Maxwell Para Simples Indexação

Título
[en] ALUMNI TOOL: INFORMATION RECOVERY OF PERSONAL DATA ON THE WEB IN AUTHENTICATED SOCIAL NETWORKS

Título
[pt] ALUMNI TOOL: RECUPERAÇÃO DE DADOS PESSOAIS NA WEB EM REDES SOCIAIS AUTENTICADAS

Autor
[pt] LUIS GUSTAVO ALMEIDA

Vocabulário
[pt] RECUPERACAO DE INFORMACAO

Vocabulário
[pt] WEB SPIDER

Vocabulário
[pt] ROBOS DE BUSCA

Vocabulário
[pt] SCRAPING

Vocabulário
[pt] SELENIUM

Vocabulário
[pt] REDE SOCIAL

Vocabulário
[pt] BOTS

Vocabulário
[pt] BIG DATA

Vocabulário
[pt] COLETA DE DADOS

Vocabulário
[pt] WEB CRAWLING

Vocabulário
[en] INFORMATION RETRIEVAL

Vocabulário
[en] WEB SPIDER

Vocabulário
[en] SEARCH ENGINE

Vocabulário
[en] SCRAPING

Vocabulário
[en] SELENIUM

Vocabulário
[en] SOCIAL MEDIA

Vocabulário
[en] BOTS

Vocabulário
[en] BIG DATA

Vocabulário
[en] DATA RETRIEVAL

Vocabulário
[en] WEB CRAWLING

Resumo
[pt] O uso de robôs de busca para coletar informações para um determinado contexto sempre foi um problema desafiante e tem crescido substancialmente nos últimos anos. Por exemplo, robôs de busca podem ser utilizados para capturar dados de redes sociais profissionais. Em particular, tais redes permitem estudar as trajetórias profissionais dos egressos de uma universidade, e responder diversas perguntas, como por exemplo: Quanto tempo um ex-aluno da PUC-Rio leva para chegar a um cargo de relevância? No entanto, um problema de natureza comum a este cenário é a impossibilidade de coletar informações devido a sistemas de autenticação, impedindo um robô de busca de acessar determinadas páginas e conteúdos. Esta dissertação aborda uma solução para capturar dados, que contorna o problema de autenticação e automatiza o processo de coleta de dados. A solução proposta coleta dados de perfis de usuários de uma rede social profissional para armazenamento em banco de dados e posterior análise. A dissertação contempla ainda a possibilidade de adicionar diversas outras fontes de dados dando ênfase a uma estrutura de armazém de dados.

Resumo
[en] The use of search bots to collect information for a given context has grown substantially in recent years. For example, search bots may be used to capture data from professional social networks. In particular, such social networks facilitate studying the professional trajectory of the alumni of a given university, and answer several questions such as: How long does a former student of PUC-Rio take to arrive at a management position? However, a common problem in this scenario is the inability to collect information due to authentication systems, preventing a search robot from accessing certain pages and content. This dissertation addresses a solution to capture data, which circumvents the authentication problem and automates the data collection process. The proposed solution collects data from user profiles for later database storage and analysis. The dissertation also contemplates the possibility of adding several other sources of data giving emphasis to a data warehouse structure.

Orientador(es)
MARCO ANTONIO CASANOVA

Banca
SIMONE DINIZ JUNQUEIRA BARBOSA

Banca
MARCO ANTONIO CASANOVA

Banca
ANTONIO LUZ FURTADO

Catalogação
2018-08-02

Apresentação
2018-01-31

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=34643@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=34643@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.34643


Arquivos do conteúdo
NA ÍNTEGRA PDF