Título: | XHITS: ESTENDENDO O ALGORITMO HITS PARA EXTRAÇÃO DE TÓPICOS NA WWW | |||||||
Autor: |
FRANCISCO BENJAMIM FILHO |
|||||||
Colaborador(es): |
RUY LUIZ MILIDIU - Orientador |
|||||||
Catalogação: | 20/SET/2005 | Língua(s): | PORTUGUÊS - BRASIL |
|||||
Tipo: | TEXTO | Subtipo: | TESE | |||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
|||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=7081&idi=1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=7081&idi=2 |
|||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.7081 | |||||||
Resumo: | ||||||||
O ambiente baseado em hyperlink possui na sua topologia
informações
substanciais sobre o seu conteúdo. Baseado nesse tipo de
ambiente, Jon
Kleingerg desenvolveu um conjunto de algoritmos,
popularmente conhecido como
HITS (Hyperlink Induced Topic Search), que utiliza a
estrutura de hyperlinks na
WWW para extrair essas informações. O foco central desses
algoritmos é a
classificação de tópicos de busca de caráter geral na WWW,
através da descoberta
de páginas que representam autoridade sobre tais tópicos.
Para tanto, os
algoritmos formulam a noção de autoridade considerando o
relacionamento,
decorrente da estrutura de hyperlink, entre o conjunto de
páginas que são
autoridades relevantes e o conjunto de páginas que apontam
para essas,
denominadas de hubs. Jon Kleingerg definiu, portanto, uma
relação de
interdependência entre os conjuntos anteriormente citados:
uma boa autoridade
será uma página apontada por bons hubs e um bom hub será
uma página que
aponta para boas autoridades. Neste trabalho, propomos a
extensão do modelo
formulado por Jon Kleingerg, através da inserção de novos
conceitos nas relações
de interdependência entre autoridades e hubs. Assim,
formulamos um algoritmo
estendido, XHITS (Extended Hyperlink Induced Topic
Search), que visa melhorar a
classificação das autoridades do ambiente. Nessa extensão
as autoridades são
apontadas por bons hubs, às vezes apontadas por bons
portais e também apontam
para boas novidades. Os bons hubs são páginas que apontam
para boas
autoridades e novidades, e são apontados por bons portais.
As boas novidades
são páginas que são apontadas pelas boas autoridades,
pelos bons hubs e pelos
bons portais e bons portais são páginas que apontam para
as boas autoridades,
para bons hubs e para boas novidades. Adicionalmente,
mostramos que o
algoritmo proposto converge e também os diversos
resultados experimentais que
indicam a melhoria na precisão dos hiperdocumentos
recuperados.
|
||||||||