Título
[en] W-RAY: AN APPROACH TO THE DEEP WEB DATA PUBLICATION
Título
[pt] W-RAY: UMA ABORDAGEM PARA PUBLICAÇÃO DE DADOS DA DEEP WEB
Autor
[pt] HELENA SERRAO PICCININI
Vocabulário
[pt] WEB SEMANTICA
Vocabulário
[pt] MAPEAMENTO RDB TO RDF
Vocabulário
[pt] DADOS LIGADOS
Vocabulário
[pt] LINGUAGEM NATURAL
Vocabulário
[pt] DEEP WEB
Vocabulário
[pt] BANCO DE DADOS
Vocabulário
[en] SEMANTIC WEB
Vocabulário
[en] RDB TO RDF MAPPING
Vocabulário
[en] LINKED DATA
Vocabulário
[en] NATURAL LANGUAGE
Vocabulário
[en] DEEP WEB
Vocabulário
[en] DATABASE
Resumo
[pt] Deep Web é composta por dados armazenados em bases de dados, páginas dinâmicas, páginas com scripts e dados multimídia, dentre outros tipos de objetos. Os bancos de dados da Deep Web são geralmente sub-representados pelos motores de busca, devido aos desafios técnicos de localizar, acessar e indexar seus dados. A utilização de hyperlinks pelos motores de busca não é suficente para alcançar todos os dados da Deep Web, exigindo interação com interfaces de consultas complexas. Esta tese apresenta uma abordagem, denominada W-Ray, capaz de fornecer visibilidade aos dados da Deep Web. A abordagem baseia-se na descrição dos dados relevantes através de sentenças bem estruturadas, e na publicação dessas sentenças em páginas estáticas da Web. As sentenças podem ser geradas com RDFa embutido, mantendo a semântica do banco de dados. As páginas da Web assim geradas são passíveis de ser indexadas pelos motores de coleta de dados tradicionais e por motores mais sofisticados que suportam busca semântica. É apresentada também uma ferramenta que apóia a abordagem W-Ray. A abordagem foi implementada com sucesso para diferentes bancos de dados reais.
Resumo
[en] The Deep Web comprises data stored in databases, dynamic pages, scripted pages and multimedia data, among other types of objects. The databases of the Deep Web are generally underrepresented by the search engines due to the technical challenges of locating, accessing and indexing them. The use of hyperlinks by search engines is not sufficient to achieve all the Deep Web data, requiring interaction with complex queries interfaces. This thesis presents an approach, called W-Ray, that provides visibility to Deep Web data. The approach relies on describing the relevant data through well-structured sentences, and on publishing the sentences as static Web pages. The sentences can be generated with embedded RDFa, keeping the semantics of the database. The Web pages thus generated are indexed by traditional Web crawlers and sophisticated crawlers that support semantic search. It is also presented a tool that supports the W-Ray approach. The approach has been successfully implemented for some real databases.
Orientador(es)
MARCO ANTONIO CASANOVA
Banca
HELIO CORTES VIEIRA LOPES
Banca
MARCO ANTONIO CASANOVA
Banca
ANTONIO LUZ FURTADO
Banca
LUIZ ANDRE PORTES PAES LEME
Banca
JOSE ANTONIO FERNANDES DE MACEDO
Catalogação
2014-09-29
Apresentação
2013-06-21
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=23502@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.23502
Arquivos do conteúdo
NA ÍNTEGRA PDF