Título: | ARQUITETURA PARA RECOMENDAÇÃO DE FONTES DE DADOS RDF | |||||||
Autor: |
JOSE EDUARDO TALAVERA HERRERA |
|||||||
Colaborador(es): |
KARIN KOOGAN BREITMAN - Orientador |
|||||||
Catalogação: | 25/MAR/2013 | Língua(s): | PORTUGUÊS - BRASIL |
|||||
Tipo: | TEXTO | Subtipo: | TESE | |||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
|||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=21367&idi=1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=21367&idi=2 |
|||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.21367 | |||||||
Resumo: | ||||||||
Dentro do processo de publicação de dados na Web recomenda-se interligar
os dados entre diferentes fontes, através de recursos similares que descrevam
um domínio em comum. No entanto, com o crescimento do número dos conjuntos
de dados publicados na Web de Dados, as tarefas de descoberta e
seleção de dados tornam-se cada vez mais complexas. Além disso, a natureza
distribuída e interconectada dos dados, fazem com que a sua análise
e entendimento sejam muito demorados. Neste sentido, este trabalho visa
oferecer uma arquitetura Web para a identificação de fontes de dados em
RDF, com o objetivo de prover melhorias nos processos de publicação, interconex
ão, e exploração de dados na Linked Open Data. Para tal, nossa
abordagem utiliza o modelo de MapReduce sobre o paradigma de computa
ção nas nuvens. Assim, podemos efetuar buscas paralelas por palavraschave
sobre um índice de dados semânticos existente na Web. Estas buscas
permitem identificar fontes candidatas para ligar os dados. Por meio desta
abordagem, foi possível integrar diferentes ferramentas da web semântica em
um processo de busca para descobrir fontes de dados relevantes, e relacionar
tópicos de interesse denidos pelo usuário. Para atingir nosso objetivo foi
necessária a indexação e análise de texto para aperfeiçoar a busca de recursos
na Linked Open Data. Para mostrar a ecácia de nossa abordagem
foi desenvolvido um estudo de caso, utilizando um subconjunto de dados de
uma fonte na Linked Open Data, através do seu serviço SPARQL endpoint.
Os resultados do nosso trabalho revelam que a geração de estatísticas sobre
os dados da fonte é, de fato, um grande diferencial no processo de busca. Estas estatísticas ajudam ao usuário no processo de escolha de indivíduos. Um processo especializado de extração de palavras-chave é aplicado para cada indivíduo com o objetivo de gerar diferentes buscas sobre o índice semântico. Mostramos a escalabilidade de nosso processo de recomendação de fontes RDF através de diferentes amostras de indivíduos.
|
||||||||