Maxwell Para Simples Indexação

Título
[pt] EXPLORANDO BASES DE CONHECIMENTO EM RDF ATRAVÉS DE PADRÕES DE FORTUIDADE

Título
[en] EXPLORING RDF KNOWLEDGE BASES THROUGH SERENDIPITY PATTERNS

Autor
[pt] JERONIMO SIROTHEAU DE ALMEIDA EICHLER

Vocabulário
[pt] MINERACAO DE DADOS

Vocabulário
[pt] AQUISICAO DE INFORMACAO

Vocabulário
[pt] FORTUIDADE

Vocabulário
[pt] DADOS INTERLIGADOS

Vocabulário
[en] DATA MINING

Vocabulário
[en] INFORMATION RETRIEVAL

Vocabulário
[en] SERENDIPITY

Vocabulário
[en] LINKED DATA

Resumo
[pt] Fortuidade pode ser definida como a descoberta de algo que não está sendo buscado. Em outras palavras, fortuidade trata da descoberta de informação que provê valiosas intuições ao desvendar conhecimento inesperado. O tópico vem recebendo bastante atenção na literatura, uma vez que precisão pode ser justificadamente relaxada com o objetivo de aumentar a satisfação do usuário. Uma área que pode se beneficiar com fortuidade é a área de dados interligados, um gigantesco espaço de dados no qual dados são disponibilizados publicamente. Buscar e extrair informação relevante se torna uma tarefa desafiadora à medida que cada vez mais dados se tornam disponíveis nesse ambiente. Esta tese contribui para enfrentar este desafio de duas maneiras. Primeiro, apresenta um processo de orquestração de consulta que introduz três estratégias para injetar padrões de fortuidade no processo de consulta. Os padrões de fortuidade são inspirados em características básicas de eventos fortuitos, como analogia e perturbação, e podem ser usados para estender os resultados com informações adicionais, sugerindo consultas alternativas ou reordenando os resultados. Em segundo lugar, introduz uma base de dados que pode ser utilizada para comparar diferentes abordagens de obtenção de conteúdo fortuito. A estratégia adotada para construção dessa base de dados consiste em dividir o universo de dados em partições com base em um atributo global e conectar entidades de diferentes partições de acordo com o número de caminhos compartilhados.

Resumo
[en] Serendipity is defined as the discovery of a thing when one is not searching for it. In other words, serendipity means the discovery of information that provides valuable insights by unveiling unanticipated knowledge. The topic is receiving increased attention in the literature, since the precision requirement may be justifiably relaxed in order to improve user satisfaction. A field that can benefit from serendipity is the Web of Data, an immense global data space where data is publicly available. As more and more data become available in this data space, searching and extracting relevant information becomes a challenging task. This thesis contributes to addressing this challenge in two ways. First, it presents a query orchestration process that introduces three strategies to inject serendipity patterns in the query process. The serendipity patterns are inspired by basic characteristics of serendipitous events, such as, analogy and disturbance, and can be used for augmenting the results with additional information, suggesting alternative queries or rebalancing the results. Second, it introduces a benchmark dataset that can be used to compare different approaches for locating serendipitous content. The strategy adopted for constructing the dataset consists of dividing the dataset into partitions based on a global feature and linking entities from different partitions according to the number of paths they share.

Orientador(es)
MARCO ANTONIO CASANOVA

Banca
BERNARDO PEREIRA NUNES

Banca
SIMONE DINIZ JUNQUEIRA BARBOSA

Banca
MARCO ANTONIO CASANOVA

Banca
ANTONIO LUZ FURTADO

Banca
VANIA MARIA PONTE VIDAL

Banca
LUIZ ANDRE PORTES PAES LEME

Catalogação
2019-01-15

Apresentação
2018-08-21

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36107@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36107@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.36107


Arquivos do conteúdo
NA ÍNTEGRA PDF