Título
[en] DCD TOOL: A TOOLKIT FOR THE DISCOVERY AND TRIPLIFICATION OF STATISTICAL DATA CUBES
Título
[pt] DCD TOOL: UM CONJUNTO DE FERRAMENTAS PARA DESCOBERTA E TRIPLIFICAÇÃO DE CUBOS DE DADOS ESTATÍSTICOS
Autor
[pt] SERGIO RICARDO BATULI MAYNOLDI ORTIGA
Vocabulário
[pt] WEB SEMANTICA
Vocabulário
[pt] MODELAGEM DIMENSIONAL
Vocabulário
[pt] R2RML
Vocabulário
[pt] DATA CUBE VOCABULARY
Vocabulário
[pt] RDF
Vocabulário
[pt] TRIPLIFICACAO
Vocabulário
[pt] DADOS ESTATISTICOS
Vocabulário
[pt] LINKED DATA
Vocabulário
[en] SEMANTIC WEB
Vocabulário
[en] DIMENSIONAL MODELING
Vocabulário
[en] R2RML
Vocabulário
[en] DATA CUBE VOCABULARY
Vocabulário
[en] RDF
Vocabulário
[en] TRIPLIFICATION
Vocabulário
[en] STATISTICAL DATA
Vocabulário
[en] LINKED DATA
Resumo
[pt] A produção de indicadores sociais e sua disponibilização na Web é uma importante iniciativa de democratização e transparência que os governos em todo mundo vêm realizando nas últimas duas décadas. No Brasil diversas instituições governamentais ou ligadas ao governo publicam indicadores relevantes para acompanhamento do desempenho do governo nas áreas de saúde, educação, meio ambiente entre outras. O acesso, a consulta e a correlação destes dados demanda grande esforço, principalmente, em um cenário que envolve diferentes organizações. Assim, o desenvolvimento de ferramentas com foco na integração e disponibilização das informações de tais bases, torna-se um esforço relevante. Outro aspecto que se destaca no caso particular do Brasil é a dificuldade em se identificar dados estatísticos dentre outros tipos de dados armazenados no mesmo banco de dados. Esta dissertação propõe um arcabouço de software que cobre a identificação das bases de dados estatísticas no banco de dados de origem e o enriquecimento de seus metadados utilizando ontologias padronizadas pelo W3C, como base para o processo de triplificação.
Resumo
[en] The production of social indicators and their availability on the Web is an important initiative for the democratization and transparency that governments have been doing in the last two decades. In Brazil, several government or government-linked institutions publish relevant indicators to help assess the government performance in the areas of health, education, environment and others. The access, query and correlation of these data demand substantial effort, especially in a scenario involving different organizations. Thus, the development of tools, with a focus on the integration and availability of information stored in such bases, becomes a significant effort. Another aspect that requires attention, in the case of Brazil, is the difficulty in identifying statistical databases among others type of data that share the same database. This dissertation proposes a software framework which covers the identification of statistical data in the database of origin and the enrichment of their metadata using W3C standardized ontologies, as a basis for the triplification process.
Orientador(es)
MARCO ANTONIO CASANOVA
Banca
MARCO ANTONIO CASANOVA
Banca
ANTONIO LUZ FURTADO
Banca
LUIZ ANDRE PORTES PAES LEME
Banca
GISELI RABELLO LOPES
Catalogação
2015-07-07
Apresentação
2013-09-06
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=24871@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=24871@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.24871
Arquivos do conteúdo
NA ÍNTEGRA PDF