Título
[en] IDENTIFICATION OF RELATED DATASETS IN THE CONTEXT OF MISSING OR PARTIAL METADATA
Título
[pt] IDENTIFICAÇÃO DE DATASETS RELACIONADOS, EM CONTEXTO COM METADADOS AUSENTES OU PARCIAIS
Autor
[pt] SERGIO BERNARDELLI NETTO
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] METADADOS AUSENTES
Vocabulário
[pt] IDENTIFICACAO DE DATASETS
Vocabulário
[pt] DATA LAKE
Vocabulário
[pt] MINERACAO DE DADOS
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] MISSING METADATA
Vocabulário
[en] DATASET IDENTIFICATION
Vocabulário
[en] DATA LAKE
Vocabulário
[en] DATA MINING
Resumo
[pt] O projeto propõe uma ferramenta para a análise, identificação e determinação de possíveis combinações de datasets, seja pela identificação de chaves
primárias e estrangeiras entre dois datasets (o que permite a junção relacional
entre datasets), seja pela similaridade entre datasets (o que permite união,
interseção e diferença entre datasets). Serão utilizadas técnicas de mineração
de dados e aprendizado de máquina, entre outras. Os resultados obtidos pelo
projeto poderão viabilizar novas análises de dados com a utilização de datasets
que anteriormente não se apresentavam como relacionados, em um determinado
contexto.
Resumo
[en] This project proposes a tool for analyzing, identifying, and determining
potential combinations of datasets, focusing on the discovery of primary and
foreign keys between two datasets (enabling relational joins), or similarity
between datasets (enabling union, intersection, and difference operations). The
approach leverages data mining and machine learning techniques to automate
the correlation process between tables. By doing so, the project aims to enable
new forms of data analysis that were previously unattainable due to the lack
of explicit relationships between datasets. The results are expected to enhance
data integration and uncover insights in contexts where datasets appeared
unrelated.
Orientador(es)
MARCOS VIANNA VILLAS
Catalogação
2026-03-25
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75814@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75814@2
Arquivos do conteúdo
NA ÍNTEGRA PDF