XINFORMAÇÕES SOBRE DIREITOS AUTORAIS
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: ENRIQUECIMENTO DE DADOS COM BASE EM ESTATÍSTICAS DE GRAFO DE SIMILARIDADE PARA MELHORAR O DESEMPENHO EM MODELOS DE ML SUPERVISIONADOS DE CLASSIFICAÇÃO Autor: NEY BARCHILON
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Colaborador(es):
HELIO CORTES VIEIRA LOPES - ORIENTADOR
Nº do Conteudo: 68124
Catalogação: 19/09/2024 Liberação: 19/09/2024 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TESE
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68124&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68124&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.68124
Resumo:
Título: ENRIQUECIMENTO DE DADOS COM BASE EM ESTATÍSTICAS DE GRAFO DE SIMILARIDADE PARA MELHORAR O DESEMPENHO EM MODELOS DE ML SUPERVISIONADOS DE CLASSIFICAÇÃO Autor: NEY BARCHILON
Nº do Conteudo: 68124
Catalogação: 19/09/2024 Liberação: 19/09/2024 Idioma(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TESE
Natureza: PUBLICAÇÃO ACADÊMICA
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68124&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68124&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.68124
Resumo:
A otimização do desempenho dos modelos de aprendizado de máquina
supervisionados representa um desafio constante, especialmente em contextos
com conjuntos de dados de alta dimensionalidade ou com numerosos atributos
correlacionados. Neste estudo, é proposto um método para o enriquecimento
de conjuntos de dados tabulares, fundamentado na utilização de estatísticas
provenientes de um grafo construído a partir da similaridade entre as instâncias
presentes neste conjunto de dados, buscando capturar correlações estruturais
entre esses dados. As instâncias assumem o papel de vértices no grafo, enquanto
as conexões entre elas refletem sua similaridade. O conjunto de características
originais (FO) é enriquecido com as estatísticas extraídas do grafo (FG)
na busca pela melhora do poder preditivo dos modelos de aprendizado de
máquina. O método foi avaliado em dez conjuntos de dados públicos de
distintas áreas de conhecimento, em dois cenários distintos, sobre sete modelos
de aprendizado de máquina, comparando a predição sobre o conjunto de dados
inicial (FO) com o conjunto de dados enriquecido com as estatísticas extraídas
do seu grafo (FO+FG). Os resultados revelaram melhorias significativas na
métrica de acurácia, com um aprimoramento médio de aproximadamente
4,9 por cento. Além de sua flexibilidade para integração com outras técnicas de
enriquecimento existentes, o método se apresenta como uma alternativa eficaz,
sobretudo em situações em que os conjuntos de dados originais carecem das
características necessárias para as abordagens tradicionais de enriquecimento
com a utilização de grafo.
Descrição | Arquivo |
NA ÍNTEGRA |