Título
[en] A DECISION TREE LEARNER FOR COST-SENSITIVE BINARY CLASSIFICATION
Título
[pt] UMA ÁRVORE DE DECISÃO PARA CLASSIFICAÇÃO BINÁRIA SENSÍVEL AO CUSTO
Autor
[pt] DANIEL DOS SANTOS MARQUES
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] APRENDIZADO SENSIVEL AO CUSTO
Vocabulário
[pt] ARVORE DE DECISAO
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] DECISION TREE
Resumo
[pt] Problemas de classificação foram amplamente estudados na literatura de aprendizado de máquina, gerando aplicações em diversas áreas. No entanto, em diversos cenários, custos por erro de classificação podem variar bastante, o que motiva o estudo de técnicas de classificação sensível ao custo. Nesse trabalho, discutimos o uso de árvores de decisão para o problema mais geral de Aprendizado Sensível ao Custo do Exemplo (ASCE), onde os custos dos erros de classificação variam com o exemplo. Uma das grandes vantagens das árvores de decisão é que são fáceis de interpretar, o que é uma propriedade altamente desejável em diversas aplicações. Propomos um novo método de seleção de atributos para construir árvores de decisão para o problema ASCE e discutimos como este pode ser implementado de forma eficiente. Por fim, comparamos o nosso método com dois outros algoritmos de árvore de decisão propostos recentemente na literatura, em 3 bases de dados públicas.
Resumo
[en] Classification problems have been widely studied in the machine learning literature, generating applications in several areas. However, in a number of scenarios, misclassification costs can vary substantially, which motivates the study of Cost-Sensitive Learning techniques. In the present work, we discuss the use of decision trees on the more general Example-Dependent Cost-Sensitive Problem (EDCSP), where misclassification costs vary with each example. One of the main advantages of decision trees is that they are easy to interpret, which is a highly desirable property in a number of applications. We propose a new attribute selection method for constructing decision trees for the EDCSP and discuss how it can be efficiently implemented. Finally, we compare our new method with two other decision tree algorithms recently proposed in the literature, in 3 publicly available datasets.
Orientador(es)
EDUARDO SANY LABER
Banca
RUY LUIZ MILIDIU
Banca
EDUARDO SANY LABER
Banca
RAUL PIERRE RENTERIA
Catalogação
2016-11-30
Apresentação
2016-09-22
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
INGLÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=28239@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=28239@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.28239
Arquivos do conteúdo
NA ÍNTEGRA PDF