Título
[en] DECISION TREES WITH EXPLAINABLE RULES
Título
[pt] ÁRVORES DE DECISÃO COM REGRAS EXPLICÁVEIS
Autor
[pt] VICTOR FEITOSA DE CARVALHO SOUZA
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] MODELO EXPLICAVEL
Vocabulário
[pt] ALGORITMOS DE APROXIMACAO
Vocabulário
[pt] ARVORE DE DECISAO
Vocabulário
[pt] CLASSIFICACAO
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] EXPLAINABLE MODEL
Vocabulário
[en] APPROXIMATION ALGORITHMS
Vocabulário
[en] DECISION TREE
Vocabulário
[en] CLASSIFICATION
Resumo
[pt] As árvores de decisão são estruturas comumente utilizadas em cenários
nos quais modelos explicáveis de Aprendizado de Máquina são desejados, por
serem visualmente intuitivas. Na literatura existente, a busca por explicabilidade
em árvores envolve a minimização de métricas como altura e número de
nós. Nesse contexto, definimos uma métrica de explicabilidade, chamada de
explanation size, que reflete o número de atributos necessários para explicar
a classificação dos exemplos. Apresentamos também um algoritmo, intitulado
SER-DT, que obtém uma aproximação O(log n) (ótima se P diferente NP) para a
minimização da altura no pior caso ou caso médio, assim como do explanation
size no pior caso ou caso médio. Em uma série de experimentos, comparamos
a implementação de SER-DT com algoritmos conhecidos da área, como CART e
EC2, além de testarmos o impacto de parâmetros e estratégias de poda nesses
algoritmos. SER-DT mostrou-se competitivo em acurácia com os algoritmos
citados, mas gerou árvores muito mais explicáveis.
Resumo
[en] Decision trees are commonly used structures in scenarios where explainable
Machine Learning models are desired, as they are visually intuitive. In
the existing literature, the search for explainability in trees involves minimizing
metrics such as depth and number of nodes. In this context, we define
an explainability metric, called explanation size, which reflects the number of
attributes needed to explain the classification of examples. We also present an
algorithm, called SER-DT, which obtains an O(log n) approximation (optimal
if P different NP) for the minimization of depth in the worst/average case, as well
as of explanation size in the worst/average case. In a series of experiments,
we compared the SER-DT implementation with well-known algorithms in the
field, such as CART and EC2 in addition to testing the impact of parameters
and pruning strategies on these algorithms. SER-DT proved to be competitive
in terms of accuracy with the aforementioned algorithms, but generated much
more explainable trees.
Orientador(es)
EDUARDO SANY LABER
Banca
MARCO SERPA MOLINARO
Banca
EDUARDO SANY LABER
Banca
CLAUDSON FERREIRA BORNSTEIN
Catalogação
2023-08-04
Apresentação
2023-03-15
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=63537@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=63537@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.63537
Arquivos do conteúdo
NA ÍNTEGRA PDF