Maxwell Para Simples Indexação

Título
[en] DERIVING EXPERT AGENT POLICIES INTO INTERPRETABLE DECISION TREES THROUGH IMITATION

Título
[pt] EXTRAÇÃO DE POLÍTICAS DE AGENTES ESPECIALISTA PARA ÁRVORES DE DECISÃO INTERPRETÁVEIS VIA APRENDIZADO POR IMITAÇÃO

Autor
[pt] THOMAS ADDIS JUNQUEIRA BOTELHO

Vocabulário
[pt] REDE NEURAL

Vocabulário
[pt] APRENDIZADO DE MAQUINA

Vocabulário
[pt] APRENDIZADO PROFUNDO

Vocabulário
[pt] MODELO LINEAR

Vocabulário
[pt] ARVORE DE DECISAO

Vocabulário
[en] NEURAL NETWORKS

Vocabulário
[en] MACHINE LEARNING

Vocabulário
[en] DEEP LEARNING

Vocabulário
[en] LINEAR MODEL

Vocabulário
[en] DECISION TREE

Resumo
[pt] Este estudo apresenta uma investigação sobre a aplicação de técnicas de Aprendizado por Imitação (IL) para a extração de políticas estruturadas e interpretáveis a partir de modelos especialistas operando como caixas-pretas. O foco principal é analisar a viabilidade e eficácia dessa abordagem em traduzir comportamentos aprendidos por redes neurais profundas em árvores de decisão, que representam um conjunto de regras que podem ser sequencialmente avaliadas para chegar numa decisão. Avaliamos esta metodologia em três ambientes de simulação distintos: Lunar-Lander, Taxi e CartPole. Testamos os algoritmos DAgger e sua variante VIPER, que iterativamente treinam políticas representadas por árvores de decisão a partir de demonstrações de uma política especialista. Comparamos o uso de árvores de decisão tradicionais com árvores de modelos lineares, que contém modelos lineares em suas folhas.

Resumo
[en] This study presents an investigation into the application of Imitation Learning (IL) techniques for extracting structured and interpretable policies from black-box expert models. The primary focus is to analyze the feasibility and effectiveness of this approach in translating behaviors learned by deep neural networks into decision trees, which represent a set of rules that can be sequentially evaluated to reach a decision. We evaluate this methodology in three distinct simulation environments: Lunar-Lander, Taxi, and CartPole. We test the DAgger algorithm and its variant VIPER, which iteratively train policies represented by decision trees from demonstrations of an expert policy. We compare the use of traditional decision trees with linear model trees, which contain linear models in their leaves.

Orientador(es)
AUGUSTO CESAR ESPINDOLA BAFFA

Catalogação
2024-09-04

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=67834@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=67834@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.67834


Arquivos do conteúdo
NA ÍNTEGRA PDF