Maxwell Para Simples Indexação

Título
[en] DEEP REINFORCEMENT LEARNING FOR THE ARCADE LEARNING ENVIRONMENT

Título
[pt] DEEP REINFORCEMENT LEARNING PARA O ARCADE LEARNING ENVIRONMENT

Autor
[pt] FLAVIO THIAGO FRANCO VAZ

Vocabulário
[pt] APRENDIZADO POR REFORCO

Vocabulário
[pt] ATARI

Vocabulário
[pt] APRENDIZADO PROFUNDO POR REFORCO

Vocabulário
[pt] REDE NEURAL CONVOLUCIONAL

Vocabulário
[pt] APRENDIZADO PROFUNDO

Vocabulário
[en] REINFORCEMENT LEARNING

Vocabulário
[en] ATARI

Vocabulário
[en] REINFORCED DEEP LEARNING

Vocabulário
[en] CONVOLUTIONAL NEURAL NETWORK

Vocabulário
[en] DEEP LEARNING

Resumo
[pt] Este estudo investiga a aplicação de técnicas de Deep Reinforcement Learning (DRL) no Arcade Learning Environment (ALE), com o objetivo de desenvolver agentes capazes de superar o desempenho humano em jogos do Atari 2600. A pesquisa foca na avaliação do desempenho e da convergência de técnicas de inicialização de pesos e bias consolidadas na literatura na arquitetura da Deep Q-Network (DQN). A análise inclui comparações entre diferentes estratégias de inicialização e suas implicações na eficiência de aprendizado e na robustez dos agentes treinados em um amplo conjunto de jogos.

Resumo
[en] This study investigates the application of Deep Reinforcement Learning (DRL) techniques in the Arcade Learning Environment (ALE), with the aim of developing agents capable of outperforming humans in Atari 2600 games. The research focuses on evaluating the performance and convergence of wellestablished weight and bias initialization techniques in the literature within the architecture of the Deep Q-Network (DQN). The analysis includes comparisons between different initialization strategies and their implications on the learning efficiency and robustness of agents trained across a range of games.

Orientador(es)
JOSE ALBERTO RODRIGUES PEREIRA SARDINHA

Catalogação
2025-04-28

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=70120@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=70120@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.70120


Arquivos do conteúdo
NA ÍNTEGRA PDF