Título
[en] DEEP REINFORCEMENT LEARNING FOR THE ARCADE LEARNING ENVIRONMENT
Título
[pt] DEEP REINFORCEMENT LEARNING PARA O ARCADE LEARNING ENVIRONMENT
Autor
[pt] FLAVIO THIAGO FRANCO VAZ
Vocabulário
[pt] APRENDIZADO POR REFORCO
Vocabulário
[pt] ATARI
Vocabulário
[pt] APRENDIZADO PROFUNDO POR REFORCO
Vocabulário
[pt] REDE NEURAL CONVOLUCIONAL
Vocabulário
[pt] APRENDIZADO PROFUNDO
Vocabulário
[en] REINFORCEMENT LEARNING
Vocabulário
[en] ATARI
Vocabulário
[en] REINFORCED DEEP LEARNING
Vocabulário
[en] CONVOLUTIONAL NEURAL NETWORK
Vocabulário
[en] DEEP LEARNING
Resumo
[pt] Este estudo investiga a aplicação de técnicas de Deep Reinforcement Learning (DRL) no Arcade Learning Environment (ALE), com o objetivo de desenvolver agentes capazes de superar o desempenho humano em jogos do Atari 2600. A pesquisa foca na avaliação do desempenho e da convergência de técnicas de inicialização de pesos e bias consolidadas na literatura na arquitetura da Deep Q-Network (DQN). A análise inclui comparações entre diferentes estratégias de inicialização e suas implicações na eficiência de
aprendizado e na robustez dos agentes treinados em um amplo conjunto de jogos.
Resumo
[en] This study investigates the application of Deep Reinforcement Learning (DRL) techniques in the Arcade Learning Environment (ALE), with the aim of developing agents capable of outperforming humans in Atari 2600 games. The research focuses on evaluating the performance and convergence of wellestablished weight and bias initialization techniques in the literature within the architecture of the Deep Q-Network (DQN). The analysis includes comparisons between different initialization strategies and their implications on the learning efficiency and robustness of agents trained across a range of games.
Orientador(es)
JOSE ALBERTO RODRIGUES PEREIRA SARDINHA
Catalogação
2025-04-28
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=70120@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=70120@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.70120
Arquivos do conteúdo
NA ÍNTEGRA PDF