Título: | DEEP REINFORCEMENT LEARNING PARA O ARCADE LEARNING ENVIRONMENT | ||||||||||||
Autor(es): |
FLAVIO THIAGO FRANCO VAZ |
||||||||||||
Colaborador(es): |
JOSE ALBERTO RODRIGUES PEREIRA SARDINHA - Orientador |
||||||||||||
Catalogação: | 28/ABR/2025 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=70120@1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=70120@2 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.70120 | ||||||||||||
Resumo: | |||||||||||||
Este estudo investiga a aplicação de técnicas de Deep Reinforcement Learning (DRL) no Arcade Learning Environment (ALE), com o objetivo de desenvolver agentes capazes de superar o desempenho humano em jogos do Atari 2600. A pesquisa foca na avaliação do desempenho e da convergência de técnicas de inicialização de pesos e bias consolidadas na literatura na arquitetura da Deep Q-Network (DQN). A análise inclui comparações entre diferentes estratégias de inicialização e suas implicações na eficiência de
aprendizado e na robustez dos agentes treinados em um amplo conjunto de jogos.
|
|||||||||||||
|