Título
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS
Título
[pt] UM ESTUDO EM REDES NEURAIS PARA AGENTES JOGADORES DE PÔQUER
Autor
[pt] ALEXANDRE MARANGONI COSTA
Vocabulário
[pt] REDE NEURAL
Vocabulário
[pt] SIMULACAO MULTIAGENTE
Vocabulário
[pt] POQUER
Vocabulário
[pt] APRENDIZADO PROFUNDO
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[en] NEURAL NETWORKS
Vocabulário
[en] MULTI AGENT SIMULATION
Vocabulário
[en] POKER
Vocabulário
[en] DEEP LEARNING
Vocabulário
[en] MACHINE LEARNING
Resumo
[pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por
não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas.
Resumo
[en] Data science research needs real examples to test and improve solutions. Games are widely used to mimic those real-world examples. Poker rounds are a good example of imperfect information state with competing
agents dealing with probabilistic knowledge, risk assessment, and possible deception, unlike chess, checkers and perfect information brute-force search style of games. By using poker as a test-bed we can analyze different approaches used in real-world examples, in a more controlled environment, which should give great insights on how to tackle those real-world scenarios. We propose a framework to build and test different neural networks that can play against each other, learn from a supervised experience and maximize
its rewards.
Orientador(es)
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
Banca
BRUNO FEIJO
Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
Banca
THIBAUT VICTOR GASTON VIDAL
Catalogação
2020-05-12
Apresentação
2019-04-04
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
INGLÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.48011
Arquivos do conteúdo
NA ÍNTEGRA PDF