Maxwell Para Simples Indexação

Título
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS

Título
[pt] UM ESTUDO EM REDES NEURAIS PARA AGENTES JOGADORES DE PÔQUER

Autor
[pt] ALEXANDRE MARANGONI COSTA

Vocabulário
[pt] REDE NEURAL

Vocabulário
[pt] SIMULACAO MULTIAGENTE

Vocabulário
[pt] POQUER

Vocabulário
[pt] APRENDIZADO PROFUNDO

Vocabulário
[pt] APRENDIZADO DE MAQUINA

Vocabulário
[en] NEURAL NETWORKS

Vocabulário
[en] MULTI AGENT SIMULATION

Vocabulário
[en] POKER

Vocabulário
[en] DEEP LEARNING

Vocabulário
[en] MACHINE LEARNING

Resumo
[pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas.

Resumo
[en] Data science research needs real examples to test and improve solutions. Games are widely used to mimic those real-world examples. Poker rounds are a good example of imperfect information state with competing agents dealing with probabilistic knowledge, risk assessment, and possible deception, unlike chess, checkers and perfect information brute-force search style of games. By using poker as a test-bed we can analyze different approaches used in real-world examples, in a more controlled environment, which should give great insights on how to tackle those real-world scenarios. We propose a framework to build and test different neural networks that can play against each other, learn from a supervised experience and maximize its rewards.

Orientador(es)
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
BRUNO FEIJO

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
THIBAUT VICTOR GASTON VIDAL

Catalogação
2020-05-12

Apresentação
2019-04-04

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.48011


Arquivos do conteúdo
NA ÍNTEGRA PDF