TFCs

Consulta aos Conteúdos

Título:

PREVISÃO DE RESULTADOS DE PARTIDAS DE FUTEBOL DA SÉRIE A DO CAMPEONATO BRASILEIRO UTILIZANDO APRENDIZADO DE MÁQUINA: UMA ANÁLISE COMPARATIVA DE MODELOS

Autor(es):

RODRIGO LORENTE KAUER

Colaborador(es):

ALBERTO BARBOSA RAPOSO - Orientador
CESAR AUGUSTO SIERRA FRANCO - Coorientador

Catalogação:

27/MAR/2026

Língua(s):

PORTUGUÊS - BRASIL

Tipo:

TEXTO

Subtipo:

TRABALHO DE FIM DE CURSO

Notas:

[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
[en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio.

Referência(s):

[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75870@1
[en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75870@2

DOI:

https://doi.org/10.17771/PUCRio.acad.75870

Resumo:

A previsão de resultados de partidas de futebol constitui um problema desafiador, em virtude da natureza dinâmica e multifatorial do esporte. No contexto brasileiro, a Série A do Campeonato Brasileiro apresenta características específicas, como elevado equilíbrio competitivo, influência regional e variabilidade de desempenho ao longo da temporada, que dificultam a modelagem preditiva. Este trabalho propõe o desenvolvimento e a avaliação de uma pipeline de aprendizado de máquina voltada à previsão dos resultados de partidas da Série A. Para a realização do estudo, foi construído um conjunto de dados abrangente a partir de bases históricas, incluindo estatísticas de jogo, informações de desempenho recente das equipes, confrontos diretos, fatores regionais e métricas relacionadas ao mercado de apostas esportivas. Um processo sistemático de engenharia de atributos foi aplicado com o objetivo de capturar padrões temporais e contextuais relevantes para o futebol brasileiro. Diversos modelos de classificação supervisionada foram avaliados, incluindo Regressão Logística, Naive Bayes, K-Nearest Neighbors, Support Vector Machines, Random Forest, Gradient Boosting, AdaBoost, Multilayer Perceptron e XGBoost. Os modelos foram comparados com base em métricas apropriadas para problemas potencialmente desbalanceados, como acurácia, precisão, recall e F1-score, com ênfase nas médias ponderadas e macro.

Descrição:			Arquivo:
NA ÍNTEGRA			PDF