| Título: | PREVISÃO DE RESULTADOS DE PARTIDAS DE FUTEBOL DA SÉRIE A DO CAMPEONATO BRASILEIRO UTILIZANDO APRENDIZADO DE MÁQUINA: UMA ANÁLISE COMPARATIVA DE MODELOS | ||||||||||||
| Autor(es): |
RODRIGO LORENTE KAUER |
||||||||||||
| Colaborador(es): |
ALBERTO BARBOSA RAPOSO - Orientador CESAR AUGUSTO SIERRA FRANCO - Coorientador |
||||||||||||
| Catalogação: | 27/MAR/2026 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
| Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
| Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
| Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75870@1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75870@2 |
||||||||||||
| DOI: | https://doi.org/10.17771/PUCRio.acad.75870 | ||||||||||||
| Resumo: | |||||||||||||
|
A previsão de resultados de partidas de futebol constitui um problema
desafiador, em virtude da natureza dinâmica e multifatorial do esporte. No contexto brasileiro, a Série A do Campeonato Brasileiro apresenta características
específicas, como elevado equilíbrio competitivo, influência regional e variabilidade de desempenho ao longo da temporada, que dificultam a modelagem preditiva. Este trabalho propõe o desenvolvimento e a avaliação de uma pipeline
de aprendizado de máquina voltada à previsão dos resultados de partidas da
Série A. Para a realização do estudo, foi construído um conjunto de dados
abrangente a partir de bases históricas, incluindo estatísticas de jogo, informações de desempenho recente das equipes, confrontos diretos, fatores regionais e métricas relacionadas ao mercado de apostas esportivas. Um processo
sistemático de engenharia de atributos foi aplicado com o objetivo de capturar
padrões temporais e contextuais relevantes para o futebol brasileiro. Diversos
modelos de classificação supervisionada foram avaliados, incluindo Regressão
Logística, Naive Bayes, K-Nearest Neighbors, Support Vector Machines, Random Forest, Gradient Boosting, AdaBoost, Multilayer Perceptron e XGBoost.
Os modelos foram comparados com base em métricas apropriadas para problemas potencialmente desbalanceados, como acurácia, precisão, recall e F1-score,
com ênfase nas médias ponderadas e macro.
|
|||||||||||||
|
|||||||||||||