Título
[pt] ANÁLISE COMPARATIVA DE MODELOS DE CLASSIFICAÇÃO DE TEXTO: DO SKLEARN AOS LLMS MODERNOS
Autor
[pt] RAFAEL DE MENDONCA CARDOSO BASTOS
Vocabulário
[pt] CLASSIFICACAO DE TEXTOS
Vocabulário
[pt] LLM LARGE LANGUAGE MODEL
Vocabulário
[pt] GPT
Vocabulário
[pt] BERT
Vocabulário
[pt] LSTM
Resumo
[pt] A crescente variedade de modelos para classificação de texto, desde os tradicionais até os modernos LLMs, aumentou a necessidade de um guia prático para a seleção da abordagem mais adequada. Este trabalho realiza um estudo comparativo para satisfazer essa demanda, analisando modelos dependentes de dataset de treino (como scikit-learn e BERT com finetuning) e modelos independentes (LLMs) em nove cenários de classificação binária, multiclasse e multilabel. A análise de performance, custo e eficiência revelou um claro trade-off: enquanto o BERT alcançou a maior precisão na maioria dos testes e os modelos scikit-learn/LSTM foram superiores em velocidade, os LLMs se mostraram uma alternativa viável principalmente em cenários onde não há um dataset de treino disponível, justificando seu uso por sua capacidade de operar de forma independente. A principal
contribuição deste estudo é um conjunto de fluxogramas de decisão, que oferece um roteiro prático para escolher o modelo ideal com base nas prioridades de cada projeto, seja performance, eficiência ou a disponibilidade de dados.
Orientador(es)
HELIO CORTES VIEIRA LOPES
Catalogação
2026-01-16
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75020@1
Referência DOI
https://doi.org/10.17771/PUCRio.acad.75020
Arquivos do conteúdo
NA ÍNTEGRA PDF