Maxwell Para Simples Indexação

Título
[pt] ANÁLISE COMPARATIVA DE MODELOS DE CLASSIFICAÇÃO DE TEXTO: DO SKLEARN AOS LLMS MODERNOS

Autor
[pt] RAFAEL DE MENDONCA CARDOSO BASTOS

Vocabulário
[pt] CLASSIFICACAO DE TEXTOS

Vocabulário
[pt] LLM LARGE LANGUAGE MODEL

Vocabulário
[pt] GPT

Vocabulário
[pt] BERT

Vocabulário
[pt] LSTM

Resumo
[pt] A crescente variedade de modelos para classificação de texto, desde os tradicionais até os modernos LLMs, aumentou a necessidade de um guia prático para a seleção da abordagem mais adequada. Este trabalho realiza um estudo comparativo para satisfazer essa demanda, analisando modelos dependentes de dataset de treino (como scikit-learn e BERT com finetuning) e modelos independentes (LLMs) em nove cenários de classificação binária, multiclasse e multilabel. A análise de performance, custo e eficiência revelou um claro trade-off: enquanto o BERT alcançou a maior precisão na maioria dos testes e os modelos scikit-learn/LSTM foram superiores em velocidade, os LLMs se mostraram uma alternativa viável principalmente em cenários onde não há um dataset de treino disponível, justificando seu uso por sua capacidade de operar de forma independente. A principal contribuição deste estudo é um conjunto de fluxogramas de decisão, que oferece um roteiro prático para escolher o modelo ideal com base nas prioridades de cada projeto, seja performance, eficiência ou a disponibilidade de dados.

Orientador(es)
HELIO CORTES VIEIRA LOPES

Catalogação
2026-01-16

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75020@1

Referência DOI
https://doi.org/10.17771/PUCRio.acad.75020


Arquivos do conteúdo
NA ÍNTEGRA PDF