Logo PUC-Rio Logo Maxwell
TRABALHOS DE FIM DE CURSO @PUC-Rio
Consulta aos Conteúdos
Estatística
Título: AVALIAÇÃO COMPARATIVA DE FERRAMENTAS PARA EXTRAÇÃO DE TABELAS EM DOCUMENTOS PDF
Autor(es): PAULO DE SALDANHA DA G DE M VIANNA
Colaborador(es): AUGUSTO CESAR ESPINDOLA BAFFA - Orientador
Catalogação: 25/MAR/2026 Língua(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TRABALHO DE FIM DE CURSO
Notas: [pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
[en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio.
Referência(s): [pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75809@1
[en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75809@2
DOI: https://doi.org/10.17771/PUCRio.acad.75809
Resumo:
Este trabalho apresenta uma avaliação comparativa de ferramentas para extração de tabelas em documentos PDF financeiros brasileiros. Foram avaliadas ferramentas baseadas em regras geométricas, em deep learning especializado (IBM Docling) e em modelo multimodal, seguindo a metodologia de quatro níveis de Göbel et al. (2012): detecção de página, localização, estrutura celular e conteúdo textual. Os experimentos utilizaram relatórios de Fundos de Investimento Imobiliário, caracterizados por tabelas irregulares e células mescladas. Os resultados evidenciam diferenças significativas entre as abordagens e os desafios persistentes na extração automatizada de tabelas financeiras.
Descrição: Arquivo:   
NA ÍNTEGRA PDF