| Título: | AVALIAÇÃO COMPARATIVA DE FERRAMENTAS PARA EXTRAÇÃO DE TABELAS EM DOCUMENTOS PDF | ||||||||||||
| Autor(es): |
PAULO DE SALDANHA DA G DE M VIANNA |
||||||||||||
| Colaborador(es): |
AUGUSTO CESAR ESPINDOLA BAFFA - Orientador |
||||||||||||
| Catalogação: | 25/MAR/2026 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
| Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
| Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
| Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75809@1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75809@2 |
||||||||||||
| DOI: | https://doi.org/10.17771/PUCRio.acad.75809 | ||||||||||||
| Resumo: | |||||||||||||
|
Este trabalho apresenta uma avaliação comparativa de ferramentas para
extração de tabelas em documentos PDF financeiros brasileiros. Foram
avaliadas ferramentas baseadas em regras geométricas, em deep learning
especializado (IBM Docling) e em modelo multimodal, seguindo a
metodologia de quatro níveis de Göbel et al. (2012): detecção de página,
localização, estrutura celular e conteúdo textual. Os experimentos utilizaram
relatórios de Fundos de Investimento Imobiliário, caracterizados por tabelas
irregulares e células mescladas. Os resultados evidenciam diferenças
significativas entre as abordagens e os desafios persistentes na extração
automatizada de tabelas financeiras.
|
|||||||||||||
|
|||||||||||||