Título: | DO TEXTO AO SQL EM DATASETS DO MUNDO REAL | ||||||||||||
Autor(es): |
AIKO RAMALHO DE OLIVEIRA |
||||||||||||
Colaborador(es): |
MARCO ANTONIO CASANOVA - Orientador |
||||||||||||
Catalogação: | 28/ABR/2025 | Língua(s): | INGLÊS - ESTADOS UNIDOS |
||||||||||
Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=70127@1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=70127@2 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.70127 | ||||||||||||
Resumo: | |||||||||||||
No campo em rápida evolução do Processamento de Linguagem Natural (NLP), a tarefa de traduzir consultas em linguagem natural para consultas SQL (Text-to-SQL) tem ganhado atenção significativa devido ao seu potencial para simplificar interações com bancos de dados para usuários não técnicos. Este projeto final, intitulado Text-to-SQL em Conjuntos de Dados do Mundo Real,explora métodos inovadores para melhorar a precisão e a eficiência dos sistemas Text-to-SQL, focando especificamente em bancos de dados do mundo real com esquemas complexos. O projeto utiliza a técnica de Geração Aumentada por Recuperação (RAG) para melhorar a precisão do Text-to-SQL, integrando fontes de dados externas e estratégias de ajuste fino. Uma combinação de geração de conjuntos
de dados sintéticos e estratégias de prompts é empregada para aprimorar o desempenho do modelo. O conjunto de dados Mondial, conhecido por sua complexidade e riqueza em dados geográficos, serve como referência para avaliar as técnicas propostas.
O objetivo do estudo é desenvolver uma estrutura robusta de Textto-SQL capaz de lidar com consultas diversas e complexas, tornando as interações com bancos de dados mais intuitivas e acessíveis. As metodologias, experimentos e descobertas documentadas neste relatório contribuem com insights valiosos para a pesquisa contínua em NLP e sistemas de gerenciamento de bancos de dados.
|
|||||||||||||
|