Título
[pt] APLICAÇÃO DE TÉCNICAS DE NLP E CLUSTERIZAÇÃO PARA SEGMENTAÇÃO DE PROSPECTOS DE FUNDOS UCITS
Título
[en] APPLICATION OF NLP AND CLUSTERING TECHNIQUES FOR SEGMENTATION OF UCITS FUND PROSPECTUSES
Autor
[pt] JOAO PEDRO KHAIR CUNHA
Vocabulário
[pt] FINANCA
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL
Vocabulário
[pt] CLUSTERIZACAO
Vocabulário
[pt] FUNDO DE INVESTIMENTO
Vocabulário
[en] FINANCE
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] NATURAL LANGUAGE PROCESSING
Vocabulário
[en] CLUSTERING
Vocabulário
[en] INVESTMENT FUND
Resumo
[pt] O Processamento de Linguagem Natural (NLP) revolucionou a leitura e processamento automático de textos, culminando na emergência de modelos Large Language Models que possibilitaram uma compreensão e extração de informações em níveis jamais vistos. Neste estudo, explorou-se o uso de técnicas de NLP e Machine Learning para segmentar prospectos de fundos de investimento do tipo UCITS (Undertakings for Collective Investment in Transferable Securities), no intuito de otimizar a coleta de dados não estruturados contidos neles. Utilizando algoritmos de frequência de n-gramas e clusterização, esta tese busca expandir os horizontes de aplicação de Inteligência Artificial
no âmbito do mercado financeiro.
Resumo
[en] Natural Language Processing (NLP) has revolutionized the automatic reading and processing of texts, culminating in the emergence of Large Language Models that have made it possible to understand and extract information at unprecedented levels. This study explored the use of NLP and Machine Learning techniques to segment UCITS (Undertakings for Collective Investment in Transferable Securities) investment fund prospectuses in order to optimize the collection of unstructured data contained therein. Using n-gram frequency and clustering algorithms, this thesis seeks to expand the application horizons of Artificial Intelligence in the scope of financial markets.
Orientador(es)
ALVARO DE LIMA VEIGA FILHO
Catalogação
2024-09-06
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=67886@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=67886@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.67886
Arquivos do conteúdo
NA ÍNTEGRA PDF