Maxwell Para Simples Indexação

Título
[pt] ARQUITETURA PROFUNDA PARA EXTRAÇÃO DE CITAÇÕES

Título
[en] DEEP ARCHITECTURE FOR QUOTATION EXTRACTION

Autor
[pt] LUIS FELIPE MULLER DE OLIVEIRA HENRIQUES

Vocabulário
[pt] REDE NEURAL

Vocabulário
[pt] APRENDIZADO PROFUNDO

Vocabulário
[pt] EXTRACAO DE CITACOES

Vocabulário
[pt] PROCESSAMENTO DE LINGUAGEM NATURAL

Vocabulário
[pt] APRENDIZADO DE MAQUINA

Vocabulário
[en] NEURAL NETWORKS

Vocabulário
[en] DEEP LEARNING

Vocabulário
[en] QUOTATION EXTRACTION

Vocabulário
[en] NATURAL LANGUAGE PROCESSING

Vocabulário
[en] MACHINE LEARNING

Resumo
[pt] A Extração e Atribuição de Citações é a tarefa de identificar citações de um texto e associá-las a seus autores. Neste trabalho, apresentamos um sistema de Extração e Atribuição de Citações para a língua portuguesa. A tarefa de Extração e Atribuição de Citações foi abordada anteriormente utilizando diversas técnicas e para uma variedade de linguagens e datasets. Os modelos tradicionais para a tarefa consistem em extrair manualmente um rico conjunto de atributos e usá-los para alimentar um classificador raso. Neste trabalho, ao contrário da abordagem tradicional, evitamos usar atributos projetados à mão, usando técnicas de aprendizagem não supervisionadas e redes neurais profundas para automaticamente aprender atributos relevantes para resolver a tarefa. Ao evitar a criação manual de atributos, nosso modelo de aprendizagem de máquina tornou-se facilmente adaptável a outros domínios e linguagens. Nosso modelo foi treinado e avaliado no corpus GloboQuotes e sua métrica de desempenho F1 é igual a 89.43 por cento.

Resumo
[en] Quotation Extraction and Attribution is the task of identifying quotations from a given text and associating them to their authors. In this work, we present a Quotation Extraction and Attribution system for the Portuguese language. The Quotation Extraction and Attribution task has been previously approached using various techniques and for a variety of languages and datasets. Traditional models to this task consist of extracting a rich set of hand-designed features and using them to feed a shallow classifier. In this work, unlike the traditional approach, we avoid using hand-designed features using unsupervised learning techniques and deep neural networks to automatically learn relevant features to solve the task. By avoiding design features by hand, our machine learning model became easily adaptable to other languages and domains. Our model is trained and evaluated at the GloboQuotes corpus, and its F1 performance metric is equal to 89.43 percent.

Orientador(es)
RUY LUIZ MILIDIU

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
RUY LUIZ MILIDIU

Banca
EDWARD HERMANN HAEUSLER

Catalogação
2017-07-28

Apresentação
2017-03-08

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30734@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.30734


Arquivos do conteúdo
NA ÍNTEGRA PDF