Título
[pt] DOS TERMOS ÀS ENTIDADES NO DOMÍNIO DE PETRÓLEO
Título
[en] FROM TERMS TO ENTITIES IN THE OIL AND GAS AREA
Autor
[pt] WOGRAINE EVELYN FARIA DIAS
Vocabulário
[pt] TERMINOLOGIA
Vocabulário
[pt] ENTIDADES MENCIONADAS
Vocabulário
[pt] PLN PROCESSAMENTO DE LINGUAGEM NATURAL
Vocabulário
[pt] TAXONOMIA
Vocabulário
[pt] EXTRACAO DE INFORMACAO
Vocabulário
[en] TERMINOLOGY
Vocabulário
[en] NAMED ENTITY
Vocabulário
[en] NLP NATURAL LANGUAGEM PROCESSING
Vocabulário
[en] TAXONOMY
Vocabulário
[en] EXTRACTION OF INFORMATION
Resumo
[pt] Este trabalho tem como objetivo identificar uma terminologia e expressões
relevantes do domínio de óleo e gás (OeG) e estruturá-la como uma taxonomia,
tendo em vista o levantamento de itens para a anotação de entidades dentro do
domínio. Para tanto, foi construída uma lista de termos relevantes da área, com base em diversas fontes, e, em seguida, a lista foi estruturada hierarquicamente por meio de regras. O processo de elaboração da taxonomia seguiu aspectos teóricometodológicos utilizados por diversos trabalhos semelhantes dentro da área. O trabalho procura evidenciar que a identificação de uma terminologia de um domínio técnico e a sua estruturação como taxonomia podem servir como a primeira etapa do levantamento de entidades de um domínio. Por conta disso, o trabalho também se propõe a discutir estratégias para identificação de entidade mencionada (EM) e possibilitar um diálogo entre duas áreas: Processamento de Linguagem Natural (PLN) e Linguística. De maneira geral, espera-se que a taxonomia ajudar a suprir, mesmo que de forma modesta, a escassez de recursos linguísticos para as técnicas do Processamento de Linguagem Natural (PLN) e da Extração de Informação (EI), dentro da área de óleo e gás.
Resumo
[en] This work aims to identify a terminology and relevant expressions of the oil
and gas domain and structure it as a taxonomy. To this end, a list of relevant terms
in the area was built, based on various sources, and then the list was structured
hierarchically by rules. The taxonomy elaboration process followed theoretical and
methodological aspects used by several similar works within the area. The work
tries to show that the identification of a technical domain terminology and its
structuring as a taxonomy can serve as the first stage of the identification of entities
in a domain. Because of this, the work also proposes to discuss strategies for
identifying named entity and to enable a dialogue between two areas: Natural
Language Processing (NLP) and Linguistics. In general, the taxonomy presented is
expected to supply, at least in a modest way, the lack of linguistic resources for
techniques of Natural Language Processing (NLP) and Information Extraction (EI),
within the area of oil and gas.
Orientador(es)
MARIA CLAUDIA DE FREITAS
Banca
MARIA CLAUDIA DE FREITAS
Banca
MARIA JOSE BOCORNY FINATTO
Banca
DIANA MARIA DE SOUSA MARQUES PINTO DOS SANTOS
Catalogação
2021-09-09
Apresentação
2021-04-26
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=54588@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=54588@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.54588
Arquivos do conteúdo
NA ÍNTEGRA PDF