Título: | APLICAÇÃO DE DATA SCIENCE PARA CLASSIFICAÇÃO AUTOMÁTICA DE MENSAGENS EM UM PROCESSO INTENSIVO EM CONHECIMENTO ATRAVÉS DE MINERAÇÃO DE TEXTOS | ||||||||||||
Autor(es): |
PALOMA CASTRIOTO RIBEIRO VICTOR DE SIMONE OLIVEIRA |
||||||||||||
Colaborador(es): |
FERNANDA ARAUJO BAIAO AMORIM - Orientador PEDRO HENRIQUE PICCOLI RICHETTI - Coorientador |
||||||||||||
Catalogação: | 18/JAN/2021 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=51281@1 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.51281 | ||||||||||||
Resumo: | |||||||||||||
A Gestão de Processos de Negócios, ou Business Process Management (BPM), tem sido bastante utilizada no mercado de trabalho e estudada no meio acadêmico com o objetivo de identificar gargalos e otimizar processos de negócio. No entanto, cada vez mais esses processos são realizados por empresas e clientes interconectados em rede através das mídias sociais, originando uma quantidade de informações (estruturadas ou não, como documentos e mensagens) sem precedentes. Dentro deste contexto, são usadas técnicas de Ciência de Dados (Data Science) com o objetivo de extrair conhecimento útil das informações geradas, sendo o maior foco recente em processos pouco estruturados ou Processos Intensivos em Conhecimento (Knowledge-intensive Processes - KiP), que ainda têm suporte inadequado das metodologias e ferramentas existentes, e vêm se estabelecendo como os processos mais críticos nas organizações. Os KiPs envolvem tomadas de decisão complexas que dependem do conhecimento dos participantes do processo, além de serem flexíveis e apresentaram grande variabilidade. Diante deste cenário, este trabalho realiza uma revisão da teoria de KiP e de Teoria dos Atos de Fala, juntamente com as principais técnicas de processamento de linguagem natural (Natural Language Processing - NLP), além da criação de um algoritmo em Python que implementa essas técnicas para extrair conhecimento útil das mensagens trocadas entre os participantes de um KiP. Mais especificamente, o objetivo desse algoritmo é realizar a classificação automática de mensagens em categorias de Atos de Fala. Essa classificação pode futuramente servir de base para identificação de padrões de diálogo. O algoritmo criado tem 6 parâmetros, que foram combinados de maneiras distintas para gerar 74 modelos, durante um experimento de Ciência de Dados. Para medir o desempenho de cada um deles, foram utilizadas duas métricas: accuracy e hamming loss. O modelo que apresentou o melhor desempenho teve uma accuracy de 83,35 porcento e um hamming loss de 1,17 porcento. Esses resultados foram bem satisfatórios, considerando que este é um problema de NLP multi-label com 24 categorias diferentes.
|
|||||||||||||
|