Título
[en] A FRAMEWORK TO AUTOMATE DATA SCIENCE TASKS THROUGH PERSONALIZED CHATBOTS
Título
[pt] UM FRAMEWORK PARA AUTOMATIZAR TAREFAS DE CIENCIA DE DADOS ATRAVéS DE INTERFACES CONVERSACIONAIS
Autor
[pt] JEFRY SASTRE PEREZ
Vocabulário
[pt] ENGENHARIA DE SOFTWARE
Vocabulário
[pt] AUTOMACAO DE PROCESSOS
Vocabulário
[pt] CIENCIA DE DADOS
Vocabulário
[en] SOFTWARE ENGINEERING
Vocabulário
[en] AUTOMATION
Vocabulário
[en] DATA SCIENCE
Resumo
[pt] Diversas soluções foram criadas para automatizar cenários específicos de
ciência de dados e implementações de conteúdo personalizado em interfaces de
conversação. No entanto, o entendimento geral dessas interfaces de conversação
que fornecem sugestões personalizadas para cientistas de dados ainda é pouco
explorado. Identificamos a necessidade de automatizar procedimentos de ciência de dados até diferentes níveis de automação. Nossa pesquisa se concentra
em ajudar os cientistas de dados durante a automação desses procedimentos
usando interfaces conversacionais. Propomos um framework para a criação de
um sistema chat-bot para facilitar a automação de cenários comuns de ciência de dados. Além disso, instanciamos a solução em dois cenários diferentes
de ciência de dados. O primeiro cenário se concentra na detecção de valores
discrepantes e o segundo na limpeza de dados. Conduzimos um estudo com 28
participantes para demonstrar que os cientistas de dados podem usar a solução
proposta. Todos os participantes concluíram as atividades corretamente e 75 a
80 por cento acharam o framework relativamente fácil de estender e usar. Nossa análise sugere que o uso de interfaces conversacionais pode facilitar a automação
de tarefas de ciência de dados.
Resumo
[en] Several solutions have been created for automating specific data science
scenarios and implementations of personalized content in conversational interfaces. However, the overall understanding of these conversational interfaces
that provide personalized suggestions for data scientists is still poorly explored. We identify the need to automate data science procedures up to different
levels of automation. Our research focuses on helping data scientists during the
automation of these procedures by using conversational interfaces. We propose
a framework for creating a chat-bot system to facilitate the automation of data
science common scenarios. In addition, we instantiate the framework in two
different data science scenarios. The first scenario focuses on outlier detection,
and the second scenario on data cleaning. We conducted a study with 28 participants to demonstrate that data scientists can use the proposed framework.
All participants completed the activities correctly, and 75 to 80 percent found the
framework relatively easy to extend and use. Our analysis suggests that the
use of conversational interfaces can facilitate the automation of data science
tasks.
Orientador(es)
HELIO CORTES VIEIRA LOPES
Coorientador(es)
MARX LELES VIANA
Banca
HELIO CORTES VIEIRA LOPES
Banca
BRUNO FEIJO
Banca
SIMONE DINIZ JUNQUEIRA BARBOSA
Banca
MARCO ANTONIO CASANOVA
Banca
LUIZ ANDRE PORTES PAES LEME
Banca
MARCOS DE OLIVEIRA LAGE FERREIRA
Banca
MARX LELES VIANA
Banca
CASSIO FREITAS PEREIRA DE ALMEIDA
Catalogação
2022-01-31
Apresentação
2021-11-19
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
INGLÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=57219@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=57219@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.57219
Arquivos do conteúdo
NA ÍNTEGRA PDF