Título: | UMA APLICAÇÃO DE DATA SCIENCE UTILIZANDO O KNIME PARA DESCOBERTA DE REGRAS DE ASSOCIAÇÃO EM UM MARKETPLACE DE VENDAS DE VAREJO | ||||||||||||
Autor(es): |
LUCAS SEIXAS JAZBIK MURILO DE SAN T ANNA FONSECA ALVES |
||||||||||||
Colaborador(es): |
FERNANDA ARAUJO BAIAO AMORIM - Orientador BRUNO FANZERES DOS SANTOS - Coorientador |
||||||||||||
Catalogação: | 17/MAR/2020 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=47111@1 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.47111 | ||||||||||||
Resumo: | |||||||||||||
O advento da Internet possibilitou um crescimento exponencial na quantidade de
dados gerados, de tal modo que atualmente geramos 2,5 quintilhões de bytes diariamente. Tal
volume de informação é um mar de oportunidades para as empresas conhecerem melhor seus
consumidores e públicos alvos. Por exemplo, a Amazon1, baseada na localização geográfica
dos consumidores que buscam por produtos em seu site, envia previamente os itens mais
buscados para os hubs de distribuição próximos ao local que concentrou a maior quantidade
de procuras, já prevendo uma demanda por esses itens. Entretanto, a Amazon é uma exceção
em relação à maioria das empresas existentes, de tal modo que ainda há muito espaço para o
surgimento e crescimento de setores voltados para a Ciência de Dados em empresas de varejo.
Os avanços na pesquisa e prática em Ciência de Dados vêm há muito tempo propondo
e disponibilizando para uso diversas técnicas que visam explorar bancos de dados e encontrar
padrões úteis e desconhecidos previamente. Dentre as diversas técnicas existentes, a que será
utilizada nesse trabalho será a de aprendizado de regras de associação, sua função consiste em
encontrarmos padrões de ocorrência simultânea de itens em um determinado conjunto de
dados representando transações. Tal descoberta é importante, pois utilizada em um contexto
de vendas pode servir como vantagem para que se ofereçam produtos de forma conjunta, por
exemplo: Se o estudo apontar que martelos e pregos aparecem frequentemente juntos, é
inteligente oferecer pregos sempre que um cliente compra martelos.
Utilizaremos o algoritmo APRIORI, por meio do software KNIME como ferramenta
para o aprendizado das regras de associação entre itens comprados em sites de varejo online
que utilizam o canal de vendas Olist. Os dados relacionados a este cenário foram obtidos no
portal Kaggle, um repositório de benchmarks para aplicações de descoberta de conhecimento
bastante conhecido na área. A escolha por esse algoritmo se deu pois o mesmo é de uso mais
frequente tanto na prática quanto na literatura voltada para aprendizado de regras de
associação.
Nos resultados obtidos por esse trabalho foram encontradas algumas cestas de itens
frequentes. A metodologia de Ciência de Dados seguida neste trabalho, contemplando asa nálises exploratórias realizadas, o racional das decisões tomadas para limpeza e preparação
dos dados, a codificação do workflow e a configuração dos cenários que compuseram o
experimento para o aprendizado das regras de associação, assim como os insights
desenvolvidos a partir dos resultados obtidos podem servir de inspiração para stakeholders
envolvidos com cenários semelhantes, em particular em ambientes de compra e venda online
varejistas, como possível forma de analisar suas informações históricas e propor estratégias
para impulsionar suas vendas oferecendo de forma conjunta esses itens.
|
|||||||||||||
|