Logo PUC-Rio Logo Maxwell
TRABALHOS DE FIM DE CURSO @PUC-Rio
Consulta aos Conteúdos
Título: UMA APLICAÇÃO DE DATA SCIENCE UTILIZANDO O KNIME PARA DESCOBERTA DE REGRAS DE ASSOCIAÇÃO EM UM MARKETPLACE DE VENDAS DE VAREJO
Autor(es): LUCAS SEIXAS JAZBIK
MURILO DE SAN T ANNA FONSECA ALVES
Colaborador(es): FERNANDA ARAUJO BAIAO AMORIM - Orientador
BRUNO FANZERES DOS SANTOS - Coorientador
Catalogação: 17/MAR/2020 Língua(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TRABALHO DE FIM DE CURSO
Notas: [pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
[en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio.
Referência(s): [pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=47111@1
DOI: https://doi.org/10.17771/PUCRio.acad.47111
Resumo:
O advento da Internet possibilitou um crescimento exponencial na quantidade de dados gerados, de tal modo que atualmente geramos 2,5 quintilhões de bytes diariamente. Tal volume de informação é um mar de oportunidades para as empresas conhecerem melhor seus consumidores e públicos alvos. Por exemplo, a Amazon1, baseada na localização geográfica dos consumidores que buscam por produtos em seu site, envia previamente os itens mais buscados para os hubs de distribuição próximos ao local que concentrou a maior quantidade de procuras, já prevendo uma demanda por esses itens. Entretanto, a Amazon é uma exceção em relação à maioria das empresas existentes, de tal modo que ainda há muito espaço para o surgimento e crescimento de setores voltados para a Ciência de Dados em empresas de varejo. Os avanços na pesquisa e prática em Ciência de Dados vêm há muito tempo propondo e disponibilizando para uso diversas técnicas que visam explorar bancos de dados e encontrar padrões úteis e desconhecidos previamente. Dentre as diversas técnicas existentes, a que será utilizada nesse trabalho será a de aprendizado de regras de associação, sua função consiste em encontrarmos padrões de ocorrência simultânea de itens em um determinado conjunto de dados representando transações. Tal descoberta é importante, pois utilizada em um contexto de vendas pode servir como vantagem para que se ofereçam produtos de forma conjunta, por exemplo: Se o estudo apontar que martelos e pregos aparecem frequentemente juntos, é inteligente oferecer pregos sempre que um cliente compra martelos. Utilizaremos o algoritmo APRIORI, por meio do software KNIME como ferramenta para o aprendizado das regras de associação entre itens comprados em sites de varejo online que utilizam o canal de vendas Olist. Os dados relacionados a este cenário foram obtidos no portal Kaggle, um repositório de benchmarks para aplicações de descoberta de conhecimento bastante conhecido na área. A escolha por esse algoritmo se deu pois o mesmo é de uso mais frequente tanto na prática quanto na literatura voltada para aprendizado de regras de associação. Nos resultados obtidos por esse trabalho foram encontradas algumas cestas de itens frequentes. A metodologia de Ciência de Dados seguida neste trabalho, contemplando asa nálises exploratórias realizadas, o racional das decisões tomadas para limpeza e preparação dos dados, a codificação do workflow e a configuração dos cenários que compuseram o experimento para o aprendizado das regras de associação, assim como os insights desenvolvidos a partir dos resultados obtidos podem servir de inspiração para stakeholders envolvidos com cenários semelhantes, em particular em ambientes de compra e venda online varejistas, como possível forma de analisar suas informações históricas e propor estratégias para impulsionar suas vendas oferecendo de forma conjunta esses itens.
Descrição: Arquivo:   
NA ÍNTEGRA PDF