Título
[pt] CLASSIFICAÇÃO DE OFERTAS DE PRODUTOS
Título
[en] PRODUCT OFFERING CLASSIFICATION
Autor
[pt] FELIPE REIS GOMES
Vocabulário
[pt] APRENDIZADO DE MAQUINA
Vocabulário
[pt] CLASSIFICACAO DE PRODUTOS
Vocabulário
[pt] FRAMEWORK APRENDIZADO DE MAQUINA
Vocabulário
[pt] WEKA
Vocabulário
[pt] CLASSIFICACAO DE ENTIDADES
Vocabulário
[pt] APRENDIZADO SUPERVISIONADO
Vocabulário
[en] MACHINE LEARNING
Vocabulário
[en] PRODUCT CLASSIFICATION
Vocabulário
[en] SUPERVISED LEARNING
Resumo
[pt] Este trabalho apresenta o EasyLearn, um framework para apoiar o desenvolvimento de aplicações voltadas ao aprendizado supervisionado. O EasyLearn define uma camada intermediaria, de simples configuração e entendimento, entre a aplicação e o WEKA, um framework de aprendizado de máquina criado pela Universidade de Waikato. Todos os classificadores e filtros implementados pelo WEKA podem ser facilmente encapsulados para serem utilizados pelo EasyLearn. O EasyLearn recebe como entrada um conjunto de arquivos de configuração no formato XML contendo a definição do fluxo de processamento a ser executado, além da fonte de dados a ser processada, independente do formato. Sua saída é adaptável e pode ser configurada para produzir, por exemplo, relatórios de acurácia da classificação, a própria da fonte de dados classificada, ou o modelo de classificação já treinado. A arquitetura do EasyLearn foi definida após a análise detalhada dos processos de classificação, permitindo identificar inúmeras atividades em comum entre os três processos estudados aprendizado, avaliação e classificação). Através desta percepção e tomando as linguagens orientadas a objetos como inspiração, foi criado um framework capaz de comportar os processos de classificação e suas possíveis variações, além de permitir o reaproveitamento das configurações, através da implementação de herança e polimorfismo para os seus arquivos de configuração. A dissertação ilustra o uso do framework criado através de um estudo de caso completo sobre classificação de produtos do comércio eletrônico, incluindo a criação do corpus, engenharia de atributos e análise dos resultados obtidos.
Resumo
[en] This dissertation presents EasyLearn, a framework to support the development of supervised learning applications. EasyLearn dfines an intermediate layer, which is easy to configure and understand, between the application and WEKA, a machine learning framework created by the University of Waikato. All classifiers and filters implemented by WEKA can be easily encapsulated to be used by EasyLearn. EasyLearn receives as input a set of configuration files in XML format containing the definition of the processing flow to be executed, in addition to the data source to be classified, regardless of format. Its output is customizable and can be configured to produce classification accuracy reports, the classified data source, or the trained classification model. The architecture of EasyLearn was defined after a detailed analysis of the classification process, which identified a set of common activities among the three analyzed processes (learning, evaluation and classification). Through this insight and taking the object-oriented languages as inspiration, a framework was created which is able to support the classification processes and its variations, and which also allows reusing settings by implementing inheritance and polymorphism in their configuration files. This dissertation also illustrates the use of the created framework presenting a full case study about e-commerce product classification, including corpus creation, attribute engineering and result analysis.
Orientador(es)
MARCO ANTONIO CASANOVA
Coorientador(es)
RUY LUIZ MILIDIU
Banca
HELIO CORTES VIEIRA LOPES
Banca
RUY LUIZ MILIDIU
Banca
MARCO ANTONIO CASANOVA
Banca
ANTONIO LUZ FURTADO
Catalogação
2014-02-26
Apresentação
2012-12-18
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=22577@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=22577@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.22577
Arquivos do conteúdo
NA ÍNTEGRA PDF