Maxwell Para Simples Indexação

Título
[pt] ALGORITMO GENÉTICO HÍBRIDO PARA O PROBLEMA DE CLUSTERIZAÇÃO MINIMUM SUM-OF-SQUARES

Título
[en] HYBRID GENETIC ALGORITHM FOR THE MINIMUM SUM-OF-SQUARES CLUSTERING PROBLEM

Autor
[pt] DANIEL LEMES GRIBEL

Vocabulário
[pt] MINERACAO DE DADOS

Vocabulário
[pt] APRENDIZADO NAO SUPERVISIONADO

Vocabulário
[pt] MINIMA SOMA DOS QUADRADOS

Vocabulário
[pt] CLUSTERIZACAO

Vocabulário
[pt] META-HEURISTICA

Vocabulário
[en] DATA MINING

Vocabulário
[en] UNSUPERVISED LEARNING

Vocabulário
[en] MINIMUM SUMOF- SQUARES

Vocabulário
[en] CLUSTERING

Vocabulário
[en] META-HEURISTICS

Resumo
[pt] Clusterização desempenha um papel importante em data mining, sendo útil em muitas áreas que lidam com a análise exploratória de dados, tais como recuperação de informações, extração de documentos e segmentação de imagens. Embora sejam essenciais em aplicações de data mining, a maioria dos algoritmos de clusterização são métodos ad-hoc. Eles carecem de garantias na qualidade da solução, que em muitos casos está relacionada a uma convergência prematura para um mínimo local no espaço de busca. Neste trabalho, abordamos o problema de clusterização a partir da perspectiva de otimização, onde propomos um algoritmo genético híbrido para resolver o problema Minimum Sum-of-Squares Clustering (MSSC, em inglês). A meta-heurística proposta é capaz de escapar de mínimos locais e gerar soluções quase ótimas para o problema MSSC. Os resultados mostram que o método proposto superou os resultados atuais da literatura – em termos de qualidade da solução – para quase todos os conjuntos de instâncias considerados para o problema MSSC.

Resumo
[en] Clustering plays an important role in data mining, being useful in many fields that deal with exploratory data analysis, such as information retrieval, document extraction, and image segmentation. Although they are essential in data mining applications, most clustering algorithms are adhoc methods. They have a lack of guarantee on the solution quality, which in many cases is related to a premature convergence to a local minimum of the search space. In this research, we address the problem of data clustering from an optimization perspective, where we propose a hybrid genetic algorithm to solve the Minimum Sum-of-Squares Clustering (MSSC) problem. This meta-heuristic is capable of escaping from local minima and generating near-optimal solutions to the MSSC problem. Results show that the proposed method outperformed the best current literature results - in terms of solution quality - for almost all considered sets of benchmark instances for the MSSC objective.

Orientador(es)
THIBAUT VICTOR GASTON VIDAL

Banca
MARCO SERPA MOLINARO

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
THIBAUT VICTOR GASTON VIDAL

Catalogação
2017-07-27

Apresentação
2017-03-20

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30724@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=30724@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.30724


Arquivos do conteúdo
NA ÍNTEGRA PDF