Título
[pt] ALGORITMO GENÉTICO PARA SELEÇÃO DE VARIÁVEIS NA CLASSIFICAÇÃO DE FALHAS EM PROCESSOS QUÍMICOS DE LARGA ESCALA
Título
[en] GENETIC ALGORITHM FOR FEATURE SELECTION IN LARGE SCALE CHEMICAL PROCESSES FAULT CLASSIFICATION
Autor
[pt] MARCOS VINICIUS PORTO DE SA
Vocabulário
[pt] CLASSIFICACAO
Vocabulário
[pt] PROCESSO TENNESSEE EASTMAN
Vocabulário
[pt] EMBALADORA
Vocabulário
[pt] SELECAO DE VARIAVEIS
Vocabulário
[pt] ALGORITMO GENETICO
Vocabulário
[en] CLASSIFICATION
Vocabulário
[en] TENNESSEE EASTMAN PROCESS
Vocabulário
[en] WRAPPER
Vocabulário
[en] SELECTION OF VARIABLES
Vocabulário
[en] GENETIC ALGORITHM
Resumo
[pt] Com o advento da indústria 4.0, observou-se um aumento expressivo na geração de informações alavancado por novas tecnologias de monitoramento. Algoritmos de Machine Learning são amplamente empregados nesse contexto para a inferência estatística, predição, detecção e diagnóstico de falhas. Entretanto, dados redundantes ou com baixo ganho de informação a respeito do processo que se deseja ter uma predição ou diagnóstico podem significar um custo computacional desnecessário, gerando modelos inadequados. Um grande desafio, portanto, é filtrar esses dados a fim de capturar apenas uma parcela que possua relevância significativa, com o objetivo de otimizar recursos investidos nos sistemas de monitoramento. Este projeto propõe um método de seleção de variáveis do tipo Wrapper baseado em Algoritmos Genéticos para obter um subconjunto suficiente de atributos de entrada para proporcionar uma acurácia satisfatória no treinamento e validação de modelos de classificação de falhas em processos químicos industriais. Foi empregado para a classificação de falhas e também para avaliar as soluções geradas pelo Algoritmos Genético, o Random Forrest, da classe dos algoritmos do tipo Ensemble. Este projeto utilizou como objeto de estudo o caso do Processo Tennessee Eastman. Os resultados foram considerados promissores, obtendo-se uma melhora na acurácia de 1,72% e com uma redução de aproximadamente 50% do número de variáveis em relação ao caso base sem seleção de variáveis.
Resumo
[en] With the advent of industry 4.0, there was a significant increase in the generation of information leveraged by new monitoring technologies. Machine Learning algorithms are widely used in this context for statistical inference, prediction, detection and fault diagnosis. However, redundant data or with low gain of information about the process that is desired to have a prediction or diagnosis, can mean an unnecessary cost, generating slow models. A major challenge, therefore, is to filter this data to capture only a portion that has significant relevance, to optimize resources invested in monitoring systems. This project proposes a Wrapper Feature Selection Method based on a Genetic Algorithm to obtain a subset of the input attributes to provide a satisfactory accuracy in the training and validation of classification models in Industrial Chemical Processes Fault Classification. It was used for Fault Classification and to evaluate the solutions generated by the Genetic Algorithm, a Random Forrest Classifier, from the Ensemble algorithm class. This project used the Tennessee Eastman Process as its object of study. The results were considered promising, with an improvement in accuracy of 1.72% and a reduction of approximately 50% in the number of variables in relation to the base case without selection of variables.
Orientador(es)
MARLEY MARIA BERNARDES REBUZZI VELLASCO
Catalogação
2022-11-24
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=61398@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=61398@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.61398
Arquivos do conteúdo
NA ÍNTEGRA PDF