Título: | ESTUDO DE TÉCNICAS DE APRENDIZADO POR REFORÇO APLICADAS AO CONTROLE DE PROCESSOS QUÍMICOS | ||||||||||||
Autor: |
ERIC MONTEIRO E LOBO LUZ |
||||||||||||
Colaborador(es): |
WOUTER CAARLS - Orientador |
||||||||||||
Catalogação: | 30/DEZ/2021 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
Tipo: | TEXTO | Subtipo: | TESE | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=56872&idi=1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=56872&idi=2 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.56872 | ||||||||||||
Resumo: | |||||||||||||
A indústria 4.0 impulsionou o desenvolvimento de novas tecnologias
para atender as demandas atuais do mercado. Uma dessas novas tecnologias
foi a incorporação de técnicas de inteligência computacional no cotidiano
da indústria química. Neste âmbito, este trabalho avaliou o desempenho de
controladores baseados em aprendizado por reforço em processos químicos
industriais. A estratégia de controle interfere diretamente na segurança e
no custo do processo. Quanto melhor for o desempenho dessa estrategia,
menor será a produção de efluentes e o consumo de insumos e energia. Os
algoritmos de aprendizado por reforço apresentaram excelentes resultados
para o primeiro estudo de caso, o reator CSTR com a cinética de Van de
Vusse. Entretanto, para implementação destes algoritmos na planta química
do Tennessee Eastman Process mostrou-se que mais estudos são necessários.
A fraca ou inexistente propriedade Markov, a alta dimensionalidade e as
peculiaridades da planta foram fatores dificultadores para os controladores
desenvolvidos obterem resultados satisfatórios. Foram avaliados para o estudo
de caso 1, os algoritmos Q-Learning, Actor Critic TD, DQL, DDPG, SAC e
TD3, e para o estudo de caso 2 foram avaliados os algoritmos CMA-ES, TRPO,
PPO, DDPG, SAC e TD3.
|
|||||||||||||
|