Título
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS
Título
[pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES
Autor
[pt] GEORGES MIRANDA SPYRIDES
Vocabulário
[pt] MINERACAO DE PROCESSOS
Vocabulário
[pt] FATORACAO DE MATRIZES NAO NEGATIVAS
Vocabulário
[pt] FATORACAO DE MATRIZES BINARIAS
Vocabulário
[en] PROCESS MINING
Vocabulário
[en] NON-NEGATIVE MATRIX FACTORIZATION
Vocabulário
[en] BINARY MATRIX FACTORIZATION
Resumo
[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.
Resumo
[en] Novel methods for matrix factorization introduce constraints to the
decomposed matrices, allowing for unique kinds of analysis. One significant
modification is the binary matrix factorization for binary matrices. This
technique can reveal common subsets and mixing of subsets, making it useful
in a variety of applications, such as market basket analysis, topic modeling,
and recommendation systems. Despite the advantages, current approaches face
a trade-off between accuracy, scalability, and explainability. While gradient
descent-based methods are scalable, they yield high reconstruction errors
when thresholded for binary matrices. Conversely, heuristic methods are not
scalable. To overcome this, this thesis propose a post-processing procedure
for discretizing matrices obtained by gradient descent. This novel approach
recovers the reconstruction error post-thresholding and successfully processes
larger matrices within a reasonable timeframe. We apply this technique to
many applications including a novel pipeline for discovering and visualizing
patterns in petrochemical batch processes.
Orientador(es)
HELIO CORTES VIEIRA LOPES
Coorientador(es)
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
Banca
HELIO CORTES VIEIRA LOPES
Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
Banca
BRUNO FANZERES DOS SANTOS
Banca
ALEX LAIER BORDIGNON
Banca
FERNANDA ARAUJO BAIAO AMORIM
Banca
CASSIO FREITAS PEREIRA DE ALMEIDA
Banca
EDUARDO CAMPONOGARA
Catalogação
2024-02-06
Apresentação
2023-08-24
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
INGLÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.65993
Arquivos do conteúdo
NA ÍNTEGRA PDF