Maxwell Para Simples Indexação

Título
[en] BINARY MATRIX FACTORIZATION POST-PROCESSING AND APPLICATIONS

Título
[pt] PÓS-PROCESSAMENTO DE FATORAÇÃO BINÁRIA DE MATRIZES E APLICAÇÕES

Autor
[pt] GEORGES MIRANDA SPYRIDES

Vocabulário
[pt] MINERACAO DE PROCESSOS

Vocabulário
[pt] FATORACAO DE MATRIZES NAO NEGATIVAS

Vocabulário
[pt] FATORACAO DE MATRIZES BINARIAS

Vocabulário
[en] PROCESS MINING

Vocabulário
[en] NON-NEGATIVE MATRIX FACTORIZATION

Vocabulário
[en] BINARY MATRIX FACTORIZATION

Resumo
[pt] Novos métodos de fatoração de matrizes introduzem restrições às matrizes decompostas, permitindo tipos únicos de análise. Uma modificação significativa é a fatoração de matrizes binárias para matrizes binárias. Esta técnica pode revelar subconjuntos comuns e mistura de subconjuntos, tornando-a útil em uma variedade de aplicações, como análise de cesta de mercado, modelagem de tópicos e sistemas de recomendação. Apesar das vantagens, as abordagens atuais enfrentam um trade-off entre precisão, escalabilidade e explicabilidade. Enquanto os métodos baseados em gradiente descendente são escaláveis, eles geram altos erros de reconstrução quando limitados para matrizes binárias. Por outro lado, os métodos heurísticos não são escaláveis. Para superar isso, essa tese propõe um procedimento de pós-processamento para discretizar matrizes obtidas por gradiente descendente. Esta nova abordagem recupera o erro de reconstrução após a limitação e processa com sucesso matrizes maiores dentro de um prazo razoável. Testamos esta técnica a muitas aplicações, incluindo um novo pipeline para descobrir e visualizar padrões em processos petroquímicos em batelada.

Resumo
[en] Novel methods for matrix factorization introduce constraints to the decomposed matrices, allowing for unique kinds of analysis. One significant modification is the binary matrix factorization for binary matrices. This technique can reveal common subsets and mixing of subsets, making it useful in a variety of applications, such as market basket analysis, topic modeling, and recommendation systems. Despite the advantages, current approaches face a trade-off between accuracy, scalability, and explainability. While gradient descent-based methods are scalable, they yield high reconstruction errors when thresholded for binary matrices. Conversely, heuristic methods are not scalable. To overcome this, this thesis propose a post-processing procedure for discretizing matrices obtained by gradient descent. This novel approach recovers the reconstruction error post-thresholding and successfully processes larger matrices within a reasonable timeframe. We apply this technique to many applications including a novel pipeline for discovering and visualizing patterns in petrochemical batch processes.

Orientador(es)
HELIO CORTES VIEIRA LOPES

Coorientador(es)
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
HELIO CORTES VIEIRA LOPES

Banca
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO

Banca
BRUNO FANZERES DOS SANTOS

Banca
ALEX LAIER BORDIGNON

Banca
FERNANDA ARAUJO BAIAO AMORIM

Banca
CASSIO FREITAS PEREIRA DE ALMEIDA

Banca
EDUARDO CAMPONOGARA

Catalogação
2024-02-06

Apresentação
2023-08-24

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=65993@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.65993


Arquivos do conteúdo
NA ÍNTEGRA PDF