XINFORMAÇÕES SOBRE DIREITOS AUTORAIS
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: CLUSTERING UNDER CONSTRAINTS: EXPLAINABILITY VIA DECISION TREES AND SEPARABILITY WITH MINIMUM SIZE Autor: LUCAS SAADI MURTINHO
Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO
Colaborador(es):
EDUARDO SANY LABER - ADVISOR
Nº do Conteudo: 69655
Catalogação: 18/03/2025 Liberação: 21/03/2025 Idioma(s): ENGLISH - UNITED STATES
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=69655&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=69655&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.69655
Resumo:
Título: CLUSTERING UNDER CONSTRAINTS: EXPLAINABILITY VIA DECISION TREES AND SEPARABILITY WITH MINIMUM SIZE Autor: LUCAS SAADI MURTINHO
Nº do Conteudo: 69655
Catalogação: 18/03/2025 Liberação: 21/03/2025 Idioma(s): ENGLISH - UNITED STATES
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=69655&idi=1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=69655&idi=2
Referência DOI: https://doi.org/10.17771/PUCRio.acad.69655
Resumo:
We investigate two methods of clustering with constraints on the partitions
being generated: explainable clustering, in which the partition must be
induced by a binary decision tree (i.e., by cuts that are parallel to the
axes); and minimum-size clustering, in which all clusters must have at least
a predetermined number of elements.
For explainable clustering, we present theoretical algorithms and bounds for
the k-centers, k-medians, k-means, and minimum-spacing cost functions.
We also introduce three practical algorithms for the popular k-means cost
function: ExGreedy, which presents results generally better than comparable
algorithms in the literature; ExShallow, with a penalty term related to the
depth of the tree that induces the partition, allowing for a trade-off between
performance (reducing the cost function) and explainability (generating
shallower trees); and ExBisection, to our knowledge the first explainable
clustering algorithm based on decision trees for the k-means cost function
that builds an explainable partition from scratch (i.e., without starting from
an unrestricted partition).
For minimum-size clustering, our focus is on inter-clustering measures. We
show that Single-Linkage, the algorithm that maximizes the minimum
spacing, also maximizes the minimum-spanning-tree cost of a graph induced
by the partition it generates; however, it is also prone to generating small
clusters, which motivates the search for algorithms that perform well for
these cost functions without suffering from this tendency. We introduce one
approximation algorithm for each cost function, and present the results of
experiments showing that they produce partitions that perform better than
the popular k-means algorithm for these instances of the clustering task.
Descrição | Arquivo |
COMPLETE |