Maxwell Para Simples Indexação

Título
[pt] CLASSIFICANDO IMAGENS COM PADRÕES INCERTOS: DAS PROPRIEDADES VISUAIS À IMPORTÂNCIA DA NARRATIVA

Título
[en] CLASSIFYING IMAGES WITH UNCLEAR PATTERNS: FROM VISUAL FEATURES TO NARRATIVE IMPORTANCE

Autor
[pt] YAN MARTINS BRAZ GUREVITZ CUNHA

Vocabulário
[pt] NARRATOLOGIA

Vocabulário
[pt] PERSONAGENS DE ANIME

Vocabulário
[pt] APRENDIZADO PROFUNDO

Vocabulário
[pt] CLASSIFICACAO DE IMAGENS

Vocabulário
[en] NARRATOLOGY

Vocabulário
[en] ANIME CHARACTERS

Vocabulário
[en] DEEP LEARNING

Vocabulário
[en] IMAGE CLASSIFICATION

Resumo
[pt] O campo de classificação de imagens tem sido bastante explorado há anos, em especial com o grande avanço de redes neurais da última década. No entanto, grande parte do foco tem sido dedicado a casos com grandes diferenças inter-classe e pequenas diferenças intra-classe. Neste trabalho exploramos o quão bem redes convolucionais lidam com casos com pequenas diferenças inter-classe e cujas classificações carregam um grau de subjetividade, torando não óbvia a relação entre features visuais e classifcação e diferenciando isso do campo tradicional de fine-grained classificaiton. Para isso, abordamos um caso específico deste problema: Determinar a importância narrativa de um personagem a partir somente de sua imagem. Avaliamos a performance de CNNs em nossa tarefa, usando um dataset que criamos para ela, e analisamos que padrões conseguimos encontrar no quis diz respeito da relação entre features visuais e classifcação. Mostramos que, especificamente para a tarefa que estudamos, CNNs conseguem superar a performance humana em termos de acurácia e, além disso, refletem vários dos padrões apresentados por humanos quando julgam personagens, até mesmos alguns padrões que não refletem a realidade. Isto significa que esse tipo de modelo pode ser um possível substiuto para avaliadores humanos para propósitos de character design.

Resumo
[en] The field of image classification has been heavily explored for years, especially with the big advancements in deep neural networks seen in the last decade. However, most of the focus has been dedicated to cases with significant inter-class differences and minor intra-class differences. In this work we explore how well convolutional networks deal with cases with small inter-class differences and whose classification carries a degree of subjectivity, making non-obvious the relationship between visual features and classification and differentiating it from the traditional field of fine-grained classification. To do that, we approach a specific instance of this problem: Determining a character s narrative importance based solely on its image. We have evaluate the performance of different CNN models in our task, using a dataset we created for it, and we have analysed which patterns were found when it comes to the relationship between visual features and classification. We show that, for our specific task, CNNs are able to exceed human performance in pure accuracy and, more interestingly, mirror many of the patterns humans show when judging characters, even if some of those patterns are inaccurate. This means that this kind of model may be able to serve as a good surrogate for human evaluators when designing characters.

Orientador(es)
SERGIO COLCHER

Banca
ALBERTO BARBOSA RAPOSO

Banca
SERGIO COLCHER

Banca
ANTONIO JOSE GRANDSON BUSSON

Catalogação
2023-03-20

Apresentação
2023-02-16

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=61995@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=61995@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.61995


Arquivos do conteúdo
NA ÍNTEGRA PDF