Maxwell Para Simples Indexação

Título
[pt] BUSCA POR ARQUITETURA NEURAL COM INSPIRAÇÃO QUÂNTICA APLICADA A SEGMENTAÇÃO SEMÂNTICA UTILIZANDO REDES NEURAIS SIMÉTRICAS

Título
[en] QUANTUM-INSPIRED NEURAL ARCHITECTURE SEARCH APPLIED TO SEMANTIC SEGMENTATION USING SYMMETRIC NETWORKS

Autor
[pt] FABIO HENRIQUE CARDOSO

Vocabulário
[pt] ALGORITMO EVOLUCIONARIO

Vocabulário
[pt] COMPUTACAO COM INSPIRACAO QUANTICA

Vocabulário
[pt] BUSCA POR ARQUITETURA NEURAL

Vocabulário
[pt] SEGMENTACAO SEMANTICA

Vocabulário
[en] EVOLUTIONARY ALGORITHM

Vocabulário
[en] QUANTUM-INSPIRED COMPUTING

Vocabulário
[en] NEURAL ARCHITECTURE SEARCH

Vocabulário
[en] PIXEL-WISE SEMANTIC SEGMENTATION

Resumo
[pt] A aprendizagem profunda revolucionou vários domínios, demonstrando excelente desempenho em várias tarefas perceptivas nos campos de visão computacional, reconhecimento de fala e processamento de linguagem natural. No entanto, o projeto de arquiteturas ideais de redes neurais profundas geralmente depende do conhecimento de especialistas e de abordagens demoradas de tentativa e erro. O campo da busca por arquiteturas neurais (NAS - Neural Architecture Search) surgiu como uma solução promissora, automatizando o processo de design para descobrir arquiteturas que melhoram o desempenho e a eficiência. Este trabalho apresenta o SegQSNAS, uma extensão do SegQNAS, projetado para Q-NAS (Quantum-inspired Neural Architecture Search) em segmentação semântica, especialmente no domínio de imagens médicas. O SegQSNAS foi projetado para pesquisar arquiteturas simétricas do tipo U-Net, reduzindo assim o espaço de busca e eliminando a necessidade de verificações de viabilidade de solução que eram necessárias no SegQNAS. Além disso, ele aprimora o processo de busca incorporando uma operação de cruzamento de dois pontos para melhorar a exploração durante o processo evolutivo, juntamente com a adição de funções de self-attention, MobileNet e EfficientNet ao espaço de busca que permite a descoberta de redes eficientes e personalizadas. Para tratar de imprecisões em cenários com vários rótulos, a implementação do SegQNAS do Coeficiente de Dice-Sorensen (DSC) e as funções de perda foram corrigidas porque fornecem uma avaliação de DSC superestimada nesses cenários. Os experimentos com conjuntos de dados de segmentação médica do desafio Medical Segmentation Decathlon demonstram que, no experimento do conjunto de dados de próstata, o SegQSNAS teve um bom desempenho com os melhores resultados em DSC, contagem de parâmetros e dias de GPU, alcançando 0.7924 no DSC médio com meio milhão de parâmetros. SegQSNAS também apresentou bons resultados no experimento com o conjunto de dados do fígado devido ao melhor trade-off, considerando que se trata de um cenário de recursos de computação limitados. No entanto, em alguns experimentos, ele mostra alguma limitação da estratégia de pesquisa ou do recurso computacional disponível. Além disso, em todos os experimentos, a função de self-attention não foi selecionada na melhor arquitetura encontrada, o que indica que o número máximo predefinido de nós ou a complexidade dos problemas testados podem não ter sido suficientemente altos para que essa operação fosse selecionada durante o processo de evolução.

Resumo
[en] Deep learning has revolutionized various domains, showing great performance for several perceptual tasks, in the fields of computer vision, speech recognition, and natural language processing. However, designing optimal deep neural network (DNN) architectures often rely on expert knowledge and time-consuming trial and error approaches. Neural Architecture Search (NAS) has emerged as a promising solution, automating the design process to discover architectures that enhance performance and efficiency. This work introduces SegQSNAS, an extension of SegQNAS, designed for Q-NAS (Quantum-inspired Neural Architecture Search) in semantic segmentation, particularly within the medical imaging domain. SegQSNAS is designed to search for symmetrical U-Net-like architectures, thereby reducing the search space and eliminating the need for feasibility checks that were needed in SegQNAS. Furthermore, it enhances the search process by incorporating a two-point crossover operation in order to improve the exploitation during evolutionary process, alongside the addition of self-attention, MobileNet, and EfficientNet functions to the search space that enables the discovery of efficient, customized networks. To address inaccuracies in multi-class scenarios, the SegQNAS implementation of Dice-Sorensen Coefficient (DSC) and loss functions were corrected because it provides an overestimated DSC score in those scenarios. Experiments on medical segmentation datasets from the Medical Segmentation Decathlon challenge demonstrate that on the prostate dataset experiment, SegQSNAS performed well with the best results in DSC score, parameter count and GPU days, archiving 0.7924 in average DSC score with half million parameters. It also archive of good results on the liver dataset experiment due to the best trade-off considering that it is a limited computing resource scenario. Although, in some experiments it show some limitation of the search strategy or computational resource available. In addition, in any experiment the self-attention block was not selected in the best architecture found, and this is indicative that the predefined maximum number of nodes or the complexity of the tested problems might not have been high enough for this operation to be selected during evolution process.

Orientador(es)
MARLEY MARIA BERNARDES REBUZZI VELLASCO

Coorientador(es)
KARLA TEREZA FIGUEIREDO LEITE

Banca
MARLEY MARIA BERNARDES REBUZZI VELLASCO

Banca
ANDRE VARGAS ABS DA CRUZ

Banca
KARLA TEREZA FIGUEIREDO LEITE

Banca
CELSO GONCALVES CAMILO JUNIOR

Banca
GISELE LOBO PAPPA

Catalogação
2025-07-17

Apresentação
2025-04-14

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
INGLÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71667@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71667@2

Referência DOI
https://doi.org/10.17771/PUCRio.acad.71667


Arquivos do conteúdo
NA ÍNTEGRA PDF