Título
[pt] BUSCA POR ARQUITETURA NEURAL COM INSPIRAÇÃO QUÂNTICA APLICADA A SEGMENTAÇÃO SEMÂNTICA UTILIZANDO REDES NEURAIS SIMÉTRICAS
Título
[en] QUANTUM-INSPIRED NEURAL ARCHITECTURE SEARCH APPLIED TO SEMANTIC SEGMENTATION USING SYMMETRIC NETWORKS
Autor
[pt] FABIO HENRIQUE CARDOSO
Vocabulário
[pt] ALGORITMO EVOLUCIONARIO
Vocabulário
[pt] COMPUTACAO COM INSPIRACAO QUANTICA
Vocabulário
[pt] BUSCA POR ARQUITETURA NEURAL
Vocabulário
[pt] SEGMENTACAO SEMANTICA
Vocabulário
[en] EVOLUTIONARY ALGORITHM
Vocabulário
[en] QUANTUM-INSPIRED COMPUTING
Vocabulário
[en] NEURAL ARCHITECTURE SEARCH
Vocabulário
[en] PIXEL-WISE SEMANTIC SEGMENTATION
Resumo
[pt] A aprendizagem profunda revolucionou vários domínios, demonstrando
excelente desempenho em várias tarefas perceptivas nos campos de visão computacional, reconhecimento de fala e processamento de linguagem natural. No
entanto, o projeto de arquiteturas ideais de redes neurais profundas geralmente depende do conhecimento de especialistas e de abordagens demoradas
de tentativa e erro. O campo da busca por arquiteturas neurais (NAS - Neural
Architecture Search) surgiu como uma solução promissora, automatizando o
processo de design para descobrir arquiteturas que melhoram o desempenho
e a eficiência. Este trabalho apresenta o SegQSNAS, uma extensão do SegQNAS, projetado para Q-NAS (Quantum-inspired Neural Architecture Search)
em segmentação semântica, especialmente no domínio de imagens médicas. O
SegQSNAS foi projetado para pesquisar arquiteturas simétricas do tipo U-Net,
reduzindo assim o espaço de busca e eliminando a necessidade de verificações
de viabilidade de solução que eram necessárias no SegQNAS. Além disso, ele
aprimora o processo de busca incorporando uma operação de cruzamento de
dois pontos para melhorar a exploração durante o processo evolutivo, juntamente com a adição de funções de self-attention, MobileNet e EfficientNet ao
espaço de busca que permite a descoberta de redes eficientes e personalizadas.
Para tratar de imprecisões em cenários com vários rótulos, a implementação
do SegQNAS do Coeficiente de Dice-Sorensen (DSC) e as funções de perda
foram corrigidas porque fornecem uma avaliação de DSC superestimada nesses cenários. Os experimentos com conjuntos de dados de segmentação médica
do desafio Medical Segmentation Decathlon demonstram que, no experimento
do conjunto de dados de próstata, o SegQSNAS teve um bom desempenho
com os melhores resultados em DSC, contagem de parâmetros e dias de GPU,
alcançando 0.7924 no DSC médio com meio milhão de parâmetros. SegQSNAS também apresentou bons resultados no experimento com o conjunto de
dados do fígado devido ao melhor trade-off, considerando que se trata de um
cenário de recursos de computação limitados. No entanto, em alguns experimentos, ele mostra alguma limitação da estratégia de pesquisa ou do recurso
computacional disponível. Além disso, em todos os experimentos, a função
de self-attention não foi selecionada na melhor arquitetura encontrada, o que
indica que o número máximo predefinido de nós ou a complexidade dos problemas testados podem não ter sido suficientemente altos para que essa operação
fosse selecionada durante o processo de evolução.
Resumo
[en] Deep learning has revolutionized various domains, showing great performance for
several perceptual tasks, in the fields of computer vision, speech recognition, and
natural language processing. However, designing optimal
deep neural network (DNN) architectures often rely on expert knowledge and
time-consuming trial and error approaches. Neural Architecture Search (NAS)
has emerged as a promising solution, automating the design process to discover
architectures that enhance performance and efficiency. This work introduces SegQSNAS,
an extension of SegQNAS, designed for Q-NAS (Quantum-inspired Neural Architecture
Search) in semantic segmentation, particularly
within the medical imaging domain. SegQSNAS is designed to search for symmetrical
U-Net-like architectures, thereby reducing the search space and eliminating the need
for feasibility checks that were needed in SegQNAS. Furthermore, it enhances the search
process by incorporating a two-point crossover
operation in order to improve the exploitation during evolutionary process,
alongside the addition of self-attention, MobileNet, and EfficientNet functions
to the search space that enables the discovery of efficient, customized networks.
To address inaccuracies in multi-class scenarios, the SegQNAS implementation
of Dice-Sorensen Coefficient (DSC) and loss functions were corrected because it
provides an overestimated DSC score in those scenarios. Experiments on medical
segmentation datasets from the Medical Segmentation Decathlon challenge
demonstrate that on the prostate dataset experiment, SegQSNAS performed
well with the best results in DSC score, parameter count and GPU days, archiving
0.7924 in average DSC score with half million parameters. It also archive
of good results on the liver dataset experiment due to the best trade-off considering
that it is a limited computing resource scenario. Although, in some
experiments it show some limitation of the search strategy or computational
resource available. In addition, in any experiment the self-attention block was
not selected in the best architecture found, and this is indicative that the predefined
maximum number of nodes or the complexity of the tested problems
might not have been high enough for this operation to be selected during
evolution process.
Orientador(es)
MARLEY MARIA BERNARDES REBUZZI VELLASCO
Coorientador(es)
KARLA TEREZA FIGUEIREDO LEITE
Banca
MARLEY MARIA BERNARDES REBUZZI VELLASCO
Banca
ANDRE VARGAS ABS DA CRUZ
Banca
KARLA TEREZA FIGUEIREDO LEITE
Banca
CELSO GONCALVES CAMILO JUNIOR
Banca
GISELE LOBO PAPPA
Catalogação
2025-07-17
Apresentação
2025-04-14
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
INGLÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71667@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71667@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.71667
Arquivos do conteúdo
NA ÍNTEGRA PDF