Título: | FCGAN: CONVOLUÇÕES ESPECTRAIS VIA TRANSFORMADA RÁPIDA DE FOURIER PARA CAMPO RECEPTIVOS DE ABRANGÊNCIA GLOBAL EM REDES ADVERSÁRIAS GENERATIVAS | ||||||||||||
Autor: |
PEDRO HENRIQUE BARROSO GOMES |
||||||||||||
Colaborador(es): |
MARCELO GATTASS - Orientador |
||||||||||||
Catalogação: | 23/MAI/2024 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
Tipo: | TEXTO | Subtipo: | TESE | ||||||||||
Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=66801&idi=1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/ETDs/consultas/conteudo.php?strSecao=resultado&nrSeq=66801&idi=2 |
||||||||||||
DOI: | https://doi.org/10.17771/PUCRio.acad.66801 | ||||||||||||
Resumo: | |||||||||||||
Esta dissertação propõe a Rede Generativa Adversarial por Convolução
Rápida de Fourier (FCGAN). Essa abordagem inovadora utiliza convoluções
no domínio da frequência para permitir que a rede opere com um campo receptivo de abrangência global. Devido aos seus campos receptivos pequenos,
GANs baseadas em convoluções tradicionais enfrentam dificuldades para capturar padrões estruturais e geométricos. Nosso método utiliza Convoluções
Rápidas de Fourier (FFCs), que usam Transformadas de Fourier para operar
no domínio espectral, afetando globalmente os canais da imagem. Assim, a
FCGAN é capaz de gerar imagens considerando informações de todas as localizações dos mapas de entrada. Essa nova característica da rede pode levar a um
desempenho errático e instável. Mostramos que a utilização de normalização
espectral e injeções de ruído estabilizam o treinamento adversarial. O uso de
convoluções espectrais em redes convolucionais tem sido explorado para tarefas como inpainting e super-resolução de imagens. Este trabalho foca no seu
potencial para geração de imagens. Nossos experimentos também sustentam a
afirmação que features de Fourier são substitutos de baixo custo operacional
para camadas de self-attention, permitindo que a rede aprenda informações
globais desde camadas iniciais. Apresentamos resultados qualitativos e quantitativos para demonstrar que a FCGAN proposta obtém resultados comparáveis
a abordagens estado-da-arte com profundidade e número de parâmetros semelhantes, alcançando um FID de 18,98 no CIFAR-10 e 38,71 no STL-10 - uma
redução de 4,98 e 1,40, respectivamente. Além disso, em maiores dimensões de
imagens, o uso de FFCs em vez de self-attention permite batch-sizes com até
o dobro do tamanho, e iterações até 26 por cento mais rápidas.
|
|||||||||||||
|