Maxwell Para Simples Indexação

Título

[pt] RECONHECIMENTO FACIAL EM VÍDEO COM UMA AMOSTRA POR PESSOA UTILIZANDO STACKED SUPERVISED AUTO-ENCODER

Título

[en] SINGLE SAMPLE FACE RECOGNITION FROM VIDEO VIA SATCKED SUPERVISED AUTO-ENCODER

Autor

[pt] PEDRO JUAN SOTO VEGA

Vocabulário

[pt] RECONHECIMENTO DE FACES

Vocabulário

[pt] VIGILANCIA

Vocabulário

[pt] AUTO-ENCODER

Vocabulário

[en] FACE RECOGNITIONS

Vocabulário

[en] SURVEILLANCE

Resumo

[pt] Esta dissertação propõe e avalia estratégias baseadas nos Stacked Supervised Auto-encoders (SSAE) para representação de imagens faciais em aplicações de vídeo vigilância. O estudo foca na identificação de faces a partir de uma amostra por pessoa na galeria (single sample per person - SSPP). Variações em termos de pose, expressão facial, iluminação e oclusão são abordadas de duas formas. Primeiro, o SSAE extrai atributos das imagens de faces que são robustos contra tais variações. Segundo, exploram-se as múltiplas amostras que podem ser coletadas nas sequências de vídeo de uma pessoa (multiple samples per person probe - MSPPP). Os métodos propostos foram avaliados e comparados usando os bancos de vídeos Honda/UCSD e VIDTIMIT. Adicionalmente, foi estudada a influência de parâmetros relacionados com a arquitetura do SSAE utilizando o banco de imagens estáticas Extended Yale B. Os resultados demonstraram que as estratégias que exploram as MSPPP em combinação com o SSAE podem superar o desempenho de outros métodos SSPP, como os Padrões Binários Locais (LBP), para reconhecimento de faces em vídeos.

Resumo

[en] This work proposes and evaluates strategies based on Stacked Supervised Auto-encoders (SSAE) for face representation in video surveillance applications. The study focuses on the identification task with a single sample per person (SSPP) in the gallery. Variations in terms of pose, facial expression, illumination and occlusion are approached in two ways. First, the SSAE extracts features from face images, which are robust to such variations. Second, multiple samples per persons probes (MSPPP) that can be extracted from video sequences are exploited to improve recognition accuracy. The proposed methods were compared upon Honda/UCSD and VIDTIMIT video datasets. Additionally, the influence of the parameters related to SSAE architecture was studied using the Extended Yale B dataset. The experimental results demonstrated that strategies combining SSAE and MSPPP are able to outperform other SSPP methods, such as local binary patterns, in face recognition from video.

Orientador(es)

RAUL QUEIROZ FEITOSA

Coorientador(es)

PATRICK NIGRI HAPP

Banca

RAUL QUEIROZ FEITOSA

Banca

ALVARO DE LIMA VEIGA FILHO

Catalogação

2016-11-23

Apresentação

2016-08-30

Tipo

[pt] TEXTO

Formato

application/pdf

Idioma(s)

PORTUGUÊS

Referência [pt]

https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=28102@1

Referência [en]

https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=28102@2

Referência DOI

https://doi.org/10.17771/PUCRio.acad.28102

Arquivos do conteúdo

NA ÍNTEGRA PDF