Logo PUC-Rio Logo Maxwell
TRABALHOS DE FIM DE CURSO @PUC-Rio
Consulta aos Conteúdos
Estatística
Título: ESTIMATIVA E RASTREAMENTO DE POSE 3D EM TEMPO REAL A PARTIR DE MÚLTIPLAS CÂMERAS
Autor(es): MATHEUS MELLO DE SOUZA MENDES
YURI VELASQUEZ RIVAS DA SILVA MOREIRA
Colaborador(es): WOUTER CAARLS - Orientador
Catalogação: 13/JUL/2023 Língua(s): PORTUGUÊS - BRASIL
Tipo: TEXTO Subtipo: TRABALHO DE FIM DE CURSO
Notas: [pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
[en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio.
Referência(s): [pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=63208@1
[en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=63208@2
DOI: https://doi.org/10.17771/PUCRio.acad.63208
Resumo:
Este trabalho tem como foco o desenvolvimento de um sistema de estimativa de poses 3D em tempo real para rastreamento de movimentos humanos. A estimativa de pose é vital na visão computacional e tem aplicações em entretenimento, esportes, saúde e robótica. O desafio de estimar poses 3D envolve identificar as principais articulações do corpo e suas relações espaciais, criando uma representação esquelética de figuras humanas, que é complicada por fatores como oclusões, variações do ponto de vista da câmera e interações próximas entre os indivíduos. O projeto propõe uma solução de baixo custo mesmo que isso possa resultar em uma diminuição na precisão geral do sistema, ele fornece uma alternativa aos sistemas padrão da indústria usados na captura de movimento. Utilizamos um número arbitrário de câmeras (n≥4) para minimizar erros de projeção e rastreamento causados por oclusões do alvo. A abordagem adotada neste projeto envolve uma lógica de reconstrução, como visto na fig 1-a. A linguagem de programação Python é usada para processamento de imagens, com a ajuda da biblioteca OpenCV para reconstrução de poses 3D. A câmera escolhida para o projeto é Intelbras VIP1430 B G2, e a implementação de código aberto MediaPipe do Google é usada para estimativa de pose 2D. As limitações desta abordagem e possíveis melhorias também são discutidas, fornecendo uma base sólida para futuras pesquisas e aplicações no campo.
Descrição: Arquivo:   
NA ÍNTEGRA PDF