Título
[pt] ATRIBUTOS E DOMÍNIOS DE INTERPOLAÇÃO EFICIENTES EM RECONHECIMENTO DE VOZ DISTRIBUÍDO
Título
[en] EFFICIENT FEATURES AND INTERPOLATION DOMAINS IN DISTRIBUTED SPEECH RECOGNITION
Autor
[pt] VLADIMIR FABREGAS SURIGUE DE ALENCAR
Vocabulário
[pt] REDES MOVEIS CELULARES
Vocabulário
[pt] LSF
Vocabulário
[pt] HMM
Vocabulário
[pt] RECONHECIMENTO DE VOZ DISTRIBUIDO
Vocabulário
[pt] REDES IP
Vocabulário
[en] CELLULAR MOBILE NETWORKS
Vocabulário
[en] LSF
Vocabulário
[en] HMM
Vocabulário
[en] DISTRIBUTED SPEECH RECOGNITION
Vocabulário
[en] IP NETWORK
Resumo
[pt] Com o crescimento gigantesco da Internet e dos sistemas
de comunicações
móveis celulares, as aplicações de processamento de voz
nessas redes têm
despertado grande interesse . Um problema particularmente
importante nessa área
consiste no reconhecimento de voz em um sistema servidor,
baseado nos
parâmetros acústicos calculados e quantizados no terminal
do usuário
(Reconhecimento de Voz Distribuído). Como em geral estes
parâmetros não são
os mais indicados como atributos de voz para o sistema de
reconhecimento
remoto, é importante que sejam examinadas diferentes
transformações dos
parâmetros, que permitam um melhor desempenho do
reconhecedor. Esta
dissertação trata da extração de atributos de
reconhecimento eficientes a partir dos
parâmetros dos codificadores utilizados em redes móveis
celulares e em redes IP.
Além disso, como a taxa dos parâmetros fornecidos ao
reconhecedor de voz é
normalmente superior àquela com a qual os codificadores
geram os parâmetros, é
importante analisar o efeito da interpolação dos
parâmetros sobre o desempenho
do sistema de reconhecimento, bem como o melhor domínio
sobre o qual esta
interpolação deve ser realizada. Estes são outros tópicos
apresentados nesta
dissertação.
Resumo
[en] The huge growth of the Internet and cellular mobile
communication systems
has stimulated a great interest in the applications of
speech processing in these
networks. An important problem in this field consists in
speech recognition in a
server system, based on the acoustic parameters calculated
and quantized in the
user terminal (Distributed Speech Recognition). Since these
parameters are not the
most indicated ones for the remote recognition system, it
is important to examine
different transformations of these parameters, in order to
allow a better
performance of the recogniser. This dissertation is
concerned with the extraction
of efficient recognition features from the coder parameters
used in cellular mobile
networks and IP networks. In addition, as the rate that
parameters supplied for the
speech recogniser must be usually higher than that
generated by the codec, it is
important to analyze the effect of the interpolation of the
parameters over the
performance of the recognition system. Moreover, it is
paramount to establish the
best domain over which this interpolation must be carried
out. These are other
topics presented in this dissertation.
Orientador(es)
ABRAHAM ALCAIM
Banca
ABRAHAM ALCAIM
Banca
FERNANDO GIL VIANNA RESENDE JUNIOR
Banca
RODRIGO CAIADO DE LAMARE
Catalogação
2005-04-01
Apresentação
2005-03-18
Tipo
[pt] TEXTO
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=6201@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=6201@2
Referência DOI
https://doi.org/10.17771/PUCRio.acad.6201
Arquivos do conteúdo
CAPA, AGRADECIMENTOS, RESUMO, ABSTRACT, SUMÁRIO E LISTAS PDF CAPÍTULO 1 PDF CAPÍTULO 2 PDF CAPÍTULO 3 PDF CAPÍTULO 4 PDF CAPÍTULO 5 PDF CAPÍTULO 6 PDF CAPÍTULO 7 PDF REFERÊNCIAS BIBLIOGRÁFICAS E ANEXOS PDF