As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: RECONOCIMIENTO DE VOZ EN PRESCENCIA DE RUIDO Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO Autor(es): DEBORA ANDREA DE OLIVEIRA SANTOS
Colaborador(es): ABRAHAM ALCAIM - Orientador
Número do Conteúdo: 1987
Catalogação: 02/10/2001 Idioma(s): PORTUGUESE - BRAZIL
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@2
Referência [es]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@4
Referência DOI: https://doi.org/10.17771/PUCRio.acad.1987
Resumo:
Formato DC | MARC |
Título: RECONOCIMIENTO DE VOZ EN PRESCENCIA DE RUIDO Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO Autor(es): DEBORA ANDREA DE OLIVEIRA SANTOS
Colaborador(es): ABRAHAM ALCAIM - Orientador
Número do Conteúdo: 1987
Catalogação: 02/10/2001 Idioma(s): PORTUGUESE - BRAZIL
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@2
Referência [es]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@4
Referência DOI: https://doi.org/10.17771/PUCRio.acad.1987
Resumo:
Este trabajo presenta un estudio comparativo de tres
técnicas de mejoría de las tasas de reconocimiento de voz
en ambiente adverso, a saber: Normalización de la Media
Cepextral (CMN), Substracción Espectral y Regresión Lineal
en el Sentido de la Máxima Verosimilitud (MLLR), aplicadas
separada y conjuntamente, dos a dos. Las pruebas son
realizados usando un sistema simple: reconocimiento de
palabras aisladas (dígitos de cero al nueve, y media), de
modo dependiente del locutor, modelos ocultos de Markov de
tipo contínuo, y vectores de atributos con doce
coeficientes cepextrales derivados del análisis de
predicción lineal. Se adoptan tres tipos de ruido (gausiano
blanco, parlatorio y de fábrica) en nueve razones señal-
ruido diferentes. Los resultados experimentales demuestran
que el empleo aislado de las técnicas de reconocimiento
robusto es, en general, ventajoso, pues en las diversas
relaciones señal ruido para las cuales las pruebas son
efetuadas, cuando la tasa de reconocimiento no aumenta,
manteniendo las mismas tasas cuando no se aplica ningún
método de aumento de robustez. Analizando comparativamente
las implementaciones aisladas y simultáneas de las
técnicas, se constata que no siempre la simultánea resulta
atractiva, dependiendo de la dupla utilizada. Se presentan
además los resultados al utilizar modelos ruidosos,
observando que, aunque resultan mejores, su utilización em
la práctica resulta inviable. De las técnicas
implementadas, la que presenta resultados más próximos al
empleo de modelos ruidosos es la MLLR, seguida por la CMN,
y por último por la Substracción Espectral. Estas últimas,
aunque tienen desempeño peor que la primera, tienen como
ventaja la simplicidad y la generalidad. En lo que se
refiere a las técnicas usadas concomitantemente, la dupla
Substracción Espectral y MLLR es la de mejor performance,
pues se muestra conveniente en relación al empleo aislado
de ambos métodos, lo que no siempre ocurre con el uso de
otras combinaciones de las técnicas individuales.
Descrição | Arquivo |
EN SU TOTALIDAD |
PDF ![]() |