As obras disponibilizadas nesta Biblioteca Digital foram publicadas sob expressa autorização dos respectivos autores, em conformidade com a Lei 9610/98.
A consulta aos textos, permitida por seus respectivos autores, é livre, bem como a impressão de trechos ou de um exemplar completo exclusivamente para uso próprio. Não são permitidas a impressão e a reprodução de obras completas com qualquer outra finalidade que não o uso próprio de quem imprime.
A reprodução de pequenos trechos, na forma de citações em trabalhos de terceiros que não o próprio autor do texto consultado,é permitida, na medida justificada para a compreeensão da citação e mediante a informação, junto à citação, do nome do autor do texto original, bem como da fonte da pesquisa.
A violação de direitos autorais é passível de sanções civis e penais.
Coleção Digital
Título: SPEECH RECOGNITION IN NOISE ENVIRONMENT Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO Autor(es): DEBORA ANDREA DE OLIVEIRA SANTOS
Colaborador(es): ABRAHAM ALCAIM - Orientador
Número do Conteúdo: 1987
Catalogação: 02/10/2001 Idioma(s): PORTUGUESE - BRAZIL
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@2
Referência [es]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@4
Referência DOI: https://doi.org/10.17771/PUCRio.acad.1987
Resumo:
Formato DC | MARC |
Título: SPEECH RECOGNITION IN NOISE ENVIRONMENT Instituição: PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO - PUC-RIO Autor(es): DEBORA ANDREA DE OLIVEIRA SANTOS
Colaborador(es): ABRAHAM ALCAIM - Orientador
Número do Conteúdo: 1987
Catalogação: 02/10/2001 Idioma(s): PORTUGUESE - BRAZIL
Tipo: TEXT Subtipo: THESIS
Natureza: SCHOLARLY PUBLICATION
Nota: Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio.
Referência [pt]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@1
Referência [en]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@2
Referência [es]: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=1987@4
Referência DOI: https://doi.org/10.17771/PUCRio.acad.1987
Resumo:
This work presents a comparative study of three techniques
for improving the speech recognition rates in adverse
environment, namely: Cepstral Mean Normalization (CMN),
Spectral Subtraction and Maximum Likelihood Linear
Regression (MLLR). They are implemented in two ways:
separately and in pairs. The tests are carried out on a
simple system: recognition of isolated words (digits from
zero to nine, and the word half), speaker-dependent mode,
continuous hidden Markov models, and speech feature vectors
with twelve cepstral coefficients derived from linear
predictive analysis. Three types of noise are considered
(the white one, voice babble and from factory) at nine
different signal-to-noise ratios. Experimental result
demonstrate that it is worth using separately the
techniques of robust recognition. This is because for all
signal-to-noise conditions when the recognition accuracy is
not improved it is the same one obtained when no method for
increasing the robustness is applied. Analyzing
comparatively the isolated and simultaneous applications of
the techniques, it is verified that the later is not always
more attractive than the former one. This depends on the
pair of techniques. The use of noisy models is also
considered. Although it presents better results, it is not
feasible to implement in pratical situations. Among the
implemented techniques, MLLR presents closer results to the
ones obtaneid with noisy models, followed by CMN, and, at
last, by Spectral Subtraction. Although the two later ones
are beaten by the first, in terms of recognition accuracy,
their advantages are the simplicity and the generality. The
use of simultaneous techniques reveals that the pair
Spectral Subtraction and MLLR is the one with the best
performance because it is superior in comparison with the
individual use of both methods. This does not happen with
other combination of techniques.
Descrição | Arquivo |
COMPLETE |
PDF ![]() |