Traitement du signal pour la reconnaissance de la parole robuste dans des environnements bruités et réverbérants

Kenko Ota

Traitement du signal pour la reconnaissance de la parole robuste dans des environnements bruités et réverbérants

2008

Kenko Ota

Les technologies de la reconnaissance de la parole ont des performances acceptables si l’on utilise un micro dans des environnements calmes. Si des micros se situent a une position distante d’un locuteur, il faut developper des techniques de la soustraction de bruits et de reverberation. Une technique pour reduire des sons emis par les appareils environnants est proposee. Bien que l’annulation adaptative du bruit (ANC) soit une solution possible, l’exces de soustraction peut causer la distorsion de la parole estimee. Le systeme propose utilise la structure harmonique des segments vocaliques que les ANCs conventionnels n’a pas prise en compte directement. La methode de dereverberation conventionnelle provoque l’exces de soustraction car on suppose que la caracteristique de frequence, est plate. Il faut donc estimer le temps reel de reverberation pour resoudre ce probleme. On propose une methode de dereverberation aveugle utilisant un micro avec des fonctions d’autocorrelation sur la sequence de composants a chaque frequence. Une technique pour echapper au probleme de permutation qui se provoque lorsqu’on utilise l’analyse en composantes independantes (ICA) dans le domaine de frequence, est egalement proposee : le Multi-bin ICA. Enfin, ce travail propose une technique pour estimer les spectres de bruit et de parole sans developper de modele de gaussienne a melange (GMM). Le spectre de la parole est modelise a l’aide melange de processus de Dirichlet (Dirichlet Process Mixture : ‘DPM’) au lieu du GMM

Keywords:

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations