dc.description.abstract |
Ce travail présente un algorithme amélioré, pour le rehaussement de la parole appelé Erreur quadratique moyenne Minimum (MMSE), basé sur le spectre de retard de groupe modifié (MODGD), pour la reconnaissance automatique du locuteur en vue de la criminalistique (FASR) dans des environnements bruités. Cet algorithme utilise le MODGD au lieu du spectre d’amplitude, pour calculer le spectre de puissance du signal corrompu par le bruit. Dans l’estimateur proposé, le MODGD conserve la plupart des informations sur les formants. Par conséquent, il améliore le signal vocal bruité avec une qualité élevée, même à des niveaux de Rapport Signal sur Bruit (SNR) extrêmement bas. L’évaluation de l’algorithme amélioré dans des scénarios FASR simulés a été réalisée en ajoutant différents niveaux de bruit, extraits de la base de données NOISEX-92 aux traces NIST2000 propres. Les résultats obtenus montrent que l’estimateur MMSE-MODGD proposé permet une plus grande suppression des composantes de bruit dans les régions à faible SNR que l’estimateur MMSE. De plus, il y a une réduction importante de la probabilité à proportions Egales (EPP) (les améliorations sont de 1,84 % pour le bruit de bavardage et de 1,25 % pour les bruits d’usine et blanc), combinant les techniques FASR avec l’estimateur MMSEMODGD proposé, par rapport à l’estimateur MMSE conventionnel |
fr_FR |