Veuillez utiliser cette adresse pour citer ce document :
http://repository.enp.edu.dz/jspui/handle/123456789/3988
Titre: | Identification du locuteur indépendante du texte |
Auteur(s): | Bouchamekh, Mouslem Bousseksou, Boualem, Directeur de thèse |
Mots-clés: | Identification du locuteur Paramètres Mel cepstraux (MFCC) Paramètres LSP Quantification Vectorielle (QV) GMM OGMM |
Date de publication: | 2007 |
Editeur: | Ecole nationale polytechnique |
Collection/Numéro: | Electronique; |
Résumé: | Ce travail s'inscrit dans le domaine de la reconnaissance automatique du locuteur, domaine riche d'applications potentielles allant de la sécurisation d'accès et les applications d’ordre juridique à l'indexation de documents audio. Afin de laisser le champ à un large éventail d'applications, nous nous intéressons à la reconnaissance du locuteur en mode indépendant du texte. Nous nous intéressons plus particulièrement à la modélisation et à la représentation des locuteurs. Il s'agit d’extraire, à partir des signaux de parole, des informations relatives à l’identité, et d'estimer avec ces dernières un modèle du locuteur suffisamment robuste pour permettre son identification. Nous avons commencé par rappeler le principe de la reconnaissance automatique du locuteur et nous avons présenté les différentes étapes du système de reconnaissance. Cette introduction a permis de présenter le contexte général de la reconnaissance du locuteur et de comprendre la terminologie de l’identification et de la vérification du locuteur. Dans le deuxième chapitre nous avons présenté la modélisation et les différentes étapes nécessaires pour l’analyse du signal vocal, nous avons cités les différents paramètres acoustiques utilisés dans la majorité des systèmes de traitement de la parole. Ce chapitre donne une aidé générale sur le choix des paramètres acoustiques convenables. Au troisième chapitre, nous nous sommes intéressés aux différentes modélisations des locuteurs, et plus particulièrement à la modélisation par mélange de gaussiennes où les locuteurs sont modélisés par une somme pondérée de gaussiennes. Dans le quatrième chapitre nous avons évalué ces différentes modélisations sur notre base de données de 60 locuteurs extraite de TIMIT. Le dernier chapitre est consacré à l’utilisation du pitch, l’idée est de tenir en compte des informations propres à la source d’excitation, laquelle constitue un élément discriminatoire entre les locuteurs. Nous avons développé une méthodologie basé sur l’estimation de la probabilité a posteriori du pitch, l’ancien système est transformé en un nouveau, l’utilité en est dans les applications au le nombre de locuteurs est relativement important. |
Description: | Mémoire de Magister : Électronique : Alger, École Nationale Polytechnique : 2007 |
URI/URL: | http://repository.enp.edu.dz/xmlui/handle/123456789/3988 |
Collection(s) : | Département Electronique |
Fichier(s) constituant ce document :
Fichier | Description | Taille | Format | |
---|---|---|---|---|
BOUCHAMEKH.Mouslem.pdf | M001407 | 2.89 MB | Adobe PDF | Voir/Ouvrir |
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.