Veuillez utiliser cette adresse pour citer ce document : http://repository.enp.edu.dz/jspui/handle/123456789/3988
Titre: Identification du locuteur indépendante du texte
Auteur(s): Bouchamekh, Mouslem
Bousseksou, Boualem, Directeur de thèse
Mots-clés: Identification du locuteur
Paramètres Mel cepstraux (MFCC)
Paramètres LSP
Quantification Vectorielle
(QV) GMM OGMM
Date de publication: 2007
Editeur: Ecole nationale polytechnique
Collection/Numéro: Electronique;
Résumé: Ce travail s'inscrit dans le domaine de la reconnaissance automatique du locuteur, domaine riche d'applications potentielles allant de la sécurisation d'accès et les applications d’ordre juridique à l'indexation de documents audio. Afin de laisser le champ à un large éventail d'applications, nous nous intéressons à la reconnaissance du locuteur en mode indépendant du texte. Nous nous intéressons plus particulièrement à la modélisation et à la représentation des locuteurs. Il s'agit d’extraire, à partir des signaux de parole, des informations relatives à l’identité, et d'estimer avec ces dernières un modèle du locuteur suffisamment robuste pour permettre son identification. Nous avons commencé par rappeler le principe de la reconnaissance automatique du locuteur et nous avons présenté les différentes étapes du système de reconnaissance. Cette introduction a permis de présenter le contexte général de la reconnaissance du locuteur et de comprendre la terminologie de l’identification et de la vérification du locuteur. Dans le deuxième chapitre nous avons présenté la modélisation et les différentes étapes nécessaires pour l’analyse du signal vocal, nous avons cités les différents paramètres acoustiques utilisés dans la majorité des systèmes de traitement de la parole. Ce chapitre donne une aidé générale sur le choix des paramètres acoustiques convenables. Au troisième chapitre, nous nous sommes intéressés aux différentes modélisations des locuteurs, et plus particulièrement à la modélisation par mélange de gaussiennes où les locuteurs sont modélisés par une somme pondérée de gaussiennes. Dans le quatrième chapitre nous avons évalué ces différentes modélisations sur notre base de données de 60 locuteurs extraite de TIMIT. Le dernier chapitre est consacré à l’utilisation du pitch, l’idée est de tenir en compte des informations propres à la source d’excitation, laquelle constitue un élément discriminatoire entre les locuteurs. Nous avons développé une méthodologie basé sur l’estimation de la probabilité a posteriori du pitch, l’ancien système est transformé en un nouveau, l’utilité en est dans les applications au le nombre de locuteurs est relativement important.
Description: Mémoire de Magister : Électronique : Alger, École Nationale Polytechnique : 2007
URI/URL: http://repository.enp.edu.dz/xmlui/handle/123456789/3988
Collection(s) :Département Electronique

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
BOUCHAMEKH.Mouslem.pdfM0014072.89 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.