Veuillez utiliser cette adresse pour citer ce document : http://repository.enp.edu.dz/jspui/handle/123456789/326
Titre: Application des algorithmes génétiques au décodage acoustico-phonétique de la parole en arabe standard
Auteur(s): Aissiou, Mohamed
Guerti, Mhania, Directeur de thèse
Mots-clés: Décodage acoustico-phonétique
Parole -- Reconnaissance automatique
Analyse cepstrale
Algorithmes génétiques
Classification supervisée
Phonèmes de l’arabe standard
Date de publication: 2008
Résumé: Dans ce travail de thèse, nous avons appliqué les Algorithmes Génétiques (AGs) au Décodage Acoustico-Phonétique (DAP), qui constitue une phase importante du domaine de la Reconnaissance Automatique de la Parole (RAP), afin de classer les séquences vocales. La RAP est considérée comme étant un problème de classification de données en attribuant à un signal vocal d’entrée une et une seule classe des phonèmes possibles. Aussi, nous avons formulé la classification acoustique supervisée comme étant un problème d’optimisation de fonctions. Par conséquent, nous avons cherché à classer les quarante phonèmes de l'Arabe Standard (AS) de la parole naturelle en utilisant les AGs en raison de leurs capacités de résoudre les problèmes d’optimisation les plus compliqués. Ainsi, nous avons analysé un corpus composé d’une centaine de phrases enregistrées par un seul locuteur adulte arabophone dans un milieu ambiant et qui contient tous les types de phonèmes dans les différents contextes vocaliques possibles. Cette analyse qui est de type cepstral, nous a permis de représenter le signal vocal par les premiers coefficients cepstraux à l’échelle de Mel, plus l'énergie et leurs dérivées premières et secondes. Nous avons choisi parmi plusieurs classificateurs celui qui se base sur le critère décisionnel de la fonction de mesure de distance, en choisissant comme fonction d’évaluation ce type de critère. Dans ce cadre, plusieurs fonctions de distance ont été utilisées. Pour rendre plus performant notre modèle génétique de la classification qui est de type séquentiel, nous avons opté pour un parallélisme de son fonctionnement en utilisant le modèle parallèle de type à sous-populations isolées sans migration. Il en résulte un taux moyen global de classification des phonèmes du corpus, de 81.17 %. Dans notre travail nous avons focalisé notre étude sur les différentes étapes du DAP en insistant sur l’étape de la classification acoustique supervisée des différents phonèmes de l’AS. Aussi, nous avons présenter les AGs, le principe et les étapes de leur fonctionnement, les différents opérateurs de la phase de reproduction et le rôle de chacun d’eux. Sans oublier leur dimensionnement et leurs critères d’arrêt. Nous dégageons l’importance des choix de l’espace de représentation, du type de codage des paramètres du problème à résoudre et de la nature de la fonction objective ou d’évaluation. Les différentes techniques d’amélioration des AGs ont été abordées. Dans le quatrième chapitre nous avons expliqué comment nous avons appliqué les AGs au DAP en insistant sur le choix de la fonction d’évaluation de notre modèle génétique et celui de ses différents paramètres, la nature des individus de sa population et le choix de ses opérateurs de reproduction. Le cinquième chapitre décrit notre modèle génétique de classification acoustique qu'il soit séquentiel ou parallèle tout en expliquant le choix des paramètres de réglage, des opérateurs de reproduction et de la fonction d’évaluation pour atteindre les meilleurs taux de classification. En interprétant les résultats obtenus, il a été démontré que le choix du modèle génétique parallèle de type à gros grains ou en îlots sans migration permet d’atteindre les meilleurs scores de performance. Durant notre travail, nous nous sommes confrontés à des difficultés concernant le choix approprié des paramètres de notre modèle génétique, relatifs aux divers opérateurs (mutation, croisement, sélection et remplacement). Nous avons remarqué que le taux de rejet est contrôlé indirectement par le choix de ces paramètres. Par conséquent, il faudra se pencher sur la meilleure manière de les sélectionner, qui reste un problème ouvert.
Description: Thèse de Doctorat: Electronique: Alger, Ecole Nationale Polytechnique: 2008
URI/URL: http://repository.enp.edu.dz/xmlui/handle/123456789/326
ISSN: D000508
Collection(s) :Département Electronique

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
AISSIOU.Mohamed.pdfD0005081.08 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.