Veuillez utiliser cette adresse pour citer ce document : http://repository.enp.edu.dz/jspui/handle/123456789/436
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.authorBenselama, Zoubir Abdeslem-
dc.contributor.otherGuerti, Mhania, Directeur de thèse-
dc.date.accessioned2020-12-16T12:20:33Z-
dc.date.available2020-12-16T12:20:33Z-
dc.date.issued2007-
dc.identifier.otherD003107-
dc.identifier.urihttp://repository.enp.edu.dz/xmlui/handle/123456789/436-
dc.descriptionThèse de Doctorat : Électronique : Alger, École Nationale Polytechnique : 2007fr_FR
dc.description.abstractL’étude de la pathologie du langage rentre dans un cadre pluridisciplinaire. Généralement les différents défauts de prononciation sont corrigés à l'aide d'un orthophoniste qui utilise des méthodes très simplistes, parfois lentes et lassantes pour le patient. Notre travail rentre dans un cadre d’entraînement à la bonne prononciation des personnes souffrant de défauts langagiers en vue d’élaborer un système d’aide à la décision à l'orthophoniste, en utilisant des méthodes graphiques et sonores, permettant de suivre l'évolution du patient présentant un sigmatisme en détectant précisément les phonèmes à corriger. Pour mettre en œuvre notre travail, nous avons d’abord commencé par élaborer un corpus constitué de mots en Arabe représentant la pathologie que nous voulons traiter. Dans notre cas il s’agit du sigmatisme occlusif ou constructif. Par la suite nous avons extrait les meilleures caractéristiques acoustiques qui s’adaptent à notre travail: les Coefficients Cepstraux d'échelle MEL en fréquences (MFCC). Ensuite nous avons appliqué deux classificateurs basés respectivement sur les HMM/GMM (Hidden Markov Models/ Gaussian Mixture Model) et les ANN (Artificial Neural Networks). Les résultats obtenus nous ont donné un taux intéressent de reconnaissance de 87% ainsi qu’un taux de déviation du phonème pathologique par rapport au phonème sain le plus proche. Notre système d'aide peut être aussi installé chez le patient afin de lui permettre de s’auto-corriger. La première partie de cette thèse est constituée de deux chapitres donnant un état de l’art général sur le domaine de la parole. Le premier chapitre à pour intention de présenter un état de l’art sur le traitement automatique de la parole ainsi que ses applications en insistant surtout sur la reconnaissance, les notions fondamentales sur la parole et son traitement. Nous exposons tout d’abord les grands principes du traitement automatique de la langue avant de présenter les appareils phonatoire et auditif de l’être humain. Nous présentons ensuite deux des taxonomies possibles pour les sons observables dans un signal de parole, l’une étant spécifique au Français tandis que l’autre est spécifique à l’Arabe. Nous traitons enfin les problèmes de variabilité du signal de parole et énoncerons quelques unes des méthodes de représentation graphique du signal, qu’elles soient ou non dédiées à la parole et qu’elles soient reconnues ou non comme résistantes au bruit. Le deuxième chapitre nous permet de présenter les trois grandes techniques de la reconnaissance des formes qui sont utilisées en Reconnaissance Automatique de la Parole (RAP): l’alignement temporel, les chaines de Markov et les modèles connexionnistes. La présentation de ces derniers sera plus approfondie et sera précédée d’une brève présentation des connaissances de la neurobiologie qui ont servi de fondement à l’établissement des techniques neuromimétiques. La deuxième partie de cette thèse permet de présenter les causes susceptibles de produire des pathologies du langage ainsi que les principales définitions des pathologies de la parole et ceci sera matérialisé dans le chapitre trois. La troisième partie réalisée en deux chapitres nous permettant de présenter le développement de toute la chaine de reconnaissance avec une proposition du développement de notre travail en vue de la réalisation d’un système d’aide à l’orthophoniste et au patient représentant des mots pathologiques et cela en premier, dans le chapitre 4 représentant le développement du bloc d’extraction des caractéristiques du signal vocal à savoir les techniques classiques ainsi un nouveau procédé s’articulant sur la neuro predictive coding, par la suite le développement des trois grandes techniques de classification des formes qui sont utilisées en Reconnaissance Automatique de la Parole: l’alignement temporel (Dynamic Time Warping, DTW), les Chaînes de Markov et les modèles connexionnistes. Dans le chapitre 5 nous représentons notre système d’aide qui s’articule sur les chaines de Markov ainsi que les Réseaux de Neurones en dégageant les résultats pour chaque variante. Nous terminons notre travail par des conclusions et perspectives.fr_FR
dc.language.isofrfr_FR
dc.subjectPathologie du langage Arabefr_FR
dc.subjectSigmatismes HMM/GMM ANN MFCCfr_FR
dc.titlePathologie du langage parlé arabe : cas des sigmatismes occlusifs et constrictifsfr_FR
dc.typeThesisfr_FR
Collection(s) :Département Electronique

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
BENSELAMA.Zoubir Abdeslem.pdfD0031074.26 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.