Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle

Ait-Daoud, Siham

Veuillez utiliser cette adresse pour citer ce document : http://repository.enp.edu.dz/jspui/handle/123456789/2300

Titre:	Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle
Auteur(s):	Ait-Daoud, Siham Hamami, Latifa, Directeur de thèse
Mots-clés:	Reconnaissance optique Reconnaissance multifonte Caractères arabes imprimés Reconnaissance des caractères Méthode structurelle
Date de publication:	1997
Résumé:	Plusieurs méthodes (stastiques et structurelles) parmi les usuelles en reconnaissance de caractères ont été utilisées au laboratoire de recherches de l'ENP. Ces méthodes présentaient souvent un bon taux de reconnaissance mais les prétraitement utilisés (squelettisation et détection des contours) sont lents et par conséquent donnent une vitesse de reconnaissance non satisfaisante. Ces prétraitement ont été testés au début de notre étude. Ils présentent très fréquemment des déformations de la forme et en plus ils ne permettent pas de réduire réellement l'épaisseur à un pixel. La squelletisation nécessite souvent un autre traitement supplémentaire pour pouvoir suivre correctement le tracé du caractère. Généralement les travaux effectués recemment en OCR utilisent l'approximation par des polygones après amincissement. Les méthodes statistiques ne peuvent traiter qu'une seule fonte à la fois donc le logiciel se trouve limité. Pour pallier à toutes ces limitations une autre approche a été adoptée; son but est de traiter plusieurs fontes différentes et plusieurs styles et aussi d'améliorer la vitesse de reconnaissance. Cette approche consiste à déterminer les frontières du caractère ou ses quatre profils: gauche, droit, haut et bas pour l'extraction des concavités dans les quatre directions possibles (hautes, basses, gauches et droites) et la recherche des cavités pour obtenir les trous ou les boucles. D'autres caractéristiques secondaires sont nécessaires pour diminuer les ambiguïtés qui peuvent exister. Le système ainsi réalisé est basé sur deux niveaux. Le 1er niveau permet la classification de tous les caractères ayant les mêmes caractéristiques principales dans un même groupe et le second niveau est l'étape de reconnaissance et de décision. Cette façon de procéder accélère considérablement le processus de reconnaissance. Les résultats obtenus par notre système sont jugés satisfaisants puisque on atteint un pourcentage d'identification de 98,28%, la rejection est de 0% tandis que le taux de confusion est de 1.7%. Les caractères confus sont Y et V pour le latin et dad position début avec le fa isolé. Le temps de reconnaissance dépend de la complexité de la classe adressée et de la manière d'organiser le dictionnaire. Le temps moyen obtenu avec notre méthode est très satisfaisant et il ne dépasse pas les 8 centièmes de seconde sur un micro-ordinateur de type 486 DX 4. Ce système peut être améliorer en introduisant d'autres fontes pour s'approcher d'un système omnifonte.
Description:	Mémoire de Magister : Electronique : Alger, Ecole Nationale Polytechnique : 1997
URI/URL:	http://repository.enp.edu.dz/xmlui/handle/123456789/2300
Collection(s) :	Département Electronique

Fichier(s) constituant ce document :

Fichier	Description	Taille	Format
AIT-DAOUD.Siham.pdf	M000797	1.7 MB	Adobe PDF	Voir/Ouvrir

Affichage détaillé

DSpace ENP

Bienvenue sur la plateforme de diffusion en ligne de la production académique de l'ENP. Une meilleure accessibilité pour toute la communauté universitaire.