Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle

Ait-Daoud, Siham

dc.contributor.author	Ait-Daoud, Siham
dc.contributor.other	Hamami, Latifa, Directeur de thèse
dc.date.accessioned	2020-12-23T10:27:40Z
dc.date.available	2020-12-23T10:27:40Z
dc.date.issued	1997
dc.identifier.other	M000797
dc.identifier.uri	http://repository.enp.edu.dz/xmlui/handle/123456789/2300
dc.description	Mémoire de Magister : Electronique : Alger, Ecole Nationale Polytechnique : 1997	fr_FR
dc.description.abstract	Plusieurs méthodes (stastiques et structurelles) parmi les usuelles en reconnaissance de caractères ont été utilisées au laboratoire de recherches de l'ENP. Ces méthodes présentaient souvent un bon taux de reconnaissance mais les prétraitement utilisés (squelettisation et détection des contours) sont lents et par conséquent donnent une vitesse de reconnaissance non satisfaisante. Ces prétraitement ont été testés au début de notre étude. Ils présentent très fréquemment des déformations de la forme et en plus ils ne permettent pas de réduire réellement l'épaisseur à un pixel. La squelletisation nécessite souvent un autre traitement supplémentaire pour pouvoir suivre correctement le tracé du caractère. Généralement les travaux effectués recemment en OCR utilisent l'approximation par des polygones après amincissement. Les méthodes statistiques ne peuvent traiter qu'une seule fonte à la fois donc le logiciel se trouve limité. Pour pallier à toutes ces limitations une autre approche a été adoptée; son but est de traiter plusieurs fontes différentes et plusieurs styles et aussi d'améliorer la vitesse de reconnaissance. Cette approche consiste à déterminer les frontières du caractère ou ses quatre profils: gauche, droit, haut et bas pour l'extraction des concavités dans les quatre directions possibles (hautes, basses, gauches et droites) et la recherche des cavités pour obtenir les trous ou les boucles. D'autres caractéristiques secondaires sont nécessaires pour diminuer les ambiguïtés qui peuvent exister. Le système ainsi réalisé est basé sur deux niveaux. Le 1er niveau permet la classification de tous les caractères ayant les mêmes caractéristiques principales dans un même groupe et le second niveau est l'étape de reconnaissance et de décision. Cette façon de procéder accélère considérablement le processus de reconnaissance. Les résultats obtenus par notre système sont jugés satisfaisants puisque on atteint un pourcentage d'identification de 98,28%, la rejection est de 0% tandis que le taux de confusion est de 1.7%. Les caractères confus sont Y et V pour le latin et dad position début avec le fa isolé. Le temps de reconnaissance dépend de la complexité de la classe adressée et de la manière d'organiser le dictionnaire. Le temps moyen obtenu avec notre méthode est très satisfaisant et il ne dépasse pas les 8 centièmes de seconde sur un micro-ordinateur de type 486 DX 4. Ce système peut être améliorer en introduisant d'autres fontes pour s'approcher d'un système omnifonte.	fr_FR
dc.language.iso	fr	fr_FR
dc.subject	Reconnaissance optique	fr_FR
dc.subject	Reconnaissance multifonte	fr_FR
dc.subject	Caractères arabes imprimés	fr_FR
dc.subject	Reconnaissance des caractères	fr_FR
dc.subject	Méthode structurelle	fr_FR
dc.title	Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle	fr_FR
dc.type	Thesis	fr_FR