Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle

Show simple item record

dc.contributor.author Ait-Daoud, Siham
dc.contributor.other Hamami, Latifa, Directeur de thèse
dc.date.accessioned 2020-12-23T10:27:40Z
dc.date.available 2020-12-23T10:27:40Z
dc.date.issued 1997
dc.identifier.other M000797
dc.identifier.uri http://repository.enp.edu.dz/xmlui/handle/123456789/2300
dc.description Mémoire de Magister : Electronique : Alger, Ecole Nationale Polytechnique : 1997 fr_FR
dc.description.abstract Plusieurs méthodes (stastiques et structurelles) parmi les usuelles en reconnaissance de caractères ont été utilisées au laboratoire de recherches de l'ENP. Ces méthodes présentaient souvent un bon taux de reconnaissance mais les prétraitement utilisés (squelettisation et détection des contours) sont lents et par conséquent donnent une vitesse de reconnaissance non satisfaisante. Ces prétraitement ont été testés au début de notre étude. Ils présentent très fréquemment des déformations de la forme et en plus ils ne permettent pas de réduire réellement l'épaisseur à un pixel. La squelletisation nécessite souvent un autre traitement supplémentaire pour pouvoir suivre correctement le tracé du caractère. Généralement les travaux effectués recemment en OCR utilisent l'approximation par des polygones après amincissement. Les méthodes statistiques ne peuvent traiter qu'une seule fonte à la fois donc le logiciel se trouve limité. Pour pallier à toutes ces limitations une autre approche a été adoptée; son but est de traiter plusieurs fontes différentes et plusieurs styles et aussi d'améliorer la vitesse de reconnaissance. Cette approche consiste à déterminer les frontières du caractère ou ses quatre profils: gauche, droit, haut et bas pour l'extraction des concavités dans les quatre directions possibles (hautes, basses, gauches et droites) et la recherche des cavités pour obtenir les trous ou les boucles. D'autres caractéristiques secondaires sont nécessaires pour diminuer les ambiguïtés qui peuvent exister. Le système ainsi réalisé est basé sur deux niveaux. Le 1er niveau permet la classification de tous les caractères ayant les mêmes caractéristiques principales dans un même groupe et le second niveau est l'étape de reconnaissance et de décision. Cette façon de procéder accélère considérablement le processus de reconnaissance. Les résultats obtenus par notre système sont jugés satisfaisants puisque on atteint un pourcentage d'identification de 98,28%, la rejection est de 0% tandis que le taux de confusion est de 1.7%. Les caractères confus sont Y et V pour le latin et dad position début avec le fa isolé. Le temps de reconnaissance dépend de la complexité de la classe adressée et de la manière d'organiser le dictionnaire. Le temps moyen obtenu avec notre méthode est très satisfaisant et il ne dépasse pas les 8 centièmes de seconde sur un micro-ordinateur de type 486 DX 4. Ce système peut être améliorer en introduisant d'autres fontes pour s'approcher d'un système omnifonte. fr_FR
dc.language.iso fr fr_FR
dc.subject Reconnaissance optique fr_FR
dc.subject Reconnaissance multifonte fr_FR
dc.subject Caractères arabes imprimés fr_FR
dc.subject Reconnaissance des caractères fr_FR
dc.subject Méthode structurelle fr_FR
dc.title Reconnaissance optique et multifonte de caractères arabes imprimés par une méthode structurelle fr_FR
dc.type Thesis fr_FR


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search Repository


Advanced Search

Browse

My Account