Abstract:
Plusieurs méthodes (stastiques et structurelles) parmi les usuelles en reconnaissance de caractères ont été utilisées au laboratoire de recherches de l'ENP. Ces méthodes présentaient souvent un bon taux de reconnaissance mais les prétraitement utilisés (squelettisation et détection des contours) sont lents et par conséquent donnent une vitesse de reconnaissance non satisfaisante. Ces prétraitement ont été testés au début de notre étude. Ils présentent très fréquemment des déformations de la forme et en plus ils ne permettent pas de réduire réellement l'épaisseur à un pixel. La squelletisation nécessite souvent un autre traitement supplémentaire pour pouvoir suivre correctement le tracé du caractère. Généralement les travaux effectués recemment en OCR utilisent l'approximation par des polygones après amincissement. Les méthodes statistiques ne peuvent traiter qu'une seule fonte à la fois donc le logiciel se trouve limité. Pour pallier à toutes ces limitations une autre approche a été adoptée; son but est de traiter plusieurs fontes différentes et plusieurs styles et aussi d'améliorer la vitesse de reconnaissance. Cette approche consiste à déterminer les frontières du caractère ou ses quatre profils: gauche, droit, haut et bas pour l'extraction des concavités dans les quatre directions possibles (hautes, basses, gauches et droites) et la recherche des cavités pour obtenir les trous ou les boucles. D'autres caractéristiques secondaires sont nécessaires pour diminuer les ambiguïtés qui peuvent exister.
Le système ainsi réalisé est basé sur deux niveaux. Le 1er niveau permet la classification de tous les caractères ayant les mêmes caractéristiques principales dans un même groupe et le second niveau est l'étape de reconnaissance et de décision. Cette façon de procéder accélère considérablement le processus de reconnaissance. Les résultats obtenus par notre système sont jugés satisfaisants puisque on atteint un pourcentage d'identification de 98,28%, la rejection est de 0% tandis que le taux de confusion est de 1.7%. Les caractères confus sont Y et V pour le latin et dad position début avec le fa isolé. Le temps de reconnaissance dépend de la complexité de la classe adressée et de la manière d'organiser le dictionnaire. Le temps moyen obtenu avec notre méthode est très satisfaisant et il ne dépasse pas les 8 centièmes de seconde sur un micro-ordinateur de type 486 DX 4. Ce système peut être améliorer en introduisant d'autres fontes pour s'approcher d'un système omnifonte.