FR2570530A1 - Procede et dispositif de lecture optique de caracteres - Google Patents

Procede et dispositif de lecture optique de caracteres Download PDF

Info

Publication number
FR2570530A1
FR2570530A1 FR8414217A FR8414217A FR2570530A1 FR 2570530 A1 FR2570530 A1 FR 2570530A1 FR 8414217 A FR8414217 A FR 8414217A FR 8414217 A FR8414217 A FR 8414217A FR 2570530 A1 FR2570530 A1 FR 2570530A1
Authority
FR
France
Prior art keywords
digital
vertical
signals
character
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8414217A
Other languages
English (en)
Other versions
FR2570530B1 (fr
Inventor
Catherine Vincent
Raynald Leconte
Francis Mahuteau
Guy Belenfant
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Dassault Electronique SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dassault Electronique SA filed Critical Dassault Electronique SA
Priority to FR8414217A priority Critical patent/FR2570530B1/fr
Publication of FR2570530A1 publication Critical patent/FR2570530A1/fr
Application granted granted Critical
Publication of FR2570530B1 publication Critical patent/FR2570530B1/fr
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

UNE BARRETTE DE PHOTODETECTEURS ANALYSE VERTICALEMENT LES CARACTERES. LE SIGNAL VIDEO AINSI PRODUIT EST NUMERISE 10. LES SIGNAUX BINAIRES OBTENUS POUR CHAQUE PIXEL SONT REGROUPES PAR BLOCS 21, 31, POUR ETRE ENSUITE COMPARES A UN SEUIL 22, 32, 40. CHAQUE VERTICALE ANALYSEE EST ALORS REDUITE A DEUX OCTETS DISPONIBLES DANS UN REGISTRE 45. ON PEUT ENSUITE DETERMINER CHAQUE CARACTERE A PARTIR DES PAIRES D'OCTETS RELATIVES A TROIS VERTICALES CARACTERISTIQUES DE CELUI-CI.

Description

Procédé et dispositif de lecture optique de caractères.
L'invention concerne la lecture optique, c'est-à-dire automatique de caractères.
Cette lecture optique n'est actuellement concevable que pour des caractères spécialement aménagés tacet effet, que l'on appellera ci-après caractères sélectivement reconnaissables. En effet, lorsque l'homme lit des caractères, il le fait en tenant compte du contexte, tâche qu'une machine ne peut assumer aujourd'hui d'une façon simple. C'est pourquoi l'on a conçu différentes polices de caractères spéciaux pour la lecture optique, notamment ceux connus sous les désignations OCRA, OCRB, ou encore E13B.
Même avec ces caractères spéciaux, les appareils de lecture optique commercialisés à ce jour demeurent complexes, encombrants et onéreux.
La présente invention a notamment pour but de simplifier considérablement la lecture optique de caractères, de manière à la rendre possible dans des applications où elle n'était pas envisageable jusqu'à présent.
Un second but de l'invention est de permettre simplement et d'une manière fiable la reconnaissance de caractères numé riques et de symboles spéciaux qui leur sont associés.
La fiabilité réside en ce qu'on doit éviter une identification erronée de caractères.
Un autre but de l'invention est de permettre la reconnaissance de caractères même lorsque ceux-ci sont faiblement contrastés, mal imprimés, peu nets, tachés, ou encore mal disposés géométriquement.
Encore un autre but de l'invention est de permettre la reconnaissance de caractères sans devoir se préoccuper du positionnement exact du support sur lequel sont imprimés les caractères par rapport à l'organe photosensible qui les détecte.
Enfin, un dernier but de l'invention est de fournir des moyens de reconnaissance optique de caractères qui soient peu sensibles à la régularité du défilement du support des caractères devant l'organe photosensible.
L'invention offre tout d'abord un procédé de lecture automatique de caractères sélectivement reconnaissables, tels que des caractères numériques dits OCR, inscrits sur un support.
Selon un premier aspect de l'invention, ce procédé comprend les étapes suivantes a) faire défiler une image de la rangée horizontale de caractères sur une barrette verticale de photodétecteurs discrets à sorties analogiques individuelles; b) numériser les signaux analogiques issus des photodétecteurs discrets, de façon à associer un signal numérique de base à chaque verticale explorée le long de la rangée horizontale de caractères; c) déterminer à partir des signaux numériques de base la longueur de chaque caractère à reconnaÎtre, ainsi qu'un jeu d'au moins trois signaux numériques de test, respectivement associés à une verticale de droite, à une verticale de gauche et à une verticale intermédiaire du caractère à reconnaitre (que l'on appelle ci-après verticale centrale); d) décaler bit à bit chaque signal numérique de test, jusqu'à ce que son premier bit soit significatif d'un élément du caractère inscrit; et e) effectuer une séquence prédéterminée de tests sur les signaux numériques de test ainsi décalés, afin d'identifier chaque caractère d'après l'analyse de tout ou partie de ses trois verticales.
Avantageusement, l'étape b) comprend b1) la numérisation individuelle des signaux analogiques issus des photodétecteurs; b2) le regroupement des signaux numériques individuels ainsi obtenus par blocs; et b3) la comparaison de chaque bloc numérique à une valeur numérique de référence choisie.
De préférence, l'étape c) comprend cl) la sélection des signaux numériques de base associés d'une part à plusieurs verticales de droite, d'une autre part à plusieurs verticales de gauche, d'autre part enfin à une ou plusieurs verticales centrales; et c2) la construction de chacun des signaux numériques de test par une fonction OU des signaux numériques de base sélectionné pour la verticale correspondante.
Plus particulièrement, à l'étape chaque test comprend el) l'application d'un masque à chaque signal numérique de test; et e2) la comparaison du signal numérique de test ainsi masqué à une valeur numérique de référence associée au masque.
Invention offre aussi un dispositif de lecture automatique de caractères sélectivement reconnaissables, tels que des caractères numériques dits OCR, inscrits sur un support.
Selon un autre aspect de l'invention, le dispositif comporte,en combinaison - des moyens pour déplacer le support face à un système optique afin de faire défiler une image de la rangée horizontale de caractères sur une barrette verticale de photodétecteurs discrets, à sorties analogiques individuelles; - des moyens d'acquisition et de numérisation propres à numériser les signaux analogiques issus des photodétecteurs discrets de façon à associer un signal numérique de base à chaque verticale explorée le long de la rangée horizontale de caractères; - des moyens de prétraitement pour déterminer à partir de la suite des signaux numériques de base, la longueur de chaque caractère à reconnaître, ainsi que les signaux de base utiles de celui-ci, en mémorisant ces informations avec suppression des signaux numériques de base vides, correspondant à l'absence d'inscription;; - des premiers moyens de traitement pour associer à chaque caractère à reconnaître, à partir des informations mémorisées, un jeu de trois signaux numériques de test, respectivement associés à une verticale de droite, à une verticale de gauche et à une verticale intermédiaire de ce caractère ; et pour décaler bit à bit chaque signal numérique de test, jusqu'à ce que son premier bit soit significatif d'un élément de caractère inscrit; et - de seconds moyens de traitement pour effectuer une séquence prédéterminée de tests sur les signaux numériques de test ainsi décalés, afin d'identifier chaque caractère d'après l'analyse de tout ou partie de ses trois verticales.
Ce dispositif est susceptible des mêmes aménagements que le procédé défini plus haut.
Dansun mode de réalisation particulier de l'invention, les tests sont établis pour distinguer un jeu prédéterminé de configurations de verticales choisies dans l'ensemble comprenant : un trait long, un trait court, deux points éloignés, deux points rapprochés,trois points, un point surmontant un trait, un trait surmontant un point, un point seul et deux points éloignés avec ou sans inscriptions intermédiaires sur leur verticale, ces configurations définissant, en fonction d'une ou plusieurs des trois verticales où elles se trouvent, une table de reconnaissance de caractères.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée qui va suivre, et des dessins annexés, sur lesquels - la figure 1 illustre schématiquement un système optique permettant de créer une image d'une rangée de caractères sur une barrette de photodétecteurs; - la figure 2 est une autre vue illustrant la scrutation de verticales par la barrette de photodétecteurs sur la rangée de caractères; - la figure 3 est un schéma électrique partiel montrant l'interconnexion d'une barrette de photodiodes avec son module de commande; - la figure 4 est un schéma électrique partiel montrant la commande d'un moteur de défilement du support des caractères par une unité centrale de commande;; - la figure 5 est le schéma électrique de principe du dispositif d'acquisition et de numérisation des signaux issus de l'ensemble photodétecteur; - les figures 5A et 5B sont des chronogrammes en relation avec la figure 5; - la figure 6 est le schéma électrique détaillé d'un organe de la figure 5; - la figure 7 est un schéma illustrant un ensemble d'opérations de prétraitement selon l'invention; - la figure 8 est un schéma illustrant un ensemble d'opérations de traitement selon l'invention; - la figure 9 est un schéma illustrant les opérations de traitement individuelles selon l'invention; - la figure 10 illustre le principe de la reconnaissance d'un caractère particulier; et - la figure 11, ainsi que les figures 11A et 11B, illustrent un cas particulier d'application de l'invention.
Les dessins annexés comportent pour beaucoup des informations de caractères certains qu'ils peuvent seuls définir d'une manière simple. En conséquence, ils sont incorporés à la présente description non seulement pour permettre de mieux comprendre l'invention: mais aussi pour contribuer à la définition de celle-ci.
Sur la figure 1, un support S tel que du papier porte des caractères formant une rangée de hauteur utile hu, dans un espace de hauteur totale ht. Il peut s'agir par exemple de caractères inscrits au bas d'un chèque.La figure 2 fait également apparaître l'inscription de plusieurs caractères du type OCR, pour lesquels hu = 2,75 mm et ht = 5,8 mm.
Comme le montre la figure 1, une lentille L procure une image de la zone de hauteur ht dans laquelle les caractères sont focalisés sur une barrette de photodétecteurs notés
BPD. Ainsi que l'illustre la figure 2, on peut considérer que la barrette BPD scrute à chaque fois une verticale du support, lequel va donc être mis en défilement horizontal dans le sens indiqué par la référence SD sur les figures 1 et 2.
Dans un mode de réalisation particulier, la barrette
BPD est le modèle TH7806, fabriqué par la Société française
THOMSON CSF. Une telle barrette comporte une ligne de photodiodes, auxquelles sont associés individuellement deux'regis- tres à décalage fonctionnant en alternat.
Un module de commande MCB, qui peut alors être le modèle
TH7931 de THOMSON CSF; assure la lecture séquentielle des différents points - images ou pixels d'informations stockés dans chacun des registres. Ce module permet un réglage du temps d'intégration pour chaque pixel, ainsi que du temps de lecture des différents pixels.
La sortie de ensemble ainsi défini est tout d'abord un signal "VIDEO", qu'accompagnent des signaux logiques de synchronisation de lignes SL et de synchronisation de points
SP. Le signal de synchronisation de lignes marque la durée d'exploration d'une verticale par la barrette de photodiodes.
Le signal SP marque la lecture séquentielle par le registre à décalage concerné des points individuellement scrutés par les éléments photodétecteurs sur cette même verticale. Enfin, en correspondance avec les deux signaux de synchronisation, le signal vidéo délivre à chaque fois le niveau d'éclairement perçu par le photodétecteur concerné.
La figure 4 fait apparaître que le support S des caractères peut être entraîné en défilement par un moteur ME, tel qu'un moteur pas à pas, muni d'un organe de commande CM. Un détecteur photoélectrique DB détecte le bord du document, tel qu'un chèque, et une unité centrale de commande, qui peut comporter un microprocesseur 8051 de la société des Etats
Unis INTEL CORPORATION, actionne en conséquence la commande du moteur CM pour produire un défilement régulier et ajustable du support.
On réalise ainsi l'exploration, verticale par verticale, de ensemble des caractères de la rangée illustrée schématiquement sur la figure 2.
Il est maintenant fait référence à la figure 5.
Le signal vidéo est appliqué à un amplificateur-comparateur analogique référencé 10, muni d'une entrée d'ajustement de sa référence de comparaison. Un mode de réalisation particulier de cet organe sera décrit ci-après en référence à la figure 6.
La sortie de cet amplificateur-comparateur 10 est donc un signal logique de valeur 0 ou 1, qui est appliqué à une porte ET 11, dont la seconde entrée reçoit le signal de synchronisation de points SP.
L'information recueillie individuellement par chacun des photodétecteurs se trouve ainsi quantifiée par rapport à un niveau de référence ajustable, compte tenu notamment du contraste d'impression. Et la quantification s'effectue sur un bit par photodétecteur.
A partir des signaux de synchronisation SL et SP, un générateur de synchronisation 49 fournit des signaux auxiliaires, que l'homme de l'art saura aisément obtenir à partir des chronogrammes des figures 5A et 5B. Plus précisément, la figure 5A illustre qu'un signal HO est produit à l'état vrai pendant seize alternances consécutives du signal de synchronisation de points SP, puis à l'état faux pendant les seize alternances suivantes du même signal SP, et ainsi de suite alternativement. La figure 5B montre qu'à partir du signal
HO, on produit le signal HO qui est son complément. On produit également un signal H1 qui varie à une cadence double de celle des signaux HO et HO, et en synchronisme de ceux-ci.
Des portes NON/ET 23 ainsi que ET 24 d'une part, NON/ET 33 ainsi que ET 34 d'autre part, produisent des signaux notés respectivement RAZA et RAZB, dont la forme est donnée sur la figure 5B.
A ce niveau, il convient de se référer au mode de réalisation particulier de la barrette photodétectrice définie plus haut. Cette barrette possède 256 photodétecteurs utiles, auxquels s'ajoutent de part et d'autre 16 photodétecteurs de garde. Ceci fait en tout 288 = 16 x 18 photodétecteurs.
Bien entendu, seuls les 256 bits utiles seront effectivement considérés. Par contre, les signaux issus du générateur de synchronisation 49 tiennent compte de l'existence des 16 autres bits de part et d'autre.
En particulier, la figure 5B fait apparaître un signal d'arrêt, qui est produit un peu après neuf impulsions de l'horloge HO.
L'homme de l'art comprendra plus loin que ce signal d'arrêt passe à l'état vrai après 2 x 9 x 16, soit 288 bits.
On revient maintenant à la sortie numérique de la porte ET 11, dont on rappelle qu'elle fournit un bit pour chaque pixel exploré par un photodétecteur.
Pendant les seize impulsions SP pour lesquelles HO est vrai, un compteur 21, ou compteur A, va compter le nombre de fois que la porte ET 11 fournit un signal logique 1, représentant une partie de caractère (du noir par exemple) lue par le photodétecteur correspondant.
Pendant les seize impulsions SP suivantes, c'est le signal
HO qui est vrai, et c'est donc alors le compteur 31 ou compteur B qui va effectuer le même type de comptage.
Inversement, des portes 22 ou portes A seront rendues conductrices pendant le signal HO vrai afin de délivrer les quatre sorties du compteur 21 à un comparateur numérique 40.
Lorsque le signal HO est vrai, ce sont au contraire les portes 32 ou portes B qui vont délivrer les quatre sorties du compteur 31 au même comparateur numérique 40. Ces opérations de lecture des compteurs sont très rapides, car faites en parallèle. Aussitôt après, la porte NON/ET 23 ou 33, suivant le cas, va remettre à zéro le contenu du compteur 21 ou 31 qui vient d'être lu. (On sait que la remise à zéro d'un compteur s'effectue lorsqu'on applique à son entrée CL (pour
Clear) un niveau bas; les portes ET 24 et 34 réalisent donc, du fait de cette inversion logique, une fonction OU.On remarque aussi que l'entrée SL des portes 24 et 34 effectue une remise à zéro systématique des deux compteurs à la fin de l'exploration de chaque verticale.)
Le comptage ainsi réalisé en alternat, suivi d'une comparaison à un seuil réglabie par le comparateur 40, va donc condenser les seize bits relatifs à seize pixels consécutifs de l'analyse d'une verticale en une seule information numérique, dont en un seul bit. Ceci réalise une première moyenne ou intégration sur les signaux issus de la détection du caractère. L'ajustement du seuil de combaraison permet de tenir compte des différents paramètres qui interviennent, notamment du contraste des caractères.
L'homme de l'art aura observé que, lorsque les seize bits consécutifs d'un bloc ainsi condensé en un seul bit sont tous à un, le compteur concerné 21 ou 31 ne va pas donner le résultat 1111 (qui correspond à 16 en binaire), mais donner au contraire 0000, accompagné d'une impulsion de report, qui apparaît sur la sortie CYA ou CYB suivant qu'il s'agit du compteur 21 ou 31. Pour en tenir compte, des portes ET 25 et 35 reçoivent respectivement le signalCYA avec HO, et le signal
CYB avec HO. Une porte NI 42 reprend les deux sorties des portes ET 25 et 35,' pour appliquer à son tour sa sortie à l'entrée PR d'une bascule 43 dont l'entrée D est à zéro, et dont l'entrée d'horloge CK reçoit le signal H1. Le montage de ces deux dernières entrées fait que la bascule est normalement à l'état faux sur sa sortie Q.Par contre, lorsqu'une impulsion de retenue apparaît sur le compteur en fonctionnement, l'entrée PR de. la bascule 43 permet de mémoriser cette retenue, et sa sortie Q va alors l'appliquer à la porte OU 41,afin de rétablir la valeur numérique correcte 1, en correspondance du bloc de seize pixels à 1.
Après cela, on comprendra que les 256 bits utiles d'une verticale sont réduits du fait de la comparaison en 40 à 16 bits,qli vont etre séquentiellement introduits au rythme de l'horloge Hî dans un registre à décalage 44. Ce registre est remis à zéro à chaque fin de ligne par l'application du signal SL à son entrée CL.
Enfin, sur commande du signal arrêt appliqué à son entrée d'horloge CX, un registre tampon 45 recopie le contenu du registre 44.
Il apparaît finalement que chaque verticale explorée par la barrette photodétectrice est réduite à deux octets, qui sont disponibles pour le traitement.
Bien qu'il puisse en être autrement, on admet ici le traitement s'effectue dans le microprocesseur MP de la figure 4, qui est également chargé de la commande du moteur.
Ce microprocesseur assure 11 ensemble de ces fonctions sur interruptions.
Avant de décrire son fonctionnement, il est fait référence à la figure 6 pour un mode de réalisation détaillé de l'organe 10 de la figure 5. L'alimentation se fait sous une tension de + 15 volts, filtrée par une résistance série
R101,suivie en parallèle d'un condensateur C102. Le signal vidéo est appliqué à travers un condensateur C103 à un pont diviseur constitué de résistances R104 et R105. Le point milieu du diviseur est appliqué à la base d'un transistor
T106, dont le collecteur va vers l'alimentation positive par une résistance R107. L'émetteur du transistor T106 est relié à la masse par une résistance R108, suivie de l'ensemble parallèle constitué d'une résistance R109 et d'un condensateur C110 formant découplage partiel.Le collecteur du transistor T106 est encore relié à la base d'un transistor
T111, opérant en collecteur commun, et muni d'une résistance d'émetteur R112. Ces deux premiers étages réalisent une préamplification du signal vidéo, qui est alors prêt à être appliqué à un comparateur analogique AC120, sur son entrée de signal. Le signal vidéo est également appliqué à un montage à double constante de temps, commençant par une diode
K113, dont la cathode est reliée à la masse à travers un condensateur C 114. Cette cathode est également reliée à une résistance série R115, suivie d'une résistance parallèle
R116 vers la masse. Le point commun de ces deux résistances va sur l'entrée inverseuse d'un amplificateur A117. L'entrée non inverseuse de ce même amplificateur est reliée à la masse par une résistance R118, et à sa sortie par une résistance variable R119.
Le montage à double constante de temps permet de déterminer la valeur moyenne de la partie utile du signal vidéo. Et l'ajustement par la résistance variable de contre-réaction
R119 de l'amplificateur A117 permet de modifier légèrement cette valeur moyenne, afin de l'appliquer en tant que seuil au comparateur analogique AC120. Enfin, la sortie de ce comparateur Au120, qui est du type à collecteur ouvert, est tirée vers la tension positive logique de + 5 volts par une résistance de manière connue.
Cette disposition présente l'avantage de fournir un ajustement relatif du seuil, par rapport à la valeur moyenne que présente la partie utile du signal vidéo.
On retourne maintenant aux opérations ultérieures effectuées par le microprocesseur MP, qui fonctionne sur interruptions.
Une des interruptions,notée TRTOCR, consiste tout d'abord en la lecture du contenu du registre 45 de la figure 5, et en un prétraitement des deux octets ainsi lus.
L'étape 50 correspond donc à cette lecture des octets dans le registre 45. Un test 51 détermine s'ils sont tous nuls.
Si c'est vrai, il s'agit d'une ligne verticale vide et l'on met à zéro un signal valpré, qui memorisera que la valeur précédente de la verticale est nulle. Cela s'effectue en deux temps. Le test 52 détermine tout d'abord si valpré est déjà nul. Si ce n'est pas le cas, on positionne valpré à zéro à l'étape 53. Ce passage de valpré à zéro signifie qu'un caractère vient de se terminer. L'étape 54 stocke ou mémorise alors sa longueur, en termes de nombre de verticales.
Ensuite, l'étape 55 positionne un pointeur dans une zone de mémoire qui va être affectée au début du caractère suivant. Et l'étape 56 réalise un positionnement du pointeur du caractère suivant à l'intérieur même de cette zone de mémoire.
Si la sortie du test 51 indiquait que les octets d'une verticale ne sont pas entièrement nuls, une étape 57 va alors positionner valpré à 1. Une étape 58 va ensuite incrémenter lallongueur du caractère en cours d'examen,c'est-à-dire matérialiser qu'il comporte une verticale de plus, et une étape 59 va stocker les deux octets qui viennent d'être acquis sur cette verticale.
La sortie s'effectue alors par un retour d'interruption.
Au terme de ce prétraitement,on a acquis une suite de paires d'octets qui définissent les signaux numériques de base correspondant à un caractère, ainsi que la longueur de ce caractère. Le mécanisme de la figure 7 permet de réduire à une seule paire d'octets vide l'intervalle séparant deux caractères, lequel comprenait normalement plusieurs verticales lors de la saisie.
Selon l'invention, l'analyse de ce jeu de signaux numériques de base s'effectue suivant des "verticales caractéristiques".
Bien que, suivant l'étendue du jeu de caractères que lton veut examiner, il soit possible de faire autrement, l'invention prévoit préférentiellement que l'on considère,dans chaque caractère, une verticale de droite, puis une verticale de gauche, et enfin une verticale centrale, ceci dans l'ordre.
De plus,l'invention prévoit la construction d'une "verticale logique" à partir de plusieurs verticales physiques contiguës, c'est-à-dire de plusieurs paires d'octets relatives à des verticales détectées l'une après l'autre.
Ceci réalise une autre forme de moyenne dans la mise en oeuvre de l'invention.
A titre d' exemple, pour la verticale de droite, on peut prendre le OU, bit à bit, des paires d'-octets relatives aux trois ou quatre premières verticales acquises dans le caractère (de la droite vers la gauche). On peut faire de même pour la verticale de gauche, par un OU logique des trois ou quatre dernières verticales acquises dans le caractère.
Pour sa part, la verticale logique centrale est déterminée en deux temps - connaissant la longueur du caractère,on détermine une verticale centrale de celui-ci, ou deux verticales centrales de celui-ci, auquel cas on fait là encore le OU logique de ces deux verticales.
On bbtient ainsi un jeu de trois signaux numériques de test, respectivement associés à la verticale logique de droite, d la verticale logique de gauche et à la verticale centrale (logique ou physique).
Selon un autre aspect de l'invention, le système optique illustré sur la figure 1 est prévu avec une réduction, de sorte qu'un caractère dont la taille normalisée est de 2,75 mm n'excite que sept ou huit plages de seize photodiodes, sur les seize plages utiles de seize photodiodes que comporte la barrette photodétectrice.
Il est à noter que la technique antérieure considère que la reconnaissance correcte de caractères ne peut s'effectuer qu'en grandissement unité, voire même avec un agrandissement du caractère, plutôt qu'avec une réduction de celui-ci.
La disposition selon l'invention permet de s'affranchir des écarts aléatoires de position du caractère dans la zone d'écriture.
La Demanderesse a tout d'abord observé, par l'analyse des caractères des trois polices OCRA, CCRB et E13B, qu'il n'est pas nécessaire d'effectuer un cadrage global à 11 intérieur du caractère En d'autres termes, on peut s'abstenue de faire corréler spatialement les différentes verticales logiques d'un même caractère.
Ainsi, l'invention prévoit que la paire d'octets associés à chacune des verticales (logiques) de droite, de gauche et du centre, est recadrée, individuellement par décalage bit à bit effectué swr les bits de poids le plus fort, jusqu'à ce que l'on rencontre le premier bit 1, représentatif d'un morceau de caractère (du noir, par exemple). Le décalage peut s'effectuer vers le haut ou le bas,'de façon choisie a priori. Et l'on peut bien sûr le faire sur les bits de poids les plus faibles.
Compte tenu de ce qui précède, ce décalage a pour effet que les deux octets associés à chaque verticale logique vont être réduits à un seul octet (car seules sept ou huit plages de 16 bits auront été initialement excitées par un caractère).
Il en résulte une première simplification par diminution du volume d'informations à traiter pour la reconnaissance de caractères, et une seconde simplification car on peut traiter les verticales de façon indépendante, sans impliquer nécessairement les positions relatives des bits 1 que présente chacune des trois verticales associées à un caractère.
Il peut se produire dans certains cas, notamment avec les caractères "quatre" et "chaise" du code OCRA, qu'il soit nécessaire de tenir compte d'une partie du comportement horizontal des octets. Cela peut être fait en enregistrant le nombre de décalages effectués sur chacune des trois verticales associées aux caractères. On en décrira plus loin un exemple.
Un mécanisme général de reconnaissance des caractères est illustré sur la figure 8.
A l'étape 60, on sélectionne d'abord la verticale de droite du caractère à reconnaître. Sur l'octet correspondant à cette verticale de droite, on va effectuer ensuite une série de tests 61. Le premier test 61-1 peut conduire à une identification directe du caractère. Un autre test 61-2 peut conduire à une branche 1, ou étape 62-1, qui consiste à s'intéresser maintenant à la verticale de gauche du même caractère.
A son tour, cette verticale de gauche peut faire l'obit d'un test 63-11 qui permettra une identification directe du caractère, en ayant seulement considéré sa verticale de droite et sa verticale de gauche.Il en est de meme pour un autre test 63-12. Par contre, dans certains cas, un test 63-13 amènera à considérer une branche 1-1 ou étape 64 qui sélectionne la verticale centrale du caractère, pour procéder à un ou plusieurs tests 65 sur celle-ci.
Si la réponse au test 61-2 était négative, on procédera à un autre test 61-3, qui à son tour pourra conduire à examiner une branche 2 notée 62-2, suivi d'une série de tests tels que 61, comme pour la branche 1.
On remarque que ce mécanisme comporte un premier niveau, relatif à la verticale de droite, et constitué des opérations 60,ainsi que 61, un deuxième niveau, relatif à la verticale de gauche, et constitué des opérations 62 et 63, et un troisième niveau, relatif à la verticale centrale, et constitué des opérations 64 et 65.
Le cas échéant, un quatrième niveau permettra, compte tenu du nombre de décalages effectués sur l'une ou l'autre de ces verticales, de faire une discrimination supplémentaire entre caractères.
Il est maintenant fait référence à la figure 9. Celle-ci complète le mécanisme de la figure 8. il apparaît tout d'abord que l'étape 70 de sélection d'une verticale (quelle qu'elle soit) comprend le choix d'un nombre d'échantillons, un positionnement sur le premier octet de cet ensemble d'échantillons, l'appel du module "OUMOD, qui va réaliser la fonction OU sur le nombre voulu de verticales physiques adjacentes, et l'appel du module "DECAL",qui va réaliser des décalages des deux octets-logiques obtenus après la fonction OU, jusqu'à rencontrer le premier bit significatif de poids le plus fort, après quoi il ne reste plus qu'un octet. Et l'on aura enregistré le nombre de décalages effectués.
L'invention fait ensuite usage d'un jeu de configurations caractéristiques, que l'on note PAT suivi d'un chiffre. Sur la figure 9, ce chiffre est représenté comme un indice qui peut prendre des valeurs I, J, etc.
Lorsqu'on est à un niveau donné du mécanisme de la figure 8, l'étape 81 réalise un appel de la sélection de la verticale voulue (droite, gauche ou centre), l'opération de sélection de la verticale étant celle illustrée en 70. On appelle ensuite une première configuration PAT "I" à l'étape 82. Un test 83 détermine si l'octet obtenu après l'opération de sélection de la verticale en 81 correspond à la configuration définie par PAT "I" en 82. Si oui, on passe au niveau n+1, qui consiste soit en l'identification directe du caractère, soit en l'appel d'une nouvelle sélection.
Ce processus peut être répété en 84 avec l'appel d'une nouvelle configuration PAT "J, suivi d'un autre test 85 semblable au test 83, et ainsi de suite.
Hormis le premier niveau, qui concerne la verticale de droite, les autres peuvent comporter plusieurs entrées, et c'est pourquoi la figure 9 fait apparaître une branche 2 qui correspond à l'étape 62-2 de la figure 8.
La figure 10 montre sur un exemple comment l'on peut identufier le caractère 2 de la police OCRA.
La verticale de gauche de ce caractère comporte un point en partie haute, et un trait court en partie basse.
La Demanderesse a examiné les différentes configurations d'un octet (seul représentatif de la verticale après décalage) qui peuvent correspondre à ce caractère 2. Ce faisant, elle a observé que le point supérieur de la verticale de gauche pouvait être représenté par un ou deux bits, comme le montre la partie supérieure de la figure 10.
L'invention prévoit alors d'appliquer tout d'abord à l'octet un masque, qui est ici 10111111. Le second bit à zéro de ce masque va avoir pour effet qu'on ne tiendra pas compte du second bit de l'octet de la verticale de gauche, à partir des poids supérieurs (les poids supérieurs sont supposés ici être ceux du haut de la verticale). L'application de ce masque consiste à faire un ET logique de l'octet lui-même avec le masque. Après cette opération logique, le second bit le plus significatif est nécessairement à zéro. Après cette opération 90, on fait un test 91 qui va comparer le résultat de la fonction ET à une "condition de référencé",laquelle est ici 10001111.S'il y a égalité, le bit de transition est validé, c'est-à-dire qu'on reconnaît un caractère 2, ou bien qu'on procède à d'autres opérations nécessaires pour la reconnaissance de ce caractère 2. Si ive résultat de la comparaison 91 est négatif, on considère qu'il ne peut s'agir du caractère 2, et on passe à d'autres opérations analogues.
Ainsi, en comparant les figures 9 et 10, il apparaît qu'une opération d'appel d'une configuration PAT "I" ou "J" réside en l'appel d'un octet de masque et d'un octet de condition, tandis que le test suivant consiste d'abord en une fonction
ET de l'octet courant avec le masque, puis en une comparaison du résultat de cette fonction ET à la condition.
On décrira maintenant un exemple de mise en oeuvre de l1in- vention, à partir des caractères numériques OCRA.
La figure il se présente comme une table définissant neuf configurations différentes PAT1 à PAT9, avec en regard leurs correspondances physiques, qui sont respectivement trait long, deux points éloignés, trait court, deux points rappro chés, trois points, point surmontant un trait, trait surmontant un point, un point seul, et "centre du huit en caractères OCRA".
Pour chacune de ces configurations, il est indiqué en regard les caractères (représentés dans leur forme OCRA) qui possèdent ladite configuration, à gauche, au centre, ou à droite.
On notera la présence de trois caractères spéciaux, qui sont dénommés "chaise" (deuxième caractère de PAT8 au centre), "crochet" (seul caractère de PAT1 au centre), et "fourchette" (premier caractère de PAT3 au centre)
La figure 11 A se comporte de deux parties superposées. La partie inférieure est à considérer comme étant à droite de la partie supérieure.
Cette figure 41A illustre la séquence des opérations d'un mécanisme selon les figures 8 et 9, tel qu'il peut être appliqué compte tenu de la table de la figure 11.
L'exploration de ce mécanisme s'effectue d'abord de haut en bas, puis de gauche à droite.
En comparant les figures 11 et pila, l'homme de l'art comprendra que, par exemple, le crochet est le seul caractère qui corresponde à la configuration PAT3 à droite et à gauche, ainsi qu'à la configuration PAT1 au centre.
Le reste des tests se comprend à L'examen des figures 11 et 14A, compte tenu de la règle d'exploration précitée.
On note aussi que la discrimination entre "quatre" et chaise (séquence PAT1 - PAT3 - PAT8) se poursuit par l'examen du nombre de décalages effectués sur la verticale de gauche, ou, en variante, en reprenant les signaux numériques de test non décalés relatifs aux deux verticales extrêmes (gauche et droite), en leur faisant subir conjointement le décalage jusqu a rencontrer du noir sur l'un deux au moins. Si le bit suivant est 1 pour les 2 verticales, c'est un "quatre", dans le cas contraire c'est une "chaise".
Par ailleurs, la police numérique OCRA comporte un trait séparateur vertical qui est aisément identifié d'après sa largeur.
Bien que l'homme de l'art puisse en concevoir d'autres équivalents la figure 11B vient donner un mode de réalisation de la définition des configurations PAT1 à PAT9. Pour chaque configuration, il est donné à chaque fois un ou plusieurs masques, et la ou les conditions de référence correspondant à chaque masque. Le masque est utilisé à chaque fois pour une fonction ET telle que définie à l'étape 90 de la figure 10, tandis que la ou les conditions de référence associées sont utilisées pour une ou plusieurs comparaisons telles que celles faites à l'étape 91, après application du masque.
La figure 11b montre que masque et référence sont constitués à chaque fois d'un octet, c'est-à-dire de deux groupes de quatre bits séparés par une virgule. En regard de chaque octet, il est indiqué la représentation conventionnelle de ces deux blocs de quatre bits, en hexadécimal. L'homme de l'art sait qu'en hexadécimal, les blocs de quatre bits dont la valeur numérique va de O à 9 sont représentés par les chiffres habituels de la base 10, tandis que les blocs des quatre bits dont la valeur va de 10 à 15 sont représentés respectivement par les lettres A à F.
La Demanderesse a conduit des expériences portant sur 3000 passages de caractères du type OCRA
Pour ces expériences, les réglages étaient les suivants - défilement moteur : 200 mm/s - temps d'intégration de la barrette (module rIcB) 0,5 ms - temps de lecture 0,141 ms (lecture de 288 points à 2 Mhz) - comparateur numérique 40 réglé à 9 (sur 16).
Il n'a été observé aucune substitution de caractères, c'està-dire aucune identification erronée d'un caractère. Le taux d'erreur, c 'est-à-dire de refus d'identification d'un caractère réel était d'environ 50/00 (cinq pour mille).
Il se confirme donc que le mode de réalisation qui vient d'être décrit est particulièrement avantageux, et qu'il répond bien aux buts visés d'identification simple et sûre d'un jeu de caractères numériques à lecture optique et de ses caractères auxiliaires.
Ceci s'étend bien entendu aux autres caractères de même nature, à savoir en particulier les caractères OCRB et E13B.
Bien entendu, l'invention n'est pas limitée au mode de réalisation décrit, mais s'étend à toute variante incluse dans le cadre des revendications ci-après.

Claims (12)

Revendications.
1. Procédé de lecture automatique de caractères sélectivement reconnaissables, tels que des caractères numériques dits
OCR, inscrits sur un support, caractérisé par les étapes suivantes a) faire défiler (ME, S, L) une image de la rangée horizontale de caractères sur une barrette verticale de photodétecteurs discrets (BPD), à sorties analogiques individuelles (MCB); b) numériser (10-45) les signaux analogiques issus des photodétecteurs discrets, de façon à associer un signal numérique de base à chaque verticale explorée le long de la rangée horizontale de caractères; c) déterminer (50-59) à partir des signaux numériques de base la longueur de chaque caractère à reconnaître, ainsi qu'un jeu d'au moins trois signaux numériques de test, respectivement associés à une verticale de droite, à une verticale de gauche et à une verticale intermédiaire du caractère à reconnaître; d) décaler (50) bit à bit chaque signal numérique de test, jusqu'à ce que son premier bit soit significatif d'un élément du caractère inscrit; et e) effectuer une séquence prédéterminée (60-65) de tests (81-85) sur les signaux numériques de test ainsi décalés, afin d'identifier chaque caractère d'après analyse de tout ou partie de ses trois verticales.
2 . Procédé selon la revendication 1, caractérisé n ce que l'étape b) comprend bl) la numérisation individuelle (10) des signaux analogiques issus des photodétecteurs; b2) le regroupement (21-31) des signaux numuériques individuels ainsi obtenus par blocs; et b3) la comparaison (40) de chaque bloc numérique à une valeur numérique de référence choisie.
3. Procédé selon l'une des revendications 1 et 2, caractérisé en ce que l'étape c) comprend (70) c1) la sélection des signaux numériques de base associés d'une part à plusieurs verticales de droite, d'une autre part à plusieurs verticales de gauche, d'autre part enfin à une ou plusieurs verticales centrales; et c2) la construction de chacun des signaux numériques de test par une fonction OU des signaux numériques de base sélectionnés pour la verticale correspondante.
4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce queà l'étape e), chaque test comprend el) l'application d'un masque (9p) à chaque signal numérique de test; et e2) la comparaison (91) du signal numérique de test ainsi masqué à une valeur numérique de référence associée au masque.
5. Procédé selon l'une des revendications 1 à 4,caractérisé en ce que les tests sont établis pour distinguer un jeu prédéterminé de configurations de verticale choisies dans l'ensemble comprenant : un trait long, un trait court, deux points éloignés,-deux points rapprochés, trois points, un point surmontant un trait, un trait surmontant un point, un point seul, et deux points éloignés avec ou sans inscriptions intermédiaires sur leur verticale.
6. Dispositif de lecture automatique de caractères sélective ment reconnaissables, tels que des caractères numériques dits OCR, inscrits sur un support, caractérisé en ce qu'il comporte, en combinaison - des moyens (ME) pour déplacer le support (S) face à un système optique (L) afin de faire défiler une image de la rangée horizontale de caractères sur une barrette verticale de photodétecteurs discrets, à sorties analogiques individuelles (BPD, MCB); - des moyens d'acquisition et de numérisation (1 -45) propres à numériser les signaux analogiques issus des photodétecteurs discrets de façon à associer un signal numérique de base à chaque verticale explorée le long de la rangée horizontale de caractères;; - des moyens de prétraitement (50-59) pour déterminer, à partir de la suite des signaux numériques de base, la longueur de chaque caractère à reconnaître, ainsi que les signaux de base utiles de celui-ci, en mémorisant ces informations avec suppression des signaux numériques de base vides, correspondant à l'absence d'inscription; - de premiers moyens de traitement (70) pour associer à chaque caractère à reconnaître, à partir des informations mémorisées, un jeu de trois signaux numériques de test, respectivement associés à une verticale de droite, à une verticale de gauche et à une verticale intermédiaire de ce caractère; et pour décaler bit à bit chaque signal numériqué de test, jusqu'à ce que son premier bit soit significatif d'un élément du caractère inscrit; et - de seconds moyens de traitement (60-65; 81-85) pour effectuer une séquence prédéterminée de tests sur les signaux numériques de test ainsi décalés, afin d'identifier chaque caractère d'après l'analyse de tout ou partie de ses trois verticales.
7. Dispositif selon la revendication 6, caractérisé en ce que les moyens d'acquisition comprennent - des moyens (10) pour numériser individuellement les signaux analogiques issus des photodétecteurs; - des moyens (21,31) pour regrouper les signaux numériques individuels ainsi obtenus par blocs; et - des moyens (40) pour comparer chaque bloc numérique à une valeur numérique de référence choisie.
8. Dispositif selon la revendication 7, caractérisé en ce que la barrette (BPD) possède 256 points photodétecteurs utiles, numérisés chacun en un bit, et en ce que les blocs mesurent 4 bits, représentant par comptage 16 photodétecteurs, chaque signal numérique de base étant ainsi constitué de 16 bits, soit deux octets.
9. Dispositif selon l'une des revendications 6 à 8, caractérisé en ce que la numérisation (10) des signaux analogiques est effectuée par rapport a une fonction ajustable (R119) du niveau moyen de la partie utile de ces signaux analogiques.
10. Dispositif selon l'une des revendications 6 à 9, caractérisé en ce que les premiers moyens de traitement (70) réalisent - la sélection des signaux numériques de base associés d'une part à plusieurs verticales de droite, d'une autre part à plusieurs verticales de gauche, d'autre part enfin à une ou plusieurs verticales centrales; et -lIa construction de chacun des signaux numériques de test par une fonction OU des signaux numériques de base sélectionnés pour la verticale correspondante.
11. Dispositif selon l'une des revendications 6à 10, caractérisé en ce que les seconds moyens de traitement réalisent chaque test par - l'application d'un masque (90) à chaque signai numérique
de test; et - la comparaison (91) du signal numérique de test ainsi masqué à une valeur numérique de référence associée au masque.
12. Dispositif selon l'une des revendications 6 à 11, caractérisé en ce que les tests sont établis pour dstin- guer un jeu prédéterminé de configurations de verticale, choisies dans l'ensemble comprenant : un trait long, un trait court, deux points éloignés, deux points rapprochés, trois points, un point surmontant un trait, un trait surmontant un point, un point seul et deux points éloignés avec ou sans inscriptions intermédiaires sur leur verticale, ces configurations définissant, en fonction d'une ou plusieurs des trois verticales où elles se trouvent, une table de reconnaissance de caractères.
FR8414217A 1984-09-17 1984-09-17 Procede et dispositif de lecture optique de caracteres Expired FR2570530B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR8414217A FR2570530B1 (fr) 1984-09-17 1984-09-17 Procede et dispositif de lecture optique de caracteres

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR8414217A FR2570530B1 (fr) 1984-09-17 1984-09-17 Procede et dispositif de lecture optique de caracteres

Publications (2)

Publication Number Publication Date
FR2570530A1 true FR2570530A1 (fr) 1986-03-21
FR2570530B1 FR2570530B1 (fr) 1988-06-10

Family

ID=9307777

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8414217A Expired FR2570530B1 (fr) 1984-09-17 1984-09-17 Procede et dispositif de lecture optique de caracteres

Country Status (1)

Country Link
FR (1) FR2570530B1 (fr)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3245037A (en) * 1961-02-17 1966-04-05 Int Standard Electric Corp Character-recognition apparatus utilizing columnar variations from a reference line
FR1466654A (fr) * 1965-02-12 1967-01-20 Ibm Système d'identification de caractères
FR2121278A5 (fr) * 1971-01-07 1972-08-18 Bendix Corp
GB1472927A (en) * 1974-05-01 1977-05-11 Sharp K Character recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3245037A (en) * 1961-02-17 1966-04-05 Int Standard Electric Corp Character-recognition apparatus utilizing columnar variations from a reference line
FR1466654A (fr) * 1965-02-12 1967-01-20 Ibm Système d'identification de caractères
FR2121278A5 (fr) * 1971-01-07 1972-08-18 Bendix Corp
GB1472927A (en) * 1974-05-01 1977-05-11 Sharp K Character recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PROCEEDINGS OF THE INTERNATIONAL FEDERATION OF INFORMATION PROCESSING CONFERENCE, 24-29 mai 1965, New York, pages 358/361, Washington, US; T.SAKAI et al.: "An asynchronous characterrecognition system and device" *

Also Published As

Publication number Publication date
FR2570530B1 (fr) 1988-06-10

Similar Documents

Publication Publication Date Title
EP0477351B1 (fr) Procede et dispositif de modification de zone d'images successives
CA2957774C (fr) Procede de securisation et de verification d'un document
EP1817715A2 (fr) Procede d'identification d'un individu a partir de fragments d'image
CN109803096B (zh) 一种基于脉冲信号的显示方法和系统
WO2004077200A2 (fr) Procede d’identification de personnes et systeme pour la mise en oeuvre du procede
EP0289427A1 (fr) Procédé et dispositif d'exploitation du signal d'écran d'un écran tactile
FR2482749A1 (fr) Procede et appareillage de reconnaissance optique de caracteres
CN107749918A (zh) 提示用户擦拭镜头的方法、移动终端及存储介质
EP0243253B1 (fr) Procédé de reconnaissance automatique d'objets susceptibles de se chevaucher
EP3171990B1 (fr) Procédé pour trier des objets postaux dans un casier de tri avec un dénombrement automatique des objets triés
FR3033914A1 (fr) Procede de traitement d'un signal asynchrone
FR3066294B1 (fr) Dispositif de capture d'empreintes
CN113379713B (zh) 证件图像的检测方法及其装置
EP1622065B1 (fr) Procédé pour la détection de filantes
FR2565441A1 (fr) Appareil de compression de donnees d'image.
FR2570530A1 (fr) Procede et dispositif de lecture optique de caracteres
WO2019166720A1 (fr) Détection dynamique de lumière parasite dans une image numérique
FR2525003A1 (fr) Procede de lecture d'un texte imprime par une tete aiguille et tete de lecture pour la mise en oeuvre du procede
FR3088160A1 (fr) Capteur d'image pour la reconnaissance optique de code(s)
WO2013190202A1 (fr) Regroupement de donnees attachees a des images
EP3933626A1 (fr) Evaluation du biais d'une fonction d'identification biométrique
WO2020144225A1 (fr) Procédé de traitement d'images numériques
EP3310039B1 (fr) Dispositif électronique d'analyse d'une scène
FR2543457A1 (fr) Procede et dispositif pour le triage d'objets en fonction de leur aspect externe, en particulier pour un tirage colorimetrique d'objets
FR2656709A1 (fr) Systeme de reconnaissance d'un caractere grave sur un support.

Legal Events

Date Code Title Description
CD Change of name or company name
ST Notification of lapse
TP Transmission of property