FR2660463A1 - Dispositif de reconnaissance de caracteres, procede d'extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif. - Google Patents

Dispositif de reconnaissance de caracteres, procede d'extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif. Download PDF

Info

Publication number
FR2660463A1
FR2660463A1 FR9103617A FR9103617A FR2660463A1 FR 2660463 A1 FR2660463 A1 FR 2660463A1 FR 9103617 A FR9103617 A FR 9103617A FR 9103617 A FR9103617 A FR 9103617A FR 2660463 A1 FR2660463 A1 FR 2660463A1
Authority
FR
France
Prior art keywords
block
bar
characters
character
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9103617A
Other languages
English (en)
Other versions
FR2660463B1 (fr
Inventor
Kameyama Hirofumi
Miki Shoji
Tsubota Hiroku
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2084391A external-priority patent/JPH0769934B2/ja
Priority claimed from JP2093720A external-priority patent/JPH03291781A/ja
Priority claimed from JP2258317A external-priority patent/JP2988990B2/ja
Application filed by Glory Ltd filed Critical Glory Ltd
Publication of FR2660463A1 publication Critical patent/FR2660463A1/fr
Application granted granted Critical
Publication of FR2660463B1 publication Critical patent/FR2660463B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

Ce dispositif comprend des moyens (21) d'extraction d'un bloc de caractères d'un ensemble de caractères devant être reconnu, pour affecter des attributs à chaque bloc de caractères; des moyens d'extraction de types d'arrangements de blocs (11C) pour sélectionner, des arrangements candidats semblables à celui du bloc de caractères extrait par les moyens d'extraction; des moyens (11B) d'affectation d'un candidat d'attribut de bloc à chacun des blocs sur la base du type d'arrangement de bloc; et des moyens de vérification (11D,11E) du type d'arrangement candidat. Application notamment à la reconnaissance fiable de caractères manuscrits, tels que des chiffres sur un chèque.

Description

La présente invention concerne un système de reconnaissance de caractères
qui permet de reconnaître des caractères en utilisant des types d'arrangements de caractères pour réaliser une reconnaissance efficace et fiable des caractères manuscrits (chiffres), auxquels sont rattachés des symboles comme par exemple une barre et des
chiffres attenants en contact les uns avec les autres.
Comme procédé classique de reconnaissance de caractères, il existait par exemple un procédé de reconnaissance de caractères décrit dans la demande de brevet japonais mise à l'inspection publique sous le numéro 233585/1989, proposée par le proposant de la présente demande Ce document décrivait un procédé de reconnaissance de caractères tel qu'indiqué ciaprès Tout d'abord, on soumet des données de caractères à un prétraitement d'uniformisation et d'amincissement et à une analyse de structure du dessin linéaire, puis on soumet les données traitées à une reconnaissance structurelle globale pour discriminer et extraire une pluralité de blocs candidats de reconnaissance possédant chacun un caractère, puis on exécute la reconnaissance des caractères pour chacun des blocs Pour les blocs dans lesquels les données ne peuvent pas être reconnues en tant que caractère, on exécute la segmentation, l'analyse de la structure du dessin linéaire ou la restructuration des données jusqu'à ce que la
reconnaissance des données soit terminée.
Mais, dans le procédé classique de reconnaissance de caractères manuscrits tel qu'indiqué précédemment, il était impossible d'obtenir finalement une reconnaissance ou une résolution d'un cas tel que par exemple un chèque U S. tel que représenté sur la figure 1 annexée à la présente demande La figure 1 représente seulement une partie manuscrite du chèque Les caractères manuscrits représentés schématiquement sur la figure 1 sont identifiés progressivement, les caractères étant finalement répartis entre les blocs BL 1 à BL 8 comme représenté sur la figure 3 annexée à la présente demande Ensuite, si on soumet chaque bloc à la reconnaissance des caractères, on peut reconnaître les caractères des blocs BL 1, BL 2, BL 3, BL 5, BL 7 et BL 8, mais on ne peut pas reconnaître les caractères des blocs BL 4 et BL 6 tels qu'ils doivent être et on peut effectuer une reconnaissance erronée De façon plus spécifique, le bloc BL 4 est identifié d'une manière erronée comme étant un " 1 " du chiffre et le bloc BL 6 est également reconnu comme un " 1 "
du nombre.
En outre, même si on ajoute, dans le procédé classique mentionné précédemment, des informations pour reconnaître des symboles tels que la barre des centièmes, la virgule des centièmes et analogue, il est impossible d'établir une discrimination entre un " 1 " du nombre et la barre des centièmes dans le cas du bloc BL 4 Dans les mêmes conditions, il est impossible d'établir une discrimination entre un " 1 " du nombre et la barre des centièmes pour le cas du bloc BL 6 Par conséquent, on dépit d'une extraction correcte des blocs, si le caractère d'un bloc sélectionné comporte deux ou plusieurs types de possibilités, il s'est avéré que la reconnaissance des caractères ne pouvait pas
être exécutée.
Dans le cas du chèque U S représenté sur la figure 1, le format dans lequel les caractères manuscrits sont remplis, est constitué par le rang des dollars, le rang des centièmes, la barre des centièmes et la marque des centièmes, etc et en outre on peut les classer la plupart du temps selon plusieurs classes de types bien que ceci dépende de variations individuelles Le fait est que les types des caractères manuscrits présents sur le chèque US appartiennent d'une manière générale à l'un quelconque des types A à F comme cela est représenté sur les figures 4 A à 4 G annexées à la présente demande En outre, on notera que cette caractéristique est appliquée non seulement au chèque U.S mais également aux cas o des formats doivent être
limités dans des types définis.
De façon classique, on connaissait un procédé illustré sur les figures 5 A et 5 B annexées à la présente demande et permettant de détecter une barre contenue dans une information de caractère pour la reconnaissance de cette information Comme cela est représenté sur la figure 5 A, une barre 100 est écrite par avance selon une disposition horizontale et linéaire en tant que ligne de référence, et des caractères 101 doivent être marqués au-dessus de cette ligne Lors de la reconnaissance des caractères 101 écrit au-dessus de la barre 100, le nombre total de points dans la direction horizontale des caractères est tout d'abord compté dans la direction verticale, un histogramme du nombre des points dans la direction verticale est préparé comme cela est représenté sur la figure 5 B, puis la partie comportant un nombre extrêmement important de points est identifié comme étant la barre 100 de la ligne de référence En se référant à cette ligne, on réalise la discrimination des
caractères 101.
En outre, s'il s'avère que l'ensemble devient un bloc lorsqu'un contact est établi entre une barre et un chiffre comme représenté sur la figure 17, qui montre une partie écrite du chèque U S Il est nécessaire d'extraire les chiffres en détectant la barre à partir des blocs, dans lesquels le chiffre et la barre sont en contact, afin de
reconnaître l'information concernant le chiffre.
Conformément au procédé de séparation décrit précédemment, étant donné qu 'une barre linéaire formant ligne de référence est marquée horizontalement par avance, il est nécessairement possible de détecter le chiffre en formant
l'histogramme du nombre de points comptés horizontalement.
Cependant, une barre manuscrite n'est pas toujours horizontale et en outre la longueur de la barre varie en fonction de la taille des caractères C'est pourquoi il est impossible d'établir une discrimination entre le caractère
et la barre à partir de l'histogramme.
Même si on utilise le procédé décrit dans la demande de brevet japonais mise à l'inspection publique sous le numéro 233585/1989 et illustrée sur les figures 1 à 3 pour reconnaître le caractère pour le chèque représenté sur la figure 17 annexée à la présente demande, il est impossible de reconnaître le bloc comprenant deux caractères Cependant, il est possible de trouver des caractéristiques pour classer des formes écrites même si le bloc, dont la barre et le chiffre sont en contact, est
contenu dans l'information numérique.
Un procédé de l'art antérieur pour reconnaître des formes numériques inclut les systèmes décrits par l'auteur de la présente invention par exemple dans les demandes de brevets japonais mises à l'inspection publique sous les numéros 116781/1989 et 116782/1989 Conformément à ces systèmes, il peut se présenter le cas o une segmentation ne peut pas être réalisée pour des chiffres attenants lors de la lecture de ces chiffres attenants lors d'une analyse structurelle Le procédé de lecture collective pour la reconnaissance à partir de la préparation et de l'enregistrement de deux profils continus pour deux chiffres attenants implique un accroissement du nombre des profils, et l'enregistrement préalable d'un aussi grand nombre de profils n'est pas nécessaire pour l'obtention d'une
reconnaissance aisée dans un grand nombre de cas.
En tant que procédé de reconnaissance de chiffres attenants, l'auteur à la base de la présente invention a proposé le procédé de séparation de caractères en contact, qui est décrit dans la demande de brevet japonais mise à l'inspection publique sous le numéro 121988/1989 Cependant, l'inconvénient inévitable tient au fait que, étant donné qu'une procédure a conduit immédiatement à une reconnaissance du bloc subsistant de la reconnaissance des chiffres, une segmentation de blocs conformément à ce procédé conduit à ce que le cas échéant, le résultat d'une
reconnaissance erronée n'est pas immédiatement obtenu.
La présente invention a été nise au point compte tenu des conditions indiquées précédemment pour résoudre les problèmes rencontrés dans l'art antérieur Un but de la présente invention est de fournir un dispositif de reconnaissance de caractères, qui permet de reconnaître des caractères moyennant l'utilisation de types classés d'arrangements des caractères manuscrits possédant un format définitif à un certain degré, et détermine les caractères
d'une manière fiable sur la base du type d'agencement.
Le second but de l'invention est de fournir un procédé qui permette de détecter de façon sûre une barre contenue dans des informations de caractères et d'extraire les caractères seuls même si la barre n' est pas inscrite horizontalement ni d'une manière linéaire ou même lorsque la
barre est en soi écrite à la main.
Un troisième but de la présente invention est de fournir un procédé de reconnaissance, dans lequel on obtient une pluralité de profils de segments moyennant l'exécution d'une segmentation, pour avoir une reconnaissance sur la base de segments contenus dans un bloc, ce qui permet d'obtenir une pluralité de candidats, parmi lesquels un candidat optimum est sélectionné pour l'obtention d'une
reconnaissance precise.
Conformément à un aspect de la présente invention, pour atteindre les objectifs indiqués précédemment, il est prévu un dispositif de reconnaissance de caractères, qui reconnaît des caractères à partir d'informations concernant un ensemble de caractères devant être détecté moyennant l'utilisation d'une base de connaissances comprenant des règles requises pour effectuer cette reconnaissance, et un mécanisme logique mettant en oeuvre un raisonnement à partir de la base de connaissancesl caractérisé en ce qu'il comporte des moyens d'extraction de blocs, servant à extraire un bloc de caractères unique à partir dudit ensemble de caractères devant être reconnu, de manière à affecter des attributs à chaque bloc de caractères; des moyens d'extraction de types d'arrangement de blocs pour sélectionner, parmi une pluralité de types d'arrangements de blocs prédéterminé, des candidats du type d'arrangement extrait par lesdits moyens d'extraction de blocs; des moyens d'affectation d'attributs servant à affecter un candidat d'attribut de bloc à chacun desdits blocs, sur la base du type d'arrangement de bloc extrait par les moyens d'extraction de type d'arrangement de blocs; et des moyens de vérification pour vérifier le candidat sur la base du candidat du type d'arrangement de bloc et du candidat
d'attribut du bloc.
Selon un autre aspect de l'invention, il est prévu un procédé d'extraction de caractères comprenant les étapes de traitement consistant à détecter une barre à partir de l'information de caractère contenant une barre et séparer ladite barre de manière à extraire des caractères, caractérisé en ce qu'il inclut les étapes consistant à détecter des points d'extrémité à partir de ladite information concernant le caractère, détecter une distance linéaire entre deux points d'extrémité, obtenir un nombre de points raccordant lesdits points d'extrémité, détecter ladite barre sur la base du rapport d'une distance linéaire à une longueur effective de trajet entre deux points d'extrémité quelconques, et séparer la barre ainsi détectée
pour extraire des caractères.
En outre, selon un autre aspect de la présente invention, il est prévu un procédé d'extraction de caractères permettant de détecter une barre contenue dans une information formée de caractères pour reconnaître les caractères contenus dans cette information, caractérisé en ce qu'il inclut les étapes consistant à extraire un bloc constitué par un groupe de caractères attenants parmi ladite information de caractères, à diviser le bloc ainsi extrait en plusieurs zones Z(i,j)(i= O OJ m,j= O-'J n), compter un certain nombre de masques verticaux qui sont des composantes verticales formant les caractères, un certain nombre de masques inclinés qui sont des composantes inclinées, un certain nombre de masques horizontaux qui sont des composantes horizontales pour les différentes zones Z(jj), déterminer un facteur de certitude du bloc contenant une barre pour chaque bloc sur la base du nombre de masques existant dans chaque zone Z(j,j), des points d'extrémité du bloc possédant le facteur le plus élevé de certitude de contenir une barre, une distance linéaire entre les points d'extrémité ainsi détectés et la longueur effective du trajet ou les nombres de points entre les points d'extrémité, et détecter la barre sur la base du rapport de la distance linéaire à la longueur effective du trajet entre
les points d'extrémité pour extraire lesdits caractères.
Selon un autre aspect de la présente invention, il est prévu un procédé de reconnaissance de chiffres attenants au moyen d'un prétraitement lors duquel ces chiffres sont factorisés en éléments, comme par exemple une boucle constituée par un noeud et une branche, une ligne droite et un arc, caractérisé en ce qu'on segmente un bloc à partir d'une extrémité desdits chiffres attenants, à une distance prédéterminée pour effectuer la reconnaissance, qu'on efface ladite branche dans l'ordre du centre de gravité à partir de l'autre extrémité à l'intérieur dudit bloc et qu'on répète cet effacement jusqu'à ce que la branche située à l'intérieur dudit bloc soit nulle, qu'on identifie les chiffres à l'intérieur dudit bloc et qu'en outre on segmente de façon analogique le bloc subsistant, non segmenté, pour la reconnaissance, ce qui permet d'obtenir un résultat
portant sur plus d'un chiffre identifié.
D'autres caractéristiques et avantages de la
présente invention ressortiront de la description donnée ci-
après, prises en référence aux dessins annexés, sur lesquels: les figures 1 à 3 sont des diagrammes permettant d'expliquer l'opération de reconnaissance du chèque; les figures 4 A à 4 G représentent les sortes de types de centièmes; les figures 5 A et 5 B sont des vues permettant d'expliquer des procédés d'extraction de caractères de l'art antérieur; la figure 6 est un schéma-bloc illustrant l'arrangement de base de la présente invention; la figure 7 est un organigramme permettant d'expliquer l'exemple de fonctionnement de l'invention; la figure 8 est un diagramme expliquant la position d'un centre de gravité dans la direction horizontale; les figures 9 A et 9 B sont des diagrammes schématiques permettant d'expliquer le fonctionnement de la présente invention; les figures 10 à 12 sont des dessins permettant d'expliquer le procédé de détermination d'un attribut sur la base de la relation de position relative; la figure 13 montre une table pour le code de position relative; et les figures 14 et 15 sont des vues servant à illustrer la barre de ichi-s; les figures 16 A et 16 B sont des organigrammes montrant un exemple e mise en oeuvre de la présente invention; la figure 17 est un tableau montrant un exemple de caractères manuscrits; Les figures 18 et 19 sont des tableaux permettant d'expliquer le traitement impliquant une subdivision de la zone objet en blocs; la figure 20 est un tableau montrant la zone ainsi subdivisée; la figure 21 est une vue montrant des exemples d'un masque vertical; la figure 22 est une vue montrant des exemples de masques inclinés; la figure 23 est une vue montrant des exemples de masques horizontaux; la figure 24 est une vue explicative montrant un trajet effectif, la longueur la plus courte du trajet et la linéarité entre des points d'extrémité; la figure 25 est une vue permettant d'expliquer le traitement sur la base d'une hypothèse; les figures 26 A à 26 F sont des vues montrant des exemples de caractères manuscrits; les figures 27 et 28 A à 28 D sont des vues montrant respectivement des longueurs de trajet entre des points d'extrémité; la figure 29 est un organigramme représentant un exemple de la présente invention; la figure 30 est une vue représentant un exemple de chiffres réunis; les figures 31 A et 31 B sont des organigrammes représentant un mode de mise en oeuvre de la présente invention; les figures 32,33,34 A à 34 E,35,36 A à 36 D,39 et 40 sont des vues illustrant le fonctionnement de la présente invention; la figure 37 est un organigramme montrant une relation de segments; et la figure 38 est un schéma-bloc montrant des exemples d'un candidat de segment et d'un résultat de
chiffres reconnus, et une suite de branchements.
Sur la figure 6, qui montre un exemple d'un agencement conforme à la présente invention, une section de commande 1 constituée d'une unité CPU et analogue est adaptée pour l'ensemble de la commande de la structure Un ensemble de caractères manuscrits sur un chèque ou analogue est lu optiquement par une section d'entrée d'images 2 et est soumis -aux traitements tels qu'un amincissement et analogue, dans une section de prétraitement 3, pour être introduit dans une unité 20 contenant toutes les variables (mémoire) La mémoire 20 contenant toutes les variables est raccordée à une section d'extraction de blocs 21, une section d'extraction de caractéristiques de blocs 22 et une section de production de code de position relative 23 ainsi qu'une mémoire de travail 30 qui conserve des variables d'informations représentant par exemple les caractéristiques de blocs, les attributs de blocs, les hypothèses concernant les types de centièmes, le déroulement de l'opération de reconnaissance En outre, étant donné qu'un mécanisme logique 40 est adapté pour comparer le contenu de la mémoire de travail 30 à une partie de conditionnement d'une section de détermination d'une règle dans une base de connaissances 10 pour commander la mise en oeuvre de la règle La base de connaissances 10 inclut les sections de conditionnement 11 B à l IE pour les règles B à E, et des sections d'exécution 12 B à 12 E, dont les résultats sont envoyés à la mémoire de travail 30 et affichés, par l'intermédiaire de la mémoire 20 contenant toutes les variables, dans une section d'affichage 4 En outre, la section de conditionnement ll B réalise une affectation préalable de l'attribut de bloc, la section de conditionnement li C règle les conditions concernant des hypothèses de types d'arrangements, la section de conditionnement 11 D exécute une vérification 1 des hypothèses et la section de conditionnement li E exécute une
vérification 2 des hypothèses.
Le procédé de reconnaissance de caractères selon la présente invention est mis en oeuvre sur la base de la
description détaillée donnée dans les demandes de brevets
mises à l'inspection publique sous les numéros 116781/1989 et 116782/1989, toutes deux déposées au nom du déposant de la présente demande La figure 7 est un organigramme montrant un exemple de fonctionnement de l'invention, et on va décrire de façon détaillée l'opération de reconnaissance
en se référant à cet organigramme.
Tout d'abord, une donnée d'image d'un chèque, telle que représentée sur la figuré 1, est introduite au moyen de son exploration par la section d'entrée d'images 2 (pas Sl) et est soumise au prétraitement et au traitement d'amincissement comme représenté sur la figure 2, au moyen de la section de prétraitement 3 (pas 52) A la suite de ces opérations, les blocs BL 1 à BL 8 sont extraits comme cela est représenté sur la figure 3, moyennant l'exécution d'une analyse de structure d'un dessin linéaire (pas 53) Cette
extraction de blocs est exécutée pour les blocs valables.
Ici, un bloc valable est déterminé par la procédure selon laquelle, dans le cas o la hauteur moyenne des blocs comportant quatre ou un plus grand nombre de points est définie par EFI et ou la hauteur moyenne entre les blocs possédant une hauteur supérieure à EF 1 x 0,9 est définie par EF 2, les blocs possédant une hauteur supérieure à EF 2 x 1/3 ou les blocs, dans lesquels le nombre de points est supérieur à EF 2 x 1/2, sont définis comme étant des blocs valables Ensuite, l'extraction de caractéristiques est exécutée pour les blocs BL 1 à BL 8 (pas 54) A cet égard, les caractéristiques d'un bloc incluent la hauteur du bloc, la largeur du bloc, le rapport entre la hauteur et la largeur, la position du centre de gravité dans la direction horizontale, le résultat de la reconnaissance de caractères, l'aspect d'une barre (le degré de ressemblance d'un dessin à une barre), l'aspect d'une barre inférieure, l'aspect d'une barre supérieure, l'aspect d'une barre médiane, l'aspect d'une barre inclinée, l'aspect d'une barre inférieure
inclinée et l'aspect d'une barre supérieure inclinée.
L'étendue de la valeur de la hauteur d'un bloc est représentée par ( 1 =(hauteur du bloc)/EF 2 Lorsqu'on a i 1 > 1,3, la hauteur est évaluée comme étant extrêmement importante), lorsqu'on a < 1 > 1,1, elle est évaluée comme étant "très importante", lorsqu'on a i( 1 > 0,9, elle est évaluée comme étant "importante", lorsqu'on a & 1 > 0,7 elle est évaluée comme étant "assez faible", lorsqu'on a X 1 > 0,5, elle est évaluée comme étant "faible" et lorsqu'on aoel> 0,3, elle est évaluée comme étant "très faible" alors que lorsqu'on a" 1 > 0, elle est évaluée comme étant "extrêmement faible" L'étendue de la largeur d'un bloc est exprimée par (l=(largeur du bloc)/EF 2 Lorsqu'on a f> 0,9, la largeur est évaluée comme étant "très importante", et lorsqu'on a PF 0, elle est évaluée comme étant "faible" Le rapport d'élancement est représenté par '1 =hauteur/largeur et, lorsqu'on a 1 < 0,67, le bloc est évalué comme étant "très long latéralement", lorsqu'on ay-k 0,91, il est évalué comme étant "long latéralement" et lorsqu'on a '1 < 1,43, il est évalué comme étant "moyen", alors que, sinon, il est évalué comme étant "long longitudinalement" La position du centre de gravité dans le sens horizontal est représentée par la variable comprise entre " O à 100 " comme représenté sur la figure 8 Le procédé de calcul de l'aspect d'une barre, de l'aspect d'une barre inférieure, de l'aspect d'une barre supérieure, de l'aspect d'une barre médiane, de l'aspect d'une barre inclinée, de l'aspect d'une barre inférieure inclinée et de l'aspect d'une barre supérieure inclinée
seront décrits plus loin.
Lorsque l'extraction des caractéristiques du bloc est terminée, l'affectation préalable de l'attribut de bloc est exécutée sur la base de la série d'ensemble de règles B,
qui incluent la description de l'attribut du bloc dans une
section de conditionnement d'affectation préalable 11 B dans la base de connaissances 10, et l'affectation de l'attribut de bloc dans la section d'exécution 12 B dans cette base (pas ) Pour les blocs BL 1 à BL 8 représentés sur la figure 3, l'attribut suivant est affecté De façon spécifique, comme représenté en (A) sur la figure 9 A, l'attribut "chiffre" est affecté au bloc BL 1 (règle B 2), l'attribut "chiffre" est affecté au bloc BL 2 (règle B 2), l'attribut "chiffre" est affecté au bloc BL 3 (règle B 2), l'attribut "barre inclinée" est affecté au bloc BL 4 (règle B 10), l'attribut "chiffre" est affecté au bloc BL 4 (règle B 2), l'attribut "chiffre" est affecté au bloc BL 5 (règle B 2), l'attribut "chiffre" est affecté au bloc BL 6 (règle B 2), l'attribut "chiffre est affecté au bloc BL 7 (règle B 2), et l'attribut "chiffre" est
affecté au bloc BL 8 (règle B 2) La description concernant
les règles sera donnée plus loin.
A la suite de ces affectations de l'attribut de bloc, l'hypothèse concernant les types de centièmes tels que représentés sur les figures 4 A à 4 G est faite sur la base des ensembles de règles C (pas 56) De façon plus spécifique, la section de conditionnement 11 C dans la base de connaissances 10 règle la condition pour les types d'arrangements incluant les caractéristiques de blocs, l'attribut de bloc et les codes de position relative, et la section d'exécution 12 C propose l'hypothèse concernant le type des centièmes en appliquant les ensembles de règles C aux données Ce processus est mis en oeuvre comme cela est représenté en (B) sur la figure 9 A Sur les figures 4 A à 4 G, le terme "rang des dollars" représente la partie de marquage de l'argent pour une partie située au-dessus de la virgule décimale (la virgule des centièmes), la "virgule des centièmes" représente la partie du marquage de l'argent pour des valeurs inférieures à la virgule des centièmes Sur les mêmes figures 4 C à 4 F, chacun des types de centièmes C à F possèdent une"barre des centièmes" En outre, sur les figures 4 D à 4 F, chacun des types D à F des centièmes possède une "marque respective des centièmes", comme par exemple " 100 " ou "XX" Pour les données de reconnaissance de caractères représentées sur la figure 3, les types E et B des centièmes tels que représentés sur la figure 4 E ou 4 B sont choisis par hypothèse et les types proposés des centièmes font à nouveau l'objet d'une affectation et d'un renouvellement de l'attribut (pas 510) De façon spécifique en ce qui concerne l'hypothèse concernant le type des centièmes (pas 56), deux hypothèses, à savoir le type E des centièmes et le type B des centièmes, sont proposées respectivement sur la base de la règle C Sd 3 et de la règle CB 1, dont toutes deux seront décrites plus loin En ce qui concerne le type E des centièmes, la "barre des centièmes" et la "marque des centièmes" sont affectées en tant
qu'attributs respectivement aux blocs BL 4 et au bloc BL 6.
Pour le type B des centièmes, le "chiffre du rang des centièmes" est affecté en tant qu'attribut respectivement
aux blocs BL 7 et BL 8.
Ensuite, l'attribut affecté est régénéré par l'application des ensembles de règles D La section de conditionnement D pour la vérification 1 de l'hypothèse est décrite par les hypothèses des types des centièmes, les attributs de blocs, les caractéristiques de blocs et les codes de position relative, et la section d'exécution 12 D réalise le renouvellement des caractéristiques de blocs Si les données de reconnaissance des caractères n'ont aucune adaptation avec l'un quelconque des ensembles de règles D et si par conséquent on est en présence du bloc effectif, pour lequel des attributs en tant qu'éléments constitutifs des centièmes ne peuvent pas être affectés, l'hypothèse du type des centièmes doit être rejetée ou abandonnée (vérification 1 de l'hypothèse) Pour le renouvellement de l'attribut sur la base du type E des centièmes, comme cela est décrit dans (C) sur la figure 9 B, la "marque des centièmes" est affectée au bloc BL 7 (règle DK 3), la "marque des centièmes" est affectée au bloc BL 8 (règle DK 4), le "chiffre du rang des centièmes" est affecté au bloc BL 3 (règle Ddl), le "chiffre du rang des centièmes" est affecté au bloc BL 5 (règle Ddl), le "chiffre du rang des dollars" est affecté au bloc BLI (règle Dl) et le "chiffre du rang des dollars" est affecté au bloc BL 2 (règle Dl) D'autre part, pour le renouvellement de l'attribut sur la base du type B des centièmes, la "ivirgule des centièmes" est affectée au bloc BL 6 (règle DP 1), le "chiffre du rang des dollars" est affecté au bloc BL 1 (règle Dl), le "chiffre du rang des dollars" est affecté au bloc BL 2 (règle Dl-l), le "chiffre du rang des dollars" est affecté au bloc BL 4 (règle Dl-1) le "chiffre du rang des dollars" est affecté au bloc BL 3 (règle Dl) et le "chiffre
du rang des dollars" est affecté au bloc BL 5 (règle Dl-1).
Ce renouvellement de l'attribut et la vérification de l'hypothèse (pas 510) sont suivis par le traitement de segmentation et la vérification 2 de l'hypothèse sur la base de l'agencement global (pas S 20) Comme cela estreprésenté en (D) sur la figure 9 B, étant donné que la relation de position relative entre les blocs BL 4,BL 6 et BL 8 n'est pas autorisée par la règle E-PO 56, l'hypothèse B du type des centièmes, mentionnée précédemment, est rejetée La vérification 2 de l'hypothèse doit être effectuée après l'évaluation faite pour savoir si le cas considéré entre ou non dans la règle de rejet Le résultat de la reconnaissance devient " 32 dollars et 64 centièmes" moyennant l'arrangement des résultats identifiés sous la forme du chiffre unique des blocs B Li et BL 2 auquel est affecté l'attribut "chiffre du rang des dollars" et des blocs BL 3 et BL 5 auquel est affecté l'attribut "chiffre du rang des centièmes" en raison de l'hypothèse E du type des centièmes, mentionnée précédemment, qui a subsisté précédemment Le résultat de la reconnaissance est affiché dans une section d'affichage 4 (pas 530) de manière à permettre une transaction requise pour le chèque, comme par exemple une transaction de dépôt
(pas 531).
On va maintenant décrire de la manière indiquée
ci-après l'attribut devant être appliqué à un bloc extrait.
L'attribut du bloc consiste en "chiffre", "contenant une barre inférieure (inclinée)", "barre (inclinée)", "chiffres attenants", "petits chiffres attenants du rang des centièmes", "contenant une barre supérieure (inclinée)" et "inconnu" L'attribut "chiffre" doit être renouvelé ou remplacé par "chiffre du rang des dollars", "chiffre du rang des centièmes", "marque des centièmes", et "virgule des centièmes" L'attribut "contenant une barre inférieure (inclinée)" doit être remplacé par "un caractère du rang des centièmes contenant une barre inférieure (inclinée) " ou "deux caractères du rang des centièmes contenant une barre inférieure (inclinée)" En outre, l'attribut doit être remplacé par "chiffre du rang des centièmes" et "barre des centièmes (inclinée)" L'attribut est remplacé par "chiffre du rang des centièmes", "chiffre du rang des centièmes" et "barre des centièmes (inclinée)" L'attribut "barre (inclinée)" est remplacé par "barre des centièmes (inclinée)" et l'attribut "chiffres attenants" est remplacé par "chiffres attenants du rang des dollars" ou "chiffres attenants du rang des centièmes" En outre l'attribut "chiffres attenants du rang des dollars" est remplacé par "chiffres du rang des dollars" et "chiffre du rang des dollars" et l'attribut "chiffres attenants du rang des centièmes" sont remplacés par "chiffre du rang des centièmes" et "chiffre du rang des centièmes" En outre l'attribut "inconnu" est classé dans "chiffre du rang des dollars", "chiffre du rang des centièmes", "marque des
centièmes" ou "virgule des centièmes".
La détection de l'attribut par la relation de position relative est illustrée sur la figure 10 avec la carte de la position relative et sur la figure Il avec la position et la forme du bloc La figure 12 montre un exemple dans lequel le bloc BL 4 est considéré comme étant un bloc de référence La caractéristique de direction horizontale du bloc BL 6 est repérée par Xmin = centre, centre de gravité suivant x = centre et Xmax = centre Pour sa direction longitudinale Ymin = milieu, centre de gravité suivant y = milieu et Ymax = milieu Par conséquent, le code de position relative BL 6 est représenté par ( 26,26) conformément à la figure 13 Pour le bloc BL 7, la caractéristique de direction horizontale est exprimée par Xmin = centre, centre de gravité suivant x = droite et Xmax droite, la caractéristique de direction longitudinale correspondante est repérée par ymen = milieu, centre de gravité suivant y = milieu et ymax = milieu, et par conséquent le code de position relative du bloc est représenté par ( 29,26) conformément à la figure 13 La caractéristique horizontale du bloc BL 8 est exprimée par xmin = droite, centre de gravité suivant x = droite et Xmax = hors R la caractéristique longitudinale est ymin = milieu, centre de gravité suivant y = milieu, Yax = milieu et il en résulte que le code de position relative est représenté par ( 33,26) conformément à la figure 13 Comme représenté sur la figure 13, la position relative est indiquée par la combinaison de la position longitudinale et de la position horizontale, dont chacune comporte 35 variantes La position relative du bloc BL 6 par rapport au bloc BL 4 peut être représentée moyennant l'utilisation de la combinaison mentionnée précédemment, c'est-à-dire le code de position relative ( 26, 26) En utilisant ce mode de représentation, il est possible d'exprimer la relation en particulier des chiffres ou de la marque des centièmes par rapport à la barre des centièmes d'une manière simple et précise Les codes de position relative permettant d'exprimer les relations entre les blocs sont produits dans la section 23 de production de codes de positions relatives et sont transmis par l'intermédiaire de la mémoire 20 de toutes les variables, qui est située dans la mémoire de travail 30 Les codes mémorisés sont comparés aux codes enregistrés antérieurement des règles dans la section de conditionnement et sont utilisés pour la préaffection de l'attribut de bloc (pas ), pour l'hypothèse concernant le type des centièmes (pas 56), pour l'affectation et le remplacement de l'attribut sur la base du type des centièmes (pas Sl O) et pour la vérification effectuée sur la base du traitement de segments et de l'arrangement global (pas 520) Dans la relation de position représentée sur la figure 14, les codes de position relative des deux blocs b et c par rapport au bloc a sont représentées par x = 26, y = 26 Pour exprimer les relations de position verticale des blocs b et b par rapport au bloc a, lorsqu'une ligne verticale s'étend vers le haut ou vers le bas à partir d'un point quelconque dans chaque bloc b ou c, si la ligne étendue recoupe la barre des centièmes sur le côté ascendant comme représenté sur la figure 15, d est remplacé par "u-d", c'est-à-dire d = u d, tandis que si la ligne étendue croise la barre des centièmes vers le bas, le
u est remplacé par "u d", c'est-à-dire u = u d Ici "u -
d" peut être utilisé uniquement pour le cas o l'on a x= 26
et y= 26.
Ci-après, on va décrire pour chacun des exemples les règles appliquées, dans la base de connaissances 10 pour
la présente invention.
Règle B 10: Dans la section de conditionnement S'il existe un bloc qui présente les caractéristiques suivantes de bloc: 1 Le bloc est effectif, 2 La hauteur du bloc est "extrêmement importante", "très importante" ou "importante", 3 La position horizontale du centre de gravité du bloc est supérieure à 30, 4 Le coefficient d'aspect de la barre inclinée est
supérieur à 72.
Dans la section d'exécution
Alors l'attribut "barre inclinée" est affecté au bloc.
Règle B 2: Dans la section de conditionnement si 1 Le bloc est effectif, 2 La hauteur du bloc est "extrêmement importante", "très importante", "importante", "assez faible", "faible" ou "très faible", 3 L'aspect du caractère "ressemble à celui d'un
chiffre" ou est "un chiffre".
Dans la section d'exécution:
Alors l'attribut "chiffre" est donné.
Règle C Sd 3: Dans la section de conditionnement S'il existe un bloc (i) appartenant à l'attribut "barre inclinée" avec un autre bloc effectif ( ) situé dans la position inférieure droite de cette barre (barre du ichi-s) Ici, le bloc D< doit posséder un centre de
gravité horizontal correspondant à plus de 40.
Dans la section d'exécution: L'attribut "barre des centièmes inclinée" est affecté au bloc et l'hypothèse du type des centièmes E doit
être formulée.
Règle CB 1: Dans la section de conditionnement 1 Si le premier bloc effectif (") et le second bloc effectif ( P) à partir de l'extrémité de droite appartiennent à l'attribut"(chiffre" ou "petit chiffre", 2 Si les blocs o< et P possèdent un attribut élevé "légèrement faible", "faible", très faible" ou extrêmement faible" et si la relation (centre de gravité suivant x du bloc) < (centre de gravité suivant y du bloc) est satisfaite, 3 S'il existe un bloc Y proche du côté gauche des blocs i< et mentionnés précédemment, le blocy possédant un attribut "chiffre" ou "chiffres attenants", et la relation t(centre de gravité dee< suivant x) (centre de gravité de y suivant x)i < 3 x (hauteur du bloc () est satisfaite; et 4 si la hauteur du bloc g est supérieure de 50 % à celle du bloc iî ou P Dans la section d'exécution Les attributs des blocs X et P sont remplacés par "chiffres du rang des centièmes" et on prend
l'hypothèse du type B des centièmes.
Règle DK 3: Dans la section de conditionnement Si, lorsqu'on prend l'hypothèse du type E des centièmes, il existe un bloc effectif dans la position inférieure droite (barre du ichi-s) du bloc qui possède
l'attribut "barre des centièmes inclinée".
Dans la section d'exécution: L'attribut "marque des centièmes est affecté au bloc effectif et est supposé être le bloc de la marque des
centièmes dans le type E des centièmes.
Règle Ddl: Dans la section de conditionnement Si, lorsque le type E des centièmes, qui était un bloc "barre des centièmes inclinée" est pris pour hypothèse, il existe un bloc (i() ayant un attribut "chiffre" ou "faible chiffre" dans la position supérieure gauche
(Ddl du ichi-s) du bloc "barre des centièmes inclinée".
Dans la section d'exécution: L'attribut du bloc" est remplacé par "chiffre du rang des centièmes" et est supposé être le bloc du chiffre
du rang des centièmes du type E des centièmes.
Règle Dl: Dans la section de conditionnement Si pour toutes les sortes des types des centièmes, lorsqu'il existe deux blocs "chiffre du rang des centièmes" (devant être désignés par -ie et P), un troisième bloc r ayant l'attribut "chiffre" est positionné de manière à satisfaire à la relation suivante: centre de gravité du bloc r suivant x < centre de gravité des blocs M/ et suivant x, hauteur du bloc È> 90 % de la hauteur du bloc c 6 ou A Dans la section d'exécution: L'attribut du bloc ( est remplacé par "chiffre du rang
des dollars".
Règle D 1-1: Dans la section de conditionnement Si pour toutes les sortes des types de centièmes, on a un bloc C' possédant l'attribut "chiffre du rang des dollars" et deux blocs et possédant l'attribut "chiffre du rang des centièmes", il existe un bloc possédant l'attribut "chiffre" et la relation de position suivante est satisfaite: Centre de gravité de i suivant x > centre de gravité de suivant x, le code de position relative de par rapport au bloc g est
code-y = 11, 20, 21, 26, 27.
Dans la section d'exécution: L'attribut du bloc S est remplacé par "chiffre du rang
des dollars".
Règle DP 1: Dans la section de conditionnement Si pour tous les types des centièmes, lorsqu'il existe deux blocs X< et / possédant l'attribut "chiffre du rang des centièmes" (ici la relation centre de gravité de 0 < suivant x < centre de gravité de P suivant x doit être satisfaite), il existe deux blocs ayant l'attribut "chiffre" ( ( et i; la relation centre de gravité de <suivant x < centre de gravité deî suivant x < centre de gravité de X suivant x doit être satisfaite), le résultat de la reconnaissance du caractère de Sest " 1 ", " 2 " ou " 6 " et la hauteur de est "très faible" ou "extrêmement faible", et est inférieure à È, la position de i satisfait à la relation: Ymin de ô > centre de gravité de 2 suivant y Dans la section d'exécution: L'attribut du bloc S est remplacé par "virgule des
centièmes".
Règle E-PO 56 Dans la section de conditionnement Si le type B des centièmes est pris par hypothèse et s'il existe deux blocs O (et F ayant l'attribut "chiffre du rang des dollars" et un bloc <ayant l'attribut "chiffre du rang des centièmes" et si les relations suivantes sont satisfaites entre ô', P et Y, le code de position relative de Ypar rapport àF est la barre du ichi-s, le code de position relative de par rapport à est Ddl
du ichi-s.
Si la barre du ichi-s désigne la relation de position entre une barre inférieure inclinée et le bloc inférieur et si le code de position relative est représenté par (x= 26, y= 26, u-d=d), (x= 26, y= 27), (x= 27, y= 26) ou (x= 29, y= 26), Ddl de Ichi désigne la relation de position entre une barre inférieure inclinée et le chiffre supérieur gauche de rang des centièmes, et le code de position relative est représenté par (x= 26, y= 26, u-d=d), (x= 26, y= 17) ou
(x= 20, y= 20).
Dans la section d'exécution: l'hypothèse du type des
centièmes est abandonnée.
Comme cela a été décrit de façon détaillée précédemment, étant donné que le dispositif de reconnaissance des caractères conforme à la présente invention reconnaît des caractères réalisant la classification des caractères manuscrits possédant un format définitif, à un certain degré, par rapport au type d'arrangement des caractères, en considérant comme hypothèse l'arrangement auquel le type de caractère appartient en effectuant la reconnaissance sur la base de cette hypothèse, il est possible de reconnaître et de discriminer de façon fiable et sans erreur des caractères qui présentent une grande similarité réciproque, par exemple le chiffre " 1 " et
la "barre inclinée".
Ci-après, on va expliquer le procédé de calcul de l'aspect d'une barre, de l'aspect d'une barre inférieure, de l'aspect d'une barre supérieure, de l'aspect d'une barre médiane, de l'aspect d'une barre inclinée, de l'aspect d'une barre inférieure inclinée et de l'aspect d'une barre supérieure inclinée, et en outre le procédé de traitement dans le cas o une barre et un chiffre sont en contact et
dans le cas de chiffres en contact réciproque.
La présente invention concerne un procédé permettant de détecter automatiquement une barre des centièmes, qui est prévue de manière à distinguer de façon sûre le rang des dollars du rang des centièmes, par reconnaissance de la quantité d'argent qui est écrite à la main sur un chèque U S représenté sur la figure 17 ou sur les figures 26 A à 26 F En détectant le rang des centièmes, le procédé permet de reconnaître le rang des dollars et le
rang des centièmes.
Les figures 16 A et 16 B sont des organigrammes illustrant le mode opératoire de ce procédé conforme à l'invention, que l'on peut subdiviser grossièrement en un pas de détection d'une zone qui inclut la barre dans l'information des caractères, et le pas de reconnaissance des caractères sur la base de la relation de position entre la barre détectée et les caractères respectifs On va décrire le procédé de façon plus spécifique en référence à un chèque représenté sur la figure 17 et dans l'ordre des organigrammes des figures 16 A et 16 B. La figure 18 montre un exemple des blocs extraits moyennant l'utilisation des pas Si à 53 sur la figure 7 pour l'indication d'argent en dollars sur un chèque comme représenté sur la figure 17 Bien que les blocs soient extraits lors du pas suivant 54, on va décrire un procédé de calcul du facteur de certitude, englobant la barre, qui est l'une des caractéristiques du bloc C'est-à-dire que, lorsque des blocs sont extraits de cette manière à partir de l'information de caractère de la figure 17, sept blocs sont extraits comme illustré sur la figure 18 Les blocs sont numérotés B L 11 à BL 17 à partir de la gauche L'extraction des blocs peut être exécutée conformément au procédé décrit dans la demande de brevet japonais mise à l'inspection publique sous le numéro 233585/1989 Lorsque l'extraction du bloc est terminée, la procédure passe au calcul du facteur
de certitude déterminant si un bloc contient une barre.
Chacun des blocs B L 11 à BL 17 est subdivisé en neuf zones de matrice ayant pour dimensions 3 x 3, comme représenté sur la figure 20 Par exemple, le bloc BL 14 est subdivisé en neuf zones Z(i,j) comme représenté sur la figure 19 Le nombre de masques verticaux ZV(i,j) le nombre de masques inclinés ZS(<,j), et le nombre de masques horizontaux ZH(i,j) sont obtenus pour chaque zone Z(i,j) comme
représenté sur la figure 20.
La raison qu'il y a de subdiviser un bloc en neuf zones est qu'il faut évaluer le type d'une barre en plus de sa présence ou de son absence De façon plus spécifique, le type de la barre peut être évalué sur la base de l'information de probabilité de la position d'une barre dans un bloc Par exemple, si la barre est présente dans les zones inférieures (Z( 0,2), Z( 1,2), Z( 2,2 >) d'un bloc, elle est évaluée comme étant une barre inférieure S'il existe dans les zones supérieures (z(o,o), Z (,o, Z( 2, 0) , du bloc, elle est évaluée comme étant une barre supérieure De façon similaire, lorsqu'elle est présente dans les zones médianes (Z(o,1), Z(i, l), Z( 2,1 >) du bloc, on l'évalue comme étant une barre médiane Si elle existe dans des zones disposées obliquement (Z(o,o), Z(ll), Z( 2,2)) OU (Z 2,O), Z(li,), Z( 0,2)), elle est évaluée comme étant une barre inclinée, une barre inférieure inclinée ou une barre supérieure inclinée Le type de la barre, par exemple une barre inférieure, une barre supérieure, une barre inclinée, une barre inférieure inclinée et une barre supérieure
inclinée peut être déterminé.
On va maintenant décrire un masque Un masque est constitué de neuf traits ayant pour dimensions 3 x 3 La configuration du masque de points qui forme un composant vertical de l'information de caractères formés de points, est désigné sous le terme de masque vertical et la configuration de masque qui constitue une composante horizontale de cette information est désigné sous le terme de masque horizontal, et la configuration du masque, qui forme une composante inclinée d'informations, est désigné
sous le terme de masque incliné.
Il existe 7 types de masques verticaux comme représenté sur la figure 21, 2 types de masques inclinés tel que représenté sur la figure 22 et 7 types de masques horizontaux tel que représenté sur la figure 23 Bien que les masques indiqués précédemment comprennent 3 x 3 points, la taille de la matrice n'est pas limitée à ces dimensions et peut être supérieure à 3 x 3 Le nombre des masques zv<o,j) dans un bloc est obtenu par exploration des masques verticaux dans chaque zone Zj(i,j), le nombre des masques inclinés est obtenu par exploration des masques inclinés dans chaque zone Z(<jj), et le nombre des masques horizontaux est obtenu par l'exploration des masques horizontaux dans chaque zone Z(i,j) Alors, le facteur de certitude qu'un bloc contienne une barre est calculé pour chacun des blocs Plus particulièrement, on calcule le
facteur de certitude de la manière indiquée ci-après.
Le facteur de certitude < d'une barre inférieure est calculé après l'extraction d'une ligne inférieure
conformément aux formules indiquées ci-dessous.
ud-hlinelOl = ZH( 0,2) + ZH( 1,2) + ZH( 2,2)
(ZS( 0,2) + ZS( 1,2) + ZS( 2,2))/2
(zv( 0,2) + ZV( 1,2) + ZV( 2,2))/2 ( 1) ud-hlinel 1 l = ZH(O,2) + ZH( 1,2) + ZH( 2,1) (ZS(o,2) + ZS( 1,2) + ZS( 2,1))/2 (zv(o,2) + ZV( 1,2) + ZV( 2, 1))/2 ( 2) ud-hlinel 2 l = ZH(O,1) + ZH( 1,2) + ZH( 2,2)
(ZS( 0,1) + ZS( 1,2) + ZS( 2,2))/2
(zv(o,1) + ZV( 1,2) + ZV( 2,2))/2 ( 3) Les données extraites pour la ligne inférieure ainsi obtenue ud-hlinel O l, ud-hlinel 1 l, et ud-hline l 2 l sont utilisés pour l'obtention du facteur de certitude de la
barre inférieure conformément à la formule indiquée ci-
après. = K 1 MAXlud-hlinel O l, ud-hlinel 1 l, ud-hlinel 2 ll/ (total de pixels noirs dans un bloc) ( 4)
Avec O << 1, et K 1 constante.
De façon similaire, le facteur de certitudes d'une barre supérieure est obtenu au moyen de l'extraction d'une
ligne supérieure conformément aux formules indiquées ci-
dessous, et son calcul est obtenu conformément à la formule ( 8) uphlinel O l = ZH( 0,0) + ZH( 1,0) + ZH( 2,0) (zs(o,o) + ZS( 1,0) + ZS( 2,0 o))/2 (ZV(o,0 o) + ZV( 1,0 o) + ZV( 2,0 o))/2 ( 5) up-hlinel 1 l = ZH( 0, 1) + ZH( 1,O) + ZH( 2,0) (zs (o 0, 1) + ZS( 1, 0) + ZS( 2,o))/2 (ZV(o,1) + ZV( 1,0) + ZV( 2,0 o))/2 ( 6) up-hlinel 2 l = ZH( 0,0) + ZH( 1,0) + ZH( 2,1) (ZS( 0,0 o) + zs( 1,0) + ZS( 2,1))/2 (zv ( 0,0)+zv( 1,0)+ZV( 2,1))/2 ( 7) 3 = K 2-MAXlup-hlinelOl, up-hlinel 1 l, up-hlinel 2 ll / (Nombre total de pixels noirs dans un bloc) ( 8)
Avec O 1, et K 2 constante.
Le facteur de certitude Yd'une barre médiane est obtenu au moyen du calcul effectué conformément à la formule
suivante, puis au moyen de la formule ( 9).
md-hlinel O l = ZH( 0,1) + ZH( 1,1) + ZH( 2,1) = K 3 md-hlinel O l/chiffre de pixels dans l'étendue latérale en largeur d'un bloc) ( 9)
0 <$< 1, et K 3 constante.
En outre, le facteur de certitude l d'une barre inclinée, le facteur de certitude 2 d'une barre inférieure inclinée et le facteur de certitude i 3 d'une barre supérieure inclinée sont obtenus comme indiqué ci-après Le facteur de certitude de la barre inclinée F, est obtenu au moyen du calcul réalisé conformément à la formule suivante,
puis au moyen de la formule ( 11).
s-barlOl = -3-ZV( 0,O)1-ZV(i,0) + 1-ZV( 2,0) -1-z V(o,1) + 1 zv( 1,1) 1 zv( 2,1)
+ 1-ZV( 0,2) 1 -ZV( 1,2) 3 ZV( 2,2)
-3 ZS( 0,0) ZS( 1,O 0) + 1 ZS( 2,0)
zs(o,1) + 1-zs( 1,1) 1 zs( 2, 1) + 1 -zs(o,2) 1 -ZS( 1,2) 3-ZS( 2,2)
-3 ZH( 0,0) 1 -ZH( 1,O 0) + 1 -ZH( 2,0)
-1 ZH( 0,1) + 1 ZH( 1,1) 1 ZH( 2,1)
+ 1-ZH( 0,2) 1 ZH( 1,2) 3-ZH( 2,2)
( 10) l = K 4 S-barl O l/(chiffre de pixels dans l'étendue latérale en largeur d'un bloc) ( 11)
Avec O <i 1 < 1, et K 4 constante.
Le facteur de certitude 2 d'une barre inférieure
inclinée est obtenu conformément aux formules ( 12) et ( 13).
s-ud-barl O l = + 0-ZV( 0,0) + O-ZV( 1,0) + 1 ZV( 2,0) +O-ZV(O,i) + 1-ZV( 1,1) 1 ZV( 2,1) + 1 zv( 0,2) 1 ZV( 1,2) 3-ZV( 2,2)
+O-ZS( 0,0) + O-ZS( 1,0) + 1-ZS( 2,0)
+O ZS (O, 1) + 1-ZS ( 1,1)
+ 1-zs(o,2) 1 -ZS( 1,2)
+ O -ZH( 0,0) + O -ZH( 1,0)
+ O ZH( 0,1) + 1 ZH( 1,1)
+ 1-ZH( 0,2) 1-ZH( 1,2)
1-zs( 2,1)
3 ZS( 2,2)
+ 1-ZH( 2,0)
1-ZH( 2,1)
3-ZH( 2,2)
( 12) 2 = K 5 s-ud-barlOl/(nombre de pixels dans l'étendue latérale en largeur d'un bloc) ( 13)
Avec O <,2 <,l, et K 1 constante.
Le facteur de certitude 53 d'une barre sup 6 rieure
inclin 6 e est calculé conformément aux formules ( 14) et ( 15).
s-up-barl O l = -3 ZV( 0,0 o)
-1 *ZV (O, 1)
+ 1 ZV ( 0,2)
-3-ZS ( 0,0)
-1-ZS ( 0,1)
+i-zs( 0,2)
-3 ZH ( 0,0)
-1-ZH ( 0, 1)
+ 1 i ZH ( 0,2) 1 ZV( 1, o)
+ 1 ZV( 1,1)
+ O ZV( 1,2)
1 ZS ( 1, o)
+ 1-ZS( 1,1)
+ o-ZS( 1,2)
1-ZH( 1,0)
+ 1 -ZH( 1,1)
+ O-ZH( 1,2)
+ 1 ZV( 2, 0)
+ O -ZV( 2,1)
+ O o ZV( 2,2) + 1 ZS( 2, o) + 0-zs( 2,1)
+ O-ZS( 2,2)
+ 1-ZH( 2,0)
+ O-ZH( 2,1)
+ 0-ZH( 2,2)
( 14) 3 = K 6 s-up-barl O l/(nombre de pixels dans l'étendue latérale en larguer d'un bloc ( 15)
Avec 0,< 93 41, et K 6 constante.
On évalue si les facteurs de certitude ont été ou non calculés pour tous les blocs sur la figure 18, et une fois terminée l'extraction des blocs, après affectation pas ) utilisant la base de connaissances 10 et le mécanisme logique 40, l'hypothèse (pas 56) du type des centièmes et l'affectation et le remplacement (pas 510) de l'attribut du bloc concernant le type des centièmes sont exécutés de la
même manière que dans l'exemple représenté sur la figure 1.
Seule l'hypothèse concernant le type E des centièmes n'est pas abandonné et subsiste en tant que résultat de vérification sur la base de l'agencement global du bloc lors du pas 520 Conformément à l'hypothèse concernant le type des centièmes, les attributs des blocs BLîl à BL 17 sont les suivants; le bloc BL 11 est le "chiffre du rang des dollars", le bloc BL 12 forme les "chiffres attenants du rang des dollars", le bloc BL 13 forme le "chiffre du rang des centièmes", le bloc BL 14 forme un "caractère unique du rang des centièmes contenant une barre inférieure inclinée", et les attributs des blocs BLî 5 et BL 17 sont la "marque des centièmes". Lors de la vérification suivante 2 de l'hypothèse (pas 520), le bloc correspondant à deux ou un plus grand chiffre de caractères est déterminé au moyen de l'attribut affecté à chaque bloc, puis un traitement de segments et exécuté C'est-à-dire que si l'attribut affecté au bloc est "un caractère de l'ordre des centièmes contenant une barre inférieure", "deux caractères du rang des centièmes incluant une barre inférieure", "un caractère du rang des centièmes incluant une barre inférieure inclinée" ou "deux caractères du rang des centièmes incluant une barre inclinée inférieure", le bloc contient la barre des centièmes Alors, on trouve le bloc comportant les quatre attributs indiqués précédemment, la barre est séparée du bloc et ensuite les chiffres sont extraits Dans le cas de la figure 18, le bloc BL 14 qui possède l'attribut "un caractère du rang des centièmes incluant une barre inférieure inclinée" est extrait On va expliquer le procédé de traitement de séparation de la barre, en référence aux figures 16 A et 16 B. Tout d'abord, le bloc extrait est introduit dans une section 24 de séparation de la barre, à partir de la mémoire 20 de toutes les variables, et des points d'extrémité dans le bloc sont extraits (pas 540) Cependant, deux points d'extrémités d'une barre possédant une longueur horizontale supérieure à la moitié de l'étendue latérale en largeur du bloc sont évalués comme étant effectifs, et des points d'extrémités de barres extrêmement courtes sont négligés Par exemple, pour le bloc BL 14 représenté sur la figure 19, quatre ensembles de points d'extrémités, par exemple a (xl,yl) et b (x 2,y 2), a (et c, a et d, et a et e sont extraits comme représenté sur la figure 24, et des longueurs effectives de trajets Pk (k = l") n; N étant le chiffre d'ensembles de deux points d'extrémité) sont obtenus (pas 541) La longueur effective de trajet Pk est une distance (ou le chiffre de points), sur laquelle le dessin de la ligne entre deux points d'extrémité s'étend continûment S'il existe plusieurs trajets entre les points d'extrémité, la longueur la plus faible de trajet est considérée comme étant Pk Par exemple, dans le bloc représenté sur la figure 27, deux trajets existent entre les points d'extrémité a et b comme représenté sur les figures 28 A et 28 B tandis qu'il existe deux trajets entre les points d'extrémité a et c comme représenté sur les figures 28 C et 28 D On utilise les trajets les plus courts pour chaque distance, c'est-à-dire le trajet a-p-q-b (figure 28 A) et le trajet a-p-r-c (figure 28 C) La distance linéaire Dk entre les points d'extrémités est obtenue au moyen de la formule
( 16) (pas 542).
Dk = {(X 2 X 1)2 + (Y 2 yl)2 ( 16) et la linéarité Sk des trajets respectifs est obtenue au
moyen de la formule ( 17) (pas 543).
Sk = Dk/Pk ( 17) On répète ce pas jusqu'à ce que la linéarité Sk est calculée pour tous les trajets (pas 544) Lorsque la linéarité Sk est obtenue pour tous les trajets, un trajet possédant la linéarité maximale est choisi par hypothèse comme étant la barre des centièmes (pas 550). On évalue ensuite si la barre des centièmes considérée par hypothèse possède ou non une branche qui est partagée avec un chiffre (pas 551) S'il existe une telle branche, la barre des centièmes prise par hypothèse est éliminée hormis en ce qui concerne la branche commune (pas 553) Ceci concerne le cas o une barre est en chevauchement avec-le tracé d'un chiffre S'il n'existe aucune branche qui soit commune avec le tracé d'un chiffre, labarre des centièmes considérée par hypothèse est supprimée du bloc (pas 552) Le chiffre (D) sur la figure 25, représente le cas o une barre des centièmes, qui est considérée par hypothèse pour le bloc (A) représenté sur la figure 25 est supprimée hormis pour la branche commune, alors que le bloc (C) sur la figure 25 représente le cas o la barre des
centièmes, prise par hypothèse, est éliminée.
Ensuite, le nombre formé de chiffres attenants est segmenté au moyen du procédé que l'on va expliquer ci-après, pour la partie numérique de segment (pas 554), le chiffre est reconnu et vérifié (pas 555) et la reconnaissance et la vérification sont évaluées comme étant valables ou non (pas 556) Si la reconnaissance et la vérification ne sont pas évaluées comme fournissant un résultat positif, le trajet choisi par hypothèse est supprimé de la liste de candidats (pas 557) et la procédure revient au pas 550 indiqué plus haut Si un trajet est retiré deux ou un plus grand nombre de fois de la liste de candidats, ce trajet est traité comme étant une erreur (pas 558) C'est de cette manière qu'est
exécutée la segmentation pour le bloc contenant la barre.
Cependant, le bloc dans lequel des chiffres sont en contact les uns avec les autres, n'est pas encore segmenté et subsiste Ce bloc pourrait être évalué conformément aux attributs affectés, les attributs du bloc constitué de deux ou d'un plus grand nombre de caractères étant "chiffres attenants du rang des dollars", "chiffres attenants du rang des centièmes" et "chiffres attenants du rang des centièmes" La segmentation des chiffres attenants est exécutée pour le bloc auquel sont affectés les trois attributs mentionnés précédemment Dans le cas de la figure 18, seul l'attribut du bloc BL 12 entre dans le cadre de l'attribut représentant les chiffres attenants indiqués précédemment, la segmentation des chiffres attenants est exécutée pour le bloc B L 12, puis ce bloc est subdivisé en
*les deux chiffres " 3 " et " 8 ".
Conformément aux opérations indiquées précédemment, tous les chiffres du rang des dollars et du rang des centièmes sont séparés et identifiés, le résultat identifié étant affiché (pas 530 sur la figure 7) Ensuite, une transaction de contrôle est exécutée (pas 531) et l'opération est terminée Si le traitement d'erreur est apparu lors du traitement de séparation de la barre, indiqué plus haut ou de la segmentation, la reconnaissance de la quantité d'argent conduit à un rejet et le "rejet" est affiché lors du pas 530 Un opérateur peut voir l'affichage
et l'information d'entrée nécessaire.
Comme cela a été indiqué ce façon détaillée dans ce qui précède, -le procédé d'extraction des caractères conforme à la présente invention permet de reconnaître de façon précise des caractères même si les caractères sont en contact avec une barre étant donné que cette dernière est détectée sur la base du rapport entre la distance linéaire et la longueur de trajet effectif de deux points d'extrémité quelconques et la barre est retirée du bloc pour la reconnaissance des caractères Même les caractères tels que ceux représentés sur les figures 26 A à 26 F peuvent être
reconnus conformément à la présente invention.
On va décrire maintenant le procédé de
segmentation pour un nombre formé de chiffres attenants.
L'organigramme de la figure 29 illustre une opération schématique d'une forme de réalisation de la présente invention, dans -laquelle un bloc devant être reconnu est tout d'abord fixé (pas 5101) Tout d'abord, les chiffres attenants sont complètement marqués dans le bloc devant être reconnu et les chiffres sont séparés par segmentation (pas 5102) La segmentation a pour objet d'éliminer la branche comportant le centre de gravité situé tout-à-fait à droite, et ce de façon successive, un élément étant supprimé pour la reconnaissance d'un chiffre (pas 5103), et lorsque les chiffres peuvent être identifiés dans ce cas, la caractéristique d'une relation associée aux branches éliminées est également extraite; le résultat est mémorisé (pas 5104), les branches sont éliminées une par une successivement pour la reconnaissance, et si les chiffres peuvent être reconnus au cours du traitement, la segmentation est exécutée de façon répétée (pas 5105), et lorsque toutes les segmentations sont terminées, une décision est alors prise concernant le fait que le bloc
devant être reconnu doit être ou non éliminé (pas 5106).
C'est-à-dire que si l'on observe que la partie (sur le côté droit) subsistant après l'élimination d'une partie de chiffre maintenant reconnu à droite du bloc de chiffres attenants est ou non encore présente -et si elle est présente, alors l'ensemble du côté droit de la partie reconnue à droite maintenant est éliminé comme bloc devant être reconnu, la procédure allant du pas Sl O 1 au pas 5106 est répétée, et la procédure allant du pas 5101 au pas 5106 est également mise en oeuvre pour l'ensemble de tous les résultats reconnus, et, chaque fois que cette procédure pour tous ces résultats est terminée, la détermination synthétique est faite en ce qui concerne les chiffres attenants pour établir s'ils correspondent au résultat reconnu obtenu jusqu'alors, à la caractéristique de connexion et à la caractéristique d'arrangement général, etc
(pas 5107).
On va décrire ci-après des chiffres concrets attenants (sur la figure 30), en se référant à un organigramme détaillé représenté sur les figures 31 A et 31 B. Avec 1 = 1, i = 1 et imu = 1, on initialise tout d'abord 1 et imax (pas 5110), une donnée d'un bloc de chiffres attenants ali = (=a 1 ') est structurée (pas Sili), une structure d'un dessin de ligne est alors analysée (pas
5112), et des branches ( 1) à ( 8) sont sélectionnées.
Ensuite, on évalue si l'on a 1 > 2 (pas 5113), mais étant donné que l'on n'a pas 1 > 2, l'information relative au segment, comme par exemple le centre de gravité d'informations de branches ou analogue, est préparée (pas 5115), et l'ordre du centre de gravité des branches vient se situer dans ( 1),( 2),( 3),( 4),( 5),( 7),( 6) et ( 8), i et k ayant tous les deux la valeur zéro (pas 5116), on segmente un bloc de chiffres réunis ali (=ai,) (pas 5117) Les branches sont retirées une par une (A) comme représenté sur la figure 32 dans l'ordre du centre de gravité, conformément à la technique décrite dans la demande de brevet japonais mise à l'inspection publique sous le numéro 121988/1989 Le fait que la segmentation soit ou non "OK" est garanti (pas 5120), étant donné qu'un élément est maintenant retiré, la segmentation est "OK d", et un contrôle de balance est exécuté (pas 5121) D'une manière tout-à-fait différente de ce qui est exécuté finalement dans une décision synthétique prise lors du pas 5134, qui sera décrit plus loin, le contrôle de balance est exécuté au moment de la segmentation et est signalé de façon distinctive par un 0 ", qui lui est associé Concrètement, on a la décision "NG" si la condition "hauteur de la branche candidate< 0,5 x hauteur du bloc" est satisfaite C'est-à-dire que, lors de la segmentation, si le bloc est inférieur à la moitié de la hauteur du bloc d'origine, alors la décision prise est "NG" (pas 5122) Si le contrôle de balance ( 0) est "OK", alors les données sont restructurées (pas 5123), la structure du dessin linéaire est analysée (pas 5124) pour déterminer si la reconnaissance du chiffre fournit la décision "OK", (pas 5125) mais, étant donné que la reconnaissance fournit maintenant le résultat "NG", la procédure revient au pas 5117, la branche ( 6) est alors retirée et un bloc "B" de la figure 32 est mémorisé, mais étant donné qu'on ne peut pas l'identifier comme étant un chiffre, la procédure revient au pas 5117, et de ce fait
cette procédure est répétée.
Dans l'état (F) de la figure 32, la reconnaissance du chiffre "OK d", j=j+ 1, k=k+l lors du pas 5126, i et k sont augmentés et une caractéristique de connexion est alors préparée (pas 5127) Ceci consiste à préparer une information indiquant comment le chiffre " 1 " reconnu à droite maintenant est raccordé par rapport aux branches situées juste avant lui et qui ont été segmentées et retirées, mais, bien que ceci sera décrit plus loin de façon
plus détaillée, le cas " 1 "ne s'y trouve pas associé.
Ensuite, le " 1 " reconnu est segmenté en un bloc b 1 j (=bll), l'ensemble de la partie restante après l'élimination du b 1 l mentionnée précédemment du bloc a,, de chiffres attenants est réglée de manière à être un bloc de connexion cik(=c 11), et un attribut de bloc de segment préparé (pas 5128) Le bloc est simplement désigné lors du pas 5128 La procédure revient au pas 5117 et un " 1 " est en outre segmenté comme représenté en (G) sur la figure 32, mais il ne peut pas être segmenté dans ce cas et par conséquent un drapeau indiquant la fin de la segmentation est placé dans le bloc de chiffres attenants ali(=ai,) (pas 5130) Alors, on détermine si le drapeau indiquant la fin de la segmentation a été ou non placé dans tous les blocs de chiffres attenants (pas 5131), mais, étant donné que le bloc de chiffres attenants est désigné maintenant comme étant a 1, une décision est alors prise pour savoir si la valeur maximale de k dépasse ou non 0 (pas 5133), mais, étant donné qu'on a maintenant k= 1 (accru une fois seulement lors du pas 5126), le bloc de connexion cl, désigné lors du pas 5128 reçoit une nouvelle désignation indiquant qu'il s'agit d'un bloc de chiffres attenants a 2 l (pas 5135), et la procédure revient au pas 5111 pour l'exécution d'une opération semblable à celle décrite précédemment C'est- à-dire que l'on a 1 = 2, i= 1, max = kmax= 1 lors du pas 5135, et le bloc de chiffres attenants a 2 j représenté sur la figure 33 est soumis à un traitement mais, étant donné qu'on a 1 = 2, une reconnaissance de chiffres est exécutée une fois lors du pas 5114 et le résultat est enregistré Dans ce cas que la reconnaissance soit ou non exécutée, le résultat est inscrit comme étant celui de la reconnaissance d'un bloc c 11 k(=cll) Cette
reconnaissance n'a pas encore eu lieu à ce stade.
Ensuite, la branche est retirée comme cela est représenté sur la figure 34 A, mais une reconnaissance n'est pas exécutée lors du pas 5125, et la reconnaissance de chiffres est déjà en cours comme sur la figure 34 B, après détermination d'un segment, la partie de la figure 35 B est rendue égale à b 2 l et la partie restante de la figure 35 C est réglée de manière à être c'l lors du pas 5128 La procédure revient au pas 5117 et la segmentation se poursuit également ensuite, et étant donné que la reconnaissance au niveau de la figure 34 C peut indiquer un " 5 ", " 5 " est réglé de manière à être b 22 et " 9 " est réglé de manière à être c 22 En outre la segmentation se poursuit et si la branche supérieure est supprimée du symbole de la figure 34 D, alors le contrôle de balance est "OK d", mais la reconnaissance des chiffres est "NG", et en outre le symbole de la figure 34 E ne peut pas être segmenté, c'est pourquoi un drapeau indiquant la fin de la segmentation du bloc a 21 est insérée lors du pas 5130 Etant donné que les deux blocs de chiffres attenants fournit maintenant un uniquement en tant que a 2 î la procédure avance du pas 5131 au pas 5133, mais une valeur maximale de k est 2 (k étant 2 par le fait qu'il est soumis deux fois au pas 5126), et par conséquent la procédure passe au pas 5135 et revient au pas 5111 après avoir fourni a 31 pour c 21 et a 32 pour C 22 Dans ce cas on a 1 = 3, i= 1,
imax=kmax= 2.
Alors un bloc a 31 représenté sur la figure 36 A et un bloc a 32 représenté sur la figure 36 B vont être reconnus, et tout d'abord pour le bloc a 31, étant donné qu'on peut le reconnaître comme étant le XI 7 "A lors du pas 5114, et un " 7 " est inscrit en tant que bloc de segment de c 21 Ensuite, k est ramené à la valeur k=O lors du pas 5116, et la partie supérieure est soumise à un contrôle de balance après la séparation, comme cela est représenté sur la figure 36 C lors du pas 5117, mais, il devient "NG" pour le renvoi au pas 5117, et la partie inférieure ne peut pas être segmentée, et c'est pourquoi la procédure passe du pas 5120 au pas 5130 et que le drapeau de fin est placé dans le bloc a 3 ' Le bloc a 32 n'est pas encore terminé et par conséquent i est augmenté de 1, selon la formule i=i+ 1 lors du pas 5132, puis la procédure revient au pas 5111 Ensuite, comme pour le bloc a 32, la reconnaissance permet d'indiquer " 9 " lors du pas 5114, et par conséquent le " 9 " est inscrit avec comme résultat un attribut de c 22 En poursuivant la segmentation, comme représenté sur la figure 36 D, le contrôle de balance devient "NG" et par conséquent la procédure revient au pas 5117, mais, étant donné qu'une autre segmentation ne peut pas être exécutée, la procédure passe du pas 5120 au pas 5130, et un drapeau de fin du bloc a 32 est positionné Dans ce cas, les blocs de chiffres attenants a 31 et a 32 sont tous terminés et par conséquent la procédure passe au pas 5133, et une détermination est faite pour savoir si une valeur maximale de k est ou non supérieure à 0, mais on a maintenant k = 0 Etant que k est ramené à zéro lors du pas 5116 avant la segmentation du pas 5120 et qu'en outre la reconnaissance des chiffres n'est pas "OK" d lors du pas 5125, par conséquent k n'est pas accru à partir de 0, sans passer par le pas 5126 et par conséquent on a kmax=O Par conséquent une opération de décision synthétique est exécutée (pas 5134). Contrairement à une décision d'applicabilité d'une règle de rejet conformément à l'information de connexion, la décision synthétique consiste à décider de façon synthétique de l'applicabilité d'un contrôle de balance classique et d'une règle pour annuler le contrôle de balance, que des résultats reconnus soient ou non obtenus dans deux ou un plus grand nombres d'opérations, etc, ce qui garantit soit
un rejet, soit un résultat reconnu.
On va maintenant décrire une relation entre segments et une relation entre segments candiadats, un résultat numérique reconnu et une suite de branches, en référence aux figures 37 et 38 Comme représenté sur la figure 37, le bloc de chiffres attenants ai, est subdivisé en un bloc de segmentation b'l et un bloc de connexion c 11 et le bloc de connexion ci est remplacé par le bloc de chiffres attenants a 2 l pour la segmentation, puis peut être subdivisé en un ensemble comprenant un bloc de segmentation b 21, un bloc de connexion c 21 et un ensemble formé d'un bloc de segmentation b 22, d'un bloc de connexion c 22, comme représenté ici De façon similaire, le bloc de connexion c 21 est remplacé par a 1 et le bloc de connexion c 22 est remplacé par a 32 pour la segmentation Ici, aucun de ces blocs n'est segmenté, et une segmentation du bloc de chiffres attenants, ai se termine et, sur la figure 37, on a représenté un ensemble de segmentations qui est disponible pour l'obtention de segments candidats, de la figure 38 La figure 38 représente un état dans lequel quatre segments sont obtenus à partir d'un bloc de chiffres attenants ail, dans lequel le résultat de chiffres reconnu devient "NO", " 1 " "NO", " 1 " " 7 " et " 1 " " 5 " " 9 " La figure 35 est un dessin illustrant une règle de rejet conformément à l'information de connexion, un candidat 1 " 25 ", " 117 " représenté sur les figures 35 (B) et (C) et un candidat 2 " 5 ", " 9 " sont obtenus, de manière supposée par rapport aux chiffres réunis (A) représentés sur la figure 35 Alors, avec 1 comme milieu de la longueur de la structure linéaire et li étant la longueur comprise entre 1 et ai et 1 et a 2, on obtient une valeur numérique ll/lx 1 OO(%), et cette valeur est rejetée lorsque les exigences suivantes sont toutes
satisfaites.
ai: un certain degré préréglé dans une partie de balayage sur le côté droit du chiffre 5, compris entre et 80 %, a 2: un certain degré préréglé sur l'extrémité gauche du chiffre 7, maintenant égale à 100 %, bl: un certain degré présent en un point d'extrémité de balayage sur le côté droit du chiffre 5, devenant % b 2 un certain degré présent dans une partie
supérieure du chiffre 7, compris entre O et 100 %.
Ici " 157 " est rejeté étant donné que la règle de rejet mentionnée précédemment et concernant l'information de connexion lui est appliquée C'est-à-dire que, lorsque les chiffres attenants (A) de la figure 35 sont segmentés en les chiffres (B) et (C) de la figure 35, l'information concernant les connexions ai, bl, a 2, b 2 satisfait complètement à la règle de rejet mentionnée précédemment et
par conséquent est rejetée.
En se référant à un contrôle de balance lors de la décision synthétique, lorsque l'on a r> 0,7 x min( 11,12) ( 18) 1 l, 12 désignent la longueur des deux blocs représentés sur la figure 39 et r désignant un chevauchement, les chiffres attenants sont annulés Ensuite, le contrôle de balance est annulé entre des chiffres spécifiques et dans un état connecté spécifique Par exemple, la reconnaissance sur la figure 40 est "NG" lors d'un contrôle de balance usuel, mais cette partie annule le contrôle de balance "NG", mais " 5-0 "
sont effectifs.
Comme décrit précédemment, " 159 " est obtenu lors
de la décision synthétique en tant que résultat reconnu.
Comme cela a été décrit précédemment, conformément au procédé de reconnaissance selon la présente invention, un bloc est segmenté à une distance prédéterminée d'un côté de l'extrémité de chiffres attenants, des branches sont effacées à partir de l'autre côté d'extrémité dans le bloc dans l'ordre des centres de gravité, un chiffre du bloc est reconnu, et dans le cas o la reconnaissance est possible un résultat reconnu des branches, les branches restantes sont mémorisées et en outre les branches sont effacées dans l'ordre du centre de gravité, une telle opération est répétée pour l'obtention de plus d'un profil de séparation identifiable, puis une opération similaire est répétée pour les blocs restants du profil de séparation, et par conséquent les chiffres attenants peuvent être reconnus de
façon précise.
On comprendra que de nombreuses modifications et adaptations de l'invention apparaîtront à l'évidence au spécialiste de la technique et que l'invention est censée
englober de telles modifications et changements évidents.

Claims (4)

REVENDICATIONS
1.Dispositif de reconnaissance de caractères permettant de reconnaître des caractères à partir d'informations concernant un ensemble de caractères devant être détecté moyennant l'utilisation d'une base de connaissances ( 10) comprenant des règles requises pour effectuer cette reconnaissance, et un mécanisme logique ( 40) mettant en oeuvre un raisonnement à partir de la base de connaissances ( 10), caractérisé en ce qu'il comporte des moyens d'extraction de blocs ( 21), servant à extraire un bloc de caractères unique à partir dudit ensemble de caractères devant être reconnu, de manière à affecter des attributs à chaque bloc de caractères; des moyens d'extraction de types d'arrangement de blocs ( 11 C) pour sélectionner, parmi une pluralité de types d'arrangement de blocs prédéterminé, des candidats du type d'arrangement de bloc semblable à l'arrangement du bloc de caractères extrait par lesdits moyens d'extraction de blocs ( 21); des moyens d'affectation d'attributs ( 11 B) servant à affecter un candidat d'attribut de bloc à chacun desdits blocs, sur la base du type d'arrangement de bloc extrait par les moyens d'extraction de type d'arrangement de blocs; et des moyens de vérification ( 11 D,11 E) pour vérifier le candidat de type d'arrangement sur la base du candidat du type d'arrangement
de bloc et du candidat d'attribut de bloc.
2 Dispositif de reconnaissance de caractères selon la revendication 1, caractérisé en ce que lesdits moyens de vérification ( 1 l D,11 E) exécutent la vérification d'une première hypothèse pour affecter et régénérer l'attribut sur la base du type de caractère et la vérification d'une seconde hypothèse sur la base d'un
traitement de segmentation et de l'arrangement global.
3 Dispositif de reconnaissance de caractères, permettant de reconnaître des caractères à partir d'informations concernant un ensemble de caractères devant être détecté moyennant l'utilisation d'une base de connaissances ( 10) contenant des règles requises pour effectuer cette reconnaissance, et un mécanisme logique ( 40) mettant en oeuvre un raisonnement à partir de la base de connaissances ( 10), caractérisé en ce qu'il comprend des moyens d'extraction de caractéristiques de blocs ( 22) pour extraire un bloc unique de caractères à partir de l'ensemble de caractères devant être reconnus et pour extraire des caractéristiques du bloc comme par exemple un facteur de certitude incluant une barre pour chaque bloc; des moyens d'extraction de type d'arrangement de blocs (ll C) pour extraire, parmi une pluralité de types d'arrangements de blocs prédéterminés, des types d'arrangements semblables à l'arrangement du bloc de caractères, en tant que candidats de types d'arrangements de blocs, moyennant l'utilisation des caractéristiques et du bloc et des attributs de bloc extraits par lesdits moyens d'affectation d'attributs de bloc; des moyens d'affectation d'attributs de blocs ( 11 B) servant à affecter des attributs de blocs à chaque bloc de caractères sur la base du type d'arrangement de bloc extrait par lesdits moyens d'extraction de ce type d'arrangement de blocs; des moyens de vérification (ll D,11 E) servant à vérifier le candidat sur la base du candidat du type d'arrangement de bloc et du candidat d'attribut de bloc; des moyens de séparation de barres ( 24) pour extraire le caractère par séparation de la barre à partir du bloc incluant cette barre, conformément à l'attribut de bloc; et des moyens de reconnaissance de segments ( 25) pour séparer les caractères un par un d'un bloc continu de caractères, dont les caractères sont en contact réciproque, en fonction
de l'attribut de bloc, et pour reconnaître le caractère.
4 Dispositif de reconnaissance de caractères selon la revendication 3, caractérisé en ce que lesdits moyens d'extraction de caractéristiques de blocs ( 22) classent le bloc selon plusieurs zones, établissent des nombres de présence d'éléments constitutifs du caractère et calculent le facteur de certitude de la présence d'une barre
pour chaque bloc en fonction des nombres de présence.
Dispositif de reconnaissance de caractères selon la revendication 4, caractérisé en ce que lesdits éléments constitutifs sont des composantes verticales,
horizontales et inclinées.
6 Dispositif de reconnaissance de caractères selon la revendication 3, caractérisé en ce qu'il comporte en outre des sections d'exécution ( 12 B, 12 E) dans ladite base de connaissance ( 10) pour la mise en oeuvre de règles prédéterminées et une mémoire incorporée dans ledit mécanisme logique ( 40) et dans la base de connaissances
( 10).
7 Dispositif de reconnaissance de caractères selon la revendication 6, caractérisé en ce que le caractère
est formé par des chiffres manuscrits.
8 Procédé d'extraction de caractères comprenant les étapes de traitement consistant à détecter une barre à partir de l'information de caractère contenant une barre et séparer ladite barre de manière à extraire des caractères, caractérisé en ce qu'il inclut les étapes consistant à détecter des points d'extrémité à partir de ladite information concernant le caractère, détecter une distance linéaire entre deux points d'extrémité, obtenir un nombre de points raccordant lesdits points d'extrémité, détecter ladite barre sur la base du rapport d'une distance linéaire à une longueur effective de trajet entre deux points d'extrémité quelconques, et séparer la barre ainsi détectée
pour extraire des caractères.
9 Procédé d'extraction de caractères selon la revendication 8, caractérisé en ce qu'il inclut les étapes consistant à répéter l'opération de détection de la distance linéaire, l'opération d'obtention du nombre de points, l'opération de détection de ladite barre, et l'opération de
séparation de la barre détectée pour tous les trajets.
Procédé d'extraction de caractères selon la revendication 9, caractérisé en ce que ledit caractère est
formé par des chiffres manuscrits.
11 Procédé d'extraction de caractères selon la revendication 10, caractérisé en ce qu'il inclut en outre les étapes consistant à fixer par hypothèse une barre des centièmes parmi les trajets, évaluer si il existe ou non un branchement qui est partagé en commun avec un chiffre, supprimer la barre considérée par hypothèse si le branchement n'existe pas, supprimer la barre des centièmes prise par hypothèse hormis pour le branchement partagé à partir du bloc, si la branche existe, et segmenter une
partie formant chiffre.
12 Procédé d'extraction de caractères permettant de détecter une barre contenue dans une information formée de caractères pour reconnaître des caractères dans cette information, caractérisé en ce qu'il inclut les étapes consistant à extraire un bloc constitué par un groupe de caractères attenants parmi ladite information de caractères, à diviser le bloc ainsi extrait en plusieurs zones Zcrj)>(i= O m,j= O n), compter un certain nombre de masques verticaux qui sont des composantes verticales formant les caractères, un certain nombre de masques inclinés qui sont des composantes inclinées, un certain nombre de masques horizontaux qui sont des composantes horizontales pour les différentes zones Z(jj), obtenir un facteur de certitude du bloc contenant une barre pour chaque bloc sur la base du nombre de masques existant dans chaque zone Z(ij), détecter les points d'extrémité du bloc possédant le facteur le plus élevé de certitude de contenir une barre, obtenir une distance linéaire entre les points d'extrémité ainsi détectés et la longueur effective du trajet ou les nombres de points entre les points d'extrémité, et détecter la barre sur la base du rapport de la distance linéaire à la longueur effective du trajet entre les points d'extrémité pour
extraire lesdits caractères.
13 Procédé pour reconnaître des chiffres attenants au moyen d'un prétraitement lors duquel ces chiffres sont factorisés en éléments comme par exemple une boucle constituée par un noeud et une branche, une ligne droite et un arc, caractérisé en ce qu'on segmente un bloc à partir d'une extrémité desdits chiffres attenants, à une distance prédéterminée pour effectuer la reconnaissance, qu'on efface ladite branche dans l'ordre du centre de gravité à partir de l'autre extrémité à l'intérieur dudit bloc et qu'on répète cet effacement jusqu'à ce que la branche située à l'intérieur dudit bloc devienne nulle, qu'on identifie les chiffres à l'intérieur dudit bloc et qu'en outre on segmente de façon analogue le bloc subsistant, non segmenté, pour la reconnaissance, ce qui permet d'obtenir un résultat portant sur plus d'un chiffre identifié. 14 Procédé pour reconnaître des chiffres continus selon la revendication 13, caractérisé en ce que l'information de connexion de la branche lors de la segmentation desdits chiffres attenants en une pluralité de blocs parmi lesdits résultats reconnus des chiffres, en un chiffre supérieur à un, supprime le fait que le résultat
reconnu satisfasse à une règle prédéterminée de rejet.
FR9103617A 1990-03-30 1991-03-26 Dispositif de reconnaissance de caracteres, procede d'extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif. Expired - Fee Related FR2660463B1 (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2084391A JPH0769934B2 (ja) 1990-03-30 1990-03-30 文字抽出方法
JP2093720A JPH03291781A (ja) 1990-04-09 1990-04-09 文字認識装置
JP2258317A JP2988990B2 (ja) 1990-09-27 1990-09-27 連続数字の認識方法

Publications (2)

Publication Number Publication Date
FR2660463A1 true FR2660463A1 (fr) 1991-10-04
FR2660463B1 FR2660463B1 (fr) 1994-04-15

Family

ID=27304535

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9103617A Expired - Fee Related FR2660463B1 (fr) 1990-03-30 1991-03-26 Dispositif de reconnaissance de caracteres, procede d'extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif.

Country Status (4)

Country Link
US (1) US5239592A (fr)
CA (1) CA2037173C (fr)
FR (1) FR2660463B1 (fr)
GB (1) GB2246229A (fr)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2797848B2 (ja) * 1992-08-05 1998-09-17 日本電気株式会社 光学式文字読取装置
US5835625A (en) * 1993-01-29 1998-11-10 International Business Machines Corporation Method and apparatus for optical character recognition utilizing proportional nonpredominant color analysis
US6137908A (en) * 1994-06-29 2000-10-24 Microsoft Corporation Handwriting recognition system simultaneously considering shape and context information
US5675665A (en) * 1994-09-30 1997-10-07 Apple Computer, Inc. System and method for word recognition using size and placement models
US5600732A (en) * 1994-12-08 1997-02-04 Banctec, Inc. Document image analysis method
US5894525A (en) * 1995-12-06 1999-04-13 Ncr Corporation Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
US5825923A (en) * 1996-09-05 1998-10-20 Faxtrieve, Inc. Method for performing character recognition on a pixel matrix
JP4412762B2 (ja) * 1999-05-31 2010-02-10 富士通株式会社 点線抽出方法、その装置及びその記録媒体
SE0202446D0 (sv) * 2002-08-16 2002-08-16 Decuma Ab Ideon Res Park Presenting recognised handwritten symbols
DE102005009043A1 (de) * 2005-02-22 2006-08-31 Dr. Johannes Heidenhain Gmbh Abtasteinheit für eine Positionsmesseinrichtung
KR101585842B1 (ko) * 2015-10-05 2016-01-15 주식회사 시큐브 세그먼트 블록 기반 수기서명 인증 시스템 및 방법
CN113837305B (zh) * 2021-09-29 2022-09-23 北京百度网讯科技有限公司 目标检测及模型训练方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition
WO1988002157A1 (fr) * 1986-09-19 1988-03-24 Arthur Wheeler Holt Procede et machine de reconnaissance de caracteres et de formes
GB2218839A (en) * 1988-05-19 1989-11-22 Sony Corp Character recognition system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3613080A (en) * 1968-11-08 1971-10-12 Scan Data Corp Character recognition system utilizing feature extraction
JPS57101986A (en) * 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
JPS57105088A (en) * 1980-12-22 1982-06-30 Toshiba Corp Character reader
JPS5985530A (ja) * 1982-10-11 1984-05-17 Fujitsu Ltd カード・イメージ処理機能を有するデータ処理装置
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
US4817166A (en) * 1986-05-05 1989-03-28 Perceptics Corporation Apparatus for reading a license plate
JP2667435B2 (ja) * 1987-05-01 1997-10-27 株式会社リコー 領域抽出方法
JP2619429B2 (ja) * 1987-11-05 1997-06-11 グローリー工業株式会社 接触文字の分離方法
US5040226A (en) * 1988-05-31 1991-08-13 Trw Financial Systems, Inc. Courtesy amount read and transaction balancing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition
WO1988002157A1 (fr) * 1986-09-19 1988-03-24 Arthur Wheeler Holt Procede et machine de reconnaissance de caracteres et de formes
GB2218839A (en) * 1988-05-19 1989-11-22 Sony Corp Character recognition system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IBM TECHNICAL DISCLOSURE BULLETIN vol. 15, no. 5, Octobre 1972, NEW YORK US page 1488 K. KERCHMAR 'Fraction detection logic' *

Also Published As

Publication number Publication date
FR2660463B1 (fr) 1994-04-15
GB2246229A (en) 1992-01-22
US5239592A (en) 1993-08-24
CA2037173A1 (fr) 1991-10-01
GB9104799D0 (en) 1991-04-17
CA2037173C (fr) 1996-01-09

Similar Documents

Publication Publication Date Title
CN105574513B (zh) 文字检测方法和装置
CN104573688B (zh) 基于深度学习的移动平台烟草激光码智能识别方法及装置
FR2660463A1 (fr) Dispositif de reconnaissance de caracteres, procede d&#39;extraction de caracteres et procede de reconnaissance de chiffres successifs utilisant un tel dispositif.
WO2014173012A1 (fr) Procédé et système de détection de dépôt de cendre dans un module de reconnaissance de papier financier
WO2008065113A1 (fr) Procede de designation d&#39;un objet dans une image
CN113095307B (zh) 一种财务凭证信息自动识别方法
US11823521B2 (en) Image processing method for an identity document
CN108573244B (zh) 一种车辆检测方法、装置及系统
EP1835444B1 (fr) Méthode pour fusionner des OCR postaux exploitant des fonctions de croyance
EP0274944B1 (fr) Procédé et dispositif de reconnaissance de caractères
CN109784384B (zh) 一种自动辨别商标真伪的方法及装置
CN112651417A (zh) 车牌识别方法、装置、设备及存储介质
KR102094234B1 (ko) 지폐 일련번호 인식 장치 및 방법
CN111612749B (zh) 基于肺部影像的病灶检测方法和装置
CN114511788A (zh) 一种坡体裂缝识别方法、系统、设备以及存储介质
CN111680691B (zh) 文字检测方法、装置、电子设备和计算机可读存储介质
EP0587484A1 (fr) Dispositif d&#39;analyse de supports d&#39;informations de bulletins de jeu
CN116092230B (zh) 一种票证鉴伪方法及系统
FR3109831A1 (fr) Procédé pour la vérification d’un code-barre.
US11615634B2 (en) Character recognition of license plate under complex background
CN105405204A (zh) 验钞机的纸币冠字号识别方法
Gunawardhana et al. Segmentation and identification of presence of sinhala characters in facebook images
Bogahawatte et al. Online Digital Cheque Clearance and Verification System using Block Chain
Ganschow et al. Classification of tree species on the basis of tree bark texture
Rai et al. Beyond ocrs for document blur estimation

Legal Events

Date Code Title Description
ST Notification of lapse