FR2631723A1 - Procede et dispositif de reconnaissance de caracteres - Google Patents

Procede et dispositif de reconnaissance de caracteres Download PDF

Info

Publication number
FR2631723A1
FR2631723A1 FR8906608A FR8906608A FR2631723A1 FR 2631723 A1 FR2631723 A1 FR 2631723A1 FR 8906608 A FR8906608 A FR 8906608A FR 8906608 A FR8906608 A FR 8906608A FR 2631723 A1 FR2631723 A1 FR 2631723A1
Authority
FR
France
Prior art keywords
character
discontinuous
rectangular area
characters
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8906608A
Other languages
English (en)
Other versions
FR2631723B1 (fr
Inventor
Abe Keiko
Keiko Abe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of FR2631723A1 publication Critical patent/FR2631723A1/fr
Application granted granted Critical
Publication of FR2631723B1 publication Critical patent/FR2631723B1/fr
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

L'invention propose un dispositif et un procédé de reconnaissance de caractères, qui offrent une précision améliorée pour la solidarisation des caractères discontinus. Le dispositif 1 est en mesure de reconnaître 6 une composante d'un quelconque caractère discontinu sur la base du rapport hauteur-largeur et de la position d'extraction verticale d'une aire rectangulaire formée à partir d'un signal de ligne de caractères délivré 2 au dispositif. La décision de rendre solidaires des aires rectangulaires ou des aires de caractère est prise en fonction du pas de caractère moyen de caractères carrés ou de cadratin.

Description

La présente invention concerne un procédé et un disposi-
tif de reconnaissance de caractères et, plus spécialement, un pro-
cédé et un dispositif de reconnaissance de caractères à l'aide
desquels on peut extraire efficacement une aire de caractère.
Un probLème particulier qui se pose par exemple pour les caractères japonais comprenant les caractères idéographiques
"kanji" et les.caractères syllabiques "kana" est de pouvoir distin-
guer avec exactitude des caractères isolés pour reconnaître des caractères particuliers dans des lignes de caractères écrites
horizontalement ou verticalement.
Un exemple constituant une approche de ce problème est décrit par exemple dans la demande de brevet français portant le
numéro de publication 2 588 104, o on forme des aires rectangu-
laires imaginaires à partir de données de projection tirées d'une ligne de caractères horizontale ou verticale de façon que chacune
d'elles puisse entourer un unique caractère complet ou une compo-
sante d'un caractère, et on rend solidaires des aires adjacentes prises parmi ces aires rectangulaires jusqu'à ce que le rapport hauteur-largeur de chacune des aires ainsi rendues solidaires devienne sensiblement égale à l'unité, si bien qu'on extrait alors
des caractères discontinus particuliers.
Relativement à cela, on notera que la plupart des carac-
-tères japonais se présentant sous la forme de caractères de cadra-
tin présentent, lorsqu'ils sont chacun entourés par un cadre
rectangulaire, un rapport hauteur-largeur sensiblement égal à 1.
Dans le cas de caractères discontinus tels que '"t)"' et "ô " o les composantes de caractère constituant un caractère entier sont horizontalement déconnectées et séparées les unes des autres, on considère que, si deux composantes de caractère adjacentes, ou plus, sont rendues solidaires de façon que l'aire rectangulaire qui entoure les composantes de caractère puisse avoir un rapport hauteur-largeur sensiblement égal à 1, on peut alors les extraire
comme formant un unique caractère discontinu.
Toutefois, en pratique, si l'on examine le rapport hauteur-largeur de cette aire rectangulaire de manière stricte du
point de vue des caractères discontinus obtenus par la solidarisa-
263 1 723
tion, iL se peut que les rapports hauteur-largeur ne soient pas uniformes pour tous Les caractères discontinus. Ainsi, Le procédé ci-dessus décrit ne donne pas satisfaction en pratique en ce qui
concerne La précision de l'extraction des caractères discontinus.
C'est un but de l'invention de produire un nouveau pro-
cédé et un nouveau dispositif de reconnaissance de caractères qui éliminent les inconvénients des procédés et dispositifs classiques
tels que ci-dessus décrit.
Un autre but de l'invention est de produire un procédé et un dispositif de reconnaissance de caractères offrant une meilleure
précision pour la soLidarisat.ion descaractères discontinus.
Pour atteindre ces buts, selon un premier aspect de l'invention, il est proposé un procédé permettant de reconnaître un caractère en fonction d'une information de caractère extraite d'un signal de ligne de caractères à l'aide d'une aire rectangulaire que l'on forme à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère discontinu, lequel procédé comprend l'opération consistant à décider qu'une aire rectangulaire est une composante d'un caractère discontinu sur la base du rapport hauteur-largeur et de la position d'extraction
verticale de l'aire rectangulaire.
Selon un autre aspect de l'invention, il est proposé un procédé permettant de reconnaître un caractère en fonction d'une
information de caractère extraite d'un signal de ligne de carac-
tères à l'aide d'une aire rectangulaire que l'on forme à partir du signal de ligne de caractères et qui entoure un caractère compLet
ou une composante d'un caractère discontinu, lequel procédé com-
prend les opérations consistant à décider qu'une aire de caractère est une composante d'un. caractère discontinu sur la base du rapport hauteurlargeur et de la position d'extraction verticale de l'aire de caractère, à décider, lorsqu'il a été décidé que la première aire rectangulaire est une composante d'un caractère discontinu,
qu'une deuxième aire de caractère adjacente est une autre compo-
sante du caractère discontinu, à rendre solidaire la deuxième aire de caractère avec la première aire de caractère à la condition que le pas de caractère des aires de caractère rendues solidaires ne
dépasse pas un pas de caractère moyen, et à déterminer que l'infor-
mation de caractère extraite des première et deuxième aires de
caractère rendues solidaires est l'information de caractère des.
composantes du caractère discontinu.
Selon un autre aspect de l'invention, il est proposé un
dispositif de reconnaissance de caractères qui reconnaît un carac-
tère en fonction d'une information de caractère extraite d'un signal de ligne de caractères à l'aide d'une aire rectangulaire que l'on forme à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère discontinu, lequel dispositif comprend un moyen permettant de décider qu'une aire rectangulaire est une composante d'un caractère discontinu sur la base du rapport hauteurlargeur et de la position d'extraction
verticale de l'aire rectangulaire.
Selon un autre aspect de l'invention, il est proposé un
dispositif de reconnaissance de caractères qui reconnaît un carac-
tère en fonction de l'information de caractère extraite d'un signal de ligne de caractères à l'aide d'une aire rectangulaire que l'on forme à partir du signal de ligne de caractères et qui entoure un caractère complet ou une com posante d'un caractère discontinu, lequel dispositif comprend un moyen permettant de décider qu'une aire rectangulaire est une composante d'un caractère discontinu sur la base du rapport hauteurlargeur et de la position d'extraction verticale de l'aire rectangulaire, un moyen permettant de décider, lorsqu'il a été décidé que la première aire rectangulaire est une composante d'un caractère discontinu, qu'une deuxième aire de
caractère adjacente est une autre composante du caractère discon-
tinu, un moyen permettant de rendre solidaire la deuxième aire de caractère avec la première aire de caractère à la condition que le pas de caractère des aires de caractère rendues solidaires ne
dépasse pas un pas de caractère moyen, et un moyen servant à déter-
miner que l'information de caractère extraite des première et deuxième aires de caractère rendues solidaires est l'information de
caractère des composantes du caractère discontinu.
Avec le procédé et le dispositif de reconnaissance de caractères selon l'invention, on peut déterminer une composante
263 1723
d'un caractère discontinu quelconque sur La base du rapport hauteurLargeur et de La position d'extraction verticale de l'aire rectanguLaire. Par conséquent, la précision d'extraction d'un
caractère discontinu est améliorée.
En outre, lorsque des décisions relatives à des aires rectangulaires ou à des aires de caractère à rendre solidaires sont prises sur la base du pas de caractère moyen de caractères carrés
ou de caractères de cadratin, la précision d'extraction d'un carac-
tère discontinu quelconque est alors améliorée dans une plus grande
mesure.
IL est en outre possible d'accéLérer le fonctionnement
avec le procédé et le dispositif de reconnaissance de caractères.
La description suivante, conçue à titre d'illustration,
vise à donner une meilleure compréhension de ses caractéristiques et avantages; elle s'appuie sur les dessins annexés, parmi lesquels: la figure 1 est un schéma de principe d'un dispositif de reconnaissance de caractères représentant un mode de réalisation préféré de l'invention;
la figure 2 est un schéma simplifié illustrant l'extrac-
tion d'une ligne de caractères;
les figures 3, 4A, 4B, 4C et 5 sont des schémas simpli-
fiés illustrant l'extraction de caractères; la figure 6 est un organigramme montrant le déroulement d'un processus d'extraction effectué à l'aide du dispositif de reconnaissance de caractères représenté sur la figure 1; et les figures 7, 8A, 8B et 8C sont des schémas simplifiés
illustrant le processus de solidarisation d'un caractère discon-
tinu. On se reporte d'abord à la figure 1, qui représente un dispositif 1 de reconnaissance de caractères qui est raccordé à un lecteur 2 d'image de document et qui reçoit un signal d'image S1
produit par le lecteur de document 2. Le dispositif de reconnais-
sance de caractères 1 comporte une section de prétraitement com-
prennant un moyen 3 d'élimination de bruit et un moyen 4 de correc-
tion de rotation, une section de traitement d'aire de caractère
263 1 723
comportant un moyen 5 d'extraction de ligne de caractères et un
moyen 6 d'extraction de caractère, et un dispositif 7 de détermina-
tion de caractère. Le moyen 3 d'élimination de bruit reçoit Le signal d'image d'entrée S1 du lecteur d'image de document 2 et élimine du signal d'image d'entrée S1 les images parasites telles que des points isolés apparaissant dans l'image de document lue par le lecteur d'image de document 2, de façon qu'on puisse empêcher que des points isolés ou des éléments analogues soient reconnus erronément comme faisant partie d'un caractère ou de plusieurs caractères. Le moyen 3 d'éLimination de bruit déLivre donc un signal d'image S2 dépourvu de bruit au moyen 4 de correction de rotation. Dès réception de ce signal d'image dépourvu de bruit S2, le moyen 4 de correction de rotation corrige la rotation dans le plan du document lu et délivre un signal d'image corrigé S3 au
moyen 5 d'extraction de ligne de caractères.
Le moyen 5 d'extraction de ligne de caractères sépare le document imprimé en une aire de caractères et d'autres aires (par exemple photographies, dessins, etc.), puis extrait les seules données de caractères d'image qui sont incluses dans l'aire de caractères. Ensuite, le moyen 5 d'extraction de ligne de caractères confirme que les lignes de caractères incluses dans l'aire de caractères sont des lignes disposées latéralement les unes par rapport aux autres, extrait les lignes de caractères et délivre un
signal S4 représentatif des lignes de caractères.
Le moyen 6 d'extraction de caractère reçoit le signal de ligne de caractères S4 de la part du moyen 5 d'extraction de ligne de caractères et extrait du signal de ligne de caractères S4 les caractères ordinaires non discontinus et les caractères spéciaux se présentant sous la forme de caractères de cadratin, tandis qu'il extrait également des caractères discontinus en faisant usage d'une technique de solidarisation voulue. Le moyen 6 d'extraction de caractère délivre les données des caractères ainsi extraits au dispositif 7 de détermination de caractère au titre de donnée de
caractère d'entrée S5.
263 1 723
Le dispositif 7 de détermination de caractère possède un dictionnaire de caractères normalisés se rapportant à l'ensemble des caractères destinés à être distingués et il sélectionne un caractère normalisé possédant des particularités presque identiques à celles de la donnée de caractère d'entrée S5. Le dispositif 7 de détermination de caractère délivre donc la donnée S6 du caractère
ainsi reconnu comme signal de sortie du dispositif 1 de reconnais-
sance de caractères.
L'extraction des lignes de caractères par le moyen 5 d'extraction de ligne de caractères est effectuée de la manière suivante. Comme on peut le voir sur la figure 2, o la position de
chaque point d'une aire de caractères AR est représentée en coor-
donnés x-y, l'axe x s'étendant suivant la direction horizontale et l'axe y suivant la direction verticale, les sommes de points ayant le niveau logique "1', qui sont sous la forme de points constituant des caractères noirs, se trouvant dans l'aire de caractères AR sont
faites suivant des directions parallèles à l'axe x et sont pro-
jetées sur l'axe y de manière à produire un signal de projection suivant y, soit Sy, qui sera ci-après appelé la projection y. Le niveau de signal du signal de projection y, Sy, est "0 pour toute position se trouvant entre des lignes adjacentes de caractères AR1, AR2, etc., puisqu'il n'y a pas de parties à caractères noirs. Au contraire, en toute position de l'axe y qui correspond aux lignes de caractères AR1, AR2, etc., le niveau de signal correspond au nombre total de points se trouvant sur la ligne qui passe par l'ordonnée de l'axe y et qui est parallèle à l'axe x. Alors, on compare le signal de projection y, Sy, avec un niveau de seuil prédéterminé de manière à produire une donnée d'extraction de ligne de caractères CL présentant le niveau logique '1"' en toute région o le niveau du signal Sy est supérieur
au niveau de seuil.
A l'aide de cette donnée d'extraction de ligne de carac-
tères CL, le moyen 5 d'extraction de ligne de caractères extrait les parties du signal d'image corrigé S3 délivré par le moyen de
"-- 2631723
correction de rotation 4 qui correspondent aux moments o la donnée d'extraction de Ligne de caractères CL présente le niveau logique "H". Le moyen d'extraction de ligne de caractères 5 délivre ainsi les parties de signal extraites sous la forme d'un signal de ligne de caractères S4 indicatif des lignes de caractères AR1, AR2, etc.
respectives isolées.
Ainsi, toute région dans laquelle la donnée d'extraction de ligne de caractères CL présente le niveau logique "1" possède une hauteur maximale HL (HL1, HL2,...) pour la ligne de caractères ART, AR2,..., et toute position verticale suivant la direction de
l'axe y d'un caractère inclus dans une quelconque ligne de carac-
tères se trouve dans les limites de la hauteur maximale HL de la
ligne de caractères considérée.
Le moyen 6 d'extraction de caractère reçoit le signal de
ligne de caractères S4 et effectue un traitement tel qu'il déter-
mine, par rapport à la direction de l'axe x ainsi qu'à celle de
l'axe y les positions et les étendues o des caractères et des com-
posantes de caractères discontinus existent dans les lignes respec-
tives de caractères AR1, AR2, etc., afin d'extraire chacune des positions et des étendues, constituant une aire rectangulaire CHR entourée par un cadre circonscrit CADR qui entoure un caractère complet ou une composante d'un caractère, comme représenté sur la
figure 3.
En pratique, ce processus d'extraction est effectué de manière qu'une projection x soit effectuée suivant la direction de l'axe y correspondant à la direction de la hauteur du caractère et qu'une projection y soit effectuée suivant la direction de l'axe x correspondant à la direction de la largeur du caractère, afin d'obtenir un signal de projection x, soit Sx, et un signal
de projection y, soit Sy, après quoi les signaux de pro-
jection x et y, Sx et Sy, sont comparés avec des niveaux
de seuil prédéterminés en vue de la détermination des posi-
tions des cadres circonscrits CADR suivant les directions des axes
x et y.
Lorsque les caractères japonais sont ainsi extraits par le processus cidessus décrit, dans lequel ils sont.triés sur la
263 1 723
base du rapport hauteur-largeur h/w, trois types différents d'aires rectangulaires CHR (à savoir CHRH, CHR8 et CHRT) sont obtenus, comme cela est représenté respectivement sur les figures 4A, 4B et 4C. La première aire rectangulaire CHRH présente un rapport hauteur-largeur hH/WH sensiblement égal à 1, comme indiqué par H H l'expression suivante: h (1) WHj.....(1 W
Cette aire rectangulaire CHRH est donnée par les caractères ordi-
naires du type carré non discontinu ou du type caractère de cadra-
tin, lesquels ne possèdent pas de discontinuité comme les carac-
tères discontinus et ne comportent pas de particularité fixe spéciale
en ce qui concerne leur taille et leur forme. Ces caractères ordi-
naires seront ci-après appelés les caractères ordinaires non discontinus, et la plupart des caractères japonais appartiennent à
cette catégorie des caractères ordinaires non discontinus.
L'aire rectangulaire CHRB forme une composante d'un caractère discontinu et présente un rapport hauteur-largeur h B/wB supérieur à 1, comme donné par l'expression suivante: h..(2) > 1 wB Cette aire rectangulaire CHRB est donnée par des composantes de caractères discontinus et des caractères spéciaux verticalement allongés et elle présente une tendance à ce que sa position suivant la direction de la hauteur du caractère se trouve sensiblement au
centre par rapport à la hauteur maximale HL.
La troisième aire rectangulaire CHRT ne possède aucun particularité fixe spéciale dans son rapport hauteur-largeur hT/wT, mais la hauteur hT et la largeur wT de celle-ci sont relativement
petites et sa position suivant la direction de la hauteur du carac-
tèr. ne se trouve pas au centre vertical relativement à la hauteur maximale HL. Certains caractères spéciaux tels que ".,," ,
etc. appartiennent au troisième type.
En réalité, les aires rectangulaires CHR (figure 3) obtenues par une opération d'extraction de caractère effectuée sur
263 1723
chacune des lignes de caractères AR1, AR2, etc. présentent une distribution aléatoire dans les limites de la hauteur maximale HL de la ligne de caractères considérée. En particulier, des aires rectangulaires CHRH de caractères ordinaires non discontinus, des aires rectangulaires CHRB de certains caractères spéciaux ou de composantes de caractères discontinus, et des aires rectangulaires CHRT de caractères spéciaux peuvent être disposées successivement au hasard suivant la direction de l'axe x dans chaque ligne de caractères.
Le moyen 6 d'extraction de caractère effectue les dis-
tinctions voulues entre les types de caractères normaux et de caractères spéciaux dans la distribution d'aires rectangulaires CHR
obtenue pour une ligne. Ensuite, s'il existe un caractère discon-
tinu, le pas de caractère moyen P qui est donné par l'équation suivante: n P = 1 v - Pi..... (3) n = 1
est utilisé pour permettre d'extraire avec exactitude ce caractère.
Comme représenté sur la figure 5, les pas... P Pi' Pi+... à partir desquels Le pas de caractère moyen P doit être calcuLé sont fournis par Les pas des caractères carrés pour lesquels Le rapport hauteur-largeur h/w est sensiblement égal à 1 comme dans un caractère ordinaire non discontinu (h H/wH = 1). Dans
le même temps, les autres pas des caractères spéciaux et des compo-
santes de caractères discontinus, pour lesquels le rapport hauteur-
largeur h/w n'est pas sensiblement égal à 1 (hB/WBe1 et hT/WTl1) ou
bien des caractères spéciaux pour lesquels le rapport hauteur-
largeur hT/WT est sensiblement égal à 1, mais la taille est petite, sont exclus du calcul du pas de caractère moyen P selon
l'équation (3) ci-dessus.
Ceci est destiné à permettre l'exécution d'un processus de solidarisation convenable pour un caractère discontinu, de manière que le pas du caractère discontinu obtenu en résultat du
processus de solidarisation soit sensiblement égal au pas de carac-
tère moyen des caractères carrés ou de cadratin.
Il faut noter que, dans Le cas o L'espace d séparant des
rectangles adjacents est plus petit qu'une valeur de seuil prédé-
terminée,' ces rectangles sont alors traités comme des rectangles associés à un unique caractère carré par un processus d'annulation
de barbouillage.
Dans le cas du présent mode de réalisation, lorsque le processus de solidarisation de la première ligne de caractères AR1 de l'aire de caractères AR (figure 2) est appliqué, le moyen 6 d'extraction de caractère adopte la hauteur maximale HL1 de la première ligne de caractères comme pas de caractère moyen P tel que donné par l'équation (3) ci-dessus. Ensuite, pour le traitement de l'une quelconque des lignes de caractères suivantes, le moyen 6 d'extraction de caractère exécute le calcul-de l'équation (3) en utilisant le pas Pi des caractères carrés de la ligne de caractères précédente pour trouver le pas de caractère moyen P. L'opération ci-dessus repose sur le fait que, en ce qui concerne la première ligne de caractères, il est impossible
d'obtenir par le calcul un pas de caractère moyen.
Le moyen 6 d'extraction de caractère exécute un programme de traitement d'extraction RTO tel que présenté sur la figure 6 pour extraire des caractères de chacune des lignes de caractères
AR1, AR2, etc. Une fois lancé le programme de traitement d'extrac-
tion RTO, le moyen d'extraction de caractère 6 exécute un traite-
ment d'extraction de carré de base pour chacune des lignes de caractères AR1, AR2, etc. au cours de l'étape SP1 afin de produire une ligne de rectangles tels que ceux représentés sur les figures 4A, 4B et 4C, o des aires rectangulaires CHR sont disposées séquentiellement dans la direction de l'axe x de manière à laisser entre elles des espaces rectangulaires d, comme représenté sur la figure 3. Apres cela, le moyen d'extraction de caractère 6 exécute le processus de solidarisation tel que représenté sur les figures 7 et 8A, 8C successivement pour les première, deuxième, et autres
aires rectangulaires CHR constituant la ligne de rectangles consi-
dérée. En particulier, à l'étape SP2, le moyen d'extraction de caractère 6 décide si le rapport hauteur-largeur h/w d'une aire
rectangulaire CHR, à savoir, dans ce cas, la première aire rectan-
guLaire de la ligne de rectangles considérée, est ou non supérieur à 1. Lorsque le résultat est négatif, ceci signifie que l'aire CHR considérée appartient à un caractère qui possède un rapport hauteur-largeur h/w sensiblement égal à 1, c'est-à-dire qui est un caractère carré non discontinu ou un caractère spécial de petite taille. Dans ce cas, le moyen d'extraction de caractère 6 met fin au programme de traitement d'extraction au cours de l'étape SP3 et délivre la donnée de caractère de l'aire rectangulaire ainsi traitée CHR comme donnée de caractère d'entrée S5 au dispositif 7
de détermination de caractère.
Au contraire, si le résultat obtenu à l'étape SP2 est affirmatif, ceci signifie que le rapport hauteur-largeur h/w de l'aire rectangulaire CHR est supérieur à 1 et que, par conséquent, l'aire CHR peut éventuellement être une composante d'un caractère
discontinu, comme décrit ci-dessus en relation avec l'équation (2).
Dans ce cas, le moyen d'extraction de caractère 6 passe à l'étape SP4 et décide si la position verticale de l'aire rectangulaire
extraite CHR se trouve ou non au centre.
L'étape SP4 permet de déterminer si une aire rectangu-
laire CHR considérée appartient à un caractère discontinu ou à un caractère spécial et, lorsque le résultat est négatif, ceci signifie que l'aire rectangulaire CHR se trouve au-dessus ou au dessous d'une ligne centrale LCTR passant par la position centrale de la hauteur maximale HL de la ligne de caractères considérée, comme on peut le voir pour l'aire rectangulaire CHRxi ou CHRX2 sur
la figure 7.
Cette condition est satisfaite non par un caractère dis-
continu, mais par un caractère spécial tel que ")", "." "
Lorsque la condition est satisfaite, le moyen d'extrac-
tion de caractère 6 passe à l'étape SP3 afin de mettre fin au programme de traitement et délivre la donnée de caractère de l'aire rectangulaire traitée CHR comme donnée de..caractère d'entrée S5 au
dispositif de détermination de caractère 7.
Au contraire, si le résultat de l'étape SP4 est affirma-
tif, ceci signifie que l'aire rectangulaire CHR se trouve à cheval
263 1 723
sur La Ligne centraLe LCTR, comme on peut Le voir pour L'aire
rectanguLaire CHRx3 sur La figure 7.
Ce caractère est considéré comme une composante d'un caractère discontinu et, dans ce cas, le moyen d'extraction de
caractère 6 passe à l'étape SP5.
De cette manière, le moyen d'extraction de caractère 6
est en mesure de distinguer avec exactitude, de tout autre carac-
tère spécial, la composante d'un caractère discontinu. L'organi-
gramme passe alors à l'étape SP5.
A l'étape SP5, une décision est prise quant au fait que le rapport hauteur-largeur d'une aire rectangulaire immédiatement adjacente à L'aire rectangulaire CHR est ou non supérieur à 1. Dans
Le cas o,le résultat est négatif, ceci signifie que l'aire rectan-
gulaire, par exemple l'aire rectangulaire CHR11 indiquée sur la figure 8A, est suivie d'une aire rectangulaire dont le rapport hauteur-largeur h/w est sensiblement égal à 1, telle que L'aire
rectangulaire CHR12 indiquée sur la figure 8A.
Dans ce cas, l'aire rectangulaire suivante CHR12 ne satisfait pas la condition appropriée à une composante de caractère discontinu, et ceci signifie que l'aire rectangulaire CHR11 qui
satisfait la condition voulue pour une composante de caractère dis-
continu est suivie par une aire rectangulaire CHR12 qui ne peut pas
être solidarisée avec l'aire de caractère précédente CHR11.
Par conséquent, le moyen d'extraction de caractère 6 met fin au programme de traitement au cours de l'étape SP3 et délivre
la donnée de caractère d'entrée S5 indicative de l'aire rectangu-
laire CHR11 au dispositif de détermination de caractère 7.
Au contraire, si le résultat de la prise de décision ci-
dessus mentionnée de l'étape SP5 est affirmatif, ceci signifie qu'une aire rectangulaire telle que l'aire rectangulaire CHR22 ou CHR24 de la figure 8B faisant suite à une autre aire rectangulaire telle que l'aire rectangulaire CHR21 ou CHR23 de la figure 8B satisfait à la condition voulue pour une composante de caractère discontinu. Le moyen d'extraction de caractère 6 passe alors à
l'étape SP6.
263 1 723
A L'étape SP6, une décision est prise quant au fait que La position d'extraction de L'aire rectanguLaire immédiatement adjacente se trouve ou non au centre. Ceci est la confirmation d'une deuxième condition selon laquelle l'aire rectanguLaire
suivante forme une composante d'un caractère discontinu.
Si le résultat est négatif à l'étape SP6, ceci signifie
que l'aire rectangulaire immédiatement adjacente n'est pas à cali-
fourchon sur la ligne centrale LCTR, comme décrit ci-dessus en
relation avec la figure 7, et que, par conséquent, l'aire rectangu-
laire considérée appartient à un caractère spécial et non pas à une composante d'un caractère discontinu quelconque. Dans cet exemple, Le moyen d'extraction de caractère 6 passe alors à l'étape SP3-pour mettre fin au programme de traitement et délivre la donnée de
caractère indicative de l'aire rectangulaire CHR21 ou CHR23 actuel-
lement en cours d'extraction dans le cas de la figure 8B comme information de caractère d'entrée S5 au dispositif de détermination
de caractère 7. Au contraire, si le résultat obtenu à l'étape SP6 est affirmatif, ceci
signifie que la position d'extraction de l'aire rectangulaire suivante est à califourchon sur la ligne centrale LCTR, comme mentionné ci-dessus en relation avec la figure 7, et que, par conséquent, l'aire rectangulaire immédiatement adjacente
satisfait la deuxième condition relative à une composante de carac-
tère discontinu. Par exemple, dans le cas de la figure 8B, l'aire rectangulaire suivante CHR22 ou CHR24 qui est voisine de l'aire rectangulaire CHR21 ou CHR23 en cours de traitement satisfait également la deuxième condition voulue pour une composante de
caractère discontinu.
Dans ce cas, le moyen d'extraction de caractère 6 passe à l'étape SP7, o il est décidé si l'aire rectangulaire solidarisé avec l'aire rectanguLaire suivante présente ou non un pas inférieur ou égal au pas de caractère moyen. Ceci est la confirmation d'une troisième condition, selon laquelle l'aire rectangulaire qui est
maintenant en cours de traitement forme une composante d'un carac-
tère discontinu.
263 1723
Dans le cas o le résultat est négatif, ceci signifie que Le caractère discontinu formé en résultat de la soLidarisation de L'aire rectangulaire avec l'aire rectangulaire suivante aurait un pas supérieur au pas de caractère moyen. Ceci signifie que le
caractère solidarisé ne pourrait pas du tout satisfaire ultérieure-
ment la condition finale voulue pour un caractère discontinu.
Comme décrit ci-dessus en relation avec l'équation (3), le pas de caractère moyen P est calculé sur la base des-caractères carrés ou de cadratin contenus dans la ligne précédent la ligne qui comporte l'aire rectangulaire en cours de traitement. Toutefois, en pratique, un caractère dont le pas est supérieur à celui d'un caractère carré ou de cadratin ne se trouve pas dans un document imprimé. Ainsi, il faut interdire une solidarisation d'aires de caractère qui produirait un pas de caractère supérieur au pas de caractère moyen P. Lorsque le résultat de la prise de décision de l'étape SP7 est négatif de la manière ainsi indiquée, Le moyen d'extraction de caractère 6 passe à l'étape SP3 pour mettre fin au programme de traitement et déLivre au dispositif de détermination de caractère 7 La donnée de caractère d'entrée S5, ce qui indique le fait que
l'aire rectangulaire en cours de traitement appartient à un carac-
tère indépendant et n'est pas une composante d'un caractère discon-
tinu quelconque.
Au contraire, si le résultat obtenu à l'étape SP7 est affirmatif, ceci signifie que les aires de caractère solidarisées satisfont la troisième condition relative à-la composante d'un caractère discontinu. Alors, le moyen d'extraction de caractère 6 passe à l'étape SP8 afin d'exécuter réellement le processus de solidarisation de l'aire rectangulaire avec l'aire rectangulaire
suivante, puis il revient à l'étape SP5 ci-dessus mentionnée.
A l'étape SP8, Le moyen d'extraction de caractère 6 rend
solidaires, dans le cas de la figure 8B par exemple, l'aire rectan-
gulaire CHR21 ou CHR23 en cours de traitement avec l'aire de carac-
tère suivante CHR22 ou CHR24 sur la base du fait qu'un caractère
discontinu qui peut être formé par solidarisation de l'aire rectarin-
gulaire CHR21 ou CHR23 en cours de traitement avec l'aire rectangu-
Laire suivante CHR22 ou CHR24 aurait un pas de caractère plus petit que le pas de caractère moyen P. Après cela, le moyen d'extraction de caractère 6 exécute les décisions ci-dessus mentionnées au cours des étapes SP5, SP6 et SP7 relativement à une aire rectangulaire suivante adjacente à l'aire rectangulaire solidarisée, et, lorsque les résultats obtenus
lors de ces étapes sont tous affirmatifs, le traitement d'intégra-
tion est exécuté de nouveau à l'étape SP8. Au contraire, si l'un des résultats obtenus est négatif, le programme de traitement d'extraction prend fin à l'étape SP3, et la donnée de caractère discontinu composée de deux aires rectangutaires solidarisées, ou
plus, est délivréecomme donnée de caractère d'entrée S5 au disposi-
tif de détermination de caractère 7.
De cette manière, si le moyen d'extraction de caractère 6 rend solidaires entre elles les aires de caractère CHR21 et CHR22 de la figure 8B, un résultat affirmatif est obtenu à chacune des étapes SP5 et SP6 en ce qui concerne l'aire rectangulaire suivante CHR23. Toutefois, si t'aire rectangulaire suivante CHR23 est
solidarisée avec les autres, alors le pas de caractère résultant sera supé-
rieur au pas de caractère moyen P. Par conséquent, un résultat
* négatif sera obtenu à l'étape SP7.
Ceci signifie que les aires rectangulaires CHR21 et CHR22 représentées sur la figure 8B ne peuvent pas être solidarisées avec l'aire rectangulaire suivante CHR23. Dans ce cas, la donnée de
caractère discontinu obtenue par solidarisation des aires rectangu-
Laires CHR21 et CHR22 est délivré comme donnée de caractère d'entrée S5 au dispositif de détermination de caractère 7 par le
moyen d'extraction de caractère 6.
Au contraire, dans le cas o le moyen d'extraction de caractère 6 revient à L'étape SP5 après l'intégration de l'aire rectangulaire CHR24 avec l'aire CHR23 de la figure 8B, une décision
est prise à l'étape SP5 en ce qui concerne le rapport hauteur-
largeur de l'aire rectangulaire suivante CHR25. Dans le cas parti-
culier représenté, le rapport hauteur-largeur de l'aire rectangu-
taire CHR25 est sensiblement égal à 1, si bien que le moyen d'extraction de caractère 6 obtient un résultat négatif-à l'étape SP5. Dans ce cas, le moyen d'extraction de caractère 6 passe à l'étape SP3 sans exécuter un traitement de solidarisation sur l'aire
rectanguLaire CHR25 et délivre donc la donnée de caractère discon-
tinu des aires rectangulaires CHR23 et CHR24 comme donnée de carac-
tère d'entrée S5 au dispositif de détermination de caractère 7.
Au contraire, lorsque le moyen d'extraction de caractère 6 revient à l'étape SP5 après les solidarisations successives
d'aires rectangulaires CHR31 et CHR32 et d'autres aires rectangu-
laires CHR33 et CHR34, comme indiqué sur la figure 8C, il est obtenu un résultat affirmatif à chacune des étapes SP5, SP6 et SP7 si les conditions suivantes sont satisfaites, à savoir qu'une aire
rectangulaire suivante CHR35 est allongée verticalement (c'est-à-
dire possède un rapport hauteur-largeur h/w >'1) et est extraite en une position située à califourchon sur la ligne centrale LCTR (figure 7) et que le pas de caractère est, après solidarisation avec l'aire rectangulaire CHR35, inférieur ou égal au pas de caractère moyen P. Par conséquent, le processus de solidarisation est de
nouveau exécuté à l'étape SP8. Ainsi, la donnée de caractère dis-
continu obtenue par cette solidarisation des trois aires rectangu-
Laires CHR33, CHR34 et CHR35 formant un unique caractère discontinu est déLivrée comme donnée de caractère d'entrée au dispositif de détermination de caractère 7 par le moyen d'extraction de caractère 6. Avec la structure mentionnée ci-dessus à titre d'exemple, au cours de l'exécution du processus visant à extraire un caractère
discontinu par solidarisation des aires rectangulaires de compo-
santes d'un tel caractère discontinu, la condition adoptée pour
pouvoir décider que l'aire rectangulaire à traiter est une compo-
sante d'un caractère discontinu est, en plus de la condition se rapportant au rapport hauteur-largeur, une condition relative à la position d'extraction. Par conséquent, on peut améliorer encore
la précision d'extraction de n'importe quel caractère discontinu.
De plus, dans le processus de solidarisation d'une aire rectangulaire suivante, la solidarisation est exécutée de telle
manière qu'une décision soit prise relativement au rapport hauteur-
largeur et à la position d'extraction de l'aire rectangulaire
suivante tandis que la condition suivant laquelle Le pas de carac-
tère venant après ce processus de solidarisation ne doit jamais dépasser le pas de caractère moyen P est maintenue. Par conséquent, la précision d'extraction d'un caractère discontinu peut être
encore améliorée.
Le mode de réalisation ci-dessus a été décrit en relation avec un exemple dans le cas duquel on calculait le pas de caractère
moyen P dans chaque ligne de caractères et on effectuait la solida-
risation d'un caractère discontinu en utilisant le pas de caractère moyen P obtenu dans une ligne de caractère précédente. Il peut toutefois être fait appel à une variante suivant laquelle les caractères carrés partiels ou entiers d'une ligne de caractère sont utilisés comme données pour-le pas de caractère moyen P de chaque ligne de caractères, ou bien le pas de caractère moyen est calculé relativement aux caractères carrés partiels ou de cadratin d'une ligne de caractères précédente et est utilisé comme donnée de pas de caractère moyen dans la ligne de caractères considérée. De plus, on peut calculer la donnée de pas de caractère moyen relativement
aux caractères carrés de plusieurs lignes de caractères.
En ce qui concerne l'exclusion d'un pas de caractère quelconque, qui n'est pas le pas de caractère carré, pour le calcul du pas de caractère moyen de chaque rangée de caractère, on peut dire que, si le pas de caractère d'une nouvelle ligne de caractère se révèle extrèmemen;t différent du pas de caractère moyen de la ligne de caractères précédente, la nouvelle ligne de caractères peut être considérée comme une première ligne de caractères, et on met en oeuvre ce processus d'exclusion en utilisant la hauteur maximale
existant dans la nouvelle ligne de caractères.
Dans le cas o seules un certain nombre de lignes de caractères présentent un pas de caractère différent, comme c'est dans le cas dans un paragraphe inséré d'un document imprimé (par exemple, lorsqu'on insère un paragraphe d'une ou plusieurs lignes de caractères ayant une taille de caractère de 8 signes par pouce dans un document imprimé dont les lignes de caractères sont à la dimension de 12 signes par pouce), on peut choisir les caractères
devant être exclus du calcul du pas de caractère moyen en se repor-
tant à La hauteur maximale existant dans la première ligne de caractères du paragraphe inséré fait de lignes de caractères à La
dimension de 8 signes par pouce, ce qui permet d'assurer L'exécu-
tion de L'extraction voulue des caractères discontinus avec une
précision suffisamment élevée en pratique.
Alors que la description n'a traité que l'extraction de
caractères écrits horizontalement dans le mode de réalisation
préféré de l'invention, le processus d'extraction peut naturelle-
ment être identiquement appliqué à l'extraction de caractères verticalement écrits. Dans ce cas, une aire rectangulaire dont le rapport hauteur-largeur est plus petit que 1 peut être considérée
comme une composante de caractère discontinu.
De plus, on peut échanger entre eLles les étapes SP2 et
SP4, ainsi que les étapes SP5 et SP6.
Bien entendu, l'homme de l'art sera en mesure d'imaginer,
à partir du procédé et du dispositif dont la description vient
d'être donnée à titre simplement iLlustratif et nullement limita-
tif, diverses variantes et modifications ne sortant pas du cadre de l'invention.

Claims (4)

REVENDICATIONS
1. Procédé de reconnaissance d'un caractère en fonction d'une information de caractère extraite d'un signal de ligne de caractères à l'aide d'une aire rectangulaire qui est formée à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère discontinu, caractérisé en ce qu'il comprend l'opération consistant à décider qu'une aire rectangulaire est une composante d'un caractère discontinu sur la base du rapport hauteur-largeur et de la position d'extraction
verticale de l'aire rectangulaire.
2. Procédé de reconnaissance d'un caractère en fonction d'une information de caractère extraite d'un.signal de ligne de caractères à l'aide d'une aire rectangulaire qui est formée à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère discontinu, caractérisé en ce qu'il comprend les opérations consistant à décider qu'une aire de caractère est une composante d'un caractère discontinu sur la base du rapport hauteur-largeur et de la position d'extraction verticale de l'aire de caractère, à décider, lorsqu'il a été décidé
que la première aire rectangulaire est une composante d'un carac-
tère discontinu, qu'une deuxième aire de caractère adjacente est une autre composante du caractère discontinu, à rendre solidaire la deuxième aire de caractère avec la première aire de caractère à la condition que le pas de caractère des aires de caractère rendues
solidaires ne dépasse pas un pas de caractère moyen, et à déter-
miner que l'information de caractère extraite des première et deuxième aires de caractère rendues solidaires est l'information de
caractère des composantes du caractère discontinu.
3. Dispositif de reconnaissance de caractères qui reconnaît un caractère en fonction d'une information de caractère extraite
d'un signal de ligne de caractères à l'aide d'une aire rectangu-
laire qui est formée à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère
discontinu, caractérisé en ce qu'il comprend un moyen (6) permet-
tant de décider qu'une aire rectangulaire est une composante d'un
263 1723
caractère discontinu sur La base du rapport hauteur-largeur et de
la position d'extraction verticale de l'aire rectangulaire.
4. Dispositif de reconnaissance de caractères qui reconnaît un caractère en fonction d'une information de caractère extraite
d'un signal de ligne de caractères à l'aide d'une aire rectangu-
laire qui est formée à partir du signal de ligne de caractères et qui entoure un caractère complet ou une composante d'un caractère
discontinu, caractérisé en ce qu'il comprend un moyen (6) permet-
tant de décider qu'une aire rectangulaire est une composante d'un caractère discontinu sur ta base du rapport hauteur-largeur et de La position d'extraction verticale de l'aire rectangulaire, un moyen (6) permettant de décider, lorsqu'il a été décidé que la
première aire rectangulaire est une composante d'un caractère dis-
continu, qu'une deuxième aire de caractère adjacente est une autre composante du caractère discontinu, un moyen (6) permettant de rendre solidaire la deuxième aire de caractère avec la première aire de caractère à la condition que le pas de caractère des aires de caractère rendues solidaires ne dépasse pas un pas de caractère moyen, et un moyen (7) permettant de déterminer que l'information de caractère extraite des première et deuxième aires de caractère rendues solidaires est l'information de caractère des composantes
du caractère discontinu.
FR8906608A 1988-05-19 1989-05-19 Procede et dispositif de reconnaissance de caracteres Granted FR2631723A1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63122272A JP2822189B2 (ja) 1988-05-19 1988-05-19 文字認識装置及び方法

Publications (2)

Publication Number Publication Date
FR2631723A1 true FR2631723A1 (fr) 1989-11-24
FR2631723B1 FR2631723B1 (fr) 1995-04-28

Family

ID=14831855

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8906608A Granted FR2631723A1 (fr) 1988-05-19 1989-05-19 Procede et dispositif de reconnaissance de caracteres

Country Status (6)

Country Link
US (1) US5138668A (fr)
JP (1) JP2822189B2 (fr)
KR (1) KR890017630A (fr)
DE (1) DE3916323A1 (fr)
FR (1) FR2631723A1 (fr)
GB (1) GB2218839B (fr)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
CA2037173C (fr) * 1990-03-30 1996-01-09 Hirofumi Kameyama Systeme de reconnaissance de caracteres
EP0457534B1 (fr) * 1990-05-14 2001-10-31 Canon Kabushiki Kaisha Procédé et dispositif de traitement d'image
EP0457546B1 (fr) * 1990-05-15 1998-12-02 Canon Kabushiki Kaisha Procédé et dispositif de traitement d'image
JP2868134B2 (ja) * 1990-09-03 1999-03-10 キヤノン株式会社 画像処理方法及び装置
US5825920A (en) * 1991-01-28 1998-10-20 Hitachi, Ltd. Method and unit for binary processing in image processing unit and method and unit for recognizing characters
EP0539158A2 (fr) * 1991-10-21 1993-04-28 Canon Kabushiki Kaisha Procédé et appareil de reconnaissance de caractères
US5757979A (en) * 1991-10-30 1998-05-26 Fuji Electric Co., Ltd. Apparatus and method for nonlinear normalization of image
US5343537A (en) * 1991-10-31 1994-08-30 International Business Machines Corporation Statistical mixture approach to automatic handwriting recognition
US5848187A (en) * 1991-11-18 1998-12-08 Compaq Computer Corporation Method and apparatus for entering and manipulating spreadsheet cell data
JP3278471B2 (ja) * 1991-11-29 2002-04-30 株式会社リコー 領域分割方法
JPH0619439A (ja) * 1992-06-30 1994-01-28 Fujitsu Ltd 画面表示の変更方式
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
US6005976A (en) * 1993-02-25 1999-12-21 Fujitsu Limited Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
US5396566A (en) * 1993-03-04 1995-03-07 International Business Machines Corporation Estimation of baseline, line spacing and character height for handwriting recognition
JP2800633B2 (ja) * 1993-04-30 1998-09-21 富士ゼロックス株式会社 画像符号化装置
US6651221B1 (en) 1993-05-20 2003-11-18 Microsoft Corporation System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
DE69329380T2 (de) * 1993-06-30 2001-03-01 Ibm Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
JP3042945B2 (ja) * 1993-07-07 2000-05-22 富士通株式会社 画像抽出装置
US5596350A (en) * 1993-08-02 1997-01-21 Apple Computer, Inc. System and method of reflowing ink objects
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
US6256408B1 (en) * 1994-04-28 2001-07-03 International Business Machines Corporation Speed and recognition enhancement for OCR using normalized height/width position
US5600735A (en) * 1994-05-10 1997-02-04 Motorola, Inc. Method of recognizing handwritten input
JPH08194780A (ja) * 1994-11-18 1996-07-30 Ricoh Co Ltd 特徴抽出方法
IL112420A (en) * 1995-01-23 1999-05-09 Advanced Recognition Tech Handwriting recognition with reference line estimation
JPH08249422A (ja) * 1995-03-08 1996-09-27 Canon Inc 文字処理装置及び方法
GB2301470B (en) * 1995-05-15 1998-11-11 Sanyo Electric Co Document processing apparatus
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US7721948B1 (en) * 1999-05-25 2010-05-25 Silverbrook Research Pty Ltd Method and system for online payments
USD705787S1 (en) 2012-06-13 2014-05-27 Microsoft Corporation Display screen with animated graphical user interface
CN102779176A (zh) * 2012-06-27 2012-11-14 北京奇虎科技有限公司 关键词过滤系统及方法
CN105095890B (zh) * 2014-04-25 2019-02-26 广州市动景计算机科技有限公司 图像中字符分割方法及装置
KR102256667B1 (ko) 2020-03-23 2021-05-26 주식회사 신한디에스 문서 인식 방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6210784A (ja) * 1985-07-09 1987-01-19 Matsushita Electric Ind Co Ltd 文字認識装置
FR2588104A1 (fr) * 1985-09-27 1987-04-03 Sony Corp Dispositif et procede de reconnaissance de caracteres contenant des caracteres alphabetiques et des caracteres de type chinois

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3526876A (en) * 1965-10-24 1970-09-01 Ibm Character separation apparatus for character recognition machines
US3662341A (en) * 1970-09-25 1972-05-09 Ibm Video-derived segmentation-gating apparatus for optical character recognition
US3846752A (en) * 1972-10-02 1974-11-05 Hitachi Ltd Character recognition apparatus
NL160408C (nl) * 1973-02-21 1979-10-15 Nederlanden Staat Inrichting voor het lezen van tekens, bij voorkeur van cijfers.
JPS5156139A (en) * 1974-11-13 1976-05-17 Hitachi Ltd Mojomitorisochi niokeru kiridashihoshiki
US4193056A (en) * 1977-05-23 1980-03-11 Sharp Kabushiki Kaisha OCR for reading a constraint free hand-written character or the like
US4162482A (en) * 1977-12-07 1979-07-24 Burroughs Corporation Pre-processing and feature extraction system for character recognition
JPS5580183A (en) * 1978-12-12 1980-06-17 Nippon Telegr & Teleph Corp <Ntt> On-line recognition processing system of hand-written character
JPS5827551B2 (ja) * 1979-05-18 1983-06-10 日本電信電話株式会社 オンライン手書き文字認識方式
US4379282A (en) * 1979-06-01 1983-04-05 Dest Corporation Apparatus and method for separation of optical character recognition data
JPS6043555B2 (ja) * 1980-02-26 1985-09-28 株式会社トキメック 印字文字切出し装置
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
US4365234A (en) * 1980-10-20 1982-12-21 Hendrix Electronics, Inc. Segmentation system and method for optical character scanning
EP0120334B1 (fr) * 1983-03-01 1989-12-06 Nec Corporation Système pour la détection de l'écartement de caractères
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
JPS6118079A (ja) * 1984-07-05 1986-01-25 Fujitsu Ltd パタ−ン分離装置
DE3538639A1 (de) * 1984-10-31 1986-04-30 Canon K.K., Tokio/Tokyo Bildverarbeitungssystem
JPS61117670A (ja) * 1984-11-13 1986-06-05 Fujitsu Ltd 文字切り出し処理方式
JPS6316392A (ja) * 1986-07-08 1988-01-23 Matsushita Electric Ind Co Ltd 文字認識装置
JP2619429B2 (ja) * 1987-11-05 1997-06-11 グローリー工業株式会社 接触文字の分離方法
US4932065A (en) * 1988-11-16 1990-06-05 Ncr Corporation Universal character segmentation scheme for multifont OCR images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6210784A (ja) * 1985-07-09 1987-01-19 Matsushita Electric Ind Co Ltd 文字認識装置
FR2588104A1 (fr) * 1985-09-27 1987-04-03 Sony Corp Dispositif et procede de reconnaissance de caracteres contenant des caracteres alphabetiques et des caracteres de type chinois

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 5, no. 85 (P-01)(1181) 11 Juin 1987 & JP-A-62 010 784 ( MATSUSHITA ELECTRIC IND CO LTD ) 19 Janvier 1987 *

Also Published As

Publication number Publication date
US5138668A (en) 1992-08-11
GB2218839B (en) 1992-04-29
GB2218839A (en) 1989-11-22
DE3916323A1 (de) 1989-11-30
JPH01292486A (ja) 1989-11-24
JP2822189B2 (ja) 1998-11-11
GB8911303D0 (en) 1989-07-05
FR2631723B1 (fr) 1995-04-28
KR890017630A (ko) 1989-12-16

Similar Documents

Publication Publication Date Title
FR2631723A1 (fr) Procede et dispositif de reconnaissance de caracteres
US8086031B2 (en) Region detection
US20080298718A1 (en) Image Stitching
WO2011015928A2 (fr) Procede de traitement d&#39;image pour corriger une image cible en fonction d&#39;une image de reference et dispositif de traitement d&#39;image correspondant
WO1999067943A1 (fr) Unite et procede de traitement d&#39;images, et support sur lequel le programme de traitement des images est enregistre
CA3043090C (fr) Procede de reconnaissance de caracteres
EP3659070A1 (fr) Procédé pour l&#39;authentification d&#39;une illustration.
EP3570212A1 (fr) Procédé de reconnaissance de caractères
CN108615058A (zh) 一种字符识别的方法、装置、设备及可读存储介质
US7110607B2 (en) Image processing apparatus
US6671395B1 (en) Document image processing with stroke preservation and background suppression
JP2003337949A (ja) 指紋照合装置
JP3416058B2 (ja) 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体
EP1390905B1 (fr) Procede de detection de zones de texte dans une image video
JPH10285399A (ja) 画像の二値化方法
JP3462727B2 (ja) 文字列2値化装置
JP3618926B2 (ja) 文書画像の傾き検出方法
JPH09305707A (ja) 画像抽出方式
JP3103387B2 (ja) 濃淡画像の適応2値化方法
JP3949954B2 (ja) ドロップアウトカラー識別処理プログラム、方法、および装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPH01169581A (ja) 画像処理装置
JP2000293629A (ja) 画像処理方法,装置および記録媒体
JPH02254574A (ja) ノイズ除去方式
JP3381803B2 (ja) 傾き角検出装置