JPH1166236A - Method and device for character recognition and storage medium stored with character recognition program - Google Patents

Method and device for character recognition and storage medium stored with character recognition program

Info

Publication number
JPH1166236A
JPH1166236A JP9217809A JP21780997A JPH1166236A JP H1166236 A JPH1166236 A JP H1166236A JP 9217809 A JP9217809 A JP 9217809A JP 21780997 A JP21780997 A JP 21780997A JP H1166236 A JPH1166236 A JP H1166236A
Authority
JP
Japan
Prior art keywords
character
contribution
character pattern
pattern
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9217809A
Other languages
Japanese (ja)
Other versions
JP3368807B2 (en
Inventor
Minoru Mori
稔 森
Toru Wakahara
徹 若原
Kenji Ogura
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP21780997A priority Critical patent/JP3368807B2/en
Publication of JPH1166236A publication Critical patent/JPH1166236A/en
Application granted granted Critical
Publication of JP3368807B2 publication Critical patent/JP3368807B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To skillfully recognize an object character, which has large handwriting deformation such as variations in the tilt of a character line by finding the degree of direction contribution of a character pattern and using a correlation value between the degrees of direction contribution between character lines. SOLUTION: A pre-processing means 100 normalizes a binarized character pattern as to a position and size of a character and stores the results in a frame memory 101, and an intersection detecting means 102 scans the stored character pattern from a specific position in a specific direction to detect the intersection with a character part. A connection length measuring means 104 measures the connection length of black pixels in the specific direction as to the black pixels of the intersecting character part, and a direction contribution degree calculating means 106 calculates the degree of direction contribution representing the distribution states of black pixels by directions using the measured connection length. A correlation calculating means 108 calculates the correlation value between the 1st degree of direction contribution and the 2nd degree of direction contribution which are calculated, and a character pattern recognizing means 110 recognizes the character pattern by using the calculated correlation value.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字パターンの認
識方法及び文字認識装置に係わり、特に、光学変換によ
って得られた文字パターンを2値化した文字パターンに
対して手書き漢字のような多字種、多様な手書き変形を
もつ文字対象を認識するため、文字線の構造に関する特
徴を文字パターンから抽出し、入力文字パターンを認識
する方法及び装置、並びに、その入力文字パターンを認
識するプログラムを格納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character pattern recognizing method and a character recognizing device, and more particularly to a multi-character such as a handwritten kanji for a binarized character pattern obtained by optical conversion. In order to recognize a character object having a variety of handwritten deformations, a method and an apparatus for extracting a character line structure feature from a character pattern and recognizing an input character pattern, and a program for recognizing the input character pattern are stored. Related to a storage medium.

【0002】[0002]

【従来の技術】従来の文字パターンの認識方法及び装置
として、2値化と、位置及び大きさの正規化とを行った
文字パターンを複数の方向の座標軸から観測し、座標軸
上の各位置において座標軸と直交する方向の文字部を横
切る文字線数を計数し、この文字線数から特徴ベクトル
パターンを作成し、先に蓄えられた各文字の特徴辞書テ
ーブルとのマッチングをとり、文字パターンの認識を行
う方法及び装置がある。従来の文字パターンの認識方法
及び装置では、計数時に横切る文字線数によって字種の
違いに起因する文字線構造の大まかな複雑さの違いを区
別することが可能である。しかし、より詳細な文字線構
造の違いを表わす情報がないため、多数の類似文字と、
多様な手書き変形がある文字対象を高精度に認識するこ
とは困難であるという問題点がある。
2. Description of the Related Art As a conventional character pattern recognition method and apparatus, a character pattern subjected to binarization and normalization of position and size is observed from coordinate axes in a plurality of directions. The number of character lines crossing the character part in the direction orthogonal to the coordinate axis is counted, a feature vector pattern is created from the number of character lines, and matching with the previously stored feature dictionary table for each character is performed to recognize the character pattern. There is a method and apparatus for performing In the conventional character pattern recognition method and apparatus, it is possible to distinguish the difference in the general complexity of the character line structure caused by the difference in the character type according to the number of character lines traversed at the time of counting. However, since there is no information indicating a more detailed difference in the character line structure, many similar characters,
There is a problem that it is difficult to recognize a character object having various handwritten deformations with high accuracy.

【0003】2値化と、位置及び大きさの正規化とを行
った文字パターンを複数の方向の座標軸から観察し、座
標軸から走査した走査線と交差する文字部の黒画素につ
いて、例えば、特願昭56−46659号明細書に記載
されている文字線の方向寄与度を求めることにより、文
字パターンを認識する方法及び装置が知られている。し
かし、このタイプの文字パターン認識方法及び装置の場
合には、文字線の傾きの変化等の手書き変形の多い文字
対象を高精度認識できないと言う問題点がある。
[0003] A character pattern that has been subjected to binarization and position and size normalization is observed from coordinate axes in a plurality of directions. There is known a method and apparatus for recognizing a character pattern by obtaining the directional contribution of a character line described in Japanese Patent Application No. 56-46659. However, in the case of this type of character pattern recognition method and apparatus, there is a problem that a character object having many handwritten deformations such as a change in inclination of a character line cannot be recognized with high accuracy.

【0004】[0004]

【発明が解決しようとする課題】本発明は、上記従来技
術の問題点に鑑み、2値化と、位置及び大きさの正規化
とを施された文字パターンについて、文字線の傾きの変
化等を受けにくい特徴を用いることにより、文字線の傾
きの変動等の手書き変形の多い文字対象を巧く認識する
文字認識方法及び装置、並びに、文字認識プログラムを
格納した記憶媒体の提供を目的とする。
SUMMARY OF THE INVENTION In view of the above-mentioned problems of the prior art, the present invention relates to a character pattern subjected to binarization and normalization of position and size, such as a change in inclination of a character line. It is an object of the present invention to provide a character recognition method and apparatus for skillfully recognizing a character object having many handwritten deformations such as variations in the inclination of a character line, and a storage medium storing a character recognition program. .

【0005】[0005]

【課題を解決するための手段】上記の目的を達成するた
め本発明は、文字線の傾きの変化等を受けにくい特徴と
して、文字線の相対的な配置関係、特に、文字線の平行
度に関する情報を使用するため、文字パターンにおける
方向寄与度を求め、文字線間で方向寄与度同士の相関を
計算する。
In order to achieve the above-mentioned object, the present invention is characterized in that the character line is less susceptible to a change in the inclination of the character line and the like. In order to use the information, the directional contribution in the character pattern is obtained, and the correlation between the directional contributions between the character lines is calculated.

【0006】図1は本発明の原理を説明する図である。
同図に示す如く、本発明の文字認識方法は、2値化され
た文字パターンに対して、文字部との交差を検出するた
め、予め定められた複数の走査方向に文字パターンを走
査し(ステップ1)、文字部と交差した場合に、上記交
差した文字部の黒画素について予め定められた複数の方
向に触手を延ばして各方向別に黒画素の連結長を求め
(ステップ2)、上記黒画素の連結長から上記黒画素の
文字部の方向成分毎の分布状況を表わす方向寄与度を求
め(ステップ3)、上記走査方向への走査中に文字部と
複数回交差した場合に、上記複数回の交差のうち、ある
交差時の文字部の方向寄与度とそれ以前に交差した文字
部の方向寄与度との相関の値を計算し(ステップ4)、
相関の値を用いて文字パターンを認識する(ステップ
5)。
FIG. 1 is a diagram for explaining the principle of the present invention.
As shown in the figure, the character recognition method of the present invention scans a character pattern in a plurality of predetermined scanning directions in order to detect an intersection between a binarized character pattern and a character part ( Step 1) When the character portion intersects, the tentacle is extended in a plurality of predetermined directions for the black pixel of the intersecting character portion to determine the connection length of the black pixel for each direction (Step 2). From the connection length of the pixels, the directional contribution representing the distribution state of the character portion of the black pixel for each directional component is obtained (step 3). The value of the correlation between the directional contribution of the character portion at a certain crossing and the directional contribution of the character portion crossed before that time is calculated (step 4).
The character pattern is recognized using the correlation value (step 5).

【0007】以上の方法により、個々の文字線が傾きの
変動を生じていても、文字線同士の平行性が保たれてい
る場合には略同一の文字線の平行度に関する情報が得ら
れるため、文字線の傾きの変化の影響を受けにくくなる
ので、手書き変形の多い文字対象を高精度に認識するこ
とが可能になる。図2は本発明の文字認識装置の原理を
説明する構成図である。同図に示す如く、本発明の文字
認識装置10は、前処理手段100、フレームメモリ1
01、交差検出手段102、連結長測定手段104、方
向寄与度計算手段106、相関計算手段108、文字パ
ターン認識手段110、メモリ112及び制御手段11
4からなる。
According to the above method, even if the inclination of each character line varies, information on the parallelism of substantially the same character line can be obtained if the parallelism of the character lines is maintained. In addition, since it is less likely to be affected by the change in the inclination of the character line, it is possible to accurately recognize a character object having a large amount of handwritten deformation. FIG. 2 is a configuration diagram illustrating the principle of the character recognition device of the present invention. As shown in FIG. 1, the character recognition device 10 of the present invention includes a pre-processing unit 100, a frame memory 1
01, intersection detection means 102, connection length measurement means 104, direction contribution calculation means 106, correlation calculation means 108, character pattern recognition means 110, memory 112, and control means 11
Consists of four.

【0008】前処理手段100は、2値化された文字パ
ターンに文字の位置及び大きさについて正規化処理を行
ないフレームメモリ101に格納する。交差検出手段1
02は、前処理されフレームメモリ101に格納された
文字パターンを所定の位置から所定の方向に走査して、
上記文字パターンの走査によって文字部との交差を検出
する。
The preprocessing means 100 performs a normalization process on the position and size of the character in the binarized character pattern and stores the result in the frame memory 101. Intersection detection means 1
02 scans a character pattern pre-processed and stored in the frame memory 101 from a predetermined position in a predetermined direction,
The intersection with the character part is detected by scanning the character pattern.

【0009】連結長測定手段104は、該交差した文字
部の黒画素について所定の方向に黒画素の連結長を測定
し、測定された連結長をメモリ112に記憶する。方向
寄与度計算手段106は、上記交差した文字部の黒画素
に関し、上記メモリ112に記憶された連結長を用いて
上記複数の方向別の黒画素の分布状況を表わす方向寄与
度を計算し、上記方向寄与度を上記メモリ112に記憶
する。
[0009] The link length measuring means 104 measures the link length of the black pixel in the crossed character portion in a predetermined direction, and stores the measured link length in the memory 112. The directional contribution calculating means 106 calculates a directional contribution representing a black pixel distribution state in each of the plurality of directions for the black pixels of the intersecting character portion using the connection length stored in the memory 112, The directional contribution is stored in the memory 112.

【0010】相関計算手段108は、上記メモリ112
に記憶された第1の方向寄与度と第2の方向寄与度との
相関の値を計算し、メモリ112に記憶する。文字パタ
ーン認識手段110は、メモリ112に記憶された上記
相関の値を用いて文字パターンを認識する。制御手段1
14は、文字パターンにおける方向寄与度を求め、文字
線間で方向寄与度同士の相関を計算する処理の流れを制
御する。そのため、制御手段112は、上記所定の位置
及び所定の方向を順次に変化させて、各位置及び各方向
毎に上記交差検出手段102を作動させ、交差が検出さ
れた場合に、複数の方向について順次に上記連結長測定
手段104を作動させ、上記交差した文字部の黒画素に
関し、上記メモリ112に記憶された複数の方向の連結
長で上記方向寄与度計算手段106を作動させ、所定位
置かつ所定方向の走査中の文字部との交差の回数を計数
し、複数回目の交差に対応して、該複数回目に交差した
際に計算された方向寄与度を上記第1の方向寄与度と
し、それ以前に交差した際に計算された他の方向寄与度
を上記第2の方向寄与度として、上記相関計算手段10
8を作動させ、順次に変化された上記所定の位置及び所
定の方向について上記相関の値がメモリ112に記憶さ
れた後、上記文字パターン認識手段110を作動させる
よう制御する。
The correlation calculation means 108 is provided in the memory 112
The correlation value between the first direction contribution and the second direction contribution stored in is calculated and stored in the memory 112. The character pattern recognition means 110 recognizes a character pattern using the value of the correlation stored in the memory 112. Control means 1
Reference numeral 14 controls the flow of processing for obtaining the directional contribution in the character pattern and calculating the correlation between the directional contributions between the character lines. Therefore, the control means 112 sequentially changes the predetermined position and the predetermined direction, activates the intersection detection means 102 for each position and each direction, and when an intersection is detected, The link length measuring means 104 is sequentially operated to operate the direction contribution calculating means 106 with the link lengths in a plurality of directions stored in the memory 112 for the black pixels of the intersecting character portion, and Counting the number of intersections with the character portion being scanned in the predetermined direction, and corresponding to the plurality of intersections, the directional contribution calculated at the plurality of intersections is defined as the first directional contribution, The other direction contribution calculated when the vehicle crosses before that is regarded as the second direction contribution, and the correlation calculation means 10 is used.
8 is operated to control the character pattern recognition unit 110 to operate after the correlation value is stored in the memory 112 for the predetermined position and the predetermined direction which are sequentially changed.

【0011】図3は上記本発明の文字認識装置10の動
作フローチャートである。同図に示す如く、本発明の文
字認識装置10は、2値化された文字パターンを所定の
位置から所定の方向に走査し(ステップ10)、上記文
字パターンの走査によって文字部との交差があるかどう
かを判定し(ステップ12)、文字部と交差した場合
に、該交差した文字部の黒画素について複数の所定の方
向別に黒画素の連結長を測定し、上記交差した文字部の
黒画素に関し上記複数の方向別の黒画素の分布状況を表
わす方向寄与度を計算し(ステップ14)、同一位置か
ら同一方向への走査中に文字部と複数回目に交差したか
どうかを判定し(ステップ16)、複数回目の交差であ
る場合に、該複数回目に交差した際に計算された一の方
向寄与度と、それ以前に交差した際に計算された他の方
向寄与度との相関を計算し(ステップ18)、上記所定
の位置を順次変化させて、ステップ12に戻り(ステッ
プ20)、上記所定の方向を順次変化させて、ステップ
12に戻り(ステップ22)、上記計算された相関の値
を用いて文字パターンを認識する(ステップ24)。
FIG. 3 is an operation flowchart of the character recognition apparatus 10 of the present invention. As shown in the figure, the character recognition device 10 of the present invention scans a binarized character pattern from a predetermined position in a predetermined direction (step 10), and the intersection of the character portion is performed by scanning the character pattern. It is determined whether or not there is any character (step 12). If the character intersects the character portion, the connection length of the black pixel in the crossed character portion is measured for a plurality of predetermined directions for the black pixel of the character portion. The directional contribution representing the distribution of the black pixels in the plurality of directions is calculated for the pixel (step 14), and it is determined whether the character portion intersected the character portion a plurality of times during scanning from the same position in the same direction (step 14). Step 16) In the case of a plurality of crossings, the correlation between one direction contribution calculated at the time of the plurality of crossings and another direction contribution calculated at the time of the previous crossing is calculated. Calculate (step 18) The predetermined position is sequentially changed, and the process returns to step 12 (step 20). The predetermined direction is sequentially changed, and the process returns to step 12 (step 22). The character pattern is calculated using the calculated correlation value. Is recognized (step 24).

【0012】[0012]

【発明の実施の形態】図4は本発明の文字認識方法を実
現する文字認識装置の一実施例を説明する構成図であ
る。同図に示す如く、本発明の文字認識装置10は、入
力文字パターンが入力される前処理部12、特徴抽出部
14及び識別結果を発生する識別処理部16により構成
される。
FIG. 4 is a block diagram for explaining an embodiment of a character recognition apparatus for realizing a character recognition method according to the present invention. As shown in FIG. 1, the character recognition device 10 of the present invention includes a preprocessing unit 12 to which an input character pattern is input, a feature extraction unit 14, and an identification processing unit 16 that generates an identification result.

【0013】前処理部12は、2値化された文字パター
ンに文字の位置及び大きさについて正規化処理を行う。
特徴抽出部14は、上記前処理部12によって得られた
文字パターンに対し、予め定められた複数の走査方向に
文字パターンを走査し、文字部と交差した場合に、上記
交差した文字部の黒画素について予め定められた複数方
向に触手を伸ばして各方向別に黒画素の連結長を求め、
上記黒画素連結長から求められる上記黒画素の文字部の
方向成分別の分布状況を表わす方向寄与度を求める。次
に、特徴抽出部14は、走査方向への走査中に文字部と
複数回交差した場合に上記複数回の交差のうち、ある交
差時の文字部の方向寄与度とそれ以前に交差した文字部
の方向寄与度との相関を文字パターンの特徴として求め
る。
The preprocessing unit 12 performs normalization processing on the binarized character pattern with respect to the position and size of the character.
The feature extraction unit 14 scans the character pattern obtained by the pre-processing unit 12 with the character pattern in a plurality of predetermined scanning directions. Extend the tentacles in a plurality of predetermined directions for the pixel to determine the connection length of black pixels for each direction,
A directional contribution degree representing a distribution state of each of the directional components of the character portion of the black pixel obtained from the black pixel connection length is obtained. Next, when the character extracting unit 14 intersects the character portion a plurality of times during scanning in the scanning direction, the feature extracting unit 14 determines the directional contribution of the character portion at a certain intersection among the plurality of intersections and the character intersecting before that. The correlation with the directional contribution of the part is obtained as a feature of the character pattern.

【0014】識別処理部16は、上記特徴を利用して文
字パターンの識別処理を行う。以下、前処理部12の正
規化処理を詳細に説明する。前処理部12には、光電変
換等によって得られた文字パターンを2値化した文字パ
ターンが入力文字パターンとして与えられ、2値化され
た文字パターンに文字の位置及び大きさについて正規化
処理を行う。前処理部12は、例えば、従来技術により
公知の位置の正規化処理法を用いて、入力文字パターン
を構成する全黒点のx,y座標の各座標値の平均値を算
出して文字の重心と定義し、文字の重心が文字枠の中心
位置に合わされるように入力パターン全体の平行移動処
理を行う。また、前処理部12は、例えば、従来から公
知の大きさの正規化処理法を用いて、重心から各筆点へ
の距離の平均値が予め定められた正規化半径に等しくな
るように、重心の周りで一様に文字パターンを拡大/縮
小する。
The identification processing section 16 performs a character pattern identification process using the above characteristics. Hereinafter, the normalization processing of the preprocessing unit 12 will be described in detail. A character pattern obtained by binarizing a character pattern obtained by photoelectric conversion or the like is given to the pre-processing unit 12 as an input character pattern, and the binarized character pattern is subjected to normalization processing for the position and size of the character. Do. The preprocessing unit 12 calculates the average value of the coordinate values of the x and y coordinates of all the black points constituting the input character pattern using, for example, a position normalization processing method known from the related art, and calculates the center of gravity of the character. And the parallel movement processing of the entire input pattern is performed so that the center of gravity of the character is aligned with the center position of the character frame. Also, the preprocessing unit 12 uses, for example, a normalization processing method of a conventionally known size so that the average value of the distance from the center of gravity to each writing point is equal to a predetermined normalization radius. Enlarge / reduce the character pattern uniformly around the center of gravity.

【0015】図5は、前処理部12の正規化処理により
文字「木」の入力文字パターンが正規化される例を示す
説明図である。同図の(a)は入力文字パターンの例を
示す。同図の(b)は前処理部12により入力文字パタ
ーンに対して位置と大きさの正規化処理を行った後の文
字パターンである。上記の説明では、前処理部12は、
位置と大きさの正規化処理のみを行っているが、同図の
(c)に示される如く、文字「木」において位置と大き
さの正規化処理後の文字パターンが文字枠をはみ出した
場合には、文字枠からはみ出した文字部を除去する枠取
り処理を行うことが可能である。同図の(d)は枠取り
処理を行った例である。また、同図の(e)に示される
如く、位置と大きさの正規化処理後の文字パターンの文
字線輪郭部分の黒点の1メッシュの凹凸を夫々、埋める
又は取り除く平滑化処理を行ってもよい。
FIG. 5 is an explanatory diagram showing an example in which the input character pattern of the character "tree" is normalized by the normalization processing of the preprocessing unit 12. FIG. 7A shows an example of an input character pattern. FIG. 2B shows the character pattern after the preprocessing unit 12 has performed the position and size normalization processing on the input character pattern. In the above description, the preprocessing unit 12
When only the position and size normalization process is performed, but the character pattern after the position and size normalization process exceeds the character frame in the character "tree" as shown in FIG. In, it is possible to perform a frame removal process for removing a character portion that protrudes from a character frame. (D) of the same figure is an example in which the framing process is performed. Further, as shown in (e) of the figure, a smoothing process for filling or removing one mesh unevenness of a black point of a character line contour portion of the character pattern after the position and size normalization process is performed, respectively. Good.

【0016】本発明の主要部をなす特徴抽出部14は、
前処理部12によって正規化処理された文字パターンを
入力し、予め定められた複数の走査方向に文字パターン
を走査する。例えば、走査方向が8方向の場合には、水
平方向を基準として、水平方向、+45°方向、+90
°方向、+135°方向、+180°方向、−135°
方向、−90°方向、及び、−45°方向で文字パター
ンを走査する。文字部と交差した場合に、走査方向に関
して、交差文字部の黒画素について予め定めた複数方向
に触手を伸ばす。例えば、8方向の場合には、走査方向
に関して0°、45°、90°、135°、180°、
225°、270°及び315°の方向に触手を伸ば
し、各方向毎に、連結する黒点の点数を計数し、黒点の
方向寄与度を計算する処理を行う。方向寄与度は、特願
昭56−46659号明細書に記載されている。更に、
上記の走査方向の走査で文字部とM(M≧2)回交差し
た場合に、m(2≦m≦M)回目の交差時の方向寄与度
と、(m−1)回目の交差時の方向寄与度との相関を求
める処理を行う。
The feature extraction unit 14, which is a main part of the present invention,
The character pattern normalized by the preprocessing unit 12 is input, and the character pattern is scanned in a plurality of predetermined scanning directions. For example, when the scanning direction is eight directions, the horizontal direction, the + 45 ° direction, and the +90
° direction, + 135 ° direction, + 180 ° direction, -135 °
The character pattern is scanned in the directions of -90 ° and -45 °. When the character intersects with the character portion, the tentacles are extended in a plurality of predetermined directions for the black pixels of the intersection character portion in the scanning direction. For example, in the case of 8 directions, 0 °, 45 °, 90 °, 135 °, 180 °,
The tentacles are extended in the directions of 225 °, 270 °, and 315 °, the number of connected black points is counted for each direction, and the process of calculating the directional contribution of the black points is performed. The directional contribution is described in Japanese Patent Application No. 56-46659. Furthermore,
When the character portion intersects the character portion M (M ≧ 2) times in the scanning in the above scanning direction, the directional contribution at the m (2 ≦ m ≦ M) intersection and the (m−1) th intersection A process for obtaining a correlation with the directional contribution is performed.

【0017】識別処理部16は、特徴抽出部14によっ
て得られた相関の値に基づいて文字パターンを識別する
ための特徴テーブルを作成し、従来公知のマッチング方
法とを用いて、特徴テーブルを元に、既に蓄えられた各
文字の特徴辞書テーブルとのマッチングをとり、文字パ
ターンの識別を行う。特徴抽出部14の具体的な実施例
として、8方向の走査方向に文字を走査する場合を考え
る。図6は、特徴抽出部14における文字部の方向寄与
度を観測するための垂直方向とそれに直交する座標軸を
示す図である。8方向とは、水平方向を基準として、水
平方向、+45°方向、+90°方向、+135°方
向、+180°方向、−135°方向、−90°方向、
及び、−45°方向の8方向であり、夫々の方向に1、
2、3、4、5、6、7、8の番号が付けられる。
The identification processing unit 16 creates a feature table for identifying a character pattern based on the correlation value obtained by the feature extraction unit 14, and converts the feature table into an original using a conventionally known matching method. Then, the character pattern is identified by matching the stored character dictionary with the feature dictionary table. As a specific embodiment of the feature extracting unit 14, consider a case where a character is scanned in eight scanning directions. FIG. 6 is a diagram illustrating a vertical direction for observing the directional contribution of the character portion in the feature extraction unit 14 and coordinate axes orthogonal to the vertical direction. The eight directions are the horizontal direction, the + 45 ° direction, the + 90 ° direction, the + 135 ° direction, the + 180 ° direction, the −135 ° direction, the −90 ° direction, based on the horizontal direction.
And eight directions of -45 °, one in each direction,
The numbers 2, 3, 4, 5, 6, 7, 8 are given.

【0018】図7は、垂直方向に文字パターンを走査し
た際に、文字部と2回交差した場合を示す。同図に番号
1及び2で示された点は、走査によって文字部と1回目
及び2回目に交差した場合の白点から黒点に変化した箇
所の黒点を表している。このような走査により文字部と
交差した場合に、交差文字部の黒画素について走査方向
に関して8方向(0°、45°、90°、135°、1
80°、225°、270°及び315°)に触手を伸
ばす。ここで、触手を伸ばす8方向に、夫々、1、2、
3、4、5、6、7、8の番号を付ける。
FIG. 7 shows a case where a character pattern is scanned twice in a vertical direction and crosses a character portion twice. The points indicated by numbers 1 and 2 in FIG. 3 represent black points at the points where the white and black points have changed from white points to black points when the character part is first and second times crossed by scanning. When a character portion intersects with such a scan, the black pixels in the intersecting character portion are scanned in eight directions (0 °, 45 °, 90 °, 135 °, 1
Extend the tentacles to 80 °, 225 °, 270 ° and 315 °). Here, in the 8 directions where the tentacles are extended,
Numbers 3, 4, 5, 6, 7, 8 are assigned.

【0019】図8の(a)には文字パターンの黒点連結
長を求めるために触手を伸ばす8方向が示され、(b)
には、黒点の方向寄与度を求めるために、文字部の黒点
から触手を伸ばして黒点連結長を求める様子が示され
る。触手を伸ばした8方向について、黒点の方向寄与度
を求め、文字パターンを識別する。
FIG. 8A shows eight directions in which the tentacles are extended in order to determine the black dot connection length of the character pattern, and FIG.
FIG. 3 shows how to extend the tentacle from the black point of the character portion to obtain the black point connection length in order to obtain the directional contribution degree of the black point. With respect to the eight directions in which the tentacles are extended, the directional contribution of the black point is obtained, and the character pattern is identified.

【0020】以下、本発明の第1の実施例について説明
する。前処理部12によって得られたN×Nメッシュの
文字パターンを水平方向を基準として8方向から観測す
る。s走査方向(s=1,2,...,8)について、
座標軸上の位置tを通り、座標軸と直交するs走査方向
の走査が行われる。座標軸上の位置tは、図6に示され
る如く、s=1,3,5,7ではt=1,2,...,
Nであり、s=2,4,6,8ではt=1,
2,...,N’、N’=2Nである。
Hereinafter, a first embodiment of the present invention will be described. The N × N mesh character pattern obtained by the preprocessing unit 12 is observed from eight directions with reference to the horizontal direction. In the s scanning direction (s = 1, 2,..., 8),
Scanning is performed in the s scanning direction passing through the position t on the coordinate axis and orthogonal to the coordinate axis. As shown in FIG. 6, the position t on the coordinate axes is t = 1, 2,. . . ,
N and t = 1, when s = 2,4,6,8
2,. . . , N ′, N ′ = 2N.

【0021】走査の開始時には直前の画素が白点である
と仮定したとき、s方向の走査で文字部とm回交差した
場合に、交差時に白点から黒点に変化した黒点の方向寄
与度Am は、 Am =(α1 ,α2 ,α3 ,α4 ,α5 ,α6 ,α7
α8 m なる8次元ベクトルで表される。ここで、α1 ,α2
α3 ,α4 ,α5 ,α6,α7 ,α8 は、夫々、8方向
の方向寄与度成分であり、黒点から8方向に触手を伸ば
し各方向別に得られる黒点連結長li (i=1,
2,...,8)を用いて、例えば、
At the start of scanning, if it is assumed that the immediately preceding pixel is a white point, and if the character portion intersects the character portion m times in scanning in the s direction, the directional contribution A of the black point changed from a white point to a black point at the time of the intersection. m is, A m = (α 1, α 2, α 3, α 4, α 5, α 6, α 7,
α 8 ) m is represented by an eight-dimensional vector. Where α 1 , α 2 ,
α 3 , α 4 , α 5 , α 6 , α 7 , and α 8 are directional contribution components in eight directions, respectively, and a black point connection length l i ( i = 1
2,. . . , 8), for example,

【0022】[0022]

【数1】 (Equation 1)

【0023】で表される。この例ではαi としてユーク
リッド距離が適用されているが、ユークリッド距離以外
の距離を適用してもよい。更に、走査によって文字部と
M(M≧2)回交差した場合に、m(2≦m≦M)回目
の交差時の方向寄与度Am と(m−1)回目の交差時の
方向寄与度Am-1との間の相関Γm-1,m は、
## EQU2 ## In this example, the Euclidean distance is applied as α i , but a distance other than the Euclidean distance may be applied. Further, when the cross character portion and M (M ≧ 2) times by scanning, m (2 ≦ m ≦ M ) th intersecting at the direction contribution A m of (m-1) th direction contribution at cross The correlation Γ m−1, m between the degree A m−1 and

【0024】[0024]

【数2】 (Equation 2)

【0025】又は、Or

【0026】[0026]

【数3】 (Equation 3)

【0027】なる式で表される。このようにして求めら
れる相関Γm-1,m のうち、m=2からm=m’(2≦
m’≦M)までの範囲を選ぶことにより、s方向走査と
直交する座標軸上の位置tからの走査によって得られる
特徴パターンfstは、 fst=(Γ12,Γ23,...,Γm'-1 m' ) で表される。従って、文字パターンの特徴ベクトルF
は、 F=(f11,f12,...,f1N,f21
22,...,f2N' ,f31,f32,...,f3N,f
41,f42,...,f4N' ,f51,f52,...,
5N,f61,f62,...,f6N' ,f71
72,...,f7N,f81,f82,...,f8N' ) で表される。
Is represented by the following equation. Of the correlations Γ m−1, m thus obtained, m = 2 to m = m ′ (2 ≦ m ′)
By selecting a range up to m ′ ≦ M, the feature pattern f st obtained by scanning from a position t on a coordinate axis orthogonal to the s-direction scanning is f st = (Γ 12 , Γ 23 ,. Γ m'-1 m ' ). Therefore, the feature vector F of the character pattern
Is: F = (f 11 , f 12 ,..., F 1N , f 21 ,
f 22 ,. . . , F 2N ′ , f 31 , f 32 ,. . . , F 3N , f
41 , f42 ,. . . , F 4N ′ , f 51 , f 52 ,. . . ,
f 5N, f 61, f 62 ,. . . , F 6N ' , f 71 ,
f 72,. . . , F 7N , f 81 , f 82 ,. . . , F 8N ′ ).

【0028】このようにして表される文字パターンの特
徴ベクトルFの各要素を複数個ずつまとめた値を文字パ
ターンの特徴として特徴テーブルを作成し、識別処理部
16において、例えば、従来公知の識別関数としてユー
クリッド距離などの識別関数D(F)を求めることによ
り、文字パターンが識別される。ここで、識別関数は入
力文字パターンの特徴ベクトルと、予め蓄えられた特徴
辞書テーブルの各文字種毎の特徴ベクトルとの間で距離
値の演算を行い、距離値の最も小さい値(関数に依存し
て最も大きい値の場合もある)をとった文字を候補文字
として出力する。
A characteristic table is created as a character pattern characteristic using a value obtained by grouping a plurality of elements of the characteristic vector F of the character pattern represented in this manner. The character pattern is identified by determining the identification function D (F) such as the Euclidean distance as a function. Here, the discrimination function calculates the distance value between the feature vector of the input character pattern and the feature vector for each character type in the previously stored feature dictionary table, and determines the smallest value of the distance value (depending on the function). (Which may be the largest value) are output as candidate characters.

【0029】入力文字パターンの特徴ベクトルをF=
(f1 ,f2 ,...,fk ,...,fK )、特徴辞
書テーブルの各文字Ci (1≦i≦L、Lは総字種数)
の特徴ベクトルをSi =(si1,si2,...,siK
とすると、例えば、ユークリッド距離の場合に、C
i (i=1〜L)までの字種の間で、
The feature vector of the input character pattern is represented by F =
(F 1 , f 2 ,..., F k ,..., F K ), each character C i in the feature dictionary table (1 ≦ i ≦ L, L is the total number of character types)
The feature vector of S i = (s i1 , s i2 , ..., s iK )
Then, for example, in the case of the Euclidean distance, C
i (i = 1 to L)

【0030】[0030]

【数4】 (Equation 4)

【0031】の計算を行い、一番小さい値を取ったCi
の字種を正解文字パターンとして出力する。次に、他の
方法として本発明の第2の実施例について説明する。前
処理部12によって得られたN×Nメッシュの文字パタ
ーンを水平方向を基準として8方向から観測する。s走
査方向(s=1,2,...,8)について、座標軸上
の位置tを通り、座標軸と直交するs走査方向の走査が
行われる。座標軸上の位置tは、図6に示される如く、
s=1,3,5,7ではt=1,2,...,Nであ
り、s=2,4,6,8ではt=1,2,...,
N’、N’=2Nである。
Is calculated, and the smallest value C i is obtained.
Is output as the correct character pattern. Next, a second embodiment of the present invention will be described as another method. The N × N mesh character pattern obtained by the preprocessing unit 12 is observed from eight directions with reference to the horizontal direction. In the s scanning direction (s = 1, 2,..., 8), scanning is performed in the s scanning direction passing through the position t on the coordinate axis and orthogonal to the coordinate axis. The position t on the coordinate axis is, as shown in FIG.
When s = 1, 3, 5, 7, t = 1, 2,. . . , N, and for s = 2, 4, 6, 8, t = 1, 2,. . . ,
N ′ and N ′ = 2N.

【0032】走査の開始時には直前の画素が白点である
と仮定したとき、s方向の走査で文字部とm回交差した
場合に、交差時に白点から黒点に変化した黒点の方向寄
与度Bm は、 Bm =(β1 ,β2 ,β3 ,β4 m なる4次元ベクトルで表される。ここで、β1 ,β2
β3 ,β4 は、夫々、4方向の方向寄与度成分であり、
黒点から8方向に触手を伸ばし各方向別に得られる黒点
連結長li (i=1,2,...,8)を用いて、例え
ば、
At the start of scanning, assuming that the immediately preceding pixel is a white point, if the character portion intersects the character portion m times in scanning in the s direction, the directional contribution B of the black point changed from a white point to a black point at the time of the intersection. m is, B m = (β 1, β 2, β 3, β 4) represented by m becomes four-dimensional vectors. Where β 1 , β 2 ,
β 3 and β 4 are directional contribution components in four directions, respectively.
The tentacles are extended in eight directions from the black point, and using the black point connection length l i (i = 1, 2,..., 8) obtained for each direction, for example,

【0033】[0033]

【数5】 (Equation 5)

【0034】で表される。この例ではβi としてシティ
ブロック距離が適用されているが、シティブロック距離
以外の距離を適用してもよい。更に、走査によって文字
部とM(M≧2)回交差した場合に、m(2≦m≦M)
回目の交差時の方向寄与度Bm と(m−1)回目の交差
時の方向寄与度Bm-1との間の相関Δm-1,m は、
Is represented by In this example, the city block distance is applied as β i , but a distance other than the city block distance may be applied. Further, when the character portion crosses the character portion M (M ≧ 2) times by scanning, m (2 ≦ m ≦ M)
Correlation Δ m-1, m between the direction contribution B m-1 times th intersecting at the direction contribution B m of (m-1) th time crossing

【0035】[0035]

【数6】 (Equation 6)

【0036】又は、Or

【0037】[0037]

【数7】 (Equation 7)

【0038】なる式で表される。このようにして求めら
れる相関Δm-1,m のうち、m=2からm=m’(2≦
m’≦M)までの範囲を選ぶことにより、s方向走査と
直交する座標軸上の位置tからの走査によって得られる
特徴パターンgstは、 gst=(Δ12,Δ23,...,Δm'-1 m' ) で表される。従って、文字パターンの特徴ベクトルG
は、 G=(g11,g12,...,g1N,g21
22,...,g2N' ,g31,g32,...,g3N,g
41,g42,...,g4N' ,g51,g52,...,
5N,g61,g62,...,g6N' ,g71
72,...,g7N,g81,g82,...,g8N' ) で表される。
Is represented by the following equation. Of the correlations Δm −1, m thus obtained, m = 2 to m = m ′ (2 ≦ m ′)
By selecting a range up to m ′ ≦ M, the characteristic pattern g st obtained by scanning from a position t on a coordinate axis orthogonal to the s direction scanning is g st = (Δ 12 , Δ 23 ,. Δ m'-1 m ' ). Therefore, the feature vector G of the character pattern
G = (g 11 , g 12 ,..., G 1N , g 21 ,
g 22 ,. . . , G 2N ′ , g 31 , g 32 ,. . . , G 3N , g
41 , g42 ,. . . , G 4N ′ , g 51 , g 52 ,. . . ,
g 5N, g 61, g 62 ,. . . , G 6N ' , g 71 ,
g 72,. . . , G 7N , g 81 , g 82 ,. . . , G 8N ′ ).

【0039】このようにして表される文字パターンの特
徴ベクトルGの各要素を複数個ずつまとめた値を文字パ
ターンの特徴として特徴テーブルを作成し、識別処理部
16において、例えば、従来公知の識別関数としてユー
クリッド距離などの識別関数D(G)を求めることによ
り、文字パターンが識別される。
A characteristic table is created as a characteristic of a character pattern using a value obtained by grouping a plurality of elements of the characteristic vector G of the character pattern represented in this manner. The character pattern is identified by determining the identification function D (G) such as the Euclidean distance as a function.

【0040】[0040]

【実施例】以下、本発明の文字認識方法を適用した例を
説明する。図9は、手書き変形により文字線の傾きに変
動が生じた文字パターンに本発明による文字認識方法を
適用した例を示す図である。同図の(a)に番号1及び
2で示された二つの点は、手書き文字を文字枠の左側か
ら右側に向けて走査することにより得られた1回目及び
2回目の交差点であり、白点から黒点に変化したときの
黒点に対応する。同図の(b)に番号1及び2で示され
た二つの点は、別の手書き文字を文字枠の左側から右側
に向けて走査することにより得られた1回目及び2回目
の、白点から黒点に変化したときの黒点に対応する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an example in which the character recognition method of the present invention is applied will be described. FIG. 9 is a diagram showing an example in which the character recognition method according to the present invention is applied to a character pattern in which the inclination of a character line has changed due to handwriting deformation. Two points indicated by numbers 1 and 2 in FIG. 3A are the first and second intersections obtained by scanning the handwritten character from the left side to the right side of the character frame. It corresponds to the black point when changing from a point to a black point. Two points indicated by numbers 1 and 2 in (b) of the same figure are the first and second white spots obtained by scanning another handwritten character from the left to the right of the character frame. Corresponds to the black point when changing from the black point to the black point.

【0041】状基本発明の第2の実施例による方法を各
点1、2、3及び4に適用した場合に、m=1からm=
2回の文字交差の範囲で得られる方向寄与度のBa1及び
a2、並びに、Bb1及びBb2の値を以下の表1及び表2
に示す。
When the method according to the second embodiment of the basic invention is applied to points 1, 2, 3 and 4, m = 1 to m =
Tables 1 and 2 below show the values of B a1 and B a2 and B b1 and B b2 of the directional contributions obtained in the range of two character intersections.
Shown in

【0042】[0042]

【表1】 [Table 1]

【0043】[0043]

【表2】 [Table 2]

【0044】二つの方向寄与度の相関Δa12 及びΔb12
の値を、夫々、以下の表3及び表4に示す。
The correlation of the two directions contribution delta a12 and delta b12
Are shown in Tables 3 and 4 below, respectively.

【0045】[0045]

【表3】 [Table 3]

【0046】[0046]

【表4】 [Table 4]

【0047】上記の表1及び表2より、方向寄与度Bを
特徴ベクトルとして使用した場合には、傾き変動の影響
を受けて方向寄与度の値が変化している。一方、表3及
び表4から分かるにように、相関Δを特徴ベクトルとし
て用いることにより、文字の平衡性が保たれたまま傾き
変動が生じた図9の(a)及び(b)のような文字パタ
ーン場合には、特徴ベクトルが傾き変動の影響を受けに
くくなっている。
According to Tables 1 and 2, when the directional contribution B is used as the feature vector, the value of the directional contribution changes under the influence of the inclination change. On the other hand, as can be seen from Tables 3 and 4, by using the correlation Δ as the feature vector, the tilt variation occurs while the balance of the characters is maintained, as shown in FIGS. 9A and 9B. In the case of a character pattern, the feature vector is less susceptible to tilt variations.

【0048】このような処理を以下同様に繰り返し行
い、文字パターン全体から得られた相関Δを特徴ベクト
ルとして用いることにより、文字の平行性が保たれたま
ま傾き変動が生じた文字パターンの場合には、文字を正
しく認識することが可能である。上記の実施例では、文
字認識装置の構成要件に基づいて説明しているが、この
例に限定されることなく、文字認識装置の各構成要件を
ソフトウェア(プログラム)で構築し、ディスク装置等
に格納して置き、必要に応じて文字認識装置を構成する
各コンピュータにインストールして文字認識を行うこと
も可能である。更に、構築されたプログラムをフロッピ
ーディスクやCD−ROM等の可搬記憶媒体に格納し、
このようなシステムを用いる場面で汎用的に使用するこ
とも可能である。
By repeating the above processing in the same manner as described above and using the correlation Δ obtained from the entire character pattern as a feature vector, it is possible to reduce the inclination of the character pattern while maintaining the parallelism of the character. Can correctly recognize characters. In the above embodiment, the description has been given based on the configuration requirements of the character recognition device. However, the present invention is not limited to this example. It is also possible to store and store it and install it in each computer constituting the character recognition device as needed to perform character recognition. Further, the constructed program is stored in a portable storage medium such as a floppy disk or a CD-ROM,
Such a system can be used for general purposes.

【0049】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内で種々変更・応用が可能であ
る。
The present invention is not limited to the above embodiment, but can be variously modified and applied within the scope of the claims.

【0050】[0050]

【発明の効果】以上説明したように、本発明によれば、
文字線の平行度を求めることにより文字線の相対配置に
関する情報が抽出できるため、文字線の傾きの変動の影
響を受けにくくなることので、手書き変形の多い文字対
象を高精度に認識することが可能になる。
As described above, according to the present invention,
Since the information on the relative arrangement of the character lines can be extracted by calculating the parallelism of the character lines, it is less likely to be affected by fluctuations in the inclination of the character lines. Will be possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理説明図である。FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明の文字認識装置の動作フローチャートで
ある。
FIG. 3 is an operation flowchart of the character recognition device of the present invention.

【図4】本発明の文字認識装置の構成図である。FIG. 4 is a configuration diagram of a character recognition device of the present invention.

【図5】前処理の説明図である。FIG. 5 is an explanatory diagram of preprocessing.

【図6】方向寄与度を観測する走査方向及び座標軸の説
明図である。
FIG. 6 is an explanatory diagram of a scanning direction and a coordinate axis for observing a direction contribution.

【図7】走査による文字部との交差検出の説明図であ
る。
FIG. 7 is an explanatory diagram of detection of intersection with a character portion by scanning.

【図8】黒点連結長の測定の説明図である。FIG. 8 is an explanatory diagram of measurement of a black dot connection length.

【図9】手書き変形のある文字パターンを示す図であ
る。
FIG. 9 is a diagram showing a character pattern with handwritten deformation.

【符号の説明】[Explanation of symbols]

10 文字認識装置 100 前処理手段 101 フレームメモリ 102 交差検出手段 104 連結長測定手段 106 方向寄与度計算手段 108 相関計算手段 110 文字パターン認識手段 112 メモリ 114 制御手段 REFERENCE SIGNS LIST 10 character recognition device 100 preprocessing means 101 frame memory 102 intersection detection means 104 connection length measurement means 106 direction contribution calculation means 108 correlation calculation means 110 character pattern recognition means 112 memory 114 control means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 2値化された文字パターンに対して、文
字部との交差を検出するため、予め定められた複数の走
査方向に文字パターンを走査し、 文字部と交差した場合に、該交差した文字部の黒画素に
ついて予め定められた複数の方向に触手を延ばして各方
向別に黒画素の連結長を求め、 該黒画素の連結長から該黒画素の文字部の方向成分別の
分布状況を表わす方向寄与度を求め、 該走査方向への走査中に文字部と複数回交差した場合
に、該複数回の交差のうち、ある交差時の文字部の方向
寄与度とそれ以前に交差した文字部の方向寄与度との相
関の値を用いて、文字パターンを認識する処理を行うこ
とを特徴とする文字認識方法。
1. A character pattern is scanned in a plurality of predetermined scanning directions in order to detect a crossing of a binarized character pattern with a character portion. The tentacles are extended in a plurality of predetermined directions with respect to the black pixels of the intersecting character portion to determine the connection length of the black pixels in each direction, and from the connection length of the black pixels, the distribution of the character portion of the black pixel for each direction component A direction contribution representing a situation is obtained, and when a character portion intersects a plurality of times during scanning in the scanning direction, the direction contribution of a character portion at a certain intersection out of the plurality of intersections intersects before that. A character recognition method characterized by performing a process of recognizing a character pattern by using a value of a correlation with a direction contribution of a character portion.
【請求項2】 2値化された文字パターンを所定の位置
から所定の方向に走査して、上記文字パターンの走査に
よって文字部との交差があるかどうかを判定する交差検
出段階と、 文字部と交差した場合に、該交差した文字部の黒画素に
ついて複数の所定の方向別に黒画素の連結長を測定し、
上記交差した文字部の黒画素に関し上記複数の方向別の
黒画素の分布状況を表わす方向寄与度を計算する方向寄
与度計算段階と、 同一位置から同一方向への走査中に文字部と複数回目に
交差した場合に、該複数回目に交差した際に計算された
一の方向寄与度と、それ以前に交差した際に計算された
他の方向寄与度との相関を計算する相関計算段階と、 上記所定の位置及び上記所定の方向を順次変化させて、
上記交差検出段階と、上記方向寄与度計算段階と、上記
相関計算段階とを繰り返し行う走査段階と、 上記計算された相関の値を用いて文字パターンを認識す
る認識段階とからなることを特徴とする文字認識方法。
2. A crossing detection step of scanning the binarized character pattern from a predetermined position in a predetermined direction to determine whether there is a crossing with a character portion by scanning the character pattern; When intersected, measure the connection length of black pixels in a plurality of predetermined directions for the black pixels of the intersected character portion,
A directional contribution calculating step of calculating a directional contribution representing a distribution state of the black pixels in the plurality of directions with respect to the black pixels of the intersecting character portion, and a character portion and a plurality of times during scanning from the same position in the same direction. When crossing, a correlation calculation step of calculating a correlation between one direction contribution calculated at the time of crossing the plurality of times and another direction contribution calculated at the time of previous crossing, By sequentially changing the predetermined position and the predetermined direction,
A scanning step of repeatedly performing the intersection detection step, the directional contribution calculation step, and the correlation calculation step, and a recognition step of recognizing a character pattern using the calculated correlation value. Character recognition method.
【請求項3】 2値化された文字パターンに文字の位置
及び大きさについて正規化処理を行う前処理手段と、 上記前処理手段によって得られた文字パターンに対し、
予め定められた複数の走査方向に文字パターンを走査
し、文字部と交差した場合に、該交差した文字部の黒画
素について予め定められた複数方向に触手を伸ばして各
方向別に黒画素の連結長を求め、該黒画素連結長から求
められる該黒画素の文字部の方向成分別の分布状況を表
わす方向寄与度を求め、該走査方向への走査中に文字部
と複数回交差した場合に該複数回の交差のうち、ある交
差時の文字部の方向寄与度とそれ以前に交差した文字部
の方向寄与度との相関を文字パターンの特徴として求め
る特徴抽出手段と、 該特徴を利用して文字パターンの識別処理を行う識別手
段とからなる文字認識装置。
3. A pre-processing means for performing a normalization process on a position and a size of a character in a binarized character pattern, and a character pattern obtained by the pre-processing means
A character pattern is scanned in a plurality of predetermined scanning directions, and when the character pattern intersects, the tentacles are extended in a plurality of predetermined directions for black pixels of the crossed character part, and black pixels are connected in each direction. The length is obtained, the directional contribution representing the distribution state of each directional component of the character portion of the black pixel obtained from the black pixel connection length is obtained. A feature extraction unit that obtains, as a feature of a character pattern, a correlation between a direction contribution of a character portion at a certain intersection and a direction contribution of a character portion that intersected before that of the plurality of intersections; A character recognizing device comprising: an identification unit for performing a character pattern identification process.
【請求項4】 2値化された文字パターンに文字の位置
及び大きさについて正規化処理を行う前処理手段、 前処理された文字パターンを所定の位置から所定の方向
に走査して、上記文字パターンの走査によって文字部と
の交差を検出する交差検出手段、 該交差した文字部の黒画素について所定の方向に黒画素
の連結長を測定し、測定された連結長をメモリに記憶す
る連結長測定手段、 上記交差した文字部の黒画素に関し、上記メモリに記憶
された連結長を用いて上記複数の方向別の黒画素の分布
状況を表わす方向寄与度を計算し、上記方向寄与度を上
記メモリに記憶する方向寄与度計算手段、 上記メモリに記憶された第1の方向寄与度と第2の方向
寄与度との相関の値を計算し、メモリに記憶する相関計
算手段、 上記メモリに記憶された上記相関の値を用いて文字パタ
ーンを認識する文字パターン認識手段、及び上記所定の
位置及び所定の方向を順次に変化させて、各位置及び各
方向毎に上記交差検出手段を作動させ、 交差が検出された場合に、複数の方向について順次に上
記連結長測定手段を作動させ、 上記交差した文字部の黒画素に関し、上記メモリに記憶
された複数の方向の連結長で上記方向寄与度計算手段を
作動させ、 所定位置かつ所定方向の走査中の文字部との交差の回数
を計数し、複数回目の交差に対応して、該複数回目に交
差した際に計算された方向寄与度を上記第1の方向寄与
度とし、それ以前に交差した際に計算された他の方向寄
与度を上記第2の方向寄与度として、上記相関計算手段
を作動させ、 順次に変化された上記所定の位置及び所定の方向につい
て上記相関の値がメモリに記憶された後、上記文字パタ
ーン認識手段を作動させるよう制御する制御手段により
構成される文字認識装置。
4. A pre-processing means for normalizing the position and size of a character to a binarized character pattern, scanning the pre-processed character pattern from a predetermined position in a predetermined direction, Intersection detection means for detecting an intersection with a character portion by scanning the pattern; measuring a connection length of the black pixel in the crossed character portion in a predetermined direction, and storing the measured connection length in a memory. Measuring means, for the black pixels of the intersecting character portion, calculating a directional contribution representing a distribution state of the black pixels for each of the plurality of directions using a connection length stored in the memory, and calculating the directional contribution; Directional contribution calculating means for storing in the memory; correlation calculating means for calculating a correlation value between the first directional contribution and the second directional contribution stored in the memory; and storing in the memory. On A character pattern recognition means for recognizing a character pattern using a correlation value, and the predetermined position and the predetermined direction are sequentially changed, and the intersection detection means is operated for each position and each direction to detect a cross. In this case, the connection length measuring means is sequentially operated in a plurality of directions, and the directional contribution calculating means is operated by the connection lengths in the plurality of directions stored in the memory for the black pixels of the intersecting character portion. Activating, counting the number of intersections with the character portion being scanned in the predetermined position and in the predetermined direction, and corresponding to the plurality of intersections, calculating the directional contribution calculated at the plurality of intersections in the first direction. And the other direction contribution calculated at the time of intersection before the second direction contribution is used as the second direction contribution to operate the correlation calculation means, and the predetermined position and the predetermined position sequentially changed About the direction After the value of the serial correlation is stored in the memory, the character recognition device including a control means for controlling to actuate the character pattern recognition means.
【請求項5】 2値化された文字パターンに文字の位置
及び大きさについて正規化処理を行う前処理プロセス
と、 上記前処理プロセスによって得られた文字パターンに対
し、予め定められた複数の走査方向に文字パターンを走
査し、文字部と交差した場合に、該交差した文字部の黒
画素について予め定められた複数方向に触手を伸ばして
各方向別に黒画素の連結長を求め、該黒画素連結長から
求められる該黒画素の文字部の方向成分別の分布状況を
表わす方向寄与度を求め、該走査方向への走査中に文字
部と複数回交差した場合に該複数回の交差のうち、ある
交差時の文字部の方向寄与度とそれ以前に交差した文字
部の方向寄与度との相関を文字パターンの特徴として求
める特徴抽出プロセスと、 該特徴を利用して文字パターンの識別処理を行う識別プ
ロセスとを有することを特徴とする文字認識プログラム
を格納した記憶媒体。
5. A pre-processing process for normalizing a binarized character pattern with respect to the position and size of a character, and a plurality of predetermined scans performed on the character pattern obtained by the pre-processing process. The character pattern is scanned in the direction, and when it intersects with the character portion, the tentacles are extended in a plurality of predetermined directions for the black pixels of the intersected character portion to determine the connection length of the black pixel in each direction, Determine the directional contribution representing the distribution of the directional component of the character portion of the black pixel obtained from the connection length, and if the character portion intersects the character portion multiple times during scanning in the scanning direction, A feature extraction process of obtaining a correlation between a direction contribution of a character part at a certain intersection and a direction contribution of a character part intersecting before that as a characteristic of a character pattern, and a character pattern identification process using the characteristic. Cormorants storage medium storing a character recognition program, characterized in that it comprises an identification process.
【請求項6】 2値化された文字パターンに文字の位置
及び大きさについて正規化処理を行う前処理プロセス、 前処理された文字パターンを所定の位置から所定の方向
に走査して、上記文字パターンの走査によって文字部と
の交差を検出する交差検出プロセス、 該交差した文字部の黒画素について所定の方向に黒画素
の連結長を測定し、測定された連結長をメモリに記憶す
る連結長測定プロセス、 上記交差した文字部の黒画素に関し、上記メモリに記憶
された連結長を用いて上記複数の方向別の黒画素の分布
状況を表わす方向寄与度を計算し、上記方向寄与度を上
記メモリに記憶する方向寄与度計算プロセス、 上記メモリに記憶された第1の方向寄与度と第2の方向
寄与度との相関の値を計算し、メモリに記憶する相関計
算プロセス、 上記メモリに記憶された上記相関の値を用いて文字パタ
ーンを認識する文字パターン認識プロセス、及び上記所
定の位置及び所定の方向を順次に変化させて、各位置及
び各方向毎に上記交差検出プロセスを作動させ、 交差が検出された場合に、複数の方向について順次に上
記連結長測定プロセスを作動させ、 上記交差した文字部の黒画素に関し、上記メモリに記憶
された複数の方向の連結長で上記方向寄与度計算プロセ
スを作動させ、 所定位置かつ所定方向の走査中の文字部との交差の回数
を計数し、複数回目の交差に対応して、該複数回目に交
差した際に計算された方向寄与度を上記第1の方向寄与
度とし、それ以前に交差した際に計算された他の方向寄
与度を上記第2の方向寄与度として、上記相関計算プロ
セスを作動させ、 順次に変化された上記所定の位置及び所定の方向につい
て上記相関の値がメモリに記憶された後、上記文字パタ
ーン認識プロセスを作動させるよう制御する制御プロセ
スにより構成されることを特徴とする文字認識装置プロ
グラムを格納した記憶媒体。
6. A pre-processing process for normalizing a character position and a size of a binarized character pattern with respect to a position and a size of the character, scanning the pre-processed character pattern from a predetermined position in a predetermined direction, An intersection detection process of detecting an intersection with a character portion by scanning a pattern; measuring a connection length of a black pixel in a predetermined direction for a black pixel of the crossed character portion; and storing the measured connection length in a memory. A measurement process, for the black pixels in the intersecting character portion, calculate a directional contribution representing a distribution state of the black pixels in each of the plurality of directions using the connection length stored in the memory; A directional contribution calculation process stored in a memory, a correlation calculation process of calculating a correlation value between the first directional contribution and the second directional contribution stored in the memory, and storing the correlation value in the memory; The character pattern recognition process for recognizing a character pattern using the correlation value stored in the memory, and the predetermined position and the predetermined direction are sequentially changed, and the intersection detection process is performed for each position and each direction. When the intersection is detected, the connection length measurement process is sequentially performed in a plurality of directions, and the black pixels of the crossed character portion are connected with the connection lengths in the plurality of directions stored in the memory. Activating the direction contribution calculation process, counting the number of intersections with the character portion being scanned at a predetermined position and in a predetermined direction, and corresponding to the plurality of intersections, the direction calculated at the time of the plurality of intersections The correlation calculation process is activated by setting the contribution as the first directional contribution and the other directional contribution calculated at the time of the previous intersection as the second directional contribution. And storing a character recognition device program comprising a control process for controlling the character pattern recognition process to operate after the correlation value is stored in a memory for the predetermined position and the predetermined direction. Storage media.
JP21780997A 1997-08-12 1997-08-12 Character recognition method and apparatus, and storage medium storing character recognition program Expired - Fee Related JP3368807B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21780997A JP3368807B2 (en) 1997-08-12 1997-08-12 Character recognition method and apparatus, and storage medium storing character recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21780997A JP3368807B2 (en) 1997-08-12 1997-08-12 Character recognition method and apparatus, and storage medium storing character recognition program

Publications (2)

Publication Number Publication Date
JPH1166236A true JPH1166236A (en) 1999-03-09
JP3368807B2 JP3368807B2 (en) 2003-01-20

Family

ID=16710086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21780997A Expired - Fee Related JP3368807B2 (en) 1997-08-12 1997-08-12 Character recognition method and apparatus, and storage medium storing character recognition program

Country Status (1)

Country Link
JP (1) JP3368807B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus

Also Published As

Publication number Publication date
JP3368807B2 (en) 2003-01-20

Similar Documents

Publication Publication Date Title
US5930380A (en) Method and apparatus for verifying static signatures using dynamic information
JP3453134B2 (en) How to determine equivalence of multiple symbol strings
CN103390164B (en) Method for checking object based on depth image and its realize device
CN102103698B (en) Image processing apparatus and image processing method
EP0385009A1 (en) Apparatus and method for use in image processing
JP2010514025A (en) Device, method and computer program for confirming road signs in images
JPH05242292A (en) Separating method
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH1139493A (en) Device and method for pattern matching regarding distance and direction
JP3661635B2 (en) Image processing method and apparatus
JPH08508128A (en) Image classification method and apparatus using distribution map
EP0446632A2 (en) Method and system for recognizing characters
US6393151B1 (en) Pattern reading system
JP3368807B2 (en) Character recognition method and apparatus, and storage medium storing character recognition program
JP2858530B2 (en) Edge enhancement device
JP2770849B2 (en) Image processing device
JP3411796B2 (en) Character recognition device
JP2965165B2 (en) Pattern recognition method and recognition dictionary creation method
JP3365941B2 (en) Character pattern recognition method and apparatus
JP2734387B2 (en) Character recognition device
JPH0877293A (en) Character recognition device and generating method for dictionary for character recognition
JP3496897B2 (en) Color image recognition method and apparatus
JP2616994B2 (en) Feature extraction device
JP3250317B2 (en) Character recognition device
JP3546827B2 (en) Character recognition device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071115

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081115

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091115

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees