JPH045781A - Character recognizing system - Google Patents

Character recognizing system

Info

Publication number
JPH045781A
JPH045781A JP2106645A JP10664590A JPH045781A JP H045781 A JPH045781 A JP H045781A JP 2106645 A JP2106645 A JP 2106645A JP 10664590 A JP10664590 A JP 10664590A JP H045781 A JPH045781 A JP H045781A
Authority
JP
Japan
Prior art keywords
character
line segment
pattern
outline
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2106645A
Other languages
Japanese (ja)
Other versions
JP2785438B2 (en
Inventor
Naoto Shinoda
信太 直人
Toru Miyamae
徹 宮前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2106645A priority Critical patent/JP2785438B2/en
Publication of JPH045781A publication Critical patent/JPH045781A/en
Application granted granted Critical
Publication of JP2785438B2 publication Critical patent/JP2785438B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve the accuracy of recognition without enlarging a dictionary capacity hardware by extracting the point of an outline form a character pattern data binarized after reading from a document and based on the result, calculating the amount of feature as a line segment by required directions. CONSTITUTION:An outline pattern is extracted from the character pattern data binarized after reading form a slip stored in a pattern register 1 by an outline extraction part 2 to decide the direction of the line segment dividing 360 deg. into 8 equal divisions from the (x, y) coordinate of the outline pattern in a direction decision part 3. Based on this result of the decision, a feature amount calculating part 4 calculates the feature amount composed of the relative position of the line segment form the (x, y) coordinate by directions to recognize the character in comparison with the amount of feature stored in an identification part 5. By such a recognition method for recognizing the positions of distributing the line segments of the character pattern by the directions of the line segments, the character is recognized with high accuracy without enlarging the storage capacity and the size of the hardware.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識方式に関し、特に文字認識装置にお
いて、文字認識精度を向上するのに好適な文字認識方式
に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a character recognition method, and particularly to a character recognition method suitable for improving character recognition accuracy in a character recognition device.

(従来の技術) 従来、文字認識装置における文字認識方式には種々の方
式か提案されている。英数字、カタカナを対象とした文
字の認識法としては、ストロークアナリシス法やパター
ンマッチンク法か多用されており、さらに文字の変形を
より吸収する方法としてパターンの線構造を解析する方
法や背景構造を解析する方法等がある。
(Prior Art) Conventionally, various methods have been proposed as character recognition methods for character recognition devices. Stroke analysis methods and pattern matching methods are often used as character recognition methods for alphanumeric characters and katakana, and methods that analyze the line structure of patterns and background structure are methods that better absorb character deformation. There are methods to analyze the

(発明か解決しようとする課顧) しかしながら、上記従来の方式では、例えばストローク
アナリシス法の場合、各文字の特徴を変形まても含めて
辞書に記述するため、辞書か膨大となり、処理時間か長
くなるという問題かある。
(Invention or problem solving problem) However, in the conventional method described above, for example, in the case of the stroke analysis method, the characteristics of each character, including the deformations, are described in the dictionary, resulting in a huge dictionary and a long processing time. There is a problem with it being long.

一方、処理時間を短くしようとするとハードウェア規模
か大きくなり、簡易的な用途には向かないという問題か
ある。
On the other hand, if an attempt is made to shorten the processing time, the hardware scale will become large, making it unsuitable for simple applications.

また、上記従来の背景構造を解析する方法では、文字の
背景部に着目し、文字線のループ、あるいは凹、凸形状
などの特徴を抽出することにより文字を識別するのであ
るか、白黒点判定等の処理方法が複雑であるという問題
がある。
In addition, in the conventional background structure analysis method described above, characters are identified by focusing on the background part of the character and extracting features such as loops of character lines or concave or convex shapes, or black and white points are determined. There is a problem in that the processing method is complicated.

本発明の目的は、このような従来の問題を解決し、文字
認識装置において、辞書容量を大きくすることなく、ハ
ードウェア規模も大きくすることなく、文字認識精度を
向上させる文字認識方式を提供することにある。
An object of the present invention is to solve such conventional problems and provide a character recognition method that improves character recognition accuracy in a character recognition device without increasing the dictionary capacity or hardware scale. There is a particular thing.

(課題を解決するための手段) 上記目的を達成するため、本発明の文字認識方式は、帳
票上の文字を読取って、2値化した文字パターンのデー
タを格納する手段と、該データより文字パターンの輪郭
を抽出する手段とを有する文字認識装置において、上記
抽出手段により抽出した文字パターンの輪郭データより
線分の方向を判別する手段と、該判別した方向別に輪郭
線分の所定の基準点からの相対位置よりなる特徴量の算
出を行う手段と、予め格納されている特徴量と上記算出
手段による算出結果の特徴量とを比較する手段とを有し
、入力文字パターンの線分の分布位置を線分の方向別に
識別することにより文字を認識することに特徴がある。
(Means for Solving the Problems) In order to achieve the above object, the character recognition method of the present invention includes means for reading characters on a form and storing binary character pattern data, and means for extracting the outline of a pattern; means for determining the direction of a line segment from the outline data of the character pattern extracted by the extraction means; and a predetermined reference point for the outline segment for each of the determined directions. means for calculating a feature quantity consisting of a relative position from , and a means for comparing a feature quantity stored in advance with a feature quantity calculated by the calculation means, It is characterized by character recognition by identifying the position according to the direction of the line segment.

(作用) 本発明においては、上記抽出手段により抽出した文字パ
ターンの輪郭データより線分の方向を判別する手段と、
該判別した方向別に輪郭線分の所定の基準点からの相対
位置よりなる特徴量の算出を行う手段と、予め格納され
ている特徴量と上記算出手段による算出結果の特徴量と
を比較する手段とを有し、入力文字パターンの線分の分
布位置を線分の方向別に識別することにより文字を認識
する。これにより、文字認識力を高めることかできる。
(Operation) In the present invention, means for determining the direction of a line segment from the outline data of the character pattern extracted by the extraction means;
means for calculating a feature amount consisting of the relative position of the contour line segment from a predetermined reference point for each of the determined directions; and means for comparing the feature amount stored in advance with the feature amount calculated by the calculation means. The system recognizes characters by identifying the distribution positions of line segments in an input character pattern according to the direction of the line segments. This can improve your character recognition skills.

(実施例) 以下、本発明の実施例を、図面により詳細に説明する。(Example) Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

第1図は、本発明の一実施例を示す文字認識方式を説明
するための図である。これは、本実施例の文字認識方式
を適用した文字認識装置のブロック図である。
FIG. 1 is a diagram for explaining a character recognition method showing an embodiment of the present invention. This is a block diagram of a character recognition device to which the character recognition method of this embodiment is applied.

第1図において、1は2値化された文字パターンを格納
するパターンレジスタ、2はパターンレジスタ1の内容
により文字パターンの輪郭を抽出する輪郭抽出部、3は
輪郭抽出部2で抽出されたx、y輪郭座標より線分を8
方向(→、/、↑。
In FIG. 1, 1 is a pattern register that stores a binarized character pattern, 2 is an outline extractor that extracts the outline of the character pattern based on the contents of pattern register 1, and 3 is an x extracted by the outline extractor 2. , the line segment is 8 from the y contour coordinates
Direction (→, /, ↑.

\、←、/、↓、−)に判別する方向判別部、4は方向
判別部3て判別した方向別文字パターンの線分の相対位
置よりなる特徴量を算出する特徴量算出部、5は文字パ
ターンを識別する識別部である。
\, ←, /, ↓, -); 4 is a feature calculation unit that calculates a feature amount consisting of the relative position of the line segment of the direction-based character pattern determined by the direction determination portion 3; This is an identification section that identifies character patterns.

パターンレジスタ1には帳票上の文字を読み取って、2
値化された文字パターンが図示しない文字パターン入力
部によって入力されている。ここでは、第2図に示す文
字パターン“A T1が格納されているものとする。輪
郭抽出部2はパターンレジスタ1の内容から、第3図に
示すように、座標(9,32)及び(11,24)を開
始点として輪郭追跡を行い、輪郭特徴を抽出する。輪郭
の抽出法は、種々の輪郭抽出法があるが、本実施例では
この公知の輪郭抽出法を用いて行うものとし、詳細につ
いては省略する。なお、輪郭追跡開始点はどの点てあっ
ても良いものとする。
Pattern register 1 reads the characters on the form and registers 2.
The digitized character pattern is input by a character pattern input section (not shown). Here, it is assumed that the character pattern "A T1" shown in FIG. 11, 24) as a starting point to extract contour features.There are various contour extraction methods, but in this example, this known contour extraction method is used. , the details are omitted. Note that the contour tracking starting point may be any point.

次に方向判別部3は輪郭抽出部2て抽出されたx、y輪
郭座標より線分の方向を判別する。ここで、判別する方
向は第4図に示される如く、8方向に判別する。すなわ
ち、 0度方向(→)については、 X l< X ; + 1かつy□= 3’;+t  
     −−−(1)45度方向(1)については、 xl<Xl+1かツy、 < yt、+       
 −−−(2)90度方向(↑)については、 X ; = X i + 1かつyt<yz+1−−−
(3)135度方向(\)については、 x 1> X i + 、かつyz< yi、!   
     −−−(4)180度方向(←)については
、 X i > X i * (かつ3’i = !/i+
+        −−−(5)225度方向(〆)に
ついては、 X□>Xl+1かつy、> Yi++        
−−−(6)270度方向(↓)については、 X i ” X i * 1かつyI> y;++  
      −−−(7)315度方向(\)について
は、 Xi<Xiφ1かつy□> y、−1−−−(8)の各
条件を判定する。この上記各条件を判定することにより
各線分の方向か判別される。
Next, the direction determining section 3 determines the direction of the line segment from the x and y contour coordinates extracted by the contour extracting section 2. Here, eight directions are determined as shown in FIG. 4. That is, for the 0 degree direction (→), X l <X; + 1 and y = 3'; + t
--- (1) For 45 degree direction (1), xl<Xl+1 or y, < yt, +
--- (2) For the 90 degree direction (↑), X ; = X i + 1 and yt<yz+1 ---
(3) For the 135 degree direction (\), x 1 > X i + and yz < yi,!
---(4) Regarding the 180 degree direction (←), X i > X i * (and 3'i = !/i+
+ --- (5) Regarding the 225 degree direction (〆), X□>Xl+1 and y, > Yi++
---(6) For the 270 degree direction (↓), X i ''X i * 1 and yI >y; ++
---(7) Regarding the 315 degree direction (\), each condition of Xi<Xiφ1 and y□> y, -1 ---(8) is determined. By determining each of the above conditions, the direction of each line segment is determined.

第5図に文字パターンのx、y座標と方向を示す。第5
図の方向(傾き)の項で“−は0度方向、゛/パは45
度方向、゛↑パは90度方向、“−″は135度方向、
 ←パは180度方向、“〆″は225度方向、“↓゛
′は270度方向、“−°゛は315度方向を示してい
る。
FIG. 5 shows the x and y coordinates and directions of the character pattern. Fifth
In the direction (tilt) of the diagram, "-" means 0 degree direction, "/pa" means 45
degree direction, ゛↑pa is 90 degree direction, “-” is 135 degree direction,
← Pa indicates a 180 degree direction, "〆" indicates a 225 degree direction, "↓゛' indicates a 270 degree direction, and "-°'' indicates a 315 degree direction.

特徴量算出部4は方向判別部3て判別された方向別にx
、y輪郭座標より線分の相対位置よりなる特徴量の算出
を行う。この特徴量算出について以下詳細に説明する。
The feature value calculation unit 4 calculates x for each direction determined by the direction determination unit 3.
, y-contour coordinates to calculate the feature amount consisting of the relative position of the line segment. This feature quantity calculation will be explained in detail below.

ここでは、特徴量として、各線分が存在する位置を用い
る。存在する位置としである線分が、x、y方向のどの
場所に存在するかをX、y成分側に数値化する。
Here, the position where each line segment exists is used as the feature amount. The position in which a certain line segment exists in the x and y directions is expressed numerically on the x and y component side.

まず、0度方向(→)の線分について考える。First, consider a line segment in the 0 degree direction (→).

X軸上での相対位置は、 y軸上での相対位置は、 ここて、()内の計算は0度方向の成分についてのみ行
い、他方向成分の時は値を○として計算する。また、H
x、 Hyは文字パターンの文字幅を示している。
The relative position on the X-axis is: The relative position on the y-axis is: Here, calculations in parentheses are performed only for the component in the 0 degree direction, and for components in other directions, the value is calculated as ○. Also, H
x and Hy indicate the character width of the character pattern.

同様にして、方向成分ごとの式を求めると以下の様に示
される。
In the same way, formulas for each direction component are obtained as shown below.

45度方向(1)については、 90度方向(↑)については、 270度方向(↓)については、 135度方向(\)については、 315度方向(−)については、 180度方向(←)については、 225度方向(〆)については、 の式より求まる。Regarding the 45 degree direction (1), Regarding the 90 degree direction (↑), Regarding the 270 degree direction (↓), Regarding the 135 degree direction (\), For the 315 degree direction (-), Regarding the 180 degree direction (←), Regarding the 225 degree direction (end), It can be found from the formula.

上記Qlx”Q8x及びQIy−Q8Vは、文字パター
ンに外接する長方形の左下(第3図中、座標(1,1)
)を原点とする座標系により演算を行う。これにより、
各線分のx+V成分の存在する位置は、y軸上の位置に
ついては下にくるほど、X軸上の位置については左にく
るほど、その特徴量か小さくなる。また、本実施例の方
法では全線分の位置に関わる重みを全て加算するため、
原点に近い部分ての線分の変化か小さな差となって表わ
れ、文字パターンに外接する長方形上ての右上の部分で
の線分の変化により左右されることとなる。したがって
、文字パターンに外接する長方形の右上(第3図中、座
標(22,321)を原点とする座標系ての上記QIx
’□Q8x −Qly ”−Qayに関する演算を行い
、その結果をそれぞれQ9に〜Q16X、Q9Y〜Q1
6yとする。
The above Qlx"Q8x and QIy-Q8V are the lower left of the rectangle circumscribing the character pattern (coordinates (1, 1 in Figure 3)
) is the origin and performs calculations using a coordinate system. This results in
As for the position where the x+V component of each line segment exists, the lower it is on the y-axis, and the further left it is on the X-axis, the smaller the feature amount becomes. In addition, in the method of this embodiment, all weights related to the positions of all line segments are added, so
This appears as a small difference in the line segment change in the area close to the origin, and is influenced by the change in the line segment in the upper right part of the rectangle circumscribing the character pattern. Therefore, in the upper right corner of the rectangle circumscribing the character pattern (in the coordinate system whose origin is
'□Q8x -Qly '' - Perform the calculation regarding Qay and send the results to Q9 ~Q16X, Q9Y ~Q1
Let it be 6y.

以上説明したQlx−Q16つ、Q1y〜Q+ayの式
を用いて第5図に示されたx、y座標及び方向データに
より演算を行う。すなわち、第5図(a)に示した外縁
輪郭、(b)に示した内縁輪郭に関して各々演算を行い
、結果は外縁輪郭と外縁輪郭との和として Q工、〜Q
tex 、QIY−QIBYが求められる。このように
、上記の演算は、複数の内縁がある文字に対しては、そ
の全線分に関して演算を行う。
Calculations are performed using the x, y coordinates and direction data shown in FIG. 5 using the equations Qlx-Q16 and Q1y to Q+ay explained above. That is, calculations are performed on the outer edge contour shown in FIG. 5(a) and the inner edge contour shown in FIG.
tex, QIY-QIBY is obtained. In this manner, the above calculation is performed for all line segments of a character that has multiple inner edges.

識別部5には認識対象文字毎のQ 1 x ” Q I
 6 x、Q131”QI6yの特徴量が格納されてい
る。識別部5は特徴量算出部4で算出された入力文字パ
ターンの特徴量QIX−Q168、Qty”0+syと
識別部5に格Qh、〜Q、6、とをマツチングさせる。
The identification unit 5 stores Q 1 x ” Q I for each character to be recognized.
6x, Q131"QI6y are stored. The identification unit 5 stores the feature quantities QIX-Q168, Qty"0+sy of the input character pattern calculated by the feature calculation unit 4, and the case Qh, ~ Match Q, 6, and so on.

これらのマツチングにおける差をマツチング距離とし、
この算出を識別部5に格納されている認識対象文字毎て
について行い、マツチング距離による並べ替えを行う。
Let the difference in these matchings be the matching distance,
This calculation is performed for each character to be recognized stored in the identification unit 5, and sorting is performed based on the matching distance.

この並へ替え結果に従って、マツチング距離の最小の文
字が認識結果として選択される。
According to the rearrangement result, the character with the minimum matching distance is selected as the recognition result.

(発明の効果) 以上説明したように、本発明によれは、文字を図形とし
てとらえ、線分の方向を考慮した方向別の特微量抽呂を
行うこととしたので、ハードウェア構成を増加すること
なく文字認識装置における文字認識精度を向上させるこ
とかてきる。
(Effects of the Invention) As explained above, according to the present invention, characters are treated as figures, and the special amount drawing is performed in each direction by considering the direction of the line segment, so that the hardware configuration is increased. It is possible to improve character recognition accuracy in a character recognition device without any problems.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す文字認識方式を説明す
るための図、 第2図は文字パターン例を示す図、 第3図は文字パターンの輪郭抽出図、 第4図は線分の方向を示す図、 第5図は座標と方向を示す輪郭特徴図である。 1:パターンレジスタ、 2:輪郭抽出部、 3二方向判別部、 4;特徴量抽出部、 5:識別部。
Fig. 1 is a diagram for explaining a character recognition method showing an embodiment of the present invention, Fig. 2 is a diagram showing an example of a character pattern, Fig. 3 is an outline extraction diagram of a character pattern, and Fig. 4 is a line segment. Figure 5 is a contour feature diagram showing coordinates and directions. 1: Pattern register, 2: Contour extraction unit, 3 Two-way discrimination unit, 4: Feature extraction unit, 5: Identification unit.

Claims (1)

【特許請求の範囲】  帳票上の文字を読取って、2値化した文字パターンの
データを格納する手段と、該データより文字パターンの
輪郭を抽出する手段とを有する文字認識装置において、 上記抽出手段により抽出した文字パターンの輪郭データ
より線分の方向を判別する手段と、該判別した方向別に
輪郭線分の所定の基準点からの相対位置よりなる特徴量
の算出を行う手段と、 予め格納されている特徴量と上記算出手段による算出結
果の特徴量とを比較する手段とを有し、入力文字パター
ンの線分の分布位置を線分の方向別に識別することによ
り文字を認識することを特徴とする文字認識方式。
[Scope of Claims] A character recognition device comprising means for reading characters on a form and storing binary character pattern data, and means for extracting the outline of the character pattern from the data, the extraction means means for determining the direction of the line segment from the contour data of the character pattern extracted by the method; and means for calculating a feature amount consisting of the relative position of the contour line segment from a predetermined reference point for each of the determined directions; and a means for comparing the feature quantity calculated by the calculation means with the feature quantity calculated by the calculation means, and the character is recognized by identifying the distribution position of the line segments of the input character pattern according to the direction of the line segments. A character recognition method that uses
JP2106645A 1990-04-24 1990-04-24 Character recognition method Expired - Fee Related JP2785438B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2106645A JP2785438B2 (en) 1990-04-24 1990-04-24 Character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2106645A JP2785438B2 (en) 1990-04-24 1990-04-24 Character recognition method

Publications (2)

Publication Number Publication Date
JPH045781A true JPH045781A (en) 1992-01-09
JP2785438B2 JP2785438B2 (en) 1998-08-13

Family

ID=14438862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2106645A Expired - Fee Related JP2785438B2 (en) 1990-04-24 1990-04-24 Character recognition method

Country Status (1)

Country Link
JP (1) JP2785438B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231188A (en) * 1988-03-11 1989-09-14 Oki Electric Ind Co Ltd Character recognizing system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231188A (en) * 1988-03-11 1989-09-14 Oki Electric Ind Co Ltd Character recognizing system

Also Published As

Publication number Publication date
JP2785438B2 (en) 1998-08-13

Similar Documents

Publication Publication Date Title
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
JPH0291778A (en) Method of recognizing pattern
US5515455A (en) System for recognizing handwritten words of cursive script
US20030185445A1 (en) Method for extracting and matching gesture features of image
WO1993007580A1 (en) Method of determining direction in local region of profile segment and method of determining lines and angles
Tsay et al. Model-guided attributed string matching by split-and-merge for shape recognition
JP4188342B2 (en) Fingerprint verification apparatus, method and program
JPH045781A (en) Character recognizing system
Chao et al. Embedded fingerprint verification system
JP2658136B2 (en) Character recognition method
Kawaguchi et al. Recognition of occluded objects by a genetic algorithm
JPH01231189A (en) Character recognizing system
JP3817281B2 (en) Information processing apparatus and method
JP2001060250A (en) Method and device for character recognition
JP2658154B2 (en) Character identification method
JP2658153B2 (en) Character identification method
JP2925303B2 (en) Image processing method and apparatus
JPH02217981A (en) Device for recognizing on-line hand-written character
Lau et al. EDT based tracing maximum thinning algorithm on grey scale images
Wong Design of a realtime high speed recognizer for unconstrained handprinted alphanumeric characters
JP2881080B2 (en) Feature extraction method
Walker Spacio-Temporal Arabic Character Recognition Using Polynomial Contour Fitting-Internal Report
Abbasi et al. Matching shapes with self-intersections
Yu et al. New algorithms for feature description, analysis and recognition of binary image contours
Tseng et al. A LEAST-SQUARES APPROACH TO MATCHING LINES

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080529

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090529

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees