JPH045781A - Character recognizing system - Google Patents
Character recognizing systemInfo
- Publication number
- JPH045781A JPH045781A JP2106645A JP10664590A JPH045781A JP H045781 A JPH045781 A JP H045781A JP 2106645 A JP2106645 A JP 2106645A JP 10664590 A JP10664590 A JP 10664590A JP H045781 A JPH045781 A JP H045781A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line segment
- pattern
- outline
- character pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003696 structure analysis method Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、文字認識方式に関し、特に文字認識装置にお
いて、文字認識精度を向上するのに好適な文字認識方式
に関するものである。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a character recognition method, and particularly to a character recognition method suitable for improving character recognition accuracy in a character recognition device.
(従来の技術)
従来、文字認識装置における文字認識方式には種々の方
式か提案されている。英数字、カタカナを対象とした文
字の認識法としては、ストロークアナリシス法やパター
ンマッチンク法か多用されており、さらに文字の変形を
より吸収する方法としてパターンの線構造を解析する方
法や背景構造を解析する方法等がある。(Prior Art) Conventionally, various methods have been proposed as character recognition methods for character recognition devices. Stroke analysis methods and pattern matching methods are often used as character recognition methods for alphanumeric characters and katakana, and methods that analyze the line structure of patterns and background structure are methods that better absorb character deformation. There are methods to analyze the
(発明か解決しようとする課顧)
しかしながら、上記従来の方式では、例えばストローク
アナリシス法の場合、各文字の特徴を変形まても含めて
辞書に記述するため、辞書か膨大となり、処理時間か長
くなるという問題かある。(Invention or problem solving problem) However, in the conventional method described above, for example, in the case of the stroke analysis method, the characteristics of each character, including the deformations, are described in the dictionary, resulting in a huge dictionary and a long processing time. There is a problem with it being long.
一方、処理時間を短くしようとするとハードウェア規模
か大きくなり、簡易的な用途には向かないという問題か
ある。On the other hand, if an attempt is made to shorten the processing time, the hardware scale will become large, making it unsuitable for simple applications.
また、上記従来の背景構造を解析する方法では、文字の
背景部に着目し、文字線のループ、あるいは凹、凸形状
などの特徴を抽出することにより文字を識別するのであ
るか、白黒点判定等の処理方法が複雑であるという問題
がある。In addition, in the conventional background structure analysis method described above, characters are identified by focusing on the background part of the character and extracting features such as loops of character lines or concave or convex shapes, or black and white points are determined. There is a problem in that the processing method is complicated.
本発明の目的は、このような従来の問題を解決し、文字
認識装置において、辞書容量を大きくすることなく、ハ
ードウェア規模も大きくすることなく、文字認識精度を
向上させる文字認識方式を提供することにある。An object of the present invention is to solve such conventional problems and provide a character recognition method that improves character recognition accuracy in a character recognition device without increasing the dictionary capacity or hardware scale. There is a particular thing.
(課題を解決するための手段)
上記目的を達成するため、本発明の文字認識方式は、帳
票上の文字を読取って、2値化した文字パターンのデー
タを格納する手段と、該データより文字パターンの輪郭
を抽出する手段とを有する文字認識装置において、上記
抽出手段により抽出した文字パターンの輪郭データより
線分の方向を判別する手段と、該判別した方向別に輪郭
線分の所定の基準点からの相対位置よりなる特徴量の算
出を行う手段と、予め格納されている特徴量と上記算出
手段による算出結果の特徴量とを比較する手段とを有し
、入力文字パターンの線分の分布位置を線分の方向別に
識別することにより文字を認識することに特徴がある。(Means for Solving the Problems) In order to achieve the above object, the character recognition method of the present invention includes means for reading characters on a form and storing binary character pattern data, and means for extracting the outline of a pattern; means for determining the direction of a line segment from the outline data of the character pattern extracted by the extraction means; and a predetermined reference point for the outline segment for each of the determined directions. means for calculating a feature quantity consisting of a relative position from , and a means for comparing a feature quantity stored in advance with a feature quantity calculated by the calculation means, It is characterized by character recognition by identifying the position according to the direction of the line segment.
(作用)
本発明においては、上記抽出手段により抽出した文字パ
ターンの輪郭データより線分の方向を判別する手段と、
該判別した方向別に輪郭線分の所定の基準点からの相対
位置よりなる特徴量の算出を行う手段と、予め格納され
ている特徴量と上記算出手段による算出結果の特徴量と
を比較する手段とを有し、入力文字パターンの線分の分
布位置を線分の方向別に識別することにより文字を認識
する。これにより、文字認識力を高めることかできる。(Operation) In the present invention, means for determining the direction of a line segment from the outline data of the character pattern extracted by the extraction means;
means for calculating a feature amount consisting of the relative position of the contour line segment from a predetermined reference point for each of the determined directions; and means for comparing the feature amount stored in advance with the feature amount calculated by the calculation means. The system recognizes characters by identifying the distribution positions of line segments in an input character pattern according to the direction of the line segments. This can improve your character recognition skills.
(実施例) 以下、本発明の実施例を、図面により詳細に説明する。(Example) Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
第1図は、本発明の一実施例を示す文字認識方式を説明
するための図である。これは、本実施例の文字認識方式
を適用した文字認識装置のブロック図である。FIG. 1 is a diagram for explaining a character recognition method showing an embodiment of the present invention. This is a block diagram of a character recognition device to which the character recognition method of this embodiment is applied.
第1図において、1は2値化された文字パターンを格納
するパターンレジスタ、2はパターンレジスタ1の内容
により文字パターンの輪郭を抽出する輪郭抽出部、3は
輪郭抽出部2で抽出されたx、y輪郭座標より線分を8
方向(→、/、↑。In FIG. 1, 1 is a pattern register that stores a binarized character pattern, 2 is an outline extractor that extracts the outline of the character pattern based on the contents of pattern register 1, and 3 is an x extracted by the outline extractor 2. , the line segment is 8 from the y contour coordinates
Direction (→, /, ↑.
\、←、/、↓、−)に判別する方向判別部、4は方向
判別部3て判別した方向別文字パターンの線分の相対位
置よりなる特徴量を算出する特徴量算出部、5は文字パ
ターンを識別する識別部である。\, ←, /, ↓, -); 4 is a feature calculation unit that calculates a feature amount consisting of the relative position of the line segment of the direction-based character pattern determined by the direction determination portion 3; This is an identification section that identifies character patterns.
パターンレジスタ1には帳票上の文字を読み取って、2
値化された文字パターンが図示しない文字パターン入力
部によって入力されている。ここでは、第2図に示す文
字パターン“A T1が格納されているものとする。輪
郭抽出部2はパターンレジスタ1の内容から、第3図に
示すように、座標(9,32)及び(11,24)を開
始点として輪郭追跡を行い、輪郭特徴を抽出する。輪郭
の抽出法は、種々の輪郭抽出法があるが、本実施例では
この公知の輪郭抽出法を用いて行うものとし、詳細につ
いては省略する。なお、輪郭追跡開始点はどの点てあっ
ても良いものとする。Pattern register 1 reads the characters on the form and registers 2.
The digitized character pattern is input by a character pattern input section (not shown). Here, it is assumed that the character pattern "A T1" shown in FIG. 11, 24) as a starting point to extract contour features.There are various contour extraction methods, but in this example, this known contour extraction method is used. , the details are omitted. Note that the contour tracking starting point may be any point.
次に方向判別部3は輪郭抽出部2て抽出されたx、y輪
郭座標より線分の方向を判別する。ここで、判別する方
向は第4図に示される如く、8方向に判別する。すなわ
ち、
0度方向(→)については、
X l< X ; + 1かつy□= 3’;+t
−−−(1)45度方向(1)については、
xl<Xl+1かツy、 < yt、+
−−−(2)90度方向(↑)については、
X ; = X i + 1かつyt<yz+1−−−
(3)135度方向(\)については、
x 1> X i + 、かつyz< yi、!
−−−(4)180度方向(←)については
、
X i > X i * (かつ3’i = !/i+
+ −−−(5)225度方向(〆)に
ついては、
X□>Xl+1かつy、> Yi++
−−−(6)270度方向(↓)については、
X i ” X i * 1かつyI> y;++
−−−(7)315度方向(\)について
は、
Xi<Xiφ1かつy□> y、−1−−−(8)の各
条件を判定する。この上記各条件を判定することにより
各線分の方向か判別される。Next, the direction determining section 3 determines the direction of the line segment from the x and y contour coordinates extracted by the contour extracting section 2. Here, eight directions are determined as shown in FIG. 4. That is, for the 0 degree direction (→), X l <X; + 1 and y = 3'; + t
--- (1) For 45 degree direction (1), xl<Xl+1 or y, < yt, +
--- (2) For the 90 degree direction (↑), X ; = X i + 1 and yt<yz+1 ---
(3) For the 135 degree direction (\), x 1 > X i + and yz < yi,!
---(4) Regarding the 180 degree direction (←), X i > X i * (and 3'i = !/i+
+ --- (5) Regarding the 225 degree direction (〆), X□>Xl+1 and y, > Yi++
---(6) For the 270 degree direction (↓), X i ''X i * 1 and yI >y; ++
---(7) Regarding the 315 degree direction (\), each condition of Xi<Xiφ1 and y□> y, -1 ---(8) is determined. By determining each of the above conditions, the direction of each line segment is determined.
第5図に文字パターンのx、y座標と方向を示す。第5
図の方向(傾き)の項で“−は0度方向、゛/パは45
度方向、゛↑パは90度方向、“−″は135度方向、
←パは180度方向、“〆″は225度方向、“↓゛
′は270度方向、“−°゛は315度方向を示してい
る。FIG. 5 shows the x and y coordinates and directions of the character pattern. Fifth
In the direction (tilt) of the diagram, "-" means 0 degree direction, "/pa" means 45
degree direction, ゛↑pa is 90 degree direction, “-” is 135 degree direction,
← Pa indicates a 180 degree direction, "〆" indicates a 225 degree direction, "↓゛' indicates a 270 degree direction, and "-°'' indicates a 315 degree direction.
特徴量算出部4は方向判別部3て判別された方向別にx
、y輪郭座標より線分の相対位置よりなる特徴量の算出
を行う。この特徴量算出について以下詳細に説明する。The feature value calculation unit 4 calculates x for each direction determined by the direction determination unit 3.
, y-contour coordinates to calculate the feature amount consisting of the relative position of the line segment. This feature quantity calculation will be explained in detail below.
ここでは、特徴量として、各線分が存在する位置を用い
る。存在する位置としである線分が、x、y方向のどの
場所に存在するかをX、y成分側に数値化する。Here, the position where each line segment exists is used as the feature amount. The position in which a certain line segment exists in the x and y directions is expressed numerically on the x and y component side.
まず、0度方向(→)の線分について考える。First, consider a line segment in the 0 degree direction (→).
X軸上での相対位置は、
y軸上での相対位置は、
ここて、()内の計算は0度方向の成分についてのみ行
い、他方向成分の時は値を○として計算する。また、H
x、 Hyは文字パターンの文字幅を示している。The relative position on the X-axis is: The relative position on the y-axis is: Here, calculations in parentheses are performed only for the component in the 0 degree direction, and for components in other directions, the value is calculated as ○. Also, H
x and Hy indicate the character width of the character pattern.
同様にして、方向成分ごとの式を求めると以下の様に示
される。In the same way, formulas for each direction component are obtained as shown below.
45度方向(1)については、 90度方向(↑)については、 270度方向(↓)については、 135度方向(\)については、 315度方向(−)については、 180度方向(←)については、 225度方向(〆)については、 の式より求まる。Regarding the 45 degree direction (1), Regarding the 90 degree direction (↑), Regarding the 270 degree direction (↓), Regarding the 135 degree direction (\), For the 315 degree direction (-), Regarding the 180 degree direction (←), Regarding the 225 degree direction (end), It can be found from the formula.
上記Qlx”Q8x及びQIy−Q8Vは、文字パター
ンに外接する長方形の左下(第3図中、座標(1,1)
)を原点とする座標系により演算を行う。これにより、
各線分のx+V成分の存在する位置は、y軸上の位置に
ついては下にくるほど、X軸上の位置については左にく
るほど、その特徴量か小さくなる。また、本実施例の方
法では全線分の位置に関わる重みを全て加算するため、
原点に近い部分ての線分の変化か小さな差となって表わ
れ、文字パターンに外接する長方形上ての右上の部分で
の線分の変化により左右されることとなる。したがって
、文字パターンに外接する長方形の右上(第3図中、座
標(22,321)を原点とする座標系ての上記QIx
’□Q8x −Qly ”−Qayに関する演算を行い
、その結果をそれぞれQ9に〜Q16X、Q9Y〜Q1
6yとする。The above Qlx"Q8x and QIy-Q8V are the lower left of the rectangle circumscribing the character pattern (coordinates (1, 1 in Figure 3)
) is the origin and performs calculations using a coordinate system. This results in
As for the position where the x+V component of each line segment exists, the lower it is on the y-axis, and the further left it is on the X-axis, the smaller the feature amount becomes. In addition, in the method of this embodiment, all weights related to the positions of all line segments are added, so
This appears as a small difference in the line segment change in the area close to the origin, and is influenced by the change in the line segment in the upper right part of the rectangle circumscribing the character pattern. Therefore, in the upper right corner of the rectangle circumscribing the character pattern (in the coordinate system whose origin is
'□Q8x -Qly '' - Perform the calculation regarding Qay and send the results to Q9 ~Q16X, Q9Y ~Q1
Let it be 6y.
以上説明したQlx−Q16つ、Q1y〜Q+ayの式
を用いて第5図に示されたx、y座標及び方向データに
より演算を行う。すなわち、第5図(a)に示した外縁
輪郭、(b)に示した内縁輪郭に関して各々演算を行い
、結果は外縁輪郭と外縁輪郭との和として Q工、〜Q
tex 、QIY−QIBYが求められる。このように
、上記の演算は、複数の内縁がある文字に対しては、そ
の全線分に関して演算を行う。Calculations are performed using the x, y coordinates and direction data shown in FIG. 5 using the equations Qlx-Q16 and Q1y to Q+ay explained above. That is, calculations are performed on the outer edge contour shown in FIG. 5(a) and the inner edge contour shown in FIG.
tex, QIY-QIBY is obtained. In this manner, the above calculation is performed for all line segments of a character that has multiple inner edges.
識別部5には認識対象文字毎のQ 1 x ” Q I
6 x、Q131”QI6yの特徴量が格納されてい
る。識別部5は特徴量算出部4で算出された入力文字パ
ターンの特徴量QIX−Q168、Qty”0+syと
識別部5に格Qh、〜Q、6、とをマツチングさせる。The identification unit 5 stores Q 1 x ” Q I for each character to be recognized.
6x, Q131"QI6y are stored. The identification unit 5 stores the feature quantities QIX-Q168, Qty"0+sy of the input character pattern calculated by the feature calculation unit 4, and the case Qh, ~ Match Q, 6, and so on.
これらのマツチングにおける差をマツチング距離とし、
この算出を識別部5に格納されている認識対象文字毎て
について行い、マツチング距離による並べ替えを行う。Let the difference in these matchings be the matching distance,
This calculation is performed for each character to be recognized stored in the identification unit 5, and sorting is performed based on the matching distance.
この並へ替え結果に従って、マツチング距離の最小の文
字が認識結果として選択される。According to the rearrangement result, the character with the minimum matching distance is selected as the recognition result.
(発明の効果)
以上説明したように、本発明によれは、文字を図形とし
てとらえ、線分の方向を考慮した方向別の特微量抽呂を
行うこととしたので、ハードウェア構成を増加すること
なく文字認識装置における文字認識精度を向上させるこ
とかてきる。(Effects of the Invention) As explained above, according to the present invention, characters are treated as figures, and the special amount drawing is performed in each direction by considering the direction of the line segment, so that the hardware configuration is increased. It is possible to improve character recognition accuracy in a character recognition device without any problems.
第1図は本発明の一実施例を示す文字認識方式を説明す
るための図、
第2図は文字パターン例を示す図、
第3図は文字パターンの輪郭抽出図、
第4図は線分の方向を示す図、
第5図は座標と方向を示す輪郭特徴図である。
1:パターンレジスタ、
2:輪郭抽出部、
3二方向判別部、
4;特徴量抽出部、
5:識別部。Fig. 1 is a diagram for explaining a character recognition method showing an embodiment of the present invention, Fig. 2 is a diagram showing an example of a character pattern, Fig. 3 is an outline extraction diagram of a character pattern, and Fig. 4 is a line segment. Figure 5 is a contour feature diagram showing coordinates and directions. 1: Pattern register, 2: Contour extraction unit, 3 Two-way discrimination unit, 4: Feature extraction unit, 5: Identification unit.
Claims (1)
データを格納する手段と、該データより文字パターンの
輪郭を抽出する手段とを有する文字認識装置において、 上記抽出手段により抽出した文字パターンの輪郭データ
より線分の方向を判別する手段と、該判別した方向別に
輪郭線分の所定の基準点からの相対位置よりなる特徴量
の算出を行う手段と、 予め格納されている特徴量と上記算出手段による算出結
果の特徴量とを比較する手段とを有し、入力文字パター
ンの線分の分布位置を線分の方向別に識別することによ
り文字を認識することを特徴とする文字認識方式。[Scope of Claims] A character recognition device comprising means for reading characters on a form and storing binary character pattern data, and means for extracting the outline of the character pattern from the data, the extraction means means for determining the direction of the line segment from the contour data of the character pattern extracted by the method; and means for calculating a feature amount consisting of the relative position of the contour line segment from a predetermined reference point for each of the determined directions; and a means for comparing the feature quantity calculated by the calculation means with the feature quantity calculated by the calculation means, and the character is recognized by identifying the distribution position of the line segments of the input character pattern according to the direction of the line segments. A character recognition method that uses
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2106645A JP2785438B2 (en) | 1990-04-24 | 1990-04-24 | Character recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2106645A JP2785438B2 (en) | 1990-04-24 | 1990-04-24 | Character recognition method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH045781A true JPH045781A (en) | 1992-01-09 |
JP2785438B2 JP2785438B2 (en) | 1998-08-13 |
Family
ID=14438862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2106645A Expired - Fee Related JP2785438B2 (en) | 1990-04-24 | 1990-04-24 | Character recognition method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2785438B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01231188A (en) * | 1988-03-11 | 1989-09-14 | Oki Electric Ind Co Ltd | Character recognizing system |
-
1990
- 1990-04-24 JP JP2106645A patent/JP2785438B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01231188A (en) * | 1988-03-11 | 1989-09-14 | Oki Electric Ind Co Ltd | Character recognizing system |
Also Published As
Publication number | Publication date |
---|---|
JP2785438B2 (en) | 1998-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1374148B1 (en) | Method and device for recognition of a handwritten pattern | |
JPH0291778A (en) | Method of recognizing pattern | |
US5515455A (en) | System for recognizing handwritten words of cursive script | |
US20030185445A1 (en) | Method for extracting and matching gesture features of image | |
WO1993007580A1 (en) | Method of determining direction in local region of profile segment and method of determining lines and angles | |
Tsay et al. | Model-guided attributed string matching by split-and-merge for shape recognition | |
JP4188342B2 (en) | Fingerprint verification apparatus, method and program | |
JPH045781A (en) | Character recognizing system | |
Chao et al. | Embedded fingerprint verification system | |
JP2658136B2 (en) | Character recognition method | |
Kawaguchi et al. | Recognition of occluded objects by a genetic algorithm | |
JPH01231189A (en) | Character recognizing system | |
JP3817281B2 (en) | Information processing apparatus and method | |
JP2001060250A (en) | Method and device for character recognition | |
JP2658154B2 (en) | Character identification method | |
JP2658153B2 (en) | Character identification method | |
JP2925303B2 (en) | Image processing method and apparatus | |
JPH02217981A (en) | Device for recognizing on-line hand-written character | |
Lau et al. | EDT based tracing maximum thinning algorithm on grey scale images | |
Wong | Design of a realtime high speed recognizer for unconstrained handprinted alphanumeric characters | |
JP2881080B2 (en) | Feature extraction method | |
Walker | Spacio-Temporal Arabic Character Recognition Using Polynomial Contour Fitting-Internal Report | |
Abbasi et al. | Matching shapes with self-intersections | |
Yu et al. | New algorithms for feature description, analysis and recognition of binary image contours | |
Tseng et al. | A LEAST-SQUARES APPROACH TO MATCHING LINES |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080529 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090529 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |