JPS6262392B2 - - Google Patents

Info

Publication number
JPS6262392B2
JPS6262392B2 JP56032481A JP3248181A JPS6262392B2 JP S6262392 B2 JPS6262392 B2 JP S6262392B2 JP 56032481 A JP56032481 A JP 56032481A JP 3248181 A JP3248181 A JP 3248181A JP S6262392 B2 JPS6262392 B2 JP S6262392B2
Authority
JP
Japan
Prior art keywords
pattern
character
sub
feature matrix
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56032481A
Other languages
Japanese (ja)
Other versions
JPS57147782A (en
Inventor
Yoshuki Yamashita
Koichi Higuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP56032481A priority Critical patent/JPS57147782A/en
Publication of JPS57147782A publication Critical patent/JPS57147782A/en
Publication of JPS6262392B2 publication Critical patent/JPS6262392B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 本発明は高速で正確な文字認識方法に関するも
のである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a fast and accurate character recognition method.

一般に文字図形の認識は文字図形パターンから
ストロークを抽出し、それら抽出されたストロー
クの位置、長さ、ストローク間の相互関係等の幾
何学的な特徴を抽出する事により行なわれてい
る。そしてストロークの抽出には、次のような2
つの方法が広く用いられている。
In general, recognition of characters and figures is performed by extracting strokes from character and figure patterns and extracting geometric features such as the positions, lengths, and mutual relationships between the strokes. And to extract the stroke, the following 2
Two methods are widely used.

文字図形の輪郭を追跡することにより検出さ
れた輪郭点系列について曲率を計算し、その曲
率の大きな値の点を分割点として輪郭系列を分
割し、分割された系列を組合わせることにより
ストロークの抽出を行う。
Calculate the curvature of the contour point series detected by tracing the contour of the character shape, divide the contour series using points with large curvature values as division points, and extract strokes by combining the divided series. I do.

文字図形パターンに細線化処理を行なつて骨
格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し、急激な角度の変化点等を検出
してストロークを抽出する。
A character/figure pattern is thinned to form a skeleton, and the connectivity and skeleton pattern of the skeleton pattern is traced to detect sudden angle changes and extract strokes.

しかしの方法は文字図形パターンが大きい場
合や複雑な場合には、その処理量が増大し処理速
度の低下を招くこと。またの方法は文字図形パ
ターンを細線化する必要があり、さらにその細線
化によるパターンの歪、ヒゲの発生等の問題があ
りその後の処理を複雑化させること。等の欠点を
有している。
However, when the character/graphic pattern is large or complex, the amount of processing increases and the processing speed decreases. In addition, the method requires thinning of the character/figure pattern, and furthermore, the thinning causes problems such as distortion of the pattern and generation of whiskers, which complicates subsequent processing. It has the following disadvantages.

そこでこれらの欠点を除去する方法として、文
字図形パターンの線巾Wを検出し、前記パターン
を所望の方向に走査し、パターンの当該走査方向
における記入点の長さlと、前記線巾Wとの間
で、lnW(nは定数)を満足する記入点を取
り出すことにより走査方向のストローク成分を表
わすサブパターンを抽出し、さらに文字枠内を
(M×N)の領域(M,Nは整数)に分割して各
領域の文字線量を計算して認識する方法が提案さ
れている。第1図は漢字の「犬」について上記の
方法による認識の例を示したものである。Aに示
す文字パターンより垂直方向サブパターンB及び
水平方向サブパターンCを抽出した場合、文字パ
ターンAのストロークイ及びロは各走査方向にお
いて記入点の連続の長さがNωに満たないため、
サブパターンB及びCのいずれにも属さないこと
となる。
Therefore, as a method to eliminate these defects, the line width W of the character/figure pattern is detected, the pattern is scanned in a desired direction, and the length l of the writing point of the pattern in the scanning direction and the line width W are calculated. A sub-pattern representing the stroke component in the scanning direction is extracted by extracting entry points that satisfy lnW (n is a constant) between ), and a method has been proposed in which the character dose in each area is calculated and recognized. FIG. 1 shows an example of recognition of the kanji character "dog" using the above method. When vertical sub-pattern B and horizontal sub-pattern C are extracted from the character pattern shown in A, strokes A and B of character pattern A have continuous lengths of points less than Nω in each scanning direction, so
This means that it does not belong to either subpatterns B or C.

すなわち、当該ストロークを表わす特徴が欠落
するため文字認識が困難であるという欠点を有し
ている。
That is, it has the disadvantage that character recognition is difficult because the features representing the stroke are missing.

本発明の目的はこれらの従来技術の欠点を除去
するため、各方向のストローク成分を表わすサブ
パターン抽出の際にさらに原パターンの黒ビツト
のうち前記サブパターンに属さない黒ビツトをも
つて未定義サブパターンを抽出し、この未定義サ
ブパターンを含めて特徴マトリツクスを作成し、
文字図形認識を行なうようにしたもので以下詳細
に説明する。
The purpose of the present invention is to eliminate these drawbacks of the prior art, and when extracting subpatterns representing stroke components in each direction, furthermore, among the black bits of the original pattern, black bits that do not belong to the subpatterns are undefined. Extract the subpattern, create a feature matrix including this undefined subpattern,
This system is designed to recognize characters and figures, and will be explained in detail below.

第3図は本発明の文字認識装置に於ける実施例
を示すものである。光信号入力1は光電変換部2
において2値の量子化されたデイジタル電気信号
に変換されパターンレジスタ3に格納される。そ
れと同時に線巾計算部4において入力パターンの
線巾が計算される。垂直サブパターン抽出部5は
パターンレジスタについて垂直スキヤンを全面行
なつて、黒ビツトの連続の長さと計算部4におい
て計算された線巾との関係より垂直サブパターン
(VSP)を抽出する。同様に水平サブパターン抽
出部6は水平スキヤンにより水平サブパターン
(HSP)を、右斜めサブパターン抽出部7は右斜
め45゜スキヤンにより右斜めサブパターン
(RSP)を、左斜めサブパターン抽出部8は左斜
め45゜スキヤンにより、左斜めサブパターン
(LSP)を抽出する。
FIG. 3 shows an embodiment of the character recognition device of the present invention. Optical signal input 1 is photoelectric conversion section 2
The signal is converted into a binary quantized digital electrical signal and stored in the pattern register 3. At the same time, the line width of the input pattern is calculated in the line width calculating section 4. The vertical sub-pattern extracting section 5 performs a vertical scan on the entire pattern register, and extracts a vertical sub-pattern (VSP) from the relationship between the continuous length of black bits and the line width calculated by the calculating section 4. Similarly, the horizontal sub-pattern extraction section 6 extracts the horizontal sub-pattern (HSP) by a horizontal scan, the right-diagonal sub-pattern extraction section 7 extracts the right-diagonal sub-pattern (RSP) by a 45° right-diagonal scan, and the left-diagonal sub-pattern extraction section 8 extracts the left diagonal subpattern (LSP) by performing a left diagonal 45° scan.

未定義サブパターン抽出部9はパターンレジス
タ3に格納される黒ビツトのうち前述の全てのサ
ブパターンに属さない黒ビツトをもつて未定義サ
ブパターン(USP)を抽出する。USPはHSP,
VSP,RSP,LSPと原パターンPとの間に下記の
論理式(1)を適用することにより抽出する。
The undefined sub-pattern extractor 9 extracts an undefined sub-pattern (USP) from among the black bits stored in the pattern register 3 that do not belong to any of the aforementioned sub-patterns. USP is HSP,
The extraction is performed by applying the following logical formula (1) between VSP, RSP, LSP and the original pattern P.

USP=P〓〓〓〓 …(1) 文字枠検出部10はパターンレジスタ3内の文
字パターンに外接する文字枠を検出し、その結果
を文字枠分割決定部11へ送る。文字枠分割決定
部11は検出された文字枠内をM×Nの領域
(M,Nは整数、本実施例ではM=N=5)に分
割するためのX軸、Y軸上の分割点座標を決定す
る。ここでX軸は文字枠の水平方向を、Y軸は垂
直方向をそれぞれ示す。
USP=P〓〓〓〓 (1) The character frame detection unit 10 detects a character frame circumscribing the character pattern in the pattern register 3, and sends the result to the character frame division determination unit 11. The character frame division determining unit 11 determines dividing points on the X and Y axes for dividing the inside of the detected character frame into M×N areas (M and N are integers; in this embodiment, M=N=5). Determine the coordinates. Here, the X axis indicates the horizontal direction of the character frame, and the Y axis indicates the vertical direction.

特徴マトリクス抽出部12は、文字枠分割決定
部11により決定された分割点座標によりVSP,
HSP,RSP,LSP,USPの各サブパターンレジス
タ上の文字枠領域をM×Nの領域に分割し、各領
域の黒ビツト数Bijを計数し、線巾Wを使用して
式(2)により文字線長を示す特徴を計算し、M×N
×5次元の特徴マトリクスLijを作成する。
The feature matrix extraction unit 12 extracts VSP,
Divide the character frame area on each subpattern register of HSP, RSP, LSP, and USP into M×N areas, count the number of black bits Bij in each area, and use the line width W to calculate the Calculate the feature indicating the character line length, M×N
Create a ×5-dimensional feature matrix Lij.

ij=Bij/W …(2) その後、VSP特徴マトリクスは文字枠のx軸方
向の長さΔXで、HSP特徴マトリクスはy軸方向
の長さΔYで、RSP,LSP及びUSP特徴マトリク
スは√()+()でそれぞれ正規化を
行ない最終的にM×N×5次元の正規化特徴マト
リクスを作成する。
L ij = B ij /W...(2) Then, the VSP feature matrix is the length ΔX of the character frame in the x-axis direction, the HSP feature matrix is the length ΔY in the y-axis direction, and the RSP, LSP, and USP feature matrices are Normalization is performed using √() 2 +() 2 to finally create an M×N×5-dimensional normalized feature matrix.

識別部13は標準文字マスク(fn)と正規化
特徴マトリクス(fi)との間に式(3)で定義され
る距離(D)を適用し、Dが最小の値となるよう
な標準文字マスクのカテゴリ名を文字名出力14
に出力する。
The identification unit 13 applies the distance (D) defined by equation (3) between the standard character mask (f n ) and the normalized feature matrix (f i ), and selects a standard such that D is the minimum value. Output character mask category name as character name 14
Output to.

D=√(ni …(3) このようにして入力文字パターンの認識を行う
のである。
D=√( ni ) 2 (3) In this way, the input character pattern is recognized.

第3図は漢字「犬」の本発明の方法による認識
の例を示したものである。Aが原パターン、Bが
VSP,CがHSP,DがRSP,EがLSP,FがUSP
をそれぞれ示す。
FIG. 3 shows an example of recognition of the kanji character "dog" by the method of the present invention. A is the original pattern, B is
VSP, C is HSP, D is RSP, E is LSP, F is USP
are shown respectively.

以上説明したように本実施例では、未定義サブ
パターン(USP)を導入したことにより従来の文
字認識方法にみられたストロークの欠落がなくな
るという利点がある。
As described above, this embodiment has the advantage that the introduction of the undefined subpattern (USP) eliminates the lack of strokes seen in conventional character recognition methods.

本発明は文字パターンより所望の方向のストロ
ークを表わすサブパターンを抽出する際にさらに
未定義サブパターンを簡単な論理式を適用するこ
とにより抽出し、これを含めた特徴マトリクスを
作成して認識を行なうので、ストロークの欠落の
防止ばかりでなく簡単で、正確な文字認識を可能
にするというすぐれた効果を有する。
When extracting subpatterns representing strokes in a desired direction from a character pattern, the present invention further extracts undefined subpatterns by applying a simple logical formula, and creates a feature matrix that includes these subpatterns for recognition. This has the excellent effect of not only preventing missing strokes but also enabling simple and accurate character recognition.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来の方法によるサブパターン抽出の
説明図、第2図は本発明に係る実施例の構成図、
第3図は本発明によるサブパターン抽出例をそれ
ぞれ示したものである。 1……光信号入力、2……光電変換部、3……
パターンレジスタ、5〜9……サブパターン抽出
部、10……文字枠検出部、11……文字枠分割
決定部、12……特徴マトリクス抽出部、13…
…識別部、14……文字名出力。
FIG. 1 is an explanatory diagram of sub-pattern extraction by a conventional method, and FIG. 2 is a configuration diagram of an embodiment according to the present invention.
FIG. 3 shows examples of sub-pattern extraction according to the present invention. 1... Optical signal input, 2... Photoelectric conversion section, 3...
Pattern register, 5 to 9...Subpattern extraction unit, 10...Character frame detection unit, 11...Character frame division determination unit, 12...Feature matrix extraction unit, 13...
...Identification part, 14...Character name output.

Claims (1)

【特許請求の範囲】[Claims] 1 文字図形を光電変換し、量子化して得られた
デイジタル信号を原パターンとしてパターンレジ
スタに格納し、前記原パターンから各方向のスト
ローク成分をあらわす第1のサブパターンと、該
第1のサブパターンに属さない前記原パターン内
の黒ビツト成分をあらわす第2のサブパターンを
抽出してサブパターンレジスタに格納し、前記原
パターンの文字枠内領域を前記サブパターンレジ
スタについてM×N個の領域(M,Nは整数)に
分割し、各領域内の文字線長をあらわす特徴量を
文字の大きさで正規化して特徴マトリクスを作成
し、該特徴マトリクスを標準文字マトリクスと照
合して前記文字図形を認識する文字認識方法。
1. A digital signal obtained by photoelectrically converting and quantizing a character figure is stored in a pattern register as an original pattern, and a first sub-pattern representing stroke components in each direction from the original pattern, and the first sub-pattern are A second sub-pattern representing a black bit component in the original pattern that does not belong to is extracted and stored in a sub-pattern register, and the area within the character frame of the original pattern is divided into M×N areas ( M and N are integers), the feature amount representing the character line length in each region is normalized by the character size to create a feature matrix, and the feature matrix is compared with a standard character matrix to determine the character shape. A character recognition method that recognizes .
JP56032481A 1981-03-09 1981-03-09 Character recognizing system Granted JPS57147782A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56032481A JPS57147782A (en) 1981-03-09 1981-03-09 Character recognizing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56032481A JPS57147782A (en) 1981-03-09 1981-03-09 Character recognizing system

Publications (2)

Publication Number Publication Date
JPS57147782A JPS57147782A (en) 1982-09-11
JPS6262392B2 true JPS6262392B2 (en) 1987-12-25

Family

ID=12360172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56032481A Granted JPS57147782A (en) 1981-03-09 1981-03-09 Character recognizing system

Country Status (1)

Country Link
JP (1) JPS57147782A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0614364B2 (en) * 1985-08-29 1994-02-23 株式会社日立製作所 Figure recognition device and handwriting editing method

Also Published As

Publication number Publication date
JPS57147782A (en) 1982-09-11

Similar Documents

Publication Publication Date Title
JPS6262392B2 (en)
JPS6318787B2 (en)
JPS638514B2 (en)
JPS6262393B2 (en)
JPH0545991B2 (en)
JPS5894067A (en) Character recognizing method
JPS62154079A (en) Character recognition system
JPS6038755B2 (en) Feature extraction method
JPH0545993B2 (en)
JPH0545992B2 (en)
JPS62125485A (en) Character recognizing system
JPH0632080B2 (en) Character recognition method
JPS6038756B2 (en) Character recognition method
JPH0545990B2 (en)
JP2576491B2 (en) Feature extraction method
JP2575402B2 (en) Character recognition method
JPH01152586A (en) Character graphic recognizing method
JPS6019287A (en) Character recognizing method
JPS5953969A (en) Linear figure vector-converting system
JPH0475553B2 (en)
JPH0632081B2 (en) Character recognition method
JPS62164182A (en) Character and pattern recognizing method
JPS634231B2 (en)
JPH0420228B2 (en)
JPH035630B2 (en)