JPS6047636B2 - Feature extraction processing method - Google Patents

Feature extraction processing method

Info

Publication number
JPS6047636B2
JPS6047636B2 JP54145031A JP14503179A JPS6047636B2 JP S6047636 B2 JPS6047636 B2 JP S6047636B2 JP 54145031 A JP54145031 A JP 54145031A JP 14503179 A JP14503179 A JP 14503179A JP S6047636 B2 JPS6047636 B2 JP S6047636B2
Authority
JP
Japan
Prior art keywords
feature
point
pattern
points
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54145031A
Other languages
Japanese (ja)
Other versions
JPS5668877A (en
Inventor
茂 赤松
和昭 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP54145031A priority Critical patent/JPS6047636B2/en
Publication of JPS5668877A publication Critical patent/JPS5668877A/en
Publication of JPS6047636B2 publication Critical patent/JPS6047636B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は、特徴抽出処理方式、特に位相幾何的にみて複
雑な構造をもつ漢字等のパタン,端点,分岐点などの位
相幾何的な特徴点を用いて識別に有効な特徴を効率的に
抽出する特徴抽出処理方式に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention is effective for identification using a feature extraction processing method, particularly topological feature points such as patterns, end points, and branch points of Chinese characters that have a topologically complex structure. The present invention relates to a feature extraction processing method for efficiently extracting features.

黒、白2値パタンを少なくとも1個含むパタン領域の各
点から予め定めた方向をみたときに見つかる位相幾何的
力な特徴をそれぞれが検出された方向の情報を保存しつ
つ各点に集積し、この結果得られる高次特徴を用いて識
別する文字読取方式として、特願昭51−85708号
が(特願昭53−10931号)が知られている。
The topological force features found when looking in a predetermined direction from each point in a pattern area containing at least one black and white binary pattern are accumulated at each point while preserving the information of each detected direction. , Japanese Patent Application No. 51-85708 (Japanese Patent Application No. 53-10931) is known as a character reading method for identifying characters using higher-order features obtained as a result.

この方式の基本部分である特徴抽出処理の原理を第1図
に示す。同図(aにおいて、文字部分(黒)6を含むパ
タン領域7の任意の白点5から上下左右4方向に走査線
を出し(右1,上2,左3,下4)て、各方向に文字分
が存在するか否かを調べる。各白点に対応して4ビット
で符号化されたコード10が用意され、上記存在状況に
応じて存在すればRlj.存在しなければROョを特徴
コード10の所定の位置にセットする。白点5が本例の
位置にあるとき、この点の特徴コード10は、右方向走
査線1に対応するビット位置11はr1ョ、上方向走査
線2に対応するビット位置12はROぅ左方向走査線3
に対応するビット位置13はr1ぅそして下方一向走査
線4に対応するビット位置14はRLである。以上の処
里を1次位相特徴抽出と呼ぶ。この処理によつてパタン
領域7の白点領域は各白点が如何なる特徴コードをもつ
かに従つていくつかに分割される。本例では、同図bに
図形的に示す.ように文字部分6の閉じ状況に応じて2
1,22,23,24,25,26,27の示す特徴コ
ードが抽出される。例えば、21は右方向1および下方
向4のみに文字部分があること、22は上方向2のみに
空きがあること、24は空き方向がないこと等を図的に
表・わす。さて、次に、1次位相特徴抽出後にパタン領
域7の各白点に形成された位相幾何的特徴、すなわち特
徴コード10を基に高次特徴を形成するようにする。
The principle of feature extraction processing, which is the basic part of this method, is shown in FIG. In the same figure (a), scanning lines are drawn in four directions (right 1, top 2, left 3, bottom 4) from an arbitrary white point 5 in the pattern area 7 including the character part (black) 6, and each direction is A code 10 encoded with 4 bits is prepared corresponding to each white point, and if it exists, it is Rlj. If it does not exist, it is Rlj. Set the feature code 10 at a predetermined position.When the white point 5 is at the position of this example, the feature code 10 of this point is that the bit position 11 corresponding to the right scanning line 1 is r1, and the upper scanning line Bit position 12 corresponding to RO
The bit position 13 corresponding to the lower scanning line 4 is r1, and the bit position 14 corresponding to the lower unidirectional scanning line 4 is RL. The above process is called primary phase feature extraction. By this processing, the white dot area of the pattern area 7 is divided into several parts according to what kind of feature code each white dot has. This example is graphically shown in Figure b. 2 depending on the closing status of the character part 6 like so.
The feature codes indicated by 1, 22, 23, 24, 25, 26, and 27 are extracted. For example, 21 graphically indicates that there is a character portion only in the right direction 1 and the downward direction 4, 22 indicates that there is space only in the top direction 2, and 24 indicates that there is no space in the direction. Next, higher-order features are formed based on the topological features formed at each white point in the pattern area 7, that is, the feature code 10, after the first-order topological features have been extracted.

このため、各白点については、自分自身の特徴コード1
0の他に、各方向に走査線を出したときに文字部分6を
越えて初めて出合う白点の特徴コードをその走査線の方
向情報を保存しつつ追加する。白点5が本例の位置にあ
るときは、その高次特徴は図的に表わせば図示特徴30
のようになる。該高次特徴30において小さな丸31は
白点5の上方向2に文字部分がないことを示す。また、
各黒点については、その点から各方向に走ノ査線を出し
たときに初めて出合う白点の特徴コードをそろ走査線の
方向情報を保存しつつ追加する。黒点8が本例の位置に
あるときはその高次特徴は図的に表わせば図示高次特徴
40のようになる。なお特願昭51−8708号(特願
昭53−10931・号)においては、1次位相特徴抽
出された特徴コード10の中で、文字変形に対し不安定
なものを安定なものに変換する統合処理を行なうように
している。例えば、特徴コードのうち特徴コード24は
、ループと区別がつかないので、該特徴コー”ド24と
接している特徴コード26に変換、即ち統合される。ま
た、黒点にその点の隣接点の白、黒の状態をみて局所領
き情報を与え、これを黒点の1次位相特徴とする特徴抽
出法、特願昭51一121792号(特願昭53−47
239号)が知られている。これら上記方式は、手書き
あるいは印字の英数字、カタカナ等の比較的単純な位相
幾何的構造をもつたパタンの特徴抽出に適している。そ
して入力文字の識別は、上記高次特徴の存在状況とカテ
コリ毎に予め用意されている高次特徴のリストとを比較
して行う。このように上記従来方式では雑音や文字の変
形に強くパタンの構造をかなり詳細に表現する特徴コー
ドが得られる反面、漢字等のストロークの複雑に絡みあ
つた構造をもつパタンにおいて識別に重要な役割を演す
ると考えられる端点・分岐点・交点・屈曲点等の位相幾
何的特徴点についての記述能力は、場合によつてはその
存在を文字線上の高次特徴によつて間接的に表現しうる
という程度であり、また複数の位相幾何的特徴点の上・
下・左・右の位置関係を記述した高次特徴を表わす特徴
コードを抽出することができないという欠点があつた。
Therefore, for each white point, its own feature code 1
In addition to 0, a characteristic code of a white point that is encountered for the first time beyond the character portion 6 when a scanning line is drawn in each direction is added while preserving the direction information of the scanning line. When the white point 5 is at the position of this example, its higher-order feature is represented graphically as the illustrated feature 30.
become that way. In the higher-order feature 30, a small circle 31 indicates that there is no character portion in the upper direction 2 of the white point 5. Also,
For each black point, the feature code of the white point encountered for the first time when scanning lines are drawn in each direction from that point is added while preserving the direction information of the scanning line. When the black point 8 is located at the position of this example, its higher-order feature is represented graphically as the illustrated higher-order feature 40. Furthermore, in Japanese Patent Application No. 51-8708 (Japanese Patent Application No. 10931/1982), among the feature codes 10 extracted from the primary phase features, those that are unstable against character deformation are converted into stable ones. I am trying to perform an integration process. For example, the feature code 24 of the feature codes is indistinguishable from a loop, so it is converted into the feature code 26 that is in contact with the feature code 24. Also, the point adjacent to the black point is A feature extraction method that looks at the white and black states, gives local area information, and uses this as the primary phase feature of the sunspot, Japanese Patent Application No. 51-121792 (Japanese Patent Application No. 53-47)
No. 239) is known. These methods are suitable for extracting features of patterns with relatively simple topological structures, such as handwritten or printed alphanumeric characters and katakana characters. The input character is identified by comparing the presence status of the higher-order features with a list of higher-order features prepared in advance for each category. In this way, the conventional method described above can obtain a feature code that is resistant to noise and character deformation and expresses the structure of the pattern in considerable detail, but on the other hand, it plays an important role in identifying patterns that have a complex structure of strokes such as kanji. In some cases, the ability to describe topological feature points such as end points, branch points, intersections, and bending points that are considered to represent Moreover, on multiple topological feature points,
The drawback was that it was not possible to extract feature codes representing higher-order features that described the positional relationships of bottom, left, and right.

本発明は、これらの欠点を解決する為に、パタン面上の
白点に予め定められた方向に存在する端点・交点・分岐
点・屈曲点等の位相幾何的特徴点の情報コードを集積さ
せた高次特徴を表現する特徴コードを抽出できるように
することを目的としており、以下図面について詳細に説
明する。
In order to solve these drawbacks, the present invention integrates information codes of topological feature points such as end points, intersections, branch points, bending points, etc. that exist in a predetermined direction on a white point on a pattern surface. The purpose of this invention is to enable extraction of feature codes expressing higher-order features, and the drawings will be described in detail below.

第2図は本発明の実施例であつて、50は走査部、60
はパタンメモリ部、61はパタンメモリ、70は特徴抽
出部、80は識別部、90は制御部、100は特徴集積
部、810は出力端子である。これを動作するには、制
御部90の指令により走査部50が紙面を走査し、用紙
上の1文字を含む領域の2値信号(黒及び白)がパタン
メモリ61の所定のアドレスに順次格納される。
FIG. 2 shows an embodiment of the present invention, in which 50 is a scanning section, 60
is a pattern memory section, 61 is a pattern memory, 70 is a feature extraction section, 80 is an identification section, 90 is a control section, 100 is a feature accumulation section, and 810 is an output terminal. To operate this, the scanning unit 50 scans the paper surface according to a command from the control unit 90, and the binary signals (black and white) of the area containing one character on the paper are sequentially stored at a predetermined address in the pattern memory 61. be done.

パタンメモリ61上では、パタン領域内の1メッシュに
対して予め定められたWOrd数から成るメモリアドレ
スが割りあてられている。パタン領域内の信号がパタン
メモリ61に格納され終ると、制御部90の指令を受け
、特徴点抽出部70は予め定められた手順でパタンメモ
リ61の内容を読み出し、格納された文字パタン上の端
点・交点・分岐点・屈曲点などを位相幾何的特徴点とし
て検出する。上記特徴点のいずれかが検出されるとパタ
ンメモリ61上の対応するアドレスの予め定められた数
ビットに該位相幾何的特徴点を表わす特徴点コードが格
納される。特徴点抽出部70による動作が終了すると、
制御部90の指令により予め定められた手順に従つてパ
タンメモリ60はパタンメモリ61を上下左右あるいは
斜めに走査しつつその内容を読み出し、特徴集積部10
0ではパタン領域の白点に対応するアドレスから読み出
された内容について該白点の上下左右あるいは斜めに存
在する位相幾何的特徴点の特徴点コードを予め定められ
たビット構成に従つて配分することにより書きかえて特
徴コードを合成し、これをパタンメモリ61上の対応す
るアドレスに転送する。パタンメモリ部60、特徴集積
部100を使つた一連の動作が終了すると、パタンメモ
リ61の内容は識別部80に順次転送される。識別部8
0ではパタン領域の各メッシュに対応するパタンメモリ
61上のアドレスに記録された特徴コードを読み出し、
その種類と各々の個数とを求めてこの情報に基づいて入
力文字が何であつたかを決定し、その結果を出力端子8
10に出力する。尚、特徴集積部100では、文字パタ
ン上の端点・交点・分岐点・屈曲点から成る特徴点コー
ドを白点上へ集積する上記の処理と並行してその他の特
徴集積処理を行ない、それらの集積処理の結果得られる
複数種のコードを予め定められたビット構成に配分して
特徴コードを合成し、その結果を識別部80に提供する
ことができるが、上記他の集積処理とその回路構成につ
いてはその一例が特願昭51一85708号(特願昭5
3−10931号)に示されてあり、また本発明の要旨
と直接関連しないので詳しい説明は省略する。特徴点抽
出部70は、パタンメモリ61に格納されている文字パ
タンを細線化し、その後得られる文字線のスケルトン上
の黒点に、例えば3×3メッシュ等の大きさをもつ各特
徴のテンプレートを重ね合せ細線化パタンとのパタンマ
ッチングをとる方法、或いは文字線上の任意の黒点を中
心とする一定半径小円の円周と文字線とが交叉する回数
とその交叉点位置により判定する方法などによつて、位
相幾何的特徴点たとえば端点・交点・分岐点・屈曲点を
検出し、パタンメモリ61の所定のアドレスに格納する
。この種の特徴抽出法は既に知られており、公知の技術
を利用することができる。第3図に細線化パタン700
と、これから検出される端点701,702,703,
704,705、交点706、分岐点707,708,
709、屈曲点710を一例として示す。特徴点抽出部
70の出力としてパタンメモリ61上の対応するアドレ
スに記録される特徴点コードは任意に定めることができ
るが、第4図にその実施例ビット構成を示す。610は
パタンメモリ61上の1メッシュに対応するアドレスに
用意された1語以上から成るメモリ(当該アドレスの内
容)であり、620は該メッシュの特徴点コードを記述
するビット部分である。
On the pattern memory 61, memory addresses consisting of a predetermined number of words are assigned to one mesh within the pattern area. When the signals in the pattern area have been stored in the pattern memory 61, the feature point extraction unit 70 reads out the contents of the pattern memory 61 according to a predetermined procedure in response to a command from the control unit 90, and Detect end points, intersections, branch points, bending points, etc. as topological feature points. When any of the above feature points is detected, a feature point code representing the topological feature point is stored in a predetermined number of bits of the corresponding address on the pattern memory 61. When the operation by the feature point extraction unit 70 is completed,
The pattern memory 60 scans the pattern memory 61 vertically, horizontally, or diagonally according to a predetermined procedure according to a command from the control unit 90, reads out the contents, and then reads the contents of the pattern memory 61.
0, for the content read from the address corresponding to the white point in the pattern area, feature point codes of topological feature points that exist above, below, left, right, or diagonally of the white point are distributed according to a predetermined bit configuration. This rewrites and synthesizes a feature code, and transfers this to the corresponding address on the pattern memory 61. When a series of operations using the pattern memory section 60 and the feature accumulation section 100 are completed, the contents of the pattern memory 61 are sequentially transferred to the identification section 80. Identification part 8
At 0, the feature code recorded at the address on the pattern memory 61 corresponding to each mesh in the pattern area is read out,
The type and number of each character are determined, and based on this information, it is determined what the input character was, and the result is sent to the output terminal 8.
Output to 10. Note that the feature accumulation unit 100 performs other feature accumulation processing in parallel with the above processing of accumulating feature point codes consisting of end points, intersections, branch points, and bending points on the character pattern onto white points. A plurality of types of codes obtained as a result of the integration process can be allocated to a predetermined bit configuration to synthesize a feature code, and the result can be provided to the identification unit 80, but the above-mentioned other integration process and its circuit configuration An example of this is Japanese Patent Application No. 51-85708 (Japanese Patent Application No. 51-85708)
No. 3-10931), and since it is not directly related to the gist of the present invention, detailed explanation will be omitted. The feature point extracting unit 70 thins the character pattern stored in the pattern memory 61, and then overlays a template of each feature having a size of, for example, 3×3 mesh on the black dots on the skeleton of the character line obtained. A method of pattern matching with a combined thinning pattern, or a method of determining based on the number of times the character line intersects the circumference of a small circle with a constant radius centered on an arbitrary black point on the character line and the position of the intersection point. Then, topological feature points such as end points, intersections, branch points, and bending points are detected and stored at predetermined addresses in the pattern memory 61. This type of feature extraction method is already known, and known techniques can be used. Figure 3 shows a thinning pattern 700.
And the end points 701, 702, 703, which will be detected from now on,
704, 705, intersection 706, branching point 707, 708,
709 and bending point 710 are shown as an example. The feature point code recorded at the corresponding address on the pattern memory 61 as the output of the feature point extractor 70 can be arbitrarily determined, and FIG. 4 shows an example bit configuration thereof. 610 is a memory consisting of one or more words prepared at an address corresponding to one mesh on the pattern memory 61 (contents of the address), and 620 is a bit portion that describes the feature point code of the mesh.

ビット629は該メッシュ点が前記の位相幾何的特徴点
として検出された場合にRlJ.その他の場合にはRO
Jとなつて特徴点を弁別し、ビット621。622,6
23,624,625,626,627,628は該メ
ッシュ点が位相幾何的特徴点として検出された場合に、
各々611,612,613,614,615,616
,617,618の方向に文字線が連続している時のみ
にRlJとすることにより、該位相幾何的特徴点の種別
をコード化している。
Bit 629 indicates RlJ. if the mesh point is detected as the topological feature point. In other cases, RO
Discriminate the feature points as J, bits 621, 622, 6
23, 624, 625, 626, 627, 628 are when the mesh point is detected as a topological feature point,
611, 612, 613, 614, 615, 616 respectively
, 617, and 618, the type of the topological feature point is coded by specifying RlJ only when the character lines are continuous in the directions of , 617, and 618.

第5図は特徴集積部100において、白点に対して予め
定められた方向に存在する端点・交点・分岐点・屈曲点
等の位相幾何的特徴点を表わす特徴点コードを集積させ
て高次特徴を形成することを目的とする高次化回路の一
実施例のブロック図である。
FIG. 5 shows that feature point codes representing topological feature points such as end points, intersections, branch points, bending points, etc. existing in a predetermined direction with respect to the white point are accumulated in the feature accumulation unit 100 to obtain higher-order FIG. 2 is a block diagram of an embodiment of a high-order circuit for forming features.

この部分では、パタン領域7上の各白点に対して、第6
図のように上下左右各方向から該白点630上を通る走
査線631,632,633,634と中心線としてそ
の両側の予め定められた数の走査線ではさまれた領域6
41,642,643,644の内部に存在する端点・
交点・分岐点・屈曲点等の位相幾何的特徴点のうちで前
記中心走査線631,632,633,634に最も近
いもののコードを各々定められたビット構成で高次化し
、該白点630上の高次特徴を表わす特徴コードを形成
させる。第5図の動作内容を説明する便宜上、パタンメ
モリ61上の1メッシュに対応するアドレスの内容61
0のビット構成の一実施例を表わす第7図を参照する。
In this part, for each white point on the pattern area 7, the sixth
As shown in the figure, an area 6 sandwiched between scanning lines 631, 632, 633, and 634 passing above the white point 630 from the top, bottom, left, and right directions and a predetermined number of scanning lines on both sides of the center line.
End points that exist inside 41,642,643,644
Among the topological feature points such as intersections, branch points, and bending points, the code of the one closest to the center scanning line 631, 632, 633, and 634 is enhanced with a predetermined bit configuration, and the code is placed on the white point 630. A feature code representing the higher-order features of is formed. For convenience of explaining the operation contents in FIG. 5, the contents 61 of the address corresponding to one mesh on the pattern memory 61
Reference is made to FIG. 7, which depicts one embodiment of a zero bit configuration.

619は該メッシュが黒点の時RlJl白点の時ROJ
となつて黒白の区別を行なうビットであり、620は第
4図に示した如く黒点上の位相幾何的特徴点に対してビ
ット629をRljとすることにより同特徴点のコード
を記述する部分である。
619 is RlJ when the mesh is a black point, ROJ when it is a white point.
620 is a bit that distinguishes between black and white, and 620 is a part that describes the code of the topological feature point on the black point by setting bit 629 to Rlj as shown in Fig. 4. be.

さらに650ま特徴集積部100によつて得られる白点
の高次特徴を記述する部分であり、651,652,6
53,654はそれぞれ該白点の上方向、下方向、左方
向、右方向に存在する位相幾何的特徴点の特徴点コード
を記述している。尚、黒点における620及び白点にお
ける650はアドレスの内容610の中で共通のビット
列を共有して使用することができるが、第7図において
は便宜上別個に表現してある。第5図において、結線6
61からパタンメモリ61上の前記中心走査線631(
又は632,633,634)上のメッシュ点の内容が
、制御部.90よりの指令901に従つて現在レジスタ
101に読み出され、それと同期して、該中心走査線の
両側の領域641(又は642,643,644)に含
まれる走査線(その数を加とする)上のメッシュ点アド
レスの内容が結線622から・加個の現在レジスタ10
2に読み出される。現在レジスタ101,102の内容
610は論理回路103,104にそれぞれ転送され、
ビット619,629の判定によつて該メッシュ点が、
端点・交点・分岐点・屈曲点等の文字線上の位相幾何的
特徴点であることが判明した時には、指令951,95
2により現在レジスタ101,102の内容はマスク回
路105,106に転送される。マスク回路105,1
06では現在レジスタ101,102より転送された内
容610の内特徴点コードに相当する部分620だけを
とり出して過去レジスタ107,108に転送する。一
方、論理回路103,104におけるビット619,6
29の判定によつて、該メッシュ点が前記位相幾何的特
徴点以外の黒点であり、且つ走査線上の1つ前のメッシ
ュ点が白点であつたと判明した場合には、端点・交点・
分岐点・屈曲点等の特徴点が存在しないことを表わすビ
ット列620の特徴点コードをコード発生器109によ
り求め、指令953,954によりこれを過去レジスタ
107,108に転送する。さらに論理回路103にお
ける中心走査線上のメッシュ点630の内容判定の結果
、該メッシュ点が白点と判明した場合には、指令955
及び制御部90よりの指令によつて過去レジスタ107
,108の内容が、まず領域641(又は642,64
3,644)内にある加本の走査線のうちで中心走査線
631(又は632,633,634)から離れた走査
線に対応する過去レジスタ10から近い走査線に対応す
る過去レジスタ108への順に逐次読み出され、最後に
中心走査線631(又は632,633,634)に対
応する過去レジスタ107から読み出され、比較回路1
10に転送される。比較回路110では過去レジスタ1
07,108より逐次転送される特徴点コードがコード
発生器109より得られる1特徴点が存在しないョこと
を意味する特徴点コードと比較し、これと一致しない時
のみ指令956により該過去レジスタの内容を一時記憶
レジスタ111に転送する。加個の過去レジスタの内容
が全て比較回路110にて処理された時点で一時記憶レ
ジスタ111には、領域641(又は624,643,
644)内に存在し且つ最も中心走査線631(又は6
32,633,634)に近い位相幾何的特徴点の特徴
点コードが格納されており、その内容は制御部90よに
指令903によりシフト回路112転送される。シフト
回路112では、一時記憶レジスタ111に格納されて
いる内容のうち620部分に相当する特徴点コードを、
制御部90から指令904によつて与えられる走査方向
に応じて651,652,653,654のいずれかの
部分に対応させるべくシフト処理を行なう。上記シフト
回路112の出力と、現在レジスタ101に格納された
当該白点630のパタンメモリ内容とを0R回路113
において合成することによつて、該走査方向によつて決
まる651,652,653,654のいずれかの部分
に特徴点コードが集積された結果が求められ、現在レジ
スタ101に書き込まれる。最後に制御部90からの指
令905によつて、651,652,653,654の
いずれか所定の位置に新たに特徴点コードが集積された
現在レジスタの内容は、結線663によつてパタンメモ
リ61上の対応するアドレスに書き込まれる。尚、第5
図中AはAND回路、0は0R回路である。以上の特徴
集積部100の高次化回路の動作によつてパタンメモリ
61上に求められる高次特徴の一例を、第3図の細線化
パタン700に対応する第8図を参照して説明する。
Furthermore, 650 is a part that describes the high-order features of the white point obtained by the feature accumulation unit 100, and 651, 652, 6
Reference numerals 53 and 654 describe feature point codes of topological feature points located above, below, to the left, and to the right of the white point, respectively. Although 620 at the black point and 650 at the white point can share and use a common bit string in the address content 610, they are expressed separately in FIG. 7 for convenience. In Figure 5, connection 6
61 to the center scanning line 631 (
or 632, 633, 634), the contents of the mesh points on the control unit. In accordance with the command 901 from 90, the scanning lines (the number of which is added) included in the area 641 (or 642, 643, 644) on both sides of the central scanning line are read out to the register 101 in synchronization with the current reading. ) The contents of the mesh point address above are added from the connection 622 to the current register 10.
2. The contents 610 of the current registers 101 and 102 are transferred to the logic circuits 103 and 104, respectively.
Based on the determination of bits 619 and 629, the mesh point is
When it is found that it is a topological feature point on a character line such as an end point, intersection, branch point, or bend point, commands 951 and 95 are issued.
2, the contents of the current registers 101 and 102 are transferred to the mask circuits 105 and 106. Mask circuit 105,1
In step 06, only the portion 620 corresponding to the feature point code is extracted from the contents 610 transferred from the current registers 101 and 102 and transferred to the past registers 107 and 108. On the other hand, bits 619 and 6 in logic circuits 103 and 104
29, if it is found that the mesh point is a black point other than the topological feature point, and the previous mesh point on the scanning line is a white point, the end point, intersection point,
The feature point code of the bit string 620 indicating that there is no feature point such as a branch point or bending point is determined by the code generator 109, and is transferred to the past registers 107, 108 by commands 953, 954. Further, as a result of content determination of the mesh point 630 on the center scanning line in the logic circuit 103, if the mesh point is found to be a white point, the command 955
and the past register 107 according to the command from the control unit 90.
, 108 is first stored in the area 641 (or 642, 64
3,644) from the past register 10 corresponding to the scan line far from the center scan line 631 (or 632, 633, 634) to the past register 108 corresponding to the scan line close to the center scan line 631 (or 632, 633, 634) The past register 107 corresponding to the center scanning line 631 (or 632, 633, 634) is finally read out, and the comparison circuit 1
Transferred to 10. In the comparison circuit 110, past register 1
The feature point code sequentially transferred from 07 and 108 is compared with the feature point code obtained from the code generator 109, which means that one feature point does not exist. Transfer the contents to temporary storage register 111. When all the contents of the additional past registers have been processed by the comparison circuit 110, the temporary storage register 111 has an area 641 (or 624, 643,
644) and the most central scan line 631 (or 6
32, 633, 634) are stored, and the contents thereof are transferred to the shift circuit 112 by a command 903 from the control unit 90. The shift circuit 112 converts feature point codes corresponding to 620 parts of the contents stored in the temporary storage register 111 into
Shift processing is performed to correspond to any one of portions 651, 652, 653, and 654 according to the scanning direction given by command 904 from control section 90. The output of the shift circuit 112 and the pattern memory contents of the white point 630 currently stored in the register 101 are transferred to the 0R circuit 113.
By compositing at , a result in which feature point codes are accumulated in any part of 651, 652, 653, and 654 determined by the scanning direction is obtained and is currently written to the register 101. Finally, according to a command 905 from the control unit 90, the contents of the current register in which the feature point code has been newly accumulated at any predetermined position of 651, 652, 653, or 654 are transferred to the pattern memory 61 by a connection 663. written to the corresponding address above. Furthermore, the fifth
In the figure, A is an AND circuit, and 0 is an 0R circuit. An example of a higher-order feature obtained on the pattern memory 61 by the operation of the higher-order circuit of the feature accumulation section 100 described above will be explained with reference to FIG. 8, which corresponds to the thinning pattern 700 of FIG. 3. .

図中670に示す小領域内の白点に対応するパタンメモ
リ上では抽象図形680によつて表現される意味をもつ
高次特徴が形成される。即ち、681,682,684
はそれぞれ端点701,704,703に種類と表わし
、これを記述する特徴点コードが第7図651,652
,654部分に集積され、683は左方向に特徴点が存
在しないことを示す記号で、これを記述する特徴点コー
ドが第7図653部分に集積され、高次特徴コード65
0が形成される。本実施例では、複数加+1個(第8図
ではm=1)の走査線上を同時に走査することにより第
8図に示す例のように、パタンの位置のずれによつて端
点701を通る走査線671と端点703を通る走査線
672とが同一でない場合にも、上下に681,682
に示す種類の2つの端点をもつことを示す安定な高次特
徴680が形成されている。同様に抽象図形685は小
領域674内の白点に対応するパタンメモリ上に形成さ
れる高次特徴の意味を図示している。図中686は屈曲
点710の種類を表わしている。上記の実施例に於いて
は、走査線は上下左右の4方向としたが、本発明は該4
方向全てを行なう場合に限定されるものではなく、該4
方向の内特定の方向に存在する特徴点だけを集積させる
ことも可能であり、また逆に走査方向は上下左右に限定
されるものではない。
A high-order feature having a meaning expressed by an abstract figure 680 is formed on the pattern memory corresponding to a white point in a small area shown at 670 in the figure. That is, 681,682,684
The types are expressed at the end points 701, 704, and 703, respectively, and the minutiae codes that describe these are shown in Fig. 7, 651, 652.
, 654, and 683 is a symbol indicating that there are no feature points in the left direction, and the feature point code describing this is accumulated in the 653 part in FIG. 7, and the higher-order feature code 65
0 is formed. In this embodiment, by simultaneously scanning a plurality of +1 (m=1 in FIG. 8) scanning lines, as shown in the example shown in FIG. Even if the line 671 and the scanning line 672 passing through the end point 703 are not the same, the lines 681 and 682 are
A stable higher-order feature 680 is formed which is shown to have two endpoints of the type shown in FIG. Similarly, an abstract figure 685 illustrates the meaning of a higher-order feature formed on the pattern memory corresponding to a white point within the small area 674. In the figure, 686 represents the type of bending point 710. In the above embodiment, the scanning lines were arranged in four directions: top, bottom, left and right.
It is not limited to the case where all directions are performed, but the four directions are
It is also possible to accumulate only feature points existing in a specific direction among the directions, and conversely, the scanning direction is not limited to the top, bottom, left, and right.

一例として、675に示す斜め方向の走査を行なえば小
領域676には抽象図形690に示される意味をもつ高
次特徴を得ることができる。また上記実施例に於ては、
複数の加+1本の走査線によつて特徴集積を行なう場合
を示しているが、m=0とすることにより特徴の安定性
は劣るものの、より簡単な装置構成によつて、中心走査
線のみを用いた特徴集積処理を行なうことも可能である
For example, by performing diagonal scanning as shown in 675, a high-level feature having the meaning shown in abstract figure 690 can be obtained in small area 676. Further, in the above embodiment,
The case where feature accumulation is performed using multiple additions + one scanning line is shown, but although the stability of the features is inferior by setting m = 0, it is possible to accumulate only the central scanning line by using a simpler device configuration. It is also possible to perform feature accumulation processing using .

以上説明したように本発明による特徴抽出処理方式によ
れば、単純な装置構成によつて、パタン構造を記述する
特徴を抽出できて識別処理も簡単な特願昭51−857
08号(特願昭53−10931号)の方法と整合性を
もち、従来法ではその記述能力が不充分であつた文字線
上の端点・交点・分岐点・屈曲点等の位相幾何的特徴点
の存在とその位置関係とを集積させた高次特徴を抽出す
ることがてきるので、漢字などの位相幾何的に複雑な構
造をもつパタンの識別に有効な特徴を抽出できる利点が
ある。
As explained above, according to the feature extraction processing method according to the present invention, features describing a pattern structure can be extracted with a simple device configuration, and identification processing is also simple.
It is consistent with the method of No. 08 (Japanese Patent Application No. 53-10931), and the topological feature points such as end points, intersections, branch points, bending points, etc. on character lines whose descriptive ability was insufficient in the conventional method. Since it is possible to extract high-order features that accumulate the presence of characters and their positional relationships, it has the advantage of being able to extract features that are effective in identifying patterns with topologically complex structures such as Chinese characters.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来の方式における特徴抽出方法を概念的に説
明する説明図、第2図は本発明の一実施例構成、第3図
は第2図の特徴点抽出部によつて得られる細めパタン上
の特徴点の例を示す説明図、第4図は第3図の特徴点を
記述する第2図パタンメモリのビット構成を示す説明図
、第5図は第2図特徴集積部の高次化回路の一実施例ブ
ロック図、第6図は第5図の処理をパタン領域について
説明する説明図、第7図は第2図のパタンメモリ上の高
次特徴のビット構成を示す説明図、第8図は高次特徴の
概念をパタン領域上で図的に示す説明図を示す。 図中、50は走査線、60はパタンメモリ部、61はパ
タンメモリ、70は特徴点抽出部、80は識別部、90
は制御部、100は特徴集積部を表わす。
FIG. 1 is an explanatory diagram conceptually explaining a conventional feature extraction method, FIG. 2 is a configuration of an embodiment of the present invention, and FIG. 4 is an explanatory diagram showing an example of feature points on a pattern. FIG. 4 is an explanatory diagram showing the bit configuration of the pattern memory in FIG. 2 that describes the feature points in FIG. FIG. 6 is an explanatory diagram for explaining the processing in FIG. 5 for the pattern area; FIG. 7 is an explanatory diagram showing the bit configuration of higher-order features on the pattern memory in FIG. 2. , FIG. 8 is an explanatory diagram that graphically illustrates the concept of higher-order features on a pattern area. In the figure, 50 is a scanning line, 60 is a pattern memory section, 61 is a pattern memory, 70 is a feature point extraction section, 80 is an identification section, 90
1 represents a control unit, and 100 represents a feature accumulation unit.

Claims (1)

【特許請求の範囲】 1 黒白の2値パタンを含むパタン領域内の各点につい
て、その点から予め定められた方向を見た時に見つかる
位相幾何的な特徴をそれぞれが検出された方向の情報を
保存しつつ各点に集積することにより高次特徴を求め、
この結果パタン領域上の各点に得られる高次特徴を用い
て認識対象文字を識別する文字読取方式において、パタ
ンの文字線上の位相幾何的な特徴として端点・分岐点・
交点・屈曲点の少なくとも1つあるいは複数個を検出し
て対応する黒点にコード化して形成する手段と、このよ
うにして文字線上の黒点に形成された特徴点コードを予
め定められた方向に集積させて文字背景白部の白点に高
次特徴を形成させる手段とを設け、文字線上の位相幾何
的な特徴点の存在を表現する特徴コード、及び背景白部
からみた位相幾何的な特徴点相の位置関係を表現する特
徴コードを抽出する。 ことを特徴とする特徴抽出処理方式。 2 ドキュメント上の文字を走査して走査信号を黒白2
値化して出力する走査部と、2値パタンを含むパタン領
域をその一部として格納する1メッシュあたり複数ビッ
トのM×Nのパタンメモリ部と、当該パタンメモリ上に
格納されているパタン上の任意の点についてその点から
予め定められた方向を見た時に見つかる位相幾何的な特
徴をそれぞれが検出された方向の情報を保存しつつ各点
に集積することにより得られる高次特徴を表現した特徴
コードを当該パタンメモリ上に形成させる特徴抽出部と
、当該パタン上に抽出された高次特徴を表わす特徴コー
ドを処理して入力文字がどのカテゴリに属するかを決定
する識別部と、それぞれの回路に必要なタイミング信号
を発生する制御部とから構成される文字読取方式におい
て、 上記特徴抽出部は、パタン上の黒点について端点・分岐
点・交点・屈曲点の少なくとも1つあるいは複数個の位
相幾何的特徴を抽出し、これを表現する特徴点コードを
パタンメモリ上に格納する特徴点抽出部と、パタン面上
を予め定められた方向に走査し当該黒点上の位相幾何的
な特徴を表現した特徴点コードを該方向に対応づけてパ
タンメモリ上の白点に集積させて得られる新たな高次特
徴を表現する特徴コードを形成させる特徴集積部とをそ
なえ、上記識別部は少なくとも白点上の当該高次特徴を
含めた特徴コードを用いて総合判断し、ドキュメント上
の文字を識別することを特徴とする特許請求の範囲第1
項記載の特徴抽出処理方式。
[Claims] 1. For each point in a pattern area including a black and white binary pattern, topological features found when looking in a predetermined direction from that point are each detected direction information. Find higher-order features by storing them and accumulating them at each point,
As a result, in a character reading method that identifies characters to be recognized using higher-order features obtained at each point on the pattern area, topological features on the character lines of the pattern include end points, branch points,
A means for detecting at least one or a plurality of intersection points and bending points and coding them into corresponding black points, and accumulating feature point codes thus formed at black points on character lines in a predetermined direction. means for forming a higher-order feature on the white point of the white part of the character background, and a feature code that expresses the existence of a topological feature point on the character line, and a topological feature point seen from the white part of the background. Extract the feature code that expresses the positional relationship of the phases. A feature extraction processing method characterized by: 2 Scan the characters on the document and convert the scanning signal to black and white 2
a scanning unit that converts and outputs a value; an M×N pattern memory unit with multiple bits per mesh that stores a pattern area including a binary pattern as part of the pattern area; Expresses higher-order features obtained by accumulating topological features found when looking at a predetermined direction from an arbitrary point at each point while preserving information on the detected direction. a feature extraction unit that forms a feature code on the pattern memory; an identification unit that processes the feature code representing the higher-order feature extracted on the pattern to determine to which category the input character belongs; In the character reading system, which is composed of a control section that generates timing signals necessary for the circuit, the feature extraction section extracts the phase of at least one or more of end points, branch points, intersection points, and bending points with respect to the black points on the pattern. A feature point extraction unit that extracts geometric features and stores feature point codes expressing them in the pattern memory, and a feature point extraction unit that scans the pattern surface in a predetermined direction to express topological features on the black points. and a feature accumulation unit that forms a feature code that expresses a new higher-order feature obtained by associating the feature point code with the direction and accumulating it on the white point on the pattern memory, and the identification unit includes at least the white point Claim 1, characterized in that characters on a document are identified by making a comprehensive judgment using a feature code including the above-mentioned higher-order features.
Feature extraction processing method described in section.
JP54145031A 1979-11-09 1979-11-09 Feature extraction processing method Expired JPS6047636B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54145031A JPS6047636B2 (en) 1979-11-09 1979-11-09 Feature extraction processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54145031A JPS6047636B2 (en) 1979-11-09 1979-11-09 Feature extraction processing method

Publications (2)

Publication Number Publication Date
JPS5668877A JPS5668877A (en) 1981-06-09
JPS6047636B2 true JPS6047636B2 (en) 1985-10-22

Family

ID=15375802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54145031A Expired JPS6047636B2 (en) 1979-11-09 1979-11-09 Feature extraction processing method

Country Status (1)

Country Link
JP (1) JPS6047636B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61191941U (en) * 1985-05-24 1986-11-29
JPH03121135U (en) * 1990-03-26 1991-12-11
JPH053392Y2 (en) * 1985-02-22 1993-01-27

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH053392Y2 (en) * 1985-02-22 1993-01-27
JPS61191941U (en) * 1985-05-24 1986-11-29
JPH03121135U (en) * 1990-03-26 1991-12-11

Also Published As

Publication number Publication date
JPS5668877A (en) 1981-06-09

Similar Documents

Publication Publication Date Title
US4607386A (en) Handwritten character recognition device
US5970170A (en) Character recognition system indentification of scanned and real time handwritten characters
US3541511A (en) Apparatus for recognising a pattern
JPH04104324A (en) Program generating device
JPH05307638A (en) Method for converting bit map image document into encoded data
US4163214A (en) Character recognition system
JPS62254282A (en) Method and apparatus for separating overlapped pattern
JPS6047636B2 (en) Feature extraction processing method
KR100199296B1 (en) Korean character recognition system using regular noise
JPH0247788B2 (en)
JPS60142486A (en) Recognizing device of general drawing
JPS5953595B2 (en) Feature extraction processing method and device
JPH09134404A (en) Bar graph recognizing device
JP2626011B2 (en) Drawing reading processing method
JPH11120291A (en) Pattern recognition system
JP3199033B2 (en) Optical character reading method and optical character reading device
JPS63157287A (en) Character pattern extracting method
JP2578767B2 (en) Image processing method
JPS5811663B2 (en) Character/figure recognition method
JP2840355B2 (en) Document processing device
JP2507949B2 (en) Character / graphic area determination device
JPH0434794B2 (en)
JPH0225553B2 (en)
JPH0247786B2 (en)
JPH0142029B2 (en)