JPS596420B2 - Online character feature extraction method - Google Patents

Online character feature extraction method

Info

Publication number
JPS596420B2
JPS596420B2 JP55048653A JP4865380A JPS596420B2 JP S596420 B2 JPS596420 B2 JP S596420B2 JP 55048653 A JP55048653 A JP 55048653A JP 4865380 A JP4865380 A JP 4865380A JP S596420 B2 JPS596420 B2 JP S596420B2
Authority
JP
Japan
Prior art keywords
stroke
elementary
feature
circuit
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55048653A
Other languages
Japanese (ja)
Other versions
JPS56145471A (en
Inventor
忠志 樋浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP55048653A priority Critical patent/JPS596420B2/en
Publication of JPS56145471A publication Critical patent/JPS56145471A/en
Publication of JPS596420B2 publication Critical patent/JPS596420B2/en
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 本発明は記入盤上の紙面に記入される文字を識別するた
めに該文字の筆点運動を解析しもつて記入文字の特徴を
抽出する方法に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a method for extracting characteristics of characters written on a writing board by analyzing the movement of the pen point of the characters in order to identify the characters.

従来の文字認識方法における文字識別特徴としては下記
の事項がある。
Character identification features in conventional character recognition methods include the following.

記入領域の分類:XY座標系列に変換された文字のXY
両座標の極値を検出し文字を囲む枠として、その枠を4
領域に分け、始点または終点がどの領域にあるかを特徴
とする。
Classification of entry area: XY of characters converted to XY coordinate series
Detect the extreme values of both coordinates and use that frame as a frame surrounding the character.
It is divided into regions and characterized by which region the starting point or ending point is located in.

ストローク数:記入ペンが紙面に「着」の状態からペン
により図形が描かれ記入ペンが紙面から「離脱」の状態
までの間の図形をストロークと定義し、1文字記入領域
内に記入されたストロークの個数を数える。
Number of strokes: A stroke is defined as a figure drawn by the pen from the state where the writing pen is "attached" to the paper surface until the state where the writing pen is "removed" from the paper surface, and the shape is written within one character writing area. Count the number of strokes.

Xピーク数、Yピーク数:座標値が増加していき一定距
離で減少すれば、1個のピークがあつたとする。
Number of X peaks, number of Y peaks: If the coordinate values increase and then decrease over a certain distance, one peak is present.

2点の一致:始点、終点、最少値まなは最大値に関して
2点間の距離が一定値以内かどうかで一致、不一致とす
る。
Matching of two points: A match or mismatch is determined based on whether the distance between two points is within a certain value regarding the starting point, end point, minimum value or maximum value.

X始点方向:座標値をサンプルし3サンプル以内に減少
がなくて増加があれば+、それ以外は−とする。
X starting point direction: Sample the coordinate value, and if there is no decrease and increase within 3 samples, then +, otherwise -.

ストローク方向:始点と終点についてストロークの方向
を8方向に分類する。
Stroke direction: The direction of the stroke is classified into eight directions regarding the start point and end point.

以上の各種の特徴を集めて各種の形と筆順を持つ標準の
字に対して各特徴がどのような値を持つか事前に定め、
これらを樹木状の構造にまとめ文字を識別するようにし
ていた。
By collecting the above various features and predetermining what value each feature has for standard characters with various shapes and stroke orders,
These were organized into a tree-like structure to identify characters.

しかしながら、これらの諸特徴は、(1)ストロークの
始・終点の形状に着目したものであり、ストローク全体
を通じての形状による特徴、たとえばストロークの回転
、方向の急激な変化、曲線状の形状と直線状の形状の関
係などについて着目しておらず、また(2)文字が傾斜
したり小さくなるとX,Yピークが正常に検出されない
場合がある。
However, these characteristics focus on (1) the shape of the start and end points of the stroke, and the characteristics due to the shape of the entire stroke, such as rotation of the stroke, sudden changes in direction, curved shapes and straight lines. (2) If the characters are tilted or small, the X and Y peaks may not be detected properly.

従つて、従来の方向では各種の特徴を検出する機能を備
えても識別率が向上せず、文字の変形、変動に対して識
別率の向上が期待できないという欠点があつた。1方、
ストロークの形状について各点の接線の向きの方向変化
と移動距離とから生じさせる方向信号系列を特徴として
検出し、文字を識別する方法がある。
Therefore, in the conventional method, even if a function for detecting various features is provided, the recognition rate does not improve, and the recognition rate cannot be expected to improve with respect to deformation or variation of characters. One side,
There is a method of identifying characters by detecting as a feature a direction signal series generated from changes in the direction of the tangents of each point and the distance of movement of the stroke shape.

これは、接線の向きを16分周し反時計方向にO〜15
の量子化係数を与え一定距離内における量子化係数の代
数和を一定値と比較して方向の増減(反時計方向、時計
方向回転)、変化なしの出力信号とペンの紙面の着脱信
号を組合せて特徴としたものである。この方法を用いた
実施例では接線の方向量子化系数と代数和を求める部分
、方向の増減、変化なしの各出力信号を機構的に発生さ
せており、従つて、(1)信号出力の速度、精度が機構
上の制約を受け、また(2)方向変化に注目するだけな
ので0と6との区分がつかず、従つてOはφとしてけれ
ばならない欠点があつた。従つて本発明の目的は従来の
技術の上記欠点を改善することにあり、文字を構成する
各ストロークを円、曲線及び直線形状からなる予め定め
られている素特徴形状によつて近似分類し、各ストロー
クを素特徴の1つもしくはそれらの系列として抽出する
ことにある。
This divides the direction of the tangent line by 16 and rotates counterclockwise by 0~15
The algebraic sum of the quantized coefficients within a certain distance is compared with a fixed value, and the direction is increased or decreased (counterclockwise rotation, clockwise rotation), and the output signal with no change is combined with the attachment/detachment signal of the pen on the paper surface. It is characterized by In the embodiment using this method, the part for calculating the tangent direction quantization system and the algebraic sum, the increase/decrease in direction, and the output signals with no change are mechanically generated. Therefore, (1) the speed of signal output is , the accuracy is subject to mechanical constraints, and (2) since only the change in direction is focused, it is not possible to distinguish between 0 and 6, so O must be set as φ. Therefore, an object of the present invention is to improve the above-mentioned drawbacks of the conventional technology, and to approximately classify each stroke constituting a character by a predetermined elementary feature shape consisting of a circle, a curved line, and a straight line shape, The purpose is to extract each stroke as one of the elementary features or a series of them.

そのために、本発明では、1つのストロークの座標点系
列から順次1点ずつずらせて3点ずつ座標点を取り出し
、各3点で与えられる2つのベクトルの方向変化と一方
のベクトルの長さとの積を変化量として検出する過程を
設ける。そして、予め定められた値よりも大きい変化量
に対応した座標点で分割し、そのような座標点がない場
合で円特徴でないストロークの場合にはストロークの全
長に応じて決められた長さで分割して部分ストロークす
る過程を設ける。その後、各部分ストロークについて、
変化量の総和とベクトルの長さの総和との比を検出する
。そして、その比をベクトルの長さの平均に応じた値と
比較して大小関係を検出することによつて直線であるか
曲線であるかを判定する。そして、この比較結果を含み
、部分ストロークの始終点方向などの情報に基づいて、
各部分ストロークを円、曲線及び直線形伏の予め定めら
れた素特徴形状に近似対応させる。本発明によれば、部
分ストロークを設定しCいるので、比較的細かい特徴を
抽出することができ、また素特徴形状を予め分類設定し
ているので、ストローク全体を通じての形状が比較的限
られた情報コードを用いて抽出できるものである。次に
図面を用いて、素特徴自体の検出及び素特徴の検出手順
について説明する。第1図に示すごとく、記入盤上の紙
面に描かれる図形の位置情報は、XY座標情報に変換さ
れ、フイルタ一の通過後、XY座標点系列で表わされる
For this purpose, in the present invention, three coordinate points are taken out by sequentially shifting one point at a time from the coordinate point series of one stroke, and the product of the direction change of the two vectors given by each three points and the length of one vector is calculated. A process is provided to detect the amount of change. Then, it is divided at coordinate points corresponding to the amount of change larger than a predetermined value, and if there is no such coordinate point and the stroke is not a circular feature, it is divided by a length determined according to the total length of the stroke. A process of dividing and partial stroke is provided. Then, for each partial stroke,
Detect the ratio between the total amount of change and the total length of vectors. Then, by comparing the ratio with a value corresponding to the average length of the vector and detecting a magnitude relationship, it is determined whether the shape is a straight line or a curve. Then, based on information such as the starting and ending point direction of the partial stroke, including this comparison result,
Each partial stroke is made to approximately correspond to a predetermined elementary feature shape such as a circle, a curved line, or a straight line shape. According to the present invention, since partial strokes are set, relatively detailed features can be extracted, and since elementary feature shapes are classified and set in advance, the shapes throughout the entire stroke are relatively limited. It can be extracted using an information code. Next, the detection of the elementary features themselves and the procedure for detecting the elementary features will be explained using the drawings. As shown in FIG. 1, the position information of the figure drawn on the paper on the writing board is converted into XY coordinate information, and after passing through a filter, it is expressed as an XY coordinate point series.

なお、POは文字記入始点Pnは終点である。第2図は
第1図の座標点P。−P5を拡大したもので、PO−P
5を図示のごとく結ぶ時P。−P5による線分が直線か
曲線かを次のような方法で区分する。ベクトルF7ド,
に対するベクトル下7F2の方向変化を、第3図のよう
に16分周し図のような量子化係数(0〜7,−1〜−
8)を与え、F寵メの長さを11として、P72の変化
量d1をD,=a1×11(a1は量子化係数)と定義
し、これを各ベクトルFコζ,F簀ζ,F口について求
める。このようにして求めたDl,d2d3,d4dl
+D2+D3+D4に基づき、D=?、を計算し一 定値と比較する。
Note that PO is the character entry starting point Pn is the ending point. Figure 2 shows the coordinate point P in Figure 1. - An enlarged version of P5, PO-P
When tying 5 as shown, P. - Determine whether the line segment defined by P5 is a straight line or a curved line using the following method. vector F7 de,
The direction change of the vector lower 7F2 for
8), and the length of the F line is 11, the amount of change d1 of P72 is defined as D, = a1 x 11 (a1 is the quantization coefficient), and this is expressed as each vector F Ask about F mouth. Dl, d2d3, d4dl obtained in this way
Based on +D2+D3+D4, D=? , and compare it with a constant value.

′,+12+13+14=Lとして、L≧THOのとき
、1DI≧THlならば曲線とし、Dl<THlならば
直線とする。THOは一定であり通常1ストロークのl
/3〜l/4の長さに設定する。THlは長さlの平均
1hにより決める一定値である。このようにして判定さ
れる直線および曲線について、その始点と終点を結び始
終点方向を第4図で示すような8方向に分類化して、夫
々の方向における直線,曲線および円に対し第5図に示
すようなコード番号を与える。
', +12+13+14=L, when L≧THO, if 1DI≧THl, it is a curve, and if Dl<THl, it is a straight line. THO is constant and usually l of one stroke
Set the length to /3 to l/4. THl is a constant value determined by the average length l of 1h. The straight lines and curves determined in this way are classified into eight directions by connecting their starting points and ending points as shown in Figure 4, and the straight lines, curves, and circles in each direction are classified into eight directions as shown in Figure 5. Give the code number as shown in .

これらのコード番号で示される直線,曲線なでを素特徴
群と呼ぶ。次に、素特徴の検出の手順を北下に説明する
。(1)座標点PO−Pnの1ストローク内で計算した
d1〜Dn内で1diI≧TH3を満たす点Piがある
か調べる。TH3は1hにより決める一定値である。(
2) PiがあればPiによりストロークを分割しPO
−Pi,Pi+&〜Pnの各部分ストロークについて素
特徴を検出する。
The straight lines and curved lines indicated by these code numbers are called elementary features. Next, the procedure for detecting elementary features will be explained in detail. (1) Check whether there is a point Pi that satisfies 1diI≧TH3 within d1 to Dn calculated within one stroke of coordinate points PO-Pn. TH3 is a constant value determined by 1h. (
2) If Pi exists, divide the stroke by Pi and PO
Elementary features are detected for each partial stroke -Pi, Pi+&~Pn.

(3) Piがない場合、PO−PnOlストロークに
ついて円かどうかおよび、2において曲線が検出された
場合について円かどうかを調べる。
(3) If there is no Pi, check whether the PO-PnOl stroke is a circle and if a curve is detected in 2, check whether it is a circle.

条件はTHl〈TH2≦D,Q≦TH4である。ここで
TH2,TH4は1hで決める一定値である。Qは、第
6図においてPxとPX+6を結んだ線分長をyとyす
れば、Q= で計算′v−4−
ρv+.キ・・・キ1v+・する。
The conditions are THl<TH2≦D, Q≦TH4. Here, TH2 and TH4 are constant values determined in 1 hour. Q is calculated as Q='v-4-, where y and y are the line segment lengths connecting Px and PX+6 in Figure 6.
ρv+. Ki...ki 1v+.

(4) 2において検出された曲線が円でないものは曲
線として登録する。
(4) If the curve detected in 2 is not a circle, register it as a curve.

Piが検出されない場合は始点よりlを加算して行きL
≧THOを満たす時、1D!≧THlにより直線か曲線
かを判定し、始終点方向により素特徴コードを検出し登
録する。(5)ストロークの残余部分については文字の
バネなどを考慮して、座標点の数が2点以上でしくTH
Oの時直線素特徴コードを登録する。
If Pi is not detected, add l from the starting point and go to L
When ≧THO is satisfied, 1D! ≧THl determines whether it is a straight line or a curve, and the elementary feature code is detected and registered based on the direction of the start and end points. (5) Regarding the remaining part of the stroke, the number of coordinate points should be 2 or more, taking into consideration the spring of the character etc.
When O, register the line element feature code.

以上説明した本発明の原理に基づき、第7図および第8
図を用いて本発明による文字特徴抽出方法の一実施例を
説明する。
Based on the principle of the present invention explained above, FIGS.
An embodiment of the character feature extraction method according to the present invention will be described with reference to the drawings.

第7図において、700,704,705,710は記
憶回路でRAM(ランダムアクセスメモリー)にて構成
する。
In FIG. 7, storage circuits 700, 704, 705, and 710 are constituted by RAM (random access memory).

701は方向量子化回路、702は距離計算回路、70
3は乗算回路、706は加算回路、707は平均化回路
、708は比較回路、709は全体を制御する制御回路
、S7OOは座標信号入力線、S7Olは一定値入力線
、S7O2およびS7O3は記憶回路のデータ出力線、
S7O4は比較回路708の状態信号線、S7O5,S
7O8は始点座標信号線、S7O6,S7O7は終点座
標信号線、S7O9は加算回路の出力線、S7lOは平
均化回路出力線、8711,S712,S713は記憶
回路700のデータ出力線でそれぞれ3点の点座標が出
力される。
701 is a direction quantization circuit, 702 is a distance calculation circuit, 70
3 is a multiplication circuit, 706 is an addition circuit, 707 is an averaging circuit, 708 is a comparison circuit, 709 is a control circuit that controls the whole, S7OO is a coordinate signal input line, S7Ol is a constant value input line, S7O2 and S7O3 are storage circuits. data output line,
S7O4 is the status signal line of the comparison circuit 708, S7O5, S
7O8 is a start point coordinate signal line, S7O6 and S7O7 are end point coordinate signal lines, S7O9 is an output line of the adding circuit, S71O is an averaging circuit output line, 8711, S712, and S713 are data output lines of the memory circuit 700, and each Point coordinates are output.

S7l4は方向量子化出力線、S7l5は距離値出力線
、S7l6は変化量出力線、S7l7,Sll8,Sr
l9,S72l,S722は記憶回路制御信号線、S7
2Oは検出信号線、S723は素特微分割検出信号線、
S724は素特徴判定回路制御信号線、S725は座標
点信号線である。以上のごとき構成で、座標位置信号は
、制御回路709の制御に従い記憶回路700(RAM
ランダムアクセスメモリ)に書込まれる。
S7l4 is a direction quantization output line, S7l5 is a distance value output line, S7l6 is a variation output line, S7l7, Sll8, Sr
l9, S72l, S722 are memory circuit control signal lines, S7
2O is a detection signal line, S723 is an elementary feature division detection signal line,
S724 is an elementary feature determination circuit control signal line, and S725 is a coordinate point signal line. With the above configuration, the coordinate position signal is stored in the storage circuit 700 (RAM) under the control of the control circuit 709.
random access memory).

書込まれた座標位置情報は制御回路709の制御に従い
3点づつ読出され、方向量子化回路701および距離計
算回路702に入り計算される。方向量子化値とベクト
ル長さがそれぞれ出力線S7l4,S7l5に出力され
、乗算回路703に入り変化量dが計算される。ベクト
ルの長さはまた出力線S7l5により記憶回路705、
加算回路706、平均化回路707に入力される。
The written coordinate position information is read out three points at a time under the control of the control circuit 709, and is entered into the direction quantization circuit 701 and the distance calculation circuit 702 for calculation. The direction quantized value and the vector length are output to output lines S7l4 and S7l5, respectively, and input to a multiplication circuit 703, where the amount of change d is calculated. The length of the vector is also stored in the storage circuit 705 by the output line S7l5.
The signal is input to an adding circuit 706 and an averaging circuit 707.

記憶回路705は制御回路709の制御に従いベクトル
の長さを記憶していく。加算回路706はベクトルの長
さの加算すなわち全長を計算し、平均値回路707は距
離値の平均1hを計算する。変化量dは信号線S7l6
に出力され記憶回路(RAM)704に記憶されると同
時に比較器708で、一定値入力線S7Olにより入力
される一定値TH3と比較される。その結果、Di≧T
H3ならその状態が状態信号線S7O4に出力される。
これと同時に、当該検出信号を信号線S72Oに出力し
制岬部へ検出を知らせるとともに、記憶回路(RAM)
710にて始点,終点.座標を一時記憶する。なお、図
示の結線では示していないけれども、制御回路709は
記憶回路700における座標点を検出することができる
ようになつており、一つのストロークに関する始終点信
号を信号線S7O7,S7O8を介して転送するが、D
i≧TH3が検出されたならば、この点でストローク中
に急激な変化があつたことになるので、この点で部分ス
トロークに分割するために、この部分ストロークの始点
、終点座標が制御回路709を介して記憶回路710に
記憶される。第8図において、801,802は加算回
路、803は分割回路、804は4入力、2出力の切換
器、805は比較回路、806はANDゲート、807
はインバータ、808は一定値発生回路、809は素特
徴判定回路、801,811は記憶回路、812は識別
特徴判定回路である。S8OO,OOn唱′−F愉竺聞
政申十伯 QQnり QOnりは始,終点座標出力線、
S8O4,S8O5は一定値出力線、S8O6は一定値
入力線、S8O7は素特徴コード出力線、S8O8,S
8O9は記憶回路データ出力線、S8lOは特徴有無出
力線、S8llは検出信号線である。以上のごとき構成
で、第7図に引き続く本実施例の動作を以下に説明する
The storage circuit 705 stores the length of the vector under the control of the control circuit 709. The addition circuit 706 calculates the addition of vector lengths, that is, the total length, and the average value circuit 707 calculates the average 1h of distance values. The amount of change d is the signal line S7l6
At the same time, the signal is outputted to the memory circuit (RAM) 704 and is compared with the constant value TH3 input by the constant value input line S7Ol in the comparator 708. As a result, Di≧T
If it is H3, the state is output to the state signal line S7O4.
At the same time, the detection signal is output to the signal line S72O to notify the control cape of the detection, and the memory circuit (RAM)
Starting point and ending point at 710. Temporarily store coordinates. Although not shown in the diagram, the control circuit 709 is capable of detecting coordinate points in the memory circuit 700, and transfers start and end point signals regarding one stroke via signal lines S7O7 and S7O8. However, D
If i≧TH3 is detected, it means that there has been a sudden change during the stroke at this point. Therefore, in order to divide the stroke into partial strokes at this point, the control circuit 709 determines the start point and end point coordinates of this partial stroke. The data is stored in the storage circuit 710 via the. In FIG. 8, 801 and 802 are adder circuits, 803 is a division circuit, 804 is a 4-input, 2-output switch, 805 is a comparison circuit, 806 is an AND gate, and 807
808 is an inverter, 808 is a constant value generation circuit, 809 is an elementary feature determination circuit, 801 and 811 are storage circuits, and 812 is a discriminative feature determination circuit. S8OO, OOn chant'-F pleasure QQnri QOnri is the start and end point coordinate output line,
S8O4, S8O5 are constant value output lines, S8O6 is constant value input lines, S8O7 is elementary feature code output lines, S8O8, S
8O9 is a memory circuit data output line, S81O is a feature presence/absence output line, and S8ll is a detection signal line. With the above configuration, the operation of this embodiment following FIG. 7 will be described below.

記憶回路704に記憶された変化量dは加算回路801
で加算される。
The amount of change d stored in the storage circuit 704 is added to the addition circuit 801.
is added.

記憶回路705に記憶されたベクトルの長さは加算回路
802で加算され、加算出力値が比較器805に入り、
分割回路803にて生ずるストロークの全長Lの1/n
の値THOと比較され、その出力が素特徴の分割検出信
号として信号線S8llに出力される。切換器804は
一つのストロークの始終点座標とストロークの始終点座
標とを切換えるために、状態信号線S7O4の制御によ
り記憶回路710に記憶されている始・終点座標と制御
回路709より出力されている始・終点座標を切換える
。一定値発生回路808は距臨の平均長1hと座標点数
情報により一定値THl,TH2を発生し、一定値出力
線S8O4およびS8O5を通じて素特徴判定回路80
9へ入力する。ANDゲート806は検出信号線S8l
lの検出信号をゲートするもので、比較回路708の動
作の結果により制御ゲートが開閉される。素特徴判定回
路809は、加算回路出力線S8OO(加算変化量)お
よびS8Ol(加算距離)、始終点座標出力線S8O2
(始点座標およびS8O3(終点座標)、一定値出力線
S8O4(一足値THl)およびS8O5(一定値TH
2)、一定入力線S8O6(一定値TH4)を入力とし
、制御部709の制御信号線S724の動作起動により
判定動作をし素特徴コードを出力線S8O7に出力する
。記憶回路810は素特徴コード出力線S8O7を介し
素特徴コードを記憶していく。811は識別特徴が記憶
されている記憶回路で、制御部の制御により記憶内容が
読出され、その内容に従い記憶回路810より素特徴コ
ードが読出され、識別特徴判定回路812にて比較判定
され識別特徴有(1)無(0)が特徴有無出力線S8l
Oに出力される。
The lengths of the vectors stored in the storage circuit 705 are added in the addition circuit 802, and the added output value is input to the comparator 805.
1/n of the total length L of the stroke generated in the dividing circuit 803
is compared with the value THO, and its output is outputted to the signal line S8ll as an elementary feature division detection signal. In order to switch between the start and end point coordinates of one stroke and the start and end point coordinates of a stroke, the switch 804 outputs the start and end point coordinates stored in the storage circuit 710 and the control circuit 709 under the control of the status signal line S7O4. Switch the start and end point coordinates. A constant value generation circuit 808 generates constant values THl and TH2 based on the average length 1h of the distance and coordinate point number information, and outputs constant values THl and TH2 to the elementary feature determination circuit 80 through constant value output lines S8O4 and S8O5.
Enter into 9. AND gate 806 connects the detection signal line S8l
The control gate is used to gate the detection signal of l, and the control gate is opened or closed depending on the operation result of the comparison circuit 708. The elementary feature determination circuit 809 uses addition circuit output lines S8OO (additional change amount) and S8Ol (additional distance), start and end point coordinate output line S8O2
(Start point coordinates and S8O3 (end point coordinates), constant value output line S8O4 (one step value THl) and S8O5 (constant value TH
2) The constant input line S8O6 (constant value TH4) is input, a determination operation is performed by activation of the control signal line S724 of the control unit 709, and the elementary feature code is output to the output line S8O7. The storage circuit 810 stores the elementary feature code via the elementary feature code output line S8O7. Reference numeral 811 denotes a storage circuit in which identification features are stored, and the storage contents are read out under the control of the control unit, and elementary feature codes are read out from the storage circuit 810 according to the contents, and are compared and determined in the identification feature determination circuit 812 to determine the identification characteristics. Existence (1) and absence (0) are characteristic presence/absence output line S8l
Output to O.

この識別特徴有無信号を集計し集計結果より文字コード
を出力するのは従来より一般的に行なわれている手段な
ので以下省略する。第1表は標準的な來字を素特徴コー
ドで記述した例を示す。
Since the method of summing up the identification feature presence/absence signals and outputting a character code from the summing result is a conventional method, the description thereof will be omitted. Table 1 shows examples of standard Lai characters written using elementary feature codes.

第1表で/は素特徴の結合を表わし/は次のストローク
との接続を表わす。第9図は検出され登録した素特徴ら
についてあらかじめ文字別に指定した素特徴コードの結
合、接続関係より特徴あり(1)なし(0)を検出する
文字識別特徴形態の1種を示す。
In Table 1, / represents a combination of elementary features, and / represents a connection with the next stroke. FIG. 9 shows one type of character identification feature format that detects whether a feature is present (1) or absent (0) from the combination and connection relationship of elementary feature codes specified in advance for each character for detected and registered elementary features.

第9図で900は特徴番号、901,902,903は
指定ピット、904,905は素特徴コードである。9
00は特徴番号で特徴の分類に用いる。
In FIG. 9, 900 is a feature number, 901, 902, and 903 are designated pits, and 904 and 905 are elementary feature codes. 9
00 is a feature number used for classifying features.

901は904,905などの素特徴コードが何番目の
ストロークに出現するか指定する。
901 specifies in what stroke number an elementary feature code such as 904 or 905 appears.

902は指定されたストロークで何番目に素特徴が出現
するか又は出現してはならないかを指定する。
A field 902 specifies the number in which the elementary feature should appear or should not appear in the specified stroke.

903は901,902で指定された素特徴に対して次
に出現すべき素特徴との関係を指定する。
903 specifies the relationship between the elementary features specified in 901 and 902 and the elementary feature to appear next.

関係としては、(1)以下に指定した素特徴が次に出現
しなければならない、(2)出現してもしなくてもよい
、(3)次に出現してはならない、そのストローク中の
最後である、などが考えられる。
The relationships are: (1) the elementary feature specified below must appear next; (2) it may or may not appear; (3) it must not appear next; the last in the stroke. It is possible that

(XX)。+(XX)1+・・・は素特徴の指定で、+
は(XX)。が(XX)1かいづれかがあればよい論理
的0R結合を表わす。・は指定した素特徴の次に出現す
べき素特徴との結合を表わす。+は(XX)′oか(X
Xylかいずれかがあればよい論理的0R結合を表わす
。付言するに、今例えば、未知文字における第XO番目
のストロークの第X1番目の部分ストロークの素特徴と
してXXOが検出さね次の部分ストロークとして(XX
)′oなる素特徴が検出されている場合、各文字の文字
識別特徴と比較され、第9図の特徴番号を含む文字識別
特徴の文字では、FXXXなる特徴番号の識別特徴にお
いC比較判定され、この場合、904で示す特徴コード
で一致し、且つ次の素特徴の結合も905なる特徴コー
ドで結合条件を満すので、その文字に関しては(XXO
)なる素特徴有として出力し、それらの集計によつて文
字が識別される。以上説明した実施例においては、方向
変化の方向を第3図に示すように均等に16分周したが
、文字図形の種類により非均等分周で20〜32にも分
周することも考えられる。
(XX). +(XX)1+... is the designation of elementary features, +
is (XX). represents a logical 0R combination that requires only (XX)1.・represents a combination of the specified elementary feature with the elementary feature that should appear next. + is (XX)′o or (X
Represents a logical 0R combination that only requires either Xyl or Xyl. In addition, for example, if XXO detects as an elementary feature of the X1st partial stroke of the XOth stroke in an unknown character, then as the next partial stroke (XX
)'o is detected, it is compared with the character identification feature of each character, and in the case of the character whose character identification feature includes the feature number in Figure 9, a C comparison judgment is made in the identification feature of the feature number FXXX. , in this case, there is a match with the feature code shown by 904, and the combination of the next elementary feature also satisfies the combination condition with the feature code 905, so for that character, (XXO
) are output as having elementary features, and characters are identified by aggregating them. In the embodiment described above, the direction of direction change is equally divided into 16 as shown in FIG. 3, but it is also possible to divide the frequency into 20 to 32 by non-uniform division depending on the type of character figure. .

また、量子化係数も第3図のごとく定めず適当に設定す
ることも可能である。方向分周値や量子化係数値などは
識別しようとする文字種や大きさによつて選択されるべ
きである。いづれにしても曲率を近似して直線,曲線と
に区分することができる。実施例では座標点系列3点P
O,Pl,P2によるベクトルG冗に対するF【]この
方向を求めたが、あらかじめベクトルの方向を第3図の
如く定め、F『7下゛1(d−F77〆2(β)=γよ
り方向量子化値を求めても同様の効果を生ずる。
Furthermore, the quantization coefficients may not be determined as shown in FIG. 3, but may be set appropriately. The directional frequency division value, quantization coefficient value, etc. should be selected depending on the character type and size to be identified. In any case, the curvature can be approximated and classified into straight lines and curved lines. In the example, the coordinate point series is 3 points P
F[] for the vector G due to O, Pl, P2 This direction was determined, but the direction of the vector was determined in advance as shown in Figure 3, and from F'7 lower ゛1 (d-F77 A similar effect is produced by determining the directional quantization value.

ここに、α,βはベクトルP7l,F喰この方向(有)
〜7,−1〜−8),γはベクトルF蓄IO)αに対す
る方向変化量を示す。実施例では第4図に示す如く8方
向に分周した方向より直線8種、曲線16種、円1種の
素特徴を検出しているが、文字によつては、直線部分を
更に細かく分周して直線素特徴を多くしたり、直線の長
さに長短2種の区分を導入して素特徴とし、逆に曲線素
特徴は荒く近似する組合せで識別特徴を構成することが
できる。
Here, α and β are vectors P7l, F and this direction (exist)
~7, -1~-8), γ indicates the amount of direction change with respect to the vector F (IO)α. In the example, 8 types of straight lines, 16 types of curves, and 1 type of circle are detected from the directions divided into 8 directions as shown in Fig. 4. However, depending on the character, the straight line portions may be divided into even smaller parts. It is possible to increase the number of straight line elementary features, or to introduce two types of long and short divisions into the length of a straight line, and use them as elementary features.On the other hand, it is possible to configure discriminating features by combining curved elementary features that are roughly approximated.

いずれにしても、直線と曲線、円の素特徴の時間系列結
合により識別特徴を構成することができ文字を識別する
ことができるO以上説明したように本発明によれば、3
点の方向変化と距離との積から曲率を近似し曲線と直線
とを区分するので、図形の微少接線角度方向変化と微少
距離変化の計算から曲率を計算し曲線と直線とを区分す
る従来手段と異なり、比較的簡単な方法で曲線と直線の
区分をなすことができ、文字の識別特徴として始・終点
のストローク形状方向、ストロークの回転といつた特徴
を素特徴の時間系列結合という特徴で表わし、文字の変
化および変動を素特徴結合の論理和で吸収することにし
たので識別率が向上すると共に、更に識別特徴としてス
トローク数、始終点ストローク形状方向、ストカーク回
転などを統一的に扱える特徴検出形態を提案したことに
より一種類の特徴検出回路を構成すれば良い0従つて本
発明によれば経済的効果的な認識装置を得ることが可能
となる。
In any case, by time-sequential combination of elementary features of straight lines, curves, and circles, identification features can be constructed and characters can be identified.O As explained above, according to the present invention, 3
Since the curvature is approximated from the product of the change in the direction of a point and the distance, and a curve is distinguished from a straight line, the conventional method calculates the curvature from the calculation of a slight change in the tangent angle direction of the figure and a slight change in the distance, and distinguishes between a curve and a straight line. Unlike , curves and straight lines can be distinguished in a relatively simple way, and features such as the stroke shape direction of the start and end points and the rotation of the stroke can be used as distinguishing features of characters by time-series combination of elementary features. By absorbing character changes and fluctuations using the logical sum of elemental feature combinations, the identification rate is improved, and further features such as the number of strokes, start/end point stroke shape direction, and Stokker rotation can be handled uniformly as identification features. By proposing a detection form, it is only necessary to configure one type of feature detection circuit. Therefore, according to the present invention, it is possible to obtain an economically effective recognition device.

なお、本発明は直線,曲線混合の文字として数字(0〜
9)、アルフアベツトα〜Z)、その他一部の記号文字
などの実時間認識に利用することができる。
In addition, the present invention uses numbers (0 to
9), alphanumeric characters α to Z), and some other symbols can be used for real-time recognition.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はXY座標系列で表わされた文字図形を示す図、
第2図は第1図における座標点P。 −P5の拡大図、第3図は方向量子化系数の説明図、第
4図は素特徴コードの方向を説明する図、第5図は素特
徴コードと素特徴形状の説明図、第6図は円か否かにつ
いて曲線を判定する場合の説明図、第7図および第8図
は本発明によるオンライン文字特徴抽出方法の一実施例
を示すプロツク図、第9図は文字識別特徴の説明図であ
る。700,704,705,710:記憶回路、70
1:方向量子化回路、702:距離計算回路、703:
乗算回路、706:加算回路、707:平均化回路、7
08:比較回路、709:制御回路、S7OO:座標信
号入力線、S7Ol:ー定値入力信号線、S7O2,S
7O3:記憶回路データ出力線、S7O4:状態信号線
、S7O5,S7O8:始点座標出力線、SlO6,S
7O7:終点座標出力線、S7O9:加算回路出力線、
S7lO:平均化回路出力線、S7ll,S7l2,S
7l3:点座標出力線、S7l4:方向量子化出力線、
S7l5:距離出力線、S7l6:変化量出力線、S7
l7,S7l8,S7l9,S72l,S722,S7
24:記憶回路制御信号線、S72O:検出信号線、S
723:素特微分割検出信号線、S725:座標点数出
力線、801,802:加算回路、803:分割回路、
804:切換回路、805:比較器、806:アンド回
路、807:インバータ、808:ー定値発生回路、8
09.素特徴判定回路、810,811:記憶回路、8
12:識別特徴判定回路、S8OO,S8Ol:加算回
路出力線、S8O2,S8O3:始,終点座標信号、S
8O4,S8O5,S8O6:ー定信号線、S8O7:
素特徴コード出力線、S8O8,S8O9:記憶回路デ
ータ出力線、S8lO:特徴有無出力線。
Figure 1 is a diagram showing a character figure expressed in an XY coordinate series,
Figure 2 shows the coordinate point P in Figure 1. - An enlarged view of P5, Fig. 3 is an explanatory diagram of the directional quantization coefficient, Fig. 4 is an explanatory diagram of the direction of the elementary feature code, Fig. 5 is an explanatory diagram of the elementary feature code and the elementary feature shape, Fig. 6 is an explanatory diagram for determining whether a curve is a circle or not; FIGS. 7 and 8 are block diagrams showing an embodiment of the online character feature extraction method according to the present invention; and FIG. 9 is an explanatory diagram of character identification features. It is. 700, 704, 705, 710: Memory circuit, 70
1: Direction quantization circuit, 702: Distance calculation circuit, 703:
Multiplication circuit, 706: Addition circuit, 707: Averaging circuit, 7
08: Comparison circuit, 709: Control circuit, S7OO: Coordinate signal input line, S7Ol: - Fixed value input signal line, S7O2,S
7O3: Memory circuit data output line, S7O4: Status signal line, S7O5, S7O8: Start point coordinate output line, SlO6, S
7O7: End point coordinate output line, S7O9: Addition circuit output line,
S7lO: Averaging circuit output line, S7ll, S7l2, S
7l3: point coordinate output line, S7l4: direction quantization output line,
S7l5: Distance output line, S7l6: Change amount output line, S7
l7, S7l8, S7l9, S72l, S722, S7
24: Memory circuit control signal line, S72O: Detection signal line, S
723: Elementary feature division detection signal line, S725: Coordinate point number output line, 801, 802: Addition circuit, 803: Division circuit,
804: Switching circuit, 805: Comparator, 806: AND circuit, 807: Inverter, 808: Fixed value generation circuit, 8
09. Elementary feature determination circuit, 810, 811: Memory circuit, 8
12: Discrimination feature determination circuit, S8OO, S8Ol: Addition circuit output line, S8O2, S8O3: Start and end point coordinate signals, S
8O4, S8O5, S8O6: - constant signal line, S8O7:
Elementary feature code output line, S8O8, S8O9: memory circuit data output line, S8lO: feature presence/absence output line.

Claims (1)

【特許請求の範囲】[Claims] 1 記入盤における文字記入の筆点運動を各ストローク
毎にXY座標の座標点系列として検出し、1つのストロ
ークもしくはそれを分割した部分ストロークを円、直径
、及び曲線の予め定められた素特徴形状に近似させて、
各ストローク毎に1つの素特徴もしくは複数の素特徴か
らなる系列を抽出するオンライン文字特徴抽出方法にお
いて、(a)1つのストロークの座標点系列から順次1
点づつずらせて3点ずつ座標点を取り出し、各3点で与
えられる2つのベクトルの方向変化(a)と一方のベク
トルの長さ(l)との積を変化量(d)として検出する
過程と、(b)予め定められた値よりも大きい変化量(
TH_3)に対応した座標点で各ストロークを分割して
部分ストロークを設定し、各ストロークに予め定められ
た前記値(TH_3)よりも大きい変化量がなく、しか
もそれが円素特徴でない場合にはストロークの全長に応
じて決められた長さで各ストロークを分割して部分スト
ロークを設定する過程と、(c)各部分ストロークの変
化量の総和とベクトルの長さの総和との比(D)を検出
する過程と、(d)部分ストロークにおけるベクトルの
長さの平均(ln)に応じて決められた値とその部分ス
トロークにおける前記比(D)との大小関係を比較検出
する過程と、(e)その比較結果を含な情報に基づいて
、各部分ストロークを円、曲線および直線の予め定めら
れた素特徴形状に近似対応させることにより各ストロー
クから1つの素特徴もしくはその系列を抽出することを
特徴としたオンライン文字特徴抽出方法。
1 The pen point movement of writing characters on the writing board is detected for each stroke as a coordinate point series of XY coordinates, and one stroke or a partial stroke obtained by dividing it is divided into predetermined elementary characteristic shapes of circles, diameters, and curves. Approximate to
In an online character feature extraction method that extracts one elementary feature or a series of multiple elementary features for each stroke, (a) one stroke is sequentially extracted from the coordinate point series of one stroke.
A process in which the coordinate points are taken out three by three by shifting the points, and the product of the direction change (a) of the two vectors given by each three points and the length (l) of one vector is detected as the amount of change (d). and (b) the amount of change larger than the predetermined value (
Divide each stroke at the coordinate point corresponding to TH_3) and set partial strokes, and if each stroke does not have a change amount larger than the predetermined value (TH_3) and it is not a circle element feature, The process of setting partial strokes by dividing each stroke by a length determined according to the total length of the stroke, and (c) the ratio of the sum of the amount of change of each partial stroke to the sum of the length of the vector (D) (d) a process of comparing and detecting the magnitude relationship between a value determined according to the average vector length (ln) in the partial stroke and the ratio (D) in the partial stroke; e) Extracting one elementary feature or a series thereof from each stroke by making each partial stroke approximately correspond to a predetermined elementary feature shape of a circle, a curve, and a straight line, based on information including the comparison results. An online character feature extraction method featuring
JP55048653A 1980-04-15 1980-04-15 Online character feature extraction method Expired JPS596420B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55048653A JPS596420B2 (en) 1980-04-15 1980-04-15 Online character feature extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55048653A JPS596420B2 (en) 1980-04-15 1980-04-15 Online character feature extraction method

Publications (2)

Publication Number Publication Date
JPS56145471A JPS56145471A (en) 1981-11-12
JPS596420B2 true JPS596420B2 (en) 1984-02-10

Family

ID=12809305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55048653A Expired JPS596420B2 (en) 1980-04-15 1980-04-15 Online character feature extraction method

Country Status (1)

Country Link
JP (1) JPS596420B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520113Y2 (en) * 1986-03-05 1993-05-26

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5949656A (en) * 1982-09-14 1984-03-22 Fujitsu Ltd Linear and arcuate approximation system of linear pattern
JPS5969878A (en) * 1982-10-14 1984-04-20 Nec Corp On-line character recognizing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520113Y2 (en) * 1986-03-05 1993-05-26

Also Published As

Publication number Publication date
JPS56145471A (en) 1981-11-12

Similar Documents

Publication Publication Date Title
JP6992590B2 (en) Feature expression device, feature expression method, and program
EP0085545B1 (en) Pattern recognition apparatus and method for making same
US5854855A (en) Method and system using meta-classes and polynomial discriminant functions for handwriting recognition
Ray et al. Detection of significant points and polygonal approximation of digitized curves
AU722613B2 (en) Fingerprint characteristic extraction apparatus as well as fingerprint classification apparatus and fingerprint verification apparatus for use with fingerprint characteristic extraction apparatus
TWI567660B (en) Multi-class object classifying method and system
Lerner et al. A classification-driven partially occluded object segmentation (CPOOS) method with application to chromosome analysis
JP2005148987A (en) Object identifying method and device, program and recording medium
US6337927B1 (en) Approximated invariant method for pattern detection
Gattal et al. Segmentation and recognition strategy of handwritten connected digits based on the oriented sliding window
JPS596420B2 (en) Online character feature extraction method
CN111292346B (en) Method for detecting contour of casting box body in noise environment
Arora et al. An algorithm to straighten the bent human chromosomes
Gornale et al. Detection and classification of signage’s from random mobile videos using local binary patterns
Kumar et al. Fragment of binary object contour points on the basis of energy level for shape classification
CN109657623B (en) Face image similarity calculation method and device, computer device and computer readable storage medium
JP2946095B2 (en) Line segment extraction device
CN114842183A (en) Convolutional neural network-based switch state identification method and system
JPS6232584A (en) Method for extracting contour shape feature
CN104156696A (en) Bi-directional-image-based construction method for quick local changeless feature descriptor
CN103646401A (en) Time gradient and special gradient based achievement method of video fingerprint extraction
Garain et al. On machine understanding of online handwritten mathematical expressions
JP3421200B2 (en) Character recognition method and device
Huang et al. A Method for Content-Based Image Retrieval with a Two-Stage Feature Matching
JP2728117B2 (en) Character recognition device