JPS62229384A - On-line character recognizing device - Google Patents

On-line character recognizing device

Info

Publication number
JPS62229384A
JPS62229384A JP61070713A JP7071386A JPS62229384A JP S62229384 A JPS62229384 A JP S62229384A JP 61070713 A JP61070713 A JP 61070713A JP 7071386 A JP7071386 A JP 7071386A JP S62229384 A JPS62229384 A JP S62229384A
Authority
JP
Japan
Prior art keywords
stroke
partial pattern
section
matching
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61070713A
Other languages
Japanese (ja)
Other versions
JPH0531797B2 (en
Inventor
Shizuo Nagata
永田 静男
Yasuo Shimizu
安雄 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP61070713A priority Critical patent/JPS62229384A/en
Publication of JPS62229384A publication Critical patent/JPS62229384A/en
Publication of JPH0531797B2 publication Critical patent/JPH0531797B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To execute the processing at high speed by providing a picture number corresponding parameter setting part to set, for the number of the strokes of an input character, a weighting parameter added to a parameter in case a threshold and a candidate sequence are determined at the time of selecting a candidate character. CONSTITUTION:If a candidate character is classified for the number of the strokes, a normal distribution is generally approximately is obtained with about 10 pictures as a center, and therefore, a weighting parameter stored into a picture number corresponding parameter setting part 9 is weighted and added so that the threshold and the parameter of a middle classifying part 6 to select the candidate character, a part pattern Q value matching part 7 to determine a candidate sequence and a part pattern stroke code distribution matching part 8 can be set to a suitable value in accordance with the number of the stroke of an input character. Then, the optimum stroke corresponding processing is not necessary and the processing can be shortened.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、実時間にて筆記文字を識別するオンライン文
字認識装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to an online character recognition device that identifies written characters in real time.

(従来の技術) オンライン文字認識装置における認識方式としては以下
の方法が一般的である。筆記人力されたストローク(ベ
ンオンからペンオ)までの筆記部分)のデータ列をX、
Y座標あるいはr、θ極座標で表わし、これらのデータ
(以下人カバターンと称す)から特徴点を抽出する。こ
の抽出された特徴点の情報を、あらかじめ同じ方法で特
徴点を抽出し登録しておいたパターン(以下W2iパタ
ーンと称す)の情報とマツチングし、文字認識を行なっ
ていた。
(Prior Art) The following method is generally used as a recognition method in an online character recognition device. The data string of the handwritten stroke (the handwritten part from Benon to Peno) is
It is expressed in Y coordinate or r, θ polar coordinates, and feature points are extracted from these data (hereinafter referred to as human cover turns). Character recognition was performed by matching information on the extracted feature points with information on a pattern (hereinafter referred to as a W2i pattern) in which feature points were extracted and registered in advance using the same method.

以下、従来のオンライン文字認識方式について第1O図
〜第12図を参照して説明する。
Hereinafter, a conventional online character recognition method will be explained with reference to FIGS. 1O to 12.

先ず、第10図に特徴点を各ストロークの始点、終点で
表わした一例を示す。筆記人力された第jストロークデ
ータ列Djを 1DJ= ((X+−Vt)J)  t−1,2***
nJ”(1)Qja+jストロークのデータ数 とすると、始点(Xs、VJjは(X+、Vt)、+で
、終点(Xs 、3’e) =は(xo、、yo、)J
で求められる。
First, FIG. 10 shows an example in which feature points are expressed by the start and end points of each stroke. The manually written j-th stroke data string Dj is 1DJ = ((X+-Vt)J) t-1, 2***
nJ'' (1) Qja+j If the number of stroke data is the starting point (Xs, VJj is (X+, Vt), +, the ending point (Xs, 3'e) = (xo,,yo,)J
is required.

j ここで、同様の方法で求め登録しておいた登録パターン
を(Xs、3/s)J”と(Xs、ya)J’とする。
j Here, the registered patterns obtained and registered using the same method are assumed to be (Xs, 3/s)J'' and (Xs, ya)J'.

単純なマツチング方式を採用した場合、文字のストロー
ク数がNのとき、入カバターンと登録パターンの距離d
は、 ÷(lxe、−X、、@l+lye、−ye、”l) 
   = (2)ツノ にしたがって算出される。そして、各登録パターンとの
マツチングが行なわれ、そのうち距1!ldが小のもの
が認識結果として出力される。
When a simple matching method is adopted, when the number of character strokes is N, the distance d between the input cover pattern and the registered pattern is
is ÷(lxe, -X,,@l+lye, -ye,"l)
= (2) Calculated according to the horn. Then, matching with each registered pattern is performed, and eventually the distance is 1! The one with the smaller ld is output as the recognition result.

(発明が解決しようとする問題点) しかしながら、このようなマツチング方式を用いた従来
のオンライン文字認識方式では、以下に述べるような問
題点があった。
(Problems to be Solved by the Invention) However, the conventional online character recognition method using such a matching method has the following problems.

この方式によれば、登録パターンと同様な形状で筆記し
たものは、はぼ100%近くの認識率で認識される。と
ころが、一般には、筆記人力されたパターンが登録パタ
ーンと同様の形状でないケースが多々ある。第11図(
a)に登録パターンに対して形状が変形している“河”
の人カバターン例を示し、第11図(b)にこれと対応
する登録パターンを示す。この場合、“2″、”可”が
上下にずれ、それぞれの大きざも大きく変動している。
According to this method, a handwritten item with a shape similar to the registered pattern is recognized with a recognition rate of nearly 100%. However, in general, there are many cases in which the handwritten pattern does not have the same shape as the registered pattern. Figure 11 (
A) “River” whose shape is deformed with respect to the registered pattern
An example of a human cover turn is shown, and FIG. 11(b) shows a registered pattern corresponding to this. In this case, "2" and "OK" are shifted up and down, and their respective sizes also vary greatly.

従フて、人カバターンと登録パターンとの距lsdは大
きくなり、誤認識となる可能性が大となる。
Therefore, the distance lsd between the human cover pattern and the registered pattern becomes large, increasing the possibility of misrecognition.

このように、従来方式によれば、登録パターンに対して
変形された形状で筆記入力が行われた場合、誤認識率が
大きくなるという問題点があつた。
As described above, according to the conventional method, there is a problem in that when a handwritten input is performed in a shape that is modified from the registered pattern, the misrecognition rate increases.

また、(2)式に基づくような単純な筆記ストローク類
のマツチングでは、人力文字の筆順が異なった場合、距
@dが大となる。そのため、実際は、マツチングするス
トロークの最適な対応づけを行なう処理が必要となる。
Furthermore, in matching simple handwritten strokes based on equation (2), the distance @d becomes large when the stroke order of human characters differs. Therefore, in reality, processing is required to optimally associate strokes to be matched.

すなわち、筆記人力された各ストロークを、登録パター
ンの各ストロークのどのストロークとマツチングすれば
よいかを決定することが必要となる。そしてこの処理に
多大な時間が費やされることになる。
That is, it is necessary to determine which stroke of the registered pattern should be matched with each manually written stroke. This process consumes a lot of time.

例えば第12図(a)に示したような“シ“を筆記人力
したときの最適な対応づけを考えてみる。第12図(b
)はこのときの対応登録パターンを示す図、第12図(
C)は最適ストローク対応づけ処理説明図である。対応
づけの1つの方法としては、まず、人カバターンの第1
ストローク(第12図(a)中■)と登録パターンの第
1ストローク(第12図(b)中0勺との距離dllを
(22式により算圧し、次に登録パターン■1との距1
11id+z、登録パターン■1との距離d13を算出
し、d l l t d 12+ d 13の最小のス
トロークを対応づける。この例の場合dllが最小とな
り■−■6を最適なストロークとして対応づける。同様
に、人カバターン第2ストローク(第12図(a)中■
)と、すでに対応つけられた登録パターンのストローク
を除く(この場合のう残りのストロークとの対応づけを
行なう。そしてそれぞれの最適なストロークの対応づけ
を行なう。
For example, let us consider the optimal correspondence when "shi" is written manually as shown in FIG. 12(a). Figure 12 (b
) is a diagram showing the corresponding registration pattern at this time, and Figure 12 (
C) is an explanatory diagram of optimal stroke matching processing. One way to make the correspondence is to first
Calculate the distance dll between the stroke (■ in Figure 12 (a)) and the first stroke (0 in Figure 12 (b)) of the registered pattern using formula 22, and then calculate the distance 1 from the registered pattern ■1.
11id+z, the distance d13 from the registered pattern ■1 is calculated, and the minimum stroke of d l l t d 12 + d 13 is associated. In this example, dll is the minimum, and ■-■6 is associated as the optimal stroke. Similarly, the second stroke of the human cover turn (■ in Fig. 12(a))
), the strokes of the registered pattern that have already been matched are removed (in this case, the strokes are matched with the remaining strokes), and the respective optimal strokes are matched.

この処理は、ストローク数が少ない場合には処理時間は
少ないが、ストローク数人の文字(画数人の文字)では
、その処理数Mはストローク数をNとすると、 の比率で増大するため、膨大な処理量となる。この処理
量の増大をカバーするために高速なALU等を使用する
必要があるため、従来方式によるオンライン文字認識装
置では小型化ができず、またコストアップとなるという
欠点があった。
This process takes less time when the number of strokes is small, but for characters with a few strokes (characters with a few strokes), the number of processes M increases at the ratio of , where N is the number of strokes, so it takes a huge amount of time. This results in a large amount of processing. In order to compensate for this increase in processing amount, it is necessary to use a high-speed ALU or the like, so conventional online character recognition devices cannot be miniaturized and have the disadvantage of increasing costs.

このように、従来の方式は、筆記人力される人カバター
ンの形状の変化に弱く、誤認識となりやすく、また筆順
を緩和するために最適なストローク対応づけを行なう処
理が必要で処理量が多大であるという欠点があった。
As described above, the conventional method is sensitive to changes in the shape of the human cover drawn by the handwriting, and is prone to misrecognition, and also requires processing to perform optimal stroke correspondence in order to relax the stroke order, resulting in a large amount of processing. There was a drawback.

本発明は、以上述べた従来技術の問題点を解決し、この
筆記人力される入カバターンの変形に強く、しかも処理
量が少なくてすむ非常に優れたオンライン文字認識装置
を提供することを目的とする。
An object of the present invention is to solve the above-mentioned problems of the prior art, and to provide an excellent online character recognition device that is resistant to deformation of input patterns caused by handwriting and requires less processing. do.

(問題点を解決するための手段) 本発明は、タブレットに筆記入力して得られた座標デー
タ列の不要データを除去し、直線化処理を施す面処理部
と、前処理部により直線化された座標データ列から、筆
記文字を構成するストロークの特徴を表わす特徴点を抽
出する特徴点抽出部と、特徴点抽出部で抽出された特徴
点の位置関係により各ストロークをコード化するストロ
ークコード化部とを設け、ストロークコード化部の出力
データを、あらかじめ登録されている登録パターンデー
タと比較して文字認識を行なうオンライン文字認識装置
を対象とし、前記従来技術の問題点を解決するため、ス
トロークコード化部の出力を受取り、筆記文字のストロ
ーク数により大分類を行なう大分類部と;大分類部で選
択された候補文字に対し、筆記上一連のものとして筆記
する部分を部分パターンとし、特徴点抽出部で抽出した
特徴点間を結ぶセグメントの情報より各部分パターンの
重心を算出し、算出した重心データに基づき、!の部分
パターンの重心と別の部分パターンの重心をそれぞれ始
点及び終点とする部分パターン間ベクトルを求め、この
部分パターン間ベクトルと、あらかじめ同様にしてR2
2パターンより作成しておいた部分パターン間ベクトル
とのマツチングを行ない、マツチング結果にしたがって
中分類を行なう中分類部と:中分類部により絞られた候
補文字に対し、部分パターンの各ストローク各セグメン
ト情報より抽出した部分パターンの特徴を表わす部分パ
ターンQ値を求め、この部分パターンQ値と、あらかじ
め同様にして登録パターンより作成しておいた部分パタ
ーンQ値とのマツチングを行ない、このマツチング結果
と、中分類部によるマツチング結果との重みづけ加算に
より得られた値にしたがって候補文字の順位づけを行な
う部分パターンQ値マツチング部と:部分パターンQ値
マツチング部で順位づけされた上位候補文字に対し、部
分パターン毎に、ストロークコード化部で抽出したスト
ロークコードの分布を算出し、このストロークコード分
布と、あらかじめ同様にして登録パターンより作成して
おいた部分パターンストロークコード分布とのマツチン
グを行ない、このマツチング結果と、中分類部によるマ
ツチング結果と、部分パターンQ値マツチングとの重み
づけ加算により得られた値にしたがって候補文字の最終
的な順位づけを行なう部分パターンストロークコード分
布マツチング部と:ストローク数毎に、中分類部及び部
分パターンQ値マツチング部における候補選択の基準と
なる閾値並びに部分パターンストロークコード分布マツ
チング部における重みづけ加算に用いる重みづけパラメ
ータをあらかじめ設定しておき、文字認識時の人力文字
パターンのストローク数に応じて各パラメータを適宜設
定するストローク数対応パラメータ設定部とを設けたも
のである。
(Means for solving the problem) The present invention removes unnecessary data from a coordinate data string obtained by handwriting input on a tablet, and linearizes the data by a surface processing unit that performs linearization processing and a preprocessing unit. A feature point extraction unit that extracts feature points representing characteristics of strokes that make up a written character from a coordinate data string, and a stroke coding unit that codes each stroke based on the positional relationship of the feature points extracted by the feature point extraction unit. In order to solve the problems of the prior art described above, the present invention is aimed at an online character recognition device that performs character recognition by comparing the output data of the stroke coding section with registered pattern data registered in advance. A large classification section that receives the output of the coding section and performs major classification based on the number of strokes of the written characters; The center of gravity of each partial pattern is calculated from the information on the segments connecting the feature points extracted by the point extraction unit, and based on the calculated center of gravity data,! Find the inter-sub-pattern vector whose starting point and end point are the centroid of the sub-pattern and the centroid of another sub-pattern, respectively.
A middle classification section that performs matching with vectors between subpatterns created from two patterns and performs middle classification according to the matching result: For candidate characters narrowed down by the middle classification section, each stroke of each segment of the partial pattern A partial pattern Q value representing the characteristics of the partial pattern extracted from the information is obtained, and this partial pattern Q value is matched with a partial pattern Q value previously created from registered patterns in the same manner. , a partial pattern Q value matching unit that ranks candidate characters according to the value obtained by weighted addition with the matching result by the middle classification unit; , for each partial pattern, calculate the distribution of stroke codes extracted by the stroke coding section, and match this stroke code distribution with a partial pattern stroke code distribution previously created from registered patterns in the same way, A partial pattern stroke code distribution matching unit that performs final ranking of candidate characters according to the value obtained by weighted addition of this matching result, the matching result by the intermediate classification unit, and the partial pattern Q value matching: Stroke For each number, threshold values that serve as criteria for candidate selection in the medium classification section and partial pattern Q value matching section, and weighting parameters used for weighted addition in the partial pattern stroke code distribution matching section are set in advance, and the weighting parameters used for weighted addition in the partial pattern stroke code distribution matching section are set in advance. A stroke number corresponding parameter setting section is provided for appropriately setting each parameter according to the number of strokes of a human character pattern.

(作 用) 本発明では以上のようにオンライン文字認識装置を構成
したので各技術手段は以下のとおり作用する。
(Function) In the present invention, since the online character recognition device is configured as described above, each technical means functions as follows.

前処理部はタブレットに筆記人力された文字の座標デー
タ列に対し、ノイズ除去処理、移動平均処理、平滑化処
理を等を施すことにより、データを直線化する。特徴点
抽出部はたとえば直線化されたデータ列のデータ間のx
、y方向のサインを求めサインの状態の変化点を特徴点
とする等の方法により特徴点を抽出する。ストロークコ
ード化部は抽出された特徴点情報に基づき、たとえば各
セグメントのサイン、セグメントの角度、セグメント間
の回転角度によりストロークを分類し、コード化する。
The preprocessing unit linearizes the data by performing noise removal processing, moving average processing, smoothing processing, etc. on the character coordinate data string manually written on the tablet. For example, the feature point extraction unit may be configured to
, the characteristic point is extracted by a method such as finding the sign in the y direction and using the change point of the sign state as the characteristic point. The stroke encoding unit classifies strokes based on the extracted feature point information, for example, by the sign of each segment, the angle of the segments, and the rotation angle between the segments, and encodes the strokes.

このコード化されたストロークデータは以下の本発明の
特徴である各手段の分類、順位づけのために供される。
This coded stroke data is used for the following classification and ranking of each means, which is a feature of the present invention.

大分類部は筆記された文字のストローク数すなわち画数
により大分類を行なう。このため、あらかじめ画数毎に
その画数となりうる文字をたとえば文字辞書に格納して
おく。
The major classification section performs major classification based on the number of strokes of written characters. For this reason, for each number of strokes, characters that can have that number of strokes are stored in advance, for example, in a character dictionary.

中分類部はストローク数により大分類された候補文字に
対し、部分パターン間ベクトルのマツチングによる分類
を施し、更に候補文字の絞り込みを行なう。具体的には
候補文字につき部分パターン間ベクトルをそれぞれ求め
、これをたとえば文字辞書のパターン間ベクトルと比較
してその差を両ベクトル間の距離として求める。この距
離をストローク数対応パラメータ部で設定した所定の閾
値と比較し、該閾値より大きければ候補文字からはずし
、該閾値以下であれば候補文字のままとする。
The intermediate classification section classifies candidate characters roughly classified according to the number of strokes by matching vectors between partial patterns, and further narrows down the candidate characters. Specifically, a vector between partial patterns is obtained for each candidate character, and this is compared with, for example, an inter-pattern vector in a character dictionary, and the difference is obtained as the distance between both vectors. This distance is compared with a predetermined threshold value set in the stroke number corresponding parameter section, and if it is larger than the threshold value, it is removed from the candidate characters, and if it is less than the threshold value, it is left as a candidate character.

部分パターンQ値マツチング部は先ず中分類された候補
文字について部分パターンQ値を求め、これと登録パタ
ーンよりあらかじめ求めておいた部分パターンQ値とを
比較してその差を両Q値間の距離として得、マツチング
を行なう。このため登録パターンからあらかじめ求めた
部分パターンQ値をたとえば部分パターン辞書に格納し
ておく。次に、部分パターンQ値マツチング部は、上記
マツチング結果すなわち両Q値間の距離と、中分類部の
マツチング結果すなわち両ベクトル間の距離との重みづ
け加算により得られた距離にしたがい、中分類された候
補文字の順位づけを行なうとともにストローク数対応パ
ラメータ部で設定した所定の閾値による絞り込みを行な
う。
The partial pattern Q value matching section first calculates the partial pattern Q value for the medium-classified candidate characters, compares this with the partial pattern Q value determined in advance from the registered pattern, and calculates the difference as the distance between both Q values. and perform matching. For this reason, the partial pattern Q value obtained in advance from the registered pattern is stored in, for example, a partial pattern dictionary. Next, the partial pattern Q value matching unit performs intermediate classification according to the distance obtained by weighted addition of the above matching result, that is, the distance between both Q values, and the matching result of the intermediate classification unit, that is, the distance between both vectors. The selected candidate characters are ranked and narrowed down using a predetermined threshold set in the stroke number corresponding parameter section.

部分パターンストロークコード分布マツチング部は、以
上のように絞り込まれ順位づけされた上位候補文字につ
いて部分パターンのストロークコード分布を求め、これ
と登録パターンからあらかじめ求めたストロークコード
分布とを比較し、両分布間の距離を求め、マツチングを
行なう。そして、このマツチングにより得られた距離と
、中分類部におけるマツチングにより得られた距離と、
部分パターンQ値マツチング部におけるマツチングによ
り得られた距離とを、ストローク数対応パラメータ設定
部で設定した重みづけパラメータを用いて重みづけ加算
し、得られた距離にしたかって最終的な順位づけを行な
い認識結果とする。
The partial pattern stroke code distribution matching section calculates the partial pattern stroke code distribution for the top candidate characters narrowed down and ranked as described above, compares this with the stroke code distribution previously calculated from the registered pattern, and compares both distributions. Find the distance between them and perform matching. Then, the distance obtained by this matching and the distance obtained by matching in the intermediate classification part,
The distance obtained by matching in the partial pattern Q value matching section is weighted and added using the weighting parameter set in the stroke number corresponding parameter setting section, and the final ranking is performed based on the obtained distance. This is the recognition result.

なお、ストローク数対応パラメータ設定部は中分類部、
部分パターンQ値マツチング部及び部分パターンストロ
ークコード分布マツチング部での候補選択、順位づけの
ためにストローク数に応じて適切な閾値及び重みづけパ
ラメータを設定するように働く。一般に、文字をストロ
ーク数毎に分類すると、各ストローク数において候補と
なる文字数はおよそ10画を中心としてほぼ正規分布の
形となり、ストローク数により候補文字が大きく異なっ
てくる。したがって中分類部での閾値はストローク数に
応じて好適なものに変化させるのが効率的である。また
、筆記文字は1ストロークのひらがな、カタカナ、英字
、数字等から25ストロークの漢字まで多様であり、こ
れら全ての認識に対処するためには、部分パターンQ値
マツチング部で用いる閾値及び部分パターンストローク
コード分布マツチング部で用いる重みづけパラメータを
、ストローク数に応じて好適なものに変化させるのが効
果的である。以上のことをふまえてストローク数対応パ
ラメータは適切な閾値及び重みづけパラメータをストロ
ーク数に応じて設定する。
In addition, the stroke number corresponding parameter setting section is the intermediate classification section,
It works to set appropriate thresholds and weighting parameters according to the number of strokes for selecting and ranking candidates in the partial pattern Q value matching section and the partial pattern stroke code distribution matching section. Generally, when characters are classified by the number of strokes, the number of candidate characters for each number of strokes is approximately normally distributed around 10 strokes, and the candidate characters vary greatly depending on the number of strokes. Therefore, it is efficient to change the threshold value in the intermediate classification section to a suitable value depending on the number of strokes. In addition, written characters are diverse, ranging from 1-stroke hiragana, katakana, alphabets, numbers, etc. to 25-stroke kanji. It is effective to change the weighting parameters used in the chord distribution matching section to suitable values depending on the number of strokes. Based on the above, appropriate threshold values and weighting parameters are set for the stroke number corresponding parameters in accordance with the stroke number.

したがって、本発明の各手段の働きにより、筆記入力さ
れる文字形状のバラツキによる変動に対処でき、筆順の
違いによるストロークの最適な対応づけ処理を不要とし
、処理量が軽減され、前記従来技術の問題点が解決され
る。
Therefore, by the functions of each means of the present invention, it is possible to cope with fluctuations due to variations in character shapes input by hand, eliminate the need for optimal matching processing of strokes due to differences in stroke order, reduce the amount of processing, and reduce the amount of processing compared to the above-mentioned prior art. Problems are resolved.

(実施例) 以下、本発明の一実施例のオンライン文字認識装置につ
いて詳細に説明する。
(Embodiment) Hereinafter, an online character recognition device according to an embodiment of the present invention will be described in detail.

第1図は本実施例のオンライン文字認識装置の構成を示
すブロック図である。同図に示すように、このオンライ
ン文字認識装置は、タブレット1、前処理部2、特徴点
抽出部3、ストロークコード化部4、大分類部5、中分
類部6、部分パターンQ値マツチング部7、部分パター
ンストロークコード分布マツチング部8及び画数対応パ
ラメータ設定部9から構成される。なお図中IOは図示
しない表示器等への出力端子を示す。
FIG. 1 is a block diagram showing the configuration of the online character recognition device of this embodiment. As shown in the figure, this online character recognition device includes a tablet 1, a preprocessing section 2, a feature point extraction section 3, a stroke coding section 4, a major classification section 5, a medium classification section 6, and a partial pattern Q value matching section. 7. It is composed of a partial pattern stroke code distribution matching section 8 and a stroke number corresponding parameter setting section 9. Note that IO in the figure indicates an output terminal to a display device or the like (not shown).

第2図は第1図の装置の動作の概略を示すフローチャー
トで、前処理部2はステップ101を実行し、特徴点抽
出部3はステップ102を実行し、ストロークコード化
部4はステップ103を実行し、大分類部5はステップ
104を実行し、中分類部6はステップ105ないし1
08を実行し、部分パターンQ値マツチング部7はステ
ップ109ないし112を実行し、部分パターンストロ
ークコード分布マツチング部8はステップ113ないし
II&を実行する。なお、画数対応パラメータ9は入力
文字の画数に応じたパラメータを6〜8の各部に対し設
定する。
FIG. 2 is a flowchart showing an outline of the operation of the apparatus shown in FIG. The major classification section 5 executes step 104, and the intermediate classification section 6 executes steps 105 to 1.
08, the partial pattern Q value matching section 7 executes steps 109 to 112, and the partial pattern stroke code distribution matching section 8 executes steps 113 to II&. Note that the stroke number corresponding parameter 9 is set for each part of 6 to 8 in accordance with the number of strokes of the input character.

第3図は本実施例の装置が備えている文字辞書の構成を
示す図で、この辞書は画数(ストローク数)により文字
の選択ができるようになっている。また、第4図は本実
施例の装置が備えている部分パターン辞書の構成を示す
図である。
FIG. 3 is a diagram showing the structure of a character dictionary included in the apparatus of this embodiment, and this dictionary allows characters to be selected based on the number of strokes. Further, FIG. 4 is a diagram showing the configuration of a partial pattern dictionary included in the apparatus of this embodiment.

以下、本実施例の装置の動作を各部ごとに順を追って詳
しく説明する。
Hereinafter, the operation of the apparatus of this embodiment will be explained in detail step by step for each part.

先ず、タブレット1は文字を筆記人力するためのもので
、文字が筆記入力されると第5図(a)のように筆記デ
ータ列((Xt、L)j−1,2・・・nJ、が抽出さ
れ、前処理部2に送られる。
First, the tablet 1 is used for manually writing characters, and when characters are input by hand, a writing data string ((Xt, L)j-1, 2...nJ, is extracted and sent to the preprocessing section 2.

前処理部2は送られてきた筆記データ列に対し、ノイズ
除去処理、移動平均処理、平滑化処理を行うことにより
、第5図(b)のようにデータを直線化し、特徴点抽出
部3に出力する。
The preprocessing unit 2 linearizes the data as shown in FIG. 5(b) by performing noise removal processing, moving average processing, and smoothing processing on the received writing data string, and then the feature point extraction unit 3 Output to.

次に特徴点抽出部3の動作について述べる。特徴点抽出
部3の行なう特徴点抽出処理としてはいくつかの方法が
あるが、ここでは直線化されたデータ列((マ+−Vi
) 、l−1,2””nJ)Jのデータ間のX。
Next, the operation of the feature point extraction section 3 will be described. There are several methods for feature point extraction processing performed by the feature point extraction unit 3, but here we will use a linearized data string ((ma + - Vi
), l-1, 2""nJ) X between the data of J.

y方向のサイン(正、負、0の符号)を算出し、サイン
の状態の変化点を特徴点として抽出する方法について述
べる。
A method of calculating the sign (positive, negative, and 0 signs) in the y direction and extracting points of change in the sign state as feature points will be described.

データ間のx、y方向のサインXS、、YS、をYSz
 =Sign(Yi−3’+−t)で求め、+、0.−
で表現する。このようにして求めた各データ間のX方向
、X方向のサインを前データ間のサインと比較し、同じ
であれば特徴点として登録せず、異なった場合には状態
が変わったとして特徴点として登録する。第5図(C)
にこのようにして求めた点の他に始点、終点を加えた特
徴点を示す。一般にはこの処理を直線近似化と称す場合
もある。この特徴点間を以下セグメントと称し、特徴点
を((X+、Yi) 、i−1,2・・・fj)jで表
わすことにする。
The x and y direction sine XS, YS, between the data is YSz
=Sign(Yi-3'+-t), +, 0. −
Expressed as Compare the signs in the X direction and X direction between each piece of data obtained in this way with the signs between the previous data, and if they are the same, they are not registered as feature points, and if they are different, the state is considered to have changed and the feature point is Register as. Figure 5 (C)
In addition to the points obtained in this way, the characteristic points are shown including the starting point and the ending point. Generally, this process is sometimes called linear approximation. The space between these feature points will hereinafter be referred to as a segment, and the feature points will be expressed as ((X+, Yi), i-1, 2...fj)j.

以上のようにして得られた特徴点情報はストロークコー
ド化部4及び中分類部6に出力される。
The feature point information obtained as described above is output to the stroke coding section 4 and the medium classification section 6.

次にストロークコード化部4の動作について述べる。ス
トロークコード化部4は特徴点抽出部3により得られた
特徴点情報に基づき各ストロークをコード化する。この
コード化には数多くの方法があるが、一般には各セグメ
ントのX、Yサイン、セグメントの角度、セグメント間
の回転角度により分類し、コード化を行なう。第6図は
このコード化処理の説明図で、θ1.θ2.θ3はセグ
メントの角度(+xX方向なす角度)を示し、θ1゜θ
2は隣りあうセグメント間の回転角度を示す。
Next, the operation of the stroke coding section 4 will be described. The stroke encoding section 4 encodes each stroke based on the feature point information obtained by the feature point extraction section 3. There are many methods for this encoding, but in general, the encoding is performed by classifying the X and Y signs of each segment, the angle of the segment, and the rotation angle between the segments. FIG. 6 is an explanatory diagram of this encoding process, in which θ1. θ2. θ3 indicates the angle of the segment (the angle formed in the +xX direction), and θ1゜θ
2 indicates the rotation angle between adjacent segments.

コード化されたストロークデータは大分類部5ELび部
分パターンストロークコード分布マツチング部8に出力
される。
The encoded stroke data is output to the major classification section 5EL and the partial pattern stroke code distribution matching section 8.

次に大分類部5の動作について述べる。大分類部5はス
トロークコード化部4の出力を受け、ストローク数によ
り対象文字に対する大分類を行なう。そのため、あらか
じめ画数(ストローク数)毎にその画数となりつる文字
を第3図のように文字辞書に用意しておく。たとえば筆
記人力された文字パターンのストローク数が10画であ
ったとする。この場合、文字辞書に格納されている文字
のうち第3図に示すような10画となり得る文字“唖”
、“挨”、“逢”・・・を候補文字として選択する。
Next, the operation of the major classification section 5 will be described. The major classification section 5 receives the output from the stroke encoding section 4 and performs major classification of the target characters based on the number of strokes. Therefore, for each number of strokes, characters that correspond to that number of strokes are prepared in advance in a character dictionary as shown in FIG. For example, suppose that the number of strokes of a character pattern drawn manually is 10 strokes. In this case, among the characters stored in the character dictionary, the character ``唖'', which can be 10 strokes as shown in Figure 3, is
, "Ko", "Ai", etc. are selected as candidate characters.

次に中分類部6の動作について述べる。中分類部6は、
大分類部5にて画数により大分類して得た候補文字を以
下に説明する部分パターン間ベクトルにより更に中分類
する。ここで部分パターンとは1つの文字のうち筆記上
一連のものとして筆記する部分をいうものとし、部分パ
ターン間ベクトルとは1の部分パターンの重心と別の部
分パターンの重心をそれぞれ始点、終点とするベクトル
をいうものとする。
Next, the operation of the intermediate classification section 6 will be described. The middle classification section 6 is
The candidate characters obtained by major classification according to the number of strokes in the major classification section 5 are further divided into medium classifications using vectors between partial patterns, which will be described below. Here, a partial pattern refers to a part of one character that is written as a series of characters, and a vector between partial patterns refers to the center of gravity of one partial pattern and the center of gravity of another partial pattern as the starting point and ending point, respectively. is the vector.

先ず、部分パターン間ベクトルの算出法の一例を述べる
。部分パターン中の各セグメントのX。
First, an example of a method for calculating vectors between partial patterns will be described. X for each segment in the partial pattern.

y成分を(dx+、dy+)とすると各セグメントの長
さdl、は、 d i r =dx + + d’J r−・・・(5
)で表ねされる。また文字幅HX、HYで除することに
より正規化した各セグメントの中心座標を(x+”、y
t”)とすると、部分パターンの重心座標(x、、y=
)は で求められる。以上の方法で外部分パターンの重心を求
め、1の部分パターンの重心と別の部分パターンの重心
をそれぞれ始点、終点として部分パターン間ベクトルを
求める。なお、ここでは部分パターン間ベクトルはX方
向とX方向についてそれぞれ分けて考えるものとする。
When the y component is (dx+, dy+), the length dl of each segment is d i r = dx + + d'J r-...(5
). Also, the center coordinates of each segment are normalized by dividing by the character width HX, HY (x+”, y
t”), the centroid coordinates of the partial pattern (x,, y=
) is given by. The centroids of the external partial patterns are determined by the above method, and vectors between partial patterns are determined by setting the centroids of one partial pattern and another partial pattern as starting points and ending points, respectively. Note that here, the inter-partial pattern vectors are considered separately for the X direction and the X direction.

第7図に文字“唖”の部分パターン“a”、“吐”の各
重心及び部分パターン間ベクトル”;(口、t)、”;
Ca、t)の例を示す。
FIG. 7 shows the partial pattern “a” of the character “唖”, the centroid of each of the centroids of “vomit” and the vector between the partial patterns “; (mouth, t),”;
An example of Ca, t) is shown below.

中分類部6では、以上説明した部分パターン間ベクトル
により、大分類部5で選択された候補文字を絞りこみ中
分類を行なうわけであるが、ここで−例として“逢”が
筆記人力された場合を考え、以下この人力文字に対する
中分類の手順を説明する。
The intermediate classification unit 6 narrows down the candidate characters selected by the major classification unit 5 using the vectors between sub-patterns described above and performs intermediate classification. Considering this case, the procedure for intermediate classification for this human-powered character will be explained below.

筆記人力された文字“逢”は10画であるので、先ず第
3図に示すごとき文字辞書の10画部分を参照する。す
るとここには文字“唖”が第1番目に配されており、そ
の欄には“唖”を構成する部分パターン、部分パターン
の筆記類と各部分パターンのストローク数情報(以下カ
ット位置と称す)、及び登録パターンよりあらかじめ算
出した各部分パターン間ベクトル値が示されている。以
下順に“挨”、“逢”の文字について同様の情報が並ん
でおり、中分類部6はこの文字順にしたがい候補とすべ
きか否かをそれぞれ判定し以下のように中分類を行なう
Since the hand-written character "Ai" has 10 strokes, first refer to the 10 stroke portion of the character dictionary as shown in FIG. Then, the character "唖" is placed first, and in that column, the partial patterns that make up "唖", the handwriting of the partial patterns, and the stroke number information of each partial pattern (hereinafter referred to as cut position) are displayed. ), and vector values between each partial pattern calculated in advance from the registered pattern are shown. Similar information is arranged for the characters "Ko" and "Ai" in the following order, and the intermediate classification unit 6 determines whether or not they should be candidates according to this order of characters, and performs intermediate classification as follows.

先ず、筆記入力した文字が“唖”であるとして、部分パ
ターン間ベクトルのマツチング距離d vecを求める
。第3図の文字辞書にかかれているように、“唖”はカ
ット位置が(3,7)すなわち第1ストローク〜第3ス
トロークで“口”が形成され、第4ストローク〜第1θ
ストロークで“改”が形成されるが、本例では入カバタ
ーンが“逢”であるのでこのカット位置で“逢”につい
て部分パターン間ベクトルを考えると第8図のようにな
る。第8図のように求められた入カバターンの部分パタ
ーン間ベクトル丈1(ロ、叱)。
First, assuming that the handwritten character is "唖", the matching distance d vec of vectors between partial patterns is determined. As stated in the character dictionary in Figure 3, the cut position of "Muta" is (3, 7), that is, the "mouth" is formed from the 1st stroke to the 3rd stroke, and the "mouth" is formed from the 4th stroke to the 1st θ.
A "break" is formed by the stroke, but in this example, the incoming cover turn is "Ai", so if we consider the vector between partial patterns for "Ai" at this cut position, the result will be as shown in FIG. Vector length 1 between sub-patterns of the input pattern obtained as shown in FIG.

y1口、吐)と辞書にかかれている部分パターン間ベク
トルX(口、り、y  (o、健)との差がマツチング
距離d VeCであり、  Vfle −17″(09便)−マ(ロ、亜)I+l?”(ロ、健
)−7(ロ、欽月で算出される。
The difference between the partial pattern vector X (mouth, ri, y (o, ken)) written in the dictionary is the matching distance d VeC, and , A) I+l?” (B, Ken) - 7 (B, Kinzuki) Calculated.

一般に、筆記した文字の部分パターン数が複数の場合、
部分パターン数BPNで正規化を行ないマツチング距!
11dvecは、 にしたがって算出される。
Generally, when the number of partial patterns of a written character is multiple,
Normalize with the number of partial patterns BPN and find the matching distance!
11dvec is calculated according to:

ここである閾値VECREJを設定し、算出したd v
ecがVECREJより大きいか否かを判定する。モし
てdvIIc>VECREJのときは、参照した文字(
コノ場合“唖“)ではない、として次の文字の部分パタ
ーン間ベクトルのマツチングを行なう。d Vae≦V
ECREJのときは、“唖”らしいとして次に説明する
部分パターンQ値の算出及びマツチングを行なう。
Here, a certain threshold VECREJ is set and the calculated d v
It is determined whether ec is greater than VECREJ. When dvIIc > VECREJ, the referenced character (
In this case, it is assumed that the character is not "唖"), and the vectors between the partial patterns of the next character are matched. d Vae≦V
In the case of ECREJ, calculation and matching of the partial pattern Q value, which will be explained next, is performed on the assumption that it seems to be "dumb".

上記閾値VECREJは、あらかじめ画数毎に、画数対
応パラメータ設定部9に設定しておき、認識時に入カバ
ターンの画数により値が設定される。
The threshold value VECREJ is set in advance in the stroke count corresponding parameter setting unit 9 for each stroke count, and the value is set according to the stroke count of the input pattern at the time of recognition.

画数により候補文字数は異なるので、例えば候補文字数
が少ない画数においてはVECREJ値を大きくしても
本部分パターン間ベクトルマツチングによる中分類で残
る候補も他の画数の候補と同数程度となる。従って、候
補数の少ない画数ではVE(:REJ値を小さく、候補
数の多い画数ではVE(:REJ値を大きく設定する方
がよい。
Since the number of candidate characters differs depending on the number of strokes, for example, in a stroke number with a small number of candidate characters, even if the VECREJ value is increased, the number of candidates remaining in the medium classification by the vector matching between partial patterns will be about the same number as candidates for other stroke numbers. Therefore, it is better to set a small VE(:REJ value) for strokes with a small number of candidates, and to set a large VE(:REJ value for strokes with a large number of candidates).

次に部分パターンQ値マツチング部7の動作について述
べる。部分パターンQ値マツチング部7は中分類部6に
おける部分パターン間ベクトルによる中分類で残った候
補文字について部分パターンQ値を算出し、第4図に示
゛す部分パターン辞書中の部分パターンQ値とマツチン
グを行なう。この部分パターン辞書の部分パターンQ値
は、登録パターンよりあらかじめ作成され格納されてい
るものである。ここで部分パターンQ値とは、各セグメ
ントの長さ、方向及びその位置を表わす特徴パラメータ
をいう。オンライン文字認識では筆記するペンの動きと
して、X、Y方向、+または−の方向が重要な情報とし
て得られ、この情報を有効につかったのがこの部分パタ
ーンQ値である。
Next, the operation of the partial pattern Q value matching section 7 will be described. The partial pattern Q value matching unit 7 calculates the partial pattern Q value for the candidate characters remaining after the intermediate classification using the vectors between partial patterns in the intermediate classification unit 6, and calculates the partial pattern Q value in the partial pattern dictionary shown in FIG. Perform matching. The partial pattern Q values of this partial pattern dictionary are created and stored in advance from registered patterns. Here, the partial pattern Q value refers to a characteristic parameter representing the length, direction, and position of each segment. In online character recognition, the X, Y direction, + or - direction is obtained as important information regarding the movement of the writing pen, and this partial pattern Q value is an effective use of this information.

先ず、部分パターンQ値の算出法を説明する。First, a method for calculating the partial pattern Q value will be explained.

なお下式においてΣは全ストローク、全セグメントに関
する加算を示す。またHX、HYは文字幅を示す。
Note that in the formula below, Σ indicates addition regarding all strokes and all segments. Further, HX and HY indicate character width.

■ +X方向成分のX方向位置 ■ −X方向成分のX方向位置 ■ +y方向成分のX方向位置 ■ −y方向成分のX方向位置 ■ +X方向成分のX方向位置 ■ −X方向成分のy方向位置 ■ +y方向成分のX方向位置 ■ −y方向成分のX方向位置 ■〜■の場合は原点を左下に設定したときの各方向位置
の値であるが、このとき原点近くにあるものは乗算に供
すると0となってしまうため、0となるのを防ぐため原
点を入れかえ原点を右上に設定したときの各方向位置の
値Q9〜Q16についても同様に記述し、Q + ”=
 Q +sの合計16個の値により対象文字の各ストロ
ークのセグメントの長さ、方向及び位置を表わすものと
する。
■ X-direction position of the +X-direction component■ -X-direction position of the X-direction component■ +X-direction position of the y-direction component■-X-direction position of the y-direction component■X-direction position of the +X-direction component■-Y direction of the X-direction component Position■ +X-direction position of the y-direction component■ -X-direction position of the y-direction component■~■ In the case of the origin, it is the value of each direction position when the origin is set to the lower left, but in this case, the value near the origin is multiplied. When subjected to , it becomes 0, so in order to prevent it from becoming 0, change the origin and set the origin to the upper right, and write the values Q9 to Q16 of each direction position in the same way, and Q + "=
It is assumed that a total of 16 values of Q + s represent the length, direction, and position of each stroke segment of the target character.

部分パターンQ値マツチング部7では、部分パターン間
ベクトルによる分類により残フたものに対し、以上説明
した部分パターンQ値を算出するのであるが、例えば“
逢”を筆記人力して“挨”か部分パターン間ベクトルに
よる分類により残ったとする。この場合、“挨”のカッ
ト位置は第3図に示すように(3,2,5)であり、部
分パターンはJ+入+秀であるので、人カバターンをカ
ット位置(3*  2 、 5 )でカットし、各々Q
+”〜Q166を算出する。このとき、本例の場合第9
図に示すように“A”か“才”に、“二” が“ム”に
、“24”が“ス”にそれぞれ対応している。各々算出
した部分パターンQ値QI′〜Q16′と第4図の部分
パターン辞書にある部分パターンQ値とのマツチングを
行なう。すなわち先ず、“ム”で算出しなQI′〜Q+
o’と部分パターン辞書“オ”のQ1〜Q+gをマツチ
ングさせ、次に“二”で算出したQげ〜Q、6′と部分
パターン辞書“ム”のQ l −Q +aをマツチング
させ、さらに“邑”で算出したQ1″〜Q161と部分
パターン辞書“表”のQ!〜Qr6をマツチングさせる
。これらのマツチングにおける差を合計したものをマツ
チング距11dapとする。このとき距911 d n
 pは入カバターン“逢”が“挨”にどれだけ近いかを
表わす。
The partial pattern Q value matching unit 7 calculates the partial pattern Q value explained above for the remaining blanks by classification based on the vector between partial patterns.
Suppose that ``Ai'' is manually written down and left as ``Ko'' or classified by vectors between partial patterns.In this case, the cut position of ``Ko'' is (3, 2, 5) as shown in Figure 3, and the partial The pattern is J+enter+shu, so cut the human cover turn at the cut position (3*2, 5) and cut each Q
+” to Q166. At this time, in this example, the 9th
As shown in the figure, "A" or "sai" corresponds to "2", "2" corresponds to "mu", and "24" corresponds to "su". The calculated partial pattern Q values QI' to Q16' are matched with the partial pattern Q values in the partial pattern dictionary shown in FIG. 4. In other words, first, calculate QI'~Q+ using "mu".
o' and Q1~Q+g of the partial pattern dictionary "O" are matched, then Qge~Q,6' calculated in "2" is matched with Q l -Q +a of the partial pattern dictionary "Mu", and then Match Q1'' to Q161 calculated in "Obu" with Q! to Qr6 of the partial pattern dictionary "table". The sum of the differences in these matchings is set as a matching distance of 11dap. In this case, the distance is 911 d n
p represents how close the introductory pattern "Ai" is to "Ko".

一般には、各部分パターンのストローク数BSJにより
(17)式のように重みづけを行ない、それをマツチン
グ距1fl d a pとする。
Generally, weighting is performed as shown in equation (17) using the number of strokes BSJ of each partial pattern, and this is set as the matching distance 1fl d a p.

Q+ (j) ;第5部分パターンのQ、値また、あら
かじめ画数毎に(18)式の重みづけパラメータWv0
゜、wBpを決めて画数対応パラメータ設定部9に格納
しておき、認識時に入カバターンの画数に応じ画数パラ
メータ設定部9により設定される重みづけパラメータ値
により重みづけを行なう。そして、以上のように求めた
距離dapと、前ステップで求めた部分パターン間ベク
トルのマツチングにより得られたd v、、eとをそれ
ぞれWv、、cとwlipで重みづけしたものを加算し
た距離d1を求める。
Q+ (j); Q, value of the fifth partial pattern, and the weighting parameter Wv0 of equation (18) for each number of strokes in advance
°, wBp are determined and stored in the stroke number corresponding parameter setting section 9, and weighting is performed by the weighting parameter value set by the stroke number parameter setting section 9 according to the number of strokes of the input pattern at the time of recognition. Then, the distance dap obtained as above and d v, , e obtained by matching the inter-partial pattern vectors obtained in the previous step are weighted by Wv, , c and wlip, respectively, and the distance is added. Find d1.

di”Wvec”dvac”WBP”dBF   m−
(to)以上の操作を部分パターン間ベクトルによる分
類で残った全ての候補文字について行ない、dlによる
ソーティングを行なう。
di”Wvec”dvac”WBP”dBF m-
(to) The above operations are performed on all candidate characters remaining after classification by partial pattern vectors, and sorting by dl is performed.

次に部分パターンストロークコード分布マツチング部8
の動作について述べる。部分パターンストロークコード
分布マツチング部8は部分パターンQ値マツチング部7
及びストロークコード化部4の出力を受け、中分類によ
り絞られた候補文字につき部分バダーンストロークコー
ド分布を求め、この分布と登録パターンよりあらかじめ
作成され第4図の部分パターン辞書に格納されている部
分パターンストロークコード分布とのマツチングを行な
い、さらに上位候補の順位づけを行なう。この順位づけ
を行なう対象の範囲は例えばd、のソーティングで得ら
れた第1較補の距fa drとの比率で決める。すなわ
ちdJ/dI≦ZRATEの候補文字までを対象範囲と
して順位づけを行なう。ここで閾値ZRATEは、筆記
文字の画数毎にあらかじめ画数対応パラメータ設定部9
に設定しておき、認識時に、入カバターンの画数により
値が設定される。
Next, partial pattern stroke code distribution matching section 8
We will describe the operation of. The partial pattern stroke code distribution matching section 8 is the partial pattern Q value matching section 7.
In response to the output from the stroke coding unit 4, a partial badan stroke code distribution is obtained for the candidate characters narrowed down by the intermediate classification, and is created in advance from this distribution and the registered pattern and stored in the partial pattern dictionary shown in FIG. Matching with the partial pattern stroke code distribution is performed, and the top candidates are further ranked. The range of targets for this ranking is determined, for example, by the ratio of d to the first complementary distance fa dr obtained by sorting. That is, ranking is performed with candidate characters of dJ/dI≦ZRATE as the target range. Here, the threshold value ZRATE is determined in advance by the stroke number corresponding parameter setting unit 9 for each stroke number of the written character.
, and at the time of recognition, the value is set according to the number of strokes in the input pattern.

画数が少ない文字の場合、部分パターン間ベクトル及び
部分パターンQ値における情報量は少ない。したがって
、この場合、(I8)式のdlにより順位づけられた順
位は不確定となる傾向があり、部分パターンストローク
コード分布マツチング部8におけるZI’tATE値も
大きくとる必要がある。逆に、画数が多い文字の場合、
同様の理由でZRATE値は小さくするのがよい。
In the case of a character with a small number of strokes, the amount of information in the vector between partial patterns and the Q value of the partial patterns is small. Therefore, in this case, the ranking determined by dl in equation (I8) tends to be uncertain, and the ZI'tATE value in the partial pattern stroke code distribution matching section 8 also needs to be large. On the other hand, for characters with many strokes,
For the same reason, it is preferable to make the ZRATE value small.

ここで、部分パターンストロークコード分布の算出法に
ついて説明する。−例として入カバターンが“逢”で第
1候補として選ばれた文字が“逢”であったとする。第
3図の文字辞書より候補文字“逢”のカット位置は(3
,4,3)で部分パターンは%+4+Lであることがわ
かるので、この位置で入カバターン“逢”をカットする
。この場合カットして得た部分パターンは文字辞書の内
容と同じであるが、それぞれの部分パターン毎に、スト
ロークコード化部4により得られたストロークコードの
本数の分布を算出する。例えば“シ゛°の部分パターン
を見た場合、“/”。
Here, a method for calculating the partial pattern stroke code distribution will be explained. - As an example, assume that the input cover turn is "Ai" and the character selected as the first candidate is "Ai". From the character dictionary in Figure 3, the cut position of the candidate character “Ai” is (3
, 4, 3), the partial pattern is found to be %+4+L, so cut the incoming cover turn "Ai" at this position. In this case, the partial patterns obtained by cutting are the same as the contents of the character dictionary, but the distribution of the number of stroke codes obtained by the stroke coding section 4 is calculated for each partial pattern. For example, if you look at the partial pattern of “゛°,” “/”.

7”、“\”であるから501が1本、S03が1木、
SO5が1本というストロークコード分布が求められる
7”, “\”, so 501 is one tree, S03 is one tree,
A stroke code distribution with one SO5 is required.

このようにして算出された部分パターンストロークコー
ド分I5は、あらかじめ数個のRjlパターンから同様
な手順により算出し平均化して作成しておいた第4図の
部分パターン辞書の部分パターンストロークコード分布
とマツチングされる。本例の場合、先ず、以上のように
して算出した“ム”の部分パターンストロークコード分
布と、第4図の部分パターン辞書の″ん” のストロー
クコード分布との差をマツチング距離d s (匁)と
して得る。すなわち、 人カバターン     部分パターン辞書5ol−1本
    SO!−0,9本5O2−0本    SO2
・−0,1本SO3−1本    5O3−0,4本5
O4−0本    5O4−0,6本5O5−1本  
 5O5−1本 の差0.I+ 0.1+ 0.6+ 0.6=  1.
4本がd s (4)として求められる。同様に“椹”
、“L”についてマツチングを行ないd s ($)、
d S L)を得る。そしてこれらを各部分パターンス
トロークコード数BS、により正規化し、正規化された
各部分パターンのマツチング距離の合計の距gl d 
sを、より算出する。
The partial pattern stroke code portion I5 calculated in this way is based on the partial pattern stroke code distribution of the partial pattern dictionary shown in Fig. 4, which was created by previously calculating and averaging several Rjl patterns using the same procedure. Matched. In the case of this example, first, the difference between the partial pattern stroke code distribution of "mu" calculated as above and the stroke code distribution of "n" in the partial pattern dictionary in FIG. ). In other words, Hitokabataan Partial Pattern Dictionary 5ol-1 book SO! -0,9 pieces 5O2 -0 pieces SO2
・-0,1 SO3-1 5O3-0,4 5
O4-0 5O4-0, 6 5O5-1
5O5-1 difference 0. I+ 0.1+ 0.6+ 0.6=1.
Four lines are obtained as d s (4). Similarly, “椹”
, “L” is matched and d s ($),
dSL) is obtained. Then, these are normalized by the number of stroke codes of each partial pattern BS, and the total distance gl d of the matching distance of each normalized partial pattern is
s is further calculated.

次に、以上求めた部分パターン間ベクトルマツチングに
よる距@ d v、e、部分パターンQ値マツチングに
よる距離(iapおよび部分パターンストロークコード
分布マツチングによる距1lid sに対し、重みつけ
パラメータWVe、、WBp、 W、により(20)式
のように距離値りを求める。
Next, for the distance @ d v, e obtained by vector matching between partial patterns, the distance by partial pattern Q value matching (iap, and the distance 1lid s by partial pattern stroke code distribution matching), weighting parameters WVe, WBp , W, the distance value is calculated as shown in equation (20).

ここで重みづけパラメータwvclc、wBp、 w、
はあらかじめ画数毎に重みづけパラメータの最適値を求
めておき、画数対応パラメータ設定部9に格納しておい
たパラメータで、人カバターンの画数に応じ、画数対応
パラメータ設定部9により設定される重みづけパラメー
タ値である。
Here, the weighting parameters wvclc, wBp, w,
is a parameter for which the optimum value of the weighting parameter is calculated in advance for each number of strokes and stored in the number-of-strokes corresponding parameter setting section 9, and the weighting is set by the number-of-strokes corresponding parameter setting section 9 according to the number of strokes of the human covert. is a parameter value.

D = W vee” d vec”W ap ’ d
 ap” Ws・d ap  ・・・(20)この距離
りをd、/d、≦ZR八Tへの各候補文字につき求め、
得られた距離りにしたがって候補文字の順位づけを行な
い、認識結果として出力端子IOより図iFc L/な
い表示器等へ出力する。
D = W vee” d vec”W ap' d
ap” Ws・d ap ... (20) Find this distance for each candidate character to d, /d, ≦ZR8T,
The candidate characters are ranked according to the distances obtained, and the recognition results are output from the output terminal IO to a display device or the like.

なお、上記実施例ではふれなかったが、順位づけされた
認識結果において筆記形状が非常に類似したもの、例え
ば“挨”と“埃”などについて部分パターン“ふ”、“
あ”の違いとして○印の交差があれば“挨”、なければ
“埃”を認識結果とする詳細チェック部を設けるように
すると、より一層確実な認識結果が得られる。
Although not mentioned in the above embodiment, partial patterns "Fu" and "Dust" are used for those whose handwriting shapes are very similar in the ranked recognition results, such as "Dust" and "Dust".
A more reliable recognition result can be obtained by providing a detailed check section that recognizes "dust" if there is an intersection of the ○ marks as a difference between "a" and "dust" if there is no difference.

また、上記実施例の説明では人カバターンの画数に応じ
、各パラメータ値を設定する例を示したが、文字毎にタ
イプ分けし、タイプに応じたパラメータを設定すること
も可能である。
Furthermore, in the description of the above embodiment, an example was shown in which each parameter value is set according to the number of strokes of a human kataan, but it is also possible to classify each character into types and set parameters according to the types.

さらに、中分類部6において部分パターン間ベクトルの
マツチングによる候補の絞り込みに加え、部分パターン
ストロークコード分布マツチングにより距離がある閾値
以上のとき候補としない処理を追加し、後処理を行なう
候補文字を絞るようにすることも可能である。
Furthermore, in addition to narrowing down the candidates by matching vectors between partial patterns in the intermediate classification unit 6, a process is added in which characters are not considered candidates when the distance is greater than a certain threshold using partial pattern stroke code distribution matching, thereby narrowing down candidate characters for post-processing. It is also possible to do so.

(発明の効果) 以上詳細に説明したように、本発明によれば、部分パタ
ーン毎の特徴パラメータの抽出及びマッチングを行なう
ことにより、パターンマツチング法の欠点である筆記人
力される形状のバラツキ(特に文字を構成する部分パタ
ーン間の位置のずれ)による距離値の変動が吸収される
ので、この変動に起因する誤認識を防止できる。また、
部分パターン間ベクトルのマツチングによる候補の絞り
込み及び部分パターン毎に各ストローク各セグメントの
情報を表わした部分パラメータQ値を用いたマツチング
により、最適ストローク対応づけ処理が不要となり、処
理が短縮化される。このように本発明は筆記形状のバラ
ツキに強く、しかも処理量が少なくてすむ優れたオンラ
イン文字認識装置を提供することができる。
(Effects of the Invention) As described in detail above, according to the present invention, by extracting and matching the feature parameters for each partial pattern, the variation in shape created by hand writing, which is a drawback of the pattern matching method, can be eliminated. In particular, since fluctuations in distance values due to positional deviations between partial patterns constituting characters are absorbed, erroneous recognition caused by these fluctuations can be prevented. Also,
By narrowing down the candidates by matching vectors between partial patterns and by matching using the partial parameter Q value representing the information of each segment of each stroke for each partial pattern, the optimum stroke matching process becomes unnecessary and the process is shortened. As described above, the present invention can provide an excellent online character recognition device that is resistant to variations in writing shapes and that requires less processing.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のオンライン文字認識装置の
構成を示すブロック図、第2図は第1図の装置の動作フ
ローチャート、第3図は文字辞書の構成例を示す図、第
4図は部分パターン辞書の構成例を示す図、第5図は前
処理の説明図、第6図はストロークコード化処理の説明
図、第7図は部分パターン間ベクトルの説明図、第8図
は部分パターン間ベクトル算出の説明図、第9図は部分
パターンQ値算出の説明図、第1O図は人カバターンと
登録パターンの特徴点を示す図、第11図は変形人カバ
ターンの説明図、第12図はストロークの対応づけ処理
説明図である。 l・・・タブレット   2−・面処理部3−特徴点抽
出部 4・・・ス]・ローフコード化部5・・・大分類
部   6・・・中分類部7・・・部分パターンQ値マ
ツチング部8・・・部分パターンストロークコード分布
マツチング部9・・・画数対応パラメータ設定部 i o−・・出力端子
FIG. 1 is a block diagram showing the configuration of an online character recognition device according to an embodiment of the present invention, FIG. 2 is an operation flowchart of the device shown in FIG. 1, FIG. 3 is a diagram showing an example of the configuration of a character dictionary, and FIG. The figure shows an example of the structure of a partial pattern dictionary, FIG. 5 is an explanatory diagram of preprocessing, FIG. 6 is an explanatory diagram of stroke encoding processing, FIG. 7 is an explanatory diagram of vectors between partial patterns, and FIG. FIG. 9 is an explanatory diagram of calculation of vectors between partial patterns. FIG. 9 is an explanatory diagram of partial pattern Q value calculation. FIG. FIG. 12 is an explanatory diagram of stroke association processing. l...Tablet 2--Surface processing section 3-Feature point extraction section 4...S]-Loaf coding section 5...Main classification section 6...Medium classification section 7...Partial pattern Q value Matching unit 8...Partial pattern stroke code distribution Matching unit 9...Number of strokes corresponding parameter setting unit i o-...Output terminal

Claims (1)

【特許請求の範囲】 タブレットに筆記入力して得られた座標データ列の不要
データを除去し、直線化処理を施す前処理部と、 前処理部により直線化された座標データ列から、筆記文
字を構成するストロークの特徴を表わす特徴点を抽出す
る特徴点抽出部と、 特徴点抽出部で抽出された特徴点の位置関係により各ス
トロークをコード化するストロークコード化部とを設け
、 ストロークコード化部の出力データを、あらかじめ登録
されている登録パターンデータと比較して文字認識を行
なうオンライン文字認識装置において、 ストロークコード化部の出力を受取り、筆記文字のスト
ローク数により大分類を行なう大分類部大分類部で選択
された候補文字に対し、 筆記上一連のものとして筆記する部分を部分パターンと
し、特徴点抽出部で抽出した特徴点間を結ぶセグメント
の情報より各部分パターンの重心を算出し、 算出した重心データに基づき、1の部分パターンの重心
と別の部分パターンの重心をそれぞれ始点及び終点とす
る部分パターン間ベクトルを求め、 この部分パターン間ベクトルと、あらかじめ同様にして
登録パターンより作成しておいた部分パターン間ベクト
ルとのマッチングを行ない、マッチング結果にしたがっ
て中分類を行なう中分類部と、 中分類部により絞られた候補文字に対し、部分パターン
の各ストローク各セグメント情報より抽出した部分パタ
ーンの特徴を表わす部分パターンQ値を求め、 この部分パターンQ値と、あらかじめ同様にして登録パ
ターンより作成しておいた部分パターンQ値とのマッチ
ングを行ない、 このマッチング結果と、中分類部によるマッチング結果
との重みづけ加算により得られた値にしたがって候補文
字の順位づけを行なう部分パターンQ値マッチング部と
、 部分パターンQ値マッチング部で順位づけされた上位候
補文字に対し、 部分パターン毎に、ストロークコード化部で抽出したス
トロークコードの分布を算出し、 このストロークコード分布と、あらかじめ同様にして登
録パターンより作成しておいた部分パターンストローク
コード分布とのマッチングを行ない、 このマッチング結果と、中分類部によるマッチング結果
と、部分パターンQ値マッチングとの重みづけ加算によ
り得られた値にしたがって候補文字の最終的な順位づけ
を行なう部分パターンストロークコード分布マッチング
部と、 ストローク数毎に、中分類部及び部分パターンQ値マッ
チング部における候補選択の基準となる閾値並びに部分
パターンストロークコード分布マッチング部における重
みづけ加算に用いる重みづけパラメータをあらかじめ設
定しておき、文字認識時の入力文字パターンのストロー
ク数に応じて各パラメータを適宜設定するストローク数
対応パラメータ設定部とを設けたことを特徴とするオン
ライン文字認識装置。
[Scope of Claims] A preprocessing unit that removes unnecessary data from a coordinate data string obtained by handwritten input on a tablet and performs a linearization process, and a written character from the coordinate data string linearized by the preprocessing unit. A feature point extraction unit that extracts feature points representing the characteristics of the strokes that make up the stroke, and a stroke coding unit that codes each stroke based on the positional relationship of the feature points extracted by the feature point extraction unit. In an online character recognition device that performs character recognition by comparing the output data of the section with registered pattern data that has been registered in advance, there is a large classification section that receives the output of the stroke coding section and roughly categorizes the written characters according to the number of strokes. For the candidate characters selected by the major classification section, the part that is written as a series in handwriting is defined as a partial pattern, and the center of gravity of each partial pattern is calculated from the information on the segments connecting the feature points extracted by the feature point extraction section. , Based on the calculated center of gravity data, find a vector between partial patterns whose starting and ending points are the center of gravity of one partial pattern and the center of gravity of another partial pattern, respectively, and create a vector between these partial patterns and a registered pattern in the same manner in advance. The intermediate classification section performs matching with the vectors between partial patterns that have been prepared, and performs intermediate classification according to the matching results.The intermediate classification section performs intermediate classification based on the matching results. Find a partial pattern Q value that represents the characteristics of the partial pattern, match this partial pattern Q value with a partial pattern Q value created in advance from registered patterns in the same way, and use this matching result and the intermediate classification section. The partial pattern Q value matching section ranks the candidate characters according to the value obtained by weighted addition with the matching result of Next, the stroke code distribution extracted by the stroke coding section is calculated, and this stroke code distribution is matched with a partial pattern stroke code distribution previously created from registered patterns in the same manner. , a partial pattern stroke code distribution matching unit that performs final ranking of candidate characters according to the value obtained by weighted addition of the matching result by the medium classification unit and the partial pattern Q value matching, and for each number of strokes, The threshold values used as criteria for candidate selection in the medium classification section and partial pattern Q value matching section and the weighting parameters used for weighted addition in the partial pattern stroke code distribution matching section are set in advance, and the weighting parameters used for weighted addition in the partial pattern stroke code distribution matching section are set in advance. An online character recognition device comprising: a stroke number corresponding parameter setting unit that appropriately sets each parameter according to the number of strokes.
JP61070713A 1986-03-31 1986-03-31 On-line character recognizing device Granted JPS62229384A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61070713A JPS62229384A (en) 1986-03-31 1986-03-31 On-line character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61070713A JPS62229384A (en) 1986-03-31 1986-03-31 On-line character recognizing device

Publications (2)

Publication Number Publication Date
JPS62229384A true JPS62229384A (en) 1987-10-08
JPH0531797B2 JPH0531797B2 (en) 1993-05-13

Family

ID=13439486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61070713A Granted JPS62229384A (en) 1986-03-31 1986-03-31 On-line character recognizing device

Country Status (1)

Country Link
JP (1) JPS62229384A (en)

Also Published As

Publication number Publication date
JPH0531797B2 (en) 1993-05-13

Similar Documents

Publication Publication Date Title
Ghosh et al. Script recognition—a review
Al-Helali et al. Arabic online handwriting recognition (aohr) a survey
US20080002884A1 (en) Method and device for recognition of a handwritten pattern
JP5522408B2 (en) Pattern recognition device
KR19990013306A (en) On-line handwriting input character recognition method and apparatus, and recording medium for executing the method
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
Suen et al. Sorting and recognizing cheques and financial documents
Aouadi et al. A proposal for touching component segmentation in Arabic manuscripts
JPS62229384A (en) On-line character recognizing device
Girdher et al. Comprehensive survey on devanagari OCR
Johnston et al. Sketch recognition of digital logical circuits
Simistira et al. Structural analysis of online handwritten mathematical symbols based on support vector machines
Bharambe et al. Svm classifier for offline handwritten and printed mathematical expression recognition
JPS62229383A (en) On-line character recognizing device
Das et al. A study on Bangla handwritten compound character recognition using LDP
Suen et al. Farsi script recognition: a survey
HIRANVANICHAKORN et al. An on-line recognition method of Thai characters
JP3370184B2 (en) Online handwriting recognition method
Yamaji et al. Online handwritten stroke type determination using descriptors based on spatially and temporally neighboring strokes
Chen et al. A Segmentation-free Approach to OCR
Chou et al. Peripheral and global features for use in coarse classification of Chinese characters
JP2930996B2 (en) Image recognition method and image recognition device
El Emary et al. On-line structural approach for recognizing hand-written Indian numbers
Izadi et al. Incorporating a new relational feature in Arabic online handwritten character recognition
JPH0776980B2 (en) Character recognition method