JPS58214972A - On-line handwritten character recognizer - Google Patents

On-line handwritten character recognizer

Info

Publication number
JPS58214972A
JPS58214972A JP57097606A JP9760682A JPS58214972A JP S58214972 A JPS58214972 A JP S58214972A JP 57097606 A JP57097606 A JP 57097606A JP 9760682 A JP9760682 A JP 9760682A JP S58214972 A JPS58214972 A JP S58214972A
Authority
JP
Japan
Prior art keywords
character
size
input
written
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57097606A
Other languages
Japanese (ja)
Other versions
JPH0150954B2 (en
Inventor
Akihiro Asada
昭広 浅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57097606A priority Critical patent/JPS58214972A/en
Publication of JPS58214972A publication Critical patent/JPS58214972A/en
Publication of JPH0150954B2 publication Critical patent/JPH0150954B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To eliminate an operation for indication of capitals and small letters, by deciding a capital when the size detection result of the input character is larger than a fixed value and then a small letter when the size detection result is smaller than the fixed value and then delivering a character code corresponding to the decided character. CONSTITUTION:A written character is fed to a pre-processing part 4, and the size of the character is detected. A comparator 10 compares the detected size value with the set value to decide the character as a capital or small letter when the size value is larger or smaller than the set value respectively. A code converting circuit 8 receives a character code corresponding to the result obtained by giving pattern recognition to the written character and a size decision result signal through an input and regardless of the size of the written character. Then the character code corresponding to the written character is delivered as it is when a capital is decided by the decision of size. While a character code receives a prescribed conversion based on the character code received at the input and is delivered in the case of a small letter.

Description

【発明の詳細な説明】 本発明は、オンライン手書き文字認識装置に係り、特に
、筆記者の負担軽減と文字記入速度の低下防止とを図っ
たオンライン手書き文字認識装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an online handwritten character recognition device, and more particularly to an online handwritten character recognition device that reduces the burden on a scribe and prevents a decrease in character entry speed.

従来技術とその問題点を第1図、第2図により説明する
。第1図において、1はタブレソト(座標入力装置)、
2は文字記入用シート、3は入力ペン、4は前処理部、
5は特徴抽出回路、6はマツチング回路、7は最小値選
択回路、8はコード変換回路、9は出力端、10はUP
/DOi1%’N検出回路、11はストローク数検出回
路、12は標準パターンメモリ、13は位置比較回路、
14は指示枠位置メモリ、15は大文字/小文字フラグ
メモリである。筆記者は、入力ペン3によって、タブレ
ット1上に配置されている文字記入用シート2の各文字
記入枠2−1内に文字を筆記する。
The prior art and its problems will be explained with reference to FIGS. 1 and 2. In Fig. 1, 1 is a tablet input device (coordinate input device);
2 is a character entry sheet, 3 is an input pen, 4 is a preprocessing unit,
5 is a feature extraction circuit, 6 is a matching circuit, 7 is a minimum value selection circuit, 8 is a code conversion circuit, 9 is an output terminal, 10 is UP
/DOi1%'N detection circuit, 11 is a stroke number detection circuit, 12 is a standard pattern memory, 13 is a position comparison circuit,
Reference numeral 14 represents an instruction frame position memory, and reference numeral 15 represents an uppercase/lowercase character flag memory. A scribe uses an input pen 3 to write characters in each character entry frame 2-1 of a character entry sheet 2 placed on a tablet 1.

このとき、タブレット1は、入力ペン3のペン先のXY
座標の位置情報を、一定時間(標本化周期)ごとに出力
ライン1−3より出力する。
At this time, the tablet 1
Coordinate position information is output from output lines 1-3 at regular intervals (sampling period).

また、入力ペン3には、入力ペン3が文字記入用シート
2に圧着しているか否かを検出するスイッチが内蔵され
ており、このスイッチ出力も、Z軸情報として、前記X
Y座標の位置情報とともに標本化周期ごとに出力ライン
1−3より出力される。
In addition, the input pen 3 has a built-in switch that detects whether or not the input pen 3 is pressed against the character entry sheet 2, and the output of this switch is also used as Z-axis information.
It is output from output lines 1-3 at every sampling period along with the position information of the Y coordinate.

これらのX、Y、Z軸情報は、筆跡情報として前処理部
4に供給される。前処理部4では、まず、2軸情報を見
て、入力ペン3が文字記入用シート2に圧着しているデ
ータ(以下筆跡点と呼ぶ)のみを選択して取り込み以下
の正規化処理をする。
These X, Y, and Z axis information are supplied to the preprocessing section 4 as handwriting information. The preprocessing unit 4 first looks at the two-axis information, selects and imports only the data (hereinafter referred to as handwriting points) that the input pen 3 presses onto the character entry sheet 2, and performs the following normalization process. .

筆跡点の系列には冗長な点を含んでいる。それは、文字
記入時のペン先の移動が一定速度ではなく、隣接する筆
跡点間の空間的な距離が非常に近接しているものもある
からである。このために、筆跡冗長点の除去が行なわれ
る。除去の方法は、ストローク(入力ペン3が文字記入
用シート2に圧着してから離れるまでに描かれた一つの
線分、筆跡点系列)の始点から一定距離はなれた筆跡点
を再標本化点とし、次に、この再標化点から同様に一定
距離はなれた筆跡点を再び再標本化点とする処理をスト
ロークの終点まで行なう。つまり、各ストロークの筆跡
点系列を、時間空間系列から距離空間系列に変換する(
以下この処理を再標本化処理と呼ぶ)。
The series of handwriting points includes redundant points. This is because the pen tip does not move at a constant speed when writing characters, and the spatial distance between adjacent handwriting points may be very close. For this purpose, redundant handwriting points are removed. The removal method is to resample handwriting points that are a certain distance away from the starting point of a stroke (one line segment drawn from when the input pen 3 presses on the character entry sheet 2 until it leaves the character writing sheet 2, a series of handwriting points). Then, the process of again setting handwriting points that are a certain distance away from this re-marking point as re-sampling points is performed until the end point of the stroke. In other words, the handwriting point series of each stroke is converted from a time-space series to a distance-space series (
(Hereinafter, this process will be referred to as resampling process.)

次に、前処理部4は、再標本化処理された1文字分のデ
ータに対して、位置と大きさの正規化を行なう。文字記
入用シート2のどの文字記入枠2−1に文字を筆記する
か(こ、よって筆跡点のXY座標値が異なること、及び
文字記入枠2−1内のどの位置に文字を筆記するかをこ
よっても筆跡点のXY座標値が異ブ、fることのために
、1文字単位ごとに、文字の重心位置が一定となるよう
に座標変換するのが、位置の正規化である。また、文字
記入枠2−1に記入される文字の大きさは筆記者によっ
て異なるため、記入文字の大きさが一定となるように各
再標本化点の座標変換を行なうのが大きさの正規化であ
る。
Next, the preprocessing unit 4 normalizes the position and size of the data for one character that has been resampled. In which character entry frame 2-1 of the character entry sheet 2 should the characters be written? Since the XY coordinate values of the handwriting points will vary even if this is done, position normalization is a process of coordinate transformation for each character so that the center of gravity of the character remains constant. Also, since the size of the characters written in the character entry frame 2-1 differs depending on the scribe, it is recommended to perform coordinate transformation of each resampling point so that the size of the characters written is constant. It is.

これは、文字の重心位置に対する各再標本化点の距離の
平均が一定になるようにすることで行なわれる。
This is done by ensuring that the average distance of each resampling point to the center of gravity of the character is constant.

このよ・)に前処理され一人力文字データは、特徴抽出
回路5によって、以後の処理が容易に行なえるように、
情報量を低減した形で表現される。例えば、Mストロー
クからなる入力文字■は、第m番目番こ記入されたスト
ロークをImとして。
The pre-processed character data is processed by the feature extraction circuit 5 to facilitate subsequent processing.
Expressed in a form with reduced amount of information. For example, for an input character ■ consisting of M strokes, the mth stroke entered is Im.

H= (I 1 、I 2 +  ・・・ 、Ih1)
というように、ストロークの筆記順に表現する。
H= (I 1 , I 2 + ..., Ih1)
It is expressed in the order in which the strokes are written.

また、各ストローク11〜IMは、それぞれストローク
の始点(書き始めの筆跡点)から終点(書き終りの筆跡
点)までの1ストロークの巌分をN等分するN+1個の
折線近似点の系列で表現する。つまり、第n1番目のス
トローク1mは、折線近似点Pm 1.Pm2.−、P
mN+ 1の系列を用いてIm=(Pml 、 Pm2
、−、PmN+1 )と表現する。ここで折線近似点P
+nnはPIITI =(X m n 、 Y m r
・で示されるXY座a値である。
In addition, each stroke 11 to IM is a series of N+1 broken line approximation points that divide the width of one stroke from the start point (starting handwriting point) to the end point (finishing handwriting point) into N equal parts. express. In other words, the n1th stroke 1m is the approximate point Pm1. Pm2. -, P
Im=(Pml, Pm2
, -, PmN+1). Here, the approximate point P of the broken line
+nn is PIITI = (X m n , Y m r
It is the XY locus a value indicated by .

このように特徴抽出回路5で記述された入力文字は、マ
ツチング回路6の一方の入力端に供給される。マツチン
グ回路6の他方の入力端には、予め認識対象の各文字ご
とに、人力文字に対すると回置な前処理、特徴抽出され
た多数の筆記者による入力文字の平均的なパターンが、
標準パターンメモリー2より供給される。
The input characters described by the feature extraction circuit 5 in this manner are supplied to one input terminal of the matching circuit 6. At the other input terminal of the matching circuit 6, the average pattern of characters input by a large number of scribes, whose features have been extracted, is processed for each character to be recognized.
Supplied from standard pattern memory 2.

Φθ ここで、文字θに対する標準パターンSを・θ    
  θ     θ        θ8 w(S  
1.S 2.・・・、8M)とする。ただし、Mは文字
θのストローク数でθ Smは θ      θ     θ       θS m
e=(Pm1. Pmz 、−、PmN+ 1 )と表
現される第m番目のストロークである。
Φθ Here, the standard pattern S for the character θ is ・θ
θ θ θ8 w(S
1. S2. ..., 8M). However, M is the number of strokes of the character θ and θ Sm is θ θ θ θS m
This is the m-th stroke expressed as e=(Pm1.Pmz, -, PmN+1).

θ P m nは θ      θ    θ Pmn!(Xmn、 ymn) と表現される、第m番目のストロークの線分をN等分す
る折線近似点の第n番目のXY座標値である。
θ P m n is θ θ θ Pmn! (Xmn, ymn) is the nth XY coordinate value of a broken line approximate point that divides the line segment of the mth stroke into N equal parts.

マツチング回路6では、入力文字Iと、この工のストロ
ーク数Mに等しいストローク数の標6 準パターンSとの距離D(θ)を次のように計算する。
The matching circuit 6 calculates the distance D(θ) between the input character I and the standard pattern S having the number of strokes equal to the number of strokes M of this pattern as follows.

ここで、Imは入力文字工の第m番目のストロθ   
           ・θ −り、Smは標準パターンSの第m番目のストロ−り、
ds (S’m 、 Im )は両パターンノ第m番目
ノストロークSm、 Im間の距離を示しn==1 である。N+1はストロークの折線近似点数、θ Pmn、Pmnは両パターンの承m酢目のストロークの
第n番目の折線近似点、dP (Pmn 、 Pmn 
)は両パターンの第m番目のストロークの第n番目の折
線近似点間の距離を示し dP(P”mn、Pmn)= (X”mn−Xmn)%
−(7+コymJ9)である。
Here, Im is the mth stroke θ of the input character
・θ-ri, Sm is the m-th stroke of the standard pattern S,
ds (S'm, Im) represents the distance between the m-th stroke Sm, Im of both patterns, and n==1. N+1 is the number of broken line approximation points of the stroke, θ Pmn, Pmn is the nth broken line approximate point of the second stroke of both patterns, dP (Pmn, Pmn
) indicates the distance between the n-th broken line approximate points of the m-th stroke of both patterns dP(P”mn, Pmn) = (X”mn-Xmn)%
-(7+koymJ9).

以上の(7)〜(9)式をまとめて、マツチング回路6
は、両パターン間距離D(θ)としてを計算する。ただ
し、Xmn、)(n+nは第m番目のストロークの第n
番目の折線近似点のX座標値、yo−・、y−・は同じ
くY座標値である。
Combining the above equations (7) to (9), matching circuit 6
is calculated as the distance D(θ) between both patterns. However, Xmn, ) (n+n is the nth stroke of the mth stroke
The X coordinate value, yo-., y-. of the th broken line approximate point is also the Y coordinate value.

ここで、入力文字Iのストローク数Mに等しい標準パタ
ーンがL個あれば、マツチング回路6はこのL個の標準
パターンに対して順次入力文字■とのパターン間距離D
(θ)を計算し、結果を、最小値選択回路7に供給する
Here, if there are L standard patterns equal to the number of strokes M of the input character I, the matching circuit 6 sequentially calculates the inter-pattern distance D between the input character ■ and the L standard patterns.
(θ) and supplies the result to the minimum value selection circuit 7.

なお、入力文字■のストローク数は、タブレット1から
のZ軸情報をもとに、UP/DOWN検出回路10によ
って、入力ペン3のUP 、 DOWNを検出し、そし
て、U l)からDOWNへの変化を、スl−ローク数
検出回路工1によって、1文字分にわたり、計数するこ
とによって求める。
The number of strokes of the input character ■ is determined by detecting the UP and DOWN of the input pen 3 by the UP/DOWN detection circuit 10 based on the Z-axis information from the tablet 1, and then calculating the number of strokes from U l) to DOWN. The change is determined by counting over one character by the stroke number detection circuit 1.

ストローク数検出回路11の出力は、標準パターンメモ
リ12を制御し、入力文字lのストローク数Mに等しい
標準パターンSを選択し、マツチング回路6に供給する
The output of the stroke number detection circuit 11 controls the standard pattern memory 12 to select a standard pattern S equal to the number of strokes M of the input character l and supplies it to the matching circuit 6.

最小値選択回路7は、順次供給されるパターン間距離の
L個D(dl)〜D(θL)のうちの最小値を字コード
を標準パターンメモリ12より取り込みこれをコード変
換回路8に出力する。
The minimum value selection circuit 7 takes the minimum value of the L pieces of inter-pattern distances D(dl) to D(θL) sequentially supplied from the standard pattern memory 12 and outputs it to the code conversion circuit 8. .

以上のような従来のオンライン千11キ文字認識方式に
おいて問題となるのは、例えば仮名文字「キヤ」 「キ
ー」 「キ・、」における大文字「キ」と小文字[ヤJ
  r−J  r−Jのような、大文字と小文字の入力
方式と認識方式である、なんとなれば、これらの小文字
は、大文字と形状を全く同一にし、大きさが異なるのみ
であり、そして、入力文字の大きさの異なりは、従来技
術では、前処理部番こおける正規化によって、認識部で
は全く同一文字となってしまい、大文字であるか小文字
であるかの判断ができないことになるからである。
The problem with the conventional online 111 character recognition method as described above is, for example, the uppercase letter ``ki'' and the lowercase letter [ya J
This is an input method and recognition method for uppercase and lowercase letters, such as r-J r-J. These lowercase letters have exactly the same shape as uppercase letters, only differing in size, and The reason for the difference in character size is that in conventional technology, due to normalization in the preprocessing section, the recognition section ends up with exactly the same characters, making it impossible to determine whether they are uppercase or lowercase. be.

例えば、第2図の(a)のように「ツ」という仮名を文
字記入枠2−1の枠内−ばいに書いた場合と、(C)の
ように文字記入枠2−1のすみに小さく書いた場合とで
、前処理結果は、(bl 、 (dlのようにWOを重
心点として、全く等しいパターンとなってしまう。この
ように大文字と小文字の文字パターンが同一形状となる
ものは、日本字の片仮名、平仮名ばかりでなく、英字に
も存在する。
For example, if the kana ``tsu'' is written in the corner of the character entry frame 2-1 as shown in (a) of Figure 2, and if it is written in the corner of the character entry frame 2-1 as shown in (C). The preprocessing result is exactly the same pattern with WO as the center of gravity, such as (bl, (dl). In this way, when the uppercase and lowercase character patterns have the same shape, , exists not only in Japanese katakana and hiragana, but also in English characters.

これに対処して、従来、大文字であるか小文字であるか
の情報を、筆記時にタブレット1を介して筆記者が供給
する方式が採用されていた。
To deal with this, conventionally a method has been adopted in which a scribe supplies information on whether a letter is an uppercase or a lowercase letter via the tablet 1 at the time of writing.

例えば、第1図に示すように、タブレット1に大文字指
示枠1−1と小文字指示枠1−2とを設け、どちらかの
指示枠を入力ペン3で押圧することによって、以後の入
力文字は大文字であること、あるいは小文字であること
を宣言する。
For example, as shown in FIG. 1, the tablet 1 is provided with an uppercase character designation frame 1-1 and a lowercase character designation frame 1-2, and by pressing either of the designation frames with the input pen 3, subsequent input characters can be changed. Declare uppercase or lowercase letters.

そして認識部では、位置比較回路13において、指示枠
1−1.1−2に対応する座標値(指示枠位置メモリ1
4に記憶されている)を比較用基準として、入力ペン3
がどちらの指示枠を押圧したか、あるいは全く押圧して
いないかを検出し、検出結束に対応して、大文字/小文
字フラグメモリ15をセットする。
Then, in the recognition section, the position comparison circuit 13 determines the coordinate values corresponding to the indication frame 1-1, 1-2 (indication frame position memory 1
4) as a reference for comparison, input pen 3
It is detected which designation frame is pressed or whether it is not pressed at all, and an uppercase/lowercase character flag memory 15 is set in accordance with the detected combination.

ここで、大文字/小文字フラクメモリ15の出力Fを、
大文字の場合F=1、小文字の場合F=0とする。また
、大文字の「ツ」の文字コードをA3C4、小文字の「
ツjの文字コードをA3C5とし、「ツ」の標準パター
ンに対して、大文字の文字コードA3C4を与えたとす
る。
Here, the output F of the uppercase/lowercase character flak memory 15 is
For uppercase letters, F=1; for lowercase letters, F=0. Also, the character code for the uppercase letter “tsu” is A3C4, and the lowercase letter “tsu” is A3C4.
Assume that the character code for tsuj is A3C5, and the standard pattern for ``tsu'' is given an uppercase character code A3C4.

そして、「ツ」を入力ペン3で筆記した場合を見ると、
最小値選択回路7の出力には文字コードA3C4が出力
される。この文字コードはコード変換回路8に供給され
る。コード変換回路8は、大文字/小文字フラグメモリ
15からの指示がF−1(大文字指示)のときはそのま
ま文字コードA3C4を出力し、F’=0(小文字指示
)のときは、小文字に対応する文字コードA3C5を出
力する。つまり、コード変換回路8は、大文字に対応す
る小文字の文字コード対応表を内部にもち、これを用い
て、F=0のときは大文字の文字コードを小文字の文字
コードに変換して出力する。
And if you look at the case where "tsu" is written with input pen 3,
The character code A3C4 is outputted from the minimum value selection circuit 7. This character code is supplied to the code conversion circuit 8. When the instruction from the case/lowercase flag memory 15 is F-1 (uppercase instruction), the code conversion circuit 8 outputs the character code A3C4 as is, and when F'=0 (lowercase instruction), it outputs the character code A3C4, which corresponds to a lowercase letter. Outputs character code A3C5. That is, the code conversion circuit 8 internally has a character code correspondence table of lowercase letters corresponding to uppercase letters, and uses this to convert the uppercase character code to a lowercase character code when F=0 and outputs the converted character code.

しかし上記した従来方式には、文字を記入する以外に大
文字であるか小文字であるかの指示をもしなければなら
ず、筆記者にとって負担となるばかりでなく、入力速度
を低下させるという問題がある。
However, the conventional method described above has the problem that in addition to writing the letters, it is also necessary to indicate whether the letters are uppercase or lowercase, which not only burdens the scribe but also slows down the input speed. .

本発明の目的は、従来技術での上記した問題点を解決し
、娘記者の負担を軽減し、文字記入速度の低下を防止す
るとともに、英字ζこ対する認識能率を向上させること
のできるオンライン手書き文字認識装置を提供すること
にある。
The purpose of the present invention is to solve the above-mentioned problems in the prior art, reduce the burden on the reporter, prevent a decrease in character entry speed, and improve the recognition efficiency for English letters. An object of the present invention is to provide a character recognition device.

本発明の特徴は、上記目的を達成するために、筆記文字
の大きさを検出する文字ザイズ検出手段と、この検出値
と設定値とを比較して設定値より大きいとき大文字、小
さいとき小文字と判定する文字サイズ判定手段と、筆記
文字の文字サイズには依存しないで筆記文字をパターン
認識した結果に対応する文字コードと上記サイズ判定結
果信号とを入力に受けてサイズ判定結果が大文字のとき
は筆記文字に対応する文字コードをそのま差出力しサイ
ズ判定結果が小文字のときは入力に受けた文字コードを
もとに所定のコード変換を行なって出力するコード変換
手段とを備えた構成とするζこゐる。
In order to achieve the above object, the present invention has a character size detection means for detecting the size of a written character, and compares this detected value with a set value, and when the size is larger than the set value, it is determined to be an uppercase letter, and when it is smaller than the set value, it is determined to be a lowercase letter. When the size determination result is an uppercase character by receiving the character code corresponding to the result of pattern recognition of the written character without depending on the character size of the written character and the size determination result signal as input, The apparatus is configured to include a code conversion means that directly outputs a character code corresponding to a written character, and when the size determination result is a lowercase character, performs a predetermined code conversion based on the input character code and outputs the result. ζ It's cold.

以下、本発明の一実施例を第3図により説明する。第3
図においで、4−1は再標本化回路、4−2は位置正規
化回路、4−3は重心点正規化回路、4−4は大きさ正
規化回路、4−5は平均半径抽出回路、16は比較回路
であり、その他は第1図の場合と同じである。人力さイ
1.た文字の婚跡情報はタブレットの出力ラインl−3
より再標本化回路4−1に入力され、ここでは前述した
よ・うに、各ストロークの筆跡点のうらのl、T K点
を除去し、各ストロークの筆跡点系列を時空間イ;列か
ら距離空間系列に変換する。つまり、ストロークの始点
から終点まCの線分を一定距離間隔で再標本化する。
An embodiment of the present invention will be described below with reference to FIG. Third
In the figure, 4-1 is a resampling circuit, 4-2 is a position normalization circuit, 4-3 is a centroid normalization circuit, 4-4 is a size normalization circuit, and 4-5 is an average radius extraction circuit. , 16 is a comparison circuit, and the other parts are the same as in the case of FIG. Human power 1. The marriage information of the characters is on the output line l-3 of the tablet.
Here, as described above, the l and TK points behind the handwriting points of each stroke are removed, and the handwriting point series of each stroke is extracted from the spatiotemporal column. Convert to metric space series. That is, the line segment C from the start point to the end point of the stroke is resampled at constant distance intervals.

この再標本化された入力文字■の第m番目のストローク
Imを再標本化点□□□】、Φ2・・・、 (J)nE
 (rr)の系列で表現し Im= (Qml 、 Qm2 、−・−、Q+nB(
tri )とする。ただし、Qmeは第m番目のストロ
ークの第0番目の再標本化点、E(ホ)は第m番目のス
トロークの再標本化点の数である。また、再標本化点Q
meは、XY座標値を示し Qme = (Xme 、 Yme )       
である。
The m-th stroke Im of this resampled input character ■ is the resampled point □□□], Φ2..., (J)nE
Expressed as a series of (rr), Im= (Qml , Qm2 , −・−, Q+nB(
tri ). However, Qme is the 0th resampling point of the mth stroke, and E (e) is the number of resampling points of the mth stroke. Also, the resampling point Q
me indicates the XY coordinate value, Qme = (Xme, Yme)
It is.

こうして再標本化された人力文字データは、重心点抽出
回路4−3に供給され、入力文字の重心位置Woが抽出
される。この重心位置WOは、−文字分の全再標本化点
Qme (In ” 1〜M、e: l 、 F!に)
)のX座浦値の平均値Xo、Y座標値の平均値YOをX
Y座標値とする↓)のでVvo=(Xo 、 Yo ) と表現される。
The human character data resampled in this way is supplied to the center of gravity extraction circuit 4-3, and the center of gravity Wo of the input character is extracted. This center of gravity position WO is the total resampling point Qme for − characters (In” 1 to M, e: l, F!)
), the average value Xo of the X Zaura value, the average value YO of the Y coordinate value
The Y coordinate value is ↓), so it is expressed as Vvo=(Xo, Yo).

次に、位置正規化回路4−2においC1この重心位置W
Oを新たなXY座標軸の原点と4−るように、各再標本
化点Qmeの座標値を変換する。
Next, in the position normalization circuit 4-2, C1 this center of gravity position W
The coordinate values of each resampling point Qme are transformed so that O is the origin of the new XY coordinate axes.

つまり 、−XQ    −Y。In other words , -XQ -Y.

Qme = (Xme    、 Yme    )の
よ・)に、各再標本化点QmeのXY座標値XmeYm
eから、Xo 、 Yoを減算する。ここでx me 
= X me −X。
Qme = (Xme, Yme)), the XY coordinate value XmeYm of each resampling point Qme
Subtract Xo and Yo from e. x me here
= X me −X.

y me = Yme ’−Y。yme = Yme'-Y.

とすると、重心位置はX = O、y = Oとなる。Then, the center of gravity position is X=O, y=O.

次に、上記のように位置の正規化処理が行なわれた人力
文字データに対して、平均半径抽出回路4−5において
、入力文字の大きさ、ここでは入力文字の平均半径Rを として求める。ここで、U=ΣE(、、、)で入力文字
1n=1 の再標本化点数であり、Mは入力文字のストローク数、
1xme1.l ymelは入力文字の重心位置WOを
原点とする第m番目のスト11−りの第0番目の再標本
化点のX軸値、Y軸値の絶対値であ名。叩ち、各再標本
化点QrTIeの重心位置W01・からの距離の平均値
として平均半径Rを求めたことになる。この平均半径R
は、文字を天きく記入するほど大きな値となるものであ
り、人力文字の大きさに対応する・マラメータである。
Next, the average radius extraction circuit 4-5 calculates the size of the input character, here the average radius R of the input character, for the human character data that has been subjected to the position normalization process as described above. Here, U=ΣE(,,,) is the number of resampling points of input character 1n=1, M is the number of strokes of input character,
1xme1. l ymel is the absolute value of the X-axis value and Y-axis value of the 0th resampling point of the mth string whose origin is the center of gravity WO of the input character. This means that the average radius R is obtained as the average value of the distances of each resampling point QrTIe from the center of gravity W01. This average radius R
The larger the character is written, the larger the value becomes, and is a malameter that corresponds to the size of human-powered characters.

大きさ正規化回路4−4は、この平均半径R。The size normalization circuit 4-4 calculates this average radius R.

が設定値ROとなるように、各再標本化点Qmeの座標
値を変換する。この変換処理後の再標本化点QmeのX
、Y軸の値をX ll1e ’i″Y ITleとすれ
ば、大きさの正規化は のように、入力文字の平均半径几で各XY座標値を正規
化(除算)することである。
The coordinate values of each resampling point Qme are transformed so that Qme becomes the set value RO. X of the resampling point Qme after this conversion process
, the Y-axis value is X ll1e 'i''Y ITle, then the normalization of the size is to normalize (divide) each XY coordinate value by the average radius of the input character, as shown below.

この入力文字の平均半径Rは、また、比較回路16の一
方の入力端に入力され、他方の入力端に入力される設定
値athと比較される。つまり、比較回路16は、入力
文字が設定値よりも大きいか否かを判定する。判定結果
はコード変換回路8に供給され、コード変換回路8の動
作を制御する。
This average radius R of the input characters is also input to one input terminal of the comparison circuit 16 and compared with a set value ath input to the other input terminal. In other words, the comparison circuit 16 determines whether the input character is larger than the set value. The determination result is supplied to the code conversion circuit 8, and the operation of the code conversion circuit 8 is controlled.

大きさ正規化回路4−4の出力信号は特徴抽出回路5に
供給され、従来技術で説明したように、入力文字が情報
量圧縮された形で表現されそして、マツチング回路6に
おいて標準パター1ンとのマツチング計算(パターン間
距離の計算)を行なう。
The output signal of the size normalization circuit 4-4 is supplied to the feature extraction circuit 5, where the input character is expressed in a compressed form as explained in the prior art section, and the matching circuit 6 converts the input character into a standard pattern 1. Perform matching calculation (calculation of distance between patterns) with

標準パターンメモリ12には、英字に関してはA、B、
C,・・・等の大文字、仮名文字に関してもア、イ、つ
、・・・ツ等の大文字の、多数の筆記者によって記入さ
れ前述の前処理、特徴抽出が行なわれたパターンの平均
的なパターンを、その文字に対応する文字コードととも
に記憶させておく。また、このとき、文字のストローク
数によって分類して、記憶させておく。
The standard pattern memory 12 contains letters A, B,
Regarding uppercase letters such as C, ..., kana characters, etc., the average of patterns of uppercase letters such as A, I, tsu, ...tsu, written by many scribes and subjected to the above-mentioned preprocessing and feature extraction. The pattern is stored together with the character code corresponding to that character. Also, at this time, the characters are classified and stored according to the number of strokes.

ここで、第4図の図(1)9図(2)のように、文字記
入枠2−1に英字大文字1” A Jを第1ストローク
■l[△」 、第2ストローク12 [’ −Jの2ス
トロークで記入したとすると、出力ライン1−3の筆跡
情報は、前処理、特徴抽出が行なわれトマッチング回路
6で、標準パターンメモリ内の2ストロークからなる標
準パターンとのマツチング計算(パターン間距離の計算
)が行なわれ結果が順次、最小値選択回路7に供給され
る。
Here, as shown in Figures 4 (1) and 9 (2), write capital letters 1" A J in the character entry frame 2-1 with the first stroke ■l [△" and the second stroke 12 [' - Assuming that the handwriting information of output lines 1-3 is written using two strokes of J, the handwriting information of output lines 1-3 is subjected to pre-processing and feature extraction, and the matching circuit 6 performs matching calculation ( (calculation of inter-pattern distance) is performed and the results are sequentially supplied to the minimum value selection circuit 7.

そして、最小値選択回路7において、パターン間距離D
(θ)の最小値を検出して、その最小値に対応する標準
パターンの文字コードをコード変換回路8に供給する。
Then, in the minimum value selection circuit 7, the inter-pattern distance D
The minimum value of (θ) is detected and the standard pattern character code corresponding to the minimum value is supplied to the code conversion circuit 8.

ここで、標準パターンとその文字(大文字)に対応する
文字コードを第1表の左部のようにし、またその大文字
に対応する小文字の文字コードを第1表の右部のように
設定したとする。
Here, if you set the character code corresponding to the standard pattern and its letters (uppercase letters) as shown on the left side of Table 1, and set the character codes of lowercase letters corresponding to the uppercase letters as shown on the right side of Table 1. do.

最小値選択回路7において、大文字rAJに対するパタ
ーン間距離が最小となったとき、最小値選択回路7は、
大文字rAJに付与した文字コードA3C1をコード変
換回路8に供給する。そして、第4図の図(1)2図(
2)の英字大文字「Ajの筆記に対して、平均半径抽出
回路4−5で抽出した平均半径R(1)、R(2)が、
設定値几thより大きいか否かが、比較回路16で比較
される。
In the minimum value selection circuit 7, when the distance between patterns for the capital letter rAJ becomes the minimum, the minimum value selection circuit 7
The character code A3C1 given to the capital letter rAJ is supplied to the code conversion circuit 8. Figures 4 (1) and 2 (
2) The average radius R(1) and R(2) extracted by the average radius extraction circuit 4-5 for the writing of the capital letter "Aj" are as follows.
A comparison circuit 16 compares whether or not it is larger than a set value th.

ここでは RthくRm      ・・・図(1)の場合Rth
 > R(2)      ・・・図(2)の場合と判
定されたとすると、コード変換回路8は、図(11の場
合は、入力文字コードA3C1(1−A−1に対する文
字コード)をそのまま出力し、図(2)の場合は、小さ
く「A」が記入された七して、入力文字コードA3C1
(1’AJに対する文字コードを基に、対応する英字小
文字1a−(の文字コードA3B1を、第1表の大文字
−小文字の文字コード対応テーブル(コード変換回路8
に内蔵)を参照して、出力する。
Here, Rth × Rm...In the case of Figure (1), Rth
> R(2)...If it is determined that the case shown in Figure (2) is the case, the code conversion circuit 8 outputs the input character code A3C1 (character code for 1-A-1) as it is in the case of Figure (11). In the case of Figure (2), the input character code is A3C1 with a small "A" written in it.
(Based on the character code for 1'AJ, the character code A3B1 of the corresponding alphabetic lowercase letter 1a-(
(built-in) and output it.

片仮名「ツ」を第4図の図(3)1図(4)のように筆
記した場合も同様である。これらの様子を第2表にまと
めて示している。
The same is true when the katakana ``tsu'' is written as shown in Figures (3) and 1 (4) in Figure 4. These conditions are summarized in Table 2.

第   2   表 (注)大きく・・・文字記入枠−ばいに大きく記入小さ
く・・・文字記入枠に対して小さく記入することを意味
する。
Table 2 (Note) Large: means to write in a larger size than the character entry frame.Small: means to write in a smaller size relative to the character entry frame.

以上の実施例では、位置の正規化を入力文字の重心位置
を原点lこするようにし、また入力文字の大きさを、入
力文字の重心位置と再漂本化点との平均距離(平均半径
)とし、この平均半径を基に大きさの正規化を行なう構
成のものについて説明したが、本発明はこれに限定され
ず上記に代えて、位置の正規化を、入力文字の外接矩形
の中心位置を原点にするようにし、また入力文字の大き
さを、上記外接矩形の対角線長とし、この対角線長を基
に、一定の対角線長となるように、大きさの正規化を行
なう構成とすることもできる。
In the above example, the position is normalized so that the center of gravity of the input character is crossed from the origin l, and the size of the input character is set to the average distance (average radius) between the center of gravity of the input character and the re-drifting point. ), and the size is normalized based on this average radius.However, the present invention is not limited to this, and instead of the above, position normalization is performed based on the center of the circumscribed rectangle of the input character. The position is set as the origin, and the size of the input character is set as the diagonal length of the circumscribed rectangle, and the size is normalized based on this diagonal length so that it becomes a constant diagonal length. You can also do that.

以上説明したように、本発明によ(1,ば、入力文字の
大きさを検出し、検出結果が一定値以上のときは大文字
、一定値より小さいときは小文字と判定し、その判定さ
ねた文字に対応する文字コードを出力する構成としたこ
とにより、従来、入力ペンを大文字、小文字の指示枠工
IJ 7内に押圧することによる入力文字の大文字、小
文字の指示操作を不必要とし、筆記者の負担を除くとと
もに、文字入力速度の低下を防Iヒすることができるよ
うになり、また、文字が曲線を主体lと構成されている
英字・1・文字を認識対象外としたことにより、従来、
英字小文字が曲線を主体にしているが故に筆記者によっ
て多稲多様の変形があって認識率の低下を生じていたの
を防止することができる効果がある。
As explained above, according to the present invention (1), the size of an input character is detected, and when the detection result is larger than a certain value, it is judged as an uppercase letter, and when it is smaller than a certain value, it is judged as a lowercase letter. By having a configuration that outputs a character code corresponding to the input character, it is no longer necessary to input the input character by pressing the input pen into the uppercase and lowercase letter indication frame IJ7, In addition to eliminating the burden on the scribe, it is now possible to prevent a drop in character input speed, and alphabetic characters, 1, and characters whose characters are mainly composed of curved lines, are excluded from recognition. Traditionally,
This has the effect of preventing lowercase letters from being deformed in various ways by scribes, which lowers the recognition rate because they are mainly curved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来例の構成図、第2図は入力文字と前処理結
果を示す図、第3図は本発明の一実施例構成図、第4図
は本発明の文字筆記例を示4〜図である。 符号の説明 1・・・タブレット   2・・・文字記入用シート2
−1・・・文字記入枠 3・・・人力ペン4・・・前処
理部 4−4・・・大きさ正規化回路 4−5・・平均半径抽出回路 5・・・特徴抽出回路  7・・・最小値選択回路8・
・・コード変換回路 12・・・標準パターンメモリ 16・・・比較回路 代理人弁理士 薄 1)利 幸 1 ・   2P 矛 (D       (2) 4 閉 (3)      (4) 418
Fig. 1 is a block diagram of a conventional example, Fig. 2 is a diagram showing input characters and preprocessing results, Fig. 3 is a block diagram of an embodiment of the present invention, and Fig. 4 is a diagram showing an example of character writing according to the present invention. ~It is a figure. Explanation of symbols 1...Tablet 2...Character entry sheet 2
-1...Character entry frame 3...Manual pen 4...Preprocessing unit 4-4...Size normalization circuit 4-5...Average radius extraction circuit 5...Feature extraction circuit 7.・Minimum value selection circuit 8・
...Code conversion circuit 12...Standard pattern memory 16...Comparison circuit agent Patent attorney Usui 1) Toshiyuki 1 ・ 2P spear (D (2) 4 Closed (3) (4) 418

Claims (1)

【特許請求の範囲】 (リ 入力ペンでタブレット上に文字を筆記し、タブレ
ットより出力される筆記文字の娘跡情報をもとに筆記さ
れた文字を認識するオンライン手書き文字認識装置にお
いて、筆記文字の大きさを検出する文字サイズ検出手段
と、この検出値と設定値とを比較し設定値より大きいと
き大文字、小さいとき小文字と判定する文字サイズ判定
手段と、筆記文字の文字サイズには依存しないで筆記文
字をパターン認識した結果に対応する文字コードと上記
サイズ判定結果信号とを入力に受けてサイズ判定結果が
大文字のときは筆記文字に対応する文字コードをそのま
ま出力しサイズ判定結果が小文字のときは入力に受けた
文字コードをもとlこ所定のコード変換を行なって出力
するコード変換手段とを備えたことを特徴とするオンラ
イン手書き文字認識装置。 (2、特許請求の範囲第1項記載の装置に8い(、前記
文字サイズ検出手段は、筆記文字の各ストロークの線分
を一定距離間隔ごとに抽出した再標本化点をもとに得た
筆記文字の重心点と上記各再標化点との距離の平均値を
筆記文字の大きさとする文字サイズ検出手段であること
を特徴とするオンライン手書き文字認識装置。 (3)特許請求の範囲第1項記載の装置において、前記
文字サイズ検出手段は、筆記文字に外接する矩形の対角
線長を筆記文字の大きさとする文字サイズ検出手段であ
ることを特徴とするオンライン手tき文字認識装置。
[Scope of Claims] (Li) An online handwritten character recognition device that writes characters on a tablet with an input pen and recognizes the written characters based on daughter trace information of the written characters output from the tablet. a font size detection means for detecting the size of the font, a font size determination means for comparing the detected value with a set value and determining that it is an upper case letter when it is larger than the set value, and a lower case letter when it is smaller than the set value, and a font size judgment means that does not depend on the font size of written characters. When the size judgment result is an uppercase letter, the character code corresponding to the pattern recognition result of the written character is output as is, and the size judgment result is a lowercase letter. An online handwritten character recognition device characterized by comprising: code conversion means for converting a predetermined code based on a character code received as an input and outputting the resultant code. (2. Claim 1) The above-mentioned character size detection means detects the center of gravity of the written character obtained based on the re-sampling points extracted from the line segments of each stroke of the written character at fixed distance intervals, and the above-mentioned re-sampling points. An online handwritten character recognition device characterized in that it is a character size detection means that determines the size of the handwritten character as the average value of the distance from the marked point. (3) In the device according to claim 1, the character An online handwritten character recognition device characterized in that the size detection means is a character size detection means that determines the length of a diagonal line of a rectangle circumscribing the handwritten character as the size of the handwritten character.
JP57097606A 1982-06-09 1982-06-09 On-line handwritten character recognizer Granted JPS58214972A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57097606A JPS58214972A (en) 1982-06-09 1982-06-09 On-line handwritten character recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57097606A JPS58214972A (en) 1982-06-09 1982-06-09 On-line handwritten character recognizer

Publications (2)

Publication Number Publication Date
JPS58214972A true JPS58214972A (en) 1983-12-14
JPH0150954B2 JPH0150954B2 (en) 1989-11-01

Family

ID=14196877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57097606A Granted JPS58214972A (en) 1982-06-09 1982-06-09 On-line handwritten character recognizer

Country Status (1)

Country Link
JP (1) JPS58214972A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60107708A (en) * 1983-11-17 1985-06-13 Tdk Corp Magnetic head
JPS60237584A (en) * 1984-05-09 1985-11-26 Sanyo Electric Co Ltd Character recognition system
JPS60246492A (en) * 1984-05-22 1985-12-06 Sharp Corp Discriminating method of large character and small character in case of recognizing handwriting character
JPS61249483A (en) * 1985-04-26 1986-11-06 松下電器産業株式会社 Laser medical apparatus
JPS621086A (en) * 1985-06-26 1987-01-07 Toshiba Corp Character input device
JPS6320265U (en) * 1986-07-18 1988-02-10
JPH01159723A (en) * 1987-12-16 1989-06-22 Fujitsu Ltd Hand written character inputting device
JPH03223986A (en) * 1989-12-26 1991-10-02 Fuji Facom Corp Method for rejecting recognized result

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60107708A (en) * 1983-11-17 1985-06-13 Tdk Corp Magnetic head
JPS60237584A (en) * 1984-05-09 1985-11-26 Sanyo Electric Co Ltd Character recognition system
JPH0436431B2 (en) * 1984-05-09 1992-06-16 Sanyo Electric Co
JPS60246492A (en) * 1984-05-22 1985-12-06 Sharp Corp Discriminating method of large character and small character in case of recognizing handwriting character
JPS61249483A (en) * 1985-04-26 1986-11-06 松下電器産業株式会社 Laser medical apparatus
JPS621086A (en) * 1985-06-26 1987-01-07 Toshiba Corp Character input device
JPS6320265U (en) * 1986-07-18 1988-02-10
JPH01159723A (en) * 1987-12-16 1989-06-22 Fujitsu Ltd Hand written character inputting device
JPH03223986A (en) * 1989-12-26 1991-10-02 Fuji Facom Corp Method for rejecting recognized result

Also Published As

Publication number Publication date
JPH0150954B2 (en) 1989-11-01

Similar Documents

Publication Publication Date Title
JP3155577B2 (en) Character recognition method and device
Bhattacharya et al. An end-to-end system for Bangla online handwriting recognition
JPS58214972A (en) On-line handwritten character recognizer
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
JP5455364B2 (en) Information processing apparatus and locus data recognition method
JPS62159291A (en) Sentence input device
KR19980058361A (en) Korean Character Recognition Method and System
JPS58214973A (en) Similar character discriminating system
JP3128357B2 (en) Character recognition processor
JPH0676116A (en) On-line character recognizing device
JPH08161426A (en) Handwritten character stroke segmenting device
JPH11126236A (en) Device and method for on-line handwritten character recognition, and recording medium where the same method is recorded
JPH09106440A (en) Feature point detecting method for handwritten character recognition
JPH0728951A (en) On-line character/graphic recognition device
JPS63301383A (en) Handwritten character recognition device
JP2972443B2 (en) Character recognition device
JPH053633B2 (en)
JP3051628B2 (en) Character recognition method and device
JPH01298483A (en) Picture recognizing device
JPS6215681A (en) Recognizing system for on-line handwritten character
JPH0766418B2 (en) Handwriting recognition device
JPH04353964A (en) Document generation device
JPS63284691A (en) Pattern recognizing device
JPH07182455A (en) Character recognition device/method
JPH042990B2 (en)