JP2664624B2 - Feature point detection method for handwritten character recognition - Google Patents

Feature point detection method for handwritten character recognition

Info

Publication number
JP2664624B2
JP2664624B2 JP5190536A JP19053693A JP2664624B2 JP 2664624 B2 JP2664624 B2 JP 2664624B2 JP 5190536 A JP5190536 A JP 5190536A JP 19053693 A JP19053693 A JP 19053693A JP 2664624 B2 JP2664624 B2 JP 2664624B2
Authority
JP
Japan
Prior art keywords
point
stroke
feature
points
stop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5190536A
Other languages
Japanese (ja)
Other versions
JPH06223229A (en
Inventor
正義 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP5190536A priority Critical patent/JP2664624B2/en
Publication of JPH06223229A publication Critical patent/JPH06223229A/en
Application granted granted Critical
Publication of JP2664624B2 publication Critical patent/JP2664624B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、手書き文字入力方法に
関する。たとえば、日本語ワードプロセッサ等の文字入
力装置として利用される手書き文字入力装置にて手書き
入力された文字を認識するための方法に関する。 【0002】 【従来の技術】ワードプロセッサの入力装置として、そ
の操作にある程度の熟練を要するキーボードに代わっ
て、たとえば、タブレット上に入力ペンにて手書き入力
された文字を認識し、この文字の入力を受け付けるよう
に構成された手書き文字入力装置が開発され、実用化さ
れている。 【0003】この種の装置は、文字入力用のタブレット
上での入力ペンの軌跡として、手書き入力された文字の
各ストロークのタブレット上における時系列座標データ
を基に、それぞれのストロークの特徴を表す座標値を選
択的に検出して特徴点とし、これらの特徴点列にて各ス
トロークを点近似し、この各ストロークに近似された特
徴点列の座標値または特徴点列の位置関係から求められ
るストロークの特徴により、入力ペンにて手書き入力さ
れた文字を認識する。 【0004】さて、上述の各ストロークの特徴点を検出
する方法として、以下に説明する2つの方法が主として
採られていた。その第1は、入力された時系列座標デー
タを等距離間隔にて順次分割した各点(等間隔検出点)
と、ストロークの始点及び終点とを特徴点として文字認
識を行うものである。 【0005】その第2は、入力された時系列座標データ
から座標値の時系列的な移動方向が変化する点を極点と
して検出し、これとストロークの始点及び終点とを特徴
点として文字認識を行うものである。しかし、上述の第
1の方法では、ストロークの特徴点を検出する処理は比
較的簡単であるが、検出された特徴点とストロークの屈
曲点とが一致する可能性は少なく、従ってストロークの
中途の屈曲点を的確に検出することは困難であり、この
ため屈曲点を有するストロークの形状を正確に検出する
ことが出来ない。 【0006】また第2の方法では、読み取られたストロ
ークの時系列座標データから座標値の時系列的な移動方
向をその都度演算する必要がある。このため入力処理に
要するデータ処理量が過大となって入力処理に時間を要
し、またデータ処理装置も必要以上に大容量のものが必
要となる。また、この方法では、座標値の微細な移動方
向の変化等に影響され易く、不必要な特徴点が数多く検
出される虞がある。 【0007】【発明が解決しようとする課題】 本願は、文字認識の性
能を高めることを目的とする。 ところで、 手書き文字入
力に際しては、ストロークの屈曲点において入力ペンが
停留する。換言すれば、手書き文字入力装置の入力面上
を移動する入力ペンの軌跡を時系列座標データとして検
出した場合に、ある程度以上の時間に亘って継続して同
一座標値が検出される、という点に着目してこの入力ペ
ンの停留点を特徴点とすることにより、比較的少ない演
算量にて各ストロークの屈曲点を的確に検出して高精度
にて手書き文字入力された文字を認識し得る手書き文字
認識方法が、考えられる。本願は、このように、停留点
を検出すること目的とする。 ところで、単純には、特徴
点が多いほど、認識精度が向上する。 しかし、特徴点が
多いと、認識のための演算量が、大きくなる。 また、不
必要な点を特徴点として採用すると、文字認識精度が低
下してしまう。 本願は、停留点を特徴点として採用する
とともに、文字認識精度の向上を計るために、適切な特
徴点を検出することを目的とする。 【0008】 【0009】 【課題を解決するための手段】本願発明は、文字入力装
置の文字入力面上における位置を表す時系列座標データ
として読取られた入力ペンの軌跡を構成する各ストロー
クの始点、終点及び前記時系列座標データが同一値を所
定回数以上連続して反復する座標位置として検出される
入力ペンの停留点とを検出し、この始点、終点及び停留
点を特徴点とし、これらの特徴点にて構成される特徴点
列の座標値または各特徴点相互の位置関係から求められ
た各ストロークの特徴を基に、入力ペンの軌跡として手
書き入力された文字を認識する手書き文字認識の特徴点
検出方法において、前記始点または終点の近傍位置に前
記停留点が存在する場合は、これらの点の中の前記停留
点の1点を始点または終点と設定し、他の点を特徴点と
して採用しないことを特徴とする。 【0010】 【0011】 【作用】本願発明は、上記の構成なので、始点または終
点の近傍に停留点がある場合は、これらの点を、1つの
停留点にまとめて1つの特徴点としている。 【0012】 【実施例】まず、手書き文字認識における停留点検出の
意味について説明する。図1は、一例として漢字「扱」を
手書き文字入力用のタブレットにて入力した場合の時系
列座標データの実測値を示している。なお、測定データ
は時間分解能が100点/秒、空間分解能が10点/mmであ
る。 【0013】図中、各数字はそれぞれの位置の座標値が
連続して検出された回数を示しており、また○印を付し
た部分は上述の数字が4以上である部分を、さらに○印
に隣接してアンダーラインを付した数字はその○印が付
された位置での同一座標値の重複回数をそれぞれ示して
いる。この図1に示した実測データからは、以下の事実
が明瞭に読み取れる。 【0014】即ち、同一ストローク途中における屈曲点
では同一座標値の重複が相当程度高い数値を示している
こと、また各ストロークの始点及び終点においても最低
4以上の重複が生じている、等である。従って、重複回
数4以上の座標値の位置を特徴点とすれば、ストローク
の屈曲点は勿論のこと、始点及び終点をも的確に検出し
得ることになる。 【0015】以下に、本発明をその実施例を示す図面に
基づいて説明する。図2は、上述の如き原理に従って本
発明を実施するために用いる手書き文字認識装置のブロ
ック図である。図2において、(1)は手書き文字入力装置
であり、その文字入力面上を移動する入力ペンの軌跡が
入力面上に設定されたX−Y座標系における時系列デー
タとして検出される。そして、この時系列座標データ
は、停留点検出装置(2)に与えられる。 【0016】停留点検出装置(2)は、手書き文字入力装
置(1)から与えられた時系列座標データを処理して各ス
トロークの始点,終点及びその間に存在する停留点とを
検出し、その座標値をストローク特徴量算出装置(3)に
出力する。なお、この停留点検出装置(2)のデータ処理
動作については後述する。ストローク特徴量算出装置
(3)は、停留点検出装置(2)から与えられた各ストローク
それぞれの始点,終点及び停留点の座標値を各ストロー
クの特徴点とし、これらの特徴点列の座標値からそのス
トロークの特徴量を算出する。なお、各ストロークの検
出されるべき特徴としては、特徴点間を結ぶ線分の角
度、長さ(相対的な)、特徴点間を結ぶ線分の繋がり方
(右回りあるいは左回り等)等である。 【0017】そして、これらの検出された各ストローク
の特徴はストローク識別装置(4)に与えられる。ストロ
ーク識別装置(4)は、上述のストローク特徴量算出装置
(3)から与えられた各ストロークの特徴を基に、そのス
トロークを特定の標準ストローク、例えば図9の(a)(b)
(c)に示す様な特徴点が始終点のみのストローク、ある
いは図9の(d)(e)(f)(g)に示す様な屈曲点(本発明方法に
おいては始終点間の停留点として検出される)をも含む
ストロークの標準パターンにそれぞれ特定するものであ
る。 【0018】なお、ストロークの標準パターンは、漢
字,仮名,数字,アルファベット等の各文字を手書き筆記
する場合の筆順に従って各ストロークに分解したものそ
れぞれを上記の如く標準ストロークとして分解し、各標
準ストロークの特徴がストローク識別装置(4)に付属す
るストローク辞書(41)に予め格納されている。そして、
ストローク識別装置(4)は、ストローク特徴量算出装置
(3)から与えられたストロークの特徴を、ストローク辞
書(41)に格納されている標準ストロークの特徴と比較す
ることにより標準ストロークの内の一つとして特定し、
その標準ストロークのたとえばコード番号が文字識別装
置(5)に出力される。 【0019】文字識別装置(5)は、上述のストローク識
別装置(4)から与えられる一文字分の標準ストロークの
コード番号の組み合わせにより手書き文字認識装置(1)
に手書き入力された文字を特定の文字として認識する装
置である。この文字識別装置(5)には、漢字,かな, 数
字,アルファベット等の各文字を前述の標準ストローク
の組み合わせとしてそれぞれ表したデータを格納した文
字辞書(51)が付属している。そして、前述のストローク
識別装置(4)から1文字分のストロークの特定結果が与
えられる都度、これを文字認識装置(5)は文字辞書(51)
に格納されている各文字のストロークの組み合わせのデ
ータと比較することにより、手書き文字入力装置(1)か
ら手書き入力された文字を特定の文字として認識する。 【0020】本実施例は、以上のように構成された装置
により実施されるのであるが、停留点検出装置(2)によ
る停留点の検出動作について、図3のフローチャートに
従って具体的に説明する。停留点検出回路(2)は、手書
き文字入力装置(1)から順次入力される手書き文字の時
系列座標データの各データ値を、前回入力されたデータ
値と比較し、同一値である場合には重複回数Nを1加算
してデータを読み込むステップに戻って次のデータを読
み込み、同一値でない場合には重複回数Nが4以上であ
るか否かの判断を行う。そして、重複回数Nが4以上(N
≧4)の場合にはその座標値を停留点として一旦付属のメ
モリ内に格納して重複回数Nを0(N=0)にリセットした
後、次のデータを読み込むステップに戻る。また、重複
回数Nが4以上でない(N<4)の場合には重複回数Nを0(N=
0)にリセットして次のデータを読み込むステップに戻
る。 【0021】さて、停留点は基本的には上述の如き処理
により検出されるのであるが、手書き文字入力の場合に
は、ストローク途中の屈曲点においては入力ペンの移動
が停留する停留点が一個所であることはむしろ稀であ
り、通常は極く狭い範囲に停留点が複数現れることが多
い。従って、このような場合には、停留点検出装置(2)
は、以下の原則に従って、メモリに一旦格納した複数の
停留点の中から一点の停留点を選択して特徴点とする。 【0022】たとえば、図4(a)の如き、中途に屈曲点を
有するストロークを具体例として考えると、まず、図4
(b)はストローク中途の屈曲点の近傍に4点の停留点が
検出された場合を示している。即ち、このストロークの
屈曲点にはそれぞれ所定の距離内にA,B,C,Dの4点の停
留点が検出され、それぞれの重複回数AN,BN,CN,DNは、A
N=4,BN=5,CN=10,DN=6である。このような場合には停留
点検出装置(2)は重複回数Nが最大の停留点C(CN=10)を、
この屈曲点を代表とする特徴点として選択し、その座標
値をストローク特徴量算出装置(3)に出力する。 【0023】図4(c)は、上述の場合と同様にして5点の
停留点A〜Eが検出された際に、C点とD点の重複回数CN,D
Nがともに8で同数(CN=8、DN=8)であった場合を示してい
る。 このような場合には、停留点検出装置(2)は、たと
えば、(A)時間的に最初に現れた停留点を選択する。(B)
時間的に最後に現れた停留点を選択する。(C)両者の中
間を停留点として新たに設定する、等のいずれかの方法
により、一点を特徴点として選択し、その座標値をスト
ローク特徴量算出装置(3)に出力する。 【0024】図4(d)は、同一座標値の点Cが停留点とし
て二度検出された場合を示している。即ち、ストローク
の屈曲点において時系列座標データが点A(重複回数AN=
4)から点B(重複回数BN=5)、点C(重複回数CN1=8)に移動
し、次に点C’に一旦移動した後再度点Cに戻って(重複
回数CN2=3)、更に点D(重複回数DN=8)、点E(重複回数EN=
5)の順に移動した場合には、停留点検出装置(2)は停留
点Cにおける一回目の重複回数CN1と二回目の重複回数CN
2とを加算した重複回数CN0(=11)をその点Cの重複 回数C
Nとする。そして停留点検出装置(2)は、この後、上述の
図4(c)の場合と同 様に重複回数Nが最大の点をこの屈曲
点を代表する特徴点として、その座標値を ストローク
特徴量算出装置(3)に出力する。 【0025】従って、図4(d)の例では、点Cの一回目の
重複回数CN1と点Dの重複回数DNとが共に8で最大である
が、点Cの一回目と二回目の合計の重複回数CN0が11と
なるので、この点Cがこの屈曲点の停留点、即ちこの屈
曲点を代表する特徴点として選択されてその座標値がス
トローク特徴量算出装置(3)に出力される。次に、停留
点検出装置(2)による始終点の検出について説明する。 【0026】手書き文字入力に際しては、一般的には各
ストロークの始点及び終点においては、入力ペンの移動
が一旦停止し、あるいは移動速度がやや遅くなるため、
この始点及び終点には当然停留点が発生する。このた
め、たとえば、図5(a)及び(b)に示す如く(○は時系列座
標データ、●は停留点をそれぞれ表す)、ストロークの
始点及び終点近傍には始点SP及び終点EPが検出されるこ
とは勿論、始点SP及び終点EPから所定距離内に停留点A,
B,C及びD,E,F等も検出される場合があり得る。このよう
な場合には、停留点検出装置(2)は始点SP及び終点EPを
特徴点として採用せず、各停留点A,B,C及びD,E,Fの内か
ら前述の処理により一点を選択してそれぞれ始点及び終
点を表す特徴点としてそれらの座標値をストローク特徴
量算出装置(3)に出力する。 【0027】一方、図5(c)に示す如く、始点SP及び終点
EP(図5(c)には終点EPのみを示す)近傍の所定距離内に停
留点が存在しない場合には、停留点検出装置(2)は終点E
Pをそのまま終点を表す特徴点として検出し、その座標
値をストローク特徴量算出装置(3)に出力する。更に、
図5(d)に示す如く、ストロークの終端部分が「はね」で終
わる場合には、「はね」の開始部分はストローク中途にお
ける屈曲点であるから停留点が検出されるが、「はね」の
終端部分に停留点が、「はね」の終端部分に停留点が現れ
ることは無い。従って、「はね」の終点、即ちストローク
の終点EPの所定距離内には停留点は存在せず、「はね」の
終点がストロークの終点EPを表す特徴点として、検出さ
れ、また「はね」そのものも屈曲点から終点EP間の長さを
有するストロークの一部分として検出されるため、より
正確なストロークの認識が可能となる。 【0028】図6は本願の第2の実施例の構成例を示す
ブロック図である。この第2の装置構成例では、前述の
第1の装置構成例同様に手書き文字入力装置(1)の入力面
上に入力ペンの軌跡として手書き入力された文字の時系
列座標データが停留点検出装置(2)に与えられ、各スト
ロークの特徴点、即ち始点、終点及び停留点が検出され
る。 【0029】そして、本装置構成例では、この停留点検
出装置(2)により検出された一文字分の各ストロークの
始終点及び停留点の座標列を一括して文字識別装置(6)
により、標準文字座標パターンと比較することにより、
手書き文字入力装置(1)に入力された手書き文字を識別
する構成となっている。図7は、本願の第3の実施例の
構成例を示すブロック図である。 【0030】この第3の装置構成例では、前述の第1,2の
装置構成例同様に手書き文字入力装置(1)の入力面上に
入力ペンの軌跡として手書き入力された文字の時系列座
標データが停留点検出装置(2)に与えられ、各ストロー
クの特徴点、即ち始点、終点及び停留点が検出される。
そして、この実施例では、手書き文字入力装置(1)から
出力される時系列座標データは上述の停留点検出装置
(2)の他に、従来の技術の項で説明した各ストロークの
上の等距離間隔の点を特徴点として検出する特徴点検出
装置(7)にも与えられている。 【0031】そして、停留点検出装置(2)にて検出され
た各ストロークの始終点及び停留点それぞれの座標値、
及び特徴点検出装置(7)にて検出された各ストロークの
座標値は特徴点補正装置(8)に与えられる。図8は、この
特徴点補正装置(8)による補正処理の説明である。い
ま、例えば、手書き文字入力装置(1)に図10の如きスト
ローク(例えば漢字「力」、片仮名「カ」等の一部)が手書き
入力された場合には、手書き文字入力装置(1)から出力
された時系列座標データは図8(a)に示す如き状態とな
る。 【0032】この手書き文字入力装置(1)から出力され
た時系列座標データを停留点検出装置(2)にて処理した
特徴点、即ち始終点及び停留点の検出結果は図8(b)(但
し●は停留点として検出された特徴点、即ち、始終点及
び屈曲点を表す、○は停留点を伴わない始終点である特
徴点をそれぞれ表す)に示す如く、始終点及び屈曲点が
それぞれ特徴点として検出されている。 【0033】一方、手書き文字入力装置(1)から出力さ
れた時系列座標データを特徴点補正装置(8)により等距
離間隔にて分割して特徴点検出を行った結果は図8(c)に
示す如く、ストロークの屈曲点は検出されていない代わ
りに、ストロークの曲率部分が表されている。特徴点補
正回路(8)には、上述の両方のデータが与えられるの
で、特徴点補正装置(8)は、図8(d)に示す如く、両デー
タを比較して特徴点検出装置(7)により検出された特徴
点の内、停留点検出装置(2)により検出された各停留点
それぞれに最も近い特徴点をそれぞれの停留点に置き代
える。このような特徴点補正装置(8)により、従来一般
的に行われている各ストローク上の等距離間隔の位置を
特徴点として検出する方法における屈曲点を的確に検出
し難いという欠点を補えることとなる。 【0034】なお、この第3の装置構成例における手書
き入力文字の最終的な認識は前述の第2の装置構成例と
同様の文字識別装置(6)により、特徴点補正装置(8)によ
る補正結果を標準文字パターンとして比較して特定の文
字として識別する構成となっている。 【0035】 【発明の効果】筆記開始時点(始点)及び筆記終了時点
(終点)における座標は、一般的に不安定である。 本願
では、始点または終点の近傍位置に前記停留点が存在す
る場合は、これらの点の中の前記停留点の1点を始点ま
たは終点と設定している。 従って、本願によれば、始点
または終点の近傍位置に前記停留点が存在する場合は、
不安定な始点(終点)の代わりに、安定な停留点を採用
しているので、各特徴点の精度が向上し、且つ、特徴点
の数が減少しするので、文字認識精度が向上するととも
に、演算処理の負担が軽減される。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for inputting handwritten characters. For example, the present invention relates to a method for recognizing a handwritten character input by a handwritten character input device used as a character input device such as a Japanese word processor. 2. Description of the Related Art As an input device of a word processor, instead of a keyboard requiring a certain degree of skill in its operation, for example, a character input by handwriting input on a tablet is recognized and the input of the character is recognized. Handwritten character input devices configured to accept are developed and put into practical use. [0003] This type of device represents the characteristics of strokes based on time-series coordinate data of each stroke of a handwritten character on the tablet as a locus of an input pen on a tablet for character input. Coordinate values are selectively detected to be feature points, each stroke is point-approximated by these feature point sequences, and the stroke is obtained from the coordinate values of the feature point sequences approximated to each stroke or the positional relationship of the feature point sequences. Characters input by handwriting with the input pen are recognized based on the characteristics of the stroke. The following two methods have been mainly employed as methods for detecting the characteristic points of each stroke described above. First, each point obtained by sequentially dividing the input time-series coordinate data at equal distance intervals (equal interval detection points)
And character recognition using the start point and end point of the stroke as feature points. [0005] Second, a point at which the time-series moving direction of the coordinate value changes is detected as a pole from the input time-series coordinate data, and character recognition is performed by using this as a characteristic point using the start point and end point of the stroke. Is what you do. However, in the above-described first method, although the process of detecting the feature point of the stroke is relatively simple, the possibility that the detected feature point and the bending point of the stroke match is small, and therefore, the stroke in the middle of the stroke. It is difficult to accurately detect a bending point, and therefore, it is not possible to accurately detect the shape of a stroke having a bending point. In the second method, it is necessary to calculate the time-series moving direction of the coordinate value from the time-series coordinate data of the read stroke each time. For this reason, the amount of data processing required for the input processing becomes excessive, and it takes time for the input processing, and a data processing device having an unnecessarily large capacity is required. In addition, this method is susceptible to minute changes in the moving direction of the coordinate values and the like, and there is a possibility that many unnecessary feature points will be detected. SUMMARY OF THE INVENTION The present invention is directed to character recognition.
The purpose is to enhance the performance. By the way, when inputting handwritten characters, the input pen stops at the bending point of the stroke. In other words, when the trajectory of the input pen moving on the input surface of the handwritten character input device is detected as time-series coordinate data, the same coordinate value is detected continuously for a certain time or more. By paying attention to this, the stationary point of the input pen is used as a feature point, so that the inflection point of each stroke can be accurately detected with a relatively small amount of computation, and the handwritten character input character can be recognized with high accuracy. Handwritten character recognition methods are conceivable. The present application is thus a stop point
The purpose is to detect By the way, simply,
The more points, the better the recognition accuracy. However, the feature point
If the number is large, the amount of calculation for recognition increases. In addition,
Character recognition accuracy is low when necessary points are adopted as feature points.
I will drop it. This application adopts stop points as feature points
At the same time, in order to improve the character recognition accuracy,
The purpose is to detect a mark. According to the present invention, a starting point of each stroke constituting a locus of an input pen read as time-series coordinate data representing a position on a character input surface of a character input device is provided. An end point and a stop point of the input pen which are detected as coordinate positions where the time-series coordinate data repeats the same value continuously for a predetermined number of times or more are detected, and the start point, the end point, and the stop point are defined as feature points, and Based on the coordinate values of a feature point sequence composed of feature points or the features of each stroke obtained from the positional relationship between each feature point, a handwritten character recognition that recognizes a handwritten input character as a trajectory of an input pen In the feature point detection method, when the stop point exists at a position near the start point or the end point, the stop point among these points
Set the point of the point and start or end point, characterized in that it does not employ other points as feature points. According to the invention of the present application, when there are stationary points near the starting point or the ending point, these points are replaced by one.
One feature point is collected at the stop points. First, the meaning of detecting a stationary point in handwritten character recognition will be described. FIG. 1 shows, as an example, measured values of time-series coordinate data when a Chinese character “handling” is input by a tablet for inputting handwritten characters. The measurement data has a time resolution of 100 points / second and a spatial resolution of 10 points / mm. In the figure, each numeral indicates the number of times that the coordinate value of each position is continuously detected, and the part marked with a circle indicates the part where the number is four or more, and the part marked with a circle The number with an underline adjacent to the symbol indicates the number of times the same coordinate value is duplicated at the position marked with a circle. The following facts can be clearly read from the actual measurement data shown in FIG. That is, at the inflection point in the middle of the same stroke, the overlap of the same coordinate value shows a considerably high numerical value, and at least 4 or more overlaps occur at the start point and the end point of each stroke. . Therefore, if the position of the coordinate value having the number of overlaps of 4 or more is set as the feature point, not only the bending point of the stroke but also the start point and the end point can be accurately detected. Hereinafter, the present invention will be described with reference to the drawings showing embodiments thereof. FIG. 2 is a block diagram of a handwritten character recognition device used to carry out the present invention according to the above-described principle. In FIG. 2, reference numeral (1) denotes a handwritten character input device, and a trajectory of an input pen moving on the character input surface is detected as time-series data in an XY coordinate system set on the input surface. Then, the time-series coordinate data is given to the stop point detecting device (2). The stop point detecting device (2) processes the time-series coordinate data provided from the handwritten character input device (1) to detect the start point and the end point of each stroke and the stop points existing between them, and The coordinate values are output to the stroke feature value calculation device (3). The data processing operation of the stop point detection device (2) will be described later. Stroke feature amount calculation device
(3) uses the coordinate values of the start point, end point, and stop point of each stroke given from the stop point detection device (2) as feature points of each stroke, and calculates the feature of the stroke from the coordinate values of these feature point sequences. Calculate the amount. The features to be detected for each stroke include the angle and length (relative) of the line connecting the feature points, and the connection of the line connecting the feature points.
(Clockwise or counterclockwise, etc.). The features of each of the detected strokes are provided to a stroke identification device (4). The stroke identification device (4) is a stroke feature amount calculation device described above.
Based on the characteristics of each stroke given from (3), that stroke is a specific standard stroke, for example, (a) (b) of FIG.
The characteristic point as shown in (c) is a stroke having only the start and end points, or a bending point as shown in (d), (e), (f) and (g) of FIG. 9 (the stop point between the start and end points in the method of the present invention). Is detected as a standard pattern of a stroke. The standard pattern of strokes is obtained by decomposing each character such as a kanji character, a kana, a number, an alphabet, etc. into each stroke in accordance with the stroke order when handwriting and writing, and decomposing each standard stroke as described above. Are stored in advance in a stroke dictionary (41) attached to the stroke identification device (4). And
The stroke identification device (4) is a stroke feature value calculation device
The feature of the stroke given from (3) is specified as one of the standard strokes by comparing with the feature of the standard stroke stored in the stroke dictionary (41),
For example, the code number of the standard stroke is output to the character identification device (5). The character identification device (5) is a handwritten character recognition device (1) based on a combination of code numbers of standard strokes for one character given from the stroke identification device (4).
Is a device for recognizing a character input by handwriting as a specific character. The character identification device (5) is provided with a character dictionary (51) storing data representing each character such as a kanji, a kana, a number, an alphabet, etc. as a combination of the above-described standard strokes. Each time a stroke result for one character is given from the stroke identification device (4), the character recognition device (5) sends the result to the character dictionary (51).
The character input by handwriting from the handwritten character input device (1) is recognized as a specific character by comparing with the data of the combination of strokes of each character stored in. The present embodiment is implemented by the apparatus configured as described above. The operation of detecting a stop point by the stop point detecting device (2) will be specifically described with reference to the flowchart of FIG. The stop point detection circuit (2) compares each data value of the time-series coordinate data of the handwritten character sequentially input from the handwritten character input device (1) with the previously input data value, and when the data values are the same, Returns to the step of reading the data by adding 1 to the number of duplications N, and reads the next data. If they are not the same value, it judges whether or not the number of duplications N is 4 or more. And the number of duplication N is 4 or more (N
In the case of ≧ 4), the coordinate value is temporarily stored in the attached memory as a stop point, and the number of duplications N is reset to 0 (N = 0). Then, the process returns to the step of reading the next data. If the number N of duplications is not 4 or more (N <4), the number N of duplications is set to 0 (N =
Reset to 0) and return to the step of reading the next data. The stop point is basically detected by the processing described above. However, in the case of handwritten character input, one stop point where the movement of the input pen stops at the inflection point in the middle of the stroke. Location is rather rare, and usually a plurality of stopping points appear in a very narrow range. Therefore, in such a case, the stop point detection device (2)
According to the following principle, one stop point is selected from a plurality of stop points once stored in the memory and set as a feature point. For example, assuming a stroke having an inflection point in the middle as shown in FIG.
(b) shows a case where four stationary points are detected near the bending point in the middle of the stroke. That is, four stop points A, B, C, and D are detected within a predetermined distance at the bending points of this stroke, and the respective numbers of overlaps AN, BN, CN, and DN are represented by A
N = 4, BN = 5, CN = 10, DN = 6. In such a case, the stop point detection device (2) determines the stop point C (CN = 10) where the number of overlaps N is the largest,
The inflection point is selected as a representative feature point, and its coordinate value is output to the stroke feature amount calculation device (3). FIG. 4 (c) shows the number of overlaps CN and D of the point C and the point D when five stop points A to E are detected in the same manner as described above.
The case where N is 8 and the same number (CN = 8, DN = 8) is shown. In such a case, the stop point detection device (2) selects, for example, (A) the stop point that appears first in time. (B)
Select the stop point that appears last in time. (C) One point is selected as a feature point by any method such as newly setting a middle point between the two as a stationary point, and the coordinate value is output to the stroke feature amount calculating device (3). FIG. 4D shows a case where the point C having the same coordinate value is detected twice as a stationary point. That is, at the bending point of the stroke, the time-series coordinate data is point A (duplication count AN =
From 4), move to point B (duplicate number BN = 5), point C (duplicate number CN1 = 8), then move to point C 'once, return to point C again (duplicate number CN2 = 3), Further, point D (duplication count DN = 8), point E (duplication count EN =
In the case of moving in the order of 5), the stop point detection device (2) performs the first overlap number CN1 and the second overlap number CN at the stop point C.
The number of duplications CN0 (= 11) obtained by adding 2 to the number of duplications C at that point C
N is assumed. Then, as in the case of FIG. 4 (c) described above, the stop point detection device (2) sets the point where the number of overlaps N is the maximum as a characteristic point representing this inflection point and uses the coordinate value as the stroke characteristic. Output to the quantity calculation device (3). Therefore, in the example of FIG. 4 (d), the first number of times C1 of the point C and the number of times DN of the point D are both 8 and the maximum, but the sum of the first and second times of the point C is Since the number of overlaps CN0 is 11, this point C is selected as a stationary point of this inflection point, that is, a feature point representing this inflection point, and its coordinate value is output to the stroke feature amount calculating device (3). . Next, detection of the start and end points by the stop point detection device (2) will be described. At the time of inputting handwritten characters, generally, at the start point and end point of each stroke, the movement of the input pen is temporarily stopped or the movement speed is slightly reduced.
A stop point naturally occurs at the start point and the end point. For this reason, for example, as shown in FIGS.5 (a) and 5 (b) (○ represents time-series coordinate data, and ● represents a stop point, respectively), a start point SP and an end point EP are detected near the start point and end point of the stroke. Of course, the stop points A, within a predetermined distance from the start point SP and the end point EP,
B, C and D, E, F, etc. may also be detected. In such a case, the stop point detecting device (2) does not adopt the start point SP and the end point EP as the feature points, and selects one point from each of the stop points A, B, C and D, E, F by the above-described processing. And outputs the coordinate values to the stroke feature amount calculating device (3) as feature points representing the start point and the end point, respectively. On the other hand, as shown in FIG.
If there is no stop point within a predetermined distance near the EP (only the end point EP is shown in FIG. 5 (c)), the stop point detection device (2)
P is detected as it is as a feature point representing the end point, and its coordinate value is output to the stroke feature amount calculating device (3). Furthermore,
As shown in FIG. 5 (d), when the end of the stroke ends with "splash", a stop point is detected because the start of "splash" is a bending point in the middle of the stroke. A stop point does not appear at the end of “Ne” and a stop point does not appear at the end of “Splash”. Therefore, there is no stop point within a predetermined distance of the end point of the "splash", that is, the end point EP of the stroke, and the end point of the "splash" is detected as a feature point representing the end point EP of the stroke. The “ne” itself is also detected as a part of the stroke having the length between the inflection point and the end point EP, so that it is possible to recognize the stroke more accurately. FIG. 6 is a block diagram showing a configuration example of the second embodiment of the present invention. In the second device configuration example, similarly to the first device configuration example, the time-series coordinate data of the character handwritten and input as the trajectory of the input pen on the input surface of the handwritten character input device (1) is detected at the stationary point. Applied to the device (2), characteristic points of each stroke, that is, a start point, an end point, and a stop point are detected. In this embodiment, the coordinate sequence of the start and end points and the stop point of each stroke for one character detected by the stop point detecting device (2) is collectively referred to as a character identification device (6).
By comparing with the standard character coordinate pattern,
The configuration is such that handwritten characters input to the handwritten character input device (1) are identified. FIG. 7 is a block diagram illustrating a configuration example of the third embodiment of the present application. In the third example of the device configuration, the time-series coordinates of the characters input by handwriting as the trajectory of the input pen on the input surface of the handwritten character input device (1) are the same as in the first and second examples of the device configuration. The data is supplied to the stop point detection device (2), and the characteristic points of each stroke, that is, the start point, the end point, and the stop point are detected.
In this embodiment, the time series coordinate data output from the handwritten character input device (1) is
In addition to (2), the present invention is also provided to a feature point detection device (7) for detecting points at equal distance intervals on each stroke as feature points described in the section of the related art. The start and end points of each stroke and the coordinate values of the stop point detected by the stop point detection device (2),
The coordinate value of each stroke detected by the feature point detection device (7) is provided to the feature point correction device (8). FIG. 8 is an explanation of the correction processing by the feature point correction device (8). Now, for example, when a stroke as shown in FIG. 10 (for example, a part of kanji `` power '', katakana `` ka '', etc.) is handwritten to the handwritten character input device (1), the handwritten character input device (1) The output time-series coordinate data is in a state as shown in FIG. The feature points obtained by processing the time-series coordinate data output from the handwritten character input device (1) by the stop point detection device (2), that is, the start and end points and the stop points are shown in FIG. However, ● indicates a feature point detected as a stop point, that is, a start and end point and a bending point, and ○ indicates a feature point which is a start and end point without a stop point, respectively.) It has been detected as a feature point. On the other hand, FIG. 8 (c) shows the result of dividing the time-series coordinate data output from the handwritten character input device (1) at equal distance intervals by the feature point correction device (8) and detecting feature points. As shown in FIG. 7, the curvature point of the stroke is shown instead of detecting the bending point of the stroke. Since both of the above data are given to the feature point correction circuit (8), the feature point correction device (8) compares the two data as shown in FIG. ), The feature points closest to each of the stop points detected by the stop point detection device (2) are replaced with the respective stop points. With such a feature point correction device (8), it is possible to compensate for the disadvantage that it is difficult to accurately detect a bending point in the method of detecting equidistant intervals on each stroke as a feature point conventionally performed in general. Becomes Note that the final recognition of the handwritten input characters in the third apparatus configuration example is performed by the same character identification apparatus (6) as in the above-described second apparatus configuration example, and by the feature point correction apparatus (8). The result is compared as a standard character pattern and identified as a specific character. The writing start time (starting point) and the writing end time
The coordinates at (end point) are generally unstable. Application
In, the stop point exists near the start point or end point.
If one of these stops, one of the above-mentioned stop points will be the starting point.
Or the end point. Therefore, according to the present application, the starting point
Or if the stop point is located near the end point,
Uses a stable stop instead of an unstable start (end)
The accuracy of each feature point is improved, and
Reduces the number of characters, which improves character recognition accuracy and
In addition, the load on the arithmetic processing is reduced.

【図面の簡単な説明】 【図1】停留点検出の原理を説明する為の模式図であ
る。 【図2】本発明の第1の実施例の装置のブロック図であ
る。 【図3】停留点検出装置のデータ処理内容を示すフロー
チャートである。 【図4】停留点検出装置のデータ処理内容の説明図であ
る。 【図5】停留点検出装置のデータ処理内容の説明図であ
る。 【図6】本発明の第2の実施例の装置のブロック図であ
る。 【図7】本発明の第3の実施例の装置のブロック図であ
る。 【図8】第3の実施例の動作説明のための模式図であ
る。 【図9】標準ストロークの例を示す図である。 【図10】入力されたストロークの一例を示す図であ
る。 【符号の説明】 (1) 手書き文字入力装置、 (2) 停留点検出装置、 (3) ストローク特徴量算出装置、 (4) ストローク識別装置、 (5) 文字識別装置。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a schematic diagram for explaining the principle of detecting a stationary point. FIG. 2 is a block diagram of an apparatus according to a first embodiment of the present invention. FIG. 3 is a flowchart showing data processing contents of the stop point detection device. FIG. 4 is an explanatory diagram of data processing contents of the stop point detection device. FIG. 5 is an explanatory diagram of data processing contents of the stop point detection device. FIG. 6 is a block diagram of an apparatus according to a second embodiment of the present invention. FIG. 7 is a block diagram of an apparatus according to a third embodiment of the present invention. FIG. 8 is a schematic diagram for explaining the operation of the third embodiment. FIG. 9 is a diagram illustrating an example of a standard stroke. FIG. 10 is a diagram illustrating an example of an input stroke. [Description of Signs] (1) Handwritten character input device, (2) Stop point detection device, (3) Stroke feature amount calculation device, (4) Stroke identification device, (5) Character identification device.

Claims (1)

(57)【特許請求の範囲】 1.文字入力装置の文字入力面上における位置を表す時
系列座標データとして読取られた入力ペンの軌跡を構成
する各ストロークの始点、終点及び前記時系列座標デー
タが同一値を所定回数以上連続して反復する座標位置と
して検出される入力ペンの停留点とを検出し、 この始点、終点及び停留点を特徴点とし、 これらの特徴点にて構成される特徴点列の座標値または
各特徴点相互の位置関係から求められた各ストロークの
特徴を基に、入力ペンの軌跡として手書き入力された文
字を認識する手書き文字認識の特徴点検出方法におい
て、 前記始点または終点の近傍位置に前記停留点が存在する
場合は、これらの点の中の前記停留点の1点を始点また
は終点と設定し、他の点を特徴点として採用しないこと
を特徴とする手書き文字認識の特徴点検出方法
(57) [Claims] The start point and end point of each stroke constituting the trajectory of the input pen read as the time-series coordinate data representing the position on the character input surface of the character input device and the time-series coordinate data repeat the same value continuously for a predetermined number of times or more. The start point, the end point, and the stop point are detected as the feature points, and the coordinate values of the feature point sequence constituted by these feature points or the mutual Based on the characteristics of each stroke determined from the positional relationship, in a feature point detection method of handwritten character recognition for recognizing a character handwritten and input as a trajectory of an input pen, If the stationary point is present, one point of the stationary point in these points set as a start point or an end point, wherein the handwriting recognition, characterized in that does not employ other points as feature points Detection method.
JP5190536A 1993-07-30 1993-07-30 Feature point detection method for handwritten character recognition Expired - Lifetime JP2664624B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5190536A JP2664624B2 (en) 1993-07-30 1993-07-30 Feature point detection method for handwritten character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5190536A JP2664624B2 (en) 1993-07-30 1993-07-30 Feature point detection method for handwritten character recognition

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8139190A Division JP2698338B2 (en) 1996-05-31 1996-05-31 Feature point detection method for handwritten character recognition

Publications (2)

Publication Number Publication Date
JPH06223229A JPH06223229A (en) 1994-08-12
JP2664624B2 true JP2664624B2 (en) 1997-10-15

Family

ID=16259725

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5190536A Expired - Lifetime JP2664624B2 (en) 1993-07-30 1993-07-30 Feature point detection method for handwritten character recognition

Country Status (1)

Country Link
JP (1) JP2664624B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6049482A (en) * 1983-08-29 1985-03-18 Matsushita Electric Ind Co Ltd Approximate describer for on-line handwritten linear pattern

Also Published As

Publication number Publication date
JPH06223229A (en) 1994-08-12

Similar Documents

Publication Publication Date Title
EP0632403B1 (en) Handwritten symbol recognizer and method for recognising handwritten symbols
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP2698338B2 (en) Feature point detection method for handwritten character recognition
JP2664624B2 (en) Feature point detection method for handwritten character recognition
JPH0719278B2 (en) Handwriting recognition method
JP3046472B2 (en) Handwritten figure recognition device
JPH05225396A (en) Hand-written character recognizing device
JPS6395591A (en) Method for recognizing hand-written character
JPH045231B2 (en)
JP2671984B2 (en) Information recognition device
KR900005141B1 (en) Handwritter character recognizing device
JP3817281B2 (en) Information processing apparatus and method
JPH0436435B2 (en)
JPS6215681A (en) Recognizing system for on-line handwritten character
JPH0670801B2 (en) Handwritten character segmentation apparatus and method
KR940001048B1 (en) On-line hand written character recognition method
JPS62120589A (en) Hand-written character recognizing device
JPH10334187A (en) Device and method for character recognition
JP2962911B2 (en) Character recognition device
JP2665488B2 (en) Personal dictionary registration method
JPH04336690A (en) Handwritten character recognizing device
KR19990056014A (en) Hangul Cursive Character Recognition System
JPS6344287A (en) Character reader
JPS5985577A (en) Preprocessing method of recognition of on-line character

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term