JP2001357356A - 手書き認識装置及び手書き認識方法 - Google Patents

手書き認識装置及び手書き認識方法

Info

Publication number
JP2001357356A
JP2001357356A JP2001114744A JP2001114744A JP2001357356A JP 2001357356 A JP2001357356 A JP 2001357356A JP 2001114744 A JP2001114744 A JP 2001114744A JP 2001114744 A JP2001114744 A JP 2001114744A JP 2001357356 A JP2001357356 A JP 2001357356A
Authority
JP
Japan
Prior art keywords
pattern
sub
stroke
feature
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001114744A
Other languages
English (en)
Inventor
Yasushi Ishizuka
康司 石塚
Hideaki Tanaka
秀明 田中
Minako Kuwata
みな子 桑田
Yoshihiro Kitamura
義弘 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2001114744A priority Critical patent/JP2001357356A/ja
Publication of JP2001357356A publication Critical patent/JP2001357356A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 安定して高い認識率で「続け字」や「崩し
字」を含む手書き文字を高速に認識する。 【解決手段】 辞書格納部10には一筆書きされ易いサ
ブパターン単位での標準パターンを格納する。ストロー
ク処理部5は、正規化前に屈曲部の特徴を表す特徴点を
予め抽出する。特徴再抽出部8は、ストローク連鎖毎に
正規化,補間,ノイズ除去を行い、オフストローク区間を
特徴点で補間する。文字認識部9は、サブパターン単位
での標準パターンを用いたDPマッチングを行う。この
ように、正規化前に屈曲部の特徴点抽出して正規化によ
る屈曲部の特徴の喪失を防止する。また、等分割法と角
度法とを併用して抽出した特徴点とサブパターン毎の標
準パターンとによってDPマッチングの精度向上と時間
短縮を図る。また、オフストローク間を補間して一筆化
し、「続け字」や「崩し字」にも対処可能にする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ワードプロセッ
サやパーソナルコンピュータ等に用いられて、タブレッ
トからペン入力された手書き文字等を認識する手書き認
識装置に関する。
【0002】
【従来の技術】現在、電子手帳、ワードプロセッサある
いはパーソナルコンピュータ等に対して文字を入力する
際にキーボードを用いる方法が主流である。ところが、
このキーボードを用いた文字入力には、一定の技量が必
要であり、文字入力の対象となる機器が電子手帳のよう
に小型化が進んでいるためにキーボードを設ける領域を
確保できない等の問題が生じてきている。そこで、タブ
レット等を用いたオンライン手書き文字入力が注目され
始めている。
【0003】オンライン手書き文字入力された文字を認
識する際には、通常、タブレット上に書き込まれた手書
き文字はタブレット上における座標(x,y)で表現され
る。そして、手書き文字のストロークを認識の基本単位
として、ストローク毎に特徴抽出を行っている。そし
て、文字はストロークの集合であるとして、カテゴリ番
号に対応付けたストロークの特徴列を標準パターンとし
てストローク辞書に登録しておき、認識対象手書き文字
から抽出された特徴列と上記標準パターンとを照合し
て、認識対象手書き文字を構成するストロークのカテゴ
リを認識する。そして、文字辞書を用いてストロークの
組み合わせを認識することによって入力文字を認識する
のである。尚、上記辞書に標準パターンを登録する際
に、文字パターンを1個以上の「きへん」,「ごんべ
ん」あるいは「ふるとり」等の部首に相当するサブパタ
ーンに分割して登録する方法もある。
【0004】上記ストローク毎の特徴抽出法としては、
以下のような特徴抽出法がある。 (1) ストロークの始点から終点までを所定数に分割し
て、各分割点の特徴を抽出する。 (2) ストロークの始点から終点までを等間隔に分割し
て、各分割点の特徴を抽出する。 (3) ストロークを追跡して所定角度以上の曲がり点を
特徴点として検出し、各特徴点の特徴を抽出する。
【0005】上述の分類は、従来の手書き認識を特徴抽
出法から見た分類である。一方、手書き認識法全体から
見ると、「楷書」から「若干の続け字」までを認識対象
とした手書き認識装置が提案されており、今後は「続け
字」から「崩し字」への発展が予想されている。しかし
ながら、このような研究はかなり前から行われているに
も拘わらず、実用レベルに達するものは未だ出現してい
ない。また、オンライン手書き認識の際には、上述のス
トロークの変形の問題の他に、「筆順変動」という解決
すべき大きな問題が存在する。
【0006】現在まで提案されている「続け字」,「崩
し字」に対処する研究として、次のようなものがある。 [i] 変形ベクトル場に基づく文字変形予測を用いたオ
ンライン手書き文字認識(電子通信学会論文誌 '86/
12 Vol.J69−D No.12) 入力パターンと辞書の標準パターンとのストローク対応
を求めた後、DPマッチングでストローク対毎に対応特
徴点を決める。そして、この対応特徴点間の変形ベクト
ル場から求めた予測変形ベクトルを属性毎に重畳して標
準パターンを変形し、この変形した標準パターンと入力
パターンとの間でDPマッチングを行って距離を求める
のである。
【0007】[ii] ファジィ推論によるくずし字の実時
間認識(電子通信学会PRU 89−29(1989)) ストローク毎のx,y座標列にフーリエ変換を行ない、
各係数(文献ではx,y共に3つ)のメバーシップ関数に
基づいてファジィ化データを求める。そして、このファ
ジィ化データと同様にファジィ化データで表された辞書
データとをストローク毎に対応付けしながら認識するの
である。尚、上記辞書データとしては、各文字毎に可能
性がある全ての続け字パターンを用意する。
【0008】[iii] Attributed String Matching by S
plit-and-Merge for On-Line ChineseCharacter Recogn
ition(IEEE TRANSACTIONS ON PATTERN ANALYSIS AND M
ACTINEINTELLIGENSE VOL 15,NO.2 FEBRUARY 1993) 例えば、同一人物のみが使用するような筆順固定の条件
の下で、入力のオフストローク部分と辞書のオフストロ
ーク部分とを対応付けて(結局ストロークを対応付け
て)、対応するストローク毎に詳細なDPマッチングを
行なって距離を求める。
【0009】以上のように、従来の「続け字」,「崩し
字」のオンライン認識法は、以下の3つの基本的なアプ
ローチに大別できる。 (4) 筆順フリー方式であって、筆順をストローク対応
付けによって吸収し、詳細な特徴や手法を用いて認識す
る。 (5) 筆順固定方式であって、例えば同一ユーザ等のよ
うに筆順を無視できる条件下や、ある程度のバリエーシ
ョン数に限定して認識する。
【0010】また、取り込まれた文字データを画像デー
タとして取り扱い、OCR(光学的文字認識装置)におけ
る文字認識手法を用いて手書き文字をパターン認識する
方法も提案されている。例えば、入力文字画像を12×
12の升目に分割して各升目内における表示画素数を求
め、表示画素の分布を特徴パターンとし、辞書に登録さ
れた標準パターンと照合することによって入力文字を認
識するのである。
【0011】
【発明が解決しようとする課題】しかしながら、上記従
来の手書き文字認識装置には以下のような問題がある。 (A) 上記ストローク毎の特徴抽出方法(1)において
は、ストローク全体を所定数に分割するために、対象ス
トロークの長さが非常に長い場合には特徴点の間隔が長
くなり過ぎ、特徴点の連なりから元のストロークの形状
が再現できない場合が生ずる。その場合には、ストロー
ク辞書との照合の際に一致度が低下して高い認識率が得
られないという問題がある。 (B) 上記ストローク毎の特徴抽出方法(2)において
は、ストローク全体を等間隔に分割するために、対象ス
トロークの長さが非常に長い場合には特徴点の数が非常
に多くなる。分割間隔を適当な範囲で短く設定すること
によって、複雑な漢字等を1画で手書き入力されても特
徴点の連なりから元のストロークの形状を忠実に再現で
きる。ところが、その反面、特徴点が多いためにストロ
ーク辞書との照合に時間が掛かるという問題が生ずるこ
とになる。 (C) 上記ストローク毎の特徴抽出法(3)においては、
所定角度以上の曲がり点を特徴点として検出するため
に、検出される特徴点数は角度の閾値に依存することに
なる。その結果、角度の閾値を大きくすると、特徴点数
は少なくなって照合時間が早くなるが認識率が低下す
る。一方、角度の閾値を小さくすると、認識率を高める
ことができるが特徴点が多くなって照合時間が長くなる
という問題がある。また、上記角度の閾値を適度に設定
したとしても、仮名文字のように曲線が多いストローク
の場合には曲率の個人差によって特徴点の位置が安定し
ない。したがって、特徴点の座標を特徴量として用いる
場合には高い認識率を得ることが難しい。 (D) 上記各特徴抽出法(1)および(2)においては、正
規化された複数ストロークから成る入力座標列から特徴
抽出を行うと、抽出された特徴量は入力文字の特徴を表
さなくなる場合がある。そこで、特徴を的確に表す特徴
点を確実に抽出するには特徴点を多数抽出する必要があ
り、辞書照合に時間が掛かることになる。一方、特徴点
の抽出数を少なくすると特徴を的確に表わせる確率が低
くなり、認識率が低下するという問題がある。例えば、
図28(a)において、正規化された入力座標列(実線で表
示)上から特徴を抽出する場合を考える。その場合に
は、入力座標列から抽出される特徴点(“点"で表示)
は、入力座標列には屈曲部(α)が在るにも拘わらず、図
28(b)に示すごとく、あたかも直線上(1列上)に配列
されているような特徴点が抽出される。その場合には、
手書き文字の部首“ぎょうにんべん"の認識結果が“に
んべん"となってしまうのである。 (E) 上記各特徴抽出法(1)〜(3)の何れにおいても、
ストローク単位で認識するので、筆者が意図しないスト
ロークである「入り」や「跳ね」と文字の構成に欠くこ
とのできないストロークとを区別ができず、認識率が低
下するという問題がある。さらに、上記ストロークが持
つ屈曲部の特徴が正規化によって消滅する場合があり、
その場合には正規化後のストロークから屈曲部を表す特
徴を正確に抽出することは不可能となる。
【0012】また、上記従来の「続け字」,「崩し字」
のオンライン認識法には以下のような問題がある。 (F) 上記オンライン認識法(4)の筆順フリー方式で
は、 a.ストローク対応付け自体の処理に時間が掛かり過
ぎ、全体として処理速度が遅い。 b.過度の変形や省略があった場合にはストローク対応
付けの性能が低下してしまい、認識率が低下する。とい
う問題が生ずる。ここで、最終目的が「文字の認識」で
あるにも拘わらず文字認識以前のストローク対応付けの
処理量が大となってしまう問題は、例えば、電子手帳の
ようなプアーなハード構成における「続け字」,「崩し
字」のオンライン認識を実現不可能にしまうのである。
また、過度の変形や省略におけるストローク対応付けの
性能が低下する問題は、「続け字」のオンライン認識か
ら「崩し字」のオンライン認識への発展を望めなくして
しまう。 (G) 上記オンライン認識法(5)の筆順固定方式では、
「続け字」,「崩し字」の認識性能は比較的よいのであ
るが筆順変動には極端に弱いという問題がある。この問
題に対する最も簡単で唯一の解決方法は、筆順変動のバ
リエーションを全て辞書に持つことであるが、辞書容量
がバリエーションの数だけ単調増加するので一般的なシ
ステム構築は事実上不可能となってしまう。 (H) OCRを用いた文字認識方法を用いる場合には、
文字全体のパターンを認識対象としているために、「続
け字」や「崩し字」を正確に認識する際には多くの変形
パターンを標準パターンとして辞書に登録しておく必要
があり、照合に長時間を有する。そこで、ストローク単
位で認識しようとすると、ストロークの切れ目が明確で
はなく、認識率の低下を来すという問題がある。 (I) また、上記オンライン認識法(4),(5)およびO
CRを用いた文字認識方法に共通して、文字単位の認識
処理であるためにユーザーの入力が完了しないと認識処
理が開始できないという問題がある。通常、人間の筆記
時間は2秒程度掛かる。そこで、この筆記時間を利用し
て前認識処理を行うことは、電子手帳のようなプアーな
装置では特に効果的である。ところが、従来の認識法で
はこの筆記時間を利用した前認識処理の実現が困難なの
である。
【0013】そこで、この発明の目的は、安定して高い
認識率で「続け字」や「崩し字」を含む手書き文字等を
高速に認識できる手書き認識装置を提供することにあ
る。
【0014】
【課題を解決するための手段】本発明は、手書き入力さ
れた筆跡の座標を時系列に配列して成る座標データ列を
生成する座標データ生成部と、上記座標データ列から筆
跡パターンの特徴点列を抽出する特徴抽出部と、特徴点
列から成る複数のサブパターンが登録されたサブパター
ン辞書及び該サブパターンと文字とを対応付けた文字辞
書が格納された辞書格納部と、上記筆跡パターンの特徴
点列と上記複数のサブパターンの特徴点列とを照合して
サブパターンを認識し、該認識されたサブパターンと文
字辞書とを照合して上記筆跡パターンの文字を認識する
認識部と、を備える手書き認識装置であって、上記サブ
パターン辞書に登録されたサブパターンは、一筆書きさ
れ得るパターンのストロークの特徴点及び該ストローク
間を補完するオフストロークの特徴点から成る特徴点列
のパターンであり、上記特徴抽出部で抽出された特徴点
列は、抽出された筆跡パターンのストロークの特徴点及
び該ストローク間を補完するオフストロークの特徴点か
ら成る特徴点列であることを特徴とする手書き認識装置
を提供する。
【0015】また、本発明は、1文字の入力が終了した
か否かを判定する文字終了判定部を備え、上記特徴抽出
部は、上記文字終了判定部が1文字の入力が終了したと
判定した場合に、上記特徴点列から1文字分の特徴点列
を抽出することを特徴とする手書き認識装置を提供す
る。
【0016】また、本発明は、手書き入力された筆跡の
座標を時系列に配列して成る座標データ列を生成するス
テップと、上記座標データ列から筆跡パターンの特徴点
列を抽出するステップと、上記筆跡パターンの特徴点列
と予め登録されている複数のサブパターンの特徴点列と
を照合して、サブパターンを認識するステップと、上記
認識されたサブパターンと予め登録されている複数の文
字とを照合して、上記筆跡パターンの文字を認識するス
テップと、を備える手書き認識方法であって、上記サブ
パターンは、一筆書きされ得るパターンのストロークの
特徴点及び該ストローク間を補完するオフストロークの
特徴点から成る特徴点列のパターンであり、上記筆跡パ
ターンの特徴点列は、抽出された筆跡パターンのストロ
ークの特徴点及び該ストローク間を補完するオフストロ
ークの特徴点から成る特徴点列であることを特徴とする
手書き認識方法を提供する。
【0017】
【発明の実施の形態】本発明では、タブレットに手書き
入力されると座標データ列が生成される。そして、この
生成された座標データ列が複数ストロークの座標データ
列である場合には、特徴抽出部のオフスロトーク補間手
段によって、オフスロトークが特徴点によって補間され
る。こうして、上記特徴抽出部によって、複数ストロー
クの座標データ列から、各ストロークとオフストローク
との特徴点と特徴量が抽出される。そうすると、認識部
によって、上記複数ストロークとオフスロトークとに係
る各特徴量を有する特徴点の列が1つの特徴パターンと
見なされてサブパターン辞書との照合が行われ、上記筆
跡パターンが認識される。こうして、特徴抽出の際にオ
フスロトークが補間される結果、「入り」や「跳ね」や
「続け」等を有する変形パターンの標準パターンを上記
サブパターン辞書に登録しておくことによって、容易
に、「続け字」や「崩し字」の筆跡パターンが認識され
る。
【0018】また、本発明では、上記タブレットからの
座標データ列が特徴抽出部に入力されると、先ず、第1
特徴抽出部によって、上記座標データ列から筆跡パター
ンにおける屈曲部の特徴点と特徴量が抽出される。次
に、第2特徴抽出部によって、上記屈曲部の特徴点列が
正規化され、この正規化後の特徴点間を等間隔近似する
特徴点と特徴量が抽出される。こうして、正規化前に屈
曲部の特徴点と特徴量が抽出されることによって、屈曲
部の特徴が正規化によって消滅したとしても確実に屈曲
部を表す特徴点と特徴量が抽出される。
【0019】また、本発明では、上記認識部の距離算出
手段によって、上記特徴パターン上の特徴点と標準パタ
ーン上の特徴点とから成る特徴点対の特徴量に基づい
て、テーブルを引いて上記特徴点対に係る特徴量の差が
求められる。そして、この各差の値に基づいて上記特徴
パターンと標準パターンとの距離が算出される。こうし
て、上記認識部による上記特徴パターンと標準パターン
との照合が、テーブルを引くという簡単な操作によって
迅速に行われる。
【0020】また、本発明では、上記認識部のDPマッ
チング手段によって、照合の対象となるパターン上にお
ける特徴点間毎に変動重みを付けたDPマッチング処理
が行われる。こうして、DPマッチング時における時間
伸長特性が上記筆跡パターンのストロークに沿った特徴
の現れ方に応じて変更される。
【0021】また、本発明では、変動重み算出部によっ
て上記特徴抽出部およびDPマッチング手段が制御され
て、予め用意された学習パターンから学習用特徴パター
ンが生成され、この学習用特徴パターンと標準パターン
とのDPマッチング処理によってマッチングパス上の点
に係るマッチング距離が求められ、上記標準パターンに
おける特徴点間毎に全学習用特徴パターンに係るマッチ
ング距離のばらつきの度合いが上記変動重みとして算出
される。こうして、安定して特徴点が得られる区間が強
調されたDPマッチングが行われる。
【0022】また、本発明では、変動重み算出部によっ
て、上記特徴抽出部によって抽出された特徴パターン上
の特徴点から次の特徴点までの距離と当該特徴パターン
における全特徴点を入力順に結ぶ距離との比の値が、当
該特徴点に係る区間の上記変動重みとして算出される。
こうして、上記筆跡パターンにおける屈曲部の特徴が強
調されたDPマッチングが行われる。
【0023】また、本発明では、認識部のサブパターン
認識手段によって、上記特徴パターンと上記サブパター
ン辞書とが照合されて上記筆跡パターンがサブパターン
毎に認識される。そして、筆跡パターン認識手段によっ
て、上記サブパターン認識手段による認識の結果得られ
たサブパターン候補の組み合わせと上記代表パターン構
成テーブルとが照合されて、上記筆跡パターンが認識さ
れる。こうして、統計上一筆書きされ易いサブパターン
単位で認識処理が行われ、少ない認識候補で迅速に上記
筆跡パターンの認識が行われる。
【0024】また、本発明では、上記特徴抽出部の屈曲
部特徴抽出手段によって、上記座標データ列における座
標点を入力順に結んで成る直線の方向が所定値以上変化
する変化点が屈曲部の特徴点として抽出される。さら
に、直線部特徴抽出手段によって、上記屈曲部の特徴点
間を等間隔近似する特徴点が抽出される。そうすると、
方向値算出手段によって、上記両特徴抽出手段によって
抽出された各特徴点における次の特徴点への方向を表す
方向値が特徴量の一つとして算出される。こうして、角
度法と等分割法とによって特徴点が得られ、辞書照合時
に用いられる特徴量の一つとして各特徴点の上記方向値
が用いられる。
【0025】また、本発明では、ストローク数限定部に
よって、上記屈曲部の特徴点の数から筆跡パターンの近
似直線数が求められ、この近似直線数と当該筆跡パター
ンのストローク数とから特徴パターンのストローク数の
範囲が定められる。そうすると、上記認識部の特徴パタ
ーン選出手段によって、上記定められた範囲内のストロ
ーク数をヘッダ情報とする標準パターンが上記サブパタ
ーン辞書から選出され、この選出された標準パターンの
みが用いられて上記認識部によって上記辞書照合が迅速
に行われる。
【0026】また、本発明では、上記特徴量抽出部の方
向値算出手段によって、当該特徴パターンにおける最終
特徴点から次ストロークにおける先頭特徴点への方向値
が算出される。そして、上記認識部の有効標準パターン
判定手段によって、上記算出された方向値が入る有効範
囲をヘッダ情報とする標準パターンが有効標準パターン
であると判定される。そうすると、上記認識部によっ
て、上記有効標準パターンと判定された標準パターンの
みが用いられて上記辞書照合が迅速に行われる。
【0027】また、本発明では、上記認識部の標準パタ
ーン選出手段によって、代表パターン構成テーブルが参
照されて、認識済み筆跡パターンのサブパターン候補連
鎖に続くことが可能なサブパターンが求められ、この得
られたサブパターンの標準パターンが上記サブパターン
辞書から選出される。そうすると、選出された標準パタ
ーンのみが用いられて上記認識部によって上記辞書照合
が迅速に行われる。
【0028】また、本発明では、制御部の制御によっ
て、上記特徴抽出部および認識部がタブレットと平行し
て動作される。そうすると、上記タブレットによって生
成された座標データ列がデュアルポート・メモリで成る
入力座標バッファに入力ポートから書き込まれる。そし
て、この書き込まれた座標データ列が上記特徴抽出部に
よって上記書き込みと平行して出力ポートから読み出さ
れて、上記特徴抽出が行われる。さらに、抽出された特
徴パターンがデュアルポート・メモリで成る特徴バッフ
ァに入力ポートから書き込まれる。そして、この書き込
まれた特徴パターンが上記認識部によって上記書き込み
と平行して出力ポートから読み出され、上記辞書との照
合が行われる。こうして、上記特徴抽出処理および認識
処理が座標データ列生成処理と平行して行われる。
【0029】以下、この発明を図示の実施例により詳細
に説明する。尚、第1実施例〜第4実施例は主に特徴点
および特徴量の抽出法に関し、第5実施例は主に認識法
に関する。 <第1実施例>図1は本実施例における手書き認識装置
のブロック図である。この手書き認識装置は、認識部
1,タブレット2および結果表示部3で概略構成され
る。
【0030】上記タブレット2は、例えば表示一体型に
形成されており、筆記者がペン入力した筆跡データを電
気信号で表現される座標データ列に変換する。認識部1
は、得られた座標データ列に基づいて、後に詳述するよ
うな手書き認識処理を行って手書き文字等を認識する。
結果表示部3は、液晶表示装置等で構成されて認識部1
による認識結果を表示する。
【0031】上記認識部1は、ストローク終了判定部
4,ストローク処理部5,特徴格納部6,文字終了判定部
7,特徴再抽出部8および文字認識部9等によって構成
される。以下、順次各部の機能および動作について説明
する。
【0032】上記ストローク終了判定部4は、タブレッ
ト2から順次送出されてくる座標データ列を取り込み、
この取り込まれた座標データ列に基づいてペンアップを
検知してストローク終了符号を付加する。ストローク処
理部5は、ストロークを構成している座標データ列に基
づいて、ストロークの屈曲部の座標点を特徴点として抽
出する。こうして得られたストローク終了符号が付加さ
れた特徴点の座標データ列は、特徴格納部6に格納され
る。上記文字終了判定部7は、タブレット2からの座標
データ列に基づいて1文字の終了を検知して、文字終了
情報を出力する。
【0033】上記特徴再抽出部8は、文字終了判定部7
からの文字終了情報に基づいて、特徴格納部6に格納さ
れている特徴点列から1文字分の特徴点列を切り出して
ストローク連鎖を生成して正規化し、各特徴点間の距離
と方向を揃える為に特徴点の追加/削除を行う。さら
に、実際にペン入力されていない区間(以下、オフスト
ロークと言う)にもストロークがあるものと想定して特
徴点を挿入する。上記文字認識部9は、特徴再抽出部8
で最終的に得られた特徴点列と辞書格納部10に登録さ
れている標準パターンとの重み付けDPマッチングを行
ってサブパターンを認識し、さらに、辞書格納部10に
登録されている文字辞書を用いて手書き入力文字を認識
する。そして、形状では区別できない文字に対して特別
分類処理を行う。
【0034】ここで、上記辞書格納部10に登録されて
いる標準パターンは、ペンの「入り」や「跳ね」あるい
は「続け文字」や「崩し文字」にも対処可能なように、
次のようにして生成される。一般的に、文字が手書きさ
れる場合には、以下のような経験則がある。 ・漢字の“偏"と“旁"とのように、左右に分離できるパ
ターン内では一筆書きされ易い。 ・低画数の文字は一筆書きされ易い。 ・経験的,実験的あるいは指導的に一筆書きされる文字
がある。そこで、本実施例においては、上記経験則に基
づいて1文字のパターンを構成するサブパターンの定義
を次のように定める。 ・基本的に左右に分離できるパターンをサブパターンと
する。 ・低画数のパターンおよび統計上一筆書きされ易いパタ
ーンは全体でサブパターンとする。
【0035】このような定義に従ってサブパターンを設
定し、さらに、各サブパターンの筆順違いや変形バリエ
ーションを用意(以下、個々の筆順違いのパターンや変
形バリエーションのパターンをもサブパターンと言う)
する。そして、各サブパターンにおけるオフストローク
を補間して、後に上述するストローク処理部5および特
徴再抽出部8による特徴抽出処理と同様の処理を行って
特徴点と特徴量を抽出し、特徴量が付加された特徴点の
パターンを標準パターンとして辞書格納部10のサブパ
ターン辞書に登録する。図2は、上記サブパターンの一
例を示す。尚、図2(a)および図2(b)はサブパターン
「言」であり、図2(c)および図2(d)はサブパターン
「日」であり、図2(e)はサブパターン「早」である。
尚、図中の番号は、ストローク番号である。
【0036】ここで、本実施例におけるサブパターンと
して、基本的に左右に分離できるパターンを1つのサブ
パターンとするのは次の理由による。すなわち、図3に
示すように、上下に分離できるパターン「果」における
パターン「田」と「木」とは、一般的に「続き書き」さ
れ易い。したがって、サブパターンとして「田」と
「木」とを登録した場合には、図3(b)および図3(c)の
ような手書きパターンが入力された際には認識されない
ことになる。しかしながら、本実施例においては、
「果」を1つのサブパターンとして登録しており、しか
も、その筆順違いをもサブパターンとしてとしているの
で、「続き書き」されても高い認識率を得ることができ
るのである。
【0037】尚、上述のように、統計上一筆書きされ易
いパターンを1つのサブパターンとして登録しているの
で、その変形バリエーションはある程度限られる。した
がって、1文字をDPマッチングの単位とする場合によ
りも変形バリエーション数は少なくてよい。つまり、本
実施例のサブパターンによれば、従来のようにストロー
クや1文字をDPマッチングの単位とする場合に比較し
て辞書の必要記憶容量を少なくできる。逆に言えば、同
じ記憶容量で従来よりも多くのパターンを登録できるの
で変形バリエーションを更に詳細に設定でき、高い認識
率を得ることができるのである。
【0038】また、上記辞書格納部10に登録されてい
る文字辞書は、図4に示すように、文字とこの文字を構
成するサブパターンとを対応付けたものであり、上記D
Pマッチングによって認識されたサブパターン候補を組
み合わせて文字候補を生成する際に参照される。尚、本
実施例においては上述のように複数ストロークの集合で
あるサブパターンの組み合わせで文字を構成しているの
で、従来のようにストロークの組み合わせで文字を構成
する場合よりも文字の構成要素数を大幅に減らすことが
でき、文字辞書の容量を少なくできるのである。
【0039】図5は、上記構成を有する手書き文字認識
装置によって実行される手書き認識処理動作のフローチ
ャートである。以下、図5に従って、手書き認識処理動
作に付いて詳細に説明する。
【0040】ステップS1で、上記タブレット2によっ
て、ペン入力があるか否かが判別される。そして、ペン
入力があればステップS2に進む。ステップS2で、上記
タブレット2によって、入力された文字の筆跡パターン
が座標データ列に変換される。そうすると、上記ストロ
ーク終了判定部4によってストロークの終了が判定され
てストローク終了符号が付加された座標データ列が、ス
トローク処理部5に送出される。ここで、上記ストロー
ク終了判定部4によるストローク終了の判定は、次のよ
うにして行われる。すなわち、タブレット2から順次送
出されてくる座標データ列が取り込まれ、この取り込み
間隔がタブレット2における走査タイミングの間隔を越
えたことによってペンアップが検知されて、1つのスト
ロークが終了したと判定される。そして、既に取り込ま
れた座標データ列の最終にストローク終了符号が付加さ
れるのである。
【0041】ステップS3で、上記ストローク処理部5
によって、ストローク終了判定部4で付加されたストロ
ーク終了符号が参照されて特徴抽出処理が行われ、スト
ローク単位で抽出された特徴点列が特徴格納部6に格納
される。ここで、上記ストローク処理部5は、次のよう
にしてストロークの特徴抽出を行う。すなわち、先ず、
上記取り込まれた座標データ列からストローク終了符号
を検出し、このストローク終了符号の次に取り込まれた
座標データをストロークの始点の座標とする。次に、上
記始点に注目して、この始点から次の座標点までの距離
を算出する。そして、この距離が所定距離Nlmin(例え
ば0.25mm)以下の場合には、さらに次の座標点までの
距離を算出する。こうして、距離が上記所定距離Nlmin
より大きくなった際の座標点に注目点を移行する。以
後、同様の処理を次のストローク終了符号を取り込むま
で行い、得られた注目点を特徴点とし、その座標を特徴
量の一つとする。
【0042】次に、図6(a)に示すように、ストローク
を構成する特徴点列における始点P0の次の特徴点P1
を注目点とし、始点P0から注目点(特徴点P1)への方向
と注目点P1から特徴点P2への方向との差を算出し、こ
の差の値が所定角度Ndist(例えば30度)より小さい場
合には注目点P1を除去する。以下、上記注目点を各特
徴点P2,P3,…,Pn,…へ順次移行して、特徴点Pn-1か
ら注目点Pnへの方向と注目点Pnから特徴点Pn+1への
方向との差を算出し、この差の値に基づいて注目点Pn
を除去するか否かの判定を行う。その結果、図7(a)に
示すような入力座標列から図7(b)に示すような特徴点
列が作成される。こうして、正規化によって特徴が失わ
れる前にストロークの屈曲部の特徴点を抽出することに
よって、正規化後にも屈曲部の特徴が保持されるのであ
る。
【0043】ステップS4で、上記特徴再抽出部8によ
って、文字終了判定部7からの文字終了情報に基づいて
1文字入力が終了したか否かが判別される。その結果、
終了していればステップS5に進む。一方、終了してい
なければ上記ステップS1に戻って、文字入力およびス
トロークの特徴抽出が続行される。尚、上記文字終了判
定部7による文字終了判定は次のようにして行われる。
すなわち、タブレット2から順次送出されてくる座標デ
ータ列を取り込む際に、最後に座標データを取り込んで
から次の座標データを取り込むまで所定時間Ntime(例
えば1秒)が経過したことによって1つの手書き文字に
係る座標データ列の終了を検知する。そして、文字終了
を表す上記文字終了情報を特徴再抽出部8に送出するの
である。
【0044】ステップS5で、上記特徴再抽出部8によ
って、特徴格納部6に格納された特徴点の座標データ列
から、上記文字終了情報に基づいて、1文字区間内のス
トロークの特徴点に付加されている座標データ列が読み
出される。そして、以下のようにして特徴再抽出処理が
行われる。
【0045】上記特徴格納部6から読み出された複数の
特徴点が、入力されたストロークの順に並べられる。そ
して、最初のストロークから最終ストロークに向かって
順次ストロークを接続し、順次得られるストローク連鎖
毎に正規化する。この正規化は、次のようにして行われ
る。すなわち、対象となるストローク連鎖におけるx軸
の最大座標値xmaxおよびy軸の最大座標値ymaxが求め
られる。さらに、x軸の最小座標値xminおよびy軸の
最小座標値yminが求められる。そして、式(1),(2)に
従って、各特徴点の座標がx軸,y軸夫々に0〜Nnorm
(例えば128ドット)の範囲に分布するように正規化さ
れる。
【0046】 xn'=[(xn−xmin)/(xmax−xmin)]・Nnorm …(1) yn'=[(yn−ymin)/(ymax−ymin)]・Nnorm …(2) ここで、xn :特徴点nのx座標 xn':特徴点nの正規化後のx座標 yn :特徴点nのy座標 yn':特徴点nの正規化後のy座標 上述のようにして正規化された各特徴点における注目特
徴点と直後の特徴点との間の距離が求められる。この距
離が所定距離Nfmax(例えば4mm)以上である場合には、
当該特徴点間に相当する座標データ列の中から選択して
正規化した特徴点を新たに追加して、当該区間における
特徴点間の距離が所定距離Nflen(例えば2mm)以下にな
るようにする。こうして、上記屈曲部の特徴点間を補間
して等間隔近似を行うことによって、より適切に特徴点
を抽出でき、以後のDPマッチング時間を短縮すると共
に高い認識率を得ることができる。また、上記距離が所
定距離Nfmin(例えば1mm)以下であって、且つ、上記注
目特徴点から直前の注目特徴点への方向と注目特徴点か
ら直後の特徴点への方向との方向差のうち小さい方の値
が所定方向差Nddst(例えば90度)より小さい場合に
は、注目特徴点はノイズであると見なして特徴点列から
削除する。
【0047】ここで、上記ストローク連鎖が形成される
に際して、ストローク間に上記オフストロークが存在す
る場合には、オフストローク区間には実際にストローク
が存在しているものと想定して、当該オフストローク区
間を所定距離Nflen以下になるように等分割する特徴点
が追加される。このように、上記オフストローク区間を
補間することによって、筆者が意図しない「入り」や
「跳ね」の部分あるいは「続け文字」や「崩し文字」の
特徴をも適確に抽出できるのである。
【0048】以上のような特徴点の追加/削除動作が、
新たに特徴点が追加されなくなるまで繰り返される。そ
の結果、図7(b)に示すような特徴点列から、図7(c)お
よび図7(d)に示すようなx座標,y座標および絶対方向
の3要素を有する特徴点列が作成されるのである。尚、
図7(c)は第1ストロークa1と第2ストロークb1との
連鎖の特徴点列の例であり、破線eは補間されたオフス
トローク区間を示す。また、上記絶対方向は、各特徴点
における次特徴点への方向であり、基準方向からのずれ
の度合いで表す。
【0049】ステップS6で、上記文字認識部9によっ
て、上記ストローク連鎖から得られた特徴点列と辞書格
納部10のサブパターン辞書に登録されている標準パタ
ーンとの重み付けDPマッチング処理が行われる。本実
施例におけるDPマッチングの際に用いる特徴パターン
と標準パターンとの対応特徴点間のマッチング距離(以
下、部分マッチング距離と言う)Δdは、上記特徴パタ
ーンと標準パターンとの対応特徴点間のユークリッド距
離ΔLと方向差ΔHとを用いて式(3)で求める。 Δd=Wp・ΔL+Wd・ΔH …(3) 但し、Wp:距離に係る重み(例えば、全特徴点間でNwl
en(=1)) 但し、Wd:方向に係る重み(例えば、全特徴点間でNwd
st(=8)) 尚、上記ユークリッド距離ΔLは式(4)で与えられる。
また、上記方向差ΔHは、注目特徴点の直前の特徴点か
ら直後の特徴点への方向間の差であり、式(5)で与えら
れる。ここで、始点と終点とにおける方向差ΔHの値は
“0"とする。 ΔL=[(xm−xn)2+(ym−yn)2]1/2 …(4) ΔH=|dn−dm| …(5) 但し、xn:特徴パターン上における特徴点nのx座標 yn:特徴点nのy座標 xm:標準パターン上における特徴点mのx座標 ym:特徴点mのy座標 dn:特徴点nの直前の特徴点(n−1)から直後の特徴
点(n+1)への方向 dm:特徴点mの直前の特徴点(m−1)から直後の特徴
点(m+1)への方向 そして、上記部分マッチング距離Δdを用いた重み付け
DPマッチングによるマッチングパスに沿った距離の総
和(以下、単に「マッチング距離」と言う)Dに基づい
て、サブパターン候補ラティスが生成される。
【0050】ここで、上記特徴再抽出部8による特徴再
抽出処理と文字認識部9による重み付けDPマッチング
とは、上記ストローク連鎖を順次成長させながら連続し
て行われるのである。尚、その際におけるストローク連
鎖の成長は、上記サブパターン辞書に登録されているサ
ブパターンを構成するストローク数を考慮して設定され
た所定ストローク数(例えば、16ストローク)までとす
る。以下、図7(b),図7(c)および図7(d)に従って、上
記特徴再抽出処理および重み付けDPマッチングとに付
いて、より具体的に説明する。
【0051】先ず、上記特徴再抽出部8は、サブパター
ン「月」を有する入力文字パターンに基づいてストロー
ク処理部5で作成された特徴点列(図7(b)参照)のう
ち、第1ストロークa1の特徴点列を読み出し、上述の
ような正規化および特徴再抽出処理を行って第1ストロ
ークa1の特徴パターンa2(図7(c)参照)を得る。次
に、文字認識部9は、第1ストロークa1の特徴パター
ンa2と上記サブパターン辞書に登録されている標準パ
ターンとの重み付けDPマッチングを行ってマッチング
距離Dが所定値以下のサブパターン候補を得、得られた
サブパターン候補をマッチング距離Dを付加して内部バ
ッファに記憶する。
【0052】次に、上記特徴再抽出部8は、第1ストロ
ークa1と第2ストロークb1の特徴点列に対して正規化
を行った後、第1ストロークa1と第2ストロークb1と
の間にオフストローク区間が存在するので当該オフスト
ローク区間を補間する。そして、特徴再抽出処理を行っ
て、第1ストロークa2,オフストローク区間eおよび第
2ストロークb2から成るストローク連鎖の特徴パター
ンを得る。そして、文字認識部9で重み付けDPマッチ
ングを行ってマッチング距離Dが所定値以下のサブパタ
ーン候補を得、得られたサブパターン候補をマッチング
距離Dを付加して内部バッファに記憶する。
【0053】以下、同様にして、第1ストロークa1と
第2ストロークb1とのストローク連鎖に順次ストロー
クc1,d1を付加し、オフストローク区間f,gで補間し
て、特徴再抽出処理および重み付けDPマッチングを行
う。このような処理が、ストローク連鎖数が所定ストロ
ーク数“16"に至るか、あるいは、特徴点列が終了す
るまで続行されて、文字認識部9の上記内部バッファに
はサブパターン候補ラティスが生成されるのである。図
7(d)は、こうして、上記特徴再抽出部8によって最終
的に抽出されたサブパターン「月」の特徴パターンであ
る。
【0054】ステップS7で、上記文字認識部9によっ
て、上記ステップS6における重み付けDPマッチング
の結果得られたサブパターン候補ラティスに基づいて、
辞書格納部10に登録されている上記文字辞書が参照さ
れて文字候補が生成される。そして、各文字候補を構成
するサブパターンに係るマッチング距離Dの合計値が最
も小さい文字候補から順に、例えば10位までの文字候
補が認識結果として出力される。ステップS8で、文字
「や」と文字「ゃ」のように、ストロークの形状では区
別できない文字に対する特別分類処理が実行される。例
えば、上記文字「や」と文字「ゃ」との分類の場合に
は、全く形状は同じであるから、正規化後に抽出された
特徴パターンを用いるDPマッチングでは識別が不可能
である。そこで、上記ステップS3においてストローク
処理部5によって抽出された特徴点の座標に基づいて認
識対象文字のy軸方向の最大距離(文字の高さ)が求めら
れ、この文字の高さが直前に認識された文字の1/2以
下であれば小文字「ゃ」が第1位の認識結果候補である
と決定される。
【0055】ステップS9で、上記結果表示部3によっ
て、タブレット2の下側に一体に積層されている表示パ
ネル上に第1位の認識結果候補が表示される。ステップ
S10で、手書き認識処理動作の終了が指示されているか
否かが判別される。その結果、指示されていなければ上
記ステップS1に戻って次のペン入力があるのを待ち、
指示されていれば手書き認識処理動作を終了する。
【0056】上述のように、本実施例においては、上記
ストローク処理部5によって、入力されたストローク毎
に座標点間の方向差が所定値Ndistより大きい座標点を
特徴点として抽出するようにしている。つまり、本実施
例においては、正規化される前に屈曲部の特徴を表す特
徴点と特徴量を予め抽出するようにしている。したがっ
て、後の正規化に際して屈曲部の特徴が失われたとして
も、屈曲部を表す特徴量と特徴点を確実に抽出すること
ができるのである。
【0057】さらに、上記特徴再抽出部8によって、1
文字パターンを構成するストローク連鎖毎に、正規化さ
れた後の特徴点間の距離が所定値Nfminより大きい特徴
点間を補間し、ノイズを除去する。そして更に、上記オ
フストローク区間を等分割するように特徴点で補間する
ようにしている。このように、上記正規化後に再度特徴
点を抽出して等間隔近似を行うようにしている。つま
り、本実施例における特徴点の抽出は、上述した従来の
特徴抽出方法(2)の等分割法と特徴抽出方法(3)の角度
法とを併用したものである。したがって、上記従来の特
徴抽出方法(2),(3)の欠点を補って最適に特徴点を抽
出でき、後のDPマッチングの精度を高め時間を短縮で
きる。また、オフストロークを補間することによって、
上記ペンの「入り」や「跳ね」あるいは「続け文字」や
「崩し文字」にも対処できるようになる。
【0058】さらに、上記文字認識部9によって、一筆
書きされ易いサブパターン単位での標準パターンを用い
たDPマッチングを行うので、生成されるラティス数が
少なく、文字候補への展開を容易に且つ高速に行うこと
ができる。したがって、本実施例によれば、認識時間を
短縮し、認識率を高めることができる。また、上記サブ
パターン辞書および文字辞書の記憶容量を少なくでき
る。
【0059】<第2実施例>本実施例は、第1実施例に
おける上記文字認識部9で重み付けDPマッチングの際
に用いられるユークリッド距離ΔLと方向差ΔHの生成
に関する。
【0060】図8は、本実施例における手書き認識装置
のブロック図である。タブレット12,結果表示部13,
ストローク終了判定部14,ストローク処理部15,特徴
格納部16,文字終了判定部17,特徴再抽出部18およ
び辞書格納部20は、第1実施例におけるタブレット
2,結果表示部3,ストローク終了判定部4,ストローク
処理部5,特徴格納部6,文字終了判定部7,特徴再抽出
部8および辞書格納部10と同じ機能を有して同様に動
作する。
【0061】記憶部21には、文字認識部19によって
ユークリッド距離ΔLおよび方向差ΔHを生成する際に
用いられる絶対差テーブル,距離テーブルおよび方向差
テーブルが格納されている。上記絶対差テーブルおよび
距離テーブルはユークリッド距離ΔL生成の際に用いら
れる。ここで、ユークリッド距離ΔLを求める際の特徴
点は正規化後の特徴点であるから、特徴点のx,y座標
は上記0〜Nnormの範囲内に収まることになる。そこ
で、例えば、Nnorm=128ドットである場合には、図
9(a)および図9(b)に示すように、特徴パターン上にお
ける特徴点nと標準パターン上における点mとの座標の
差の絶対値を要素とする128×128の絶対差テーブ
ルをx座標およびy座標毎に作成する。また、上記座標
差の絶対値の値は0〜127の範囲内に収まる。そこ
で、図9(c)に示すようなユークリッド距離ΔLを要素
とする128×128の距離テーブルを作成するのであ
る。
【0062】上記方向差テーブルは方向差ΔH生成の際
に用いられる。ここで、上記特徴パターン上における特
徴点nあるいは標準パターン上における特徴点mの絶対
方向を、ある方向を“0"として1回転が360度にな
るように定義し、“0〜359"の整数値で表現する。
そして、図10に示すように、上記特徴パターン上にお
ける特徴点(n−1)と標準パターン上における特徴点
(m−1)との方向差ΔHを要素とする360×360の
方向差テーブルを作成する。
【0063】上記構成において、文字認識部19は、以
下のようにしてユークリッド距離ΔLと方向差ΔHとを
生成する。すなわち、先ず、特徴パターン上における特
徴点nのx座標“xn"と標準パターン上における特徴点
mのx座標“xm"との差の絶対値を上記絶対差テーブル
を引いて求める。同様にして、当該特徴点nのy座標
“yn"と当該特徴点mのy座標“ym"との差の絶対値を
上記絶対差テーブルを引いて求める。そして、得られた
両絶対値“|xn−xm|"と“|yn−ym|"に基づいて、上
記距離テーブルを引いてユークリッド距離ΔLを求め
る。次に、上記特徴パターン上の特徴点(n−1)におけ
る特徴点(n+1)への方向dnと標準パターン上の特徴
点(m−1)における特徴点(m+1)への方向dmとの差
ΔHを上記方向差テーブルを引いて求めるのである。
【0064】以後は、上述のようにして得られたユーク
リッド距離ΔLと方向差ΔHとを用いて式(3)に従って
部分マッチング距離Δdを算出し、この部分マッチング
距離Δdを用いてDPマッチングを行うのである。
【0065】このように、本実施例においては、上記絶
対差テーブル,距離テーブルおよび方向差テーブルが登
録された記憶部21を設ける。そして、文字認識部19
は、上記絶対差テーブルおよび距離テーブルを用いて、
特徴パターン上の特徴点nと標準パターン上の特徴点m
とのユークリッド距離ΔLを求める。さらに、上記方向
差テーブルを用いて、特徴パターン上の特徴点(n−1)
から特徴点(n+1)への方向と標準パターン上の特徴点
(m−1)から特徴点(m+1)への方向との方向差ΔHを
求めるようにしている。したがって、本実施例によれ
ば、上記記憶部21に格納された夫々のテーブルをアク
セスするという簡単な処理によってユークリッド距離Δ
Lと方向差ΔHとを求めることができ、部分マッチング
距離Δdの生成処理速度、延いてはDPマッチング処理
速度の高速化を図ることができる。
【0066】<第3実施例>本実施例は、第1実施例に
おける上記文字認識部9で重み付けDPマッチングを行
う際に用いられる重みの変化に関する。
【0067】図11は、本実施例における手書き認識装
置のブロック図である。タブレット32,結果表示部3
3,ストローク終了判定部34,ストローク処理部35,
特徴格納部36,文字終了判定部37および特徴再抽出
部38は、第1実施例におけるタブレット2,結果表示
部3,ストローク終了判定部4,ストローク処理部5,特
徴格納部6,文字終了判定部7および特徴再抽出部8と
同じ機能を有して同様に動作する。
【0068】本実施例においては、上記標準パターンに
おける特徴点(m−1)〜(m+1)間(以下、区間mと言
う)毎に重みを求め、この求められた重みを当該標準パ
ターンの特徴点mに付加して辞書格納部40に登録する
のである。
【0069】以下、上記各区間毎の重みの算出方法につ
いて詳細に述べる。本実施例においては、文字認識部3
9での部分マッチング距離Δd算出の際に用いる距離に
関する重みWpと方向に関する重みWdを、式(6)および
式(7)とする。 Wp=Nwlen・Wlwm …(6) Wd=Nwdst・Wdwm …(7) ここで、Nwlen,Nwdst:第1実施例と同様の全特徴点
間で均一の重み Wlwm,Wdwm:標準パターンにおける区間mにおける変
動重み 上記変動重みWlwm,Wdwmは、重み算出部41の制御の
下に、以下のようにして求められる。すなわち、先ず、
総ての認識対象文字における種々の筆跡パターンの座標
データ列で成る学習文字セットを用意する。そして、個
々の認識対象文字に係る1つのサブパターンの座標デー
タ列を任意に選出してストローク終了判定部34に入力
し、第1実施例の場合と同様にして特徴抽出/再抽出を
行い、得られた特徴列を初期標準パターンとして重み算
出用バッファ42に登録しておく。次に、上記学習文字
セット中におけるある学習文字のサブパターンのある座
標データ列をストローク終了判定部34に入力し、第1
実施例の場合と同様にして特徴抽出/再抽出を行って学
習用特徴パターンを得る。文字認識部39は、当該サブ
パターンに係る初期標準パターンを重み算出用バッファ
42から読み出し、当該サブパターンの初期標準パター
ンと学習用特徴パターンとのDPマッチングを行う。そ
の際におけるDPマッチングは、第1実施例における式
(3)の部分マッチング距離Δdを用いたDPマッチング
である。
【0070】そして、上記DPマッチングの結果、マッ
チングパスに沿った距離の総和が所定値より大きい場合
には、当該学習用特徴パターンは当該サブパターンのカ
テゴリの範疇ではないとして変動重み算出の対象から外
す。
【0071】当該学習用特徴パターンが変動重み算出の
対象となる場合には、上記DPマッチング時に算出され
たマッチングパス上の各点に係るユークリッド距離ΔL
と方向差ΔHとを、当該初期標準パターン上における当
該特徴点に係る上記区間に対応付けて重み算出用バッフ
ァ42に格納する。
【0072】上述の処理を学習文字セット総ての認識対
象文字における総ての座標データ列に付いて行い、上記
各区間毎のユークリッド距離ΔLと方向差ΔHとの分布
を求める。そして、上記重み算出部41は、重み算出用
バッファ42に格納されているユークリッド距離ΔLと
方向差ΔHとに基づいて、上記各区間毎にユークリッド
距離ΔLの分散ρLおよび方向差ΔHの分散ρHを算出
し、区間mに係るユークリッド距離ΔLの分散ρLmを上
記変動重みWlwmとする。一方、区間mに係る方向差Δ
Hの分散ρHmを上記変動重みWdwmとするのである。こ
うして得られた変動重みWlwm,Wdwmは上記初期標準パ
ターンにおける特徴点に付加されて、標準パターンとそ
の変動重みとして辞書格納部40に格納される。
【0073】尚、本実施例においては、上記各区間毎に
ユークリッド距離ΔLの分散ρLおよび方向差ΔHの分
散ρHを算出して変動重みWlwm,Wdwmを求めているが、
ユークリッド距離ΔLの平均μLおよび方向差ΔHの平
均μHを変動重みWlwm,Wdwmとしても差し支えない。要
は、初期標準パターンに対する学習文字セットのばらつ
きの度合を表すことができればよいのである。
【0074】このように、本実施例においては、予め、
総ての認識対象文字の学習文字セットを用意し、個々の
認識対象文字に係る1つの座標データ列を任意に選出し
て特徴列を求めて初期標準パターンとする。そして、上
記学習文字セット中における個々の座標データ列からの
学習用特徴パターンと当該学習文字に係る初期標準パタ
ーンとのDPマッチングを文字認識部39で行い、マッ
チングパスに沿った各点に係るユークリッド距離ΔLと
方向差ΔHとを求める。そして、初期標準パターンにお
ける区間mにある特徴点に係るユークリッド距離ΔLの
分散ρLおよび方向差ΔHの分散ρHを変動重みWlwm,W
dwmとして得る。以後、上記文字認識部39による手書
き認識の際には、このようにして得られた変動重みWlw
m,Wdwmを用いた重み付けDPマッチングを行う。
【0075】したがって、本実施例によれば、手書き文
字の曲線部分の特徴点が安定して抽出できない場合に
は、その不安定度に応じた重みを付加してDPマッチン
グを行うことによって、より高い認識性能を確保できる
のである。
【0076】<第4実施例>本実施例は、変動重みWlw
n,Wdwnを用いて重み付けDPマッチングを行う他の実
施例に関する。図12は、本実施例における手書き認識
装置のブロック図である。タブレット52,結果表示部
53,ストローク終了判定部54,ストローク処理部5
5,特徴格納部56,文字終了判定部57,特徴再抽出部
58および辞書格納部60は、第1実施例におけるタブ
レット2,結果表示部3,ストローク終了判定部4,スト
ローク処理部5,特徴格納部6,文字終了判定部7,特徴
再抽出部8および辞書格納部10と同じ機能を有して同
様に動作する。
【0077】本実施例においては、文字認識部59での
部分マッチング距離Δd算出の際に用いる距離に関する
重みWpと方向に関する重みWdを、式(8)および式(9)
とする。 Wp=Nwlen・Wlwn …(8) Wd=Nwdst・Wdwn …(9) ここで、Wlwn,Wdwn:特徴パターンにおける特徴点n
に係る変動重み 重み算出部61は、上記特徴再抽出部58で得られた特
徴パターンに基づいて変動重みWlwn,Wdwnを算出し、
得られた変動重みWlwn,Wdwnを当該特徴パターンに付
加して文字認識部59に送出する。そうすると、文字認
識部59は、重み算出部61からの特徴パターンおよび
変動重みWlwn,Wdwnと辞書格納部60に格納されたサ
ブパターン辞書の標準パターンとに基づいて、第3実施
例と同様の重み付けDPマッチングを行うのである。そ
の際における上記重み算出部61による変動重みWlwn,
Wdwnの算出は、以下のようにして行われる。
【0078】上記特徴再抽出部58からの特徴パターン
における各特徴点nについて、特徴点(n−1)と特徴点
(n+1)との距離を算出する。また、当該特徴点nが属
するストロークを構成する全特徴点の座標に基づいて当
該ストロークの全特徴点を入力順に結ぶ距離(以下、単
に“全長"と言う)を算出する。そして、式(8)に従って
変動重みWlwn,Wdwnを算出する。
【0079】 Wlwn=Wdwn=(特徴点(n−1)と特徴点(n+1)との距離) /(ストロークの全長) …(10) このように、本実施例においては、上記重み付けDPマ
ッチングの際の変動重みWlwn,Wdwnの値を、特徴点n
の両隣の特徴点間の距離のストローク長に対する割合で
求めるようにしている。したがって、直線部にある特徴
点間の部分マッチング距離Δdが遠ざけられることにな
り、特徴パターンと標準パターンとにおける屈曲部の特
徴点の座標のずれを容易に吸収できるのである。すなわ
ち、本実施例によれば、手書き入力パターンの局所変形
に強い手書き認識装置を実現できるのである。
【0080】<第5実施例>本実施例は入力パターンの
認識法に関する。尚、本実施例においては、説明を簡単
にするために、手書き文字パターンを認識対象とした手
書き文字認識装置を例に説明するが、例えば、ゼスチャ
等の文字以外のパターンへの適用も同様にして行うこと
ができる。
【0081】以下、発明の概要を簡単に述べた後、デー
タ構造や認識方式等について詳細に説明する。図13は
本実施例の手書き認識装置におけるブロック図である。
この手書き認識装置は、認識部71,タブレット72,特
徴抽出用記憶部73,認識用記憶部74,サブパターン
辞書75および結果表示部76で概略構成される。ここ
で、本実施例における上記サブパターンの定義は、第1
実施例における定義と全く同じである。
【0082】上記タブレット72は、第1実施例〜第4
実施例と同様に、例えば表示一体型に形成されて、筆記
者がペン入力した筆跡データを電気信号で表現される座
標データ列に変換する。認識部71は、タブレット72
から入力される座標データ列の特徴を抽出し、サブパタ
ーン辞書75を用いて手書き文字を認識して結果表示部
76に表示する。特徴抽出用記憶部73には、入力され
た座標データ列の特徴を抽出する際に用いられる種々の
バッファが格納される。また、認識用記憶部74には、
手書き認識処理時に用いられる種々のバッファが格納さ
れる。尚、上記認識用記憶部74における文字構成テー
ブルは、第1実施例で言うところの文字辞書と同じであ
り、図4に示す構成を有している。
【0083】上記タブレット72から入力された座標デ
ータ列は、入力部77を介して正規化部78に入力され
て1つ以上のストローク連鎖毎に正規化される。そし
て、特徴抽出部79によって、正規化後のストローク連
鎖に対して、後に詳述するようにして特徴点とその特徴
量が抽出される。方向差判定部80は、上記特徴抽出部
79で抽出された各特徴点のうちストロークの最終特徴
点に係る方向差を後に詳述するようにして求める。そし
て、この方向差に基づいて、DPマッチングに用いる標
準パターンの有効性を判定する。ストローク数限定部8
1は、上記タブレット72からの入力パターンの正規の
ストローク数をある範囲に限定する。こうして、入力パ
ターンのストローク数を限定することによって後に行わ
れるDPマッチングの高速化を図るのである。
【0084】DPマッチング部82は、上記特徴抽出部
79で抽出された特徴量を有する特徴点列のパターン
(特徴パターン)とサブパターン辞書75に登録されてい
るサブパターン単位の標準パターンとのDPマッチング
を行ってサブパターンを認識する。文字生成部84は、
サブパターン候補ソーティング部83でソーティングさ
れたサブパターン候補を組み合わせて文字候補を生成す
る。出力部85は、生成された文字候補を類似度の高い
順序で結果表示部76に送出して表示させる。制御部8
6は、上記入力部77,正規化部78,特徴抽出部79,
方向差判定部80,ストローク数限定部81,DPマッチ
ング部82,サブパターン候補ソーティング部83,文字
生成部84および出力部85を制御して、手書き文字認
識処理を実行する。
【0085】図14は、上記制御部86の制御の下に行
われる手書き文字認識処理動作のゼネラルフローを示す
フローチャートである。以下、図14に従って、手書き
文字認識処理動作の概要について説明する。ステップS
11で、上記入力部77によって、タブレット72からの
座標データ列が取り込まれて特徴抽出用記憶部73の入
力座標バッファに格納される。ステップS12で、上記正
規化部78,特徴抽出部79,方向差判定部80,ストロ
ーク数限定部81,DPマッチング部82およびサブパ
ターン候補ソーティング部83によって、順次スロトー
ク連鎖が生成されて正規化,特徴抽出,ストローク数限
定,次ストロークへのオフ方向差計算,サブパターン認識
および第1サブパターン候補ソーティングが行われて、
第1サブパターン候補が決定される。尚、上記第1サブ
パターンとは、入力文字パターンを構成する最初のサブ
パターンであり、通常は文字の偏に相当するものであ
る。ステップS13で、上記正規化部78,特徴抽出部7
9,方向差判定部80,ストローク数限定部81,DPマ
ッチング部82,サブパターン候補ソーティング部83
および文字生成部84によって、上記決定された第1サ
ブパターン候補に基づいて以降のサブパターンを限定し
ながらサブパターン認識を行ない、得られた各サブパタ
ーン候補を組み合わせて文字候補が生成される。ステッ
プS14で、上記出力部85によって、文字生成部84の
文字候補ソーティング部88で類似度の高い順にソーテ
ィングされた文字候補が類似度の高い順に結果表示部7
6に出力されて表示される。
【0086】以下、上記ゼネラルフローにおける第1サ
ブパターンの認識処理および文字生成処理について詳細
に説明する。ここで、上記第1サブパターンの認識処理
および文字生成処理の説明を容易にするために、正規化
部78による正規化処理、特徴抽出部79による特徴抽
出処理、方向差判定部80による方向差判定処理、スト
ローク数限定部81によるストローク数限定処理、DP
マッチング部82によるDPマッチング処理、サブパタ
ーン辞書75の構造について、予め説明しておく。
【0087】(I) 正規化処理 1以上のストローク分のストロークデータ(可変長の座
標列データ)に対して、このストロークデータ全体の外
接枠が縦横夫々Nnormドットになるように正規化を行な
う。尚、上記ドット数“Nnorm"は認識装置の能力に応
じて随意に決定できる値であり、本実施例ではNnorm=
200ドットである。
【0088】(II) 特徴抽出処理 正規化後におけるストロークデータに対して、オフスト
ローク区間を適当な座標データの正規化値で補間して入
力パターンの一筆化を行う。そうした後、全ての座標デ
ータを走査して、閾値以上に方向が変化している点を屈
曲点として求める。そして、屈曲点間の距離が所定値以
上である場合にはw(例えば“70")ドット間隔で補間
点を求め、屈曲点と補間点(等間隔点)とを合わせて特徴
点として抽出する。そして、各特徴点における次特徴点
への方向値dを求め、座標値(x,y)と合わせて特徴量
Fnとする。したがって、特徴量Fnは、式(11)で表さ
れる可変長の方向付座標列となる。
【0089】 Fn=(x1,y1,d1),(x2,y2,d2),…,(xn,yn,dn)…(11) 尚、上記方向値dは、ある方向を“1"として1回転が
360度になるように定義し、1〜D(例えば“64")
の整数値で表現する。上記座標(x,y)の有効範囲は正
規化枠のドット数Nnormに依存する一方、方向値dの有
効範囲は方向の量子化数Dに依存する。但し、上記ドッ
ト数Nnorm,量子化数Dおよび補間間隔wは認識装置の
能力に応じて随意に決定できる値である。
【0090】(III) 方向差判定処理 本処理は、上記DPマッチング処理の高速化を図るため
のスキップ処理を行うか否かを判定する処理である。具
体的には、あるストロークの最終特徴点から次のストロ
ークの先頭特徴点への2つの方向差を求め、この方向差
の値とサブパターン辞書75に各標準パターン毎に格納
されている方向評価値とで有効標準パターンの判定を行
なう処理である。尚、この処理で有効標準パターンでな
いと判定された標準パターンが在る場合には、その標準
パターンを用いたDPマッチング処理は行なわずに次の
標準パターンヘスキップする。
【0091】ここで、上記方向差を次のように定義す
る。すなわち、方向値dは循環値であるためにその差分
(Ddiff(d1,d2))を式(12)で定義する。
【0092】 Ddiff(d1,d2)=min(│d1−d2│,D−│d1−d2│) …(12) 但し、d1,d2は、ある特徴点における2方向の方向値
(1≦d1≦D,1≦d2≦D)であり、min(a,b)はa,
bのうち小さい方の値を取ることを意味する。
【0093】上述のように方向値dは循環値である。そ
のために、その平均や標準偏差も直接求めることはでき
ない。そこで、本実施例においては、直交する2つの軸
(方向値)を用意し、この両軸と方向値dとの方向差を求
め、求められた2つの方向差の平均値と標準偏差値とで
代用するのである。すなわち、diをi(1≦i≦I)番
目の方向値、第1,第2軸の方向値をRj(j=1,2)、
第1,第2軸との方向差をddjとすると、方向差ddjは式
(13)で求められ、方向差ddjの平均mjは式(14)で求
められ、方向差ddjの標準偏差vjは式(15)で求められ
る。
【0094】
【数1】
【0095】上記第1,第2軸は直交2軸であり、認識
装置の能力に応じて随意に決定できる。本実施例では、
R1=1,R2=16である。
【0096】尚、上記方向差判定処理結果を用いた上記
スキップ処理は、次のようにして行う。例えば、文字
「賭」におけるサブパターン「貝」では、次のサブパタ
ーン「者」へ至るオフストロークの方向(以下、オフ方
向と言う)が特定の範囲(右上方向)に限定されている。
そこで、このオフ方向の情報を用いて、現特徴点に係る
次ストロークへのオフ方向が、現標準パターンに付加さ
れているオフ方向の許容範囲内であるかをチェックし
て、許容範囲外である場合には現標準パターンをDPマ
ッチング処理の対象とはせず、次の標準パターンへスキ
ップするのである。
【0097】上記スキップ処理は、具体的には次のよう
にして行う。先ず、上記標準パターンにおける最終スト
ロークの最終特徴点から次ストロークへのオフ方向を求
め、このオフ方向と第1軸(方向値d1)および第2軸(方
向値d2)との方向差dd1,dd2を求める。次に、上記サブ
パターン辞書75における現標準パターンのヘッダ部か
ら、第1軸との方向差平均値m1と第2軸との方向差平
均値m2、および、第1軸との方向差標準偏差値v1と第
2軸との方向差標準偏差値v2を読み出して、式(16),
式(17)を満たすか否かを判定する。そして、満たさな
い場合には、次標準パターンへスキップするのである。 |dd1−m1|<v1・Cs …(16) |dd2−m2|<v2・Cs …(17) ここで、Cs:定数(例えば“3") 尚、上記サブパターン辞書75に書き込まれている第
1,第2軸との方向差平均値m1,m2および第1,第2軸
との方向差標準偏差値v1,v2は、注目サブパターンか
ら次サブパターンへのオフ方向値に対する第1,第2軸
との方向差平均値と標準偏差値であり、大量の手書き文
字の座標データ列に基づいて各サブパターン毎に求めた
ものである。
【0098】(IV) ストローク数限定処理 ストローク数限定処理は、入力パターンの正規のストロ
ーク数をある範囲に限定(予想)しておく処理であり、D
Pマッチング処理の高速化を図るための処理である。上
記ストローク数slの限定範囲は、式(18)に示すよう
に、下限を入力パターンの入力ストローク数rsとし、上
限を上記特徴抽出処理の途中で求められた屈曲点数pcか
ら計算できる予想値とする。 rs≦sl≦pc+1 …(18) 上記ストローク数限定処理結果によるDPマッチング処
理の高速化は次のようにして行われる。すなわち、予
め、上記サブパターン辞書75を正規のストローク数順
にソートしておく。そして、DPマッチング処理に際し
ては、総ての標準パターンを用いるのではなく、注目特
徴パターンに係るストロークslの限定範囲内に入る正規
のストローク数を有するサブパターンの標準パターンの
みを用いてDPマッチング処理を行うのである。
【0099】(V) DPマッチング処理 入力パターンの座標データ列からの特徴パターンとサブ
パターン辞書75に登録されている標準パターンとの距
離計算を行う処理である。このDPマッチング処理は長
さの異なる2つのデータ間の距離を求めるものであり、
マッチングパスの定義や整合窓の幅やマッチング距離の
定義は、認識装置の能力に応じて随意に決定できる。
【0100】本実施例においては、上記部分マッチング
距離d(m,n)を式(19)で定義し、マッチングパスに沿っ
た距離の部分和D(m,n)を式(20)で定義する。
【0101】
【数2】
【0102】DPマッチングの整合窓の幅wwは可変長で
あり、特徴パターンの特徴点数Nおよび標準パターンの
特徴点数Mに基づいて、式(21)で算出される。 ww=max(Cw,|M−N|) …(21) 上記max(a,b)はa,bのうちの大きい方の値を取るこ
とを意味する。また、Cwは認識装置の能力に応じて随
意に設定できる定数であり、本実施例においては“8"
である。つまり、本実施例におけるDPマッチング処理
では、1≦m≦M,1≦n≦N及び整合窓wwの範囲内で
マッチングパスに沿った距離の部分和D(m,n)を求め、
最終的にD(M,N)の値をNで割った値がマッチング距
離distとなる。 dist=D(M,N)/N …(22) (VI) サブパターン辞書75の構造 上記サブパターン辞書75には各サブパターン単位での
標準パターンを登録する。標準パターンのデータは、上
述の特徴パターンの特徴量Fnと同様の可変長の方向付
座標列であり、予め用意したサブパターンの座標データ
列に対して正規化部78による正規化処理と特徴抽出部
79による特徴抽出処理を行なって作成したものであ
る。また、上記サブパターン辞書75には、各サブパタ
ーンの各種情報がヘッダ情報として付加されている。ヘ
ッダ情報には図15に示すようなものがある。図15に
おいて、“ストローク数部"には上記正規のストローク
数が格納され、“第1方向差平均部",“第2方向差平均
部"には上記第1軸との方向差平均値m1,第2軸との方
向差平均値m2が格納され、“第1方向差偏差部",“第
2方向差偏差値"には上記第1軸との方向差標準偏差値
v1,第2軸との方向差標準偏差値v2が格納される。上
記サブパターン辞書75の辞書構造は、一つのサブパタ
ーン辞書当たり上記ヘッダ部と可変長の座標データ列で
構成されるのである。
【0103】以下、第1サブパターンの認識処理につい
て説明する。本処理は、入力された座標データ列から抽
出された特徴パターンに対するDPマッチング処理によ
って得られたマッチング距離distの近い順に、第50
位までの第1サブパターン候補を作成する処理である。
通常、オンライン手書き文字認識を行う場合は、この第
1サブパターン認識処理はユーザの入力動作と並列に前
認識処理として実現されるのであるが、本実施例におい
ては、説明を簡単にするために入力処理後の動作として
説明する(並列処理の方法については後述する)。
【0104】図16は、上記正規化部78,特徴抽出部
79,方向差判定部80,ストローク数限定部81,DP
マッチング部82およびサブパターン候補ソーティング
部83による第1サブパターン認識処理動作のフローチ
ャートである。以下、図16に従って、第1サブパター
ン認識処理動作について詳細に説明する。ステップS21
で、上記特徴抽出用記憶部73に設定された開始ストロ
ーク・カウンタststrkおよび終了ストローク・カウンタ
enstrkの内容が、夫々“1"に初期設定される。ステッ
プS22で、上記認識用記憶部74のサブパターン候補バ
ファの内容が初期化される。尚、上記サブパターン候補
バッファは、1候補当たり図17に示すような構造を有
している。また、本実施例において求められるサブパタ
ーン候補の数は“50"である。したがって、本実施例
におけるサブパターン候補バファは、図17に示す構造
が50個並んだメモリ容量/構造を有している。ここ
で、上記サブパターン候補バファの初期化では、50個
総てのDPマッチング距離の値に最大距離値maxdist(本
実施例では“255")をセットするのである。
【0105】ステップS23で、上記正規化部78によっ
て、“ststrk"番目のストロークから“enstrk"番目のス
トロークまでのストロークデータに対して、上述の正規
化処理が行われる。ステップS24で、上記特徴抽出部7
9によって、上記ステップS23における正規化処理後の
ストロークデータに対して上述の特徴抽出処理が行わ
れ、特徴パターンが得られる。こうして得られた特徴パ
ターンは、特徴抽出用記憶部73の特徴バッファに格納
される。ステップS25で、上記ストローク数限定部81
によって上記ストローク数限定処理が行われる。すなわ
ち、上記ステップS24において抽出された特徴量の1つ
である方向値dに基づいて屈曲点数pcが求められ、式
(18)に従ってストローク数slの限定範囲が算出される
のである。こうして得られたストローク数slの限定範囲
は、特徴抽出用記憶部73の入力データバッファに格納
される。ステップS26で、上記方向差判定部80によっ
て次ストロークへのオフ方向差が計算される。即ち、
“enstrk"番目のストロークの最終特徴点から“enstrk
+1"番目のストロークの先頭特徴点へのオフ方向が求
められ、このオフ方向と第1,第2軸の方向差dd1,dd2が
求められるのである。こうして得られた方向差dd1,dd2
の値は、特徴抽出用記憶部73の入力データバッファに
格納される。
【0106】ステップS27で、上述の各ステップで得ら
れて上記特徴バッファおよび入力データ・バッファ等に
格納されている各特徴点の座標データ列,ストローク数s
lの限定範囲,2つの方向差dd1・dd2,開始ストローク番
号および終了ストローク番号を入力データとして、上記
DPマッチング部82によって、後に詳述するようなサ
ブパターン認識処理サブルーチンが実行される。ステッ
プS28で、終了ストローク・カウンタenstrkの内容がイ
ンクリメントされる。ステップS29で、上記終了ストロ
ーク・カウンタenstrkの内容が、特徴抽出用記憶部73
の入力座標バッファにストロークデータが格納されてい
るストローク数以下であるか否かが判別される。その結
果、入力ストローク数rsより大きければステップS30に
進む。一方、入力ストローク数rs以下であれば上記ステ
ップS23に戻って、“ststrk"番目のストロークからイ
ンクリメント後の“enstrk"番目のストロークまでのス
トロークデータに対する正規化処理に移行する。こうし
て、ストローク数が上記入力ストローク数rsに至るまで
順次ストローク連鎖を成長しつつ、正規化処理,特徴抽
出処理,ストローク数限定処理,オフ方向差算出処理およ
びサブパターン認識処理が繰り返されるのである。
【0107】ステップS30で、サブパターン候補ソーテ
ィング部83によって、上記ステップS27におけるサブ
パターン認識処理の結果上記サブパターン候補バッファ
内に生成された第1サブパターン候補が、マッチング距
離distの小さい順にソーティングされる。そうした
後、第1サブパターン認識処理動作を終了して文字生成
処理動作に移行する。
【0108】図18は、上記サブパターン認識処理サブ
ルーチンのフローチャートである。以下、図18に従っ
て、上記DPマッチング部82によって実行されるサブ
パターン認識処理動作について詳細に説明する。ステッ
プS31で、上記入力データ・バッファに格納されている
ストローク数slの限定範囲が読み出され、この限定範囲
に基づいて、以下のようにしてサブパターン辞書からの
標準パターンを読み出す際の読み出し開始アドレスと読
み出し終了アドレスとが設定される。ここで、上記サブ
パターン辞書75は、上記正規のストローク数の小さい
順にソートされている。そして、このサブパターン辞書
75には、登録されている同一ストローク数を有する標
準パターンの先頭アドレスと終了アドレスとがストロー
ク数に対応付けられて成るテーブルが、付加情報として
登録されている。そこで、上記ストローク数slの限定範
囲の下限値に基づいて上記テーブルが参照されて、標準
パターンを読み出す際の読み出し開始アドレスが得られ
るのである。こうして設定された読み出し開始アドレス
が内部メモリに設定された開始ポインタdicpにセットさ
れる。ステップS32で、上記ストローク数slの限定範囲
の上限値に基づいて上記テーブルが参照されて標準パタ
ーンを読み出す際の読み出し終了アドレスが設定され
る。そして、上記内部メモリに設定された終了ポインタ
endpにセットされる。ステップS33で、上記サブパター
ン候補バッファにおける“距離部"内から最大距離が検
索される。そして、得られた最大距離が最大距離レジス
タmaxdistに格納される。
【0109】ステップS34で、上記サブパターン辞書7
5における開始ポインタdicpで指定されるアドレスから
ヘッダ部が読み出されて、内部メモリに格納される。ス
テップS35で、上記第1サブパターン認識処理動作のフ
ローチャート(図16参照)におけるステップS26におい
て求められた当該標準パターンの方向差dd1,dd2と上記
内部メモリ内の方向差情報とに基づいて、上述したスキ
ップ処理が行われる。そして、当該ヘッダ部に係る標準
パターンをDPマッチング処理の対象とせずに、次の標
準パターンにスキップするか否かが判定される。その結
果、スキップする場合にはステップS40に進み、スキッ
プしない場合にはステップS36に進む。ステップS36
で、当該特徴パターンと当該標準パターンとの上記DP
マッチング処理が実行されて、得られたマッチング距離
distは距離レジスタdistに格納される。ステップS37
で、上記距離レジスタdistの内容が最大距離レジスタma
xdistの内容以下であるか否かが判別される。その結
果、以下であればステップS38に進み、そうでなければ
ステップS40に進む。
【0110】ステップS38で、上記サブパターン候補バ
ッファにおける最大距離maxdistを呈するサブパターン
候補の情報が当該標準パターンの情報に書き換えられ
る。この情報書き換えは、次のように行われる。すなわ
ち、“距離部"には距離レジスタdistの内容が格納さ
れ、“開始ストローク部"には開始ストローク・カウン
タststrkの内容が格納され、“ストローク数部"には
(終了ストローク・カウンタenstrkの内容−開始ストロ
ーク・カウンタststrk+1)の演算結果が格納され、
“サブパターン・コード部"には当該ヘッダ部のサブパ
ターン・コードが格納される。ここで、上記最大距離ma
xdistを呈するサブパターン候補が複数存在する場合に
は、最小アドレスのサブパターン候補の情報が書き換え
られる。ステップS39で、上記サブパターン候補バッフ
ァにおける“距離部"内から最大距離が検索される。そ
して、得られた最大距離が最大距離レジスタmaxdistに
格納される。
【0111】ステップS40で、上記開始ポインタdicpの
内容がインクリメントされる。ステップS41で、上記開
始ポインタdicpの内容が終了ポインタendpに内容より小
さいか否かが判別される。その結果、小さければ上記ス
テップS34に戻って当該特徴パターンに対する次の標準
パターンを用いたDPマッチング処理に移行する。一
方、終了ポインタendp以上であれば、サブパターン認識
処理サブルーチンを終了してメインルーチンにリターン
する。
【0112】こうして、上記サブパターン認識処理サブ
ルーチンが終了すると、上記サブパターン候補バッファ
内には当該特徴パターンに類似した標準パターンから成
る最大50個のサブパターン候補が格納されるのであ
る。
【0113】図19は、上記正規化部78,特徴抽出部
79,ストローク数限定部81,DPマッチング部82,
文字生成部84,文字候補展開部87および文字候補ソ
ーティング部88による文字生成処理動作のフローチャ
ートである。以下、図19に従って、文字生成処理動作
について詳細に説明する。上記第1サブパターン認識処
理動作が終了すると文字生成処理動作がスタートする。
【0114】ステップS51で、上記第1サブパターン認
識処理動作によって得られて上記サブパターン候補バッ
ファ内に格納されている第1サブパターン認識結果の内
容によって、認識用記憶部74の文字候補バッファが初
期化される。この初期化は、次のように行われる。すな
わち、図20において、“距離部"には、上記サブパタ
ーン候補バッファの“距離部"の内容である“DPマッ
チング距離"が格納される。以下、同様に、“終了スト
ローク部"には、“ストローク数部"の内容である“入力
のストローク数"が格納される。また、“サブパターン
・コード部"には、“サブパターン・コード部"の内容で
ある“サブパターン・コード"が格納される。そして、
“サブパターン数部"には“1"が格納される。尚、上記
サブパターン・コード部のデータ長における記号Nsp
は、1文字を構成する最大サブパターン数であり、サブ
パターンの定義によって変動する(本実施例においては
“8")。
【0115】ここで、上記文字候補バッファは、図20
に示す構成が200個並ぶメモリ容量/構造である。ま
た、上記サブパターン候補バッファには最大50個の第
1サブパターン候補が格納されている。したがって、文
字候補バッファが初期化された段階では最大50個の文
字候補情報がDPマッチング距離distの近い順に書き
込まれることになる。図21は、文字「故」が“9"ス
トロークで手書き入力された際における初期化直後の文
字候補バッファの内容を模式的に示す。尚、図21で
は、見やすいように、図20の項目を並べ変えている。
【0116】ステップS52で、初期化後の上記文字候補
バッファにおける“終了ストローク数部"内から最小終
了ストローク数が検索される。そして、得られた最小終
了ストローク数が最小終了ストローク数レジスタminens
trkに格納される。その後、再度上記文字候補バッファ
が検索されて、最小終了ストローク数を有する第1サブ
パターン候補が選出される。ステップS53で、上記最小
終了ストローク数レジスタminenstrkの内容が入力スト
ローク数に等しいか否かが判別される。その結果、等し
ければステップS65に進み、等しくなければステップS
54に進む。図21に示す例においては、最小終了ストロ
ーク数“2"を有する第1サブパターン候補「十」,
「ナ」および「亠」が検索されて、入力ストローク数
“9"に等しくないと判定される。
【0117】ステップS54で、上記認識用記憶部74の
文字構成テーブルが参照されて、上記ステップS52にお
いて選択された第1サブパターン候補に続く第2サブパ
ターン候補が限定される。例えば、第1サブパターン候
補「十」,「ナ」および「亠」に続く第2サブパターン
候補としては、 第1サブパターン候補 第2サブパターン候補 「十」 → 「力(協)」,「兄(克)」,… 「ナ」 → 「ム(雄)」,「工(左)」,… 「亠」 → 「田(畝)」,「里(裏)」… 等に限定される。こうすることによって、第2サブパタ
ーン以降の入力パターンの認識の際のDPマッチング処
理の高速化を図るのである。
【0118】ステップS55で、上記開始ストローク・カ
ウンタststrkに“最小終了ストローク数レジスタminens
trkの内容+1"がセットされる。ステップS56で、上記
終了ストローク・カウンタenstrkに“最小終了ストロー
ク数レジスタminenstrkの内容+1"がセットされる。ス
テップS57で、上記第1サブパターン認識処理動作にお
ける上記ステップS22と同様にして、サブパターン候補
バファの内容が初期化される。ステップS58で、上記終
了ストローク・カウンタenstrkの内容が上記入力ストロ
ーク数よりも小さいか否かが判別される。その結果、入
力ストローク数よりも小さければステップS59に進み、
入力ストローク数以上であればステップS64に進む。
【0119】ステップS59〜ステップS63で、上記第1
サブパターン認識処理動作における上記ステップS23〜
ステップS25,ステップS27,ステップS28と同様にし
て、上記正規化処理,特徴抽出処理,ストローク数限定処
理,サブパターン認識処理サブルーチンおよび終了スト
ローク・カウンタenstrkインクリメントが実行されて、
上記ステップS58に戻る。尚、その際に、上記サブパタ
ーン認識処理時におけるDPマッチングでは、上記ステ
ップS54において限定されたサブパターンの標準パター
ンのみを用いて行われる。こうして、DPマッチングに
要する時間を極力少なくして、認識時間が短縮されるの
である。
【0120】こうして、上述の動作が、終了ストローク
・カウンタenstrkの内容が上記入力ストローク数以上に
なるまで行われる。そして、上記ステップS58において
終了ストローク・カウンタenstrkの内容が上記入力スト
ローク数以上であると判定されると、ステップS64に進
む。
【0121】ステップS64で、上記文字候補展開部87
によって、後に詳述するような文字展開処理サブルーチ
ンが実行されて上記ステップS52に戻る。以後、上述の
動作が、最小終了ストローク数レジスタminenstrkの内
容が入力ストローク数に等しくなるまで行われる。そし
て、上記ステップS53において最小終了ストローク数レ
ジスタminenstrkの内容が入力ストローク数に等しいと
判定されるとステップS65に進む。ステップS65で、上
記文字候補ソーティング部88によって、上記文字候補
バッファ内に生成された文字候補が距離の小さい順にソ
ーティングされて認識結果が得られ、文字生成処理動作
動作を終了する。
【0122】つまり、本文字生成処理においては、上記
第1サブパターン認識処理の結果得られた第1サブパタ
ーン候補のうち最小ストローク数の第1サブパターン候
補を選出し、この最小ストローク数の次のストローク数
を新たな開始ストローク数と見なして図16の第1スト
ローク認識処理動作を実行し、第1サブパターン候補に
続くサブパターン候補を求め、得られたサブパターン候
補に基づいて文字候補を生成するのである。
【0123】図22は、上記文字展開処理サブルーチン
のフローチャートである。以下、図22に従って、上記
文字候補展開部87によって実行される文字展開処理動
作について詳細に説明する。この文字展開処理は、上記
文字候補バッファとサブパターン候補バッファとの内容
を入力とし、上記文字構成テーブルを参照して、新たな
文字候補を作成する処理である。上記文字生成処理動作
のフローチャートの上記ステップS58において終了スト
ローク・カウンタenstrkの内容が入力ストローク数に等
しいと判別されると文字展開処理動作がスタートする。
【0124】ステップS71で、上記文字候補バッファに
おける“距離部"から最大距離が検索され、最大距離レ
ジスタmaxdistにセットされる。ステップS72で、上記
認識用記憶部74に設定された新文字候補カウンタnewc
countに、“現文字候補カウンタc countの内容(文字候
補バッファ内に生成された文字候補数)+1"がセットさ
れる。ステップS73で、上記認識用記憶部74に設定さ
れた文字候補カウンタccに初期値“1"がセットされ
る。
【0125】ステップS74で、文字候補カウンタccの内
容が現文字候補カウンタc countの内容以下であるか否
かが判別される。その結果、以下であればステップS75
に進み、そうでなければステップS86に進む。ステップ
S75で、上記文字候補バッファにおける“cc"番目の文
字候補の“終了ストローク数部"の内容(すなわち、終了
ストローク数)が、上記最小終了ストローク数レジスタm
inenstrkの内容(以下、注目終了ストローク数と言う)に
等しいか否かが判別される。その結果、等しい場合には
ステップS76に進み、等しくない場合にはステップS85
に進む。
【0126】ステップS76で、上記認識用記憶部74に
設定されたサブパターン候補カウンタscに初期値“1"
がセットされる。尚、上記サブパターン候補カウンタに
は、図19に示す文字生成処理動作の上記ステップS62
におけるサブパターン認識によって、第2サブパターン
以降のサブパターン候補が格納されている。ステップS
77で、サブパターン候補カウンタscの内容がサブパター
ン候補数以下であるか否かが判別される。その結果、以
下であればステップS78に進み、そうでなければステッ
プS85に進む。ステップS78で、上記文字候補バッファ
における“cc"番目の文字候補(複数存在する場合あり)
の“サブパターン・コード部"の内容と上記サブパター
ン候補バッファにおける“sc"番目のサブパターン候補
の“サブパターン・コード部"の内容とから成るサブパ
ターン・コード列が生成される。つまり、上記注目終了
ストローク数を呈する第1サブパターン候補とこれに続
くサブパターン候補とのサブパターン・コード列が生成
されるのである。
【0127】ステップS79で、上記文字構成テーブルが
参照されて、上記ステップS78において生成されたサブ
パターン・コード列を構成サブパターンとする文字が存
在するか否かが判別される。その結果、存在すればステ
ップS80に進み、無ければステップS84に進む。ステッ
プS80で、上記ステップS79において検索された文字に
係る平均距離cdistが、式(23)に従って算出される。
【0128】 c dist=〔[CDp-1・(p−1)]+SDp〕/p …(23) ここで、 p:対象とする文字を構成するサブパタ
ーン数 CDp-1:対象とする文字を構成する(p−1)番目まで
のサブパターン列で成る文字候補の平均距離 SDp:対象とする文字を構成するp番目のサブパター
ン候補のDPマッチング距離 ステップS81で、上記ステップS80において算出された
平均距離c distの値が最大距離レジスタmaxdistの内容
よりも大きいか否かが判別される。その結果、大きけれ
ばステップS84に進み、そうでなければステップS82に
進む。ステップS82で、上記ステップS79において検索
された文字が、現在得られている文字候補における最大
距離よりも小さいので、上記ステップS78において作成
されたサブパターン・コード列に基づいて新たな文字候
補(新文字候補)を作成して文字候補に追加する。尚、新
文字候補作成は具体的には以下のようにして行われる。
【0129】すなわち、上記文字候補バッファにおける
“new c count”番目の文字候補の“終了ストローク数
部"および“サブパターン数部"の内容として、“cc"番
目の文字候補の“終了ストローク数部"および“サブパ
ターン数部"の内容が複写される。次に、上記サブパタ
ーン候補バッファにおける“sc"番目のサブパターン候
補の内容に基づいて以下に示す処理が行われる。 ・上記文字候補バッファにおける“new c count"番目の
文字候補(以下、新文字候補と言う)の“距離部"には、
上記ステップS80において算出された平均距離cdistが
格納される。 ・上記新文字候補の“終了ストローク数部"には、“sc"
番目のサブパターン候補における“ストローク数部"の
内容が加算される。 ・上記新文字候補の“サブパターン数部"の内容に“1"
が加算される。 ・上記新文字候補の“サブパターン・コード部"の内容
の終端に、“sc"番目のサブパターン候補における“サ
ブパターン・コード部"の内容が追加される。 ・上記新文字候補の“サブパターン・コード部"の内容
に“sc"番目のサブパターン候補における“サブパター
ン・コード部"の内容を追加して得られたサブパターン
・コード列が上記文字構成テーブルにおける唯一のサブ
パターン・コード列である場合には、上記文字構成テー
ブルにおける当該サブパターン・コード列で構成される
文字のコードが上記新文字候補の“文字コード部"に格
納される。
【0130】ステップS83で、上記新文字候補カウンタ
new c countの内容がインクリメントされる。ステップ
S84で、上記サブパターン候補カウンタscの内容がイン
クリメントされた後上記ステップS77に戻る。こうし
て、上述の動作がサブパターン候補カウンタscの内容が
上記サブパターン候補数より大きくなるまで行われる。
そして、上記ステップS77においてサブパターン候補数
scの内容が上記サブパターン候補数より大きいと判定さ
れると、ステップS85に進む。ステップS85で、上記文
字候補カウンタccの内容がインクリメントされた後上記
ステップS74に戻る。こうして、上述の動作が、上記文
字候補カウンタccの内容が上記現文字候補カウンタc co
untの内容より大きくなるまで行われる。そして、上記
ステップS74において上記現文字候補カウンタc count
の内容より大きいと判定されると、ステップS86に進
む。
【0131】ステップS86で、文字候補の詰め込みが行
われる。ここで、上記文字候補の詰め込みは、以下のよ
うにして行われる。すなわち、上記文字展開処理が実行
されることによって、上記注目終了ストローク数を有す
る文字候補は、第2サブパターン以降のサブパターンが
付加されて、上記新文字候補として生まれ変わって新た
に登録されている。したがって、もはや上記注目終了ス
トローク数を有する文字候補は必要とはしないのであ
る。そこで、上記文字候補バッファにおける先頭の文字
候補から“c count"番目の文字候補までの文字候補のう
ち、上記注目終了ストローク数以下の終了ストローク数
を有する文字候補の数をカウントして文字候補消去数カ
ウンタe countにセットする。そうした後、上記注目終
了ストローク数以下の終了ストローク数を有する文字候
補を削除し、未消去の文字候補の格納領域を低アドレス
側の空き領域に順次移動するのである。ステップS87
で、上記文字候補消去数カウンタe countの内容に基づ
いて、現文字候補カウンタc countの内容が式(24)に
従って更新される。
【0132】 C COUNT=(NEW COUNT)−(E COUNT) …(24) ここで、 C COUNT:現文字候補カウンタc countの内容 NEW COUNT:新文字候補カウンタnew c countの内容 E COUNT:文字候補消去数カウンタe countの内容 そうした後、文字展開処理サブルーチンを終了して、上
記文字生成処理動作ルーチンにリターンする。
【0133】こうして、上記文字展開処理サブルーチン
が実行されることによって、上記第1サブパターン候補
のうち入力ストローク数に満たないサブパターン候補に
第2サブパターン候補以降のサブパターン候補が付加さ
れて、文字候補が得られるのである。
【0134】以下、上述の文字展開処理について、文字
「功」がストローク数“5"で手書き入力された場合を
例に、更に具体的に説明する。ここで、上記第1サブパ
ターン認識処理による結果、上記文字候補バッファの内
容が、図23に示すように初期化されているものとす
る。また、上記文字生成処理が最小終了スローク数mine
nstrk=3まで終了して、上記サブパターン候補バッフ
ァの内容が図24に示すようになっているものとする。
【0135】先ず、上記最大距離レジスタmaxdist=8
0がセットされ、新文字候補カウンタnew c count=現
文字候補カウンタc count+1=4がセットされる。…
ステップS71,S72 次に、上記文字候補カウンタcc=1がセットされ、この
セット値が現文字候補カウンタc count=4以下である
ので、文字候補バッファから“cc=1"番目のサブパタ
ーン候補「工」が読み出される。そして、当該サブパタ
ーン候補「工」の現在の終了ストローク数“3"が注目
終了ストローク数(=minenstrk=3)に一致するので、
サブパターン候補カウンタscを“1"から“サブパター
ン候補数=3"までインクリメントしつつサブパターン
候補バッファから第1サブパターン候補「工」に続くサ
ブパターン候補が検索される。そして、検索されたサブ
パターン候補「力」,「方」,「并」が第1サブパターン
候補「工」に付加されて、サブパターン・コード列
「工」,「力」と「工」,「方」と「工」,「并」とが生
成される。ところが、この場合には、サブパターン・コ
ード列「工」,「方」と「工」,「并」は文字構成テーブ
ルには存在しないので、サブパターン・コード列
「工」,「力」のみの平均距離c distが式(23)に従っ
て算出される。こうして、算出された平均距離cdist=
36が最大距離レジスタmaxdist=80より小さいの
で、新文字候補「工,力」が作成されて、図25に示す
ように、“new c count=4"番目の文字候補として登録
される。また、その“ストローク数部"には文字候補
「工」の終了ストローク数=3にサブパターン候補
「力」のストローク数=2を加算した“5"が格納さ
れ、“サブパターン数部"には文字候補「工」のサブパ
ターン数=1に“1"を加算した値“2"が格納され、新
文字候補カウンタnew c countが“5"にインクリメント
される。そうした後、上記文字候補カウンタccがインク
リメントされる。…ステップS73〜S84,ステップS77,
ステップS85 “cc=2"番目のサブパターン候補「土」の現在の終
了ストローク数“3"は注目終了ストローク数“3"に一
致するので、第1サブパターン候補「土」に続くサブパ
ターン候補が検索される。そして、サブパターン・コー
ド列「土」,「力」と「土」,「方」と「土」,「并」と
が生成される。ところが、この場合には、サブパターン
・コード列「土」,「力」と「土」,「并」は文字構成テ
ーブルには存在しないので、サブパターン・コード列
「土」,「方」のみの平均距離c distが算出される。そ
して、得られた平均距離c dist=61が最大距離レジス
タmaxdist=80より小さいので新文字候補「土,方」が
作成されて、図26に示すように、“new c count=5"
番目の文字候補として登録され、その“終了ストローク
数部"および“サブパターン数部"の内容が格納され、新
文字候補カウンタnewc countが“6"にインクリメント
される。そうした後、上記文字候補カウンタccがインク
リメントされる。…ステップS74〜S84,ステップS77,
ステップS85 “cc=3"番目のサブパターン候補「气」が読み出され
る。ところが、当該サブパターン候補「气」における現
在の終了ストローク数“4"が注目終了ストローク数=
3に一致しないので、文字候補カウンタccがインクリメ
ントされる。…ステップS74,S75,S85 以下、同様の処理が行われ、図26に示すような文字候
補が上記文字候補バッファ内に展開される。
【0136】次に、図26に示す文字候補バッファ内の
文字候補における“終了ストローク数"が注目終了スト
ローク数(=minenstrk=3)に等しい文字候補「工」,
「土」が削除されて残った文字候補が詰め込まれる。…
ステップS86 そうした後、上記文字生成処理動作にリターンして文字
候補がソーティングされた後、終了ストローク数が入力
ストローク数“5"に満たない文字候補「气」が削除さ
れる。その結果、図27に示すような文字候補が得られ
るのである。…ステップS65 上述のようにして第1サブパターン認識処理,文字生成
処理および文字展開処理が行われて、図27に示すよう
な文字候補が上記文字候補バッファ内に形成されると、
出力部85によって、第1位の文字候補「工,力」から
生成された認識結果「功」の文字コードが結果表示部7
6に送出されて表示されるのである。
【0137】このように、本実施例においては、上記サ
ブパターン辞書75に登録する標準パターンにはヘッダ
部を設け、このヘッダ部には、2つの軸との方向差の平
均値m1,m2と標準偏差値v1,v2を格納しておく。そし
て、上記方向差判定部80によって、次ストロークへの
オフ方向差をdd1,dd2を式(13)で算出し、この算出結
果dd1,dd2とサブパターン辞書75から読み出した標準
パターンに付加されている上記方向差の平均値m1,m2
および標準偏差値v1,v2とが式(16),(17)を満たさ
ないような標準パターンは、DPマッチングに有効では
ないと判定するようにしている。したがって、後にDP
マッチング部82によって行われるDPマッチング処理
は、有効な標準パターンのみを用いて迅速に行うことが
できるのである。
【0138】また、上記ストローク数限定部81によっ
て、式(18)に従って、DPマッチング処理の対象とな
っている特徴パターンの正規のストローク数をある範囲
に限定する。そして、DPマッチング部82によるDP
マッチング処理の際には、上記限定範囲内に入る標準パ
ターンのみを選択して用いるようにしている。したがっ
て、上記特徴パターンに類似した標準パターンのみを用
いて、上記DPマッチング処理を更に迅速に行うことが
できる。
【0139】また、文字と構成サブパターンとを対応付
けてなる文字構成テーブルを認識用記憶部74に登録
し、上記文字生成部84による文字生成処理に際して
は、上記文字構成テーブルを参照して、第1サブパター
ンの認識結果に続くサブパターンの候補を限定するよう
にしている。したがって、上記文字生成処理時における
DPマッチングに際して用いる標準パターンを上記限定
結果に従って絞り込むことができ、上記文字認識処理を
迅速に行うことができる。
【0140】すなわち、本実施例によれば、手書き入力
された文字の認識処理を高速に実施することが可能にな
る。このことは、単に認識結果を早く得ることを可能に
するのみならず、サブパターン辞書25に登録する標準
パターンのバリエーション数を増加して「続け字」や
「崩し字」に対する認識率を高めることを可能にするの
である。
【0141】上記各実施例では、説明を簡単にするため
に、第1〜第4実施例における特徴再抽出部8,18,3
8,58による特徴再抽出処理、あるいは、第5実施例
における特徴抽出処理や第1サブパターン認識処理は、
1文字分の入力パターンから抽出された特徴点の座標デ
ータ列が特徴格納部6,16,36,56に格納された
後、あるいは、1文字分の座標データ列や特徴パターン
が上記入力座標バッファや特徴バッファに格納された後
に、実行されるとして説明している。ところが、通常、
人間の1文字の筆記には2秒程度掛かるので、その筆記
時間を利用して上記特徴再抽出処理あるいは特徴抽出処
理や第1サブパターン認識処理を上述の入力処理と並列
して行うようにすれば、オンライン手書き文字認識が可
能となる。
【0142】その際には、第1〜第4実施例における特
徴格納部6,16,36,56、あるいは、第5実施例に
おける上記入力座標バッファ,特徴バッファ,入力データ
・バッファ等をデュアルポート・メモリで構成して、情
報の書き込みと読み出しとを平行に実行すればよい。
尚、このようなオンライン手書き文字認識処理は、上述
のように、手書き文字の認識処理を高速に実行可能にな
って初めて実現可能となるのである。
【0143】上記第1実施例における座標点間距離Nim
in,方向差Ndist,ストローク終了判定時間Ntime,正規
化範囲Nnorm,補間判定距離Nfmax,特徴点間限界距離N
flen,ノイズ判定距離Nfmin,ノイズ判定方向差Nddst、
あるいは、第5実施例における正規化範囲Nnorm,補間
間隔w,方向値量子化数D,直交2軸の方向値Rj,定数C
s,方向差重みWd,定数Cw,整合窓範囲ww等の数値はほん
の一例であり、認識精度や使用状況に応じて適切に設定
すればよい。また、上記各実施例は単独に実施されても
構わないが、適宜に組み合わせても一向に差し支えな
い。例えば、上記正規化前と正規化後とに特徴を抽出す
る第1実施例における前処理を第5実施例の前処理に適
用すること、あるいは、第3,第4実施例におけるDP
マッチングの重み変化を第5実施例におけるDPマッチ
ングに適用すること等が考えられる。
【0144】尚、第1実施例における前処理を第5実施
例の前処理に適用した際には、以下のように、続け字に
対して高い認識結果を得ることができる。すなわち、4
万字分の楷書の筆跡データから作成された約1万4千の
サブパターンの標準パターンをサブパターン辞書に登録
する。そして、複数画が続けて記入された約2万7千字
分の漢字の筆跡データ(約400字×67名)を入力し
て、手書き文字認識を行った。その結果、表1に示すよ
うに、第1位の認識候補での正解率は96.0%と高
く、第2位以下の認識候補を含めれば更に高く98.7
%の正解率を得ることができた。この正解率は、従来の
手書き認識装置(1993年 電子情報通信学会全国大
会,D578で発表)に比較して格段に高い値である。
【0145】
【表1】
【0146】また、上述したように、複数ストロークの
集合であるサブパターンを認識の単位とすることによっ
て辞書の容量を小さくできるのであるが、このことを具
体例を上げて説明する。ここで、・認識対象パターンは
「早」である。 ・パターン「早」を手書きする際に発生し得るストロー
クの種類の数は“18"である。 ・パターン「早」を構成するに際して組み合わせ得るス
トローク数とその場合の組み合わせ数は下記の通りであ
る。
【0147】 ストローク数 組み合わせ数 ストローク数 組み合わせ数 6 1 3 10 5 5 2 5 4 10 1 1 と仮定する。
【0148】(a) 従来の辞書(スロトーク辞書+パタ
ーン辞書) 従来の辞書では、パターン「早」を手書きする際に発生
し得る全てのストロークをストローク辞書に登録し、パ
ターン「早」を構成する全てのストロークの組み合わせ
をパターン辞書に登録している。 ・スロトーク辞書 1ストローク当たりの記憶容量を ストローク・コード = 2バイト ストロークを表現する16区間の方向列=16バイト 合計=18バイト とすると、発生し得るストローク数は“18"であるか
ら、ストローク辞書の必要最小容量は 18バイト×18ストローク=324バイト となる。
【0149】・パターン辞書 1パターン候補当たりの記憶容量を パターン・コード =2バイト ストローク数 =1バイト 方向情報 =4バイト ストローク・コード列 =2バイト×ストローク数 ストローク間の位置情報=1バイト×ストローク数 合計=7バイト+3バイト×ストローク数 とすると、組み合わせ得るストローク数とその場合に発
生する組み合わせ数とは上述の通りであるから、文字辞
書の必要最小容量は次のようになる。
【0150】1×(7バイト+3バイト×6ストローク)
+5×(7バイト+3バイト×5ストローク)+10×
(7バイト+3バイト×4ストローク)+10×(7バイ
ト+3バイト×3ストローク)+5×(7バイト+3バイ
ト×2ストローク)+1×(7バイト+3バイト×1スト
ローク)=560バイト となる。
【0151】 ・従来の辞書の必要最小容量 ストローク辞書の必要最小容量+パターン辞書の必要最小容量 =324バイト+560バイト =884バイト (b) 本実施例の辞書(サブパターン辞書) 本実施例の辞書では、図2(e)に示すサブパターン
「早」をサブパターン辞書に登録している。 ・サブパターン辞書 1サブパターン当たりの記憶容量を サブパターン・コード=2バイト ストローク数 =1バイト 座標数 =1バイト 方向情報 =4バイト 特徴データ =4バイト×特徴点数 合計=8バイト+4バイト×特徴点数 とすると、図2(e)における特徴点数は“20"であるか
ら、サブパターン辞書の必要最小容量は 8バイト+4バイト×20点=88バイト となる。
【0152】上述のように、統計上一筆書きされ易いパ
ターンをサブパターンとすることによって辞書容量を大
幅に縮小できるのである。したがって、サブパターンの
変形パターンを多量に登録することが可能になり、筆跡
パターンの認識率を大幅に向上できるのである。
【0153】
【発明の効果】以上より明らかなように、本発明の手書
き認識装置は、サブパターン及び各サブパターンの変形
パターンから求めた標準パターンを格納したサブパター
ン辞書と、オフストロークを補間するオフストローク補
間手段を有して、認識部は、複数スロトークとそのオフ
ストロークとに係る各特徴量を有する特徴点の列を一つ
の特徴パターンと見なして上記サブパターン辞書との照
合を行うので、「入り」,「跳ね」,「続け」等を有する
変形パターンの標準パターンを予め上記サブパターン辞
書に登録しておけば、安定して高い認識率で「続け字」
や「崩し字」を含む手書き文字等を認識できるのであ
る。さらに、統計上一筆書きされ易いサブパターンを辞
書照合の単位としているので、ストロークや1文字を単
位とする場合よりも照合辞書の容量を少なくでき、照合
速度を速めることができる。すなわち、この発明によれ
ば、電子手帳のようなプアーなハード構成における「続
け字」や「崩し字」のオンライン認識を容易に可能にす
るのである。
【0154】また、本発明の手書き認識装置における特
徴抽出部は、筆跡パターンにおける屈曲部の特徴点と特
徴量を抽出する第1特徴抽出部と、正規化後の特徴点間
を等間隔近似する特徴点と特徴量を抽出する第2特徴抽
出部を有するので、正規化前の座標データ列から屈曲部
の特徴点と特徴量を抽出できる。したがって、後の正規
化によって屈曲部の特徴が消滅したとしても屈曲部を表
す特徴点と特徴量を確実に抽出できる。さらに、上記正
規化によって屈曲部の特徴が消滅しないために、等分割
法と角度法とを併用した特徴抽出を行うことができ、筆
跡ストロークの特徴を適確に表す特徴量列を得ることが
できる。
【0155】また、本発明の手書き認識装置における認
識部は、距離算出手段によって、テーブルを引いて上記
特徴パターン上の各特徴点と標準パターン上の各特徴点
との特徴量の差を求め、この各差の値に基づいて上記両
パターンの距離を算出するので、テーブルを引くという
簡単な操作のみで両パターンの距離算出用の変数値を求
めることができる。したがって、この発明によれば、高
速な辞書照合が可能となる。
【0156】また、本発明の手書き認識装置における認
識部は、DPマッチング手段によって、照合の対象とな
るパターン上における特徴点間毎に変動重みを付けたD
Pマッチング処理を行うので、上記筆跡パターンのスト
ロークに沿った特徴の現れ方に応じて、DPマッチング
時における時間伸長特性を変更できる。したがって、こ
の発明によれば、上記筆跡パターンの特徴を強調したD
Pマッチングが可能となり、更なる認識率の向上を図る
ことができるのである。
【0157】また、本発明の手書き認識装置は、変動重
み算出部によって、複数の学習用特徴パターンと上記標
準パターンとのDPマッチング処理を行った際のマッチ
ングパス上の点に係るマッチング距離を求め、全学習用
特徴パターンに係るマッチング距離のばらつきの度合い
を上記変動重みとするので、安定して特徴点が得られる
区間を強調したDPマッチングが行われる。したがっ
て、この発明によれば、安定して高い認識率を得ること
ができる。
【0158】また、本発明の手書き認識装置は、変動重
み算出部によって、上記特徴パターン上の特徴点間の距
離と当該特徴パターンにおける全特徴点を入力順に結ぶ
距離との比の値を上記変動重みとするので、上記筆跡パ
ターンにおける屈曲部の特徴を強調したDPマッチング
が行われる。したがって、この発明によれば、屈曲部の
ずれを吸収して高い認識率を得ることができる。
【0159】また、本発明の手書き認識装置における認
識部は、サブパターン認識手段によって上記筆跡パター
ンをサブパターン毎に認識し、筆跡パターン認識手段に
よって、得られたサブパターン候補の組み合わせと代表
パターン構成テーブルとを照合して上記筆跡パターンを
認識するので、一筆書きされ易いサブパターン単位で認
識処理を行うことができる。したがって、この発明によ
れば、少ない認識候補で迅速に上記筆記パターンの認識
を行うことができる。さらに、「続け字」や「崩し字」
に対して強い手書き認識処理装置を提供できる。
【0160】また、本発明の手書き認識装置における特
徴抽出部は、屈曲部特徴抽出手段によって、上記座標デ
ータ列における座標点間を結んで成る直線の方向が所定
値以上変化する変化点を特徴点として抽出し、直線部特
徴抽出手段によってこの特徴点間を等間隔近似する特徴
点を抽出し、方向値算出手段によって各特徴点の方向値
を特徴量の一つとして算出するので、等分割法と角度法
とを併用した特徴点抽出を行うことができ、筆跡パター
ンの特徴を適確に表す特徴パターンを抽出することがで
きる。
【0161】また、本発明の手書き認識装置における認
識部は、特徴パターン選出手段によって、ストローク数
限定部で定められた範囲内のストローク数をヘッダ情報
とする標準パターンのみをサブパターン辞書から選出す
るので、類似性の高い標準パターンのみを用いて辞書照
合を迅速に行うことができる。
【0162】また、本発明の手書き認識装置における認
識部は、方向値算出手段によって、当該特徴パターンの
最終特徴点から次ストロークにおける先頭特徴点への方
向値を算出し、有効標準パターン判定手段によって、上
記算出された方向値が入る有効範囲をヘッダ情報とする
標準パターンのみを有効標準パターンと判定するので、
有効な標準パターンのみを用いて辞書照合を迅速に行う
ことができる。
【0163】また、本発明の手書き認識装置における認
識部は、標準パターン選出手段によって、認識済みサブ
パターン候補連鎖に続くことが可能なサブパターンを代
表パターン構成テーブルを参照して求め、得られたサブ
パターンの標準パターンのみをサブパターン辞書から選
出するので、有効な標準パターンのみを用いて辞書照合
を迅速に行うことができる。
【0164】また、本発明の手書き認識装置は、デュア
ルポート・メモリでなる入力座標バッファおよび特徴バ
ッファを有し、制御部の制御によって、上記特徴抽出部
および認識部を上記タブレットと平行動作させるので、
上記入力座標バッファに対する上記タブレットによる座
標データ列の書き込みと上記特徴抽出部による読み出
し、および、上記特徴バッファに対する上記特徴抽出部
による特徴パターンの書き込みと上記認識部による読み
出しを、平行して行うことができる。したがって、この
発明によれば、上記特徴抽出処理および認識処理と上記
座標データ列生成処理とを平行して実行することがで
き、オンライン筆跡パターン認識を高速に行うことがで
きる。すなわち、この発明は、電子手帳のようなプアー
なハード構成による「続け字」や「崩し字」のオンライ
ン認識を容易に実現させるのである。
【図面の簡単な説明】
【図1】この発明の手書き認識装置の第1実施例におけ
るブロック図である。
【図2】サブパターンの一例を示す図である。
【図3】上下に分離可能なサブパターンにおける認識結
果の一例を示す図である。
【図4】文字辞書の構成例を示す図である。
【図5】第1実施例における手書き認識処理動作のフロ
ーチャートである。
【図6】図1におけるストローク処理部による特徴点抽
出の説明図である。
【図7】入力座標列と特徴点列との対応図である。
【図8】この発明の手書き認識装置の第2実施例におけ
るブロック図である。
【図9】絶対差テーブルおよび距離テーブルの説明図で
ある。
【図10】方向差テーブルの説明図である。
【図11】この発明の手書き認識装置の第3実施例にお
けるブロック図である。
【図12】この発明の手書き認識装置の第4実施例にお
けるブロック図である。
【図13】この発明の手書き認識装置の第5実施例にお
けるブロック図である。
【図14】図13における制御部の制御の下に行われる
手書き文字認識処理動作のゼネラルフローを示すフロー
チャートである。
【図15】図13におけるサブパターン辞書に付加され
たヘッダの構造の説明図である。
【図16】第1サブパターン認識処理動作のフローチャ
ートである。
【図17】サブパターン候補バッファの構造の説明図で
ある。
【図18】サブパターン認識処理サブルーチンのフロー
チャートである。
【図19】文字生成処理動作のフローチャートである。
【図20】文字候補バッファの構造の説明図である。
【図21】初期化後における文字候補バッファの内容の
一例を示す模式図である。
【図22】文字展開処理サブルーチンのフローチャート
である。
【図23】図21とは異なる初期化後における文字候補
バッファの内容を示す模式図である。
【図24】図23に示す文字候補バッファの内容に対応
するサブパターン候補バッファの内容を示す模式図であ
る。
【図25】文字展開処理動作時における図23に示す文
字候補バッファの内容の変遷を示す図である。
【図26】図25に続く文字候補バッファの内容の変遷
を示す図である。
【図27】図26に示す文字候補バッファの内容に対し
て文字候補の詰め込みおよびソーティングが行われた際
の文字候補バッファの内容を示す図である。
【図28】従来の特徴点に対する正規化処理の影響の説
明図である。
【符号の説明】
1,11,31,51,71…認識部、2,12,32,52,
72…タブレット、3,13,33,53,76…結果表示
部、5,15,35,55…ストローク処理部、6,16,
36,56…特徴格納部、8,18,38,58…特徴再抽
出部、9,19,39,59…文字認識部、10,20,4
0,60…辞書格納部、41,61…重み算出部、73…
特徴抽出用記憶部、74…認識用記憶部、75…サブパ
ターン辞書、78…正規化部、79…特徴抽出部、80
…方向差判定部、81…ストローク数限定部、82…D
Pマッチング部、84…文字生成部、86…制御部、8
7…文字候補展開部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 桑田 みな子 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 (72)発明者 北村 義弘 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内 Fターム(参考) 5B064 AA01 AB04 AB16 BA05 CA09 CA11 DA21 DD09 DD14 DD16 DD18 FA04 5B068 AA02 BB00 BD02 CC19

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 手書き入力された筆跡の座標を時系列に
    配列して成る座標データ列を生成する座標データ生成部
    と、上記座標データ列から筆跡パターンの特徴点列を抽
    出する特徴抽出部と、特徴点列から成る複数のサブパタ
    ーンが登録されたサブパターン辞書及び該サブパターン
    と文字とを対応付けた文字辞書が格納された辞書格納部
    と、上記筆跡パターンの特徴点列と上記複数のサブパタ
    ーンの特徴点列とを照合してサブパターンを認識し、該
    認識されたサブパターンと文字辞書とを照合して上記筆
    跡パターンの文字を認識する認識部と、を備える手書き
    認識装置であって、 上記サブパターン辞書に登録されたサブパターンは、一
    筆書きされ得るパターンのストロークの特徴点及び該ス
    トローク間を補完するオフストロークの特徴点から成る
    特徴点列のパターンであり、 上記特徴抽出部で抽出された特徴点列は、抽出された筆
    跡パターンのストロークの特徴点及び該ストローク間を
    補完するオフストロークの特徴点から成る特徴点列であ
    ることを特徴とする手書き認識装置。
  2. 【請求項2】 1文字の入力が終了したか否かを判定す
    る文字終了判定部を備え、 上記特徴抽出部は、上記文字終了判定部が1文字の入力
    が終了したと判定した場合に、上記特徴点列から1文字
    分の特徴点列を抽出することを特徴とする請求項1に記
    載の手書き認識装置。
  3. 【請求項3】 手書き入力された筆跡の座標を時系列に
    配列して成る座標データ列を生成するステップと、 上記座標データ列から筆跡パターンの特徴点列を抽出す
    るステップと、 上記筆跡パターンの特徴点列と予め登録されている複数
    のサブパターンの特徴点列とを照合して、サブパターン
    を認識するステップと、 上記認識されたサブパターンと予め登録されている複数
    の文字とを照合して、上記筆跡パターンの文字を認識す
    るステップと、を備える手書き認識方法であって、 上記サブパターンは、一筆書きされ得るパターンのスト
    ロークの特徴点及び該ストローク間を補完するオフスト
    ロークの特徴点から成る特徴点列のパターンであり、 上記筆跡パターンの特徴点列は、抽出された筆跡パター
    ンのストロークの特徴点及び該ストローク間を補完する
    オフストロークの特徴点から成る特徴点列であることを
    特徴とする手書き認識方法。
JP2001114744A 2001-04-13 2001-04-13 手書き認識装置及び手書き認識方法 Pending JP2001357356A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001114744A JP2001357356A (ja) 2001-04-13 2001-04-13 手書き認識装置及び手書き認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001114744A JP2001357356A (ja) 2001-04-13 2001-04-13 手書き認識装置及び手書き認識方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP05152395A Division JP3445680B2 (ja) 1995-03-10 1995-03-10 手書き認識装置

Publications (1)

Publication Number Publication Date
JP2001357356A true JP2001357356A (ja) 2001-12-26

Family

ID=18965758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001114744A Pending JP2001357356A (ja) 2001-04-13 2001-04-13 手書き認識装置及び手書き認識方法

Country Status (1)

Country Link
JP (1) JP2001357356A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027778A (ja) * 2010-07-26 2012-02-09 Casio Comput Co Ltd 文字認識装置及びプログラム
US8538156B2 (en) 2010-07-26 2013-09-17 Casio Computer Co., Ltd. Character recognition device and recording medium
WO2019049187A1 (ja) * 2017-09-05 2019-03-14 富士通株式会社 プログラム、情報処理装置、及び情報処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027778A (ja) * 2010-07-26 2012-02-09 Casio Comput Co Ltd 文字認識装置及びプログラム
US8538156B2 (en) 2010-07-26 2013-09-17 Casio Computer Co., Ltd. Character recognition device and recording medium
US8571321B2 (en) 2010-07-26 2013-10-29 Casio Computer Co., Ltd. Character recognition device and recording medium
WO2019049187A1 (ja) * 2017-09-05 2019-03-14 富士通株式会社 プログラム、情報処理装置、及び情報処理方法

Similar Documents

Publication Publication Date Title
US5742705A (en) Method and apparatus for character recognition of handwritten input
US7013046B2 (en) Apparatus, method, and program for handwriting recognition
US5454046A (en) Universal symbolic handwriting recognition system
US6289124B1 (en) Method and system of handwritten-character recognition
US6898315B2 (en) Feature extraction for real-time pattern recognition using single curve per pattern analysis
US7336827B2 (en) System, process and software arrangement for recognizing handwritten characters
CN101128837A (zh) 基于分割的辨认方法
JPH08180139A (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
US6385339B1 (en) Collaborative learning system and pattern recognition method
US5812696A (en) Character recognizing method and apparatus
US8009915B2 (en) Recognition of mathematical expressions
US20040141646A1 (en) Arabic handwriting recognition using feature matching
CN101354749B (zh) 字典制作方法、手写输入方法和设备
JP3445680B2 (ja) 手書き認識装置
Singh et al. Online handwritten Gurmukhi words recognition: An inclusive study
JP2001357356A (ja) 手書き認識装置及び手書き認識方法
Tung et al. Stroke-order-free on-line Chinese character recognition by stroke adjustment of two-layer bipartite weighted matching
JP3470028B2 (ja) 手書き文字認識装置およびプログラム記憶媒体
JP2762472B2 (ja) 文字認識方法および文字認識装置
JP2000163514A (ja) 文字認識方法、文字認識装置および記憶媒体
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JP3221488B2 (ja) 検証機能付きオンライン文字認識装置
JPH08129614A (ja) 文字認識装置
JP3290097B2 (ja) ストロークの判定方法および判定装置
JPH10247221A (ja) オンライン文字認識装置