JPH10214312A

JPH10214312A - オンライン手書き文字認識装置

Info

Publication number: JPH10214312A
Application number: JP9015035A
Authority: JP
Inventors: Soshiro Kuzunuki; 壮四郎葛貫; Toshimi Yokota; 登志美横田; Akihiro Katsura; 晃洋桂; Masayuki Ishida; 正幸石田; Kayoko Taki; かよ子瀧; Ryunosuke Murao; 龍之介村尾
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1997-01-29
Filing date: 1997-01-29
Publication date: 1998-08-11
Anticipated expiration: 2017-01-29
Also published as: JP3470541B2

Abstract

(57)【要約】【課題】楷書入力から続け字入力までを認識できるオン
ライン手書き文字認識装置の提供。【解決手段】手書き座標列から特徴点を抽出し、辞書パ
ターンを分類比較して手書き文字を認識する認識部し、
認識した結果を表示するオンライン手書き文字認識装置
において、座標点列の複数の点列から、特徴量を求め、
しきい値と比較して手書き座標の特徴点を抽出する特徴
抽出部１００と、オフストロークを含む標準文字パター
ンを登録した認識辞書部４００，入力パターンと辞書パ
ターンの各々に対し、上下左右の４方向のベクトルに対
応させた対応点を元に、順次マッチング処理するバック
ボーンベクトル対応マッチング部２００で構成した。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、オンラインの手書
き文字認識装置に関し、特に、楷書入力から一筆書きし
たような続け入力に対しも、辞書サイズが少なく、か
つ、高性能に認識できる手書き文字認識装置に関する。

【０００２】

【従来の技術】オンライン手書き文字認識装置の文字認
識方式には、入力制限方式からの分類として、（１）画
数，筆順を固定にする方式、（２）どちらかをフリーに
する方式、（３）どちらの制限もなくフリーにする方式
がある。一方、アルゴリズムからの分類として、（４）
ストロークの構造を解析する構造解析方式、（５）スト
ロークの特徴点を辞書とパターンマッチングするパター
ンマッチング方式がある。それぞれ特徴があり、性能と
兼ね合いで決められる。

【０００３】一般に、認識時間の関係から、（１）また
は（２）の方式が、また、辞書の学習の観点から、
（５）の方式が多く用いられている。

【０００４】従来、これらの続け字に対応するため、一
般によく行われている手法に、楷書の標準パターン（辞
書）の他に、続け字の標準パターンも登録しておく方法
がある。

【０００５】続け字の標準パターンを登録しない方法と
して、特開昭57−45679号，特開平8−249424号に示すよ
うに、オンストロークのみならず、オフストローク（ペ
ンアップ中のストローク）をも仮想的に仮結合して（一
筆書きにして）、そのストロークを等分割、あるいは、
等間隔に特徴点を抽出し、これを辞書とマッチングする
方式がある。

【０００６】一方、特徴点の対応方式には、前述の特開
平8−249424 号公報に記載されているような、特徴点を
ダイナミックプログラミング（ＤＰ）方式により、入力
パターンと辞書パターンの対応をとり、距離値を計算す
る方式と、電子通信学会研究会論文、ＰＲＬ８４−６８
（１９８５．１．２５），ＰＰ１９−ＰＰ２６，“オン
ライン文字認識における標準文字と続け字との対応点抽
出法”にあるようにオフストロークの安定性に着目し
て、オフストロークとの対応点を抽出して続け字を認識
する方式がある。

【０００７】また、ストロークの特徴点を抽出する方法
に、従来、情報処理学会論文誌第２７巻第５号（昭和６
１年５月）、ＰＰ４９２−ＰＰ４９８，“画数，筆順，
回転，区切りに依存しないオンライン手書き図形認識方
式”にあるように、面積法を用いて、手ぶれや、座標入
力装置のノイズ等の影響を受けない方法が考案されてい
る。別な方式として、前述の特開平8−249424 号公報に
記載されているように、ストロークを追跡して所定角度
以上の曲がり角度点を特徴点とする角度法がある。

【０００８】また、一般に、マッチング処理では、どう
しても認識できない文字群に対し、カテゴリ別の詳細識
別方式が用いられる。たとえば、電子情報通信学会論文
誌、Ｄ−２，ＮＯ．４，ＰＰ５９２−５９９、“マルチ
メディア端末用手書き入力インタフェースの設計とその
応用”には、ストロークの終了方向(“れ”と“わ”)、
ストロークの始点位置（“カ”と“刀”）、画数の差
（“ば”と“ぱ”）等の１７５の特徴関数を用いて判定
し、認識性能を向上させている。さらに、特開昭５５−
３３２４５号公報には、ストローク対の交叉を検出し、
識別している（例えば“に”と“土”と“上”）ことが
記載されている。

【０００９】最近、携帯情報端末（ＰＤＡ：Personal D
igtal Assisitant）が普及してきているが、一般に、画
数や筆順をフリーにすると認識時間も多く要し、認識速
度を快適にするためには、文字認識中は、クロック速度
をシステムの最高速度で動作させている。

【００１０】

【発明が解決しようとする課題】上記、従来技術の続け
字を認識の方法では、下記のような問題点がある。

【００１１】第１に、いろいろな続け字を標準パターン
に登録すると辞書サイズが大きくなり、かつ、認識速度
や、認識率の低下が発生してくる問題がある。

【００１２】第２に、オフストロークをも含めて近似点
を生成する方式では、続け字を辞書に登録しない代わ
り、オフストロークの近似点も登録するため、同様に、
辞書サイズが大きくなるという問題点がある。同様に、
辞書サイズが大きくなれば、認識速度も遅くなる。

【００１３】第３に、オフストローク対応点抽出方式で
は、続け字の認識が、オフストロークに依存するという
問題点がある。したがって、標準パターンのオフストロ
ークから、入力パターンのオフストロークを推測するな
どが必要になり、推測ミスや、処理時間がかかるという
問題がある。同様に、近似点をＤＰ方式で辞書と対応さ
せる方式も時間が多く要するなど問題点がある。

【００１４】第４に、ストロークの特徴点を抽出する場
合、面積抽出法では、ノイズには強いが、鋭角の抽出が
できない問題がある。一方、角度抽出法では、ノイズの
影響が受け易いという問題点がある。

【００１５】第５に、入力が続け字されると詳細識別の
ための情報、たとえば、ループの個数や、クロス位置が
曖昧になり、詳細識別が困難になるなど問題を生じてい
た。第６に、パーソナルな携帯端末では、楷書入力する
代わり、快適な認識速度の提供が欲しい場合がある。一
方、認識速度を犠牲にするが、くずし字も認識して欲し
いなど、柔軟に設定できなかった。認識時間を速くする
ためには、高性能なＣＰＵを使用するか、ダイナミック
にシステムクロックを上げるなどしなければならない。
しかし、当然、認識速度と、電池の寿命時間とのトレー
ドオフの関係になる。このように、従来のシステムで
は、ユーザの手書き入力状態、すなわち、くずし度合い
に応じて、認識速度全体を変化させることはできないな
ど、マンマシン性に問題があった。

【００１６】本発明では、辞書サイズが少なく、特徴点
を安定して抽出でき、かつ、文字の骨格情報を利用し
て、楷書入力から続け字入力までを高性能に認識できる
オンライン手書き文字文字認識装置を提供するにある。
また、ユーザの入力パターンのくずし字の度合いと認識
速度を対応させることのできるオンライン手書き文字文
字認識装置を提供するにある。

【００１７】

【課題を解決するための手段】本発明は、上記目的を達
成するために、手書き座標を入力する座標入力装置、上
記手書き座標列から特徴点を抽出する特徴抽出部、上記
特徴抽出部から得られた特徴パターンと、辞書パターン
を分類比較して手書き文字を認識する認識部、認識した
結果を表示する認識結果表示部を備えたオンライン手書
き文字認識装置において、前記座標点列の複数の点列か
ら、特徴量を求め、しきい値と比較して手書き座標の特
徴点を抽出する特徴抽出部、オフストロークを含む標準
文字パターンを登録した認識辞書部、入力パターンと辞
書パターンの各々に対し、上下左右の４方向のベクトル
に対応させた対応点を元に、順次マッチング処理するバ
ックボーンベクトル対応マッチング部で構成したことを
特徴としている。

【００１８】さらに、前記バックボーンベクトル対応マ
ッチング部で得られた認識候補文字群に対して、辞書の
オフストローク情報を付加して入力文字パターンの特定
部分を識別する詳細識別部を設けたことを特徴としてい
る。

【００１９】手書き座標列から特徴点を抽出する特徴抽
出部は、複数点列でなる面積および角度変情報で検出す
ることを特徴としている。

【００２０】また、分類比較して手書き文字を認識する
認識部の分類として、辞書パターンと入力パターンのス
トローク長差で行う認識部であることを特徴としてい
る。

【００２１】また、くずし度設定部を設け、前記くずし
度設定部で設定した値と手書き文字を認識する認識部の
分類のしきい値を制御するようにしたことを特徴とす
る。さらに、辞書パターンと入力パターンの特徴量か
ら、くずし度を求め、このくずし度から、前記手書き文
字認識装置のシステムクロックを制御する手段を設けた
ことを特徴とする。

【００２２】

【発明の実施の形態】以下、本発明の一実施例を図１〜
図２１を用いて説明する。

【００２３】図１は、本発明の一実施例の全体ブロック
構成を示したものである。１は座標入力装置ＴＢ、２は
液晶装置ＬＣＤである。１と２のデバイスは積層してあ
る。座標入力装置ＴＢの座標はストローク入出力部４で
検出し、その筆跡はフィードバックされ、ペン３の動き
に応じて表示するようになっている。入力されたストロ
ーク座標点列は、文字認識部５に入力し、文字候補とし
て出力する。出力された文字候補群は日本語処理部６に
入力し、日本語として意味があるかどうか、日本語辞書
部７を参照して判定し、その結果を認識結果表示部８に
表示する。文字認識部５は、座標点列から特徴を抽出す
る特徴抽出部１００，抽出された特徴点はバックボーン
ベクトル対応マッチング部２００で文字の骨格として対
応点を検出し、認識辞書部４００とマッチング処理す
る。さらに、候補文字群の中から、詳細識別部３００で
詳細識別処理して、認識性能を向上させている。

【００２４】また、もう１つの特徴であるくずし度設定
部９では、ユーザから、図１９に示すようなアイコンを
用いて、楷書入力か、あるいは、続け字入力かを設定
し、これにより、認識処理速度を柔軟に変えることがで
きる。すなわち、楷書入力では、認識速度が速くなり、
続け字入力では、認識レベルを詳細に識別するが、処理
速度は多く要するようになっている。勿論、図１９のア
イコンでその中間の値も設定できるようになっている。

【００２５】次に、本発明の一実施例であるハードウエ
ア構成を図２により説明する。図２において、コンピュ
ータ（ＣＰＵ）１０のバスには、座標入力コントローラ
（ＴＢＣ）１１，液晶コントローラ（ＬＣＤＣ）１２，
メモリ（ＭＥＭ）１３，外部との通信コントローラ（Ｎ
ＥＴ）１４が接続されている。なお、メモリ（ＭＥＭ）
１３には、オペレーテイングシステム（ＯＳ）やプログ
ラム、さらに各種辞書が格納されている。

【００２６】以下、図１のブロック構成の内、特徴部分
である文字認識部５の詳細フローを説明する。

【００２７】図３は、入力された座標点列（ストロー
ク）の特徴点（近似点）を抽出する特徴抽出部１００の
詳細フローである。まず、入力された座標点列（例：
日）を正規化するため、オフストロークも端点を接続す
る１筆化処理をおこなう（ステップ１１０）。次に、オ
フストロークも含めたリサンプリング処理を行う（ステ
ップ１２０）。この処理は、等間隔に座標を補間するも
ので、入力された座標点列のサンプル速度や、入力速度
の影響をなくすためにある。次に、ステップ１３０で正
規化処理を行う。これは、以下のように計算する。先ほ
ど求めたリサンプリング座標点列の長さを全て加算し、
それを座標点列数で除算することで、重心位置を計算す
る。次に、リサンプリングした座標点列のＸ，Ｙ軸の最
大最小値から、入力データのサイズを求め、先ほど求め
た重心位置とで正規化を行う。図３の例では、左下に小
さく入力された座標点列（ステップ１２０）が、正規化
され枠の中心に、大きく正規化されていることがわか
る。このようにすることにより、入力位置や入力サイズ
による影響を軽減している。なお、オフストロークも含
めないで重心位置を求めると、離れた位置に入力された
ストロークにより、重心位置が大きく影響する。このた
め、本発明の一実施例のように、オフストロークも含め
て、一旦、リサンプリングし、この点列を用いて重心位
置を求めている。

【００２８】次に、認識のための特徴点を求める近似化
処理を行う（ステップ１４０）。この処理は、文字の特
徴点を求める処理であり、後述のマッチング処理と大い
に関係する。特徴点を、等間隔や、等分割で求める方法
は、処理は簡単であるが、特徴点が多くなり、辞書サイ
ズが大きくなる欠点がある。したがって、本発明の一実
施例では、文字の形を表すに必要な最低限の特徴点を抽
出することにする。これは、直線部分は端点のみとし、
曲がりの部分は、複数の点で構成するようにすればよ
い。したがって、オフストロークには近似点は存在しな
い。図４を用いて、以下説明する。

【００２９】図４は、入力された座標点列の一部を拡大
したもので、開始点Ｐｓ、から始まり、Ｐａ，Ｐｂ，Ｐ
ｃ，Ｐｄ…と続くものとする。ここで、本発明の一実施
例では、面積法と角度法の２つを併用して特徴点を求め
ることにする。今、開始点Ｐｓも含め、順次入力された
３つの座標点列から構成される三角形の面積をΔSa，Δ
Ｓｂ，ΔＳｃ，…、三角形の内角をθａ，θｂ，θｃ，
…とすると、下記判定式のいずれかが成り立つときに、
特徴点とする。

【００３０】(1）（累積面積（ΔＳａ＋ΔＳｂ＋ΔＳｃ
＋…）＞しきい値ＴＨ１）and（三角形の内角（θ
ａ，θｂ，θｃ，…）＞しきい値ＴＨ２）になった
点と特徴点とする。

【００３１】(2）三角形の内角（θａ，θｂ，θｃ，
…）＜しきい値ＴＨ２になった点と特徴点とする。

【００３２】以上のように、累積面積が大きく、かつ、
内角がしきい値より大きいときの条件は、曲線の検出に
良好に働く。さらに、三角形の内角がしきい値より、小
さいとき、これもまた、特徴点とすることで、折り返し
のあるストロークの先頭も特徴点として検出できる。

【００３３】図５は、この近似化処理１４０の具体的フ
ローを説明したものである。まず、累積面積Ｓｔをクリ
アし、また、開始点Ｐｓをリードして、座標バッファＰ
(１)に格納する（ステップ１４１）。次の座標点Ｐａ，
Ｐｂもリードし、座標バッファＰ（２），Ｐ（３）に格
納する（ステップ１４２）。３点の座標から、面積ΔＳ
を計算し、累積面積Ｓｔを演算する（ステップ１４
３）。同様に、３点の座標から内角θを計算する（ステ
ップ１４４）。次に、上記求めた累積面積Ｓｔと内角θ
をしきい値ＴＨ１，ＴＨ２と各々比較する（ステップ１
４５）。もし、条件がいずれも成立しないとき、次の座
標点Ｐｃをリードし、次の３点の座標を準備しておく
（ステップ１４６）。前記条件が成立したとき、最後に
取り込んだ座標の１つ前を近似点として格納する（ステ
ップ１４７）。最後に、全サンプル点の座標終了かどう
か判定し（ステップ１４８）、もし、終了していなかっ
たら、求めた近似点を新たな開始点に設定し、次の近似
点を求める(ステップ１４９)。以上のように、本発明で
は、面積法と角度法を用いて、近似点を求めた。

【００３４】次に、本発明の特徴的処理であるバックボ
ーンベクトル対応マッチング処理を説明する。最初に、
そのコンセプトを説明する。文字の形は基本的には、図
６に示すような、左右，上下の４つの方向のバックボー
ンで構成される（ｄ１，ｄ２，ｄ３，ｄ４）。そして、
斜め方向は、そのバックボーンベクトルの補助ベクトル
（ｄ１２，ｄ２３，ｄ３４，ｄ４１）とする。この補助
ベクトルは、中間的ベクトルであるため、両側のバック
ボーンベクトルのいずれにもなりうるものとする。

【００３５】上記バックボーンベクトルを用いて、入力
されたストロークの近似点と辞書の近似点をどのように
対応させるかを、図７〜図１０の各ケースで説明する。
それぞれの図において、○印は辞書パターンの近似点、
●印は入力パターンの近似点である。隣り合う近似点間
のベクトルを、辞書パターンはａ１，ａ２ベクトル、入
力パターンはｂ１，ｂ２ベクトルとする。対応点の処理
は、次のようにする。 (1）最初に、先頭のベクトルａ１，ｂ１を対応するもの
とする（■印）。

【００３６】(2）以下、辞書パターンと入力パターンの
方向により、ベクトルの比較，入力パターンベクトルの
前進，辞書パターンベクトルの前進を行う。

【００３７】(3）近似点がなくなるまで、上記(2）を処
理する。

【００３８】では、図７の例から説明する。まず、ベク
トルａ１，ｂ１が最初に対応するとして、１つ先のａ
２，ｂ２のベクトルを比較し、同一方向（（図６のｄ
１）であるとき、仮対応するものとしてａ２，ｂ２に前
進させる（□印）。

【００３９】図８の例では、同様に、ベクトルａ１，ｂ
１が最初に対応し、次に、１つ先のａ２の方向をｂ１と
判定し、同一ベクトルならば、ａ２を仮対応するとして
前進させる。

【００４０】図９は、入力パターンのベクトルと辞書パ
ターンのベクトルが逆方向のときの例である。

【００４１】図７と同様に、ベクトルａ１，ｂ１が最初
に対応するとし、ｂ２ベクトルは、辞書ベクトルａ２と
は逆方向のため対応しない。次に、１つ先の辞書ベクト
ルａ３を、ｂ２ベクトルと比較し、同じであれば、ａ２
ベクトルを進め、ａ３ベクトルをｂ２ベクトルと仮対応
するものとする。

【００４２】図１０の例は、辞書パターンのベクトルａ
１，ａ２，ａ３を、次々に前進させ、入力パターンのベ
クトルｂ１と仮対応させた例である。

【００４３】以上のように、基本的に４方向のバックボ
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なＤＰマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。

【００４４】図１１は、（ａ）入力パターンと、(ｂ）
“日”の辞書パターン、(ｃ）“区”上記バックボーン
ベクトルを用いて、入力されたストロークの近似点と辞
書の近似点をどのように対応させるかを、図７〜図１０
の各ケースで説明する。それぞれの図において、○印は
辞書パターンの近似点、●印は入力パターンの近似点で
ある。隣り合う近似点間のベクトルを、辞書パターンは
ａ１，ａ２ベクトル、入力パターンはｂ１，ｂ２ベクト
ルとする。対応点の処理は、次のようにする。 (1）最初に、先頭のベクトルａ１，ｂ１を対応するもの
とする（■印）。

【００４５】(2）以下、辞書パターンと入力パターンの
方向により、ベクトルの比較，入力パターンベクトルの
前進，辞書パターンベクトルの前進を行う。

【００４６】(3）近似点がなくなるまで、上記(2）を処
理する。

【００４７】では、図７の例から説明する。まず、ベク
トルａ１，ｂ１が最初に対応するとして、１つ先のａ
２，ｂ２のベクトルを比較し、同一方向（（図６のｄ
１）であるとき、仮対応するものとしてａ２，ｂ２に前
進させる（□印）。

【００４８】図８の例では、同様に、ベクトルａ１，ｂ
１が最初に対応し、次に、１つ先のａ２の方向をｂ１と
判定し、同一ベクトルならば、ａ２を仮対応するとして
前進させる。

【００４９】図９は、入力パターンのベクトルと辞書パ
ターンのベクトルが逆方向のときの例である。

【００５０】図７と同様に、ベクトルａ１，ｂ１が最初
に対応するとし、ｂ２ベクトルは、辞書ベクトルａ２と
は逆方向のため対応しない。次に、１つ先の辞書ベクト
ルａ３を、ｂ２ベクトルと比較し、同じであれば、ａ２
ベクトルを進め、ａ３ベクトルをｂ２ベクトルと仮対応
するものとする。

【００５１】図１０の例は、辞書パターンのベクトルａ
１，ａ２，ａ３を、次々に前進させ、入力パターンのベ
クトルｂ１と仮対応させた例である。

【００５２】以上のように、基本的に４方向のバックボ
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なＤＰマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。

【００５３】図１１は、（ａ）入力パターンと、(ｂ）
“日”の辞書パターン、(ｃ）“区”の辞書パターンと
の対応を取ったときの関係を示す。●印は対応がとれた
近似点，○印は未対応の近似点を示している。以上のよ
うに、４方向のバックボーンベクトルにより、ほぼ、対
応点を求めることができる。ここで、注目すべきこと
は、対応点を求めるとき、オンストローク，オフストロ
ークとも無関係にバックボーンベクトル検出することで
ある。これにより、入力パターンが（ａ）に示すように
続け書きされていても、楷書書きの辞書パターンとのベ
クトルと対応が取れることである。これは、辞書サイズ
を小さくできるとともに、処理時間も少なくすることが
できる効果がある。

【００５４】次に、対応点が求まったら、これを基に、
距離値を計算するが、その基本的な識別要素であるベク
トル差の計算方法を、まず説明する。図１２は、ベクト
ル差演算の基本的な考え方を示したものである。ここ
で、○印は辞書パターン、●印は入力パターンとする。
また、８点線は、その特徴点が対応しているものとす
る。

【００５５】ケース１の対応点間の線分数が辞書パター
ンと入力パターンとが１：１の場合、各々のベクトルａ
１，ｂ１の差を演算する。

【００５６】ケース２の対応点間の線分数が１：ｎのと
き、ｎ線分の長さの割合に応じて、もう一方の線分を分
割し、各々のベクトル差の累積を演算する。これは、一
方の線分が１本のとき、たとえば、“１”、“一”など
の直線ストロークの場合に多く発生する。

【００５７】ケース３のように、対応点間の線分がｎ：
ｎの場合が、一般的には、ほとんどである。このケース
の場合、対応する線分間で長い線分のベクトルを、間に
ある線分の割合で分割し、そのベクトル差を演算する。
たとえば、ａ１２とｂ２が、ａ２１とｂ３のように、ベ
クトル差を演算する。そして、線分の長さの差が小さい
ときは、そのベクトル同士で差を演算する（例；ａ１１
とｂ１）。最後に、対応する線分がなく、残った線分は
その長さをペナルティ値として計算する。

【００５８】以上のように、対応する点を中心に、その
間に未対応の特徴点（近似点）がある場合には、線分分
割しながら、仮想対応点を演算し、距離値演算の精度向
上と演算の簡単化を図っていることが、本発明の特徴で
ある。なお、ベクトル差の演算はストロークの開始点か
ら終了点まで実施するが、ベクトル差が、所定値より大
きいとき、その文字は候補外であるとして、距離値演算
を、足切り処理し、高速化を実施できる。

【００５９】以上、距離値演算の基本識別要素としての
ベクトル差の演算方法を説明したが、実際には、他の識
別要素も加味して距離値を演算する。図１３は、認識距
離値演算の全体を述べたものである。前述のベクトル差
Ｖ(ａ−ｂ)以外に、対応点同士の座標差Ｐ(ａ−ｂ)、ス
トロークの開始点と終了点同士の始終点差Ｐｓｅ（ａ−
ｂ）、最後に、ストローク長差Ｌ（ａ−ｂ）がある。な
お、認識距離値Φは各々の識別要素に、係数α，β，
γ，δを掛け合わせて加重平均したものとする。ここ
で、各々の識別要素の意味は、ベクトル差Ｖ（ａ−ｂ）
は、文字全体の骨格状態を把握する要素、座標差Ｐ（ａ
−ｂ）と始終点差Ｐｓｅ（ａ−ｂ）は対応点の位置関係
を把握する要素、最後のストローク長差Ｌ（ａ−ｂ）
は、文字の複雑さを表す要素である。

【００６０】以上、述べたバックボーンベクトル対応マ
ッチング方式の処理フローを図１４〜図１６を用いて説
明する。図１４は、バックボーンベクトル対応マッチン
グ部２００のメイン処理フローである。ステップ２１０
〜２３０で予め、大分類してから、対応点処理や、マッ
チング処理をおこなう。すなわち、まず、入力画数や、
入力ストローク長などの分類情報を収集する（ステップ
２１０）。この情報と辞書に格納されている情報から、
マッチングに不要な文字群を除く。本発明の一実施例で
は、入力画数＋２が、辞書の画数より、小さいときのみ
以下の処理を行う（ステップ２２０）。これは、辞書に
は、楷書書きでパターンを格納されているが、この辞書
より、入力画数を多く入力することは少ないことから判
断している。つまり、正確には、続いて入力されるとこ
ろを、分かち書きしたり、無い画数を余分に入力してし
まったことにより発生する。一般的には、辞書の画数よ
り、２画以上多く入力されることはない。次に、もう１
つの分類として、入力ストローク長と辞書ストローク長
の差が、しきい値ＴＨ３より、小さいときのみマッチン
グを行う(ステップ２３０)。この処理は、入力ストロー
ク長に対し、大幅に異なる文字とのマッチングを省くも
ので、処理の高速化に必要である。以上の分類が終わっ
た後、前述のバックボーンベクトル対応処理を行う(ス
テップ２４０)。詳細フローは、図１５で説明する。そ
して、最後に、求められた対応ベクトルを元に、距離値
演算であるマッチング処理を行う（ステップ２５０）。
以上の処理を全辞書について処理する（ステップ２６
０）。

【００６１】図１５は、バックボーンベクトル対応処理
（図１４、ステップ２４０）の詳細フローである。図７
〜図１０で前述のアルゴリムに従い、処理される。ま
ず、ストロークの先頭の近似点を対応点に設定する（ス
テップ２４０ａ）。次に、辞書点および入力点を各々進
める（ステップ２４０ｂ）。ベクトルを演算し、同一方
向かどうか判定する（ステップ２４０ｃ）。同一方向か
どうかは、図６のバックボーンベクトルにて行う。その
中間の補助ベクトルは、前述のように、両側のベクトル
になりうるものとして判定する。ステップ２４０ｃの判
定で、同一方向のとき、ステップ２４０ｄにジャンプ
し、辞書点，入力点とも近似点を先に進める。一方、ス
テップ２４０ｃにおいて、異方向のとき、ステップ２４
０ｇにジャンプし、辞書点を前進し、同様に方向判定す
る。もし、同一方向の時、辞書点を対応点候補として設
定する（ステップ２４０ｇ〜２４０Ｉ）。次に、入力点
においても同様に前進させ、方向を判定する（ステップ
２４０ｊ〜２４０ｌ）。さて、ステップ２４０ｃにおい
て、同一方向のとき、次のベクトルも同一方向かどうか
を判定し（ステップ２４０ｅ）、同一方向であれば、辞
書点，入力点とも対応点候補に設定する（ステップ２４
０ｆ）。異方向であれば、ステップ２４０ｇにジャンプ
する。以上の処理を全ての座標点について処理する（ス
テップｍ）。

【００６２】図１６は、前述のバックボーンベクトル対
応処理により求めた対応ベクトルを元に、認識距離値の
演算を行う処理フローである。この処理は、図１３に述
べたように各識別要素を求め、係数を加重平均すること
である。まず、ベクトル差Ｖ（ａ−ｂ）の要素を演算す
る（ステップ２５０ａ）。これは、図１２に述べたよう
に、辞書ベクトルと入力ベクトルの差分を全対応点で累
積加算するものである。次に、座標差Ｐ（ａ−ｂ）の識
別要素の演算（ステップ２５０ｂ），始終点差Ｐｓｅ
（ａ−ｂ）の識別要素の演算（ステップ２５０ｃ），ス
トローク長差Ｌ（ａ−ｂ）の識別要素の演算（ステップ
２５０ｄ）を行う。最後に、認識距離値Φを各々の識別
要素と係数を掛け、加重平均して求める（ステップ２５
０ｅ）。以上の処理を、分類された文字全てについて処
理する（ステップ２５０ｆ）。最後に、求められた距離
値を小さい順にソーティングすることで、候補文字群を
得ることができる。通常、第１０位までを候補にして、
後は、棄却する。

【００６３】次に、バックボーンベクトル対応マッチン
グ方式により、得られた候補文字群に対し、図１の詳細
識別部３００で詳細判定を行う。まず、詳細識別のコン
セプトを述べ、次に、処理フローを述べる。

【００６４】図１７は、詳細識別の基本方式を述べたも
のである。各詳細識別要素は、文字に対し共通処理する
ものと、字別の処理をするものに分類される。なお、共
通処理は、認識距離値へ、ペナルテイとして反映する
が、字別処理は、候補順位を入れ替えることにする。ま
ず、形状比較を行う。図示したように、形状比較のセグ
メントとして、直線，右ループ，右カーブ，右角，左ル
ープ，左カーブ，左角の７つに分け、形状を検出する。
なお、辞書にはオフストローク情報が付加されているた
め、この情報を利用して、入力パターンにもオフストロ
ーク情報を仮に割当ることで、特定部分の形状を判定す
ることができる。例えば、“は”は右ループ有り、
“け”は右カーブ有りと識別できる。共通処理として
は、例えば、ループの個数差をペナルティとして付加す
ることで詳細識別を行う。字別処理は、特に、似ている
文字群のテーブルを作成し、その文字のみどうしを比較
する。

【００６５】次の詳細識別要素としては、ストローク間
の相対位置を比較するもので、図１７に図示のように、
クロス型，Ｔ型，Ｌ型，Ｙ型の４種類の有無を比較す
る。例えば、“石”はクロス無し、“右”はクロス有り
として検出する。なお、この相対位置比較は、関係する
ベクトルの直線から、交叉情報を得て行う。この相対位
置比較も、共通処理と字別処理の両方を行う。

【００６６】前述したバックボーンベクトル対応マッチ
ング方式では、基本的に画数情報は利用せず、１筆書き
されたものとして処理している。したがって、楷書から
続け字まで同一認識アルゴリズムで認識できる。しか
し、逆に、これにより、形がほとんど同じになる文字群
が発生し、認識性能を低下させてします。例えば、
“乙”と“二”は、同じパターンとして識別してしま
う。そこで、字別に画数を比較する。辞書には、正確な
画数が格納されているため、入力が２画なら“二”に、
１画なら“乙”とする。ストローク長についても同様に
識別できる文字がある（例：“末”と“末”、“！”と
“：”）。これについては、横棒、縦棒の長さを比較す
ることで識別できる。

【００６７】最後の詳細識別の要素として、字別に部首
を比較する。本発明では、オフストロークがあっても、
１筆であるとして認識する方式であるため、区別がはっ
きりしない字が存在する。そのため、違いのある部首の
みを切り出しで比較する（例：“什”と“汁”、“弘”
と“払”）。

【００６８】上記、詳細識別のアルゴリズムの処理フロ
ーを図１８に示す。図１８において、まず、入力パター
ンと辞書パターンのループを検出し、入力にあって、辞
書に無い場合、その文字にペナルティを付加する（ステ
ップ３１０）。また、入力パターンと辞書パターンの接
続情報を検出し、例えば、クロスの有無により、ペナル
ティを付加する(ステップ３２０)。この２つの処理は共
通処理であるため、ペナルティを付加した値をもとに、
再ソーテングする必要がある(ステップ３３０)。次に、
ソーテングした候補の第１位の文字が、字別にテーブル
化してある文字かどうか判定する（ステップ３４０）。
もし、テーブルに定義している文字が第１位にある場
合、前述の詳細識別処理を行う（ステップ３５０）。も
し、第１位の候補文字が、テーブルにある場合、他の候
補の対応する文字も存在するため、その文字も含め、さ
らに詳細に比較する。もし、正解文字以外の文字のほう
が入力パターンと近いとき、候補を入れ替える。

【００６９】以上のように、辞書パターンは楷書で登録
しているため、オフストローク情報を用いて、入力パタ
ーンにもオフストロークを仮割当、これにより、文字の
詳細を識別することで、認識率を向上させることが出来
る。

【００７０】次に、図１に示したくずし度設定部９の詳
細について、図１９〜図２１を用いて説明する。まず、
図１９には、くずし度設定パネルを示す。このパネルで
は、（ａ）楷書入力に設定するか、（ｃ）続け字入力
か、あるいは、（ｂ）その中間の入力かの状態を示して
いる。楷書入力に設定すると、図２０に示すように、入
力ストロークと辞書ストロークのストローク長差のしき
い値ＴＨ３の値を小さくする。逆に、続け字にすると、
ストロークの変形が多くなるため、ストローク長差もバ
ラツキが大きなる。したがって、しきい値ＴＨ３は大き
くする必要がある。これは、図１４の分類幅を変更して
いることになり、認識時間に密接に関係する。したがっ
て、ユーザは、楷書入力にしておけば、快適な認識速度
を享受できるが、くずし字の認識率は悪くなる。一方、
くずし字の多い人は、続け字側にして置くことにより、
認識率は良くなるが、認識速度は犠牲になる。以上のよ
うに、文字の分類のしきい値を変更することで、多様な
入力形態に対応可能で、特に、携帯端末で有効である。

【００７１】図２１は、このくずし度設定部９の処理フ
ローを説明したものである。くずし度の設定パネルの値
を読み込み（ステップ１４ａ）、次に、この値に応じ
て、しきい値テーブルを引き、設定するのみで実現でき
る（ステップ１４ｂ）。なお、くずし度の設定しきい値
として分類のしきい値としたが、その他のマッチング処
理の足きりしきい値でもよい。逆に、認識した文字の画
数と辞書の画数との差分を検出して、画数の差分が小さ
ければ、楷書入力であるかと判定することで、上記しき
い値ＴＨ３を小さくし、かつ、ＣＰＵのクロックを遅く
設定することで携帯端末の電池寿命を長持ちさせること
もできる。勿論、その逆の場合で、画数の差分が大きい
とき、入力パターンが続け字が多いと判断し、ＣＰＵの
クロックを早くする。このときは、電池の消耗も早くな
るため、電池寿命は少なくなる。いずれにせよ、分類の
幅を制御することで、電池の消耗を制御したり、認識の
処理速度を制御したりすることができる。

【００７２】

【発明の効果】以上、本発明の実施例によれば、以下の
ような効果がある。まず、第１に、文字の骨格を所定の
角度のバックボーンベクトルに分解し、この後に、マッ
チング処理することで、楷書書き入力から続け書き入力
までの柔軟な入力が、１つの辞書パターンのみで認識可
能である。これによって、くずし字や楷書字などの複数
の辞書登録が不要となるため、辞書サイズが小さくなる
効果がある。また、バックボーンベクトル対応処理とマ
ッチング処理部を分けて処理することで、近似点の対応
が簡単になり、マッチングの処理時間の軽減することが
できる。

【００７３】第２の効果として、座標点列の特徴点を抽
出する場合、複数の座標点列で構成する三角形の面積を
しきい値と比較する面積法と上記複数の座標点列で構成
する内角をしきい値と比較する角度法を組み合わせるこ
とで、安定して、かつ、少ない近似点を求めることが可
能である。これにより、辞書サイズが少なくてよいとい
う効果がある。

【００７４】第３の効果として、バックボーンベクトル
対応マッチング方式では、未対応の近似点をも、周辺の
対応点から、仮対応することにより、マッチングの距離
演算を精度よくできる効果がある。したがって、認識率
も向上する効果がある。

【００７５】第４の効果として、くずし度設定を設ける
ことで、しきい値をダイナミックに変更して、認識処理
時間を変更することができる。これにより、楷書入力の
ように、あまり、くずし字を入力しないユーザには、快
適な認識速度を提供することができる。

【００７６】第５の効果として、くずし度を辞書との画
数差で判断し、処理システムのクロック速度と連動させ
ることで、消費電力を制御することができ、携帯端末の
寿命を長くすることができる。

【図面の簡単な説明】

【図１】本発明の一実施例のブロック構成を説明する図
である。

【図２】本発明の一実施例のハードウエア構成を説明す
る図である。

【図３】本発明の一実施例の特徴抽出部の全体処理フロ
ーである。

【図４】本発明の一実施例の特徴抽出部のアルゴリズム
を説明する図である。

【図５】本発明の一実施例の特徴抽出部の特徴点抽出処
理フローである。

【図６】本発明の一実施例のバックボーンベクトルを説
明する図である。

【図７】本発明の一実施例のバックボーンベクトル対応
を説明する図である。

【図８】本発明の一実施例のバックボーンベクトル対応
を説明する図である。

【図９】本発明の一実施例のバックボーンベクトル対応
を説明する図である。

【図１０】本発明の一実施例のバックボーンベクトル対
応を説明する図である。

【図１１】本発明の一実施例のバックボーンベクトル対
応を説明する図である。

【図１２】本発明の一実施例のベクトル差の演算アルゴ
リズムを説明する図である。

【図１３】本発明の一実施例の認識距離値演算アルゴリ
ズムを説明する図である。

【図１４】本発明の一実施例のマッチング処理フローで
ある。

【図１５】本発明の一実施例のバックボーンベクトル対
応処理フローである。

【図１６】本発明の一実施例の認識距離値演算処理フロ
ーである。

【図１７】本発明の一実施例の詳細識別のアルゴリズム
を説明する図である。

【図１８】本発明の一実施例の詳細識別の処理フローで
ある。

【図１９】本発明の一実施例のくずし度設定パネルを説
明する図である。

【図２０】本発明の一実施例のくずし度設定としきい値
の関係を説明する図である。

【図２１】本発明の一実施例のくずし度設定の処理フロ
ーである。

【符号の説明】

１…座標入力装置、２…液晶装置、３…ペン、４…スト
ローク入出力部、５…文字認識部、９…くずし度設定
部、２００…バックボーンベクトル対応マッチング部、
３００…詳細識別部、４００…認識辞書部。

───────────────────────────────────────────────────── フロントページの続き (72)発明者石田正幸東京都渋谷区道玄坂一丁目16番５号日立情報システムズ内 (72)発明者瀧かよ子東京都渋谷区道玄坂一丁目16番５号日立情報システムズ内 (72)発明者村尾龍之介東京都渋谷区道玄坂一丁目16番５号日立情報システムズ内

Claims

【特許請求の範囲】

【請求項１】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、前記座標点列の複数の点列から、特徴量を求め、しきい
値と比較して手書き座標の特徴点を抽出する特徴抽出
部、オフストロークを含む標準文字パターンを登録した
認識辞書部、入力パターンと辞書パターンの各々に対
し、上下左右の４方向のベクトルに対応させた対応点を
元に、順次マッチング処理するバックボーンベクトル対
応マッチング部で構成したことを特徴とするオンライン
文字認識装置。
【請求項２】請求範囲第１項において、前記バックボー
ンベクトル対応マッチング部で得られた認識候補文字群
に対して、辞書のオフストローク情報を付加して入力文
字パターンの特定部分を識別する詳細識別部を設けたこ
とを特徴とするオンライン文字認識装置。
【請求項３】請求範囲第１項において、前記特徴量は、
複数点列でなる面積および角度変情報であることを特徴
とするオンライン文字認識装置。
【請求項４】請求範囲第１項において、前記分類比較し
て手書き文字を認識する認識部の分類として、辞書パタ
ーンと入力パターンのストローク長差で行う認識部であ
ることを特徴とするオンライン文字認識装置。
【請求項５】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、くずし度設定部を設け、前記くずし度設定部で設定した
値と手書き文字を認識する認識部の分類のしきい値を制
御するように構成したことを特徴とするオンライン文字
認識装置。
【請求項６】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、辞書パターンと入力パターンの特徴量から、くずし度を
求め、このくずし度から、前記手書き文字認識装置のシ
ステムクロックを制御する手段を設けたことを特徴とす
るオンライン文字認識装置。
【請求項７】請求範囲第６項において、前記くずし度の
特徴量として、辞書パターンと入力パターンの画数差で
あることを特徴とするオンライン文字認識装置。