JPH10214312A - オンライン手書き文字認識装置 - Google Patents

オンライン手書き文字認識装置

Info

Publication number
JPH10214312A
JPH10214312A JP9015035A JP1503597A JPH10214312A JP H10214312 A JPH10214312 A JP H10214312A JP 9015035 A JP9015035 A JP 9015035A JP 1503597 A JP1503597 A JP 1503597A JP H10214312 A JPH10214312 A JP H10214312A
Authority
JP
Japan
Prior art keywords
recognition
pattern
feature
dictionary
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9015035A
Other languages
English (en)
Other versions
JP3470541B2 (ja
Inventor
Soshiro Kuzunuki
壮四郎 葛貫
Toshimi Yokota
登志美 横田
Akihiro Katsura
晃洋 桂
Masayuki Ishida
正幸 石田
Kayoko Taki
かよ子 瀧
Ryunosuke Murao
龍之介 村尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP01503597A priority Critical patent/JP3470541B2/ja
Publication of JPH10214312A publication Critical patent/JPH10214312A/ja
Application granted granted Critical
Publication of JP3470541B2 publication Critical patent/JP3470541B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】楷書入力から続け字入力までを認識できるオン
ライン手書き文字認識装置の提供。 【解決手段】手書き座標列から特徴点を抽出し、辞書パ
ターンを分類比較して手書き文字を認識する認識部し、
認識した結果を表示するオンライン手書き文字認識装置
において、座標点列の複数の点列から、特徴量を求め、
しきい値と比較して手書き座標の特徴点を抽出する特徴
抽出部100と、オフストロークを含む標準文字パター
ンを登録した認識辞書部400,入力パターンと辞書パ
ターンの各々に対し、上下左右の4方向のベクトルに対
応させた対応点を元に、順次マッチング処理するバック
ボーンベクトル対応マッチング部200で構成した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オンラインの手書
き文字認識装置に関し、特に、楷書入力から一筆書きし
たような続け入力に対しも、辞書サイズが少なく、か
つ、高性能に認識できる手書き文字認識装置に関する。
【0002】
【従来の技術】オンライン手書き文字認識装置の文字認
識方式には、入力制限方式からの分類として、(1)画
数,筆順を固定にする方式、(2)どちらかをフリーに
する方式、(3)どちらの制限もなくフリーにする方式
がある。一方、アルゴリズムからの分類として、(4)
ストロークの構造を解析する構造解析方式、(5)スト
ロークの特徴点を辞書とパターンマッチングするパター
ンマッチング方式がある。それぞれ特徴があり、性能と
兼ね合いで決められる。
【0003】一般に、認識時間の関係から、(1)また
は(2)の方式が、また、辞書の学習の観点から、
(5)の方式が多く用いられている。
【0004】従来、これらの続け字に対応するため、一
般によく行われている手法に、楷書の標準パターン(辞
書)の他に、続け字の標準パターンも登録しておく方法
がある。
【0005】続け字の標準パターンを登録しない方法と
して、特開昭57−45679号,特開平8−249424号に示すよ
うに、オンストロークのみならず、オフストローク(ペ
ンアップ中のストローク)をも仮想的に仮結合して(一
筆書きにして)、そのストロークを等分割、あるいは、
等間隔に特徴点を抽出し、これを辞書とマッチングする
方式がある。
【0006】一方、特徴点の対応方式には、前述の特開
平8−249424 号公報に記載されているような、特徴点を
ダイナミックプログラミング(DP)方式により、入力
パターンと辞書パターンの対応をとり、距離値を計算す
る方式と、電子通信学会研究会論文、PRL84−68
(1985.1.25),PP19−PP26,“オン
ライン文字認識における標準文字と続け字との対応点抽
出法”にあるようにオフストロークの安定性に着目し
て、オフストロークとの対応点を抽出して続け字を認識
する方式がある。
【0007】また、ストロークの特徴点を抽出する方法
に、従来、情報処理学会論文誌第27巻第5号(昭和6
1年5月)、PP492−PP498,“画数,筆順,
回転,区切りに依存しないオンライン手書き図形認識方
式”にあるように、面積法を用いて、手ぶれや、座標入
力装置のノイズ等の影響を受けない方法が考案されてい
る。別な方式として、前述の特開平8−249424 号公報に
記載されているように、ストロークを追跡して所定角度
以上の曲がり角度点を特徴点とする角度法がある。
【0008】また、一般に、マッチング処理では、どう
しても認識できない文字群に対し、カテゴリ別の詳細識
別方式が用いられる。たとえば、電子情報通信学会論文
誌、D−2,NO.4,PP592−599、“マルチ
メディア端末用手書き入力インタフェースの設計とその
応用”には、ストロークの終了方向(“れ”と“わ”)、
ストロークの始点位置(“カ”と“刀”)、画数の差
(“ば”と“ぱ”)等の175の特徴関数を用いて判定
し、認識性能を向上させている。さらに、特開昭55−
33245号公報には、ストローク対の交叉を検出し、
識別している(例えば“に”と“土”と“上”)ことが
記載されている。
【0009】最近、携帯情報端末(PDA:Personal D
igtal Assisitant)が普及してきているが、一般に、画
数や筆順をフリーにすると認識時間も多く要し、認識速
度を快適にするためには、文字認識中は、クロック速度
をシステムの最高速度で動作させている。
【0010】
【発明が解決しようとする課題】上記、従来技術の続け
字を認識の方法では、下記のような問題点がある。
【0011】第1に、いろいろな続け字を標準パターン
に登録すると辞書サイズが大きくなり、かつ、認識速度
や、認識率の低下が発生してくる問題がある。
【0012】第2に、オフストロークをも含めて近似点
を生成する方式では、続け字を辞書に登録しない代わ
り、オフストロークの近似点も登録するため、同様に、
辞書サイズが大きくなるという問題点がある。同様に、
辞書サイズが大きくなれば、認識速度も遅くなる。
【0013】第3に、オフストローク対応点抽出方式で
は、続け字の認識が、オフストロークに依存するという
問題点がある。したがって、標準パターンのオフストロ
ークから、入力パターンのオフストロークを推測するな
どが必要になり、推測ミスや、処理時間がかかるという
問題がある。同様に、近似点をDP方式で辞書と対応さ
せる方式も時間が多く要するなど問題点がある。
【0014】第4に、ストロークの特徴点を抽出する場
合、面積抽出法では、ノイズには強いが、鋭角の抽出が
できない問題がある。一方、角度抽出法では、ノイズの
影響が受け易いという問題点がある。
【0015】第5に、入力が続け字されると詳細識別の
ための情報、たとえば、ループの個数や、クロス位置が
曖昧になり、詳細識別が困難になるなど問題を生じてい
た。第6に、パーソナルな携帯端末では、楷書入力する
代わり、快適な認識速度の提供が欲しい場合がある。一
方、認識速度を犠牲にするが、くずし字も認識して欲し
いなど、柔軟に設定できなかった。認識時間を速くする
ためには、高性能なCPUを使用するか、ダイナミック
にシステムクロックを上げるなどしなければならない。
しかし、当然、認識速度と、電池の寿命時間とのトレー
ドオフの関係になる。このように、従来のシステムで
は、ユーザの手書き入力状態、すなわち、くずし度合い
に応じて、認識速度全体を変化させることはできないな
ど、マンマシン性に問題があった。
【0016】本発明では、辞書サイズが少なく、特徴点
を安定して抽出でき、かつ、文字の骨格情報を利用し
て、楷書入力から続け字入力までを高性能に認識できる
オンライン手書き文字文字認識装置を提供するにある。
また、ユーザの入力パターンのくずし字の度合いと認識
速度を対応させることのできるオンライン手書き文字文
字認識装置を提供するにある。
【0017】
【課題を解決するための手段】本発明は、上記目的を達
成するために、手書き座標を入力する座標入力装置、上
記手書き座標列から特徴点を抽出する特徴抽出部、上記
特徴抽出部から得られた特徴パターンと、辞書パターン
を分類比較して手書き文字を認識する認識部、認識した
結果を表示する認識結果表示部を備えたオンライン手書
き文字認識装置において、前記座標点列の複数の点列か
ら、特徴量を求め、しきい値と比較して手書き座標の特
徴点を抽出する特徴抽出部、オフストロークを含む標準
文字パターンを登録した認識辞書部、入力パターンと辞
書パターンの各々に対し、上下左右の4方向のベクトル
に対応させた対応点を元に、順次マッチング処理するバ
ックボーンベクトル対応マッチング部で構成したことを
特徴としている。
【0018】さらに、前記バックボーンベクトル対応マ
ッチング部で得られた認識候補文字群に対して、辞書の
オフストローク情報を付加して入力文字パターンの特定
部分を識別する詳細識別部を設けたことを特徴としてい
る。
【0019】手書き座標列から特徴点を抽出する特徴抽
出部は、複数点列でなる面積および角度変情報で検出す
ることを特徴としている。
【0020】また、分類比較して手書き文字を認識する
認識部の分類として、辞書パターンと入力パターンのス
トローク長差で行う認識部であることを特徴としてい
る。
【0021】また、くずし度設定部を設け、前記くずし
度設定部で設定した値と手書き文字を認識する認識部の
分類のしきい値を制御するようにしたことを特徴とす
る。さらに、辞書パターンと入力パターンの特徴量か
ら、くずし度を求め、このくずし度から、前記手書き文
字認識装置のシステムクロックを制御する手段を設けた
ことを特徴とする。
【0022】
【発明の実施の形態】以下、本発明の一実施例を図1〜
図21を用いて説明する。
【0023】図1は、本発明の一実施例の全体ブロック
構成を示したものである。1は座標入力装置TB、2は
液晶装置LCDである。1と2のデバイスは積層してあ
る。座標入力装置TBの座標はストローク入出力部4で
検出し、その筆跡はフィードバックされ、ペン3の動き
に応じて表示するようになっている。入力されたストロ
ーク座標点列は、文字認識部5に入力し、文字候補とし
て出力する。出力された文字候補群は日本語処理部6に
入力し、日本語として意味があるかどうか、日本語辞書
部7を参照して判定し、その結果を認識結果表示部8に
表示する。文字認識部5は、座標点列から特徴を抽出す
る特徴抽出部100,抽出された特徴点はバックボーン
ベクトル対応マッチング部200で文字の骨格として対
応点を検出し、認識辞書部400とマッチング処理す
る。さらに、候補文字群の中から、詳細識別部300で
詳細識別処理して、認識性能を向上させている。
【0024】また、もう1つの特徴であるくずし度設定
部9では、ユーザから、図19に示すようなアイコンを
用いて、楷書入力か、あるいは、続け字入力かを設定
し、これにより、認識処理速度を柔軟に変えることがで
きる。すなわち、楷書入力では、認識速度が速くなり、
続け字入力では、認識レベルを詳細に識別するが、処理
速度は多く要するようになっている。勿論、図19のア
イコンでその中間の値も設定できるようになっている。
【0025】次に、本発明の一実施例であるハードウエ
ア構成を図2により説明する。図2において、コンピュ
ータ(CPU)10のバスには、座標入力コントローラ
(TBC)11,液晶コントローラ(LCDC)12,
メモリ(MEM)13,外部との通信コントローラ(N
ET)14が接続されている。なお、メモリ(MEM)
13には、オペレーテイングシステム(OS)やプログ
ラム、さらに各種辞書が格納されている。
【0026】以下、図1のブロック構成の内、特徴部分
である文字認識部5の詳細フローを説明する。
【0027】図3は、入力された座標点列(ストロー
ク)の特徴点(近似点)を抽出する特徴抽出部100の
詳細フローである。まず、入力された座標点列(例:
日)を正規化するため、オフストロークも端点を接続す
る1筆化処理をおこなう(ステップ110)。次に、オ
フストロークも含めたリサンプリング処理を行う(ステ
ップ120)。この処理は、等間隔に座標を補間するも
ので、入力された座標点列のサンプル速度や、入力速度
の影響をなくすためにある。次に、ステップ130で正
規化処理を行う。これは、以下のように計算する。先ほ
ど求めたリサンプリング座標点列の長さを全て加算し、
それを座標点列数で除算することで、重心位置を計算す
る。次に、リサンプリングした座標点列のX,Y軸の最
大最小値から、入力データのサイズを求め、先ほど求め
た重心位置とで正規化を行う。図3の例では、左下に小
さく入力された座標点列(ステップ120)が、正規化
され枠の中心に、大きく正規化されていることがわか
る。このようにすることにより、入力位置や入力サイズ
による影響を軽減している。なお、オフストロークも含
めないで重心位置を求めると、離れた位置に入力された
ストロークにより、重心位置が大きく影響する。このた
め、本発明の一実施例のように、オフストロークも含め
て、一旦、リサンプリングし、この点列を用いて重心位
置を求めている。
【0028】次に、認識のための特徴点を求める近似化
処理を行う(ステップ140)。この処理は、文字の特
徴点を求める処理であり、後述のマッチング処理と大い
に関係する。特徴点を、等間隔や、等分割で求める方法
は、処理は簡単であるが、特徴点が多くなり、辞書サイ
ズが大きくなる欠点がある。したがって、本発明の一実
施例では、文字の形を表すに必要な最低限の特徴点を抽
出することにする。これは、直線部分は端点のみとし、
曲がりの部分は、複数の点で構成するようにすればよ
い。したがって、オフストロークには近似点は存在しな
い。図4を用いて、以下説明する。
【0029】図4は、入力された座標点列の一部を拡大
したもので、開始点Ps、から始まり、Pa,Pb,P
c,Pd…と続くものとする。ここで、本発明の一実施
例では、面積法と角度法の2つを併用して特徴点を求め
ることにする。今、開始点Psも含め、順次入力された
3つの座標点列から構成される三角形の面積をΔSa,Δ
Sb,ΔSc,…、三角形の内角をθa,θb,θc,
…とすると、下記判定式のいずれかが成り立つときに、
特徴点とする。
【0030】(1)(累積面積(ΔSa+ΔSb+ΔSc
+…) > しきい値TH1)and(三角形の内角(θ
a,θb,θc,…) > しきい値TH2)になった
点と特徴点とする。
【0031】(2)三角形の内角(θa,θb,θc,
…) < しきい値TH2になった点と特徴点とする。
【0032】以上のように、累積面積が大きく、かつ、
内角がしきい値より大きいときの条件は、曲線の検出に
良好に働く。さらに、三角形の内角がしきい値より、小
さいとき、これもまた、特徴点とすることで、折り返し
のあるストロークの先頭も特徴点として検出できる。
【0033】図5は、この近似化処理140の具体的フ
ローを説明したものである。まず、累積面積Stをクリ
アし、また、開始点Psをリードして、座標バッファP
(1)に格納する(ステップ141)。次の座標点Pa,
Pbもリードし、座標バッファP(2),P(3)に格
納する(ステップ142)。3点の座標から、面積ΔS
を計算し、累積面積Stを演算する(ステップ14
3)。同様に、3点の座標から内角θを計算する(ステ
ップ144)。次に、上記求めた累積面積Stと内角θ
をしきい値TH1,TH2と各々比較する(ステップ1
45)。もし、条件がいずれも成立しないとき、次の座
標点Pcをリードし、次の3点の座標を準備しておく
(ステップ146)。前記条件が成立したとき、最後に
取り込んだ座標の1つ前を近似点として格納する(ステ
ップ147)。最後に、全サンプル点の座標終了かどう
か判定し(ステップ148)、もし、終了していなかっ
たら、求めた近似点を新たな開始点に設定し、次の近似
点を求める(ステップ149)。以上のように、本発明で
は、面積法と角度法を用いて、近似点を求めた。
【0034】次に、本発明の特徴的処理であるバックボ
ーンベクトル対応マッチング処理を説明する。最初に、
そのコンセプトを説明する。文字の形は基本的には、図
6に示すような、左右,上下の4つの方向のバックボー
ンで構成される(d1,d2,d3,d4)。そして、
斜め方向は、そのバックボーンベクトルの補助ベクトル
(d12,d23,d34,d41)とする。この補助
ベクトルは、中間的ベクトルであるため、両側のバック
ボーンベクトルのいずれにもなりうるものとする。
【0035】上記バックボーンベクトルを用いて、入力
されたストロークの近似点と辞書の近似点をどのように
対応させるかを、図7〜図10の各ケースで説明する。
それぞれの図において、○印は辞書パターンの近似点、
●印は入力パターンの近似点である。隣り合う近似点間
のベクトルを、辞書パターンはa1,a2ベクトル、入
力パターンはb1,b2ベクトルとする。対応点の処理
は、次のようにする。 (1)最初に、先頭のベクトルa1,b1を対応するもの
とする(■印)。
【0036】(2)以下、辞書パターンと入力パターンの
方向により、ベクトルの比較,入力パターンベクトルの
前進,辞書パターンベクトルの前進を行う。
【0037】(3)近似点がなくなるまで、上記(2)を処
理する。
【0038】では、図7の例から説明する。まず、ベク
トルa1,b1が最初に対応するとして、1つ先のa
2,b2のベクトルを比較し、同一方向((図6のd
1)であるとき、仮対応するものとしてa2,b2に前
進させる(□印)。
【0039】図8の例では、同様に、ベクトルa1,b
1が最初に対応し、次に、1つ先のa2の方向をb1と
判定し、同一ベクトルならば、a2を仮対応するとして
前進させる。
【0040】図9は、入力パターンのベクトルと辞書パ
ターンのベクトルが逆方向のときの例である。
【0041】図7と同様に、ベクトルa1,b1が最初
に対応するとし、b2ベクトルは、辞書ベクトルa2と
は逆方向のため対応しない。次に、1つ先の辞書ベクト
ルa3を、b2ベクトルと比較し、同じであれば、a2
ベクトルを進め、a3ベクトルをb2ベクトルと仮対応
するものとする。
【0042】図10の例は、辞書パターンのベクトルa
1,a2,a3を、次々に前進させ、入力パターンのベ
クトルb1と仮対応させた例である。
【0043】以上のように、基本的に4方向のバックボ
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なDPマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。
【0044】図11は、(a)入力パターンと、(b)
“日”の辞書パターン、(c)“区”上記バックボーン
ベクトルを用いて、入力されたストロークの近似点と辞
書の近似点をどのように対応させるかを、図7〜図10
の各ケースで説明する。それぞれの図において、○印は
辞書パターンの近似点、●印は入力パターンの近似点で
ある。隣り合う近似点間のベクトルを、辞書パターンは
a1,a2ベクトル、入力パターンはb1,b2ベクト
ルとする。対応点の処理は、次のようにする。 (1)最初に、先頭のベクトルa1,b1を対応するもの
とする(■印)。
【0045】(2)以下、辞書パターンと入力パターンの
方向により、ベクトルの比較,入力パターンベクトルの
前進,辞書パターンベクトルの前進を行う。
【0046】(3)近似点がなくなるまで、上記(2)を処
理する。
【0047】では、図7の例から説明する。まず、ベク
トルa1,b1が最初に対応するとして、1つ先のa
2,b2のベクトルを比較し、同一方向((図6のd
1)であるとき、仮対応するものとしてa2,b2に前
進させる(□印)。
【0048】図8の例では、同様に、ベクトルa1,b
1が最初に対応し、次に、1つ先のa2の方向をb1と
判定し、同一ベクトルならば、a2を仮対応するとして
前進させる。
【0049】図9は、入力パターンのベクトルと辞書パ
ターンのベクトルが逆方向のときの例である。
【0050】図7と同様に、ベクトルa1,b1が最初
に対応するとし、b2ベクトルは、辞書ベクトルa2と
は逆方向のため対応しない。次に、1つ先の辞書ベクト
ルa3を、b2ベクトルと比較し、同じであれば、a2
ベクトルを進め、a3ベクトルをb2ベクトルと仮対応
するものとする。
【0051】図10の例は、辞書パターンのベクトルa
1,a2,a3を、次々に前進させ、入力パターンのベ
クトルb1と仮対応させた例である。
【0052】以上のように、基本的に4方向のバックボ
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なDPマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。
【0053】図11は、(a)入力パターンと、(b)
“日”の辞書パターン、(c)“区”の辞書パターンと
の対応を取ったときの関係を示す。●印は対応がとれた
近似点,○印は未対応の近似点を示している。以上のよ
うに、4方向のバックボーンベクトルにより、ほぼ、対
応点を求めることができる。ここで、注目すべきこと
は、対応点を求めるとき、オンストローク,オフストロ
ークとも無関係にバックボーンベクトル検出することで
ある。これにより、入力パターンが(a)に示すように
続け書きされていても、楷書書きの辞書パターンとのベ
クトルと対応が取れることである。これは、辞書サイズ
を小さくできるとともに、処理時間も少なくすることが
できる効果がある。
【0054】次に、対応点が求まったら、これを基に、
距離値を計算するが、その基本的な識別要素であるベク
トル差の計算方法を、まず説明する。図12は、ベクト
ル差演算の基本的な考え方を示したものである。ここ
で、○印は辞書パターン、●印は入力パターンとする。
また、8点線は、その特徴点が対応しているものとす
る。
【0055】ケース1の対応点間の線分数が辞書パター
ンと入力パターンとが1:1の場合、各々のベクトルa
1,b1の差を演算する。
【0056】ケース2の対応点間の線分数が1:nのと
き、n線分の長さの割合に応じて、もう一方の線分を分
割し、各々のベクトル差の累積を演算する。これは、一
方の線分が1本のとき、たとえば、“1”、“一”など
の直線ストロークの場合に多く発生する。
【0057】ケース3のように、対応点間の線分がn:
nの場合が、一般的には、ほとんどである。このケース
の場合、対応する線分間で長い線分のベクトルを、間に
ある線分の割合で分割し、そのベクトル差を演算する。
たとえば、a12とb2が、a21とb3のように、ベ
クトル差を演算する。そして、線分の長さの差が小さい
ときは、そのベクトル同士で差を演算する(例;a11
とb1)。最後に、対応する線分がなく、残った線分は
その長さをペナルティ値として計算する。
【0058】以上のように、対応する点を中心に、その
間に未対応の特徴点(近似点)がある場合には、線分分
割しながら、仮想対応点を演算し、距離値演算の精度向
上と演算の簡単化を図っていることが、本発明の特徴で
ある。なお、ベクトル差の演算はストロークの開始点か
ら終了点まで実施するが、ベクトル差が、所定値より大
きいとき、その文字は候補外であるとして、距離値演算
を、足切り処理し、高速化を実施できる。
【0059】以上、距離値演算の基本識別要素としての
ベクトル差の演算方法を説明したが、実際には、他の識
別要素も加味して距離値を演算する。図13は、認識距
離値演算の全体を述べたものである。前述のベクトル差
V(a−b)以外に、対応点同士の座標差P(a−b)、ス
トロークの開始点と終了点同士の始終点差Pse(a−
b)、最後に、ストローク長差L(a−b)がある。な
お、認識距離値Φは各々の識別要素に、係数α,β,
γ,δを掛け合わせて加重平均したものとする。ここ
で、各々の識別要素の意味は、ベクトル差V(a−b)
は、文字全体の骨格状態を把握する要素、座標差P(a
−b)と始終点差Pse(a−b)は対応点の位置関係
を把握する要素、最後のストローク長差L(a−b)
は、文字の複雑さを表す要素である。
【0060】以上、述べたバックボーンベクトル対応マ
ッチング方式の処理フローを図14〜図16を用いて説
明する。図14は、バックボーンベクトル対応マッチン
グ部200のメイン処理フローである。ステップ210
〜230で予め、大分類してから、対応点処理や、マッ
チング処理をおこなう。すなわち、まず、入力画数や、
入力ストローク長などの分類情報を収集する(ステップ
210)。この情報と辞書に格納されている情報から、
マッチングに不要な文字群を除く。本発明の一実施例で
は、入力画数+2が、辞書の画数より、小さいときのみ
以下の処理を行う(ステップ220)。これは、辞書に
は、楷書書きでパターンを格納されているが、この辞書
より、入力画数を多く入力することは少ないことから判
断している。つまり、正確には、続いて入力されるとこ
ろを、分かち書きしたり、無い画数を余分に入力してし
まったことにより発生する。一般的には、辞書の画数よ
り、2画以上多く入力されることはない。次に、もう1
つの分類として、入力ストローク長と辞書ストローク長
の差が、しきい値TH3より、小さいときのみマッチン
グを行う(ステップ230)。この処理は、入力ストロー
ク長に対し、大幅に異なる文字とのマッチングを省くも
ので、処理の高速化に必要である。以上の分類が終わっ
た後、前述のバックボーンベクトル対応処理を行う(ス
テップ240)。詳細フローは、図15で説明する。そ
して、最後に、求められた対応ベクトルを元に、距離値
演算であるマッチング処理を行う(ステップ250)。
以上の処理を全辞書について処理する(ステップ26
0)。
【0061】図15は、バックボーンベクトル対応処理
(図14、ステップ240)の詳細フローである。図7
〜図10で前述のアルゴリムに従い、処理される。ま
ず、ストロークの先頭の近似点を対応点に設定する(ス
テップ240a)。次に、辞書点および入力点を各々進
める(ステップ240b)。ベクトルを演算し、同一方
向かどうか判定する(ステップ240c)。同一方向か
どうかは、図6のバックボーンベクトルにて行う。その
中間の補助ベクトルは、前述のように、両側のベクトル
になりうるものとして判定する。ステップ240cの判
定で、同一方向のとき、ステップ240dにジャンプ
し、辞書点,入力点とも近似点を先に進める。一方、ス
テップ240cにおいて、異方向のとき、ステップ24
0gにジャンプし、辞書点を前進し、同様に方向判定す
る。もし、同一方向の時、辞書点を対応点候補として設
定する(ステップ240g〜240I)。次に、入力点
においても同様に前進させ、方向を判定する(ステップ
240j〜240l)。さて、ステップ240cにおい
て、同一方向のとき、次のベクトルも同一方向かどうか
を判定し(ステップ240e)、同一方向であれば、辞
書点,入力点とも対応点候補に設定する(ステップ24
0f)。異方向であれば、ステップ240gにジャンプ
する。以上の処理を全ての座標点について処理する(ス
テップm)。
【0062】図16は、前述のバックボーンベクトル対
応処理により求めた対応ベクトルを元に、認識距離値の
演算を行う処理フローである。この処理は、図13に述
べたように各識別要素を求め、係数を加重平均すること
である。まず、ベクトル差V(a−b)の要素を演算す
る(ステップ250a)。これは、図12に述べたよう
に、辞書ベクトルと入力ベクトルの差分を全対応点で累
積加算するものである。次に、座標差P(a−b)の識
別要素の演算(ステップ250b),始終点差Pse
(a−b)の識別要素の演算(ステップ250c),ス
トローク長差L(a−b)の識別要素の演算(ステップ
250d)を行う。最後に、認識距離値Φを各々の識別
要素と係数を掛け、加重平均して求める(ステップ25
0e)。以上の処理を、分類された文字全てについて処
理する(ステップ250f)。最後に、求められた距離
値を小さい順にソーティングすることで、候補文字群を
得ることができる。通常、第10位までを候補にして、
後は、棄却する。
【0063】次に、バックボーンベクトル対応マッチン
グ方式により、得られた候補文字群に対し、図1の詳細
識別部300で詳細判定を行う。まず、詳細識別のコン
セプトを述べ、次に、処理フローを述べる。
【0064】図17は、詳細識別の基本方式を述べたも
のである。各詳細識別要素は、文字に対し共通処理する
ものと、字別の処理をするものに分類される。なお、共
通処理は、認識距離値へ、ペナルテイとして反映する
が、字別処理は、候補順位を入れ替えることにする。ま
ず、形状比較を行う。図示したように、形状比較のセグ
メントとして、直線,右ループ,右カーブ,右角,左ル
ープ,左カーブ,左角の7つに分け、形状を検出する。
なお、辞書にはオフストローク情報が付加されているた
め、この情報を利用して、入力パターンにもオフストロ
ーク情報を仮に割当ることで、特定部分の形状を判定す
ることができる。例えば、“は”は右ループ有り、
“け”は右カーブ有りと識別できる。共通処理として
は、例えば、ループの個数差をペナルティとして付加す
ることで詳細識別を行う。字別処理は、特に、似ている
文字群のテーブルを作成し、その文字のみどうしを比較
する。
【0065】次の詳細識別要素としては、ストローク間
の相対位置を比較するもので、図17に図示のように、
クロス型,T型,L型,Y型の4種類の有無を比較す
る。例えば、“石”はクロス無し、“右”はクロス有り
として検出する。なお、この相対位置比較は、関係する
ベクトルの直線から、交叉情報を得て行う。この相対位
置比較も、共通処理と字別処理の両方を行う。
【0066】前述したバックボーンベクトル対応マッチ
ング方式では、基本的に画数情報は利用せず、1筆書き
されたものとして処理している。したがって、楷書から
続け字まで同一認識アルゴリズムで認識できる。しか
し、逆に、これにより、形がほとんど同じになる文字群
が発生し、認識性能を低下させてします。例えば、
“乙”と“二”は、同じパターンとして識別してしま
う。そこで、字別に画数を比較する。辞書には、正確な
画数が格納されているため、入力が2画なら“二”に、
1画なら“乙”とする。ストローク長についても同様に
識別できる文字がある(例:“末”と“末”、“!”と
“:”)。これについては、横棒、縦棒の長さを比較す
ることで識別できる。
【0067】最後の詳細識別の要素として、字別に部首
を比較する。本発明では、オフストロークがあっても、
1筆であるとして認識する方式であるため、区別がはっ
きりしない字が存在する。そのため、違いのある部首の
みを切り出しで比較する(例:“什”と“汁”、“弘”
と“払”)。
【0068】上記、詳細識別のアルゴリズムの処理フロ
ーを図18に示す。図18において、まず、入力パター
ンと辞書パターンのループを検出し、入力にあって、辞
書に無い場合、その文字にペナルティを付加する(ステ
ップ310)。また、入力パターンと辞書パターンの接
続情報を検出し、例えば、クロスの有無により、ペナル
ティを付加する(ステップ320)。この2つの処理は共
通処理であるため、ペナルティを付加した値をもとに、
再ソーテングする必要がある(ステップ330)。次に、
ソーテングした候補の第1位の文字が、字別にテーブル
化してある文字かどうか判定する(ステップ340)。
もし、テーブルに定義している文字が第1位にある場
合、前述の詳細識別処理を行う(ステップ350)。も
し、第1位の候補文字が、テーブルにある場合、他の候
補の対応する文字も存在するため、その文字も含め、さ
らに詳細に比較する。もし、正解文字以外の文字のほう
が入力パターンと近いとき、候補を入れ替える。
【0069】以上のように、辞書パターンは楷書で登録
しているため、オフストローク情報を用いて、入力パタ
ーンにもオフストロークを仮割当、これにより、文字の
詳細を識別することで、認識率を向上させることが出来
る。
【0070】次に、図1に示したくずし度設定部9の詳
細について、図19〜図21を用いて説明する。まず、
図19には、くずし度設定パネルを示す。このパネルで
は、(a)楷書入力に設定するか、(c)続け字入力
か、あるいは、(b)その中間の入力かの状態を示して
いる。楷書入力に設定すると、図20に示すように、入
力ストロークと辞書ストロークのストローク長差のしき
い値TH3の値を小さくする。逆に、続け字にすると、
ストロークの変形が多くなるため、ストローク長差もバ
ラツキが大きなる。したがって、しきい値TH3は大き
くする必要がある。これは、図14の分類幅を変更して
いることになり、認識時間に密接に関係する。したがっ
て、ユーザは、楷書入力にしておけば、快適な認識速度
を享受できるが、くずし字の認識率は悪くなる。一方、
くずし字の多い人は、続け字側にして置くことにより、
認識率は良くなるが、認識速度は犠牲になる。以上のよ
うに、文字の分類のしきい値を変更することで、多様な
入力形態に対応可能で、特に、携帯端末で有効である。
【0071】図21は、このくずし度設定部9の処理フ
ローを説明したものである。くずし度の設定パネルの値
を読み込み(ステップ14a)、次に、この値に応じ
て、しきい値テーブルを引き、設定するのみで実現でき
る(ステップ14b)。なお、くずし度の設定しきい値
として分類のしきい値としたが、その他のマッチング処
理の足きりしきい値でもよい。逆に、認識した文字の画
数と辞書の画数との差分を検出して、画数の差分が小さ
ければ、楷書入力であるかと判定することで、上記しき
い値TH3を小さくし、かつ、CPUのクロックを遅く
設定することで携帯端末の電池寿命を長持ちさせること
もできる。勿論、その逆の場合で、画数の差分が大きい
とき、入力パターンが続け字が多いと判断し、CPUの
クロックを早くする。このときは、電池の消耗も早くな
るため、電池寿命は少なくなる。いずれにせよ、分類の
幅を制御することで、電池の消耗を制御したり、認識の
処理速度を制御したりすることができる。
【0072】
【発明の効果】以上、本発明の実施例によれば、以下の
ような効果がある。まず、第1に、文字の骨格を所定の
角度のバックボーンベクトルに分解し、この後に、マッ
チング処理することで、楷書書き入力から続け書き入力
までの柔軟な入力が、1つの辞書パターンのみで認識可
能である。これによって、くずし字や楷書字などの複数
の辞書登録が不要となるため、辞書サイズが小さくなる
効果がある。また、バックボーンベクトル対応処理とマ
ッチング処理部を分けて処理することで、近似点の対応
が簡単になり、マッチングの処理時間の軽減することが
できる。
【0073】第2の効果として、座標点列の特徴点を抽
出する場合、複数の座標点列で構成する三角形の面積を
しきい値と比較する面積法と上記複数の座標点列で構成
する内角をしきい値と比較する角度法を組み合わせるこ
とで、安定して、かつ、少ない近似点を求めることが可
能である。これにより、辞書サイズが少なくてよいとい
う効果がある。
【0074】第3の効果として、バックボーンベクトル
対応マッチング方式では、未対応の近似点をも、周辺の
対応点から、仮対応することにより、マッチングの距離
演算を精度よくできる効果がある。したがって、認識率
も向上する効果がある。
【0075】第4の効果として、くずし度設定を設ける
ことで、しきい値をダイナミックに変更して、認識処理
時間を変更することができる。これにより、楷書入力の
ように、あまり、くずし字を入力しないユーザには、快
適な認識速度を提供することができる。
【0076】第5の効果として、くずし度を辞書との画
数差で判断し、処理システムのクロック速度と連動させ
ることで、消費電力を制御することができ、携帯端末の
寿命を長くすることができる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック構成を説明する図
である。
【図2】本発明の一実施例のハードウエア構成を説明す
る図である。
【図3】本発明の一実施例の特徴抽出部の全体処理フロ
ーである。
【図4】本発明の一実施例の特徴抽出部のアルゴリズム
を説明する図である。
【図5】本発明の一実施例の特徴抽出部の特徴点抽出処
理フローである。
【図6】本発明の一実施例のバックボーンベクトルを説
明する図である。
【図7】本発明の一実施例のバックボーンベクトル対応
を説明する図である。
【図8】本発明の一実施例のバックボーンベクトル対応
を説明する図である。
【図9】本発明の一実施例のバックボーンベクトル対応
を説明する図である。
【図10】本発明の一実施例のバックボーンベクトル対
応を説明する図である。
【図11】本発明の一実施例のバックボーンベクトル対
応を説明する図である。
【図12】本発明の一実施例のベクトル差の演算アルゴ
リズムを説明する図である。
【図13】本発明の一実施例の認識距離値演算アルゴリ
ズムを説明する図である。
【図14】本発明の一実施例のマッチング処理フローで
ある。
【図15】本発明の一実施例のバックボーンベクトル対
応処理フローである。
【図16】本発明の一実施例の認識距離値演算処理フロ
ーである。
【図17】本発明の一実施例の詳細識別のアルゴリズム
を説明する図である。
【図18】本発明の一実施例の詳細識別の処理フローで
ある。
【図19】本発明の一実施例のくずし度設定パネルを説
明する図である。
【図20】本発明の一実施例のくずし度設定としきい値
の関係を説明する図である。
【図21】本発明の一実施例のくずし度設定の処理フロ
ーである。
【符号の説明】
1…座標入力装置、2…液晶装置、3…ペン、4…スト
ローク入出力部、5…文字認識部、9…くずし度設定
部、200…バックボーンベクトル対応マッチング部、
300…詳細識別部、400…認識辞書部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 石田 正幸 東京都渋谷区道玄坂一丁目16番5号 日立 情報システムズ内 (72)発明者 瀧 かよ子 東京都渋谷区道玄坂一丁目16番5号 日立 情報システムズ内 (72)発明者 村尾 龍之介 東京都渋谷区道玄坂一丁目16番5号 日立 情報システムズ内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】手書き座標を入力する座標入力装置、上記
    手書き座標列から特徴点を抽出する特徴抽出部、上記特
    徴抽出部から得られた特徴パターンと、辞書パターンを
    分類比較して手書き文字を認識する認識部、認識した結
    果を表示する認識結果表示部を備えたオンライン手書き
    文字認識装置において、 前記座標点列の複数の点列から、特徴量を求め、しきい
    値と比較して手書き座標の特徴点を抽出する特徴抽出
    部、オフストロークを含む標準文字パターンを登録した
    認識辞書部、入力パターンと辞書パターンの各々に対
    し、上下左右の4方向のベクトルに対応させた対応点を
    元に、順次マッチング処理するバックボーンベクトル対
    応マッチング部で構成したことを特徴とするオンライン
    文字認識装置。
  2. 【請求項2】請求範囲第1項において、前記バックボー
    ンベクトル対応マッチング部で得られた認識候補文字群
    に対して、辞書のオフストローク情報を付加して入力文
    字パターンの特定部分を識別する詳細識別部を設けたこ
    とを特徴とするオンライン文字認識装置。
  3. 【請求項3】請求範囲第1項において、前記特徴量は、
    複数点列でなる面積および角度変情報であることを特徴
    とするオンライン文字認識装置。
  4. 【請求項4】請求範囲第1項において、前記分類比較し
    て手書き文字を認識する認識部の分類として、辞書パタ
    ーンと入力パターンのストローク長差で行う認識部であ
    ることを特徴とするオンライン文字認識装置。
  5. 【請求項5】手書き座標を入力する座標入力装置、上記
    手書き座標列から特徴点を抽出する特徴抽出部、上記特
    徴抽出部から得られた特徴パターンと、辞書パターンを
    分類比較して手書き文字を認識する認識部、認識した結
    果を表示する認識結果表示部を備えたオンライン手書き
    文字認識装置において、 くずし度設定部を設け、前記くずし度設定部で設定した
    値と手書き文字を認識する認識部の分類のしきい値を制
    御するように構成したことを特徴とするオンライン文字
    認識装置。
  6. 【請求項6】手書き座標を入力する座標入力装置、上記
    手書き座標列から特徴点を抽出する特徴抽出部、上記特
    徴抽出部から得られた特徴パターンと、辞書パターンを
    分類比較して手書き文字を認識する認識部、認識した結
    果を表示する認識結果表示部を備えたオンライン手書き
    文字認識装置において、 辞書パターンと入力パターンの特徴量から、くずし度を
    求め、このくずし度から、前記手書き文字認識装置のシ
    ステムクロックを制御する手段を設けたことを特徴とす
    るオンライン文字認識装置。
  7. 【請求項7】請求範囲第6項において、前記くずし度の
    特徴量として、辞書パターンと入力パターンの画数差で
    あることを特徴とするオンライン文字認識装置。
JP01503597A 1997-01-29 1997-01-29 オンライン手書き文字認識装置 Expired - Fee Related JP3470541B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01503597A JP3470541B2 (ja) 1997-01-29 1997-01-29 オンライン手書き文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01503597A JP3470541B2 (ja) 1997-01-29 1997-01-29 オンライン手書き文字認識装置

Publications (2)

Publication Number Publication Date
JPH10214312A true JPH10214312A (ja) 1998-08-11
JP3470541B2 JP3470541B2 (ja) 2003-11-25

Family

ID=11877590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01503597A Expired - Fee Related JP3470541B2 (ja) 1997-01-29 1997-01-29 オンライン手書き文字認識装置

Country Status (1)

Country Link
JP (1) JP3470541B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002091288A1 (en) * 2001-05-10 2002-11-14 Bijitec Pte Ltd System and method for compressing stroke-based handwriting and line drawing
JP2007140345A (ja) * 2005-11-22 2007-06-07 Nintendo Co Ltd 手書き学習支援プログラムおよび手書き文字認識プログラム
CN1333366C (zh) * 2005-04-01 2007-08-22 清华大学 基于统计结构特征的联机手写汉字识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002091288A1 (en) * 2001-05-10 2002-11-14 Bijitec Pte Ltd System and method for compressing stroke-based handwriting and line drawing
CN1333366C (zh) * 2005-04-01 2007-08-22 清华大学 基于统计结构特征的联机手写汉字识别方法
JP2007140345A (ja) * 2005-11-22 2007-06-07 Nintendo Co Ltd 手書き学習支援プログラムおよび手書き文字認識プログラム

Also Published As

Publication number Publication date
JP3470541B2 (ja) 2003-11-25

Similar Documents

Publication Publication Date Title
US7394934B2 (en) Recognition of electronic ink with late strokes
US9323456B2 (en) Multi-character continuous handwriting input method
US5590219A (en) Method and apparatus for recognizing gestures on a computer system
JP5071914B2 (ja) 認識グラフ
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US5737443A (en) Method of joining handwritten input
CN101299236B (zh) 一种中文手写词组识别方法
US5926567A (en) Method and apparatus for storing and rapidly displaying graphic data
JPH10214312A (ja) オンライン手書き文字認識装置
JP3046472B2 (ja) 手書き図形認識装置
JP4148867B2 (ja) 筆跡処理装置
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
KR940007345B1 (ko) 온라인 한글 필기체 문자의 인식방법
JP2000163514A (ja) 文字認識方法、文字認識装置および記憶媒体
JPH11126236A (ja) オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体
JP2633523B2 (ja) 手書き画入力装置
JPH045231B2 (ja)
KR100290606B1 (ko) 온라인 한글 필기체 문자 인식방법
JP3817281B2 (ja) 情報処理装置及び方法
JP3365538B2 (ja) オンライン文字認識方法および装置
JPH07117989B2 (ja) 手書き文字認識装置
JPH08190603A (ja) 文字認識装置及びその候補文字表示方法
JPH04337890A (ja) オンライン手書き文字認識装置
JPH063593B2 (ja) 手書き速記文字変換装置
JPH07182456A (ja) 文字入力装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090912

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100912

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees