JPH10214312A - オンライン手書き文字認識装置 - Google Patents
オンライン手書き文字認識装置Info
- Publication number
- JPH10214312A JPH10214312A JP9015035A JP1503597A JPH10214312A JP H10214312 A JPH10214312 A JP H10214312A JP 9015035 A JP9015035 A JP 9015035A JP 1503597 A JP1503597 A JP 1503597A JP H10214312 A JPH10214312 A JP H10214312A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- pattern
- feature
- dictionary
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
ライン手書き文字認識装置の提供。 【解決手段】手書き座標列から特徴点を抽出し、辞書パ
ターンを分類比較して手書き文字を認識する認識部し、
認識した結果を表示するオンライン手書き文字認識装置
において、座標点列の複数の点列から、特徴量を求め、
しきい値と比較して手書き座標の特徴点を抽出する特徴
抽出部100と、オフストロークを含む標準文字パター
ンを登録した認識辞書部400,入力パターンと辞書パ
ターンの各々に対し、上下左右の4方向のベクトルに対
応させた対応点を元に、順次マッチング処理するバック
ボーンベクトル対応マッチング部200で構成した。
Description
き文字認識装置に関し、特に、楷書入力から一筆書きし
たような続け入力に対しも、辞書サイズが少なく、か
つ、高性能に認識できる手書き文字認識装置に関する。
識方式には、入力制限方式からの分類として、(1)画
数,筆順を固定にする方式、(2)どちらかをフリーに
する方式、(3)どちらの制限もなくフリーにする方式
がある。一方、アルゴリズムからの分類として、(4)
ストロークの構造を解析する構造解析方式、(5)スト
ロークの特徴点を辞書とパターンマッチングするパター
ンマッチング方式がある。それぞれ特徴があり、性能と
兼ね合いで決められる。
は(2)の方式が、また、辞書の学習の観点から、
(5)の方式が多く用いられている。
般によく行われている手法に、楷書の標準パターン(辞
書)の他に、続け字の標準パターンも登録しておく方法
がある。
して、特開昭57−45679号,特開平8−249424号に示すよ
うに、オンストロークのみならず、オフストローク(ペ
ンアップ中のストローク)をも仮想的に仮結合して(一
筆書きにして)、そのストロークを等分割、あるいは、
等間隔に特徴点を抽出し、これを辞書とマッチングする
方式がある。
平8−249424 号公報に記載されているような、特徴点を
ダイナミックプログラミング(DP)方式により、入力
パターンと辞書パターンの対応をとり、距離値を計算す
る方式と、電子通信学会研究会論文、PRL84−68
(1985.1.25),PP19−PP26,“オン
ライン文字認識における標準文字と続け字との対応点抽
出法”にあるようにオフストロークの安定性に着目し
て、オフストロークとの対応点を抽出して続け字を認識
する方式がある。
に、従来、情報処理学会論文誌第27巻第5号(昭和6
1年5月)、PP492−PP498,“画数,筆順,
回転,区切りに依存しないオンライン手書き図形認識方
式”にあるように、面積法を用いて、手ぶれや、座標入
力装置のノイズ等の影響を受けない方法が考案されてい
る。別な方式として、前述の特開平8−249424 号公報に
記載されているように、ストロークを追跡して所定角度
以上の曲がり角度点を特徴点とする角度法がある。
しても認識できない文字群に対し、カテゴリ別の詳細識
別方式が用いられる。たとえば、電子情報通信学会論文
誌、D−2,NO.4,PP592−599、“マルチ
メディア端末用手書き入力インタフェースの設計とその
応用”には、ストロークの終了方向(“れ”と“わ”)、
ストロークの始点位置(“カ”と“刀”)、画数の差
(“ば”と“ぱ”)等の175の特徴関数を用いて判定
し、認識性能を向上させている。さらに、特開昭55−
33245号公報には、ストローク対の交叉を検出し、
識別している(例えば“に”と“土”と“上”)ことが
記載されている。
igtal Assisitant)が普及してきているが、一般に、画
数や筆順をフリーにすると認識時間も多く要し、認識速
度を快適にするためには、文字認識中は、クロック速度
をシステムの最高速度で動作させている。
字を認識の方法では、下記のような問題点がある。
に登録すると辞書サイズが大きくなり、かつ、認識速度
や、認識率の低下が発生してくる問題がある。
を生成する方式では、続け字を辞書に登録しない代わ
り、オフストロークの近似点も登録するため、同様に、
辞書サイズが大きくなるという問題点がある。同様に、
辞書サイズが大きくなれば、認識速度も遅くなる。
は、続け字の認識が、オフストロークに依存するという
問題点がある。したがって、標準パターンのオフストロ
ークから、入力パターンのオフストロークを推測するな
どが必要になり、推測ミスや、処理時間がかかるという
問題がある。同様に、近似点をDP方式で辞書と対応さ
せる方式も時間が多く要するなど問題点がある。
合、面積抽出法では、ノイズには強いが、鋭角の抽出が
できない問題がある。一方、角度抽出法では、ノイズの
影響が受け易いという問題点がある。
ための情報、たとえば、ループの個数や、クロス位置が
曖昧になり、詳細識別が困難になるなど問題を生じてい
た。第6に、パーソナルな携帯端末では、楷書入力する
代わり、快適な認識速度の提供が欲しい場合がある。一
方、認識速度を犠牲にするが、くずし字も認識して欲し
いなど、柔軟に設定できなかった。認識時間を速くする
ためには、高性能なCPUを使用するか、ダイナミック
にシステムクロックを上げるなどしなければならない。
しかし、当然、認識速度と、電池の寿命時間とのトレー
ドオフの関係になる。このように、従来のシステムで
は、ユーザの手書き入力状態、すなわち、くずし度合い
に応じて、認識速度全体を変化させることはできないな
ど、マンマシン性に問題があった。
を安定して抽出でき、かつ、文字の骨格情報を利用し
て、楷書入力から続け字入力までを高性能に認識できる
オンライン手書き文字文字認識装置を提供するにある。
また、ユーザの入力パターンのくずし字の度合いと認識
速度を対応させることのできるオンライン手書き文字文
字認識装置を提供するにある。
成するために、手書き座標を入力する座標入力装置、上
記手書き座標列から特徴点を抽出する特徴抽出部、上記
特徴抽出部から得られた特徴パターンと、辞書パターン
を分類比較して手書き文字を認識する認識部、認識した
結果を表示する認識結果表示部を備えたオンライン手書
き文字認識装置において、前記座標点列の複数の点列か
ら、特徴量を求め、しきい値と比較して手書き座標の特
徴点を抽出する特徴抽出部、オフストロークを含む標準
文字パターンを登録した認識辞書部、入力パターンと辞
書パターンの各々に対し、上下左右の4方向のベクトル
に対応させた対応点を元に、順次マッチング処理するバ
ックボーンベクトル対応マッチング部で構成したことを
特徴としている。
ッチング部で得られた認識候補文字群に対して、辞書の
オフストローク情報を付加して入力文字パターンの特定
部分を識別する詳細識別部を設けたことを特徴としてい
る。
出部は、複数点列でなる面積および角度変情報で検出す
ることを特徴としている。
認識部の分類として、辞書パターンと入力パターンのス
トローク長差で行う認識部であることを特徴としてい
る。
度設定部で設定した値と手書き文字を認識する認識部の
分類のしきい値を制御するようにしたことを特徴とす
る。さらに、辞書パターンと入力パターンの特徴量か
ら、くずし度を求め、このくずし度から、前記手書き文
字認識装置のシステムクロックを制御する手段を設けた
ことを特徴とする。
図21を用いて説明する。
構成を示したものである。1は座標入力装置TB、2は
液晶装置LCDである。1と2のデバイスは積層してあ
る。座標入力装置TBの座標はストローク入出力部4で
検出し、その筆跡はフィードバックされ、ペン3の動き
に応じて表示するようになっている。入力されたストロ
ーク座標点列は、文字認識部5に入力し、文字候補とし
て出力する。出力された文字候補群は日本語処理部6に
入力し、日本語として意味があるかどうか、日本語辞書
部7を参照して判定し、その結果を認識結果表示部8に
表示する。文字認識部5は、座標点列から特徴を抽出す
る特徴抽出部100,抽出された特徴点はバックボーン
ベクトル対応マッチング部200で文字の骨格として対
応点を検出し、認識辞書部400とマッチング処理す
る。さらに、候補文字群の中から、詳細識別部300で
詳細識別処理して、認識性能を向上させている。
部9では、ユーザから、図19に示すようなアイコンを
用いて、楷書入力か、あるいは、続け字入力かを設定
し、これにより、認識処理速度を柔軟に変えることがで
きる。すなわち、楷書入力では、認識速度が速くなり、
続け字入力では、認識レベルを詳細に識別するが、処理
速度は多く要するようになっている。勿論、図19のア
イコンでその中間の値も設定できるようになっている。
ア構成を図2により説明する。図2において、コンピュ
ータ(CPU)10のバスには、座標入力コントローラ
(TBC)11,液晶コントローラ(LCDC)12,
メモリ(MEM)13,外部との通信コントローラ(N
ET)14が接続されている。なお、メモリ(MEM)
13には、オペレーテイングシステム(OS)やプログ
ラム、さらに各種辞書が格納されている。
である文字認識部5の詳細フローを説明する。
ク)の特徴点(近似点)を抽出する特徴抽出部100の
詳細フローである。まず、入力された座標点列(例:
日)を正規化するため、オフストロークも端点を接続す
る1筆化処理をおこなう(ステップ110)。次に、オ
フストロークも含めたリサンプリング処理を行う(ステ
ップ120)。この処理は、等間隔に座標を補間するも
ので、入力された座標点列のサンプル速度や、入力速度
の影響をなくすためにある。次に、ステップ130で正
規化処理を行う。これは、以下のように計算する。先ほ
ど求めたリサンプリング座標点列の長さを全て加算し、
それを座標点列数で除算することで、重心位置を計算す
る。次に、リサンプリングした座標点列のX,Y軸の最
大最小値から、入力データのサイズを求め、先ほど求め
た重心位置とで正規化を行う。図3の例では、左下に小
さく入力された座標点列(ステップ120)が、正規化
され枠の中心に、大きく正規化されていることがわか
る。このようにすることにより、入力位置や入力サイズ
による影響を軽減している。なお、オフストロークも含
めないで重心位置を求めると、離れた位置に入力された
ストロークにより、重心位置が大きく影響する。このた
め、本発明の一実施例のように、オフストロークも含め
て、一旦、リサンプリングし、この点列を用いて重心位
置を求めている。
処理を行う(ステップ140)。この処理は、文字の特
徴点を求める処理であり、後述のマッチング処理と大い
に関係する。特徴点を、等間隔や、等分割で求める方法
は、処理は簡単であるが、特徴点が多くなり、辞書サイ
ズが大きくなる欠点がある。したがって、本発明の一実
施例では、文字の形を表すに必要な最低限の特徴点を抽
出することにする。これは、直線部分は端点のみとし、
曲がりの部分は、複数の点で構成するようにすればよ
い。したがって、オフストロークには近似点は存在しな
い。図4を用いて、以下説明する。
したもので、開始点Ps、から始まり、Pa,Pb,P
c,Pd…と続くものとする。ここで、本発明の一実施
例では、面積法と角度法の2つを併用して特徴点を求め
ることにする。今、開始点Psも含め、順次入力された
3つの座標点列から構成される三角形の面積をΔSa,Δ
Sb,ΔSc,…、三角形の内角をθa,θb,θc,
…とすると、下記判定式のいずれかが成り立つときに、
特徴点とする。
+…) > しきい値TH1)and(三角形の内角(θ
a,θb,θc,…) > しきい値TH2)になった
点と特徴点とする。
…) < しきい値TH2になった点と特徴点とする。
内角がしきい値より大きいときの条件は、曲線の検出に
良好に働く。さらに、三角形の内角がしきい値より、小
さいとき、これもまた、特徴点とすることで、折り返し
のあるストロークの先頭も特徴点として検出できる。
ローを説明したものである。まず、累積面積Stをクリ
アし、また、開始点Psをリードして、座標バッファP
(1)に格納する(ステップ141)。次の座標点Pa,
Pbもリードし、座標バッファP(2),P(3)に格
納する(ステップ142)。3点の座標から、面積ΔS
を計算し、累積面積Stを演算する(ステップ14
3)。同様に、3点の座標から内角θを計算する(ステ
ップ144)。次に、上記求めた累積面積Stと内角θ
をしきい値TH1,TH2と各々比較する(ステップ1
45)。もし、条件がいずれも成立しないとき、次の座
標点Pcをリードし、次の3点の座標を準備しておく
(ステップ146)。前記条件が成立したとき、最後に
取り込んだ座標の1つ前を近似点として格納する(ステ
ップ147)。最後に、全サンプル点の座標終了かどう
か判定し(ステップ148)、もし、終了していなかっ
たら、求めた近似点を新たな開始点に設定し、次の近似
点を求める(ステップ149)。以上のように、本発明で
は、面積法と角度法を用いて、近似点を求めた。
ーンベクトル対応マッチング処理を説明する。最初に、
そのコンセプトを説明する。文字の形は基本的には、図
6に示すような、左右,上下の4つの方向のバックボー
ンで構成される(d1,d2,d3,d4)。そして、
斜め方向は、そのバックボーンベクトルの補助ベクトル
(d12,d23,d34,d41)とする。この補助
ベクトルは、中間的ベクトルであるため、両側のバック
ボーンベクトルのいずれにもなりうるものとする。
されたストロークの近似点と辞書の近似点をどのように
対応させるかを、図7〜図10の各ケースで説明する。
それぞれの図において、○印は辞書パターンの近似点、
●印は入力パターンの近似点である。隣り合う近似点間
のベクトルを、辞書パターンはa1,a2ベクトル、入
力パターンはb1,b2ベクトルとする。対応点の処理
は、次のようにする。 (1)最初に、先頭のベクトルa1,b1を対応するもの
とする(■印)。
方向により、ベクトルの比較,入力パターンベクトルの
前進,辞書パターンベクトルの前進を行う。
理する。
トルa1,b1が最初に対応するとして、1つ先のa
2,b2のベクトルを比較し、同一方向((図6のd
1)であるとき、仮対応するものとしてa2,b2に前
進させる(□印)。
1が最初に対応し、次に、1つ先のa2の方向をb1と
判定し、同一ベクトルならば、a2を仮対応するとして
前進させる。
ターンのベクトルが逆方向のときの例である。
に対応するとし、b2ベクトルは、辞書ベクトルa2と
は逆方向のため対応しない。次に、1つ先の辞書ベクト
ルa3を、b2ベクトルと比較し、同じであれば、a2
ベクトルを進め、a3ベクトルをb2ベクトルと仮対応
するものとする。
1,a2,a3を、次々に前進させ、入力パターンのベ
クトルb1と仮対応させた例である。
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なDPマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。
“日”の辞書パターン、(c)“区”上記バックボーン
ベクトルを用いて、入力されたストロークの近似点と辞
書の近似点をどのように対応させるかを、図7〜図10
の各ケースで説明する。それぞれの図において、○印は
辞書パターンの近似点、●印は入力パターンの近似点で
ある。隣り合う近似点間のベクトルを、辞書パターンは
a1,a2ベクトル、入力パターンはb1,b2ベクト
ルとする。対応点の処理は、次のようにする。 (1)最初に、先頭のベクトルa1,b1を対応するもの
とする(■印)。
方向により、ベクトルの比較,入力パターンベクトルの
前進,辞書パターンベクトルの前進を行う。
理する。
トルa1,b1が最初に対応するとして、1つ先のa
2,b2のベクトルを比較し、同一方向((図6のd
1)であるとき、仮対応するものとしてa2,b2に前
進させる(□印)。
1が最初に対応し、次に、1つ先のa2の方向をb1と
判定し、同一ベクトルならば、a2を仮対応するとして
前進させる。
ターンのベクトルが逆方向のときの例である。
に対応するとし、b2ベクトルは、辞書ベクトルa2と
は逆方向のため対応しない。次に、1つ先の辞書ベクト
ルa3を、b2ベクトルと比較し、同じであれば、a2
ベクトルを進め、a3ベクトルをb2ベクトルと仮対応
するものとする。
1,a2,a3を、次々に前進させ、入力パターンのベ
クトルb1と仮対応させた例である。
ーンベクトルを基に、辞書ベクトルとの対応点探すこと
が、後のマッチング処理に重要になる。つまり、マッチ
ング処理で距離値演算するとき、基本的な骨格方向で対
応を取り、その後、対応点同士で距離値演算をするた
め、一般的なDPマッチングによる対応計算に比べ、演
算回数を減らす効果を有す。
“日”の辞書パターン、(c)“区”の辞書パターンと
の対応を取ったときの関係を示す。●印は対応がとれた
近似点,○印は未対応の近似点を示している。以上のよ
うに、4方向のバックボーンベクトルにより、ほぼ、対
応点を求めることができる。ここで、注目すべきこと
は、対応点を求めるとき、オンストローク,オフストロ
ークとも無関係にバックボーンベクトル検出することで
ある。これにより、入力パターンが(a)に示すように
続け書きされていても、楷書書きの辞書パターンとのベ
クトルと対応が取れることである。これは、辞書サイズ
を小さくできるとともに、処理時間も少なくすることが
できる効果がある。
距離値を計算するが、その基本的な識別要素であるベク
トル差の計算方法を、まず説明する。図12は、ベクト
ル差演算の基本的な考え方を示したものである。ここ
で、○印は辞書パターン、●印は入力パターンとする。
また、8点線は、その特徴点が対応しているものとす
る。
ンと入力パターンとが1:1の場合、各々のベクトルa
1,b1の差を演算する。
き、n線分の長さの割合に応じて、もう一方の線分を分
割し、各々のベクトル差の累積を演算する。これは、一
方の線分が1本のとき、たとえば、“1”、“一”など
の直線ストロークの場合に多く発生する。
nの場合が、一般的には、ほとんどである。このケース
の場合、対応する線分間で長い線分のベクトルを、間に
ある線分の割合で分割し、そのベクトル差を演算する。
たとえば、a12とb2が、a21とb3のように、ベ
クトル差を演算する。そして、線分の長さの差が小さい
ときは、そのベクトル同士で差を演算する(例;a11
とb1)。最後に、対応する線分がなく、残った線分は
その長さをペナルティ値として計算する。
間に未対応の特徴点(近似点)がある場合には、線分分
割しながら、仮想対応点を演算し、距離値演算の精度向
上と演算の簡単化を図っていることが、本発明の特徴で
ある。なお、ベクトル差の演算はストロークの開始点か
ら終了点まで実施するが、ベクトル差が、所定値より大
きいとき、その文字は候補外であるとして、距離値演算
を、足切り処理し、高速化を実施できる。
ベクトル差の演算方法を説明したが、実際には、他の識
別要素も加味して距離値を演算する。図13は、認識距
離値演算の全体を述べたものである。前述のベクトル差
V(a−b)以外に、対応点同士の座標差P(a−b)、ス
トロークの開始点と終了点同士の始終点差Pse(a−
b)、最後に、ストローク長差L(a−b)がある。な
お、認識距離値Φは各々の識別要素に、係数α,β,
γ,δを掛け合わせて加重平均したものとする。ここ
で、各々の識別要素の意味は、ベクトル差V(a−b)
は、文字全体の骨格状態を把握する要素、座標差P(a
−b)と始終点差Pse(a−b)は対応点の位置関係
を把握する要素、最後のストローク長差L(a−b)
は、文字の複雑さを表す要素である。
ッチング方式の処理フローを図14〜図16を用いて説
明する。図14は、バックボーンベクトル対応マッチン
グ部200のメイン処理フローである。ステップ210
〜230で予め、大分類してから、対応点処理や、マッ
チング処理をおこなう。すなわち、まず、入力画数や、
入力ストローク長などの分類情報を収集する(ステップ
210)。この情報と辞書に格納されている情報から、
マッチングに不要な文字群を除く。本発明の一実施例で
は、入力画数+2が、辞書の画数より、小さいときのみ
以下の処理を行う(ステップ220)。これは、辞書に
は、楷書書きでパターンを格納されているが、この辞書
より、入力画数を多く入力することは少ないことから判
断している。つまり、正確には、続いて入力されるとこ
ろを、分かち書きしたり、無い画数を余分に入力してし
まったことにより発生する。一般的には、辞書の画数よ
り、2画以上多く入力されることはない。次に、もう1
つの分類として、入力ストローク長と辞書ストローク長
の差が、しきい値TH3より、小さいときのみマッチン
グを行う(ステップ230)。この処理は、入力ストロー
ク長に対し、大幅に異なる文字とのマッチングを省くも
ので、処理の高速化に必要である。以上の分類が終わっ
た後、前述のバックボーンベクトル対応処理を行う(ス
テップ240)。詳細フローは、図15で説明する。そ
して、最後に、求められた対応ベクトルを元に、距離値
演算であるマッチング処理を行う(ステップ250)。
以上の処理を全辞書について処理する(ステップ26
0)。
(図14、ステップ240)の詳細フローである。図7
〜図10で前述のアルゴリムに従い、処理される。ま
ず、ストロークの先頭の近似点を対応点に設定する(ス
テップ240a)。次に、辞書点および入力点を各々進
める(ステップ240b)。ベクトルを演算し、同一方
向かどうか判定する(ステップ240c)。同一方向か
どうかは、図6のバックボーンベクトルにて行う。その
中間の補助ベクトルは、前述のように、両側のベクトル
になりうるものとして判定する。ステップ240cの判
定で、同一方向のとき、ステップ240dにジャンプ
し、辞書点,入力点とも近似点を先に進める。一方、ス
テップ240cにおいて、異方向のとき、ステップ24
0gにジャンプし、辞書点を前進し、同様に方向判定す
る。もし、同一方向の時、辞書点を対応点候補として設
定する(ステップ240g〜240I)。次に、入力点
においても同様に前進させ、方向を判定する(ステップ
240j〜240l)。さて、ステップ240cにおい
て、同一方向のとき、次のベクトルも同一方向かどうか
を判定し(ステップ240e)、同一方向であれば、辞
書点,入力点とも対応点候補に設定する(ステップ24
0f)。異方向であれば、ステップ240gにジャンプ
する。以上の処理を全ての座標点について処理する(ス
テップm)。
応処理により求めた対応ベクトルを元に、認識距離値の
演算を行う処理フローである。この処理は、図13に述
べたように各識別要素を求め、係数を加重平均すること
である。まず、ベクトル差V(a−b)の要素を演算す
る(ステップ250a)。これは、図12に述べたよう
に、辞書ベクトルと入力ベクトルの差分を全対応点で累
積加算するものである。次に、座標差P(a−b)の識
別要素の演算(ステップ250b),始終点差Pse
(a−b)の識別要素の演算(ステップ250c),ス
トローク長差L(a−b)の識別要素の演算(ステップ
250d)を行う。最後に、認識距離値Φを各々の識別
要素と係数を掛け、加重平均して求める(ステップ25
0e)。以上の処理を、分類された文字全てについて処
理する(ステップ250f)。最後に、求められた距離
値を小さい順にソーティングすることで、候補文字群を
得ることができる。通常、第10位までを候補にして、
後は、棄却する。
グ方式により、得られた候補文字群に対し、図1の詳細
識別部300で詳細判定を行う。まず、詳細識別のコン
セプトを述べ、次に、処理フローを述べる。
のである。各詳細識別要素は、文字に対し共通処理する
ものと、字別の処理をするものに分類される。なお、共
通処理は、認識距離値へ、ペナルテイとして反映する
が、字別処理は、候補順位を入れ替えることにする。ま
ず、形状比較を行う。図示したように、形状比較のセグ
メントとして、直線,右ループ,右カーブ,右角,左ル
ープ,左カーブ,左角の7つに分け、形状を検出する。
なお、辞書にはオフストローク情報が付加されているた
め、この情報を利用して、入力パターンにもオフストロ
ーク情報を仮に割当ることで、特定部分の形状を判定す
ることができる。例えば、“は”は右ループ有り、
“け”は右カーブ有りと識別できる。共通処理として
は、例えば、ループの個数差をペナルティとして付加す
ることで詳細識別を行う。字別処理は、特に、似ている
文字群のテーブルを作成し、その文字のみどうしを比較
する。
の相対位置を比較するもので、図17に図示のように、
クロス型,T型,L型,Y型の4種類の有無を比較す
る。例えば、“石”はクロス無し、“右”はクロス有り
として検出する。なお、この相対位置比較は、関係する
ベクトルの直線から、交叉情報を得て行う。この相対位
置比較も、共通処理と字別処理の両方を行う。
ング方式では、基本的に画数情報は利用せず、1筆書き
されたものとして処理している。したがって、楷書から
続け字まで同一認識アルゴリズムで認識できる。しか
し、逆に、これにより、形がほとんど同じになる文字群
が発生し、認識性能を低下させてします。例えば、
“乙”と“二”は、同じパターンとして識別してしま
う。そこで、字別に画数を比較する。辞書には、正確な
画数が格納されているため、入力が2画なら“二”に、
1画なら“乙”とする。ストローク長についても同様に
識別できる文字がある(例:“末”と“末”、“!”と
“:”)。これについては、横棒、縦棒の長さを比較す
ることで識別できる。
を比較する。本発明では、オフストロークがあっても、
1筆であるとして認識する方式であるため、区別がはっ
きりしない字が存在する。そのため、違いのある部首の
みを切り出しで比較する(例:“什”と“汁”、“弘”
と“払”)。
ーを図18に示す。図18において、まず、入力パター
ンと辞書パターンのループを検出し、入力にあって、辞
書に無い場合、その文字にペナルティを付加する(ステ
ップ310)。また、入力パターンと辞書パターンの接
続情報を検出し、例えば、クロスの有無により、ペナル
ティを付加する(ステップ320)。この2つの処理は共
通処理であるため、ペナルティを付加した値をもとに、
再ソーテングする必要がある(ステップ330)。次に、
ソーテングした候補の第1位の文字が、字別にテーブル
化してある文字かどうか判定する(ステップ340)。
もし、テーブルに定義している文字が第1位にある場
合、前述の詳細識別処理を行う(ステップ350)。も
し、第1位の候補文字が、テーブルにある場合、他の候
補の対応する文字も存在するため、その文字も含め、さ
らに詳細に比較する。もし、正解文字以外の文字のほう
が入力パターンと近いとき、候補を入れ替える。
しているため、オフストローク情報を用いて、入力パタ
ーンにもオフストロークを仮割当、これにより、文字の
詳細を識別することで、認識率を向上させることが出来
る。
細について、図19〜図21を用いて説明する。まず、
図19には、くずし度設定パネルを示す。このパネルで
は、(a)楷書入力に設定するか、(c)続け字入力
か、あるいは、(b)その中間の入力かの状態を示して
いる。楷書入力に設定すると、図20に示すように、入
力ストロークと辞書ストロークのストローク長差のしき
い値TH3の値を小さくする。逆に、続け字にすると、
ストロークの変形が多くなるため、ストローク長差もバ
ラツキが大きなる。したがって、しきい値TH3は大き
くする必要がある。これは、図14の分類幅を変更して
いることになり、認識時間に密接に関係する。したがっ
て、ユーザは、楷書入力にしておけば、快適な認識速度
を享受できるが、くずし字の認識率は悪くなる。一方、
くずし字の多い人は、続け字側にして置くことにより、
認識率は良くなるが、認識速度は犠牲になる。以上のよ
うに、文字の分類のしきい値を変更することで、多様な
入力形態に対応可能で、特に、携帯端末で有効である。
ローを説明したものである。くずし度の設定パネルの値
を読み込み(ステップ14a)、次に、この値に応じ
て、しきい値テーブルを引き、設定するのみで実現でき
る(ステップ14b)。なお、くずし度の設定しきい値
として分類のしきい値としたが、その他のマッチング処
理の足きりしきい値でもよい。逆に、認識した文字の画
数と辞書の画数との差分を検出して、画数の差分が小さ
ければ、楷書入力であるかと判定することで、上記しき
い値TH3を小さくし、かつ、CPUのクロックを遅く
設定することで携帯端末の電池寿命を長持ちさせること
もできる。勿論、その逆の場合で、画数の差分が大きい
とき、入力パターンが続け字が多いと判断し、CPUの
クロックを早くする。このときは、電池の消耗も早くな
るため、電池寿命は少なくなる。いずれにせよ、分類の
幅を制御することで、電池の消耗を制御したり、認識の
処理速度を制御したりすることができる。
ような効果がある。まず、第1に、文字の骨格を所定の
角度のバックボーンベクトルに分解し、この後に、マッ
チング処理することで、楷書書き入力から続け書き入力
までの柔軟な入力が、1つの辞書パターンのみで認識可
能である。これによって、くずし字や楷書字などの複数
の辞書登録が不要となるため、辞書サイズが小さくなる
効果がある。また、バックボーンベクトル対応処理とマ
ッチング処理部を分けて処理することで、近似点の対応
が簡単になり、マッチングの処理時間の軽減することが
できる。
出する場合、複数の座標点列で構成する三角形の面積を
しきい値と比較する面積法と上記複数の座標点列で構成
する内角をしきい値と比較する角度法を組み合わせるこ
とで、安定して、かつ、少ない近似点を求めることが可
能である。これにより、辞書サイズが少なくてよいとい
う効果がある。
対応マッチング方式では、未対応の近似点をも、周辺の
対応点から、仮対応することにより、マッチングの距離
演算を精度よくできる効果がある。したがって、認識率
も向上する効果がある。
ことで、しきい値をダイナミックに変更して、認識処理
時間を変更することができる。これにより、楷書入力の
ように、あまり、くずし字を入力しないユーザには、快
適な認識速度を提供することができる。
数差で判断し、処理システムのクロック速度と連動させ
ることで、消費電力を制御することができ、携帯端末の
寿命を長くすることができる。
である。
る図である。
ーである。
を説明する図である。
理フローである。
明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
応を説明する図である。
応を説明する図である。
リズムを説明する図である。
ズムを説明する図である。
ある。
応処理フローである。
ーである。
を説明する図である。
ある。
明する図である。
の関係を説明する図である。
ーである。
ローク入出力部、5…文字認識部、9…くずし度設定
部、200…バックボーンベクトル対応マッチング部、
300…詳細識別部、400…認識辞書部。
Claims (7)
- 【請求項1】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、 前記座標点列の複数の点列から、特徴量を求め、しきい
値と比較して手書き座標の特徴点を抽出する特徴抽出
部、オフストロークを含む標準文字パターンを登録した
認識辞書部、入力パターンと辞書パターンの各々に対
し、上下左右の4方向のベクトルに対応させた対応点を
元に、順次マッチング処理するバックボーンベクトル対
応マッチング部で構成したことを特徴とするオンライン
文字認識装置。 - 【請求項2】請求範囲第1項において、前記バックボー
ンベクトル対応マッチング部で得られた認識候補文字群
に対して、辞書のオフストローク情報を付加して入力文
字パターンの特定部分を識別する詳細識別部を設けたこ
とを特徴とするオンライン文字認識装置。 - 【請求項3】請求範囲第1項において、前記特徴量は、
複数点列でなる面積および角度変情報であることを特徴
とするオンライン文字認識装置。 - 【請求項4】請求範囲第1項において、前記分類比較し
て手書き文字を認識する認識部の分類として、辞書パタ
ーンと入力パターンのストローク長差で行う認識部であ
ることを特徴とするオンライン文字認識装置。 - 【請求項5】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、 くずし度設定部を設け、前記くずし度設定部で設定した
値と手書き文字を認識する認識部の分類のしきい値を制
御するように構成したことを特徴とするオンライン文字
認識装置。 - 【請求項6】手書き座標を入力する座標入力装置、上記
手書き座標列から特徴点を抽出する特徴抽出部、上記特
徴抽出部から得られた特徴パターンと、辞書パターンを
分類比較して手書き文字を認識する認識部、認識した結
果を表示する認識結果表示部を備えたオンライン手書き
文字認識装置において、 辞書パターンと入力パターンの特徴量から、くずし度を
求め、このくずし度から、前記手書き文字認識装置のシ
ステムクロックを制御する手段を設けたことを特徴とす
るオンライン文字認識装置。 - 【請求項7】請求範囲第6項において、前記くずし度の
特徴量として、辞書パターンと入力パターンの画数差で
あることを特徴とするオンライン文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01503597A JP3470541B2 (ja) | 1997-01-29 | 1997-01-29 | オンライン手書き文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01503597A JP3470541B2 (ja) | 1997-01-29 | 1997-01-29 | オンライン手書き文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10214312A true JPH10214312A (ja) | 1998-08-11 |
JP3470541B2 JP3470541B2 (ja) | 2003-11-25 |
Family
ID=11877590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01503597A Expired - Fee Related JP3470541B2 (ja) | 1997-01-29 | 1997-01-29 | オンライン手書き文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3470541B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091288A1 (en) * | 2001-05-10 | 2002-11-14 | Bijitec Pte Ltd | System and method for compressing stroke-based handwriting and line drawing |
JP2007140345A (ja) * | 2005-11-22 | 2007-06-07 | Nintendo Co Ltd | 手書き学習支援プログラムおよび手書き文字認識プログラム |
CN1333366C (zh) * | 2005-04-01 | 2007-08-22 | 清华大学 | 基于统计结构特征的联机手写汉字识别方法 |
-
1997
- 1997-01-29 JP JP01503597A patent/JP3470541B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002091288A1 (en) * | 2001-05-10 | 2002-11-14 | Bijitec Pte Ltd | System and method for compressing stroke-based handwriting and line drawing |
CN1333366C (zh) * | 2005-04-01 | 2007-08-22 | 清华大学 | 基于统计结构特征的联机手写汉字识别方法 |
JP2007140345A (ja) * | 2005-11-22 | 2007-06-07 | Nintendo Co Ltd | 手書き学習支援プログラムおよび手書き文字認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3470541B2 (ja) | 2003-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7394934B2 (en) | Recognition of electronic ink with late strokes | |
US9323456B2 (en) | Multi-character continuous handwriting input method | |
US5590219A (en) | Method and apparatus for recognizing gestures on a computer system | |
JP5071914B2 (ja) | 認識グラフ | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
US5737443A (en) | Method of joining handwritten input | |
CN101299236B (zh) | 一种中文手写词组识别方法 | |
US5926567A (en) | Method and apparatus for storing and rapidly displaying graphic data | |
JPH10214312A (ja) | オンライン手書き文字認識装置 | |
JP3046472B2 (ja) | 手書き図形認識装置 | |
JP4148867B2 (ja) | 筆跡処理装置 | |
JP3977473B2 (ja) | 手書き文字認識方法及び手書き文字認識装置 | |
KR940007345B1 (ko) | 온라인 한글 필기체 문자의 인식방법 | |
JP2000163514A (ja) | 文字認識方法、文字認識装置および記憶媒体 | |
JPH11126236A (ja) | オンライン手書き文字認識装置およびオンライン手書き文字認識方法ならびにその方法を記録した記録媒体 | |
JP2633523B2 (ja) | 手書き画入力装置 | |
JPH045231B2 (ja) | ||
KR100290606B1 (ko) | 온라인 한글 필기체 문자 인식방법 | |
JP3817281B2 (ja) | 情報処理装置及び方法 | |
JP3365538B2 (ja) | オンライン文字認識方法および装置 | |
JPH07117989B2 (ja) | 手書き文字認識装置 | |
JPH08190603A (ja) | 文字認識装置及びその候補文字表示方法 | |
JPH04337890A (ja) | オンライン手書き文字認識装置 | |
JPH063593B2 (ja) | 手書き速記文字変換装置 | |
JPH07182456A (ja) | 文字入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070912 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080912 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090912 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100912 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100912 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |