JP3720873B2

JP3720873B2 - 手書き文字認識方法及びその装置

Info

Publication number: JP3720873B2
Application number: JP15183195A
Authority: JP
Inventors: 良文坂井; 佳隆池田
Original assignee: NS Solutions Corp
Current assignee: NS Solutions Corp
Priority date: 1995-06-19
Filing date: 1995-06-19
Publication date: 2005-11-30
Anticipated expiration: 2020-11-30
Also published as: JPH096920A

Description

【０００１】
【産業上の利用分野】
本発明は、手書き文字認識に関し、特に、続け字（カーシブ；cursive）で入力された複数文字分の手書き文字データから１字分の手書き文字データを順次切り出す手書き文字認識方法及びその装置に関する。
【０００２】
【従来の技術】
これまでのオンライン手書き文字認識システムでは、入力装置上に予め設定された該四角形の領域（入力枠）に対し利用者が１文字ずつ手書き文字を入力するようになっていたが、近年、入力枠を設けることなく利用者が自由に入力した手書き文字を認識できる技術が開発されてきた。
【０００３】
日本語や中国語の場合であれば、手書き文字入力を行なうに際し１文字ずつ分けて入力することを要求しても、利用者は大した違和感をもつことなく手書き文字入力を行なうことができる。しかしながら、英語やフランス語、スペイン語などの単語はアルファベットの文字列として表わされるが、アルファベットの文字列が手書き文字入力される場合には、複数の文字にまたがって１ストロークの運筆がなされること、すなわち続け字（カーシブ;cursive）で入力されることが多い。さらに、英語などのラテンアルファベットのほか、ロシア語などで使用されるキリル文字、さらにはアラビア文字なども、続け字で入力されることが多い。このように続け字で入力されることが多い言語を対象とする場合には、続け字で入力されることを前提として手書き文字認識を行なう必要がある。このような場合の手書き文字認識方法の一つとして、英語を例に挙げれば、「ｂｏｏｋ」とか「ｌｏｏｋ」といった単語を単位としてパターンマッチングで文字認識を行なう方法がある。この方法には、「ｂｏｏｋ」と「ｌｏｏｋ」のように全体の形が似ている単語同士での識別が難しく、認識用辞書の容量が膨大になり、かつ、辞書にない単語の認識が行なえないという問題がある。
【０００４】
続け字で入力される手書き文字データに対する手書き文字認識方法の他の方法として、続け字として入力された複数文字分の手書き文字データから特徴点を見つけ、この特徴点を切り出し位置として１文字分ずつのデータを切り出し、１文字ごとに手書き文字認識を行なう方法がある。特徴点としては、ストローク長を等分する点や、運筆時のペン先の移動方向を逐次検出して移動方向がある特定の方向から別の特定の方向に変化した点などが選択される。ストローク長を等分する点を特徴点とする方法は、字によってストローク長が異なることがあるので（「ｗ」は他の文字に比べストローク長が長い）、必ずしも有効でない。運筆の移動方向の変化を見る方法では、個人差が大きく、例えば「ｄ」と「ｃｌ」の区別などを行なうことが困難である。
【０００５】
特徴点を抽出する方法として、２次元空間内のデータとして入力された手書き文字データを入力方向に平行な直線上に射影してヒストグラムを作成し、このヒストグラムから特徴点を抽出する方法（ヒストグラム法）がある。図１３はヒストグラム法を説明する図であって、ここでは、続け字で英語文字列「ａｌｃ」に対応する手書き文字入力データ９１が入力されたものとする。入力方向に対し垂直であって、所定の刻み幅ｄの間隔で相互に平行な多数の直線（図示破線）を考え、これらの直線と手書き文字入力データ９１との交点の数を数え、この交点の数に基づいてヒストグラム９２を考える。英語文字列の手書き文字データでは、字と字の間の領域では直線ごとの交点の数は１であり、字の中心部では直線ごとの交点の数は２以上であると考えられるから、ヒストグラム９２に表わされた頻度（直線ごとの交点の数）の変化を調べて頻度が変化するところから特徴点を抽出しここを切り出し位置とすることができる。しかしながら、単純なヒストグラム法では、利用者の書き癖によっては頻度１の範囲が複数文字にわたって連続したり、図１３の「ｌｃ」の部分に見られるように、寝た字では隣接する文字が重なって、文字を切り出すべき位置を正確に見い出せないことがある。
【０００６】
特徴点を見つけて切り出し位置とする方法では、切り出し位置を一度誤ると、その誤っている位置を基準に次の文字切り出しが行なわれるので、切り出し位置の誤りが伝播することになり、切り出し位置の誤りは広範囲に影響を及ぼすことになる。
【０００７】
正しい位置での切り出しを行なうために、文字の縦横比などを利用することが試みられている。この方法は、例えば横書きの場合、文字高に比べて極端に短い位置での切り出しを行なわないことにより、誤った位置での切り出しを防止しようとするものである。しかしながら、手書き文字での縦横比は利用者によってかなりばらつきがあり、また、文字によっても縦横比が異なるので、縦横比を利用する方法でも切り出し位置の誤りを減らすことは難しい。例えば、「ｉ」と「Ｗ」とでは、文字の縦横比が異なるので、同一の基準を用いて文字切り出しを行なった場合に、いずれの文字も正しく切り出されるとは限らない。また、異なる利用者の手書き文字データのいずれに対しても正確に文字切り出しが行なえるような、利用者に共通した切り出し基準を見つけることも困難である。
【０００８】
以上、続け字で入力された手書き文字データに対して手書き文字認識を行なう方法について、単語単位でパターン認識する方法と、１文字分ずつの手書き文字データを切り出して文字認識を行なう方法とを説明したが、認識率や認識の速度、必要とする辞書容量の小ささなどの点を考慮すると、１文字分ずつ手書き文字データを切り出す方法の方が有効である。
【０００９】
以下の説明において、「文字」とは、文字コードと１対１に対応するものを指し、具体的にはこのように文字コードによって一意に指定されるものの名前のことを意味し、「インクデータ」とは、利用者がペンなどの入力デバイスによって入力した軌跡データを指し、「手書き文字入力」とは、文字認識の対象となるインクデータを入力する作業を指し、「手書き文字」とは、手書き文字認識処理を施すことを意図して利用者が入力したインクデータのことを指し、「文字切り出し」とは、手書き文字のインクデータ群の中から、１文字に相当するインクデータを抽出することを指す。
【００１０】
また、「距離」とは、認識誤差量とも呼ばれ、候補文字の形状的な特徴を表わすデータ（特徴量）やインクデータがある場合に、これらのデータのうちの任意の２つのものについて、両者の差異を定量的に表わす尺度のことである。例えば、データが特徴空間内の特徴ベクトルとして表わされる場合には、２つの特徴ベクトル間の差ベクトルのノルムとして距離を定義することができる。距離が小さいほど、２つのデータがよく一致していることになる。切り出されたインクデータをもとに認識辞書を探索してそのインクデータに対応する候補文字を見つけ出した場合には、その候補文字に対応する特徴データとインクデータとの距離が小さいほど、探索された候補文字が利用者の意図した文字である可能性が高いということになる。
【００１１】
「クラスタ」とは、候補文字などについて、その形状的な特徴を表わすデータの代表となるべきもののことを指す。インクデータから特徴ベクトルを生成して文字認識処理が行なわれる場合には、クラスタは候補文字の特徴ベクトル（代表点）に相当する。
【００１２】
【発明が解決しようとする課題】
入力枠を用いない手書き文字認識システムでアルファベットの文字列のように続け字で入力された手書き文字データの手書き文字認識を行なう場合、上述したように、単語単位でパターン認識を行なうよりも、続け字の手書き文字データから１文字分の手書き文字データを順次切り出して認識を行なう方が有効である。しかしながら、従来の文字切り出し方法では、利用者の書き癖によっては正確に切り出し位置を設定できないことがあり、このため、誤った切り出し位置で切り出された手書き文字データに基づいて文字認識を行なうこととなって、認識率のさらなる向上を望めないという問題点がある。
【００１３】
本発明の目的は、正確な文字切り出しを行なうことによって、アルファベット文字列で代表される続け字で入力される手書き文字データに対する手書き文字認識の認識率の向上を図ることにある。
【００１４】
【課題を解決するための手段】
本発明の手書き文字認識方法は、利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識方法において、未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から手書き文字の入力方向に沿って所定の長さの候補位置探索範囲を設定する探索範囲設定工程と、前記候補位置探索範囲内のインクデータから文字切り出しの位置の候補となる切り出し候補位置を決定する候補位置探索工程と、前記候補位置探索工程で決定された切り出し候補位置で切り出されたインクデータに基づいて文字認識を行う認識工程と、を有する。そして本発明は、候補位置探索工程における候補位置の探索方法として、以下の２通りの方法を提供する。
【００１５】
第１の方法では、基準線設定工程により、まず、入力された一連のインクデータに対して手書き文字の入力方向に平行な１対の基準線を設定し、その上で、候補位置探索範囲内のインクデータに関し、１対の基準線ではさまれた範囲から一方の基準線側に張り出している部分を検出した場合には、インクデータ上の点であって当該部分の直後もしくは直前にありかつ他方の基準線に対応する点を中心として当該部分を含むインクデータ部分を回転する。そして、手書き文字の入力方向に平行な直線上にインクデータを射影し、文字切り出しの位置の候補となる切り出し候補位置を射影点の数の増減に基づいて決定する。すなわちヒストグラム法を使用する。このように切り出し候補位置が決定したら、候補位置探索工程での回転が行なわれる前のインクデータを対象として認識工程を実行する。認識工程では、例えば、切り出し候補位置のそれぞれで文字切り出しが行なわれたとして、文字とその文字に対するクラスタを格納した認識辞書との比較・照合を行ない、切り出し位置ごとにその切り出し候補位置に対応する候補文字と対応するクラスタからのその候補文字の距離値とを求める。さらに、重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書を探索し、切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、その重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行なう重み付け工程と、重み付け工程で重み付けが行なわれた後の距離値の大小に応じて候補文字の中から認識文字を決定する決定工程と、を設けるようにしてもよい。この方法において使用される一対の基準線は、アルファベット文字列の場合であればそれぞれ並び線（ライン）とミーンラインに相当する直線である。この一対の基準線の求め方としては、例えば、インクデータから特徴点を抽出し、入力方向に垂直な直線上にこれら特徴点を射影し、射影点の分布に応じてグループ分けを行ない、各グループでの射影点の平均位置に応じて基準線の位置を決める方法を採用することができる。
【００１６】
第２の方法では、文字とその文字に対するクラスタを格納した認識辞書と、重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書と、予め定められた特定パターンごとに当該特定パターンに属する１または複数の基準パターンとその基準パターンごとの切り出し位置パラメータとを格納する切り出し用辞書を使用する。そして、特定パターンに該当する部分を候補位置探索範囲内のインクデータから抽出し、抽出された部分と類似する基準パターンを切り出し用辞書の中から探索し、文字切り出しの位置の候補となる切り出し候補位置を探索された基準パターンに対応する切り出し位置パラメータによって決定する。認識工程では、切り出し候補位置のそれぞれで文字切り出しが行なわれたとして、文字とその文字に対するクラスタを格納した認識辞書との比較・照合を行ない、切り出し位置ごとにその切り出し候補位置に対応する候補文字と対応するクラスタからのその候補文字の距離値とを求める。さらに、重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書を探索し、切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、その重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行なう重み付け工程と、重み付け工程で重み付けが行なわれた後の距離値の大小に応じて候補文字の中から認識文字を決定する決定工程と、を実行する。特定パターンは、例えば、インクデータ中の右上がりの部分というようにして定められる。「右上がり」という特定データに対し、基準パターンは、例えば、「一直線であるようなパターン」、「初めの方があとの方より勾配が急であるようなパターン」、「初めの方があとの方より勾配が緩やかであるようなパターン」として定めることができる。また、切り出し位置パラメータは、例えば、インクデータの軌跡としての距離で前から１／３の場所を切り出し候補位置とする、といったように定めておく。基準パターンと抽出されたインクデータ部分との類似の判定は通常の１ストロークデータの文字認識に他ならないから、一般的な方法で実行でき、類似する基準パターンが決まれば、その基準パターンについて予め定められている切り出し位置パラメータによって、抽出されたインクデータ部分に対して切り出し候補位置の設定が行なわれる。先の例に基づけば、右上がりの部分として抽出されたインクデータ部分の前から１／３の位置を切り出し候補位置とする。
【００１７】
本発明の第１の手書き文字認識装置は、利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識装置において、インクデータを入力する入力手段と、インクデータを格納するインクデータ格納手段と、前記インクデータ格納手段中のインクデータに対し手書き文字の入力方向に平行な１対の基準線を設定し、未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から前記入力方向に沿って所定の長さの候補位置探索範囲を設定し、前記候補位置探索範囲内のインクデータに関し、前記１対の基準線ではさまれた範囲から一方の基準線側に張り出している部分を検出した場合には、前記インクデータ上の点であって当該部分の直後もしくは直前にありかつ前記他方の基準線に対応する点を中心として当該部分を含むインクデータ部分を回転し、その後、前記入力方向に平行な直線上に前記インクデータを射影し、文字切り出しの位置の候補となる切り出し候補位置を射影点の数の増減に基づいて決定し、決定された切り出し候補位置で切り出されたインクデータに基づいて文字認識を行う文字認識手段と、を有する。
【００１８】
本発明の第２の手書き文字認識装置は、利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識装置において、インクデータを入力する入力手段と、インクデータを格納するインクデータ格納手段と、文字とその文字に対するクラスタを格納した認識辞書と、重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書と、予め定められた特定パターンごとに当該特定パターンに属する１または複数の基準パターンとその基準パターンごとの切り出し位置パラメータとを格納する切り出し用辞書と、前記インクデータ格納手段中の未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から手書き文字の入力方向に沿って所定の長さの候補位置探索範囲を設定し、前記特定パターンに該当する部分を前記候補位置探索範囲内のインクデータから抽出し、抽出された部分と類似する前記基準パターンを前記切り出し用辞書の中から探索し、文字切り出しの位置の候補となる切り出し候補位置を探索された基準パターンに対応する切り出し位置パラメータによって決定し、前記切り出し候補位置のそれぞれで文字切り出しが行なわれたとして前記認識辞書との比較・照合を行ない、前記切り出し位置ごとに当該切り出し候補位置に対応する候補文字と対応するクラスタからの当該候補文字の距離値とを求め、前記重み付け辞書を探索し、前記切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、当該重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行ない、そののち、距離値の大小に応じて前記候補文字の中から認識文字を決定する文字認識手段と、を有する。
【００１９】
【作用】
本発明では、続け字で入力されたインクデータから１文字分のインクデータを切り出して文字認識を行なう際に、まず、切り出し候補位置を探索し、認識辞書と重み付け辞書とを用いて文字認識を行なって切り出し候補位置の中から最も適切なものを選ぶ、という２段階で切り出し及び文字認識を実行している。続け字に対して正しく文字認識を行なえるかどうかは適切に文字切り出しが行なえるかどうかにかかっているが、本発明では、インクデータ中の寝ている部分（横書きの場合）を直立させてからヒストグラム法により切り出し候補位置を探索する、あるいは、インクデータから特定パターンに該当する部分を抽出し、抽出されたインクデータ部分に類似している基準パターン（特定パターンごとに１あるいは複数定められている）を探索してその基準パターンに対応して定められている位置を切り出し候補位置としている。このように切り出し候補位置を定めることにより、隣接する文字が入力方向に垂直な方向に重なっているような場合でも、適切に切り出し候補位置を見出すことが可能になる。
【００２０】
さらに本発明では、重み付けクラスタを重み付け辞書に設定してあり、切り出されたインクデータがこの重み付けクラスタに近い場合にはこの重み付けクラスタの対象文字が文字認識され難くなるように構成されている。したがって、利用者の書き癖に応じて重み付けクラスタを重み付け辞書に登録することにより、利用者の書き癖による誤切り出しが生じ難くなり、利用者の意図したとおりの正確な文字認識を行なうことが可能になる。
【００２１】
【実施例】
次に、本発明の実施例について、図面を参照して説明する。図１は本発明の一実施例の手書き文字認識装置の構成を示すブロック図である。以下では、アルファベットの文字列が続け字で手書き文字入力された場合を例に挙げて、説明を行なう。
【００２２】
この手書き文字認識装置は、オンライン手書き文字認識を実行するものであって、利用者によるインクデータが入力するとともに必要な情報を表示するための入力・表示パネル１１と、入力・表示パネル１１に対して入力されたインクデータを受け付け、手書き文字データなのか指示なのかを識別する入力処理部１３と、手書き文字のインクデータを格納するインクデータ格納部１４と、文字認識に使用する認識辞書２１と、重み付けクラスタを格納する重み付け辞書２２と、文字切り出しの際に使用する切り出し用辞書２３と、認識辞書２１、重み付け辞書２２及び切り出し用辞書２３を参照してインクデータ格納部１４内のインクデータに対する文字切り出し処理及び文字認識処理を実行する文字認識エンジン部１５と、文字認識エンジン部１５による文字認識結果を格納する認識結果格納部１６と、文字認識結果に応じて入力・表示パネル１１に対して表示を行なう出力処理部１７と、利用者からの指示に基づいて認識辞書２１及び重み付け辞書２２の更新を行なう辞書更新部１８とによって構成されている。入力・表示パネル１１は、表示部とインクデータ２０の入力部とが一体になったいわゆる表示一体型入力パネルであり、例えば、液晶フラットディスプレイ上に透明型タブレットを積層した構成のものを使用できる。利用者は、ペン１２でこの入力・表示パネルの入力・表示画面をなぞることによって、所望のインクデータ２０を入力できる。
【００２３】
本実施例の手書き文字認識装置は、アルファベット文字列などの続け字で入力されたインクデータに対して１文字分に相当するインクデータを切り出し、切り出されたインクデータからその形状の特徴を表わす特徴ベクトルを求め、認識辞書２１中の各文字（候補文字）の特徴ベクトル（クラスタ）とインクデータから求めた特徴ベクトルとを比較し、両者の距離に応じてそのインクデータに対する候補文字を定めることにより、文字認識が行なうものである。このとき、文字切り出しに際して、まず、手書き文字入力されたインクデータの入力方向に応じ、切り出し候補位置探索範囲内で切り出し候補位置を探索し、各切り出し候補位置で切り出されたインクデータごとに候補文字を定めている。ここでは、入力枠なしでの手書き文字認識が行なわれているが、入力方向が縦なのか横なのかだけは指定されており、入力方向が横方向であれば、複数の文字の手書き文字入力を行なう場合に利用者は斜めではなくできるだけ真横に向って文字を書き連ねるものとする。認識辞書２１には、文字とその文字のクラスタとが格納されている。ある１つの文字に対して複数のクラスタが対応することが可能であり、また、認識辞書２１に対し利用者の指定した文字のクラスタを追加登録することが可能なようになっている。もちろん本発明は、文字認識の具体的方法やアルゴリズムによらずに適用できるものであり、特徴ベクトルによらない文字認識方法、例えばパターンマッチング法などにも本発明を適用することが可能である。
【００２４】
文字認識エンジン部１５は、インクデータ格納部１４に格納された未切り出しのインクデータについて、その先頭部分（基点Ｏ）から手書き文字に入力方向に向かって所定の範囲（切り出し候補位置探索範囲Ｗ）の領域内にある切り出し候補位置を探索し、各切り出し候補位置でインクデータを切り出したとして認識辞書２１と比較し、切り出し候補位置ごとにその切り出し候補位置に対応する候補文字を求め、さらに重み付け辞書２２を参照して重み付けを行ない、文字認識を行なうものである。切り出し候補位置とは、文字切り出しが行なわれるべき位置の候補のことであって、切り出し候補位置の見つけ方としては、後述するように、インクデータ中の隣接する文字が重なっているのを補正してからヒストグラムによって切り出し候補位置を見つける方法と、インクデータから特定パターンを抽出しこの特定パターンと基準パターンとを比較して切り出し候補位置を見つける方法とを用いている。特定パターンによる方法を用いて切り出し候補位置の探索を行なう場合には、切り出し用辞書２３も使用する。
【００２５】
図２(a)は、アルファベット文字列として続け字で入力されたインクデータの実例を示すものである。図２(a)では、切り出し候補位置として、Ａ及びＢの２箇所が探索されている。文字認識の際には、未切り出しのインクデータの先頭部分（基点Ｏ）から各切り出し候補位置までのインクデータ（図２(a)に示した例では、基点Ｏから切り出し候補位置Ａまでのインクデータと、基点Ｏから切り出し候補位置Ｂまでのインクデータ）を対象として、認識辞書２１を参照してこれら各インクデータに対する候補文字が探索され、同時にこれらの候補文字に対する距離値がそれぞれ算出される。ここで距離値は、切り出し候補位置ごとのインクデータから求められた特徴ベクトルと、そのインクデータに対応する候補文字についてのクラスタとの距離のことである。そして、文字認識エンジン部１５は、以下の重み付け処理を行なった後に、距離値でソートし、距離値の小さい順に候補文字を認識結果格納部１６に出力するようになっている。
【００２６】
ここで重み付け処理について説明する。続け字のアルファベット文字列に対応するインクデータに対する重み付け辞書２２の構成例が図２(b)に示されている。重み付け辞書２２には、重み付けクラスタとその重み付けクラスタによる重み付けの対象となる文字とが組になって格納されている。重み付けクラスタは、利用者の入力したインクデータに基づく特徴ベクトルとして、後述する辞書更新部１８により登録されたものである。図２(b)に示した例では、筆記体での「ｄ」の字に似た重み付けクラスタに対し、「ｃ」の字が重み付け対象文字とされている。本実施例では、各切り出し候補位置に対応するインクデータが重み付けクラスタとして登録された形状に似ている場合には、その重み付けクラスタに対応する重み付け対象文字が候補文字として挙げられている場合に、その候補文字の距離値に重み付けがなされるようになっている。重み付けの方法としては、一定値を重み付け対象文字である候補文字の距離値に加算する方法、切り出し候補位置に対応するインクデータの特徴ベクトルと重み付けクラスタとの距離に応じて変化する値を候補文字の距離値に加算する方法などがある。重み付けクラスタとの「近さ」に比例した重み付けを行なうことが望ましい。結局、あるインクデータが重み付けクラスタとして登録されている場合には、その重み付けクラスタに類似したインクデータが入力した場合に、その重み付けクラスタの対象文字が文字認識結果として現われ難くなる。利用者の書き癖によって、切り出し位置の誤りが生じる場合、誤切り出しに対応するインクデータとその誤って認識されて出力された文字とを重み付けクラスタとその対象文字として重み付け辞書２２に登録することにより、以後はその誤切り出しが生じ難くなる。
【００２７】
辞書更新部１８は、利用者から学習の指示があった場合に、認識辞書２１あるいは重み付け辞書２２の更新を行なう。誤切り出しが生じたので利用者が学習を行なわせようとする場合、上述したように、誤切り出しとなったインクデータを重み付けクラスタとして重み付け辞書２２に登録するのが原則であるが、この場合、文字切り出しの基点から最遠の切り出し候補位置までのインクデータを登録する。また、場合によっては、認識辞書２１中に妥当なクラスタが存在しなかったために誤切り出しとなることがあるが、そのような場合には、指定されたインクデータをクラスタとして認識辞書２１に登録する。さらに、辞書更新部１８は、重み付けクラスタを新規登録した場合にその新規登録の重み付けクラスタの近傍に既存の重み付けクラスタが存在する場合には、その既存の重み付けクラスタを重み付け辞書２２から消去する。辞書更新部１８での具体的に処理については、図１１のフローチャートを用いて後述する。
【００２８】
次に、この手書き文字認識装置の動作を説明する。最初に、文字認識処理の流れを図３のフローチャートを用いて説明する。
【００２９】
まず、利用者が時間的に間を置かずに入力した一連のインクデータを取得する（ステップ１０１）。この一連のインクデータは、典型的には、１単語分に相当する続け字で手書き文字入力されたアルファベット文字列である。取得されたインクデータは文字認識エンジン部１５に送られ、前処理が施される（ステップ１０２）。前処理の内容は、サイズの正規化、サンプリング数の調整、基準線の設定などである。サイズの正規化は、取得したインクデータから、入力方向に垂直な方向（アルファベットであれば縦方向）の文字幅（いわゆる文字高）を求め、それが一定値となるように正規化する処理である。サンプリング数の調整は、利用者が素早く入力した場合とゆっくり入力した場合とではインクデータのサンプリング数が異なるので、補間や等分などの処理を適宜行なってサンプリング数を安定させるための処理である。基準線の設定については、詳細は後述するが、英語の文字列の場合であれば、欧文活字組版用語でいう並び線（ライン）とミーンラインに相当する線をインクデータから抽出する処理である。
【００３０】
前処理が終ったら、切り出し候補位置探索範囲Ｗの中で後述する手法にしたがって切り出し候補位置を探索する（ステップ１０３）。この際、複数の切り出し候補位置が探索されたらその全てを記憶しておくようにする。そして、このように探索された切り出し候補位置のうち中から未処理のものを１つ選び、その切り出し候補位置でインクデータを切り出し、切り出されたインクデータから特徴ベクトルを求め、認識辞書２１と比較して候補文字を獲得する（ステップ１０４）。このとき、その候補文字のクラスタと切り出されたインクデータの特徴ベクトルとの距離値を算出しておく。候補文字の数は、切り出し候補位置ごとに１個でもよいし複数個でもよい。そして、重み付け辞書２２内を探索し、取り出されたインクデータの中で重み付けクラスタに近い（類似している）ものがあるかを検索する。この検索は、特徴ベクトルと重み付けクラスタとの特徴空間内での距離が所定のしきい値ｒ以下であるかどうかで行なわれる。重み付けクラスタに近いものが存在しない場合は、そのままステップ１０６に移行し、存在する場合には、重み付け辞書２２においてその重み付けクラスタの対象文字として登録されている文字を読み出し、その文字がすでに求められている候補文字のいずれかと一致する場合には、その一致する候補文字についての距離値に重み付けを行なう（ステップ１０５）。
【００３１】
ステップ１０６では、切り出し候補位置探索範囲内の全ての切り出し候補位置について、上述のステップ１０４と１０５の処理が終ったかどうかをチェックする。その結果、終っている場合にはステップ１０７に進み、終っていない場合には、残っている切り出し候補位置において文字認識を行なうために、ステップ１０４に戻る。
【００３２】
ステップ１０７では、各候補文字をその距離値に応じてソートし、距離値の小さい順に並べる。距離値の定義によっては、インクデータ中のストローク数に距離値が依存する場合もあるが、そのような場合には、正規化処理を行なって、異なるストローク数のインクデータを比較できるようにする。このソート結果は、文字認識エンジン部１５から認識結果格納部１６に送られ、出力処理部１７によって、ソート結果に応じた候補文字の表示が入力・表示パネル１１で行なわれる。候補文字の表示は、最も確からしい候補文字、すなわち、重み付け処理を実行した後の距離値が最も小さな文字のみをまず表示し、利用者の指示によって次順位の文字を表示するようにしてもよいし、ソート順に応じていくつかの候補文字を並べて表示してもよい。その後、利用者に指示によって候補文字を決定する（ステップ１０８）。このとき、第１順位の候補文字が利用者の意図した文字でない場合には、利用者は、次順位以下の候補文字を検索し、自分の意図した文字を指定して候補文字の決定を行なうものとする。
【００３３】
候補文字の決定が済んだら、後処理を実行する（ステップ１０８）。後処理では、決定した候補文字に対応する切り出し候補位置までのインクデータを切り出し処理済みのものとし、切り出しの開始位置（基点Ｏ）を次に進める。その際、必要に応じて、決定した候補文字に対応する切り出し候補位置と次の切り出しの開始位置とは異ならせることができるが、そのことの詳細は後述する。そして、全てのインクデータが切り出し済みかどうかを判断する（ステップ１０９）。未切り出しのインクデータが残っている場合にはステップ１０２に戻って上記の処理を繰り返し、残っていない場合には処理を終了する。
【００３４】
この手書き文字認識装置では、切り出し候補位置ごとに候補文字が求められるので、例えば、「ｄ」と「ｃ」などのように、切り出し位置の異なる候補文字が併存することになる。そして、候補文字を利用者に提示している段階では文字切り出しの位置は確定しておらず、候補文字の確定とともに、その候補文字に対応する切り出し候補位置で切り出し位置が確定し、文字切り出しが最終的に行なわれたことになる。
【００３５】
以下、実例を挙げて説明する。図２(a)に示したインクデータ２０は、利用者が英単語の「ｄｉｐ」を意図して続け字により手書き文字入力したものであるが、「ｄ」の字の書き始めの部分が他の部分から位置的に離れているために、「ｃｌｉｐ」とも認識されかねないものである。また、このインクデータ２０に対して切り出し候補位置Ａと切り出し候補位置Ｂの２つの切り出し候補位置が探索されたものとする。切り出し候補位置ごとの候補文字とその候補文字に対する距離値が表１に示されている。表１に示されるように、重み付け処理を行なわない距離値で候補文字の順位付けを行なうと、「ｃ」の方が距離値が近いため、第１順位の候補文字は「ｃ」となり、誤った文字切り出しが行なわれることになる。
【００３６】
【表１】

ところで、重み付け辞書２２に、図２(b)に示すようなのような重み付けクラスタ（図２(a)のインクデータ２０中の「ｄ」の字に非常に類似している）が、「ｃ」の文字を対象文字として登録されていたとする。すると、切り出し候補位置Ｂでのインクデータがこの重み付けクラスタに近いことになるので、候補文字「ｃ」に重み付けが行なわれることになる。この重み付け処理の結果、候補文字「ｄ」に対する距離値はそのままであるのに対し、候補文字「ｃ」に対する距離値が増加し、「ｄ」の方の距離値が小さくなって、最終的に、第１順位の候補文字が「ｄ」となる。すなわち、利用者の書き癖に応じて正確な文字切り出しが行なわれたことになる。なお、利用者が「ｃｌ…」の入力を意図した場合には、そのときのインクデータは、「ｄ」を意図したときのインクデータとは異なっていると考えられ、その場合は上述の重み付けクラスタとはインクデータが異なるであろうから、「ｃ」に対する重み付けは十分に行なわれず、「ｃ」、「ｌ」と正しく切り出しを行なうことができる。
【００３７】
別のケースとして、「ｃｌ」と入力したつもりが「ｃ」と「ｌ」が離れていないために「ｄ」と誤切り出しされるような場合には、誤切り出しされたインクデータについて、切り出しの基点から最も遠い切り出し候補位置までを重み付けクラスタとし、対象文字を「ｄ」として重み付け辞書に登録することにより、以後は正しく「ｃｌ」と認識されるようになる。
【００３８】
次に、図３のフローチャートのステップ１０２で行なわれる前処理における基準線の設定について説明する。アルファベットの各活字文字をその文字の高さで分類すると、小文字の「ｃ」,「ｅ」,「ｘ」などの文字（ショートレター、すなわちエックスハイト(x height)の文字）、ショートレターの文字に比べて上に出る文字（アッセンダ、例えば「ｂ」や「ｌ」）、ショートレターの文字より下に出る文字（デッセンダ、例えは「ｐ」や「ｑ」）、上下に伸びている文字（ロングレター、「ｊ」、続け字では「ｆ」も該当する）に分けられる。活字体でのショートレターの各文字の上端と下端はそれぞれ同一の線上にあって、これらの線はそれぞれミーンラインと並び線（ライン）と呼ばれる。なお、アッセンダの上端が並ぶ線をアッセンダライン、デッセンダの下端が並ぶ線をデッセンダラインと呼ぶ。活字体では大文字の上端の並ぶ線（キャップライン）とアッセンダラインとは多少ずれているが、手書き文字入力の場合にはこのずれは意識されないので、本実施例では両者をまとめてアッセンダラインと呼ぶことにする。
【００３９】
続け字で手書き文字入力されたインクデータの場合、ショートレターの各文字の上端と下端は、それぞれ厳密に１本の直線上にあるとは考え難いが、縦方向にある幅をもってその幅の中にそれぞれ位置していると考えることができる。そこで本実施例では、ミーンラインと並び線に相当する線をそれぞれ上側基準線、下側基準線として、インクデータから抽出している。これらの基準線は、本実施例でのヒストグラム法による切り出し候補位置の探索に使用されるほか、大文字と小文字の区別、入力方向に垂直な方向への文字幅（文字高）の決定などにも使用できる。なお、アルファベット以外でも、入力方向に平行なこのような基準線を定義できる文字であれば、以下に述べる方法は有効である。
【００４０】
図４(a)に示すようにインクデータ２０ａが入力されたら、インクデータ２０ａ中から、上に凸になっている点（図示○印）と下に凸になっている点（図示△印）を探し出し、入力方向に垂直な直線上にこれらの点を射影する。これら上に凸になっている点と下に凸になっている点には線分の端点も含まれるものとする。上に凸になっている点や下に凸になっている点は、基準線探索のために使用される特徴点である。上に凸になっている点はミーンラインとアッセンダラインのいずれかに対応し、下に凸になっている点は並び線とデッセンダラインのいずれかに対応すると考えられるから、射影された各点は、ミーンライン、アッセンダライン、並び線、デッセンダラインにそれぞれ対応する範囲（図示点線の楕円で表示）のいずれかに群集することになる。もちろん、「ａｃｅ」に対応するインクデータなどでは、ショートレターのみからなるから、ミーンラインと並び線に対応して２つの群集しか生じない。また、例えば、デッセンダである「ｇ」も下に凸になっている点を並び線上に有するから、並び線に対応する群集とミーンラインに対応する群集は必ず発生するものとしてよい。
【００４１】
そこで本実施例では、図４(b)に示すように、ミーンラインに対応する群集を構成する射影点の平均位置を通過し入力方向に平行な直線を上側基準線２５_Uとし、並び線に対応する群集を構成する射影点の平均位置を通過し入力方向に平行な直線を下側基準線２５_Lとしている。場合によっては、射影点の群集が３つでき、そのままではどれが並び線に対応し、どれがミーンラインに対応するか分からなくなる場合もあるが、群集に含まれる射影点の数は、デッセンダラインよりも並び線の方が多く、アッセンダラインよりミーンラインの方が多いと考えられるから、適当なルールを定めることにより、識別が可能である。
【００４２】
次に、本実施例における切り出し候補位置の探索方法について説明する。本実施例では、上述したように、ヒストグラム法を用いる方法と、特定パターンを抽出する方法のいずれかによって、あるいは両者を併用して切り出し候補位置を探索する。まず、本実施例におけるヒストグラムを用いる方法について説明する。図５はこのヒストグラムを用いる方法の処理を示すフローチャートである。
【００４３】
従来の技術の欄でも述べたように、続け字によるアルファベット文字列のインクデータから１文字分の切り出しを行なう際に障害ものの１つは、字が寝ていて２文字分のインクデータが重なり合うことである。この重なり合いは、連続する２文字がショートレターの場合には起きにくく、一方がアッセンダ、デッセンダ、ロングレターのいずれかの場合に起きやすいと考えられる。そこで本実施例では、アッセンダ、デッセンダ、ロングレターを検出して、これらアッセンダ、デッセンダ、ロングレターのインクデータを入力方向に対して直立させ、その後、ヒストグラム法で切り出し候補位置を探索する。なお、直立したインクデータは切り出し候補位置の決定のみに使用され、文字認識を行なう際には、もとのインクデータが使用される。
【００４４】
まず、切り出し候補位置探索範囲Ｗ内で、インクデータ中に上側基準線２５_Uより上側の部分があるかを調べる（ステップ１１１）。手書き文字データであるので、上述したように、文字の上下端が必ずしも同一のミーンラインや同一の並び線上に一列に並んでいるわけ出はないから、実際には、上側基準線２５_U自体に幅を持たせ、この幅の上限よりもさらに上側までインクデータが張り出しているかどうかを調べる。上側の部分がない場合にはステップ１１３に移行し、上側の部分がある場合には、上側基準線２５_Uより上にある部分の直後（語尾側）にある基準点を中心として、その基準点より語頭側にあるインクデータを回転する（ステップ１１２）。なお、切り出し開始位置（基点Ｏ）側からストロークとして近い（インクデータの軌跡上の距離が短い）側が語頭側であり、遠い側が語尾側である。また、基準点とは、インクデータ中の上に凸の点であって上側基準線２５_Uに対応している点と、下に凸の点であって下側基準線２５_Lに対応している点のことである。これにより、アッセンダやロングレターが入力方向に対して直立することになる。
【００４５】
ステップ１１３では、切り出し候補位置探索範囲Ｗ内で、インクデータ中に下側基準線２５_Lより下側の部分があるかを調べる。手書き文字データであるので、ステップ１１１の場合と同様に、実際には、下側基準線２５_L自体に幅を持たせ、この幅の下限よりもさらに下側までインクデータが張り出しているかどうかを調べる。下側の部分がない場合にはステップ１１５に移行し、下側の部分がある場合には、下側基準線２５_Lより下にある部分の直前（語頭側）にある基準点を中心として、その基準点より語尾側にあるインクデータを回転する（ステップ１１４）。これにより、デッセンダが入力方向に対して直立することになる。
【００４６】
ステップ１１５では、上述のような処理を経たインクデータを入力方向に平行な直線上に投影し、切り出し位置候補探索範囲Ｗ内で、ヒストグラム法によって切り出し候補位置を探索する。具体的には、度数（頻度）が１から複数、または、複数から１に変わる点を切り出し候補位置とする。さらに、複数文字の範囲にわたって度数１が連続する場合に対処するために、度数が１で下に凸の部分を候補としてもよい。また、直前の切り出し位置（今回の基点Ｏ）から一定幅（文字幅を基準に決定）以内では切り出し候補位置としない、基点Ｏから一定幅（文字幅を基準に決定）の位置内に上記の条件から求められる切り出し候補位置が探索されなかった場合にはその位置を切り出し候補位置に追加するなどのルールを設けて、切り出し候補位置を決定するようにしてもよい。
【００４７】
図６は、ここで述べたヒストグラム法による切り出し候補位置探索の実例を示す図である。図６(a)に示すように、続け字の「ｌｌｅｒｇｙ」というインクデータ２０ｂにおいて、最初の「ｌ」に相当する部分は、切り出し候補位置探索範囲Ｗ内にあってかつ上側基準線２５_Uより上側の部分を有する。そこで、下側基準線２５_Lに対応する基準点（図示○印）を中心として、最初の「ｌ」の部分を回転する。回転は、図示点線で示されるように「ｌ」の延びる方向に平行な直線を想定し、これが直立するまで行なう。その結果、インクデータ２０ｂが図６(b)に示されるように変形するから、これに対して、ヒストグラム法により切り出し候補位置を探索する。
【００４８】
同様に図６(c)は続け字の「ｇｙ」のインクデータ２０ｃを示している。最初の「ｇ」は下側基準線２５_Lより下側の部分を有しているから、上側基準線２５_Uに対応する基準点（図示△印）を中心として、この基準点より後ろの部分を回転する。その結果、図６(d)に示されるようにインクデータ２０ｃが変形する。ここでは、「ｇ」に引き続く「ｙ」の部分も回転しているが、切り出し候補位置は切り出し候補位置探索範囲Ｗ内でのみ探索され、さらに、切り出し候補位置の探索後は元（回転する前）のインクデータに基づき文字認識が行なわれ、次の切り出し開始位置の決定も元のインクデータにおいて行なわれるので、切り出し候補位置探索範囲Ｗ内の部分のみを回転させるようにしてもよい。
【００４９】
ここでは、アルファベットの場合を説明したが、文字の入力方向等に応じて適宜の変更を加えることにより、他の文字種にも適用することができる。
【００５０】
次に、特定パターンを抽出して切り出し候補位置を決定する方法について説明する。ここでは、特定パターンとして、右上がりの部分をインクデータから抽出するものとする。この他、右上がり部分のほか、その前後、例えば直前の右下がり部分を加えたものを特定パターンとしてもよい。右上がりの部分は、例えばインクデータ入力時のサンプリングで、２次元平面においてｘ成分の値もｙ成分の値も増加していることを検出することで抽出できる。もちろん、言語や文字種、文字の入力方向などに応じて、特定パターンを適宜に設定することができる。図７はこの方法の処理を説明するフローチャートである。
【００５１】
まず、切り出し候補位置探索範囲Ｗ内のインクデータから特定パターンに該当する部分を抽出する（ステップ１２１）。該当する部分がなければ、本方法に基づく切り出し候補位置の探索を行なわない。一方、切り出し用辞書２３（図１参照）には、予め、特定パターンごとに１ないし複数の基準パターンが格納され、基準パターンごとにどこを切り出し候補位置とするかの情報が格納されている。基準パターンは例えば特徴ベクトル（クラスタ）の形態で格納されている。どの位置を切り出し候補位置とするかは、例えば、抽出された部分において軌跡の長さに基づき何対何で内分（場合によっては外分）する点というように定めることができる。さらに、複数の切り出し候補位置が設定されるようにしてもよい。特定パターンに該当する部分が抽出されたら、切り出し用辞書２３を探索して、この抽出されたデータに最も類似している基準パターンを見つけ出し（ステップ１２２）、探索された基準パターンに対応して定められている位置に基づき、元のインクデータに切り出し候補位置を設定する（ステップ１２３）。
【００５２】
図８(a)〜(c)は、いずれも、特待パターンが右上がりの部分である場合の基準パターンの例を示す図である。図８(a)に示す基準パターン２６は、右上がりの部分においてインクデータがほぼ一直線状となっているものである。このような基準パターン２６に対して、切り出し候補位置は、例えば該当部分の１／２の位置と定める。これは、続け字での「ｇｌ」、「ｇｈ」などの切り分けに対応したものである。図８(b)に示す基準パターン２６は、初めのうちの勾配の方が後の方の勾配よりも急になっているものである。このような基準パターン２６に対しては、切り出し候補位置は、例えば該当部分の前から３／４の位置と定める。これは、「ｖ」や「ｗ」に対応させたものである。図８(c)に示す基準パターン２６は、初めのうちの勾配の方が後の方の勾配よりも緩くなっているものである。このような基準パターン２６に対しては、切り出し候補位置は、例えば該当部分の前から１／３の位置と定める。これは、上述以外の通常のアルファベットに適用されるものである。
【００５３】
図９は特定パターンを抽出する方法の実例を示す図である。「ａｌｌ」に対応するインクデータ２０ｄに対し、図示太線の部分が特定パターンに該当する部分となる。この部分（太線部分）のみを抽出して図８(a)〜(c)に示す各基準パターンを比較すると、図８(c)に示す基準パターンに類似していることが分かる。そこで、太線部分の前から１／３の位置を切り出し候補位置として設定する。
【００５４】
次に、後処理（図３のフローチャートのステップ１０８）における次の切り出し開始位置の調整について説明する。アルファベットの続け字のインクデータを考えると、ある字の本体部分（文字認識の重要な部分）と次の字の本体部分との間に、接続するためだけの部分が存在したり、両方の字の本体部分に属する部分があったりする。例えば、図１０(a)は、「ｌｅ」のインクデータの例であるが、これから「ｌ」が文字認識されて切り出されると、「ｅ」の文字認識に必要な部分まで取り除かれてしまう。このような現象が起きたことは、切り出された部分が切り出されていない部分と交差していることなどから検出できるから、次の文字切り出しの開始位置を語頭側にずらす。図１０(b)は、「ａｇ」のインクデータの例であるが、「ａ」が文字認識されて文字切り出されても「ｇ」のインクデータの前に、接続部分（文字間のつなぎのストローク）がかなり長く残ってしまい、「ｇ」の認識に対する障害となる。最初に切り出された文字が何であるかやインクデータの形状によって単なる接続部分であるかどうかが識別できるから、そのような場合には、次の文字の切り出し開始位置を語尾側にずらす。このようにして、後処理では次の文字に対する切り出し開始位置（基点Ｏ）の調整を行なう。
【００５５】
次に、学習処理について図１１を用いて説明する。
【００５６】
学習処理は、誤切り出しが行なわれた場合に利用者が入力・表示パネル１１の所定箇所をダブルクリックすることなどによって、開始する。このとき、誤切り出しが行なわれたインクデータがそのまま保存されているとする。以下、このインクデータのことを入力データという。
【００５７】
次順位以下の候補文字で上述の確定が行なわれたなどのことにより、入力データに対する正しい文字（以下、指定文字という）が利用者によって指定されると、まず、その入力データに対応する特徴ベクトルとその指定文字の既存のクラスタとの距離が第１のしきい値以下であるかどうかが判断される（ステップ１３１）。第１のしきい値以下の場合はステップ１３３に移行する。第１のしきい値を越える場合は、認識辞書２１におけるその指定文字のクラスタがその利用者にとって適切なものではない場合なので、その特徴ベクトルをその指定文字のクラスタとして認識辞書２１に追加登録する（ステップ１３２）。
【００５８】
ステップ１３３では、認識辞書２１内が検索され、入力データの特徴ベクトルに対して、指定文字のクラスタよりも近くに別の文字のクラスタがあるかどうかが判断される。「近い」とは、距離値が小さいということである。また、ここでいう別の文字とは、指定文字とは切り出し位置が異なる文字のことである。そのようなクラスタが存在しない場合には、誤切り出しによる誤認識ではない場合なので、学習処理を終了する。なお、切り出し位置が同じクラスタがより近くに存在する場合は、誤切り出しではなく、単なる誤認識の問題である。ここで入力データの特徴ベクトルとクラスタとを比較しているが、認識辞書がインクデータのストローク数別に編成されていて、異なるストローク数間での比較が直接行なえないような場合（アルファベット文字列の場合、続け字であっても、「ｉ」の点部分や「ｔ」の横棒部分、さらにはいくつかの大文字は複数ストロークで入力されるのが一般的である）には、データをストロークごとの特徴空間で比較して距離値を求め、その距離値を適宜正規化して、異なるストローク数間での比較を行なえばよい。
【００５９】
ステップ１３３で指定文字より近いクラスタがある場合には、その別の文字のクラスタと入力データの特徴ベクトルとの距離が第２のしきい値以下であるかを判断する（ステップ１３４）。第２のしきい値を越える場合は、重み付けクラスタの設定が適切でない場合なので処理を終了し、第２のしきい値以下の場合には、切り出し候補位置探索範囲Ｗの範囲内で最も遠くにある切り出し候補位置から切り出されたインクデータに対応する特徴ベクトルを重み付けクラスタとし、指定文字より順位が上位であった候補文字を重み付けの対象文字として、重み付け辞書２２に登録する（ステップ１３５）。そして、重み付け辞書２２を検索し、新規登録の重み付けクラスタの近くに既存の重み付けクラスタが存在するかどうかを調べ（ステップ１３６）、存在しない場合には処理を終了し、存在する場合には、矛盾した重み付けクラスタの存在と重み付け辞書２２の必要以上の肥大化とを防ぐために、その既存の重み付けクラスタを重み付け辞書２２から消去して（ステップ１３７）、処理を終了する。ステップ１３５において、切り出し候補位置探索範囲Ｗの範囲内で最遠の切り出し候補位置に基づき重み付けクラスタを設定しているが、仮に、最遠でない切り出し候補位置から重み付けクラスタを設定したとすると、後続のストロークを考慮しないで重み付け処理が行なわれることになり、上述した例で言えば、「ｃｌｏ」と入力しても「ｄ」と認識されてしまうおそれがある。
【００６０】
次に、学習処理について、さらに詳しく説明する。図２(a)に示すようなインクデータ２０が入力した場合、特徴空間３０内において、切り出し候補位置Ａまでのデータ及び切り出し候補位置Ｂまでのデータに対応する特徴ベクトルが、図１２(a)に示されるように、それぞれ、図示×印の点３４Ａ及び点３４Ｂのように配置したとする。また、認識辞書２１における文字「ｄ」のクラスタと文字「ｃ」のクラスタとが、それぞれ図示□印の点３１及び点３２のように配置されているものとする。点３４Ａに最も近いクラスタは「ｃ」のクラスタであり、点３４Ｂに最も近いクラスタは「ｄ」のクラスタであるから、これら「ｃ」と「ｄ」とがそれぞれ候補文字として選択される。点３１と点３４Ｂとの距離Ｄ１が点３２と点３４Ａとの距離Ｄ２より長いので、重み付け処理を行なわない限り、距離Ｄ２に対応する方、すなわち候補文字「ｃ」の方が高い順位となる。図２は「ｄｉｐ」を入力したものであるから、誤切り出しとなる。
【００６１】
そこで、図１２(b)に示すように、切り出し候補位置探索範囲Ｗ内で遠い方の切り出し候補位置Ｂに対応するインクデータを重み付けクラスタ３３として設定する。この場合の重み付け対象文字は「ｃ」である。このように重み付けクラスタ３３を重み付け辞書２２に登録したのち、図２(a)に示すのとほぼ同様のインクデータが入力したものとすると、図２(a)に示したのとほぼ同様に、切り出し候補位置が検出される。ここでもこの切り出し候補位置をＡ及びＢとすると、それらの切り出し候補位置でのインクデータは、特徴空間３０内で、それぞれ、点３５Ａ及び点３５Ｂに配置する。この場合も点３５Ａに最も近いクラスタは「ｃ」クラスタであり、点３５Ｂに最も近いクラスタは「ｄ」のクラスタであるから、これら「ｃ」と「ｄ」とがそれぞれ候補文字として選択される。そして、点３１と点３５Ｂの距離Ｄ３が、点３２と点３５Ａの距離Ｄ４よりも長いため、重み付け処理を行なわなければ、「ｃ」が切り出されることになる。しかし、点３５Ｂは、重み付けクラスタ３３から所定のしきい値ｒの範囲内にあるため、候補文字「ｃ」に対して重み付けがなされ、「ｃ」に対する距離Ｄ４に重み付け量δが加算される。その結果、Ｄ３＜Ｄ４＋δとなって、「ｄ」が切り出され、正しい文字切り出しが行なわれることになる。
【００６２】
以上、本発明の実施例について、続け字で手書き文字入力されたラテンアルファベットの文字列を対象とした場合を例に挙げて説明したが、本発明が対象とする文字種はこれに限定されるものではなく、キリル文字やアラビア文字の文字列であって続け字で入力されたものに対しても本発明は有効である。さらには、入力方向が縦である続け字の文字列に対しても本発明を適用することができる。
【００６３】
【発明の効果】
以上説明したように本発明は、まず切り出し候補位置を探索し、次に認識辞書と重み付け辞書とを用いて文字認識を行なって切り出し候補位置の中から最も適切なものを選ぶ、という２段階で１文字ごとの文字切り出しと文字認識を実行し、さらに、切り出し候補位置の探索に際して、インクデータ中の寝ている部分（横書きの場合）を直立させてからヒストグラム法により切り出し候補位置を探索する、あるいは、インクデータから特定パターンに該当する部分を抽出し、抽出されたインクデータ部分に類似している基準パターン（特定パターンごとに１あるいは複数定められている）を探索してその基準パターンに対応して定められている位置を切り出し候補位置とする、のいずれかの方法を採用することにより、利用者の書き癖によらず、例えば、インクデータ中の各文字が極端に寝ているような場合であっても、適切な文字切り出しが行なえるようになるという効果がある。さらに本発明は、重み付けクラスタを重み付け辞書に設定して切り出されたインクデータがこの重み付けクラスタに近い場合にはこの重み付けクラスタの対象文字が文字認識され難くなるように構成することにより、利用者の書き癖に応じて重み付けクラスタを重み付け辞書に登録しておけば、誤切り出しが生じ難くなって利用者の意図に正確な文字認識を行なうことが可能になるという効果がある。
【図面の簡単な説明】
【図１】本発明の一実施例の手書き文字認識装置の構成を示すブロック図である。
【図２】 (a)は切り出し候補位置探索範囲と切り出し候補位置を説明する図、(b)は重み付け辞書を説明する図である。
【図３】文字認識処理の流れを示すフローチャートである。
【図４】 (a),(b)は基準線の求め方を説明する図である。
【図５】本発明の方法によりヒストグラム法によって切り出し候補位置を探索する手順を示すフローチャートである。
【図６】 (a)〜(d)は本発明の方法によりヒストグラム法によって切り出し候補位置を探索する際のインクデータの回転を説明する図である。
【図７】本発明の方法により特定パターン抽出法によって切り出し候補位置を探索する手順を示すフローチャートである。
【図８】 (a)〜(c)はそれぞれ基準パターンを示す図である。
【図９】抽出された特定パターンの一例を示す図である。
【図１０】 (a),(b)は後処理を説明するための図である。
【図１１】学習処理の流れを示すフローチャートである。
【図１２】 (a)〜(c)は、学習と文字認識との関係を説明する図である。
【図１３】ヒストグラム法を説明する図である。
【符号の説明】
１１入力・表示パネル
１２ペン
１３入力処理部
１４インクデータ格納部
１５文字認識エンジン部
１６認識結果格納部
１７出力処理部
１８辞書更新部
２０,２０ａ〜２０ｄインクデータ
２１認識辞書
２２重み付け辞書
２３切り出し用辞書
２５_U 上側基準線
２５_L 下側基準線
２６基準パターン
３０特徴空間
３３重み付けクラスタ
１０１〜１０９,１１１〜１１５,１２１〜１２３,１３１〜１３７ステップ

Claims

利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識方法において、
利用者によって入力されたインクデータをインクデータ格納部に格納するインクデータ格納工程と、
前記インクデータ格納部に格納されているインクデータに対し、文字認識エンジン部で手書き文字の入力方向に平行な１対の基準線を設定する基準線設定工程と、
未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から前記入力方向に沿って所定の長さの候補位置探索範囲を設定する探索範囲設定工程と、
前記候補位置探索範囲内のインクデータに関し、前記１対の基準線ではさまれた範囲から一方の基準線側に張り出している部分を検出した場合には、前記インクデータ上の点であって当該部分の直後もしくは直前にありかつ他方の基準線に対応する点を中心として当該部分を含むインクデータ部分を回転し、その後、前記入力方向に平行な直線上に前記インクデータを射影し、文字切り出しの位置の候補となる切り出し候補位置を射影点の数の増減に基づいて前記文字認識エンジン部で決定する候補位置探索工程と、
前記候補位置探索工程で決定された切り出し候補位置で切り出されたインクデータに基づいて文字認識を行う認識工程と、
を有することを特徴とする手書き文字認識方法。
前記認識工程では、文字とその文字に対するクラスタを格納した認識辞書を使用し、前記候補位置探索工程での回転が行なわれる前のインクデータを対象とし、前記切り出し候補位置のそれぞれで文字切り出しが行なわれたとして前記認識辞書との比較・照合を行ない、前記切り出し位置ごとに当該切り出し候補位置に対応する候補文字と対応するクラスタからの当該候補文字の距離値とを求め、
次いで重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書を探索し、前記切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、当該重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行なう重み付け工程と、
前記重み付け工程で重み付けが行なわれた後の距離値の大小に応じて候補文字の中から認識文字を決定する決定工程と、
さらにを有することを特徴とする、請求項１に記載の手書き文字認識方法。
前記候補位置探索工程において、前記インクデータから特徴点を抽出し、前記入力方向に垂直な直線上に前記特徴点を射影し、射影点の分布に応じてグループ分けを行ない、各グループでの射影点の平均位置に応じて前記１対の基準線の位置が定められる請求項１または２に記載の手書き文字認識方法。
利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識方法において、
未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から手書き文字の入力方向に沿って所定の長さの候補位置探索範囲を設定する探索範囲設定工程と、
予め定められた特定パターンごとに当該特定パターンに属する１または複数の基準パターンとその基準パターンごとの切り出し位置パラメータとを格納する切り出し用辞書を使用し、前記特定パターンに該当する部分を前記候補位置探索範囲内のインクデータから抽出し、抽出された部分と類似する前記基準パターンを前記切り出し用辞書の中から探索し、文字切り出しの位置の候補となる切り出し候補位置を探索された基準パターンに対応する切り出し位置パラメータによって決定する候補位置探索工程と、
前記切り出し候補位置のそれぞれで文字切り出しが行なわれたとして、文字とその文字に対するクラスタを格納した認識辞書との比較・照合を行ない、前記切り出し位置ごとに当該切り出し候補位置に対応する候補文字と対応するクラスタからの当該候補文字の距離値とを求める認識工程と、
重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書を探索し、前記切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、当該重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行なう重み付け工程と、
前記重み付け工程で重み付けが行なわれた後の距離値の大小に応じて候補文字の中から認識文字を決定する決定工程と、
を有することを特徴とする手書き文字認識方法。
利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識装置において、
インクデータを入力する入力手段と、
インクデータを格納するインクデータ格納手段と、
前記インクデータ格納手段中のインクデータに対し手書き文字の入力方向に平行な１対の基準線を設定し、未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から前記入力方向に沿って所定の長さの候補位置探索範囲を設定し、前記候補位置探索範囲内のインクデータに関し、前記１対の基準線ではさまれた範囲から一方の基準線側に張り出している部分を検出した場合には、前記インクデータ上の点であって当該部分の直後もしくは直前にありかつ他方の基準線に対応する点を中心として当該部分を含むインクデータ部分を回転し、その後、前記入力方向に平行な直線上に前記インクデータを射影し、文字切り出しの位置の候補となる切り出し候補位置を射影点の数の増減に基づいて決定し、決定された切り出し候補位置で切り出されたインクデータに基づいて文字認識を行う文字認識手段と、
を有することを特徴とする手書き文字認識装置。
文字とその文字に対するクラスタを格納した認識辞書と、
重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書とをさらに備え、
前記文字認識手段では、前記回転が行なわれる前のインクデータを対象とし、前記切り出し候補位置のそれぞれで文字切り出しが行なわれたとして前記認識辞書との比較・照合を行ない、前記切り出し位置ごとに当該切り出し候補位置に対応する候補文字と対応するクラスタからの当該候補文字の距離値とを求め、
次いで前記重み付け辞書を探索し、前記切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、当該重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行ない、
重み付けが行われた後の距離値の大小に応じて候補文字の中から認識文字を決定することを特徴とする、請求項５に記載の手書き文字認識装置。
利用者が入力したインクデータから文字切り出しを行なって手書き文字認識を行なう手書き文字認識装置において、
インクデータを入力する入力手段と、
インクデータを格納するインクデータ格納手段と、
文字とその文字に対するクラスタを格納した認識辞書と、
重み付けクラスタとその重み付けクラスタに対する対象文字を格納した重み付け辞書と、
予め定められた特定パターンごとに当該特定パターンに属する１または複数の基準パターンとその基準パターンごとの切り出し位置パラメータとを格納する切り出し用辞書と、
前記インクデータ格納手段中の未切り出しのインクデータに対し、前記未切り出しのインクデータの先頭から手書き文字の入力方向に沿って所定の長さの候補位置探索範囲を設定し、前記特定パターンに該当する部分を前記候補位置探索範囲内のインクデータから抽出し、抽出された部分と類似する前記基準パターンを前記切り出し用辞書の中から探索し、文字切り出しの位置の候補となる切り出し候補位置を探索された基準パターンに対応する切り出し位置パラメータによって決定し、前記切り出し候補位置のそれぞれで文字切り出しが行なわれたとして前記認識辞書との比較・照合を行ない、前記切り出し位置ごとに当該切り出し候補位置に対応する候補文字と対応するクラスタからの当該候補文字の距離値とを求め、前記重み付け辞書を探索し、前記切り出し候補位置ごとのインクデータの中に重み付けクラスタに近いものがあり、かつ、当該重み付けクラスタの対象文字が探索された候補文字のいずれかと一致する場合には、一致した候補文字の距離値に重み付けを行ない、そののち、距離値の大小に応じて前記候補文字の中から認識文字を決定する文字認識手段と、を有することを特徴とする手書き文字認識装置。