JP2004133951A - 文字認識方法、文字認識装置および記憶媒体 - Google Patents

文字認識方法、文字認識装置および記憶媒体 Download PDF

Info

Publication number
JP2004133951A
JP2004133951A JP2003401999A JP2003401999A JP2004133951A JP 2004133951 A JP2004133951 A JP 2004133951A JP 2003401999 A JP2003401999 A JP 2003401999A JP 2003401999 A JP2003401999 A JP 2003401999A JP 2004133951 A JP2004133951 A JP 2004133951A
Authority
JP
Japan
Prior art keywords
bending
character
character recognition
recognition method
written
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003401999A
Other languages
English (en)
Other versions
JP4059841B2 (ja
Inventor
Masayoshi Okamoto
岡本 正義
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2003401999A priority Critical patent/JP4059841B2/ja
Publication of JP2004133951A publication Critical patent/JP2004133951A/ja
Application granted granted Critical
Publication of JP4059841B2 publication Critical patent/JP4059841B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】 筆記文字が続け字で書かれたような場合に、続け字の書かれ方に応じて不規則な屈曲点が発生するため、文字の屈曲位置を正しく検出できなくなってしまい、文字認識の精度が低下するといった問題があった。
【解決手段】 筆記ストロークの始点と終点とを仮想線分で連結し、これによって筆記文字に屈曲個所を強制的に生じさせる。この仮想線分による屈曲個所と、実際に筆記された屈曲個所の両方の特徴量(位置、屈曲方向、屈曲角度)を検出し、これを字処情報と比較して、文字認識を行う。
【選択図】  図1

Description

 本発明は、文字認識方法、文字認識装置および記憶媒体に関するものであり、特に、筆記された文字が続け字であっても良好に文字認識できるものに関する。
 たとえば、PDCなどに搭載される表示入力一体型タブレットにおいては、手書き入力された文字の認識精度が、商品価値を評価する上で重要な要素となっている。かかる文字認識の方法として、文字のストローク座標を辞書情報と比較するものや、文字の筆記方向をその生起順序と共に辞書情報と比較するもの等がある。
 このうち、文字のストローク座標を比較するものは、全ストローク座標について比較する必要から、特に、筆順変動および画数変動の大きな文字については、処理する情報量が膨大となり、辞書情報用および処理プログラム用のメモリが大容量化し、また処理速度が遅くなるといった問題がある。
 文字の筆記方向を辞書情報と比較する方法は、一文字中の各ストローク部位の筆記方向を、その部位の筆記開始タイミング(生起順序)に対応づけて検出し、これをメモリ内の辞書情報と比較して、辞書内で最も整合するものを認識文字とするものである。かかる方法では、先の従来方法に比べ、辞書情報用のメモリが小さくて済み、また処理速度も速くなる。しかしながら、筆記方向を筆記タイミング(時間)に対応づけて検出するものであるから、書き順が正規のものと相違すると、誤認識となってしまう。
 そこで、出願人は、筆記文字ストロークの屈曲点の特徴量を検出し、これを辞書情報と比較して文字認識する方法を開発し、先に、特願平8−310936号(特開平10−154206号公報)として出願している。かかる方法は、筆記文字ストロークの屈曲点の位置と屈曲角度を検出し、これを辞書情報と比較して文字を認識するものである。かかる方法によれば、文字認識のための情報を制限でき、また書き順が正規のものと相違するような場合でも、正しく文字が認識できるようになる。
特開平10−154206号公報
 しかしながら、かかる従来方法では、筆記文字が続け字で書かれたような場合に、続け字の書かれ方に応じて不規則な屈曲点が発生する。このため、文字の屈曲位置を正しく検出できなくなってしまい、文字認識の精度が低下するといった問題がある。この点は、上記他の2つの文字認識方法においても、それぞれの認識方法に応じ、同様に生じる問題である。
 そこで、本発明は、文字認識のための処理情報を制限しながら、続け字で書かれた文字であっても、迅速且つ精度良く文字認識できる文字認識方法、文字認識装置および記憶媒体を提供しようとするものである。
 請求項1に係る文字認識方法は、筆記文字の屈曲個所の特徴量に基づいて文字認識を行う文字認識方法において、一文字中の筆記ストロークの始点と終点とを仮想線分によって連結するステップと、上記筆記文字から実際に筆記屈曲個所とその特徴量を検出するステップと、上記仮想線分によって連結した場合に生じる屈曲個所とその特徴量を検出するステップと、上記筆記文字を縦横所定数のメッシュパターンに分割し、上記両屈曲個所の座標から、対応するメッシュ位置を求め、当該メッシュ位置に上記特徴量を加算することにより特徴抽出を行う特徴抽出ステップと、上記メッシュパターンを、上記両屈曲個所の特徴量と上記仮想線分を予め考慮して作成した認識辞書内の各文字に対するメッシュパターンとを照合することにより文字認識を行うステップと、からなる。
 これによれば、仮想線分によって筆記ストロークの始点と終点とを連結した上で文字認識を行うので、ユーザが続け字で記載した場合にも、筆記文字の屈曲個所と認識候補文字の屈曲個所が相応するようになり、よって、続け字で筆記しても精度良く文字認識できる。
 請求項2に係る文字認識方法は、請求項1に記載の文字認識方法において、上記屈曲個所の特徴量は、上記屈曲個所の屈曲方向または屈曲個所の屈曲角度の内、少なくとも一の情報を含むことを特徴とする。
 このように、請求項1の屈曲個所の位置情報に加えて、屈曲方向および角度を更に認識候補文字のものと比較することにより、認識精度を更に高めることができる。
 請求項3に係る文字認識方法は、請求項2に記載の文字認識方法において、上記特徴抽出ステップは、予め設定された基準方向ごとに用意された各メッシュパターンの内、上記屈曲方向と一致するメッシュパターンの当該メッシュ位置に値を加算することにより特徴抽出を行うことを特徴とする。
 このように基準方向によって正規化することにより、認識辞書内に記憶すべき情報の量を制限でき、また比較および認識の処理が簡単となる。
 請求項4に係る文字認識方法は、請求項3に記載の文字認識方法において、屈曲方向が上記2つの基準方向の間にある場合には、当該両方の基準方向の内、筆記した屈曲方向により接近している方を屈曲方向として採用することを特徴とする。
 このように何れか一方の基準方向のみを採用するようにすれば、記憶すべき情報量が少なくなり、処理も簡単となる。
 請求項5に係る文字認識方法は、請求項3に記載の文字認識方法において、屈曲方向が上記2つの基準方向の間にある場合には、当該両方の基準方向を屈曲方向として採用することを特徴とする。
 このように両方の基準方向を採用するようにすれば、上記請求項3に比べて情報量は増加するが、認識の精度は向上する。
 請求項6に係る文字認識方法は、請求項5に記載の文字認識方法において、屈曲個所の特徴量として上記屈曲方向および屈曲角度の両方を採用する場合、屈曲角度は上記2つの基準方向に対する屈曲方向の接近度に応じて当該2つの基準方向に対し分配することを特徴とする。
 このように、接近度によって屈曲角度を分配するようにすれば、屈曲の方向を2つの基準方向によって表すことができるので、認識の精度を更に向上させることができる。
 請求項7に係る文字認識方法は、請求項1〜6の何れかに記載の文字認識方法において、上記特徴量の比較は、屈曲個所の周辺部にも当該屈曲個所の特徴量を分布させた後に行うことを特徴とする。
 このように、特徴量を屈曲個所の周辺部にも分布させると、筆記文字の一の屈曲個所と、選択されるべき認識候補の屈曲個所とが僅かにずれているような場合でも、当該屈曲個所の照合度がゼロとはならずに、ある程度の照合度を算出できるので、不所望な認識誤りを抑制することができる。
 請求項8に係る文字認識方法は、請求項7に記載の文字認識方法において、周辺部への分布は、当該屈曲個所から離れるに従って特徴量が小さくなるように設定することを特徴とする。
 これにより、上記請求項7において、筆記文字の一の屈曲個所と、選択されるべき認識候補の屈曲個所とが僅かにずれているような場合のみを効率的に救済でき、誤った認識候補文字を選択する確立を抑制できる。
 請求項9に係る文字認識方法は、請求項1〜8の何れかに記載の文字認識方法において、認識辞書の特徴量は、複数のサンプル筆記について検出した屈曲個所の特徴量を当該サンプル数で平均化することにより算出することを特徴とする。
 このように実際に複数人が筆記したサンプル筆記について特徴量を平均化すれば、筆記癖の異なる不特定多数の何れのユーザに対しても精度良く文字認識できるようになる。
 請求項10文字認識方法は、請求項1〜9の何れかに記載の文字認識方法において、認識辞書の特徴量は、ユーザによる筆記文字について検出した筆記個所の特徴量を基に更新することを特徴とする。
 このように、学習により特徴量を更新すれば、ユーザの書き癖に微細に対応した精度の良い文字認識を実現できるようになる。
 請求項11に係る文字認識方法は、請求項1〜10の何れかに記載の文字認識方法において、実際に筆記された際の屈曲個所と仮想線分によって連結した場合に生じる屈曲個所とを区別せずに、一律に上記特徴量の比較処理を行うことを特徴とする。
 このようにすれば、筆記癖の異なる不特定多数の何れのユーザに対しても精度良く文字認識できるようになる。
 請求項12に係る文字認識装置は、請求項1〜11の内、少なくとも一つの文字認識方法を実現する制御手段を有する。
 当該装置は、上記請求項1〜11による効果と同様の効果を奏することができる。
 請求項13に係るプログラムを記憶した記憶媒体は、請求項1〜11の内、少なくとも一つの文字認識方法を実現する。
 これによれば、かかる記録媒体を装置にインストールすることにより、当該装置は、上記請求項1〜11による効果と同様の効果を奏することができる。
 本発明は、文字認識のための処理情報を制限しながら、続け字で書かれた文字であっても、迅速且つ精度良く文字認識できる文字認識方法、文字認識装置および記憶媒体を提供することができる。
 本発明の実施の形態について、図を参照しながら以下に説明する。
 以下、本発明に係る好ましい実施の形態について説明する。
 図1に本発明の一実施例の基本構成を示す。図において、1は表示入力一体型タブレットである。当該タブレット1は、LCD表示部1aと座標検出部1bとが一体となって構成されており、互いの座標位置は一対一に対応している。
 2は、主制御部であり、メモリに記憶されたプログラムに従って他部を制御する。3は文字認識部であり、タブレット1に筆記された座標データを文字認識辞書内のデータと比較して筆記文字を認識し、認識結果を主制御部2に送る。31は文字筆記データ記憶部で、上記主制御部2から送られてきた筆記文字の座標データを一時的に記憶する。
 タブレット1上にペン等で文字が筆記されると、座標検出部1bは筆記位置の座標を一定間隔(例えば1/100秒)で検出し、当該筆記文字の時系列座標データを主制御部2に送る。主制御部2は、受け取った時系列座標データに基づいて、筆跡を表示部1aに表示すると共に、当該時系列座標データを文字認識部3へ転送する。文字認識部3は、受け取った座標データをメモり31に記憶していく。そして、文字の筆記ストロークの開始を検出してからペンが一定時間文字タブレットから離れたかを図示しないタイマーをもとに判別し、一定時間以上ペンが離れたと判別すれば、一文字分の筆記が終了したとして、文字認識部3に認識開始の指令を行う。
 文字認識部3は、認識開始の指示を受けて、それまでに記憶した筆跡の時系列座標データから、筆記文字の特徴量を算出する。なお、かかる筆記文字の特徴量の算出については、後に詳述する。そして、この特徴量と、文字認識辞書4に記憶してある特徴量とを一文字毎に比較し、照合度の最も高い文字を文字認識辞書4内の認識文字候補から選択して、その認識結果を主制御部2に送る。主制御部2は、かかる認識結果を受けて、それまで表示部1aに表示されている筆跡を消去し、その筆跡位置に認識結果に係る文字を新たに表示する。
 次に、本実施の形態に係る文字認識の方法を以下に説明する。
 図2は、当該文字認識の方法を概念的に示す図である。図において、2A−1、2A−2、2A−3は筆記文字から特徴量を検出する流れを示し、2B−1、2B−2、2B−3、2B−4は認識辞書内の認識候補文字の特徴量を作成する流れを示すものである。
 まず、筆記文字から特徴量を検出する流れについて説明する。なお、以下、一文字分の時系列座標データを単に時系列座標データと称し、1ストローク分の時系列座標データを単にストロークデータと称する。
 2A−1は、筆記された文字である。まず、かかる筆記文字の時系列座標データに対し、筆記文字が所定のサイズに整合するように線形または非線形正規化を行い、時系列座標データの座標値を補正する。次に、この正規化文字に対して、筆記ストロークの終点と次の筆記ストロークの始点とを仮想線分によって連結する。2A−2は、かかる正規化処理および仮想線分の追加が行われた筆記文字を示す。このようにして仮想線分の追加された文字に対し、正規化サイズと同じサイズのメッシュ枠を当てはめる。かかるメッシュは、図示のように縦横8×8に分割されている。
 次に、かかるメッシュの各升目領域について、上記正規化された文字の屈曲個所が位置するか否かの検出を行う。さらに、屈曲個所が存在する升目領域については、屈曲の方向および程度を検出する。かかる屈曲の方向および程度の検出は、以下のようにして行う。
 図3において、点線は屈曲個所の筆跡である。矢印の方向は筆記方向を示す。屈曲の方向は、屈曲点により筆記の方向が変化した後の筆記方向によって与えられる。例えば、図3では、変化後右やや斜め上である。但し、屈曲方向の内容は、予め8つの基準方向を基に設定する。ここで、屈曲方向は、通常、これら8つの方向の何れかにそのまま一致することはなく、2つの基準方向の間に位置することとなる。例えば、図3では、屈曲の方向は、「変化後右」と「変化後右上」の間となる。
 本実施の形態では、かかる場合、基準となる2つの方向に対する接近度によって重み付けを行うことで、かかる屈曲方向を設定する。例えば、図3の例では、屈曲後の軌跡は、「変化後右」の方に近く、接近度を比率で表すと、ほぼ3対2であるので、「変化後右」の重みを3/5とし、「変化後左」の重みを2/5とする。そして、図4の屈曲の角度Dθをかかる重み付けで両基準方向に配分し、屈曲点の屈曲方向と屈曲角度とするのである。
 例えば、図3の例では、屈曲点の特徴量は以下のようになる。
 ・ 屈曲方向=「変化後右」、 屈曲角度=Dθ×(3/5)
 ・ 屈曲方向=「変化後右上」、屈曲角度=Dθ×(2/5)
 なお、このように重み付けにより特徴量を設定する代わりに、屈曲方向に最も接近している屈曲方向を一つだけ選択するようにしても良い。たとえば、図3では、屈曲方向は「変化後右」に最も近いので、かかる屈曲点の特徴量を、
 ・屈曲方向=「変化後右」、屈曲角度=Dθとすることもできる。ただし、このようにする場合には、後述する認識辞書側の特徴量の設定も、同様に、最も接近した屈曲方向のみとする必要がある。
 このようにして検出された当該屈曲点の位置情報と屈曲の角度情報は、8つの屈曲基準方向毎にメモリに保持される。たとえば、図2では、2A−3は「変化後右」の屈曲点を黒塗りで示すものである。図示の「言」について、「変化後右」の屈曲点は、黒塗りされた升目位置である。そして、かかる屈曲点の位置情報と、上述の如くして算出された屈曲角度の情報が、「変化後右」の特徴量としてメモリに記憶される。同様に、他の基準屈曲方向についても、各基準屈曲方向毎に、屈曲点の位置情報と屈曲角度情報が記憶される。
 以上のようにして検出された屈曲点の位置情報および角度情報は、図2の2B―3の辞書情報と比較される。かかる辞書情報は、実際に何人かに同一文字を記載させて上記と同様に屈曲点の位置情報と角度情報を当該人数分検出し(2B−1〜2B−3)、これを当該人数にて平均化することにより算出したものである。図2の2B―4の黒塗り部分は、このように平均化した場合に、認識文字「言」について第1位的に屈曲点が存在する位置を示す。
 筆記文字と認識辞書との照合は、以上のようにして得られた筆記文字の特徴量と認識辞書とを、基準屈曲方向毎に比較することにより行う。この際、当該照合度は、筆記文字の屈曲点が、本来正しいとされるべき認識文字の屈曲点から単位メッシュ升分だけずれてしまうと、たちまち大きく低下してしまう。本実施例では、このような場合にも精度良く認識できるように、筆記文字と認識文字の特徴量にガウスフィルターによってぼかしをかけ、実際の屈曲点の周辺にもある程度の特徴量を持たせ、しかる後に筆記文字と認識辞書内の認識文字とを比較して両者の照合度を参照するようにしている。そして、全ての基準屈曲方向について照合度を合計し、最も照合度の高いものを認識辞書内から選択して、認識文字とする。
 上記認識処理のフローチャートを図5に示す。
 認識処理が開始されると、まず筆記文字が非線形正規化処理された後(ステップ501)、仮想線分の生成、追加がなされる(ステップ502)。このように正規化および仮想線分の追加がなされた筆記文字に対し、屈曲位置の検出と(503)、メッシュメモリ(4K)の消去(ステップ504)が実行される。その後、屈曲位置の度合い情報(屈曲方向、屈曲角度)が検出され、基準屈曲方向毎に屈曲位置と屈曲角度がメモリ4Kに記憶される(ステップ505)。
 このようにして、筆記文字の屈曲個所の特徴量が記憶されると、次に、当該特徴量が、予めメモり(4DK)に記憶されている、辞書情報内の各認識候補文字の特徴量と一文字毎に比較され、両者の間の差が、各基準方向毎(基準方向メッシュ毎)に算出される(ステップ506)。そして、当該差が全ての基準方向(8方向)について合計され、これにより、当該認識候補文字と筆記文字との間の照合度が算出される(ステップ507)。
 ステップ506および507の照合度の算出は、認識辞書内の全ての認識候補文字について実行される。しかして、全ての認識候補文字について照合度の算出が終了すると、そのうち最も照合度の高い文字が判別され、当該最も照合度の高い文字が認識文字とされる(ステップ509)。
 次に、認識辞書の作成のためのフローチャートを図6に示す。
 認識辞書の作成が開始されると、まず筆記文字が非線形正規化処理された後(ステップ601)、仮想線分の生成、追加がなされる(ステップ602)。このように正規化および仮想線分の追加がなされた筆記文字に対し、屈曲位置の検出がなされ(604)、同時にメッシュメモリ(4DK)の消去(ステップ603)が実行される。その後、屈曲個所の度合い情報(屈曲方向、屈曲角度)が検出され、基準屈曲方向毎に屈曲個所と屈曲角度がメモリ4DKに加算して記憶される(ステップ605)。
 当該メモリ4DKへの加算記憶は、全てのサンプル筆記者について実行される(ステップ606)。そして、全てのサンプル筆記者による筆記が終了すると、メモリ4DKの総特徴量をサンプル筆記者の人数で割算し平均の特徴量を求める(607)。このようにして、1つの認識候補文字についての特徴量が算出されると、これがメモリ4DKに書き換え記憶される。そして、全ての認識候補文字について、以上のステップ601〜607の処理を繰り返すことにより、4DKに対する全ての認識候補文字の特徴量の記憶が行われる(ステップ608)。
 なお、かかる認識辞書の作成は、通常、手書文字認識装置等の開発時に、またはそれに先だって予め行われるものであるが、これに代えて、またはこれに加えて、例えば、手書文字認識装置のユーザがデジタイザ面に筆記した文字について上記特徴量を検出し、これを上記メモリ4DKに逐次重ね書きして認識辞書の内容を更新する、いわゆる学習機能を設けて、ユーザの書き癖に応じた文字認識精度の改良を図るようにしても良い。
 ところで、上記実施の形態では、筆記ストロークの実際の屈曲個所と、仮想線分による屈曲個所とを区別せずに一律に処理するようにしたが、これに代えて、仮想線分による屈曲個所の重み付けを軽くしたり、あるいは仮想線分の長さに応じて、例えば、仮想線分の長い屈曲個所は重み付けを軽くする等して、続け字となる確立を予め想定して屈曲点の重みづけに変化を持たせることもできる。
 このように、屈曲点の特徴量に更に重み付けを設定する方法は、上記学習機能を設ける場合など、その装置を常に同一ユーザが使用し、書き癖が一律である場合には、認識精度の向上を図ることができる。
 しかしながら、認識辞書が予め装置にプリインストールされており、その後の使用によって更新されないような場合には、むしろ、各屈曲点の特徴量に重み付けを設定しない方が、認識精度は高くなる。この点は、発明者による実験によって確認されている。これは、楷書体によれば通常筆記ストロークが大きく空いているような個所であっても、制約なく自由に記載する場合には続けて筆記されるケースが多く、また、続けて筆記される個所は個人によって相違し、一律に想定できないためであると考えられる。
 以上は、仮想ストロークの生成と追加を、一つのストロークの終点と次のストロークの始点とを単純に連結して行うものであったが、かかる方法によれば、仮想線分のストローク部分を実際に続け字で記載した場合と上記のように単純に仮想線分で結んだ場合とでは、結び目付近のパターンがずれていることが多く、このため誤認識を招くこともあり得る。すなわち、続け字で筆記される場合は、上記仮想線分による場合のように結び目部分が鋭角になることはなく、滑らかに曲線的に筆記する場合が多い。
 そこで、以下の実施の形態では、筆記されたパターンを仮想ストロークにて一筆書きにする際、実ストロークと仮想ストロークの結び目付近を曲線的に滑らかに変形させ(以下、スムージングという)、その後に方向変化特徴等の特徴量を抽出する。
 図7に、かかるスムージング方法を示す。
 同図(a)は、スムージングを行う前のストロークの状態を示すものである。図において、Pnは一つのストロークの終点、Pn−1はPnよりも一つ前の座標点、Pn−2はPnよりも2つ前の座標点である。また、点線は、終点Pnと次のストロークの始点とを連結した場合の仮想ストロークである。Pn+1およびPn+2は、当該仮想ストローク上に計算上の必要から設定した座標点である。ここで、Pn+1はPnとPn−1の間の距離だけPnから離れる位置に設定し、Pn+2はPn−1とPn−2の間の距離だけPn+1から離れる位置に設定する。
 このように計算上の座標点を設定した後、以下の数式によりPn’の座標を算出する。
Pn'(x)=[Pn-2(x)+2Pn-1(x)+4Pn(x)+2Pn+1(x)+Pn+2(x)]/10 …(1)
Pn'(y)=[Pn-2(y)+2Pn-1(y)+4Pn(y)+2Pn+1(y)+Pn+2(y)]/10 …(2)
 このようにして算出したPn’をPnと置き換える。さらに、上記のようにして新たに設定した座標点Pn+1およびPn+2を実座標データに追加する。かかる座標データの更新をストロークの全ての仮想線分との連結点について実行する。この際、ストロークの始点が連結点である場合は、上記Pn’を求める場合の処理とは逆に、当該始点に続く2つの座標と当該始点との間の距離だけ当該始点から仮想線分を遡った位置に新たな座標点を設定する。すなわち、図7(a)のPmに対して、Pm−1とPm−2を新たに設定し、上記(1)(2)式でもって、Pm’を算出する。
 その後、更新した座標データを基に、上記第1の実施の形態と同様、屈曲個所の位置と屈曲角度の検出処理を実行して筆記文字の特徴量を求め、当該特徴量を辞書データと比較して認識候補を決定する。
 なお、このようにスムージングを行った場合、辞書データは、当該スムージングに対応したものとする必要がある。すなわち、上記と同様、実際の筆記によりサンプルを集めるのであるが、このサンプルに対しても同様のスムージングを施した後、スムージングにて更新した座標データを平均化して辞書データを作成する。
 ところで、図7(a)では、ストロークの終点の前に実座標点が2つ以上存在していたが、筆記文字によっては、当該終点の前に実座標点が1つしか存在しないような場合がある。かかる場合には、計算上の座標データをPn+1のみとし、新たな座標点Pn’は以下の式で求める。
Pn'(x)=[2Pn-1(x)+4Pn(x)+2Pn+1(x)]/8 …(3)
Pn'(y)=[2Pn-1(y)+4Pn(y)+2Pn+1(y)]/8 …(4)
 そして、かかるPn’をPnに置き換えるとともに、実座標データにPn+1のみを追加してスムージング処理とする。
 当該第2の実施形態に係るフローチャートを図8に示す。同図のフローチャートは第1の実施の形態に係る図5のフローチャートに比べ、ステップ803のスムージング処理とステップ807のぼかし処理が追加されている。このうち、ステップ803のスムージング処理については、上述した通りである。ステップ807のぼかし処理とは、メッシュメモリ4K中の、一つの記憶領域の点数を、その周りの記録領域に影響させる処理で、当該一つの記憶領域の点数を2倍すると共に、その周りの記憶領域に、当該一つの記憶領域の点数をそのまま(1倍して)加算するものである。かかるぼかし処理をメッシュメモリ4K中の全ての記憶領域に対し行うことで、筆記文字の特徴量の僅かなズレ、たとえば屈曲位置が辞書情報内の本来正しいとされるべき文字の屈曲位置から少しだけずれたとしても、ほぼ正しく文字認識が行えるようになる。
 以上の第2の実施の形態では、実際に筆記した軌跡の線分の終点と次の線分の始点とを仮想線分で連結した場合の実際の座標点(Pn−2、Pn−1、Pn)および仮想の座標点(Pn+1、Pn+2)に基づいて、スムージングを行うようにしたが、仮想線分によって、より忠実に続け字を再現しようとすれば、図7において、仮想線分方向にPnを湾曲させたPn’を採用するよりも、むしろ、線分の終点Pnを次の線分の始点方向に湾曲させながら延長し、この延長後の終点と次の線分の始点とを仮想線分で連結した後に上記スムージング処理を行った方が、続け字の再現性が良好になる場合が多い。
 かかる第3の実施の形態の一例として、図9に示すように、終点Pnに対し延長点Pn+1を新たに設定し、同時に、始点Pmに対し延長点Pm―1を新たに設定し、その後に、上記と同様のスムージング処理を実行するようにする。かかる場合、スムージングの対象となる座標点は、新たに設定された延長点であるPn+1とPm−1である。すなわち、かかる延長点Pn+1およびPm−1は、スムージング処理により、P’n+1とP’m−1に変更される。
 ここで、座標点Pn+1は、PnとPn−1の間の距離だけPnから離れ、且つ、PnとPn−1の間の方向変化角度だけPnの方向から変位させた位置に設定される。同様に、座標点Pm−1は、PmとPm+1の間の距離だけPmから離れ、且つ、Pm―1とPmの間の方向変化角度だけPmの方向から変位させた位置に設定される。
 かかる第3の実施の形態における処理フローチャートは、図8のフローチャートにおけるステップ801とステップ802の間に、上記延長座標点の設定処理を追加することにより実現される。また、認識辞書の作成も、かかるフローチャートの変更に伴って変更するようにすればよい。
 なお、かかる第3の実施の形態では、延長する座標点を一つのみ新たに設定するようにしたが、これに代えて、延長点として2以上の座標点を設定した後に、スムージング処理を行うようにしても良い。この場合、延長後の座標点は、上記の場合と同様に、距離は直前の座標点間の距離をそのまま採用し、湾曲の度合いは直前の座標転換の方向変位角度を延長する毎に設定するようにすればよい。
 以上、本発明の実施の形態について説明したが、本発明は、かかる実施の形態に限らず、種々の変更が可能であることは言うまでもない。
は、実施の形態の構成を示す図である。 は、実施の形態に係る文字認識方法の概要を示す図である。 は、実施の形態に係る屈曲個所の方向を示す図である。 は、実施の形態に係る屈曲個所の角度を示す図である。 は、実施の形態に係る認識処理のフローチャートである。 は、実施の形態に係る認識辞書の作成処理のフローチャートである。 は、第2の実施形態を説明する図である。 は、第2の実施形態に係る認識処理のフローチャートである。 は、第3の実施形態を説明する図である。
符号の説明
1 表示入力一体型タブレット
2 主制御部
3 文字認識部
4 文字認識辞書
31 文字筆記データ記憶用メモリ

Claims (13)

  1. 筆記文字の屈曲個所の特徴量に基づいて文字認識を行う文字認識方法において、一文字中の筆記ストロークの始点と終点とを仮想線分によって連結するステップと、
     上記筆記文字から実際に筆記屈曲個所とその特徴量を検出するステップと、
     上記仮想線分によって連結した場合に生じる屈曲個所とその特徴量を検出するステップと、
     上記筆記文字を縦横所定数のメッシュパターンに分割し、上記両屈曲個所の座標から、対応するメッシュ位置を求め、当該メッシュ位置に上記特徴量を加算することにより特徴抽出を行う特徴抽出ステップと、
     上記メッシュパターンを、上記両屈曲個所の特徴量と上記仮想線分を予め考慮して作成した認識辞書内の各文字に対するメッシュパターンとを照合することにより文字認識を行うステップと、
    からなる文字認識方法。
  2. 上記屈曲個所の特徴量は、上記屈曲個所の屈曲方向または屈曲個所の屈曲角度の内、少なくとも一の情報を含むことを特徴とする請求項1に記載の文字認識方法。
  3. 上記特徴抽出ステップは、予め設定された基準方向ごとに用意された各メッシュパターンの内、上記屈曲方向と一致するメッシュパターンの当該メッシュ位置に値を加算することにより特徴抽出を行うことを特徴とする請求項2に記載の文字認識方法。
  4. 屈曲方向が上記2つの基準方向の間にある場合には、当該両方の基準方向の内、筆記した屈曲方向により接近している方を屈曲方向として採用することを特徴とする請求項3に記載の文字認識方法。
  5. 屈曲方向が上記2つの基準方向の間にある場合には、当該両方の基準方向を屈曲方向として採用することを特徴とする請求項3に記載の文字認識方法。
  6. 屈曲個所の特徴量として上記屈曲方向および屈曲角度の両方を採用する場合、屈曲角度は上記2つの基準方向に対する屈曲方向の接近度に応じて当該2つの基準方向に対し分配することを特徴とする請求項5に記載の文字認識方法。
  7. 上記特徴量の比較は、屈曲個所の周辺部にも当該屈曲個所の特徴量を分布させた後に行うことを特徴とする請求項1〜6の何れかに記載の文字認識方法。
  8. 周辺部への分布は、当該屈曲個所から離れるに従って特徴量が小さくなるように設定することを特徴とする請求項7に記載の文字認識方法。
  9. 認識辞書の特徴量は、複数のサンプル筆記について検出した屈曲個所の特徴量を当該サンプル数で平均化することにより算出することを特徴とする請求項1〜8の何れかに記載の文字認識方法。
  10. 認識辞書の特徴量は、ユーザによる筆記文字について検出した筆記個所の特徴量を基に更新することを特徴とする請求項1〜9の何れかに記載の文字認識方法。
  11. 実際に筆記された際の屈曲個所と仮想線分によって連結した場合に生じる屈曲個所とを区別せずに、一律に上記特徴量の比較処理を行うことを特徴とする請求項1〜10の何れかに記載の文字認識方法。
  12. 上記請求項1〜11の内、少なくとも一つの文字認識方法を実現する制御手段を有する文字認識装置。
  13. 上記請求項1〜11の内、少なくとも一つの文字認識方法を実現するプログラムを記憶した記憶媒体。
JP2003401999A 1998-04-27 2003-12-01 文字認識方法、文字認識装置および記憶媒体 Expired - Fee Related JP4059841B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003401999A JP4059841B2 (ja) 1998-04-27 2003-12-01 文字認識方法、文字認識装置および記憶媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11700598 1998-04-27
JP17153298 1998-06-18
JP2003401999A JP4059841B2 (ja) 1998-04-27 2003-12-01 文字認識方法、文字認識装置および記憶媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP09315199A Division JP3749035B2 (ja) 1998-04-27 1999-03-31 文字認識方法、文字認識装置および記憶媒体

Publications (2)

Publication Number Publication Date
JP2004133951A true JP2004133951A (ja) 2004-04-30
JP4059841B2 JP4059841B2 (ja) 2008-03-12

Family

ID=32303070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003401999A Expired - Fee Related JP4059841B2 (ja) 1998-04-27 2003-12-01 文字認識方法、文字認識装置および記憶媒体

Country Status (1)

Country Link
JP (1) JP4059841B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100745753B1 (ko) * 2005-11-21 2007-08-02 삼성전자주식회사 영상의 문자 영역 검출장치 및 방법
US10725650B2 (en) 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100745753B1 (ko) * 2005-11-21 2007-08-02 삼성전자주식회사 영상의 문자 영역 검출장치 및 방법
US10725650B2 (en) 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program

Also Published As

Publication number Publication date
JP4059841B2 (ja) 2008-03-12

Similar Documents

Publication Publication Date Title
US6289124B1 (en) Method and system of handwritten-character recognition
US6249606B1 (en) Method and system for gesture category recognition and training using a feature vector
US7974472B2 (en) Feature design for HMM based Eastern Asian character recognition
US10606474B2 (en) Touch screen finger tracing device
KR960008205B1 (ko) 육필 인식에 대한 기준선, 줄간격 및 문자 높이 예측
US20040246240A1 (en) Detection of a dwell gesture by examining parameters associated with pen motion
US5923793A (en) Handwritten character recognition apparatus with an improved feature of correction to stroke segmentation and method for correction to stroke segmentation for recognition of handwritten character
KR20120095852A (ko) 디스플레이 표면상에서 손글씨 잉크 객체를 그리기 및 지우기 하는 방법 및 장치
US20230008529A1 (en) Gesture stroke recognition in touch-based user interface input
JP2004133951A (ja) 文字認識方法、文字認識装置および記憶媒体
JP2002515144A (ja) 手書き入力ストローク分割方法
US20120299837A1 (en) Identifying contacts and contact attributes in touch sensor data using spatial and temporal features
JP3749035B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JP2000163514A (ja) 文字認識方法、文字認識装置および記憶媒体
JP3357847B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JPH1049624A (ja) 手書き文字認識方法及び装置
EP4086744B1 (en) Gesture stroke recognition in touch-based user interface input
JP3817281B2 (ja) 情報処理装置及び方法
JP3977477B2 (ja) 手書き文字認識のための筆順処理方法及び手書き文字認識装置
JP3357835B2 (ja) 文字認識方法、文字認識装置および記憶媒体
JPH10214312A (ja) オンライン手書き文字認識装置
JP3146046B2 (ja) オンライン文字認識装置
JPH1011538A (ja) 手書き文字認識装置および認識方法
CN110796917A (zh) 一种电脑化写字评估与训练方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071022

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees