JP2005505866A - 文字認識 - Google Patents
文字認識 Download PDFInfo
- Publication number
- JP2005505866A JP2005505866A JP2003536972A JP2003536972A JP2005505866A JP 2005505866 A JP2005505866 A JP 2005505866A JP 2003536972 A JP2003536972 A JP 2003536972A JP 2003536972 A JP2003536972 A JP 2003536972A JP 2005505866 A JP2005505866 A JP 2005505866A
- Authority
- JP
- Japan
- Prior art keywords
- prototype
- prototypes
- character
- spellings
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Revoked
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Abstract
【選択図】図1
Description
【0001】
本発明は、分類体系を変更するための方法および装置に関する。より詳細には、変更は、ユーザ非依存型分類体系がユーザ依存型分類体系に変更されるようになされる。
【背景技術】
【0002】
この明細書において参照されるすべての従来技術は、それらの従来技術が一般的に良く知られている知識の一部しか構成しない限り、本発明を想到させまたは何らかの形で示唆するものではなく、また、そのようなものであるとみなされるべきではない。
【0003】
一般的には、手書き文字認識システムは、それらのシステムが一人のユーザの特定の書き方だけを認識するように訓練されていることを意味する筆者(書き手)依存型と、それらのシステムがどのようなユーザの書き方をも認識するように訓練されていることを意味する筆者非依存型とに分類される。筆者依存型システムは、一人のユーザの書体をモデル化するだけでよいので、通常、筆者非依存型システムよりも正確な認識(特定のユーザに対して)を提供することができる。しかしながら、一般的には、それらの筆者依存型システムは、ユーザに固有の訓練を実施することができるように、大量の訓練情報をユーザが入力する必要がある。それとは逆に、一般的に、筆者非依存型システムは、多数のユーザから得られた訓練データのコーパスを用いて開発されているので、ユーザに固有の訓練を必要としない。これらのシステムは、ストロークおよび字体構成における様々な様式的変種を考慮に入れなければならないので、文字クラス間における混同を発生させる可能性がより高い。
【0004】
筆者適応は、ユーザによって提供されたデータを用いて、筆者非依存型認識システムを筆者依存型システムに変換するプロセスである。適応システムは、ユーザが訓練データを入力するという時間のかかるプロセスを実行することを必要としないので、魅力的なものであり、そして、時間が経てば、筆者依存型システムの認識精度に近づくことができる。これに加えて、適応システムは、ユーザの書き方が経時的に変化することに適応することができる。
【0005】
適応システムを開発する際の1つの問題は、得られた適応が改善された認識をもたらすことを保証することである。入念に実施されなければ、適応処理は、例えば、間違ってラベルを付されたプロトタイプを包含することによって、あるいは、不適切なパターンまたは曖昧なパターンに適応することによって、特定のユーザに対する全体的な認識率を低下させる場合がある。その結果として、多くの適応システムは、適応を実現するために、筆者からの指導を必要とし、適応のために使用されるデータが適切なものであり且つ正しくラベルを付されたものであることを保証するために、ユーザとの対話を用いる。この例が、米国特許第5,917,924号、米国特許第5,754,686号、米国特許第5,544,260号、および、米国特許第5,550,930号に記載されている。
【0006】
これは、退化的な適応の発生を抑制することができるが、ユーザは、時間がかかり退屈であるかもしれない多くの操作に没頭しなければならない。
【0007】
適応識別器は、システムがユーザの特定の書体に適応できるように、ある種の学習プロセスを使用しなければならない。教師あり学習は、そのようなプロセスであり、それによって、識別器の動作は、一組のサンプルの正しいラベル付け(すなわち、それぞれのサンプルの正しいカテゴリーが供給される)に基づいて変更される。しかしながら、一般的には、この情報は、ユーザの介入がなければ、適応システムは利用することができない。なぜなら、ラベルが付された利用することのできる情報だけが、識別器自身の出力であるからである。あるいは、教師なし学習技術(自己組織化学習としても知られている)は、ラベルが付されたサンプルを学習プロセスに必要とせず、したがって、正しい結果のわからない適応システムには適している。
【0008】
競合学習は、システムの要素が活性化されるためにお互いに競合する教師なし学習プロセスであり、例えば、方位感受性神経細胞の自己組織化に関するC.von der Malsburg,“Self−Organisation of Orientation Sensitive Cells in the Striate Cortex”.Kybernetik,14巻,85〜100頁,1973において説明されている。同様に、コグニトロンと呼ばれる多層ニューラルネットワークの自己組織化に関するK.Fukushima,“Cognitron:a Self−Organising Multilayered Neural Network”.Biological Cybernetics,20巻,121〜136頁,1975においても説明されている。また、J.Ambros−Ingerson,R.GrangerおよびG.Lynch,“Simulation of Paleocortex Performs Hierarchical Clustering”.Science,247巻,1344〜1348頁,1990に説明されるような競合学習技術のための神経生物学的位置調整もある。
【0009】
ここで、これらの技術を説明する文献の更なる例について説明する。V.Vuori,J.Laaksonen,E.OjaおよびJ.Kangas,“On−line Adaptation In Recognition of Handwritten Alphanumeric Characters”,Proceedings of the Fifth International Conference on Document Analysis and Recognition.ICDAR ’99.IEEE Computer Society,Los Alamitos,CA,USAは、3つの方法の様々な組み合わせを含む手書き英数字のためのユーザ固有適応システムを説明している。3つのこれらの方法は、k−NN検索に基づいてプロトタイプを追加し、有益であるよりも有害であると考えられるプロトタイプを活性化し、そして、Springer Series in Information Sciences.Springer−Verlag,1997,30巻のT.Kohonen,“Self Organising Maps”に説明されるように、学習ベクトル量子化に基づいて、プロトタイプを作り直すことを含む。
【0010】
識別器は、単純圧縮最近傍法に基づいたものであり、プロトタイプを圧縮するために、半自動プロトタイプクラスタリングアルゴリズムが、訓練中に使用される。入力とプロトタイプとの類似性の量を計算するために、様々な点と点、点と線、および、面積の尺度を用いた動的時間伸縮法が、使用される。プロトタイプを非活性化するためのアプローチは、教師あり学習を使用する(J.Laaksonen,V.Vuori,E.OjaおよびJ.Kangas,“Adaptation of Prototype Sets In On−line Recognition Of Isolated Handwritten Latin Characters”において説明されるように、「ユーザによって報告された誤分類が、システムを修正するのに使用される」)。また、このシステムは、特定のクラスに基づいた異綴り体識別ではなくクラス内混同によって決定を行う。また、このアプローチは、2分決定に基づくものであり、混同するプロトタイプは、「活性プロトタイプの組から除去」される。
【0011】
L.Schomaker,H.Teulings,E.HelsperおよびG.Abbink,“Adaptive Recognition Of Online,Cursive Handwriting”,Proceedings of the Sixth International Conference on Handwriting and Drawing.Paris,July,4−7,1993:Telecom,(19〜21頁)およびIWFHR III,CEDAR,SUNY Buffalo,USA,May25−27,1993においてデモンストレーション用に配布された印刷物であるL.Schomaker,H.Teulings,G.AbbinkおよびE.Helsper“Adaptive Recognition of On−line Connected−cursive Script for use in Pen−based Notebook Computers.”は、Kohonen自己組織化マップ(SOM)を用いてクラスタリングされたプロトタイプストロークに基づいた続け字認識システムを説明している。説明されたプロセスは、書かれた入力を認識するのに使用される筆者非依存型ストローク遷移ネットワークを使用する。
【0012】
認識器によって出力された上位20個の可能性のあるワードのうち1つでも辞書によって定義された正当なワードであることがわかれば、ストローク遷移ネットワークにおける値が、「ターゲットワードがワードの出力リストの最上位にくるまで、あるいは、反復回数の最大値に到達するまで、小さな増分単位で増加」させられる。適応システムは、ストローク遷移ネットワークにおける個々のストローク解釈ごとに、ユーザ固有確率を含む。
【0013】
L.Heutte,T.Paquet,A.NosaryおよびC.Hernoux,“Defining Writer’s Invariants To Adapt the Recognition Task”,Proceedings of the Fifth International Conference on Document Analysis and Recognition,IEEE Computer Society,1998は、オフライン文字認識(OCR)システムの認識を改善するために、形態素的筆者固有不変式を使用する。この技術は、認識プロセスの曖昧さをなくすために、文脈的知識とともに使用される筆者固有不変式を検出およびクラスタリングすることを必要とする。
【0014】
S.ConnellおよびA.Jain,“Learning Prototypes For On−line Handwritten Digits”,Proceedings of the 14th International Conference on Pattern Recognition,Brisbane,Australia,182〜184頁,Aug.1998およびG.Hinton,C.WilliamsおよびM.Revow,“Adaptive elastic models for character recognition”,Advances in Neural Information Processing Systems 4,Morgan Kaufmann,San Mateo,CA.のような識別器を訓練するための適応技術を用いた多くのアプローチが、提案されてきた。
【0015】
同様に、S.ConnellおよびA.K.Jain,“Writer Adaptation of Online Handwritten Models,” Proc. 5th International Conference on Document Analysis and Recognition,Bangalore,India,434〜437頁,Sept.1999は、筆者適応システムを説明しており、このシステムは、筆者非依存型モデル内に存在する語彙の識別に基づいてユーザに固有の書き方を構築することを試み、そして、それらの識別器を再訓練するために、この筆者依存型モデルを使用する。このアプローチは、隠れマルコフモデル(HMM)識別器の訓練を中核にしたものであるので、適応技術は、恐らくは、それぞれの筆者に対して1回しか実行されないであろう(HMMシステムを再訓練するのに必要な大きなオーバーヘッドのために)。これらの技術のどれもが、ユーザ入力に基づいて連続的にユーザ固有適応を達成することを試みていない。
【0016】
米国特許第6,038,343号は、認識結果を改善するために、ユーザ非依存型「汎用認識辞書」と組み合わせて筆者固有特徴ベクトルを生成することを用いた適応技術へのアプローチを説明している。それらは、「入力文字の特徴ベクトルから複数の代替カテゴリーごとに筆者固有特徴ベクトルを予測」するために、統計的回帰を使用する。この方法は、ユーザ非依存型特徴ベクトルを筆者固有特徴ベクトルと組み合わせることによって、それらのユーザ非依存型特徴ベクトルを「修正」し、そして、それらのユーザ非依存型特徴ベクトルは、将来のユーザ入力ベクトルのための文字予測を提供するために生成的に使用される。
【0017】
米国特許第5,917,924号は、認識プロセスにおいて候補として適合するプロトタイプの尤度を変更する適応重みを使用し、「編集モードにおける重み付け値を変更するだけ」である。すなわち、この方法は、ユーザとの対話から決定された結果に基づいてプロトタイプの重みを変更するだけである。
【0018】
米国特許第5,754,686号は、筆者依存型モデルを記憶するために、ユーザ固有辞書を使用することへのアプローチを説明している。「認識信頼性が低ければ、警報が発せられる。警報に応答して、ユーザまたはオペレータは、その文字パターンをユーザ辞書に登録すべきかどうかを決定することができる。」パターンは、ユーザ辞書に含めるべきかどうかの適合性を自動的に評価されるが(恐らくは、既存のプロトタイプによる曖昧さの尺度を使用することによって)、認識中に、どのようにしてユーザ固有辞書プロトタイプを既存の筆者非依存型モデルと組み合わせるかについては記載されていない。
【0019】
米国特許第6,256,410号は、筆者依存型HMM識別器を訓練するための標準体系を説明しており、それによれば、ユーザ固有訓練データは、筆者非依存型モデルを用いて、切り出され、文字に基づいた一組のモデルが、その訓練データを用いて、反復的に訓練される。
【0020】
米国特許第5,319,721号は、一組のユーザ非依存型プロトタイプを一組の筆者依存型プロトタイプに進化させる方法を説明している。入力ストロークデータが所定のしきい値以下でプロトタイプと一致すれば、ユーザデータは、筆者依存型プロトタイプを生成するために、既存のプロトタイプと統合され、そして、「入力シンボルと同じラベルを有する1つまたはそれ以上のスタータープロトタイプシンボル」が、削除される。ストロークデータが既存のプロトタイプと一致しなければ、新しいプロトタイプが、生成され、そして、この場合にも、同じラベルを有する1つまたはそれ以上のスタータープロトタイプが、削除される。
【0021】
米国特許第5,544,260号においては、「文字プロトタイプを変更するために誤り訂正中に提供される情報」を使用すること、すなわち、誤って認識されたプロトタイプを更新するためにユーザによってなされる訂正ストロークを使用することが説明されている。同様に、米国特許第5,550,930号は、認識結果を記憶する方法を説明しており、ユーザから要求されると、その結果を表示し、ユーザが、識別器を訓練するために、その入力およびそれに対応するシンボルを選択するのを可能にする。
【0022】
米国特許第5,285,505号は、識別のために重要な文字部分を強調し且つ文字間で類似する部分をあまり強調しないことによって、「同じような形をした文字の認識精度を改善するために文字プロトタイプを生成する」方法を説明している。このアプローチは、具体的には、‘g’/‘y’および‘A’/‘H’を混同するような2つのクラスの曖昧さを識別することに取り組むものである。
【発明の開示】
【0023】
範囲の広い第1の形態において、本発明は、手書き文字を分類するための分類体系を変更し、それによって、上記分類体系をユーザ依存型にする方法を提供し、上記分類体系は、いくつかの異綴り体を含み、それぞれの上記異綴り体は、それぞれの字体のそれぞれの様式を表現し、上記方法は、
a)少なくとも1つの手書き文字を受け取り、
b)上記文字を表現する1つの異綴り体を選択し、
c)上記選択に基づいて1つまたはそれ以上の上記異綴り体を変更する。
【0024】
典型的には、上記方法は、上記選択された異綴り体が上記ユーザによって使用されるそれぞれの上記字体の様式に対応することをもたらすように、上記異綴り体を変更することを含む。
【0025】
上記分類体系は、いくつかのクラスを含み、それぞれの上記クラスは、それぞれの上記字体を表現し、且つ、1つまたはそれ以上の上記異綴り体を含み、上記方法は、
a)上記文字を表現するクラスを選択し、それによって、上記文字によって表現される上記字体を決定し、
b)それぞれの上記クラスにおける1つまたはそれ以上の上記異綴り体を変更することを含む。
【0026】
典型的には、それぞれの上記異綴り体は、1つまたはそれ以上のプロトタイプを含み、それぞれの上記プロトタイプは、それぞれの上記異綴り体における変種を表現し、上記方法は、
a)少なくともいくつかのプロトタイプに対して、上記文字とそれぞれの上記プロトタイプとの類似性に基づいて、選択値を決定し、
b)上記決定された選択値に基づいて、それぞれの上記プロトタイプの中から1つを選択することを含む。
【0027】
一般的には、上記方法は、上記選択されたプロトタイプに基づいて、上記クラスを選択することを含む。
【0028】
上記方法は、通常、上記選択されたプロトタイプに基づいて、上記異綴り体を選択することを含む。
【0029】
典型的には、それぞれの上記プロトタイプは、プロトタイプベクトルとして表現され、それぞれの上記プロトタイプベクトルは、いくつかの値から構成され、それぞれの上記値は、それぞれの上記プロトタイプのそれぞれの特徴を定量化する。この場合、典型的には、上記選択値を決定する方法は、
a)上記文字を表現する特徴ベクトルを決定し、上記特徴ベクトルは、いくつかの値から構成され、それぞれの上記値が、上記文字のそれぞれの特徴を定量化し、
b)上記特徴ベクトルとそれぞれの上記プロトタイプベクトルとの距離を表現する距離値を決定することを含む。
【0030】
それぞれの上記異綴り体は、好ましくは、対応する重み付けを含み、この場合、上記方法は、
a)上記重み付けに基づいて、上記異綴り体を選択し、
b)1つまたはそれ以上の上記異綴り体の重み付けを変更することによって、上記異綴り体を変更することを含む。
【0031】
あるいは、上記方法は、上記ユーザによって使用されない上記異綴り体をただ単に除去することを含んでもよいが、これは、一般的に、あまり正確なものではないことがわかる。
【0032】
典型的には、上記選択値は、上記決定された距離値と、それぞれの上記異綴り体に対応する上記重み付けとに基づいて、決定される。
【0033】
典型的に、上記方法は、少なくとも上記選択されたプロトタイプを含む異綴り体の重み付けを変更することを含む。
【0034】
通常、上記方法は、最も小さな選択値を有するプロトタイプを選択することを含む。
【0035】
上記重み付けを変更する方法は、
a)上記選択されたプロトタイプを含む異綴り体に対する重み付けを減少させ、
b)上記選択されたプロトタイプを含まない1つまたはそれ以上の異綴り体に対する重み付けを増加させる、
ことの少なくとも1つを含んでもよい。
【0036】
一般的には、上記方法は、上記異綴り体の重み付けを予め定められた量だけ増加および/または減少させることを含む。
【0037】
あるいは、上記方法は、
a)変更されるべき異綴り体ごとに基準プロトタイプを選択し、
b)上記基準プロトタイプごとに上記距離値を決定し、
c)上記決定された距離値の平均値を決定し、
d)それぞれの上記基準プロトタイプの上記距離値と平均距離値とに基づいて、それぞれの上記異綴り体の重み付けを変更する、
ことを含んでもよい。
【0038】
この場合、通常、上記基準プロトタイプは、それぞれの上記異綴り体に対して最も小さな距離値を有するプロトタイプである。
【0039】
典型的には、上記方法は、処理システムを用いて実行され、上記処理システムは、
a)上記異綴り体を表現する異綴り体データを記憶する記憶装置と、
b)プロセッサと、を含み、
上記プロセッサは、
i)上記手書き文字を受け取り、
ii)上記異綴り体を選択し、
iii)1つまたはそれ以上の上記異綴り体を変更する、
ように構成される。
【0040】
範囲の広い第2の形態において、本発明は、手書き文字を分類するための分類体系を変更し、それによって、上記分類体系をユーザ依存型にするための装置を提供し、上記装置は、
a)いくつかの異綴り体を表現する異綴り体データを記憶するための記憶装置であって、それぞれの上記異綴り体は、それぞれの字体のそれぞれの様式を表現する、上記記憶装置と、
b)プロセッサと、を含み、
上記プロセッサは、
i)少なくとも1つの上記手書き文字を受け取り、
ii)上記文字を表現する異綴り体を選択し、
iii)上記選択に基づいて、上記異綴り体データを変更し、それによって、1つまたはそれ以上の上記異綴り体を変更する、
ように構成される。
【0041】
この場合、典型的には、上記異綴り体データは、それぞれの上記異綴り体に対応する重み付けを含み、上記プロセッサは、上記重み付けを変更することによって、上記異綴り体データを変更するように構成される。
【0042】
また、上記記憶装置は、クラスデータを記憶するように構成されてもよく、上記クラスデータは、いくつかのクラスを表現し、それぞれの上記クラスは、それぞれの字体を表現し、且つ、1つまたはそれ以上の上記異綴り体を含む。
【0043】
上記記憶装置は、プロトタイプを表現するプロトタイプデータを記憶するように構成されてもよく、それぞれの上記異綴り体は、1つまたはそれ以上の上記プロトタイプを含み、それぞれの上記プロトタイプは、それぞれの上記異綴り体における変種を表現する。
【0044】
上記プロセッサは、好ましくは、本発明による範囲の広い第1の形態の方法を実行するように構成される。
【0045】
範囲の広い第3の形態において、本発明は、ユーザ依存型分類体系を用いて手書き文字を分類する方法を提供し、上記分類体系は、いくつかの異綴り体を含み、それぞれの上記異綴り体は、それぞれの字体のそれぞれの様式を表現し、且つ、ユーザ依存性を表現するそれぞれの重み付けを有し、それぞれの上記異綴り体は、1つまたはそれ以上のプロトタイプを含み、それぞれの上記プロトタイプは、それぞれの上記異綴り体における変種を表現し、上記方法は、
a)少なくとも1つの手書き文字を受け取り、
b)少なくともいくつかの上記プロトタイプに対して、上記文字とそれぞれの上記プロトタイプとの類似性と、それぞれの上記プロトタイプを含む上記異綴り体の重み付けとに基づいて、選択値を決定し、
c)上記決定された選択値に基づいて、それぞれの上記プロトタイプの中から1つを選択し、
d)上記選択されたプロトタイプに基づいて、上記文字を分類する、
ことを含む。
【0046】
それぞれの上記プロトタイプは、プロトタイプベクトルとして表現されてもよく、それぞれの上記プロトタイプベクトルは、いくつかの値から構成され、それぞれの上記値は、それぞれの上記プロトタイプのそれぞれの特徴を定量化する。この場合、典型的には、上記選択値を決定する方法は、
a)上記文字を表現する特徴ベクトルを決定し、上記特徴ベクトルは、いくつかの値から構成され、それぞれの上記値は、上記文字のそれぞれの特徴を定量化し、
b)上記特徴ベクトルとそれぞれの上記プロトタイプベクトルとの距離を表現する距離値を決定し、
c)上記決定された距離値と、それぞれの上記異綴り体に対応する重み付けとに基づいて、上記選択値を決定することを含む。
【0047】
上記分類体系は、いくつかのクラスを含んでもよく、それぞれの上記クラスは、それぞれの字体を表現し、且つ、1つまたはそれ以上の上記異綴り体を含む。この場合、通常、上記方法は、上記選択されたプロトタイプに基づいて、クラスを選択することを含み、それによって、上記文字によって表現される上記字体を決定する。
【0048】
一般的には、上記分類体系は、本発明による範囲の広い第1の形態の方法に基づいて、変更される。
【0049】
一般的には、上記方法は、処理システムを使用することを含み、上記処理システムは、
a)i)上記異綴り体およびそれに対応する重み付けを表現する異綴り体データと、
ii)上記プロトタイプを表現するプロトタイプデータと、
を記憶するための記憶装置と、
b)プロセッサと、を含み、
上記プロセッサは、
i)上記手書き文字を受け取り、
ii)上記選択値を決定し、
iii)上記プロトタイプを選択し、
iv)上記文字を分類する、
ように構成される。
【0050】
範囲の広い第4の形態において、本発明は、ユーザ依存型分類体系を用いて手書き文字を分類するための装置を提供し、上記装置は、
a)i)いくつかの異綴り体およびそれぞれの上記異綴り体に対応する重み付けを表現する異綴り体データであって、それぞれの上記異綴り体は、それぞれの字体のそれぞれの様式を表現し、上記重み付けは、上記異綴り体のユーザ依存性を表現する、上記異綴り体データと、
ii)1つまたはそれ以上のプロトタイプを表現するプロトタイプデータであって、それぞれの上記プロトタイプは、それぞれの上記異綴り体における変種を表現する、上記プロトタイプデータと、
を記憶するための記憶装置と、
b)プロセッサと、を含み、
上記プロセッサは、
i)少なくとも1つの手書き文字を受け取り、
ii)少なくともいくつかの上記プロトタイプに対して、上記文字とそれぞれの上記プロトタイプとの類似性と、それぞれの上記プロトタイプを含む上記異綴り体の重み付けとに基づいて、選択値を決定し、
iii)上記決定された選択値に基づいて、それぞれの上記プロトタイプの中から1つを選択し、
iv)上記選択されたプロトタイプに基づいて、上記文字を分類する、
ように構成される。
【0051】
この場合、上記記憶装置は、いくつかのクラスを表現するクラスデータを記憶するように構成されてもよく、それぞれの上記クラスは、それぞれの字体を表現し、且つ、1つまたはそれ以上の上記異綴り体を含む。
【0052】
したがって、上記プロセッサは、本発明による範囲の広い第3の形態の方法を実行するように構成される。
【0053】
添付の図面を参照して、本発明の好ましい限定するものではない実施形態の単なる例として提供される以下の説明から、本発明を容易に理解できるはずである。
【発明を実施するための形態】
【0054】
本発明の主題をより正確に理解するために、本明細書および添付の特許請求の範囲に適用される以下の態様を説明する。
【0055】
手書き文字認識を実行するように構成された処理システム10を示す図1を参照して、本発明を実施するのに適した装置の例を以下に説明する。
【0056】
具体的には、処理システム10は、一般的には、図示されるようにバス24を介してお互いに結合された、プロセッサ20、メモリー21、グラフィックスタブレットおよび/またはキーボードのような入力装置22、および、ディスプレイのような出力装置23を少なくとも含む。また、データベースのような記憶装置11に処理システムを結合するために、符号25によって示されるように、外部インタフェースが、提供される。
【0057】
使用する際、処理システムは、予め定められた分類体系を用いて、手書きテキスト文字を受け取り、且つ、復号化するように構成される。また、最初は、分類体系は、ユーザ非依存型であっても、処理システム10は、その体系を変更するように構成されてもよく、それによって、分類体系をユーザ依存型にし、それによって、文字認識の精度を増大させる。
【0058】
このことから、典型的に、処理システム10は、メモリー21に記憶された適切なアプリケーションソフトウェアを実行することによってこれらの技術を実行するように構成されたコンピュータ、ラップトップ型コンピュータ、サーバー、専門ハードウェア等、どのような形態の処理システムであってもよいことがわかる。
【0059】
このことを達成するために、処理システム10は、それぞれの字体様式を識別するための異綴り体を利用した分類体系を実現する。そして、処理システムは、特定の筆者によって使用される字体異綴り体の適応学習を使用する。
【0060】
字体異綴り体は、個々の文字クラスの書き方における様式的変種をモデル化する。すなわち、字体異綴り体は、文字が書かれる様々な様式を表現する。異綴り体は、静的なものとして定義されてもよく、文字の形状全体が一方の異綴り体を他方の異綴り体から区別することを意味する。字体「a」の静的な異綴り体の例が、図2に示される。
【0061】
また、異綴り体は、動的なものであってもよく、この場合、異綴り体は、同じように見えるかもしれないが、動的なストローク情報(すなわち、字体を構成するストロークの順序または方向)によって区別される。字体「a」の動的な異綴り体の例が、図3に示される。具体的には、この例において、2つの字体の基本的な形状は、類似しているが、バージョン1は、ただ1つのストロークによって書かれており、バージョン2は、2つのストロークによって書かれている。異綴り体は、動的な意味および静的な意味の両方を有してもよいので、異綴り体に基づいた適応は、オンライン(すなわち、光学的文字認識)システムおよびオフラインシステムの両方でうまく動作することができる。
【0062】
筆者非依存型システムは、それが取り扱うであろう考えられるすべての異綴り体をモデル化しなければならない。しかしながら、ユーザは、文字を書く際、一般的には、それぞれの字体に対してただ1つの異綴り体を使用する。したがって、一般的には、特定のユーザは、毎回、同じような書体で与えられた字体を書く。
【0063】
その結果として、筆者非依存型システムは、特定のユーザに対する認識にはなくてもよい多数の異綴り体を含む。これらの余分な異綴り体は、筆者が実際に使用する異なるクラスの異綴り体に類似することがあるので、システムの認識精度を低下させることがある。
【0064】
この例が、図4に示される。具体的には、左側の異綴り体は、字体「a」を表現し、右側の異綴り体は、字体「d」を表現する。これらの2つの異綴り体間には、明らかに、多くの類似性があり、明らかに、誤って認識される可能性がある。
【0065】
ここに示される字体「a」の異綴り体は、手書きする際に、まれにしか使用されず、たいていの書き方の認識のためには必要とされない。しかしながら、わずかな数の筆者が、この書体を使用するので、筆者非依存型システムは、この異綴り体をサポートしなければならないが、この異綴り体を容認することによって、字体を誤って認識する可能性は、増大する。
【0066】
このように、一般的には、特定の個人は、そのような類似した書き方で字体「a」および「d」を書くことはなく、したがって、ユーザ依存型分類システムにおいては、図4に示される異綴り体の両方が必要とされる可能性はほとんどないことがわかる。
【0067】
したがって、処理システムは、筆者がどの異綴り体を使用するかを学習し、同じ字体に対する他の異綴り体は無視されるように構成され、それによって、それぞれの筆者に対する文字認識を改善する。その結果、これは、処理システムが様々な書き方をより高い認識精度でサポートできるようにする。
【0068】
したがって、使用中、処理システム10は、文字を受け取るように動作し、その文字を、データベースに記憶された字体および異綴り体と比較する。これによって、プロセッサは、その文字が対応する字体および異綴り体を決定することができる。
【0069】
これは、一般的には、その文字を、データベース11に記憶されたプロトタイプと比較することによって達成される。プロトタイプは、それぞれの異綴り体および字体にグループ化される。したがって、文字とプロトタイプとの間の類似性は、その文字に最もぴったりと一致するプロトタイプを選択するのに使用され、それによって、その文字をそれぞれの字体および異綴り体のグループに割り付けることができる。
【0070】
具体的には、通常、文字を特徴ベクトルの形で定義することによって達成される。この場合、特徴ベクトルは、字体の様々な特徴を表現する値を含む。プロトタイプは、プロトタイプベクトルとして記憶され、特徴空間において、特徴ベクトルとプロトタイプベクトルとの距離を測定することができ、それによって、最も類似するプロトタイプを決定することができる。
【0071】
そして、プロセッサは、選択された字体に対応する異綴り体を変更し、それによって、その異綴り体が、それぞれのユーザによって使用される異綴り体であることを指示する。これは、一般的には、それぞれの異綴り体に対応する重み付けを有することによって達成され、プロセッサは、異綴り体の重み付けを変更するように構成される。したがって、例えば、ユーザによって使用される異綴り体の重み付けは、増加/減少してもよく、それに応じて、他の異綴り体の重み付けが、増加/減少する。
【0072】
ここで、これらの技術について、より詳細に説明する。
【0073】
具体的には、以下の説明は、手書き文字異綴り体のための競合学習アルゴリズムに関するものである。この例においては、技術は、簡単なテンプレートマッチング識別器(具体的には、ユークリッド距離最近傍法識別器)の形で説明される。しかしながら、当業者は、クラスをサブクラスに分割し、且つ、それに続いて、それらのサブクラスに重み付けを行うのをサポートすることができるどのような種類の識別器にもこの処理を適用できることがわかるはずである。
【0074】
これに加えて、重み更新処理は、尺度に依存するものではなく、ただ単に、プロトタイプ類似性の何らかの数値的指示に頼るものである。したがって、この技術は、ユークリッド距離、動的時間伸縮法、などの距離尺度とともに使用されてもよい。
【0075】
最初の段階において、プロセッサ20は、考察の対象となる文字を表現する入力信号を受け取る。これは、通常、入力装置22から受け取られるが、データベースに記憶された文字から取り出されてもよい。いずれにしても、プロセッサ20は、入力信号を多次元特徴空間にマッピングすることによって、パターン分類を実行し、その入力信号は、ある種の正規化を実行するために、前処理されてもよい。したがって、プロセッサは、字体の高さ、幅、ストロークの数、最大ストローク長等のような字体のそれぞれの予め定められた特徴を定量化するために、値を割り付ける。マッピングが、特徴ベクトルを生成するために使用される。
【0076】
そして、プロセッサ20は、どのクラスが与えられた特徴を生成する可能性が最も高いかを決定するために、特徴ベクトルを一組のクラスモデルに適用する。
【0077】
テンプレートマッチング識別器は、クラスに含まれるプロトタイプ的なサンプル(プロトタイプ)を記憶することによってうまく動作し、入力特徴をプロトタイプと比較するための何らかの類似性尺度を使用することによって、分類を実行する。入力特徴ベクトルに最も類似するプロトタイプのクラスが、入力パターンのクラスであるとみなされる。例として、簡単なユークリッド距離最近傍法識別器は、ただ単に、一組の訓練サンプルの特徴ベクトルを記憶し、且つ、入力特徴ベクトルから最小ユークリッド距離を有する訓練パターン特徴ベクトルのクラスを示すラベルを入力パターンに付すだけである。
【0078】
筆者依存型異綴り体訓練がなされる場合、筆者非依存型識別器は、プロトタイプごとの異綴り体情報を含まなければならない。これは、それぞれの訓練サンプルが、クラスおよび異綴り体の両方を示すラベルを付されなければならないことを意味する。異綴り体を示すラベルを付すためには、多くの半自動処理が、存在する。例えば、ICDAR,387〜393頁.IEEE,August 1997におけるL.VuurpijlおよびL.Schomaker.“Finding Structure In Diversity:A Hierachical Clustering Method For the Categorization of Allographs In Handwriting,」は、個々の字体クラスに対する異綴り体の選択およびラベル付けを助ける統合的階層クラスタリング法を説明している。
【0079】
一般的に、分類体系の構造は、図5に示されるようなものである。したがって、一般的には、ただ1つの識別器が、多くの字体を含む。この点については、語句字体は、何らかの英数字、句読点、または、表意文字を含むことがわかる。それぞれの字体は、1つまたはそれ以上の異綴り体を含み、それぞれの異綴り体は、異なる字体様式を表現する。そして、それぞれの異綴り体は、1つまたはそれ以上のプロトタイプを含み、それぞれのプロトタイプは、それぞれの異綴り体における変種を表現する。したがって、例えば、プロトタイプは、サイズ、ずれ、角度等における変種を評価するのに使用される。
【0080】
したがって、同じクラスに含まれる多くのプロトタイプを同じ異綴り体であるとみなすことができ、異綴り体は、特定の字体に対する特定の書き方をモデル化するが、個々のプロトタイプは、その書き方の実体を表現する。例えば、最近傍法識別器においては、同じクラスを表現する多くのプロトタイプを有するのが一般的であり、プロトタイプ間の差異は、特徴の考えられるクラス内変種をモデル化する(例えば、平行移動、回転、ずれ、など)。同様に、同じ異綴り体に含まれる多くのプロトタイプは、その異綴り体を書くときの変種をモデル化してもよい。したがって、識別器は、多くの字体クラスをサポートし、クラスは、多くの異綴り体をサポートし、そして、異綴り体は、多くのプロトタイプをサポートしてもよい。
【0081】
この処理において、分類は、特徴空間におけるそれぞれのプロトタイプベクトルと入力特徴ベクトルとの距離を計算することによって実行される。この距離は、特徴ベクトルとプロトタイプベクトルとの類似性を表現し、したがって、文字とそれぞれのプロトタイプとの類似性を表現する。そして、プロセッサ20は、最小距離に基づいて、プロトタイプのクラスを入力データのラベルとして決定する。したがって、プロセッサ20は、特徴ベクトルから最小距離値だけ離れたプロトタイプベクトルを決定し、そして、これを、文字によって表現される字体を決定するのに使用する。
【0082】
筆者に固有の異綴り体を決定するのをサポートするために、プロトタイプごとの距離値が、それの異綴り体の種類に基づいた重み付け係数と乗算される。したがって、より大きな重み付けを有する異綴り体は、一致する可能性はあまり高くない。なぜなら、より大きな重み付けは、距離尺度を増加させるからであり、このように、重みを減少させることは、異綴り体が一致する確率を増加させ、重みを増加させることは、一致する確率を減少させる。
【0083】
まず最初に、すべての異綴り体に対する重みのすべてが、ゼロでない同一の値(例えば、1)に初期化され、筆者に固有の優先権が異綴り体に与えられないことを指示する。この時点において、分類体系は、非依存型である。
【0084】
重み付けに加えて、距離値が、以下のようにして、ユークリッド距離最近傍法識別器のために計算される。
【数1】
【数2】
ここで、
yiは、プロトタイプiの特徴ベクトルであり、
wiは、プロトタイプiの(共通の)異綴り体重みである。
Pi∈(Rd,Ω)
xは、x∈Rdであるような入力特徴ベクトルであり、
δ(X)は、δ(X):Rd→Ωであるような識別器決定関数であり、
Ωは、Ω={ω1,...,ωn}であるようなクラスであり、
{p1,...,pm}は、プロトタイプである。
【0085】
重み付けは、ユーザが使用する異綴り体をもたらすように決定される。したがって、プロセッサ20は、重み適応を実現し、異綴り体重みを変更し、筆者が使用する可能性がより高い異綴り体に優先権を与えるように動作する。
【0086】
したがって、入力信号に最もよく一致するプロトタイプを選択することは、筆者がそのプロトタイプの異綴り体を使用することを指示することである。したがって、簡単なアプローチにおいては、プロセッサ20は、選択されたマッチングプロトタイプに含まれる異綴り体の重みをわずかな量η(学習率)だけ減少させることによって、重み適応を実現する。同様に、プロセッサ20は、それぞれのクラスにおける残りの異綴り体の重みをわずかな量だけ増加させる。一致しないクラスにおける異綴り体重みは、変更されない。
【0087】
したがって、マッチングクラスにおけるそれぞれの異綴り体iに対して、
i=cであれば、
wi=wi−η
であり、i=cでなければ、
wi=wi+η
である。
ここで、
cは、マッチングプロトタイプの異綴り体番号であり、
ηは、学習率パラメータである。
【0088】
識別器は、正しいクラスといつも一致するとは限らないことがわかる。
【0089】
例として、汚く書かれた「a」は、字体「d」と一致するかもしれず、その結果として、筆者が使用しないであろう「d」の異綴り体重みを減少させる更新をもたらす。しかしながら、それに続いて、筆者によって使用された「d」異綴り体が正しく一致すれば、使用されない異綴り体重みを増加させ、且つ、正しい異綴り体重みを減少させる。
【0090】
このために、重み適応は、徐々に発生することになり、不正確な分類が大きすぎる重みを誤った異綴り体に与えることが回避される。しかしながら、学習率が、高くなればなるほど、より素早く適応がなされ、その結果として、より高い認識精度が、得られる。したがって、学習率の大きさの平衡状態を検出する必要がある。
【0091】
これは、ユーザによって調節可能な学習率の大きさを有することによって実施されてもよいことがわかる。したがって、学習率を調節できるようにするために、典型的にはデータベース11に記憶される学習パラメータηが、ユーザによって調節されてもよい。これによって、ユーザは、所望のレベルの学習率を設定することができ、そして、あまり多くの誤りが発生すれば、その学習率を低下させてもよい。
【0092】
また、重みが大きくなりすぎないことおよび小さくなりすぎないことを保証するのは望ましいことである。異綴り体重みが小さすぎる場合、その異綴り体(したがって、そのクラス)に対する決定境界は、それを取り巻くクラスに侵入し、識別器に誤ったクラスを決定させることがある。したがって、重み付けが大きすぎる程度にまで増加すれば、特徴ベクトルが、その異綴り体に含まれるプロトタイプの1つと一致する可能性はまったくない。この場合、これは、たとえそれらの異綴り体が時々使用される機会があったにしても、異綴り体全体がマッチング処理から除外されることをもたらすかもしれない。
【0093】
一般的には、したがって、上側しきい値および下側しきい値が、重み付けのために提供され、変更によって、重み付けが、上側しきい値または下側しきい値を超える場合、重み付けは、そのしきい値に維持される。この場合にも、もしそれが望ましいのであれば、ユーザがしきい値を調節できるように、対策が施されてもよい。
【0094】
重みが大きくなりすぎないことを保証することによって、ユーザが、後日、異綴り体の書き方を変更した場合、それらの異綴り体は、優先順位が高くなる。
【0095】
異綴り体重みを変更することの識別器決定領域への影響が、図6に示される。具体的には、この例において、クラス3に対する重みが減少するにつれて、これは、元々の決定境界5(実線)をクラス4の方へ押しやり、クラス4よりもクラス3と一致するより高い確率を与える新しい決定境界6(破線)を形成する。
【0096】
上述した簡単な重み適応処理は、いくつかの問題が発生することがある。
【0097】
具体的には、いくつかの異綴り体が、ほぼ同じように一致するかもしれず(すなわち、特徴ベクトルから2つの異なる異綴り体までの距離には極めて小さな差異しか存在しない)、それは、一方の異綴り体が他方の異綴り体よりも優先的に使用される有力な根拠が存在しないことを示す。それとは逆に、異綴り体スコア間には、大きな差異が存在するかもしれず、それは、一方の種類の異綴り体よりも他方の種類の異綴り体がはっきりと優先されることを示す。
【0098】
第1の状況においては、重み更新は、小さなものであるべきであり、それは、正しい異綴り体を識別する信頼性の無さをもたらす。それとは対照的に、第2の状況においては、使用されない異綴り体を素早く識別して優先順位を下げるのを保証するために、重み更新は、大きなものであるべきである。
【0099】
したがって、重み更新は、異綴り体グループの最小距離(すなわち、異綴り体ごとの最もよく一致するプロトタイプの距離)を比較し、これらの値に応じて、重みを更新するべきである。このようにして、異綴り体は、お互いに競合させられる。なぜなら、それぞれの異綴り体の距離成績は、残りの異綴り体になされる重み変更に影響を与えるからである。
【0100】
この種の重み更新を実施するために、プロセッサ20は、まず最初に、文字を含むクラスを決定する。これは、上述したように、文字に最もぴったりと類似しているプロトタイプをプロセッサ20に探索させることによって実行される。これが実行されてしまえば、プロセッサ20は、そのクラスにおける異綴り体グループごとの最小距離を決定するように動作する。これは、特徴ベクトルと、異綴り体グループごとの最も近いプロトタイプベクトルとの距離を決定することによって達成される。
【0101】
そして、プロセッサ20は、そのクラスにおける異綴り体ごとの最小距離の平均値を決定し、それぞれの重み付けを更新するのにこの平均値を使用する。具体的には、ある特定の異綴り体に対する重み付けの変更は、その異綴り体の最小距離と平均距離との差に基づくものである。極めて大きな距離が平均値を極めて大きく変化させないことを保証するために、すべての距離は、以下のように、指数形式に変換される。
【0102】
一致したクラス内における異綴り体iごとに、
【数3】
【数4】
【数5】
【数6】
ここで、ηは、学習率パラメータである。
【0103】
この処理を用いて、平均距離よりも小さい最小距離を備えた異綴り体は、より大きな値のEiを有し(なぜなら、e0=1、および、x→∞のときlim e−x→0であるからである)、平均値は、Eiよりも小さいので、異綴り体重みを消極的に更新することになる。Eiが、平均距離よりも大きくなればなるほど、重み更新は、より大きくなる。
【0104】
したがって、わずかしか一致しない異綴り体は、平均値と比較してEiがどのくらい小さいかに応じて積極的に重みを増加させることによって、更新される。更に、曖昧な結果(最小異綴り体距離にあまり差がない)は、すべての距離が平均値からかけ離れたところに存在しないので、極めて小さい重み更新をもたらす。
【0105】
上述した処理は、自動的なものであり、したがって、ユーザの介入を必要としない。具体的には、この処理は、誤った決定がなされた場合に文字の正しい識別を教えるためのユーザまたはその他のソースからのフィードバックが存在しないので、管理されたものではない。
【0106】
しかしながら、入力信号の分類に関する更なる情報(例えば、文脈的言語モデル)が、利用できるのであれば、重み適応プロセスにおける何らかの管理をサポートすることができる。この状況においては、重み更新は、すべての認識処理が完全に実行され、最終的な結果を、識別器の生の類似性尺度を変更または検査するのに使用できるようになるまで、延期されてもよい。
【0107】
例えば、重み更新は、識別器の決定が認識器によって生成された最終的な決定と一致する場合にしか実行されなくてもよい。したがって、識別器が、最も可能性の高い一致として、字体「d」を選択したが、その後の処理が、字体は実際には「a」であると結論を下せば、重み更新は、実行されない。
【0108】
あるいは、ほとんどの認識システムは、代替字体に対するある種の信頼水準を生成し、この確率は、重み更新処理に組み込まれてもよく、その結果、更新は、字体が正しく且つ曖昧さを伴うことなく識別される信頼水準に比例して発生する。
【0109】
更に、ユーザフィードバックが、提供されてもよく、それによって、プロセッサ20が、誤った字体を決定した場合、ユーザは、正しい字体を指示することができ、それによって、プロセッサ20は、異綴り体の重み付けをしかるべく調節することができる。
【0110】
したがって、上述したプロセスは、字体異綴り体の競合学習のための処理を提供する。この適応学習プロセスは、特定の筆者によって使用されない字体異綴り体の認識確率を最小限に抑制することによって、手書き文字認識システムの精度を改善することができる。いくつかの重み適応メカニズムが、説明される。
【0111】
上述したハードウェア構成においては、重み付けはデータベース11に記憶されることがわかる。したがって、重み付けをユーザ識別子に基づいて記憶することができる。これによって、様々なユーザに対応する様々な組の重み付けを記憶することができる。そして、これによって、多くの異なるユーザごとに手書き文字を分類するのに処理システム10を使用することができる。この場合、様々なユーザからの手書き文字が解析されるたびに、文字の識別において、また、それに続く、重み付けの変更においても、識別子が、適切な一組の重み付けを選択するのに使用される。
【0112】
そして、これは、ただ1つの中央処理システム10が、多くのユーザからの手書き文字を識別するのに使用されるのを可能にする。このただ1つの中央処理システム10は、ウェブサイトまたはそれに類似するものを介して様々なユーザから提供される手書き文字をその中央処理システム10に解析させるために、例えば、インターネットのようなネットワークを利用した環境において使用されてもよい。
【0113】
また、本発明は、本出願の明細書において個々にまたは集合的に言及または開示された2つかまたはそれ以上の部品、構成要素、および、特徴のいずれかまたはすべてを組み合わせてそれらの部品、構成要素、および、特徴から構成されるように、広い範囲で論じられてもよく、ここでは、特定の完全体について言及したが、それらの完全体は、本発明が属する分野において知られている同等のものを有し、そのような良く知られている同等のものは、個々に説明したように、本発明に含まれると考えられる。
【0114】
好ましい実施形態を詳細に説明したが、ここで、当業者は、上述され且つ特許請求の範囲において請求された本発明の範囲から逸脱することなく、様々な変更、置換、および、代替をなすことができることを理解すべきである。
【0115】
したがって、例えば、異綴り体の重み付けを変更する代わりに、本発明による方法は、ユーザによって使用されない異綴り体をただ単に除去することを包含してもよい。これは、単一事例解析に基づくものであってもよく、そのために、使用される異綴り体が決定されると、その他のすべての異綴り体は、クラスから除去される。あるいは、これは、重み付け変更と組み合わせられてもよく、それによって、異綴り体の重み付けが、予め定められた量よりも大きく変更されると、その異綴り体は、分類体系から除去される。
【図面の簡単な説明】
【0116】
【図1】本発明を実施するのに適した処理システムの例を示す図である。
【図2】字体「a」の2つの静的な異綴り体の例を示す図である。
【図3】字体「a」の2つの動的な異綴り体の例を示す図である。
【図4】字体「a」および字体「d」からなる2つの類似する異綴り体の例を示す図である。
【図5】分類システムの構造の例を示す概略ブロック図である。
【図6】識別器決定領域上において異綴り体の重みを変更する例を示す概略ブロック図である。
Claims (29)
- 手書き文字を分類するための分類体系を変更し、それによって、前記分類体系をユーザ依存型にする方法であり、前記分類体系が、いくつかの異綴り体を含み、それぞれの前記異綴り体が、それぞれの字体のそれぞれの様式を表現する、前記方法であって、
a)少なくとも1つの手書き文字を受け取り、
b)前記文字を表現する1つの異綴り体を選択し、
c)前記選択に基づいて1つまたはそれ以上の前記異綴り体を変更する、
ことを含む方法。 - 前記選択された異綴り体が前記ユーザによって使用されるそれぞれの前記字体の様式に対応することをもたらすように、前記異綴り体を変更することを含む、請求項1に記載の方法。
- 前記分類体系が、いくつかのクラスを含み、それぞれの前記クラスが、それぞれの前記字体を表現し、且つ、1つまたはそれ以上の前記異綴り体を含み、
当該方法が、
a)前記文字を表現するクラスを選択し、それによって、前記文字によって表現される前記字体を決定し、
b)それぞれの前記クラスにおける1つまたはそれ以上の前記異綴り体を変更する、
ことを含む、請求項1または請求項2に記載の方法。 - それぞれの前記異綴り体が、1つまたはそれ以上のプロトタイプを含み、それぞれの前記プロトタイプが、それぞれの前記異綴り体における変種を表現し、
当該方法が、
a)少なくともいくつかのプロトタイプに対して、前記文字とそれぞれの前記プロトタイプとの類似性に基づいて、選択値を決定し、
b)前記決定された選択値に基づいて、それぞれの前記プロトタイプの中から1つを選択する、
ことを含む、請求項1から請求項3のいずれか一項に記載の方法。 - 前記選択されたプロトタイプに基づいて、前記クラスを選択することを含む、請求項4に記載の方法。
- 前記選択されたプロトタイプに基づいて、前記異綴り体を選択することを含む、請求項4または請求項5に記載の方法。
- それぞれの前記プロトタイプが、プロトタイプベクトルとして表現され、それぞれの前記プロトタイプベクトルが、いくつかの値から構成され、それぞれの前記値が、それぞれの前記プロトタイプのそれぞれの特徴を定量化し、
前記選択値を決定する方法が、
a)前記文字を表現する特徴ベクトルを決定し、前記特徴ベクトルが、いくつかの値から構成され、それぞれの前記値が、前記文字のそれぞれの特徴を定量化し、
b)前記特徴ベクトルとそれぞれの前記プロトタイプベクトルとの距離を表現する距離値を決定する、
ことを含む、請求項4〜6のいずれか一項に記載の方法。 - それぞれの前記異綴り体が、対応する重み付けを含み、
当該方法が、
a)前記重み付けに基づいて、前記異綴り体を選択し、
b)1つまたはそれ以上の前記異綴り体の重み付けを変更することによって、前記異綴り体を変更する、
ことを含む、請求項1〜7のいずれか一項に記載の方法。 - 前記選択値が、前記決定された距離値と、それぞれの前記異綴り体に対応する前記重み付けとに基づいて決定される、請求項7または請求項8に記載の方法。
- 少なくとも前記選択されたプロトタイプを含む異綴り体の重み付けを変更することを含む、請求項8または請求項9に記載の方法。
- 最も小さな選択値を有するプロトタイプを選択することを含む、請求項8から請求項10のいずれか一項に記載の方法。
- 前記重み付けを変更する方法が、
a)前記選択されたプロトタイプを含む異綴り体に対する重み付けを減少させ、
b)前記選択されたプロトタイプを含まない1つまたはそれ以上の異綴り体に対する重み付けを増加させる、
ことの少なくとも1つを含む、請求項8〜11のいずれか一項に記載の方法。 - 前記異綴り体の重み付けを予め定められた量だけ増加および/または減少させることを含む、請求項12に記載の方法。
- 請求項7に記載の方法であり、
a)変更されるべき異綴り体ごとに基準プロトタイプを選択し、
b)前記基準プロトタイプごとに前記距離値を決定し、
c)前記決定された距離値の平均値を決定し、
d)それぞれの前記基準プロトタイプの前記距離値と平均距離値とに基づいて、それぞれの前記異綴り体の重み付けを変更する、
ことを含む、請求項12に記載の方法。 - 前記基準プロトタイプが、それぞれの前記異綴り体に対して最も小さな距離値を有するプロトタイプである、請求項14に記載の方法。
- 処理システムを用いて実行され、
前記処理システムが、
a)前記異綴り体を表現する異綴り体データを記憶する記憶装置と、
b)プロセッサと、を含み、
前記プロセッサが、
i)前記手書き文字を受け取り、
ii)前記異綴り体を選択し、
iii)1つまたはそれ以上の前記異綴り体を変更する、
ように構成された、請求項1〜14のいずれか一項に記載の方法。 - 手書き文字を分類するための分類体系を変更し、それによって、前記分類体系をユーザ依存型にするための装置であって、
a)いくつかの異綴り体を表現する異綴り体データを記憶するための記憶装置であって、それぞれの前記異綴り体が、それぞれの字体のそれぞれの様式を表現する、前記記憶装置と、
b)プロセッサと、を含み、
前記プロセッサが、
i)少なくとも1つの前記手書き文字を受け取り、
ii)前記文字を表現する異綴り体を選択し、
iii)前記選択に基づいて、前記異綴り体データを変更し、それによって、1つまたはそれ以上の前記異綴り体を変更する、
ように構成された装置。 - 前記異綴り体データが、それぞれの前記異綴り体に対応する重み付けを含み、前記プロセッサが、前記重み付けを変更することによって、前記異綴り体データを変更するように構成された、請求項17に記載の装置。
- 前記記憶装置が、クラスデータを記憶するように構成され、前記クラスデータが、いくつかのクラスを表現し、それぞれの前記クラスが、それぞれの字体を表現し、且つ、1つまたはそれ以上の前記異綴り体を含む、請求項17または請求項18に記載の装置。
- 前記記憶装置が、プロトタイプを表現するプロトタイプデータを記憶するように構成され、それぞれの前記異綴り体が、1つまたはそれ以上の前記プロトタイプを含み、それぞれの前記プロトタイプが、それぞれの前記異綴り体における変種を表現する、請求項17〜19のいずれか一項に記載の装置。
- 前記プロセッサが、請求項1〜16のいずれか一項に記載の方法を実行するように構成された、請求項17〜20のいずれか一項に記載の装置。
- ユーザ依存型分類体系を用いて手書き文字を分類する方法であり、前記分類体系が、いくつかの異綴り体を含み、それぞれの前記異綴り体が、それぞれの字体のそれぞれの様式を表現し、且つ、ユーザ依存性を表現するそれぞれの重み付けを有し、それぞれの前記異綴り体が、1つまたはそれ以上のプロトタイプを含み、それぞれの前記プロトタイプが、それぞれの前記異綴り体における変種を表現する、前記方法であって、
a)少なくとも1つの手書き文字を受け取り、
b)少なくともいくつかの前記プロトタイプに対して、前記文字とそれぞれの前記プロトタイプとの類似性と、それぞれの前記プロトタイプを含む前記異綴り体の重み付けとに基づいて、選択値を決定し、
c)前記決定された選択値に基づいて、それぞれの前記プロトタイプの中から1つを選択し、
d)前記選択されたプロトタイプに基づいて、前記文字を分類する、
ことを含む方法。 - それぞれの前記プロトタイプが、プロトタイプベクトルとして表現され、それぞれの前記プロトタイプベクトルが、いくつかの値から構成され、それぞれの前記値が、それぞれの前記プロトタイプのそれぞれの特徴を定量化し、
前記選択値を決定する方法が、
a)前記文字を表現する特徴ベクトルを決定し、前記特徴ベクトルが、いくつかの値から構成され、それぞれの前記値が、前記文字のそれぞれの特徴を定量化し、
b)前記特徴ベクトルとそれぞれの前記プロトタイプベクトルとの距離を表現する距離値を決定し、
c)前記決定された距離値と、それぞれの前記異綴り体に対応する重み付けとに基づいて、前記選択値を決定する、
ことを含む、請求項22に記載の方法。 - 前記分類体系が、いくつかのクラスを含み、それぞれの前記クラスが、それぞれの字体を表現し、且つ、1つまたはそれ以上の前記異綴り体を含み、
当該方法が、前記選択されたプロトタイプに基づいて、クラスを選択することを含み、それによって、前記文字によって表現される前記字体を決定する、請求項22または請求項23に記載の方法。 - 前記分類体系が、請求項1〜15のいずれか一項に記載の方法に基づいて変更される、請求項22〜24のいずれか一項に記載の方法。
- 処理システムを使用することを含み、
前記処理システムが、
a)i)前記異綴り体およびそれに対応する重み付けを表現する異綴り体データと、
ii)前記プロトタイプを表現するプロトタイプデータと、
を記憶するための記憶装置と、
b)プロセッサと、を含み、
前記プロセッサが、
i)前記手書き文字を受け取り、
ii)前記選択値を決定し、
iii)前記プロトタイプを選択し、
iv)前記文字を分類する、
ように構成された、請求項22〜25のいずれか一項に記載の方法。 - ユーザ依存型分類体系を用いて手書き文字を分類するための装置であって、
a)i)いくつかの異綴り体およびそれぞれの前記異綴り体に対応する重み付けを表現する異綴り体データであって、それぞれの前記異綴り体が、それぞれの字体のそれぞれの様式を表現し、前記重み付けが、前記異綴り体のユーザ依存性を表現する、前記異綴り体データと、
ii)1つまたはそれ以上のプロトタイプを表現するプロトタイプデータであって、それぞれの前記プロトタイプが、それぞれの前記異綴り体における変種を表現する、前記プロトタイプデータと、
を記憶するための記憶装置と、
b)プロセッサと、を含み、
前記プロセッサが、
i)少なくとも1つの手書き文字を受け取り、
ii)少なくともいくつかの前記プロトタイプに対して、前記文字とそれぞれの前記プロトタイプとの類似性と、それぞれの前記プロトタイプを含む前記異綴り体の重み付けとに基づいて、選択値を決定し、
iii)前記決定された選択値に基づいて、それぞれの前記プロトタイプの中から1つを選択し、
iv)前記選択されたプロトタイプに基づいて、前記文字を分類する、
ように構成された装置。 - 前記記憶装置が、いくつかのクラスを表現するクラスデータを記憶するように構成され、それぞれの前記クラスが、それぞれの字体を表現し、且つ、1つまたはそれ以上の前記異綴り体を含む、請求項27に記載の装置。
- 前記プロセッサが、請求項22〜26のいずれか一項に記載された方法を実行するように構成された、請求項27または請求項28に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AUPR8244A AUPR824401A0 (en) | 2001-10-15 | 2001-10-15 | Methods and systems (npw002) |
PCT/AU2002/001394 WO2003034317A1 (en) | 2001-10-15 | 2002-10-15 | Character identification |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005505866A true JP2005505866A (ja) | 2005-02-24 |
Family
ID=3832069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003536972A Revoked JP2005505866A (ja) | 2001-10-15 | 2002-10-15 | 文字認識 |
Country Status (12)
Country | Link |
---|---|
US (5) | US7469062B2 (ja) |
EP (1) | EP1444640B1 (ja) |
JP (1) | JP2005505866A (ja) |
KR (1) | KR100716594B1 (ja) |
CN (1) | CN100492392C (ja) |
AT (1) | ATE364208T1 (ja) |
AU (1) | AUPR824401A0 (ja) |
CA (1) | CA2463098C (ja) |
DE (1) | DE60220537T2 (ja) |
IL (2) | IL161382A0 (ja) |
WO (1) | WO2003034317A1 (ja) |
ZA (1) | ZA200402929B (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPR824401A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw002) |
US7519221B1 (en) * | 2005-02-28 | 2009-04-14 | Adobe Systems Incorporated | Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts |
US7428516B2 (en) * | 2005-06-23 | 2008-09-23 | Microsoft Corporation | Handwriting recognition using neural networks |
US7715629B2 (en) * | 2005-08-29 | 2010-05-11 | Microsoft Corporation | Style aware use of writing input |
US7646913B2 (en) * | 2005-12-19 | 2010-01-12 | Microsoft Corporation | Allograph based writer adaptation for handwritten character recognition |
US7702182B2 (en) * | 2006-02-16 | 2010-04-20 | Adobe Systems, Incorporated | Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images |
US7886266B2 (en) * | 2006-04-06 | 2011-02-08 | Microsoft Corporation | Robust personalization through biased regularization |
US7646921B2 (en) * | 2006-09-11 | 2010-01-12 | Google Inc. | High resolution replication of document based on shape clustering |
US7697758B2 (en) * | 2006-09-11 | 2010-04-13 | Google Inc. | Shape clustering and cluster-level manual identification in post optical character recognition processing |
US8175394B2 (en) * | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
KR101457456B1 (ko) * | 2008-01-28 | 2014-11-04 | 삼성전자 주식회사 | 개인 폰트 생성 장치 및 방법 |
ATE489686T1 (de) * | 2008-05-27 | 2010-12-15 | Eberhard Falk | Verfahren und vorrichtung zur musterverarbeitung |
US9361367B2 (en) | 2008-07-30 | 2016-06-07 | Nec Corporation | Data classifier system, data classifier method and data classifier program |
JP5500070B2 (ja) * | 2008-07-30 | 2014-05-21 | 日本電気株式会社 | データ分類システム、データ分類方法、及びデータ分類プログラム |
JP5385752B2 (ja) * | 2009-10-20 | 2014-01-08 | キヤノン株式会社 | 画像認識装置、その処理方法及びプログラム |
US8739276B2 (en) * | 2010-06-22 | 2014-05-27 | Microsoft Corporation | Automatic construction of human interaction proof engines |
CN103577820B (zh) * | 2012-07-31 | 2017-08-25 | 乐金信世股份有限公司 | 字符识别方法、字符识别装置及金融设备 |
JP2014127188A (ja) * | 2012-12-27 | 2014-07-07 | Toshiba Corp | 整形装置及び方法 |
US9715623B2 (en) * | 2015-06-10 | 2017-07-25 | Lenovo (Singapore) Pte. Ltd. | Reduced document stroke storage |
CN107239786B (zh) | 2016-03-29 | 2022-01-11 | 阿里巴巴集团控股有限公司 | 一种字符识别方法和装置 |
US10514841B2 (en) * | 2018-04-30 | 2019-12-24 | Microsoft Technology Licensing, Llc | Multi-layered ink object |
CN109241750B (zh) * | 2018-07-20 | 2023-04-07 | 海南大学 | 个性化英文字母展示风格变换方法 |
WO2022104606A1 (zh) * | 2020-11-18 | 2022-05-27 | 京东方科技集团股份有限公司 | 终端的交互方法、电子白板及计算机非瞬态可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0935006A (ja) * | 1995-07-18 | 1997-02-07 | Fujitsu Ltd | 文字認識装置 |
US5917924A (en) * | 1996-01-31 | 1999-06-29 | Neopost Limited | Postage metering system |
JPH11219433A (ja) * | 1998-01-30 | 1999-08-10 | Nec Corp | 認識辞書の学習方法及びその装置 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4068298A (en) * | 1975-12-03 | 1978-01-10 | Systems Development Corporation | Information storage and retrieval system |
US4491960A (en) * | 1982-04-05 | 1985-01-01 | The United States Of America As Represented By The Secretary Of The Navy | Handprinted symbol recognition system |
JPS6282486A (ja) * | 1985-10-08 | 1987-04-15 | Hitachi Ltd | オンライン手書き図形認識装置 |
US4864618A (en) | 1986-11-26 | 1989-09-05 | Wright Technologies, L.P. | Automated transaction system with modular printhead having print authentication feature |
US5051736A (en) | 1989-06-28 | 1991-09-24 | International Business Machines Corporation | Optical stylus and passive digitizing tablet data input system |
US5005205A (en) * | 1990-01-12 | 1991-04-02 | International Business Machines Corporation | Handwriting recognition employing pairwise discriminant measures |
US5852434A (en) * | 1992-04-03 | 1998-12-22 | Sekendur; Oral F. | Absolute optical position determination |
US5477012A (en) | 1992-04-03 | 1995-12-19 | Sekendur; Oral F. | Optical position determination |
US5319721A (en) | 1992-04-14 | 1994-06-07 | International Business Machines Corporation | Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set |
JPH05319721A (ja) * | 1992-05-19 | 1993-12-03 | Hitachi Ltd | エレベータの運転方式 |
US6081766A (en) * | 1993-05-21 | 2000-06-27 | Axys Pharmaceuticals, Inc. | Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
DE69425412T2 (de) | 1993-11-23 | 2001-03-08 | Ibm | Anlage und Verfahren zur automatischen Handschrifterkennung mittels eines benutzerunabhängigen chirographischen Labelalphabets |
EP0691623B1 (en) * | 1994-07-04 | 2001-10-04 | Hewlett-Packard Company, A Delaware Corporation | Scribble matching |
US5652412A (en) | 1994-07-11 | 1997-07-29 | Sia Technology Corp. | Pen and paper information recording system |
US5799267A (en) * | 1994-07-22 | 1998-08-25 | Siegel; Steven H. | Phonic engine |
US5675665A (en) * | 1994-09-30 | 1997-10-07 | Apple Computer, Inc. | System and method for word recognition using size and placement models |
US5661506A (en) | 1994-11-10 | 1997-08-26 | Sia Technology Corporation | Pen and paper information recording system using an imaging pen |
US6236740B1 (en) * | 1995-04-07 | 2001-05-22 | Michael E. Lee | Signature verification apparatus and method utilizing relative angle measurements |
US6081261A (en) | 1995-11-01 | 2000-06-27 | Ricoh Corporation | Manual entry interactive paper and electronic document handling and processing system |
JPH09223195A (ja) * | 1996-02-06 | 1997-08-26 | Hewlett Packard Co <Hp> | 文字認識方法 |
US5692073A (en) | 1996-05-03 | 1997-11-25 | Xerox Corporation | Formless forms and paper web using a reference-based mark extraction technique |
US6556712B1 (en) * | 1996-05-23 | 2003-04-29 | Apple Computer, Inc. | Methods and apparatus for handwriting recognition |
US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
US6518950B1 (en) | 1997-10-07 | 2003-02-11 | Interval Research Corporation | Methods and systems for providing human/computer interfaces |
WO1999050787A1 (en) | 1998-04-01 | 1999-10-07 | Xerox Corporation | Cross-network functions via linked hardcopy and electronic documents |
US6256410B1 (en) * | 1998-07-30 | 2001-07-03 | International Business Machines Corp. | Methods and apparatus for customizing handwriting models to individual writers |
US6964374B1 (en) | 1998-10-02 | 2005-11-15 | Lucent Technologies Inc. | Retrieval and manipulation of electronically stored information via pointers embedded in the associated printed material |
US6852434B2 (en) * | 1999-12-23 | 2005-02-08 | Ballard Power Systems Inc. | Fuel cell assembly with an improved gas sensor |
AUPR824401A0 (en) * | 2001-10-15 | 2001-11-08 | Silverbrook Research Pty. Ltd. | Methods and systems (npw002) |
DE60311904D1 (de) * | 2002-03-15 | 2007-04-05 | Computer Sciences Corp | Verfahren und Vorrichtungen zur Analyse von Schrift in Dokumenten |
AU2004271639B2 (en) * | 2003-09-05 | 2010-09-23 | Gannon Technologies Group | Systems and methods for biometric identification using handwriting recognition |
US7646913B2 (en) * | 2005-12-19 | 2010-01-12 | Microsoft Corporation | Allograph based writer adaptation for handwritten character recognition |
JP5491758B2 (ja) * | 2009-03-31 | 2014-05-14 | 日本バルカー工業株式会社 | 充填材入りフッ素樹脂シート、その製造方法およびガスケット |
-
2001
- 2001-10-15 AU AUPR8244A patent/AUPR824401A0/en not_active Abandoned
-
2002
- 2002-10-15 US US10/492,152 patent/US7469062B2/en not_active Expired - Fee Related
- 2002-10-15 IL IL16138202A patent/IL161382A0/xx unknown
- 2002-10-15 DE DE60220537T patent/DE60220537T2/de not_active Expired - Lifetime
- 2002-10-15 CA CA002463098A patent/CA2463098C/en not_active Expired - Fee Related
- 2002-10-15 AT AT02801226T patent/ATE364208T1/de not_active IP Right Cessation
- 2002-10-15 JP JP2003536972A patent/JP2005505866A/ja not_active Revoked
- 2002-10-15 WO PCT/AU2002/001394 patent/WO2003034317A1/en active IP Right Grant
- 2002-10-15 EP EP02801226A patent/EP1444640B1/en not_active Expired - Lifetime
- 2002-10-15 KR KR1020047005554A patent/KR100716594B1/ko not_active IP Right Cessation
- 2002-10-15 CN CNB028204735A patent/CN100492392C/zh not_active Expired - Fee Related
-
2004
- 2004-04-14 IL IL161382A patent/IL161382A/en not_active IP Right Cessation
- 2004-04-19 ZA ZA200402929A patent/ZA200402929B/xx unknown
-
2008
- 2008-11-26 US US12/324,646 patent/US7760947B2/en not_active Expired - Fee Related
-
2010
- 2010-07-12 US US12/834,892 patent/US7903879B2/en not_active Expired - Fee Related
-
2011
- 2011-01-12 US US13/005,524 patent/US8019160B2/en not_active Expired - Fee Related
- 2011-08-21 US US13/214,222 patent/US8363948B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0935006A (ja) * | 1995-07-18 | 1997-02-07 | Fujitsu Ltd | 文字認識装置 |
US5917924A (en) * | 1996-01-31 | 1999-06-29 | Neopost Limited | Postage metering system |
JPH11219433A (ja) * | 1998-01-30 | 1999-08-10 | Nec Corp | 認識辞書の学習方法及びその装置 |
Non-Patent Citations (4)
Title |
---|
LIONEL PREVOST AND MAURICE MILGRAM: "Non-supervised Determination of Allograph Sub-classes for On-line Omni-scriptor Handwriting Recognit", FIFTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, JPN4007015181, 20 September 1999 (1999-09-20), ISSN: 0000880473 * |
LIONEL PREVOST AND MAURICE MILGRAM: "Non-supervised Determination of Allograph Sub-classes for On-line Omni-scriptor Handwriting Recognit", FIFTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, JPN6007012509, 20 September 1999 (1999-09-20), ISSN: 0000942037 * |
LIONEL PREVOST AND MAURICE MILGRAM: "Non-supervised Determination of Allograph Sub-classes for On-line Omni-scriptor Handwriting Recognit", FIFTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, JPN6008002846, 20 September 1999 (1999-09-20), ISSN: 0000968142 * |
LOUIS VUURPIJL AND LAMBERT SCHOMAKER: "Finding structure in diversity: A hierarchical clustering method for the categorization of allograph", FOURTH INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION, JPN4007015447, 18 August 1997 (1997-08-18), ISSN: 0000880474 * |
Also Published As
Publication number | Publication date |
---|---|
CA2463098A1 (en) | 2003-04-24 |
US20100278429A1 (en) | 2010-11-04 |
US20050018906A1 (en) | 2005-01-27 |
IL161382A (en) | 2009-09-01 |
CN1571977A (zh) | 2005-01-26 |
KR100716594B1 (ko) | 2007-05-09 |
US20090074295A1 (en) | 2009-03-19 |
EP1444640B1 (en) | 2007-06-06 |
DE60220537D1 (de) | 2007-07-19 |
IL161382A0 (en) | 2004-09-27 |
CA2463098C (en) | 2009-06-23 |
US8363948B2 (en) | 2013-01-29 |
US7903879B2 (en) | 2011-03-08 |
KR20050036862A (ko) | 2005-04-20 |
US8019160B2 (en) | 2011-09-13 |
DE60220537T2 (de) | 2008-02-07 |
US7469062B2 (en) | 2008-12-23 |
AUPR824401A0 (en) | 2001-11-08 |
US20110110593A1 (en) | 2011-05-12 |
EP1444640A4 (en) | 2006-01-18 |
CN100492392C (zh) | 2009-05-27 |
US7760947B2 (en) | 2010-07-20 |
US20110299780A1 (en) | 2011-12-08 |
WO2003034317A1 (en) | 2003-04-24 |
EP1444640A1 (en) | 2004-08-11 |
ATE364208T1 (de) | 2007-06-15 |
ZA200402929B (en) | 2005-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8019160B2 (en) | Method of modifying classification scheme for hand-written characters | |
CN107085585B (zh) | 用于图像搜索的准确的标签相关性预测 | |
Bag et al. | A survey on optical character recognition for Bangla and Devanagari scripts | |
US20170124435A1 (en) | Method for Text Recognition and Computer Program Product | |
EP2214123A2 (en) | Model-based comparative measure for vector sequences and word spotting using same | |
JP2007042097A (ja) | キー文字抽出プログラム、キー文字抽出装置、キー文字抽出方法、一括地名認識プログラム、一括地名認識装置および一括地名認識方法 | |
Mor et al. | Confidence prediction for lexicon-free OCR | |
Inkeaw et al. | Recognition-based character segmentation for multi-level writing style | |
Romero et al. | Modern vs diplomatic transcripts for historical handwritten text recognition | |
Pechwitz et al. | Handwritten Arabic word recognition using the IFN/ENIT-database | |
JPH11328317A (ja) | 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体 | |
Huang et al. | Keyword spotting in unconstrained handwritten Chinese documents using contextual word model | |
Kessentini et al. | Word spotting and regular expression detection in handwritten documents | |
Kumar et al. | Bayesian background models for keyword spotting in handwritten documents | |
Mandal et al. | An improved discriminative region selection methodology for online handwriting recognition | |
Mouchère et al. | Writer style adaptation in online handwriting recognizers by a fuzzy mechanism approach: The adapt method | |
AU2002333065B2 (en) | Character identification | |
ZA200507735B (en) | Method of transforming writer-independent character classification scheme into writer-dependent character classification scheme | |
AU2002333065A1 (en) | Character identification | |
ZA200606088B (en) | A method for classifying a hand-written character | |
Nguyen et al. | On the problem of classifying vietnamese online handwritten characters | |
Al-Khayat | Learning-based Arabic word spotting using a hierarchical classifier | |
JPH0954814A (ja) | 入力記号表現の分析及び入力記号表現の可能解釈のスコアリングシステム | |
Gurav et al. | ResPho (SC) Net: A Zero-Shot Learning Framework for Norwegian Handwritten Word Image Recognition | |
JP4326173B2 (ja) | 文字認識装置、文字認識方法、その実行プログラムおよびそれを記憶した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071211 |
|
AA91 | Notification that invitation to amend document was cancelled |
Free format text: JAPANESE INTERMEDIATE CODE: A971091 Effective date: 20080108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080129 |