JP3930174B2 - 文字認識方法および文字認識装置 - Google Patents

文字認識方法および文字認識装置 Download PDF

Info

Publication number
JP3930174B2
JP3930174B2 JP35840998A JP35840998A JP3930174B2 JP 3930174 B2 JP3930174 B2 JP 3930174B2 JP 35840998 A JP35840998 A JP 35840998A JP 35840998 A JP35840998 A JP 35840998A JP 3930174 B2 JP3930174 B2 JP 3930174B2
Authority
JP
Japan
Prior art keywords
learning data
character recognition
feature vector
character
euclidean distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP35840998A
Other languages
English (en)
Other versions
JP2000172784A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP35840998A priority Critical patent/JP3930174B2/ja
Publication of JP2000172784A publication Critical patent/JP2000172784A/ja
Application granted granted Critical
Publication of JP3930174B2 publication Critical patent/JP3930174B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識方法および文字認識装置に関し、より詳しくは、手書き文字をパターンマッチングやベクトル間の相違度算出などによって文字認識を行う文字認識方法および文字認識装置に関する。
【0002】
【従来の技術】
従来より、手書き漢字や平仮名などの文字を光学的に読み取って、文字の判別を行う文字認識方法が用いられている。例えば、統計的手法を用いて手書き文字認識の正読率を向上させるため、各字種の分布の分離性が良い特徴量を用いて、最適(ベイズ)識別関数になるべく近い識別関数が用いられることがある。
【0003】
このような文字認識方法としては、特公平2−59507号公報になど開示されたものがある。これは、電子情報通信学会論文誌 D−II Vol.j79−D−II No.1 p45−52 1996年1月の「改良型マハラノビス距離を用いた高精度な手書き文字認識」に記載されているシティブロック距離やユークリッド距離などの距離尺度を用いて相違度計算を行うと、学習データのバラツキを考慮に入れることができないことから生じる誤認識を防止するために考案された方法である。すなわち、学習データからそのバラツキの方向を表わす固有値/固有ベクトルを用いて、学習データのバラツキの大きい方向では値が小さくなるように相違度を算出することにより、入力された文字画像から抽出された特徴ベクトルがどのカテゴリ(文字)に属するのかを精度良く判断するものであった。
【0004】
しかし、このような固有値/固有ベクトルを用いた文字認識方法は、その計算量が多くなるため、計算量の少ない相違度算出方式において、計算量の多くならない範囲で固有値/固有ベクトルを用いて相違度を補正する方法などが提案されている。その一例としては、電子情報通信学会論文誌 D−II Vol.j76−D−II No.12 pp.2495−2503 1993年12月の「手書き文字認識における特徴量の次元数と変数変換に関する考察」に示されていて、その論文誌の2496頁において擬似ベイズ識別関数が次式(1)のように表わされる。
【0005】
【数1】
Figure 0003930174
【0006】
この(1)式は、ユークリッド距離(‖X−M‖2 )に対して固有値/固有ベクトルを用いて補正を加えた形式となっている。
【0007】
【発明が解決しようとする課題】
しかしながら、このような従来の文字認識方法にあっては、学習データから固有値/固有ベクトルを算出する際に、文字認識に用いる特徴ベクトルの次元数に対して十分な量の学習データを必要とするが、文字認識システムを構築する状況によっては、必ずしも十分な量の学習データが確保できるとは限らない。特に、文字認識システムを市場にリリースした後に、認識できない文字をユーザが登録する場合などでは、多くの誤認識データを学習データとして収集することが困難なことが多く、そのような場合には適切な固有値/固有ベクトルを求めることができなくなるという問題点があった。
【0008】
本発明は上記に鑑みてなされたものであって、文字認識に用いる特徴ベクトルの次元数に対して十分な量の学習データが無い場合であっても、適切な文字認識を行うことができる文字認識方法および文字認識装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するために、請求項1に記載の発明は、入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識方法であって、前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出するステップと、一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、入力画像から抽出された前記特徴ベクトルの大きさに応じて前記ユークリッド距離を補正するステップと、補正された前記ユークリッド距離を用いて文字認識を行うステップと、を実行することを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、入力画像から抽出された特徴ベクトルの大きさに応じて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0010】
また、請求項2に記載の発明は、入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識方法であって、前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出するステップと、一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルを用いて前記ユークリッド距離を補正するステップと、補正された前記ユークリッド距離を用いて文字認識を行うステップと、を実行することを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルを用いて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0011】
また、請求項3に記載の発明は、請求項2に記載の文字認識方法において、前記ユークリッド距離を補正するステップは、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合に、前記他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルの平均値を用いて前記ユークリッド距離を補正することを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルの平均値を用いて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0012】
上記の目的を達成するために、請求項4に記載の発明は、入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識装置であって、前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出する手段と、一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、入力画像から抽出された前記特徴ベクトルの大きさに応じて前記ユークリッド距離を補正する手段と、補正された前記ユークリッド距離を用いて文字認識を行う手段と、を備えたことを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、入力画像から抽出された特徴ベクトルの大きさに応じて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0013】
また、請求項5に記載の発明は、入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識装置であって、前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出する手段と、一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルを用いて前記ユークリッド距離を補正する手段と、補正された前記ユークリッド距離を用いて文字認識を行う文字認識手段と、を備えたことを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルを用いて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0014】
また、請求項6に記載の発明は、請求項5に記載の文字認識装置において、前記ユークリッド距離を補正する手段は、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合に、前記他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルの平均値を用いて前記ユークリッド距離を補正することを特徴とする。
これによれば、算出されたユークリッド距離を補正する際に、一の文字コードに対して用いられた学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルの平均値を用いて補正するようにしたため、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0019】
【発明の実施の形態】
以下、本発明の文字認識方法および文字認識装置に係る実施の形態について、添付図面を参照して詳細に説明する。
【0020】
まず、本発明の文字認識方法を実行するための装置構成について説明する。
【0021】
図1は、本発明で用いる文字認識システムの一構成例を示した図である。図1に示されるように、サーバー側には、文字認識用辞書(以下、パターン辞書ともいう)10があって、この文字認識用辞書10がネットワーク12を介してクライアント側に保持された文字認識エンジン14と接続されている。この文字認識エンジン14は、文字切り出し部、文字画像比較部、文字認識を行う手段としての文字認識部、類似文字処理部、言語処理部、パス選択部、ユークリッド距離を算出する手段およびユークリッド距離を補正する手段としての確信度算出部、キャッシュ処理部などにより構成されている。
【0022】
このような文字認識システムを用いれば、サーバー側にある最新の文字認識用辞書10を使って文字認識処理を行うことができるので、クライアント側の文字認識エンジン14をコンパクト化することができる。
【0023】
また、図2は、本発明で用いる文字認識システムの他の構成例を示した図である。図2に示されるように、この文字認識システムは、比較的容量の大きい文字認識用辞書18をクライアント側に保持し、サーバー側に設けられた最新の文字認識プログラム16を利用することによって、ネットワーク12の負荷の少ない状態で文字認識処理を行うことができる。
【0024】
このように、ネットワーク12を介してサーバー側に文字認識プログラム16や文字認識用辞書10を接続することにより、クライアント側の文字認識用辞書18や文字認識エンジン14は、常に最新の文字認識プログラムやパターン辞書を用いて文字認識処理を行うことができる。
【0025】
次に、上記した文字認識システムにおける文字認識用辞書(パターン辞書)の作成方法について説明する。
【0026】
図3は、作成されたパターン辞書の一例を示す図である。このパターン辞書の作成にあたっては、各辞書レコード20、21、・・・、2n-1、2nにおける文字コード(例えば、「あ」、「い」、・・・、「亜」、「阿」など)毎に複数の文字画像が学習データとして用いられている。ここでは、各文字コードの学習データから抽出された特徴ベクトル30、31、・・・、3n-1、3nの平均値をその文字コードの特徴ベクトルとして文字コードと共に保持するようにしている。
【0027】
また、上記した学習データ数がNmin 以上の文字コードについては、固有値と固有ベクトル(固有値/固有ベクトル40、41)をそれぞれD個算出し、辞書中に保持している。この学習データ数Nmin については、特徴ベクトルの次元数等を考慮して適宜定めるものとする。
【0028】
また、固有値と固有ベクトルの数Dについては、要求される認識精度と処理速度とを考慮して適宜定めるものとする。一般的に高い認識精度が要求される場合には、Dを多めに設定し、高度な処理が要求される場合には、Dを少なめに設定するようにする。そして、図3では、Dを3とした場合のパターン辞書例を示したものである。
【0029】
次に、相違度の算出方法について説明する。
【0030】
本実施の形態における相違度の計算には、固有値/固有ベクトルを持たない特徴ベクトルとの相違度算出関数、および固有値/固有ベクトルを持つ特徴ベクトルとの相違度算出関数の2つの相違度算出関数を用いるものとする。
【0031】
上記した固有値/固有ベクトルを持たない特徴ベクトルとの相違度算出関数としては、次式(2)に示したユークリッド距離De を用いるものとする。
【0032】
【数2】
Figure 0003930174
【0033】
また、上記した固有値/固有ベクトルを持つ特徴ベクトルとの相違度算出関数としては、説明を簡単にするために、擬似ベイズ識別関数をさらに簡略化した次式(3)を用いるものとする。
【0034】
【数3】
Figure 0003930174
【0035】
これは、特開昭63−16394号公報等に示された多層方向コードヒストグラムを特徴ベクトルとして用いた実験において、電子情報通信学会論文誌 D−II Vol.j76−D−II No.12 pp.2495−2503 1993年12月の「手書き文字認識における特徴量の次元数と変数変換に関する考察」の2496頁に示された上記(1)式の修正2次識別関数では、上記(3)式に所定項が加算されたものであるが、この項の値は相対的に十分小さく、無視することができるため、上記(3)式を用いるようにしたものである。
【0036】
そこで、上記(2)式と(3)式とを比較すると、(3)式では(2)式で算出されたユークリッド距離に対して、固有値/固有ベクトルを用いた距離の補正を行っていることがわかる。この補正項Mmは、次式(4)のように表わすことができる。
【0037】
【数4】
Figure 0003930174
【0038】
次に、本発明の特徴部分である相違度の補正処理のそれぞれの態様について、実施の形態1および2に分けて説明する。
【0039】
(実施の形態1)
本実施の形態1では、固有値/固有ベクトルを用いずに補正処理を行う際に、特徴ベクトルの大きさに応じて補正の大きさを制御して、相違度を正規化する方法について説明する。
【0040】
一般的に、特徴ベクトルの大きさが大きいほど、相違度が補正される大きさも大きくなる。そこで、予めパターン辞書作成時に作成されたパターン辞書の特徴ベクトルの大きさと、これに対応する同じ文字コードの学習データの間で上式(4)を使って算出される補正項の大きさとの間で相関関係を求めておく。
【0041】
本実施の形態1では、その一例として、最小自乗法を用いて回帰直線を算出することにより、特徴ベクトルの大きさ(‖X‖)と補正項(Mr )との関係を図4に示すように求めている。なお、本発明は、これに限定されるものではなく、直線以外の式に近似させても良いし、また、数式ではなく、特徴ベクトルの大きさと補正項との関係をテーブル化しても勿論良い。
【0042】
上記した回帰直線の方程式は、次式(5)のように表わされる。
【0043】
【数5】
Figure 0003930174
【0044】
文字認識を行う際には、パターン辞書中の各特徴ベクトル(M)と、入力画像から抽出された特徴ベクトル(X)との間の相違度を算出する。その際、パターン辞書中に固有値/固有ベクトルを持つ辞書レコードとの相違度算出には前述した式(3)が用いられる。
【0045】
ここで、パターン辞書中に固有値/固有ベクトルを持たない辞書レコードとの相違度算出には、次式(6)が用いられる。
【0046】
【数6】
Figure 0003930174
【0047】
最終的な文字認識結果を出力する際には、それぞれの計算式で算出された相違度の小さい順にソートを行い、相違度の小さいものから順に認識結果として出力する。
【0048】
このように、本実施の形態1では、特徴ベクトルの大きさに応じて補正の大きを制御して相違度を正規化したため、固有値/固有ベクトルを持つ辞書レコードから算出された(3)式の相違度と、固有値/固有ベクトルを持たない辞書レコードから算出された(6)式の相違度とが同等に扱えるようになり、適切な文字認識結果を出力することができる。
【0049】
本実施の形態1における処理結果の一例を示したのが図5である。(回帰直線の方程式のα=0.05,β=0の場合)
【0050】
(実施の形態2)
本実施の形態2では、全ての辞書レコードに対して前述した式(2)を用いて相違度を算出し、相違度の小さい順に一定数の上位候補を抽出するようにしたものである。なお、ここでは、上位7候補について抽出するようにしたが、勿論この候補数は7候補に限られるものではなく、要求される処理速度や認識精度に応じて適宜定めれば良い。
【0051】
次に、上位7候補のうち固有値/固有ベクトルを持つ辞書レコードについては、前述した(4)式を用いて補正項Mmを求める。ここまでの処理結果を示したのが図6である。
【0052】
そして、図6の処理結果に対して、補正項が算出された結果についてのみ(3)式に基づいた補正を施すと図7のようになる。これにより、補正の行われた認識結果の相違度が小さくなって、上位の認識結果として出力されるようになったことがわかる。
【0053】
ここで、補正項の有無は、学習データの数に依存することになるため、補正項のある認識結果のみを優先して出力することは必ずしも得策とはならない。つまり、学習データの少ない文字は、認識結果として出力されなくなる。その典型的な例としては、ユーザが認識しない文字を文字認識用のパターン辞書に登録する際に、学習用の文字画像を多数用意できない場合、ユーザが認識させたい文字画像を登録したにも関わらず、その登録した文字は認識結果として出現し難くなることなどがあげられる。
【0054】
このため、本実施の形態2では、補正項の算出されない認識結果について、補正項の算出された認識結果の補正項の平均値を用いて補正を行うようにする。すなわち、図6の場合、補正項は第3、第4、第6、第7候補について算出されており、その平均値は6である。そこで、補正項が算出されていない第1、第2、第5候補については、補正項を上記した平均値の6と看做して相違度を補正するようにし、その得られた結果をソートして最終確認結果として出力する。この場合の最終認識結果を示したのが図8である。
【0055】
このように、本実施の形態2によれば、学習データ数が所定数未満と少ない文字については補正項が無く、文字認識結果として出現し難くなるのを防ぐため、学習データ数が所定数以上有る文字の補正項を参照して補正の大きさを定めるようにしたので、学習データ数に関わらず相違度を正規化することが可能となり、適切な文字認識結果を出力することができる。
【0056】
特に、ここでは補正項の有る文字を参照するにあたって、補正項の平均値を算出し、この平均値を用いて補正項の無い文字の相違度を補正するようにしたため、相違度が正規化され、適切な文字認識結果を出力することができる。
【0057】
なお、上記実施の形態で説明した文字認識方法を実行することが可能な文字認識装置あるいは文字認識システム(図1、図2参照)を構成するようにしても良い。
【0058】
また、上記実施の形態で説明した文字認識方法をコンピュータに実行させるプログラムとして、コンピュータが読取り可能な記憶媒体に記憶させるようにしても良い。
【0059】
さらに、上記実施の形態で説明した文字認識方法を実行するための文字認識装置あるいは文字認識システムとして、装置やシステムの一部あるいは全体をネットワークを介して接続して構成するようにしても良い。
【0060】
【発明の効果】
以上説明したように、本発明の文字認識方法(請求項1)によれば、入力画像から抽出された特徴ベクトルとパターン辞書が保持している文字コードの特徴ベクトルとに基づいて算出されたユークリッド距離を、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、入力画像から抽出された特徴ベクトルの大きさに応じて補正するようにしので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0061】
また、本発明の文字認識方法(請求項2)によれば、入力画像から抽出された特徴ベクトルとパターン辞書が保持している文字コードの特徴ベクトルとに基づいて算出されたユークリッド距離を、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルを用いて補正するようにしたので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
また、本発明の文字認識方法(請求項3)によれば、ユークリッド距離を補正するステップにおいて、学習データの数が所定数未満の場合、他の文字コードに対して用いられた学習データの固有値/固有ベクトルの平均値を用いて補正するようにしたので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0062】
以上説明したように、本発明の文字認識装置(請求項4)によれば、入力画像から抽出された特徴ベクトルとパターン辞書が保持している文字コードの特徴ベクトルとに基づいて算出されたユークリッド距離を、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、入力画像から抽出された特徴ベクトルの大きさに応じて補正するようにしたので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【0063】
また、本発明の文字認識装置(請求項)によれば、入力画像から抽出された特徴ベクトルとパターン辞書が保持している文字コードの特徴ベクトルとに基づいて算出されたユークリッド距離を、一の文字コードに対して用いられた学習データの数が所定数以上の場合は、固有値/固有ベクトルを用いて補正し、学習データの数が所定数未満の場合は、他の文字コードに対して用いられた学習データの固有値/固有ベクトルを用いて補正するようにしたので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
また、本発明の文字認識装置(請求項6)によれば、ユークリッド距離を補正する手段において、学習データの数が所定数未満の場合、他の文字コードに対して用いられた学習データの固有値/固有ベクトルの平均値を用いて補正するようにしたので、ユークリッド距離が正規化されて、適切な文字認識結果を出力することができる。
【図面の簡単な説明】
【図1】本発明で用いる文字認識システムの一構成例を示した図である。
【図2】本発明で用いる文字認識システムの他の構成例を示した図である。
【図3】作成されたパターン辞書の一例を示す図である。
【図4】特徴ベクトルの大きさと補正項との関係を示す線図である。
【図5】本実施の形態1における処理結果の一例を示す図である。
【図6】本実施の形態2において全ての辞書レコードに対して相違度を算出し、固有値/固有ベクトルを持つ辞書レコードについて補正項を求めた図である。
【図7】図6の処理結果に対して補正項が算出された結果についてのみ補正を施した図である。
【図8】図7の処理結果で補正項の算出されない認識結果について、補正項の算出された認識結果の補正項の平均値を用いて補正を行った結果をソートした実施の形態2における最終認識結果を示した図である。
【符号の説明】
10 文字認識用辞書(パターン辞書)
12 ネットワーク
14 文字認識エンジン
16 文字認識プログラム
18 文字認識用辞書
20〜2n 辞書レコード
30〜3n 特徴ベクトル
40、41 固有値/固有ベクトル

Claims (6)

  1. 入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識方法であって、
    前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、
    前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出するステップと、
    一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、入力画像から抽出された前記特徴ベクトルの大きさに応じて前記ユークリッド距離を補正するステップと、
    補正された前記ユークリッド距離を用いて文字認識を行うステップと、
    を実行することを特徴とする文字認識方法。
  2. 入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識方法であって、
    前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、
    前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出するステップと、
    一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルを用いて前記ユークリッド距離を補正するステップと、
    補正された前記ユークリッド距離を用いて文字認識を行うステップと、
    を実行することを特徴とする文字認識方法。
  3. 前記ユークリッド距離を補正するステップは、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合に、前記他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルの平均値を用いて前記ユークリッド距離を補正することを特徴とする請求項2に記載の文字認識方法。
  4. 入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識装置であって、
    前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、
    前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出する手段と、
    一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、入力画像から抽出された前記特徴ベクトルの大きさに応じて前記ユークリッド距離を補正する手段と、
    補正された前記ユークリッド距離を用いて文字認識を行う手段と、
    を備えたことを特徴とする文字認識装置。
  5. 入力画像から抽出された特徴ベクトルと、予めパターン辞書が保持している文字コードの特徴ベクトルとに基づいて文字認識を行う文字認識装置であって、
    前記各文字コードの特徴ベクトルは、一又は複数の学習データを用いて算出されており、
    前記入力画像から抽出された特徴ベクトルと前記パターン辞書が保持している文字コードの特徴ベクトルとの相違度であるユークリッド距離を算出する手段と、
    一の文字コードに対して用いられた学習データの数が所定数以上の場合には、前記学習データのばらつきの方向を表す固有値/固有ベクトルを用いて前記ユークリッド距離を補正し、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合には、他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルを用いて前記ユークリッド距離を補正する手段と、
    補正された前記ユークリッド距離を用いて文字認識を行う手段と、
    を備えたことを特徴とする文字認識装置。
  6. 前記ユークリッド距離を補正する手段は、一の文字コードに対して用いられた前記学習データの数が所定数未満の場合に、前記他の文字コードに対して用いられた学習データの前記固有値/固有ベクトルの平均値を用いて前記ユークリッド距離を補正することを特徴とする請求項5に記載の文字認識装置。
JP35840998A 1998-12-03 1998-12-03 文字認識方法および文字認識装置 Expired - Fee Related JP3930174B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35840998A JP3930174B2 (ja) 1998-12-03 1998-12-03 文字認識方法および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35840998A JP3930174B2 (ja) 1998-12-03 1998-12-03 文字認識方法および文字認識装置

Publications (2)

Publication Number Publication Date
JP2000172784A JP2000172784A (ja) 2000-06-23
JP3930174B2 true JP3930174B2 (ja) 2007-06-13

Family

ID=18459152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35840998A Expired - Fee Related JP3930174B2 (ja) 1998-12-03 1998-12-03 文字認識方法および文字認識装置

Country Status (1)

Country Link
JP (1) JP3930174B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4935905B2 (ja) * 2007-07-25 2012-05-23 富士通株式会社 文字認識処理方法及び装置
JP7110723B2 (ja) * 2018-05-21 2022-08-02 コニカミノルタ株式会社 データ変換装置、画像処理装置及びプログラム

Also Published As

Publication number Publication date
JP2000172784A (ja) 2000-06-23

Similar Documents

Publication Publication Date Title
JP4421134B2 (ja) 文書画像検索装置
JP3689455B2 (ja) 情報処理方法及び装置
US5572604A (en) Method for pattern recognition using prototype transformations and hierarchical filtering
JP2006252333A (ja) データ処理方法、データ処理装置およびそのプログラム
US20210124976A1 (en) Apparatus and method for calculating similarity of images
US20110317882A1 (en) Biometric matching method and apparatus
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4393720B2 (ja) パターン認識装置および方法
EP0960381B1 (en) Method and apparatus for recognizing patterns
WO2009048696A1 (en) Local image descriptors using linear discriminant embedding
CN110399493B (zh) 一种基于增量学习的作者消歧方法
JP5755046B2 (ja) 画像認識装置、画像認識方法及びプログラム
JPH11203415A (ja) 類似パターンカテゴリ識別辞書作成装置および方法
JP3930174B2 (ja) 文字認識方法および文字認識装置
CN114581927A (zh) 银行票据识别方法、设备及介质
JP2000090117A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP3374762B2 (ja) 文字認識方法及びその装置
JP3428512B2 (ja) 文字認識装置およびコンピュータ可読記録媒体
Nam et al. Elis: An efficient leaf image retrieval system
JPH07200735A (ja) 図形認識装置
JP3985926B2 (ja) 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体
JP7435990B2 (ja) 振込データ入力支援装置、振込データ入力支援方法、及びプログラム
JP3280577B2 (ja) 文字認識装置
JP2001092924A (ja) パターン認識方法および装置
JP3421200B2 (ja) 文字認識方法および装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070308

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees