JP4338058B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP4338058B2
JP4338058B2 JP11074598A JP11074598A JP4338058B2 JP 4338058 B2 JP4338058 B2 JP 4338058B2 JP 11074598 A JP11074598 A JP 11074598A JP 11074598 A JP11074598 A JP 11074598A JP 4338058 B2 JP4338058 B2 JP 4338058B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
distance
additional
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11074598A
Other languages
English (en)
Other versions
JPH11306286A (ja
Inventor
滋子 金一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP11074598A priority Critical patent/JP4338058B2/ja
Publication of JPH11306286A publication Critical patent/JPH11306286A/ja
Application granted granted Critical
Publication of JP4338058B2 publication Critical patent/JP4338058B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、あらかじめ標準パターンを登録しておき、認識対象となる入力パターンを受け付けた際に該入力パターンを標準パターンと照合して入力パターンの文字認識を行う文字認識装置に関する。
【0002】
【従来の技術】
従来、あらかじめ入力パターンの比較の対象となる文字パターン(以下「標準パターン」)を文字認識辞書に辞書登録しておき、この文字認識辞書を用いて文字認識を行う技術が知られている。
【0003】
例えば、特開平8−272904号公報には、標準パターンのサンプルをクラスタリングして大分類辞書及び分類辞書という2種類の文字認識辞書を作成し、これらの文字認識辞書を用いて高精度かつ高速な認識処理を行うパターン認識装置が開示されている。
【0004】
しかし、実際に市場でユーザが文字認識装置を使用するに際しては、文字認識辞書内に登録された標準パターン以外の字体の入力パターンが出現する場合が多いため、該入力パターンがリジェクトされたり、意図しない標準パターンに誤読される結果が生ずる。
【0005】
このため、従来の文字認識装置では、これらの正しく読めない文字を収集し辞書サンプルに追加したうえであらためて、文字認識辞書を再構築することにより、かかるリジェクトや誤読を避けていた。
【0006】
しかしながら、かかる文字認識辞書の再構築には、多大の時間及び労力を要し、ユーザ自身がその役割を担うには負担が大きすぎる。このため、特開平8−287190号公報では、上記大分類辞書及び分類辞書のような標準パターンを記憶した基本辞書のほかに追加辞書を設けている。
【0007】
具体的には、上記基本辞書の他にリジェクト辞書及び孤立辞書を新たに設け、リジェクト辞書には誤読となった文字パターンに対応してリジェクトを示すコードを登録するとともに、孤立辞書にはリジェクトが発生した文字パターンに対応して正解の文字コードを登録する。
【0008】
そして、文字認識に際しては、入力パターンと基本辞書及びリジェクト辞書とを照合し、リジェクト辞書に該当するときにはリジェクトとし、該当しないときには文字コードを出力する。また、基本辞書に該当しない場合には、孤立辞書と照合する。
【0009】
【発明が解決しようとする課題】
しかしながら、この従来技術を用いた場合には、一旦誤読された文字パターンはリジェクト辞書に登録されるため、この文字パターンに対応する入力パターンは常にリジェクトと判定され、出力するしかなく正解が得られない。
【0010】
また、かかるリジェクト辞書や孤立辞書のような追加辞書を使用する場合には、登録される文字パターンの数が増えれば増える程、文字パターンの照合に要する演算量が累増するため、認識時間が遅延するという問題が生ずる。
【0011】
なお、例えば特開平8−287250号公報のように、辞書に2分木の構造を持たせ、単純な条件をチェックして照合する標準パターンの集合を小さくして、入力パターンと辞書パターンとの照合回数を低減する技術も知られているが、かかる技術を適用するためには、2分木を構成するためにクラスタリング処理が必要となり、誤読あるいはリジェクトした文字パターンを追加登録する処理に時間がかかるという問題がある。
【0012】
以上のことから、文字認識辞書を用いて文字認識を行う際に、基本辞書の再構築を伴うことなく、追加辞書に登録した文字パターンから正解を取得でき、登録文字が増加した場合であっても文字パターンの照合を迅速に行うことができる文字認識装置をいかに実現するかが極めて重要な課題となっている。
【0013】
そこで、本発明では、上記課題を解決し、文字認識辞書を用いて文字認識を行う際に、基本辞書の再構築を伴うことなく、追加辞書に登録した文字パターンから正解を取得でき、登録文字が増加した場合であっても文字パターンの照合を迅速に行うことができる文字認識装置を提供することを目的とする。
【0014】
【課題を解決するための手段】
上記目的を達成するため、請求項1に記載の発明は、あらかじめ標準パターンを登録しておき、認識対象となる入力パターンを受け付けた際に該入力パターンを前記標準パターンと照合して入力パターンの文字認識を行う文字認識装置において、前記入力パターンの比較の対象となる標準パターン及びその特徴量を記憶する基本辞書と、前記基本辞書に存在せず追加登録された標準パターンである追加パターン及びその特徴量を記憶する追加辞書と、前記基本辞書に記憶した標準パターンのうち、前記入力パターンとの特徴量の距離が最も近い第1パターン及び第1の距離と、前記入力パターンとの特徴量の距離が2番目に近い第2パターン及び第2距離とを算定する算定手段と、前記算定手段が算定した第1の距離が第1のしきい値よりも大きい第1の条件を満たす場合、又は、第2の距離と第1の距離との差が第2のしきい値よりも小さい第2の条件を満たす場合には、前記第1の距離及び第2の距離をそれぞれ前記入力パターンとともに追加パターンとして前記追加辞書に登録する追加辞書登録手段と、前記入力パターンと前記基本辞書に記憶した標準パターンとの特徴量の距離に基づいて該入力パターンを前記追加辞書と照合する必要があるか否かを判断する判断手段と、前記判断手段が前記追加辞書との照合が必要と判断した場合に限り、前記入力パターンを前記追加辞書と照合する照合手段とを備え、前記判断手段は、前記基本辞書に登録されている標準パターンと前記入力パターンとの距離をaとし、前記追加パターンと前記基本辞書に登録されている標準パターンとの距離をcとし、前記第2の距離をd_min(2)とし、前記第1の距離のしきい値をTH1とし、該第2の距離と第1の距離の差のしきい値をTH2とした場合に、
a−c>d_min(2) 又は a−c>TH1+TH2
が成立すれば、前記入力パターンと前記追加パターンとの距離を算定しないものと判断する
ことを特徴とする。
【0016】
また、請求項2に記載の発明は、請求項の発明において、前記追加辞書登録手段は、前記第1の条件及び第2の条件を満たさず、かつ、誤読している場合にも、前記第1の距離及び第2の距離をそれぞれ前記入力パターンとともに追加パターンとして前記追加辞書に登録することを特徴とする。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。なお、本実施の形態では、大分類辞書及び分類辞書という2種類の辞書を基本辞書として用いた場合を示すこととする。
【0019】
図1は、本実施の形態で用いる文字認識装置の全体構成を示す機能ブロック図である。
【0020】
図1に示すように、この文字認識装置10は、画像入力部11から入力した文字イメージから特徴量を抽出した文字パターンを、基本辞書15にあらかじめ登録した標準パターン及び追加辞書に登録したパターンと照合して入力文字を認識する装置であり、画像入力部11と、特徴抽出部12と、辞書登録部13と、追加辞書14と、大分類辞書15a及び分類辞書15bからなる基本辞書15と、認識処理部16とからなる。
【0021】
ここで、基本辞書15は請求項1の基本辞書に対応し、追加辞書14は請求項1の追加辞書に対応し、認識処理部16は請求項1の判断手段及び照合手段に対応する。また、認識処理部16は請求項2及び3の算定手段に対応し、辞書登録部13が請求項2及び3の追加辞書登録手段に対応する。
【0022】
なお、この文字認識装置10は、基本辞書に存在する文字以外であって追加の標準パターン(以下「追加パターン」と言う。)を追加辞書14に登録する登録モードと、入力文字の認識を行う認識モードを有し、これらのモード切り替えは図示しないハードウエアスイッチ又はソフトウエアスイッチによって指示される。
【0023】
画像入力部11は、認識対象又は登録対象となる文字イメージを光学的に読み取るイメージスキャナ等の入力デバイスである。
【0024】
特徴抽出部12は、画像入力部11が読み取った文字イメージから当該文字の特徴量を抽出する処理部であり、登録モードの場合には当該特徴量を辞書登録部13に出力し、認識モードの場合にはこの特徴量を認識処理部16に出力する。
【0025】
具体的には、この特徴量は、入力イメージの画素毎の濃度勾配方向及び濃度勾配強度成分からなる画素成分を抽出し、これをm×nの複数のブロックに分割して各ブロックの濃度勾配成分ごとの濃度勾配強度成分の総和を求めたものである。
【0026】
例えば、1文字を5×5のブロックに分割した場合には、1ブロックにつき8方向の濃度勾配方向を有するので、200次元のベクトルで表現される。
【0027】
辞書登録部13は、登録モードにおいて動作する処理部であり、特徴量抽出部12から受け取った特徴量に基づいて入力した文字パターンを追加辞書14に登録するか否かを判断し、後述する所定の条件を満たす場合に、該文字パターンに係わる所定の事項を追加辞書に登録する。なお、かかる条件は、特徴量相互間のシティブロック距離又はユークリッド距離(以下単に「距離」と言う。)に基づいて定められる。
【0028】
具体的には、5×5のブロックに分割した場合のシティブロック距離は、標準パターンFSを
Figure 0004338058
の算定式により算定される。
【0029】
例えば、図2に示すような標準パターンFNと入力パターンIPとのシティブロック距離cを求めると、
c1=|FN1−IP1|=|15− 0|=15
c2=|FN2−IP2|=|24−51|=27
・・・
c200=|FN200−IP200|=|3−0|=3
となるため、
c=15+27+…+3=1856
が得られる。
【0030】
追加辞書14は、追加パターンとして辞書登録したい文字の特徴量等を記憶する辞書であり、辞書登録部13によって登録され、認識処理部16によって参照される。
【0031】
基本辞書15は、辞書登録部13による辞書登録の可否の判断及び認識処理部16による入力パターンの認識を行う際に参照される標準パターンの特徴量等からなる辞書であり、大分類辞書15a及び分類辞書15bからなる。
【0032】
ここで、分類辞書15bとは、例えばゴシック体の’3’、明朝体の’3’というように、’3’という同じ意味内容(カテゴリー)に属するフォントパターンの集合のことを指す。したがって、例えば’3’の分類辞書には、図3に示すようにそれぞれ書体等が異なる複数のフォントパターンが属する。
【0033】
また、大分類辞書15aとは、この分類辞書15bに属する集合を特徴量によって複数のフォントパターン群に分割し、各フォントパターン群に属する複数のフォントパターンの特徴量の平均値をその群の代表フォントの特徴量としたものである。例えば、図3に示すフォントI、フォントA、フォントB及びフォントFのフォントパターン群の大分類辞書パターン(番号10)の特徴量は、これらのフォントパターンの特徴量の平均値となる。
【0034】
なお、このように大分類辞書15a及び分類辞書15bという2段階の辞書で基本辞書15を形成した理由は、入力パターンの特徴量に近い特徴量を持つフォントパターンを高速に特定して、文字認識の高速化を実現するためである。
【0035】
認識処理部16は、基本辞書15及び追加辞書14に記憶した各標準パターン及び追加パターンの特徴量と入力パターンの特徴量とを照合して、入力文字の文字認識を行う処理部である。
【0036】
以上、文字認識装置10の全体構成について説明した。
【0037】
次に、図1に示す辞書登録部13の具体的な処理について説明する。
【0038】
図4は、図1に示す辞書登録部13の処理手順を示すフローチャートである。
【0039】
同図に示すように、この辞書登録部13は、まず最初に入力パターンを大分類辞書15aに所在する各標準パターンと照合し、入力パターンとの距離が最も近いパターン(以下「第1パターン」と言う。)及び該第1パターンとはカテゴリーが異なる最も距離が近いパターン(以下「第2パターン」と言う。)を見つける(ステップ401)。なお、追加辞書14に登録された追加パターンが存在する場合には、この追加パターンについても同様に入力パターンと照合する。ここで、入力パターンと第1パターンとの距離をd_min(1)で表しこれを第1の距離と呼び、また、該入力パターンと第2パターンとの距離をd_min(2)で表しこれを第2の距離と呼ぶことにする。
【0040】
その結果、入力パターンがリジェクト若しくはエラーとなったときに入力パターンを新たな追加パターンとして追加辞書14に登録する(ステップ402)。
【0041】
なお、入力パターンがリジェクトとなる場合としては、第1の距離(d_min(1))が所定のしきい値を越えたときのみが該当し、また入力パターンがエラーになる場合としては、d_min(1)が所定のしきい値以下でかつd_min(2)−d_min(1)が所定のしきい値を越えるときであっても意図したカテゴリーに属さず誤読されている場合が該当する。
【0042】
そして、かかる大分類辞書15aとの照合が終了したならば、入力パターンを追加パターンとして追加辞書に登録するか否かを問わず、分類辞書15bに記憶した標準パターンとの照合に移行する(ステップ403)。なお、追加辞書14に登録された追加パターンが存在する場合には、この追加パターンについても同様に入力パターンと照合し、リジェクト又はエラーのときに追加辞書14に追加パターンとして登録する(ステップ404)。 なお、入力パターンがリジェクトとなる場合としては、第1の距離(d_min(1))が所定のしきい値を越え、あるいは第1の距離と第2の距離の差が所定のしきい値以下であるようなときが該当し、つまりこのときは入力パターンを第1パターンであると判定できないことを意味する。
【0043】
上記一連の処理を行うことにより、入力パターンを追加パターンとして追加辞書に登録できる。
【0044】
次に、この辞書登録部13による追加辞書14への追加パターンの登録についてさらに具体的に説明する。なお、以下で用いる「A(X)ij 」の表記では、Xがパターン番号を示し、i=1が大分類辞書を、i=2が分類辞書をそれぞれ示し、j=1が第1パターンを、j=2が第2パターンをそれぞれ示すものとする。
【0045】
図5は、図1に示す追加辞書14へ登録する文字パターンの一例を示す図であり、図6は、図1に示す追加辞書14及び基本辞書15の一例である。
【0046】
例えば、図5に示す辞書登録されていないパターン0が入力された場合に大分類辞書15aとの照合を行った結果、第1パターン(パターン番号13)との距離d_min(1)が1856であり、あらかじめ定められたしきい値TH11(1836)よりも大きな場合には、入力パターンはリジェクトされ、追加辞書14への追加登録の対象となる。
【0047】
このとき、この入力パターンを確認し、ノイズがあるなど品質の悪いパターンを登録すると悪影響を及ぼすおそれがあるためそのようなパターンを省き、正しいカテゴリー’3’を与えて追加辞書14に書き込む。
【0048】
これにより、図6(b)に示す追加辞書の(1)の番号0に登録パターンの特徴量f0とカテゴリー’3’が書き込まれる。この特徴量f0は例えば図2に示す入力パターンIPの各値である。この際、大分類辞書15の第1パターン及び第2パターンの大分類辞書番号(A(0)11(=13)、A(0)12(=25))と、入力パターンから各パターンへの距離(C(0)11(=1856)、C(0)12(=1930))とが、追加辞書14の(2)に書き込まれる。
【0049】
その後、このパターン0を分類辞書15bと照合した結果、第1パターンとの距離d_min(1)がTH21(1786)よりも大きくなれば、追加辞書14への追加登録を行う。ただし、このパターン0は既に追加辞書14に登録されているので、分類辞書の第1パターン及び第2パターンの分類番号(A(0)21(=40)、A(0)22(=65))と、それぞれの距離(C(0)21(=1794)、C(0)22(=1930))を(3)の部分に付加する。これにより、パターン0の追加辞書14への追加登録を終了する。
【0050】
また、図5に示すパターン1が入力された場合に大分類辞書15aとの照合を行った結果、第1パターンとの距離d_min(1)が1361であり、あらかじめ定められたしきい値TH11(1836)よりも小さな場合には、d_min(2)−d_min(1)を算出して、しきい値TH12(152 )と比較する。この場合しきい値TH12より大きくなり、その結果、入力パターンはリジェクトされず、入力パターンは第1パターンに属することになるが、入力パターンのカテゴリーが’6’であるのにも係わらず、第1パターンのカテゴリーが’5’であるため、誤読によるエラーとなる。
【0051】
このため、その文字パターンを確認し、正しいカテゴリー’6’を与えて追加辞書14に書き込む。
【0052】
これにより、図6(b)に示す追加辞書14の(1)の番号1に登録パターンの特徴量f1とカテゴリー’6’が書き込まれる。この際、大分類辞書15の第1パターン及び第2パターンの大分類辞書番号(A(1)11(=23)、A(1)12(=28))と、入力パターンから各パターンへの距離(C(1)11(=1361)、C(1)12(=1523))とが、追加辞書14の(2)に書き込まれる。
【0053】
その後、このパターン1を分類辞書15bと照合した結果、第1パターンとの距離d_min(1)がTH21(1786)よりも小さいので、d_min(2)−d_min(1)を算出し、このd_min(2)−d_min(1)をしきい値TH22と比較する。この場合もしきい値TH22より大きくなり、その結果、入力パターンはリジェクトされず、入力パターンは第1パターンに属することになるが、入力パターンのカテゴリーが’6’であるのにも係わらず、第1パターンのカテゴリーが’5’であるため、誤読によるエラーとなる。
【0054】
ただし、このパターン1は既に追加辞書14に登録されているので、分類辞書の第1パターン及び第2パターンの分類番号(A(1)21(=68)、A(1)22(=74))と、それぞれの距離(C(1)21(=1178)、C(1)22(=1350))を(3)の部分に付加する。これにより、パターン1の追加辞書14への追加登録を終了する。
【0055】
また、図5に示すパターン2が入力された場合に大分類辞書15aとの照合を行った結果、第1パターンとの距離d_min(1)が1378であり、あらかじめ定められたしきい値TH11(1836)よりも小さな場合には、d_min(2)−d_min(1)を算出して、しきい値TH12(152 )と比較する。
【0056】
その結果は、しきい値TH12より小さいが、次の分類照合へ進むため、追加辞書14へ追加登録する必要は生じない。
【0057】
その後、このパターン2を分類辞書15bと照合した結果、第1パターンとの距離d_min(1)がTH21(1786)よりも小さいので、d_min(2)−d_min(1)を算出し、このd_min(2)−d_min(1)をしきい値TH22と比較する。
【0058】
その結果、d_min(2)−d_min(1)がTH22よりも小さく、リジェクトとなるので追加辞書14に追加登録する。なお、このパターン2はまだ登録されていないので、正しいカテゴリー’3’を与える。
【0059】
これにより、図6(b)に示す追加辞書14の(1)の番号2に特徴量f2とカテゴリー’3’が書き込まれる。この際、分類辞書15bの分類辞書番号(A(2)21(=65)、A(2)22(=98))とそれぞれの距離(C(2)21(=1307)、C(2)22(=1467))が追加辞書14の(3)に書き込まれる。これにより、パターン2の追加辞書14への追加登録が終了する。
【0060】
以上、図1に示す辞書登録部13の処理手順について説明した。
【0061】
次に、図1に示す認識処理部16による文字認識処理手順について説明する。
【0062】
図7は、図1に示す認識処理部16による文字認識処理手順を示すフローチャートである。
【0063】
同図に示すように、この認識処理部16では、特徴抽出部12が抽出した入力パターンの特徴量を受け取ったならば(ステップ701)、まず大分類辞書15aを用いた大分類照合を行い(ステップ702)、第1パターン及び第2パターンとの距離d_min(1)及びd_min(2)を取得する。
【0064】
そして、このd_min(1)及びd_min(2)と、追加辞書14に登録した追加パターンの番号i、特徴量fi、カテゴリーCati 、辞書番号A(i)11、A(i)12、A(i)21、A(i)22および距離c(i)11、c(i)12、c(i)21、c(i)22を用いて、距離計算をできるだけ省略して高速化を図りつつ、追加辞書14との照合を行う(ステップ703)。
【0065】
その後、d_min(1)がしきい値TH11より大きいかどうかをチェックし(ステップ704)、大きいときはそのままリジェクトする。そうでないときは、さらにd_min(2)−d_min(1)がしきい値TH12より大きいかどうかをチェックし(ステップ705)、大きいときはアクセプトとし、第1パターンのカテゴリーを出力する。つまり、d_min(1)がしきい値TH11より大きければ、文字が似ていないということになり、また、d_min(1)がしきい値TH11より小さければ2番目に似ているカテゴリーのパターンとの距離d_min(2)とd_min(1)とが離れているかを見て、離れていれば(TH12より大きければ)第1パターンのカテゴリーに決定するが、離れていなければ第2番目の文字にも似ているということになり第1パターンのカテゴリーに決定せずに更に次の分類照合を行うことになる。
【0066】
一方、上式が成立しない場合には、入力パターンと分類辞書15bとの照合を行い(ステップ706)、入力パターンと分類辞書15b内の標準パターンとの距離を計算してd_min(1)及びd_min(2)を改めて計算して、分類照合を行った後に(ステップ706)、上記ステップ703と同様に追加辞書14との照合を行う(ステップ707)。
【0067】
その後、d_min(1)がしきい値TH21より大きいかどうかをチェックし(ステップ708)、大きいときはリジェクトし、そうでないときはd_min(2)−d_min(1)がしきい値TH22より大きいかどうかをチェックする(ステップ709)。そして、上式が成立する場合には、第1パターンのカテゴリーを出力し、上式が成立しない場合にはリジェクトとする。
【0068】
次に、上記ステップ703及び707に示す追加辞書14との照合について図8〜図11を用いて説明する。
【0069】
まず、かかる追加辞書14との照合を行う概念について説明する。
【0070】
いま、入力パターンと追加パターンとの距離が、仮にbである場合を考えると、しきい値判定においてd_min(1)及びd_min(2)が用いられるため、bがd_min(2)より大きい場合は、bを計算する必要はない。
【0071】
また、しきい値としてTH1(d_min(1)のしきい値)とTH2(d_min(2)−d_min(1)のしきい値)を用いるため、bがTH1+TH2より大きい場合は、この追加パターンを認識結果として出力することはない。
【0072】
つまり、b>d_min(2)またはb>TH1+TH2であることが明らかであれば、この追加パターンが認識結果に影響を及ぼすことはないので、bを計算する必要がないことになる。
【0073】
そこで、入力パターンと標準パターンとの距離をa、追加辞書に登録されている追加パターンと標準パターンとの距離をcとすると、距離の公理より、a−c<bなので、a−c>d_min(2)のときb>d_min(2)で、a−c>TH1+TH2のときb>TH1+TH2である。
【0074】
このことは、a−c>d_min(2)又はa−c>TH1+TH2のいずれかが成り立つとき、bの計算は不要となることを意味するため、a−c>εが成立すると入力パターンと追加パターンの距離計算はする必要がないことが分かる。なお、ε=min(TH1+TH2、d_min(2))とする。
【0075】
次に、図8を用いて、かかる距離計算の必要の有無についてさらに具体的に説明する。
【0076】
図8に示すように、入力パターンに最も近い標準パターンがJであり、2番目に近い標準パターンがKである場合に、もし、追加パターンLがTH11+TH12を半径とする円よりも外側にあれば、たとえ、Kよりも近いとしても、最終的にはJとは近くにないとして(Jを中心とする半径TH12の内側にはない)、一意にJに決まるので、この追加パターンLとの距離を算出しなくとも問題はない。
【0077】
しかし、追加パターンMのように、TH11+TH12を半径とする円の内側にあれば、Jを中心とする半径TH12の中に存在する可能性が出てくるため、追加パターンMと入力パターンとの距離計算が必要となる。
【0078】
もし、KがJを中心とする半径TH12の内側に入っていれば、d_min(2)−d_min(1)がTH12よりも小さくなるので、第1パターンと第2パターンとが接近しすぎているとしてリジェクトする。
【0079】
なお、追加パターンとの比較照合時に距離計算を行うこととなったときは、第1パターンのカテゴリーと一致するか否かを問わず距離計算を行う。その理由は、同一カテゴリーであっても、演算の結果、距離がd_min(1)より小さくなればd_min(1)が更新され、d_min(2)との差が開くことになり、より照合結果(認識率)が良くなるからである。
【0080】
次に、図9を用いて、この距離計算が不要となる場合をさらに詳細に説明する。
【0081】
なお、図10(1)及び(2)に示す追加パターンB(0) 及びB(1) が追加辞書14に登録済みであり、入力パターンXが同図(3)に示すものであるとし、B(0)は、A(0)11(=13)、A(0)12(=25)、c(0)11(=1856)、c(0)12(=1930)を有し、B(1) はA(1)11(=23)、A(1)12(=28)、c(1)11(=1361)、c(1)12(=1523)を有するものとする(図6(b)参照)。
【0082】
図9は、追加パターン(△)と標準パターン(●)の関係を示す図であり、同図に示すように、標準パターン(●)のボロノイ境界付近に、追加パターン(△)が張り付けられていると考えられる。また、ε= min(TH11+TH12, d_min(2))である。
【0083】
そして、入力パターン×とA(0)11との距離をa(0)11、A(0)12との距離をa(0)12、A(1)11との距離をa(1)11、A(1)12との距離をa(1)12とする。
【0084】
ここで、入力パターンXと追加パターンB(0)との距離計算を行う前に、a(0)11−c(0)11>εまたはa(0)12−c(0)12>εに該当するかどうかをチェックする。a(0)11、a(0)12の各値は標準パターンとの距離計算を既に行なっているので既知であり、c(0)11、c(0)12の各値は追加パターンB(0)の中に既に持っており、εも算出済みであるので上記判定式を直ちに確認でき、いずれの不等式にも該当しないので、入力パターンと追加パターンB(0)との距離計算を行い、d_min(1)とd_min(2)の更新を行う。
【0085】
次に、追加パターンB(1)との距離計算を行う前に、a(1)11−c(1)11>εまたはa(1)12−c(1)12>εに該当するかどうかをチェックする。この場合も同様に各値は既に求められているので判定式はすぐに確認でき、判定式が成立することになるので、入力パターンと追加パターンB(1)との距離計算を行わない。
【0086】
図11は、上記概念に基づく追加辞書14との照合手順を示すフローチャートである。
【0087】
同図に示すように、全ての追加パターンとの照合が終了するまでの間(ステップ1101)、ε=min(TH1+TH2、d_min(2))によりεを求め(ステップ1102)、a1−c1>εまたはa2−c2>εが成立するか否かを確認する(ステップ1103)。
【0088】
そして、a1−c1>εまたはa2−c2>εが成立しない場合には、入力パターンと追加パターンとの距離計算を行い(ステップ1104)、d_min(1)及びd_min(2)を更新する(ステップ1105)。
【0089】
そして、全ての追加パターンとの照合が終了したならば、追加辞書14との照合を終了する。
【0090】
このように、かかる追加辞書14との照合では、追加辞書14内の全ての追加パターンと入力パターンとの間の距離を求めるのではなく、a1−c1>εまたはa2−c2>εが成立しない場合にのみ、入力パターンと追加パターンとの距離計算を行っているので、高速に追加辞書14と入力パターンとの照合を行うことができる。
【0091】
なお、本実施の形態では、大分類辞書15a及び分類辞書15bからなる基本辞書15を用いる場合に本発明を適用することとしたが、本発明はこれに限定されるものではない。
【0092】
【発明の効果】
以上説明したように、請求項1に記載の発明によれば、入力パターンの比較の対象となる標準パターン及びその特徴量を基本辞書に記憶するとともに、基本辞書に存在しない追加パターン及びその特徴量を追加辞書に記憶しておき、基本辞書に記憶した標準パターンのうち、入力パターンとの特徴量の距離が最も近い第1パターン及び第1の距離と、入力パターンとの特徴量の距離が2番目に近い第2パターン及び第2の距離とを算定し、該算定した第1の距離が第1のしきい値よりも大きい第1の条件を満たす場合、又は、第2の距離と第1の距離との差が第2のしきい値よりも小さい第2の条件を満たす場合には、第1の距離及び第2の距離をそれぞれ入力パターンとともに追加パターンとして追加辞書に登録し、入力パターンと標準パターンとの特徴量の距離に基づいて該入力パターンを追加辞書と照合する必要があるか否かを判断手段により判断し、照合が必要と判断した場合に限り、入力パターンを追加辞書と照合するよう構成し、上記判断手段は、基本辞書に登録されている標準パターンと入力パターンとの距離をaとし、追加パターンと基本辞書に登録されている標準パターンとの距離をcとし、第2の距離をd_min(2)とし、第1の距離のしきい値をTH1とし、該第2の距離と第1の距離の差のしきい値をTH2とした場合に、a−c>d_min(2) 又は a−c>TH1+TH2が成立すれば、入力パターンと追加パターンとの距離を算定しないものと判断するよう構成したので、基本辞書の再構築を伴うことなく、追加辞書に登録した文字パターンから正解を取得でき、登録文字が増加した場合であっても文字パターンの照合を迅速に行うことができるとともに、追加パターンとの照合回数を低減し、迅速かつ効率的に文字認識を行うことができる。
【0094】
また、請求項に記載の発明によれば、第1の条件及び第2の条件を満たさず、かつ、誤読している場合にも、第1の距離及び第2の距離をそれぞれ入力パターンとともに追加パターンとして追加辞書に登録するよう構成したので、誤読が生じている場合にも対応することができる。
【図面の簡単な説明】
【図1】本実施の形態で用いる文字認識装置の全体構成を示す機能ブロック図。
【図2】図1に示す辞書登録部が行う距離の算定を説明するための図。
【図3】図1に示す大分類辞書及び分類辞書に記憶する標準パターンの一例を示す図。
【図4】図1に示す辞書登録部の処理手順を示すフローチャート。
【図5】図1に示す追加辞書へ登録する文字パターンの一例を示す図。
【図6】図1に示す追加辞書及び基本辞書の一例を示す図。
【図7】図1に示す認識処理部による文字認識処理手順を示すフローチャート。
【図8】図1に示す認識処理部が行う距離計算の概念を説明するための図。
【図9】追加パターンと標準パターンの関係を示す概念図。
【図10】追加パターン及び入力パターンの一例を示す図。
【図11】追加辞書との照合手順を示すフローチャート。
【符号の説明】
10…文字認識装置
11…画像入力部
12…特徴抽出部
13…辞書登録部
14…追加辞書
15…基本辞書
15a…大分類辞書
15b…分類辞書
16…認識処理部

Claims (2)

  1. あらかじめ標準パターンを登録しておき、認識対象となる入力パターンを受け付けた際に該入力パターンを前記標準パターンと照合して入力パターンの文字認識を行う文字認識装置において、
    前記入力パターンの比較の対象となる標準パターン及びその特徴量を記憶する基本辞書と、
    前記基本辞書に存在せず追加登録された標準パターンである追加パターン及びその特徴量を記憶する追加辞書と、
    前記基本辞書に記憶した標準パターンのうち、前記入力パターンとの特徴量の距離が最も近い第1パターン及び第1の距離と、前記入力パターンとの特徴量の距離が2番目に近い第2パターン及び第2距離とを算定する算定手段と、
    前記算定手段が算定した第1の距離が第1のしきい値よりも大きい第1の条件を満たす場合、又は、第2の距離と第1の距離との差が第2のしきい値よりも小さい第2の条件を満たす場合には、前記第1の距離及び第2の距離をそれぞれ前記入力パターンとともに追加パターンとして前記追加辞書に登録する追加辞書登録手段と、
    前記入力パターンと前記基本辞書に記憶した標準パターンとの特徴量の距離に基づいて該入力パターンを前記追加辞書と照合する必要があるか否かを判断する判断手段と、
    前記判断手段が前記追加辞書との照合が必要と判断した場合に限り、前記入力パターンを前記追加辞書と照合する照合手段と
    を備え、
    前記判断手段は、
    前記基本辞書に登録されている標準パターンと前記入力パターンとの距離をaとし、前記追加パターンと前記基本辞書に登録されている標準パターンとの距離をcとし、前記第2の距離をd_min(2)とし、前記第1の距離のしきい値をTH1とし、該第2の距離と第1の距離の差のしきい値をTH2とした場合に、
    a−c>d_min(2) 又は a−c>TH1+TH2
    が成立すれば、前記入力パターンと前記追加パターンとの距離を算定しないものと判断する
    ことを特徴とする文字認識装置。
  2. 前記追加辞書登録手段は、
    前記第1の条件及び第2の条件を満たさず、かつ、誤読している場合にも、前記第1の距離及び第2の距離をそれぞれ前記入力パターンとともに追加パターンとして前記追加辞書に登録する
    ことを特徴とする請求項1記載の文字認識装置。
JP11074598A 1998-04-21 1998-04-21 文字認識装置 Expired - Fee Related JP4338058B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11074598A JP4338058B2 (ja) 1998-04-21 1998-04-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11074598A JP4338058B2 (ja) 1998-04-21 1998-04-21 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11306286A JPH11306286A (ja) 1999-11-05
JP4338058B2 true JP4338058B2 (ja) 2009-09-30

Family

ID=14543475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11074598A Expired - Fee Related JP4338058B2 (ja) 1998-04-21 1998-04-21 文字認識装置

Country Status (1)

Country Link
JP (1) JP4338058B2 (ja)

Also Published As

Publication number Publication date
JPH11306286A (ja) 1999-11-05

Similar Documents

Publication Publication Date Title
US7031530B2 (en) Compound classifier for pattern recognition applications
Kanai et al. Automated evaluation of OCR zoning
US7562017B1 (en) Active labeling for spoken language understanding
CN112036383B (zh) 一种基于手静脉的身份识别方法及装置
Fujii et al. Sequence-to-label script identification for multilingual ocr
US11062120B2 (en) High speed reference point independent database filtering for fingerprint identification
CN109165639B (zh) 一种指静脉识别方法、装置及设备
US20040146216A1 (en) Fine segmentation refinement for an optical character recognition system
Shirali-Shahreza et al. Recognition of handwritten Persian/Arabic numerals by shadow coding and an edited probabilistic neural network
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
CN112613293B (zh) 摘要生成方法、装置、电子设备及存储介质
Han et al. Off-line cursive handwriting segmentation
JP2009129253A (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JP4338058B2 (ja) 文字認識装置
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
Tulyakov et al. Classifier combination types for biometric applications
JP4116688B2 (ja) 辞書学習方法および文字認識装置
JP3659688B2 (ja) 文字認識装置
Reddy et al. A connectionist expert system model for conflict resolution in unconstrained handwritten numeral recognition
JP2906758B2 (ja) 文字読取装置
JP3446769B2 (ja) 文字認識装置
JP2957097B2 (ja) パタン認識用辞書作成方法およびパタン認識方法
JPH04260987A (ja) 文字認識装置
JPS58105387A (ja) 文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080805

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090623

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090625

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees