JP2008097275A

JP2008097275A - パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Info

Publication number: JP2008097275A
Application number: JP2006277737A
Authority: JP
Inventors: Minako Kuwata; みな子桑田; Yoshiyuki Koyama; 至幸小山
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-10-11
Filing date: 2006-10-11
Publication date: 2008-04-24
Anticipated expiration: 2026-10-11
Also published as: WO2008044380A1; CN101553825A; EP2073146A1; EP2073146A4; JP4087421B2; CN101553825B

Abstract

【課題】高速かつ高精度なパターン認識を可能とする。
【解決手段】
パターン認識装置１は、入力パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル抽出部８２３と、辞書照合ベクトル蓄積バッファ８１３から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出する照合ベクトル一致度判定部８２４と、所定閾値より大きい一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をし、照合結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンを、辞書データ８１１から読出して出力する。
【選択図】図１

Description

本発明は、入力パターンを認識するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関し、特に、入力パターンが複数の異なる辞書パターンのいずれに一致するかを判定するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関する。

従来、光学式文字読取装置（Optical Character Reader：ＯＣＲと略す）などの文字認識装置において、一般的には、パターンマッチングにより文字認識を行なう。パターンマッチングでは、まず、入力文字画像から特徴ベクトルを抽出する。ここでは、入力文字画像から抽出された特徴ベクトルのことを、入力特徴ベクトルと呼ぶ。そして、入力特徴ベクトルと、各文字に対応して辞書データに予め登録された標準的な特徴ベクトル（以下、辞書特徴ベクトルよいう）との照合処理を行なう。照合処理の結果、最もパターンが類似していると判断された辞書特徴ベクトルに対応した文字を認識結果として決定し出力する。

ここで、特徴ベクトルについてのメッシュ特徴ベクトルを例示する。図１７は、特徴ベクトルを抽出するために入力画像において矩形状に切取られた文字画像の例を示す。図１７の文字画像をメッシュ状に分割すると、文字画像は複数の領域に分割される。メッシュ状に分割された文字画像の各領域の画素数に基づき、各領域の画素数について正規化等の処理を行なう。当該処理により算出された各領域の画素数を指す値を成分とするベクトルを生成する。このようにして生成されたベクトルを、メッシュ特徴ベクトルと呼ぶ。

図１８では、図１７の矩形状の文字画像を、縦８×横８の６４個の領域にメッシュ分割した様子が示される。図１９では、図１８に示したメッシュ分割された画像から生成されるメッシュ特徴ベクトルの各成分を、各領域に対応付けて示される。図１９によれば、メッシュ特徴ベクトルの成分の個数は６４（８×８）個であり、一文字は６４個の成分からなる特徴ベクトルにより規定されることが示される。

図２０を参照して、パターン認識において参照される辞書データ８１１について説明する。図２０の辞書データ８１１は、複数種類の辞書登録文字ＣＨｉ（ｉ＝１、２、３、・・・、ｎ）と、辞書登録文字ＣＨｉのそれぞれに対応して、辞書特徴ベクトル群ＶＥｉ（ｉ＝１、２、３、・・・、ｎ）とを含む。辞書特徴ベクトル群ＶＥｉは、対応の辞書登録文字ＣＨｉについて、ｍ個の辞書特徴ベクトルＶＴｊ（ｊ＝１、２、３、・・・、ｍ）を含む。ここでは辞書登録文字ＣＨｉは当該文字を識別する文字コードを示す。

特徴ベクトルＶＴｉは、対応の辞書登録文字ＣＨｉについて複数種類のフォントの文字を学習することによって、各種のフォント（書体：明朝、ゴシックなど）について統計的に生成された特徴ベクトルを指す。特徴ベクトルＶＴｉは、傾いた文字、かすれた文字、または潰れた文字などを学習することにより統計的に生成された特徴ベクトルを指してもよい。

辞書データには、いずれの辞書登録文字ＣＨｉについても、基本的にｍ個の特徴ベクトルＶＴｊが格納されているとする。具体的には、全てのフォントを学習して、第１特徴ベクトルＶＴ１〜第ｍ特徴ベクトルＶＴｍを作成する。第１特徴ベクトルＶＴ１が、全ての学習ベクトルの平均を算出した結果を指す。第２特徴ベクトルＶＴ２は、第１特徴ベクトルＶＴ１に直交するベクトルを算出した結果を指す。第３ベクトルＶＴ３は、第２特徴ベクトルＶＴ２に直交するベクトルを算出した結果を指す。以下、特徴ベクトルＶＴｍまで同様にして算出がなされて、算出結果を指す。

従来、特徴ベクトルＶＴｊを用いたパターンマッチングのための演算では、シティーブロック距離、ユークリッド距離、類似度などが用いられる。これらは、すべてパターン認識に一般的に用いられる周知の尺度である。パターン認識では、未知ベクトルと標準ベクトルとを想定した場合に、標準ベクトルと未知ベクトルとの距離や類似度を算出し、算出結果に基づき、最も近い（類似している）文字コードＣＨｉが指示する文字コードを認識結果として出力する。

入力された文字とマッチング対象となる辞書登録文字が、それぞれ、図１９に示すメッシュ状の等分割による６４個の成分からなる特徴ベクトルによって規定される場合を例にして、シティーブロック距離および類似度の算出式をそれぞれ式（１）と式（２）に示す。

入力文字の特徴ベクトル（以下、入力特徴ベクトルという）Ｘ（ベクトルＸはＸ１、Ｘ２・・・Ｘ６４の６４個の成分からなる）、マッチング対象となる辞書登録文字ＣＨｉの特徴ベクトル（以下、辞書特徴ベクトルという）Ｙ（ベクトルＹはＹ１、Ｙ２・・・Ｙ６４の６４個の成分からなる）とすると、シティーブロック距離Ｄは式（１）に従い算出されて、また、単純類似度Ｓは式（２）に従い算出される。

上述したとおり、パターンマッチングは入力文字画像から抽出された入力特徴ベクトルと予め登録されている辞書特徴ベクトルとのマッチング処理により行なわれるが、このマッチング処理は時間を要するため、従来から、この時間を短縮するための方法が提案されてきた。

特許文献１では、詳細マッチングを行なうか否かの判定のための閾値を文字種毎に閾値テーブルに登録しておき、辞書ｋと入力特徴ベクトルとの距離ｄが閾値Ｔｈｋを超えた時点でマッチングを中止する方法が開示されている。

また、従来技術においては、マッチング処理は、まず辞書の第１特徴ベクトルとのマッチング距離が近いものから上位Ｐ個を抽出し、抽出されたＰ個については、さらに詳細に識別するために第２特徴ベクトルから第Ｚ特徴ベクトルまでマッチングを行なう。

次に、図２１を用いて、ＯＣＲなどの文字認識装置において従来用いられてきたパターンマッチング高速化のための処理を説明する。以下の説明では、マッチングは、メッシュ特徴ベクトルを用いて行なわれるものとする。

はじめに、マッチング処理の概要について説明する。図２１では、まず、入力文字とすべての辞書登録文字との距離が算出される。つまり、入力文字画像から抽出された入力特徴ベクトルと辞書に登録されているすべての文字の辞書特徴ベクトルとの距離（たとえばシティーブロック距離）が算出される。算出された距離の値が小さいほど誤差が少なく入力文字パターンと辞書登録文字パターンとは類似しているといえる。

図２１の例では、上記距離は、式（１）のシティーブロック距離の算出式に従い、入力特徴ベクトルと辞書特徴ベクトルの各成分の差を累積加算することにより算出される。

すべての辞書登録文字について距離の算出が終了すると、算出された距離の値が小さい順に（昇順に）並べた順列において、上位Ｐ個の辞書登録文字を抽出する。そして、以降は、抽出されたＰ個の辞書登録文字を対象にして詳細マッチングが行なわれる。詳細マッチングでは、辞書の第１特徴ベクトルとの距離演算だけでなく、第２特徴ベクトルから第Ｚ特徴ベクトルまでのすべての辞書特徴ベクトルとの距離演算が行なわれる。

次に、図２１のフローチャートに従い詳細に説明する。まず、ＯＣＲは光学読取り部と認識部と記憶部を有する。まず、光学読取り部により、紙面上に書かれた文字が読取られて、読取り結果を指す画像が出力される。認識部は、光学読取り部から出力された画像を入力して（ステップＳ１０１）、入力画像から文字画像を切り出す（ステップＳ１０２）。文字画像の切り出しは特開昭６３−２１６１８８号公報に示されるように、入力画像から黒画素を抽出し、この抽出結果に基づき文字行を抽出する。その後、抽出された行に垂直な方向のヒストグラムに従い文字画像が切り出される。

入力された文字画像はメッシュ分割され、メッシュ分割の結果得られた複数の領域のそれぞれの画素数に基づき、正規化等の処理が行なわれる。その結果に基づき、入力特徴ベクトルが抽出（生成）される（ステップＳ１０３）。

次に、マッチングカウンタを示す変数ｉの値を初期化する。すなわちｉ＝１とする（ステップＳ１０４）。なお、ＯＣＲの記憶部に予め格納された辞書に登録されているすべての文字数をＮ個と想定する。

次に、辞書に登録されたすべての文字のそれぞれについて、以下のように、入力文字（切り出された文字）とのパターンマッチング処理が行なわれる。パターンマッチング処理は、入力文字についての入力特徴ベクトルと、辞書に登録された文字についての辞書特徴ベクトルとの距離を算出することを指す。

まず、入力文字と登録文字とのパターンマッチングが行なわれる際には、予め、辞書に登録された全ての文字について距離算出が終了したか否かの終了判定を行なう（ステップＳ１０５）。ここで、すべての文字について距離算出が終了していないと判定された場合（ｉ＜Ｎの場合）、入力特徴ベクトルと辞書登録された文字の第１特徴ベクトルとの距離算出がされて、算出された距離は変数Ｄｉにセットされる（ステップＳ１０６）。ここでは変数Ｄｉを距離値Ｄｉともいう。

１つの辞書登録文字について距離値Ｄｉが算出されると、変数ｉの値を１インクリメントする（ステップＳ１１０）。このインクリメント後の変数ｊの値は、現在までに距離の算出が終了した辞書中の文字数を指す。そして、辞書中のすべての文字について距離値Ｄｊの算出が、すなわちマッチングが終了したか否かの判定がされる（ステップＳ１０５）。すべての文字についてのマッチングが終了した場合（ｉ＜Ｎでないの場合）には、距離の算出結果が格納されている変数Ｄｉ（ｉ＝０、１、２、３、・・・、Ｎ）をその値の昇順にソートする（ステップＳ１０７）。

ソート結果の順列において、上位のＰ個の変数Ｄｉに対応する辞書登録文字を対象にして詳細マッチングが行なわれる（ステップＳ１０８）、その結果に基づき、入力文字とパターンが近いと判定された文字をマッチング結果として、すなわち候補文字として辞書から読出して出力する（ステップＳ１０９）。その後、処理を終了する。

図２１の認識処理の手順よりも、さらなる高速化を図るため、距離算出の演算について閾値に基づくスキップ処理を導入する方法も提案されてきた。

図２２には、閾値に基づくスキップ処理を行なう際に参照される閾値テーブル６００２が例示される。図２２を参照して、閾値テーブル６００２には、辞書データ６００１に登録された各文字と関連付けて、当該登録文字の閾値Ｔｉ（i＝１、２、３、・・・、ｎ）が予め登録されている。たとえば、閾値Ｔｎは、辞書データの登録文字ＣＨｎに対応する閾値である。閾値Ｔｉは学習データにより統計的に計算された値であり、たとえば辞書データ６００１の登録文字ＣＨｉに対応して登録されている辞書特徴ベクトルと登録文字ＣＨｉについての任意の入力特徴ベクトルとの距離は、必ず閾値Ｔｉで示される範囲内であることが保証されている。

入力文字と辞書登録文字との距離の算出は、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算することによって行なわれるが、辞書登録されている文字ごとにそれぞれ距離の閾値Ｔｉが設けられていることによって、累積加算により算出された値が、閾値Ｔｉ以下の間のみ、さらに下位成分についてまでの累積加算演算を続行し、上記設けられている閾値を上回った場合、演算を打ち切るような処理を行なわせることが可能となる。

図２３は、閾値Ｔｉに基づき距離算出の演算をスキップするパターンマッチングのフローチャートである。図２３のステップＳ２０１からステップＳ２０５は、図２１のステップＳ１０１からステップＳ１０５と同様の処理内容であり説明は省略する。

距離算出においては、図２１の処理と同様に入力された文字の入力特徴ベクトルと辞書登録されている文字の辞書特徴ベクトルの各成分の差を累積加算する演算が実行されることになる。

前述したとおり、図２３の処理においては、累積加算により算出された距離の値が、辞書の登録文字ごとにそれぞれ設けられている閾値Ｔｉ以下を指示する場合には、さらに下位成分についてまでの累積加算の演算を続行し、閾値Ｔｉを上回ったことを指示する場合、累積演算を打ち切り、現在対象としている文字についての距離が確定され、次の文字についての距離算出へと処理が移ることになる（ステップＳ２０６〜Ｓ２０８）。

そこで、ステップＳ２０９では、現在対象としている文字について、累積加算により算出された距離が、閾値テーブル６００２に格納されている判定閾値Ｔｉ以下であるか否かの判定が行なわれることになる。この判定において、距離が判定閾値Ｔｉ以下であった（Ｄｉ＜Ｔｉ）場合には、ステップＳ２１０に移行しマッチング成分カウンタｊがインクリメントされ、そのまま距離算出の演算が続行される。

また、距離が判定閾値を上回る（Ｄｉ＜Ｔｉでない）場合には、現在対象としている文字についての距離は確定され、ステップＳ２１３にて距離変数Ｄｉに、算出された距離の最大値が格納され、ステップＳ２１４にてマッチング辞書カウンタｉをインクリメントし、次の文字の距離計算に処理を移す。

以降の処理（ステップＳ２１１〜Ｓ２１３）は、図２１と同様の処理内容であり説明は省略する。以上が、閾値によるスキップ処理を導入しパターンマッチングを高速化させる手法の従来例である。

以上のとおり、従来の文字認識装置において、距離演算回数が少なくする為に各種の方法を用いることにより、パターンマッチングの高速化が実現されてきた。
特開昭６３−１０９５９２号公報

上記した従来技術の距離を使用するマッチング手法においては、距離算出の累積加算は、必ずしも特徴ベクトルのすべての成分を対象とする必要はなかった。しかしながら、類似度を用いたマッチングを行なう場合は、算出された類似度が最大のものをマッチング結果とするため、特徴ベクトルの一部の要素のみを累積加算の対象とすることはマッチングの精度を考慮すると好ましくなかった。

つまり、上記距離を使用するマッチング処理においては、あらかじめ累積加算の対象とする特徴ベクトルの成分数を設定しておくことや、閾値を設定することにより累積加算を打ち切るなどの高速化手法を適用できたが、類似度を用いたマッチング処理に対して上記高速化手法を適用することは困難であった。

したがって、従来、類似度を用いてマッチングを行なう場合は、図１８のメッシュ特徴ベクトルの場合を例に挙げると、１つの特徴ベクトルの成分数は６４（８×８）であり、１つの登録文字について距離を求める場合６４回の演算が必要となる。

これでは、日本語のように文字数が多い言語においては、登録文字数が３０００以上にもなり、少なくとも１９２０００（６４×３０００）回の演算を行なわなくてはならなかった。さらに、１つの登録文字の辞書特徴ベクトルが複数の特徴ベクトルから成る場合、詳細マッチングにおいては、さらに多くの演算が必要であった。さらに、類似度演算は積和によるため加算のみで実現可能な距離演算に比べ、１回の演算に要する時間のコストが高かった。

そのため、類似度を用いたマッチング処理においては、積和演算を行なう前に、高速に正解の可能性が無いと高速に判断する方法、つまり、積和演算を行なう必要がない辞書登録文字を高速に判別する大分類方法が望まれていた。

本発明は、類似度によるパターンマッチングにおいても、距離によるパターンマッチングにおいても、より高速に高精度に認識できるパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体を提供することを目的とする。

この発明のある局面に係るパターン認識装置は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成手段と、辞書照合ベクトル格納手段から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、所定閾値より大きい一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をする照合手段と、を備える。そして、入力パターンと、照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なう。

好ましくは、所定閾値は、辞書照合ベクトル格納手段において辞書特徴ベクトル毎に予め格納されている。

好ましくは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の入力照合ベクトルの１を指す成分の総数に対する割合を指示する。

好ましくは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の辞書照合ベクトルの１を指す成分の総数に対する割合を指示する。

好ましくは、特徴は画像の濃淡を指示する。
好ましくは、特徴は画像の濃淡を指示し、成分は濃淡を１と０により指示し、入力照合ベクトルの１を指す成分の総数が予め設定した数値より大きいときは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の入力照合ベクトルの１を指す成分の総数に対する割合を指示する。

好ましくは、特徴は画像の濃淡を指示し、成分は濃淡を１と０により指示し、入力照合ベクトルの１を指す成分の総数が予め設定した数値以下のときは、一致度は、辞書照合ベクトルと入力照合ベクトルとの内積の値の辞書照合ベクトルの１を指す成分の総数に対する割合を指示する。

この発明の他の局面に係るパターン認識方法は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備えるコンピュータを用いたパターン認識方法であって、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、辞書照合ベクトル格納部から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、所定閾値より大きい前記一致度が算出された辞書特徴ベクトルと、入力照合ベクトルとの照合をする照合ステップと、入力パターンと、前述の照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なうステップとを備える。

この発明のさらに他の局面では、上述のパターン認識方法をコンピュータに実行させるためのパターン認識プログラムが提供される。

この発明のさらに他の局面では、上述のパターン認識方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体が提供される。

本発明によれば、値が１または０で示される成分からなる辞書照合ベクトルと入力照合ベクトルとの一致度を基に、辞書パターンと入力パターンが類似しているかどうかの照合を行なうが、一致度は辞書照合ベクトルと入力照合ベクトルとの内積に基づき算出されるから、高速に一致度を得ることができる、照合も速やかに行なうことが可能となる。

これによりパターン認識では、時間を要する類似度演算の回数が削減され、入力パターンをより高速に認識することが可能となる。

以下図面を参照しながら、本発明に係る実施形態について説明する。
（実施の形態１）
（機能構成）
図１には、本実施の形態に係る文字認識装置１の要部の機能構成が示される。図２には、実施の形態に係るコンピュータの構成が示される。

図２は本実施の形態に係る文字認識装置１が搭載されるコンピュータの構成図である。図２を参照してコンピュータは、画像入力部１０１、ＣＲＴ（陰極線管）や液晶などからなるディスプレイ６１０、該コンピュータ自体を集中的に管理し制御するためのＣＰＵ（Central Processing Unit）６２２、ＲＯＭ（Read Only Memory）またはＲＡＭ（Random Access Memory）を含んで構成されるメモリ６２４、固定ディスク６２６、ＦＤ（Flexible Disk）６３２が着脱自在に装着されて、装着されたＦＤ６３２をアクセスするＦＤ駆動装置６３０、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）６４２が着脱自在に装着されて、装着されたＣＤ−ＲＯＭ６４２をアクセスするＣＤ−ＲＯＭ駆動装置６４０、通信ネットワーク３００と、該コンピュータとを通信接続するための通信インターフェイス６８０、プリンタ６９０およびキーボード６５０およびマウス６６０を有する入力部７００を含む。これらの各部はバスを介して通信接続される。

画像入力部１０１は、スキャナを有し、紙面に書かれた文字をスキャナにより光学的に読取り、画像データを出力する。またはカメラなどの撮像部を有し、紙面に書かれた文字を撮像部により撮像して画像データを出力する。

コンピュータには、カセット形式の磁気テープが着脱自在に装着されて磁気テープをアクセスする磁気テープ装置が設けられてもよい。

図１を参照して、文字認識装置１は、入力部７００に対応の入力部８００、画像入力部１０１に対応する入力部８０１、ならびにプリンタ６９０またはディスプレイ６１０に対応の出力部８０２を接続する。文字認識装置１は内部に、ＣＰＵ６２２などに対応の制御部８０３、与えられる画像データから文字部分のデータを抽出（切り出し）する切り出し部８０４、切り出した文字画像データが示す文字から特徴を抽出する特徴抽出部８０５、辞書特徴ベクトルと入力特徴ベクトルとを用いたパターンマッチングを行なうマッチング部８２０、辞書データ８１１、入力特徴ベクトルの照合用のベクトルを格納するための入力照合ベクトル蓄積バッファ８２５、辞書特徴ベクトルの照合用のベクトルを蓄積する辞書照合ベクトル蓄積バッファ８１３、およびメモリ８１４を備える。

メモリ８１４は画像データ、文字パターンなどを処理するための作業領域として利用されるとともに、文字認識処理途中の中間データなどを格納するための領域である。

マッチング部８２０は、辞書特徴ベクトルと入力特徴ベクトルのパターンマッチングを行なうパターンマッチング部８２１を含む。パターンマッチング部８２１は、入力パターンの濃淡の度合いを判定する濃淡判定部８２２、入力特徴ベクトルの成分の値に従い入力照合ベクトルを抽出する照合ベクトル抽出部８２３、辞書特徴ベクトルと入力特徴ベクトルが類似しているかどうかを判定する照合ベクトル一致度判定部８２４、閾値作成部８２６、第１ベクトル類似度算出部８２７および詳細類似度算出部８２８を含む。

図２０の辞書データ８１１、閾値バッファ８１２、辞書照合ベクトル蓄積バッファ８１３、メモリ８１４、および入力照合ベクトル蓄積バッファ８２５は、メモリ６２４、固定ディスク６２６、ＦＤ６３２およびＣＤ−ＲＯＭ６４２に対応する。

切り出し部８０４および特徴抽出部８０５、ならびにマッチング部８２０の各部の機能は、対応するプログラムを実行することにより実現される。つまり、これらプログラムは、メモリ６２４、固定ディスク６２６、ＦＤ６３２およびＣＤ−ＲＯＭ６４２などに予め格納されており、ＣＰＵ６２２がこれらプログラムを読出して実行することにより対応する機能が実現される。なお、ここでは、これら各部の機能はプログラムで実現されるとしているが全部またはその一部が回路を用いて実現されても良い。

（マッチング処理）
本実施の形態に係る辞書データ８１１の一部の構成は図２０に示される。

文字認識装置１におけるマッチング処理の概要について図３のフローチャートを参照しながら説明する。当該フローチャートはプログラムとして、たとえばメモリ６２４に格納されて、ＣＰＵ６２２がメモリ６２４から当該プログラムの命令を読出して実行することによりマッチング処理が進行する。

まず、ユーザが、画像入力部８０１を操作して、文字が記載された紙面（原稿）を光学的に走査することにより、または当該紙面を撮像することにより、画像データが画像入力部８０１により入力される。画像入力部８０１は入力した画像データを文字認識装置１に出力する。文字認識装置１は、画像入力部８０１から出力された画像データを入力する。入力した画像データはメモリ８１４に格納される（ステップＳ（以下、単にＳと略す）１）。画像入力部８０１から出力される画像データは、画像の各画素が白または黒の値を有する２値化された、すなわち特徴として濃淡を呈する画像のデータを指す。

切り出し部８０４は、メモリ８１４に格納された画像データを読出して切り出し処理を行なう。つまり、当該画像データのうちから、文字に対応する画像データを、文字パターン（入力パターン）データとして切り出す。切り出された文字パターンデータは矩形状のパターンデータを指す（Ｓ２）。文字パターンデータ（以下、文字パターンという）の切り出しは、たとえば、特開昭６３−２１６１８８号公報に示される手順に従い行なわれる。つまり、入力画像データより黒画素を抽出し、抽出した黒画素に基づき入力画像において文字の行を判別した後、判別した行に垂直な方向の黒画素のヒストグラムに従い文字パターンを切り出す。ここでは、たとえば、図１７の文字パターンが切り出されたと想定する。図１７の文字パターンは黒画素からなる文字領域と、白画素からなる文字の背景領域からなる。切り出し部８０４により切り出された文字パターンは、メモリ８１４に格納される。

特徴抽出部８０５は、メモリ８１４から文字パターンを読出し、読出した文字パターンから当該文字パターンの特徴を抽出する。当該特徴は入力特徴ベクトルとして抽出される（Ｓ３）。その後、パターンマッチング（Ｓ４）が行なわれる。入力特徴ベクトルの抽出手順の詳細が図４に示される。

図４を参照して、特徴抽出部８０５は、メモリ８１４から読出した文字パターン、たとえば、図１７の文字パターンの矩形状の領域を、メモリ８１４の作業領域においてメッシュ状の複数の領域に分割する（Ｓ３１）。ここでは、矩形状の文字パターンは図１２に示すように縦横８×８の正方形の６４個の領域に等分割される。本実施の形態では、等分割された６４個の各領域は、図５に示すように文字パターンの矩形領域の左上端から右下端にかけて領域ｅ１、ｅ２、ｅ３、・・・、ｅ６４と順番に指示される。

さらに、特徴抽出部８０５は、等分割して得た６４個の各領域に、当該領域に含まれる画素（pixel）のうち、文字領域を表す画素（黒画素）の数をカウントし、各領域のカウントされた黒画素数の２乗の総和が一定になるように正規化を行なう（Ｓ３３）。正規化では、各成分の値の２乗の総和が、たとえば６５５３６と一定となるように行なわれる。

特徴抽出部８０５により出力される入力特徴ベクトルは、正規化された６４個の成分を有する。各成分は、正規化された黒色画素の数を指す。抽出された入力特徴ベクトルはメモリ８１４に格納される（Ｓ３５）。その後、処理は図３のステップＳ４に移行する。

ここで正規化とは、６４個の領域のそれぞれについてカウントされた黒画素数の２乗値を算出して、算出された各領域の黒画素数の２乗値を、６４個の領域全てについて足し合わせて、その足し合わせた値が、所定値となるように入力特徴ベクトルの各成分を調整することを指す。正規化をすることにより、入力文字パターンが同じフォント（書体）の「Ａ」であれば、32pixel×32pixelの文字パターンも64pixel×64pixelの文字パターンも、その入力特徴ベクトルは、同じ値のベクトルを指す。これにより、同一文字についてフォントが同じであれば、大きな文字も小さな文字も、辞書ベクトルと比較されるべき入力特徴ベクトルは等しくなる。

パターンマッチング部８２１はメモリ８１４から入力特徴ベクトルを読出して、読出した入力特徴ベクトルと辞書データ８１１に予め格納されている辞書特徴ベクトルＶＴｊとを用いて、パターンマッチング処理を行なう（Ｓ４）。つまり、パターンマッチング部８２１は、入力特徴ベクトルと辞書データ８１１から読出した辞書特徴ベクトルＶＴｊとを用いて入力文字と辞書登録文字とのパターンマッチング処理を行なう。

このようなパターンマッチング処理のための各部の機能について説明する。
（第１ベクトル類似度算出部）
第１ベクトル類似度算出部８２７による具体的な類似度の算出手順は次のようである。つまり、第１ベクトル類似度算出部８２７は、入力文字パターンと辞書登録文字ＣＨｉの文字パターンについて、図５のメッシュ状に分割された６４個の領域のうち、互いの領域eｘ（ｘ＝１，２，３、・・・、６４）における黒色画素の割合同士を乗算する。すなわち、入力特徴ベクトルを構成する６４個の成分と、辞書特徴ベクトルＶＴｉを構成する６４個の成分について対応する成分の値同士を乗算する。そして、乗算結果の値を図５の６４個の領域ｅ１〜ｅ６４（６４個の成分）について、すべて加算する。この加算結果が類似度を指す。

第１ベクトル類似度算出部８２７が、類似度を算出する際には、パターンマッチング部８２１によりまず、辞書特徴ベクトル群ＶＥｉそれぞれの第１の特徴ベクトルＶＴ１を演算の対象して、概略的なマッチングが行なわれる。これにより６４個の演算結果（乗算値）が得られる。所定の閾値よりも大きい乗算値を有する第１の特徴ベクトルＶＴ１に対応の辞書登録文字ＣＨｉのそれぞれについて、次に、対応の第２の特徴ベクトルＶＴ２〜第ｍの特徴ベクトルＶＴｍのそれぞれを対象として演算をする。それらの演算結果に基づき認識結果が出力される。

（照合ベクトル抽出部）
照合ベクトル抽出部８２３について図６（Ａ）〜図６（Ｃ）を参照し説明する。照合ベクトル抽出部８２３は、たとえば図６（Ａ）の入力特徴ベクトル１００から図６（Ｂ）の入力照合ベクトル１０１を生成して、その後、生成された入力照合ベクトル１０１に基づき図６（Ｃ）の照合ベクトルテーブル９２５を生成する。生成された照合ベクトルテーブル９２５は図７の入力照合ベクトル蓄積バッファ８２５に格納される。

具体的には、照合ベクトル抽出部８２３は、図６（Ａ）の入力特徴ベクトル１００をメモリ８１４から読出す。そして読出した入力特徴ベクトル１００の６４個の成分それぞれの値と、所定の閾値（ここでは、所定閾値を３２とする）とを比較する。比較結果に基づき入力照合ベクトル１０１を生成する。なお、所定閾値は、特徴ベクトルの各成分を、高い値の成分、低い値の成分に分けるための閾値を指す。前述の正規化で述べたように、各成分の値の２乗の総和が、ここでは６５５３６を指すので、全ての成分が同じ値を指すと想定した場合には、各成分の値は３２を指すことになる。つまり、３２×３２×６４＝６５５３６である。そこで、ここでは、所定閾値として３２を採用している。このように、所定閾値は、正規化の時の総和の値により決定される。したがって、所定閾値は３２に限定されない。

照合ベクトル抽出部８２３はまず６４個の成分からなるベクトルを生成する。これを、生成ベクトルという。このとき生成ベクトルの各成分の値はたとえば‘０’がセットされている。次に、上述の比較結果に基づき、図６（Ａ）の入力特徴ベクトル１００の６４個の成分のうち、所定閾値（＝３２）より大きいと判定された値を有する生成ベクトルの成分の値のみを‘１’にセットする（所定閾値以下と判定された値を有する成分に対応する生成ベクトルの成分の値は‘０’のままである）。これにより生成ベクトルは、図６（Ｂ）に示すように値‘１’または‘０’のいずれかが割当てされた６４個の成分を有する入力照合ベクトル１０１を指示する。生成された入力照合ベクトル１０１は一旦メモリ８１４に格納される。

さらに、照合ベクトル抽出部８２３は、メモリ８１４から図６（Ｂ）の入力照合ベクトル１０１を読出し、読出した入力照合ベクトル１０１の６４個の成分の値を、図６（Ｂ）の矢印ＡＲで示すように行単位に順番にビット列として抽出する。したがって、計８個のビット列が抽出される。抽出された各ビット列は８ビットの長さを有する。次に、照合ベクトル抽出部８２３は、入力照合ベクトル１０１から抽出された順番に従い８個のビット列を格納した図６（Ｃ）の入力照合ベクトルテーブル９２５を生成する。生成された入力照合ベクトルテーブル９２５は入力照合ベクトル蓄積バッファ８２５に格納される。

入力照合ベクトルテーブル９２５は、入力照合ベクトル１０１から抽出された順番に従い８個のビット列をレコードＩＲｋ（ｋ＝１，２，３，４，５，６，７，８）として格納する。また、照合ベクトル抽出部８２３は、生成した入力照合ベクトル１０１の６４個の成分のうち値が‘１’を指す成分の数、つまり６４個の成分のうち値が所定閾値よりも大きい成分の総数をカウントして、カウント値を入力カウントデータ９２６として入力照合ベクトル蓄積バッファ８２５に格納する。図６（Ｂ）の例では入力カウントデータ９２６は‘２７個’を指す。

（辞書照合ベクトル蓄積バッファ）
図８（Ａ）と（Ｂ）には、辞書照合ベクトル蓄積バッファ８１３の内容の一例が示される。本実施の形態では、辞書データ８１１の辞書登録文字ＣＨｉのそれぞれについても、対応する辞書特徴ベクトルＶＴｊについて、入力特徴ベクトル１００と同様にして入力照合ベクトルテーブル９２５に相当する辞書照合ベクトルテーブルＤ１ｊと入力カウントデータ９２６に相当する辞書カウントデータＤ２ｊが算出されて、算出された両方の値は対応付けされて辞書照合ベクトル蓄積バッファ８１３に格納される。

辞書照合ベクトル蓄積バッファ８１３には、図８（Ａ）に示すように辞書データ８１１の辞書登録文字ＣＨｉに対応の辞書特徴ベクトルＶＴｊのそれぞれに関連付けされたデータＤｊが予め格納される。図８（Ａ）を参照してデータＤｊは、関連付けされた辞書特徴ベクトルＶＴｊについて算出された辞書照合ベクトルＤ１ｊ、辞書カウントデータＤ２ｊ、判定閾値（辞書）データＤ３ｊおよび判定閾値（入力）データＤ４ｊを有する。判定閾値（辞書）データＤ３ｊおよび判定閾値（入力）データＤ４ｊについては後述する。図８（Ｂ）には辞書照合ベクトルテーブルＤ１ｊの一例が示される。辞書照合ベクトルテーブルＤ１ｊは入力照合ベクトルテーブル９２５と同様に８ビット長の８個のレコードＲＲｋ（ｋ＝１，２，３、・・・、８）を有する。

データＤｊは、たとえば、文字認識装置１が起動したとき辞書データ８１１をロードする場合に、ロードされた辞書データ８１１に基づき算出して辞書照合ベクトル蓄積バッファ８１３に格納するようにしてもよい。

図９には、辞書照合ベクトル蓄積バッファ８１３の具体的な内容例が示される。たとえば図９の辞書特徴ベクトルＶＴｊの場合には、照合ベクトル抽出部８２３により図９の辞書照合ベクトルテーブルＤ１ｊと辞書カウントデータＤ２ｊとが算出されて格納される。また、辞書照合ベクトルテーブルＤ１ｊの‘１’の成分の数を基準にした一致度判定閾値（辞書）データＤ３ｊと、入力照合ベクトル１０１の‘１’の成分の数を基準にした一致度判定閾値（入力）データＤ４ｊが算出されて格納される。

（照合ベクトル一致度判定部）
次に、照合ベクトル一致度判定部８２４について説明する。図１０（Ａ）〜（Ｈ）には、照合ベクトル一致度判定部８２４の処理手順が模式的に示される。ここでは、図１０（Ａ）と（Ｂ）の辞書特徴ベクトルＶＴｊと入力特徴ベクトル１００のそれぞれから、照合ベクトル抽出部８２３により、図１０（Ｃ）と（Ｄ）の辞書照合ベクトルテーブルＤ１ｊと入力照合ベクトルテーブル１０１のそれぞれと、図１０（Ｆ）と（Ｇ）の辞書カウントデータＤ２ｊと入力カウントデータ９２６のそれぞれが算出されていると想定する。

照合ベクトル一致度判定部８２４は、判定に用いるデータを作成する。つまり、入力照合ベクトルテーブル１０１のレコードＩＲｋと辞書照合ベクトルテーブルＤ１ｊのレコードＲＲｋの８ビットのデータどうしをビット単位で論理積を算出する。変数ｋの値を１から順にインクリメントしながら８となるまで、レコードＩＲｋとＲＲｋのデータどうしの論理積を算出する。これにより、レコードＩＲｋとＲＲｋどうしの論理積（８ビットデータ）を格納した８個のレコードＲからなる図１０（Ｅ）に示す論理積データ２００が得られる。論理積データ２００は一時的にメモリ８１４に格納される。

照合ベクトル一致度判定部８２４は、次に、メモリ８１４の論理積データ２００の各レコードＲのデータを読出し、読出したデータが示す８ビットのうち、‘１’を指すビットの総数を計算する。算出された総数は、辞書照合ベクトルＶＴｊと入力照合ベクトル１００の内積値２０１（図１０（Ｈ）参照）を指す。算出された内積値２０１はメモリ８１４に格納される。照合ベクトル一致度判定部８２４による一致度の判定の詳細は後で述べる。

辞書ベクトルＶＴｊから作成された各成分の値が０と１のいずれかである辞書照合ベクトルテーブルＤ１ｊと、入力特徴ベクトル１００から辞書照合ベクトルテーブルＤ１ｊと同じ閾値を用いて作成された各成分の値が０と１のいずれかを指す入力照合ベクトルテーブル１０１を比較する場合、２つが同じ文字種であれば両方のテーブルにおいて値が‘１’を指す成分の場所が一致する度合いが高くなり、したがって、内積値２０１の値が大きくなる。したがって、内積値２０１の値が大きいほど入力文字と辞書登録文字ＣＨｉのパターンは一致する程度が高いといえる。

（閾値作成部）
閾値作成部８２６による、入力照合ベクトルの値が‘１’を指す成分の総数を基準にした一致度判定閾値の作成方法と、辞書照合ベクトルの値が‘１’の成分の総数を基準にした一致度判定閾値の作成方法を図１１（Ａ）〜（Ｈ）に従い説明する。

「Ａ」という文字を例に説明する。前述の方法に従い、辞書照合ベクトル蓄積バッファ８１３には「Ａ」を指す辞書登録文字ＣＨｉの辞書特徴ベクトルＶＴｊ（図１１（Ａ）参照）と辞書照合ベクトルテーブルＤ１ｊ（図１１（Ｃ）参照）が予め格納されている。また、予め、「Ａ」の異なる種類のフォント毎に、図１１（Ｂ）に示すようにその文字パターンから作成した学習特徴ベクトルについてそれぞれ図１１（Ｄ）の学習照合ベクトルテーブル１０３を作成する。次に、作成された学習照合ベクトルテーブル１０３それぞれについて「Ａ」の辞書照合ベクトルテーブルＤ１ｊとの論理積２０３（図１１（Ｅ）参照）を算出して、論理積２０３のそれぞれについて図１１（Ｈ）の内積値２０４を算出する。

さらに辞書照合ベクトルの値‘１’の成分の総数１０４（図１１（Ｆ））に対する各学習照合ベクトルに対応の内積値２０４の比率ＲＬと、学習照合ベクトルの値‘１’の成分の総数１０５のそれぞれに対する、当該学習照合ベクトルの内積値２０４の比率ＲＤを求める。図１１（Ｆ）〜（Ｈ）では総数１０４が‘２２’、総数１０５が‘２７’、および内積値２０４が‘７’である場合には、比率ＲＬは０．３１８であり、比率ＲＤは０．２５９である。

図１１（Ｂ）のすべての学習特徴ベクトルについて比率ＲＬと比率ＲＤを計算し、比率ＲＬの最小値を「Ａ」の入力照合ベクトルの値‘１’の成分の総数を基準にした一致度判定閾値ＭｉｎＩとし、比率ＲＤの最小値を「Ａ」の辞書照合ベクトルの値‘１’の成分の総数を基準にした一致度判定閾値ＭｉｎＤとする。算出された一致度判定閾値ＭｉｎＩとＭｉｎＤは、図８の辞書照合ベクトル蓄積バッファ８１３に当該辞書特徴ベクトルＶＴｊに対応の判定閾値データＤ３ｊおよびＤ４ｊとして格納される。

図１２は、閾値作成部８２６による、１つの辞書特徴ベクトルＶＴｊについての２つの閾値、つまり、辞書照合ベクトルの値‘１’の成分の総数を基準にした一致度判定閾値ＭｉｎＤ（判定閾値データＤ３ｊ）と、入力照合ベクトルの値‘１’の成分の総数を基準にした一致度判定閾値ＭｉｎＩ（判定閾値データＤ４ｊ）との作成処理フローチャートである。

まず、閾値作成部８２６は、閾値作成対象の辞書特徴ベクトルＶＴｊを辞書データ８１１から読出して入力する（Ｓ１３０１）。求めるべき閾値（ＭｉｎＤ、ＭｉｎＩ）に初期値として最大値‘１’（＝１００％）をセットする（Ｓ１３０２）。入力した辞書特徴ベクトルＶＴｊから辞書照合ベクトルテーブルＤ１ｊを作成する（Ｓ１３０３）。次に、作成した辞書照合ベクトルテーブルＤ１ｊにおいて閾値（＝３２）を超えている成分の総数Ｓｄを算出する（Ｓ１３０４）。

次に、学習された特徴ベクトルデータであって、未だ、閾値作成に用いられていないデータがあるかどうかを判断し（Ｓ１３０５）、あれば、１つの学習特徴ベクトルデータ（以下、学習特徴ベクトルという）を入力する（Ｓ１３０６）。ここでは学習により得られた複数の学習特徴ベクトルはメモリ８１４に予め格納されているので、メモリ８１４から読出されることにより学習特徴ベクトルが入力される。

次に、入力された学習特徴ベクトルから学習照合ベクトルテーブル１０３を作成し（Ｓ１３０７）、作成した学習照合ベクトルテーブル１０３の閾値（＝３２）を超えている成分の総数Ｓｉを算出する（Ｓ１３０８）。

次に、辞書照合ベクトルテーブルＤ１ｊを辞書照合ベクトル蓄積バッファ８１３から読出し、読出した辞書照合ベクトルテーブルＤ１ｊと作成した学習照合ベクトルテーブル１０３との内積値２０４を指す内積値Ｗを算出する（Ｓ１３０９）。

そして、内積値Ｗに対する総数Ｓｄの比（Ｗ／Ｓｄ）と閾値ＭｉｎＤとを比較して、比較結果に基づき、比（Ｗ／Ｓｄ）は閾値ＭｉｎＤより小さいかを判定する（Ｓ１３１０）。小さいと判定されないとステップＳ１３１２に移行するが、小さいと判定されると閾値ＭｉｎＤに比（Ｗ／Ｓｄ）をセットして（Ｓ１３１１）、ステップＳ１３１２に移行する。

ステップＳ１３１２では、内積値Ｗに対する総数Ｓｉの比（Ｗ／Ｓｉ）と閾値ＭｉｎＩとを比較して、比較結果に基づき、比（Ｗ／Ｓｉ）は閾値ＭｉｎＩより小さいかを判定する。小さいと判定されないとステップＳ１３０５に移行するが、小さいと判定されると閾値ＭｉｎＩに比（Ｗ／Ｓｉ）をセットして（Ｓ１３１３）、ステップＳ１３０５に移行する。

ステップＳ１３０６〜Ｓ１３１３の処理を、メモリ８１４に格納された全ての学習特徴ベクトルそれぞれについて繰り返し行なう。学習特徴ベクトルの全てについて処理が終了したことが判定されると（Ｓ１３０５で‘Ｙ’）、その時点の閾値ＭｉｎＤおよびＭｉｎＩの値を出力する。すなわち、出力された閾値ＭｉｎＤとＭｉｎＩの値は、辞書特徴ベクトルＶＴｊに対応の判定閾値データＤ３ｊおよびＤ４ｊとして辞書照合ベクトル蓄積バッファ８１３に格納される（Ｓ１３１４）。以上により一致度判定閾値作成処理は終了する。

ここで用いる学習ベクトルは、辞書特徴ベクトルＶＴｊと同じ文字種の大量データである。図１２の一致度判定閾値作成処理は、辞書データ８１１の全ての辞書登録文字ＣＨｉのすべての辞書特徴ベクトルデータＶＴｊについて行なわれる。

ここで、辞書登録文字ＣＨｉの各特徴ベクトルＶＴｊの一致度判定閾値データＤ３ｊとＤ４ｊを学習ベクトルから求めた最小の閾値ＭｉｎＤとＭｉｎＩとする理由は次のようである。

つまり、前述したように辞書特徴ベクトルＶＴｊと入力特徴ベクトル１００との間では、同じ文字種であれば、両方のベクトルにおいて成分の値が‘１’の場所が一致する度合いが高いはずである。たとえば、文字‘Ｊ’の辞書照合ベクトルテーブルＤ１ｊと入力文字‘Ｌ’の入力照合ベクトルテーブル１０１とでは、値‘１’の場所が一致する度合いは低いはずである。反対に‘Ｌ’の辞書照合ベクトルテーブルＤ１ｊと‘Ｌ’の入力照合ベクトルテーブル１０１とは、値‘１’の場所が一致する度合いが高いはずである。しかし、どのくらい度合いが高いかは、データによって異なるので確定することは困難である。そこで、手がかりとして、図１２では学習データから一致する割合を、すなわち辞書特徴ベクトルと学習ベクトルが一致する割合を、算出している。

したがって、図１２の処理で一致度判定閾値データＤ３ｊとＤ４ｊを最小値とすれば、学習データのすべてを網羅することが可能となる。学習データについて言えば、後述の図１４のパターンマッチング処理の類似度計算（第１辞書ベクトルとの類似度計算）と詳細マッチング（第２辞書ベクトルとの類似度計算）（Ｓ１５１０とＳ１５１２）を誤ってスキップしてしまうことはない。このような理由から、最小値を例に挙げている。もちろん、最小値でなくてもかまわないが、値が大きくなるとパターンマッチング処理は早くなる代わりに精度は落ちるであろう。

図１３は、照合ベクトル抽出部８２３において、照合ベクトルテーブル（辞書照合ベクトルテーブルＤ１ｊまたは入力照合ベクトルテーブル１０１など）の値‘１’の成分の総数（辞書カウントデータＤ２ｊまたは入力カウントデータ９２６）を算出する時に使用するテーブルを示す。図１３のテーブルは、１０進数の値（０〜２５５）のそれぞれに対応して、２進数の値と、２進数の値で示される値が‘１’のビットの個数とが格納されている。このテーブルは予めメモリ８１４に格納されている。

たとえば、照合ベクトルテーブルのレコード（レコードＲＲｋまたはＩＲｋ）の成分の値が00000101(１０進で５)の時、図１３のテーブルの１０進数の‘５’に対応のビット数を検索すると‘２’が得られる。このような手順で図１３のテーブルを検索することにより、照合ベクトルテーブルの各レコードについて閾値を超えている成分の数（ビット数）を得ることができるから、得られたビット数の総和を求める、すなわち７回の足し算のみで値‘１’の成分の総数を高速に得ることができる。

（パターンマッチング処理）
図１４には、パターンマッチング部８２１の処理手順が示される。

特徴抽出部８０５で作成された、たとえば図６（Ａ）の入力特徴ベクトル１００がマッチング部８２０のパターンマッチング部８２１に入力されたと想定する（Ｓ１５０１）。照合ベクトル抽出部８２３は入力特徴ベクトル１００に基づき入力照合ベクトル１０１を作成し（Ｓ１５０２）、入力照合ベクトル１０１の値‘１’の成分の総数ＳＩを算出（カウント）する（Ｓ１５０３）。これにより、入力照合ベクトル蓄積バッファ８２５には入力照合ベクトルテーブル９２５と総数ＳＩに相当の入力カウントデータ９２６が格納される。

パターンマッチング部８２１は、辞書データ８１１から読出されてパターンマッチングに用いられる辞書登録文字ＣＨｉをカウントするためのカウンタｉを１にセットし（Ｓ１５０４）、辞書登録文字数の相当する回数だけマッチングが行なわれたか判定する（Ｓ１５０５）。図２０に従えば辞書登録文字ＣＨｉの総数はｎ個である。パターンマッチング部８２１には、予めｎ個を指すデータが与えられているので、カウンタｉが指示する値と登録辞書文字数（ｎ個）とを比較し、比較結果の基づき‘ｉ＜ｎ（登録辞書文字数）’の条件が成立するか否かを判定することにより、辞書登録文字数の相当する回数だけマッチングが行なわれたか否かを判定する。

‘ｉ＜ｎ（登録辞書文字数）’の条件が成立して、辞書登録文字の全てについてマッチングがまだ行なわれていないと判定すると（Ｓ１５０５でＹ）、辞書登録文字ＣＨｉに対応の第１辞書特徴ベクトルＶＴ１について後述の類似度計算（Ｓ１５１０）が可能となるが、その前に、第１辞書特徴ベクトルＶＴ１は類似度計算（Ｓ１５１０）の対象となるかを判別するための照合ベクトル一致度判定部８２５を用いた処理（Ｓ１５０６〜Ｓ１５０９）が行なわれる。

まず、照合ベクトル一致度判定部８２５は、辞書特徴ベクトルＶＴ１に対応する辞書照合ベクトルテーブルＤ１１、閾値ＭｉｎＤおよびＭｉｎＩに相当の閾値データＤ３１およびＤ４１、ならびに辞書照合ベクトルテーブルＤ１１の値‘１’の成分の総数Ｓｄに相当の辞書カウントデータＤ２１を照合ベクトル蓄積バッファ８１３から読出す（Ｓ１５０６）。

次に、照合ベクトル一致度判定部８２５は、入力照合ベクトル蓄積バッファ８２５から読み出した入力照合ベクトルテーブル９２５と辞書照合ベクトルテーブルＤ１１の内積値Ｗを算出する（Ｓ１５０７）。そして、入力照合ベクトルテーブル１０１と辞書照合ベクトルテーブルＤ１１との一致度が所定閾値（ＭｉｎＤ、ＭｉｎＩ）を超えるか否かにより、入力文字の認識結果候補として辞書登録文字ＣＨｉを選択するか否かを判定する。選択した場合には、当該辞書登録文字ＣＨｉに関してステップＳ１５１０の類似度計算が行なわれる。照合ベクトル一致度判定部８２５は、具体的には、内積値Ｗの総数Ｓｄに対する比Ｗ／Ｓｄを求めて、比Ｗ／Ｓｄが閾値データＤ３１の値（閾値ＭｉｎＤに相当）を比較し、比較結果に基づき（Ｗ／Ｓｄ＞ＭｉｎＤ）が成立すると判定されると（Ｓ１５０８で‘Ｙ’）次の判断処理（Ｓ１５０９）に進むが、成立すると判定されないと（Ｓ１５０８の‘Ｎ’）、入力特徴ベクトル１００は、この辞書特徴ベクトルＶＴ１とは全く類似しないと判断する。その場合には、第１ベクトル類似度算出部８２７による類似度計算（Ｓ１５１０）は行なわれず、カウントｉの値を１インクリメントして次の辞書登録文字ＣＨｉを指示するようにして（Ｓ１５０８）、ステップＳ１５０５の処理に戻り、指示された次の辞書登録文字ＣＨｉについてＳ１５０６以降の処理が同様に行なわれる。

一方、照合ベクトル一致度判定部８２５は（Ｗ／Ｓｄ＞ＭｉｎＤ）が成立すると判定すると（Ｓ１５０８の‘Ｙ’）、内積Ｗの総数ＳＩに対する比Ｗ／ＳＩを求めて、比Ｗ／ＳＩが閾値データＤ３２の値（閾値ＭｉｎＩに相当）を比較し、比較結果に基づき（Ｗ／ＳＩ＞ＭｉｎＩ）が成立すると判定すると（Ｓ１５０９で‘Ｙ’）、類似度計算が行なわれる（Ｓ１５１０）。（Ｗ／ＳＩ＞ＭｉｎＩ）が成立しないと判定すると（Ｓ１５０９で‘Ｎ’）、入力特徴ベクトル１００は、現在の辞書特徴ベクトルＶＴ１とはまったく類似しないと判断する。その場合には、類似度計算（Ｓ１５１０）は行なわれず、次の辞書登録文字ＣＨｉを指示するようにカウンタｉの値を１インクリメントして（Ｓ１５０８ａ）、対応の特徴ベクトルＶＴ１について、ステップＳ１５０５以降の処理が同様に行なわれる。

以上の処理は、Ｓ１５０５の条件が成立すると判定されるまで（Ｓ１５０５でＮ）、すなわち辞書データ８１１の辞書登録文字ＣＨｉのすべてについて行なわれる。したがって、辞書データ８１１のｎ個の辞書登録文字ＣＨｉのうち、その辞書特徴ベクトルＶＴ１についてＳ１５０８およびＳ１５０９の条件が成立したｘ個の辞書登録文字ＣＨｉについてのみ類似度計算（Ｓ１５１０）が行なわれる。

第１ベクトル類似度算出部８２７は、ｘ個の辞書登録文字ＣＨｉそれぞれの第１特徴ベクトルＶＴ１と入力照合ベクトル１０１との類似度を前述した手順に従い算出する。ここでは算出された類似度は、ｘ個の類似度Ｒ１、Ｒ２、Ｒ３、・・・、Ｒｘとして、辞書データ８１１の対応の辞書登録文字ＣＨｉとポインタなどで関連付けされてメモリ８１４に格納される。

その後、パターンマッチング部８２１は、メモリ８１４のｘ個の類似度Ｒ１、Ｒ２、Ｒ３、・・・，Ｒｘをソートし（Ｓ１５１１）、ソート結果に基づき、大きい方から上位Ｐ個の類似度に対応の辞書登録文字ＣＨｉを辞書データ８１４から読出し、さらに詳細類似度算出部８２８により詳細マッチングを行なう（Ｓ１５１２）。詳細マッチングの結果に基づき、認識結果候補文字が出力部８０２などに出力される（Ｓ１５１３）。

本実施の形態では、詳細マッチング（Ｓ１５１２）はたとえば次のように行なわれる。つまり、詳細類似度算出部８２８は、上位Ｐ個の類似度に対応の辞書登録文字ＣＨｉそれぞれについて第２辞書特徴ベクトルＶＴ２〜第ｍ辞書特徴ベクトルＶＴｍについて類似度の演算を行なう。つまり、Ｐ個の辞書登録文字ＣＨｉのそれぞれについて、当該辞書登録文字ＣＨｉに対応の第２辞書特徴ベクトルＶＴ２〜第ｍ辞書特徴ベクトルＶＴｍのそれぞれと入力特徴ベクトル１０１との類似度を算出する。類似度の算出は、前述した式２に従う類似度Ｓの算出を指す。Ｐ個の辞書登録文字ＣＨｉのそれぞれについて、辞書特徴ベクトルそれぞれについて算出された類似度の総和が算出される。そして、Ｐ個の辞書登録文字ＣＨｉのうち、対応の類似度の総和が大きい順に従い辞書登録文字ＣＨｉを選択して、選択した辞書登録文字ＣＨｉを認識結果を指す候補として、辞書データ８１１から読み出し、出力部８０２に与える。これにより、ステップＳ１５１３では、出力部８０２は、入力した認識結果候補の辞書登録文字ＣＨｉが指す文字コードに基づき文字を表示する。

したがって、詳細類似度算出部８２８は、入力パターン（入力特徴ベクトル１０１）と、前述の第１ベクトル類似度算出部８２７による照合の結果に基づき入力特徴ベクトル１０１と一致すると判定された辞書特徴ベクトルＶＴ１に対応の辞書パターン（第２辞書特徴ベクトルＶＴ２〜第ｍ辞書特徴ベクトルＶＴｍ）のみとの間でパターンマッチングを行なう。

ここでは、照合ベクトル一致度判定部８２４は、辞書登録文字ＣＨｉ毎に設定された２つの閾値データＤ３ｊとＤ４ｊを用いて判定を行なっているが、０．５などの固定値でもよい。

図１４の処理では一致度判定閾値データＤ３ｊとＤ４ｊを学習データから算出された値のうちの最小値としているので、辞書登録文字ＣＨｉとして入力が想定される文字パターンのすべてを網羅することが可能となる。したがって、図１４のパターンマッチング処理では類似度計算（第１辞書ベクトルとの類似度計算）と詳細マッチング（第２辞書ベクトルとの類似度計算）（Ｓ１５１０とＳ１５１２）を誤ってスキップしてしまうことはないから、パターンマッチング処理の結果について高い精度を持つことができる。

ただし、精度が要求されない場合など、最小値をとる必要がない場合は、調整し、高い値にすることも可能である。たとえば、高速性を優先する場合には、必ずしも最小値をとる必要はない。

（マッチング処理の他の例）
図１５は、図１４のマッチング部の処理に濃淡判定部８２２のための処理（Ｓ１６０４、Ｓ１６０９）が加わった場合の処理手順を示す。図１５のＳ１６０４とＳ１６０９を除く他の処理は図１４で説明したものと同じであるから、詳細説明を略する。

濃淡判定部８２２の処理のために濃淡フラグｆｌａｇが参照される。濃淡フラグｆｌａｇの設定手順を、図１６を参照して説明する。

濃淡判定部８２２は、図１６に示すように濃淡判定を行なう。まず、入力照合ベクトルテーブル１０１の値‘１’の成分の総数ＳＩと濃淡フラグｆｌａｇの値を入力する。このとき濃淡フラグｆｌａｇは‘０’として入力される（Ｓ１７０１）。次に、濃淡判定部８２２は、予め定められた閾値Ｔと総数ＳＩの値とを比較して、比較結果に基づき（ＳＩ＞Ｔ）の条件が成立しているか否かを判定する（Ｓ１７０２）。条件成立と判定されると、すなわち総数ＳＩは閾値Ｔより大きいと判定されると（Ｓ１７０２で‘Ｙ’）、濃淡フラグｆｌａｇに‘１’がセットされるが（Ｓ１７０３）、成立しないと判定されると（Ｓ１７０２で‘Ｎ’）濃淡フラグｆｌａｇの値は‘０’のままである。これにより、濃淡判定部８２２の処理は終了する。つまり、濃淡判定部８２２により、入力文字パターンに黒画素が多い場合には濃淡フラグｆｌａｇに‘１’がセットされる。

濃淡判定では、処理対象の入力特徴ベクトルの基になった画像が、黒っぽいか白っぽいかの判定をさすから、ベクトルの成分の総数（６４個）のうちの３分の１程度から２分の１程度（２０から３０）の値を、閾値Ｔとして用いることが好ましい。

なお、濃淡判定は、図１６のように入力照合ベクトルテーブル１０１の値‘１’の成分の総数ＳＩに基づき行なってもよいし、入力特徴ベクトル１００の成分の値に基づき行なってもよい。入力照合ベクトルテーブル１０１を介さず入力特徴ベクトルに基づき濃淡判定を行なえば、入力照合ベクトルテーブル作成時の閾値とは別の閾値で、判定を行なうことができる。

図１５を参照して、ステップＳ１５０１〜Ｓ１５０３の処理が図１４と同様に行なわれる。次に、濃淡判定部８２２により、Ｓ１５０３で算出した総数ＳＩを用いて図１６で示したように濃淡フラグｆｌａｇに値が設定される（Ｓ１６０４）。次に、Ｓ１５０５〜Ｓ１５０７の処理が図１４と同様に行なわれる。

次に、濃淡フラグｆｌａｇの値が‘１’を指すか否かを判定する（Ｓ１６０９）。濃淡フラグｆｌａｇが‘１’を指すと判定すると（Ｓ１６０９で‘Ｙ’）、一致度判定閾値ＭｉｎＩに基づく判断を行ない（Ｓ１５０９）、濃淡フラグｆｌａｇが‘０’を指すと判定すると（Ｓ１６０９で‘Ｎ’）、一致度判定閾値ＭｉｎＤに基づく判断を行なう（Ｓ１５０８）。その後は、図１４と同様に処理が行なわれる。

図１５の処理手順に従うと次のメリットが得られる。つまり、図１４の手順では、類似度計算（Ｓ１５１１）をするかしないかの判断を一致度判定閾値ＭｉｎＤとＭｉｎＩの２つの閾値のみに基づき行なっているために、入力パターンの内容にかかわらず閾値ＭｉｎＤを用いた比較処理（Ｓ１５０８）は必ず行なわれる。一方、図１５のように濃淡判定部８２２を用いる場合は、濃い画素（文字領域）の多い入力パターンほど、すなわち総数ＳＩの値が大きい入力パターンほど、ステップＳ１５０９の判定処理により類似度計算（Ｓ１５１０）の対象から外される可能性が高い。このことに着目して、図１５の手順では、濃淡フラグｆｌａｇにより、ステップＳ１５０８の閾値ＭｉｎＤを用いた判定処理をスキップして、Ｓ１５０９の閾値ＭｉｎＩを用いた判定処理のみをすることができる。したがって、図１４の手順に比較して処理を高速に行なうことが可能となる。

（実施の形態２）
次に実施の形態２について説明する。

実施の形態１で説明した処理機能を有したシステムは、プログラムで実現される。本実施の形態２では、このプログラムはコンピュータで読取可能な記録媒体に格納される。

本実施の形態２では、この記録媒体として、図２に示されているコンピュータで処理が行なわれるために必要なメモリ、たとえばメモリ６２４のようなそのものがプログラムメディアであってもよいし、また外部記憶装置として磁気テープ装置およびＣＤ−ＲＯＭ駆動装置６４０などのプログラム読取装置が設けられ、そこに記憶媒体である磁気テープまたはＣＤ−ＲＯＭ６４２が挿入されることで読取可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはＣＰＵ６２２がアクセスして実行させる構成であってよい。

ここで、上述したプログラムメディアはコンピュータ本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープなどのテープ系、ＦＤ６３２や固定ディスク６２６などの磁気ディスクやＣＤ−ＲＯＭ６４２／ＭＯ（Magnetic Optical Disc）／ＭＤ（Mini Disc）／ＤＶＤ（Digital Versatile Disc）などの光ディスクのディスク系、ＩＣカード（メモリカードを含む）／光カードなどのカード系、あるいはマスクＲＯＭ、ＥＰＲＯＭ（Erasable and Programmable ＲＯＭ）、ＥＥＰＲＯＭ(Electrically ＥＰＲＯＭ)、フラッシュＲＯＭなどによる半導体メモリを含めた固定的なプログラムを担持する媒体であってもよい。

また、本実施の形態においては、コンピュータはインターネットを含む通信ネットワーク３００と通信インターフェイス６８０を介して接続可能な構成が採用されているから、これら通信ネットワークからプログラムがダウンロードされるよ流動的にプログラムを担持する媒体であってもよい。

なお、一般的傾向として、コンピュータのオペレーティングシステムの一部として様々なプログラムモジュールを用意しておき、アプリケーションプログラムはこれらモジュールを所定の配列で必要なときに呼出して処理を進める方式が一般的である。そうした場合、当該パターン認識装置を実現するためのソフトウェア自体にはそうしたモジュールは含まれず、図２のコンピュータでオペレーティングシステムと協働してはじめてパターン認識装置が実現することになる。しかし、一般的なプラットホームを使用する限り、そうしたモジュールを含ませたソフトウェアを流通させる必要はなく、それらモジュールを含まないソフトウェア自体およびそれらソフトウェアを記録した記録媒体（およびそれらソフトウェアがネットワーク上を流通する場合のデータ信号）が実施の形態を構成すると考えることができる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

本発明は、画像のパターン認識機能を有する各種の装置に適用可能である。したがって、文字を識別するＯＣＲの他にも、顔画像、指紋、印鑑などによる認証装置や、その他画像のパターン認識機能を有するあらゆる装置において利用可能である。

本実施の形態に係る文字認識装置の要部の機能構成図である。本実施の形態に係る文字認識装置が搭載されるコンピュータの構成図である。本実施の形態に係る概略処理フローチャートである。特徴抽出部の処理フローチャートである。本実施の形態に係るメッシュ状の領域を示す図である。照合ベクトル抽出部８２３の処理を示す図である。入力照合ベクトル蓄積バッファの内容例を示す図である。辞書照合ベクトル蓄積バッファの概略的な内容例を示す図である。辞書照合ベクトル蓄積バッファの具体的内容例を示す図である。（Ａ）〜（Ｈ）は、照合ベクトル一致度判定部の処理手順を模式的に示す図である。（Ａ）〜（Ｈ）は、閾値作成部の処理手順を模式的に示す図である。閾値作成の処理フローチャートである。照合ベクトル抽出部により使用されるテーブルの一例を示す図である。パターンマッチング部の処理手順の一例を示す図である。パターンマッチング部の処理手順の他の例を示す図である。濃淡判定処理の手順を示す図である。入力文字画像の例を示す図である。入力文字画像をメッシュ分割した状態を示す図である。特徴ベクトルの各成分を示す図である。従来および本実施の形態に適用される辞書データを示す図である。従来の処理手順の一例を示す図である。従来の閾値テーブルを示す図である。従来の処理手順の他の例を示す図である。

符号の説明

１文字認識装置、８０５特徴抽出部、８１１辞書データ、８１３辞書照合ベクトル蓄積バッファ、８２１パターンマッチング部、８２２濃淡判定部、８２３照合ベクトル抽出部、８２４照合ベクトル一致度判定部、８２５入力照合ベクトル蓄積バッファ、８２６閾値作成部、８２７第１ベクトル類似度算出部、８２８詳細類似度算出部。

この発明のある局面に係るパターン認識装置は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成手段と、辞書照合ベクトル格納手段から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、所定閾値より大きい一致度が算出された辞書照合ベクトルと、入力照合ベクトルとの照合をする照合手段と、を備える。そして、入力パターンと、照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なう。

好ましくは、所定閾値は、辞書照合ベクトル格納手段において辞書照合ベクトル毎に予め格納されている。

この発明の他の局面に係るパターン認識方法は、複数の辞書パターンを格納した辞書部と、複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備えるコンピュータを用いたパターン認識方法であって、入力パターンに基づき、当該入力パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、辞書照合ベクトル格納部から読出された辞書照合ベクトルそれぞれと、入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、所定閾値より大きい前記一致度が算出された辞書照合ベクトルと、入力照合ベクトルとの照合をする照合ステップと、入力パターンと、前述の照合の結果に基づき入力照合ベクトルと一致すると判定された辞書照合ベクトルに対応の辞書パターンのみとの間でパターンマッチングを行なうステップとを備える。

Claims

複数の辞書パターンを格納した辞書部と、
前記複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納手段と、
入力パターンに基づき、当該入力パターンの特徴を示す前記所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成手段と、
前記辞書照合ベクトル格納手段から読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定手段と、
所定閾値より大きい前記一致度が算出された前記辞書特徴ベクトルと、前記入力照合ベクトルとの照合をする照合手段と、を備え、
前記入力パターンと、前記照合の結果に基づき前記入力照合ベクトルと一致すると判定された前記辞書照合ベクトルに対応の前記辞書パターンのみとの間で、パターンマッチングを行なう、パターン認識装置。
前記所定閾値は、前記辞書照合ベクトル格納手段において前記辞書特徴ベクトル毎に予め格納されている、請求項１に記載のパターン認識装置。
前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの１を指す成分の総数に対する割合を指示する、請求項１または２に記載のパターン認識装置。
前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記辞書照合ベクトルの１を指す成分の総数に対する割合を指示する、請求項１から３のいずれか１項に記載のパターン認識装置。
前記特徴は画像の濃淡を指示する、請求項１から４のいずれか１項に記載のパターン認装置。
前記特徴は画像の濃淡を指示し、前記成分は濃淡を１と０により指示し、
前記入力照合ベクトルの１を指す成分の総数が予め設定した数値より大きいときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記入力照合ベクトルの１を指す成分の総数に対する割合を指示する、請求項１または２に記載のパターン認識装置。
前記特徴は画像の濃淡を指示し、前記成分は濃淡を１と０により指示し、
前記入力照合ベクトルの１を指す成分の総数が予め設定した数値以下のときは、前記一致度は、前記辞書照合ベクトルと前記入力照合ベクトルとの前記内積の値の前記辞書照合ベクトルの１を指す成分の総数に対する割合を指示する、請求項１、２および６のいずれかに記載のパターン認識装置。
複数の辞書パターンを格納した辞書部と、前記複数辞書パターンのそれぞれに対応して、当該辞書パターンの特徴を示す所定個数の成分からなり、各成分は１または０を指す辞書照合ベクトルを格納する辞書照合ベクトル格納部と、を備える情報処理装置を用いたパターン認識方法であって、
入力パターンに基づき、当該入力パターンの特徴を示す前記所定個数の成分からなり、各成分は１または０を指す入力照合ベクトルを生成する照合ベクトル生成ステップと、
前記辞書照合ベクトル格納部から読出された前記辞書照合ベクトルそれぞれと、前記入力照合ベクトルとの内積に基づく一致度を算出するベクトル一致度判定ステップと、
所定閾値より大きい前記一致度が算出された前記辞書特徴ベクトルと、前記入力照合ベクトルとの照合をする照合ステップと、
前記入力パターンと、前記照合の結果に基づき前記入力照合ベクトルと一致すると判定された前記辞書照合ベクトルに対応の前記辞書パターンのみとの間でパターンマッチングを行なうステップとを備える、パターン認識方法。
請求項８に記載のパターン認識方法をコンピュータに実行させるためのパターン認識プログラム。
請求項８に記載のパターン認識方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。