JP5020513B2

JP5020513B2 - パターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体

Info

Publication number: JP5020513B2
Application number: JP2006004135A
Authority: JP
Inventors: みな子桑田; 至幸小山
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2006-01-11
Filing date: 2006-01-11
Publication date: 2012-09-05
Anticipated expiration: 2026-01-11
Also published as: JP2007188190A

Description

本発明は、認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体に関する。

従来、光学式文字読取装置（以下ＯＣＲと略す）などの文字認識装置において、パターンマッチングにより文字認識を行う方法が広く用いられている。パターンマッチングは、入力文字画像から特徴ベクトルを抽出し（入力文字画像から抽出された特徴ベクトルのことを、特に、入力特徴ベクトルと呼称する）、予め各文字に対して用意されている標準的な特徴ベクトル（以下辞書特徴ベクトルと呼称する）との照合処理を行い、最もパターンが近いと判断された辞書特徴ベクトルに対応した文字を認識結果として決定するものである。

ここで、特徴ベクトルについてメッシュ特徴ベクトルを例として説明を行う。図１７（ａ）は、特徴ベクトルを抽出するために矩形に切り取られた文字画像の例を表す図である。上記文字画像に対しメッシュ分割を行い、メッシュで分割された各領域の画素数を元に正規化等の処理を行って算出した値を成分とするベクトルを、メッシュ特徴ベクトルと呼ぶ。

図１７（ｂ）は、図１７（ａ）の文字画像を、縦横８×８の領域にメッシュ分割した様子を表す図である。図１８は、図１７（ｂ）のメッシュ分割の結果抽出されるメッシュ特徴ベクトルの各成分を、上記分割された各領域に示した図である。図１８の例ではメッシュ特徴ベクトルの成分の数は６４（８×８）であり、一文字がこれら６４の成分からなる特徴ベクトルにより規定される。

次に、辞書特徴ベクトルについて、より詳しく説明を行う。上述の通り、辞書特徴ベクトルは、パターンマッチングの照合処理の基準として、予め用意されている標準的な特徴ベクトルである。そのため、辞書特徴ベクトルは、あるカテゴリー（たとえばある一文字）について収集された複数のサンプルデータについて、それぞれ特徴ベクトルが抽出され、それらに対し統計処理を行うことにより作成される。

辞書特徴ベクトルはカテゴリーごとに登録され、辞書を構成する。図１９は、辞書の構成例の一つを表す図である。図１９に示されている辞書は、辞書カテゴリー１から辞書カテゴリーＮまでのＮ個のカテゴリーから成る。さらに、１つのカテゴリー（たとえばある１文字）は、第１特徴ベクトルから第Ｚ特徴ベクトルまでのＺ個の特徴ベクトルで構成されている。

特徴ベクトルを用いたマッチング演算は、シティーブロック距離や、ユークリッド距離、類似度等を用いて行われる。入力された文字とマッチング対象となる辞書登録された文字が、それぞれ、図１８に示すような縦横８×８にメッシュ分割した６４成分からなる特徴ベクトルにより規定される場合を例として、シティーブロック距離及び類似度の算出式をそれぞれ数１、数２に示す。

入力された文字の入力特徴ベクトルをＸ（Ｘ１、Ｘ２・・・Ｘ６４の６４成分）、マッチング対象となる辞書登録された文字の辞書特徴ベクトルをＹ（Ｙ１、Ｙ２・・・Ｙ６４の６４成分）とすると、シティーブロック距離Ｄは次の計算式で求められる。

また、単純類似度Ｓは次の計算式で求められる。

上述したとおり、パターンマッチングは入力文字画像から抽出された入力特徴ベクトルと予め登録されている辞書特徴ベクトルとのマッチング処理により行われるが、このマッチング処理は時間を要するため、従来から、この時間を短縮するための方法が提案されてきた。

特許文献１では、文字認識装置において、読み取った文字の特徴量（上記特徴ベクトルの各成分に相当）と標準文字の特徴量（上記辞書特徴ベクトルの各成分に相当）との差を累積加算する演算を実行し、累積加算された値が設定された閾値を超えた場合、実行中の標準文字に関する累積加算の演算を終了し、次の標準文字に関して上記演算を開始することにより、マッチング時間を短縮する方法が開示されている。

また、従来技術においては、マッチング処理は、まず辞書の第１特徴ベクトルとのマッチング距離が近いものから上位Ｐ個を抽出し、抽出されたＰ個については、さらに詳細に識別するために第２特徴ベクトルから第Ｚ特徴ベクトルまでマッチングを行う。

次に、図２０を用いて、ＯＣＲなどの文字認識装置において従来用いられてきたパターンマッチング高速化手法の処理フローについて説明を行う。以下の説明では、マッチングは、メッシュ特徴ベクトルを用いて行われるものとする。

はじめに、マッチング処理の概要について説明する。図２０に示す従来のマッチング処理の例では、まず、入力文字とすべての辞書登録文字との距離が算出される。つまり、入力文字画像から抽出された入力特徴ベクトルと辞書に登録されているすべての文字の辞書特徴ベクトルとの距離（たとえばシティーブロック距離）が算出される。算出された距離は値が小さいほど誤差が少なくパターンが近いといえる。

図２０の例では、上記距離は、シティーブロック距離の算出式の数１に示されるような、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算する演算により算出される。ここで、上記累積加算は、各特徴ベクトルのすべての成分について行われる訳ではなく、上記累積加算の対象とする特徴ベクトルの成分の数（図２０においてはＹ）が予め設定されている。つまり、上記累積加算は、上記予め設定された回数（ここではＹ回）のみ実行されることになる。

すべての文字について距離算出が終了すると、算出された距離が小さいものから上位Ｐ個の辞書登録文字を候補文字とする。以降は、上記候補文字Ｐ個についてのみ詳細マッチングを行うが、最初に実行するすべての文字に対するマッチング処理と同様に、ここでも累積加算の演算を行う。ただし、ここでは詳細にマッチングを行うため実行される累積加算回数は、すべての文字に対するマッチング処理時の累積加算の回数（ここではＹ回）より増加させることになる。また、詳細マッチングでは、辞書の第１特徴ベクトルとの距離演算だけでなく、第２特徴ベクトルから第Ｚ特徴ベクトルまでのすべての辞書特徴ベクトルとの距離演算が行われる。

それでは、図２０のフローについての詳細な説明を行う。まず、文字画像が入力され（Ｓ２００１）、入力された文字画像の切り出しが行われる（Ｓ２００２）。入力された文字画像はメッシュ分割され、各領域の画素数に基づき正規化等の処理が行われ入力特徴ベクトルが抽出される（Ｓ２００３）。

入力特徴ベクトルが抽出されると、マッチング処理が開始される。処理概要で説明したとおり、はじめにすべての文字について距離の算出が行われるため、すべての文字について、マッチングが行われたか否かについての判定を行う必要がある。そして上記の判定を行うためには、現在までに距離の算出が行われた文字数をカウントしておく必要がある。

そのため、上記カウント用の変数としてマッチング辞書カウンタｊが用意されており、はじめにこれを初期化（ｊに０を設定）しておく（Ｓ２００４）。また、図２０の例においては、辞書に登録されているすべての文字数をＮとする。

次に、すべての文字について、１文字づつ繰り返し距離が算出されることになるが、新たな文字についての距離が算出される前には毎回、すべての文字について距離算出が終了したか否かの終了判定を行う（Ｓ２００５）。ここで、すべての文字について距離算出が終了していない場合（ｊ＜Ｎの場合）、入力文字と辞書登録された文字との距離算出の演算が開始される。

距離算出の演算は、処理概要で説明したとおり、予め設定された回数（ここではＹ回）の累積加算の演算が実行されるため、現在何回目の累積加算を実行したかをカウントしておく必要がある。そのため、上記累積加算の回数をカウントするための変数として、マッチング要素カウンタｉが用意されている。また、距離算出のための累積加算用の変数としてＤｊが用意され、これらを初期化（ｉ及びＤｊに０を設定）しておく（Ｓ２００６）。

累積加算が実行される前には毎回、累積加算の回数が予め設定された回数（ここではＹ回）を超えてないかの判定が行われる（Ｓ２００７）。ここで、累積加算回数が予め設定された回数を超えていない間（ｉ＜Ｙ）、Ｄｊに入力特徴ベクトルと辞書特徴ベクトルの成分の差が累積加算され（Ｓ２００８）、累積加算回数のカウント用変数ｉがインクリメントされる（Ｓ２００９）という一連の処理が繰り返される。

上記繰り返し処理中に、累積加算回数についての判定ステップＳ２００７で、累積加算の回数が予め設定された回数を超えた場合（ｉ＜Ｙでない場合）、現在マッチング対象としている文字についての距離算出は終了する。

その後、マッチング辞書カウンタｊをインクリメントして（Ｓ２０１０）、現在までに距離の算出が終了した文字数をカウントする。そして、すべての文字についてマッチングが終了したか否かの終了判定ステップＳ２００５に進む。すべての文字についてのマッチングが終了した場合（ｊ＜Ｎでないの場合）には、距離の算出結果が格納されているＤ０からＤｎについてソートする（Ｓ２０１１）。

以降は、上記抽出された上位Ｐ個の文字について詳細マッチングを行い（Ｓ２０１２）、その結果、最も入力された文字とパターンが近いと判定された文字をマッチング結果として出力し（Ｓ２０１３）、処理を終了する。

以上、図２０を用いて、従来のパターンマッチング高速化手法の処理フローについて一例を示した。図２０の例では、入力された文字に対して、辞書に登録されているすべての文字とマッチングを行うが、各文字のマッチング処理で実行される入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算する処理について、予め累積加算する成分の数（累積加算の実行回数に相当）を設定し、各特徴ベクトルのすべての要素を累積加算の対象とはしないことにより（各特徴ベクトルの一部の要素のみ累積加算の対象とすることにより）、高速化を図っていた。

また、図２０の処理フローにより説明した方法と比較し、さらなる高速化を図るため、距離算出の演算について閾値によるスキップ処理を導入する方法も提案されてきた。

図２１は、上記閾値によるスキップ処理を行う際に使用される閾値テーブル２１０１の例である。図２１には、閾値テーブル２１０１と辞書２１０２との関係についても示されている。閾値テーブル２１０１は、辞書２１０２を構成している各カテゴリー（たとえば、文字）に対応した閾値が集まって構成されている。たとえば、判定閾値Ｔｎは、辞書のカテゴリーＮに対応する閾値である。各判定閾値は学習データにより統計的に計算された値であり、たとえば辞書のカテゴリーＮに登録されている辞書特徴ベクトルとカテゴリーＮについての任意の入力特徴ベクトルとの距離は、必ず判定閾値Ｔｎの範囲内であることが保障されている。

入力文字と辞書登録されている文字との距離の算出は、入力特徴ベクトルと辞書特徴ベクトルの成分の差を累積加算することによって行われるが、辞書登録されている文字ごとにそれぞれ距離の閾値が設けられていることによって、累積加算により算出された値が、上記設定されている閾値以下の間のみ、さらに下位要素についてまでの累積加算演算を続行し、上記設けられている閾値を上回った場合、演算を打ち切るような処理を行わせることが可能となる。

図２２は、閾値により距離算出の演算をスキップするパターンマッチングのフローチャートである。図２２のステップＳ２２０１からステップＳ２２０８は、図２０のステップＳ２００１からステップＳ２００８と同様の処理内容であり説明は省略する。

距離算出においては、図２０の処理と同様に入力された文字の入力特徴ベクトルと辞書登録されている文字の辞書特徴ベクトルの各要素（成分）の差を累積加算する演算が実行されることになる。

前述したとおり、図２２の処理においては、累積加算により算出された距離が、辞書のカテゴリー（たとえば文字）ごとにそれぞれ設けられている閾値以下の間のみ、さらに下位要素についてまでの累積加算の演算を続行し、上記設けられている閾値を上回った場合、累積演算を打ち切り、現在対象としている文字についての距離が確定され、次の文字についての距離算出へと処理が移ることになる。

そこで、ステップＳ２２０９では、現在対象としている文字について、累積加算により算出された距離が、閾値テーブル２１０１に格納されている判定閾値以下であるか否かの判定が行われることになる。この判定において、距離が判定閾値以下であった（Ｄｊ＜Ｔｊ）場合には、ステップＳ２２１０に移行しマッチング要素カウンタｉがインクリメントされ、そのまま距離算出の演算が続行される。

また、距離が判定閾値を上回る（Ｄｊ＜Ｔｊでない）場合には、現在対象としている文字についての距離は確定され、ステップＳ２２１１にて距離変数Ｄｊに、算出された距離の最大値が格納され、ステップＳ２２１２にてマッチング辞書カウンタｊをインクリメントし、次の文字の距離計算に処理を移す。

以降のステップＳ２２１３からステップＳ２２１５は、図２０のステップＳ２０１１からステップＳ２０１３と同様の処理内容であり説明は省略する。以上が、閾値によるスキップ処理を導入しパターンマッチングを高速化させる手法の従来例である。

また、特許文献２では、文字認識方式において、特徴ベクトルの要素数に依存して累積加算の演算が増加し、それに伴いマッチング処理が長時間化する問題に対し、文字識別効果の大きい辞書特徴ベクトルの成分と、上記効果がそれほど顕著でない辞書特徴ベクトルの成分とがあることを利用したマッチング処理の高速化手法について開示されている。

具体的には、全文字種の辞書特徴ベクトルの成分を、標準偏差または分散の大きい順に並べ替えて、辞書特徴ベクトルとして登録している。一方、入力文字は入力特徴ベクトルが抽出されると、入力特徴ベクトルの各成分が並べ替え部にて並べ替えテーブルの情報に従って標準偏差または分散の大きい順に並べ替えられ、距離演算が行われる。

つまり、各文字の特徴ベクトルの成分（特徴量）を文字識別効果の高い成分から優先的に累積加算されるように、並べ替えを行っておくことにより、より高速なマッチング処理を実現するというものである。

以上のとおり、従来の文字認識装置において、距離演算回数が少なくなるような各種の方法を用いることにより、パターンマッチングの高速化が実現されてきた。
特開平０２−４４４８８号公報（１９９０年２月１４日公開）特開昭６３−１０９５９２号公報（１９８８年５月１４日公開）

上記従来技術の距離を使用するマッチング手法においては、距離算出の累積加算は、必ずしも特徴ベクトルのすべての成分について上記累積加算の対象とする必要はなかった。しかしながら、類似度を用いたマッチングを行う場合は、算出された類似度が最大のものをマッチング結果とするため、特徴ベクトルの一部の要素のみを累積加算の対象とすることはマッチングの精度を考慮すると好ましくなかった。

つまり、上記距離を使用するマッチング処理においては、あらかじめ累積加算の対象とする特徴ベクトルの要素数を設定しておくことや、閾値を設定することにより累積加算を打ち切りなどの高速化手法を適用できたが、類似度を用いたマッチング処理に対して上記高速化手法を適用することは困難であった。

したがって、従来、類似度を用いてマッチングを行う場合は、図１８のメッシュ特徴ベクトルの場合を例に挙げると、１つの特徴ベクトルの要素数は６４（８×８）であり、１つのカテゴリー（たとえばある１文字）について距離を求める場合６４回の演算が必要となる。

これでは、日本語のように文字数が多い言語においては、カテゴリー数が３０００以上にもなり、少なくとも１９２０００（６４×３０００）回の演算を行わなくてはならなかった。さらに、１つのカテゴリーの辞書特徴ベクトルが複数の特徴ベクトルから成る場合、詳細マッチングにおいては、さらに多くの演算が必要であった。さらに、類似度演算は積和によるため加算のみで実現可能な距離演算に比べ、１回の演算に要する時間のコストが高かった。

そのため、類似度を用いたマッチング処理においても、特徴ベクトルの要素の一部のみを累積加算の対象とする手法や、閾値を設定し距離演算を途中で打ち切る手法を導入できるようにしたいという要求があった。

また、特許文献２において示されている特徴ベクトルの要素の文字識別効果を基準にした並び替えは、統計的な手法によるものであり、入力特徴ベクトルの特性により並び替えを行っているものではなかった。したがって、入力された文字が「／」のように特徴ベクトルの成分に０が多く（文字画像の画素が存在しないメッシュ分割領域が多く）、入力特徴ベクトルの要素の値に非常に偏りがあるような場合には、高速化の効果が薄いという問題点もあった。

本発明は、識別対象パターンをより高速に認識できるパターン認識装置、パターン認識方法、パターン認識プログラム、および記録媒体を提供することを目的とする。

本発明に係るパターン認識装置は、上記問題を解決するために、
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識手段とを備えていることを特徴としている。

上記の構成によれば、本発明に係るパターン認識装置は、認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置である。まず、上位成分抽出手段が、前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する。そして、乗算値算出手段が、前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する（すなわち、前記上位成分に方向が一致する）前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する。さらに、上位成分類似度算出手段が、前記上位成分について算出された前記乗算値のみを加算することによって（すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって）、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する。最後に、パターン認識手段が、前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識する。

以上のように、パターン認識装置は、入力特徴ベクトルを構成する成分のうち、値の大きな成分を、上位成分類似度を算出する演算の対象として優先的に使用する。すなわち、値の小さい成分を、上位成分類似度を算出する演算の対象から外す。このような演算方式に基づいても、パターン認識装置が算出する上位成分類似度は、各辞書パターンと認識対象パターンとの正確な類似度を十分に反映したものとなる。すなわち、パターン認識装置が算出する上位成分類似度の精度は、入力特徴ベクトルを構成するすべての成分を前記演算の対象として算出される類似度の精度と、同等になる。したがって、パターン認識装置は、認識対象パターンがどの辞書パターンにマッチングするのかを、算出した上位成分類似度に基づき正確に照合できる。

このようにパターン認識装置は、認識対象パターンを正確に認識するための判定根拠となる上位成分類似度を、限られたベクトル成分を使って算出する。これにより、パターン同士をより少ない計算量によって照合できるため、結果的に、より少ない計算量によって、認識対象パターンをある辞書パターンとして認識できる。これによりパターン認識装置は、識別対象パターンをより高速に認識できる効果を奏する。

本発明に係るパターン認識方法は、上記の課題を解決するために、
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置が実行するパターン認識方法であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出ステップと、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出ステップと、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出ステップと、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識ステップとを含んでいることを特徴としている。

上記の構成によれば、上述したパターン認識装置と同様の作用効果を奏する。

また、本発明に係るパターン認識装置では、さらに、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することが好ましい。

上記の構成によれば、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。そして、下位成分抽出手段が、前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する。次に、下位成分乗算値算出手段が、前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する（すなわち、前記上位成分に方向が一致する）前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出し、下位成分加算値算出手段が、前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する。さらに、全成分類似度算出手段が、前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する。最後に、前記パターン認識手段が、前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識する。

以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた数の候補パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際に用いる上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについては、候補パターンを絞り込む際に対象としなかった入力特徴ベクトルの成分について、全成分類似度を算出する演算の対象とする。つまり、入力特徴ベクトルを構成するすべての成分を用いることによって、上位成分類似度よりも高精度な全成分類似度を算出することになる。したがって、パターン認識装置は、認識対象パターンを、候補パターンとの高精度な全成分類似度に基づく照合により、正確に認識できる。

このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って上位成分類似度を算出することで、候補パターンの抽出を高速に行うことができる。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。

また、本発明に係るパターン認識装置では、さらに、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することが好ましい。

上記構成によれば、本発明に係るパターン認識装置は、互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されている。そして、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。次に、関連乗算値算出手段が、前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する（すなわち、前記上位成分に方向が一致する）前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する。さらに、関連上位成分類似度算出手段が、前記上位成分について算出された前記関連乗算値のみを加算することによって（すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって）、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する。そして、詳細類似度算出手段が、前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識する。

以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた数の候補パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについて、関連辞書特徴ベクトルを用いて、認識対象パターンとの、関連上位成分類似度を算出する。この関連上位成分類似度の算出においても、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、関連上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。パターン認識装置は、この関連上位成分類似度と、候補パターンを抽出する際に算出した上位成分類似度とを、候補パターンごとに加算して算出する高精度な詳細類似度に基づいて、認識対象パターンを照合する。

このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って上位成分類似度を算出することで、候補パターンの抽出を高速に行うことができる。さらに、高精度な詳細類似度を算出するための関連上位成分類似度を算出する際にも、限られたベクトル成分を使って関連上位成分類似度を算出する。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。

また、本発明に係るパターン認識装置では、さらに、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段とをさらに備え、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識することが好ましい。

上記構成によれば、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。そして、下位成分抽出手段が、前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する。次に、下位成分乗算値算出手段が、前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する（すなわち、前記上位成分に方向が一致する）前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出し、下位成分加算値算出手段が、前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する。さらに、全成分類似度算出手段が、前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識する。

以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについては、候補パターンを絞り込む際に対象としなかった入力特徴ベクトルの成分についても、全成分類似度を算出する演算の対象とする。つまり、入力特徴ベクトルを構成するすべての成分を用いることによって、上位成分類似度よりも高精度な全成分類似度を算出することになる。したがって、パターン認識装置は、認識対象パターンを、候補パターンとの高精度な全成分類似度に基づく照合により、正確に認識できる。

このように、パターン認識装置は、候補パターンを絞り込む際に、限られたベクトル成分を使って類似度を算出することで、候補パターンの抽出を高速に行うことができる。これにより、より精密にパターンマッチングを行いたい場合であっても、識別対象パターンをより高速に認識できる効果を奏する。

また、本発明に係るパターン認識装置は、さらに、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段とをさらに備えており、
前記パターン認識手段は、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識することが好ましい。

上記構成によれば、本発明に係るパターン認識装置は、互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されている。そして、まず、候補パターン抽出手段が、前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する。次に、関連乗算値算出手段が、前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する（すなわち、前記上位成分に方向が一致する）前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する。さらに、関連上位成分類似度算出手段が、前記上位成分について算出された前記関連乗算値のみを加算することによって（すなわち、前記上位成分ごとに算出された前記乗算値をすべて加算することによって）、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する。そして、詳細類似度算出手段が、前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する。最後に、前記パターン認識手段は、前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識する。

以上のように、パターン認識装置は、詳細なマッチングをする場合、まず、詳細なマッチングの対象となる候補パターンとして、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、すべての辞書パターンの中から絞り込む。この候補パターンを絞り込む際の上位成分類似度を算出する演算では、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。そして、前記上位成分類似度を算出する演算の結果に基づいて絞り込まれた候補パターンについて、関連辞書特徴ベクトルを用いて、認識対象パターンとの、関連上位成分類似度を算出する。この関連上位成分類似度の算出においても、入力特徴ベクトルを構成する成分のうち、値の小さい成分を、関連上位成分類似度を算出する演算の対象から外し、限られたベクトル成分を使って算出する。パターン認識装置は、この関連上位成分類似度と、候補パターンを抽出する際に算出した上位成分類似度とを、候補パターンごとに加算して算出する高精度な詳細類似度に基づいて、認識対象パターンを照合する。

また、本発明に係るパターン認識装置は、さらに、
前記閾値は、前記辞書パターンごとに個別に設定されていることが好ましい。

上記構成により、前記辞書パターンごとに、詳細マッチングの対象とするかを判定する閾値を設定することで、詳細マッチングの対象となる候補パターンの抽出を精度よく行うことができるという効果を奏する。

また、本発明に係るパターン認識装置は、さらに、
前記上位成分抽出手段が抽出する前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出手段をさらに備えていることが好ましい。

上記構成により、上位成分類似度を算出する演算の対象とする入力特徴ベクトルの成分の数を、入力特徴ベクトルの成分の特性に応じて決定することができるという効果を奏する。

また、本発明に係るパターン認識装置は、さらに、
前記乗算値算出手段は、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、
前記上位成分類似度算出手段は、前記乗算値を順に加算することによって、前記上位成分類似度を算出することが好ましい。

上記構成により、本発明に係るパターン認識装置は、前記乗算値算出手段が、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、前記上位成分類似度算出手段が、前記乗算値を順に加算することによって、前記上位成分類似度を算出する。

以上のように、パターン認識装置は、上位成分類似度を算出する演算において、前記演算の対象となる入力特徴ベクトルの成分の値が、あらかじめ定められた閾値を下回った時点で、前記演算を打ち切ることができる。これにより、上位成分類似度を算出する演算の回数を減らし、識別対象パターンをより高速に認識できる効果を奏する。

なお、前記パターン認識装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記パターン認識装置をコンピュータにおいて実現するパターン認識プログラム、およびそのパターン認識プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

以上のように、パターン認識装置は、認識対象パターンを正確に認識するための判定根拠となる類似度を、限られたベクトル成分を使って算出する。これにより、パターン同士をより少ない計算量によって照合できるため、結果的に、より少ない計算量によって、認識対象パターンをある辞書パターンとして認識できる。これによりパターン認識装置は、識別対象パターンをより高速に認識できる効果を奏する。

以下図面を参照しながら、本発明に係る一実施形態について説明する。

（機能構成）
はじめに、本発明に係る文字認識装置１（パターン認識装置）の構成について、図１を参照して説明する。図１は、本発明に係る文字認識装置１の要部構成を表すブロック図である。

図１に示すように、文字認識装置１は、スキャナー１０２と、読み取り部１０３と、切り出し部１０４と、特徴抽出部１０５と、ベクトル成分並べ替え部１０６（上位成分抽出手段）と、マッチング部１０７（乗算値算出手段、上位成分類似度算出手段、パターン認識手段、候補パターン抽出手段、下位成分抽出手段、下位成分乗算値算出手段、下位成分加算値算出手段、上位成分抽出数算出手段）と、詳細マッチング部１０８（全成分類似度算出手段、関連乗算値算出手段、関連上位成分類似度算出手段、詳細類似度算出手段）と
、メモリ１０９と、ハードディスク１１０と、出力処理部１１１と、出力部１１２とを備えている。さらに、ハードディスク１１０は、辞書１１３と並べ替え情報１１４を記憶している。

（マッチング方法）
文字認識装置１におけるマッチング処理の概要について、以下に説明する。まず、ユーザが、スキャナー部１０２を介して、原稿などから文字を入力する。次に、読み取り部１０３は、ユーザが入力した文字を画像として読み取る。次に、切り出し部１０４は、画像として読み取られた文字を、文字パターン（認識対象パターン）として矩形に切り出す。

次に、特徴抽出部１０５は、文字パターンから入力特徴ベクトルを抽出する。このとき、まず、文字パターンを、図３に示すような縦横８×８の正方形のメッシュ領域に等分割する。特徴抽出部１０５が分割する各メッシュ領域の面積は、すべて等しくなる。また、以下では、説明のため、分割した各領域を、図３の各領域上に示す番号により規定する。成分の番号は、最上段の左端のメッシュ領域を０番とし、左から右へ順番に１づつ増加する。番号は、右端に達すると、次段の左端へと続き、最上段と同様に右へ順番に１づつ増加する。以下、同様の規則に従い、最下段の右端のメッシュ領域まで、番号を付す。本明細書では、図３において番号ｎが示されている領域を、第ｎ番目の領域と呼ぶ。

さらに、特徴抽出部１０５は、各メッシュ領域に含まれる文字を表す画素（黒色画素）の数を、メッシュ領域ごとにカウントする。ベクトル成分並べ替え部１０６、マッチング部１０７およびマッチング部１０８は、各メッシュ領域に含まれる黒色画素の数を成分とするベクトルを用いて処理を行う。パターン認識技術の分野において、上記黒色画素の数のようなパターンの特徴を表す量を、特徴量という。また、この特徴量を成分とするベクトルを、特徴ベクトルという。特に、各メッシュ領域に含まれる黒色画素の数を成分とする特徴ベクトルを、メッシュ特徴ベクトルという。

マッチング部１０７および詳細マッチング部１０８は、ユーザが入力した文字と、辞書１１３が記憶している文字とのマッチング（以下では単にマッチング処理と呼ぶ）を行う。ここでは、ユーザが入力した文字（以下では、入力文字と呼ぶ）から特徴抽出部１０５が抽出した特徴ベクトルを、入力特徴ベクトルと呼ぶ。また、辞書１１３が記憶している各文字（以下では、辞書登録文字と呼ぶ）についての特徴ベクトルを、辞書特徴ベクトルと呼ぶ。辞書特徴ベクトルは、各文字の標準的なパターンを表す特徴ベクトルである。

ここで、辞書１１３の構成について、図１９を参照して説明する。辞書１１３は、図１９に示すように、Ｎ個（Ｎは正の整数）のカテゴリーについての辞書特徴ベクトルを記憶している。ここでいう「カテゴリー」は、本実施形態では文字に対応する。また、特許請求の範囲に記載の「辞書パターン」にも対応する。また、一つの文字についての辞書特徴ベクトルは、第１特徴ベクトルから第Ｚ特徴ベクトルまでのＺ個（Ｚは正の整数）の特徴ベクトルから成る。つまり、第１特徴ベクトルから第Ｚ特徴ベクトルは、それぞれ、ある一つの文字についての異なるＺ個の標準的なパターンから、特徴抽出部１０５が特徴を抽出して生成した特徴ベクトルである。辞書特徴ベクトルは、カテゴリーごとに同じ数だけ用意されている。すなわち、いずれのカテゴリーについても、対応する辞書特徴ベクトルが、第１〜第Ｚ特徴ベクトルまで用意されている。

また、マッチング部１０７および詳細マッチング部１０８は、入力文字と辞書登録文字との類似度を算出することによって、マッチング処理を行う。マッチング部１０７および詳細マッチング部１０８は、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第ｎ番目の領域に含まれる黒色画素の数同士を乗算し、上記乗算の結果をすべて加算することにより、類似度を算出する。すなわち、入力特徴ベクトルを構成する成分と、辞書特徴ベクトルを構成する成分とを、対応する成分同士を掛け合わせる。

マッチング部１０７は、類似度を算出する際、辞書特徴ベクトルのうち、いずれか１つを演算の対象とする。以下では、第１特徴ベクトルのみを演算の対象とする例を説明する。また、詳細マッチング部１０８は、類似度を算出する際、第１特徴ベクトルのみならず、第２特徴ベクトルから第Ｚ特徴ベクトルまでも演算の対象とする。なお、第２〜第Ｚ特徴ベクトルは、特許請求の範囲における関連辞書特徴ベクトルに対応する。

（入力特徴ベクトルの成分の並び替え）
マッチング部１０７および詳細マッチング部１０８が処理を開始する前に、ベクトル成分並べ替え部１０６は、入力特徴ベクトルの成分を降順に並べ替える。そこで以下に、図４を用いて、入力特徴ベクトルの並べ替えについて説明する。

図４（ａ）は、入力文字「あ」について、特徴抽出部１０５がカウントした各メッシュ領域に含まれる黒色画素の数を、各メッシュ領域上に示した図である。図４（ｂ）は、入力文字「あ」について、特徴抽出部１０５が生成する入力特徴ベクトルを表す図である。図４（ｂ）に示される特徴抽出部１０５が生成する入力特徴ベクトルの第ｎ成分は、図４（ａ）に示される第ｎ番目の領域に含まれる黒色画素の数に対応している。図４（ｃ）は、入力文字「あ」について、図４（ｂ）に示される入力特徴ベクトルの各成分を、ベクトル成分並べ替え部１０６が降順に並べ替えた後の入力特徴ベクトルを表す図である。図４（ｃ）に示される並べ替え後の入力特徴ベクトルの第ｎ成分は、図４（ａ）に示される第ｎ番目の領域に含まれる黒色画素の数に対応していない。

以下では、図４（ｂ）、図４（ｃ）に示される特徴ベクトルを、それぞれ、並べ替え前の入力特徴ベクトル、並べ替え後の入力特徴ベクトルと呼ぶ。

上述したとおり、マッチング部１０７および詳細マッチング部１０８は、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第ｎ番目の領域に含まれる黒色画素の数同士を乗算し、上記乗算の結果をすべて加算することにより、類似度を算出する。類似度を算出するための上記乗算および加算を積和演算と呼ぶ。

マッチング部１０７および詳細マッチング部１０８は、並べ替え後の入力特徴ベクトルを用いてマッチング処理を行う。

ここで、並び替え後の入力特徴ベクトルの第ｎ成分と、辞書特徴ベクトルの第ｎ成分とは、入力文字と辞書登録文字の各文字パターンについて、メッシュ領域の互いに第ｎ番目の領域に含まれる黒色画素の数同士ではない。したがって、マッチング部１０７および詳細マッチング部１０８は、類似度の算出において、並び替え後の入力特徴ベクトルの第ｎ成分と、辞書特徴ベクトルの第ｎ成分とを演算の対象とすることはできない。そこで、マッチング部１０７および詳細マッチング部１０８は、類似度を算出する際に、並べ替え後の入力特徴ベクトルの第ｎ成分について演算の対象となる辞書特徴ベクトルの成分（辞書成分）を検索する必要がある。そのため、文字認識装置１は、入力特徴ベクトルの成分の並べ替えについての情報を保持しておく必要があり、並べ替え情報１１４として、記憶する。

図４（ｄ）は、ベクトル成分並べ替え部１０６が、図４（ｂ）に示される入力特徴ベクトルの成分を並べ替えて、図４（ｃ）に示される入力特徴ベクトルを生成する際に作成する並べ替え情報テーブル４００を表す図である。並べ替え情報テーブル４００が、上述した並べ替え情報１１４を具体的に記憶している。並べ替え情報テーブル４００は、１レコードを、テーブル番号、並べ替え前要素番号、並べ替え後要素番号の３つの項目から構成する。

テーブル番号は、レコードを識別するための項目である。また、並べ替え前要素番号、並べ替え後要素番号は、それぞれ並べ替え前の入力特徴ベクトルの成分番号と並べ替え後の入力特徴ベクトルの成分番号を格納する項目である。たとえば、レコード４０１は、並べ替え前要素番号０、並べ替え後要素番号は５０となっている。これは、並べ替え前の入力特徴ベクトルの第０成分が、並べ替え後の入力特徴ベクトルの第５０成分に対応していることを表している。

類似度を算出するための演算時には、マッチング部１０７および詳細マッチング部１０８は、この並べ替え情報テーブル４００に基づいて並べ替え後の入力特徴ベクトルの各成分について演算の対象となる辞書特徴ベクトルの成分を検索する。

たとえば、並べ替え後の入力特徴ベクトルの第５０成分について演算を行う場合には、マッチング部１０７および詳細マッチング部１０８は、まず、並べ替え情報テーブル４００の並べ替え後要素番号が５０であるレコードを検索する。この例では、レコード４０１が検索結果に該当する。そして、取得したレコード４０１に含まれる並べ替え前要素番号が演算対象とする辞書特徴ベクトルの成分の番号である。この例では、辞書特徴ベクトルの第０成分が演算対象となる。

以上、入力特徴ベクトルの成分の並べ替えと並べ替え情報テーブルについて説明した。本実施形態の並べ替え処理は、ベクトル成分並べ替え部１０６が、入力特徴ベクトルの成分を、その大きさの降順に並べ替えるものである。入力特徴ベクトルの成分を予め降順に並べ替えておくことにより、値の大きな成分から優先的に積和演算の対象とすることが可能となる。これは、つまり、類似度に対する影響が大きい成分から順番に積和演算の対象とすることが可能ということである。

これにより、従来技術では入力特徴ベクトルのすべての成分を対象とする必要があった積和演算において、本発明では入力特徴ベクトルのすべての成分のうち、値の大きい、上位の限られたベクトル成分（上位成分）のみを対象とする。そのため、従来技術に比べ、類似度を算出する処理に要する時間を短縮でき、マッチング処理を高速化することが可能となる。上位限られたベクトル成分のみを対象として算出した類似度が、特許請求の範囲に記載の、上位成分類似度に対応する。

なお、これまで説明した、ベクトル成分並べ替え部１０６が、入力特徴ベクトルの成分をその大きさの降順に並べ替えることによりマッチング処理を高速化する手法と同様に、辞書特徴ベクトルの成分をその大きさの降順に並び替えることによってマッチング処理を高速化することも可能である。その場合、ベクトル成分並べ替え部１０６は、辞書特徴ベクトルの成分について並べ替え情報テーブル４００を生成するが、並べ替え情報テーブル４００は、辞書登録文字の個数分（ここではＮ個）必要である。

（標準処理フロー）
図２は、文字認識装置１が文字を認識するための処理の流れを表すフローチャートである。まず、読み取り部１０３が、スキャナー１０２を介して、ユーザが入力した原稿などの文字画像を読み込む（ステップＳ２０１）。次に、切り出し部１０４が、読み取り部１０３に読み込まれた文字画像から、文字パターンを切り出す（ステップＳ２０２）。そして、特徴抽出部１０５は、切り出し部１０４が切り出した文字パターンをメッシュ領域に分割し、入力特徴ベクトルを抽出する（ステップＳ２０３）。

次に、ベクトル成分並べ替え部１０６は、ステップＳ２０３において特徴抽出部１０５が抽出した入力特徴ベクトルの成分を並べ替え、上記並べ替え処理に関する情報を並べ替え情報１１４として生成する（ステップＳ２０４）。入力特徴ベクトルの成分の並べ替え及び並べ替え情報テーブルについての詳細内容については、（マッチング準備）において説明したとおりである。

次に、マッチング部１０７が、入力文字と辞書登録文字とのマッチングを行う。辞書登録文字は複数あるため、マッチング部１０７は、類似度の算出を、すべての辞書登録文字について終了するまで、１文字づつ繰り返し実行する。そのため、マッチング部１０７は、すべての辞書登録文字について類似度の算出が終了したか否かについて判定する（ステップＳ２０６）。なお、本実施形態においては、辞書登録文字は全部でＮ文字とする。

ステップＳ２０６におけるマッチングの終了判定を行うため、マッチング部１０７は、現在までに類似度を算出した文字数をカウントする必要がある。そこで、マッチング部１０７は、マッチング辞書カウンタｊにより上記文字数をカウントする。マッチング部１０７は、マッチング処理の始めに、上記カウンタｊを初期化（ｊに０を設定）しておく（ステップＳ２０５）。

ステップＳ２０６における判定の結果、すべての文字についての類似度の算出が終了していない（ｊ＜Ｎ）場合には、マッチング部１０７は、次の文字について類似度の算出を開始する。

上述したとおり、マッチング部１０７は、入力文字および辞書登録文字の各特徴ベクトル（入力特徴ベクトルと辞書特徴ベクトル）の成分について積和演算することにより類似度を算出する。ここでは、積和演算の対象とする成分の数はｍ（ｍは正の整数）とする。マッチング部１０７は、積和演算をｍ回実行した段階において、現在対象としている文字について類似度の算出を終了する。そのため、マッチング部１０７は、現在何回目の加算処理を実行したかをカウントしておく必要がある。そこで、マッチング部１０７は、マッチング要素カウンタｉにより、積和演算の回数をカウントする。

また、マッチング部１０７が行う積和演算は、具体的には、入力特徴ベクトルと辞書特徴ベクトルの各成分の積を、類似度変数Ｒｊに加算する処理である。マッチング部１０７は、この処理を、対象とするｍ個の成分について繰り返し実行する。ここでは、類似度を文字ごとに区別するため、類似度変数Ｒｊは、マッチング辞書カウンタｊを添え字としている。そこで、マッチング部１０７は、類似度を算出する処理の始めに、毎回、上記変数ｉ及びＲｊについて初期化（ｉ及びＲｊに０を設定）しておく（ステップＳ２０７）。

また、マッチング部１０７は、新たに積和演算を実行する前には毎回、既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えてないかについて判定する（ステップＳ２０８）。既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えていない場合（ｉ＜ｍ）、マッチング部１０７は、入力特徴ベクトルの成分Ｖｉと辞書特徴ベクトルの成分Ｄｊｉを乗算し、上記乗算結果を類似度変数Ｒｊに加算する（ステップＳ２０９）。ここで、ＶｉおよびＤｊｉの添え字ｉは、特徴ベクトルの各成分を区別するための添え字である。また、Ｄｊｉの添え字ｊは、辞書特徴ベクトルを文字ごとに区別するための添え字である。

なお、Ｄｊｉは、入力特徴ベクトルの成分Ｖｉの演算対象となる辞書特徴ベクトルの成分を表している。つまり、マッチング部１０７は、並べ替え後の入力特徴ベクトルの成分Ｖｉについて演算対象となる辞書特徴ベクトルの成分Ｄｊｉを、並べ替え情報テーブル４００の検索結果に基づいて取得しているものとする。上記検索では、マッチング部１０７は、まず、並べ替え情報テーブル４００から、並べ替え後要素番号がｉのレコードを検索する。そして、取得したレコードの並べ替え前要素番号が、演算の対象とする辞書特徴ベクトルの成分を表す番号である。マッチング部１０７は、この番号の辞書特徴ベクトルを取得しＤｊｉとしている。

ステップＳ２０９の演算の後、マッチング部１０７は、実行した積和演算の回数をカウントするための変数ｉをインクリメントする（Ｓ２１０）。その後、マッチング部１０７は、ステップＳ２０８にて積和演算の終了判定を行う。

ここで、既に実行した積和演算の回数が、演算の対象とする特徴ベクトルの成分の数を超えた場合（ｉ＜ｍでない場合）、マッチング部１０７は、現在対象としている辞書登録文字について、類似度を算出する処理を終了する。そして、マッチング部１０７は、この終了時点において類似度変数Ｒｊに格納している値を、現在対象としていた文字に対する類似度として確定し、メモリ１０９上に保持しておく（Ｓ２１１）。

その後、マッチング部１０７は、マッチング辞書カウンタｊをインクリメントして（ステップＳ２１２）、現在までに類似度の算出が終了した文字数をカウントする。その後、処理はステップＳ２０６に移り、マッチング部１０７は、すべての辞書登録文字について類似度の算出が終了したか否かの判定をする。

すべての辞書登録文字についての類似度の算出が終了した場合（ｊ＜Ｎでないの場合）、マッチング部１０７は、すべての辞書登録文字についての類似度Ｒｊ（ｊ＝１，２・・・Ｎ）をソートする（ステップＳ２１３）。

以降は、詳細マッチング部１０８が、類似度が大きい上位Ｐ個（Ｐは正の整数）の文字（候補パターン）について詳細マッチングを行う（ステップＳ２１４）。ステップＳ２１４における詳細マッチングの結果、入力文字に対する類似度が最も大きい辞書登録文字をマッチング結果とする。最後に、出力処理部１１１は、マッチング結果を、出力部１１２に出力する（ステップＳ２１５）。以上で、文字認識装置１が行う、文字を認識する処理は終了する。なお、ステップＳ２１４の詳細マッチングについては、詳細を後述する。

（処理イメージ）
図５から図８を用いて、マッチング部１０７が、特徴ベクトルのすべての成分を演算の対象として類似度を算出する場合のイメージについて説明する。

図５は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。図６（ａ）、図７（ａ）、図８（ａ）は、それぞれ、辞書登録文字「あ」、「い」、「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。

図６（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「あ」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図６（ｂ）において、各メッシュ領域上に示されている値は、図５および図６（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図６（ｂ）の例では、入力文字「あ」と辞書登録文字「あ」の類似度は、６２３２７となる。

図７（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「い」の類似度を算出する過程での演算内容を各メッシュ分割領域上に示した図である。図７（ｂ）において、各メッシュ領域上に示されている値は、図５および図７（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図７（ｂ）の例では、入力文字「あ」と辞書登録文字「い」の類似度は、３２０１０となる。

図８（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「会」の類似度を算出する過程での演算内容を各メッシュ分割領域上に示した図である。図８（ｂ）において、各メッシュ領域上に示されている値は、図５および図８（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、各メッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図８（ｂ）の例では、入力文字「あ」と辞書登録文字「会」の類似度は、４７４０１となる。

図６（ｂ）、図７（ｂ）、図８（ｂ）に示される類似度を比較すると、図６（ｂ）に示される類似度が最も高い。これは、入力文字「あ」についてのマッチング結果が、辞書登録文字「あ」であることを示している。

図９から図１２を用いて、マッチング部１０７が、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として、類似度を算出する場合のイメージについて説明する。

図９は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図である。図１０（ａ）、図１１（ａ）、図１２（ａ）は、それぞれ、辞書登録文字「あ」、「い」、「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図である。

図１０（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「あ」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図１０（ｂ）において、各メッシュ領域上に示されている値は、図９および図１０（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、１６のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図１０（ｂ）の例では、入力文字「あ」と辞書登録文字「あ」の類似度は、３８１４２となる。

図１１（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「い」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図１１（ｂ）において、各メッシュ領域上に示されている値は、図９および図１１（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、１６のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図１１（ｂ）の例では、入力文字「あ」と辞書登録文字「い」の類似度は、１７１８４となる。

図１２（ｂ）は、マッチング部１０７が、入力文字「あ」と辞書登録文字「会」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図１２（ｂ）において、各メッシュ領域上に示されている値は、図９および図１２（ａ）の互いに第ｎ番目の領域に示される値同士を乗算した結果である。最終的には、１６のメッシュ領域上に示されている上記乗算の結果をすべて加算したものが類似度となる。図１２（ｂ）の例では、入力文字「あ」と辞書登録文字「会」の類似度は、２５０４２となる。

図１０（ｂ）、図１１（ｂ）、図１２（ｂ）に示される類似度を比較すると、図１０（ｂ）に示される類似度が最も高い。これは、マッチング部１０７が、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する場合においても、正しいマッチング結果が得られることを表している。

（図１３のフローチャート）
図１３は、図２で示した文字認識装置１が文字を認識するための処理の流れにおいて、詳細マッチングの対象としない文字を類似度の値で区別するための処理を追加したフローチャートである。図１３のステップＳ１３０１からステップＳ１３１０は、図２のステップＳ２０１からステップＳ２１０と同様の処理内容であり説明は省略する。

図１３に示す文字認識の処理では、閾値Ｔを設定する。閾値Ｔについては、ユーザが予め設定してもよいし、文字認識装置１が統計情報などに基づいて算出してもよい。追加する処理の具体的な内容は以下の通りである。マッチング部１０７は、現在マッチングの対象としている文字について類似度の算出が終了すると、算出した類似度Ｒｊと閾値Ｔを比較する（ステップＳ１３１１）。ステップＳ１３１１にて、算出した類似度が閾値より小さい場合（Ｒｊ＜Ｔの場合）、マッチング部１０７は、算出した類似度を格納している変数Ｒｊの値を、類似度としてとり得る値の中で最小の値に置き換える（ステップＳ１３１２）。

ステップＳ１３１１にて、マッチング部１０７が算出した類似度が閾値より大きい場合（Ｒｊ＞Ｔの場合）、以降の処理内容については、ステップＳ１３１３からステップＳ１３１７まで、図２のステップＳ２１１からＳ２１５と同様の処理内容であり説明は省略する。

なお、図１３に示す例では、すべての辞書登録文字に対し共通の閾値を設定しているが、上記閾値は辞書登録文字ごとに設定してもよい。また、図１３に示す例では、詳細マッチングの対象から除外する文字を、Ｒｊに最小値を代入することによって区別しているが、Ｒｊに負の値（例えば−１）などの類似度としてとり得ない値を代入することによって区別してもよい。

以上のとおり、詳細マッチング部１０８は、ステップＳ１３１６において、上記最小の値に置き換えられた類似度Ｒｊを有する文字について、詳細マッチングの対象から除外することができる。これにより、詳細マッチング部１０８が実行する類似度を算出する演算の回数は減少し、マッチング処理を高速化できる。

（図１４のフローチャート）
図１４は、図２で示した文字認識装置１が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象とする特徴ベクトルの成分の数を入力特徴ベクトルの特性に基づいて算出するための処理を追加したフローチャートである。

図１４のステップＳ１４０１からステップＳ１４０４は、図２のステップＳ２０１からステップＳ２０４と同様の処理内容であり説明は省略する。

図１４に示す文字認識の処理では、マッチング部１０７が、類似度を算出する演算の対象とする特徴ベクトルの成分の数ｍを、入力特徴ベクトルの成分の値を元に算出する（ステップＳ１４０５）。ここで、ｍの定義は、入力特徴ベクトルの成分の最大値をＶｍａｘ、最小値をＶｍｉｎ、平均値をＶａｖｒとし、また、０からＶｍａｘの間のある数を定数Ｖｃとすると、以下のような例がある。

（例１）入力特徴ベクトルの成分の中で、（Ｖｍａｘ−Ｖｃ）以上の値を有する成分の数
（例２）入力特徴ベクトルの成分の中で、（（Ｖｍａｘ＋Ｖｍｉｎ）÷２）以上の値を有する成分の数
（例３）入力特徴ベクトルの成分の中で、（Ｖａｖｒ＋（Ｖｍａｘ−Ｖａｖｒ）÷２）以上の値を有する成分の数
図１４のステップＳ１４０６からステップＳ１４１６は、図２のステップＳ２０５からステップＳ２１５と同様の処理内容であり説明は省略する。

以上のとおり、マッチング部１０７は、ステップＳ１４０５において、類似度を算出する演算の対象とする特徴ベクトルの成分の数を、入力特徴ベクトルの成分の特性に応じて算出することができる。これにより、入力特徴ベクトルの成分の特性に応じて、類似度を算出する演算の回数を減らし、マッチング処理を高速化できる。

（図１５のフローチャート）
図１５は、図２で示した文字認識装置１が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象としない特徴ベクトルの成分を、閾値により除外する処理を追加したフローチャートである。図１５のステップＳ１５０１からステップＳ１５０４は、図２のステップＳ２０１からステップＳ２０４と同様の処理内容であり説明は省略する。

図１５に示す文字認識の処理では、類似度を算出する演算の対象としない入力特徴ベクトルの成分を除外するため、閾値Ｌを設定する（ステップＳ１５０５）。閾値Ｌは、ユーザがあらかじめ定数（たとえば０）を設定してもよいし、ベクトル成分並べ替え部１０６またはマッチング部１０７が算出してもよい。

ベクトル成分並べ替え部１０６またはマッチング部１０７が閾値Ｌを算出する場合、たとえば、入力特徴ベクトルの成分の平均値から予めユーザが設定した定数を減算した値を閾値Ｌとすればよい。あるいは、並べ替え後の入力特徴ベクトルの成分について上位第何位の成分の値を閾値Ｌとするか、あらかじめユーザが指定し、ベクトル成分並べ替え部１０６またはマッチング部１０７は、ユーザが指定する入力特徴ベクトルの成分の値を閾値Ｌとして設定してもよい。

ステップＳ１５０６からステップＳ１５０９は、ステップＳ２０５からＳ２０８と同様の処理内容であり説明は省略する。

ステップＳ１５１１において、マッチング部１０７は、入力特徴ベクトルの成分Ｖｉと辞書特徴ベクトルの成分Ｄｊｉを乗算した値をＲｊに加算する。マッチング部１０７は、この処理を演算の対象とする特徴ベクトルの成分の数だけ繰り返し、類似度を算出する。

ここで、ある入力特徴ベクトルＶｉと辞書特徴ベクトルＤｊｉを乗算した値が、最終的な類似度Ｒｊに対し、無視できる位に十分小さい値をとる場合には、加算の対象から除外できる。特に、値が０の特徴ベクトルの成分を積和演算の対象とする場合、０を加算することになるが、演算結果には影響せず、演算処理に費やす時間を増加させるだけである。

そこで、マッチング部１０７は、ステップＳ１５１１を行う前に、毎回、入力特徴ベクトルの成分Ｖｉについて、類似度を算出する演算の対象とするか否かについて判定する（ステップＳ１５１０）。入力特徴ベクトルの成分が閾値Ｌより小さい場合（Ｖｉ＜Ｌの場合）、マッチング部１０７は、その入力特徴ベクトルの成分について、類似度を算出する演算の対象としない。

また、入力特徴ベクトルの成分は、値の大きな成分から順番に演算の対象となる。そのため、ステップＳ１５１０で、マッチング部１０７が、一度、入力特徴ベクトルの成分Ｖｉが閾値Ｌより小さいと判定した場合、それ以降に演算の対象となる予定であった入力特徴ベクトルの成分の値は、閾値Ｌより小さく、もはや演算の対象とはならない。したがって、マッチング部１０７は、現在対象としている文字について、類似度を算出する演算を打ち切り、ステップＳ１５１３に移る。

ステップＳ１５１１からステップＳ１５１７は、図２のステップＳ２０９からＳ２１５と同様の処理であり説明は省略する。

なお、図１５では、マッチング部１０７が、入力特徴ベクトルの成分Ｖｉと閾値Ｌとを比較し、類似度を算出する演算を打ち切るか否かを判定する例を示したが、辞書特徴ベクトルＤｊｉを判定の対象としてもよい。

以上のとおり、マッチング部１０７は、ステップＳ１５１０により、演算の対象となる入力特徴ベクトルの成分の値が閾値を下回った時点で、類似度を算出する演算を打ち切ることができる。これにより、類似度を算出する演算の回数を減らし、マッチング処理を高速化できる。

（詳細マッチング処理フロー）
図１６は、図２で示した文字認識装置１が文字を認識するための処理の流れにおける詳細マッチングについてのフローチャートである。

詳細マッチングの処理の前には、マッチング部１０７が、すべての辞書登録文字のうち、入力文字との類似度が大きい上位Ｐ個の文字を選別している。詳細マッチング部１０８が類似度を算出する演算の対象とするのは、上記Ｐ個の文字についてのみである。そこで、詳細マッチング部１０８は、すべての辞書登録文字について、マッチング部１０７が選別したＰ個の文字に該当するか否かをチェックし、上記Ｐ個の文字に該当した場合についてのみ、類似度を算出する演算を実行する。

まず、マッチング部１０７は、詳細マッチング部１０８に、並び替え後の入力特徴ベクトルＶｉ、並び替え情報テーブル、マッチング対象要素数ｍ、類似度Ｒｊ、Ｐ個の選別結果情報を入力する（ステップＳ１６０１）。

次に、詳細マッチング部１０８は、カウンタ変数ｊを初期化（ｊ＝０）する（ステップＳ１６０２）。その後、詳細マッチング部１０８は、マッチング部１０７が選別したＰ個の文字に該当するか否かのチェックをすべての辞書登録文字について終了したか判定する（ステップＳ１６０３）。

ステップＳ１６０３における判定の結果、マッチング部１０７が選別したＰ個の文字に該当するか否かのチェックをすべての辞書登録文字について終了していない場合（ｊ＜Ｎ）、詳細マッチング部１０８は、次の文字についてマッチング部１０７が選別したＰ個の文字に該当するか否かのチェックを行う（ステップＳ１６０４）。

ステップＳ１６０４のチェック処理において、チェック対象の文字が、マッチング部１０７が選別したＰ個の文字に該当する場合には、詳細マッチング部１０８は、マッチング部１０７が類似度を算出する演算の対象としなかった特徴ベクトルの残りの成分（ここでは６４−ｍ個の成分、特許請求の範囲における下位成分に対応）を用いて、類似度を算出し直す。

つまり、詳細マッチング部１０８は、残りの成分についてステップＳ２０９と同様の積和演算を実行し、その結果を、マッチング部１０７が算出した類似度Ｒｊに加算する（ステップＳ１６０７）。上位限られたベクトル成分のみを対象として算出した類似度を元にして、残りのベクトル成分についても対象として算出し直した類似度が、特許請求の範囲に記載の全成分類似度に対応する。

さらに、詳細マッチング部１０８は、マッチング部１０７が類似度を算出する演算の対象にしなかった、辞書登録文字の第２特徴ベクトルから第Ｚ特徴ベクトルのすべての成分についても、ステップＳ２０９と同様の積和演算を実行する。そして、詳細マッチング部１０８はその結果を、ステップＳ１６０７で算出した類似度Ｒｊに加算し、最終的な類似度Ｒｊを算出する（ステップＳ１６０８）。

ステップＳ１６０４のチェック処理において、チェック対象の文字が、マッチング部１０７が選別したＰ個の文字に該当しない場合、詳細マッチング部１０８は、類似度Ｒｊに、類似度としてとり得る最小の値を設定する（ステップＳ１６０５）。そして、詳細マッチング部１０８は、カウンタ変数ｊをインクリメントし（ステップＳ１６０６）、上記チェックが終了した文字の数をカウントした後、ステップＳ１６０３に移る。

ステップＳ１６０３における判定の結果、マッチング部１０７が選別したＰ個の文字に該当するか否かのチェックを、すべての辞書登録文字について終了した場合（ｊ＜Ｎでない場合）、入力文字とすべての辞書登録文字との類似度Ｒｊが確定する。最後に、詳細マッチング部１０８は、類似度Ｒｊをソートする。（ステップＳ１６０９）。

これまで説明したとおり、マッチング部１０７は、類似度を算出する際、入力特徴ベクトルの成分のうち値が大きい上位ｍ個の成分のみを演算の対象とし、かなりの精度を得ることができる。したがって、詳細マッチング部１０８は、ステップＳ１６０７を省略することが可能である。また、詳細マッチング部１０８は、ステップＳ１６０８において、入力特徴ベクトルの成分のうち値が大きい上位ｍ個の成分のみを演算の対象とすればよい。

辞書登録文字の第２特徴ベクトルから第Ｚ特徴ベクトルの各特徴ベクトルごとに算出した各類似度が、特許請求の範囲に記載の、関連上位成分類似度に対応する。また、辞書登録文字の第２特徴ベクトルから第Ｚ特徴ベクトルの各特徴ベクトルごとに算出した類似度を、上位限られたベクトル成分のみを対象として算出した類似度に加算して算出する類似度が、特許請求の範囲に記載の詳細類似度に対応する。

さらに、詳細マッチング部１０８は、図１５のフローチャートについて説明したように、入力特徴ベクトルの成分が閾値Ｌより小さいかどうかをチェックし、小さい場合は、演算をスキップするようにすれば、さらなる高速化が可能である。

なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

（他の構成）
なお、本発明を、以下のように表現することも可能である。

（第１の構成）
入力特徴ベクトルと予め記録されている複数カテゴリーの辞書特徴ベクトルとを比較するパターン照合装置において、入力特徴ベクトルの各要素を並べ変える手段と、並べ替え情報を記憶するテーブルとを持ち、入力特徴ベクトルの各要素と各カテゴリーの辞書特徴ベクトルとを上記テーブルに記載された情報に基づいて照合し、入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとの類似度を求めるパターン照合装置で、並び替えられた入力特徴ベクトルの上位ｍ個の要素について辞書の全カテゴリーについて類似度を求め、求めた類似度の上位Ｐ個のみ詳細にマッチング処理を行うことを特徴とするパターン照合装置。

（第２の構成）
入力特徴ベクトルと予め記録されている複数カテゴリーの辞書特徴ベクトルとを比較するパターン照合装置において、入力特徴ベクトルの各要素を並べ変える手段と、並べ替え情報を記憶するテーブルとを持ち、入力特徴ベクトルの各要素と各カテゴリーの辞書特徴ベクトルとを上記テーブルに記載された情報に基づいて照合し、入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとの類似度を求めるパターン照合装置で、並び替えられた入力特徴ベクトルの上位ｍ個の要素について辞書の全カテゴリーについて類似度を求め、求めた類似度がある閾値以下ならばそのカテゴリーについては候補ではないとして詳細なマッチング処理をしないことを特徴とするパターン照合装置。

（第３の構成）
類似度の閾値を辞書カテゴリー毎に持つことを特徴とする第２の構成に記載のパターン照合装置。

（第４の構成）
入力特徴ベクトルの特性から演算を行う要素数を設定する手段を持ち、入力特徴ベクトルにより演算を行う要素数の変更が可能なことを特徴とする第１の構成または第２の構成に記載のパターン照合装置。

（第５の構成）
入力特徴ベクトルと各カテゴリーの辞書特徴ベクトルとのマッチング処理において、並べ替えた入力特徴ベクトルの要素がある閾値を下回った時点で、累積されている類似度をそのカテゴリーとの類似度として採用することを特徴とする第１の構成または第２の構成に記載のパターン照合装置。

（プログラムおよび記録媒体）
最後に、文字認識装置に含まれている各ブロックは、ハードウェアロジックによって構成すればよい。または、次のように、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を用いてソフトウェアによって実現してもよい。

すなわち、文字認識装置は、各機能を実現する制御プログラムの命令を実行するＣＰＵ、この制御プログラムを格納したＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、上記制御プログラムを実行可能な形式に展開するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、および、上記制御プログラムおよび各種データを格納するメモリ等の記憶装置（記録媒体）を備えている。

この構成により、本発明の目的は、所定の記録媒体によっても、達成できる。この記録媒体は、上述した機能を実現するソフトウェアである文字認識装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録していればよい。文字認識装置には、この記録媒体を供給する。これにより、コンピュータとしての文字認識装置（またはＣＰＵやＭＰＵ）が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。

プログラムコードを上記各装置に供給する記録媒体は、特定の構造または種類のものに限定されない。すなわち、この記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ／ＣＤ−Ｒ等の光ディスクを含むディスク系、ＩＣカード（メモリカードを含む）／光カード等のカード系、あるいはマスクＲＯＭ／ＥＰＲＯＭ／ＥＥＰＲＯＭ／フラッシュＲＯＭ等の半導体メモリ系などとすることができる。

また、文字認識装置を、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して文字認識装置に供給する。この通信ネットワークは、文字認識装置にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、ＬＡＮ、ＩＳＤＮ、ＶＡＮ、ＣＡＴＶ通信網、仮想専用網（ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）、電話回線網、移動体通信網、衛星通信網等であればよい。

この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、ＩＥＥＥ１３９４、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ（ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）回線等の有線でも、ＩｒＤＡやリモコンのような赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、８０２．１１無線、ＨＤＲ、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

本発明は、画像のパターン認識機能を有する各種の装置に適用可能である。したがって、文字を識別するＯＣＲの他にも、顔画像、指紋、印鑑などによる認証装置や、その他画像のパターン認識機能を有するあらゆる装置において利用可能である。

本発明に係る文字認識装置の構成を表すブロック図である。文字認識装置が文字を認識するための処理の流れを表すフローチャートである。特徴抽出部がメッシュ領域に分割した文字パターンの各メッシュ領域を識別するための番号を示した図である。（ａ）は、入力文字「あ」について、特徴抽出部がカウントした各メッシュ領域に含まれる黒色画素の数を、各メッシュ領域上に示した図であり、（ｂ）は、入力文字「あ」について、特徴抽出部が生成する入力特徴ベクトルを表す図であり、（ｃ）は、入力文字「あ」について、（ｂ）に示される入力特徴ベクトルの各成分を、ベクトル成分並べ替え部が降順に並べ替えた後の入力特徴ベクトルを表す図であり、（ｄ）は、ベクトル成分並べ替え部が、（ｂ）に示される入力特徴ベクトルの成分を並べ替えて、図４（ｃ）に示される入力特徴ベクトルを生成する際に作成する並べ替え情報テーブルを表す図である。入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図である。（ａ）は、辞書登録文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「あ」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。（ａ）は、辞書登録文字「い」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「い」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。（ａ）は、辞書登録文字「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「会」の類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図９は、入力文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図である。（ａ）は、辞書登録文字「あ」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「あ」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。（ａ）は、辞書登録文字「い」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「い」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。（ａ）は、辞書登録文字「会」を表す文字パターンについて、各メッシュ領域に含まれる黒色画素の数を、上記黒色画素の数が多い上位１６個の領域についてのみ示した図であり、（ｂ）は、マッチング部が、入力文字「あ」と辞書登録文字「会」について、入力特徴ベクトルの成分の中で値の大きい上位１６成分のみを演算の対象として類似度を算出する過程での演算内容を各メッシュ領域上に示した図である。図２で示した文字認識装置が文字を認識するための処理の流れにおいて、詳細マッチングの対象としない文字を類似度の値で区別するための処理を追加したフローチャートである。図２で示した文字認識装置が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象とする特徴ベクトルの成分の数を入力特徴ベクトルの特性に基づいて算出するための処理を追加したフローチャートである。図２で示した文字認識装置が文字を認識するための処理の流れにおいて、類似度を算出する演算の対象としない特徴ベクトルの成分を、閾値により除外する処理を追加したフローチャートである。図２で示した文字認識装置が文字を認識するための処理の流れにおける詳細マッチングについてのフローチャートである。（ａ）は、特徴ベクトルを抽出するために矩形に切り取られた文字画像の例を表す図であり、（ｂ）は、図１７（ａ）の文字画像を、縦横８×８のメッシュ領域に分割した様子を表す図である。図１７（ｂ）に示す各メッシュ領域に対応するメッシュ特徴ベクトルの各成分を、各メッシュ領域に示した図である。辞書の構成例の一つを表す図である。従来の文字認識装置が文字パターンを認識するための処理の流れを表すフローチャートである。距離を用いたパターンマッチングにおいて、距離を算出する演算を、閾値によりスキップする場合に使用する閾値テーブルの例である。図２０に示す従来の文字認識装置が文字パターンを認識するための処理の流れにおいて、閾値により距離を算出する演算をスキップする処理を追加したフローチャートである。

符号の説明

１文字認識装置（パターン認識装置）
１０２スキャナー
１０３読み取り部
１０４切り出し部
１０５特徴抽出部
１０６ベクトル成分並べ替え部（上位成分抽出手段）
１０７マッチング部（乗算値算出手段、上位成分類似度算出手段、パターン認識手段、候補パターン抽出手段、下位成分抽出手段、下位成分乗算値算出手段、下位成分加算値算出手段、上位成分抽出数算出手段）
１０８詳細マッチング部（全成分類似度算出手段、関連乗算値算出手段、関連上位成分類似度算出手段、詳細類似度算出手段）
１０９メモリ
１１０ハードディスク
１１１出力処理部
１１２出力部
１１３辞書
１１４並べ替え情報

Claims

認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識手段と、
前記上位成分抽出手段が抽出する前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出手段と
を備えていることを特徴とするパターン認識装置。
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段と、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識するパターン認識手段と、
前記上位成分抽出手段が抽出する前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出手段と
を備えていることを特徴とするパターン認識装置。
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段とを備えており、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた数の、より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段と、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識するパターン認識手段とをさらに備えていることを特徴とするパターン認識装置。
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段と、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記入力特徴ベクトルを構成する複数の成分のうち、前記上位成分以外の成分を下位成分として抽出する下位成分抽出手段と、
前記候補パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記下位成分と対応する前記辞書成分に、前記下位成分を乗算することによって、前記下位成分ごとの下位成分乗算値を算出する下位成分乗算値算出手段と、
前記下位成分ごとに算出された前記下位成分乗算値をすべて加算することによって、前記候補パターンごとの下位成分加算値を算出する下位成分加算値算出手段と、
前記下位成分加算値算出手段が算出した前記下位成分加算値と、前記上位成分類似度算出手段が算出した前記上位成分類似度を加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの全成分類似度を算出する全成分類似度算出手段と、
前記認識対象パターンを、前記候補パターンごとに算出された前記全成分類似度のうち、最大の前記全成分類似度に対応する前記候補パターンであると認識するパターン認識手段とを備えており、
前記閾値は、前記辞書パターンごとに個別に設定されている
ことを特徴とするパターン認識装置。
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出手段と、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出手段と、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出手段とを備えており、
互いに異なり、かつ前記辞書特徴ベクトルとも異なる、前記辞書パターンを表す関連辞書特徴ベクトルが、前記辞書パターンごとに同じ数だけあらかじめ用意されており、
前記辞書パターンごとに算出された前記上位成分類似度のうち、あらかじめ定められた閾値より大きい前記上位成分類似度に対応する前記辞書パターンを、候補パターンとして抽出する候補パターン抽出手段と、
前記候補パターンを表す前記関連辞書特徴ベクトルを構成する複数の辞書成分のうち、前記入力特徴ベクトルを構成する前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの関連乗算値を算出する関連乗算値算出手段と、
前記上位成分について算出された前記関連乗算値のみを加算することによって、前記認識対象パターンと前記候補パターンとの関連上位成分類似度を、前記関連辞書特徴ベクトルごとに算出する関連上位成分類似度算出手段と、
前記上位成分類似度に、前記関連辞書特徴ベクトルごとに算出された前記関連上位成分類似度をすべて加算することによって、前記候補パターンごとに、前記認識対象パターンと前記候補パターンとの詳細類似度を算出する詳細類似度算出手段と、
前記認識対象パターンを、前記候補パターンごとに算出された前記詳細類似度のうち、最大の前記詳細類似度に対応する前記候補パターンであると認識するパターン認識手段とをさらに備えていることを特徴とするパターン認識装置。
前記乗算値算出手段は、前記上位成分を、値の大きい成分から順に、前記上位成分があらかじめ定められた閾値を上回る場合に、対応する前記辞書成分と乗算して前記乗算値を算出し、
前記上位成分類似度算出手段は、前記乗算値を順に加算することによって、前記上位成分類似度を算出することを特徴とする請求項１に記載のパターン認識装置。
認識対象パターンを、複数の異なる辞書パターンのいずれかであると認識するパターン認識装置が実行するパターン認識方法であって、
前記認識対象パターンを表す入力特徴ベクトルを構成する複数の成分のうち、あらかじめ定められた数の、より値の大きい成分を、上位成分として抽出する上位成分抽出ステップと、
前記辞書パターンを表す辞書特徴ベクトルを構成する複数の辞書成分のうち、前記上位成分と対応する前記辞書成分に、前記上位成分を乗算することによって、前記上位成分ごとの乗算値を算出する乗算値算出ステップと、
前記上位成分について算出された前記乗算値のみを加算することによって、前記認識対象パターンと前記辞書パターンとの上位成分類似度を、前記辞書パターンごとに算出する上位成分類似度算出ステップと、
前記認識対象パターンを、前記辞書パターンごとに算出された前記上位成分類似度のうち、最大の前記上位成分類似度に対応する前記辞書パターンであると認識するパターン認識ステップと、
前記上位成分抽出ステップにて抽出される前記上位成分の数を、前記入力特徴ベクトルを構成する前記成分に基づいて算出する上位成分抽出数算出ステップと
を含んでいることを特徴とするパターン認識方法。
請求項１から６のいずれか１項に記載のパターン認識装置を動作させるパターン認識プログラムであって、コンピュータを上記の各手段として機能させるためのパターン認識プログラム。
請求項８に記載のパターン認識プログラムを記録しているコンピュータ読み取り可能な記録媒体。