JP5846127B2

JP5846127B2 - 認識辞書生成装置及びパターン認識装置

Info

Publication number: JP5846127B2
Application number: JP2012552546A
Authority: JP
Inventors: 佐藤　敦; 敦佐藤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2011-01-11
Filing date: 2011-12-28
Publication date: 2016-01-20
Anticipated expiration: 2031-12-28
Also published as: US20130290228A1; JPWO2012095938A1; US9245234B2; WO2012095938A1

Description

本発明は、パターン認識技術に関する。

現在、パターン認識技術は、個人認証、表情認識、音声認識、文字認識等、様々な分野で利用されている。パターン認識は、一般的には、入力パターンから特徴ベクトルを抽出し、抽出された特徴ベクトルと予め用意されている認識辞書とを照合することにより入力パターンがどのカテゴリに属するかを判定する。

下記非特許文献１では、認識辞書と呼ばれる複数の参照ベクトルと、入力パターンをベクトルで表現した入力ベクトルとの距離計算に基づき、入力ベクトルとの距離が最も小さい参照ベクトルが属するクラスを、その入力ベクトルの認識結果とするパターン認識装置が提案されている。このパターン認識装置は、参照ベクトルを学習する段階において、学習データに対する誤りを表す評価関数の値が減少するように参照ベクトルの値を勾配法に基づいて修正する。

また、下記特許文献１では、以下のような参照ベクトルの学習手法が提案されている。入力ベクトルと同じクラスに属する参照ベクトルの中で、入力ベクトルとの距離が最も小さい第１の参照ベクトルとの距離をべき乗変換して得た値と、入力ベクトルと異なるクラスに属する参照ベクトルの中で、入力ベクトルとの距離が最も小さい第２の参照ベクトルとの距離をべき乗変換して得た値を用いて、第１の参照ベクトルと第２の参照ベクトルが修正される。

特許第３４５２１６０号

A. Sato & K. Yamada, "Generalized Learning Vector Quantization," Advances in Neural Information Processing Systems, Vol. 8, pp. 423-429, MIT Press, 1996.

上述のような認識辞書の学習では、入力されたデータが特徴抽出手段によりｄ（ｄは１以上の整数）次元の特徴ベクトルに変換され、この特徴ベクトルを用いて当該参照ベクトルが修正される。このとき、参照ベクトル修正手段は、特徴ベクトルからの引力と斥力とを用いて、参照ベクトルの位置をｄ次元の特徴ベクトル空間内で移動させることで、学習データの誤り率が減るように参照ベクトルを修正する。

ところが、認識辞書に、認識精度に影響を及ぼさない多くの参照ベクトルが含まれる場合がある。上述の手法では、このような冗長な参照ベクトルも含めて全ての参照ベクトルを用いた処理をしていたため、パターン認識処理に多くの時間を要してしまっていた。

本発明の目的は、認識精度を落とすことなくパターン認識処理の高速化を実現する技術を提供することにある。

本発明の各態様では、上述した課題を解決するために、それぞれ以下の構成を採用する。

第１の態様は、複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成装置に関する。第１の態様に係る認識辞書生成装置は、（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する取得手段と、この取得手段により取得された複数の参照ベクトルの中から、学習用入力ベクトルと同じクラスに属しかつ学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、学習用入力ベクトルと異なるクラスに属しかつ学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する選択手段と、学習用入力ベクトルと第１の参照ベクトルとの間の距離を示す第１距離値、及び、学習用入力ベクトルと第２の参照ベクトルとの間の距離を示す第２距離値を取得する距離取得手段と、第１距離値及び第２距離値の関係に応じて変化する係数、第２距離値のべき乗された値、及び、学習用入力ベクトルと第１の参照ベクトルとの差分を乗算することにより得られる第１修正ベクトルを用いて第１の参照ベクトルを修正し、当該係数、第１距離値のべき乗された値、及び、学習用入力ベクトルと第２の参照ベクトルとの差分を乗算することにより得られる第２修正ベクトルを用いて第２の参照ベクトルを修正する修正手段と、この修正手段により修正された第１の参照ベクトル及び第２の参照ベクトルの各オフセット値に応じて、上記認識辞書から除外する参照ベクトルを決定する決定手段とを備える。

第２の態様は、複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成方法に関する。第２の態様に係る認識辞書生成方法は、コンピュータが、ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得し、この取得された複数の参照ベクトルの中から、学習用入力ベクトルと同じクラスに属しかつ学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、学習用入力ベクトルと異なるクラスに属しかつ学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択し、学習用入力ベクトルと第１の参照ベクトルとの間の距離を示す第１距離値、及び、学習用入力ベクトルと第２の参照ベクトルとの間の距離を示す第２距離値を取得し、第１距離値及び第２距離値の関係に応じて変化する係数、第２距離値のべき乗された値、及び、学習用入力ベクトルと第１の参照ベクトルとの差分を乗算することにより得られる第１修正ベクトルを用いて第１の参照ベクトルを修正し、上記係数、第１距離値のべき乗された値、及び、学習用入力ベクトルと第２の参照ベクトルとの差分を乗算することにより得られる第２修正ベクトルを用いて第２の参照ベクトルを修正し、この修正された第１の参照ベクトル及び第２の参照ベクトルの各オフセット値に応じて、上記認識辞書から除外する参照ベクトルを決定する、ことを含む。

第３の態様は、上記第１の態様に係る認識辞書生成装置と、入力データから得られたｄ個の特徴値を含む特徴ベクトルを（ｄ＋１）次元の入力ベクトルに変換する第１変換手段と、上記第１の態様に係る決定手段により決定された除外対象の参照ベクトルが削除された上記複数の（ｄ＋１）次元の参照ベクトルから形成される認識辞書と、この認識辞書を形成する複数の参照ベクトルと上記第１変換手段により変換された入力ベクトルとを用いて上記入力データの属するクラスを識別する識別手段と、を備えるパターン認識装置に関する。なお、本発明の別態様として、上記第１の態様又は上記第３の態様の各構成をコンピュータに実現させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。

上記各態様によれば、認識精度を落とすことなくパターン認識処理の高速化を実現する技術を提供することができる。

図１は、参照ベクトルの学習の概念を示す図である。図２は、参照ベクトルを用いた入力ベクトルの識別の概念を示す図である。図３は、本実施形態における参照ベクトル及び入力ベクトルの概念を示す図である。図４は、第２実施形態におけるパターン認識装置の構成例を概念的に示す図である。図５は、認識辞書作成部の構成例を概念的に示す図である。図６は、パターン識別部の構成例を概念的に示す図である。図７は、第２実施形態における認識辞書の生成処理の具体例を示すフローチャートである。図８は、第２実施形態におけるパターン認識処理の具体例を示すフローチャートである。図９は、第３実施形態における認識辞書の生成処理の具体例を示すフローチャートである。

以下、本発明の実施の形態について説明する。なお、以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。

［第１実施形態］
本実施形態に係る認識辞書生成装置は、複数の参照ベクトルから形成される認識辞書を生成する装置であって、取得部、選択部、距離取得部、修正部、決定部等を備える。各参照ベクトルは、複数のクラスのいずれか１つにそれぞれ属するように管理される。

取得部は、ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する。

選択部は、上記取得部により取得された複数の参照ベクトルの中から、学習用入力ベクトルと同じクラスに属しかつ学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、学習用入力ベクトルと異なるクラスに属しかつ学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する。

距離取得部は、学習用入力ベクトルと第１の参照ベクトルとの間の距離を示す第１距離値、及び、学習用入力ベクトルと第２の参照ベクトルとの間の距離を示す第２距離値を取得する。本実施形態は、ベクトル間の距離の算出手法を制限せず、例えば、ユークリッド距離を利用する。

修正部は、上記選択部により選択された第１の参照ベクトル及び第２の参照ベクトルを修正する。具体的には、修正部は、第１修正ベクトル及び第２修正ベクトルを算出し、第１修正ベクトルを用いて第１の参照ベクトルを修正し、第２修正ベクトルを用いて第２の参照ベクトルを修正する。修正部は、第１距離値及び第２距離値の関係に応じて変化する係数、第２距離値のべき乗された値、及び、学習用入力ベクトルと第１の参照ベクトルとの差分を乗算することにより第１修正ベクトルを算出する。修正部は、上記係数、第１距離値のべき乗された値、及び、学習用入力ベクトルと第２の参照ベクトルとの差分を乗算することにより第２修正ベクトルを算出する。

決定部は、上記修正部により修正された第１の参照ベクトル及び第２の参照ベクトルの各オフセット値に応じて、当該認識辞書から除外する参照ベクトルを決定する。

以下、参照ベクトルの重要度を示すオフセット値について説明する。図１は、参照ベクトルの学習の概念を示す図である。

図１の例では、学習に用いられる入力ベクトルは２次元（ｄ＝２）の特徴ベクトルであり、白丸は正のクラスに属する入力ベクトルの位置を示し、黒丸は負のクラスに属する入力ベクトルの位置を示す。黒四角１０１は黒丸と同じクラスに属する参照ベクトルを示し、白四角１０５は白丸と同じクラスに属する参照ベクトルを示す。

参照ベクトル１０１は、認識辞書作成時において、同じクラスに属する入力ベクトル（黒丸）から引力１０２を受け、異なるクラスに属する入力ベクトル（白丸）から斥力１０３を受ける。これにより、参照ベクトル１０１の位置は、引力１０２及び斥力１０３の合力の向きに修正される。同様に、参照ベクトル１０５は、同じクラスに属する入力ベクトル（白丸）から引力１０６を受け、異なるクラスに属する入力ベクトル（黒丸）から斥力１０７を受ける。これにより、参照ベクトル１０５の位置は、引力１０６及び斥力１０７の合力の向きに修正される。

図２は、参照ベクトルを用いた入力ベクトルの識別の概念を示す図である。図２の例では、正及び負の各クラスにおいて３個の参照ベクトルがそれぞれ存在する。黒四角１１１、１１２及び１１３が負のクラスに属する参照ベクトルを示し、白四角１１５、１１６及び１１７が正のクラスに属する参照ベクトルを示す。ここで、各クラスの識別関数は、以下の（式１）で表される。

上記（式１）において、ベクトルｘは入力ベクトルを示し、ベクトルｙ_ｋｉはクラスω_ｋに属する参照ベクトルを示し、Ｍ_ｋはクラスω_ｋに属する参照ベクトルの数を示す。図２の例によれば、Ｍ_１及びＭ_２は共に３である。また、ｍｉｎは変数ｉについて最小値を求める関数を示す。これにより、クラスω_ｋの識別関数ｄ_ｋ（ｘ）は、ベクトルｘと、ベクトルｘに最も近い参照ベクトルとの間のユークリッド距離の２乗（以降、平方ユークリッド距離とも表記する）を取得する。この識別関数ｄ_ｋ（ｘ）の値が最も小さいクラスω_ｋがその入力ベクトルｘの認識結果とされる。

図２の例において、正のクラスをω_１、負のクラスをω_２とすると、入力ベクトルｘが属するクラス（ω_１又はω_２）を識別するための境界（以降、識別境界と表記する）は、ｄ_１（ｘ）値とｄ_２（ｘ）値とが等しくなる（ｄ_１（ｘ）＝ｄ_２（ｘ））ベクトルｘの集合となる。つまり、識別境界は、隣接する異なるクラスの参照ベクトルからの等距離面として定義される。図２では、正のクラスと負のクラスとの間の識別境界は符号１２０で示される。

ここで、図２の例では、正のクラスに属する参照ベクトル１１５と負のクラスに属する参照ベクトル１１１とからの等距離面として識別境界１２０が設定されれば、全てのサンプル（入力ベクトル）を正しく識別することができる。つまり、他の参照ベクトル１１２、１１３、１１６及び１１７は、認識精度に影響を及ぼさないため、冗長な参照ベクトルとみなすことができる。本実施形態では、このような冗長な参照ベクトルの重要度は低く設定される。

本実施形態では、各参照ベクトルに、このような重要度を示すオフセット値がそれぞれ設けられる。図３は、本実施形態における参照ベクトル及び入力ベクトルの概念を示す図である。図３の例では、白四角及び黒四角で示す参照ベクトル１３１、１３２、１３３、１３４、１３５及び１３６はそれぞれ２次元の特徴値及びオフセット値を含む３次元のベクトルである。一方、白丸及び黒丸で示される各入力ベクトルはそれぞれ２次元の特徴ベクトルに要素（０）が追加された３次元のベクトルである。

ここで、各入力ベクトルは、付加要素が０であるため、２次元平面１４０内に存在している。一方、各参照ベクトルは、オフセット値を有しているため、２次元平面１４０にオフセット軸１４５を加えた３次元空間内に存在する。上記修正部の修正処理により、参照ベクトルは、同一クラスに属する学習用入力ベクトルから引力を受け、異なるクラスに属する学習用入力ベクトルから斥力を受けることにより、このような３次元空間内を移動する。

ここで、オフセット値が大きい参照ベクトル１３２、１３３、１３５及び１３６は、オフセット値の小さい参照ベクトル１３１及び１３４よりも入力ベクトルから遠くなるため、識別境界１５０の構成には関与せず、削除しても認識精度には影響しない。つまり、オフセット値は参照ベクトルの重要度を示す。これにより、オフセット値が大きい参照ベクトルは、重要度が低いため、認識辞書としての保存対象から除外することができる。

図３に示す概念は、以下のように説明することもできる。本実施形態では、オフセット値を設けるため、識別関数は、次の（式２）のように示される。以下の（式２）は、上記（式１）にオフセット値σ_ｋｉを付加したものである。

ここで、入力ベクトル及び参照ベクトルの次元数を１つ増やし、以下の（式３−１）及び（式３−２）のように表記すれば、上記（式２）は、以下の（式４）のように書き直すことができる。以下の（式４）は、上記（式１）と同じ形式となっている。

〔第１実施形態の作用及び効果〕
このように、本実施形態では、各参照ベクトルにオフセット値がそれぞれ設けられ、各参照ベクトルが学習（修正）されるに従って、各オフセット値が各参照ベクトルの重要度を示すようになる。そして、各オフセット値に応じて、認識辞書から除外される参照ベクトルが決定される。

従って、本実施形態によれば、各参照ベクトルのオフセット値を参照することにより、重要度が低い、即ち、認識精度に影響を及ぼさない冗長な参照ベクトルを簡単に特定することができ、ひいては、認識辞書に保存すべきでない参照ベクトルを決めることができる。結果、本実施形態によれば、認識精度への影響を強く与える重要な参照ベクトルのみを用いてパターン認識処理を実行することができるため、認識精度を低下させることなく、パターン認識処理の時間を短縮することができる。

［第２実施形態］
以下、第２実施形態は、上述の第１実施形態における認識辞書生成装置の構成を更に具体化しパターン認識装置に適用した場合の例である。

〔装置構成〕
図４は、第２実施形態におけるパターン認識装置７の構成例を概念的に示す図である。パターン認識装置７は、ハードウェア構成として、ＣＰＵ（Central Processing Unit）１、メモリ２（ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ハードディスク、可搬型記憶装置等）、入出力インタフェース３等を有する。これらハードウェア要素は例えばバス５により接続される。なお、本実施形態は、パターン認識装置７のハードウェア構成を限定しない。

パターン認識装置７は、ソフトウェア構成として、認識辞書作成部１０、認識辞書２０、パターン識別部３０等を有する。認識辞書作成部１０及びパターン識別部３０は、例えば、ＣＰＵ１によりメモリ２に格納されるプログラムが実行されることで実現される。

認識辞書２０は、認識辞書作成部１０により修正された複数の参照ベクトルであって重要度の低い参照ベクトルが除外された複数の参照ベクトルにより形成される。認識辞書２０は、メモリ２上に保存される。

パターン識別部３０は、認識辞書２０として保存される参照ベクトルを用いて、入力データが属するクラス（カテゴリ）を判別する。

認識辞書作成部１０は、第１実施形態における認識辞書生成装置の構成に対応する。認識辞書作成部１０は、学習用の入力ベクトル及び初期化された参照ベクトルを取得し、学習用入力ベクトルに応じて参照ベクトルを修正し、重要度の低い参照ベクトルが除外された複数の参照ベクトルを認識辞書２０として保存する。

図５は、認識辞書作成部１０の構成例を概念的に示す図である。認識辞書作成部１０は、取得部１２、選択部１３、距離取得部１４、修正部１５、決定部１６等を有する。認識辞書作成部１０に含まれる各処理部についても、例えば、ＣＰＵ１によりメモリ２に格納されるプログラムが実行されることで実現される。以下、これら各処理部について第１実施形態と異なる内容を中心に説明し、第１実施形態と同じ内容については適宜省略する。

第２実施形態における修正部１５は、選択部１３により選択された第１の参照ベクトル及び第２の参照ベクトルを以下の（式５）を用いて修正する。以下の（式５）において、Ｘは学習用入力ベクトルを示し、Ｙ_１は上述の第１の参照ベクトルを示し、Ｙ_２は上述の第２の参照ベクトルを示す。以下の（式５）では、第１の参照ベクトルＹ_１に加算される項が上述の第１修正ベクトルに相当し、第２の参照ベクトルＹ_２から減算される項が上述の第２修正ベクトルに相当する。

上記（式５）において、Ｄ_１及びＤ_２は、距離取得部１４により取得された第１距離値及び第２距離値を示す。ｋは、１より大きい任意の実数であり、ベクトル間のユークリッド距離をｋ乗するための値である。

ｆ（Ｄ_１、Ｄ_２）は、第１距離値Ｄ_１及び第２距離値Ｄ_２の差が小さい程大きくなる関数（以降、第１方式と表記する）、又は、第２距離値Ｄ_２が第１距離値Ｄ_１より小さくかつ第１距離値Ｄ_１と第２距離値Ｄ_２との差が大きい程大きくなる関数（以降、第２方式と表記する）である。α１及びα２は、任意の正の実数パラメータである。第２実施形態では、α１とｆ（Ｄ_１、Ｄ_２）とが掛け合わされた値、及び、α２とｆ（Ｄ_１、Ｄ_２）とが掛け合わされた値が第１距離値及び第２距離値の関係に応じて変化する係数に相当する。

上記（式５）によれば、第１修正ベクトルは、学習用入力ベクトルＸから第１の参照ベクトルＹ_１を引いたベクトルに、当該係数及び学習用入力ベクトルＸと第２の参照ベクトルＹ_２とのユークリッド距離をｋ乗した値を乗算することにより得られる。第２修正ベクトルは、学習用入力ベクトルＸから第２の参照ベクトルＹ_２を引いたベクトルに、当該係数及び学習用入力ベクトルＸと第１の参照ベクトルＹ_１とのユークリッド距離をｋ乗した値を乗算することにより得られる。

修正部１５は、第１の参照ベクトルＹ_１を第１修正ベクトルと加算することにより修正し、第２の参照ベクトルＹ_２を第２修正ベクトルを減算することにより修正する。結果として、学習用入力ベクトルＸと同じクラスに属する第１の参照ベクトルＹ_１は、その学習用入力ベクトルＸに近づく方向に修正され、学習用入力ベクトルＸと異なるクラスに属する第２の参照ベクトルＹ_２は、その学習用入力ベクトルＸから離れる方向に修正される。

ここで、所定の関数ｆ（Ｄ_１、Ｄ_２）について説明する。関数ｆ（Ｄ_１、Ｄ_２）としては、上述のように２つの方式のいずれか一方が利用される。第１距離値Ｄ_１及び第２距離値Ｄ_２が近い場合は、その学習用入力ベクトルＸが識別境界の近くに存在していることを意味する。誤って識別される可能性が高い入力ベクトルは識別境界に近い場合が多いため、第１の方式のように、識別境界に近い入力ベクトルＸに対する参照ベクトルの修正量は、識別境界から遠い入力ベクトルＸに対する参照ベクトルの修正量よりも大きく設定される。

第１方式が利用される場合には、関数ｆ（Ｄ_１、Ｄ_２）は、例えば、以下の（式６）及び（式７）で表すことができる。ｂは、任意の正の実数であり、ｍは、第１距離値Ｄ_１から第２距離値Ｄ_２を減算した値である。

一方、学習用入力ベクトルＸが正しく識別される場合には、第１距離値Ｄ_１が第２距離値Ｄ_２よりも小さくなり、学習用入力ベクトルＸが誤って識別される場合には、第１距離値Ｄ_１が第２距離値Ｄ_２よりも大きくなる。つまり、第２距離値Ｄ_２が第１距離値Ｄ_１より小さくかつ第１距離値Ｄ_１と第２距離値Ｄ_２との差が大きい程、誤認識され易くなる。そこで、上記第２の方式のように、第２距離値Ｄ_２が第１距離値Ｄ_１より小さくかつ第１距離値Ｄ_１と第２距離値Ｄ_２との差が大きい程修正量が大きく設定される。

第２方式が利用される場合には、関数ｆ（Ｄ_１、Ｄ_２）は、例えば、以下の（式８）及び（式９）で表すことができる。ｂ及びｍは、上述の（式６）及び（式７）と同様である。

このように、当該係数に含まれる所定関数ｆ（Ｄ_１、Ｄ_２）として、上述の第１方式及び第２方式のいずれか一方の方式が利用されることにより、誤認識が減るように、参照ベクトルが修正される。

この参照ベクトルの修正に従って、各参照ベクトルに付加されている各オフセット値の絶対値は、学習用入力ベクトルと同じクラスに属する参照ベクトルのもの程小さくなり、学習用入力ベクトルと異なるクラスに属する参照ベクトルのもの程大きくなるように修正される。その修正量は、対応する学習用入力ベクトルが識別境界に近い程大きくされるか、又は、誤認識され易い程大きくされる。

決定部１６は、修正部１５により上述のように修正された各参照ベクトルを受け、オフセット値が所定閾値（例えば、１）以上の参照ベクトルを認識辞書２０から除外する参照ベクトルと決定する。決定部１６は、オフセット値が所定閾値（例えば、１）より小さい参照ベクトルを認識辞書２０として保存する。

なお、決定部１６による認識辞書２０として保存すべき参照ベクトルの決定は、他の方法により行うようにしてもよい。例えば、決定部１６は、全オフセット値の絶対値の最小値の定数倍より小さいオフセット値の絶対値を持つ参照ベクトルを認識辞書２０として保存するようにしてもよいし、オフセット値の絶対値の小さいものから所望の個数を選んで認識辞書２０として保存するようにしてもよい。

図６は、パターン識別部３０の構成例を概念的に示す図である。パターン識別部３０は、入力データ取得部３１、特徴抽出部３２、変換部３３、識別部３４等を有する。パターン識別部３０に含まれる各処理部についても、例えば、ＣＰＵ１によりメモリ２に格納されるプログラムが実行されることで実現される。

入力データ取得部３１は、識別対象となる入力データを取得する。入力データは、例えば、画像データ、音声データ等である。本実施形態は、この入力データ自体を制限しない。

特徴抽出部３２は、入力データ取得部３１により取得された入力データから特徴情報（特徴値）を抽出し、その特徴値を要素に含むｄ（ｄは１以上の整数）次元の特徴ベクトルを生成する。なお、ここでは、１次元データであってもベクトルと表記する。例えば、特徴抽出部３２は、入力データとしての画像データを白黒濃淡画像に変換した後、画像全体を縦１０個及び横１０個の各領域に分割し、各領域内で画像の輝度値の平均を求め、１００次元の特徴ベクトルを得る。

変換部３３は、特徴抽出部３２により生成されたｄ次元の特徴ベクトルに付加要素（０）を追加することにより、当該特徴ベクトルを（ｄ＋１）次元の入力ベクトルに変換する。

識別部３４は、上述の認識辞書作成部１０により生成（学習）された認識辞書２０に格納されている複数の（ｄ＋１）次元の参照ベクトルを利用することにより、変換部３３により変換された（ｄ＋１）次元の入力ベクトルを識別する。識別部３４で利用される識別関数は、上述の（式４）で示される。識別部３４は、その識別結果として、（ｄ＋１）次元の入力ベクトルが属するクラス情報を取得し、その取得されたクラス情報を出力する。

認識辞書作成部１０の取得部１２は、パターン識別部３０の変換部３３から（ｄ＋１）次元の学習用入力ベクトルを取得するようにしてもよい。この場合、パターン識別部３０において、入力データ取得部３１が学習用の入力データを取得し、特徴抽出部３２がその学習用入力データからｄ次元の学習用特徴ベクトルを生成し、変換部３３がそのｄ次元の学習用特徴ベクトルを（ｄ＋１）次元の学習用入力ベクトルに変換する。また、認識辞書作成部１０が、パターン識別部３０の入力データ取得部３１、特徴抽出部３２及び変換部３３と同様の各処理部を、（ｄ＋１）次元の学習用入力ベクトルの生成のために備えるようにしてもよい。

〔動作例〕
以下、第２実施形態におけるパターン認識装置７の動作例について説明する。図７は、第２実施形態における認識辞書の生成処理の具体例を示すフローチャートである。認識辞書２０の生成処理では、認識辞書作成部１０が以下のように動作する。

取得部１２が、Ｍ個の（ｄ＋１）次元の参照ベクトルと、Ｎ個の（ｄ＋１）次元の学習用入力ベクトルとを取得する（Ｓ７０１）。（ｄ＋１）次元の参照ベクトルは、ｄ個の特徴値及び１つのオフセット値（σ）を含む。（ｄ＋１）次元の学習用入力ベクトルは、予め準備された学習用入力データから特徴情報が抽出されることにより得られるｄ次元の特徴ベクトルに付加要素（０）が追加されることにより、生成される。

ここで、各学習用入力ベクトル及び各参照ベクトルには、いずれか１つのクラスがそれぞれ予め付与されている。例えば、Ｎ個の配列ＣＸ［］が用意され、ｎ番目の学習用入力ベクトルがクラスｋに属する場合、ＣＸ［ｎ］＝ｋと設定される。同様に、Ｍ個の配列ＣＹ［］が用意され、ｊ番目の参照ベクトルがクラスｋに属する場合、ＣＹ［ｊ］＝ｋと設定される。

各参照ベクトルの特徴値の初期値は、クラス毎にＫ平均法などのクラスタリング手法が用いられることにより設定される。各参照ベクトルのオフセット値（σ）は、例えば、１に設定される。ここでは、Ｎ個の学習用入力ベクトルは、（Ｘ［１］、Ｘ［２］、．．．、Ｘ［Ｎ］）と表記され、Ｍ個の参照ベクトルは、（Ｙ［１］、Ｙ［２］、．．．、Ｙ［Ｍ］）と表記される。

取得部１２は、予め準備されたＮ個の学習用入力データを取得し、この取得された学習用入力データから（ｄ＋１）次元の学習用入力ベクトルを生成するようにしてもよい。また、取得部１２は、学習用入力データからパターン識別部３０の各処理部（入力データ取得部３１、特徴抽出部３２及び変換部３３）により変換された（ｄ＋１）次元の学習用入力ベクトルを取得するようにしてもよい。

認識辞書作成部１０は、変数ｔを１（初期値）に設定し（Ｓ７０２）、変数ｎを１（初期値）に設定する（Ｓ７０３）。

選択部１３は、Ｍ個の参照ベクトルの中から、学習用入力ベクトルＸ［ｎ］と同じクラスに属する各参照ベクトルＹ［ｊ］との間の平方ユークリッド距離の値を計算し、その値が最も小さい参照ベクトルＹ［Ｊ１］を選択する。距離取得部１４は、選択された参照ベクトルＹ［Ｊ１］と学習用入力ベクトルＸ［ｎ］との間の平方ユークリッド距離の値を変数Ｄ１に格納する（Ｓ７０４）。つまり、図７の例では、ベクトル間の距離には、平方ユークリッド距離が利用される。

選択部１３は、Ｍ個の参照ベクトルの中から、学習用入力ベクトルＸ［ｎ］と異なるクラスに属する各参照ベクトルＹ［ｊ］との間の平方ユークリッド距離の値を計算し、その値が最も小さい参照ベクトルＹ［Ｊ２］を選択する。距離取得部１４は、選択された参照ベクトルＹ［Ｊ２］と学習用入力ベクトルＸ［ｎ］との間の平方ユークリッド距離の値を変数Ｄ２に格納する（Ｓ７０５）。ここで、学習用入力ベクトルＸ［ｎ］と同じクラスか否かの判定は、例えば、配列ＣＸ［ｎ］及び配列ＣＹ［ｊ］との比較により行われる。

修正部１５は、上記（式５）を用いて、参照ベクトルＹ［Ｊ１］及びＹ［Ｊ２］を修正する（Ｓ７０６及びＳ７０７）。ここでは、例えば、（式５）におけるｋが２に設定され、パラメータα１及びα２が０．０１に設定される。なお、本実施形態は、ｋ、α１及びα２の各値をこのような値に限定するものではない。

認識辞書作成部１０は、変数ｎが学習用入力ベクトルの総数Ｎより小さい場合には（Ｓ７０８；ＹＥＳ）、変数ｎに１加算する（Ｓ７０９）。認識辞書作成部１０は、その後、選択部１３に処理（Ｓ７０４）を再度実行させる。

一方、認識辞書作成部１０は、変数ｎが学習用入力ベクトルの総数Ｎ以上の場合（Ｓ７０８；ＮＯ）、変数ｔを予め設定された学習回数Ｔと比較する（Ｓ７１０）。認識辞書作成部１０は、変数ｔが学習回数Ｔより小さい場合（Ｓ７１０；ＹＥＳ）、変数ｔに１加算する（Ｓ７１１）。認識辞書作成部１０は、その後、変数ｎを１（初期値）に設定し（Ｓ７０３）、選択部１３に処理（Ｓ７０４）を再度実行させる。

認識辞書作成部１０は、変数ｔが学習回数Ｔ以上の場合には（Ｓ７１０；ＮＯ）、決定部１６に処理させる。決定部１６は、修正後の参照ベクトル（Ｙ［１］、Ｙ［２］、．．．、Ｙ［Ｍ］）のうち、オフセット値の絶対値が所定閾値（例えば１）より小さい参照ベクトルを認識辞書２０として保存する（Ｓ７１２）。

図８は、第２実施形態におけるパターン認識処理の具体例を示すフローチャートである。パターン認識処理では、パターン識別部３０が以下のように動作する。

入力データ取得部３１が入力データを取得する（Ｓ８０１）。特徴抽出部３２は、取得された入力データに対して既定の特徴抽出処理を行うことにより、ｄ次元の特徴ベクトルを生成する（Ｓ８０２）。変換部３３は、ｄ次元の特徴ベクトルの要素に付加要素（０）を加えることにより、（ｄ＋１）次元の入力ベクトルＸを生成する（Ｓ８０３）。

識別部３４は、（ｄ＋１）次元の入力ベクトルＸを変換部３３から取得し、参照ベクトルＹ［ｊ］を認識辞書２０から取得する。識別部３４は、入力ベクトルＸと各参照ベクトルＹ［ｊ］との間の平方ユークリッド距離の値を算出し、その算出値が最も小さい参照ベクトルＹ［Ｊ］を選択する（Ｓ８０４）。

識別部３４は、その選択された参照ベクトルＹ［Ｊ］が属するクラスＣＹ［Ｊ］を識別結果として出力する（Ｓ８０５）。なお、複数の入力データが取得された場合には、処理（Ｓ８０２）から（Ｓ８０５）がその入力データの数分繰り返される。

〔第２実施形態の作用及び効果〕
上述したように、第２実施形態では、認識辞書の生成処理において、上記（式５）により参照ベクトルが修正される。この参照ベクトルの学習に従って、各参照ベクトルに付加される各オフセット値の絶対値は、学習用入力ベクトルと同じクラスに属する参照ベクトルのもの程小さくなり、学習用入力ベクトルと異なるクラスに属する参照ベクトルのもの程大きくなるように修正される。結果として、オフセット値の絶対値が所定閾値以上の参照ベクトルは、識別境界に影響を与えない冗長なデータであるとして除外され、識別境界に影響を与える重要な参照ベクトルのみが認識辞書２０として保存される。

パターン認識時には、入力データから得られた特徴ベクトルが、オフセット値を含む参照ベクトルの次元に合わせられた入力ベクトルに変換され、冗長な参照ベクトルが除外された状態の認識辞書２０から得られる参照ベクトルとその入力ベクトルとの関係から、当該入力データが識別される。

よって、第２実施形態によれば、各参照ベクトルにオフセット値を付加することにより、各参照ベクトルの重要度を自動的に得ることができると共に、冗長な参照ベクトルを適切にかつ簡単に特定することができる。これにより、冗長な参照ベクトルを認識辞書から除外することにより、認識精度を落とすことなく、パターン認識処理を高速化することができる。

［第３実施形態］
上述の第２実施形態における認識辞書の生成処理では、（式５）により、オフセット値を含む参照ベクトルの全要素が修正されたが、オフセット値のみが修正されるようにしてもよい。以下、認識辞書の生成処理においては、各参照ベクトルのオフセット値のみが修正される態様を第３実施形態として説明する。

第３実施形態におけるパターン認識装置７の構成は、第２実施形態と同様であるが、認識辞書作成部１０の修正部１５の処理のみが第２実施形態と異なる。以下、第２実施形態と異なる内容を中心に、第３実施形態におけるパターン認識装置７の構成について説明する。

第３実施形態における修正部１５は、選択部１３により選択された第１の参照ベクトル及び第２の参照ベクトルの各オフセット値を以下の（式１０）を用いて修正する。以下の（式１０）において、σ_１は第１の参照ベクトルＹ_１のオフセット値を示し、σ_２は第２の参照ベクトルＹ_２のオフセット値を示す。ｋは、１より大きい任意の実数であり、オフセット値（σ_１又はσ_２）の絶対値をｋ乗するための値である。関数ｆ（Ｄ_１、Ｄ_２）、パラメータα_１及びα_２、ｋはそれぞれ第２実施形態の上記（式５）と同様である。

上記（式１０）は、上記（式５）から（ｄ＋１）番目の要素（オフセット値及び付加要素（０））に関する計算要素を抜き出したものに相当する。よって、上記（式１０）によりオフセット値を修正すれば、オフセット値は第２実施形態と同様に参照ベクトルの重要度を示すように修正される。

具体的には、各参照ベクトルのオフセット値は、学習用入力ベクトルと同じクラスに属する参照ベクトルのもの程小さくなり、学習用入力ベクトルと異なるクラスに属する参照ベクトルのもの程大きくなるように修正される。その修正量は、対応する学習用入力ベクトルが識別境界に近い程大きくされ、また、誤認識され易い程大きくされる。

〔動作例〕
以下、第３実施形態におけるパターン認識装置７の動作例について説明する。図９は、第３実施形態における認識辞書の生成処理の具体例を示すフローチャートである。なお、パターン認識処理は第２実施形態と同様であるため、ここでは説明を省略する。

処理（Ｓ９０１）及び処理（Ｓ９０２）を除いた残りの処理は、第２実施形態と同様であるため、ここでは説明を省略する。

修正部１５は、上記（式１０）を用いて、参照ベクトルＹ［Ｊ１］のオフセット値σ［Ｊ１］、及び、参照ベクトルＹ［Ｊ２］のオフセット値σ［Ｊ２］を修正する（Ｓ９０１及びＳ９０２）。ここでは、例えば、（式１０）におけるｋが２に設定され、パラメータα１及びα２が０．０１に設定される。なお、本実施形態は、ｋ、α１及びα２の各値をこのような値に限定するものではない。オフセット値σ［ｊ］（ｊ＝１からＭの整数）は、参照ベクトルＹ［ｊ］の（ｄ＋１）番目の要素値を示す配列である。

〔第３実施形態の作用及び効果〕
第３実施形態では、認識辞書２０の生成処理において、各参照ベクトルのオフセット値のみがその重要度を示すように修正される。よって、第３実施形態によれば、第２実施形態と同様の効果を得ることができると共に、ベクトル間の加減算が減ることから、処理負荷を軽減することができる。

なお、上記実施形態の説明は、複数のフローチャートを用いており、それぞれに複数のステップ（処理）を順番に記載しているが、その記載の順番は、本実施形態で実行される処理ステップの各順番を必ずしも限定するものではない。本実施形態では、図示される処理ステップの順番を内容的に支障しない範囲で変更することができる。また、上述した各実施形態は、その内容が相反しない範囲で組み合わせることができる。

この出願は、２０１１年１月１１日に出願された日本出願特願２０１１−００２７２８を基礎とする優先権を主張し、その開示の全てをここに取り込む。
上記の各実施形態の一部又は全部は、以下の付記のようにも特定され得る。但し、各実施形態が以下の記載に限定されるものではない。
（付記１）
複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成装置において、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する取得手段と、
前記取得手段により取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する選択手段と、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得する距離取得手段と、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第１の参照ベクトルとの差分を乗算することにより得られる第１修正ベクトルを用いて前記第１の参照ベクトルを修正し、該係数、前記第１距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの差分を乗算することにより得られる第２修正ベクトルを用いて前記第２の参照ベクトルを修正する修正手段と、
前記修正手段により修正された前記第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する決定手段と、
を備えることを特徴とする認識辞書生成装置。
（付記２）
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする付記１に記載の認識辞書生成装置。
（付記３）
前記修正手段は、前記係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、前記係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正する、
ことを特徴とする付記１又は２に記載の認識辞書生成装置。
（付記４）
付記１から３のいずれか１つに記載の認識辞書生成装置と、
入力データから得られたｄ個の特徴値を含む特徴ベクトルを（ｄ＋１）次元の入力ベクトルに変換する第１変換手段と、
前記決定手段により決定された除外対象の参照ベクトルが削除された前記複数の（ｄ＋１）次元の参照ベクトルから形成される認識辞書と、
前記認識辞書を形成する複数の参照ベクトルと前記第１変換手段により変換された入力ベクトルとを用いて前記入力データの属するクラスを識別する識別手段と、
を備えることを特徴とするパターン認識装置。
（付記５）
複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成方法において、
コンピュータが、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得し、
前記取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択し、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得し、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第１の参照ベクトルとの差分を乗算することにより得られる第１修正ベクトルを用いて前記第１の参照ベクトルを修正し、
前記係数、前記第１距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの差分を乗算することにより得られる第２修正ベクトルを用いて前記第２の参照ベクトルを修正し、
前記修正された第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する、
ことを含む認識辞書生成方法。
（付記６）
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする付記５に記載の認識辞書生成方法。
（付記７）
前記第１の参照ベクトルの修正に代え、前記係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、
前記第２の参照ベクトルの修正に代え、前記係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正する、
ことを特徴とする付記５又は６に記載の認識辞書生成方法。
（付記８）
複数の参照ベクトルから形成される認識辞書を生成するプログラムにおいて、
コンピュータに、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する取得手段と、
前記取得手段により取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する選択手段と、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得する距離取得手段と、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第１の参照ベクトルとの差分を乗算することにより得られる第１修正ベクトルを用いて前記第１の参照ベクトルを修正し、該係数、前記第１距離値のべき乗された値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの差分を乗算することにより得られる第２修正ベクトルを用いて前記第２の参照ベクトルを修正する修正手段と、
前記修正手段により修正された前記第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する決定手段と、
を実現させることを特徴とするプログラム。
（付記９）
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする付記８に記載のプログラム。
（付記１０）
前記修正手段は、前記係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、前記係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正する、
ことを特徴とする付記８又は９に記載のプログラム。

Claims

複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成装置において、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する取得手段と、
前記取得手段により取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する選択手段と、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得する距離取得手段と、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、該係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正する修正手段と、
前記修正手段により修正された前記第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する決定手段と、
を備えることを特徴とする認識辞書生成装置。
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする請求項１に記載の認識辞書生成装置。
請求項１又は２に記載の認識辞書生成装置と、
入力データから得られたｄ個の特徴値を含む特徴ベクトルを（ｄ＋１）次元の入力ベクトルに変換する第１変換手段と、
前記決定手段により決定された除外対象の参照ベクトルが削除された前記複数の（ｄ＋１）次元の参照ベクトルから形成される認識辞書と、
前記認識辞書を形成する複数の参照ベクトルと前記第１変換手段により変換された入力ベクトルとを用いて前記入力データの属するクラスを識別する識別手段と、
を備えることを特徴とするパターン認識装置。
複数の参照ベクトルから形成される認識辞書を生成する認識辞書生成方法において、
コンピュータが、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得し、
前記取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択し、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得し、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、
前記係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正し、
前記修正された第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する、
ことを含む認識辞書生成方法。
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする請求項４に記載の認識辞書生成方法。
複数の参照ベクトルから形成される認識辞書を生成するプログラムにおいて、
コンピュータに、
ｄ（ｄは１以上の整数）個の特徴値、及び、各参照ベクトルの重要度を示すオフセット値をそれぞれ含む（ｄ＋１）次元の複数の参照ベクトルと、（ｄ＋１）次元の学習用入力ベクトルを取得する取得手段と、
前記取得手段により取得された複数の参照ベクトルの中から、前記学習用入力ベクトルと同じクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第１の参照ベクトル、及び、前記学習用入力ベクトルと異なるクラスに属しかつ前記学習用入力ベクトルとの距離が最小となる第２の参照ベクトルを選択する選択手段と、
前記学習用入力ベクトルと前記第１の参照ベクトルとの間の距離を示す第１距離値、及び、前記学習用入力ベクトルと前記第２の参照ベクトルとの間の距離を示す第２距離値を取得する距離取得手段と、
前記第１距離値及び前記第２距離値の関係に応じて変化する係数、前記第２の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第１の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第１の参照ベクトルのオフセット値のみを修正し、該係数、前記第１の参照ベクトルのオフセット値の絶対値のべき乗された値、及び、前記第２の参照ベクトルのオフセット値を乗算することにより得られる値を用いて、前記第２の参照ベクトルのオフセット値のみを修正する修正手段と、
前記修正手段により修正された前記第１の参照ベクトル及び前記第２の参照ベクトルの各オフセット値に応じて、前記認識辞書から除外する参照ベクトルを決定する決定手段と、
を実現させることを特徴とするプログラム。
前記係数は、前記第１距離値と前記第２距離値との間の差が小さい程大きくなる、又は、前記第２距離値が前記第１距離値より小さくかつ前記第１距離値と前記第２距離値との差が大きい程大きくなる、
ことを特徴とする請求項６に記載のプログラム。