JP5214760B2

JP5214760B2 - 学習装置、方法及びプログラム

Info

Publication number: JP5214760B2
Application number: JP2011064354A
Authority: JP
Inventors: 智一河原; 達夫小坂谷
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2011-03-23
Filing date: 2011-03-23
Publication date: 2013-06-19
Anticipated expiration: 2031-03-23
Also published as: US20120246099A1; US8805752B2; JP2012203422A

Description

本発明の実施形態は、学習装置、方法及びプログラムに関する。

近年、識別器の学習手法において、学習データ中の各学習サンプルに当該学習サンプルに応じた属性を人間が予め教示しておき、教示した属性を識別する識別基準である２クラス識別器を学習する手法が提案されている。学習サンプルに与える属性としては、例えば学習サンプルが人間の顔の画像であれば、性別などが該当する。

このような学習手法では、各学習サンプルに予め様々な属性を教示しておき、教示した属性毎の２クラス識別器を学習する。そして、学習された複数の２クラス識別器は、各２クラス識別器の出力値が物体の特徴量として利用されることにより、物体認識などに用いられる。

ＮｅｅｒａｊＫｕｍａｒ，ＡｌｅｘａｎｄｅｒＣ．Ｂｅｒｇ，ＰｅｔｅｒＮ．Ｂｅｌｈｕｍｅｕｒ，ａｎｄＳｈｒｅｅＫ．Ｎａｙａｒ， "ＡｔｔｒｉｂｕｔｅａｎｄＳｉｍｉｌｅＣｌａｓｓｉｆｉｅｒｓｆｏｒＦａｃｅＶｅｒｉｆｉｃａｔｉｏｎ，" ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ（ＩＣＣＶ），２００９．

しかしながら、従来技術では、学習サンプルに対して属性を人間が教示しなければならないため、コストがかかってしまう。

実施形態の学習装置は、選択部と、学習部と、評価部と、を備える。選択部は、各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを１以上含むグループを複数選択する選択処理を複数回行う。学習部は、選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、識別基準群を得る。評価部は、各評価サンプルが複数のカテゴリのいずれかに分類される複数の評価サンプルを記憶する評価サンプル記憶部からカテゴリが異なる２以上の評価サンプルを取得し、取得した前記２以上の評価サンプルを用いて前記識別基準群に含まれる識別基準を評価し、前記識別基準群から評価結果に応じた複数の識別基準を取得して当該複数の識別基準を含む評価基準を生成する。

第１実施形態の学習装置の構成例を示すブロック図。第１実施形態の画像データの特徴量の計算手法例の説明図。第１実施形態の認識テーブルの例を示す図。第１実施形態の識別器群の生成手法例を示す説明図。第１実施形態の認識処理例を示すフローチャート図。第１実施形態の学習処理例を示すフローチャート図。第１実施形態の評価処理例を示すフローチャート図。第１実施形態の学習サンプル格納処理例を示すフローチャート図。第１実施形態の評価サンプル格納処理例を示すフローチャート図。第１実施形態の基準特徴量登録処理例を示すフローチャート図。第２実施形態の学習装置の構成例を示すブロック図。第２実施形態の学習装置の評価処理例を示すフローチャート図。第３実施形態の学習装置の構成例を示すブロック図。第３実施形態の学習装置の評価処理例を示すフローチャート図。第１〜第３実施形態の学習装置のハードウェア構成例を示すブロック図。

（第１実施形態）
図１は、第１実施形態の学習装置１００の構成の一例を示すブロック図である。図１に示すように、学習装置１００は、入力部１０２と、入力受付部１０４と、評価基準記憶部１０６と、特徴量計算部１０８と、認識テーブル記憶部１１０と、類似度計算部１１２と、認識部１１４と、出力制御部１１６と、出力部１１８と、学習サンプル記憶部１２０と、選択部１２２と、学習部１２４と、識別基準群記憶部１２６と、評価サンプル記憶部１２８と、評価部１３０と、格納部１３２とを、備える。

なお、入力部１０２は、例えば、画像入力用のインタフェースなど各種入力インタフェースにより実現できる。また、入力受付部１０４、特徴量計算部１０８、類似度計算部１１２、認識部１１４、出力制御部１１６、選択部１２２、学習部１２４、評価部１３０、及び格納部１３２は、例えば、ＣＰＵ（Central Processing Unit）などの既存の制御装置により実現できる。また、評価基準記憶部１０６、認識テーブル記憶部１１０、学習サンプル記憶部１２０、識別基準群記憶部１２６、及び評価サンプル記憶部１２８は、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、メモリカード、又はＲＡＭ（Random Access Memory）などの磁気的、光学的、又は電気的に記憶可能な既存の記憶装置の少なくともいずれかにより実現できる。また、出力部１１８は、例えば、液晶ディスプレイなど各種出力装置により実現できる。

入力部１０２は、認識対象の目標を含むパターンを入力する。本実施形態では、入力部１０２が、認識対象の目標を含むパターンとして、認識対象の物体を含む画像データを入力する例について説明するが、これに限定されるものではない。認識対象の目標を含むパターンは、例えば、認識対象の音声を含む音声信号などであってもよい。

本実施形態では、入力部１０２により入力される画像データが、Ｄｓ（Ｄｓ≧１）次元ベクトルで表され、ベクトルの各要素が輝度値である場合を例に取り説明するが、これに限定されるものではない。本実施形態では、入力部１０２により入力される画像データＸは、（Ｘ_１，Ｘ_２，…，Ｘ_Ｄｓ）で表されるものとする。

なお入力部１０２は、フィルタ処理、背景の除去、又は物体の位置の正規化など物体を認識し易くするための処理を施した画像データを入力するようにしてもよい。つまり、入力部１０２は、目標を識別し易くするための処理を施したパターンを入力するようにしてもよい。例えば、パターンが音声信号である場合には、入力部１０２は、フィルタ処理などの処理を施した音声信号を入力するようにしてもよい。

また本実施形態では、入力部１０２は、後述の学習サンプルや評価サンプルの入力も行う。

入力受付部１０４は、入力部１０２から入力されたパターンの入力を受け付ける。本実施形態では、入力受付部１０４は、入力部１０２から、認識対象の物体が含まれる画像データＸの入力を受け付ける。また本実施形態では、入力受付部１０４は、入力部１０２から、学習サンプルや評価サンプルの入力も受け付ける。

評価基準記憶部１０６は、複数の識別基準を含む評価基準を記憶する。本実施形態では、評価基準記憶部１０６は、識別器Ｆ_ｊ（ｘ）（１≦ｊ≦Ｏ（Ｏ≧２））を有する評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を記憶する。

特徴量計算部１０８は、評価基準記憶部１０６に記憶されている評価基準を用いて、入力受付部１０４により受け付けられたパターンの特徴量を計算する。本実施形態では、特徴量計算部１０８は、評価基準記憶部１０６に記憶されている評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を用いて、入力受付部１０４により受け付けられた画像データＸの特徴量を計算する。

本実施形態では、評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝に含まれるそれぞれの識別器Ｆ_ｊ（ｘ）が、画像データＸに対し、数式（１）に示すように評価値ｓ_ｊを返却するものとする。評価値ｓ_ｊは、例えば、識別器が予め学習したいずれのグループ（クラス）に属するかを示す尤度やクラス番号などが該当する。このように、識別器Ｆ_ｊ（ｘ）の出力値である評価値ｓ_ｊは、識別対象のグループに属する尤度などとして表されるため、後述の学習部１２４により、いずれの学習手法を用いて識別器Ｆ_ｊ（ｘ）が学習された場合であっても、数式（１）を満たす。

Ｆ_ｊ（Ｘ）＝ｓ_ｊ …（１）

なお本実施形態では、評価値ｓ_ｊがスカラー量である場合を例に取り説明するが、これに限定されるものではなく、例えば、複数の要素を持つベクトルであってもよい。また、後述する内容は、評価値ｓ_ｊがベクトルであっても同様に適用できる。例えば、後述の学習部１２４により、３個以上のグループを識別する学習手法を用いて識別器Ｆ_ｊ（ｘ）が学習された場合、識別器Ｆ_ｊ（ｘ）の出力は、識別対象のグループに含まれる各カテゴリに帰属する尤度を要素に持つようなベクトルとなる。

図２は、画像データＸの特徴量ｖ（Ｘ）の計算手法の一例の説明図である。特徴量計算部１０８は、図２に示すように、入力受付部１０４により受け付けられた画像データＸを評価基準記憶部１０６に記憶されている評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝に適用して、それぞれの識別器Ｆ_ｊ（ｘ）から評価値ｓ_ｊを取得し、取得した評価値ｓ_ｊから画像データＸの特徴量ｖ（Ｘ）を計算する。本実施形態では、特徴量計算部１０８は、図２及び数式（２）に示すように、全ての評価値ｓ_ｊを１つに並べることで画像データＸの特徴量ｖ（Ｘ）を計算する。

ｖ（Ｘ）＝（ｓ_１，ｓ_２，…，ｓ_Ｏ） …（２）

例えば、識別器Ｆ_ｊ（ｘ）が２つのクラスを判別し、評価値ｓ_ｊとして０又は１を出力する関数であるとする。この場合、特徴量計算部１０８は、入力受付部１０４により受け付けられた画像データＸの特徴量を、例えば、ｖ（Ｘ）＝（１，１，０，１，０，…，１）のように、０と１との組み合わせで表現されたベクトルとして計算する。また特徴量計算部１０８は、入力受付部１０４により受け付けられた画像データＸ’（Ｘ’≠Ｘ）の特徴量を計算すると、例えば、ｖ（Ｘ’）＝（０，１，１，１，０，…，０）のように、やはり０と１との組み合わせで表現されたベクトルとして計算するが、計算した特徴量は画像データＸの特徴量と異なるものになる。つまり、この例では、０と１の組み合わせで表現されたベクトルが、画像データＸに含まれる物体の固有の特徴量となり、物体の認識に有効な特徴量となる。なお、識別器Ｆ_ｊ（ｘ）が２つ以上のクラスを判別し、評価値ｓ_ｊとして０及び１以外の実数を出力する関数である場合であっても、上記と同様である。

但し、特徴量の計算手法は上述の手法に限定されるものではなく、取得した評価値ｓ_ｊをどのように用いて特徴量を計算しても構わない。

なお、評価値ｓ_ｊがベクトルの場合、画像データＸの特徴量ｖ（Ｘ）は、評価値ｓ_ｊが持つ各要素を並べたものとなる。つまり、評価値ｓ_ｊの次元数をｄ_ｊとすると、画像データＸの特徴量ｖ（Ｘ）の次元数Ｄは、次元数ｄ_ｊの総和となる（Ｄ＝ｄ_１＋…＋ｄ_Ｏ）。なお、各評価値ｓ_ｊの次元数ｄ_ｊは、全て同じ値でもよいし、それぞれ異なっていてもよい。

また、特徴量計算部１０８は、特徴量ｖ（Ｘ）を評価値ｓ_ｊのヒストグラムとして計算するようにしてもよい。具体的には、特徴量計算部１０８は、評価値ｓ_ｊを離散化（必要なら要素毎に）しておき、その値に該当するビンに対して投票することでヒストグラム特徴量ｖ（Ｘ）を計算することができる。

なお、評価値ｓ_ｊがベクトルの場合、特徴量計算部１０８は、次元数ｄ_ｊのヒストグラムとすることでヒストグラム特徴量ｖ（Ｘ）を計算することができる。また、スカラー量とベクトルのように次元数の異なる評価値ｓ_ｊが混在している場合、特徴量計算部１０８は、同種の評価値ｓ_ｊ毎にヒストグラム特徴量を計算しておき、計算したヒストグラム特徴量を１つのベクトルとして並べることでヒストグラム特徴量ｖ（Ｘ）を計算することができる。

また、特徴量計算部１０８は、評価値ｓ_ｊを１つに並べてベクトル化した特徴量と、評価値ｓ_ｊをヒストグラム化したヒストグラム特徴量とを、更に１つのベクトルとして並べる（連結する）ことで特徴量ｖ（Ｘ）を計算するようにしてもよい。また、特徴量計算部１０８は、評価値ｓ_ｊに非線形な変換を施して特徴量を計算するようにしてもよい。また、特徴量計算部１０８は、計算した特徴量に対して、平均を０にしたり、２乗平均を１にしたりするなどの正規化を行うようにしてもよい。

認識テーブル記憶部１１０は、認識基準となる各基準特徴量にカテゴリを対応付けた認識テーブルを記憶する。ここで、カテゴリとは、目標を認識する際の種類を表し、本実施形態のように目標が物体であれば、物体の名前、重さ、又は値段などが該当する。物体が人間の顔である場合には、例えば、人物の名前又は所属などが該当する。但し、カテゴリはこれらに限定されるものではない。基準特徴量及びカテゴリの組は、特徴量計算部１０８により認識テーブルに登録される。具体的には、特徴量計算部１０８が、評価基準を用いて既知の目標が含まれるパターンの特徴量を計算し、計算した特徴量を基準特徴量として、既知の目標が属するカテゴリに対応付けて認識テーブルに登録する。なお、基準特徴量の計算元となる既知の目標が含まれるパターンは、後述の評価サンプルが該当する。

図３は、認識テーブルの一例を示す図である。図３に示す例では、カテゴリＡとカテゴリＡに属するか否かの認識基準となる基準特徴量ｖ’（Ａ）＝（ａ_１，ａ_２，…，ａ_Ｏ）とが対応付けられており、カテゴリＢとカテゴリＢに属するか否かの認識基準となる基準特徴量ｖ’（Ｂ）＝（ｂ_１，ｂ_２，…，ｂ_Ｏ）とが対応付けられている。

類似度計算部１１２は、特徴量計算部１０８により計算された特徴量と認識テーブル記憶部１１０に記憶されている基準特徴量との類似度を計算する。本実施形態では、類似度計算部１１２は、数式（３）を用いて、特徴量計算部１０８により計算された特徴量ｖ（Ｘ）と認識テーブル記憶部１１０に記憶されている各基準特徴量（基準特徴量ｖ’（Ａ）及び基準特徴量ｖ’（Ｂ）など）との類似度を計算する。

Ｌ＝（α，β）／｜｜α｜｜｜｜β｜｜ …（３）

ここで、数式（３）は、ベクトルαとベクトルβとの単純類似度を計算する数式である。（α，β）は、ベクトルαとベクトルβとの内積を示し、｜｜α｜｜、｜｜β｜｜は、それぞれベクトルα、ベクトルβのノルムを示す。例えば、特徴量ｖ（Ｘ）と基準特徴量ｖ’（Ａ）との類似度Ｌは、数式（３）より、Ｌ＝（ｖ（Ｘ），ｖ’（Ａ））／｜｜ｖ（Ｘ）｜｜｜｜ｖ’（Ａ）｜｜となる。

なお、類似度計算部１１２は、ベクトル間の距離を計算する数式（４）又は数式（５）を用いて、特徴量計算部１０８により計算された特徴量ｖ（Ｘ）と認識テーブル記憶部１１０に記憶されている各基準特徴量（基準特徴量ｖ’（Ａ）及び基準特徴量ｖ’（Ｂ）など）との類似度を計算するようにしてもよい。

認識部１１４は、類似度計算部１１２により計算された類似度を用いて、パターンに含まれる目標を認識する。具体的には、認識部１１４は、類似度計算部１１２により計算された類似度を用いて、パターンに含まれる未知の目標を同定するか、又は未知の目標が属する複数の候補を特定する。本実施形態では、認識部１１４は、認識テーブル記憶部１１０に記憶されている認識テーブルから、類似度計算部１１２により計算された類似度Ｌの値が閾値を超えた基準特徴量のうち類似度Ｌの値が大きい順、即ち、類似度の高い順に所定数の基準特徴量を選択する。そして認識部１１４は、選択した所定数の基準特徴量に対応するカテゴリの少なくともいずれかに、画像データＸに含まれる未知の物体が属すると認識する。なお認識部１１４は、認識テーブル記憶部１１０に記憶されている認識テーブルから、類似度計算部１１２により計算された類似度Ｌのうち類似度の高い順に所定数の基準特徴量を選択するようにしてもよい。

また、類似度計算部１１２が、ベクトル間の距離を計算する数式（４）又は数式（５）を用いて類似度Ｌを計算した場合、ベクトル間の距離が短いほど、即ち、類似度Ｌの値が小さいほど類似度が高くなる。この場合であれば、認識部１１４は、認識テーブル記憶部１１０に記憶されている認識テーブルから、類似度計算部１１２により計算された類似度Ｌが閾値よりも小さい基準特徴量のうち類似度Ｌの値が小さい順に所定数の基準特徴量を選択する。なお、認識部１１４は、認識テーブル記憶部１１０に記憶されている識別テーブルから、類似度計算部１１２により計算された類似度Ｌの値が小さい順に所定数の基準特徴量を選択するようにしてもよい。

出力制御部１１６は、認識部１１４の認識結果を出力部１１８に出力させる。つまり、出力制御部１１６は、パターンに含まれる未知の目標の認識部１１４による同定結果や、パターンに含まれる未知の目標が属すると認識部１１４により特定された複数の候補を出力部１１８に出力させる。本実施形態では、出力制御部１１６は、画像データＸに含まれる未知の物体が属するカテゴリが認識部１１４により選択された場合、選択されたカテゴリを出力部１１８に出力させる。また出力制御部１１６は、画像データＸに含まれる未知の物体が属するカテゴリが認識部１１４により選択されなかった場合、画像データＸに含まれる未知の物体がいずれのカテゴリにも属さない旨を出力部１１８に出力させる。

出力部１１８は、出力制御部１１６により制御され、認識部１１４の認識結果を出力する。

学習サンプル記憶部１２０は、各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する。本実施形態では、学習サンプルとして、Ｄｓ（前述したように、Ｄｓ≧１）次元ベクトルで表わされ、ベクトルの各要素が輝度値である画像データを例に取り説明するが、学習サンプルはこれに限定されるものではない。学習サンプルは、入力部１０２により入力されるパターンに対応していればよく、例えば音声信号などであってもよい。

本実施形態では、学習サンプル記憶部１２０は、Ｍ（Ｍ≧２）の画像データを記憶している。なお、画像データのカテゴリはＣ（Ｃ≧２）用意され、Ｍの画像データはカテゴリ毎にＭ_ｈ（１≦ｈ≦Ｃ）に分類されるものとする。つまり、Ｍ＝Ｍ_１＋…＋Ｍ_Ｃとなる。

選択部１２２は、学習サンプル記憶部１２０から学習サンプルを１以上含むグループを複数選択する選択処理を複数回行う。特に選択部１２２は、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数又はサンプル数が略同数となるように、当該複数のグループを選択する。具体的には、選択部１２２は、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数又はサンプル数のグループ間の差が予め定められた範囲内に収まるように、当該複数のグループを選択する。なお本実施形態では、選択部１２２が、学習サンプル記憶部１２０から学習サンプルを無作為に選択（ランダムサンプリング）するものとする。これにより、選択部１２２により選択される複数のグループに含まれる学習サンプルのカテゴリは、選択部１２２の選択処理毎に異なることが期待できる。但し、学習サンプルの選択手法はこれに限定されるものではなく、選択する複数のグループに含まれる学習サンプルのカテゴリが選択処理毎に異なることが期待できれば、どのような選択基準で選択してもよい。

本実施形態では、選択部１２２は、学習サンプル記憶部１２０から、各グループが画像データを１以上含むようにＫ（Ｋ＝２）個のグループを無作為に選択する選択処理をＮ（Ｎ≧Ｏ）回行う。特に選択部１２２は、選択処理を行う際、Ｋ個のグループのそれぞれに含まれる画像データのカテゴリ数が同数となるように、Ｋ個のグループを無作為に選択する。なお、Ｋの値は２以上であってもよい。

このため選択部１２２は、学習サンプル記憶部１２０から画像データを完全に無作為に選択するのではなく、カテゴリの画像データ数に応じて重み付けを行ってＫ個のグループ間の画像データ数の差を小さくするように調整したり、カテゴリの画像データ数に関わらずある一定数の画像データを抽出するようにしたりしてもよい。なお、画像データ数を一定にする場合、選択部１２２は、さらに単純にカテゴリから画像データを無作為に選択するようにしてもよいし、学習サンプルとしてまだ選択されていない未選択の画像データをカテゴリから優先的に選択するようにしてもよい。

学習部１２４は、選択部１２２により選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、識別基準群を得る。本実施形態では、学習部１２４は、選択部１２２により選択されたＫ個のグループ毎に当該Ｋ個のグループを識別する識別器Ｆ_ｉ（ｘ）（１≦ｉ≦Ｎ）を学習し、学習したＮ個の識別器である識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝を生成する。

本実施形態では、学習部１２４は、サポートベクターマシンにより、Ｋ個のグループを識別する識別器Ｆ_ｉ（ｘ）を学習する。サポートベクターマシンは、２クラスのパターン識別器を構成する手法である。サンプルから、各データとの距離が最大となる分離平面を求め、ソフトマージンを最大化するという基準で学習する。但し、識別器の学習手法はこれに限定されるものではなく、既存の学習手法を用いることができる。例えば、学習部１２４は、ブースティングなどの学習手法を用いることができる。また例えば、選択部１２２により選択された３個のグループを識別する識別器を学習する場合であれば、学習部１２４は、ｋ近傍識別器、ベイズ分類、又はニューラルネットワークなどの学習手法を用いることができる。

図４は、識別器群の生成手法の一例を示す説明図である。なお、図４に示す例では、Ｓ_１〜Ｓ_Ｍ（Ｍ≧１１）が、学習サンプル（画像データ）を示し、Ｃ＝Ｍであるものとする。つまり、図４に示す例では、全ての学習サンプルのカテゴリが異なるものとする。また、図４に示す例では、Ｋ＝２であるものとする。つまり、図４に示す例では、学習サンプル選択部１２２は、各グループに含まれる学習サンプルのカテゴリ数が２となるように、即ち、Ｃ＝Ｍであるため、各グループに含まれる学習サンプル数が２となるように、２個のグループを選択する。

図４に示す例では、選択部１２２は、１回目の選択処理で、学習サンプルＳ_１及びＳ_５を含むグループ１５１ａと、学習サンプルＳ_２及びＳ_７を含むグループ１５１ｂとを、選択している。また、選択部１２２は、２回目の選択処理で、学習サンプルＳ_３及びＳ_８を含むグループ１５２ａと、学習サンプルＳ_１０及びＳ_Ｍを含むグループ１５２ｂとを、選択している。また、選択部１２２は、Ｎ回目の選択処理で、学習サンプルＳ_４及びＳ_９を含むグループ１５３ａと、学習サンプルＳ_６及びＳ_７を含むグループ１５３ｂとを、選択している。

また、学習部１２４は、選択部１２２により１回目の選択処理で選択されたグループ１５１ａとグループ１５１ｂとを識別する識別器Ｆ_１（ｘ）を学習している。また、学習部１２４は、選択部１２２により２回目の選択処理で選択されたグループ１５２ａとグループ１５２ｂとを識別する識別器Ｆ_２（ｘ）を学習している。また、学習部１２４は、選択部１２２によりＮ回目の選択処理で選択されたグループ１５３ａとグループ１５３ｂとを識別する識別器Ｆ_Ｎ（ｘ）を学習している。これにより、学習部１２４は、学習したＮ個の識別器を含む識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝を生成する。

識別基準群記憶部１２６には、学習部１２４により生成された識別基準群が記憶される。具体的には、学習部１２４は、生成した識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝を識別基準群記憶部１２６に格納する（記憶させる）。

評価サンプル記憶部１２８は、各評価サンプルが複数のカテゴリのいずれかに分類される複数の評価サンプルを記憶する。本実施形態では、評価サンプルとして、学習サンプル同様、Ｄｓ（前述したように、Ｄｓ≧１）次元ベクトルで表わされ、ベクトルの各要素が輝度値である画像データを例に取り説明するが、評価サンプルは、これに限定されるものではない。評価サンプルは、学習サンプル同様、入力部１０２により入力されるパターンに対応していればよく、例えば音声信号などであってもよい。但し、評価サンプルは、認識テーブルに登録されている基準特徴量の生成に用いられるパターンであり、当該基準特徴量が対応付けられているカテゴリに属するものとする。また、評価サンプルのカテゴリの分布は、学習サンプルのカテゴリの分布と異なっている（学習サンプルのカテゴリの分布に対して偏っている）ものとする。上記条件さえ満たせば、評価サンプルに学習サンプルを用いるようにしてもよい。

本実施形態では、評価サンプル記憶部１２８は、Ｍ’（Ｍ’≧２）の画像データを記憶している。なお、画像データのカテゴリはＣ’（Ｃ’≧２）用意され、Ｍ’の画像データはカテゴリ毎にＭ_ｇ’（１≦ｇ≦Ｃ’）に分類されるものとする。つまり、Ｍ’＝Ｍ_１’＋…＋Ｍ_Ｃ’’となる。

評価部１３０は、評価サンプル記憶部１２８からカテゴリが異なる２以上の評価サンプルを取得し、取得した２以上の評価サンプルを用いて識別基準群に含まれる識別基準を評価し、識別基準群から評価結果に応じた複数の識別基準を取得して当該複数の識別基準を含む評価基準を生成する。特に評価部１３０は、取得した２以上の評価サンプルを用いて、識別基準群に含まれる識別基準がカテゴリの異なる評価サンプルを識別する識別性能を評価し、評価した識別性能に応じた複数の識別基準を取得する。

具体的には、評価部１３０は、カテゴリが異なる評価サンプル間の類似度を用いて、識別基準群に含まれる識別基準を評価する。例えば、評価部１３０は、取得済みの識別基準と取得前の識別基準それぞれとの組み合わせに、取得した２以上の評価サンプルを適用する。そして評価部１３０は、カテゴリが異なる評価サンプル間での類似度の最大値を組み合わせ毎に特定し、特定した最大値が最も小さい組み合わせに含まれる取得前の識別基準を取得する。なお、評価部１３０は、識別基準を帰納的に取得する。

本実施形態では、評価部１３０は、識別基準群記憶部１２６に記憶されている識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる識別器の有効性を評価する評価処理をＯ（前述したように、Ｏ≧２）回行うものとする。つまり、本実施形態では、評価部１３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝からＯ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）として評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。なお本実施形態では、評価部１３０は、評価処理に評価サンプル記憶部１２８から取得したＭ’の画像データを用いるものとする。

以下、本実施形態の評価処理を詳細に説明する。

まず、１回目の評価処理では、取得済みの識別器が存在しないため、評価部１３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれるそれぞれの識別器Ｆ_ｉ（ｘ）に対し、評価サンプル記憶部１２８から取得したＭ’の画像データを適用する。これにより、識別器Ｆ_ｉ（ｘ）毎に、Ｍ’の画像データそれぞれに対する出力値ｔ_１〜ｔ_Ｍ’が得られる。

次に、評価部１３０は、識別器Ｆ_ｉ（ｘ）毎に、出力値ｔ_１〜ｔ_Ｍ’を用いてカテゴリが異なる画像データ間の類似度を算出する。例えば、出力値ｔ_１の画像データが、出力値ｔ_２〜ｔ_４の画像データと同一カテゴリに属し、出力値ｔ_５〜ｔ_Ｍ’の画像データと異なるカテゴリに属するとする。この場合、評価部１３０は、出力値ｔ_１及びｔ_５〜ｔ_Ｍ’を用いて、出力値ｔ_１の画像データと出力値ｔ_５〜ｔ_Ｍ’のそれぞれの画像データとの類似度を算出する。評価部１３０は、出力値ｔ_２〜ｔ_Ｍ’の画像データについても同様の手法で異なるカテゴリに属する画像データとの類似度を算出する。なお、類似度の算出手法はどのような手法であってもよく、例えば、前述した数式（３）、数式（４）、又は数式（５）を用いて算出してもよい。

そして評価部１３０は、算出した類似度の最大値を識別器Ｆ_ｉ（ｘ）毎に特定し、特定した類似度の最大値の中から、最大値が最も小さい識別器Ｆ_ｉ（ｘ）を取得する。

続いて、２回目以降の評価処理では、評価部１３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる識別器Ｆ_ｉ（ｘ）のうち、取得済みの全ての識別器と取得前の識別器それぞれとの組み合わせに対し、評価サンプル記憶部１２８から取得したＭ’の画像データを適用する。これにより、識別器の組み合わせ毎に、Ｍ’の画像データそれぞれに対する出力値ｔ_１〜ｔ_Ｍ’が得られる。

例えば、１回目の評価処理で識別器Ｆ_３（ｘ）が取得されたとする。この場合、２回目の評価処理では、評価部１３０は、取得済みの全ての識別器である識別器Ｆ_３（ｘ）と取得前の識別器Ｆ_１（ｘ）〜Ｆ_２（ｘ）、Ｆ_４（ｘ）〜Ｆ_Ｎ（ｘ）それぞれとの組み合わせである｛Ｆ_３（ｘ），Ｆ_１（ｘ）｝、｛Ｆ_３（ｘ），Ｆ_２（ｘ）｝、…、｛Ｆ_３（ｘ），Ｆ_Ｎ（ｘ）｝に対し、Ｍ’の画像データを適用する。また例えば、１回目の評価処理で識別器Ｆ_３（ｘ）が取得され、２回目の評価処理で識別器Ｆ_２（ｘ）が取得されたとする。この場合、３回目の評価処理では、評価部１３０は、取得済みの全ての識別器である識別器Ｆ_３（ｘ）及びＦ_２（ｘ）と取得前の識別器Ｆ_１（ｘ）、Ｆ_４（ｘ）〜Ｆ_Ｎ（ｘ）それぞれとの組み合わせである｛Ｆ_３（ｘ），Ｆ_２（ｘ），Ｆ_１（ｘ）｝、｛Ｆ_３（ｘ），Ｆ_２（ｘ），Ｆ_４（ｘ）｝、…、｛Ｆ_３（ｘ），Ｆ_２（ｘ），Ｆ_Ｎ（ｘ）｝に対し、Ｍ’の画像データを適用する。

次に、評価部１３０は、識別器の組み合わせ毎に、取得した画像データの出力値ｔ_１〜ｔ_Ｍ’を用いてカテゴリが異なる画像データ間の類似度を算出する。そして評価部１３０は、算出した類似度の最大値を識別器の組み合わせ毎に特定し、特定した類似度の最大値の中から、最大値が最も小さい識別器の組み合わせに含まれる取得前の識別器Ｆ_ｉ（ｘ）を取得する。

本実施形態では、評価部１３０は、上述した評価処理をＯ回繰り返すことにより、Ｏ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）にナンバリングし直して評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。例えば、Ｏ回の評価処理によりＯ個の識別器Ｆ_３（ｘ）、Ｆ_４（ｘ）、…、Ｆ_１（ｘ）がこの順番で取得されたとする。この場合、評価部１３０は、識別器Ｆ_３（ｘ）をＦ_１（ｘ）、識別器Ｆ_４（ｘ）をＦ_２（ｘ）、…、識別器Ｆ_１（ｘ）をＦ_Ｏ（ｘ）にナンバリングし直して評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。

格納部１３２は、入力受付部１０４により受け付けられた学習サンプルを学習サンプル記憶部１２０に格納したり、入力受付部１０４により受け付けられた評価サンプルを評価サンプル記憶部１２８に格納したりする。

図５は、第１実施形態の学習装置１００で行われる認識処理の手順の流れの一例を示すフローチャート図である。

まず、入力受付部１０４は、入力部１０２から、認識対象の未知の物体を含む画像データの入力を受け付ける（ステップＳ１００）。

続いて、特徴量計算部１０８は、評価基準記憶部１０６に記憶されている評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を用いて、入力受付部１０４により受け付けられた画像データの特徴量を計算する（ステップＳ１０２）。

続いて、類似度計算部１１２は、特徴量計算部１０８により計算された特徴量と認識テーブル記憶部１１０に記憶されている各基準特徴量との類似度を計算する（ステップＳ１０４）。

続いて、認識部１１４は、認識テーブル記憶部１１０に記憶されている認識テーブルから、類似度計算部１１２により計算された類似度の値が閾値を超えた基準特徴量のうち類似度が上位の基準特徴量を選択し、選択した基準特徴量に対応するカテゴリの少なくともいずれかに、画像データに含まれる未知の物体が属すると認識する（ステップＳ１０６）。なお、認識部１１４は、類似度計算部１１２により計算された類似度の値が閾値を超える基準特徴量が存在しない場合、画像データに含まれる未知の物体はいずれのカテゴリにも属さないと認識する。

続いて、出力制御部１１６は、認識部１１４の認識結果、即ち、認識部１１４により認識された未知の物体のカテゴリ、又は未知の物体がいずれのカテゴリにも属さないことを出力部１１８に出力させる（ステップＳ１０８）。

図６は、第１実施形態の学習装置１００で行われる学習処理の手順の流れの一例を示すフローチャート図である。

まず、選択部１２２は、学習サンプル記憶部１２０から、それぞれ画像データを１つ以上含む２つのグループを選択する（ステップＳ２００）。この際、選択部１２２は、選択する２つのグループのそれぞれに含まれる画像データのカテゴリ数のグループ間の差が予め定められた範囲内に収まるように、当該２つのグループを選択する。

続いて、学習部１２４は、選択部１２２により選択された２つのグループを識別する識別器を学習する（ステップＳ２０２）。

続いて、選択部１２２は、例えば、選択がＮ回行われていない場合には、選択を続行すると判定し（ステップＳ２０４でＹｅｓ）、ステップＳ２００に戻り、選択がＮ回行われている場合には、選択を続行しないと判定し（ステップＳ２０４でＮｏ）、ステップＳ２０６へ進む。

続いて、学習部１２４は、ステップＳ２０２で学習した識別器群を識別基準群記憶部１２６に格納する（ステップＳ２０６）。

図７は、第１実施形態の学習装置１００で行われる評価処理の手順の流れの一例を示すフローチャート図である。

まず、評価部１３０は、識別基準群記憶部１２６に記憶されている識別器群から取得前の識別器のうち未選択のものを１つ選択する（ステップＳ３００）。

続いて、評価部１３０は、識別基準群記憶部１２６に記憶されている識別器群から取得済みの全ての識別器と選択された取得前の識別器との識別器の組み合わせに対し、評価サンプル記憶部１２８から取得したカテゴリが異なる２以上の画像データを適用し、カテゴリが異なる画像データ間の類似度を算出する（ステップＳ３０２）。なお、１回目の評価処理では、取得済みの識別器が存在しないため、評価部１３０は、選択された取得前の識別器に対し、カテゴリが異なる２以上の画像データを適用し、カテゴリが異なる画像データ間の類似度を算出する。

続いて、評価部１３０は、算出した類似度の最大値を特定する（ステップＳ３０４）。

続いて、評価部１３０は、未評価の識別器の組み合わせがある場合（ステップＳ３０６でＹｅｓ）、即ち、識別器群に未選択の取得前の識別器がある場合、ステップＳ３００に戻る。一方、評価部１３０は、未評価の識別器の組み合わせがない場合（ステップＳ３０６でＮｏ）、即ち、識別器群に未選択の取得前の識別器がない場合、ステップＳ３０８へ進む。

続いて、評価部１３０は、識別器の組み合わせ毎に特定した類似度の最大値の中から、類似度の最大値が最も小さい識別器の組み合わせに含まれる取得前の識別器を取得する（ステップＳ３０８）。なお、１回目の評価処理では、評価部１３０は、識別器毎に特定した類似度の最大値の中から、類似度の最大値が最も小さい識別器を取得する。

続いて、評価部１３０は、例えば、評価処理がＯ回行われていない場合には、評価処理を続行すると判定し（ステップＳ３１０でＹｅｓ）、ステップＳ３００に戻る。この場合、ステップＳ３０８において新たな識別器が取得されているため、取得前の識別器を全て未選択に戻して処理を再開する。一方、評価部１３０は、評価処理がＯ回行われている場合には、評価処理を続行しないと判定し（ステップＳ３１０でＮｏ）、ステップＳ３１２へ進む。

続いて、評価部１３０は、取得済みの全ての識別器を含む評価基準を生成し、評価基準記憶部１０６に格納する（ステップＳ３１２）。

図８は、第１実施形態の学習装置１００で行われる学習サンプル格納処理の手順の流れの一例を示すフローチャート図である。なお、図８に示す学習サンプル格納処理は、例えば、学習装置１００の工場出荷時などに行われる。

まず、入力受付部１０４は、入力部１０２から、学習サンプルとして、既知の物体を含む画像データの入力を受け付ける（ステップＳ４００）。

続いて、格納部１３２は、入力受付部１０４により学習サンプルとして受け付けられた画像データを学習サンプル記憶部１２０に格納する（ステップＳ４０２）。

図９は、第１実施形態の学習装置１００で行われる評価サンプル格納処理の手順の流れの一例を示すフローチャート図である。なお、図９に示す評価サンプル格納処理は、例えば、学習装置１００の出荷後にユーザなどにより行われる。

まず、入力受付部１０４は、入力部１０２から、評価サンプルとして、既知の物体を含む画像データの入力を受け付ける（ステップＳ５００）。

続いて、格納部１３２は、入力受付部１０４により評価サンプルとして受け付けられた画像データを評価サンプル記憶部１２８に格納する（ステップＳ５０２）。

図１０は、第１実施形態の学習装置１００で行われる基準特徴量登録処理の手順の流れの一例を示すフローチャート図である。

まず、入力受付部１０４は、入力部１０２から、既知の物体を含む画像データの入力を受け付ける（ステップＳ６００）。ここで、入力受付部１０４が受け付ける既知の物体を含む画像データは、評価サンプル記憶部１２８に格納されている少なくともいずれかの画像データと同一の画像データである。

続いて、特徴量計算部１０８は、評価基準記憶部１０６に記憶されている評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を用いて、入力受付部１０４により受け付けられた画像データの特徴量を計算する（ステップＳ６０２）。

続いて、特徴量計算部１０８は、計算した特徴量を基準特徴量として、入力受付部１０４により受け付けられた画像データに含まれる既知の物体が属するカテゴリに対応付けて認識テーブルに登録する（ステップＳ６０４）。

以上のように、第１実施形態の学習装置１００では、複数のグループ毎に、当該複数のグループを識別する識別基準、即ち各グループに含まれる学習サンプルのカテゴリ又はカテゴリの組み合わせをグループ間で識別する識別基準を学習する。そして第１実施形態の学習装置１００では、複数のグループの選択、即ち、各グループに含まれる学習サンプルのカテゴリ又はカテゴリの組み合わせの選択は、選択部１２２により自動的に行われる。このため、第１実施形態の学習装置１００によれば、人間が識別基準を教示する必要がなく、識別基準の学習に伴うコストを削減することができる。これに対し、従来技術の手法では、識別基準となる属性を人間が教示しなければならないため、識別基準の学習に伴うコストがかかってしまう。

また第１実施形態の学習装置１００では、グループの組み合わせ数、即ち、グループに含まれる学習サンプルのカテゴリ又はカテゴリの組み合わせのグループ間の組み合わせ数は、膨大な数になる傾向にある。このため第１実施形態の学習装置１００によれば、上限にとらわれず、必要なだけ識別基準を学習して、評価基準を生成することができる。これに対し、従来技術の手法では、識別基準は、例えば性別や人種、年代など、教示する人間にとって明確に判断可能なものに限られるため、学習可能な識別基準の数に限界がある。

また第１実施形態の学習装置１００では、選択部１２２は、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数又はサンプル数のグループ間の差が予め定められた範囲内に収まるように、当該複数のグループを無作為に選択する。つまり第１実施形態の学習装置１００では、識別対象の複数のグループのそれぞれを無作為かつ均等な分布を有するように選択する。このようにして選択された複数のグループを識別するように学習された識別基準は、認識対象の目標が含まれるパターンに対する評価値、即ち、学習に用いた複数のグループのいずれに属すると判定されるかが完全にランダムとなる。

従って、例えば、目標を含む２つのパターンそれぞれに同一の識別基準を用いると、２つのパターンそれぞれに含まれる目標が同一である場合は、評価値の値が同一となること、即ち、両目標が識別対象の複数のグループのうちのいずれかのグループに類似することが期待できる。一方、２つのパターンそれぞれに含まれる目標が異なる場合は、評価値の値がどのような値となるかは不定、即ち、無相関となる。ここで、互いに異なる目標を含む２つのパターンそれぞれに対する評価値が無相関であるということは、例えば、目標認識を行う際の類似度計算に正規化相関などを利用した場合、類似度がゼロになるということを示す。

つまり、第１実施形態の学習装置１００では、選択する複数のグループのそれぞれに含まれる学習サンプルのカテゴリ数又はサンプル数のグループ間の差が予め定められた範囲内に収まるように、当該複数のグループを無作為に選択することにより、この複数のグループを識別する識別基準には、異なる目標の類似度を分離するような変換が、組み込まれているという特徴を持つ。

従って、第１実施形態の学習装置１００によれば、パターンに含まれる目標を識別するために有効、即ち、目標認識の認識精度において好適な識別基準を含む評価基準を学習サンプルから効率的かつ高速に学習することができる。これに対し、従来技術の手法では、識別基準となる属性（例えば、ある人物とそれ以外の人物）によっては、学習サンプルが一方（それ以外の人物）に偏って学習されるため、識別基準の評価値の分布にも偏りが出てしまい、画像データに含まれる物体を認識するために有効な評価基準とならない場合がある。

但し上述した手法で識別基準を学習した場合であっても、目標認識に用いる認識テーブル（基準特徴量及びカテゴリの組）の分布に偏りがある場合、即ち、基準特徴量の生成に用いたパターンの分布が、評価基準の生成に用いた学習サンプルの分布に対して偏っている場合、２つのパターンそれぞれに含まれる目標が異なっていても、評価値の値が無相関になるとは限らない。例えば、学習サンプルを工場出荷時に用意し、工場出荷後にユーザが認識テーブルを用意するような場合、認識テーブルの分布が学習サンプルの分布に対して偏ってしまうことが想定される。

このため、第１実施形態の学習装置１００では、基準特徴量の生成に用いるパターンである評価サンプルを学習部１２４により学習された識別基準に適用し、当該識別基準をカテゴリが異なる評価サンプル間の類似度を用いて評価し、評価サンプル間の距離が離れるような識別基準を取得して、評価基準を生成する。つまり、第１実施形態の学習装置１００では、学習部１２４により学習された識別基準のうち識別に有効でない識別基準、即ち、基準特徴量との関係で目標を識別できない識別基準を排除して評価基準を生成する。従って第１実施形態の学習装置１００によれば、目標認識に用いる認識テーブル（基準特徴量及びカテゴリの組）の分布に偏りがある場合であっても、含まれている目標が異なる２つのパターンの評価値の値を無相関とすることができ、目標認識により好適な識別基準を含む評価基準を生成することができる。

また第１実施形態の学習装置１００によれば、識別に有効でない識別基準を排除して評価基準を生成するので、評価基準を用いた特徴量の計算処理量や認識テーブルのメモリサイズを削減することができる。

（第２実施形態）
第２実施形態では、クラス内分散及びクラス間分散を用いて識別基準を評価する例について説明する。以下では、第１実施形態との相違点の説明を主に行い、第１実施形態と同様の機能を有する構成要素については、第１実施形態と同様の名称・符号を付し、その説明を省略する。

図１１は、第２実施形態の学習装置２００の構成の一例を示すブロック図である。図１１に示すように、第２実施形態の学習装置２００では、評価部２３０が第１実施形態の学習装置１００と相違する。

評価部２３０は、取得した２以上の評価サンプルのクラス内分散及びクラス間分散の少なくとも一方を用いて、識別基準群に含まれる識別基準を評価する。具体的には、評価部２３０は、識別基準群に含まれる各識別基準に、取得した２以上の評価サンプルを適用して、当該２以上の評価サンプルのクラス間分散をクラス内分散で除した値を識別基準毎に算出し、算出した値が高い順に複数の識別基準を取得する。また、評価部２３０は識別基準を帰納的に取得する。なお、以下では、クラス間分散をクラス内分散で除した値を分離値と称する。

ここで、クラス内分散は、同一カテゴリ内の評価サンプル同士の距離の近さを表し、値が小さいほど同一カテゴリ内の評価サンプル同士の距離が近いことを意味する。クラス間分散は、異なるカテゴリ間の評価サンプル同士の距離の近さを表し、値が大きいほど異なるカテゴリ間の評価サンプル同士の距離が遠いことを意味する。従って、分離値が大きいほど、カテゴリ内およびカテゴリ間の分離がよいことを意味し、分離値が大きい識別基準ほど識別性能が高いことを示す。

但し、評価手法はこれに限定されるものではなく、取得した２以上の評価サンプルのクラス内分散及びクラス間分散の少なくとも一方を用いて識別基準群に含まれる識別基準を評価していればよい。

本実施形態では、評価部２３０は、評価サンプル記憶部１２８から取得したＭ’の画像データを用いて、識別基準群記憶部１２６に記憶されている識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる各識別器Ｆ_ｉ（ｘ）の有効性を評価する。そして、評価部２３０は、有効性の高い順にＯ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）として評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。

具体的には、評価部２３０は、上述した評価をＯ回繰り返すことにより、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる識別器Ｆ_ｉ（ｘ）毎に、数式（６）を用いて、当該識別器Ｆ_ｉ（ｘ）におけるＭ’の画像データの分離値を算出する。そして、評価部２３０は、分離値の高い順にＯ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）にナンバリングし直して評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。

ここで、Ｓ（Ｆ）が識別器におけるＭ’の画像データの分離値を示し、Ｓ_Ｂ（Ｆ）が識別器におけるＭ’の画像データのクラス間分散を示し、Ｓ_Ｗ（Ｆ）が識別器におけるＭ’の画像データのクラス内分散を示す。Ｓ_Ｂ（Ｆ）は、数式（７）により求められる。

ここで、Ｃ’は、前述したように、評価サンプル記憶部１２８に記憶されている画像データ（評価サンプル）のカテゴリ数を示し、Ｍ_ｇ’は、前述したように、ｇのカテゴリに属する画像データ数（評価サンプル数）を示す。ｔは転置を示す。ｍ_ｇは、数式（８）により求められ、ｍは、数式（９）により求められる。

ここで、ｘ_ｇｋは、ｇのカテゴリに属するｋ（１≦ｋ≦Ｍ_ｇ’）番目の画像データ（評価サンプル）を示す。

数式（６）に戻り、Ｓ_Ｗ（Ｆ）は、数式（１０）により求められる。

Ｓ_ｇ（Ｆ）は、数式（１１）により求められる。

図１２は、第２実施形態の学習装置２００で行われる評価処理の手順の流れの一例を示すフローチャート図である。

まず、評価部２３０は、識別基準群記憶部１２６に記憶されている識別器群から未選択の識別器を１つ選択する（ステップＳ７００）。

続いて、評価部２３０は、選択された識別器に評価サンプル記憶部１２８から取得したカテゴリが異なる２以上の画像データを適用し、選択された識別器における当該２以上の画像データの分離値を算出する（ステップＳ７０２）。

続いて、評価部２３０は、識別器群に未選択の識別器がある場合（ステップＳ７０４でＹｅｓ）、ステップＳ７００に戻り、識別器群に未選択の識別器がない場合（ステップＳ７０４でＮｏ）、ステップＳ７０６へ進む。

続いて、評価部２３０は、算出した分離値が高い順に複数、例えばＯ個の識別器を取得して評価基準を生成し、評価基準記憶部１０６に格納する（ステップＳ７０６）。

以上のように、第２実施形態の学習装置２００では、基準特徴量の生成に用いるパターンである評価サンプルを学習部１２４により学習された識別基準に適用して、当該識別基準を評価サンプルの分離値（評価サンプルのクラス間分散をクラス内分散で除した値）を用いて評価し、評価サンプル間の距離が離れるような識別基準を取得して、評価基準を生成する。このため、第２実施形態の学習装置２００においても、目標認識に用いる認識テーブル（基準特徴量及びカテゴリの組）の分布に偏りがある場合であっても、含まれている目標が異なる２つのパターンの評価値の値を無相関とすることができ、目標認識により好適な識別基準を含む評価基準を生成することができる。また、識別に有効でない識別基準を排除して評価基準を生成するので、評価基準を用いた特徴量の計算処理量や認識テーブルのメモリサイズを削減することができる。

（第３実施形態）
第３実施形態では、ソフトマージンを用いて識別基準を評価する例について説明する。以下では、第１実施形態との相違点の説明を主に行い、第１実施形態と同様の機能を有する構成要素については、第１実施形態と同様の名称・符号を付し、その説明を省略する。

図１３は、第３実施形態の学習装置３００の構成の一例を示すブロック図である。図１３に示すように、第３実施形態の学習装置３００では、評価部３３０が第１実施形態の学習装置１００と相違する。

学習部１２４は、第１実施形態同様、サポートベクターマシンにより識別基準を学習する。

評価部３３０は、カテゴリが異なる評価サンプル間のソフトマージンを用いて、識別基準群に含まれる識別基準を評価する。具体的には、評価部３３０は、取得済みの識別基準と取得前の識別基準それぞれとの組み合わせに、取得した２以上の評価サンプルを適用する。そして評価部３３０は、ソフトマージンの最大値を組み合わせ毎に特定し、特定した最大値が最も小さい組み合わせに含まれる取得前の識別基準を取得する。なお、評価部３３０は、識別基準を帰納的に取得する。

本実施形態においても、評価部３３０は、評価サンプル記憶部１２８から取得したＭ’の画像データを用いて、識別器の有効性を評価する評価処理をＯ回行う。そして評価部３３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝からＯ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）として評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。

以下、本実施形態の評価処理を詳細に説明する。

まず、評価部３３０は、評価処理を行う前に、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる識別器Ｆ_ｉ（ｘ）毎に、評価サンプル記憶部１２８から取得したＭ’の画像データのＣ’（前述したように、Ｃ’≧２）のカテゴリを正クラスと負クラスの２つのクラスに分ける。具体的には、評価部３３０は、Ｍ’の画像データのｇ（前述したように、１≦ｇ≦Ｃ’）のカテゴリ毎に、当該ｇのカテゴリに属するＭ_ｇ’の画像データを識別器Ｆ_ｉ（ｘ）に適用し、識別器Ｆ_ｉ（ｘ）の出力値が正の値となる画像データの数と出力値が負の値となる画像データの数とを比較する。そして、評価部３３０は、正の値となる画像データの数の方が多ければ、ｇのカテゴリを正クラスに決定し、負の値となる画像データの数の方が多ければ、ｇのカテゴリを負クラスに決定する。

なお本実施形態では、正クラスのカテゴリに属する画像データのソフトマージンは、識別器Ｆ_ｉ（ｘ）の出力値が０以上であれば０とし、出力値が負の値であればその絶対値とする。また、負クラスのカテゴリに属する画像データのソフトマージンは、識別器Ｆ_ｉ（ｘ）の出力値が０以下であれば０とし、出力値が正の値であればその絶対値とする。

次に、１回目の評価処理では、取得済みの識別器が存在しないため、評価部３３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれるそれぞれの識別器Ｆ_ｉ（ｘ）に対し、評価サンプル記憶部１２８から取得したＭ’の画像データを適用する。これにより、識別器Ｆ_ｉ（ｘ）毎に、Ｍ’の画像データそれぞれのソフトマージンが得られる。

そして評価部３３０は、得られたソフトマージンの最大値を識別器Ｆ_ｉ（ｘ）毎に特定し、特定したソフトマージンの最大値の中から、最大値が最も小さい識別器Ｆ_ｉ（ｘ）を取得する。

続いて、２回目以降の評価処理では、評価部３３０は、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝に含まれる識別器Ｆ_ｉ（ｘ）のうち、取得済みの全ての識別器と取得前の識別器それぞれとの組み合わせに対し、評価サンプル記憶部１２８から取得したＭ’の画像データを適用する。これにより、識別器の組み合わせ毎に、Ｍ’の画像データそれぞれのソフトマージンが得られる。なお、識別器の組み合わせにおける画像データのソフトマージンは、識別器の組み合わせに含まれる各識別器の画像データのソフトマージンの合計値とする。例えば、｛Ｆ_３（ｘ），Ｆ_１（ｘ）｝の組み合わせにおける画像データのソフトマージンは、識別器Ｆ_３（ｘ）における画像データのソフトマージンと識別器Ｆ_１（ｘ）における画像データのソフトマージンとの合計値となる。そして評価部３３０は、得られたソフトマージンの最大値を識別器の組み合わせ毎に特定し、特定したソフトマージンの最大値の中から、最大値が最も小さい識別器の組み合わせに含まれる取得前の識別器Ｆ_ｉ（ｘ）を取得する。

本実施形態では、評価部３３０は、上述した評価処理をＯ回繰り返すことにより、Ｏ個の識別器Ｆ_ｉ（ｘ）を取得し、取得したＯ個の識別器Ｆ_ｉ（ｘ）を識別器Ｆ_ｊ（ｘ）にナンバリングし直して評価基準｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｏ（ｘ）｝を生成する。
なお評価部３３０は、得られたソフトマージンの最大値を識別器の組み合わせ（識別器）毎に特定するのではなく、得られたソフトマージンの総和を識別器の組み合わせ（識別器）毎に特定し、特定したソフトマージンの総和の中から、総和が最も小さい識別器の組み合わせに含まれる取得前の識別器Ｆ_ｉ（ｘ）を取得するようにしてもよい。

図１４は、第３実施形態の学習装置３００で行われる評価処理の手順の流れの一例を示すフローチャート図である。

まず、評価部３３０は、識別基準群記憶部１２６に記憶されている識別器群に含まれる識別器毎に、評価サンプル記憶部１２８に記憶されている画像データのカテゴリのクラスを決定する（ステップＳ８００）。

続いて、評価部３３０は、識別基準群記憶部１２６に記憶されている識別器群から取得前の識別器のうち未選択のものを１つ選択する（ステップＳ８０２）。

続いて、評価部３３０は、識別基準群記憶部１２６に記憶されている識別器群から取得済みの全ての識別器と選択された取得前の識別器との識別器の組み合わせに対し、評価サンプル記憶部１２８から取得したカテゴリが異なる２以上の画像データを適用し、各画像データのソフトマージンを算出する（ステップＳ８０４）。なお、１回目の評価処理では、取得済みの識別器が存在しないため、評価部３３０は、選択された取得前の識別器に対し、カテゴリが異なる２以上の画像データを適用し、各画像データのソフトマージンを算出する。

続いて、評価部３３０は、算出したソフトマージンの最大値を特定する（ステップＳ８０６）。

続いて、評価部３３０は、未評価の識別器の組み合わせがある場合（ステップＳ８０８でＹｅｓ）、即ち、識別器群に未選択の取得前の識別器がある場合、ステップＳ８０２に戻る。一方、評価部３３０は、未評価の識別器の組み合わせがない場合（ステップＳ８０８でＮｏ）、即ち、識別器群に未選択の取得前の識別器がない場合、ステップＳ８１０へ進む。

続いて、評価部３３０は、識別器の組み合わせ毎に特定したソフトマージンの最大値の中から、最大値が最も小さい識別器の組み合わせに含まれる取得前の識別器を取得する（ステップＳ８１０）。なお、１回目の評価処理では、評価部３３０は、識別器毎に特定したソフトマージンの最大値の中から、最大値が最も小さい識別器を取得する。

続いて、評価部３３０は、例えば、評価処理がＯ回行われていない場合には、評価処理を続行すると判定し（ステップＳ８１２でＹｅｓ）、ステップＳ８０２に戻る。この場合、ステップＳ８１０において新たな識別器が取得されているため、取得前の識別器を全て未選択に戻して処理を再開する。一方、評価部３３０は、評価処理がＯ回行われている場合には、評価処理を続行しないと判定し（ステップＳ８１２でＮｏ）、ステップＳ８１４へ進む。

続いて、評価部３３０は、取得済みの全ての識別器を含む評価基準を生成し、評価基準記憶部１０６に格納する（ステップＳ８１４）。

以上のように、第３実施形態の学習装置３００では、基準特徴量の生成に用いるパターンである評価サンプルを学習部１２４により学習された識別基準に適用して、当該識別基準をソフトマージンで評価し、評価サンプル間の距離が離れるような識別基準を取得して、評価基準を生成する。このため、第３実施形態の学習装置３００においても、目標認識に用いる認識テーブル（基準特徴量及びカテゴリの組）の分布に偏りがある場合であっても、含まれている目標が異なる２つのパターンの評価値の値を無相関とすることができ、目標認識により好適な識別基準を含む評価基準を生成することができる。また、識別に有効でない識別基準を排除して評価基準を生成するので、評価基準を用いた特徴量の計算処理量や認識テーブルのメモリサイズを削減することができる。

（変形例）
なお、上記第１及び第３実施形態において、評価部は、１回目の評価処理において、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝のうちの予め定められた識別器を、１つ目の識別器として取得するようにしてもよい。また評価部は、１回目の評価処理で取得する１つ目の識別器を、識別器群｛Ｆ_１（ｘ），Ｆ_２（ｘ），…，Ｆ_Ｎ（ｘ）｝の中からランダムで取得するようにしてもよい。また、評価部は、１回目の評価処理で予め定められた識別器やランダムで識別器を取得する場合には、評価基準を複数生成し、生成した複数の評価基準の中から、カテゴリが最も異なる（離れている）評価サンプル間の類似度の最大値が最も小さい評価基準を評価基準とするようにしてもよい。

また、上記第１及び第３実施形態において、評価部は、評価処理を行う毎に、取得済みの全ての識別器の組み合わせに評価サンプルを適用して、当該組み合わせの正解率を計算し、計算した正解率が最も高い組み合わせを評価基準とするようにしてもよい。この場合、評価部は、評価処理をＮ回行うようにしてもよい。また、正解率は、ある段階までは評価処理を行う毎に高くなりその後低くなることが予想されるため、評価部は、正解率が最も高い組み合わせを判別できた時点で評価処理を終了するようにしてもよい。また、正解率の計算は、識別器の取得を全て終えた後にまとめて行うようにしてもよい。評価部は、例えば、取得済みの全ての識別器の組み合わせを用いた特徴抽出を全ての評価サンプルに対して施し、抽出した特徴を利用して、最も近似する評価サンプルとカテゴリが同一である評価サンプルの総数を計算し、計算した評価サンプルの総数を全評価サンプル数で除すことにより、正解率を計算する。なお、正解率を用いる場合、評価基準に含まれる識別器の数（評価処理の回数）は、正解率に依存するため、Ｏ個になるとは限らない。

また、上記第１乃至第３実施形態を適宜組み合わせるようにしてもよい。例えば、カテゴリが異なる評価サンプル間での類似度の最大値が最も小さいものにソフトマージンに加えたものを用いて、識別器を評価するようにしてもよい。

また、上記各実施形態において、識別器の出力が３段階（例えば、０、１、又は２）の場合には、同一カテゴリに属する評価サンプル同士の出力が一致する数や異なる数、また異なるカテゴリに属する評価サンプル同士の出力が一致する数や異なる数などを用いて、識別器を評価するようにしてもよい。

また、上記各実施形態では、画像データを評価基準に適用して特徴量を計算する例について説明したが、画像データの画像特徴を抽出し、抽出した画像特徴を評価基準に適用して特徴量を計算するようにしてもよい。この場合、学習サンプルや評価サンプルも画像データの画像特徴とすればよい。

また、上記各実施形態では、評価サンプルは認識テーブルに登録されている基準特徴量の生成に用いられたパターンである例について説明したが、基準特徴量の生成に使用したパターンと分布が同じであれば、評価サンプルはこれらと異なってもよい。例えば、基準特徴量の生成用に用意した各カテゴリのパターンが複数ある場合に、一部を基準特徴量の生成に使用し、別の一部を評価サンプルとして使用してもよい。この場合、基準特徴量の生成に使用したパターンと評価サンプルの分布とが同じとみなすことができる。具体的には、基準特徴量の生成に使用したパターンと同じ環境で撮影した画像を評価サンプルに使用してもよい。

（ハードウェア構成）
図１５は、上記第１〜第３実施形態の学習装置のハードウェア構成の一例を示すブロック図である。図１５に示すように、上記各実施形態の学習装置は、ＣＰＵ９０２と、評価基準を生成したり画像データに含まれる未知の目標を認識したりするための学習プログラム（認識プログラム）などを記憶するＲＯＭ９０４と、ＲＡＭ９０６と、学習サンプル、評価サンプル、評価基準、及び認識テーブルなどを記憶するＨＤＤ９０８と、ＨＤＤ９０８とのインタフェースであるＩ／Ｆ９１０と、画像データ入力用のインタフェースであるＩ／Ｆ９１２と、マウスやキーボードなどの入力装置９１４と、入力装置９１４とのインタフェースであるＩ／Ｆ９１６と、ディスプレイなどの表示装置９１８と、表示装置９１８とのインタフェースであるＩ／Ｆ９２０と、バス９２２とを、備えており、通常のコンピュータを利用したハードウェア構成となっている。なおＣＰＵ９０２、ＲＯＭ９０４、ＲＡＭ９０６、Ｉ／Ｆ９１０、Ｉ／Ｆ９１２、Ｉ／Ｆ９１６、及びＩ／Ｆ９２０は、バス９２２を介して互いに接続されている。

上記各実施形態の学習装置では、ＣＰＵ９０２が、ＲＯＭ９０４から学習プログラムをＲＡＭ９０６上に読み出して実行することにより、上記各部（入力受付部、特徴量計算部、類似度計算部、認識部、出力制御部、選択部、学習部、評価部、及び格納部など）がコンピュータ上で実現される。そして上記各実施形態の学習装置では、ＣＰＵ９０２が、ＨＤＤ９０８に記憶されている学習サンプルや評価サンプルなどを用いて、評価基準を生成してＨＤＤ９０８に記憶し、ＨＤＤ９０８に記憶されている評価基準や認識テーブルなどを用いて、Ｉ／Ｆ９１２から入力される画像データに含まれる未知の物体を認識する。

なお、学習プログラムはＨＤＤ９０８に記憶されていてもよい。また、学習プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ、ＣＤ−Ｒ、メモリカード、ＤＶＤ、フレキシブルディスク（ＦＤ）等のコンピュータで読み取り可能な記憶媒体に記憶されてコンピュータプログラムプロダクトとして提供されるようにしてもよい。また、学習プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、学習プログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、未知の物体を含む画像データをＨＤＤ９０８に記憶しておき、Ｉ／Ｆ９１０から画像データを入力するようにしてもよい。

以上説明したとおり、上記各実施形態及び上記各変形例によれば、識別基準の学習に伴うコストを削減し、認識に好適な識別基準を得ることができる。また従来技術では、学習された複数の識別基準の少なくともいずれかが原因で認識性能の低下を招いてしまう可能性もあったが、本実施形態及び各変形例によれば、認識に好適な識別基準を得ることができる。

なお本発明は、上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。

例えば、上記各実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。

また例えば、上記実施形態では、学習装置が学習処理と認識処理の両処理を行う例について説明したが、学習処理、認識処理を、別々の装置で行うようにしてもよい。例えば、学習処理、認識処理を、それぞれ学習装置、認識装置が行うようにしてもよい。この場合、学習装置で生成した評価基準を認識装置に格納しておけばよい。

１００、２００、３００学習装置
１０２入力部
１０４入力受付部
１０６評価基準記憶部
１０８特徴量計算部
１１０認識テーブル記憶部
１１２類似度計算部
１１４認識部
１１６出力制御部
１１８出力部
１２０学習サンプル記憶部
１２２選択部
１２４学習部
１２６識別基準群記憶部
１２８評価サンプル記憶部
１３０、２３０、３３０評価部
１３２格納部
９０２ＣＰＵ
９０４ＲＯＭ
９０６ＲＡＭ
９０８ＨＤＤ
９１０Ｉ／Ｆ
９１２Ｉ／Ｆ
９１４入力装置
９１６Ｉ／Ｆ
９１８表示装置
９２０Ｉ／Ｆ
９２２バス

Claims

各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを１以上含むグループを複数選択する選択処理を複数回行う選択部と、
選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、識別基準群を得る学習部と、
各評価サンプルが複数のカテゴリのいずれかに分類される複数の評価サンプルを記憶する評価サンプル記憶部からカテゴリが異なる２以上の評価サンプルを取得し、取得した前記２以上の評価サンプルを用いて前記識別基準群に含まれる識別基準を評価し、前記識別基準群から評価結果に応じた複数の識別基準を取得して当該複数の識別基準を含む評価基準を生成する評価部と、
を備えることを特徴とする学習装置。
前記評価サンプルのカテゴリの分布は、前記学習サンプルのカテゴリの分布と異なっており、
前記評価部は、前記２以上の評価サンプルを用いて、前記識別基準群に含まれる識別基準がカテゴリの異なる評価サンプルを識別する識別性能を評価し、評価した識別性能に応じた複数の識別基準を取得することを特徴とする請求項１に記載の学習装置。
目標を含むパターンの入力を受け付ける入力受付部と、
前記評価基準を用いて、前記パターンの特徴量を計算する特徴量計算部と、
前記特徴量と前記目標の認識基準となる基準特徴量との類似度を計算する類似度計算部と、
前記類似度を用いて、前記目標を認識する認識部と、
認識結果を出力部に出力させる出力制御部と、を更に備え、
前記基準特徴量は、前記評価基準を用いて計算した前記評価サンプルの特徴量であることを特徴とする請求項１又は２に記載の学習装置。
前記評価部は、カテゴリが異なる評価サンプル間の類似度を用いて、前記識別基準群に含まれる識別基準を評価することを特徴とする請求項１〜３のいずれか１つに記載の学習装置。
前記評価部は、取得済みの識別基準と取得前の識別基準それぞれとの組み合わせに前記２以上の評価サンプルを適用して、カテゴリが異なる評価サンプル間での類似度の最大値を前記組み合わせ毎に特定し、特定した前記最大値が最も小さい組み合わせに含まれる取得前の識別基準を取得することを特徴とする請求項４に記載の学習装置。
前記評価部は、前記２以上の評価サンプルのクラス内分散及びクラス間分散の少なくとも一方を用いて、前記識別基準群に含まれる識別基準を評価することを特徴とする請求項１〜３のいずれか１つに記載の学習装置。
前記評価部は、前記識別基準群に含まれる各識別基準に前記２以上の評価サンプルを適用して、前記２以上の評価サンプルのクラス間分散をクラス内分散で除した値を識別基準毎に算出し、算出した値が高い順に複数の識別基準を取得することを特徴とする請求項６に記載の学習装置。
前記学習部は、サポートベクターマシンにより前記識別基準を学習し、
前記評価部は、カテゴリが異なる評価サンプル間のソフトマージンを用いて、前記識別基準群に含まれる識別基準を評価することを特徴とする請求項１〜３のいずれか１つに記載の学習装置。
前記評価部は、取得済みの識別基準と取得前の識別基準それぞれとの組み合わせに前記２以上の評価サンプルを適用して、ソフトマージンの最大値を前記組み合わせ毎に特定し、特定した前記最大値が最も小さい組み合わせに含まれる取得前の識別基準を取得することを特徴とする請求項８に記載の学習装置。
前記評価部は、識別基準を帰納的に取得することを特徴とする請求項４〜９のいずれか１つに記載の学習装置。
選択部が、各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを１以上含むグループを複数選択する選択処理を複数回行う選択ステップと、
学習部が、選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、識別基準群を得る学習ステップと、
評価部が、各評価サンプルが複数のカテゴリのいずれかに分類される複数の評価サンプルを記憶する評価サンプル記憶部からカテゴリが異なる２以上の評価サンプルを取得し、取得した前記２以上の評価サンプルを用いて前記識別基準群に含まれる識別基準を評価し、前記識別基準群から評価結果に応じた複数の識別基準を取得して当該複数の識別基準を含む評価基準を生成する評価ステップと、
を含むことを特徴とする学習方法。
各学習サンプルが複数のカテゴリのいずれかに分類される複数の学習サンプルを記憶する学習サンプル記憶部から学習サンプルを１以上含むグループを複数選択する選択処理を複数回行う選択ステップと、
選択された複数のグループ毎に当該複数のグループを識別する識別基準を学習し、識別基準群を得る学習ステップと、
各評価サンプルが複数のカテゴリのいずれかに分類される複数の評価サンプルを記憶する評価サンプル記憶部からカテゴリが異なる２以上の評価サンプルを取得し、取得した前記２以上の評価サンプルを用いて前記識別基準群に含まれる識別基準を評価し、前記識別基準群から評価結果に応じた複数の識別基準を取得して当該複数の識別基準を含む評価基準を生成する評価ステップと、
をコンピュータに実行させるための学習プログラム。