JPWO2015146113A1

JPWO2015146113A1 - 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム

Info

Publication number: JPWO2015146113A1
Application number: JP2016510017A
Authority: JP
Inventors: 利憲細井
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2014-03-28
Filing date: 2015-03-20
Publication date: 2017-04-13
Also published as: WO2015146113A1; US10380456B2; US20170039451A1; JP6897749B2; JP2020053073A

Abstract

画像上で見た目のバリエーションが大きい特定の物体を検出するために、高い識別率を得られる識別用辞書を作成する識別辞書学習システム等を提供する。識別辞書学習システム２００は、第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定部２１１と、サブクラスの組み合わせ毎に、優先度に基づいて複数の識別器を学習する識別器学習部２１３と、識別器について所定の最適化指標が最も良好となるサブクラスの組み合わせを選択する選択部２１５と、選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する重み更新部２１６とを備える。

Description

本発明は、画像から物体を検出するための学習を行う識別辞書学習システム等に関する。

画像に映った（記録された）特定の種類の物体を検出し、その物体の位置決めする場合、物体のみが映ったテンプレート画像を用意し、当該物体を表す部分画像が含まれるであろう注目画像中に探索窓を設定してテンプレート画像とのマッチング計算を繰り返すテンプレートマッチング探索手法が古くから利用されている。この手法では、単純にテンプレート画像の画素値と注目画像中の画素値を利用してマッチングを行うと精度が低い。このため、マッチング精度を高めるために、テンプレート画像や注目画像の、周辺画素との勾配情報や２次微分情報等を計算して、よりマッチングしやすい特徴量と呼ばれる数値列に変換する手法が開発された。更に、統計的パターン識別技術を用いて学習された識別辞書を用いてマッチング計算する手法が開発された。この識別辞書は物体クラスであるポジティブ（ｐｏｓｉｔｉｖｅ）クラスと、非物体クラスであるネガティブ(ｎｅｇａｔｉｖｅ)クラスとの２クラス識別をするための辞書であり、具体的には、識別に必要なパラメータ群を格納したメモリである。

物体検出においてよく利用される統計的パターン識別技術としては、ブースティング（Ｂｏｏｓｔｉｎｇ）と呼ばれる学習手法がある。Ｂｏｏｓｔｉｎｇでは、弱識別器と呼ばれる比較的単純な識別器を複数まとめることで、強識別器と呼ばれる識別精度が高い識別器が生成される。非特許文献１には、Ｂｏｏｓｔｉｎｇを物体検出に効果的に利用した手法が開示されている。この手法では、弱識別器にはＤｅｃｉｓｉｏｎ−Ｓｔｕｍｐ処理を採用する。この処理では、ＲｅｃｔａｎｇｌｅＦｉｌｔｅｒを利用して、高速な抽出処理が可能なＨａａｒウェーブレット風の特徴量１つに対して単純に閾値処理する。強識別器の生成にはＡｄａＢｏｏｓｔと呼ばれるＢｏｏｓｔｉｎｇを採用している。

非特許文献２には、ＡｄａＢｏｏｓｔを改良したＲｅａｌＡｄａＢｏｏｓｔと呼ばれるＢｏｏｓｔｉｎｇ手法が開示されている。この手法では、単純なＤｅｃｉｓｉｏｎ−Ｓｔｕｍｐ処理ではなく、ポジティブクラスの特徴量を表す数値の出現確率と、ネガティブクラスの特徴量を表す数値の出現確率とに基づいた弱識別を行う。このため、学習データさえ大量にあれば、高精度な物体検出を実現できる。

また、非特許文献３では、ＧｅｎｔｌｅＡｄａＢｏｏｓｔと呼ばれるＢｏｏｓｔｉｎｇ手法が開示されている。この手法は、Ｂｏｏｓｔｉｎｇで最適化する指標（損失）の定義をポジティブ化するので学習が安定的になり、これによりＲｅａｌＡｄａＢｏｏｓｔと同等以上の精度を得られる。非特許文献１、非特許文献２および非特許文献３を組み合わせた手法を用いれば、顔や車等の特定の物体を画像から高精度に検出できる。しかし、物体の見た目の変化が大きくない物体、例えば正面顔等しか検出できない。

注目する画像から、見た目の変化が大きい物体を検出するには、見た目の変化の種類毎に識別辞書を各々用意し、この辞書の数の分、検出処理する方式がよく利用される。しかし、この方式では、識別辞書の数だけ検出処理が必要となるので、処理時間が増加する問題がある。この問題に対して、非特許文献４は、見た目の変化を分類して別々のカテゴリ（クラス）として捉え、複数のクラス間で特徴量と弱識別器とを共有できるように学習する手法を開示している。この手法では弱識別器を共有できるため、処理時間が単純にクラス数倍まで増加することはない。よってこの手法によれば、比較的高速な処理を実現できる。このような物体検出のためクラスは、ポジティブ系のクラスが複数のサブクラス、ネガティブが１クラス、という階層的な多クラス構成になっている。階層的多クラス構成では、ポジティブ系クラス全体とネガティブクラスとの間の識別が最優先されるという条件下で、ポジティブクラス間も識別できるようにする必要がある。非特許文献４では、個々のポジティブ系クラスと、ネガティブクラスとを分類できるよう学習し、各ポジティブクラスのスコアを出力し、結果的に階層的なクラスの分類が可能である。

P. Viola and M. Jones著, 「Robust real-time object detection」, IJCV, 57(2):137-154ページ, 2004年 R. Schapire, Y. Singer著, 「Improved boosting algorithms using confidence-rated predictions」, Proc. of 11th conference on Computational Learning Theory, 1998年 J.Friedman, T. Hastie, R. Tibshirani著, 「Additive logistic regression: a statistical view of boosting」, Annals of statistics, 28(2):337-374ページ, 2000年 A. Torralba, K. P. Murphy, W. T. Freeman著, 「Sharing visual features for multiclass and multiview object detection」, PAMI 2006年

しかしながら、上述したように、非特許文献１、非特許文献２および非特許文献３を組み合わせた手法では、見た目の変化が大きくない物体、例えば正面顔等しか検出することができないという問題がある。

非特許文献４の手法では、画像上で見た目のバリエーションが大きい特定の物体を検出するための識別用辞書について、高い識別率を得られないという問題がある。これは、ポジティブ系クラスとネガティブクラスとの分類精度と、ポジティブ系クラス間の分類精度をどの程度の優先度合いで学習するかを設定することができないためである。分類精度の優先度合いが固定されている弱識別器しか学習できないと、それらを組み合わせて得られる強識別器において、識別に最適な辞書を構成できない。物体検出では、物体を検出することが最優先されるため、ポジティブ系クラスとネガティブクラスとの分類精度が特に重要である。

本発明は上記の問題点に鑑みてなされた。本発明は、画像上で見た目の変化が大きい特定の物体を高い識別率で検出することが可能な識別用辞書を作成できる、識別辞書学習システム等を提供することを主たる目的とする。

上記の問題点を鑑みて、本発明の第１の観点は、第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定部と、サブクラスの組み合わせ毎に、優先度に基づいて複数の識別器を学習する識別器学習部と、識別器について所定の最適化指標が最も良好となるサブクラスの組み合わせを選択する選択部と、選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する重み更新部とを備える識別辞書学習システムである。

本発明の第２の観点は、識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習方法であって、第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定し、サブクラスの組み合わせ毎に、優先度に基づいて複数の識別器を学習し、識別器について所定の最適化指標が最も良好となるサブクラスの組み合わせを選択し、選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する、識別辞書学習方法である。

本発明の第３の観点は、識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習プログラムであって、第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定部と、サブクラスの組み合わせ毎に、優先度に基づいて複数の識別器を学習する機能と、識別器について所定の最適化指標が最も良好となるサブクラスの組み合わせを選択する機能と、選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する機能とを有し、システムの有する各機能をコンピュータに機能させるための識別辞書学習プログラムを格納する記録媒体である。

本発明によると、画像上で見た目の変化が大きい特定の物体を高い識別率で検出することが可能な識別用辞書を作成できる。

図１は、各クラスの概念を模式的に示した概念図である。図２は、本発明の第一の実施形態の識別辞書学習システムの内部構成を示す図である。図３は、重み記憶部の重み表のデータ構成を示す図である。図４は、ラベル表のデータ構成を示す図である。図５は、重み記憶部の重み表のデータ構成を示す図である。図６Ａは、ヒストグラム表（ラベル＋１）のデータ構成を示す図である。図６Ｂは、ヒストグラム表（ラベル−１）のデータ構成を示す図である。図７は、識別辞書学習システムの動作を示すフロー図である。図８は、識別辞書学習システムにて作成された識別辞書記憶部の使用例を示すシステム図である。図９は、本発明の第二の実施形態の識別辞書学習システムの内部構成を示す図である。図１０は、本発明の実施形態を実現するための情報処理装置の構成図である。

次に図面を参照して、本発明の実施形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。更に以下に記載される実施形態は一例であり、その本質を同一とする範囲において適宜変更可能であることに留意すべきである。
＜第一の実施形態＞
本発明の第一の実施形態の識別辞書学習システムは、画像検出の学習に用いる特定の物体、例えば顔が撮影（記録）されている画像データ（以下「学習サンプル」と記載）の分類において、図１に示すような、階層的な多クラス構成を用いる。図１中の○、▲、▼、◆等の各点は、学習サンプル（以下、単に「サンプル」とも記載する）を意味しており、これをある２つのクラスを表す特徴平面としてプロットした概念図である。サンプルは、上記の２つのクラスである、ポジティブクラスとネガティブクラスに分類される。ポジティブのクラスが複数のサブクラス（例えば◆印で示される正面顔クラスを表すＰｏｓ（positiveの略、以下同様）１クラス、▼印で示される横顔クラスを表すＰｏｓ２クラス、▲印で示される斜め顔クラスを表すＰｏｓ３クラス）によって構成される。以下これらをポジティブ系クラスと記述する。○印で示されるネガティブクラスは特定の物体（顔）が映っていない画像データのクラスであり、１クラスのみである。尚、図１のポジティブ系クラスとネガティブクラスの境界は、物体と非物体の境界を概念的に示すものである。
次に、以下の説明の便宜上、本実施の形態により作成された識別辞書を用いた多クラス識別処理の枠組みについて先に説明する。上記識別辞書には学習された多数の弱識別器に関する情報が記憶されており、上記弱識別器を１つずつ順に実行することで、全体的な識別結果が得られる。
このように弱識別器を組み合わせた処理は、機械学習におけるパターン認識分野では強識別器と呼ばれ、この枠組みはBoostingと呼ばれる手法（技術）の一変種である。上記弱識別器それぞれは、１つまたは複数のポジティブ系クラスに対応しており、弱識別処理は、対応しているポジティブ系クラスのスコアと、対応していないポジティブ系クラスのスコアとの２種類を出力する。
つまり、１つの弱識別器が計算するスコアは、上記弱識別器に対応しているポジティブ系クラスについては同一の値であり、残りのポジティブ系クラスについては別の同一の値である。本実施形態に係る識別辞書学習システムは、このような弱識別器を複数処理し、ポジティブ系クラス１つずつにスコアの累積和を計算し、計算した累積和を強識別器の出力（強識別スコア）とする。つまり、強識別スコアは、ポジティブ系クラス毎に求まるので、それらの最大値をとるポジティブ系クラスに分類することができる。
以下では、個々の弱識別器に対応しているポジティブ系クラスを簡潔に表現するために、１つのポジティブ系クラスまたは複数のポジティブ系クラスの組み合わせからなる集合を、単に組み合わせＳ_ｎと表記する（組み合わせ数：ｎ＝１，…，組み合わせ候補数）。

上記強識別スコアの計算は、式１で表される。Ｈ^ｃは、ポジティブ系クラスcらしさを表す強識別器の出力値、Ｎ_ｍは弱識別器の個数、ｍは弱識別器番号である。強識別器も弱識別器も、どちらも個々のポジティブ系クラスc用のスコア（Ｈ^ｃまたはｈ^ｃ）を、すべてのポジティブ系クラス(ｃ＝１，…，Ｎ_ｃ)分だけ出力する。つまり、強識別器および弱識別器は、ポジティブ系クラス個数分の数値を出力する。

尚、このような強識別器を用いて識別処理を行う際には、必ずしも全ての弱識別器の計算を行う必要はない。弱識別器の一部のみ(ｍ＝１，…，Ｎ´_ｍ：だたしＮ´_ｍ＜Ｎ_ｍ)を計算することによって得られる中間出力値を取り出し、この中間出力値を閾値処理すれば残りの計算を省略できる。特に物体検出を行う場合には、識別器への入力がネガティブクラス（背景クラス）である確率が非常に高い。このため、少ない弱識別器によってネガティブクラスであると判定することができると、計算コストが非常に小さくなるので、高速に物体を検出できるようになる。
（識別辞書学習システム）
本発明の第１の実施形態の識別辞書学習システム１００は、図２に示すようにデータ処理部１１０、重み記憶部１２１、識別辞書記憶部１２２およびラベル記憶部１２３を備える。データ処理部１１０は、優先度設定部１１１、重み正規化部１１２、弱識別器候補学習部１１３、最適化指標計算部１１４、共有クラス弱識別器選択部１１５、重み更新部１１６、優先度再設定部１１７を備える。
各部は、機能ブロックを示しており、各部は図１０に示されるＣＰＵ（Central Processing Unit）３００１によって適宜演算処理される。詳細は後述する。

重み記憶部１２１には、学習サンプル毎の重み係数を、ポジティブ系クラス毎に記載した重み表を格納する。重み表は、全ての学習サンプルの通し番号と、ポジティブ系クラスとが関連付けされた表に、各々重み値を割り当てた情報（データ）である。

識別辞書記憶部１２２には、学習処理に基づき求められた強識別器のパラメータが記憶される。強識別器は弱識別器の集合によって構成されるので、記憶される情報は、実質的には学習処理に基づき求められた複数の弱識別器のパラメータと同等である。弱識別器毎に備えるパラメータは、「選択された特徴量を特定する情報」、「弱識別器の出力値を得るための参照表」、「弱識別器に対応するポジティブクラスの組み合わせを特定する情報」である。
本実施形態において、特徴量とは、学習サンプルの特徴量となりうるあらゆる要素を指し、例えば色、画素値、勾配（画素値の１次微分）、画素値の２次微分等である。特徴量を特定する情報とは、ある弱識別器に使われる特徴量としてどの特徴量が選択されたかを特定する情報である。これは例えば、特徴量の各々に通し番号等を付した場合、この通し番号でよいし、特徴量を抽出するためのパラメータでもよい。参照表とは、弱識別器の出力値を学習サンプルの特徴量の値を基に計算するためのルックアップテーブルを構成する情報（データ）であり、詳細は後述する。
弱識別器に対応するポジティブクラスとは、ポジティブ系クラスの組み合わせＳ_ｎのうち、弱識別器がどの１つの組み合わせＳ_ｎに対応するかを特定する情報である。本実施形態による弱識別器は、Ｓ_ｎに含まれるクラスか否かに応じて計算式が異なり、どちら（即ち、当該クラスか否か）に基づいて計算すべきかを特定する必要があるため、この情報が必要である。１つのＳ_ｎを保持するためには、例えばＯＮ／ＯＦＦフラグがポジティブ系クラスの個数分あればよい。

識別辞書記憶部１２２は、識別辞書学習システム１００の動作中に得られた弱識別器のパラメータを順次記録する。識別辞書学習システム１００の全動作が完了すると、識別辞書記憶部１２２には、全てのパラメータが記録された識別辞書が完成する。

ラベル記憶部１２３は、学習時に用いる＋１または−1等の値であるラベルを、個々の学習サンプルについてポジティブ系クラス毎に割り当てたラベル表を格納する。

優先度設定部１１１は、ネガティブクラスとポジティブ系クラスとの分類の優先度として、ユーザが所望する値を重み表に反映させる。これは学習処理の最初のみ行われる。その際、ネガティブクラスの優先度をポジティブ系クラスの優先度に対して大きくなるように設定することが好ましい。これは、初期における弱識別器の学習段階でネガティブクラスとポジティブ系クラスの識別を重視した学習を行うためである。
例えば、ユーザが、ポジティブ系クラスに対するネガティブクラスの優先度の比率を２と設定する。この設定によると、ある一つの学習サンプルによるネガティブクラスの優先度はＤ^neg＝｛１／学習データ総数｝×２となり、ポジティブ系クラスの優先度はＤ^pos＝｛１／学習データ総数｝となる。この結果、図３に示すように、ネガティブクラスの重みはＤ^neg＝０．０２、ポジティブ系クラスの重みはＤ^pos＝０．０１となる。但し、「×」は積算を表し、「／」は除算を表す。

重み正規化部１１２は、学習サンプルの重み表の値を正規化する。具体的に、重み正規化部１１２は、ラベルｚ＝＋１が付与されたサンプル重みの総和と、ラベルｚ＝−１が付与されたサンプルの重みの総和が等しくなるように正規化を実行する。ラベルとは、学習時に用いる＋１または−1という値で、図４のように、個々の学習サンプルについてポジティブ系クラス毎に割り当てられる。尚、図４の表はラベル記憶部１２３に格納される。
図４に示す例において、個々の学習サンプルが属するクラスに対応するラベルは＋１であり、その他は−１である。正規化の際には、具体的には、｛ラベルｚ＝＋１が付与されたサンプル重み｝／｛ラベルｚ＝＋１が付与された全てのサンプル重みの総和｝と、｛ラベルｚ＝−１が付与されたサンプル重み｝／｛ラベルｚ＝−１が付与された全てのサンプル重みの総和｝を算出し、各々算出結果に置き換えればよい。
例えば、個々の学習サンプルのラベルが図４のように割り当てられている場合に、図３の重み表を正規化すると、図５のようになる。弱識別器候補学習部１１３は、ある１つの特徴量と、あるポジティブ系クラスの１つの組み合わせＳ_ｎの場合について、弱識別器を学習（作成）し、これらを弱識別器の候補とする。この処理は、あらゆる特徴量とあらゆるポジティブ系クラスの組み合わせＳ_ｎに対して繰り返し実行される。但し、実装に際しては、現実的な処理時間で繰り返し処理が終了するように、組み合わせＳ_ｎの数量を制限すればよい。
弱識別器の学習とは、ある学習サンプルの特徴量の値が入力された場合に、その場合の弱識別器の出力値を計算するためのパラメータを求めておくことである。弱識別器は、ポジティブ系クラス毎に値が出力されるものであれば任意のモジュール（処理、機能）で構わないが、一例として、弱識別器による計算式に以下の式２を採用する場合について説明する。

式２で用いられる文字等について説明する。ｈ_j ^cは弱識別器（弱識別の出力値）を表す。関数δ（・）は、引数に与えた数式が真であれば１、偽であれば０となる関数を表す。式２中の「・」は積算を表す。ｃは全ポジティブ系クラスＮ_ｃ内の所定クラスを示す添字番号（Ｎ_ｃ＝Ｎ_１，…，Ｎ_ｃ）を表す。ｉは学習サンプルの添字番号を表す。Ｚ_i ^cはクラスcに属する学習サンプルｉのラベルを表す。ｘ_ｉは学習サンプルｉの特徴量の値を表す。Ｄ_i ^cはクラスｃに属する学習サンプルｉの重みを表す。Ｘ_ｊは特徴量の値の１区間（ビン）を表す。ｊは特徴量の値の区間Ｎ_ｊ内の所定ビンを示す添字番号を表す。Ｓ_ｎは先述のクラス組み合わせ集合を表す。εは小さな定数値を表す。ｌｎは自然対数を表す。これらの記号の定義は、次式以降も同様である。
弱識別器候補学習部１１３を繰り返し実行することで、あらゆる特徴量、あらゆるポジティブ系クラスの組み合わせについて、全ての特徴値の区間（ｊ＝１，…，Ｎ_ｊ）の式（１）の値ｈ_j ^cが計算される。尚、この「j、c」とｈ_j ^cを関連付けた情報が上記参照表の候補であり、式２の場合、式の上段に相当する表（j個の数値）と式の下段に相当する表（ｃ個の数値）の２つで構成される。尚、後述の最適化指標もあらゆる特徴量とあらゆるＳ_ｎについて計算される。後述する共有クラス弱識別器選択部１１５は、上記最適化指標を最小にする１つの特徴量と１つのＳ_ｎを選択する。

本実施形態の結果を用いた識別処理時の弱識別について説明する。クラス集合Ｓ_ｎに含まれるポジティブ系クラスのスコアについては、識別対象であるサンプルの特徴量からビンｊを特定し、例えば式２の上段の参照表を用いれば、上記サンプルの弱識別結果として１つの値ｈ_j ^cが計算される。
一方、Ｓ_ｎに含まれないポジティブ系クラスのスコアについては、例えば式２の下段の参照表を用いれば、上記サンプルの弱識別結果として１つの値ｈ_j ^cが計算される。このように識別処理には、１つの弱識別の結果として各ポジティブ系クラスのスコアが求まる。この時、各スコアは式２の上段の値と下段の値の２種類しかない。

式２による計算処理について詳しく説明する。まず、Ｓ_ｎに含まれるポジティブ系クラスの場合、特徴量の数値の出現頻度をサンプル重み付きでカウントすることでラベルが＋１であるヒストグラムとラベルが−１であるヒストグラムとを作成し、さらにこの２つのヒストグラムの対応するビン値の比の対数を計算することで、全ての特徴量の区間（ｊ＝１,…，Ｎ_ｊ）の式２の出力値ｈ_j ^cが計算される。
一方、Ｓ_ｎに含まれないポジティブ系クラスの場合には、ラベルが＋１である全ての学習サンプルの重み付き個数と、ラベルが−１である全ての学習サンプルの重み付き個数とを計算し、さらにこれらの比の対数を計算することで出力値が計算される。この値は特徴量の区間には依存しない。
上記ヒストグラムについて、図６Ａおよび図６Ｂに例示して説明する。図６Ａはラベルが＋１である重み付きヒストグラムであり、図６Ｂはラベルが−1である重み付きヒストグラムである。通常のヒストグラムは、サンプル１つにつき１を足し込んで計算されるが、重み付きヒストグラムとは、サンプル１つにつきその重みの値を足し込んで計算される。このため、図６Ａおよび図６Ｂのヒストグラムの縦軸は重み付きの出現頻度を意味し、横軸は特徴量の値を示す。例えば特徴量が０から２５５の整数値である場合、ヒストグラムのビン幅が例えば５であると、各ビンＮ_ｊは０〜４、５〜９、…、２４５〜２４９、２５０以上、のように設定される。ビン添字番号ｊは左から昇順でＮ_１、Ｎ_２、Ｎ_３、…、Ｎ_ｊと付す。

この場合、図６Ａおよび図６Ｂのヒストグラムにて、同じ添字ｊが付されたビンの出現頻度の値の比に関して対数を計算すれば出力値ｈ_ｊが得られる。尚、式２の出力値ｈ_j ^cは、ラベルが＋１のサンプルの出現頻度が高く、ラベルが−1のサンプルの出現頻度が低いほど、高い値となる。つまり、あるサンプルの特徴量が区間ｊの中に含まれる場合、ｈ_j ^cの値が高いと、そのサンプルが＋１である確率が高いといえる。

尚、実用上は、学習サンプルの個数や変化が十分でないと、上記の重み付けラベルの出現頻度が数値的に０になる恐れがある。このため、近接するビンの値から補間、または平滑化することで、値が０になるリスクを低減することが好ましい。

一方、弱識別の出力式としては、式２の代わりに、以下の式３を使用してもよい。式２は確率の比の対数を計算することに相当していたが、式３では確率の差分を計算していることに相当する。式３の出力値ｈ_j ^cも式２と同様に、ラベルが＋１であるサンプルの出現頻度が高く、ラベルが−1であるサンプルの出現頻度が低いほど、高い値となる。つまり、あるサンプルの特徴量が区間jの中に含まれる場合、ｈ_j ^cの値が高いと、そのサンプルが＋１である確率が高いといえる学習サンプルほど高い値が算出される。

最適化指標計算部１１４では、ある１組のポジティブ系クラスの集合Ｓ_ｎと、ある１つの特徴量とが用いられる場合について、弱識別器の候補による出力値を用いて、学習に基づいて最適化すべき指標（以下、「最適化指標値Ｌ」と記載）が計算される。この指標は、パターン認識分野においては、損失、交差エントロピー損失、または尤度等と呼ばれる値に相当し、指標の値が小さい程、識別結果が正しいと判断される。式２にて出力値ｈ_j ^cを得た場合、最適化指標値Ｌは、以下の式４、または式５にて算出すればよい。尚、ｅはネイピア数を指す。式５は、計算コストを抑えるために簡略化した計算式であり、Ｌ_ｃをクラス組み合わせ集合Ｓ_ｎ内の各クラスすべてについて計算し、それらの総和をとった値を損失とする。尚、厳密には、上記の式４と式５から計算される最適化指標値Ｌ（損失）は異なる。

一方、式３にて出力値ｈ_j ^cを得た場合、最適化指標値Ｌは、以下の式６または式７を用いて算出すればよい。尚、厳密には上記の式６と式７から算出される最適化指標値Ｌ（損失）は異なる。

共有クラス弱識別器選択部１１５は、最適化指標計算部１１４で求められた最適化指標値Ｌが最も小さくなる「ポジティブ系クラスの組み合わせＳ_ｎと特徴量」を探し、この場合に相当する上記「参照表」を弱識別器として採用し、識別辞書記憶部１２２に弱識別器パラメータとして記憶する。

重み更新部１１６は、上記重み表（図３参照）の各値を、以下の式８を用いて更新する。式８では、弱識別器の出力値ｈ_ｊを使用する。

優先度再設定部１１７は、ネガティブクラスとポジティブ系クラス全体との分類の優先度を、所定の式を用いて自動的に再設定する。例えば、ネガティブクラスの重みＤ^Neg＞ポジティブ系クラスの重みＤ^Posと設定する場合、初期値をＤ^Neg＞Ｄ^Pos、新しい重みＤ^Posを「元の重みＤ×Ｃ」にて算出すればよい。尚、Ｃは重みを徐々に重くするための定数であり、例えばＣ＝１．１等と設定する。重みの大小関係が逆転するのを防ぐためには、Ｄ^Neg≧Ｄ^Posを満たすよう、上限を設定すればよい。

優先度の再設定の目的は、学習処理の序盤では、ネガティブクラスとポジティブ系クラスとの識別を優先するようにネガティブサンプルの重みを重く設定するが、徐々にポジティブ系クラス間の識別を優先するように設定するのが望ましいためである。このように優先度を設定することで、序盤では弱識別器が物体と非物体を大まかに判別し、判別の後、弱識別器がポジティブ系クラス毎に詳細に判別できるようになる。

学習終了判定部１１８は、学習処理を終了するか判定する。この終了判定は、所定の学習回数を超えた場合に終了としても構わないし、繰り返し行う当該学習処理の中で、前回の学習処理と今回の学習処理における最適化指標値Ｌの差分の減少量が所定の閾値を下回った場合に終了としても構わない。例えば、相対値の減少閾値を０.２とした場合、ある回における学習処理での最適化指標値Ｌ_１が０．８、その次の学習処理の最適化指標値Ｌ_２が０．４、更に次の学習処理の最適化指標値Ｌ_３が０．３だったとする。この場合Ｌ_１−Ｌ_２＝０．４であるから閾値以上だが、Ｌ_２−Ｌ_３＝０．１では閾値以下となる。この場合に、学習終了判定部１１８は、最適化指標値Ｌ_３の算出後に学習処理を終了すると判断する。この他、別の評価用データセットを用意し、それを実際に識別させて得られた最適化指標値または識別誤り率に応じて終了と判定しても構わない。
（識別辞書学習システムの動作）
次に、識別辞書学習システム１００の動作について、図７のフロー図を参照して説明する。以下の説明では、ポジティブ系クラスの数をＮ_ｃ、特徴量の数をＮ_ｆとする。
（ａ）ステップＳ１１１において、優先度設定部１１１は、ネガティブクラスとポジティブ系クラスとの分類の優先度を、ユーザ指定の値に設定する。優先度設定部１１１は、選択または入力された優先度の値を取得し、この優先度を基に、重み表の重み値を例えば、図３に示すよう設定する。
（ｂ）ステップＳ１１２において、重み正規化部１１２は、ラベルｚの値に応じて、学習サンプルの重みを正規化する。ラベルｚの値は、ラベル記憶部１２３に格納される。この処理では、ラベルｚ＝＋１が付与されたサンプル重みの総和と、ラベルｚ＝−１が付与されたサンプルの重みの総和とが等しくなるように正規化する。例えば、正規化された重み表は、図５に示すようになる。
（ｃ）次にステップＳ１１３において、弱識別器候補学習部１１３は、ある特徴量およびあるポジティブ系クラスの組み合わせＳ_ｎについての弱識別器候補の学習処理を行う。弱識別器候補学習部１１３は、例えば、式２または式３に基づいて、弱識別器の候補それぞれの上記参照表を作成する。
（ｄ）ステップＳ１１４において、最適化指標計算部１１４は、ステップＳ１１３にて学習された複数の弱識別器候補の最適化指標値Ｌを計算する。
上述したステップＳ１１３〜ステップＳ１１４の処理は、特徴量の数Ｎ_ｆ回数分繰り返し行われ、さらにポジティブ系クラスの組み合わせＳ_ｎの数だけ繰り返し行われる。この繰り返し処理により、あらゆる特徴量と、あらゆるポジティブ系クラスの組み合わせＳ_ｎと、に対応するそれぞれの弱識別器候補の最適化指標値Ｌが計算される。尚、実装においては、現実的な処理時間内で繰り返し処理が終了するように、特徴量および組み合わせＳ_ｎの数量を制限すればよい。
（ｅ）ステップＳ１１５において、共有クラス弱識別器選択部１１５は、弱識別器候補の中から、ステップＳ１１４の処理で求められた最適化指標値Ｌが最も小さくなる、特徴量とポジティブ系クラスの組み合わせとを探す。共有クラス弱識別器選択部１１５は、検索された組み合わせに対応する弱識別器を採用する。これは言い換えれば、ポジティブ系クラスの組み合わせＳ_ｎに属するクラス間では、弱識別器（と特徴量）が共有されていると解釈することもできる。

共有クラス弱識別器選択部１１５は、採用された弱識別器のパラメータ（具体的には、学習サンプルの特徴量を特定する情報、弱識別器の出力値を得るための参照表、および、弱識別器が対応するポジティブクラスの組み合わせ）を識別辞書記憶部１２２に格納する。

ステップＳ１１５においては、クラス組み合わせ集合Ｓ_ｎの要素の全てについて検索を繰り返すのではなく、ステップＳ１１４で計算された最適化指標に応じて、クラス組み合わせ集合Ｓ_ｎの要素の内、検索するパターンを削減してもよい。例えば、最も最適化指標値Ｌが小さいポジティブクラスを１つ見つけておき、そのポジティブクラスを含むクラス組み合わせ集合Ｓ_ｎについてのみ検索処理を行ってもよい。この他、最適化指標値Ｌが最も小さいポジティブクラスに、別のポジティブクラスを１つずつ追加して検索する処理を繰り返してもよい。この場合、繰り返し回数は、ポジティブクラス数にほぼ比例するため、少ない回数で近似的な結果を得ることができる。
（ｆ）ステップＳ１１６において、重み更新部１１６は、図５の重み表の各値を、式８を用いて更新する。
（ｇ）ステップＳ１１７において、優先度再設定部１１７は、ネガティブクラスとポジティブ系クラスとの分類の優先度を、所定の式を用いて自動的に再設定する。
（ｈ）最後にステップＳ１１８において、学習終了判定部１１８は、学習処理の終了を判定する。例えば、所定の学習回数を超えた場合や、前回の学習処理と今回の学習処理における最適化指標値Ｌの相対値の減少量が所定の閾値を下回った場合に、学習終了判定部１１８は、学習処理を終了すると判定する。一方、学習処理を終了しないと判定した場合、上述した一連の処理はステップＳ１１１に戻る。学習終了判定部１１８が、処理を終了すると判定した場合、本学習処理は完了し、この結果、識別辞書学習システム１００の動作中に得られた弱識別器のパラメータが全て記録された識別辞書記憶部１２２が完成する。

次に、上述した学習の結果作成された識別辞書記憶部１２２の使用例を、図８を用いて説明する。本実施形態の一連の学習過程にて作成された識別辞書記憶部１２２は、実際に物体を検出する処理を行う物体検出システム３００で使用される。物体検出システム３００は、データ処理部３１０と識別辞書記憶部１２２を備える。データ処理部３１０は、探索部３１１、特徴量抽出部３１２、弱識別部３１３、強識別部３１４を有する。

探索部３１１は、注目画像中の物体を探索するために当該注目画像を探索窓を用いてスキャンする。尚、探索部３１１は、探索窓を用いてスキャンした結果、最もポジティブらしい結果が得られた探索窓に探索すべき物体があると判断して、検出結果とすればよい。特徴量抽出部３１２は、スキャン中の探索窓内について識別辞書記憶部１２２に記憶されている特徴量と同じ特徴量、例えば画素値を抽出する。弱識別部３１３は、抽出された特徴量に基づいて弱識別の式を用いて出力値を求める。強識別部３１４は、識別辞書記憶部１２２内の参照式を基に各弱識別器の出力値の総和をとり、これを強識別の結果として出力する。

本発明の第一の実施形態の識別辞書学習システム１００によると、注目画像内で見た目の変化が大きい特定の物体を検出するための識別用辞書の作成に際して、分類するクラス間の優先度をユーザが自由に設定することで、高い識別率を得られる識別用辞書を作成できる。この理由は、識別辞書学習システム１００において識別用辞書を作成するに当たり、学習初期ではポジティブ系クラスとネガティブクラスとの分類精度を優先するよう弱識別器を設定することで、この設定条件に従って当該弱識別器が学習できるからである。更に、学習が進むにつれ、ポジティブ系クラス間の分類精度を徐々に優先するように弱識別器を自動設定することで、当該弱識別器がポジティブ系クラス間における分類精度を上げて学習できるからである。
＜第二の実施形態＞
第二の実施形態の識別辞書学習システム２００は、図９に示すように、設定部２１１、識別器学習部２１３、選択部２１５および重み更新部２１６を備える。

設定部２１１は、第１のクラスと、サブクラスを含む第２のクラスとの分類の優先度をユーザ等から指定された値に設定する。識別器学習部２１３は、当該優先度を設定する。選択部２１５は、サブクラスの組み合わせ毎に、優先度に基づいて複数の識別器を学習する。重み更新部２１６は、選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する。

本願発明の第二の実施形態の識別辞書学習システム２００によると、識別用辞書を作成するに当たり、第１のクラスと、サブクラスを含む第２のクラスとの分類の優先度をユーザが設定する。このため、本実施形態によると、注目画像内で見た目のバリエーションが大きい特定の物体を検出する場合であっても、高い識別力を備えた識別辞書を作成することができる。
また、本発明の交通費申請サーバ２０にて行われる方法は、コンピュータに実行させるためのプログラムに適用しても良い。また、そのプログラムを記憶媒体に格納することも可能であり、ネットワークを介して外部に提供することも可能である。
（情報処理装置）
上述した実施形態に係る識別辞書学習システム１００、２００は、情報処理装置（コンピュータ）を利用しても実現することができる。この場合において、識別辞書学習システム１００、２００の各部のうち、以下の各構成は、ソフトウェアプログラムの機能（処理）単位（ソフトウェアモジュール）と捉えることができる。
・図２に示した、データ処理部１１０内の各部（優先度設定部１１１、重み正規化部１１２、弱識別器候補学習部１１３、最適化指標計算部１１４、共有クラス弱識別器選択部１１５、重み更新部１１６および優先度再設定部１１７）、および、
・図９に示した設定部２１１、識別器学習部２１３、選択部２１５および重み更新部２１６。
これらの機能（処理）を実現可能なハードウェア環境の一例を、図１０を参照して説明する。但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。
図１０は、本発明の実施形態に係る識別辞書学習システム１００、２００を実行可能な情報処理装置１０００の構成を例示的に説明する図である。
図１０に示した情報処理装置１０００は、以下の構成がバス（通信線）３００８を介して接続された一般的なコンピュータである。
・ＣＰＵ３００１、
・ＲＯＭ（Ｒｅａｄ＿Ｏｎｌｙ＿Ｍｅｍｏｒｙ）３００２、
・ＲＡＭ（Ｒａｎｄｏｍ＿Ａｃｃｅｓｓ＿Ｍｅｍｏｒｙ）３００３、
・記憶装置３００４（図２に示す重み記憶部１２１、識別辞書記憶部１２２およびラベル記憶部１２３を備える）、
・入出力ユーザインタフェース（Ｉｎｔｅｒｆａｃｅ：以降、「Ｉ／Ｆ」と称する）３００５、
・外部装置との通信Ｉ／Ｆ３００６、
・ドライブ装置３００９。
ドライブ装置３００９は、記録媒体３０１０から、情報処理装置１０００を実行するためのソフトウェア（プログラム）を読み出す。
そして、上述したハードウェア環境において、上述した実施形態は、以下の手順によって達成される。即ち、図１０に示した情報処理装置１０００に対して、その実施形態の説明において参照したブロック構成図（上述した図２のデータ処理部１１０および図９の各部）、或いはフローチャート（図７）の機能を実現可能なコンピュータ・プログラムがネットワーク３０００またはドライブ装置３００９から供給される。その後、そのコンピュータ・プログラムは、当該ハードウェアのＣＰＵ３００１に読み出されて解釈され、ＣＰＵ３００１において実行される。また、当該装置１０００内に供給されたコンピュータ・プログラムは、読み書き可能な揮発性の記憶デバイス（ＲＡＭ３００３）または記憶装置３００４等の不揮発性の記憶デバイスに格納すればよい。

上記実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

[付記１］
第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定手段と、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習する識別器学習手段と、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択する選択手段と、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する重み更新手段
を備えることを特徴とする識別辞書学習システム。

[付記２］
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定手段は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促すことを特徴とする付記１に記載の識別辞書学習システム。

[付記３］
前記第１のクラスがポジティブ系クラスの場合、前記第２のクラスには複数のポジティブクラスを備え、
前記複数のポジティブクラス間の分類の優先度が徐々に高くなるよう前記優先度を再設定する再設定手段を更に備えることを特徴とする付記１又は２に記載の識別辞書学習システム。

[付記４］
前記識別器学習手段は複数の弱識別器を備え、
前記弱識別器は、学習サンプルの特徴量の値が所定の範囲内にある、１つのポジティブ系クラスの学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第１の値と、
前記特徴量の値が所定の範囲内にある前記１つのポジティブ系クラス以外のポジティブ系クラスおよびネガティブクラスから成る学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第２の値と、
の比率に基づいて算出されることを特徴とする付記１乃至３のいずれか１項に記載の識別辞書学習システム。

[付記５］
前記弱識別器の前記最適化指標を計算する最適化指標計算手段を更に備え、
前記最適化指標は、前記第１の値と前記第２の値の積に基づいて算出されることを特徴とする付記１乃至４のいずれか１項に記載の識別辞書学習システム。

[付記６］
識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習方法であって、
第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する工程と、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習する工程と、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択する工程と、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する工程を有することを特徴とする識別辞書学習方法。

[付記７］
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定する工程は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促すことを特徴とする付記６に記載の識別辞書学習方法。

[付記８］
前記第１のクラスがポジティブ系クラスの場合、前記第２のクラスには複数のポジティブクラスを備え、
前記複数のポジティブクラス間の分類の優先度が徐々に高くなるよう前記優先度を再設定する工程を更に有することを特徴とする付記６又は７に記載の識別辞書学習方法。

[付記９］
前記学習する工程は複数の弱識別器を備え、
前記弱識別器の出力は、学習サンプルの特徴量の値が所定の範囲内にある、１つのポジティブ系クラスの学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第１の値と、
前記特徴量の値が所定の範囲内にある前記１つのポジティブ系クラス以外のポジティブ系クラスおよびネガティブクラスから成る学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第２の値と、
の比率に基づいて算出されることを特徴とする付記６乃至８のいずれか１項に記載の識別辞書学習方法。

[付記１０］
前記弱識別器の前記最適化指標を計算する工程を更に備え、
前記最適化指標は、前記第１の値と前記第２の値の積に基づいて算出されることを特徴とする付記６乃至９のいずれか１項に記載の識別辞書学習方法。

[付記１１］
識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習プログラムであって、
第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定手段と、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習する識別器学習手段と、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択する選択手段と、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する重み更新手段
とを有し、前記システムの有する前記各手段をコンピュータに機能させるための識別辞書学習プログラム。

[付記１２］
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定手段は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促す
ことを更に前記コンピュータに機能させるための付記１１に記載の識別辞書学習プログラム。

[付記１３］
前記第１のクラスがポジティブ系クラスの場合、前記第２のクラスには複数のポジティブクラスを備え、
前記複数のポジティブクラス間の分類の優先度が徐々に高くなるよう前記優先度を再設定する再設定手段
を更に前記コンピュータに機能させるための付記１１又は１２に記載の識別辞書学習プログラム。

[付記１４］
前記識別器学習手段は複数の弱識別器を備え、
前記弱識別器の出力は、学習サンプルの特徴量の値が所定の範囲内にある、１つのポジティブ系クラスの学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第１の値と、
前記特徴量の値が所定の範囲内にある前記１つのポジティブ系クラス以外のポジティブ系クラスおよびネガティブクラスから成る学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第２の値と、の比率に基づいて算出される
ことを更に前記コンピュータに機能させるための付記１１乃至１３のいずれか１項に記載の識別辞書学習プログラム。

[付記１５］
前記弱識別器の前記最適化指標を計算する最適化指標計算手段を更に備え、
前記最適化指標は、前記第１の値と前記第２の値の積に基づいて算出されること
を更に前記コンピュータに機能させるための付記１１乃至１４のいずれか１項に記載の識別辞書学習プログラム。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は２０１４年３月２８日に出願された日本出願特願２０１４−０６７５９７を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１００、２００識別辞書学習システム
１１０データ処理部
１１１優先度設定部
１１２重み正規化部
１１３弱識別器候補学習部
１１４最適化指標計算部
１１５共有クラス弱識別器選択部
１１６重み更新部
１１７優先度再設定部
１１８学習終了判定部
１２１重み記憶部
１２２識別辞書記憶部
１２３ラベル記憶部
３００物体検出システム
３１０データ処理部
３１１探索部
３１２特徴量抽出部
３１３弱識別部
３１４強識別部

Claims

第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する設定手段と、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習する識別器学習手段と、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択する選択手段と、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する重み更新手段
とを備える、識別辞書学習システム。
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定手段は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促す、
請求項１に記載の識別辞書学習システム。
前記第１のクラスがポジティブ系クラスの場合、前記第２のクラスには複数のポジティブクラスを備え、
前記複数のポジティブクラス間の分類の優先度が徐々に高くなるよう前記優先度を再設定する再設定手段を更に備える、
請求項１又は２に記載の識別辞書学習システム。
前記識別器学習手段は複数の弱識別器を備え、
前記弱識別器の出力は、学習サンプルの特徴量の値が所定の範囲内にある、１つのポジティブ系クラスの学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第１の値と、
前記特徴量の値が所定の範囲内にある前記１つのポジティブ系クラス以外のポジティブ系クラスおよびネガティブクラスから成る学習サンプルの重みの総和を、前記弱識別器を共有するクラス全体に亘りさらに総和をとった第２の値と、の比率に基づいて算出される、
請求項１乃至３のいずれか１項に記載の識別辞書学習システム。
前記弱識別器の前記最適化指標を計算する最適化指標計算手段を更に備え、
前記最適化指標は、前記第１の値と前記第２の値の積に基づいて算出される、
請求項１乃至４のいずれか１項に記載の識別辞書学習システム。
識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習方法であって、
第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定し、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習し、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択し、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する、
ことを備える識別辞書学習方法。
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定の際は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促す、請求項６に記載の識別辞書学習方法。
前記第１のクラスがポジティブ系クラスの場合、前記第２のクラスには複数のポジティブクラスを備え、
前記複数のポジティブクラス間の分類の優先度が徐々に高くなるよう前記優先度を再設定する、
請求項６又は７に記載の識別辞書学習方法。
識別辞書を作成する識別辞書学習システムに用いられる識別辞書学習プログラムであって、
第１のクラスと、サブクラスを含む第２のクラスから成る分類の優先度を受け付け、当該優先度を設定する機能と、
前記サブクラスの組み合わせ毎に、前記優先度に基づいて複数の識別器を学習する機能と、
前記識別器について所定の最適化指標が最も良好となる前記サブクラスの組み合わせを選択する機能と、
前記選択された組み合わせで学習された識別器による識別精度に基づいて重みを更新する機能
とを有し、
前記システムの有する前記各機能をコンピュータに機能させるための識別辞書学習プログラムを格納する記録媒体。
前記第１のクラスは、ネガティブクラスとポジティブ系クラスを有し、
前記設定する機能は、ネガティブクラスとポジティブ系クラスとの分類の優先度を高く設定するよう促すこと
を更に前記コンピュータに機能させるための請求項９に記載の記録媒体。