JP4667912B2

JP4667912B2 - 判別器生成装置、判別器生成方法およびそのプログラム

Info

Publication number: JP4667912B2
Application number: JP2005064967A
Authority: JP
Inventors: 軼胡
Original assignee: Fujifilm Corp
Current assignee: Fujifilm Corp
Priority date: 2005-03-09
Filing date: 2005-03-09
Publication date: 2011-04-13
Anticipated expiration: 2025-03-09
Also published as: JP2006251955A

Description

本発明は、ブースティング学習による判別器を生成する判別器生成装置、方法およびそのプログラムに関するものである。

従来より、そこそこの性能を持つ弱判別器を組み合わせて分類の高精度の高い強い判別器を獲得する手法として、AdaBoostおよびその変形によるブースティング学習方法が提案されている（例えば、特許文献１など）。

ブースティング学習法は、画像フィルタから生成した特徴量からなる膨大な特徴量空間からトレーニングデータの重みを少しずつ変えながら適当な弱判別器を複数選択し、選択した複数の弱判別を組み合わせて用いることで高性能な判別を行なうことが可能な強い判別器を生成する手法である。

このようなブースティング学習方法においては、弱判別器の選択をするために用いる特徴量は通常二つの手法によって行なわれている。一つは開発者の経験よって決められた小さい特徴量空間から判別器の選択する手法が取られ（例えば、非特許文献１）、もう一つは特徴量によって決められる膨大な空間から組み合わせを探索する手法が取られている（例えば、非特許文献２）。

また、画像パターンの分類・認識の分野においては、さまざまな特徴量を用いて分類や認識が行われるが、分類や認識に最適な特徴量を膨大な特徴量の中から探索をおこなわなければならない。特許文献２では、ＭＲＩ画像から脳の白質・灰白質などの組織分類をするために、ＭＲI画像中の各種特徴量を入力して、属するクラス（例えば白質、灰白質、その他）を出力するバックプロパゲーション学習則を適用した層状ニューラルネットを用いた学習を行うが、組織分類に適した特徴量の全ての組合せについて、分類精度評価を行なうとかなりの計算時間が必要となる。そこで、実際に全ての特徴量の組み合わせのニューラルネットワークを構成することなく最適な特徴量の組合せを探索するために、遺伝的アルゴリズムを用いて特徴量の最適な組合せを得る手法が提案されている。
特開平８−３２９０３１号広報特開平１１−２１３１２７号広報 Paul Viola and Michael Jones,"Rapid object detection using boosted cascade of simple features",IEEE CVPR01, 2001. Raimer Lienhart and Jyochen Maydt, "An extended set of Haar-link features for rapid objection detection", vol.1, pp900-903, IEEE ICIP2002, 2002.

ブースティング学習方法を用いて高性能な判別を行なうには、最適な特徴量を選択することが必要であるが、膨大な特徴量空間から、いかに速く最適な特徴量を選択するかが問題である。しかしながら、最適な特徴量を速く選択する簡便な手法がないため、非特許文献１のように、対象とする画像の特徴に精通した作業者の勘を頼りに、試行錯誤的に構成したり、非特許文献２のように、特徴量の膨大な空間から特徴量の組み合わせを評価して、最適な特徴量の組み合わせを探索しなければならず非常に時間がかかり実用的ではなかった。この問題は、ブースティングに基づいて複数のクラスを学習するマルチクラスの共有学習を行う場合に、いっそう厳しいものとなる。マルチクラスの共有学習では、クラス間の共有関係を考慮しなければならず、探索空間がクラスの組み合わせに応じて、探索空間がさら大きくなるためである。

また、一般的に行なわれている探索手法、例えば、最大勾配法やbest first searchでは、局所に収束しやすく最適の解を求めるのが困難だと考えられる。しかし、特許文献２では遺伝的アルゴリズムを用いて局所に収束することなく最適な特徴量の組み合わせを探索しているが、ニューラルネットワークの学習に特化したものであり、ブースティング学習法に適用できるものではない。

そこで、本願発明は、ブースティング学習を行う際に、最適な特徴量を高速に選択する方法を提供することを目的とするものである。

本願発明の判別器生成装置は、多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段とを備えたことを特徴とするものである。

また、本願発明の判別器生成方法は、多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力ステップと、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予めフィルタ記憶手段に記憶するステップと、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶するステップと、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択ステップと、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成ステップとを備えたことを特徴とするものである。

また、本願発明のプログラムは、コンピュータを、
多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段として機能させることを特徴とするものである。

「フィルタ」とは、画像より特徴量を取得することが可能なものであり、特徴量を取得するために画像を変換するプログラムも含むものである。

「遺伝的操作」とは、遺伝的アルゴリズムにおける個体の遺伝子を操作することをいい、染色体の変異と選択によって進化した世代の個体を生成するものである。具体的には、例えば、選択（selection）あるいは複製（reproduction）、交叉（crossover）、突然変異（mutation）などが挙げられる。

また、前記判別器は、判別するクラスが複数あるマルチクラスの判別を行うものであり、前記遺伝子が、該遺伝子に対応する特徴量が複数のクラスのうちのいずれのクラスの判別に用いられるものかを表す染色体配列を含むものであるものであってもよい。

「マルチクラスの判別」は、複数あるクラスの判別を同時におこなうものである。

さらに、前記遺伝子は、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであってもよい。

「染色体配列が類似する」とは、遺伝子に含まれる染色体の少なくとも一部の配列が似通ったものをいう。

さらにまた、前記強判別器は、前記選択された複数の弱判別器を、前記適応度が高くなるような重みを用いて組み合わせたものであるものが望ましい。

本発明によれば、遺伝的アルゴリズムを用いて多数の弱判別器の中からブースティング学習法に用いる弱判別器を探索するために、遺伝的アルゴリズムを用い、類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ個体に対応させて探索するようにすることで、膨大な特徴量の中から最適な特徴量を用いた弱判別器を高速に選択することができる。

また、遺伝子の染色体配列に特徴量が複数あるクラスのうちいずれのクラスの判別に用いられるものかを表す配列を含むようにすることで、マルチクラスの判別を行うことが可能になる。

また、画像上の位置を染色体配列に含むようにすることで、特定の領域に現れる特徴を効率よく探索することが可能になる。

以下、本発明の実施の形態について、図面を用いて説明する。図１は本発明の判別器生成装置の概略構成を示す図である。

図１に示す本願発明の判別器生成装置１は、トレーニング画像データ１００を入力するトレーニング画像入力手段１０と、判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量が得られる複数のフィルタを予め記憶するフィルタ記憶手段２０と、複数のフィルタから得られる特徴量を用いた複数の弱判別器を、所定の遺伝子を持つ個体に対応させて記憶する弱判別器記憶手段３０と、ブースティング学習法によって判別器を生成するために、弱判別器記憶手段３０に記憶されている多数の弱判別器の中から判別に適した弱判別器（以下、最適判別器という）４２を複数選択するために、遺伝的アルゴリズムを適用して最適弱判別器４２を探索する最適弱判別器選択手段４０と、選択した最適弱判別器４２を組み合わせて強判別器を生成する強判別器生成手段５０と、トレーニング画像入力手段１０より入力したトレーニング画像データ１００などを記憶する記憶手段６０を備える。

ブースティング学習法は複数の弱判別器を組み合わせて強判別器を生成する方法であり、具体的には、与えられた弱判別器の集合（ここでは、図１の弱判別器空間３３内の弱判別器に対応する）に対してトレーニングデータ（ここでは、トレーニング画像データ１００に対応する）の重みをわずかに変更させながら何度も再学習させ、訓練した最適弱判別器４２を集めて１つの強い判別器を生成する手法である。

本願発明では、ブースティグ学習法における弱判別器の選択に遺伝的アルゴリズムを適用する。まず、遺伝的アルゴリズムを適用するために、弱判別器記憶手段３０に記憶された弱判別器を所定の遺伝子を持った個体と対応づけて記憶する。

最適弱判別器選択手段４０は、遺伝的アルゴリズム探索手段４１を備え、弱判別器記憶手段３０に記憶された多数の個体の中からランダムに抽出して初期（第１世代の）個体集団を生成し、この初期個体集団に含まれる固体に対して遺伝的操作を行なって新たな固体を発生させて次世代個体集団を次々と生成しながら、各世代の個体集団の中から適応度の高い最適弱判別器を選択する。

強判別器生成手段５０は、各世代の個体集団から選択された弱判別器を組み合わせて強い判別器を生成する。

記憶手段６０は、多数の画像データを記憶することが可能なハードディスクなどの大容量記憶装置などであり、トレーニング画像入力手段１０から入力されたトレーニング画像データ１００を記憶する。また、記憶手段６０には、ブースティング学習を行うとき用いるトレーニング画像データの第１の重み１０１や、ブースティングにおける選択基準１０２や、選択された弱判別器を組み合わせて強判別器を作成するときに用いる重みが記憶される。

少ない弱判別器で精度の高い強い判別器を獲得するためには、なるべく多くの種類のフィルタを試みて、この画像フィルタの中から画像パターンの特徴をコンパクトかつ有効に表現できる特徴量を探索して、判別性能の高い強判別器を生成する必要がある。

そこで、フィルタ記憶手段２０（以下、フィルターバンク２０という）には、判別対象画像の判別に適しているフィルタを多数記憶する。このフィルタは、例えば、図２に示すような長方形Haar-likeのようなフィルタ（非特許文献１を参照）を用いることができる。長方形Haar-likeのフィルタは、図２のようにa,b,cの値に応じて異なった形状のフィルタとなり、さまざまなフィルタを定義することができる。フィルターバンク２０中のｉ番目をフィルタFt_iと表わし、下式（１）のように表わす。

パラメーターα₁, α₂,…, α_ｔiは、例えば、図２の長方形Haar-likeフィルタのa,b,cに該当し、パラメーターを変えることにより同じ形式のフィルタであっても異なったフィルタを定義することができる。以下、長方形フィルタについて具体的に説明するが、ウェーブレットフィルタなどを用いるようにしてもよい。

弱判別器記憶手段３０は、シングルクラスの判別の学習を行なうか、マルチクラスの判別の学習を行なうかによって構成が異なってくる。シングルクラスの学習を行なう場合には、弱判別器記憶手段３０はフィルターバンク２０に含まれるフィルタから生成される特徴量の集合からなる特徴量空間３１と、各特徴量に対応する判別器の集合からなる判別器空間３３から構成される。一方、マルチクラスについて共同学習する場合には、弱判別器記憶手段３０は、シングルクラスの時の構成に加えて、マルチクラス間の共有関係を表す共有関係空間３２を含む構成となる。

また、特徴量は、同じパラメーターを持つフィルタを用いて得られたものであっても、フィルタ処理を施す判別対象の画像上の位置（x,y）が異なるとフィルタリングした結果も異なったものとなる。そこで、i番目フィルタに判別対象の画像上の位置（x,y）を含めて、特徴量を下式（２）のように表す。

図１の特徴量空間３１は、パラメーターa_１,a_２,…，a_ｔと判別対象画像上の位置（x,y）を変えて得られた特徴量Ft_i(a_１，a_２，…，a_ｔ)(i=1,2,…,N)の集合である。この空間は、フィルタFt_iの種類、パラメーターa_１,a_２,…,a_ｔ、およびフィルタリングする判別対象の画像上の位置（x,y）を変えた特徴量の集合で、通常膨大な空間となる。例えば、24 x 24の画像パッチにおける４種類のHaar-likeフィルタから生まれる特徴量の数は数十万個となると考えられる。

さらに、ブースティング学習法に基づいて複数のクラスの学習を同時に行なうマルチクラスの共同学習を行う場合には、文献「Antonio Torralba, Kevin P. Murphy and willian T. Freeman, "Sharing visual features for multiclass and multiview detection", IEEE CVPR04, 2000」に示されるJoint Boosting methodの共同学習のように、クラスの間で特徴量の共有関係３２を考えなければならず、特徴量空間３１にも共有関係３２が反映され、さらに大きな空間となる。

ブースティング学習法を画像パターン分類・認識の分野に応用する場合、特にオブジェクトの検出を行なうような学習をするときには、少ない弱判別器から精度の高い強判別器を構成することが要求される。そのため、各弱判別器の性能を高めるために有効な特徴量を選択することが要求される。そこで、図１で示すような膨大な特徴量空間３１の中から有効な特徴量Ftとその特徴量Ftが有効なクラスを探索しなければならない。

また、特徴量Ftの有効性は、トレーニング画像１００と重み分布１０１により評価される。弱判別器は、通常、統計学的識別における手法で評価されるため、多数のトレーニング画像１００を用いて評価される。

したがって、特徴量Ftとそのマルチクラスの共有関係とを合わせた空間における探索を全てについて評価していたのでは膨大な時間かかる。そこで、本願発明では、効率的に探索をするために、本発明は遺伝的アルゴリズムを用いて、有効な特徴量Ftとその共有関係S_Ftを求める。

遺伝的アルゴリズム探索手段４１によって探索を行うために、弱判別空間３３を適当な遺伝的表現形式で表す。まず、特徴量FtをインデックスInd_ｆｔに対応させる。

Ft→Ind_ｆｔ
特徴量空間Ftにおける全ての特徴量を「同種類フィルタ」―＞「同一パラメーター」−＞位置(x,y)の順に並べ、並べた順に特徴量空間のすべて特徴量を１からNまでのインデックスを割り振り、インデックスInd_ｆｔの集合はインデックス空間とよばれる。図３に示すように、インデックスInd_ｆｔと特徴量Ft_iは一対一の関係となる。

また、マルチクラスの判別を行う場合には、複数のクラスC_jで特徴量Ft_i(a_１,a_２,…,a_ｔ,x,y)を共有するかどうかを、Sｊを用いて表す。

学習するクラスの数をNcとすると、与えられた特徴量Ft_i(a_１,a_２,…,a_ｔ,x,y)に対するマルチクラス間の共有関係S_Ftiは、下の表のように長さがＮcの0と1のバイナリ配列で表される。

すなわち、下式(4)のように表すことができる。

このS_Fti（ただし、Ft_i∈特徴量空間３１）の集合がマルチクラスの共有関係空間３２と呼ばれる。

弱判別器をh(・)（ただし、「・」は変数）とすると、弱判別器は、特徴量Ft_iとマルチクラスの共有関係から決められ下式(5)のように表される。

図１に示めす弱判別器空間３３は、h(・)の集合である。

次に、弱判別器h(・)を遺伝子空間に写像する手法について説明する。

（１）シングルクラスの学習（One-class learning）の場合は、それぞれのインデックスInd_ｆｔを0と１のバイナリ配列Binで表して遺伝子の染色体の配列に対応させる。

（２）マルチクラスの学習（Multiclass learning）の場合は、
(i) まず、それぞれのインデックスInd_ｆｔを0と１のバイナリ配列Bin1で表す。

(ii) さらに、S_Ftiの配列とBin1をつなげた新しい配列Binとする（図４参照）。

上式(6)、(8)に示す、バイナリ配列Binの各ビットを遺伝子の各染色体に対応させる。

図３に示すように、特徴量を「同種類フィルタ」―＞「同一パラメーター」−＞位置(x,y)の順に並べてインデックスを振った場合、このインデックスをバイナリ配列に変換して各ビットを染色体に対応させることによって、例えば、シングルクラスの学習ではBin（マルチクラスの学習ではBin１）の下位の染色体が位置(x,y)に関する配列を表すことになる。上位の染色体の配列はフィルタの種類を表し、中間の染色体の配列はフィルタのパラメーターを表すことになる（図５参照）。

弱判別器は、h(Bin)で表され、このバイナリ配列Binの遺伝子を持つ個体が、図６で示した遺伝的アルゴリズム探索手段４１における探査空間４１１になる。この空間の中から、遺伝的アルゴリズムでは、まず初期染色の個体集団Ｐ(t＝0)を生成して評価する（４１２）。次に、複製選択４１３により個体集団Ｐ(t)の中から個体を選んで、交叉や突然変異などの遺伝的操作により子の個体Ｃ_chdを生成して評価する（４１４）。その後、個体集団Ｐ(t)とＣ_sel、Ｃ_chdから生存選択４１５を行って、新しい個体集団Ｐ'(t)（次世代の個体集団）を作って進化させる。進化の終了条件４１６に到達するまでは、新しい進化を繰り返して新しい世代の個体集団Ｐ'(t)を生成するが、終了条件４１６が満たされると、個体集団Ｐ'(t)の中から適応度が最も高い個体を選択して変換４１７で変換して、選択した個体の遺伝子に対応する判別器を最適弱判別器４２とする。

図６の４１２〜４１３、４１５の各ステップには、一般的な遺伝的アルゴリズム(SGA、ER、MGG等)の戦略を適用することが可能であるが、ここでは、MGGを用いた例について、具体的に説明する。個体の評価は、ブースティングにおける弱判別器の評価基準を用いて４１８〜４２０で求める（詳細は後述）。

ここで、遺伝的アルゴリズムによる弱判別器の探索について説明する。

まず、初期個体集団Ｐ(t＝0)は探索空間Binから一様乱数分布で生成する。例えば、上述の長方形Haar-likeのフィルタを24 x 24の判別対象画像に適用して得られる特徴量の数は数十万個になるが、その特徴量の中から1000個程度を一様乱数分布で選択する。まず、生成された個体に均一な重みを持たせたトレーニング画像データを用いて評価(４１８〜４２０)する。初期個体集団Ｐ(t＝0)に含まれる個体の適応度があまり低い場合には、再度別の個体集団を一様乱数分布により新しく生成させる。ある程度適応度の高いものを選ぶことにより目的とする弱判別器に早くたどり着くことができるようになる。

まず、複製選択４１３で、適応度にかかわらず個体集団Ｐ(t)の中から２個の個体Ｃ_selをランダムに非復元抽出して親の個体とする。次に、生存選択４１５は、まず個体集団Ｐ(t)の中から選んだ親の個体Ｃ_selを除いて、Ｐ(t)−Ｃ_sel→Ｐ'(t)にする。親の個体Ｃ_selと子の個体Ｃ_chdの家族の中から最良の１個体、あるいは適応度に比例した確率で選択されるルーレット選択により選ばれた１個体を次世代Ｐ'(t)に加える。

子の生成４１４では、Ｃ_sel個の親個体から交叉や突然変異を経て、Ｃ_chdの子個体を生成する。交叉は、図７で示すように、まず、与えられた交叉率と一様乱数でマスクを作成し、このマスクを用いて親１と親２の一様交叉(uniform crossover)を行って、子１と子２を生成する。また、突然変異の方法には、乱数を用いてビット反転する方式を採用する。

次に、個体の評価４１８〜４２０方法について説明する。

まず、４１８では、入力の個体を式(6)あるいは(7)と(8)の写像に基づいて、弱判別器ｈ(・)に対応しているフィルタFt、あるいはフィルタとその共有関係(Ft_i, S_Ft )を求める。次に、式(5)の関係を用いて弱判別器ｈ(・)を決める。

さらに、４１９は、弱判別器ｈ(・)を使用したとき、与えられたトレーニング画像および重み分布１０１の損失Loss(・)を次式で求める。

損失関数Loss(・)は使用しているブースティング学習法によって適宜決められる。適応度の計算４２０では、４１８の個体（弱判別器ｈ(・)）の適応度Fitnessを次式で計算する。

上式で表される適応度Fitnessを用いて、遺伝的アルゴリズムによって生成された各世代の個体集団Ｐ'(t)の個体の適応度を算出し、適応度の最も高い個体Chrom_topを選択する。変換手段４１７で式(6)の写像あるいは式(7)と(8)による写像により、対応する特徴量Ft、あるいは特徴量とその共有関係(Ft_i, S_Ft )を求め、適応度の最も高い個体の特徴量Ft、あるいは特徴量とその共有関係(Ft_i, S_Ft )で構成される弱判別器ｈ(・)を最適弱判別器４２とする。

例えば、画像上の特定の位置に特徴がある画像であれば、適応度の高い特徴量は、その位置の近傍から得られる特徴量に集中して表れやすい。例えば、人の顔の画像を判別する場合、顔の中の眼や鼻のある位置関係が大きく異なることはなく、眼や鼻の検出に適したフィルタを用いて眼や鼻を抽出することができるような位置はほほ決まってくる。そこで、上述のように遺伝的アルゴリズムを適用し、遺伝子内に位置に関連する染色体の配列を持たせるようにすれば、交叉などを繰り返して適応度の高い遺伝子を持った個体を含む新しい世代の個体集合を生成するようにすれば、特徴がある位置の近傍にある特徴量に対応する個体が残る可能性が高くなり、すべての位置で特徴量を探索しなくとも、判別に適した特徴量を探索することが可能になる。同様に、特定のタイプのフィルタに対して反応が高いタイプの画像である場合にも、遺伝子内にフィルタやそのパラメーターに関連する染色体の配列を持たせることにより、特定のタイプのフィルタに集中して探索することが可能になる。

また、世代が進むに従って、一旦同じような染色体配列を持った特徴量に偏った個体が生成されるようになると、一部の染色体配列の固体が選択されやすくなるが、適当な割合で遺伝子を突然変異させることで、局所的な解に収束することなく最適な解を求めることができる。

ブースティング学習法は繰り返し学習法である。変換４１７で最も適応度の高い個体Chrom_topを最適弱判別器４２に変換した後、次回の学習プロセスでは個体Chrom_topに対応するインデックスInd_ｔｏｐを式(6)あるいは(7)で示すように定義されたインデックス空間Ind_ｆｔから取り除く。具体的には、選択した個体に対応する特徴量を除いた特徴量空間に対して新たなインデックスを割り当てて新しいインテックス空間を作成する。すなわち、次の弱判別器を選択するインデックス空間は、Ind_ｆｔ−Ind_topに縮小した空間となる。

再度、この新たなインデックス空間から、選択された弱判別器による判別が正しく判別できなかったトレーニング画像データに重点を置いて判別できるように前記トレーニング画像データに対する重みを更新して、上述と同様に遺伝的アルゴリズムを用いて別の判別器を探索する。

例えば、図８に示すように、１回目最初のラウンドではトレーニング画像データSample_１,Sample_２,・・・,Sample_ｍの重み（第1の重み１０１）w_１(1), w_１(2),・・・, w_１(m)は一様に取られるが、それ以降のラウンドでは間違ったトレーニング画像データに対してはより高い重みが与えられ、正解したトレーニングデータに対しては低い重みを与えるように重みを更新し、すでに選択された弱判別器はトレーニングデータのなかで判別の難しかったトレーニング画像データに対して重点的に再度学習が行なわれるようにする。

強判別器生成手段５０は、このようにして選択された弱判別器ｈ_１(・), ｈ_２(・),・・・, ｈ_ｍ(・)を組み合わせて強判別器を生成する。強判別器は、弱判別器ｈ_ｋ(・)の誤り率err_ｋ(ｋ＝1,2,…,ｍ)に応じて、弱判別器ｈ_ｋ(・)の結果に重み（第２の重み１０３）β_ｋ(ｋ＝1,2,…,ｍ)付きの多数決によって結果を得る。

上述の遺伝的アルゴリズムでは、繰り返し弱判別器を探索する際、１度選択した個体を除いて別の弱判別器を探索する場合について記載したが、１度選択した個体を除かないで繰り返し探索を行うようにしてもよい。

以上、詳細に説明したように、遺伝的アルゴリズムを用いてブースティングの弱判別器を探索することにより、最適な弱判別器を短時間で探索することが可能になる。

判別器生成装置の概略構成図フィルターバンクの一例特徴量とインデックスの関係を示す図シングルクラスとマルチクラスの遺伝子の作成方法を説明するための図遺伝子配列を説明する図遺伝的アルゴリズムを説明するための図染色体交叉を説明するための図ブースティングを説明するための図

符号の説明

１判別器生成装置
10 トレーニング画像入力手段
20 フィルタ記憶手段
30 弱判別器記憶手段
40 最適弱判別器選択手段
50 強判別器生成手段

Claims

多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体の遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成手段と、
前記個体集団生成手段により生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段とを備え、
前記フィルタが、長方形Harr-likeフィルタであり、
前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とする判別器生成装置。
前記判別器が、前記判別するクラスが複数あるマルチクラスの判別を行うものであり、
前記遺伝子が、該遺伝子に対応する特徴量が複数のクラスのうちのいずれのクラスの判別に用いられるものかを表す染色体配列を含むものであることを特徴とする請求項１記載の判別器生成装置。
前記強判別器が、前記選択した複数の弱判別器を、前記適応度が高くなるような重みを用いて組み合わせたものであることを特徴とする請求項１または２記載の判別器生成装置。
多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の個体のうちの一部の個体からなる複数世代の個体集団を繰り返し生成する個体集団生成手段と、
前記個体集団生成手段により生成された前記個体集団の中から、前記トレーニング画像データを用いて弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段と、
を備えた判別器生成装置の動作方法において、
前記トレーニング画像入力手段が、前記トレーニング画像データを入力するトレーニング画像入力ステップと、
前記個体集団生成手段が、前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体の遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成ステップと、
前記最適弱判別器選択手段が、前記個体集団生成ステップにより生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択ステップと、
前記強判別器生成手段が、選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成ステップを実行する判別器生成装置の動作方法であって、
前記フィルタが、長方形Harr-likeフィルタであり、
前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とする判別器生成装置の動作方法。
コンピュータを、
多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体の遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成手段と、
前記個体集団生成手段により生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段として機能させるプログラムであって、
前記フィルタが、長方形Harr-likeフィルタであり、
前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とするプログラム。