JP4667912B2 - 判別器生成装置、判別器生成方法およびそのプログラム - Google Patents

判別器生成装置、判別器生成方法およびそのプログラム Download PDF

Info

Publication number
JP4667912B2
JP4667912B2 JP2005064967A JP2005064967A JP4667912B2 JP 4667912 B2 JP4667912 B2 JP 4667912B2 JP 2005064967 A JP2005064967 A JP 2005064967A JP 2005064967 A JP2005064967 A JP 2005064967A JP 4667912 B2 JP4667912 B2 JP 4667912B2
Authority
JP
Japan
Prior art keywords
weak
individual
image data
training image
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005064967A
Other languages
English (en)
Other versions
JP2006251955A (ja
Inventor
軼 胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2005064967A priority Critical patent/JP4667912B2/ja
Publication of JP2006251955A publication Critical patent/JP2006251955A/ja
Application granted granted Critical
Publication of JP4667912B2 publication Critical patent/JP4667912B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2111Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physiology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Image Analysis (AREA)

Description

本発明は、ブースティング学習による判別器を生成する判別器生成装置、方法およびそのプログラムに関するものである。
従来より、そこそこの性能を持つ弱判別器を組み合わせて分類の高精度の高い強い判別器を獲得する手法として、AdaBoostおよびその変形によるブースティング学習方法が提案されている(例えば、特許文献1など)。
ブースティング学習法は、画像フィルタから生成した特徴量からなる膨大な特徴量空間からトレーニングデータの重みを少しずつ変えながら適当な弱判別器を複数選択し、選択した複数の弱判別を組み合わせて用いることで高性能な判別を行なうことが可能な強い判別器を生成する手法である。
このようなブースティング学習方法においては、弱判別器の選択をするために用いる特徴量は通常二つの手法によって行なわれている。一つは開発者の経験よって決められた小さい特徴量空間から判別器の選択する手法が取られ(例えば、非特許文献1)、もう一つは特徴量によって決められる膨大な空間から組み合わせを探索する手法が取られている(例えば、非特許文献2)。
また、画像パターンの分類・認識の分野においては、さまざまな特徴量を用いて分類や認識が行われるが、分類や認識に最適な特徴量を膨大な特徴量の中から探索をおこなわなければならない。特許文献2では、MRI画像から脳の白質・灰白質などの組織分類をするために、MRI画像中の各種特徴量を入力して、属するクラス(例えば白質、灰白質、その他)を出力するバックプロパゲーション学習則を適用した層状ニューラルネットを用いた学習を行うが、組織分類に適した特徴量の全ての組合せについて、分類精度評価を行なうとかなりの計算時間が必要となる。そこで、実際に全ての特徴量の組み合わせのニューラルネットワークを構成することなく最適な特徴量の組合せを探索するために、遺伝的アルゴリズムを用いて特徴量の最適な組合せを得る手法が提案されている。
特開平8−329031号広報 特開平11−213127号広報 Paul Viola and Michael Jones,"Rapid object detection using boosted cascade of simple features",IEEE CVPR01, 2001. Raimer Lienhart and Jyochen Maydt, "An extended set of Haar-link features for rapid objection detection", vol.1, pp900-903, IEEE ICIP2002, 2002.
ブースティング学習方法を用いて高性能な判別を行なうには、最適な特徴量を選択することが必要であるが、膨大な特徴量空間から、いかに速く最適な特徴量を選択するかが問題である。しかしながら、最適な特徴量を速く選択する簡便な手法がないため、非特許文献1のように、対象とする画像の特徴に精通した作業者の勘を頼りに、試行錯誤的に構成したり、非特許文献2のように、特徴量の膨大な空間から特徴量の組み合わせを評価して、最適な特徴量の組み合わせを探索しなければならず非常に時間がかかり実用的ではなかった。この問題は、ブースティングに基づいて複数のクラスを学習するマルチクラスの共有学習を行う場合に、いっそう厳しいものとなる。マルチクラスの共有学習では、クラス間の共有関係を考慮しなければならず、探索空間がクラスの組み合わせに応じて、探索空間がさら大きくなるためである。
また、一般的に行なわれている探索手法、例えば、最大勾配法やbest first searchでは、局所に収束しやすく最適の解を求めるのが困難だと考えられる。しかし、特許文献2では遺伝的アルゴリズムを用いて局所に収束することなく最適な特徴量の組み合わせを探索しているが、ニューラルネットワークの学習に特化したものであり、ブースティング学習法に適用できるものではない。
そこで、本願発明は、ブースティング学習を行う際に、最適な特徴量を高速に選択する方法を提供することを目的とするものである。
本願発明の判別器生成装置は、多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段とを備えたことを特徴とするものである。
また、本願発明の判別器生成方法は、多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力ステップと、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予めフィルタ記憶手段に記憶するステップと、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶するステップと、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択ステップと、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成ステップとを備えたことを特徴とするものである。
また、本願発明のプログラムは、コンピュータを、
多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
前記弱判別器記憶手段に記憶されている前記複数の固体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体に対して遺伝的操作を行なって新たな個体を発生させながら次世代の個体集団を繰り返し生成して、前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された固体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段として機能させることを特徴とするものである。
「フィルタ」とは、画像より特徴量を取得することが可能なものであり、特徴量を取得するために画像を変換するプログラムも含むものである。
「遺伝的操作」とは、遺伝的アルゴリズムにおける個体の遺伝子を操作することをいい、染色体の変異と選択によって進化した世代の個体を生成するものである。具体的には、例えば、選択(selection)あるいは複製(reproduction)、交叉(crossover)、突然変異(mutation)などが挙げられる。
また、前記判別器は、判別するクラスが複数あるマルチクラスの判別を行うものであり、前記遺伝子が、該遺伝子に対応する特徴量が複数のクラスのうちのいずれのクラスの判別に用いられるものかを表す染色体配列を含むものであるものであってもよい。
「マルチクラスの判別」は、複数あるクラスの判別を同時におこなうものである。
さらに、前記遺伝子は、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであってもよい。
「染色体配列が類似する」とは、遺伝子に含まれる染色体の少なくとも一部の配列が似通ったものをいう。
さらにまた、前記強判別器は、前記選択された複数の弱判別器を、前記適応度が高くなるような重みを用いて組み合わせたものであるものが望ましい。
本発明によれば、遺伝的アルゴリズムを用いて多数の弱判別器の中からブースティング学習法に用いる弱判別器を探索するために、遺伝的アルゴリズムを用い、類似性の高いフィルタから得られた特徴量を用いた弱判別器は、染色体配列が類似する遺伝子を持つ個体に対応させて探索するようにすることで、膨大な特徴量の中から最適な特徴量を用いた弱判別器を高速に選択することができる。
また、遺伝子の染色体配列に特徴量が複数あるクラスのうちいずれのクラスの判別に用いられるものかを表す配列を含むようにすることで、マルチクラスの判別を行うことが可能になる。
また、画像上の位置を染色体配列に含むようにすることで、特定の領域に現れる特徴を効率よく探索することが可能になる。
以下、本発明の実施の形態について、図面を用いて説明する。図1は本発明の判別器生成装置の概略構成を示す図である。
図1に示す本願発明の判別器生成装置1は、トレーニング画像データ100を入力するトレーニング画像入力手段10と、判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量が得られる複数のフィルタを予め記憶するフィルタ記憶手段20と、複数のフィルタから得られる特徴量を用いた複数の弱判別器を、所定の遺伝子を持つ個体に対応させて記憶する弱判別器記憶手段30と、ブースティング学習法によって判別器を生成するために、弱判別器記憶手段30に記憶されている多数の弱判別器の中から判別に適した弱判別器(以下、最適判別器という)42を複数選択するために、遺伝的アルゴリズムを適用して最適弱判別器42を探索する最適弱判別器選択手段40と、選択した最適弱判別器42を組み合わせて強判別器を生成する強判別器生成手段50と、トレーニング画像入力手段10より入力したトレーニング画像データ100などを記憶する記憶手段60を備える。
ブースティング学習法は複数の弱判別器を組み合わせて強判別器を生成する方法であり、具体的には、与えられた弱判別器の集合(ここでは、図1の弱判別器空間33内の弱判別器に対応する)に対してトレーニングデータ(ここでは、トレーニング画像データ100に対応する)の重みをわずかに変更させながら何度も再学習させ、訓練した最適弱判別器42を集めて1つの強い判別器を生成する手法である。
本願発明では、ブースティグ学習法における弱判別器の選択に遺伝的アルゴリズムを適用する。まず、遺伝的アルゴリズムを適用するために、弱判別器記憶手段30に記憶された弱判別器を所定の遺伝子を持った個体と対応づけて記憶する。
最適弱判別器選択手段40は、遺伝的アルゴリズム探索手段41を備え、弱判別器記憶手段30に記憶された多数の個体の中からランダムに抽出して初期(第1世代の)個体集団を生成し、この初期個体集団に含まれる固体に対して遺伝的操作を行なって新たな固体を発生させて次世代個体集団を次々と生成しながら、各世代の個体集団の中から適応度の高い最適弱判別器を選択する。
強判別器生成手段50は、各世代の個体集団から選択された弱判別器を組み合わせて強い判別器を生成する。
記憶手段60は、多数の画像データを記憶することが可能なハードディスクなどの大容量記憶装置などであり、トレーニング画像入力手段10から入力されたトレーニング画像データ100を記憶する。また、記憶手段60には、ブースティング学習を行うとき用いるトレーニング画像データの第1の重み101や、ブースティングにおける選択基準102や、選択された弱判別器を組み合わせて強判別器を作成するときに用いる重みが記憶される。
少ない弱判別器で精度の高い強い判別器を獲得するためには、なるべく多くの種類のフィルタを試みて、この画像フィルタの中から画像パターンの特徴をコンパクトかつ有効に表現できる特徴量を探索して、判別性能の高い強判別器を生成する必要がある。
そこで、フィルタ記憶手段20(以下、フィルターバンク20という)には、判別対象画像の判別に適しているフィルタを多数記憶する。このフィルタは、例えば、図2に示すような長方形Haar-likeのようなフィルタ(非特許文献1を参照)を用いることができる。長方形Haar-likeのフィルタは、図2のようにa,b,cの値に応じて異なった形状のフィルタとなり、さまざまなフィルタを定義することができる。フィルターバンク20中のi番目をフィルタFtiと表わし、下式(1)のように表わす。
Figure 0004667912
パラメーターα1, α2,…, αtiは、例えば、図2の長方形Haar-likeフィルタのa,b,cに該当し、パラメーターを変えることにより同じ形式のフィルタであっても異なったフィルタを定義することができる。以下、長方形フィルタについて具体的に説明するが、ウェーブレットフィルタなどを用いるようにしてもよい。
弱判別器記憶手段30は、シングルクラスの判別の学習を行なうか、マルチクラスの判別の学習を行なうかによって構成が異なってくる。シングルクラスの学習を行なう場合には、弱判別器記憶手段30はフィルターバンク20に含まれるフィルタから生成される特徴量の集合からなる特徴量空間31と、各特徴量に対応する判別器の集合からなる判別器空間33から構成される。一方、マルチクラスについて共同学習する場合には、弱判別器記憶手段30は、シングルクラスの時の構成に加えて、マルチクラス間の共有関係を表す共有関係空間32を含む構成となる。
また、特徴量は、同じパラメーターを持つフィルタを用いて得られたものであっても、フィルタ処理を施す判別対象の画像上の位置(x,y)が異なるとフィルタリングした結果も異なったものとなる。そこで、i番目フィルタに判別対象の画像上の位置(x,y)を含めて、特徴量を下式(2)のように表す。
Figure 0004667912
図1の特徴量空間31は、パラメーターa,a,…,aと判別対象画像上の位置(x,y)を変えて得られた特徴量Fti(a,a,…,a)(i=1,2,…,N)の集合である。この空間は、フィルタFtiの種類、パラメーターa,a,…,a、およびフィルタリングする判別対象の画像上の位置(x,y)を変えた特徴量の集合で、通常膨大な空間となる。例えば、24 x 24の画像パッチにおける4種類のHaar-likeフィルタから生まれる特徴量の数は数十万個となると考えられる。
さらに、ブースティング学習法に基づいて複数のクラスの学習を同時に行なうマルチクラスの共同学習を行う場合には、文献「Antonio Torralba, Kevin P. Murphy and willian T. Freeman, "Sharing visual features for multiclass and multiview detection", IEEE CVPR04, 2000」に示されるJoint Boosting methodの共同学習のように、クラスの間で特徴量の共有関係32を考えなければならず、特徴量空間31にも共有関係32が反映され、さらに大きな空間となる。
ブースティング学習法を画像パターン分類・認識の分野に応用する場合、特にオブジェクトの検出を行なうような学習をするときには、少ない弱判別器から精度の高い強判別器を構成することが要求される。そのため、各弱判別器の性能を高めるために有効な特徴量を選択することが要求される。そこで、図1で示すような膨大な特徴量空間31の中から有効な特徴量Ftとその特徴量Ftが有効なクラスを探索しなければならない。
また、特徴量Ftの有効性は、トレーニング画像100と重み分布101により評価される。弱判別器は、通常、統計学的識別における手法で評価されるため、多数のトレーニング画像100を用いて評価される。
したがって、特徴量Ftとそのマルチクラスの共有関係とを合わせた空間における探索を全てについて評価していたのでは膨大な時間かかる。そこで、本願発明では、効率的に探索をするために、本発明は遺伝的アルゴリズムを用いて、有効な特徴量Ftとその共有関係SFtを求める。
遺伝的アルゴリズム探索手段41によって探索を行うために、弱判別空間33を適当な遺伝的表現形式で表す。まず、特徴量FtをインデックスIndftに対応させる。
Ft→Indft
特徴量空間Ftにおける全ての特徴量を「同種類フィルタ」―>「同一パラメーター」−>位置(x,y)の順に並べ、並べた順に特徴量空間のすべて特徴量を1からNまでのインデックスを割り振り、インデックスIndftの集合はインデックス空間とよばれる。図3に示すように、インデックスIndftと特徴量Ftiは一対一の関係となる。
また、マルチクラスの判別を行う場合には、複数のクラスCjで特徴量Fti(a,a,…,a,x,y)を共有するかどうかを、Sjを用いて表す。
Figure 0004667912
学習するクラスの数をNcとすると、与えられた特徴量Fti(a,a,…,a,x,y)に対するマルチクラス間の共有関係SFtiは、下の表のように長さがNcの0と1のバイナリ配列で表される。
Figure 0004667912
すなわち、下式(4)のように表すことができる。
Figure 0004667912
このSFti(ただし、Fti∈特徴量空間31)の集合がマルチクラスの共有関係空間32と呼ばれる。
弱判別器をh(・)(ただし、「・」は変数)とすると、弱判別器は、特徴量Ftiとマルチクラスの共有関係から決められ下式(5)のように表される。
Figure 0004667912
図1に示めす弱判別器空間33は、h(・)の集合である。
次に、弱判別器h(・)を遺伝子空間に写像する手法について説明する。
(1) シングルクラスの学習(One-class learning)の場合は、それぞれのインデックスIndftを0と1のバイナリ配列Binで表して遺伝子の染色体の配列に対応させる。
Figure 0004667912
(2)マルチクラスの学習(Multiclass learning)の場合は、
(i) まず、それぞれのインデックスIndftを0と1のバイナリ配列Bin1で表す。
Figure 0004667912
(ii) さらに、SFtiの配列とBin1をつなげた新しい配列Binとする(図4参照)。
Figure 0004667912
上式(6)、(8)に示す、バイナリ配列Binの各ビットを遺伝子の各染色体に対応させる。
図3に示すように、特徴量を「同種類フィルタ」―>「同一パラメーター」−>位置(x,y)の順に並べてインデックスを振った場合、このインデックスをバイナリ配列に変換して各ビットを染色体に対応させることによって、例えば、シングルクラスの学習ではBin(マルチクラスの学習ではBin1)の下位の染色体が位置(x,y)に関する配列を表すことになる。上位の染色体の配列はフィルタの種類を表し、中間の染色体の配列はフィルタのパラメーターを表すことになる(図5参照)。
弱判別器は、h(Bin)で表され、このバイナリ配列Binの遺伝子を持つ個体が、図6で示した遺伝的アルゴリズム探索手段41における探査空間411になる。この空間の中から、遺伝的アルゴリズムでは、まず初期染色の個体集団P(t=0)を生成して評価する(412)。次に、複製選択413により個体集団P(t)の中から個体を選んで、交叉や突然変異などの遺伝的操作により子の個体Cchdを生成して評価する(414)。その後、個体集団P(t)とCsel、Cchdから生存選択415を行って、新しい個体集団P'(t)(次世代の個体集団)を作って進化させる。進化の終了条件416に到達するまでは、新しい進化を繰り返して新しい世代の個体集団P'(t)を生成するが、終了条件416が満たされると、個体集団P'(t)の中から適応度が最も高い個体を選択して変換417で変換して、選択した個体の遺伝子に対応する判別器を最適弱判別器42とする。
図6の412〜413、415の各ステップには、一般的な遺伝的アルゴリズム(SGA、ER、MGG等)の戦略を適用することが可能であるが、ここでは、MGGを用いた例について、具体的に説明する。個体の評価は、ブースティングにおける弱判別器の評価基準を用いて418〜420で求める(詳細は後述)。
ここで、遺伝的アルゴリズムによる弱判別器の探索について説明する。
まず、初期個体集団P(t=0)は探索空間Binから一様乱数分布で生成する。例えば、上述の長方形Haar-likeのフィルタを24 x 24の判別対象画像に適用して得られる特徴量の数は数十万個になるが、その特徴量の中から1000個程度を一様乱数分布で選択する。まず、生成された個体に均一な重みを持たせたトレーニング画像データを用いて評価(418〜420)する。初期個体集団P(t=0)に含まれる個体の適応度があまり低い場合には、再度別の個体集団を一様乱数分布により新しく生成させる。ある程度適応度の高いものを選ぶことにより目的とする弱判別器に早くたどり着くことができるようになる。
まず、複製選択413で、適応度にかかわらず個体集団P(t)の中から2個の個体Cselをランダムに非復元抽出して親の個体とする。次に、生存選択415は、まず個体集団P(t)の中から選んだ親の個体Cselを除いて、P(t)−Csel→P'(t)にする。親の個体Cselと子の個体Cchdの家族の中から最良の1個体、あるいは適応度に比例した確率で選択されるルーレット選択により選ばれた1個体を次世代P'(t)に加える。
子の生成414では、Csel個の親個体から交叉や突然変異を経て、Cchdの子個体を生成する。交叉は、図7で示すように、まず、与えられた交叉率と一様乱数でマスクを作成し、このマスクを用いて親1と親2の一様交叉(uniform crossover)を行って、子1と子2を生成する。また、突然変異の方法には、乱数を用いてビット反転する方式を採用する。
次に、個体の評価418〜420方法について説明する。
まず、418では、入力の個体を式(6)あるいは(7)と(8)の写像に基づいて、弱判別器h(・)に対応しているフィルタFt、あるいはフィルタとその共有関係(Fti, SFt )を求める。次に、式(5)の関係を用いて弱判別器h(・)を決める。
さらに、419は、弱判別器h(・)を使用したとき、与えられたトレーニング画像および重み分布101の損失Loss(・)を次式で求める。
Figure 0004667912
損失関数Loss(・)は使用しているブースティング学習法によって適宜決められる。適応度の計算420では、418の個体(弱判別器h(・))の適応度Fitnessを次式で計算する。
Figure 0004667912
上式で表される適応度Fitnessを用いて、遺伝的アルゴリズムによって生成された各世代の個体集団P'(t)の個体の適応度を算出し、適応度の最も高い個体Chromtopを選択する。変換手段417で式(6)の写像あるいは式(7)と(8)による写像により、対応する特徴量Ft、あるいは特徴量とその共有関係(Fti, SFt )を求め、適応度の最も高い個体の特徴量Ft、あるいは特徴量とその共有関係(Fti, SFt )で構成される弱判別器h(・)を最適弱判別器42とする。
例えば、画像上の特定の位置に特徴がある画像であれば、適応度の高い特徴量は、その位置の近傍から得られる特徴量に集中して表れやすい。例えば、人の顔の画像を判別する場合、顔の中の眼や鼻のある位置関係が大きく異なることはなく、眼や鼻の検出に適したフィルタを用いて眼や鼻を抽出することができるような位置はほほ決まってくる。そこで、上述のように遺伝的アルゴリズムを適用し、遺伝子内に位置に関連する染色体の配列を持たせるようにすれば、交叉などを繰り返して適応度の高い遺伝子を持った個体を含む新しい世代の個体集合を生成するようにすれば、特徴がある位置の近傍にある特徴量に対応する個体が残る可能性が高くなり、すべての位置で特徴量を探索しなくとも、判別に適した特徴量を探索することが可能になる。同様に、特定のタイプのフィルタに対して反応が高いタイプの画像である場合にも、遺伝子内にフィルタやそのパラメーターに関連する染色体の配列を持たせることにより、特定のタイプのフィルタに集中して探索することが可能になる。
また、世代が進むに従って、一旦同じような染色体配列を持った特徴量に偏った個体が生成されるようになると、一部の染色体配列の固体が選択されやすくなるが、適当な割合で遺伝子を突然変異させることで、局所的な解に収束することなく最適な解を求めることができる。
ブースティング学習法は繰り返し学習法である。変換417で最も適応度の高い個体Chromtopを最適弱判別器42に変換した後、次回の学習プロセスでは個体Chromtopに対応するインデックスIndtopを式(6)あるいは(7)で示すように定義されたインデックス空間Indftから取り除く。具体的には、選択した個体に対応する特徴量を除いた特徴量空間に対して新たなインデックスを割り当てて新しいインテックス空間を作成する。すなわち、次の弱判別器を選択するインデックス空間は、Indft−Indtopに縮小した空間となる。
再度、この新たなインデックス空間から、選択された弱判別器による判別が正しく判別できなかったトレーニング画像データに重点を置いて判別できるように前記トレーニング画像データに対する重みを更新して、上述と同様に遺伝的アルゴリズムを用いて別の判別器を探索する。
例えば、図8に示すように、1回目最初のラウンドではトレーニング画像データSample,Sample,・・・,Sampleの重み(第1の重み101)w(1), w(2),・・・, w(m)は一様に取られるが、それ以降のラウンドでは間違ったトレーニング画像データに対してはより高い重みが与えられ、正解したトレーニングデータに対しては低い重みを与えるように重みを更新し、すでに選択された弱判別器はトレーニングデータのなかで判別の難しかったトレーニング画像データに対して重点的に再度学習が行なわれるようにする。
強判別器生成手段50は、このようにして選択された弱判別器h(・), h(・),・・・, h(・)を組み合わせて強判別器を生成する。強判別器は、弱判別器h(・)の誤り率err(k=1,2,…,m)に応じて、弱判別器h(・)の結果に重み(第2の重み103)β(k=1,2,…,m)付きの多数決によって結果を得る。
上述の遺伝的アルゴリズムでは、繰り返し弱判別器を探索する際、1度選択した個体を除いて別の弱判別器を探索する場合について記載したが、1度選択した個体を除かないで繰り返し探索を行うようにしてもよい。
以上、詳細に説明したように、遺伝的アルゴリズムを用いてブースティングの弱判別器を探索することにより、最適な弱判別器を短時間で探索することが可能になる。
判別器生成装置の概略構成図 フィルターバンクの一例 特徴量とインデックスの関係を示す図 シングルクラスとマルチクラスの遺伝子の作成方法を説明するための図 遺伝子配列を説明する図 遺伝的アルゴリズムを説明するための図 染色体交叉を説明するための図 ブースティングを説明するための図
符号の説明
1 判別器生成装置
10 トレーニング画像入力手段
20 フィルタ記憶手段
30 弱判別器記憶手段
40 最適弱判別器選択手段
50 強判別器生成手段

Claims (5)

  1. 多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
    判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
    前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
    前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体の遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成手段と、
    前記個体集団生成手段により生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
    選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段とを備え、
    前記フィルタが、長方形Harr-likeフィルタであり、
    前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とする判別器生成装置。
  2. 前記判別器が、前記判別するクラスが複数あるマルチクラスの判別を行うものであり、
    前記遺伝子が、該遺伝子に対応する特徴量が複数のクラスのうちのいずれのクラスの判別に用いられるものかを表す染色体配列を含むものであることを特徴とする請求項記載の判別器生成装置。
  3. 前記強判別器が、前記選択た複数の弱判別器を、前記適応度が高くなるような重みを用いて組み合わせたものであることを特徴とする請求項1または2記載の判別器生成装置。
  4. 多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
    判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
    前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
    前記弱判別器記憶手段に記憶されている前記複数の個体のうちの一部の個体からなる複数世代の個体集団を繰り返し生成する個体集団生成手段と、
    前記個体集団生成手段により生成された前記個体集団の中から、前記トレーニング画像データを用いて弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
    選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段と、
    を備えた判別器生成装置の動作方法において、
    前記トレーニング画像入力手段が、前記トレーニング画像データを入力するトレーニング画像入力ステップと、
    前記個体集団生成手段が、前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体の遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成ステップと、
    前記最適弱判別器選択手段が、前記個体集団生成ステップにより生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択ステップと、
    前記強判別器生成手段が、選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成ステップを実行する判別器生成装置の動作方法であって、
    前記フィルタが、長方形Harr-likeフィルタであり、
    前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とする判別器生成装置の動作方法。
  5. ンピュータを、
    多数の弱判別器を組み合わせて強判別器を生成するブースティング学習のためのトレーニング画像データを入力するトレーニング画像入力手段と、
    判別対象の画像データが所定のクラスに属するか否かを判別するために用いる特徴量を得る複数のフィルタを予め記憶するフィルタ記憶手段と、
    前記複数のフィルタから得た特徴量を用いた複数の弱判別器を複数の遺伝的アルゴリズムにおける遺伝子を持つ個体それぞれに対応させ、かつ、前記複数の弱判別器のうち類似性の高いフィルタから得られた特徴量を用いた弱判別器を染色体配列が類似する遺伝子を持つ前記個体に対応させて記憶する弱判別器記憶手段と、
    前記弱判別器記憶手段に記憶されている前記複数の個体から一部の個体を選択し、この選択した個体からなる個体集団を生成し、該個体集団に含まれる個体遺伝子に対して遺伝的操作を行なって新たな個体を発生させながら、前記トレーニング画像データに対する適応度の最も高い個体または適応度に比例して高い確率で選択された個体を含む次世代の個体集団を繰り返し生成する個体集団生成手段と、
    前記個体集団生成手段により生成された前記各世代の個体集団の中から、所定の重み付けした前記トレーニング画像データに対する適応度の高い個体を探索して、該探索された個体に対応する弱判別器を選択するとともに、選択された弱判別器により、正しく判別できなかったトレーニング画像データに重点を置いて判別できるように、前記トレーニング画像データに対する重みを更新し、更新した重みを用いて重み付けした前記トレーニング画像データを用いて再度弱判別器を選択する処理を繰り返して複数の弱判別器を選択する最適弱判別器選択手段と、
    選択した前記弱判別器を組み合わせて強判別器を生成する強判別器生成手段として機能させるプログラムであって、
    前記フィルタが、長方形Harr-likeフィルタであり、
    前記遺伝子が、前記フィルタを用いてフィルタリング処理を施す前記判別対象の画像上の位置を表わす染色体配列を含むものであり、前記判別対象の画像上の位置が近いものほど前記位置を表わす染色体配列が類似するように決められるものであることを特徴とするプログラム。
JP2005064967A 2005-03-09 2005-03-09 判別器生成装置、判別器生成方法およびそのプログラム Expired - Fee Related JP4667912B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005064967A JP4667912B2 (ja) 2005-03-09 2005-03-09 判別器生成装置、判別器生成方法およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005064967A JP4667912B2 (ja) 2005-03-09 2005-03-09 判別器生成装置、判別器生成方法およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2006251955A JP2006251955A (ja) 2006-09-21
JP4667912B2 true JP4667912B2 (ja) 2011-04-13

Family

ID=37092409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005064967A Expired - Fee Related JP4667912B2 (ja) 2005-03-09 2005-03-09 判別器生成装置、判別器生成方法およびそのプログラム

Country Status (1)

Country Link
JP (1) JP4667912B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4660765B2 (ja) * 2006-02-13 2011-03-30 国立大学法人横浜国立大学 進化型画像自動分類装置、フィルタ構造生成方法、及びプログラム
JP2008204103A (ja) * 2007-02-19 2008-09-04 Yokohama National Univ 画像認識システム
JP2009110212A (ja) * 2007-10-29 2009-05-21 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP4997178B2 (ja) * 2008-06-10 2012-08-08 学校法人中部大学 物体検出装置
CN101853389A (zh) * 2009-04-01 2010-10-06 索尼株式会社 多类目标的检测装置及检测方法
JP5417967B2 (ja) * 2009-04-24 2014-02-19 株式会社ニコン 遺伝的処理装置、遺伝的処理方法およびプログラム
JP5444822B2 (ja) * 2009-04-30 2014-03-19 株式会社ニコン 遺伝的処理装置、遺伝的処理方法およびプログラム
JP2013164863A (ja) * 2013-04-24 2013-08-22 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP6127958B2 (ja) * 2013-12-19 2017-05-17 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
CN108140133B (zh) 2015-10-22 2022-03-22 富士通株式会社 程序生成装置、程序生成方法及记录介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020102024A1 (en) * 2000-11-29 2002-08-01 Compaq Information Technologies Group, L.P. Method and system for object detection in digital images
JP2003271726A (ja) * 2002-03-18 2003-09-26 Dentsu Inc 新聞広告出稿プラン選択システム及び方法
JP2004355174A (ja) * 2003-05-28 2004-12-16 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020102024A1 (en) * 2000-11-29 2002-08-01 Compaq Information Technologies Group, L.P. Method and system for object detection in digital images
JP2003271726A (ja) * 2002-03-18 2003-09-26 Dentsu Inc 新聞広告出稿プラン選択システム及び方法
JP2004355174A (ja) * 2003-05-28 2004-12-16 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム
JP2005044330A (ja) * 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置

Also Published As

Publication number Publication date
JP2006251955A (ja) 2006-09-21

Similar Documents

Publication Publication Date Title
JP4667912B2 (ja) 判別器生成装置、判別器生成方法およびそのプログラム
Robbins et al. The ant colony algorithm for feature selection in high-dimension gene expression data for disease classification
Loyola-González et al. Cost-sensitive pattern-based classification for class imbalance problems
Amal et al. Survey of nearest neighbor condensing techniques
Rostami et al. A clustering based genetic algorithm for feature selection
Szerlip et al. Unsupervised feature learning through divergent discriminative feature accumulation
CN111414863B (zh) 一种增强型集成遥感影像分类方法
Tan Rule learning and extraction with self-organizing neural networks
Dimanov et al. Moncae: Multi-objective neuroevolution of convolutional autoencoders
Jan et al. Optimizing clustering to promote data diversity when generating an ensemble classifier
Mathew Simple and ensemble decision tree classifier based detection of breast cancer
Akpajaro Genetic algorithm with bagging for DNA classification
Howley et al. An evolutionary approach to automatic kernel construction
Aishwarya et al. Parkinson’s disease prediction using fisher score based recursive feature elimination
Elshazly et al. Lymph diseases diagnosis approach based on support vector machines with different kernel functions
Ishibuchi et al. A hybrid fuzzy genetics-based machine learning algorithm: hybridization of Michigan approach and Pittsburgh approach
Guidotti et al. Generative Model for Decision Trees
Senthamilarasu et al. A genetic algorithm based intuitionistic fuzzification technique for attribute selection
David et al. Stacked framework for ensemble of heterogeneous classification algorithms
Dinakaran et al. Comparative analysis of filter-wrapper approach for random forest performance on multivariate data
Zeraliu Comparison of ensemble-based feature selection methods for binary classification of imbalanced data sets
Amarnath et al. Metaheuristic approach for efficient feature selection: A data classification perspective
Torres et al. Application of a GA/Bayesian filter-wrapper feature selection method to classification of clinical depression from speech data
Kabeer et al. BFSSGA: Enhancing the Performance of Genetic Algorithm using Boosted Filtering Approach
Gaspar et al. Parameter Influence in Genetic Algorithm Optimization of Support Vector Machines

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100809

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101129

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20101202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees