JP2007058722A - 判別器の学習方法および対象判別装置ならびにプログラム - Google Patents

判別器の学習方法および対象判別装置ならびにプログラム Download PDF

Info

Publication number
JP2007058722A
JP2007058722A JP2005245493A JP2005245493A JP2007058722A JP 2007058722 A JP2007058722 A JP 2007058722A JP 2005245493 A JP2005245493 A JP 2005245493A JP 2005245493 A JP2005245493 A JP 2005245493A JP 2007058722 A JP2007058722 A JP 2007058722A
Authority
JP
Japan
Prior art keywords
candidate
image
discrimination
discriminator
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005245493A
Other languages
English (en)
Inventor
Yoshiro Kitamura
嘉郎 北村
Sadataka Akahori
貞登 赤堀
Kensuke Terakawa
賢祐 寺川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2005245493A priority Critical patent/JP2007058722A/ja
Publication of JP2007058722A publication Critical patent/JP2007058722A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 画像内の判別対象の検出について高い検出精度を保ちつつ高速化を図る。
【解決手段】 部分画像生成手段11によりサブウィンドウWが全体画像P上を複数画素間隔で走査し複数の部分画像PPが生成される。生成された部分画像PPは、候補判別器12において顔(判別対象)であるか否かが判別され、顔である可能性のある候補画像CPが検出される。次に、周辺画像生成手段21において、検出された候補画像CPの周辺の領域から複数の周辺画像APが生成される。生成された周辺画像APは対象判別器22において顔が含まれているか否かが判別される。そして、顔である判別された周辺画像APが検出される。
【選択図】 図1

Description

本発明は、画像がたとえば人物の顔等の判別対象であるか否かを判別する判別器学習方法および対象判別装置ならびにプログラムに関するものである。
顔検出の基本原理は顔か顔ではないかの2クラス判別であり、この判別方法としてブースティング(Boosting)と呼ばれる手法が広く用いられている(たとえば特許文献1参照)。ブースティングアルゴリズムは複数の弱い判別器(弱判別器)を結合することにより1つの強い判別器を形成する2クラス判別器の学習方法であって、弱判別器における特徴量としてたとえば多重解像度平面のエッジ情報が用いられる。
特に、ブースティングによる顔検出処理の高速化を図るために、弱判別器がカスケード構造を有する判別器が提案されている(たとえば特許文献2参照)。この判別器において、弱判別器が顔もしくは非顔の判別を行ったときに、上流側の弱判別器が顔であると判別した画像について下流側の弱判別器がさらに顔か非顔かの判別を行うようになっている。
ところで、顔検出処理の検出速度は初期(上流側)の探索量に左右されるものであり、初期の探索量が多ければ多いほど検出速度は遅くなってしまう。ここで、初期の探索量を減らすために、カスケード構造の上流側において低解像度の画像を用いることが提案されている(たとえば非特許文献3参照)。非特許文献3において、上流側の弱判別器では低解像度の画像から抽出した特徴量を用いて顔の判別を行い、下流側の弱判別器になるにつれて高解像度の画像から抽出した特徴量を用いて判別が行われるようになっている。
特開平8−329031号公報 米国特許出願公開2002/102024号明細書 Henry Schneiderman. "A Statistical Approach to 3D Object Detection Applied to Faces and Cars" CMU-RI-TR-0066, May 10,2000、p.61
ところで、デジタルカメラ等において取得された全体画像内において判別対象を探索する際、所定の大きさからなるサブウィンドウ(枠)を走査させ、サブウィンドウ内の画像を切り出した画像に対し顔であるか否かの判別が行われる。上述した上流側の探索量を減らす方法として、上述した非特許文献3に示す他に、切り出す画像の数を減らすことが考えられる。たとえば、従来、サブウィンドウの走査は1画素ずつ行われているが、3画素ずつ行えば判別する画像の数を減らすことができる。
しかし、上述した判別器は、顔が画像の所定位置に存在する場合に顔であると判別するものであるため、複数画素間隔でサブウィンドウを走査させた場合、顔が所定位置からずれてしまうことがある。よって、画像に顔が存在していても判別器が顔であると判別できない場合が生じ顔の検出率が悪くなってしまうという問題がある。
そこで、本発明は、判別対象の検出率の低下を防止しながら検出の高速化を図ることができる判別器学習方法および対象判別装置ならびにプログラムを提供することを目的とするものである。
本発明の判別器の学習方法は、画像が判別対象であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う判別器の学習方法において、判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトされた位置に配置されたシフトサンプル画像とを用いて学習されることを特徴とするものである。
本発明の対象判別装置は、全体画像上に設定画素数の枠からなるサブウィンドウを複数画素間隔で走査させ部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された部分画像が判別対象であるか否かを判別し、判別対象の可能性のある部分画像を候補画像として検出する候補検出手段と、候補検出手段により検出された候補画像の周辺の領域にサブウィンドウを走査させ周辺画像を生成する周辺画像生成手段と、周辺画像生成手段により生成された周辺画像について判別対象であるか否かを判別する対象判別手段とを有し、候補検出手段が、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであり、候補判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトした位置に配置されたシフトサンプル画像とを用いて学習されたものであることを特徴とするものである。
本発明の対象判別プログラムは、コンピュータを、全体画像上に設定画素数の枠からなるサブウィンドウを複数画素間隔で走査させ部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された部分画像が判別対象であるか否かを判別し、判別対象の可能性のある部分画像を候補画像として検出する候補検出手段と、候補検出手段により検出された候補画像の周辺の領域にサブウィンドウを走査させ周辺画像を生成する周辺画像生成手段と、周辺画像生成手段により生成された周辺画像について判別対象であるか否かを判別する対象判別手段として機能させるための対象判別プログラムであって、候補検出手段が、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであり、候補判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトした位置に配置されたシフトサンプル画像とを用いて学習されたものであることを特徴とするものである。
ここで、シフトサンプル画像は、判別対象を設定位置からシフトさせたものであればシフト方向は問わず、サンプル画像内において上下左右いずれの方向にシフトさせたものであってもよい。また、シフト量は1画素であってもよいし数画素であってもよい。さらに、候補判別器の学習に用いるシフトサンプル画像は、シフトサンプル画像を用いて学習されたものであってもよいし、上下方向および左右方向にシフト量の異なる複数種類のシフトサンプル画像を用いて学習されたものであってもよい。
また、候補判別器は、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備えたものであれば判別手法は問わず、たとえば部分画像について各弱判別器による判別を行い、その複数の判別結果を用いて最終的な判別を行うようにしてもよいし、複数の弱判別器がカスケード構造を有し、上流側の弱判別器において判別対象であると判別された部分画像について下流側の弱判別器による判別を行うものであってもよい。
さらに、候補検出手段は、候補判別器により判別された多数の候補画像をより少ない数の候補画像に絞り込む候補絞込手段をさらに有するものであってもよい。この候補絞込手段は、候補判別器により判別された候補画像の周辺の領域にサブウィンドウを走査させて周辺候補画像を生成する周辺候補画像生成手段と、周辺候補画像生成手段により生成された周辺候補画像に対し判別対象であるか否かを判別し、判別対象である周辺候補画像を候補画像として出力する候補絞込判別器とを備えたものであってもよい。候補絞込判別器が、複数の弱判別器による複数の判別結果を用いて前記周辺候補画像が前記判別対象であるか否かを判別する、前記サンプル画像と、前記判別対象が前記設定位置からシフトした位置に配置された候補絞込用シフトサンプル画像とを用いて学習されたものであってもよい。
なお、候補検出手段は、1つの候補絞込手段を有するものであってもよいし、カスケード構造を有する複数の候補絞込手段を有するものであってもよい。複数の候補絞込手段がカスケード構造を有する場合、候補判別器が、異なるシフト量で判別対象がシフトした複数のシフトサンプル画像を用いて学習されたものであり、候補絞込用シフトサンプル画像が、複数のシフトサンプル画像のうち判別対象が設定位置から最も離れている最大シフト量よりも小さいシフト量で判別対象が設定位置からシフトされたものであり、複数の候補絞込判別器が、異なるシフト量で判別対象がシフトした複数の候補絞込用シフトサンプル画像を用いて学習されたものであって、下流側の候補絞込判別器が上流側の候補絞込判別器よりも最大シフト量の少ない候補絞込用シフトサンプル画像を用いて学習されているものであってもよい。
本発明の判別器学習方法によれば、判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトされた位置に配置されたシフトサンプル画像とを用いて学習されることにより、画像内において判別対象が設定位置からずれている場合であっても判別対象を判別することができるため、判別対象の検出率を向上させることができる。
本発明の対象判別装置ならびにプログラムによれば、全体画像上に設定画素数の枠からなるサブウィンドウを複数画素間隔で走査させ部分画像を生成する部分画像生成手段と、部分画像生成手段により生成された部分画像が判別対象であるか否かを判別し、判別対象の可能性のある部分画像を候補画像として検出する候補検出手段と、候補検出手段により検出された候補画像の周辺の領域にサブウィンドウを走査させ周辺画像を生成する周辺画像生成手段と、周辺画像生成手段により生成された周辺画像について判別対象であるか否かを判別する対象判別手段とを有し、候補検出手段が、複数の弱判別器による複数の判別結果を用いて部分画像が判別対象であるか否かを判別する候補判別器を備え、候補判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトした位置に配置されたシフトサンプル画像とを用いて学習されたものであることにより、サブウィンドウが複数画素間隔で走査されることにより、判別対象が設定位置からシフトした状態の部分画像が生成されても、候補判別器が当部分画像を判別対象であると確実に判別することができるため、サブウィンドウを1画素ずつ走査する場合に比べて判別すべき部分画像の数を減らすことができ判別作業の高速化を図ることができる。
なお、弱判別器がカスケード構造を有し、上流側の弱判別器が判別対象であると判別した部分画像について下流側の弱判別器が判別を行うものであれば、下流側の弱判別器が判別すべき部分画像の数を大幅に低減することができるため、判別作業の高速化をさらに促進することができる。
また、候補判別器が、判別対象の位置を設定位置を中心に上下方向および左右方向にシフトさせた複数のシフトサンプル画像を用いて学習されたものであるとき、判別対象が設定位置から上下左右方向のいずれの方向にシフトしていても候補判別器は当該部分画像を判別対象であると判別することができるため、候補判別器の対象検出率をさらに高めることができる。
さらに、候補検出手段が、候補判別器により判別された多数の候補画像をより少ない数の候補画像に絞り込む候補絞込手段をさらに有し、候補絞込手段が、候補判別器により判別された候補画像の周辺の領域にサブウィンドウを複数画素間隔で走査させ周辺候補画像を生成する周辺候補画像生成手段と、周辺候補画像生成手段により生成された周辺候補画像について判別対象であるか否かを判別し、判別対象であると判別した周辺候補画像を候補画像として対象検出手段に出力する候補絞込判別器とを備え、候補絞込判別器が、複数の弱判別器による複数の判別結果を用いて周辺候補画像が判別対象であるか否かを判別する、サンプル画像と判別対象が設定位置からシフトした位置に配置された候補絞込用シフトサンプル画像とを用いて学習されたものであるとき、候補判別器よりも誤検出率の低い候補絞込判別器により候補画像の数を絞り込むことにより、対象検出手段により判別すべき候補画像の数を大幅に減らすことができるため、判別作業のさらなる高速化を図ることができる。
さらに、候補検出手段が、カスケード構造を有する複数の候補絞込手段を有し、候補判別器が、異なるシフト量で判別対象がシフトした複数のシフトサンプル画像を用いて学習されたものであり、候補絞込用シフトサンプル画像が、複数のシフトサンプル画像のうち判別対象が設定位置から最も離れている最大シフト量よりも小さいシフト量で判別対象が設定位置からシフトされたものであり、複数の候補絞込判別器が、異なるシフト量で判別対象がシフトした複数の候補絞込用シフトサンプル画像を用いて学習されたものであって、下流側の候補絞込判別器が上流側の候補絞込判別器よりも最大シフト量の少ない候補絞込用シフトサンプル画像を用いて学習されていれば、下流側の候補絞込手段ほど誤検出率の低い候補絞込判別器を用いて候補画像の数の絞り込みが行うことにより、対象検出手段により判別すべき候補画像の数を大幅に減らすことができるため、判別作業のさらなる高速化を図ることができる。
以下、図面を参照して本発明の対象判別装置の実施の形態を詳細に説明する。図1は本発明の対象判別装置の好ましい実施の形態を示すブロック図である。なお、図1のような対象判別装置1の構成は、補助記憶装置に読み込まれたオブジェクト識別プログラムをコンピュータ(たとえばパーソナルコンピュータ等)上で実行することにより実現される。また、このオブジェクト識別プログラムは、CD−ROM等の情報記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされることになる。
図1の対象判別装置1は判別対象である顔の判別を行うものであって、全体画像Pの中から顔である可能性のある部分画像PPを検出し候補画像CPとして出力する候補検出手段10と、候補検出手段10により検出された候補画像CPが顔であるか否かをさらに判別する対象検出手段20とを有している。この候補検出手段10は、全体画像P上に設定画素数の枠からなるサブウィンドウWを複数画素間隔で走査させ部分画像PPを生成する部分画像生成手段11と、部分画像生成手段11により生成された部分画像が判別対象であるか否かを判別し、判別対象である可能性のある部分画像PPを候補画像CPとして判別する候補判別手段12とを有する。
ここで、部分画像生成手段11は、図2(A)に示すように、設定画素数(たとえば32画素×32画素)の枠からなるサブウィンドウWを全体画像P内において走査させ、サブウィンドウWにより囲まれた領域を切り出すことにより設定画素数からなる部分画像PPを生成するようになっている。特に、部分画像生成手段11は、上下方向および左右方向にそれぞれ複数画素間隔(たとえば3画素)でサブウィンドウWを走査させ部分画像PPを生成するようになっている。
さらに、部分画像生成手段11は、図2(B)〜(D)に示すように、1つの全体画像Pから複数の低解像度画像P2、P3、P4を生成する機能を有し、生成した低解像度画像上においてサブウィンドウWを走査させたときの部分画像PPをも生成するようになっている。これにより、全体画像PにおいてサブウィンドウW内に顔(判別対象)が収まらなかった場合であっても、低解像度画像上においてはサブウィンドウW内に収めることが可能となり、顔の検出を確実に行うことができる。
図1の候補判別手段12は、アダブースティングアルゴリズム(Adaboosting Algorithm)により学習された候補判別器であって、複数の弱判別器CF〜CF(M:弱判別器の個数)を有している。各弱判別器CF〜CFはそれぞれ部分画像PPから特徴量xを抽出し、この特徴量xを用いて部分画像PPが顔であるか否かの判別を行う機能を有する。そして、候補判別器12は弱判別器CF〜CFおける判別結果を用いて顔であるか否かの最終的な判別を行うようになっている。
具体的には、図3に示すように各弱判別器CF〜CFは部分画像PP内の設定された座標P1a、P1b、P1cにおける輝度値等を抽出する。さらに、部分画像PPの低解像度画像PP2内の設定された座標位置P2a、P2b、低解像度画像PP3内の設定された座標位置P3a、P3bにおける輝度値等をそれぞれ抽出する。その後、上述した7個の座標P1a〜P3bの2つをペアとして組み合わせ、この組み合わせた輝度の差分を特徴量xとする。各弱判別器CF〜CF毎にそれぞれ異なる特徴量が用いられるものであり、たとえば弱判別器CFでは座標P1a、P1cにおける輝度の差分を特徴量として用い、弱判別器CFでは座標P2a、P2bにおける輝度の差分を特徴量として用いるようになっている。
なお、各弱判別器CF〜CFがそれぞれ特徴量xを抽出する場合について例示しているが、複数の部分画像PPについて上述した特徴量xを予め抽出しておき、各弱判別器CF〜CFに入力するようにしてもよい。さらに、輝度値を用いた場合について例示しているが、コントラスト、エッジ等の情報を用いるようにしても良い。
各弱判別器CF〜CFは図4に示すようなヒストグラムを有しており、このヒストグラムに基づいて特徴量xの値に応じたスコアf(x)〜f(x)を出力するようになっている。さらに、各弱判別器CF〜CFは判別性能を示す信頼度β〜βを有している。そして、候補判別器12は、各弱判別器CF〜CFから出力されたスコアf(x)および信頼度β〜βとに基づいて最終的な判別結果を出力するようになっている。具体的には、以下の式(1)により表すことができる。
sign(Fm(x))=sign[Σm=1 Mβm・fm(x))] ・・・(1)
式(1)において、候補判別器12からの判別結果sign(F(x))は、各弱判別器CF〜CFからそれぞれ算出される判定スコアβ・f(x)(m=1、2、・・・、M)の総和により判別されるようになっている。
図1の対象検出手段20は、候補検出手段10により検出された候補画像CPの周辺の領域にサブウィンドウWを走査させ周辺画像APを生成する周辺画像生成手段21と、周辺画像生成手段21により生成された周辺画像APが判別対象であるか否かを判別する対象判別手段22とを有している。
周辺画像生成手段21は、図5(A)、(B)に示すように、候補画像CPを中心に上下左右に1画素ずつサブウィンドウWをずらして切り出した8つの周辺画像APを生成するようになっている。つまり、周辺画像生成手段21は、候補画像CPの中心PCを上下方向および左右方向に1画素ずつシフトした中心PC1〜PC8に基づいてサブウィンドウWを走査させるようになっている。図1の対象判別器22はアダブースティングアルゴリズムにより学習された各弱判別器NCF〜NCF(k:弱判別器の個数)を有し、上述した候補判別器12と同様の手法により周辺画像APが顔であるか否かを判別するようになっている。
ここで、図1から図5を参照して対象判別装置1の動作例について説明する。まず、部分画像生成手段11において、全体画像P上をサブウィンドウWが一定の走査間隔で走査することにより複数の部分画像PPが生成される。生成された部分画像PPは、候補判別器12において顔であるか否かが判別され、顔である可能性のある候補画像CPが検出される。次に、周辺画像生成手段21において、検出された候補画像CPの周辺の領域から複数の周辺画像APが生成される。生成された周辺画像APは対象判別器22において顔であるか否かが判別される。そして、顔であると判別された周辺画像APが顔画像として検出される。
ところで、上述した候補判別器12は、予め用意された複数の弱判別器CF〜CFに対し学習画像LPの重み付けを更新しながら繰り返し各弱判別器CF〜CFに入力していく(リサンプリング)というアダブースティング(AdaBoosting)アルゴリズムを用いて学習されている。図6は顔もしくは非顔を判別することができるように候補判別器12を学習させるための判別器学習装置50の一例を示すブロック図である。
判別器学習装置50は、学習画像LPを記憶したデータベースDBと、データベースDBに記憶された学習画像LPに対し重み付けwm−1(i)を加える重み付け手段51と、重み付け手段51により重み付けwm−1(i)がなされた学習画像LPが弱判別器CFに入力されたときに、各弱判別器CFにおける信頼度を算出する信頼度算出手段52とを備えている。
データベースDBに記憶された学習画像LPは、部分画像PP(サブウィンドウW)と同一の画素数からなる画像であって、図7に示すように、判別対象である顔が設定位置(たとえば中央)に配置されているサンプル画像SPと、顔が設定位置から上下方向および左右方向にシフトされた位置に配置されているシフトサンプル画像SSPとを有している。シフトサンプル画像SSPの顔は1画素に上下左右にシフトされている(シフト量=1画素)。さらに、学習画像LPは非顔である非対象サンプル画像NSPを有しており、サンプル画像SP、シフトサンプル画像SSPおよび非対象サンプル画像NSPを用いて弱判別器CF〜CFの学習が行われる。
また、各学習画像LP毎が顔であるのか否かを示す真偽パラメータyが付されている(i=1、2、・・・、N:Nは学習画像LPの数)。パラメータyは顔であれば「1」、非顔であれば「−1」を示し、サンプル画像SPおよびシフトサンプル画像SSPの真偽パラメータyは「1」、非対象サンプル画像NSPの真偽パラメータyは「−1」に設定されている。
重み付け手段51は、データベースDBに記憶された学習画像LPに重み付けwm−1(i)(i=1、2、・・・、N:N=学習画像LPの数)を付加するものである。重み付けwm−1(i)は学習画像LPの判別の困難性を示すパラメータであって、重み付けwm−1(i)が大きい学習画像LPは判別が難しいものであることを示し、小さい学習画像LPは判別が容易なものであることを示している。重み付け手段51は、各学習画像LPを弱判別器CFに入力されたときの判別結果に基づいて重み付けwm−1(i)を更新し、新たに重み付けw(i)がなされた複数の学習画像LPを用いて次の弱判別器CFm+1の学習を行うようになっている。なお、重み付け手段51は、最初の弱判別器CFの学習を行うときには、重み付けw(i)としてw(i)=1/Nを与えるようになっている。
信頼度算出手段52は、重み付けwm−1(i)がなされた複数の学習画像LPが各弱判別器CFに入力されたときに、各弱判別器CFにおける正答率を信頼度βとして算出するものである。ここで、信頼度算出手段52は重み付けwm−1(i)に応じた信頼度βを与えるようになっている。つまり、重み付けwm−1(i)が大きい学習画像LPを正しく判別できた弱判別器には大きい信頼度βを与え、重み付けwm−1(i)が小さい学習サンプルを正しく判別できた弱判別器には小さい信頼度βを与えるようになっている。
図8は本発明の判別器学習方法の好ましい実施の形態を示すフローチャートであり、図6から図8を参照して判別器学習方法について説明する。なお、各学習画像LPの重み付けは初期値w(i)=1/N(i=1、2、・・・、N)に設定されている。
まず、学習画像LPが弱判別器CFに入力されたとき(ステップSS11)、弱判別器CFの判別結果に基づいて信頼度βが信頼度算出手段52により算出される(ステップSS12)。
具体的には、まず弱判別器CFにおける誤り率errが式(2)により算出される。
err=Σi=1 Nwm-1(i)I(yi≠fm(xi)) ・・・(2)
式(2)において、学習画像LPの特徴量xiを弱判別器CFに入力したときに、その判別が学習画像LPに付された真偽パラメータyiと異なった場合(yi≠f(xi))、誤って判別された学習画像LPの重み付けwm−1(i)に比例して誤り率errが大きくなることを意味している。
次に、算出した誤り率errに基づいて弱判別器CFの信頼度βが式(3)により算出される。
βm=log((1-err)/err) ・・・(3)
この信頼度βが弱判別器CFの判別性能を示すパラメータとして学習されたことになる。
一方、重み付け手段51において弱判別器CFの判別結果に基づいて学習画像LPの重み付けw(i)が式(4)のように更新される(ステップSS13)。
wm(i)=wm-1(i)・exp[βm・I(yi≠fm(xi))] ・・・(4)
式(4)において、弱判別器CFが正しく判別した学習画像LPの重み付けが大きく更新され、誤った判別がなされた学習画像LPの重み付けが小さくなるように更新される。なお、各学習画像LPの重み付けは最終的にΣi=1 N(i)=1となるように正規化される。
重み付けw(i)の更新が行われた学習画像LPを用いて次の弱判別器CFm+1の学習が行われ(ステップSS11〜ステップSS14)、この学習の繰り返しがM回繰り返される。すると、以下の式(5)に示す候補判別器12が完成し、学習が終了する(ステップSS16)。
sign(Fm(x))=sign[βm・fm(x)] ・・・(5)
なお、図6から図8において、候補判別器12の学習について説明してきたが、対象判別手段22についても同様の学習方法により学習される。但し、対象判別器22の学習においてはサンプル画像SPおよび非対象サンプル画像NSPが用いられシフトサンプル画像SSPは用いられない。
ところで、上述のように候補判別器12はサンプル画像SPの他にシフトサンプル画像SSPについても顔であると判定させるように学習されたものである。このため、サンプル画像SPのように設定位置に顔が配置された部分画像PPのみならず、顔が設定位置からずれている部分画像PPについても候補画像CPとして検出する。よって、サブウィンドウWの左右方向の走査および上下方向の走査を3画素間隔で(2画素飛ばし)走査させたとしても、顔である部分画像PPを確実に判別することができ、サブウィンドウWの走査により生成される部分画像PPの数を大幅に減らすことができる。
一方、サンプル画像SPのみならずシフトサンプル画像SSPを用いて学習を行った候補判別器12は、非顔である部分画像PPについても顔であると判断する場合が増大し、結果として候補判別器12自体の誤検出率が上がってしまう。ここで、対象判別器22は、サンプル画像SPおよび非サンプル画像NSPのみを用いて学習されたものであるため誤検出率が低い。つまり、対象判別器22において部分画像PPの周辺領域について精密な顔検出が行われるため、候補判別器12における誤検出率が上がったとしても、対象判別装置1全体としての誤検出率は低く保つことができる。つまり、一見、候補判別器12の誤検出率が上がり対象判別装置1全体の誤検出率が上がってしまうように思えるが、対象判別器22により対象判別装置1全体の誤検出率を低く保ちながら、候補判別器12において判別処理される部分画像PPの数を減少させ判別作業の高速化を図ることができる。
図9は本発明の別の実施の形態を示すブロック図であり、図9を参照して対象判別装置について説明する。なお図9において図1に示す対象判別装置1と同一の構成を有する部位には同一の符号を付してその説明を省略する。
図9の対象判別装置100が図1の対象判別装置1と異なる点は、候補検出手段110が候補判別器12により判別された候補画像CPの数をより少ない数に絞り込む候補絞込手段120、130をさらに有する点である。
各候補絞込手段120、130は、候補判別器12により判別された候補画像CPの周辺の領域にサブウィンドウWを複数画素間隔で走査させ周辺候補画像ACPを生成する周辺候補画像生成手段111と、周辺候補画像生成手段111により生成された周辺候補画像ACPに対し判別対象であるか否かを判別し、判別対象であると判別した周辺候補画像ACPを候補画像CPとして対象判別器22に出力する候補絞込判別器121、131とを備えている。なお、候補絞込手段120、130には共通の周辺候補画像生成手段111が用いられている。
さらに候補絞込手段120、130はカスケード構造を有しており、上流側の候補絞込手段120において絞り込まれた候補画像CPについてさらに下流側の候補絞込手段130において候補の絞込を行うようになっている。
ここで、周辺候補画像生成手段111は、上記周辺画像生成手段21とほぼ同一の機能を有し(図6参照)、候補判別器12において顔であると判別された候補画像CPの周辺の領域から第1周辺候補画像を生成するようになっている。なお、周辺画像生成手段21が1画素ずつサブウィンドウWを走査させるのに対し、周辺候補画像生成手段111は、複数画素間隔でサブウィンドウWを走査させるようになっている。そして、候補絞込判別器121は、周辺候補画像生成手段111により生成された第1周辺候補画像について顔であるか否かの判別を行い、顔であると判別した第1周辺候補画像を候補画像CP1として出力するようになっている。
さらに、周辺候補画像生成手段111は、候補絞込判別器121において顔であると判別された候補画像CP1の周辺の領域から第2周辺候補画像ACP2を生成するようになっている。そして、候補絞込判別器131は、周辺候補画像生成手段111により生成された第2周辺候補画像について顔であるか否かの判別を行い、顔であると判別した第2周辺候補画像を候補画像CP2として出力するようになっている。
候補絞込判別器121、131は、上述した候補判別器12および対象判別器22と同様、アダブースティングアルゴリズムにより学習されたものであって、複数の弱判別器を有している。この候補絞込判別器121、131は、サンプル画像SPと候補絞込用シフトサンプル画像LSPとを用いて学習されたものである。
ここで、候補絞込判別器121は、サンプル画像SPの他に、判別対象を設定位置から上下方向および左右方向に1画素シフトさせた候補絞込用シフトサンプル画像と、2画素シフトさせた候補絞込用シフトサンプル画像とを用いて学習されている。また、候補絞込判別器131は、サンプル画像SPの他に判別対象を設定位置から上下方向および左右方向に1画素シフトさせた候補絞込用シフトサンプル画像を用いて学習されている。
さらに、候補判別器12は、サンプル画像SPの他に、判別対象を設定位置から上下方向および左右方向へのシフト量が1画素である第1シフトサンプル画像SSP1、シフト量が2画素である第2シフトサンプル画像SSP2、シフト量が3画素である第3シフトサンプル画像SSP3を用いて学習されている。なお、対象判別器22は、シフトサンプル画像SSPは用いずサンプル画像SPのみによって学習されている。
つまり、候補絞込用シフトサンプル画像LSPは、複数のシフトサンプル画像SSPのうち顔が設定位置から最も離れている最大シフト量(=たとえば3画素)よりも小さいシフト量で顔が設定位置からシフトされたものであり、下流側の候補絞込判別器131が上流側の候補絞込判別器121よりも最大シフト量の少ない候補絞込用シフトサンプル画像LSPを用いて学習されている。
具体的には、シフトサンプル画像SSPにおいて、最大シフト量は第3シフトサンプル画像SSP3の3画素である。一方、候補絞込判別器121の学習に用いられる候補絞込用シフトサンプル画像の最大シフト量は2画素であり、候補絞込判別器131の学習に用いられる候補絞込用シフトサンプル画像の最大シフト量は1画素である。つまり、上流側の候補判別器12から候補絞込判別器121、131の順に最大シフト量が3画素、2画素、1画素というように小さくなるようなシフトサンプル画像SSPを用いて学習が行われている。
これに対応して、部分画像生成手段11は、部分画像PPを生成する際に7画素間隔(6画素飛ばし)でサブウィンドウWを走査させる。また、周辺候補画像生成手段111は、第1周辺候補画像ACP1を生成する際には5画素間隔(4画素飛ばし)、第2周辺候補画像ACP2を生成する際には3画素間隔(2画素飛ばし)でサブウィンドウWを走査させるようになっている。この場合であっても、判別すべき部分画像PPおよび各周辺候補画像の数を大幅に減らし高速な判別ができるとともに、判別精度を高く保つことができる。すなわち、上流側の候補検出手段10においては、誤検出率が高くなってしまっても検出速度を上げる構成にし、下流側の候補絞込手段120、130になるにつれて検出速度を下げ誤検出率を低くなる構成にし、対象検出手段20において検出速度および誤検出率が最も低くなる構成にしている。このように、上流側において判別すべき画像の数を減らすことにより、判別の高速化を図ることともに、下流側の誤検出率を低く設定することにより、対象判別装置1全体の誤検出率を低くすることを実現している。
図10は本発明の第3の実施の形態を示すブロック図であり、図10を参照して対象判別装置について説明する。なお、図10の対象判別装置において図1の対象判別装置と同一の構成を有する部位には同一の符号を付してその説明を省略する。
図10の対象判別装置200が図1の判別対象装置1と異なる点は、候補判別器12の構成である。なお、図10において候補判別器12について例示しているが、対象判別器22、候補絞込判別器121、131についても適用することができる。
候補判別器212において各弱判別器CF〜CFはカスケード構造を有している。つまり、式(1)では各弱判別器CF〜CFから出力される判定スコアβ・f(x)の総和として出力されるようになっているが、図12においては各弱判別器CF〜CFのすべてが顔であると判別した部分画像PPのみを候補画像CPとして出力するようになっている。
具体的には、各弱判別器CFの判定スコアβ・f(x)自体が設定しきい値Sref以上であるか否かを判断し、設定しきい値以上であるときに顔であると判別する(β・f(x)≧Sref)。そして、弱判別器CFにおいて顔であると判別した部分画像PPのみ下流側の弱判別器CFm+1による判別を行い、弱判別器CFで非顔であると判別された部分画像PPは下流側の弱判別器CFm+1による判別は行わない。
これにより、下流側の弱判別器により判別すべき部分画像PPの量を減らすことができるため、判別作業の高速化を図ることができる。さらにカスケード構造の弱判別器CF〜CFを有する候補判別器212の学習にサンプル画像SPのみならずシフトサンプル画像SSPを用いることにより、候補判別器212において判別すべき部分画像PPの数を減らし判別作業の高速化を図ることができるとともに、対象判別器22において高い判別精度を維持することができる。
上述した候補判別器212の学習の詳細は特許文献2に開示されている。具体的には、各弱判別器CF〜CFに対し学習画像が入力され、各弱判別器CF〜CF毎に信頼度β〜βが算出される。そして、最も低いβminである弱判別器CFminが選択され、この弱判別器CFminが正解した学習画像LPの重み付けを低くなるように更新し、誤った学習画像LPの重み付けを大きくなるように更新する。この作業を設定回数だけ繰り返すことにより候補判別器212の学習が行われるようになっている。
なお、図11のように、各弱判別器CF〜CFから出力された判定スコアS〜Sをそれぞれ個別に設定しきい値Sref以上であるか否かを判断するのではなく、弱判別器CFにおいて判別を行う際、弱判別器CFの上流側の弱判別器CF〜CFm−1での判定スコアの和Σr=1 β・fが設定しきい値S1ref以上であるか否かにより判別を行うようにしても良い。
Σr=1 mβr・fr(x)≧S1ref ・・・(6)
これにより、上流側の弱判別器による判定スコアを考慮した判定を行うことができるため、判定精度の向上を図ることができる。この場合であっても、対象判別器22に対しサンプル画像とともにシフトサンプル画像SSPを用いて学習を行うことにより、検出精度を維持しながら判別の高速化を図ることができる。なお、式(6)に示すような判別を行う候補判別器12(対象判別器22)を学習する際、ある弱判別器CFの学習が終わった後、その出力を次の弱判別器CFm+1に対する最初の弱判別器とし、弱判別器CFm+1の学習を開始するようになっている(詳細は、Shihong LAO等、「高速全方向顔検出」、画像の認識・理解シンポジウム(MIRU2004)、2004年7月参照)。この弱判別器の学習においても、サンプル画像SPとともにシフトサンプル画像SSPが用いられる。
上記実施の形態によれば、候補判別器12が、サンプル画像SPとシフトサンプル画像SSPとを用いて学習されたことにより、部分画像生成手段11においてサブウィンドウWを画素をとばしながら走査しても判別対象を検出することができるため、候補判別器12が判別すべき部分画像PPの数を減らして判別の高速化を図ることができるとともに、候補判別手段が誤って判別してしまった候補画像については対象判別器により正確な判別を行うため、判別精度の劣化を防止することができる。
本発明の実施の形態は、上記実施の形態に限定されない。上記実施の形態において判別対象が顔の場合について例示しているが、目、洋服や、自動車、等の全体画像に含まれる可能性のあるオブジェクトであれば何でもよい。
さらに、たとえば図7において、1つの顔サンプル画像から上下左右に所定量だけ顔を移動させたシフトサンプル画像を作成するようにしているが、さらに、各顔サンプル画像およびシフトサンプル画像につき、縦および/または横を0.7倍から1.2倍の範囲にて0.1倍単位で段階的に拡縮して得られる各サンプル画像を生成し学習に用いるようにしても良い。
なお、上記の学習手法を採用する場合において、弱判別器は、特定のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せを用いて顔の画像と顔でない画像とを判別する基準を提供するものであれば、上記のヒストグラムの形式のものに限られずいかなるものであってもよく、例えば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図11の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
本発明の対象判別装置の好ましい実施の形態を示すブロック図 図1の部分画像生成手段においてサブウィンドウが走査される様子を示す模式図 図1の候補判別器により部分画像から特徴量が抽出される様子を示す模式図 図1の弱判別器が有するヒストグラムの一例を示すグラフ図 図1の周辺画像生成手段により周辺画像が生成される様子を示す模式図 図1の候補判別器を学習させるための判別器学習装置の一例を示すブロック図 図6の判別器学習装置におけるデータベースに記憶された学習画像の一例を示す模式図 図6の判別器学習装置の動作例を示すフローチャート 本発明の対象判別装置の別の実施の形態を示すブロック図 本発明の対象判別装置の別の実施の形態を示すブロック図 本発明の対象判別装置の候補判別器の別の実施の形態を示すフローチャート
符号の説明
1、100、200 対象判別装置
11 部分画像生成手段
12 候補検出手段(候補判別器)
20 対象検出手段
21 周辺画像生成手段
22 対象判別器
50 判別器学習装置
110 候補検出手段
111 周辺候補画像生成手段
120、130 候補絞込手段
121、131 候補絞込判別器
212 候補判別器
AP 周辺画像
CF 弱判別器
CP 候補画像
LP 学習画像
LSP 候補絞込用シフトサンプル画像
NSP 非対象サンプル画像
P 全体画像
PP 部分画像
SP サンプル画像
SSP シフトサンプル画像
W サブウィンドウ
i 特徴量
β 信頼度

Claims (7)

  1. 画像が判別対象であるか否かの判別を複数の弱判別器による複数の判別結果を用いて最終的な判別を行う判別器の学習方法において、
    前記判別器が、判別対象が設定位置に配置されたサンプル画像と、判別対象が設定位置からシフトされた位置に配置されたシフトサンプル画像とを用いて学習されることを特徴とする判別器の学習方法。
  2. 全体画像上に設定画素数の枠からなるサブウィンドウを複数画素間隔で走査させ部分画像を生成する部分画像生成手段と、
    該部分画像生成手段により生成された前記部分画像が判別対象であるか否かを判別し、該判別対象の可能性のある前記部分画像を候補画像として検出する候補検出手段と、
    前記候補検出手段により検出された前記候補画像の周辺の領域に前記サブウィンドウを走査させ周辺画像を生成する周辺画像生成手段と、
    該周辺画像生成手段により生成された前記周辺画像について前記判別対象であるか否かを判別する対象判別手段と
    を有し、
    前記候補検出手段が、複数の弱判別器による複数の判別結果を用いて前記部分画像が前記判別対象であるか否かを判別する候補判別器を備えたものであり、
    該候補判別器が、前記判別対象が設定位置に配置されたサンプル画像と、前記判別対象が前記設定位置からシフトした位置に配置されたシフトサンプル画像とを用いて学習されたものであることを特徴とする対象判別装置。
  3. 前記複数の弱判別器がカスケード構造を有し、上流側の前記弱判別器が前記判別対象であると判別した前記部分画像について下流側の前記弱判別器が判別を行うものであることを特徴とする請求項2記載の対象判別装置。
  4. 前記候補判別器が、前記判別対象の位置を前記設定位置を中心に上下方向および左右方向にシフトさせた複数の前記シフトサンプル画像を用いて学習されたものであることを特徴とする請求項2または3記載の対象判別装置。
  5. 前記候補検出手段が、前記候補判別器により判別された多数の前記候補画像をより少ない数の該候補画像に絞り込む候補絞込手段をさらに有し、
    該候補絞込手段が、
    前記候補判別器により判別された前記候補画像の周辺の領域に前記サブウィンドウを複数画素間隔で走査させ周辺候補画像を生成する周辺候補画像生成手段と、
    前記周辺候補画像生成手段により生成された前記周辺候補画像について前記判別対象であるか否かを判別し、前記判別対象であると判別した前記周辺候補画像を前記候補画像として前記対象検出手段に出力する候補絞込判別器と
    を備え、
    該候補絞込判別器が、複数の弱判別器による複数の判別結果を用いて前記周辺候補画像が前記判別対象であるか否かを判別する、前記サンプル画像と前記判別対象が前記設定位置からシフトした位置に配置された候補絞込用シフトサンプル画像とを用いて学習されたものであることを特徴とする請求項2から4のいずれか1項記載の対象判別装置。
  6. 前記候補検出手段が、カスケード構造を有する複数の前記候補絞込手段を有し、
    前記候補判別器が、異なるシフト量で前記判別対象がシフトした複数の前記シフトサンプル画像を用いて学習されたものであり、
    前記候補絞込用シフトサンプル画像が、前記複数のシフトサンプル画像のうち前記判別対象が前記設定位置から最も離れている最大シフト量よりも小さいシフト量で前記判別対象が設定位置からシフトされたものであり、
    前記複数の候補絞込判別器が、異なるシフト量で前記判別対象がシフトした複数の前記候補絞込用シフトサンプル画像を用いて学習されたものであって、下流側の前記候補絞込判別器が上流側の前記候補絞込判別器よりも最大シフト量の少ない前記候補絞込用シフトサンプル画像を用いて学習されていることを特徴とする請求項5に記載の対象判別装置。
  7. コンピュータを、
    全体画像上に設定画素数の枠からなるサブウィンドウを複数画素間隔で走査させ部分画像を生成する部分画像生成手段と、
    該部分画像生成手段により生成された前記部分画像が判別対象であるか否かを判別し、該判別対象の可能性のある前記部分画像を候補画像として検出する候補検出手段と、
    前記候補検出手段により検出された前記候補画像の周辺の領域に前記サブウィンドウを走査させ周辺画像を生成する周辺画像生成手段と、
    該周辺画像生成手段により生成された前記周辺画像について前記判別対象であるか否かを判別する対象判別手段として機能させるための対象判別プログラムであって、
    前記候補検出手段が、複数の弱判別器による複数の判別結果を用いて前記部分画像が前記判別対象であるか否かを判別する候補判別器を備えたものであり、
    該候補判別器が、前記判別対象が設定位置に配置されたサンプル画像と、前記判別対象が前記設定位置からシフトした位置に配置されたシフトサンプル画像とを用いて学習されたものであることを特徴とする対象判別プログラム。
JP2005245493A 2005-08-26 2005-08-26 判別器の学習方法および対象判別装置ならびにプログラム Pending JP2007058722A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005245493A JP2007058722A (ja) 2005-08-26 2005-08-26 判別器の学習方法および対象判別装置ならびにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005245493A JP2007058722A (ja) 2005-08-26 2005-08-26 判別器の学習方法および対象判別装置ならびにプログラム

Publications (1)

Publication Number Publication Date
JP2007058722A true JP2007058722A (ja) 2007-03-08

Family

ID=37922140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005245493A Pending JP2007058722A (ja) 2005-08-26 2005-08-26 判別器の学習方法および対象判別装置ならびにプログラム

Country Status (1)

Country Link
JP (1) JP2007058722A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250444A (ja) * 2007-03-29 2008-10-16 Omron Corp 顔検出装置、顔検出方法及び顔検出プログラム
JP2008259190A (ja) * 2007-03-22 2008-10-23 Artnix Inc 顔領域検出装置及び検出方法
JP2010009517A (ja) * 2008-06-30 2010-01-14 Canon Inc パターン検出器の学習装置、学習方法及びプログラム
JP2011508325A (ja) * 2007-12-28 2011-03-10 ツィンファ ユニバーシティ 物体検出装置、方法
CN111666957A (zh) * 2020-07-17 2020-09-15 湖南华威金安企业管理有限公司 图像真实性的识别方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005215899A (ja) * 2004-01-28 2005-08-11 Yamaha Motor Co Ltd 対象物検出装置及びその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005215899A (ja) * 2004-01-28 2005-08-11 Yamaha Motor Co Ltd 対象物検出装置及びその方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008259190A (ja) * 2007-03-22 2008-10-23 Artnix Inc 顔領域検出装置及び検出方法
JP2008250444A (ja) * 2007-03-29 2008-10-16 Omron Corp 顔検出装置、顔検出方法及び顔検出プログラム
JP2011508325A (ja) * 2007-12-28 2011-03-10 ツィンファ ユニバーシティ 物体検出装置、方法
US8520955B2 (en) 2007-12-28 2013-08-27 Tsinghua University Object detection apparatus and method
JP2010009517A (ja) * 2008-06-30 2010-01-14 Canon Inc パターン検出器の学習装置、学習方法及びプログラム
CN111666957A (zh) * 2020-07-17 2020-09-15 湖南华威金安企业管理有限公司 图像真实性的识别方法及装置
CN111666957B (zh) * 2020-07-17 2023-04-25 湖南华威金安企业管理有限公司 图像真实性的识别方法及装置

Similar Documents

Publication Publication Date Title
JP2007066010A (ja) 判別器学習方法および対象判別装置ならびにプログラム
JP7208480B2 (ja) 学習プログラム、検出プログラム、学習装置、検出装置、学習方法および検出方法
KR101507662B1 (ko) 비디오 내 객체들의 시맨틱 파싱
JP4767595B2 (ja) 対象物検出装置及びその学習装置
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
US20160125275A1 (en) Character recognition device, image display device, image retrieval device, character recognition method, and computer program product
JP2006301847A (ja) 顔検出方法および装置並びにプログラム
JP2006350704A (ja) 判別器の学習方法、顔判別方法および装置並びにプログラム
JP2007094633A (ja) 顔検出装置ならびにプログラム
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
JP2000137792A (ja) 眼部検出装置
JP4757598B2 (ja) 顔検出方法および装置並びにプログラム
CN112651364B (zh) 图像处理方法、装置、电子设备及存储介质
JP2007058722A (ja) 判別器の学習方法および対象判別装置ならびにプログラム
KR101991307B1 (ko) 다중 객체 추적을 위한 트랙렛의 특징 벡터 할당이 가능한 전자 장치 및 그 동작 방법
JP5777390B2 (ja) 情報処理方法及び装置、パターン識別方法及び装置
JP2007025902A (ja) 画像処理装置、画像処理方法
JP3906197B2 (ja) パターン識別方法及びパターン識別装置及びプログラム
JP2015194927A (ja) 対象識別装置
US11647152B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2021111228A (ja) 学習装置、学習方法、及びプログラム
EP3291179A1 (en) Image processing device, image processing method, and image processing program
JP5241687B2 (ja) 物体検出装置及び物体検出プログラム
JP2008027058A (ja) 画像検出装置及び画像検出方法
US20220254153A1 (en) Determination device, determination method, and recording medium

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Effective date: 20061211

Free format text: JAPANESE INTERMEDIATE CODE: A712

A621 Written request for application examination

Effective date: 20080214

Free format text: JAPANESE INTERMEDIATE CODE: A621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A02 Decision of refusal

Effective date: 20101116

Free format text: JAPANESE INTERMEDIATE CODE: A02