JP4795864B2 - 特徴点検出装置および方法並びにプログラム - Google Patents

特徴点検出装置および方法並びにプログラム Download PDF

Info

Publication number
JP4795864B2
JP4795864B2 JP2006170983A JP2006170983A JP4795864B2 JP 4795864 B2 JP4795864 B2 JP 4795864B2 JP 2006170983 A JP2006170983 A JP 2006170983A JP 2006170983 A JP2006170983 A JP 2006170983A JP 4795864 B2 JP4795864 B2 JP 4795864B2
Authority
JP
Japan
Prior art keywords
feature point
feature
candidate
detection
positional relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006170983A
Other languages
English (en)
Other versions
JP2008003749A (ja
Inventor
義隆 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2006170983A priority Critical patent/JP4795864B2/ja
Publication of JP2008003749A publication Critical patent/JP2008003749A/ja
Application granted granted Critical
Publication of JP4795864B2 publication Critical patent/JP4795864B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像に含まれる所定対象物の特徴点を検出する特徴点検出装置および方法並びにそのためのプログラムに関するものである。
画像に含まれる所定対象物(オブジェクト)の位置、姿勢、形態等を検出する方法が種々の分野において研究されているが、その1つの方法として、所定対象物の特徴的な部位を表す複数の特徴点を定義しておき、検出対象画像からこれら複数の特徴点を検出し、検出された特徴点の位置関係に基づいて所定対象物の位置、姿勢、形態等を検出する方法が種々提案されている。
例えば、特許文献1では、対象物を構成する基準特徴点(例えば、対象物が人物の顔である場合には、目、鼻、顔輪郭など)を複数定義し、それらの特徴点に特定のフィルタを適用したときのレスポンスを学習するとともに、特徴点同士の間の標準的な位置関係、すなわち特徴点毎の当該特徴点に対する対象物の中心点の画像上の存在確率分布を学習してこれらを記憶し、入力画像に対して学習時に用いたものと同じフィルタを適用してそのレスポンスから特徴点の候補を複数検出し、検出された候補と上記学習した特徴点同士の間の標準的な位置関係とを比較して、顔の中心点の画像上の存在確率分布を足し合わせ、その結果、最も存在確率が高い位置の点を目的の対象物の中心点とする対象物位置検出方法が提案されている。なお、ここでの確率分布はガウス関数で近似している。
また、非特許文献1では、特許文献1の方法に類似する物体位置検出方法が提案されている。この方法は、物体の中心点等、ある1点だけを検出するのではなく、複数の特徴点をセットで検出するものであり、また、「特徴点同士の間の標準的な位置関係」をより実際のデータに則して決定するため、存在確率分布を多数の学習サンプルから統計的に生成するようにしている。以下、この方法をより具体的に説明する。
(学習ステップ)
この方法では、ある特徴点検出器(AdaBoost学習アルゴリズムによって生成された識別器等を備えるもの)によって検出された特徴点の位置に対する他の特徴点の正解となる点の存在確率分布を、1つの特徴点と1つのその他の特徴点とからなる2つ1組の単位で各組毎に用意し、特徴点同士の間の位置関係をこれら複数組の存在確率分布を用いて表現する。ここで、特徴点Xの検出器の出力座標xに対する特徴点X(座標x)の正解となる点の存在確率分布をPij(x|x)と定義する。なお、Pijは、実装上、2次元のヒストグラムで表す。
この存在確率分布Pijを求めるには、まずトレーニング画像セット(対象物の特徴点の正解座標が入力された数千枚の画像)に対して対象物の検出を行い、対象物が基準位置に位置するように画像を規格化する。図7は、対象物が人物の顔であるときに、画像から顔を検出し、その顔が画像の中心に所定の大きさで位置するように画像を規格化した場合の例を示すものである。
次に、規格化された画像から特徴点検出器Dにより特徴点Xを検出し、その特徴点の座標xとその他の特徴点Xの正解座標xとのずれを、1つの特徴点Xと1つのその他の特徴点Xとからなる2つ1組の単位で比較、集計する。このような学習によって得られた存在確率分布Pijの例を図8に示す。図8は、対象物が人物の顔である場合の例であり、特徴点検出器によって検出された特徴点の位置を×で表し、対象の特徴点の存在確率分布を画像上の濃淡で表している。なお、ここでは、対象の特徴点の存在確率が高いほどその位置での濃度が濃くなるように表現してある。図8(a)は、左目頭検出器により検出された左目頭の点の位置に対する左目尻の点の存在確率分布を表す図であり、図8(b)は、当該左目頭の点の位置に対する左小鼻の点の存在確率分布を表す図であり、図8(c)は、当該左目頭の点の位置に対する右口角の点の存在確率分布を表す図である。
(検出ステップ)
検出対象画像から対象物を検出し、その対象物を含む規格化された画像を取得し、その規格化された画像に対して特徴点の候補を検出する処理を行い、各特徴点について他の特徴点の候補から推測される当該特徴点の画像上の存在確率分布の和を計算し、最も存在確率が高い位置の点をその特徴点の真の点と推定して選択する。特徴点の真の点として推定される点は、次式(1)で表される。
ここで、x^(左辺)は、特徴点の真の点として推定される点の位置座標、Pij(x|qjt)は特徴点Xのt番目の候補の位置座標qjtを基準としたときの特徴点X(位置座標x)の存在確率分布、kは特徴点Xの候補の数、nは定義した特徴点の数である。
この方法では、ある特徴点の位置を検出する際に、その特徴点を検出する単独の特徴点検出器の出力に頼るのではなく、複数の特徴点検出器が互いに他の特徴点の位置を推測し合うことにより、検出器単体の性能を上回る、より優れた検出能が得られるという利点がある。
一方、特許文献2では、顔を構成する目の位置を検出する方法であって、比較的検出精度が低くロバスト性が高い、いわゆる粗い検出器を用いて目の概略位置を検出した後に、その概略位置近傍において、比較的検出精度が高くロバスト性が低い、いわゆる細かい検出器を用いて目の正確な位置を検出するという、2段階構成の目の検出方法が提案されている。
特開平6−348851号公報 特開2005−108197号公報 David Cristinacce "A Multi-Stage Approach to Facial Feature Detection", In Proc. of BMVC, Pages 231-240, 2004
ところで、非特許文献1の物体位置検出方法では、通常、対象物の所定の特徴的な複数の点の位置で検出対象画像を幾何学的に正規化し、その正規化された画像に対して対象物の複数種類の特徴点を検出する。例えば、対象物が人物の顔である場合には、顔の両目の位置で検出対象画像を幾何学的に正規化し、顔の目頭、目尻、小鼻、口角等の特徴点を検出する。
しかしながら、この方法では、幾何学的な正規化を行う際に基準とした特徴的な位置、上記の顔を例にとれば、顔の両目の位置から離れた場所にある特徴点ほどその位置のばらつきが広範囲に及び、その特徴点の検索範囲も広くなる。ここで、検索処理の高速化を重視しつつ、この広い検索範囲をカバーするためには、比較的ロバスト性が高い特徴点検出器を用いる必要が有り、このような特徴点検出器を用いると一般的に、検出された特徴点の位置精度が悪くなる。
また、特許文献2の目の検出方法は、2段階構成を採っているため検出精度のよい方法ではあるが、この方法をそのまま複数種類の特徴点検出に適用すると、各特徴点同士の位置関係は考慮していないため、正解である特徴点の位置からずれた場所に、偶然、特徴点を表す画像に類似した特徴を有する画像が存在する場合には、不正解の特徴点候補が検出されることとなり、安定した特徴点検出が望めない。
本発明は、上記事情に鑑みなされたものであり、画像に含まれる所定対象物の複数種類の特徴点を、高速に精度よくかつ安定して検出することができる特徴点検出装置および方法並びにそのためのプログラムを提供することを目的とするものである。
本発明の特徴点検出装置は、検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出手段と、該第1の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、該第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定手段と、該第1の特徴点決定手段により決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出手段と、該第2の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定手段とを備えたことを特徴とするものである。
本発明の特徴点検出装置において、前記検出対象画像に対して、前記第1の特徴点決定手段により決定された前記複数種類の暫定特徴点をそれぞれ所定の基準位置に近づける、アスペクト比を維持した幾何学的正規化処理を施す正規化手段をさらに備え、前記第2の特徴点候補検出手段を、前記正規化手段により正規化された検出対象画像上で前記候補を検出するものとしてもよい
また、本発明の特徴点検出装置において、前記第1の特徴点決定手段は、前記複数種類の特徴点の中の2つの異なる特徴点からなる組合せ毎に統計的に求められた、一方の特徴点の位置を基準としたときの他方の特徴点の画像上の存在確率分布を用いて、1つの種類の特徴点について、他の種類の特徴点の前記検出された候補の位置を基準としたときの該1つの種類の特徴点の存在確率分布を、該他の特徴点の候補毎にそれぞれ求め、該求められた存在確率分布を合成する処理を、特徴点の前記種類毎に行う第1の存在確率分布合成手段と、1つの種類の特徴点について、該1つの種類の特徴点の前記検出された候補の位置と、該1つの種類の特徴点の前記合成された存在確率分布における存在確率の大小とに基づいて、該1つの種類の特徴点の候補を前記検出された候補の中から選択して絞り込む処理を、特徴点の前記種類毎に行う第1の特徴点候補選択手段と、特徴点の前記種類毎に、該種類の特徴点の前記選択された候補の位置に基づいて、該種類の暫定特徴点の位置を決定する第1の特徴点位置決定手段とを備えたものであってもよい。
また、本発明の特徴点検出装置において、前記第1の特徴点候補選択手段は、特徴点の前記種類毎に、前記検出された候補のうち、該種類の特徴点の前記合成された存在確率分布における存在確率が最も高い位置の点を代表とする所定領域内に存する候補を選択するものであってもよい。
また、本発明の特徴点検出装置において、前記第1の特徴点候補選択手段は、特徴点の前記種類毎に、前記検出された候補のうち、該候補の位置に対応した、前記種類の特徴点の前記合成された存在確率分布における存在確率が所定の閾値以上である候補を選択するものであってもよい。
また、本発明の特徴点検出装置において、前記第1の特徴点候補検出手段は、前記検出対象画像上の識別対象画像が特徴点を含む画像である蓋然性を示す確信度の閾値判定に基づいて、該識別対象画像における対象を該特徴点の候補として検出するものであり、前記第1の特徴点位置決定手段は、特徴点の前記種類毎に、該種類の特徴点について選択されたすべての候補の位置座標を、該候補に対して算出された前記確信度で重み付けしたときの、前記位置座標の重み付き平均を該種類の暫定特徴点の位置座標として決定するものであってもよい。
また、本発明の特徴点検出装置において、前記第1の特徴点位置決定手段は、特徴点の前記種類毎に、該種類の特徴点について選択されたすべての候補の位置座標を、該候補の位置に対応した、該種類の特徴点の前記合成された存在確率分布における存在確率で重み付けしたときの、前記位置座標の重み付き平均を該種類の暫定特徴点の位置座標として決定するものであってもよい。
本発明の特徴点検出方法は、検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出ステップと、該第1の特徴点候補検出ステップにより検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、前記第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定ステップと、該第1の特徴点決定ステップにより決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出ステップと、該第2の特徴点候補検出ステップにより検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定ステップとを有することを特徴とするものである。
本発明のプログラムは、コンピュータを、検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出手段と、該第1の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、前記第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定手段と、該第1の特徴点決定手段により決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出手段と、該第2の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定手段として機能させることを特徴とするものである。
本発明において、「複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデル」とは、特徴点同士の位置関係を点同士の位置関係ではなく、領域同士の位置関係として規定するモデルであり、この領域の平均的な広さを第1の許容度で定義するものである。同様に、「複数種類の特徴点同士の位置関係を第1の許容度より小さい第2の許容度で規定する第2の位置関係モデル」とは、特徴点同士の位置関係を領域同士の位置関係として規定するモデルであり、この領域の平均的な広さが第1の許容度で定義される広さより小さいものである。
なお、これらの位置関係モデルは、所定対象物を含むサンプル画像に対して特徴点検出器群を適用して検出された複数種類の特徴点の候補の位置と、そのサンプル画像における複数種類の特徴点の正解位置とに基づいて、統計的に求めることができる。
本発明において、前記特徴点の存在確率分布とは、特徴点が画像上のある位置に存在する確率を当該画像上の複数の位置について表した分布のことを意味するものである。
本発明において、「存在確率分布を合成する」とは、画像上の互いに対応する位置毎にその位置における存在確率を合成して新たな存在確率の分布を得ることを意味するものである。ここで、前記合成は、加算であってもよいし、積算であってもよい。
また、本発明において、「確率が最も高い位置の点を代表とする所定領域」とは、その点を略中心、略重心、あるいは略中央とした所定の大きさの範囲の領域のことを意味するものである。この領域は、円形であってもよいし矩形等の多角形であってもよい。
本発明において、前記所定対象物としては、例えば、人物の顔、自動車、動物等が考えられる。
なお、本発明の方法および装置により検出された所定対象物の特徴点は、所定対象物の姿勢認識のほか、特定の対象物であるか否かを判定する認証処理、また、所定対象物が人物の顔である場合には、表情判別等に用いることができる。
本発明の特徴点検出装置および方法並びにそのためのプログラムによれば、検出対象画像における所定対象物の複数種類の特徴点の候補を、第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて検出し、その検出された特徴点の候補の位置と、上記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、第1の位置関係モデルで拘束された位置関係を有する上記複数種類の暫定特徴点を決定した後、その決定された上記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、第1の検出精度より高い第2の検出精度および第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて検出し、その検出された特徴点の候補の位置と、上記複数種類の特徴点同士の位置関係を第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、第2の位置関係モデルで拘束された位置関係を有する上記複数種類の最終特徴点を決定するようしているので、比較的粗い検出の後に比較的細かい検出を行うという2段階構成の採用により高速で検出精度がよい特徴点検出を行うことができるとともに、特徴点同士の位置関係の拘束により不正解の特徴点候補を排除することができ、画像に含まれる所定対象物の複数種類の特徴点を、高速に精度よくかつ安定して検出することができる。
以下、図面を参照して、本発明の実施形態について説明する。
図1は、本発明の実施形態による顔特徴点検出システムの構成を示すブロック図である。なお、この顔特徴点検出システムは、画像の中から人物の顔を検出し、さらに検出された顔の特徴点を検出するシステムであり、補助記憶装置に読み込まれた処理プログラムをコンピュータ(たとえばパーソナルコンピュータ等)上で実行することにより実現される。また、この処理プログラムは、CD−ROM等の情報記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされることになる。また、画像データは画像を表すものであり、以下、特に画像と画像データの区別をせずに説明を行う。
図1に示すように、本実施形態による顔特徴点検出システムは、画像入力部10と、顔検出部20と、第1の顔正規化部30と、第1の特徴点候補検出部40と、第1の特徴点決定部50と、第2の顔正規化部60と、第2の特徴点候補検出部70と、第2の特徴点決定部80とを備えている。
画像入力部10は、ユーザから入力された、顔の検出対象となる画像S0の入力を受け付け、この入力画像S0を不図示のメモリに保存するものであり、ユーザは、この画像入力部10により、例えば、デジタルカメラ等により取得されたスナップ写真の画像を入力する。
顔検出部20は、メモリに保存された入力画像S0を読み出して、その画像に含まれる顔を検出するものであり、具体的には、入力画像S0に含まれる顔S1の両目の位置を検出するとともに、その顔の向きfをも検出するものである。
ここでは、顔S1の両目の位置を検出する方法として、特開2005−108197号公報に開示されている対象物識別方法を適用することにする。この方法は、入力画像S0における識別対象領域の画像について特徴量を算出し、目の位置を所定の許容度を持って正規化した複数の顔サンプル画像と複数の非顔サンプル画像の特徴量について学習を行った第1の参照データを参照して、識別対象領域の画像から算出した特徴量に基づいて、識別対象領域の画像に顔が含まれるか否かを識別し、顔が含まれる場合に、目の位置を所定の許容度よりも小さい許容度を持って正規化した複数の顔サンプル画像と複数の非顔サンプル画像の特徴量について学習を行った第2の参照データを参照して、顔に含まれる目の位置を識別する方法であり、いわゆるAdaBoostと呼ばれるマシンラーニングの手法により学習された識別器を用いて顔を検出し、顔に含まれる目の位置を精度よく検出する方法である。
この識別器は、学習に用いた顔サンプル画像の顔の向きと略同じ向きの顔を識別するので、顔の向き毎に用意された複数種類の顔サンプル画像群をそれぞれ用いて学習して得られる複数種類の識別器を用意し、これら複数種類の識別器を用いて顔を検出するようにすれば、多方向の向きの顔S1を検出し、その顔の両目の位置とその顔の向きfを同時に知ることができる。
なお、顔S1を検出する方法としては、上記のほか、テンプレートマッチングによる方法などを用いてもよい。この場合、顔の向きがそれぞれ異なる複数のテンプレート上で顔の両目の位置に相当する位置を予め定義しておくなどして、検出された顔S1の両目の位置を求めるようにすればよい。
第1の顔正規化部30は、入力画像S0(Gray画像)と、検出された顔S1の両目の位置の情報を用いて、入力画像S0から、両目の位置が所定の基準位置に位置するように正規化された顔S1を含む所定サイズの画像を切り出すことにより、正規化顔画像S1′を得るものである。図7は、入力画像S0を必要に応じて拡大・縮小したり回転したりした後に適切なトリミングを行って正規化顔画像S1′を得る様子を示した図である。本実施例では、画像サイズを200×200画素サイズとし、顔S1の両目の中心位置がそれぞれ、画像の最左上の画素を座標(0,0)、最右下の画素を座標(199,199)として、A(70,70)およびB(130,70)に位置するように顔を正規化する。なお、顔の向きfが斜めの向き、例えば、斜め45度の向きの場合には、顔S1の両目の中心位置がそれぞれ、A(70,50)およびB(130,50)となるように、顔の位置を20画素分だけ上方にシフトして正規化する。
第1の特徴点候補検出部40は、正規化顔画像S1′上で指定した識別対象領域の画像に対して、当該画像の略中心に特徴点が含まれる蓋然性を示す検出スコア(確信度)SCDを算出し、当該検出スコアSCDが所定の閾値以上であるときに、当該識別対象領域の画像が表す対象をその特徴点であると識別することにより、顔の特徴点X毎にその特徴点の候補Q1itを検出するものである。
図2は、第1の特徴点候補検出部40の構成を示した図である。第1の特徴点候補検出部40は、図示のように、多重解像度画像生成部41と、照明正規化部42と、第1の特徴点検索範囲設定部43と、第1の特徴点検出器群45を含む第1の検出処理部44と、第1の特徴点検出器選択部46とを備える。
第1の特徴点検出器群45は、検出する特徴点Xの種類別に用意された複数種類の特徴点検出器D1(i=1,2,・・・,N)から構成されており、各特徴点検出器D1は、特開2005−108197号公報等に開示されている、いわゆるAdaBoostと呼ばれるマシンラーニングの手法により学習された複数の識別器を用いて特徴点の位置を精度よく検出するものである。すなわち、この第1の特徴点検出器群が、本発明における第1の検出精度および第1のロバスト性を有する特徴点検出器群を表すものである。
この識別器は、ある特定の特徴点の位置が略中心となるように所定の許容度を持って正規化した複数の特徴点サンプル画像と複数の非特徴点サンプル画像の特徴量について学習を行った参照データを参照して、識別対象領域の画像から算出した特徴量に基づいて、当該画像がその特徴点を含む蓋然性を示す識別ポイントを算出するものであり、適当な閾値を設定することで、この識別ポイントの閾値判定により、識別対象の画像が特定の特徴点を略中心に含むか否かを識別できるようになる。
ここで、図13を参照しながら、ある特定の特徴点の識別器の作成について簡単に説明する。まず、ある特定の特徴点を略中心に含むすべての特徴点サンプル画像について、ある複数種類の特徴量を算出してその特徴量の組合せを求め、そのヒストグラムを作成する。同様に、すべての非特徴点サンプル画像について、同じ複数種類の特徴量の組合せを求め、そのヒストグラムを作成する。これら2つのヒストグラムが示す頻度値の比の対数値等を取って新たにヒストグラムで表したものが、図13の一番右側に示す、識別器として用いられるヒストグラムである。この識別器のヒストグラムが示す各縦軸(ビン)の値を、以下、識別ポイントと称する。この識別器によれば、正の識別ポイントに対応する特徴量の分布を示す画像は中心にその特定の特徴点を含む画像である可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の識別ポイントに対応する特徴量の分布を示す画像はその特定の特徴点でない可能性が高く、識別ポイントの絶対値が大きいほどその可能性は高まる。
このような識別器を、特徴量の組合せ毎に複数作成して用意し、作成した複数の識別器のうち、画像がその特定の特徴点を略中心に含むか否かを識別するのに有効な識別器が、所定のアルゴリズムにより選択される。所定のアルゴリズムとしては、例えば次のようなものが考えられる。はじめに、特徴点および非特徴点の各サンプル画像に予め重み1を等しく付しておき、各識別器に各サンプル画像が特定の特徴点を中心に含む画像であるか否かを識別させて各識別器の重み付き正答率を求め、この各識別器の重み付き正答率を比較して、重み付き正答率が相対的に最も高い識別器を選択するようにする。そして、正答率が悪かったサンプル画像の重みを現時点より大きく設定し直し、再度、各識別器に各サンプル画像の識別を行わせて各識別器の重み付き正答率を求め、重み付き正答率が相対的に最も高い識別器を選択する。このような処理を繰り返すことにより、識別に有効な識別器が順次選択されてゆくことになる。なお、このアルゴリズムの詳細については、特開2005−108197号公報を参照されたい。
特徴点検出器D1は、後述の正規化済みの解像度画像S1″上で識別対象領域を指定し、指定された識別対象領域の画像に対して、上記の選択された有効な識別器を用いて識別ポイントをそれぞれ算出し、算出されたすべての識別ポイントを加算したものを検出スコアSCDとして出力する。そして、その検出スコアSCDが所定の閾値以上であるか否かを判定し、所定の閾値以上であるときに、その識別対象領域の画像の中心にその特定の特徴点が含まれると識別する。すなわち、その中心位置をその特定の特徴点の候補Q1it(t=1,・・・,NQ1i)の位置として検出する。
なお、識別器の学習に用いる特徴点サンプル画像としては、例えば、数千パターンの異なる特徴点画像をベースに拡縮、回転、アスペクト変換のバリエーションを加え、合わせて数万サンプルを用意する。また、各パッチの解像度は24×24画素とし、Haar-likeフィルタの出力値を特徴量として、AdaBoost学習アルゴリズムにより学習を行う。
この識別器は、学習に用いた特徴点を含む画像の当該特徴点の種類と同じ種類の特徴点を識別するので、特徴点の種類がそれぞれ異なる複数種類の特徴点サンプル画像群を用いて学習した複数種類の識別器を用意し、これら複数種類の識別器を用いて特徴点を検出するようにすれば、各種類の特徴点X毎にその特徴点の候補Q1itの位置q1itを検出することができる。
本実施例では、検出された顔S1の顔の向きfが正面に近い場合には、顔の各特徴点Xとして、左目尻(X)、左目頭(X)、右目頭(X)、右目尻(X)、左小鼻(X)、右小鼻(X)、左口角(X)、右口角(X)、上唇の中点(X)、下唇の中点(X10)の10種類を用いることとし、一方、検出された顔S1の顔の向きfが斜め45度に近い顔の場合には、顔の各特徴点xiとして、左目尻(X)、左目頭(X)、右目頭(X)、右目尻(X)、鼻先(X11)、左口角(X)、右口角(X)の7種類を用いることにする。したがって、特徴点検出器は、左目尻、左目頭、右目頭、右目尻、左小鼻、右小鼻、左口角、右口角、上唇の中点、下唇の中点、鼻先の11種類(N=10)について用意しておく。
図10は、各特徴点検出器が備える識別器の学習に用いる特徴点サンプル画像の例を示す図であり、正面顔用として、左目尻(X)、左目頭(X)、右目頭(X)、右目尻(X)、左小鼻(X)、右小鼻(X)、左口角(X)、右口角(X)、上唇の中点(X)、下唇の中点(X10)の10種類について示したものである。
なお、特徴点Xを検出する方法としては、上記のほか、テンプレートマッチングによる方法などを用いてもよい。この場合、特徴点の種類がそれぞれ異なる複数のテンプレート上で特徴点の位置に相当する位置を予め定義しておくなどして、特徴点の位置を求めるようにすればよい。
多重解像度画像生成部41は、図9に示すように、200×200画素サイズの画像である正規化顔画像S1′を基準に、2の−1/5乗倍刻みで縮小画像(以下、解像度画像と称する)S1′(k=1,2,・・・,NS1)を生成するものである。このように正規化顔画像S1′を多重解像度化する理由は、生成された解像度が異なる複数の画像に対して特徴点の候補の検出を行うことにより、顔正規化時の目の位置の精度の良し悪しや顔の向き、個人差によって顔を構成する顔部品の大きさがばらついた場合であっても、顔部品の大きさを少しずつ段階的に変えた複数の画像で特徴点の候補の検出を試みることで、その顔部品のばらつきを吸収し、特徴点の候補を安定して検出することができるようするためである。
照明正規化部42は、解像度画像のコントラストが特徴点の候補の検出に適した状態となるように、解像度画像の各々に対して正規化処理を施し、正規化済みの解像度画像S1″を得るものである。
この正規化処理は、解像度画像のコントラストを特徴点の候補の検出に適した所定のレベル、すなわち、特徴点検出器の性能を引き出すのに適したレベルに近づけるべく、解像度画像全体の画素値をこの画像における被写体の輝度の対数を表す値に近づける変換曲線にしたがって変換する処理である。
図14は、照明正規化処理に用いる変換曲線の一例を示した図である。この照明正規化処理としては、図示のような、画素値をsRGB空間におけるいわゆる逆ガンマ変換(=2.2乗する)した後にさらに対数をとるような変換曲線(ルックアップテーブル)にしたがって、画像全体における画素値を変換する処理を考えることができる。これは、次のような理由による。
画像として観測される光強度Iは、通常、被写体の反射率Rと光源の強度Lの積として表現される(I=R×L)。したがって、光源の強度Lが変化すると、画像として観測される光強度Iも変化することになるが、被写体の反射率Rのみを評価することができれば、光源の強度Lに依存しない、すなわち、画像の明るさ、すなわち、撮影時の照明の明るさの影響を受けない精度の高い特徴点候補検出を行うことができる。
ここで、光源の強度がLの場合において、被写体上で反射率がR1の部分から観測される光強度をI1、被写体上で反射率がR2の部分から観測される光強度をI2としたとき、それぞれの対数をとった空間では、下記の式が成り立つ。
すなわち、画像における画素値を対数変換することは、反射率の比が差として表現された空間へ変換することとなり、このような空間では、光源の強度Lに依存しない被写体の反射率のみを評価することが可能となる。言い換えると、画像中の明るさによって異なるコントラスト(ここでは画素値の差分そのもの)を揃えることができる。
一方、一般的なデジタルカメラ等の機器で取得された画像の色空間はsRGBである。sRGBとは、機器間の色再現の違いを統一するために、色彩、彩度等を規定・統一した国際標準の色空間のことであり、この色空間においては、ガンマ値(γout)が2.2の画像出力機器において適正な色再現を可能にするため、画像の画素値は、入力輝度を1/γout(=0.45)乗して得られる値となっている。
そこで、画像全体における画素値を、いわゆる逆ガンマ変換、すなわち、2.2乗した後にさらに対数をとるような変換曲線にしたがって変換することにより、光源の強度に依存しない被写体の反射率のみによる評価を適正に行うことができるようになる。
このような正規化処理は、別の言い方をすれば、画像全体における画素値を、特定の色空間を別の特性を有する色空間に変換する変換曲線にしたがって変換する処理ということができる。
このような処理を画像に施すことにより、画像中の明るさによって異なるコントラストを揃えることができ、特徴点の候補の検出の精度が向上することとなる。
なお、特徴点検出器が備える識別器は、このような正規化処理が施されたサンプル画像を用いて学習されたものである。
第1の特徴点検索範囲設定部43は、特徴点の候補の検出に要する時間を短縮するため、各特徴点が存在し得る領域でのみ特徴点の検索を行うように、解像度画像上で各特徴点Xの検索範囲SR1を設定するものである。この探索範囲は、後述する、顔を含むトレーニング画像セットにより統計的に求められた特徴点の存在確率分布に基づいて決定し、位置の変動が大きい特徴点ほどその検索範囲を広くして設定するようにする。なお、この特徴点の存在確率分布は後述の第1のデータベース58に記憶されており、第1の特徴点検索範囲設定部43は、この存在確率分布を第1のデータベース58から読み出して、解像度画像S1″毎に、また、特徴点X毎に、検索範囲SR1iを設定する。
図11は、探索範囲の一例として、左目尻(X)、右小鼻(X)および左口角(X)の各特徴点それぞれの検索範囲SR111、SR116およびSR117を示した図である。口角は個人差も多く比較的変動しやすい特徴点なので、図示のように、目尻や小鼻に比して検索範囲が広く設定される。
第1の特徴点検出器選択部46は、検出された顔S1の顔の向きfが正面に近い場合には、使用する特徴点検出器の種類として、検出する特徴点を、左目尻(X)、左目頭(X)、右目頭(X)、右目尻(X)、左小鼻(X)、右小鼻(X)、左口角(X)、右口角(X)、上唇の中点(X)、下唇の中点(X10)とする10種類の特徴点検出器を選択し、一方、検出された顔S1の顔の向きfが斜め45度に近い場合には、検出する特徴点を、左目尻(X)、左目頭(X)、右目頭(X)、右目尻(X)、鼻先(X11)、左口角(X)、右口角(X)とする7種類の特徴点検出器を選択するものである。
第1の検出処理部44は、正規化済みの解像度画像S1″の各々に対し、特徴点検出器群D1のうち選択された特徴点検出器を用いて、特徴点Xのうち決められた特徴点の種類毎に、設定された検索範囲内で、特徴点の候補を検出するものである。
第1の特徴点決定部50は、図3に示すように、第1の特徴点存在確率分布合成部51と、第1の特徴点候補選択部52と、第1の特徴点位置決定部53と、第1のデータベース58とを備える。
第1のデータベース58は、予め統計的に求められた、顔の特徴点X毎の、当該特徴点の位置座標xを基準としたときの、当該特徴点Xとは異なる他の特徴点Xのそれぞれの存在確率分布P1ijを記憶しているものである。
この存在確率分布P1ijは、ある特徴点検出器によって検出された特徴点の位置座標に対する他の特徴点の正解となる点の存在確率分布を、1つの特徴点Xと1つのその他の特徴点Xとからなる2つ1組の単位で各組毎に用意されたものであり、特徴点同士の間の位置関係をこれら複数組の確率分布を用いて表現することができるものである。すなわち、この存在確率分布が本発明における特徴点の位置関係を第1の許容度で規定する第1の位置関係モデルを表すものである。ここで、特徴点検出器D1の出力座標x1に対する特徴点Xの存在確率分布をP1ij(x|x1)と定義するものであり、P1ijは2次元のヒストグラムで表される。
この存在確率分布P1ijを求めるには、まずトレーニング画像セット(顔の特徴点の正解座標が入力された数千枚の画像)に対して顔の検出を行い、顔が基準位置に位置するように画像を規格化する。図7は、画像から顔を検出し、その顔が画像の中心に所定の大きさで所定の基準位置に位置するように画像を規格化した場合の例を示すものである。
次に、規格化された画像から特徴点検出器D1により特徴点Xを検出し、その特徴点の座標x1とその他の特徴点Xの正解座標xとのずれを、1つのある種類の特徴点Xと1つのその他の種類の特徴点Xとからなる2つ1組の単位で比較、集計する。このような学習によって得られた存在確率分布P1ijの例を図12に示す。なおここでは、特徴点検出器により検出された特徴点の位置を×で表し、対象の特徴点の存在確率分布を画像上の濃淡で表しており、対象の特徴点の存在確率が高いほどその位置における濃度が濃くなるように表現してある。図12(a)は、左目頭検出器D1により検出された左目頭の点の位置座標xに対する左目尻の点(位置座標x)の存在確率分布P121を表す図であり、図12(b)は、当該左目頭の点の位置座標xに対する左小鼻の点(位置座標x)の存在確率分布P125を表す図であり、図12(c)は、当該左目頭の点の位置座標xに対する右口角の点(位置座標x)の存在確率分布P128を表す図である。なお、この存在確率分布P1ijが表す2次元のヒストグラムの解像度は、正規化顔画像S1が200×200画素サイズである場合に、画像サイズをその1/4とする100×100画素サイズとし、学習の効率をよくするとともにデータベースに記憶させる情報量を低減している。
第1の特徴点存在確率分布合成部51は、第1のデータベース58に記憶されている存在確率分布P1ijを用いて、特徴点X毎に、1つの種類の特徴点Xとは異なる他の種類の特徴点Xの各候補Q1jtの位置をそれぞれ基準としたときの、入力画像S0上での当該1つの種類の特徴点Xの存在確率分布P1ij(x|q1jt)を求め、当該確率分布を次式にしたがって合成するものである。
ここで、P1は特徴点Xの合成された存在確率分布、P1ij(x|q1jt)は特徴点Xのt番目の候補Q1jtの位置座標q1jtを基準としたときの特徴点X(位置座標x)の存在確率分布、NQ1jは特徴点Xの候補の数、Nは予め定義した特徴点の種類の数である。
なお、1つの種類の特徴点について多数の候補が検出された場合には、上記式による計算量は増大し計算の所要時間が長くなるので、例えば、候補の数NQ1jが6つ以上の場合には、検出スコアSCDの高いものから上位5つの候補についてのみ計算するようにしてもよい。
このようにして合成された存在確率分布P1は、ある種類の特徴点が存在する位置の、その特徴点とは異なる他の種類の特徴点の位置から見たときの推定結果として考えることができる。
第1の特徴点候補選択部52は、顔の特徴点X毎に、当該特徴点Xの合成された存在確率分布P1における確率を、顔部品の位置関係を示す形状の尤度を表す形状スコアSCGとして算出し、この形状スコアSCGの大小と、当該特徴点Xの候補Q1itの位置とに基づいて、当該特徴点の候補Q1itの中から候補Q1′iu(u=NQ1′i)を選択して絞り込むものである。
本実施例では、形状スコアSCG、すなわち、特徴点Xの合成された存在確率分布P1上で存在確率が最も高い位置の点を代表点C1とし、特徴点の候補Q1itのうちその代表点C1を略中心とする所定範囲の領域内に存する候補を絞り込むべき候補Q1′iuとして選択する。
ここで、上記の代表点C1は、次式にしたがって定義される。
なお、候補を絞り込む手法としては上記の他、候補Q1itのうち、この候補に対応する形状スコアSCGが所定の閾値、例えば、特徴点Xの合成された存在確率分布P1上での存在確率の最大値から所定値を引いた値以上の形状スコアを有する候補のみを選択して絞り込む手法を用いてもよい。
第1の特徴点位置決定部53は、顔の特徴点X毎に、第1の特徴点候補選択部52により絞り込まれた候補について、各候補の位置座標をその候補が検出されたときの検出スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を算出し、当該算出された位置座標を特徴点Xの位置として決定する。
本実施例では、重み係数Weight1iuを次式に従って算出し、ΣWeight1iu×q1′iuで表される位置座標を特徴点Xの位置として決定する。
ここで、xは特徴点Xの位置座標、q1′iuは候補Q1′iuの位置座標、Weight1iuは重み係数、SCD1iuは候補Q1′iuの検出スコア、SCD1imaxは候補Q1′iuの中での検出スコアの最大値、N1norは、Σweight1iu=1となるように定義された正規化定数である。
なお、特徴点の決定方法は本実施例に限定されるわけではなく、例えば、絞り込まれた候補について、各候補の位置座標をその候補に対応する形状スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を特徴点Xの位置として決定してもよいし、各候補の位置座標をその候補に対応する検出スコアと形状スコアの合算値でそれぞれ重み付けしたときの、位置座標の重み付き平均を特徴点Xの位置として決定してもよい。あるいは、絞り込まれた候補の中で、検出スコアが最大の候補の位置座標、形状スコアが最大の候補の位置座標、または、検出スコアと形状スコアの合算値が最大の候補の位置座標を特徴点Xの位置として決定してもよい。
第2の顔正規化部60は、第1の特徴点決定部50により決定された各特徴点がそれぞれ所定の基準位置に近づくように、入力画像S0に対して再び幾何学的正規化処理を施し、顔を含む画像を切り出して新たな正規化顔画像を得るものである。ただし、実際には、処理の効率化を考え、既に顔S1の特徴点が検出された解像度画像S1″に対して幾何学的正規化処理を施して、正規化顔画像S2″を得る。
このときの幾何学的正規化処理は、アスペクト比を維持した拡大縮小、回転、平行移動のみを考慮したアフィン変換を用いる。このアフィン変換を式で表すと、次式のようになる。
ここで、(x,y)は変換前の画素の座標、(x′,y′)は変換後の画素の座標、a,b,c,dはそれぞれ変換のパラメータを表している。
第2の特徴点候補検出部70は、正規化顔画像S2″上で指定した判定対象領域の画像に対して、当該画像の略中心に特徴点が含まれる蓋然性を示す検出スコアSCDを算出し、当該検出スコアSCDが所定の閾値以上であるときに、当該判定対象領域の画像が表す対象をその特徴点であると判定することにより、顔の特徴点X毎にその特徴点の候補Q2itを検出するものである。
第2の特徴点候補検出部70は、図4に示すように、第2の特徴点検索範囲設定部73と、第2の特徴点検出器群75を含む第2の検出処理部74と、第2の特徴点検出器選択部76とを備えている。
第2の特徴点検出器群75は、第2の特徴点検出器群45と同様に、検出する特徴点Xの種類別に用意された複数種類の特徴点検出器D2から構成されており、各特徴点検出器D2は、いわゆるAdaBoostと呼ばれるマシンラーニングの手法により学習された複数の識別器を用いて特徴点の位置を精度よく検出するものである。すなわち、この第2の特徴点検出器群が、本発明における第2の検出精度および第2のロバスト性を有する特徴点検出器群を表すものである。
ただし、この識別器は、ある特定の特徴点の位置が略中心となるように、特徴点検出器D1の場合よりもより小さい許容度を持って正規化した複数の特徴点サンプル画像と複数の非特徴点サンプル画像の特徴量について学習を行った参照データを参照して、識別対象領域の画像から算出した特徴量に基づいて、当該画像がその特徴点を含む蓋然性を示す識別ポイントを算出し、この識別ポイントの閾値判定により、識別対象の画像が特定の特徴点を略中心に含むか否かを識別するものである。したがって、特徴点検出器D2は、特徴点検出器D1よりも検出精度が高い反面、ロバスト性が低いという特徴を有する。
第2の特徴点検索範囲設定部73は、第1の特徴点検索範囲設定部43と同様に、各特徴点が存在し得る領域でのみ特徴点の検索を行うように、正規化顔画像S2″上で各特徴点Xの検索範囲SR2を設定するものである。この探索範囲は、後述の第2のデータベース88に記憶されている特徴点の存在確率分布に基づいて決定し、位置の変動が大きい特徴点ほどその検索範囲を広くして設定するようにする。
第2の特徴点検出器選択部76は、第1の特徴点検出器選択部46と同様に、検出された顔S1の顔の向きfに応じて特徴点検出器D2の中から特徴点の検出に利用する特徴点検出器を選択するものである。
第2の検出処理部74は、第1の検出処理部44と同様に、正規化顔画像S2″に対し、第2の特徴点検出器選択部76によって選択された特徴点検出器を用いて、特徴点Xのうち決められた特徴点の種類毎に、設定された検索範囲内で、特徴点の候補を検出するものである。
第2の特徴点決定部80は、図5に示すように、第2の特徴点存在確率分布合成部81と、第2の特徴点候補選択部82と、第2の特徴点位置決定部83と、第2のデータベース88とを備える。
第2のデータベース88は、第1のデータベース58と同様に、予め統計的に求められた、顔の特徴点X毎の、当該特徴点の位置座標xを基準としたときの、当該特徴点Xとは異なる他の特徴点Xのそれぞれの存在確率分布P2ijを記憶しているものである。
この存在確率分布P2ijは、ある特徴点検出器によって検出された特徴点の位置座標に対する他の特徴点の正解となる点の存在確率分布を、1つの種類の特徴点Xと1つのその他の種類の特徴点Xとからなる2つ1組の単位で各組毎に用意されたものであり、特徴点同士の間の位置関係をこれら複数組の確率分布を用いて表現することができるものである。すなわち、この存在確率分布が本発明における特徴点の位置関係を第2の許容度で規定する第2の位置関係モデルを表すものである。
ここで、特徴点検出器D2の出力座標x2に対する、特徴点Xの存在確率分布をP2ij(x|x2)と定義するものであり、P2ijは2次元のヒストグラムで表される。
この存在確率分布P2ijを求める手順は次の通りである。まず、特徴点の正解座標が分かっているトレーニング画像に対して、顔検出部20、第1の顔正規化部30、第1の特徴点候補検出部40、および第1の特徴点決定部50を適用して、特徴点Xの種類別に特徴点の位置を決定する。次に、その決定された特徴点の位置に基づいて第2の顔正規化部69により正規化された正規化顔画像を求め、その正規化顔画像上で第2の特徴点検出器群75を構成する特徴点検出器D2により特徴点Xを検出し、その特徴点の座標x2とその他の特徴点Xの正解座標xとのずれを、1つの特徴点Xと1つのその他の特徴点Xとからなる2つ1組の単位で比較、集計する。このような処理を多数のトレーニング画像に対して行い、統計的に学習して前述の存在確率分布P2ijを求める。
第2の特徴点存在確率分布合成部81は、第2のデータベース88に記憶されている存在確率分布P2ijを用いて、特徴点X毎に、1つの特徴点Xとは異なる他の特徴点Xの各候補Q2jtの位置をそれぞれ基準としたときの、入力画像S0上での当該1つの特徴点Xの存在確率分布P2ij(x|q2jt)を求め、当該確率分布を次式にしたがって合成するものである。
ここで、P2は特徴点Xの合成された存在確率分布、P2ij(x|q2jt)は特徴点Xのt番目の候補Q2jtの位置座標q2jtを基準としたときの特徴点X(位置座標x)の存在確率分布、NQ2jは特徴点Xの候補の数、Nは予め定義した特徴点の種類の数である。
第2の特徴点候補選択部82は、顔の特徴点X毎に、当該特徴点Xの合成された存在確率分布P2における確率を、顔部品の形状の尤度を表す形状スコアSCGとして算出し、この形状スコアSCGの大小と、当該特徴点Xの候補Q2itの位置とに基づいて、当該特徴点の候補Q2itの中から候補Q2′iu(u=NQ2′i)を選択して絞り込むものである。
本実施例では、形状スコアSCG、すなわち、特徴点Xの合成された存在確率分布P2上で存在確率が最も高い位置の点を代表点C2とし、特徴点の候補Q2itのうちその代表点C2を略中心とする所定範囲の領域内に存する候補を絞り込むべき候補Q2′iuとして選択する。
ここで、上記の代表点C1は、次式にしたがって定義される。
なお、候補を絞り込む手法としては、第1の特徴点候補選択部52と同様に、候補Q2itのうち、この候補に対応する形状スコアSCGが所定の閾値、例えば、特徴点Xの合成された存在確率分布P2上での存在確率の最大値から所定値を引いた値以上の形状スコアを有する候補のみを選択して絞り込む手法を用いてもよい。
第2の特徴点位置決定部83は、顔の特徴点X毎に、第2の特徴点候補選択部82により絞り込まれた候補について、各候補の位置座標をその候補が検出されたときの検出スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を算出し、当該算出された位置座標を特徴点Xの位置として決定する。
本実施例では、重み係数Weight2iuを次式に従って算出し、ΣWeight2iu×q2′iuで表される位置座標を特徴点Xの位置として決定する。
ここで、xは特徴点Xの位置座標、q2′iuは候補Q2′iuの位置座標、Weight2iuは重み係数、SCD2iuは候補Q2′iuの検出スコア、SCD2imaxは候補Q2′iuの中での検出スコアの最大値、N2norは、Σweight2iu=1となるように定義された正規化定数である。
なお、特徴点の決定方法は第1の特徴点位置決定部53と同様に、本実施例に限定されるわけではなく、例えば、絞り込まれた候補について、各候補の位置座標をその候補に対応する形状スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を特徴点Xの位置として決定してもよいし、各候補の位置座標をその候補に対応する検出スコアと形状スコアの合算値でそれぞれ重み付けしたときの、位置座標の重み付き平均を特徴点Xの位置として決定してもよい。あるいは、絞り込まれた候補の中で、検出スコアが最大の候補の位置座標、形状スコアが最大の候補の位置座標、または、検出スコアと形状スコアの合算値が最大の候補の位置座標を特徴点Xの位置として決定してもよい。
次に、本実施形態において行われる処理について説明する。図6は、本実施形態において行われる処理を示すフローチャートである。
まず、画像入力部10が顔およびその特徴点の検出対象となる画像S0の入力を受け付ける(ステップST1)。次に、顔検出部20が入力画像S0に含まれる顔S1を検出し、その顔S1の両目の位置と顔の向きfの情報を取得する(ステップST2)。第1の顔正規化部30は、検出された顔S1について、入力画像S0から相対的な大きさや位置が正規化された顔S1を含む所定サイズの画像を切り出して正規化顔画像S1′を得る(ステップST3)。
正規化顔画像S1′が得られると、多重解像度画像生成部41が、正規化顔画像S1′を基準に解像度が異なる複数の解像度画像S1′を生成し、照明正規化部42が、照明の明るさの影響を受けずに特徴点候補を検出できるように、解像度画像S1′に対して画像のコントラストの正規化を行う。そして、第1の特徴点検索範囲設定部43は、第1のデータベース58に記憶されている存在確率分布P1ijに基づいて解像度画像上で各特徴点Xの検索範囲SR1を設定する。第1の特徴点検出器選択部46は、検出された顔S1の顔の向きfに応じて利用する特徴点検出器の種類を特徴点検出器を第1の特徴点検出器群45の中から選択し、第1の検出処理部44は、解像度画像S1′に対して選択された特徴点検出器を適用する。すなわち、正規化顔画像S1′上で指定した判定対象領域の画像に対し、当該画像の略中心に特徴点が含まれる蓋然性を示す検出スコアSCDを算出し、当該検出スコアSCDの閾値判定により、顔の特徴点X毎にその特徴点の候補Q1itを少なくとも1つ検出する(ステップST4)。
特徴点の候補が検出されると、第1の特徴点存在確率合成部51は、第1のデータベース58に記憶されている存在確率分布P1ijを用いて、特徴点X毎に、1つの特徴点Xとは異なる他の特徴点Xの各候補Q1jtの位置をそれぞれ基準としたときの、入力画像S0上での当該1つの特徴点Xの存在確率分布P1ij(x|q1jt)を求め、当該確率分布を上記の式(3)にしたがって合成する。第1の特徴点候補選択部52は、形状スコアSCG、すなわち、特徴点Xの合成された存在確率分布P1上で存在確率が最も高い位置の点を代表点C1とし、特徴点の候補Q1itのうちその代表点C1を略中心とする所定範囲の領域内に存する候補を絞り込むべき候補Q1′iuとして選択する。そして、第1の特徴点位置決定部53が、顔の特徴点X毎に、第1の特徴点候補選択部52により絞り込まれた候補について、各候補の位置座標をその候補が検出されたときの検出スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を算出し、当該算出された位置座標を特徴点Xの位置として決定する(ステップST5)。
第1の特徴点位置決定部53により各特徴点Xの位置が決定されると、第2の顔正規化部60は、それら決定された各特徴点がそれぞれ所定の基準位置に近づくように、既に顔S1の特徴点が検出された解像度画像S1″に対して、アスペクト比を維持した拡大縮小、回転、平行移動のみを考慮したアフィン変換を行い、顔を含む画像を切り出して新たな正規化顔画像S2″を得る(ステップST6)。
正規化顔画像S2″が得られると、第2の特徴点検索範囲設定部73は、第2のデータベース88に記憶されている存在確率分布P2ijに基づいて正規化顔画像S2″上で各特徴点Xの検索範囲SR2を設定する。第2の特徴点検出器選択部76は、検出された顔S1の顔の向きfに応じて利用する特徴点検出器の種類を特徴点検出器を第2の特徴点検出器群75の中から選択し、第2の検出処理部74は、正規化顔画像S2″に対して、選択された特徴点検出器を適用する。すなわち、正規化顔画像S2″上で指定した判定対象領域の画像に対し、当該画像の略中心に特徴点が含まれる蓋然性を示す検出スコアSCDを算出し、当該検出スコアSCDの閾値判定により、顔の特徴点X毎にその特徴点の候補Q2itを少なくとも1つ検出する(ステップST7)。
特徴点の候補が検出されると、第2の特徴点存在確率合成部81は、第2のデータベース88に記憶されている存在確率分布P2ijを用いて、特徴点X毎に、1つの特徴点Xとは異なる他の特徴点Xの各候補Q2jtの位置をそれぞれ基準としたときの、入力画像S0上での当該1つの特徴点Xの存在確率分布P2ij(x|q2jt)を求め、当該確率分布を上記の式(7)にしたがって合成する。第2の特徴点候補選択部82は、形状スコアSCG、すなわち、特徴点Xの合成された存在確率分布P2上で存在確率が最も高い位置の点を代表点C2とし、特徴点の候補Q2itのうちその代表点C2を略中心とする所定範囲の領域内に存する候補を絞り込むべき候補Q2′iuとして選択する。そして、第2の特徴点位置決定部83が、顔の特徴点X毎に、第2の特徴点候補選択部82により絞り込まれた候補について、各候補の位置座標をその候補が検出されたときの検出スコアでそれぞれ重み付けしたときの、位置座標の重み付き平均を算出し、当該算出された位置座標を特徴点Xの位置として決定する。そして、このようにして最終的に決定された特徴点Xの位置を、真の特徴点の位置としてその位置の情報を出力する(ステップST8)。
このような本実施形態による顔特徴点検出システムによれば、入力画像S0における顔S1の複数種類の特徴点の候補を、第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群45を用いて検出し、その検出された特徴点の候補の位置と、上記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、第1の位置関係モデルで拘束された位置関係を有する上記複数種類の特徴点を決定した後、その決定された上記複数種類の特徴点の各々の近傍で、特徴点の候補を、第1の検出精度より高い第2の検出精度および第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群75を用いて検出し、その検出された特徴点の候補の位置と、上記複数種類の特徴点同士の位置関係を第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、第2の位置関係モデルで拘束された位置関係を有する上記複数種類の特徴点を決定するようしているので、比較的粗い検出の後に比較的細かい検出を行うという2段階構成の採用により高速で検出精度がよい特徴点検出を行うことができるとともに、特徴点同士の位置関係の拘束により不正解の特徴点候補を排除することができ、画像に含まれる顔S1の複数種類の特徴点を、高速に精度よくかつ安定して検出することができる。
また、本実施形態による顔特徴点検出システムによれば、粗い特徴点検出の後、第2の顔正規化処理、すなわち、検出された各特徴点の位置が所定の基準位置に近づくような、アスペクト比を維持した幾何学的正規化処理を行ってから、細かい特徴点検出を行うようにしているので、粗い特徴点検出を行う前の段階で規格化しきれなかった顔の幾何学的なずれを補正する機会を得ることができ、特徴点の検出精度をより向上させることができる。
また、本実施形態による顔特徴点検出システムによれば、特徴点の種類毎に、第1および第2の特徴点候補選択部により絞り込まれた特徴点の各候補の位置座標をその候補が検出されたときの検出スコアでそれぞれ重み付けしたときの重み付き平均を算出し、この重み付き平均で表された位置座標を特徴点の位置として決定しているので、特徴点の正解位置から大きくずれた位置に単独で存在するような不正解の候補の影響を抑えることができる。
なお、この場合、式(5-1),(5-2)、式(9-1),(9-2)等の指数関数的に表現された重み付け係数を用いて重み付き平均を求めるようにするとよい。このような重み付き平均から特徴点の位置を決定する手法によれば、特徴点の位置の精度がより向上することが、本出願人の実験により明らかになっている。
以上、本発明の望ましい実施形態について説明したが、本発明の装置および方法並びにそのためのプログラムは、上述した実施形態に限られることなく、本発明の主旨を逸脱しない限り、様々な増減、変化を加えることができる。
本発明の実施形態である顔特徴点検出システムの構成を示すブロック図 第1の特徴点候補検出部40の構成を示すブロック図 第1の特徴点決定部50の構成を示すブロック図 第2の特徴点候補検出部70の構成を示すブロック図 第2の特徴点決定部80の構成を示すブロック図 本発明の実施形態である顔特徴点検出システムにおける処理を示すフローチャート 顔正規化処理の様子を示す図 1つの特徴点を基準としたときその他の特徴点の位置の確率分布の例を示す図 多重解像度化処理の様子を示す図 特徴点検出器が備える識別器の学習に用いる特徴点のサンプル画像の例を示す図 画像上で特徴点別に設定された検索範囲の例を示す図 統計的に求められた特徴点の存在確率分布の例を示す図 識別器の導出方法を示す図 照明正規化処理に用いる画素値の変換曲線の一例を示す図
符号の説明
10 画像入力部
20 顔検出部
30 第1の顔正規化部
40 第1の特徴点候補検出部
41 多重解像度画像生成部
42 照明正規化部
43 第1の特徴点検索範囲設定部
44 第1の特徴点検出器選択部
45 第1の特徴点検出器群
50 第1の特徴点決定部
51 第1の特徴点存在確率分布合成部
52 第1の特徴点候補選択部
53 第1の特徴点位置決定部
58 第1のデータベース
60 第2の顔正規化部
70 第2の特徴点候補検出部
73 第2の特徴点検索範囲設定部
74 第2の特徴点検出器選択部
75 第2の特徴点検出器群
80 第2の特徴点決定部
81 第2の特徴点存在確率分布合成部
82 第2の特徴点候補選択部
83 第2の特徴点位置決定部
88 第2のデータベース

Claims (10)

  1. 検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出手段と、
    該第1の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、該第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定手段と、
    該第1の特徴点決定手段により決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出手段と、
    該第2の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定手段とを備えたことを特徴とする特徴点検出装置。
  2. 前記検出対象画像に対して、前記第1の特徴点決定手段により決定された前記複数種類の暫定特徴点をそれぞれ所定の基準位置に近づける、アスペクト比を維持した幾何学的正規化処理を施す正規化手段をさらに備え、
    前記第2の特徴点候補検出手段が、前記正規化手段により正規化された検出対象画像上で前記候補を検出するものであることを特徴とする請求項1記載の特徴点検出装置。
  3. 前記第1の特徴点決定手段が、
    前記複数種類の特徴点の中の2つの異なる特徴点からなる組合せ毎に統計的に求められた、一方の特徴点の位置を基準としたときの他方の特徴点の画像上の存在確率分布を用いて、1つの種類の特徴点について、他の種類の特徴点の前記検出された候補の位置を基準としたときの該1つの種類の特徴点の存在確率分布を、該他の特徴点の候補毎にそれぞれ求め、該求められた存在確率分布を合成する処理を、特徴点の前記種類毎に行う第1の存在確率分布合成手段と、
    1つの種類の特徴点について、該1つの種類の特徴点の前記検出された候補の位置と、該1つの種類の特徴点の前記合成された存在確率分布における存在確率の大小とに基づいて、該1つの種類の特徴点の候補を前記検出された候補の中から選択して絞り込む処理を、特徴点の前記種類毎に行う第1の特徴点候補選択手段と、
    特徴点の前記種類毎に、該種類の特徴点の前記選択された候補の位置に基づいて、該種類の暫定特徴点の位置を決定する第1の特徴点位置決定手段とを備えたものであることを特徴とする請求項1または2記載の特徴点検出装置。
  4. 前記第1の特徴点候補選択手段が、特徴点の前記種類毎に、前記検出された候補のうち、該種類の特徴点の前記合成された存在確率分布における存在確率が最も高い位置の点を代表とする所定領域内に存する候補を選択するものであることを特徴とする請求項3記載の特徴点検出装置。
  5. 前記第1の特徴点候補選択手段が、特徴点の前記種類毎に、前記検出された候補のうち、該候補の位置に対応した、前記種類の特徴点の前記合成された存在確率分布における存在確率が所定の閾値以上である候補を選択するものであることを特徴とする請求項3記載の特徴点検出装置。
  6. 前記第1の特徴点候補検出手段が、前記検出対象画像上の識別対象画像が特徴点を含む画像である蓋然性を示す確信度の閾値判定に基づいて、該識別対象画像における対象を該特徴点の候補として検出するものであり、
    前記第1の特徴点位置決定手段が、特徴点の前記種類毎に、該種類の特徴点について選択されたすべての候補の位置座標を、該候補に対して算出された前記確信度で重み付けしたときの、前記位置座標の重み付き平均を該種類の暫定特徴点の位置座標として決定するものであることを特徴とする請求項3、4または5記載の特徴点検出装置。
  7. 前記第1の特徴点位置決定手段が、特徴点の前記種類毎に、該種類の特徴点について選択されたすべての候補の位置座標を、該候補の位置に対応した、該種類の特徴点の前記合成された存在確率分布における存在確率で重み付けしたときの、前記位置座標の重み付き平均を該種類の暫定特徴点の位置座標として決定するものであることを特徴とする請求項3、4または5記載の特徴点検出装置。
  8. 前記所定対象物が、人物の顔であることを特徴とする請求項1から7いずれか記載の特徴点検出装置。
  9. 検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出ステップと、
    該第1の特徴点候補検出ステップにより検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、前記第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定ステップと、
    該第1の特徴点決定ステップにより決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出ステップと、
    該第2の特徴点候補検出ステップにより検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定ステップとを有することを特徴とする特徴点検出方法。
  10. コンピュータを、
    検出対象画像における所定対象物の複数種類の特徴点の候補を、マシンラーニングにより生成された第1の検出精度および第1のロバスト性を有する第1の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第1の特徴点候補検出手段と、
    該第1の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を第1の許容度で規定する第1の位置関係モデルとに基づいて、前記第1の位置関係モデルで拘束された位置関係を有する前記複数種類の暫定特徴点を決定する第1の特徴点決定手段と、
    該第1の特徴点決定手段により決定された前記複数種類の暫定特徴点の各々の近傍で、特徴点の候補を、マシンラーニングにより生成された前記第1の検出精度より高い第2の検出精度および前記第1のロバスト性より低い第2のロバスト性を有する第2の特徴点検出器群を用いて、前記種類毎に少なくとも1つ検出する第2の特徴点候補検出手段と、
    該第2の特徴点候補検出手段により検出された特徴点の候補の位置と、前記複数種類の特徴点同士の位置関係を前記第1の許容度より小さい第2の許容度で規定する第2の位置関係モデルとに基づいて、前記第2の位置関係モデルで拘束された位置関係を有する前記複数種類の最終特徴点を決定する第2の特徴点決定手段として機能させるためのプログラム。
JP2006170983A 2006-06-21 2006-06-21 特徴点検出装置および方法並びにプログラム Active JP4795864B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006170983A JP4795864B2 (ja) 2006-06-21 2006-06-21 特徴点検出装置および方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006170983A JP4795864B2 (ja) 2006-06-21 2006-06-21 特徴点検出装置および方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2008003749A JP2008003749A (ja) 2008-01-10
JP4795864B2 true JP4795864B2 (ja) 2011-10-19

Family

ID=39008087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006170983A Active JP4795864B2 (ja) 2006-06-21 2006-06-21 特徴点検出装置および方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4795864B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4655235B2 (ja) 2008-03-14 2011-03-23 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5361530B2 (ja) * 2009-05-20 2013-12-04 キヤノン株式会社 画像認識装置、撮像装置及び画像認識方法
JP5644773B2 (ja) * 2009-11-25 2014-12-24 日本電気株式会社 顔画像を照合する装置および方法
KR101381439B1 (ko) 2011-09-15 2014-04-04 가부시끼가이샤 도시바 얼굴 인식 장치 및 얼굴 인식 방법
JP5787686B2 (ja) * 2011-09-15 2015-09-30 株式会社東芝 顔認識装置、及び顔認識方法
KR101713690B1 (ko) * 2013-10-25 2017-03-08 한국전자통신연구원 특징 선택 방법을 이용한 비주얼 기술자 추출 방법 및 시스템
US11210498B2 (en) 2017-06-26 2021-12-28 Nec Corporation Facial authentication device, facial authentication method, and program recording medium
KR20210142342A (ko) * 2020-05-18 2021-11-25 주식회사 엘지생활건강 나이 추정 장치 및 나이를 추정하는 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348851A (ja) * 1993-04-12 1994-12-22 Sony Corp 対象物位置検出方法
JPH0944676A (ja) * 1995-08-01 1997-02-14 Toyota Motor Corp 顔面検出装置
JP4011426B2 (ja) * 2002-07-17 2007-11-21 グローリー株式会社 顔検出装置、顔検出方法および顔検出プログラム

Also Published As

Publication number Publication date
JP2008003749A (ja) 2008-01-10

Similar Documents

Publication Publication Date Title
JP4532419B2 (ja) 特徴点検出方法および装置並びにプログラム
JP4657934B2 (ja) 顔検出方法および装置並びにプログラム
JP4517633B2 (ja) 対象物検出装置及び方法
US7801337B2 (en) Face detection method, device and program
JP4795864B2 (ja) 特徴点検出装置および方法並びにプログラム
US8155399B2 (en) Generic face alignment via boosting
JP4708909B2 (ja) デジタル画像の対象物検出方法および装置並びにプログラム
US8811744B2 (en) Method for determining frontal face pose
JP4624889B2 (ja) 顔検出方法および装置並びにプログラム
WO2012098842A1 (ja) 特徴抽出装置、特徴抽出方法、特徴抽出プログラム、および、画像処理装置
JP4708948B2 (ja) 顔向き特定方法、顔判別方法および装置並びにプログラム
JP4588575B2 (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP2008117391A (ja) デジタル画像における顔を検出する方法、およびデジタル画像における顔を検出する装置
US20120269443A1 (en) Method, apparatus, and program for detecting facial characteristic points
JP2007128127A (ja) 顔検出方法および装置並びにプログラム
JP2007213378A (ja) 特定表情顔検出方法、撮像制御方法および装置並びにプログラム
JP4553044B2 (ja) 集団学習装置及び方法
JP4757598B2 (ja) 顔検出方法および装置並びにプログラム
JP4690190B2 (ja) 画像処理方法および装置並びにプログラム
JP2011170890A (ja) 顔検出方法および装置並びにプログラム
JP4749879B2 (ja) 顔判別方法および装置並びにプログラム
JP4749884B2 (ja) 顔判別装置の学習方法、顔判別方法および装置並びにプログラム
JP2019139618A (ja) 情報処理装置、被写体の判別方法及びコンピュータプログラム
JP4795737B2 (ja) 顔検出方法および装置並びにプログラム
JP2006244385A (ja) 顔判別装置およびプログラム並びに顔判別装置の学習方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110728

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4795864

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250