JP4749880B2 - 顔判別方法および装置並びにプログラム - Google Patents

顔判別方法および装置並びにプログラム Download PDF

Info

Publication number
JP4749880B2
JP4749880B2 JP2006029177A JP2006029177A JP4749880B2 JP 4749880 B2 JP4749880 B2 JP 4749880B2 JP 2006029177 A JP2006029177 A JP 2006029177A JP 2006029177 A JP2006029177 A JP 2006029177A JP 4749880 B2 JP4749880 B2 JP 4749880B2
Authority
JP
Japan
Prior art keywords
image
face
dispersion
pixel
discrimination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006029177A
Other languages
English (en)
Other versions
JP2006309715A (ja
Inventor
嘉郎 北村
貞登 赤堀
賢祐 寺川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2006029177A priority Critical patent/JP4749880B2/ja
Publication of JP2006309715A publication Critical patent/JP2006309715A/ja
Application granted granted Critical
Publication of JP4749880B2 publication Critical patent/JP4749880B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、対象画像が顔画像であるか否かを判別する顔判別方法および装置並びにそのためのプログラムに関するものである。
従来、デジタルカメラによって撮影されたスナップ写真における人物の顔領域の色分布を調べてその肌色を補正したり、監視システムのデジタルビデオカメラで撮影されたデジタル映像中の人物を認識したりすることが行われている。このような場合、デジタル画像中の人物の顔に対応する顔領域を検出する必要があり、このため、対象画像が顔を表す画像であるか否かを判別する種々の手法が提案されている。
例えば、所定対象物を表す画像であることが分かっている複数のサンプル画像と、所定対象物を表す画像でないことが分かっている複数のサンプル画像とからなる多数のサンプル画像群のそれぞれから算出された特徴量を、マシンラーニングの手法によりあらかじめ学習することにより得られた、特徴量の入力により所定対象物を表す画像と所定対象物を表さない画像とを判別するための基準値を出力する複数の識別器を備え、この複数の識別器から出力された基準値の重み付け総和があらかじめ定めた閾値を超えた場合に、判別対象画像が所定対象物を表す画像であると判別する手法が本出願人により提案されている(特許文献1から3参照)。
また、顔を表す画像であることが分かっている複数のサンプル画像と、顔を表す画像でないことが分かっている複数のサンプル画像とからなる多数のサンプル画像群のそれぞれから算出された特徴量を、マシンラーニングの手法によりあらかじめ学習することにより得られた、特徴量の入力により判別対象画像が顔を表す画像であるか否かを判別する複数の弱判別器を備え、これら複数の弱判別器を線形に結合してカスケード構造をなし、すべての弱判別器において顔を表す画像であると判別された場合に、判別対象画像が顔を表す画像であると判別する手法も提案されている(非特許文献1参照)。
なお、これらの手法では、上記特徴量を判別対象画像の輝度分布に係る特徴量とし、この特徴量を用いて判別する場合が多い。
ところで、デジタルカメラ等によって取得されたスナップ写真の画像では、撮影シーンや撮影条件等に起因して、例えば、光源の位置や被写体の形状等に起因して、コントラスト(明暗の度合)がばらついた画像となる場合があるが、このようなコントラストがばらついた画像に対して上記輝度分布に係る特徴量に基づく判別を行うと、その特徴量に顔画像らしさが適正に反映されないため、判別の精度を低下させることとなる。
そこで、このようなコントラストのばらつきを抑えるため、顔判別を行う前処理として、判別対象画像に対して輝度を表す画素値の分散の程度をある一定レベルに均一化する正規化処理を一律に施す手法が知られている。
特願2003−316924号 特願2003−316925号 特願2003−316926号 「高速全方向顔検出」,Shihong LAO他,画像の認識・理解シンポジウム(MIRU2004),2004年7月,P.II-271−II-276
しかしながら、上記のような、判別対象画像に対して画素値の分散の程度を一定レベルに均一化する正規化処理を一律に施す手法では、例えば、顔の額や頬を表す領域、背景の空を表す領域等、もともとコントラストが平坦な領域についても無理やり画素値の分散の程度を一定レベルに近づけてしまうため、輝度がばらつき、顔判別処理にとってのノイズ成分をかえって増加させ、顔判別の精度を低下させる場合があるという問題がある。
本発明は、上記事情に鑑み、顔判別の精度の低下を抑制することが可能な顔判別方法および装置並びにそのためのプログラムを提供することを目的とするものである。
本発明の顔判別方法は、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化ステップと、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別ステップとを有する顔判別方法において、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑える第2の輝度階調変換処理を施す処理であることを特徴とする方法である(第1の顔判別方法)。
本発明の顔判別方法は、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化ステップと、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別ステップとを有する顔判別方法において、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施す処理であることを特徴とする方法である(第2の顔判別方法)。
本発明の顔判別装置は、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段とを備えた顔判別装置において、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑える第2の輝度階調変換処理を施す処理であることを特徴とするものである(第1の顔判別装置)。
本発明の顔判別装置は、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段とを備えた顔判別装置において、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施す処理であることを特徴とするものである(第2の顔判別装置)。
本発明のプログラムは、コンピュータを、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段として機能させるためのプログラムにおいて、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑える第2の輝度階調変換処理を施す処理であることを特徴とするものである(第1のプログラム)。
本発明のプログラムは、コンピュータを、顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段として機能させるためのプログラムにおいて、前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施す処理であることを特徴とするものである(第2のプログラム)。
本発明において、前記正規化処理は、前記判別対象画像における各画素を注目画素として順次設定するとともに、前記注目画素毎に、該注目画素を代表とする所定の大きさの局所領域における画素値の分散を算出し、少なくとも該分散が前記所定のレベルに対応する閾値以上のときに、前記第1の輝度階調変換処理として、該分散が前記一定レベルに対応する基準値より大きいほど、前記注目画素の画素値と該注目画素を代表とする前記局所領域における画素値の統計学上の所定の代表値との差を小さくし、該分散が前記基準値より小さいほど、前記注目画素の画素値と前記所定の代表値との差を大きくする階調変換を行う処理とすることができる。
なお、前記所定レベルは、前記局所領域における全体または一部の輝度に応じて変化させるようにしてもよい。例えば、上記の、注目画素毎に階調変換を行う正規化処理において、前記閾値を、前記注目画素の画素値に応じて変化させるようにしてもよい。すなわち、前記所定レベルに対応する閾値を、前記注目画素の輝度が相対的に高いときにはより高く設定し、その輝度が相対的に低いときにはより低く設定するようにしてもよい。このようにすることにより、輝度の低い(暗い)領域に低いコントラスト(小さい分散値)で存在している顔も正しく正規化することができる。
本発明の顔判別方法において、前記顔判別ステップは、前記判別対象画像が顔画像であるか否かを判別する互いに異なる複数の弱判別器(モジュール)を、該弱判別器の信頼度が高い順に線形に結合してなる構造を有する顔判別手段における処理を行うステップとすることができる。また、本発明の顔判別装置およびプログラムにおいて、前記顔判別手段は、前記判別対象画像が顔画像であるか否かを判別する互いに異なる複数の弱判別器(モジュール)を、該弱判別器の信頼度が高い順に線形に結合してなる構造を有するものとすることができる。
この場合において、さらに、本発明の顔判別方法において、前記顔判別ステップは、顔の向きが判別すべき顔の向きと同一であって顔の天地方向が揃った互いに異なる複数の学習用顔画像を用いた学習により、判別に用いる前記弱判別器の種類および前記弱判別器を結合する順番が決められた顔判別手段における処理を行うステップとすることができる。また、本発明の顔判別装置およびプログラムにおいて、前記顔判別手段は、顔の向きが判別すべき顔の向きと同一であって顔の天地方向が揃った互いに異なる複数の学習用顔画像を用いた学習により、判別に用いる前記弱判別器の種類および前記弱判別器を結合する順番が決められたものとすることができる。
ここで、「画素値の分散の程度」とは、画素値のばらつきの度合を意味するものであり、例えば、画素値のいわゆる数学的な分散値のほか、画素値の最大値と最小値の差分値等とすることができる。また、「所定レベル」とは、上記分散値あるいは上記差分値等が取り得る値の一つであり、顔の額や頬、背景となる空等を表すコントラストがもともと平坦である画像とその他の画像とを区別し得る境界に相当する上記分散値あるいは上記差分値等とすることができる。
なお、前記所定レベルは、画像毎に異なるノイズレベルに応じて設定すべきであり、入力ソースが分かっている場合には、それに合わせて前記所定レベルを変更することが好ましい。例えば、携帯電話に内蔵された撮像手段によって撮像された画像は比較的ノイズが多いことから、ノイズの増幅を抑えるために、前記所定のレベルを高く設定する。また、例えばノイズ解析手段から得られた解析情報、撮像手段から得られた画像撮像時のゲイン情報等により、画像のノイズレベルを知ることができる場合には、ノイズレベルが大きいほど前記所定のレベルを高く設定し、ノイズレベルが小さいほど前記所定のレベルを小さく設定するとよい。
「注目画素を代表とする所定の大きさの局所領域」とは、例えば、図16に示すような、注目画素xを略中心、略重心または略中央とする第1の領域Z1や、これら第1の領域Z1の画素値の分布に応じて設定される、第1の領域内の部分的な領域である第2の領域Z2を意味するものである。この第2の領域Z2としては、例えば、図17に示すように、第1の領域Z1内の画素値のヒストグラムの形状が複数の山を有する形状である場合に、それらの山のうち注目画素xの画素値Xが含まれる山に対応する画素からなる領域とすることができる。すなわち、第1の領域Z1から、注目画素xの画素値Xが含まれない山に対応する画素からなる領域Zaを取り除いた領域を第2の領域Z2とすることができる。このような領域の設定は、第1の領域Z1が明らかに画像濃度の異なる領域にまたがって存する場合に、その濃度変化の境界による悪影響を避けるため、所定の領域内の画像に対してのみ画素値の演算をするような場合によく実施される方法である。
「画素値の統計学上の所定の代表値」とは、画素値の分布の特徴を代表するこの分布の中心的な値であり、例えば、画素値の、統計学上の平均値、中央値、中間値、最頻値等とすることができる。
「局所領域」は、便宜上、矩形領域であることが好ましいが、真円、楕円等の形状であってもよい。
本発明においては、学習に用いる顔画像として、少なくとも前記学習用顔画像を用いていればよく、もちろん、学習に用いる画像として、前記学習用顔画像に加え学習用非顔画像を用いても構わない。
「学習用顔画像」とは、顔を表す画像であることが分かっている学習に用いるサンプル画像をいい、「学習用非顔画像」とは顔を表す画像でないことが分かっている学習に用いるサンプル画像をいう。
「顔の天地方向が揃った」とは、顔の天地方向が完全に一致した状態に限定されるわけではなく、画像平面上での所定角度範囲、例えば±15度の回転は許容するものとする。
「弱判別器」とは、正答率が50%を超える判別手段(モジュール)であり、「複数の弱判別器を線形に結合した構造」とは、このような弱判別器を直列に接続し、弱判別器において、対象画像が顔画像であると判別されたときに次の弱判別器に進み、非顔画像であると判別されたときに判別処理を離脱するように構成された構造のことをいう。最後の弱判別器において顔画像であると判別された対象画像が、最終的に、顔画像であると判別される。
本発明の顔判別方法および装置並びにそのためのプログラムによれば、顔判別対象画像に対する正規化処理において、正規化処理を一律に施すのではなく、この画像について、輝度を表す画素値の分散の程度が所定レベル以上の局所領域に対しては、その分散を一定レベルに近づける輝度階調変換処理を施し、所定レベル未満の局所領域に対しては、その分散の程度を上記一定レベルより低いレベルに抑える輝度階調変換処理を施すか、もしくは輝度階調変換処理を施さないようにしているので、画素値の分散が所定レベルを下回ると考えられる、顔の額や頬、背景の空といったもともとコントラストが平坦な領域において、画素値の分散が不必要に上昇し輝度がばらつくことを防ぎ、顔判別処理にとってのノイズ成分を抑えることができ、顔判別の精度の低下を抑制することが可能となる。
以下、本発明の実施形態について説明する。図1は本発明の顔判別装置が適用された顔検出システムの構成を示す概略ブロック図である。この顔検出システムは、デジタル画像中に含まれる顔を、顔の位置、大きさ、向き、回転方向によらずに検出するものである。図1に示すように、顔検出システム1は、顔を検出する対象となる入力画像S0を多重解像度化して解像度の異なる複数の画像(以下、解像度画像という)S1_i(i=1,2,3・・・)を得る多重解像度化部10と、後に実行される顔検出処理の精度向上を目的とした前処理として、解像度画像S1_iの各々に対して、画像全体にわたって局所的な領域におけるコントラストのばらつきを抑制する正規化(以下、局所正規化という)を施し、局所正規化済みの解像度画像S1′_iを得る局所正規化部(正規化手段)20と、局所正規化済みの解像度画像S1′_iの各々に対してラフな顔検出処理を施すことにより顔候補S2を抽出する第1の顔検出部30と、各顔候補を含む所定の近傍領域内の画像に対して高精度な顔検出処理を施すことにより顔候補S2をさらに絞り込み、真の顔と思われる顔S3を得る第2の顔検出部40と、各解像度画像上で検出された顔S3の各々について、同一の顔が重複して検出されたものであるか否かをその位置関係から判定して整理し、重複検出のない顔S3′を得る重複検出判定部50とを備える。
多重解像度化部10は、入力画像S0の解像度(画像サイズ)を変換することにより、その解像度を所定の解像度、例えば、短辺が416画素の矩形サイズの画像に規格化し、規格化済みの入力画像S1を得る。そして、この画像S1を基本画像としてさらに解像度変換を行うことにより、解像度の異なる複数の解像度画像S1_iを生成する。このような複数の解像度画像を生成する理由は、通常、入力画像に含まれる顔の大きさは不明であるが、一方、検出しようとする顔の大きさ(画像サイズ)は、後述の判別器の構造と関連して一定にする必要があるため、解像度の異なる画像上で所定サイズの部分画像をそれぞれ切り出し、その部分画像が顔か非顔かを判別してゆく必要があるためである。具体的には、図2に示すように、画像S1を基本画像S1_1として、画像S1_1に対して2の−1/3乗倍の画像S1_2と、画像S1_2に対して2の−1/3乗倍(基本画像S1_1に対しては2の−2/3乗倍)の画像S1_3とを先に生成し、その後、画像S1_1,S1_2,S1_3のそれぞれに対して、1/2倍サイズの縮小画像を生成し、それらの縮小画像に対してさらに1/2倍サイズの縮小画像を生成する・・・といった処理を繰り返し行い、複数の縮小画像を所定の数だけ生成するようにする。このようにすることで、輝度を表す画素値の補間処理を必要としない1/2倍の縮小処理を主に、基本画像から2の−1/3乗倍ずつ解像度が縮小された複数の画像が高速に生成できる。例えば、画像S1_1が短辺416画素の矩形サイズである場合、画像S1_2,S1_3,・・・は、短辺がそれぞれ、330画素,262画素,208画素,165画素,131画素,104画素,82画素,65画素,・・・の矩形サイズとなり、2の−1/3乗倍ずつ縮小された複数の解像度画像を生成することができる。なお、このように画素値を補間しないで生成される画像は、画像パターンの特徴をそのまま担持する傾向が強いので、顔検出処理において精度向上が期待できる点で好ましい。
局所正規化部20は、解像度画像S1_iの各々に対して、解像度画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑える第2の輝度階調変換処理を施すものであるが、ここで、局所正規化部20における具体的な処理について説明する。
図12は局所正規化処理の概念を示した図であり、図13は局所正規化部20における処理フロー示す図である。また、式(1),(2)は、この局所正規化処理のための画素値の階調変換の式である。
Figure 0004749880
ここで、Xは注目画素の画素値、X′は注目画素の変換後の画素値、mlocalは注目画素を中心とする局所領域における画素値の平均、Vlocalはこの局所領域における画素値の分散、SDlocalはこの局所領域における画素値の標準偏差、(C1×C1)は上記一定レベルに対応する基準値、C2は上記所定レベルに対応する閾値、SDcは所定の定数である。なお、本実施形態において、輝度の階調数は8bitとし、画素値の取り得る値は0から255とする。
局所正規化部20は、図13に示すように、解像度画像における1つの画素を注目画素として設定し(ステップS21)、この注目画素を中心とする所定の大きさ、例えば11×11画素サイズの局所領域における画素値の分散Vlocalを算出し(ステップS22)、分散Vlocalが上記所定のレベルに対応する閾値C2以上であるか否かを判定する(ステップS23)。ステップS23において、分散Vlocalが閾値C2以上であると判定された場合には、上記第1の輝度階調変換処理として、分散Vlocalが上記一定のレベルに対応する基準値(C1×C1)より大きいほど、注目画素の画素値Xと平均mlocalとの差を小さくし、分散mlocalが基準値(C1×C1)より小さいほど、注目画素の画素値Xと平均mlocalとの差を大きくする階調変換を式(1)にしたがって行う(ステップS24)。一方、ステップS23において、分散Vlocalが閾値C2未満であると判定された場合には、上記第2の輝度階調変換処理として、分散Vlocalに依らない線形な階調変換を式(2)にしたがって行う(ステップS25)。そして、ステップS21で設定した注目画素が最後の画素であるか否かを判定する(ステップS26)。ステップS26において、その注目画素が最後の画素でないと判定された場合には、ステップS21に戻り、同じ解像度画像上の次の画素を注目画素として設定する。一方、ステップS26において、その注目画素が最後の画素であると判定された場合には、その解像度画像に対する局所正規化を終了する。このように、上記ステップS21からS26の処理を繰り返すことにより、解像度画像全体に局所正規化が施された解像度画像が得られる。この一連の処理を各解像度画像に対して行うことにより、局所正規化済みの解像度画像S1′_iを得る。
なお、上記の所定レベルは、局所領域における全体または一部の輝度に応じて変化させるようにしてもよい。例えば、上記の、注目画素毎に階調変換を行う正規化処理において、閾値C2を注目画素の画素値に応じて変化させるようにしてもよい。すなわち、上記の所定レベルに対応する閾値C2を、注目画素の輝度が相対的に高いときにはより高く設定し、その輝度が相対的に低いときにはより低く設定するようにしてもよい。このようにすることで、輝度の低い、いわゆる暗い領域に低いコントラスト(画素値の分散が小さい状態)で存在している顔も正しく正規化することができる。
また、ここでは、解像度画像に対して局所正規化のみを施した場合について説明しているが、局所正規化とは別の正規化を同時に行うようにしてもよい。例えば、輝度の低い、いわゆる暗い領域のコントラストを高くする(画素値の分散を大きくすることに相当する)ように設定されたルックアップテーブル(LUT)等を用いて階調変換をしてから、上記局所正規化を行なうようにしてもよい。このようにすることで、上述のような、閾値C2を注目画素の画素値に応じて変化させるのと同じ効果が得られ、暗い領域に低いコントラストで存在している顔も正しく正規化することができる。
第1の顔検出部30は、局所正規化部20により局所正規化処理がなされた各解像度画像S1′_iに対して比較的粗く高速な顔検出処理を施し、各解像度画像S1′_iから顔候補S2を暫定的に抽出するものである。図3は、この第1の顔検出部30の構成を示すブロック図である。第1の顔検出部30は、図3に示すように、各解像度画像について、顔画像であるか否かの判別対象となる部分画像(判別対象画像)を切り出すサブウィンドウWを順次設定する第1のサブウィンドウ設定部31と、部分画像が主に正面顔の画像であるか否かを判別する第1の正面顔判別器(顔判別手段)33と、この部分画像が主に左横顔の画像であるか否かを判別する第1の左横顔判別器(顔判別手段)34と、この部分画像が主に右横顔の画像であるか否かを判別する第1の右横顔判別器(顔判別手段)35とから構成されており、各判別器33から35は、それぞれ、複数の弱判別器WCi(i=1からN)が線形に結合してカスケード構造を有している。
第1のサブウィンドウ設定部31は、すべての解像度画像S1′_iの各々について、解像度画像をその平面上で360度回転させつつ、解像度画像上において32×32画素サイズの部分画像を切り出すサブウィンドウWを、所定画素数分、例えば5画素ずつ移動させながら順次設定し、その切り出された部分画像を第1の正面顔判別器33、第1の左横顔判別器34および第1の右横顔判別器35にそれぞれ出力する。
上記各判別器33から35は、それぞれ、順次入力されてくる部分画像に対し、この部分画像が正面顔、左横顔または右横顔を表す顔画像であるか否かの判別を行い、各解像度画像S1′_iにおいて、平面上のあらゆる回転角度にある正面顔、左横顔、および右横顔を検出し、顔候補S2を出力する。なお、斜め向きの顔の検出精度を上げるため、右斜め顔、左斜め顔をそれぞれ判別する判別器をさらに設けるようにしてもよいが、ここでは特に設けないものとする。
上記各判別器33から35は、部分画像の輝度分布に係る少なくとも1つの特徴量を算出し、この特徴量を用いてこの部分画像が顔画像であるか否かを判別するものであるが、ここで、これら各判別器33から35における具体的な処理について説明する。図5は、各判別器における大局的な処理フローを示したものであり、図6は、その中の各弱判別器による処理フローを示したものである。
まず、最初の弱判別器WC1が、解像度画像S1′_i上で切り出された所定サイズの部分画像に対してこの部分画像が顔であるか否かを判別する(ステップSS1)。具体的には、弱判別器WC1は、図7に示すように、解像度画像S1′_i上で切り出された所定サイズの部分画像、すなわち、32×32画素サイズの画像に対して、4近傍画素平均(画像を2×2画素サイズ毎に複数のブロックに区分し、各ブロックの4画素における画素値の平均値をそのブロックに対応する1つの画素の画素値とする処理)を行うことにより、16×16画素サイズの画像と、8×8画素サイズの縮小した画像を得、これら3つの画像の平面内に設定される所定の2点を1ペアとして、複数種類のペアからなる1つのペア群を構成する各ペアにおける2点間の輝度の差分値をそれぞれ計算し、これらの差分値の組合せを特徴量とする(ステップSS1−1)。各ペアの所定の2点は、例えば、画像上の顔の濃淡の特徴が反映されるよう決められた縦方向に並んだ所定の2点や、横方向に並んだ所定の2点とする。そして、特徴量である差分値の組合せに応じて所定のスコアテーブルを参照してスコアを算出し(ステップSS1−2)、直前の弱判別器が算出したスコアに自己の算出したスコアを加算して累積スコアを算出するが(ステップSS1−3)、最初の弱判別器WC1では、直前の弱判別器がないので、自己の算出したスコアをそのまま累積スコアとする。この累積スコアが所定の閾値以上であるか否かによって部分画像が顔であるか否かを判別する(ステップSS1−4)。ここで、上記部分画像が顔と判別されたときには、次の弱判別器WC2による判別に移行し(ステップSS2)、部分画像が非顔と判別されたときには、部分画像は、即、非顔と断定され(ステップSSB)、処理が終了する。
ステップSS2においても、ステップSS1と同様に、弱判別器WC2が部分画像に基づいて画像上の特徴を表す上記のような特徴量を算出し(ステップSS2−1)、スコアテーブルを参照して特徴量からスコアを算出する(ステップSS2−2)。そして、自ら算出したスコアを前の弱判別器WC1が算出した累積スコアに加算して累積スコアを更新し(ステップSS2−3)、この累積スコアが所定の閾値以上であるか否かによって部分画像が顔であるか否かを判別する(ステップSS2−4)。ここでも、部分画像が顔と判別されたときには、次の弱判別器WC3による判別に移行し(ステップSS3)、部分画像が非顔と判別されたときには、部分画像は、即、非顔と断定され(ステップSSB)、処理が終了する。このようにして、N個すべての弱判別器において部分画像が顔であると判別されたときには、その部分画像を最終的に顔候補として抽出する(ステップSSA)。
判別器33から35は、それぞれ、独自の、特徴量の種類、スコアテーブル、および閾値によって定められた複数の弱判別器からなる判別器であり、それぞれの判別すべき顔の向き、すなわち、正面顔、左横顔、右横顔にある顔を判別する。
第2の顔検出部40は、全解像度画像のうち、顔候補S2の各々がそれぞれ含まれる所定領域内の各画像に対して比較的精度の高い顔検出処理を施し、顔候補近傍の画像から真の顔S3を検出するものである。この第2の顔検出部40は、基本的には、第1の顔検出部30と同様の構成であり、図4に示すように、第2のサブウィンドウ設定部41と、第2の正面顔判別器43と、第2の左横顔検出部44と、第2の右横顔検出部45とから構成されており、各判別器43から45は、それぞれ、複数の弱判別器WCi(i=1からN)が線形に結合してカスケード構造を有する。ただし、これらの判別器は、第1の顔検出部30における判別器より判別精度の高いものが好ましい。この第2の顔検出部40においては、判別器における大局的な処理フロー、および弱判別器による処理フローも基本的には第1の顔検出部30と同様であるが、サブウィンドウWを設定する位置は、第1の顔検出部30によって抽出された顔候補S2を含む所定領域内の画像に限定され、また、サブウィンドウWの移動幅は、第1の顔検出部30の場合より細かく、例えば、1画素ずつとなる。これにより、第1の顔検出部30でラフに抽出された顔候補S2がさらに絞り込まれ、真の顔S3だけが出力されることになる。
重複検出判定部50は、第2の顔検出部40によって検出された各解像度画像S1′_i上の顔S3の位置情報に基づいて、各解像度画像上で検出された顔のうち重複して検出された同一の顔を1つの顔としてまとめる処理を行い、入力画像S0において検出された顔S3′の位置情報を出力する。判別器は、学習方法にもよるが、一般的に部分画像のサイズに対して検出できる顔の大きさにはある程度幅があるので、解像度レベルが隣接する複数の解像度画像において、同一の顔が重複して検出される場合があるからである。
図9は、上記顔検出システムにおける処理の流れを示したフローチャートである。図9に示すように、多重解像度化部10に入力画像S0が供給されると(ステップS1)、この入力画像S0の画像サイズが所定のサイズに変換された画像S1が生成され、画像S1から2の−1/3乗倍ずつ解像度が縮小された複数の解像度画像S1_iが生成される(ステップS2)。そして、局所正規化部20において、各解像度画像S1_iの画像全体に局所的な領域におけるコントラストのばらつきを抑制する局所正規化処理、すなわち、画素値の分散が所定の閾値以上の領域に対してはその分散をある一定レベルに近づける輝度階調変換をし、画素値の分散がその所定の閾値を下回る領域に対してはその分散を上記一定レベルより低いレベルに抑える輝度階調変換をする局所的な正規化が施され、局所正規化済みの解像度画像S1′_iが得られる(ステップS3)。第1の顔検出部30は、第1のサブウィンドウ設定部31により、局所正規化済みの各解像度画像S1′_iにおいて、サブウィンドウWの設定により所定サイズの部分画像を順次切り出すとともに(ステップS4)、正面顔、右横顔および左横顔の判別器33から35を用いて、これら部分画像の各々に対して顔判別を行い、各解像度画像S1′_iについての顔候補S2をラフに検出する(ステップS5)。さらに、第2の顔検出部40は、ステップS5で抽出された顔候補S2の近傍画像に対して、第1の顔検出部30と同様に、サブウィンドウWの設定による部分画像の切り出し(ステップS6)、正面顔、右横顔、および左横顔の判別器43から45を用いて精査に相当する顔検出を行い、真の顔S3に絞り込む(ステップS7)。そして、各解像度画像S1′_iにおいて重複して検出された同一の顔を判定(ステップS8)し、これらをそれぞれ1つにまとめて最終的に検出された顔S3′とする。
次に、判別器の学習方法について説明する。図10は、この判別器の学習方法を示すフローチャートである。なお、学習は、判別器の種類、すなわち、判別すべき顔の向き毎に行われる。
学習の対象となるサンプル画像群は、所定のサイズ、例えば32×32画素サイズで規格化された、顔であることが分かっている複数のサンプル画像と、顔でないことが分かっている複数のサンプル画像とからなる。顔であることが分かっているサンプル画像としては、顔の向きが判別器の判別すべき顔の向きと同一であって顔の天地方向が揃ったものを用いる。顔であることが分かっているサンプル画像は、1つのサンプル画像につき、縦および/または横を0.7倍から1.2倍の範囲にて0.1倍単位で段階的に拡縮して得られる各サンプル画像に対し、平面上±15度の範囲にて3度単位で段階的に回転させて得られる複数の変形バリエーションを用いる。なおこのとき、顔のサンプル画像は、目の位置が所定の位置に来るように顔のサイズと位置を規格化し、上記の平面上の回転、拡縮は目の位置を基準として行うようにする。例えば、d×dサイズの正面顔のサンプル画像の場合においては、図14に示すように、両目の位置が、サンプル画像の最左上の頂点と最右上の頂点から、それぞれ、内側に1/4d、下側に1/4d移動した各位置とに来るように顔のサイズと位置を規格化し、また、上記の平面上の回転、拡縮は、両目の中間点を中心に行うようにする。各サンプル画像には、重みすなわち重要度が割り当てられる。まず、すべてのサンプル画像の重みの初期値が等しく1に設定される(ステップS11)。
次に、サンプル画像およびその縮小画像の平面内に設定される所定の2点を1ペアとして複数のペアからなるペア群を複数種類設定したときの、この複数種類のペア群のそれぞれについて弱半別器が作成される(ステップS12)。ここで、それぞれの弱判別器とは、サブウィンドウWで切り出された部分画像とその縮小画像の平面内に設定される所定の2点を1ペアとして複数のペアからなる1つのペア群を設定したときの、この1つのペア群を構成する各ペアにおける2点間の画素値(輝度)の差分値の組合せを用いて、顔の画像と顔でない画像とを判別する基準を提供するものである。本実施形態においては、1つのペア群を構成する各ペアにおける2点間の画素値の差分値の組合せについてのヒストグラムを弱判別器のスコアテーブルの基礎として使用する。
図11を参照しながらある判別器の作成について説明する。図11の左側のサンプル画像に示すように、この判別器を作成するためのペア群を構成する各ペアの2点は、顔であることが分かっている複数のサンプル画像において、サンプル画像上の右目の中心にある点をP1、右側の頬の部分にある点をP2、眉間の部分にある点をP3、サンプル画像を4近傍画素平均で縮小した16×16画素サイズの縮小画像上の右目の中心にある点をP4、右側の頬の部分にある点をP5、さらに4近傍画素平均で縮小した8×8画素サイズの縮小画像上の額の部分にある点をP6、口の部分にある点をP7として、P1−P2、P1−P3、P4−P5、P4−P6、P6−P7の5ペアである。なお、ある判別器を作成するための1つのペア群を構成する各ペアの2点の座標位置はすべてのサンプル画像において同一である。そして顔であることが分かっているすべてのサンプル画像について上記5ペアを構成する各ペアの2点間の画素値の差分値の組合せが求められ、そのヒストグラムが作成される。ここで、画素値の差分値の組合せとしてとり得る値は、画像の輝度階調数に依存するが、仮に16ビット階調である場合には、1つの画素値の差分値につき65536通りあり、全体では階調数の(ペア数)乗、すなわち65536の5乗通りとなってしまい、学習および検出のために多大なサンプルの数、時間およびメモリを要することとなる。このため、本実施形態においては、画素値の差分値を適当な数値幅で区切って量子化し、n値化する(例えばn=100)。
これにより、画素値の差分値の組合せの数はnの5乗通りとなるため、画素値の差分値の組合せを表すデータ数を低減できる。
同様に、顔でないことが分かっている複数のサンプル画像についても、ヒストグラムが作成される。なお、顔でないことが分かっているサンプル画像については、顔であることが分かっているサンプル画像上における上記各ペアの所定の2点の位置に対応する位置(同様に参照符号P1からP7を用いる)が用いられる。これらの2つのヒストグラムが示す頻度値の比の対数値を取ってヒストグラムで表したものが、図11の一番右側に示す、弱判別器のスコアテーブルの基礎として用いられるヒストグラムである。この弱判別器のヒストグラムが示す各縦軸の値を、以下、判別ポイントと称する。この弱判別器によれば、正の判別ポイントに対応する、画素値の差分値の組合せの分布を示す画像は顔である可能性が高く、判別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の判別ポイントに対応する画素値の差分値の組合せの分布を示す画像は顔でない可能性が高く、やはり判別ポイントの絶対値が大きいほどその可能性は高まる。ステップS12では、判別に使用され得る複数種類のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せについて、上記のヒストグラム形式の複数の弱判別器が作成される。
続いて、ステップS12で作成した複数の弱半別器のうち、画像が顔であるか否かを判別するのに最も有効な弱判別器が選択される。最も有効な弱判別器の選択は、各サンプル画像の重みを考慮して行われる。この例では、各弱判別器の重み付き正答率が比較され、最も高い重み付き正答率を示す弱判別器が選択される(ステップS13)。すなわち、最初のステップS13では、各サンプル画像の重みは等しく1であるので、単純にその弱判別器によって画像が顔であるか否かが正しく判別されるサンプル画像の数が最も多いものが、最も有効な弱判別器として選択される。一方、後述するステップS15において各サンプル画像の重みが更新された後の2回目のステップS13では、重みが1のサンプル画像、重みが1よりも大きいサンプル画像、および重みが1よりも小さいサンプル画像が混在しており、重みが1よりも大きいサンプル画像は、正答率の評価において、重みが1のサンプル画像よりも重みが大きい分多くカウントされる。これにより、2回目以降のステップS13では、重みが小さいサンプル画像よりも、重みが大きいサンプル画像が正しく判別されることに、より重点が置かれる。
次に、それまでに選択した弱判別器の組合せの正答率、すなわち、それまでに選択した弱判別器を組み合わせて使用して(学習段階では、弱判別器は必ずしも線形に結合させる必要はない)各サンプル画像が顔の画像であるか否かを判別した結果が、実際に顔の画像であるか否かの答えと一致する率が、所定の閾値を超えたか否かが確かめられる(ステップS14)。ここで、弱判別器の組合せの正答率の評価に用いられるのは、現在の重みが付けられたサンプル画像群でも、重みが等しくされたサンプル画像群でもよい。所定の閾値を超えた場合は、それまでに選択した弱判別器を用いれば画像が顔であるか否かを十分に高い確率で判別できるため、学習は終了する。所定の閾値以下である場合は、それまでに選択した弱判別器と組み合わせて用いるための追加の弱判別器を選択するために、ステップS16へと進む。
ステップS16では、直近のステップS13で選択された弱判別器が再び選択されないようにするため、その弱判別器が除外される。
次に、直近のステップS13で選択された弱判別器では顔であるか否かを正しく判別できなかったサンプル画像の重みが大きくされ、画像が顔であるか否かを正しく判別できたサンプル画像の重みが小さくされる(ステップS15)。このように重みを大小させる理由は、次の弱判別器の選択において、既に選択された弱判別器では正しく判別できなかった画像を重要視し、それらの画像が顔であるか否かを正しく判別できる弱判別器が選択されるようにして、弱判別器の組合せの効果を高めるためである。
続いて、ステップS13へと戻り、上記したように重み付き正答率を基準にして次に有効な弱判別器が選択される。
以上のステップS13からS16を繰り返して、顔であるか否かを判別するのに適した弱判別器として、特定のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せに対応する弱判別器が選択されたところで、ステップS14で確認される正答率が閾値を超えたとすると、顔であるか否かの判別に用いる弱判別器の種類と判別条件とが確定され(ステップS17)、これにより学習を終了する。なお、選択された弱判別器は、その重み付き正答率が高い順に線形結合され、1つの判別器が構成される。また、各弱判別器については、それぞれ得られたヒストグラムを基に、画素値の差分値の組合せに応じてスコアを算出するためのスコアテーブルが生成される。なお、ヒストグラム自身をスコアテーブルとして用いることもでき、この場合、ヒストグラムの判別ポイントがそのままスコアとなる。
なお、上記の学習手法を採用する場合において、弱判別器は、特定のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せを用いて顔の画像と顔でない画像とを判別する基準を提供するものであれば、上記のヒストグラムの形式のものに限られずいかなるものであってもよく、例えば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図11の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
また、学習の方法としては上記手法に限定されるものではなく、ニューラルネットワーク等他のマシンラーニングの手法を用いることができる。
ここで、上記の局所正規化部20による局所正規化処理における局所領域の最適な大きさについて考えてみることにする。
この局所正規化処理は、上述の通り、サブウィンドウWで切り出された部分画像において局所的なコントラストのばらつきを抑制する処理であり、具体的には、部分画像における各画素を注目画素として順次設定するとともに、その注目画素毎に、この注目画素を中心とする所定の大きさの局所領域における輝度を表す画素値の分散を算出し、この分散が所定の基準値より大きいほど注目画素の画素値とその局所領域における画素値の平均値(他の統計学上の代表値でもよい)との差を小さくし、この分散が上記基準値より小さいほど注目画素の画素値とその局所領域における画素値の平均値との差を大きくする階調変換を行う正規化処理である。
このような局所正規化処理においては、この局所領域のサイズによってコントラストのばらつきをどの程度局所的に抑制するかが決まるわけであるが、一般的には、局所領域のサイズが大きいほど、輝度のばらつきを抑えることができる一方細かいコントラストの変動を抑制し難くなり、局所領域のサイズが小さいほど、細かいコントラストの変動を抑制しやすくなる一方輝度がばらつく傾向にある。また、その局所領域内に顔を構成する複数種類の部位の全部または一部が同時に入り込むような場合、例えば、その局所領域内に目を中心として鼻の一部等が入り込むような場合には、上記画素値の分散がその鼻の部分の画素値やその鼻の部分が局所領域に対して占める割合等に敏感に反応し、その中心に位置する目の部分の画素値が不自然にばらつく場合があるが、このように顔を構成する所定の部位における画素値が不自然にばらつくと、その判別対象画像上の輝度分布に係る特徴量について顔画像らしさが適正に反映されず、判別精度が低下するという問題がある。
したがって、上記の局所正規化処理の特性や問題点を考慮すると、上記局所領域の適切なサイズは、この局所正規化処理が顔判別処理の前処理であることに照らして、抑制可能なコントラストの変動の程度と輝度のばらつく程度とのバランスがよく、かつ、顔を構成する各部位間の距離に鑑みて顔を構成する複数種類の部位が同時に入り込まない程度の大きさということになる。このような要件を満足する局所領域としては、例えば、図15に示すような、顔の特徴を表す顔の構成部位の中で最も小さい「目」を基準として経験的に他の部位が入り込まない程度の大きさである、判別器が判別すべき顔の目が1つのみ含まれる大きさの領域とすることができる。なお、判別器が判別すべき顔の目の大きさは、その学習に用いた顔を表すサンプル画像における顔の目の大きさが基準となることから、この局所領域は、この領域の長手方向の幅を、判別器の学習に用いた顔を表すサンプル画像における目の長手方向の幅の平均値の1.1から1.8倍の間の長さとする領域とすることもできる。本実施形態における局所正規化部20による局所正規化処理における局所領域のサイズ、すなわち11×11画素サイズは、上記のような観点から設定されたサイズの一例である。
このように、本実施形態による顔判別方法および装置によれば、顔判別対象画像に対する正規化処理において、正規化処理を一律に施すのではなく、この画像について、輝度を表す画素値の分散の程度が所定レベル以上の領域に対しては、その分散を一定レベルに近づける輝度階調変換処理を施し、所定レベルを下回る領域に対しては、その分散の程度を上記一定レベルより低いレベルに抑える輝度階調変換処理を施すか、もしくは輝度階調変換処理を施さないようにしているので、画素値の分散が所定レベルを下回ると考えられる、顔の額や頬、背景の空といったもともとコントラストが平坦な領域において、画素値の分散が不必要に上昇し輝度がばらつくことを防ぎ、顔判別処理にとってのノイズ成分を抑えることができ、顔判別の精度の低下を抑制することが可能となる。
また、上記のように判別器が複数の弱判別器の線形結合として構成されているような場合では、従来のように判別対象画像に対して正規化処理を一律に施すと、判別対象画像上のもともとコントラストが平坦な領域において、画素値の分散を無理やり上昇させ輝度を不必要にばらつかせることとなり、これにより、判別器にとっての顔らしい非顔領域が多数発生し、複数の弱判別器による判別のうち初期の判別段階で非顔画像が非顔と判断され難くなり、余計な判別処理がかさむ結果となる。一方、本実施形態によれば、そのような平坦な領域に対して画素値の分散を無理やり上昇させるようなことがないので、コントラストが平坦な領域ではその平坦さが維持され、非顔画像を初期の判別段階で非顔と判別されやすくなり、計算時間の増大を抑制する効果がある。
なお、本実施形態では、画素値の分散の程度が所定レベルを下回る領域に対してその分散の程度を低く抑える輝度階調変換処理を施しているが、別の手法として、例えば、このような領域に対しては輝度階調変換処理を全く施さないようにすることも考えられる。
以上、本発明の実施形態に係る顔判別方法および装置について説明したが、上記顔判別装置(局所正規化部と判別器)における各処理をコンピュータに実行させるためのプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
顔検出システム1の構成を示すブロック図 検出対象画像の多重解像度化の工程を示す図 第1の顔検出部30の構成を示すブロック図 第2の顔検出部40の構成を示すブロック図 判別器における大局的な処理フローを示す図 弱判別器における処理フローを示す図 弱判別器における特徴量の算出を説明するための図 複数の解像度画像での解像度画像の回転とサブウィンドウの移動を説明するための図 顔検出システム1において行われる処理を示すフローチャート 判別器の学習方法を示すフローチャート 弱判別器のヒストグラムを導出する方法を示す図 局所正規化処理の概念を示す図 局所正規化部における処理フローを示す図 目の位置が所定の位置にくるように規格化された顔のサンプル画像を示す図 目の大きさを基準にした適切なサイズの局所領域の例を示す図 注目画素を代表とする局所領域の例を示す図 画素値の分布に基づいて設定される、注目画素を代表とする局所領域の例を示す図
符号の説明
1 顔検出システム
10 多重解像度化部
20 局所正規化部(正規化手段)
30 第1の顔検出部
31 第1のサブウィンドウ設定部
33 第1の正面顔判別器(顔判別手段)
34 第1の左横顔判別器(顔判別手段)
35 第1の右横顔判別器(顔判別手段)
40 第2の顔検出部
41 第2のサブウィンドウ設定部
43 第2の正面顔判別器(顔判別手段)
44 第2の左横顔判別器(顔判別手段)
45 第2の右横顔判別器(顔判別手段)
50 重複検出判定部

Claims (10)

  1. 顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化ステップと、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別ステップとを有する顔判別方法において、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑えるように画素値を変換する第2の輝度階調変換処理を施す処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とする顔判別方法。
  2. 顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化ステップと、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別ステップとを有する顔判別方法において、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、他の局所領域に対しては輝度階調変換処理を施さない処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とする顔判別方法。
  3. 顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段とを備えた顔判別装置において、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑えるように画素値を変換する第2の輝度階調変換処理を施す処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とする顔判別装置。
  4. 顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段とを備えた顔判別装置において、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、他の局所領域に対しては輝度階調変換処理を施さない処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とする顔判別装置。
  5. 前記正規化処理が、前記判別対象画像における各画素を注目画素として順次設定するとともに、前記注目画素毎に、該注目画素を代表とする所定の大きさの局所領域における画素値の分散を算出し、少なくとも該分散が前記所定のレベルに対応する閾値以上のときに、前記第1の輝度階調変換処理として、該分散が前記一定レベルに対応する基準値より大きいほど、前記注目画素の画素値と該注目画素を代表とする前記局所領域における画素値の統計学上の所定の代表値との差を小さくし、該分散が前記基準値より小さいほど、前記注目画素の画素値と前記所定の代表値との差を大きくする階調変換を行う処理であることを特徴とする請求項3または4記載の顔判別装置。
  6. 前記閾値が、前記注目画素の画素値に応じて変化するものであることを特徴とする請求項5記載の顔判別装置。
  7. 前記顔判別手段が、前記判別対象画像が顔画像であるか否かを判別する互いに異なる複数の弱判別器を、該弱判別器の信頼度が高い順に線形に結合してなる構造を有するものであることを特徴とする請求項3から6いずれか記載の顔判別装置。
  8. 前記顔判別手段が、顔の向きが判別すべき顔の向きと同一であって顔の天地方向が揃った互いに異なる複数の学習用顔画像を用いた学習により、判別に用いる前記弱判別器の種類および前記弱判別器を結合する順番が決められたものであることを特徴とする請求項7記載の顔判別装置。
  9. コンピュータを、
    顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段として機能させるためのプログラムにおいて、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、前記画素値の分散の程度が前記所定レベル未満である局所領域に対して、該分散の程度を前記一定レベルより低いレベルに抑えるように画素値を変換する第2の輝度階調変換処理を施す処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とするプログラム。
  10. コンピュータを、
    顔画像であるか否かを判別する対象となる判別対象画像に対して、該画像におけるコントラストのばらつきを抑制する正規化処理を施す正規化手段と、
    前記正規化処理が施された判別対象画像の輝度分布に係る少なくとも1つの特徴量を算出し、該特徴量を用いて前記判別対象画像が顔画像であるか否かを判別する顔判別手段として機能させるためのプログラムにおいて、
    前記正規化処理が、前記判別対象画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対してのみ、該分散の程度を前記所定レベルより高い一定レベルに近づけるように画素値を変換する第1の輝度階調変換処理を施し、他の局所領域に対しては輝度階調変換処理を施さない処理であり、
    前記所定レベルとは、輝度を表す画素値の分散の程度が低くコントラストが平坦である画像と他の画像とを区別する境界に相当する値であることを特徴とするプログラム。
JP2006029177A 2005-03-31 2006-02-07 顔判別方法および装置並びにプログラム Active JP4749880B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006029177A JP4749880B2 (ja) 2005-03-31 2006-02-07 顔判別方法および装置並びにプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005103779 2005-03-31
JP2005103779 2005-03-31
JP2006029177A JP4749880B2 (ja) 2005-03-31 2006-02-07 顔判別方法および装置並びにプログラム

Publications (2)

Publication Number Publication Date
JP2006309715A JP2006309715A (ja) 2006-11-09
JP4749880B2 true JP4749880B2 (ja) 2011-08-17

Family

ID=37476484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006029177A Active JP4749880B2 (ja) 2005-03-31 2006-02-07 顔判別方法および装置並びにプログラム

Country Status (1)

Country Link
JP (1) JP4749880B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3912145B2 (ja) * 2002-03-11 2007-05-09 三菱電機株式会社 コントラスト強調装置、およびこの装置を備えた撮像機

Also Published As

Publication number Publication date
JP2006309715A (ja) 2006-11-09

Similar Documents

Publication Publication Date Title
JP4744918B2 (ja) 顔検出方法および装置並びにプログラム
JP4657934B2 (ja) 顔検出方法および装置並びにプログラム
JP4628882B2 (ja) 判別器の学習方法、顔判別方法および装置並びにプログラム
JP4708909B2 (ja) デジタル画像の対象物検出方法および装置並びにプログラム
JP4619927B2 (ja) 顔検出方法および装置並びにプログラム
JP4640825B2 (ja) 特定向き顔判定方法および装置並びにプログラム
JP4624889B2 (ja) 顔検出方法および装置並びにプログラム
JP4712563B2 (ja) 顔検出方法および装置並びにプログラム
US8605955B2 (en) Methods and apparatuses for half-face detection
US8577099B2 (en) Method, apparatus, and program for detecting facial characteristic points
US20150071547A1 (en) Automated Selection Of Keeper Images From A Burst Photo Captured Set
EP1255225A2 (en) Method for detecting eye and mouth positions in a digital image
US20050271245A1 (en) Specified object detection apparatus
US20070189609A1 (en) Method, apparatus, and program for discriminating faces
JP4757598B2 (ja) 顔検出方法および装置並びにプログラム
JP2007102401A (ja) 顔向き特定方法、顔判別方法および装置並びにプログラム
US20060222217A1 (en) Method, apparatus, and program for discriminating faces
JP4795864B2 (ja) 特徴点検出装置および方法並びにプログラム
JP4749879B2 (ja) 顔判別方法および装置並びにプログラム
JP2011170890A (ja) 顔検出方法および装置並びにプログラム
JP4749884B2 (ja) 顔判別装置の学習方法、顔判別方法および装置並びにプログラム
JP4795737B2 (ja) 顔検出方法および装置並びにプログラム
JP2006244385A (ja) 顔判別装置およびプログラム並びに顔判別装置の学習方法
JP4510562B2 (ja) 円中心位置検出方法および装置並びにプログラム
JP4749880B2 (ja) 顔判別方法および装置並びにプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110518

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4749880

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250