JP4657934B2 - 顔検出方法および装置並びにプログラム - Google Patents

顔検出方法および装置並びにプログラム Download PDF

Info

Publication number
JP4657934B2
JP4657934B2 JP2006013720A JP2006013720A JP4657934B2 JP 4657934 B2 JP4657934 B2 JP 4657934B2 JP 2006013720 A JP2006013720 A JP 2006013720A JP 2006013720 A JP2006013720 A JP 2006013720A JP 4657934 B2 JP4657934 B2 JP 4657934B2
Authority
JP
Japan
Prior art keywords
face
image
inclination
orientation
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006013720A
Other languages
English (en)
Other versions
JP2007193740A (ja
Inventor
嘉郎 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2006013720A priority Critical patent/JP4657934B2/ja
Priority to US11/655,847 priority patent/US7853086B2/en
Publication of JP2007193740A publication Critical patent/JP2007193740A/ja
Application granted granted Critical
Publication of JP4657934B2 publication Critical patent/JP4657934B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Description

本発明は、デジタル画像に含まれる顔を検出する顔検出方法および装置並びにそのためのプログラムに関するものである。
従来、特に、画像補正処理、セキュリティシステム、デジタルカメラ制御等の分野において、デジタル画像に含まれる顔を検出する顔検出方法が研究されており、種々の顔検出方法が提案されている。その方法の1つとして、デジタル画像上でサブウィンドウを走査しながら、このサブウィンドウの画像が顔を含む顔画像であるか否かを、判別器を用いて順次判別することにより、このデジタル画像に含まれる顔を検出する顔検出方法が提案されている(例えば、非特許文献1,特許文献1)。
ところで、顔画像には、主に、正面を向いた正面顔を含む正面顔画像と、横を向いた横顔を含む横顔画像とがあり、それぞれ画像上の特徴が異なる。そこで、検出対象画像上でこれら正面顔画像と横顔画像とをともに検出する場合には、一般的に、正面顔画像の判別と横顔画像の判別とで別々の判別器を用いる。例えば、正面顔画像を判別するための判別器には、正面顔を表す複数の異なるサンプル画像により正面顔の特徴を学習した判別器を用い、横顔画像を判別するための判別器には、横顔を表す複数の異なるサンプル画像により横顔の特徴を学習した判別器を用いる。
「高速全方向顔検出」,Shihong LAO他,画像の認識・理解シンポジウム(MIRU2004),2004年7月,P.II-271−II-276 US2002/0102024 A1(米国特許出願公開公報)
しかしながら、上記の判別器を用いた顔検出方法において、検出対象画像上に顔の特徴に類似した非顔のパターンが存在する場合には、その非顔の画像を顔画像であると誤検出してしまう場合がある。特に、横顔は、正面顔と比べて、顔を構成する顔部品が少なく顔の面積が小さいため画像上に現れる顔としての特徴が少なく、また、顔の構造が複雑であり、さらに左向きの横顔と右向きの横顔の両方を検出する必要があることから、横顔画像の誤検出率は、正面顔画像の誤検出率に比べて高い傾向にある。
このように、画像に含まれる顔を、顔の画像上の特徴を手がかり検出しようとする場合には、少なくとも誤検出が生じる可能性があり、できるだけ誤検出を抑えて顔を検出することが望まれる。また、その誤検出率は一般的に顔の向きによって異なるため、誤検出率の高い顔の向きについても、その誤検出をより抑えることが望まれる。
本発明は、上記事情に鑑み、誤検出をより抑制することが可能な顔検出方法および装置並びにそのためのプログラムを提供することを目的とするものである。
本発明の顔検出方法は、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出ステップと、該候補が真の顔画像であるか否かを判別する判別ステップとからなる顔検出方法において、前記判別ステップが、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とするものである(第1の顔検出方法)。
本発明の顔検出方法は、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出ステップと、該候補が真の顔画像であるか否かを判別する判別ステップとからなる顔検出方法において、前記判別ステップが、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とするものである(第2の顔検出方法)。
本発明の顔検出装置は、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段とを備えた顔検出装置において、前記判別手段が、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とするものである(第1の顔検出装置)。
本発明の顔検出装置は、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段とを備えた顔検出装置において、前記判別手段が、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とするものである(第2の顔検出装置)。
本発明のプログラムは、コンピュータを、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段として機能させることにより、該コンピュータを顔検出装置として機能させるためのプログラムにおいて、前記判別手段が、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とするものである(第1のプログラム)。
本発明のプログラムは、コンピュータを、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段として機能させることにより、該コンピュータを顔検出装置として機能させるためのプログラムにおいて、前記判別手段が、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とするものである(第2のプログラム)。
本発明において、「顔の傾き」とは、いわゆるインプレーン(画像面内)方向での傾きを意味し、別の言い方をすれば、顔の画像上での回転位置を意味するものである。また、「顔の向き」とは、いわゆるアウトプレーン(画像面外)方向での向きを意味し、別の言い方をすれば、顔の左右首振り方向での向きを意味するものである。
また、「所定の傾きと略同じ傾き」とは、例えば、所定の傾きからの角度が±15度以内の角度とすることができる。
本発明において、前記評価値は、顔の向きが前記第1の向きである前記顔画像の候補の数であり、前記所定の閾値は2以上の整数であってもよい。
また、前記評価値は、顔の向きが前記第1の向きである前記顔画像の候補における前記指標値の総和であってもよい。
また、前記第1の向きと前記第2の向きは同じ向きであってもよい。この場合、前記第1および第2の向きは、複数の異なる向きを含むものであってもよい。
また、前記第1の向きは正面、前記第2の向きは横または斜め横であってもよい。
本発明において、前記指標値の算出は、顔の向きおよび傾きが所定の向きおよび傾きである顔を表す複数の異なるサンプル画像を用いたマシンラーニングの手法により、その顔の特徴を学習してなる判別器による算出であってもよい。
前記マシンラーニングの手法としては、例えば、ブースティング(Boosting)、ニューラルネットワーク等を考えることができる。
本発明の顔検出方法および装置並びにそのためのプログラムによれば、入力画像において、ある傾きの顔の候補が検出された場合に、その候補の信頼度を表す所定の評価値がある閾値を超えたときに、顔の傾きがその候補の顔の傾きと同じである別の候補に対して、真の顔として受け入れる、あるいは、真の顔として受け入れるか否かの受入れ閾値を低くする処理を行うので、同一画像上に含まれる複数の顔はほぼ同じ傾きであることが多いという事実を利用して、誤検出である可能性が低い候補を真の顔として受け入れる傾向を強めることができ、顔の誤検出をより抑制することが可能となる。
以下、本発明の実施形態について説明する。
図1は本発明の実施形態による顔検出システム1の構成を示す概略ブロック図である。この顔検出システム1は、デジタル画像において正面顔を含む正面顔画像と横顔を含む横顔画像(以下、これらの画像を単に顔画像ともいう)とを、その顔の位置や大きさ、顔の傾き(インプレーン方向での傾き)によらず検出するものである。本顔検出システム1は、特に検出精度、ロバスト性が優れているとされる顔検出の手法として、サンプル画像を用いたマシンラーニングの学習により生成された判別器モジュール(以下、単に判別器という)を用いる手法を採用したものである。この手法は、顔の傾きおよび向きが略揃った複数の異なる顔サンプル画像からなる顔サンプル画像群と、顔でないことが分かっている複数の異なる非顔サンプル画像からなる非顔サンプル画像群とを用いて、顔の特徴を学習させ、ある画像が所定の傾きと向きを持つ顔の画像であるか否かを判別できる判別器を生成して用意しておき、顔画像の検出対象となる画像(以下、検出対象画像という)において部分画像を順次切り出し、その部分画像が顔画像であるか否かを上記の判別器を用いて判別することにより、検出対象画像上の顔画像を検出する手法である。
顔検出システム1は、図1に示すように、多重解像度化部10、正規化部20、顔候補検出部30、重複検出判定部40、判別部50を備えている。顔候補検出部30は、さらに、解像度画像選択部31、サブウィンドウ設定部32、判別器群33を備えている。
多重解像度化部10は、顔を検出する対象となる入力画像S0を多重解像度化して解像度の異なる複数の画像(S1_1,S1_2,・・・,S1_n;以下、解像度画像という)からなる解像度画像群S1を得るものである。すなわち、多重解像度化部10は、入力画像S0の解像度(画像サイズ)を変換することにより、その解像度を所定の解像度、例えば、短辺が416画素の矩形サイズの画像に規格化し、規格化済みの入力画像S0′を得、この規格化済みの入力画像S0′を基本としてさらに解像度変換を行うことにより、解像度の異なる複数の解像度画像を生成し、解像度画像群S1を得るものである。
このような解像度画像群を生成する理由は、通常、入力画像に含まれる顔の大きさは不明であるが、一方、検出しようとする顔の大きさ(画像サイズ)は、後述の判別器の生成方法と関連して一定の大きさに固定されるため、大きさの異なる顔を検出するためには、解像度の異なる画像上で位置をずらしながら所定サイズの部分画像をそれぞれ切り出し、その部分画像が顔画像であるか否かを判別してゆく必要があるためである。
図2は、入力画像の多重解像度化の工程を示した図である。多重解像度化、すなわち、解像度画像群の生成は、具体的には、図2に示すように、規格化済みの入力画像S0′を基本となる解像度画像S1_1とし、解像度画像S1_1に対して2の−1/3乗倍サイズの解像度画像S1_2と、解像度画像S1_2に対して2の−1/3乗倍サイズ(基本画像S1_1に対しては2の−2/3乗倍サイズ)の解像度画像S1_3とを先に生成し、その後、解像度画像S1_1,S1_2,S1_3のそれぞれを1/2倍サイズに縮小した解像度画像を生成し、それら縮小した解像度画像をさらに1/2倍サイズに縮小した解像度画像を生成する、といった処理を繰り返し行い、複数の解像度画像を所定の数だけ生成するようにする。このようにすることで、輝度を表す画素値の補間処理を必要としない1/2倍の縮小処理を主な処理とし、基本となる解像度画像から2の−1/3乗倍ずつサイズが縮小された複数の画像が高速に生成できる。例えば、解像度画像S1_1が短辺416画素の矩形サイズである場合、解像度画像S1_2,S1_3,・・・は、短辺がそれぞれ、330画素,262画素,208画素,165画素,131画素,104画素,82画素,65画素,・・・の矩形サイズとなり、2の−1/3乗倍ずつ縮小された複数の解像度画像を生成することができる。なお、このように画素値を補間しないで生成される画像は、元の画像パターンの特徴をそのまま担持する傾向が強いので、顔検出処理において精度向上が期待できる点で好ましい。
正規化部20は、解像度画像のコントラストの状態が、後に実行される顔検出処理に適した状態となるように、解像度画像の各々に対して全体正規化処理および局所正規化処理を施し、正規化済みの複数の解像度画像(S1′_1,S1′_2,・・・,S1′_n)からなる解像度画像群S1′を得るものである。
まず、全体正規化処理について説明する。全体正規化処理は、解像度画像のコントラストを顔検出処理に適した所定のレベル、すなわち、後述の判別器の性能を引き出すのに適したレベルに近づけるべく、解像度画像全体の画素値をこの画像における被写体の輝度の対数を表す値に近づける変換曲線にしたがって変換する処理である。
図3は全体正規化処理に用いる変換曲線の一例を示した図である。全体正規化処理としては、例えば、図3に示すような、画素値をsRGB空間におけるいわゆる逆ガンマ変換(=2.2乗する)した後にさらに対数をとるような変換曲線(ルックアップテーブル)にしたがって、画像全体における画素値を変換する処理を考えることができる。これは、次のような理由による。
画像として観測される光強度Iは、通常、被写体の反射率Rと光源の強度Lの積として表現される(I=R×L)。したがって、光源の強度Lが変化すると、画像として観測される光強度Iも変化することになるが、被写体の反射率Rのみを評価することができれば、光源の強度Lに依存しない、すなわち、画像の明るさの影響を受けない精度の高い顔判別を行うことができる。
ここで、光源の強度がLの場合において、被写体上で反射率がR1の部分から観測される光強度をI1、被写体上で反射率がR2の部分から観測される光強度をI2としたとき、それぞれの対数をとった空間では、下記の式が成り立つ。
log(I1)−log(I2)=log(R1×L)−log(R2×L)=log(R1)+log(L)−(log(R2)+log(L))=log(R1)−log(R2)=log(R1/R2)
すなわち、画像における画素値を対数変換することは、反射率の比が差として表現された空間へ変換することとなり、このような空間では、光源の強度Lに依存しない被写体の反射率のみを評価することが可能となる。言い換えると、画像中の明るさによって異なるコントラスト(ここでは画素値の差分そのもの)を揃えることができる。
一方、一般的なデジタルカメラ等の機器で取得された画像の色空間はsRGBである。sRGBとは、機器間の色再現の違いを統一するために、色彩、彩度等を規定・統一した国際標準の色空間のことであり、この色空間においては、ガンマ値(γout)が2.2の画像出力機器において適正な色再現を可能にするため、画像の画素値は、入力輝度を1/γout(=0.45)乗して得られる値となっている。
そこで、画像全体における画素値を、いわゆる逆ガンマ変換、すなわち、2.2乗した後にさらに対数をとるような変換曲線にしたがって変換することにより、光源の強度に依存しない被写体の反射率のみによる評価を適正に行うことができるようになる。
なお、このような全体正規化処理は、別の言い方をすれば、画像全体における画素値を、特定の色空間を別の特性を有する色空間に変換する変換曲線にしたがって変換する処理ということができる。
このような処理を検出対象画像に施すことにより、画像中の明るさによって異なるコントラストを揃えることができ、顔検出処理の精度が向上することとなる。なお、この全体正規化処理は、処理結果が検出対象画像中の斜光や背景、入力モダリティの違いによる影響を受けやすい反面、処理時間が短いという特徴を有する。
次に、局所正規化処理について説明する。局所正規化処理とは、解像度画像上の局所的な領域におけるコントラストのばらつきを抑制するための処理である。すなわち、解像度画像に対して、この解像度画像における各局所領域について、輝度を表す画素値の分散の程度が所定レベル以上である局所領域に対して、この分散の程度を上記の所定レベルより高い一定レベルに近づける第1の輝度階調変換処理を施し、画素値の分散の程度が上記の所定レベル未満である局所領域に対して、この分散の程度を上記の一定レベルより低いレベルに抑える第2の輝度階調変換処理を施すものである。なお、この局所正規化処理は、処理時間は長いが、検出対象画像中の斜光や背景、入力モダリティの違いによる判別結果への影響は小さいという特徴を有する。
図4は局所正規化処理の概念を示した図であり、図5は局所正規化処理のフローを示した図である。また、式(1),(2)は、この局所正規化処理のための画素値の階調変換の式である。
Figure 0004657934
ここで、Xは注目画素の画素値、X′は注目画素の変換後の画素値、mlocalは注目画素を中心とする局所領域における画素値の平均、Vlocalはこの局所領域における画素値の分散、SDlocalはこの局所領域における画素値の標準偏差、(C1×C1)は上記の一定レベルに対応する基準値、C2は上記の所定レベルに対応する閾値、SDcは所定の定数である。なお、本実施形態において、輝度の階調数は8bitとし、画素値の取り得る値は0から255とする。
図4に示すように、まず、部分画像W2における1つの画素を注目画素として設定し(ステップST1)、この注目画素を中心とする所定の大きさ、例えば11×11画素サイズの局所領域における画素値の分散Vlocalを算出し(ステップST2)、分散Vlocalが上記所定のレベルに対応する閾値C2以上であるか否かを判定する(ステップST3)。ステップST3において、分散Vlocalが閾値C2以上であると判定された場合には、上記第1の輝度階調変換処理として、分散Vlocalが上記一定のレベルに対応する基準値(C1×C1)より大きいほど、注目画素の画素値Xと平均mlocalとの差を小さくし、分散mlocalが基準値(C1×C1)より小さいほど、注目画素の画素値Xと平均mlocalとの差を大きくする階調変換を式(1)にしたがって行う(ステップST4)。一方、ステップST3において、分散Vlocalが閾値C2未満であると判定された場合には、上記第2の輝度階調変換処理として、分散Vlocalに依らない線形な階調変換を式(2)にしたがって行う(ステップST5)。そして、ステップST1で設定した注目画素が最後の画素であるか否かを判定する(ステップST6)。ステップST6において、その注目画素が最後の画素でないと判定された場合には、ステップST1に戻り、同じ部分画像上の次の画素を注目画素として設定する。一方、ステップST6において、その注目画素が最後の画素であると判定された場合には、その部分画像に対する局所正規化を終了する。このように、上記ステップST1からS6の処理を繰り返すことにより、解像度画像全体に局所正規化を施すことができる。
なお、上記の所定レベルは、局所領域における全体または一部の輝度に応じて変化させるようにしてもよい。例えば、上記の、注目画素毎に階調変換を行う正規化処理において、閾値C2を注目画素の画素値に応じて変化させるようにしてもよい。すなわち、上記の所定レベルに対応する閾値C2を、注目画素の輝度が相対的に高いときにはより高く設定し、その輝度が相対的に低いときにはより低く設定するようにしてもよい。このようにすることで、輝度の低い、いわゆる暗い領域に低いコントラスト(画素値の分散が小さい状態)で存在している顔も正しく正規化することができる。
なお、ここでは、検出すべき顔の傾きを、入力画像S0の天地方向を基準に入力画像S0の画像面内において30度刻みで回転して設定される計12種類の傾きとし、検出すべき顔の傾きの順序が初期設定として予め所定の順序で設定されている。例えば、入力画像S0の天地方向を基準に時計回りの回転角度で表すとして、上向き3方向である0度、330度、30度、右向き3方向である90度、60度、120度、左向き3方向である270度、240度、300度、そして、下向き3方向である180度、150度、210度の順序とする。
顔候補検出部30は、正規化部20により正規化処理がなされた解像度画像群S1′の各解像度画像に対して、検出すべき顔の傾きを予め設定された順序にしたがって変えながら顔検出処理を施すことにより、各解像度画像に含まれる顔画像の候補S2を所定数検出するものであり、上述のように、解像度画像選択部31、サブウィンドウ設定部32、判別器群33とから構成されている。
解像度画像選択部31は、解像度画像群S1′の中から顔検出処理に供する解像度画像をサイズの小さい順に(解像度の粗い順に)順次選択するものである。なお、本実施形態における顔検出の手法が、各解像度画像上で順次切り出された同じサイズの部分画像Wについてその部分画像Wが顔画像であるか否かを判別することにより入力画像S0における顔画像を検出する手法であるから、この解像度画像選択部31は、入力画像S0における検出すべき顔の大きさを毎回変えながら設定するものであって、検出すべき顔の大きさを大から小へ変えながら設定するものと同等なものということができる。
サブウィンドウ設定部32は、解像度画像選択部31により選択された解像度画像において、顔画像であるか否かの判別対象となる部分画像Wを切り出すサブウィンドウを、その位置をずらしながら順次設定するものである。例えば、上記の選択された解像度画像において、所定のサイズすなわち32×32画素サイズの部分画像Wを切り出すサブウィンドウを、所定画素数分、例えば1画素ずつ移動させながら順次設定し、その切り出された部分画像Wを判別器群33へ入力する。判別器群を構成する各判別器は、後述のように、それぞれ、ある画像が所定の傾きおよび向きの顔を含む顔画像であるか否かを判別するものであるから、このようにすることで、あらゆる向きにある顔の判別をすることが可能となる。
判別器群33は、サブウィンドウによって切り出された部分画像Wが顔画像であるか否かを判別するものである。
図6は判別器群33の構成を示した図である。判別器群33は、図6に示すように、判別可能な顔の向きがそれぞれ異なる複数種類の判別器群、すなわち、主に正面顔画像を判別する正面顔判別器群33_F、主に左横顔画像を判別する左横顔判別器群33_Lおよび主に右横顔画像を判別する右横顔判別器群33_Rが並列に接続された構成である。さらに、これら3種の判別器群はそれぞれ、判別可能な顔の傾きが上記の部分画像の天地方向を基準として30度ずつ異なる計12方向に対応した判別器、すなわち、正面顔判別器群33_Fは、判別器33_F0,33_F30,・・・,33_F330、左横顔判別器群33_Lは、判別器33_L0,33_L30,・・・,33_L330、右横顔判別器群33_Rは、判別器33_R0,33_R30,・・・,33_R330から構成されている。
なお、上記の各判別器は、図6に示すように、複数の弱判別器WCが線形に結合したカスケード構造を有しており、弱判別器は、部分画像Wの画素値(輝度)の分布に係る少なくとも1つの特徴量を算出し、この特徴量を用いてこの部分画像Wが顔画像であるか否かを判別するものである。
また、判別器群33は、いずれも、判別可能な主な顔の画像面外の向きを正面顔、左横顔および右横顔の3種としているが、斜め向きの顔の検出精度を上げるため、右斜め顔、左斜め顔をそれぞれ判別する判別器をさらに設けるようにしてもよい。
重複検出判定部40は、顔検出部30によって検出された顔画像の候補S2の位置情報に基づいて、解像度画像群S1′の各解像度画像上で検出された顔画像の候補のうち同一の顔を表す画像、すなわち重複して検出された顔画像の候補をそれぞれ1つの顔画像の候補としてまとめる処理を行い、入力画像S0において検出された重複のない顔画像の候補S3を出力する。判別器は、学習方法にもよるが、一般的に部分画像Wのサイズに対して検出できる顔の大きさにはある程度幅があるので、解像度レベルが隣接する複数の解像度画像において、同一の顔を表す画像が重複して検出される場合があるからである。
ここで、判別器群を構成する各判別器の構成、判別器における処理の流れおよび判別器の学習方法について説明する。
判別器は、図6に示すように、複数の弱判別器WCからなり、後述の学習により多数の弱判別器WCの中から選定された判別に有効な弱判別器WCをその有効な順に直列に接続したものである。弱判別器WCは、それぞれ、部分画像Wから弱判別器毎に固有の所定のアルゴリズムにしたがって特徴量を算出し、その特徴量と所定のスコアテーブル(後述の自己のヒストグラム)とに基づいて、部分画像Wが所定の傾きおよび向きにある顔画像であることの蓋然性を示すスコアを求めるものである。判別器は、これら複数の弱判別器WCの全部または一部から得られたスコアを評価して、部分画像Wが所定の傾きおよび向きにある顔画像であるか否かの判別結果Rを得る。
図7は1つの判別器における処理の流れを示すフローチャートである。部分画像Wが判別器に入力されると、第1番目の弱判別器WCにおいて特徴量xが算出される(ステップST11)。例えば、図8に示すように、所定のサイズ、例えば、32×32画素サイズの部分画像Wに対して、4近傍画素平均(画像を2×2画素サイズ毎に複数のブロックに区分し、各ブロックの4画素における画素値の平均値をそのブロックに対応する1つの画素の画素値とする処理)を段階的に行うことにより、16×16画素サイズの画像W′と、8×8画素サイズの縮小した画像W″を得、もとの画像を含めたこれら3つの画像の平面内に設定される所定の2点を1ペアとして、複数種類のペアからなる1つのペア群を構成する各ペアにおける2点間の画素値(輝度)の差分値をそれぞれ計算し、これらの差分値の組合せを特徴量とする。各ペアの所定の2点は、例えば、画像上の顔の濃淡の特徴が反映されるよう決められた縦方向に並んだ所定の2点や、横方向に並んだ所定の2点とする。そして、特徴量である差分値の組合せに対応する値をxとして算出する。次に、その値xに応じて所定のスコアテーブル(自己のヒストグラム)から部分画像Wが判別すべき顔(例えば、判別器33_F30の場合には「顔の向きが正面で傾きが回転角度30度の顔」)を表す画像であることの蓋然性を示すスコアが求められる(ステップST12)。次に、1つ前の弱判別器WCから引き渡されたスコアにそのスコアを加算して累積スコアSCを算出するのであるが、第1番目の弱判別器WCの場合には、引き渡されるスコアが存在しないので、この場合には、求めたスコアをそのまま累積スコアSCとする(ステップST13)。次に、その累積スコアSCが予め決められた所定の閾値Th1を超えたか否か、および、その累積スコアSCが予め決められた所定の閾値Th2を下回ったか否かを判定する(ステップST14)。すなわち、SC>Th1という条件、もしくは、SC<Th2という条件のいずれかを満たすか否かを判定する。これらの条件を満たすと判定された場合には、SC>Th1のときに部分画像Wが判別すべき顔を表す「顔画像」であると判別し、SC<Th2のときに部分画像Wが「非顔画像」であると判別し、処理を終了する(ステップST15)。一方、ステップST14において、上記の条件を満たさないと判定された場合には、次の弱判別器WCがあるか否かを判定し(ステップST16)、ここで、次の弱判別器WCがあると判定されたときには、累積スコアSCを次の弱判別器WCに引き渡して、その次の弱判別器WCの処理に移行する(ステップST18)。一方、ステップST16において、次の弱判別器WCがないと判定された場合には、算出されたスコアの大小に基づいて、部分画像Wが判別すべき顔を表す「顔画像」、「非顔画像」のいずれかとして判別し処理を終了する(ステップST17)。
次に、判別器の学習(生成)方法について説明する。
図9は判別器の学習方法を示すフローチャートである。判別器の学習には、所定のサイズ、例えば32×32画素サイズで規格化され、さらに、前述の正規化部20による正規化処理と同様の処理が施された複数のサンプル画像を用いる。サンプル画像としては、顔であることが分かっている複数の異なる顔サンプル画像からなる顔サンプル画像群と、顔でないことが分かっている複数の異なる非顔サンプル画像からなる非顔サンプル画像群とを用意する。
顔サンプル画像群は、1つの顔サンプル画像につき、縦および/または横を0.7倍から1.2倍の範囲にて0.1倍単位で段階的に拡縮して得られる各サンプル画像に対し、平面上±15度の範囲にて3度単位で段階的に回転させて得られる複数の変形バリエーションを用いる。なおこのとき、顔サンプル画像は、目の位置が所定の位置に来るように顔のサイズと位置を規格化し、上記の平面上の回転、拡縮は目の位置を基準として行うようにする。例えば、d×dサイズのサンプル画像の場合においては、図10に示すように、両目の位置が、サンプル画像の最左上の頂点と最右上の頂点から、それぞれ、内側に1/4d、下側に1/4d移動した各位置とに来るように顔のサイズと位置を規格化し、また、上記の平面上の回転、拡縮は、両目の中間点を中心に行うようにする。
これら各サンプル画像には、重みすなわち重要度が割り当てられる。まず、すべてのサンプル画像の重みの初期値が等しく1に設定される(ステップST21)。
次に、サンプル画像およびその縮小画像の平面内に設定される所定の2点を1ペアとして複数のペアからなるペア群を複数種類設定したときの、この複数種類のペア群のそれぞれについて弱半別器が作成される(ステップST22)。ここで、それぞれの弱判別器とは、サブウィンドウWで切り出された部分画像とその縮小画像の平面内に設定される所定の2点を1ペアとして複数のペアからなる1つのペア群を設定したときの、この1つのペア群を構成する各ペアにおける2点間の画素値(輝度)の差分値の組合せを用いて、顔の画像と顔でない画像とを判別する基準を提供するものである。本実施形態においては、1つのペア群を構成する各ペアにおける2点間の画素値の差分値の組合せについてのヒストグラムを弱判別器のスコアテーブルの基礎として使用する。
図11はサンプル画像からヒストグラムが生成される様子を示した図である。図11の左側のサンプル画像に示すように、この判別器を作成するためのペア群を構成する各ペアの2点は、顔であることが分かっている複数のサンプル画像において、サンプル画像上の右目の中心にある点をP1、右側の頬の部分にある点をP2、眉間の部分にある点をP3、サンプル画像を4近傍画素平均で縮小した16×16画素サイズの縮小画像上の右目の中心にある点をP4、右側の頬の部分にある点をP5、さらに4近傍画素平均で縮小した8×8画素サイズの縮小画像上の額の部分にある点をP6、口の部分にある点をP7として、P1−P2、P1−P3、P4−P5、P4−P6、P6−P7の5ペアである。なお、ある判別器を作成するための1つのペア群を構成する各ペアの2点の座標位置はすべてのサンプル画像において同一である。そして顔であることが分かっているすべてのサンプル画像について上記5ペアを構成する各ペアの2点間の画素値の差分値の組合せが求められ、そのヒストグラムが作成される。ここで、画素値の差分値の組合せとしてとり得る値は、画像の輝度階調数に依存するが、仮に16ビット階調である場合には、1つの画素値の差分値につき65536通りあり、全体では階調数の(ペア数)乗、すなわち65536の5乗通りとなってしまい、学習および検出のために多大なサンプルの数、時間およびメモリを要することとなる。このため、本実施形態においては、画素値の差分値を適当な数値幅で区切って量子化し、n値化する(例えばn=100)。これにより、画素値の差分値の組合せの数はnの5乗通りとなるため、画素値の差分値の組合せを表すデータ数を低減できる。
同様に、顔でないことが分かっている複数の非顔サンプル画像についても、ヒストグラムが作成される。なお、非顔サンプル画像については、顔であることが分かっている顔サンプル画像上における上記各ペアの所定の2点の位置に対応する位置(同様に参照符号P1からP7を用いる)が用いられる。これらの2つのヒストグラムが示す頻度値の比の対数値を取ってヒストグラムで表したものが、図11の一番右側に示す、弱判別器のスコアテーブルの基礎として用いられるヒストグラムである。この弱判別器のヒストグラムが示す各縦軸の値を、以下、判別ポイントと称する。この弱判別器によれば、正の判別ポイントに対応する、画素値の差分値の組合せの分布を示す画像は顔である可能性が高く、判別ポイントの絶対値が大きいほどその可能性は高まると言える。逆に、負の判別ポイントに対応する画素値の差分値の組合せの分布を示す画像は顔でない可能性が高く、やはり判別ポイントの絶対値が大きいほどその可能性は高まる。ステップST22では、判別に使用され得る複数種類のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せについて、上記のヒストグラム形式の複数の弱判別器が作成される。
続いて、ステップST22で作成した複数の弱半別器のうち、画像が顔であるか否かを判別するのに最も有効な弱判別器が選択される。最も有効な弱判別器の選択は、各サンプル画像の重みを考慮して行われる。この例では、各弱判別器の重み付き正答率が比較され、最も高い重み付き正答率を示す弱判別器が選択される(ステップST23)。すなわち、最初のステップST23では、各サンプル画像の重みは等しく1であるので、単純にその弱判別器によって画像が顔であるか否かが正しく判別されるサンプル画像の数が最も多いものが、最も有効な弱判別器として選択される。一方、後述するステップST15において各サンプル画像の重みが更新された後の2回目のステップST23では、重みが1のサンプル画像、重みが1よりも大きいサンプル画像、および重みが1よりも小さいサンプル画像が混在しており、重みが1よりも大きいサンプル画像は、正答率の評価において、重みが1のサンプル画像よりも重みが大きい分多くカウントされる。これにより、2回目以降のステップST23では、重みが小さいサンプル画像よりも、重みが大きいサンプル画像が正しく判別されることに、より重点が置かれる。
次に、それまでに選択した弱判別器の組合せの正答率、すなわち、それまでに選択した弱判別器を組み合わせて使用して(学習段階では、弱判別器は必ずしも線形に結合させる必要はない)各サンプル画像が顔の画像であるか否かを判別した結果が、実際に顔の画像であるか否かの答えと一致する率が、所定の閾値を超えたか否かが確かめられる(ステップST24)。ここで、弱判別器の組合せの正答率の評価に用いられるのは、現在の重みが付けられたサンプル画像群でも、重みが等しくされたサンプル画像群でもよい。所定の閾値を超えた場合は、それまでに選択した弱判別器を用いれば画像が顔であるか否かを十分に高い確率で判別できるため、学習は終了する。所定の閾値以下である場合は、それまでに選択した弱判別器と組み合わせて用いるための追加の弱判別器を選択するために、ステップST26へと進む。
ステップST26では、直近のステップST23で選択された弱判別器が再び選択されないようにするため、その弱判別器が除外される。
次に、直近のステップST23で選択された弱判別器では顔であるか否かを正しく判別できなかったサンプル画像の重みが大きくされ、画像が顔であるか否かを正しく判別できたサンプル画像の重みが小さくされる(ステップST25)。このように重みを大小させる理由は、次の弱判別器の選択において、既に選択された弱判別器では正しく判別できなかった画像を重要視し、それらの画像が顔であるか否かを正しく判別できる弱判別器が選択されるようにして、弱判別器の組合せの効果を高めるためである。
続いて、ステップST23へと戻り、上記したように重み付き正答率を基準にして次に有効な弱判別器が選択される。
以上のステップST23からS26を繰り返して、顔であるか否かを判別するのに適した弱判別器として、特定のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せに対応する弱判別器が選択されたところで、ステップST24で確認される正答率が閾値を超えたとすると、顔であるか否かの判別に用いる弱判別器の種類と判別条件とが確定され(ステップST27)、これにより学習を終了する。なお、選択された弱判別器は、その重み付き正答率が高い順に線形結合され、1つの判別器が構成される。また、各弱判別器については、それぞれ得られたヒストグラムを基に、画素値の差分値の組合せに応じてスコアを算出するためのスコアテーブルが生成される。なお、ヒストグラム自身をスコアテーブルとして用いることもでき、この場合、ヒストグラムの判別ポイントがそのままスコアとなる。
このようにして、顔サンプル画像群と非顔サンプル画像群とを用いた学習により、判別器が生成されるわけであるが、上記のように、判別したい顔の傾きおよび向きが異なる複数の判別器を生成するには、それらの各傾きや向きに対応した顔サンプル画像群を用意し、その顔サンプル画像群と非顔サンプル画像群とを用いた学習を顔サンプル画像群の種類毎に行うこととなる。
すなわち、本実施形態においては、顔の向きについては、正面、左横、右横の計3種類、顔の傾きについては、回転角度0度から330度まで30度刻みの計12種類、合計36種類の顔サンプル画像群を用意する。
上記の複数の顔サンプル画像群が得られたら、顔サンプル画像群の種類毎に、その顔サンプル画像群と非顔サンプル画像群とを用いて、上記の学習を行うことにより、判別器群33を構成する複数の判別器を生成することができる。
このように、顔の向き毎に、かつ、顔の傾き毎に学習された複数の判別器を用いることにより、あらゆる向きや傾きの顔を判別することが可能となる。
なお、上記の学習手法を採用する場合において、弱判別器は、特定のペア群を構成する各ペアの所定の2点間の画素値の差分値の組合せを用いて顔の画像と顔でない画像とを判別する基準を提供するものであれば、上記のヒストグラムの形式のものに限られずいかなるものであってもよく、例えば2値データ、閾値または関数等であってもよい。また、同じヒストグラムの形式であっても、図11の中央に示した2つのヒストグラムの差分値の分布を示すヒストグラム等を用いてもよい。
また、学習の方法としては上記手法に限定されるものではなく、ニューラルネットワーク等他のマシンラーニングの手法を用いることができる。
判別部50は、各顔画像の候補毎に、その顔画像の候補が検出されたときのスコアSCを参照し、そのスコアSCがTh2より大きい閾値Th3以上であるものを真の顔画像として判別する。一方、そのスコアSCが閾値Th3未満であるものについては、以下の処理を行う。
すなわち、注目している顔画像の候補の顔の傾きを求め、顔の傾きがその傾きと同じである別の顔画像の候補があるかを調べる。同じ傾きの顔の候補の数が、注目している顔画像の候補を含めて2以上ある場合には、その注目している顔画像の候補を真の顔画像として判別する。
なお、重複検出判定部40において重複した顔画像の候補が1つにまとめられた顔画像の候補に対するスコアSCついては、まとめられる前の複数の顔画像の候補に対するスコアのうち最も高いスコアを、そのまとめた後の顔画像の候補に対するスコアとする。
本実施形態において、顔検出部30および重複検出判定部40が、本発明における顔画像候補抽出手段として機能するものであり、判別部50が、本発明における判別手段として機能するものである。
次に、顔検出システム1における処理の流れについて説明する。上記顔検出システムにおける処理は大きく分けて、顔候補の検出処理と真の顔の検出処理がある。
図12は顔候補の検出処理の流れを示したフローチャートであり、図13は真の顔の検出処理の流れを示したフローチャートである。
まず、顔候補の検出処理について説明する。多重解像度化部10に入力画像S0が供給されると(ステップST31)、この入力画像S0の画像サイズが所定のサイズに変換された画像S0′が生成され、この画像S0′から2の−1/3乗倍ずつサイズ(解像度)が縮小された複数の解像度画像からなる解像度画像群S1が生成される(ステップST32)。そして、正規化部20において、解像度画像群S1の各解像度化像に対して、上述の全体正規化処理と局所正規化処理が施され、正規化済みの解像度画像群S1′が得られる(ステップST33)。顔候補検出部30においては、解像度画像選択部31が、解像度画像群S1′の中から画像サイズの小さい順、すなわち、S1′_n,S1′_n−1,・・・,S1′_1の順に所定の解像度画像S1′_iを1つ選択する(ステップST34)。次に、サブウィンドウ設定部32が、選択された解像度画像S1′_i上でサブウィンドウを設定して所定サイズの部分画像Wを切り出し(ステップST35)、その部分画像Wを判別器群33に入力する。そして、判別器群33を構成する各判別器は、その部分画像Wが顔の傾きおよび向きが所定の傾きおよび向きである顔の顔画像である蓋然性を示すスコアSCを算出し(ステップST36)、そのスコアSCが閾値Th2以上である場合に、その部分画像Wを顔の傾きおよび向きがその所定の傾きおよび向きである顔の顔画像と判別し、そのスコアSCが閾値Th2未満である場合には、顔画像でないと判別する(ステップST37)。このとき、部分画像Wが顔画像であると判別された場合には、その部分画像Wは顔画像の候補S2として重複検出判定部40に送られる。ここで、サブウィンドウ設定部32は、次に切り出すべき部分画像Wが存在するか否かを判定する(ステップST38)。そして、次に切り出すべき部分画像Wが存在すると判定された場合には、ステップST35に戻り、新たなサブウィンドウを前回設定した位置から1画素分移動して設定し、新たな部分画像Wを切り出す。一方、次に切り出すべき部分画像Wが存在しないと判定された場合には、解像度画像選択部31が、次に選択すべき解像度画像が存在するか否かを判定する(ステップST39)。そして、次に選択すべき解像度画像が存在すると判定された場合には、ステップST34に戻り、画像サイズが前回選択した解像度画像より1段階小さい新たな解像度画像を選択する。一方、次に選択すべき解像度画像が存在しない場合には、重複検出判定部40が、検出された顔画像の候補の位置情報に基づいて、同一の顔が重複して検出された複数の顔画像の候補を1つの候補にまとめ直し、重複のない顔画像の候補S3が判別部50に送り(ステップST40)、顔候補の検出処理を終了する。
次に、真の顔の検出処理について説明する。判別部50は、検出された顔画像の候補S3の1つを注目候補として設定し(ステップST41)、その注目候補が検出されたときのスコアSCが閾値Th3以上であるか否かを判定する(ステップST42)。ここでそのスコアSCが閾値Th3以上であると判定された場合に、その注目候補を真の顔画像として判別する(ステップST43)。一方、そのスコアSCが閾値Th3未満であるものについては、注目候補の顔の傾きと同じ傾きの顔の候補の数が、注目候補を含めて2以上あるか否かを判定する(ステップST44)。その候補の数が2以上あると判定された場合には、その注目候補を真の顔画像として判別し(ステップST43)、2以上ないと判定された場合には、その注目候補を真の顔画像でないと判別する(ステップST45)。そして、次の注目候補として設定すべき顔画像の候補があるか否かを判定し(ステップST46)、設定すべき候補があると判定された場合には、ステップST41に戻って処理を続行する。一方、設定すべき候補がないと判定された場合には、真の顔画像S4を出力して、真の顔の検出処理を終了する。
図14は、上記のステップST34からステップST39までを繰り返すことにより、解像度画像がサイズの小さい順に選択されて、各解像度画像上で部分画像Wが順次切り出され、顔候補の検出が実施される様子を示した図である。
図15は、本顔検出システム1による顔画像の検出結果が反映された入力画像S0の一例を示した図である。図15に示す入力画像S0は、人物の顔画像である正面顔画像F1および右横顔画像F2と背景の画像とを含む写真画像であり、この背景の画像には右横顔に類似した非顔画像NF1が含まれている。ここで、正面顔画像F1と右横顔画像F2の顔の傾きはいずれも同じで入力画像S0の天地方向に沿った傾きであるが、非顔画像NF1に現れる偽顔の傾きはこれとは異なる傾きを有している。また、正面顔画像F1に対して算出されたスコアは、受入れ閾値Th3以上であり、右横顔画像F2および非顔画像NF1に対して算出されたスコアはTh2以上、Th3未満である。すなわち、右横顔画像F2および非顔画像NF1は候補としては検出されるが、そのままでは真の顔画像として受け入れられない。しかし、本発明の実施形態である顔検出システム1によれば右横顔画像F2の顔の傾きは正面顔画像F1と同じであることから、同じ傾きの顔画像の候補が2つ存在することになり、この右横顔画像F2は顔画像として検出される。一方、非顔画像NF1の偽顔の傾きは正面顔画像F1と異なるため、誤検出に該当すると判別され、顔画像としては検出されない。
このように、本実施形態による顔検出システムによれば、入力画像において、ある傾きの顔の候補が検出された場合に、その候補の信頼度を表す所定の評価値としての、顔の傾きがその候補と同じである候補の数がある閾値を超えたときに、顔の傾きがその候補の顔の傾きと同じである別の候補に対して、真の顔として受け入れる、あるいは、真の顔として受け入れるか否かの受入れ閾値を低くする処理を行うので、同一画像上に含まれる複数の顔はほぼ同じ傾きであることが多いという事実を利用して、誤検出である可能性が低い候補を真の顔として受け入れる傾向を強めることができ、顔の誤検出をより抑制することが可能となる。
例えば、デジタルカメラによる撮影では、複数の被写体の天地方向が同じ方向に揃うので、カメラが被写体に対して水平または垂直な状態の場合はもちろん、カメラが被写体に対して傾いた状態で撮影されたとしても、取得した写真画像上の複数の被写体の天地方向は一定の方向に揃うことが多い。すなわち、被写体の姿勢が自然な立位や座位にあるときには、同一画像上にある複数の顔の傾きは、正面顔であるか横顔であるかに依らず、略同じ傾きに揃うことが多い。したがって、本発明のように、同じ傾きの顔が真の顔としてより受け入れられるようにすることで、誤検出を抑制することが可能となる。
なお、本実施形態では、判別部50は、スコアSCが所定の閾値Th3未満であった顔画像の候補に対して、同じ傾きの顔の候補の数が、その注目している顔画像の候補を含めて2以上ある場合には、その注目している顔画像の候補を真の顔画像として判別するようにしているが、別の方法として、次のような方法を採用してもよい。
すなわち、注目している顔画像の候補の顔の傾きを求め、顔の傾きがその傾きと同じである別の顔画像の候補があるかを調べる。同じ傾きの顔の候補に対するスコアSCの総和が、注目している顔画像の候補を含めて所定の閾値Th4以上ある場合には、その注目している顔画像の候補を真の顔画像として判別する。
また、候補の数またはスコアの総和は、重み付けされた候補の数またはスコアを用いるようにしてもよい。例えば、横顔は正面顔より信頼度が低いので、正面顔の候補の数+(横顔の候補の数)×0.5を候補の数としたり、正面顔の候補のスコア+(横顔の候補のスコア)×0.5をスコアの総和としたりしてもよい。
また、候補の数とスコアの総和に基づいて総合的なポイントを算出し、その総合的なポイントが所定の閾値以上である場合に、それらの候補を真の顔画像として受け入れる、あるいは、その受入れ閾値Th3を低くするようにしてもよい。
また、判別部50は、検出された顔画像の候補S3について、正面顔の候補と横顔の候補とを比較し、横顔の候補のうち、横顔の傾きが正面顔の候補における正面顔の傾きと略同じ所定範囲内の傾き、例えば、正面顔の傾きとのずれが回転角度±30度以内である傾きを有する横顔の候補のみを真の顔画像とし、それ以外の横顔の候補は誤検出されたものとみなして排除し、最終的に残った正面顔の候補と横顔の候補を真の顔画像として出力するようにしてもよい。
以上、本発明の実施形態に係る顔検出システムについて説明したが、この顔検出システムにおける各処理をコンピュータに実行させるためのプログラムも、本発明の実施形態の1つである。また、そのようなプログラムを記録したコンピュータ読取可能な記録媒体も、本発明の実施形態の1つである。
顔検出システム1の構成を示すブロック図 検出対象画像の多重解像度化の工程を示す図 全体正規化処理に用いる変換曲線の一例を示す図 局所正規化処理の概念を示す図 局所正規化処理のフローを示す図 判別器群の構成を示すブロック図 判別器における処理フローを示す図 弱判別器における特徴量の算出を説明するための図 判別器の学習方法を示すフローチャート 目の位置が所定の位置にくるように規格化された顔のサンプル画像を示す図 弱判別器のヒストグラムを導出する方法を示す図 顔検出システム1において行われる顔候補の検出処理を示すフローチャート 顔検出システム1において行われる真の顔の検出処理を示すフローチャート 顔検出対象となる解像度画像の切替えとその画像上でのサブウィンドウの移動を説明するための図 顔検出システム1による顔画像の検出結果が反映された入力画像S0の一例を示す図
符号の説明
1 顔検出システム
10 多重解像度化部
20 正規化部
30 顔候補検出部(顔候補抽出手段)
31 解像度画像選択部
32 サブウィンドウ設定部
33 判別器群
33_F 正面顔判別器群
33_L 左横顔判別器群
33_R 右横顔判別器群
40 重複検出判定部(顔候補抽出手段)
50 判別部(判別手段)

Claims (21)

  1. 入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出ステップと、該候補が真の顔画像であるか否かを判別する判別ステップとからなる顔検出方法において、
    前記判別ステップが、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とする顔検出方法。
  2. 入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出ステップと、該候補が真の顔画像であるか否かを判別する判別ステップとからなる顔検出方法において、
    前記判別ステップが、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、
    顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とする顔検出方法。
  3. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補の数であり、前記所定の閾値が2以上の整数であることを特徴とする請求項1または2記載の顔検出方法。
  4. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補における前記指標値の総和であることを特徴とする請求項1または2記載の顔検出方法。
  5. 前記第1の向きと前記第2の向きが同じ向きであることを特徴とする請求項1、2または3記載の顔検出方法。
  6. 前記第1および第2の向きが複数の異なる向きを含むものであることを特徴とする請求項5記載の顔検出方法。
  7. 前記第1の向きが正面、前記第2の向きが横または斜め横であることを特徴とする請求項1、2または3記載の顔検出方法。
  8. 入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段とを備えた顔検出装置において、
    前記判別手段が、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とする顔検出装置。
  9. 入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段とを備えた顔検出装置において、
    前記判別手段が、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、
    顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とする顔検出装置。
  10. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補の数であり、前記所定の閾値が2以上の整数であることを特徴とする請求項8または9記載の顔検出装置。
  11. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補における前記指標値の総和であることを特徴とする請求項8または9記載の顔検出装置。
  12. 前記第1の向きと前記第2の向きが同じ向きであることを特徴とする請求項8、9または10記載の顔検出装置。
  13. 前記第1および第2の向きが複数の異なる向きを含むものであることを特徴とする請求項12記載の顔検出装置。
  14. 前記第1の向きが正面、前記第2の向きが横または斜め横であることを特徴とする請求項8、9または10記載の顔検出装置。
  15. コンピュータを、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段として機能させることにより、該コンピュータを顔検出装置として機能させるためのプログラムにおいて、
    前記判別手段が、顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補を真の顔画像と判別するものであることを特徴とするプログラム。
  16. コンピュータを、入力画像上で検出すべき顔の位置、傾きおよび向きを変えながら、前記検出すべき顔の位置、傾きおよび向き毎に、該位置における部分画像が該傾きおよび該向きの顔を含む顔画像である蓋然性を示す指標値を算出し、該指標値が第1の閾値以上である前記部分画像を前記顔画像の候補としてすべて抽出する顔候補抽出手段と、該候補が真の顔画像であるか否かを判別する判別手段として機能させることにより、該コンピュータを顔検出装置として機能させるためのプログラムにおいて、
    前記判別手段が、前記抽出されたすべての候補のうち前記算出された指標値が第2の閾値以上であるものを真の顔画像と判別するものであって、
    顔の傾きが所定の傾きであり顔の向きが第1の向きである前記顔画像の候補の信頼度を表す所定の評価値が所定の閾値以上であるとき、顔の傾きが前記所定の傾きと略同じ傾きであり顔の向きが第2の向きである前記顔画像の候補に対する前記第2の閾値を低くして判別するものであることを特徴とするプログラム。
  17. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補の数であり、前記所定の閾値が2以上の整数であることを特徴とする請求項15または16記載のプログラム。
  18. 前記評価値が、顔の向きが前記第1の向きである前記顔画像の候補における前記指標値の総和であることを特徴とする請求項15または16記載のプログラム。
  19. 前記第1の向きと前記第2の向きが同じ向きであることを特徴とする請求項15、16または17記載のプログラム。
  20. 前記第1および第2の向きが複数の異なる向きを含むものであることを特徴とする請求項19記載のプログラム。
  21. 前記第1の向きが正面、前記第2の向きが横または斜め横であることを特徴とする請求項15、16または17記載のプログラム。
JP2006013720A 2006-01-23 2006-01-23 顔検出方法および装置並びにプログラム Active JP4657934B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006013720A JP4657934B2 (ja) 2006-01-23 2006-01-23 顔検出方法および装置並びにプログラム
US11/655,847 US7853086B2 (en) 2006-01-23 2007-01-22 Face detection method, device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006013720A JP4657934B2 (ja) 2006-01-23 2006-01-23 顔検出方法および装置並びにプログラム

Publications (2)

Publication Number Publication Date
JP2007193740A JP2007193740A (ja) 2007-08-02
JP4657934B2 true JP4657934B2 (ja) 2011-03-23

Family

ID=38285626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006013720A Active JP4657934B2 (ja) 2006-01-23 2006-01-23 顔検出方法および装置並びにプログラム

Country Status (2)

Country Link
US (1) US7853086B2 (ja)
JP (1) JP4657934B2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7440593B1 (en) 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7965875B2 (en) 2006-06-12 2011-06-21 Tessera Technologies Ireland Limited Advances in extending the AAM techniques from grayscale to color images
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
WO2009098894A1 (ja) * 2008-02-06 2009-08-13 Panasonic Corporation 電子カメラおよび画像処理方法
JP5227629B2 (ja) * 2008-03-25 2013-07-03 富士フイルム株式会社 オブジェクト検出方法、オブジェクト検出装置、およびオブジェクト検出プログラム
JP5027030B2 (ja) * 2008-03-25 2012-09-19 富士フイルム株式会社 オブジェクト検出方法、オブジェクト検出装置、およびオブジェクト検出プログラム
JP5171362B2 (ja) * 2008-04-07 2013-03-27 株式会社東芝 強識別器の学習装置及びその方法並びに強識別器の学習プログラム
JP5456159B2 (ja) * 2009-05-29 2014-03-26 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド 背景から前景の頭頂部を分離するための方法および装置
US8605955B2 (en) * 2009-06-29 2013-12-10 DigitalOptics Corporation Europe Limited Methods and apparatuses for half-face detection
JP2011090569A (ja) * 2009-10-23 2011-05-06 Sony Corp 画像処理装置および画像処理方法
US8861800B2 (en) * 2010-07-19 2014-10-14 Carnegie Mellon University Rapid 3D face reconstruction from a 2D image and methods using such rapid 3D face reconstruction
US8971628B2 (en) 2010-07-26 2015-03-03 Fotonation Limited Face detection using division-generated haar-like features for illumination invariance
US8705811B1 (en) * 2010-10-26 2014-04-22 Apple Inc. Luminance adjusted face detection
JP2012113621A (ja) * 2010-11-26 2012-06-14 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
JP5748472B2 (ja) * 2010-12-15 2015-07-15 富士フイルム株式会社 オブジェクト判別装置、方法、及びプログラム
EP2721582A4 (en) * 2011-06-20 2015-03-25 Nokia Corp METHODS, DEVICES AND COMPUTER PROGRAM PRODUCTS FOR IMPLEMENTING DETAILED POSITION PROVISIONS OF OBJECTS
JP5285748B2 (ja) * 2011-07-08 2013-09-11 富士フイルム株式会社 オブジェクト検出装置、方法およびプログラム
JP6544900B2 (ja) * 2014-09-17 2019-07-17 キヤノン株式会社 オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP2017099616A (ja) * 2015-12-01 2017-06-08 ソニー株式会社 手術用制御装置、手術用制御方法、およびプログラム、並びに手術システム
US10592729B2 (en) * 2016-01-21 2020-03-17 Samsung Electronics Co., Ltd. Face detection method and apparatus
CN106295587B (zh) * 2016-08-16 2019-05-31 一块互动(北京)科技有限公司 一种视频感兴趣区域快速标定方法
US10621419B2 (en) * 2016-12-06 2020-04-14 Robert William Kocher Method and system for increasing biometric acceptance rates and reducing false accept rates and false rates
CN106650675B (zh) * 2016-12-28 2020-01-21 天地伟业技术有限公司 一种基于嵌入式系统的实时人脸检测方法
JP7081305B2 (ja) * 2018-05-24 2022-06-07 株式会社アイシン 周辺監視装置
CN112712006A (zh) * 2020-12-25 2021-04-27 四川云从天府人工智能科技有限公司 目标图片抓拍方法、系统、介质及装置
CN112613459B (zh) * 2020-12-30 2022-07-15 深圳艾摩米智能科技有限公司 一种人脸敏感区域检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267512A (ja) * 2004-03-22 2005-09-29 Fuji Photo Film Co Ltd 特定領域検出方法、特定領域検出装置、およびプログラム
JP2007108990A (ja) * 2005-10-13 2007-04-26 Fujifilm Corp 顔検出方法および装置並びにプログラム
JP2007188419A (ja) * 2006-01-16 2007-07-26 Fujifilm Corp 顔検出方法および装置並びにプログラム
JP2007193404A (ja) * 2006-01-17 2007-08-02 Fujifilm Corp 顔検出方法および装置並びにプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001357404A (ja) * 2000-06-14 2001-12-26 Minolta Co Ltd 画像抽出装置
US7099510B2 (en) 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection
US7024033B2 (en) * 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
US6879709B2 (en) * 2002-01-17 2005-04-12 International Business Machines Corporation System and method for automatically detecting neutral expressionless faces in digital images
US7508961B2 (en) * 2003-03-12 2009-03-24 Eastman Kodak Company Method and system for face detection in digital images
US7203669B2 (en) * 2003-03-17 2007-04-10 Intel Corporation Detector tree of boosted classifiers for real-time object detection and tracking
US7920725B2 (en) * 2003-09-09 2011-04-05 Fujifilm Corporation Apparatus, method, and program for discriminating subjects
US7508979B2 (en) * 2003-11-21 2009-03-24 Siemens Corporate Research, Inc. System and method for detecting an occupant and head pose using stereo detectors
JP4482796B2 (ja) * 2004-03-26 2010-06-16 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20070053563A1 (en) * 2005-03-09 2007-03-08 Zhuowen Tu Probabilistic boosting tree framework for learning discriminative models
US7889892B2 (en) * 2005-10-13 2011-02-15 Fujifilm Corporation Face detecting method, and system and program for the methods

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267512A (ja) * 2004-03-22 2005-09-29 Fuji Photo Film Co Ltd 特定領域検出方法、特定領域検出装置、およびプログラム
JP2007108990A (ja) * 2005-10-13 2007-04-26 Fujifilm Corp 顔検出方法および装置並びにプログラム
JP2007188419A (ja) * 2006-01-16 2007-07-26 Fujifilm Corp 顔検出方法および装置並びにプログラム
JP2007193404A (ja) * 2006-01-17 2007-08-02 Fujifilm Corp 顔検出方法および装置並びにプログラム

Also Published As

Publication number Publication date
US20070172126A1 (en) 2007-07-26
US7853086B2 (en) 2010-12-14
JP2007193740A (ja) 2007-08-02

Similar Documents

Publication Publication Date Title
JP4657934B2 (ja) 顔検出方法および装置並びにプログラム
JP4640825B2 (ja) 特定向き顔判定方法および装置並びにプログラム
JP4712563B2 (ja) 顔検出方法および装置並びにプログラム
JP4619927B2 (ja) 顔検出方法および装置並びにプログラム
JP4744918B2 (ja) 顔検出方法および装置並びにプログラム
JP4628882B2 (ja) 判別器の学習方法、顔判別方法および装置並びにプログラム
JP4624889B2 (ja) 顔検出方法および装置並びにプログラム
JP4708909B2 (ja) デジタル画像の対象物検出方法および装置並びにプログラム
JP4708948B2 (ja) 顔向き特定方法、顔判別方法および装置並びにプログラム
JP4757598B2 (ja) 顔検出方法および装置並びにプログラム
JP2007213182A (ja) 対象物状態認識方法および装置並びにプログラム
JP2007047975A (ja) デジタル画像の複数対象物検出方法および装置並びにプログラム
JP4795864B2 (ja) 特徴点検出装置および方法並びにプログラム
WO2011092865A1 (ja) 物体検出装置及び物体検出方法
JP5317934B2 (ja) オブジェクト検出装置および方法並びにプログラム
JP4657930B2 (ja) 顔検出方法および装置並びにプログラム
JP4749884B2 (ja) 顔判別装置の学習方法、顔判別方法および装置並びにプログラム
JP4795737B2 (ja) 顔検出方法および装置並びにプログラム
JP2011170890A (ja) 顔検出方法および装置並びにプログラム
JP2006309714A (ja) 顔判別方法および装置並びにプログラム
JP2006244385A (ja) 顔判別装置およびプログラム並びに顔判別装置の学習方法
JP5283267B2 (ja) コンテンツ識別方法及び装置
JP4749880B2 (ja) 顔判別方法および装置並びにプログラム
JP2007011935A (ja) 顔判別方法および装置並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4657934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250