JP2005190400A - 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム - Google Patents

顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム Download PDF

Info

Publication number
JP2005190400A
JP2005190400A JP2003434177A JP2003434177A JP2005190400A JP 2005190400 A JP2005190400 A JP 2005190400A JP 2003434177 A JP2003434177 A JP 2003434177A JP 2003434177 A JP2003434177 A JP 2003434177A JP 2005190400 A JP2005190400 A JP 2005190400A
Authority
JP
Japan
Prior art keywords
face image
image
detection target
face
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003434177A
Other languages
English (en)
Inventor
Toshinori Nagahashi
敏則 長橋
Takashi Hiuga
崇 日向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2003434177A priority Critical patent/JP2005190400A/ja
Priority to US11/022,069 priority patent/US20050139782A1/en
Priority to PCT/JP2004/019798 priority patent/WO2005064540A1/ja
Priority to TW093140626A priority patent/TWI254891B/zh
Publication of JP2005190400A publication Critical patent/JP2005190400A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Abstract

【課題】 人物顔が含まれているか否かが判明しない画像の中から人の顔画像が存在する可能性が高い領域を高速、かつ精度良く検出することができる新規な顔画像検出方法及び検出システム並びに検出プログラムの提供。
【解決手段】検出対象領域内を複数のブロックに分割して次元圧縮を行ってから、各ブロック毎の代表値で構成する特徴ベクトルを算出し、その特徴ベクトルを用いて前記検出対象領域内に顔画像が存在するか否かを識別器によって識別する。つまり、顔画像の特徴を損なわない程度まで画像特徴量の次元圧縮を行ってからように識別するようにしたものである。これによって、識別に利用する画像特徴量は検出対象領域内の画素の数からブロックの数にまで大幅に減少するため、演算量が激減して高速な顔画像検出を達成できる。
【選択図】 図1

Description

本発明は、パターン認識(Pattern recognition)やオブジェクト認識技術に係り、特に人物顔が含まれているか否かが判明しない画像中から当該人物顔が含まれているか否かを高速に検出するための顔画像検出方法及び検出システム並びに検出プログラムに関するものである。
近年のパターン認識技術やコンピュータ等の情報処理システムの高性能化に伴って文字や音声の認識精度は飛躍的に向上してきているが、人物や物体・景色等が映っている画像、例えば、ディジタルカメラ等によって取り込まれた画像のパターン認識のうち、特にその画像中に人の顔が映っているか否かを正確かつ高速に識別するといった点に関しては未だに極めて困難な作業であることが知られている。
しかしながら、このように画像中に人の顔が映っているか否か、さらにはその人物が誰であるのかをコンピュータ等によって自動的に正確に識別することは、生体認識技術の確立やセキュリティの向上、犯罪捜査の迅速化、画像データの整理・検索作業の高速化等を実現する上で極めて重要なテーマとなってきており、このようなテーマに関しては従来から多くの提案がなされている。
例えば、以下の特許文献1等では、ある入力画像について、先ず、人物肌色領域の有無を判定し、人物肌色領域に対して自動的にモザイクサイズを決定し、候補領域をモザイク化し、人物顔辞書との距離を計算することにより人物顔の有無を判定し、人物顔の切り出しを行うことによって、背景等の影響による誤抽出を減らし、効率的に画像中から人間の顔を自動的に見つけるようにしている。
特開平9−50528号公報
しかしながら、前記従来技術では、「肌色」を元に画像中から人間の顔を検出するようにしているが、この「肌色」は照明等の影響により、色範囲が異なることがあり、顔画像の検出漏れや逆に背景によっては絞り込みが効率的に行えない等の問題がある。
そこで、本発明はこのような課題を有効に解決するために案出されたものであり、その目的は、人物顔が含まれているか否かが判明しない画像の中から人の顔画像が存在する可能性が高い領域を高速、かつ精度良く検出することができる新規な顔画像検出方法及び検出システム並びに検出プログラムを提供するものである。
〔発明1〕
上記課題を解決するために発明1の顔画像検出方法は、
顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出する方法であって、前記検出対象画像内の所定の領域を検出対象領域として選択し、選択された検出対象領域内のエッジの強度を算出すると共に、算出されたエッジ強度に基づいて当該検出対象領域内を複数のブロックに分割した後、各ブロック毎の代表値で構成する特徴ベクトルを算出し、しかる後、それら特徴ベクトルを識別器に入力して前記検出対象領域内に顔画像が存在するか否かを識別するようにしたことを特徴とするものである。
すなわち、顔画像が含まれているかどうか分からない、又は含まれている位置についての知識もない画像から顔画像を抽出する技術としては、前述したように肌色領域を利用する方法の他に、輝度などから算出される顔画像特有の特徴ベクトルに基づいて検出する方法がある。
しかしながら、通常の特徴ベクトルを用いた方法では、例えば、僅か24×24画素の顔画像を検出する場合でも、576(24×24)次元の膨大な量の特徴ベクトル(ベクトルの要素が576個)を使った演算を行わなければならないため、高速な顔画像検出を行うことができない。
そこで、本発明は前記の通り、当該検出対象領域内を複数のブロックに分割してから、各ブロック毎の代表値で構成する特徴ベクトルを算出し、その特徴ベクトルを用いて前記検出対象領域内に顔画像が存在するか否かを識別器によって識別するようにしたものである。つまり、顔画像の特徴を損なわない程度まで画像特徴量の次元圧縮を行ってからように識別するようにしたものである。
これによって、識別に利用する画像特徴量は検出対象領域内の画素の数からブロックの数にまで大幅に減少するため、演算量が激減して高速な顔画像検出を達成することが可能となる。さらにエッジを使っているため、照明変動に強い顔画像の検出が可能になる。
〔発明2〕
発明2の顔画像検出方法は、
発明1に記載の顔画像検出方法において、前記ブロックの大きさは、自己相関係数に基づいて決定するようにしたことを特徴とするものである。
すなわち、後に詳述するが、自己相関係数を用い、その係数に基づいて顔画像本来の特徴を大きく損なわない程度までブロック化による次元圧縮を行うことが可能となるため、より高速かつ高精度な顔画像検出を実施することができる。
〔発明3〕
発明3の顔画像検出方法は、
発明1又は2に記載の顔画像検出方法において、前記エッジの強度に代わり、あるいはエッジの強度と共に、前記検出対象領域内の輝度値を求め、その輝度値に基づいて前記各ブロック毎の代表値で構成する特徴ベクトルを算出するようにしたことを特徴とするものである。
これによって、検出対象領域内に顔画像が存在する場合はその顔画像を精度良く、高速に識別することが可能となる。
〔発明4〕
発明4の顔画像検出方法は、
発明1〜3のいずれかに記載の顔画像検出方法において、前記各ブロック毎の代表値として、前記各ブロックを構成する画素の画像特徴量の分散値または平均値を用いるようにしたことを特徴とするものである。
これによって、識別手段に入力するための前記特徴ベクトルを的確に算出することができる。
〔発明5〕
発明5の顔画像検出方法は、
発明1〜4のいずれかに記載の顔画像検出方法において、前記識別器として、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したサポートベクタマシンを用いるようにしたことを特徴とするものである。
すなわち、本発明では生成された特徴ベクトルの識別手段として、サポートベクタマシンを利用するようにしたものであり、これによって、選択された検出対象領域内に人の顔画像が存在するか否かを高速、かつ精度良く識別することが可能となる。
ここで本発明で用いる、「サポートベクタマシン(Support Vector Machine:以下、適宜「SVM」と称する)」とは、後に詳述するが、1995年にAT&TのV.Vapnikによって統計的学習理論の枠組みで提案され、マージンという指標を用いて全ての2クラスの入力データを線形分離するのに最適な超平面を求めることができる学習機械のことであり、パターン認識の能力において最も優秀な学習モデルの一つであることが知られている。また、後述するように、線形分離不可能な場合でもカーネルトリックというテクニックを用いることにより、高い識別能力を発揮することが可能となっている。
〔発明6〕
発明6の顔画像検出方法は、
発明5に記載の顔画像検出方法において、前記サポートベクタマシンの識別関数として、非線形のカーネル関数を使用するようにしたことを特徴とするものである。
すなわち、このサポートベクタマシンの基本的な構造は、線形しきい素子であるが、これでは原則として線形分離不可能なデータである高次元の画像特徴ベクトルに適用することができない。
一方、このサポートベクタマシンによって非線形な分類を可能とする方法として高次元化が挙げられる。これは、非線形写像によって元の入力データを高次元特徴空間に写像して特徴空間において線形分離を行うという方法であり、これによって、結果的に元の入力空間においては非線形な識別を行う結果となるものである。
しかし、この非線形写像を得るためには膨大な計算を必要とするため、実際にはこの非線形写像の計算は行わずに「カーネル関数」という識別関数の計算に置き換えることができる。これをカーネルトリックといい、このカーネルトリックによって非線形写像を直接計算することを避け、計算上の困難を克服することが可能となっている。
従って、本発明で用いるサポートベクタマシンの識別関数として、この非線形な「カーネル関数」を用いれば、本来線形分離不可能なデータである高次元の画像特徴ベクトルでも容易に分離することができる。
〔発明7〕
発明7の顔画像検出方法は、
発明1〜4のいずれかに記載の顔画像検出方法において、前記識別器として、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したニューラルネットワークを用いるようにしたことを特徴とするものである。
このニューラルネットワークとは、生物の脳の神経回路網を模倣したコンピュータのモデルであり、特に多層型のニューラルネットワークであるPDP(Parallel Distributed Processing)モデルは、線形分離不可能なパターン学習が可能であってパターン認識技術の分類手法の代表的なものとなっている。但し、一般的に高次の特徴量を使用した場合、ニューラルネットでは識別能力が低下するといわれている。本発明では画像特徴量の次元が圧縮されているために、このような問題は発生しない。
従って、前記識別器として前記SVMに変えてこのようなニューラルネットワークを用いても高速かつ高精度な識別を実施することが可能となる。
〔発明8〕
発明8の顔画像検出方法は、
発明1〜7のいずれかに記載の顔画像検出方法において、前記検出対象領域内のエッジ強度は、各画素におけるSobelのオペレータを用いて算出するようにしたことを特徴とするものである。
すなわち、この「Sobelのオペレータ」とは、画像中のエッジや線のように濃淡が急激に変化している箇所を検出するための差分型のエッジ検出オペレータの一つである。
従って、このような「Sobelのオペレータ」を用いて各画素におけるエッジの強さ、又はエッジの分散値を生成することにより、画像特徴ベクトルを生成することができる。
尚、この「Sobelのオペレータ」の形状は、図9(a:横方向のエッジ)、(b:横方向のエッジ)に示す通りであり、それぞれのオペレータで生成した結果を二乗和した後、平方根をとることでエッジの強度を求めることができる。
〔発明9〕
発明9の顔画像検出システムは、
顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出するシステムであって、前記検出対象画像及び当該検出対象画像内の所定の領域を検出対象領域として読み取る画像読取手段と、前記画像読取手段で読み取った検出対象領域内をさらに複数のブロックに分割してそのブロック毎の代表値で構成する特徴ベクトルを算出する特徴ベクトル算出手段と、前記特徴ベクトル算出手段で得られた各ブロック毎の代表値で構成する特徴ベクトルに基づいて前記検出対象領域内に顔画像が存在するか否かを識別する識別手段と、を備えたことを特徴とするものである。
これによって、発明1と同様に、識別手段の識別に利用する画像特徴量が検出対象領域内の画素の数からブロックの数にまで大幅に減少するため、顔画像検出を高速、かつ自動的に達成することが可能となる。
〔発明10〕
発明10の顔画像検出システムは、
発明9に記載の顔画像検出システムにおいて、前記特徴ベクトル算出手段は、前記画像読取手段で読み取った検出対象領域内の各画素における輝度値を算出する輝度算出部と、前記検出対象領域内のエッジの強度を算出するエッジ算出部と、前記輝度算出部で得られた輝度値又は前記エッジ算出部で得られたエッジの強度、あるいは両方の値の平均値又は分散値を算出する平均・分散値算出部とからなることを特徴とするものである。
これによって、発明4と同様に、識別手段に入力するための前記特徴ベクトルを的確に算出することができる。
〔発明11〕
発明11の顔画像検出システムは、
発明9又は10に記載の顔画像検出システムにおいて、前記識別手段は、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したサポートベクタマシンからなることを特徴とするものである。
これによって、発明5と同様に選択された検出対象領域内に人の顔画像が存在するか否かを高速、かつ精度良く識別することが可能となる。
〔発明12〕
発明12の顔画像検出プログラムは、
顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出するプログラムであって、コンピュータを、前記検出対象画像及び当該検出対象画像内の所定の領域を検出対象領域として読み取る画像読取手段と、前記画像読取手段で読み取った検出対象領域内をさらに複数のブロックに分割してそのブロック毎の代表値で構成する特徴ベクトルを算出する特徴ベクトル算出手段と、前記特徴ベクトル算出手段で得られた各ブロック毎の代表値で構成する特徴ベクトルに基づいて前記検出対象領域内に顔画像が存在するか否かを識別する識別手段と、して機能させることを特徴とするものである。
これによって、発明1と同様な効果が得られると共に、パソコン等の汎用のコンピュータシステムを用いてソフトウェア上でそれらの各機能を実現することができるため、それぞれ専用のハードウェアを製作して実現する場合に比べて、経済的かつ容易に実現することが可能となる。また、プログラムの書き換えだけでそれら各機能の改良も容易に行うことができる。
〔発明13〕
発明13の顔画像検出プログラムは、
発明12に記載の顔画像検出プログラムにおいて、前記特徴ベクトル算出手段は、前記画像読取手段で読み取った検出対象領域内の各画素における輝度値を算出する輝度算出部と、前記検出対象領域内のエッジの強度を算出するエッジ算出部と、前記輝度算出部で得られた輝度値又は前記エッジ算出部で得られたエッジの強度、あるいは両方の値の平均値又は分散値を算出する平均・分散値算出部とからなることを特徴とするものである。
これによって、発明4と同様に識別手段に入力するための最適な画像特徴ベクトルを的確に算出することができ、また、発明12と同様に、パソコン等の汎用のコンピュータシステムを用いてソフトウェア上でそれらの各機能を実現することができるため、経済的かつ容易に実現することが可能となる。
〔発明14〕
発明14の顔画像検出プログラムは、
発明12又は13に記載の顔画像検出プログラムにおいて、前記識別手段は、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したサポートベクタマシンからなることを特徴とするものである。
これによって、発明5と同様に選択された検出対象領域内に人の顔画像が存在するか否かを高速、かつ精度良く識別することが可能となり、また、発明12と同様にパソコン等の汎用のコンピュータシステムを用いてソフトウェア上でそれらの各機能を実現することができるため、経済的かつ容易に実現することが可能となる。
以下、本発明を実施するための最良の形態を添付図面を参照しながら詳述する。
図1は、本発明に係る顔画像検出システム100の実施の一形態を示したものである。
図示するように、この顔画像検出システム100は、学習用のサンプル画像と検出対象画像を読み取るための画像読取手段10と、この画像読取手段10で読み取った画像の特徴ベクトルを生成する特徴ベクトル算出手段20と、この特徴ベクトル算出手段20で生成した特徴ベクトルから前記検索対象画像が顔画像候補領域であるか否かを識別する識別手段30であるSVM(サポートベクタマシン)とから主に構成されている。
この画像読取手段10は、具体的には、ディジタルスチルカメラやディジタルビデオカメラ等のCCD(Charge Coupled Device:電荷結合素子)カメラやビジコンカメラ、イメージスキャナ、ドラムスキャナ等であり、読み込んだ検出対象画像内の所定の領域、及び学習用のサンプル画像となる複数の顔画像と非顔画像とをA/D変換してそのディジタルデータを特徴ベクトル算出手段20へ順次送る機能を提供するようになっている。
特徴ベクトル算出手段20は、さらに、画像中の輝度(Y)を算出する輝度算出部22と、画像中のエッジの強度を算出するエッジ算出部24と、このエッジ算出部24で生成されたエッジの強度又は前記輝度算出部22で生成された輝度の平均又はエッジの強度の分散値を求める平均・分散値算出部26とから構成されており、この平均・分散値生成部26でサンプリングされる画素値からサンプル画像及び検索対象画像毎の画像特徴ベクトルを生成してこれをSVM30に順次送る機能を提供するようになっている。
SVM30は、前記特徴ベクトル算出手段20で生成した学習用のサンプルとなる複数の顔画像及び非顔画像の画像特徴ベクトルを学習すると共に、その学習結果から特徴ベクトル算出手段20で生成した検索対象画像内の所定の領域が顔像候補領域であるか否かを識別する機能を提供するようになっている。
このSVM30は、前述したようにマージンという指標を用いて全ての入力データを線形分離するのに最適な超平面を求めることができる学習機械のことであり、線形分離不可能な場合でもカーネルトリックというテクニックを用いることにより、高い識別能力を発揮できることが知られている。
そして、本実施の形態で用いるSVM30は、1.学習を行うステップと、2.識別を行うステップに分かれる。
先ず、1.学習を行うステップは、図1に示すように学習用のサンプル画像となる多数の顔画像及び非顔画像を画像読取手段10で読み取った後、特徴ベクトル生成部20で各画像の特徴ベクトルを生成し、これを画像特徴ベクトルとして学習するものである。
その後、2.識別を行うステップでは、検索対象画像内の所定の選択領域を順次読み込んでこれを同じく特徴ベクトル算出部20でその画像特徴ベクトルを生成し、これを特徴ベクトルとして入力し、入力された画像特徴ベクトルがその識別超平面に対していずれの領域に該当するかで顔画像が存在する可能性が高い領域か否かを検出するものである。
ここで、学習に用いられるサンプル用の顔画像及び非顔画像の大きさについては後に詳述するが、例えば24×24pixel(画素)のものを所定数にブロック化したものであって、検出対象となる領域のブロック化後の大きさと同じ大きさの領域について行われることになる。
さらに、このSVMについて「パターン認識と学習の統計学」(岩波書店、麻生英樹、津田宏治、村田昇著)pp.107〜118の記述に基づいて多少詳しく説明すると、識別する問題が非線形である場合、SVMでは非線形なカーネル関数を用いることができ、この場合の識別関数は以下の数式1で示される。
すなわち、数式1の値が「0」の場合に識別超平面になり、「0」以外の場合は与えられた画像特徴ベクトルから計算した識別超平面からの距離の距離となる。また、数式1の結果が非負の場合は、顔画像、負の場合は非顔画像である。
xは特徴ベクトル、xはサポートベクトルであり、特徴ベクトル算出部20で生成された値を用いる。Kはカーネル関数であり、本実施の形態では以下の数式2の関数を用いる。
尚、この顔画像検出システム100を構成する特徴ベクトル算出手段20、SVM30並びに画像読取手段10等は、実際には、CPUやRAM等からなるハードウェアと、専用のコンピュータプログラム(ソフトウェア)とからなるパソコン(PC)等のコンピュータシステムによって実現されるようになっている。
すなわち、この顔画像検出システム100を実現するためのコンピュータシステムは、例えば図2に示すように、各種制御や演算処理を担う中央演算処理装置であるCPU(Central Processing Unit)40と、主記憶装置(Main Storage)に用いられるRAM(Random Access Memory)41と、読み出し専用の記憶装置であるROM(Read Only Memory)42と、ハードディスクドライブ装置(HDD)や半導体メモリ等の補助記憶装置(Secondary Storage)43、及びモニタ(LCD(液晶ディスプレイ)やCRT(陰極線管))等からなる出力装置44、イメージスキャナやキーボード、マウス、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像センサ等からなる入力装置45と、これらの入出力インターフェース(I/F)46等との間を、PCI(Peripheral Component Interconnect)バスやISA(Industrial Standard Architecture;アイサ)バス等からなるプロセッサバス、メモリバス、システムバス、入出力バス等の各種内外バス47によってバス接続したものである。
そして、例えば、CD−ROMやDVD−ROM、フレキシブルディスク(FD)等の記憶媒体、あるいは通信ネットワーク(LAN、WAN、インターネット等)Nを介して供給される各種制御用プログラムやデータを補助記憶装置43等にインストールすると共にそのプログラムやデータを必要に応じて主記憶装置44にロードし、その主記憶装置41にロードされたプログラムに従ってCPU44が各種リソースを駆使して所定の制御及び演算処理を行い、その処理結果(処理データ)をバス47を介して出力装置44に出力して表示すると共に、そのデータを必要に応じて補助記憶装置43によって形成されるデータベースに適宜記憶、保存(更新)処理するようにしたものである。
次に、このような構成を顔画像検出システム100を用いた顔画像検出方法の一例を説明する。
図3は、実際に検索対象となる画像に対する顔画像検出方法の一例を示すフローチャートであるが、実際の検出対象画像を用いて識別を実施する前には、前述したように識別に用いるSVM30に対する学習用のサンプル画像となる顔画像及び非顔画像を学習させるステップを経る必要がある。
この学習ステップは、従来通り、サンプル画像となる顔画像及び非顔画像毎の特徴ベクトルを生成してその特徴ベクトルを顔画像であるか非顔画像であるかの情報と共に入力するものである。尚、ここで学習に用いる学習画像は、実際の検出対象画像の選択領域と同じ処理が成された画像を用いることが望ましい。すなわち、後に詳述するが、本発明の識別対象となる画像領域は、次元圧縮されていることから、それと同じ次元まで予め圧縮した画像を用いることで、より高速かつ高精度な識別を行うことが可能となる。
そして、このようにしてSVM30に対してサンプル画像の特徴ベクトルの学習が行われたならば、図3のステップS101に示すように、先ず検出対象画像内の検出対象となる領域を決定(選択)する。尚、この検出対象領域の決定方法としては、特に限定されるものではなく、他の顔画像識別手段で得られた領域をそのまま採用したり、又は本システムの利用者等が検出対象画像内で任意に指定した領域を採用しても良いが、この検出対象画像については、原則としてどの位置に顔画像が含まれているかは勿論、顔画像が含まれているか否かも分かっていないことが殆どであると考えられるため、例えば、検出対象画像の左上の角を始点とした一定の領域から始めて順次水平及び垂直方向に一定の画素毎にずらしながら全ての領域をしらみ潰しに探索するようにその領域を選択することが望ましい。また、その領域の大きさは一定である必要はなく、適宜大きさを変えながら選択するようにしても良い。
その後、このようにして顔画像の検出対象となる最初の領域が選択されたならば、図3に示すように、次のステップS103に移行してその最初の検出対象領域の大きさを所定のサイズ、例えば24×24画素に正規化(リサイズ)する。すなわち、原則として検出対象となる画像には顔画像が含まれている否かは勿論、その大きさも不明であるため、選択される領域の顔画像の大きさによってはその画素数が大幅に異なることから、取り敢えず選択された領域については基準となる大きさ(24×24画素)の大きさにリサイズ(正規化)する。
次に、このようにして選択領域の正規化が終了したならば、次のステップS105に移行して正規化した領域のエッジの強度を各画素について求めた後、その領域内を複数のブロックに分割して各ブロック内のエッジの強度の平均値、又は分散値を算出する。
図4は、このように正規化した後のエッジ強度の変化を示した図(画像)であり、算出されたエッジ強度が24×24画素(pixel)として表示されている。また、図5は、この領域内をさらに6×8にブロック化して各ブロック内のエッジ強度の平均値を各ブロックの代表値として表示したものであり、さらに、図6は同じく、この領域内をさらに6×8にブロック化して各ブロック内のエッジ強度の分散値を各ブロックの代表値として表示したものである。尚、図中上段両端のエッジ部分は人物顔の「両目」を、図中中央中段部分のエッジ部分は「鼻」を、図中中央下段部分のエッジ部分は人物顔の「唇部分」を示したものである。本発明のように次元を圧縮しても、顔画像の特徴をそのまま残していることが明白である。
ここで、領域内のブロック化数としては、自己相関係数に基づいて画像の特徴量を大きく損なわない程度までブロック化することが肝要であり、ブロック化数が多くなり過ぎると算出される画像特徴ベクトルの数も多くなって処理負荷が増大し、検出の高速化が達成できなくなるからである。すなわち、自己相関係数が閾値以上であれば、ブロック内での画像特徴量の値、あるいは変動パターンが一定範囲に収まっていると考えることができる。
この自己相関係数の算出方法としては、以下の式3及び式4を利用することで容易に求めることができる。式3は検索対象画像に対する水平(幅)方向(H)の自己相関係数を算出するための式であり、式4は、検索対象画像に対する垂直(高さ)方向(V)の自己相関係数を算出するための式である。
そして、図7及び図8はこのような式3、式4を用いて得られた画像の水平方向(H)及び垂直方向(V)のそれぞれの相関係数の一例を示したものである。
図7に示すように、基準となる画像に対して一方の画像のズレが水平方向に「0」、すなわち、両画像が完全に重なり合っているときの両画像間の相関関係は最大の「1.0」であるが、一方の画像が基準となる画像に対して水平方向に「1」画素分だけズレると、両画像間の相関関係は、約「0.9」、また、「2」画素分だけズレると、両画像間の相関関係は、約「0.75」といったように、両画像間の相関関係は、水平方向に対してそのズレ量(画素数)が増えるに従って徐々に低下することがわかる。
また、図8に示すように、基準となる画像に対して一方の画像のズレが垂直方向に「0」、すなわち、両画像が完全に重なり合っているときの両画像間の相関関係は同じく最大の「1.0」であるが、一方の画像が基準となる画像に対して垂直方向に「1」画素分だけズレると、両画像間の相関関係は、約「0.8」、また、「2」画素分だけズレると、両画像間の相関関係は、約「0.65」といったように、両画像間の相関関係は、垂直方向に対してもそのズレ量(画素数)が増えるに従って徐々に低下することがわかる。
この結果、そのズレ量が比較的少ない場合、すなわち、一定の画素数の範囲内では、両画像間の画像特徴量に大きな差はなく、ほぼ同じものと考えることができる。
このように画像特徴量の値あるいは変動パターンが一定と考える範囲(閾値)は、検出速度や検出の信頼性等によって異なってくるが、本実施の形態では、図中矢印に示すように水平方向については「4」画素まで、垂直方向に対しては「3」画素までとした。すなわち、この範囲内のズレ量の画像であれば画像特徴量の変化が少なく、一定範囲の変動の範囲として取り扱っても良い。この結果、本実施の形態では、元の選択領域の特徴を大きく損なわずに、1/12(6×8=48次元/24×24=576次元)まで次元圧縮することが可能となる。
本発明はこのように画像特徴量に一定の幅がある点に着目して案出されたものであり、自己相関係数が一定値を下回らない範囲内を一つのブロックとして扱い、そのブロック内の代表値で構成する画像特徴ベクトルを採用するようにしたものである。
そして、このようにして検出対象となる領域の次元圧縮を行ったならば、各ブロック毎の代表値で構成する画像特徴ベクトルを算出した後、得られた画像特徴ベクトルを識別器(SVM)30に入力することで当該領域に顔画像が存在するか否かを判別することになる(ステップS109)。
その後、その判別結果は、その判定が終了する都度、あるいは他の判別結果と共に纏めて利用者に示されると共に、次のステップS110に移行して全ての領域について判定処理が実行されるのを待って処理が終了することになる。
すなわち、図4〜図6の例では、各ブロックは、自己相関係数が一定値を下回らない、それぞれ縦横に隣接する12個の画素(3×4)からなっており、この12個の画素の画像特徴量(エッジ強度)の平均値(図5)及び分散値(図6)が各ブロックの代表値として算出され、その代表値から得られた画像特徴ベクトルを識別器(SVM)30に入力して判定処理を行うことになる。
このように本発明は検出対象の領域の全ての画素の特徴量をそのまま利用するのではなく、画像本来の特徴量を損なわない程度まで次元圧縮してから識別するようにしたため、計算量が大幅に削減することが可能となり、選択された領域に顔画像が存在するか否かを高速、かつ精度良く識別することができる。
尚、本実施の形態では、エッジの強度に基づく画像特徴量を採用したが、画像の種類によってはエッジの強度よりも、画素の輝度値を用いた方がより効率的に次元圧縮できる場合があり、この場合は、輝度値単独で、あるいはエッジの強度を併用した画像特徴量を用いても良い。
また、本発明では、検出対象画像として将来極めて有望な「人間の顔」を対象としたものであるが、「人間の顔」のみならず、「人間の体型」や「動物の顔、姿態」、「自動車等の乗り物」、「建造物」、「植物」、「地形」等といった他のあらゆるオブジェクトへの適用も可能である。
また、図9は、本発明で適用可能な差分型エッジ検出オペレータの一つである「Sobelのオペレータ」を示したものである。
図9(a)に示すオペレータ(フィルタ)は、注目画素を囲む8つの画素値のうち、左列及び右列に位置するそれぞれ3つの画素値を調整することで横方向のエッジを強調し、図9(b)に示すオペレータは、注目画素を囲む8つの画素値のうち、上行及び下列に位置するそれぞれ3つの画素値を調整して縦方向のエッジを強調することで縦横のエッジを検出するものである。
そして、このようなオペレータで生成した結果を二乗和した後、平方根をとることでエッジの強度を求め、各画素におけるエッジの強さ、又はエッジの分散値を生成することにより、画像特徴ベクトルを精度良く検出することができる。尚、前述したように、この「Sobelのオペレータ」に代えて「Roberts」や「Prewitt」等の他の差分型エッジ検出オペレータや、テンプレート型エッジ検出オペレータ等を適用することも可能である。
また、前記識別器30としてSVMに変えてニューラルネットワークを用いても高速かつ高精度な識別を実施することが可能となる。
顔画像検出システムの実施の一形態を示すブロック図である。 顔画像検出システムを実現するハードウェア構成を示す図である。 顔画像検出方法の実施の一形態を示すフローチャート図である。 エッジ強度の変化を示す図である。 エッジ強度の平均値を示す図である。 エッジ強度の分散値を示す図である。 画像の水平方向に対するズレ量と相関係数との関係を示すグラフ図である。 画像の垂直方向に対するズレ量と相関係数との関係を示すグラフ図である。 Sobelのフィルタの形状を示す図である。
符号の説明
10…画像読取手段、20…特徴ベクトル算出手段、22…輝度算出部、24…エッジ算出部、26…平均・分散値生成部、30…識別手段(SVM(サポートベクタマシン))、100…顔画像検出システム、40…CPU、41…RAM、42…ROM、43…補助記憶装置、44…出力装置、45…入力装置、46…入出力インターフェース(I/F)、47…バス。

Claims (14)

  1. 顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出する方法であって、
    前記検出対象画像内の所定の領域を検出対象領域として選択し、選択された検出対象領域内のエッジの強度を算出すると共に、算出されたエッジ強度に基づいて当該検出対象領域内を複数のブロックに分割した後、各ブロック毎の代表値で構成する特徴ベクトルを算出し、しかる後、それら特徴ベクトルを識別器に入力して前記検出対象領域内に顔画像が存在するか否かを検出するようにしたことを特徴とする顔画像検出方法。
  2. 請求項1に記載の顔画像検出方法において、
    前記ブロックの大きさは、自己相関係数に基づいて決定するようにしたことを特徴とする顔画像検出方法。
  3. 請求項1又は2に記載の顔画像検出方法において、
    前記エッジの強度に代わり、あるいはエッジの強度と共に、前記検出対象領域内の輝度値を求め、当該輝度値に基づいて前記各ブロック毎の代表値で構成する特徴ベクトルを算出するようにしたことを特徴とする顔画像検出方法。
  4. 請求項1〜3のいずれかに記載の顔画像検出方法において、
    前記各ブロック毎の代表値として、前記各ブロックを構成する画素の画像特徴量の分散値または平均値を用いるようにしたことを特徴とする顔画像検出方法。
  5. 請求項1〜4のいずれかに記載の顔画像検出方法において、
    前記識別器として、予め複数の学習用のサンプル顔画像とサンプル非顔画像とを学習したサポートベクタマシンを用いるようにしたことを特徴とする顔画像検出方法。
  6. 請求項5に記載の顔画像検出方法において、
    前記サポートベクタマシンの識別関数として、非線形のカーネル関数を使用するようにしたことを特徴とする顔画像検出方法。
  7. 請求項1〜4のいずれかに記載の顔画像検出方法において、
    前記識別器として、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したニューラルネットを用いるようにしたことを特徴とする顔画像検出方法。
  8. 請求項1〜7のいずれかに記載の顔画像検出方法において、
    前記検出対象領域内のエッジ強度は、各画素におけるSobelのオペレータを用いて算出するようにしたことを特徴とする顔画像検出方法。
  9. 顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出するシステムであって、
    前記検出対象画像及び当該検出対象画像内の所定の領域を検出対象領域として読み取る画像読取手段と、
    前記画像読取手段で読み取った検出対象領域内をさらに複数のブロックに分割してそのブロック毎の代表値で構成する特徴ベクトルを算出する特徴ベクトル算出手段と、
    前記特徴ベクトル算出手段で得られた各ブロック毎の代表値で構成する特徴ベクトルに基づいて前記検出対象領域内に顔画像が存在するか否かを識別する識別手段と、を備えたことを特徴とする顔画像検出システム。
  10. 請求項9に記載の顔画像検出システムにおいて、
    前記特徴ベクトル算出手段は、前記画像読取手段で読み取った検出対象領域内の各画素における輝度値を算出する輝度算出部と、前記検出対象領域内のエッジの強度を算出するエッジ算出部と、前記輝度算出部で得られた輝度値又は前記エッジ算出部で得られたエッジの強度、あるいは両方の値の平均値又は分散値を算出する平均・分散値算出部とからなることを特徴とする顔画像検出システム。
  11. 請求項9又は10に記載の顔画像検出システムにおいて、
    前記識別手段は、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したサポートベクタマシンからなることを特徴とする顔画像検出システム。
  12. 顔画像が含まれているか否かが判明しない検出対象画像中に顔画像が存在するか否かを検出するプログラムであって、コンピュータを、
    前記検出対象画像及び当該検出対象画像内の所定の領域を検出対象領域として読み取る画像読取手段と、
    前記画像読取手段で読み取った検出対象領域内をさらに複数のブロックに分割してそのブロック毎の代表値で構成する特徴ベクトルを算出する特徴ベクトル算出手段と、
    前記特徴ベクトル算出手段で得られた各ブロック毎の代表値で構成する特徴ベクトルに基づいて前記検出対象領域内に顔画像が存在するか否かを識別する識別手段と、して機能させることを特徴とする顔画像検出プログラム。
  13. 請求項12に記載の顔画像検出プログラムにおいて、
    前記特徴ベクトル算出手段は、前記画像読取手段で読み取った検出対象領域内の各画素における輝度値を算出する輝度算出部と、前記検出対象領域内のエッジの強度を算出するエッジ算出部と、前記輝度算出部で得られた輝度値又は前記エッジ算出部で得られたエッジの強度、あるいは両方の値の平均値又は分散値を算出する平均・分散値算出部とからなることを特徴とする顔画像検出プログラム。
  14. 請求項12又は13に記載の顔画像検出プログラムにおいて、
    前記識別手段は、予め複数の学習用のサンプル顔画像とサンプル非顔画像を学習したサポートベクタマシンからなることを特徴とする顔画像検出プログラム。
JP2003434177A 2003-12-26 2003-12-26 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム Withdrawn JP2005190400A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003434177A JP2005190400A (ja) 2003-12-26 2003-12-26 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
US11/022,069 US20050139782A1 (en) 2003-12-26 2004-12-23 Face image detecting method, face image detecting system and face image detecting program
PCT/JP2004/019798 WO2005064540A1 (ja) 2003-12-26 2004-12-24 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
TW093140626A TWI254891B (en) 2003-12-26 2004-12-24 Face image detection method, face image detection system, and face image detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003434177A JP2005190400A (ja) 2003-12-26 2003-12-26 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム

Publications (1)

Publication Number Publication Date
JP2005190400A true JP2005190400A (ja) 2005-07-14

Family

ID=34697754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003434177A Withdrawn JP2005190400A (ja) 2003-12-26 2003-12-26 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム

Country Status (4)

Country Link
US (1) US20050139782A1 (ja)
JP (1) JP2005190400A (ja)
TW (1) TWI254891B (ja)
WO (1) WO2005064540A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272435A (ja) * 2006-03-30 2007-10-18 Univ Of Electro-Communications 顔特徴抽出装置及び顔特徴抽出方法
JP2011053953A (ja) * 2009-09-02 2011-03-17 Toyota Central R&D Labs Inc 画像処理装置及びプログラム
JP2015028723A (ja) * 2013-07-30 2015-02-12 富士通株式会社 生体特徴ベクトル抽出装置、生体特徴ベクトル抽出方法、および生体特徴ベクトル抽出プログラム
US10489684B2 (en) 2015-12-14 2019-11-26 Samsung Electronics Co., Ltd. Image processing apparatus and method based on deep learning and neural network learning

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405388C (zh) * 2004-05-14 2008-07-23 欧姆龙株式会社 特定被摄体检测装置
US8311294B2 (en) 2009-09-08 2012-11-13 Facedouble, Inc. Image classification and information retrieval over wireless digital networks and the internet
US8600174B2 (en) 2005-09-28 2013-12-03 Facedouble, Inc. Method and system for attaching a metatag to a digital image
US7599527B2 (en) * 2005-09-28 2009-10-06 Facedouble, Inc. Digital image search system and method
US7587070B2 (en) * 2005-09-28 2009-09-08 Facedouble, Inc. Image classification and information retrieval over wireless digital networks and the internet
US7907791B2 (en) * 2006-11-27 2011-03-15 Tessera International, Inc. Processing of mosaic images
TW200842733A (en) 2007-04-17 2008-11-01 Univ Nat Chiao Tung Object image detection method
JP4479756B2 (ja) 2007-07-05 2010-06-09 ソニー株式会社 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
JP5505761B2 (ja) * 2008-06-18 2014-05-28 株式会社リコー 撮像装置
US8331684B2 (en) * 2010-03-12 2012-12-11 Sony Corporation Color and intensity based meaningful object of interest detection
TWI452540B (zh) * 2010-12-09 2014-09-11 Ind Tech Res Inst 影像式之交通參數偵測系統與方法及電腦程式產品
EP2697775A4 (en) * 2011-04-11 2015-03-04 Intel Corp METHOD FOR DETECTING FACE FEATURES
CN105611344B (zh) * 2014-11-20 2019-11-05 乐金电子(中国)研究开发中心有限公司 一种智能电视机及其锁屏方法
US10860837B2 (en) * 2015-07-20 2020-12-08 University Of Maryland, College Park Deep multi-task learning framework for face detection, landmark localization, pose estimation, and gender recognition
CN105741229B (zh) * 2016-02-01 2019-01-08 成都通甲优博科技有限责任公司 实现人脸图像快速融合的方法
JP6904842B2 (ja) * 2017-08-03 2021-07-21 キヤノン株式会社 画像処理装置、画像処理方法
KR102532230B1 (ko) 2018-03-30 2023-05-16 삼성전자주식회사 전자 장치 및 그 제어 방법
CN110647866B (zh) * 2019-10-08 2022-03-25 杭州当虹科技股份有限公司 一种检测文字笔画的方法
CN112380965B (zh) * 2020-11-11 2024-04-09 浙江大华技术股份有限公司 进行人脸识别的方法及多目摄像机

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2973676B2 (ja) * 1992-01-23 1999-11-08 松下電器産業株式会社 顔画像特徴点抽出装置
JPH10233926A (ja) * 1997-02-18 1998-09-02 Canon Inc データ処理装置およびデータ処理方法およびコンピュータが読み出し可能なプログラムを格納した記憶媒体
JP2000222572A (ja) * 1999-01-28 2000-08-11 Toshiba Tec Corp 性別の判定方法
US6792135B1 (en) * 1999-10-29 2004-09-14 Microsoft Corporation System and method for face detection through geometric distribution of a non-intensity image property
JP2001216515A (ja) * 2000-02-01 2001-08-10 Matsushita Electric Ind Co Ltd 人物の顔の検出方法およびその装置
JP2002051316A (ja) * 2000-05-22 2002-02-15 Matsushita Electric Ind Co Ltd 画像通信端末
US6804391B1 (en) * 2000-11-22 2004-10-12 Microsoft Corporation Pattern detection methods and systems, and face detection methods and systems
US7155036B2 (en) * 2000-12-04 2006-12-26 Sony Corporation Face detection under varying rotation
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection
US6879709B2 (en) * 2002-01-17 2005-04-12 International Business Machines Corporation System and method for automatically detecting neutral expressionless faces in digital images
EP1359536A3 (en) * 2002-04-27 2005-03-23 Samsung Electronics Co., Ltd. Face recognition method and apparatus using component-based face descriptor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272435A (ja) * 2006-03-30 2007-10-18 Univ Of Electro-Communications 顔特徴抽出装置及び顔特徴抽出方法
JP2011053953A (ja) * 2009-09-02 2011-03-17 Toyota Central R&D Labs Inc 画像処理装置及びプログラム
JP2015028723A (ja) * 2013-07-30 2015-02-12 富士通株式会社 生体特徴ベクトル抽出装置、生体特徴ベクトル抽出方法、および生体特徴ベクトル抽出プログラム
US9792512B2 (en) 2013-07-30 2017-10-17 Fujitsu Limited Device to extract biometric feature vector, method to extract biometric feature vector, and computer-readable, non-transitory medium
US10489684B2 (en) 2015-12-14 2019-11-26 Samsung Electronics Co., Ltd. Image processing apparatus and method based on deep learning and neural network learning
US11341375B2 (en) 2015-12-14 2022-05-24 Samsung Electronics Co., Ltd. Image processing apparatus and method based on deep learning and neural network learning

Also Published As

Publication number Publication date
TW200529093A (en) 2005-09-01
WO2005064540A1 (ja) 2005-07-14
TWI254891B (en) 2006-05-11
US20050139782A1 (en) 2005-06-30

Similar Documents

Publication Publication Date Title
JP2005190400A (ja) 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
EP3916627A1 (en) Living body detection method based on facial recognition, and electronic device and storage medium
EP3333768A1 (en) Method and apparatus for detecting target
KR100608595B1 (ko) 얼굴 인식 방법 및 장치
US9213890B2 (en) Gesture recognition system for TV control
JP5629803B2 (ja) 画像処理装置、撮像装置、画像処理方法
JP6351240B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR101896357B1 (ko) 객체를 검출하는 방법, 디바이스 및 프로그램
JP6332937B2 (ja) 画像処理装置、画像処理方法及びプログラム
EP1775683A1 (en) Object image detection device, face image detection program, and face image detection method
EP1168247A2 (en) Method for varying an image processing path based on image emphasis and appeal
US20050141766A1 (en) Method, system and program for searching area considered to be face image
JP2007047965A (ja) デジタル画像の対象物検出方法および装置並びにプログラム
EP4006777A1 (en) Image classification method and device
JP2010262601A (ja) パターン認識システム及びパターン認識方法
JP2005165984A (ja) 人物顔の頭頂部検出方法及び頭頂部検出システム並びに頭頂部検出プログラム
JP2005134966A (ja) 顔画像候補領域検索方法及び検索システム並びに検索プログラム
JP2007025902A (ja) 画像処理装置、画像処理方法
JP5201184B2 (ja) 画像処理装置及びプログラム
JP2006323779A (ja) 画像処理方法、画像処理装置
CN109657577B (zh) 一种基于熵和运动偏移量的动物检测方法
JP5407897B2 (ja) 画像分類方法、装置、及びプログラム
Jindal et al. Sign Language Detection using Convolutional Neural Network (CNN)
JP2007026308A (ja) 画像処理方法、画像処理装置
CN111881732B (zh) 一种基于svm的人脸质量评价方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20050606