JP2005134966A - 顔画像候補領域検索方法及び検索システム並びに検索プログラム - Google Patents

顔画像候補領域検索方法及び検索システム並びに検索プログラム Download PDF

Info

Publication number
JP2005134966A
JP2005134966A JP2003367210A JP2003367210A JP2005134966A JP 2005134966 A JP2005134966 A JP 2005134966A JP 2003367210 A JP2003367210 A JP 2003367210A JP 2003367210 A JP2003367210 A JP 2003367210A JP 2005134966 A JP2005134966 A JP 2005134966A
Authority
JP
Japan
Prior art keywords
image
face image
area
feature vector
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003367210A
Other languages
English (en)
Other versions
JP2005134966A5 (ja
Inventor
Toshinori Nagahashi
敏則 長橋
Takashi Hiuga
崇 日向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2003367210A priority Critical patent/JP2005134966A/ja
Priority to CNA2004800116534A priority patent/CN1781122A/zh
Priority to EP04792484A priority patent/EP1679655A4/en
Priority to PCT/JP2004/015267 priority patent/WO2005041128A1/ja
Priority to US10/968,843 priority patent/US20050190953A1/en
Publication of JP2005134966A publication Critical patent/JP2005134966A/ja
Publication of JP2005134966A5 publication Critical patent/JP2005134966A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

【課題】 画像の中から人の顔画像が存在する可能性が高い領域を高速かつ正確に検索できる新規な顔画像候補領域検索方法及び検索システム並びに検索プログラムの提供。
【解決手段】検索対象画像G内を所定の領域毎に順次選択してから当該選択領域の画像特徴ベクトルを生成し、その後、予め複数の学習用のサンプル画像の画像特徴ベクトルを学習済みのサポートベクタマシン30にその画像特徴ベクトルを入力し、その識別超平面に対する位置関係に応じて当該選択領域に顔画像が存在するか否かを判定する。これによって、検索対象画像Gの中から人の顔画像が存在する可能性が高い領域を高速かつ精度良く検索できる。
【選択図】 図1

Description

本発明は、パターン認識(Pattern recognition)やオブジェクト認識技術に係り、特に画像の中から人物の顔画像が存在する可能性が高い領域を高速に検索するための方法及び検索システム並びに検索プログラムに関するものである。
近年のパターン認識技術やコンピュータ等の情報処理装置の高性能化に伴って文字や音声の認識精度は飛躍的に向上してきているが、人物や物体・景色等が映っている画像、例えば、ディジタルカメラ等によって取り込まれた画像のパターン認識のうち、特にその画像中に人の顔が映っているか否かを正確かつ高速に識別するといった点に関しては未だに極めて困難な作業であることが知られている。
しかしながら、このように画像中に人の顔が映っているか否か、さらにはその人物が誰であるのかをコンピュータ等によって自動的に正確に識別することは、生体認識技術の確立やセキュリティの向上、犯罪捜査の迅速化、画像データの整理・検索作業の高速化等を実現する上で極めて重要なテーマとなってきており、このようなテーマに関しては従来から多くの提案がなされている。
例えば、以下の特許文献1等では、ある入力画像について、先ず、人物肌色領域の有無を判定し、人物肌色領域に対して自動的にモザイクサイズを決定し、候補領域をモザイク化し、人物顔辞書との距離を計算することにより人物顔の有無を判定し、人物顔の切り出しを行うことによって、背景等の影響による誤抽出を減らし、効率的に画像中から人間の顔を自動的に見つけるようにしている。
特開平9−50528号公報
しかしながら、前記従来技術では、「肌色」を元に画像中から人間の顔を検出するようにしているが、この「肌色」は照明等の影響により、色範囲が異なることがあり、顔画像の検出漏れや逆に背景によっては絞り込みが効率的に行えない等の問題がある。
一般に画像内では顔画像領域よりも背景の方が大きな面積を占めるために、高速に顔画像領域を検出するために絞り込みが効率的に行えることが重要である。
そこで、本発明はこのような課題を有効に解決するために案出されたものであり、その目的は、画像の中から人の顔画像が存在する可能性が高い領域を高速、かつ精度良く検索することができる新規な顔画像候補領域検索方法及び検索システム並びに検索プログラムを提供するものである。
〔発明1〕
上記課題を解決するために発明1の顔画像候補領域検索方法は、
顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索する方法であって、前記検索対象画像内を所定の領域毎に順次選択してから当該選択領域の画像特徴ベクトルを生成し、その後、予め複数の学習用のサンプル画像の画像特徴ベクトルを学習済みのサポートベクタマシンにその画像特徴ベクトルを入力し、その識別超平面に対する位置関係に応じて当該選択領域に顔画像が存在するか否かを判定するようにしたことを特徴とするものである。
すなわち、本発明では生成された画像特徴ベクトルの識別手段として、サポートベクタマシンを利用するようにしたものであり、これによって検索対象画像中から人の顔画像が存在する可能性が高い領域を高速、かつ精度良く検索することが可能となる。
ここで本発明で用いる、「サポートベクタマシン(Support Vector Machine:以下、適宜「SVM」と称する)」とは、後に詳述するが、1995年にAT&TのV.Vapnikによって統計的学習理論の枠組みで提案され、マージンという指標を用いて全ての2クラスの入力データを線形分離するのに最適な超平面を求めることができる学習機械のことであり、パターン認識の能力において最も優秀な学習モデルの一つであることが知られている。また、後述するように、線形分離不可能な場合でもカーネルトリックというテクニックを用いることにより、高い識別能力を発揮することが可能となっている。
〔発明2〕
発明2の顔画像候補領域検索方法は、
請求項1に記載の顔画像候補領域検索方法において、前記が、識別超平面で区画された非顔領域であって、かつ、前記識別超平面から距離が所定の閾値以上であるときは、その選択画像領域に顔画像が存在しないと判定するようにしたことを特徴とするものである。
すなわち、この閾値以上の非顔領域である場合にはその領域近傍には顔領域が存在する可能性がないとみなし、顔画像が存在するか否かの判定を行わないことにより、高速に顔画像領域候補の検索を行うものである。
〔発明3〕
発明3の顔画像候補領域検索方法は、
請求項1又は2に記載の顔画像候補領域検索方法において、前記サポートベクタマシンの識別関数として、非線形のカーネル関数を使用することを特徴とするものである。
すなわち、このサポートベクタマシンの基本的な構造は、線形しきい素子であるが、これでは原則として線形分離不可能なデータである高次元の画像特徴ベクトルに適用することができない。
一方、このサポートベクタマシンによって非線形な分類を可能とする方法として高次元化が挙げられる。これは、非線形写像によって元の入力データを高次元特徴空間に写像して特徴空間において線形分離を行うという方法であり、これによって、結果的に元の入力空間においては非線形な識別を行う結果となるものである。
しかし、この非線形写像を得るためには膨大な計算を必要とするため、実際にはこの非線形写像の計算は行わずに「カーネル関数」という識別関数の計算に置き換えることができる。これをカーネルトリックといい、このカーネルトリックによって非線形写像を直接計算することを避け、計算上の困難を克服することが可能となっている。
従って、本発明で用いるサポートベクタマシンの識別関数として、この非線形な「カーネル関数」を用いれば、本来線形分離不可能なデータである高次元の画像特徴ベクトルでも容易に分離することができる。
〔発明4〕
発明4の顔画像候補領域検索方法は、
発明1〜3のいずれかに記載の顔画像候補領域検索方法において、前記画像特徴ベクトルは、顔の特徴を反映する、各画素の対応した値を用いるようにしたことを特徴とするものである。
これによって、顔画像以外のオブジェクト等を顔画像と誤判別することがなくなり、判定対象となる各選択領域に顔画像が存在するか否かを精度良く識別することができる。
〔発明5〕
発明5の顔画像候補領域検索方法は、
発明1〜3のいずれかに記載の顔画像候補領域検索方法において、前記画像特徴ベクトルは、各画素におけるエッジの強さ、または各画素におけるエッジのエッジの分散値、または各画素における輝度のいずれか、あるいは組み合わせた値を用いて生成することを特徴とするものである。
これによって、顔画像を精度良く判別することが可能となり、各選択領域の画像が顔画像か否かをより正確に判別することができる。
〔発明6〕
発明6の顔画像候補領域検索方法は、
発明5に記載の顔画像候補領域検索方法において、前記各画素におけるエッジの強さ、またはエッジの分散値は、Sobelのオペレータを用いて生成することを特徴とするものである。
すなわち、この「Sobelのオペレータ」とは、画像中のエッジや線のように濃淡が急激に変化している箇所を検出するための差分型のエッジ検出オペレータの一つであり、特に人間の顔の輪郭等を検出するのには最適なオペレータであることが知られている。
従って、このような「Sobelのオペレータ」を用いて各画素におけるエッジの強さ、またはエッジの分散値を生成することにより、画像特徴ベクトルを生成することができる。
尚、この「Sobelのオペレータ」の形状は、図10(a:横方向のエッジ)、(b:横方向のエッジ)に示す通りであり、それぞれのオペレータで生成した結果を二乗和した後、平方根をとることでエッジの強度を求めることができる。
〔発明7〕
発明7の顔画像候補領域検索システムは、
顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索するシステムであって、前記検索対象画像内の選択領域及び学習用のサンプル画像を読み取る画像読取手段と、前記画像読取手段で読み取った前記検索対象画像内の選択領域及び学習用のサンプル画像の画像特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段で生成した学習用のサンプル画像の画像特徴ベクトルから識別超平面を求めると共に、その識別超平面に対する前記特徴ベクトル生成手段で生成した前記検索対象画像内の選択領域の画像特徴ベクトルの関係から当該選択領域に顔画像が存在するか否かを判定するサポートベクタマシンと、を備えたことを特徴とするものである。
これによって、発明1と同様に、検索対象画像中から人の顔画像が存在する可能性が高い領域を高速、かつ精度良く検索することが可能となる。
〔発明8〕
発明8の顔画像候補領域検索システムは、
発明6に記載の顔画像候補領域検索システムにおいて、前記サポートベクタマシンの識別関数は、非線形なカーネル関数を使用することを特徴とするものである。
これによって、発明3と同様に線形分離不可能なデータである高次元の画像特徴ベクトルでも容易に分離することができる。
〔発明9〕
発明9の顔画像候補領域検索プログラムは、
顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索するためのプログラムであって、前記検索対象画像内の選択領域及び学習用のサンプル画像を読み取る画像読取手段と、前記画像読取手段で読み取った前記検索対象画像内の選択領域及び学習用のサンプル画像の画像特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段で生成した学習用のサンプル画像の画像特徴ベクトルから識別超平面を求めると共に、その識別超平面に対する前記特徴ベクトル生成手段で生成した前記検索対象画像内の選択領域の画像特徴ベクトルの関係から当該選択領域に顔画像が存在するか否かを判定するサポートベクタマシンと、をコンピュータに機能させることを特徴とするものである。
これによって、発明1と同様な効果が得られると共に、パソコン等の汎用のコンピュータシステムを用いてソフトウェア上でそれらの各機能を実現することができるため、それぞれ専用のハードウェアを製作して実現する場合に比べて、経済的かつ容易に実現することが可能となる。また、プログラムの書き換えだけでそれら各機能の改良も容易に行うことができる。
〔発明10〕
発明10の顔画像候補領域検索プログラムは、
発明9に記載の顔画像候補領域検索プログラムにおいて、前記サポートベクタマシンの識別関数は、非線形なカーネル関数を使用することを特徴とするものである。
これによって、発明3と同様な効果が得られると共に、発明9と同様にパソコン等の汎用のコンピュータシステムを用いて実現することができるため、専用のハードウェアを製作して実現する場合に比べて、経済的かつ容易に実現することが可能となる。
以下、本発明を実施するための最良の形態を添付図面を参照しながら詳述する。
図1は、本発明に係る顔画像候補領域検索システム100の実施の一形態を示したものである。
図示するように、この顔画像候補領域検索システム100は、学習用のサンプル画像と検索対象画像を読み取る画像読取手段10と、この画像読取手段10で読み取った画像の特徴ベクトルを生成する特徴ベクトル生成手段20と、この特徴ベクトル生成手段20で生成した特徴ベクトルから前記検索対象画像が顔画像候補領域であるか否かを識別するSVM(サポートベクタマシン)30とから主に構成されている。
この画像読取手段10は、具体的には、ディジタルスチルカメラやディジタルビデオカメラ等のCCD(Charge Coupled Device:電荷結合素子)カメラやビジコンカメラ、イメージスキャナ、ドラムスキャナ等であり、読み込んだ検索対象画像内の所定の選択領域及び学習用のサンプル画像となる複数の顔画像と非顔画像とをA/D変換してそのディジタルデータを特徴ベクトル生成手段20へ順次送る機能を提供するようになっている。
特徴ベクトル生成手段20は、さらに、画像中の輝度(Y)を生成する輝度生成部22と、画像中のエッジの強度を生成するエッジ生成部24と、このエッジ生成部24で生成されたエッジの強度又は前記輝度生成部22で生成された輝度の平均又はエッジの強度の分散値を求める平均・分散値生成部26とから構成されており、この平均・分散値生成部26でサンプリングされる画素値からサンプル画像及び検索対象画像毎の画像特徴ベクトルを生成してこれをSVM30に順次送る機能を提供するようになっている。
SVM30は、前記特徴ベクトル生成手段20で生成した学習用のサンプルとなる複数の顔画像及び非顔画像の画像特徴ベクトルを学習すると共に、その学習結果から特徴ベクトル生成手段20で生成した検索対象画像内の所定の領域が顔像候補領域であるか否かを識別する機能を提供するようになっている。
このSVM30は、前述したようにマージンという指標を用いて全ての入力データを線形分離するのに最適な超平面を求めることができる学習機械のことであり、線形分離不可能な場合でもカーネルトリックというテクニックを用いることにより、高い識別能力を発揮できることが知られている。
そして、本実施の形態で用いるSVM30は、1.学習を行うステップと、2.識別を行うステップに分かれる。
先ず、1.学習を行うステップは、図1に示すように学習用のサンプル画像となる多数の顔画像及び非顔画像を画像読取手段10で読み取った後、特徴ベクトル生成部20で各画像の特徴ベクトルを生成し、これを画像特徴ベクトルとして学習するものである。
その後、2.識別を行うステップでは、検索対象画像内の所定の選択領域を順次読み込んでこれを同じく特徴ベクトル生成部20でその画像特徴ベクトルを生成し、これを特徴ベクトルとして入力し、入力された画像特徴ベクトルがその識別超平面に対していずれの領域に該当するかで顔画像が存在する可能性が高い領域か否かを検出するものである。
ここで、学習に用いられるサンプル用の顔画像及び非顔画像の大きさは、例えば20×20pixel(画素)で行われ、また、顔画像の検出に際しても同じ大きさの領域について行われることになる。
さらに、このSVMについて「パターン認識と学習の統計学」(岩波書店、麻生英樹、津田宏治、村田昇著)pp.107〜118の記述に基づいて多少詳しく説明すると、識別する問題が非線形である場合、SVMでは非線形なカーネル関数を用いることができ、この場合の識別関数は以下の数式1で示される。
すなわち、数式1の値が「0」の場合に識別超平面になり、「0」以外の場合は与えられた画像特徴ベクトルから計算した識別超平面からの距離の距離となる。また、数式1の結果が非負の場合は、顔画像、負の場合は非顔画像である。
Figure 2005134966
x、xは画像特徴ベクトルであり、特徴ベクトル生成部20で生成された値を用いる。Kはカーネル関数であり、本実施の形態では以下の数式2の関数を用いる。
Figure 2005134966
尚、この顔画像候補領域検索システム100を構成する特徴ベクトル生成手段20、SVM30並びに画像読取手段10等は、実際には、CPUやRAM等からなるハードウェアと、専用のコンピュータプログラム(ソフトウェア)とからなるパソコン(PC)等のコンピュータシステムによって実現されるようになっている。
すなわち、この顔画像候補領域検索システム100を実現するためのコンピュータシステムは、例えば図2に示すように、各種制御や演算処理を担う中央演算処理装置であるCPU(Central Processing Unit)40と、主記憶装置(Main Strage)に用いられるRAM(Random Access Memory)41と、読み出し専用の記憶装置であるROM(Read Only Memory)42と、ハードディスクドライブ装置(HDD)や半導体メモリ等の補助記憶装置(Secondary Storage)43、及びモニタ(LCD(液晶ディスプレイ)やCRT(陰極線管))等からなる出力装置44、イメージスキャナやキーボード、マウス、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像センサ等からなる入力装置45と、これらの入出力インターフェース(I/F)46等との間を、PCI(Peripheral Component Interconnect)バスやISA(Industrial Standard Architecture;アイサ)バス等からなるプロセッサバス、メモリバス、システムバス、入出力バス等の各種内外バス47によってバス接続したものである。
そして、例えば、CD−ROMやDVD−ROM、フロッピー(登録商標)ディスク等の記憶媒体、あるいは通信ネットワーク(LAN、WAN、インターネット等)Nを介して供給される各種制御用プログラムやデータを補助記憶装置93等にインストールすると共にそのプログラムやデータを必要に応じて主記憶装置91にロードし、その主記憶装置91にロードされたプログラムに従ってCPU90が各種リソースを駆使して所定の制御及び演算処理を行い、その処理結果(処理データ)をバス97を介して出力装置94に出力して表示すると共に、そのデータを必要に応じて補助記憶装置93によって形成されるデータベースに適宜記憶、保存(更新)処理するようにしたものである。
次に、このような構成を顔画像候補領域検索システム100を用いた顔画像候補領域検索方法の一例を説明する。
図3は、実際に検索対象となる画像に対する顔画像候補領域検索方法の一例を示すフローチャートであるが、実際に識別を行う前には、前述したように識別に用いるSVM30に対する学習用のサンプル画像となる顔画像及び非顔画像を学習させるステップを経る必要がある。
この学習ステップは、従来通り、サンプル画像となる顔画像及び非顔画像毎の特徴ベクトルを生成してその特徴ベクトルを顔画像であるか非顔画像であるかの情報と共に入力するものである。尚、予め学習させる学習画像が、所定の画素数、例えば「20×20」よりも大きい場合には、「20×20」の大きさにリサイズされた後、特徴ベクトル生成手段20の平均・分散値生成部26によってその画像が「20×20」のブロックにモザイク化処理されてから特徴ベクトルが得られるようになっている。
そして、このようにしてSVM30に対してサンプル画像の特徴ベクトルの学習が行われたならば、図3のステップS101に示すように、先ず検索対象画像G内の識別対象となる領域を選択する。
この時、検索対象画像G内のどの位置に顔画像が含まれているかは勿論、顔画像が含まれているか否かも分かっていないため、しらみ潰しに探索するようにその領域が選択されることになる。
例えば、この検索対象画像Gが図4に示すような男女の若いカップルの写真であった場合、先ず最初に選択される領域としては、検索対象画像Gの左上の角部を始点とし、その画像Gの横方向をx、縦方向をyとし、選択領域Zの大きさを学習用のサンプル画像と同じ「20×20」pixelの矩形領域とすると、最初の選択領域Zはa(x=0,y=0)からb(x=19、y=19)の領域となる。
そして、このようにして顔画像の検索対象となる最初の選択領域Zが選択されたならば、図3に示すように、次のステップS102に移行してその最初の選択領域Zが閾値を越えた領域の近傍か否かを判断するが、最初の領域については当然にその判断が不可能なため、「No」が選択されてステップS103に移行し、その選択領域Zについての画像特徴ベクトルを算出する。その後、ステップS105に移行してその特徴ベクトルについてSVM30を用いて識別超平面からの距離を算出すると共に、その特徴ベクトルの位置がSVM30の識別超平面で仕切られた非負領域(顔領域)か否かを判断する(ステップS107)。
この判断ステップS107にて、その特徴ベクトルが非負領域に存在している(Yes)と判断した場合は、その選択領域Zが顔画像存在領域である可能性が極めて高いと考えることから、そのまま直ちにステップS113までジャンプすることになるが、非負領域でない、すなわち、その特徴ベクトルの位置がSVM30の識別超平面で仕切られた負領域(非顔領域)に存在している(No)と判断した場合は、次のステップS109に移行してその特徴ベクトルに対する識別超平面からの距離が負領域に設定された閾値以上か否かを判断する。
すなわち、本実施の形態では、算出された選択領域Zの特徴ベクトルが非負領域であった場合は当然にその選択領域Zを顔領域と判断するが、その特徴ベクトルがSVM30の識別超平面を境とした負領域(非顔領域)であった場合でも直ちにその選択領域Zを非顔領域と判断するのではなく、識別超平面より負領域側に閾値を設け、この閾値を越えた場合にのみその選択領域Zを非顔領域と判断するようにしたものである。
これによって、単に識別超平面を境に選択領域Zの特徴ベクトルが負領域に存在しているだけで、顔画像が存在しているにもかかわらず当該選択領域Zを排除してしまうような誤判定を未然に防止することが可能となる。
そして、ステップS111では、このようにして識別超平面からの距離が閾値を越えた選択領域Zを記憶するテーブルを更新すると共に、ステップS113ではこの閾値を越えた選択領域Zは勿論、識別した全ての領域を記憶するテーブルを更新することになる。
その後、このようにして両テーブルの更新処理が終了したならば、ステップS115に移行して全ての選択領域Zについて識別処理が終了したか否かを判断し、終了したと判断したとき(Yes)はその処理を終了することになるが、終了していないと判断したとき(No)は、最初のステップS101に移行して次の識別対象領域Zを選択してからステップS102に移行し、その選択領域Zが、前回に選択され、かつ閾値を越えると判断された領域Zの近傍か否かを判断し、「Yes」であれば、その領域Zについての以降の処理を省略して最初のステップS101に戻り、さらに次の領域Zを選択して同様な処理を繰り返すことになる。
これによって、高速な顔画像が存在する可能性が極めて低い領域についてのステップS103以降の判断処理が省略されるため、より高速な顔画像領域検索を実行することが可能となる。
例えば、図4に示すように最初の選択領域Z(x=0,x=19,y=0,y=19)についての識別処理が終了したならば、次に図5に示すようにその選択領域Zを検索対象画像Gに対して横方向(x方向)に「5」pixelだけ移動させた領域を2番目の選択領域Z(x=5,x=24,y=0,y=19)として選択する(ステップS101)。
そして、そのままステップS102に移行し、その2番目に選択された領域Zが前回(最初)に選択された領域の近傍であって閾値を越えた領域の近傍であるか否かを判断し、「Yes」の場合は、その領域についてのそれ以降の処理を省略し、さらに最初のステップ101に戻って検索対象画像Gをさらに「5」pixelだけ横方向(x方向)に移動させた領域を3番目の選択領域Z(x=10,x=29,y=0,y=19)として選択して同様な処理を繰り返すことになる。
すなわち、最初の選択領域Z(x=0,x=19,y=0,y=19)がその後の判断フローで結果的に閾値を越えた領域(顔画像が存在する可能性が極めて少ない)であると判断された場合には、この領域Zの近傍である2番目に選択された領域Z(x=5,x=24,y=0,y=19)にも顔画像存在する可能性が低いと考えることができることから、その2番目の領域Zについてのその後の判断を省略し、直ちにその次の3番目の選択領域Z(x=10,x=29,y=0,y=19)について判断処理を実行することで、顔画像存在する可能性が低い領域(2番目の選択領域Z)について無駄な処理を両酌することができるため、より高速な顔画像検索処理を達成することが可能となる。
そして、このようにして検索対象画像Gの最上段の横ラインについてのx方向への領域Zの選択が終了したならば、次は図6に示すように最初の選択領域Z(x=0,x=19,y=0,y=19)から縦方向(y方向)に「5」pixelだけ移動させた領域を次の選択領域Z(x=0,x=19,y=5,y=24)として選択し、その選択領域Zを次の横ラインの始点として同様の処理を行った後、順に「5」pixelずつ横方向(x方向)にずらした領域を選択してその横ラインの右端に至るまで同様の処理を繰り返し、さらに縦方向(y方向)に「5」pixelだけ次の横ラインに移動して同様の処理を検索対象画像Gの右下の領域に至るまで順次繰り返すことになる。
これによって、検索対象画像Gの全ての領域Zを選択してその全ての選択領域Zについての判断処理を実行することができる。
図7(a)は、前記ステップS113で説明した既識別選択領域テーブルの一例を、同図(b)は前記ステップS111で説明した閾値を越えた識別選択領域テーブルの一例をそれぞれ示したものである。
すなわち、図7(a)では、4つの選択領域(1,2,3,4)について既に識別が終了したことを示し、図7(b)では、その4つの選択領域(1,2,3,4)のうち、2つ目の選択領域(x=5,x=24,y=0,y=19)が閾値を越えた領域、つまり顔画像が存在する可能性が極めて少なくて候補から排除する領域ということになる。
図8は、図5に示すように選択領域Zを検索対象画像G内を横方向(x方向)に移動させながら各選択領域Zについての識別超平面からの距離(1/1000)を示した一例である。尚、図中「0」のラインが識別超平面であり、これより上方の領域が顔領域(非負領域)、その下方の領域が非顔領域(負領域)を示している。また、各プロット点(黒点)がそれぞれの選択領域についての識別超平面からの距離を示し、また、本図においては非顔領域側の「−1」のラインが閾値となっている。また、横軸は画素数を示したものであり、実際の画素数は、当該数値の5倍の数となっている。
図において、画素数「71」〜「81」付近のエリアのみが、唯一、識別超平面である「0」のラインを超えていることから、この例では、当該エリアが顔画像が存在する可能性が最も高いと判断することができる。一方、画素数「11」以下の付近、画素数「61」〜「71」付近、画素数「121」〜「131」の付近、画素数「161」付近は、いずれも閾値である「−1」のラインを大きく越えている(下回っている)ことから、この付近には、顔画像が存在する可能性が極めて少ないと判断することができる。
従って、この図の例では、画素数「11」以下の付近、画素数「61」〜「71」付近、画素数「121」〜「131」の付近、画素数「161」付近を除く他の領域、すなわち、1.画素数「11」〜「61」のエリア、2.画素数「71」〜「121」のエリア、3.画素数「131」〜「161」のエリアといった3つのエリアに顔画像が存在する可能性が高いと判断することができ、しかも、その可能性の大小関係も例えば「2のエリア」→「1のエリア」→「3のエリア」というように容易に判定することが可能となる。
一方、図9は、図6のように、選択領域Zを検索対象画像G内を縦方向(y方向)に移動させながら各選択領域Zについての識別超平面からの距離(1/1000)を示した一例である。尚、図8と同様に「0」のラインが識別超平面であり、「−1」が閾値となっている。また、同様に横軸の数値も実際の画素数の5倍の値を示したものである。
図において、画素数「55」付近の領域のみが、識別超平面である「0」のラインを超えていることから、この例では、当該領域に顔画像が存在する可能性が最も高いと判断することができる。一方、この画素数「55」付近の両側の領域、及び画素数「145」付近は、閾値である「−1」のラインを大きく越えている(下回っている)ことから、この付近には、顔画像が存在する可能性が極めて少ないと判断することができる。
従って、この図の例では、画素数「55」付近の両側の領域、及び画素数「145」付を除く他の領域、すなわち、1.画素数「19」付近、2.「55」付近、3.「73」〜「127」付近、4.「163」〜「217」付近といった4つのエリアに顔画像が存在する可能性が高いと判断することができ、しかも、その可能性の大小関係も「2のエリア」→「1のエリア」→「4のエリア」→「3のエリア」というように容易に判別することが可能となる。
また、閾値を越えて顔画像の存在する可能性が極めて少ないと判断された領域の近傍の領域も「0」のラインを超えたことがなく、顔画像が存在する可能性が少ないと判断することができるため、図3のステップ102に示すように顔画像の存在する可能性が極めて少ないと判断された領域の近傍の領域について判断処理を省略してもなんら問題ないと判断することができる。
尚、図8及び図9の例では、識別した結果が顔画像候補領域と非顔画像候補領域とで入れ替わっている箇所があるが、識別超平面からの距離が非顔候補領域に大きい画素の近傍では顔画像と判定される領域がないことが分かる。
また、識別超平面からの距離に関する閾値を上記のように「−1」とした場合、顔領域が出現しない近傍の画素距離は「50」画素とすることができる。
ただし、閾値、近傍とみなす画素距離は、学習用のサンプル画像やテスト画像、カーネル関数の詳細等に依存することから、適宜変更し得るものであることは勿論である。
このようにサポートベクタマシン30を用いて各選択領域Z毎に識別超平面からの距離を求めることによって検索対象画像G中から人の顔画像が存在する可能性が高い領域を高速、かつ正確に検索することが可能となる。
尚、本発明及び本実施の形態は、検索対象として極めて有用な「人間の顔」を対象としたものであるが、このようにサポートベクタマシン30を用いて各選択領域Z毎に識別超平面からの距離を求める手法によれば、「人間の顔」のみならず、「人間の体型」や「動物の顔、姿態」、「自動車等の乗り物」、「建造物」、「植物」、「地形」等といった他のあらゆるオブジェクトへの適用も可能である。
また、図10は、本発明で適用可能な差分型エッジ検出オペレータの一つである「Sobelのオペレータ」を示したものである。
図10(a)に示すオペレータ(フィルタ)は、注目画素を囲む8つの画素値のうち、左列及び右列に位置するそれぞれ3つの画素値を調整することで横方向のエッジを強調し、図10(b)に示すオペレータは、注目画素を囲む8つの画素値のうち、上行及び下列に位置するそれぞれ3つの画素値を調整して縦方向のエッジを強調することで縦横のエッジを検出するものである。
そして、このようなオペレータで生成した結果を二乗和した後、平方根をとることでエッジの強度を求め、各画素におけるエッジの強さ、またはエッジの分散値を生成することにより、画像特徴ベクトルを精度良く検出することができる。尚、前述したように、この「Sobelのオペレータ」の代えて「Roberts」や「Prewitt」等の他の差分型エッジ検出オペレータや、テンプレート型エッジ検出オペレータ等を適用することも可能である。
顔画像候補領域検索システムの実施の一形態を示すブロック図である。 顔画像候補領域検索システムを実現するハードウェア構成を示す図である。 顔画像候補領域検索方法の実施の一形態を示すフローチャート図である。 検索対象画像の一例を示す図である。 検索対象画像内の選択領域を横方向にずらして選択する状態を示す図である。 検索対象画像内の選択領域を縦方向にずらして選択する状態を示す図である。 選択領域テーブルの一例を示す図である。 識別超平面からの距離と横方向への移動距離との関係を示すグラフ図である。 識別超平面からの距離と縦方向への移動距離との関係を示すグラフ図である。 Sobelのオペレータの形状を示す図である。
符号の説明
10…画像読取手段、20…特徴ベクトル生成手段、22…輝度生成部、24…エッジ生成部、26…平均・分散値生成部、30…SVM(サポートベクタマシン)、100…顔画像候補領域検索システム、40…CPU、41…RAM、42…ROM、43…補助記憶装置、44…出力装置、45…入力装置、46…入出力インターフェース(I/F)、47…バス、G…検索対象画像、Z…選択領域。

Claims (10)

  1. 顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索する方法であって、
    前記検索対象画像内を所定の領域毎に順次選択してから当該選択領域の画像特徴ベクトルを生成し、その後、予め複数の学習用のサンプル画像の画像特徴ベクトルを学習済みのサポートベクタマシンにその画像特徴ベクトルを入力し、その識別超平面に対する位置関係に応じて当該選択領域に顔画像が存在するか否かを判定するようにしたことを特徴とする顔画像候補領域検索方法。
  2. 請求項1に記載の顔画像候補領域検索方法において、
    前記選択領域の画像特徴ベクトルが前記サポートベクタマシンの識別超平面で区画された非顔領域であって、かつ、前記識別超平面から距離が所定の閾値以上であるときは、その選択画像領域の近傍に顔画像が存在しないと判定するようにしたことを特徴とする顔画像候補領域検索方法。
  3. 請求項1又は2に記載の顔画像候補領域検索方法において、
    前記サポートベクタマシンの識別関数として、非線形のカーネル関数を使用することを特徴とする顔画像候補領域検索方法。
  4. 請求項1〜3のいずれかに記載の顔画像候補領域検索方法において、
    前記画像特徴ベクトルは、顔の特徴を反映する、各画素の対応した値を用いるようにしたことを特徴とする顔画像候補領域検索方法。
  5. 請求項1〜3のいずれかに記載の顔画像候補領域検索方法において、
    前記画像特徴ベクトルは、各画素におけるエッジの強さ、または各画素におけるエッジの分散値、または各画素における輝度のいずれか、あるいは組み合わせた値を用いて生成することを特徴とする顔画像候補領域検索方法。
  6. 請求項5に記載の顔画像候補領域検索方法において、
    前記各画素におけるエッジの強さ、またはエッジの分散値は、Sobelのオペレータを用いて生成することを特徴とする顔画像候補領域検索方法。
  7. 顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索するシステムであって、
    前記検索対象画像内の選択領域及び学習用のサンプル画像を読み取る画像読取手段と、
    前記画像読取手段で読み取った前記検索対象画像内の選択領域及び学習用のサンプル画像の画像特徴ベクトルを生成する特徴ベクトル生成手段と、
    前記特徴ベクトル生成手段で生成した学習用のサンプル画像の画像特徴ベクトルから識別超平面を求めると共に、その識別超平面に対する前記特徴ベクトル生成手段で生成した前記検索対象画像内の選択領域の画像特徴ベクトルの関係から当該選択領域に顔画像が存在するか否かを判定するサポートベクタマシンと、を備えたことを特徴とする顔画像候補領域検索システム。
  8. 請求項6に記載の顔画像候補領域検索システムにおいて、
    前記サポートベクタマシンの識別関数は、非線形のカーネル関数を使用することを特徴とする顔画像候補領域検索システム。
  9. 顔画像が含まれているか否かが判明しない検索対象画像中から当該顔画像が存在する可能性が高い顔画像候補領域を検索するためのプログラムであって、前記検索対象画像内の選択領域及び学習用のサンプル画像を読み取る画像読取手段と、
    前記画像読取手段で読み取った前記検索対象画像内の選択領域及び学習用のサンプル画像の画像特徴ベクトルを生成する特徴ベクトル生成手段と、
    前記特徴ベクトル生成手段で生成した学習用のサンプル画像の画像特徴ベクトルから識別超平面を求めると共に、その識別超平面に対する前記特徴ベクトル生成手段で生成した前記検索対象画像内の選択領域の画像特徴ベクトルの関係から当該選択領域に顔画像が存在するか否かを判定するサポートベクタマシンとして機能させることを特徴とする顔画像候補領域検索プログラム。
  10. 請求項9に記載の顔画像候補領域検索プログラムにおいて、
    前記サポートベクタマシンの識別関数は、非線形のカーネル関数を使用することを特徴とする顔画像候補領域検索プログラム。
JP2003367210A 2003-10-28 2003-10-28 顔画像候補領域検索方法及び検索システム並びに検索プログラム Withdrawn JP2005134966A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2003367210A JP2005134966A (ja) 2003-10-28 2003-10-28 顔画像候補領域検索方法及び検索システム並びに検索プログラム
CNA2004800116534A CN1781122A (zh) 2003-10-28 2004-10-15 用于搜索被认为是面部图像的区域的方法、系统和程序
EP04792484A EP1679655A4 (en) 2003-10-28 2004-10-15 METHOD, SYSTEM AND PROGRAM FOR SEARCHING CANDIDATE ZONES OF A FACE IMAGE
PCT/JP2004/015267 WO2005041128A1 (ja) 2003-10-28 2004-10-15 顔画像候補領域検索方法及び顔画像候補領域検索システム並びに顔画像候補領域検索プログラム
US10/968,843 US20050190953A1 (en) 2003-10-28 2004-10-19 Method, system and program for searching area considered to be face image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003367210A JP2005134966A (ja) 2003-10-28 2003-10-28 顔画像候補領域検索方法及び検索システム並びに検索プログラム

Publications (2)

Publication Number Publication Date
JP2005134966A true JP2005134966A (ja) 2005-05-26
JP2005134966A5 JP2005134966A5 (ja) 2005-09-02

Family

ID=34510286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003367210A Withdrawn JP2005134966A (ja) 2003-10-28 2003-10-28 顔画像候補領域検索方法及び検索システム並びに検索プログラム

Country Status (5)

Country Link
US (1) US20050190953A1 (ja)
EP (1) EP1679655A4 (ja)
JP (1) JP2005134966A (ja)
CN (1) CN1781122A (ja)
WO (1) WO2005041128A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102286A (ja) * 2005-09-30 2007-04-19 Seiko Epson Corp 特定画像検出装置、特定画像検出方法および特定画像検出プログラム
JP2008027130A (ja) * 2006-07-20 2008-02-07 Seiko Epson Corp オブジェクト認識装置およびオブジェクト認識方法ならびにオブジェクト認識用プログラム
KR100869554B1 (ko) 2007-02-23 2008-11-21 재단법인서울대학교산학협력재단 영역 밀도 표현에 기반한 점진적 패턴 분류 방법
US8036998B2 (en) 2007-08-31 2011-10-11 Seiko Epson Corporation Category classification method
KR101090269B1 (ko) 2010-02-19 2011-12-07 연세대학교 산학협력단 특징 추출 방법 및 그 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100724932B1 (ko) * 2005-08-02 2007-06-04 삼성전자주식회사 얼굴 검출 장치 및 방법
US7684651B2 (en) * 2006-08-23 2010-03-23 Microsoft Corporation Image-based face search
JP2010182150A (ja) * 2009-02-06 2010-08-19 Seiko Epson Corp 顔の特徴部位の座標位置を検出する画像処理装置
KR101175597B1 (ko) * 2011-09-27 2012-08-21 (주)올라웍스 아다부스트 학습 알고리즘을 이용하여 얼굴 특징점 위치를 검출하기 위한 방법, 장치, 및 컴퓨터 판독 가능한 기록 매체
JP5649601B2 (ja) * 2012-03-14 2015-01-07 株式会社東芝 照合装置、方法及びプログラム
US8824742B2 (en) * 2012-06-19 2014-09-02 Xerox Corporation Occupancy detection for managed lane enforcement based on localization and classification of windshield images
US9633267B2 (en) * 2014-04-04 2017-04-25 Conduent Business Services, Llc Robust windshield detection via landmark localization
US9842266B2 (en) 2014-04-04 2017-12-12 Conduent Business Services, Llc Method for detecting driver cell phone usage from side-view images
US10048765B2 (en) * 2015-09-25 2018-08-14 Apple Inc. Multi media computing or entertainment system for responding to user presence and activity

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4590717B2 (ja) * 2000-11-17 2010-12-01 ソニー株式会社 顔識別装置及び顔識別方法
DE60213032T2 (de) * 2001-05-22 2006-12-28 Matsushita Electric Industrial Co. Ltd. Gerät zur Gesichtsdetektion, Gerät zur Detektion der Gesichtspose, Gerät zur Extraktion von Teilbildern und Verfahren für diese Geräte
FR2826343B1 (fr) * 2001-06-22 2003-09-26 Oreal Dispositif pour la pulverisation d'un produit, notamment sous forme de dose echantillon
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102286A (ja) * 2005-09-30 2007-04-19 Seiko Epson Corp 特定画像検出装置、特定画像検出方法および特定画像検出プログラム
JP2008027130A (ja) * 2006-07-20 2008-02-07 Seiko Epson Corp オブジェクト認識装置およびオブジェクト認識方法ならびにオブジェクト認識用プログラム
KR100869554B1 (ko) 2007-02-23 2008-11-21 재단법인서울대학교산학협력재단 영역 밀도 표현에 기반한 점진적 패턴 분류 방법
US8036998B2 (en) 2007-08-31 2011-10-11 Seiko Epson Corporation Category classification method
KR101090269B1 (ko) 2010-02-19 2011-12-07 연세대학교 산학협력단 특징 추출 방법 및 그 장치

Also Published As

Publication number Publication date
EP1679655A4 (en) 2007-03-28
US20050190953A1 (en) 2005-09-01
CN1781122A (zh) 2006-05-31
EP1679655A1 (en) 2006-07-12
WO2005041128A1 (ja) 2005-05-06

Similar Documents

Publication Publication Date Title
JP2005190400A (ja) 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
JP5763965B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2006048322A (ja) オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
JP2005122351A (ja) 顔画像候補領域検索方法及び検索システム並びに検索プログラム
JP5283088B2 (ja) 画像検索装置および同画像検索装置に適用される画像検索用コンピュータプログラム
JP6351240B2 (ja) 画像処理装置、画像処理方法及びプログラム
US10079974B2 (en) Image processing apparatus, method, and medium for extracting feature amount of image
JP2017033469A (ja) 画像識別方法、画像識別装置及びプログラム
JP2005134966A (ja) 顔画像候補領域検索方法及び検索システム並びに検索プログラム
JP2000132688A (ja) 顔パーツ検出方法及びその装置
JP2010262601A (ja) パターン認識システム及びパターン認識方法
US7460705B2 (en) Head-top detecting method, head-top detecting system and a head-top detecting program for a human face
JP2011086261A (ja) 情報処理装置及び情報処理方法
US20230018589A1 (en) Information processing apparatus, control method, and non-transitory storage medium
JP2006323779A (ja) 画像処理方法、画像処理装置
JP5952942B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2011053952A (ja) 画像検索装置及び画像検索方法
JP2005165983A (ja) 人物顔のあご検出方法及びあご検出システム並びにあご検出プログラム
JP6698058B2 (ja) 画像処理装置
JP2002216131A (ja) 画像照合装置及び画像照合方法、並びに記憶媒体
KR101031369B1 (ko) 얼굴 인식 장치 및 그 방법
JP2021064120A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2008102589A (ja) 動画像処理装置および動画像処理方法ならびに動画像処理プログラム
JP2006059215A (ja) オブジェクトの回転角度検出装置、顔の回転角度検出プログラムおよび顔の回転角度検出方法
JP2005346663A (ja) オブジェクト画像判別方法およびオブジェクト画像判別システム、オブジェクト画像判別プログラム、並びに誤検出判別方法、誤検出判別システム、誤検出判別プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050428

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070502