JP2009015614A - 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム - Google Patents

画像処理装置及び画像処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2009015614A
JP2009015614A JP2007177007A JP2007177007A JP2009015614A JP 2009015614 A JP2009015614 A JP 2009015614A JP 2007177007 A JP2007177007 A JP 2007177007A JP 2007177007 A JP2007177007 A JP 2007177007A JP 2009015614 A JP2009015614 A JP 2009015614A
Authority
JP
Japan
Prior art keywords
face
image
organ
facial organ
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007177007A
Other languages
English (en)
Other versions
JP4479756B2 (ja
Inventor
Kaname Ogawa
要 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007177007A priority Critical patent/JP4479756B2/ja
Priority to US12/139,741 priority patent/US8463049B2/en
Priority to TW097122547A priority patent/TWI380223B/zh
Priority to EP08158565A priority patent/EP2012255B1/en
Priority to CN2008101305641A priority patent/CN101339609B/zh
Publication of JP2009015614A publication Critical patent/JP2009015614A/ja
Application granted granted Critical
Publication of JP4479756B2 publication Critical patent/JP4479756B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships

Abstract

【課題】Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いて顔画像から顔器官の位置を好適に検出する。
【解決手段】顔器官検出の前段で顔検出を行なうことで大体の顔のサイズが分かることを利用して、前段で検出された顔画像を、該当する顔器官が顔器官検出器と同程度の解像度になるように、あらかじめ正規化しておく。そして、1つの大きさに固定された顔器官検出器のみを用いて正規化後の顔画像から顔器官を検出する。各検出顔を複数の解像度に変換して解像度毎にスキャンを行なう必要がなくなり、必要な演算量やメモリ量を大幅に削減することができる。
【選択図】 図2

Description

本発明は、撮影画像などに含まれる顔画像の検出や認識を行なう画像処理装置及び画像処理方法、並びにコンピュータ・プログラムに係り、特に、入力画像から検出された顔画像から目の中心や目頭、目尻、鼻、鼻底部、鼻側面、口、口端点、眉毛、眉毛頭、眉毛尻といった顔器官の位置を検出する画像処理装置及び画像処理方法、並びにコンピュータ・プログラムに関する。
さらに詳しくは、本発明は、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いて顔画像から顔器官の位置を検出する画像処理装置及び画像処理方法、並びにコンピュータ・プログラムに係り、特に、顔検出処理によって検出された顔画像から目などの顔器官の位置をより少ない演算量並びにメモリ量で検出する画像処理装置及び画像処理方法、並びにコンピュータ・プログラムに関する。
顔認識の技術は、ユーザに負担をかけない個人認証システムをはじめとして、性別の識別など、マンマシン・インターフェースに幅広く適用が可能である。また、最近では、デジタルカメラにおける被写体検出若しくは被写体認識に基づく自動焦点合わせ(AF)や自動露光調整(AE)、自動画角設定、自動撮影といったカメラワークの自動化のために顔認識が適用されている。
顔認識システムは、例えば、顔画像の位置を検出して検出顔として抽出する顔検出処理と、検出顔から主要な顔器官の位置を検出する顔器官検出処理と、検出顔の識別(人物の特定)を行なう顔識別処理で構成される。顔検出処理では、入力画像から顔の大きさや位置を検出して、検出顔として抽出する。また、顔器官検出処理では、検出顔から顔器官を発見する。顔器官としては、目の中心や目頭、目尻、鼻、鼻底部、鼻側面、口、口端点、眉毛、眉毛頭、眉毛尻などが挙げられる。そして、顔検出された検出された顔器官の位置に基づく位置合わせや回転の補正を行なった後に、顔識別処理では検出顔の識別(人物の認識など)を行なう。
これまで、複雑な画像シーンの中から画像信号の濃淡パターンのみを使って顔検出する手法について数多の提案がなされている。例えば、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を、上述の顔検出処理に適用することができる。
Adaboostは、1996年にFreundらによって提案された、「ランダムよりも少し良い弱い識別器」(Weak Learnerとも呼ぶ)を多数組み合わせることで、「強い識別器」を構築できるとする理論である。弱識別器は、ハール(Haar)基底のようなフィルタを用いて構成することができる。それぞれの弱識別器は自分の前に生成された弱識別器が不得意とする識別に重みαを置くようにして生成され、それぞれの弱認識器がどの程度確からしいによって信頼度を求め、それに基づき多数決を行なう。
ここで、入力画像にはさまざまな大きさの顔が含まれることが想定されるから(図9を参照のこと)、さまざまなサイズの探索ウィンドウを切り出して顔か否かを判定する必要がある。
かかる画像の解像度と検出顔の大きさの相対関係の問題で、画像の解像度を固定にする方法(すなわち、入力画像に対していろいろな大きさの顔検出器を用意する方法)と、検出顔の大きさを固定にする方法(検出できる顔の大きさが固定された1つの顔検出器を用い、入力画像をいろいろな解像度に縮小して検出する方法)が考えられる。後者の方法が現実的であり、通常は、入力画像をスケール変換した各画像から学習サンプルと同一サイズのウィンドウ(以下では、「探索ウィンドウ」とも言う)を切り出すことで、異なるサイズの探索ウィンドウを探索するようになっている。入力画像に含まれる顔のサイズが分からないため、入力画像の解像度を変えながら、解像度毎に顔検出器をスキャンさせる。各解像度の入力画像からは、顔検出器のサイズに近い解像度の顔のみを検出することができる(図10を参照のこと)。
しかしながら、例えば320×240画素からなる入力画像にはおよそ5000種類のサイズの探索ウィンドウが含まれており、これらすべてのウィンドウ・サイズについて弱判別器の演算を実施するには長時間を要する。このため、弱判別器の演算を高速化するための幾つかの提案がなされている。
例えば、矩形特徴(rectangle feature)と積分画像(integral image)と呼ばれる画像を使用することで、高速に弱仮説(weak hypothesis)を計算する方法が知られている(例えば、特許文献1、非特許文献1を参照のこと)。
また、重み付き多数決の際、すべての弱判別器の計算結果を待たず、計算途中であってもその値によっては対象物体でないと判断して計算を打ち切りするため、打ち切りの閾値を学習時に学習する対象物検出装置について提案がなされている(例えば、特許文献2を参照のこと)。上記の打ち切り処理によって、検出処理における演算量を大幅に削減することが可能となる。
米国特許出願公開2002/0102024号明細書 特開2005−157679号公報 Paul Viola著"Rapid Object Detection using a Boosted Cascade of Simple Features"(CVPR 2001)
Adaboostアルゴリズムを用いて構成される検出器は、複雑な画像シーンの中から画像信号の濃淡パターンのみを使って顔検出を行なうことができるが、本発明者らはこの種の検出器をさらに顔器官の検出にも適用できると考えている。
図10に示したような顔検出方法をそのまま顔器官検出にも適用した場合には、入力画像から検出された顔画像毎に、解像度を変えながら、1つのサイズに固定された顔器官検出器をスキャンさせることになる(例えば、図11を参照のこと)。顔検出器で検出されたそれぞれの顔画像について解像度を変換し、顔器官検出器をスキャンさせ、顔器官検出器のサイズに近い解像度の顔器官のみが各解像度で検出される。
しかしながら、このような顔器官検出方法では、入力画像から抽出された顔画像毎に、解像度を変更し、解像度毎に顔器官検出器をスキャンさせるといった処理が必要であることから、演算量とメモリ量を消費してしまう。
本発明はかかる技術的課題を勘案したものであり、その主な目的は、入力画像から検出された顔画像から目の中心や目頭、目尻、鼻、鼻底部、鼻側面、口、口端点、眉毛、眉毛頭、眉毛尻といった顔器官の位置を好適に検出することができる、優れた画像処理装置及び画像処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いて顔画像から顔器官の位置を好適に検出することができる、優れた画像処理装置及び画像処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、顔検出処理によって検出された顔画像から目などの顔器官の位置をより少ない演算量並びにメモリ量で検出することができる、優れた画像処理装置及び画像処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、顔を含む画像から所望の顔器官の位置を検出する画像処理装置であって、
任意の顔検出手段によって検出された顔の大きさが既知となる画像を入力する入力手段と、
該入力された画像を該顔の大きさに基づいて所定の顔サイズとなるように正規化する正規化手段と、
該正規化された画像よりも小さい領域を前記顔器官の検出範囲に設定する検出範囲設定手段と、
該設定された検出範囲内で前記顔器官の位置を検出する顔器官検出手段と、
を具備することを特徴とする画像処理装置である。
複雑な画像シーンの中から画像信号の濃淡パターンのみを使って顔検出する手法として、例えば、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いる方法が知られている。また、入力画像にはさまざまな大きさの顔が含まれることが想定されることから、検出できる顔の大きさが固定された1つの顔検出器を用い、入力画像をいろいろな解像度に縮小して顔画像を検出する方法が知られている。
また、顔検出処理によって検出された顔画像から、さらに目などの顔器官の位置を検出する処理についても、基本的には複雑な画像シーンの中から画像信号の濃淡パターンのみを使って検出を行なうことに相当するから、上述のようなAdaboostアルゴリズムなどの統計学習を用いた顔器官検出方法が考えられる。
しかしながら、画像の解像度と検出顔の大きさの相対関係を解消するために、顔検出された顔画像をいろいろな解像度を変えながら、解像度毎に顔器官検出器をスキャンさせる必要があり、演算量やメモリ量が厖大になるという問題がある。あるいは顔画像の解像度を変更するのではなく、サイズの異なる複数の顔器官検出器を用意する方法もあるが、これは現実的でない。
そこで、本発明に係る画像処理装置では、顔器官検出の前段で顔検出を行なうことで大体の顔のサイズが分かることを利用して、前段で検出された顔画像を、該当する顔器官が顔器官検出器に適切な程度に拡大又は縮小する、すなわち該当する顔器官が顔器官検出器と同程度の解像度になるように、あらかじめ正規化しておく。そして、1つの大きさに固定された顔器官検出器のみを用いて正規化後の顔画像から顔器官を検出するようになっている。
したがって、本発明によれば、顔器官検出器は、前段の顔検出器によって検出された各検出顔について、正規化した1つの顔画像のみをスキャンすればよい。すなわち、各検出顔を複数の解像度に変換して解像度毎にスキャンを行なう必要がなくなるので、必要な演算量やメモリ量を大幅に削減することができ、また、解像度毎の不要なスキャンを削減できるので、顔器官検出処理を高速化することができる。
本発明に係る画像処理装置は、所望の顔器官として例えば目の位置を高速に検出するものであり、この場合の前記検出範囲設定手段は、正規化された顔画像よりも小さい、目の位置を検出するための領域を検出範囲として設定するようにする。
また、前記顔器官検出手段は、前記検出範囲に含まれる少なくとも2点の画素の輝度差を弱仮説として定義し、事前に統計学習した弱仮説によって定義される最終仮説を用いて、前記検出範囲から前記顔器官の位置を検出する。
具体的には、例えば24×24画素からなる顔器官検出手段の適用範囲内において、目などの顔器官の特徴を抽出し易い輝度差を持つとされる2点の画素の複数の組み合わせ(例えば数百組だけ)を選び、それぞれの組み合わせについて2点画素間の輝度差に関する弱仮説として定義し、事前に統計学習した弱仮説によって最終仮説を定義する。このようにして24×24画素内で定義された2点画素の輝度差に関する弱仮説の集合を、顔器官検出辞書として登録される。
なお、統計学習は、前記正規化手段により正規化された顔画像と同程度の解像度からなる顔画像を用いて行なわれるものとする。
そして、顔器官の検出時には、顔検出器などで検出された顔画像領域上で、上記の顔器官検出辞書を適用した検出器をスキャンさせていく。各スキャン位置において、弱仮説が定義されたそれぞれの2点画素において輝度差を算出し、計算結果が弱仮説に合致するかに応じてスコアをつけ、弱仮説が定義されたすべての2点画素におけるスコアの合計に基づいて、当該スキャン位置が所望する顔器官の位置に相当するか否か真偽判定することができる。
上述したように、本発明では、あらかじめ顔画像を一定サイズに正規化しておくので、例えば24×24画素に固定されたただ1つの顔器官検出器のみを用いて正規化後の顔画像から顔器官を検出することができる。また、検出範囲設定手段によって、正規化された顔画像よりも小さい領域を前記顔器官の検出範囲に設定するので(例えば、左目を検出するときには顔画像全体ではなく、左目が存在し得る顔画像よりも小さい領域を検出器のスキャン範囲とする)、顔器官検出に要する演算量やメモリ量を削減することができ、この結果、所望の顔器官の位置を高速に発見することができる。
ここで、目的とする顔器官が正のスコア値になるように前記の統計学習が行なわれる場合には、前記顔器官検出手段は、すべてのスキャン位置のうちゼロを超えた最もスコアの高い場所を目的とする顔器官の位置であると結論することができる。
また、各スキャン位置においてスコアを算出するには、弱仮説として定義されているすべての2点画素について輝度差を求める必要がある。弱仮説数が数百ある場合には、顔器官検出範囲全体にわたりすべてのスコア計算を行なうと、演算量は厖大となる。他方、弱仮説数をある程度増やしていった段階で、当該スキャン位置では目的とする顔器官である可能性があるかどうかを推定することができる。
そこで、統計学習に基づいて、もはや目的とする顔器官とは判定されないとする弱仮説数毎のスコアの限界値を設定して、顔器官検出器が演算する不要な弱仮説数を削減するようにしてもよい。限界値は、例えば投入した全学習データのうち、弱仮説数毎の最低スコアに基づいて設定することができる。あるスキャン位置においてスコア計算を行なう最中に、弱仮説数毎にその時点でのスコアを限界値と比較を行なう。スコアが限界値を下回るときには、目的の顔器官である可能性は極めて低いことから、以降のスコア計算をキャンセルし、当該スキャン位置は目的とする顔器官でない旨の結果を返すようにする。
また、顔器官検出手段を、(顔画像全体よりも小さな領域で設定された)顔器官検出範囲内のすべてのXY点でスキャンを行なう必要はなく、スコア計算すべきスキャン位置を適宜間引く高速スキャンを行なうことによって、顔器官検出に要する処理時間を短縮することができる。
あるスキャン位置で算出されたスコアが高くなると、当該スキャン位置又はこれに隣接するスキャン位置が所望の顔器官の位置である可能性が高い。ところが、上述したような1点飛ばしの高速スキャンでは、顔器官検出の粒度が粗くなる。
そこで、算出されたスコアがあらかじめ設定された値よりも高いスキャン位置では、このスキャン位置に隣接する、デフォルトではスコア計算が省略されているスキャン位置においてもスコア計算を実施して、これらのうちゼロを超えた最もスコアの高い場所を目的とする顔器官の位置に決定するようにすれば、高速化とともに検出精度を保つことができる。
また、前記所望の顔器官の具体例は左右の目である。そして、本発明に係る画像処理装置は、前記顔器官検出手段によって検出された両目の位置に基づいて、前記入力手段により入力された顔画像の位置、大きさ、角度を正規化して、顔認識、又はその他の用途に利用する正規化顔画像利用手段をさらに備えていてもよい。
顔画像の正規化を行なうための、両目以外の顔器官の位置情報を利用することも考えられる。但し、他の顔器官と比べ、左右の目の間隔は個体差が少ないことから、両目位置に基づいてより高精度な顔画像の正規化を実現することができる。
また、本発明の第2の側面は、顔を含む画像から所望の顔器官の位置を検出するための画像処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータに対し、
任意の顔検出手段によって検出された顔の大きさが既知となる画像を入力する入力手順と、
該入力された画像を該顔の大きさに基づいて所定の顔サイズとなるように正規化する正規化手順と、
該正規化された画像よりも小さい領域を前記顔器官の検出範囲に設定する検出範囲設定手順と、
該設定された検出範囲内で前記顔器官の位置を検出する顔器官検出手順と、
を実行させることを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータにインストールすることによって、コンピュータ上では協働的作用が発揮され、本発明の第1の側面に係る画像処理装置と同様の作用効果を得ることができる。
本発明によれば、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いて顔画像から顔器官の位置を好適に検出することができる、優れた画像処理装置及び画像処理方法、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、顔検出処理によって検出された顔画像から目などの顔器官の位置をより少ない演算量並びにメモリ量で検出することができる、優れた画像処理装置及び画像処理方法、並びにコンピュータ・プログラムを提供することができる。
本発明に係る画像処理装置は、あらかじめ顔画像を一定サイズに正規化しておくので、画素サイズが固定された単一の顔器官検出器のみを用いて正規化した後の顔画像から顔器官を検出することができる。また、検出範囲設定手段によって、正規化された顔画像よりも小さい領域を前記顔器官の検出範囲に設定するので(例えば、左目を検出するときには顔画像全体ではなく、左目が存在し得る顔画像よりも小さい領域を検出器のスキャン範囲とする)、顔器官検出に要する演算量やメモリ量を削減することができ、この結果、顔器官の位置を高速に発見することができる。
さらに本発明に係る画像処理装置によれば、統計学習に基づいて弱仮説数毎のスコアの限界値を設定して、あるスキャン位置においてスコア計算を行なう最中にスコアが限界値を下回った弱仮説数にて、それ以降のスコア計算をキャンセルすることによって、不要なスコア計算コストを削除して、顔器官検出処理を高速化することができる。また、スコア計算すべきスキャン位置を適宜間引くとともに、高いスコアが計算されたスキャン位置の近傍では間引かずにスコア計算を行なうことで、演算量を大幅に削減して高速化を実現するとともに、検出精度の低下を抑制することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
図1には、本発明を適用することができる顔認識システムの全体構成を模式的に示している。図示のシステム1は、画縮小器11と、顔検出器12と、両目位置検出器13と、顔認識器14と、複数枚の画像を蓄えるメモリ(SDRAM)15で構成される。また、顔検出器12と、両目位置検出器13と、顔認識器14内部にローカル・メモリ(SDRAM)を備えている。本システム1への入力は例えばデジタルカメラで撮影された画像であり、本システム1からの出力(Yes/No)は例えば同一人物か否かを示すフラグである。
画縮小器11では、入力画像に対し水平及び垂直の各方向にそれぞれ1/2にした縮小画像を作成し、原入力画像とともにSDRAM(Synchronous DRAM)15に格納する。図1に示す例では、入力画像を画1、入力画像に対し水平及び垂直方向にそれぞれ1/2にした縮小画像を画1/2、入力画像に対し水平及び垂直方向にそれぞれ1/4にした縮小画像を画1/4として、これら3枚の画像を作成して、SDRAM15に格納する。
縮小画像を作成する際、演算精度を考慮すると、入力画像から直接それぞれの縮小画像を作成する方法が望ましい。但し、ハードウェアの規模を考慮して、1/2縮小を順番に施す方法、つまり、始めに入力画像(画1)から画1/2を作成し、次に作成された画1/2から画1/4を作成する方法で実現するようにしてもよい。
顔検出器12では、入力画像とSDRAM15に格納されているすべての縮小画像に対して顔を検出し、検出された顔の大きさと顔の位置を求める。顔の位置の検出に関しては、画像全体を検出することで処理速度を考慮しなければ容易に実現可能である。一方、いろいろな大きさの顔の検出に関しては、画像の解像度と検出顔の大きさの相対関係の問題で(図9を参照のこと)、画像の解像度を固定にする方法(すなわち、入力画像に対していろいろな大きさの顔検出器を用意する方法)と、検出顔の大きさを固定にする方法(検出できる顔の大きさが固定された1つの顔検出器を用い、入力画像をいろいろな解像度に縮小して検出する方法(図10を参照のこと))が考えられるが、後者の方法が現実的である。したがって、図1に示すように、顔検出器12では、画縮小器11で作成された画1、画1/2、画1/4の各縮小画像に対して、24×24画素内に顔が存在するか否かを識別する。
なお、縮小率の刻みが1/2、1/4では粗過ぎて精度が不十分である場合には、例えば画縮小器11で画7/8、画6/8、画5/8の縮小率の画像をさらに作成し、顔検出器12でそれぞれの縮小率の画像に対しても顔検出を行なうようにすれば良い。
顔検出の特徴抽出として2点画素差分方式を適用することができる。これは、24×24画素内において顔の特徴を抽出し易い2点の画素の輝度差をさまざまな2点で行なう方式である。また、識別器演算としてAdaboostアルゴリズムを用いることができる。
両目位置検出器13では、顔画像を顔認識するための準備として、顔検出器12によって検出された顔に対して解像度を上げた画像の顔を正規化するために、左右の目の位置を特定する。すなわち、両目位置を検出して、顔検出によって得られた顔の大きさ、顔の位置から、その顔画像の解像度を上げた顔の大きさ、顔の位置、顔の角度を求める。
本発明の特定の実施形態では、顔器官として左右の目を顔画像から検出するように構成されている。これは、左右の目の間隔の個体差が少ないという経験則に依拠する。勿論、目の中心や目頭、目尻、鼻、鼻底部、鼻側面、口、口端点、眉毛、眉毛頭、眉毛尻などさまざまな顔器官を検出対象としても、同様に本発明を構成することができる。
両目位置検出の特徴抽出として、顔検出と同様に、2点画素差分方式を適用することができる。2点画素差分方式の適用範囲も24×24画素であり、顔検出器12と同じであるので、顔検出器12と同一のハードウェアで処理時間をシリアルにして実現することができる。また、識別器演算としてAdaboostアルゴリズムを用いることができる。
24×24画素からなる検出器において、目の特徴を抽出し易い輝度差を持つとされる2点の画素の複数の組み合わせ(例えば数百組だけ)を選び、それぞれの組み合わせについて2点画素間の輝度差に関する弱仮説として定義し、事前に統計学習した弱仮説によって最終仮説を定義する。このようにして24×24画素内で定義された2点画素の輝度差に関する弱仮説の集合は目検出器を構成し、顔器官検出辞書として登録される。そして、検出時には、顔検出器12で検出された顔画像領域内で24×24画素からなる目検出器をスキャンさせていく。各スキャン位置において、弱仮説が定義されたそれぞれの2点画素間の輝度差を算出し、その計算結果が弱仮説に合致するかに応じてスコアをつけ、弱仮説が定義されたすべての2点画素におけるスコアの合計を最終仮説として、当該スキャン位置が目の位置か否か真偽判定することができる。
本発明は、目、あるいは口、鼻といった顔器官の位置を高速に発見することに主な特徴があるが、両目位置検出などの顔器官検出処理の詳細については後述に譲る。
顔認識器14では、両目位置検出器13によって左右の目位置が特定された顔画像から顔の大きさ、位置、角度を求め、それらに応じて顔検出器12で検出された顔画像を正規化して60×66画素の内部のSRAMに一旦蓄えて、登録画像と一致するか否かを調べる。
顔画像の正規化を行なうための、両目以外の顔器官の位置情報を利用することも考えられる。但し、他の顔器官と比べ、左右の目の間隔は個体差が少ないことから、両目位置に基づいてより高精度な顔画像の正規化を実現することができる。
顔認識器14には、顔認識の特徴抽出として「ガボア・フィルタリング(Gabor Filtering)」を適用することができる。人間の視覚細胞には、ある特定の方位に対して選択性を持つ細胞が存在することが既に判明されている。これは、垂直の線に対して発火する細胞と、水平の線に反応する細胞で構成される。ガボア・フィルタは、これと同様に、方向選択性を持つ複数のフィルタで構成される空間フィルタである。
また、顔認識器14の識別器演算としてgentleboostを用いる。正規化された顔画像にガボア・フィルタを適用して得られた結果と、以前に登録された画像にガボア・フィルタを適用して得られた結果との類似度を求める。そして、求められた類似度に対してgentleboostを施すことによって、登録画と一致したか否か識別する。
上述したように、顔検出器12には、複雑な画像シーンの中から画像信号の濃淡パターンのみを使って顔検出する手法として、Adaboostアルゴリズムなどの統計学習を用いて構成される検出器を用いることができる。また、入力画像にはさまざまな大きさの顔が含まれることが想定されることから、検出できる顔の大きさが固定された1つの検出器を用い、入力画像をいろいろな解像度に縮小して解像度毎に検出するように構成されている(図10を参照のこと)。
また、顔器官として左右の目の位置を検出する両目位置検出器13も、特徴抽出として2点画素差分方式を適用するとともに、Adaboostアルゴリズムなどの統計学習を用いた検出器を使用する。
ここで、両目位置検出処理では、画像の解像度と検出顔の大きさの相対関係を解消するために、顔検出器12で顔検出された顔画像をいろいろな解像度を変えながら解像度毎に顔器官検出器をスキャンさせる必要があり(図11を参照のこと)、演算量やメモリ量が厖大になるという問題がある。あるいは顔画像の解像度を変更するのではなく、サイズの異なる複数の顔器官検出器を用意する方法もあるが、これは現実的でない。
そこで、本実施形態では、前段の顔検出器12で顔検出した際に大体の顔のサイズが分かることを利用して、顔画像を、左右の目が目検出器と同程度の解像度になるように、あらかじめ正規化しておくようにした。
具体的には、目検出器のサイズを24×24画素としたとき、顔画像を80×80画素サイズに正規化する。このようにすれば、24×24画素に固定された1つの目検出器のみを用いて80×80画に正規化後の顔画像から目の位置を検出することができる。すなわち、図2に示すように、顔検出器12から出力される顔画像が大きければ、目検出器と同程度の解像度にあらかじめ正規化し、逆に顔画像が小さければ拡大する。この結果、複数の解像度でスキャンを行なう必要がなくなるので、高速に目検出を行なうことができる。
図3には、顔画像を正規化してから顔器官として目検出を行なう概略的な処理手順をフローチャートの形式で示している。
前段の顔検出器12からは、処理対象の画像中の顔の大きさと顔の位置に関する情報が入力される(ステップS1)。目検出のために、まず、顔サイズが一定(例えば、顔の一辺が80×80画素)となるように正規化する(ステップS2)。
次いで、正規化した顔画像のうち目が存在する範囲を目検出範囲に設定し、この検出範囲において、目検出器をスキャンする(ステップS3)。
目検出器には2点画素差分方式が適用され、また、識別器演算としてAdaboostアルゴリズムが適用される。80×80画素の顔画像に対し、目検出器は例えば24×24画素からなる。
目検出器は、この24×24画素の領域内で、目の特徴を抽出し易い輝度差を持つとされる2点の画素の複数の組み合わせ(例えば数百組だけ)を設定し、それぞれの2点画素間の輝度差に関する弱仮説を定義し、且つ、事前に統計学習した弱仮説によって最終仮説を定義している。ここでは、目(目的とする顔器官)が正のスコア値になるように統計学習を行なうものとする。目検出範囲の各スキャン位置において、弱仮説が定義されたそれぞれの2点画素間において輝度差を算出し、その計算結果が弱仮説に合致するかに応じて付けられるスコアの合計を当該スキャン位置におけるスコアとして保存する。
そして、所定の目検出範囲内で目検出器のスキャンを終えると、スコアがゼロを超えていて、且つ、最もスコアの高いスキャン位置を目の位置とする(ステップS4)。目的とする顔器官が正のスコア値になるように顔器官検出器の統計学習を行なっている場合には、ゼロを超えた最もスコアの高い場所が目的器官の位置であると結論することができる。
上述のようにして一方の目の位置を検出する、続いて、反対側の目についても同様にステップS3〜S4の処理を実施して、その位置を検出する(ステップS5)。
そして、両目の位置が検出されると、目の位置があらかじめ決めてある模範位置に合うように、拡大縮小、回転を行ない、顔位置の正規化を行なってから(ステップS6)、得られた顔画像を、顔認識などの後段のアプリケーションに利用する。
図4には、正規化された顔画像上を左目検出器でスキャンする様子を模式的に示している。
図4Aに示すように、顔検出器12からはいろいろな解像度の顔画像が出力されることが想定される。左目などの顔器官検出を行なう際には、まず、80×80画素などあらかじめ決められたサイズに正規化される。そして、正規化された顔画像上で、左目検出器をスキャンさせる。左目検出器は、少なくとも2点の輝度差を弱仮説にし、これを多数組み合わせて最終仮説とする。
顔画像は、例えば80×80画素に正規化されているが、当該顔領域全体を左目検出器がスキャンする必要はなく、図4B中の斜線で示すように左目が存在しそうな範囲をあらかじめ左目検出範囲に設定する。このような顔器官検出範囲は、正規化された顔領域画像よりも小さい、固定された範囲とする。
80×80画素の顔画像に対し、目検出器のサイズは24×24画素程度でよい。Adaboostなどにより用意された左目検出器は、左目の位置と重なると正のスコア値になるように統計学習が行なわれている。したがって、上述した左目検出範囲で左目検出器をXY方向にスキャンさせて、ゼロを超えた最もスコアの高い場所が目的器官の位置であると結論することができる。
なお、左目検出器を左目検出範囲内のすべてのXY点でスキャンを行なう必要はなく、スキャン位置を適宜間引くことによって検出に要する処理時間を短縮することができるが、この点の詳細については後述に譲る。
後段のアプリケーションとして、図1に示したように顔画像を顔認識する処理を行なう場合、顔器官検出としての目検出器による両目検出の結果を用いて、顔検出によって得られた顔の大きさ、顔の位置から、その顔画像の解像度を上げた顔の大きさ、顔の位置、顔の角度を求めるといった顔認識のための準備を行なう。本発明の特定の実施形態では、顔器官として左右の目を顔画像から検出するように構成されるが、これは左右の目の間隔の個体差が少ないという経験則に依拠する。例えば、顔画像を上記のように80×80画素に正規化した場合、目の幅が10〜15画素であるのに対し、目の間隔は概ね16画素となる。
図5には、左目検出器の構成例を示している。左目検出器は、24×24画素からなり、点画素差分方式を適用するとともに、識別器演算としてAdaboostアルゴリズムを用いている。
図5Aに示すように、24×24画素からなる左目検出器において、目の特徴を抽出し易い輝度差を持つとされる2点の画素pix1(t)及びpix2(t)の組み合わせが複数設定されている(tは1〜数百の正の整数)。そして、それぞれの2点の画素pix1(t)及びpix2(t)の組み合わせについて、画素間の輝度差の閾値θ(t)未満であるとする弱仮説を定義し、事前に統計学習した弱仮説によって最終仮説を定義する。ここでは、左目が正のスコア値になるように統計学習を行なうものとする。弱仮説を下式に示しておく。
なお、統計学習は、正規化された顔画像と同程度の解像度からなる顔画像を用いて行なわれるものとする。
基本的には、目の特徴を抽出し易い輝度差を持つとされる輝度差を求める2点画素の組み合わせに対して弱仮説が定義されるが、組み合わせ毎に目の特徴を表す度合いが異なる。そこで、2点の画素pix1(t)及びpix2(t)の組み合わせに対して重みα(t)が与えられる。
したがって、例えば左目検出用の辞書には、2点画素の組み合わせ毎の、画素pix1(t)及びpix2(t)の位置情報と、画素間の輝度差の閾値θ(t)と、重みα(t)が記述されている(図5Bを参照のこと)。この辞書はAdaboostを用いて別に用意しておく。
検出時には、2点の画素pix1(t)及びpix2(t)の輝度差を算出し、仮説pix1(t)−pix2(t)<θ(t)を満たすかどうかをチェックし、仮説が真となるときにはh(t)=1を返し、偽であればh(t)=−1を返すようになっている。
そして、弱仮説h(t)に対して重みα(t)を掛けたものが2点の画素pix1(t)及びpix2(t)についてのスコアとなり、すべての2点画素の組み合わせの合計値が、当該スキャン位置におけるスコアすなわち最終仮説となる。下式のように、目が正のスコア値になるように統計学習を行なっている場合には、左目検出範囲で左目検出器をXY方向にスキャンさせて、ゼロを超えた最もスコアの高い場所が目的器官の位置であると結論することができる。
図5Cには、顔器官検出器の構成を擬似プログラムコードの形式で記述している。
まず、スキャン位置において、スコアscoreを0に初期化する。
そして、弱仮説が定義されている2点の画素pix1(t)及びpix2(t)の輝度差を算出し、仮説pix1(t)−pix2(t)<θ(t)を満たすかどうかをチェックする。弱仮説が真となるときにはh(t)=1が返され、偽であればh(t)=−1が返される。弱仮説h(t)に対して重みα(t)を掛けた値h(t)α(t)が当該2点の画素pix1(t)及びpix2(t)についてのスコアとなり、これをスコアscoreに加算する。
このようなスコア計算をN回だけ、すなわちすべての2点画素の組み合わせについて繰り返し行ない、得られたスコアscoreが当該スキャン位置におけるスコアとなる(但し、Nは全弱仮説数であり、例えば数百の値)。
目が正のスコア値になるように統計学習を行なっているので、スコアsocerが正の値であれば、真すなわち当該スキャン位置が目的とする顔器官の位置であるとする結果が返され、そうでなければ偽すなわち当該スキャン位置が目的とする顔器官の位置でないとする結果が返される。
図5Dには、顔画像のうち所定の顔器官検出範囲内で、2点の画素の輝度差からなる弱仮説(Weak Learner:WL)を定義する様子を示している。同図中では、弱仮説数を2、50、100、500とした場合を挙げている。なお、顔画像は肖像の保護のためグラデーション処理を施していることを容赦されたい。
図5B並びに図5Dに示したように、左目など顔器官検出器は、数百組の2点画素における輝度差に関する弱仮説で構成される。数百組すべての2点画素について輝度差を求めなければ、そのスキャン位置におけるスコアを計算することはできない。すべてのスキャン位置についてスコアを計算すると、その演算量や必要なメモリ量は厖大となる。
そこで、統計学習に基づいて、顔器官検出器が演算する不要な弱仮説数を削減するようにしてもよい。本実施形態では目的とする顔器官が正のスコア値になるように統計学習が行なわれるが(前述)、このような場合、検出時において、弱仮説数をある個数まで増やしていっても正のスコア値にならなければ、このまま最後までスコア計算を継続しても目的とする顔器官と評価若しくは判定されないという、「限界値」が統計学習から導き出される。
このような限界値は、投入した全学習データのうち、弱仮説数毎の最低スコアに基づいて設定することができる(図6Aを参照のこと)。そして、あるスキャン位置においてスコア計算を行なう最中に、弱仮説数毎にその時点でのスコアを限界値と比較を行なう。スコアが限界値を下回るときには(図6Bを参照のこと)、目的の顔器官である可能性は極めて低いことから、以降のスコア計算をキャンセルし、当該スキャン位置は目的とする顔器官でない旨の結果を返すようにする。
また、左目検出器を左目検出範囲内のすべてのXY点でスキャンを行なう必要はなく、スコア計算すべきスキャン位置を適宜間引いた高速スキャンを行なうことによって、顔器官検出に要する処理時間を短縮することができる。
図7には、顔器官検出範囲内で高速スキャンを行なう様子を示している。同図では、デフォルトのスキャン位置を左斜線で示している。図示の例では、水平方向(x方向)には、1点飛ばしでデフォルトのスキャン位置を決定し、また、垂直方向(y方向)には1行間隔でスキャン(1点飛ばしのスキャン)する行を設けている。
あるスキャン位置で算出されたスコアが高くなると、当該スキャン位置又はこれに隣接するスキャン位置が所望の顔器官の位置である可能性が高い。ところが、上述したような1点飛ばしの高速スキャンでは、顔器官検出の粒度が粗くなる。
そこで、算出されたスコアがあらかじめ設定された値よりも高いスキャン位置では、このスキャン位置に隣接する、デフォルトではスコア計算が省略されているスキャン位置においてもスコア計算を実施して、これらのうちゼロを超えた最もスコアの高い場所を目的とする顔器官の位置に決定するようにすれば、高速化とともに検出精度を保つことができる。
図7に示した例では、高いスコア値が算出されたスキャン位置を二重斜線で描いている。そして、当該スキャン位置に隣接する、同図中の右、下、並びに右下のスキャン位置(図中、右斜線で示す)においてもスコア計算を行なっている。
図7に示したような高速スキャンを行なうことにより、全スキャン位置でスコア計算を行なう場合に対し、およそ4分の1の計算量で、検出精度の低下を抑制しながら、所望の顔器官を好適に探索することができる。
顔画像から検出すべき顔器官の代表例は左右の目であり、図1に示したように、顔認識システム1は、顔器官検出手段として両目位置検出器13を備えている。この両目位置検出器13によって検出された両目の位置に基づいて、前記入力手段により入力された顔画像の位置、大きさ、角度を正規化して、後段の顔認識器14によって顔認識を行ない(前述)、あるいは図示しない、検出顔を利用するその他のアプリケーションに供することができる。
図8には、検出された顔画像をその大きさに基づいて正規化し、さらに両目の位置に基づいて顔画像の位置、大きさ、角度を正規化した結果を示している。同図から、目検出を行ない、この目の位置で各顔領域画像を正規化することで、バラバラであった顔のアライメントを精度よく合わせることができる、ということを理解できよう。
顔画像の正規化を行なうための、両目以外の顔器官の位置情報を利用することも考えられる。但し、他の顔器官と比べ、左右の目の間隔は個体差が少ないことから、両目位置に基づいてより高精度な顔画像の正規化を実現することができる。
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
例えば、顔認識技術を適用する個人認証システムや、性別識別などのマンマシン・インターフェースや、カメラワークの自動化などの目的で被写体認識技術を搭載したデジタルカメラ、デジタルカメラ付きの携帯電話機やその他の携帯端末に対して、本発明を適用することができる。
また、本明細書では、顔器官として左右の目を顔画像から検出する実施形態を中心に説明してきたが、本発明の要旨はこれに限定されるものではない。目の中心や目頭、目尻、鼻、鼻底部、鼻側面、口、口端点、眉毛、眉毛頭、眉毛尻などさまざまな顔器官を検出対象としても、同様に本発明を適用することができる。
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
図1は、本発明を適用することができる顔認識システムの全体構成を模式的に示した図である。 図2は、前段で顔検出した際に大体の顔のサイズが分かることを利用して、顔画像を左右の目が目検出器と同程度の解像度になるようにあらかじめ正規化して絡め検出を行なう様子を示した図である。 図3は、顔画像を正規化してから顔器官検出を行なう概略的な処理手順を示したフローチャートである。 図4Aは、顔画像を正規化してから左目検出器でスキャンする様子を模式的に示した図である。 図4Bは、正規化された顔画像上を左目検出器でスキャンする様子を模式的に示した図である。 図5Aは、24×24画素からなる左目検出器において、目の特徴を抽出し易い輝度差を持つとされる2点の画素pix1(t)及びpix2(t)の組み合わせが複数設定されている様子を示した図である。 図5Bは、顔器官検出用の辞書の構成例を示した図である。 図5Cは、顔器官検出器の構成を擬似プログラムコードの形式で示した図である。 図5Dは、顔画像のうち所定の顔器官検出範囲内で、2点の画素の輝度差からなる弱仮説を定義する様子を示した図である。 図6Aは、投入した全学習データのうち、弱仮説数毎の最低スコアに基づいて限界値を設定する様子を示した図である。 図6Bは、限界値を下回った弱仮説数でスコアの計算を打ち切る様子を示した図である。 図7は、顔器官検出範囲内で高速スキャンを行なう様子を示した図である。 図8は、検出された顔画像をその大きさに基づいて正規化し、さらに両目の位置に基づいて顔画像の位置、大きさ、角度を正規化した結果を示した図である。 図9は、入力画像にさまざまな大きさの顔が含まれている様子を示した図である。 図10は、入力画像の解像度を変えながら顔検出器をスキャンさせ、各解像度の入力画像からは、顔検出器のサイズに近い解像度の顔のみを検出する様子を示した図である。 図11は、顔画像の解像度を変えながら顔器官検出器をスキャンさせ、顔器官検出器のサイズに近い解像度の顔器官のみが各解像度で検出される様子を示した図である。
符号の説明
1…顔認識システム
11…画縮小器
12…顔検出器
13…両目位置検出器
14…顔認識器
15…メモリ

Claims (21)

  1. 顔を含む画像から所望の顔器官の位置を検出する画像処理装置であって、
    任意の顔検出手段によって検出された顔の大きさが既知となる画像を入力する入力手段と、
    該入力された画像を該顔の大きさに基づいて所定の顔サイズとなるように正規化する正規化手段と、
    該正規化された画像よりも小さい領域を前記顔器官の検出範囲に設定する検出範囲設定手段と、
    該設定された検出範囲内で前記顔器官の位置を検出する顔器官検出手段と、
    を具備することを特徴とする画像処理装置。
  2. 前記検出範囲設定手段は、前記正規化手段が正規化する顔画像よりも小さい、前記所望の顔器官の位置を検出するための領域を顔器官検出範囲として設定する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記顔器官検出手段は、前記顔器官検出範囲に含まれる少なくとも2点の画素の輝度差を弱仮説として定義し、事前に統計学習した弱仮説によって定義される最終仮説を用いて、前記検出範囲から前記顔器官の位置を検出する、
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記の統計学習は、前記正規化手段が正規化する顔画像と同程度の解像度からなる顔画像を用いて行なわれる、
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記顔器官検出手段の適用範囲内において、顔器官の特徴を抽出し易い輝度差を持つとされる少なくとも2点の画素の複数の組み合わせの各々について、2点画素間の輝度差に関する弱仮説として定義し、事前に統計学習した弱仮説によって最終仮説を定義し、
    前記顔器官検出手段は、前記正規化手段により正規化された後の顔画像上で設定された顔器官検出範囲内の各スキャン位置において、弱仮説が定義されたそれぞれの2点画素において輝度差を算出し、計算結果が弱仮説に合致するかに応じてスコアをつけ、弱仮説が定義されたすべての2点画素におけるスコアの合計に基づいて、当該スキャン位置が所望する顔器官の位置に相当するか否か真偽判定する、
    ことを特徴とする請求項3に記載の画像処理装置。
  6. 目的とする顔器官が正のスコア値になるように前記の統計学習が行なわれており、
    前記顔器官検出手段は、すべてのスキャン位置のうちゼロを超えた最もスコアの高い場所を目的とする顔器官の位置であると結論する、
    ことを特徴とする請求項5に記載の画像処理装置。
  7. 投入した全学習データのうち、弱仮説数毎の最低スコアに基づいてスコアの限界値を設定する手段をさらに備え、
    前記顔器官検出手段は、あるスキャン位置においてスコア計算を行なう最中に、弱仮説数毎にその時点でのスコアを前記限界値と比較し、スコアが前記限界値を下回るときには以降のスコア計算をキャンセルし、当該スキャン位置は目的とする顔器官でない旨の結果を返す、
    ことを特徴とする請求項5に記載の画像処理装置。
  8. 前記顔器官検出手段は、前記顔器官の検出範囲内において、スコア計算すべきスキャン位置を適宜間引いた高速スキャンを行なう、
    ことを特徴とする請求項5に記載の画像処理装置。
  9. 算出されたスコアがあらかじめ設定された値よりも高いスキャン位置に隣接する、デフォルトではスコア計算が省略されているスキャン位置においてもスコア計算を実施する、
    ことを特徴とする請求項8に記載の画像処理装置。
  10. 前記所望の顔器官は左右の目であり、
    前記顔器官検出手段によって検出された両目の位置に基づいて、前記入力手段により入力された顔画像の位置、大きさ、角度を正規化して、顔認識又はその他の用途に利用する正規化顔画像利用手段をさらに備える、
    ことを特徴とする請求項1に記載の画像処理装置。
  11. 顔を含む画像から所望の顔器官の位置を検出する画像処理方法であって、
    任意の顔検出手段によって検出された顔の大きさが既知となる画像を入力する入力ステップと、
    該入力された画像を該顔の大きさに基づいて所定の顔サイズとなるように正規化する正規化ステップと、
    該正規化された画像よりも小さい領域を前記顔器官の検出範囲に設定する検出範囲設定ステップと、
    該設定された検出範囲内で前記顔器官の位置を検出する顔器官検出ステップと、
    を具備することを特徴とする画像処理方法。
  12. 前記検出範囲設定ステップでは、前記正規化ステップにおいて正規化される顔画像よりも小さい、前記所望の顔器官の位置を検出するための領域を顔器官検出範囲として設定する、
    ことを特徴とする請求項11に記載の画像処理方法。
  13. 前記顔器官検出ステップでは、前記顔器官検出範囲に含まれる少なくとも2点の画素の輝度差を弱仮説として定義し、事前に統計学習した弱仮説によって定義される最終仮説を用いて、前記検出範囲から前記顔器官の位置を検出する、
    ことを特徴とする請求項11に記載の画像処理方法。
  14. 前記の統計学習は、前記正規化ステップにおいて正規化された顔画像と同程度の解像度からなる顔画像を用いて行なわれる、
    ことを特徴とする請求項13に記載の画像処理方法。
  15. 前記顔器官検出ステップにおける顔器官検出の適用範囲内において、顔器官の特徴を抽出し易い輝度差を持つとされる少なくとも2点の画素の複数の組み合わせの各々について、2点画素間の輝度差に関する弱仮説として定義し、事前に統計学習した弱仮説によって最終仮説を定義し、
    前記顔器官検出ステップでは、前記正規化ステップにおいて正規化された後の顔画像上で設定された顔器官検出範囲内の各スキャン位置において、弱仮説が定義されたそれぞれの2点画素において輝度差を算出し、計算結果が弱仮説に合致するかに応じてスコアをつけ、弱仮説が定義されたすべての2点画素におけるスコアの合計に基づいて、当該スキャン位置が所望する顔器官の位置に相当するか否か真偽判定する、
    ことを特徴とする請求項13に記載の画像処理方法。
  16. 目的とする顔器官が正のスコア値になるように前記の統計学習が行なわれており、
    前記顔器官検出ステップでは、すべてのスキャン位置のうちゼロを超えた最もスコアの高い場所を目的とする顔器官の位置であると結論する、
    ことを特徴とする請求項15に記載の画像処理方法。
  17. 投入した全学習データのうち、弱仮説数毎の最低スコアに基づいてスコアの限界値を設定するステップをさらに備え、
    前記顔器官検出ステップでは、あるスキャン位置においてスコア計算を行なう最中に、弱仮説数毎にその時点でのスコアを前記限界値と比較し、スコアが前記限界値を下回るときには以降のスコア計算をキャンセルし、当該スキャン位置は目的とする顔器官でない旨の結果を返す、
    ことを特徴とする請求項15に記載の画像処理方法。
  18. 前記顔器官検出ステップでは、前記顔器官の検出範囲内において、スコア計算すべきスキャン位置を適宜間引いた高速スキャンを行なう、
    ことを特徴とする請求項15に記載の画像処理方法。
  19. 算出されたスコアがあらかじめ設定された値よりも高いスキャン位置に隣接する、デフォルトではスコア計算が省略されているスキャン位置においてもスコア計算を実施する、
    ことを特徴とする請求項18に記載の画像処理方法。
  20. 前記所望の顔器官は左右の目であり、
    前記顔器官検出ステップにおいて検出された両目の位置に基づいて、前記入力手段により入力された顔画像の位置、大きさ、角度を正規化して、顔認識又はその他の用途に利用する正規化顔画像利用ステップをさらに備える、
    ことを特徴とする請求項11に記載の画像処理方法。
  21. 顔を含む画像から所望の顔器官の位置を検出するための画像処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータに対し、
    任意の顔検出手段によって検出された顔の大きさが既知となる画像を入力する入力手順と、
    該入力された画像を該顔の大きさに基づいて所定の顔サイズとなるように正規化する正規化手順と、
    該正規化された画像よりも小さい領域を前記顔器官の検出範囲に設定する検出範囲設定手順と、
    該設定された検出範囲内で前記顔器官の位置を検出する顔器官検出手順と、
    を実行させることを特徴とするコンピュータ・プログラム。
JP2007177007A 2007-07-05 2007-07-05 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム Expired - Fee Related JP4479756B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2007177007A JP4479756B2 (ja) 2007-07-05 2007-07-05 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
US12/139,741 US8463049B2 (en) 2007-07-05 2008-06-16 Image processing apparatus and image processing method
TW097122547A TWI380223B (en) 2007-07-05 2008-06-17 Image processing apparatus and image processing method
EP08158565A EP2012255B1 (en) 2007-07-05 2008-06-19 Image processing apparatus and image processing method
CN2008101305641A CN101339609B (zh) 2007-07-05 2008-07-07 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007177007A JP4479756B2 (ja) 2007-07-05 2007-07-05 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2009015614A true JP2009015614A (ja) 2009-01-22
JP4479756B2 JP4479756B2 (ja) 2010-06-09

Family

ID=39745040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007177007A Expired - Fee Related JP4479756B2 (ja) 2007-07-05 2007-07-05 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム

Country Status (5)

Country Link
US (1) US8463049B2 (ja)
EP (1) EP2012255B1 (ja)
JP (1) JP4479756B2 (ja)
CN (1) CN101339609B (ja)
TW (1) TWI380223B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020352A (ja) * 2011-07-08 2013-01-31 Fujifilm Corp オブジェクト検出装置、方法およびプログラム
JP2013058162A (ja) * 2011-09-09 2013-03-28 Sumitomo Electric Ind Ltd 特徴量抽出装置、対象物検出システム、コンピュータプログラム及び特徴量抽出方法
JP2013117793A (ja) * 2011-12-01 2013-06-13 Canon Inc 情報処理装置、情報処理方法、及びプログラム
JP2014530424A (ja) * 2011-09-27 2014-11-17 インテル・コーポレーション Adaboost学習アルゴリズムを使用して顔特徴点の位置を検出するための方法、装置、およびコンピュータ可読記録媒体

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630006B2 (en) 1997-10-09 2009-12-08 Fotonation Ireland Limited Detecting red eye filter and apparatus using meta-data
US20110102643A1 (en) * 2004-02-04 2011-05-05 Tessera Technologies Ireland Limited Partial Face Detector Red-Eye Filter Method and Apparatus
TWI427545B (zh) * 2009-11-16 2014-02-21 Univ Nat Cheng Kung 以尺度不變特徵轉換和人臉角度估測為基礎的人臉辨識方法
JP2012203613A (ja) 2011-03-25 2012-10-22 Sony Corp 画像処理装置および方法、記録媒体並びにプログラム
JP5774889B2 (ja) * 2011-03-31 2015-09-09 株式会社ソニー・コンピュータエンタテインメント 情報処理装置、情報処理システム、および情報処理方法
CN103563350B (zh) * 2011-05-31 2016-09-28 松下知识产权经营株式会社 图像处理装置、图像处理方法以及数码相机
TWI513291B (zh) * 2013-12-12 2015-12-11 Ind Tech Res Inst 影像處理的方法、裝置及電腦可讀取媒體
US10592727B2 (en) * 2014-07-28 2020-03-17 Centre For Development Of Advanced Computing Apparatus for automated monitoring of facial images and a process therefor
JP6447955B2 (ja) * 2014-12-09 2019-01-09 富士ゼロックス株式会社 画像処理装置およびプログラム
CN104778481B (zh) * 2014-12-19 2018-04-27 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN105404868B (zh) * 2015-11-19 2019-05-10 电子科技大学 一种基于交互平台的复杂背景中文本的快速检测方法
CN106325519A (zh) * 2016-08-31 2017-01-11 周口师范学院 基于眼睛检测的终端屏幕控制装置和方法
CN106600855A (zh) * 2016-12-22 2017-04-26 河南牧业经济学院 基于面部识别的支付装置和方法
CN109559535A (zh) * 2018-11-22 2019-04-02 深圳市博远交通设施有限公司 一种一体化人脸识别的动态声光协调交通信号系统
CN109696788B (zh) * 2019-01-08 2021-12-14 武汉精立电子技术有限公司 一种基于显示面板的快速自动对焦方法
KR20210074915A (ko) * 2019-12-12 2021-06-22 현대자동차주식회사 안면 인식 잠금 해제 장치 및 그것의 동작방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2278856T3 (es) * 1996-08-05 2007-08-16 Bayer Cropscience Ag Fenilcetoenoles 2- y 2,5-substituidos.
US7099510B2 (en) 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US6934332B1 (en) * 2001-04-24 2005-08-23 Vweb Corporation Motion estimation using predetermined pixel patterns and subpatterns
US6895103B2 (en) 2001-06-19 2005-05-17 Eastman Kodak Company Method for automatically locating eyes in an image
US7764808B2 (en) * 2003-03-24 2010-07-27 Siemens Corporation System and method for vehicle detection and tracking
CN1839410B (zh) * 2003-07-18 2015-05-20 佳能株式会社 图像处理设备、摄像设备、图像处理方法
JP2005044330A (ja) 2003-07-24 2005-02-17 Univ Of California San Diego 弱仮説生成装置及び方法、学習装置及び方法、検出装置及び方法、表情学習装置及び方法、表情認識装置及び方法、並びにロボット装置
JP4493448B2 (ja) 2003-09-09 2010-06-30 富士フイルム株式会社 対象物識別装置および方法並びにプログラム
JP4517633B2 (ja) 2003-11-25 2010-08-04 ソニー株式会社 対象物検出装置及び方法
JP2005190400A (ja) 2003-12-26 2005-07-14 Seiko Epson Corp 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム
JP4217664B2 (ja) 2004-06-28 2009-02-04 キヤノン株式会社 画像処理方法、画像処理装置
CN101023446B (zh) * 2004-09-17 2010-06-16 三菱电机株式会社 脸部认证装置和脸部认证方法
KR100664956B1 (ko) * 2004-11-24 2007-01-04 삼성전자주식회사 눈 검출 방법 및 장치
US7599549B2 (en) 2004-12-22 2009-10-06 Fujifilm Corporation Image processing method, image processing apparatus, and computer readable medium, in which an image processing program is recorded
JP2006268825A (ja) 2005-02-28 2006-10-05 Toshiba Corp オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム
CN101142586A (zh) 2005-03-18 2008-03-12 皇家飞利浦电子股份有限公司 执行人脸识别的方法
JP2007025900A (ja) 2005-07-13 2007-02-01 Canon Inc 画像処理装置、画像処理方法
JP2007026308A (ja) 2005-07-20 2007-02-01 Canon Inc 画像処理方法、画像処理装置
JP4595750B2 (ja) 2005-08-29 2010-12-08 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP4708948B2 (ja) 2005-10-03 2011-06-22 富士フイルム株式会社 顔向き特定方法、顔判別方法および装置並びにプログラム
TWI318108B (en) 2005-11-30 2009-12-11 Univ Nat Kaohsiung Applied Sci A real-time face detection under complex backgrounds
JP4532419B2 (ja) 2006-02-22 2010-08-25 富士フイルム株式会社 特徴点検出方法および装置並びにプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020352A (ja) * 2011-07-08 2013-01-31 Fujifilm Corp オブジェクト検出装置、方法およびプログラム
US8644625B2 (en) 2011-07-08 2014-02-04 Fujifilm Corporation Object detection device, method and program
JP2013058162A (ja) * 2011-09-09 2013-03-28 Sumitomo Electric Ind Ltd 特徴量抽出装置、対象物検出システム、コンピュータプログラム及び特徴量抽出方法
JP2014530424A (ja) * 2011-09-27 2014-11-17 インテル・コーポレーション Adaboost学習アルゴリズムを使用して顔特徴点の位置を検出するための方法、装置、およびコンピュータ可読記録媒体
US9202109B2 (en) 2011-09-27 2015-12-01 Intel Corporation Method, apparatus and computer readable recording medium for detecting a location of a face feature point using an Adaboost learning algorithm
JP2016001492A (ja) * 2011-09-27 2016-01-07 インテル・コーポレーション Adaboost学習アルゴリズムを使用して顔特徴点の位置を検出するための方法、装置、およびコンピュータ可読記録媒体
US9563821B2 (en) 2011-09-27 2017-02-07 Intel Corporation Method, apparatus and computer readable recording medium for detecting a location of a face feature point using an Adaboost learning algorithm
JP2013117793A (ja) * 2011-12-01 2013-06-13 Canon Inc 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
US8463049B2 (en) 2013-06-11
TW200910223A (en) 2009-03-01
EP2012255A1 (en) 2009-01-07
US20090010501A1 (en) 2009-01-08
CN101339609B (zh) 2012-05-30
EP2012255B1 (en) 2012-09-19
TWI380223B (en) 2012-12-21
JP4479756B2 (ja) 2010-06-09
CN101339609A (zh) 2009-01-07

Similar Documents

Publication Publication Date Title
JP4479756B2 (ja) 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
US7929771B2 (en) Apparatus and method for detecting a face
JP4946730B2 (ja) 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム
US7869632B2 (en) Automatic trimming method, apparatus and program
US8345921B1 (en) Object detection with false positive filtering
US8253819B2 (en) Electronic camera and image processing method
US9098760B2 (en) Face recognizing apparatus and face recognizing method
US8254643B2 (en) Image processing method and device for object recognition
US8605955B2 (en) Methods and apparatuses for half-face detection
US20110158542A1 (en) Data correction apparatus and method
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
JP2018092610A (ja) 画像認識装置、画像認識方法及びプログラム
JP2008152530A (ja) 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム
KR20110064117A (ko) 얼굴 정면포즈 판단 방법
JP6351243B2 (ja) 画像処理装置、画像処理方法
JP2012252447A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4795864B2 (ja) 特徴点検出装置および方法並びにプログラム
JPWO2012046426A1 (ja) 物体検出装置、物体検出方法および物体検出プログラム
JP2007025900A (ja) 画像処理装置、画像処理方法
JP2019096146A (ja) 画像識別装置、画像識別方法、コンピュータプログラム、及び記憶媒体
JP2012068948A (ja) 顔属性推定装置およびその方法
CN109074646B (zh) 图像识别装置以及图像识别程序
JP2006133941A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び携帯型端末
JP2005316743A (ja) 画像処理方法および画像処理装置
JP4789526B2 (ja) 画像処理装置、画像処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4479756

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees