JPWO2010044214A1 - 顔認識装置および顔認識方法 - Google Patents

顔認識装置および顔認識方法 Download PDF

Info

Publication number
JPWO2010044214A1
JPWO2010044214A1 JP2010533803A JP2010533803A JPWO2010044214A1 JP WO2010044214 A1 JPWO2010044214 A1 JP WO2010044214A1 JP 2010533803 A JP2010533803 A JP 2010533803A JP 2010533803 A JP2010533803 A JP 2010533803A JP WO2010044214 A1 JPWO2010044214 A1 JP WO2010044214A1
Authority
JP
Japan
Prior art keywords
face
normalization
unit
size
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010533803A
Other languages
English (en)
Inventor
冨田 裕人
裕人 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2010044214A1 publication Critical patent/JPWO2010044214A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

目位置検出処理と顔特徴抽出処理とで使用するデータ転送量を削減する顔認識装置を提供する。第1の正規化手段は、顔検出手段によって検出された顔を含む顔画像に対して、一定のサイズへの正規化処理を行う。部位検出手段は、正規化された顔画像を用いて顔の部位を検出する。第2の正規化手段は、顔検出手段によって検出された顔を含む顔画像に対して、一定のサイズへの正規化処理を行う。特徴量抽出手段は、正規化された顔画像を用いて顔の特徴量を抽出する。顔画像取得手段は、顔検出手段によって検出された顔の位置および大きさを用いて、正規化手段の処理対象となる顔画像を取得する。顔画像取得選択手段は、正規化手段で用いる顔画像を個別取得するか、共用するかを切り替える。

Description

本発明は、人の画像を用いて、その画像に撮像されている人を認識する装置や方法などに適用される技術に関するものである。
近年、人の画像を用いて認識処理を行う、いわゆる顔認識技術が注目されている。顔認識には、特定の個人の識別、性別の識別、表情の識別、および年齢の識別などがある。顔認識技術は、撮像した画像から人の顔を検出する顔検出処理と、検出された顔画像を元に顔を認識する顔認識で構成される。さらに、顔認識処理は、顔画像の目や口などの顔特徴点を検出する特徴点検出処理、顔の特徴量を抽出する特徴抽出処理、および特徴量を用いて認識対象か否かを判定する照合処理から構成される。
例えば、顔認識処理の一例として、特許文献1では、顔特徴点として両目位置、顔特徴量の抽出方法としてガボール・フィルタ(Gabor Filter)を用いる手法が提案されている。
図13は、特許文献1の顔認識システム70を示すものである。図13について説明する。撮像画像はSDRAM74に格納され、入力画像となる。顔検出部71は、SDRAM74から入力画像を取得し、入力画像全体を24×24画素単位で顔検出処理を行い、検出された顔の大きさと顔の位置を求める。顔検出処理方法としては、2点画素差分方式を用いている。両目位置検出部72は、顔検出部71で検出された顔位置の顔画像を取得し、24×24画素に正規化した後、顔検出部71と同じ2点画素差分方式で両目位置を検出する。検出された両目位置情報から、顔の大きさ、顔の位置、および顔の角度を求める。顔認識部73は、両目位置検出部72で特定された顔画像を再度取得し、60×66画素に正規化した後、顔特徴を抽出する。顔特徴の抽出には、ガボール・フィルタリング(Gabor Filtering)が適用され、その適用結果と以前に登録された画像にガボール・フィルタリングを適用して得られた結果との類似度を求める。その類似度より、登録画像と一致したか否かを識別する。
ここで、両目位置検出部72と顔認識部73で正規化後の顔画像の解像度が異なっており、顔認識部73の方が高解像度を必要としている。これは、顔認識処理が両目位置検出処理よりも精度を要求されるためである。そのため、両目位置検出部72と顔認識部73で個別に正規化画像を生成する必要があり、正規化に必要な顔画像データも個別に取得している。
特開2008−152530号公報
前記従来の構成では、両目位置検出部72と顔認識部73で処理対象の顔画像を異なる解像度で正規化するために、常に個別で顔画像データを取得していた。そのため、SDRAM74から取得するデータ量が多いという課題を有していた。
そこで、取得データ量を削減するために、正規化処理に必要なラインのみSDRAM74から取得し、正規化処理に不要なラインは間引くことが考えられる。2次元画像をラスター順でSDRAM74に格納した場合、一般的に水平方向の間引きは効果が小さいが、垂直方向の間引きは容易で効果が大きい。SDRAM74の1ワードには複数画素(例えば4画素)が格納されており、またバースト・アクセスで連続した複数ワードを同時に取得するため、水平方向を間引くには不要画素も多く取得してしまう。そのため、水平方向の間引きの効果は小さい。しかし、垂直方向は多くのワードを跨ぐ(例えば、640×480画素および4画素/ワードの場合、160ワード)ため、SDRAM74のアドレス制御のみで間引くことが可能であり、容易かつ効果が大きい。
ここで、取得すべき顔領域の大きさをS_FACE×S_FACEとし、両目位置検出部72での正規化後の大きさをNX_EYE(図13では24)、顔認識部73の正規化後の大きさをNX_EYE(図13では66)とする。この時、垂直方向のみ間引いて顔画像を取得すると、取得データ量は、両目位置検出部72がS_FACE×NX_EYE、顔認識部73がS_FACE×NX_EXTとなる。また、顔領域全体を取得する場合は、前述の通りS_FACE×S_FACEである。
両目位置検出部72と顔認識部73とで個別に画像を取得する場合と、顔領域全体を1回転送して、転送データを両目位置検出部72と顔認識部73とで共有する場合の1回の認識処理に必要な総データ転送量を図8に示す。横軸が取得する顔領域の大きさであり、縦軸が総データ転送量である。個別転送の場合を(A)に示しており、顔領域の大きさに比例した転送量となる。また、顔領域全体転送の場合を(B)に示しており、顔領域の大きさの二乗に比例した転送量となる。図8から分かるとおり、顔領域の大きさが両目位置検出部72と顔認識部73との正規化後の大きさの和よりも小さいときは、顔領域全体を転送した方が総データ転送量を小さく出来る。
しかしながら、前記従来の構成では、常に両目位置検出部72と顔認識部73とで個別に顔画像を取得していたため、顔領域の大きさに合わせて顔画像のデータの転送方法を制御することができないという課題を有していた。
本発明は、前記従来の課題を解決するもので、顔認識処理に必要な顔画像データの転送方法を顔の大きさに合わせて制御することで、転送量を削減することを目的とする。
前記従来の課題を解決するために、本発明の顔認識装置は、
顔が撮像された画像から、顔を検出する顔検出手段と、
前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化手段と、
前記第1の正規化手段により正規化された顔画像を用いて顔の部位を検出する部位検出手段と、
前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化手段と、
前記第2の正規化手段により正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出手段と、
前記第1および第2の正規化手段で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出手段によって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化手段の処理対象となる顔画像を取得する顔画像取得手段と、
前記顔検出手段で検出された顔の大きさ情報と、前記部位検出手段および前記特徴量抽出手段の正規化サイズに応じて、前記顔画像取得手段の前記取得モードを選択して切替える顔画像取得選択切替手段とを備え、
前記顔画像取得選択切替手段は、前記顔検出手段の顔の大きさが、前記第1の正規化手段の正規化サイズと前記第2の正規化手段の正規化サイズとの和よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共有取得モードとする。
本構成によって、顔の大きさに応じて顔画像データの取得方法を設定できるため、顔認識に必要なデータの転送量を抑えることができる。
本発明の顔認識装置によれば、顔領域の大きさに合わせて顔画像のデータの転送方法を制御することで、顔認識に必要なデータの転送量を抑えることができる。
図1は、本発明の実施の形態1に係る顔認識装置1の構成の一例を示すブロック図である。 図2は、顔認識装置1の処理フローを示す図である。 図3は、目位置検出処理および顔特徴抽出処理のフローを示す図である。 図4は、バイリニア補間の説明図である。 図5は、本発明の実施の形態1における、個別取得モード時の、SDRAMからの画像取得手順の説明図である。 図6は、本発明の実施の形態1における個別取得モードのデータ転送量を示す模式図である。 図7は、本発明の実施の形態1における顔領域全体取得モードのデータ転送量を示す模式図である。 図8は、個別取得モードと顔領域全体取得モードの総データ転送量の関係を示す図である。 図9は、顔画像取得部の転送モードの切り替えフローを示す図である。 図10は、本発明の実施の形態1に係る顔認識装置1の機能ブロックの一例を示す図である。 図11Aは、本発明の実施の形態2に係る半導体集積回路50のブロック図である。 図11Bは、本発明の実施の形態2に係る顔認識装置1aのブロック図である。 図12は、本発明の実施の形態2に係る撮像装置80のブロック図である。 図13は、従来技術の顔認識装置70のブロック図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
実施の形態1に関わる顔認識装置1は、入力された顔画像と登録された登録画像との間で抽出された特徴量同士を比較して類似度を算出し、その類似度の大小に基づいて顔の照合判定を行うものである。図1は、本発明の実施の形態1における顔認識装置1の構成の一例を示す図である。図2および図3は、顔認識装置1の処理フローを示す図である。
まずは、図2を用いて、顔認識装置1の大まかな処理フローについて説明する。図2を参照して、顔認識装置1は、入力画像に対して顔検出を行い、顔の位置および顔の大きさを得る(ステップS20)。次に、顔認識装置1は、その顔の位置および顔の大きさを基準として、顔画像を取得して両目の位置を検出し、その両目の位置情報から顔の位置、大きさ、および角度の情報を算出する(ステップS21)。次に、顔認識装置1は、両目の情報から顔画像を正規化し、顔特徴量を抽出する(ステップS22)。顔認識装置1は、抽出した特徴量を予め登録された特徴量と比較し、結果を認識結果として出力する(ステップS23)。
図3は、ステップS21およびステップS22の処理の具体例を示している。まずは、図3を参照して、ステップS21の目位置検出処理から説明する。ステップS21において、顔認識装置1は、顔画像を取得すると、取得した顔画像を所定の大きさ(この例では、24画素×24画素)に正規化する(ステップS24)。次に、顔認識装置1は、正規化した顔画像から両目の位置を検出し(ステップS25)、当該両目の位置に基づいて、顔の位置、大きさ、角度を正規化情報として算出する(ステップS26)。
次に、図3を参照して、ステップS22の顔特徴抽出処理を説明する。ステップS22において、顔認識装置1は、顔画像を取得すると、取得した顔画像を所定の大きさ(この例では、64画素×64画素)に正規化する(ステップS27)。次に、顔認識装置1は、顔画像を回転させて傾きを補正し(ステップS28)、カボールフィルタを用いて、顔特徴点に関する顔特徴量を算出する(ステップS29)。
次に、図1の構成について説明する。
図1において、顔認識装置1は、顔検出部2、顔認識部3、顔画像取得選択手段としての、転送モード設定部18および転送モード選択部19から構成される。顔認識部3は、部位検出手段としての目位置検出部4、特徴量抽出手段としての顔特徴抽出部5、顔照合部16、および顔画像取得部6から構成される。目位置検出部4は、正規化処理部7、正規化画像バッファ8、および目位置検出処理部9から構成される。顔特徴抽出部5は、正規化処理部10、正規化画像バッファ12、回転処理部11、およびガボールフィルタ処理部13から構成される。
顔検出部2は、SDRAM17に格納された撮像画像を取得し、顔検出処理を行う。顔検出処理では、検出した顔の位置情報および顔の大きさ情報が検出結果として出力され、顔認識部3に渡される。顔認識部3では、前記検出された顔の位置情報および顔の大きさ情報から、顔画像取得部6および顔特徴抽出部5に必要な顔画像領域の顔画像をそれぞれ取得し、それぞれの正規化処理部7,10に渡す。
目位置検出部4において、正規化処理部7では、前記顔検出部2で検出された顔の大きさを用いて目位置検出処理に必要なサイズに正規化処理行い、正規化画像バッファ8に正規化後の顔画像を格納する。目位置検出処理部9は、前記正規化画像バッファ8中の顔画像に対して目位置検出処理を行い、両目位置を検出するとともに、顔の位置、大きさ、および角度の情報を算出する。前記算出された顔の位置、大きさ、および角度の情報は、顔特徴抽出部5に渡される。
顔特徴抽出部5において、正規化処理部10では、前記目位置検出部4で検出された顔の大きさを用いて顔特徴抽出処理に必要なサイズに正規化処理行い、正規化画像バッファ12に正規化後の顔画像を格納する。回転処理部11では、前記目位置検出部4で検出された顔の角度を用いて回転処理を行い、正規化画像バッファ12に再度格納する。ガボールフィルタ処理部13は、前記正規化画像バッファ12中の顔画像に対してガボールフィルタ処理を行い、結果が特徴量として顔照合部16に出力される。顔照合部16では、予め登録された顔画像の特徴量をSDRAM17から取得し、顔特徴抽出部5から出力された特徴量と比較する。その比較結果が顔認識結果として出力される。
次に、各部の詳細について説明する。
顔検出部2は、SDRAM17に格納された撮像画像から人の顔を検出し、検出された顔の位置や大きさなどを検出結果として出力する。顔検出部2は、例えば、顔全体の輪郭に対応した基準テンプレートを用いたテンプレートマッチングによって顔を検出するように構成されても良い。また、顔検出部2は、顔の構成要素(目、鼻、耳など)に基づくテンプレートマッチングによって顔を検出するように構成されても良い。また、顔検出部2は、肌の色に近い領域を検出し、その領域を顔として検出するように構成されても良い。また、顔検出部2は、ニューラルネットワークを使って教師信号による学習を行い、顔らしい領域を顔として検出するように構成されても良い。また、顔検出部2による顔検出処理は、その他、既存のどのような技術が適用されることによって実現されても良い。
また、撮影画像から複数の人の顔が検出された場合、顔の位置、顔の大きさおよび顔の向きなどの、特定の基準に従って、顔認識部3の処理対象を決定しても良い。もちろん、検出された全ての顔について顔認識対象としても良い。その処理順序は前記特定の基準に従えばよい。なお、これらの顔検出結果の情報は、顔認識部3に渡される。
目位置検出部4の正規化処理部7は、SDRAM17に格納された撮影画像から、目位置検出処理に必要な正規化画像を生成する。具体的に説明する。まず、顔検出結果の位置や顔の大きさ情報を用いて、正規化処理時の縮小率、および検出された顔が含まれるように顔領域の位置および範囲を算出する。なお、正規化処理部7は、顔検出結果の顔の大きさよりも広いもしくは狭い範囲を算出しても良い。縮小率は数1で表される。
Figure 2010044214
算出された顔領域の位置および範囲の情報から、正規化処理に必要なライン情報および顔の大きさ(顔の幅)情報を算出し、顔画像取得部6から顔画像を取得する。ここで、正規化処理に必要なライン情報のみを取得しているのは、前述の通り顔画像データの転送量を削減するためである。取得した顔画像に対して、前記縮小率に応じたリサイズを行う正規化処理を行い、正規化画像バッファ8に顔画像を格納する。正規化処理方法としては、例えばバイリニア補間が用いられる。バイリニア補間は、図4および数2で示される。
Figure 2010044214
バイリニア補間では、リサイズ後の画素位置を縮小率より小数精度で算出し、その位置の周辺の整数4画素から線形補間により算出する。図4で示すように、リサイズ後の画素位置Xと、その周辺整数4画素C1,C2,C3、C4の2頂点で結ばれる矩形領域の面積がフィルタ係数となる。
正規化処理に必要なライン位置を示すライン情報は、縮小率と正規化処理方法により算出できる。正規化処理方法が前述の通りバイリニア補間であれば、正規化処理に必要なラインは、縮小率で決まるリサイズ後の画素位置の上下2ラインのみである。例えば、縮小率が1/4であれば、4nラインおよび4n+1ライン(n=0,1,2,…)となる。
顔画像取得部6は、2つの転送モード(取得モード)で動作可能であり、ラインバッファ14と、ラインバッファ15と、バッファ管理部とを備える。バッファ管理部は、ラインバッファ14、15の動作を管理すると共に、ラインバッファ14、15と、正規化処理部7、8との間のアクセスを制御する。顔画像取得部6は、転送モード設定部18で設定された転送モードに従って、目位置検出部4で用いる顔画像の取得および顔特徴抽出部5で用いる顔画像の取得方法を変更する。ここでは、2つの転送モードとして、個別転送モードと、顔領域全体転送モードとを用いる。
個別転送モードとは、目位置検出処理と顔特徴抽出処理とで顔画像を個別に取得するモードである。そのため、個別転送モードを、個別取得モードと呼んでもよい。個別転送モードでは、顔画像取得部6は、目位置検出部4と顔特徴抽出部5とから出力される顔画像中の必要ライン情報からSDRAM17上のアドレスを算出し、SDRAM17からライン単位でデータを取得する。取得手順を、図5を用いて説明する。顔検出部2の出力から算出される、SDRAM17上の顔の左上位置(FACE_POSITION)、顔領域の幅(S_FACE)、目位置検出部4もしくは顔特徴抽出部5から出力されるライン情報(図5中のnおよびn+1)、および入力画像の画像幅(WIDTH)が必要な情報である。
まず、顔画像取得部6は、必要なラインの先頭アドレスを算出すると、顔の左上位置(FACE_POSITION)、入力画像の画像幅(WIDTH)、およびライン情報(n)から算出され、FACEPOSITION+WIDTH×nとなる。ここから顔領域の幅(S_FACE)のデータを取得することで、1ライン目のデータは取得できる。続いて2ライン目のデータ取得は、同様にラインの先頭アドレスを算出すると、FACEPOSITION+WIDTH×(n+1)となる。ここから、同様に顔領域の幅(S_FACE)のデータを取得することで、2ライン目のデータは取得できる。以上の手順を繰り返すことで、SDRAM17から必要なラインのデータのみを取得する。SDRAM17から取得したラインデータは、目位置検出処理と顔特徴抽出処理用に個別のラインバッファに格納され、それぞれ目位置検出部4と顔特徴抽出部5とに出力される。
顔領域全体転送モードとは、顔領域の画像全体を取得し、目位置検出処理と顔特徴抽出処理とで取得データを共有するモードである。そのため、顔領域全体転送モードを、共有取得モードと呼んでもよい。顔領域全体転送モードでは、顔画像取得部6は、SDRAM17上から顔領域全体を取得し、一旦顔領域全体のデータをラインバッファに保持する。SDRAM17からの転送手順は、個別転送モードを参考にすれば良い。顔画像取得部6は、ラインバッファに保持した顔領域全体のデータより、目位置検出部4と顔特徴抽出部5とから出力される顔画像中の必要なライン情報に応じて、必要なラインデータを目位置検出部4と顔特徴抽出部5とに出力する。
なお、複数人の顔の顔認識を行うときには、目位置検出部4と顔特徴抽出部5とをパイプライン動作で異なる人の顔処理を並列処理させても構わない。その際、顔画像取得部6のラインバッファは、2つの領域に分けられ、個別転送モードでは、目位置検出部4と顔特徴抽出部5のそれぞれのラインデータが格納される。顔領域全体転送モードでは、パイプラインバッファとして一方に目位置検出部4が処理している顔の顔領域全体のデータが、もう一方に顔特徴抽出部5が処理している顔の顔領域全体のデータが格納される。
2つの転送モードで転送されるデータの違いを示す模式図を、図6および図7に示す。ここで、S_FACEは顔検出結果の顔の大きさ、NS_EYEは目位置検出の正規化後の大きさ、NS_EXTは顔特徴抽出の正規化後の大きさを示す。L_EYEは目位置検出処理での正規化処理に必要なライン数(バイリニア補間の場合は、L_EYE=NX_EYE×2)、およびL_EXTは特徴抽出処理での正規化処理に必要なライン数を示す。個別転送モードで転送されるデータの流れは図6で示される。このとき、SDRAM17からのデータ転送量は、目位置検出処理に必要なデータ転送量が数3で表され、顔特徴抽出処理に必要なデータ転送量が数4で表される。よって、総データ転送量は数5で表される。顔領域全体転送モードで転送されるデータの流れは図7で示される。SDRAM17からのデータ転送量は、顔領域全体のデータ量に等しく、数6で示される。
Figure 2010044214
Figure 2010044214
Figure 2010044214
Figure 2010044214
目位置検出部4の目位置検出処理部9は、正規化画像バッファ8中の正規化画像から顔の目の位置を検出し、検出された目の位置情報から、顔の大きさ、顔の位置、および顔の角度などの情報を算出する。顔の目の位置検出は、パターンマッチングやニューラルネットワークを用いることにより実現する。また、目位置検出処理部9による目位置検出処理は、その他、既存のどのような技術が適用されることによって実現されても良い。
顔の目の位置情報からの各種情報の算出は、例えば次のように算出すれば良い。顔の位置は、両目の位置から算出可能であり、顔の大きさも、両目の位置情報から両目間の距離を算出することで得ることが可能である。顔の角度は、両目の位置情報から水平位置からの角度を算出し、得ることが可能である。もちろん、これらの方法は一例であり、その他の方法で算出しても良い。
顔特徴抽出部5の正規化処理部10は、目位置検出処理の正規化と同様の処理を行う。ただし、縮小率は異なる。顔の大きさ情報は、目位置検出部4で算出された情報を用い、正規化後のサイズは顔特徴抽出処理に必要なサイズとなる。それらの情報から、縮小率を算出する必要がある。
顔特徴抽出部5の回転処理部11は、アフィン変換により、顔画像を目の位置が同一水平線上に並んだ(すなわち、顔の傾きが垂直線に対して角度=0°の)正面画像にする。正規化画像バッファ12内の顔画像に対して、目位置検出部4で算出された顔の角度情報を用いて、アフィン変換を行い、正規化画像バッファ12に書き戻すことで実現される。なお、顔の向きもアフィン変換により回転させても良い。また、顔画像の回転処理は、アフィン変換以外の方法で実現されてもよい。
顔特徴抽出部5のガボールフィルタ処理部13は、正規化顔画像内の一つ以上の特徴点についてガボール・ウェーブレット変換を実施する。ガボールフィルタを表わす式を数7に示す。
Figure 2010044214
ガボールフィルタにより、特徴点周辺における濃淡特徴の周期性と方向性とを特徴量として取得する。特徴点の位置は、顔の部位(目、鼻、口など)周辺が考えられるが、その位置は照合を行う登録画像の特徴量と位置が一致していれば、どこでも構わない。その特徴点の数も同様である。
顔照合部16は、顔特徴抽出部5で抽出された特徴量と予め登録された特徴量とを比較することにより、その類似度を算出する。算出された類似度が最も高く、かつこの類似度が閾値を超えている場合、その登録された人物と認識し、その認識結果を出力する。また、顔照合部16による顔照合処理は、その他、既存のどのような技術が適用されることによって実現されても良い。例えば、特徴量を直接比較するのではなく、特定の変換後に比較しても良い。
図8に、目位置検出部4および顔特徴抽出部5の処理に必要な総データ転送量の関係を示す。前述したように、データ転送量は、数2、数3、数4、および数5で算出される。この中で変数となるのは入力画像中の顔領域の大きさ(S_FACE)である。よって、データ転送量を顔領域の大きさの関数としてみると、個別転送モードでの総データ転送量は顔領域の大きさに比例する一次関数であり、顔領域全体転送モードでのデータ転送量は顔領域の大きさの二乗に比例する二次関数で示される。よって、顔領域の大きさに応じて2つの転送モードを選択することで、顔認識に必要なデータ転送量を抑えることが可能である。
図9に、2つの転送モードの選択方法の一例を示す。図9を参照して、転送モード選択部19は、顔検出部2によって検出された顔領域(S_FACE)の大きさを取得する(ステップS30)。次に、転送モード選択部19は、顔領域の大きさ(S_FACE)と、目位置検出部4および顔特徴抽出部5での正規化後の大きさの和(L_EYE+L_EXT)とを比較する(ステップS31)。転送モード選択部19は、顔領域の大きさ(S_FACE)が小さい場合は顔領域全体転送モードを選択し(ステップS32)、顔領域の大きさ(S_FACE)が大きい場合は個別転送モードを選択する(ステップS33)。
図10は、上述した顔認識装置1を機能ブロックで表した図である。図10において、顔認識装置1は、顔検出手段101と、第1の正規化手段102と、部位検出手段103と、第2の正規化手段104と、特徴量抽出手段105と、顔画像取得手段106と、顔画像取得選択手段107とを備える。各機能ブロックの動作について以下に説明する。
顔検出手段101は、顔が撮影された画像から、顔を検出する。第1の正規化手段102は、顔検出手段101によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う。部位検出手段103は、第1の正規化手段102により正規化された顔画像を用いて顔の部位を検出する。第2の正規化手段104は、顔検出手段101によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う。特徴量抽出手段105は、第2の正規化手段104により正規化された顔画像を用いて顔の特徴量を抽出する。
顔画像取得手段106は、第1および第2の正規化手段102,104で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、顔検出手段101によって検出された顔の位置情報および大きさ情報を用いて、第1および第2の正規化手段102,104の処理対象となる顔画像の画像データを取得する。顔画像取得選択手段107は、顔検出手段101で検出された顔の大きさ情報と、部位検出手段103および特徴量抽出手段105の正規化手段の正規化サイズに応じて、顔画像取得手段106の取得モードを選択して切替える。
(実施の形態2)
上述した顔認識装置1に含まれる各構成は、それぞれ集積回路であるLSIとして実現することができる。これらは、個別に1チップ化されてもよいし、それぞれにおいて全てまたは一部を含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応例が可能性としてありえる。
図11Aは、本発明の実施の形態2における半導体集積回路の一例を示すブロック図である。図11Aにおいて、半導体集積回路50は、一般的にはCMOSなどのMOSトランジスタで構成され、MOSトランジスタの接続構成により、特定の論理回路を実現する。近年、半導体集積回路の集積度が進み、非常に複雑な論理回路(例えば、本発明における顔認識装置1)を、一つないしは数個の半導体集積回路で実現できる。
半導体集積回路50は、実施の形態1で説明した顔認識装置1およびプロセッサ52を備える。また、半導体集積回路50が備える顔認識装置1は、入力画像を、内部バス69を介して、画像メモリ51より取得する。
半導体集積回路50は、顔認識装置1およびプロセッサ52以外にも必要に応じて、画像符号化/復号化回路56、音声処理部55、ROM54、カメラ入力回路58、LCD出力回路57を備えていても良い。
半導体集積回路50が備える顔認識装置1は、実施の形態1で説明したとおり、顔領域の大きさに応じてデータ転送量を削減した顔認識処理を実現している。
なお、半導体集積回路50は、顔認識装置1の一部の機能をプロセッサ52で実現してもよい。例えば、半導体集積回路50は、図11Bに示すような顔認識装置1aを備えるものであってもよい。図11Bにおいて、顔認識装置1aは、転送モード設定部18および転送モード選択部19を備えずに、これらの機能をプロセッサ52で実現する。
また、顔認識装置1が半導体集積回路50で実現されることで、小型化、低消費電力化などが実現される。
(実施の形態3)
図12を用いて、実施の形態3について説明する。図12は、本発明の実施の形態3における撮影装置のブロック図である。図12において、撮像装置80は、実施の形態2に記載の半導体集積回路50と、レンズ65と、絞り64と、CCDなどのセンサ63と、A/D変換回路62と、角度センサ68と、フラッシュメモリ61となどから構成される。A/D変換回路62は、センサ63のアナログ出力をデジタル信号に変換する。角度センサ68は、撮像装置80の撮影角度を検出する。フラッシュメモリ61は、認識させる顔の特徴量(登録特徴量)を記憶している。
半導体集積回路50には、実施の形態2記載のブロックに加え、レンズ65を制御するズーム制御部67、及び絞り64を制御する露出制御部66などが備わる。
半導体集積回路50の顔認識装置1で認識したフラッシュメモリ80に登録済みの顔の位置情報を用いることで、例えば家族などある特定の顔の位置に合わせたズーム制御部67によるフォーカス制御、露出制御部66による露出制御が可能となる。特に家族の顔をきれいに撮影可能な撮像装置80が実現される。
また、上述した顔認識装置1が行うそれぞれの処理手順は、記憶装置(ROM、RAM、ハードディスク等)に格納された上述した処理手順を実行可能な所定のプログラムデータが、CPUによって解釈実行されることで実現されてもよい。この場合、プログラムデータは、記憶媒体を介して記憶装置内に導入されてもよいし、記憶媒体上から直接実行されてもよい。なお、記憶媒体は、ROMやRAMやフラッシュメモリ等の半導体メモリ、フレキシブルディスクやハードディスク等の磁気ディスクメモリ、CD−ROMやDVDやBD等の光ディスクメモリ、及びメモリカード等をいう。また、記憶媒体は、電話回線や搬送路等の通信媒体を含む概念である。
本発明にかかる顔認識装置は、顔認識処理のデータ転送量を削減すること等が可能であり、デジタルカメラにおける顔認識装置等として有用である。また、デジタルムービー、および監視カメラ等の用途にも応用できる。
1 顔認識装置
2 顔検出部
3 顔認識部
4 目位置検出部
5 顔特徴抽出部
6 顔画像取得部
7 目位置検出部の正規化処理部
8 目位置検出部の正規化画像バッファ
9 目位置検出部の目位置検出処理部
10 顔特徴抽出部の正規化処理部
11 顔特徴抽出部の回転処理部
12 顔特徴抽出部の正規化画像バッファ
13 顔特徴抽出部のガボールフィルタ処理部
16 顔照合部
50 半導体集積回路
51 画像メモリ
52 プロセッサ
53 動き検出回路
54 ROM
55 音声処理部
56 画像符号化回路
57 LCD出力回路
58 カメラ入力回路
59 LCD
60 カメラ
61 フラッシュメモリ
62 A/D変換回路
63 センサ
64 絞り
65 レンズ
66 露出制御部
67 ズーム制御部
68 角度センサ
69 内部バス
101 顔検出手段
102 第1の正規化手段
103 部位検出手段
104 第2の正規化手段
105 特徴量抽出手段
106 顔画像取得手段
107 顔画像取得選択手段
80 撮像装置
本発明は、人の画像を用いて、その画像に撮像されている人を認識する装置や方法などに適用される技術に関するものである。
近年、人の画像を用いて認識処理を行う、いわゆる顔認識技術が注目されている。顔認識には、特定の個人の識別、性別の識別、表情の識別、および年齢の識別などがある。顔認識技術は、撮像した画像から人の顔を検出する顔検出処理と、検出された顔画像を元に顔を認識する顔認識で構成される。さらに、顔認識処理は、顔画像の目や口などの顔特徴点を検出する特徴点検出処理、顔の特徴量を抽出する特徴抽出処理、および特徴量を用いて認識対象か否かを判定する照合処理から構成される。
例えば、顔認識処理の一例として、特許文献1では、顔特徴点として両目位置、顔特徴量の抽出方法としてガボール・フィルタ(Gabor Filter)を用いる手法が提案されている。
図13は、特許文献1の顔認識システム70を示すものである。図13について説明する。撮像画像はSDRAM74に格納され、入力画像となる。顔検出部71は、SDRAM74から入力画像を取得し、入力画像全体を24×24画素単位で顔検出処理を行い、検出された顔の大きさと顔の位置を求める。顔検出処理方法としては、2点画素差分方式を用いている。両目位置検出部72は、顔検出部71で検出された顔位置の顔画像を取得し、24×24画素に正規化した後、顔検出部71と同じ2点画素差分方式で両目位置を検出する。検出された両目位置情報から、顔の大きさ、顔の位置、および顔の角度を求める。顔認識部73は、両目位置検出部72で特定された顔画像を再度取得し、60×66画素に正規化した後、顔特徴を抽出する。顔特徴の抽出には、ガボール・フィルタリング(Gabor Filtering)が適用され、その適用結果と以前に登録された画像にガボール・フィルタリングを適用して得られた結果との類似度を求める。その類似度より、登録画像と一致したか否かを識別する。
ここで、両目位置検出部72と顔認識部73で正規化後の顔画像の解像度が異なっており、顔認識部73の方が高解像度を必要としている。これは、顔認識処理が両目位置検出処理よりも精度を要求されるためである。そのため、両目位置検出部72と顔認識部73で個別に正規化画像を生成する必要があり、正規化に必要な顔画像データも個別に取得している。
特開2008−152530号公報
前記従来の構成では、両目位置検出部72と顔認識部73で処理対象の顔画像を異なる解像度で正規化するために、常に個別で顔画像データを取得していた。そのため、SDRAM74から取得するデータ量が多いという課題を有していた。
そこで、取得データ量を削減するために、正規化処理に必要なラインのみSDRAM74から取得し、正規化処理に不要なラインは間引くことが考えられる。2次元画像をラスター順でSDRAM74に格納した場合、一般的に水平方向の間引きは効果が小さいが、垂直方向の間引きは容易で効果が大きい。SDRAM74の1ワードには複数画素(例えば4画素)が格納されており、またバースト・アクセスで連続した複数ワードを同時に取得するため、水平方向を間引くには不要画素も多く取得してしまう。そのため、水平方向の間引きの効果は小さい。しかし、垂直方向は多くのワードを跨ぐ(例えば、640×480画素および4画素/ワードの場合、160ワード)ため、SDRAM74のアドレス制御のみで間引くことが可能であり、容易かつ効果が大きい。
ここで、取得すべき顔領域の大きさをS_FACE×S_FACEとし、両目位置検出部72での正規化後の大きさをNX_EYE(図13では24)、顔認識部73の正規化後の大きさをNX_EXT(図13では66)とする。この時、垂直方向のみ間引いて顔画像を取得すると、取得データ量は、両目位置検出部72がS_FACE×NX_EYE、顔認識部73がS_FACE×NX_EXTとなる。また、顔領域全体を取得する場合は、前述の通りS_FACE×S_FACEである。
両目位置検出部72と顔認識部73とで個別に画像を取得する場合と、顔領域全体を1回転送して、転送データを両目位置検出部72と顔認識部73とで共有する場合の1回の認識処理に必要な総データ転送量を図8に示す。横軸が取得する顔領域の大きさであり、縦軸が総データ転送量である。個別転送の場合を(A)に示しており、顔領域の大きさに比例した転送量となる。また、顔領域全体転送の場合を(B)に示しており、顔領域の大きさの二乗に比例した転送量となる。図8から分かるとおり、顔領域の大きさが両目位置検出部72と顔認識部73との正規化後の大きさの和よりも小さいときは、顔領域全体を転送した方が総データ転送量を小さく出来る。
しかしながら、前記従来の構成では、常に両目位置検出部72と顔認識部73とで個別に顔画像を取得していたため、顔領域の大きさに合わせて顔画像のデータの転送方法を制御することができないという課題を有していた。
本発明は、前記従来の課題を解決するもので、顔認識処理に必要な顔画像データの転送方法を顔の大きさに合わせて制御することで、転送量を削減することを目的とする。
前記従来の課題を解決するために、本発明の顔認識装置は、
顔が撮像された画像から、顔を検出する顔検出手段と、
前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化手段と、
前記第1の正規化手段により正規化された顔画像を用いて顔の部位を検出する部位検出手段と、
前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化手段と、
前記第2の正規化手段により正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出手段と、
前記第1および第2の正規化手段で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出手段によって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化手段の処理対象となる顔画像を取得する顔画像取得手段と、
前記顔検出手段で検出された顔の大きさ情報と、前記部位検出手段および前記特徴量抽出手段の正規化サイズに応じて、前記顔画像取得手段の前記取得モードを選択して切替える顔画像取得選択切替手段とを備え、
前記顔画像取得選択切替手段は、前記顔検出手段の顔の大きさが、前記第1の正規化手段の正規化サイズと前記第2の正規化手段の正規化サイズとの和よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共有取得モードとする。
本構成によって、顔の大きさに応じて顔画像データの取得方法を設定できるため、顔認識に必要なデータの転送量を抑えることができる。
本発明の顔認識装置によれば、顔領域の大きさに合わせて顔画像のデータの転送方法を制御することで、顔認識に必要なデータの転送量を抑えることができる。
本発明の実施の形態1に係る顔認識装置1の構成の一例を示すブロック図 顔認識装置1の処理フローを示す図 目位置検出処理および顔特徴抽出処理のフローを示す図 バイリニア補間の説明図 本発明の実施の形態1における、個別取得モード時の、SDRAMからの画像取得手順の説明図 本発明の実施の形態1における個別取得モードのデータ転送量を示す模式図 本発明の実施の形態1における顔領域全体取得モードのデータ転送量を示す模式図 個別取得モードと顔領域全体取得モードの総データ転送量の関係を示す図 顔画像取得部の転送モードの切り替えフローを示す図 本発明の実施の形態1に係る顔認識装置1の機能ブロックの一例を示す図 本発明の実施の形態2に係る半導体集積回路50のブロック図 本発明の実施の形態2に係る顔認識装置1aのブロック図 本発明の実施の形態2に係る撮像装置80のブロック図 従来技術の顔認識装置70のブロック図
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
実施の形態1に関わる顔認識装置1は、入力された顔画像と登録された登録画像との間で抽出された特徴量同士を比較して類似度を算出し、その類似度の大小に基づいて顔の照合判定を行うものである。図1は、本発明の実施の形態1における顔認識装置1の構成の一例を示す図である。図2および図3は、顔認識装置1の処理フローを示す図である。
まずは、図2を用いて、顔認識装置1の大まかな処理フローについて説明する。図2を参照して、顔認識装置1は、入力画像に対して顔検出を行い、顔の位置および顔の大きさを得る(ステップS20)。次に、顔認識装置1は、その顔の位置および顔の大きさを基準として、顔画像を取得して両目の位置を検出し、その両目の位置情報から顔の位置、大きさ、および角度の情報を算出する(ステップS21)。次に、顔認識装置1は、両目の情報から顔画像を正規化し、顔特徴量を抽出する(ステップS22)。顔認識装置1は、抽出した特徴量を予め登録された特徴量と比較し、結果を認識結果として出力する(ステップS23)。
図3は、ステップS21およびステップS22の処理の具体例を示している。まずは、図3を参照して、ステップS21の目位置検出処理から説明する。ステップS21において、顔認識装置1は、顔画像を取得すると、取得した顔画像を所定の大きさ(この例では、24画素×24画素)に正規化する(ステップS24)。次に、顔認識装置1は、正規化した顔画像から両目の位置を検出し(ステップS25)、当該両目の位置に基づいて、顔の位置、大きさ、角度を正規化情報として算出する(ステップS26)。
次に、図3を参照して、ステップS22の顔特徴抽出処理を説明する。ステップS22において、顔認識装置1は、顔画像を取得すると、取得した顔画像を所定の大きさ(この例では、64画素×64画素)に正規化する(ステップS27)。次に、顔認識装置1は、顔画像を回転させて傾きを補正し(ステップS28)、カボールフィルタを用いて、顔特徴点に関する顔特徴量を算出する(ステップS29)。
次に、図1の構成について説明する。
図1において、顔認識装置1は、顔検出部2、顔認識部3、顔画像取得選択手段としての、転送モード設定部18および転送モード選択部19から構成される。顔認識部3は、部位検出手段としての目位置検出部4、特徴量抽出手段としての顔特徴抽出部5、顔照合部16、および顔画像取得部6から構成される。目位置検出部4は、正規化処理部7、正規化画像バッファ8、および目位置検出処理部9から構成される。顔特徴抽出部5は、正規化処理部10、正規化画像バッファ12、回転処理部11、およびガボールフィルタ処理部13から構成される。
顔検出部2は、SDRAM17に格納された撮像画像を取得し、顔検出処理を行う。顔検出処理では、検出した顔の位置情報および顔の大きさ情報が検出結果として出力され、顔認識部3に渡される。顔認識部3では、前記検出された顔の位置情報および顔の大きさ情報から、目位置検出部4および顔特徴抽出部5に必要な顔画像領域の顔画像をそれぞれ取得し、それぞれの正規化処理部7,10に渡す。
目位置検出部4において、正規化処理部7では、前記顔検出部2で検出された顔の大きさを用いて目位置検出処理に必要なサイズに正規化処理行い、正規化画像バッファ8に正規化後の顔画像を格納する。目位置検出処理部9は、前記正規化画像バッファ8中の顔画像に対して目位置検出処理を行い、両目位置を検出するとともに、顔の位置、大きさ、および角度の情報を算出する。前記算出された顔の位置、大きさ、および角度の情報は、顔特徴抽出部5に渡される。
顔特徴抽出部5において、正規化処理部10では、前記目位置検出部4で検出された顔の大きさを用いて顔特徴抽出処理に必要なサイズに正規化処理行い、正規化画像バッファ12に正規化後の顔画像を格納する。回転処理部11では、前記目位置検出部4で検出された顔の角度を用いて回転処理を行い、正規化画像バッファ12に再度格納する。ガボールフィルタ処理部13は、前記正規化画像バッファ12中の顔画像に対してガボールフィルタ処理を行い、結果が特徴量として顔照合部16に出力される。顔照合部16では、予め登録された顔画像の特徴量をSDRAM17から取得し、顔特徴抽出部5から出力された特徴量と比較する。その比較結果が顔認識結果として出力される。
次に、各部の詳細について説明する。
顔検出部2は、SDRAM17に格納された撮像画像から人の顔を検出し、検出された顔の位置や大きさなどを検出結果として出力する。顔検出部2は、例えば、顔全体の輪郭に対応した基準テンプレートを用いたテンプレートマッチングによって顔を検出するように構成されても良い。また、顔検出部2は、顔の構成要素(目、鼻、耳など)に基づくテンプレートマッチングによって顔を検出するように構成されても良い。また、顔検出部2は、肌の色に近い領域を検出し、その領域を顔として検出するように構成されても良い。また、顔検出部2は、ニューラルネットワークを使って教師信号による学習を行い、顔らしい領域を顔として検出するように構成されても良い。また、顔検出部2による顔検出処理は、その他、既存のどのような技術が適用されることによって実現されても良い。
また、撮影画像から複数の人の顔が検出された場合、顔の位置、顔の大きさおよび顔の向きなどの、特定の基準に従って、顔認識部3の処理対象を決定しても良い。もちろん、検出された全ての顔について顔認識対象としても良い。その処理順序は前記特定の基準に従えばよい。なお、これらの顔検出結果の情報は、顔認識部3に渡される。
目位置検出部4の正規化処理部7は、SDRAM17に格納された撮影画像から、目位置検出処理に必要な正規化画像を生成する。具体的に説明する。まず、顔検出結果の位置や顔の大きさ情報を用いて、正規化処理時の縮小率、および検出された顔が含まれるように顔領域の位置および範囲を算出する。なお、正規化処理部7は、顔検出結果の顔の大きさよりも広いもしくは狭い範囲を算出しても良い。縮小率は数1で表される。
Figure 2010044214
算出された顔領域の位置および範囲の情報から、正規化処理に必要なライン情報および顔の大きさ(顔の幅)情報を算出し、顔画像取得部6から顔画像を取得する。ここで、正規化処理に必要なライン情報のみを取得しているのは、前述の通り顔画像データの転送量を削減するためである。取得した顔画像に対して、前記縮小率に応じたリサイズを行う正規化処理を行い、正規化画像バッファ8に顔画像を格納する。正規化処理方法としては、例えばバイリニア補間が用いられる。バイリニア補間は、図4および数2で示される。
Figure 2010044214
バイリニア補間では、リサイズ後の画素位置を縮小率より小数精度で算出し、その位置の周辺の整数4画素から線形補間により算出する。図4で示すように、リサイズ後の画素位置Xと、その周辺整数4画素C1,C2,C3、C4の2頂点で結ばれる矩形領域の面積がフィルタ係数となる。
正規化処理に必要なライン位置を示すライン情報は、縮小率と正規化処理方法により算出できる。正規化処理方法が前述の通りバイリニア補間であれば、正規化処理に必要なラインは、縮小率で決まるリサイズ後の画素位置の上下2ラインのみである。例えば、縮小率が1/4であれば、4nラインおよび4n+1ライン(n=0,1,2,…)となる。
顔画像取得部6は、2つの転送モード(取得モード)で動作可能であり、ラインバッファ14と、ラインバッファ15と、バッファ管理部とを備える。バッファ管理部は、ラインバッファ14、15の動作を管理すると共に、ラインバッファ14、15と、正規化処理部7、10との間のアクセスを制御する。顔画像取得部6は、転送モード設定部18で設定された転送モードに従って、目位置検出部4で用いる顔画像の取得および顔特徴抽出部5で用いる顔画像の取得方法を変更する。ここでは、2つの転送モードとして、個別転送モードと、顔領域全体転送モードとを用いる。
個別転送モードとは、目位置検出処理と顔特徴抽出処理とで顔画像を個別に取得するモードである。そのため、個別転送モードを、個別取得モードと呼んでもよい。個別転送モードでは、顔画像取得部6は、目位置検出部4と顔特徴抽出部5とから出力される顔画像中の必要ライン情報からSDRAM17上のアドレスを算出し、SDRAM17からライン単位でデータを取得する。取得手順を、図5を用いて説明する。顔検出部2の出力から算出される、SDRAM17上の顔の左上位置(FACE_POSITION)、顔領域の幅(S_FACE)、目位置検出部4もしくは顔特徴抽出部5から出力されるライン情報(図5中のnおよびn+1)、および入力画像の画像幅(WIDTH)が必要な情報である。
まず、顔画像取得部6は、必要なラインの先頭アドレスを算出すると、顔の左上位置(FACE_POSITION)、入力画像の画像幅(WIDTH)、およびライン情報(n)から算出され、FACE_POSITION+WIDTH×nとなる。ここから顔領域の幅(S_FACE)のデータを取得することで、1ライン目のデータは取得できる。続いて2ライン目のデータ取得は、同様にラインの先頭アドレスを算出すると、FACE_POSITION+WIDTH×(n+1)となる。ここから、同様に顔領域の幅(S_FACE)のデータを取得することで、2ライン目のデータは取得できる。以上の手順を繰り返すことで、SDRAM17から必要なラインのデータのみを取得する。SDRAM17から取得したラインデータは、目位置検出処理と顔特徴抽出処理用に個別のラインバッファに格納され、それぞれ目位置検出部4と顔特徴抽出部5とに出力される。
顔領域全体転送モードとは、顔領域の画像全体を取得し、目位置検出処理と顔特徴抽出処理とで取得データを共有するモードである。そのため、顔領域全体転送モードを、共有取得モードと呼んでもよい。顔領域全体転送モードでは、顔画像取得部6は、SDRAM17上から顔領域全体を取得し、一旦顔領域全体のデータをラインバッファに保持する。SDRAM17からの転送手順は、個別転送モードを参考にすれば良い。顔画像取得部6は、ラインバッファに保持した顔領域全体のデータより、目位置検出部4と顔特徴抽出部5とから出力される顔画像中の必要なライン情報に応じて、必要なラインデータを目位置検出部4と顔特徴抽出部5とに出力する。
なお、複数人の顔の顔認識を行うときには、目位置検出部4と顔特徴抽出部5とをパイプライン動作で異なる人の顔処理を並列処理させても構わない。その際、顔画像取得部6のラインバッファは、2つの領域に分けられ、個別転送モードでは、目位置検出部4と顔特徴抽出部5のそれぞれのラインデータが格納される。顔領域全体転送モードでは、パイプラインバッファとして一方に目位置検出部4が処理している顔の顔領域全体のデータが、もう一方に顔特徴抽出部5が処理している顔の顔領域全体のデータが格納される。
2つの転送モードで転送されるデータの違いを示す模式図を、図6および図7に示す。ここで、S_FACEは顔検出結果の顔の大きさ、NS_EYEは目位置検出の正規化後の大きさ、NS_EXTは顔特徴抽出の正規化後の大きさを示す。L_EYEは目位置検出処理での正規化処理に必要なライン数(バイリニア補間の場合は、L_EYE=NS_EYE×2)、およびL_EXTは特徴抽出処理での正規化処理に必要なライン数を示す。個別転送モードで転送されるデータの流れは図6で示される。このとき、SDRAM17からのデータ転送量は、目位置検出処理に必要なデータ転送量が数3で表され、顔特徴抽出処理に必要なデータ転送量が数4で表される。よって、総データ転送量は数5で表される。顔領域全体転送モードで転送されるデータの流れは図7で示される。SDRAM17からのデータ転送量は、顔領域全体のデータ量に等しく、数6で示される。
Figure 2010044214
Figure 2010044214
Figure 2010044214
Figure 2010044214
目位置検出部4の目位置検出処理部9は、正規化画像バッファ8中の正規化画像から顔の目の位置を検出し、検出された目の位置情報から、顔の大きさ、顔の位置、および顔の角度などの情報を算出する。顔の目の位置検出は、パターンマッチングやニューラルネットワークを用いることにより実現する。また、目位置検出処理部9による目位置検出処理は、その他、既存のどのような技術が適用されることによって実現されても良い。
顔の目の位置情報からの各種情報の算出は、例えば次のように算出すれば良い。顔の位置は、両目の位置から算出可能であり、顔の大きさも、両目の位置情報から両目間の距離を算出することで得ることが可能である。顔の角度は、両目の位置情報から水平位置からの角度を算出し、得ることが可能である。もちろん、これらの方法は一例であり、その他の方法で算出しても良い。
顔特徴抽出部5の正規化処理部10は、目位置検出処理の正規化と同様の処理を行う。ただし、縮小率は異なる。顔の大きさ情報は、目位置検出部4で算出された情報を用い、正規化後のサイズは顔特徴抽出処理に必要なサイズとなる。それらの情報から、縮小率を算出する必要がある。
顔特徴抽出部5の回転処理部11は、アフィン変換により、顔画像を目の位置が同一水平線上に並んだ(すなわち、顔の傾きが垂直線に対して角度=0°の)正面画像にする。正規化画像バッファ12内の顔画像に対して、目位置検出部4で算出された顔の角度情報を用いて、アフィン変換を行い、正規化画像バッファ12に書き戻すことで実現される。なお、顔の向きもアフィン変換により回転させても良い。また、顔画像の回転処理は、アフィン変換以外の方法で実現されてもよい。
顔特徴抽出部5のガボールフィルタ処理部13は、正規化顔画像内の一つ以上の特徴点についてガボール・ウェーブレット変換を実施する。ガボールフィルタを表わす式を数7に示す。
Figure 2010044214
ガボールフィルタにより、特徴点周辺における濃淡特徴の周期性と方向性とを特徴量として取得する。特徴点の位置は、顔の部位(目、鼻、口など)周辺が考えられるが、その位置は照合を行う登録画像の特徴量と位置が一致していれば、どこでも構わない。その特徴点の数も同様である。
顔照合部16は、顔特徴抽出部5で抽出された特徴量と予め登録された特徴量とを比較することにより、その類似度を算出する。算出された類似度が最も高く、かつこの類似度が閾値を超えている場合、その登録された人物と認識し、その認識結果を出力する。また、顔照合部16による顔照合処理は、その他、既存のどのような技術が適用されることによって実現されても良い。例えば、特徴量を直接比較するのではなく、特定の変換後に比較しても良い。
図8に、目位置検出部4および顔特徴抽出部5の処理に必要な総データ転送量の関係を示す。前述したように、データ転送量は、数2、数3、数4、および数5で算出される。この中で変数となるのは入力画像中の顔領域の大きさ(S_FACE)である。よって、データ転送量を顔領域の大きさの関数としてみると、個別転送モードでの総データ転送量は顔領域の大きさに比例する一次関数であり、顔領域全体転送モードでのデータ転送量は顔領域の大きさの二乗に比例する二次関数で示される。よって、顔領域の大きさに応じて2つの転送モードを選択することで、顔認識に必要なデータ転送量を抑えることが可能である。
図9に、2つの転送モードの選択方法の一例を示す。図9を参照して、転送モード選択部19は、顔検出部2によって検出された顔領域(S_FACE)の大きさを取得する(ステップS30)。次に、転送モード選択部19は、顔領域の大きさ(S_FACE)と、目位置検出部4および顔特徴抽出部5での正規化後の大きさの和(L_EYE+L_EXT)とを比較する(ステップS31)。転送モード選択部19は、顔領域の大きさ(S_FACE)が小さい場合は顔領域全体転送モードを選択し(ステップS32)、顔領域の大きさ(S_FACE)が大きい場合は個別転送モードを選択する(ステップS33)。
図10は、上述した顔認識装置1を機能ブロックで表した図である。図10において、顔認識装置1は、顔検出手段101と、第1の正規化手段102と、部位検出手段103と、第2の正規化手段104と、特徴量抽出手段105と、顔画像取得手段106と、顔画像取得選択手段107とを備える。各機能ブロックの動作について以下に説明する。
顔検出手段101は、顔が撮影された画像から、顔を検出する。第1の正規化手段102は、顔検出手段101によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う。部位検出手段103は、第1の正規化手段102により正規化された顔画像を用いて顔の部位を検出する。第2の正規化手段104は、顔検出手段101によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う。特徴量抽出手段105は、第2の正規化手段104により正規化された顔画像を用いて顔の特徴量を抽出する。
顔画像取得手段106は、第1および第2の正規化手段102,104で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、顔検出手段101によって検出された顔の位置情報および大きさ情報を用いて、第1および第2の正規化手段102,104の処理対象となる顔画像の画像データを取得する。顔画像取得選択手段107は、顔検出手段101で検出された顔の大きさ情報と、部位検出手段103および特徴量抽出手段105の正規化手段の正規化サイズに応じて、顔画像取得手段106の取得モードを選択して切替える。
(実施の形態2)
上述した顔認識装置1に含まれる各構成は、それぞれ集積回路であるLSIとして実現することができる。これらは、個別に1チップ化されてもよいし、それぞれにおいて全てまたは一部を含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応例が可能性としてありえる。
図11Aは、本発明の実施の形態2における半導体集積回路の一例を示すブロック図である。図11Aにおいて、半導体集積回路50は、一般的にはCMOSなどのMOSトランジスタで構成され、MOSトランジスタの接続構成により、特定の論理回路を実現する。近年、半導体集積回路の集積度が進み、非常に複雑な論理回路(例えば、本発明における顔認識装置1)を、一つないしは数個の半導体集積回路で実現できる。
半導体集積回路50は、実施の形態1で説明した顔認識装置1およびプロセッサ52を備える。また、半導体集積回路50が備える顔認識装置1は、入力画像を、内部バス69を介して、画像メモリ51より取得する。
半導体集積回路50は、顔認識装置1およびプロセッサ52以外にも必要に応じて、画像符号化/復号化回路56、音声処理部55、ROM54、カメラ入力回路58、LCD出力回路57を備えていても良い。
半導体集積回路50が備える顔認識装置1は、実施の形態1で説明したとおり、顔領域の大きさに応じてデータ転送量を削減した顔認識処理を実現している。
なお、半導体集積回路50は、顔認識装置1の一部の機能をプロセッサ52で実現してもよい。例えば、半導体集積回路50は、図11Bに示すような顔認識装置1aを備えるものであってもよい。図11Bにおいて、顔認識装置1aは、転送モード設定部18および転送モード選択部19を備えずに、これらの機能をプロセッサ52で実現する。
また、顔認識装置1が半導体集積回路50で実現されることで、小型化、低消費電力化などが実現される。
(実施の形態3)
図12を用いて、実施の形態3について説明する。図12は、本発明の実施の形態3における撮影装置のブロック図である。図12において、撮像装置80は、実施の形態2に記載の半導体集積回路50と、レンズ65と、絞り64と、CCDなどのセンサ63と、A/D変換回路62と、角度センサ68と、フラッシュメモリ61となどから構成される。A/D変換回路62は、センサ63のアナログ出力をデジタル信号に変換する。角度センサ68は、撮像装置80の撮影角度を検出する。フラッシュメモリ61は、認識させる顔の特徴量(登録特徴量)を記憶している。
半導体集積回路50には、実施の形態2記載のブロックに加え、レンズ65を制御するズーム制御部67、及び絞り64を制御する露出制御部66などが備わる。
半導体集積回路50の顔認識装置1で認識したフラッシュメモリ80に登録済みの顔の位置情報を用いることで、例えば家族などある特定の顔の位置に合わせたズーム制御部67によるフォーカス制御、露出制御部66による露出制御が可能となる。特に家族の顔をきれいに撮影可能な撮像装置80が実現される。
また、上述した顔認識装置1が行うそれぞれの処理手順は、記憶装置(ROM、RAM、ハードディスク等)に格納された上述した処理手順を実行可能な所定のプログラムデータが、CPUによって解釈実行されることで実現されてもよい。この場合、プログラムデータは、記憶媒体を介して記憶装置内に導入されてもよいし、記憶媒体上から直接実行されてもよい。なお、記憶媒体は、ROMやRAMやフラッシュメモリ等の半導体メモリ、フレキシブルディスクやハードディスク等の磁気ディスクメモリ、CD−ROMやDVDやBD等の光ディスクメモリ、及びメモリカード等をいう。また、記憶媒体は、電話回線や搬送路等の通信媒体を含む概念である。
本発明にかかる顔認識装置は、顔認識処理のデータ転送量を削減すること等が可能であり、デジタルカメラにおける顔認識装置等として有用である。また、デジタルムービー、および監視カメラ等の用途にも応用できる。
1 顔認識装置
2 顔検出部
3 顔認識部
4 目位置検出部
5 顔特徴抽出部
6 顔画像取得部
7 目位置検出部の正規化処理部
8 目位置検出部の正規化画像バッファ
9 目位置検出部の目位置検出処理部
10 顔特徴抽出部の正規化処理部
11 顔特徴抽出部の回転処理部
12 顔特徴抽出部の正規化画像バッファ
13 顔特徴抽出部のガボールフィルタ処理部
16 顔照合部
50 半導体集積回路
51 画像メモリ
52 プロセッサ
53 動き検出回路
54 ROM
55 音声処理部
56 画像符号化回路
57 LCD出力回路
58 カメラ入力回路
59 LCD
60 カメラ
61 フラッシュメモリ
62 A/D変換回路
63 センサ
64 絞り
65 レンズ
66 露出制御部
67 ズーム制御部
68 角度センサ
69 内部バス
101 顔検出手段
102 第1の正規化手段
103 部位検出手段
104 第2の正規化手段
105 特徴量抽出手段
106 顔画像取得手段
107 顔画像取得選択手段
80 撮像装置

Claims (7)

  1. 顔が撮像された画像から、顔を検出する顔検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化手段と、
    前記第1の正規化手段により正規化された顔画像を用いて顔の部位を検出する部位検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化手段と、
    前記第2の正規化手段により正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出手段と、
    前記第1および第2の正規化手段で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出手段によって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化手段の処理対象となる顔画像を取得する顔画像取得手段と、
    前記顔検出手段で検出された顔の大きさ情報と、前記部位検出手段および前記特徴量抽出手段の正規化手段の正規化サイズに応じて、前記顔画像取得手段の前記取得モードを選択して切替える顔画像取得選択手段とを備え、
    前記顔画像取得選択手段は、前記取得モードを、前記顔検出手段で検出された顔の大きさが、前記第1の正規化手段の正規化サイズと前記第2の正規化手段の正規化サイズとの和よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共有取得モードとする、顔認識装置。
  2. 前記顔画像取得手段は、
    前記取得した画像データを保持する第1および第2の画像データ記憶手段と、
    前記第1および第2の正規化手段から前記第1および第2の画像データ記憶手段へのアクセスを制御する画像データ記憶制御手段とを備え、
    前記画像データ記憶制御手段は、
    前記取得モードが前記個別取得モードである場合に、前記第1の画像データ記憶手段に前記第1の正規化手段のみがアクセスし、前記第2の画像データ記憶手段に前記第2の正規化手段のみがアクセスするように制御し、
    前記取得モードが前記共有取得モードである場合に、前記第1および第2の画像データ記憶手段に、前記第1および第2の正規化手段のいずれもがアクセスできるように制御する、請求項1に記載の顔認識装置。
  3. 前記顔画像取得選択手段は、前記取得モードを、
    前記顔検出手段で検出された顔の大きさが、前記第1の正規化手段の正規化サイズと、前記第2の正規化手段の正規化サイズとに、各々リサイズ処理のフィルタのタップ数を乗算した値の和よりも大きな場合に、前記個別取得モードとし、小さな場合に、前記共有取得モードとする、請求項1または2に記載の顔認識装置。
  4. 顔が撮像された画像から、顔を検出する顔検出ステップと、
    前記顔検出ステップによって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化ステップと、
    前記第1の正規化ステップにより正規化された顔画像を用いて顔の部位を検出する部位検出ステップと、
    前記顔検出ステップによって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化ステップと、
    前記第2の正規化ステップにより正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出ステップと、
    前記第1および第2の正規化ステップで用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出ステップによって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化ステップの処理対象となる顔画像を取得する顔画像取得ステップと、
    前記顔検出ステップで検出された顔の大きさ情報と、前記部位検出ステップおよび前記特徴量抽出ステップの正規化サイズに応じて、前記取得モードを選択して切替える顔画像取得選択ステップを備え、
    前記顔画像取得選択ステップは、前記顔検出ステップで検出された顔の大きさが、前記第1の正規化ステップの正規化サイズと前記第2の正規化ステップの正規化サイズとの和よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共用取得モードとする、顔認識方法。
  5. 顔が撮像された画像から、顔を検出する顔検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化手段と、
    前記第1の正規化手段により正規化された顔画像を用いて顔の部位を検出する部位検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化手段と、
    前記第2の正規化手段により正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出手段と、
    前記第1および第2の正規化手段で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出手段によって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化手段の処理対象となる顔画像を取得する顔画像取得手段と、
    前記顔検出手段で検出された顔の大きさ情報と、前記部位検出手段および前記特徴量抽出手段の正規化サイズに応じて、前記顔画像取得手段の前記取得モードを選択して切替える顔画像取得選択手段とを備え、
    前記顔画像取得選択手段は、前記取得モードを、前記顔検出手段で検出された顔の大きさが、前記第1の正規化手段の正規化サイズと前記第2の正規化手段の正規化サイズを加算した値よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共有取得モードとする、顔認識装置を備える半導体集積回路。
  6. 前記半導体集積回路は、プロセッサをさらに備え、
    前記プロセッサは、前記顔画像取得選択手段を実現する、請求項5に記載の半導体集積回路。
  7. 顔が撮像された画像を保持する外部記憶手段と、
    前記外部記憶手段から顔が撮像された画像を取得し、当該取得画像から、顔を検出する顔検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第1の正規化手段と、
    前記第1の正規化手段により正規化された顔画像を用いて顔の部位を検出する部位検出手段と、
    前記顔検出手段によって検出された顔を含む顔画像に対して、ある一定のサイズにリサイズする正規化処理を行う第2の正規化手段と、
    前記第2の正規化手段により正規化された顔画像を用いて顔の特徴量を抽出する特徴量抽出手段と、
    前記第1および第2の正規化手段で用いる顔画像を個別に取得する個別取得モードか、共用して取得する共用取得モードかに応じて、前記顔検出手段によって検出された顔の位置情報および大きさ情報を用いて、前記第1および第2の正規化手段の処理対象となる顔画像を前記外部記憶手段から取得する顔画像取得手段と、
    前記顔検出手段で検出された顔の大きさ情報と、前記部位検出手段および前記特徴量抽出手段の正規化サイズに応じて、前記顔画像取得手段の前記取得モードを選択して切替える顔画像取得選択手段とを備え、
    前記顔画像取得選択手段は、前記取得モードを、前記顔検出手段の顔の大きさが、前記第1の正規化手段の正規化サイズと前記第2の正規化手段の正規化サイズとの和よりも大きな場合に、前記個別取得モードとし、小さな場合に前記共有取得モードとする、撮像装置。
JP2010533803A 2008-10-14 2009-10-05 顔認識装置および顔認識方法 Pending JPWO2010044214A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008265041 2008-10-14
JP2008265041 2008-10-14
PCT/JP2009/005160 WO2010044214A1 (ja) 2008-10-14 2009-10-05 顔認識装置および顔認識方法

Publications (1)

Publication Number Publication Date
JPWO2010044214A1 true JPWO2010044214A1 (ja) 2012-03-08

Family

ID=42106389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010533803A Pending JPWO2010044214A1 (ja) 2008-10-14 2009-10-05 顔認識装置および顔認識方法

Country Status (4)

Country Link
US (1) US20110199499A1 (ja)
JP (1) JPWO2010044214A1 (ja)
CN (1) CN102150180A (ja)
WO (1) WO2010044214A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4766197B2 (ja) * 2009-01-29 2011-09-07 日本電気株式会社 特徴量選択装置
KR101241625B1 (ko) * 2012-02-28 2013-03-11 인텔 코오퍼레이션 얼굴 인식 환경 통지 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체
CN103310179A (zh) * 2012-03-06 2013-09-18 上海骏聿数码科技有限公司 一种基于人脸识别技术的最优姿态检测方法及系统
CN103365922A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 一种用于关联图像和个人信息的方法和装置
WO2015025704A1 (ja) * 2013-08-23 2015-02-26 日本電気株式会社 映像処理装置、映像処理方法および映像処理プログラム
CN107135664B (zh) * 2015-12-21 2020-09-11 厦门熵基科技有限公司 一种人脸识别的方法以及人脸识别装置
CN105741229B (zh) * 2016-02-01 2019-01-08 成都通甲优博科技有限责任公司 实现人脸图像快速融合的方法
US10347218B2 (en) * 2016-07-12 2019-07-09 Qualcomm Incorporated Multiple orientation detection
CN106056729A (zh) * 2016-08-03 2016-10-26 北海和思科技有限公司 一种基于人脸识别技术的门禁系统
JP2018045309A (ja) * 2016-09-12 2018-03-22 株式会社東芝 特徴量抽出装置および認証システム
JP2018136803A (ja) * 2017-02-23 2018-08-30 株式会社日立製作所 画像認識システム
DE112017007011B4 (de) * 2017-03-10 2021-11-04 Mitsubishi Electric Corporation Gesichtsrichtungsschätzvorrichtung und Gesichtsrichtungsschätzverfahren
TWI633499B (zh) * 2017-06-22 2018-08-21 宏碁股份有限公司 全景影像的顯示方法及其電子裝置
WO2019003973A1 (ja) 2017-06-26 2019-01-03 日本電気株式会社 顔認証装置、顔認証方法およびプログラム記録媒体
WO2020095400A1 (ja) * 2018-11-08 2020-05-14 日本電気株式会社 特徴点抽出装置、特徴点抽出方法およびプログラム記憶媒体
CN110969085B (zh) * 2019-10-30 2024-03-19 维沃移动通信有限公司 脸部特征点定位方法及电子设备
CN111695522B (zh) * 2020-06-15 2022-10-18 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质
WO2023189195A1 (ja) * 2022-03-30 2023-10-05 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3452685B2 (ja) * 1995-05-10 2003-09-29 三菱電機株式会社 顔画像の処理装置
US6292575B1 (en) * 1998-07-20 2001-09-18 Lau Technologies Real-time facial recognition and verification system
JP4277534B2 (ja) * 2003-02-12 2009-06-10 オムロン株式会社 画像編集装置および画像編集方法
JP2005084980A (ja) * 2003-09-09 2005-03-31 Fuji Photo Film Co Ltd 顔画像付きカード用データ生成装置および方法並びにプログラム
US20080080744A1 (en) * 2004-09-17 2008-04-03 Mitsubishi Electric Corporation Face Identification Apparatus and Face Identification Method
KR100608595B1 (ko) * 2004-11-16 2006-08-03 삼성전자주식회사 얼굴 인식 방법 및 장치
JP4685465B2 (ja) * 2005-02-01 2011-05-18 パナソニック株式会社 監視記録装置
JP4744918B2 (ja) * 2005-04-19 2011-08-10 富士フイルム株式会社 顔検出方法および装置並びにプログラム
JP4624889B2 (ja) * 2005-08-30 2011-02-02 富士フイルム株式会社 顔検出方法および装置並びにプログラム
KR100745981B1 (ko) * 2006-01-13 2007-08-06 삼성전자주식회사 보상적 특징에 기반한 확장형 얼굴 인식 방법 및 장치
JP4532419B2 (ja) * 2006-02-22 2010-08-25 富士フイルム株式会社 特徴点検出方法および装置並びにプログラム
JP4197019B2 (ja) * 2006-08-02 2008-12-17 ソニー株式会社 撮像装置および表情評価装置
JP2008152530A (ja) * 2006-12-18 2008-07-03 Sony Corp 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム
KR100888476B1 (ko) * 2007-02-15 2009-03-12 삼성전자주식회사 얼굴이 포함된 영상에서 얼굴의 특징을 추출하는 방법 및장치.
US7972266B2 (en) * 2007-05-22 2011-07-05 Eastman Kodak Company Image data normalization for a monitoring system
JP4666179B2 (ja) * 2007-07-13 2011-04-06 富士フイルム株式会社 画像処理方法および画像処理装置
JP4946730B2 (ja) * 2007-08-27 2012-06-06 ソニー株式会社 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム
CN101939980B (zh) * 2008-02-06 2012-08-08 松下电器产业株式会社 电子摄像机和图像处理方法
JP4535164B2 (ja) * 2008-04-09 2010-09-01 ソニー株式会社 撮像装置、画像処理装置、これらにおける画像解析方法およびプログラム
JP4577410B2 (ja) * 2008-06-18 2010-11-10 ソニー株式会社 画像処理装置、画像処理方法およびプログラム

Also Published As

Publication number Publication date
US20110199499A1 (en) 2011-08-18
WO2010044214A1 (ja) 2010-04-22
CN102150180A (zh) 2011-08-10

Similar Documents

Publication Publication Date Title
WO2010044214A1 (ja) 顔認識装置および顔認識方法
US10691923B2 (en) Face anti-spoofing using spatial and temporal convolutional neural network analysis
WO2022134337A1 (zh) 人脸遮挡检测方法、系统、设备及存储介质
WO2020259118A1 (en) Method and device for image processing, method and device for training object detection model
JP4970557B2 (ja) デジタル画像取込装置における顔検索及び検出
CN110348270B (zh) 影像物件辨识方法与影像物件辨识系统
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
US20140334736A1 (en) Face recognition method and device
CN108428214B (zh) 一种图像处理方法及装置
KR20190028349A (ko) 이미지 내 휴먼 분리를 위한 전자 장치 및 방법
CN107368806B (zh) 图像矫正方法、装置、计算机可读存储介质和计算机设备
JP2018092610A (ja) 画像認識装置、画像認識方法及びプログラム
KR20160066380A (ko) 얼굴 등록 방법 및 장치, 얼굴 인식 방법 및 장치
US10134114B2 (en) Apparatus and methods for video image post-processing for segmentation-based interpolation
KR102223478B1 (ko) 눈 상태 검출에 딥러닝 모델을 이용하는 눈 상태 검출 시스템 및 그 작동 방법
JP2009015614A (ja) 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
JP2010108494A (ja) 画像内の顔の特性を判断する方法及びシステム
JP2007074033A (ja) 撮像装置及びその制御方法及びプログラム及び記憶媒体
WO2021178419A1 (en) Method and system for performing image segmentation
US9323989B2 (en) Tracking device
JP2008102611A (ja) 画像処理装置
TW201931312A (zh) 產生視差圖的方法及其影像處理裝置與系統
JPWO2009078155A1 (ja) 画像判定装置
JP6202938B2 (ja) 画像認識装置および画像認識方法
KR101726692B1 (ko) 객체 추출 장치 및 방법