JP2008152530A - 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム - Google Patents

顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2008152530A
JP2008152530A JP2006339748A JP2006339748A JP2008152530A JP 2008152530 A JP2008152530 A JP 2008152530A JP 2006339748 A JP2006339748 A JP 2006339748A JP 2006339748 A JP2006339748 A JP 2006339748A JP 2008152530 A JP2008152530 A JP 2008152530A
Authority
JP
Japan
Prior art keywords
function
degrees
filter
rom
gabor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006339748A
Other languages
English (en)
Inventor
Haruo Togashi
治夫 富樫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006339748A priority Critical patent/JP2008152530A/ja
Priority to US11/950,929 priority patent/US8077932B2/en
Priority to CN2007101611089A priority patent/CN101206715B/zh
Publication of JP2008152530A publication Critical patent/JP2008152530A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】ガボア・フィルタ係数の種類や数を固定することなく、十分な性能で顔画像の認識を行なう。
【解決手段】入力した顔画像内のフィルタの適用場所に応じてフィルタの種類や数を任意に設定して、さまざまな認識の認識率を向上する。また、フィルタ係数をガウス関数により演算された値とサイン関数又はコサイン関数により演算された値に分割して、ガウス関数の特性、サイン関数とコサイン関数の周期性を利用してROMデータを削減し、ハードウェア規模の縮小を図る。
【選択図】 図1

Description

本発明は、撮影画像などに含まれる顔画像を認識する顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムに係り、特に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタを用いて顔画像の特徴量を抽出する顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムに関する。
さらに詳しくは、本発明は、ガボア・フィルタ係数の種類や数を固定することなく、十分な性能で顔画像の認識を行なう顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムに係り、特に、ハードウェア規模や演算負荷の増加を招来することなく十分な性能でガボア・フィルタを利用した顔画像の認識処理を行なう顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムに関する。
顔認識の技術は、ユーザに負担をかけない個人認証システムをはじめとして、性別の識別など、マンマシン・インターフェースに幅広く適用が可能である。初期は横顔を使った認識技術も検討されたが、現在は、正面画像の認識技術が中心となっている。
顔認識システムは、CCDカメラなどによる撮像画像から顔パターンを抽出する顔抽出処理と、抽出された顔パターンを基に顔を認識する顔認識で構成される。顔パターンを抽出する(顔画像の特徴量を抽出する)顔抽出処理若しくは顔認識処理には、例えば、方位選択性を持ち周波数成分の異なる複数のフィルタを用いることにより、顔画像の特徴量を抽出する「ガボア・フィルタリング(Gabor Filtering)」を適用することができる(例えば、特許文献1を参照のこと)。
人間の視覚細胞には、ある特定の方位に対して選択性を持つ細胞が存在することが既に判明されている。これは、垂直の線に対して発火する細胞と、水平の線に反応する細胞で構成される。ガボア・フィルタは、これと同様に、方向選択性を持つ複数のフィルタで構成される空間フィルタである。
ガボア・フィルタは、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現される。フィルタ窓の大きさは例えば24×24固定とする。また、周波数fを5種類、角度θを8方向とすると、40種類のガボア・フィルタが構成される。
ガボア・フィルタの演算は、ガボア・フィルタを適用する画素とガボア・フィルタの係数との畳み込みである。ガボア・フィルタの係数は、周波数応答がコサイン関数からなる実部と周波数応答がサイン関数からなる虚部に分離することができ、それぞれに畳み込み演算を実施し、それぞれの成分を合成して1個のスカラ値からなるガボア・フィルタ結果を求めることができる。このような演算を、周波数fと角度θを切り替えながら最大40種類のガボア・フィルタを適用し、得られた最大40個のスカラ値の組を「ガボア・ジェット」と呼ぶ。顔画像データ上で水平方向及び垂直方向に一定間隔で検出される特徴量抽出位置毎に、局所特徴量としてガボア・ジェットが求められる。ガボア・ジェットは、特徴量抽出位置のある程度の位置のずれや変形に対して、不変であるという特徴を有している。
登録顔画像に関しては、あらかじめ特徴量抽出位置毎のガボア・ジェットが算出されている。そして、同じ特徴量抽出位置における入力顔のガボア・ジェットと登録顔のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合である類似度ベクトルが求められる。続いて、サポート・ベクタ・マシーン(SVM)によるクラス判定を行なって、入力顔画像と登録顔画像の認識を行なう。サポート・ベクタ・マシーンは、類似度ベクトルの境界面の値を、例えば、+1又は−1と判定する境界面(値が0である位置の面)からの距離を算出し、intra−personal class又はextra−personal classのいずれに属するかを判断する。intra−personal classに属すると判断される類似度ベクトルが存在しない場合には、未登録の人物の顔が入力されたと判断される(例えば、非特許文献1を参照のこと)。また、1つのサポート・ベクタ・マシーンが多くの顔画像を学習(すなわち登録)することで、新たに入力された顔画像が登録されている(学習済みの)顔画像と一致するのか(intra−personal classに属するのか)、又は、一致しないのか(extra−personal classに属するのか)を判定することができる(例えば、特許文献2、特許文献3を参照のこと)。サポート・ベクタ・マシーンは、パターン認識の分野で最も学習汎化能力が高いと当業界では評価されている。
上述したように、ガボア・フィルタリングでは、周波数応答に用いるガボア関数の周波数fと角度θを切り替えながら最大40種類のガボア・フィルタを適用して演算を行なう。このように多数のフィルタ係数をガボア・フィルタ演算の度に逐次用意することは計算機にとって演算負荷が高く、処理時間が長くなってしまう。ここで、フィルタ係数の種類や数を固定(制限)することで、演算負荷は軽減されるが、この場合は十分な認識性能が得られなくなってしまう。
また、ガボア・フィルタのすべてのフィルタ係数を単純にROM(Read Only Memory)データとして格納すると、ハードウェア規模が増大してしまう。例えば、医用画像の処理にガボア・フィルタを用いる場合など(例えば、特許文献4を参照のこと)、比較的高価な装置を用いることが許容されている場合においては、ハードウェア規模や演算負荷の問題は無視し得るであろう。他方、小型・携行型のデジタルカメラにおいても、顔認識技術を搭載することにより、人物撮影における合焦時間の短縮を図る、主要被写体が最適露出となるようにダイナミックレンジ圧縮処理を行なう、といったさまざまなアプリケーションが可能となるが、ガボア・フィルタリングを実施する際のハードウェア規模や演算負荷の問題が重大なネックとなる。
特開2006−4041号公報 特再WO03/019475号公報 特開2006−4003号公報 特開2005−21334号公報 B.sholkopf外著"Advance in Kernel Support Vector Learning"(The MIT Press、1999.)
本発明の目的は、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタを用いて顔画像の特徴量を好適に抽出することができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、ガボア・フィルタ係数の種類や数を固定することなく、十分な性能で顔画像の認識を行なうことができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、ハードウェア規模や演算負荷の増加を招来することなく十分な性能でガボア・フィルタを利用した顔画像の認識処理を行なうことができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、入力顔画像と登録顔画像の認識を行なう顔認識装置であって、
認識処理の対象となる顔画像を入力する顔画像入力手段と、
前記の入力画像の特徴量抽出位置毎に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と画素の畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用手段と、
特徴量抽出位置毎に、入力顔画像のガボア・ジェットと登録顔画像のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合からなる類似度ベクトルを求める類似度演算手段と、
該類似度ベクトルを基に入力顔画像と登録顔画像が一致するか否かを判定する一致判定手段を備え、
前記ガボア・フィルタ適用手段は、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMと、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するガボア・フィルタ係数算出手段を備え、該ガボア・フィルタ係数算出手段によって算出されたガボア・フィルタ係数による前記の入力顔画像の畳み込み演算を行なう、
ことを特徴とする顔認識装置である。
顔抽出処理若しくは顔認識処理には、例えば、方位選択性を持ち周波数成分の異なる複数のフィルタで顔画像の特徴量を抽出するガボア・フィルタリングを適用することができる。ガボア・フィルタは、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現される。ガボア・フィルタで画像を畳み込むことで、ガボア・フィルタと方向の一致する輪郭線だけを抽出することができる。
入力顔画像のある特徴量抽出位置において、応答関数の周波数と角度を切り替えながらガボア・フィルタの演算を行なうことで、フィルタの種類に応じた個数のスカラ値からなるガボア・フィルタ結果すなわちガボア・ジェットが得られる。そして、特徴量抽出位置毎に入力顔画像と登録顔画像のガボア・ジェットの類似度を算出して、類似度の集合である類似度ベクトルが求められ、この類似度ベクトルを基に入力顔画像と登録顔画像の一致判定を行なうことができる。
ガボア・フィルタで画像を畳み込むことで、ガボア・フィルタと方向の一致する輪郭線だけを好適に抽出することができるので、顔認識に限らず、パターン認識やその他のさまざまな画像処理に適用することができる。
しかしながら、多数のガボア・フィルタ係数をガボア・フィルタ演算の度に逐次用意することは計算機にとって演算負荷が高く、処理時間が長くなってしまう。また、ガボア・フィルタのフィルタ係数を単純にROMデータとして格納すると、ハードウェア規模が増大してしまうという問題がある。
そこで、本発明に係る顔認識装置では、ガボア・フィルタが窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とすることに着目して、ガボア・フィルタ係数を格納するROMデータの削減を図っている。前記ガボア・フィルタ適用手段は、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMを備えており、ガボア・フィルタ係数算出手段は、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するように構成されている。
すなわち、フィルタ係数をガウス関数により演算された値とサイン関数又はコサイン関数により演算された値に分割して扱うことによって、ガボア・フィルタのすべてのフィルタ係数を単純にROMデータとして格納する場合よりも、ハードウェア規模を削減することができる。また、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算することで、ガボア・フィルタ係数を容易に求めることができるので、演算負荷は高くない。
さらに、本発明に係る顔認識装置では、ガウス関数の特性、サイン関数とコサイン関数の周期性を利用して、冗長性を排して最小限のデータのみをROMに格納することで、ハードウェア規模の縮小を実現している。
前記ガボア・フィルタ適用手段は、8方向の角度からなるガボア・フィルタを適用するために、サイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度サインROMと、コサイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度コサインROMと、サイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度サインROMと、コサイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度コサインROMを備える。
また、0度と45度、45度と90度、90度と135度、135度と180度それぞれの中心角である22.5度、67.5度、112.5度、157.5度の各想定角に関しては、サイン関数並びにコサイン関数の周期性がないため、サイン関数とコサイン関数の周期性を持つ近傍の27度、63度、117度、153度の角度に近似して、サイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度63度117度153度サインROMと、コサイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度63度117度153度コサインROMを備える。
また、前記の各ROMは、それぞれの角度のサイン関数又はコサイン関数から得られた値から重複を排除して、最小限のワード数からなるROMデータを格納するようにする。
この場合、特徴量抽出位置を前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROM上のアドレスに変換するアドレス変換手段を備え、前記ガボア・フィルタ係数算出手段は、前記アドレス変換手段によって特徴量抽出位置から変換されたアドレスに従って、前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROMからフィルタ窓の値並びにフィルタの角度毎の応答関数の値を読み出し、これらを乗算して該当する特徴量抽出位置におけるガボア・フィルタ係数を求めることができる。
したがって、本発明によれば、ガウス関数の特性、サイン関数とコサイン関数の周期性を利用して、冗長性を排して最小限のデータのみをROMに格納することで、ハードウェア規模の縮小を実現することができる。
また、本発明に係る顔認識装置は、各特徴量抽出位置において適用されるフィルタの種類を記録するフィルタ種別記録手段と、特徴量抽出位置毎に前記フィルタ種別記録手段における記録内容に従って前記の各ROMから該当するフィルタ係数を構成するためのフィルタ窓の値及び応答関数の値を選択的に読み出して前記ガボア・フィルタ係数算出手段に渡す選択手段をさらに備えていても良い。
このような場合、入力した顔画像内のフィルタの適用場所(特徴量抽出位置の位置)に応じてフィルタの種類や数を任意に設定することができる。この結果、顔認識、笑顔認識、性別認識など、さまざまな認識の認識率を向上することができる。また、フィルタの種類や数を固定した場合(すべての特徴量抽出位置で全フィルタを適用する場合)よりも処理時間を短縮することができる。
また、本発明の第2の側面は、入力顔画像と登録顔画像の認識を行なうための処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータに対し、
認識処理の対象となる顔画像を入力する顔画像入力手順と、
前記の入力画像の特徴量抽出位置毎に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と画素の畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用手順と、
特徴量抽出位置毎に、入力顔画像のガボア・ジェットと登録顔画像のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合からなる類似度ベクトルを求める類似度演算手順と、
該類似度ベクトルを基に入力顔画像と登録顔画像が一致するか否かを判定する一致判定手順を実行させ、
前記ガボア・フィルタ適用手順では、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMを用い、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するガボア・フィルタ係数算出手順を実行して、該算出されたガボア・フィルタ係数による前記の入力顔画像の畳み込み演算を行なう、
ことを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータにインストールすることによって、コンピュータ上では協働的作用が発揮され、本発明の第1の側面に係る顔認識装置と同様の作用効果を得ることができる。
本発明によれば、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタを用いて顔画像の特徴量を好適に抽出することができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、ガボア・フィルタ係数の種類や数を固定することなく、十分な性能で顔画像の認識を行なうことができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、ハードウェア規模や演算負荷の増加を招来することなく、十分な性能でガボア・フィルタを利用した顔画像の認識処理を行なうことができる、優れた顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラムを提供することができる。
本発明に係る顔認識装置は、ガボア・フィルタが窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とすることに着目して、ガボア・フィルタ係数を格納するROMデータの削減を図っている。すなわち、フィルタ係数をガウス関数により演算された値とサイン関数又はコサイン関数により演算された値に分割して、さらにガウス関数の特性、サイン関数とコサイン関数の周期性を利用して、冗長性を排して最小限のデータのみをROMに格納することで、ハードウェア規模の縮小を実現することができる。
また、本発明に係る顔認識装置によれば、入力した顔画像内のフィルタの適用場所(特徴量抽出位置の位置)に応じてフィルタの種類や数を任意に設定することができる。この結果、顔認識、笑顔認識、性別認識など、さまざまな認識の認識率を向上することができる。また、フィルタの種類や数を固定した場合(すべての特徴量抽出位置で全フィルタを適用する場合)よりも処理時間を短縮することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
顔認識システムは、入力画像から顔画像を抽出する顔抽出処理と、抽出された顔画像を認識する顔認識で構成されることは既に述べた通りである。ここでは、まず顔検出と顔認識について改めて定義しておく。
顔検出は、ある1枚の画像(1枚の写真や動画像の1ピクチャ(フィールド又はフレーム)に当たる)に対して、人物顔を検出しその位置と大きさを求める処理である。1枚の画において複数の顔が存在することがある。一方、顔認識とは検出されたある1個の顔が以前に登録された顔と同一人物かを識別することを言う。
図1には、本発明の一実施形態に係る顔認識システムの全体構成を模式的に示している。図示のシステム1は、画縮小器11と、顔検出器12と、両目位置検出器13と、顔認識器14と、複数枚の画像を蓄えるメモリ(SDRAM)15で構成される。また、顔検出器12と、両目位置検出器13と、顔認識器14内部にローカル・メモリ(SDRAM)を備えている。本システム1への入力は画像であり、本システム1からの出力(Yes/No)は同一人物か否かを示すフラグである。
画縮小器11では、入力画像に対し水平及び垂直の各方向にそれぞれ1/2にした縮小画像を作成し、原入力画像とともにSDRAM(Synchronous DRAM)15に格納する。図1に示す例では、入力画像を画1、入力画像に対し水平及び垂直方向にそれぞれ1/2にした縮小画像を画1/2、入力画像に対し水平及び垂直方向にそれぞれ1/4にした縮小画像を画1/4として、これら3枚の画像を作成して、SDRAM15に格納する。
縮小画像を作成する際、演算精度を考慮すると、入力画像から直接それぞれの縮小画像を作成する方法が望ましい。但し、ハードウェアの規模を考慮して、1/2縮小を順番に施す方法、つまり、始めに入力画像(画1)から画1/2を作成し、次に作成された画1/2から画1/4を作成する方法で実現するようにしてもよい。
顔検出器12では、入力画像とSDRAM15に格納されているすべての縮小画像に対して顔を検出し、検出された顔の大きさと顔の位置を求める。顔の位置の検出に関しては、画像全体を検出することで処理速度を考慮しなければ容易に実現可能である。一方、いろいろな大きさの顔の検出に関しては、画像の解像度と検出顔の大きさの相対関係の問題で、画像の解像度を固定にする方法(すなわち、入力画像に対していろいろな大きさの顔検出器を用意する方法)と、検出顔の大きさを固定にする方法(検出できる顔の大きさが固定された1つの顔検出器を用い、入力画像をいろいろな解像度に縮小して検出する方法)が考えられるが、後者の方法が現実的である。したがって、図1に示すように、顔検出器12では、画縮小器11で作成された画1、画1/2、画1/4の各縮小画像に対して、24×24画素内に顔が存在するか否かを識別する。
なお、縮小率の刻みが1/2、1/4では粗過ぎて精度が不十分である場合には、例えば画縮小器11で画7/8、画6/8、画5/8の縮小率の画像をさらに作成し、顔検出器12でそれぞれの縮小率の画像に対しても顔検出を行なうようにすれば良い。
顔検出の特徴抽出として2点画素差分方式を適用することができる。これは、24×24画素内において顔の特徴を抽出し易い2点の画素の差分をさまざまな2点で行なう方式である。また、識別器演算としてadaboostアルゴリズムを用いることができる。
両目位置検出器13では、両目位置検出は、顔画像を顔認識するための準備として、顔検出器12によって検出された顔に対して解像度を上げた画像の顔を正規化するために、左右の目の位置を特定する。すなわち、両目位置を検出して、顔検出によって得られた顔の大きさ、顔の位置から、その顔画像の解像度を上げた顔の大きさ、顔の位置、顔の角度を求める。
顔検出器12では24×24画素の解像度で顔検出が行なわれ、顔認識器14では60×66画素の解像度で顔認識が行なわれる。言い換えると、顔認識器14に必要な解像度は、顔検出器12のそれより精度を要求される。そこで、顔検出器で検出された顔が画1/2とすると、それよりも解像度の高い画1の同等の顔が存在する場所で且つ目が存在する顔の上部で左右の目を検出する。
両目位置検出の特徴抽出として2点画素差分方式を適用することができる。2点画素差分方式の適用範囲も24×24画素であり、顔検出器12と同じであるので、顔検出器12と同一のハードウェアで処理時間をシリアルにして実現することができる。
顔認識器14では、両目位置検出器13によって左右の目位置が特定された顔画像から顔の大きさ、位置、角度を求め、それらに応じて顔を正規化して60×66画素の内部のSRAMに一旦蓄えて、登録画像と一致するか否かを調べる。
本実施形態では、顔認識器14は、顔認識の特徴抽出としてガボア・フィルタリングを適用する。また、識別器演算としてgentleboostを用いる。正規化された顔画像にガボア・フィルタを適用して得られた結果と、以前に登録された画像にガボア・フィルタを適用して得られた結果との類似度を求める。そして、求められた類似度に対してgentleboostを施すことによって、登録画と一致したか否か識別する。
図2には、顔認識器14の構成例を示している。図示の顔認識器14は、顔画像入力部141と、ガボア・フィルタ適用部142と、類似度算出部143と、一致判定部144を備えている。
顔画像入力部141は、初めに、両目位置検出で検出された両目位置から顔認識に必要である解像度に相当する顔画像を、SDRAM15から、顔認識器14にローカルのSRAM1に転送する。次いで、両目位置情報から顔の大きさ、顔の位置、顔の角度を求め、SRAM1にある顔画像を正規化して、顔認識に必要な顔画像を作成して、顔認識器14にローカルのSRAM2に格納する。つまり、顔画像入力部141では、両目位置情報からSRAM2の固定した座標に右目、左目の位置を合わせるように、SRAM1の顔画像を縮小、シフト、回転変換して顔認識に必要な顔画像をSRAM2に作成する(図3を参照のこと)。
ガボア・フィルタ適用部142は、画像入力部141において正規化された顔画像に対してガボア・フィルタを適用する。
ガボア・フィルタは、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現される。本実施形態では、フィルタ窓は、図4Aに示すように24×24画素固定とする。そして、図4Bに示すような特定の周波数成分のサイン関数又はコサイン関数からなる応答関数にフィルタ窓をかけると、図4Cに示すようなガボア・フィルタを作成することができる。また、例えば、0度、22.5度、45度、67.5度、90度、112.5度、135度、157.5度と22.5度ずつずらした8方向のサイン関数又はコサイン関数からなる応答関数に対してそれぞれフィルタ窓をかけると、図4Dに示すように8通りのガボア・フィルタを作成することができる。さらに、低周波域から高周波域に至る5種類の周波数fの応答関数について、同様に8方向の角度θでフィルタ窓をかけることで、図4Eに示すように合計で40種類のガボア・フィルタが構成される。ガボア・フィルタ(ガボア・カーネルK(x,y))は、以下の演算式で表される。
ガボア・フィルタの演算は、ガボア・フィルタGi(x,y)を適用する画素I(x,y)とガボア・フィルタの係数との畳み込みである。ガボア・フィルタの係数は、周波数応答がコサイン関数からなる実部Re(x,y)と周波数応答がサイン関数Im(x,y)からなる虚部に分離することができ、それぞれに畳み込み演算を実施し、それぞれの成分を合成して、1個のスカラ値からなるガボア・フィルタ結果Ji(x,y)を求めることができる。但し、(x,y)は特徴量抽出位置の画素位置を示し、iは上述した40通りのガボア・フィルタのうちi番目であることを示す。
画像の特徴量抽出位置(x,y)において最大40種類のガボア・フィルタを適用して得られた最大40スカラ値の組{J1,J2,…,J40}をガボア・ジェットと呼ぶ。
類似度算出部143は、入力画像について算出されたガボア・ジェットGSと登録画像のガボア・ジェットGRに正規化相関演算を行ない、特徴量抽出位置毎の類似度dを求める。
本実施形態では、正規化された60×66画素の顔画像のうち、特徴量が抽出し易い82箇所の特徴量抽出位置(図5を参照のこと)において、正規化相関演算を行ない、類似度を求める。この結果、d0、d1、…、d81の82箇所の各特徴量抽出位置で求められた正規化相関演算結果を要素とする類似度ベクトルDが得られる。
なお、上記では「最大40種類」のガボア・フィルタを適用することを記述したが、これは82箇所のすべての特徴量抽出位置において40種類すべてのガボア・フィルタを適用する必要はないことを意味する。何種類のガボア・フィルタを適用するかは、類似度を抽出する特徴量抽出位置の場所に依存し、場所に応じてガボア・フィルタの種類とその数(ガボア・ジェットの要素数)が異なる。
一致判定部144は、入力画と登録画間の類似度ベクトルに基づいて、両画像の一致を判定する。本実施形態では、識別器演算としてgentleboostを用いる。ここでは、以下の演算式を用いてgentleboostを算出する。但し、同式中のa、q、bは辞書としてあらかじめ登録されているものとする。
そして、以下の判別式に従って、入力画が登録画と一致するかどうかを判定する。
なお、本実施形態では、一致判定にgentleboostを用いているが、本発明の要旨は必ずしもこれに限定されるものではない。例えば、サポート・ベクタ・マシーンを用いて類似ベクトルの境界面の値をクラス判定して、顔画像の一致を判定するようにしてもよい。
図6には、ガボア・フィルタ適用部142の構成例を示している。図示のガボア・フィルタ適用部142は、制御信号発生部から供給される制御信号に従って動作する。図7には、制御信号発生部の内部構成を示している。また、図8には、この制御信号発生部が出力する制御信号を図解している。
図7に示すように、制御信号発生部は、特徴量抽出位置を指定する特徴量抽出位置カウンタ、特徴量抽出位置毎のフィルタの種類を指定するフィルタ種類カウンタ、24×24画素からなるフィルタ窓のY及びXを指定する窓Yカウンタ並びに窓Xカウンタを備えている。
図5に示したように、1画像(すなわち1つの顔)に対して82箇所でそれぞれ特徴量を抽出するため、特徴量抽出位置カウンタは、特徴量抽出位置を示すための0〜81のカウンタである。特徴両抽出位置の場所に応じて、適用されるガボア・フィルタの種類と数が異なる。また、図6に示したガボア・フィルタ適用部142では4並列でフィルタ演算を行なう。
図8に示す例では、特徴量抽出位置0(pos0)において4×7=28種類のガボア・フィルタを適用し、特徴量抽出位置1(pos1)において4×3=12種類のガボア・フィルタを適用する。入力した顔画像内のフィルタの適用場所(特徴量抽出位置の位置)に応じてフィルタの種類や数を任意に設定することができる。何種類のガボア・フィルタを適用するかは、特徴量抽出位置の場所{d0、d1、…d81}に依存し、場所に応じてガボア・フィルタの種類とその数(ガボア・ジェットの要素数)が異なる(前述)。ここで、フィルタの種類は最大で40、フィルタ演算の並列数は4であることから、フィルタ種類カウンタは0〜9のカウンタである。
1個のガボア・フィルタに対しては(4並列なので合計4個)、0〜23のy方向のカウンタ(窓Y)と0〜23のx方向のカウンタ(窓X)を用意し(図9を参照のこと)、処理時間は24×24=576クロック(固定クロック時間)となる。
本実施形態では、40(=8方向×5通りの周波数)種類のガボア・フィルタが使用される。ガボア・フィルタの係数は、ガウス関数により演算されたフィルタ窓(24×24)と、コサイン関数からなる実部並びにサイン関数からなる虚部により演算され、ハードウェアとしてROMを用いて実現することができる。ここで、すべてのフィルタ係数をROMに格納する場合、係数のビット長を16ビットと仮定すると、24×24×40×2×16=720Kビットと大容量になる。そこで、以下では、ROMに格納すべき係数のデータ量削減について考察する。
ガボア・フィルタ係数は、ガウス関数により演算されたフィルタ窓の値と、サイン関数及びコサイン関数によりそれぞれ演算された応答関数の値の乗算で求められる。したがって、ガウス関数により演算されたフィルタ窓の値、サイン関数により演算された値、並びにコサイン関数により演算された値をそれぞれROMに格納して用意し、乗算器を使って乗算を行なうことで、ガボア・フィルタ係数を求めることができる。これによって、40種類のガボア・フィルタの係数をすべて格納する場合に比べ、ROMデータのサイズを削減することができる。
また、ガウス関数がピークを中心に対称的であることや、サイン関数及びコサイン関数が周期関数であること、すなわち同じ値が繰り返し出現するという冗長性に着目して、ガウス関数により演算されたフィルタ窓の値、サイン関数により演算された値、並びにコサイン関数により演算された値を格納するそれぞれのROMのサイズをさらに削減することができる。
まず、フィルタ窓の冗長性について考えてみる。図10A及び図10Bには、ガウス関数により演算される24×24固定のフィルタ窓の位置XY毎の値を示している。図4Aからも分るように、(0,0)にピークを持ち、ピークから離れるに従って0に近づくが、(0,0)に対し点対称となる。そして、図10からも分るように、ガウス関数により演算された24×24(=576ワード)のフィルタ窓では78ワードが複数の窓位置XYで繰り返し出現するから、図10A中において太枠で示した78ワードのみが必要なデータとなる。
また、サイン関数とコサイン関数により演算された値は、0度と90度、45度と135度、並びに、27度と63度と117度と153度では、それぞれ同じ値となるから、サイン関数とコサイン関数の周期性を考慮して、サイン関数とコサイン関数により演算される応答関数に必要なROMデータのサイズを削減することができる。
図11A及び図11Bには、サイン関数により演算された0度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。また、図12A及び図12Bには、コサイン関数により演算された0度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。0度のXとYを入れ替えると90度の関係となるという、サイン関数とコサイン関数の周期性を考慮すると、12ワードが複数の窓位置XYで繰り返し出現するから、図12A中において太枠で示した12ワードのみが当該角度の応答関数を構成するために必要なデータとなる。
図13A及び図13Bには、サイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示し、図13C及び図13Dには、サイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。また、図14A及び図14Bには、コサイン関数により演算された45度の方向に対する応答関数の24×24の各窓位置XYにおける値を示し、図14C及び図14Dには、コサイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。サイン関数とコサイン関数の周期性を考慮すると、24ワードが複数の窓位置XYで繰り返し出現するから、図13A及び図14A中に太枠で示した合計24ワードのみが当該角度の応答関数を構成するために必要なデータとなる。
サイン関数及びコサイン関数からなる応答関数の残りの4方向に関しては、当初、0度と45度、45度と90度、90度と135度、135度と180度それぞれの中心角である22.5度、67.5度、112.5度、157.5度を想定していた(図4Cを参照のこと)。ところが、これらの想定角度では、サイン関数並びにコサイン関数の周期性が見出せず、上記と同様のデータ削減を行なうことができない。そこで、これらの想定角の近傍で、サイン関数とコサイン関数の周期性を考慮してデータを削減することができる、27度、63度、117度、153度の角度に近似して、これら4方向に対してサイン関数及びコサイン関数からなる応答関数で代用することにした。
27度、63度、117度、153度の角度はそれぞれ下式で求めることができ、サイン関数とコサイン関数の間で周期性があることを理解できよう。
図15A及び図15Bには、サイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。また、図16A及び図16Bには、コサイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示している。サイン関数とコサイン関数の周期性を考慮すると、35ワードが複数の窓位置XYで繰り返し出現するから、図15A及び図16Aに太枠で示したそれぞれ35ワードのみが当該角度の応答関数を構成するために必要なデータとなる。
このようにして、ガボア・フィルタを構成するフィルタ窓、及び8方向の応答関数に必要なデータを以下のように削減することができる。
(1)ガウス関数により演算される24×24固定のフィルタ窓に必要なROMデータを78ワードとする。
(2)サイン関数及びコサイン関数により演算された0度と90度の方向に対する応答関数を構成するために必要なROMデータを12ワードとする。
(3)サイン関数及びコサイン関数により演算された45度と135度の方向に対する応答関数を構成するために必要なROMデータを24ワードとする。
(4)応答関数の残りの4方向となる22.5度、67.5度、112.5度、157.5度の各想定角に関してはサイン関数並びにコサイン関数の周期性が見出せないことから、サイン関数とコサイン関数の周期性のある27度、63度、117度、153度の角度に近似した応答関数で代用することで、これらの方向に対する応答関数を構成するために必要なROMデータをそれぞれ35ワードとする。
これらの必要最小限となるワード数のROMデータをそれぞれガウスROM、0度及び90度サインROM、0度及び90度コサインROM、45度及び135度サインROM、45度及び135度コサインROM、27度63度117度153度サインROM、27度63度117度153度コサインROMに格納する。そして、アドレス作成部において、制御信号発生部の窓Yカウンタ並びに窓Xカウンタから出力される窓Y及び窓Xの制御信号を変換して、これらの各ROMのアドレスを作成することによって、ガウス関数から演算された値、並びに、サイン関数及びコサイン関数から演算された値を読み出すことができる。
ガウスROM用アドレス作成部は、例えば図17に示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号からガウスROM上の該当アドレスを早見することができる。
また、0度及び90度サインROM用アドレス作成部は、例えば図18A及び図18Bに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、サイン関数により演算された0度及び90度方向の応答関数の値を格納した0度及び90度サインROM上の該当アドレスをそれぞれ早見することができる。あるいは、0度及び90度サインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から0度及び90度サインROM上の該当アドレスに変換することができる。
また、0度及び90度コサインROMアドレス作成部は、例えば図19A及び図19Bに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、コサイン関数により演算された0度及び90度方向の応答関数の値を格納した0度及び90度コサインROM上の該当アドレスをそれぞれ早見することができる。あるいは、0度及び90度コサインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から0度及び90度コサインROM上の該当アドレスに変換することができる。
また、45度及び135度サインROMアドレス作成部は、例えば図20A及び図20Bに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、サイン関数により演算された45度及び135度方向の応答関数の値を格納した45度及び135度サインROM上の該当アドレスをそれぞれ早見することができる。あるいは、45度及び135度サインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から45度及び135度サインROM上の該当アドレスに変換することができる。
また、45度及び135度コサインROMアドレス作成部は、例えば図21A及び図21Bに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、コサイン関数により演算された45度及び135度方向の応答関数の値を格納した45度及び135度コサインROM上の該当アドレスをそれぞれ早見することができる。あるいは、45度及び135度コサインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から45度及び135度コサインROM上の該当アドレスに変換することができる。
また、27度63度117度153度サインROMアドレス作成部は、例えば図22A〜図22Dに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、サイン関数により演算された27度、63度、117度、153度の各方向の応答関数の値を格納した27度63度117度153度サインROM上の該当アドレスをそれぞれ早見することができる。あるいは、27度63度117度153度サインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から27度63度117度153度サインROM上の該当アドレスに変換することができる。
また、27度63度117度153度コサインROMアドレス作成部は、例えば図23A〜図23Dに示すアドレス変換テーブルを参照することによって、窓Y及び窓Xの制御信号から、コサイン関数により演算された27度、63度、117度、153度の各方向の応答関数の値を格納した27度63度117度153度コサインROM上の該当アドレスをそれぞれ早見することができる。あるいは、27度63度117度153度コサインROM用アドレス作成部は、次式に従って窓Y及び窓Xの制御信号から27度63度117度153度コサインROM上の該当アドレスに変換することができる。
ここで、サイン関数により演算された値のアドレス割り当てとコサイン関数により演算された値のアドレス割り当てのROMのアドレスへの変換式は同じである。
上述したように、82箇所のすべての特徴量抽出位置において40種類すべてのガボア・フィルタを適用する必要はなく、何種類のガボア・フィルタを適用するかは、特徴量抽出位置の場所{d0,d1,…,d81}に依存し、場所に応じてガボア・フィルタの種類とその数(ガボア・ジェットの要素数)が異なる。このような操作を実現するために、ガボア・フィルタ適用部142内には、フィルタ種別SRAMとセレクタが配設される。まず、入力画のすべての特徴量抽出位置{d0,d1,…,d81}において、それぞれ適用されるフィルタの種類をフィルタ種別SRAMに書き込む。すなわち、
特徴量抽出位置0(pos0)では、pos00,pos01,…,pos027,
特徴量抽出位置1(pos1)では、pos10,pos11,…,pos011,
制御信号発生部から入力される特徴量抽出位置のアドレスに応じて、該当位置において適用されるフィルタの位置がフィルタ種別SRAMから読み出される。そして、セレクタは、当該特徴量抽出位置において必要なフィルタ係数(サイン関数及びコサイン関数から演算された応答関数)を上述した各係数格納ROMから選択して、後段のフィルタ演算部に渡す。
図6に示したガボア・フィルタ適用部142では、フィルタ演算部は4並列で構成されている。但し、並列数は4個に限定される訳ではなく、フィルタ適用数や処理速度、ハードウェア規模を考慮して決定される設計事項である。
フィルタ演算部では、SDRAM15から画像SRAMに取り込まれた処理対象画像(入力画)に対して、ガボア・フィルタを適用する。具体的には、特徴量抽出位置に応じてセレクタで選択されたサインROM及びコサインROMから得られた値と、ガウスROMから得られた値を乗算して各ガウス・フィルタ係数を算出し、24×24の各ガウス・フィルタ係数と処理対象画像の24×24画素との畳み込み演算を行ない、それぞれの結果を合成する。本実施形態では、合成を絶対値和で近似している。合成の精度が必要な場合には、両者の2乗和のルート演算を行なう。
なお、図6に示したガボア・フィルタ適用部142の構成では、フィルタ種別の選択肢が限定されてしまうという問題がある。何故ならば、サイン関数及びコサイン関数により演算して得た応答関数に関して、27度と63度と117度と153度(ある周波数に限定する)でROMデータを共有しているため、これらの演算をフィルタ演算の並列化を利用して同時実行することができないからである。したがって、この4種のフィルタしか適用しない場合は4並列化の中で3並列分のハードウェア資源が無駄になる。
この問題を解決するために、図24に示すように、それぞれの角度のROMデータを独立に割り当てた構成としてもよい。これにより、ROMデータの容量は大きくなるが、任意のフィルタ種類構成を最小の時間で処理可能に実現することができる。
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
本明細書では、顔認識装置に適用した実施形態を中心に説明してきたが、本発明の要旨はこれに限定されるものではない。ガボア・フィルタは、人間の視覚細胞にはある特定の方位に対して選択性を持つ細胞が存在するということに着眼し、方向選択性を持つ複数のフィルタで構成される空間フィルタであり、具体的には窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現される。ガボア・フィルタで画像を畳み込むことで、ガボア・フィルタと方向の一致する輪郭線だけを抽出することができる。本発明は、ガボア・フィルタを用いてパターン認識やその他のさまざまな画像処理を行なう装置に好適に適用することができる。
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
図1は、本発明の一実施形態に係る顔認識システムの全体構成を模式的に示した図である。 図2は、顔認識器14の構成例を示した図である。 図3は、検出された顔画像を、縮小、シフト、回転変換して顔認識に必要な顔画像に正規化する様子を示した図である。 図4Aは、24×24画素固定で構成されるガウス関数からなるフィルタ窓を示した図である。 図4Bは、サイン関数又はコサイン関数からなる応答関数を示した図である。 図4Cは、図4Bに示した応答関数に図4Aに示したフィルタ窓をかけて得られるガボア・フィルタを示した図である。 図4Dは、22.5度ずつずらした8方向の応答関数についてそれぞれフィルタ窓をかけて得られる8通りのガボア・フィルタを示した図である。 図4Eは、5種類の周波数fの応答関数について、同様に8方向の角度θでフィルタ窓をかけて得られる40種類のガボア・フィルタを示した図である。 図5は、正規化された60×66画素の顔画像に設けられた82箇所の特徴量抽出位置を示した図である。 図6は、ガボア・フィルタ適用部142の構成例を示した図である。 図7は、制御信号発生部の内部構成を示した図である。 図8は、図7に示した制御信号発生部が出力する制御信号を示した図である。 図9は、フィルタ窓の構成を示した図である。 図10Aは、ガウス関数により演算される24×24固定のフィルタ窓の位置XY毎の値を示した図である。 図10Bは、ガウス関数により演算される24×24固定のフィルタ窓の位置XY毎の値を示した図である。 図11Aは、サイン関数により演算された0度と90度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図11Bは、サイン関数により演算された0度と90度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図12Aは、コサイン関数により演算された0度と90度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図12Bは、コサイン関数により演算された0度と90度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図13Aは、サイン関数により演算された45度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図13Bは、サイン関数により演算された45度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図13Cは、サイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図13Dは、サイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図14Aは、コサイン関数により演算された45度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図14Bは、コサイン関数により演算された45度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図14Cは、コサイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図14Dは、コサイン関数により演算された135度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図15Aは、サイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図15Bは、サイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図16Aは、コサイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図16Bは、コサイン関数により演算された27度の方向に対する応答関数の24×24の各窓位置XYにおける値を示した図である。 図17は、窓Y及び窓Xの制御信号からガウスROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図18Aは、窓Y及び窓Xの制御信号から、サイン関数により演算された0度方向の応答関数の値を格納した0度サイン及び90度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図18Bは、窓Y及び窓Xの制御信号から、サイン関数により演算された90度方向の応答関数の値を格納した0度及び90度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図19Aは、窓Y及び窓Xの制御信号から、コサイン関数により演算された0度方向の応答関数の値を格納した0度及び90度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図19Bは、窓Y及び窓Xの制御信号から、コサイン関数により演算された90度方向の応答関数の値を格納した0度及び90度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図20Aは、窓Y及び窓Xの制御信号から、サイン関数により演算された45度方向の応答関数の値を格納した45度及び135度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図20Bは、窓Y及び窓Xの制御信号から、サイン関数により演算された135度方向の応答関数の値を格納した45度及び135度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図21Aは、窓Y及び窓Xの制御信号から、コサイン関数により演算された45度方向の応答関数の値を格納した45度及び135度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図21Bは、窓Y及び窓Xの制御信号から、コサイン関数により演算された135度方向の応答関数の値を格納した45度及び135度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図22Aは、窓Y及び窓Xの制御信号から、サイン関数により演算された27度方向の応答関数の値を格納した27度63度117度153度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図22Bは、窓Y及び窓Xの制御信号から、サイン関数により演算された63度方向の応答関数の値を格納した27度63度117度153度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図22Cは、窓Y及び窓Xの制御信号から、サイン関数により演算された117度方向の応答関数の値を格納した27度63度117度153度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図22Dは、窓Y及び窓Xの制御信号から、サイン関数により演算された153度方向の応答関数の値を格納した27度63度117度153度サインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図23Aは、窓Y及び窓Xの制御信号から、コサイン関数により演算された27度方向の応答関数の値を格納した27度63度117度153度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図23Bは、窓Y及び窓Xの制御信号から、コサイン関数により演算された63度方向の応答関数の値を格納した27度63度117度153度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図23Cは、窓Y及び窓Xの制御信号から、コサイン関数により演算された117度方向の応答関数の値を格納した27度63度117度153度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図23Dは、窓Y及び窓Xの制御信号から、コサイン関数により演算された153度方向の応答関数の値を格納した27度63度117度153度コサインROMのアドレスを早見するためのアドレス変換テーブルの構成例を示した図である。 図24は、ガボア・フィルタ適用部142の変形例を示した図である。
符号の説明
1…顔認識システム
11…画縮小器
12…顔検出器
13…両目位置検出器
14…顔認識器
15…メモリ
141…顔画像入力部
142…ガボア・フィルタ適用部
143…類似度算出部
144…一致判定部

Claims (10)

  1. 入力顔画像と登録顔画像の認識を行なう顔認識装置であって、
    認識処理の対象となる顔画像を入力する顔画像入力手段と、
    前記の入力画像の特徴量抽出位置毎に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と画素の畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用手段と、
    特徴量抽出位置毎に、入力顔画像のガボア・ジェットと登録顔画像のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合からなる類似度ベクトルを求める類似度演算手段と、
    該類似度ベクトルを基に入力顔画像と登録顔画像が一致するか否かを判定する一致判定手段を備え、
    前記ガボア・フィルタ適用手段は、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMと、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するガボア・フィルタ係数算出手段を備え、該ガボア・フィルタ係数算出手段によって算出されたガボア・フィルタ係数による前記の入力顔画像の畳み込み演算を行なう、
    ことを特徴とする顔認識装置。
  2. 前記フィルタ窓ROM、前記のフィルタの角度毎のサインROM及びコサインROMは、ガウス関数の特性、並びにサイン関数とコサイン関数の周期性に基づいて、冗長性のない最小限のROMデータを格納し、
    特徴量抽出位置を前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROM上のアドレスに変換するアドレス変換手段をさらに備え、
    前記ガボア・フィルタ係数算出手段は、前記アドレス変換手段によって特徴量抽出位置から変換されたアドレスに従って、前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROMからフィルタ窓の値並びにフィルタの角度毎の応答関数の値を読み出し、これらを乗算して該当する特徴量抽出位置におけるガボア・フィルタ係数を求める、
    ことを特徴とする請求項1に記載の顔認識装置。
  3. 前記ガボア・フィルタ適用手段は、8方向の角度からなるガボア・フィルタを適用するために、
    サイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度サインROMと、コサイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度コサインROMと、サイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度サインROMと、コサイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度コサインROMを備えるとともに、
    0度と45度、45度と90度、90度と135度、135度と180度それぞれの中心角である22.5度、67.5度、112.5度、157.5度の各想定角を、サイン関数とコサイン関数の周期性を持つ近傍の27度、63度、117度、153度の角度に近似して、サイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度67度117度153度サインROMと、コサイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度67度117度153度コサインROMを備え、
    前記の各ROMは、それぞれの角度のサイン関数又はコサイン関数から得られた値から重複を排除して、最小限のワード数からなるROMデータを格納する、
    ことを特徴とする請求項2に記載の顔認識装置。
  4. 各特徴量抽出位置において適用されるフィルタの種類を記録するフィルタ種別記録手段と、
    特徴量抽出位置毎に前記フィルタ種別記録手段における記録内容に従って前記の各ROMから該当するフィルタ係数を構成するためのフィルタ窓の値及び応答関数の値を選択的に読み出して前記ガボア・フィルタ係数算出手段に渡す選択手段と、
    をさらに備えることを特徴とする請求項2に記載の顔認識装置。
  5. 入力顔画像と登録顔画像の認識を行なう顔認識方法であって、
    認識処理の対象となる顔画像を入力する顔画像入力ステップと、
    前記の入力画像の特徴量抽出位置毎に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と画素の畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用ステップと、
    特徴量抽出位置毎に、入力顔画像のガボア・ジェットと登録顔画像のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合からなる類似度ベクトルを求める類似度演算ステップと、
    該類似度ベクトルを基に入力顔画像と登録顔画像が一致するか否かを判定する一致判定ステップを備え、
    前記ガボア・フィルタ適用ステップでは、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMを用い、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するガボア・フィルタ係数算出ステップを備え、該算出されたガボア・フィルタ係数による前記の入力顔画像の畳み込み演算を行なう、
    ことを特徴とする顔認識方法。
  6. 窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と空間データとの畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用装置であって、
    ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、
    サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、
    コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMと、
    前記の各ROMから読み出される、ガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値とを乗算して、ガボア・フィルタ係数を算出するガボア・フィルタ係数算出手段と、
    該ガボア・フィルタ係数算出手段によって算出されたガボア・フィルタ係数によって畳み込み演算を行なう畳み込み演算手段と、
    を具備することを特徴とするガボア・フィルタ適用装置。
  7. 前記フィルタ窓ROM、前記のフィルタの角度毎のサインROM及びコサインROMは、ガウス関数の特性、並びにサイン関数とコサイン関数の周期性に基づいて、冗長性のない最小限のROMデータを格納し、
    空間データの処理対象となる特徴量抽出位置を前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROM上のアドレスに変換するアドレス変換手段をさらに備え、
    前記ガボア・フィルタ係数算出手段は、前記アドレス変換手段によって特徴量抽出位置から変換されたアドレスに従って、前記フィルタ窓ROM、フィルタの角度毎のサインROM及びコサインROMからフィルタ窓の値並びにフィルタの角度毎の応答関数の値を読み出し、これらを乗算して該当する特徴量抽出位置におけるガボア・フィルタ係数を求める、
    ことを特徴とする請求項6に記載のガボア・フィルタ適用装置。
  8. サイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度サインROMと、コサイン関数により演算された0度と90度の方向に対する応答関数の値を格納する0度及び90度コサインROMと、サイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度サインROMと、コサイン関数により演算された45度と135度の方向に対する応答関数の値を格納する45度及び135度コサインROMを備えるとともに、
    0度と45度、45度と90度、90度と135度、135度と180度それぞれの中心角である22.5度、67.5度、112.5度、157.5度の各想定角を、サイン関数とコサイン関数の周期性を持つ近傍の27度、63度、117度、153度の角度に近似して、サイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度67度117度153度サインROMと、コサイン関数により演算された27度、63度、117度、153度の方向に対する応答関数の値を格納する27度67度117度153度コサインROMを備え、
    前記の各ROMは、それぞれの角度のサイン関数又はコサイン関数から得られた値から重複を排除して、最小限のワード数からなるROMデータを格納する、
    ことを特徴とする請求項7に記載のガボア・フィルタ適用装置。
  9. 各特徴量抽出位置において適用されるフィルタの種類を記録するフィルタ種別記録手段と、
    特徴量抽出位置毎に前記フィルタ種別記録手段における記録内容に従って前記の各ROMから該当するフィルタ係数を構成するためのフィルタ窓の値及び応答関数の値を選択的に読み出して前記ガボア・フィルタ係数算出手段に渡す選択手段と、
    をさらに備えることを特徴とする請求項7に記載のガボア・フィルタ適用装置。
  10. 入力顔画像と登録顔画像の認識を行なうための処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータに対し、
    認識処理の対象となる顔画像を入力する顔画像入力手順と、
    前記の入力画像の特徴量抽出位置毎に、窓にガウス関数、周波数応答にサイン関数又はコサイン関数を基底とするガボア関数によって空間表現されるガボア・フィルタの応答関数の周波数と角度を切り替えながら、該ガボア・フィルタ係数と画素の畳み込み演算を行なって、フィルタの種類に応じた個数のスカラ値からなるガボア・ジェットを求めるガボア・フィルタ適用手順と、
    特徴量抽出位置毎に、入力顔画像のガボア・ジェットと登録顔画像のガボア・ジェットの類似度を演算し、複数の特徴量抽出位置における類似度の集合からなる類似度ベクトルを求める類似度演算手順と、
    該類似度ベクトルを基に入力顔画像と登録顔画像が一致するか否かを判定する一致判定手順を実行させ、
    前記ガボア・フィルタ適用手順では、ガウス関数を演算して得られるフィルタ窓の値を格納するフィルタ窓ROMと、サイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のサインROMと、コサイン関数を演算して得られる応答関数の値を格納するフィルタの角度毎のコサインROMを用い、これらのROMから読み出されるガウス関数を演算して得られる値とサイン関数並びにコサイン関数を演算して得られる値を乗算してガボア・フィルタ係数を算出するガボア・フィルタ係数算出手順を実行して、該算出されたガボア・フィルタ係数による前記の入力顔画像の畳み込み演算を行なう、
    ことを特徴とするコンピュータ・プログラム。
JP2006339748A 2006-12-18 2006-12-18 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム Pending JP2008152530A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006339748A JP2008152530A (ja) 2006-12-18 2006-12-18 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム
US11/950,929 US8077932B2 (en) 2006-12-18 2007-12-05 Face recognition apparatus, face recognition method, gabor filter application apparatus, and computer program
CN2007101611089A CN101206715B (zh) 2006-12-18 2007-12-18 面部识别设备、方法、Gabor滤波器应用设备和计算机程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006339748A JP2008152530A (ja) 2006-12-18 2006-12-18 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2008152530A true JP2008152530A (ja) 2008-07-03

Family

ID=39527308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006339748A Pending JP2008152530A (ja) 2006-12-18 2006-12-18 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム

Country Status (3)

Country Link
US (1) US8077932B2 (ja)
JP (1) JP2008152530A (ja)
CN (1) CN101206715B (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2175622A1 (en) 2008-10-07 2010-04-14 Sony Corporation Information processing device, information processing method and storage medium storing computer program
WO2010044214A1 (ja) * 2008-10-14 2010-04-22 パナソニック株式会社 顔認識装置および顔認識方法
JP2010204947A (ja) * 2009-03-03 2010-09-16 Toshiba Corp オブジェクト検出装置、オブジェクト検出方法、及び、プログラム
JP2013506919A (ja) * 2009-10-02 2013-02-28 クゥアルコム・インコーポレイテッド オクルージョン耐性のある顔認識のための方法およびシステム
KR101931271B1 (ko) * 2018-05-11 2018-12-20 주식회사 다통솔루션 싱글 포워드 패스를 이용한 얼굴 인식 방법 및 이를 위한 장치

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4321645B2 (ja) * 2006-12-08 2009-08-26 ソニー株式会社 情報処理装置および情報処理方法、認識装置および情報認識方法、並びに、プログラム
KR100888476B1 (ko) * 2007-02-15 2009-03-12 삼성전자주식회사 얼굴이 포함된 영상에서 얼굴의 특징을 추출하는 방법 및장치.
US8224042B2 (en) * 2009-03-12 2012-07-17 Seiko Epson Corporation Automatic face recognition
US9898675B2 (en) 2009-05-01 2018-02-20 Microsoft Technology Licensing, Llc User movement tracking feedback to improve tracking
WO2011119117A1 (en) * 2010-03-26 2011-09-29 Agency For Science, Technology And Research Facial gender recognition
US9396539B2 (en) 2010-04-02 2016-07-19 Nokia Technologies Oy Methods and apparatuses for face detection
US20110296352A1 (en) * 2010-05-27 2011-12-01 Microsoft Corporation Active calibration of a natural user interface
JP5652227B2 (ja) * 2011-01-25 2015-01-14 ソニー株式会社 画像処理装置および方法、並びにプログラム
KR20130012297A (ko) * 2011-07-25 2013-02-04 삼성전자주식회사 병변 검출 장치, 병변 검출 방법 및 병변 진단 장치
CN103257712A (zh) * 2013-05-30 2013-08-21 苏州福丰科技有限公司 基于面部识别的阅读标记终端
US9363093B2 (en) * 2014-03-21 2016-06-07 International Business Machines Corporation Utilizing eye tracking to determine attendee engagement
WO2015145589A1 (ja) 2014-03-25 2015-10-01 富士通フロンテック株式会社 生体認証装置、生体認証方法、及びプログラム
EP3125192B1 (en) 2014-03-25 2023-05-10 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
EP3125194B1 (en) * 2014-03-25 2021-10-27 Fujitsu Frontech Limited Biometric authentication device, biometric authentication method, and program
CN104462915A (zh) * 2014-11-27 2015-03-25 柳州市网中网络策划中心 具有滤波的因特网管理系统
CN105138973B (zh) * 2015-08-11 2018-11-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105224919B (zh) * 2015-09-11 2019-02-26 深圳Tcl新技术有限公司 纹理特征提取方法及装置
CN105528595A (zh) * 2016-02-01 2016-04-27 成都通甲优博科技有限责任公司 在无人机航拍图像中对输电线路绝缘子的识别定位方法
CN106326868A (zh) * 2016-08-26 2017-01-11 江苏华通晟云科技有限公司 基于余弦相似度度量学习的人脸识别方法
CN106600855A (zh) * 2016-12-22 2017-04-26 河南牧业经济学院 基于面部识别的支付装置和方法
CN106845427B (zh) * 2017-01-25 2019-12-06 北京深图智服技术有限公司 一种基于深度学习的人脸检测方法和装置
CN111461022A (zh) * 2020-04-01 2020-07-28 北京心智计算科技有限公司 一种基于人工智能技术的皮纹识别系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619956A (ja) * 1992-06-30 1994-01-28 Kao Corp 高速演算装置および方法,信号解析システム,ならびに計測装置および方法
JP2006004003A (ja) * 2004-06-15 2006-01-05 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826300B2 (en) * 2001-05-31 2004-11-30 George Mason University Feature based classification
KR100941209B1 (ko) 2001-08-23 2010-02-10 소니 주식회사 로봇 장치, 얼굴 인식 방법 및 얼굴 인식 장치
JP4363095B2 (ja) 2003-07-01 2009-11-11 コニカミノルタエムジー株式会社 医用画像処理装置及び医用画像処理システム
CN100356387C (zh) * 2004-05-17 2007-12-19 香港中文大学 基于随机采样的面部识别方法
JP2006004041A (ja) 2004-06-16 2006-01-05 Matsushita Electric Ind Co Ltd 物体画像抽出装置および物体画像抽出方法
WO2006023046A1 (en) * 2004-06-21 2006-03-02 Nevengineering, Inc. Single image based multi-biometric system and method
JP4574249B2 (ja) * 2004-06-29 2010-11-04 キヤノン株式会社 画像処理装置及びその方法、プログラム、撮像装置
CN100397410C (zh) * 2005-12-31 2008-06-25 北京中星微电子有限公司 基于视频的面部表情识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619956A (ja) * 1992-06-30 1994-01-28 Kao Corp 高速演算装置および方法,信号解析システム,ならびに計測装置および方法
JP2006004003A (ja) * 2004-06-15 2006-01-05 Sony Corp 画像処理装置および方法、記録媒体、並びにプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2175622A1 (en) 2008-10-07 2010-04-14 Sony Corporation Information processing device, information processing method and storage medium storing computer program
US8319818B2 (en) 2008-10-07 2012-11-27 Sony Corporation Information processing device, information processing method and storage medium storing computer program
WO2010044214A1 (ja) * 2008-10-14 2010-04-22 パナソニック株式会社 顔認識装置および顔認識方法
JP2010204947A (ja) * 2009-03-03 2010-09-16 Toshiba Corp オブジェクト検出装置、オブジェクト検出方法、及び、プログラム
JP2013506919A (ja) * 2009-10-02 2013-02-28 クゥアルコム・インコーポレイテッド オクルージョン耐性のある顔認識のための方法およびシステム
KR101931271B1 (ko) * 2018-05-11 2018-12-20 주식회사 다통솔루션 싱글 포워드 패스를 이용한 얼굴 인식 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
CN101206715A (zh) 2008-06-25
CN101206715B (zh) 2010-10-06
US8077932B2 (en) 2011-12-13
US20080144941A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
JP2008152530A (ja) 顔認識装置及び顔認識方法、ガボア・フィルタ適用装置、並びにコンピュータ・プログラム
JP7490141B2 (ja) 画像検出方法、モデルトレーニング方法、画像検出装置、トレーニング装置、機器及びプログラム
JP2008191816A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP5771413B2 (ja) 姿勢推定装置、姿勢推定システム、および姿勢推定方法
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
JP5715833B2 (ja) 姿勢状態推定装置および姿勢状態推定方法
US20200272806A1 (en) Real-Time Tracking of Facial Features in Unconstrained Video
US20140043329A1 (en) Method of augmented makeover with 3d face modeling and landmark alignment
US10515636B2 (en) Speech recognition using depth information
WO2015016988A1 (en) Object recognition and tracking using a classifier comprising cascaded stages of multiple decision trees
KR101647803B1 (ko) 3차원 얼굴모델 투영을 통한 얼굴 인식 방법 및 시스템
JP2018022360A (ja) 画像解析装置、画像解析方法およびプログラム
JP2009015614A (ja) 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
JP7064257B2 (ja) 画像深度確定方法及び生き物認識方法、回路、装置、記憶媒体
US11017262B2 (en) Method and device to determine image features using multi-resolution gradient analysis
WO2018176281A1 (zh) 一种素描图像的生成方法及装置
WO2013122009A1 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
Raghavendra et al. 3d face reconstruction and multimodal person identification from video captured using smartphone camera
US20220130175A1 (en) Method and apparatus for detecting liveness based on phase difference
WO2014006786A1 (ja) 特徴量抽出装置および特徴量抽出方法
WO2021026281A1 (en) Adaptive hand tracking and gesture recognition using face-shoulder feature coordinate transforms
Ren et al. A non-contact sleep posture sensing strategy considering three dimensional human body models
CN113744339B (zh) 生成全景图像的方法、装置、电子设备和存储介质
CN112016495A (zh) 人脸识别的方法、装置和电子设备
CN113837053B (zh) 生物面部对齐模型训练方法、生物面部对齐方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111108