JP4375570B2 - 顔認識方法およびシステム - Google Patents

顔認識方法およびシステム Download PDF

Info

Publication number
JP4375570B2
JP4375570B2 JP2006212710A JP2006212710A JP4375570B2 JP 4375570 B2 JP4375570 B2 JP 4375570B2 JP 2006212710 A JP2006212710 A JP 2006212710A JP 2006212710 A JP2006212710 A JP 2006212710A JP 4375570 B2 JP4375570 B2 JP 4375570B2
Authority
JP
Japan
Prior art keywords
face
image
metadata
index
reliability index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006212710A
Other languages
English (en)
Other versions
JP2006344236A (ja
Inventor
俊男 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006212710A priority Critical patent/JP4375570B2/ja
Publication of JP2006344236A publication Critical patent/JP2006344236A/ja
Application granted granted Critical
Publication of JP4375570B2 publication Critical patent/JP4375570B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、顔同定や顔識別、顔の表情認識、顔による男女識別、顔による年齢判別等に利用可能な技術に係り、特に静止画像や動画像に映されている顔情報に関するメタデータを生成する顔メタデータ生成および顔認識技術に関する。
メタデータとは、一般に、データの意味を記述あるいは代表するデータのことであり、顔認識の場合には、主に静止顔画像や動画像などの顔データに関するデータを意味する。
映像・画像や音声などのマルチメディアコンテンツに対するメタデータの標準化活動として、MPEG-7(MPEG(Moving Pictures Experts Group)によって標準化されたマルチメディアコンテンツ記述インタフェースの国際標準規格,ISO/IEC 15938)の活動が広く知られている。この中で顔認識に関するメタデータの記述子として、顔認識記述子が提案されている(非特許文献1)。
この顔認識記述子では、切り出して正規化した顔画像に対して、一般的に固有顔と呼ばれる部分空間法の一種を用いて、顔画像の特徴量を抽出するための基底行列を求め、この基底行列によって画像中から顔特徴量を抽出し、これをメタデータとする。また、この顔特徴量に対する類似度として重み付け絶対値距離を用いることを提案している。
また、顔認識に関する技術には様々な方法があることが知られており、例えば、主成分分析(非特許文献2)あるいは判別分析(非特許文献3)に基づく固有顔による方法などが知られている。
また、指紋画像から得られた特徴量に対して部分空間法を適用する際に、品質指標を導入し適応的にパターン間の距離を測る方法がある(非特許文献4、特許文献1)。
A. Yamada他編, "MPEG-7 Visual part of eXperimental Model Version 9.0," ISO/IEC JTC1/SC29/WG11 N3914, 2001 Moghaddam他,"Probalilistic Visual Learning for Object Detection",IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 696-710, 1997 W. Zhao他, "Discriminant Analysis of Principal Components for Face Recognition," Proceedings of the IEEE Third International Conference on Automatic Face and Gesture Recognition, pp. 336-341, 1998 T. Kamei and M. Mizoguchi, "Fingerprint Preselection Using Eigenfeatures," Proceedings of the 1998 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp.918-923, 1998, C.M. Bishop, "Neural Networks for Pattern Recognition", Oxford University Express, 1995 特開平10−177650号公報
しかしながら、上記従来の技術では、十分な顔認識の精度を得られなかった。そこで、本発明の目的は、顔認識の精度を向上させることが可能な顔メタデータ生成技術および顔類似度算出技術を提供し、さらに実用的な顔のマッチングシステムを構築するための技術を提供することにある。
本発明によれば、顔画像から信頼性を抽出して、その信頼性に応じて適応的にパターン間の類似度を算出することで、顔認識の精度を向上させることができる。
本発明による顔認識システムは、画像を入力する画像入力部と、顔画像を蓄積する顔画像データベース部と、を有する顔認識システムであって、前記画像から抽出した顔特徴量と前記画像から抽出したコントラスト指標あるいは非対称性指標である信頼性指標とを顔メタデータとして出力する顔メタデータ生成部と、前記顔メタデータ生成部によって生成された顔メタデータを蓄積する顔メタデータ蓄積部と、信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力する顔類似度算出部と、入力された指令に応じて、前記顔メタデータ生成部、前記顔メタデータ蓄積部および前記顔類似度算出部を制御し、顔画像マッチングを実行する制御部と、を備えたことを特徴とする。
本発明による顔認識方法は、画像を入力する画像入力部と顔画像を蓄積する顔画像データベース部とを有するシステムにおける顔認識方法であって、前記画像から抽出した顔特徴量と前記画像から抽出したコントラスト指標あるいは非対称性指標である信頼性指標とを顔メタデータとして出力し、前記顔メタデータ生成部によって生成された複数の顔メタデータを顔メタデータ蓄積部に蓄積し、ある顔画像の顔メタデータと前記顔メタデータ蓄積部に蓄積された複数の顔メタデータの各々とを入力し、信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力し、前記顔類似度に従って顔画像マッチング結果を出力する、ことを特徴とする。
本発明によれば、画像から抽出した顔特徴量とコントラスト指標あるいは非対称性指標である信頼性指標とを顔メタデータとして出力し、信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力することにより、高精度の顔画像マッチングを達成することができる。
(発明の原理)
はじめに本発明の原理について説明する。一般に、パターン認識を行う際、認識を行いたいクラスに対する学習データを大量に用意することが可能であるならば、その学習データに対する統計解析に基づいてパターンの分布関数を推定し、パターン認識機構を構築することができる。しかしながら、顔認識応用の場合、個人毎には1枚だけの登録画像しか得られず、ごく少数の登録画像しか許されないことが多い。
このような場合であっても、顔の特徴ベクトルに対して信頼性指標という指標を与え、その指標に基づくクラスを考えることで、その信頼性指標に対するクラスの統計解析を行いパターンの分布関数を推定することで、一枚の登録画像しか得られないような顔認識応用に対しても信頼性指標を通じた分布関数に基づくパターン認識機構を構築することができる。
以下、誤差分布に基づく場合のマハラノビス距離とクラス内分布やクラス間分布に基づく判別距離についての顔認識の原理について説明する。
いま、ある一人の顔を観測する場合を考える。誤差がない場合に顔画像から得られる特徴ベクトルをv0とし、実際に観測 される観測ベクトルvは、誤差ベクトルεが重畳しているとする(数1)。
Figure 0004375570
ここで、特徴ベクトルv0を2回観測するとすれば、二つの観測ベクトルv1とv2が得られる(数2)。
Figure 0004375570
いま、誤差ベクトルε1、誤差ベクトルε2に対して相関を持つ信頼性指標θ1、信頼性指標θ2がそれぞれ得られ、その事後分布がp(ε|θ1)、p(ε|θ2)であるとする。
このような分布が得られたときのv1とv2の差ベクトルsの事後分布がp(s|θ12)と表されるとすれば、パターン間の類似度d(v1,v2)として、次の対数尤度を用いることができる。
Figure 0004375570
事後分布p(ε|θ1)、p(ε|θ2)がそれぞれ正規分布であるとすると、差ベクトルsの分布p(s|θ1, θ2)も正規分布となる。ここで、誤差ベクトルの事後分布p(ε|θi) (i=1,2)として平均0で共分散行列Σε(θi)の正規分布を考えると、差ベクトルsの分布は、平均0で、共分散行列Σs1, θ2)は次式(数4)となる。
Figure 0004375570
つまり、事後分布p(s|θ1, θ2)は次式(数5)で表される。
Figure 0004375570
従って、(数3)は、次式(数6)に示すように、共分散行列Σε(θ1)やΣε(θ2)を用いて、信頼性指標θ1,やθ2に対して適応的なマハラノビス距離に書き表すことができる。
Figure 0004375570
誤差ベクトルの各要素間における独立性を仮定すれば、(数5)は次式(数7)となる。
Figure 0004375570
ここで、σs,k1, θ2)2は共分散行列Σs1, θ2)のk番目の対角要素であり、つまり、観測誤差の分散である。また、σε,k1)2、σε,k2)2は、それぞれ共分散行列Σε(θ1)、Σε(θ2)のk番目の対角要素である。skは差ベクトルsのk番目の要素である。
このように正規分布を仮定することで、(数3)は、次式(数8)のように各特徴ベクトルの要素毎の分散σε,k1)、σε,k2)を用いて、信頼性指標θ1やθ2に対して適応的なマハラノビス距離によって類似度を定義することができる。
Figure 0004375570
ここで、v1,k、v2,kはそれぞれ特徴ベクトルv1、v2のk番目の要素である。
上記説明では事後分布p(s|θ1, θ2)として正規分布を仮定したが、以下、混合正規分布を仮定する。さて、事後分布p(s|θ1, θ2)として、次式(数9)によって示すように、正規分布p(s|θ1, θ2, j) (j=1,2,...,M)の和によって事後分布p(s|θ1, θ2)が表現できると仮定する。
Figure 0004375570
従って、次式(数10)により適応的混合マハラノビス距離を定義することができる。
Figure 0004375570
事後分布p(s|θ1, θ2, j)の共分散行列Σs1, θ2, j)およびP(j)の推定については、一般的な推定方法である最尤推定法やEMアルゴリズムを用いて推定することができる(非特許文献5を参照)。
混合正規分布を仮定することで、分布をより正確に近似でき、マッチング性能が向上するが、大量の学習データが必要になるとともに演算量もまた大幅に増加する。
前述の誤差分布に基づくマハラノビス距離は、検索する顔が他の登録されている顔データの中でどれに最も近いかを調べる顔同定(face identification)のような問題に対して優れている距離である。
一方、顔識別(face verification)の問題では、入力された顔が登録された画像との同一性を判定する上で、受け入れるか、棄却するかが重要な問題である。以下で説明する「判別距離」と名付ける距離は、この顔識別問題に対しては 前述のマハラノビス距離を用いる場合よりも、優れた類似度尺度となっている。
いま、顔の二つの特徴ベクトルvが、一致すると判定すべき、つまり、二つの特徴ベクトルが同一クラス内に属している(例えば、二つの特徴ベクトルが同じ人物の顔データである)ならば、それらの特徴ベクトルの組み合わせはクラスWに属しているとする。また、二つの特徴ベクトルvが不一致と判定すべき、つまり、クラス間の特徴ベクトルである(例えば、二つの特徴ベクトルが異なった人物の顔データである)ならば、それらの組み合わせはクラスBに属しているとする。
二つの特徴ベクトルv1、v2に対して信頼性指標θ1、θ2が得られるとする。差ベクトルsと二つの信頼性指標θ1、θ2(以下、二つの信頼性指標のセットを[θi]と表記する。)が観測されたときに一致している と見倣すクラスWと不一致と見倣すべきクラスBとの判別問題を考えると、次式(数11)の判別則(decision rule)が得られる。
Figure 0004375570
上記(数11)の左辺は、ベイズ定理(Bayes Theorem)によって次式(数12)のように書き直すことができる。
Figure 0004375570
ここで、W、Bと[θi]の生じる確率は独立であると仮定して、P(W,[θi])=P(W)P([θi])、P(B,[θi])=P(B)P([θi])としている。
パターン間の距離d(v1,v2)として(数12)の対数尤度を計算することで、次式(数13)のように、顔識別問題に適した類似度を求めることができる。
Figure 0004375570
個別のマッチング毎に事前確率P(W)、P(B)が異なり、且つ、それを知ることができるならば、(数13)の第2項を計算することが望ましい。しかし、多くの場合、個別のマッチング毎に事前確率を知ることができないので、事前確率は一定と仮定することで、第2項を一定と見倣し、類似度の計算からは除外する。
事後確率P(s|W,[θi])、P(s|B,[θi])を、それぞれクラス内分布pW(s|[θi])、クラス間分布pB(s|[θi])と書き代えると、次式(数14)となる。
Figure 0004375570
次に、クラス内分布pW(s|[θi])、クラス間分布pB(s|[θi])がそれぞれ正規分布であると仮定し、その平均がそれぞれ0、共分散行列がそれぞれΣW([θi])、ΣB([θi])とすれば、事後分布はそれぞれ次式(数15)で書き表すことができる。
Figure 0004375570
上式を(数14)に代入すると(但し、(数14)の第2項は省略)、次式(数16)で示す距離を得ることができる。これを「適応的判別距離」と呼ぶことにする。
Figure 0004375570
差ベクトルsの各要素間における独立性を仮定すれば、(数15)は、次式となる。
Figure 0004375570
ここで、σW,ki)2、σB,ki)2は、それぞれ共分散行列ΣWi)、ΣBi)のk番目の対角要素であり、つまり、クラス内分散とクラス間分散に相当する。skは差ベクトルsのk番目の要素である。
このように正規分布を仮定することで(数16)は、次式(数18)のように、各特徴ベクトルの要素毎のクラス内分散σW,ki)2、クラス間分散σB,ki)2を用いて、信頼性指標[θi]に対して適応的な判別距離による類似度を定義することができる。
Figure 0004375570
上記までの説明ではクラス内分散σW,ki)2、クラス間分散σB,ki)2として 正規分布を仮定したが、以下では混合分布を仮定する。
次式(数19)のように、クラス内分布pW(s|[θi])、クラス間分布pB(s|[θi])として、それぞれ正規分布pW(s|[θi], jW) (jW=1,2,...,MW)、pB(s|[θi], jB) (jB=1,2,...,MB)の和によって事後分布が表現できると仮定する。
Figure 0004375570
従って、この対数尤度を用いて次式(数20)の適応的混合マハラノビス距離を導くことができる。
Figure 0004375570
クラス内分布pW(s|[θi], jW)、クラス間分布pB(s|[θi], jB)の共分散行列ΣW(s|[θi], jW)、ΣB(s|[θi], jB)および P(jW)、P(jB)の推定については、最尤推定法やEMアルゴリズムを用いて推定することができる。
混合分布を仮定することで、分布をより正確に近似でき、マッチング性能を 向上させることができるが、同時に大量の学習データが必要になるとともに、演算量も大幅に増加する。
このように顔特徴量に対してさらに信頼性指標を抽出することによって、信頼性指標に対して適応的な距離規範を導くことができ、高精度な顔認識機構を構築することができる。なお、上記では、特徴ベクトルに対する信頼性指標をスカラー量(一つの成分のみ)か、ベクトル量(複数の成分をもつ)か特定していないが、どちらの場合でも成立する議論であり、複数の要素を用いることで、性能の向上が期待できる。
具体的な信頼性指標については、実験的に有効な信頼性指標を発見することが必要であり、顔認識の場合では、画像のコントラストを表すコントラスト指標や、正面顔の認識では、照明変動や姿勢変動によって生じる顔画像の左右の対称性の歪みからの量を表す非対称指標を用いると高い効果が得られ、それらの信頼性指標を組み合わせてベクトル量とすることで、より精度の向上が期待できる。
(実施の形態)
図1は、本発明の一実施形態による顔画像マッチングシステムを示すブロック図である。以下、顔画像マッチングシステムについて詳細に説明する。
図1に示すように、本発明による顔画像マッチングシステムには、顔画像を入力する顔画像入力部11と、入力された顔画像からそれらの顔特徴量、信頼性指標の顔メタデータを生成する顔メタデータ生成部12と、抽出された顔メタデータを蓄積する顔メタデータ蓄積部13と、顔メタデータから顔の類似度を算出する顔類似度算出部14と、顔画像を蓄積する顔画像データベース15と、画像の登録要求・検索要求に応じて、画像の入力・メタデータの生成・メタデータの蓄積・顔類似度の算出の制御を行う制御部16と、顔画像や他の情報を表示するディスプレイの表示部17と、が設けられている。
また、顔メタデータ生成部12は、入力された顔画像から顔特徴を抽出する顔特徴抽出部121と、信頼性指標を抽出する信頼性指標抽出部122とから構成され、顔類似度算出部14は、信頼性指標から事後分布に関するパラメータ情報を推定する分布推定部141と顔特徴量と分布推定部141からの事後分布情報から顔特徴量間の距離を算出する距離算出部142によって構成される。
登録時には、画像入力部11では、スキャナあるいはビデオカメラなどで顔写真等を顔の大きさや位置を合わせた上で入力する。あるいは、人物の顔を直接ビデオカメラなどから入力しても構わない。この場合には、前述のMoghaddamの文献に示されているような顔検出技術を用いて、入力された画像の顔位置を検出し、顔画像の大きさ等を自動的に正規化する方がよいであろう。
また、入力された顔画像は必要に応じて顔画像データベース15に登録する。顔画像登録と同時に、顔メタデータ生成部12によって顔メタデータを生成し、顔メタデータ蓄積部13に蓄積する。
検索時には同様に顔画像入力部11によって顔画像を入力し、顔メタデータ生成部12にて顔メタデータを生成する。生成された顔メタデータは、一旦 顔メタデータ蓄積部13に登録するか、または、直接に顔類似度算出部14へ送られる。検索では、予め入力された顔画像がデータベース中にあるかどうかを確認する場合(顔同定)には、顔メタデータ蓄積部13に登録されたデータの一つ一つとの類似度を算出する。最も類似度が高い(距離値が小さい)結果に基づいて制御部16では、顔画像データベース15から、顔画像を選び、表示部17等に顔画像の表示を行い、検索画像と登録画像における顔の同一性を作業者が確認する。
一方、予めID番号等で特定された顔画像と検索の顔画像が一致するかどうかを確認する場合(顔識別)では、特定されたID番号の顔画像と一致するか否かを顔類似度算出部14にて計算し、予め決められた類似度よりも類似度が低い(距離値が大きい)場合には一致しないと判定し、類似度が高い場合には一致すると判定し、その結果を表示部17に表示する。このシステムを入室管理用に用いるならば、表示する代わりに、制御部16から自動ドアに対して、その開閉制御信号を送ることで、自動ドアの制御によって入室管理を行うことができる。
上記のように、顔画像マッチングシステムは動作するが、このような動作はコンピュータシステム上で実現することもできる。たとえば、次に詳述するようなメタデータ生成を実行するメタデータ生成プログラムおよび類似度算出を実行する類似度算出プログラムをそれぞれメモリに格納しておき、これらをプログラム制御プロセッサによってそれぞれ実行することで顔画像マッチングを実現することができる。
次に、この顔画像マッチングシステムの動作、特に顔メタデータ生成部12と顔類似度算出部14について詳細に説明する。
(1)顔メタデータ生成
顔メタデータ生成部12では、位置と大きさを正規化した画像I(x, y)を用いて、顔特徴量を抽出する。位置と大きさの正規化は、例えば、目位置が(16, 24)、(31, 24)、サイズが46×56画素となるように画像を正規化しておくとよい。以下では、このサイズに画像が正規化されている場合について説明する。
顔特徴量として、所謂、固有顔の手法(前述Moghaddamの論文)を用いて特徴抽出する。つまり、画像中の画素値を要素とする特徴ベクトルΛに対して、顔画像サンプル集合[Λ]の主成分分析によって得られた基底ベクトルの中から選択した部分基底ベクトルによって特定される基底行列Uと、顔画像サンプル集合[Λ]における平均ベクトルである平均顔Ψとを用いて、特徴ベクトルv=UT(Λ−Ψ)を算出し特徴ベクトルとする。このように、入力画像ではなく、部分基底ベクトルを用いることで、入力画像のデータ量を削減することができる。このようにデータ量を削減することは、メタデータベースにおける蓄積量を少なくするだけではなく、高速なマッチングを実現するためには重要な要素である。この特徴ベクトルの次元数としては、例えば、48次元の特徴量を用いればよい。
このように一般的に用いられる固有顔による手法の他に、主成分分析に対して判別分析を組み合わせた手法(前述、W. Zhaoの論文)等を用いて部分基底ベクトルを規定しても構わない。
また、前述したような顔画像サンプルにおける特徴ベクトル集合[Λ]の主成分分析や判別分析によって得られる基底ベクトルの中から選択した部分基底ベクトルによって特定される基底行列Unと、顔画像を左右反転される画素値の変換と対応するように基底ベクトルの要素を入 れ換えた反転部分基底ベクトルによって特定される基底行列Umの線形和によって得られる行列U(= aUn + bUm)を基底行列として、顔特徴ベクトルを抽出してもよい。例えばa=b=1とすると、得られる顔特徴ベクトルは、入力画像空間で左右の変換に対して対称な成分のみを抽出 することができる。顔は本来左右対称であるので、照明の影響で非対称となった画像成分や顔の向きが正面に向いていないために生じる非対称成分が本来ノイズに相当するものであるので、これを除去し、対称な成分のみを抽出することで、照明や姿勢の変動に対して安定な顔特徴量を抽出することが可能となる。
また、画像をフーリエ変換し、得られた複素フーリエ成分の各成分の大きさを要素とするベクトルを特徴ベクトルΛとして算出し、上記のような主成分分析や判別分析によって次元圧縮を行い顔特徴量を抽出してもよい。このように画像をフーリエ変換することで、位置ずれに対して強い顔特徴量を抽出することができる。このようにして、顔特徴抽出部121では、顔特徴量vを抽出する。
信頼性指標抽出部122では、顔特徴量vの信頼性指標として有効なコントラスト指標θcontrastと非対称性指標θasymmetricを抽出する。コントラスト指標θcontrastとして、顔画像 I(x,y)の画素値の標準偏差を次式(数21)によって計算する。
Figure 0004375570
ここでround()は数値の丸め処理を意味する。このように抽出された信頼性指標θcontrastを[0,1,2,...,15]の4 bitの範囲に収まるように、値域を越えるものは値を制限する。なお、上記ではコントラスト指標として、画像の標準偏差を計算したが、分散や画像中の画素値の最大値と最小値の差を抽出してもよい。画像中の画素値の最大値と最小値による コントラスト指標は、標準偏差や分散による場合よりも演算量が少ないが、効果は相対的に小さい。
非対称性指標θasymmetricとして、顔画像 I(x,y)とその反転画像との間の差分の絶対値(1乗)の平均を次式(数22)により抽出する。
Figure 0004375570
このように抽出された信頼性指標θasymmetricを[0,1,2,...,15]の4 bitの範囲に収まるように値域を越えるものは値を制限する。なお、上記では非対称指標として、絶対値による値(1乗)を用いたが差分の2乗等を用いてもよい。また、平均の代わりに、和等の値を用いても同等の効果を得ることができる。また、差分の最大値を検出して、その値を非対称指標として用いれば演算量が少なくて済む。
信頼性指標抽出部122では、顔画像に対して、特徴ベクトルvと信頼性指標θcontrastと信頼性指標θasymmetricを抽出し、顔メタデータとして出力する。前述したように、上記顔メタデータ生成手順をコンピュータプログラムによってコンピュータに実行させることもできる。
(2)顔類似度算出
次に、顔類似度算出部14の動作について説明する。顔類似度算出部14では、二つの顔メタデータの信頼性指標θcontrast,1、θconstrast,2とθasymmetric,1、θasymmetric,2を用いて、分布推定部141が事後分布に関するパラメータ情報を推定し、二つの顔メタデータの二つの特徴ベクトルv1、v 2と事後分布に関するパラメータ情報とを用いて距離算出部142が顔特徴間の類似度dを算出する。
ここでは、(数8)あるいは(数18)によって顔の類似度を計算する場合について説明する。
(数8)あるいは(数18)にて表記されている信頼性指標θ1、θ2は本実施形態ではベクトルであり、それぞれの要素はθ1 = (θcontrast,1, θasymmetric,1)T、θ2 = (θcontrast,2, θasymmetric,2)Tとなる。コントラスト指標、非対称性指標はそれぞれ4bitで表現されているので、θiのとり得る状態は256個の状態となる。与えられた信頼性指標θiによって、256個の状態の中の一つの状態が特定できる。
分布推定部141では、後述するように、予め求めておいた信頼性指標θ(256個の状態がある)に対する差ベクトルの分散値σε, k(θ)や分散値σW,k(θ)、分散値σB,k (θ)をテーブルに記憶しておき、信頼性指標θ1およびθ2を用いて、それぞれの分散値テーブルの値を参照し、得られた分散値を事後分布情報として、距離算出部142に引き渡す。なお、顔同定の場合には、(数8)で必要な分散値σε,k1)、分散値σε,k2)の値を距離算出部142に出力すればよく、顔識別の場合には、(数18)に必要な分散値σW,k(θ)、分散値σB,k(θ)を出力する。
距離算出部142では、(数8)あるいは(数18)に従って適応的マハラノビス距離あるいは適応的判別距離を算出し、類似度dとして出力する。
前述した分散値テーブルの分散値は、予め用意した顔画像データサンプルを用いて計算しておく。顔画像サンプルにおける特徴ベクトル集合[vi]とその信頼性指標[θi]から、それぞれの分散値は次のように計算できる。
Figure 0004375570
Figure 0004375570
ここで、"(i, j)がクラスWに属する"とは、データiとデータjが同一クラス(同一人物)から得られたデータである(クラス内である)ことを意味し、"(i, j)がクラスBに属する"とは、データiとデータjが異なるクラス(異なる人物)から得られたデータである(クラス間である)ことを意味する。また、Nε(θ)、NW(θ)、NB(θ)はそれぞれのクラスに属するデータの組み合わせの数である。このようにθのビン毎に分散値を計算する際に、そのデータ数が少な過ぎる場合には、近傍のビンのデータを併合するようにして、サンプル数を確保するようにする(これは、分布推定におけるk近傍法(前述Bishop の文献,pp.53)によってbinを併合するのと同様な手法である)。
ここで、(数18)の場合、(数4)と同様に、σW,k([θi])2 = σW,k1)2 + σW,k2)2、および、σB,k([θi])2 = σB,k1)2B,k2)2となることに注意されたい。
なお、誤差分散σε,k(θ)2とクラス内分散σW,k(θ)2が同じになるので、顔画像マッチングシステムで(数8)と(数18)の両方の距離を計算する場合には、これらの分散値テーブルを共有して構わない。
また、誤差分布とクラス間分布は強い相関がある場合が多いので、誤差分 散σε,k(θ)2の代わりにクラス間分散σB,k(θ)2を用いても、信頼性指標を用いない場合よりは精度が向上する(しかし、誤差分散を用いた方が精度が良い)。
このように顔メタデータ間の類似度を信頼性指標θcontrastや信頼性指標θasymmetricを介した事後分布情報を用いて算出することで、精度のよい顔認識を行うことが可能である。前述したように、上記顔類似度算出手順をコンピュータプログラムによってコンピュータに実行させることもできる。
なお、ここでは(数8)と(数18)を用いて、類似度を計算しているが、次のような様々な計算方法によって近似的に計算し、高速化等を図ることもできる。
Figure 0004375570
Figure 0004375570
上記各式の右辺第二項(lnの部分)を計算しないことで、さらなる高速演算を図ることができる。
また、(数6)や(数16)によって類似度を計算する場合も、基本的には同様に予め用意した顔画像データサンプルから、それぞれの計算に必要な差ベクトルの誤差の共分散行列Σε(θ)や差ベクトルのクラス内の共分散行列ΣW(θ)、クラス間の共分散行列ΣB(θ)を算出して、共分散テーブルとして用意しておき、類似度計算の際にその共分散テーブルを参照するようにすればよい。この方法は共分散行列を用いて距離を計算するために演算量が増加するが、十分な学習サンプルがある場合には類似度計算の精度を向上させることができる。
(数3)の事後分布や(数14)のクラス間分布、クラス間分布に対して混合正規分布を仮定して、分布関数を推定することで、それぞれ(数10)や(数20)の適応的混合マハラノビス距離や適応的混合判別距離を計算してもよい。この場合も、分散や共分散行列を用いて、事後分布情報を計算するのと同様に顔画像データサンプルから、混合正規分布を表す共分散行列Σs1, j)、P(j)等の混合分布を特定するパラメータを求めておき、テーブルとして記憶しておけばよい。なお、この推定については、一般的な推定方法である最尤推定法やEMアルゴリズムを用いて推定すればよい。
ここまでの説明では、一枚の顔画像が登録され、一枚の顔画像を用いて検索する場合について説明したが、一人の顔に対して複数の画像が登録され、一枚の顔画像を用いて検索する場合には、例えば、次のようにすればよい。
検索側の特徴ベクトルをvqueとし、登録側の特徴ベクトルをvreg,kとし、複数画像登録の場合の類似度dmulti(vque, [vreg,1, vreg,2, ... ,vreg,n])として、次式(数27、数28)に示す計算式に基づき類似度を計算すればよい。
Figure 0004375570
あるいは、
Figure 0004375570
同様に1つの顔当たりの複数枚の画像登録と複数画像による検索の場合も、各組み合わせの類似度の平均や最小値を求め類似度を算出することで、一つの顔データに対する類似度を算出することができる。これは、動画像を複数画像と見倣すことで、本発明のマッチングシステムを動画像における顔認識に対しても適用できることを意味する。
また、上記説明では、同一人物の顔の同定や顔の識別を中心に説明したが、例えば、男性の顔を一つのカテゴリー、女性の顔を一つのカテゴリーと考えて、それぞれの分布に関する情報を求め、男女の顔を識別する性別識別を行ったり、笑った顔、怒った顔、悲しい顔などの表情のカテゴリーを考えて、顔の表情を認識する表情認識に適用することも可能である。10代、20代、30代、40代というようにカテゴリーを設定し、そのカテゴリー毎に誤差分布、クラス内分布やクラス間分布を求めることで、年齢判別を行うことも可能であり、様々な顔認識に対して本発明を適用することが可能である。
本発明の一実施形態による顔画像マッチングシステムの構成を示すブロック図である。
符号の説明
11: 顔画像入力部
12: 顔メタデータ生成部
13: 顔メタデータ蓄積部
14: 顔類似度算出部
15: 顔画像データベース
16: 制御部
17: 表示部
121: 顔特徴抽出部
122: 信頼性指標抽出部
141: 分布推定部
142: 距離算出部

Claims (4)

  1. 画像を入力する画像入力部と、顔画像を蓄積する顔画像データベース部と、を有する顔認識システムにおいて、
    前記画像から抽出した顔特徴量と前記画像から抽出したコントラスト指標あるいは非対称性指標である信頼性指標とを顔メタデータとして出力する顔メタデータ生成部と、
    前記顔メタデータ生成部によって生成された顔メタデータを蓄積する顔メタデータ蓄積部と、
    信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力する顔類似度算出部と、
    入力された指令に応じて、前記顔メタデータ生成部、前記顔メタデータ蓄積部および前記顔類似度算出部を制御し、顔画像マッチングを実行する制御部と、
    を備えたことを特徴とする顔認識システム。
  2. 画像を入力する画像入力部と顔画像を蓄積する顔画像データベース部とを有するシステムにおける顔認識方法において、
    前記画像から抽出した顔特徴量と前記画像から抽出したコントラスト指標あるいは非対称性指標である信頼性指標を顔メタデータとして出力し、
    前記顔メタデータ生成部によって生成された複数の顔メタデータを顔メタデータ蓄積部に蓄積し、
    ある顔画像の顔メタデータと前記顔メタデータ蓄積部に蓄積された複数の顔メタデータの各々とを入力し、
    信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力し、
    前記顔類似度に従って顔画像マッチング結果を出力する、
    ことを特徴とする顔認識方法。
  3. コンピュータに、顔画像の類似度を算出させるためのコンピュータプログラムにおいて、
    前記顔画像から顔特徴量を抽出する顔特徴抽出ステップと、
    前記顔画像からコントラスト指標あるいは非対称性指標である信頼性指標を抽出する信頼性指標抽出ステップと、
    信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記顔画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力するステップと、
    を有することを特徴とする類似度算出プログラム。
  4. コンピュータに、顔認識をさせるコンピュータプログラムにおいて、
    入力画像から抽出された顔特徴量と前記画像から抽出したコントラスト指標あるいは非対称性指標である信頼性指標を顔メタデータとして出力するステップと、
    出力された複数の顔メタデータを顔メタデータ蓄積部に蓄積するステップと、
    ある顔画像の顔メタデータと前記顔メタデータ蓄積部に蓄積された複数の顔メタデータの各々とを入力するステップと、
    信頼性指標の値ごとに予め記憶しておいた顔特徴量間の差ベクトルの事後分布を用いて、前記画像から抽出した信頼性指標の値に対応した事後分布を推定し、前記事後分布に基づいて算出した顔特徴量間距離を顔類似度として出力するステップと、
    前記顔類似度に従って顔画像マッチング結果を出力するステップと、
    を有することを特徴とする顔認識プログラム。
JP2006212710A 2006-08-04 2006-08-04 顔認識方法およびシステム Expired - Lifetime JP4375570B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006212710A JP4375570B2 (ja) 2006-08-04 2006-08-04 顔認識方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006212710A JP4375570B2 (ja) 2006-08-04 2006-08-04 顔認識方法およびシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001381530A Division JP3903783B2 (ja) 2001-12-14 2001-12-14 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置

Publications (2)

Publication Number Publication Date
JP2006344236A JP2006344236A (ja) 2006-12-21
JP4375570B2 true JP4375570B2 (ja) 2009-12-02

Family

ID=37641104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006212710A Expired - Lifetime JP4375570B2 (ja) 2006-08-04 2006-08-04 顔認識方法およびシステム

Country Status (1)

Country Link
JP (1) JP4375570B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5151522B2 (ja) * 2007-02-09 2013-02-27 株式会社デンソー 演算装置及びプログラム
JP4964044B2 (ja) * 2007-07-06 2012-06-27 三菱電機株式会社 顔検出装置及び顔検出方法
JP4914398B2 (ja) * 2008-04-09 2012-04-11 キヤノン株式会社 表情認識装置、撮像装置、方法及びプログラム
US20110096135A1 (en) * 2009-10-23 2011-04-28 Microsoft Corporation Automatic labeling of a video session
KR101443031B1 (ko) 2013-04-04 2014-09-23 주식회사 슈프리마 얼굴 인식 서비스 제공 방법
CN108229314B (zh) 2017-11-28 2021-05-04 深圳市商汤科技有限公司 目标人物的搜索方法、装置和电子设备
CN114359449A (zh) * 2022-01-13 2022-04-15 北京大橘大栗文化传媒有限公司 一种面部数字资产制作方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11455864B2 (en) 2018-07-25 2022-09-27 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Also Published As

Publication number Publication date
JP2006344236A (ja) 2006-12-21

Similar Documents

Publication Publication Date Title
JP3903783B2 (ja) 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置
JP4375570B2 (ja) 顔認識方法およびシステム
JP3873793B2 (ja) 顔メタデータ生成方法および顔メタデータ生成装置
Naseem et al. Linear regression for face recognition
Kak et al. A review of person recognition based on face model
JP4543423B2 (ja) 対象物自動認識照合方法および装置
Bekhouche et al. Pyramid multi-level features for facial demographic estimation
Kekre et al. Eigenvectors of covariance matrix using row mean and column mean sequences for face recognition
AU2019200711A1 (en) Biometric verification
JP4375571B2 (ja) 顔類似度算出方法および装置
Nagendra et al. Video-based face recognition and face-tracking using sparse representation based categorization
Cai et al. Robust facial expression recognition using RGB-D images and multichannel features
Mau et al. Video face matching using subset selection and clustering of probabilistic multi-region histograms
KR20160042646A (ko) 얼굴 인식 방법
Tan et al. Face recognition algorithm based on open CV
Poh et al. Face video competition
Gambhir et al. Person recognition using multimodal biometrics
Atallah et al. A review study: The effect of face aging at Estimating Age and Face Recognition
Tistarelli et al. Understanding iconic image-based face biometrics
Mostafa et al. Adaptive biometric verification system using quality-based co-training
Marwa et al. Classifiers Combination for Efficient Masked Face Recognition
Ayo et al. Normalized Independent Component Analysis for Face Recognition
Zhang et al. Face Detection Based on Two Dimensional Principal Component Analysis and Support Vector Machine
Wang et al. Bilateral two dimensional linear discriminant analysis for stereo face recognition
Altaei Face Recognition Based on Image Integration and DCT Analysis

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Ref document number: 4375570

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

EXPY Cancellation because of completion of term