WO2003052690A1

WO2003052690A1 - Creation de metadonnees faciales et calcul de similarites faciales

Info

Publication number: WO2003052690A1
Application number: PCT/JP2002/013114
Authority: WO
Inventors: Toshio Kamei
Original assignee: Nec Corporation
Priority date: 2001-12-14
Filing date: 2002-12-16
Publication date: 2003-06-26
Also published as: DE60232365D1; EP1460580A4; CN1552041A; CN100492397C; CN1912891A; EP2017770B1; EP1460580A1; EP2017770A2; EP1460580B1; JP2003187229A; EP2017770A3; JP3903783B2; US20040197013A1; CN100492398C; CN1912890A; CN100367311C; US7593551B2

Description

明細書顔メタデータ生成と顔類似度算出技術分野

本発明は、顔同定や顔識別、顔の表情認識、顔による男女識別、顔による年齢判別等に利用可能な技術に関する。特に、本発明は、静止画像や動画像に映されている顔情報に関するメタデータを生成するメタデータ生成、顔類似度算出およびメタデータのマッチング技術に関する。背景技術

メタデータとは、一般に、データの意味を記述あるいは代表するデータであり、顔認識の場合には、主に静止顔画像や動画像などの顔データに関するデータを意味する。

映像 · 画像や音声などのマルチメディァコンテンツに対するメタデータの標準化活動として、 M P E G - 7 ( M o v i n g P i c t u r e s E x e r t s G r o u - 7 ) の活動力 S広く知られている。この中で顔認識に関するメタデータの記述子として、顔認識記述子が提案されている（ A . Y a m a d a 他編， " M P E G - 7 V i s u a l a r t o f e x p e r i m e n t a 1 M o d e l V e r s i o n 9 . 0 , " I S O / I E C J T C 1 / S C 2 9 / W G 1 1 N 3 9 1 4 , 2 0 0 1 ) 。

この顔認識記述子では、切り出され、正規化された顔画像に対して、一般的に固有顔と呼ばれる部分空間法の一種を用いて、顔画像の特徴量を抽出するための基底行列が求められる。この基底行列に基づいて画像中から顔特徴量が抽出される。これがメタデータとして扱われる。この顔特徴量に対する類似度として重み付け絶対値距離を用いることが提案されている。

また、顔認識に関する技術には様々な方法があることが知られている。例えば、主成分分析、あるいは、判別分析に基づく固有顔による方法などが知られている。主成分分析は、たとえば、 M o g a d d a m 他による " P r o b a l i l i s t i c V i s u a l L e a r n i n g f o r O j e c t D e t e c t i o n " ( I E E E T r a n s a c t i o n s o n P a t t e r n A n a 1 y s i s a n d M a c h i n e I n t e l l i g e n c e , V o l .

1 7 , N o . 7 , p p . 6 9 6 - 7 1 0 , 1 9 9 7 ) で知られている。また、判別分析は、例えば W . Z h a ο 他による " D i s c r i m i n a n t A n a l y s i s o f P r i n c i p a l C o m p o n e n t s f o r F a c e R e c o g n i t i o n " ( P r o c e e d i n g s o f t h e I E E E T i r d I n t e r n a t i o n a.1 C o n f e r e n c e o n A u t o m a t i c F a c e a n d G e s t u r e R e c o g n i t i o n , p p . 3 3 6 - 3 4 1 , 1 9 9

8 ) で知られている。

また、指紋画像から得られた特徴量に対して部分空間法が適用される際に、品質指標を導入し、適応的にパターン間の距離を測る方法も知られている。例えば、 T . K a m e i a n d M . M i z o g u c h i による F i n g e r p r i n t P r e s e l e c t i o n U s i n g E i g e n f e a t u r e s ( P r o c e e d i n g s o f t h e 1 9 8 I E E E C o m p u t e r S o c i e t y C o n f e r e n c e o n C o m p u t e r V i s i o n a n d P a t t e r n R e c o g n i t i o n , p p . 9 1 8 - 9 2 3 , 1

9 9 8 , 特開平 1 0 - 1 7 7 6 5 0 号公報）である。

しかしながら、上記従来の技術では、十分な顔認識の精度を得られなかった。

上記記述に関連して、特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置が、特開平

1 0 — 5 5 4 1 2 号公報に開示されてレ、る。この従来例のパターン認識装置は、多種類の文字パターンの識別を目的として、特徴選択の手法を用いて特徴ベクトルの次元数を削減することにより認識処理の高速化を図っており、入力パターンの特徴を表現する特徴べクトルを用いて入力パターンを認識する。入力特徴ベクトル抽出部は、入力パターンの特徴を表現する入力特徴べクトルを抽出する。正規直交基底記憶部は、元特徴空間の部分固有空間の正規直交基底を保持する。認識辞書部は、 1 つ以上の各認識対象パターンに対応し前記部分固有空間上で規定される各辞書選択特徴ベクトルを記憶している。特徴選択部は、正規直交基底記憶部が記憶する正規直交基底を用いて、入力特徴べクトル抽出部が抽出した入力特徴べクトルの部分固有空間への射影である入力選択特徴ベクトルを算出する。照合部は、特徴選択部が算出した入力選択特徴べクトルと認識辞書部が記憶する各辞書選択特徴べクトルとを照合することによって、入力選択特徴べクトルに対応する入力パターンの種類を認識する。

また、対象物検出装置が特開平 1 1 一 3 0 6 3 2 5 号公報に開示されている。この従来例の対象物検出装置は、処理が比較的簡単で、しかも、被識別対象物を正確に検出することを目的としている。画像入力部は、画像を入力し、記憶部は、検出する被識別対象物画像の特徵的な領域に対応して複数の判定要素取得領域を設定した領域モデルを記憶している。位置指定部は、画像入力部により入力した入力画像、又は予め画像入力部により入力し、画像処理を施した画像に対して記憶部に記憶した領域モデルを当てはめる被照合局所領域位置を順次指定する。判定要素取得部は、この位置指定部にて指定した位置に領域モデルを順次当てはめる毎に、この領域モデルの各判定要素取得領域から判定要素を取得する。マハラノビス距離判定部は、この判定要素取得部が取得した各判定要素取得領域の判定要素に基づいてマハラノビス距離計算を行い、被照合局所領域の画像が被識別対象物画像か否かの判定を行う。こうして、判定部の判定結果により被識別対象物の検出を行う。

また、顔識別 ' 照合方法が特開 2 0 0 0 — 1 3 2 6 7 5 号公報に開示されている。この従来例の顔識別 · 照合方法は、比較する 2 つの顔画像が異なった撮影条件や異なった撮影時期に撮影されたものである場合でも安定した識別を行うこと目的としている。その方法では、撮影条件または撮影時期の違いによる画像変動の特徴が分類されたクラス毎に予め学習されている。撮影条件または撮影時期の少なくとも 1 つが異なる 2 枚の顔画像の差力、らクラスが選択され、 2 枚の顔画像から選択されたクラスの画像変動の特徴小さくな特徵量をそれぞれ求め、 2 枚の顔画像の特徴より顔識別 · 照合を行っている。画像変動の特徴は、撮影条件または撮影時期の異なる 2 つの画像の差画像の標本集合を複数用意し、各クラス毎に主成分分析を行って主成分と各主成方向の標本分布の分散の大きさを求める。画像変動の特徴のクラスタの選択は、入力された 2 枚の顔画像の差の画像と各クラスの主成分によって張られる空間との距離を算出し、算出された距離が最も近いクラスを選択する

た、画像処理装置が特開 2 0 0 0 — 1 8 7 7 3 3 号公報に開示されている。この従来の画像処理装置は、学習用サンプルとして、左右に向いた顔及び斜めに傾いた顔等を用意しなくて済むようにすることを目的としている。画像処理装置では、画像群生成部は、左右対称配置の第 1 リファレンス用画像群から左右対称な第 2 リファレンス用画像群を作成する。特徴情報抽出部は、第 1 リファレンス用画像群と当第 2 リファレンス用画像群の両方を用いて特徴情報を抽出する。判定部は、特徴情報抽出部により抽出された特徴情報と入力画像とを比較して、入力画像が第 1 リファレンス用画像群と同じパターンの画像からなる力否力、を判定する。第 1 リファレンス用画像群が、人間の顏画像で fc よい。発明の開示

そこで、本発明の目的は、顔認識の精度を向上させることが可能な顔メ夕データ生成技術および顔類似度算出技術を提供することである。

本発明の他の目的は、さらに実用的な顔のマッチングシステムを構築するための技術を提供することにある。

本発明によれば、顔画像から信頼性が抽出されて、その信頼性に応じて適応的にパターン間の類似度が算出され、顔認識の精度を向上させることができる。

本発明の第 1 の観点によれば、顔メタデータ生成装置は、画像の顔画像部に関するメタデータを生成する。顔メ夕データ生成装置は、画像から顔特徴量を抽出する顔特徴抽出部と、画像から顔特徴量に対する信頼性を表す信頼性指標を抽出する信頼性指標抽出部とを備え、顔特徴量および信頼性指標を顔メタデータとして生成する。

信頼性指標抽出部は、信頼性指標として、画像のコントラスト指標を抽出することができる。画像のコントラスト指標として、画像中の画素値の最大値と最小値との差が抽出される。あるいは、画像のコントラスト指標として、画像中の画素値の分散あるいは標準偏差が抽出される。

さらに、信頼性指標として、画像の非対称性指標が抽出されてもよい。画像の非対称性指標としては、画像とその画像を左右反転した画像（以下、反転画像という。）との間の差分の最大値が抽出される。あるいは、画像の非対称性指標として、画像と反転画像との間の差分画像の画素値のべき乗の和および平均のいずれかが抽出される。信頼性指標抽出部は、画像のコントラスト指標を抽出する第 1 信頼性指標抽出部と、画像の非対称性指標を抽出する第 2 信頼性指標抽出部とを備えていてもよい。第 1 信頼性指標抽出部は、画像のコントラスト指標として、画像中の画素値の最大値と最小値の差を抽出し、第 2 信頼性指標抽出部は、画像の非対称性指標として、画像と反転画像との間の差分の最大値を抽出する。あるいは、第 1 信頼性指標抽出部は、画像のコントラスト指標として、画像中の画素値の分散および標準偏差の一方を抽出し、第 2 信頼性指標抽出部は、画像の非対称性指標として、画像と反転画像との間の差分画像の画素値のべき乗の和および平均の一方を抽出してもよい。

顔特徴抽出部は、画像から得られた特徴ベクトルを Λ とするときに、特徴べクトル Λ の部分基底べクトルによって特定される基底行列 U と特徴べクトル Λ の平均べクトル Ψ とを用いて特徴ベクトル v = U ^T ( Λ - Ψ ) を算出する。こうして、特徴ベクトル V は、顔特徴量として抽出される。基底行列 U は、顔画像サンプル集合 [ Λ ] の主成分分析によって得られる基底べクトルの中から選択された部分基底ベクトルによって特定される。基底行列 U は、基底行列と、顔画像を左右反転する画素値の変換と対応するように基底べクトルの要素が入れ換えられた反転部分基底べクトルによって特定される基底行列との線形和によって得ることもできる。特徴べクトル Λ は、画像中の各画素値を要素とするべクトリレであるか、あるいは、画像をフ一リエ変換し、得られる複素フーリエ成分の各成分の大きさを要素とするべクトルであってもよい。

本発明の他の観点によれば、顔類似度算出装置は、画像カゝら抽出された顔特徴量とその顔特徴量に対する信頼性を表す信頼性指標とに基づいて類似度を算出する。こうして、顔類似度算出装置は、画像の顔情報に関するメタデー夕間の類似度を算出する。

上記顔類似度算出装置は、比較する顔特徴量に対する信頼性指標を用いて、顔特徴量間の差ベクトルの事後分布に関するパラメータ情報を推定する分布推定部と、事後分布の対数尤度から導かれる顔特徴間の距離を類似度として算出する距離算出部とを有する。

距離算出部は、顔特徴量間の差べクトルの事後分布が正規分布であるとして、信頼性指標における正規分布の対数尤度から導かれる適応的マハラノビス距離を類似度として算出する。

分布推定部は、信頼性指標 [ ] に対する差ベクトル S の各要素 k の分散ひ。，_ ( [ Θ . 1 ) 2 を推定し、距離算出部は、各要素 k の分散 σ _s ，- ( ί Θ ) 2 を用いて適応的マハラノビス距離を計算する。

頼性指標 [ 0 . ] に対する差ベクトル s の各要素 k の分散 σ _{s k} ( [ 0 . ] ) ² をあらかじめ記憶する分散値テ一ブルが備えられ、分布推定部は、信頼性指標 [ 0 . ] に基づいて分散値テ一ブルを参照して分散を読み出し、その分散を用いて適応的マハラノビス距離が計算されてもよい。

距離算出部は、顔特徴量間の差べクトルの事後分布が混合分布であるとき、信頼性指標における混合分布の対数尤度から導かれる適応的混合マハラノビス距離を類似度として算出する。

比較する顔特徴量に対する信頼性指標を用いて、一致と見倣すべきクラス内における顔特徴量間の差べクトルの事後分布（クラス内分布）と、不一致と見倣すべきクラス間における顔特徴量間の差ベクトルの事後分布（クラス間分布）とに関するパラメータ情報が推定され、推定されたパラメータ情報を用いてクラス内分布およびクラス間分布の比の対数尤度から導かれる顔特徴量間の距離を類似度として算出する。

クラス内分布およびクラス間分布がそれぞれ正規分布であるとき、信頼性指標におけるそれぞれの分布の比の対数尤度から導かれる適応的判別距離が類似度として算出される。

信頼性指標 [ Θ . ] に対する差ベクトル S の各要素 k のクラス内分散ひ _{w k} ( [ θ . ] ) 2 およびクラス間分散ひ _Β ，- ( [ Θ , ] ) 2 が推定され、適応的判別距離が類似度として算出されてもよい。

信頼性指標 [ 0 . ] に対する差ベクトル S の各要素 k のクラス内分散 a _{w k} ( [ θ _± 1 ) 2 およびクラス間分散 _σ B , k ( [ θ . ) 2 の推定のために、クラス内分散 σ _{τ k} ( ί θ _± ] ) 2 をあらかじめ記憶する第 1 分散値テーブルと、クラス間分散 σ _B , _k ( ί θ _± ] ) 2 をあらかじめ記憶する第 2 分散値テーブルとが備えられ、信頼性指標 [ S . ] に基づいて第 1 および第 2 分散値テーブルがそれぞれ参照されて分散を読出し、読み出された分散を用いて適応的判別距離が計算されてもよい。

クラス内分布およびクラス間分布がそれぞれ混合分布であるとき、信頼性指標におけるそれぞれの混合分布の比の対数尤度から適応的混合判別距離が類似度として算出されてもよい。

本発明の第 3 の観点によれば、顔認識システムは、画像を入力する画像入力部と、顔画像を蓄積する顔画像データベース部とを有する。顔認識システムは、画像から抽出された顔特徴量とその顔特徴量に対する信頼性を表す信頼性指標顔とを顔メタデータとして生成する顔メタデータ生成部と、顔メタデータ生成部によつて生成された顔メタデー夕を蓄積する顔メタデータ蓄積部と、顔特徴量とその顔特徴量に対する信頼性を表す信頼性指標とに基づいて顔類似度を算出する顔類似度算出部と、入力された指令に応じて、顔メタデータ生成部、顏メ夕データ蓄積部および顔類似度算出部を制御し、顔画像のマツチングを実行する制御部とを備えている。

上述した顔メタデータ生成部および顔類似度算出部を用いることにより、高精度の顔画像マッチングを達成することができる。図面の簡単な説明

図 1 は、本発明の一実施形態による顔画像マッチングシステムの構成を示すブロック図である。発明を実施するための最良の形態

(発明の原理）

はじめに本発明の原理について説明する。一般に、パターン認識を行う際、認識されるべきクラスに対する学習デ一夕を大量に用意することが可能であるならば、その学習データに対する統計解析に基づいてパターンの分布関数が推定され、パターン認識機構を構築することができる。しかしながら、顔認識の場合、個人毎には 1 枚だけの登録画像しか得られず、ごく少数の登録画像しか許されないことが多い。このような場合であっても、顔の特徴ベクトルに対して信頼性指標という指標が与えられ、その指標に基づいてクラスを考えることとする。これにより、その信頼性指標に対するクラスの統計解析が行われ、パターンの分布関数が推定され、一枚の登録画像しか得られないような顔認識に対しても信頼性指標を通じた分布関数に基づくパタ一ン認識機構を構築することができる。

以下、誤差分布に基づく場合のマハラノビス距離とクラス内分布やクラス間分布に基づく判別距離についての顔認識の原理について説明する。

いま、ある一人の顔を観測する場合を考える。誤差がない場合に顔画像から得られる特徴ベクトルを V 。とし、誤差べクトリレ ε が重畳しているとすると、実際に観測される観測ベクトル V は、以下の式（ 1 ) により表される。

V = ν。 + ε ( 1 )

ここで、特徴ベクトル V _Q が 2 回観測されるとすれば、以下の式（ 2 ) に示されるように、 2 つの観測ベクトル V _λ と V ₂ が得られる。 2 V。

( 2 )

εつレま、誤差ベクトル ε 3_ , 誤差べクトル ε に対して相関を持つ信頼性指標 θ 、信頼性指標 0 ₂ がそれぞれ得られ、その事後分布が ρ ( ε I ⁰ 1 ) 、 ( ε I 0 ₂ ) であるとする。このような分布が得られたときの観測べク卜ル V _λ と ν ₂ の差ベクトル s の事後分布が ρ ( S \ Θ _± , Θ ₂ ) と表されるとすれば、パターン間の類似度 d ( V

V 2 ) は、以下の式（ 3 ) の対数尤度により表されるとができる。

d (ν， , v₂) = - In p (s I θ_1# θ₂) ( 3 )

事後分布 P { B \ θ ) 、 ρ ( ε I θ ₂ ) がそれぞれ正規分布であるとすると、差ベクトル s の分布 ρ ( S I θ _λ , θ ) も正規分布となるで、誤差べク卜ルの事後分布を ρ ( ε I Θ . ) , 2 ) とし、平均が 0 でめるとい、共分散行列 ∑ _£ ( Θ _± ) の正規分布を考える。この場合、差ベクトル s の分布は、平均が 0 であり、共分散行列 ∑ _s { Θ , S ₂ ) は式（ 4 ) で表される。

，θ₂) = I ）+ _ε(θ₂) ( 4 ) 書き直すと、事後分布 p s j ^ ;^ 0 ₂ ) は次式（ 5 ) で表される。

P s θ,,θ, exp ( 5 )

2

(2 ₃(θ_χ, θ₂^ 従って、式（ 3 ) は、次式（ 6 ) に示されるように、共分散行列 ∑ ε {、 θ " 1 ) ' や ' ∑ ε ( 0 つ）を用いて、信頼性指標

Θ や Θ に対して適応的なマハラノビス距離に書き表すとができる。

d v_lf v₂

= - In l^s I 9_LF θ₂)

= s^T2 ,

_S(0" Θ₂)| ( 6 )

誤差べクトルの各要素間における独立性が仮定されれば、式（ 5 ) は次式（ 7 ) に示されるようになる。

ここで、 σ „ _k { θ _± , θ ₂ ) 2 は共分散行列 ∑ _s ( θ , θ ₂ ) の k 番目の対角要素であり、つまり、観測誤差の分散である。また、 σ _{ε k} ( S ₁ ) 2 、（j _£ ( θ ₂ ) 2 は、それぞれ共分散行列 ∑ _ε { θ _λ ) 、 ∑ _ε ( θ ₂ ) の k 番目の対角要素である。 s _k は差ベクトル s の k 番目の要素を指定する。

このように正規分布を仮定することで、式（ 3 ) は、次式（ 8 ) のように、各特徴ベクトルの要素毎の分散 σ _{£ k} 、ひ _ε ，- ( θ ₂ ) を用いて、信頼性指標 S ェや 0 ₂ に対して適応的なマハラノビス距離によって類似度を定義することができる。 d、v， , v.

= - In p I θ_1# θ.

2 2 ， θ; ( 8 )

1 ^Ν

-

2 άι

— '

2. k=i

で ν k ν 2 , k はそれぞれ特徴ベクトル V ェ、 V

2 の k 番目の要素を表す。

上記説明では、事後分布 p ( s I 0 . , θ ) として正規分布が仮定されたが、以下の説明では、混合正規分布が仮定される。さて、次式（ 9 ) に示されるように、正規分布

P ( s I 0 丄， Θ 2 ' , 2 , , M ) の和によつて事後分布 p ( s θ ₁ , 0 ₂ ) が表現されることができると仮定する。

P (s f θ,,θ,) = 2 p (s I θ,, θ,, ίίρ ( 9 ) 従って、次式（ 1 0 ) により適応的混合マハラノビス距離を定義することができる。 ,V₂

-lnp(s I 0_lfe₂)

-ΙηΙρΙβ Ι Θ,,θ,,:

= -ln —— N x _exp (- - ∑ _Efe' j) +∑ ! ■ ¹ s) P ( j)

( 1 0 )

事後分布 p ( s \ Θ ₁ , Θ ₂ , j ) の共分散行列 ∑ _s ( θ _Λ , Θ ₂ , ； j ) および Ρ ( j ) の推定については、一般的な推定方法である最尤推定法や E Mアルゴリズムを用いて推定することができる。これらの詳細は、 C . M . B i s h o にる " e u r a l N e t w o r k s f o r P a t t e r n R e c o g n i t i o n " ( O x f o r d U n i v e r s i t y E x p r e s s , 1 9 9 5 ) に記載されている。

混合正規分布を仮定することで、分布をより正確に近似でき、マッチング性能が向上する。しかしながら、大量の学習データが必要になるとともに演算量もまた大幅に増加する。

前述の誤差分布に基づくマハラノビス距離は、検索される顔データが他の登録されている顔データの中でどれに最も近いかを調べる顔同定（ f a c e i d e n t i f i c a t i o n ) のような問題に対して優れている距離である。一方、顔識別 ( f a c e v e r i f i c a t i o n ) の問題では、入力された顔データを、登録された顔画像との同一性を判定する上で、入力された顔データを受け入れるべきか、棄却すべきかが重要な問題である。以下で説明する「判別距離」と名付ける距離は、この顔識別問題に対しては前述のマハラノビス距離を用いる場合よりも、優れた類似度尺度となつている。

いま、顔の 2 つの特徴ベクトル V が、同一クラス内に属して一致すると判定できるならば、すなわち、例えば、 2 つの特徴べクトルが同じ人物の顔デ一夕であるならば、それらの特徴べクトルの組み合わせはクラス Wに属しているとする。また、 2 つの特徴べクトフレ V がクラス間の特徴べクトルであり、不一致と判定されるべきならば、すなわち、 2 つの特徴ベクトルが異なった人物の顔データであるならば、それらの組み合わせはクラス B に属しているとする。

2 つの特徴ベクトル V ェ、 V ₂ に対して信頼性指標 Θ i 、 Θ ₂ が得られるとする。差ベクトル s と 2 つの信頼性指標 ^θ 1 、 ⁹ 2 (以下、 2 つの信頼性指標のセットは [ 0 , ] と表記される）が観測されたときに、 2 つの特徴ベクトル V

₁ , V ₂ がー致していると見做される場合と不一致と見倣される場合との判別問題を考える。この場合、次式（ 1 1 ) の判別貝 IJ ( d e c i s i o n r u l e ) が得られる。

上記式（ 1 1 ) の左辺は、ベイズ定理（ B a y e s T h e o r e m ) によって次式（ 1 2 ) のように書き直すことができる。

( 1 2 )

(w, {eJ)_P (s I w, {Θ_±})

P (B, {θ_±})ρ (s I B,

₌ (W) P (s I w, {θ,})

P (B) P (s I B,¾)

ここで、クラス W、 B と [ ^ i ] の生じる確率は独立であると仮定して、 P ( W , [ Θ _± ] ) = P ( W ) P ( [ Θ . ] ) 、 Ρ ( Β , [ θ ] ) = Ρ ( Β ) ρ ( [ 9 . ] ) としている。

ノ\°ターン間の距離 d ( V _χ , V ₂ ) として式（ 1 2 ) の対数尤度が計算されるならば、次式（ 1 3 ) に示されるように、顔識別問題に適した類似度を求めることができる。 d(v₁ v₂) = _ln.^P(^W)P(^S I

p (B) p (S I B, |Θ_Α ( 1 3 )

p w

一 In 一 In

is I B, θ p (Bj

個別のマッチング毎に事前確率 P ( W ) 、 P ( B ) が異なり、且つ、それを知ることができるならば、 .式（ 1 3 ) の第 2 項を計算することが望ましい。しかし、多くの場合、個別のマッチング毎に事前確率を知ることができないので、事前確率は一定と仮定することで、第 2 項を一定と見倣し、類似度の計算からは除外する。

事後確率 P ( s I W , [ Θ . ] ) 、 P ( s | B , [ Θ . ] ) を、それぞれクラス内分布 p _w ( s I ί Θ 1 ) 、クラス間分布 ρ „ ( s ί Θ , ] ) と書き代えると、次式（ 1 4 ) が得られる。

次に、クラス内分布 p _w ( s I ί Θ _± ) 、クラス間分布

P Β ( s I ί θ .1 ) がそれぞれ正規分布であると仮定し、その平均がそれぞれ 0 、共分散行列がそれぞれ ∑ _w ( [ Θ . ] ) 、 ∑ _B ( [ Θ _±1 ) とすれば、事後分布はそれぞれ次式（ 1 5 ) で書き表すことができる。

P_B s

上式を式（ 1 4 ) に代入すると（但し、式（ 1 4 ) の第

2 項は省略）、次式（ 1 6 ) で示される距離を得ることができる。これを「適応的判別距離」と呼ぶことにする。

d ， , )

一 In Pwl^s θ

( 1 6 )

差べクトル s の各要素間における独立性を仮定すれば、式 ( 1 5 ) は、次式 ( 1 7 ) と表すことが出来る。

( 1 7 ) ( θ _± 2 は、それぞれで、び W , _k ^{( Θ} i 2、び _B , _k

共分散行列 ∑ _w ( θ _± ) 、 ∑ _Β ( θ _± ) の k 番目の対角要素であり、つまり、クラス内分散とクラス間分散に相当する。 s _k は差ベクトル s の k番目の要素である。

' このように正規分布を仮定することで式（ 1 6 ) は、次式（ 1 8 ) のように、各特徴ベクトルの要素毎のクラス内分散び _{w k} θ _± ) 2、クラス間分散 σ _Β ，- ( 0 . ) ² を用いて、信頼性指標 [ 0 . ] に対して適応的な判別距離による類似度を定義することができる。

( 1 8 )

上記の説明ではクラス内分散 σ ( θ . ) 2、クラス間

W , k

分散び _k ( Θ . ) 2 として正規分布が仮定されたが、以下では混合分布が仮定される。

次式（ 1 9 ) のように、クラス内分布 P _w ( s I [ Θ . ] ) 、クラス間分布 P _n ( s I [ Θ _± ] ) として、それぞれ正規分布 P _w ( s | [ 0 i ] , j _w ) ( j _w , 2 , .

M 、 P _B ( S | j B ) ( J B ⁼ ： , 2 , . , M

B ) の和によって事後分布が表現できると仮定する

P„(s I {θ_±}) = | _Pw(s I {θ_±}, j_w) p (jj

( 1 9 )

p_B(s I {ej) = 1 P_b(S I {ej, j_B)p(j_B) 従って、この対数尤度を用いて次式（ 2 0 ) の適応的混合マハラノビス距離を導くことができる。

TJP02/13114

： _ _ln Pw(s I {Θ,

— ln | _Pw(s I {e^ jpi j + ln J p_E s θ ; j_B)P(j

( 2 0 )

クラス内分布 P _w ( s | [ e i ] B , j _w ) 、クラス間分布

P _R ( s I [ Θ . ] , _B ) の共分散行列 ∑ _w ( s I ί θ , ] ,

∑

w B ί θ _Λ 1 j _w ) 、 p

( j _R ) の推定については、最尤推定法や E M

B アルゴリズム p

を用いて推定することができる。混合分布を仮定することで、分布をより正確に近似でき、マッチング性能を向上させることができる。しかしながら、同時に大量の学習データが必要になるとともに、演算量も大幅に増加する。

このように顔特徴量に対してさらに信頼性指標を抽出することによって、信頼性指標に対して適応的な距離規範を導くことができ、高精度な顔認識機構を構築することができる。なお、上記では、特徴ベクトルに対する信頼性指標をスカラー量（一つの成分のみ）か、ベクトル量（複数の成分をもつ）か特定していないが、どちらの場合でも成立する議論であり、複数の要素を用いることで、性能の向上が期待できる。具体的な信頼性指標については、実験的に有効な信頼性指標を発見することが必要であり、顔認識の場合では、画像のコントラストを表すコントラスト指標や、正面顔の認識では、照明変動や姿勢変動によって生じる顔画像の左右の対称性の歪みからの量を表す非対称指標を用いると高い効果が得られ、それらの信頼性指標を組み合わせてべクトル量とすることで、より精度の向上が期待できる。

(実施例）

図 1 は、本発明の一実施形態による顔画像マッチングシステムを示すブロック図である。以下、顔画像マッチングシステムについて詳細に説明する。

図 1 に示すように、本発明による顔画像マッチングシステムは、顔画像入力部 1 1 と、顔メタデータ生成部 1 2 と、顔メタデ一夕蓄積部 1 3 と、顔類似度算出部 1 4 と、顔画像データべ一ス 1 5 と、制御部 1 6 と、表示部 1 7 とを備えている。顔画像入力部 1 1 は、顔画像を入力し、顔メタデータ生成部 1 2 は、入力された顔画像からそれらの顔特徴量、信頼性指標を抽出し、顔メ夕デ一夕を生成する。顔メタデータ蓄積部 1 3 は、抽出された顔メタデータを蓄積する。顔類似度算出部 1 4 は、 2 つの顔メタデータから顔の類似度を算出する。顔画像データべ一ス 1 5 は、顔画像を蓄積する。制御部 1 6 は、画像の登録要求 · 検索要求に応じて、画像の入力、メタデータの生成、メタデー夕の蓄積、顔類似度の算出の制御を行う。表示部 1 7 は、顔画像や他の情報を表示する。また、顔メタデータ生成部 1 2 は、入力された顔画像から顔特徴を抽出する顔特徴抽出部 1 2 1 と、顔画像から信頼性指標を抽出する信頼性指標抽出部 1 2 2 とを備えている。顔類似度算出部 1 4 は、信頼性指標から事後分布に関するパラメータ情報を推定する分布推定部 1 4 1 と、顔特徴量と分布推定部 1 4 1 からの事後分布情報から顔特徴量間の距離を算出する距離算出部 1 4 2 とを備えている。分布推定部 1 4 1 内には、分散値を格納する分散値テーブル 1 4 3 が用意されていることが望ましい。分散値テーブル 1 4 3 に格納される分散値は予め計算され、テーブル 1 4 3 に格納されていることが望ましい。

登録時には、画像入力部 1 1 は、顔の大きさや位置を合わせた上でスキャナあるいはビデオカメラから顔写真を入力する。あるいは、人物の顔を直接ビデオカメラなどから入力しても構わない。この場合には、前述の M o g h a d d a m の文献に示されているような顔検出技術を用いて、入力された画像の顔位置を検出し、顔画像の大きさ等を自動的に正規化する方がよいであろう。

また、入力された顔画像は、必要に応じて、顔メタデー夕又は I D と関連付けて顔画像データべ一ス 1 5 に登録される。顔画像登録と同時に、顔メタデータ生成部 1 2 によつて顔メタデータが生成され、顔メタデータ蓄積部 1 3 に蓄積される。

検索時には、同様に、顔画像入力部 1 1 から顔画像が入力され、顔メタデータ生成部 1 2 により顔メタデータが生成される。生成された顔メタデータは、一旦顔メタデータ蓄積部 1 3' に登録されるか、または、直接に顔類似度算出部 1 4 へ送られる。検索では、顔同定の場合、すなわち予め入力された顔画像がデ一夕ベース.中にあるかどうかを確認する場合には、顔メタデータ蓄積部 1 3 に登録されたデ一夕の一つ一つとの類似度が算出される。最も類似度が高い結果、すなわち、距離値が小さい結果に対応する顔メタデータ又は I D に基づいて、制御部 1 6 は、顔画像データベース 1 5 から、顔画像を選び、顔画像を表示するように表示部 1 7 を制御する。検索画像と登録画像における顔の同一性を作業者が確認する。

一方、顔識別の場合には、すなわち予め I D 番号で特定された顔画像と検索の顔画像が一致するかどうかを確認する場合には、特定された I D 番号の顔画像と一致するか否かが顔類似度算出部 1 4 において計算され、予め決められた類似度よりも類似度が低い場合には、すなわち距離値が大きい場合には、一致しないと判定され、類似度が高い場合には一致すると判定される。制御部 1 6 は、その結果を表示するように表示部 1 7 を制御する。

このシステムが入室管理用に用いられるならば、顔類似度を表示する代わりに、制御部 1 6 カゝら自動ドアに対して、その開閉制御信号を送り、自動ドアの開閉制御を行うことによって入室管理を行うことができる。

上記のように、顔画像マッチングシステムは動作するが、このような動作はコンピュータシステム上で実現することもできる。たとえば、次に詳述するようなメタデータ生成を実行するメタデータ生成プログラムおよび類似度算出を実行する類似度算出プログラムが記録媒体 2 0 に格納されていて、それを読出してメモリ（図示せず）に格納し、これらをプログラム制御プロセッサ（図示せず）によつてそれぞれ実行することで顔画像マッチングを実現することができる。

次に、この顔画像マッチングシステムの動作、特に顔メ夕データ生成部 1 2 と顔類似度算出部 1 4 について詳細に説明する。

( 1 ) 顔メタデータ生成

顔メタデータ生成部 1 2 は、位置と大きさが正規化された画像 I ( X , y ) を用いて、顔特徴量を抽出する。位置と大きさの正規化は、例えば、目位置が（ 1 6 , 2 4 ) 、

( 3 1 , 2 4 ) 、サイズが 4 6 X 5 6 画素となるように画像を正規化しておくとよい。以下では、このサイズに画像が正規化されている場合について説明する。

顔特徴量として、所謂、固有顔の手法（前述 M o g h a d d a m の論文）を用いて特徴を抽出する。つまり、画像中の画素値を要素とする特徴べクトル Λ に対して、基底行列 U と、顔画像サンプル集合 [ Λ ] における平均ベクトルである平均顔 ψ とを用いて、特徴ベクトル _V = U ^T ( Λ — Ψ ) が算出される。基底行列 U は、顔画像サンプル集合 [ Λ ] の主成分分析によって得られた基底べクトルの中から選択された部分基底ベクトルによって特定される。このように、入力画像ではなく、部分基底ベクトルを用いることで、入力画像のデータ量を削減することができる。このようにデ一夕量を削減することは、メタデータベースにおける蓄積量を少なくするだけではなく、高速なマッチングを実現するためには重要な要素である。この特徴べクトルの次元数としては、例えば、 4 8 次元の特徴量を用いればよい。

このように一般的に用いられる固有顔による手法の他に、主成分分析に対して判別分析を組み合わせた手法（前述、 W . Z h a o の論文）等を用いて部分基底ベクトルを規定しても構わない。

また、基底行列 U n と基底行列 U m の線形和によって得られる行列 U ( - a U n + b U m ) を基底行列として用いて、顔特徴ベクトルを抽出してもよい。ここで、基底行列 U n は、前述したような顔画像サンプルにおける特徴べクトル集合 [ Λ ] の主成分分析や判別分析によって得られる基底べクトルの中から選択された部分基底べクトルによつて特定される。また、基底行列 U m は、顔画像を左右反転される画素値の変換と対応するように基底べクトルの要素を入れ換えた反転部分基底べクトルによって特定される。例えば a b == 1 とすると、得られる顔特徴ベクトルは、入力画像空間で左右の変換に対して対称な成分のみを抽出することができる。顔は本来左右対称であるので、照明の影響で非対称となった画像成分や顔の向きが正面に向いていないために生じる非対称成分が本来ノィズに相当す 4 るものであるので、これを除去し、対称な成分のみを抽出することで、照明や姿勢の変動に対して安定な顔特徴量を抽出することが可能となる。

また、画像をフーリエ変換し、得られた複素フーリエ成分の各成分の大きさを要素とするべクトルを特徴べクトル

Λ として算出し、上記のような主成分分析や判別分析によつて次元圧縮を行い顔特徴量を抽出してもよい。このように画像をフーリエ変換することで、位置ずれに対して強い顔特徴量を抽出することができる。このようにして、顔特徴抽出部 1 2 1 は、顔特徴量 V を抽出する。

信頼性指標抽出部 1 2 2 では、顔特徴量 V の信頼性指標として有効なコントラスト指標 S c o n t r a s ■ と非対称性指標 ^ a s y mm e t r i c を抽出する。コントラスト指標 C

O _η . i„ _Λ d _Q . X- として、顔画像 I ( x , y ) の画素値の標準偏差を次式式（ 2 1 ) によって計算する。 round

、

46 χ 56 i-i _J=

ここで r o u n d ( ) は数値の丸め処理を意味する。このように抽出された信頼性指標 0 ハ。 _{n t r a s t} を ' [ 0 , 1 ,

2 1 5 ] の 4 b i t の範囲に収まるように、値域を越えるものは値を制限する。なお、上記ではコントラスト指標として、画像の標準偏差を計算したが、分散や画像中の画素値の最大値と最小値の差を抽出してもよい。画像中の画素値の最大値と最小値によるコントラスト指標は、標準偏差や分散による場合よりも演算量が少ないが、効果は相対的に小さい。

非対称性指標 0 a s y m m e t 2： i c として、顔画像 I ( x , y ) とその反転画像との間の差分の絶対値（ 1 乗）の平均を次式式（ 2 2 ) により抽出する。

^Θ~

- ¹ (⁴⁷ - ή

( 2 2 ) このように抽出された信頼性指標 Θ a s y m m e t r i c を [ 0 , 1 , 2 1 5 ] の 4 b i t の範囲に収まるように値域を越えるものは値を制限する。なお、上記では非対称指標として、絶対値による値（ 1 乗）を用いたが差分の 2 乗を用いてもよい。また、平均の代わりに、和値を用いても同等の効果を得ることができる。また、差分の最大値を検出して、その値を非対称指標として用いれば演算量が少なくて済む。

信頼性指標抽出部 1 2 2 は、顔画像に対して、特徴べクトル V と信頼性指標 0 _α。 _{n t a s t} と信頼性指標 0 a s y m m e t r i c を抽出し、顔メタデータとして出力する。前述したように、上記顔メタデータ生成手順をコンピュータプログラムによってコンピュータに実行させることもできる。

( 2 ) 顔類似度算出

次に、顔類似度算出部 1 4 の動作について説明する。顔類似度算出部 1 4 では、二つの顔メタデータの信頼性指標

Θ ^ _{n n t} ^ _{a s J} - I 0 c o n s t r a s t , 2 と 0 a s ymm e t r i c , l 、 Θ a s y m m e t r i c , 2 を用いて、分布推定部 1 4

1 が事後分布に関するパラメータ情報を推定し、二つの顔メタデータの二つの特徴ベクトル _{V i}、 V ₂ と事後分布（'こ関するパラメ一夕情報とを用いて距離算出部 1 4 2 が顔特徵間の類似度 d を算出する。

ここでは、式（ 8 ) あるいは式（ 1 8 ) によって顔の類似度を計算する場合について説明する。

式（ 8 ) あるいは式（ 1 8 ) にて表記されている信頼性指標 Θ ェ、 θ ₂ は本実施形態ではベクトルであり、それぞれの要素は ^ 丄 = ( 9 c o n t r a s t , l , Θ a s y m m e t r i c , 1 、 Θ = ^ 0 c o n t r a s t , 2 , Θ a s y m m e t r i c , 2 ) ^T となる。コントラスト指標、非対称性指標はそれぞれ 4 b i t で表現されているので、 Θ i のとり得る状態は 2 5 6 個の状態となる。与えられた信頼性指標 0 — . によつて、 2 5 6 個の状態の中の一つの状態が特定できる。

分布推定部 1 4 1 は、後述するように、予め求めておいた信頼性指標 0 ( 2 5 6 個の状態がある）に対する差べクトルの分散値 σ _P ( θ ) や分散値 σ _w ，_ ( 0 ) 、分散値 σ _Β ( θ ) をテーブルに記憶しておき、信頼性指標 S 丄および 0 ₂ を用いて、それぞれの分散値テ一ブルの値を参照し、得られた分散値を事後分布情報として、距離算出部 1 4 2 に引き渡す。なお、顔同定の場合には、式（ 8 ) で必要な分散値 σ _£ ，_ ( θ ₁ ) 、分散値 σ _{£ t} ^ ( θ ₂ ) の値を距離算出部 1 4 2 に出力すればよく、顔識別の場合には、式（ 1 8 ) に必要な分散値 σ _w ，- ( Θ ) 、分散値 σ _B _k ( Θ ) を出力する。距離算出部 1 4 2 は、式（ 8 ) あるいは式（ 1 8 ) に従つて適応的マハラノビス距離あるいは適応的判別距離を算出し、類似度 d として出力する。前述した分散値テーブルの分散値は、予め用意された顔画像データサンプルを k)用いて計算されている。顔画像サンプルにおける特徴ベクト Vル集合 [ V ] とその信頼性指標 ί Θ . から、それぞれの分散値は次のように計算できる α (Θ)² ( 2 3 )

2Ν_ε(θ) (_(i,3)e a_w._k(6)² _ - _ y (v - v

2N_w(6)_((i, ! † ^d'^k/

( 2 4 )

σ_Β,,(θ)² ¹ y (_{Vl h} v

2Ν_Β(θ) ((i ここで、 " ( i , 3 ) がクラス Wに属する " とは、デー夕 i とデータ j が同一クラス、すなわち、同一人物から得られたデータであり、クラス内であることを意味し、 " ( i , j ) がクラス B に属する " とは、データ i とデータが異なるクラス、すなわち、異なる人物から得られたデ —夕であり、クラス間であることを意味する。また、 N _£ ( Θ ) N _w ( θ ) Ν _Β ( θ ) はそれぞれのクラスに属するデータの組み合わせの数である。このように 0 のビン毎に分散値を計算する際に、そのデータ数が少な過ぎる場合には、近傍のビンのデータを併合するようにして、サンプル数を確保するようにする。これは、分布推定における k 近傍法（前述 B i s h o p の文献， p p . 5 3 ) によって b i n を併合するのと同様な手法である。

で、式（ 1 8 ) の場合、式（ 4 ) と同様に、 0

W , k

( ί θ . 1 ) 2 ₌ び _w , _k ( S ェ） 2 + σ _{W f k} ( θ ₂ )

2、および、 σ _Β „ ( [ θ _± ] ) 2 ₌ C7 _{B k} ( 0 , ) 2 + ^σ Β , ^θ 2 ² となることに注意されたい。

なお、誤差分散び . _k ( Θ ) 2 とクラス内分散 a _w , _k

( Θ ) 2 が同じになるので、顔画像マッチングシステムで式（ 8 ) と式（ 1 8 ) の両方の距離を計算する場合には、これらの分散値テーブルを共有して構わない。

また、誤差分布とクラス間分布は強い相関がある場合が多いので、誤差分散 σ _{£ k} ( θ ) 2 の代わりにクラス間分散び β , k ^{( 9 ) 2} を用いても、信頼性指標を用いない場合よりは精度が向上する。しかし、誤差分散を用いた方が精度が良い。

このように顔メタデータ間の類似度を信頼性指標 Θ c o n t r a s t や信頼性指標 0 a s y m m e t r i c を介した事後分布情報を用いて算出することで、精度のよい顔認識を行うことが可能である。前述したように、上記顔類似度算出手順をコンピュータプログラムによってコンピュータに実行させることもできる。

なお、ここでは式（ 8 ) と式（ 1 8 ) を用いて、類似度が計算されているが、次式（ 2 5 ) 、 ( 2 6 ) に示されるような様々な計算方法によって近似的に計算され、高速化等を図ることもできる。 zz

( Z )

z

¹ \ ゾノノ K "C

((^Ζθ)^¾'³0 '( '³0 SUI Z

^ΖΛ '^τΛ)ρ

"Λ - 'Δ +

( θ) ο'_ζ(^τθΓ'³

Δ - ^ ^ιΛ

W'³ ) a£S UT Κ - +

:Λ '^τΛ

⁷ Ν L

、 ^θ) ^D ζ

ζ ( Λ - '^τΛ) 1 'Λ ' ^τΛ)

T

~ ^L ^— ^{L 1} I N T

^Ζ '^τΛ)ρ

Iれ Λ一 '^ΤΛΙ M τ θ)^¾'³ο + ^τθ) '³οり υτ - +

= (^ΖΛ ' ^ΤΛ ρ 、

Λ - Λ κ

τ

ノ \ ノ κ X

(^Ζθ) '³θ θ) '³0 2

- "^Δ) «

' 、 , / Ν Τ

Mici/zodr/xad 0691S0/C0 OAV σ_Β )²)

+ -∑ (ln2i«J_w,_k(e₂) - ln2ira_B,_k(8₂

2

( 2 6 ) 上記各式の右辺第 2 項（ I n の部分）を計算しないことで、さらなる高速演算を図ることができる。

また、式（ 6 ) や式（ 1 6 ) を用いて類似度が計算される場合も、基本的には同様に、予め用意された顔画像デー夕サンプルから、それぞれの計算に必要な差べクトルの誤差の共分散行列 ∑ _£ ( 0 ) や差ベクトルのクラス内の共分散行列 ∑ _w ( Θ ) 、クラス間の共分散行列 ∑ _Β ( Θ ) が算出されて、共分散テーブルとして用意され、類似度計算の際にその共分散テーブルが参照されるようにすればよい。この方法では、共分散行列を用いて距離を計算するので、演算量が増加するが、十分な学習サンプルがある場合には類似度計算の精度を向上させることができる。式（ 3 ) の事後分布や式（ 1 4 ) のクラス間分布、クラス間分布に対して混合正規分布を仮定して、分布関数を推定することで、それぞれ式（ 1 0 ) や式（ 2 0 ) の適応的 0213114 混合マハラノビス距離や適応的混合判別距離を計算してもよい。この場合も、分散や共分散行列を用いて、事後分布情報を計算するのと同様に、顔画像データサンプルから混合正規分布を表す共分散行列 ∑ _s ( 0 , , j ) 、 P (： j ) 等の混合分布を特定するパラメータが求められ、テーブルとして記憶されてもよい。なお、この推定については、一般的な推定方法である最尤推定法や E Mアルゴリズムを用いて推定すればよい。

ここまでの説明では、一枚の顔画像が登録され、一枚の一 f 1

顔画像を用いて検索される場合について説明したが、一人の顔に対して複数の画像が登録され、一 d枚の顔画像を用いて検索される場合には、例えば、次のようにすればよい。すなわち、検索側の特徴べクトルを V q u e とし、登録側の特徴べクトルを V r e g , k とし、複数画像登録の場合の類似度 d m u t ( v q u e ' [ ^L v V

v r e g , 1 ' ^v r e g , 2 ' v r e g , n ] ) として、次式（ 2 7 、 2 8 ) に示す計算式に基づき類似度を計算すればょレ d V , 1V. , v， V V■

n k =

( 2 7 ) あるレは、

^■multi que ' reg.l ' r&a,2 ' 'v_reg,_n = min v_reg>k

k

( 2 8 ) 同様に 1 つの顔当たりの複数枚の画像登録と複数画像による検索の場合も、各組み合わせの類似度の平均や最小値を求め類似度を算出することで、一つの顔データに対する類似度を算出することができる。これは、動画像を複数画像と見倣すことで、本発明のマッチングシステムを動画像における顔認識に対しても適用できることを意味する。

また、上記説明は、同一人物の顔の同定や顔の識別を中心になされたが、例えば、男性の顔を一つのカテゴリー、女性の顔を一つのカテゴリーと考えて、それぞれの分布に関する情報を求め、男女の顔を識別する性別識別を行ったり、笑った顔、怒った顔、悲しい顔などの表情のカテゴリ一を考えて、顔の表情を認識する表情認識に適用することも可能である。 1 0 代、 2 0 代、 3 0 代、 4 0 代というようにカテゴリーを設定し、そのカテゴリー毎に誤差分布、クラス内分布やクラス間分布を求めることで、年齢判別を行うことも可能であり、様々な顔認識に対して本発明を適用することが可能である。

以上詳細に説明したように、本発明によれば、顔特徴量に対してその信頼性を表現するための信頼性指標を加えて顔メタデータとして生成することで、信頼性指標を通じた適応的な距離を導くことができ、その距離を用いて精度の高い顔認識を行うことが可能となる。

Claims

請求の範囲

1 . 顔画像部から顔特徴量を抽出する顔特徴抽出部と、前記顔画像から、前記顔特徴量に対する信頼性を表す信頼性指標を抽出する信頼性指標抽出部とを備え、

前記顔特徴量および前記信頼性指標が顔メタデータとして生成される顔メタデータ生成装置。

2 . 前記信頼性指標抽出部は、前記信頼性指標として、前記顔画像のコントラスト指標を抽出する

請求項 1 に記載の顔メタデ一夕生成装置。

3 . 前記信頼性指標抽出部は、前記顔画像のコントラスト指標として、前記顔画像中の画素値の最大値と最小値との差を抽出する

請求項 2 に記載の顔メタデータ生成装置。

4 . 前記信頼性指標抽出部は、前記顔画像のコントラスト指標として、前記顔画像部中の画素値の分散および標準偏差の一方を抽出する

請求項 2 に記載の顔メタデータ生成装置。

5 . 前記信頼性指標抽出部は、前記信頼性指標として、前記顔画像の非対称性指標を抽出する

請求項 1 に記載の顔メタデータ生成装置。

6 . 前記信頼性指標抽出部は、前記顔画像の非対称性指標として、前記顔画像と該前記顔画像を左右反転することにより得られる画像としての反転画像との間の差分の最大値を抽出する

請求項 5 に記載の顔メタデータ生成装置。

7 . 前記信頼性指標抽出部は、前記顔画像の非対称性指標として、前記顔画像と該前記顔画像を左右反転することにより得られる画像としての反転画像との間の差分画像の画素値のべき乗の和および平均のいずれかを抽出する請求項 5 に記載の顔メタデータ生成装置。

8 . 前記信頼性指標抽出部は、

前記顔画像のコントラスト指標を抽出する第 1 信頼性指標抽出部と、

前記顔画像の非対称性指標を抽出する第 2 信頼性指標抽出部と

を備える請求項 1 に記載の顔メタデータ生成装置。

9 . 前記第 1 信頼性指標抽出部は、前記顔画像のコン卜ラスト指標として、前記顔画像部中の画素値の最大値と最小値の差を抽出し、

前記第 2 信頼性指標抽出部は、前記顔画像部の非対称性指標として、前記顔画像部と該顔画像部を左右反転することにより得られる画像としての反転画像との間の差分の最大値を抽出する

請求項 8 に記載の顔メタデータ生成装置。

1 0 . 前記第 1 信頼性指標抽出部は、前記顔画像のコントラスト指標として、前記顔画像中の画素値の分散および標準偏差の一方を抽出し、

前記第 2 信頼性指標抽出部は、前記顔画像の非対称性指標として、前記顔画像と該顔画像を左右反転することにより得られる画像としての反転画像との間の差分画像の画素値のべき乗の和および平均の一方を抽出する

請求項 8 に記載の顔メタデータ生成装置。

1 1 . 前記顔特徴抽出部は、前記顔画像から得られた特徵ベクトルを Λ としたときに、前記特徴ベクトル Λ の部分基底べクトルによって特定される基底行列 U と前記特徴べクトル Λ の平均べクトル Ψ とを用いて特徴べクトル v = U ^τ ( Λ — ）を算出し、前記特徴ベクトル V を前記顔特徴量として抽出する

請求項 1 ないし 1 0 のいずれかに記載の顔メタデータ生成装置。

1 2 . 前記基底行列 U は、顔画像サンプル集合 [ Λ ] の主成分分析によって得られる基底べクトルの中から選択された前記部分基底べクトルによって特定される

請求項 1 1 に記載の顔メタデータ生成装置。

1 3 . 前記基底行列 U は、前記顔画像サンプルにおける前記特徴ベクトル集合 [ Λ ] の主成分分析によって得られる基底べクトルの中から選択された部分基底べクトルによつて特定される基底行列と、前記顔画像部を左右反転する画素値の変換と対応するように前記基底べクトルの要素を入れ換えた反転部分基底べクトルによって特定される基底行列との線形和によって得られる

請求項 1 1 に記載の顔メタデータ生成装置。

1 4 . 前記特徴べクトル Λ は前記顔画像中の各画素値を要素とするべクトルである

請求項 1 1 ないし 1 3 のいずれかに記載の顔メタデータ生成装置。

1 5 . 前記特徴ベクトル Λ は、前記顔画像をフーリエ変換し、得られる複素フーリエ成分の各成分の大きさを要素とするべク 1、ルである

1 6 . 前記顔画像から抽出された顔特徴量と当該顔特徴量に対する信頼性を表す信頼性指標とに基づいて前記類似度を算出する顔類似度算出装置。

1 7 . 前記顔特徴量に対する前記信頼性指標を用いて、前記顔特徴量間の差べクトルの事後分布に関するパラメ一夕情報を推定する分布推定部と、

前記パラメータ情報を用いて前記事後分布の対数尤度から導かれる前記顔特徴間の距離を前記 |g似度として算出する距離算出部と

を具備する請求項 1 6 に記載の顔類似度算出装置。

1 8 . 前記距離算出部は、前記顔特徴量間の差べクトルの前記事後分布が正規分布であるとき、前記信頼性指標における正規分布の前記対数尤度から導かれる適応的マハラノビス距離を前記類似度として算出する

請求項 1 7 に記載の顔類似度算出装置。

1 9 . 前記分布推定部は、前記信頼性指標 [ 0 i ] に対する前記差ベクトル s の各要素 k の分散 σ ₃ Θ

. ] ) 2 を推定し、

前記距離算出部は、前記各要素 k の分散 σ _{s k} ( [ θ . ] ) 2 を用いて前記適応的マハラノビス距離を計算する請求項 1 8 に記載の顔類似度算出装置。

2 0 . 前記分布推定部は、前記信頼性指標 ]： 0 ] に対する前記差ベクトル s の各要素 k の分散 σ _s ( [ θ . ] ) 2 をあらかじめ記憶する分散値テーブルを備え、

前記信頼性指標 [ 0 i ] に基づいて前記分散値テープルを参照して、前記適応的マハラノビス距離の計算で必要となる分散を読出し、

前記距離算出部は、前記各要素 k の分散 σ _{s k} ( [ θ . ] ) 2 を用いて前記適応的マ八ラノビス距離を計算する請求項 1 9 に記載の顔類似度算出装置。

2 1 . 前記顔特徴量間の差べクトルの事後分布が混合分布であるとき、前記信頼性指標における混合分布の対数尤度から導かれる前記適応的混合マハラノビス距離を前記類似度として算出する

請求項 1 7 に記載の顔類似度算出装置。

2 2 . 前記顔特徴量に対する前記信頼性指標を用いて、一致と見倣されるべきクラス内における前記顔特徴量間の差ベクトルの事後分布であるクラス内分布と、不一致と見倣されるべきクラス間における前記顔特徴量間の前記差べクトルの前記事後分布であるクラス間分布とに関するパラメータ情報を推定し、

前記パラメ一夕情報を用いて前記クラス内分布および前記クラス間分布の比の対数尤度から導かれる前記顔特徴量間の距離を前記類似度として算出する

請求項 1 6 に記載の顔獰似度算出装置。

2 3 . 前記クラス内分布および前記クラス間分布がそれぞれ正規分布であるとき、前記信頼性指標におけるそれぞれの分布の比の対数尤度から導かれる前記適応的判別距離を前記類似度として算出する

請求項 2 2 に記載の顔類似度算出装置。

2 4 . 前記信頼性指標 [ Θ . ] に対する前記差ベクトル s の各要素 k のクラス内分散 a _w ( ί Θ _. ] ) 2 およびクラス間分散 σ _{η k} ( [ θ . ] ) 2 を推定し、前記推定された分散に基づいて前記適応的判別距離を前記類似度として算出する

請求項 2 3 に記載の顔類似度算出装置。

2 5 . 前記信頼性指標 [ 0 . ] に対する差ベクトル s の各要素 k の前記クラス内分散び _w , ( [ Θ . ] ) 2 および前記クラス間分散 σ _Β ,. ( [ 0 丄 ] ) 2 の推定のために、前記クラス内分散 σ _w , _k ( ί θ _± ] ) 2 をあらかじめ記憶する第 1 分散値テーブルと、前記クラス間分散 σ _B , _k ( [ θ . ] ) 2 をあらかじめ記憶する第 2 分散値テーブルとを備え、

前記信頼性指標 [ 0 i ] に基づいて前記第 1 および第 2 分散値テーブルをそれぞれ参照して分散を推定し、

前記推定された分散に基づいて前記適応的判別距離を前記類似度として算出する

請求項 2 4 に記載の顔類似度算出装置。

2 6 . 前記クラス内分布および前記クラス間分布がそれぞれ混合分布であるとして、前記信頼性指標におけるそれぞれの混合分布の比の対数尤度から導かれる前記適応的混合判別距離を前記類似度として算出する

請求項 2 2 に記載の顔類似度算出装置。

2 7 . 第 1 顔画像を入力する画像入力部と、

前記第 1 顔画像部から顔特徴量を抽出し、前記第 1 顔画像部から、前記顔特徴量に対する信頼性を表す信頼性指標と抽出し、前記顔特徴量をと前記信頼性指標を第 1 顔メタデ一夕として生成する顔メタデータ生成部と、

複数の第 2 顔メタデータを蓄積する顔メタデータ蓄積部と、

前記第 1 顔メタデータと前記複数の第 2 顔メタデータの各々の間の顔類似度を算出する顔類似度算出部と、

入力された指令に応じて、前記画像入力部、前記顔メタデータ生成部、および前記顔類似度算出部を制御する制御部と

を具備する顔認識システム。

2 8 . 顔画像から抽出された顔特徴量と当該顔特徴量に対する信頼性を表す信頼性指標顔とを第 1 顔メタデータとして生成するステップと、

複数の第 2 顔メタデータの各々を読み出すステップと、前記第 1 顔メタデータと前記複数の第 2 顔メタデータの各々の前記顔特徴量と前記信頼性指標とに基づいて、前記第 1 顔メタデータと前記複数の第 2 顔メタデータの各々との間の顔類似度を算出するステップと、

前記顔類似度に従って前記顔画像のマッチング結果を出力するステップと

を具備する顔認識方法。

2 9 . ( a ) 顔画像から顔特徴量を抽出するステップと、

( b ) 前記顔画像から前記顔特徴量に対する信頼性を表す信頼性指標を抽出ステップと、

( c ) 前記顔特徴量および前記信頼性指標を顔メタデー夕として生成するステップと

を具備する顔メタデータ生成方法。

3 0 . 前記ステップ（ b ) は、前記信頼性指標として、前記顔画像のコントラスト指標を抽出するステップを具備する請求項 2 9 に記載の顔メタデータ生成方法。

3 1 . 前記ステップ（ b ) は、前記画像のコントラスト指標として、前記顔画像中の画素値の最大値と最小値との差を抽出するステップを具備する請求項 3 0 に記載の顔メタデータ生成方法。

3 2 . 前記ステップ（ b ) は、前記顔画像のコントラスト指標として、前記顔画像中の画素値の分散および標準偏差の一方を抽出するステップを具備する請求項 3 0 に記載の顔メタデータ生成方法。

3 3 . 前記ステップ（ b ) は、前記信頼性指標として、前記顔画像の非対称性指標を抽出するステップを具備する請求項 2 9 に記載の顔メタデータ生成方法。

3 4 . 前記ステップ（ b ) は、前記顔画像の非対称性指標として、前記顔画像と該顔画像を左右反転した画像としての反転画像との間の差分の最大値を抽出するステップを具備する請求項 3 3 に記載の顔メタデータ生成方法。

3 5 . 前記ステップ（ b ) は、前記顔画像の非対称性指標として、前記顔画像と反転画像との間の差分画像の画素値のべき乗の和および平均のいずれかを抽出するステップを具備する請求項 3 3 に記載の顔メタデータ生成方法。

3 6 . 前記信頼性指標は、前記顔画像のコントラスト指標および前記顔画像の非対称性指標である請求項 2 9 に記載の顔メタデータ生成方法。

3 7 . 前記ステップ（ b ) は、

前記顔画像のコン卜ラス卜指標として前記顔画像中の画素値の最大値と最小値の差を抽出するステップと、

前記顔画像の非対称性指標として前記顔画像と前記反転画像との間の差分の最大値を抽出するステップとを具備する請求項 3 6 に記載の顔メタデータ生成方法。

3 8 . 前記ステップ（ b ) は、

前記顔画像のコントラスト指標として前記顔画像中の画素値の分散および標準偏差の一方を抽出するステップと、前記顔画像の非対称性指標として前記顔画像と前記反転画像との間の差分画像の画素値のべき乗の和および平均の一方を抽出するステップと

を具備する請求項 3 6 に記載の顔メタデ一夕生成方法。

3 9 . 顔画像から抽出された顔特徴量と当該顔特徴量に対する信頼性を表す信頼性指標とに基づいて前記類似度を算出する顔類似度算出方法。

4 0 . 第 1 と第 2 顔画像の各々に対する顔特徴量に対する信頼性指標を用いて、前記顔特徴量間の差べクトルの事後分布に関するパラメータ情報を推定ステップと、

事後分布に関する前記パラメ一夕情報を用いて対数尤度から顔特徴間の距離を類似度として算出するステップとを具備する請求項 3 9 に記載の顔類似度算出方法。

4 1 . 前記顔特徴量間の差べクトルの事後分布が正規分布であるとして、前記信頼性指標における正規分布の対数尤度から導かれる適応的マハラノビス距離を類似度として算出する請求項 4 0 に記載の顔類似度算出方法

4 2 信頼性指標 [ θ ] 対する差ベクトル s の各要素 k の分散 σ 。 ₁ ( [ Θ _± ] ) 2 を推定するステップと、前記各要素 k の分散 σ _{3 1}, ( [ Θ . ] ) 2 を用いて適応的マハラノビス距離を計算するステップと

を具備する請求項 4 1 に記載の顔類似度算出方法。

4 3 . 信頼性指標 [ 0 . ] に対する差ベクトル s の各要素 k の分散 σ ₃ ( [ Θ . ] ) をあらかじめ分散値テーブルに記憶し、信頼性指標 [ 0 . ] によって前記分散値テ一ブルを参照することによって適応的マハラノビス距離の計算で必要となる分散値を生成する

請求項 4 2 に記載の顔類似度算出方法。

4 4 . 顔特徴量間の差べクトルの事後分布が混合分布であるとして、前記信頼性指標における混合分布の対数尤度から導かれる適応的混合マハラノビス距離を類似度として算出する

請求項 4 0 に記載の顔類似度算出方法。

4 5 . 比較する顔特徴量に対する信頼性指標を用いて、一致と見倣すべきクラス内における顔特徴量間の差べクトルの事後分布（クラス内分布）と、不一致と見倣すべきクラス間における顔特徴量間の差ベクトルの事後分布（クラス間分布）とに関するパラメータ情報を推定し、前記クラス内分布および前記クラス間分布の比の対数尤度から導かれる顔特徴量間の距離を類似度として算出する

請求項 3 9 に記載の顔類似度算出方法。

4 6 . 前記クラス内分布および前記クラス間分布がそれぞれ正規分布であるとして、前記信頼性指標におけるそれぞれの分布の比の対数尤度から導かれる適応的判別距離を類似度として算出する

請求項 4 5 に記載の顔類似度算出方法。

4 7 信頼性指標 [ 0 . ] に対する差ベクトル s の各要素 k のクラス内分散ひ _w ( [ 0 」 ] ) ² およびクラス間分散 σ _{Β k} ( [ θ _± ] ) 2 を推定するとで、適応的判別距離を類似度として算出する

請求項 4 6 に記載の顔類似度算出方法。

4 8 . 信頼性指標 [ 0 . ] に対する差ベクトル s の各要素 k のクラス内分散ひ _w ( ί Θ . 1 ) およびクラス間分散 σ _Β , ，， ( [ Θ . ] ) 2 の推定のために、 'クラス内分散 a _{w k} ( ί θ . ] ) をあらかじめ記憶する第 1 分散値テ —ブルと、クラス間分散び _Β , _k ( [ Θ _± ] ) 2 をあらかじめ記憶する第 2 分散値テーブルとを備え、

信頼性指標 [ 0 . ] によって第 1 および第 2 分散値テーブルをそれぞれ参照することで、適応的判別距離において必要となる分散値を推定する

請求項 4 7 に記載の顔類似度算出方法。

4 9 . 前記クラス内分布および前記クラス間分布がそれぞれ混合分布であるとして、前記信頼性指標におけるそれぞれの混合分布の比の対数尤度から導かれる適応的混合判別距離を類似度として算出する

請求項 4 5 に記載の顔類似度算出方法。

5 0 . 顔画像から顔特徴量を抽出し、

前記顔画像から、前記顔特徴量に対する信頼性を表す信頼性指標を抽出し、

前記顔特徴量および前記信頼性指標を顔メタデータとして生成する

ステップを有するメ夕デ一夕生成プログラムを格納する記録媒体。

5 1 . 前記画像から顔特徴量を抽出し、

前記顔特徴量に対する信頼性を表す信頼性指標を抽出し、

前記顔特徴量と前記信頼性指標とに基づいて類似度を算出する

ステップを具備する類似度算出プログラムを格納した記録媒体。

5 2 . 入力画像から抽出された顔特徴量と当該顔特徴量に対する信頼性を表す信頼性指標顔とを顔メタデータとして生成し、

生成された複数の顔メタデータを顔メタデータ蓄積部に蓄積し、

ある顔画像の顔メタデータと前記顔メタデータ蓄積部に蓄積された複数の顔メタデータの各々とを入力し、顔特徴量と当該顔特徴量に対する信頼性を表す信頼性指標とに基づいて顔類似度を算出し、

前記顔類似度に従って顔画像マッチング結果を出力するステップを有する顔認識プログラムを格納する記録媒体。