しかしながら、上記特許文献1に示す技術では、3次元形状全体、所謂大局的情報を用いることを前提としており、顔の基準方向の決定が必要であることから、上記姿勢変動等により顔に部分的な隠れが生じた場合(オクリュージョン)には、この基準方向が決定できず認証処理が実行できないことがあるなど、対応することができない。
また、上記特許文献2に示す技術では、3次元形状全体の重心を求め、平行移動及び重心回りに微小回転させて最小誤差を求める処理に時間がかかる。ましてや密な3次元形状データを用いる場合は処理時間が大幅にかかり、さらに認証速度が遅くなってしまう。上記顔に部分的な隠れが生じた場合(オクリュージョン)には、認証精度が低下する。また、計測された3次元形状そのものを保持しなければならないため、データベース容量が膨大になる。
本発明は、上記事情に鑑みてなされたもので、顔に部分的な隠れ等が生じた場合でも認証精度の低下を軽減することができ、また、処理に時間がかかることなく認証速度を向上させることができる認証システム及び認証方法を提供することを目的とする。
本発明に係る認証システムは、認証対象者の顔の2次元画像を取得する2次元画像取得手段と、前記2次元画像から、予め定められている前記顔の特徴的な部位である特徴部位を抽出する特徴部位抽出手段と、前記特徴部位の情報から前記顔の2次元的な特徴量である2次元顔特徴量を算出する2次元特徴量算出手段と、前記顔の全体的な3次元形状である全体3次元形状情報を取得する3次元形状取得手段と、前記全体3次元形状情報から、該全体3次元形状上の所定のラインであって、前記特徴部位以外の部位を含む所定数の3次元ラインを決定する決定手段と、前記決定手段により決定された3次元ラインにおける、前記全体3次元形状情報の局所的な情報としての局所3次元形状情報から、各3次元ラインの形状に関するライン形状情報であって、前記顔の3次元的な特徴量である3次元顔特徴量を算出する3次元特徴量算出手段と、前記認証対象者に対する認証動作を行うべく、前記2次元特徴量算出手段により算出された2次元顔特徴量と前記3次元特徴量算出手段により算出された3次元顔特徴量とを併せてなる総合的な顔特徴量と、予め用意された比較用顔特徴量とを比較する特徴量比較手段とを備えることを特徴とする。
上記構成によれば、2次元画像取得手段が、顔の2次元画像を取得し、特徴部位抽出手段によって、2次元画像取得手段により取得された2次元画像から顔の特徴的な部位である特徴部位が抽出され、2次元特徴量算出手段によって、特徴部位抽出手段により抽出された特徴部位の情報から顔の2次元的な特徴量である2次元顔特徴量が算出され、3次元形状取得手段によって、認証対象者の顔の全体的な3次元形状である全体3次元形状の情報が取得され、決定手段によって、3次元形状取得手段により取得された全体3次元形状情報から、該全体3次元形状上の所定のラインである少なくとも前記顔の特徴部位以外の部位を含む所定数の3次元ラインが決定される。そして、3次元特徴量算出手段によって、決定手段により決定された3次元ラインにおける、全体3次元形状情報の局所的な情報としての局所3次元形状情報から、各3次元ラインの形状に関するライン形状情報であって、顔の3次元的な特徴量である3次元顔特徴量が算出され、特徴量比較手段によって、認証対象者に対する認証動作を行うべく特徴量比較手段によって、2次元特徴量算出手段により算出された2次元顔特徴量と3次元特徴量算出手段により算出された3次元顔特徴量とを併せてなる総合的な顔特徴量と、予め用意された比較用顔特徴量とが比較される。
また、上記構成において、前記3次元形状取得手段は、前記特徴部位抽出手段により抽出された特徴部位の3次元座標を算出する3次元座標算出手段とをさらに備え、前記決定手段は、前記3次元座標算出手段により算出された特徴部位の3次元座標に基づいて前記3次元ラインを決定することが好ましい。(請求項2)
これによれば、3次元座標算出手段によって、特徴部位抽出手段により抽出された特徴部位の3次元座標が算出される。そして、決定手段によって、3次元座標算出手段により算出された特徴部位の3次元座標に基づいて3次元ラインが決定される。
また、上記構成において、前記決定手段は、前記3次元ラインを抽出するための抽出用ラインであって、前記特徴部位の3次元座標点間を結ぶ抽出用ラインを設定するとともに、前記全体3次元形状上の該抽出用ラインに対応するラインを前記3次元ラインとして決定することが好ましい。(請求項3)
これによれば、決定手段によって、3次元ラインを抽出するための抽出用ラインであって、特徴部位の3次元座標点間を結ぶ抽出用ラインが設定されるとともに、全体3次元形状上の該抽出用ラインに対応するラインが3次元ラインとして決定される。
また、上記構成において、前記全体3次元形状情報は、複数の3次元点からなる前記顔の形状データであって、前記決定手段は、前記抽出用ライン上に定義された複数の定義点を所定の投影中心から前記全体3次元形状上に投影してなる投影点に対応する前記3次元点に基づいて前記3次元ラインを決定することが好ましい。(請求項4)
これによれば、全体3次元形状情報が、複数の3次元点からなる顔の形状データとされ、決定手段によって、抽出用ライン上に定義された複数の定義点が所定の投影中心から全体3次元形状上に投影されてなる投影点に対応する3次元点に基づいて3次元ラインが決定される。
また、上記構成において、前記抽出用ライン上の定義点は等間隔に配置されていることが好ましい。(請求項5)
これによれば、抽出用ライン上の定義点が等間隔に配置されたものとされる。
また、上記構成において、前記抽出用ライン上の定義点は、前記顔の凹凸の程度が大きい場所に密に配置されていることが好ましい。(請求項6)
これによれば、抽出用ライン上の定義点が、顔の凹凸の程度が大きい場所に密に配置されたものとされる。
また、上記構成において、前記決定手段は、予め用意された前記顔の3次元モデル形状であって、前記3次元ラインを抽出するための抽出用ラインが該3次元モデル形状上に設定されてなる標準モデルを、前記全体3次元形状に近づけるべく変形し、該変形した標準モデル上の抽出用ラインに対応する前記全体3次元形状上のラインを前記3次元ラインとして決定することが好ましい。(請求項7)
これによれば、決定手段によって、予め用意された顔の3次元モデル形状であって、3次元ラインを抽出するための抽出用ラインが該3次元モデル形状上に設定されてなる標準モデルが、全体3次元形状に近づけられるべく変形され、該変形された標準モデル上の抽出用ラインに対応する全体3次元形状上のラインが3次元ラインとして決定される。
また、上記構成において、前記全体3次元形状情報は、複数の3次元点からなる前記顔の形状データであって、前記決定手段は、前記変形した標準モデル上の抽出用ライン上に定義された複数の定義点を所定の投影中心から前記全体3次元形状上に投影してなる投影点に対応する前記3次元点に基づいて前記3次元ラインを決定することが好ましい。(請求項8)
これによれば、全体3次元形状情報が、複数の3次元点からなる顔の形状データとされ、決定手段によって、変形した標準モデル上の抽出用ライン上に定義された複数の定義点が所定の投影中心から全体3次元形状上に投影されてなる投影点に対応する3次元点に基づいて3次元ラインが決定される。
また、上記構成において、前記決定手段は、前記全体3次元形状上の前記投影点の位置に3次元点が存在しない場合に、該投影点近傍の3次元点を用いた補間処理により算出した補間3次元点を用いて前記3次元ラインを決定することが好ましい。(請求項9)
これによれば、決定手段によって、全体3次元形状上の投影点の位置に3次元点が存在しない場合に、該投影点近傍の3次元点を用いた補間処理により算出された補間3次元点を用いて3次元ラインが決定される。
また、上記構成において、前記抽出用ラインは、複数本のラインからなることが好ましい。(請求項10)
これによれば、抽出用ラインが複数本のライン(抽出用ライン)からなるものとされる。
また、上記構成において、前記3次元特徴量算出手段は、前記3次元ラインにおける局所3次元形状情報を所定の曲線情報に変換したものを前記ライン形状情報として算出することが好ましい。(請求項11)
これによれば、3次元特徴量算出手段によって、3次元ラインにおける局所3次元形状情報が所定の曲線情報に変換されたものがライン形状情報として算出される。
また、上記構成において、前記3次元特徴量算出手段は、前記3次元顔特徴量として、各3次元ラインの相対位置関係の情報も含む3次元顔特徴量を算出することが好ましい。(請求項12)
これによれば、3次元特徴量算出手段によって、3次元顔特徴量として、各3次元ラインの相対位置関係の情報も含む3次元顔特徴量が算出される。
また、上記構成において、前記決定手段は、前記所定数の3次元ラインが前記顔の左右対称となる位置に配置されるように前記全体3次元形状における該3次元ラインを決定することが好ましい。(請求項13)
これによれば、決定手段によって、所定数の3次元ラインが顔の左右対称となる位置に配置されるように全体3次元形状における該3次元ラインが決定される。
また、上記構成において、前記決定手段は、前記所定数の3次元ラインが少なくとも前記顔の鼻及び頬の部位を含むように前記全体3次元形状における該3次元ラインを決定することが好ましい。(請求項14)
これによれば、決定手段によって、所定数の3次元ラインが少なくとも顔の鼻及び頬の部位を含むように全体3次元形状における該3次元ラインが決定される。
また、上記構成において、前記特徴量比較手段は、前記複数本の抽出用ラインに対応する複数の3次元ラインから得られた複数の3次元顔特徴量と、前記比較用顔特徴量との間の距離情報に基づいて前記比較を行うことが好ましい。(請求項15)
これによれば、特徴量比較手段によって、複数本の抽出用ラインに対応する複数の3次元ラインから得られた複数の3次元顔特徴量と、比較用顔特徴量との間の距離情報(本実施形態ではユークリッド距離の情報)に基づいて上記比較が行われる。
また、上記構成において、前記特徴量比較手段は、前記複数本の抽出用ラインに対応する複数の3次元ラインから得られた複数の3次元顔特徴量と、前記比較用顔特徴量との間の距離情報であって、該距離が最小となる場合の最小距離情報に基づいて前記比較を行うことが好ましい。(請求項16)
これによれば、特徴量比較手段によって、複数本の抽出用ラインに対応する複数の3次元ラインから得られた複数の3次元顔特徴量と、比較用顔特徴量との間の距離情報であって、該距離が最小となる場合の最小距離情報に基づいて上記比較が行われる。
また、上記構成において、前記2次元顔特徴量を算出するための特徴部位の情報はテクスチャ情報であって、当該テクスチャ情報に対して、前記顔の姿勢に関する補正である姿勢変動補正及び顔に対する光源の向きに関する補正である光源変動補正を行う補正手段をさらに備えることが好ましい。(請求項17)
これによれば、2次元顔特徴量を算出するための特徴部位の情報がテクスチャ情報とされ、補正手段によって、当該テクスチャ情報に対して、顔の姿勢に関する補正である姿勢変動補正及び顔に対する光源の向きに関する補正である光源変動補正が行われる。
また、上記構成において、前記3次元形状取得手段は、前記顔の2次元画像を撮影する少なくとも2つの撮影装置と、当該各撮影装置から得られた2枚の2次元画像から、位相限定相関法による演算によって高精度な対応点検索処理を行い、3次元再構成を行うことで、前記全体3次元形状を算出する3次元形状算出手段とを備えることが好ましい。(請求項18)
これによれば、3次元形状取得手段において、少なくとも2つの撮影装置によって顔の2次元画像が撮影され、3次元形状算出手段によって、当該各撮影装置から得られた2枚の2次元画像から位相限定相関法による演算によって高精度な対応点検索処理が行われ、3次元再構成が行われることで、全体3次元形状が算出される。
また、上記構成において、前記3次元特徴量算出手段により算出される3次元顔特徴量はベクトル量であって、該ベクトル量に対応する前記比較用顔特徴量としての比較用ベクトル量を記憶する記憶手段をさらに備えることが好ましい。(請求項19)
これによれば、3次元特徴量算出手段により算出される3次元顔特徴量がベクトル量とされ、記憶手段によって、該ベクトル量に対応する比較用顔特徴量としての比較用ベクトル量が記憶される。
また、本発明に係る認証方法は、認証対象者の顔の全体的な3次元形状である全体3次元形状の情報を取得する第1の工程と、前記全体3次元形状情報から、該全体3次元形状上の所定のラインである所定数の3次元ラインを決定する第2の工程と、前記3次元ラインにおける、前記全体3次元形状情報の局所的な情報としての局所3次元形状情報から、各3次元ラインの形状に関するライン形状情報であって、前記顔の3次元的な特徴量である3次元顔特徴量を算出する第3の工程と、前記認証対象者に対する認証動作を行うべく前記3次元顔特徴量と予め用意された比較用顔特徴量とを比較する第4の工程とを有することを特徴とする。(請求項20)
上記構成によれば、第1の工程において、認証対象者の顔の全体的な3次元形状である全体3次元形状の情報が取得され、第2の工程において、全体3次元形状情報から、該全体3次元形状上の所定のラインである所定数の3次元ラインが決定される。第3の工程において、3次元ラインにおける、全体3次元形状情報の局所的な情報としての局所3次元形状情報から、各3次元ラインの形状に関するライン形状情報であって、顔の3次元的な特徴量である3次元顔特徴量が算出される。そして、第4の工程において、認証対象者に対する認証動作を行うべく3次元顔特徴量と予め用意された比較用顔特徴量とが比較される。
さらに、上記構成において、前記第1の工程は、前記顔の2次元画像を取得する第5の工程を含むものであり、前記2次元画像から前記顔の特徴的な部位である特徴部位を抽出する第6の工程と、前記特徴部位の3次元座標を算出する第7の工程とをさらに有し、前記第2の工程は、前記特徴部位の3次元座標に基づいて前記3次元ラインを決定する工程であることが好ましい。(請求項21)
これによれば、第1の工程が、顔の2次元画像を取得する第5の工程を含む工程とされ、第6の工程において、2次元画像から顔の特徴的な部位である特徴部位が抽出される。また、第7の工程において、特徴部位の3次元座標が算出される。そして、上記第2の工程において、特徴部位の3次元座標に基づいて3次元ラインが決定される。
請求項1に係る認証システムによれば、顔の2次元画像から顔の特徴的な部位である特徴部位が抽出され、特徴部位の情報から顔の2次元的な特徴量である2次元顔特徴量が算出され、認証対象者の顔の全体3次元形状から所定数の3次元ラインが決定され、この3次元ラインにおける局所3次元形状情報から3次元顔特徴量が算出され、2次元顔特徴量と3次元顔特徴量とを併せてなる総合的な顔特徴量と比較用顔特徴量との比較が行われることで認証対象者に対する認証動作が行われるので、すなわち顔の全体3次元形状の情報をそのまま用いるのではなく、顔全体の3次元形状情報から局所的な情報(3次元ライン情報;ライン形状情報)を抽出し、この抽出した3次元ライン情報に基づいて認証を行う構成であるので、顔に部分的な隠れ等が生じたとしても、必ずしもこの隠れ等が生じた部分を用いずともよく、この部分以外の局所情報を用いて認証を行うことができ、認証精度の低下を軽減することができる。また、データ量の多い全体3次元形状(3次元データ)の情報をそのまま扱わなくてもよいため、つまり部分的な3次元形状データを扱えばよいので、処理に時間がかかることなく認証速度を向上させることができる。
また、2次元画像から顔の特徴的な部位である特徴部位が抽出されて、顔の2次元顔特徴量が算出され、この2次元顔特徴量と3次元顔特徴量とを併せてなる総合的な顔特徴量と、比較用顔特徴量とが比較されるので、2次元顔特徴量と3次元顔特徴量とを用いたより高精度な認証を行うことが可能となる。
少なくとも顔の特徴部位以外の部位を含む3次元ラインにおける局所3次元形状情報から3次元顔特徴量が算出されるので、2次元顔特徴量と3次元顔特徴量とを用いた認証(多重認証)を行うに際して、2次元顔特徴量として特徴を抽出し難い特徴部位以外の部位の特徴を、3次元顔特徴量として含むことができ、すなわち2次元顔特徴量でカバーすることができない特徴量を3次元顔特徴量でカバーすることができ、ひいてはより高精度な認証を行うことができる。
請求項2に係る認証システムによれば、この特徴部位の3次元座標が算出され、この3次元座標に基づいて3次元ラインが決定されるので、3次元ラインを決定するに際して2次元的な特徴部位の情報と関連付けることができ、当該3次元ラインの情報と共に特徴部位の情報を用いた高精度の認証を行うことが可能となる。
請求項3に係る認証システムによれば、特徴部位の3次元座標点間を結ぶ抽出用ラインが設定され、全体3次元形状上のこの抽出用ラインに対応するラインが3次元ラインとして決定されるので、抽出用ラインを3次元座標点間を結ぶことで容易に設定することができ、当該設定した抽出用ラインを用いて3次元ラインを容易に決定することができる。
請求項4に係る認証システムによれば、抽出用ライン上の複数の定義点が全体3次元形状上に投影されてなる投影点に対応する3次元点に基づいて3次元ラインが決定されるので、投影という簡易な方法で容易に且つ確実に抽出用ラインから3次元ラインを決定することができる。
請求項5に係る認証システムによれば、抽出用ライン上の定義点が等間隔に配置されているので、当該定義点からなる抽出用ラインの設定が容易となる。
請求項6に係る認証システムによれば、抽出用ライン上において定義点が顔の凹凸の程度が大きい場所すなわち顔の特徴が良く表される場所で密に配置されているので、抽出用ラインを用いて求めた3次元ラインから得られる3次元顔特徴量に対して、顔の特徴情報を確実に反映することが可能となる。
請求項7に係る認証システムによれば、予め抽出用ラインが設定された標準モデルが全体3次元形状に近づくように(合致するように)変形され、この変形された標準モデル上の抽出用ラインに対応する全体3次元形状上のラインが3次元ラインとして決定されるので、2次元画像を取得したり、この2次元画像から特徴部位(2次元顔特徴量)を抽出するとともに抽出用ラインを設定する等の動作及び構成を必要とせず、容易に全体3次元形状における3次元ラインを決定することができる。
請求項8に係る認証システムによれば、変形した標準モデル上の抽出用ライン上の複数の定義点が全体3次元形状上に投影されてなる投影点に対応する3次元点に基づいて3次元ラインが決定されるので、投影という簡易な方法で容易に且つ確実に抽出用ラインから3次元ラインを決定することができる。
請求項9に係る認証システムによれば、全体3次元形状上の投影点の位置に3次元点が存在しない場合に、該投影点近傍の3次元点を用いた補間処理により算出された補間3次元点を用いて3次元ラインが決定されるので、全体3次元形状上の投影点の位置に3次元点が存在しない場合であっても、補間3次元点を用いて3次元ラインを決定することができ、ひいては顔の特徴が精度良く反映された3次元顔特徴量を得ることができる。
請求項10に係る認証システムによれば、抽出用ラインが複数本のライン(抽出用ライン)からなるものとされるので、抽出用ラインに対応する3次元ラインの決定において、抽出用ライン上の定義点を例えば全体3次元形状上に投影して3次元ラインを構成する3次元点を選択する際の裕度を確保するといったことが可能となり、ひいては抽出用ラインを用いて複数のラインを帯状に複数本選択することでズレの軽減が可能になり、精度良くライン抽出ができる。
請求項11に係る認証システムによれば、3次元ラインの局所領域形状情報として、3次元ラインにおける局所3次元形状情報が所定の曲線情報に変換されたものが用いられるので、すなわち3次元形状情報がそのまま用いられるのではなく、これを変換して曲線情報(例えば曲率)として扱う構成であるので、次元圧縮が可能となり、処理が高速となる。
請求項12に係る認証システムによれば、3次元顔特徴量が、各3次元ラインの相対位置関係の情報も含むものとされるので、この3次元顔特徴量によって、各3次元ラインにおける個々の特徴だけでなく、顔全体に亘っての特徴を表すことが可能となり(顔の大域形状情報を扱うことができ)、より高精度の認証を行うことが可能となる。
請求項13に係る認証システムによれば、3次元ラインが顔の左右対称の位置に配置されるので、全体3次元形状における3次元ラインの(位置の)決定が効率良く行えるようになり処理時間が短縮されるとともに、データの取り扱い性が向上する。
請求項14に係る認証システムによれば、少なくとも顔の鼻及び頬の部位が含まれるように全体3次元形状における3次元ラインが決定されるので、当該3次元ラインを、例えば髪で隠れてしまう部位(例えば額)や計測し難い部位(例えば口髭を有する場合の口)を避けて設定することができて、この3次元ラインから精度良く3次元顔特徴量を算出することができ、ひいては高精度の認証を行うことが可能となる。
請求項15に係る認証システムによれば、複数の3次元ラインから得られた複数の3次元顔特徴量と比較用顔特徴量との間の距離情報に基づいて特徴量比較手段による比較処理が行われるので、3次元顔特徴量と比較用顔特徴量との個数が1対1に対応していない場合であっても、容易に特徴量比較手段による比較処理を実行することができる。
請求項16に係る認証システムによれば、複数の3次元ラインから得られた複数の3次元顔特徴量と比較用顔特徴量との間の距離が最小となる場合の最小距離情報に基づいて特徴量比較手段による比較処理が行われるので、3次元顔特徴量と比較用顔特徴量との個数が1対1に対応していない場合であっても、容易に且つ精度良く特徴量比較手段による比較処理を実行することができる。
請求項17に係る認証システムによれば、2次元顔特徴量を算出するための特徴部位のテクスチャ情報に対して、顔の姿勢に関する補正である姿勢変動補正及び顔に対する光源の向きに関する補正が行われるので、姿勢変動補正及び光源変動補正がなされたテクスチャ情報に基づいて適正な2次元顔特徴量を得ることができ、ひいてはより高精度な認証を行うことができる。
請求項18に係る認証システムによれば、少なくとも2つの撮影装置から得られた2枚の2次元画像から位相限定相関法による演算によって高精度な対応点検索処理が行われ、3次元再構成が行われることで、全体3次元形状が算出されるので、高価な3次元撮影装置等を用いることなく低コストで、且つ位相限定相関法により精度良く全体3次元形状を算出することができる。
請求項19に係る認証システムによれば、記憶手段によって、3次元顔特徴量であるベクトル量に対応する比較用顔特徴量としての比較用ベクトル量が記憶されるので、すなわち比較用顔特徴量として記憶されるデータが、計測された所謂密な3次元形状データでなくベクトル量となるので、記憶するデータ量を小さくすることができる(メモリ容量が少なくて済む)とともに、データの扱いが容易となる。
請求項20に係る認証方法によれば、認証対象者の顔の全体3次元形状から所定数の3次元ラインが決定され、この3次元ラインにおける局所3次元形状情報から3次元顔特徴量が算出され、この3次元顔特徴量と比較用顔特徴量との比較が行われることで認証対象者に対する認証動作が行われるので、すなわち顔の全体3次元形状の情報をそのまま用いるのではなく、顔全体の3次元形状情報から局所的な情報(3次元ライン情報;ライン形状情報)を抽出し、この抽出した3次元ライン情報に基づいて認証を行う構成であるので、顔に部分的な隠れ等が生じたとしても、必ずしもこの隠れ等が生じた部分を用いずともよく、この部分以外の局所情報を用いて認証を行うことができ、認証精度の低下を軽減することができる。また、データ量の多い全体3次元形状(3次元データ)の情報をそのまま扱わなくてもよいため、つまり部分的な3次元形状データを扱えばよいので、処理に時間がかかることなく認証速度を向上させることができる。
請求項21に係る認証方法によれば、2次元画像から顔の特徴的な部位である特徴部位が抽出されてこの特徴部位の3次元座標が算出され、この3次元座標に基づいて3次元ラインが決定されるので、3次元ラインを決定するに際して2次元的な特徴部位の情報と関連付けることができ、当該3次元ラインの情報と共に特徴部位の情報を用いた高精度の認証を行うことが可能となる。
図1は、本発明の実施形態に係る認証システム1の一例を示す概略構成図である。図1に示すように認証システム1は、顔による個人認証(以降、顔認証という)を行うものであり、コントローラ10と2台の撮影カメラ(2次元カメラ;2Dカメラ)(以下、単に「カメラ」ともいう)CA1及びCA2とを備えている。カメラCA1及びCA2は、それぞれ異なる位置から認証対象者HMの顔を撮影できるように配置されている。カメラCA1及びCA2によって認証対象者HMの顔画像が撮影されると、この撮影により得られる認証対象者HMの外観情報すなわち2種類の顔画像がコントローラ10に通信線を介して送信される。なお、各カメラとコントローラ10との間での画像データの通信方式は、有線方式に限定されず、無線方式であってもよい。また、上記顔画像は顔部分の画像だけでなく背景画像をも含む画像となっている。
図2は、コントローラ10の全体的な構成の一例を示す模式図である。図2に示すようにコントローラ10は、パーソナルコンピュータ(PC)等の情報処理装置であり、CPU2、記憶部3、メディアドライブ4、液晶ディスプレイなどの表示部5、キーボード6a及びポインティングデバイスであるマウス6bなどの入力部6、及びネットワークカードなどの通信部7を備えている。記憶部3は、ハードディスクドライブ(HDD)3a及びRAM(半導体メモリ)3bなどの複数の記憶媒体を備えている。また、メディアドライブ4は、CD−ROM、DVD(Digital Versatile Disk)、フレキシブルディスク及びメモリカードなどの可搬性の記憶媒体8からその中に記録されている情報を読み出すことができる。なお、このコントローラ10に対して供給される情報は、記録媒体8を介して供給される場合に限定されず、LAN(Local Area Network)やインターネットなどのネットワークを介して供給されてもよい。なお、コントローラ10は、このシステム用に製作された専用のコントローラ(本体制御装置)であってもよく、以下に説明する機能を備えているようなものであればよい。
図3は、コントローラ10が備える顔認証の機能を説明するための機能ブロック図である。図3に示すようにコントローラ10は、画像入力部11、顔領域検出部12、顔部位検出部13、顔部位3D計算部14、姿勢・光源補正部15、標準モデル記憶部16、2次元認証部17、顔領域3D計算部18、3次元認証部19、類似度計算部20、登録データ記憶部21及び判定部22を備えている。
画像入力部11は、カメラCA1及びCA2による撮影により得られた認証対象者HMの顔画像を入力するものである。画像入力部11は、第1画像入力部11a及び第2画像入力部11bを備えており、それぞれに対してカメラCA1及びCA2から送信されてきた顔画像が入力される、すなわち合計2枚の顔画像が入力される。ところで、本実施形態では、入力された顔画像を用いて2次元認証(2D認証)と3次元認証(3D認証)とを行い(このことを多重認証するという)、これらの結果に基づいて判定を行う構成であるため、2次元画像(2D画像)と3次元形状データ(3D形状データ)とが必要となる。当該2D画像及び3D形状データを取得するための入力装置(2D画像・3次元(3D)計測の入力装置)としては、一般的な2Dカメラ(ステレオカメラ)を複数台(2〜N台)用いる方法がある。この場合、2枚以上の2D画像から顔の3次元形状(3D形状)を算出する。
ただし、これに限らず、3D形状データを取得する方法として、光切断方式による非接触3次元デジタイザのような3次元計測装置(3D計測装置;3Dカメラ)を用いてもよい。本実施形態では2台のカメラCA1及びCA2を用いる構成であるため、2枚の2D画像(顔画像)から顔の3D形状を算出する必要があるが、上記非接触3次元デジタイザなどの3D計測装置を用いる(1台のカメラと1台の3D計測装置を用いる)場合は、3D計測装置により3D形状データが直接取得可能であるため2D画像から算出する必要はない。さらに、3D形状データ取得用のカメラと2D画像取得用のカメラとを兼用しているタイプの3D計測装置では、上述のように2D画像取得のためのカメラを別途用意する必要もなくなる。
顔領域検出部12は、画像入力部11に入力された顔画像から顔領域を検出(特定、抽出)するものである。顔領域検出部12は、第1顔領域検出部12a及び第2顔領域検出部12bを備えており、それぞれ第1画像入力部11a及び第2画像入力部11bから送信されてきた顔画像から顔領域(顔領域画像)を検出する。具体的には、例えば予め用意された標準の顔画像を用いたテンプレートマッチングを行うことにより、顔画像から顔の存在している領域を抽出する(切り出す)処理を行う。
なお、顔領域の検出手法として、以下1.〜3.に示す方法を用いてもよく、また、その他の手法を用いても実現可能である。
1.顔画像に対して、所定サイズのウィンドウ領域(矩形領域)を走査しつつ、このウィンドウ領域内に人の顔を表した領域が含まれるか否かの判定を該ウィンドウ領域内の画素値と所定のしきい値とを比較することで行う方法(例えば、特開2003−22441号公報、特開平8−339445号公報)。なお、この方法によれば、動き情報や色情報を必要としない顔発見アルゴリズムによって、複雑背景の中から高速且つ高い認証率で顔領域を検出することができる。
2.複数人の顔部位の画像をトレーニングさせてその結果を学習辞書として記憶しておき、新たに入力された顔画像と比較することで顔領域検出の判定を行う所謂ニューラルネットを用いた方法(例えば、H.Rowley,S.Baluja,and T.Kanade.“Newral Network-Based Face Detection”In IEEE Patt.Anal.Mach.Intell,.volume 20,pages 22-38,1998.)。
3.Violaらの提案した検出器(Viola−Jones検出器)を用いた方法であって、様々な顔領域検出用の識別子を記憶しておき、これを段階的に用いてすなわち比較が進むにつれて使用する識別子の数を減少させていきながら顔領域検出の判定を行う方法(例えば、P. Viola and M. Jones. Rapid object detection using a boosted cascade of simple features. In Proc. of IEEE Conference on Computer Vision and Pattern Recognition, Kauai, HI, December 2001.)。なお、この方法によれば、顔と非顔との入り組んだ空間の識別関数を、簡単な画像特徴量を用いた単純な判別関数を複数組み合わせて構成することができる。
顔部位検出部13は、顔領域検出部12により検出した顔領域の画像から顔の特徴的な部位(特徴部位という)を検出(抽出、算出)するものである。顔の特徴的な部位を検出することを「顔部位検出」という。顔部位検出部13は、第1顔部位検出部13a及び第2顔部位検出部13bを備えており、それぞれ第1顔領域検出部12a及び第2顔領域検出部12bから送信されてきた顔領域画像から上記特徴部位の位置(画像上の座標)を検出する。顔の特徴部位は、目(例えば瞳中心、目尻、目頭、瞳の上下部)、眉(例えば眉の両端部や中央部)、鼻(例えば小鼻の端、中央下部、或いは鼻孔)、口(例えば左右の口の端、唇中央部の上下部)或いは下顎尖端部などの部位が挙げられる。本実施形態では、顔部位検出部13により、図4に示されるような各特徴部位の特徴点Q1〜Q23の座標が算出される。なお、抽出する特徴点の部位は適宜設定すればよく、必要に応じて増減可能である。また、この特徴部位の検出は特徴部位の標準的なテンプレートを用いたテンプレートマッチングなど、種々の方法で行うことが可能である。
上記算出される特徴点Q1〜Q23の座標は、上記カメラCA1及びCA2より入力された各画像上の座標として表される。例えば口の右端に相当する特徴点Q20について言えば、2枚の画像G1、G2(後述の図5参照)それぞれにおいて当該特徴点Q20の座標値が求められる。具体的には、画像G1及びG2の端点を原点Oとして、特徴点Q20の画像G1上の座標(x1、y1)が算出され、また、特徴点Q20の画像G2上の座標(x2、y2)が算出される。
また、顔部位検出部13は、上記顔領域の画像から、各特徴点の座標を算出するとともに、各特徴点を頂点とする領域(特徴領域という)内の各画素の輝度値を、この領域が有する情報(テクスチャ情報という)として取得する。本実施形態の場合、入力される画像は2枚であるので、顔部位検出部13は、これら画像(画像G1、G2)における互いに対応する特徴領域内の対応する画素における例えば平均の輝度値を算出し、こ各画素の平均輝度値を当該特徴領域におけるテクスチャ情報として用いる。
なお、上記顔部位検出の手法として、例えば特開平9−102043号公報「画像内の要素の位置検出」に提案されているような方法を採用してもよい。また、補助光を使用することで顔部位の形状から検出するような方法や、上述と同様のニューラルネットによる学習を用いた方法、或いはGabor(ガボール)ウェーブレット変換やGaborでない通常のウェーブレット変換による周波数解析を用いた方法を採用してもよい。
顔部位3D計算部14は、顔部位検出部13において検出された顔の特徴部位の座標から該各特徴部位の3次元における座標を算出する、すなわち、顔部位検出部13において検出された各特徴点Qjの各画像Gi(i=1,・・・,N)における2次元座標(2D座標)Ui(j)と、各画像Giを撮影したカメラのカメラパラメータPi(i=1,・・・,N)とに基づいて、謂わば三角測量の原理で各特徴部位すなわち各特徴点Qjの3次元座標(3D座標)M(j)(j=1,・・・,Mf)を算出する(所謂「3次元再構成」する)ものである。ただし、記号「N」はN台のカメラ(ここではN=2)を示し、また、記号「Mf」は計測点或いは特徴点の数(Mf個)を示す。なお、各特徴点Qjの3D座標M(j)を纏めてなる3次元的な顔のデータのことを「3D顔部位形状データ」という。
以下に、この3D座標M(j)を算出する方法の具体的な一例を説明する。
空間のワールド座標(X,Y,Z)Tと、画像上の座標(x,y)とは以下の(1・1)式に示す関係が成り立っている。
但し、(1・1)式中の記号「w」は0(ゼロ)でない定数であり、記号「P」は透視投影行列(カメラパラメータ)を表す。
上記座標の表記に、以下の(1・2)式に示すように1次元多いベクトルを用いているが、この表記は斉次座標と呼ばれる。斉次座標では、座標を表すベクトルの0(ゼロ)でない定数倍つまり上記における(wx,wy,w)Tと(x,y,1)Tとなどが同じ点を表すものとする。すなわち、空間の点の斉次座標をM=(X,Y,Z,1)Tとし、またその空間点の画像における斉次座標をu=(x,y,1)Tとし、「=」と「〜」とを組み合わせてなる記号を、定数倍であることを許せば等しいので左辺は右辺の0でない定数倍に等しい、ということを表す記号であるとすると、上記(1・1)式は以下の(1・3)式で表される。
ここで、透視投影行列Pは、3×4の行列式であり、その各成分を以下の(1・4)式に示すものとすると、上記(1・1)式における「w」を消去することにより、空間と画像との座標の関係は以下の(1・5)及び(1・6)式に示すようになる。
但し、ここで注意する点としては、(1・3)式により定数倍の自由度を許していることから、Pの各成分は各パラメータを用いて組み合わされたものであって独立ではない。
例えば図5に示すように、自由な位置に配置された、カメラパラメータの異なる一般的な2台のカメラ(これらを第1カメラ、第2カメラという)を用いて構成されたシステムでは、ワールド座標(X,Y,Z)Tと、その点(ワールド座標点)に対応する第1及び第2カメラそれぞれの画像G1、G2上の座標(x1,y1)、(x2,y2)は、それぞれのカメラパラメータP1、P2を用いて以下の(1・7)式で表される。
但し、(1・7)式中の記号「ui」及び記号「M」は、それぞれ以下の(1・8)式に示すものを表している。
したがって、透視投影行列P1、P2がわかっている場合は、その画像上での特徴点の位置座標(x1,y1)、(x2,y2)の組から上記(1・7)及び(1・8)式をw1、w2、X、Y、Zの方程式と見なして解くことにより当該特徴点の空間における座標を求めることで、3次元再構成を行うことができる。すなわち、w1、w2を消去することにより(1・5)及び(1・6)式が得られるので、記号「P1 ij」はP1、記号「P2 ij」はP2の(i,j)成分を表すものであるとすると、当該関係式を整理することにより以下の(1・9)式となり、X、Y、Zの連立一次方程式となるので、これら方程式を解くことで当該特徴点の3次元空間(3D空間)上の座標(X,Y,Z)を求めることができる。なお、(1・9)式では、3つの未知数X、Y、Zに対して4つの方程式が与えられている。これは、(x1,y1)、(x2,y2)の4つの成分は独立でないことを意味している。その他の特徴点も同様に空間上の座標が算出される。
姿勢・光源補正部15は、顔部位検出部13により算出されたテクスチャ情報に対する姿勢変動補正及び光源変動補正を行うものである。姿勢変動補正は、顔の姿勢つまり向き(傾き)の違いによるテクスチャへの影響を補正するものである。光源変動補正は、顔に対する光源の向き(傾き)の違いによるテクスチャへの影響を補正するものである。
姿勢・光源補正部15は、このテクスチャ情報に対する姿勢変動補正及び光源変動補正に際して、予め準備された一般的(標準的)な顔のモデルである標準モデル(標準立体モデル;後述の図7参照)を用いる。
<姿勢変動補正>
(形状情報補正)
テクスチャ情報に対する姿勢変動補正を行うに際して、先ず上記3D顔部位形状データ(各特徴点Qjの3D座標M(j))の形状補正を行う。すなわち、姿勢・光源補正部15は、3D顔部位形状データすなわち3D形状が、上記標準モデルの3D形状に最も合致するように3次元的な位置の補正を行う(3D顔部位形状データの形状自体は変化しない)。要するに、3D顔部位形状データによる顔が横を向いていた場合、標準モデルを基準として所謂モデルフィッティングを行い、その横を向いた顔が標準モデルの顔の向き(基準方向)、例えば正面方向を向くように位置補正する。この位置の補正は、以下の(2)式に示す姿勢パラメータt(ポーズパラメータ)に基づいて行われる。
t=(s,φ,θ,ψ,tx,ty,tz)Tt ・・・(2)
但し、記号「s」はスケール変換指数を、記号「φ,θ,ψ」は回転変位(傾き)を示す変換パラメータを、記号「tx,ty,tz」は直交3軸方向における並進変位を示す変換パラメータを表す。また、指数の記号「Tt」は“転置”を表す。
(テクスチャ情報補正)
次に、上述において3D顔部位形状データの顔の向きを正面方向に補正することにより得られた位置補正情報に基づいて、顔部位検出部13により取得された各特徴領域の2次元テクスチャ(2Dテクスチャ)が正面方向(基準方向)を向いた状態となるようにテクスチャ情報の補正を行う。これにより、顔が正面から撮影された場合に相当するテクスチャ情報(正面テクスチャ顔画像という)が再構成される。すなわち、正規化された適正なテクスチャ画像が作成される。このように、再構成された正面テクスチャ顔画像を用いることで、姿勢変動すなわち形状の違いに影響されない(依存しない)テクスチャ情報が扱えるようになる。
テクスチャ情報補正は、上記方法に限らず、例えば、顔部位検出部13により取得された各特徴領域のテクスチャ(テクスチャ画像)を、上記標準モデルの対応する領域(後述のポリゴン)に貼り付ける(マッピングする)ことで、上記と同様、正面テクスチャ顔画像が得られるように補正する方法を採用してもよい。これにより姿勢の違いに影響されないテクスチャ情報が扱えるようになる。当該補正により得られた正面テクスチャ顔画像は、相互比較しやすいように、更に、標準モデル周囲に配置した円筒座標(円筒面)に投影するようにしてもよい。この投影により得られた投影画像のテクスチャ情報は、姿勢変動に影響されないばかりか、表情変化等による顔の形状変化にも影響されない謂わば純粋な顔のテクスチャ情報となるため、個人認証に用いる情報として非常に有用である。
<光源変動補正>
(テクスチャ情報補正)
テクスチャ情報に対する光源変動補正としては、例えばテクスチャの輝度情報の補正を行う。この場合、カメラにより撮影される画像には、一般的に光源の向きによるシェーディングの影響が含まれるため、入力された画像の各特徴領域のテクスチャにもその影響が残っているため、各特徴領域単位で輝度補正する。具体的には、例えば、顔部位検出部13により取得された各特徴領域の各画素(ノード)の輝度が、標準モデルに対応する画素の輝度に等しくなるよう特徴領域内部で傾斜をかけてすなわち傾斜角度(向き)のパラメータにより輝度値を制御して輝度補正を行う。
標準モデル記憶部16は、上記顔の標準モデルの情報を予め記憶するものである。この標準モデルは、例えば図6に示すように、頂点データとポリゴンデータとで構成されている。頂点データは、標準モデルにおける特徴部位の頂点Uの座標の集合体であり、上記各特徴点Qjの3D座標と1対1に対応している。ポリゴンデータは、標準モデルの表面を微小な多角形、例えば3角形や4角形といった多角形のポリゴンに分割し、このポリゴンを数値データとして表現したものである。各ポリゴンには、上記光源変動補正において用いられる画素の輝度情報等が含まれるものとする。なお、この標準モデルは、複数人の顔のデータを平均して求めた平均顔データであってもよい。また、標準モデルの各ポリゴンの頂点は、特徴点Qjとともに、特徴点Qj以外の中間点を用いて構成されてもよい。この中間点は補間によって算出される。
2次元認証部(2D認証部)17は、姿勢・光源補正部15において姿勢変動補正及び光源変動補正されてなる各特徴領域のテクスチャ情報から2次元顔特徴量(2D顔特徴量:局所的な2D顔特徴量;局所2D顔特徴量)を算出するものである。2D認証部17は、補正画像取得部17a及び2次元特徴量抽出部(2D特徴量抽出部)17bを備えている。補正画像取得部17aは、姿勢・光源補正部15においてテクスチャ画像が姿勢変動補正及び光源変動補正されてなる補正画像(補正テクスチャ画像という)を取得するもの、換言すれば姿勢・光源補正部15からの補正画像が入力されるものである。
2D特徴量抽出部17bは、補正画像取得部17aにより取得された補正テクスチャ画像から2D顔特徴量を抽出するものである。この2D顔特徴量の抽出は、画像の局所的な濃淡情報(特定方向の輪郭線など)を特徴量として取り出す手法であるGaborウェーブレット変換を用いた方法により行う(Gaborウェーブレット変換は、上記顔部位の検出にも使用できるし、ここでの濃淡情報を取り出すことにも使用できる)。実際には、補正テクスチャ画像が有する2D座標点を基準として、この補正テクスチャ画像に対してGaborフィルタによるフィルタ処理を施すことで得られる濃淡情報を2D顔特徴量として抽出する。
ところで、Gaborフィルタは、図7に示すように、sin関数(虚部)及びcos関数(実部)をガウス関数で局在化したカーネルを用いた空間フィルタであって、画像の局所的な濃淡情報を取り出すことが可能な変換(Gaborウェーブレット変換)を行うフィルタである。Gaborフィルタによるフィルタ処理は局所的な情報に対する処理であるので、画像の照明変動の影響を受けにくいという利点がある。Gaborウェーブレット変換は、カーネルの形を固定しておき、このカーネルを伸び縮みさせて様々な周期のカーネルを作り出し、これに対応した空間周期の特徴量(Gabor特徴量;ここでの濃淡情報)を抽出する変換である。
上記空間周期の特徴量を表す特徴ベクトル(2次元特徴ベクトル;2D特徴ベクトル)は、サイズ、方向特性の異なるGaborウェーブレット係数の並びである。Gaborウェーブレット変換は、位置及び周波数の不確定性を最小にする関数であって以下の(3)式で表される。
上記(3)式中のkベクトルは、波の波長と方向を決める定数であり、[ ]内の第2項はウェーブレットの再構成条件を満たすべく関数の直流成分が0(ゼロ)、すなわちそのフーリエ変換において以下の(4)式が得られるように加えられた項である。
このようなGaborウェーブレット変換を用いた手法は、顔画像に適用した場合、様々な方向と濃淡周期によって豊富な特徴情報を抽出することができるため、高精度な顔認証システムに採用される。
2D顔特徴量は、補正テクスチャ画像に対して、上記図7に示すGaborフィルタを畳み込むことによって算出することができる。例えば、方向が、方向{0,π/8,2π/8,3π/8,4π/8,5π/8,6π/8,7π/8,8π/8}の8方向、スケールが、スケール{4,4√2,8,8√2,16}の5段での複数のGaborフィルタを畳み込むことにより、2D顔特徴量としての40(=5*8(記号「*」は乗算を表す))次元の特徴ベクトル(それぞれの濃淡の周期の情報)を得ることができる。なお、2D顔特徴量の抽出は、Gaborウェーブレット変換による方法に限らず、その他一般的なテクスチャ情報を使用した方法であれば何れの方法であってもよい。また、上記方向やスケールも8方向や5段に限らず、任意に定めることができる。
顔領域3D計算部18は、顔領域検出部12により検出した顔領域の画像すなわちステレオカメラによるステレオ画像から、顔の高密度な3D形状(3D顔密形状データという)を算出する。ただし、ここで言う“高密度なデータ”とは、上記顔部位検出部13により検出される顔の目や鼻といった特徴部位(特徴点Qjの3D座標M(j))だけのデータつまりデータ取得点数が少ない謂わば“粗(低密度)”のデータに対して、この特徴部位のデータだけでなく、頬や額などの部分も含む顔全体のデータつまりデータ取得点数が多い謂わば“密”なデータであることを示している。なお、3D顔密形状データを構成する当該密なデータ取得点のことを「3次元点(3D点;又は3D計測点)」という。3D顔密形状データは複数の3D点からなる顔の形状データである。
ステレオ画像からの顔の高密度な3D形状の算出は、例えば位相限定相関法(POC:Phase-Only Correlation)を用いて行う。位相限定相関法は、フーリエ変換を使った相関計算方法の一つであって、2つのフーリエ画像をスペクトルごとに規格化してから合成し、すなわち2枚の画像が与えられたとき、それぞれの画像の2次元離散フーリエ変換を振幅成分で正規化してこれらの積をとって合成位相スペクトルを求め、これに対して逆フーリエ変換を行うすなわち当該合成位相スペクトルの2次元逆離散フーリエ変換を行う手法である。2枚の画像が類似している場合、POC関数は極めて鋭いピークを有する。この相関ピークの高さは、画像の類似度の尺度として有用であり、さらにピークの座標は2枚の画像の相対的な位置ずれに対応する。位相限定相関法はこのような特性を有するため、輝度変動やノイズの影響を受けにくく、高精度の画像間の対応点を取得することができる(換言すれば、位相限定相関法は高精度な異なる画像間の対応点検索つまりマッチングを行う処理である)。また、取得した対応点に対して3次元再構成処理を行うことで、高精度の3D顔密形状データを求めることができる。なお、上述のように、本実施形態では2Dカメラを複数台用いることを想定しているため、高密度な3D形状を位相限定相関法により算出しているが、3D計測装置を用いる場合には、複数枚の画像から算出せずとも高密度な3D形状を取得することが可能であるためこのような手法を用いずともよい。
3次元認証部(3D認証部)19は、顔領域3D計算部18により算出した3D顔密形状データと、顔部位3D計算部14により算出した3D顔部位形状データとに基づいて、3D顔特徴量(局所的な3D顔特徴量;局所3D顔特徴量)を算出するものである。3D認証部19は、3D特徴ライン抽出部19a及び3D特徴量抽出部19bを備えている。3D特徴ライン抽出部19aは、3D顔密形状データと、3D顔部位形状データ(特徴部位)とから3次元的な特徴ラインを抽出(算出)するものである。以降、3次元的な特徴ラインを「3D特徴ライン」という。
3D顔部位形状データの各特徴部位における各特徴点Qjの3D座標M(j)(特徴点座標という)は、高密度な3D形状(3D顔部位形状データ)上に存在する。上記3D特徴ライン(この3D特徴ラインを当該ラインによる領域と考えて3D特徴ライン領域と表現してもよい)は、3D顔部位形状データの特徴点座標からの相対関係で定義される。具体的には、例えば図8に示すように、特徴点Qjである右目頭a及び左小鼻bの2点を結んだライン(直線ライン;特徴抽出用ラインという)abを設定する。この特徴抽出用ラインabを例えば図9における符号210のライン(特徴抽出用ライン210)とする。ただし、図9に示すメッシュ(網状の表示部)は、3D顔密形状データを表しており、このメッシュにおける各頂点201は3D顔密形状データにおける各3D点αを示している。この特徴抽出用ラインab上には、所定間隔で所定数の3D座標点202(定義点という)が予め設定(定義)されている。
ただし、特徴抽出用ラインは、顔の3D形状の特徴が良く現れている部分、すなわち顔の凹凸の起伏が最も現れている部分(最特徴部分という)におけるラインを設定(選択)することが望ましい。ここでは、例えば鼻(鼻付近;鼻周辺部)を当該最特徴部分としている。鼻は、他の部位よりも奥行き方向の情報を多く含んでいる。また、人それぞれによって鼻の大きさや高低は大きく異なることから、鼻の形状情報を含む3D特徴ラインは最も有効な特徴ラインの一つであり、これを用いることで高精度な認証が可能となる。なお、鼻の形状情報が含まれるように設定する特徴抽出用ラインは、上記右目頭a及び左小鼻bを結ぶラインに限定されず、これ以外の特徴点Qjを結ぶラインでもよい(後述の図3(a)に示す特徴抽出用ラインAB参照)。また、特徴抽出用ラインabを内包する特徴抽出用ライン、すなわち特徴抽出用ラインabを両端からさらに顔の側面側へ延長して、頬や額などの顔の特徴が現れ難い部位のラインも併せ持つ全体的な特徴抽出用ラインを設定してもよい。
この特徴抽出用ラインab上の各定義点202を3D顔密形状データ上へ投影(プロジェクション)してなる投影点に基づいて得られるラインを3D特徴ラインとして抽出する。具体的には、例えば図10に示すように、これら定義点202を所定の位置すなわち投影中心(投影中心点)203から3D顔密形状データ上へ球投影し、すなわち投影中心203から放射状に延びた、各定義点202を通る仮想的なライン(投影ラインという)204が3D顔密形状データによる3D形状と交差する位置(投影位置)を上記投影点とし、当該3D顔密形状データ上の投影点に対応する3D点αからなるライン(3D点の集合体としてのライン)を3D特徴ラインと定める。この3D特徴ラインは、例えば図11に示す3D特徴ライン310となる。ただし、上記投影方法は「球投影」に限定されず、すなわち点(投影中心点)からの投影でなくともよく、「軸投影」すなわち所定の軸(中心軸;中心線)からの例えば扇状に延びた投影ラインによる投影であってもよい。また例えば特徴抽出用ラインabと所定の1点を定めて、これらから定まる平面の法線方向に定義点を3D顔密形状データ上へ射影するような射影方法であってもよい。要は、3D顔密形状データに対する定義点の投影方向が定義されるのであれば何れの投影方法も採用可能である。なお、図10は、特徴抽出用ラインabを顔の上方から見下ろした場合の概念的な図である。また、上記投影中心203は、3D顔密形状データの顔を球と見なした場合の該球の中心点としている。
上記各定義点の3D顔密形状データ上への投影において、当該3D顔密形状データ上の投影位置に3D点が存在しない場合がある。すなわち図12に示すように、特徴抽出用ライン210上の或る定義点211の投影位置には3D点αが存在するが、或る定義点212の投影位置(図中の位置213)には3D点αが存在しない(データが欠落している)場合がある。この場合には、位置213の周辺に存在する所定数の3D点を用いた補間処理によって算出する。具体的には、符号240で示す図のように、投影位置213’(投影位置213に相当)に最も近い位置の少なくとも3つの3D点αにより囲まれる領域(投影パッチという)を設定し(この投影パッチは、3D顔密形状データによる3D形状における部分領域となっている)、この投影パッチと、定義点212’(定義点212に相当)を通る投影ライン214(上記投影ライン204に相当)との交点(交点座標)を、当該定義点212’に対応する3D顔密形状データ上の3D点(α’)と定める。このように補間により求めた3D点のことを補間3次元点(補間3D点)α’という。
ただし、補間3D点α’の設定方法は、上記投影ライン214と投影パッチとの交点(交差)位置に設定する方法に限らず、例えば先ず投影ライン214と交差する投影パッチを設定しておき、この投影パッチを形成する複数の3D点を用いた補間によって該投影パッチ内の任意の点を設定するようにしてよい。なお、投影ラインと3D顔密形状データとの交点に3D点が存在しないときには必ず補間処理して該当する3D点を設定せずともよく、存在しないところはそのままにしておき、存在する3D点のみで3D特徴ラインを構成してもよい。
ところで、各特徴抽出用ライン(例えば特徴抽出用ラインab)における定義点の個数は個人毎に定義するのではなく、予め決めておいた既定値としての個数を使用する。換言すれば、各特徴抽出用ラインの定義点の設定個数は固定されており、何れの認証対象者に対しても同じ特徴抽出用ラインを選択したときの定義点の個数が同じとなるよう統一されたものとなっている。また、定義点は特徴抽出用ライン全体において均等(等間隔)に配置してもよいし、不均等に配置してもよい。この不均等な配置の場合、例えば特徴部位の形状が良く表れるつまり特徴部位の形状情報が的確に反映される配置位置となるように、特徴抽出用ライン上の所定範囲において定義点を集中的に配置するようにしてもよい。具体的には、例えば図13(a)に示す特徴抽出用ラインAB(右目尻A及び左小鼻Bを結ぶライン)において、図13(b)に示すように、鼻の部分を含む範囲261は定義点の配置間隔を狭く(小間隔に)して、すなわち鼻の部分は定義点を密に配置し、それ以外の部分つまり鼻の部分を含まない範囲262は配置間隔を広くする(粗な配置にする、大間隔にする)設定としてもよい。なお、この配置間隔が狭い範囲或いは広い範囲についても、定義点は均等配置でもよいし不均等配置でもよい。
また、上記特徴抽出用ラインは、図14(a)に示すように1本のラインつまり1画素相当の幅のラインでなくともよく、図14(b)に示すように複数本つまり数画素分のラインから構成された所謂帯状(リボン状)のラインであってもよい。換言すれば、3D顔密形状データ上へ投影する定義点は、1本の特徴抽出用ライン上の点として設定(選択)してもよいし、複数本に跨って設定してもよい(この複数本の特徴抽出用ラインからなるものを「特徴抽出用帯状ライン」と表現する)。特徴抽出用帯状ラインは、同じ特徴抽出用ライン、つまり同じ定義点の配置位置を有する特徴抽出用ラインが互いに平行(並列)に同じ向きで複数本纏められてなる。この特徴抽出用帯状ラインは、中央に位置する特徴抽出用ラインが特徴点(a、b)を通るライン(特徴抽出用ラインab)となるように、換言すれば特徴抽出用ラインabを中央ラインとしてこの両側に所定数の特徴抽出用ラインを配置するようにして定めてもよい。ただし、この特徴抽出用帯状ラインは1つの領域として扱うのではなく、あくまでも各特徴抽出用ラインを独立したものとして扱う、つまり特徴抽出用ライン毎に、各定義点を投影してこれに対応する3D点を選択しようとする動作を行う。
このように複数の特徴抽出用ラインとするのは次の理由による。すなわち、1本の特徴抽出用ラインである場合、上記右目頭a及び左小鼻bの位置が異なるなどして特徴抽出用ラインに少しでも位置ズレ(誤差)が生じると、これまで3D特徴ラインとして抽出されていた3D点(投影ラインと3D顔密形状データとの交点)がそうでなくなる、つまり投影ラインと3D顔密形状データとの交点位置が3D点でなくなる(代わりに補間処理によって当該3D点が算出されるようになる)。したがって、当該特徴抽出用ラインに対応する3D点の選択における裕度を確保するべく或いは選択に余裕(幅)をもたせるべく、各位置の定義点の個数を増やして(図14(b)では各位置において5個の定義点を並置している)、当該定義点に対応する3D点が補間処理に依らず直接選択される確率つまり各定義点からの投影ラインと3D顔密形状データ上の3D点とが交差する確度(精度)を高めるものである。
この特徴抽出用帯状ラインを用いて、該特徴抽出用帯状ラインを構成する特徴抽出用ラインそれぞれに対応する3D特徴ライン、すなわち図14(b)の場合は5本の3D特徴ラインが求められる。この場合、特徴抽出用ライン毎に定義点が3D顔密形状データに投影されて、投影ラインとの交点位置の3D点(及び交点でない位置での補間3D点)が特定されて、該特徴抽出用ライン毎の3D特徴ラインが決定される。
なお、これに限らず、図14(b)に示すように、特徴抽出用帯状ラインにおける例えば位置270の5つの定義点における定義点271に対して3D点が定まり、位置280の5つの定義点における定義点281に対して3D点が定まる(各位置のその他の定義点の投影位置には3D点は存在しない)、というように各特徴抽出用ラインの各位置の定義点における3D点が決定され、これら3D点を結んでなる例えば1本のラインが3D特徴ラインとなるようにしてもよい。つまり特徴抽出用帯状ラインから、この特徴抽出用帯状ラインを構成する特徴抽出用ラインの本数より少ない3D特徴ラインが決定される構成であってもよい。
なお、図14(b)では特徴抽出用帯状ラインは5本の特徴抽出用ラインからなるが、この本数に限定されない。ただし、本数が多くなり過ぎると扱うデータ量が増えて処理の負荷が大きくなるので、こうならないように且つ上記選択の裕度が確保されるような適正な本数が設定される。
また、上記図8に示すように最特徴部分(上記では鼻)を含む1本(或いは並列複数本)だけの特徴抽出用ラインを設定する方法でなくともよく、例えば図15に示すように、3D顔部位形状データにおける顔の特徴部位(目、眉、鼻、口等)以外を含むように複数本のラインを用いて任意な方向に組み合わせてなる特徴抽出用ライン(これを「組合特徴抽出用ライン」という)301を設定してもよい。同様に、この組合特徴抽出用ライン301の各定義点を3D顔密形状データに対して投影することで、図16に示すような3D特徴ライン(これを「組合3D特徴ライン」という)311が得られる。このように顔の特徴部位以外を含むように3D特徴ラインを設定することで、後述の2D認証との多重照合時(多重類似度による認証判定時)における認証精度の向上を図ることができる。
図15に示す組合特徴抽出用ライン301において、例えば、右目頭a及び右口端cの特徴点Qjを結んだ特徴抽出用ラインac、或いは右目尻d及び右小鼻eの特徴点Qjを結んだ特徴抽出用ラインdeに対して、図16に示す組合3D特徴ライン311の3D特徴ラインa’c’或いは3D特徴ラインd’e’が当該頬の3D形状情報を含むラインとして得られる。この頬部分は、鼻部分ほどの3D形状の起伏は見られないものの、人それぞれにより異なる起伏となっており、当該3D特徴ラインa’c’や3D特徴ラインd’e’は、2D画像上では取得が困難である(表現し難い)特徴を扱うことが可能な、認証において有効な3D形状情報を含む3D特徴ラインとなっている。特徴抽出用ラインは上記特徴抽出用ラインac、deに限らず、一般的な目頭と目尻とを結ぶラインや、上唇と下唇とを結ぶラインなど、種々のラインが設定可能である。ただし、特徴抽出用ラインは、隠れなどのオクルージョンに強いラインを複数設定しておくことが望ましい。
3D特徴ライン抽出部19aは、上述の方法に限定されず、例えば下の方法によって3D顔密形状データ上の3D特徴ラインを設定してもよい。すなわち、標準の3次元モデル(3Dモデル;上記標準モデルと同じ)上に、標準として定める所定の特徴抽出用ライン(標準特徴抽出用ラインという)を、つまり標準特徴抽出用ラインを構成する各定義点(標準定義点という)を予め設定しておき、3D顔密形状データに対して該標準モデルをフィッティングさせて、標準モデルが3D顔密形状データに最も類似した状態において、該標準モデル上の標準特徴抽出用ラインに対応する3D顔密形状データ上の3D特徴ラインを抽出するようにしてもよい。
この方法について具体的に説明する。先ず上記フィッティングとは、以下の(5)式に示すエネルギー関数e(T)が最小となるように制御点群Tを用いて標準モデルを変形させて、3D顔密形状データに合致させるようにすることである。換言すれば、評価関数e(T)の値を小さくする方向に標準モデルを変形していくことである。
e(T)=wout*eout(T)+win*ein(T) ・・・(5)
但し、各項は以下のように定義される。
eout(T):3D顔密形状データの3D点と標準モデルとの差分エネルギー(外部エネルギー)
ein(T):過剰な変形を回避するための安定化エネルギー(内部エネルギー)
wout、win:それぞれのエネルギーのウエイトパラメータ
T:標準モデルの変形制御点
かかるフィッティングにより、図17に示すように標準特徴抽出用ライン(標準定義点)が設定された標準モデル401の形状を、3D顔密形状データ402の形状に近づける(合致させる)ように変形する。この変形の結果、通常は、標準モデル401は3D顔密形状データ402に完全には一致せず、例えば変形標準モデル401’のように変形される。なお、図17に示す3D顔密形状データ402は、この各3D点αを顔の上方から見下ろした場合の概念的な断面図である。
このように標準モデル401’は3D顔密形状データ402と完全には一致しないため、標準モデル401’における標準特徴抽出用ライン上の各定義点を3D顔密形状データ402上へ投影することでこの各定義点に対応する3D点からなる3D特徴ラインを抽出する。具体的には、例えば図18に示すように、これら標準特徴抽出用ライン上の各定義点を所定の位置すなわち投影中心403から3D顔密形状データ402上へ球投影し、すなわち投影中心403から放射状に延びた各定義点を通る投影ライン404が3D顔密形状データ402による3D形状と交差する位置を投影位置とし、当該3D顔密形状データ402上の投影位置における3D点αの集合体としてのラインを3D特徴ラインと定める。
この場合も投影方法は「球投影」に限定されず、「軸投影」でもよい。また例えば所定の平面を定め、標準特徴抽出用ラインの定義点をこの平面の法線方向に3D顔密形状データ402上へ射影するような射影方法であってもよい。要は、3D顔密形状データに対する定義点の投影方向が定義されるのであれば何れの投影方法も採用可能である。本実施形態のような標準モデル上の特徴抽出用ラインを3D顔密形状データに投影する場合も、上記図12での説明と同様、定義点の投影位置に3D点αが存在しない場合、投影パッチ等を設定して投影位置周辺の各3D点を用いて補間処理により補間3D点を算出するようにしてもよい。また、標準モデル上の特徴抽出用ラインも上記図14(b)に示すように複数本の特徴抽出用ラインからなる特徴抽出用帯状ラインであってもよい。この場合も、特徴抽出用帯状ラインの各定義点を3D顔密形状データに投影して3D特徴ラインを抽出する方法は上述と同様の方法でよい。これ以外の3D特徴ラインの抽出方法についても上述と同様に種々の変形例が採用可能である。なお、図18は、3D顔密形状データ402及び標準モデル401’を顔の側方から見た場合の概念的な断面図である。また、上記投影中心403は、3D顔密形状データの顔を球と見なした場合の該球の中心点としている。
上記標準モデル401上に設定する標準特徴抽出用ライン(標準定義点)は、任意なものでよい。例えば上記図8、9に示す特徴抽出用ラインabを含み、顔を謂わば“輪切り”するような特徴抽出用ライン(特徴点間を含むように輪切りしたライン)、つまり特徴抽出用ラインabを両端からさらに顔の側面側へ延長して、頬や額などの顔の特徴が現れ難い部位のラインも併せ持つ全体的な標準特徴抽出用ラインを設定してもよい。また、例えば図19(a)、(b)及び(c)に示す3D特徴ラインが得られるような標準特徴抽出用ラインを標準モデル上に設定してもよい。すなわち図19(a)では、顔の横方向に上記輪切りされるような標準特徴抽出用ラインを顔の上下方向において所定間隔で複数本設定している。図19(b)では、顔の縦方向に当該輪切りされるような標準特徴抽出用ラインを顔の左右方向において所定間隔で複数本設定している。図19(c)では、謂わば等高線となるような標準特徴抽出用ラインを顔の奥行き方向に(耳から鼻の頂点へ向けて)所定間隔で複数本設定している。この場合、各標準特徴抽出用ラインの間隔は等間隔でもよいし、不等間隔でもよい。
標準モデルにこれら特徴抽出用ラインを設定するに際して、特徴部位の情報に基づいて設定してもよい。すなわち先ず特徴点を通る基準ラインを決めておいて、この基準ラインに対して所定間隔に各特徴抽出用ラインを設定するようにしてもよい。勿論、特徴部位(特徴点)の情報に基づかずに定めてもよい。
また、これに限らず、標準モデル401上に上記図15の組合特徴抽出用ラインに示すような複数の標準特徴抽出用ラインを組み合わせてなる標準特徴抽出用ラインを設定してもよい。また、上記図14での説明と同様、標準特徴抽出用ラインは、1本のラインつまり1画素相当の幅のラインでなくともよく、複数本つまり数画素分のラインから構成された帯状のラインであってもよい。
ところで、上述では、フィッティングによって標準モデルは3D顔密形状データに完全には一致しないという前提であったが、フィッティングによって標準モデルが3D顔密形状データに完全に一致してもよい。すなわち、標準モデルを3D顔密形状データと全く同じ形となるように変形し、この変形した標準モデル上の標準特徴抽出用ライン(この標準特徴抽出用ラインも標準モデルの変形に伴い変形している)を3D特徴ラインとして抽出するようにしてもよい。
なお、顔は左右対称であることからも、抽出する各3D特徴ラインは、顔における左右対称の位置に配置されていることが好ましい。また、目領域はサングラスなどで隠される場合があり、口領域は髭などの影響で3D計測できない場合があるため、抽出する3D特徴ラインは少なくとも、当該隠れたり3D計測不能となりにくい部分である、鼻及び頬を含む(額は髪で隠れる可能性が高い)ことが望ましい。
3D特徴量抽出部19bは、3D特徴ライン抽出部19aにより抽出された3D特徴ラインの情報から3D顔特徴量を抽出するものである。すなわち、各3D特徴ライン内の複数の3D点の情報に基づいて、3D特徴ラインごとに3次元情報の計算を行い3D顔特徴量を算出する。当該算出方法は、例えば3D特徴ラインを曲線に近似することにより(曲線近似により)3D顔特徴量を算出する方法であってもよい。
上記曲線近似には、例えばベジェ曲線、エルミート曲線、有理ベジェ曲線、Bスプライン曲線、NURBS(Non Uniform Rational B-Spline)曲線など、種々の曲線を用いることができる。ここでベジェ曲線を用いた場合について説明する。
ベジェ曲線は、制御点と呼ばれる複数の点Pi(制御点Pi)によって定義した曲線であり、このとき制御点Piは曲線の両端点と概形とを定める。ベジェ曲線は、通常、パラメータ区間t∈[0,1]において定義される多項式曲線であり、以下の(6)式で与えられる。
上記(6)式に示すように、ベジェ曲線上の点P(t)は、制御点Piの荷重平均となっている。パラメータtが変化すると、各制御点に対する重みBn i(t)が連続的に変化して、点P(t)が連続的に移動する。換言すれば、ベジェ曲線は、制御点Pi(の座標値)を制御することでベジェ曲線の形状を変化させて上記3D特徴ラインの形状に近似させる。当該近似させたベジェ曲線の形状情報(曲線情報)を3D特徴ラインの形状情報(ライン形状情報という)として求める。
ところで、このベジェ曲線は、この性質の他に以下の性質を有している。
(a)凸包性:パラメータ区間t∈[0,1]における曲線は、制御点の構成する凸包の内部に存在する。
(b)変動減少性:曲線は、制御点列の形状を滑らかにした形になる(滑らかにフィッティングできる)。
(c)疑似局所制御性:制御点を移動させると、その制御点に対応する曲線部分が大きく変形する(制御点の僅かな変化が曲線部分の大きな変化となって現れる;変化量が大きい)。
(d)直線再現性:制御点を直線上に配置すると、曲線は直線になる。
(e)アフィン不変性:曲線にアフィン変換を施した結果と、アフィン変換を施した制御点から得られる曲線とが等しくなる。
ベジェ曲線は、これらの性質、特に(b)、(c)の性質を有しているため、3D特徴ラインの特徴をより的確に表現することができる。
このようなベジェ曲線を用いて、同様に顔の各3D特徴ラインについてライン形状情報、すなわち各3D特徴ラインの3D特徴ベクトルつまり3D顔特徴量を求める。そして、この各3D特徴ラインに対して求められた各ライン形状情報(3D顔特徴量)を1つに合わせてトータルの3D顔特徴量(顔3D特徴ベクトルという)を求める。ただし、これに限らず、このトータルの3D顔特徴量の情報に対して、さらに各3D特徴ライン(或いは各ライン形状情報)間の相対位置関係つまり相互の距離や傾き等の情報を加えるようにしてもよく、この場合、顔の全体的な特徴を示す“大域形状情報”を扱うことができるようになるので、当該3D顔特徴量がより一層個人認証に適したものとなる。
上記3D顔特徴量を抽出する3D特徴ラインは、少なくとも顔の特徴部位(上記目、眉、鼻、口など)以外の部位を含む3D特徴ラインであることが好ましい。換言すれば、3D顔特徴量は、特徴が無い或いは少ない、つまり2D特徴量(特徴部位、2D画像)では特徴が出にくい部位である「額」や「頬」などの部位(表面の凹凸変化が少ない謂わば平坦な部位)を含む3D特徴ラインから抽出したものであることが好ましい。これにより、2D認証との多重照合時、すなわち後述の多重類似度による認証判定時において、特徴の有る部位から得た特徴量(2次元的に得た特徴量)はもちろんのこと、特徴が出にくい部位の特徴量(3次元的に得た特徴量)の情報も用いて、より高い精度での認証を行うことが可能となる。
なお、このように3D顔特徴量を3D特徴ベクトル(ベクトル量)として扱うことができるので、この算出した3D顔特徴量(3D特徴ベクトル)、或いは後述における予め用意する比較特徴量(上記3D顔特徴量の3D特徴ベクトルに対応する比較用の3D特徴ベクトル;比較用ベクトル量)を、例えばコントローラ10の記憶部3などに登録(記憶)しておく場合、上記3D顔密形状データ(各3D点の座標情報)そのものを登録する場合と比べて、3D特徴ベクトルを登録する方が登録データ量が少なくて済むすなわちメモリ容量が小さくて済むなど、データの取り扱い性が良くなる。
3D特徴量抽出部19bは、以下の方法によって3D特徴ラインの情報から3D顔特徴量を抽出してもよい。すなわち、3D顔密形状データから得られた3D特徴ラインを以下の(7)式に示す3D座標ベクトルxSとして、3D顔特徴量の抽出を行ってもよい。
xS=(X1,Λ,XMcount,Y1,Λ,YMcount,Z1,Λ,ZMcount)T ・・・(7)
なお、この場合、特徴選択による次元削減処理を行ってもよい。特徴選択とは、形状情報から、顔認証に適した特徴を選び出すことにより次元を圧縮し、顔認証に使用する顔情報量を得ることである。この特徴選択は、複数の3D特徴ラインに対して行う。特徴選択の手法としては、例えば多くのサンプルデータを用いた統計的手法が用いられる。この場合、先ず特徴量xのサンプルセットをKL展開を適応することによって特徴量cに次元圧縮する(以下(8)式参照)。
但し、右辺第1項の記号「xバー」は平均の特徴量、記号「P」は変化の正規モード(固有ベクトル)のセットを表す。
さらに、特徴量cで張られる特徴空間を学習によって個人性を表す分部空間と属性を表す分部空間とに分割する。次に、この特徴量cの次元を変換Aによってn次元からk次元(特徴ベクトルd)に低減させる(以下(9)式参照)。
d=Atc ・・・(9)
但し、記号「A」はn×kの行列を表す。
上記変換Aを決定する手法としては、次の幾つかの方法が提案されている。
(イ)特徴空間の各主成分の中から、級内分散と級間分散との比率(F比)が大きい主成分をk個選び出すことで、個人性を表す部分空間を求める(PCA(Principle Component Analysis)法)。
(ロ)特徴空間から、クラス間分散とクラス内分散との差が大きくなるような射影空間を求める(EM(Eigenspace Method)法)。
(ハ)特徴空間から、クラス間分散とクラス内分散との比が大きくなるような射影空間を求める。これはFisherの判別分析法を多クラスの問題に一般化した重判別分析法である(MDA(Multiple Discriminant Analysis)法)。
また、3D特徴量抽出部19bは、以下の方法によって3D特徴ラインの情報から3D顔特徴量を抽出してもよい。この方法では特徴量として3D特徴ラインの曲率のデータを用いる。曲線上の点P0を基点として、ここから曲線上の或る点P(位置ベクトルrPで表されるとする)までの距離をsとすると、点Pの位置ベクトルrPは、sによって、以下の(10)式と表すことができる。
rP=r(s) ・・・(10)
同様にして、曲線上の点Q(点P0からの距離はs+Δs)は、以下の(11)式で表される。
rQ=r(s+Δs) ・・・(11)
ここで、点P上の曲線に対する接線方向の単位ベクトルt(s)は、以下の(12)式で表される。
drP/ds=t(s) ・・・(12)
但し、記号「/」は除算を示す(以降同じ)。
また、点Q上の曲線に対する接線方向の単位ベクトルt(s+Δs)は、以下の(13)式で表される。
drQ/ds=t(s+Δs) ・・・(13)
点P及び点Qでの接線の単位ベクトルt(s)、t(s+Δs)のなす角度をθとして、Δsを限りなく小さくしていくと、以下の(14)式が得られる。
x=1/R ・・・(14)
但し、記号「x」は曲率、記号「R」は曲率半径を表す。
このように得られた曲率を、特徴ベクトル(3D特徴ベクトル;3D顔特徴量)として用いてもよい。
類似度計算部20は、予め登録された比較対象者の顔特徴量(比較用特徴量という)と、上述で算出された認証対象者HMの顔特徴量すなわち2D顔特徴量(2D特徴ベクトルの特徴量)及び3D顔特徴量(3D特徴ベクトルの特徴量)との類似性の評価を行う。具体的には、上記比較用特徴量と2D顔特徴量及び3D顔特徴量とに基づいて類似度計算を行い、それぞれ2次元類似度(2D類似度;L)及び3次元類似度(3D類似度;D)を算出し、さらにこれら2D類似度及び3D類似度を用いて多重類似度を算出する。先ず、2D類似度の算出について説明する。
<2D類似度の計算>
認証対象者HMと比較対象者との2D類似度Lは、以下の(15)式に示すように、上記2D特徴量抽出部17bにおいてGaborフィルタによるフィルタ処理をF個の特徴点に対して行い、これにより抽出(生成)されたF個の特徴ベクトルの類似度SD(Ji,Ji’)を積算した値の平均値として与えられる。
但し、上記(15)式において、2D類似度Lは、算出された特徴ベクトルの特徴量をG、登録されている特徴量をG’とすると、これらの類似度L(G,G’)として表現している。また、上記(15)式中の記号「i」は特徴点の個数を表し、i=1〜F(個)を示す。
上記(15)式における類似度SD(Ji,Ji’)は、以下の(16)式で定義される。
但し、上記(16)式中の記号「Ω」は原点近傍(0変位近傍)の局所領域を表す。また、記号dベクトルは位相差を表す。
また、上記(16)式中のSD(Ji,Ji’,dベクトル)は、位相類似度に変位修正を考慮した以下の(17)式により与えられる。この(17)式は、振幅の相関を位相角の類似度で重み付けした形をしている。
但し、上記(17)式中の記号「J」は、J=(a1,a2,a3,・・・,aN,φ1,φ2,・・・,φN)であり、Nは複素Gaborフィルタ(上記虚部と実部とのGaborフィルタのセット)の数である。また、記号「a」は振幅を、記号「φ」は位相を表す。また、kjベクトルは、j番目の2次元波の方向を向き、且つ周波数の大きさを有するベクトルであって、以下の(18)式により与えられる。
なお、Gaborフィルタを使用しない場合には、2D類似度の計算は、後述する3D類似度算出と同様に、ユークリッド距離による算出でも可能である。
<3D類似度の計算>
認証対象者HMと比較対象者との3D類似度、すなわち形状特徴量の類似度Dは、互いに対応するベクトル(3D特徴ベクトルdS)同士間のユークリッド距離の合計を算出することにより得ることができる。ここで、抽出された特徴量データdと登録されている特徴量データd’との比較を行う。抽出された特徴量データ数と登録されている特徴量データ数とが同じ、すなわち抽出した3D特徴ラインのライン数と、この3D特徴ラインと比較するための予め登録されている特徴ライン(比較用3D特徴ラインという)のライン数とが1対1に対応している(或る1本の3D特徴ラインに対応する登録3D特徴ラインも1本となっている)場合は、3D類似度Dは以下の(19)式で表される。
但し、記号「j」は3D特徴ライン数(1,2・・・K,N)を示す。また、記号「wj」は信頼度を示す。
登録されている特徴量データ数(比較用3D特徴ライン数)が各位置(3D特徴ラインが設定された顔の各位置)において1ライン(1本)であり、一方、抽出した特徴量データ数(3D特徴ライン数)が当該各位置においてkjライン(kj本)である場合、例えば以下の2通りの方法が採用される。
(I)上記抽出したkjラインの3D特徴ライン(3D特徴ベクトル)のうちから、比較用3D特徴ライン(比較用3D特徴ベクトル)に対するユークリッド距離が一番小さくなる3D特徴ライン(3D特徴ベクトル)を選択して使用する。この場合の3D類似度Dは以下の(20)式で表される。
(II)上記抽出したkjラインの3D特徴ライン(3D特徴ベクトル)を全て使用し、上記各位置において、比較用3D特徴ライン(比較用3D特徴ベクトル)に対する該3D特徴ライン1ライン毎の重みが均等となるような重みW’ijを設定する。この場合の3D類似度Dは以下の(21)式で表される。
<多重類似度の計算>
認証対象者HM(認証対象物)と比較対象者(比較対象者)との総合的な類似度である多重類似度は、以下の(22)式に示すように、上記2D類似度及び3D類似度の各類似度に対しての重み付け和により算出される。なお、多重類似度をReで表す。
但し、上記(11)式中の記号「W」は所定の重み付け係数を表す。ここでは、この重み付け係数Wは予め決められた固定値として与える。
登録データ記憶部21は、予め用意された比較対象者の顔特徴量(比較特徴量、比較用顔特徴量)の情報を記憶しておくものである。
判定部22は、多重類似度Reに基づいて認証判定を行うものである。認証判定は、顔照合(Verification)の場合と顔識別(Identification)の場合とで、その手法が以下(α)、(β)のように異なる。
(α)顔照合は、入力された顔(入力顔;認証対象者HMの顔)が特定の登録者(特定登録者)であるか否かを判定するものである。この顔照合では、特定登録者つまり比較対象者の顔特徴量(比較特徴量)と認証対象者HMの顔特徴量との類似度を所定の閾値と比較することで、認証対象者HMと比較対象者との同一性が判定される。具体的には、多重類似度Reが所定の閾値TH1よりも小さいときに認証対象者HMが比較対象者と同一人物(本人)であると判定される。なお、この場合の閾値TH1の情報は判定部22内に記憶されている(登録データ記憶部21に記憶されていてもよい)。
(β)顔識別は、入力顔が入力顔が誰のものであるかを判定するものである。この顔識別では、登録されている人物(比較対象者)の顔特徴量と認証対象者HMの顔の特徴量との類似度を全て算出して、認証対象者HMと各比較対象者との同一性をそれぞれ判定する。そして、複数の比較対象者のうち最も高い同一性を有する比較対象者を認証対象者HMと同一人物であると判定する。具体的には、認証対象者HMと複数の比較対象者とのそれぞれの多重類似度Reのうち、最小の多重類似度Re(Remin)に対応する比較対象者が、認証対象者HMと同一人物であると判定される。
図20は、本実施形態に係る顔認証の動作の一例を示すフローチャートである。先ず、カメラCA1及びCA2それぞれによる撮影によって認証対象者HMの顔画像が取得され(ステップS1)、当該撮影により得られた2枚の顔画像がコントローラ10(画像入力部11)に入力される(ステップS2)。次に、顔領域検出部12によって、画像入力部11に入力された各顔画像から顔領域画像が検出される(ステップS3)。この検出された顔領域画像から、顔部位検出部13によって、顔の特徴部位すなわち特徴点の座標と特徴領域のテクスチャ情報とが検出される(ステップS4)。そして、顔部位3D計算部14によって、顔部位検出部13により検出された顔の特徴部位の座標(特徴点の座標)から該各特徴部位の3次元における座標(3D顔部位形状データ)が算出される(ステップS5)。また、姿勢・光源補正部15によって、顔部位検出部13により検出されたテクスチャ情報に対する姿勢変動補正及び光源変動補正が行われる(ステップS6)。そして、2D認証部17によって、当該姿勢変動補正及び光源変動補正されてなる各特徴領域の補正テクスチャ画像から2D顔特徴量が算出される(ステップS7)。
一方、顔領域3D計算部18によって、顔領域検出部12により検出された顔領域画像(ステレオ画像)から、複数の3D点からなる3D顔密形状データが算出される(ステップS8)。次に、3D認証部19において、3D特徴ライン抽出部19aによって、顔領域3D計算部18により算出された3D顔密形状データと、上記ステップS5おいて顔部位3D計算部14により算出された3D顔部位形状データとから3D特徴ラインが算出(抽出)される(ステップS9)。そして、3D特徴量抽出部19bによって、当該3D特徴ライン抽出部19aにより算出された3D特徴ラインの情報から3D顔特徴量が算出される(ステップS10)。次に、類似度計算部20によって、予め登録された比較対象者の顔特徴量(比較用特徴量)と、上記ステップS7及びS10において算出された局所2D顔特徴量及び3D顔特徴量との類似性の評価が行われる、すなわち、上記比較用特徴量と2D顔特徴量及び3D顔特徴量とに基づく類似度計算が行われて、2D類似度及び3D類似度、さらにこれら類似度から多重類似度が算出される(ステップS11)。そして、当該多重類似度に基づいて、判定部22によって、顔照合或いは顔識別の認証判定が行われる(ステップS12)。
図21は、図20のステップS9における動作の一例を示すフローチャートである。ステップS9では、3D特徴ライン抽出部19aによって、先ず顔部位3D計算部14により算出された各特徴部位における各特徴点(3D座標)(3D顔部位形状データ)に基づいて、特徴抽出用ライン(特徴抽出用ラインを構成する各定義点)が設定(算出)される(ステップS21)。そして、この設定された特徴抽出用ラインにおける各定義点を3D顔密形状データに対して投影する演算が実行されて(ステップS22)、各定義点に対応する3D点αが特定されることで3D特徴ラインが決定される。このとき、定義点の投影位置に3D点が存在しない箇所は、当該投影位置付近の所定の3D点αを用いた補間処理によって補間3D点が算出される(ステップS23)。
以上のように、本実施形態に係る認証システム1によれば、3次元形状取得手段(顔領域検出部12、顔領域3D計算部18)によって、認証対象者HMの顔の全体的な3D形状である全体3次元形状(全体3D形状)の情報が取得され、決定手段(3D特徴ライン抽出部19a)によって、3次元形状取得手段により取得された全体3D形状情報(3D顔密形状データ)から、該全体3D形状上の所定のラインである所定数の3次元ライン(3Dライン;3D特徴ライン)が決定される。また、3次元特徴量算出手段(3D特徴量抽出部19b)によって、決定手段により決定された3Dラインにおける、全体3D形状情報の局所的な情報としての局所3次元形状(局所3D形状)情報から、各3Dラインの形状に関するライン形状情報であって、顔の3次元的な特徴量である3D顔特徴量が算出され、特徴量比較手段(類似度計算部20、判定部22)によって、認証対象者HMに対する認証動作を行うべく3次元特徴量算出手段により算出された3D顔特徴量と、予め用意された比較用顔特徴量とが比較される。
また、本実施形態に係る認証方法によれば、第1の工程において、認証対象者HMの顔の全体的な3D形状である全体3D形状の情報が取得され、第2の工程において、全体3D形状情報から、該全体3D形状上の所定のラインである所定数の3Dラインが決定される。第3の工程において、3Dラインにおける、全体3D形状情報の局所的な情報としての局所3D形状情報から、各3Dラインの形状に関するライン形状情報であって、顔の3次元的な特徴量である3D顔特徴量が算出される。そして、第4の工程において、認証対象者に対する認証動作を行うべく3D顔特徴量と予め用意された比較用顔特徴量とが比較される。
これらのように認証システム又は認証方法において、認証対象者の顔の全体3D形状から所定数の3Dラインが決定され、この3Dラインにおける局所3D形状情報から3D顔特徴量が算出され、この3D顔特徴量と比較用顔特徴量との比較が行われることで認証対象者に対する認証動作が行われるので、すなわち顔の全体3D形状の情報をそのまま用いるのではなく、顔全体の3D形状情報から局所的な情報(3Dライン情報;ライン形状情報)を抽出し、この抽出した3Dライン情報に基づいて認証を行う構成であるので、顔に部分的な隠れ等が生じたとしても、必ずしもこの隠れ等が生じた部分を用いずともよく、この部分以外の局所情報を用いて認証を行うことができ、認証精度の低下を軽減することができる。また、データ量の多い全体3D形状(3Dデータ)の情報をそのまま扱わなくてもよいため、つまり部分的な3D形状データを扱えばよいので、処理に時間がかかることなく認証速度を向上させることができる。
また、上記認証システムにおいて、3次元形状取得手段が、顔の2D画像を取得する2次元画像取得手段(カメラCA1、CA2)を備えたものとされ、特徴部位抽出手段(顔部位検出部13)によって、2次元画像取得手段により取得された2D画像から顔の特徴的な部位である特徴部位が抽出される。そして、3次元座標算出手段(顔部位3D計算部14)によって、特徴部位抽出手段により抽出された特徴部位の3D座標(M(j))が算出され、決定手段によって、3次元座標算出手段により算出された特徴部位の3D座標に基づいて3Dラインが決定される。
また、上記認証方法において、第1の工程が、顔の2D画像を取得する第5の工程を含む工程とされ、第6の工程において、2D画像から顔の特徴的な部位である特徴部位が抽出される。また、第7の工程において、特徴部位の3D座標が算出される。そして、上記第2の工程において、特徴部位の3D座標に基づいて3Dラインが決定される。
これらのように認証システム又は認証方法では、2D画像から顔の特徴的な部位である特徴部位が抽出されてこの特徴部位の3D座標が算出され、この3D座標に基づいて3Dラインが決定されるので、3Dラインを決定するに際して2次元的な特徴部位の情報と関連付けることができ、当該3Dラインの情報と共に特徴部位の情報を用いた高精度の認証を行うことが可能となる。
また、上記認証システムにおいて、決定手段によって、3Dラインを抽出するための抽出用ライン(特徴抽出用ライン)であって、特徴部位の3D座標点間を結ぶ抽出用ラインが設定されるとともに、全体3D形状上の該抽出用ラインに対応するラインが3Dラインとして決定されるので、抽出用ラインを3D座標点間(例えば図9に示す点ab間)を結ぶことで容易に設定することができ、当該設定した抽出用ラインを用いて3Dラインを容易に決定することができる。
また、上記認証システムにおいて、全体3D形状情報が、複数の3D点からなる顔の形状データとされ、決定手段によって、抽出用ライン上に定義された複数の定義点が所定の投影中心(例えば図10に示す投影中心203)から全体3D形状上に投影されてなる投影点に対応する3D点に基づいて3Dラインが決定されるので、投影という簡易な方法で容易に且つ確実に抽出用ラインから3Dラインを決定することができる。
また、上記認証システムにおいて、抽出用ライン上の定義点が等間隔に配置されているので、当該定義点からなる抽出用ラインの設定が容易となる。
また、上記認証システムにおいて、抽出用ライン上において定義点が顔の凹凸の程度が大きい場所すなわち顔の特徴が良く表される場所で密に配置されているので(図14(b)参照)、抽出用ラインを用いて求めた3Dラインから得られる3D顔特徴量に対して、顔の特徴情報を確実に反映することが可能となる。
また、上記認証システムにおいて、決定手段によって、予め用意された顔の3Dモデル形状であって、3Dラインを抽出するための抽出用ラインが該3Dモデル形状上に設定されてなる標準モデル(例えば図17(b)に示す標準モデル401)が、全体3D形状(例えば3D顔密形状データ402)に近づけられるべく変形され、すなわち、予め抽出用ラインが設定された標準モデルが全体3D形状に近づくように(合致するように)変形され、該変形された標準モデル上の抽出用ラインに対応する全体3D形状上のラインが3Dラインとして決定されるので、2D画像を取得したり、この2D画像から特徴部位(2D顔特徴量)を抽出するとともに抽出用ラインを設定する等の動作及び構成を必要とせず、容易に全体3D形状における3Dラインを決定することができる。
また、上記認証システムにおいて、全体3D形状情報が、複数の3D点からなる顔の形状データとされ、決定手段によって、変形した標準モデル上の抽出用ライン上に定義された複数の定義点が所定の投影中心(例えば図18に示す投影中心403)から全体3D形状上に投影されてなる投影点に対応する3D点に基づいて3Dラインが決定されるので、投影という簡易な方法で容易に且つ確実に抽出用ラインから3Dラインを決定することができる。
また、上記認証システムにおいて、決定手段によって、全体3D形状上の投影点の位置に3D点が存在しない場合に(図12に示す位置213参照)、該投影点近傍の3D点を用いた補間処理により算出された補間3D点を用いて3Dラインが決定されるので、全体3D形状上の投影点の位置に3D点が存在しない場合であっても、補間3D点(α’)を用いて3Dラインを決定することができ、ひいては顔の特徴が精度良く反映された3D顔特徴量を得ることができる。
また、上記認証システムにおいて、抽出用ラインが複数本のライン(抽出用ライン)からなるものとされるので(図14(b)参照)、抽出用ラインに対応する3Dラインの決定において、抽出用ライン上の定義点を例えば全体3D形状上に投影して3Dラインを構成する3D点を選択する際の裕度を確保するといったことが可能となり、ひいては抽出用ラインを用いて複数のラインを帯状に複数本選択することでズレの軽減が可能になり、精度良くライン抽出ができる。
また、上記認証システムにおいて、3次元特徴量算出手段によって、3Dラインにおける局所3D形状情報が所定の曲線(例えばベジェ曲線)情報に変換されたものがライン形状情報として算出される(3Dラインの局所領域形状情報として、3Dラインにおける局所3D形状情報が所定の曲線情報に変換されたものが用いられる)ので、すなわち3D形状情報がそのまま用いられるのではなく、これを変換して曲線情報(例えば曲率)として扱う構成であるので、次元圧縮が可能となり、処理が高速となる。
また、上記認証システムにおいて、3次元特徴量算出手段によって、3D顔特徴量として、各3Dラインの相対位置関係の情報も含む3D顔特徴量が算出される、すなわち3D顔特徴量が各3Dラインの相対位置関係の情報も含むものとされるので、この3D顔特徴量によって、各3Dラインにおける個々の特徴だけでなく、顔全体に亘っての特徴を表すことが可能となり(顔の大域形状情報を扱うことができ)、より高精度の認証を行うことが可能となる。
また、上記認証システムにおいて、決定手段によって、所定数の3Dラインが顔の左右対称となる位置に配置されるように全体3D形状における該3Dラインが決定されるので、全体3D形状における3Dラインの(位置の)決定が効率良く行えるようになり処理時間が短縮されるとともに、データの取り扱い性が向上する。
また、上記認証システムにおいて、決定手段によって、所定数の3Dラインが少なくとも顔の鼻及び頬の部位を含むように全体3D形状における該3Dラインが決定されるので、当該3Dラインを、例えば髪で隠れてしまう部位(例えば額)や計測し難い部位(例えば口髭を有する場合の口)を避けて設定することができて、この3Dラインから精度良く3D顔特徴量を算出することができ、ひいては高精度の認証を行うことが可能となる。
また、上記認証システムにおいて、2次元特徴量算出手段(2D特徴量抽出部17b)によって、特徴部位抽出手段により抽出された特徴部位の情報から顔の2次元的な特徴量である2D顔特徴量が算出され、特徴量比較手段によって、2次元特徴量算出手段により算出された2D顔特徴量と3D特徴量算出手段により算出された3D顔特徴量とを併せてなる総合的な顔特徴量と、比較用顔特徴量とが比較されるので、2D顔特徴量と3D顔特徴量とを用いたより高精度な認証を行うことが可能となる。
また、上記認証システムにおいて、3次元特徴量算出手段によって、少なくとも顔の特徴部位以外の部位を含む3Dラインにおける局所3D形状情報から3D顔特徴量が算出されるので、2D顔特徴量と3D顔特徴量とを用いた認証(多重認証)を行うに際して、2D顔特徴量として特徴を抽出し難い特徴部位以外の部位の特徴を、3D顔特徴量として含むことができ、すなわち2D顔特徴量でカバーすることができない特徴量を3D顔特徴量でカバーすることができ、ひいてはより高精度な認証を行うことができる。
また、上記認証システムにおいて、特徴量比較手段によって、複数の3Dラインから得られた複数の3D顔特徴量(3D特徴ベクトル)と比較用顔特徴量(比較用3D特徴ベクトル)との間の距離情報(ユークリッド距離の情報)に基づいて比較処理が行われるので、3D顔特徴量と比較用顔特徴量との個数(3D特徴ラインと比較用3D特徴ラインとの本数)が1対1に対応していない場合であっても、容易に特徴量比較手段による比較処理を実行することができる。
また、上記認証システムにおいて、特徴量比較手段によって、複数の3Dラインから得られた複数の3D顔特徴量(3D特徴ベクトル)と比較用顔特徴量(比較用3D特徴ベクトル)との間の距離情報(ユークリッド距離の情報)であって、該距離が最小となる場合の最小距離情報に基づいて比較処理が行われるので、3D顔特徴量と比較用顔特徴量との個数(3D特徴ラインと比較用3D特徴ラインとの本数)が1対1に対応していない場合であっても、容易に且つ精度良く特徴量比較手段による比較処理を実行することができる。
また、上記認証システムにおいて、2D顔特徴量を算出するための特徴部位の情報がテクスチャ情報とされ、補正手段(姿勢・光源補正部15)によって、当該テクスチャ情報に対して、顔の姿勢に関する補正である姿勢変動補正及び顔に対する光源の向きに関する補正である光源変動補正が行われるので、姿勢変動補正及び光源変動補正がなされたテクスチャ情報に基づいて適正な2D顔特徴量を得ることができ、ひいてはより高精度な認証を行うことができる。
また、上記認証システムにおいて、3次元形状取得手段において、少なくとも2つの撮影装置(カメラCA1、CA2)によって顔の2D画像が撮影され、3次元形状算出手段によって、当該各撮影装置から得られた2枚の2D画像から位相限定相関法による演算処理で得た対応点に対して3次元再構成を行うことによって全体3D形状が算出されるので、高価な3次元撮影装置等を用いることなく低コストで、且つ位相限定相関法と3次元再構成処理により精度良く全体3D形状を算出することができる。
また、上記認証システムにおいて、3次元特徴量算出手段により算出される3D顔特徴量がベクトル量(3D特徴ベクトル)とされ、記憶手段(記憶部3)によって、該ベクトル量に対応する比較用顔特徴量(比較用特徴量)としての比較用ベクトル量(比較用の3D特徴ベクトル)が記憶されるので、すなわち比較用顔特徴量として記憶されるデータが、計測された所謂密な3D形状データ(3D顔密形状データ)でなくベクトル量となるので、記憶するデータ量を小さくすることができる(メモリ容量が少なくて済む)とともに、データの扱いが容易となる。
なお、本発明は、以下の態様をとることができる。
(A)特徴抽出用ラインから3D特徴ラインを決定する方法は、上述のように定義点を投影することにより求める方法でなくともよい。すなわち、定義点でなく特徴抽出用ライン自体を3D顔密形状データ上へ投影し、この投影により得られる投影ライン上の3D点を3D特徴ラインとしての情報として抽出する方法であってもよい。
(B)認証システム1は、図1に示すようにコントローラ10とカメラCA1、CA2とに分離された構成でなくてもよい。例えばコントローラ10内に直接、各カメラが内蔵された構成であってもよい。ただしこの場合、各カメラは、互いに異なる角度で認証対象者HMを撮影できるような配置で内蔵されている。