JP2013218604A

JP2013218604A - 画像認識装置、画像認識方法及びプログラム

Info

Publication number: JP2013218604A
Application number: JP2012090242A
Authority: JP
Inventors: Kiyotaka Takahashi; 潔考高橋; Kotaro Yano; 光太郎矢野
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2012-04-11
Filing date: 2012-04-11
Publication date: 2013-10-24

Abstract

【課題】登録顔画像群と入力顔画像群との間で、より精度の高い認識結果が得られるようにする。
【解決手段】まず、被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得し、前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から局所特徴量を抽出する。次に、前記抽出された特徴量と、登録画像の特徴量との類似度を算出し、前記算出された類似度と前記多視点画像の視点位置とから基準視点を決定する。そして、対応付けられ視点と前記決定された基準視点とがずれている場合に、類似度が低くなるように補正し、前記補正された類似度に基づいて、前記被写体を認識する。
【選択図】図１

Description

本発明は、例えば、顔認識を行うために用いて好適な画像認識装置、画像認識方法及びプログラムに関する。

従来、人物の顔を含む画像から顔の領域を顔画像として抽出し、抽出した顔画像を予め登録した特定人物の顔画像と比較することにより、個人識別を行う顔認識技術が知られている。この顔認識技術は、例えば、カメラに写っている人物が登録者であると認証されたときにオフィス等への入室を許可するなどのセキュリティ用途に使用されている。

一方、この顔認識技術を同一人物が写っている写真の検索に利用したいといった要望もある。前述したようなセキュリティ用途においては、人物を撮影する際の条件に制約を付けて高精度の認識を可能としているが、検索に利用する場合は人物の撮影条件が様々であるため認識精度が低下するといった問題がある。例えば、顔の向きや表情、撮影時の照明が異なった写真間では、同一人物が写っていても別人物と誤判定してしまうことがあった。

そこで、近年では、顔の向きが異なる場合においても高精度に顔認識を行う方法として、複数方向の顔画像を利用した様々な方式が提案されている。例えば、非特許文献１には、複数方向の顔画像から部分空間を作成し、登録顔及び入力顔の部分空間同士の類似度から認識を行う方法が開示されている。一方、特許文献１では、複数方向の顔画像から向きの異なる２枚の顔画像を選択し、フィールドモーフィングにより正面顔画像を生成して正面顔同士で照合を行う方法が開示されている。また、第３の方法として、複数方向の顔画像を登録顔及び入力顔で用意し、登録顔画像群及び入力顔画像群から夫々一枚の顔画像を選択して網羅的に照合を繰り返す方法も提案されている。

特開２００９−２５８７４号公報

福井和広: "複数視点画像を用いた顔画像認識", 精密工学会画像応用技術専門委員会研究報告, Vol.19, No.3, pp.1-10, (2004) Viola and Jones. Rapid Object Detection using Boosted Cascade of Simple Features. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR2001) Cootes, Edwards and Taylor. Active Appearance Models. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 23, No.6, JUNE 2001 C. Shan and T. Gritti, Learning Discriminative LBP-Histogram Bins For Facial Expression Recognition. In Proc. British Machine Vision Conference, 2008

しかしながら、部分空間によって顔の認識を行う方法においては、顔の向きの変化の範囲が広すぎると顔の見えが大きく変わってしまうため、個人の特徴を正確に表現できる部分空間を作成することが困難になる。また、画像モーフィングを利用した方法では、画像間の対応付けを失敗すると生成した正面顔が破綻してしまうといった問題点がある。そこで、最も高精度に顔認証を行うためには、登録顔画像群と入力顔画像群とから網羅的に照合を繰り返す手法を用いることが望ましい。しかしながら、この方法を単純に適用すると、撮像方向の異なる複数の顔画像の視点によって、別人物でも類似度が高くなる場合があり、認識性能が劣化するといった問題点がある。すなわち、顔の向きによる見えの違いと個人差による見えの違いとの区別がつかなくなる。

本発明は前述の問題点に鑑み、登録顔画像群と入力顔画像群との間で、より精度の高い認識結果が得られるようにすることを目的としている。

本発明の画像認識装置は、被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得手段と、前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出手段と、前記抽出手段によって抽出された特徴量と、登録画像の特徴量との類似度を算出する算出手段と、前記算出手段によって算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定手段と、前記決定手段によって決定された基準視点を基に、前記類似度を補正する補正手段と、前記補正手段により補正された類似度に基づいて、前記被写体を認識する認識手段とを備えたことを特徴とする。

本発明によれば、多視点画像同士の照合時に向きによる違いと個人による違いとの区別がつくことができ、より精度の高い認識結果を得ることができる。

第１の実施形態に係る画像認識装置の機能構成例を示すブロック図である。第１の実施形態における多視点画像取得部を構成する多眼撮像装置の一例を示す図である。第１の実施形態において、多視点画像を登録する処理手順の一例を示すフローチャートである。多視点画像の一例を示す図である。特徴点の位置を説明する図である。人物の顔における局所領域を説明する図である。第１の実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。視点位置からの距離に基づく補正量を説明する図である。第２の実施形態に係る画像認識装置の機能構成例を示すブロック図である。第２の実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。多視点画像の各基準視点をもとに、基準視点の位置を整合性がある位置関係に補正する処理を説明する図である。

（第１の実施形態）
以下、図面を参照しながら、本発明の好適な実施形態について詳細に説明する。本実施形態では、多視点画像から顔の個人識別を行う例について説明する。
図１は、本実施形態に係る画像認識装置１００の機能構成例を示すブロック図である。
図１において、多視点画像取得部１０１は、複数の撮像部を備えた多眼撮像装置と、多眼撮像装置を構成する撮像部の制御を行う撮像制御部と、多眼撮像装置で取得した多視点画像を視点位置毎に記録する記録装置とにより構成されている。図２に、多眼撮像装置の一例を示す。図２に示すように、多眼撮像装置２００には、画像データを取得する２５個の撮像部２０１〜２２５が正方格子上に均等に配置されている。このような多眼方式の撮像装置により、同一の被写体を複数の視点位置から撮像した、撮像方向の異なる複数方向からの画像群を得ることができる。

顔検出部１０２は、多視点画像取得部１０１で取得した多視点画像を構成する夫々の単視点画像から顔領域を検出し、その位置座標の情報を出力する。顔画像正規化部１０３は、顔検出部１０２で検出した顔領域の位置座標から顔領域が所定の配置及び大きさになるように元の単視点画像に対して画像の幾何学的変換を行い、正規化された顔画像を切り出す。

顔特徴点検出部１０４は、顔画像正規化部１０３で正規化した顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出し、その位置座標の情報を出力する。局所特徴抽出部１０５は、顔特徴点検出部１０４で検出した顔特徴の端点位置に基づいて、顔画像正規化部１０３で正規化した顔画像から局所領域を切り出し、切り出した領域から顔を認識するための局所特徴量を求める。多視点顔特徴登録部１０６は、局所特徴抽出部１０５が求めた顔の局所特徴量を多視点画像の視点位置と対応付けて登録する。

類似度算出部１０７は、多視点画像間での各局所領域における類似度を単視点画像毎に算出する。すなわち、局所特徴抽出部１０５によって求めた局所特徴量と多視点顔特徴登録部１０６に既に登録されている局所特徴量との類似度を算出する。局所特徴量対応付け部１０８は、類似度算出部１０７で算出した類似度を基に多視点画像間での局所特徴量の対応付けを行い、局所領域毎に対応する視点を求める。基準視点決定部１０９は、局所特徴量対応付け部１０８で求めた多視点画像間での局所特徴量の対応関係と多視点画像の視点位置とから基準視点を決定する。

類似度補正部１１０は、基準視点決定部１０９で求めた基準視点を基に、局所特徴量対応付け部１０８で対応付けられた局所特徴量間の類似度を補正する。類似度統合部１１１は、類似度補正部１１０で補正した類似度を統合し、多視点画像間の類似度として算出する。認識部１１２は、類似度統合部１１１で求めた多視点画像間の類似度に基づいて、入力された多視点画像の人物が登録されている多視点画像（登録画像）の人物と同一人物かどうかを判定する。

次に、本実施形態に係る画像認識装置１００の動作について説明する。
図３は、本実施形態における多視点画像を登録する処理手順の一例を示すフローチャートである。
まず、多視点画像取得部１０１は、多視点画像を取得し、取得した多視点画像を多視点画像取得部１０１の内部メモリに記憶する（Ｓ３０１）。このとき、取得する多視点画像は輝度画像とし、ＲＧＢ等のカラー画像を取得した場合は輝度画像に変換して内部メモリに記憶する。図４には、多視点画像の例を示しており、例えば、図４における左上隅の顔画像４０１は図２の撮像部２０１で取得されたものである。

次に、顔検出部１０２は、多視点画像取得部１０１で取得した多視点画像から顔領域の正確な位置及び大きさを求める（Ｓ３０２）。例えば、非特許文献３で開示されている方法によって、多視点画像取得部１０１の内部メモリに記憶されている輝度画像中の顔領域の位置を求める。この処理では、例えば、図４に示した２５個の顔の位置（両目の中心位置に相当）、及び大きさ（両目間の距離に相当）を求め、不図示のメモリに記憶しておく。

次に、顔画像正規化部１０３は、顔検出部１０２で検出した顔の位置及び大きさに基づいて、検出した顔領域が所定の配置、大きさになるように幾何学変換を行い、不図示のメモリに記憶する（Ｓ３０３）。例えば、両目の夫々の位置が画像中の所定の位置に配置される１００×１００画素の顔画像になるように変換する。

次に、顔特徴点検出部１０４は、顔画像正規化部１０３で正規化した顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出する（Ｓ３０４）。本実施形態では、図５に示すように、両目の目尻、目頭、口の左右の端点の位置を特徴点として検出する。これらの特徴点を検出する技術は、例えば、非特許文献３に開示されている方法を用いる。そして、検出した端点の位置座標の情報を不図示のメモリに記憶しておく。

次に、局所特徴抽出部１０５は、顔特徴点検出部１０４で検出した端点の位置に基づいて、顔画像正規化部１０３で正規化した顔画像から局所領域を切り出し、切り出した領域から顔を認識するための特徴量を求める（Ｓ３０５）。本実施形態では、図６の破線で示すように左右の目、眉、鼻、口の６領域を局所領域として切り出す。例えば、左目の領域を切り出す場合は左目の目尻、目頭の位置座標を参照して顔画像から切り出す。すなわち、左目の目尻、目頭の位置座標から顔画像中の左目領域の四隅の位置座標を所定の幾何学的関係に基づいて求め、左目領域が所定の矩形になるように幾何変換を施して局所領域を切り出す。局所領域は、例えば３０×３０画素の矩形領域になるように変換する。

そして、求めた局所領域の画像から局所特徴量を求める。本実施形態では、局所特徴量としてＬＢＰヒストグラムを求める。ＬＢＰヒストグラムは、非特許文献４に記載されているように近傍の画素の輝度の増加あるいは減少傾向を符号化したＬＢＰ特徴を求め、局所領域内で符号化した値毎にヒストグラム化したものである。ＬＢＰ特徴は照明変動にロバストな特徴を持つ。本実施形態では、局所特徴量としてＬＢＰヒストグラムを用いる場合について説明したが、その他、例えば、輝度勾配ヒストグラムやガボールウェーブレット特徴量、等を用いるようにしてもよいし、それらを組合せた特徴量を用いるようにしてもよい。同様にして、その他の局所領域に対しても夫々参照すべき端点の位置座標に基づいて顔画像から局所特徴量を求める。

次に、多視点顔特徴登録部１０６は、局所特徴抽出部１０５で求めた局所特徴量を多視点画像の視点位置と対応付けて局所領域毎に登録する（Ｓ３０６）。すなわち、求めた局所特徴量の情報は、顔画像の多視点画像中の視点インデックス（図２の各撮像手段のどれかを示すポインタ）、及び局所領域インデックス（局所領域のどれかを示すポインタ）とともに不図示のメモリに登録される。

次に、多視点画像中のすべての顔についてＳ３０３〜Ｓ３０６の処理を行ったか否かを判定する（Ｓ３０７）。この判定の結果、すべての顔について処理を行っていない場合はＳ３０３に戻り、すべての顔について処理が終了した場合は、処理を終了する。

図７は、本実施形態において、入力された多視点画像（以下、入力多視点画像）と登録されている多視点画像（以下、登録多視点画像）とを照合する処理手順の一例を示すフローチャートである。
まず、多視点画像取得部１０１は、多視点画像を取得する（Ｓ７０１）。ここでの処理は、図３のＳ３０１と同じである。次に、顔検出部１０２は、多視点画像取得部１０１で取得した多視点画像から顔領域の正確な位置及び大きさを求める（Ｓ７０２）。ここでの処理は、図３のＳ３０２と同じである。

次に、多視点画像から顔の局所特徴量を取得する（Ｓ７０３）。ここでの処理は、図３のＳ３０３〜Ｓ３０５と同じである。ここで、Ｓ７０３で求めた局所特徴量を、多視点画像中の視点位置と共に不図示のメモリに記憶しておく。

次に、類似度算出部１０７は、Ｓ７０３で取得した顔の局所特徴量と、図３の手順により既に多視点顔特徴登録部１０６に登録されている局所特徴量との類似度を局所領域毎に全単視点画像の組み合わせの数だけ算出する（Ｓ７０４）。例えば、登録されている多視点画像における左上端の単視点画像との左目の領域における類似度を算出する場合には、左上端の視点インデックスを持ち、かつ左目の局所領域インデックスを持つ局所特徴量を不図示のメモリから読み出す。そして、Ｓ７０３で取得した顔の左目の局所特徴量との類似度の計算を行う。類似度の計算では、ＬＢＰヒストグラムのヒストグラムインターセクションを計算する。同様に、登録されている多視点画像の中の他の単視点画像での局所特徴量の類似度を計算する。また、同様に、全局所領域に対して類似度を計算する。そして、求めた類似度を、入力多視点画像及び登録多視点画像の双方の視点インデックスと局所領域インデックスとに対応付けて不図示のメモリに記憶する。

次に、局所特徴量対応付け部１０８は、類似度算出部１０７で算出した類似度を基に多視点画像間での局所特徴量の対応付けを局所領域毎に行い、局所領域毎に対応する視点を求める（Ｓ７０５）。例えば、左目の領域についてＳ７０４で算出した類似度を取得し、最も類似度の高い視点インデックスを持つ登録されている多視点画像の局所特徴量を対応する局所特徴量として対応付けを行う。また、局所特徴量の対応関係と共に対応付けられた局所特徴量間の類似度（すなわち、ここでは最大の類似度）も同時に、入力多視点画像の単視点画像と登録多視点画像との局所領域における類似度として不図示のメモリに記憶しておく。このように対応付けることにより、入力時の顔と登録時の顔の向きがずれていたとしても、多視点画像取得部１０１のいずれかの撮像部で向きが一致することが期待できる。同様にして他の局所領域での局所特徴量の対応付けを行う。

次に、基準視点決定部１０９は、局所特徴量対応付け部１０８で求めた多視点画像間での局所特徴量の対応関係と多視点画像の視点位置とから基準視点を決定する（Ｓ７０６）。ここで、基準視点とは、ある多視点画像を構成する一つの単視点画像に対応する別の多視点画像を構成する単視点画像の視点と定義する。まず、局所特徴量対応付け部１０８で対応付けられた局所特徴量の登録多視点画像の視点インデックスを全ての局所領域に対して取得する。そして、最も頻度の高い視点インデックスが表す視点を投票によって基準視点とする。

次に、類似度補正部１１０は、基準視点決定部１０９で求めた基準視点を基に、局所特徴量対応付け部１０８で対応付けられた局所特徴量間の類似度を補正する（Ｓ７０７）。例えば、以下の式（１）に基づいて類似度を補正する。

ここで、Ｓ_riは入力多視点画像のｉ番目の単視点画像のｒ番目の局所領域の類似度、Ｓ_{ri(corrected)}は補正後の類似度である。また、ρはペナルティ係数であり、０．０８等の任意の正の数値である。また、ｄは基準視点決定部１０９で求めた基準視点と局所特徴量対応付け部１０８で求めた局所領域毎の対応する視点との間の距離を表す指標である。

例えば、図２において基準視点の位置が撮像部２０１に対応するものであり、ある局所領域での対応する視点位置が撮像部２０２に対応する場合を距離＝１と設定する。また、基準視点の位置が撮像部２０１に対応するものであり、ある局所領域での対応する視点位置が撮像部２０７に対応する場合は距離＝２と設定する。これにより、図８に示すように、基準視点から距離が離れるほど、類似度は低く補正される。なお、本実施形態では式（１）に示したように類似度が低くなるように補正したが、ｄの値が大きい程、類似度が相対的に低くなるような方法であれば他の方法でも構わない。例えば、ｄの値が小さい程、類似度が高くなるような補正方法であっても本質的には同じである。

また、類似度を補正する方法として、前述した方法以外にも、Ｓ７０６で求めた基準視点に対応した局所特徴量との類似度を取得して、Ｓ７０５で一旦対応付けられた局所特徴量間の類似度を置き換えるようにしてもよい。

次に、類似度統合部１１１は、類似度補正部１１０で補正した類似度を統合し、その統合結果を入力多視点画像のある単視点画像と登録多視点画像との間の類似度とする（Ｓ７０８）。例えば、以下の式（２）のように局所領域毎の類似度の単純総和によって類似度を統合する。

ここで、Ｓ_iは入力多視点画像のある単視点画像と登録多視点顔画像との間の類似度である。

次に、多視点画像中のすべての顔についてＳ７０３〜Ｓ７０８の処理を行ったか否かを判定する（Ｓ７０９）。この判定の結果、すべての顔について処理を行っていない場合はＳ７０３に戻り、すべての顔について処理が終了した場合は、次のＳ７１０に進む。

次に、類似度統合部１１１は、統合した類似度を入力多視点画像と登録多視点画像との統合類似度として統合する（Ｓ７１０）。この処理では、Ｓ７０８の処理と同様に、以下の式（３）によって類似度を統合する。

ここで、Ｓは入力多視点画像と登録多視点画像との間の統合類似度である。

次に、認識部１１２は、類似度統合部１１１で統合された統合類似度に基づいて、入力多視点画像の人物が登録多視点画像の人物と同一人物かどうかを判定する（Ｓ７１１）。この処理では、多視点画像間の統合類似度が所定値以上の場合に、入力した顔画像が登録顔と同一人物であると判断する。

なお、以上の説明では登録多視点画像の人物が一人の場合について説明したが、登録多視点画像の人物が複数の場合にも適用できる。すなわち、前述したＳ７０４〜Ｓ７１０の処理を登録されている人物の顔画像毎に繰り返し、類似度が所定値以上の登録顔が複数あった場合に、統合類似度が最大の人物を該当人物と判断するようにする。

以上のように本実施形態によれば、視点位置関係がずれている場合に局所領域毎に対応する局所特徴量間の類似度を補正するようにした。これにより、多視点画像同士の照合時に向きによる違いと個人による違いの区別がつくようにした。なお、本実施形態では顔の認識を例に説明したが、顔以外の特定の物体の識別にも適用できる。

（第２の実施形態）
以下、本発明の第２の実施形態について説明する。本実施形態では、入力多視点画像の任意の単視点画像の基準視点を決定する際、各単視点画像の基準視点を利用して、より高精度に補正する。

図９は、本実施形態に係る画像認識装置９００の機能構成例を示すブロック図である。なお、第１の実施形態で説明した図１の画像認識装置１００と異なる点は、基準視点補正部９０１が設けられている点である。なお、それ以外の構成については図１と同様であるため、説明は省略する。

以下、本実施形態における動作について説明する。なお、本実施形態においては、多視点画像を登録する処理は、第１の実施形態で説明した図３と同様である。

図１０は、本実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。なお、Ｓ１００１〜Ｓ１００６は、それぞれ図７のＳ７０１〜Ｓ７０６と同様であるため、説明は省略する。

次に、多視点画像中のすべての顔についてＳ１００３〜Ｓ１００６の処理を行ったか否かを判定する（Ｓ１００７）。この判定の結果、すべての顔について処理を行っていない場合はＳ１００３に戻り、すべての顔について処理が終了した場合は、次のＳ１００８に進む。

次に、基準視点補正部９０１は、基準視点決定部１０９で決定した多視点画像の各基準視点をもとに、基準視点の位置を整合性がある位置関係に補正する（Ｓ１００８）。ここで、「整合性がある」とは、入力多視点画像における単視点画像間の相対的な位置関係と、登録多視点画像における各単視点画像の基準視点間の相対的な位置関係とが一致していることを指す。まず、入力多視点画像と登録多視点画像との視点位置の相対的な関係をＳ１００６で求めた入力多視点画像の各単視点画像の視点インデックスの頻度から求める。詳しくは、求めた視点インデックスの頻度が最も大きい単視点画像と登録多視点画像の一つの単視点画像との組に対応した視点位置の相対的な関係を求める。そして、求めた位置関係に一致するように入力多視点画像の他の単視点画像に対する基準視点を補正する。

例えば、図１１に示す例において、ＡおよびＡ′が前記相対的な位置関係を表す組であるものとする。また、入力多視点画像のＢ、Ｃ、Ｄに対する基準視点の位置が夫々登録多視点画像のＢ′、Ｃ′、Ｄ′であるものとすると、ＢおよびＣの多視点画像間での位置関係はＡの位置関係と一致している。しかしながら、Ｄの多視点画像間での位置関係はＡの位置関係と一致していない。そこで、この場合は、Ｄの多視点画像間での位置関係をＡの位置関係と一致するように登録多視点画像中の基準視点をＤ″に補正する。

なお、本実施形態では、入力多視点画像と登録多視点画像との視点位置の相対的な関係をステップＳ１００６で求めた視点インデックスの頻度に基づいて求めるようにしたが、他の方法を用いてもよい。例えば、最初に入力多視点画像及び登録多視点画像の視点位置の相対的な関係を求めずに、結果的に基準視点の補正量が最小になるように、多視点画像間で視点位置関係が整合性のあるように基準視点を補正するようにしてもよい。

次に、類似度補正部１１０は、基準視点補正部９０１で補正して求めた基準視点を基に、局所特徴量対応付け部１０８で対応付けられた局所特徴量間の類似度を補正する（Ｓ１００９）。ここでの処理は図７のＳ７０７と同じである。また、Ｓ１０１０の処理は、図７のＳ７０８の処理と同様であり、Ｓ１０１１及びＳ１０１２は、それぞれ図７のＳ７１０及びＳ７１１と同様である。

なお、以上の説明では、登録多視点画像の人物が一人の場合について説明したが、登録多視点画像の人物が複数の場合にも適用できる。この場合、前述したＳ１００４〜Ｓ１０１１を登録されている人物の顔画像毎に繰り返し、類似度が所定値以上の登録顔が複数あった場合に、類似度が最大の人物を該当人物と判断するようにする。

以上のように本実施形態によれば、視点位置関係がずれている場合に局所領域毎に対応する局所特徴量間の類似度を補正するようにした。これにより、多視点画像同士の照合時に向きによる違いと個人による違いとの区別をつけることができる。なお、本実施形態では顔の認識を例に説明したが、顔以外の特定の物体の識別にも適用できる。

（その他の実施形態）
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア（プログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）がプログラムを読み出して実行する処理である。

１０１多視点画像取得部
１０５局所特徴抽出部
１０７類似度算出部
１０９基準視点決定部
１１０類似度補正部
１１２認識部

Claims

被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得手段と、
前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出手段と、
前記抽出手段によって抽出された特徴量と、登録画像の特徴量との類似度を算出する算出手段と、
前記算出手段によって算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定手段と、
前記決定手段によって決定された基準視点を基に、前記類似度を補正する補正手段と、
前記補正手段により補正された類似度に基づいて、前記被写体を認識する認識手段とを備えたことを特徴とする画像認識装置。
前記算出手段により算出された類似度から前記登録画像との間で前記特徴量の対応付けを行い、前記局所領域ごとに対応する視点を求める対応付け手段を備え、
前記決定手段は、前記対応付け手段による対応付けの結果と前記多視点画像の視点位置とから基準視点を決定することを特徴とする請求項１に記載の画像認識装置。
前記決定手段は、前記対応付け手段により求められた局所領域ごとの対応する視点の結果によって、基準視点を決定することを特徴とする請求項２に記載の画像認識装置。
前記補正手段は、前記対応付け手段により対応付けられた視点と前記決定手段により決定された基準視点とがずれている場合に、前記算出手段により算出された類似度が低くなるように補正することを特徴とする請求項３に記載の画像認識装置。
前記多視点画像は顔画像であることを特徴とする請求項１〜４の何れか１項に記載の画像認識装置。
被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得工程と、
前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出工程と、
前記抽出工程において抽出された特徴量と、登録画像の特徴量との類似度を算出する算出工程と、
前記算出工程において算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定工程と、
前記決定工程において決定された基準視点を基に、前記類似度を補正する補正工程と、
前記補正工程において補正された類似度に基づいて、前記被写体を認識する認識工程とを備えたことを特徴とする画像認識方法。
被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得工程と、
前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出工程と、
前記抽出工程において抽出された特徴量と、登録画像の特徴量との類似度を算出する算出工程と、
前記算出工程において算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定工程と、
前記決定工程において決定された基準視点を基に、前記類似度を補正する補正工程と、
前記補正工程において補正された類似度に基づいて、前記被写体を認識する認識工程とをコンピュータに実行させることを特徴とするプログラム。