JP2013218604A - 画像認識装置、画像認識方法及びプログラム - Google Patents

画像認識装置、画像認識方法及びプログラム Download PDF

Info

Publication number
JP2013218604A
JP2013218604A JP2012090242A JP2012090242A JP2013218604A JP 2013218604 A JP2013218604 A JP 2013218604A JP 2012090242 A JP2012090242 A JP 2012090242A JP 2012090242 A JP2012090242 A JP 2012090242A JP 2013218604 A JP2013218604 A JP 2013218604A
Authority
JP
Japan
Prior art keywords
viewpoint
image
similarity
face
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012090242A
Other languages
English (en)
Inventor
Kiyotaka Takahashi
潔考 高橋
Kotaro Yano
光太郎 矢野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012090242A priority Critical patent/JP2013218604A/ja
Publication of JP2013218604A publication Critical patent/JP2013218604A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】登録顔画像群と入力顔画像群との間で、より精度の高い認識結果が得られるようにする。
【解決手段】まず、被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得し、前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から局所特徴量を抽出する。次に、前記抽出された特徴量と、登録画像の特徴量との類似度を算出し、前記算出された類似度と前記多視点画像の視点位置とから基準視点を決定する。そして、対応付けられ視点と前記決定された基準視点とがずれている場合に、類似度が低くなるように補正し、前記補正された類似度に基づいて、前記被写体を認識する。
【選択図】図1

Description

本発明は、例えば、顔認識を行うために用いて好適な画像認識装置、画像認識方法及びプログラムに関する。
従来、人物の顔を含む画像から顔の領域を顔画像として抽出し、抽出した顔画像を予め登録した特定人物の顔画像と比較することにより、個人識別を行う顔認識技術が知られている。この顔認識技術は、例えば、カメラに写っている人物が登録者であると認証されたときにオフィス等への入室を許可するなどのセキュリティ用途に使用されている。
一方、この顔認識技術を同一人物が写っている写真の検索に利用したいといった要望もある。前述したようなセキュリティ用途においては、人物を撮影する際の条件に制約を付けて高精度の認識を可能としているが、検索に利用する場合は人物の撮影条件が様々であるため認識精度が低下するといった問題がある。例えば、顔の向きや表情、撮影時の照明が異なった写真間では、同一人物が写っていても別人物と誤判定してしまうことがあった。
そこで、近年では、顔の向きが異なる場合においても高精度に顔認識を行う方法として、複数方向の顔画像を利用した様々な方式が提案されている。例えば、非特許文献1には、複数方向の顔画像から部分空間を作成し、登録顔及び入力顔の部分空間同士の類似度から認識を行う方法が開示されている。一方、特許文献1では、複数方向の顔画像から向きの異なる2枚の顔画像を選択し、フィールドモーフィングにより正面顔画像を生成して正面顔同士で照合を行う方法が開示されている。また、第3の方法として、複数方向の顔画像を登録顔及び入力顔で用意し、登録顔画像群及び入力顔画像群から夫々一枚の顔画像を選択して網羅的に照合を繰り返す方法も提案されている。
特開2009−25874号公報
福井 和広: "複数視点画像を用いた顔画像認識", 精密工学会画像応用技術専門委員会研究報告, Vol.19, No.3, pp.1-10, (2004) Viola and Jones. Rapid Object Detection using Boosted Cascade of Simple Features. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR2001) Cootes, Edwards and Taylor. Active Appearance Models. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 23, No.6, JUNE 2001 C. Shan and T. Gritti, Learning Discriminative LBP-Histogram Bins For Facial Expression Recognition. In Proc. British Machine Vision Conference, 2008
しかしながら、部分空間によって顔の認識を行う方法においては、顔の向きの変化の範囲が広すぎると顔の見えが大きく変わってしまうため、個人の特徴を正確に表現できる部分空間を作成することが困難になる。また、画像モーフィングを利用した方法では、画像間の対応付けを失敗すると生成した正面顔が破綻してしまうといった問題点がある。そこで、最も高精度に顔認証を行うためには、登録顔画像群と入力顔画像群とから網羅的に照合を繰り返す手法を用いることが望ましい。しかしながら、この方法を単純に適用すると、撮像方向の異なる複数の顔画像の視点によって、別人物でも類似度が高くなる場合があり、認識性能が劣化するといった問題点がある。すなわち、顔の向きによる見えの違いと個人差による見えの違いとの区別がつかなくなる。
本発明は前述の問題点に鑑み、登録顔画像群と入力顔画像群との間で、より精度の高い認識結果が得られるようにすることを目的としている。
本発明の画像認識装置は、被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得手段と、前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出手段と、前記抽出手段によって抽出された特徴量と、登録画像の特徴量との類似度を算出する算出手段と、前記算出手段によって算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定手段と、前記決定手段によって決定された基準視点を基に、前記類似度を補正する補正手段と、前記補正手段により補正された類似度に基づいて、前記被写体を認識する認識手段とを備えたことを特徴とする。
本発明によれば、多視点画像同士の照合時に向きによる違いと個人による違いとの区別がつくことができ、より精度の高い認識結果を得ることができる。
第1の実施形態に係る画像認識装置の機能構成例を示すブロック図である。 第1の実施形態における多視点画像取得部を構成する多眼撮像装置の一例を示す図である。 第1の実施形態において、多視点画像を登録する処理手順の一例を示すフローチャートである。 多視点画像の一例を示す図である。 特徴点の位置を説明する図である。 人物の顔における局所領域を説明する図である。 第1の実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。 視点位置からの距離に基づく補正量を説明する図である。 第2の実施形態に係る画像認識装置の機能構成例を示すブロック図である。 第2の実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。 多視点画像の各基準視点をもとに、基準視点の位置を整合性がある位置関係に補正する処理を説明する図である。
(第1の実施形態)
以下、図面を参照しながら、本発明の好適な実施形態について詳細に説明する。本実施形態では、多視点画像から顔の個人識別を行う例について説明する。
図1は、本実施形態に係る画像認識装置100の機能構成例を示すブロック図である。
図1において、多視点画像取得部101は、複数の撮像部を備えた多眼撮像装置と、多眼撮像装置を構成する撮像部の制御を行う撮像制御部と、多眼撮像装置で取得した多視点画像を視点位置毎に記録する記録装置とにより構成されている。図2に、多眼撮像装置の一例を示す。図2に示すように、多眼撮像装置200には、画像データを取得する25個の撮像部201〜225が正方格子上に均等に配置されている。このような多眼方式の撮像装置により、同一の被写体を複数の視点位置から撮像した、撮像方向の異なる複数方向からの画像群を得ることができる。
顔検出部102は、多視点画像取得部101で取得した多視点画像を構成する夫々の単視点画像から顔領域を検出し、その位置座標の情報を出力する。顔画像正規化部103は、顔検出部102で検出した顔領域の位置座標から顔領域が所定の配置及び大きさになるように元の単視点画像に対して画像の幾何学的変換を行い、正規化された顔画像を切り出す。
顔特徴点検出部104は、顔画像正規化部103で正規化した顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出し、その位置座標の情報を出力する。局所特徴抽出部105は、顔特徴点検出部104で検出した顔特徴の端点位置に基づいて、顔画像正規化部103で正規化した顔画像から局所領域を切り出し、切り出した領域から顔を認識するための局所特徴量を求める。多視点顔特徴登録部106は、局所特徴抽出部105が求めた顔の局所特徴量を多視点画像の視点位置と対応付けて登録する。
類似度算出部107は、多視点画像間での各局所領域における類似度を単視点画像毎に算出する。すなわち、局所特徴抽出部105によって求めた局所特徴量と多視点顔特徴登録部106に既に登録されている局所特徴量との類似度を算出する。局所特徴量対応付け部108は、類似度算出部107で算出した類似度を基に多視点画像間での局所特徴量の対応付けを行い、局所領域毎に対応する視点を求める。基準視点決定部109は、局所特徴量対応付け部108で求めた多視点画像間での局所特徴量の対応関係と多視点画像の視点位置とから基準視点を決定する。
類似度補正部110は、基準視点決定部109で求めた基準視点を基に、局所特徴量対応付け部108で対応付けられた局所特徴量間の類似度を補正する。類似度統合部111は、類似度補正部110で補正した類似度を統合し、多視点画像間の類似度として算出する。認識部112は、類似度統合部111で求めた多視点画像間の類似度に基づいて、入力された多視点画像の人物が登録されている多視点画像(登録画像)の人物と同一人物かどうかを判定する。
次に、本実施形態に係る画像認識装置100の動作について説明する。
図3は、本実施形態における多視点画像を登録する処理手順の一例を示すフローチャートである。
まず、多視点画像取得部101は、多視点画像を取得し、取得した多視点画像を多視点画像取得部101の内部メモリに記憶する(S301)。このとき、取得する多視点画像は輝度画像とし、RGB等のカラー画像を取得した場合は輝度画像に変換して内部メモリに記憶する。図4には、多視点画像の例を示しており、例えば、図4における左上隅の顔画像401は図2の撮像部201で取得されたものである。
次に、顔検出部102は、多視点画像取得部101で取得した多視点画像から顔領域の正確な位置及び大きさを求める(S302)。例えば、非特許文献3で開示されている方法によって、多視点画像取得部101の内部メモリに記憶されている輝度画像中の顔領域の位置を求める。この処理では、例えば、図4に示した25個の顔の位置(両目の中心位置に相当)、及び大きさ(両目間の距離に相当)を求め、不図示のメモリに記憶しておく。
次に、顔画像正規化部103は、顔検出部102で検出した顔の位置及び大きさに基づいて、検出した顔領域が所定の配置、大きさになるように幾何学変換を行い、不図示のメモリに記憶する(S303)。例えば、両目の夫々の位置が画像中の所定の位置に配置される100×100画素の顔画像になるように変換する。
次に、顔特徴点検出部104は、顔画像正規化部103で正規化した顔画像から顔の特徴を表す目、鼻、口などの顔部品の端点を検出する(S304)。本実施形態では、図5に示すように、両目の目尻、目頭、口の左右の端点の位置を特徴点として検出する。これらの特徴点を検出する技術は、例えば、非特許文献3に開示されている方法を用いる。そして、検出した端点の位置座標の情報を不図示のメモリに記憶しておく。
次に、局所特徴抽出部105は、顔特徴点検出部104で検出した端点の位置に基づいて、顔画像正規化部103で正規化した顔画像から局所領域を切り出し、切り出した領域から顔を認識するための特徴量を求める(S305)。本実施形態では、図6の破線で示すように左右の目、眉、鼻、口の6領域を局所領域として切り出す。例えば、左目の領域を切り出す場合は左目の目尻、目頭の位置座標を参照して顔画像から切り出す。すなわち、左目の目尻、目頭の位置座標から顔画像中の左目領域の四隅の位置座標を所定の幾何学的関係に基づいて求め、左目領域が所定の矩形になるように幾何変換を施して局所領域を切り出す。局所領域は、例えば30×30画素の矩形領域になるように変換する。
そして、求めた局所領域の画像から局所特徴量を求める。本実施形態では、局所特徴量としてLBPヒストグラムを求める。LBPヒストグラムは、非特許文献4に記載されているように近傍の画素の輝度の増加あるいは減少傾向を符号化したLBP特徴を求め、局所領域内で符号化した値毎にヒストグラム化したものである。LBP特徴は照明変動にロバストな特徴を持つ。本実施形態では、局所特徴量としてLBPヒストグラムを用いる場合について説明したが、その他、例えば、輝度勾配ヒストグラムやガボールウェーブレット特徴量、等を用いるようにしてもよいし、それらを組合せた特徴量を用いるようにしてもよい。同様にして、その他の局所領域に対しても夫々参照すべき端点の位置座標に基づいて顔画像から局所特徴量を求める。
次に、多視点顔特徴登録部106は、局所特徴抽出部105で求めた局所特徴量を多視点画像の視点位置と対応付けて局所領域毎に登録する(S306)。すなわち、求めた局所特徴量の情報は、顔画像の多視点画像中の視点インデックス(図2の各撮像手段のどれかを示すポインタ)、及び局所領域インデックス(局所領域のどれかを示すポインタ)とともに不図示のメモリに登録される。
次に、多視点画像中のすべての顔についてS303〜S306の処理を行ったか否かを判定する(S307)。この判定の結果、すべての顔について処理を行っていない場合はS303に戻り、すべての顔について処理が終了した場合は、処理を終了する。
図7は、本実施形態において、入力された多視点画像(以下、入力多視点画像)と登録されている多視点画像(以下、登録多視点画像)とを照合する処理手順の一例を示すフローチャートである。
まず、多視点画像取得部101は、多視点画像を取得する(S701)。ここでの処理は、図3のS301と同じである。次に、顔検出部102は、多視点画像取得部101で取得した多視点画像から顔領域の正確な位置及び大きさを求める(S702)。ここでの処理は、図3のS302と同じである。
次に、多視点画像から顔の局所特徴量を取得する(S703)。ここでの処理は、図3のS303〜S305と同じである。ここで、S703で求めた局所特徴量を、多視点画像中の視点位置と共に不図示のメモリに記憶しておく。
次に、類似度算出部107は、S703で取得した顔の局所特徴量と、図3の手順により既に多視点顔特徴登録部106に登録されている局所特徴量との類似度を局所領域毎に全単視点画像の組み合わせの数だけ算出する(S704)。例えば、登録されている多視点画像における左上端の単視点画像との左目の領域における類似度を算出する場合には、左上端の視点インデックスを持ち、かつ左目の局所領域インデックスを持つ局所特徴量を不図示のメモリから読み出す。そして、S703で取得した顔の左目の局所特徴量との類似度の計算を行う。類似度の計算では、LBPヒストグラムのヒストグラムインターセクションを計算する。同様に、登録されている多視点画像の中の他の単視点画像での局所特徴量の類似度を計算する。また、同様に、全局所領域に対して類似度を計算する。そして、求めた類似度を、入力多視点画像及び登録多視点画像の双方の視点インデックスと局所領域インデックスとに対応付けて不図示のメモリに記憶する。
次に、局所特徴量対応付け部108は、類似度算出部107で算出した類似度を基に多視点画像間での局所特徴量の対応付けを局所領域毎に行い、局所領域毎に対応する視点を求める(S705)。例えば、左目の領域についてS704で算出した類似度を取得し、最も類似度の高い視点インデックスを持つ登録されている多視点画像の局所特徴量を対応する局所特徴量として対応付けを行う。また、局所特徴量の対応関係と共に対応付けられた局所特徴量間の類似度(すなわち、ここでは最大の類似度)も同時に、入力多視点画像の単視点画像と登録多視点画像との局所領域における類似度として不図示のメモリに記憶しておく。このように対応付けることにより、入力時の顔と登録時の顔の向きがずれていたとしても、多視点画像取得部101のいずれかの撮像部で向きが一致することが期待できる。同様にして他の局所領域での局所特徴量の対応付けを行う。
次に、基準視点決定部109は、局所特徴量対応付け部108で求めた多視点画像間での局所特徴量の対応関係と多視点画像の視点位置とから基準視点を決定する(S706)。ここで、基準視点とは、ある多視点画像を構成する一つの単視点画像に対応する別の多視点画像を構成する単視点画像の視点と定義する。まず、局所特徴量対応付け部108で対応付けられた局所特徴量の登録多視点画像の視点インデックスを全ての局所領域に対して取得する。そして、最も頻度の高い視点インデックスが表す視点を投票によって基準視点とする。
次に、類似度補正部110は、基準視点決定部109で求めた基準視点を基に、局所特徴量対応付け部108で対応付けられた局所特徴量間の類似度を補正する(S707)。例えば、以下の式(1)に基づいて類似度を補正する。
Figure 2013218604
ここで、Sriは入力多視点画像のi番目の単視点画像のr番目の局所領域の類似度、Sri(corrected)は補正後の類似度である。また、ρはペナルティ係数であり、0.08等の任意の正の数値である。また、dは基準視点決定部109で求めた基準視点と局所特徴量対応付け部108で求めた局所領域毎の対応する視点との間の距離を表す指標である。
例えば、図2において基準視点の位置が撮像部201に対応するものであり、ある局所領域での対応する視点位置が撮像部202に対応する場合を距離=1と設定する。また、基準視点の位置が撮像部201に対応するものであり、ある局所領域での対応する視点位置が撮像部207に対応する場合は距離=2と設定する。これにより、図8に示すように、基準視点から距離が離れるほど、類似度は低く補正される。なお、本実施形態では式(1)に示したように類似度が低くなるように補正したが、dの値が大きい程、類似度が相対的に低くなるような方法であれば他の方法でも構わない。例えば、dの値が小さい程、類似度が高くなるような補正方法であっても本質的には同じである。
また、類似度を補正する方法として、前述した方法以外にも、S706で求めた基準視点に対応した局所特徴量との類似度を取得して、S705で一旦対応付けられた局所特徴量間の類似度を置き換えるようにしてもよい。
次に、類似度統合部111は、類似度補正部110で補正した類似度を統合し、その統合結果を入力多視点画像のある単視点画像と登録多視点画像との間の類似度とする(S708)。例えば、以下の式(2)のように局所領域毎の類似度の単純総和によって類似度を統合する。
Figure 2013218604
ここで、Siは入力多視点画像のある単視点画像と登録多視点顔画像との間の類似度である。
次に、多視点画像中のすべての顔についてS703〜S708の処理を行ったか否かを判定する(S709)。この判定の結果、すべての顔について処理を行っていない場合はS703に戻り、すべての顔について処理が終了した場合は、次のS710に進む。
次に、類似度統合部111は、統合した類似度を入力多視点画像と登録多視点画像との統合類似度として統合する(S710)。この処理では、S708の処理と同様に、以下の式(3)によって類似度を統合する。
Figure 2013218604
ここで、Sは入力多視点画像と登録多視点画像との間の統合類似度である。
次に、認識部112は、類似度統合部111で統合された統合類似度に基づいて、入力多視点画像の人物が登録多視点画像の人物と同一人物かどうかを判定する(S711)。この処理では、多視点画像間の統合類似度が所定値以上の場合に、入力した顔画像が登録顔と同一人物であると判断する。
なお、以上の説明では登録多視点画像の人物が一人の場合について説明したが、登録多視点画像の人物が複数の場合にも適用できる。すなわち、前述したS704〜S710の処理を登録されている人物の顔画像毎に繰り返し、類似度が所定値以上の登録顔が複数あった場合に、統合類似度が最大の人物を該当人物と判断するようにする。
以上のように本実施形態によれば、視点位置関係がずれている場合に局所領域毎に対応する局所特徴量間の類似度を補正するようにした。これにより、多視点画像同士の照合時に向きによる違いと個人による違いの区別がつくようにした。なお、本実施形態では顔の認識を例に説明したが、顔以外の特定の物体の識別にも適用できる。
(第2の実施形態)
以下、本発明の第2の実施形態について説明する。本実施形態では、入力多視点画像の任意の単視点画像の基準視点を決定する際、各単視点画像の基準視点を利用して、より高精度に補正する。
図9は、本実施形態に係る画像認識装置900の機能構成例を示すブロック図である。なお、第1の実施形態で説明した図1の画像認識装置100と異なる点は、基準視点補正部901が設けられている点である。なお、それ以外の構成については図1と同様であるため、説明は省略する。
以下、本実施形態における動作について説明する。なお、本実施形態においては、多視点画像を登録する処理は、第1の実施形態で説明した図3と同様である。
図10は、本実施形態において、入力多視点画像と登録多視点画像とを照合する処理手順の一例を示すフローチャートである。なお、S1001〜S1006は、それぞれ図7のS701〜S706と同様であるため、説明は省略する。
次に、多視点画像中のすべての顔についてS1003〜S1006の処理を行ったか否かを判定する(S1007)。この判定の結果、すべての顔について処理を行っていない場合はS1003に戻り、すべての顔について処理が終了した場合は、次のS1008に進む。
次に、基準視点補正部901は、基準視点決定部109で決定した多視点画像の各基準視点をもとに、基準視点の位置を整合性がある位置関係に補正する(S1008)。ここで、「整合性がある」とは、入力多視点画像における単視点画像間の相対的な位置関係と、登録多視点画像における各単視点画像の基準視点間の相対的な位置関係とが一致していることを指す。まず、入力多視点画像と登録多視点画像との視点位置の相対的な関係をS1006で求めた入力多視点画像の各単視点画像の視点インデックスの頻度から求める。詳しくは、求めた視点インデックスの頻度が最も大きい単視点画像と登録多視点画像の一つの単視点画像との組に対応した視点位置の相対的な関係を求める。そして、求めた位置関係に一致するように入力多視点画像の他の単視点画像に対する基準視点を補正する。
例えば、図11に示す例において、AおよびA′が前記相対的な位置関係を表す組であるものとする。また、入力多視点画像のB、C、Dに対する基準視点の位置が夫々登録多視点画像のB′、C′、D′であるものとすると、BおよびCの多視点画像間での位置関係はAの位置関係と一致している。しかしながら、Dの多視点画像間での位置関係はAの位置関係と一致していない。そこで、この場合は、Dの多視点画像間での位置関係をAの位置関係と一致するように登録多視点画像中の基準視点をD″に補正する。
なお、本実施形態では、入力多視点画像と登録多視点画像との視点位置の相対的な関係をステップS1006で求めた視点インデックスの頻度に基づいて求めるようにしたが、他の方法を用いてもよい。例えば、最初に入力多視点画像及び登録多視点画像の視点位置の相対的な関係を求めずに、結果的に基準視点の補正量が最小になるように、多視点画像間で視点位置関係が整合性のあるように基準視点を補正するようにしてもよい。
次に、類似度補正部110は、基準視点補正部901で補正して求めた基準視点を基に、局所特徴量対応付け部108で対応付けられた局所特徴量間の類似度を補正する(S1009)。ここでの処理は図7のS707と同じである。また、S1010の処理は、図7のS708の処理と同様であり、S1011及びS1012は、それぞれ図7のS710及びS711と同様である。
なお、以上の説明では、登録多視点画像の人物が一人の場合について説明したが、登録多視点画像の人物が複数の場合にも適用できる。この場合、前述したS1004〜S1011を登録されている人物の顔画像毎に繰り返し、類似度が所定値以上の登録顔が複数あった場合に、類似度が最大の人物を該当人物と判断するようにする。
以上のように本実施形態によれば、視点位置関係がずれている場合に局所領域毎に対応する局所特徴量間の類似度を補正するようにした。これにより、多視点画像同士の照合時に向きによる違いと個人による違いとの区別をつけることができる。なお、本実施形態では顔の認識を例に説明したが、顔以外の特定の物体の識別にも適用できる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 多視点画像取得部
105 局所特徴抽出部
107 類似度算出部
109 基準視点決定部
110 類似度補正部
112 認識部

Claims (7)

  1. 被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得手段と、
    前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出手段と、
    前記抽出手段によって抽出された特徴量と、登録画像の特徴量との類似度を算出する算出手段と、
    前記算出手段によって算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定手段と、
    前記決定手段によって決定された基準視点を基に、前記類似度を補正する補正手段と、
    前記補正手段により補正された類似度に基づいて、前記被写体を認識する認識手段とを備えたことを特徴とする画像認識装置。
  2. 前記算出手段により算出された類似度から前記登録画像との間で前記特徴量の対応付けを行い、前記局所領域ごとに対応する視点を求める対応付け手段を備え、
    前記決定手段は、前記対応付け手段による対応付けの結果と前記多視点画像の視点位置とから基準視点を決定することを特徴とする請求項1に記載の画像認識装置。
  3. 前記決定手段は、前記対応付け手段により求められた局所領域ごとの対応する視点の結果によって、基準視点を決定することを特徴とする請求項2に記載の画像認識装置。
  4. 前記補正手段は、前記対応付け手段により対応付けられた視点と前記決定手段により決定された基準視点とがずれている場合に、前記算出手段により算出された類似度が低くなるように補正することを特徴とする請求項3に記載の画像認識装置。
  5. 前記多視点画像は顔画像であることを特徴とする請求項1〜4の何れか1項に記載の画像認識装置。
  6. 被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得工程と、
    前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出工程と、
    前記抽出工程において抽出された特徴量と、登録画像の特徴量との類似度を算出する算出工程と、
    前記算出工程において算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定工程と、
    前記決定工程において決定された基準視点を基に、前記類似度を補正する補正工程と、
    前記補正工程において補正された類似度に基づいて、前記被写体を認識する認識工程とを備えたことを特徴とする画像認識方法。
  7. 被写体の撮像方向がそれぞれ異なる複数の単視点画像を含む多視点画像を取得する取得工程と、
    前記複数の単視点画像から複数の局所領域を抽出して前記局所領域の夫々から特徴量を抽出する抽出工程と、
    前記抽出工程において抽出された特徴量と、登録画像の特徴量との類似度を算出する算出工程と、
    前記算出工程において算出された類似度と前記多視点画像の視点位置とから基準視点を決定する決定工程と、
    前記決定工程において決定された基準視点を基に、前記類似度を補正する補正工程と、
    前記補正工程において補正された類似度に基づいて、前記被写体を認識する認識工程とをコンピュータに実行させることを特徴とするプログラム。
JP2012090242A 2012-04-11 2012-04-11 画像認識装置、画像認識方法及びプログラム Pending JP2013218604A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012090242A JP2013218604A (ja) 2012-04-11 2012-04-11 画像認識装置、画像認識方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012090242A JP2013218604A (ja) 2012-04-11 2012-04-11 画像認識装置、画像認識方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2013218604A true JP2013218604A (ja) 2013-10-24

Family

ID=49590603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012090242A Pending JP2013218604A (ja) 2012-04-11 2012-04-11 画像認識装置、画像認識方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2013218604A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016015170A1 (en) * 2014-07-28 2016-02-04 Xiaoou Tang A method for face recognition and a system thereof
CN110414304A (zh) * 2018-04-26 2019-11-05 株式会社日立制作所 物体辨别装置及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016015170A1 (en) * 2014-07-28 2016-02-04 Xiaoou Tang A method for face recognition and a system thereof
CN106663186A (zh) * 2014-07-28 2017-05-10 北京市商汤科技开发有限公司 用于脸部识别的方法和系统
CN106663186B (zh) * 2014-07-28 2018-08-21 北京市商汤科技开发有限公司 用于脸部识别的方法和系统
CN110414304A (zh) * 2018-04-26 2019-11-05 株式会社日立制作所 物体辨别装置及方法
CN110414304B (zh) * 2018-04-26 2023-10-27 株式会社日立制作所 物体辨别装置及方法

Similar Documents

Publication Publication Date Title
US10198623B2 (en) Three-dimensional facial recognition method and system
CN111310731B (zh) 基于人工智能的视频推荐方法、装置、设备及存储介质
JP5801601B2 (ja) 画像認識装置、画像認識装置の制御方法、およびプログラム
Husken et al. Strategies and benefits of fusion of 2D and 3D face recognition
US8374422B2 (en) Face expressions identification
CN105740778B (zh) 一种改进的三维人脸活体检测方法及其装置
US20180075291A1 (en) Biometrics authentication based on a normalized image of an object
KR101268718B1 (ko) 대조 장치
MX2014002827A (es) Aparato de reconocimiento de personas y metodo de reconocimiento de personas.
US11238271B2 (en) Detecting artificial facial images using facial landmarks
Ouanan et al. Facial landmark localization: Past, present and future
CN105243376A (zh) 一种活体检测方法和装置
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
JP2013218605A (ja) 画像認識装置、画像認識方法及びプログラム
CN111652018B (zh) 一种人脸注册方法和认证方法
CN107480628B (zh) 一种人脸识别方法及装置
CN106980818B (zh) 一种用于人脸图像的个性化预处理方法、系统及其终端
JP6202938B2 (ja) 画像認識装置および画像認識方法
Xu et al. Robust shape-feature-vector-based face recognition system
JP2012221053A (ja) 画像認識装置、画像認識方法、及びプログラム
JP2013218604A (ja) 画像認識装置、画像認識方法及びプログラム
JP2008065651A (ja) 顔画像認証方法、顔画像認証装置、および、プログラム
Cai et al. Robust facial expression recognition using RGB-D images and multichannel features
KR20160042646A (ko) 얼굴 인식 방법
CN111428670B (zh) 人脸检测方法、装置、存储介质及设备