JP2008046864A - 顔画像認識装置及び顔画像認識プログラム - Google Patents

顔画像認識装置及び顔画像認識プログラム Download PDF

Info

Publication number
JP2008046864A
JP2008046864A JP2006221850A JP2006221850A JP2008046864A JP 2008046864 A JP2008046864 A JP 2008046864A JP 2006221850 A JP2006221850 A JP 2006221850A JP 2006221850 A JP2006221850 A JP 2006221850A JP 2008046864 A JP2008046864 A JP 2008046864A
Authority
JP
Japan
Prior art keywords
face
face image
image recognition
particles
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006221850A
Other languages
English (en)
Other versions
JP4928193B2 (ja
Inventor
Atsushi Matsui
淳 松井
Clippingdale Simon
クリピングデル サイモン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2006221850A priority Critical patent/JP4928193B2/ja
Publication of JP2008046864A publication Critical patent/JP2008046864A/ja
Application granted granted Critical
Publication of JP4928193B2 publication Critical patent/JP4928193B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】高速に高精度な顔画像認識を実現する。
【解決手段】予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる人物を特定する顔画像認識装置において、前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録部と、前記顔画像登録部により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出部と、前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識部とを有し、前記顔画像認識部は、予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行う。
【選択図】図1

Description

本発明は、顔画像認識装置及び顔画像認識プログラムに係り、特に高速に高精度な顔画像認識を実現するための顔画像認識装置及び顔画像認識プログラムに関する。
従来より、映像等に映っている顔の認識手法としては、音声認識や動作認識、顔表情認識、対象物認識、又はそれらを組み合わせた技術が有効な手段であることが知られており、そのための顔画像認識システムが用いられている。
ところで、顔画像認識が困難である大きな理由の一つは、認識対象可変性が多いことであり、特に顔の表情による可変性が挙げられる。そこで、従来の技術では、顔の変形等の変動要素に対して頑健な顔画像認識を行う技術として、Bayes(ベイズ)推定に基づいた認識手法がある(例えば、非特許文献1、特許文献1参照。)。
非特許文献1に記載された技術は、今まで登場人物の追加・削除、照明や背景等の撮影条件の変化が生じた場合、その都度パラメータの調整を行う必要あったが、そのシステムのパラメータを確率変数とみなし、顔テンプレートに付随するパラメータの事後確率分布を、階層的Bayes推定の枠組みから捉えて、その確率分布のサンプルをハミルトニアモンテカルロ法(HMC法)で採取する。その上で、尤度を事後確率分布に関して周辺化(積分)することで、顔画像認識を行うものであった。
松井淳 他,"ハミルトニアモンテカルロ法によるBayes的画像認識",映像情報メディア学会誌 Vol.59,No.8,pp.1183〜1190,2005年. 特開2005−208850号公報
しかしながら、上述した従来手法である一括学習型のBayes推定による方法は、映像等のように時々刻々と変化する入力画像上の顔の状態を、事前に与えられた学習データから抽出した普遍的なパラメータのサンプルの分布として表している。したがって、例えば、映像に含まれている顔の表情変化等による顔モデルの変動に対しては、ある程度頑健な顔画像認識が実現できているが、直前の時刻までに与えられた入力画像を考慮していないため、高精度な画像認識を実現できているとはいえない。
また、従来手法で顔画像認識精度を向上させるためには、個々の人物についての多数の学習データを用意し、それら学習データに含まれる顔の多様な変化(パラメータの分布)を、より多くのサンプルで表現する必要があるが、その場合、抽出するサンプルの総数の増加に伴い、個々のサンプルについて繰り返し行われる計算の回数が増えるため、顔画像認識プログラム全体の処理コストが増大する問題を抱えていた。
本発明は、上述した問題点に鑑みなされたものであり、高速に高精度な顔画像認識を実現するための顔画像認識装置及び顔画像認識プログラムを提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
請求項1に記載された発明は、予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる顔画像の人物を特定するための顔画像認識装置において、前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録部と、前記顔画像登録部により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出部と、前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識部とを有し、前記顔画像認識部は、予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行うことを特徴とする。
請求項1記載の発明によれば、高速に高精度な顔画像認識を実現することができる。また、計算コストを左右する粒子の総数を動的に制御することによって、装置全体の処理時間を短縮することができる。また、逐次モンテカルロ法を適用することで、高精度に確率分布の更新処理を実現することができる。
請求項2に記載された発明は、前記顔画像認識部は、前記逐次モンテカルロ法における粒子の再抽出において、前記顔テンプレートのモデル周辺尤度を利用して、事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする条件のもとで前記粒子の再抽出を行うことを特徴とする。
請求項2記載の発明によれば、最終的な認識精度への影響を最小限にして、計算コストを効果的に削減することができる。
請求項3に記載された発明は、前記顔画像認識部は、前記入力画像が入力される毎時刻あるいは予め設定された時間間隔毎に粒子の再抽出を行うことを特徴とする。
請求項3記載の発明によれば、必要に応じて粒子の再抽出を行うことで効率的かつ高速に確率分布の更新処理を実現することができる。したがって、高精度な顔画像認識を実現することができる。
請求項4に記載された発明は、前記顔画像認識部は、同一人物を連続して撮影した入力画像の顔画像認識を行う際、前記入力画像毎に前記パラメータの確率分布を逐次学習することを特徴とする。
請求項4記載の発明によれば、動画像や連続静止画像(映像を含む)等では、直前の顔の変形との関連性が強いため、連続する入力画像の顔画像認識を行う際、その直前の入力画像によりパラメータの確率分布を逐次学習させることで、より高精度に顔画像認識を行うことができる。
請求項5に記載された発明は、前記入力画像から顔の中心位置及び大きさを含む顔領域情報を検出する顔画像検出部を有し、前記顔画像認識部は、前記顔領域情報に基づいて顔画像認識を行うことを特徴とする。
請求項5記載の発明によれば、顔領域情報も認識判定に用いることにより、より高精度な顔画像認識を行うことができる。
請求項6に記載された発明は、予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる顔画像の人物を特定するための顔画像認識処理をコンピュータに実行させるための顔画像認識プログラムにおいて、前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録処理と、前記顔画像登録処理により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出処理と、前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識処理とを有し、前記顔画像認識処理時に予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行う再抽出処理をコンピュータに実行させる。
請求項6記載の発明によれば、高速に高精度な顔画像認識を実現することができる。また、実行プログラムをコンピュータにインストールすることにより、容易に顔画像認識を実現することができる。
本発明によれば、高速に高精度な顔画像認識を実現することができる。
<本発明の特徴>
本発明は、例えば動画像又は連続静止画像(映像を含む)等のように、ある人物の顔を連続的に撮影した画像の組(以下、「入力画像」という)が、撮影時刻の順に一枚ずつ与えられる場合において、予め与えられた複数の人物の顔画像(以下、「登録顔画像」という)の中から入力画像に含まれる顔と最も類似するものを探し、その結果として、例えばその人物を特定する人物識別情報としてのラベル(以下、「人物ID」という)を逐次出力する。
また、連続静止画像を入力とする顔画像認識を実現する技術は幾つか提案されているが、本発明では、特に個々の登録顔画像について、顔の物理モデル(以下、「顔テンプレート」という)を作成し、それに付随するパラメータΘの事後確率分布、及び登録した人物(顔テンプレート)の総数Npersons個の各々の顔テンプレートの事後確率分布をベイズ(Bayes)推定に基づいて直接計算し、計算した結果に基づいて比較する手法を用いる。つまり、表情変化や発話動作に伴って時々刻々と変化する顔の状態(画像平面上での歪み)に追従するため、各時刻における顔モデルの確率分布を与えられた入力画像そのものを用いて逐次的に推定(学習)する。
ここで、例えば(1)式に示されるある過去の時刻から現時刻nまでの入力画像列:y1:n=(y,y,…,y)が与えられたときのj番目の顔テンプレートHの事後確率分布P(H|y1:n)について考える。

上述した(1)式の右辺、分子の第1項は時刻nにおける顔テンプレートHのモデル周辺尤度P(y|y1:n−1,H)を示しており、以下の(2)式に示す更新式で定義される。
ここで、上述した(2)式のうち、P(y|Θ,H)は、パラメータΘの尤度であり、顔テンプレートHの構造と入力画像yから抽出する特徴量の生成モデル(観測モデル)によって定まる関数である。また、P(Θ|y1:n−1,H)は、パラメータΘの予測確率分布であり、以下に示す(3)式、(4)式で定義される。
また、顔テンプレートの初期分布は、予め事前知識(例えば、ある特定の人物が、他のどの人物よりも多く出現する可能性が高い等の情報)を有している等の特別な理由がない限り等確率であるため以下の(5)式が成り立つ。
顔画像認識を行う際には、上述した(1)式にしたがって、顔テンプレートの事後確立分布を逐次更新し、例えば各時刻nにおける事後確率が最大を与える顔テンプレートの人物IDを認識結果として出力する。つまり、以下に示す(6)式が成り立つ。
また、顔テンプレートの事後確率分布を求めるには、(2)式及び(3)式の計算を実行する必要があるが、この多次元連続空間上の積分値を解析的に求めることは非常に困難である。
そこで、本発明では、被積分関数の一部であるパラメータΘの事後確率分布を、(7)式に示すN個のサンプルの粗密と(8)式に示す各々のサンプルの重みで表現する。
ここで、w (i)|Hは、j番目のモデルHに属するi番目のサンプルΘ(i)についての、提案分布(proposal distribution)π(Θ)と事後確率分布P(Θ|y1:n,H)との間の誤差を補正するサンプル重み(importance weight)であり、w (i)|Hは、その全ての和が1となるように大きさを正規化した正規サンプル重み(normalized importance weight)である。
なお、提案分布とは、注目する確率分布から直接サンプル(標本値)を得ることが困難なときに直接的にサンプルを得ることが可能な、該確率分布と形状が類似した別の分布を用いてサンプルを抽出する場合の分布関数を表す。このとき、パラメータの事後確率分布は、提案分布から抽出したサンプルの疎密と、提案分布と事後確率分布との誤差を補正する正規サンプル重みの対の集合によって表現される。
本発明では、上述したサンプルとその正規サンプル重みの対、及びそれらの対の有限子の集合を「粒子」として扱う。このとき、上述した(3)式の積分は、粒子、すなわち、サンプルと正規サンプル重みの集合を用いて以下に示す(9)式で近似される。
なお、上述の(9)式においてδ(x)は、クロネッカーのデルタ関数を表す。このクロネッカーのデルタ関数は、入力値xが0のときに1を返し、入力値xが0以外のときに0を返すものである。このとき、(2)式の積分は以下に示す(10)式で表される。
このように、問題となる確率分布を逐次的に抽出した有限個の粒子の集合で表現し、興味の対象となる積分をその有限和で近似する手法は、逐次モンテカルロ(Sequential Monte Carlo,SMC)法に用いられている(詳細は、例えば伊庭幸人他、統計科学フロンティア12「計算統計II−マルコフ連鎖モンテカルロ法とその周辺−」、岩波書店、pp.293−324等を参照。)。
ここで、逐次モンテカルロ法の近似誤差は、抽出する粒子の数が多い程減少するが、その一方でモンテカルロ近似の計算コストは粒子の総数に比例して増大してしまう欠点を有する。したがって、本発明では、比較すべきモデル(顔テンプレート)が複数存在する問題において、粒子の総数を統計的指標に基づいて動的に制御することにより、逐次モンテカルロ法の計算コストを効果的に削減し、高速に高精度な顔画像認識を実現する。
<<モデル周辺尤度に基づく粒子数の動的制御>>
次に、本発明におけるモデル周辺尤度に基づく粒子数の動的制御について説明する。本発明における逐次モンテカルロ法では、粒子の重みの分散が時間の経過と共に発散することを防止するため、毎時刻あるいは一定の時間間隔等の予め設定された条件による所定のタイミングで、粒子をその重みの大きさに応じて複製又は消滅する操作(再抽出処理)を行う。
なお、再抽出の具体的な方法については様々な手法が提案されているが、一般には再抽出の前後で粒子の総数を一定とする条件が課せられることが多い。再抽出の結果、重みが大きい粒子はその大きさに応じて分割され、確率の高いサンプル値の周辺により多くの粒子が割り当てられる。
本発明が扱う問題のように、それぞれの粒子が複数の異なるモデル(顔テンプレート)に属する場合、粒子の再抽出の操作は、それぞれの粒子が属するモデルと関連性を持って行われる。その結果、より大きな重みを持つ粒子が多数属しているモデル、すなわち、上述した(10)式で計算したモデルの尤度がより大きなモデルに粒子が集中する。これは、与えられた情報(入力画像)が増える共に、モデルの事後確率分布のピークが徐々に鋭くなることを意味する。
本発明は、上述した再抽出の処理の結果、特定のモデルに粒子が徐々に集中する一般的な傾向を利用して、最終的な興味の対象である事後確率が最大を与えるモデルとそのモデルの事後確率に近い事後確率を持つモデル(対立候補)との確率値の大小関係を保持したまま、粒子の総数を制御することで、全体の計算コストを効率的に削減することを目的とする。
つまり、本発明では、ベイズ推定の枠組みにおけるモデル周辺尤度を利用して、最終的な興味の対象であるモデル事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする新たな再抽出手法を用いる。
具体的には、粒子を再抽出する際に、各々のモデルに割り当てた粒子の総数Ntotalを一定とする一般的な条件を、モデル周辺尤度の最大値を与えるモデルHj*に属する粒子数Nj*のみを一定とする条件に変更する。なお、この変更の結果、再抽出の前後で全粒子の総数Ntotalは変化するが、最終的な興味の対象である事後確率分布の最大値を与えるモデルHj*に割り当てられる粒子の数Nj*は、略一定に保たれ、かつ、Hj*の対立候補となるその他のモデルとの事後確率の比率(大小関係)は、粒子の総数Ntotalを一定とした場合と変わらないため、認識精度への影響は理論的にない。
ここで、抽出後の粒子の総数Ntotalは、以下に示す(11)式で与えられる。
なお、上述したNj*を決定するモデル周辺尤度の最大値を与えるモデルHj*は、以下に示す(12)式となる。
このように、本発明では、顔画像の様々な変動要素に対応した顔画像認識を行うにあたり、特に顔のモデルに付随するパラメータの確率分布を逐次モンテカルロ法を用いて逐次学習する際、最も出現の可能性が高い顔モデルを安定して判定するために必要十分な粒子の総数を動的に決定し調整することで、高速に高精度な顔画像認識を実現することができる。
<実施の形態>
次に、上述した特徴を有する本発明における顔画像認識装置及び顔画像認識プログラムを好適に実施した形態について、図面を用いて説明する。
図1は、顔画像認識装置の一構成例を示す図である。図1に示す顔画像認識装置1は、顔データ作成装置10と、顔画像認識特定装置20とを有するよう構成されている。また、顔データ作成装置10は、顔画像登録部11と、顔変形データ抽出部12と、記録部13とを有するよう構成されている。また、顔画像認識特定装置20は、顔画像検出部21と、顔画像認識部22とを有するよう構成されている。
<顔データ作成装置10>
顔データ作成装置10は、予め入力画像に出現することが予想される人物の顔画像(登録顔画像)と、個々の人物を区別するための人物識別情報としての人物ID、個々の人物の顔の変形の統計的性質を表現する表情サンプル画像と、登録顔画像及び表情サンプル画像のそれぞれの顔の各器官(目、鼻、口)の位置を記録した特徴点配置情報とから、個々の顔の静的な情報を記録した顔テンプレートと、個々の顔の動的な情報を記録した顔変形データを作成する。また、顔データ作成装置10は、作成した顔テンプレート及び顔変形データを記録する。
具体的には、顔画像登録部11は、予め入力される登録顔画像と、各登録顔画像について特徴点が配置された特徴点配置情報xと、各登録画像に対応する人物IDjとから、特徴点における登録画像の情報から特徴量cを計算し、個々の顔テンプレートH=(x,c,j)を生成する。また、顔画像登録部11は、生成した顔テンプレートを記録部13に出力する。
ここで、本実施形態において、登録顔画像は、顔画像認識装置1に予め登録される人物の顔の画像データであり、また特徴点配置情報は、顔の各器官(目、鼻、口等)に配置された点の画像平面上での位置xであり、上述したパラメータΘに相当している。また、人物IDは、登録顔画像に対応する人物を特定するためのラベル又は番号n等からなる識別情報であり、人名や性別、年齢、顔画像の向き、ユニークID等により表される。更に、顔テンプレートは、登録顔画像の個々の顔の静的な特徴を予め設定された特徴点の配置と、それらの近傍の画像特徴量との組で表したモデルである。
また、顔変形データ抽出部12は、予め設定された個々の人物の表情サンプル画像と、各サンプル画像に対応する特徴点配置情報を用いて、特徴点配置の変動に関する統計量(例えば、特徴点配置の変分の共分散行列等)を計算し、計算した結果を顔変形データとして記録部13に出力する。
ここで、本実施形態において、表情サンプル画像は、個々の人物の表情変化に伴う顔の変形の様子を撮影した画像の集合を表す。また、特徴点配置の変動に関する統計量は、例えば特徴点配置の提案分布π(x)を決定する統計量である。
また、本実施形態において、顔変形データは、表情の変化等の一時的な変形に関する個々の顔の動的な特徴を、特徴点配置情報の共分散行列で表した統計モデルである。具体的には、顔変形データは、入力した変形サンプル画像に基づいて画像中の全ての特徴点が移動方向や移動距離等の移動情報を特徴付けたものであり、例えばある特徴点がどの程度動いたら、他の特徴点がどの向きにどの程度動くか等、特徴点毎に対応付けられた移動情報を統計的に求めたものである。
記録部13は、個々の人物の顔に関するデータ(特徴点の座標と特徴量)と、人物IDから構成される顔テンプレート及び個々の人物の顔変形データが記録される。
ここで、図2は、登録画像の特徴点配置の具体例を示したものである。図2に示すように、登録画像の特徴点は、例えば顔画像の両目元や目尻、鼻の頂点、口の端点の合計9点に特徴点30−0〜30−8を配置する。なお、特徴点配置の位置や数についてはこの限りではない。
ここで、上述した顔データ作成装置10における処理は、後述する顔画像認識特定装置20との処理と連動させる必要はなく、例えば顔画像認識特定装置20に入力画像が与えられる前に実行されていればよい。
<顔画像認識特定装置20>
顔画像認識特定装置20は、顔データ作成装置10が事前に作成し保存した顔テンプレートと顔変形データを利用して、逐次的に与えられる連続した入力画像から顔認識結果を出力する。つまり、顔画像認識装置20は、記録部13に保存されている顔テンプレートと顔変形データから決定される提案分布π(x)を用いて、特徴点配置のサンプル{x (i)i=1 Njを抽出する。
次に、抽出されたサンプルを用いて、(7)式〜(10)式の計算、及び(11)式、(12)式の条件に基づいて、所定のタイミングで粒子の再抽出を実行し、例えば(6)式で定義した事後確率が最大となる顔テンプレートに対応する人物ID等を顔認識結果として出力する。
具体的には、顔画像検出部21は、現時点において与えられた認識対象である入力画像を読み込み、入力画像に含まれる顔の領域を検出する。また、顔画像検出部21は、検出した顔の領域の中心位置と大きさを特定して、中心位置と大きさ等からなる顔領域情報を顔画像認識部22に出力する。
なお、顔画像検出手法については、例えば上述した特許文献1や「P.Viola、P.,andM.Jones,”Rapid Object Detection using a Boosted Cascade of Simple Features,”Proc. CVPR2001,Vol.1,pp.511−518.」に記載されるような単純かつ多様な画像判別器の集合からなる顔検出装置を多段に接続する手法等を用いることができる。
また、本実施形態において、上述した入力画像は、顔認識処理対象として例えば人物ID等が知られていない人物の顔を撮影した動画像又は連続静止画像等である。また、本実施形態において出力される顔認識結果は、動画像又は連続静止画像等の各画像に対応する各々の時刻において事後確率が最大となる顔テンプレートが表すIDであるが、本発明において出力される顔認識結果はこれに限定されるものではない。
顔画像認識部22は、記録部13に予め記録された顔テンプレート、顔変形データを入力し、更に顔画像検出部21により現時刻において与えられた1枚の入力画像と、それに対応する顔領域情報に基づいて、上述した(7)式〜(12)式による計算及び上述した(6)式に対応する最大値探索を実行する。また、顔画像認識部22は、現時刻における事後確率が最大となる顔テンプレートの人物ID等を認識結果として出力する。
なお、顔画像認識部22は、逐次モンテカルロ法において時間の経過と共に増大する上述した粒子の分散を抑制させるため、予め設定された条件に基づき、所定のタイミングで粒子の再抽出(リサンプル)を行う。このとき、リサンプル後に最も多くの粒子が割り当てられているモデル、すなわち、リサンプルを行う時点でモデル周辺尤度が最大となるモデルに属する粒子の数Nが一定となるように、粒子の総数を統計的指標に基づいて動的に制御する。これにより、最終的な認識精度への影響を最小限にして、計算コストを効果的に削減することができる。
更に、顔画像認識部22は、連続して入力される画像を用いて顔認識に用いられる所定のパラメータの確率分布を逐次更新する。具体的には、顔画像認識部22は、連続した入力画像の顔画像認識を行う際、直前に入力された画像を用いてパラメータの確率分布を上述したベイズ推定による逐次学習則に基づいて逐次学習する。これにより、認識対象の個々の人物に固有の情報(顔変形データ)と動画像等が予め備えている入力画像の連続性とを利用して、表情変化や発話動作に付随する顔の変形等に対応可能な高精度の顔画像認識を実現することができる。
<顔画像認識>
ここで、本実施形態における顔画像認識について具体的に説明する。上述したように、顔データ作成装置10にて作成された顔テンプレートは、登録顔画像上に定義したN個の特徴点(上述した図2ではN=9)の配置x∈R2×N、各特徴点におけるK個の方位、R段階の解像度のガボール・ウェーブレット係数c∈CN×K×R、及び人物IDから構成される。
ここで、連続した入力画像列y1:n={y1,y2,・・・,y}が逐次的に与えられる場合について考える。n番目の入力画像上の特徴点配置をx∈R2×N
とおき、各特徴点の位置xで計算したガボール・ウェーブレット係数をc∈CN×K×Rとおく。ここで、従来手法としては、c,cの間の類似度を各々の解像度rに関する成分ベクトルc ,c 毎に定義し、各々のノルム(例えば、ユークリッドノルム等)で正規化したもとでの内積で評価しているが、これは各解像度rについてのベクトルc を指向性データとみなすことを意味する。
そこで、本実施形態では、一例として指向性データの自然な生成モデルとして知られているvon Mises−Fisher分布(詳細は、例えばI.S.Dhillon and S.Sra,”Modeling Data using Directional Distributions,”TR−03−06,University of Texas at Austin(2003).等を参照。)を用いてn枚目の入力画像yの尤度を以下に示す(13)式で定義する。
ここで、Hは仮定したj番目の顔テンプレートであり、βn,1:R={βn,1,βn,2,・・・,βn,R}は、時刻nにおける尤度関数の鋭さを決定するハイパーパラメータである。また、Zは、von Mises−Fisher分布の規格化定数である。
また、入力画像yが与えられる前のxの予測確率分布は以下に示す(14)式で定義する。
上述した(14)式において、Λは正規特徴点配置空間上での特徴点配置の共分散行列を表す。また、αは、事前分布の鋭さを決定するハイパーパラメータであり、規格化定数Zαは規格化定数である。また、Tは、顔テンプレートの特徴点配置x が張る空間(以下、正規特徴点配置空間という)から入力画像上の特徴点配置xが張る空間への写像を表す。以下、表記の簡略化のため、Tを決定する4つのパラメータの組(r、θ、u,v)を記号Tによって代表して表す。Tの各パラメータは、入力画像上の顔の中心位置と大きさ、画像平面内の回転を決定する。
本発明では、顔全体の動きが極端に激しくない場合を想定してTの逐次更新則P(T|Tn−1)として、以下に示す(15)式のような確率的ダイナミカルシステムを考える。
なお、上述した(15)式において、変数r,θ,u,vは、推定対象の一部として扱う顔領域の中心位置座標(u,v)、大きさr、頭部の傾きの角度θを表す。また、それぞれの変数は、学習アルゴリズム(逐次モンテカルロ法)を用いて、時刻nと共に更新される。
つまり、上述した(15)式は、各々のパラメータの確率が、直前の時刻での値の周りになだらかに分布している場合(言い換えると、あまり激しく動かない場合)の具体的な更新規則を示している。上述した(15)式では、直前の時刻における実現値rn−1,θn−1,un−1,vn−1に正規分布に従う4つの乱数v,vθ,v,vの値を各々加算して、現在の時刻の予測値r,θ,u,vとしている。
また、同様に、尤度関数及び事前確率の分布の鋭さを決定するハイパーパラメータについて、次のような予測モデルP(α,βn,1:R|αn−1,βn−1,1:R)を仮定すると以下に示す(16)式のようになる。
ここで、データy1:nが与えられたときj番目のモデルHの事後確率は、Bayesの定理より上述した(1)式によって再帰的に与えられる。本発明における画像認識においては、これまでに観測された入力画像集合y1:nについての事後確率が最大となるモデルHMPを時刻nにおける認識結果として出力する。なお、この関係式は、以下に示す(17)式にて表される。
ここで、モデルの初期分布P(H|y)は、上述した(5)式に示すようにNpersons個の顔モデルについて等確率であるとすると、上述した(1)に示されているHの尤度は以下に示す(18)式で与えられる。
ここで、上述した(18)式の計算は、多次元連続空間に関する積分であり、解析的に計算を実行すること不可能であることが多い。そのため、本発明では、この積分を上述した逐次モンテカルロ法(SMC法)による近似計算で実現する。
まず、時刻nにおける各パラメータの予測分布を独立同一なサンプルで表現するため、以下に示す(19)式のような提案分布πを考える。
ここで、提案分布π(x,α,β,T)に従うN個のサンプルが抽出されたとき、上述した(18)式の積分は以下に示す(20)式で近似的に計算することができる。
ここで、抽出したサンプルにおける提案分布と事後確率分布との誤差を補正する正規サンプル重みw (i)|Hは、上述した(19)式の提案分布を用いた場合、以下に示す(21)式、(22)式で計算される。
<粒子の再抽出>
次に、本実施形態における粒子の再抽出例について具体的に説明する。逐次モンテカルロ法では、上述した時間の経過と共に増大する補正用の重みの分散を抑制するために、画像が入力される毎時刻あるいは予め設定された一定の時間間隔等の予め設定された条件に基づく所定のタイミングで粒子の再抽出(リサンプル)が行われる。
粒子の総数Ntotalは、モンテカルロ近似の精度を決定する一つの重要な要素であり、多くの場合、リサンプルのアルゴリズムはNtotalが不変となるように設計される。本発明では、このリサンプルの処理において、粒子の総数を統計的指標に基づいて動的に制御することで、最終的な認識精度への影響を最小限にして計算コストを効果的に削減する。
以下、表記を簡略化させるため、各々のパラメータについてのi番目のサンプルを纏めてS(i)で表し、その正規サンプル重みをw (i)で表す。ただし、正規サンプル重みの添字jは、該正規サンプル重みと対応するサンプルが属するモデルの番号を表す。
リサンプルの具体的な実現方法は幾つか提案されているが、本発明では、Ntotalが不変である一般的な手法の一つであるResidual Resamplingについて考える。このアルゴリズムは、以下の手順にしたがってリサンプルを行う。
まず、各々のサンプルS(i)からk(i)=[Ntotal×w (i)]個のサンプルを複製する([x]はxの整数部)。次に、以下の(23)式に示す残りのサンプルRを(Ntotal×w (i))−k(i)に応じた確率で抽出する。また、上述の手法で抽出した各々のサンプルの正規サンプル重み全てを、以下に示す(24)式の値に設定する。
このアルゴリズムは、再抽出する粒子の総数Ntotalが不変で、かつ個々の粒子が正規サンプル重みの大小に応じた確率で抽出される。このとき、リサンプル後の個々のモデルに属する粒子の数の比率は、リサンプル前のそれらの正規サンプル重みの和の比率と同じである。
本発明では、各時刻におけるモデル事後確率分布のピークを求めればよく、例えば確率値の低い分布の裾で発生する推定誤差は最終的な認識性能に影響はない。そこで、リサンプル後に最も多くの粒子が割り当てられるモデル、すなわち、リサンプルを行う時点でモデル周辺尤度最大となるモデルに属する粒子数Nj^が一定となる処理を行う。リサンプルによって各モデルに割り当てられる粒子の数は、リサンプル前の正規サンプル重みの和に比例することから、リサンプル後の粒子の総数Ntotalは以下に示す(25)式で計算される。
このとき,モデル周辺尤度最大のj^番目以外のモデルについては、リサンプルの前後で割り当てられる粒子の数は同一又は減少する。したがって、本実施形態におけるリサンプルのアルゴリズムは、モデル事後確率分布のピークから離れたモデル、すなわち、最終的な認識結果として選ばれる可能性の低いモデルを統計的な指標にもとづいて枝狩り(Pruning)することができる。
上述したように、本発明では、顔画像の様々な変動要素に対応した顔画像認識を実現する装置において、特に顔のモデルに付随するパラメータの確率分布を逐次モンテカルロ方法を用いて逐次学習する際に、最も出現の可能性が高い顔モデルを安定して判定するために必要十分な粒子の総数を動的に決定し調整する。具体的には、ベイズ推定の枠組みにおけるモデル周辺尤度を利用して、最終的な興味の対象であるモデル事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする再抽出手法を用いることにより、高速に高精度な顔画像認識を実現することができる。
また、本発明では逐次モンテカルロ手法を用いて複数の顔画像を用いたパラメータの学習に係る時間を逐次的な更新則を適用することで、従来の一括学習型のアルゴリズムでの処理時間と比較して飛躍的に削減することができる。また、直前の時刻までに与えられた入力画像を用いて逐次学習を行うことで、表情変化等による顔画像の変動に対して頑健な顔画像認識を実現することができる。
<実行プログラム>
ここで、上述した顔画像認識装置1は、上述した専用の装置構成等を用いて本発明における顔画像認識処理を行うこともできるが、各構成における処理をコンピュータに実行させるための実行プログラムを生成し、例えば汎用のパーソナルコンピュータ、サーバ等にそのプログラムをインストールすることにより、本発明に係る顔画像認識処理を実現することができる。
<ハードウェア構成>
ここで、本発明における顔画像認識処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図3は、本発明における顔画像認識処理が実現可能なハードウェア構成の一例を示す図である。
図3におけるコンピュータ本体には、入力装置41と、出力装置42と、ドライブ装置43と、補助記憶装置44と、メモリ装置45と、各種制御を行うCPU(Central Processing Unit)46と、ネットワーク接続装置47とを有するよう構成されており、これらはシステムバスBで相互に接続されている。
入力装置41は、ユーザが操作するキーボード及びマウス等のポインティングデバイスや音声入力デバイス等を有しており、ユーザからのプログラムの実行指示等、各種操作信号、音声信号を入力する。出力装置42は、本発明における処理を行うためのコンピュータ本体を操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイやスピーカ等を有し、CPU46が有する制御プログラムにより実行経過や結果等を表示又は音声出力することができる。
ここで、本発明において、コンピュータ本体にインストールされる実行プログラムは、例えばCD−ROM等の記録媒体48等により提供される。プログラムを記録した記録媒体48は、ドライブ装置43にセット可能であり、記録媒体48に含まれる実行プログラムが、記録媒体48からドライブ装置43を介して補助記憶装置44にインストールされる。
また、ドライブ装置43は、本発明に係る実行プログラムを記録媒体48に記録することができる。これにより、その記録媒体48を用いて、他の複数のコンピュータに容易にインストールすることができ、容易に顔画像認識処理を実現することができる。
補助記憶装置44は、ハードディスク等のストレージ手段であり、本発明における実行プログラムや、コンピュータに設けられた制御プログラム等を蓄積し必要に応じて入出力を行うことができる。また、補助記憶装置44は、上述した登録顔画像や特徴点配置情報、人物ID、表情サンプル画像、顔テンプレート、顔変形データ、入力画像(動画像、連続静止画像等)、顔領域情報、粒子の再抽出を行うための条件等の各種設定情報、顔認識結果等を記録する記録部として用いることもできる。
メモリ装置45は、CPU46により補助記憶装置44から読み出された実行プログラム等を格納する。なお、メモリ装置45は、ROM(Read Only Memory)やRAM(Random Access Memory)等からなる。
CPU46は、OS(Operating System)等の制御プログラム、及び補助記憶装置44から読み出されメモリ装置45に格納されている実行プログラムに基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御して、顔画像認識処理における各処理を実現することができる。また、プログラムの実行中に必要な各種情報等は、補助記憶装置44から取得することができ、また格納することもできる。
ネットワーク接続装置47は、電話回線やLAN(Local Area Network)ケーブル等の通信ネットワーク等と接続することにより、実行プログラムを通信ネットワークに接続されている他の端末等から取得したり、プログラムを実行することで得られた実行結果又は本発明における実行プログラムを他の端末等に提供することができる。
上述したようなハードウェア構成により、特別な装置構成を必要とせず、低コストで上述した顔画像認識処理を実現することができる。また、プログラムをインストールすることにより、容易に顔画像認識処理を実現することができる。
<顔画像認識処理手順>
次に、本発明における実行プログラム(顔画像認識プログラム)を用いた顔画像認識処理手順についてフローチャートを用いて説明する。図4は、顔画像認識処理手順の一例を示すフローチャートである。
図4において、登録顔画像、特徴点配置情報、及び人物IDを読み込み(S01)、特徴量を計算して、個々の登録顔に対応する顔テンプレートを出力する(S02)。また、表情サンプル画像及び特徴点配置情報を読み込み(S03)、特徴点配置の提案分布を決定する統計量を顔変形データとして出力する(S04)。なお、上述したS01〜S04の処理は、予め実行され、記録部等に記録されていてもよい。
次に、顔認識を行うため、動画像又は連続静止画像等における各画像毎に対応して付与されている時刻情報を基準として、現時刻において与えられた1枚の入力画像を読み込み(S05)、読み込んだ入力画像に含まれている人の顔の領域を検出する(S06)。具体的には、顔領域の中心位置及び大きさを検出して顔領域情報を生成する。また、顔テンプレート、顔変形データ、顔領域情報、及び入力画像から、現時刻における事後確率が最大となる顔テンプレートの人物IDを人物識別情報として出力する(S07)。
ここで、次の画像を入力するか否かを判断し(S08)、次の画像を入力する場合(S08において、YES)、上述した逐次モンテカルロ法において抽出された事後確率分布を模したパラメータのサンプルとその重みからなる粒子の再抽出が必要であるか否かを判断する(S09)。なお、粒子の再抽出が必要であるか否かの判断は、予め設定された再抽出条件により処理の要否が判断され、具体的には、画像が入力される毎時刻や予め設定された時間間隔等により再抽出が行われる。
ここで、S09の処理において、粒子の再抽出が必要である場合(S09において、YES)、上述した手法を用いて抽出の再抽出を行う(S10)。また、粒子の再抽出が必要でない場合(S09において、NO)、又はS10の処理が終了後、逐次モンテカルロ法により、各パラメータである各時刻における確率分布を更新する(S11)。具体的には、各時刻におけるパラメータの確率分布を直前の時刻における予測分布と、現時刻の入力画像から得られる情報(尤度)を用いて逐次的に推定し、パラメータの確率分布に逐次更新を行う。また、S11の処理が終了後、S05に戻り連続する次の画像を入力して顔認識処理を継続して行う。また、S08において、入力画像がない場合等、次の画像を入力しない場合(S08において、NO)、顔認識処理を終了する。
上述したように、顔画像認識プログラムを用いた顔画像認識処理により、高速に高精度な顔認識を実現することができる。具体的には、顔画像の様々な変動要素に対応した顔画像認識を実現する装置において、特に顔のモデルに付随するパラメータの確率分布を逐次モンテカルロ方法を用いて逐次学習する際に、最も出現の可能性が高い顔モデルを安定して判定するために必要十分な粒子の総数を動的に決定し調整する。更に、ベイズ推定の枠組みにおけるモデル周辺尤度を利用して、最終的な興味の対象であるモデル事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする再抽出手法を用いることにより、高速に高精度な顔画像認識を実現することができる。また、プログラムをインストールすることにより、容易に顔画像認識処理を実現することができる。
<顔認識の評価結果>
次に、本発明を用いた顔認識の評価結果について説明する。本発明における顔認識手法(以下、Pruned Resamplingという)の有効性を検証するため、従来手法である(Residual Resampling)を比較対象とした認識実験を行った。
<<実験条件>>
ここで、実験に用いるデータとして、評価データ、登録データ、学習データの3種類を用意した。なお、本装置(システム)に逐次的に与える入力データy1:nとして用いる評価データとして、10人の被験者それぞれについての発話時の顔の連続画像(1秒間)を用意した。
また、各々の画像は、スタジオ照明・単色背景(ブルーバック)の条件で撮影した正面顔の動画像から、縦240画素×横360画素のサイズで30フレーム/秒のフレームレートで取得した。また、各人物の顔テンプレートH=(x,c,j)の作成に用いる登録データは、評価データと同じ条件で撮影した無表情・正面の顔画像1枚/人を用意した。
また、顔の位置情報の初期値T=(r,θ,u,v)は、予め手動で抽出した結果を用いた。予測モデルの分散とハイパーパラメータの初期値は、σ =σ =1.0、σ =0.1、σθ =0.0001、σα =σβ =0.01、α =10.0、β =1.0とした。更に、本手法及び従来手法において、モンテカルロ近似の精度を決定するサンプルの総数は、それぞれ一つの顔テンプレートあたりN=3600個に統一した。
<<実験結果>>
ここで、図5は、本手法と従来手法のリサンプルアルゴリズムによる比較結果の一例を示す図である。図5に示すように、本手法(Pruned Resampling)が従来手法(Residual Resampling)のリサンプルアルゴリズム(Resample algorithm)において、顔画像認識結果として出力される人物IDの不正解率は共に2.3%である。また、図5に示すように本手法では、同じ認識性能(ID Error Rate)を約半分の処理時間(従来手法:2329sec、本手法:1135sec)で実現することができる。
ここで、図6は、各モデルに属する粒子数のヒストグラムの推移の様子をグラフ化した一例を示す図である。なお、図6(a)は従来手法による粒子数のヒストグラムの推移をグラフ化した図を示し、図6(b)は本手法による粒子数のヒストグラムの推移をグラフ化した図を示している。
図6に示すグラフでは、入力されるフレーム(frame number1〜30)毎に粒子の再抽出を行っており、10人の被験者(Identitynumberoffacemodel:1〜10)における各々のモデルHに属する粒子の数(N:number of particles)が示されている。
図6(a)と図6(b)を比較すると、各々の時刻n(frame number)におけるヒストグラムの高さの比、すなわち、モデル間の粒子数の比率は略同じであるが、各時刻nにおけるヒストグラムの高さの合計が示す粒子の総数Ntotalは、本手法では時間の経過と共に指数関数的に減少する様子がわかる。
その一方、周辺尤度最大となるモデル(図6(b)のj=10のモデル)については、粒子の総数が略一定に保たれていることから、モンテカルロ近似の精度が最尤モデルについて一定の水準に保たれているとみなすことができる。
上述したように、逐次モンテカルロ法によるモデル比較の問題において、モデル周辺尤度に基づく粒子数の動的制御を行い、各時刻における最尤モデルに属する粒子の数が一定となるようにリサンプルの段階で粒子の総数を調整することで、モデル事後確率分布の推定への影響を最小限にしたまま、計算コストの効率的な削減を行うことができる。
これにより、発話時の連続顔画像を用いた顔画像認識における比較実験の結果、サンプルの総数を固定した従来の手法に比べて新たな顔認識誤りを生じることなく、処理時間を削減することができる。
なお、上述した実施形態では、顔画像認識部において、粒子の総数を調整しつつ粒子の再抽出を行っているが、本発明における粒子は、上述したようにパラメータのサンプルとサンプルの重みとの対に限定されることはなく、少なくともサンプルとそのサンプルの重みを含んでいればよく、その数や他の要素が含まれていてもよい。
上述したように本発明によれば、高速に高精度な顔画像認識を実現することができる。具体的には、顔画像の様々な変動要素に対応した顔画像認識を実現する装置において、特に顔のモデルに付随するパラメータの確率分布を逐次モンテカルロ方法を用いて逐次学習する際に、最も出現の可能性が高い顔モデルを安定して判定するために必要十分な粒子の総数を動的に決定し調整する。更に、ベイズ推定の枠組みにおけるモデル周辺尤度を利用して、最終的な興味の対象であるモデル事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする再抽出手法を用いることにより、高速に高精度な顔画像認識を実現することができる。
したがって、計算コストを左右する粒子の総数を動的に制御することによって、システム全体の処理時間を短縮することができる。また、粒子の総数を逐次制御(削減)することにより、一部の確率値が高いモデルに粒子が局在する状況を早期に把握することができる。すなわち、モデル事後確率分布が急峻である場合、十分に時間が経過した時点において、システム全体の計算コストを予め登録されるモデルの数によらず一定に抑えることが可能である。
以上本発明の好ましい実施の形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
顔画像認識装置の一構成例を示す図である。 登録画像の特徴点配置の具体例を示したものである。 本発明における顔画像認識処理が実現可能なハードウェア構成の一例を示す図である。 顔画像認識処理手順の一例を示すフローチャートである。 本手法と従来手法のリサンプルアルゴリズムによる比較結果の一例を示す図である。 各モデルに属する粒子数のヒストグラムの推移の様子をグラフ化した一例を示す図である。
符号の説明
1 顔画像認識装置
10 顔データ作成装置
11 顔画像登録部
12 顔変形データ抽出部
13 記録部
20 顔画像認識特定装置
21 顔画像検出部
22 顔画像認識部
30 特徴点
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 メモリ装置
46 CPU
47 ネットワーク接続装置
48 記録媒体

Claims (6)

  1. 予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる顔画像の人物を特定するための顔画像認識装置において、
    前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録部と、
    前記顔画像登録部により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出部と、
    前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識部とを有し、
    前記顔画像認識部は、予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行うことを特徴とする顔画像認識装置。
  2. 前記顔画像認識部は、
    前記逐次モンテカルロ法における粒子の再抽出において、前記顔テンプレートのモデル周辺尤度を利用して、事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする条件のもとで前記粒子の再抽出を行うことを特徴とする請求項1に記載の顔画像認識装置。
  3. 前記顔画像認識部は、
    前記入力画像が入力される毎時刻あるいは予め設定された時間間隔毎に粒子の再抽出を行うことを特徴とする請求項1又は2に記載の顔画像認識装置。
  4. 前記顔画像認識部は、
    同一人物を連続して撮影した入力画像の顔画像認識を行う際、前記入力画像毎に前記パラメータの確率分布を逐次学習することを特徴とする請求項1乃至3の何れか1項に記載の顔画像認識装置。
  5. 前記入力画像から顔の中心位置及び大きさを含む顔領域情報を検出する顔画像検出部を有し、
    前記顔画像認識部は、前記顔領域情報に基づいて顔画像認識を行うことを特徴とする請求項1乃至4の何れか1項に記載の顔画像認識装置。
  6. 予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる顔画像の人物を特定するための顔画像認識処理をコンピュータに実行させるための顔画像認識プログラムにおいて、
    前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録処理と、
    前記顔画像登録処理により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出処理と、
    前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識処理とを有し、
    前記顔画像認識処理時に予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行う再抽出処理をコンピュータに実行させるための顔画像認識プログラム。
JP2006221850A 2006-08-16 2006-08-16 顔画像認識装置及び顔画像認識プログラム Expired - Fee Related JP4928193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006221850A JP4928193B2 (ja) 2006-08-16 2006-08-16 顔画像認識装置及び顔画像認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006221850A JP4928193B2 (ja) 2006-08-16 2006-08-16 顔画像認識装置及び顔画像認識プログラム

Publications (2)

Publication Number Publication Date
JP2008046864A true JP2008046864A (ja) 2008-02-28
JP4928193B2 JP4928193B2 (ja) 2012-05-09

Family

ID=39180556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006221850A Expired - Fee Related JP4928193B2 (ja) 2006-08-16 2006-08-16 顔画像認識装置及び顔画像認識プログラム

Country Status (1)

Country Link
JP (1) JP4928193B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245207A (ja) * 2008-03-31 2009-10-22 Fujifilm Corp 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム
JP2013529334A (ja) * 2010-04-30 2013-07-18 ヴィユーコンプ インク 確率密度関数推定器
CN108280422A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于识别人脸的方法和装置
CN109766857A (zh) * 2019-01-16 2019-05-17 嘉兴学院 一种基于语义对齐多区域模板融合的三维人脸识别方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4949754B2 (ja) 2006-07-03 2012-06-13 日東工器株式会社 空気圧式マッサージ装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005044352A (ja) * 2003-07-10 2005-02-17 Advanced Telecommunication Research Institute International 推定装置、推定方法および推定プログラム
JP2005208850A (ja) * 2004-01-21 2005-08-04 Nippon Hoso Kyokai <Nhk> 顔画像認識装置及び顔画像認識プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005044352A (ja) * 2003-07-10 2005-02-17 Advanced Telecommunication Research Institute International 推定装置、推定方法および推定プログラム
JP2005208850A (ja) * 2004-01-21 2005-08-04 Nippon Hoso Kyokai <Nhk> 顔画像認識装置及び顔画像認識プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
松井淳 外2名: "逐次モンテカルロ法を用いたBayes的顔画像認識", 電子情報通信学会技術研究報告 VOL.105 NO.673, vol. 第105巻 第673号, JPN6011059775, 9 March 2006 (2006-03-09), JP, pages 119 - 124, ISSN: 0002070676 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009245207A (ja) * 2008-03-31 2009-10-22 Fujifilm Corp 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム
JP2013529334A (ja) * 2010-04-30 2013-07-18 ヴィユーコンプ インク 確率密度関数推定器
US9076197B2 (en) 2010-04-30 2015-07-07 Vucomp, Inc. Probability density function estimation
US9256941B2 (en) 2010-04-30 2016-02-09 Vucomp, Inc. Microcalcification detection and classification in radiographic images
CN108280422A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于识别人脸的方法和装置
CN108280422B (zh) * 2018-01-22 2022-06-14 百度在线网络技术(北京)有限公司 用于识别人脸的方法和装置
CN109766857A (zh) * 2019-01-16 2019-05-17 嘉兴学院 一种基于语义对齐多区域模板融合的三维人脸识别方法

Also Published As

Publication number Publication date
JP4928193B2 (ja) 2012-05-09

Similar Documents

Publication Publication Date Title
Boyko et al. Performance evaluation and comparison of software for face recognition, based on dlib and opencv library
Fuhl et al. Fully convolutional neural networks for raw eye tracking data segmentation, generation, and reconstruction
CN111160533B (zh) 一种基于跨分辨率知识蒸馏的神经网络加速方法
JP5552519B2 (ja) 顔特徴ベクトルの構築
JP2019028839A (ja) 分類器、分類器の学習方法、分類器における分類方法
JP2022141931A (ja) 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
JP2005327076A (ja) パラメタ推定方法、パラメタ推定装置および照合方法
JP4928193B2 (ja) 顔画像認識装置及び顔画像認識プログラム
Kallipolitis et al. Affective analysis of patients in homecare video-assisted telemedicine using computational intelligence
JP4348202B2 (ja) 顔画像認識装置及び顔画像認識プログラム
Mousas et al. Learning motion features for example-based finger motion estimation for virtual characters
JP2012118668A (ja) パターン分類装置の学習装置及びそのためのコンピュータプログラム
Oliveira et al. A comparison between end-to-end approaches and feature extraction based approaches for sign language recognition
JP2007249394A (ja) 顔画像認識装置及び顔画像認識プログラム
Kelly et al. Recognition of spatiotemporal gestures in sign language using gesture threshold hmms
JP7103235B2 (ja) パラメタ算出装置、パラメタ算出方法、及び、パラメタ算出プログラム
Zamzami et al. An accurate evaluation of msd log-likelihood and its application in human action recognition
JP2020135485A (ja) 拡張装置、拡張方法及び拡張プログラム
Salem et al. Facial features detection: a comparative study
CN106845386B (zh) 一种基于动态时间规整与多核学习的动作识别方法
Su et al. Learning low-dimensional temporal representations with latent alignments
Hammer et al. How to visualize large data sets?
Soviany et al. A multimodal biometric identification method for mobile applications security
JP2011013818A (ja) 顔特徴点抽出装置及び顔特徴点抽出プログラム
Gao et al. Chinese fingerspelling recognition via Hu moment invariant and RBF support vector machine

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081029

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4928193

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees