JP2009199417A - 顔追跡装置及び顔追跡方法 - Google Patents

顔追跡装置及び顔追跡方法 Download PDF

Info

Publication number
JP2009199417A
JP2009199417A JP2008041355A JP2008041355A JP2009199417A JP 2009199417 A JP2009199417 A JP 2009199417A JP 2008041355 A JP2008041355 A JP 2008041355A JP 2008041355 A JP2008041355 A JP 2008041355A JP 2009199417 A JP2009199417 A JP 2009199417A
Authority
JP
Japan
Prior art keywords
face
tracking
template
area
captured image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008041355A
Other languages
English (en)
Inventor
Atsushi Shimura
敦 志村
Junya Inada
純也 稲田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2008041355A priority Critical patent/JP2009199417A/ja
Publication of JP2009199417A publication Critical patent/JP2009199417A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】顔向きが正面以外であっても顔モデルが顔領域の追跡に失敗したことを簡易な方法で判定し、顔モデルの誤った更新を防止する。
【解決手段】運転者の正面を向いた顔の撮像画像を取得し(S101,S102)、その撮像画像から顔領域を抽出して(S103)、その顔領域の位置から顔の追跡を開始する(S104,S105)。そして、追跡の開始後に取得された撮像画像におけるテンプレート更新型顔モデル142が存在する領域を正面顔に変形した変形画像を生成し(S106)、生成した変形画像が顔であるか否かを判定することで追跡の成否を判定する(S107)。このように、変形画像が顔であるか否かを判定するだけで、追跡が成功しているか否かを容易に判定することができる。
【選択図】図10

Description

本発明は、人間の顔向きの変化をテンプレート更新型顔モデルを用いて追跡する顔追跡装置及び顔追跡方法に関するものである。
近年、人間の顔を撮像した撮像画像に基づいて顔の特徴点を追跡し、顔向き変化や特徴点位置の変化を検出する顔追跡方法が提案されている。そして、このような顔追跡方法に基づく処理を行う顔追跡装置を自動車に搭載することで、運転者の脇見判定や顔特徴点の位置変化から生理・心理状態を推定し、自動車の安全・利便・快適性を向上させるような運転支援システムが提案されている(例えば特許文献1参照)。
また、顔追跡方法としては、カメラで撮像した撮像画像から現在の追跡結果を計算の初期パラメータとして最適化問題を解くことで顔モデル(人間の顔部品テンプレート(目や口など)の集合をモデル化したもの)を動的に更新し、顔領域に顔モデルを収束させることで顔部品を追跡する技術がある(非特許文献1,2参照)。これらの技術(テンプレート更新型顔モデルを用いた技術)は、照明変化や顔部品の形状変化等に関してロバスト性が高く、従来のテンプレートマッチング法に比べて検出精度及び追跡精度が高いことが特徴である。
なお、様々な顔向きにおいても追跡の成否を判定するために、複数の顔部品テンプレートを辞書として格納しておき比較する技術も提案されている(特許文献2参照)。
特開2006−231963号公報 特開2003−346158号公報 I. Matthews and S. Baker, "Active Appearance Models Revisited", International Journal of Computer Vision, Vol. 60, No. 2, November 2004, pp. 135 - 164. J. Xiao, T. Moriyama, T. Kanade, and J. Cohn, "Robust Full-Motion Recovery of Head by Dynamic Templates and Re-registration Techniques", International Journal of Imaging Systems and Technology, Vol.13, September 2003, pp. 85 - 94.
しかしながら、テンプレート更新型顔モデルを用いた顔領域の追跡手法(非特許文献1,2)では、顔部品テンプレートを適切な状況で更新しなければ、誤った追跡をしてしまうという本質的な問題がある。また、これらの手法では、顔モデルと顔モデルの存在する撮像画像の領域との画素値誤差が最小及び類似度が最大になることを目的として最適化問題を反復計算で解くため、現在の追跡が成功しているか否かをアルゴリズム自体では判定することができない。すなわち、現在の顔モデルが顔以外の領域にある場合であっても更新が継続されてしまう。また、更新手法として最適化問題を反復計算で解くことから、追跡が失敗した場合には局所解に収束して追跡が終了してしまい、自動復帰できないという性質がある。
なお、特許文献2に記載のように、様々な顔向きにおいても追跡の成否を判定するために、複数の顔部品テンプレートを辞書として格納しておき比較する技術があるが、メモリ量が増大するとともに判定が複雑になるため効率的ではない。
本発明は、こうした問題にかんがみてなされたものであり、顔向きが正面以外であっても顔モデルが顔領域の追跡に失敗したことを簡易な方法で判定することができ、顔モデルの誤った更新を防止することのできる顔追跡装置及び顔追跡方法を提供することを目的としている。
上記目的を達成するためになされた本発明の請求項1に記載の顔追跡装置は、人間の顔向きの変化をテンプレート更新型顔モデルを用いて追跡するものである。
具体的には、この顔追跡装置において、撮像画像取得手段が、人間の顔を撮像した撮像画像を取得し、顔領域抽出手段が、撮像画像取得手段により取得された撮像画像から顔領域を抽出する。そして、顔追跡手段が、顔領域抽出手段により抽出された顔領域の位置から顔の追跡を開始する。さらに、判定手段が、顔追跡手段による追跡の開始後に取得された撮像画像におけるテンプレート更新型顔モデルが存在する領域を正面顔に変形した変形画像を生成し、生成した変形画像が顔であるか否かを判定することで顔追跡手段による追跡の成否を判定する。
このような顔追跡装置によれば、実際の顔向きが正面以外になっている場合であっても、顔であるか否かを常に正面顔を基準として判定することができる。
すなわち、テンプレート更新型顔モデルが正確に顔領域に追従している場合は、顔向きがどのように変化していても、変形画像は正面顔となる。一方、追跡に失敗した場合には、変形画像には顔が存在しないか、又は歪んだ顔が存在することになる。このため、変形画像が顔であるか否かを判定するだけで、追跡の確からしさを容易に調べることができる。例えば、変形画像における水平方向及び垂直方向のそれぞれについて輝度を累積加算し、水平方向及び垂直方向の各累積加算値の谷位置を観察する。この谷位置から目やまゆなどの顔部品があらかじめ定義した所定の位置に存在するか否かを容易に判定することができるため、顔部品が所定の位置にあるときは正面顔であると判定することができる。したがって、顔向きが正面以外であっても、テンプレート更新型顔モデルが顔領域の追跡に失敗したことを、複数の顔向きの異なる判定用テンプレートやアルゴリズムを用意することなく、簡易な方法で判定することができる。
ところで、変形画像が顔であるか否かの判定は、例えば請求項2に記載のように、登録されている正面顔テンプレートとの比較に基づき行うようにしてもよい。具体的には、例えば、複数の人間が正面を向いたときの画像を取得しておき、それら複数の正面顔画像の平均画像を正面顔テンプレートとしてあらかじめ生成しておく。このようにすれば、正面顔テンプレートをあらかじめ1つ用意しておくだけで、顔向きが変化した場合においてもテンプレートマッチングのような単純なアルゴリズムで顔追跡の確からしさを判定することができる。特に、正面顔テンプレートをあらかじめ用意しておく構成のため、変形画像が顔であるか否かを精度良く判定することができる。
ここで、正面顔テンプレートは、例えば請求項3に記載のように、テンプレート更新型顔モデルが有する正面顔テンプレートとしてもよい。このようにすれば、テンプレート更新型顔モデルの正面顔を判定用の正面顔テンプレートとして利用することができるため、判定用の正面顔テンプレートをあらかじめ用意しておく必要がないという利点がある。なお、一般に、テンプレート更新型顔モデルは、非特許文献1,2に記載されているように、追跡時の基準となる顔テンプレートとして、正面顔のテンプレートをモデルの内部に所持している場合が多い。例えば、非特許文献1に記載の手法では、顔モデルの平均顔として正面顔が存在し、これに主成分分析で獲得された特徴点変位、テンプレートアピアランスの変動成分が線形結合としてテンプレート更新型顔モデルが定義されている。
一方、例えば請求項4に記載のように、撮像画像から抽出した顔領域を正面顔テンプレートとして取得するようにしてもよい。具体的には、例えば、音声によるガイダンスなどで人間に正面を向くことを促し、正面を向いたときの撮像画像から顔領域をテンプレートとして取得するようにすればよい。このようにすれば、判定用の正面顔テンプレートをあらかじめ用意しておく必要がないという利点がある。しかも、判定用の正面顔テンプレートが追跡対象者自身の正面顔であることから、判定精度を高くすることができる。
また、請求項5に記載の顔追跡装置は、判定手段により判定された顔追跡手段による追跡の成否の判定結果を報知する報知手段を備える。このような顔追跡装置によれば、追跡の成否を判定した場合に、その判定結果を人間に知らせることができる。例えば、テンプレート更新型顔モデルが顔領域への追従に失敗した場合に、失敗したことを聴覚や視覚的効果によって伝達する。ここで、具体的な報知方法としては、例えば、音声やパイロットランプの点滅などが挙げられる。このようにすれば、追跡の成否を人間が確認できる。
次に、請求項6に記載の顔追跡方法は、人間の顔向きの変化をテンプレート更新型顔モデルを用いて追跡するためのものである。
そして、この顔追跡方法は、人間の顔を撮像した撮像画像を取得する撮像画像取得ステップと、撮像画像取得ステップで取得した撮像画像から顔領域を抽出する顔領域抽出ステップと、顔領域抽出ステップで抽出した顔領域の位置から顔の追跡を開始する顔追跡ステップと、顔追跡ステップによる追跡の開始後に取得した撮像画像におけるテンプレート更新型顔モデルが存在する領域を正面顔に変形した変形画像を生成し、生成した変形画像が顔であるか否かを判定することで顔の追跡の成否を判定する判定ステップとを備える。
このような顔追跡方法によれば、請求項1に記載の顔追跡装置と同様の効果を得ることができる。
以下、本発明が適用された実施形態について、図面を用いて説明する。
[第1実施形態]
図1は、第1実施形態の顔追跡装置の概略構成を示すブロック図である。
本実施形態の顔追跡装置は、車両に搭載されて用いられるものであり、制御部100と、カメラ200と、画像キャプチャボード300と、照明部400と、音声出力部(スピーカ)500とを備えている。
カメラ200は、運転者の顔を撮像するためのものであり、イメージセンサとして例えばCCD又はCMOSを備えるとともに、運転者の顔が明瞭に撮像できるような焦点距離のレンズが装着されている。
画像キャプチャボード300は、カメラ200で撮像した顔画像をキャプチャし、制御部100に提供する機能を持つ。
照明部400は、カメラ200からシャッター信号を受信し、ストロボ発光する。また、画像キャプチャボード300から取得した顔画像の輝度情報を制御部100から受け取り、照明の光量を調整する。なお、本実施形態の顔追跡装置は、顔画像を暗室下でも明瞭に撮像可能とするために照明部400を備えているが、照明部400を備えない構成とすることも可能である。
一方、制御部100は、コンピュータのようなプロセッサユニットを実装した処理装置であり、顔抽出部110と、顔追跡部120と、顔判定部130と、メモリ140と、状態認識部150とを備えている。
顔抽出部110は、画像キャプチャボード300から取得した顔画像において、顔領域を抽出する機能を有している。例えば、「Paul Viola and Michael Jones “Robust Real-time Object Detection”, SECOND INTERNATIONAL WORKSHOP ON STATISTICAL AND COMPUTATIONAL THEORIES OF VISION ?MODELING, LEARNING, COMPUTING, AND SAMPLING VANCOUVER, CANADA, JULY 13, 2001.」(以下「参考文献」という。)に記載のAdaBoosting手法により事前に学習された顔識別器141をメモリ140に登録しておき、この顔識別器141を呼び出すことで図2に示すように顔領域の画像空間上の位置と顔の大きさを取得することができる。また、このとき、メモリ140には事前学習によって生成されたテンプレート更新型顔モデル142もあらかじめ登録されている。
顔追跡部120は、このテンプレート更新型顔モデル142をメモリ140から呼び出し、顔の追跡を行う。
状態認識部150は、顔追跡部120で追跡された顔から、顔向きや目や口などの顔部品の特徴点位置を抽出し、これらの情報から、現在の運転者の状態を認識する。例えば、顔追跡部120で得られた顔向き変化情報を用い、あらかじめ設定した所定の範囲外に顔向きが変化したときに、脇見をしたと運転者の状態を判定する。また、このとき、制御部100からスピーカである音声出力部500に、脇見をしたことによる警報を出力するように指示する。また、追跡対象者に顔を正面に向けるように促す音声を音声出力部500に出力するように指示することもできる。
以下、顔追跡部120、テンプレート更新型顔モデル142及び顔判定部130について詳細に説明する。
前述したように、顔追跡部120は、テンプレート更新型顔モデル142をメモリ140から呼び出し、顔領域の追跡を行う。
ここで、テンプレート更新型顔モデル142は、正面顔を三角形状の複数のメッシュで表現した基本形状(base shape)s0(図3(a)参照)と、基本形状s0からの顔向きを示すn個(nは自然数)の形状ベクトル(shape vector)si(i=1,2,3,…,n)(図3(b),(c)参照)からなる形状モデルを持つ。これら基本形状s0及びn個の形状ベクトルsiを用いて式(1)により計算することで、人間の顔の形状sを表現する。なお、式(1)のpi(i=1,2,3,…)は、重ね合わせ係数である。
また、形状ベクトルsi(i=1,2,3,…)は、基本形状s0を構成するメッシュの頂点(以下「メッシュ頂点」ともいう。)を始点とするベクトルであり、基本形状s0の全頂点について形状ベクトルsiが設定されている。なお、図3(b),(c)では、n個の形状ベクトルs1〜snのうちの一部のみ(形状ベクトルs1,s2)を示している。
このような基本形状s0や形状ベクトルsiを生成するためには、顔向きの異なる複数の顔画像を学習セットとし、各画像における顔特徴点位置(メッシュ頂点の位置)を入力として、主成分分析を用いて導出する。基本形状s0は学習セットにおける顔特徴点位置の平均値となる。このとき、この基本形状s0が正面顔形状になるように学習セットを選択しておく。
また、テンプレート更新型顔モデル142は、前述の基本形状s0や形状ベクトルsiとともに、基本アピアランスA0(図3(d)参照)と、m個(mは自然数)のアピアランス変動Aj(j=1,2,3,…,m)(図3(e),(f)参照)から構成されるアピアランスモデルを持つ。アピアランスモデルは、これら基本アピアランスA0及びm個のアピアランス変動Ajを用いて式(2)により計算することで、人間の顔のアピアランスAを表現する。なお、式(2)のλj(j=1,2,3,…)は重ね合わせ係数である。
このアピアランスモデルを前述の形状モデルにテクスチャマッピングすることで人間の顔テンプレートを表現することができる。このとき、重ね合わせ係数pi及びλiを顔追跡部120で導出する。また、これら重ね合わせ係数に加え、平行移動量とスケール変化からなる相似変換パラメータも併せて顔追跡部120で導出される。重ね合わせ係数pi及びλiと相似変換パラメータは、前フレームで導出した重ね合わせ係数pi及びλiと相似変換パラメータからなる現在のテンプレート更新型顔モデル142のテンプレートと、そのテンプレート更新型顔モデル142が存在する画像キャプチャボード300から取得した撮像画像上のテンプレートの輝度誤差が最小になるように最急降下法による反復計算によって求められる。
このようにすることで、テンプレート更新型顔モデル142は顔領域に収束し、顔を追跡することができる(図4(a),(b)参照)。すなわち、現在の撮像画像における顔領域の追跡は、前フレームでの追跡結果の影響を受けるため、一度追跡が失敗すると追跡に復帰することはできない。また、追跡は2つのテンプレート間の輝度誤差が最小になるように求められるため、追跡失敗時にもテンプレート更新型顔モデル142の更新は行われる。
また、状態認識部150に受け渡す顔向き情報も顔追跡部120で導出される。テンプレート更新型顔モデル142には、図5で示すような3次元形状モデルが含まれる。これらは、前述の形状モデルを3次元に拡張したものである。顔追跡部120における顔追跡時に、顔特徴点の2次元座標上の位置が求まるため、これら顔特徴点の2次元座標上の位置と3次元モデルを2次元座標上に投影し、対応している各顔特徴点の位置誤差が小さくなるように3次元モデルを3次元空間の3軸で回転させる。この回転量が顔向きになる。
顔判定部130は、顔追跡部120から追跡結果である顔特徴点の2次元座標を受け取り、各特徴点で囲まれた画像を抽出し(図6(a),(b)参照)、抽出後の顔画像(図6(b))を正面顔に変形する(図6(c)参照)。このとき、図6(b)に示す顔画像の形状は式(1)の形状sに該当する。形状sの正面顔形状への変換は、基本形状s0になるように特徴点群で構成される三角形をアフィン変換することで作成することができる。なぜなら、基本形状s0は前述のとおり正面顔形状になるように学習されているからであり、アフィン変換後の形状s(図6(c))は正面顔形状となる。
また、顔判定部130は、この変形された変形画像(図6(c))が顔であるか否かを判定する。例えば、図7に示すように、画像の上半分における水平方向及び垂直方向のそれぞれについて輝度を累積加算し、水平方向及び垂直方向の各累積加算値の谷位置を観察する。この谷位置は目やまゆの位置に相当する。このため、画像が正面顔であれば、垂直方向累積輝度値及び水平方向累積輝度値のそれぞれにおいて、2つの大きな谷が存在する。これらの位置と累積輝度値を観察し、あらかじめ設定しておいた範囲と比較すれば、変形画像(図6(c))が正面顔であるか否かを容易に判定することができる。
ここで、追跡が成功した場合(図6)と対比するため、追跡が失敗した場合の例を図8及び図9に示す。このような場合、変形画像(図8(c)及び図9(c))はいずれも正面顔画像にならない。また、顔抽出部110で正面顔を抽出したときに用いた顔識別器(例えば、前述した参考文献に記載のAdaBoosting手法)を変形画像(図6(c)、図8(c)及び図9(c))に適用し、顔が発見できるか否かを調べてもよい。発見できない場合は、変形画像が正面顔ではないと判定する。
次に、顔追跡装置の制御部100が実行する具体的処理手順について、図10のフローチャートを用いて説明する。
制御部100は、まずS101で、ボイスガイダンスの処理を行う。具体的には、追跡対象者である運転者に対し、正面方向に顔を向けるように促す音声を音声出力部500から出力させる。
続いて、S102では、カメラ200により撮像された1つの撮像画像(正面顔画像)を取得する。
続いて、S103では、S102で取得した撮像画像から顔領域を抽出する処理(顔抽出部110の処理)を行う。
続いて、S104では、S103で抽出した顔領域の位置及び大きさ情報をテンプレート更新型顔モデル142の追跡開始の初期パラメータとして設定する。
続いて、S105では、顔領域の追跡を行う追従処理(顔追跡部120の処理)を行う。
続いて、S106では、追従領域の顔画像を正面顔に変形する処理(顔判定部130の処理)を行う。
続いて、S107では、S106で得られた変形画像が正面顔であるか否かを判定する。
そして、S107で、変形画像が正面顔でないと判定した場合(追跡が失敗したと判定した場合)には、S102へ戻り、再度顔領域の抽出処理を行い、追従の初期パラメータ(位置及び大きさ)を再設定して再度追跡を行う。このとき、S102へ戻るのではなくS104へ戻り、追従の初期パラメータ(位置及び大きさ)を再設定してもよい。
一方、S107で、変形画像が正面顔であると判定した場合には、S108へ移行し、運転者の顔向き角が、あらかじめ設定されている脇見判定用のしきい値以内であるか否かを判定する処理(状態認識部150の処理)を行う。
そして、S108で、顔向き角がしきい値以内でないと判定した場合(脇見をしていると判定した場合)には、S109へ移行し、音声出力部500から警報を出力させる。その後、S110へ移行する。
一方、S108で、顔向き角がしきい値以内であると判定した場合(脇見をしていないと判定した場合)には、そのままS110へ移行する。
S110では、図10に示す一連の処理を終了するか否かを判定する。具体的には、例えば、運転者により処理終了操作が行われたか否かを判定する。
そして、S110で、処理を終了しないと判定した場合には、S111へ移行し、顔画像を取得した後、S105へ戻る。
一方、S110で、処理を終了すると判定した場合には、そのまま処理を終了する。
以上説明したように、第1実施形態の顔追跡装置は、運転者の顔向きの変化をテンプレート更新型顔モデル142を用いて追跡するものであり、運転者の正面を向いた顔の撮像画像を取得し(S101,S102)、その撮像画像から顔領域を抽出して(S103)、その顔領域の位置から顔の追跡を開始する(S104,S105)。そして、追跡の開始後に取得された撮像画像におけるテンプレート更新型顔モデル142が存在する領域を正面顔に変形した変形画像を生成し(S106)、生成した変形画像が顔であるか否かを判定することで追跡の成否を判定する(S107)。
このため、第1実施形態の顔追跡装置によれば、変形画像が顔であるか否かを判定するだけで、追跡が成功しているか否かを容易に判定することができる。
なお、本実施形態の顔追跡装置では、S102の処理を実行する制御部100が、撮像画像取得手段に相当し、S103の処理を実行する制御部100が、顔領域抽出手段に相当し、S104,S105の処理を実行する制御部100が、顔追跡手段に相当し、S106,S107の処理を実行する制御部100が、判定手段に相当する。
[第2実施形態]
次に、請求項2に対応する第2実施形態の顔追跡装置について説明する。
図11に示すように、第2実施形態の顔追跡装置は、第1実施形態の顔追跡装置と対比すると、メモリ140に正面顔形状テンプレート143が付加されている点が異なる。その他、各部の機能及び動作内容は、正面顔形状テンプレート143及び顔判定部130を除いて第1実施形態と同様である。このため、正面顔形状テンプレート143及び顔判定部130について第1実施形態との相違点を中心に説明する。
正面顔形状テンプレート143は、図12に示すように、あらかじめ作成しておいた人間の正面顔の画像である。この正面顔形状テンプレート143は、複数の人間の正面顔画像を平均して生成されたものであり、テンプレート更新型顔モデル142における基本形状s0と同じ大きさになるように調整されている。すなわち、図12における水平方向の画素数Wと垂直方向の画素数Hは図7と同じである。なお、正面顔形状テンプレート143は追跡対象者自身の顔テンプレートでもよいし、第三者の正面顔テンプレートであってもよく、テンプレートが顔全体ではなくてもよい。
顔判定部130は、この正面顔形状テンプレート143をメモリ140から呼び出し、テンプレート更新型顔モデル142が抽出した顔領域を正面顔に変形した変形画像(図6(c))とテンプレートマッチングを行う。このテンプレートマッチングでは、正面顔形状テンプレート143と変形画像(図6(c))との正規化相関値を計算する(式(3)、式(4)参照)。なお、画素値間の平均二乗誤差(Root Mean Square Error)を計算してあらかじめ設定したしきい値から判定してもよい。
正規化相関値は−1〜1の値を取り、1に近いほどテンプレートと対象画像の相関が高いことを示す。この正規化相関値があらかじめ設定したしきい値(例えば0.8)以上になったときに変形画像(図6(c))が正面顔であったと判定し、追跡が正確に行われたと判定する。
式(3)は正規化相関値を計算する一般的な式である。本実施形態では、テンプレート更新型顔モデル142が抽出した顔領域を正面顔に変形した画像と正面顔形状テンプレート143の大きさはともに基本形状s0であり、水平方向の画素数Wと垂直方向の画素数Hは同じになるため、本実施形態では式(4)で示す計算式を用いる。
ここで、式(3)及び式(4)について解説する。
図13に一般的な正規化相関を用いたテンプレートマッチングの概要図を示す。ここでI(x,y)は探索画像である。(x,y)は水平方向及び垂直方向のそれぞれの画素位置を示す。また、T(i,j)はテンプレートを示す。探索画像のときと同様に(i,j)は水平方向及び垂直方向のそれぞれの画素位置を示す。
計算領域は大きさがテンプレートT(i,j)となる探索画像I(x,y)中の領域になる。走査領域は(x,y)の取り得る範囲を示す。すなわち、計算領域の左上の座標(x,y)を走査領域で走査し、T(i,j)との相関を計算することになる。式(3)の<I>は計算領域におけるI(x,y)の画素値の平均、<T>はテンプレートT(i,j)の画素値の平均である。
次に、本実施形態で用いる正規化相関値を用いたテンプレートマッチングの概要を図14に示す。前述のとおり、本実施形態ではテンプレートT(i,j)が探索画像I(x,y)と同じ大きさとなるため、計算領域は探索画像I(x,y)全体になり、走査領域は(0,0)の一点になる。
以上説明したように、第2実施形態の顔追跡装置では、変形画像が顔であるか否かの判定を、あらかじめ登録されている正面顔形状テンプレート143との比較に基づき行う。このため、正面顔形状テンプレート143をあらかじめ1つ用意しておくだけで、顔向きが変化した場合においてもテンプレートマッチングのような単純なアルゴリズムで顔追跡の確からしさを判定することができる。特に、正面顔形状テンプレート143をあらかじめ用意しておく構成のため、変形画像が顔であるか否かを精度良く判定することができる。
[第3実施形態]
次に、請求項3に対応する第3実施形態の顔追跡装置について説明する。
第3実施形態の顔追跡装置は、第2実施形態の顔追跡装置と対比すると、テンプレート更新型顔モデル142の持つ正面顔を正面顔形状テンプレート143とする点が異なる。この正面顔とは、形状が形状モデルの基本形状s0で、テンプレートがアピアランスモデルの基本アピアランスA0によって構成されるテンプレートである(図3(a),(d)参照)。このテンプレートと追跡によって得られた領域を正面顔形状に変換した変形画像(図6(c),図8(c),図9(c))とを前述の式(4)を使って正規化相関値から正面顔であるか否かを判定する。
このような第3実施形態の顔追跡装置によれば、テンプレート更新型顔モデル142が有する正面顔テンプレートを正面顔形状テンプレート143としているため、テンプレート更新型顔モデル142の正面顔を判定用の正面顔形状テンプレート143として利用することができる。このため、判定用の正面顔形状テンプレート143をあらかじめ用意しておく必要がないという利点がある。
[第4実施形態]
次に、請求項4に対応する第4実施形態の顔追跡装置について説明する。
第4実施形態の顔追跡装置は、第2実施形態の顔追跡装置と対比すると、撮像画像におけるテンプレート更新型顔モデル142が存在する領域を正面形状に変換した画像(図6(c),図8(c),図9(c)参照)を正面顔形状テンプレート143とする点が異なる。つまり、顔抽出部110によって得られた正面顔画像を探索画像I(x,y)とする。このときの正規化相関値を計算し、あるしきい値(例えば、0.8)以上になったときに、顔判定部130が追跡が成功したと判定する。
このような第4実施形態の顔追跡装置によれば、撮像画像から抽出した顔領域を正面顔形状テンプレート143として取得するようにしているため、判定用の正面顔形状テンプレート143をあらかじめ用意しておく必要がないという利点がある。しかも、判定用の正面顔形状テンプレート143が運転者自身の正面顔であることから、判定精度を高くすることができる。
[第5実施形態]
次に、請求項5に対応する第5実施形態の顔追跡装置について説明する。
第5実施形態の顔追跡装置の構成は、第1〜第4実施形態のいずれを基礎としてもよく(図1、図11参照)、顔判定部130の判定手法は第1〜第4実施形態に記載の手法をすべて取り得る。第5実施形態の顔追跡装置が第1〜第4実施形態の顔追跡装置と異なるのは、顔判定部130により追跡が失敗したと判定した場合に、顔判定部130から音声出力部500に音声信号を出力する点である。ここで、音声信号は、メッセージ等の音声を表すものであってもよく、単純なビープ音などであってもよい。また、図15に示すように、別途、パイロットランプ600を用意し、点灯と消灯によって運転者に伝達するようにしてもよい。
ここで、このような処理を実現するために顔追跡装置の制御部100が実行する具体的処理手順について、図16のフローチャートを用いて説明する。
図16の処理は、前述した図10の処理に代えて実行されるものであり、S112の処理が追加されている点のみが異なる。すなわち、S107で変形画像が正面顔でないと判定した場合(追跡が失敗したと判定した場合)に、S112へ移行し、追跡が失敗したことを運転者に知らせるための音声を音声出力部500から出力させた後、S102へ戻る。
このような第5実施形態の顔追跡装置によれば、追跡の成否を判定した場合に、その判定結果を運転者に知らせることができるため、追跡の成否を運転者が確認できる。また、運転者に追跡の失敗を音声又は視覚的効果により伝達できることから、追跡対象者以外の第三者が顔領域の位置や大きさなどの初期パラメータをマウス等の入力デバイスによって再設定することができるようになる。加えて、初期パラメータの再設定等の追跡復帰処理を運転者自身が適切なタイミングで行うといったことも可能となる。
なお、本実施形態の顔追跡装置では、S112の処理を実行する制御部100が、報知手段に相当する。
[他の形態]
以上、本発明の実施形態について説明したが、本発明は、上記実施形態に限定されることなく、種々の形態を採り得ることは言うまでもない。
例えば、上記実施形態では、車両に搭載されて用いられる顔追跡装置を例示したが、これに限定されるものではなく、本発明の顔追跡装置は車両以外でも利用することができる。
第1実施形態の顔追跡装置の概略構成を示すブロック図である。 顔抽出部によって抽出された顔の領域を示す図である。 形状モデル及びアピアランスモデルを示す図であり、(a)が基本形状を示す図、(b),(c)が形状ベクトルを示す図、(d)が基本アピアランスを示す図、(e),(f)がアピアランス変動を示す図である。 テンプレート更新型顔モデルが顔領域に収束して追従している様子を示す図であり、(a)が顔向きが正面での追従の様子を示す図、(b)が顔向きが正面以外での追従の様子を示す図である。 3次元形状モデルを示す図であり、(a)が基本形状を示す図、(b),(c)が形状ベクトルを示す図である。 正面顔への変形を示す図であり、(a)がテンプレート更新型顔モデルによる追跡結果を示す図、(b)がテンプレート更新型顔モデルが存在する領域の画像を示す図、(c)が(b)を正面顔形状に変形した変形画像を示す図である。 変形画像が正面顔であるか否かの判定手法を示す図である。 追跡が失敗したときの正面顔形状への変形事例1を示す図であり、(a)がテンプレート更新型顔モデルによる追跡結果を示す図、(b)がテンプレート更新型顔モデルが存在する領域の画像を示す図、(c)が(b)を正面顔形状に変形した変形画像を示す図である。 追跡が失敗したときの正面顔形状への変形事例2を示す図であり、(a)がテンプレート更新型顔モデルによる追跡結果を示す図、(b)がテンプレート更新型顔モデルが存在する領域の画像を示す図、(c)が(b)を正面顔形状に変形した変形画像を示す図である。 第1実施形態の顔追跡装置の制御部が実行する具体的処理手順を示すフローチャートである。 第2実施形態の顔追跡装置の概略構成を示すブロック図である。 複数人の正面顔の平均画像から生成した正面顔形状テンプレートを示す図である。 一般的な正規化相関値の計算を示す図である。 第2実施形態における正規化相関値の計算を示す図である。 第5実施形態の顔追跡装置の概略構成を示すブロック図である。 第5実施形態の顔追跡装置の制御部が実行する具体的処理手順を示すフローチャートである。
符号の説明
100…制御部、110…顔抽出部、120…顔追跡部、130…顔判定部、140…メモリ、141…顔識別器、142…テンプレート更新型顔モデル、143…正面顔形状テンプレート、150…状態認識部、200…カメラ、300…画像キャプチャボード、400…照明部、500…音声出力部、600…パイロットランプ

Claims (6)

  1. 人間の顔向きの変化をテンプレート更新型顔モデルを用いて追跡する顔追跡装置であって、
    人間の顔を撮像した撮像画像を取得する撮像画像取得手段と、
    前記撮像画像取得手段により取得された撮像画像から顔領域を抽出する顔領域抽出手段と、
    前記顔領域抽出手段により抽出された顔領域の位置から顔の追跡を開始する顔追跡手段と、
    前記顔追跡手段による追跡の開始後に取得された撮像画像における前記テンプレート更新型顔モデルが存在する領域を正面顔に変形した変形画像を生成し、生成した変形画像が顔であるか否かを判定することで前記顔追跡手段による追跡の成否を判定する判定手段と、
    を備えることを特徴とする顔追跡装置。
  2. 前記判定手段は、前記変形画像が顔であるか否かの判定を、登録されている正面顔テンプレートとの比較に基づき行うこと
    を特徴とする請求項1に記載の顔追跡装置。
  3. 前記正面顔テンプレートは、前記テンプレート更新型顔モデルが有する正面顔テンプレートであること
    を特徴とする請求項2に記載の顔追跡装置。
  4. 前記顔領域抽出手段は、前記撮像画像から抽出した顔領域を前記正面顔テンプレートとして取得すること
    を特徴とする請求項2に記載の顔追跡装置。
  5. 前記判定手段により判定された前記顔追跡手段による追跡の成否の判定結果を報知する報知手段を備えること
    を特徴とする請求項1から請求項4までのいずれか1項に記載の顔追跡装置。
  6. 人間の顔向きの変化をテンプレート更新型顔モデルを用いて追跡する顔追跡方法であって、
    人間の顔を撮像した撮像画像を取得する撮像画像取得ステップと、
    前記撮像画像取得ステップで取得した撮像画像から顔領域を抽出する顔領域抽出ステップと、
    前記顔領域抽出ステップで抽出した顔領域の位置から顔の追跡を開始する顔追跡ステップと、
    前記顔追跡ステップによる追跡の開始後に取得した撮像画像における前記テンプレート更新型顔モデルが存在する領域を正面顔に変形した変形画像を生成し、生成した変形画像が顔であるか否かを判定することで顔の追跡の成否を判定する判定ステップと、
    を備えることを特徴とする顔追跡方法。
JP2008041355A 2008-02-22 2008-02-22 顔追跡装置及び顔追跡方法 Pending JP2009199417A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008041355A JP2009199417A (ja) 2008-02-22 2008-02-22 顔追跡装置及び顔追跡方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008041355A JP2009199417A (ja) 2008-02-22 2008-02-22 顔追跡装置及び顔追跡方法

Publications (1)

Publication Number Publication Date
JP2009199417A true JP2009199417A (ja) 2009-09-03

Family

ID=41142834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008041355A Pending JP2009199417A (ja) 2008-02-22 2008-02-22 顔追跡装置及び顔追跡方法

Country Status (1)

Country Link
JP (1) JP2009199417A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011128966A (ja) * 2009-12-18 2011-06-30 Denso Corp 顔特徴点検出装置および眠気検出装置
CN102640185A (zh) * 2009-10-20 2012-08-15 全浸公司 图像序列中对象实时表示的混合跟踪的方法、计算机程序和设备
JP2016058085A (ja) * 2014-09-05 2016-04-21 株式会社リコー 対象の遮蔽を検出する方法と装置
JP2018005839A (ja) * 2016-07-08 2018-01-11 オムロン株式会社 画像処理装置および画像処理方法
JP2018530017A (ja) * 2015-07-30 2018-10-11 インテル・コーポレーション 感情拡張アバターアニメーション
WO2020175144A1 (ja) * 2019-02-25 2020-09-03 いすゞ自動車株式会社 制御装置及び撮影システム
WO2020255645A1 (ja) * 2019-06-20 2020-12-24 Necソリューションイノベータ株式会社 3次元データ更新装置、顔向き推定装置、3次元データ更新方法およびコンピュータ読み取り可能な記録媒体
KR20210038482A (ko) * 2020-04-17 2021-04-07 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 얼굴 융합 모델 트레이닝 방법, 장치 및 전자 기기
JP2021524957A (ja) * 2018-07-23 2021-09-16 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 画像処理方法およびその、装置、端末並びにコンピュータプログラム
US11295502B2 (en) 2014-12-23 2022-04-05 Intel Corporation Augmented facial animation
US11303850B2 (en) 2012-04-09 2022-04-12 Intel Corporation Communication using interactive avatars
US11887231B2 (en) 2015-12-18 2024-01-30 Tahoe Research, Ltd. Avatar animation system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094491A (ja) * 2002-08-30 2004-03-25 Nec Corp 顔向き推定装置および顔向き推定方法ならびに顔向き推定プログラム
JP2004234367A (ja) * 2003-01-30 2004-08-19 Fujitsu Ltd 顔の向き検出装置、顔の向き検出方法及びコンピュータプログラム
JP2005115544A (ja) * 2003-10-06 2005-04-28 Fuji Xerox Co Ltd 動作識別装置、及び対象物の姿勢識別装置
WO2006090449A1 (ja) * 2005-02-23 2006-08-31 Fujitsu Limited 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム
JP2006228061A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 顔追跡プログラムおよび顔追跡方法
JP2006227739A (ja) * 2005-02-15 2006-08-31 Toyota Motor Corp 画像処理装置及び画像処理方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094491A (ja) * 2002-08-30 2004-03-25 Nec Corp 顔向き推定装置および顔向き推定方法ならびに顔向き推定プログラム
JP2004234367A (ja) * 2003-01-30 2004-08-19 Fujitsu Ltd 顔の向き検出装置、顔の向き検出方法及びコンピュータプログラム
JP2005115544A (ja) * 2003-10-06 2005-04-28 Fuji Xerox Co Ltd 動作識別装置、及び対象物の姿勢識別装置
JP2006227739A (ja) * 2005-02-15 2006-08-31 Toyota Motor Corp 画像処理装置及び画像処理方法
JP2006228061A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 顔追跡プログラムおよび顔追跡方法
WO2006090449A1 (ja) * 2005-02-23 2006-08-31 Fujitsu Limited 画像処理方法、画像処理装置、画像処理システム及びコンピュータプログラム

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102640185A (zh) * 2009-10-20 2012-08-15 全浸公司 图像序列中对象实时表示的混合跟踪的方法、计算机程序和设备
JP2013508844A (ja) * 2009-10-20 2013-03-07 トタル・イメルジヨン 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置
JP2011128966A (ja) * 2009-12-18 2011-06-30 Denso Corp 顔特徴点検出装置および眠気検出装置
US11595617B2 (en) 2012-04-09 2023-02-28 Intel Corporation Communication using interactive avatars
US11303850B2 (en) 2012-04-09 2022-04-12 Intel Corporation Communication using interactive avatars
JP2016058085A (ja) * 2014-09-05 2016-04-21 株式会社リコー 対象の遮蔽を検出する方法と装置
US11295502B2 (en) 2014-12-23 2022-04-05 Intel Corporation Augmented facial animation
JP2018530017A (ja) * 2015-07-30 2018-10-11 インテル・コーポレーション 感情拡張アバターアニメーション
US10776980B2 (en) 2015-07-30 2020-09-15 Intel Corporation Emotion augmented avatar animation
US11887231B2 (en) 2015-12-18 2024-01-30 Tahoe Research, Ltd. Avatar animation system
US10497133B2 (en) 2016-07-08 2019-12-03 Omron Corporation Object tracking apparatus and object tracking method
WO2018008184A1 (ja) * 2016-07-08 2018-01-11 オムロン株式会社 画像処理装置および画像処理方法
JP2018005839A (ja) * 2016-07-08 2018-01-11 オムロン株式会社 画像処理装置および画像処理方法
JP2021524957A (ja) * 2018-07-23 2021-09-16 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 画像処理方法およびその、装置、端末並びにコンピュータプログラム
JP7058760B2 (ja) 2018-07-23 2022-04-22 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 画像処理方法およびその、装置、端末並びにコンピュータプログラム
US11631275B2 (en) 2018-07-23 2023-04-18 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, terminal, and computer-readable storage medium
CN113491101A (zh) * 2019-02-25 2021-10-08 五十铃自动车株式会社 控制装置及拍摄系统
US20220182518A1 (en) * 2019-02-25 2022-06-09 Isuzu Motors Limited Control device and photographing system
WO2020175144A1 (ja) * 2019-02-25 2020-09-03 いすゞ自動車株式会社 制御装置及び撮影システム
US11956525B2 (en) 2019-02-25 2024-04-09 Isuzu Motors Limited Control device and photographing system
JPWO2020255645A1 (ja) * 2019-06-20 2021-11-25 Necソリューションイノベータ株式会社 3次元データ更新装置、顔向き推定装置、3次元データ更新方法およびプログラム
WO2020255645A1 (ja) * 2019-06-20 2020-12-24 Necソリューションイノベータ株式会社 3次元データ更新装置、顔向き推定装置、3次元データ更新方法およびコンピュータ読み取り可能な記録媒体
JP7276968B2 (ja) 2019-06-20 2023-05-18 Necソリューションイノベータ株式会社 3次元データ更新装置、顔向き推定装置、3次元データ更新方法およびプログラム
KR20210038482A (ko) * 2020-04-17 2021-04-07 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 얼굴 융합 모델 트레이닝 방법, 장치 및 전자 기기
KR102410328B1 (ko) 2020-04-17 2022-06-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 얼굴 융합 모델 트레이닝 방법, 장치 및 전자 기기

Similar Documents

Publication Publication Date Title
JP2009199417A (ja) 顔追跡装置及び顔追跡方法
JP4865517B2 (ja) 頭部の位置・姿勢検出装置
JP4469275B2 (ja) ポーズ角度を推定するためのシステムおよび方法
JP5873442B2 (ja) 物体検出装置および物体検出方法
JP5001930B2 (ja) 動作認識装置及び方法
JP4951498B2 (ja) 顔画像認識装置、顔画像認識方法、顔画像認識プログラムおよびそのプログラムを記録した記録媒体
JP2007310707A (ja) 姿勢推定装置及びその方法
WO2014199786A1 (ja) 撮影システム
JP2019185557A (ja) 画像解析装置、方法およびプログラム
CN112911393B (zh) 部位识别方法、装置、终端及存储介质
JP5087037B2 (ja) 画像処理装置、方法及びプログラム
JP4860289B2 (ja) ロボット装置
JP2003150942A (ja) 目位置追跡方法
JPWO2009004916A1 (ja) なりすまし検知システム、なりすまし検知方法およびなりすまし検知用プログラム
KR20190119212A (ko) 인공신경망을 이용한 가상 피팅 시스템, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
JP3823760B2 (ja) ロボット装置
CN109986553B (zh) 一种主动交互的机器人、系统、方法及存储装置
JP2019185556A (ja) 画像解析装置、方法およびプログラム
JP2015011404A (ja) 動作認識処理装置
JP2006215743A (ja) 画像処理装置及び画像処理方法
JP2019012497A (ja) 部位認識方法、装置、プログラム、及び撮像制御システム
JP2010056720A (ja) ネットワークカメラおよびネットワークカメラシステム
KR102039164B1 (ko) 다중 구조 인공신경망을 이용한 가상 피팅을 수행하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
JP2022095994A (ja) 画像処理システム、画像処理プログラム、および画像処理方法
JP2008152717A (ja) 転倒状況検知装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100427

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120214