JP7354693B2

JP7354693B2 - 顔向き推定装置及び方法

Info

Publication number: JP7354693B2
Application number: JP2019156979A
Authority: JP
Inventors: 知禎相澤
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2019-08-29
Filing date: 2019-08-29
Publication date: 2023-10-03
Anticipated expiration: 2039-08-29
Also published as: JP2021033938A

Description

本開示は、画像データ中の人の顔に関して、安定して精度よく顔向きを推定する顔向き推定装置、及び方法に関する。

画像データの中から人の顔を検出し、更に検出した顔についてその顔の向きを推定する様々な技術が知られている。例えば、特許文献１は、人の顔における複数の特徴点に対応する複数の３次元位置を定める３次元顔モデルを、画像中の顔にフィッティングすることにより、画像中の顔の向きを推定する、３次元顔モデルフィッティングアルゴリズム、及び、同アルゴリズムを利用する検出装置を、開示している。

しかしながら、斜め方向を向く顔の向きを、上述のような従来の３次元顔モデルフィッティングアルゴリズムにより検出しようとすると、推定の精度が安定しないことがある。横顔に近い斜め方向を向く顔、即ち、正面からのヨー角が大きい顔である場合であって、特に、眼鏡等の装飾品が掛けられている顔である場合においては、顔の奥側の顔特徴点が見え辛い（即ち、画像上にて明確ではない）ため、３次元顔モデルがフィットし辛く、結果として局所解に陥ってしまい、このことが顔向き推定精度に影響を及ぼす可能性があるからである。

特許文献２に開示される顔特徴点検出装置は、あらかじめ顔特徴点の位置関係のルールを定めておくことによって、不自然な形状の変形３次元顔モデルでフィッティング処理をして局所解に陥り精度の低い顔特徴点検出結果となってしまうことを、抑制している。しかしながら、当該顔特徴点検出装置は、横顔等の正面からのヨー角が大きい場合、特に眼鏡等の装飾品を掛けている場合においては、自然な顔特徴点モデルによるフィッティング処理をしている際に、局所解に陥ることが考えられる。その結果として、顔特徴点検出において、精度の低い顔特徴点検出、即ち、精度の低い顔向き角度推定となってしまうおそれがある。

また、特許文献３に開示される特徴点位置検出装置は、目、鼻、口等の主要な少数の顔特徴点位置の初期情報を外部から入力することによって、より多くの所望の顔特徴点の概略の位置を推定する。当該特徴点位置検出装置は、入力される位置から顔特徴点探索を開始するので、正解とは異なる姿勢や表情などの顔形状を、誤ってフィッティングする、すなわち、局所解に陥ることが、抑制される。しかしながら、当該特徴点位置検出装置においては、予め少数の顔特徴点が外部から入力されなければならず、よって、当該特徴点位置検出装置は高速且つリアルタイムの処理には不向きである。

特開２００７－２４９２８０号公報特開２０１１－１２８９６６号公報特許第６３８７８３１号公報

本開示は、画像データ中の人の顔に関して、安定して精度良く顔向きを推定するアルゴリズム、及び同アルゴリズムを利用する顔向き推定装置及び方法を提供する。

本開示の顔向き推定装置は、
画像データから人の顔画像データを検出する顔検出部と、及び、検出された人の顔画像データに関して顔の向きの角度を推定する顔向き推定部とを備える顔向き推定装置である。前記顔向き推定部は、３次元顔モデル初期設定部と、３次元顔モデル移動（ずらし）部と、３次元顔モデル詳細フィッティング部と、３次元顔モデルフィッティングスコア算出部と、及び、３次元顔モデル統合部とを含み、
前記３次元顔モデル初期設定部は、顔画像データ上に３次元顔モデルを設定するものであり、
更に、
（１）前記３次元顔モデル移動（ずらし）部は、所与の３次元顔モデルの位置をずらし量だけ一又は複数回ずらし、詳細フィッティングのための複数の３次元顔モデルを生成し、
（２）前記３次元顔モデル詳細フィッティング部は、顔画像データに対して位置をずらすことにより生成された複数の詳細フィッティングのための三次元顔モデルを詳細フィッティングする処理を行い、
（３）前記３次元顔モデルフィッティングスコア算出部は、前記３次元顔モデル詳細フィッティング部による詳細フィッティング処理の直後の、３次元顔モデルのフィッティングスコアを算出し、
（４）前記３次元顔モデル統合部は、複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出する
ものであり、
前記顔向き推定部は、上記（１）～（４）の処理を繰り返し実行し、顔の向きの角度を出力する。

本開示に係る顔向き推定装置及び方法は、画像データ中の人の顔に関して、安定して精度良く顔向きを推定することができる。

実施の形態１に係る顔向き推定装置の機能構成を示すブロック図である。本開示に係る顔向き推定装置の適用例を説明するための図である。実施の形態１に係る顔向き推定装置の全体動作を示すフローチャートである。実施の形態１に係る顔向き推定装置における、顔向き推定部の顔向き推定処理を示すフローチャートである。実施の形態１に係る顔向き推定装置における、３次元顔モデル統合部の、Ｍ個の３次元顔モデルフィッティング結果の統合処理を示すフローチャートである。図５ａに示すフローチャートでは、開始後、変数を初期化し、Ｍ個のフィッティング結果についてフィッティングスコアＳｍで重み付けして、積算する（足し込む）。実施の形態１に係る顔向き推定装置における、３次元顔モデル統合部の、Ｍ個の３次元顔モデルフィッティング結果の統合処理を示すフローチャートである。図５ｂに示すフローチャートでは、正規化により統合値を算出して顔向きの角度を算出し、終了する。図６（ａ－１）（ａ－２）は、ヨー（Ｙａｗ）角が約－４０°である顔画像に対して、２種類の、点（ノード）のみにより構成される３次元顔モデルを、合わせた様子を示す図である。図６（ｂ－１）～（ｂ－７）は、ヨー角を変化させたときの３次元顔モデルの形状の様子を示す図である。本開示に係る顔向き推定アルゴリズムの概要を説明する図である。

以下、適宜図面を参照しながら、本発明に係る実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

なお、発明者らは、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。

［本開示に至る経緯］
画像データから人の顔を検出し、更に検出した顔についてその顔の向きを推定する技術は、これまで様々に開発されている。特許文献１は、人の顔における複数の特徴点に対応する複数の３次元位置を定める３次元顔モデルを、画像中の顔にフィッティングすることにより、画像中の顔の向きを推定する、３次元顔モデルフィッティングアルゴリズム、及び、同アルゴリズムを利用する検出装置を、開示している。

しかしながら、斜め方向を向く顔の向きを、従来の３次元顔モデルフィッティングアルゴリズムにより検出しようとすると、推定の精度が安定しない。正面からのヨー角が大きい、横顔に近い場合、特に、眼鏡等の装飾品が掛けられている場合においては、顔の奥側の顔特徴点が画像上にて明確ではないため、３次元顔モデルがフィットし辛く、結果として局所解に陥ってしまうことがあるからである。

図６（ｂ－１）～（ｂ－７）は、ヨー（Ｙａｗ）角を変化させたときの３次元顔モデルの形状の様子を示す図である。正面を向くモデルが、ヨー角が０°である（図６（ｂ－７））。図６（ｂ－６）から図６（ｂ－１）に移るにつれて、３次元顔モデルは右方向を深く向き、ヨー角が「約－１０°」から「約－６０°」に移行している。

図６（ａ－１）（ａ－２）は、ヨー角が約－４０°である顔画像に対して、２種類の、点（ノード）のみにより構成される３次元顔モデルを、合わせた様子を示す図である。図６（ａ－２）では、ヨー角が約－４０°である３次元顔モデルが合わせられ、図６（ａ－１）では、ヨー角が約－５０°である３次元顔モデルが合わせられている。
図６（ａ－１）に示されるように、ヨー角約－４０°の顔画像に対して、ヨー角約－５０°であると誤推定が生じる可能性がある。これは以下のような要因によるものである。
（要因１）ヨー角約－５０°の３次元顔モデルに対しても、ヨー角約－４０°の顔画像における多くの顔特徴点がフィットすること。
（要因２）顔の奥側（ここでは右側）の顔特徴点が明確でない（即ち、見辛い）ことから、ヨー角約－４０°の３次元顔モデルもヨー角約－５０°の３次元顔モデルも、いずれに対しても、顔の奥側の顔特徴点がフィットし難いこと。
つまり、３次元顔モデルフィッティングが結果として、局所解に陥り、誤推定を生じ、顔向き推定精度に影響を及ぼす。

本開示は、このような問題点を解決するために、発明者により考案された技術である。図７は、本開示に係る顔向き推定アルゴリズムの概要を説明する図である。まず、顔画像に対して、初期の位置に３次元顔モデルを配置して（図７（ａ））、凡その位置に３次元顔モデルをフィッティングする。即ち、顔画像に対して、ラフフィッティングを行う（図７（ｂ））。なおラフフィッティングは行われなくてもよい。次に、３次元顔モデルの位置を左右又は上下等にずらし、複数方向から、詳細フィッティングを行う（図７（ｃ－１）、図７（ｃ－２））。ここでのずらし量は、例えば、口幅の約半分である。更に、複数方向からのフィッティングの結果を統合する。この統合の際には、詳細フィッティング直後に算出されるフィッティングスコアが所定の閾値（即ち、所定の第３閾値）以上となる結果について、フィッティングスコアで重み付けして統合する。

ラフフィッティング処理を含み得る初期配置処理を経た、又は統合処理を経た、３次元顔モデルの位置を、左右又は上下等にずらし、複数方向から、詳細フィッティングを行うことと、複数方向からのフィッティングの結果を統合することは、例えば、以下の条件をいずれも満たすまで繰り返す（イタレーションする）。
（条件１）統合されたフィッティングスコアが所定の第１閾値より大きい。
（条件２）顔向きの角度の変動量が所定の第２閾値より小さい。
但し、処理を終了する（打ち切る）ためのイタレーション回数の上限を設けることがある。

以上を経て、３次元顔モデルフィッティングの最終結果を得る（図７（ｄ））。このようして得られる最終結果は、安定して精度良く顔向きを推定するものである。

［本開示で利用する３次元顔モデルフィッティング］
本開示で利用する３次元顔モデルフィッティングのアルゴリズムについて説明する。３次元顔モデルフィッティングのアルゴリズムは、様々存在する。特許文献１に開示される３次元顔モデルフィッティングのアルゴリズムは、リアルタイム性及び高精度が求められる車載モニタリングセンサの技術分野で用いられる、一つの例である。本開示で利用する３次元顔モデルフィッティングのアルゴリズムは、特許文献１に開示される３次元顔モデルフィッティングのアルゴリズムであってもよいし、別の３次元顔モデルフィッティングのアルゴリズムであってもよい。

本開示で利用する３次元顔モデルフィッティングのアルゴリズムは、概略以下のようなものである。学習画像を用いて、モデルの各ノードが顔特徴点の正しい位置に配置された正解モデルと、いずれかのノードが誤った位置に配置された誤差モデルとの差、及び誤差モデルに基づいて取得されたノード特徴量、についての相関関係の情報を、予め取得しておく。入力画像から顔特徴点を検出する際には、複数のノードの３次元位置を定めた３次元モデルを作成し、各ノードを入力画像上に投影し、投影点からノード特徴量を取得し、このノード特徴量と学習した相関関係の情報に基づいて、現在の各ノードの位置と対応する特徴点の位置とのずれを示す誤差推定量を取得する。更に、この誤差推定量と現在の各ノードの位置に基づいて、入力画像における各顔特徴点の３次元位置を推定し、それに合わせて各ノードを動かす。

なお、本開示で利用する「ラフフィッティング」では、相関関係を取得するための学習段階で用いる学習画像において、正解モデルと誤差モデルの差が比較的大きいものが用いられ、これにより相関関係が形成される。一方、本開示で利用する「詳細フィッティング」では、相関関係を取得するための学習段階で用いる学習画像において、正解モデルと誤差モデルの差が比較的小さいものが用いられ、これにより相関関係が形成される。

本開示で利用する３次元顔モデルフィッティングのアルゴリズムは、上記以外のものであってもよい。

［適用例］
本開示に係る顔向き推定装置が適用可能な一例について、図２を用いて説明する。図２は、本開示に係る顔向き推定装置１４の適用例を説明するための図である。

図２は、いずれも自動車に搭載される、車両制御部４と、及びドライバモニタリングセンサ１２との、内部構成を示すブロック図である。車両制御部４は、ＥＣＵ（electronic control unit：電子制御ユニット）６と、アクチュエータ８を含む。ＥＣＵ６は、複数のものであってもよいし、アクチュエータ８も複数のものであってもよい。

ドライバモニタリングセンサ１２は、運転者の表情を中心にリアルタイムでモニタリングを行う装置であり、撮像装置であるカメラ１６と、及び、顔向き推定装置である画像処理部１４とを、含む。顔向き推定装置である画像処理部１４は、ハードウェアプロセッサに相当するＣＰＵ１８と、メモリに相当するＲＯＭ（Read Only Memory）２０と、メモリに相当するＲＡＭ（Random Access Memory）２２とを有する。これら各構成は、適宜のバスを介して相互にデータ送受信可能に接続される。
更に、ドライバモニタリングセンサ１２のＣＰＵ１８と、車両制御部４のＥＣＵ６とは、ＣＡＮ（Control Area Network）１０を介して接続する。

ＣＰＵ１８は、ＲＯＭ２０又はＲＡＭ２２に記憶されたプログラムの実行に関する制御やデータの演算、加工を行う。ＣＰＵ１８は、様々なプログラム（例えば、３次元顔モデルフィッティングアルゴリズムのためのプログラム）を実行する演算装置である。ＣＰＵ１８は、カメラ１６や、車両制御部４のＥＣＵ６から種々の入力データを受け取り、入力データの演算結果を、ＣＡＮ１０を介して車両制御部４のＥＣＵ６に出力したり、ＲＯＭ２０やＲＡＭ２２に格納したりする。

ＲＯＭ２０は、データの読み出しのみが可能な記憶部であり、例えば半導体記憶素子で構成される。ＲＯＭ２０は、例えばＣＰＵ１８が実行するアプリケーションのプログラムやデータ等を記憶する。

ＲＡＭ２２は、データの書き換えが可能な記憶部であり、例えば半導体記憶素子で構成される。ＲＡＭ２２は、カメラ１６からの入力画像等を記憶する。

以上のような、車両制御部４及びドライバモニタリングセンサ１２において、顔向き推定装置は、画像処理部１４により実現される。

［構成例］
以下、顔向き推定装置１４の構成例としての実施の形態を説明する。

１.実施の形態１
１．１．構成
実施の形態１に係る顔向き推定装置１４の構成について、図１を用いて説明する。図１は、本実施の形態に係る顔向き推定装置１４の機能構成を示すブロック図である。

顔向き推定装置１４は、顔検出部２３、顔向き推定部２４、目開閉検出部３８、及び、視線推定部４０により、構成される。顔検出部２３は、カメラ１６等により撮像される画像データから人の顔画像データを検出する。顔向き推定部２４は、検出された人の顔画像データに関して顔の向き（角度）を推定する。目開閉検出部３８は、検出された人の顔画像データ及び推定された顔の向きのデータに基づいて、目の開閉を検出する。視線推定部４０は、検出された人の顔画像データ、推定された顔の向きのデータ、及び検出された目の開閉のデータに基づいて、視線の方向を推定する。なお、顔向き推定装置１４は、目開閉検出部３８と視線推定部４０を備えなくてもよい。

更に、顔向き推定部２４は、３次元顔モデル初期設定部２６、３次元顔モデル移動（ずらし）部３０、３次元顔モデル詳細フィッティング部３２、３次元顔モデルフィッティングスコア算出部３４、及び、３次元顔モデル統合部３６を、含む。更に３次元顔モデル初期設定部２６は、３次元顔モデルラフフィッティング部２８を含む。なお、３次元顔モデル初期設定部２６は、３次元顔モデルラフフィッティング部２８を含まないこともある。

３次元顔モデル初期設定部２６は、顔画像データに対して、初期の位置に３次元顔モデルを配置する。このとき、３次元顔モデル初期設定部２６は、先ず配置した３次元顔モデルに基づいて、３次元顔モデルラフフィッティング部２８により、顔画像データに対して、凡その位置に３次元顔モデルをフィッティングする、ラフフィッティングを行い、ラフフィッティング後の３次元顔モデルを初期配置の３次元顔モデルとする。なお、３次元顔モデルラフフィッティング部２８によるラフフィッティングは行われないこともある。

３次元顔モデル移動（ずらし）部３０は、複数方向からのフィッティングのために３次元顔モデルの位置を左右又は上下等にずらし量だけ一又は複数回ずらす。ここでのずらし量は、例えば、口幅の約半分である。これは、以下の理由による。
（理由１）複数方向のフィッティング処理で、各々、各顔器官点の各両端の特徴(例えば、左からのフィッティングでは左側の特徴)が少なくともフィッティングされるようにするため。
（理由２）「口幅」は最大長さの器官点であり基準とされるべきものであるため。
なお、ずらし量は別の値であってもよい。
ずらすことにより詳細フィッティングのための３次元顔モデルが、例えば、Ｍ個（Ｍ≧１）生成される。

３次元顔モデル詳細フィッティング部３２は、Ｍ個のうちの一つ（ｍ番目（１≦ｍ≦Ｍ））の３次元顔モデルに基づいて、詳細フィッティングを行う。
３次元顔モデルフィッティングスコア算出部３４は、３次元顔モデル詳細フィッティング部３２による詳細フィッティングの直後の、３次元顔モデルのフィッティングスコアを算出する。
更に、３次元顔モデル統合部３６は、複数方向からの詳細フィッティングの結果を統合して、顔向きの角度を算出する。

１．２．動作
以上のように構成される顔向き推定装置１４の動作について、以下説明する。

１．２．１．全体動作
図３は、実施の形態１に係る顔向き推定装置１４の全体動作を示すフローチャートである。顔向き推定装置１４の動作開始（ステップＳ０２）後、「ｔ」の初期化処理を行う（ステップＳ０４）。

次に、ｔフレーム目の画像データに関して、顔検出部２３が顔画像データ検出処理を行う（ステップＳ０６）。顔検出ができれば（ステップＳ０８・ＹＥＳ）、顔向き推定部２４が顔向きを推定して（ステップＳ１０）、「ｔ」をインクリメントする（ステップＳ１２）。顔検出ができなければ（ステップＳ０８・ＮＯ）、そのまま「ｔ」をインクリメントする（ステップＳ１２）。

「ｔ」が終了値でなければ（ステップＳ１４・ＮＯ）、次のフレームに関して顔検出処理から顔向き推定処理が行われる（ステップＳ０６～）。

「ｔ」が終了値となれば（ステップＳ１４・ＹＥＳ）、顔向き推定装置１４の動作を終了する（ステップＳ１６）。

１．２．２．顔向き推定処理
図４は、実施の形態１に係る顔向き推定装置１４における、顔向き推定部２４の顔向き推定処理（図３・ステップＳ１０）の内容を示すフローチャートである。

顔向き推定処理開始（ステップＳ２０）後、３次元顔モデル初期設定部２６が、顔画像データ上に３次元顔モデルを初期配置（初期設定）する（ステップＳ２２）。このとき、３次元顔モデル初期設定部２６は、先ず配置した３次元顔モデルに基づいて、３次元顔モデルラフフィッティング部２８により、顔画像データに対してラフフィッティングを行い、ラフフィッティング後の３次元顔モデルを初期配置の３次元顔モデルとすることがある。なお、３次元顔モデルラフフィッティング部２８によるラフフィッティングは行われなくてもよい。また、３次元顔モデルラフフィッティング部２８を備えない３次元顔モデル初期設定部２６では、ラフフィッティングは行われない。「ラフフィッティング」については、上述の［本開示で利用する３次元顔モデルフィッティング］において説明している。

次に、イタレーション回数を初期化（ｉ＝１）する（ステップＳ２６）。続いて、３次元顔モデル移動（ずらし）部３０が、３次元顔モデルの位置を左右又は上下等に一又は複数回ずらす（ステップＳ２８）。ずらし量は、上述のように、例えば口幅の約半分である。なお、ずらすことにより詳細フィッティングのための３次元顔モデルがＭ個（Ｍ≧１）生成される。

イタレーション回数（ｉ）が“１”であるとき、３次元顔モデルの位置ずらし処理（ステップＳ２８）の基になる３次元顔モデルは、初期配置処理（ステップＳ２２）を経たものである。イタレーション回数（ｉ）が複数であるときは、３次元顔モデルの位置ずらし処理（ステップＳ２８）の基になる３次元顔モデルは、後で説明するステップＳ４０における「Ｍ個の３次元顔モデルフィッティング結果の統合処理」を直前に且つ少なくとも１回経由したものである。

次に、１～Ｍまでインクリメントされる変数であるｍを初期化（ｍ＝１）する（ステップＳ３０）。続いて、Ｍ個のうちのｍ番目の３次元顔モデルに基づいて、３次元顔モデル詳細フィッティング部３２が、顔画像データに対して３次元顔モデルを詳細フィッティングする（ステップＳ３２）。「詳細フィッティング」については、上述の［本開示で利用する３次元顔モデルフィッティング］において説明している。

次に、３次元顔モデルフィッティングスコア算出部３４が、３次元顔モデル詳細フィッティング部３２による詳細フィッティング処理（ステップＳ３２）の直後の、３次元顔モデルのフィッティングスコアを算出する（ステップＳ３４）。フィッティングスコアは、例えば、以下のように算出する。ＲＯＭ２０に記憶される、正解モデルに基づいて取得される特徴量と、ステップＳ３２の詳細フィッティング処理を経たｍ番目の３次元顔モデルに基づいて取得される特徴量との、相関値を求めて、フィッティングスコアとする。なお、フィッティングスコアは、この値に限定されるものでは無い。

次に、変数ｍをインクリメントする（ステップＳ３６）。ここでｍがＭ以下であるならば（ステップＳ３８・ＮＯ）、インクリメントしたｍ番目の３次元顔モデルについて、詳細フィッティング処理（ステップＳ３２）、及び、フィッティングスコアの算出（ステップＳ３４）を行う。

ｍがＭより大きければ（ステップＳ３８・ＹＥＳ）、３次元顔モデル統合部３６が、Ｍ個の３次元顔モデルフィッティング結果を統合する（ステップＳ４０）。このステップＳ４０については、図５ａ及び図５ｂを用いて、後で説明する。３次元顔モデル統合部３６がＭ個の３次元顔モデルフィッティング結果を統合することにより、顔画像における顔向きの角度が算出される。

続いて、統合されたフィッティングスコアが所定の第１閾値より大きく且つ顔向き変動が所定の第２閾値より小さければ（ステップＳ４２・ＹＥＳ）、顔向き推定部２４が、最終的な顔向きの角度を出力して（ステップＳ４８）、顔向き推定処理を終了する（ステップＳ５０）。ここで「統合されたフィッティングスコア」とは、Ｍ個の３次元顔モデルフィッティング結果の統合処理（ステップＳ４０）を経由した３次元顔モデルに係るフィッティングスコアである。即ち、「統合されたフィッティングスコア」とは、例えば、後で説明する、Ｍ個の３次元顔モデルフィッティング結果の統合処理（ステップＳ４０）において、所定の第３閾値以上でありそれ故に重み付けに用いられるフィッティングスコアについての平均値である。また「顔向き変動」とは、イタレーション回数が「ｉ－１」である処理フローの際に算出された顔向きの角度からの変動値である。なお、ｉ＝１の際、即ち、ｉ－１＝０の際は、ステップＳ２４のラフフィッティング処理を経た３次元顔モデルの顔向きの角度からの変動値が「顔向き変動」とされる。

統合されたフィッティングスコアが所定の第１閾値より大きく且つ顔向き変動が所定の第２閾値より小さい、のでは無いならば（ステップＳ４２・ＮＯ）、イタレーション回数をインクリメント（ｉ＋＋）して、次のイタレーション回数に入る（ステップＳ４４）。

イタレーション回数（ｉ）が、所定のイタレーション上限回数“Ｎ”以下であるならば（ステップＳ４６・ＮＯ）、３次元顔モデルの位置ずらし処理（ステップＳ２８）～Ｍ個の３次元顔モデルフィッティング結果の統合処理（ステップＳ４０）のフローを行う（繰り返す）。イタレーション回数（ｉ）が多くなる程、３次元顔モデル統合部３６による、Ｍ個の３次元顔モデルフィッティング結果の統合処理（ステップＳ４０）が多く経由されることになる。即ち、３次元顔モデルの位置ずらし処理（ステップＳ２８）の基になる３次元顔モデルも、Ｍ個の３次元顔モデルフィッティング結果の統合処理（ステップＳ４０）を多く経由したものとなる。

イタレーション回数（ｉ）が所定のイタレーション上限回数“Ｎ”より大きければ（ステップＳ４６・ＹＥＳ）、顔向き推定部２４が、その時点での顔向きの角度を出力して（ステップＳ４８）、顔向き推定処理を終了する（ステップＳ５０）。

１．２．３．Ｍ個の３次元顔モデルフィッティング結果の統合処理
図５ａ及び図５ｂは、実施の形態１に係る顔向き推定装置１４における、３次元顔モデル統合部３６の、Ｍ個の３次元顔モデルフィッティング結果の統合処理を示すフローチャートである。図５ａ及び図５ｂに示すフローチャートでは、Ｍ個の詳細フィッティング結果について、フィッティングスコアで重み付けして統合して、顔向きを算出する。

図５ａ及び図５ｂに示すフローチャートが用いる変数及び定数は、次のように定義される。
・「paraN」：所定のフィッティングモデルパラメータ数（定数）。
・「ModelPara[k]」：「paraN」個のフィッティングモデルパラメータのうち、ｋ番目のフィッティングモデルパラメータ。
「フィッティングモデルパラメータ」は、例えば、３次元顔モデルを左右方向に何度回転するか、などを表すものである。
・「validModelScoreSum」：“フィッティングスコアＳｍ≧所定の第３閾値”を満たす３次元顔モデル（以下、有効モデルと言う。）のフィッティングスコアの合計値。
・「validModelParaSum[k]」：k番目のフィッティングモデルパラメータ「ModelPara[k]」について、“フィッティングスコアＳｍ≧所定の第３閾値”を満たす有効モデルの分だけ、フィッティングスコアＳｍで重み付けして、フィッティングモデルパラメータ値を合計（積算）したもの。
・「Model[m].ModelPara[k]」：ｍ番目の３次元顔モデルにおける、ｋ番目のフィッティングモデルパラメータ。

図５ａ及び図５ｂに示すフローチャートでは、概略、開始（図５ａ・ステップＳ６０）後、変数を初期化し（図５ａ・ステップＳ６２～Ｓ７０）、Ｍ個の詳細フィッティング結果についてフィッティングスコアＳｍで重み付けして積算し（図５ａ・ステップＳ７２～Ｓ８８）、積算後、正規化により統合値を算出して顔向きの角度を算出し（図５ｂ・ステップＳ９０～９８）、終了する（図５ｂ・ステップＳ１００）。以下にて、図５ａ及び図５ｂに示すフローチャートの各ステップを説明する。

図５ａに示すフローチャートにおいて、開始（ステップＳ６０）後、「validModelScoreSum」（有効モデルのフィッティングスコアの合計値）を初期化し（ステップＳ６２）、変数ｋを０から「paraN」までインクリメントして全部の「validModelParaSum[k]」を初期化する（ステップＳ６４、ステップＳ６６、ステップＳ６８、及び、ステップＳ７０）。

「validModelParaSum[k]」の初期化が完了すれば（ステップＳ７０・ＮＯ）、１～Ｍまでインクリメントされるｍにまず“１”を設定する（ｍ＝１）（ステップＳ７２）。

続いて、Ｍ個のうちのｍ番目の３次元顔モデルについて、フィッティングスコアＳｍが所定の第３閾値より小さければ（ステップＳ７４・ＹＥＳ）、フィッティング結果の積算処理（ステップＳ７６～ステップＳ８４）を行うこと無く、ｍをインクリメントし（ステップＳ８６）、ｍがＭ以下である限り（ステップＳ８８・ＮＯ）、ステップＳ７４以下を繰り返す。

フィッティングスコアＳｍが所定の第３閾値以上であれば（ステップＳ７４・ＮＯ）、変数ｋを０から「paraN」までインクリメントして、Ｍ個のうちのｍ番目の３次元顔モデルにおける、k番目のフィッティングモデルパラメータ「Model[m].ModelPara[k]」の夫々について、フィッティングスコアＳｍで重み付けして、フィッティングモデルパラメータ値を足し込む。即ち、以下の処理を行う（ステップＳ７６、ステップＳ７８、ステップＳ８０、及び、ステップＳ８２）。

更に、有効モデルのフィッティングスコアＳｍについての足し込み処理を行う。即ち、以下の処理を行う（ステップＳ８４）。

続いて、ｍをインクリメントし（ステップＳ８６）、ｍがＭ以下である限り（ステップＳ８８・ＮＯ）、ステップＳ７４以下を繰り返す。ｍがＭより大きくなれば（ステップＳＳ８８・ＹＥＳ）、図５ｂに示すステップＳ９０～の、正規化による統合値の算出、及び、顔向き角度の算出の、処理ステップに進む。

図５ｂに示すフローチャートでは、変数ｋを０から「paraN」までインクリメントして、k番目のフィッティングモデルパラメータ「ModelPara[k]」について、正規化することにより統合値を算出する。つまり、以下の処理のようにして、「validModelParaSum[k]」を「validModelScoreSum」で除することにより、統合値である「ModelPara[k]」を求める（ステップＳ９０、ステップＳ９２、ステップＳ９４、及び、ステップＳ９６）。

統合したフィッティング結果である、フィッティングモデルパラメータの統合値から、顔画像データにおける顔の向きの角度を算出して（ステップＳ９８）、Ｍ個の３次元顔モデルフィッティング結果の統合処理が終了する（ステップＳ１００）。

１．３．まとめ
以上のように、本実施の形態に係る顔向き推定装置は、画像データから人の顔画像データを検出する顔検出部２３と、及び、検出された人の顔画像データに関して顔の向きの角度を推定する顔向き推定部２４とを備える顔向き推定装置１４である。顔向き推定部２４は、３次元顔モデル初期設定部２６と、３次元顔モデル移動（ずらし）部３０と、３次元顔モデル詳細フィッティング部３２と、３次元顔モデルフィッティングスコア算出部３４と、及び、３次元顔モデル統合部３６とを含む。３次元顔モデル初期設定部２６は、顔画像データ上に３次元顔モデルを設定するものである。更に、（１）３次元顔モデル移動（ずらし）部３０は、所与の３次元顔モデルの位置をずらし量だけ一又は複数回ずらし、詳細フィッティングのための複数の３次元顔モデルを生成し、（２）３次元顔モデル詳細フィッティング部３２は、顔画像データに対して位置をずらすことにより生成された複数の詳細フィッティングのための３次元顔モデルを詳細フィッティングする処理を行い、（３）３次元顔モデルフィッティングスコア算出部３４は、３次元顔モデル詳細フィッティング部３２による詳細フィッティング処理の直後の、３次元顔モデルのフィッティングスコアを算出し、（４）３次元顔モデル統合部３６は、複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出するものである。顔向き推定部１４は、上記（１）～（４）の処理を繰り返し実行し、顔の向きの角度を出力する。

以上の、本実施の形態に係る顔向き推定装置は、画像データ中の人の顔に関して、安定して精度良く顔の向きの角度を推定することができる。

（他の実施の形態）
以上のように、本出願において開示する技術の例示として、実施の形態１を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。

実施の形態１に係る顔向き推定装置は、自動車に搭載されるドライバモニタリングセンサに適用されることが想定されるが、適用例はドライバモニタリングセンサに限定されない。例えば、工場における作業者の表情をモニタするモニタリングシステムや、カメラを駅や広場等に設置した上で特定の人物を検出してその人物の表情を検出する検出システム等に適用され得る。

また、実施の形態を説明するために、添付図面および詳細な説明を提供した。したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。

また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。

４・・・車両制御部、６・・・ＥＣＵ、８・・・アクチュエータ、１０・・・ＣＡＮ、１２・・・ドライバモニタリングセンサ、１４・・・顔向き推定装置（画像処理部）、１６・・・カメラ、１８・・・ＣＰＵ、２０・・・ＲＯＭ、２２・・・ＲＡＭ、２３・・・顔検出部、２４・・・顔向き推定部、２６・・・３次元顔モデル初期設定部、２８・・・３次元顔モデルラフフィッティング部、３０・・・３次元顔モデル移動（ずらし）部、３２・・・３次元顔モデル詳細フィッティング部、３４・・・３次元顔モデルフィッティングスコア算出部、３６・・・３次元顔モデル統合部、３８・・・目開閉検出部、４０・・・視線推定部。

Claims

画像データから人の顔画像データを検出する顔検出部と、及び、
検出された人の顔画像データに関して顔の向きの角度を推定する顔向き推定部と
を備える顔向き推定装置であって、
前記顔向き推定部は、
３次元顔モデル初期設定部と、
３次元顔モデル移動（ずらし）部と、
３次元顔モデル詳細フィッティング部と、
３次元顔モデルフィッティングスコア算出部と、及び、
３次元顔モデル統合部と
を含み、
前記３次元顔モデル初期設定部は、顔画像データ上に３次元顔モデルを初期配置するものであり、
更に、
（１）前記３次元顔モデル移動（ずらし）部は、所与の３次元顔モデルの位置をずらし量だけ一又は複数回ずらし、詳細フィッティングのための複数の３次元顔モデルを生成し、
（２）前記３次元顔モデル詳細フィッティング部は、顔画像データに対して位置をずらすことにより生成された複数の詳細フィッティングのための３次元顔モデルを詳細フィッティングする処理を行い、
（３）前記３次元顔モデルフィッティングスコア算出部は、前記３次元顔モデル詳細フィッティング部による詳細フィッティング処理の直後の、３次元顔モデルのフィッティングスコアを算出し、
（４）前記３次元顔モデル統合部は、複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出する
ものであり、
前記顔向き推定部は、上記（１）～（４）の処理を繰り返し実行し、最終的な顔の向きの角度を出力し、
ここで、上記（１）の前記所与の３次元顔モデルは、前記繰り返しの回数ｉが１であるとき、前記３次元顔モデル初期設定部による初期配置を経たものであり、前記繰り返しの回数ｉが複数であるとき、上記（４）における前記３次元顔モデル統合部による、複数の３次元顔モデルフィッティング結果の統合の処理を、前記繰り返しの実行により（ｉ－１）回分、経由したものである、
顔向き推定装置。
上記（４）における複数の３次元顔モデルフィッティング結果の統合処理を経由した３次元顔モデルに係るフィッティングスコアが、所定の第１閾値より大きく、且つ、前回の繰り返し回数における、上記（４）における顔の向きの角度からの変動値が、所定の第２の閾値より小さく、なるまで、
又は、
繰り返し回数が繰り返し上限回数を超えるまで、
実行され、
上記（１）～（４）の処理の繰り返しの実行後、最終的な顔の向きの角度を出力する、
請求項１に記載の顔向き推定装置。
上記（４）における、前記３次元顔モデル統合部が、複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出する処理では、
複数の詳細フィッティング結果について、夫々のフィッティングスコアが所定の第３閾値以上であれば当該フィッティングスコアで重み付けして積算し、
積算後、正規化により統合値を算出して顔向きの角度を算出する、
請求項１に記載の顔向き推定装置。
上記（４）における、複数の３次元顔モデルフィッティング結果の統合処理を経由した３次元顔モデルに係るフィッティングスコアは、複数のフィッティングスコアのうち所定の第３閾値以上であるフィッティングスコアについての平均値である、
請求項３に記載の顔向き推定装置。
コンピュータが実行する顔向き推定方法であって、
画像データから人の顔画像データを検出するステップと、
顔画像データ上に３次元顔モデルを初期配置するステップと、並びに、
下記（処理１）～（処理４）の処理を繰り返し実行し、最終的な顔の向きの角度を出力するステップと
を含み、
ここで、下記（処理１）の下記所与の３次元顔モデルは、前記繰り返しの回数ｉが１であるとき、前記初期配置するステップによる初期配置を経たものであり、前記繰り返しの回数ｉが複数であるとき、下記（処理４）における、複数の３次元顔モデルフィッティング結果の統合の処理を、前記繰り返しの実行により（ｉ－１）回分、経由したものである、
顔向き推定方法。
（処理１）所与の３次元顔モデルの位置をずらし量だけ一又は複数回ずらし、詳細フィッティングのための複数の３次元顔モデルを生成する処理。
（処理２）顔画像データに対して位置をずらすことにより生成された複数の詳細フィッティングのための３次元顔モデルを詳細フィッティングする処理。
（処理３）上記（処理２）における詳細フィッティング処理の直後の、３次元顔モデルのフィッティングスコアを算出する処理。
（処理４）複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出する処理。
上記（処理４）における、複数の３次元顔モデルフィッティング結果の統合処理を経由した３次元顔モデルに係るフィッティングスコアが、所定の第１閾値より大きく、且つ、前回の繰り返し回数における、上記（処理４）における顔の向きの角度からの変動値が、所定の第２の閾値より小さく、なるまで、
又は、
繰り返し回数が繰り返し上限回数を超えるまで、
実行され、
上記（処理１）～（処理４）の処理の繰り返しの実行後、最終的な顔の向きの角度を出力する、
請求項５に記載の顔向き推定方法。
上記（処理４）における、複数の３次元顔モデルフィッティング結果を統合して、顔の向きの角度を算出する処理では、
複数の詳細フィッティング結果について、夫々のフィッティングスコアが所定の第３閾値以上であれば当該フィッティングスコアで重み付けして積算し、
積算後、正規化により統合値を算出して顔向きの角度を算出する、
請求項５に記載の顔向き推定方法。
上記（処理４）における、複数の３次元顔モデルフィッティング結果の統合処理を経由した３次元顔モデルに係るフィッティングスコアは、複数のフィッティングスコアのうち所定の第３閾値以上であるフィッティングスコアについての平均値である、
請求項７に記載の顔向き推定方法。