JP6465027B2 - 特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム - Google Patents

特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム Download PDF

Info

Publication number
JP6465027B2
JP6465027B2 JP2015533941A JP2015533941A JP6465027B2 JP 6465027 B2 JP6465027 B2 JP 6465027B2 JP 2015533941 A JP2015533941 A JP 2015533941A JP 2015533941 A JP2015533941 A JP 2015533941A JP 6465027 B2 JP6465027 B2 JP 6465027B2
Authority
JP
Japan
Prior art keywords
feature point
point position
search parameter
face feature
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015533941A
Other languages
English (en)
Other versions
JPWO2015029287A1 (ja
Inventor
雄介 森下
雄介 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2015029287A1 publication Critical patent/JPWO2015029287A1/ja
Application granted granted Critical
Publication of JP6465027B2 publication Critical patent/JP6465027B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Description

本発明は、顔などの画像から目や鼻などの特徴点の位置を検出するための特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラムに関する。
特徴点位置検出とは、顔などの画像中から目、鼻、口などの器官の特徴点位置を検出する技術である。特徴点位置検出は、高精度な顔認証や表情認識などを行うための重要な技術である。
顔の特徴点位置を検出する技術として、例えば、Active Appearance Model(AAM)が知られている(非特許文献1)。AAMでは、複数の顔画像と複数の顔画像に予め入力された特徴点位置の情報から、統計的手法により顔のテクスチャと形状に関するモデルが構築される。AAMでは、この構築されたモデルが、検出対象の顔が含まれる画像にフィッティングされる。
すなわち、AAMでは、検出対象の顔画像とモデルから計算される顔画像が近くなるようにモデルのパラメータが繰り返し更新されることで、特徴点位置が検出される。AAMは、提案されて以来様々な拡張がなされている。例えば、横顔の検出に対応させるために複数のモデルを組み合わせる方法や、高速化または高精度化のための改良案が数多く提案されている。
AAMは、例えば、一人の人物の顔を学習することによってその人に特化したモデルを構築するなど、少人数の顔を学習および検出する目的で使用される場合には高精度であることが知られている。それに対して、多人数、非コントロール下(様々な照明、姿勢など)の顔を学習および検出する目的で使用される場合には、AAMは、性能が極端に悪化することが知られている。
そこで、非特許文献1には、AAMのモデルとは異なり、目、鼻、口などの顔特徴点が全て正しい位置である状態(以下、正しい形状という。)から得られる顔画像と、顔特徴点の一つ以上の点が正しい位置から外れた状態(以下、ずれた形状という。)から得られる顔画像の2クラスに顔画像を識別する2クラス識別器を構築し、この2クラス識別器の識別スコアが向上するようにモデルのパラメータを繰り返し更新することによって顔特徴点を検出する手法が提案されている。
Xiaoming Liu, "Discriminative Face Alignment," IEEE Transaction on Pattern Analysis and Machine Intelligence (PAMI), Vol. 31, No. 11, pp. 1941−1954, 2009. D. Cristinacce and T. F. Cootes, "A Comparison of Shape Constrained Facial Feature Detectors," In 6th International Conference on Automatic Face and Gesture Recognition 2004, Korea, pages 357−380, 2004. SATO A., "Generalized Learning Vector Quantization," Advances in Neural Information Processing Systems 8, 423−429, 1996.
非特許文献1に記載されている手法では、特徴量としてHaar−like、識別器としてBoostingの一種であるGentle Boostが利用されている。しかし、Boostingは特徴量を1次元ずつ選択する方式であるため、非特許文献1に記載されている手法を使用した場合、検出される顔特徴点が局所解に陥る傾向にある。すなわち、非特許文献1に記載されている手法を使用した場合、高い精度の顔特徴点を得にくいという課題がある。
そこで、本発明は、モデルのフィッティングが局所解に陥ることを減らし、より実用的な精度で顔特徴点を検出できる特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラムを提供することを目的とする。
本発明による特徴点位置推定装置は、外部から顔画像を入力する画像入力部と、正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め顔特徴点位置探索パラメータと最近傍テンプレートとから、顔特徴点位置探索パラメータの勾配方向を計算するパラメータ勾配方向計算部と、計算された勾配方向を加算することにより、顔特徴点位置探索パラメータを更新する探索パラメータ更新部と、更新された顔特徴点位置探索パラメータが収束したか否かを判定する収束判定部と、顔特徴点位置探索パラメータが収束したと判定された場合、顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する探索結果出力部とを備えることを特徴とする。
本発明による特徴点位置推定方法は、外部から顔画像を入力し、正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め、顔特徴点位置探索パラメータと最近傍テンプレートとから、顔特徴点位置探索パラメータの勾配方向を計算し、計算した勾配方向を加算することにより、顔特徴点位置探索パラメータを更新し、更新した顔特徴点位置探索パラメータが収束したか否かを判定し、顔特徴点位置探索パラメータが収束したと判定した場合、顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力することを特徴とする。
本発明による特徴点位置推定プログラムは、コンピュータに、外部から顔画像を入力する入力処理、正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め、顔特徴点位置探索パラメータと最近傍テンプレートとから、顔特徴点位置探索パラメータの勾配方向を計算する計算処理、計算された勾配方向を加算することにより、顔特徴点位置探索パラメータを更新する更新処理、更新された顔特徴点位置探索パラメータが収束したか否かを判定する判定処理、および顔特徴点位置探索パラメータが収束したと判定された場合、顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する出力処理を実行させることを特徴とする。
本発明によれば、モデルのフィッティングが局所解に陥ることを減らし、より実用的な精度で顔特徴点を検出できる。
顔特徴点位置推定装置1の構成例を示すブロック図である。 顔特徴点位置推定装置1の顔特徴点探索処理の動作を示すフローチャートである。 顔特徴点位置推定装置1が処理の対象にする顔画像の例を示す説明図である。 顔特徴点位置推定装置1の初期位置入力手段120が入力の対象にする顔特徴点の例を示す説明図である。 本発明による特徴点位置推定装置の概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。図1は、顔特徴点位置推定装置1の構成例を示すブロック図である。図1に示す顔特徴点位置推定装置1は、データ処理装置100と、記憶装置200とを含む。
データ処理装置100は、画像入力手段110と、初期位置入力手段120と、最近傍テンプレート計算手段130と、パラメータ勾配方向計算手段140と、探索パラメータ更新手段150と、収束判定手段160と、探索結果出力手段170とを有する。また、記憶装置200は、テンプレート記憶手段210を有する。
画像入力手段110は、外部から顔画像を入力する機能を有する。
初期位置入力手段120は、外部から、探索される顔特徴点の初期位置として用いられる顔特徴点情報を入力する機能を有する。
顔特徴点情報は、例えば、外部の顔特徴点検出装置が出力する目、鼻、口などの複数の顔特徴点の位置を示す情報である。なお、外部から入力される初期位置には、例えば、公知の顔特徴点検出装置や、非特許文献2に記載された顔特徴点検出技術から得られる顔特徴点の位置が用いられる。また、初期位置には、人間の手によって入力された顔特徴点の位置が用いられてもよい。
最近傍テンプレート計算手段130は、テンプレート記憶手段210に記憶されている複数のテンプレートの中から、現在の顔特徴点位置探索パラメータから計算される画像(以下、Warp画像という。)に最も近いテンプレートである最近傍テンプレートを求める機能を有する。
複数のテンプレートとして、具体的には、正しい形状から得られる顔画像の代表的な正例のテンプレートと、ずれた形状から得られる顔画像の代表的な負例のテンプレートが、それぞれ少なくとも一つ以上、テンプレート記憶手段210に記憶されている。
つまり、最近傍テンプレート計算手段130は、正例のテンプレートおよび負例のテンプレートとWarp画像との距離をそれぞれ計算する。そして、最近傍テンプレート計算手段130は、正例のテンプレートの中でWarp画像に最も近いテンプレートを一つと、負例のテンプレートの中でWarp画像に最も近いテンプレートを一つそれぞれ選ぶ。
また、顔特徴点位置探索パラメータ(以下、探索パラメータ、または単にパラメータという。)は、顔特徴点位置の特徴を表す複数個の数値から構成される。以下では探索パラメータをベクトルpとして表す。
なお、上記の正しい形状とは、前述のとおり、目や鼻などの顔特徴点が、全て各特徴点として定義された位置に配置されている状態である。また、上記のずれた形状とは、前述のとおり、全ての顔特徴点のうち一つ以上の特徴点が、定義から外れた位置に配置されている状態である。ずれた形状には、例えば、顔特徴点検出装置による処理が失敗し、幾つかの特徴点が誤った位置に検出された状態が含まれる。
各特徴点の位置の定義は、顔の器官や骨格の構造などの情報を基になされる。例えば、ヒトの瞳中心の特徴点の位置は、瞳孔の中央部として定義される。また、ヒトの鼻下の特徴点の位置は、頭蓋骨の前鼻棘の尖端部として定義される。
ただし、画像上から顔の器官や骨格の正確な構造を把握し特徴点位置を決めることは困難である。よって、本実施形態では、正しい形状として別の基準が用いられてもよい。例えば、上記の特徴点位置の定義を基に画像を目視するなどの方法により、人間が手で入力した画像上の位置(手入力特徴点)を特徴点の基準とし、ある特徴点の位置が全て手入力特徴点上に配置されている状態を「正しい形状」としてもよい。
パラメータ勾配方向計算手段140は、現在の探索パラメータpと、最近傍テンプレート計算手段130が計算して求めた最近傍テンプレートとから、所定の評価関数の偏微分により導出される探索パラメータの勾配の計算式により、探索パラメータpの勾配方向Δpを計算する機能を有する。
探索パラメータ更新手段150は、パラメータ勾配方向計算手段140が計算した探索パラメータpの勾配方向Δpを、現在の探索パラメータpに加算し、探索パラメータを更新する機能を有する。
収束判定手段160は、探索パラメータ更新手段150が更新した探索パラメータpが収束したか否かを判定する機能を有する。探索パラメータが収束していない場合、最近傍テンプレート計算手段130が再度最近傍テンプレートを求める。探索パラメータが収束した場合、収束判定手段160は、探索結果出力手段170に更新した探索パラメータを出力する。
探索結果出力手段170は、最適化された後の探索パラメータpから顔特徴点位置を計算する機能を有する。探索結果出力手段170は、計算した顔特徴点位置を探索結果として出力する。
なお、本実施形態における顔特徴点位置推定装置1において、データ処理装置100は、例えば、CPU(Central Processing Unit)によって実現される。また、データ処理装置100は、ハードウェアによって実現されてもよい。
また、画像入力手段110、初期位置入力手段120、最近傍テンプレート計算手段130、パラメータ勾配方向計算手段140、探索パラメータ更新手段150、収束判定手段160、および探索結果出力手段170は、例えば、プログラム制御に従って処理を実行するCPUによって実現される。
また、本実施形態における顔特徴点位置推定装置1において、記憶装置200は、例えば、半導体メモリ、またはハードディスクドライブによって実現される。
また、テンプレート記憶手段210は、例えば、半導体メモリ、またはハードディスクドライブ上の記憶領域によって実現される。
以下、本実施形態の顔特徴点探索処理の動作を図2のフローチャートを参照して説明する。図2は、顔特徴点位置推定装置1の顔特徴点探索処理の動作を示すフローチャートである。
画像入力手段110は、外部から顔画像を入力する(ステップS111)。
次いで、初期位置入力手段120は、外部から、探索される顔特徴点の初期位置として用いられる顔特徴点情報を入力する(ステップS112)。
次いで、最近傍テンプレート計算手段130は、テンプレート記憶手段210に記憶されている複数のテンプレートの中から、現在の顔特徴点位置探索パラメータpから計算される画像に最も近いテンプレートを求める(ステップS113)。
次いで、パラメータ勾配方向計算手段140は、現在の探索パラメータpと、ステップS113で計算して求められた最近傍テンプレートから、所定の評価関数の偏微分により導出される探索パラメータの勾配の計算式により、探索パラメータpの勾配方向Δpを計算する(ステップS114)。
次いで、探索パラメータ更新手段150は、ステップS114で計算された探索パラメータpの勾配方向Δpを、現在の探索パラメータpに加算し、探索パラメータを更新する(ステップS115)。
次いで、収束判定手段160は、ステップS115で更新された探索パラメータpが収束したか否かを判定する(ステップS116)。探索パラメータが収束していない場合(ステップS116のNo)、顔特徴点位置推定装置1は、ステップS113へ処理を戻す。探索パラメータが収束した場合(ステップS116のYes)、顔特徴点位置推定装置1は、ステップS117へ処理を進める。
更新された探索パラメータが収束した場合(ステップS116のYes)、探索結果出力手段170は、最適化された後の探索パラメータpから顔特徴点位置を計算する。そして、探索結果出力手段170は、計算した顔特徴点位置を探索結果として出力する(ステップS117)。
以下、本実施形態の動作を、具体例を用いて説明する。ここでは、顔特徴点位置推定装置1に図3に示す顔画像が入力される場合を例に説明する。図3は、顔特徴点位置推定装置1が処理の対象にする顔画像の例を示す説明図である。
画像入力手段110は、外部から顔画像を入力する(ステップS111)。
次いで、初期位置入力手段120は、外部から、探索される顔特徴点の初期位置として用いられる顔特徴点情報を入力する(ステップS112)。
顔特徴点情報は、例えば、顔特徴点検出装置が出力する目、鼻、口などの顔特徴点の位置(座標)を示す情報である。この場合、顔特徴点情報は、顔特徴点位置推定装置1の処理対象である顔画像上における顔特徴点の位置を、顔特徴点ごとにそれぞれx座標値、y座標値の二つの数字の組である座標として表す。
外部から入力される顔特徴点情報には、例えば、公知の顔特徴点検出装置や、非特許文献2に記載された顔特徴点検出技術から得られる顔特徴点情報が用いられる。また、顔特徴点情報には、人間の手によって入力された顔特徴点の位置が用いられてもよい。
図4は、顔特徴点位置推定装置1の初期位置入力手段120が入力の対象にする顔特徴点の例を示す説明図である。図4に示す例では、処理対象の顔特徴点の位置が×印で示されている。本例では、図4に示すように、目、鼻、口などの75点に×印が付されている。初期位置入力手段120に入力される顔特徴点情報は、図4に示す75点の顔特徴点の初期位置である。
最近傍テンプレート計算手段130は、テンプレート記憶手段210に記憶されている複数のテンプレートの中から、現在の顔特徴点位置探索パラメータから計算される画像に最も近いテンプレートを求める(ステップS113)。
本実施形態におけるテンプレートとは、すなわち顔画像を表す。テンプレート記憶手段210には、正しい形状から得られる顔画像を代表する複数個の正例のテンプレートと、ずれた形状から得られる顔画像を代表する複数個の負例のテンプレートが記憶されている。
正例のテンプレートと負例のテンプレートは、各々のテンプレートを用いて所定の計算を行う際に、ある顔画像が、正しい形状から得られた顔画像とずれた形状から得られた顔画像のどちらであるか正確に判別されるように定められることが望ましい。
正例のテンプレートと負例のテンプレートは、例えば、一般化ベクトル量子化(非特許文献3)などの手法が用いられた場合、適切に定められる。一般化ベクトル量子化(generalized learning vector quantization;GLVQ)を用いて適切なテンプレート(GLVQでは参照ベクトルと呼ばれる)を求める方法は、様々な環境で撮影された複数人の顔が映った画像から、正しい形状を用いて生成した顔画像と、ずれた形状を用いて生成した顔画像を、それぞれ複数枚用意する。そして、用意した複数の顔画像に対して、GLVQの学習処理を実行する。その結果、適切なテンプレートが定められる。
なお、以下ではGLVQを用いた場合の顔特徴点位置の推定方法を説明するが、本実施形態の範囲は以下に記載される内容に限定されない。
また、本実施形態における顔特徴点位置探索パラメータpは、顔特徴点位置の特徴を表す複数個の数値(ベクトル)として構成される。本実施形態では、様々な環境で撮影された複数人の顔の顔特徴点75点の座標値が主成分分析され、得られた主成分部分空間上の点が、顔特徴点位置探索パラメータpとして用いられる。
なお、顔特徴点位置探索パラメータpは、最近傍テンプレート計算手段130における処理の前に予め初期化されることが求められる。顔特徴点位置探索パラメータpの初期化には、初期位置入力手段120で入力された顔特徴点の位置が利用される。
顔特徴点位置探索パラメータpは、顔特徴点75点の座標値の主成分部分空間上の点である。よって、初期位置入力手段120で入力された顔特徴点の位置を主成分部分空間上に射影することによって得られる値が、顔特徴点位置探索パラメータpの初期値でもよい。
また、初期位置入力手段120において適切な顔特徴点の位置が入力されない場合は、平均的な顔特徴点75点の座標を主成分部分空間上に射影することによって得られる値(すなわち、全てゼロの値)が、顔特徴点位置探索パラメータpの初期値でもよい。
以上の準備がなされた段階で、最近傍テンプレート計算手段130が、テンプレート記憶手段210に記憶されている複数のテンプレートの中から、現在の顔特徴点位置探索パラメータpから計算される画像に最も近いテンプレートを求める。
最近傍テンプレート計算手段130は、以下のようにテンプレートを求める。顔特徴点位置探索パラメータpは顔特徴点75点の座標値の主成分部分空間上の点であるため、最近傍テンプレート計算手段130は、部分空間からの逆射影により現在の顔特徴点位置探索パラメータpに対応する顔特徴点位置を求める。
次いで、最近傍テンプレート計算手段130は、求めた顔特徴点位置を用いて、画像入力手段110に入力された画像から顔画像を切り出す。この切り出された顔画像がWarp画像である。
次いで、最近傍テンプレート計算手段130は、Warp画像と、テンプレート記憶手段210に記憶されている複数のテンプレート(顔画像)の距離を計算し、正しい形状から得られる顔画像を代表する正例のテンプレートの中でWarp画像に最も近いテンプレートを一つと、ずれた形状から得られる顔画像を代表する負例のテンプレートの中でWarp画像に最も近いテンプレートを一つそれぞれ求める。最近傍テンプレート計算手段130は、求めたこれらのテンプレートを最近傍テンプレートとする。
パラメータ勾配方向計算手段140は、現在の顔特徴点位置探索パラメータpと、最近傍テンプレート計算手段130で計算して求められた最近傍テンプレートとから、所定の評価関数の偏微分により導出される探索パラメータの勾配の計算式により、探索パラメータpの勾配方向を計算する(ステップS114)。以下、勾配方向の具体的な計算手順を示す。
最近傍テンプレートのうち、正しい形状から得られる顔画像を代表する正例のテンプレートをr1、ずれた形状から得られる顔画像を代表する負例のテンプレートをr2とそれぞれする。このとき、現在の顔特徴点位置探索パラメータpにより定まる顔特徴点位置から切り出された顔画像(Warp画像)fに対して、GLVQにおける誤分類尺度Jは、次式で計算される。
Figure 0006465027
ただし、
Figure 0006465027
である。
求めるべき探索パラメータの勾配方向は、現在の探索パラメータpにおける誤分類尺度Jが改善する方向(勾配)Δpである。誤分類尺度Jをモデルパラメータpにより偏微分すると、Δpは、次式で計算される。
Figure 0006465027
ただし、
Figure 0006465027
Figure 0006465027
Figure 0006465027
である。
探索パラメータ更新手段150は、パラメータ勾配方向計算手段140が計算したパラメータの勾配方向Δpを、現在の探索パラメータpに加算し、探索パラメータpを更新する(ステップS115)。探索パラメータpは、次式に従って更新される。
Figure 0006465027
ここで、cは、探索パラメータpに加算される勾配方向Δpの大きさを決める定数である。
収束判定手段160は、探索パラメータ更新手段150で更新した探索パラメータpが収束したか否かを判定する(ステップS116)。パラメータが収束していない場合(ステップS116のNo)、顔特徴点位置推定装置1は、最近傍テンプレート計算手段130にステップS113の処理を再度実行させる。パラメータが収束した場合(ステップS116のYes)、顔特徴点位置推定装置1は、探索結果出力手段170にステップS117の処理を実行させる。
収束判定手段160は、パラメータが収束したか否かを、例えば、最近傍テンプレート計算手段130から探索パラメータ更新手段150にかけて実行される処理が繰り返し適用された結果としての式(1)の誤分類尺度Jの変化分が、所定の閾値よりも小さいか否かによって判定できる。
また、収束判定手段160は、パラメータが収束したか否かを、最近傍テンプレート計算手段130で計算される顔特徴点位置の変化分が所定の閾値よりも小さいか否かによって判定してもよい。
探索結果出力手段170は、最適化された後の探索パラメータpから顔特徴点位置を計算する。そして、探索結果出力手段170は、計算した顔特徴点位置を探索結果として出力する(ステップS117)。顔特徴点位置の探索パラメータpは、顔特徴点75点の座標値の主成分部分空間上の点である。よって、部分空間からの逆射影を行うことにより、現在の顔特徴点位置探索パラメータpに対する顔特徴点位置が得られる。
本実施形態の特徴点位置推定装置は、正しい形状から得られる顔画像の代表的なテンプレートと、ずれた形状から得られる顔画像の代表的なテンプレートから、正しい形状から得られる顔画像とずれた形状から得られる顔画像を最適に識別できるテンプレートを選択し、選択したテンプレートを用いて、顔特徴点の探索パラメータを最適化できる。
本実施形態の特徴点位置推定装置は、上記の代表的なテンプレートを正例と負例で複数持つことができる。その結果、正しい形状の顔画像とずれた形状の顔画像の2クラスの識別器において複雑な識別面が構築されるため、モデルのフィッティングが局所解に陥ることが減り、高精度な顔特徴点位置が検出される。
次に、本発明の概要を説明する。図5は、本発明による特徴点位置推定装置の概要を示すブロック図である。本発明による特徴点位置推定装置10は、外部から顔画像を入力する画像入力部11(例えば、画像入力手段110)と、正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求める最近傍テンプレート計算部12(例えば、最近傍テンプレート計算手段130)と、顔特徴点位置探索パラメータと最近傍テンプレートとから、顔特徴点位置探索パラメータの勾配方向を計算するパラメータ勾配方向計算部13(例えば、パラメータ勾配方向計算手段140)と、計算された勾配方向を加算することにより、顔特徴点位置探索パラメータを更新する探索パラメータ更新部14(例えば、探索パラメータ更新手段150)と、更新された顔特徴点位置探索パラメータが収束したか否かを判定する収束判定部15(例えば、収束判定手段160)と、顔特徴点位置探索パラメータが収束したと判定された場合、顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する探索結果出力部16(例えば、探索結果出力手段170)とを備える。
そのような構成により、この特徴点位置推定装置は、モデルのフィッティングが局所解に陥ることを減らし、より実用的な精度で顔特徴点を検出できる。
また、パラメータ勾配方向計算部13は、所定の評価関数の偏微分により導出される顔特徴点位置探索パラメータの勾配の計算式により、勾配方向の計算を行ってもよい。
そのような構成により、この特徴点位置推定装置は、顔特徴点位置探索パラメータの勾配の計算式から、勾配方向を計算できる。
また、所定の評価関数は、誤分類尺度の顔特徴点位置探索パラメータに関する評価関数でもよい。
そのような構成により、この特徴点位置推定装置は、一般化ベクトル量子化における誤分類尺度を用いて顔特徴点の探索パラメータを最適化できる。
また、特徴点位置推定装置10は、複数の顔画像のテンプレートの情報を格納するテンプレート記憶部(例えば、テンプレート記憶手段210)を備えていてもよい。
また、特徴点位置推定装置10は、外部から顔特徴点の初期位置を入力する初期位置入力部を備え、最近傍テンプレート計算部12は、入力された初期位置を用いて顔特徴点位置探索パラメータを初期化してもよい。
そのような構成により、この特徴点位置推定装置は、外部から入力された初期位置を用いて顔特徴点位置探索パラメータを初期化できる。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2013年8月28日に出願された日本特許出願2013−176283を基礎とする優先権を主張し、その開示の全てをここに取り込む。
産業上の利用の可能性
本発明に係る顔特徴点位置推定装置、顔特徴点位置推定方法、および顔特徴点位置推定プログラムは、顔検出、顔認証、表情認識等の顔画像を入力する処理における高精度化に広く適用可能である。
1 顔特徴点位置推定装置
10 特徴点位置推定装置
11 画像入力部
12 最近傍テンプレート計算部
13 パラメータ勾配方向計算部
14 探索パラメータ更新部
15 収束判定部
16 探索結果出力部
100 データ処理装置
110 画像入力手段
120 初期位置入力手段
130 最近傍テンプレート計算手段
140 パラメータ勾配方向計算手段
150 探索パラメータ更新手段
160 収束判定手段
170 探索結果出力手段
200 記憶装置
210 テンプレート記憶手段

Claims (9)

  1. 外部から顔画像を入力する画像入力部と、
    正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め、前記顔特徴点位置探索パラメータと前記最近傍テンプレートとから、前記顔特徴点位置探索パラメータの勾配方向を計算するパラメータ勾配方向計算部と、
    計算された前記勾配方向を加算することにより、前記顔特徴点位置探索パラメータを更新する探索パラメータ更新部と、
    更新された前記顔特徴点位置探索パラメータが収束したか否かを判定する収束判定部と、
    前記顔特徴点位置探索パラメータが収束したと判定された場合、前記顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する探索結果出力部とを備える
    ことを特徴とする特徴点位置推定装置。
  2. 前記パラメータ勾配方向計算部は、所定の評価関数の偏微分により導出される前記顔特徴点位置探索パラメータの勾配の計算式により、前記勾配方向の計算を行う
    請求項記載の特徴点位置推定装置。
  3. 前記所定の評価関数は、誤分類尺度の顔特徴点位置探索パラメータに関する評価関数である
    請求項記載の特徴点位置推定装置。
  4. 複数の顔画像のテンプレートの情報を格納するテンプレート記憶部を備える
    請求項1から請求項のうちのいずれか1項に記載の特徴点位置推定装置。
  5. 外部から顔特徴点の初期位置を入力する初期位置入力部を備え、
    前記パラメータ勾配方向計算部は、入力された前記初期位置を用いて顔特徴点位置探索パラメータを初期化する
    請求項1から請求項のうちのいずれか1項に記載の特徴点位置推定装置。
  6. 外部から顔画像を入力し、
    正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め、前記顔特徴点位置探索パラメータと前記最近傍テンプレートとから、前記顔特徴点位置探索パラメータの勾配方向を計算し、
    計算した前記勾配方向を加算することにより、前記顔特徴点位置探索パラメータを更新し、
    更新した前記顔特徴点位置探索パラメータが収束したか否かを判定し、
    前記顔特徴点位置探索パラメータが収束したと判定した場合、前記顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する
    ことを特徴とする特徴点位置推定方法。
  7. 所定の評価関数の偏微分により導出される前記顔特徴点位置探索パラメータの勾配の計算式により、前記勾配方向の計算を行う
    請求項6記載の特徴点位置推定方法。
  8. コンピュータに、
    外部から顔画像を入力する入力処理、
    正例と負例で構成される複数の顔画像のテンプレートの中から、顔特徴点位置探索パラメータを用いて入力された顔画像から計算される画像に最も近いテンプレートである最近傍テンプレートを、正例及び負例の中からそれぞれ求め、前記顔特徴点位置探索パラメータと前記最近傍テンプレートとから、前記顔特徴点位置探索パラメータの勾配方向を計算する計算処理、
    計算された前記勾配方向を加算することにより、前記顔特徴点位置探索パラメータを更新する更新処理、
    更新された前記顔特徴点位置探索パラメータが収束したか否かを判定する判定処理、および
    前記顔特徴点位置探索パラメータが収束したと判定された場合、前記顔特徴点位置探索パラメータから計算される顔特徴点位置を探索結果として出力する出力処理
    を実行させるための特徴点位置推定プログラム。
  9. コンピュータに、
    計算処理で、所定の評価関数の偏微分により導出される前記顔特徴点位置探索パラメータの勾配の計算式により、前記勾配方向を計算させる
    請求項8記載の特徴点位置推定プログラム。
JP2015533941A 2013-08-28 2014-05-26 特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム Active JP6465027B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013176283 2013-08-28
JP2013176283 2013-08-28
PCT/JP2014/002750 WO2015029287A1 (ja) 2013-08-28 2014-05-26 特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム

Publications (2)

Publication Number Publication Date
JPWO2015029287A1 JPWO2015029287A1 (ja) 2017-03-02
JP6465027B2 true JP6465027B2 (ja) 2019-02-06

Family

ID=52585887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015533941A Active JP6465027B2 (ja) 2013-08-28 2014-05-26 特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム

Country Status (3)

Country Link
US (1) US9779286B2 (ja)
JP (1) JP6465027B2 (ja)
WO (1) WO2015029287A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3186787A1 (en) * 2014-08-29 2017-07-05 Thomson Licensing Method and device for registering an image to a model
EP3232368A1 (en) * 2016-04-14 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Determining facial parameters
US10685197B2 (en) 2017-11-17 2020-06-16 Divine Logic, Inc. Systems and methods for tracking items
CN107862303B (zh) * 2017-11-30 2019-04-26 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN108765532B (zh) * 2018-05-04 2023-08-22 卢卡(北京)智能科技有限公司 儿童绘本模型建立方法、阅读机器人及存储设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155399B2 (en) * 2007-06-12 2012-04-10 Utc Fire & Security Corporation Generic face alignment via boosting
US8744144B2 (en) 2009-03-13 2014-06-03 Nec Corporation Feature point generation system, feature point generation method, and feature point generation program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878657B2 (en) 2018-07-25 2020-12-29 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11455864B2 (en) 2018-07-25 2022-09-27 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same

Also Published As

Publication number Publication date
WO2015029287A1 (ja) 2015-03-05
JPWO2015029287A1 (ja) 2017-03-02
US20160203357A1 (en) 2016-07-14
US9779286B2 (en) 2017-10-03

Similar Documents

Publication Publication Date Title
JP6465027B2 (ja) 特徴点位置推定装置、特徴点位置推定方法および特徴点位置推定プログラム
JP5406705B2 (ja) データ補正装置及び方法
JP5772821B2 (ja) 顔特徴点位置補正装置、顔特徴点位置補正方法および顔特徴点位置補正プログラム
JP4950787B2 (ja) 画像処理装置及びその方法
JP6433149B2 (ja) 姿勢推定装置、姿勢推定方法およびプログラム
JP3962803B2 (ja) 頭部検出装置、頭部検出方法および頭部検出プログラム
KR101725651B1 (ko) 식별 장치 및 식별 장치의 제어 방법
JP4991317B2 (ja) 顔特徴点検出装置及びその方法
JP2004206656A (ja) 検出装置および検出方法
KR101612605B1 (ko) 얼굴 특징점 추출 방법 및 이를 수행하는 장치
Li et al. Efficient 3D face recognition handling facial expression and hair occlusion
JP2019191981A (ja) 行動認識装置、モデル構築装置及びプログラム
CN110603570B (zh) 对象物识别方法、装置、系统、程序
KR101558547B1 (ko) 얼굴 포즈 변화에 강한 연령 인식방법 및 시스템
US9904843B2 (en) Information processing device, information processing method, and program
WO2014112346A1 (ja) 特徴点位置検出装置、特徴点位置検出方法および特徴点位置検出プログラム
WO2015176502A1 (zh) 一种图像特征的估计方法和设备
JP2012243285A (ja) 特徴点位置決定装置、特徴点位置決定方法及びプログラム
JP5300795B2 (ja) 顔表情増幅装置、表情認識装置、顔表情増幅方法、表情認識方法、及びプログラム
JP6596044B2 (ja) 対象認識装置
JP7404137B2 (ja) 顔画像処理装置及び顔画像処理プログラム
JP7233610B2 (ja) 情報処理装置、プログラム及び情報処理方法
Klingner et al. Modeling human movements with self-organizing maps using adaptive metrics
Stricker et al. Increasing the robustness of 2d active appearance models for real-world applications
JP2018092273A (ja) 姿勢推定方法、姿勢推定プログラム及び姿勢推定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181224

R150 Certificate of patent or registration of utility model

Ref document number: 6465027

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150