JP5953097B2 - イメージ位置合わせのための最適勾配追求 - Google Patents
イメージ位置合わせのための最適勾配追求 Download PDFInfo
- Publication number
- JP5953097B2 JP5953097B2 JP2012098291A JP2012098291A JP5953097B2 JP 5953097 B2 JP5953097 B2 JP 5953097B2 JP 2012098291 A JP2012098291 A JP 2012098291A JP 2012098291 A JP2012098291 A JP 2012098291A JP 5953097 B2 JP5953097 B2 JP 5953097B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- alignment
- function
- score function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Description
顔モデル
BAMおよびBRMに似て、一実施形態の顔モデルは、生成形状モデルコンポーネントおよび識別外見モデルコンポーネントからなり、またはこれを含む。形状モデルに関して、ランドマークベースの形状表現が、イメージの顔形状を記述する人気のある形であることに留意されたい。すなわち、2Dランドマークの集合{xi,yi}i=1,…,vを、たとえば目の角、口の角、鼻の先端などの主要な顔特徴の上に配置することができる。これらのランドマークの連結は、イメージの形状観察s=[x1,y1,x2,y2,…,xv,yv]Tを形成する。各イメージが手作業でランドマークのラベルを付けられる顔データベースを与えられて、形状観察の集合全体を、形状モデルのトレーニングデータとして扱うことができる。一実施形態では、形状モデルを、観察集合に対する主成分分析(PCA)を介して学習されたPDM(Point Distribution Model)とすることができる。したがって、学習された生成PDMは、
ここで、(x0,y0)は、平均形状領域内の画素座標46であり、a(p)=[a1(p)a2(p)]は、s0およびs(p)内の各三角形対を関係付ける一意の3×2アフィン変換行列である。形状パラメータpを与えられて、三角形12ごとにa(p)を計算することができる。しかし、各画素(x0,y0)がどの三角形に属するのかの知識は、先験的に既知なので、ワープを、単純なテーブルルックアップを介して効率的に実行することができる。このワープ関数48を使用して、任意の顔イメージ52を平均形状(全体的に、符号50および56によって1画素について表される)にワープすることができ、この顔イメージ52は、符号58によって全体的に表される形状正規化された顔イメージI(W(x;p))をもたらし、外見モデルは、この形状正規化された顔イメージI(W(x;p))から学習される。
位置合わせ学習
外見モデル表現を紹介したので、我々は、これから本技法の外見モデルをどのようにトレーニングするのかに移る。一実施形態では、外見モデルは、モデルあてはめステージ中に使用される位置合わせスコア関数を含み、またはこれからなるものとすることができる。まず、pを、式(1)の形状モデルの現在の位置合わせを表す所与のイメージの形状パラメータとして表すことができる。一実施形態では、外見モデル学習の目標を、ラベルを付けられたトレーニングデータから、pに関して最大化された時に正しい位置合わせの形状パラメータをもたらすようになるスコア関数F(p)を学習することを目指すことと述べることができる。具体的には、この目標を使用して、p0がイメージの正しい位置合わせに対応する形状パラメータである場合に、Fは、
そしてワープされたイメージIi(W(x;pj,i))の集合を、学習用の肯定的トレーニングサンプル(yi=1)として扱うことができる。理想的な移動方向と一緒に、これが、我々のトレーニングセットを構成することができる。
顔位置合わせ
一実施形態で、OGPMを、下で説明する形で、初期形状パラメータp(0)(0回目の反復で)を有する所与のイメージIの顔にあてはめることができる。式(5)に示されているように、位置合わせを、勾配上昇手法を使用することによって反復的に実行することができる。式(3)、(10)、および(14)から、pに関するFの導関数が
実験結果
次の実験結果は、3つの公に使用可能なデータベースすなわち、ND1データベース、FERETデータベース、およびBioIDデータベースからの964個のイメージを含む実験データセットを使用して入手された。964個のイメージのそれぞれが、33個の手作業でラベルを付けられたランドマークを含む。トレーニングプロセスの速度を高めるために、この実験において、イメージセットは、顔の幅がセットにわたって約40画素になるようにダウンサンプリングされた。ND1データベース、FERETデータベース、およびBioIDデータベースのサンプルイメージ134を、それぞれ図12、13、および14に示す。下の表1に示されているように、すべてのイメージが、3つのオーバーラップしないデータセットに区分された。セット1は、2つのデータベースからの400個のイメージ(被験者あたり1つのイメージ)を含んだ。セット2は、セット1内のND1データベースと同一の被験者からの、334個の異なるイメージを含んだ。セット3は、BioIDデータベース内の23人の被験者からの、トレーニングに一度も使用されなかった230個のイメージを含んだ。セット1は、モデル学習用のトレーニングセットとして使用され、3つのセットのすべてが、モデルあてはめをテストするのに使用された。そのような区分の動機づけは、一般化能力のさまざまなレベルを実験することであった。たとえば、セット2を、見られた被験者の見られていないデータとしてテストすることができ、セット3を、見られていない被験者の見られていないデータ(より挑戦的なケースであり、実用応用のシナリオにより似ている)としてテストすることができる。
12 三角形
14 ランドマークポイント
16 線分
20 グラフ
22 グランドトルース形状パラメータ
24 最大値
26 線
28 摂動された形状パラメータ
30 要素
32 勾配方向
34 ベクトル
36 角度
40 グラフ
46 画素座標
48 ワープ関数
52 イメージ観察
58 形状正規化された顔イメージ
70 ワープされたイメージ
72 パラメータ化された特徴
74 特徴タイプ
76 特徴タイプ
78 特徴タイプ
80 特徴タイプ
82 特徴タイプ
84 特徴タイプ
92 概念イメージテンプレートA
96 プロセス
98 サンプル
118 表現
120 上位5個のハール特徴
124 表現
126 次の10個のハール特徴
130 空間密度マップ
134 サンプルイメージ
140 グラフ
150 グラフ
160 ヒストグラム
170 顔分析プロセス
184 プロセッサベースのシステム
186 マイクロコントローラまたはマイクロプロセッサ
188 メモリ
190 マスストレージデバイス
192 入力デバイス
194 ディスプレイ
196 プリンタ
198 通信ネットワーク
Claims (20)
- 人の顔イメージを獲得することと、
システムのプロセッサによって実行されるソフトウェアを介して、前記顔イメージの顔特徴の突き止めを容易にするために包括的顔メッシュを前記顔イメージに位置合わせするのに識別顔位置合わせモデルを使用することであって、前記識別顔位置合わせモデルは、生成形状モデルコンポーネントおよび識別外見モデルコンポーネントを含み、前記識別外見モデルコンポーネントは、所与のイメージの形状パラメータの関数であるスコア関数であって、前記形状パラメータの前記スコア関数の勾配方向と前記形状パラメータの理想的位置合わせ移動方向との間の角度を最小化することを試みる前記スコア関数を推定するために、トレーニングデータを用いてトレーニング済みである、使用することと
を含む方法。 - 前記識別外見モデルコンポーネントは、前記トレーニングデータのすべての形状パラメータpについて
- 前記目的関数を最小化することは、それぞれがそれぞれの単一の長方形顔特徴に作用する弱関数を合計することを含む、請求項2記載の方法。
- 前記プロセッサによって実行される追加ソフトウェアを介して、位置合わせに続いて前記顔イメージに対して顔認識を実行することを含む、請求項1乃至3のいずれかに記載の方法。
- 前記人の前記顔イメージを獲得することは、前記人の前記顔を検出するためにイメージデータを分析することを含む、請求項1乃至4のいずれかに記載の方法。
- 前記トレーニングデータを用いて前記識別外見モデルをトレーニングすることを含む、請求項1記載の方法。
- 勾配上昇を介して前記スコア関数を最適化することを含む、請求項6記載の方法。
- 複数の顔イメージの顔イメージごとにグランドトルース形状パラメータを計算することと、
前記グランドトルース形状パラメータのランダム摂動によって顔イメージごとに複数の変更された顔パラメータを合成することと
を含む、請求項6記載の方法。 - 前記トレーニングデータは、前記変更された形状パラメータに基づくワープされたイメージの集合と、前記ワープされたイメージの理想的移動方向とを含む、請求項8記載の方法。
- 複数のルーチンをその中に格納されたメモリデバイスと、
前記メモリデバイス内に格納された前記複数のルーチンを実行するように構成されたプロセッサであって、前記複数のルーチンは、
トレーニングイメージの集合にアクセスするように構成されたルーチンと、
位置合わせスコア関数の勾配方向と所望の位置合わせへの理想的移動方向との間の角度を最小化する前記位置合わせスコア関数を学習するためにトレーニングイメージの前記集合を使用して外見モデルをトレーニングするように構成されたルーチンと
を含む、プロセッサと
を含むシステム。 - 前記複数のルーチンは、
トレーニングイメージの前記集合のイメージごとにグランドトルース形状パラメータを判定するように構成されたルーチンと、
前記グランドトルース形状パラメータから派生する複数の形状パラメータを合成するように構成されたルーチンと
を含む、請求項10記載のシステム。 - 前記複数の形状パラメータを合成するように構成された前記ルーチンは、ランダム摂動を介して前記複数の形状パラメータを合成するように構成されたルーチンを含む、請求項11記載のシステム。
- 前記外見モデルをトレーニングするように構成された前記ルーチンは、前記位置合わせスコア関数を初期化することと、単一の長方形特徴に作用する複数の弱関数を反復して推定することと、前記複数の弱関数の推定値を前記位置合わせスコア関数に増分的に加算することとによって前記位置合わせスコア関数を学習するルーチンを含む、請求項10または12に記載のシステム。
- 前記複数の弱関数を反復して推定することは、1に関するクラシファイヤ関数の最小二乗距離に基づいて前記複数の弱関数の弱関数をあてはめることを含む、請求項13記載のシステム。
- トレーニングイメージの前記集合は、顔イメージの集合を含み、トレーニングイメージの前記集合にアクセスするように構成された前記ルーチンは、顔イメージの前記集合にアクセスするように構成されたルーチンを含み、トレーニングイメージの前記集合を使用して前記外見モデルをトレーニングするように構成された前記ルーチンは、顔イメージの前記集合を使用して前記外見モデルをトレーニングするように構成されたルーチンを含む、請求項10乃至14のいずれかに記載のシステム。
- 前記メモリデバイスは、光ディスク、ランダムアクセスメモリ、またはハードドライブのうちの少なくとも1つを含む、請求項10乃至15のいずれかに記載のシステム。
- 実行可能命令をその上に格納された1つまたは複数の固定コンピュータ可読媒体であって、前記実行可能命令は、
人間の顔を含むイメージにアクセスするように適合された命令と、
位置合わせスコア関数の勾配方向と前記位置合わせスコア関数の最大値の方向で指すベクトルとの間の角度を最小化する前記位置合わせスコア関数を推定するためにトレーニングされた識別外見モデルを含む識別顔位置合わせモデルを使用して前記人間の顔を位置合わせするように適合された命令と
を含む、1つまたは複数の固定コンピュータ可読媒体。 - 前記1つまたは複数の固定コンピュータ可読媒体は、少なくとも集合的に前記実行可能命令をその上に格納された複数の固定コンピュータ可読媒体を含む、請求項17記載のコンピュータ可読媒体。
- 前記1つまたは複数の固定コンピュータ可読媒体は、光ディスク、磁気ディスク、ソリッドステートディスク、またはそのある組合せを含む、請求項17または18に記載のコンピュータ可読媒体。
- 前記1つまたは複数の固定コンピュータ可読媒体は、コンピュータのランダムアクセスメモリを含む、請求項17乃至19のいずれかに記載のコンピュータ可読媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012098291A JP5953097B2 (ja) | 2012-04-24 | 2012-04-24 | イメージ位置合わせのための最適勾配追求 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012098291A JP5953097B2 (ja) | 2012-04-24 | 2012-04-24 | イメージ位置合わせのための最適勾配追求 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013228765A JP2013228765A (ja) | 2013-11-07 |
JP5953097B2 true JP5953097B2 (ja) | 2016-07-20 |
Family
ID=49676360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012098291A Expired - Fee Related JP5953097B2 (ja) | 2012-04-24 | 2012-04-24 | イメージ位置合わせのための最適勾配追求 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5953097B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102381687B1 (ko) * | 2015-07-30 | 2022-03-31 | 인텔 코포레이션 | 감정 증강형 아바타 애니메이션 |
US9633250B2 (en) * | 2015-09-21 | 2017-04-25 | Mitsubishi Electric Research Laboratories, Inc. | Method for estimating locations of facial landmarks in an image of a face using globally aligned regression |
CN109902546B (zh) * | 2018-05-28 | 2020-11-06 | 华为技术有限公司 | 人脸识别方法、装置及计算机可读介质 |
CN108986016B (zh) * | 2018-06-28 | 2021-04-20 | 北京微播视界科技有限公司 | 图像美化方法、装置及电子设备 |
KR102422779B1 (ko) * | 2019-12-31 | 2022-07-21 | 주식회사 하이퍼커넥트 | 랜드마크 분리 장치, 방법 및 컴퓨터 판독 가능한 기록매체 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8155399B2 (en) * | 2007-06-12 | 2012-04-10 | Utc Fire & Security Corporation | Generic face alignment via boosting |
US8208717B2 (en) * | 2009-02-25 | 2012-06-26 | Seiko Epson Corporation | Combining subcomponent models for object image modeling |
JP2010244251A (ja) * | 2009-04-03 | 2010-10-28 | Seiko Epson Corp | 顔の特徴部位の座標位置を検出する画像処理装置 |
-
2012
- 2012-04-24 JP JP2012098291A patent/JP5953097B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013228765A (ja) | 2013-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8768100B2 (en) | Optimal gradient pursuit for image alignment | |
Prince et al. | Probabilistic models for inference about identity | |
Vock et al. | Fast template matching and pose estimation in 3D point clouds | |
Liang et al. | Face alignment via component-based discriminative search | |
US10380413B2 (en) | System and method for pose-invariant face alignment | |
Mohammadzade et al. | Iterative closest normal point for 3D face recognition | |
KR101304374B1 (ko) | 객체 특징을 위치결정하는 방법 | |
US8422797B2 (en) | Object recognition with 3D models | |
KR100647322B1 (ko) | 객체의 모양모델 생성장치 및 방법과 이를 이용한 객체의특징점 자동탐색장치 및 방법 | |
Hinterstoisser et al. | Learning real-time perspective patch rectification | |
JP5953097B2 (ja) | イメージ位置合わせのための最適勾配追求 | |
CN111340932A (zh) | 图像处理方法以及信息处理设备 | |
Seshadri et al. | An analysis of the sensitivity of active shape models to initialization when applied to automatic facial landmarking | |
Tong et al. | Automatic facial landmark labeling with minimal supervision | |
Pérez-Villar et al. | Spacecraft pose estimation based on unsupervised domain adaptation and on a 3d-guided loss combination | |
Sang et al. | Robust non-rigid point registration based on feature-dependant finite mixture model | |
Tong et al. | Semi-supervised facial landmark annotation | |
WO2005122066A1 (en) | Support vector classification with bounded uncertainties in input data | |
Yang et al. | Tracking nonstationary visual appearances by data-driven adaptation | |
Su | Statistical shape modelling: automatic shape model building | |
KR20130121360A (ko) | 이미지 정렬에 대한 최적 그래디언트 추적 | |
Chou et al. | A robust real-time facial alignment system with facial landmarks detection and rectification for multimedia applications | |
Fan et al. | A landmark-free approach for automatic, dense and robust correspondence of 3D faces | |
Turmukhambetov et al. | Modeling object appearance using context-conditioned component analysis | |
Shin et al. | Robust face alignment and tracking by combining local search and global fitting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160315 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5953097 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |