JP4928193B2 - 顔画像認識装置及び顔画像認識プログラム - Google Patents
顔画像認識装置及び顔画像認識プログラム Download PDFInfo
- Publication number
- JP4928193B2 JP4928193B2 JP2006221850A JP2006221850A JP4928193B2 JP 4928193 B2 JP4928193 B2 JP 4928193B2 JP 2006221850 A JP2006221850 A JP 2006221850A JP 2006221850 A JP2006221850 A JP 2006221850A JP 4928193 B2 JP4928193 B2 JP 4928193B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- face image
- image recognition
- particles
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Collating Specific Patterns (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
松井淳 他,"ハミルトニアモンテカルロ法によるBayes的画像認識",映像情報メディア学会誌 Vol.59,No.8,pp.1183〜1190,2005年.
本発明は、例えば動画像又は連続静止画像(映像を含む)等のように、ある人物の顔を連続的に撮影した画像の組(以下、「入力画像」という)が、撮影時刻の順に一枚ずつ与えられる場合において、予め与えられた複数の人物の顔画像(以下、「登録顔画像」という)の中から入力画像に含まれる顔と最も類似するものを探し、その結果として、例えばその人物を特定する人物識別情報としてのラベル(以下、「人物ID」という)を逐次出力する。
上述した(1)式の右辺、分子の第1項は時刻nにおける顔テンプレートHjのモデル周辺尤度P(yn|y1:n−1,Hj)を示しており、以下の(2)式に示す更新式で定義される。
次に、本発明におけるモデル周辺尤度に基づく粒子数の動的制御について説明する。本発明における逐次モンテカルロ法では、粒子の重みの分散が時間の経過と共に発散することを防止するため、毎時刻あるいは一定の時間間隔等の予め設定された条件による所定のタイミングで、粒子をその重みの大きさに応じて複製又は消滅する操作(再抽出処理)を行う。
次に、上述した特徴を有する本発明における顔画像認識装置及び顔画像認識プログラムを好適に実施した形態について、図面を用いて説明する。
顔データ作成装置10は、予め入力画像に出現することが予想される人物の顔画像(登録顔画像)と、個々の人物を区別するための人物識別情報としての人物ID、個々の人物の顔の変形の統計的性質を表現する表情サンプル画像と、登録顔画像及び表情サンプル画像のそれぞれの顔の各器官(目、鼻、口)の位置を記録した特徴点配置情報とから、個々の顔の静的な情報を記録した顔テンプレートと、個々の顔の動的な情報を記録した顔変形データを作成する。また、顔データ作成装置10は、作成した顔テンプレート及び顔変形データを記録する。
顔画像認識特定装置20は、顔データ作成装置10が事前に作成し保存した顔テンプレートと顔変形データを利用して、逐次的に与えられる連続した入力画像から顔認識結果を出力する。つまり、顔画像認識装置20は、記録部13に保存されている顔テンプレートと顔変形データから決定される提案分布π(xn)を用いて、特徴点配置のサンプル{xn (i)}i=1 Njを抽出する。
ここで、本実施形態における顔画像認識について具体的に説明する。上述したように、顔データ作成装置10にて作成された顔テンプレートは、登録顔画像上に定義したN個の特徴点(上述した図2ではN=9)の配置xA∈R2×N、各特徴点におけるK個の方位、R段階の解像度のガボール・ウェーブレット係数cA∈CN×K×R、及び人物IDから構成される。
とおき、各特徴点の位置xnで計算したガボール・ウェーブレット係数をcB∈CN×K×Rとおく。ここで、従来手法としては、cA,cBの間の類似度を各々の解像度rに関する成分ベクトルcr A,cr B毎に定義し、各々のノルム(例えば、ユークリッドノルム等)で正規化したもとでの内積で評価しているが、これは各解像度rについてのベクトルcr Bを指向性データとみなすことを意味する。
次に、本実施形態における粒子の再抽出例について具体的に説明する。逐次モンテカルロ法では、上述した時間の経過と共に増大する補正用の重みの分散を抑制するために、画像が入力される毎時刻あるいは予め設定された一定の時間間隔等の予め設定された条件に基づく所定のタイミングで粒子の再抽出(リサンプル)が行われる。
ここで、上述した顔画像認識装置1は、上述した専用の装置構成等を用いて本発明における顔画像認識処理を行うこともできるが、各構成における処理をコンピュータに実行させるための実行プログラムを生成し、例えば汎用のパーソナルコンピュータ、サーバ等にそのプログラムをインストールすることにより、本発明に係る顔画像認識処理を実現することができる。
ここで、本発明における顔画像認識処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図3は、本発明における顔画像認識処理が実現可能なハードウェア構成の一例を示す図である。
次に、本発明における実行プログラム(顔画像認識プログラム)を用いた顔画像認識処理手順についてフローチャートを用いて説明する。図4は、顔画像認識処理手順の一例を示すフローチャートである。
次に、本発明を用いた顔認識の評価結果について説明する。本発明における顔認識手法(以下、Pruned Resamplingという)の有効性を検証するため、従来手法である(Residual Resampling)を比較対象とした認識実験を行った。
ここで、実験に用いるデータとして、評価データ、登録データ、学習データの3種類を用意した。なお、本装置(システム)に逐次的に与える入力データy1:nとして用いる評価データとして、10人の被験者それぞれについての発話時の顔の連続画像(1秒間)を用意した。
ここで、図5は、本手法と従来手法のリサンプルアルゴリズムによる比較結果の一例を示す図である。図5に示すように、本手法(Pruned Resampling)が従来手法(Residual Resampling)のリサンプルアルゴリズム(Resample algorithm)において、顔画像認識結果として出力される人物IDの不正解率は共に2.3%である。また、図5に示すように本手法では、同じ認識性能(ID Error Rate)を約半分の処理時間(従来手法:2329sec、本手法:1135sec)で実現することができる。
10 顔データ作成装置
11 顔画像登録部
12 顔変形データ抽出部
13 記録部
20 顔画像認識特定装置
21 顔画像検出部
22 顔画像認識部
30 特徴点
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 メモリ装置
46 CPU
47 ネットワーク接続装置
48 記録媒体
Claims (5)
- 予め登録される登録顔画像と該登録顔画像の表情の異なる複数の画像とを用いて、入力画像に含まれる顔画像の人物を特定するための顔画像認識装置において、
前記登録顔画像の特徴点配置情報と人物識別情報とを、前記登録顔画像に対応付けて顔テンプレートとして登録する顔画像登録部と、
前記顔画像登録部により登録された人物の表情の異なる複数の顔画像と、前記人物識別情報とから顔変形データを抽出する顔変形データ抽出部と、
前記顔テンプレートと前記顔変形データとに基づいて、顔認識に用いられる所定のパラメータの確率分布を逐次モンテカルロ法を用いて更新しながら、前記入力画像に含まれる顔画像の人物を特定する顔画像認識部とを有し、
前記顔画像認識部は、予め設定された条件に基づいて前記パラメータのサンプルと該サンプルの重みとを含む粒子の総数を調整しつつ粒子の再抽出を行い、
更に前記顔画像認識部は、前記逐次モンテカルロ法における粒子の再抽出において、前記顔テンプレートのモデル周辺尤度を利用して、事後確率分布の最大値を与えるモデルに割り当てる粒子の数を一定とする条件のもとで前記粒子の再抽出を行うことを特徴とする顔画像認識装置。 - 前記顔画像認識部は、
前記入力画像が入力される毎時刻あるいは予め設定された時間間隔毎に粒子の再抽出を行うことを特徴とする請求項1に記載の顔画像認識装置。 - 前記顔画像認識部は、
同一人物を連続して撮影した入力画像の顔画像認識を行う際、前記入力画像毎に前記パラメータの確率分布を逐次学習することを特徴とする請求項1又は2に記載の顔画像認識装置。 - 前記入力画像から顔の中心位置及び大きさを含む顔領域情報を検出する顔画像検出部を有し、
前記顔画像認識部は、前記顔領域情報に基づいて顔画像認識を行うことを特徴とする請求項1乃至3の何れか1項に記載の顔画像認識装置。 - コンピュータを、請求項1乃至4の何れか1項に記載の顔画像認識装置が有する各手段として機能させるための顔画像認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006221850A JP4928193B2 (ja) | 2006-08-16 | 2006-08-16 | 顔画像認識装置及び顔画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006221850A JP4928193B2 (ja) | 2006-08-16 | 2006-08-16 | 顔画像認識装置及び顔画像認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008046864A JP2008046864A (ja) | 2008-02-28 |
JP4928193B2 true JP4928193B2 (ja) | 2012-05-09 |
Family
ID=39180556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006221850A Expired - Fee Related JP4928193B2 (ja) | 2006-08-16 | 2006-08-16 | 顔画像認識装置及び顔画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4928193B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8231559B2 (en) | 2006-07-03 | 2012-07-31 | Nitto Kohki Co., Ltd. | Pneumatic massage device |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5096211B2 (ja) * | 2008-03-31 | 2012-12-12 | 富士フイルム株式会社 | 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム |
EP2564353A1 (en) | 2010-04-30 | 2013-03-06 | Vucomp, Inc. | Spiculated malignant mass detection and classification in radiographic image |
CN108280422B (zh) * | 2018-01-22 | 2022-06-14 | 百度在线网络技术(北京)有限公司 | 用于识别人脸的方法和装置 |
CN109766857A (zh) * | 2019-01-16 | 2019-05-17 | 嘉兴学院 | 一种基于语义对齐多区域模板融合的三维人脸识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4382597B2 (ja) * | 2003-07-10 | 2009-12-16 | 株式会社国際電気通信基礎技術研究所 | 推定装置、推定方法および推定プログラム |
JP4348202B2 (ja) * | 2004-01-21 | 2009-10-21 | 日本放送協会 | 顔画像認識装置及び顔画像認識プログラム |
-
2006
- 2006-08-16 JP JP2006221850A patent/JP4928193B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8231559B2 (en) | 2006-07-03 | 2012-07-31 | Nitto Kohki Co., Ltd. | Pneumatic massage device |
Also Published As
Publication number | Publication date |
---|---|
JP2008046864A (ja) | 2008-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fuhl et al. | Fully convolutional neural networks for raw eye tracking data segmentation, generation, and reconstruction | |
JP7306062B2 (ja) | ナレッジ・トランスファー方法、情報処理装置及び記憶媒体 | |
CN111160533B (zh) | 一种基于跨分辨率知识蒸馏的神经网络加速方法 | |
JP5552519B2 (ja) | 顔特徴ベクトルの構築 | |
Sadjadi et al. | The IBM 2016 speaker recognition system | |
JP2022141931A (ja) | 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
US20240185604A1 (en) | System and method for predicting formation in sports | |
JP2005327076A (ja) | パラメタ推定方法、パラメタ推定装置および照合方法 | |
CN110929802A (zh) | 基于信息熵的细分类识别模型训练、图像识别方法及装置 | |
JP4928193B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
Jachimski et al. | A comparative study of English viseme recognition methods and algorithms | |
JP5704692B2 (ja) | パターン分類装置の学習装置及びそのためのコンピュータプログラム | |
Shi et al. | Sparse bilinear logistic regression | |
US10546246B2 (en) | Enhanced kernel representation for processing multimodal data | |
Oliveira et al. | A comparison between end-to-end approaches and feature extraction based approaches for sign language recognition | |
JP2007249394A (ja) | 顔画像認識装置及び顔画像認識プログラム | |
JPWO2019215904A1 (ja) | 予測モデル作成装置、予測モデル作成方法、および予測モデル作成プログラム | |
JP7103235B2 (ja) | パラメタ算出装置、パラメタ算出方法、及び、パラメタ算出プログラム | |
Kelly et al. | Recognition of spatiotemporal gestures in sign language using gesture threshold hmms | |
Salem et al. | Facial features detection: a comparative study | |
Zamzami et al. | An accurate evaluation of msd log-likelihood and its application in human action recognition | |
CN106845386B (zh) | 一种基于动态时间规整与多核学习的动作识别方法 | |
Su et al. | Learning low-dimensional temporal representations with latent alignments | |
Hammer et al. | How to visualize large data sets? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120117 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4928193 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |