JP5118616B2 - 顔画像検出装置及び顔画像検出プログラム - Google Patents
顔画像検出装置及び顔画像検出プログラム Download PDFInfo
- Publication number
- JP5118616B2 JP5118616B2 JP2008321543A JP2008321543A JP5118616B2 JP 5118616 B2 JP5118616 B2 JP 5118616B2 JP 2008321543 A JP2008321543 A JP 2008321543A JP 2008321543 A JP2008321543 A JP 2008321543A JP 5118616 B2 JP5118616 B2 JP 5118616B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- area
- distribution
- image
- face image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Description
栗田多喜夫 他,"顔の位置に関する事前確率の適応的な推定とIsing探索を用いたニュース映像からの顔検出の高速化",電子情報通信学会技術報告,PRMU2000−81,pp.43−50,2000年.
本発明は、例えば被写体をカメラで撮影する際の構図等に関する定性的な傾向を、被写体の画像平面上での中心位置と大きさについての確率分布の形で表現し、それにより新たに与えられた画像に出現する被写体の事前確率を、当該確率分布で予測することにより、被写体の出現の可能性が低いパラメータ空間を探索の対象から除外することによって、顔検索処理の計算コストを効率的に削減し、高速に高精度な顔画像検出を実現する。なお、本発明では、確率分布に付随する各種パラメータを自動的に決定することができる学習アルゴリズムを用いる。
本発明では、顔候補領域の中心位置(x,y)及び大きさrの3つの要素で構成されるベクトルu=(x、y、r)を確率変数と捉え、画像データDが与えられたもとでのuの事後確率分布P(u|D)は、ベイズ公式より以下に示す(1)式で与えられる。
次に、上述した特徴を有する本発明における顔画像検出装置及び顔画像検出プログラムを好適に実施した形態について、図面を用いて説明する。
顔分布推定手段11における処理手順について、具体的に説明する。顔分布推定手段11では、まず予め設定される顔領域サンプルデータ{u1,・・・,uN}を受け取る。次に、パラメータVk,mk,Σkについて、初期値として適当な値を設定する。
次に、記録手段12における処理手順について、具体的に説明する。まず、事前に顔分布推定手段11が出力した顔領域予測パラメータを記録する。次に、事前に与えられる予め設定された顔画像判別パラメータを記録する。
次に、顔領域探索手段13における処理手順について、具体的に説明する。まず、顔画像検出装置10のシステム起動時に、記録手段12から顔領域予測パラメータを読み込む。
次に、顔画像判別手段14における処理手順について、具体的に説明する。まず、顔画像検出装置10のシステム起動時に、記録手段12から顔画像判別パラメータを読み込む。また、顔領域探索手段13から送られる各々の顔候補領域画像データについて、予め与えられた顔画像判別パラメータをもとに基づいて算出される尤度P(D|u)の値に基づいて顔であるか否かを判別し、その結果(顔領域判別結果)を顔領域探索手段13に出力する。
次に、上述した顔分布推定手段11における顔分布推定の一例について、具体的に説明する。本発明では、当該確率分布に関する全てのパラメータを確率変数とみなし、それぞれの確率変数を顔領域のサンプルデータをもとに統計的学習アルゴリズムにより最適化する。具体的には、顔の出現領域(中心位置と大きさ)を決定する三次元ベクトルuについて、その確率分布を混合正規分布で表現し、当該確率分布の個々の要素の平均値、分散、及び混合数を、ディリクレ過程EMアルゴリズムにより学習する。
Σk〜IW(Σ;n0,R0) ・・・(5)
但し、上述した(4)式に示すN(・)は、以下に示す(6)式の正規分布を表す。
Vk〜Beta(1,α) ・・・(10)
ここで、上述した(3)〜(10)式で定義される混合正規分布のコンポーネント(混合)数は、理論上は無限大に設定すべきであるが、実際に計算機で計算する際は、ある自然数Kで打ち切る必要がある。このとき、設定するKの値の増大と共に推定誤差が激減することが知られており、例えば多くの応用においてK=100とした場合の推定誤差が実用上無視できる程度に小さくなる場合が多い。
ここで、ディリクレ過程EMアルゴリズムについて説明する。まず、各パラメータの初期値Vk (0),mk (0),Σk (0)を設定する。次に、上述した(11)式に示すQ関数が収束するまで次の2つのステップ(E−step、M−step)を交互に繰り返し行う。但し、インデックスiは、更新ステップ数を表す。
ここで、上述した顔画像検出装置10は、上述した専用の装置構成により本発明における顔画像検出処理を行うこともできるが、顔画像検出装置10の一部、例えば、顔分布推定手段11、記録手段12、顔領域探索手段13、及び顔画像判別手段14等における各機能をコンピュータで実現するようにしてもよい。
次に、本発明における実行プログラムによる顔画像検出処理手順についてフローチャートを用いて説明する。
図3は、本実施形態における顔画像検出処理手順の一例を示すフローチャートである。図3において、まず予め設定される顔領域サンプルデータ{u1,・・・,uN}を入力する(S01)。次に、パラメータVk,mk,Σkについて、初期値として適当な値を設定する(S02)。
次に、本発明を用いた顔検出の評価結果について説明する。図4は、顔画像検出結果の具体例を示す図である。なお、図4(a)は従来における顔検出手法を示し、図4(b)は本願発明における顔検出手法を示す図である。また、図4(a),(b)には、1画面中における探索領域21の一部が示されており、実際には、動画として、複数枚の画像フレームにおいて探索領域21が示される。
11 顔分布推定手段
12 記録手段
13 顔領域探索手段
14 顔画像判別手段
21 探索領域
Claims (6)
- 連続する映像を構成する各画像に含まれる顔領域の位置を検出する顔画像検出装置において、
入力される顔領域サンプルデータから顔の出現分布を推定する顔分布推定手段と、
前記顔分布推定手段により得られる顔領域予測パラメータに基づいて顔画像を検出する対象となる入力画像データに対して顔検出のための顔領域を探索する顔領域探索手段と、
前記顔領域探索手段により得られる顔候補領域画像データと、顔画像判別パラメータとを用いて、顔候補領域に顔が存在しているか否かを判別する顔画像判別手段とを有し、
前記顔領域探索手段は、前記顔領域予測パラメータに基づいて、前記各画像に対して中心位置と大きさとが異なる顔候補領域を所定数抽出し、抽出により得られる顔候補領域画像データを前記顔画像判別手段に出力し、前記顔画像判別手段により得られる前記各画像の顔領域判別結果を統合して最終的な顔検出結果を出力することを特徴とする顔画像検出装置。 - 前記顔分布推定手段は、
前記入力画像データの内容に関する情報が予め設定された属性情報を入力し、入力された属性情報に一意に対応する前記顔の出現傾向を確率分布で表現して前記顔の出現分布を推定することを特徴とする請求項1に記載の顔画像検出装置。 - 前記顔分布推定手段は、
前記顔の出現分布を推定する確率分布をディリクレ過程による生成モデルで表現し、前記確率分布で用いられる内部変数を、前記顔領域サンプルデータから得られる予め設定された顔の出現位置及び大きさに関する学習サンプルに基づいて推定することを特徴とする請求項1又は2に記載の顔画像検出装置。 - 前記顔分布推定手段は、
前記顔の出現分布を推定する確率分布を混合正規分布で定義することを特徴とする請求項1乃至3の何れか1項に記載の顔画像検出装置。 - 前記顔分布推定手段は、
前記混合正規分布の混合数を決定する混合数決定手段を有することを特徴とする請求項4に記載の顔画像検出装置。 - 連続する映像を構成する各画像に含まれる顔領域の位置を検出する顔画像検出処理をコンピュータに実行させるための顔画像検出プログラムにおいて、
コンピュータを、
入力される顔領域サンプルデータから顔の出現分布を推定する顔分布推定手段、
前記顔分布推定手段により得られる顔領域予測パラメータに基づいて顔画像を検出する対象となる入力画像データに対して顔検出のための顔領域を探索する顔領域探索手段、及び、
前記顔領域探索手段により得られる顔候補領域画像データと、顔画像判別パラメータとを用いて、顔候補領域に顔が存在しているか否かを判別する顔画像判別手段として機能させ、
前記顔領域探索手段は、前記顔領域予測パラメータに基づいて、前記各画像に対して中心位置と大きさとが異なる顔候補領域を所定数抽出し、抽出により得られる顔候補領域画像データを前記顔画像判別手段に出力し、前記顔画像判別手段により得られる前記各画像の顔領域判別結果を統合して最終的な顔検出結果を出力することを特徴とする顔画像検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008321543A JP5118616B2 (ja) | 2008-12-17 | 2008-12-17 | 顔画像検出装置及び顔画像検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008321543A JP5118616B2 (ja) | 2008-12-17 | 2008-12-17 | 顔画像検出装置及び顔画像検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010146211A JP2010146211A (ja) | 2010-07-01 |
JP5118616B2 true JP5118616B2 (ja) | 2013-01-16 |
Family
ID=42566604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008321543A Expired - Fee Related JP5118616B2 (ja) | 2008-12-17 | 2008-12-17 | 顔画像検出装置及び顔画像検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5118616B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6383639B2 (ja) * | 2014-10-29 | 2018-08-29 | 日本電信電話株式会社 | 画像処理装置及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4208898B2 (ja) * | 2006-06-09 | 2009-01-14 | 株式会社ソニー・コンピュータエンタテインメント | 対象物追跡装置および対象物追跡方法 |
-
2008
- 2008-12-17 JP JP2008321543A patent/JP5118616B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010146211A (ja) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020221278A1 (zh) | 视频分类方法及其模型的训练方法、装置和电子设备 | |
CN109598231B (zh) | 一种视频水印的识别方法、装置、设备及存储介质 | |
WO2021203863A1 (zh) | 基于人工智能的物体检测方法、装置、设备及存储介质 | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US8358837B2 (en) | Apparatus and methods for detecting adult videos | |
Gaidon et al. | Actom sequence models for efficient action detection | |
Gaidon et al. | Temporal localization of actions with actoms | |
JP7222319B2 (ja) | 分類モデル訓練方法及び装置並びに分類方法及び装置 | |
JP5570629B2 (ja) | 分類器の学習方法及び装置、並びに処理装置 | |
CN110942011B (zh) | 一种视频事件识别方法、系统、电子设备及介质 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
US20230237771A1 (en) | Self-supervised learning method and apparatus for image features, device, and storage medium | |
CN112465020B (zh) | 训练数据集的生成方法及装置、电子设备、存储介质 | |
CN113766330A (zh) | 基于视频生成推荐信息的方法和装置 | |
JP5214679B2 (ja) | 学習装置、方法及びプログラム | |
CN111738319B (zh) | 一种基于大规模样本的聚类结果评价方法及装置 | |
JP2006344236A (ja) | 顔メタデータ生成方法および装置、並びに顔認識方法およびシステム | |
KR102350192B1 (ko) | 검색 데이터베이스를 구축하기 위한 관심영상 선별 방법 및 이를 수행하는 영상 관제 시스템 | |
Jayanthiladevi et al. | Text, images, and video analytics for fog computing | |
CN110717407A (zh) | 基于唇语密码的人脸识别方法、装置及存储介质 | |
CN111191781A (zh) | 训练神经网络的方法、对象识别方法和设备以及介质 | |
JP5118616B2 (ja) | 顔画像検出装置及び顔画像検出プログラム | |
CN111640438A (zh) | 音频数据处理方法、装置、存储介质及电子设备 | |
Handrich et al. | Simultaneous prediction of valence/arousal and emotion categories in real-time | |
JP2017084006A (ja) | 画像処理装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120724 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120925 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121019 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5118616 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151026 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |