JP4881272B2 - 顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム - Google Patents
顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム Download PDFInfo
- Publication number
- JP4881272B2 JP4881272B2 JP2007260365A JP2007260365A JP4881272B2 JP 4881272 B2 JP4881272 B2 JP 4881272B2 JP 2007260365 A JP2007260365 A JP 2007260365A JP 2007260365 A JP2007260365 A JP 2007260365A JP 4881272 B2 JP4881272 B2 JP 4881272B2
- Authority
- JP
- Japan
- Prior art keywords
- face area
- face
- prediction
- discontinuity
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
M.Isard and A.Blake,"ICONDENSATION:Unifying low−level and high−level tracking in a stochastic framework,"Proc. of European Conference on Computer Vision,vol.1,pp.893−908,1998年)
本発明は、入力映像の各時刻における顔領域を検出する場合において、過去の検出結果の履歴と、動画像の連続性を仮定した予測モデルを用いて未来の時刻における顔領域を予測し、検証すべき対象である顔領域の候補を確率的な可能性の高い部分領域に絞り込むことによって、処理全体の計算コストを効果的に削減し、処理時間の削減を実現する。
本発明では、顔候補領域の中心位置(x,y)及び大きさrの時刻tにおける値で構成されるベクトルut=(xt,yt,rt)を確率変数と捉え、時刻tまでに与えられた画像の系列:D1:t=(D1,D2,・・・,Dt)に対応するutの系列u0:t=(u0,u1,・・・,ut)の事後確率分布P(u0:t|D1:t)を推定する。
次に、上述した特徴を有する本発明における顔画像検出装置、顔画像検出方法、及び顔画像検出プログラムを好適に実施した形態について、図面を用いて説明する。
まず、顔領域予測部30における顔領域予測処理手順についてフローチャートを用いて説明する。図5は、顔領域予測処理手順の一例を示すフローチャートである。
<顔領域探索部40における顔領域探索処理手順>
次に、顔領域探索部40における顔領域探索処理手順についてフローチャートを用いて説明する。図6は、顔領域探索処理手順の一例を示すフローチャートである。
次に、顔領域探索結果統合部50における顔領域探索結果統合処理手順についてフローチャートを用いて説明する。図7は、顔領域探索結果統合処理手順の一例を示すフローチャートである。
次に、不連続性判定部60における不連続性判定処理手順についてフローチャートを用いて説明する。図8は、不連続性判定処理手順の一例を示すフローチャートである。
ここで、上述した顔画像検出装置1は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータを表示する表示部、並びに外部と通信するためのインタフェイスを備えたコンピュータによって構成することができる。
図9は、本実施形態における顔画像検出処理手順の一例を示すフローチャートである。なお、後述する処理手順においては、記録媒体部に予め設定される顔領域を予測するための顔領域予測パラメータΣや、与えられた画像が顔である可能性を定量的に評価するための顔検出パラメータΘ、入力映像信号に含まれる編集点等の時間的不連続点を検知するための不連続性判定パラメータε等の各種情報が記録されている。
ここで、本発明手法と、従来手法との比較例について説明する。図10は、本発明手法と、従来手法との比較例の一例を示す図である。なお、以下に示す説明においては、本発明手法(以下、Proposedと呼ぶ)の有効性を検証するため、OpenCV(以下、Baselineと呼ぶ)との比較実験を例にする。
10 記録媒体部
20 画像取得部
30 顔領域予測部
40 顔領域探索部
50 顔領域統合部
60 不連続性判定部
Claims (3)
- 入力映像の各時刻における顔領域を検出する顔画像検出装置において、
予め設定される顔領域を予測するための顔領域予測パラメータ、与えられた画像が顔である可能性を定量的に評価するための顔検出パラメータ、及び、入力映像信号に含まれる編集点等の時間的不連続点を検知するための不連続性判定パラメータを少なくとも記録する記録部と、
与えられた入力映像信号から静止画像データを取得する画像取得部と、
前記顔領域予測パラメータを用いて前記静止画像データから顔領域を予測する顔領域予測部と、
前記顔領域予測部により予測された顔領域予測結果に基づいて顔領域を探索する顔領域探索部と、
前記顔領域探索部より得られる顔領域から算出される周辺尤度を用いた入力画像の連続性を示す連続性評価値と、前記記録部により記録された不連続性判定パラメータとに基づいて、顔画像の不連続性を判定する不連続性判定部と、
前記顔領域探索部により得られる顔領域探索結果から前記静止画像データに存在するある1つの顔に対して探索された複数の顔領域を統合して1つの顔領域を生成する顔領域統合部とを有し、
前記顔領域予測部は、連続区間を対象とした顔領域の予測と、不連続点における予測確率分布の再初期化による顔領域の予測とを前記不連続性判定部により得られる不連続点の検知結果に基づき、切り替えて顔領域の予測を行い、
前記顔領域探索部は、前記顔領域統合部より得られる顔領域統合結果に基づいて個々の顔領域についての前記周辺尤度を計算することを特徴とする顔画像検出装置。 - 入力映像の各時刻における顔領域を検出するための顔画像検出方法において、
与えられた入力映像信号から静止画像データを取得する画像取得ステップと、
予め設定される顔領域を予測するための顔領域予測パラメータを用いて前記静止画像データから顔領域を予測する顔領域予測ステップと、
前記顔領域予測ステップにより予測された顔領域予測結果に基づいて顔領域を探索する顔領域探索ステップと、
前記顔領域探索ステップより得られる顔領域から算出される周辺尤度を用いた入力画像の連続性を示す連続性評価値と、入力映像信号に含まれる編集点等の時間的不連続点を検知するための不連続性判定パラメータとに基づいて顔画像の不連続性を判定する不連続性判定ステップと、
前記顔領域探索ステップにより得られる顔領域探索結果から前記静止画像データに存在するある1つの顔に対して探索された複数の顔領域を統合して1つの顔領域を生成する顔領域統合ステップとを有し、
前記顔領域予測ステップは、連続区間を対象とした顔領域の予測と、不連続点における予測確率分布の再初期化による顔領域の予測とを前記不連続性判定ステップにより得られる不連続点の検知結果に基づき、切り替えて顔領域の予測を行い、
前記顔領域探索ステップは、前記顔領域統合ステップより得られる顔領域統合結果に基づいて個々の顔領域についての前記周辺尤度を計算することを特徴とする顔画像検出方法。 - 入力映像の各時刻における顔領域を検出する顔画像検出プログラムにおいて、
コンピュータを、
予め設定される顔領域を予測するための顔領域予測パラメータ、与えられた画像が顔である可能性を定量的に評価するための顔検出パラメータ、及び、入力映像信号に含まれる編集点等の時間的不連続点を検知するための不連続性判定パラメータを少なくとも記録する記録手段、
与えられた入力映像信号から静止画像データを取得する画像取得手段、
前記顔領域予測パラメータを用いて前記静止画像データから顔領域を予測する顔領域予測手段、
前記顔領域予測手段により予測された顔領域予測結果に基づいて顔領域を探索する顔領域探索手段、
前記顔領域探索手段より得られる顔領域から算出される周辺尤度を用いた入力画像の連続性を示す連続性評価値と、前記記録手段により記録された不連続性判定パラメータとに基づいて、顔画像の不連続性を判定する不連続性判定手段、及び、
前記顔領域探索手段により得られる顔領域探索結果から前記静止画像データに存在するある1つの顔に対して探索された複数の顔領域を統合して1つの顔領域を生成する顔領域統合手段として機能させ、
前記顔領域予測手段は、連続区間を対象とした顔領域の予測と、不連続点における予測確率分布の再初期化による顔領域の予測とを前記不連続性判定手段により得られる不連続点の検知結果に基づき、切り替えて顔領域の予測を行い、
前記顔領域探索手段は、前記顔領域統合手段より得られる顔領域統合結果に基づいて個々の顔領域についての前記周辺尤度を計算することを特徴とする顔画像検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007260365A JP4881272B2 (ja) | 2007-10-03 | 2007-10-03 | 顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007260365A JP4881272B2 (ja) | 2007-10-03 | 2007-10-03 | 顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009093230A JP2009093230A (ja) | 2009-04-30 |
JP4881272B2 true JP4881272B2 (ja) | 2012-02-22 |
Family
ID=40665204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007260365A Expired - Fee Related JP4881272B2 (ja) | 2007-10-03 | 2007-10-03 | 顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4881272B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5096211B2 (ja) * | 2008-03-31 | 2012-12-12 | 富士フイルム株式会社 | 確率分布構築方法、確率分布構築装置、および確率分布構築プログラム、並びに被写体検出方法、被写体検出装置、および被写体検出プログラム |
JP5719230B2 (ja) * | 2011-05-10 | 2015-05-13 | キヤノン株式会社 | 物体認識装置、物体認識装置の制御方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6546117B1 (en) * | 1999-06-10 | 2003-04-08 | University Of Washington | Video object segmentation using active contour modelling with global relaxation |
-
2007
- 2007-10-03 JP JP2007260365A patent/JP4881272B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009093230A (ja) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020146501A1 (en) | Surgical workflow and activity detection based on surgical videos | |
Zliobaite et al. | Adaptive preprocessing for streaming data | |
US20170236055A1 (en) | Accurate tag relevance prediction for image search | |
JP4132589B2 (ja) | オーディオ・ストリームにおけるスピーカを追跡するための方法及び装置 | |
CN111373417A (zh) | 与基于度量学习的数据分类相关的设备及其方法 | |
CN107077609B (zh) | 用于检测在空间上不同的时间模式的非参数化模型 | |
JP2017228068A (ja) | 機械学習管理プログラム、機械学習管理方法および機械学習管理装置 | |
JP5235691B2 (ja) | 情報処理装置及び情報処理方法 | |
KR20060129366A (ko) | 온라인 학습을 통한 연속적 안면 인식 | |
US11825278B2 (en) | Device and method for auto audio and video focusing | |
JP2009110503A (ja) | 対話システムにおける統計的分類のための最適な選択戦略の方法及びシステム | |
US20190156125A1 (en) | Characterizing Content with a Predictive Error Representation | |
Bermingham et al. | A probabilistic stop and move classifier for noisy GPS trajectories | |
US20050246317A1 (en) | Matching engine | |
CN113380413A (zh) | 一种构建无效再通fr预测模型的方法和装置 | |
CN113963303A (zh) | 图像处理方法、视频识别方法、装置、设备及存储介质 | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
CN115063664A (zh) | 用于工业视觉检测的模型学习方法、训练方法及系统 | |
US9330662B2 (en) | Pattern classifier device, pattern classifying method, computer program product, learning device, and learning method | |
JP4881272B2 (ja) | 顔画像検出装置、顔画像検出方法、及び顔画像検出プログラム | |
US11354936B1 (en) | Incremental clustering for face recognition systems | |
KR102339478B1 (ko) | Dna 정보를 이용한 얼굴 추정 방법, 이를 수행하기 위한 기록 매체 및 장치 | |
AU2021251463B2 (en) | Generating performance predictions with uncertainty intervals | |
Isupova et al. | Anomaly detection in video with Bayesian nonparametrics | |
Arbab-Zavar et al. | On hierarchical modelling of motion for workflow analysis from overhead view |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111202 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4881272 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |