JP4642128B2 - 画像処理方法、画像処理装置及びシステム - Google Patents
画像処理方法、画像処理装置及びシステム Download PDFInfo
- Publication number
- JP4642128B2 JP4642128B2 JP2009204760A JP2009204760A JP4642128B2 JP 4642128 B2 JP4642128 B2 JP 4642128B2 JP 2009204760 A JP2009204760 A JP 2009204760A JP 2009204760 A JP2009204760 A JP 2009204760A JP 4642128 B2 JP4642128 B2 JP 4642128B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- images
- distance
- composite images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
- Studio Devices (AREA)
- Image Processing (AREA)
Description
他の問題は、人々がカメラにまっすぐに向かい合う場合に限り、正面顔画像をキャプチャすることができるが、現実の世界においてこのような条件を必ずしも満たすことができるとは限らないことである。
このため、顔キャプチャシステムは、可能な限り正面顔画像を取得することが要求される。
言いかえれば、人々がカメラに必ずしもまっすぐに向かい合うとは限らないので、撮影された人物の異なる顔のポーズによって引き起こされる問題は、単一のカメラベースの顔検出には避けられないことである。
人々がカメラの方へまっすぐに向かなければ、キャプチャされた顔画像は非前面の顔画像あるいは側面顔画像になるだろう。
一方、多重カメラ顔キャプチャ技術においては、数台のカメラが、一度に一人の人物の異なる方向の顔画像をキャプチャする。
このため、異なるカメラから1つの人物の顔画像をマージすることが必要になってくる。
複数のカメラが一度に一人の人物の異なる方向の顔画像をキャプチャするので、本発明は、異なる人物にそれぞれ対応するクラスターに顔画像をグループ化するクラスタリング方法を提供することを目的とする。
本発明の実施の形態において、異なる顔のポーズの画像間の類似度は、それらの画像の間の距離を利用することにより測定される。
これにより、顔のポーズの判断により引き起こされる複雑な計算を回避することが可能である。
すなわち、本発明の画像処理技術は、顔のポーズの判断を行うことなく効率的に顔画像をキャプチャし、高品質顔画像の出力することを可能とする。
Faces in Images: A Survey. IEEE Transactions On Pattern analysis and Machine
Intelligence, Vol. 24, No. 1, pp. 34-58, 2002(ミン−セン ヤン、デビッド ジェイ クリンマン、ナンドゥラ アウジャ、画像中の顔の検出、IEEE パターンの分析と機械知能、2002年、巻24号1、34−58頁))に記載された顔検出器あるいは非特許文献2(Paul
A. Viola, Michael J. Jones: Rapid Object Detection using a Boosted Cascade of
Simple Features. In Proceedings of IEEE Computer Society Conference on Computer
Vision and Pattern Recognition (CVPR 2001), Vol. 1, pp. 511-518, Kauai, HI, USA
, 8-14 December 2001(ポール エイ ビオラ、マイケル ジェイ ジョーンズ、簡易特徴のブースト化されたカスケードを用いた高速物体検知、IEEEコンピュータ ソサイエティ大会 コンピュータビジョンとパターン認識について、2001年12月8−14日 アメリカ合衆国 巻1号 511−518頁))に示された分類器のような、様々な適切な検出器を用いることが可能である。
具体例として、分類器は、最初に顔を含む画像と顔を含まない画像でトレーニングされ、次に、関心のある領域の検出に適用される。分類器は、いくつかの領域が顔を含んでいれば、「1」を出力し、そうでなければ、「0」を出力する。このように、分類器は、様々な基準で画像の全ての箇所を検索することにより、各画像中の顔領域を見つけ出す。
したがって、同じポーズの顔画像は、より簡単にクラスタに分けられるであろう。本実施の形態によれば、非特許文献3(W. Zhao, R. Chellappa, A. Rosenfeld, P.J. Phillips, Face
Recognition: A Literature Survey, ACM Computing Surveys, Vol. 35, Issue 4, pp.
399-458, December 2003(ウェイ ザオ、ラマ チェラッパ、エイ ローゼンフェルド、ピー ジェイ フィリップス、顔認識、論文ACMコンピュ−ティング、35号4版、399−458頁、2003年12月))に説明されるように、顔画像間の類似度はLDAまたはPCAのように特徴の間の距離によって表わされる。本発明の実施の形態によれば、顔画像の合成画像セットとして、例えば、水平と垂直の少なくと1方向に−45度から+45度に及ぶ様々なポーズ角について合成顔画像を生成するために、異なるポーズ角の顔画像には、レンダリングのような所定の処理が施される。
図3は、いくつかの顔画像のポーズ角の具体例を示す。
ここで、処理手順の詳細について説明する。
顔画像セットは、
Fi={fi(-nθ),…,fi(-θ), fi(0), fi(θ),…, fi(nθ),
Fj={fj(-nθ),…,fj(-θ), fj(0), fj(θ),…, fj(nθ)}
と表される。
fi(kθ)およびfj(kθ)は、ポーズ角kθの顔ポーズモデルを用いてレンダリングされた顔画像である。θは、予め定義された顔のポーズ角である。kは、−nからnの範囲の整数変数である。
顔画像fi(kθ)とfj(kθ)の各ペアについて、LDAまたはPCA特徴の特徴距離によって距離行列を取得することができる。
図4は距離行列を示している。距離行列を計算した後、画像fiおよびfjについてのMFPDは、距離行列の最小距離として定義される。
MFPDは、以下の式で表される。
一旦2つの顔画像の間の距離が定義されれば、制約付きのマージベースの階層的クラスタリングアルゴリズムを、顔画像をグループ化するために用いることが可能である。
制約は、それらが1つの同じカメラから取得されたものであれば、2以上の顔画像が異なるクラスタにグループ化されるということである。
例えば、マージするクラスターがなくなるまで、最小のクラスター距離で2つのクラスターCiおよびCjが1つのクラスターにマージされる。
2つのクラスターの距離は次のように定義される。
また、2つのクラスターの距離は、最大あるいは平均のMFPD距離である。
ステップS17で、上記顔クラスタリングの後、画像が所定の判定基準に従って各クラスター毎に代表的な顔画像として選択される。
例えば、目の間の距離が最大の画像あるいは最も高い鮮明度の画像が、クラスター毎に代表的な顔画像として選択される。
20:顔検出ユニット
30:顔クラスタリングユニット
31:画像レンダリングユニット
32:特徴抽出ユニット
33:距離計算ユニット
34:クラスタリングユニット
40:選択ユニット
Claims (19)
- 共通の場面の様々な位置に配置された複数のカメラによってキャプチャされる画像を処理する画像処理方法であって、
キャプチャされた画像から顔画像を検出するステップと、
各々の対応する顔画像について様々な顔のポーズ角について複数の合成画像を含む1セットの合成画像を生成するために、所定の顔のポーズモデルを用いることにより、様々なポーズ角について検出された各顔画像を処理するステップと、
各合成画像から特徴ベクトルを抽出するステップと、
異なるセットの合成画像間の特徴ベクトル距離を計算することにより、合成画像の異なるセットの間の距離を計算するステップと、
合成画像の異なるセット間の距離に基づいて、検出された顔画像をクラスタリングするステップと
を含むことを特徴とする画像処理方法。
- クラスター毎に、最大の目の間隔を有する検出顔画像をクラスターの代表的な顔画像として選択するステップをさらに含むことを特徴とする請求項1に記載の画像処理方法。
- クラスター毎に、最も高い鮮明度の検出顔画像をクラスターの代表的な顔画像として選択するステップをさらに含むことを特徴とする請求項1に記載の画像処理方法。
- 前記特徴ベクトルが、LDAあるいはPCA特徴ベクトルであることを特徴とする請求項1に記載の画像処理方法。
- 合成画像の異なるセット間の距離に基づいて、検出された顔画像をクラスタリングするステップが、
合成画像のセット間の距離が所定の閾値より小さい検出顔画像をクラスターとして分類するステップを含むことを特徴とする請求項1に記載の画像処理方法。
- 異なるカメラで取得された検出顔画像を、異なるクラスターに分類することを特徴とする請求項1に記載の画像処理方法。
- 前記ポーズ角が、水平と垂直の少なくと1方向に−45度から+45度に及ぶ範囲であることを特徴とする請求項1に記載の画像処理方法。
- 異なるセットの合成画像間の特徴ベクトル距離を計算することにより、合成画像の異なるセットの間の距離を計算するステップが、
合成画像の異なるセットの間の特徴ベクトル距離の計算するステップと、
計算した距離が最小のものを合成画像の異なるセットの間の距離として決定するステップとを含むことを特徴とする請求項1に記載の画像処理方法。
- 顔のポーズモデルが、2Dあるいは3Dの顔のポーズモデルであることを特徴とする請求項1に記載の画像処理方法。
- 共通の場面の様々な位置に配置された複数のカメラによってキャプチャされる画像を処理する画像処理装置であって、
キャプチャされた画像から顔画像を検出する検出手段と、
所定の顔のポーズモデルを記憶する顔モデル記憶手段と、
各々の対応する顔画像について様々な顔のポーズ角について複数の合成画像を含む1セットの合成画像を生成するために、所定の顔のポーズモデルを用いることにより、様々なポーズ角について検出された各顔画像を処理する処理手段と、
各合成画像から特徴ベクトルを抽出する抽出手段と、
異なるセットの合成画像間の特徴ベクトル距離を計算することにより、合成画像の異なるセットの間の距離を計算する計算手段と、
合成画像の異なるセット間の距離に基づいて、検出された顔画像をクラスタリングするクラスタリング手段と
を備えることを特徴とする画像処理装置。
- クラスター毎に、最大の目の間隔を有する検出顔画像をクラスターの代表的な顔画像として選択する選択手段をさらに備えることを特徴とする請求項10に記載の画像処理装置。
- クラスター毎に、最も高い鮮明度の検出顔画像をクラスターの代表的な顔画像として選択する選択手段をさらに備えることを特徴とする請求項10に記載の画像処理装置。
- 前記特徴ベクトルが、LDAあるいはPCA特徴ベクトルであることを特徴とする請求項10に記載の画像処理装置。
- 前記クラスタリング手段が、合成画像のセット間の距離が所定の閾値より小さい検出顔画像をクラスターとして分類することを特徴とする請求項10に記載の画像処理装置。
- 前記クラスタリング手段が、異なるカメラで取得された検出顔画像を、異なるクラスターに分類することを特徴とする請求項10に記載の画像処理装置。
- 前記ポーズ角が、水平と垂直の少なくと1方向に−45度から+45度に及ぶ範囲であることを特徴とする請求項10に記載の画像処理装置。
- 前記計算手段が、合成画像の異なるセットの間の特徴ベクトル距離の計算し、計算した距離が最小のものを合成画像の異なるセットの間の距離として決定することを特徴とする請求項10に記載の画像処理装置。
- 顔のポーズモデルが、2Dあるいは3Dの顔のポーズモデルであることを特徴とする請求項10に記載の画像処理装置。
- 画像を処理するシステムであって、
共通の場面の画像をキャプチャする様々な位置に配置された複数のカメラと、
キャプチャされた画像から顔画像を検出する検出手段と、
所定の顔のポーズモデルを記憶する顔モデル記憶手段と、
各々の対応する顔画像について様々な顔のポーズ角について複数の合成画像を含む1セットの合成画像を生成するために、所定の顔のポーズモデルを用いることにより、様々なポーズ角について検出された各顔画像を処理する処理手段と、
各合成画像から特徴ベクトルを抽出する抽出手段と、
異なるセットの合成画像間の特徴ベクトル距離を計算することにより、合成画像の異なるセットの間の距離を計算する計算手段と、
合成画像の異なるセット間の距離に基づいて、検出された顔画像をクラスタリングするクラスタリング手段と
を備えることを特徴とするシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200810215058 CN101673346B (zh) | 2008-09-09 | 2008-09-09 | 对图像进行处理的方法、设备和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010103980A JP2010103980A (ja) | 2010-05-06 |
JP4642128B2 true JP4642128B2 (ja) | 2011-03-02 |
Family
ID=42020567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009204760A Expired - Fee Related JP4642128B2 (ja) | 2008-09-09 | 2009-09-04 | 画像処理方法、画像処理装置及びシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4642128B2 (ja) |
CN (1) | CN101673346B (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012001755A1 (ja) | 2010-07-02 | 2012-01-05 | 株式会社ソニー・コンピュータエンタテインメント | 情報処理システム、情報処理装置および情報処理方法 |
CN102385692B (zh) * | 2010-08-31 | 2015-07-08 | 中国科学院深圳先进技术研究院 | 人脸偏转图像获取系统及方法 |
CN102609695A (zh) * | 2012-02-14 | 2012-07-25 | 上海博物馆 | 一种多角度人脸识别方法及系统 |
CN104252616B (zh) * | 2013-06-28 | 2018-01-23 | 广州华多网络科技有限公司 | 人脸标注方法、装置及设备 |
US9607411B2 (en) * | 2014-04-23 | 2017-03-28 | Ebay Inc. | Specular highlights on photos of objects |
US10074003B2 (en) * | 2014-07-11 | 2018-09-11 | Intel Corporation | Dynamic control for data capture |
US9544679B2 (en) * | 2014-12-08 | 2017-01-10 | Harman International Industries, Inc. | Adjusting speakers using facial recognition |
CN105138956B (zh) * | 2015-07-22 | 2019-10-15 | 小米科技有限责任公司 | 人脸检测方法和装置 |
US9875427B2 (en) * | 2015-07-28 | 2018-01-23 | GM Global Technology Operations LLC | Method for object localization and pose estimation for an object of interest |
CN105488527B (zh) | 2015-11-27 | 2020-01-10 | 小米科技有限责任公司 | 图像分类方法及装置 |
US10229324B2 (en) | 2015-12-24 | 2019-03-12 | Intel Corporation | Video summarization using semantic information |
KR101954103B1 (ko) * | 2017-01-31 | 2019-05-17 | 한국항공우주연구원 | 복수의 유사 영상들을 이용한 영상 합성 기술 |
CN107509024B (zh) * | 2017-07-25 | 2019-01-04 | 维沃移动通信有限公司 | 一种拍照处理方法及移动终端 |
US10552665B2 (en) * | 2017-12-12 | 2020-02-04 | Seiko Epson Corporation | Methods and systems for training an object detection algorithm using synthetic images |
CN109242045B (zh) * | 2018-09-30 | 2019-10-01 | 北京达佳互联信息技术有限公司 | 图像聚类处理方法、装置、电子设备及存储介质 |
CN109974594A (zh) * | 2019-04-16 | 2019-07-05 | 安阳壮龙无人机科技有限公司 | 一种距离确定的方法及装置 |
CN111447357B (zh) * | 2019-11-02 | 2021-02-09 | 上海明殿文化传播有限公司 | 选择性实时图像存储系统 |
CN110929679B (zh) * | 2019-12-05 | 2023-06-16 | 杭州电子科技大学 | 一种基于gan的无监督自适应行人重识别方法 |
CN117078868B (zh) * | 2023-10-17 | 2023-12-15 | 北京太极信息系统技术有限公司 | 基于信创软硬件的虚拟现实引擎及其建模和渲染方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094491A (ja) * | 2002-08-30 | 2004-03-25 | Nec Corp | 顔向き推定装置および顔向き推定方法ならびに顔向き推定プログラム |
JP2004192378A (ja) * | 2002-12-12 | 2004-07-08 | Toshiba Corp | 顔画像処理装置およびその方法 |
JP2006092396A (ja) * | 2004-09-27 | 2006-04-06 | Oki Electric Ind Co Ltd | 単独行動者及びグループ行動者検知装置 |
JP2007206898A (ja) * | 2006-01-31 | 2007-08-16 | Toshiba Corp | 顔認証装置および入退場管理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100472556C (zh) * | 2005-10-09 | 2009-03-25 | 欧姆龙株式会社 | 特定被摄体检测装置及方法 |
CN100568262C (zh) * | 2007-12-29 | 2009-12-09 | 浙江工业大学 | 基于多摄像机信息融合的人脸识别检测装置 |
-
2008
- 2008-09-09 CN CN 200810215058 patent/CN101673346B/zh active Active
-
2009
- 2009-09-04 JP JP2009204760A patent/JP4642128B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004094491A (ja) * | 2002-08-30 | 2004-03-25 | Nec Corp | 顔向き推定装置および顔向き推定方法ならびに顔向き推定プログラム |
JP2004192378A (ja) * | 2002-12-12 | 2004-07-08 | Toshiba Corp | 顔画像処理装置およびその方法 |
JP2006092396A (ja) * | 2004-09-27 | 2006-04-06 | Oki Electric Ind Co Ltd | 単独行動者及びグループ行動者検知装置 |
JP2007206898A (ja) * | 2006-01-31 | 2007-08-16 | Toshiba Corp | 顔認証装置および入退場管理装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101673346B (zh) | 2013-06-05 |
CN101673346A (zh) | 2010-03-17 |
JP2010103980A (ja) | 2010-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4642128B2 (ja) | 画像処理方法、画像処理装置及びシステム | |
JP7317919B2 (ja) | 外観検索のシステムおよび方法 | |
US8314854B2 (en) | Apparatus and method for image recognition of facial areas in photographic images from a digital camera | |
Charfi et al. | Definition and performance evaluation of a robust SVM based fall detection solution | |
JP5567853B2 (ja) | 画像認識装置および方法 | |
KR101615254B1 (ko) | 디지털 이미지들에서 얼굴 표정들을 검출 | |
JP5174045B2 (ja) | 分類器チェーンを用いた照明検出 | |
EP3168810B1 (en) | Image generating method and apparatus | |
CN110348270B (zh) | 影像物件辨识方法与影像物件辨识系统 | |
US8526742B2 (en) | Image processing apparatus, method, and program that classifies data of images | |
JP2007265367A (ja) | 視線検出方法および装置ならびにプログラム | |
TW201137767A (en) | Image processing apparatus and image processing method | |
JP6157165B2 (ja) | 視線検出装置及び撮像装置 | |
US11315360B2 (en) | Live facial recognition system and method | |
US9323989B2 (en) | Tracking device | |
JP2014128003A (ja) | 画像認識装置、その制御方法及びプログラム | |
US9996743B2 (en) | Methods, systems, and media for detecting gaze locking | |
JP5791361B2 (ja) | パターン識別装置、パターン識別方法およびプログラム | |
CN114743264A (zh) | 拍摄行为检测方法、装置、设备及存储介质 | |
JP2008211534A (ja) | 顔検知装置 | |
KR100412634B1 (ko) | 카메라를 사용한 얼굴 영상 자동 촬영 방법 및 그 장치 | |
KR101031369B1 (ko) | 얼굴 인식 장치 및 그 방법 | |
JP2015158745A (ja) | 行動識別器生成装置、行動認識装置及びプログラム | |
US11335123B2 (en) | Live facial recognition system and method | |
Kumar et al. | Automated panning of video devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4642128 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |