JP4881278B2 - 物体認識装置及びその方法 - Google Patents
物体認識装置及びその方法 Download PDFInfo
- Publication number
- JP4881278B2 JP4881278B2 JP2007282932A JP2007282932A JP4881278B2 JP 4881278 B2 JP4881278 B2 JP 4881278B2 JP 2007282932 A JP2007282932 A JP 2007282932A JP 2007282932 A JP2007282932 A JP 2007282932A JP 4881278 B2 JP4881278 B2 JP 4881278B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- class
- point spread
- feature vector
- blur
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 33
- 239000013598 vector Substances 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000003909 pattern recognition Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 229920013655 poly(bisphenol-A sulfone) Polymers 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012567 pattern recognition method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000001747 pupil Anatomy 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Description
具体的な実施形態を説明する前に、本実施形態の概念について説明する。
まず、図4(a)の学習処理について述べる。
次に、図4(b)の認識処理について述べる。
選択されたHSを用いて、ぼける前の画像をgから復元する。
復元された画像から個人を識別するための特徴量を算出し、各人物の参照画像と比較することで個人を同定する。
次に、本実施形態の顔認識装置100について図1〜図3に基づいて説明する。本実施形態は、見え方の変動モデルに基づくPSF推定を用いて個人識別を行うものである。図1に顔認識装置100の構成を示す。
顔領域獲得部101は、カメラから出力された画像から顔領域を検出し、顔領域のみからなる画像g(u,v)を獲得する(図2のステップ201)。
特徴ベクトル生成部102は、g(u,v)からぼけ量を表す特徴ベクトルxを生成する(図2のステップ202)。
PSF推定部104では、特徴ベクトル生成部102から出力されたxとぼけモデル格納部103のΦとを部分空間法を用いて比較し、PSFを推定する(図2のステップ203)。
復元部105では、顔領域獲得部101から出力されたgに対して、PSF推定部104から出力されたHsを用いて、画像を復元する(図2のステップ204)。
個人識別部106では、復元部105から出力されたaを用いて個人を識別する(図2のステップ205)。
本実施形態によれば、ぼけた画像が与えられると、ぼけによる顔の見え方の変動モデルと比較することでPSFを推定し、そのPSFで復元された画像を用いて個人を識別する。輪郭上のエッジではなく、顔全体の見え方を用いるためPSFを安定に推定できる。ぼけによる顔の見え方の変動モデルは、個人識別に用いる参照画像とは別の人物から学習できる。
本発明は上記実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
102 特徴ベクトル生成部
103 ぼけモデル格納部
104 PSF推定部
105 復元部
106 個人識別部
301 劣化画像
302 フーリエ変換
303 対数変換
304 ノルム正規化
Claims (8)
- 動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出する領域獲得部と、
前記物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出するベクトル生成部と、
予め記憶した複数の点拡がり関数(PSF)における各点拡がり関数を、予め記憶したぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各点拡がり関数にそれぞれ対応させて格納する格納部と、
前記特徴ベクトルと、前記各クラスに属する複数枚の前記ぼけた画像とをパターン認識することにより比較して、前記特徴ベクトルと最も類似する前記クラスを求め、この最も類似する前記クラスに対応する前記点拡がり関数を一つ選択する推定部と、
選択された前記点拡がり関数を用いて前記物体領域画像をぼける前の画像に復元する復元部と、
前記復元された画像と前記参照画像とを比較して前記物体を識別する識別部と、
を有する物体認識装置。 - 前記ベクトル生成部は、
前記物体領域画像に対してフーリエ変換で振幅値を求め、前記振幅値に対数変換を適用した後に、ダウンサンプリングとノルムの正規化を行って前記特徴ベクトルを算出する、
請求項1記載の物体認識装置。 - 前記格納部は、前記各クラスに属する複数枚の前記ぼけた画像から生成された部分空間を、前記クラス毎に格納し、
前記推定部は、前記クラス毎の前記部分空間と前記特徴ベクトルとを部分空間法により比較する、
請求項1記載の物体認識装置。 - 前記領域獲得部は、
前記劣化画像から前記物体領域の前記特徴点を検出し、前記特徴点を平均物体領域形状にあてはめることで前記物体領域画像を獲得する、
請求項1記載の物体認識装置。 - 動きぼけ、または、焦点ぼけにより劣化した劣化画像から、認識したい物体の物体領域画像を検出する領域獲得ステップと、
前記物体領域画像をそれぞれ周波数領域へ変換し、ぼけ量を表す特徴ベクトルを抽出するベクトル生成ステップと、
予め記憶した複数の点拡がり関数(PSF)における各点拡がり関数を、予め記憶したぼけのない複数枚の訓練画像にそれぞれ適用して生成された複数枚のぼけた画像を1個のクラスとして構成し、前記各クラスを前記各点拡がり関数にそれぞれ対応させて格納する格納ステップと、
前記特徴ベクトルと、前記各クラスに属する複数枚の前記ぼけた画像とをパターン認識することにより比較して、前記特徴ベクトルと最も類似する前記クラスを求め、この最も類似する前記クラスに対応する前記点拡がり関数を一つ選択する推定ステップと、
選択された前記点拡がり関数を用いて前記物体領域画像をぼける前の画像に復元する復元ステップと、
前記復元された画像と前記参照画像とを比較して前記物体を識別する識別ステップと、
を有する物体認識方法。 - 前記ベクトル生成ステップは、
前記物体領域画像に対してフーリエ変換で振幅値を求め、前記振幅値に対数変換を適用した後に、ダウンサンプリングとノルムの正規化を行って前記特徴ベクトルを算出する、
請求項5記載の物体認識方法。 - 前記格納ステップは、前記各クラスに属する複数枚の前記ぼけた画像から生成された部分空間を、前記クラス毎に格納し、
前記推定ステップは、前記クラス毎の前記部分空間と前記特徴ベクトルとを部分空間法により比較する、
請求項5記載の物体認識方法。 - 前記領域獲得ステップは、
前記劣化画像から前記物体領域の前記特徴点を検出し、前記特徴点を平均物体領域形状にあてはめることで前記物体領域画像を獲得する、
請求項5記載の物体認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007282932A JP4881278B2 (ja) | 2007-10-31 | 2007-10-31 | 物体認識装置及びその方法 |
US12/262,735 US8068687B2 (en) | 2007-10-31 | 2008-10-31 | Object recognizing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007282932A JP4881278B2 (ja) | 2007-10-31 | 2007-10-31 | 物体認識装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009110349A JP2009110349A (ja) | 2009-05-21 |
JP4881278B2 true JP4881278B2 (ja) | 2012-02-22 |
Family
ID=40582930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007282932A Expired - Fee Related JP4881278B2 (ja) | 2007-10-31 | 2007-10-31 | 物体認識装置及びその方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8068687B2 (ja) |
JP (1) | JP4881278B2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8948513B2 (en) | 2009-01-27 | 2015-02-03 | Apple Inc. | Blurring based content recognizer |
US8229244B2 (en) * | 2009-03-30 | 2012-07-24 | Mitsubishi Electric Research Laboratories, Inc. | Multi-image deblurring |
JP5499050B2 (ja) * | 2009-12-22 | 2014-05-21 | パナソニック株式会社 | 画像処理装置、撮像装置、及び画像処理方法 |
CN102110122B (zh) | 2009-12-24 | 2013-04-03 | 阿里巴巴集团控股有限公司 | 一种建立样本图片索引表和图片过滤、搜索方法及装置 |
PL2535864T3 (pl) * | 2010-02-10 | 2020-12-28 | Dolby International Ab | Urządzenie i sposób przetwarzania obrazu |
JP5505007B2 (ja) | 2010-03-18 | 2014-05-28 | 富士通株式会社 | 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム |
US8180208B2 (en) * | 2010-05-19 | 2012-05-15 | Eastman Kodak Company | Identifying a photographer |
US8180209B2 (en) * | 2010-05-19 | 2012-05-15 | Eastman Kodak Company | Determining camera activity from a steadiness signal |
US8200076B2 (en) * | 2010-05-19 | 2012-06-12 | Eastman Kodak Company | Estimating gender or age of a photographer |
US8905314B2 (en) | 2010-09-30 | 2014-12-09 | Apple Inc. | Barcode recognition using data-driven classifier |
US8792748B2 (en) * | 2010-10-12 | 2014-07-29 | International Business Machines Corporation | Deconvolution of digital images |
JP5776255B2 (ja) * | 2011-03-25 | 2015-09-09 | ソニー株式会社 | 端末装置、物体識別方法、プログラム及び物体識別システム |
WO2012175010A1 (en) * | 2011-06-24 | 2012-12-27 | Technicolor (China) Technology Co., Ltd. | Method and device for processing of an image |
US9262694B2 (en) * | 2011-12-16 | 2016-02-16 | Nec Corporation | Dictionary learning device, pattern matching apparatus, method for learning dictionary and storage medium |
CN103390151B (zh) * | 2012-05-08 | 2016-09-07 | 展讯通信(上海)有限公司 | 人脸检测方法及装置 |
GB2507576A (en) * | 2012-11-05 | 2014-05-07 | British Broadcasting Corp | Focus detection |
US9530079B2 (en) * | 2012-11-09 | 2016-12-27 | Nikon Corporation | Point spread function classification using structural properties |
US20140307950A1 (en) * | 2013-04-13 | 2014-10-16 | Microsoft Corporation | Image deblurring |
CN105453540B (zh) * | 2013-08-02 | 2018-08-21 | 富士胶片株式会社 | 图像处理装置、摄像装置、图像处理方法 |
WO2015025704A1 (ja) * | 2013-08-23 | 2015-02-26 | 日本電気株式会社 | 映像処理装置、映像処理方法および映像処理プログラム |
US9430817B2 (en) * | 2013-11-12 | 2016-08-30 | Microsoft Technology Licensing, Llc | Blind image deblurring with cascade architecture |
JP6686890B2 (ja) | 2014-10-03 | 2020-04-22 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
US9696265B2 (en) * | 2014-11-04 | 2017-07-04 | Exnodes Inc. | Computational wafer inspection filter design |
US9684970B2 (en) * | 2015-02-27 | 2017-06-20 | Qualcomm Incorporated | Fast adaptive estimation of motion blur for coherent rendering |
CN108268881A (zh) * | 2016-12-30 | 2018-07-10 | 中兴通讯股份有限公司 | 电子设备、目标图像识别方法及装置 |
CN108230291B (zh) * | 2017-03-30 | 2020-09-29 | 北京市商汤科技开发有限公司 | 物体识别系统训练方法、物体识别方法、装置和电子设备 |
JP7142420B2 (ja) * | 2017-07-10 | 2022-09-27 | キヤノン株式会社 | 画像処理装置、学習方法、学習済モデル、画像処理方法 |
US10025950B1 (en) * | 2017-09-17 | 2018-07-17 | Everalbum, Inc | Systems and methods for image recognition |
KR102019990B1 (ko) * | 2018-01-12 | 2019-09-10 | 숭실대학교산학협력단 | 움직임에 따른 흐림 현상의 보정을 고려한 가시광 통신 기반의 차량 위치 추정 방법 및 장치 |
CN108460356B (zh) * | 2018-03-13 | 2021-10-29 | 上海海事大学 | 一种基于监控系统的人脸图像自动处理系统 |
US11908212B2 (en) * | 2019-07-22 | 2024-02-20 | Nec Corporation | Matching position output system |
EP4116929A4 (en) * | 2020-03-02 | 2023-07-05 | Panasonic Intellectual Property Corporation of America | INFORMATION PROCESSING METHOD, INFORMATION PROCESSING SYSTEM AND INFORMATION PROCESSING DEVICE |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6301370B1 (en) * | 1998-04-13 | 2001-10-09 | Eyematic Interfaces, Inc. | Face recognition from video images |
JP2005332382A (ja) | 2004-04-22 | 2005-12-02 | Fuji Photo Film Co Ltd | 画像処理方法および装置並びにプログラム |
US7346222B2 (en) * | 2005-02-07 | 2008-03-18 | Motorola, Inc. | Object-of-interest image de-blurring |
-
2007
- 2007-10-31 JP JP2007282932A patent/JP4881278B2/ja not_active Expired - Fee Related
-
2008
- 2008-10-31 US US12/262,735 patent/US8068687B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009110349A (ja) | 2009-05-21 |
US8068687B2 (en) | 2011-11-29 |
US20090110303A1 (en) | 2009-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4881278B2 (ja) | 物体認識装置及びその方法 | |
Nishiyama et al. | Facial deblur inference using subspace analysis for recognition of blurred faces | |
US7679621B2 (en) | Image processing apparatus and method | |
Wang et al. | Hallucinating face by eigentransformation | |
Hurri et al. | Simple-cell-like receptive fields maximize temporal coherence in natural video | |
US7957560B2 (en) | Unusual action detector and abnormal action detecting method | |
KR101314293B1 (ko) | 조명변화에 강인한 얼굴인식 시스템 | |
Nishiyama et al. | Facial deblur inference to improve recognition of blurred faces | |
JP4858612B2 (ja) | 物体認識システム、物体認識方法および物体認識用プログラム | |
Peter et al. | Nonlocal-means image denoising technique using robust M-estimator | |
kumar Shukla et al. | A novel method for identification and performance improvement of Blurred and Noisy Images using modified facial deblur inference (FADEIN) algorithms | |
Vaksman et al. | Patch-craft self-supervised training for correlated image denoising | |
CN113807246A (zh) | 人脸识别方法、装置、设备及存储介质 | |
Kalam et al. | Gender classification using geometric facial features | |
Asai et al. | Cepstral analysis based blind deconvolution for motion blur | |
Senshiki et al. | PSF estimation using total variation regularization and shock filter for blind deconvolution | |
Chato et al. | Total variation denoising method to improve the detection process in IR images | |
Shah et al. | Hough transform and cepstrum based estimation of spatial-invariant and variant motion blur parameters | |
Khan et al. | Segmentation of defocus blur using local triplicate Co-occurrence patterns (LTCoP) | |
Victoria et al. | A survey on impulse noise removal techniques in image processing | |
Alaoui et al. | Application of blind deblurring algorithm for face biometric | |
Anand et al. | Tackling multiple visual artifacts: Blind image restoration using conditional adversarial networks | |
Setia et al. | Image Deblurring using Wiener Filtering and Siamese Neural Network | |
Pasha et al. | An Efficient Novel Approach for Iris Recognition and Segmentation Based on the Utilization of Deep Learning | |
Haywood et al. | Real-time Blind Deblurring Based on Lightweight Deep-Wiener-Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111202 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4881278 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |