JP5889820B2 - 特徴量抽出装置、特徴量抽出方法、および画像識別装置 - Google Patents

特徴量抽出装置、特徴量抽出方法、および画像識別装置 Download PDF

Info

Publication number
JP5889820B2
JP5889820B2 JP2013060863A JP2013060863A JP5889820B2 JP 5889820 B2 JP5889820 B2 JP 5889820B2 JP 2013060863 A JP2013060863 A JP 2013060863A JP 2013060863 A JP2013060863 A JP 2013060863A JP 5889820 B2 JP5889820 B2 JP 5889820B2
Authority
JP
Japan
Prior art keywords
data
covariance matrix
gradient
image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013060863A
Other languages
English (en)
Other versions
JP2014186534A (ja
Inventor
直浩 野々垣
直浩 野々垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013060863A priority Critical patent/JP5889820B2/ja
Priority to US14/024,390 priority patent/US9002118B2/en
Publication of JP2014186534A publication Critical patent/JP2014186534A/ja
Application granted granted Critical
Publication of JP5889820B2 publication Critical patent/JP5889820B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • G06V10/473Contour-based spatial representations, e.g. vector-coding using gradient analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Description

本発明の実施形態は、特徴量抽出装置、特徴量抽出方法、および画像識別装置に関する。
従来、撮像された物体の識別処理を行う画像識別装置は、画像からの特徴量抽出処理と、抽出された特徴を用いた識別処理の2つの段階で構成されている。識別精度の向上のためには前段階である特徴量抽出処理において、識別したい物体とそれ以外とを統計的に有意に分離できる情報を含めることが重要である。
特開2010−44439号公報 US2009/238460,Ryuji Funayama, Hiromichi Yanagihara, Luc Van Gool, Tinne Tuytelaars, Herbert Bay,"ROBUST INTEREST POINT DETECTOR AND DESCRIPTOR", published 2009-09-24
Navneet Dalal,and Bill Triggs, "Histograms of oriented gradients for human detection, " CVPR2005, vol.1, pp. 886-893, 2005.
本発明の実施形態は、回転に敏感かつ照明変化に頑強な物体の識別に有効な特徴量を少ない計算量で得ることが可能な特徴量抽出装置、特徴量抽出方法、および画像識別装置を提供することを目的とする。
本発明の一つの実施形態の特徴量抽出装置は、画像データの輝度データに基づいて、異なる2つの方向についての輝度勾配データを生成する勾配画像算出部と、前記輝度勾配データに基づいて、前記画像データを複数に分割する部分領域毎に共分散行列を算出する勾配集計部を備える。実施形態の特徴量抽出装置は、前記共分散行列が表現する楕円の長軸および短軸に係る2つのパラメータを算出し、前記部分領域毎に、前記パラメータの対数の値域を所定の分割数で量子化し、量子化した値に対応する次元のみ他の次元と値が異なる特徴ベクトルを出力する特徴量出力部をさらに備える。
図1は、本実施形態にかかる画像識別装置100の構成を示すブロック図である。 図2は、本実施形態にかかるソーベルフィルタを示す図である。 図3は、本実施形態にかかるロバーツフィルタを示す図である。 図4は、本実施形態にかかる部分領域I1・・・Inの例を示す図である。 図5は、本実施形態にかかる対角行列Λと直交行列Pから得られる楕円の方程式が示す楕円を示す図である。
以下に添付図面を参照して、実施形態にかかる特徴量抽出装置、特徴量抽出方法、および画像識別装置を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。
(第1の実施形態)
図1は、本実施形態にかかる画像識別装置100の構成を示すブロック図である。画像識別装置100は、画像データ入力部1、特徴量抽出装置10、および画像識別部5を備える。画像データ入力部1は、取得した画像データから2次元平面の輝度データを得て出力する、例えばカメラ、センサー等である。特徴量抽出装置10は、画像データの画素ごとに、勾配画像を算出する勾配画像算出部2、勾配画像を複数の領域に分割し領域ごとに複数の画素の勾配関数によって値を集計する勾配集計部3、および集計結果から特徴量(特徴ベクトル)を出力する特徴量出力部4を備える。画像識別部5は既存の機械学習手法に基づいて画像を識別する。
画像データ入力部1に入力されるデータは画面全体のデータでもよいし、画面の一部をアフィン変換によって写像の上、切り出した画像でもよい。また、画像データは、輝度情報、色(色差)情報の可視光情報、距離情報(深さ)、赤外線画像等、2次元平面(2次元配列)の輝度データで表現される数値データに変換できるものならいずれでもよい。
勾配画像算出部2は、2次元平面の輝度データから勾配画像を算出する。勾配画像は、画素位置ごとに異なる2つの方向、例えば直交する2つの方向について勾配(一階微分)が算出できれば、どのような方法を用いて計算してもよい。例えば図2(a)及び(b)に示されるような1組の3×3のソーベルフィルタを通した出力を、勾配画像として用いることができる。他のフィルタとしては、図3(a)及び(b)に示されるようなロバーツフィルタを用いてもよい。
勾配集計部3では、勾配画像算出部2が生成した勾配画像の中のある矩形領域を、複数の部分領域I0・・・I15に区分けし、部分領域Ik(k=0,・・・,15)ごとに共分散行列を算出する。各部分領域Ikは、複数の画素を有している。図4では、矩形領域を16の部分領域Ikに区分けした例を示しているが、部分領域の数はこれに限定されない。なお、勾配画像算出部2が生成した勾配画像は複数の矩形領域に分割されており、それぞれの矩形領域全てについて以下の演算を実行する。
部分領域Ikに含まれる画素位置(i,j)のx方向の勾配画像をgxij、y方向の勾配画像をgyijとしたとき、gxij及びgyijから部分領域Ikごとの共分散行列Hkの成分としてσk 0(Ik),σk 1(Ik),σk 2(Ik)の3つのスカラー値を得る。ここで部分画像Ikの幅方向の画素数をcw、高さ方向の画素数をchとすると、各σk 0(Ik),σk 1(Ik),σk 2(Ik)は以下のように示せる。
Figure 0005889820
Figure 0005889820
Figure 0005889820
σk 0(Ik),σk 1(Ik),σk 2(Ik)を行列で表現すると式(4)の共分散行列Hkが得られる。
Figure 0005889820
共分散行列Hkは正定値のエルミート行列であることから、実数かつ非負の固有値をもつ。そこで、特徴量出力部4は、この行列Hkを固有値分解して、Hk=PΛP-1を満たす対角行列Λおよび直交行列Pを求める。この対角行列Λと直交行列Pにより、αを媒介変数として式(5)の楕円方程式を得ることができる。
Figure 0005889820
図5は、本実施形態にかかる対角行列Λと直交行列Pから得られる楕円方程式が示す楕円を示す図である。このとき、楕円の長軸λ1と短軸λ2の長さは式(6)に示す対角行列Λより求まる。
Figure 0005889820
λ12は、自然画像において対数分布をすることが経験的に知られているので、これらの対数をとって、それぞれlogλ1,logλ2を特徴量として得る。
一方、楕円の長軸の軸角θは式(7)で示される直交行列Pから求まる(式(8))。
Figure 0005889820
Figure 0005889820
得られたパラメータθ,logλ1,logλ2を、さらに量子化およびベクトル化し、特徴ベクトルvk 0,vk 1,vk 2を求める。例えば、変数xの値域が[−r,+r)([a,b)は、左閉右開区間{x|a≦x<b}を示す)であるとすると、nビット即ち2n階調(0,・・・2n−1)となるように以下の式により量子化する。
[2n×(x−(−r))/(r−(−r))]
(ここで、[Y]は、Yを超えない最大の整数を表記するガウス記号である)
そして、等間隔の値域ごとに量子化した値が得られたら、2n次元の2値(バイナリ)ベクトルであって、量子化した値に対応する次元((量子化した値+1)次元)のみ1で、他は0となるようなベクトルに変換する。
例えば、値域[−π,+π)、変数θ=π/4である場合に、n=4で量子化すると、
[24×(π/4−(−π))/(π−(−π))]=10
となるので、24(=16)次元のベクトルであって、第11次元だけ1で他は0となる2値ベクトル、即ち、
{0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0}
を得る。
値域が[0,+∞)のように∞を含む場合は、実験的にパラメータの分布を調べて、累積度数が相対的に(2n−1)/2nとなるようなcを値域の上限値として選ぶ。値域[0,c)は、(2n−1)次元として設定する。そして、値域[c,+∞)は2n次元目として設定する。2n次元の2値ベクトルへの変換は上記と同様である。
なお、値域の分割数を2nとして説明したが、分割数は2のべき乗に限定はされない。例えば分割数がmの場合、パラメータxの値域が[−r,+r)のときは
[m×(x−(−r))/(r−(−r))]
として量子化すればよい。また、値域が[0,+∞)の場合は、累積度数が相対的に(m−1)/mとなるようなcを値域の上限値として選ぶ。値域[0,c)は、(m−1)次元として設定し、値域[c,+∞)はm次元目として設定すればよい。
このようにして、各部分領域Ikに対してパラメータθ,logλ1,logλ2から量子化および2値ベクトルへの変換を経て特徴ベクトルvk 0,vk 1,vk 2を得る。本実施形態によれば、少ない計算量で特徴ベクトルを求めることができる。
特徴量出力部4は、すべての部分領域Ikから得られた特徴ベクトルを出力して画像識別部5に入力する。なお、すべての部分領域Ikから得られた特徴ベクトルを連結し、((θの値域の分割数)+(logλ1の値域の分割数)+(logλ2の値域の分割数))×(部分領域の数)次元の特徴ベクトルとして画像識別部5に入力するようにしてもよい。この特徴ベクトルを、画像識別部5が実行する、例えば、サポートベクターマシン、ブースティング、ランダムフォレストなどの既存の機械学習手法の入力とすることで、高い精度の識別能力を得ることができる。特徴ベクトルを次元数の高い2値ベクトルとすることにより、より複雑な線形モデルを学習することができるようになるからである。
(第2の実施形態)
第1の実施形態においては、θ,λ12の算出において固有値分解を行うため、λ12の計算時に平方根の計算が必要になる。第2の実施形態は、これを省いて更に計算量を削減した手法である。共分散行列Hkにおいて、
|trace(Hk)|=|(λ1+λ2)|
det(Hk)=λ1λ2
となる関係を利用して、λ12の代わりに、例えば、t=|trace(Hk)|およびd=det(Hk)を使用する。
ここで、tおよびdは共分散行列Hkの成分を用いて計算することができる。
Figure 0005889820
Figure 0005889820
また、直交行列Pおよび対角行列Λを解析的に解くと、θを、直接、共分散行列Hkの成分から求めることができる。
Figure 0005889820
従って、共分散行列Hkから四則演算および対数関数(log),逆正接関数(tan-1)のみで、θ,logt,logdの特徴量を得ることができる。これら特徴量についても、第1の実施形態と同様に量子化および2値ベクトル化して、特徴ベクトルに変換することができる。
第1および第2の実施形態にかかる特徴量抽出装置においては、局所領域の勾配分布を特徴量として使用することで回転方向に滑らかに特徴を記述できる。したがって、繰り返し模様が乏しく向きが重要な物体の識別に有効である。また、第1および第2の実施形態にかかる特徴量抽出装置においては、勾配の分布に対してロバストな特徴量の抽出を少ない計算量で実現することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 画像データ入力部、2 勾配画像算出部、3 勾配集計部、4 特徴量出力部、5 画像識別部、10 特徴量抽出装置、100 画像識別装置。

Claims (6)

  1. 画像データの輝度データに基づいて、異なる2つの方向についての輝度勾配データを生成する勾配画像算出部と、
    前記輝度勾配データに基づいて、前記画像データを複数に分割する部分領域毎に共分散行列を算出する勾配集計部と、
    前記共分散行列が表現する楕円の長軸および短軸に係る2つのパラメータを算出し、前記部分領域毎に、前記パラメータの対数の値域を所定の分割数で量子化し、量子化した値に対応する次元のみ他の次元と値が異なる特徴ベクトルを出力する特徴量出力部と、
    を備える
    ことを特徴とする特徴量抽出装置。
  2. 前記パラメータは、前記共分散行列の固有値である
    ことを特徴とする請求項1に記載の特徴量抽出装置。
  3. 前記パラメータは、前記共分散行列のトレース(対角和)の絶対値および前記共分散行列の行列式である
    ことを特徴とする請求項1に記載の特徴量抽出装置。
  4. 前記特徴量出力部は、さらに前記楕円の回転量に係るパラメータを算出し、前記部分領域毎に、前記回転量に基づく前記特徴ベクトルを出力する
    ことを特徴とする請求項1乃至3のいずれかに記載の特徴量抽出装置。
  5. 2次元平面の輝度データに基づいて、異なる2つの方向についての輝度勾配データを生成し、
    前記異なる2つの方向についての前記輝度勾配データに基づいて、前記2次元平面を複数に分割する部分領域毎に共分散行列を算出し、
    前記共分散行列が表現する楕円の長軸および短軸に係る2つのパラメータを算出し、
    前記パラメータの対数の値域をそれぞれ複数の領域に分割する分割数の次元を有する2値ベクトルであって前記対数を含む前記領域に対応する次元のみ他の次元と値が異なるようなベクトルとして、2つの前記パラメータの対数のそれぞれを表現して前記部分領域毎に出力する
    ことを特徴とする特徴量抽出方法。
  6. 取得した画像データから輝度データを得て出力する画像データ入力部と、
    前記輝度データに基づいて、異なる2つの方向についての輝度勾配データを生成する勾配画像算出部と、
    前記異なる2つの方向についての前記輝度勾配データに基づいて、2次元平面を複数に分割する部分領域毎に共分散行列を算出する勾配集計部と、
    前記共分散行列が表現する楕円の長軸および短軸に係る2つのパラメータを算出し、前記パラメータの対数の値域をそれぞれ複数の領域に分割する分割数の次元を有する2値ベクトルであって前記対数を含む前記領域に対応する次元のみ他の次元と値が異なるような特徴ベクトルとして、2つの前記パラメータの対数のそれぞれを表現して前記部分領域毎に出力する特徴量出力部と、
    前記特徴ベクトルに基づいて画像を識別する画像識別部と、
    を備える
    ことを特徴とする画像識別装置。
JP2013060863A 2013-03-22 2013-03-22 特徴量抽出装置、特徴量抽出方法、および画像識別装置 Expired - Fee Related JP5889820B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013060863A JP5889820B2 (ja) 2013-03-22 2013-03-22 特徴量抽出装置、特徴量抽出方法、および画像識別装置
US14/024,390 US9002118B2 (en) 2013-03-22 2013-09-11 Image feature extraction device, image feature extraction method, and image recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013060863A JP5889820B2 (ja) 2013-03-22 2013-03-22 特徴量抽出装置、特徴量抽出方法、および画像識別装置

Publications (2)

Publication Number Publication Date
JP2014186534A JP2014186534A (ja) 2014-10-02
JP5889820B2 true JP5889820B2 (ja) 2016-03-22

Family

ID=51569191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013060863A Expired - Fee Related JP5889820B2 (ja) 2013-03-22 2013-03-22 特徴量抽出装置、特徴量抽出方法、および画像識別装置

Country Status (2)

Country Link
US (1) US9002118B2 (ja)
JP (1) JP5889820B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501838B1 (en) 2015-08-24 2016-11-22 The Boeing Company Systems and methods for determining boundaries of features in digital images
US11367150B2 (en) * 2017-01-23 2022-06-21 Meta Platforms, Inc. Demographic-based targeting of electronic media content items
CN116609844B (zh) * 2023-03-13 2024-03-12 中国自然资源航空物探遥感中心 一种用于提取地球物理三维断裂信息的方法和计算设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3006338B2 (ja) 1993-03-26 2000-02-07 松下電器産業株式会社 運動領域輪郭検出装置
JP3668455B2 (ja) * 2000-12-19 2005-07-06 松下電器産業株式会社 一次および二次固有特徴を用いる照明および視角に影響されない顔面記述方法
US7720289B2 (en) 2005-12-14 2010-05-18 Mitsubishi Electric Research Laboratories, Inc. Method for constructing covariance matrices from data features
US7620204B2 (en) 2006-02-09 2009-11-17 Mitsubishi Electric Research Laboratories, Inc. Method for tracking objects in videos using covariance matrices
ATE470912T1 (de) 2006-04-28 2010-06-15 Toyota Motor Europ Nv Robuster detektor und deskriptor für einen interessenspunkt
US7899253B2 (en) * 2006-09-08 2011-03-01 Mitsubishi Electric Research Laboratories, Inc. Detecting moving objects in video by classifying on riemannian manifolds
US7869631B2 (en) * 2006-12-11 2011-01-11 Arcsoft, Inc. Automatic skin color model face detection and mean-shift face tracking
US8457400B2 (en) * 2008-06-27 2013-06-04 Microsoft Corporation Patch-based texture histogram coding for fast image similarity search
JP5214367B2 (ja) 2008-08-08 2013-06-19 株式会社東芝 特徴量抽出装置、特徴量抽出方法、画像処理装置、及び、プログラム
US8422788B2 (en) * 2008-08-26 2013-04-16 Microsoft Corporation Automatic image straightening
FR2935508B1 (fr) * 2008-09-01 2010-09-17 Sagem Securite Procede de determination d'une pseudo-identite a partir de caracteristiques de minuties et dispositif associe.

Also Published As

Publication number Publication date
US9002118B2 (en) 2015-04-07
JP2014186534A (ja) 2014-10-02
US20140286576A1 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
Li et al. Nonnegative mixed-norm preconditioning for microscopy image segmentation
US20170262985A1 (en) Systems and methods for image-based quantification for allergen skin reaction
JP2018113080A (ja) エッジベクトルを利用した画像特徴検出
CN104318243B (zh) 基于稀疏表示和空谱拉普拉斯图的高光谱数据降维方法
CN107851327A (zh) 粗细搜索方法及图像处理装置
Klein et al. Salient pattern detection using W 2 on multivariate normal distributions
Banic et al. Color Dog-Guiding the Global Illumination Estimation to Better Accuracy.
US8559714B2 (en) Post processing for improved generation of intrinsic images
Zhou et al. Label denoising adversarial network (LDAN) for inverse lighting of faces
JP5889820B2 (ja) 特徴量抽出装置、特徴量抽出方法、および画像識別装置
US20220414827A1 (en) Training apparatus, training method, and medium
CN116645595A (zh) 遥感影像建筑物屋顶轮廓识别方法、装置、设备和介质
JP5755810B2 (ja) 特徴抽出のための技法
CN106886754A (zh) 一种基于三角面片的三维场景下的物体识别方法及系统
JP2015148895A (ja) 物体数分布推定方法
Mendez-Rial et al. Efficiency of semi-implicit schemes for anisotropic diffusion in the hypercube
CN103679174A (zh) 一种形状描述子的生成方法、装置
JP5860970B2 (ja) 固有画像の生成を改良するための後処理
US9536144B2 (en) Automatic image classification
Sigurdsson et al. Endmember constrained semi-supervised hyperspectral unmixing
CN106326846B (zh) 无人机图像的林木植株并行提取方法
Gaddam et al. Advanced Image Processing Using Histogram Equalization and Android Application Implementation
Conni et al. Dependence of texture classification accuracy on spectral information
Demirci et al. Weighted Chebyshev distance classification method for hyperspectral imaging
Martins et al. Focus of attention and region segregation by low-level geometry

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150717

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160217

R151 Written notification of patent or utility model registration

Ref document number: 5889820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees