JP2010271787A - 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム - Google Patents
特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム Download PDFInfo
- Publication number
- JP2010271787A JP2010271787A JP2009121244A JP2009121244A JP2010271787A JP 2010271787 A JP2010271787 A JP 2010271787A JP 2009121244 A JP2009121244 A JP 2009121244A JP 2009121244 A JP2009121244 A JP 2009121244A JP 2010271787 A JP2010271787 A JP 2010271787A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- vector
- order
- feature
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 104
- 239000013598 vector Substances 0.000 claims abstract description 457
- 239000011159 matrix material Substances 0.000 claims description 70
- 238000003860 storage Methods 0.000 claims description 43
- 238000000605 extraction Methods 0.000 claims description 19
- 238000012850 discrimination method Methods 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 14
- 238000009795 derivation Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 claims description 9
- 238000007906 compression Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 37
- 238000012545 processing Methods 0.000 description 80
- 230000008569 process Effects 0.000 description 19
- 238000004458 analytical method Methods 0.000 description 13
- 238000007781 pre-processing Methods 0.000 description 13
- 230000000007 visual effect Effects 0.000 description 12
- 238000013500 data storage Methods 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 238000003909 pattern recognition Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013476 bayesian approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】実世界情報を示すデータとしての新奇画像データIs全体の特徴を示す特徴ベクトルXsは、当該新奇画像データIsから抽出されたp(j)個のd次局所特徴ベクトルVk (j)の平均ベクトルμ(j)を構成する要素と、p(j)個のd次局所特徴ベクトルVk (j)間における第1次から第M次までのm次相関ベクトルを構成する要素とに基づいて取得される(ステップS130〜S180)。これにより、新奇画像データIsから抽出された多数かつ比較的高次の局所特徴ベクトルVk (j)に基づいて当該新奇画像データIs全体の特徴を精度よく表す特徴ベクトルXsを速やかに生成することが可能となる。
【選択図】図3
Description
1)画像の特徴的な点(特徴点)の検出と,その特徴点のスケール・オリエンテーションの正規化
2)特徴点の周辺における部分的な画像特徴(局所特徴)の記述
3)すべての局所特徴を利用して最終的な画像特徴を算出
ここで、上記1)および2)のプロセスに関しては、例えば上述の“SIFT記述子”のような精度のよい局所特徴をより少ない計算コストで抽出可能とするものが提案されている。しかしながら、上記3)の局所特徴からの最終的な特徴量の算出に関しては、計算コストの面での課題が依然として解消されておらず、最終的に得られた特徴量の精度(特徴の表現度)にも課題が残されている。例えば上述のBag-of-Keypoints法は、クラスタリングに極めて多大な時間を要するものであり、長時間かけて得られた特徴ベクトルを用いても画像認識精度の飛躍的改善が認められておらず、いわゆるスケーラビリティに劣っている。また、1つのデータ全体の特徴を示す特徴量の精度が低いと、新奇データの出現時における当該新奇データの内容判別(クラス判別)の精度もおのずと低下してしまうことになる。
実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する特徴量生成装置であって、
前記複数の高次局所特徴ベクトルの平均ベクトルを取得する平均取得手段と、
前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)を取得する相関取得手段と、
前記平均取得手段により取得された平均ベクトルを構成する要素と、前記相関取得手段により取得されたm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得する特徴ベクトル取得手段と、
を備えるものである。
実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する特徴量生成方法であって、
前記複数の高次局所特徴ベクトルの平均ベクトルと、前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得し、
前記取得された平均ベクトルを構成する要素と、前記取得されたm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得するものである。
実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する装置としてコンピュータを機能させる特徴量生成プログラムであって、
前記複数の高次局所特徴ベクトルの平均ベクトルを取得する平均取得モジュールと、
前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)を取得する相関取得モジュールと、
前記平均取得モジュールにより取得された平均ベクトルを構成する要素と、前記相関取得モジュールにより取得されたm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得する特徴ベクトル取得モジュールと、
を備えるものである。
実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別装置であって、
第h層で前記新奇データおよび前記既知データのそれぞれがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルに基づいて該領域ごとに導出された該特徴ベクトルを潜在空間に射影するための変換を記憶する変換記憶手段と、
第h層で前記新奇データがh×h個の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出する局所特徴抽出手段と、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから前記局所特徴抽出手段により抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得する特徴ベクトル取得手段と、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出する確率導出手段と、
前記確率導出手段により導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するクラス設定手段と、
を備えるものである。
実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別方法であって、
第h層で前記新奇データおよび前記既知データのそれぞれがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルに基づいて、該特徴ベクトルを潜在空間に射影するための変換を該領域ごとに導出し、
第h層で前記新奇データがh×h個の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出し、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得し、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出し、
前記導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するものである。
実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別装置としてコンピュータを機能させるクラス判別プログラムであって、
第h層で前記新奇データがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出する局所特徴抽出モジュールと、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから前記局所特徴抽出モジュールにより抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得する特徴ベクトル取得モジュールと、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを予め定められた該領域に対応した変換により潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出する確率導出モジュールと、
前記確率導出モジュールにより導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するクラス設定モジュールと、
を備えるものである。
手法[B]:A. Bosch, A. Zisserman, and X. Mu・noz. Scene classification using a hybrid generative/discriminative approach. IEEE Trans. Pattern Analysis and Machine Intelligence, pages 712・727, 2008.
手法[C]:S. Lazebnik, C. Schmid, and J. Ponce. Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories. In Proc. IEEE Conf. Computer Vision and Pattern Recognition, 2006.
手法[D]:O. Boiman, E. Shechtman, and M. Irani. In defense of nearest-neighbor based image classification. In Proc. IEEE Conf. Computer Vision and Pattern Recognition, 2008.
手法[E]:H. Zhang, A. C. Berg, M. Maire, and J. Malik. SVM-KNN: Discriminative nearest neighbor classification for visual category recognition. In Proc. IEEE Conf. Computer Vision and Pattern Recognition, volume 2, pages 2126・2136, 2006.
手法[F]:K. Grauman and T. Darrell. The pyramid match kernel: Efficient learning with sets of features. Journal of Machine Learning Research, 8:725・760, 2007.
手法[G]:N. Herv´e and N. Boujemaa. Image annotation: which approach for realistic databases? In Proc. ACM International Conference on Image and Video Retrieval, 2007
Claims (10)
- 実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する特徴量生成装置であって、
前記複数の高次局所特徴ベクトルの平均ベクトルを取得する平均取得手段と、
前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)を取得する相関取得手段と、
前記平均取得手段により取得された平均ベクトルを構成する要素と、前記相関取得手段により取得されたm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得する特徴ベクトル取得手段と、
を備える特徴量生成装置。 - 請求項1に記載の特徴量生成装置において、
実世界情報を示す1つのデータIから抽出されたp個のd次局所特徴ベクトルをVk=(v1,…,vd)としたときに(ただし、“p”および“d”はそれぞれ値2以上の整数であり、“k”は値1から値pまでの整数である)、前記平均取得手段は、前記p個のd次局所特徴ベクトルVkの平均ベクトルμを次式(1)に従って取得し、前記相関取得手段は、前記p個のd次局所特徴ベクトルVkの自己相関行列Rを次式(2)に従って取得すると共に該自己相関行列Rの上三角行列の要素を列挙して1次相関ベクトルupper(R)を取得し、前記特徴ベクトル取得手段は、前記特徴ベクトルをXとしたときに、次式(3)に従って平均ベクトルμの要素と1次相関ベクトルupper(R)の要素とを列挙することにより該特徴ベクトルXを取得する特徴量生成装置。
- 請求項1に記載の特徴量生成装置において、
前記相関取得手段は、主成分分析による前記高次局所特徴ベクトルの次元圧縮を伴って前記m次相関ベクトルを取得する特徴量生成装置。 - 請求項3に記載の特徴量生成装置において、
実世界情報を示すN個のデータI(j)が存在するとし(ただし、“N”は値2以上の整数であり、“j”は値1から値Nまでの整数である)、1つのデータI(j)から抽出されたp(j)個のd次局所特徴ベクトルをVk (j)=(v1,…,vd)とし(ただし、“p(j)”および“d”はそれぞれ値2以上の整数であり、“k”は値1から値pまでの整数である)、前記平均取得手段により取得される前記p(j)個のd次局所特徴ベクトルVkの平均ベクトルを次式(4)に示すμ(j)とし、前記p(j)個のd次局所特徴ベクトルVk (j)の自己相関行列を次式(5)に示すR(j)とし、前記N個のデータから抽出されたd次局所特徴ベクトル全体の自己相関行列を次式(6)に示すRallとし、新奇データをI(j+1)としたときに、前記相関取得手段は、次式(7)の固有値問題を解いて得られるd次よりも低次であるdl次の主成分空間への射影行列Udlと、新奇データI(j+1)から抽出されたp(j+1)個のd次局所特徴ベクトルVk (j+1)の自己相関行列R(j+1)とに基づく対角行列Udl TR(j+1)Udlを取得すると共に、該対角行列Udl TR(j+1)Udlの上三角行列の要素を列挙して1次相関ベクトルupper(Udl TR(j+1)Udl)を取得し、前記特徴ベクトル取得手段は、次式(8)に従って前記p(j+1)個のd次局所特徴ベクトルVk (j+1)の平均ベクトルμ(j+1)を構成する要素と1次相関ベクトルupper(Udl TR(j+1)Udl)を構成する要素とを列挙することにより新奇データI(j+1)の特徴ベクトルX(j+1)を取得する特徴量生成装置。
- 実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する特徴量生成方法であって、
前記複数の高次局所特徴ベクトルの平均ベクトルと、前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得し、
前記取得された平均ベクトルを構成する要素と、前記取得されたm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得する特徴量生成方法。 - 実世界情報を示す1つのデータから抽出された複数の高次局所特徴ベクトルを用いて前記1つのデータ全体の特徴を示す特徴ベクトルを生成する装置としてコンピュータを機能させる特徴量生成プログラムであって、
前記複数の高次局所特徴ベクトルの平均ベクトルを取得する平均取得モジュールと、
前記複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)を取得する相関取得モジュールと、
前記平均取得モジュールにより取得された平均ベクトルを構成する要素と、前記相関取得モジュールにより取得された前記複数の高次局所特徴ベクトルのm次相関ベクトルを構成する要素とに基づいて前記特徴ベクトルを取得する特徴ベクトル取得モジュールと、
を備える特徴量生成プログラム。 - 実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別装置であって、
第h層で前記新奇データおよび前記既知データのそれぞれがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルに基づいて該領域ごとに導出された該特徴ベクトルを潜在空間に射影するための変換を記憶する変換記憶手段と、
第h層で前記新奇データがh×h個の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出する局所特徴抽出手段と、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから前記局所特徴抽出手段により抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得する特徴ベクトル取得手段と、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出する確率導出手段と、
前記確率導出手段により導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するクラス設定手段と、
を備えるクラス判別装置。 - 請求項7に記載のクラス判別装置において、
第h層における第i番目の領域についての前記変換は、前記クラスの個数をG(ただし、“G”は値2以上の整数である)とし、前記クラスをCg(ただし、“g”は値1から値Gまでの整数である)とし、クラスCgからサンプルとして抽出される既知データであるサンプルデータの数をnとし(だだし、“n”は値1以上の整数である)、クラスCgに属する第j番目(ただし、“j”は値1から値nまでの整数である)のサンプルデータの第h層における第i番目の領域の特徴ベクトルをXj g(h,i)とし、クラスCgに属するサンプルデータの第h層におけるi番目の領域の特徴ベクトルXj g(h,i)の平均ベクトルをX-g(h,i)とし、クラスCgに属する全サンプルデータの第h層におけるi番目の領域の特徴ベクトルの平均ベクトルをμx (h,i)とし、第h層におけるi番目の領域についてのクラス内共分散行列を次式(9)に示すΣw (h,i)とし、第h層におけるi番目の領域についてのクラス外共分散行列を次式(10)に示すΣb (h,i)としたときに、次式(11)の固有値問題を解いて得られる射影行列W(h,i)であり(ただし、式(11)の“Λ(h,i)”は判別基準としての固有値を順番に対角に並べて得られる対角行列である)、
前記特徴ベクトルをXとし、前記射影行列をWとし、該特徴ベクトルXの射影点をuとしたときに、第1層から第H層までの各層で前記サンプルデータのそれぞれを分割して得られる領域それぞれの特徴ベクトルの射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルの射影点とは、次式(12)に従って導出され、
前記新奇データの特徴ベクトルをXsとしたときに、クラスCgから該特徴ベクトルXsが出現する確率p(Xs|Cg)は、次式(13)に基づいて導出されるクラス判別装置。ただし、式(13)における添え字(h,i)は第h層における第i番目の領域に由来することを示し、添え字sは新奇データに由来することを示し、添え字CgはクラスCgに属することを示し、添え字1…nはクラスCgに属する第1〜n番目のサンプルデータに由来することを示し、“αh”は、第h層に対して付与される重みであり、式(13)における“Z(h,i)Cg”および“Θ(h,i)”は次式(14)および(15)に示すとおりであり、式(14)におけるu-(h、j)CgはクラスCgに属する特徴ベクトルX(h、j)Cgの射影点u(h、j)Cgの平均であり、式(14)および(15)における“Ψ(h,i)”は次式(16)に示す潜在変数の分散であり、式(16)におけるΛ(h,i)は第h層における第i番目の領域における固有値問題の解である固有値を順番に対角に並べて得られる対角行列である。
- 実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別方法であって、
第h層で前記新奇データおよび前記既知データのそれぞれがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルに基づいて、該特徴ベクトルを潜在空間に射影するための変換を該領域ごとに導出し、
第h層で前記新奇データがh×h個の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出し、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得し、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出し、
前記導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するクラス判別方法。 - 実世界情報を示す新奇データがそれぞれ少なくとも1つの既知データに対応した複数のクラスのいずれに属するかを判別するクラス判別装置としてコンピュータを機能させるクラス判別プログラムであって、
第h層で前記新奇データがh×h個(ただし、“h”は値1から値Hまでの整数であり、“H”は値2以上の整数である)の領域に分割されるとして、第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから複数の高次局所特徴ベクトルを抽出する局所特徴抽出モジュールと、
第1層から第H層までの各層で前記新奇データを分割して得られる領域のそれぞれから前記局所特徴抽出モジュールにより抽出された複数の高次局所特徴ベクトルの平均ベクトルと、該複数の高次局所特徴ベクトル間における第1次から第M次までのm次相関ベクトル(ただし、“M”は値1以上の整数であり、“m”は値1から値Mまでの整数である)とを取得すると共に、該平均ベクトルを構成する要素と該m次相関ベクトルを構成する要素とに基づいて前記領域それぞれの特徴ベクトルを取得する特徴ベクトル取得モジュールと、
前記クラスごとに、第1層から第H層までの各層で前記既知データのそれぞれを分割して得られる領域それぞれの特徴ベクトルを予め定められた該領域に対応した変換により潜在空間に射影して得られる射影点と、第1層から第H層までの各層で前記新奇データを分割して得られる領域それぞれの特徴ベクトルを該領域に対応した前記変換により前記潜在空間に射影して得られる射影点とに基づいて、前記既知データの第h層における第i番目(ただし、“i”は値1から値h2までの整数である)の領域の特徴ベクトルから前記新奇データの第h層における第i番目の領域の特徴ベクトルが出現する確率のi=1からi=h2かつ第1層から第H層までの総和を前記クラスから前記新奇データの特徴ベクトルが出現する確率として導出する確率導出モジュールと、
前記確率導出モジュールにより導出された確率が最大となるクラスを前記新奇データが属するクラスとして設定するクラス設定モジュールと、
を備えるクラス判別プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009121244A JP5382786B2 (ja) | 2009-05-19 | 2009-05-19 | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム |
PCT/JP2010/058427 WO2010134539A1 (ja) | 2009-05-19 | 2010-05-19 | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009121244A JP5382786B2 (ja) | 2009-05-19 | 2009-05-19 | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010271787A true JP2010271787A (ja) | 2010-12-02 |
JP5382786B2 JP5382786B2 (ja) | 2014-01-08 |
Family
ID=43126216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009121244A Expired - Fee Related JP5382786B2 (ja) | 2009-05-19 | 2009-05-19 | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5382786B2 (ja) |
WO (1) | WO2010134539A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
JP7477546B2 (ja) | 2022-02-14 | 2024-05-01 | 矢崎総業株式会社 | 温度センサおよびセンサの取付け構造 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015125760A (ja) * | 2013-12-27 | 2015-07-06 | 日立建機株式会社 | 鉱山用作業機械 |
JP6460332B2 (ja) * | 2015-04-20 | 2019-01-30 | 国立大学法人 東京大学 | 特徴量生成ユニット、照合装置、特徴量生成方法、および特徴量生成プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004326693A (ja) * | 2003-04-28 | 2004-11-18 | Sony Corp | 画像認識装置及び方法、並びにロボット装置 |
-
2009
- 2009-05-19 JP JP2009121244A patent/JP5382786B2/ja not_active Expired - Fee Related
-
2010
- 2010-05-19 WO PCT/JP2010/058427 patent/WO2010134539A1/ja active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004326693A (ja) * | 2003-04-28 | 2004-11-18 | Sony Corp | 画像認識装置及び方法、並びにロボット装置 |
Non-Patent Citations (2)
Title |
---|
JPN6013043724; Yan Ke, Rahul Sukthankar: 'PCA-SIFT: a more distinctive representation for local image descriptors' Proc. of IEEEConference on Computer Vision and Pattern Recognition (CVPR),2004 Vol 2, 20040627, p.506-513 * |
JPN7013003268; Hideki Nakayama, Tatsuya Harada, Yasuo Kuniyoshi: 'Scene Classification using Generalized Local Correlation' MVA2009 IAPR Conference on Machine Vision Application , 20090520, p.195-198 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
JP7477546B2 (ja) | 2022-02-14 | 2024-05-01 | 矢崎総業株式会社 | 温度センサおよびセンサの取付け構造 |
Also Published As
Publication number | Publication date |
---|---|
WO2010134539A1 (ja) | 2010-11-25 |
JP5382786B2 (ja) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gosselin et al. | Revisiting the fisher vector for fine-grained classification | |
KR101919831B1 (ko) | 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법 | |
Roy et al. | Unsupervised universal attribute modeling for action recognition | |
CN103425996B (zh) | 一种并行分布式的大规模图像识别方法 | |
JP5458815B2 (ja) | マルチメディア検索システム | |
Ju et al. | Fusing global and local features for generalized ai-synthesized image detection | |
WO2019167784A1 (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
Han et al. | High-order statistics of microtexton for hep-2 staining pattern classification | |
JP5382786B2 (ja) | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム | |
CN108108769B (zh) | 一种数据的分类方法、装置及存储介质 | |
CN115393666A (zh) | 图像分类中基于原型补全的小样本扩充方法及系统 | |
CN111414958B (zh) | 一种视觉词袋金字塔的多特征图像分类方法及系统 | |
Dong et al. | A supervised dictionary learning and discriminative weighting model for action recognition | |
Angelopoulou et al. | Evaluation of different chrominance models in the detection and reconstruction of faces and hands using the growing neural gas network | |
JP5197492B2 (ja) | 半教師画像認識検索装置、半教師画像認識検索方法、及びプログラム | |
Elsayed et al. | Hand gesture recognition based on dimensionality reduction of histogram of oriented gradients | |
Dong et al. | Scene-oriented hierarchical classification of blurry and noisy images | |
Bissacco et al. | Gait recognition using dynamic affine invariants | |
Naik Bukht et al. | A Novel Human Interaction Framework Using Quadratic Discriminant Analysis with HMM. | |
Elsayed et al. | Hybrid method based on multi-feature descriptor for static sign language recognition | |
JP5683287B2 (ja) | パターン認識装置及びパターン認識方法 | |
Rosado et al. | Semantic-based image analysis with the goal of assisting artistic creation | |
CN111353353A (zh) | 跨姿态的人脸识别方法及装置 | |
JP6282121B2 (ja) | 画像認識装置、画像認識方法およびプログラム | |
Khalid | Robust shape matching using global feature space representation of contours |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5382786 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |