JP6193779B2 - 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム - Google Patents
特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム Download PDFInfo
- Publication number
- JP6193779B2 JP6193779B2 JP2014028980A JP2014028980A JP6193779B2 JP 6193779 B2 JP6193779 B2 JP 6193779B2 JP 2014028980 A JP2014028980 A JP 2014028980A JP 2014028980 A JP2014028980 A JP 2014028980A JP 6193779 B2 JP6193779 B2 JP 6193779B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature vector
- bit
- logical operation
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 74
- 239000013598 vector Substances 0.000 claims description 214
- 230000008707 rearrangement Effects 0.000 claims description 38
- 230000009466 transformation Effects 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 34
- 230000010354 integration Effects 0.000 claims description 16
- 238000003491 array Methods 0.000 claims description 8
- 230000001965 increasing effect Effects 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 10
- 230000000052 comparative effect Effects 0.000 description 9
- 238000000034 method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/14—Conversion to or from non-weighted codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/28—Indexing scheme for image data processing or generation, in general involving image processing hardware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Description
f(x)=wTx+b ・・・(1)
ここで、xは特徴ベクトルであり、wは重みベクトルであり、bはバイアスである。線形識別器は、特徴ベクトルxが与えられたときに、f(x)がゼロより大きいか小さいかによって、二値分類を行う。
yij=xiyj/(xi+yj) ・・・(2)
このとき、FIND特徴量は、y=(y11,y12,・・・,yDD)Tで与えられる。
第1の実施の形態の特徴量変換装置は、二値のHOG特徴量である特徴ベクトルが与えられたときに、この特徴ベクトルに対して非線形変換を行うことで、識別力の向上した特徴ベクトル(以下、「非線形変換特徴ベクトル」という。)を得る。例えば、8ピクセル×8ピクセルを1単位とした領域をセルと定義したとき、HOG特徴量は、2×2のセルで構成されるブロックごとに32次元のベクトルとして得られる。また、本実施の形態では、このHOG特徴量が二値化されたベクトルとして得られているものとする。本実施の形態の特徴量変換装置の構成を説明する前に、二値の特徴ベクトルに対して非線形変換を行ってFIND相当の共起要素を有する非線形変換特徴ベクトルを求める原理について説明する。
a×b/(|a|+|b|) ・・・(2)
ここで、a、bは各要素の値(「+1」か「−1」)である。a、bは、「+1」又は「−1」のいずれかであるので、その組み合わせは4通りに限られる。よって、特徴ベクトルの要素が「+1」か「−1」の二値である場合には、この調和平均はXORと等価になる。
次に、第2の実施の形態として、HOG特徴量が二値ベクトルではなく、実数ベクトルとして得られている場合について、それを識別力の高い二値ベクトルに変換する特徴量変換装置について説明する。
111〜11N ビット再配列器
121〜12N 論理演算器
13、23 特徴統合器
211〜21N 二値化器
221〜22N 共起要素生成器
100 特徴ベクトルのビット列
101、201、301、401 再配列ビット列
102、202、302、402 論理演算ビット列
Claims (15)
- 入力された二値の特徴ベクトルの要素をそれぞれ異なる配列に再配列した複数の再配列ビット列を生成するビット再配列部と、
前記複数の再配列ビット列の各々と入力された前記特徴ベクトルとの論理演算をそれぞれ行って、複数の論理演算ビット列を生成する論理演算部と、
生成された複数の前記論理演算ビット列を統合して、非線形変換特徴ベクトルを生成する特徴統合部と、
を備えたことを特徴とする特徴量変換装置。 - 前記特徴統合部は、さらに、入力された前記特徴ベクトルの要素も生成された複数の前記論理演算ビット列とともに統合することを特徴とする請求項1に記載の特徴量変換装置。
- 前記論理演算部は、前記再配列ビット列と、入力された前記特徴ベクトルとの排他的論理和を計算することを特徴とする請求項1又は2に記載の特徴量変換装置。
- 前記ビット再配列部は、入力された前記特徴ベクトルの要素に対して、キャリーなしローテートシフトを行うことで前記再配列ビット列を生成することを特徴とする請求項1ないし3のいずれかに記載の特徴量変換装置。
- 入力された前記特徴ベクトルがd次元であるときに、d/2個の前記ビット再配列部を備えたことを特徴とする請求項4に記載の特徴量変換装置。
- 前記ビット再配列部は、入力された前記特徴ベクトルの要素に対して、ランダムな再配列を行うことを特徴とする請求項1ないし3のいずれかに記載の特徴量変換装置。
- 入力された実数の特徴ベクトルを二値化して前記二値の特徴ベクトルを生成する複数の二値化部と、
前記複数の前記二値化部の各々に対応する複数の共起要素生成部と、
を備え、
前記複数の共起要素生成部の各々は、前記複数のビット再配列部と前記複数の論理演算部とを備え、
前記複数の共起要素生成部の各々には、対応する前記二値化部から前記二値の特徴ベクトルが入力され、
前記特徴統合部は、複数の前記共起要素生成部の複数の前記論理演算部の各々によって生成された前記論理演算ビット列のすべてを統合して、前記非線形変換ベクトルを生成することを特徴とする請求項1ないし6のいずれかに記載の特徴量変換装置。 - 前記二値の特徴ベクトルはHOG特徴量を二値化して得られた特徴ベクトルであることを特徴とする請求項1ないし7のいずれかに記載の特徴量変換装置。
- 入力された二値の特徴ベクトルの要素を再配列して再配列ビット列を生成するビット再配列部と、
前記再配列ビット列と入力された前記特徴ベクトルとの論理演算を行って、論理演算ビット列を生成する論理演算部と、
前記特徴ベクトルの要素と生成された前記論理演算ビット列を統合して、非線形変換特徴ベクトルを生成する特徴統合部と、
を備えたことを特徴とする特徴量変換装置。 - 入力された二値の特徴ベクトルの要素をそれぞれ異なる配列に再配列した再配列ビット列を生成する複数のビット再配列部と、
前記複数のビット再配列部にて生成されたそれぞれの前記再配列ビット列どうしの論理演算を行って、論理演算ビット列を生成する論理演算部と、
前記特徴ベクトルの要素と生成された複数の前記論理演算ビット列を統合して、非線形変換特徴ベクトルを生成する特徴統合部と、
を備えたことを特徴とする特徴量変換装置。 - 入力された二値の特徴ベクトルの要素をそれぞれ異なる配列に再配列した再配列ビット列を生成する複数のビット再配列部と、
前記複数のビット再配列部にて生成されたそれぞれの前記再配列ビット列どうしの論理演算を行って、それぞれ論理演算ビット列を生成する複数の論理演算部と、
生成された複数の前記論理演算ビット列を統合して、非線形変換特徴ベクトルを生成する特徴統合部と、
を備えたことを特徴とする特徴量変換装置。 - 請求項1ないし11のいずれかに記載の特徴量変換装置と、
前記特徴量変換装置にて生成された前記非線形変換特徴ベクトルを用いて学習を行う学習部と、
を備えたことを特徴とする学習装置。 - 請求項1ないし11のいずれかに記載の特徴量変換装置と、
前記特徴量変換装置にて生成された前記非線形変換特徴ベクトルを用いて認識を行う認識部と、
を備えたことを特徴とする認識装置。 - 前記認識部は、前記認識における重みベクトルと前記非線形変換特徴ベクトルのとの内積計算において、分布の広い順又はエントロピーの値が高い順に計算をして、前記内積が認識のための所定の閾値より大きくなる、又は小さくなると判断できる時点で、前記内積の計算を打ち切ることを特徴とする請求項13に記載の認識装置。
- コンピュータを、
入力された二値の特徴ベクトルの要素をそれぞれ異なる配列に再配列してそれぞれ再配列ビット列を生成する複数のビット再配列部、
前記複数の再配列ビット列の各々と入力された前記特徴ベクトルとの論理演算をそれぞれ行って、それぞれ論理演算ビット列を生成する複数の論理演算部、及び
生成された複数の前記論理演算ビット列を統合して、非線形変換特徴ベクトルを生成する特徴統合部、
として機能させることを特徴とする特徴量変換プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014028980A JP6193779B2 (ja) | 2013-06-03 | 2014-02-18 | 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム |
US14/895,198 US20160125271A1 (en) | 2013-06-03 | 2014-05-28 | Feature amount conversion apparatus, learning apparatus, recognition apparatus, and feature amount conversion program product |
PCT/JP2014/002816 WO2014196167A1 (ja) | 2013-06-03 | 2014-05-28 | 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム製品 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013116918 | 2013-06-03 | ||
JP2013116918 | 2013-06-03 | ||
JP2014028980A JP6193779B2 (ja) | 2013-06-03 | 2014-02-18 | 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015015014A JP2015015014A (ja) | 2015-01-22 |
JP6193779B2 true JP6193779B2 (ja) | 2017-09-06 |
Family
ID=52007826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014028980A Active JP6193779B2 (ja) | 2013-06-03 | 2014-02-18 | 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20160125271A1 (ja) |
JP (1) | JP6193779B2 (ja) |
WO (1) | WO2014196167A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6430228B2 (ja) * | 2014-12-15 | 2018-11-28 | 株式会社Screenホールディングス | 画像分類装置および画像分類方法 |
JP6558765B2 (ja) * | 2014-12-18 | 2019-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 処理装置、処理方法、推測装置、推測方法、およびプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5347612A (en) * | 1986-07-30 | 1994-09-13 | Ricoh Company, Ltd. | Voice recognition system and method involving registered voice patterns formed from superposition of a plurality of other voice patterns |
EP0567680B1 (en) * | 1992-04-30 | 1999-09-22 | International Business Machines Corporation | Pattern recognition and validation, especially for hand-written signatures |
DE19623033C1 (de) * | 1996-06-08 | 1997-10-16 | Aeg Electrocom Gmbh | Verfahren und Anordnung zur Mustererkennung auf statistischer Basis |
US7734652B2 (en) * | 2003-08-29 | 2010-06-08 | Oracle International Corporation | Non-negative matrix factorization from the data in the multi-dimensional data table using the specification and to store metadata representing the built relational database management system |
US7574409B2 (en) * | 2004-11-04 | 2009-08-11 | Vericept Corporation | Method, apparatus, and system for clustering and classification |
US8145656B2 (en) * | 2006-02-07 | 2012-03-27 | Mobixell Networks Ltd. | Matching of modified visual and audio media |
JP5258915B2 (ja) * | 2011-02-28 | 2013-08-07 | 株式会社デンソーアイティーラボラトリ | 特徴変換装置、それを含む類似情報探索装置、コード化パラメータ生成方法、及びコンピュータ・プログラム |
EP2782066B1 (en) * | 2011-11-18 | 2019-09-11 | NEC Corporation | Local feature descriptor extracting apparatus, method for extracting local feature descriptor, and program |
US8886635B2 (en) * | 2012-05-23 | 2014-11-11 | Enswers Co., Ltd. | Apparatus and method for recognizing content using audio signal |
US9298988B2 (en) * | 2013-11-08 | 2016-03-29 | Analog Devices Global | Support vector machine based object detection system and associated method |
US10521441B2 (en) * | 2014-01-02 | 2019-12-31 | The George Washington University | System and method for approximate searching very large data |
-
2014
- 2014-02-18 JP JP2014028980A patent/JP6193779B2/ja active Active
- 2014-05-28 WO PCT/JP2014/002816 patent/WO2014196167A1/ja active Application Filing
- 2014-05-28 US US14/895,198 patent/US20160125271A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20160125271A1 (en) | 2016-05-05 |
JP2015015014A (ja) | 2015-01-22 |
WO2014196167A1 (ja) | 2014-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Highly efficient forward and backward propagation of convolutional neural networks for pixelwise classification | |
Rassem et al. | Completed local ternary pattern for rotation invariant texture classification | |
Rathgeb et al. | Iris-biometric hash generation for biometric database indexing | |
Pan et al. | Central pixel selection strategy based on local gray-value distribution by using gradient information to enhance LBP for texture classification | |
CN102508910A (zh) | 基于多哈希表映射误差最小化的图像检索方法 | |
Wang et al. | Learning efficient binarized object detectors with information compression | |
CN103310236A (zh) | 基于局部二维特征的拼接图像检测方法及系统 | |
Lin et al. | Tsrformer: Table structure recognition with transformers | |
EP3588352B1 (en) | Byte n-gram embedding model | |
Chen | Scalable spectral clustering with cosine similarity | |
JP2015230715A (ja) | 特徴量演算装置、特徴量演算方法、及び特徴量演算プログラム | |
Arróspide et al. | A study of feature combination for vehicle detection based on image processing | |
Al‐Berry et al. | Fusing directional wavelet local binary pattern and moments for human action recognition | |
JP6193779B2 (ja) | 特徴量変換装置、学習装置、認識装置、及び特徴量変換プログラム | |
Xie et al. | Binarization based implementation for real-time human detection | |
Yuan et al. | Completed hybrid local binary pattern for texture classification | |
Xu et al. | Application of Neural Network in Handwriting Recognition | |
Said et al. | Efficient and high‐performance pedestrian detector implementation for intelligent vehicles | |
Wongthanavasu et al. | Cellular automata for pattern recognition | |
Sharif et al. | A comparison between hybrid models for classifying Bangla isolated basic characters | |
Hsiao et al. | Hardware design of histograms of oriented gradients based on local binary pattern and binarization | |
Linh et al. | Enhance deep learning model for malware detection with a new image representation method | |
CN116010520B (zh) | 基于区块链的保密数据存储方法、装置、设备及存储介质 | |
Wang et al. | Image representation and deep inception-attention for file-type and malware classification | |
Safonov et al. | Document image classification on the basis of layout information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6193779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |