JP2017129990A - 画像認識装置、画像認識方法、及び画像認識プログラム - Google Patents
画像認識装置、画像認識方法、及び画像認識プログラム Download PDFInfo
- Publication number
- JP2017129990A JP2017129990A JP2016008273A JP2016008273A JP2017129990A JP 2017129990 A JP2017129990 A JP 2017129990A JP 2016008273 A JP2016008273 A JP 2016008273A JP 2016008273 A JP2016008273 A JP 2016008273A JP 2017129990 A JP2017129990 A JP 2017129990A
- Authority
- JP
- Japan
- Prior art keywords
- covariance
- image
- image recognition
- local feature
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000010606 normalization Methods 0.000 claims abstract description 13
- 238000009795 derivation Methods 0.000 claims abstract 4
- 238000013527 convolutional neural network Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 230000007935 neutral effect Effects 0.000 abstract 1
- 238000012549 training Methods 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 11
- 235000012054 meals Nutrition 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
図1に示すように、学習済みCNNから有効な特徴量を得るために、全結合層より以前の畳み込み層の特徴マップから特徴量を抽出する。当該畳み込み層には画像のedgeやcornerなど基礎的な特徴が含まれる。当該画像の特徴は、全結合層と比較して、学習用画像データセットの内容に影響をうけない。そこで、畳み込み層の特徴マップの共分散行列を特徴量として求める。なお、本発明では、ニューラルネットワークや識別器の学習とニューラルネットワークや識別器の訓練は同じ意味で用いている。
図2は、特徴マップ共分散記述子を利用した、画像認識システムの概要図である。まず、識別器を学習するためのラベルが付与された認識対象ドメインの画像で構成された訓練画像データセットと、特徴マップ共分散記述子を抽出するための学習済みCNNを用意する。
食事画像データセットETHZ Food-101 (Food-101)(非特許文献2を参照)を用いて認識精度の評価を行った。Food-101には、101個のクラスに分類された101,000枚の食事画像が含まれている。各クラスには、750枚の訓練画像、250枚のテスト画像が含まれている。食事画像の認識を課題として選択した理由は、一般に公開されている学習済みCNNは、ImageNetから取得した種々雑多な画像で学習されている。認識対象を食事画像に絞ることで、学習に用いた画像と、認識対象となる画像の分野が異なっていても、優れた認識精度が得られるかを確認できる。
本発明では、OverFeatの第1層の特徴マップを使用したもの(FMCD-L1)、第2層の特徴マップから抽出したもの(FMCD-L2)、それらの要素を並べて1つのベクトルとすることで連結したもの(FMCD-L1+FMCD-L2)、全結合層と連結したもの(FMCD-L1+FUL及びFMCD-L2+FUL)、全てを連結したもの(FMCD-L1+FMCD-L2+FUL)を用いた。識別器には全て線形SVMを用いた。
Claims (9)
- 複数の畳み込み層を備える畳み込みニューラルネットワークを使用する画像認識装置であって、
画像から共分散記述子を抽出する演算部と、画像データセットに含まれる画像について前記演算部によって処理されて抽出された共分散記述子を記憶する記憶部と、新たに入力される画像について前記演算部によって処理されて抽出される共分散記述子を前記記憶部に記憶される共分散記述子と比較する識別処理部とを備え、
前記演算部は、前記畳み込み層のうちの任意の層から出力される特徴マップから局所特徴量を演算する局所特徴量演算手段と、前記局所特徴量について共分散行列を導く共分散行列導出手段と、前記共分散行列をベクトル化するための演算を行うベクトル演算手段と、前記ベクトルを正規化する正規化手段とを備えることを特徴とする画像認識装置。 - 前記局所特徴量演算手段は、前記畳み込みニューラルネットワークの全ての畳み込み層から出力される特徴マップについて局所特徴量を演算するものであることを特徴とする請求項1に記載の画像認識装置。
- 前記局所特徴量演算手段は、一つの畳み込み層からdチャンネルで大きさw×hの特徴マップが得られるとき、前記特徴マップをn=w×hの点によるd次元の局所特徴量を演算するものであることを特徴とする請求項1または2に記載の画像認識装置。
- 前記演算部は、前記共分散行列の大きさをd×dとするとき、抽出される共分散記述子の次元が(d2+d)/2であることを特徴とする請求項3に記載の画像認識装置。
- 複数の畳み込み層を備える畳み込みニューラルネットワークを使用する画像認識方法であって、
画像から共分散記述子を抽出する抽出ステップと、画像データセットに含まれる画像について前記抽出ステップによって処理されて抽出された共分散記述子を記憶する記憶ステップと、新たに入力される画像について前記抽出ステップによって処理されて抽出される共分散記述子を前記記憶ステップによって記憶される共分散記述子と比較する識別処理ステップとを備え、
前記抽出ステップは、前記畳み込み層のうちの任意の層から出力される特徴マップから局所特徴量を演算する局所特徴量演算ステップと、前記局所特徴量について共分散行列を導く共分散行列導出ステップと、前記共分散行列をベクトル化するための演算を行うベクトル演算ステップと、前記ベクトルを正規化する正規化ステップとを含むことを特徴とする画像認識方法。 - 前記局所特徴量演算ステップは、前記畳み込みニューラルネットワークの全ての畳み込み層から出力される特徴マップについて局所特徴量を演算するものであることを特徴とする請求項5に記載の画像認識方法。
- 前記局所特徴量演算ステップは、一つの畳み込み層からdチャンネルで大きさw×hの特徴マップが得られるとき、前記特徴マップをn=w×hの点によるd次元の局所特徴量を演算するものであることを特徴とする請求項5または6に記載の画像認識方法。
- 前記抽出ステップは、前記共分散行列の大きさをd×dとするとき、抽出される共分散記述子の次元が(d2+d)/2であることを特徴とする請求項7に記載の画像認識方法。
- 複数の畳み込み層を備える畳み込みニューラルネットワークを使用する画像認識のためのコンピュータプログラムであって、コンピュータを、
画像から共分散記述子を抽出する演算手段と、画像データセットに含まれる画像について前記演算部によって処理されて抽出された共分散記述子を記憶する記憶手段と、新たに入力される画像について前記演算部によって処理されて抽出される共分散記述子を前記記憶部に記憶される共分散記述子と比較する識別処理手段として機能させ、
さらに、前記演算手段において、前記畳み込み層のうちの任意の層から出力される特徴マップから局所特徴量を演算する局所特徴量演算手段と、前記局所特徴量について共分散行列を導く共分散行列導出手段と、前記共分散行列をベクトル化するための演算を行うベクトル演算手段と、前記ベクトルを正規化する正規化手段として機能させることを特徴とする画像認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016008273A JP6713162B2 (ja) | 2016-01-19 | 2016-01-19 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016008273A JP6713162B2 (ja) | 2016-01-19 | 2016-01-19 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017129990A true JP2017129990A (ja) | 2017-07-27 |
JP6713162B2 JP6713162B2 (ja) | 2020-06-24 |
Family
ID=59395645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016008273A Active JP6713162B2 (ja) | 2016-01-19 | 2016-01-19 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6713162B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427879A (zh) * | 2019-08-01 | 2019-11-08 | 齐鲁工业大学 | 一种基于图像处理和机器学习的人脸识别方法及系统 |
WO2019230666A1 (ja) * | 2018-06-01 | 2019-12-05 | 日本電信電話株式会社 | 特徴量抽出装置、方法、及びプログラム |
JP2020060838A (ja) * | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | 学習方法および学習システム |
JP2020533725A (ja) * | 2017-09-12 | 2020-11-19 | ナントミクス,エルエルシー | 組織レベルのホールスライド画像の少数ショット学習ベースの画像認識 |
US11682195B2 (en) | 2016-10-21 | 2023-06-20 | Nantomics, Llc | Digital histopathology and microdissection |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310796A (ja) * | 2007-06-15 | 2008-12-25 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法 |
-
2016
- 2016-01-19 JP JP2016008273A patent/JP6713162B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310796A (ja) * | 2007-06-15 | 2008-12-25 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法 |
Non-Patent Citations (3)
Title |
---|
中山 英樹: ""深層畳み込みニューラルネットによる画像特徴抽出と転移学習"", 電子情報通信学会技術研究報告, vol. 115, no. 146, JPN6019046009, 9 July 2015 (2015-07-09), JP, pages 55 - 59, ISSN: 0004162173 * |
山下 亮、外2名: ""ARCOによる顔検出を併用した人誤検出の棄却について"", 情報処理学会 画像の認識・理解シンポジウム(MIRU2011)論文集, vol. 2011, JPN6019046016, 20 July 2011 (2011-07-20), JP, pages 608 - 614, ISSN: 0004254290 * |
韓 先花、陳 延偉: ""Deep Convolutional Neural Networkによる食事画像認識"", 情報処理学会 研究報告, vol. Vol.2015-CVIM-198, No.12, JPN6019046012, 7 September 2015 (2015-09-07), JP, pages 1 - 6, ISSN: 0004162174 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11682195B2 (en) | 2016-10-21 | 2023-06-20 | Nantomics, Llc | Digital histopathology and microdissection |
US12002262B2 (en) | 2016-10-21 | 2024-06-04 | Nantomics, Llc | Digital histopathology and microdissection |
JP2020533725A (ja) * | 2017-09-12 | 2020-11-19 | ナントミクス,エルエルシー | 組織レベルのホールスライド画像の少数ショット学習ベースの画像認識 |
JP7061671B2 (ja) | 2017-09-12 | 2022-04-28 | ナントミクス,エルエルシー | デジタル画像の対象領域の少なくとも1つの形状を生成する方法および装置ならびに機械学習システムを訓練するための訓練データを生成する方法 |
WO2019230666A1 (ja) * | 2018-06-01 | 2019-12-05 | 日本電信電話株式会社 | 特徴量抽出装置、方法、及びプログラム |
JP2020060838A (ja) * | 2018-10-05 | 2020-04-16 | 株式会社デンソーアイティーラボラトリ | 学習方法および学習システム |
JP7208758B2 (ja) | 2018-10-05 | 2023-01-19 | 株式会社デンソーアイティーラボラトリ | 学習方法および学習システム |
CN110427879A (zh) * | 2019-08-01 | 2019-11-08 | 齐鲁工业大学 | 一种基于图像处理和机器学习的人脸识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6713162B2 (ja) | 2020-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8675974B2 (en) | Image processing apparatus and image processing method | |
Tabia et al. | Covariance-based descriptors for efficient 3D shape matching, retrieval, and classification | |
Guo et al. | Local directional derivative pattern for rotation invariant texture classification | |
JP6713162B2 (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
Gaber et al. | Plant identification: Two dimensional-based vs. one dimensional-based feature extraction methods | |
Klein et al. | Salient pattern detection using W 2 on multivariate normal distributions | |
Tatsuma et al. | Food image recognition using covariance of convolutional layer feature maps | |
CN108764351B (zh) | 一种基于测地距离的黎曼流形保持核学习方法及装置 | |
Jain et al. | Comparative study on SIFT and SURF face feature descriptors | |
Huang et al. | A Novel Approach for Interest Point Detection via Laplacian‐of‐Bilateral Filter | |
JP2019021100A (ja) | 画像探索装置、商品認識装置および画像探索プログラム | |
Terzić et al. | Fast cortical keypoints for real-time object recognition | |
Ramesh et al. | Multiple object cues for high performance vector quantization | |
Yang et al. | Evaluating contour segment descriptors | |
Choi | Spatial pyramid face feature representation and weighted dissimilarity matching for improved face recognition | |
Bai et al. | Informative patches sampling for image classification by utilizing bottom-up and top-down information | |
Liang et al. | Random forest with suppressed leaves for Hough voting | |
Estrada et al. | Appearance-based keypoint clustering | |
Yuan et al. | Research of batik image classification based on support vector machine | |
Shukla et al. | Enhanced Bag-of-Features Method Using Grey Wolf Optimization for Automated Face Retrieval | |
Arulprakash et al. | A study on indirect performance parameters of object detection | |
Kim et al. | Feature scalability for a low complexity face recognition with unconstrained spatial resolution | |
Gao et al. | Learning warps based similarity for pose-unconstrained face recognition | |
JP6668228B2 (ja) | 被写体識別装置、方法、及びプログラム | |
Zhong et al. | S-sift: A shorter sift without least discriminability visual orientation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190116 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200424 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6713162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |