JP2019197445A - 画像認識装置、画像認識方法、およびプログラム - Google Patents
画像認識装置、画像認識方法、およびプログラム Download PDFInfo
- Publication number
- JP2019197445A JP2019197445A JP2018091882A JP2018091882A JP2019197445A JP 2019197445 A JP2019197445 A JP 2019197445A JP 2018091882 A JP2018091882 A JP 2018091882A JP 2018091882 A JP2018091882 A JP 2018091882A JP 2019197445 A JP2019197445 A JP 2019197445A
- Authority
- JP
- Japan
- Prior art keywords
- block
- blocks
- image recognition
- convolution
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
Description
まず、本発明の実施形態の概要について説明する。
図1を参照して、本発明の実施の形態に係る画像認識装置100の構成について説明する。図1は、本発明の実施の形態に係る画像認識装置100の構成を示すブロック図である。
図6は、本発明の実施の形態に係る画像認識処理ルーチンを示すフローチャートである。
本実施形態では学習済みのCNNを仮定して認識処理を説明したが、本実施形態における構成のCNNも、非特許文献1〜3にあるような公知のCNNと同様に、誤差逆伝搬法(確率勾配法などのアルゴリズム)により、同様に学習することが可能である。
次に、本実施形態に係る画像認識装置100の有効性を示すための実験結果について説明する。以下、本実施形態に係る画像認識装置100の第一ブロック集約部104、第二ブロック集約部106で用いたプーリング手法をParallel Grid Pooling(PGP)と呼ぶ。
画像分類のタスクにおいて標準的なデータセットであるCIFAR−10、CIFAR−100(参考文献1)、SVHN(参考文献2)を用いた実験を行った。
[参考文献1]G. E. Hinton: “Learning multiple layers of representation”, Trends in cognitive sciences, 11, 10, 2007, pp. 428-434.
[参考文献2] Y. Netzer, T. Wang, A. Coates, A. Bissacco, B. Wu and A. Y. Ng: “Reading digits in natural images with unsupervised feature learning”, NIPS Workshop on Machine Learning Systems", Vol. 2011, p. 5.
[参考文献3]G. Huang, Z. Liu, K. Q. Weinberger and L. van der Maaten:“Densely connected convolutional networks”, CVPR (2017).
[参考文献4]S. Xie, R. Girshick, Piotr, Z. Tu, K. He:“Aggregated residual transformations for deep neural networks”, CVPR (2017).
[参考文献5]S. Zagoruyko and N. Komodakis: “Wide residual networks”, BMVC (2016).
PGPの有効性を確認するため、畳み込み層として複数種類のネットワークモデルを用いて実験を行った。
学習率のスケジューリングにはCosine Annealing(参考文献6)を用いた。
[参考文献6]I. Loshchilov and F. Hutter: “SGDR: stochastic gradient descent with restarts”, ICLR (2017).
[参考文献7]K. He, X. Zhang, S. Ren and J. Sun: “Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification”, ICCV, 2015, pp. 1026-103.
各データセットに対して各種ネットワークモデルを学習した結果のテストエラー率をベースライン(Baseline)として評価を行った。
101 CNN記憶部
102 入力部
103 畳み込み部
104 第一ブロック集約部
105 第一ブロック畳み込み部
106 第二ブロック集約部
107 第二ブロック畳み込み部
108 認識処理部
109 出力部
110 画像
120 認識結果
Claims (7)
- 入力された1以上のチャネルを有する画像に対して、畳み込みニューラルネットワークを用いた画像認識を行う画像認識装置であって、
前記畳み込みニューラルネットワークは、
少なくとも一つの畳み込み層と、
前記畳み込み層の出力を、所定の2方向に対して相互排反である1以上のブロックに分割し、前記1以上のブロックの各々について、前記ブロックに含まれる前記畳み込み層の出力を、前記ブロック内における位置に応じて相互排反な複数のサブブロックに分割し、全てのブロックにわたり、前記位置が対応するサブブロックに含まれる要素の値を集約して、前記複数のサブブロックの各々における集約結果を出力するプーリング層と、
を含む画像認識装置。 - 前記所定の2方向は、幅方向及び高さ方向であり、
前記ブロックは、幅及び高さが同一であり、かつ、前記幅及び前記高さの値が2のべき乗であり、
前記複数のサブブロックは、前記ブロックを、前記ブロック内における左上、左下、右上、及び右下の各位置に応じて相互排反な複数のサブブロックに分割したものである
請求項1記載の画像認識装置。 - 前記畳み込みニューラルネットワークは、複数の畳み込み層を含み、
前記複数の畳み込み層では、共通のパラメータを用いる
請求項1又は2記載の画像認識装置。 - 入力された1以上のチャネルを有する画像に対して、畳み込みニューラルネットワークを用いた画像認識を行う画像認識方法であって、
前記畳み込みニューラルネットワークは、
少なくとも一つの畳み込み層と、
前記畳み込み層の出力を、所定の2方向に対して相互排反である1以上のブロックに分割し、前記1以上のブロックの各々について、前記ブロックに含まれる前記畳み込み層の出力を、前記ブロック内における位置に応じて相互排反な複数のサブブロックに分割し、全てのブロックにわたり、前記位置が対応するサブブロックに含まれる要素の値を集約して、前記複数のサブブロックの各々における集約結果を出力するプーリング層と、
を含む画像認識方法。 - 前記所定の2方向は、幅方向及び高さ方向であり、
前記ブロックは、幅及び高さが同一であり、かつ、前記幅及び前記高さの値が2のべき乗であり、
前記複数のサブブロックは、前記ブロックを、前記ブロック内における左上、左下、右上、及び右下の各位置に応じて相互排反な複数のサブブロックに分割したものである
請求項4記載の画像認識方法。 - 前記畳み込みニューラルネットワークは、複数の畳み込み層を含み、
前記複数の畳み込み層では、共通のパラメータを用いる
請求項4又は5記載の画像認識方法。 - コンピュータを、請求項1〜3の何れか1項記載の画像認識装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018091882A JP6935868B2 (ja) | 2018-05-11 | 2018-05-11 | 画像認識装置、画像認識方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018091882A JP6935868B2 (ja) | 2018-05-11 | 2018-05-11 | 画像認識装置、画像認識方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019197445A true JP2019197445A (ja) | 2019-11-14 |
JP6935868B2 JP6935868B2 (ja) | 2021-09-15 |
Family
ID=68538698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018091882A Active JP6935868B2 (ja) | 2018-05-11 | 2018-05-11 | 画像認識装置、画像認識方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6935868B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582215A (zh) * | 2020-05-17 | 2020-08-25 | 华中科技大学同济医学院附属协和医院 | 一种胆胰系统正常解剖结构的扫查识别系统和方法 |
JP2021117969A (ja) * | 2020-01-23 | 2021-08-10 | 同▲済▼大学 | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 |
CN113807363A (zh) * | 2021-09-08 | 2021-12-17 | 西安电子科技大学 | 基于轻量化残差网络的图像分类方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099707A (ja) * | 2014-11-19 | 2016-05-30 | 株式会社デンソー | 演算処理装置 |
-
2018
- 2018-05-11 JP JP2018091882A patent/JP6935868B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016099707A (ja) * | 2014-11-19 | 2016-05-30 | 株式会社デンソー | 演算処理装置 |
Non-Patent Citations (1)
Title |
---|
岡谷 貴之: "画像認識のための深層学習の研究動向 −畳込みニューラルネットワークとその利用法の発展−", 人工知能, vol. 第31巻 第2号, JPN6021030865, 1 March 2016 (2016-03-01), JP, pages 169 - 179, ISSN: 0004566625 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021117969A (ja) * | 2020-01-23 | 2021-08-10 | 同▲済▼大学 | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 |
CN111582215A (zh) * | 2020-05-17 | 2020-08-25 | 华中科技大学同济医学院附属协和医院 | 一种胆胰系统正常解剖结构的扫查识别系统和方法 |
CN113807363A (zh) * | 2021-09-08 | 2021-12-17 | 西安电子科技大学 | 基于轻量化残差网络的图像分类方法 |
CN113807363B (zh) * | 2021-09-08 | 2024-04-19 | 西安电子科技大学 | 基于轻量化残差网络的图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6935868B2 (ja) | 2021-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yue et al. | Dual adversarial network: Toward real-world noise removal and noise generation | |
WO2020216227A9 (zh) | 图像分类方法、数据处理方法和装置 | |
CN111079532B (zh) | 一种基于文本自编码器的视频内容描述方法 | |
Cui et al. | Fast and practical neural architecture search | |
KR101970488B1 (ko) | 실내 의미론적 분할을 위한 컬러-깊이 영상의 단계적 레지듀얼 특성 결합 네트워크 장치 | |
US20190244362A1 (en) | Differentiable Jaccard Loss Approximation for Training an Artificial Neural Network | |
CN110473137A (zh) | 图像处理方法和装置 | |
KR20180136720A (ko) | 다채널 특징맵을 이용하는 영상 처리 장치 및 방법 | |
CN111445418A (zh) | 图像去雾处理方法、装置及计算机设备 | |
KR20180004898A (ko) | 딥러닝 기반의 이미지 처리 기술 및 그 방법 | |
CN112215332B (zh) | 神经网络结构的搜索方法、图像处理方法和装置 | |
CN113065645B (zh) | 孪生注意力网络、图像处理方法和装置 | |
WO2020258902A1 (zh) | 图像生成和神经网络训练方法、装置、设备和介质 | |
CN114549913B (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
JP6935868B2 (ja) | 画像認識装置、画像認識方法、およびプログラム | |
US20220157046A1 (en) | Image Classification Method And Apparatus | |
CN114418030A (zh) | 图像分类方法、图像分类模型的训练方法及装置 | |
US11620514B2 (en) | Training artificial neural networks with reduced computational complexity | |
Zhuo et al. | Ridnet: Recursive information distillation network for color image denoising | |
CN114781499A (zh) | 一种构建基于ViT模型的密集预测任务适配器的方法 | |
KR102305981B1 (ko) | 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법 | |
CN117475134A (zh) | 基于多尺度跨层特征融合网络的伪装目标检测算法 | |
US20230143985A1 (en) | Data feature extraction method and related apparatus | |
CN117058235A (zh) | 跨多种室内场景的视觉定位方法 | |
WO2023086198A1 (en) | Robustifying nerf model novel view synthesis to sparse data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180511 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180604 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210810 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210816 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6935868 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |