JP7462168B2 - 処理方法およびそれを利用した処理装置 - Google Patents
処理方法およびそれを利用した処理装置 Download PDFInfo
- Publication number
- JP7462168B2 JP7462168B2 JP2022555266A JP2022555266A JP7462168B2 JP 7462168 B2 JP7462168 B2 JP 7462168B2 JP 2022555266 A JP2022555266 A JP 2022555266A JP 2022555266 A JP2022555266 A JP 2022555266A JP 7462168 B2 JP7462168 B2 JP 7462168B2
- Authority
- JP
- Japan
- Prior art keywords
- feature map
- processing
- image
- learning
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 185
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 48
- 238000000605 extraction Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 description 48
- 238000000034 method Methods 0.000 description 38
- 238000010606 normalization Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Description
図3(a)に示される学習処理では、第1学習用画像600が使用される。第1学習用画像600は、画像認識の結果が教師データとして予め用意されている画像である。第1学習用画像600は、例えば、「112×112」のサイズを有する。第1学習用画像600は、第1処理部100と抽出部200に入力される。
図3(a)における学習処理によって導出された空間フィルタの係数が、図3(b)における各畳み込み層に設定される。図3(b)に示される認証処理では、対象画像700が使用される。対象画像700は、処理装置1000における認識処理の対象となる画像であり、例えば、「1024×1024」のサイズを有する。対象画像700は、第1処理部100と第2処理部300に入力される。認証処理において抽出部200は使用されない。
Claims (6)
- 処理対象となる対象画像に対して第1ニューラルネットワークの処理を実行することによって、前記対象画像の(1/m)×(1/n)倍のサイズとなる第1特徴マップを生成する第1処理部と、
前記第1処理部において生成した前記第1特徴マップをn倍拡大する拡大部と、
前記対象画像に対して第2ニューラルネットワークの処理を実行することによって、前記対象画像の(1/m)倍のサイズとなる第2特徴マップを生成する第2処理部と、
前記拡大部においてn倍拡大した前記第1特徴マップと、前記第2処理部において生成した前記第2特徴マップとを組み合わせる組合せ部とを備え、
前記第1処理部の前記第1ニューラルネットワークと前記第2処理部の前記第2ニューラルネットワークは全結合層を含まず、
学習時において、前記第1処理部の前記第1ニューラルネットワークには第1学習用画像が入力され、
学習時において、前記第2処理部の前記第2ニューラルネットワークには、抽出部により抽出された前記第1学習用画像の中心部分であり、かつ前記第1学習用画像の(1/n)倍のサイズとなる第2学習用画像が入力され、
学習時において、前記組合せ部は、前記拡大部を介さずに前記第1処理部に接続されるとともに、前記第2処理部に接続される処理装置。 - 前記拡大部は、前記第1特徴マップに含まれる画素の値を、追加する画素に複製することによって、前記第1特徴マップをn倍拡大する請求項1に記載の処理装置。
- 前記拡大部は、前記第1特徴マップにおいて隣接した第1画素と第2画素の間に第3画素を追加し、前記第1画素の値と前記第2画素の値とを補間した値を前記第3画素に使用することによって、前記第1特徴マップをn倍拡大する請求項1に記載の処理装置。
- 前記組合せ部は、2つの入力を別のチャンネルとして合併する請求項1から3のいずれか1項に記載の処理装置。
- 前記組合せ部は、2つの入力を画素毎に四則演算して組み合わせる請求項1から3のいずれか1項に記載の処理装置。
- 処理対象となる対象画像に対して第1ニューラルネットワークの処理を実行することによって、前記対象画像の(1/m)×(1/n)倍のサイズとなる第1特徴マップを生成するステップと、
生成した前記第1特徴マップをn倍拡大するステップと、
前記対象画像に対して第2ニューラルネットワークの処理を実行することによって、前記対象画像の(1/m)倍のサイズとなる第2特徴マップを生成するステップと、
n倍拡大した前記第1特徴マップと、生成した前記第2特徴マップとを組み合わせるステップとを備え、
前記第1ニューラルネットワークと前記第2ニューラルネットワークは全結合層を含まず、
学習時において、前記第1ニューラルネットワークには第1学習用画像が入力され、
学習時において、前記第2ニューラルネットワークには、前記第1学習用画像から抽出された前記第1学習用画像の中心部分であり、かつ前記第1学習用画像の(1/n)倍のサイズとなる第2学習用画像が入力され、
学習時において、n倍の拡大がなされずに、組合せがなされる処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020170751 | 2020-10-08 | ||
JP2020170751 | 2020-10-08 | ||
PCT/JP2021/024224 WO2022074877A1 (ja) | 2020-10-08 | 2021-06-25 | 処理方法およびそれを利用した処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022074877A1 JPWO2022074877A1 (ja) | 2022-04-14 |
JP7462168B2 true JP7462168B2 (ja) | 2024-04-05 |
Family
ID=81125793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022555266A Active JP7462168B2 (ja) | 2020-10-08 | 2021-06-25 | 処理方法およびそれを利用した処理装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240119717A1 (ja) |
EP (1) | EP4227892A4 (ja) |
JP (1) | JP7462168B2 (ja) |
CN (1) | CN116368517A (ja) |
WO (1) | WO2022074877A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019102796A1 (ja) | 2017-11-21 | 2019-05-31 | 富士フイルム株式会社 | 認識装置、認識方法及びプログラム |
WO2019194044A1 (ja) | 2018-04-04 | 2019-10-10 | パナソニックIpマネジメント株式会社 | 画像処理装置および画像処理方法 |
WO2020064715A1 (en) | 2018-09-28 | 2020-04-02 | Varian Medical Systems International Ag | Methods and systems for radiotherapy treatment planning using deep learning engines |
CN111476793A (zh) | 2020-03-10 | 2020-07-31 | 西北大学 | 动态增强磁共振成像处理方法、系统、存储介质、终端 |
WO2020183799A1 (ja) | 2019-03-11 | 2020-09-17 | キヤノン株式会社 | 医用画像処理装置、医用画像処理方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019159324A1 (ja) | 2018-02-16 | 2019-08-22 | パナソニックIpマネジメント株式会社 | 処理方法およびそれを利用した処理装置 |
WO2020028382A1 (en) * | 2018-07-30 | 2020-02-06 | Memorial Sloan Kettering Cancer Center | Multi-modal, multi-resolution deep learning neural networks for segmentation, outcomes prediction and longitudinal response monitoring to immunotherapy and radiotherapy |
US10769744B2 (en) * | 2018-10-31 | 2020-09-08 | Kabushiki Kaisha Toshiba | Computer vision system and method |
-
2021
- 2021-06-25 EP EP21877181.4A patent/EP4227892A4/en active Pending
- 2021-06-25 CN CN202180069293.7A patent/CN116368517A/zh active Pending
- 2021-06-25 WO PCT/JP2021/024224 patent/WO2022074877A1/ja unknown
- 2021-06-25 JP JP2022555266A patent/JP7462168B2/ja active Active
- 2021-06-25 US US18/030,900 patent/US20240119717A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019102796A1 (ja) | 2017-11-21 | 2019-05-31 | 富士フイルム株式会社 | 認識装置、認識方法及びプログラム |
WO2019194044A1 (ja) | 2018-04-04 | 2019-10-10 | パナソニックIpマネジメント株式会社 | 画像処理装置および画像処理方法 |
WO2020064715A1 (en) | 2018-09-28 | 2020-04-02 | Varian Medical Systems International Ag | Methods and systems for radiotherapy treatment planning using deep learning engines |
WO2020183799A1 (ja) | 2019-03-11 | 2020-09-17 | キヤノン株式会社 | 医用画像処理装置、医用画像処理方法及びプログラム |
CN111476793A (zh) | 2020-03-10 | 2020-07-31 | 西北大学 | 动态增强磁共振成像处理方法、系统、存储介质、终端 |
Also Published As
Publication number | Publication date |
---|---|
WO2022074877A1 (ja) | 2022-04-14 |
JPWO2022074877A1 (ja) | 2022-04-14 |
EP4227892A1 (en) | 2023-08-16 |
US20240119717A1 (en) | 2024-04-11 |
CN116368517A (zh) | 2023-06-30 |
EP4227892A4 (en) | 2024-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11315235B2 (en) | Processing method for performing process on image and processing device using the processing method | |
JP4074062B2 (ja) | ベクトル画像シーケンスにおける意味対象物の追跡 | |
JP5555706B2 (ja) | 高解像度映像獲得装置およびその方法 | |
JP4966893B2 (ja) | 一致度計算装置及び方法、プログラム | |
Liu et al. | A new multi-focus image fusion algorithm and its efficient implementation | |
EP3067858A1 (en) | Image noise reduction | |
EP3067863A1 (en) | Image noise reduction | |
Ma et al. | Dual refinement feature pyramid networks for object detection | |
JP7407407B2 (ja) | 処理方法およびそれを利用した処理装置 | |
JP7462168B2 (ja) | 処理方法およびそれを利用した処理装置 | |
Jang et al. | Self-supervised image denoising with downsampled invariance loss and conditional blind-spot network | |
JPWO2019189026A1 (ja) | 処理方法およびそれを利用した処理装置 | |
WO2022133874A1 (zh) | 图像处理方法及设备、计算机可读存储介质 | |
CN112233021B (zh) | 基于降质分类和定向数据增广的鲁棒人脸超分辨处理方法 | |
US11232323B2 (en) | Method of merging images and data processing device | |
JP7277855B2 (ja) | 被写体別特徴点分離装置、被写体別特徴点分離方法及びコンピュータプログラム | |
JP7210380B2 (ja) | 画像学習プログラム、画像学習方法、及び画像認識装置 | |
CN116503294B (zh) | 基于人工智能的文物图像复原方法、装置及设备 | |
JP2009069902A (ja) | 画像処理方法およびプログラム | |
Okamoto et al. | A Hierarchical Type Segmentation Algorithm based on Support Vector Machine for Colorectal Endoscopic Images with NBI Magnification | |
Sappa et al. | Edge point linking by means of global and local schemes | |
CA3237536A1 (en) | Machine learning system and method for object-specific recognition | |
Wang et al. | UFC-Net: Unrolling Fixed-point Continuous Network for Deep Compressive Sensing | |
Cheung et al. | TransformMix: Learning Transformation and Mixing Strategies from Data | |
Smolka et al. | Application of the self-avoiding random walk noise reduction algorithm in the colour image segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7462168 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |