JP6977886B2 - 機械学習方法、機械学習装置、及び機械学習プログラム - Google Patents
機械学習方法、機械学習装置、及び機械学習プログラム Download PDFInfo
- Publication number
- JP6977886B2 JP6977886B2 JP2020526802A JP2020526802A JP6977886B2 JP 6977886 B2 JP6977886 B2 JP 6977886B2 JP 2020526802 A JP2020526802 A JP 2020526802A JP 2020526802 A JP2020526802 A JP 2020526802A JP 6977886 B2 JP6977886 B2 JP 6977886B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- machine learning
- unit
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims description 56
- 238000000034 method Methods 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 35
- 230000011218 segmentation Effects 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 21
- 230000009467 reduction Effects 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000013135 deep learning Methods 0.000 claims description 8
- 230000003252 repetitive effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 16
- 238000011176 pooling Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Description
機械学習では、学習画像及び正解画像を用いた学習により学習モデルが作成されたあと、その学習モデルが適切であるかどうかの精度評価が実施されるのが一般的である。この学習モデルの精度評価の際には、テスト画像とこれに対応する正解画像とが用いられるが、該テスト画像を学習モデルに入力した結果として該学習モデルから出力されるラベル画像は縮小された画像である。そのため、その縮小されたラベル画像をバイリニア補間法等により拡大して正解画像と同じフルサイズの画像に戻したうえで、両画像を比較して評価が行われる。ところが、縮小されたラベル画像を拡大する際に生じる画素信号の誤差のために両画像間の微細な領域での差異が顕在化し、評価精度が低下してしまう場合がある。
a)入力された学習画像のサイズを縮小する画像縮小ステップと、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成ステップ、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大ステップ、及び、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新ステップと、を含み、該ラベル画像生成ステップ、該画像拡大ステップ及び該パラメータ更新ステップを繰り返し行うことで前記学習モデルを逐次的に改良する学習実行ステップと、
を有し、前記学習実行ステップにおいて改良された学習モデルに前記画像拡大ステップによる拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
a)入力された学習画像のサイズを縮小する画像縮小部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新部、並びに、前記ラベル画像生成部、前記画像拡大部、及び前記パラメータ更新部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御部、を含む学習実行部と、
を備え、前記学習実行部において改良された学習モデルに前記画像拡大部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
コンピュータを、
a)入力された学習画像のサイズを縮小する画像縮小機能部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成機能部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大機能部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新機能部、並びに、前記ラベル画像生成機能部、前記画像拡大機能部、及び前記パラメータ更新機能部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御機能部、を含む学習実行機能部と、
して動作させ、前記学習実行機能部において改良された学習モデルに前記画像拡大機能部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
図1は本発明に係る機械学習方法を実施するための機械学習装置の一実施例の概略ブロック構成図である。
12…学習実行部
13…FCN演算部
131…多層ネットワーク
132…畳み込み層
14…画像拡大部
15…誤差計算部
16…パラメータ更新部
17…学習制御部
Claims (6)
- 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルを作成する機械学習方法であって、
a)入力された学習画像のサイズを縮小する画像縮小ステップと、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成ステップ、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大ステップ、及び、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新ステップと、を含み、該ラベル画像生成ステップ、該画像拡大ステップ及び該パラメータ更新ステップを繰り返し行うことで前記学習モデルを逐次的に改良する学習実行ステップと、
を有し、前記学習実行ステップにおいて改良された学習モデルに前記画像拡大ステップによる拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習方法。 - 請求項1に記載の機械学習方法であって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習方法。 - 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルを作成する機械学習装置であって、
a)入力された学習画像のサイズを縮小する画像縮小部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新部、並びに、前記ラベル画像生成部、前記画像拡大部、及び前記パラメータ更新部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御部、を含む学習実行部と、
を備え、前記学習実行部において改良された学習モデルに前記画像拡大部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習装置。
- 請求項3に記載の機械学習装置であって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習装置。 - 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルをコンピュータ上で作成する機械学習プログラムであって、
コンピュータを、
a)入力された学習画像のサイズを縮小する画像縮小機能部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成機能部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大機能部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新機能部、並びに、前記ラベル画像生成機能部、前記画像拡大機能部、及び前記パラメータ更新機能部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御機能部、を含む学習実行機能部と、
して動作させ、前記学習実行機能部において改良された学習モデルに前記画像拡大機能部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習プログラム。
- 請求項5に記載の機械学習プログラムであって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/024566 WO2020003434A1 (ja) | 2018-06-28 | 2018-06-28 | 機械学習方法、機械学習装置、及び機械学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020003434A1 JPWO2020003434A1 (ja) | 2021-01-07 |
JP6977886B2 true JP6977886B2 (ja) | 2021-12-08 |
Family
ID=68986315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020526802A Active JP6977886B2 (ja) | 2018-06-28 | 2018-06-28 | 機械学習方法、機械学習装置、及び機械学習プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11176672B1 (ja) |
JP (1) | JP6977886B2 (ja) |
CN (1) | CN112262394B (ja) |
WO (1) | WO2020003434A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7210380B2 (ja) * | 2019-06-04 | 2023-01-23 | 京セラ株式会社 | 画像学習プログラム、画像学習方法、及び画像認識装置 |
CN111612803B (zh) * | 2020-04-30 | 2023-10-17 | 杭州电子科技大学 | 一种基于图像清晰度的车辆图像语义分割方法 |
CN114693694A (zh) * | 2020-12-25 | 2022-07-01 | 日本电气株式会社 | 图像处理的方法、设备和计算机可读存储介质 |
WO2023038074A1 (ja) * | 2021-09-13 | 2023-03-16 | 株式会社島津製作所 | 細胞画像の学習時におけるメモリ容量判定システムおよび細胞画像の学習時におけるメモリ容量判定方法 |
JP7321577B2 (ja) * | 2021-11-10 | 2023-08-07 | 株式会社アクセル | 情報処理装置、情報処理方法、及びプログラム |
WO2023157439A1 (ja) * | 2022-02-18 | 2023-08-24 | 富士フイルム株式会社 | 画像処理装置及びその作動方法、推論装置並びに学習装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3814353B2 (ja) * | 1996-11-20 | 2006-08-30 | キヤノン株式会社 | 画像分割方法および画像分割装置 |
JP3767667B2 (ja) * | 1999-08-18 | 2006-04-19 | 富士ゼロックス株式会社 | 画像処理装置 |
US9785866B2 (en) * | 2015-01-22 | 2017-10-10 | Microsoft Technology Licensing, Llc | Optimizing multi-class multimedia data classification using negative data |
US9824189B2 (en) * | 2015-01-23 | 2017-11-21 | Panasonic Intellectual Property Management Co., Ltd. | Image processing apparatus, image processing method, image display system, and storage medium |
US11071501B2 (en) * | 2015-08-14 | 2021-07-27 | Elucid Bioiwaging Inc. | Quantitative imaging for determining time to adverse event (TTE) |
CN106874921B (zh) * | 2015-12-11 | 2020-12-04 | 清华大学 | 图像分类方法和装置 |
CN106023220B (zh) * | 2016-05-26 | 2018-10-19 | 史方 | 一种基于深度学习的车辆外观部件图像分割方法 |
CN106920243B (zh) * | 2017-03-09 | 2019-12-17 | 桂林电子科技大学 | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 |
US10997462B2 (en) * | 2018-04-04 | 2021-05-04 | Canon Virginia, Inc. | Devices, systems, and methods for clustering reference images for non-destructive testing |
-
2018
- 2018-06-28 US US17/041,364 patent/US11176672B1/en active Active
- 2018-06-28 WO PCT/JP2018/024566 patent/WO2020003434A1/ja active Application Filing
- 2018-06-28 CN CN201880094484.7A patent/CN112262394B/zh active Active
- 2018-06-28 JP JP2020526802A patent/JP6977886B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN112262394A (zh) | 2021-01-22 |
CN112262394B (zh) | 2024-01-16 |
US20210358129A1 (en) | 2021-11-18 |
US11176672B1 (en) | 2021-11-16 |
WO2020003434A1 (ja) | 2020-01-02 |
JPWO2020003434A1 (ja) | 2021-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6977886B2 (ja) | 機械学習方法、機械学習装置、及び機械学習プログラム | |
US11093669B2 (en) | Method and system for quantum computing | |
WO2018180263A1 (ja) | 情報処理装置、情報処理方法、及びコンピュータ可読記憶媒体 | |
JP7083037B2 (ja) | 学習装置及び学習方法 | |
JP6832252B2 (ja) | 超解像装置およびプログラム | |
KR102329546B1 (ko) | 뉴럴 네트워크 및 비국소적 블록을 이용하여 세그멘테이션을 수행하는 질병 진단 시스템 및 방법 | |
Guo et al. | Circuit synthesis using generative adversarial networks (GANs) | |
CA3143928C (en) | Dynamic image resolution assessment | |
JP7073171B2 (ja) | 学習装置、学習方法及びプログラム | |
CN111753980A (zh) | 将第一图像的特征转移到第二图像的方法 | |
Lima et al. | Automatic design of deep neural networks applied to image segmentation problems | |
WO2022127603A1 (zh) | 一种模型处理方法及相关装置 | |
KR102365270B1 (ko) | 희소 신경망 생성 방법 및 이를 위한 시스템 | |
JP2023078578A (ja) | 画像処理装置、学習システム、および、学習方法 | |
US11361424B2 (en) | Neural network-type image processing device, appearance inspection apparatus and appearance inspection method | |
Suthaharan et al. | Deep learning models | |
Bourqui et al. | Toward automatic comparison of visualization techniques: application to graph visualization | |
JP2020030702A (ja) | 学習装置、学習方法及び学習プログラム | |
JP6994572B2 (ja) | データ処理システムおよびデータ処理方法 | |
Skaruz et al. | Two-dimensional patterns and images reconstruction with use of cellular automata | |
US12079717B2 (en) | Data processing apparatus, training apparatus, method of detecting an object, method of training, and medium | |
Hayashi et al. | Reinforcement learning for optimal topology design of 3D trusses | |
Pal et al. | Quantum neural network application for exudate affected retinal image patch identification | |
임재경 | Efficient topology optimization using deep learning-based image super-resolution | |
Hasan | Real-Time Classification of Traffic Signs with Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211025 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6977886 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |