JPWO2020003434A1 - 機械学習方法、機械学習装置、及び機械学習プログラム - Google Patents
機械学習方法、機械学習装置、及び機械学習プログラム Download PDFInfo
- Publication number
- JPWO2020003434A1 JPWO2020003434A1 JP2020526802A JP2020526802A JPWO2020003434A1 JP WO2020003434 A1 JPWO2020003434 A1 JP WO2020003434A1 JP 2020526802 A JP2020526802 A JP 2020526802A JP 2020526802 A JP2020526802 A JP 2020526802A JP WO2020003434 A1 JPWO2020003434 A1 JP WO2020003434A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- machine learning
- learning model
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
Description
機械学習では、学習画像及び正解画像を用いた学習により学習モデルが作成されたあと、その学習モデルが適切であるかどうかの精度評価が実施されるのが一般的である。この学習モデルの精度評価の際には、テスト画像とこれに対応する正解画像とが用いられるが、該テスト画像を学習モデルに入力した結果として該学習モデルから出力されるラベル画像は縮小された画像である。そのため、その縮小されたラベル画像をバイリニア補間法等により拡大して正解画像と同じフルサイズの画像に戻したうえで、両画像を比較して評価が行われる。ところが、縮小されたラベル画像を拡大する際に生じる画素信号の誤差のために両画像間の微細な領域での差異が顕在化し、評価精度が低下してしまう場合がある。
a)入力された学習画像のサイズを縮小する画像縮小ステップと、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成ステップ、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大ステップ、及び、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新ステップと、を含み、該ラベル画像生成ステップ、該画像拡大ステップ及び該パラメータ更新ステップを繰り返し行うことで前記学習モデルを逐次的に改良する学習実行ステップと、
を有し、前記学習実行ステップにおいて改良された学習モデルに前記画像拡大ステップによる拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
a)入力された学習画像のサイズを縮小する画像縮小部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新部、及び、それら各部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御部と、を含む学習実行部と、
を備え、前記学習実行部において改良された学習モデルに前記画像拡大部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
コンピュータを、
a)入力された学習画像のサイズを縮小する画像縮小機能部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成機能部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大機能部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新機能部、及び、それら各機能部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御機能部と、を含む学習実行機能部と、
して動作させ、前記学習実行機能部において改良された学習モデルに前記画像拡大機能部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴としている。
図1は本発明に係る機械学習方法を実施するための機械学習装置の一実施例の概略ブロック構成図である。
12…学習実行部
13…FCN演算部
131…多層ネットワーク
132…畳み込み層
14…画像拡大部
15…誤差計算部
16…パラメータ更新部
17…学習制御部
Claims (6)
- 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルを作成する機械学習方法であって、
a)入力された学習画像のサイズを縮小する画像縮小ステップと、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成ステップ、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大ステップ、及び、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新ステップと、を含み、該ラベル画像生成ステップ、該画像拡大ステップ及び該パラメータ更新ステップを繰り返し行うことで前記学習モデルを逐次的に改良する学習実行ステップと、
を有し、前記学習実行ステップにおいて改良された学習モデルに前記画像拡大ステップによる拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習方法。 - 請求項1に記載の機械学習方法であって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習方法。 - 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルを作成する機械学習装置であって、
a)入力された学習画像のサイズを縮小する画像縮小部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新部、及び、それら各部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御部と、を含む学習実行部と、
を備え、前記学習実行部において改良された学習モデルに前記画像拡大部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習装置。 - 請求項3に記載の機械学習装置であって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習装置。 - 機械学習を用いて入力画像に対するセマンティックセグメンテーションを行うための学習モデルをコンピュータ上で作成する機械学習プログラムであって、
コンピュータを、
a)入力された学習画像のサイズを縮小する画像縮小機能部と、
b)複数の縮小された学習画像を用い、所定のパラメータに基づく学習モデルに従ってラベル画像を生成するラベル画像生成機能部、該ラベル画像を前記入力された学習画像のサイズまで拡大する画像拡大機能部、該拡大されたラベル画像と前記学習画像に対応する正解画像とに基づき損失関数による誤差を求め該誤差に応じて前記パラメータを更新するパラメータ更新機能部、及び、それら各機能部による処理を繰り返し行うことで前記学習モデルを逐次的に改良する繰り返し制御機能部と、を含む学習実行機能部と、
して動作させ、前記学習実行機能部において改良された学習モデルに前記画像拡大機能部による拡大処理を加えた拡大学習モデルをセマンティックセグメンテーションを行うための学習モデルとして得ることを特徴とする機械学習プログラム。 - 請求項5に記載の機械学習プログラムであって、
前記機械学習は畳み込みニューラルネットワークを用いたディープラーニングであることを特徴とする機械学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/024566 WO2020003434A1 (ja) | 2018-06-28 | 2018-06-28 | 機械学習方法、機械学習装置、及び機械学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020003434A1 true JPWO2020003434A1 (ja) | 2021-01-07 |
JP6977886B2 JP6977886B2 (ja) | 2021-12-08 |
Family
ID=68986315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020526802A Active JP6977886B2 (ja) | 2018-06-28 | 2018-06-28 | 機械学習方法、機械学習装置、及び機械学習プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11176672B1 (ja) |
JP (1) | JP6977886B2 (ja) |
CN (1) | CN112262394B (ja) |
WO (1) | WO2020003434A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7210380B2 (ja) * | 2019-06-04 | 2023-01-23 | 京セラ株式会社 | 画像学習プログラム、画像学習方法、及び画像認識装置 |
CN111612803B (zh) * | 2020-04-30 | 2023-10-17 | 杭州电子科技大学 | 一种基于图像清晰度的车辆图像语义分割方法 |
CN114693694A (zh) * | 2020-12-25 | 2022-07-01 | 日本电气株式会社 | 图像处理的方法、设备和计算机可读存储介质 |
WO2023038074A1 (ja) * | 2021-09-13 | 2023-03-16 | 株式会社島津製作所 | 細胞画像の学習時におけるメモリ容量判定システムおよび細胞画像の学習時におけるメモリ容量判定方法 |
JP7321577B2 (ja) * | 2021-11-10 | 2023-08-07 | 株式会社アクセル | 情報処理装置、情報処理方法、及びプログラム |
WO2023157439A1 (ja) * | 2022-02-18 | 2023-08-24 | 富士フイルム株式会社 | 画像処理装置及びその作動方法、推論装置並びに学習装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3814353B2 (ja) * | 1996-11-20 | 2006-08-30 | キヤノン株式会社 | 画像分割方法および画像分割装置 |
JP3767667B2 (ja) * | 1999-08-18 | 2006-04-19 | 富士ゼロックス株式会社 | 画像処理装置 |
US9785866B2 (en) * | 2015-01-22 | 2017-10-10 | Microsoft Technology Licensing, Llc | Optimizing multi-class multimedia data classification using negative data |
US9824189B2 (en) * | 2015-01-23 | 2017-11-21 | Panasonic Intellectual Property Management Co., Ltd. | Image processing apparatus, image processing method, image display system, and storage medium |
US11071501B2 (en) * | 2015-08-14 | 2021-07-27 | Elucid Bioiwaging Inc. | Quantitative imaging for determining time to adverse event (TTE) |
CN106874921B (zh) * | 2015-12-11 | 2020-12-04 | 清华大学 | 图像分类方法和装置 |
CN106023220B (zh) * | 2016-05-26 | 2018-10-19 | 史方 | 一种基于深度学习的车辆外观部件图像分割方法 |
CN106920243B (zh) * | 2017-03-09 | 2019-12-17 | 桂林电子科技大学 | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 |
US10997462B2 (en) * | 2018-04-04 | 2021-05-04 | Canon Virginia, Inc. | Devices, systems, and methods for clustering reference images for non-destructive testing |
-
2018
- 2018-06-28 CN CN201880094484.7A patent/CN112262394B/zh active Active
- 2018-06-28 US US17/041,364 patent/US11176672B1/en active Active
- 2018-06-28 WO PCT/JP2018/024566 patent/WO2020003434A1/ja active Application Filing
- 2018-06-28 JP JP2020526802A patent/JP6977886B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN112262394B (zh) | 2024-01-16 |
CN112262394A (zh) | 2021-01-22 |
WO2020003434A1 (ja) | 2020-01-02 |
US20210358129A1 (en) | 2021-11-18 |
US11176672B1 (en) | 2021-11-16 |
JP6977886B2 (ja) | 2021-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6977886B2 (ja) | 機械学習方法、機械学習装置、及び機械学習プログラム | |
US11093669B2 (en) | Method and system for quantum computing | |
US10755162B2 (en) | Method and apparatus to reduce neural network | |
Chen et al. | Graph unrolling networks: Interpretable neural networks for graph signal denoising | |
van Wyk et al. | Evolutionary neural architecture search for image restoration | |
JP2019056975A (ja) | 改良型敵対的生成ネットワーク実現プログラム、改良型敵対的生成ネットワーク実現装置及び学習済モデル生成方法 | |
Giovannangeli et al. | Toward automatic comparison of visualization techniques: Application to graph visualization | |
Wei et al. | Deep unfolding with normalizing flow priors for inverse problems | |
JP6832252B2 (ja) | 超解像装置およびプログラム | |
KR102329546B1 (ko) | 뉴럴 네트워크 및 비국소적 블록을 이용하여 세그멘테이션을 수행하는 질병 진단 시스템 및 방법 | |
Guo et al. | Circuit synthesis using generative adversarial networks (GANs) | |
Suganuma et al. | Designing convolutional neural network architectures using cartesian genetic programming | |
WO2020256698A1 (en) | Dynamic image resolution assessment | |
CN111753980A (zh) | 将第一图像的特征转移到第二图像的方法 | |
Lima et al. | Automatic design of deep neural networks applied to image segmentation problems | |
Liu et al. | Densely connected stacked u-network for filament segmentation in microscopy images | |
JP2023078578A (ja) | 画像処理装置、学習システム、および、学習方法 | |
Gharehchopogh et al. | A novel approach for edge detection in images based on cellular learning automata | |
KR20210061800A (ko) | 희소 신경망 생성 방법 및 이를 위한 시스템 | |
Raumanns et al. | ENHANCE (ENriching Health data by ANnotations of Crowd and Experts): A case study for skin lesion classification | |
Yuan et al. | MMSR: a multi-model super resolution framework | |
Christopher et al. | Projected Generative Diffusion Models for Constraint Satisfaction | |
Bourqui et al. | Toward automatic comparison of visualization techniques: application to graph visualization | |
Skaruz et al. | Two-dimensional patterns and images reconstruction with use of cellular automata | |
JP2020030702A (ja) | 学習装置、学習方法及び学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211025 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6977886 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |