JP7441312B2 - 学習装置、学習方法、及びプログラム - Google Patents
学習装置、学習方法、及びプログラム Download PDFInfo
- Publication number
- JP7441312B2 JP7441312B2 JP2022530495A JP2022530495A JP7441312B2 JP 7441312 B2 JP7441312 B2 JP 7441312B2 JP 2022530495 A JP2022530495 A JP 2022530495A JP 2022530495 A JP2022530495 A JP 2022530495A JP 7441312 B2 JP7441312 B2 JP 7441312B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- image
- estimated
- error
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 26
- 230000011218 segmentation Effects 0.000 claims description 46
- 230000006870 function Effects 0.000 claims description 21
- 238000010801 machine learning Methods 0.000 claims description 18
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 18
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000011176 pooling Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 4
- 241001342895 Chorus Species 0.000 description 3
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 3
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
なお、上記の式におけるcross_entropy(推定画像,正解画像)は第1の誤差であり、cross_entropy(推定種類,正解種類)は第2の誤差であり、αは任意に決定される係数である。
先ず、学習モデル(ネットワーク)に機械学習のディープラーニングを行わせて、クラスフィケーションを行う分類器を作成する場合について説明する。
このように、学習モデル103に学習を行わせることにより学習済みモデルが作成され、入力画像101から推定種類を出力する分類器を得ることができる。
次に、学習モデルに機械学習のディープラーニングを行わせて、セグメンテーション器を作成する場合について説明する。
このように、学習モデル107に学習を行わせることにより学習済みモデルが作成され、入力画像101から推定画像109を出力するセグメンテーション器を得ることができる。
図3は、本発明の学習装置を構成するコンピュータ10のハードウェア構成の一例を示すブロック図である。
なお、上記の式におけるcross_entropy(推定画像,正解画像)は第1の誤差であり、cross_entropy(推定種類,正解種類)は第2の誤差であり、αは任意に決定される係数である。
次に、本発明を実際のネットワークに適用した実施例を説明する。
12 :データ取得部
14 :GPU
16 :メモリ
18 :操作部
20 :CPU
22 :RAM
24 :ROM
26 :表示部
101 :入力画像
103 :学習モデル
105 :確率ベクトル
107 :学習モデル
109 :推定画像
121 :エンコーダ部分
123 :デコーダ部分
131 :学習装置
135 :セグメンテーション学習器
137 :分類器
143 :学習制御部
145 :学習モデル
147 :誤差算出部
149 :パラメータ制御部
Claims (12)
- 学習モデルと前記学習モデルを機械学習させる学習制御部とを構成するプロセッサを備えた学習装置において、
前記学習モデルは、
対象物が撮影された画像データであって、前記画像データ内の前記対象物の領域を示す正解画像とのペアからなる学習データにおける前記画像データを入力し、前記対象物の領域の特徴量を抽出して特徴マップを生成する複数の第1の畳み込み層を含むエンコーダ部分と、前記生成された前記特徴マップを用いて前記対象物の領域を推定した推定画像を出力する複数の第2の畳み込み層を含むデコーダ部分と、を有するセグメンテーション学習器と、
前記エンコーダ部分から得られた前記特徴マップを用いて、前記対象物の種類を推定した推定種類を取得する分類器と、を含み、
前記学習制御部は、前記正解画像と前記推定画像との第1の誤差、及び前記対象物の正解種類と前記推定種類との第2の誤差に基づいて前記学習モデルを機械学習させる学習装置であって、
前記学習制御部は、前記第1の誤差と前記第2の誤差との以下の式で表される誤差関数により得られる誤差が閾値A以下であるように、前記推定画像を前記正解画像に合わせ込む、学習装置。
誤差=cross_entropy(前記推定画像,前記正解画像)+α×cross_entropy(前記推定種類,前記正解種類)
なお、上記の式におけるcross_entropy(前記推定画像,前記正解画像)は前記第1の誤差であり、cross_entropy(前記推定種類,前記正解種類)は前記第2の誤差であり、αは任意に決定される係数である。 - 前記正解画像は、前記正解種類に関する情報を有する請求項1に記載の学習装置。
- 前記学習制御部は、前記正解画像の画素の情報に基づいて、前記正解種類を取得する請求項2に記載の学習装置。
- 前記分類器は、前記特徴マップから全結合層を介して、前記推定種類を取得する請求項1から3のいずれか1項に記載の学習装置。
- 前記分類器は、前記特徴マップを平均化し前記全結合層に入力することにより、前記推定種類を取得する請求項4に記載の学習装置。
- 前記分類器は、前記対象物の種類を示す確率ベクトルを取得して、前記推定種類を取得する請求項1から5のいずれか1項に記載の学習装置。
- 前記画像データは、1枚の画像を分割した分割画像のデータである請求項1から6のいずれか1項に記載の学習装置。
- 前記画像データは、構造物を撮影した画像のデータである請求項1から7のいずれか1項に記載の学習装置。
- 前記対象物は、前記構造物の損傷である請求項8に記載の学習装置。
- 学習モデルと前記学習モデルを機械学習させる学習制御部とを構成するプロセッサを備えた学習装置の学習方法において、
前記学習モデルは、
対象物が撮影された画像データであって、前記画像データ内の前記対象物の領域を示す正解画像とのペアからなる学習データにおける前記画像データを入力し、前記対象物の領域の特徴量を抽出して特徴マップを生成する複数の第1の畳み込み層を含むエンコーダ部分と、前記生成された前記特徴マップを用いて前記対象物の領域を推定した推定画像を出力する複数の第2の畳み込み層を含むデコーダ部分と、を有するセグメンテーション学習器と、
前記エンコーダ部分から得られた前記特徴マップを用いて、前記対象物の種類を推定した推定種類を取得する分類器と、を含み、
前記学習制御部により、前記正解画像と前記推定画像との第1の誤差、及び前記対象物の正解種類と前記推定種類との第2の誤差に基づいて前記学習モデルを機械学習させるステップを含む、学習方法であって、
前記ステップにおいて前記学習制御部は、前記第1の誤差と前記第2の誤差との以下の式で表される誤差関数により得られる誤差が閾値A以下であるように、前記推定画像を前記正解画像に合わせ込む、学習方法。
誤差=cross_entropy(前記推定画像,前記正解画像)+α×cross_entropy(前記推定種類,前記正解種類)
なお、上記の式におけるcross_entropy(前記推定画像,前記正解画像)は前記第1の誤差であり、cross_entropy(前記推定種類,前記正解種類)は前記第2の誤差であり、αは任意に決定される係数である。 - 学習モデルと前記学習モデルを機械学習させる学習制御部とを構成するプロセッサを備えた学習装置に学習方法を実行させるプログラムであって、
前記学習モデルは、
対象物が撮影された画像データであって、前記画像データ内の前記対象物の領域を示す正解画像とのペアからなる学習データにおける前記画像データを入力し、前記対象物の領域の特徴量を抽出して特徴マップを生成する複数の第1の畳み込み層を含むエンコーダ部分と、前記生成された前記特徴マップを用いて前記対象物の領域を推定した推定画像を出力する複数の第2の畳み込み層を含むデコーダ部分と、を有するセグメンテーション学習器と、
前記エンコーダ部分から得られた前記特徴マップを用いて、前記対象物の種類を推定した推定種類を取得する分類器と、を含み、
前記学習制御部により、前記正解画像と前記推定画像との第1の誤差、及び前記対象物の正解種類と前記推定種類との第2の誤差に基づいて前記学習モデルを機械学習させるステップを含む、学習方法を実行させるプログラムであって、
前記ステップにおいて前記学習制御部は、前記第1の誤差と前記第2の誤差との以下の式で表される誤差関数により得られる誤差が閾値A以下であるように、前記推定画像を前記正解画像に合わせ込む、プログラム。
誤差=cross_entropy(前記推定画像,前記正解画像)+α×cross_entropy(前記推定種類,前記正解種類)
なお、上記の式におけるcross_entropy(前記推定画像,前記正解画像)は前記第1の誤差であり、cross_entropy(前記推定種類,前記正解種類)は前記第2の誤差であり、αは任意に決定される係数である。 - 非一時的かつコンピュータ読取可能な記録媒体であって、請求項11に記載のプログラムが記録された記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020101491 | 2020-06-11 | ||
JP2020101491 | 2020-06-11 | ||
PCT/JP2021/020927 WO2021251224A1 (ja) | 2020-06-11 | 2021-06-02 | 学習装置、学習方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021251224A1 JPWO2021251224A1 (ja) | 2021-12-16 |
JP7441312B2 true JP7441312B2 (ja) | 2024-02-29 |
Family
ID=78846052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022530495A Active JP7441312B2 (ja) | 2020-06-11 | 2021-06-02 | 学習装置、学習方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7441312B2 (ja) |
WO (1) | WO2021251224A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002373333A (ja) | 2001-05-28 | 2002-12-26 | Honda R & D Europe (Deutschland) Gmbh | 階層ネットワークを用いたパターン認識方法 |
JP2018205920A (ja) | 2017-05-31 | 2018-12-27 | 富士通株式会社 | 学習プログラム、学習方法および物体検知装置 |
JP2019091434A (ja) | 2017-11-14 | 2019-06-13 | アドビ インコーポレイテッド | 複数のディープ・ラーニング・ニューラル・ネットワークを動的に重み付けすることによるフォント認識の改善 |
WO2020048140A1 (zh) | 2018-09-07 | 2020-03-12 | 北京市商汤科技开发有限公司 | 活体检测方法和装置、电子设备、计算机可读存储介质 |
-
2021
- 2021-06-02 JP JP2022530495A patent/JP7441312B2/ja active Active
- 2021-06-02 WO PCT/JP2021/020927 patent/WO2021251224A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002373333A (ja) | 2001-05-28 | 2002-12-26 | Honda R & D Europe (Deutschland) Gmbh | 階層ネットワークを用いたパターン認識方法 |
JP2018205920A (ja) | 2017-05-31 | 2018-12-27 | 富士通株式会社 | 学習プログラム、学習方法および物体検知装置 |
JP2019091434A (ja) | 2017-11-14 | 2019-06-13 | アドビ インコーポレイテッド | 複数のディープ・ラーニング・ニューラル・ネットワークを動的に重み付けすることによるフォント認識の改善 |
WO2020048140A1 (zh) | 2018-09-07 | 2020-03-12 | 北京市商汤科技开发有限公司 | 活体检测方法和装置、电子设备、计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021251224A1 (ja) | 2021-12-16 |
JPWO2021251224A1 (ja) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106920243B (zh) | 改进的全卷积神经网络的陶瓷材质件序列图像分割方法 | |
US9317784B2 (en) | Image processing apparatus, image processing method, and program | |
US9697583B2 (en) | Image processing apparatus, image processing method, and computer-readable recording medium | |
CN109712165B (zh) | 一种基于卷积神经网络的同类前景图像集分割方法 | |
JP6341650B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP7083037B2 (ja) | 学習装置及び学習方法 | |
WO2019026104A1 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
Bugeau et al. | Patch-based image colorization | |
US11615515B2 (en) | Superpixel merging | |
WO2020223963A1 (en) | Computer-implemented method of detecting foreign object on background object in image, apparatus for detecting foreign object on background object in image, and computer-program product | |
JPWO2020022027A1 (ja) | 学習装置及び学習方法 | |
WO2022199710A1 (zh) | 图像融合方法、装置、计算机设备和存储介质 | |
CN115841447A (zh) | 一种磁瓦表面缺陷的检测方法 | |
US9965881B2 (en) | Method for generating image and image generation system | |
JP7441312B2 (ja) | 学習装置、学習方法、及びプログラム | |
KR20200091661A (ko) | 조작 이미지 판별 장치 및 방법 | |
CN113744142A (zh) | 图像修复方法、电子设备及存储介质 | |
JP6887154B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
JP6294700B2 (ja) | 画像処理装置及び画像処理方法 | |
CN110991408B (zh) | 基于深度学习方法分割脑白质高信号的方法和装置 | |
US20220164658A1 (en) | Method, device, and computer program | |
US20220122244A1 (en) | Defect image generation method for deep learning and system therefor | |
CN113744199B (zh) | 图像的破损检测方法、电子设备及存储介质 | |
JP7252158B2 (ja) | 学習方法、学習装置、画像解析装置、及びプログラム | |
CN114419081A (zh) | 一种图像语义分割方法、系统及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7441312 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |