JP7205327B2 - 学習装置 - Google Patents
学習装置 Download PDFInfo
- Publication number
- JP7205327B2 JP7205327B2 JP2019051213A JP2019051213A JP7205327B2 JP 7205327 B2 JP7205327 B2 JP 7205327B2 JP 2019051213 A JP2019051213 A JP 2019051213A JP 2019051213 A JP2019051213 A JP 2019051213A JP 7205327 B2 JP7205327 B2 JP 7205327B2
- Authority
- JP
- Japan
- Prior art keywords
- latent variable
- error
- learning
- encoder
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
なお、本実施形態に係る学習装置Aは、情報処理装置であって、CPU又はMPUなどのマイクロプロセッサ、MCUなどのマイクロコントローラなどにより構成されてよい。
図1に示すように、学習装置Aは、入力データ取得部1、変分オートエンコーダ2、エンコーダ3及び学習部4を備える。
図2に示すように、変分オートエンコーダ2は、エンコーダ2a(第1のエンコーダ)及びデコーダ2bを備える。
エンコーダ2aは、入力画像Gを次元圧縮して、多次元正規分布で表現される第1の潜在変数z1の平均μ1と分散σ1とを求める。そして、エンコーダ2aは、この平均μ1と分散σ1とに基づいて多次元正規分布から潜在変数z1(以下、「第1の潜在変数z1」という。)をサンプリングすることで求める。エンコーダ2aは、サンプリングにより求めた第1の潜在変数z1をデコーダ2b及び学習部4に出力する。このエンコーダ2aは、ニューラルネットワークである。
デコーダ2bは、第1の潜在変数z1から復元した出力画像G´をエンコーダ3及び学習部4のそれぞれに出力する。なお、出力画像G´は、本発明の「出力データ」の一例である。
エンコーダ3は、変分オートエンコーダ2の後段に設けられている。具体的には、エンコーダ3は、入力がデコーダ2bの出力に接続されており、出力が学習部4に接続されている。
そして、学習部4は、第1の潜在変数z1と第2の潜在変数z2との誤差である潜在変数誤差Rを求め、その潜在変数誤差Rを含む損失関数Lが最小化するように変分オートエンコーダ2のパラメータを学習する。ここで、本実施形態に係る潜在変数誤差Rは、第1の潜在変数z1と第2の潜在変数z2との差の絶対値(=||z1-z2||)であるが、これに限定されず、第1の潜在変数z1と第2の潜在変数z2とのRMSE(Root Mean Square Error)でもよいし、MSE(Mean Squared Error)でもよいし、MAE(Mean Absolute Error)でもよい。
学習部4は、入力画像Gと出力画像G´との誤差である復元誤差(Reconstruction Error)Eを求める。復元誤差Eは、交差エントロピーを用いた誤差関数でもよいし、交差エントロピー以外の誤差関数(例えば、RMSE(Root Mean Square Error)やMSE(Mean Squared Error)、MAE(Mean Absolute Error)等を用いて誤差関数)でもよい。
なお、従来の変分オートエンコーダでの学習に用いられる損失関数は、復元誤差EとKLダイバージェンスによる正則化誤差とからなる関数である。一方、本実施形態の損失関数Lは、正則化誤差を用いず、復元誤差Eと潜在変数誤差Rとからなる関数である。したがって、学習部4は、潜在変数z1を直接真の値に近づける学習を行うことができ、潜在変数z1の平均μ1及び分散σ1をより高い精度で学習することができる。
本実施形態に係る学習装置Aの学習方法は、変分オートエンコーダ2に入力される入力画像Gと変分オートエンコーダ2から出力される出力画像G´との復元誤差Eと、エンコーダ2aの出力される第1の潜在変数z1とエンコーダ3から出力される第2の潜在変数z2との潜在変数誤差Rと、からなる損失関数Lを求め、その損失関数Lを最小化するように、変分オートエンコーダ2のパラメータを調整することで学習するステップを含む。
学習部4は、第1の取得ステップとして、入力データ取得部1から入力画像Gを取得し、デコーダ2bの出力から出力画像G´を取得する(ステップS101)。
学習装置Aは、第2の取得ステップとして、エンコーダ2aの出力から第1の潜在変数z1を取得し、エンコーダ3の出力から第2の潜在変数z2を取得する(ステップS102)。
本実施例では、撮像対象物とは、ハニカム構造体であって、例えば、シート状に形成されたハニカム構造の金属(以下、「ハニカムシート」という。)である。そして、本実施例の異常検知は、所定の部材(例えば、FRP等の樹脂部材)とハニカム構造体とを接着させた場合の接着状態(以下、単に「接着状態」という。)の異常を検知するものである。具体的には、本実施例の異常検知は、ハニカムシートと樹脂部材との接着面を超音波で検査した検査画像から、本実施形態の変分オートエンコーダ2を用いて接着状態の異常を検知するものである。
本実施形態の学習方法で学習した学習済みの変分オートエンコーダ2は、入力画像Gと出力画像G´とが同じになるように正常の入力画像の特徴を学習している。したがって、学習済みの変分オートエンコーダ2は、どんな画像が入力されても正常な入力画像に近づけた出力画像を生成することができる。
なお、本実施形態では、ハニカム構造体に対する樹脂等の部材の接着状態の異常検知を説明したが、本発明はこれに限定されず、ハニカム構造体でなくても、周期的な形状を有するものであればよい。
1 入力データ取得部
2 変分オートエンコーダ
2a エンコーダ(第1のエンコーダ)
2b デコーダ
3 エンコーダ(第2のエンコーダ)
4 学習部
Claims (4)
- 入力データを次元圧縮して第1の潜在変数を生成する第1のエンコーダと、前記第1の潜在変数を復元して出力データを生成するデコーダと、を備える変分オートエンコーダと、
前記出力データを次元圧縮して第2の潜在変数を生成する第2のエンコーダと、
前記第1の潜在変数と前記第2の潜在変数との誤差である潜在変数誤差を含む損失関数が最小化するように前記変分オートエンコーダのパラメータを学習する学習部と、
を備えることを特徴とする、学習装置。 - 前記損失関数は、前記入力データと前記出力データとの復元誤差と、前記潜在変数誤差と、からなる関数であることを特徴とする、請求項1に記載の学習装置。
- 前記第1のエンコーダと前記第2のエンコーダとは同一のニューラルネットワークであることを特徴とする、請求項1又は2に記載の学習装置。
- 前記潜在変数誤差は、前記第1の潜在変数と前記第2の潜在変数との平均二乗誤差であることを特徴とする、請求項1から請求項3のいずれか一項に記載の学習装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019051213A JP7205327B2 (ja) | 2019-03-19 | 2019-03-19 | 学習装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019051213A JP7205327B2 (ja) | 2019-03-19 | 2019-03-19 | 学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154561A JP2020154561A (ja) | 2020-09-24 |
JP7205327B2 true JP7205327B2 (ja) | 2023-01-17 |
Family
ID=72559079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019051213A Active JP7205327B2 (ja) | 2019-03-19 | 2019-03-19 | 学習装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7205327B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2021430612B9 (en) | 2021-03-05 | 2024-03-14 | Mitsubishi Electric Corporation | Signal identification device |
CN113315524A (zh) * | 2021-05-26 | 2021-08-27 | 武汉理工大学 | 一种基于深度学习的界标数据压缩传输方法及装置 |
-
2019
- 2019-03-19 JP JP2019051213A patent/JP7205327B2/ja active Active
Non-Patent Citations (1)
Title |
---|
森川将平 他1名,標準的な顔画像データセットを用いた顔方位変換のための深層生成モデル,情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM) 2018-CVIM-214 No.11,情報処理学会,2018年10月31日,pp.1-6 |
Also Published As
Publication number | Publication date |
---|---|
JP2020154561A (ja) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846888B2 (en) | Systems and methods for generating and transmitting image sequences based on sampled color information | |
EP3734549A1 (en) | System and method for fault detection and correction | |
US20210082124A1 (en) | Foreground-aware image inpainting | |
US10133915B2 (en) | Facial recognition using social networking information | |
US10529066B2 (en) | Assessing quality of images or videos using a two-stage quality assessment | |
WO2019128660A1 (zh) | 训练神经网络的方法和设备、图像处理方法和设备以及存储介质 | |
WO2020087607A1 (zh) | 一种基于Bi-Skip-Net的图像去模糊方法 | |
CN111242222B (zh) | 分类模型的训练方法、图像处理方法及装置 | |
JP7205327B2 (ja) | 学習装置 | |
WO2020056718A1 (zh) | 在设备中的神经网络模型的量化方法和装置 | |
US20210118145A1 (en) | Diagnostic imaging support system and diagnostic imaging apparatus | |
Xing et al. | Deep CNN for removal of salt and pepper noise | |
WO2021077140A2 (en) | Systems and methods for prior knowledge transfer for image inpainting | |
JP6773061B2 (ja) | 評価システム、評価装置、評価方法、評価プログラム、及び記録媒体 | |
US20220198609A1 (en) | Modifying sensor data using generative adversarial models | |
JP2020071808A (ja) | 学習装置及び学習方法 | |
CN113807160B (zh) | 图像采集设备劫持的检测方法、装置及计算机设备 | |
EP3869401A1 (en) | Out-of-distribution detection of input instances to a model | |
JP2021136666A (ja) | 撮像装置、デバイス、制御方法、およびプログラム | |
KR20200042874A (ko) | 개인화된 hrtf 생성 방법 | |
CN110717441B (zh) | 视频目标检测方法、装置、设备及介质 | |
US11941862B2 (en) | Apparatus, method, and storage medium | |
CN117726542B (zh) | 基于扩散模型的可控噪声去除方法及系统 | |
US10387803B2 (en) | Sensor system for transcoding data | |
WO2022178834A1 (zh) | 一种图像处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221212 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7205327 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |