JP2020071808A - 学習装置及び学習方法 - Google Patents

学習装置及び学習方法 Download PDF

Info

Publication number
JP2020071808A
JP2020071808A JP2018207276A JP2018207276A JP2020071808A JP 2020071808 A JP2020071808 A JP 2020071808A JP 2018207276 A JP2018207276 A JP 2018207276A JP 2018207276 A JP2018207276 A JP 2018207276A JP 2020071808 A JP2020071808 A JP 2020071808A
Authority
JP
Japan
Prior art keywords
error
learning
feature amount
image
pixel value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018207276A
Other languages
English (en)
Inventor
玄 佐藤
Gen Sato
玄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IHI Corp
Original Assignee
IHI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IHI Corp filed Critical IHI Corp
Priority to JP2018207276A priority Critical patent/JP2020071808A/ja
Publication of JP2020071808A publication Critical patent/JP2020071808A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】オートエンコーダ又は変分オートエンコーダの復元性能を向上させる。【解決手段】オートエンコーダ又は変分オートエンコーダである学習モデルを用いて機械学習する学習装置であって、学習データとして前記学習モデルに入力される第1の画像と、前記学習モデルから出力される第2の画像と、の復元誤差を求め、前記復元誤差がなくなるように前記学習モデルのパラメータを調整することで前記機械学習する学習部を備え、前記学習部は、前記第1の画像の画素値の特徴を示す第1の特徴量と前記第2の画像の画素値の特徴を示す第2の特徴量との誤差である特徴量誤差を算出し、前記特徴量誤差を前記復元誤差に含める。【選択図】図1

Description

本発明は、学習装置及び学習方法に関する。
入力画像の特徴を学習する手法の一つとして、入力画像を次元圧縮(エンコード)し、その次元圧縮したデータを復元(デコード)して出力画像を得るオートエンコーダ(Auto Encoder)を用いる方法がある(例えば、特許文献1)。
特開2018−156451号公報
従来のオートエンコーダでは、復元誤差として画素間のクロスエントロピーのみを用いている。したがって、単純な格子模様のデータセット(複数の入力画像)であっても、ぼやけた画像などを含めたデータセットで学習させると、出力画像において、元の入力画像の形状パターンが失われたり、学習したデータセットにはない別な形状パターンが出力画像に出現したりする場合がある。その結果、オートエンコーダの復元性能が低下する場合がある。
なお、このような問題は、オートエンコーダに限られた問題ではなく、変分オートエンコーダ(Variational Auto Encoder)や他の派生手法にも共通する問題である。
本発明は、このような事情に鑑みてなされたもので、その目的は、オートエンコーダ又は変分オートエンコーダの復元性能を向上させることが可能な学習装置及び学習方法を提供することである。
本発明の一態様は、オートエンコーダ又は変分オートエンコーダである学習モデルを用いて機械学習する学習装置であって、学習データとして前記学習モデルに入力される第1の画像と、前記学習モデルから出力される第2の画像と、の復元誤差を求め、前記復元誤差に基づいて前記学習モデルのパラメータを調整することで前記機械学習する学習部を備え、前記学習部は、前記第1の画像の画素値の特徴を示す第1の特徴量と前記第2の画像の画素値の特徴を示す第2の特徴量との誤差である特徴量誤差を算出し、前記特徴量誤差を前記復元誤差に含めることを特徴とする、学習装置である。
本発明の一態様は、上述の学習装置であって、前記学習部は、前記第1の画像の画素値及び前記第2の画像の画素値の誤差を示す画素値誤差を求める第1の処理部と、前記第1の特徴量及び前記第2の特徴量に基づいて前記特徴量誤差を求める第2の処理部と、前記画素値誤差及び前記特徴量誤差を前記復元誤差に含める第3の処理部と、を備える。
本発明の一態様は、上述の学習装置であって、前記第2の処理部は、前記第1の画像の各画素間での画素値の勾配を前記第1の特徴量として求め、前記第2の画像の各画素間での画素値の勾配を前記第2の特徴量として求める。
本発明の一態様は、上述の学習装置であって、前記第2の処理部は、前記第1の画像の各画素間での画素値を微分することで第1の微分画像を生成することで前記第1の特徴量を求める第1の特徴量算出部と、前記第2の画像の各画素間での画素値を微分することで第2の微分画像を生成することで前記第2の特徴量を求める第2の特徴量算出部と、前記第1の微分画像及び第2の微分画像の誤差を前記特徴量誤差として求める誤差算出部と、備える。
本発明の一態様は、上述の学習装置であって、前記第1の処理部は、交差エントロピーを用いた誤差関数により前記画素値誤差を算出し、前記第2の処理部は、交差エントロピーを用いた誤差関数により前記特徴量誤差を算出する。
本発明の一態様は、コンピュータがオートエンコーダ又は変分オートエンコーダである学習モデルを用いて機械学習する学習方法であって、学習データとして前記学習モデルに入力される第1の画像と、前記学習モデルから出力される第2の画像と、の復元誤差を求め、前記復元誤差に基づいて前記学習モデルのパラメータを調整することで前記機械学習する学習ステップを含み、前記学習ステップは、前記第1の画像の画素値の特徴を示す第1の特徴量を算出する第1の算出ステップと、前記第2の画像の画素値の特徴を示す第2の特徴量を算出する第2の算出ステップと、前記第1の特徴量及び前記第2の特徴量の誤差である特徴量誤差を算出する第3の算出ステップと、前記特徴量誤差を前記復元誤差に含めて当該復元誤差に基づいて前記パラメータを調整する調整ステップと、含むことを特徴とする、学習方法である。
以上説明したように、本発明によれば、オートエンコーダ又は変分オートエンコーダの復元性能を向上させることができる。
本発明の一実施形態に係る学習方法を備える学習装置Aの機能部の一例を示す図である。 本発明の一実施形態に係るオートエンコーダAE及び変分オートエンコーダVAEの構成例を示す図である。 本発明の一実施形態に係る学習部3の機能部の一例を示す図である。 本発明の一実施形態に係る勾配Sの算出方法を説明する図である。 本発明の一実施形態に係る学習装置Aの学習方法の流れを説明する図である。 従来のVAEを適用した場合における入出力画像を示す図である。 本実施例で用いられたデータセットの特徴を説明する図である。 本実施例での入出力画像を示す図である。
以下、本発明の一実施形態に係る学習装置及び学習方法を、図面を用いて説明する。
図1は、本発明の一実施形態に係る学習方法を備える学習装置Aの機能部の一例を示す図である。図1に示す学習装置Aは、オートエンコーダAE(Auto Encoder)又は変分オートエンコーダVAE(Variational Auto Encoder)である学習モデルを用いて、学習データである入力画像の特徴を機械学習する。
なお、本実施形態に係る学習装置Aは、情報処理装置であって、CPU又はMPUなどのマイクロプロセッサ、MCUなどのマイクロコントローラなどにより構成されてよい。
以下に、本発明の一実施形態に係る学習装置Aの各機能部について説明する。
図1に示すように、学習装置Aは、入力画像取得部1、学習モデル2及び学習部3を備える。
入力画像取得部1は、学習データとして入力画像Gを取得する。例えば、入力画像Gは、外部に設けられた撮像装置(不図示)が撮像対象物を撮像した撮像画像(例えば、超音波検査の検査画像)である。なお、例えば、入力画像取得部1は、上記撮像画像を入力画像Gとして当該撮像装置から直接取得してもよい。また、入力画像取得部1は、学習装置Aの外部又は内部に設けられた格納部(不図示)に格納されている上記撮像画像を入力画像Gとして読み込むことで取得してもよい。なお、入力画像Gは、本発明の「第1の画像」の一例である。
ここで、例えば、学習装置Aが撮像対象物の異常を上記撮像画像から検知することを目的として機械学習する場合には、学習データとして用いられる入力画像Gは、すべて正常時の撮像対象物の撮像画像である。
学習モデル2は、オートエンコーダAE又は変分オートエンコーダVAEである。
オートエンコーダAEは、ニューラルネットワークによる教師なしの学習モデルであって、隠れ層のニューロン数を入力層の次元数よりも少なくすることによって、より少ない次元数で入力画像Gを再現するように次元削減を行うことができる。
なお、本実施形態に係るオートエンコーダAEの構成は、公知であるため具体的な説明は省略するが、図2(a)に示すように、オートエンコーダAEは、入力層L1、隠れ層L2及び出力層L3で構成されるニューラルネットワークである。
入力層L1及び出力層L3は、同一の次元数である。一方、隠れ層L2は、入力層L1及び出力層L3よりも次元数が少ない。
したがって、入力画像取得部1で取得された入力画像Gが入力層L1に入力されると、オートエンコーダAEは、入力層L1から隠れ層L2の間(エンコーダ)で入力画像Gを潜在変数zに次元圧縮し、隠れ層L2から出力層L3の間(デコーダ)で、潜在変数zを元の画像になるように復元することで出力画像G´を得る。したがって、この出力画像G´は、オートエンコーダAEのデコーダで復元された画像である。なお、出力画像G´は、本発明の「第2の画像」の一例である。
変分オートエンコーダVAEは、公知であるため詳細な説明は省略するが、図2(b)に示すように、エンコーダで潜在変数zの平均ベクトルμと分散ベクトルσを求めることで、オートエンコーダAEに比べて低次元で抽象的な特徴を学習することができる。
学習部3は、入力画像G及び出力画像Gを取得する。例えば、学習部3は、入力画像取得部1から入力画像Gを取得する。また、学習部3は、学習モデル2の出力から出力画像G´を取得する。
そして、学習部3は、学習データとして学習モデル2に入力される入力画像Gと、学習モデル2から出力される出力画像G´との誤差である復元誤差(Reconstruction Error)Eを求め、この復元誤差Eがなくなるように、又は最小化するように学習モデル2のパラメータ(例えば、重み)を調整することで機械学習を行う。なお、学習モデル2のパラメータを最適化することが、本実施形態に係る機械学習の「学習」に相当する。なお、この学習には、例えば、誤差逆伝播法(back propagation)が用いられる。
なお、学習モデル2が変分オートエンコーダVAEである場合には、KLダイバージェンスによる正則化誤差をも考慮して学習モデル2のパラメータを最適化する必要があるが、この正規化誤差は例えば公知の技術で算出されてもよい。
次に、本発明の一実施形態に係る学習部3の機能部について、図3を用いて説明する。図3は、本発明の一実施形態に係る学習部3の機能部の一例を示す図である。
図3に示すように、学習部3は、第1の処理部4、第2の処理部5及び第3の処理部6を備える。
第1の処理部4は、入力画像G及び出力画像G´の間の画素値の誤差(以下、「画素値誤差」という。)Vを求める。例えば、第1の処理部4は、入力画像Gの画素の画素値Pと当該画素の位置と同じ位置にある出力画像G´の画素の画素値P´との間の誤差eを各画素間で求める。そして、第1の処理部4は、入力画像G及び出力画像G´の間の各画素間で求めた誤差eを合計することで画素値誤差Vを算出する。例えば、第1の処理部4は、以下の式(1)に示すように、交差エントロピーを用いた誤差関数により画素値誤差Vを算出する。すなわち、画素値誤差Vは、入出力画像(入力画像G及び出力画像G´)の交差エントロピーとなる。ただし、本発明はこれに限定されず、第1の処理部4は、画素値誤差Vを、交差エントロピーを用いた誤差関数以外の誤差関数(例えば、RMSE(Root Mean Square Error)やMSE(Mean Squared Error)、MAE(Mean Absolute Error))で求めてもよい。
なお、iは、画素の位置を示すものである。すなわち、式(1)に示す画素値誤差Vは、「1」として設定された位置(例えば、xy座標の位置)から「D」として設定された位置までの各画素の誤差eを合計することを意味する。なお、このDは、任意に設定可能である。本実施形態では、第1の処理部4が入力画像G及び出力画像G´の間のすべての画素間で誤差eを求めるように「D」が設定される。
第2の処理部5は、入力画像Gの画素値Pの特徴を示す第1の特徴量と出力画像G´の画素値qの特徴を示す第2の特徴量とを算出する。そして、第2の処理部5は、第1の特徴量及び第2の特徴量の誤差である特徴量誤差Uを算出する。
この第1の特徴量は、いわゆる入力画像Gの形状特徴を示すものであって、本実施形態では入力画像Gの勾配である。同様に、第2の特徴量は、出力画像G´の形状特徴を示すものであって、本実施形態では出力画像G´の勾配である。ただし、本発明はこれに限定されず、第1の特徴量及び第2の特徴量は、勾配の代わりに,ISC(増分符号)やOC(方向符号)など、画素値の特徴を示す他の符号や指標を用いても構わない。また、第1の特徴量及び第2の特徴量は、画像を二値化や微分を行うことで求められる輪郭を示すものであってもよい。
第3の処理部6は、画素値誤差P及び特徴量誤差Uを復元誤差Eに含める。例えば、第3の処理部6は、画素値誤差P及び特徴量誤差Uを加算した値を復元誤差Eに含めて、その復元誤差Eに基づいて(例えば、復元誤差Eに最小化するように)学習モデル2のパラメータを調整することで機械学習を行う。このように、第3の処理部6は、画素値誤差P及び特徴量誤差Uに基づいて復元誤差Eを設定してもよい。
次に、本発明の一実施形態に係る第2の処理部5の機能部について説明する。
第2の処理部5は、第1の特徴量算出部7、第2の特徴量算出部8及び誤差算出部9を備える。
第1の特徴量算出部7は、入力画像Gにおける画素値Pの勾配Sを第1の特徴量として求める。例えば、まず、第1の特徴量算出部7は、入力画像Gの各画素間での画素値Pの勾配Stを求める。本実施形態では、第1の特徴量算出部7は、勾配Stとして入力画像Gの各画素間におけるx方向の勾配Sx及び入力画像Gの各画素間におけるy方向の勾配Syを求める。
ここで、入力画像G内の画素の位置(x,y)における画素値をP(x,y)としたとき、勾配Sx及び勾配Syは以下の式(2)及び(3)で求められる。
勾配Sx=P(x+1,y)−P(x,y) …(2)
勾配Sy=P(x,y+1)−P(x,y) …(3)
すなわち、第1の特徴量算出部7は、図4に示すように、入力画像Gに対してx方向及びy方向のそれぞれにおいて微分処理を行うことで勾配Sx及び勾配Syを算出する。本実施形態に係る微分処理とは、例えば、隣接する画素の画素値の引き算である。
第1の特徴量算出部7は、各画素間の勾配Sxの総和及び各画素間の勾配Syの総和を足して2で割った値を勾配Sとして求める。
なお、第1の特徴量算出部7は、入力画像Gの各画素間での画素値を微分処理して入力画像Gのx方向及びy方向の微分画像(第1の部分画像)を生成することで、入力画像Gにおける画素値Pの勾配Sを求めてもよい。
第2の特徴量算出部8は、出力画像G´における画素値qの勾配S´を第1の特徴量として求める。例えば、まず、第2の特徴量算出部8は、出力画像G´の各画素間での画素値qの勾配S´tを求める。本実施形態では、第2の特徴量算出部8は、勾配S´tとして出力画像G´の各画素間におけるx方向の勾配S´x及び出力画像G´の各画素間におけるy方向の勾配S´yを求める。
ここで、出力画像G´内の画素の位置(x,y)における画素値をq(x,y)としたとき、勾配S´x及び勾配S´yは以下の式(4)及び(5)で求められる。
勾配S´x=q(x+1,y)−q(x,y) …(4)
勾配S´y=q(x,y+1)−q(x,y) …(5)
すなわち、第2の特徴量算出部8は、図4に示すように、出力画像G´に対してx方向及びy方向のそれぞれにおいて微分処理を行うことで勾配S´x及び勾配S´yを算出する。本実施形態に係る微分処理とは、例えば、隣接する画素の画素値の引き算である。
第2の特徴量算出部8は、各画素間の勾配S´xの総和及び各画素間の勾配S´yの総和を足して2で割った値を勾配S´として求める。
なお、第2の特徴量算出部8は、出力画像G´の各画素間での画素値を微分処理して出力画像G´のx方向及びy方向の微分画像(第2の部分画像)を生成することで、出力画像G´における画素値qの勾配S´を求めてもよい。
誤差算出部9は、勾配Sと勾配S´との誤差である特徴量誤差Uを求める。例えば、誤差算出部9は、交差エントロピーを用いた誤差関数により特徴量誤差Uを算出する。ただし、本発明はこれに限定されず、誤差算出部9は、特徴量誤差UをRMSE(Root Mean Square Error)やMSE(Mean Squared Error)、MAE(Mean Absolute Error)等を用いた誤差関数で求めてもよい。
本実施形態では、誤差算出部9は、交差エントロピーを用いた誤差関数により特徴量誤差Uを求める。例えば、誤差算出部9は、下記の式(6)に示すように、第1の微分画像及び第2の微分画像の交差エントロピーを求めることで特徴量誤差Uを得ることができる。
したがって、例えば、第3の処理部6は、画素値誤差P及び特徴量誤差Uを加算した値を復元誤差Eに含めることで、例えば、その復元誤差Eが最小化するように学習モデル2のパラメータを調整することで機械学習を行う。
例えば、第3の処理部6は、画素値誤差Pの重み係数Wa及び特徴量誤差Uの重み係数Wbとした場合に、以下に示す式(7)で復元誤差Eを定義してもよい。すなわち、第3の処理部6は、画素値誤差P及び特徴量誤差Uの加重平均を復元誤差Eとして設定してもよい。
次に、本発明の一実施形態に係る学習装置Aの学習方法の流れを、図5を用いて説明する。
本発明の一実施形態に係る学習装置Aの学習方法は、学習データとして学習モデル2に入力される入力画像Gと、学習モデル2から出力される出力画像G´と、の復元誤差Eを求め、この復元誤差Eに基づいて学習モデル2のパラメータを調整することで機械学習する学習ステップを含む。
具体的には、学習ステップは、第1の取得ステップ、第2の取得ステップ、第1の算出ステップ、第2の算出ステップ、第3の算出ステップ及び調整ステップを備える。
学習装置Aは、第1の取得ステップとして、入力画像取得部1から入力画像Gを取得する(ステップS101)。また、学習装置Aは、第2の取得ステップとして、学習モデル2で復元された画像、すなわち出力画像G´を取得する(ステップS102)。
そして、学習装置Aは、第1の算出ステップとして入力画像Gの画素値の特徴を示す第1の特徴量を算出し、第2の算出ステップとして出力画像G´の画素値の特徴を示す第2の特徴量を算出する(ステップS103)。
学習装置Aは、算出した第1の特徴量及び第2の特徴量の誤差である特徴量誤差Uを、交差エントロピー、RMSE、MSE、又はMAE等を用いた誤差関数を用いて算出する(ステップS104)。そして、学習装置Aは、特徴量誤差Uを復元誤差Eに含め、この復元誤差Eがなくなるように、又は最小化するように学習モデル2のパラメータを調整することで機械学習を行う。
具体的には、学習装置Aは、入力画像G及び出力画像G´のそれぞれの形状特徴(第1の特徴量及び第2の特徴量)を算出し、入力画像の第1の特徴量を真値とし、出力画像G´の第2の特徴量との特徴量誤差Uを求める。そして、学習装置Aは、復元誤差Eの評価関数に、形状特徴を評価する項である特徴量誤差Uを追加して、この復元誤差Eがなくなるように、又は最小化するように学習モデル2のパラメータを調整することで機械学習を行う。なお、この復元誤差Eの評価関数には、特徴量誤差Uの他に、画素値誤差Pの項が含まれている。
次に、本発明の一実施形態に係る効果について説明する。
例えば、従来のオートエンコーダAEや変分オートエンコーダVAEでは、復元誤差として画素間のクロスエントロピーのみを用いている。したがって、図6に示すように、単純な格子模様の画像を入力画像として入力しても、出力画像として元の入力画像の形状パターンが失われたり、学習したデータセットにはない別な形状パターンが出力画像に出現したりする場合がある。
特に、変分オートエンコーダVAEの場合には、入力画像の特徴を多次元正規分布上で学習するため、ある画像とある画像の中間のような、本体の入力画像とは異なる特徴が出力画像に出現することがある。したがって、データセットによっては復元前後の形状が一致しない方向に学習が進んでしまう場合がある。
一方、本実施形態に係る学習装置Aは、入力画像Gの画素値の特徴を示す第1の特徴量と出力画像G´の画素値の特徴を示す第2の特徴量との誤差である特徴量誤差Uを算出し、特徴量誤差Uを復元誤差Eに含めて学習する。
これにより、入力画像のパターンを保持した復元が可能となり、オートエンコーダAE又は変分オートエンコーダVAEの復元性能を向上させることできる。
次に、実施例として、上記の学習方法で機械学習した学習モデル2(変分オートエンコーダVAE)を用いて撮像対象物の異常検知を行った場合について説明する。
本実施例では、撮像対象物とは、ハニカム構造体であって、例えば、シート状に形成されたハニカム構造の金属(以下、「ハニカムシート」という。)である。そして、本実施例の異常検知は、所定の部材(例えば、FRP等の樹脂部材)とハニカム構造体とを接着させた場合の接着状態(以下、単に「接着状態」という。)の異常を検知するものである。具体的には、本実施例の異常検知は、ハニカムシートと樹脂部材との接着面を超音波で検査した検査画像から、本実施形態の変分オートエンコーダVAEを用いて接着状態の異常を検知するものである。
ここで、超音波で検査した検査画像では、ハニカムシートと所定の部材との接着ができていない(接着状態が異常である)箇所が白く映る。すなわち、超音波で検査した検査画像では、ハニカムシートと所定の部材との接着ができていない箇所でハニカムの周期性が消失する。したがって、異常検知では、このハニカムの周期性が消失した領域を抽出することで接着状態の異常を検知可能である。そのため、事前に、本実施形態の学習方法(又は学習装置A)を用いて、接着状態が正常であったときの複数の検査画像(ハニカムの周期性が消失した領域がない検査画像)のデータセット(4000枚)を学習データ(入力画像G)として学習モデルに入力して機械学習させた。
なお、このハニカムシートには厚みが異なる個所があり、その厚みによってハニカムの形状や規則性に違いが生じる。したがって、例えば、図7に示すように、ハニカムシートの肉厚の部分では、ハニカムシートの肉薄の部分と比較して、ハニカムの規則性が崩れてしまうことがある。したがって、検査画像(4000枚)のデータセットには、ハニカムの形が一定でない箇所や黒くつぶれてしまった箇所が存在する。
ここで、異常検知の検知方法について、説明する。
本実施形態の学習方法で学習した学習済みの変分オートエンコーダVAEは、入力画像Gと出力画像G´とが同じになるように正常の入力画像の特徴を学習している。したがって、学習済みの変分オートエンコーダVAEは、どんな画像が入力されても正常な入力画像に近づけた出力画像を生成することができる。
したがって、異常検知において、正常の検査画像(ハニカムの周期性が消失した領域がない検査画像)を入力画像として学習済みの変分オートエンコーダVAEに入力された場合には、当該変分オートエンコーダVAEから出力される出力画像は、入力画像と差がなない。一方、異常検知において、異常の検査画像(ハニカムの周期性が消失した領域がある検査画像)を入力画像として学習済みの変分オートエンコーダVAEに入力された場合には、当該変分オートエンコーダVAEから出力される出力画像は、正常の検査画像の特徴に近づけた画像になる。そのため、出力画像では、入力画像と比較して、ハニカムの周期性が消失した領域がハニカムの形状に置き換わっている。したがって、出力画像と入力画像との間に差(すなわちハニカムの周期性が消失した領域の有無)が生じることになり、学習済みの変分オートエンコーダVAEを有する異常検知装置(例えば、コンピュータ)は、この差を検知することで異常を検知することができる。
図8は、本実施形態の学習した変分オートエンコーダVAEを用いて異常検知したときの出力画像と、復元誤差として画素間のクロスエントロピーのみを用いて学習する従来の学習方法で学習した変分オートエンコーダVAEを用いて異常検知したときの出力画像とを比較した図である。
図8に示すように、本実施形態では、隣接画像間の関係、すなわち特徴量誤差Uを学習に反映させているため、従来の変分オートエンコーダVAEと比較して、元の入力画像にないパターンを学習することが少なくなった。すなわち、本実施形態の変分オートエンコーダVAEは、従来の変分オートエンコーダVAEと比較して、安定してハニカムを復元することができ、異常時の過検知を減少させることができる。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
(変形例1)
上記実施形態では、第1の処理部4は、入力画像Gの画素の画素値Pと当該画素の位置と同じ位置にある出力画像G´の画素の画素値P´との間の誤差eを各画素間で求め、その誤差eを合計することで画素値誤差Vを算出したが、本発明はこれに限定されない。例えば、第1の処理部4は、すべての画像間で誤差eを求める必要はなく、入力画像Gにおける所定の領域内の画素と、当該画素の位置と同じ位置にある出力画像G´の画素との間で誤差eを求めてもよい。すなわち、第1の処理部4は、すべての画像間で誤差eを求める必要はなく、所定の領域内の各画素間で誤差eを求め、その求めた各誤差eを合計することで画素値誤差Vを算出してもよい。
(変形例2)
上記実施形態では、第1の特徴量算出部7は、入力画像Gの各画素間で画素値Pの勾配Stを求めたが、本発明はこれに限定されず、入力画像Gにおける所定の領域の各画素間で画素値Pの勾配Stを求めてもよい。同様に、第2の特徴量算出部8は、出力画像G´の各画素間で画素値qの勾配S´tを求めたが、本発明はこれに限定されず、出力画像G´における所定の領域の各画素間で画素値qの勾配S´tを求めてもよい。
(変形例3)
上記実施形態では、第1の特徴量算出部7は、各画素間の勾配Sxの総和及び各画素間の勾配Syの総和を足して2で割った値を勾配Sとして求めたが、本発明はこれに限定されない。例えば、第1の特徴量算出部7は、各画素間の勾配Sxの総和及び各画素間の勾配Syの総和のうち、いずれかを勾配Sとしてもよい。また、第1の特徴量算出部7は、勾配Sx及び勾配Syの双方を用いて勾配Sを算出する場合には、勾配Sxの特徴及び勾配Syの特徴を反映した値を勾配Sとすればよく、必ずしも各画素間の勾配Sxの総和及び各画素間の勾配Syの総和を足して2で割った値を勾配Sとしなくてもよい。例えば、第1の特徴量算出部7は、各画素間の勾配Sx及び勾配Syのそれぞれにおいて、代表値(例えば、平均値、中央値、又は最頻値)を求めて、その各代表値を足して2で割った値を勾配Sとしてもよい。なお、変形例3は、第2の特徴量算出部8の勾配S´にも適用できる。ただし、第2の特徴量算出部8の勾配S´の算出方法は、第1の特徴量算出部7の勾配Sの算出方法と同一であることが望ましい。
(変形例4)
上記実施例では、ハニカム構造体に対する樹脂等の部材の接着状態の異常検知を説明したが、本発明はこれに限定されず、ハニカム構造体でなくても、周期的な形状を有するものであれば適用が可能である。なお、周期的な形状は、厳密なものでなくてもよく、オートエンコーダAE又は変分オートエンコーダVAEなどの学習モデルを用いた機械学習ができれば対象は限定されない。
以上、説明したように、本実施形態に係る学習装置Aは、オートエンコーダAE又は変分オートエンコーダVAEである学習モデル2を用いて機械学習する学習装置であって、入力画像Gと出力画像G´との復元誤差Eを求め、復元誤差Eに基づいて学習モデル2のパラメータを調整することで機械学習する学習部3を備える。そして、学習部3は、入力画像Gの画素値の特徴を示す第1の特徴量と出力画像G´の画素値の特徴を示す第2の特徴量との誤差である特徴量誤差Uを算出し、特徴量誤差Uを復元誤差Eに含める。
このような構成によれば、入力画像のパターンを保持した復元が可能となり、オートエンコーダAE又は変分オートエンコーダVAEの復元性能を向上させることできる。
また、本実施形態に係る学習方法は、コンピュータがオートエンコーダAE又は変分オートエンコーダVAEである学習モデル2を用いて機械学習する学習方法であって、入力画像Gと出力画像G´との復元誤差Eを求め、復元誤差Eに基づいて学習モデル2のパラメータを調整することで機械学習する学習ステップを含む。そして、学習ステップは、入力画像Gの画素値の特徴を示す第1の特徴量を算出する第1の算出ステップと、出力画像G´の画素値の特徴を示す第2の特徴量を算出する第2の算出ステップと、第1の特徴量及び第2の特徴量の誤差である特徴量誤差Uを算出する第3の算出ステップと、特徴量誤差Uを復元誤差Eに含めて当該復元誤差Eに基づいて学習モデル2のパラメータを調整する調整ステップと、含む。
このような構成によれば、入力画像のパターンを保持した復元が可能となり、オートエンコーダAE又は変分オートエンコーダVAEの復元性能を向上させることできる。
なお、上述した実施形態における学習装置Aの全部または一部をコンピュータで実現するようにしてもよい。この場合、上記コンピュータは、CPU、GPUなどのプロセッサ及びコンピュータ読み取り可能な記録媒体を備えてもよい。そして、学習装置Aの全部または一部の機能をコンピュータで実現するためのプログラムを上記コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムを上記プロセッサに読み込ませ、実行することによって実現してもよい。ここで、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、FPGA等のプログラマブルロジックデバイスを用いて実現されるものであってもよい。
A 学習装置
1 入力画像取得部
2 学習モデル
3 学習部
4 第1の処理部
5 第2の処理部
6 第3の処理部
7 第1の特徴量算出部
8 第2の特徴量算出部
9 誤差算出部

Claims (6)

  1. オートエンコーダ又は変分オートエンコーダである学習モデルを用いて機械学習する学習装置であって、
    学習データとして前記学習モデルに入力される第1の画像と、前記学習モデルから出力される第2の画像と、の復元誤差を求め、前記復元誤差に基づいて前記学習モデルのパラメータを調整することで前記機械学習する学習部を備え、
    前記学習部は、
    前記第1の画像の画素値の特徴を示す第1の特徴量と前記第2の画像の画素値の特徴を示す第2の特徴量との誤差である特徴量誤差を算出し、前記特徴量誤差を前記復元誤差に含めることを特徴とする、学習装置。
  2. 前記学習部は、
    前記第1の画像の画素値及び前記第2の画像の画素値の誤差を示す画素値誤差を求める第1の処理部と、
    前記第1の特徴量及び前記第2の特徴量に基づいて前記特徴量誤差を求める第2の処理部と、
    前記画素値誤差及び前記特徴量誤差を前記復元誤差に含める第3の処理部と、
    を備えることを特徴とする、請求項1に記載の学習装置。
  3. 前記第2の処理部は、前記第1の画像の各画素間での画素値の勾配を前記第1の特徴量として求め、前記第2の画像の各画素間での画素値の勾配を前記第2の特徴量として求めることを特徴とする、請求項2に記載の学習装置。
  4. 前記第2の処理部は、
    前記第1の画像の各画素間での画素値を微分することで第1の微分画像を生成することで前記第1の特徴量を求める第1の特徴量算出部と、
    前記第2の画像の各画素間での画素値を微分することで第2の微分画像を生成することで前記第2の特徴量を求める第2の特徴量算出部と、
    前記第1の微分画像及び第2の微分画像の誤差を前記特徴量誤差として求める誤差算出部と、
    備えることを特徴とする、請求項2に記載の学習装置。
  5. 前記第1の処理部は、交差エントロピーを用いた誤差関数により前記画素値誤差を算出し、
    前記第2の処理部は、交差エントロピーを用いた誤差関数により前記特徴量誤差を算出することを特徴とする、請求項2から4のいずれか一項に記載の学習装置。
  6. コンピュータがオートエンコーダ又は変分オートエンコーダである学習モデルを用いて機械学習する学習方法であって、
    学習データとして前記学習モデルに入力される第1の画像と、前記学習モデルから出力される第2の画像と、の復元誤差を求め、前記復元誤差に基づいて前記学習モデルのパラメータを調整することで前記機械学習する学習ステップを含み、
    前記学習ステップは、
    前記第1の画像の画素値の特徴を示す第1の特徴量を算出する第1の算出ステップと、
    前記第2の画像の画素値の特徴を示す第2の特徴量を算出する第2の算出ステップと、
    前記第1の特徴量及び前記第2の特徴量の誤差である特徴量誤差を算出する第3の算出ステップと、
    前記特徴量誤差を前記復元誤差に含めて当該復元誤差がなくなるように前記パラメータを調整する調整ステップと、
    含むことを特徴とする、学習方法。
JP2018207276A 2018-11-02 2018-11-02 学習装置及び学習方法 Pending JP2020071808A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018207276A JP2020071808A (ja) 2018-11-02 2018-11-02 学習装置及び学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018207276A JP2020071808A (ja) 2018-11-02 2018-11-02 学習装置及び学習方法

Publications (1)

Publication Number Publication Date
JP2020071808A true JP2020071808A (ja) 2020-05-07

Family

ID=70548253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018207276A Pending JP2020071808A (ja) 2018-11-02 2018-11-02 学習装置及び学習方法

Country Status (1)

Country Link
JP (1) JP2020071808A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022024245A1 (ja) * 2020-07-29 2022-02-03 オリンパス株式会社 検査システム、学習方法、検査方法、及び記憶媒体
JP2022027657A (ja) * 2020-07-29 2022-02-10 株式会社新日本コンサルタント マンホールポンプ異常検知方法
WO2022044197A1 (ja) * 2020-08-27 2022-03-03 三菱電機株式会社 形状モデリング装置及び形状モデリング方法
JP7487144B2 (ja) 2021-06-09 2024-05-20 株式会社東芝 情報処理装置、方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022024245A1 (ja) * 2020-07-29 2022-02-03 オリンパス株式会社 検査システム、学習方法、検査方法、及び記憶媒体
JPWO2022024245A1 (ja) * 2020-07-29 2022-02-03
JP2022027657A (ja) * 2020-07-29 2022-02-10 株式会社新日本コンサルタント マンホールポンプ異常検知方法
JP7431390B2 (ja) 2020-07-29 2024-02-15 NiX JAPAN株式会社 マンホールポンプ異常検知方法
JP7499337B2 (ja) 2020-07-29 2024-06-13 株式会社エビデント 検査システム、学習方法、検査方法、及び記憶媒体
WO2022044197A1 (ja) * 2020-08-27 2022-03-03 三菱電機株式会社 形状モデリング装置及び形状モデリング方法
JP7487144B2 (ja) 2021-06-09 2024-05-20 株式会社東芝 情報処理装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2020071808A (ja) 学習装置及び学習方法
Shen et al. An iterative image dehazing method with polarization
Li et al. Fast guided global interpolation for depth and motion
Harikiran et al. Impulse noise removal in digital images
CN104350746A (zh) 基于局部幅度和相位谱的图像质量测量
KR101786754B1 (ko) 나이 추정 장치 및 방법
Gong et al. Combining sparse representation and local rank constraint for single image super resolution
Nair et al. Direction based adaptive weighted switching median filter for removing high density impulse noise
CN118302788A (zh) 从有噪原始图像进行高动态范围视图合成
Patel et al. Separated component-based restoration of speckled SAR images
Lyakhov et al. A new method for adaptive median filtering of images
CN110648326A (zh) 一种构建图像质量评估卷积神经网络的方法及装置
JP7205327B2 (ja) 学習装置
CN117726542A (zh) 基于扩散模型的可控噪声去除方法及系统
Naumova et al. Fast dictionary learning from incomplete data
CN109658357A (zh) 一种面向遥感卫星图像的去噪方法
CN113327209A (zh) 深度图像生成方法、装置、电子设备和存储介质
Fry et al. Validation of modulation transfer functions and noise power spectra from natural scenes
CN117392036A (zh) 基于照明幅度的低光图像增强方法
CN111861931A (zh) 模型训练、图像增强方法和装置、电子设备及存储介质
Zin et al. Local image denoising using RAISR
JP2015179426A (ja) 情報処理装置、パラメータの決定方法、及びプログラム
CN107203976B (zh) 一种基于噪点检测的自适应非局部均值去噪方法及系统
CN113902617B (zh) 基于参考图像的超分辨率方法、装置、设备及介质
CN116109957A (zh) 一种运动检测方法、装置、存储介质及电子设备