JP2021082155A - モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム - Google Patents
モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム Download PDFInfo
- Publication number
- JP2021082155A JP2021082155A JP2019210874A JP2019210874A JP2021082155A JP 2021082155 A JP2021082155 A JP 2021082155A JP 2019210874 A JP2019210874 A JP 2019210874A JP 2019210874 A JP2019210874 A JP 2019210874A JP 2021082155 A JP2021082155 A JP 2021082155A
- Authority
- JP
- Japan
- Prior art keywords
- data
- background
- training
- estimator
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 104
- 238000012549 training Methods 0.000 claims abstract description 276
- 238000010801 machine learning Methods 0.000 claims abstract description 115
- 238000004364 calculation method Methods 0.000 claims description 65
- 230000007547 defect Effects 0.000 claims description 64
- 238000003860 storage Methods 0.000 description 84
- 238000012545 processing Methods 0.000 description 72
- 239000000047 product Substances 0.000 description 62
- 238000007689 inspection Methods 0.000 description 44
- 230000008569 process Effects 0.000 description 40
- 230000004048 modification Effects 0.000 description 28
- 238000012986 modification Methods 0.000 description 28
- 238000012806 monitoring device Methods 0.000 description 26
- 210000002569 neuron Anatomy 0.000 description 20
- 238000013528 artificial neural network Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 17
- 230000010365 information processing Effects 0.000 description 17
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 10
- 206010041349 Somnolence Diseases 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 238000004806 packaging method and process Methods 0.000 description 8
- 238000011179 visual inspection Methods 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Chemical & Material Sciences (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
Abstract
Description
図1は、本発明を適用した場面の一例を模式的に例示する。図1に示されるとおり、本実施形態に係る推定システム100は、モデル生成装置1及び推定装置2を備えている。
[ハードウェア構成]
<モデル生成装置>
図2は、本実施形態に係るモデル生成装置1のハードウェア構成の一例を模式的に例示する。図2に示されるとおり、本実施形態に係るモデル生成装置1は、制御部11、記憶部12、通信インタフェース13、外部インタフェース14、入力装置15、出力装置16、及びドライブ17が電気的に接続されたコンピュータである。なお、図2では、通信インタフェース及び外部インタフェースを「通信I/F」及び「外部I/F」と記載している。
図3は、本実施形態に係る推定装置2のハードウェア構成の一例を模式的に例示する。図3に示されるとおり、本実施形態に係る推定装置2は、制御部21、記憶部22、通信インタフェース23、外部インタフェース24、入力装置25、出力装置26、及びドライブ27が電気的に接続されたコンピュータである。
<モデル生成装置>
図4A〜図4Cは、本実施形態に係るモデル生成装置1のソフトウェア構成の一例を模式的に例示する。
推定器5、生成器60、識別器61、及び入力推定器62それぞれには、機械学習を実施可能な任意のモデルが利用されてよい。図4A〜図4Cに示されるとおり、本実施形態では、推定器5、生成器60、識別器61、及び入力推定器62はそれぞれ、多層構造の全結合型ニューラルネットワークにより構成される。推定器5、生成器60、識別器61、及び入力推定器62はそれぞれ、入力層(51、601、611、621)、中間(隠れ)層(52、602、612、622)、及び出力層(53、603、613、623)を備えている。
図4Aに示されるとおり、第1訓練部114は、各学習データセット30について、生成された差分データ37を推定器5の入力層51に入力し、対象の特徴を推定した結果に対応する出力値を出力層53から取得する。推定器5の機械学習において、第1訓練部114は、取得される出力値と正解データ32との間の誤差が小さくなるように、推定器5の演算パラメータの値を調節する。これにより、各学習データセット30について、差分データ37から対象の特徴を推定する能力を獲得した訓練済みの推定器5を生成することができる。
図4Bに示されるとおり、本実施形態に係る生成器60の機械学習は、上記第1訓練ステップ及び第2訓練ステップを含む。第1訓練ステップでは、第2訓練部116は、生成器60の入力層601にノイズ631を入力し、ノイズ631から生成された疑似背景データ633に対応する出力値を出力層603から取得する。第2訓練部116は、生成された疑似背景データ633を識別器61の入力層611に入力し、入力された背景データの由来を識別した結果に対応する出力値を出力層613から取得する。また、第2訓練部116は、学習用背景データ39を識別器61の入力層611に入力し、入力された背景データの由来を識別した結果に対応する出力値を出力層613から取得する。
図4Cに示されるとおり、第3訓練部118は、各学習データセット64について、疑似背景データ643を入力推定器62の入力層621に入力し、出力層623から出力値を取得する。入力推定器62から得られる出力値は、入力された疑似背景データ643を機械学習済みの生成器60により生成するために、機械学習済みの生成器60に与える入力値(ノイズ)を推定した結果に対応する。第3訓練部118は、取得される出力値と対応するノイズ641との間の誤差が小さくなるように、入力推定器62の演算パラメータの値を調節する。これにより、画像データに写る背景に適合する(疑似)背景データを機械学習済みの生成器60により生成するために、機械学習済みの生成器60に与える入力値(ノイズ)を推定する能力を獲得した訓練済みの入力推定器62を生成することができる。
図4Cに示されるとおり、本実施形態では、背景取得部112は、上記機械学習により生成された訓練済みの生成器60及び入力推定器62を利用することで、各学習データセット30の訓練データ31に対応する背景データ35を生成することができる。
図5は、本実施形態に係る推定装置2のソフトウェア構成の一例を模式的に例示する。
モデル生成装置1及び推定装置2の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、モデル生成装置1及び推定装置2の各ソフトウェアモジュールがいずれも汎用のCPUによって実現される例について説明している。しかしながら、以上のソフトウェアモジュールの一部又は全部が、1又は複数の専用のプロセッサにより実現されてもよい。また、モデル生成装置1及び推定装置2それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換及び追加が行われてもよい。
[モデル生成装置]
(A)生成器の機械学習
図6Aは、本実施形態に係るモデル生成装置1による生成器60の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
ステップS101では、制御部11は、第2データ取得部115として動作し、複数件の学習用背景データ39を取得する。
ステップS102では、制御部11は、第2訓練部116として動作し、取得された複数件の学習用背景データ39を使用して、生成器60の機械学習を実施する。これにより、訓練データ31に対する背景データ35を生成するように訓練された機械学習済みの生成器60を構築する。
ステップS1021では、制御部11は、学習用背景データ39及び生成器60により生成された疑似背景データ633を使用して、入力された背景データの由来を識別するように識別器61を訓練する。ステップS1021は、上記第1訓練ステップの一例である。この機械学習の訓練処理には、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。後述するステップS1022等の他のニューラルネットワークの機械学習の処理についても同様である。
ステップS1022では、制御部11は、識別器61の識別性能を低下させるような疑似背景データ633を生成するように生成器60を訓練する。換言すると、制御部11は、識別器61が「真」と識別する(すなわち、学習データ由来と識別する)ような疑似背景データ633を生成するように生成器60を訓練する。ステップS1022は、上記第2訓練ステップの一例である。
ステップS1023では、制御部11は、ステップS1021及びステップS1022の処理を繰り返すか否かを判定する。処理を繰り返す基準は任意に決定されてよい。例えば、処理を繰り返す規定回数が設定されていてもよい。規定回数は、例えば、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。この場合、制御部11は、ステップS1021及びステップS1022の処理を実行した回数が規定回数に到達したか否かを判定する。実行回数が規定回数に到達していないと判定した場合、制御部11は、ステップS1021に処理を戻し、ステップS1021及びステップS1022の処理を再度実行する。一方、実行回数が規定回数に到達していると判定した場合には、制御部11は、生成器60の機械学習の処理を完了し、次のステップS103に処理を進める。
図6Aに戻り、ステップS103では、制御部11は、保存処理部119として動作し、機械学習により構築された訓練済みの生成器60に関する情報を第2学習結果データ122として生成する。そして、制御部11は、生成された第2学習結果データ122を所定の記憶領域に保存する。
図7は、本実施形態に係るモデル生成装置1による入力推定器62の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
ステップS111では、制御部11は、第3データ取得部117として動作し、複数の学習データセット64を取得する。各学習データセット64は、入力値のサンプルであるノイズ641、及び機械学習済みの生成器60にノイズ641を与えることで生成される疑似背景データ643の組み合わせにより構成される。
ステップS112では、制御部11は、第3訓練部118として動作し、取得された複数の学習データセット64を使用して、入力推定器62の機械学習を実施する。当該機械学習では、制御部11は、各学習データセット64について、機械学習済みの生成器60に与えた入力値を疑似背景データ643から入力推定器62により推定することで得られる推定値がノイズ641に適合するように入力推定器62を訓練する。
ステップS113では、制御部11は、保存処理部119として動作し、機械学習により構築された訓練済みの入力推定器62に関する情報を第3学習結果データ123として生成する。そして、制御部11は、生成された第3学習結果データ123を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部11内のRAM、記憶部12、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。
図8は、本実施形態に係るモデル生成装置1による推定器5の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、本発明の「モデル生成方法」の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
ステップS121では、制御部11は、第1データ取得部111として動作し、複数の学習データセット30を取得する。各学習データセット30は、画像データである訓練データ31、及び訓練データ31に含まれる特徴を示す正解データ32の組み合わせにより構成される。
ステップS122では、制御部11は、背景取得部112として動作し、各学習データセット30について、訓練データ31に対する背景データ35を取得する。
ステップS123では、制御部11は、差分算出部113として動作し、各学習データセット30について、取得された背景データ35及び訓練データ31の差分を算出することで、差分データ37を生成する。差分データ37を生成すると、制御部11は、次のステップS124に処理を進める。
ステップS124では、制御部11は、第1訓練部114として動作し、生成された差分データ37を使用して、推定器5の機械学習を実施する。当該機械学習では、制御部11は、各学習データセット30について、生成された差分データ37から推定器5により特徴を推定した結果が正解データ32に適合するように推定器5を訓練する。
ステップS125では、制御部11は、保存処理部119として動作し、機械学習により構築された訓練済みの推定器5に関する情報を第1学習結果データ121として生成する。そして、制御部11は、生成された第1学習結果データ121を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部11内のRAM、記憶部12、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。
図10は、本実施形態に係る推定装置2の処理手順の一例を示すフローチャートである。以下で説明する処理手順は、推定方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
ステップS201では、制御部21は、データ取得部211として動作し、対象画像データ41を取得する。
ステップS202では、制御部21は、背景取得部212として動作し、対象画像データ41に対応する対象背景データ45を取得する。
ステップS203では、制御部21は、差分算出部213として動作し、対象画像データ41と対象背景データ45との差分を取ることで、対象差分データ47を生成する。対象背景データ45に基づいて対象画像データ41に含まれる背景に関する情報を低減可能であれば、本ステップS203の差分計算の方法は任意に決定されてよい。本ステップS203の差分計算の方法は、上記ステップS123と同様であってよい。対象差分データ47を生成すると、制御部21は、次のステップS204に処理を進める。
ステップS204では、制御部21は、推定部214として動作し、機械学習済みの推定器5を利用して、生成された対象差分データ47に含まれる特徴を推定する。本実施形態では、制御部21は、第1学習結果データ121を参照して、機械学習済みの推定器5の設定を行う。制御部21は、生成された対象差分データ47を機械学習済みの推定器5の入力層51に入力し、機械学習済みの推定器5の演算処理を実行する。これにより、制御部21は、対象差分データ47に含まれる対象の特徴を推定した結果に対応する出力値を機械学習済みの推定器5の出力層53から取得することができる。すなわち、本実施形態では、対象画像データ41に含まれる特徴を推定することは、対象差分データ47を機械学習済みの推定器5に与えて、機械学習済みの推定器5の演算結果を取得することにより達成される。対象の特徴に関する推定処理が完了すると、制御部21は、次のステップS205に処理を進める。
ステップS205では、制御部21は、出力部215として動作し、対象の特徴を推定した結果に関する情報を出力する。
以上のとおり、本実施形態では、上記ステップS123及ぶステップS124により、推定器5は、背景データ35の情報が除外された訓練データ31(差分データ37)から、正解データ32のとおりに対象の特徴を推定するように訓練される。その結果、機械学習済みの推定器5は、差分計算で除外された背景データ35の情報を利用せずに、対象の特徴に関する推定タスクを遂行する能力を獲得することができる。すなわち、対象の特徴に関する推定タスクを訓練済みの推定器5により遂行する際に、背景データ35に対応する情報が考慮されないようにすることができる。したがって、本実施形態に係るモデル生成装置1によれば、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器5であって、背景の相違に対してロバストな訓練済みの推定器5を生成することができる。また、本実施形態に係る推定装置2では、上記ステップS204において、生成された訓練済みの推定器5を利用することで、背景の相違に対してロバストに対象の特徴に関する推定タスクを遂行することができる。
上記効果を検証するために、実施例及び比較例に係る機械学習済みの推定器を構築した。ただし、本発明は、以下の実施例に限定されるものではない。
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。
上記実施形態に係る推定システム100は、画像データに対して対象の特徴に関する推定タスクの遂行するあらゆる場面に適用されてよい。例えば、上記実施形態に係る推定システム100は、画像データの前景に含まれる特徴を推定する場面に適用可能である。前景は、背景と区別して画像データから抽出可能な任意の成分により構成されてよい。特徴は、前景から直接的又は間接的に導出可能な何らかの情報であってよい。前景に含まれる特徴を推定することは、例えば、画像データに写る対象物の属性を推定することにより構成されてよい。この場合、対象物の属性の導出に関与する成分が、前景の一例である。前景の範囲は、対象物の属性を導出可能に適宜決定されてよい。例えば、前景は、対象物の写る範囲であってよい。或いは、前景は、対象物及び対象物の周囲を含む範囲であってよい。或いは、前景は、推定対象の属性の表れる対象物の一部の範囲であってもよい。以下、適用場面を限定した変形例を例示する。
図11は、第1変形例に係る検査システム100Aの適用場面の一例を模式的に例示する。本変形例は、製品の写る画像データを利用して、製品の外観検査を実施する場面に上記実施形態を適用した例である。本変形例に係る検査システム100Aは、モデル生成装置1及び検査装置2Aを備えている。上記実施形態と同様に、モデル生成装置1及び検査装置2Aは、ネットワークを介して互いに接続されてよい。
本変形例では、モデル生成装置1は、上記ステップS101において、背景P11の写る学習用背景データ39を取得する。そして、モデル生成装置1は、ステップS102及びステップS103の処理を実行することで、背景P11の写る疑似背景データを生成する能力を獲得した機械学習済みの生成器60を生成し、第2学習結果データ122を所定の記憶領域に保存する。モデル生成装置1は、上記ステップS111〜ステップS113の処理を実行することで、機械学習済みの入力推定器62を生成し、第3学習結果データ123を所定の記憶領域に保存する。
図12Aは、本変形例に係る検査装置2Aのハードウェア構成の一例を模式的に例示する。図12Aに示されるとおり、本変形例に係る検査装置2Aは、上記推定装置2と同様に、制御部21、記憶部22、通信インタフェース23、外部インタフェース24、入力装置25、出力装置26、及びドライブ27が電気的に接続されたコンピュータにより構成されてよい。
本変形例によれば、モデル生成装置1の機械学習により、差分計算で除外された背景P11に関する情報を利用せずに、欠陥P12に関する推定タスクを遂行するように推定器5を訓練することができる。よって、背景P11の相違に対してロバストに欠陥P12に関する推定タスクを遂行可能な機械学習済みの推定器5を生成することができる。本変形例に係る検査装置2Aでは、この機械学習済みの推定器5を利用することで、欠陥P12に関する推定タスク(すなわち、外観検査)が高精度に遂行されることを期待することができる。
上記第1変形例において、製品RAは、対象物の一例であり、欠陥P12に関する情報は、対象物の属性の一例である。対象物及びその属性は、製品RA及び欠陥P12に関する情報に限られなくてもよく、実施の形態に応じて適宜選択されてよい。すなわち、上記実施形態に係る推定システム100は、画像データに表れる任意の対象物の属性を推定する様々な場面に適用されてよい。この場合、推定システム100では、対象物の写る画像データが訓練データ31及び対象画像データ41として取り扱われてよい。対象の特徴は、対象物の属性に関するものであってよい。これにより、背景の相違に対してロバストに対象物の属性に関する推定タスクを遂行可能な機械学習済みの推定器5を生成することができる。
図13は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図13に例示される識別システムは、モデル生成装置1及び識別装置2Bを備えている。識別装置2Bは、上記検査装置2Aに対応する。識別装置2Bの構成は、上記検査装置2Aと同様であってよい。図13の例では、ナンバープレートRBの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム100Aと同様に、カメラSBが用いられてよい。
図14は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図14に例示される識別システムは、モデル生成装置1及び識別装置2Cを備えている。識別装置2Cは、上記検査装置2Aに対応する。識別装置2Cの構成は、上記検査装置2Aと同様であってよい。図14の例では、製品の包装RCの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム100Aと同様に、カメラSCが用いられてよい。
図15は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図15に例示される監視システムは、モデル生成装置1及び監視装置2Dを備えている。監視装置2Dは、上記検査装置2Aに対応する。監視装置2Dの構成は、上記検査装置2Aと同様であってよい。図15の例では、移動体RDの存在し得る範囲を撮影することで得られた画像データが訓練データ及び対象画像データとして取り扱われてよい。画像データの取得には、監視対象の範囲を撮影するように配置されたカメラSDが用いられてよい。監視対象の範囲は、例えば、道路、建物内等の任意の場所から決定されてよい。監視装置2Dは、例えば、ネットワーク等を介して、カメラSDに適宜接続されてよい。これにより、監視装置2Dは、監視対象の範囲の写る画像データを取得することができる。
図16は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図16に例示される監視システムは、モデル生成装置1及び監視装置2Eを備えている。監視装置2Eは、上記検査装置2Aに対応する。監視装置2Eの構成は、上記検査装置2Aと同様であってよい。図16の例では、運転者REの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム100Aと同様に、カメラSEが用いられてよい。カメラSEは、運転席に存在すると仮定される運転者REを撮影するように適宜配置されてよい。
上記実施形態では、ステップS122及びステップS202において、機械学習済みの生成器60を利用して、背景データ35及び対象背景データ45を取得可能である。しかしながら、各背景データ(35、45)を取得する方法は、このような例に限定されなくてもよい。例えば、各背景データ(35、45)として利用可能な背景データが予め用意されてよい。この場合、背景データは、記憶部(12、22)、記憶媒体(91、92)、外部記憶装置等に記憶されていてよい。上記ステップS122及びステップS202では、予め用意された背景データから、訓練データ31及び対象画像データ41それぞれと同種の背景の写る背景データが各背景データ(35、45)として適宜選択されてよい。一例として、利用する背景データは、オペレータにより選択されてよい。或いは、訓練データ31及び対象画像データ41それぞれと最も類似する背景データが各背景データ(35、45)として選択されてよい。
上記実施形態では、生成器60の訓練に識別器61が利用されている。モデル生成装置1は、生成器60及び識別器61の間で敵対的学習を実施することで、学習用背景データ39に適合する疑似背景データ633を生成する能力を獲得した機械学習済みの生成器60を構築する。しかしながら、機械学習済みの生成器60を生成する方法は、学習用背景データ39により与えられる背景の写る疑似背景データを生成するように生成器60を訓練可能であれば、このような例に限定されなくてもよい。
上記実施形態では、推定器5、生成器60、識別器61、及び入力推定器62それぞれには、全結合型のニューラルネットワークが用いられている。しかしながら、それぞれを構成するニューラルネットワークの種類は、このような例に限定されなくてもよい。推定器5、生成器60、識別器61、及び入力推定器62それぞれには、例えば、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク等が用いられてよい。
11…制御部、12…記憶部、
13…通信インタフェース、14…外部インタフェース、
15…入力装置、16…出力装置、17…ドライブ、
111…第1データ取得部、112…背景取得部、
113…差分算出部、114…第1訓練部、
115…第2データ取得部、116…第2訓練部、
117…第3データ取得部、118…第3訓練部、
119…保存処理部、
121…第1学習結果データ、
122…第2学習結果データ、
123…第3学習結果データ、
81…モデル生成プログラム、91…記憶媒体、
2…推定装置、
21…制御部、22…記憶部、
23…通信インタフェース、24…外部インタフェース、
25…入力装置、26…出力装置、27…ドライブ、
211…データ取得部、212……背景取得部、
213…差分算出部、214…推定部、
215…出力部、
82…推定プログラム、92…記憶媒体、
30…学習データセット、
31…訓練データ、32…正解データ、
35…背景データ、37…差分データ、
39…学習用背景データ、
41…対象画像データ、
45…対象背景データ、47…対象差分データ、
5…推定器、
60…生成器、61…識別器、
62…入力推定器
Claims (10)
- 画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得する第1データ取得部と、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得する背景取得部と、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成する差分算出部と、
推定器の機械学習を実施する第1訓練部であって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、第1訓練部と、
を備える、
モデル生成装置。 - 前記背景データを取得することは、機械学習済みの生成器を利用して、前記各学習データセットについて、前記訓練データに対して前記背景データを生成することを含む、
請求項1に記載のモデル生成装置。 - 学習用背景データを取得する第2データ取得部と、
取得された学習用背景データを使用した機械学習を実施することで、前記訓練データに対する前記背景データを生成するように訓練された前記機械学習済みの生成器を構築する第2訓練部と、
を更に備える、
請求項2に記載のモデル生成装置。 - 前記差分算出部は、前記訓練データの各画素及び各画素の周囲の画素を含む対象領域と前記背景データの対応する各画素及び各画素の周囲の画素を含む対応領域との間の相関性に基づいて、前記訓練データの各画素と前記背景データの対応する各画素との差分を取ることで、前記差分データを生成する、
請求項1から3のいずれか1項に記載のモデル生成装置。 - 前記特徴は、前記訓練データの前景に関する、
請求項1から4のいずれか1項に記載のモデル生成装置。 - 前記訓練データは、対象物の写る前記画像データであり、
前記特徴は、前記対象物の属性である、
請求項1から4のいずれか1項に記載のモデル生成装置。 - 前記対象物は、製品であり、
前記対象物の属性は、前記製品の欠陥に関する、
請求項6に記載のモデル生成装置。 - 対象画像データを取得するデータ取得部と、
前記対象画像データに対応する対象背景データを取得する背景取得部と、
前記対象画像データと前記対象背景データとの差分を取ることで、対象差分データを生成する差分算出部と、
請求項1から7のいずれか1項に記載のモデル生成装置により生成された機械学習済みの推定器を利用して、生成された前記対象差分データに含まれる特徴を推定する推定部と、
前記特徴を推定した結果に関する情報を出力する出力部と、
を備える、
推定装置。 - コンピュータが、
画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、
推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、
を実行する、
モデル生成方法。 - コンピュータに、
画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、
推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、
を実行させるための、
モデル生成プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019210874A JP7434829B2 (ja) | 2019-11-21 | 2019-11-21 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
EP20889952.6A EP4064183A4 (en) | 2019-11-21 | 2020-11-06 | MODEL GENERATION APPARATUS, ESTIMATION APPARATUS, MODEL GENERATION METHOD, AND MODEL GENERATION PROGRAM |
CN202080073252.0A CN114556383A (zh) | 2019-11-21 | 2020-11-06 | 模型生成装置、推定装置、模型生成方法以及模型生成程序 |
PCT/JP2020/041453 WO2021100483A1 (ja) | 2019-11-21 | 2020-11-06 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
US17/772,182 US20220405586A1 (en) | 2019-11-21 | 2020-11-06 | Model generation apparatus, estimation apparatus, model generation method, and computer-readable storage medium storing a model generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019210874A JP7434829B2 (ja) | 2019-11-21 | 2019-11-21 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021082155A true JP2021082155A (ja) | 2021-05-27 |
JP7434829B2 JP7434829B2 (ja) | 2024-02-21 |
Family
ID=75965360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019210874A Active JP7434829B2 (ja) | 2019-11-21 | 2019-11-21 | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220405586A1 (ja) |
EP (1) | EP4064183A4 (ja) |
JP (1) | JP7434829B2 (ja) |
CN (1) | CN114556383A (ja) |
WO (1) | WO2021100483A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11922314B1 (en) * | 2018-11-30 | 2024-03-05 | Ansys, Inc. | Systems and methods for building dynamic reduced order physical models |
JP7236062B2 (ja) * | 2019-09-13 | 2023-03-09 | 日本電気株式会社 | 学習装置、学習方法及び学習プログラム |
TWI800767B (zh) * | 2020-11-16 | 2023-05-01 | 財團法人工業技術研究院 | 具有生成對抗網路架構之異常偵測裝置和異常偵測方法 |
JP2022096379A (ja) * | 2020-12-17 | 2022-06-29 | 富士通株式会社 | 画像出力プログラム,画像出力方法および画像出力装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209966A (ja) * | 2010-03-29 | 2011-10-20 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2019153057A (ja) * | 2018-03-02 | 2019-09-12 | 富士通株式会社 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012026982A (ja) | 2010-07-27 | 2012-02-09 | Panasonic Electric Works Sunx Co Ltd | 検査装置 |
CN103679185B (zh) | 2012-08-31 | 2017-06-16 | 富士通株式会社 | 卷积神经网络分类器系统、其训练方法、分类方法和用途 |
US9785855B2 (en) | 2015-12-17 | 2017-10-10 | Conduent Business Services, Llc | Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks |
DE112017007252T5 (de) | 2017-03-14 | 2019-12-19 | Omron Corporation | Fahrerüberwachungsvorrichtung, fahrerüberwachungsverfahren, lernvorrichtung und lernverfahren |
US10475174B2 (en) * | 2017-04-06 | 2019-11-12 | General Electric Company | Visual anomaly detection system |
JP7278735B2 (ja) | 2017-10-06 | 2023-05-22 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2019
- 2019-11-21 JP JP2019210874A patent/JP7434829B2/ja active Active
-
2020
- 2020-11-06 US US17/772,182 patent/US20220405586A1/en active Pending
- 2020-11-06 EP EP20889952.6A patent/EP4064183A4/en active Pending
- 2020-11-06 WO PCT/JP2020/041453 patent/WO2021100483A1/ja unknown
- 2020-11-06 CN CN202080073252.0A patent/CN114556383A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209966A (ja) * | 2010-03-29 | 2011-10-20 | Sony Corp | 画像処理装置および方法、並びにプログラム |
JP2019153057A (ja) * | 2018-03-02 | 2019-09-12 | 富士通株式会社 | 画像処理装置、学習装置、画像処理方法、学習方法、画像処理プログラムおよび学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2021100483A1 (ja) | 2021-05-27 |
US20220405586A1 (en) | 2022-12-22 |
EP4064183A1 (en) | 2022-09-28 |
EP4064183A4 (en) | 2024-01-10 |
CN114556383A (zh) | 2022-05-27 |
JP7434829B2 (ja) | 2024-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021100483A1 (ja) | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム | |
US11715190B2 (en) | Inspection system, image discrimination system, discrimination system, discriminator generation system, and learning data generation device | |
US11531899B2 (en) | Method for estimating a global uncertainty of a neural network | |
WO2021059909A1 (ja) | データ生成システム、学習装置、データ生成装置、データ生成方法及びデータ生成プログラム | |
JP7059883B2 (ja) | 学習装置、画像生成装置、学習方法、及び学習プログラム | |
CN108388834A (zh) | 利用循环神经网络和级联特征映射的对象检测 | |
CN112541520A (zh) | 用于为神经网络生成反事实数据样本的设备和方法 | |
JP7164028B2 (ja) | 学習システム、データ生成装置、データ生成方法、及びデータ生成プログラム | |
JP7435303B2 (ja) | 検査装置、ユニット選択装置、検査方法、及び検査プログラム | |
CN115210724A (zh) | 模型生成装置、推断装置、模型生成方法及模型生成程序 | |
US20220309771A1 (en) | Method, device, and computer program for an uncertainty assessment of an image classification | |
CN112418432A (zh) | 分析多个物理对象之间的相互作用 | |
WO2022004773A1 (ja) | モデル生成装置、回帰装置、モデル生成方法、及びモデル生成プログラム | |
JP7059889B2 (ja) | 学習装置、画像生成装置、学習方法、及び学習プログラム | |
US20230260259A1 (en) | Method and device for training a neural network | |
CN111435457B (zh) | 对传感器获取的采集进行分类的方法 | |
WO2022196433A1 (ja) | モデル生成装置、分類装置、データ生成装置、モデル生成方法、及びモデル生成プログラム | |
CN115519579A (zh) | 一种基于三元组对比网络的机器人抓取预测方法 | |
KR20230018339A (ko) | 이미지들 및 라벨 맵들을 처리하고 생성하기 위한 생성적 대립 네트워크 | |
CN115238904A (zh) | 用于在车辆中创建训练数据的方法、设备和计算机程序 | |
CN111753981A (zh) | 用于较高维度数据的神经网络训练的再使用 | |
JP7564616B2 (ja) | モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム | |
US20220327332A1 (en) | Method and device for ascertaining a classification and/or a regression result when missing sensor data | |
US20220012506A1 (en) | System and method of segmenting free space based on electromagnetic waves | |
CN118648035A (zh) | 表面异常检测的训练系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7434829 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |