JP7434829B2

JP7434829B2 - モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム

Info

Publication number: JP7434829B2
Application number: JP2019210874A
Authority: JP
Inventors: 竜米谷
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2019-11-21
Filing date: 2019-11-21
Publication date: 2024-02-21
Anticipated expiration: 2039-11-21
Also published as: EP4064183A1; US20220405586A1; WO2021100483A1; JP2021082155A; EP4064183A4; CN114556383A

Description

本発明は、モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラムに関する。

従来、製造ライン等の製品を製造する場面では、製造される製品を撮影装置により撮影し、得られた画像データに基づいて製品の良否を検査する技術が利用されている。例えば、特許文献１では、学習済みの第１のニューラルネットワークに基づいて画像に写る検査対象物が正常であるか異常であるかを判定し、検査対象物が異常であると判定した場合に、学習済みの第２のニューラルネットワークに基づいて当該異常の種類を分類する検査装置が提案されている。

特開２０１２－０２６９８２号公報特開２０１７－１１１８０６号公報特開２０１４－０４９１１８号公報特開２０１９－０７１０５０号公報特許第６２６４４９２号公報

機械学習により構築された訓練済みの機械学習モデルで構成された推定器によれば、与えられた訓練データと同種の未知のデータに対して、回帰、分類等の推定（予測を含む）タスクを実行することができる。そのため、上記特許文献１のような、ニューラルネットワーク等の機械学習モデルを利用する方法によれば、訓練済みの推定器の出力に基づいて製品の外観検査を実施することができる。しかしながら、本件発明者は、上記のような従来の方法には、次のような問題点があることを見出した。

すなわち、従来の方法では、与えられた画像に写る欠陥を検出する能力を機械学習モデルに習得させる機械学習を実施するために、事前に、欠陥を含む製品の写る画像が学習データとして収集される。欠陥を検出することは、欠陥の種別を識別することであってもよい。基本的には、収集される学習データが多岐にわたるほど、換言すると、学習データに表れる欠陥の状況が多様であるほど、外観検査の精度の向上を図ることができる。

ただし、欠陥の種別、及び製品の外観を含む背景の種別が多くなればなるほど、欠陥の種別及び背景の種別の組み合わせが増加し、学習データとして収集されることが所望されるサンプルの件数（及び種類）も増加する。また、訓練済みの推定器を運用する際に背景が変更されることもあり得る。高精度に外観検査を遂行可能な訓練済みの推定器を生成するためには、欠陥の種別及び背景の種別の全ての組み合わせについてサンプルを収集するのが望ましいが、全ての組み合わせについてサンプルを収集するのにはコストがかかる。そこで、例えば、全ての組み合わせについてのサンプルは得られていないが、検出対象の欠陥の全種別についてはサンプルが得られた時点等、ある程度の学習データが収集された段階で、機械学習モデルの機械学習を実施することが考えられる。

しかしながら、学習データにおいてサンプルの得られていない組み合わせが存在する場合に、次のような問題が生じる可能性がある。すなわち、機械学習により、機械学習モデルは、訓練データ（サンプル）に含まれる任意の情報を利用して、所望の推定タスクを遂行するように訓練される。そのため、欠陥及び背景を含む訓練データを使用して、推定器の機械学習を実施した場合、生成される訓練済みの推定器は、データに含まれる欠陥に関する情報だけではなく、背景に関する情報も利用して、欠陥の検出に関する推定タスクを遂行する能力を獲得している場合がある。このような場合、サンプルの得られていない欠陥の種別及び背景の種別の組み合わせを機械学習に反映できないことで、その組み合わせに対する訓練済みの推定器による欠陥の検出に関する推定の精度が低下してしまう可能性がある。

加えて、サンプルに表れる欠陥の種別及び背景の種別の組み合わせが偏っている場合、特に、欠陥の種別及び背景の種別が同じ分布でサンプルに表れる場合、このサンプルの偏りが、機械学習により機械学習モデルの習得する能力に悪影響を及ぼす可能性がある。具体的には、組み合わせの偏ったサンプルを使用した機械学習により、推定器は、種別に応じて欠陥を検出する能力ではなく、背景の種別を識別する能力を習得してしまう可能性がある。

一例として、第１製品及び第２製品の２種類の製品に対して、第１欠陥及び第２欠陥の２種類の欠陥が発生すると仮定する。また、この例において、第１製品では第１欠陥が生じやすく、第２製品では第２欠陥が生じやすいと仮定する。更に、得られたサンプルが、第１欠陥を含む第１製品の写る画像、及び第２欠陥を含む第２製品の写る画像に偏っていると仮定する。すなわち、第２欠陥を含む第１製品の写る画像及び第１欠陥を含む第２製品の写る画像が機械学習のサンプルとして得られていないと仮定する。この仮定の下で得られたサンプルを使用して、種別に応じて欠陥を検出する能力を習得させることを意図して機械学習モデルの機械学習を実行したと想定する。この場合、得られるサンプルに上記偏りが生じていることで、当該機械学習により、機械学習モデルは、種別に応じて欠陥を検出識別する能力ではなく、背景の種別を識別する能力を習得してしまう可能性がある。すなわち、サンプルが偏っていることで、意図した能力とは別の能力を機械学習モデルに習得させてしまう可能性がある。背景の種別を識別する能力を習得してしまった場合には、第２欠陥を含む第１製品の写る画像が与えられたときに、訓練済みの推定器は、第１製品に第１欠陥が生じていると誤検出してしまう。

したがって、従来の方法では、機械学習により、訓練済みの推定器は、画像データに含まれる背景に関する情報を考慮して、欠陥検出に関する推定タスクを遂行するように構築される可能性がある。これにより、運用時の背景が学習時の背景と異なっていることで、訓練済みの推定器による欠陥検出に関する推定の精度が悪化してしまうという問題点があった。換言すると、背景の相違にロバストな訓練済みの推定器を生成するのが困難であるという問題点があった。

なお、このような問題点は、製品の外観検査に利用可能な訓練済みの推定器を生成する場面に特有のものではない。この問題点は、画像データに含まれる何らかの特徴を推定する様々な場面で生じ得る。画像データに含まれる何らかの特徴を推定する場面とは、例えば、画像データの前景に関する推定を行う場面である。前景に関する推定は、例えば、画像データに写る対象物の属性を推定することであってよい。

具体例として、特許文献２では、訓練済みのニューラルネットワークを利用して、ナンバープレートを認識することが提案されている。特許文献３では、訓練済みの畳み込みニューラルネットワークを利用して、文字を識別することが提案されている。特許文献４では、訓練済みのニューラルネットワークを利用して、撮影画像に写る人物の密度分布及び移動ベクトルの分布を推定することが提案されている。特許文献５では、学習済みのモデルを利用して、撮影画像から運転者の運転に対する集中の程度を推定することが提案されている。

これらの場面でも、従来の方法では、機械学習により、対象の特徴に関する推定タスクを遂行するための訓練済みの推定器を構築した場合に、訓練済みの推定器は、画像データに含まれる背景に関する情報を考慮して、当該推定タスクを遂行するように構築される可能性がある。そのため、背景の相違にロバストな訓練済みの推定器を生成するのが困難であるという問題点があった。

本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器であって、背景の相違に対してロバストな訓練済みの推定器を生成するための技術を提供することである。

本発明は、上述した課題を解決するために、以下の構成を採用する。

すなわち、本発明の一側面に係るモデル生成装置は、画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得する第１データ取得部と、前記各学習データセットについて、前記訓練データの背景を示す背景データを取得する背景取得部と、前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成する差分算出部と、推定器の機械学習を実施する第１訓練部であって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、第１訓練部と、を備える。

当該構成に係るモデル生成装置では、各学習データセットについて、訓練データから背景データを差分することで、背景の除外された訓練用の差分データが生成される。生成された訓練用の差分データを使用した機械学習により、推定器は、背景データの情報が除外された訓練データから対象の特徴を推定するように訓練される。これにより、差分計算で除外された背景データの情報を利用せずに、対象の特徴に関する推定タスクを遂行する能力を獲得した訓練済みの推定器を生成することができる。すなわち、対象の特徴に関する推定タスクを訓練済みの推定器により遂行する際に、背景データに対応する情報が考慮されないようにすることができる。したがって、当該構成に係るモデル生成装置によれば、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器であって、背景の相違に対してロバストな訓練済みの推定器を生成することができる。

上記一側面に係るモデル生成装置において、前記背景データを取得することは、機械学習済みの生成器を利用して、前記各学習データセットについて、前記訓練データに対して前記背景データを生成することを含んでもよい。例えば、撮影箇所がずれる等の同一種の背景であってもばらつきが生じる場合、そのばらつき毎に対応する背景データを予め用意するのにはコストがかかる。また、ばらつきを無視して差分を計算すると、得られる差分データに背景に関する情報の殆どが残ってしまい、背景の相違に対してロバストな訓練済みの推定器を適切に生成できない可能性がある。これに対して、当該構成によれば、機械学習済みの生成器を利用することで、背景にばらつきが生じる場合でも、訓練データに対応する背景データを生成することができる。そのため、背景データを用意するコストを低減することができる。また、背景の相違に対してロバストな訓練済みの推定器を適切に生成することができる。

上記一側面に係るモデル生成装置は、学習用背景データを取得する第２データ取得部と、取得された学習用背景データを使用した機械学習を実施することで、前記訓練データに対する前記背景データを生成するように訓練された前記機械学習済みの生成器を構築する第２訓練部と、を更に備えてもよい。当該構成によれば、訓練データに対応する背景データを生成可能な機械学習済みの生成器を適切に構築することができる。そして、構築された機械学習済みの生成器を利用することで、各学習データセットについて、訓練データに対応する背景データを用意するコストを低減することができる。また、背景の相違に対してロバストな訓練済みの推定器を適切に生成することができる。なお、学習用背景データには、訓練データと同種の背景の写る画像データが用いられる。

上記一側面に係るモデル生成装置において、前記差分算出部は、前記訓練データの各画素及び各画素の周囲の画素を含む対象領域と前記背景データの対応する各画素及び各画素の周囲の画素を含む対応領域との間の相関性に基づいて、前記訓練データの各画素と前記背景データの対応する各画素との差分を取ることで、前記差分データを生成してもよい。ノイズ等の影響により、背景データには、訓練データに含まれる背景との間に誤差が生じている可能性がある。特に、機械学習済みの生成器により背景データを生成した場合には、その可能性が高い。これに対して、当該構成では、対象の画素を含む領域間の相関性に基づいて対象の画素の差分を算出することで、単純な差分計算よりもその誤差が残らないように差分データを生成することができる。したがって、当該構成によれば、背景データに誤差が生じ得る場合でも、背景の相違に対してロバストな訓練済みの推定器を適切に生成することができる。

上記一側面に係るモデル生成装置において、前記特徴は、前記訓練データの前景に関するもの（前記訓練データの前景についての特徴）であってよい。当該構成によれば、背景の相違に対してロバストに前景に関する推定タスクを遂行可能な訓練済みの推定器を生成することができる。なお、背景及び前景はそれぞれ、画像データに写り得る事象から任意に選択されてよい。

上記一側面に係るモデル生成装置において、前記訓練データは、対象物の写る前記画像データであってよく、前記特徴は、前記対象物の属性であってよい。当該構成によれば、背景の相違に対してロバストに対象物の属性に関する推定タスクを遂行可能な訓練済みの推定器を生成することができる。なお、対象物は、任意に選択されてよい。対象物は、例えば、製品、製品の包装、ナンバープレート、撮影範囲内を移動可能な移動体（例えば、車両、人物等）、車両を運転する運転者等であってよい。

上記一側面に係るモデル生成装置において、前記対象物は、製品であってよく、前記対象物の属性は、前記製品の欠陥に関するものであってよい。当該構成によれば、外観検査を実施する場面において、背景の相違に対してロバストに欠陥に関する推定タスクを遂行可能な訓練済みの推定器を生成することができる。

また、本発明の形態は、上記モデル生成装置の形態に限られなくてもよい。本発明の一側面は、上記モデル生成装置により生成された訓練済みの推定器を利用する装置であってもよい。例えば、本発明の一側面は、上記モデル生成装置により生成された訓練済みの生成器を利用して、対象画像データに対して対象の特徴に関する推定タスクを実行するように構成された推定装置であってもよい。この推定装置は、適用場面における推定タスクの種類に応じて、検査装置、識別装置、監視装置、診断装置、予測装置等と読み替えられてよい。

例えば、本発明の一側面に係る推定装置は、対象画像データを取得するデータ取得部と、前記対象画像データに対応する対象背景データを取得する背景取得部と、前記対象画像データと前記対象背景データとの差分を取ることで、対象差分データを生成する差分算出部と、上記いずれかの側面に係るモデル生成装置により生成された機械学習済みの推定器を利用して、生成された前記対象差分データに含まれる特徴を推定する推定部と、前記特徴を推定した結果に関する情報を出力する出力部と、を備える。当該構成によれば、背景の相違に対してロバストに対象の特徴に関する推定タスクを遂行することができる。

また、上記各形態に係るモデル生成装置及び推定装置それぞれの別の態様として、本発明の一側面は、以上の各構成の全部又はその一部を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。また、本発明の一側面は、上記いずれかの形態に係るモデル生成装置及び推定装置により構成される推定システムであってもよい。

例えば、本発明の一側面に係るモデル生成方法は、コンピュータが、画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、を実行する、情報処理方法である。

例えば、本発明の一側面に係るモデル生成プログラムは、コンピュータに、画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、を実行させるための、プログラムである。

本発明によれば、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器であって、背景の相違に対してロバストな訓練済みの推定器を生成することができる。

図１は、本発明が適用される場面の一例を模式的に例示する。図２は、実施の形態に係るモデル生成装置のハードウェア構成の一例を模式的に例示する。図３は、実施の形態に係る推定装置のハードウェア構成の一例を模式的に例示する。図４Ａは、実施の形態に係るモデル生成装置のソフトウェア構成の一例を模式的に例示する。図４Ｂは、実施の形態に係るモデル生成装置のソフトウェア構成の一例を模式的に例示する。図４Ｃは、実施の形態に係るモデル生成装置のソフトウェア構成の一例を模式的に例示する。図５は、実施の形態に係る推定装置のソフトウェア構成の一例を模式的に例示する。図６Ａは、実施の形態に係るモデル生成装置による訓練済みの生成器の生成に関する処理手順の一例を例示する。図６Ｂは、実施の形態に係る生成器の機械学習の処理手順の一例を例示する。図７は、実施の形態に係るモデル生成装置による訓練済みの入力推定器の生成に関する処理手順の一例を例示する。図８は、実施の形態に係るモデル生成装置による訓練済みの推定器の生成に関する処理手順の一例を例示する。図８は、訓練データ及び背景データの差分を算出する方法の一例を模式的に例示する。図１０は、実施の形態に係る推定装置の処理手順の一例を例示する。図１１は、本発明が適用される他の場面の一例を模式的に例示する。図１２Ａは、他の形態に係る検査装置のハードウェア構成の一例を模式的に例示する。図１２Ｂは、他の形態に係る検査装置のソフトウェア構成の一例を模式的に例示する。図１３は、本発明が適用される他の場面の一例を模式的に例示する。図１４は、本発明が適用される他の場面の一例を模式的に例示する。図１５は、本発明が適用される他の場面の一例を模式的に例示する。図１６は、本発明が適用される他の場面の一例を模式的に例示する。図１７は、他の形態に係る生成器の構成の一例を模式的に例示する。

以下、本発明の一側面に係る実施の形態（以下、「本実施形態」とも表記する）を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。

§１適用例
図１は、本発明を適用した場面の一例を模式的に例示する。図１に示されるとおり、本実施形態に係る推定システム１００は、モデル生成装置１及び推定装置２を備えている。

本実施形態に係るモデル生成装置１は、推定器５の機械学習を実施するように構成されたコンピュータである。具体的に、本実施形態に係るモデル生成装置１は、複数の学習データセット３０を取得する。各学習データセット３０は、訓練データ３１、及び訓練データ３１に含まれる特徴を示す正解データ３２の組み合わせにより構成される。

訓練データ３１は、画像データのサンプルである。訓練データ３１は、「訓練サンプル」、「画像サンプル」、単に「サンプル」等と称されてもよい。特徴は、任意に選択されてよい。例えば、特徴は、画像データに直接的又は間接的に表れ得る成分（要素）に関するものであってよい。直接的に表れることは、画像データに写ることに相当する。間接的に表れることは、画像データに写る事象から導出されることに相当する。

正解データ３２は、対象の特徴に関する推定タスクの正解を示す。正解データ３２は、「教師信号」、「ラベル」等と称されてもよい。「推定」は、「推論」と読み替えられてもよい。推定することは、例えば、グループ分け（分類、識別）により離散値（例えば、特定の特徴に対応するクラス）を導出すること、及び回帰により連続値（例えば、特定の特徴が出現している確率）を導出することのいずれかであってよい。推定することには、当該グループ分け又は回帰の結果に基づいて、検出、判定等の何らかの認定を行うことが含まれてもよい。また、推定することには、予測することが含まれてもよい。

本実施形態に係るモデル生成装置１は、各学習データセット３０について、訓練データ３１の背景を示す背景データ３５を取得する。背景は、画像データに含まれる推定タスクの対象となる特徴以外の任意の成分から適宜選択されてよい。背景は、対象の特徴以外の全て又は一部の成分により構成されてよい。本実施形態に係るモデル生成装置１は、各学習データセット３０について、取得された背景データ３５と訓練データ３１との差分を取ることで、差分データ３７を生成する。生成された差分データ３７は、背景データ３５及び訓練データ３１の間の差分を示す。

本実施形態に係るモデル生成装置１は、生成された差分データ３７を使用して、推定器５の機械学習を実施する。推定器５は、画像データ（サンプル）の入力を受け付け、入力された画像データに含まれる対象の特徴を推定し、推定の結果に対応する出力値を出力するように構成される。推定器５の入力及び出力の形式は、推定タスクに応じて任意に決定されてよい。推定器５は、演算に利用される演算パラメータであって、機械学習により調節される演算パラメータを備える機械学習モデル（学習器）により構成される。推定器５を構成する機械学習モデルの種類は、特に限定されなくてよく、実施の形態に応じて任意に選択されてよい。後述するとおり、本実施形態では、推定器５には、ニューラルネットワークが用いられる。

本実施形態に係る機械学習を実施することは、各学習データセット３０について、生成された差分データ３７から推定器５により特徴を推定した結果が正解データ３２に適合するように推定器５を訓練することを含む。本実施形態に係るモデル生成装置１は、この機械学習を実施することで、画像データに含まれる特徴を推定する能力を獲得した訓練済みの推定器５を生成することができる。なお、「訓練済み」は、「機械学習済み」、単に「学習済み」等と称されてもよい。また、本実施形態に係るモデル生成装置１は、単に「生成装置」、「学習装置」等と称されてもよい。

一方、本実施形態に係る推定装置２は、モデル生成装置１により生成された機械学習済みの推定器５を利用して、画像データに対して対象の特徴に関する推定タスクを遂行するように構成されたコンピュータである。具体的に、本実施形態に係る推定装置２は、推定タスクを遂行する対象となる対象画像データ４１を取得する。対象画像データ４１は、「対象サンプル」、「画像サンプル」、単に「サンプル」等と称されてもよい。推定装置２は、対象画像データ４１に対応する対象背景データ４５を取得する。推定装置２は、対象画像データ４１と対象背景データ４５との差分を取ることで、対象差分データ４７を生成する。推定装置２は、モデル生成装置１により生成された機械学習済みの推定器５を利用して、生成された対象差分データ４７に含まれる特徴を推定する。そして、推定装置２は、特徴を推定した結果に関する情報を出力する。

以上のとおり、本実施形態では、訓練用の差分データ３７を使用した機械学習により、推定器５は、背景データ３５の情報が除外された訓練データ３１から、正解データ３２に適合するように対象の特徴を推定するように訓練される。その結果、訓練済みの推定器５は、差分計算で除外された背景データ３５の情報を利用せずに、対象の特徴に関する推定タスクを遂行する能力を獲得することができる。すなわち、対象の特徴に関する推定タスクを訓練済みの推定器５により遂行する際に、背景データ３５に対応する情報が考慮されないようにすることができる。したがって、本実施形態に係るモデル生成装置１によれば、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器５であって、背景の相違に対してロバストな訓練済みの推定器５を生成することができる。本実施形態に係る推定装置２では、生成された訓練済みの推定器５を利用することで、背景の相違に対してロバストに対象の特徴に関する推定タスクを遂行することができる。

なお、図１の例では、モデル生成装置１及び推定装置２は、ネットワークを介して互いに接続されている。ネットワークの種類は、例えば、インターネット、無線通信網、移動通信網、電話網、専用網等から適宜選択されてよい。ただし、モデル生成装置１及び推定装置２の間でデータをやりとりする方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、モデル生成装置１及び推定装置２の間では、記憶媒体を利用して、データがやりとりされてよい。

また、図１の例では、モデル生成装置１及び推定装置２は、それぞれ別個のコンピュータにより構成されている。しかしながら、本実施形態に係る推定システム１００の構成は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。たとえば、モデル生成装置１及び推定装置２は一体のコンピュータであってもよい。また、例えば、モデル生成装置１及び推定装置２のうちの少なくとも一方は、複数台のコンピュータにより構成されてもよい。

§２構成例
［ハードウェア構成］
＜モデル生成装置＞
図２は、本実施形態に係るモデル生成装置１のハードウェア構成の一例を模式的に例示する。図２に示されるとおり、本実施形態に係るモデル生成装置１は、制御部１１、記憶部１２、通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６、及びドライブ１７が電気的に接続されたコンピュータである。なお、図２では、通信インタフェース及び外部インタフェースを「通信Ｉ／Ｆ」及び「外部Ｉ／Ｆ」と記載している。

制御部１１は、ハードウェアプロセッサであるＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。記憶部１２は、メモリの一例であり、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部１２は、モデル生成プログラム８１、複数の学習データセット３０、複数件の学習用背景データ３９、第１～第３学習結果データ１２１～１２３等の各種情報を記憶する。

モデル生成プログラム８１は、機械学習を実施することで各学習済みモデルを生成する後述の情報処理（図６Ａ、図６Ｂ、図７及び図８）をモデル生成装置１に実行させるためのプログラムである。モデル生成プログラム８１は、当該情報処理の一連の命令を含む。モデル生成プログラム８１は、単に「生成プログラム」、「学習プログラム」等と称されてもよい。学習データセット３０は、推定器５の機械学習に使用される。学習用背景データ３９は、後述する生成器６０の機械学習に使用される。第１～第３学習結果データ１２１～１２３はそれぞれ、機械学習により構築された各学習済みモデルに関する情報を示す。本実施形態では、第１～第３学習結果データ１２１～１２３はそれぞれ、モデル生成プログラム８１を実行した結果として生成される。

通信インタフェース１３は、例えば、有線ＬＡＮ（Local Area Network）モジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。モデル生成装置１は、通信インタフェース１３を利用して、他の情報処理装置との間で、ネットワークを介したデータ通信を実行してもよい。外部インタフェース１４は、例えば、ＵＳＢ（Universal Serial Bus）ポート、専用ポート等であり、外部装置と接続するためのインタフェースである。外部インタフェース１４の種類及び数は任意に選択されてよい。モデル生成装置１は、通信インタフェース１３及び外部インタフェース１４の少なくとも一方を介して、訓練データ３１、学習用背景データ３９等の画像サンプルを得るためのカメラに接続されてよい。

入力装置１５は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置１６は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザ等のオペレータは、入力装置１５及び出力装置１６を利用することで、モデル生成装置１を操作することができる。

ドライブ１７は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９１に記憶されたプログラム等の各種情報を読み込むためのドライブ装置である。記憶媒体９１は、コンピュータその他装置、機械等が、記憶されたプログラム等の各種情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。上記モデル生成プログラム８１、複数の学習データセット３０、及び複数件の学習用背景データ３９の少なくともいずれかは、記憶媒体９１に記憶されていてもよい。モデル生成装置１は、この記憶媒体９１から、上記モデル生成プログラム８１、複数の学習データセット３０、及び複数件の学習用背景データ３９の少なくともいずれかを取得してもよい。なお、図２では、記憶媒体９１の一例として、ＣＤ、ＤＶＤ等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体９１の種類は、ディスク型に限られなくてもよく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。ドライブ１７の種類は、記憶媒体９１の種類に応じて任意に選択されてよい。

なお、モデル生成装置１の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部１１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ（field-programmable gate array）、ＤＳＰ（digital signal processor）等で構成されてよい。記憶部１２は、制御部１１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６及びドライブ１７の少なくともいずれかは省略されてもよい。モデル生成装置１は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、モデル生成装置１は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、ＰＣ（Personal Computer）等であってもよい。

＜推定装置＞
図３は、本実施形態に係る推定装置２のハードウェア構成の一例を模式的に例示する。図３に示されるとおり、本実施形態に係る推定装置２は、制御部２１、記憶部２２、通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、及びドライブ２７が電気的に接続されたコンピュータである。

推定装置２の制御部２１～ドライブ２７及び記憶媒体９２はそれぞれ、上記モデル生成装置１の制御部１１～ドライブ１７及び記憶媒体９１それぞれと同様に構成されてよい。制御部２１は、ハードウェアプロセッサであるＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部２２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部２２は、推定プログラム８２、第１～第３学習結果データ１２１～１２３等の各種情報を記憶する。推定プログラム８２は、訓練済みの推定器５を利用して、画像データに対して対象の特徴に関する推定タスクを遂行する後述の情報処理（図１０）を推定装置２に実行させるためのプログラムである。推定プログラム８２は、この情報処理の一連の命令を含む。推定プログラム８２及び第１～第３学習結果データ１２１～１２３のうちの少なくともいずれかは、記憶媒体９２に記憶されていてもよい。また、推定装置２は、記憶媒体９２から、上記推定プログラム８２及び第１～第３学習結果データ１２１～１２３のうちの少なくともいずれかを取得してもよい。

なお、推定装置２の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部２１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ、ＤＳＰ等で構成されてよい。記憶部２２は、制御部２１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、及びドライブ２７の少なくともいずれかは省略されてもよい。推定装置２は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、推定装置２は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ、ＰＬＣ（programmable logic controller）等であってもよい。

［ソフトウェア構成］
＜モデル生成装置＞
図４Ａ～図４Ｃは、本実施形態に係るモデル生成装置１のソフトウェア構成の一例を模式的に例示する。

モデル生成装置１の制御部１１は、記憶部１２に記憶されたモデル生成プログラム８１をＲＡＭに展開する。そして、制御部１１は、ＣＰＵにより、ＲＡＭに展開されたモデル生成プログラム８１に含まれる命令をＣＰＵにより解釈及び実行して、各構成要素を制御する。これにより、図４Ａ～図４Ｃに示されるとおり、本実施形態に係るモデル生成装置１は、第１データ取得部１１１、背景取得部１１２、差分算出部１１３、第１訓練部１１４、第２データ取得部１１５、第２訓練部１１６、第３データ取得部１１７、第３訓練部１１８、及び保存処理部１１９をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、モデル生成装置１の各ソフトウェアモジュールは、制御部１１（ＣＰＵ）により実現される。

第１データ取得部１１１は、画像データである訓練データ３１、及び訓練データ３１に含まれる特徴を示す正解データ３２の組み合わせによりそれぞれ構成される複数の学習データセット３０を取得する。各学習データセット３０は、対象の特徴に関する推定タスクを遂行する場面を想定して生成される。背景取得部１１２は、各学習データセット３０について、訓練データ３１の背景を示す背景データ３５を取得する。各学習データセット３０の訓練データ３１に対応する背景データ３５は適宜生成されてよい。本実施形態では、背景データ３５を取得することは、機械学習済みの生成器６０を利用して、各学習データセット３０について、訓練データ３１に対して背景データ３５を生成することを含んでもよい。

差分算出部１１３は、各学習データセット３０について、取得された背景データ３５及び訓練データ３１の差分を取ることで、背景データ３５及び訓練データ３１の間の差分を示す差分データ３７を生成する。第１訓練部１１４は、生成された差分データ３７を使用して、推定器５の機械学習を実施する。この機械学習では、第１訓練部１１４は、各学習データセット３０について、生成された差分データ３７から推定器５により特徴を推定した結果が正解データ３２に適合するように推定器５を訓練する。

第２データ取得部１１５は、複数件の学習用背景データ３９を取得する。学習用背景データ３９は、各学習データセット３０の訓練データ３１と同種の背景が写るように生成される。学習用背景データ３９は、対象の特徴に関する情報が写らず、背景のみが写るように生成されるのが好ましい。第２訓練部１１６は、取得された学習用背景データ３９を使用した機械学習を実施することにより、訓練データ３１に対する背景データ３５を生成するように訓練された機械学習済みの生成器６０を構築する。推定器５と同様に、生成器６０には、任意の機械学習モデルが利用されてよい。生成器６０の入力及び出力の形式は任意に決定されてよい。

訓練データ３１に対応する背景データ３５を生成可能であれば、生成器６０の構成及び機械学習の方法は任意に選択されてよい。図４Ｂに示されるとおり、本実施形態では、生成器６０の訓練に識別器６１が利用される。生成器６０は、ノイズ６３１（潜在変数）の入力を受け付け、入力されたノイズ６３１から疑似背景データ６３３を生成し、生成された疑似背景データ６３３に対応する出力値を出力するように構成される。これに対して、識別器６１は、背景データ（サンプル）の入力を受け付け、入力された背景データ（サンプル）の由来を識別し、識別した結果に対応する出力値を出力するように構成される。生成器６０等と同様に、識別器６１には任意の機械学習モデルが利用されてよい。識別器６１の入力及び出力の形式は任意に決定されてよい。

本実施形態に係る生成器６０の機械学習は、識別器６１を訓練する第１訓練ステップ及び生成器６０を訓練する第２訓練ステップを含む。第１訓練ステップでは、第２訓練部１１６は、入力された背景データが学習用背景データ３９か生成器６０により生成された疑似背景データ６３３かを識別する（換言すると、背景データの由来を識別する）性能を高めるように識別器６１を訓練する。一方、第２訓練ステップでは、第２訓練部１１６は、識別器６１の識別性能を低下させるような疑似背景データ６３３を生成する性能を高めるように生成器６０を訓練する。第２訓練部１１６は、第１訓練ステップ及び第２訓練ステップを交互に繰り返し実行する。すなわち、本実施形態に係る生成器６０の機械学習は、生成器６０及び識別器６１の間の敵対的学習により構成される。

上記機械学習により、本実施形態に係る訓練済みの生成器６０は、学習用背景データ３９に適合する疑似背景データを潜在変数のノイズから生成する能力を獲得する。つまり、本実施形態に係る訓練済みの生成器６０によれば、学習用背景データ３９により与えられた背景については再現性が高く、それ以外の情報については再現性の低い疑似画像データをノイズに応じて生成することができる。よって、この訓練済みの生成器６０を利用することで、各学習データセット３０について、訓練データ３１に対応する背景データ３５を生成することができる。

ただし、上記のとおり、本実施形態では、訓練済みの生成器６０は、疑似背景データをノイズに応じて生成するように構成される。そのため、この機械学習済みの生成器６０を利用して、訓練データ３１に対応する背景データ３５を生成するためには、機械学習済みの生成器６０に与える適当な入力値（ノイズ）を決定することになる。本実施形態に係るモデル生成装置１は、この入力値の決定に利用可能な機械学習済みの入力推定器６２を更に生成する。

入力推定器６２は、画像データの入力を受け付け、入力された画像データに写る背景に適合する（疑似）背景データを生成するために機械学習済みの生成器６０に与える入力値（ノイズ）を推定し、得られた推定値に対応する出力値を出力するように構成される。上記推定器５等と同様に、入力推定器６２には任意の機械学習モデルが利用されてよい。入力推定器６２の入力及び出力の形式は任意に決定されてよい。

第３データ取得部１１７は、複数の学習データセット６４を取得する。各学習データセット６４は、入力値のサンプルであるノイズ６４１、及び機械学習済みの生成器６０にノイズ６４１を与えることで生成される疑似背景データ６４３の組み合わせにより構成される。各学習データセット６４の生成には、機械学習済みの生成器６０が利用されてよい。

第３訓練部１１８は、取得された複数の学習データセット６４を使用して、入力推定器６２の機械学習を実施する。この機械学習では、第３訓練部１１８は、各学習データセット６４について、機械学習済みの生成器６０に与えた入力値を疑似背景データ６４３から入力推定器６２により推定することで得られる推定値がノイズ６４１に適合するように入力推定器６２を訓練する。これにより、入力推定器６２は、画像データに写る背景に適合する（疑似）背景データを機械学習済みの生成器６０により生成するために、機械学習済みの生成器６０に与える入力値（ノイズ）を推定する能力を獲得することができる。

保存処理部１１９は、各機械学習により構築された訓練済みの推定器５、生成器６０、及び入力推定器６２それぞれに関する情報を第１～第３学習結果データ１２１～１２３として生成する。そして、保存処理部１１９は、生成された第１～第３学習結果データ１２３を所定の記憶領域に保存する。所定の記憶領域は任意に選択されてよい。

（機械学習モデルの構成）
推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれには、機械学習を実施可能な任意のモデルが利用されてよい。図４Ａ～図４Ｃに示されるとおり、本実施形態では、推定器５、生成器６０、識別器６１、及び入力推定器６２はそれぞれ、多層構造の全結合型ニューラルネットワークにより構成される。推定器５、生成器６０、識別器６１、及び入力推定器６２はそれぞれ、入力層（５１、６０１、６１１、６２１）、中間（隠れ）層（５２、６０２、６１２、６２２）、及び出力層（５３、６０３、６１３、６２３）を備えている。

ただし、推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれの構造は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、中間層（５２、６０２、６１２、６２２）の数は、１つに限定されなくてもよく、２つ以上であってもよい。或いは、中間層（５２、６０２、６１２、６２２）は省略されてもよい。それぞれのニューラルネットワークを構成する層の数は任意に選択されてよい。推定器５、生成器６０、識別器６１、及び入力推定器６２の少なくともいずれかの組み合わせについて、少なくとも部分的に構造が一致してもよいし、或いは一致していなくてもよい。

各層（５１～５３、６０１～６０３、６１１～６１３、６２１～６２３）は１又は複数のニューロン（ノード）を備えている。各層（５１～５３、６０１～６０３、６１１～６１３、６２１～６２３）に含まれるニューロン（ノード）の数は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。隣接する層のニューロン同士は適宜結合される。図４Ａ～図４Ｃの例では、各ニューロンは、隣接する層の全てのニューロンと結合されている。しかしながら、各ニューロンの結合関係は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。

各結合には、重み（結合荷重）が設定されている。各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。閾値は、活性化関数により表現されてもよい。この場合、各入力と各重みとの積の和を活性化関数に入力し、活性化関数の演算を実行することで、各ニューロンの出力が決定される。活性化関数の種類は任意に選択されてよい。各層（５１～５３、６０１～６０３、６１１～６１３、６２１～６２３）に含まれる各ニューロン間の結合の重み及び各ニューロンの閾値は、推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれの演算処理に利用される演算パラメータの一例である。推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれの演算パラメータの値は、上記機械学習により、所望の推論に適合した出力が得られるように調節される。

（推定器の機械学習）
図４Ａに示されるとおり、第１訓練部１１４は、各学習データセット３０について、生成された差分データ３７を推定器５の入力層５１に入力し、対象の特徴を推定した結果に対応する出力値を出力層５３から取得する。推定器５の機械学習において、第１訓練部１１４は、取得される出力値と正解データ３２との間の誤差が小さくなるように、推定器５の演算パラメータの値を調節する。これにより、各学習データセット３０について、差分データ３７から対象の特徴を推定する能力を獲得した訓練済みの推定器５を生成することができる。

保存処理部１１９は、機械学習により生成された訓練済みの推定器５を再生するための第１学習結果データ１２１を生成する。訓練済みの推定器５を再生可能であれば、第１学習結果データ１２１の構成は任意であってよい。例えば、保存処理部１１９は、生成された訓練済みの推定器５の演算パラメータの値を示す情報を第１学習結果データ１２１として生成する。場合によって、第１学習結果データ１２１には、訓練済みの推定器５の構造を示す情報が更に含まれてもよい。構造は、例えば、ニューラルネットワークにおける入力層から出力層までの層の数、各層の種類、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等により特定されてよい。保存処理部１１９は、生成された第１学習結果データ１２１を所定の記憶領域に保存する。

（生成器の機械学習）
図４Ｂに示されるとおり、本実施形態に係る生成器６０の機械学習は、上記第１訓練ステップ及び第２訓練ステップを含む。第１訓練ステップでは、第２訓練部１１６は、生成器６０の入力層６０１にノイズ６３１を入力し、ノイズ６３１から生成された疑似背景データ６３３に対応する出力値を出力層６０３から取得する。第２訓練部１１６は、生成された疑似背景データ６３３を識別器６１の入力層６１１に入力し、入力された背景データの由来を識別した結果に対応する出力値を出力層６１３から取得する。また、第２訓練部１１６は、学習用背景データ３９を識別器６１の入力層６１１に入力し、入力された背景データの由来を識別した結果に対応する出力値を出力層６１３から取得する。

図４Ｂの例では、学習データ由来であることを「真」と表現し、生成器６０由来であることを「偽」と表現している。「真」は「１」に置き換えられてよく、「偽」は「０」に置き換えられてよい。ただし、各由来を表現する方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。上記背景データの由来を識別した結果を取得した２つの場面のうち、生成された疑似背景データ６３３を識別器６１に入力した場面では、識別器６１は「真」と識別するのが正解である。一方、学習用背景データ３９を識別器６１に入力した場面では、識別器６１は「偽」と識別するのが正解である。第１訓練ステップにおいて、第２訓練部１１６は、生成器６０の演算パラメータの値を固定した上で、各場面で出力層６１３から取得される出力値と各正解との間の誤差が小さくなるように、識別器６１の演算パラメータの値を調節する。これにより、入力された背景データの由来を識別する性能を高めるように識別器６１を訓練することができる。

一方、第２訓練ステップでは、第２訓練部１１６は、生成器６０の入力層６０１にノイズ６３１を入力し、ノイズ６３１から生成された疑似背景データ６３３に対応する出力値を出力層６０３から取得する。この疑似背景データ６３３を生成する処理は、第１訓練ステップ及び第２訓練ステップで共通に実行されてよい。すなわち、第１訓練ステップで生成された疑似背景データ６３３が第２訓練ステップでも利用されてよい。第２訓練部１１６は、生成された疑似背景データ６３３を識別器６１の入力層６１１に入力し、入力された背景データの由来を識別した結果に対応する出力値を出力層６１３から取得する。

第２訓練ステップでは、識別器６１の識別性能を低下させる（すなわち、識別結果が誤りである）ことが正解である。つまり、出力層６１３から得られる出力値が「真」に対応することが正解である。第２訓練部１１６は、識別器６１の演算パラメータの値を固定した上で、出力層６１３から取得される出力値と当該正解との間の誤差が小さくなるように、生成器６０の演算パラメータの値を調節する。これにより、識別器６１の識別性能を低下させるような疑似背景データ６３３を生成する性能を高めるように生成器６０を訓練することができる。

第２訓練部１１６は、上記第１訓練ステップ及び第２訓練ステップを交互に繰り返し実行することで、識別器６１及び生成器６０の性能を交互に高めていくことができる。これにより、識別器６１の識別性能の向上に応じて、学習用背景データ３９に適合する疑似背景データ６３３を生成する生成器６０の性能の向上を図ることができる。したがって、上記機械学習により、推定タスクを遂行する場面で得られる画像データに表れ得る背景については再現性が高く、それ以外の情報については再現性の低い疑似背景データをノイズから生成可能な訓練済みの生成器６０を構築することができる。なお、第１訓練ステップ及び第２訓練ステップの処理順序は任意であってよい。

保存処理部１１９は、機械学習により生成された訓練済みの生成器６０を再生するための第２学習結果データ１２２を生成する。第２学習結果データ１２２の構成は、上記第１学習結果データ１２１と同様であってよい。例えば、第２学習結果データ１２２には、訓練済みの生成器６０の演算パラメータの値を示す情報が含まれてよい。場合によっては、第２学習結果データ１２２には、訓練済みの生成器６０の構造を示す情報が更に含まれてもよい。保存処理部１１９は、生成された第２学習結果データ１２２を所定の記憶領域に保存する。なお、訓練済みの識別器６１の取扱いについては任意であってよい。第２学習結果データ１２２には、訓練済みの識別器６１を再生するための情報が更に含まれてもよいし、或いは含まれなくてもよい。

（入力推定器の機械学習）
図４Ｃに示されるとおり、第３訓練部１１８は、各学習データセット６４について、疑似背景データ６４３を入力推定器６２の入力層６２１に入力し、出力層６２３から出力値を取得する。入力推定器６２から得られる出力値は、入力された疑似背景データ６４３を機械学習済みの生成器６０により生成するために、機械学習済みの生成器６０に与える入力値（ノイズ）を推定した結果に対応する。第３訓練部１１８は、取得される出力値と対応するノイズ６４１との間の誤差が小さくなるように、入力推定器６２の演算パラメータの値を調節する。これにより、画像データに写る背景に適合する（疑似）背景データを機械学習済みの生成器６０により生成するために、機械学習済みの生成器６０に与える入力値（ノイズ）を推定する能力を獲得した訓練済みの入力推定器６２を生成することができる。

保存処理部１１９は、機械学習により生成された訓練済みの入力推定器６２を再生するための第３学習結果データ１２３を生成する。第３学習結果データ１２３の構成は、上記第１学習結果データ１２１等と同様であってよい。例えば、第３学習結果データ１２３には、訓練済みの入力推定器６２の演算パラメータの値を示す情報が含まれてよい。場合によっては、第３学習結果データ１２３には、訓練済みの入力推定器６２の構造を示す情報が更に含まれてもよい。保存処理部１１９は、生成された第３学習結果データ１２３を所定の記憶領域に保存する。

（背景データの生成）
図４Ｃに示されるとおり、本実施形態では、背景取得部１１２は、上記機械学習により生成された訓練済みの生成器６０及び入力推定器６２を利用することで、各学習データセット３０の訓練データ３１に対応する背景データ３５を生成することができる。

具体的に、背景取得部１１２は、各学習データセット３０について、機械学習済みの入力推定器６２の入力層６２１に訓練データ３１を入力し、出力層６２３から出力値を取得する。機械学習済みの入力推定器６２から得られる出力値は、訓練データ３１に写る背景に適合する疑似背景データを生成するために、機械学習済みの生成器６０に与えるノイズの推定値に対応する。

次に、背景取得部１１２は、取得されたノイズの推定値を機械学習済みの生成器６０の入力層６０１に入力し、ノイズの推定値から生成された疑似背景データに対応する出力値を出力層６０３から取得する。背景取得部１１２は、生成された疑似背景データを、訓練データ３１に対する背景データ３５として取得することができる。

＜推定装置＞
図５は、本実施形態に係る推定装置２のソフトウェア構成の一例を模式的に例示する。

推定装置２の制御部２１は、記憶部２２に記憶された推定プログラム８２をＲＡＭに展開する。そして、制御部２１は、ＲＡＭに展開された推定プログラム８２に含まれる命令をＣＰＵにより解釈及び実行して、各構成要素を制御する。これにより、図５に示されるとおり、本実施形態に係る推定装置２は、データ取得部２１１、背景取得部２１２、差分算出部２１３、推定部２１４、及び出力部２１５をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、推定装置２の各ソフトウェアモジュールは、上記モデル生成装置１と同様に、制御部２１（ＣＰＵ）により実現される。

データ取得部２１１は、推定タスクの遂行対象となる対象画像データ４１を取得する。背景取得部２１２は、対象画像データ４１に対応する対象背景データ４５を取得する。本実施形態では、背景取得部２１２は、第２学習結果データ１２２及び第３学習結果データ１２３を保持することで、機械学習済みの生成器６０及び入力推定器６２を備えている。背景取得部２１２は、機械学習済みの入力推定器６２に対象画像データ４１を与えることで、対象画像データ４１に写る背景に適合する疑似背景データを生成するために機械学習済みの生成器６０に与えるノイズを推定してもよい。そして、背景取得部２１２は、取得されたノイズの推定値を機械学習済みの生成器６０に与えることで、疑似背景データを生成してもよい。背景取得部２１２は、生成された疑似背景データを対象背景データ４５として取得してもよい。

差分算出部２１３は、対象画像データ４１と対象背景データ４５との差分を取ることで、対象差分データ４７を生成する。推定部２１４は、第１学習結果データ１２１を保持することで、機械学習済みの推定器５を備えている。推定部２１４は、機械学習済みの推定器５を利用して、生成された対象差分データ４７に含まれる特徴を推定する。出力部２１５は、特徴を推定した結果に関する情報を出力する。

＜その他＞
モデル生成装置１及び推定装置２の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、モデル生成装置１及び推定装置２の各ソフトウェアモジュールがいずれも汎用のＣＰＵによって実現される例について説明している。しかしながら、以上のソフトウェアモジュールの一部又は全部が、１又は複数の専用のプロセッサにより実現されてもよい。また、モデル生成装置１及び推定装置２それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換及び追加が行われてもよい。

§３動作例
［モデル生成装置］
（Ａ）生成器の機械学習
図６Ａは、本実施形態に係るモデル生成装置１による生成器６０の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ１０１）
ステップＳ１０１では、制御部１１は、第２データ取得部１１５として動作し、複数件の学習用背景データ３９を取得する。

学習用背景データ３９は適宜生成されてよい。例えば、実空間又は仮想空間において、推定タスクを遂行する場面を想定して、様々な条件で背景をカメラにより撮影することで、学習用背景データ３９を生成することができる。このとき、対象の特徴に関する情報が写らず、背景のみが写るように学習用背景データ３９を生成するのが好ましい。背景は、推定タスクに応じて適宜選択されてよい。下地が異なる等の異なる種類の背景について、学習用背景データ３９は網羅的に収集されるのが好ましい。一方、同一種の背景で撮影箇所がずれる等のばらつきに関しては、学習用背景データ３９は網羅的に収集されなくてよい。撮影する背景の種類は、訓練データ３１と同じである。対象の特徴及び背景の写る訓練データ３１が得られている場合、学習用背景データ３９は、画像処理により対象の特徴に関する情報を訓練データ３１から適宜除去することにより生成されてもよい。或いは、学習用背景データ３９は、訓練データ３１とは別途に取得されてよい。

学習用背景データ３９は、コンピュータの動作により自動的に生成されてもよいし、少なくとも部分的にオペレータの操作を含むことで手動で生成されてもよい。また、学習用背景データ３９の生成は、モデル生成装置１により行われてもよいし、モデル生成装置１以外の他のコンピュータにより行われてもよい。学習用背景データ３９をモデル生成装置１が生成する場合、制御部１１は、自動的に又は入力装置１５を介したオペレータの操作により手動で上記生成処理を実行することで、学習用背景データ３９を取得する。一方、学習用背景データ３９を他のコンピュータが生成する場合、制御部１１は、例えば、ネットワーク、記憶媒体９１等を介して、他のコンピュータにより生成された学習用背景データ３９を取得する。一部の学習用背景データ３９がモデル生成装置１により生成され、その他の学習用背景データ３９が１又は複数の他のコンピュータにより生成されてもよい。

取得する学習用背景データ３９の件数は任意に選択されてよい。複数件の学習用背景データ３９を取得すると、制御部１１は、次のステップＳ１０２に処理を進める。

（ステップＳ１０２）
ステップＳ１０２では、制御部１１は、第２訓練部１１６として動作し、取得された複数件の学習用背景データ３９を使用して、生成器６０の機械学習を実施する。これにより、訓練データ３１に対する背景データ３５を生成するように訓練された機械学習済みの生成器６０を構築する。

図６Ｂは、本実施形態に係る生成器６０の機械学習に関するサブルーチンの処理手順の一例を示すフローチャートである。本実施形態に係るステップＳ１０２の処理は、以下のステップＳ１０２１～ステップＳ１０２３の処理を含む。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

本実施形態では、生成器６０の訓練に識別器６１が利用される。処理対象となる生成器６０及び識別器６１それぞれを構成するニューラルネットワークは適宜用意されてよい。生成器６０及び識別器６１それぞれの構造（例えば、層の数、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等）、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部１１は、過去の機械学習により得られた学習結果データに基づいて、生成器６０及び識別器６１を用意してもよい。

（ステップＳ１０２１）
ステップＳ１０２１では、制御部１１は、学習用背景データ３９及び生成器６０により生成された疑似背景データ６３３を使用して、入力された背景データの由来を識別するように識別器６１を訓練する。ステップＳ１０２１は、上記第１訓練ステップの一例である。この機械学習の訓練処理には、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。後述するステップＳ１０２２等の他のニューラルネットワークの機械学習の処理についても同様である。

一例として、まず、制御部１１は、所定の確率分布からノイズ６３１（潜在変数）を抽出する。所定の確率分布は任意に選択されてよい。所定の確率分布は、例えば、ガウス分布等の公知の確率分布であってよい。続いて、制御部１１は、抽出されたノイズ６３１を生成器６０に与えて、生成器６０の演算処理を実行する。すなわち、制御部１１は、ノイズ６３１を生成器６０の入力層６０１に入力し、入力側から順に各層６０１～６０３に含まれる各ニューロンの発火判定を行う（すなわち、順伝播の演算を行う）。この演算処理により、制御部１１は、ノイズ６３１から生成した疑似背景データ６３３に対応する出力値を出力層６０３から取得する。生成する疑似背景データ６３３の件数は任意でよい。なお、この順伝播の演算処理は、以下の他のニューラルネットワークの演算処理においても同様に実行される。

次に、制御部１１は、生成された疑似背景データ６３３を識別器６１の入力層６１１に入力し、識別器６１の演算処理を実行する。これにより、制御部１１は、入力された背景データの由来を識別した結果に対応する出力値を識別器６１の出力層６１３から取得する。この場面では、入力された背景データは疑似背景データ６３３であるため、識別器６１は「偽」と識別するのが正解である。制御部１１は、各件の疑似背景データ６３３について、出力層６１３から得られる出力値と当該正解との誤差を算出する。

また、制御部１１は、各件の学習用背景データ３９を識別器６１の入力層６１１に入力し、識別器６１の演算処理を実行する。これにより、制御部１１は、入力された背景データの由来を識別した結果に対応する出力値を識別器６１の出力層６１３から取得する。この場面では、入力された背景データは学習用背景データ３９であるため、識別器６１は「真」と識別するのが正解である。制御部１１は、各件の学習用背景データ３９について、出力層６１３から得られる出力値と当該正解との誤差を算出する。

各誤差（損失）の算出には、損失関数が用いられてよい。損失関数は、機械学習モデルの出力と正解との差分（すなわち、相違の程度）を評価する関数であり、出力層６１３から得られる出力値と当該正解との差分値が大きいほど、損失関数により算出される誤差の値は大きくなる。誤差の計算に利用する損失関数の種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。

制御部１１は、誤差逆伝播（Back propagation）法により、算出された出力値の誤差の勾配を用いて、識別器６１の各演算パラメータ（各ニューロン間の結合の重み、各ニューロンの閾値等）の値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、識別器６１の各演算パラメータの値を更新する。各演算パラメータの値を更新する程度は、学習率により調節されてよい。学習率は、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。

制御部１１は、生成器６０の各演算パラメータの値を固定した上で、上記一連の更新処理により、算出される誤差の和が小さくなるように、識別器６１の各演算パラメータの値を調節する。例えば、規定回数実行する、算出される誤差の和が閾値以下になる等の所定の条件を満たすまで、制御部１１は、上記一連の処理による識別器６１の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、入力された背景データの由来を識別する性能を高めるように識別器６１を訓練することができる。この識別器６１の訓練処理が完了すると、制御部１１は、次のステップＳ１０２２に処理を進める。

（ステップＳ１０２２）
ステップＳ１０２２では、制御部１１は、識別器６１の識別性能を低下させるような疑似背景データ６３３を生成するように生成器６０を訓練する。換言すると、制御部１１は、識別器６１が「真」と識別する（すなわち、学習データ由来と識別する）ような疑似背景データ６３３を生成するように生成器６０を訓練する。ステップＳ１０２２は、上記第２訓練ステップの一例である。

一例として、まず、制御部１１は、上記ステップＳ１０２１と同様に、所定の確率分布から抽出されたノイズ６３１を生成器６０に与えることで、疑似背景データ６３３を生成する。上記ステップＳ１０２１により生成された疑似背景データ６３３を本ステップＳ１０２２でも利用する場合、制御部１１は、本ステップＳ１０２２において、疑似背景データ６３３を生成する処理を省略してよい。

次に、制御部１１は、生成された疑似背景データ６３３を識別器６１の入力層６１１に入力し、識別器６１の演算処理を実行する。これにより、制御部１１は、入力された背景データの由来を識別した結果に対応する出力値を識別器６１の出力層６１３から取得する。この場面では、入力された背景データが「真」である（すなわち、学習データ由来である）と識別器６１が誤った識別をすることが正解である。制御部１１は、各件の疑似背景データ６３３について、出力層６１３から得られる出力値と当該正解との誤差を算出する。上記と同様に、当該誤差の算出には、任意の損失関数が用いられてよい。

制御部１１は、誤差逆伝播法により、算出した出力値の誤差の勾配を、識別器６１を介して生成器６０の各演算パラメータに逆伝播して、生成器６０の各演算パラメータの値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、生成器６０の各演算パラメータの値を更新する。上記と同様に、各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、識別器６１の各演算パラメータの値を固定した上で、上記一連の更新処理により、算出される誤差の和が小さくなるように、生成器６０の各演算パラメータの値を調節する。上記識別器６１の訓練と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による生成器６０の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、識別器６１の識別性能を低下させるような疑似背景データ６３３を生成する性能を高めるように生成器６０を訓練することができる。この生成器６０の訓練処理が完了すると、制御部１１は、次のステップＳ１０２３に処理を進める。

（ステップＳ１０２３）
ステップＳ１０２３では、制御部１１は、ステップＳ１０２１及びステップＳ１０２２の処理を繰り返すか否かを判定する。処理を繰り返す基準は任意に決定されてよい。例えば、処理を繰り返す規定回数が設定されていてもよい。規定回数は、例えば、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。この場合、制御部１１は、ステップＳ１０２１及びステップＳ１０２２の処理を実行した回数が規定回数に到達したか否かを判定する。実行回数が規定回数に到達していないと判定した場合、制御部１１は、ステップＳ１０２１に処理を戻し、ステップＳ１０２１及びステップＳ１０２２の処理を再度実行する。一方、実行回数が規定回数に到達していると判定した場合には、制御部１１は、生成器６０の機械学習の処理を完了し、次のステップＳ１０３に処理を進める。

以上により、制御部１１は、識別器６１の訓練ステップ及び生成器６０の訓練ステップを交互に繰り返し実行する。これにより、識別器６１及び生成器６０の性能を交互に高めていくことができる。その結果、学習用背景データ３９に適合する疑似背景データ６３３を生成する（これにより、訓練データ３１に対する背景データ３５を生成する）能力を獲得した訓練済みの生成器６０を構築することができる。

（ステップＳ１０３）
図６Ａに戻り、ステップＳ１０３では、制御部１１は、保存処理部１１９として動作し、機械学習により構築された訓練済みの生成器６０に関する情報を第２学習結果データ１２２として生成する。そして、制御部１１は、生成された第２学習結果データ１２２を所定の記憶領域に保存する。

所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。記憶メディアは、例えば、ＣＤ、ＤＶＤ等であってよく、制御部１１は、ドライブ１７を介して記憶メディアに第２学習結果データ１２２を格納してもよい。外部記憶装置は、例えば、ＮＡＳ（Network Attached Storage）等のデータサーバであってよい。この場合、制御部１１は、通信インタフェース１３を利用して、ネットワークを介してデータサーバに第２学習結果データ１２２を格納してもよい。また、外部記憶装置は、例えば、外部インタフェース１４を介してモデル生成装置１に接続された外付けの記憶装置であってもよい。

これにより、第２学習結果データ１２２の保存が完了すると、制御部１１は、生成器６０の機械学習に関する一連の処理を終了する。

なお、生成された第２学習結果データ１２２は、任意のタイミングで推定装置２に提供されてよい。例えば、制御部１１は、ステップＳ１０３の処理として又はステップＳ１０３の処理とは別に、第２学習結果データ１２２を推定装置２に転送してもよい。推定装置２は、この転送を受信することで、第２学習結果データ１２２を取得してもよい。また、例えば、推定装置２は、通信インタフェース２３を利用して、モデル生成装置１又はデータサーバにネットワークを介してアクセスすることで、第２学習結果データ１２２を取得してもよい。また、例えば、推定装置２は、記憶媒体９２を介して、第２学習結果データ１２２を取得してもよい。また、例えば、第２学習結果データ１２２は、推定装置２に予め組み込まれてもよい。

更に、制御部１１は、上記ステップＳ１０１～ステップＳ１０３の処理を定期又は不定期に繰り返すことで、第２学習結果データ１２２を更新又は新たに生成してもよい。この繰り返しの際には、学習用背景データ３９の少なくとも一部の変更、修正、追加、削除等が適宜実行されてよい。そして、制御部１１は、更新した又は新たに生成した第２学習結果データ１２２を任意の方法で推定装置２に提供することで、推定装置２の保持する第２学習結果データ１２２を更新してもよい。

（Ｂ）入力推定器の機械学習
図７は、本実施形態に係るモデル生成装置１による入力推定器６２の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ１１１）
ステップＳ１１１では、制御部１１は、第３データ取得部１１７として動作し、複数の学習データセット６４を取得する。各学習データセット６４は、入力値のサンプルであるノイズ６４１、及び機械学習済みの生成器６０にノイズ６４１を与えることで生成される疑似背景データ６４３の組み合わせにより構成される。

各学習データセット６４は、機械学習済みの生成器６０を利用することで適宜生成されてよい。一例として、所定の確率分布（例えば、ガウス分布等）からノイズ６４１（潜在変数）を抽出する。抽出されたノイズ６４１を機械学習済みの生成器６０の入力層６０１に入力し、機械学習済みの生成器６０の演算処理を実行する。この演算処理により、ノイズ６４１から生成した疑似背景データ６４３に対応する出力値を訓練済みの生成器６０の出力層６０３から取得することができる。生成された疑似背景データ６４３に、入力したノイズ６４１を関連付ける。これにより、各学習データセット６４を生成することができる。なお、学習データセット６４の構成は、このような例に限定されなくてもよい。例えば、学習データセット６４は、疑似背景データ６４３の代わりに、背景以外の他の情報（例えば、対象の特徴）を更に含む画像データを備えてもよい。この場合、同一の背景の写る画像データには同一のノイズ６４１が関連付けられる。

上記学習用背景データ３９と同様に、各学習データセット６４は、コンピュータの動作により自動的に生成されてもよいし、少なくとも部分的にオペレータの操作を含むことで手動で生成されてもよい。また、各学習データセット６４の生成は、モデル生成装置１により行われてもよいし、モデル生成装置１以外の他のコンピュータにより行われてもよい。一部の学習データセット６４がモデル生成装置１により生成され、その他の学習データセット６４が１又は複数の他のコンピュータにより生成されてもよい。

取得する学習データセット６４の件数は任意に選択されてよい。複数の学習データセット６４を取得すると、制御部１１は、次のステップＳ１１２に処理を進める。

（ステップＳ１１２）
ステップＳ１１２では、制御部１１は、第３訓練部１１８として動作し、取得された複数の学習データセット６４を使用して、入力推定器６２の機械学習を実施する。当該機械学習では、制御部１１は、各学習データセット６４について、機械学習済みの生成器６０に与えた入力値を疑似背景データ６４３から入力推定器６２により推定することで得られる推定値がノイズ６４１に適合するように入力推定器６２を訓練する。

一例として、まず、制御部１１は、各学習データセット６４について、入力推定器６２の入力層６２１に疑似背景データ６４３を入力し、入力推定器６２の演算処理を実行する。これにより、制御部１１は、疑似背景データ６４３を生成するために、機械学習済みの生成器６０に与える入力値（ノイズ）を推定した結果に対応する出力値を出力層６２３から取得する。制御部１１は、得られる推定値と対応するノイズ６４１との誤差を算出する。上記ステップＳ１０２１等と同様に、誤差の算出には、任意の損失関数が用いられてよい。

制御部１１は、誤差逆伝播法により、算出された誤差の勾配を用いて、入力推定器６２の各演算パラメータの値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、入力推定器６２の各演算パラメータの値を更新する。上記ステップＳ１０２１等と同様に、各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される誤差の和が小さくなるように、入力推定器６２の各演算パラメータの値を調節する。上記ステップＳ１０２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による入力推定器６２の各演算パラメータの値の調節を繰り返してもよい。

この機械学習により、入力推定器６２は、各学習データセット６４について、疑似背景データ６４３からノイズ６４１を適切に推定可能に訓練される。すなわち、入力推定器６２は、機械学習済みの生成器６０の出力から入力を推定するように訓練される。機械学習済みの生成器６０は、背景については再現性が高く、それ以外の情報については再現性の低い疑似画像データを生成するように訓練されている。そのため、入力推定器６２は、同一の背景の写る画像データであれば、その他の情報が含まれていても、同じ入力値（ノイズ）を推定可能に訓練される。同一の背景の写る画像データに同一のノイズ６４１が関連付けられている限り、疑似背景データ６４３が他の情報を更に含む画像データに置き換わっても同様に入力推定器６２を訓練可能である。したがって、上記機械学習により、与えられた画像データに写る背景から、その背景の写る疑似背景データを生成するために、機械学習済みの生成器６０に与える入力値（ノイズ）を推定する能力を獲得した訓練済みの入力推定器６２を構築することができる。入力推定器６２の機械学習が完了すると、制御部１１は、次のステップＳ１１３に処理を進める。

（ステップＳ１１３）
ステップＳ１１３では、制御部１１は、保存処理部１１９として動作し、機械学習により構築された訓練済みの入力推定器６２に関する情報を第３学習結果データ１２３として生成する。そして、制御部１１は、生成された第３学習結果データ１２３を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。

これにより、第３学習結果データ１２３の保存が完了すると、制御部１１は、入力推定器６２の機械学習に関する一連の処理を終了する。なお、上記第２学習結果データ１２２と同様に、生成された第３学習結果データ１２３は、任意のタイミングで推定装置２に提供されてよい。また、上記ステップＳ１１１～ステップＳ１１３の処理が定期又は不定期に繰り返されてよい。そして、更新又は新たに生成された第３学習結果データ１２３が任意の方法で推定装置２に提供されることで、推定装置２の保持する第３学習結果データ１２３が更新されてもよい。

（Ｃ）推定器の機械学習
図８は、本実施形態に係るモデル生成装置１による推定器５の機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、本発明の「モデル生成方法」の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ１２１）
ステップＳ１２１では、制御部１１は、第１データ取得部１１１として動作し、複数の学習データセット３０を取得する。各学習データセット３０は、画像データである訓練データ３１、及び訓練データ３１に含まれる特徴を示す正解データ３２の組み合わせにより構成される。

各学習データセット３０は適宜生成されてよい。例えば、実空間又は仮想空間において、対象の特徴が表れる状態で背景と共にカメラによる撮影を実施することで、訓練データ３１が得られてよい。具体例として、製品の外観検査に利用可能な訓練済みの推定器を生成する場合、欠陥を含む又は含まない製品をカメラにより撮影することで、訓練データを得ることができる。そして、取得された訓練データ３１に含まれる対象の特徴を推定した結果（正解）を示す情報を、正解データ３２として、取得された訓練データ３１に関連付ける。対象の特徴を推定する方法は任意に選択されてよい。例えば、特徴の推定はオペレータにより行われてもよい。これにより、各学習データセット３０を生成することができる。

上記学習用背景データ３９等と同様に、各学習データセット３０は、コンピュータの動作により自動的に生成されてもよいし、少なくとも部分的にオペレータの操作を含むことで手動で生成されてもよい。また、各学習データセット３０の生成は、モデル生成装置１により行われてもよいし、モデル生成装置１以外の他のコンピュータにより行われてもよい。一部の学習データセット３０がモデル生成装置１により生成され、その他の学習データセット３０が１又は複数の他のコンピュータにより生成されてもよい。

取得する学習データセット３０の件数は任意に選択されてよい。複数の学習データセット３０を取得すると、制御部１１は、次のステップＳ１２２に処理を進める。

（ステップＳ１２２）
ステップＳ１２２では、制御部１１は、背景取得部１１２として動作し、各学習データセット３０について、訓練データ３１に対する背景データ３５を取得する。

背景データ３５は適宜生成されてよい。本実施形態では、制御部１１は、機械学習済みの生成器６０及び入力推定器６２を利用して、各学習データセット３０について、訓練データ３１に対する背景データ３５を生成することができる。具体的に、制御部１１は、各学習データセット３０について、機械学習済みの入力推定器６２の入力層６２１に訓練データ３１を入力し、入力推定器６２の演算処理を実行する。これにより、制御部１１は、入力された訓練データ３１に写る背景に適合する疑似背景データを生成するために、機械学習済みの生成器６０に与える入力値を推定した結果に対応する出力値を機械学習済みの入力推定器６２の出力層６２３から取得することができる。続いて、制御部１１は、機械学習済みの入力推定器６２により取得された推定値を機械学習済みの生成器６０の入力層６０１に入力し、機械学習済みの生成器６０の演算処理を実行する。これにより、制御部１１は、推定値から生成された疑似背景データに対応する出力値を機械学習済みの生成器６０の出力層６０３から取得することができる。制御部１１は、各学習データセット３０について、生成された疑似背景データを、訓練データ３１に対する背景データ３５として取得してもよい。背景データ３５を取得すると、制御部１１は、次のステップＳ１２３に処理を進める。

（ステップＳ１２３）
ステップＳ１２３では、制御部１１は、差分算出部１１３として動作し、各学習データセット３０について、取得された背景データ３５及び訓練データ３１の差分を算出することで、差分データ３７を生成する。差分データ３７を生成すると、制御部１１は、次のステップＳ１２４に処理を進める。

なお、背景データ３５に基づいて訓練データ３１に含まれる背景に関する情報を低減可能であれば、差分計算の方法は、特に限定されなくてもよく、実施の形態に応じて適宜に決定されてよい。一例として、制御部１１は、訓練データ３１と背景データ３５との間で同一の位置の各画素の値を比較し、同じ値である場合に「０」にし、異なる値である場合に訓練データ３１の画素値をそのまま採用することで、差分データ３７を生成してもよい。

その他の例として、制御部１１は、訓練データ３１と背景データ３５との間で同一の位置の各画素同士の値を単純に差分してもよい。この単純な差分計算では、背景データ３５と訓練データ３１とのわずかな背景の相違が差分データ３７に残存する可能性がある。特に、上記機械学習済みの生成器６０により背景データ３５を生成した場合にはその可能性が高い。そこで、これに対応するために、制御部１１は、得られた差分データ３７を二値化してもよい。例えば、差分データ３７の画素値が０～２５５の間で表現される場合には、制御部１１は、訓練データ３１及び背景データ３５の間で算出された各画素の値の差分を閾値と比較してもよい。閾値は任意に決定されてよい。そして、制御部１１は、差分が閾値より小さい画素の値を「０」にし、差分が閾値よりも大きい画素の値を「２５５」とすることで、差分データ３７を生成してもよい。

図９は、訓練データ３１及び背景データ３５の差分を算出する更にその他の方法の一例を模式的に例示する。この方法では、制御部１１は、訓練データ３１の各画素３１１の対象領域３１５と背景データ３５の対応する各画素３５１の対応領域３５５との間の相関性を算出する。対象領域３１５は、訓練データ３１における対象の画素３１１及び対象の画素３１１の周囲に存在する画素３１２を含む。対象領域３１５は、画素３１１毎に定義される。図９の例では、対象領域３１５は、対象の画素３１１及び対象の画素３１１の周囲に存在する８つの画素３１２を全て含むことで、３×３のサイズを有している。ただし、対象領域３１５のサイズ及び形状は、このような例に限定されなくてもよく、対象の画素３１１の周囲に存在する少なくとも１つの画素３１２を含むものであれば、任意に決定されてよい。対応領域３５５は、対象の画素３１１に対応する画素３５１及び画素３５１の周囲に存在する画素３５２を含む。対応する画素３５１は、対象の画素３１１と同一の位置に存在する。対応領域３５５は、対象領域３１５と同一の位置及び範囲に定義される。相関性の計算には、相関係数を計算する方法等の公知の計算方法が採用されてよい。

そして、制御部１１は、対象領域３１５及び対応領域３５５の間で算出された相関性に基づいて、訓練データ３１の各画素３１１と背景データ３５の対応する各画素３５１との差分を算出する。すなわち、制御部１１は、算出された相関性に応じて、対象の画素３１１及び対応する画素３５１の間の差分結果を決定する。算出される相関性が高いほど、対象の画素３１１及び対応する画素３５１は互いに同じ背景の像を写しており、算出される相関性が低いほど、対象の画素３１１は、対応する画素３５１と異なる像（すなわち、対象の特徴等の背景以外の像）を写していることを示す。この観点に基づいて、算出される相関性と差分結果との間の関係は任意に規定されてよい。例えば、制御部１１は、算出された相関性の値と閾値とを比較し、相関性の値が閾値よりも低い場合に、各画素３１１の値をそのまま採用し、相関性の値が閾値よりも高い場合に、対象の画素の値を「０」にすることで、差分データ３７を生成してもよい。閾値は任意に決定されてよい。この方法によれば、背景データ３５と訓練データ３１との間で背景がわずかに相違する場合の他、背景データ３５と訓練データ３１との間で背景が、相関性を算出する範囲でずれている場合でも、背景に関する情報が差分データ３７に残存するのを低減することができる。

（ステップＳ１２４）
ステップＳ１２４では、制御部１１は、第１訓練部１１４として動作し、生成された差分データ３７を使用して、推定器５の機械学習を実施する。当該機械学習では、制御部１１は、各学習データセット３０について、生成された差分データ３７から推定器５により特徴を推定した結果が正解データ３２に適合するように推定器５を訓練する。

一例として、まず、制御部１１は、各学習データセット３０について、生成された差分データ３７を推定器５の入力層５１に入力し、推定器５の演算処理を実行する。これにより、制御部１１は、差分データ３７に含まれる対象の特徴を推定した結果に対応する出力値を推定器５の出力層５３から取得する。制御部１１は、出力層５３から得られる出力値と対応する正解データ３２との誤差を算出する。上記ステップＳ１０２１等と同様に、誤差の算出には、任意の損失関数が用いられてよい。

制御部１１は、誤差逆伝播法により、算出された誤差の勾配を用いて、推定器５の各演算パラメータの値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、推定器５の各演算パラメータの値を更新する。上記ステップＳ１０２１等と同様に、各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される誤差の和が小さくなるように、推定器５の各演算パラメータの値を調節する。上記ステップＳ１０２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による推定器５の各演算パラメータの値の調節を繰り返してもよい。

この機械学習により、推定器５は、各学習データセット３０について、差分データ３７から対象の特徴を適切に推定可能に訓練される。そのため、当該機械学習の結果、背景差分により得られる画像データが与えられると、与えられた画像データに表れる対象の特徴を推定する能力を獲得した訓練済みの推定器５を構築することができる。推定器５の機械学習が完了すると、制御部１１は、次のステップＳ１２５に処理を進める。

（ステップＳ１２５）
ステップＳ１２５では、制御部１１は、保存処理部１１９として動作し、機械学習により構築された訓練済みの推定器５に関する情報を第１学習結果データ１２１として生成する。そして、制御部１１は、生成された第１学習結果データ１２１を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。

これにより、第１学習結果データ１２１の保存が完了すると、制御部１１は、推定器５の機械学習に関する一連の処理を終了する。なお、上記第２学習結果データ１２２等と同様に、生成された第１学習結果データ１２１は、任意のタイミングで推定装置２に提供されてよい。また、上記ステップＳ１２１～ステップＳ１２５の処理が定期又は不定期に繰り返されてよい。そして、更新又は新たに生成された第１学習結果データ１２１が任意の方法で推定装置２に提供されることで、推定装置２の保持する第１学習結果データ１２１が更新されてもよい。

［推定装置］
図１０は、本実施形態に係る推定装置２の処理手順の一例を示すフローチャートである。以下で説明する処理手順は、推定方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ２０１）
ステップＳ２０１では、制御部２１は、データ取得部２１１として動作し、対象画像データ４１を取得する。

対象画像データ４１は、推定タスクを遂行する対象となる画像データのサンプルである。対象画像データ４１は任意の方法で取得されてよい。例えば、対象の特徴に関する撮影をカメラにより行うことで、対象画像データ４１を取得することができる。カメラの種類は任意に選択されてよい。また、対象画像データ４１は、静止画像及び動画像のいずれであってもよい。対象画像データ４１を取得すると、制御部２１は、次のステップＳ２０２に処理を進める。

（ステップＳ２０２）
ステップＳ２０２では、制御部２１は、背景取得部２１２として動作し、対象画像データ４１に対応する対象背景データ４５を取得する。

対象背景データ４５は適宜生成されてよい。対象背景データ４５は、上記ステップＳ１２２の背景データ３５と同様の方法で生成されてよい。本実施形態では、制御部２１は、第２学習結果データ１２２及び第３学習結果データ１２３を参照することで、機械学習済みの生成器６０及び入力推定器６２の設定を行ってもよい。そして、制御部２１は、訓練データ３１を対象画像データ４１に置き換えて、上記ステップＳ１２２と同様の演算処理を実行することにより、機械学習済みの生成器６０及び入力推定器６２を利用して、対象画像データ４１に対応する対象背景データ４５を取得してもよい。対象背景データ４５を取得すると、制御部２１は、次のステップＳ２０３に処理を進める。

（ステップＳ２０３）
ステップＳ２０３では、制御部２１は、差分算出部２１３として動作し、対象画像データ４１と対象背景データ４５との差分を取ることで、対象差分データ４７を生成する。対象背景データ４５に基づいて対象画像データ４１に含まれる背景に関する情報を低減可能であれば、本ステップＳ２０３の差分計算の方法は任意に決定されてよい。本ステップＳ２０３の差分計算の方法は、上記ステップＳ１２３と同様であってよい。対象差分データ４７を生成すると、制御部２１は、次のステップＳ２０４に処理を進める。

（ステップＳ２０４）
ステップＳ２０４では、制御部２１は、推定部２１４として動作し、機械学習済みの推定器５を利用して、生成された対象差分データ４７に含まれる特徴を推定する。本実施形態では、制御部２１は、第１学習結果データ１２１を参照して、機械学習済みの推定器５の設定を行う。制御部２１は、生成された対象差分データ４７を機械学習済みの推定器５の入力層５１に入力し、機械学習済みの推定器５の演算処理を実行する。これにより、制御部２１は、対象差分データ４７に含まれる対象の特徴を推定した結果に対応する出力値を機械学習済みの推定器５の出力層５３から取得することができる。すなわち、本実施形態では、対象画像データ４１に含まれる特徴を推定することは、対象差分データ４７を機械学習済みの推定器５に与えて、機械学習済みの推定器５の演算結果を取得することにより達成される。対象の特徴に関する推定処理が完了すると、制御部２１は、次のステップＳ２０５に処理を進める。

（ステップＳ２０５）
ステップＳ２０５では、制御部２１は、出力部２１５として動作し、対象の特徴を推定した結果に関する情報を出力する。

出力先及び出力する情報の内容はそれぞれ、実施の形態に応じて適宜決定されてよい。例えば、制御部２１は、ステップＳ２０４の推定結果をそのまま出力装置２６に出力してもよい。また、例えば、制御部２１は、対象の特徴を推定した結果に基づいて、何らかの情報処理を実行してもよい。そして、制御部２１は、その情報処理を実行した結果を、推定の結果に関する情報として出力してもよい。この情報処理を実行した結果の出力には、推定結果に応じて特定のメッセージを出力すること、推定結果に応じて制御対象装置の動作を制御すること等が含まれてよい。出力先は、例えば、出力装置２６、他のコンピュータの出力装置、制御対象装置等であってよい。

推定結果に関する情報の出力が完了すると、制御部２１は、本動作例に係る処理手順を終了する。なお、所定期間の間、制御部２１は、ステップＳ２０１～ステップＳ２０５の一連の情報処理を継続的に繰り返し実行してもよい。繰り返すタイミングは、任意であってよい。これにより、推定装置２は、対象の特徴に関する推定タスクを継続的に実施してもよい。

［特徴］
以上のとおり、本実施形態では、上記ステップＳ１２３及ぶステップＳ１２４により、推定器５は、背景データ３５の情報が除外された訓練データ３１（差分データ３７）から、正解データ３２のとおりに対象の特徴を推定するように訓練される。その結果、機械学習済みの推定器５は、差分計算で除外された背景データ３５の情報を利用せずに、対象の特徴に関する推定タスクを遂行する能力を獲得することができる。すなわち、対象の特徴に関する推定タスクを訓練済みの推定器５により遂行する際に、背景データ３５に対応する情報が考慮されないようにすることができる。したがって、本実施形態に係るモデル生成装置１によれば、画像データに含まれる対象の特徴に関する推定タスクを遂行可能な訓練済みの推定器５であって、背景の相違に対してロバストな訓練済みの推定器５を生成することができる。また、本実施形態に係る推定装置２では、上記ステップＳ２０４において、生成された訓練済みの推定器５を利用することで、背景の相違に対してロバストに対象の特徴に関する推定タスクを遂行することができる。

また、ステップＳ１２１及びステップＳ２０１で取得される訓練データ３１及び対象画像データ４１において、例えば、撮影箇所がずれる等に起因して、同一種の背景であってもばらつきが生じる可能性がある。これに対して、本実施形態では、ステップＳ１０１～ステップＳ１０３の処理により、背景データを生成するための機械学習済みの生成器６０を構築することができる。この機械学習済みの生成器６０を利用することで、同一種の背景にばらつきが生じる場合でも、ステップＳ１２２及びステップＳ２０２において、訓練データ３１及び対象画像データ４１それぞれに対応する背景データ３５及び対象背景データ４５を適切に生成することができる。そのため、背景データ３５及び対象背景データ４５それぞれを用意するコストを低減することができる。また、ステップＳ１２４において、背景の相違に対してロバストな訓練済みの推定器５を適切に生成することができる。ステップＳ２０４では、背景の相違に対してロバストに対象の特徴に関する推定タスクを遂行することができる。

［実施例］
上記効果を検証するために、実施例及び比較例に係る機械学習済みの推定器を構築した。ただし、本発明は、以下の実施例に限定されるものではない。

まず、ＭＮＩＳＴ（Modified National Institute of Standards and Technology）の画像（２８×２８、グレースケール、０～９の手書き文字）及び５種類の背景テクスチャを用意した。用意したＭＮＩＳＴの画像及び背景テクスチャを合成することで、機械学習に使用する訓練データ及び評価に使用するテストデータを作成した。５種類のうち４種類の背景テクスチャは縞模様のパターンを有し、ＭＮＩＳＴの画像との合成の際に、ランダムにそのパターンの位置を変更した。作成した訓練データの件数は６００００件であり、テストデータの件数は１００００件であった。作成した訓練データには、合成した文字（０～９）を示す正解データを関連付けることで、学習データセットを用意した。また、上記実施形態と同様の方法により、背景テクスチャを生成するための機械学習済みの生成器を作成した。

実施例では、上記実施形態と同様の方法により、機械学習済みの生成器により生成された背景データと訓練データとの差分を算出することで、差分データを生成した。そして、生成された差分データを使用して、文字を識別するように訓練された機械学習済みの推定器を構築した。この機械学習済みの推定器の評価時には、上記実施形態に係る推定装置２と同様の方法により、機械学習済みの生成器により生成された背景データとテストデータとの差分を算出することで、対象差分データを生成した。そして、機械学習済みの推定器により、対象差分データに対して文字を識別するタスクを遂行した。一方、比較例では、背景を除去せずに、訓練データをそのまま使用して、文字を識別するように訓練された機械学習済みの推定器を構築した。評価時には、機械学習済みの推定器により、テストデータに対して文字を識別するタスクを遂行した。なお、実施例及び比較例それぞれでは、線形識別モデル、４層のＭＬＰ（Multilayer perceptron）、及び畳み込みニューラルネットワークの３種類の推定器を用意した。

表１は、実施例及び比較例それぞれにおけるテストデータに対する文字識別の正答率を示す。表１に示されるとおり、いずれのモデルを推定器に用いた場合でも、比較例よりも実施例の性能の方が良かった。特に、線形識別モデル及び４層ＭＬＰのような単純なモデルを利用したケースで、機械学習済みの推定器の性能を飛躍的に向上させることができた。この結果から、本発明によれば、背景の相違に対してロバストな訓練済みの推定器を構築可能であることが検証することができた。

§４変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。

＜４．１＞
上記実施形態に係る推定システム１００は、画像データに対して対象の特徴に関する推定タスクの遂行するあらゆる場面に適用されてよい。例えば、上記実施形態に係る推定システム１００は、画像データの前景に含まれる特徴を推定する場面に適用可能である。前景は、背景と区別して画像データから抽出可能な任意の成分により構成されてよい。特徴は、前景から直接的又は間接的に導出可能な何らかの情報であってよい。前景に含まれる特徴を推定することは、例えば、画像データに写る対象物の属性を推定することにより構成されてよい。この場合、対象物の属性の導出に関与する成分が、前景の一例である。前景の範囲は、対象物の属性を導出可能に適宜決定されてよい。例えば、前景は、対象物の写る範囲であってよい。或いは、前景は、対象物及び対象物の周囲を含む範囲であってよい。或いは、前景は、推定対象の属性の表れる対象物の一部の範囲であってもよい。以下、適用場面を限定した変形例を例示する。

（Ａ）外観検査の場面
図１１は、第１変形例に係る検査システム１００Ａの適用場面の一例を模式的に例示する。本変形例は、製品の写る画像データを利用して、製品の外観検査を実施する場面に上記実施形態を適用した例である。本変形例に係る検査システム１００Ａは、モデル生成装置１及び検査装置２Ａを備えている。上記実施形態と同様に、モデル生成装置１及び検査装置２Ａは、ネットワークを介して互いに接続されてよい。

本変形例では、製品ＲＡの写る画像データＰ１０が訓練データ及び対象画像データとして取り扱われる。画像データＰ１０は、カメラＳＡにより製品ＲＡを撮影することにより得られてよい。推定タスクの対象となる特徴は、製品ＲＡの欠陥Ｐ１２に関するものであってよい。背景Ｐ１１は、コンベアのシード等の製品ＲＡ以外の部分であってよい。背景Ｐ１１は、例えば、異常のない製品ＲＡの外装の写る部分等の、欠陥Ｐ１２以外の製品ＲＡの写る部分を含んでもよい。これらの限定を除き、本変形例に係る検査システム１００Ａは、上記実施形態に係る推定システム１００と同様に構成されてよい。

なお、製品ＲＡは、例えば、電子機器、電子部品、自動車部品、薬品、食品等の製造ラインで搬送される製品であってよい。電子部品は、例えば、基盤、チップコンデンサ、液晶、リレーの巻線等であってよい。自動車部品は、例えば、コンロッド、シャフト、エンジンブロック、パワーウィンドウスイッチ、パネル等であってよい。薬品は、例えば、包装済みの錠剤、未包装の錠剤等であってよい。製品ＲＡは、製造過程完了後に生成される最終品であってもよいし、製造過程の途中で生成される中間品であってもよいし、製造過程を経過する前に用意される初期品であってもよい。欠陥Ｐ１２は、例えば、傷、汚れ、クラック、打痕、バリ、色ムラ、異物混入等であってよい。欠陥Ｐ１２に関する推定は、例えば、製品ＲＡに欠陥Ｐ１２が含まれるか否かを判定すること、製品ＲＡに欠陥Ｐ１２が含まれる確率を判定すること、製品ＲＡに含まれる欠陥Ｐ１２の種類を識別すること、製品ＲＡに含まれる欠陥Ｐ１２の範囲を特定すること又はこれらの組み合わせにより表現されてよい。

（モデル生成装置）
本変形例では、モデル生成装置１は、上記ステップＳ１０１において、背景Ｐ１１の写る学習用背景データ３９を取得する。そして、モデル生成装置１は、ステップＳ１０２及びステップＳ１０３の処理を実行することで、背景Ｐ１１の写る疑似背景データを生成する能力を獲得した機械学習済みの生成器６０を生成し、第２学習結果データ１２２を所定の記憶領域に保存する。モデル生成装置１は、上記ステップＳ１１１～ステップＳ１１３の処理を実行することで、機械学習済みの入力推定器６２を生成し、第３学習結果データ１２３を所定の記憶領域に保存する。

また、モデル生成装置１は、上記ステップＳ１２１において、製品ＲＡの写る訓練データ３１、及び訓練データ３１に写る製品ＲＡの欠陥Ｐ１２に関する情報（正解）を示す正解データ３２の組み合わせによりそれぞれ構成される複数の学習データセット３０を取得する。欠陥Ｐ１２に関する情報は、例えば、欠陥Ｐ１２の有無、欠陥Ｐ１２の種別、欠陥Ｐ１２の存在する範囲等の情報を含んでよい。モデル生成装置１は、上記ステップＳ１２２～ステップＳ１２５の処理を実行することで、欠陥Ｐ１２に関する推定を遂行する能力を獲得した機械学習済みの推定器５を生成し、第１学習結果データ１２１を所定の記憶領域に保存する。生成された第１～第３学習結果データ１２１～１２３は、任意のタイミングで検査装置２Ａに提供されてよい。

（検査装置）
図１２Ａは、本変形例に係る検査装置２Ａのハードウェア構成の一例を模式的に例示する。図１２Ａに示されるとおり、本変形例に係る検査装置２Ａは、上記推定装置２と同様に、制御部２１、記憶部２２、通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、及びドライブ２７が電気的に接続されたコンピュータにより構成されてよい。

本変形例では、記憶部２２は、検査プログラム８２Ａ、第１～第３学習結果データ１２１～１２３等の各種情報を記憶する。検査プログラム８２Ａは、上記実施形態に係る推定プログラム８２に対応する。検査プログラム８２Ａ及び第１～第３学習結果データ１２１～１２３の少なくともいずれかは記憶媒体９２に記憶されていてもよい。また、本変形例では、検査装置２Ａは、外部インタフェース２４を介して、カメラＳＡに接続される。カメラＳＡは、例えば、一般的なＲＧＢカメラ、深度カメラ、赤外線カメラ等であってよい。カメラＳＡは、製品ＲＡを撮影可能な場所に適宜配置されてよい。例えば、カメラＳＡは、製品ＲＡを搬送するコンベア装置の近傍に配置されてよい。

なお、検査装置２Ａのハードウェア構成は、このような例に限定されなくてもよい。検査装置２Ａの具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。検査装置２Ａは、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ、ＰＬＣ等であってもよい。

図１２Ｂは、本変形例に係る検査装置２Ａのソフトウェア構成の一例を模式的に例示する。上記実施形態と同様に、検査装置２Ａのソフトウェア構成は、制御部２１による検査プログラム８２Ａの実行により実現される。取り扱われるデータが上記のように限定される点を除き、検査装置２Ａのソフトウェア構成は、上記推定装置２と同様である。検査部２１４Ａは、上記推定部２１４に対応する。これにより、検査装置２Ａは、上記推定装置２の推定処理と同様に、外観検査に関する一連の情報処理を実行することができる。

すなわち、ステップＳ２０１では、制御部２１は、検査対象の製品ＲＡの写る対象画像データ４１Ａを取得する。ステップＳ２０２では、制御部２１は、対象画像データ４１Ａに対応する対象背景データ４５Ａを取得する。本変形例では、制御部２１は、機械学習済みの生成器６０及び入力推定器６２を利用することで、対象画像データ４１Ａに写る背景Ｐ１１に適合する対象背景データ４５Ａを取得することができる。ステップＳ２０３では、制御部２１は、対象画像データ４１Ａと対象背景データ４５Ａとの差分を取ることで、対象差分データ４７Ａを生成する。ステップＳ２０４では、制御部２１は、検査部２１４Ａとして動作し、生成された対象差分データ４７Ａを機械学習済みの推定器５に与えて、機械学習済みの推定器５の演算処理を実行する。これにより、制御部２１は、対象画像データ４１Ａに写る製品ＲＡの欠陥Ｐ１２について推定した結果に対応する出力値を機械学習済みの推定器５から取得する。

ステップＳ２０５では、制御部２１は、製品ＲＡの欠陥Ｐ１２について推定した結果に関する情報を出力する。例えば、制御部２１は、製品ＲＡの欠陥Ｐ１２について推定した結果をそのまま出力装置２６に出力してもよい。また、例えば、製品ＲＡに欠陥Ｐ１２が含まれると判定した場合、制御部２１は、そのことを知らせるための警告を出力装置２６に出力してもよい。また、例えば、製品ＲＡを搬送するコンベア装置に検査装置２Ａが接続される場合、制御部２１は、欠陥Ｐ１２について推定した結果に基づいて、欠陥Ｐ１２のある製品ＲＡと欠陥Ｐ１２のない製品ＲＡとを別のラインで搬送されるようにコンベア装置を制御してもよい。

（特徴）
本変形例によれば、モデル生成装置１の機械学習により、差分計算で除外された背景Ｐ１１に関する情報を利用せずに、欠陥Ｐ１２に関する推定タスクを遂行するように推定器５を訓練することができる。よって、背景Ｐ１１の相違に対してロバストに欠陥Ｐ１２に関する推定タスクを遂行可能な機械学習済みの推定器５を生成することができる。本変形例に係る検査装置２Ａでは、この機械学習済みの推定器５を利用することで、欠陥Ｐ１２に関する推定タスク（すなわち、外観検査）が高精度に遂行されることを期待することができる。

（その他）
上記第１変形例において、製品ＲＡは、対象物の一例であり、欠陥Ｐ１２に関する情報は、対象物の属性の一例である。対象物及びその属性は、製品ＲＡ及び欠陥Ｐ１２に関する情報に限られなくてもよく、実施の形態に応じて適宜選択されてよい。すなわち、上記実施形態に係る推定システム１００は、画像データに表れる任意の対象物の属性を推定する様々な場面に適用されてよい。この場合、推定システム１００では、対象物の写る画像データが訓練データ３１及び対象画像データ４１として取り扱われてよい。対象の特徴は、対象物の属性に関するものであってよい。これにより、背景の相違に対してロバストに対象物の属性に関する推定タスクを遂行可能な機械学習済みの推定器５を生成することができる。

また、製品ＲＡ以外の部分を背景Ｐ１１と捉えた場合、製品ＲＡの写る部分は、前景の一例である。或いは、製品ＲＡの欠陥Ｐ１２以外の部分を背景Ｐ１１と捉えた場合、欠陥Ｐ１２の写る範囲が、前景の一例である。前景及び背景は、このような例に限られなくてもよく、実施の形態に応じて適宜選択されてよい。すなわち、上記実施形態に係る推定システム１００は、画像データに写る任意の前景に含まれる特徴に関する推定を行う様々な場面に適用されてよい。この場合、所定種類のデータは、前景及び背景を含む画像データであってよい。この場合、前景及び背景の写る画像データが訓練データ３１及び対象画像データ４１として取り扱われてよい。対象の特徴は、前景に関するものであってよい。前景には、画像データから抽出可能な任意の要素が選択されてよい。これにより、背景の相違に対してロバストに前景に関する推定タスクを遂行可能な機械学習済みの推定器５を生成することができる。

（Ｂ）ナンバープレートの記号を識別する場面
図１３は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図１３に例示される識別システムは、モデル生成装置１及び識別装置２Ｂを備えている。識別装置２Ｂは、上記検査装置２Ａに対応する。識別装置２Ｂの構成は、上記検査装置２Ａと同様であってよい。図１３の例では、ナンバープレートＲＢの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム１００Ａと同様に、カメラＳＢが用いられてよい。

この場合、推定タスクの対象となる特徴は、ナンバープレートＲＢに付与された記号Ｐ２０に関するものであってよい。ナンバープレートＲＢは、対象物の一例である。背景は、記号Ｐ２０以外の領域であってよい。前景は、記号Ｐ２０の写る領域であってよい。記号Ｐ２０は、例えば、数字、文字、マーク、図形、又はこれらの組み合わせにより構成されてよい。ナンバープレートＲＢの背景には、模様、図柄等の装飾が施されていてもよい。対象の特徴に関する推定は、記号Ｐ２０を識別することであってよい。

これにより、モデル生成装置１は、背景の相違に対してロバストにナンバープレートＲＢに付与された記号Ｐ２０を識別可能な機械学習済みの推定器５を生成することができる。識別装置２Ｂは、上記検査装置２Ａと同様の手順により、対象画像データに写るナンバープレートＲＢの記号Ｐ２０を識別することができる。本変形例に係る識別システムは、ナンバープレートＲＢの記号Ｐ２０を識別するあらゆる場面に利用されてよい。例えば、本変形例に係る識別システムは、道路を走行する車両を監視するための監視カメラにより得られる画像データから当該道路を走行する車両を識別するために利用されてよい。

なお、道路を走行する車両を監視する場面では、識別装置２Ｂは、上記ステップＳ２０１～ステップＳ２０４の処理により、時系列に得られる対象画像データに対してナンバープレートＲＢの記号Ｐ２０を識別してもよい。そして、識別装置２Ｂは、上記ステップＳ２０５の処理により、記号Ｐ２０に基づいて対象の道路を走行する車両を識別した結果を時系列に示す履歴情報を作成してもよい。

（Ｃ）製品の包装に付与された記号を識別する場面
図１４は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図１４に例示される識別システムは、モデル生成装置１及び識別装置２Ｃを備えている。識別装置２Ｃは、上記検査装置２Ａに対応する。識別装置２Ｃの構成は、上記検査装置２Ａと同様であってよい。図１４の例では、製品の包装ＲＣの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム１００Ａと同様に、カメラＳＣが用いられてよい。

この場合、推定タスクの対象となる特徴は、包装ＲＣに付与された記号Ｐ３０に関するものであってよい。包装ＲＣは、対象物の一例である。背景は、記号Ｐ３０以外の領域であってよい。前景は、記号Ｐ３０の写る領域であってよい。記号Ｐ３０は、例えば、数字、文字、マーク、図形、コード、又はこれらの組み合わせにより構成されてよい。コードは、例えば、一次元コード、二次元コード等であってよい。包装ＲＣの背景には、模様、図柄等の装飾が施されていてもよい。対象の特徴に関する推定は、記号Ｐ３０を識別することであってよい。

これにより、モデル生成装置１は、背景の相違に対してロバストに包装ＲＣに付与された記号Ｐ３０を識別可能な機械学習済みの推定器５を生成することができる。識別装置２Ｃは、上記検査装置２Ａと同様の手順により、対象画像データに写る包装ＲＣに付与された記号Ｐ３０を識別することができる。本変形例に係る識別システムは、包装ＲＣに付与された記号Ｐ３０を識別するあらゆる場面に利用されてよい。例えば、本変形例に係る識別システムは、製造ラインで搬送される製品を識別するために利用されてよい。

（Ｄ）移動体の属性を推定する場面
図１５は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図１５に例示される監視システムは、モデル生成装置１及び監視装置２Ｄを備えている。監視装置２Ｄは、上記検査装置２Ａに対応する。監視装置２Ｄの構成は、上記検査装置２Ａと同様であってよい。図１５の例では、移動体ＲＤの存在し得る範囲を撮影することで得られた画像データが訓練データ及び対象画像データとして取り扱われてよい。画像データの取得には、監視対象の範囲を撮影するように配置されたカメラＳＤが用いられてよい。監視対象の範囲は、例えば、道路、建物内等の任意の場所から決定されてよい。監視装置２Ｄは、例えば、ネットワーク等を介して、カメラＳＤに適宜接続されてよい。これにより、監視装置２Ｄは、監視対象の範囲の写る画像データを取得することができる。

この場合、推定タスクの対象となる特徴は、移動体ＲＤの属性に関するものであってよい。移動体ＲＤは、対象物の一例である。移動体ＲＤの属性は、例えば、移動体ＲＤの写る範囲（バウンディングボックス）、移動体ＲＤの識別情報、移動体ＲＤの状態等を含んでもよい。移動体ＲＤの状態は、例えば、位置、数、混み具合（混雑度、密度）、速度、加速度等を含んでもよい。その他、移動体ＲＤの状態は、例えば、事故、犯罪等の危険に移動体ＲＤが遭遇する可能性（危険度）を含んでもよい。移動体ＲＤの遭遇し得る危険の種類は任意に決定されてよい。更にその他、移動体ＲＤが人物である場合、移動体ＲＤの識別情報は、例えば、人物の識別子、名前、性別、年齢、体格等を含んでもよい。また、移動体ＲＤの状態は、例えば、人物の行動、人物の姿勢等を含んでもよい。背景は、例えば、道路、建物等の移動体ＲＤ以外の対象物が写る領域であってよい。前景は、移動体ＲＤの写る領域であってよい。或いは、前景は、移動体ＲＤ及び移動体ＲＤの周囲を含む領域であってよい。この場合、背景は、移動体ＲＤの周囲より外側の領域であってよい。

これにより、モデル生成装置１は、背景の相違に対してロバストに移動体ＲＤの属性を推定可能な機械学習済みの推定器５を生成することができる。監視装置２Ｄは、上記検査装置２Ａと同様の手順により、カメラＳＤの撮影範囲における移動体ＲＤの属性を推定することができる。本変形例に係る監視システムは、移動体ＲＤを監視するあらゆる場面に利用されてよい。例えば、本変形例に係る監視システムは、道路、建物内の移動体ＲＤの混雑度を監視する場面、駅のホームから人物が転落する予兆を監視する場面、道路を歩行する人物が犯罪に遭遇する予兆を監視する場面等に利用されてよい。なお、推定結果を出力する形態は任意に決定されてよい。例えば、移動体ＲＤの危険度を推定する場面では、監視装置２Ｄは、上記ステップＳ２０５において、推定される危険度に応じた警告を出力してもよい。

（Ｅ）運転者の状態を監視する場面
図１６は、画像データに写る対象物の属性を推定する他の場面の一例を模式的に例示する。図１６に例示される監視システムは、モデル生成装置１及び監視装置２Ｅを備えている。監視装置２Ｅは、上記検査装置２Ａに対応する。監視装置２Ｅの構成は、上記検査装置２Ａと同様であってよい。図１６の例では、運転者ＲＥの写る画像データが訓練データ及び対象画像データとして取り扱われてよい。この画像データの取得には、上記検査システム１００Ａと同様に、カメラＳＥが用いられてよい。カメラＳＥは、運転席に存在すると仮定される運転者ＲＥを撮影するように適宜配置されてよい。

この場合、推定タスクの対象となる特徴は、運転者ＲＥの状態に関するものであってよい。運転者ＲＥは、対象物の一例である。運転者ＲＥの状態は、例えば、健康状態、眠気度、疲労度、余裕度等を含んでよい。健康状態は、例えば、所定の疾患を発症する確率、体調変化が生じる確率等により表現されてよい。眠気度は、運転者ＲＥの眠気の度合いを示す。疲労度は、運転者ＲＥの疲労の度合いを示す。余裕度は、運転者ＲＥの運転に対する余裕の度合を示す。背景は、例えば、車内風景等の運転者ＲＥの状態に関与する領域以外の領域であってよい。前景は、運転者ＲＥの状態に関与する領域であってよい。運転者ＲＥの状態に関与する領域は、例えば、運転者ＲＥの写る領域、運転者ＲＥの周囲を更に含む領域、運転者ＲＥの一部（例えば、任意の身体部位）の写る領域、運転に関するツール（ハンドル等）の写る領域等であってよい。

これにより、モデル生成装置１は、背景の相違に対してロバストに運転者ＲＥの状態を推定可能な機械学習済みの推定器５を生成することができる。監視装置２Ｅは、上記検査装置２Ａと同様の手順により、対象画像データに写る運転者ＲＥの状態を推定することができる。本変形例に係る監視システムは、運転者ＲＥの状態を監視するあらゆる場面に利用されてよい。更に、本変形例に係る監視システムは、運転者ＲＥ以外の対象者にも利用されてよい。運転者ＲＥ以外の例として、対象者は、例えば、オフィス、工場等で作業を行う作業者であってよい。

なお、上記ステップＳ２０５において、運転者ＲＥの状態を推定した結果を出力する形態は任意に決定されてよい。一例として、眠気度及び疲労度の少なくとも一方を推定した場合、監視装置２Ｅは、推定された眠気度及び疲労度の少なくとも一方が閾値を超えるか否かを判定してもよい。そして、眠気度及び疲労度の少なくとも一方が閾値を超えている場合に、監視装置２Ｅは、駐車場等に車両を停車し、休憩を取るように運転者ＲＥに促す警告を出力装置に出力してもよい。このように、監視装置２Ｅは、推定される運転者ＲＥの状態に応じて、警告等の特定のメッセージを出力装置に出力してもよい。

その他の例として、自動運転の動作を制御する制御装置（不図示）を車両が備えている場合、監視装置２Ｅは、運転者ＲＥの状態を推定した結果に基づいて、車両の自動運転の動作を指示するための指令を制御装置に送信してもよい。具体例として、制御装置が、車両の走行を制御する自動運転モード及び運転者ＲＥの操舵により車両の走行を制御する手動運転モードの切り替え可能に構成されていると想定する。このケースにおいて、自動運転モードで車両が走行しており、自動運転モードから手動運転モードへの切り替えを運転者ＲＥ又はシステムから受け付けた際に、監視装置２Ｅは、推定された運転者ＲＥの余裕度が閾値を超えているか否かを判定してもよい。そして、運転者ＲＥの余裕度が閾値を超えている場合に、監視装置２Ｅは、自動運転モードから手動運転モードへの切り替えを許可する指令を制御装置に送信してもよい。一方、運転者ＲＥの余裕度が閾値以下である場合には、監視装置２Ｅは、自動運転モードから手動運転モードへの切り替えを許可しない通知を制御装置に送信し、自動運転モードでの走行を維持するようにしてもよい。

また、手動運転モードで車両が走行している際に、監視装置２Ｅは、推定された眠気度及び疲労度の少なくとも一方が閾値を超えるか否かを判定してもよい。そして、眠気度及び疲労度の少なくとも一方が閾値を超えている場合に、監視装置２Ｅは、手動運転モードから自動運転モードに切り替えて、駐車場等の安全な場所に停車するように指示する指令を制御装置に送信してもよい。一方で、そうではない場合には、監視装置２Ｅは、手動運転モードによる車両の走行を維持するようにしてもよい。

また、手動運転モードで車両が走行している際に、監視装置２Ｅは、推定された余裕度が閾値以下であるか否かを判定してもよい。そして、余裕度が閾値以下である場合に、監視装置２Ｅは、減速する指令を制御装置に送信してもよい。一方で、そうではない場合には、監視装置２Ｅは、運転者ＲＥの操作による車両の走行を維持してもよい。なお、車両の制御装置と監視装置２Ｅとは一体のコンピュータにより構成されてよい。

＜４．２＞
上記実施形態では、ステップＳ１２２及びステップＳ２０２において、機械学習済みの生成器６０を利用して、背景データ３５及び対象背景データ４５を取得可能である。しかしながら、各背景データ（３５、４５）を取得する方法は、このような例に限定されなくてもよい。例えば、各背景データ（３５、４５）として利用可能な背景データが予め用意されてよい。この場合、背景データは、記憶部（１２、２２）、記憶媒体（９１、９２）、外部記憶装置等に記憶されていてよい。上記ステップＳ１２２及びステップＳ２０２では、予め用意された背景データから、訓練データ３１及び対象画像データ４１それぞれと同種の背景の写る背景データが各背景データ（３５、４５）として適宜選択されてよい。一例として、利用する背景データは、オペレータにより選択されてよい。或いは、訓練データ３１及び対象画像データ４１それぞれと最も類似する背景データが各背景データ（３５、４５）として選択されてよい。

＜４．３＞
上記実施形態では、生成器６０の訓練に識別器６１が利用されている。モデル生成装置１は、生成器６０及び識別器６１の間で敵対的学習を実施することで、学習用背景データ３９に適合する疑似背景データ６３３を生成する能力を獲得した機械学習済みの生成器６０を構築する。しかしながら、機械学習済みの生成器６０を生成する方法は、学習用背景データ３９により与えられる背景の写る疑似背景データを生成するように生成器６０を訓練可能であれば、このような例に限定されなくてもよい。

図１７は、本変形例に係る生成器６０Ｚの構成の一例を模式的に例示する。本変形例では、生成器６０Ｚは、エンコーダ６７と共に訓練される。エンコーダ６７は、画像データを特徴量に変換するように構成される。生成器６０Ｚは、特徴量から画像データを復元するよう構成されたデコーダとして動作する。エンコーダ６７により得られる特徴量は、上記実施形態におけるノイズ（潜在変数）に対応する。エンコーダ６７は、上記入力推定器６２に対応する。特徴量の形式は、特に限定されなくてよく、任意に決定されてよい。

エンコーダ６７及び生成器６０Ｚはそれぞれ、機械学習モデルにより構成される。それぞれを構成する機械学習モデルの種類は任意に選択されてよい。上記実施形態と同様に、エンコーダ６７及び生成器６０Ｚには、ニューラルネットワークが用いられてよい。エンコーダ６７及び生成器６０Ｚにニューラルネットワークが用いられる場合、モデル生成装置１は、上記ステップＳ１０２において、以下のとおり、機械学習を実施することができる。

すなわち、制御部１１は、学習用背景データ３９をエンコーダ６７に入力し、エンコーダ６７の演算処理を実行する。これにより、制御部１１は、学習用背景データ３９を特徴量に変換した結果に対応する出力値をエンコーダ６７から取得する。次に、制御部１１は、エンコーダ６７から得られた特徴量を生成器６０Ｚに入力し、生成器６０Ｚの演算処理を実行する。これにより、制御部１１は、特徴量から復元された復元背景データ６３３Ｚに対応する出力値を生成器６０Ｚから取得する。

制御部１１は、得られた復元背景データ６３３Ｚと学習用背景データ３９との誤差を算出する。制御部１１は、誤差逆伝播法により、算出された誤差の勾配を用いて、エンコーダ６７及び生成器６０Ｚの各演算パラメータの値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、エンコーダ６７及び生成器６０Ｚの各演算パラメータの値を更新する。制御部１１は、当該一連の更新処理により、算出される誤差の和が小さくなるように、エンコーダ６７及び生成器６０Ｚの各演算パラメータの値を調節する。なお、上記更新処理の他に、制御部１１は、エンコーダ６７から得られる特徴量と所定の確率分布（例えば、ガウス分布等）から得られる値との誤差を算出し、当該誤差の和が小さくなるようにエンコーダ６７の各演算パラメータの値を更に調節してもよい。これにより、制御部１１は、エンコーダ６７の出力値を正規化してもよい。

以上の機械学習により、背景に応じて画像データを適切な特徴量に変換する能力を獲得した訓練済みのエンコーダ６７を構築することができる。これと共に、対応する背景の写る疑似背景データを特徴量から生成する能力を獲得した訓練済みの生成器６０Ｚを構築することができる。この場合、機械学習済みのエンコーダ６７を上記機械学習済みの入力推定器６２として利用可能である。そのため、本変形例では、上記ステップＳ１１１～ステップＳ１１３の処理は省略されてよい。

上記ステップＳ１２２では、制御部１１は、機械学習済みのエンコーダ６７に訓練データ３１を与えて、機械学習済みのエンコーダ６７及び生成器６０Ｚの演算処理を実行する。これにより、制御部１１は、訓練データ３１に対応して生成された背景データ３５を機械学習済みの生成器６０Ｚから取得することができる。同様に、上記ステップＳ２０２では、制御部２１は、機械学習済みのエンコーダ６７に対象画像データ４１を与えて、機械学習済みのエンコーダ６７及び生成器６０Ｚの演算処理を実行する。これにより、制御部２１は、対象画像データ４１に対応して生成された対象背景データ４５を機械学習済みの生成器６０Ｚから取得することができる。

その他の例として、生成器６０の機械学習は、主成分分析により構成されてよい。この場合、機械学習済みの生成器６０は、主成分分析により導出される固有ベクトルにより構成されてよい。詳細には、機械学習済みの生成器６０は、固有ベクトルＵを利用した射影行列「ＵＵ^T」により構成されてよい。固有ベクトルの各成分が生成器６０の演算パラメータの一例である。上記ステップＳ１２２及びステップＳ２０２では、訓練データ３１及び対象画像データ４１それぞれを上記射影行列により変換することで、対応する背景データ３５及び対象背景データ４５を得ることができる。

＜４．４＞
上記実施形態では、推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれには、全結合型のニューラルネットワークが用いられている。しかしながら、それぞれを構成するニューラルネットワークの種類は、このような例に限定されなくてもよい。推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれには、例えば、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク等が用いられてよい。

また、推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれを構成する機械学習モデルの種類は、ニューラルネットワークに限られなくてもよい。例えば、生成器６０は、上記のとおり、固有ベクトルＵを利用した射影行列により構成されてよい。また、推定器５、識別器６１、及び入力推定器６２それぞれには、ニューラルネットワーク以外に、例えば、サポートベクタマシン、回帰モデル、決定木モデル等が用いられてよい。機械学習の方法は、それぞれの機械学習モデルの種類に応じて適宜選択されてよい。

また、上記実施形態において、推定器５、生成器６０、識別器６１、及び入力推定器６２それぞれの入力及び出力の形式は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。例えば、生成器６０及び識別器６１はそれぞれ、背景の種別を示す情報の入力を更に受け付けるように構成されてよい。これにより、機械学習済みの生成器６０に与える入力値（背景の種別を示す情報）に応じて、当該機械学習済みの生成器６０により生成する疑似背景データに写る背景の種別を制御することができる。

また、上記実施形態において、機械学習済みの生成器６０及び入力推定器６２は、モデル生成装置１以外の他のコンピュータにより生成されてもよい。モデル生成装置１により機械学習済みの生成器６０を生成しない場合、モデル生成装置１のソフトウェア構成から第２データ取得部１１５及び第２訓練部１１６は省略されてよい。モデル生成装置１の処理手順から上記ステップＳ１０１～ステップＳ１０３の処理は省略されてよい。また、モデル生成装置１により機械学習済みの入力推定器６２を生成しない場合、モデル生成装置１のソフトウェア構成から第３データ取得部１１７及び第３訓練部１１８は省略されてよい。モデル生成装置１の処理手順から上記ステップＳ１１１～ステップＳ１１３の処理は省略されてよい。また、機械学習済みの機械学習モデルに関する情報を保存しない場合には、モデル生成装置１のソフトウェア構成から保存処理部１１９は省略されてよい。モデル生成装置１の処理手順から上記ステップＳ１０３、ステップＳ１１３、及びステップＳ２０５の処理は省略されてよい。

１…モデル生成装置、
１１…制御部、１２…記憶部、
１３…通信インタフェース、１４…外部インタフェース、
１５…入力装置、１６…出力装置、１７…ドライブ、
１１１…第１データ取得部、１１２…背景取得部、
１１３…差分算出部、１１４…第１訓練部、
１１５…第２データ取得部、１１６…第２訓練部、
１１７…第３データ取得部、１１８…第３訓練部、
１１９…保存処理部、
１２１…第１学習結果データ、
１２２…第２学習結果データ、
１２３…第３学習結果データ、
８１…モデル生成プログラム、９１…記憶媒体、
２…推定装置、
２１…制御部、２２…記憶部、
２３…通信インタフェース、２４…外部インタフェース、
２５…入力装置、２６…出力装置、２７…ドライブ、
２１１…データ取得部、２１２……背景取得部、
２１３…差分算出部、２１４…推定部、
２１５…出力部、
８２…推定プログラム、９２…記憶媒体、
３０…学習データセット、
３１…訓練データ、３２…正解データ、
３５…背景データ、３７…差分データ、
３９…学習用背景データ、
４１…対象画像データ、
４５…対象背景データ、４７…対象差分データ、
５…推定器、
６０…生成器、６１…識別器、
６２…入力推定器

Claims

画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得する第１データ取得部と、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得する背景取得部と、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成する差分算出部と、
推定器の機械学習を実施する第１訓練部であって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、第１訓練部と、
を備える、
モデル生成装置。
前記背景データを取得することは、機械学習済みの生成器を利用して、前記各学習データセットについて、前記訓練データに対して前記背景データを生成することを含む、
請求項１に記載のモデル生成装置。
学習用背景データを取得する第２データ取得部と、
取得された学習用背景データについて機械学習を実施することで、前記訓練データに対する前記背景データを生成するように訓練された前記機械学習済みの生成器を構築する第２訓練部と、
を更に備える、
請求項２に記載のモデル生成装置。
前記差分算出部は、前記訓練データの各画素及び各画素の周囲の画素を含む対象領域と前記背景データの対応する各画素及び各画素の周囲の画素を含む対応領域との間の相関性に応じて、前記訓練データの各画素と前記背景データの対応する各画素との差分を取ることで、前記差分データを生成する、
請求項１から３のいずれか１項に記載のモデル生成装置。
前記特徴は、前記訓練データの前景についての特徴である、
請求項１から４のいずれか１項に記載のモデル生成装置。
前記訓練データは、対象物の写る前記画像データであり、
前記特徴は、前記対象物の属性である、
請求項１から４のいずれか１項に記載のモデル生成装置。
前記対象物は、製品であり、
前記対象物の属性は、前記製品の欠陥についての属性である、
請求項６に記載のモデル生成装置。
対象画像データを取得するデータ取得部と、
前記対象画像データに対応する対象背景データを取得する背景取得部と、
前記対象画像データと前記対象背景データとの差分を取ることで、対象差分データを生成する差分算出部と、
請求項１から７のいずれか１項に記載のモデル生成装置により生成された機械学習済みの推定器を利用して、生成された前記対象差分データに含まれる特徴を推定する推定部と、
前記特徴を推定した結果についての情報を出力する出力部と、
を備える、
推定装置。
コンピュータが、
画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、
推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、
を実行する、
モデル生成方法。
コンピュータに、
画像データである訓練データ、及び前記訓練データに含まれる特徴を示す正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記各学習データセットについて、前記訓練データの背景を示す背景データを取得するステップと、
前記各学習データセットについて、取得された前記背景データと前記訓練データとの差分を取ることで、前記背景データと前記訓練データとの間の差分を示す差分データを生成するステップと、
推定器の機械学習を実施するステップであって、前記推定器の機械学習を実施することは、前記各学習データセットについて、生成された前記差分データから当該推定器により前記特徴を推定した結果が前記正解データに適合するように当該推定器を訓練することを含む、ステップと、
を実行させるための、
モデル生成プログラム。