JP7396125B2

JP7396125B2 - モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム

Info

Publication number: JP7396125B2
Application number: JP2020036237A
Authority: JP
Inventors: 敦史橋本; 大和岡本
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2020-03-03
Filing date: 2020-03-03
Publication date: 2023-12-12
Anticipated expiration: 2040-03-03
Also published as: CN115210724A; EP4116893A1; JP2021140362A; US20230109426A1; WO2021176984A1; EP4116893A4

Description

本発明は、モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラムに関する。

近年、車両を自律的に運転するための自動運転の技術開発が盛んに行われている。例えば、特許文献１には、訓練済みのニューラルネットワークを用いて、自動運転車両に対してローカル座標内に目的地を確立し、確立されたルートに沿ってナビゲーションするように自動運転車両の加速、制動、及び操舵を決定するためのシステムが提案されている。

特表２０１９－５３３８１０号公報特開２０１９－１２５２９９号公報特開２０１２－０２６９８２号公報特開２００９－０８３０９５号公報

機械学習により構築された訓練済みの機械学習モデルによれば、与えられた訓練データと同種の未知のデータに対して、回帰、分類等の推定（予測を含む）タスクを遂行することができる。そのため、訓練済みの機械学習モデルの出力に基づいて、自動運転の戦略を決定することは可能である。しかしながら、訓練済みの機械学習モデルを使用する自動運転の技術には次のような問題点があることを本件発明者らは見出した。

すなわち、機械学習モデルは、推定タスクを遂行する演算処理を実行するための複数の演算パラメータを備える。例えば、機械学習モデルとしてニューラルネットワークを用いる場合、各ニューロン間の結合の重み及び各ニューロンの閾値が演算パラメータの一例である。推定タスクが複雑になるほど、この演算パラメータの数は多くなり、かつ各次元の要素が複雑に結び付くようになるため、各演算パラメータの演算内容を読解するのは困難になる。また、各演算パラメータの値は、機械学習によって、所望の推定タスクを遂行する能力を獲得するように調節される。同程度の性能を発揮する多数の局所解が存在し、初期値の偶然性等の要因により、各演算パラメータの値はいずれかの局所解に到達する。この際、到達した局所解により、各演算パラメータの値は異なる。そのため、同一の推論タスクを遂行する能力を獲得するように同一の構造を有する機械学習モデルを訓練したとしても、各機械学習の同一の演算パラメータの演算内容が同一になるとは限らない。

一例として、これらの要因により、機械学習モデルがその結論を得た理由を分析するのは困難である。換言すると、訓練済みの機械学習モデルの演算内容の説明性が極めて低い。そのため、機械学習モデルの演算結果に基づく自動運転に誤動作が生じた際に、機械学習モデルの演算内容を解析して、その誤動作の原因を解明するのは困難である。

機械学習モデルの演算内容の説明性が低いことに起因して生じる問題点はこれに限られるものではない。更には、機械学習モデルの演算内容の説明性が低いことに起因して何らかの問題点が生じるのは、訓練済みの機械学習を自動運転の場面で使用する際に限られるものではない。

他の例として、特許文献２では、訓練済みの決定木を使用して、求職者と企業とのマッチングを行うためのシステムが提案されている。このようなシステムにおいて、訓練済みの機械学習モデルの説明性が低く、その演算内容に意図的に介入不能であることで、予期せぬ評価が行われる（例えば、性別により評価が不利になる等の所望しない判定基準が形成される）可能性がある。また、他の例として、特許文献３では、訓練済みのニューラルネットワークを使用して、対象物の欠陥検査を行うためのシステムが提案されている。このようなシステムにおいて、機械学習モデルの説明性が低いと、欠陥検査を誤った原因を解明するのが困難となってしまう。更には、特定の環境（例えば、製品の種別、明るさの条件等）で得られる情報が推定タスクの遂行に影響を与えることで、異なる環境において、訓練済みの機械学習モデルの欠陥検査の精度が低下してしまう可能性がある。訓練済みの機械学習モデルの説明性が低く、その演算内容に意図的に介入不能であることで、このような特定の環境で得られる情報に起因する精度の低下を抑制するのが困難である。また、他の例として、特許文献４では、訓練済みのニューラルネットワークを使用して、ロボット装置の動作を制御するためのシステムが提案されている。このようなシステムにおいて、機械学習モデルの説明性が低いと、ロボット装置の誤動作の原因を解明するのが困難となってしまう。

したがって、上記各例のとおり、推定タスクを遂行するのに訓練済みの機械学習モデルを使用する様々な場面において、機械学習モデルの演算内容の説明性が低いことに起因して、その推定タスクに関する何らかの不具合が生じる可能性がある。

本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成するための技術を提供することである。

本発明は、上述した課題を解決するために、以下の構成を採用する。

すなわち、本発明の一側面に係るモデル生成装置は、訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するデータ取得部と、前記複数の学習データセットを使用して、学習モデルの機械学習を実施する学習処理部と、を備える。前記学習モデルは、符号器、第１推定器、及び第２推定器を含む。前記符号器は、与えられた入力データを特徴量に変換するように構成される。前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成される。前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成される。そして、前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、を含む。

当該構成に係るモデル生成装置では、２つの訓練ステップにより、符号器、第１推定器及び第２推定器を含む学習モデルの機械学習が実施される。第１訓練ステップでは、第１推定器は、符号器により得られる特徴量の第１部分から第１推定タスクを遂行する能力を獲得するように訓練され、第２推定器は、特徴量の第２部分から第２推定タスクを遂行する能力を獲得するように訓練される。この第１訓練ステップによれば、訓練された符号器により得られる特徴量の第１部分には、第１推定タスクに関連する情報が含まれるようになり、特徴量の第２部分には、第２推定タスクに関連する情報が含まれるようになる。一方、第２訓練ステップでは、符号器は、特徴量の第１部分と第１正解データとの間の相関性、及び特徴量の第２部分と第２正解データとの間の相関性が共に低くなるように訓練される。この第２訓練ステップによれば、訓練された符号器により得られる特徴量の第１部分には、第２推定タスクに関連する情報が含まれ難くなり、特徴量の第２部分には、第１推定タスクに関連する情報が含まれ難くなる。

したがって、第１訓練ステップ及び第２訓練ステップにより、符号器により得られる特徴量に各推定タスクに関連する情報が含まれるようにしつつ、当該特徴量の第１部分と第２部分との間で情報の排他性を高めることができる。これにより、訓練された符号器により得られる特徴量の第１部分及び第２部分の説明性を高めることができる。すなわち、訓練された符号器により得られる特徴量の第１部分には、第１推定タスクと関連性が高く、かつ第２推定タスクとは関連性の低い情報が含まれており、特徴量の第２部分には、第１推定タスクとは関連性が低く、かつ第２推定タスクと関連性の高い情報が含まれていることを保証することができる。よって、当該構成によれば、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。

その結果、例えば、第１推定タスクの遂行に、第２推定タスクに関連する情報による影響を及び難くすることができる。反対も同様である。なお、訓練済みの学習モデルの利用場面として第１推定タスクを遂行する場面を想定する場合、第２推定タスクは、「疑似タスク」と称されてもよい。また、例えば、特徴量の第１部分及び第２部分に基づく他の推定タスク（例えば、後述する高次推定タスク）の結果に誤りが生じた場合に、各部分に含まれる情報が上記のように保証されるため、その誤りの生じた原因を解明しやすくなることを期待することができる。すなわち、特徴量の各部分を参照することで、誤りの生じた原因を解明可能であることを期待することができる。

上記一側面に係るモデル生成装置において、前記学習モデルは、前記符号器の出力からマスクを生成するように構成されたマスク生成器を更に備えてもよい。前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合するように、前記マスク生成器を訓練する第３訓練ステップを更に含んでもよい。前記第１部分は、生成された前記マスクを前記特徴量に適用することにより抽出されてもよい。

特徴量の第１部分及び第２部分それぞれの範囲は予め固定的に決定されていてもよい。ただし、この場合、それぞれの範囲が各推定タスクに適切か否かは不明であり、各推定タスクに対して各部分の範囲が冗長になったり、次元数の不足が生じたりする可能性がある。各部分の範囲が冗長になると、データの無駄が生じる可能性がある。一方、各部分に次元数の不足が生じると、各推定タスクの精度が低くなる可能性がある。これに対して、当該構成によれば、マスク生成器の訓練により、第１推定タスクに関連する情報が含まれるようになる特徴量の第１部分の範囲を訓練データに適応的に決定することができる。これにより、第１推定タスクの精度を担保した上で、特徴量の第１部分の情報量を最適化することができる。その結果、第１推定タスクの計算時間の効率化を期待することができる。また、第１推定タスク及び第２推定タスクの両方に寄与する情報を第１部分及び第２部分それぞれに抽出可能であることを期待することができる。その結果、各推定タスクの精度の向上を図ることができる。

上記一側面に係るモデル生成装置において、前記第３訓練ステップは、前記第１訓練ステップ及び前記第２訓練ステップの少なくともいずれかと同時に実行されてよい。当該構成によれば、機械学習の処理の効率化を図ることができる。

上記一側面に係るモデル生成装置において、前記機械学習を実施することは、生成される前記マスクの各要素の２値化が進むように、前記マスク生成器を訓練する第４訓練ステップを更に含んでもよい。当該構成によれば、特徴量の第１部分の情報量の最適化を促進することができる。

上記一側面に係るモデル生成装置において、前記学習モデルは、第１敵対推定器及び第２敵対推定器を更に含んでもよい。前記第１敵対推定器は、前記特徴量の前記第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成されてよい。また、前記第２敵対推定器は、前記特徴量の前記第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成されてよい。そして、前記第２訓練ステップは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１敵対推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合し、かつ前記第２敵対推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合するように、前記第１敵対推定器及び前記第２敵対推定器を訓練する第１ステップ、並びに前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１敵対推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合しなくなるように、かつ前記第２敵対推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合しなくなるように、前記符号器を訓練する第２ステップ、を交互に繰り返し実行することにより構成されてよい。当該構成によれば、第１ステップ及び第２ステップによる敵対的学習によって、特徴量の第１部分と第２正解データとの間の相関性を低くし、かつ特徴量の第２部分と第１正解データとの間の相関性を低くする訓練を適切に実現することができる。これにより、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを適切に生成することができる。なお、第１ステップ及び第２ステップを交互に繰り返し実行することは、勾配反転層を利用して第１ステップ及び第２ステップを同時に実行すること含んでよい。

上記一側面に係るモデル生成装置において、前記学習モデルは、前記特徴量から前記入力データを復号化するように構成される復号器を更に含んでもよい。そして、前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記復号器により得られる復号化データが前記訓練データに適合するように、前記符号器及び前記復号器を訓練する第５訓練ステップを更に含んでもよい。当該構成では、復号器の訓練により、入力データ（訓練データ）を特徴量から復元可能であることを保証することができる。これにより、符号器により得られる特徴量において、入力データに関する情報の欠損を抑制することができる。したがって、当該構成によれば、特徴量に変換する過程での情報の欠損を抑えることができるため、構築される訓練済み機械学習モデルの汎化性及びロバスト性の向上を図ることができる。

上記一側面に係るモデル生成装置において、前記第５訓練ステップは、前記第１訓練ステップ及び前記第２訓練ステップの少なくともいずれかと同時に実行されてよい。当該構成によれば、機械学習の処理の効率化を図ることができる。

上記一側面に係るモデル生成装置において、前記第２推定タスクは、前記訓練データの個体性を推定することであってよい。訓練データに含まれるノイズは、特定の個体特有に現れる現象であるため、訓練データの個体性に対応する。当該構成によれば、訓練された符号器により得られる特徴量の第１部分に、訓練データの個体性に関する情報（すなわち、ノイズに対応し得る情報）が含まれ難くすることができる。これによって、個体性に関する情報が第１推定タスクの遂行に影響を及ぼすことを抑制することができ、第１推定タスクを遂行する訓練済みの機械学習モデル（この場合、符号器及び第１推定器）の汎化性能の向上を図ることができる。換言すると、未知の環境で得られる対象データに対する訓練済みの機械学習モデルの推定精度の向上を期待することができる。なお、個体性を推定することは、個体性の識別及び回帰の少なくとも一方により構成されてよい。個体性の識別は、例えば、識別子、クラス等を識別することであってよい。また、個体性の回帰は、例えば、個体性に関する距離（例えば、識別子に基づくクラス間の距離）を推定することであってよい。

上記一側面に係るモデル生成装置において、前記第２正解データは、前記訓練データの識別子を示すように構成されてよく、前記訓練データの個体性を推定することは、前記識別子を識別することであってよい。当該構成によれば、個体性を識別する第２推定タスクを適切に設定することができ、これによって、第１推定タスクを遂行する訓練済みの機械学習モデルの汎化性能の向上を図ることができる。

上記一側面に係るモデル生成装置において、前記識別子は、ハッシュ値により構成されてよい。各学習データセットには個別に識別子を与えてもよい。ただし、この場合には、学習データセットの数に応じて第２正解データの情報量が膨大になり得る。当該構成によれば、学習データセットの数に応じた第２正解データの情報量の増大を緩和することができ、これによって、第２推定タスクに関する計算量の低減及び機械学習の処理の効率化を期待することができる。

上記一側面に係るモデル生成装置において、前記各学習データセットの前記訓練データはクラス分けされてよく、前記識別子は、前記訓練データの属するクラスを示すように構成されてよい。当該構成によれば、各学習データセットに個別に識別子を与えた場合と比べて、学習データセットの数に応じた第２正解データの情報量の増大を緩和することができ、これによって、第２推定タスクに関する計算量の低減及び機械学習の処理の効率化を期待することができる。なお、「クラス」は、「カテゴリ」と称されてもよい。

上記一側面に係るモデル生成装置において、前記各学習データセットは、前記訓練データに対する高次推定タスクの正解を示す高次正解データを更に備えてよい。前記学習モデルは、高次推定器を更に含んでもよい。前記高次推定器は、前記特徴量の前記第１部分及び前記第２部分の入力を受け付け、入力された前記第１部分及び前記第２部分に基づいて、前記入力データに対する前記高次推定タスクを遂行するように構成されてよい。前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記高次推定器の前記高次推定タスクを遂行した結果が前記高次正解データに適合するように、前記高次推定器を訓練する高次訓練ステップを更に含んでもよい。当該構成によれば、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの機械学習モデル（この場合、符号器及び高次推定器）を構築することができる。なお、「第１推定タスク」及び「第２推定タスク」はそれぞれ「ｋ次推定タスク」と称されてよく、「高次推定タスク」は「ｋ＋１次推定タスク」と称されてもよい（ｋは１以上の自然数）。

なお、上記一側面に係るモデル生成装置において、設定される推定タスク及び特徴量の部分の数は２つに限られなくてもよい。推定タスク及び特徴量の部分の数は３つ以上であってもよい。例えば、本発明の一側面に係るモデル生成装置は、訓練データ、及び前記訓練データに対するｎ個の推定タスクそれぞれの正解をそれぞれ示すｎ件の正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するデータ取得部と、前記複数の学習データセットを使用して、学習モデルの機械学習を実施する学習処理部とを備えてもよい。前記学習モデルは、符号器及びｎ個の推定器を含んでもよい。前記符号器は、与えられた入力データを特徴量に変換するように構成されてよい。前記特徴量は、前記各推定タスクにそれぞれ対応するｎ個の部分を含んでもよい。前記各推定器は、前記各推定タスクに割り当てられ、前記各推定器は、前記特徴量の自身に割り当てられた推定タスクに対応する前記部分の入力を受け付け、入力された前記部分に基づいて、前記入力データに対する割り当てられた前記推定タスクを遂行するように構成されてよい。前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記各推定器の前記各推定タスクを遂行した結果が対応する前記正解データに適合するように、前記符号器及び前記各推定器を訓練する第１訓練ステップ、並びに前記各学習データセットについて、前記特徴量の前記各部分と前記各部分に対応する前記推定タスクに対応する前記正解データ（すなわち、前記各部分に対応する前記推定タスクの正解を示す対応の正解データ）を除くｎ－１件の正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、を含んでもよい。そして、前記ｎは、３以上であってよい。加えて、当該一側面に係るモデル生成装置において、前記ｎ個の推定タスクのいずれか１つは、前記訓練データの個体性を推定することであってよい。

上記各形態に係るモデル生成装置は、推定タスクの遂行に利用可能な訓練済みの機械学習モデルを生成する様々な場面に適用されてよい。推定タスクは、例えば、製品を検査すること、自動運転の戦略を決定すること、ロボット装置の動作を決定すること、対象を評価すること等であってよい。推定タスクに利用されるデータの種類及び取得方法は、各場面に応じて適宜選択されてよい。

また、本発明の形態は、上記モデル生成装置の形態に限られなくてもよい。本発明の一側面は、上記モデル生成装置により生成された訓練済みの機械学習モデルを使用して、推定タスクを遂行するように構成された推定装置であってもよい。なお、推定装置は、適用場面における推定タスクの種類に応じて、検査装置、識別装置、監視装置、評価装置、診断装置、監視装置、予測装置等と読み替えられてよい。

例えば、本発明の一側面に係る推定装置は、対象データを取得するデータ取得部と、上記一側面に係るモデル生成装置により訓練された前記符号器及び前記第１推定器を使用して、取得された前記対象データに対して前記第１推定タスクを遂行する推定部と、前記第１推定タスクを遂行した結果に関する情報を出力する出力部と、を備える。当該構成によれば、第１推定タスクの遂行に、第２推定タスクに関連する情報による影響を及び難くすることができる。これにより、所望しない推定基準による推定タスクの遂行を抑制することができる。また、第１推定タスクの推定精度の向上を期待することができる。

また、例えば、本発明の一側面に係る推定装置は、対象データを取得するデータ取得部と、上記一側面に係るモデル生成装置により訓練された前記符号器及び前記高次推定器を使用して、取得された前記対象データに対して前記高次推定タスクを遂行する推定部と、前記高次推定タスクを遂行した結果に関する情報を出力する出力部と、を備える。当該構成によれば、高次推定タスクの結果に誤りが生じている場合でも、特徴量の各部分を参照することで、その誤りの生じた原因を解明可能であることを期待することができる。

また、上記各形態に係るモデル生成装置及び推定装置それぞれの別の態様として、本発明の一側面は、以上の各構成の全部又はその一部を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。また、本発明の一側面は、上記いずれかの形態に係るモデル生成装置及び推定装置により構成される推定システムであってもよい。

例えば、本発明の一側面に係るモデル生成方法は、コンピュータが、訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、前記複数の学習データセットを使用して、学習モデルの機械学習を実施するステップと、を実行する、情報処理方法である。前記学習モデルは、符号器、第１推定器、及び第２推定器を含み、前記符号器は、与えられた入力データを特徴量に変換するように構成され、前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、並びに前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、を含む。

また、例えば、本発明の一側面に係るモデル生成プログラムは、コンピュータに、訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、前記複数の学習データセットを使用して、学習モデルの機械学習を実施するステップと、を実行させるための、プログラムである。前記学習モデルは、符号器、第１推定器、及び第２推定器を含み、前記符号器は、与えられた入力データを特徴量に変換するように構成され、前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、並びに前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、を含む。

本発明によれば、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。

図１は、本発明が適用される場面の一例を模式的に例示する。図２は、実施の形態に係るモデル生成装置のハードウェア構成の一例を模式的に例示する。図３は、実施の形態に係る推定装置のハードウェア構成の一例を模式的に例示する。図４は、実施の形態に係るモデル生成装置のソフトウェア構成の一例を模式的に例示する。図５Ａは、実施の形態に係るモデル生成装置による機械学習の処理過程の一例を模式的に例示する。図５Ｂは、実施の形態に係るモデル生成装置による機械学習の処理過程の一例を模式的に例示する。図６は、実施の形態に係る推定装置のソフトウェア構成の一例を模式的に例示する。図７は、実施の形態に係るモデル生成装置の処理手順の一例を例示する。図８は、実施の形態に係るモデル生成装置の機械学習の処理手順の一例を例示する。図９は、実施の形態に係る推定装置の処理手順の一例を例示する。図１０Ａは、変形例に係る学習モデルの一例を模式的に例示する。図１０Ｂは、変形例に係る訓練済みの学習モデルの利用場面の一例を模式的に例示する。図１１は、変形例に係る学習モデルの一例を模式的に例示する。図１２は、変形例に係る学習モデルの一例を模式的に例示する。図１３は、本発明が適用される他の場面の一例を模式的に例示する。図１４は、本発明が適用される他の場面の一例を模式的に例示する。図１５は、本発明が適用される他の場面の一例を模式的に例示する。図１６は、本発明が適用される他の場面の一例を模式的に例示する。図１７は、本発明が適用される他の場面の一例を模式的に例示する。図１８は、本発明が適用される他の場面の一例を模式的に例示する。

以下、本発明の一側面に係る実施の形態（以下、「本実施形態」とも表記する）を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。

§１適用例
図１は、本発明を適用した場面の一例を模式的に例示する。本実施形態に係る推定システム１００は、モデル生成装置１及び推定装置２を備えている。

本実施形態に係るモデル生成装置１は、学習モデル５の機械学習を実施するように構成されたコンピュータである。具体的に、モデル生成装置１は、複数の学習データセット１２０を取得する。各学習データセット１２０は、訓練データ１２１、第１正解データ１２２、及び第２正解データ１２３の組み合わせにより構成される。第１正解データ１２２は、訓練データ１２１に対する第１推定タスクの正解を示す。第２正解データ１２３は、第１推定タスクとは異なる第２推定タスクであって、訓練データ１２１に対する第２推定タスクの正解を示す。

訓練データ１２１は、所定種類のデータのサンプルである。所定種類のデータは、例えば、推定タスクの対象となるように何らかの特徴を含み得るデータであれば、そのデータの種類は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。所定種類のデータは、例えば、画像データ、音データ、数値データ、テキストデータ、その他各種センサにより得られる測定データ等であってよい。所定種類のデータは、複数の異なる種類のデータにより構成されてもよい。所定種類のデータは、例えば、何らかの対象をセンサにより観測することで得られるセンシングデータであってもよい。センサは、例えば、画像センサ（カメラ）、赤外線センサ、音センサ（マイクロフォン）、超音波センサ、光センサ、圧力センサ、気圧センサ、温度センサ等であってよい。また、センサは、例えば、環境センサ、バイタルセンサ、医療検査装置、車載センサ、ホームセキュリティセンサ等であってよい。環境センサは、例えば、気圧計、温度計、湿度計、音圧計、音センサ、紫外線センサ、照度計、雨量計、ガスセンサ等であってよい。バイタルセンサは、例えば、血圧計、脈拍計、心拍計、心電計、筋電計、体温計、皮膚電気反応計、マイクロ波センサ、脳波計、脳磁計、活動量計、血糖値測定器、眼電位センサ、眼球運動計測器等であってよい。医療検査装置は、例えば、ＣＴ（Computed Tomography）装置、ＭＲＩ（Magnetic Resonance Imaging）装置等であってよい。車載センサは、例えば、画像センサ、Lidar（light detection and ranging）センサ、ミリ波レーダ、超音波センサ、加速度センサ等であってよい。ホームセキュリティセンサは、例えば、画像センサ、赤外線センサ、活性度（音声）センサ、ガス（ＣＯ₂等）センサ、電流センサ、スマートメータ（家電、照明等の電力使用量を計測するセンサ）等であってよい。

第１推定タスク及び第２推定タスクは、データに含まれる何らかの特徴を推定するあらゆるタスクから互いに異なるように適宜選択されてよい。特徴は、データに直接的又は間接的に表れ得る成分（要素）に関するものであってよい。直接的に表れるとは、画像データに写る等のデータそのものに表れることを指す。間接的に表れるとは、画像データから推定される等のデータから導出されることを指す。推定することは、分類すること及び回帰することの少なくとも一方により構成されてよい。回帰することは、バウンディングボックス等のデータ内の範囲を特定することを含んでもよい。推定することは、分類及び回帰の少なくとも一方の結果に基づいて、例えば、検出、判定等の認定処理を実行することを含んでもよい。また、推定することは、未来の何らかの要素を予測することを含んでもよく、これに応じて、特徴は、未来に現れる予兆に関するものであってよい。「推定」は、「推論」と読み替えられてもよい。

本実施形態では、利用場面で遂行する推定タスクが第１推定タスクとして設定される。そのため、本実施形態に係る第２推定タスクは、「疑似タスク」と称されてよい。ただし、各推定タスクと利用場面との関係はこのような例に限定されなくてもよい。第２推定タスクが、利用場面で遂行される推定タスクとして設定されてもよい。その他、第１推定タスク及び第２推定タスク以外に、訓練済みの機械学習モデルの利用場面で遂行される他の推定タスクが設定されてもよい。この場合、第１推定タスク及び第２推定タスクは事前学習のタスクとして設定されてよい。第１正解データ１２２及び第２正解データ１２３はそれぞれ、「教師信号」、「ラベル」等と読み替えられてもよい。各正解データ（１２２、１２３）のデータ形式は、推定タスク、機械学習の方法、学習モデル５の構成等に応じて適宜決定されてよい。

本実施形態に係るモデル生成装置１は、取得された複数の学習データセット１２０を使用して、学習モデル５の機械学習を実施する。本実施形態に係る学習モデル５は、符号器５０、第１推定器５１、及び第２推定器５２を含んでいる。符号器５０は、与えられた入力データを特徴量３に変換するように構成される。換言すると、符号器５０は、データの入力を受け付けて、入力されたデータを特徴量３に変換した結果に対応する出力値を出力するように構成される。第１推定器５１は、特徴量３の第１部分３１の入力を受け付け、入力された第１部分３１に基づいて、入力データに対する第１推定タスクを遂行する（換言すると、第１推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。第２推定器５２は、特徴量３の第２部分３２であって、第１部分３１以外の第２部分３２の入力を受け付け、入力された第２部分３２に基づいて、入力データに対する第２推定タスクを遂行する（換言すると、第２推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。

特徴量３のデータ形式及び各部分（３１、３２）の範囲は、特に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。本実施形態では、後述するとおり、各部分（３１、３２）の範囲は、機械学習において適応的に決定される。なお、図１の例では、各部分（３１、３２）は、特徴量３の全ての範囲を占めている。しかしながら、各部分（３１、３２）の範囲は、このような例に限定されなくてもよい。特徴量３には、各部分（３１、３２）として利用されない範囲が存在してもよい。また、図１の例では、特徴量３の上側の部分が第１部分３１に割り当てられ、下側の部分が第２部分３２に割り当てられている。しかしながら、この割り当ては、便宜上に過ぎず、各部分（３１、３２）の割り当ては、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。

また、各推定器（５１、５２）の出力値の形式は、対応する各推定タスクの遂行の結果を直接的又は間接的に示すように適宜決定されてよい。推定タスクの遂行結果を間接的に示すとは、閾値判定、テーブル参照等の何らかの情報処理が介在して推定の結果に到達することである。符号器５０及び各推定器（５１、５２）は、複数の演算パラメータを備える機械学習モデルにより構成される。機械学習モデルの種類は、各演算を実行可能であれば、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。本実施形態では、後述するとおり、符号器５０及び各推定器（５１、５２）には、ニューラルネットワークが用いられる。

本実施形態に係る機械学習を実施することは、第１訓練ステップ及び第２訓練ステップを含む。第１訓練ステップでは、モデル生成装置１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１推定器５１の第１推定タスクを遂行した結果が第１正解データ１２２に適合し、かつ第２推定器５２の第２推定タスクを遂行した結果が第２正解データ１２３に適合するように、符号器５０、第１推定器５１、及び第２推定器５２を訓練する。また、第２訓練ステップでは、モデル生成装置１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、特徴量３の第１部分３１と第２正解データ１２３との間の相関性が低くなり、かつ特徴量３の第２部分３２と第１正解データ１２２との間の相関性が低くなるように、符号器５０を訓練する。２つの値の「相関性が低い」とは、理想的には２つの値が無相関であることであり、２つの値が統計的に独立している状態、各値の分布間の距離を最小化した状態、又は一方の値を与えても他方の値の推定精度を上げるのが困難（不可能）な状態と言い換えられてよい。各訓練ステップの処理順序は任意であってよい。これにより、第１推定タスクの遂行に利用可能な訓練済みの符号器５０及び第１推定器５１を生成することができる。なお、本実施形態に係るモデル生成装置１は、単に「生成装置」、「学習装置」等と読み替えられてよい。「訓練済み」は、「学習済み」と読み替えられてよい。

一方、本実施形態に係る推定装置２は、モデル生成装置１により生成された訓練済みの機械学習モデルを使用して、所定種類の対象データに対して所定の推定タスクを遂行するように構成されたコンピュータである。推定装置２は、訓練済みの機械学習モデルを使用する利用装置の一例である。本実施形態では、推定装置２は、訓練済みの符号器５０及び第１推定器５１を使用して、対象データに対する第１推定タスクを遂行する。具体的に、推定装置２は、推定タスクの対象となる対象データを取得する。次に、推定装置２は、モデル生成装置１により生成された訓練済みの符号器５０及び第１推定器５１を使用して、取得された対象データに対して第１推定タスクを遂行する。そして、推定装置２は、第１推定タスクを遂行した結果に関する情報を出力する。推定装置２は、遂行する推定タスクに応じて、検査装置、識別装置、監視装置、評価装置、予測装置等と読み替えられてよい。

以上のとおり、本実施形態では、機械学習は、２つの訓練ステップを含む。上記第１訓練ステップの結果、各学習データセット１２０について各推定タスクの遂行が成功するように、訓練された符号器５０により得られる特徴量３の各部分（３１、３２）には、各推定タスクに関連する情報が含まれるようになる。一方、上記第２訓練ステップの結果、訓練された符号器５０により得られる特徴量３の第１部分３１には、第２推定タスクに関連する情報が含まれ難くなり、第２部分３２には、第１推定タスクに関連する情報が含まれ難くなる。

したがって、本実施形態によれば、第１訓練ステップ及び第２訓練ステップにより、符号器５０により得られる特徴量３に各推定タスクに関連する情報が含まれるようにしつつ、特徴量３の第１部分３１と第２部分３２との間で情報の排他性を高めることができる。これにより、訓練された符号器５０により得られる特徴量３の第１部分３１及び第２部分３２の説明性を高めることができる。すなわち、訓練された符号器５０により得られる特徴量３の第１部分３１には、第１推定タスクと関連性が高く、かつ第２推定タスクとは関連性の低い情報が含まれており、第２部分３２には、第１推定タスクと関連性が低く、かつ第２推定タスクとは関連性の高い情報が含まれていることを保証することができる。よって、本実施形態によれば、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。

なお、図１の例では、モデル生成装置１及び推定装置２は、ネットワークを介して互いに接続されている。ネットワークの種類は、例えば、インターネット、無線通信網、移動通信網、電話網、専用網等から適宜選択されてよい。ただし、モデル生成装置１及び推定装置２の間でデータをやりとりする方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、モデル生成装置１及び推定装置２の間では、記憶媒体を利用して、データがやりとりされてよい。

また、図１の例では、モデル生成装置１及び推定装置２は、それぞれ別個のコンピュータにより構成されている。しかしながら、本実施形態に係る推定システム１００の構成は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。たとえば、モデル生成装置１及び推定装置２は一体のコンピュータであってもよい。また、例えば、モデル生成装置１及び推定装置２のうちの少なくとも一方は、複数台のコンピュータにより構成されてもよい。

§２構成例
［ハードウェア構成］
＜モデル生成装置＞
図２は、本実施形態に係るモデル生成装置１のハードウェア構成の一例を模式的に例示する。図２に示されるとおり、本実施形態に係るモデル生成装置１は、制御部１１、記憶部１２、通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６、及びドライブ１７が電気的に接続されたコンピュータである。なお、図２では、通信インタフェース及び外部インタフェースを「通信Ｉ／Ｆ」及び「外部Ｉ／Ｆ」と記載している。後述の図３でも同様の表記を用いる。

制御部１１は、ハードウェアプロセッサであるＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。ＣＰＵは、プロセッサ・リソースの一例である。記憶部１２は、メモリ・リソースの一例であり、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部１２は、モデル生成プログラム８１、複数の学習データセット１２０、学習結果データ１２９等の各種情報を記憶する。

モデル生成プログラム８１は、学習モデル５の機械学習に関する後述の情報処理（図７及び図８）をモデル生成装置１に実行させるためのプログラムである。モデル生成プログラム８１は、当該情報処理の一連の命令を含む。モデル生成プログラム８１は、単に「生成プログラム」、「学習プログラム」等と称されてもよい。複数の学習データセット１２０は、学習モデル５の機械学習に使用される。学習結果データ１２９は、機械学習の結果（本実施形態では、機械学習により生成された訓練済みの符号器５０及び第１推定器５１）に関する情報を示す。本実施形態では、学習結果データ１２９は、モデル生成プログラム８１を実行した結果として生成される。

通信インタフェース１３は、例えば、有線ＬＡＮ（Local Area Network）モジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。モデル生成装置１は、この通信インタフェース１３を利用して、他の情報処理装置との間で、ネットワークを介したデータ通信を実行してもよい。外部インタフェース１４は、例えば、ＵＳＢ（Universal Serial Bus）ポート、専用ポート等であり、外部装置と接続するためのインタフェースである。外部インタフェース１４の種類及び数は、接続される外部装置の種類及び数に応じて適宜選択されてよい。訓練データ１２１等のデータをセンサにより取得する場合、モデル生成装置１は、通信インタフェース１３及び外部インタフェース１４の少なくとも一方を介して、対象のセンサに接続されてよい。

入力装置１５は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置１６は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。ユーザ等のオペレータは、入力装置１５及び出力装置１６を利用することで、モデル生成装置１を操作することができる。

ドライブ１７は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９１に記憶されたプログラム等の各種情報を読み込むためのドライブ装置である。記憶媒体９１は、コンピュータその他装置、機械等が、記憶されたプログラム等の各種情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。上記モデル生成プログラム８１及び複数の学習データセット１２０の少なくともいずれかは、記憶媒体９１に記憶されていてもよい。モデル生成装置１は、この記憶媒体９１から、上記モデル生成プログラム８１及び複数の学習データセット１２０の少なくともいずれかを取得してもよい。なお、図２では、記憶媒体９１の一例として、ＣＤ、ＤＶＤ等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体９１の種類は、ディスク型に限られなくてもよく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。ドライブ１７の種類は、記憶媒体９１の種類に応じて任意に選択されてよい。

なお、モデル生成装置１の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、プロセッサ・リソースは、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ（field-programmable gate array）、ＤＳＰ（digital signal processor）等で構成されてよい。記憶部１２は、制御部１１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース１３、外部インタフェース１４、入力装置１５、出力装置１６及びドライブ１７の少なくともいずれかは省略されてもよい。モデル生成装置１は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、モデル生成装置１は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、ＰＣ（Personal Computer）等であってもよい。

＜推定装置＞
図３は、本実施形態に係る推定装置２のハードウェア構成の一例を模式的に例示する。図３に示されるとおり、本実施形態に係る推定装置２は、制御部２１、記憶部２２、通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、及びドライブ２７が電気的に接続されたコンピュータである。

推定装置２の制御部２１～ドライブ２７及び記憶媒体９２はそれぞれ、上記モデル生成装置１の制御部１１～ドライブ１７及び記憶媒体９１それぞれと同様に構成されてよい。制御部２１は、ハードウェアプロセッサであるＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部２２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部２２は、推定プログラム８２、学習結果データ１２９等の各種情報を記憶する。

推定プログラム８２は、訓練済みの機械学習モデル（本実施形態では、符号器５０及び第１推定器５１）を使用して、所定種類のデータに対して所定の推定タスクを遂行する後述の情報処理（図９）を推定装置２に実行させるためのプログラムである。推定プログラム８２は、当該情報処理の一連の命令を含む。推定プログラム８１及び学習結果データ１２９のうちの少なくともいずれかは、記憶媒体９２に記憶されていてもよい。また、推定装置２は、推定プログラム８１及び学習結果データ１２９のうちの少なくともいずれかを記憶媒体９２から取得してもよい。

なお、推定装置２の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、推定装置２のプロセッサ・リソースは、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ、ＤＳＰ等で構成されてよい。記憶部２２は、制御部２１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース２３、外部インタフェース２４、入力装置２５、出力装置２６、及びドライブ２７の少なくともいずれかは省略されてもよい。推定装置２は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、推定装置２は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ等であってもよい。

［ソフトウェア構成］
＜モデル生成装置＞
図４は、本実施形態に係るモデル生成装置１のソフトウェア構成の一例を模式的に例示する。図５Ａ及び図５Ｂは、本実施形態に係るモデル生成装置１による機械学習の処理過程の一例を模式的に例示する。

モデル生成装置１の制御部１１は、記憶部１２に記憶されたモデル生成プログラム８１をＲＡＭに展開する。そして、制御部１１は、ＣＰＵにより、ＲＡＭに展開されたモデル生成プログラム８１に含まれる命令を解釈及び実行して、各構成要素を制御する。これにより、図４に示されるとおり、本実施形態に係るモデル生成装置１は、データ取得部１１１、学習処理部１１２、及び保存処理部１１３をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、モデル生成装置１の各ソフトウェアモジュールは、制御部１１（ＣＰＵ）により実現される。

データ取得部１１１は、訓練データ１２１、第１正解データ１２２、及び第２正解データ１２３の組み合わせによりそれぞれ構成される複数の学習データセット１２０を取得する。学習処理部１１２は、取得された複数の学習データセット１２０を使用して、学習モデル５の機械学習を実施する。上記のとおり、学習モデル５は、符号器５０、第１推定器５１、及び第２推定器５２を含んでいる。本実施形態では、これらに加えて、第１敵対推定器５３、第２敵対推定器５４、マスク生成器５６、及び復号器５７を更に含んでいる。

第１敵対推定器５３は、第２訓練ステップのために第１推定器５１に対応して与えられ、第１推定器５１に割り当てられた推定タスク以外の推定タスクを遂行するように構成される。同様に、第２敵対推定器５４は、第２訓練ステップのために第２推定器５２に対応して与えられ、第２推定器５２に割り当てられた推定タスク以外の推定タスクを遂行するように構成される。本実施形態では、第１敵対推定器５３は、特徴量３の第１部分３１の入力を受け付け、入力された第１部分の３１に基づいて、入力データに対する第２推定タスクを遂行する（換言すると、第２推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。第２敵対推定器５４は、特徴量３の第２部分３２の入力を受け付け、入力された第２部分３２に基づいて、入力データに対する第１推定タスクを遂行する（換言すると、第１推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。

マスク生成器５６は、符号器５０の出力からマスク４を生成する（換言すると、符号器５０の出力を入力として受け付け、入力された符号器５０の出力からマスク４を生成した結果に対応する出力値を出力する）ように構成される。マスク４は、第１部分３１の抽出に使用される。すなわち、第１部分３１は、生成されるマスク４を特徴量３に適用することにより抽出される。マスク４の構成は、第１部分３１の抽出に使用可能であれば、特に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。第２部分３２は、特徴量３の残りの部分から適宜抽出されてよい。実施形態の一例として、マスク４は、特徴量３と同じ次元数の要素で構成され、マスク４の各要素の値は、特徴量３の各要素を第１部分３１として通過させるか否か（例えば、「１」及び「０」）を示すように構成されてよい。また、第２部分３２は、特徴量３の第１部分３１以外の全ての部分であってよい。この場合、図４に示されるとおり、第１部分３１は、生成されるマスク４と特徴量３とを掛け算することにより算出されてよい（換言すると、第１部分３１は、マスク４及び特徴量３の積であってよい）。一方、第２部分３２は、生成されるマスク４の各要素の値を反転し、得られた反転マスクと特徴量３とを掛け算することにより算出されてよい。これに応じて、第１部分３１を抽出することは、第１部分３１以外の部分の要素を無効化する（例えば、「０」に置き換える）ことにより構成されてよい。第２部分３２の抽出についても同様である。

復号器５７は、特徴量３から入力データを復号化する（換言すると、特徴量３を入力として受け付け、入力された特徴量３から入力データを復号化することで得られる復号化データに対応する出力値を出力する）ように構成される。

図５Ａ及び図５Ｂに示されるとおり、機械学習を実施することは、上記第１訓練ステップ及び第２訓練ステップを含む。図５Ｂに示されるとおり、本実施形態に係る第２訓練ステップは、第１敵対推定器５３及び第２敵対推定器５４を訓練する第１ステップ、並びに符号器５０を訓練する第２ステップを交互に繰り返し実行することにより構成される。第１ステップでは、第１敵対推定器５３及び第２敵対推定器５４が、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１敵対推定器５３の第２推定タスクを遂行した結果が第２正解データ１２３に適合し、かつ第２敵対推定器５４の第１推定タスクを遂行した結果が第１正解データ１２２に適合するように訓練される。この第１ステップの間、符号器５０の各演算パラメータは固定される。一方、第２ステップでは、符号器５０が、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１敵対推定器５３の第２推定タスクを遂行した結果が第２正解データ１２３に適合しなくなるように、かつ第２敵対推定器５４の第１推定タスクを遂行した結果が第１正解データ１２２に適合しなくなるように訓練される。この第２ステップの間、第１敵対推定器５３及び第２敵対推定器５４の各演算パラメータは固定される。

第１ステップによれば、第１敵対推定器５３は、符号器５０により得られる特徴量３の第１部分３１から第２推定タスクを遂行する能力を獲得し、第２敵対推定器５４は、第２部分３２から第１推定タスクを遂行する能力を獲得する。一方、第２ステップによれば、第１部分３１に基づく第１敵対推定器５３の第２推定タスクが失敗し、かつ第２部分３２に基づく第２敵対推定器５４の第１推定タスクが失敗するような特徴量３に入力データを変換する能力を獲得するように符号器５０は訓練される。この第１ステップ及び第２ステップを交互に繰り返し実行することにより、各敵対推定器（５３、５４）の推定性能の向上に対応して、各敵対推定器（５３、５４）による各推定タスクが失敗するように、符号器５０により得られる第１部分３１には第２推定タスクに関する成分が含まれ難く、かつ第２部分３２には第１推定タスクに関する成分が含まれ難くすることができる。よって、特徴量３の第１部分３１及び第２正解データ１２３の間の相関性が低くなり、かつ特徴量３の第２部分３２及び第１正解データ１２２の間の相関性を低くなるように、符号器５０を訓練することができる。

なお、第２ステップの一例として、学習処理部１１２は、各学習データセット１２０について、第１正解データ１２２に対応するダミーデータ１２２１であって、対応する第１正解データ１２２とは異なる値で構成されるダミーデータ１２２１を取得してよい。学習処理部１１２は、各学習データセット１２０について、第２正解データ１２３に対応するダミーデータ１２３１であって、対応する第２正解データ１２３とは異なる値で構成されるダミーデータ１２３１を取得してよい。この場合、第１敵対推定器５３の第２推定タスクを遂行した結果が第２正解データ１２３に適合しなくなるように訓練することは、第１敵対推定器５３の第２推定タスクを遂行した結果がダミーデータ１２３１に適合するものとなるように訓練することにより構成されてよい。第２敵対推定器５４の第１推定タスクを遂行した結果が第１正解データ１２２に適合しなくなるように訓練することは、第２敵対推定器５４の第１推定タスクを遂行した結果がダミーデータ１２２１に適合するものとなるように訓練することにより構成されてよい。ただし、各推定タスクを遂行した結果が各正解データ（１２２、１２３）に適合しなくなるように符号器５０を訓練する方法は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。

本実施形態では、これらに加えて、機械学習を実施することは、第３訓練ステップ、第４訓練ステップ、及び第５訓練ステップを更に含んでいる。図５Ａに示されるとおり、第３訓練ステップでは、マスク生成器５６が、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１推定器５１の第１推定タスクを遂行した結果が第１正解データ１２２に適合するように訓練される。第４訓練ステップでは、マスク生成器５６が、生成されるマスク４の各要素の２値化が進むように訓練される。第５訓練ステップでは、符号器５０及び復号器５７が、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、復号器５７により得られる復号化データが訓練データ１２１に適合するように訓練される。第３～第５訓練ステップの少なくともいずれかは、第１訓練ステップ及び第２訓練ステップの少なくともいずれかと同時に実行されてよい。

以上の各訓練ステップの実行により、訓練済みの学習モデル５が生成される。図４に示されるとおり、保存処理部１１３は、訓練済みの学習モデル５に関する情報を学習結果データ１２９として生成する。そして、保存処理部１１３は、生成された学習結果データ１２９を所定の記憶領域に保存する。なお、学習結果データ１２９は、訓練済みの学習モデル５の構成要素であって、利用場面で使用されない構成要素に関する情報を含んでいなくてもよい。例えば、本実施形態では、訓練済みの第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、及び復号器５７は、推定装置２において使用されない。そのため、学習結果データ１２９は、これらに関する情報を含んでもよいし、含まなくてもよい。

（機械学習モデルの構成）
符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、マスク生成器５６、及び復号器５７それぞれには、機械学習を実施可能な任意のモデルが利用されてよい。図５Ａ及び図５Ｂに示されるとおり、本実施形態では、符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、及び復号器５７はそれぞれ、多層構造の全結合型ニューラルネットワークにより構成される。
符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、及び復号器５７はそれぞれ、入力層（５０１、５１１、５２１、５３１、５４１、５７１）、中間（隠れ）層（５０２、５１２、５２２、５３２、５４２、５７２）、及び出力層（５０３、５１３、５２３、５３３、５４３、５７３）を備えている。一方、マスク生成器５６は、１層のニューラルネットワークにより構成される。

ただし、それぞれの構造は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、各中間層（５０２、５１２、５２２、５３２、５４２、５７２）の数は、１つに限られなくてよく、２つ以上であってもよい。或いは、符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、及び復号器５７の少なくともいずれかは、２層以下のニューラルネットワークにより構成されてよい（すなわち、中間層は省略されてよい）。マスク生成器５６は、２層以上のニューラルネットワークにより構成されてよい。つまり、それぞれのニューラルネットワークを構成する層の数は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。更に、符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、マスク生成器５６、及び復号器５７の少なくともいずれかの組み合わせでは、少なくとも部分的に構造が一致してもよいし、一致していなくてもよい。また、図５Ａ及び図５Ｂの例では、それぞれのニューラルネットワークは分離されているが、処理の連続する２つ以上の構成要素は、一体のニューラルネットワークにより構成されてよい。

各層（５０１～５０３、５１１～５１３、５２１～５２３、５３１～５３３、５４１～５４３、５７１～５７３）及びマスク生成器５６の層はそれぞれ、１又は複数のニューロン（ノード）を備えている。それぞれに含まれるニューロン（ノード）の数は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。隣接する層のニューロン同士は適宜結合される。図５Ａ及び図５Ｂの例では、各ニューロンは、隣接する層の全てのニューロンと結合されている。しかしながら、各ニューロンの結合関係は、このような例に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。

各結合には、重み（結合荷重）が設定されている。各ニューロンには閾値が設定されており、基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。閾値は、活性化関数により表現されてもよい。この場合、各入力及び各重みの積の和を活性化関数に入力し、活性化関数の演算を実行することで、各ニューロンの出力が決定される。活性化関数の種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。それぞれに含まれる各ニューロン間の結合の重み及び各ニューロンの閾値は、それぞれの演算処理に利用される演算パラメータの一例である。

学習モデル５の各構成要素（符号器５０等）の演算パラメータの値は、上記機械学習の各訓練ステップにより調節される。具体的に、図５Ａに示されるとおり、第１訓練ステップでは、学習処理部１１２は、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、各推定タスクの遂行結果に対応する出力値を各推定器（５１、５２）の出力層（５１３、５２３）から取得する。順伝播の演算処理は、入力側から順に各層に含まれる各ニューロンの発火判定を行うことである。学習処理部１１２は、第１推定器５１から得られる出力値及び第１正解データ１２２の間の誤差が小さくなるように、符号器５０及び第１推定器５１の各演算パラメータの値を調節する。また、学習処理部１１２は、第２推定器５２から得られる出力値及び第２正解データ１２３の間の誤差が小さくなるように、符号器５０及び第２推定器５２の各演算パラメータの値を調節する。

図５Ｂに示されるとおり、第２訓練ステップの第１ステップでは、学習処理部１１２は、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、各推定タスクの遂行結果に対応する出力値を各敵対推定器（５３、５４）の出力層（５３３、５４３）から取得する。学習処理部１１２は、符号器５０の各演算パラメータの値を固定した上で、第１敵対推定器５３から得られる出力値及び第２正解データ１２３の間の誤差が小さくなるように、第１敵対推定器５３の各演算パラメータの値を調節する。また、学習処理部１１２は、第２敵対推定器５４から得られる出力値及び第１正解データ１２２の間の誤差が小さくなるように、第２敵対推定器５４の各演算パラメータの値を調節する。

第２訓練ステップの第２ステップでは、学習処理部１１２は、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、各推定タスクの遂行結果に対応する出力値を各敵対推定器（５３、５４）の出力層（５３３、５４３）から取得する。学習処理部１１２は、各敵対推定器（５３、５４）の各演算パラメータの値を固定した上で、第１敵対推定器５３から得られる出力値及び第２正解データ１２３の間の誤差が大きくなり、かつ第２敵対推定器５４から得られる出力値及び第１正解データ１２２の間の誤差が大きくなるように、符号器５０の各演算パラメータの値を調節する。一例として、学習処理部１１２は、第１敵対推定器５３から得られる出力値及びダミーデータ１２３１の間の誤差が小さくなり、かつ第２敵対推定器５４から得られる出力値及びダミーデータ１２２１の間の誤差が小さくなるように、符号器５０の各演算パラメータの値を調節する。

図５Ａに示されるとおり、第３訓練ステップでは、学習処理部１１２は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、第１推定器５１の出力層５１３から出力値を取得する。学習処理部１１２は、第１推定器５１から得られる出力値及び第１正解データ１２３の間の誤差が小さくなるように、マスク生成器５６の各演算パラメータの値を調節する。この第３訓練ステップは、第１訓練ステップの一部として実行されてもよい。

第４訓練ステップでは、学習処理部１１２は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、生成されたマスク４に対応する出力値をマスク生成器５６から取得する。学習処理部１１２は、各要素の２値化が進んでいないほど値の大きくなる指標を用いて、マスク生成器５６から得られる出力値の誤差を算出する。学習処理部１１２は、算出される誤差が小さくなるように、マスク生成器５６の各演算パラメータの値を調節する。この第４訓練ステップは、他の訓練ステップ内で実行されてもよい。

第５訓練ステップでは、学習処理部１１２は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、順伝播の演算処理を実行して、生成された復号化データに対応する出力値を復号器５７の出力層５７３から取得する。学習処理部１１２は、復号器５７から得られる出力値及び訓練データ１２１の間の誤差が小さくなるように、符号器５０及び復号器５７の各演算パラメータの値を調節する。各訓練ステップにおける各誤差の計算及び各演算パラメータの値の調節は、可能な範囲で同時に実行されてよい。

保存処理部１１３は、上記機械学習により構築された訓練済みの学習モデル５の各構成要素の構造及び演算パラメータの値を示す情報を学習結果データ１２９として生成する。構造は、例えば、ニューラルネットワークにおける入力層から出力層までの層の数、各層の種類、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等により特定されてよい。システム内でモデルの構造が共通化される場合、この構造に関する情報は学習結果データ１２９から省略されてもよい。また、利用場面で使用されない構成要素に関する情報は学習結果データ１２９から省略されてよい。保存処理部１１３は、生成された学習結果データ１２９を所定の記憶領域に保存する。

＜推定装置＞
図６は、本実施形態に係る推定装置２のソフトウェア構成の一例を模式的に例示する。推定装置２の制御部２１は、記憶部２２に記憶された推定プログラム８２をＲＡＭに展開する。そして、制御部２１は、ＣＰＵにより、ＲＡＭに展開された推定プログラム８２に含まれる命令を解釈及び実行して、各構成要素を制御する。これにより、図６に示されるとおり、本実施形態に係る推定装置２は、データ取得部２１１、推定部２１２、及び出力部２１３をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、推定装置２の各ソフトウェアモジュールは、上記モデル生成装置１と同様に、制御部２１（ＣＰＵ）により実現される。

データ取得部２１１は、推定タスクの遂行対象となる対象データ２２１を取得する。推定部２１２は、モデル生成装置１により生成された訓練済みの機械学習モデルを使用して、取得された対象データ２２１に対して推定タスクを遂行する。本実施形態では、推定部２１２は、学習結果データ１２９を保持することで、モデル生成装置１により生成された訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１を備えている。推定部２１２は、訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１を使用して、取得された対象データ２２１に対して第１推定タスクを遂行する。推定部２１２は、遂行する推定タスクに応じて、検査部、識別部、監視部、評価部、予測部等と読み替えられてよい。出力部２１３は、第１推定タスクを遂行した結果に関する情報を出力する。

＜その他＞
モデル生成装置１及び推定装置２の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、モデル生成装置１及び推定装置２の各ソフトウェアモジュールがいずれも汎用のＣＰＵによって実現される例について説明している。しかしながら、上記ソフトウェアモジュールの一部又は全部が、１又は複数の専用のプロセッサにより実現されてもよい。例えば、訓練データ１２１及び対象データ２２１それぞれに画像データが含まれる場合、上記ソフトウェアモジュールの一部又は全部が、グラフィックスプロセッシングユニットにより処理されてもよい。また、モデル生成装置１及び推定装置２それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換及び追加が行われてもよい。

§３動作例
［モデル生成装置］
図７は、本実施形態に係るモデル生成装置１の処理手順の一例を示すフローチャートである。以下で説明する処理手順は、本発明の「モデル生成方法」の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ１０１）
ステップＳ１０１では、制御部１１は、データ取得部１１１として動作し、訓練データ１２１、第１正解データ１２２、及び第２正解データ１２３の組み合わせによりそれぞれ構成される複数の学習データセット１２０を取得する。

各学習データセット１２０は適宜生成されてよい。例えば、実空間又は仮想空間において、推定タスクの対象となる所定種類のデータのサンプルを訓練データ１２１として取得してもよい。サンプルを取得する方法は適宜選択されてよい。一例として、所定種類のデータがセンシングデータである場合には、様々な条件でセンサにより対象を観測することで、訓練データ１２１を取得することができる。観測の対象は、習得させる推定タスクに応じて選択されてよい。取得された訓練データ１２１に対する第１推定タスク及び第２推定タスクそれぞれの正解を示す情報を、第１正解データ１２２及び第２正解データ１２３として、取得された訓練データ１２１に関連付ける。

第１推定タスク及び第２推定タスクはそれぞれ、実施の形態に応じて適宜選択されてよい。例えば、第１推定タスク及び第２推定タスクはそれぞれ、利用場面で遂行する推定タスク又はそれに関連する推定タスクから適宜選択されてよい。本実施形態では、第１推定タスクには、利用場面で遂行する推定タスクが選択される。一方、第２推定タスクは、第１推定タスク以外の推定タスクから適宜選択されてよい。利用場面で遂行する推定タスクが入力データの個体性を推定することではない場合、第２推定タスクは、入力データの個体性を推定することであってよい。学習の場面では、入力データは、訓練データ１２１であり、利用場面では、入力データは、対象データ２２１である。個体性を推定することは、個体性の識別及び回帰の少なくとも一方により構成されてよい。個体性の識別は、例えば、識別子、クラス等を識別することであってよい。また、個体性の回帰は、例えば、個体性に関する距離（例えば、識別子に基づくクラス間の距離）を推定することであってよい。

一例として、第２正解データ１２３は、訓練データ１２１の識別子を示すように構成されてよい。この場合、訓練データ１２１の個体性を推定することは、識別子を識別することであってよい。識別子は、訓練データ１２１毎に与えられる個体識別番号により構成されてよい。この場合、訓練データ１２１の識別子は、取得順、取得時間、ランダム等の所定の規則に従って適宜与えられてよい。

或いは、各学習データセット１２０の訓練データ１２１はクラス分けされてよく、識別子は、訓練データ１２１の属するクラスを示すように構成されてよい。クラスは、「カテゴリ」と読み替えられてもよい。クラス分けの方法は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。例えば、公知のクラスタリング手法、所定の規則（例えば、ランダム）に従って割り振る等の方法により、訓練データ１２１をクラス分けしてもよい。また、例えば、訓練データ１２１を適宜整列し、先頭から順に所定個ずつ同一グループに割り当てる等のように作為性を有する規則に従って、訓練データ１２１をクラス分けしてもよい。

或いは、識別子は、ハッシュ値により構成されてよい。ハッシュ値を算出する方法には、公知の方法が採用されてよい。ハッシュ値は、訓練データ１２１又は上記個体識別番号から算出されてよい。なお、ハッシュ値（すなわち、第２正解データ１２３）は、第１推定タスクの正解（すなわち、同一の学習データセット１２０に含まれる第１正解データ１２２）と一致しないように算出されるのが好ましい。その方法は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。その方法の一例として、第１正解データ１２２により示される正解が同一である学習データセット１２０を同一のグループに振り分け、グループ毎にハッシュ値を算出し、算出されたハッシュ値を第２正解データ１２３として利用してもよい。その他、第１正解データ１２２により示される正解を事前固定部分に含む値からハッシュ値を算出し、算出されたハッシュ値から対応する固定部分を除外することで部分ハッシュ値を導出し、導出された部分ハッシュ値を第２正解データ１２３として利用してもよい。

以上により、各学習データセット１２０を生成することができる。各学習データセット１２０は、コンピュータの動作により自動的に生成されてもよいし、少なくとも部分的にオペレータの操作を含むことで手動的に生成されてもよい。また、各学習データセット１２０の生成は、モデル生成装置１により行われてもよいし、モデル生成装置１以外の他のコンピュータにより行われてもよい。各学習データセット１２０をモデル生成装置１が生成する場合、制御部１１は、自動的に又は入力装置１５を介したオペレータの操作により手動的に上記一連の生成処理を実行することで、複数の学習データセット１２０を取得する。一方、各学習データセット１２０を他のコンピュータが生成する場合、制御部１１は、例えば、ネットワーク、記憶媒体９１等を介して、他のコンピュータにより生成された複数の学習データセット１２０を取得する。一部の学習データセット１２０がモデル生成装置１により生成され、その他の学習データセット１２０が１又は複数の他のコンピュータにより生成されてもよい。

取得する学習データセット１２０の件数は任意に選択されてよい。複数の学習データセット１２０を取得すると、制御部１１は、次のステップＳ１０２に処理を進める。

（ステップＳ１０２）
ステップＳ１０２では、制御部１１は、学習処理部１１２として動作し、取得された複数の学習データセット１２０を使用して、学習モデル５の機械学習を実施する。

図８は、本実施形態に係る学習モデル５に対するステップＳ１０２の機械学習に関するサブルーチンの処理手順の一例を示すフローチャートである。本実施形態に係るステップＳ１０２の処理は、以下のステップＳ１２１～ステップＳ１２７の処理を含む。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

なお、機械学習の処理対象となる学習モデル５の各構成要素（本実施形態では、符号器５０、第１推定器５１、第２推定器５２、第１敵対推定器５３、第２敵対推定器５４、マスク生成器５６、及び復号器５７）を構成するニューラルネットワークは適宜用意されてよい。各構成要素の構造（例えば、層の数、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等）、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。また、再学習を行う場合には、制御部１１は、過去の機械学習を行うことで得られた学習結果データに基づいて、学習モデル５の各構成要素を用意してもよい。

（ステップＳ１２１）
ステップＳ１２１では、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１推定器５１の第１推定タスクを遂行した結果が第１正解データ１２２に適合し、かつ第２推定器５２の第２推定タスクを遂行した結果が第２正解データ１２３に適合するように、符号器５０、第１推定器５１、及び第２推定器５２を訓練する。ステップＳ１２１は、第１訓練ステップの一例である。この機械学習の訓練処理には、例えば、バッチ勾配降下法、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。後述するステップＳ１２２～ステップＳ１２６における訓練処理についても同様である。

訓練処理の一例として、まず、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０、マスク生成器５６、第１推定器５１及び第２推定器５２の順伝播の演算処理を実行する。この演算処理の過程で、符号器５０の出力がマスク生成器５６に入力される。この符号器５０の出力は、特徴量３（すなわち、出力層５０３の出力）であってもよいし、符号器５０の演算途中の結果（例えば、出力層５０３の一個前の層の演算結果）であってもよい。すなわち、マスク生成器５６は、符号器５０の出力層５０３に接続されてもよいし、中間層５０２に接続されてよい。制御部１１は、符号器５０までの演算処理により、符号器５０の出力層５０３から特徴量３に対応する出力値を取得する。また、制御部１１は、マスク生成器５６までの演算処理により、生成されたマスク４に対応する出力値をマスク生成器５６から取得する。演算処理の過程において、制御部１１は、得られたマスク４を使用して、第１部分３１及び第２部分３２を特徴量３から抽出する。そして、制御部１１は、特徴量３の第１部分３１を第１推定器５１の入力層５１１に入力し、第２部分３２を第２推定器５２の入力層５２１に入力して、各推定器（５１、５２）の順伝播の演算処理を実行する。これにより、制御部１１は、各推定タスクの遂行結果に対応する出力値を各推定器（５１、５２）の出力層（５１３、５２３）から取得する。

制御部１１は、各学習データセット１２０について、第１推定器５１から得られる出力値及び第１正解データ１２２の間の第１誤差を算出する。同様に、制御部１１は、各学習データセット１２０について、第２推定器５２から得られる出力値及び第２正解データ１２３の間の第２誤差を算出する。各誤差（損失）の算出には、損失関数が用いられてよい。損失関数は、機械学習モデルの出力と正解との差分（すなわち、相違の程度）を評価する関数であり、出力値と正解（所望の値）との差分値が大きいほど、損失関数により算出される誤差の値は大きくなる。誤差の計算に利用する損失関数の種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。損失関数には、例えば、平均二乗誤差、交差エントロピー誤差等の公知の損失関数が用いられてよい。なお、第２推定タスクが個体性を回帰する（例えば、識別子に基づくクラス間の距離を推定する）ことである場合、第２誤差は、トリプレットロス等の計量学習に用いられる損失関数により算出されてよい。

制御部１１は、誤差逆伝播（Back propagation）法により、算出された第１誤差の勾配を用いて、第１推定器５１及び符号器５０の各演算パラメータ（各ニューロン間の結合の重み、各ニューロンの閾値等）の値の誤差を算出する。同様に、制御部１１は、算出された第２誤差の勾配を用いて、第２推定器５２及び符号器の各演算パラメータの値の誤差を算出する。制御部１１は、算出された各誤差に基づいて、符号器５０、第１推定器５１及び第２推定器５２の各演算パラメータの値を更新する。各演算パラメータの値を更新する程度は、学習率により調節されてよい。学習率は、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。

制御部１１は、上記一連の更新処理により、算出される各誤差の和が小さくなるように、符号器５０、第１推定器５１及び第２推定器５２の各演算パラメータの値を調整する。例えば、規定回数実行する、算出される誤差の和が閾値以下になる等の所定の条件を満たすまで、制御部１１は、上記一連の処理による各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えることで各推定器（５１、５２）から得られる各推定タスクの遂行結果が各正解データ（１２２、１２３）に適合するように、符号器５０及び各推定器（５１、５２）を訓練することができる。ステップＳ１２１の訓練処理が完了すると、制御部１１は、次のステップＳ１２２に処理を進める。

なお、この訓練処理における各誤差の勾配を逆伝播する過程で、制御部１１は、マスク生成器５６の各演算パラメータの値の誤差を更に算出し、算出された各誤差に基づいて、マスク生成器５６の各演算パラメータの値を更新してもよい。これにより、制御部１１は、符号器５０、第１推定器５１及び第２推定器５２と共に、マスク生成器５６の訓練を実行してもよい。

（ステップＳ１２２）
ステップＳ１２２では、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１敵対推定器５３の第２推定タスクを遂行した結果が第２正解データ１２３に適合し、かつ第２敵対推定器５４の第１推定タスクを遂行した結果が第１正解データ１２２に適合するように、第１敵対推定器５３及び第２敵対推定器５４を訓練する。ステップＳ１２２は、第２訓練ステップの第１ステップの一例である。

訓練処理の一例として、まず、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０、マスク生成器５６、第１敵対推定器５３、及び第２敵対推定器５４の順伝播の演算処理を実行する。第１推定器５１が第１敵対推定器５３に置き換わり、第２推定器５２が第２敵対推定器５４に置き換わる点を除き、この順伝播の演算処理は、上記ステップＳ１２１と同様に実行されてよい。これにより、制御部１１は、第２推定タスクの遂行結果に対応する出力値を第１敵対推定器５３の出力層５３３から取得し、第１推定タスクの遂行結果に対応する出力値を第２敵対推定器５４の出力層５４３から取得する。

次に、制御部１１は、各学習データセット１２０について、上記演算処理で第１敵対推定器５３から得られる出力値と第２正解データ１２３との間の第３誤差を算出する。同様に、制御部１１は、第２敵対推定器５４から得られる出力値と第１正解データ１２２との間の第４誤差を算出する。各誤差を算出するための損失関数は、ステップＳ１２１と同様、適宜選択されてよい。制御部１１は、誤差逆伝播法により、算出された第３誤差の勾配を第１敵対推定器５３の出力側から入力側に逆伝播して、第１敵対推定器５３の各演算パラメータの値の誤差を算出する。同様に、制御部１１は、誤差逆伝播法により、算出された第４誤差の勾配を第２敵対推定器５４の出力側から入力側に逆伝播して、第２敵対推定器５４の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、各敵対推定器（５３、５４）の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、符号器５０及びマスク生成器５６の各演算パラメータの値を固定した上で、上記一連の更新処理により、算出される誤差の和が小さくなるように、各敵対推定器（５３、５４）の各演算パラメータの値を調節する。ステップＳ１２１と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による各敵対推定器（５３、５４）の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えることで各敵対推定器（５３、５４）から得られる各推定タスクの遂行結果が各正解データ（１２３、１２２）に適合するように、各敵対推定器（５３、５４）を訓練することができる。各敵対推定器（５３、５４）の訓練処理が完了すると、制御部１１は、次のステップＳ１２３に処理を進める。

（ステップＳ１２３）
ステップＳ１２３では、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、第１敵対推定器５３の第２推定タスクを遂行した結果が第２正解データ１２３に適合しなくなるように、かつ第２敵対推定器５４の第１推定タスクを遂行した結果が第１正解データ１２２に適合しなくなるように、符号器５０を訓練する。ステップＳ１２３は、第２訓練ステップの第２ステップの一例である。

上記のとおり、この訓練処理では、各ダミーデータ（１２２１、１２３１）が用いられてよい。すなわち、制御部１１は、第１敵対推定器５３の第２推定タスクの遂行結果がダミーデータ１２３１に適合し、かつ第２敵対推定器５４の第１推定タスクの遂行結果がダミーデータ１２２１に適合するように、符号器５０を訓練してもよい。

各ダミーデータ（１２２１、１２３１）は、各学習データセット１２０の各正解データ（１２２、１２３）に対応して適宜取得されてよい。一例として、対象の学習データセットの各ダミーデータ（１２２１、１２３１）は、対象の学習データセットとは異なる他の学習データセットの各正解データ（１２２、１２３）により構成されてよい。他の学習データセットは、実施の形態に応じて適宜選択されてよい。選択方法の一例として、他の学習データセットは、複数の学習データセット１２０の中から、ランダム等の機械的な方法で選択されてもよい。その他の例として、各学習データセット１２０の訓練データ１２１に対する各正解データ（１２２、１２３）の対応関係が任意の方向にずらされてもよい。これにより、対象の学習データセットに割り当てられた他の学習データセットの各正解データ（１２２、１２３）が各ダミーデータ（１２２１、１２３１）として利用されてもよい。その他の例として、複数の学習データセット１２０の中から１つの学習データセットを任意の方法で選択し、選択された学習データセットの各正解データ（１２２、１２３）を全ての学習データセットの各ダミーデータ（１２２１、１２３１）として利用してもよい。この方法によれば、各ダミーデータ（１２２１、１２３１）を生成する計算量を抑えることができ、ステップＳ１２３の処理コストの低減を図ることができる。

なお、各ダミーデータ（１２２１、１２３１）を生成する方法は、このような例に限られなくてよく、実施の形態に応じて適宜決定されてよい。他の方法の一例として、制御部１１は、各正解データ（１２２、１２３）の値を反転することで、各ダミーデータ（１２２１、１２３１）を生成してもよい。更に他の方法の一例として、制御部１１は、各正解データ（１２２、１２３）の値とは相違するように、ランダム（例えば、乱数）等の機械的な方法で各ダミーデータ（１２２１、１２３１）を生成してもよい。複数の学習データセット１２０のうち各ダミーデータ（１２２１、１２３１）と各正解データ（１２２、１２３）とが一致する学習データセットが一部に存在してもよい。この場合、当該学習データセットをそのまま訓練に使用してもよいし、或いは当該学習データセットの各ダミーデータ（１２２１、１２３１）を適宜変更するようにしてもよい。

各ダミーデータ（１２２１、１２３１）を利用した訓練処理の一例として、まず、制御部１１は、上記ステップＳ１２２と同様に、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０、マスク生成器５６、第１敵対推定器５３、及び第２敵対推定器５４の順伝播の演算処理を実行する。これにより、制御部１１は、各推定タスクの遂行結果に対応する出力値を各敵対推定器（５３、５４）から取得する。

次に、制御部１１は、各学習データセット１２０について、上記演算処理で第１敵対推定器５３から得られる出力値とダミーデータ１２３１との間の第５誤差を算出する。同様に、制御部１１は、第２敵対推定器５４から得られる出力値とダミーデータ１２２１との間の第６誤差を算出する。各誤差を算出するための損失関数は、ステップＳ１２１等と同様に、適宜選択されてよい。制御部１１は、誤差逆伝播法により、算出された第５誤差の勾配を、第１敵対推定器５３を介して、符号器５０の各演算パラメータに逆伝播する。同様に、制御部１１は、誤差逆伝播法により、算出された第６誤差の勾配を、第２敵対推定器５４を介して、符号器５０の各演算パラメータに逆伝播する。これにより、制御部１１は、符号器５０の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出される各誤差に基づいて、符号器５０の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、各敵対推定器（５３、５４）の各演算パラメータの値を固定した上で、上記一連の更新処理により、算出される各誤差の和が小さくなるように、符号器５０の各演算パラメータの値を調節する。ステップＳ１２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による符号器５０の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えることで各敵対推定器（５３、５４）から得られる各推定タスクの遂行結果が各正解データ（１２３、１２２）に適合しなくなるように、符号器５０を訓練することができる。符号器５０の訓練処理が完了すると、制御部１１は、次のステップＳ１２４に処理を進める。

なお、ステップＳ１２３における符号器５０の訓練方法は、上記各ダミーデータ（１２２１、１２３１）を利用する方法に限られなくてよい。例えば、訓練処理において、制御部１１は、上記ステップＳ１２２と同様に、各学習データセット１２０について、第１敵対推定器５３から得られる出力値と第２正解データ１２３との間の誤差を算出してもよい。同様に、制御部１１は、第２敵対推定器５４から得られる出力値と第１正解データ１２２との間の誤差を算出してもよい。そして、制御部１１は、算出された各誤差の大きくなる方向に当該各誤差の勾配を算出し、誤差逆伝播法により、算出された各誤差の勾配を符号器５０の各演算パラメータに逆伝播してもよい。これにより、制御部１１は、符号器５０の各演算パラメータの値の誤差を算出し、算出された各誤差に基づいて、符号器５０の各演算パラメータの値を更新してもよい。

また、ステップＳ１２３の訓練処理における各誤差の勾配を逆伝播する過程で、制御部１１は、マスク生成器５６の各演算パラメータの値の誤差を更に算出し、算出された各誤差に基づいて、マスク生成器５６の各演算パラメータの値を更新してもよい。これにより、ステップＳ１２３において、制御部１１は、符号器５０と共に、マスク生成器５６の訓練を実行してもよい。更に、上記ステップＳ１２２及びステップＳ１２２の両方で、制御部１１は、各正解の出現頻度に応じた重みを各誤差に掛け合わせてもよい。或いは、制御部１１は、各正解の出現頻度に応じて、各学習データセット１２０のサンプリングレートを調整してもよい。これにより、ステップＳ１２２及びステップＳ１２２の訓練において、制御部１１は、各正解の組み合わせの偏りを補正してもよい。

（ステップＳ１２４）
ステップＳ１２４では、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えたときに、復号器５７により得られる復号化データが訓練データ１２１に適合するよう、符号器５０及び復号器５７を訓練する。ステップＳ１２４は、第５訓練ステップの一例である。

ステップＳ１２４の訓練処理の一例として、まず、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０及び復号器５７の順伝播の演算処理を実行する。これにより、制御部１１は、生成された復号化データに対応する出力値を復号器５７の出力層５７３から取得する。次に、制御部１１は、各学習データセット１２０について、復号器５７から得られる出力値と訓練データ１２１との間の第７誤差（再構成誤差）を算出する。第７誤差を算出するための損失関数は、ステップＳ１２１等と同様に、適宜選択されてよい。制御部１１は、誤差逆伝播法により、算出された第７誤差の勾配を復号器５７の出力層５７３から符号器５０の入力層５０１に逆伝播して、復号器５７及び符号器５０の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、符号器５０及び復号器５７の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される第７誤差の和が小さくなるように、符号器５０及び復号器５７の各演算パラメータの値を調節する。ステップＳ１２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による符号器５０及び復号器５７の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えることで復号器５７から得られる復号化データが訓練データ１２１に適合するように、符号器５０及び復号器５７を訓練することができる。符号器５０及び復号器５７の訓練処理が完了すると、制御部１１は、次のステップＳ１２５に処理を進める。

（ステップＳ１２５）
ステップＳ１２５では、制御部１１は、訓練データ１２１を符号器５０に与えたときに、第１推定器５１の第１推定タスクを遂行した結果が第１正解データ１２２に適合するように、マスク生成器５６を訓練する。ステップＳ１２５は、第３訓練ステップの一例である。

ステップＳ１２５の訓練処理の一例として、まず、制御部１１は、上記ステップＳ１２１と同様に、各学習データセット１２０について、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０、マスク生成器５６、及び第１推定器５１の順伝播の演算処理を実行する。これにより、制御部１１は、第１推定タスクの遂行結果に対応する出力値を第１推定器５１の出力層５１３から取得する。次に、制御部１１は、各学習データセット１２０について、第１推定器５１から得られる出力値と第１正解データ１２２との間の第８誤差を算出する。第８誤差を算出するための損失関数は、ステップＳ１２１等と同様に、適宜選択されてよい。制御部１１は、誤差逆伝播法により、算出された第８誤差の勾配を、第１推定器５１を介して、マスク生成器５６に逆伝播して、マスク生成器５６の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、マスク生成器５６の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される第８誤差の和が小さくなるように、マスク生成器５６の各演算パラメータの値を調節する。ステップＳ１２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理によるマスク生成器５６の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０について、訓練データ１２１を符号器５０に与えることで第１推定器５１から得られる第１推定タスクの遂行結果が第１正解データ１２２に適合するように、マスク生成器５６を訓練することができる。マスク生成器５６の訓練処理が完了すると、制御部１１は、ステップＳ１２６に処理を進める。

なお、このステップＳ１２５の訓練処理は、上記ステップＳ１２１の訓練処理の一部として実行されてよい。この場合、第８誤差は、上記第１誤差に置き換えられてよい。或いは、ステップＳ１２５の訓練処理は、上記ステップＳ１２１の訓練処理とは別に実行されてよい。この場合、ステップＳ１２５における第１推定器５１及び符号器５０の訓練は任意であってよい。一例として、ステップＳ１２５の訓練処理において、第１推定器５１の各演算パラメータの値は固定されてよい（すなわち、第１推定器５１の訓練は省略されてよい）。一方、制御部１１は、第８誤差の勾配を更に符号器５０の入力層５０１まで逆伝播して、符号器５０の各演算パラメータの値の誤差を更に算出し、算出された各誤差に基づいて、符号器５０の各演算パラメータの値を更新してもよい。

（ステップＳ１２６）
ステップＳ１２６では、制御部１１は、生成されるマスク４の各要素の２値化が進むように、マスク生成器５６を訓練する。ステップＳ１２６は、第４訓練ステップの一例である。

ステップＳ１２６の訓練処理の一例として、まず、制御部１１は、各学習データセット１２０の訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０及びマスク生成器５６の順伝播の演算処理を実行する。これにより、制御部１１は、生成されたマスク４に対応する出力値をマスク生成器５６から取得する。次に、制御部１１は、各要素の２値化が進んでいないほど値の大きくなる誤差関数を用いて、マスク生成器５６から得られた出力値の第９誤差を算出する。誤差関数には、例えば、以下の式１の関数が用いられてよい。

ｘ_i及びｘ_jは、マスク４（出力値）の各要素の値を示す。εは、０以外の定数であり、その値は、適宜与えられてよい。なお、２値化を進めるための誤差関数は、このような例に限定されなくてよく、実施の形態に応じて適宜設定されてよい。例えば、Ｌ０ノルム、Ｌ１ノルム又はその近似をマスク生成器５６の出力値に掛け算するように構成された誤差関数が、第９誤差の算出に用いられてよい。

制御部１１は、誤差逆伝播法により、算出された第９誤差の勾配をマスク生成器５６に逆伝播して、マスク生成器５６の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、マスク生成器５６の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される第９誤差の和が小さくなるように、マスク生成器５６の各演算パラメータの値を調節する。ステップＳ１２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理によるマスク生成器５６の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、生成されるマスク４の各要素の２値化が進むように、マスク生成器５６を訓練することができる。２値化を進めるための訓練処理が完了すると、制御部１１は、ステップＳ１２７に処理を進める。

なお、このステップＳ１２６の訓練処理において、制御部１１は、第９誤差の勾配を更に符号器５０の入力層５０１まで逆伝播して、符号器５０の各演算パラメータの値の誤差を更に算出し、算出された各誤差に基づいて、符号器５０の各演算パラメータの値を更新してもよい。これにより、制御部１１は、マスク生成器５６と共に、マスク４の各要素の２値化が進むように、符号器５０の訓練を実行してもよい。この符号器５０の訓練により、マスク４の各要素の２値化の促進を期待することができる。また、このステップＳ１２６の訓練処理は、上記ステップＳ１２１～ステップＳ１２５の少なくともいずれかの訓練処理と共に実行されてよい。

（ステップＳ１２７）
ステップＳ１２７では、制御部１１は、ステップＳ１２１～ステップＳ１２６の訓練処理を繰り返すか否かを判定する。判定の基準は、実施の形態に応じて適宜設定されてよい。一例として、訓練処理を繰り返す規定回数が与えられてもよい。規定回数は、例えば、オペレータの指定により与えられてもよいし、プログラム内の設定値として与えられてもよい。この場合、制御部１１は、ステップＳ１２１～ステップＳ１２６の訓練処理を実行した回数が規定回数に到達したか否かを判定する。実行回数が規定回数に到達していないと判定した場合、制御部１１は、ステップＳ１２１に処理を戻し、ステップＳ１２１～ステップＳ１２６の訓練処理を再度実行する。これにより、本実施形態では、ステップＳ１２２及びステップＳ１２３が交互に繰り返し実行される。一方、実行回数が規定回数に到達していると判定した場合、制御部１１は、学習モデル５の機械学習の処理を完了し、次のステップＳ１０３に処理を進める。

なお、上記ステップＳ１２１～ステップＳ１２６の処理順序は、上記の例に限られなくてもよく、実施の形態に応じて適宜適宜変更されてよい。例えば、ステップＳ１２３の処理は、ステップＳ１２２の処理の後に実行されてもよい。ステップＳ１２１及びステップＳ１２４～ステップＳ１２６のうちの少なくともいずれかは、ステップＳ１２７によるループ外で実行されてもよい。各訓練処理における各構成要素の訓練は、個別に実行されてもよい。上記ステップＳ１２１～ステップＳ１２６の少なくともいずれかの組み合わせは同時に実行されてもよい。すなわち、上記ステップＳ１２１～ステップＳ１２６における各誤差の計算及び各演算パラメータの値の調節は、可能な範囲で同時に実行されてよい。この場合、順伝播の演算処理は可能な限り共通に実行されてよく、また、各誤差の勾配は、重み付き和により合計されてよい。これにより、機械学習の処理の効率化を図ることができる。また、制御部１１は、ステップＳ１２１～ステップＳ１２６の各訓練処理において、各演算パラメータの値の調節を繰り返すのではなく、ステップＳ１２７の処理により、ステップＳ１２１～ステップＳ１２６による各演算パラメータの値の調節を繰り返すようにしてもよい。

（ステップＳ１０３）
図７に戻り、ステップＳ１０３では、制御部１１は、保存処理部１１３として動作し、ステップＳ１０２による機械学習の結果に関する情報を学習結果データ１２９として生成する。本実施形態では、制御部１１は、機械学習により構築された訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１の構造及び各演算パラメータの値を示す情報を学習結果データ１２９として生成する。そして、制御部１１は、生成された学習結果データ１２９を所定の記憶領域に保存する。

所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、外部記憶装置、記憶メディア又はこれらの組み合わせであってよい。記憶メディアは、例えば、ＣＤ、ＤＶＤ等であってよく、制御部１１は、ドライブ１７を介して記憶メディアに学習結果データ１２９を格納してもよい。外部記憶装置は、例えば、ＮＡＳ（Network Attached Storage）等のデータサーバであってよい。この場合、制御部１１は、通信インタフェース１３を利用して、ネットワークを介してデータサーバに学習結果データ１２９を格納してもよい。また、外部記憶装置は、例えば、外部インタフェース１４を介してモデル生成装置１に接続された外付けの記憶装置であってもよい。学習結果データ１２９の保存が完了すると、制御部１１は、本動作例に係る処理手順を終了する。

なお、生成された学習結果データ１２９は、任意のタイミングで推定装置２に提供されてよい。例えば、制御部１１は、ステップＳ１０３の処理として又はステップＳ１０３の処理とは別に、学習結果データ１２９を転送してもよい。推定装置２は、この転送を受信することで、学習結果データ１２９を取得してもよい。また、推定装置２は、通信インタフェース２３を利用して、モデル生成装置１又はデータサーバにネットワークを介してアクセスすることで、学習結果データ１２９を取得してもよい。また、例えば、推定装置２は、記憶媒体９２を介して、学習結果データ１２９を取得してもよい。また、例えば、学習結果データ１２９は、推定装置２に予め組み込まれてもよい。

更に、制御部１１は、上記ステップＳ１０１～ステップＳ１０３の処理を定期又は不定期に繰り返すことで、学習結果データ１２９を更新又は新たに生成してもよい。この繰り返しの際には、複数の学習データセット１２０の少なくとも一部の変更、修正、追加、削除等が適宜実行されてよい。そして、制御部１１は、更新した又は新たに生成した学習結果データ１２９を任意の方法で推定装置２に提供することで、推定装置２の保持する学習結果データ１２９を更新してもよい。

［推定装置］
図９は、本実施形態に係る推定装置２の処理手順の一例を示すフローチャートである。以下で説明する処理手順は、推定方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各ステップは可能な限り変更されてよい。更に、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ２０１）
ステップＳ２０１では、制御部２１は、データ取得部２１１として動作し、対象データ２２１を取得する。対象データ２２１は、第１推定タスクの遂行対象となる所定種類のデータのサンプルである。対象データ２２１を取得する方法は、データの種類に応じて適宜決定されてよい。対象データ２２１がセンシングデータである場合、制御部２１は、第１推定タスクに関する対象をセンサにより観測することで、対象データ２２１を取得することができる。対象データ２２１を取得すると、制御部２１は、次のステップＳ２０２に処理を進める。

（ステップＳ２０２）
ステップＳ２０２では、制御部２１は、推定部２１２として動作し、学習結果データ１２９を参照して、訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１の設定を行う。制御部２１は、取得された対象データ２２１を訓練済みの符号器５０の入力層５０１に入力し、訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１の順伝播の演算処理を実行する。この演算処理の過程において、制御部２１は、訓練済みの符号器５０までの演算処理により、符号器５０の出力層５０３から対象データ２２１の特徴量３に対応する出力値を取得する。また、制御部２１は、訓練済みのマスク生成器５６までの演算処理により、対象データ２２１より生成されたマスク４に対応する出力値を取得する。制御部２１は、得られたマスク４を使用して、第１部分３１を特徴量３から抽出する。そして、制御部２１は、特徴量３の第１部分３１を訓練済みの第１推定器５１の入力層５１１に入力し、訓練済みの第１推定器５１の順伝播の演算処理を実行する。これにより、制御部２１は、対象データ２２１に対して第１推定タスクを遂行した結果に対応する出力値を訓練済みの第１推定器５１の出力層５１３から取得することができる。すなわち、本実施形態では、対象データ２２１に対する第１推定タスクを遂行することは、対象データ２２１を符号器５０に与えて、訓練済みの符号器５０、マスク生成器５６、及び第１推定器５１の順伝播の演算処理を実行することにより達成される。第１推定タスクの遂行が完了すると、制御部２１は、次のステップＳ２０３に処理を進める。

（ステップＳ２０３）
ステップＳ２０３では、制御部２１は、出力部２１３として動作し、第１推定タスクを遂行した結果に関する情報を出力する。

出力先及び出力する情報の内容はそれぞれ、実施の形態に応じて適宜決定されてよい。例えば、制御部２１は、ステップＳ２０２により得られる第１推定タスクを遂行した結果をそのまま出力装置２６に出力してもよい。また、例えば、制御部２１は、第１推定タスクを遂行した結果に基づいて、何らかの情報処理を実行してもよい。そして、制御部２１は、その情報処理を実行した結果を、第１推定タスクの遂行結果に関する情報として出力してもよい。この情報処理を実行した結果の出力には、第１推定タスクの遂行結果に応じて特定のメッセージを出力すること、遂行結果に応じて制御対象装置の動作を制御すること等が含まれてよい。出力先は、例えば、出力装置２６、他のコンピュータの出力装置、制御対象装置等であってよい。

第１推定タスクの遂行結果に関する情報の出力が完了すると、制御部２１は、本動作例に係る処理手順を終了する。なお、所定期間の間、制御部２１は、ステップＳ２０１～ステップＳ２０３の一連の情報処理を継続的に繰り返し実行してもよい。繰り返すタイミングは、任意であってよい。これにより、推定装置２は、第１推定タスクを継続的に遂行してもよい。

［特徴］
以上のとおり、本実施形態では、上記ステップＳ１２１～ステップＳ１２３の訓練処理により、符号器５０により得られる特徴量３に各推定タスクに関連する情報が含まれるようにしつつ、特徴量３の第１部分３１と第２部分３２との間で情報の排他性を高めることができる。これにより、訓練された符号器５０により得られる特徴量３の第１部分３１及び第２部分３２の説明性を高めることができる。よって、本実施形態によれば、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。推定装置２では、第１推定タスクの遂行に、第２推定タスクに関連する情報による影響を及び難くすることができる。

また、本実施形態では、学習モデル５は、マスク生成器５６を含んでいる。ステップＳ１２５におけるマスク生成器５６の訓練処理により、特徴量３の第１部分３１の範囲を訓練データ１２１に適応的に決定することができる。これにより、訓練済みの第１推定器５１による第１推定タスクの遂行精度を担保した上で、特徴量３の第１部分３１の情報量を最適化することができる。その結果、第１推定タスクの計算時間の効率化を期待することができる。また、生成されるマスク４の要素が中間的な値をとることにより、第１推定タスク及び第２推定タスクの両方に寄与する情報を第１部分３１及び第２部分３２それぞれに抽出可能であることを期待することができる。その結果、各推定タスクの遂行精度の向上を図ることができる。更には、本実施形態では、ステップＳ１２６の訓練処理により、特徴量３の第１部分３１の情報量の最適化（すなわち、訓練済みのマスク生成器５６の生成）を促進することができる。

また、本実施形態では、学習モデル５は、復号器５７を含んでいる。ステップＳ１２４における符号器５０及び復号器５７の訓練処理により、訓練データ１２１を特徴量３から復元可能であることを保証することができる。これにより、符号器５０により得られる特徴量３において、訓練データ１２１に関する情報の欠損を抑制することができる。したがって、本実施形態によれば、訓練済みの符号器５０により入力データを特徴量３に変換する過程での情報の欠損を抑えることができるため、推定装置２において使用される訓練済み機械学習モデルの汎化性及びロバスト性の向上を図ることができる。

また、本実施形態では、第２推定タスクは、訓練データ１２１の個体性を推定することであってよい。訓練データ１２１に含まれるノイズは、特定の個体特有に表れる現象であるため、訓練データ１２１の個体性に対応する。本実施形態によれば、訓練された符号器５０により得られる特徴量３の第１部分３１に、訓練データ１２１の個体性に関する情報（すなわち、ノイズに対応し得る情報）が含まれ難くすることができる。これによって、個体性に関する情報が第１推定タスクの遂行に影響を及ぼすことを抑制することができ、第１推定タスクを遂行する訓練済みの機械学習モデル（符号器５０、マスク生成器５６、及び第１推定器５１）の汎化性能の向上を図ることができる。換言すると、推定装置２において、未知の環境で得られる対象データ２２１に対する第１推定タスクの遂行精度の向上を期待することができる。なお、個体性を推定することは、訓練データ１２１の識別子を識別することであってよい。これにより、第２推定タスクを適切に設定することができる。また、識別子は、ハッシュ値又はクラスを示すように構成されてよい。これにより、学習データセット１２０の数に応じた第２正解データ１２３の情報量の増大を緩和することができる。その結果、第２推定タスクに関する計算量の低減及び機械学習の処理の効率化を期待することができる。

§４変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良又は変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。

＜４．１＞
上記実施形態では、第１推定タスクには、推定装置２（すなわち、利用場面）において遂行する推定タスクが設定される。しかしながら、利用場面で遂行される推定タスクは、第１推定タスクに限られなくてよい。その他の一例として、第２推定タスクが、利用場面で遂行されてもよい。更にその他の一例として、第１推定タスク及び第２推定タスク以外の他の推定タスクが利用場面で遂行されてもよい。この場合、利用場面で遂行する他の推定タスクは、複数の推定タスクそれぞれにより推定される特徴に関する情報から更に高次の特徴を推定する高次推定タスクであってよい。「高次」とは、２つ以上の推定タスクの推定結果又はその遂行に利用した情報からより複雑又は抽象的な特徴を推定することに相当する。一例として、第１推定タスク及び第２推定タスクの少なくとも一方は、入力データに含まれる対象物の数をカウントする、対象物の種別を識別する等のより原始的（或いは、単純）な特徴を推定することであってよい。第１推定タスク及び第２推定タスクが共に原始的な特徴を推定することである場合には、第１推定タスク及び第２推定タスクは、原始的な特徴の異なる項目を推定するように設定されてよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、例えば、センシングデータ等の入力データの比較的に近い未来又は過去の値（例えば、許容可能な精度で現在値から推定可能な未来又は過去の値）を推定することであってよい。第１推定タスク及び第２推定タスクが共に入力データの未来又は過去の値を推定することである場合には、第１推定タスク及び第２推定タスクは、互いに異なる時間の値を推定するように設定されてよい。これに対応して、高次推定タスクは、その推定結果に基づいて、自動運転の戦略を決定する等のより高度（複雑又は抽象的）な特徴を推定することであってよい。なお、第１推定タスク及び第２推定タスクも、より低次の推定タスクに対する高次推定タスクであってよい。この点を考慮して、第１推定タスク及び第２推定タスクは「ｋ次推定タスク」と読み替えられてよく、高次推定タスクは「ｋ＋１次推定タスク」と読み替えられてよい（ｋは１以上の自然数）。

図１０Ａは、高次推定タスクが利用場面で遂行される変形例に係る学習モデル５Ｚの機械学習の処理過程の一例を模式的に例示する。本変形例に係る学習モデル５Ｚは、高次推定器５８を更に含む点を除き、上記学習モデル５と同様に構成されてよい。高次推定器５８は、特徴量３の第１部分３１及び第２部分３２の入力を受け付け、入力された第１部分３１及び第２部分３２に基づいて、入力データに対する高次推定タスクを遂行する（換言すると、高次推定タスクを遂行した結果に対応する出力値を出力する）ように構成される。

上記各推定器（５１、５２）と同様に、高次推定器５８の出力値の形式は、高次推定タスクの遂行結果を直接的又は間接的に示すように適宜決定されてよい。また、高次推定器５８を構成する機械学習モデルの種類は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。図１０Ａの例では、高次推定器５８は、上記実施形態に係る各推定器（５１、５２）と同様に、多層構造の全結合型ニューラルネットワークにより構成される。高次推定器５８は、入力層５８１、中間（隠れ）層５８２、及び出力層５８３を備える。ただし、上記学習モデル５の各構成要素と同様に、高次推定器５８の構造は、このような例に限定されなくてよく、実施の形態に応じて適宜決定されてよい。高次推定器５８の層の数は、実施の形態に応じて適宜決定されてよい。各層５８１～５８３は、１又は複数のニューロン（ノード）を備えている。各ニューロンの結合関係は、実施の形態に応じて適宜設定されてよい。各層５８１～５８３は、上記実施形態と同様に構成されてよい。

本変形例に係る学習モデル５Ｚの機械学習は、上記モデル生成装置１により実施可能である。上記ステップＳ１０１において、制御部１１は、複数の学習データセット１２０Ｚを取得する。各学習データセット１２０Ｚは、訓練データ１２１に対する高次推定タスクの正解を示す高次正解データ１２４を更に備える点を除き、上記各学習データセット１２０と同様に構成されてよい。高次正解データ１２４のデータ形式は、高次推定タスク、機械学習の方法、学習モデル５Ｚの構成等に応じて適宜決定されてよい。

また、上記ステップＳ１０２における機械学習を実施することは、高次推定器５８を訓練する高次訓練ステップを更に含む点を除き、上記実施形態と同様に構成されてよい。高次訓練ステップでは、制御部１１は、各学習データセット１２０Ｚについて、訓練データ１２１を符号器５０に与えたときに、高次推定器５８の高次推定タスクを遂行した結果が高次正解データ１２４に適合するように、高次推定器５８を訓練する。上記ステップＳ１２１等と同様に、この機械学習の訓練処理には、例えば、バッチ勾配降下法、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。

訓練処理の一例として、まず、制御部１１は、各学習データセット１２０Ｚについて、訓練データ１２１を符号器５０の入力層５０１に入力し、符号器５０、マスク生成器５６、及び高次推定器５８の順伝播の演算処理を実行する。これにより、制御部１１は、高次推定タスクの遂行結果に対応する出力値を高次推定器５８の出力層５８３から取得する。なお、この訓練処理において、マスク生成器５６の処理は省略されてよい。

次に、制御部１１は、各学習データセット１２０Ｚについて、上記演算処理で高次推定器５８から得られる出力値と高次正解データ１２４との間の誤差を算出する。誤差を算出するための損失関数は、上記ステップＳ１２１等と同様に、適宜選択されてよい。制御部１１は、誤差逆伝播法により、算出された勾配を高次推定器５８の出力側から入力側に逆伝播して、高次推定器５８の各演算パラメータの値の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、高次推定器５８の各演算パラメータの値を更新する。この各演算パラメータの値を更新する程度は、学習率により調節されてよい。

制御部１１は、上記一連の更新処理により、算出される誤差の和が小さくなるように、高次推定器５８の各演算パラメータの値を調節する。上記ステップＳ１２１等と同様に、制御部１１は、所定の条件を満たすまで、上記一連の処理による高次推定器５８の各演算パラメータの値の調節を繰り返してもよい。これにより、制御部１１は、各学習データセット１２０Ｚについて、訓練データ１２１を符号器５０に与えることで高次推定器５８から得られる高次推定タスクの遂行結果が高次正解データ１２４に適合するように、高次推定器５８を訓練することができる。

この高次訓練ステップを実行するタイミングは、実施の形態に応じて適宜決定されてよい。例えば、高次訓練ステップは、ステップＳ１２７によるループ内で（すなわち、ステップＳ１２１～ステップＳ１２６と共に）実行されてもよいし、ステップＳ１２７の後に実行されてもよい。ループ内で実行される場合、高次訓練ステップは、上記ステップＳ１２１等と同等に取り扱われてよい。

なお、高次訓練ステップにおいて、制御部１１は、誤差の勾配を更に符号器５０の入力層５０１まで逆伝播して、符号器５０の各演算パラメータの値の誤差を更に算出し、算出された各誤差に基づいて、符号器５０の各演算パラメータの値を更新してもよい。これにより、制御部１１は、高次推定器５８と共に符号器５０を訓練してもよい。マスク生成器５６も同様に高次推定器５８と共に訓練されてよい。

上記ステップＳ１０３では、制御部１１は、機械学習により構築された訓練済みの符号器５０、マスク生成器５６、及び高次推定器５８の構造及び各演算パラメータの値を示す情報を学習結果データ１２９Ｚとして生成する。そして、制御部１１は、生成された学習結果データ１２９Ｚを所定の記憶領域に保存する。生成された学習結果データ１２９Ｚは、任意のタイミングで利用装置（例えば、推定装置２）に提供されてよい。

なお、高次推定タスクの演算の過程でマスク生成器５６の処理を省略する場合には、訓練済みのマスク生成器５６に関する情報は、学習結果データ１２９Ｚから省略されてよい。また、学習結果データ１２９Ｚは、訓練済みの学習モデル５Ｚの他の構成要素に関する情報を含んでもよい。

図１０Ｂは、本変形例に係る訓練済みの学習モデル５Ｚの利用場面の一例を模式的に例示する。訓練済みの高次推定器５８を使用した高次推定タスクの遂行は、上記推定装置２により実行可能である。上記ステップＳ２０２では、制御部２１は、訓練済みの符号器５０、マスク生成器５６、及び高次推定器５８を使用して、取得された対象データ２２１に対して高次推定タスクを遂行する。すなわち、制御部２１は、学習結果データ１２９Ｚを参照して、訓練済みの符号器５０、マスク生成器５６、及び高次推定器５８の設定を行う。制御部２１は、取得された対象データ２２１を訓練済みの符号器５０の入力層５０１に入力し、訓練済みの符号器５０、マスク生成器５６、及び高次推定器５８の順伝播の演算処理を実行する。これにより、制御部２１は、対象データ２２１に対して高次推定タスクを遂行した結果に対応する出力値を訓練済みの高次推定器５８から取得することができる。これらの点を除き、推定装置２は、上記実施形態と同様の処理手順により、高次推定タスクに関する処理を実行することができる。なお、ステップＳ２０２において、不要な場合には、訓練済みのマスク生成器５６は省略されてよい。

本変形例によれば、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの機械学習モデル（符号器５０、マスク生成器５６、及び高次推定器５８）を構築することができる。すなわち、推定装置２において、高次推定タスクの遂行結果に誤りが生じた場合、特徴量３の各部分（３１、３２）を参照する。各部分（３１、３２）の参照には、訓練済みの各推定器（５１、５２）が用いられてもよい。参照の結果、第１部分３１及び第２部分３２の少なくともいずれかが適切な値ではない（すなわち、高次推定タスクよりも低次の第１推定タスク及び第２推定タスクに誤りが生じている）ことが判明した場合、そのことが、高次推定タスクの遂行結果に誤りが生じた原因であると解明することができる。また、高次推定器５８の推定結果に誤りが生じた場合に、第１部分３１及び第２部分３２のいずれかが適切ではないと疑わしいことが判明したと想定する。この場合に、第１部分３１及び第２部分３２のうちの疑わしい方を取り除いた後、再度、高次推定器５８の学習を行い、新たに生成された訓練済みの高次推定器５８により高次推定タスクを遂行する。或いは、第１部分３１及び第２部分３２のうちの疑わしい方を取り除いた後、取り除いた方の部分を適正な値に補完し、高次推定器５８により高次推定タスクを遂行する。この遂行の結果が正しかった場合、特徴量３の取り除いた部分が、誤りの原因であると解明することができる。つまり、本変形例によれば、第１部分３１及び第２部分３２の間の情報の排他性を高めることで特徴量３の説明性を高めたことにより、推定タスクの遂行に問題が生じた際にその原因の検証を行うことができるようになる。

＜４．２＞
上記実施形態では、特徴量３から抽出される部分、対応する推定タスク、及び推定器の数はそれぞれ２つである。しかしながら、それぞれの数は、２つに限られなくてよく、３つ以上であってよい。

図１１は、本変形例に係る学習モデルの一例を模式的に例示する。本変形例では、ｎ個の推定タスクが設定される。ｎは、３以上の自然数であってよい。ｎ個の推定タスクのいずれか１つは、上記第２推定タスクと同様に、入力データの個体性を推定することであってよい。本変形例に係る学習モデルは、推定タスクの数に応じて構成要素の数が変更される点を除き、上記実施形態に係る学習モデル５と同様に構成されてよい。本変形例に係る学習モデルは、上記符号器５０及びｎ個の推定器５１０１～５１０ｎを含む。各推定器５１０１～５１０ｎは、上記各推定器（５１、５２）と同様に構成されてよい。

特徴量３は、各推定タスクにそれぞれ対応するｎ個の部分３１１～３１ｎを含んでよい。各部分３１１～３１ｎを抽出するためのマスク４を生成するマスク生成器５６の数は、実施の形態に応じて適宜決定されてよい。例えば、１つのマスク生成器５６が、各部分３１１～３１ｎをそれぞれ抽出するためのｎ個のマスク４を生成するように構成されてよい。また、例えば、学習モデルは、ｎ－１個のマスク生成器５６を含み、各マスク生成器５６は、第１～第ｎ－１部分を抽出するためのマスク４を生成するように構成されてよい。この場合、第ｎ部分３１ｎは、特徴量３の第１～第ｎ－１部分以外の部分から抽出されてよい。

各推定器５１０１～５１０ｎは、各推定タスクに割り当てられる。各推定器５１０１～５１０ｎは、特徴量３の自身に割り当てられた推定タスクに対応する部分３１１～３１ｎの入力を受け付け、入力された部分３１１～３１ｎに基づいて、入力データに対する割り当てられた推定タスクを遂行するように構成される。図１１の例では、第１推定器５１０１は、第１部分３１１の入力を受け付け、第１推定タスクを遂行するように構成される。第ｎ推定器５１０ｎは、第ｎ部分３１ｎの入力を受け付け、第ｎ推定タスクを遂行するように構成される。

また、第２訓練ステップを敵対的学習により実現するため、本変形例に係る学習モデルは、各推定器５１０１～５１０ｎにそれぞれ対応するｎ個の敵対推定器５３０１～５３０ｎを含む。各敵対推定器５３０１～５３０ｎは、特徴量３の対応する部分３１１～３１ｎの入力を受け付け、入力された部分３１１～３１ｎに基づいて、対応する推定器５１０１～５１０ｎに割り当てられている推定タスク以外のｎ－１個の推定タスクを遂行するように構成される。図１１の例では、第１敵対推定器５３０１は、第１部分３１１の入力を受け付け、第２～第ｎ推定タスクを遂行するように構成される。第ｎ敵対推定器５３０ｎは、第ｎ部分３１ｎの入力を受け付け、第１～第ｎ－１推定タスクを遂行するように構成される。各敵対推定器５３０１～５３０ｎは、上記各敵対推定器（５３、５４）と同様に構成されてよい。なお、敵対推定器の数は、このような例に限定されなくてよい。例えば、敵対推定器は、推定タスク毎に設定されてもよい。すなわち、各推定器５１０１～５１０ｎにｎ－１個の敵対推定器が設定されてもよい。

本変形例に係る学習モデルの機械学習は、上記モデル生成装置１により実施可能である。上記ステップＳ１０１では、制御部１１は、複数の学習データセット１２０Ｙを取得する。本変形例に係る各学習データセット１２０Ｙは、訓練データ１２１、及び訓練データ１２１に対するｎ個の推定タスクそれぞれの正解をそれぞれ示すｎ件の正解データ１２２１～１２２ｎの組み合わせにより構成される。各正解データ１２２１～１２２ｎは、上記実施形態に係る各正解データ（１２２、１２３）に対応する。

本変形例に係る機械学習を実施することは、構成要素の数の点を除き、上記実施形態に係るステップＳ１０２と同様に構成されてよい。ステップＳ１２１では、制御部１１は、各学習データセット１２０Ｙについて、訓練データ１２１を符号器５０に与えた時に、各推定器５１０１～５１０ｎの各推定タスクを遂行した結果が対応する正解データ１２２１～１２２ｎに適合するように、符号器５０及び各推定器５１０１～５１０ｎを訓練する。ステップＳ１２２では、制御部１１は、各学習データセット１２０Ｙについて、訓練データ１２１を符号器５０に与えたときに、各敵対推定器５３０１～５３０ｎにより上記ｎ－１個の推定タスクを遂行した結果が当該ｎ－１個の推定タスクそれぞれの正解をそれぞれ示すｎ－１件の正解データ（例えば、第１敵対推定器５３０１の場合、第２～第ｎ正解データ）に適合するように、各敵対推定器５３０１～５３０ｎを訓練する。一方、ステップＳ１２３では、制御部１１は、各学習データセット１２０Ｙについて、訓練データ１２１を符号器５０に与えたときに、各敵対推定器５３０１～５３０ｎにより上記ｎ－１個の推定タスクを遂行した結果が当該ｎ－１個の推定タスクそれぞれの正解をそれぞれ示すｎ－１件の正解データに適合しなくなるように、符号器５０を訓練する。制御部１１は、ステップＳ１２２及びステップＳ１２３を交互に繰り返し実行する。これにより、制御部１１は、各学習データセット１２０Ｙについて、特徴量３の各部分３１１～３１ｎと各部分３１１～３１ｎに対応する推定タスクに対応する正解データ１２２１～１２２ｎを除くｎ－１件の（他の）正解データ（例えば、第１部分３１１の場合、第２～第ｎ正解データ）との間の相関性が低くなるように、符号器５０を訓練することができる。

本変形例に係る訓練済みの学習モデルは、利用場面において推定タスクを遂行するために適宜使用されてよい。例えば、推定装置２は、ｎ個の訓練済みの推定器５１０１～５１０ｎのいずれか及び訓練済みの符号器５０を使用して、ｎ個の推定タスクのいずれかを対象データ２２１に対して遂行してもよい。また、上記＜４．１＞と同様に、ｎ個の推定タスク以外の高次推定タスクが設定されてよく、本変形例に係る学習モデルは、高次推定器を更に備えてもよい。高次推定タスクは、ｎ個の推定タスクのうちの少なくとも２個の推定タスクに対して設定されてよい。この場合、高次推定器は、特徴量３のｎ個の部分３１１～３１ｎの少なくとも２つの入力を受け付け、入力されたｎ個の部分３１１～３１ｎの少なくとも２つに基づいて、入力データに対する高次推定タスクを遂行するように構成されてよい。この学習モデルの機械学習を実施することは、上記高次訓練ステップを更に含んでよい。推定装置２は、訓練済みの符号器５０及び高次推定器を使用して、対象データ２２１に対して高次推定タスクを遂行してもよい。

本変形例によれば、演算内容の説明性が更に高い訓練済みの機械学習モデルを生成することができる。推定装置２では、いずれかの推定タスクを遂行する際に、他の推定タスクに関連する情報による影響を及び難くすることができる。また、高次推定器を設ける形態では、高次推定タスクの遂行結果に誤りが生じた場合に、各部分３１１～３１ｎを参照することで、その誤りの生じた原因を解明可能であることを期待することができる。また、高次推定タスクの遂行結果に誤りが生じた際に、特徴量３のｎ個の部分３１１～３１ｎから疑わしい部分を取り除いた後、再度、高次推定器５８の学習を行い、新たに生成された高次推定器５８により高次推定タスクを再度遂行する。或いは、取り除いた方の部分を適正な値に補完し、高次推定器５８により高次推定タスクを遂行する。これにより、その誤りが生じた原因の検証を行うことができる。

更に、作成者は、適用場面に応じて使用する特徴量３の部分を選択し、選択された部分に基づいて高次推定タスクを遂行するように高次推定器を構成してもよい。例えば、第１部分３１１が、第１適用場面では高次推定タスクの遂行精度の向上に貢献するのに対して、第２適用場面では高次推定タスクの遂行精度を悪化させるものであると想定する。この場合に、作成者は、第１適用場面では、第１部分３１１の入力を受け付けるように高次推定器を構築するのに対して、第２適用場面では、高次推定器の入力から第１部分３１１を除外してもよい。これにより、適用画面に最適な訓練済みの高次推定器の生成を期待することができる。

＜４．３＞
上記実施形態では、ステップＳ１２２及びステップＳ１２３を独立に実行し、ステップＳ１２７により訓練処理をループすることで、第２訓練ステップの第１ステップ及び第２ステップは交互に繰り返し実行されている。しかしながら、第１ステップ及び第２ステップを交互に繰り返し実行することは、このような例に限定されなくてよく、勾配反転層を利用して第１ステップ及び第２ステップを同時に実行することを含んでもよい。

図１２は、本変形例に係る学習モデル５Ｘの一例を模式的に例示する。本変形例に係る学習モデル５Ｘは、各敵対推定器（５３、５４）の手前にそれぞれ配置される勾配反転層（５９１、５９２）を備えている。各勾配反転層（５９１、５９２）は、順伝播の演算の際は値をそのまま通過させ、逆伝播時には値を反転するように構成される。本変形例に係る学習モデル５Ｘの機械学習は、第２訓練ステップ（上記ステップＳ１２２及びステップＳ１２３）の処理を除いて、上記実施形態と同様に処理されてよい。第２訓練ステップでは、制御部１１は、上記ステップＳ１２２及びステップＳ１２３と同様に、各敵対推定器（５３、５４）の出力値の誤差を算出する。制御部１１は、算出された各誤差を、各敵対推定器（５３、５４）の出力層（５３３、５３４）から符号器５０の入力層５０１まで逆伝播し、符号器５０及び各敵対推定器（５３、５４）の各演算パラメータの値の固定せずに更新する。これにより、制御部１１は、ステップＳ１２２及びステップＳ１２３を同時に処理することができる。なお、上記＜４．２＞の変形例においても同様の構成が採用されてよい。各勾配反転層は、各敵対推定器５３０１～５３０ｎの手前に配置されてよい。

＜４．４＞
上記実施形態及び変形例では、第２訓練ステップは、第１ステップ及び第２ステップの敵対的学習により構成されている。しかしながら、各部分と正解データとの間の相関性を低くするように符号器５０を訓練する方法は、このような例に限定されなくてよい。一例として、第２訓練ステップでは、制御部１１は、特徴量３の各部分及び正解データ（上記実施形態では、第１部分３１及び第２正解データ１２３／第２部分３２及び第１正解データ１２２）の分布間の不一致性（discrepancy）を誤差として算出し、算出された誤差を最小化するように符号器５０を訓練してもよい。誤差の計算には、ＭＭＤ（maximum mean discrepancy）、ＭＣＤ（maximum classifier discrepancy）等の公知の指標が用いられてよい。これにより、制御部１１は、各部分と正解データとの間の相関性を低くするように符号器５０を訓練してもよい。この場合、各敵対推定器（５３、５４、５３０１～５３０ｎ）は省略されてよい。

＜４．５＞
上記実施形態では、符号器５０、各推定器（５１、５２）、各敵対推定器（５３、５４）、及び復号器５７それぞれには、全結合型のニューラルネットワークが用いられている。しかしながら、それぞれを構成するニューラルネットワークの種類は、このような例に限定されなくてもよい。例えば、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク等の公知のニューラルネットワークが学習モデル５の各構成要素に用いられてよい。更には、学習モデル５の各構成要素は、例えば、ドロップアウト層等の他の種類の層を含んでもよい。マスク生成器５６及び高次推定器５８についても同様である。

また、上記実施形態において、学習モデル５の各構成要素を構成する機械学習モデルの種類は、ニューラルネットワークに限られなくてよい。各構成要素には、例えば、ニューラルネットワーク以外に、サポートベクタマシン、回帰モデル、決定木モデル等が用いられてよい。機械学習モデルの演算内容は、識別及び回帰の少なくとも一方であってよい。機械学習の方法は、それぞれの機械学習モデルの種類に応じて適宜選択されてよい。機械学習の方法には、例えば、ｋ近傍法又はその近似法（例えば、近似最近傍法等）、ランダムフォレスト、バギング、ブースティング等が採用されてよい。高次推定器５８についても同様である。なお、機械学習モデルが、例えば、ニューラルネットワーク等の微分可能な関数で構成されない場合、機械学習の方法には、強化学習等の微分不能なモデルの訓練を実行可能な方法が採用されてよい。

また、上記実施形態において、学習モデル５の各構成要素の入力及び出力の形式は、特に限定されなくてよく、実施の形態に応じて適宜決定されてよい。例えば、第１推定器５１は、特徴量３の第１部分３１（及び第２部分３２）以外の情報の入力を更に受け付けるように構成されてもよい。高次推定器５８についても同様である。

＜４．６＞
上記実施形態において、ステップＳ１２６の訓練処理が、学習モデル５の機械学習の処理手順から省略されてもよい。

また、上記実施形態において、マスク生成器５６が、学習モデル５から省略されてよい。この場合、ステップＳ１２５の訓練処理が、学習モデル５の機械学習の処理手順から省略されてよい。特徴量３の第１部分３１及び第２部分３２は、例えば、予めその範囲が規定されていることにより、マスク４を用いずに抽出されてよい。すなわち、特徴量３の第１部分３１及び第２部分３２の範囲は予め固定的に決定されていてもよい。第１部分３１及び第２部分３２の範囲は、オペレータの指定、プログラム内の設定値等により適宜規定されてよい。或いは、マスク４は、マスク生成器５６を用いずに与えられてよい。この場合、マスク４は、予め定められた固定値により構成されてよい。若しくは、マスク４の各要素の値は、例えば、訓練処理が進むにつれて第１部分３１の範囲を狭めていく等のように、訓練処理の進捗に応じてカリキュラム的に調整されてよい。

また、上記実施形態において、復号器５７が、学習モデル５から省略されてもよい。この場合、ステップＳ１２４の訓練処理が、学習モデル５の機械学習の処理手順から省略されてよい。

＜４．７＞
上記実施形態に係る推定システム１００及び変形例は、所定種類のデータに対して推定タスクを遂行するあらゆる場面に適用されてよい。

一例として、上記実施形態に係る推定システム１００及び変形例は、センサにより対象（人物、物体等）を観測する場面に適用されてよい。この場合、取り扱うデータ（訓練データ及び対象データ）は、対象を観測するセンサにより生成されるセンシングデータであってよい。この場合、第１推定タスク及び第２推定タスクは、対象の属性、観測の環境等に関して互いに異なる１又は複数の項目を推定する（予測を含む）ことであってよい。例えば、第１推定タスクは、対象の属性を推定することであるのに対して、第２推定タスクは、観測の環境を推定することであってよい。対象の属性は、例えば、対象の状態、状況、評価、種別、識別子等を含んでよい。観測の環境は、例えば、観測場所、センサの観測条件（例えば、センサの設定、設置位置等）、観測範囲の観測条件（例えば、照明条件、外乱光条件等）等を含んでよい。なお、例えば、対象の種別、識別子等のセンサの観測条件に影響する属性は、観測の環境に含まれると解釈されてもよい。また、例えば、第１推定タスクは、対象の属性を推定することであるのに対して、第２推定タスクは、入力データ（訓練データ、対象データ）の個体性を推定することであってよい。

また、高次推定タスクが第１推定タスク及び第２推定タスクに対して設定されてよい。この場合、第１推定タスク及び第２推定タスクの少なくとも一方は、対象の属性に関する１又は複数の項目を推定（予測を含む）ことであってよい。これに対して、高次推定タスクは、第１推定タスク及び第２推定タスクよりも複雑な対象の属性を推定すること、対象の属性に応じて制御対象装置（例えば、自動運転車両、ロボット装置等）の動作戦略を推定すること、等であってよい。複雑な対象の推定することは、例えば、第１推定タスク及び第２推定タスクにより推定される項目に基づいて、それらの項目よりも高次の１又は複数の項目を推定することであってよい。第１推定タスク及び第２推定タスクが共に対象の属性に関する１又は複数の項目を推定することである場合、第１推定タスク及び第２推定タスクは、対象の属性に関して互いに異なる１又は複数の項目を推定するように設定される。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、センサの現在の観測値から未来又は過去の観測値を推定することであってよい。第１推定タスク及び第２推定タスクが共にセンサの未来又は過去の観測値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の観測値を推定するように設定されてよい。この場合、高次推定タスクは、未来及び過去の少なくとも一方の観測値に基づいて、対象の属性を推定することであってよい。ｎ個の推定タスクを設定する場合も同様である。

その他の例として、取り扱うデータは、対象の属性に関する属性データであってよい。属性データは、例えば、画像データ、音データ、数値データ、テキストデータ等により構成されてよい。属性データは、センサにより得られたセンシングデータを解析することで得られてもよい。この場合、第１推定タスクは、対象を評価することであってよい。対象を評価することは、例えば、対象の評価点を判定すること、対象の状態を推定すること等であってよい。第２推定タスクは、対象の評価にバイアスをかけないようにする（すなわち、対象を評価する指標から除外する）対象の属性を推定することであってよい。

また、第１推定タスク及び第２推定タスクの少なくとも一方は、１又は複数の項目で対象を評価することであってよい。第１推定タスク及び第２推定タスクが共に１又は複数の項目で対象を評価することである場合、第１推定タスク及び第２推定タスクは、互いに異なる１又は複数の項目で対象を評価するように設定されてよい。この場合、高次推定タスクは、第１推定タスク及び第２推定タスクの項目よりも高次の１又は複数の項目で対象を評価することであってよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、現在の属性値から未来又は過去の属性値を推定することであってよい。第１推定タスク及び第２推定タスクが共に未来又は過去の属性値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の属性値を推定するように設定されてよい。この場合、高次推定タスクは、未来及び過去の少なくとも一方の属性値に基づいて、対象を評価することであってよい。ｎ個の推定タスクを設定する場合も同様である。

具体例として、上記実施形態に係る推定システム１００及び変形例は、例えば、自動運転の戦略を決定する場面、ロボットの動作を決定する場面、製品の外観検査を実施する場面、対象人物を評価する場面、対象人物の状態を診断する場面、植物の栽培状況を監視する場面等に適用されてよい。以下、適用場面を限定した具体例を例示する。

（Ａ）自動運転の戦略を決定する場面
図１３は、第１具体例に係る制御システム１００Ａの適用場面の一例を模式的に例示する。第１具体例は、車載センサＳＡにより得られるセンシングデータを利用して、自動運転の戦略を決定する場面に上記実施形態を適用した例である。第１具体例に係る制御システム１００Ａは、モデル生成装置１及び制御装置２Ａを備える。

上記＜４．１＞と同様に、第１具体例の学習モデルは、高次推定器５８を更に備える。第１具体例において取り扱うデータ（訓練データ１２１及び対象データ２２１）は、車載センサＳＡにより得られるセンシングデータである。車載センサＳＡの種類は適宜選択されてよい。車載センサＳＡは、例えば、画像センサ、Lidarセンサ、ミリ波レーダ、超音波センサ、加速度センサ等であってよい。

第１具体例において、第１推定タスク及び第２推定タスクの少なくとも一方は、車両の状況に関する１又は複数の項目を推定（予測を含む）することであってよい。車両の状況に関する推定項目は、車両の外部及び内部の少なくとも一方に関するものであってよい。車両外部の状況は、例えば、車両周囲に存在する物体の属性、混雑度、車間距離、事故のリスク、天候、時間、道路の存在する場所の属性等により表現されてよい。車両周囲に存在する物体は、例えば、道路、信号機、障害物（人、物）等であってよい。道路の属性は、例えば、走行車線の種別、道路の種別（例えば、交差点、高速道路）、路面状態等を含んでよい。信号機の属性は、例えば、信号機の点灯状態等を含んでよい。障害物の属性は、例えば、障害物の有無、障害物の種別、障害物の大きさ、障害物の速度、障害物に関するイベント等を含んでよい。障害物に関するイベントは、例えば、人又は車両の飛び出し、急発進、急停車、車線変更等を含んでよい。事故のリスクは、例えば、事故の種別及びその事故の発生確率により表現されてよい。時間は、一定の時間帯により表現されてよい。時間帯の表現には、朝、昼、夜等のような時期により時間帯の長さが変動し得る表現方法が用いられてもよいし、或いは、１時から２時等のような固定的な表現方法が用いられてもよい。場所の属性は、例えば、都会、田舎等のその場所の人口密集度の種別を含んでよい。車両内部の状況は、例えば、車両の走行状態、車両に乗車する乗員の属性等により表現されてよい。走行状態は、例えば、速度、加速度、操舵角等の走行動作の変容により表現されてよい。乗員の属性は、例えば、乗員の状態、人数、位置、数、識別情報等を含んでよい。第１推定タスク及び第２推定タスクが共に車両の状況に関する１又は複数の項目を推定することである場合、第１推定タスク及び第２推定タスクは、車両の状況に関して互いに異なる１又は複数の項目を推定するように設定されてよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、車載センサＳＡの現在の観測値から未来又は過去の観測値を推定することであってよい。第１推定タスク及び第２推定タスクが共に未来又は過去の観測値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の観測値を推定するように設定されてよい。一方、高次推定タスクは、車両の状況に応じて当該車両に対する動作指令を推定すること、すなわち、自動運転の戦略を決定することであってよい。動作指令は、例えば、アクセル量、ブレーキ量、ハンドル操舵角、ライトの点灯、クラクションの使用等により規定されてよい。各正解データ１２２～１２４は、各推定タスクの正解を示すように適宜構成されてよい。

これらの他、第１具体例の構成は、上記実施形態及び変形例と同様であってよい。第１具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、自動運転の戦略の決定に使用可能な訓練済みの機械学習モデル（符号器５０及び高次推定器５８）を生成することができる。この機械学習モデルには、上記マスク生成器５６が含まれてもよい。以下の具体例についても同様である。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで制御装置２Ａに提供されてよい。

制御装置２Ａは、訓練済みの符号器５０及び高次推定器５８を使用して、車両の動作を制御するように構成されたコンピュータである。制御装置２Ａのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。車載センサＳＡは、外部インタフェース又は通信インタフェースを介して制御装置２Ａに接続されてよい。制御装置２Ａは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、車載装置等であってもよい。

制御装置２Ａは、上記推定装置２と同様の処理手順により、自動運転の戦略を決定することができる。すなわち、ステップＳ２０１では、制御装置２Ａの制御部は、車載センサＳＡから対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び高次推定器５８を使用して、対象データ２２１に基づいて自動運転の戦略を決定する。ステップＳ２０３では、制御部は、決定された戦略の動作指令に基づいて、車両の動作を制御する。

（特徴）
第１具体例によれば、モデル生成装置１の機械学習により、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの符号器５０及び高次推定器５８を構築することができる。すなわち、制御装置２Ａにおいて、自動運転の戦略の決定に不具合が生じた場合に、特徴量３の各部分（３１、３２）を参照する。参照の結果、第１部分３１及び第２部分３２の少なくともいずれかが適切な値ではない、すなわち、車両の状況に関する推定に誤りが生じていることが判明した場合、そのことが、自動運転の戦略の決定に不具合が生じた原因であると解明することができる。

なお、第１具体例において、高次推定タスクは、第１推定タスク及び第２推定タスクと比べて車両のより複雑な状況を推定することに置き換えられてよい。これに応じて、制御装置２Ａは、監視装置と読み替えられてよい。また、車両は、例えば、ドローン等の、自律的に飛行可能な飛行体に置き換えられてもよい。

（Ｂ）ロボットの動作を決定する場面
図１４は、第２具体例に係る制御システム１００Ｂの適用場面の一例を模式的に例示する。第２具体例は、センサＳＢにより得られるセンシングデータを利用して、ロボット装置ＲＢの動作を決定する場面に上記実施形態を適用した例である。第２具体例に係る制御システム１００Ｂは、モデル生成装置１及び制御装置２Ｂを備える。

上記＜４．１＞と同様に、第２具体例の学習モデルは、高次推定器５８を更に備える。第２具体例において取り扱うデータ（訓練データ１２１及び対象データ２２１）は、センサＳＢにより得られるセンシングデータである。センサＳＢの種類は適宜選択されてよい。センサＳＢは、例えば、画像センサ、近赤外線画像センサ、マイクロフォン、加速度センサ、触覚センサ、力覚センサ、近接センサ、トルクセンサ、圧力センサ、距離センサ、温度センサ、照度センサ等であってよい。センサＳＢは、ロボット装置ＲＢの状況を観測可能に適宜配置されてよい。ロボット装置ＲＢの種類は、実施の形態に応じて適宜選択されてよい。ロボット装置ＲＢは、例えば、垂直多関節ロボット、スカラロボット、パラレルリンクロボット、直交ロボット、協調ロボット等の産業用ロボットであってよい。或いは、ロボット装置ＲＢは、人とコミュニケーションを行うコミュニケーションロボット等の自律型ロボットであってよい。

第２具体例において、第１推定タスク及び第２推定タスクの少なくとも一方は、ロボット装置ＲＢの状況に関する１又は複数の項目を推定（予測を含む）することであってよい。ロボット装置ＲＢの状況に関する推定項目は、ロボット装置ＲＢの外部及び内部の少なくとも一方に関するものであってよい。ロボット装置ＲＢ外部の状況は、例えば、ワークの属性、障害物の属性、作業者の属性等により表現されてよい。ワークは、例えば、加工、運搬等のロボット装置ＲＢの作業対象となり得る物体である。ワーク及び障害物の属性は、例えば、種類、位置、傾き、形状、大きさ、重さ、質感、イベント等を含んでよい。障害物は、例えば、ロボット装置ＲＢ以外の他のロボット装置であってもよい。この場合、ロボット装置ＲＢ及び他のロボット装置は、互いに通信可能に構成されてよく、障害物の属性は、例えば、他のロボット装置の内部変数、他のロボット装置の動作（例えば、他のロボット装置からのメッセージ）等を含んでもよい。推定タスクの一例として、ロボット装置ＲＢの動作に対する他のロボット装置の反応（例えば、メッセージ出力）が予測されてもよい。メッセージは、通信、視覚提示、音声提示、振動による提示等の方法により他のロボット装置からロボット装置ＲＢに伝達されてよい。作業者の属性は、例えば、位置、身長、姿勢、作業内容、眠気度、疲労度、余裕度、熟練度、視線等を含んでよい。ロボット装置ＲＢ内部の状況は、例えば、駆動部（エンドエフェクタ、関節等）の状態、実行する作業の種別等により表現されてよい。第１推定タスク及び第２推定タスクが共にロボット装置ＲＢの状況に関する１又は複数の項目を推定することである場合、第１推定タスク及び第２推定タスクは、ロボット装置ＲＢの状況に関して互いに異なる１又は複数の項目を推定するように設定されてよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、センサＳＢの現在の観測値から未来又は過去の観測値を推定することであってよい。第１推定タスク及び第２推定タスクが共にセンサＳＢの未来又は過去の観測値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の観測値を推定するように設定されてよい。一方、高次推定タスクは、ロボット装置ＲＢの状況に応じて当該ロボット装置ＲＢの動作指令を推定すること、すなわち、ロボット装置ＲＢの動作を決定することであってよい。動作指令は、例えば、駆動部の駆動量、信号又は情報の出力等により規定されてよい。信号又は情報の出力は、例えば、データをサーバに送信すること、音声を出力すること、ディスプレイに情報を表示すること、表示灯を点灯すること、プロジェクタにより情報を投影すること、情報内容に応じて振動子を振動すること等を含んでよい。

これらの他、第２具体例の構成は、上記実施形態及び変形例と同様であってよい。第２具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、ロボット装置ＲＢの動作の決定に使用可能な訓練済みの機械学習モデル（符号器５０及び高次推定器５８）を生成することができる。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで制御装置２Ｂに提供されてよい。

制御装置２Ｂは、訓練済みの符号器５０及び高次推定器５８を使用して、ロボット装置ＲＢの動作を制御するように構成されたコンピュータである。制御装置２Ｂのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。センサＳＢ及びロボット装置ＲＢは、外部インタフェース又は通信インタフェースを介して制御装置２Ｂに接続されてよい。また、ロボット装置ＲＢは、専用のコントローラを備えてもよい。この場合、制御装置２Ｂは、専用のコントローラを介してロボット装置ＲＢに接続されてよい。制御装置２Ｂは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、スマートフォンを含む携帯電話、ＰＬＣ（programmable logic controller）等であってもよい。

制御装置２Ｂは、上記推定装置２と同様の処理手順により、ロボット装置ＲＢの動作を決定することができる。すなわち、ステップＳ２０１では、制御装置２Ｂの制御部は、センサＳＢから対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び高次推定器５８を使用して、対象データ２２１に基づいてロボット装置ＲＢに対する動作指令を決定する。ステップＳ２０３では、制御部は、決定された動作指令に基づいて、ロボット装置ＲＢの動作を制御する。

（特徴）
第２具体例によれば、モデル生成装置１の機械学習により、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの符号器５０及び高次推定器５８を構築することができる。すなわち、制御装置２Ｂにおいて、ロボット装置ＲＢの動作の決定に不具合が生じた場合に、特徴量３の各部分（３１、３２）を参照する。参照の結果、第１部分３１及び第２部分３２の少なくともいずれかが適切な値ではない、すなわち、ロボット装置ＲＢの状況に関する推定に誤りが生じていることが判明した場合、そのことが、ロボット装置ＲＢの動作の決定に不具合が生じた原因であると解明することができる。

（Ｃ）製品の外観検査を実施する場面
図１５は、第３具体例に係る検査システム１００Ｃの適用場面の一例を模式的に例示する。第３具体例は、カメラＳＣにより得られる画像データを利用して、製品ＲＣの外観検査を実施する場面に上記実施形態を適用した例である。第３具体例に係る検査システム１００Ｃは、モデル生成装置１及び検査装置２Ｃを備える。

第３具体例において取り扱うデータ（訓練データ１２１及び対象データ２２１）は、カメラＳＣにより得られる画像データである。カメラＳＣの種類は、特に限定されなくてよく、実施の形態に応じて適宜選択されてよい。カメラＳＣは、例えば、一般的なＲＧＢカメラ、深度カメラ、赤外線カメラ等であってよい。カメラＳＣは、製品ＲＣを撮影可能な場所に適宜配置されてよい。

製品ＲＣは、例えば、電子機器、電子部品、自動車部品、薬品、食品等の製造ラインで搬送される製品であってよい。電子部品は、例えば、基盤、チップコンデンサ、液晶、リレーの巻線等であってよい。自動車部品は、例えば、コンロッド、シャフト、エンジンブロック、パワーウィンドウスイッチ、パネル等であってよい。薬品は、例えば、包装済みの錠剤、未包装の錠剤等であってよい。製品ＲＣは、製造過程完了後に生成される最終品であってもよいし、製造過程の途中で生成される中間品であってもよいし、製造過程を経過する前に用意される初期品であってもよい。

第３具体例において、第１推定タスクは、製品ＲＣの欠陥に関する推定を行うことである。欠陥は、例えば、傷、汚れ、クラック、打痕、バリ、色ムラ、異物混入等であってよい。欠陥に関する推定は、例えば、製品ＲＣに欠陥が含まれるか否かを判定すること、製品ＲＣに欠陥が含まれる確率を判定すること、製品ＲＣに含まれる欠陥の種類を識別すること、製品ＲＣに含まれる欠陥の範囲を特定すること又はこれらの組み合わせにより表現されてよい。一方、第２推定タスクは、第１推定タスクと異なるように適宜設定されてよい。第２推定タスクは、例えば、製品ＲＣの種別、製造工場の識別子、製造ラインの種別、撮影条件、照明条件、外乱光条件等の外観検査の環境を推定することであってよい。撮影条件は、カメラＳＣの設定、撮影角度、撮影の相対配置等により規定されてよい。カメラＳＣの設定は、例えば、絞り値、シャッター速度、合焦距離、ズーム倍率等により規定されてよい。撮影の相対配置は、例えば、撮影の際におけるカメラ視野内の製品ＲＣの位置／姿勢、カメラＳＣ及び製品ＲＣの間の距離等により規定されてよい。照明条件は、製品ＲＣに対する照明光の方向、照明光のスペクトル、偏光等により規定されてよい。外乱光条件は、建物内の天井照明の影響、窓からの自然光の影響等により規定されてよい。或いは、第２推定タスクは、上記実施形態と同様に、入力データの個体性を推定することであってよい。個体性は、例えば、製品ＲＣのロット番号等により識別されてよい。

これらの他、第３具体例の構成は、上記実施形態及び変形例と同様であってよい。第３具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、製品ＲＣの外観検査に使用可能な訓練済みの機械学習モデル（符号器５０及び第１推定器５１）を生成することができる。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで検査装置２Ｃに提供されてよい。

検査装置２Ｃは、訓練済みの符号器５０及び第１推定器５１を使用して、製品ＲＣの外観検査を実施するように構成されたコンピュータである。検査装置２Ｃのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。カメラＳＣは、外部インタフェース又は通信インタフェースを介して検査装置２Ｃに接続されてよい。検査装置２Ｃは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、ＰＬＣ等であってもよい。

検査装置２Ｃは、上記推定装置２と同様の処理手順により、製品ＲＣの外観検査を実行することができる。すなわち、ステップＳ２０１では、検査装置２Ｃの制御部は、カメラＳＣから対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び第１推定器５１を使用して、対象データ２２１に写る製品ＲＣの欠陥に関する推定を実行する。

ステップＳ２０３では、制御部は、製品ＲＣの欠陥推定の結果に関する情報を出力する。例えば、制御部は、製品ＲＣの欠陥推定の結果をそのまま出力装置に出力してもよい。また、例えば、製品ＲＣに欠陥が含まれると判定した場合、制御部は、そのことを知らせるための警告を出力装置に出力してもよい。また、例えば、製品ＲＣを搬送するコンベア装置に検査装置２Ｃが接続される場合、制御部は、欠陥推定の結果に基づいて、欠陥のある製品ＲＣと欠陥のない製品ＲＣとを別のラインで搬送されるようにコンベア装置を制御してもよい。

（特徴）
第３具体例によれば、モデル生成装置１の機械学習により、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。検査装置２Ｃでは、製品ＲＣの欠陥に関する推定タスクの遂行（すなわち、製品ＲＣの外観検査）に、第２推定タスクに関連する情報による影響を及び難くすることができる。未知の環境（例えば、訓練データ１２１を得た工場とは異なる工場）で外観検査を行う場合に、その未知の環境と訓練データを得た学習環境との違いに起因して、訓練済みの機械学習モデルによる推定精度が悪化する可能性がある。この問題に対して、第３具体例では、外観検査の環境を推定することを第２推定タスクに設定することで、当該環境に関する情報による影響を製品ＲＣの外観検査に及び難くすることができる。これにより、製品ＲＣの外観検査の精度の向上を図ることができる。

なお、既知の環境で外観検査を行う場合には、環境に関する情報を利用することで、外観検査の精度の向上を見込むことができる。そこで、第１具体例及び第２具体例と同様に、第３具体的においても、学習モデルは、高次推定器５８を更に備えてもよい。この場合、高次推定タスクが、製品ＲＣの欠陥に関する推定を行うことであってよい。一方、第１推定タスク及び第２推定タスクは、上記外観検査の環境に関して互いに異なる１又は複数の項目を推定することであってよい。これにより、既知の環境における外観検査の精度の向上を期待することができる。

（Ｄ）対象人物を評価する場面
図１６は、第４具体例に係る評価システム１００Ｄの適用場面の一例を模式的に例示する。第４具体例は、対象人物に関するデータ（以下、「人物データ」と記載する）を利用して、対象人物の評価を行う場面に上記実施形態を適用した例である。第４具体例に係る評価システム１００Ｄは、モデル生成装置１及び評価装置２Ｄを備える。

第４具体例において取り扱うデータ（訓練データ１２１及び対象データ２２１）は、評価に利用可能な人物データである。人物データは、例えば、対象人物の経歴、身体測定の結果、健康診断データ、テスト／アンケートの回答、資格（例えば、各種免許）の有無等に関する情報を含んでよい。これらの情報は、画像データにより得られてもよい。また、人物データは、対象人物の写る画像データ、対象人物の音声が録音された音データを含んでよい。人物データは、入力装置、スキャナ等を利用して、適宜取得されてよい。

第４具体例において、第１推定タスクは、対象人物の評価点を判定することであってよい。対象人物の評価点を判定することは、例えば、対象人物の採用の可否を判定すること、対象の業務に対する適正を判定すること等であってよい。一方、第２推定タスクは、例えば、対象人物の性別、人種、出身地、国籍、親族等の職業、思想、信条、既往歴、債務の状況、障害の有無、年齢、容姿等の評価にバイアスがかかるのが好ましくない属性を推定することであってよい。

これらの他、第４具体例の構成は、上記実施形態及び変形例と同様であってよい。第４具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、対象人物の評価に使用可能な訓練済みの機械学習モデル（符号器５０及び第１推定器５１）を生成することができる。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで評価装置２Ｄに提供されてよい。

評価装置２Ｄは、訓練済みの符号器５０及び第１推定器５１を使用して、対象人物の評価を行うように構成されたコンピュータである。評価装置２Ｄのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。評価装置２Ｄは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ（例えば、タブレット端末、デスクトップＰＣ等）、スマートフォンを含む携帯電話等であってよい。

評価装置２Ｄは、上記推定装置２と同様の処理手順により、対象人物の評価を行うことができる。すなわち、ステップＳ２０１では、評価装置２Ｄの制御部は、対象人物の人物データにより構成される対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び第１推定器５１を使用して、対象データ２２１に基づいて対象人物の評価を行う。ステップＳ２０３では、制御部は、対象人物の評価結果に関する情報を出力する。

（特徴）
第４具体例によれば、モデル生成装置１の機械学習により、演算内容の説明性が比較的に高い訓練済みの機械学習モデルを生成することができる。評価装置２Ｄでは、対象人物の評価に関する推定タスクの遂行に、第２推定タスクに関連する情報による影響を及び難くすることができる。上記のとおり、評価にバイアスがかかるのが好ましくない属性を推定することを第２推定タスクに設定することで、対象人物を評価する際に、その属性によるバイアスがかかり難くすることができる。これにより、所望しない判定基準が形成され、予期せぬ評価が行われるのを抑制することができる。

（Ｅ）対象人物の状態を診断する場面
図１７は、第５具体例に係る診断システム１００Ｅの適用場面の一例を模式的に例示する。第５具体例は、センサＳＥにより得られるセンシングデータを利用して、対象人物の状態を診断する場面に上記実施形態を適用した例である。第５具体例に係る診断システム１００Ｅは、モデル生成装置１及び診断装置２Ｅを備える。

上記＜４．１＞と同様に、第５具体例の学習モデルは、高次推定器５８を更に備える。第５具体例において取り扱うデータ（訓練データ１２１及び対象データ２２１）は、センサＳＥにより生成されるセンシングデータである。センサＳＥは、対象人物の状態を観測可能であれば、その種類は、特に限定されなくてよい。センサＳＥは、例えば、カメラ、赤外線センサ、圧力センサ、圧力分布センサ、マイクロフォン、バイタルセンサ、医療検査装置等であってよい。バイタルセンサは、例えば、血圧計、脈拍計、心拍計、心電計、筋電計、体温計、皮膚電気反応計、マイクロ波センサ、脳波計、脳磁計、活動量計、血糖値測定器、眼電位センサ、眼球運動計測器等であってよい。医療検査装置は、例えば、ＣＴ装置、ＭＲＩ装置等であってよい。

第５具体例において、第１推定タスク及び第２推定タスクの少なくとも一方は、対象人物の属性に関する１又は複数の項目を推定（予測を含む）することであってよい。対象人物の属性に関する推定項目は、例えば、姿勢、表情、外部刺激に対する眼球運動の追随性及び瞳孔の収縮反応性、眼球運動及び頭部姿勢の連動性、音声に対する応答性、身長、体重、人種、性別、生活習慣等であってよい。第１推定タスク及び第２推定タスクが共に対象人物の属性に関する１又は複数の項目を推定することである場合、第１推定タスク及び第２推定タスクは、対象人物の属性に関して互いに異なる１又は複数の項目を推定ように設定されてよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、センサＳＥの現在の観測値からセンサＳＥの未来又は過去の観測値を推定することであってよい。第１推定タスク及び第２推定タスクが共にセンサＳＥの未来又は過去の観測値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の観測値を推定するように設定されてよい。一方、高次推定タスクは、対象人物の健康状態を推定することであってよい。対象人物の健康状態を推定することは、例えば、健康であるか否かを判定すること、病気になる予兆があるか否かを判定すること、健康状態の種別を識別すること、対象の病気になる確率を判定すること又はこれらの組み合わせにより構成されてよい。また、対象人物は、車両の運転者であってよく、対象人物の状態を推定する場面は、車両を運転する運転者の状態を推定する場面であってもよい。この場合、対象人物の健康状態を推定することは、例えば、運転者の眠気度、疲労度、余裕度等の運転可能性を診断することであってよい。或いは、対象人物は、工場等で作業を行う作業者であってよく、対象人物の健康状態を推定する場面は、当該作業者の状態を推定する場面であってもよい。この場合、対象人物の健康状態を推定することは、例えば、作業者の眠気度、疲労度、余裕度等の作業に対するパフォーマンスを診断することであってよい。各正解データ１２２～１２４は、各推定タスクの正解を示すように適宜構成されてよい。

これらの他、第５具体例の構成は、上記実施形態及び変形例と同様であってよい。第５具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、対象人物の状態の診断（すなわち、健康状態の推定）に使用可能な訓練済みの機械学習モデル（符号器５０及び高次推定器５８）を生成することができる。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで診断装置２Ｅに提供されてよい。

診断装置２Ｅは、訓練済みの符号器５０及び高次推定器５８を使用して、対象人物の状態を診断するように構成されたコンピュータである。診断装置２Ｅのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。センサＳＥは、外部インタフェース又は通信インタフェースを介して診断装置２Ｅに接続されてよい。診断装置２Ｅは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、スマートフォンを含む携帯端末等であってもよい。

診断装置２Ｅは、上記推定装置２と同様の処理手順により、対象人物の健康状態を推定することができる。すなわち、ステップＳ２０１では、診断装置２Ｅの制御部は、センサＳＥから対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び高次推定器５８を使用して、対象データ２２１に基づいて対象人物の健康状態を推定する。ステップＳ２０３では、制御部は、対象人物の健康状態を推定した結果を出力する。

（特徴）
第５具体例によれば、モデル生成装置１の機械学習により、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの符号器５０及び高次推定器５８を構築することができる。すなわち、診断装置２Ｅにおいて、対象人物の健康状態の推定結果に誤りが生じた場合に、特徴量３の各部分（３１、３２）を参照することで、その誤りの生じた原因を検証することができる。

なお、第５具体例において、診断システム１００Ｅは、高次推定タスクを遂行するのではなく、第１推定タスクを遂行するように構成されてもよい。この場合、第１推定タスクは、対象人物の健康状態を推定することであってよい。一方、第２推定タスクは、センサＳＥの観測条件を推定することであってよい。観測条件は、例えば、センサＳＥの型番、センサＳＥの配置場所等により規定されてよい。これにより、第１推定タスクの遂行に、観測条件に関連する情報の影響を及び難くすることができる。その結果、第１推定タスクをロバストに実行することができる。或いは、第２推定タスクは、入力データ（訓練データ１２１、対象データ２２１）の個体性を推定することであってよい。

（Ｆ）植物の栽培状況を監視する場面
図１８は、第６具体例に係る監視システム１００Ｆの適用場面の一例を模式的に例示する。第６具体例は、植物ＲＦの栽培状況を監視する場面に上記実施形態を適用した例である。第６具体例に係る監視システム１００Ｆは、モデル生成装置１及び監視装置２Ｆを備える。

上記＜４．１＞と同様に、第６具体例の学習モデルは、高次推定器５８を更に備える。第６具体例において取り扱うデータは、環境センサＳＦにより生成されるセンシングデータ、作業者の入力により得られた植物ＲＦの観察データ、又はこれらの組み合わせにより構成されてよい。環境センサＳＦは、植物ＲＦの栽培状況を観測可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。環境センサＳＦは、例えば、気圧計、温度計、湿度計、音圧計、音センサ、紫外線センサ、照度計、雨量計、ガスセンサ、土壌センサ等であってよい。植物ＲＦの種類は任意に選択されてよい。観察データは、例えば、作業記録データ、環境記録データ、又はこれらの組み合わせにより構成されてよい。作業記録データは、例えば、摘花、摘葉、摘芽等の作業の有無、実行日時、量等を示す情報により構成されてよい。また、環境記録データは、作業者が植物ＲＦ周囲の環境（例えば、天候、気温、湿度等）を観測した結果を示す情報により構成されてよい。

第６具体例において、第１推定タスク及び第２推定タスクの少なくとも一方は、例えば、病気の有無、実／花の数、葉の茂り具合、栄養状態、植物ＲＦに対する光の照射時間、植物ＲＦ周囲の温度、植物ＲＦに与える水の量等の基本的な栽培状況に関する１又は複数の項目を推定することであってよい。第１推定タスク及び第２推定タスクが共に栽培状況に関する１又は複数の項目を推定することである場合、第１推定タスク及び第２推定タスクは、栽培状況に関して互いに異なる１又は複数の項目を推定ように設定されてよい。或いは、第１推定タスク及び第２推定タスクの少なくとも一方は、環境センサＳＦの現在の観測値から未来又は過去の観測値を推定することであってよい。第１推定タスク及び第２推定タスクが共に環境センサＳＦの未来又は過去の観測値を推定することである場合、第１推定タスク及び第２推定タスクは、互いに異なる時間の観測値を推定するように設定されてよい。これに対して、高次推定タスクは、例えば、植物ＲＦの収穫量、収穫時期、市場価値（市場価格）、最適な（例えば、収穫量が最大となる）生育環境又は作業内容等の高次の栽培状況を推定することであってよい。高次推定タスクは、例えば、植物ＲＦの基本的な栽培状況の推定結果に応じて、植物ＲＦの生育環境を制御するように構成された栽培装置ＣＦに対する制御指令を推定することであってもよい。栽培装置ＣＦは、例えば、カーテン装置、照明装置、空調設備、散水装置等であってよい。カーテン装置は、建物の窓に取り付けられたカーテンを開閉するように構成される。照明装置は、例えば、ＬＥＤ（light emitting diode）照明、蛍光灯等である。空調設備は、例えば、エアコンディショナ等である。散水装置は、例えば、スプリンクラ等である。カーテン装置及び照明装置は、植物ＲＦに光を照射する時間を制御するために利用される。空調設備は、植物ＲＦ周囲の温度を制御するために利用される。散水装置は、植物ＲＦに与える水の量を制御するために利用される。各正解データ１２２～１２４は、各推定タスクの正解を示すように適宜構成されてよい。

これらの他、第６具体例の構成は、上記実施形態及び変形例と同様であってよい。第６具体例において、モデル生成装置１は、上記実施形態と同様の処理手順により、植物ＲＦの栽培状況の監視に使用可能な訓練済みの機械学習モデル（符号器５０及び高次推定器５８）を生成することができる。生成された訓練済みの機械学習モデルを示す学習結果データは、任意のタイミングで監視装置２Ｆに提供されてよい。

監視装置２Ｆは、訓練済みの符号器５０及び高次推定器５８を使用して、植物ＲＦの栽培状況を監視するように構成されたコンピュータである。監視装置２Ｆのハードウェア構成及びソフトウェア構成は、上記推定装置２と同様であってよい。環境センサＳＦは、外部インタフェース又は通信インタフェースを介して監視装置２Ｆに接続されてよい。監視装置２Ｆは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、汎用のサーバ装置等であってよい。

監視装置２Ｆは、上記推定装置２と同様の処理手順により、植物ＲＦの栽培状況を監視することができる。すなわち、ステップＳ２０１では、監視装置２Ｆの制御部は、環境センサＳＦにより生成されるセンシングデータ、作業者により生成された観察データ、又はこれらの組み合わせにより構成された対象データ２２１を取得する。ステップＳ２０２では、制御部は、訓練済みの符号器５０及び高次推定器５８を使用して、対象データ２２１に基づいて植物ＲＦの栽培状況を推定する。ステップＳ２０３では、制御部は、植物ＲＦの栽培状況を推定した結果を出力する。例えば、最適な生育環境又は作業内容を高次推定タスクとして推定した場合、制御部は、推定結果を出力することで、植物ＲＦの管理者に栽培装置ＣＦのどうさを制御するように促してもよい。また、例えば、植物ＲＦの栽培状況に応じた栽培装置ＣＦに対する制御指令を推定した場合、制御部は、推定結果により得られた制御指令を栽培装置ＣＦに与えることで、栽培装置ＣＦの動作を制御してもよい。

（特徴）
第６具体例によれば、モデル生成装置１の機械学習により、推定結果に誤りが生じた場合に、その原因を解明しやすい訓練済みの符号器５０及び高次推定器５８を構築することができる。すなわち、監視装置２Ｆにおいて、植物ＲＦの栽培状況の推定結果に誤りが生じた場合に、特徴量３の各部分（３１、３２）を参照することで、その誤りの生じた原因を検証することができる。

なお、第６具体例において、監視システム１００Ｆは、高次推定タスクを遂行するのではなく、第１推定タスクを遂行するように構成されてもよい。この場合、第１推定タスクは、例えば、植物ＲＦの収穫量、収穫時期、市場価値（市場価格）等の栽培状況を推定することであってよい。或いは、第１推定タスクは、例えば、植物ＲＦの栽培に最適な栽培装置ＣＦに対する制御指令を推定することであってもよい。これに対して、第２推定タスクは、環境センサＳＦの観測条件を推定することであってよい。観測条件は、例えば、環境センサＳＦの型番、環境センサＳＦの種類、栽培場所（例えば、農園、ビニールハウス、ビニールハウス内の位置、緯度・経度等）等により規定されてよい。これにより、第１推定タスクの遂行に、観測条件に関連する情報の影響を及び難くすることができる。その結果、第１推定タスクをロバストに実行することができる。或いは、第２推定タスクは、入力データ（訓練データ１２１、対象データ２２１）の個体性を推定することであってよい。

＜４．８＞
上記実施形態において、第１推定タスクは、入力データのドメインを推定することであってよく、第２推定タスクは、入力データの個体性を推定することであってよい。ドメインは、例えば、データの取得環境等に応じて識別されてよい。この場合、第１推定タスク及び第２推定タスクの機械学習は事前学習として行われてよい。上記モデル生成装置１は、ステップＳ１０２の機械学習を実行した後に、未知のドメインで得られた複数の学習データセットを使用して、第２推定器５２の追加学習を実行し、第２推定器５２を他の推定タスクに適用させてよい。追加学習に利用する学習データセットは適宜生成されてよい。追加学習を実行する直前の状態では、特徴量３の第２部分３２にはドメインに関する情報が殆ど含まれておらず、かつ第２部分３２から入力データの個体性を推定可能である。そのため、訓練された符号器５０は、できるだけ細かい単位で与えられたデータを特徴量に量子化するが、その量子化の際にドメインの違いによるばらつきは排除されたものとなる。このため、未知のドメインの学習データセットにより追加学習を行う際、学習すべき差分は、ドメインによるばらつきの排除された特徴に対して未知のドメインから得られるデータの有する共通のバイアス項、及び細かい単位で量子化された特徴空間を、粒度を挙げる方向での再整理のみとなる。よって、未知のドメインにおける推定タスクを遂行可能な訓練済みの第２推定器５２を早期に生成する（すなわち、追加学習の時間を短縮する）ことができる。

１…モデル生成装置、
１１…制御部、１２…記憶部、
１３…通信インタフェース、１４…外部インタフェース、
１５…入力装置、１６…出力装置、１７…ドライブ、
１１１…データ取得部、１１２…学習処理部、
１１３…保存処理部、
１２０…学習データセット、
１２１…訓練データ、
１２２…第１正解データ、１２３…第２正解データ、
１２９…学習結果データ、
８１…モデル生成プログラム、９１…記憶媒体、
２…推定装置、
２１…制御部、２２…記憶部、
２３…通信インタフェース、２４…外部インタフェース、
２５…入力装置、２６…出力装置、２７…ドライブ、
２１１…データ取得部、２１２……推定部、
２１３…出力部、
２２１…対象データ、
５…学習モデル、
５０…符号器、
５１…第１推定器、５２…第２推定器

Claims

訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するデータ取得部と、
前記複数の学習データセットを使用して、学習モデルの機械学習を実施する学習処理部であって、
前記学習モデルは、符号器、第１推定器、及び第２推定器を含み、
前記符号器は、与えられた入力データを特徴量に変換するように構成され、
前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、
前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、並びに
前記機械学習を実施することは、
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに
前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、
を含む、
学習処理部と、
を備える、
モデル生成装置。
前記学習モデルは、前記符号器の出力からマスクを生成するように構成されたマスク生成器を更に備え、
前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合するように、前記マスク生成器を訓練する第３訓練ステップを更に含み、
前記第１部分は、生成された前記マスクを前記特徴量に適用することにより抽出される、
請求項１に記載のモデル生成装置。
前記第３訓練ステップは、前記第１訓練ステップ及び前記第２訓練ステップの少なくともいずれかと同時に実行される、
請求項２に記載のモデル生成装置。
前記機械学習を実施することは、生成される前記マスクの各要素の２値化が進むように、前記マスク生成器を訓練する第４訓練ステップを更に含む、
請求項２又は３に記載のモデル生成装置。
前記学習モデルは、第１敵対推定器及び第２敵対推定器を更に含み、
前記第１敵対推定器は、前記特徴量の前記第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、
前記第２敵対推定器は、前記特徴量の前記第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、
前記第２訓練ステップは、
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１敵対推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合し、かつ前記第２敵対推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合するように、前記第１敵対推定器及び前記第２敵対推定器を訓練する第１ステップ、並びに
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１敵対推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合しなくなるように、かつ前記第２敵対推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合しなくなるように、前記符号器を訓練する第２ステップ、
を交互に繰り返し実行することにより構成される、
請求項１から４のいずれか１項に記載のモデル生成装置。
前記学習モデルは、前記特徴量から前記入力データを復号化するように構成される復号器を更に含み、
前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記復号器により得られる復号化データが前記訓練データに適合するように、前記符号器及び前記復号器を訓練する第５訓練ステップを更に含む、
請求項１から５のいずれか１項に記載のモデル生成装置。
前記第５訓練ステップは、前記第１訓練ステップ及び前記第２訓練ステップの少なくともいずれかと同時に実行される、
請求項６に記載のモデル生成装置。
前記第２推定タスクは、前記訓練データの個体性を推定することである、
請求項１から７のいずれか１項に記載のモデル生成装置。
前記第２正解データは、前記訓練データの識別子を示すように構成され、
前記訓練データの個体性を推定することは、前記識別子を識別することである、
請求項８に記載のモデル生成装置。
前記識別子は、ハッシュ値により構成される、
請求項９に記載のモデル生成装置。
前記各学習データセットの前記訓練データはクラス分けされ、
前記識別子は、前記訓練データの属するクラスを示すように構成される、
請求項９に記載のモデル生成装置。
前記各学習データセットは、前記訓練データに対する高次推定タスクの正解を示す高次正解データを更に備え、
前記学習モデルは、高次推定器を更に含み、
前記高次推定器は、前記特徴量の前記第１部分及び前記第２部分の入力を受け付け、入力された前記第１部分及び前記第２部分に基づいて、前記入力データに対する前記高次推定タスクを遂行するように構成され、並びに
前記機械学習を実施することは、前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記高次推定器の前記高次推定タスクを遂行した結果が前記高次正解データに適合するように、前記高次推定器を訓練する高次訓練ステップを更に含む、
請求項１から１１のいずれか１項に記載のモデル生成装置。
対象データを取得するデータ取得部と、
請求項１から１１のいずれか１項に記載のモデル生成装置により訓練された前記符号器及び前記第１推定器を使用して、取得された前記対象データに対して前記第１推定タスクを遂行する推定部と、
前記第１推定タスクを遂行した結果に関する情報を出力する出力部と、
を備える、
推定装置。
対象データを取得するデータ取得部と、
請求項１２に記載のモデル生成装置により訓練された前記符号器及び前記高次推定器を使用して、取得された前記対象データに対して前記高次推定タスクを遂行する推定部と、
前記高次推定タスクを遂行した結果に関する情報を出力する出力部と、
を備える、
推定装置。
訓練データ、及び前記訓練データに対するｎ個の推定タスクそれぞれの正解をそれぞれ示すｎ件の正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するデータ取得部と、
前記複数の学習データセットを使用して、学習モデルの機械学習を実施する学習処理部であって、
前記学習モデルは、符号器及びｎ個の推定器を含み、
前記符号器は、与えられた入力データを特徴量に変換するように構成され、
前記特徴量は、前記各推定タスクにそれぞれ対応するｎ個の部分を含み、
前記各推定器は、前記各推定タスクに割り当てられ、
前記各推定器は、前記特徴量の対応する前記部分の入力を受け付け、入力された前記部分に基づいて、前記入力データに対する割り当てられた前記推定タスクを遂行するように構成され、並びに
前記機械学習を実施することは、
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記各推定器の前記各推定タスクを遂行した結果が対応する前記正解データに適合するように、前記符号器及び前記各推定器を訓練する第１訓練ステップ、並びに
前記各学習データセットについて、前記特徴量の前記各部分と前記各部分に対応する前記推定タスクに対応する前記正解データを除くｎ－１件の正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、
を含む、
学習処理部と、
を備え、
前記ｎは、３以上である、
モデル生成装置。
前記ｎ個の推定タスクのいずれか１つは、前記訓練データの個体性を推定することである、
請求項１５に記載のモデル生成装置。
コンピュータが、
訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記複数の学習データセットを使用して、学習モデルの機械学習を実施するステップであって、
前記学習モデルは、符号器、第１推定器、及び第２推定器を含み、
前記符号器は、与えられた入力データを特徴量に変換するように構成され、
前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、
前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、並びに
前記機械学習を実施することは、
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに
前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、
を含む、
ステップと、
を実行する、
モデル生成方法。
コンピュータに、
訓練データ、前記訓練データに対する第１推定タスクの正解を示す第１正解データ、前記第１推定タスクとは異なる第２推定タスクであって、前記訓練データに対する第２推定タスクの正解を示す第２正解データの組み合わせによりそれぞれ構成される複数の学習データセットを取得するステップと、
前記複数の学習データセットを使用して、学習モデルの機械学習を実施するステップであって、
前記学習モデルは、符号器、第１推定器、及び第２推定器を含み、
前記符号器は、与えられた入力データを特徴量に変換するように構成され、
前記第１推定器は、前記特徴量の第１部分の入力を受け付け、入力された前記第１部分に基づいて、前記入力データに対する前記第１推定タスクを遂行するように構成され、
前記第２推定器は、前記特徴量の第２部分であって、前記第１部分以外の第２部分の入力を受け付け、入力された前記第２部分に基づいて、前記入力データに対する前記第２推定タスクを遂行するように構成され、並びに
前記機械学習を実施することは、
前記各学習データセットについて、前記訓練データを前記符号器に与えたときに、前記第１推定器の前記第１推定タスクを遂行した結果が前記第１正解データに適合し、かつ前記第２推定器の前記第２推定タスクを遂行した結果が前記第２正解データに適合するように、前記符号器、前記第１推定器、及び前記第２推定器を訓練する第１訓練ステップ、並びに
前記各学習データセットについて、前記特徴量の前記第１部分と前記第２正解データとの間の相関性が低くなり、かつ前記特徴量の前記第２部分と前記第１正解データとの間の相関性が低くなるように、前記符号器を訓練する第２訓練ステップ、
を含む、
ステップと、
を実行させるための、
モデル生成プログラム。