JP7164028B2

JP7164028B2 - 学習システム、データ生成装置、データ生成方法、及びデータ生成プログラム

Info

Publication number: JP7164028B2
Application number: JP2021515399A
Authority: JP
Inventors: 健太西行
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2019-04-25
Filing date: 2019-04-25
Publication date: 2022-11-01
Anticipated expiration: 2039-04-25
Also published as: US20220172046A1; EP3961555A4; JPWO2020217371A1; CN113557536A; WO2020217371A1; EP3961555A1

Description

本発明は、学習システム、データ生成装置、データ生成方法、及びデータ生成プログラムに関する。

近年、製品の良否を検査する場面、ドライバをモニタリングする場面等の様々な場面で、得られた画像データに対して分類タスクを遂行するために、ニューラルネットワークにより構成された分類器の開発が行われている。例えば、特許文献１では、学習済みの第１のニューラルネットワークに基づいて画像に写る検査対象物が正常であるか異常であるかを判定し、検査対象物が異常であると判定した場合に、学習済みの第２のニューラルネットワークに基づいて当該異常の種類を分類する検査装置が提案されている。

ニューラルネットワークは、教師あり学習における学習モデルの一例である。教師あり学習における学習モデルのその他の例として、例えば、サポートベクタマシン、線形回帰モデル、決定木モデル等の様々なモデルが挙げられる。教師あり学習では、分類器は、訓練データである画像データを与えると、対応する正解データに適合する出力値を出力するように訓練される。学習済みの分類器によれば、未知の画像データに対して所定の分類タスクを遂行することができる。

この学習済みの分類器の性能は、基本的には、学習データのサンプル数に依存する。すなわち、学習データのサンプル数が多いほど、例えば、製品の良否を精度よく分類したり、ドライバの状態を精度よく分類したりする等、分類器の性能を高めることができる。しかしながら、教師あり学習では、訓練データである画像データ、及び当該画像データに対する分類タスクの正解を示す正解データの組み合わせによりそれぞれ構成された複数の学習データセットが学習データとして利用される。この画像データに対して正解データを付与する作業は、通常は、オペレータによる手作業で行われる。そのため、画像データに正解データを付与するのに手間がかかり、沢山のサンプルを用意するのにはコストがかかってしまう。

そこで、近年、少量のサンプルで分類器の性能の向上を図るアクティブラーニングが試みられている。アクティブラーニングでは、所定の指標に基づいて、正解データの付与されていない訓練データのサンプルが分類器の性能向上に寄与する程度を評価する。そして、その評価結果に基づいて、性能向上に寄与する程度の高いサンプルを抽出し、抽出されたサンプルに対して正解データを付与する。これにより、正解データを付与する訓練データのサンプル数を抑えつつ、得られた学習データセットを使用した教師あり学習により、性能の高い分類器を構築することができる。

非特許文献１では、各サンプルが分類器の性能向上に寄与する程度を評価する方法として、複数のニューラルネットワークの出力値を指標に利用した方法が提案されている。具体的には、既に正解データの付与されている画像データのサンプルを用意して、複数の学習済みのニューラルネットワークを構築する。そして、正解データの付与されていない学習データのサンプルに対する各学習済みのニューラルネットワークの出力値の不安定性を評価する。

各学習済みのニューラルネットワークの出力値の不安定性が高いほど、既に得られている学習データでは、そのサンプルに対して十分な性能で分類タスクを遂行する分類器が構築されておらず、そのサンプルは、分類器の性能向上に寄与する程度が高いことを示す。そのため、不安定性の高いサンプルに対して正解データを付与して、新たな学習データセットを生成する。そして、生成された新たな学習データセット及び既に用意された学習データセットを使用して、ニューラルネットワークの再学習を実施する。これにより、正解データを付与する訓練データのサンプル数を抑えつつ、性能の高い分類器を構築することができる。

特開２０１２－０２６９８２号公報

William H. Beluch, Tim Genewein, Andreas Nurnberger, Jan M. Kohler, "The power of ensembles for active learning in image classification", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.9368-9377, 2018

本件発明者は、この非特許文献１のような、複数のニューラルネットワークを利用したアクティブラーニングの方法には、次のような問題点があることを見出した。すなわち、この方法では、各ニューラルネットワークの出力層から得られた出力値を獲得関数に適用することで、正解データの付与されていないサンプルに対する各ニューラルネットワークの出力の不安定性が評価されている。非特許文献１では、分類タスクを遂行するために、各ニューラルネットワークの出力層にはソフトマックス層が利用されており、ソフトマックス層の出力値には、エントロピー等を算出するための獲得関数が適用されている。

しかしながら、画像データに対して設定可能な推定タスクの種類は、何らかの特徴を分類する分類タスクに限られない。画像データに対して設定可能な推定タスクには、例えば、回帰タスク、セグメンテーション等の他の種類のタスクが存在する。回帰タスクでは、例えば、特定の特徴が現れている確率等の連続値が導出される。セグメンテーションでは、例えば、特定の特徴の写る部分等の画像領域が抽出される。

ニューラルネットワークの出力形式は、このタスクの種類に応じて異なり得る。そのため、タスクの種類の異なるニューラルネットワークに同一種類の獲得関数を利用することは困難である。つまり、分類タスクに設定された獲得関数をそのまま他の種類のタスクの獲得関数として利用することは困難であり、タスクの種類に依存する出力層の出力形式に応じて獲得関数を変更することになる。したがって、従来の方法では、タスクの種類が異なるニューラルネットワークに共通の指標を利用して、アクティブラーニングを実施することは困難であるという問題点が存在する。

なお、この問題点は、画像データを訓練データとして利用する場面に限られず、音データ、数値データ、テキストデータ等の様々な種類のデータを訓練データとして利用するあらゆる場面で生じる。また、複数種類のデータを訓練データとして利用する場面にも同様の問題点が生じる。任意の種類のデータに対して任意の推定タスクを遂行するための推定器を生成するあらゆる場面で教師あり学習を利用することができ、それぞれの場面で、タスクの種類が異なるニューラルネットワークに共通の指標を利用して、アクティブラーニングを実施することは困難であるという問題点が生じ得る。

本発明は、一側面では、このような実情を鑑みてなされたものであり、その目的は、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施可能にするための技術を提供することである。

本発明は、上述した課題を解決するために、以下の構成を採用する。

すなわち、本発明の一側面に係る学習システムは、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを取得する第１データ取得部と、取得された前記複数の第１学習データセットを使用して、複数のニューラルネットワークの機械学習を実施する学習処理部であって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記機械学習を実施することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように、前記各ニューラルネットワークを訓練することを含む、学習処理部と、複数件の第２訓練データを取得する第２データ取得部と、訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得し、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出する評価部と、前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出する抽出部と、抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成する生成部と、を備え、前記学習処理部は、前記複数の第１学習データセット及び前記少なくとも１つ以上の第２学習データセットを使用して、前記複数のニューラルネットワークの機械学習を再度実施する、又は前記複数のニューラルネットワークとは別の学習モデルの教師あり学習を実施する。

例えば、分類タスクを遂行するために出力層にソフトマックス層を利用する等、ニューラルネットワークの出力層の形式は、当該ニューラルネットワークに習得させる推定タスクの種類に依存する。これに対して、ニューラルネットワークの出力層より入力側に配置される層（例えば、中間層等）の形式は、推定タスクの種類に依存せずに設定可能である。例えば、画像データに対する推定タスクを遂行するために畳み込みニューラルネットワークを利用する場面を想定する。この場面において、習得させる推定タスクの種類に依存せず（すなわち、異なる推定タスクを習得させる畳み込みニューラルネットワークの間で）、畳み込み層、プーリング層、全結合層等の共通の出力形式の中間層を利用することができる。

そこで、当該構成に係る学習システムでは、複数の層を含む各ニューラルネットワークにおいて、出力層より入力側に配置された層を注目層に設定する。注目層は、出力層以外の層から任意に設定されてよい。そして、複数の第１学習データセットを使用した機械学習において、第１訓練データを入力すると、第１正解データに適合する出力値が出力層から出力されると共に、注目層から出力される出力値が互いに適合するように、各ニューラルネットワークを訓練する。この機械学習により、各ニューラルネットワークは、未知の入力データに対して推定タスクを遂行可能に訓練されると共に、各ニューラルネットワークの注目層は、推定タスクを適切に遂行可能な入力データに対して同一又は近似する出力値を出力するように訓練される。つまり、この機械学習では、前者の訓練のみでは各ニューラルネットワークの注目層の出力はばらつくのに対して、後者の訓練を更に実施することで、各ニューラルネットワークの注目層の出力の整合を図っている。

そのため、訓練データのサンプルを各ニューラルネットワークに与えたときに、各ニューラルネットワークの注目層の出力値がばらつく、すなわち、出力の不安定性が高いことは、各ニューラルネットワークがそのサンプルに対して十分な性能で推定タスクを遂行することができないことを示す。よって、そのサンプルは、推定タスクを遂行する推定器の性能向上に寄与する程度が高いと推定される。当該構成に係る学習システムは、これを利用して、推定器の性能向上に寄与する程度の高いと推定される第２訓練データを抽出する。

具体的には、当該構成に係る学習システムは、各ニューラルネットワークの注目層の出力値に基づいて、各件の第２訓練データ（すなわち、訓練データのサンプル）に対する各ニューラルネットワークの出力の不安定性を示す評価値を算出する。各ニューラルネットワークの注目層の出力値と評価値との間の関係は、獲得関数により数学的に記述されてよい。この場合、各ニューラルネットワークの注目層の出力値を獲得関数に代入することで、各件の第２訓練データに対する各ニューラルネットワークの出力の不安定性を示す評価値を算出することができる。当該構成に係る学習システムは、不安定性が高いと判定するための条件を評価値が満たす少なくとも１件以上の第２訓練データを複数の第２訓練データから抽出する。

したがって、当該構成に係る学習システムでは、例えば、畳み込み層、プーリング層、全結合層等の出力形式が共通する層を注目層に設定することで、ニューラルネットワークに遂行させるタスクの種類に依存せずに、共通の指標（例えば、同一の獲得関数）を用いて、各サンプルに対する各ニューラルネットワークの出力の不安定性を評価することができる。すなわち、ニューラルネットワークに遂行させるタスクの種類に応じて、出力の不安定性を評価するための指標を変更しなくてもよい。そして、その評価の結果に基づいて、推定器の性能向上に寄与する程度の高いと推定される第２訓練データを適切に抽出することができる。よって、当該構成に係る学習システムによれば、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

また、当該構成に係る学習システムは、抽出された少なくとも１件以上の第２訓練データに第２正解データを付与することで、少なくとも１件以上の第２学習データセットを生成する。そして、当該構成に係る学習システムは、第１学習データセット及び第２学習データセットを使用して、各ニューラルネットワークの再学習又は新たな学習モデルの教師あり学習を実施する。これにより、正解データを付与する訓練データのサンプル数を抑えつつ、性能の高い推定器を構築することができる。

なお、各ニューラルネットワークは、複数の層を含んでいれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。各ニューラルネットワークには、全結合型ニューラルネットワーク、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク等が用いられてよい。出力層の出力形式は、各ニューラルネットワークに遂行させるタスクの種類に応じて設定されてよい。注目層は、出力層以外の層から適宜選択されてよい。例えば、畳み込み層、プーリング層、全結合層等の中間層が注目層に設定されてよい。各層の構成は、適宜設定されてよい。学習モデルは、教師あり学習を実施可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。学習モデルには、例えば、サポートベクタマシン、線形回帰モデル、決定木モデル等が用いられてよい。

訓練データの種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。訓練データには、例えば、画像データ、音データ、数値データ、テキストデータ等が用いられてよい。特徴を推定することには、分類すること、回帰すること、セグメンテーションを行うこと等が含まれてよい。特徴は、データから推定可能なあらゆる要素を含んでよい。推定タスクの一例として、例えば、画像データに写る製品の状態（良否）を推定するタスク、運転者を観察することで得られたセンシングデータから当該運転者の状態を推定するタスク、対象者のバイタルデータから当該対象者の健康状態を推定するタスク等を挙げることができる。特徴を推定することには、未来の何らかの要素を予測することが含まれてよい。この場合、特徴は、未来に現れる要素の予兆を含んでよい。正解データは、習得させる推定タスクに応じて適宜決定されてよい。正解データは、例えば、特徴のカテゴリを示す情報、特徴の表れる確率を示す情報、特徴の値を示す情報、特徴の写る範囲を示す情報等により構成されてよい。

上記一側面に係る学習システムにおいて、前記各ニューラルネットワークは、畳み込みニューラルネットワークであってよく、前記注目層は、畳み込み層であってよい。当該構成によれば、タスクの種類が異なる畳み込みニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

上記一側面に係る学習システムにおいて、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合することは、前記各畳み込みニューラルネットワークの前記畳み込み層より出力される特徴マップから導出されるアテンションマップが互いに一致することであってよい。アテンションマップは、ソフトマックス関数の出力に類似する特性を有している。そのため、ソフトマックス層に適用される獲得関数をそのままアテンションマップにも利用することができる。つまり、各件の第２訓練データに対する評価値を注目層の出力値から導出するのに、分類タスクに利用される従来の獲得関数を利用することができる。したがって、当該構成によれば、部分的に従来の演算モジュールを利用することができるため、本発明の導入コストを抑えることができる。

上記一側面に係る学習システムにおいて、前記各ニューラルネットワークの前記複数の層は、演算に利用される演算パラメータを備えてよい。前記各ニューラルネットワークを訓練することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力したときに、前記各ニューラルネットワークの前記出力層から出力される出力値と前記第１正解データとの誤差が小さくなるように、かつ前記各ニューラルネットワークの前記注目層から出力される出力値の間の誤差が小さくなるように、前記各ニューラルネットワークの前記演算パラメータの値の調整を繰り返すことを備えてよい。前記注目層から出力される出力値の間の誤差に関する学習率は、前記演算パラメータの値の調整を繰り返す度に大きくなるように設定されてよい。学習の初期段階では、各ニューラルネットワークの注目層の出力値は大きく相違する可能性がある。当該構成によれば、この注目層の出力値の誤差に対する学習率を徐々に高くすることで、各ニューラルネットワークの注目層の出力値を互いに適合させるための学習を適切に収束させることができる。なお、演算パラメータは、例えば、各ニューロン間の結合の重み、各ニューロンの閾値等である。

上記一側面に係る学習システムにおいて、前記各訓練データは、製品の写る画像データにより構成されてよく、前記特徴は、前記製品の状態に関するものであってよい。当該構成によれば、外観検査に利用する推定器を構築する場面において、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

なお、画像データに写る製品は、例えば、電子機器、電子部品、自動車部品、薬品、食品等の製造ラインで搬送される製品であってよい。電子部品は、例えば、基盤、チップコンデンサ、液晶、リレーの巻線等であってよい。自動車部品は、例えば、コンロッド、シャフト、エンジンブロック、パワーウィンドウスイッチ、パネル等であってよい。薬品は、例えば、包装済みの錠剤、未包装の錠剤等であってよい。製品は、製造過程完了後に生成される最終品であってもよいし、製造過程の途中で生成される中間品であってもよいし、製造過程を経過する前に用意される初期品であってもよい。製品の状態は、例えば、欠陥の有無に関するものであってよい。これに応じて、特徴は、例えば、傷、汚れ、クラック、打痕、バリ、色ムラ、異物混入等の製品の欠陥に関するものであってよい。

上記一側面に係る学習システムにおいて、前記各訓練データは、被験者の状態を観察するセンサにより得られたセンシングデータにより構成されてよく、前記特徴は、前記被験者の状態に関するものであってよい。当該構成によれば、対象者の状態を推定するための推定器を構築する場面において、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

なお、センサは、人物（被験者、対象者）の状態を観察可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。センサには、例えば、カメラ、バイタルセンサ等が用いられてよい。カメラには、例えば、一般的なＲＧＢカメラ、深度カメラ、赤外線カメラ等が用いられてよい。バイタルセンサには、例えば、体温計、血圧計、脈拍計等が用いられてよい。これに応じて、センシングデータは、画像データ、バイタルの測定データ等により構成されてよい。また、人物の状態は、例えば、人物の健康状態を含んでよい。健康状態を表現する方法は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。健康状態は、例えば、健康であるか否か、病気になる予兆があるか否か等により表現されてよい。人物が運転者である場合、人物の状態は、例えば、人物の眠気の度合いを示す眠気度、人物の疲労の度合いを示す疲労度、人物の運転に対する余裕の度合いを示す余裕度、又はこれらの組み合わせを含んでもよい。

本発明の形態は、上記学習システムに限られなくてもよい。本発明の一側面に係る装置は、例えば、上記各形態に係る学習システムから、例えば、各ニューラルネットワークの機械学習を実施する部分、推定器の性能向上に寄与する程度の高い第２訓練データを抽出する部分等の一部分を抽出することにより構成されてよい。各ニューラルネットワークの機械学習を実施する部分に対応する装置は学習装置と称されてよい。推定器の性能向上に寄与する程度の高い第２訓練データを抽出する部分に対応する装置はデータ生成装置と称されてよい。また、本発明の形態は、第１学習データセット及び第２学習データセットを使用した機械学習により構築された推定器（学習済みのニューラルネットワーク又は学習モデル）を利用する装置を含んでもよい。推定器を利用する装置は推定装置と称されてよい。推定装置の呼び方は、推定タスクの種類に応じて変更されてよい。

例えば、本発明の一側面に係る学習装置は、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを取得する第１データ取得部と、取得された前記複数の第１学習データセットを使用して、複数のニューラルネットワークの機械学習を実施する学習処理部であって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記機械学習を実施することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように、前記各ニューラルネットワークを訓練することを含む、学習処理部と、を備える。

また、例えば、本発明の一側面に係るデータ生成装置は、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するモデル取得部であって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、モデル取得部と、複数件の第２訓練データを取得するデータ取得部と、訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得し、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出する評価部と、前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出する抽出部と、抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成する生成部と、を備える。

上記一側面に係るデータ生成装置は、生成された前記少なくとも１つ以上の第２学習データセットを学習モデルの教師あり学習に使用可能に出力する出力部を更に備えてもよい。

また、上記各形態に学習システム、学習装置、データ生成装置、推定装置、及び推定装置を含むシステムそれぞれの別の態様として、本発明の一側面は、以上の各構成の全部又はその一部を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記憶した、コンピュータその他装置、機械等が読み取り可能な記憶媒体であってもよい。ここで、コンピュータ等が読み取り可能な記憶媒体とは、プログラム等の情報を、電気的、磁気的、光学的、機械的、又は、化学的作用によって蓄積する媒体である。

例えば、本発明の一側面に係る学習方法は、コンピュータが、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを取得するステップと、取得された前記複数の第１学習データセットを使用して、複数のニューラルネットワークの機械学習を実施するステップであって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記機械学習を実施することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように、前記各ニューラルネットワークを訓練することを含む、ステップと、複数件の第２訓練データを取得するステップと、訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得するステップと、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出するステップと、前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出するステップと、抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成するステップと、前記複数の第１学習データセット及び前記少なくとも１つ以上の第２学習データセットを使用して、前記複数のニューラルネットワークの機械学習を再度実施する、又は前記複数のニューラルネットワークとは別の学習モデルの教師あり学習を実施するステップと、を実行する情報処理方法である。

例えば、本発明の一側面に係るデータ生成方法は、コンピュータが、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するステップであって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、ステップと、複数件の第２訓練データを取得するステップと、訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得するステップと、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出するステップと、前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出するステップと、抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成するステップと、を実行する、情報処理方法である。

また、例えば、本発明の一側面に係るデータ生成プログラムは、コンピュータに、第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するステップであって、前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、ステップと、複数件の第２訓練データを取得するステップと、訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得するステップと、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出するステップと、前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出するステップと、抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成するステップと、を実行させるための、プログラムである。

本発明によれば、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

図１は、本発明の適用される場面の一例を模式的に例示する。図２は、実施の形態に係る学習装置のハードウェア構成の一例を模式的に例示する。図３は、実施の形態に係るデータ生成装置のハードウェア構成の一例を模式的に例示する。図４は、実施の形態に係る推定装置のハードウェア構成の一例を模式的に例示する。図５Ａは、実施の形態に係る学習装置のソフトウェア構成の一例を模式的に例示する。図５Ｂは、実施の形態に係る学習装置のソフトウェア構成の一例を模式的に例示する。図６は、実施の形態に係るデータ生成装置のソフトウェア構成の一例を模式的に例示する。図７は、実施の形態に係る推定装置のソフトウェア構成の一例を模式的に例示する。図８は、実施の形態に係る学習装置の処理手順の一例を例示する。図９は、実施の形態に係る学習装置の機械学習の処理手順の一例を例示する。図１０は、実施の形態に係るデータ生成装置の処理手順の一例を例示する。図１１は、実施の形態に係る学習装置の処理手順の一例を例示する。図１２は、実施の形態に係る推定装置の処理手順の一例を例示する。図１３は、本発明が適用される他の場面の一例を模式的に例示する。図１４Ａは、他の形態に係る検査装置のハードウェア構成の一例を模式的に例示する。図１４Ｂは、他の形態に係る検査装置のソフトウェア構成の一例を模式的に例示する。図１５は、本発明が適用される他の場面の一例を模式的に例示する。図１６Ａは、他の形態に係る監視装置のハードウェア構成の一例を模式的に例示する。図１６Ｂは、他の形態に係る監視装置のソフトウェア構成の一例を模式的に例示する。図１７は、本発明が適用される他の場面の一例を模式的に例示する。

以下、本発明の一側面に係る実施の形態（以下、「本実施形態」とも表記する）を、図面に基づいて説明する。ただし、以下で説明する本実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。

§１適用例
まず、図１を用いて、本発明が適用される場面の一例について説明する。図１は、本発明を適用した場面の一例を模式的に例示する。

本実施形態に係る推定システム１００は、学習データセットを生成する処理、学習モデルの機械学習を実施する処理、及び訓練された学習モデルを利用して所定の推定タスクを遂行する処理を含む一連の情報処理を実行するように構成される。本実施形態では、推定システム１００は、学習システム１０１及び推定装置３を備えている。

本実施形態に係る学習システム１０１は、上記一連の情報処理のうち、ニューラルネットワークを含む学習モデルの機械学習を実施する処理、及び学習データセットを生成する処理を実行するように構成される。本実施形態では、学習システム１０１は、それぞれの処理に応じて、学習装置１及びデータ生成装置２を備えている。

本実施形態に係る学習装置１は、複数の学習データセットを使用して、学習モデルの機械学習（教師あり学習）を実行するように構成されたコンピュータである。本実施形態では、学習装置１は、２つのフェーズそれぞれで、異なる目的で学習モデルの機械学習を実施する。

第１のフェーズでは、学習装置１は、用意された学習データセット（第１学習データセット１２１）を使用して、推定器の性能向上に寄与する程度の高い、すなわち、正解データを付与する価値の高い訓練データの抽出に利用する複数のニューラルネットワークの機械学習を実施する。データ生成装置２は、この機械学習により訓練された複数のニューラルネットワークを利用して、新たな学習データセット（第２学習データセット２２７）を生成する。一方、第２のフェーズでは、学習装置１は、生成された新たな学習データセットを更に使用して、推定タスクの遂行に利用するための学習モデルの機械学習を実施する。推定装置３は、この機械学習により訓練された学習モデルを利用して、対象データに対して所定の推定タスクを遂行する。

具体的に、第１のフェーズでは、学習装置１は、複数の第１学習データセット１２１を取得する。各第１学習データセット１２１は、第１訓練データ１２２及び第１正解データ１２３の組み合わせにより構成される。

第１訓練データ１２２の種類は、特に限定されなくてもよく、学習モデルに習得させる推定タスクに応じて適宜選択されてよい。第１訓練データ１２２は、例えば、画像データ、音データ、数値データ、テキストデータ等であってよい。図１の例では、センサＳにより得られるセンシングデータに含まれる特徴を推定する能力を学習モデルに習得させる場面を想定している。そのため、本実施形態では、第１訓練データ１２２は、センサＳ又はこれと同種のセンサにより得られるセンシングデータである。

センサＳの種類は、特に限定されなくてもよく、学習モデルに習得させる推定タスクに応じて適宜選択されてよい。センサＳは、例えば、カメラ、マイクロフォン、エンコーダ、Lidar（light detection and ranging）センサ、バイタルセンサ、環境センサ等であってよい。カメラは、例えば、ＲＧＢ画像を取得するよう構成された一般的なデジタルカメラ、深度画像を取得するように構成された深度カメラ、赤外線量を画像化するように構成された赤外線カメラ等であってよい。バイタルセンサは、例えば、体温計、血圧計、脈拍計等であってよい。環境センサは、例えば、光度計、温度計、湿度計等であってよい。一例として、画像に写る製品の外観検査をする能力を学習モデルに習得させる場合には、センサＳには、カメラが選択され、第１訓練データ１２２には、カメラにより得られる製品の写る画像データが選択される。

第１正解データ１２３は、第１訓練データ１２２に含まれる特徴を示す。すなわち、第１正解データ１２３は、第１訓練データ１２２に対する所定の推定タスクの正解を示すように構成される。第１正解データ１２３は、例えば、特徴のカテゴリを示す情報、特徴の表れる確率を示す情報、特徴の値を示す情報、特徴の写る範囲を示す情報等により構成されてよい。一例として、上記外観検査を実施する場合には、第１正解データ１２３は、例えば、製品に欠陥が含まれるか否か、製品に含まれる欠陥の種類、製品に含まれる欠陥の範囲等を示すように構成されてよい。

所定の推定タスクは、所定のデータに含まれる何らかの特徴を推定することである。この「特徴を推定すること」には、何らかの分類を行うこと、何らかの値を回帰すること、セグメンテーションを行うこと等が含まれてよい。特徴は、データから推定可能なあらゆる要素を含んでよい。推定タスクの一例として、上記画像データに写る製品の状態（良否）を推定するタスクの他、例えば、運転者を観察することで得られたセンシングデータから当該運転者の状態を推定するタスク、対象者のバイタルデータから当該対象者の健康状態を推定するタスク等を挙げることができる。特徴を推定することには、未来の何らかの要素を予測することが含まれてよい。この場合、特徴は、未来に現れる要素の予兆を含んでよい。

学習装置１は、取得された複数の第１学習データセット１２１を使用して、複数のニューラルネットワークの機械学習を実施する。本実施形態では、学習装置１は、複数のニューラルネットワークとして２つのニューラルネットワーク（５０、５１）の機械学習を実施する。以下では、説明の便宜上、それぞれを第１ニューラルネットワーク５０及び第２ニューラルネットワーク５１と称する。ただし、この第１のフェーズで機械学習の対象となるニューラルネットワークの数は、２つに限られなくてもよく、３つ以上であってもよい。

各ニューラルネットワーク（５０、５１）は、入力側から出力側に並んで配置された複数の層を含むように構成される。そして、各ニューラルネットワーク（５０、５１）の複数の層は、最も出力側に配置された出力層及び出力層よりも入力側に配置される注目層を含むように構成される。各ニューラルネットワーク（５０、５１）の構造（例えば、層の数、各層の種類、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等）及び種類それぞれは、特に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。２つのニューラルネットワーク（５０、５１）の構造は互いに異なっていてもよい。また、注目層は、出力層以外の層から適宜選択されてよい。注目層には、例えば、入力層、中間層等が選択されてよい。注目層には、中間層が選択されるのが好ましい。

図１の例では、第１ニューラルネットワーク５０は、最も入力側に配置された入力層５０１、最も出力側に配置された出力層５０７、及び中間層として配置された注目層５０３の少なくとも３つ以上の層を含んでいる。同様に、第２ニューラルネットワーク５１は、最も入力側に配置された入力層５１１、最も出力側に配置された出力層５１７、及び中間層として配置された注目層５１３の少なくとも３つ以上の層を含んでいる。本実施形態では、後述するとおり、各ニューラルネットワーク（５０、５１）には、畳み込みニューラルネットワークが用いられる。また、各注目層（５０３、５１３）には、畳み込み層が選択される。

学習装置１は、複数の第１学習データセット１２１を使用した機械学習において、第１訓練データ１２２を入力すると、第１正解データ１２３に適合する出力値が出力層（５０７、５１７）から出力されると共に、注目層（５０３、５１３）から出力される出力値が互いに適合するように、各ニューラルネットワーク（５０、５１）を訓練する。この機械学習により、各ニューラルネットワーク（５０、５１）は、第１訓練データ１２２と同種の未知の入力データに対して推定タスクを遂行可能に訓練されると共に、注目層（５０３、５１３）は、推定タスクを適切に遂行可能な入力データに対して同一又は近似する出力値を出力するように訓練される。前者の訓練のみでは、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）の出力はばらつくのに対して、後者の訓練を更に実施することで、注目層（５０３、５１３）の出力は整合するようになる。

これに対して、本実施形態に係るデータ生成装置２は、この注目層（５０３、５１３）の性質を利用して、新たな学習データセットを生成するように構成されたコンピュータである。具体的に、データ生成装置２は、複数の第１学習データセット１２１を使用した機械学習により、上記のとおり訓練された複数のニューラルネットワークを取得する。本実施形態では、データ生成装置２は、上記２つのニューラルネットワーク（５０、５１）を取得することができる。また、データ生成装置２は、複数件の第２訓練データ２２１を取得する。各件の第２訓練データ２２１は、上記第１訓練データ１２２と同種のデータである。本実施形態では、各件の第２訓練データ２２１は、正解データの付与されていない訓練データのサンプルである。

続いて、本実施形態に係るデータ生成装置２は、訓練された各ニューラルネットワーク（５０、５１）に各件の第２訓練データ２２１を入力することで、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）から出力値を取得する。データ生成装置２は、注目層（５０３、５１３）から取得された出力値に基づいて、各件の第２訓練データ２２１に対する各ニューラルネットワーク（５０、５１）の出力の不安定性を示す評価値２２２を算出する。

各ニューラルネットワーク（５０、５１）は、上記のとおり、注目層（５０３、５１３）の出力が整合するように訓練されている。そのため、訓練データのサンプルを各ニューラルネットワーク（５０、５１）に与えたときに、注目層（５０３、５１３）の出力値がばらつく、すなわち、出力の不安定性が高いことは、各ニューラルネットワーク（５０、５１）がそのサンプルに対して十分な性能で推定タスクを遂行することができないことを示す。よって、そのサンプルは、推定タスクを遂行する推定器の性能向上に寄与する程度が高い、すなわち、正解データを付与する価値の高いものと推定される。

そこで、本実施形態に係るデータ生成装置２は、不安定性が高いと判定するための条件を評価値２２２が満たす少なくとも１件以上の第２訓練データ２２３を複数件の第２訓練データ２２１から抽出する。更に、データ生成装置２は、抽出された少なくとも１件以上の第２訓練データ２２３それぞれに対して、第２訓練データ２２３に含まれる特徴（すなわち、第２訓練データ２２３に対する所定の推定タスクの正解）を示す第２正解データ２２５の入力を受け付ける。第２正解データ２２５は、第１正解データ１２３と同種のデータである。そして、データ生成装置２は、入力された第２正解データ２２５を対応する第２訓練データ２２３に付与することで、少なくとも１つ以上の第２学習データセット２２７を生成する。生成された各第２学習データセット２２７は、第２訓練データ２２３及び第２正解データ２２５の組み合わせにより構成される。

なお、各ニューラルネットワーク（５０、５１）は、各第１学習データセット１２１について、第１訓練データ１２２が入力されると、第１正解データ１２３に適合する出力値を出力層（５０７、５１７）から出力するようにも訓練されている。そのため、上記の第２訓練データ２２３の抽出だけではなく、所定の推定タスクの遂行にも、各ニューラルネットワーク（５０、５１）を利用することができる。そのため、各ニューラルネットワーク（５０、５１）は、当該推定タスクの遂行にも利用されてよい。

次に、第２のフェーズでは、本実施形態に係る学習装置１は、生成された少なくとも１つ以上の第２学習データセット２２７を取得する。そして、学習装置１は、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）の機械学習を再度実行してもよい。または、学習装置１は、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）とは別の学習モデルの教師あり学習を実施してもよい。教師あり学習により、学習済みの学習モデルは、学習済みの各ニューラルネットワーク（５０、５１）と同様に、所定の推定タスクの遂行に利用可能に構成される。

これに対して、本実施形態に係る推定装置３は、学習装置１により構築された学習済みの学習モデルを推定器として利用し、対象データに対して所定の推定タスクを遂行するように構成されたコンピュータである。学習済みの学習モデルには、上記第１ニューラルネットワーク５０、第２ニューラルネットワーク５１、及び別の学習モデルのいずれが利用されてもよい。

具体的に、推定装置３は、推定タスクを遂行する対象となる対象データを取得する。本実施形態では、推定装置３には、センサＳが接続されている。推定装置３は、このセンサＳから対象データを取得する。次に、推定装置３は、取得された対象データを学習済みの学習モデルに入力して、学習済みの学習モデルの演算処理を実行する。これにより、推定装置３は、対象データに含まれる特徴を推定した結果に対応する出力値を学習済みの学習モデルから取得する。そして、推定装置３は、推定の結果に関する情報を出力する。

以上のとおり、本実施形態では、各ニューラルネットワーク（５０、５１）において、出力層（５０７、５１７）よりも入力側に配置された層が注目層（５０３、５１７）に選択される。各ニューラルネットワーク（５０、５１）の出力層（５０７、５１７）の形式は、習得させる推定タスクの種類に依存する。これに対して、各ニューラルネットワーク（５０、５１）の出力層（５０７、５１７）より入力側に配置される層の形式は、推定タスクの種類に依存せずに設定可能である。そこで、本実施形態では、各ニューラルネットワーク（５０、５１）において、出力層（５０７、５１７）よりも入力側に配置された出力層（５０７、５１７）の出力を利用して、各件の第２訓練データ２２１に対する出力の不安定性を評価する。

ただし、機械学習において、第１訓練データ１２２の入力に対して、出力層（５０７、５１７）の出力値を第１正解データ１２３に適合させる訓練のみを実行した場合には、同一の入力データに対して、各注目層（５０３、５１３）の出力値はばらついてしまう。そこで、本実施形態では、機械学習において、当該訓練と共に、注目層（５０３、５１３）の出力値を互いに適合させる訓練を実行する。これにより、注目層（５０３、５１３）の出力が上記評価に利用可能となる。

したがって、本実施形態では、出力形式の共通する層を注目層（５０３、５１３）に設定することで、各ニューラルネットワーク（５０、５１）に習得させるタスクの種類に依存せずに、共通の指標を用いて、各件の第２訓練データ２２１に対する各ニューラルネットワーク（５０、５１）の出力の不安定性を評価することができる。また、上記の注目層（５０３、５１３）の出力値を互いに適合させる訓練を実行しているため、その評価の結果に基づいて、推定器の性能向上に寄与する程度の高いと推定される第２訓練データ２２３を適切に抽出することができる。よって、本実施形態によれば、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

なお、図１の例では、学習装置１、データ生成装置２、及び推定装置３は、ネットワークを介して互いに接続されている。ネットワークの種類は、例えば、インターネット、無線通信網、移動通信網、電話網、専用網等から適宜選択されてよい。ただし、各装置１～３の間でデータをやりとりする方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、各装置１～３の間では、記憶媒体を利用して、データがやりとりされてよい。

また、図１の例では、学習装置１、データ生成装置２、及び推定装置３は、それぞれ別個のコンピュータである。しかしながら、推定システム１００の構成は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、学習装置１、データ生成装置２、及び推定装置３のうちの少なくともいずれかのペアは一体のコンピュータであってよい。また、例えば、学習装置１、データ生成装置２、及び推定装置３のうちの少なくともいずれかは、複数台のコンピュータにより構成されてよい。

§２構成例
［ハードウェア構成］
＜学習装置＞
次に、図２を用いて、本実施形態に係る学習装置１のハードウェア構成の一例について説明する。図２は、本実施形態に係る学習装置１のハードウェア構成の一例を模式的に例示する。

図２に示されるとおり、本実施形態に係る学習装置１は、制御部１１、記憶部１２、通信インタフェース１３、入力装置１４、出力装置１５、及びドライブ１６が電気的に接続されたコンピュータである。なお、図２では、通信インタフェースを「通信Ｉ／Ｆ」と記載している。

制御部１１は、ハードウェアプロセッサであるＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等を含み、プログラム及び各種データに基づいて情報処理を実行するように構成される。記憶部１２は、メモリの一例であり、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部１２は、学習プログラム８１、第１データプール８５、第１学習結果データ１２５、第２学習結果データ１２７等の各種情報を記憶する。

学習プログラム８１は、上記各フェーズの機械学習に関する後述の情報処理（図８、図９、及び図１１）を学習装置１に実行させるためのプログラムである。学習プログラム８１は、当該情報処理の一連の命令を含む。第１データプール８５は、機械学習に利用されるデータセット（第１学習データセット１２１及び第２学習データセット２２７）を蓄積する。第１学習結果データ１２５は、第１のフェーズの機械学習により生成された学習済みの各ニューラルネットワーク（５０、５１）に関する情報を示す。第２学習結果データ１２７は、第２のフェーズの機械学習により生成された学習済みの学習モデルに関する情報を示す。各学習結果データ（１２５、１２７）は、学習プログラム８１を実行した結果として得られる。詳細は後述する。

通信インタフェース１３は、例えば、有線ＬＡＮ（Local Area Network）モジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。学習装置１は、この通信インタフェース１３を利用することで、ネットワークを介したデータ通信を他の情報処理装置（例えば、データ生成装置２、推定装置３等）と行うことができる。

入力装置１４は、例えば、マウス、キーボード等の入力を行うための装置である。また、出力装置１５は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。オペレータは、入力装置１４及び出力装置１５を介して、学習装置１を操作することができる。入力装置１４及び出力装置１５は、タッチパネルディスプレイ等により一体的に構成されてもよい。

ドライブ１６は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９１に記憶されたプログラムを読み込むためのドライブ装置である。ドライブ１６の種類は、記憶媒体９１の種類に応じて適宜選択されてよい。上記学習プログラム８１及び第１データプール８５の少なくともいずれかは、この記憶媒体９１に記憶されていてもよい。

記憶媒体９１は、コンピュータその他装置、機械等が記録されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。学習装置１は、この記憶媒体９１から、上記学習プログラム８１及び第１データプール８５の少なくともいずれかを取得してもよい。

ここで、図２では、記憶媒体９１の一例として、ＣＤ、ＤＶＤ等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体９１の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。

なお、学習装置１の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部１１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ（field-programmable gate array）、ＤＳＰ（digital signal processor）等で構成されてよい。記憶部１２は、制御部１１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース１３、入力装置１４、出力装置１５及びドライブ１６の少なくともいずれかは省略されてもよい。学習装置１は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、学習装置１は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ（Personal Computer）等であってもよい。

＜データ生成装置＞
次に、図３を用いて、本実施形態に係るデータ生成装置２のハードウェア構成の一例について説明する。図３は、本実施形態に係るデータ生成装置２のハードウェア構成の一例を模式的に例示する。

図３に示されるとおり、本実施形態に係るデータ生成装置２は、制御部２１、記憶部２２、通信インタフェース２３、入力装置２４、出力装置２５、及びドライブ２６が電気的に接続されたコンピュータである。本実施形態に係るデータ生成装置２の制御部２１～ドライブ２６はそれぞれ、上記学習装置１の制御部１１～ドライブ１６それぞれと同様に構成されてよい。

すなわち、制御部２１は、ハードウェアプロセッサであるＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部２２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。本実施形態では、記憶部２２は、データ生成プログラム８２、第２データプール８７、第１学習結果データ１２５等の各種情報を記憶する。

データ生成プログラム８２は、少なくとも１つ以上の第２学習データセット２２７を生成する後述の情報処理（図１０）をデータ生成装置２に実行させるためのプログラムである。データ生成プログラム８２は、当該情報処理の一連の命令を含む。第２データプール８７は、正解データの付与されていない第２訓練データ２２１を蓄積する。詳細は後述する。

通信インタフェース２３は、例えば、有線ＬＡＮモジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。データ生成装置２は、この通信インタフェース２３を利用することで、ネットワークを介したデータ通信を他の情報処理装置（例えば、学習装置１）と行うことができる。

入力装置２４は、例えば、マウス、キーボード等の入力を行うための装置である。出力装置２５は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。オペレータは、入力装置２４及び出力装置２５を介して、データ生成装置２を操作することができる。入力装置２４及び出力装置２５は、タッチパネルディスプレイ等により一体的に構成されてもよい。

ドライブ２６は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９２に記憶されたプログラムを読み込むためのドライブ装置である。上記データ生成プログラム８２、第２データプール８７、及び第１学習結果データ１２５のうちの少なくともいずれかは、記憶媒体９２に記憶されていてもよい。また、データ生成装置２は、記憶媒体９２から、上記データ生成プログラム８２、第２データプール８７、及び第１学習結果データ１２５のうちの少なくともいずれかを取得してもよい。記憶媒体９２の種類は、ディスク型であってもよいし、ディスク型以外であってもよい。

なお、データ生成装置２の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部２１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ、ＤＳＰ等で構成されてよい。記憶部２２は、制御部２１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース２３、入力装置２４、出力装置２５及びドライブ２６の少なくともいずれかは省略されてもよい。データ生成装置２は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、データ生成装置２は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ等であってもよい。

＜推定装置＞
次に、図４を用いて、本実施形態に係る推定装置３のハードウェア構成の一例について説明する。図４は、本実施形態に係る推定装置３のハードウェア構成の一例を模式的に例示する。

図４に示されるとおり、本実施形態に係る推定装置３は、制御部３１、記憶部３２、通信インタフェース３３、入力装置３４、出力装置３５、ドライブ３６、及び外部インタフェース３７が電気的に接続されたコンピュータである。なお、図４では、外部インタフェースを「外部Ｉ／Ｆ」と記載している。推定装置３の制御部３１～ドライブ３６はそれぞれ、上記学習装置１の制御部１１～ドライブ１６それぞれと同様に構成されてよい。

すなわち、制御部３１は、ハードウェアプロセッサであるＣＰＵ、ＲＡＭ、ＲＯＭ等を含み、プログラム及びデータに基づいて各種情報処理を実行するように構成される。記憶部３２は、例えば、ハードディスクドライブ、ソリッドステートドライブ等で構成される。記憶部３２は、推定プログラム８３、第２学習結果データ１２７等の各種情報を記憶する。

推定プログラム８３は、生成された学習済みの学習モデルを利用して、対象データに含まれる特徴を推定する後述の情報処理（図１２）を推定装置３に実行させるためのプログラムである。推定プログラム８３は、当該情報処理の一連の命令を含む。詳細は後述する。

通信インタフェース３３は、例えば、有線ＬＡＮモジュール、無線ＬＡＮモジュール等であり、ネットワークを介した有線又は無線通信を行うためのインタフェースである。推定装置３は、この通信インタフェース３３を利用することで、ネットワークを介したデータ通信を他の情報処理装置（例えば、学習装置１）と行うことができる。

入力装置３４は、例えば、マウス、キーボード等の入力を行うための装置である。出力装置３５は、例えば、ディスプレイ、スピーカ等の出力を行うための装置である。オペレータは、入力装置３４及び出力装置３５を介して、推定装置３を操作することができる。入力装置３４及び出力装置３５は、タッチパネルディスプレイ等により一体的に構成されてもよい。

ドライブ３６は、例えば、ＣＤドライブ、ＤＶＤドライブ等であり、記憶媒体９３に記憶されたプログラムを読み込むためのドライブ装置である。上記推定プログラム８３及び第２学習結果データ１２７のうちの少なくともいずれかは、記憶媒体９３に記憶されていてもよい。また、推定装置３は、記憶媒体９３から、上記推定プログラム８３及び第２学習結果データ１２７のうちの少なくともいずれかを取得してもよい。記憶媒体９３の種類は、ディスク型であってもよいし、ディスク型以外であってもよい。

外部インタフェース３７は、例えば、ＵＳＢ（Universal Serial Bus）ポート、専用ポート等であり、外部装置と接続するためのインタフェースである。外部インタフェース３７の種類及び数は、接続される外部装置の種類及び数に応じて適宜選択されてよい。本実施形態では、推定装置３は、外部インタフェース３７を介して、センサＳに接続される。

センサＳは、推定タスクの対象となる対象データを取得するのに利用される。センサＳの種類及び配置場所は、特に限定されなくてもよく、遂行する推定タスクの種類に応じて適宜決定されてよい。一例として、製造ラインで搬送される製品であって、画像に写る製品の外観検査を実施する場合には、センサＳには、カメラが選択されてよく、そのカメラは、製造ラインにより搬送される製品を観測可能なように適宜配置されてよい。なお、センサＳが通信インタフェースを備える場合、推定装置３は、外部インタフェース３７ではなく、通信インタフェース３３を介して、センサＳに接続されてよい。

なお、推定装置３の具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。例えば、制御部３１は、複数のハードウェアプロセッサを含んでもよい。ハードウェアプロセッサは、マイクロプロセッサ、ＦＰＧＡ、ＤＳＰ等で構成されてよい。記憶部３２は、制御部３１に含まれるＲＡＭ及びＲＯＭにより構成されてもよい。通信インタフェース３３、入力装置３４、出力装置３５、ドライブ３６及び外部インタフェース３７の少なくともいずれかは省略されてもよい。推定装置３は、複数台のコンピュータで構成されてもよい。この場合、各コンピュータのハードウェア構成は、一致していてもよいし、一致していなくてもよい。また、推定装置３は、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ等であってもよい。

［ソフトウェア構成］
＜学習装置＞
次に、図５Ａ及び図５Ｂを用いて、本実施形態に係る学習装置１のソフトウェア構成の一例について説明する。図５Ａ及び図５Ｂは、本実施形態に係る学習装置１のソフトウェア構成の一例を模式的に例示する。

学習装置１の制御部１１は、記憶部１２に記憶された学習プログラム８１をＲＡＭに展開する。そして、制御部１１は、ＲＡＭに展開された学習プログラム８１に含まれる命令をＣＰＵにより解釈及び実行して、各構成要素を制御する。これによって、図５Ａ及び図５Ｂに示されるとおり、本実施形態に係る学習装置１は、データ取得部１１１、学習処理部１１２、及び保存処理部１１３をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、学習装置１の各ソフトウェアモジュールは、制御部１１（ＣＰＵ）により実現される。

（第１のフェーズ）
図５Ａに示されるとおり、第１のフェーズでは、データ取得部１１１は、第１訓練データ１２２、及び第１訓練データ１２２に含まれる特徴を示す第１正解データ１２３の組み合わせによりそれぞれ構成された複数の第１学習データセット１２１を取得する。データ取得部１１１は、本発明の「第１データ取得部」の一例である。本実施形態では、第１データプール８５に学習データセットが蓄積されている。データ取得部１１１は、第１データプール８５から複数の第１学習データセット１２１を取得することができる。

学習処理部１１２は、取得された複数の第１学習データセット１２１を使用して、複数のニューラルネットワークの機械学習を実施する。本実施形態では、学習処理部１１２は、２つのニューラルネットワーク（５０、５１）の機械学習を実施する。各ニューラルネットワーク（５０、５１）は、入力側から出力側に並んで配置された複数の層を含んでいる。各ニューラルネットワーク（５０、５１）において、複数の層は、最も出力側に配置された出力層（５０７、５１７）及び出力層（５０７、５１７）よりも入力側に配置された注目層（５０３、５１３）を含んでいる。上記機械学習を実施することは、各第１学習データセット１２１について、各ニューラルネットワーク（５０、５１）に第１訓練データ１２２を入力すると、第１正解データ１２３に適合する出力値が出力層（５０７、５１７）から出力されると共に、注目層（５０３、５１３）から出力される出力値が互いに適合するように、各ニューラルネットワーク（５０、５１）を訓練することを含む。

保存処理部１１３は、上記機械学習により構築された学習済みの各ニューラルネットワーク（５０、５１）に関する情報を第１学習結果データ１２５として生成する。そして、保存処理部１１３は、生成された第１学習結果データ１２５を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、記憶媒体９１、外部記憶装置又はこれらの組み合わせであってよい。

（ニューラルネットワーク）
次に、各ニューラルネットワーク（５０、５１）の一例について説明する。本実施形態では、各ニューラルネットワーク（５０、５１）は、畳み込みニューラルネットワークである。

畳み込みニューラルネットワークは、一般的に、畳み込み層、プーリング層、及び全結合層を備えている。畳み込み層は、与えられたデータに対する畳み込み演算を行う層である。畳み込み演算とは、与えられたデータと所定のフィルタとの相関を算出する処理に相当する。例えば、画像の畳み込みを行うことで、フィルタの濃淡パターンと類似する濃淡パターンを入力される画像から検出することができる。畳み込み層は、この畳み込み演算に対応するニューロンであって、入力又は自分の層よりも前（入力側）に配置された層の出力の一部の領域に結合するニューロンを備えている。プーリング層は、プーリング処理を行う層である。プーリング処理は、与えられたデータのフィルタに対する応答の強かった位置の情報を一部捨て、当該データ内に現れる特徴の微小な位置変化に対する応答の不変性を実現する。例えば、プーリング層では、フィルタ内の最も大きな値が抽出され、それ以外の値が削除される。全結合層は、１又は複数のニューロンを備え、隣接する層の間のニューロン全てを結合した層である。

図５Ａの例では、各ニューラルネットワーク（５０、５１）は、入力側から出力側に並んで配置された複数の層（５０１～５０７、５１１～５１７）を備えている。最も入力側には、入力層（５０１、５１１）が配置されている。入力層（５０１、５１１）は、畳み込み層である。この入力層（５０１、５１１）の出力は、プーリング層（５０２、５１２）の入力に接続されている。このように、畳み込み層とプーリング層とは交互に配置されてよい。或いは、複数の畳み込み層が連続して配置されてよい。畳み込みニューラルネットワークでは、１又は複数の畳み込み層及び１又は複数のプーリング層を含む部分を備え、この部分の出力が全結合層に入力される構造を採用することが多い。

本実施形態では、この畳み込み層及びプーリング層が配置される部分において、注目層（５０３、５１３）は、中間層として配置されている。この注目層（５０３、５１３）は、畳み込み層である。この部分の最も出力側には、プーリング層（５０４、５１４）が配置されており、プーリング層（５０４、５１４）の出力が全結合層（５０６、５１６）の入力に接続されている。図５Ａの例では、全結合層は２層であり、最も出力側に配置される全結合層が、出力層（５０７、５１７）である。

出力層（５０７、５１７）の形式は、推定タスクの種類に応じて適宜選択されてよい。一例として、各ニューラルネットワーク（５０、５１）に分類タスクの遂行を習得させる場合には、出力層（５０７、５１７）は、各カテゴリの発生確率を出力するように構成されてよい。この場合、出力層（５０７、５１７）は、各カテゴリに対応するニューロンを含んでよい。この出力層（５０７、５１７）は、ソフトマックス層により構成されてよい。また、その他の例として、各ニューラルネットワーク（５０、５１）に回帰タスクの遂行を習得させる場合、出力層（５０７、５１７）は、回帰される値を出力するように構成されてよい。この場合、出力層（５０７、５１７）は、回帰される値の数に応じたニューロンを含んでよい。更に、その他の例として、各ニューラルネットワーク（５０、５１）にセグメンテーションの遂行を習得させる場合、出力層（５０７、５１７）は、抽出される範囲（例えば、中心位置及び画素数）を出力するように構成されてよい。この場合、出力層（５０７、５１７）は、この範囲を示す形式に応じたニューロンを含んでよい。

なお、各ニューラルネットワーク（５０、５１）の構造は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。各ニューラルネットワーク（５０、５１）は、例えば、正規化層、ドロップアウト層等の上記の層以外の他の種類の層を備えてもよい。図５Ａの例では、ニューラルネットワーク（５０、５１）の構造は同じであるが、ニューラルネットワーク（５０、５１）の構造は互いに相違していてもよい。

各ニューラルネットワーク（５０、５１）の複数の層（５０１～５０７、５１１～５１７）は、演算に利用される演算パラメータを備えている。具体的には、隣接する層のニューロン同士は適宜結合され、各結合には重み（結合荷重）が設定されている。また、各層（５０１～５０７、５１１～５１７）に含まれる各ニューロンには閾値が設定されている。基本的には、各入力と各重みとの積の和が閾値を超えているか否かによって各ニューロンの出力が決定される。つまり、各ニューラルネットワーク（５０、５１）の演算処理は、入力層（５０１、５１１）に入力データが入力されたときに、入力側から順に順伝播方向に、各層（５０１～５０７、５１１～５１７）に含まれる各ニューロンの発火判定を行うことにより構成される。各層（５０１～５０７、５１１～５１７）に含まれる各ニューロン間の結合の重み及び各ニューロンの閾値は、演算パラメータの一例である。

上記各ニューラルネットワーク（５０、５１）を訓練することは、各第１学習データセット１２１について、第１訓練データ１２２を入力層（５０１、５１１）に入力したときに、出力層（５０７、５１７）から出力される出力値と第１正解データ１２３との第１誤差が小さくなるように、かつ注目層（５０３、５１３）から出力される出力値の間の第２誤差が小さくなるように、各ニューラルネットワーク（５０、５１）の演算パラメータの値の調整を繰り返すことを備えてよい。

この調整を繰り返す過程において、演算パラメータの値を更新する程度を学習率により調節することができる。各誤差に関する学習率は、適宜設定されてよい。学習率は、設定値として与えられてもよいし、オペレータの指定により与えられてもよい。また、例えば、出力層（５０７、５１７）から出力される出力値と第１正解データ１２３との第１誤差に関する学習率は一定に設定されてよい。一方、注目層（５０３、５１３）から出力される出力値の間の第２誤差に関する学習率は、演算パラメータの値の調整を繰り返す度に大きくなるように設定されてよい。

なお、プーリング層（５０２、５０４、５１２、５１４）は、学習による調整の対象となる演算パラメータを有していない。このように、各ニューラルネットワーク（５０、５１）は、調整の対象とならない演算パラメータを有してもよい。

また、畳み込み層の出力値は、特徴マップと称される。本実施形態において、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）から出力される出力値が互いに適合することは、畳み込み層である注目層（５０３、５１３）より出力される特徴マップ（６０、６１）から導出されるアテンションマップ（６２、６３）が互いに一致することであってよい。すなわち、第２誤差は、アテンションマップ（６２、６３）の不一致性に基づいて算出されてよい。

（第２のフェーズ）
図５Ｂに示されるとおり、第２のフェーズでは、データ取得部１１１は、データ生成装置２により生成された少なくとも１つ以上の第２学習データセット２２７を取得する。学習処理部１１２は、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）の機械学習を再度実行してもよい。または、学習処理部１１２は、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）とは別の学習モデル５２の教師あり学習を実施してもよい。教師あり学習は、機械学習の一種である。教師あり学習では、学習モデル５２は、各訓練データ（１２２、２２３）の入力に対して、対応する各正解データ（１２３、２２５）に適合する出力値を出力するように訓練される。学習モデル５２は、教師あり学習を実施可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。この学習モデル５２には、例えば、ニューラルネットワーク、サポートベクタマシン、線形回帰モデル、決定木モデル等が用いられてよい。

上記機械学習により、所定の推定タスクの遂行に利用可能な学習済みの学習モデルが構築される。この学習済みの学習モデルは、ニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかである。保存処理部１１３は、この学習済みの学習モデルに関する情報を第２学習結果データ１２７として生成する。そして、保存処理部１１３は、生成された第２学習結果データ１２７を所定の記憶領域に保存する。所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、記憶媒体９１、外部記憶装置又はこれらの組み合わせであってよい。第２学習結果データ１２７の保存先は、第１学習結果データ１２５の保存先と同じであってもよいし、異なっていてもよい。

＜データ生成装置＞
次に、図６を用いて、本実施形態に係るデータ生成装置２のソフトウェア構成の一例について説明する。図６は、本実施形態に係るデータ生成装置２のソフトウェア構成の一例について模式的に例示する。

データ生成装置２の制御部２１は、記憶部２２に記憶されたデータ生成プログラム８２をＲＡＭに展開する。そして、制御部２１は、ＲＡＭに展開されたデータ生成プログラム８２に含まれる命令をＣＰＵにより解釈及び実行して、各構成要素を制御する。これによって、図６に示されるとおり、本実施形態に係るデータ生成装置２は、モデル取得部２１１、データ取得部２１２、評価部２１３、抽出部２１４、生成部２１５、及び出力部２１６をソフトウェアモジュールとして備えるコンピュータとして動作する。すなわち、本実施形態では、データ生成装置２の各ソフトウェアモジュールも、上記学習装置１と同様に、制御部２１（ＣＰＵ）により実現される。

モデル取得部２１１は、第１のフェーズで訓練された複数のニューラルネットワークを取得する。本実施形態では、モデル取得部２１１は、第１学習結果データ１２５を取得することで、訓練された上記２つのニューラルネットワーク（５０、５１）を取得することができる。データ取得部２１２は、複数件の第２訓練データ２２１を取得する。データ取得部２１２は、本発明の「第２データ取得部」の一例である。本実施形態では、第２データプール８７に正解データの付与されていない訓練データが蓄積されている。データ取得部２１２は、第２データプール８７から複数件の第２訓練データ２２１を取得することができる。

評価部２１３は、第１学習結果データ１２５を保持することで、訓練された各ニューラルネットワーク（５０、５１）を備える。評価部２１３は、第１学習結果データ１２５を参照して、訓練された各ニューラルネットワーク（５０、５１）の設定を行う。評価部２１３は、訓練された各ニューラルネットワーク（５０、５１）に各件の第２訓練データ２２１を入力することで、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）から出力値を取得する。評価部２１３は、注目層（５０３、５１３）から取得された出力値に基づいて、各件の第２訓練データ２２１に対する各ニューラルネットワーク（５０、５１）の出力の不安定性を示す評価値２２２を算出する。

本実施形態では、各ニューラルネットワーク（５０、５１）は畳み込みニューラルネットワークであり、各注目層（５０３、５１３）は畳み込み層である。評価部２１３は、注目層（５０３、５１３）の出力値として特徴マップ（６５、６６）を取得することができる。評価部２１３は、特徴マップ（６５、６６）からアテンションマップ（６７、６８）を算出し、算出されたアテンションマップ（６７、６８）に基づいて、各件の第２訓練データ２２１に対する評価値２２２を算出することができる。

抽出部２１４は、不安定性が高いと判定するための条件を評価値２２２が満たす少なくとも１件以上の第２訓練データ２２３を複数件の第２訓練データ２２１から抽出する。生成部２１５は、抽出された少なくとも１件以上の第２訓練データ２２３それぞれに対して、第２訓練データ２２３に含まれる特徴（すなわち、第２訓練データ２２３に対する所定の推定タスクの正解）を示す第２正解データ２２５の入力を受け付ける。そして、生成部２１５は、入力された第２正解データ２２５を対応する第２訓練データ２２３に付与することで、少なくとも１つ以上の第２学習データセット２２７を生成する。生成された各第２学習データセット２２７は、第２訓練データ２２３及び第２正解データ２２５の組み合わせにより構成される。

出力部２１６は、生成された少なくとも１つ以上の第２学習データセット２２７を学習モデルの教師あり学習に使用可能に出力する。一例として、出力部２１６は、この出力処理において、第２学習データセット２２７を第１データプール８５に格納してもよい。これにより、生成された第２学習データセット２２７は、学習モデルの教師あり学習に使用可能な状態で保存される。

＜推定装置＞
次に、図７を用いて、本実施形態に係る推定装置３のソフトウェア構成の一例について説明する。図７は、本実施形態に係る推定装置３のソフトウェア構成の一例を模式的に例示する。

推定装置３の制御部３１は、記憶部３２に記憶された推定プログラム８３をＲＡＭに展開する。そして、制御部３１は、ＲＡＭに展開された推定プログラム８３に含まれる命令をＣＰＵにより解釈及び実行して、各構成要素を制御する。これによって、図７に示されるとおり、本実施形態に係る推定装置３は、データ取得部３１１、推定部３１２、及び出力部３１３をソフトウェアモジュールとして備えるコンピュータとして構成される。すなわち、本実施形態では、推定装置３の各ソフトウェアモジュールも、上記学習装置１と同様に、制御部３１（ＣＰＵ）により実現される。

データ取得部３１１は、対象データ３２１を取得する。推定部３１２は、第２学習結果データ１２７を保持することで、学習済みの学習モデル７０を推定器として備える。学習済みの学習モデル７０は、上記第２のフェーズの機械学習により訓練されたニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかであってよい。推定部３１２は、第２学習結果データ１２７を参照して、学習済みの学習モデル７０の設定を行う。

推定部３１２は、取得された対象データ３２１を学習済みの学習モデル７０に入力して、学習済みの学習モデル７０の演算処理を実行する。これにより、推定部３１２は、対象データ３２１に含まれる特徴を推定した結果に対応する出力値を学習済みの学習モデル７０から取得する。つまり、推定部３１２は、この演算処理により、学習済みの学習モデル７０を利用して、対象データ３２１に対する推定タスクを遂行することができる。出力部３１３は、推定の結果に関する情報を出力する。

なお、推定装置３で利用可能な学習済みの学習モデルは、第２のフェーズの機械学習により構築された学習済みの学習モデルに限られなくてもよく、第１のフェーズの機械学習により構築されたニューラルネットワーク（５０、５１）の少なくともいずれかであってよい。この場合、推定部３１２は、第１学習結果データ１２５を保持することで、学習済みのニューラルネットワーク（５０、５１）の少なくともいずれかを備える。推定部３１２は、この学習済みのニューラルネットワーク（５０、５１）の少なくともいずれかを利用して、対象データ３２１に対する推定タスクを遂行してもよい。

＜その他＞
学習装置１、データ生成装置２及び推定装置３の各ソフトウェアモジュールに関しては後述する動作例で詳細に説明する。なお、本実施形態では、学習装置１、データ生成装置２及び推定装置３の各ソフトウェアモジュールがいずれも汎用のＣＰＵによって実現される例について説明している。しかしながら、以上のソフトウェアモジュールの一部又は全部が、１又は複数の専用のプロセッサにより実現されてもよい。また、学習装置１、データ生成装置２及び推定装置３それぞれのソフトウェア構成に関して、実施形態に応じて、適宜、ソフトウェアモジュールの省略、置換及び追加が行われてもよい。

§３動作例
（Ａ）第１のフェーズにおける機械学習
次に、図８を用いて、本実施形態に係る第１のフェーズにおける学習装置１の動作例について説明する。図８は、本実施形態に係る学習装置１の第１のフェーズにおける機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、学習方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ１０１）
ステップＳ１０１では、制御部１１は、データ取得部１１１として動作し、複数の第１学習データセット１２１を取得する。各第１学習データセット１２１は、第１訓練データ１２２、及び当該第１訓練データ１２２に含まれる特徴を示す第１正解データ１２３の組み合わせにより構成される。本実施形態では、予め生成された学習データセットを蓄積する第１データプール８５が記憶部１２に保持されている。制御部１１は、記憶部１２の第１データプール８５から複数の第１学習データセット１２１を取得する。

ただし、第１データプール８５の保存先は、記憶部１２に限られなくてもよく、実施の形態に応じて適宜選択されてよい。第１データプール８５は、例えば、記憶媒体９１、外部記憶装置等に保持されていてもよい。外部記憶装置は、学習装置１に接続された外付けの記憶装置であってよい。或いは、外部記憶装置は、例えば、ＮＡＳ（Network Attached Storage）等のデータサーバであってよい。また、第１データプール８５は、他のコンピュータに保持されていてもよい。この場合、制御部１１は、通信インタフェース１３、ドライブ１６等を介して、第１データプール８５にアクセスし、複数の第１学習データセット１２１を取得することができる。

また、第１学習データセット１２１の取得源は、第１データプール８５に限られなくてもよい。例えば、制御部１１は、第１学習データセット１２１を生成してもよい。或いは、制御部１１は、他のコンピュータにより生成された第１学習データセット１２１を取得してもよい。制御部１１は、少なくともいずれかにより、複数の第１学習データセット１２１を取得してもよい。

なお、各第１学習データセット１２１を生成する方法は、第１訓練データ１２２の種類、及び学習モデルに習得させる推定タスクの種類（すなわち、第１正解データ１２３により示される情報）に応じて適宜選択されてよい。一例として、センサＳと同種のセンサを用意し、用意したセンサにより様々な条件で観測を行うことで生成される各件のセンシングデータを第１訓練データ１２２として取得する。観測の対象は、学習モデルに習得させる推定タスクに応じて適宜選択されてよい。そして、得られた各件の第１訓練データ１２２に対して、当該各件の第１訓練データ１２２に現れる特徴を示す第１正解データ１２３を関連付ける。これにより、各第１学習データセット１２１を生成することができる。

各第１学習データセット１２１は、コンピュータの動作により自動的に生成されてもよいし、オペレータの操作により手動的に生成されてもよい。また、各第１学習データセット１２１の生成は、学習装置１により行われてもよいし、学習装置１以外の他のコンピュータにより行われてもよい。各第１学習データセット１２１を学習装置１が生成する場合、制御部１１は、自動的に又はオペレータの入力装置１４を介した操作により手動的に上記一連の処理を実行することで、複数の第１学習データセット１２１を取得することができる。一方、各第１学習データセット１２１を他のコンピュータが生成する場合、制御部１１は、例えば、ネットワーク、記憶媒体９１等を介して、他のコンピュータにより生成された複数の第１学習データセット１２１を取得することができる。他のコンピュータでは、自動的に又はオペレータの操作により手動的に上記一連の処理を実行することで、複数の第１学習データセット１２１が生成されてよい。一部の第１学習データセット１２１が学習装置１により生成され、その他の第１学習データセット１２１が１又は複数の他のコンピュータにより生成されてよい。

取得される第１学習データセット１２１の件数は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。複数の第１学習データセット１２１を取得すると、制御部１１は、次のステップＳ１０２に処理を進める。

（ステップＳ１０２）
ステップＳ１０２では、制御部１１は、学習処理部１１２として動作し、取得された複数の第１学習データセット１２１を使用して、複数のニューラルネットワークの機械学習を実施する。本実施形態では、制御部１１は、２つのニューラルネットワーク（５０、５１）の機械学習を実施する。

各ニューラルネットワーク（５０、５１）は、入力側から出力側に並んで配置された複数の層（５０１～５０７、５１１～５１７）を含んでいる。複数の層（５０１～５０７、５１１～５１７）は、最も出力側に配置された出力層（５０７、５１７）及び出力層（５０７、５１７）よりも入力側に配置された注目層（５０３、５１３）を含んでいる。制御部１１は、各第１学習データセット１２１の第１訓練データ１２２を入力データとして利用する。制御部１１は、出力層（５０７、５１７）の出力に対して、第１正解データ１２３を教師データとして利用する。制御部１１は、注目層（５０３、５１３）の出力に対して、当該注目層（５０３、５１３）の出力が一致することを教師データとして利用する。制御部１１は、これらのデータに基づいて、各ニューラルネットワーク（５０、５１）の学習処理を実行する。この学習処理には、バッチ勾配降下法、確率的勾配降下法、ミニバッチ勾配降下法等が用いられてよい。

＜機械学習＞
ここで、図９を更に用いて、ステップＳ１０２における機械学習の処理の一例を詳細に説明する。図９は、本実施形態に係る学習装置１による機械学習の処理手順の一例を例示する。本実施形態に係るステップＳ１０２の処理は、以下のステップＳ２０１～ステップＳ２０６の処理を含む。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ２０１）
ステップＳ２０１では、制御部１１は、機械学習の処理対象となる各ニューラルネットワーク（５０、５１）を用意する。

用意する各ニューラルネットワーク（５０、５１）の構造（例えば、層の数、各層の種類、各層に含まれるニューロンの数、隣接する層のニューロン同士の結合関係等）、各ニューロン間の結合の重みの初期値、及び各ニューロンの閾値の初期値は、テンプレートにより与えられてもよいし、オペレータの入力により与えられてもよい。テンプレートは、ニューラルネットワークの構造に関する情報、及びニューラルネットワークの演算パラメータの初期値に関する情報を含んでよい。

注目層は、テンプレートにおいて予め指定されていてもよいし、オペレータにより指定されてもよい。或いは、制御部１１は、用意された各ニューラルネットワーク（５０、５１）内で出力形式が共通する層を特定し、特定された層から注目層を適宜決定してもよい。注目層を決定する基準は、任意に設定されてよい。注目層を決定する基準では、例えば、層の出力数、層の種類等の属性が指定されてよい。制御部１１は、設定された基準に従って、特定された層から注目層を決定してもよい。

また、再学習を行う場合には、制御部１１は、過去の機械学習を行うことで得られた学習結果データに基づいて、処理対象となる各ニューラルネットワーク（５０、５１）を用意してもよい。

処理対象の各ニューラルネットワーク（５０、５１）を用意すると、制御部１１は、次のステップＳ２０２に処理を進める。

（ステップＳ２０２）
ステップＳ２０２では、制御部１１は、各第１学習データセット１２１について、第１訓練データ１２２を入力層（５０１、５１１）に入力し、各ニューラルネットワーク（５０、５１）の演算処理を実行する。すなわち、制御部１１は、入力側から順に、各層（５０１～５０７、５１１～５１７）に含まれる各ニューロンの発火判定を行う。この演算処理の結果、制御部１１は、出力層（５０７、５１７）から、第１訓練データ１２２に対して推定タスクを遂行した結果に対応する出力値を取得することができる。また、この演算処理の過程で、入力層（５０１、５１１）から注目層（５０３、５１３）までの演算を実行することで、制御部１１は、注目層（５０３、５１３）の出力値を取得することができる。注目層（５０３、５１３）及び出力層（５０７、５１７）それぞれからの出力値を取得すると、制御部１１は、次のステップＳ２０３に処理を進める。

（ステップＳ２０３）
ステップＳ２０３では、制御部１１は、各第１学習データセット１２１について、出力層（５０７、５１７）からの出力値と第１正解データ１２３との第１誤差を算出する。第１誤差の算出には、平均二乗誤差、交差エントロピー誤差等の公知の誤差関数が用いられてよい。誤差関数は、出力と教師データとの差分を評価する関数であり、当該差分が大きいほど、損失関数の値は大きくなる。制御部１１は、第１誤差の勾配を算出し、誤差逆伝播（Back propagation）法により、算出された勾配を逆伝播することで、各層（５０１～５０７、５１１～５１７）に含まれる演算パラメータ（例えば、各ニューロン間の結合の重み、各ニューロンの閾値等）の誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、演算パラメータの値を更新する。これにより、制御部１１は、出力層（５０７、５１７）から出力される出力値と第１正解データ１２３の第１誤差が小さくなるように、各ニューラルネットワーク（５０、５１）の演算パラメータの値を調整する。

第１誤差について、演算パラメータの値を更新する程度は、学習率により調節される。学習率は、機械学習において演算パラメータの値を更新する度合いを定める。学習率が大きいほど演算パラメータの更新量が大きくなり、学習率が小さいほど演算パラメータの更新量が小さくなる。この場合、制御部１１は、学習率を各誤差に掛け合わせて得られた値により、演算パラメータの値を更新する。第１誤差に関する学習率は、適宜与えられてよい。第１誤差に関する学習率の初期値は、例えば、オペレータの指定により与えられてもよいし、設定値として与えられてもよい。第１誤差に基づいて、各ニューラルネットワーク（５０、５１）の演算パラメータの値の調整が完了すると、制御部１１は、次のステップＳ２０４に処理を進める。

（ステップＳ２０４）
ステップＳ２０４では、制御部１１は、各第１学習データセット１２１について、注目層（５０３、５１３）から出力される出力値の間の第２誤差を算出する。第２誤差の算出には、注目層（５０３、５１３）の出力形式に応じて、平均二乗誤差等の公知の誤差関数が用いられてよい。

本実施形態では、注目層（５０３、５１３）は畳み込み層であり、制御部１１は、ステップＳ２０２において、注目層（５０３、５１３）の出力値として特徴マップ（６０、６１）を取得することができる。制御部１１は、特徴マップ（６０、６１）からアテンションマップ（６２、６３）を算出する。特徴マップからアテンションマップを算出する方法は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。

例えば、制御部１１は、特徴マップ（６０、６１）の各要素の絶対値をチャンネル方向に合計することで、アテンションマップ（６２、６３）を算出してもよい。入力データが画像データである場合、特徴マップ（６０、６１）の各要素は画素に対応する。特徴マップ（６０、６１）のチャンネル数は、畳み込み層によるフィルタの数及び入力データのチャンネル数に対応する。また、例えば、制御部１１は、特徴マップ（６０、６１）の各要素の絶対値のｎ乗をチャンネル方向に合計することで、アテンションマップ（６２、６３）を算出してもよい。ｎは、任意の数であってよい。また、例えば、制御部１１は、特徴マップ（６０、６１）の各要素の絶対値のｎ乗を算出し、算出されたｎ乗の値の最大値をチャンネル方向に抽出することで、アテンションマップ（６２、６３）を算出してもよい。この他、特徴マップからアテンションマップを算出する方法には、公知の方法が採用されてよい。

続いて、制御部１１は、算出されたアテンションマップ（６２、６３）の平均二乗誤差を算出することで、注目層（５０３、５１３）の出力値の間の第２誤差を算出することができる。なお、第２誤差を算出する方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、制御部１１は、特徴マップ（６０、６１）から直接的に第２誤差を算出してもよい。

次に、制御部１１は、第２誤差の勾配を算出し、誤差逆伝播法により、算出された勾配を注目層（５０３、５１３）から入力層（５０１、５１１）の方に逆伝播することで、入力層（５０１、５１１）から注目層（５０３、５１３）までに含まれる演算パラメータの誤差を算出する。そして、制御部１１は、算出された各誤差に基づいて、入力層（５０１、５１１）から注目層（５０３、５１３）までに含まれる演算パラメータの値を更新する。これにより、制御部１１は、注目層（５０３、５１３）の出力値の間の第２誤差が小さくなるように（すなわち、アテンションマップ（６２、６３）が互いに一致する方向に）、各ニューラルネットワーク（５０、５１）の演算パラメータの値を調整する。

なお、第２誤差による演算パラメータの調整は、このような例に限定されなくてもよく、必ずしも両方のニューラルネットワーク（５０、５１）において実行されなくてもよい。例えば、制御部１１は、ステップＳ２０４において、２つのニューラルネットワーク（５０、５１）のうちの一方を基準にし、残りの方の演算パラメータのみを調整するようにしてもよい。すなわち、ステップＳ２０４では、制御部１１は、ニューラルネットワーク（５０、５１）のうちの少なくともいずれかの入力層から注目層までに含まれる演算パラメータの値を調節する。３つ以上のニューラルネットワークが機械学習の処理の対象となる場合には、制御部１１は、全てのニューラルネットワークの演算パラメータの値を調整してもよいしもよい。或いは、制御部１１は、いずれか１つを基準にし、残りのニューラルネットワークの演算パラメータの値を調整するようにしてもよい。

また、第２誤差について、第１誤差と同様に、演算パラメータの値を更新する程度は、学習率により調節される。第２誤差に関する学習率は、適宜与えられてよい。第２誤差に関する学習率は、例えば、オペレータの指定により与えられてもよいし、設定値として与えられてもよい。第２誤差に基づいて、演算パラメータの値の調整が完了すると、制御部１１は、次のステップＳ２０５に処理を進める。

（ステップＳ２０５及びＳ２０６）
ステップＳ２０５では、制御部１１は、機械学習の処理（すなわち、各ニューラルネットワーク（５０、５１）の演算パラメータの値の調整）を繰り返すか否かを判定する。

繰り返すか否かを判定する基準は、適宜設定されてよい。例えば、機械学習を繰り返す規定回数が設定されてよい。規定回数は適宜与えられてよい。この規定回数は、例えば、設定値により与えられてもよいし、オペレータの指定により与えられてもよい。この場合、制御部１１は、ステップＳ２０２～ステップＳ２０４の一連の処理を実行した回数が規定回数に到達したか否かを判定する。当該一連の処理を実行した回数が規定回数に到達していない場合、制御部１１は、機械学習の処理を繰り返すと判定する。他方、当該一連の処理を実行した回数が規定回数に到達した場合、制御部１１は、機械学習の処理を繰り返さないと判定する。

また、例えば、上記各誤差が閾値以下になるまで、制御部１１は、機械学習の処理を繰り返してもよい。この場合、上記各誤差が閾値を超えている場合、制御部１１は、機械学習の処理を繰り返すと判定する。他方、上記各誤差が閾値以下である場合、制御部１１は、機械学習の処理を繰り返さないと判定する。この閾値は、適宜設定されてよい。閾値は、例えば、設定値により与えられてもよいし、オペレータの指定により与えられてもよい。

機械学習の処理を繰り返すと判定した場合、制御部１１は、次のステップＳ２０６に処理を進める。一方、機械学習の処理を繰り返さないと判定した場合、制御部１１は、機械学習の処理を終了する。

ステップＳ２０６では、制御部１１は、第２誤差に関する学習率の値を大きくする。学習率の増加量は、適宜決定されてよい。例えば、制御部１１は、学習率の元の値に一定の値を加算することで、第２誤差に関する学習率の値を大きくしてもよい。また、例えば、制御部１１は、実行回数が多いほど大きな値になるように実行回数と学習率の値との間の関係を規定した関数を利用して、学習率の値を決定してもよい。実行回数が多いほど、学習率の増加量が小さくなるように設定されてもよい。第２誤差に関する学習率の値を変更した後、制御部１１は、ステップＳ２０２から処理を繰り返す。これにより、本実施形態では、第２誤差に関する学習率は、演算パラメータの値の調整を繰り返す度に大きくなるように設定される。

機械学習の初期段階では、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）の出力値は大きく相違する可能性がある。制御部１１は、このステップＳ２０６により、第２誤差に関する学習率を徐々に大きな値にすることで、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）の出力値を互いに適合させるための学習を適切に収束させることができる。

ただし、第２誤差に関する学習率の設定は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、第２誤差に関する学習率の設定は、一定の値に設定されてもよい。この場合、本ステップＳ２０６の処理は省略されてよく、制御部１１は、第２誤差に関する学習率の値を変更せずに、ステップＳ２０２から処理を繰り返してもよい。

なお、第１誤差に関する学習率は適宜設定されてよい。制御部１１は、第２誤差に関する学習率と同様に、第１誤差に関する学習率を、演算パラメータの値の調整を繰り返す度に大きくなるように設定してもよい。この場合、制御部１１は、ステップＳ２０６の処理と同様に、第１誤差に関する学習率の値も大きくした後に、ステップＳ２０２から処理を繰り返す。或いは、第１誤差に関する学習率は、一定の値に設定されてもよい。この場合、第１誤差に関する学習率は一定の値のままで、制御部１１は、ステップＳ２０２から処理を繰り返す。

以上により、ステップＳ２０３及びステップＳ２０４の処理を繰り返した後、制御部１１は、機械学習の処理を終了する。ステップＳ２０３の処理が繰り返されることで、各ニューラルネットワーク（５０、５１）は、各第１学習データセット１２１について、各ニューラルネットワーク（５０、５１）に第１訓練データ１２２を入力すると、第１正解データ１２３に適合する出力値が出力層（５０７、５１７）から出力されるように訓練される。加えて、ステップＳ２０４の処理が繰り返されることで、各ニューラルネットワーク（５０、５１）は、注目層（５０３、５１３）から出力される出力値が互いに適合するように訓練される。本実施形態では、各ニューラルネットワーク（５０、５１）は、注目層（５０３、５１３）より出力される特徴マップ（６０、６１）から導出されるアテンションマップ（６２、６３）が互いに一致するように訓練される。この「一致する」ことには、閾値以下の誤差が生じることが含まれてよい。機械学習の処理が完了すると、制御部１１は、次のステップＳ１０３に処理を進める。

なお、機械学習の処理は、このような例に限定されなくてもよく、実施の形態に応じて適宜変更されてよい。例えば、ステップＳ２０３及びステップＳ２０４の処理の順序は入れ替わってもよい。或いは、ステップＳ２０３及びステップＳ２０４の処理は並列に実行されてもよい。また、上記のようにステップＳ２０３及びステップＳ２０４の処理を繰り返し連続して実行するのではなく、又は繰り返し連続して実行すると共に、制御部１１は、ステップＳ２０３及びステップＳ２０４の処理を単独で繰り返し実行してもよい。

（ステップＳ１０３）
図８に戻り、ステップＳ１０３では、制御部１１は、保存処理部１１３として動作し、機械学習により構築された学習済みの各ニューラルネットワーク（５０、５１）に関する情報を第１学習結果データ１２５として生成する。第１学習結果データ１２５は、訓練された各ニューラルネットワーク（５０、５１）を再現可能に構成される。例えば、第１学習結果データ１２５は、各ニューラルネットワーク（５０、５１）の構造及び演算パラメータの値を示す情報を含んでよい。そして、制御部１１は、生成された第１学習結果データ１２５を所定の記憶領域に保存する。

所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、記憶媒体９１、外部記憶装置又はこれらの組み合わせであってよい。外部記憶装置は、例えば、ＮＡＳ等のデータサーバであってもよい。この場合、制御部１１は、通信インタフェース１３を利用して、ネットワークを介してデータサーバに第１学習結果データ１２５を格納してもよい。また、外部記憶装置は、例えば、学習装置１に接続された外付けの記憶装置であってよい。第１学習結果データ１２５を保存すると、制御部１１は、第１のフェーズにおける機械学習に関する一連の処理を終了する。

（Ｂ）学習データセットの生成
次に、図１０を用いて、本実施形態に係るデータ生成装置２の動作例について説明する。図１０は、本実施形態に係るデータ生成装置２による学習データセットの生成に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、データ生成方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ３０１）
ステップＳ３０１では、制御部２１は、モデル取得部２１１として動作し、第１のフェーズで訓練された複数のニューラルネットワークを取得する。本実施形態では、制御部２１は、第１学習結果データ１２５を取得することで、訓練された上記２つのニューラルネットワーク（５０、５１）を取得する。

学習装置１により生成された第１学習結果データ１２５は、任意のタイミングでデータ生成装置２に提供されてよい。例えば、学習装置１の制御部１１は、上記ステップＳ１０３の処理として又は上記ステップＳ１０３とは別に、第１学習結果データ１２５をデータ生成装置２に転送してもよい。制御部２１は、この転送を受け付けることで、第１学習結果データ１２５を取得してもよい。また、例えば、制御部２１は、通信インタフェース２３を利用して、学習装置１又はデータサーバにネットワークを介してアクセスすることで、第１学習結果データ１２５を取得してもよい。また、例えば、制御部２１は、記憶媒体９２を介して、第１学習結果データ１２５を取得してもよい。本ステップＳ３０１を実行する前に、上記いずれかの取得処理により、第１学習結果データ１２５既に記憶部２２に格納されていてもよい。この場合、制御部２１は、記憶部２２から第１学習結果データ１２５を取得してもよい。第１学習結果データ１２５を取得すると、制御部２１は、次のステップＳ３０２に処理を進める。

なお、第１学習結果データ１２５は、データ生成装置２に予め組み込まれていてもよい。この場合、ステップＳ３０１の処理は省略されてよい。また、データ生成装置２のソフトウェア構成からモデル取得部２１１は省略されてよい。

（ステップＳ３０２）
ステップＳ３０２では、制御部２１は、データ取得部２１２として動作し、複数件の第２訓練データ２２１を取得する。第２訓練データ２２１は、第１訓練データ１２２と同種のデータである。本字氏形態では、正解データの付与されていない訓練データを蓄積する第２データプール８７が記憶部２２に保持されている。制御部２１は、記憶部２２の第２データプール８７から複数件の第２訓練データ２２１を取得する。

ただし、第２データプール８７の保存先は、記憶部２２に限られなくてもよく、実施の形態に応じて適宜選択されてよい。第２データプール８７は、例えば、記憶媒体９２、外部記憶装置等に保持されていてもよい。外部記憶装置は、データ生成装置２に接続された外付けの記憶装置であってもよい。或いは、外部記憶装置は、例えば、ＮＡＳ等のデータサーバであってよい。また、第２データプール８７は、他のコンピュータに保持されてもよい。この場合、制御部２１は、通信インタフェース２３、ドライブ２６等を介して、第２データプール８７にアクセスし、複数件の第２訓練データ２２１を取得することができる。

また、第２訓練データ２２１の取得源は、第２データプール８７に限られなくてもよい。例えば、制御部２１は、第２訓練データ２２１を生成してもよい。或いは、制御部２１は、他のコンピュータにより生成された第２訓練データ２２１を取得してもよい。この場合、制御部２１は、例えば、ネットワーク、記憶媒体９２等を介して、他のコンピュータにより生成された第２訓練データ２２１を取得することができる。制御部２１は、少なくともいずれかにより、複数件の第２訓練データ２２１を取得してもよい。

なお、第２訓練データ２２１を生成する方法は、上記第１訓練データ１２２を生成する方法と同様であってよい。第２訓練データ２２１は、コンピュータの動作により自動的に生成されてもよいし、オペレータの操作により手動的に生成されてもよい。複数件の第２訓練データ２２１のうちの一部をデータ生成装置２が生成し、残りを他のコンピュータが生成してもよい。

取得される第２訓練データ２２１の件数は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。複数件の第２訓練データ２２１を取得すると、制御部２１は、次のステップＳ３０３に処理を進める。

（ステップＳ３０３）
ステップＳ３０３では、制御部２１は、評価部２１３として動作し、第１学習結果データ１２５を参照して、訓練された各ニューラルネットワーク（５０、５１）の設定を行う。そして、制御部２１は、訓練された各ニューラルネットワーク（５０、５１）の入力層（５０１、５１１）に各件の第２訓練データ２２１を入力し、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）までの演算処理を実行する。すなわち、制御部２１は、各件の第２訓練データ２２１を入力層（５０１、５１１）に入力し、入力側から順に、入力層（５０１、５１１）から注目層（５０３、５１３）までに含まれる各ニューロンの発火判定を行う。これにより、制御部２１は、各ニューラルネットワーク（５０、５１）の注目層（５０３、５１３）から出力値を取得する。注目層（５０３、５１３）からの出力値を取得すると、制御部２１は、次のステップＳ３０４に処理を進める。

（ステップＳ３０４）
ステップＳ３０４では、制御部２１は、評価部２１３として動作し、取得された出力値に基づいて、各件の第２訓練データ２２１に対する各ニューラルネットワーク（５０、５１）の出力の不安定性を示す評価値２２２を算出する。

注目層（５０３、５１３）の出力値と評価値２２２との間の関係は、獲得関数により数学的に記述されてよい。獲得関数は、注目層（５０３、５１３）の出力値のばらつきが大きいほど、算出される評価値２２２が高い不安定性を示すように適宜定義されてよい。制御部２１は、注目層（５０３、５１３）から取得された出力値を獲得関数に代入することで、各件の第２訓練データ２２１に対する評価値２２２を算出することができる。

一例として、本実施形態では、注目層（５０３、５１３）は畳み込み層であり、注目層（５０３、５１３）の出力値は、特徴マップ（６５、６６）として取得される。制御部２１は、特徴マップ（６５、６６）からアテンションマップ（６７、６８）を算出する。アテンションマップ（６７、６８）を算出する方法は、上記アテンションマップ（６２、６３）を算出する方法と同様であってよい。

続いて、制御部２１は、全ての要素の総和が１になるように、アテンションマップ（６７、６８）を正規化する。正規化されたアテンションマップ（６７、６８）は、ソフトマックス関数の出力と同様の性質を有する。そのため、制御部２１は、ソフトマックス関数の出力に利用される獲得関数を、正規化されたアテンションマップ（６７、６８）に適用してもよい。例えば、制御部２１は、以下の式１～式３のＨ、Ｉ、及びＶのいずれかを評価値２２２として算出してもよい。

なお、ｓは、アテンションマップの各要素を示し、ｉは、アテンションマップの各要素の値を示す。ｐ(ｓ=ｉ|ｘ，ｗ_t)は、アテンションマップの各要素が値ｉである確率を示す。ｘは、入力データ（すなわち、第２訓練データ２２１）を示し、ｗ_tは、各ニューラルネットワークを示す。Ｓはアテンションマップの要素数を示す。ｔは、ニューラルネットワークのインデックスを示し、Ｔは、ニューラルネットワークの数（本実施形態では、２）を示す。オーバーラインは、平均値を示す。ただし、評価値２２２を算出する方法は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。各件の第２訓練データ２２１に対する評価値２２２を算出すると、制御部２１は、次のステップＳ３０５に処理を進める。

（ステップＳ３０５）
ステップＳ３０５では、制御部２１は、抽出部２１４として動作し、不安定性が高いと判定するための条件を評価値２２２が満たす少なくとも１件以上の第２訓練データ２２３を複数件の第２訓練データ２２１から抽出する。

第２訓練データ２２３を抽出するための条件は、特に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。例えば、制御部２１は、不安定性の最も高いものから任意数の第２訓練データ２２３を複数件の第２訓練データ２２１から抽出してもよい。この場合、抽出する数は、設定値として与えられてもよいし、オペレータの指定により与えられてよい。また、例えば、制御部２１は、評価値２２２と閾値とを比較し、不安定性が閾値を超える第２訓練データ２２３を複数件の第２訓練データ２２１から抽出してもよい。この場合、閾値は、設定値として与えられてもよいし、オペレータの指定により与えられてもよい。少なくとも１件以上の第２訓練データ２２３を抽出すると、制御部２１は、次のステップＳ３０６に処理を進める。

（ステップＳ３０６）
ステップＳ３０６では、制御部２１は、生成部２１５として動作し、抽出された少なくとも１件以上の第２訓練データ２２３それぞれに対して、第２訓練データ２２３に含まれる特徴（すなわち、第２訓練データ２２３に対する所定の推定タスクの正解）を示す第２正解データ２２５の入力を受け付ける。続いて、制御部２１は、入力された第２正解データ２２５を対応する第２訓練データ２２３に関連付ける。これにより、制御部２１は、第２訓練データ２２３及び第２正解データ２２５の組み合わせによりそれぞれ構成される少なくとも１つ以上の第２学習データセット２２７を生成する。

第２正解データ２２５の入力を受け付ける方法は、特に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。例えば、制御部２１は、入力装置２４を介してオペレータの入力を受け付けてもよい。また、例えば、第２訓練データ２２３と同種のデータに対して同種の推定タスクを遂行する推定器が存在する場合には、制御部２１は、この推定器の推定結果の入力を受け付けてもよい。すなわち、制御部２１は、この推定器を利用して、第２訓練データ２２３に対して所定の推定タスクを遂行した結果を第２正解データ２２５として取得してもよい。この推定器の種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。この推定器は、例えば、学習済みの学習モデル７０と同様であってよい。少なくとも１つ以上の第２学習データセット２２７を生成すると、制御部２１は、次のステップＳ３０７に処理を進める。

（ステップＳ３０７）
ステップＳ３０７では、制御部２１は、出力部２１６として動作し、生成された少なくとも１つ以上の第２学習データセット２２７を学習モデルの教師あり学習に使用可能に出力する。

出力方法は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。一例として、制御部２１は、この出力処理において、生成された第２学習データセット２２７を第１データプール８５に格納してもよい。これにより、生成された第２学習データセット２２７は、学習装置１により学習モデルの教師あり学習に使用可能な状態で保存される。その他の例として、制御部２１は、この出力処理において、生成された第２学習データセット２２７を、学習モデルの教師あり学習を実行するコンピュータに対して送信してもよい。また、その他の例として、制御部２１は、生成された第２学習データセット２２７を、学習モデルの教師あり学習を実行するコンピュータが取得可能な状態で、所定の記憶領域に保存してもよい。所定の記憶領域は、例えば、制御部２１内のＲＡＭ、記憶部２２、記憶媒体９２、外部記憶装置又はこれらの組み合わせであってよい。外部記憶装置は、例えば、ＮＡＳ等のデータサーバであってもよいし、データ生成装置２に接続された外付けの記憶装置であってもよい。生成された少なくとも１つ以上の第２学習データセット２２７を出力すると、制御部２１は、学習データセットの生成に関する一連の処理を終了する。

（Ｃ）第２のフェーズにおける機械学習
次に、図１１を用いて、本実施形態に係る第２のフェーズにおける学習装置１の動作例について説明する。図１１は、本実施形態に係る学習装置１の第２のフェーズにおける機械学習に関する処理手順の一例を示すフローチャートである。以下で説明する処理手順は、学習方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。学習方法には、上記第１のフェーズの学習方法及びデータ生成方法が更に含まれてもよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ５０１）
ステップＳ５０１では、制御部１１は、データ取得部１１１として動作し、データ生成装置２により生成された少なくとも１つ以上の第２学習データセット２２７を取得する。

本実施形態では、制御部１１は、上記ステップＳ３０７の処理の後、第１データプール８５から少なくとも１つ以上の第２学習データセット２２７を取得することができる。ただし、第２学習データセット２２７の取得先は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。例えば、制御部１１は、データ生成装置２から直接的に又は間接的に第２学習データセット２２７を取得してもよい。

更に、制御部１１は、上記ステップＳ１０１と同様に、複数の１つ以上の第１学習データセット１２１を取得する。各学習データセット（１２１、２２７）を取得すると、制御部１１は、次のステップＳ５０２に処理を進める。

（ステップＳ５０２）
ステップＳ５０２では、制御部１１は、学習処理部１１２として動作し、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、学習モデルの機械学習を実施する。

制御部１１は、ステップＳ５０２の処理として、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）の機械学習を再度実行してもよい。この再学習において、複数のニューラルネットワークのうちの少なくともいずれかの機械学習が省略されてもよい。本実施形態では、２つのニューラルネットワーク（５０、５１）のうちの少なくとも一方の機械学習が省略されてもよい。

また、この再学習において、第１のフェーズのステップＳ１０２と同様に、各訓練データ（１２２、２２３）の入力に対して、出力層（５０７、５１７）の出力値を各正解データ（１２３、２２５）に適合させる訓練（ステップＳ２０３）、及び注目層（５０３、５１３）の出力値を互いに適合させる訓練（ステップＳ２０４）の両方が実行されてもよい。或いは、前者の訓練のみが実行され、後者の訓練は省略されてよい。つまり、出力層（５０７、５１７）の出力値を各正解データ（１２３、２２５）に適合させる訓練のみが実行されてよい。

または、制御部１１は、ステップＳ５０２の処理として、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）とは別の学習モデル５２の教師あり学習を実施してもよい。この学習モデル５２は、教師あり学習を実施可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。この学習モデル５２には、ニューラルネットワークの他、例えば、サポートベクタマシン、線形回帰モデル、決定木モデル等が用いられてよい。学習モデル５２にニューラルネットワークを採用する場合、学習モデル５２の構造は、各ニューラルネットワーク（５０、５１）のいずれかと同じであってもよいし、ニューラルネットワーク（５０、５１）の両方と相違してもよい。

教師あり学習では、学習モデル５２は、各学習データセット（１２１、２２７）について、各訓練データ（１２２、２２３）の入力に対して、対応する各正解データ（１２３、２２５）に適合する出力値を出力するように訓練される。教師あり学習の方法は、学習モデル５２の種類に応じて適宜選択されてよい。教師あり学習の方法には、誤差逆伝播法、回帰分析、ランダムフォレスト等の公知の方法が採用されてよい。これにより、学習済みの学習モデル５２は、学習済みの各ニューラルネットワーク（５０、５１）と同様に、所定の推定タスクの遂行に利用可能に訓練される。

上記機械学習により、学習済みの学習モデルが構築される。この学習済みの学習モデルは、ニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかである。機械学習の処理が完了すると、制御部１１は、次のステップＳ５０３に処理を進める。

（ステップＳ５０３）
ステップＳ５０３では、制御部１１は、保存処理部１１３として動作し、上記学習済みの学習モデルに関する情報を第２学習結果データ１２７として生成する。第２学習結果データ１２７は、ステップＳ５０２の処理により構築された学習済みの学習モデルを再現可能に構成される。例えば、第２学習結果データ１２７は、学習済みの学習モデルの構造及び演算パラメータの値を示す情報を含んでよい。そして、制御部１１は、生成された第２学習結果データ１２７を所定の記憶領域に保存する。

所定の記憶領域は、例えば、制御部１１内のＲＡＭ、記憶部１２、記憶媒体９１、外部記憶装置又はこれらの組み合わせであってよい。外部記憶装置は、例えば、ＮＡＳ等のデータサーバであってもよい。この場合、制御部１１は、通信インタフェース１３を利用して、ネットワークを介してデータサーバに第２学習結果データ１２７を格納してもよい。また、外部記憶装置は、例えば、学習装置１に接続された外付けの記憶装置であってよい。第２学習結果データ１２７の保存先は、第１学習結果データ１２５の保存先と同じであってもよいし、異なっていてもよい。第２学習結果データ１２７を保存すると、制御部１１は、第２のフェーズにおける機械学習に関する一連の処理を終了する。

なお、生成された第２学習結果データ１２７は、任意のタイミングで推定装置３に提供されてよい。例えば、制御部１１は、ステップＳ５０３の処理として又はステップＳ５０３の処理とは別に、第２学習結果データ１２７を推定装置３に転送してもよい。推定装置３は、この転送を受け付けることで、第２学習結果データ１２７を取得してもよい。また、例えば、推定装置３は、通信インタフェース３３を利用して、学習装置１又はデータサーバにネットワークを介してアクセスすることで、第２学習結果データ１２７を取得してもよい。また、例えば、推定装置３は、記憶媒体９３を介して、第２学習結果データ１２７を取得してもよい。第２学習結果データ１２７は、推定装置３に予め組み込まれてもよい。

また、ステップＳ５０２において、上記ステップＳ１０２と同様に、各ニューラルネットワーク（５０、５１）の再学習を実施した場合、生成された第２学習結果データ１２７は、任意のタイミングでデータ生成装置２に提供されてよい。これにより、再学習された各ニューラルネットワーク（５０、５１）が、上記学習データセットの生成処理に利用されてよい。この学習データセットの生成処理と各ニューラルネットワーク（５０、５１）の再学習の処理とは交互に繰り返し実行されてよい。

（Ｄ）推定タスクの遂行
次に、図１２を用いて、本実施形態に係る推定装置３の動作例について説明する。図１２は、本実施形態に係る推定装置３の処理手順の一例を示すフローチャートである。以下で説明する処理手順は、推定方法の一例である。ただし、以下で説明する処理手順は一例に過ぎず、各処理は可能な限り変更されてよい。推定方法には、上記学習方法及びデータ生成方法が更に含まれてよい。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。

（ステップＳ７０１）
ステップＳ７０１では、制御部３１は、データ取得部３１１として動作し、推定タスクを遂行する対象となる対象データ３２１を取得する。本実施形態では、推定装置３は、外部インタフェース３７を介してセンサＳに接続されている。そのため、制御部３１は、外部インタフェース３７を介して、センサＳにより生成されるセンシングデータを対象データ３２１として取得する。

ただし、対象データ３２１を取得する経路は、このような例に限定されなくてもよく、実施の形態に応じて適宜決定されてよい。例えば、推定装置３とは異なる他のコンピュータにセンサＳが接続されていてもよい。この場合、制御部３１は、他のコンピュータから対象データ３２１の送信を受け付けることで、対象データ３２１を取得してもよい。対象データ３２１を取得すると、制御部３１は、次のステップＳ７０２に処理を進める。

（ステップＳ７０２）
ステップＳ７０２では、制御部３１は、推定部３１２として動作し、学習済みの学習モデル７０を利用して、取得された対象データ３２１に含まれる特徴を推定する。

本実施形態では、学習済みの学習モデル７０は、上記第２のフェーズの機械学習により訓練されたニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかである。制御部３１は、第２学習結果データ１２７を参照して、学習済みの学習モデル７０の設定を行う。そして、制御部３１は、取得された対象データ３２１を学習済みの学習モデル７０に入力して、学習済みの学習モデル７０の演算処理を実行する。演算処理は、学習済みの学習モデル７０の種類に応じて適宜選択されてよい。これにより、制御部３１は、対象データ３２１に含まれる特徴を推定した結果に対応する出力値を学習済みの学習モデル７０から取得する。つまり、制御部３１は、この演算処理により、対象データ３２１に含まれる特徴を推定することができる。対象データ３２１に含まれる特徴の推定が完了すると、制御部３１は、次のステップＳ７０３に処理を進める。

（ステップＳ７０３）
ステップＳ７０３では、制御部３１は、出力部３１３として動作し、推定の結果に関する情報を出力する。

出力先及び出力する情報の内容はそれぞれ、実施の形態に応じて適宜決定されてよい。例えば、制御部３１は、対象データ３２１に含まれる特徴を推定した結果をそのまま出力装置３５に出力してもよい。また、例えば、制御部３１は、推定の結果に基づいて、何らかの情報処理を実行してもよい。そして、制御部３１は、その情報処理を実行した結果を推定の結果に関する情報として出力してもよい。この情報処理を実行した結果の出力には、推定の結果に応じて警告等の特定のメッセージを出力すること、推定の結果に応じて制御対象装置の動作を制御すること等が含まれてよい。出力先は、例えば、出力装置３５、制御対象装置等であってよい。推定の結果に関する情報の出力が完了すると、制御部３１は、学習済みの学習モデル７０を利用した推定処理に関する一連の処理を終了する。

なお、推定装置３で利用可能な学習済みの学習モデルは、第２のフェーズの機械学習により構築された学習済みの学習モデル７０に限られなくてもよい。第１のフェーズの機械学習により構築されたニューラルネットワーク（５０、５１）の少なくともいずれかが推定装置３で利用されてもよい。この場合、第１のフェーズで生成された第１学習結果データ１２５が、任意のタイミングで推定装置３に提供されてよい。或いは、第１学習結果データ１２５は、推定装置３に予め組み込まれてもよい。これにより、推定装置３は、上記学習済みの学習モデル７０の代わりに、第１のフェーズで学習済みのニューラルネットワーク（５０、５１）の少なくともいずれかを利用して、上記ステップＳ７０１～ステップＳ７０３の処理を実行してもよい。

［特徴］
以上のとおり、本実施形態では、各ニューラルネットワーク（５０、５１）において、出力層（５０７、５１７）よりも入力側に配置された層が注目層（５０３、５１７）に選択される。各ニューラルネットワーク（５０、５１）の出力層（５０７、５１７）の形式は、習得させる推定タスクの種類に依存する。これに対して、各ニューラルネットワーク（５０、５１）の出力層（５０７、５１７）より入力側に配置される層の形式は、推定タスクの種類に依存せずに設定可能である。

ただし、ステップＳ１０２の機械学習において、第１訓練データ１２２の入力に対して、出力層（５０７、５１７）の出力値を第１正解データ１２３に適合させる訓練（ステップＳ２０３）のみを実行した場合には、同一の入力データに対して、各注目層（５０３、５１３）の出力値はばらついてしまう。そこで、本実施形態では、ステップＳ１０２の機械学習において、ステップＳ２０３の訓練と共に、ステップＳ２０４による注目層（５０３、５１３）の出力値を互いに適合させる訓練を実行する。これにより、ステップＳ３０４及びステップＳ３０５において、注目層（５０３、５１３）の出力値に基づいて、各件の第２訓練データ２２１に対する出力の不安定性を適切に評価することができるようになる。

したがって、本実施形態では、出力形式の共通する層を注目層（５０３、５１３）に設定することで、各ニューラルネットワーク（５０、５１）に習得させるタスクの種類に依存せずに、共通の指標を用いて、各件の第２訓練データ２２１に対する各ニューラルネットワーク（５０、５１）の出力の不安定性を評価することができる。つまり、各ニューラルネットワーク（５０、５１）の出力層（５０７、５１７）の出力形式を推定タスクの種類に応じて変更した場合でも、ステップＳ３０４において、獲得関数を変更せずに、各件の第２訓練データ２２１に対する出力の不安定性を評価することができる。また、ステップＳ２０４により、注目層（５０３、５１３）の出力値を互いに適合させる訓練を実行しているため、ステップＳ３０５では、その評価の結果に基づいて、推定器の性能向上に寄与する程度の高いと推定される第２訓練データ２２３を適切に抽出することができる。よって、本実施形態によれば、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。

また、本実施形態に係る学習装置１は、第２のフェーズにおいて、アクティブラーニングにより抽出された第２訓練データ２２３を更に使用して、より性能の高い学習済みの学習モデルを効率的に生成することができる。そして、本実施形態に係る推定装置３は、第２のフェーズにより生成された学習済みの学習モデルを利用することで、所定の推定タスクを精度よく遂行することができる。

§４変形例
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。例えば、以下のような変更が可能である。なお、以下では、上記実施形態と同様の構成要素に関しては同様の符号を用い、上記実施形態と同様の点については、適宜説明を省略した。以下の変形例は適宜組み合わせ可能である。

＜４．１＞
上記実施形態に係る推定システム１００は、センサＳにより得られるセンシングデータに含まれる特徴を推定する場面に適用されている。しかしながら、上記実施形態の適用範囲は、このような例に限定される訳ではない。上記実施形態は、任意の種類のデータに対して任意の推定タスクを遂行するあらゆる場面に適用可能である。以下、適用場面を限定した変形例を例示する。

（Ａ）外観検査の場面
図１３は、第１変形例に係る検査システム１００Ａの適用場面の一例を模式的に例示する。本変形例は、製造ラインで搬送される製品Ｒの外観検査を行う場面に上記実施形態を適用した例である。図１３に示されるとおり、本実施形態に係る検査システム１００Ａは、学習装置１、データ生成装置２、及び検査装置３Ａを備えている。上記実施形態と同様に、学習装置１、データ生成装置２、及び検査装置３Ａは、ネットワークを介して互いに接続されてよい。

本変形例に係る検査システム１００Ａは、取り扱うデータが異なる点を除き、上記実施形態と同様に構成されてよい。上記実施形態と同様に、学習装置１は、第１のフェーズにおいて、複数の第１学習データセット１２１を使用して、各ニューラルネットワーク（５０、５１）の機械学習を実施する。データ生成装置２は、第１のフェーズの機械学習で訓練された各ニューラルネットワーク（５０、５１）を利用して、少なくとも１つ以上の第２学習データセット２２７を生成する。学習装置１は、第２のフェーズにおいて、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）の再学習又は新たな学習モデル５２の教師あり学習を実施する。

各訓練データ（１２２、２２３）は、製品Ｒの写る画像データである。製品Ｒは、例えば、電子機器、電子部品、自動車部品、薬品、食品等であってよい。電子部品は、例えば、基盤、チップコンデンサ、液晶、リレーの巻線等であってよい。自動車部品は、例えば、コンロッド、シャフト、エンジンブロック、パワーウィンドウスイッチ、パネル等であってよい。薬品は、例えば、包装済みの錠剤、未包装の錠剤等であってよい。製品Ｒは、製造過程完了後に生成される最終品であってもよいし、製造過程の途中で生成される中間品であってもよいし、製造過程を経過する前に用意される初期品であってもよい。

各訓練データ（１２２、２２３）は、カメラＳＡ又はこれと同種のカメラにより製品Ｒを撮影することで得られる。カメラの種類は、特に限定されなくてもよい。カメラには、例えば、ＲＧＢ画像を取得するよう構成された一般的なデジタルカメラ、深度画像を取得するように構成された深度カメラ、赤外線量を画像化するように構成された赤外線カメラ等が用いられてよい。

各訓練データ（１２２、２２３）に含まれる特徴は、製品Ｒの状態に関する。製品Ｒの状態は、例えば、傷、汚れ、クラック、打痕、バリ、色ムラ、異物混入等の欠陥の有無に関するものであってよい。これに応じて、各正解データ（１２３、２２５）は、例えば、製品Ｒに欠陥が含まれるか否か、製品Ｒに含まれる欠陥の種類、製品Ｒに含まれる欠陥の範囲等を示すように構成されてよい。各正解データ（１２３、２２５）は、オペレータの入力により得られてもよい。また、画像データに写る製品Ｒの状態を推定するように訓練された推定器を利用して、各訓練データ（１２２、２２３）に写る製品Ｒの状態を推定した結果が各正解データ（１２３、２２５）として取得されてもよい。

第２のフェーズでは、学習装置１は、上記各訓練データ（１２２、２２３）及び各正解データ（１２３、２２５）を使用して、学習モデル（各ニューラルネットワーク（５０、５１）及び学習モデル５２の少なくともいずれか）の機械学習を実施する。これにより、学習モデルは、画像データに写る製品の状態を推定するタスクを遂行可能に構成される。学習装置１は、上記ステップＳ５０３の処理により、当該学習済みの学習モデルに関する情報を第２学習結果データ１２７Ａとして生成し、生成された第２学習結果データ１２７Ａを所定の記憶領域に保存する。

検査装置３Ａは、上記推定装置３に対応する。検査装置３Ａは、取り扱うデータが異なる点を除き、上記推定装置３と同様に構成されてよい。第２学習結果データ１２７Ａは、任意のタイミングで検査装置３Ａに提供されてよい。本変形例では、検査装置３Ａは、カメラＳＡに接続される。検査装置３Ａは、カメラＳＡにより製品Ｒを撮影することで、当該製品Ｒの写る対象画像データを取得する。検査装置３Ａは、学習装置１により構築された学習済みの学習モデルを利用して、取得された対象画像データに基づいて、製品Ｒの状態を推定する。

＜検査装置のハードウェア構成＞
図１４Ａは、本変形例に係る検査装置３Ａのハードウェア構成の一例を模式的に例示する。図１４Ａに示されるとおり、本変形例に係る検査装置３Ａは、上記推定装置３と同様に、制御部３１、記憶部３２、通信インタフェース３３、入力装置３４、出力装置３５、ドライブ３６、及び外部インタフェース３７が電気的に接続されたコンピュータである。検査装置３Ａは、外部インタフェース３７を介してカメラＳＡに接続される。カメラＳＡは、製品Ｒを撮影可能な場所に適宜配置されてよい。例えば、カメラＳＡは、製品Ｒを搬送するコンベア装置の近傍に配置されてよい。ただし、検査装置３Ａのハードウェア構成は、このような例に限定されなくてもよい。検査装置３Ａの具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。検査装置３Ａは、提供されるサービス専用に設計された情報処理装置の他、汎用のサーバ装置、汎用のＰＣ、ＰＬＣ（programmable logic controller）等であってもよい。

本変形例に係る検査装置３Ａの記憶部３２は、検査プログラム８３Ａ、第２学習結果データ１２７Ａ等の各種情報を記憶する。検査プログラム８３Ａ及び第２学習結果データ１２７Ａは、上記実施形態に係る推定プログラム８３及び第２学習結果データ１２７に対応する。検査プログラム８３Ａ及び第２学習結果データ１２７Ａのうちの少なくともいずれかは、記憶媒体９３に記憶されていてもよい。また、検査装置３Ａは、記憶媒体９３から、検査プログラム８３Ａ及び第２学習結果データ１２７Ａのうちの少なくともいずれかを取得してもよい。

＜検査装置のソフトウェア構成及び動作例＞
図１４Ｂは、本変形例に係る検査装置３Ａのソフトウェア構成の一例を模式的に例示する。上記実施形態と同様に、検査装置３Ａのソフトウェア構成は、制御部３１による検査プログラム８３Ａの実行により実現される。図１４Ｂに示されるとおり、取り扱うデータがセンシングデータから画像データに置き換わる点を除き、検査装置３Ａのソフトウェア構成は、上記推定装置３のソフトウェア構成と同様である。これにより、検査装置３Ａは、上記推定装置３の推定処理と同様に、検査処理に関する一連の処理を実行する。

すなわち、ステップＳ７０１では、制御部３１は、データ取得部３１１として動作し、外観検査の対象となる製品Ｒの写る対象画像データ３２１ＡをカメラＳＡから取得する。ステップＳ７０２では、制御部３１は、推定部３１２として動作し、学習済みの学習モデル７０Ａを利用して、取得された対象画像データ３２１Ａに写る製品Ｒの状態を推定する。具体的には、制御部３１は、第２学習結果データ１２７Ａを参照して、学習済みの学習モデル７０Ａの設定を行う。学習済みの学習モデル７０Ａは、上記第２のフェーズの機械学習により訓練されたニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかである。制御部３１は、取得された対象画像データ３２１Ａを学習済みの学習モデル７０Ａに入力して、学習済みの学習モデル７０Ａの演算処理を実行する。これにより、制御部３１は、対象画像データ３２１Ａに写る製品Ｒの状態を推定した結果に対応する出力値を学習済みの学習モデル７０Ａから取得する。

ステップＳ７０３では、制御部３１は、出力部３１３として動作し、製品Ｒの状態を推定した結果に関する情報を出力する。出力先及び出力情報はそれぞれ、上記実施形態と同様に、実施の形態に応じて適宜決定されてよい。例えば、制御部３１は、製品Ｒの状態を推定した結果をそのまま出力装置３５に出力してもよい。また、例えば、制御部３１は、製品Ｒに欠陥が含まれる場合に、そのことを知らせるための警告を出力装置３５に出力してもよい。また、例えば、検査装置３Ａが製品Ｒを搬送するコンベア装置（不図示）に接続される場合、製品Ｒの状態を推定した結果に基づいて、欠陥のない製品Ｒと欠陥のある製品Ｒとを別のラインで搬送されるようにコンベア装置を制御してもよい。

本変形例によれば、外観検査に利用する推定器を構築する場面において、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。また、アクティブラーニングにより抽出された第２訓練データ２２３を更に使用して、より性能の高い学習済みの学習モデルを効率的に生成することができる。検査装置３Ａは、これにより生成された学習済みの学習モデルを利用することで、製品Ｒの外観検査を精度よく遂行することができる。

（Ｂ）対象者の状態を推定する場面
図１５は、第２変形例に係る監視システム１００Ｂの適用場面の一例を模式的に例示する。本変形例は、対象者の状態を推定する場面に上記実施形態を適用した例である。図１５では、対象者の状態を予測する場面の一例として、車両の運転者ＲＢの状態を監視する場面が例示されている。運転者ＲＢは、対象者の一例である。図１５に示されるとおり、本実施形態に係る監視システム１００Ｂは、学習装置１、データ生成装置２、及び監視装置３Ｂを備えている。上記実施形態と同様に、学習装置１、データ生成装置２、及び監視装置３Ｂは、ネットワークを介して互いに接続されてよい。

本変形例に係る監視システム１００Ｂは、取り扱うデータが異なる点を除き、上記実施形態と同様に構成されてよい。上記実施形態と同様に、学習装置１は、第１のフェーズにおいて、複数の第１学習データセット１２１を使用して、各ニューラルネットワーク（５０、５１）の機械学習を実施する。データ生成装置２は、第１のフェーズの機械学習で訓練された各ニューラルネットワーク（５０、５１）を利用して、少なくとも１つ以上の第２学習データセット２２７を生成する。学習装置１は、第２のフェーズにおいて、複数の第１学習データセット１２１及び少なくとも１つ以上の第２学習データセット２２７を使用して、各ニューラルネットワーク（５０、５１）の再学習又は新たな学習モデル５２の教師あり学習を実施する。

各訓練データ（１２２、２２３）は、被験者の状態を観察するセンサにより得られたセンシングデータにより構成される。センサは、人物（被験者、対象者）の状態を観察可能であれば、その種類は、特に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。図１５の例では、人物の状態を観察するセンサの一例として、カメラＳＢ１及びバイタルセンサＳＢ２が用いられる。

各訓練データ（１２２、２２３）は、カメラＳＢ１及びバイタルセンサＳＢ２並びにこれらと同種のセンサにより被験者（運転者）の状態を観察することで得られる。カメラＳＢ１には、例えば、一般的なＲＧＢカメラ、深度カメラ、赤外線カメラ等が用いられてよい。また、バイタルセンサＳＢには、例えば、体温計、血圧計、脈拍計等が用いられてよい。各訓練データ（１２２、２２３）は、画像データ及びバイタルの測定データにより構成される。

各訓練データ（１２２、２２３）に含まれる特徴は、被験者の状態に関する。本変形例では、被験者の状態は、例えば、被験者の眠気の度合いを示す眠気度、被験者の疲労の度合いを示す疲労度、被験者の運転に対する余裕の度合いを示す余裕度、又はこれらの組み合わせを含んでもよい。これに応じて、各正解データ（１２３、２２５）は、例えば、被権者の状態の種別、被験者の状態を示す数値、被験者の写る範囲等を示すように構成されてよい。各正解データ（１２３、２２５）は、オペレータの入力により得られてもよい。また、センシングデータから対象者の状態を推定するように訓練された推定器を利用して、各訓練データ（１２２、２２３）から被験者の状態を推定した結果が各正解データ（１２３、２２５）として取得されてもよい。

第２のフェーズでは、学習装置１は、上記各訓練データ（１２２、２２３）及び各正解データ（１２３、２２５）を使用して、学習モデル（各ニューラルネットワーク（５０、５１）及び学習モデル５２の少なくともいずれか）の機械学習を実施する。これにより、学習モデルは、センシングデータから対象者の状態を推定するタスクを遂行可能に構成される。学習装置１は、上記ステップＳ５０３の処理により、当該学習済みの学習モデルに関する情報を第２学習結果データ１２７Ｂとして生成し、生成された第２学習結果データ１２７Ｂを所定の記憶領域に保存する。

監視装置３Ｂは、上記推定装置３に対応する。監視装置３Ｂは、取り扱うデータが異なる点を除き、上記推定装置３と同様に構成されてよい。第２学習結果データ１２７Ｂは、任意のタイミングで監視装置３Ｂに提供されてよい。本変形例では、カメラＳＢ１及びバイタルセンサＳＢ２から対象センシングデータを取得する。監視装置３Ｂは、学習装置１により構築された学習済みの学習モデルを利用して、取得されたセンシングデータに基づいて、運転者ＲＢの状態を推定する。

＜監視装置のハードウェア構成＞
図１６Ａは、本変形例に係る監視装置３Ｂのハードウェア構成の一例を模式的に例示する。図１６Ａに示されるとおり、本変形例に係る監視装置３Ｂは、上記推定装置３と同様に、制御部３１、記憶部３２、通信インタフェース３３、入力装置３４、出力装置３５、ドライブ３６、及び外部インタフェース３７が電気的に接続されたコンピュータである。監視装置３Ｂは、外部インタフェース３７を介して、カメラＳＢ１及びバイタルセンサＳＢ２に接続される。カメラＳＢ１は、運転者ＲＢを撮影可能な場所に適宜配置されてよい。バイタルセンサＳＢ２は、運転者ＲＢのバイタルを測定可能な場所に適宜配置されてよい。ただし、監視装置３Ｂのハードウェア構成は、このような例に限定されなくてもよい。監視装置３Ｂの具体的なハードウェア構成に関して、実施形態に応じて、適宜、構成要素の省略、置換及び追加が可能である。監視装置３Ｂは、提供されるサービス専用に設計された情報処理装置の他、汎用のコンピュータ、スマートフォンを含む携帯電話、車載装置等であってもよい。

本変形例に係る監視装置３Ｂの記憶部３２は、監視プログラム８３Ｂ、第２学習結果データ１２７Ｂ等の各種情報を記憶する。監視プログラム８３Ｂ及び第２学習結果データ１２７Ｂは、上記実施形態に係る推定プログラム８３及び第２学習結果データ１２７に対応する。監視プログラム８３Ｂ及び第２学習結果データ１２７Ｂのうちの少なくともいずれかは、記憶媒体９３に記憶されていてもよい。また、監視装置３Ｂは、記憶媒体９３から、監視プログラム８３Ｂ及び第２学習結果データ１２７Ｂのうちの少なくともいずれかを取得してもよい。

＜監視装置のソフトウェア構成及び動作例＞
図１６Ｂは、本変形例に係る監視装置３Ｂのソフトウェア構成の一例を模式的に例示する。上記実施形態と同様に、監視装置３Ｂのソフトウェア構成は、制御部３１による監視プログラム８３Ｂの実行により実現される。図１６Ｂに示されるとおり、取り扱うデータが人物の状態を観察するセンサにより得られたセンシングデータである点を除き、監視装置３Ｂのソフトウェア構成は、上記推定装置３のソフトウェア構成と同様である。これにより、監視装置３Ｂは、上記推定装置３の推定処理と同様に、監視処理に関する一連の処理を実行する。

すなわち、ステップＳ７０１では、制御部３１は、データ取得部３１１として動作し、運転者ＲＢの状態を観察するセンサから対象センシングデータ３２１Ｂを取得する。本変形例では、当該センサとしてカメラＳＢ１及びバイタルセンサＳＢ２が監視装置３Ｂに接続されている。そのため、取得される対象センシングデータ３２１Ｂは、カメラＳＢ１から得られる画像データ及びバイタルセンサＳＢ２から得られるバイタルの測定データにより構成される。

ステップＳ７０２では、制御部３１は、推定部３１２として動作し、学習済みの学習モデル７０Ｂを利用して、取得された対象センシングデータ３２１Ｂから運転者ＲＢの状態を推定する。具体的には、制御部３１は、第２学習結果データ１２７Ｂを参照して、学習済みの学習モデル７０Ｂの設定を行う。学習済みの学習モデル７０Ｂは、上記第２のフェーズの機械学習により訓練されたニューラルネットワーク（５０、５１）及び学習モデル５２のうちの少なくともいずれかである。制御部３１は、取得された対象センシングデータ３２１Ｂを学習済みの学習モデル７０Ｂに入力して、学習済みの学習モデル７０Ｂの演算処理を実行する。これにより、制御部３１は、対象センシングデータ３２１Ｂから運転者ＲＢの状態を推定した結果に対応する出力値を学習済みの学習モデル７０Ｂから取得する。

ステップＳ７０３では、制御部３１は、出力部３１３として動作し、運転者ＲＢの状態を推定した結果に関する情報を出力する。出力先及び出力する情報の内容はそれぞれ、実施の形態に応じて適宜決定されてよい。例えば、制御部３１は、運転者ＲＢの状態を推定した結果をそのまま出力装置３５に出力してもよい。また、例えば、制御部３１は、推定の結果に基づいて、何らかの情報処理を実行してもよい。そして、制御部３１は、その情報処理を実行した結果を推定の結果に関する情報として出力してもよい。

当該情報処理の一例として、制御部３１は、推定される運転者ＲＢの状態に応じて、警告等の特定のメッセージを出力装置３５に出力してもよい。具体例として、運転者ＲＢの眠気度及び疲労度の少なくとも一方を運転者ＲＢの状態として推定した場合、制御部３１は、推定された眠気度及び疲労度の少なくとも一方が閾値を超えるか否かを判定してもよい。閾値は適宜設定されてよい。そして、眠気度及び疲労度の少なくとも一方が閾値を超えている場合に、制御部３１は、駐車場等に停車し、休憩を取るように運転者ＲＢに促す警告を出力装置３５に出力してもよい。

また、例えば、車両が自動運転動作可能に構成されている場合、制御部３１は、運転者ＲＢの状態を推定した結果に基づいて、車両の自動運転の動作を制御してもよい。一例として、車両が、システムにより車両の走行を制御する自動運転モード及び運転者ＲＢの操舵により車両の走行を制御する手動運転モードの切り替えが可能に構成されていると想定する。

このケースにおいて、自動運転モードで車両が走行しており、自動運転モードから手動運転モードへの切り替えを運転者ＲＢ又はシステムから受け付けた際に、制御部３１は、推定された運転者ＲＢの余裕度が閾値を超えているか否かを判定してもよい。そして、運転者ＲＢの余裕度が閾値を超えている場合に、制御部３１は、自動運転モードから手動運転モードへの切り替えを許可してもよい。一方、運転者ＲＢの余裕度が閾値以下である場合には、制御部３１は、自動運転モードから手動運転モードへの切り替えを許可せず、自動運転モードでの走行を維持してもよい。

また、手動運転モードで車両が走行している際に、制御部３１は、推定された眠気度及び疲労度の少なくとも一方が閾値を超えるか否かを判定してもよい。そして、眠気度及び疲労度の少なくとも一方が閾値を超えている場合に、制御部３１は、手動運転モードから自動運転モードに切り替えて、駐車場等の安全な場所に停車するように指示する指令を車両のシステムに送信してもよい。一方で、そうではない場合には、制御部３１は、手動運転モードによる車両の走行を維持してもよい。

また、手動運転モードで車両が走行している際に、制御部３１は、推定された余裕度が閾値以下であるか否かを判定してもよい。そして、余裕度が閾値以下である場合に、制御部３１は、減速する指令を車両のシステムに送信してもよい。一方で、そうではない場合には、制御部３１は、運転者ＲＢの操作による車両の走行を維持してもよい。

本変形例によれば、対象者の状態を推定するための推定器を構築する場面において、タスクの種類が異なるニューラルネットワークでも共通の指標を利用して、アクティブラーニングを実施することができるようになる。また、アクティブラーニングにより抽出された第２訓練データ２２３を更に使用して、より性能の高い学習済みの学習モデルを効率的に生成することができる。監視装置３Ｂは、これにより生成された学習済みの学習モデルを利用することで、運転者ＲＢの状態を推定するタスクを精度よく遂行することができる。

なお、状態を推定する対象となる対象者は、図１５に例示される車両の運転者ＲＢに限られなくてもよく、あらゆる人物を含んでよい。状態を予測する対象となる対象者は、例えば、オフィス、工場等で作業を行う作業者、バイタルを計測される被計測者等を含んでもよい。

図１７は、対象者の状態を予測する他の場面の一例を模式的に例示する。図１７に例示される診断システム１００Ｃは、学習装置１、データ生成装置２、及び診断装置３Ｃを備えている。診断装置３Ｃは、上記監視装置３Ｂに対応する。図１７の例では、診断装置３Ｃは、バイタルセンサＳＣに接続され、このバイタルセンサＳＣにより被計測者の対象センシングデータを取得する。診断装置３Ｃは、上記監視装置３Ｂと同様の処理により、被計測者の状態を推定する。被計測者の状態には、当該被計測者の健康状態が含まれてよい。健康状態は、例えば、健康であるか否か、病気になる予兆があるか否か等を含んでよい。各正解データ（１２３、２２５）は、例えば、人物の健康状態の種別、対象の病気になる確率等を示すように構成されてよい。

＜４．２＞
上記実施形態では、各ニューラルネットワーク（５０、５１）には、畳み込みニューラルネットワークが用いられている。しかしながら、各ニューラルネットワーク（５０、５１）の種類は、このような例に限定されなくてもよく、実施の形態に応じて適宜選択されてよい。各ニューラルネットワーク（５０、５１）には、上記畳み込みニューラルネットワークの他、全結合型ニューラルネットワーク、再帰型ニューラルネットワーク等が用いられてよい。或いは、各ニューラルネットワーク（５０、５１）は、複数の異なる構造を有するニューラルネットワークの組み合わせにより構成されてよい。各ニューラルネットワーク（５０、５１）の構造は、特に限定されなくてもよく、実施の形態に応じて適宜設定されてよい。

また、上記実施形態では、注目層（５０３、５１３）は、畳み込みニューラルネットワークの中間層として配置された畳み込み層である。しかしながら、注目層（５０３、５１３）は、畳み込み層に限られなくてもよく、実施の形態に応じて適宜選択されてよい。畳み込み層の他、例えば、プーリング層、全結合層等の中間層が注目層に設定されてよい。なお、畳み込み層の出力をプーリング処理するプーリング層（すなわち、畳み込み層の直後に配置されたプーリング層）を注目層に設定する場合、このプーリング層の出力は、畳み込み層の出力と同様に扱うことができる。そのため、上記実施形態と同様の方法（式１～式３のいずれか）により、プーリング層の出力値から評価値２２２を算出することができる。また、複数のニューロン（ノード）を含む全結合層を注目層に設定する場合も、この全結合層の出力は、畳み込み層の出力と同様に扱うことができる。そのため、上記実施形態と同様の方法（式１～式３のいずれか）により、全結合層の出力値から評価値２２２を算出することができる。一方、１つのニューロン（ノード）を含む全結合層を注目層に設定する場合には、上記式３の方法により、全結合層の出力値から評価値２２２を算出することができる。

＜４．３＞
上記実施形態では、学習装置１は、第１のフェーズの機械学習及び第２のフェーズの機械学習の両方を実行する。また、学習装置１及びデータ生成装置２は、別々のコンピュータである。しかしながら、学習システム１０１の構成は、このような例に限定されなくてもよい。例えば、第１のフェーズの機械学習及び第２のフェーズの機械学習はそれぞれ別のコンピュータにより実行されてよい。また、例えば、学習装置１及びデータ生成装置２は、一体のコンピュータにより構成されてよい。

＜４．４＞
上記実施形態では、データ生成装置２は、各ニューラルネットワーク（５０、５１）により導出される評価値２２２を、正解データの付与されていない第２訓練データ２２１から正解データを付与する対象となる第２訓練データ２２３を抽出するのに利用している。しかしながら、評価値２２２による抽出は、このような例に限定されなくてもよい。データ生成装置２は、例えば、既に正解データの付与された複数件の訓練データ、すなわち、複数件の学習データセットから推定器の性能向上に寄与する程度の高いと推定される１つ以上の学習データセットを抽出するのに、評価値２２２を利用してもよい。この学習データセットの抽出処理は、上記第２訓練データ２２３の抽出処理と同様の処理手順で実行可能である。この場合、第２訓練データ２２１には正解データが付与されていてもよい。データ生成装置２の上記処理手順からステップＳ３０６が省略されてもよい。また、データ生成装置２のソフトウェア構成から生成部２１５が省略されてよい。

１００…推定システム、１０１…学習システム、
１…学習装置、
１１…制御部、１２…記憶部、１３…通信インタフェース、
１４…入力装置、１５…出力装置、１６…ドライブ、
１１１…データ取得部（第１データ取得部）、
１１２…学習処理部、１１３…保存処理部、
１２１…第１学習データセット、
１２２…第１訓練データ、１２３…第１正解データ、
１２５…第１学習結果データ、１２７…第２学習結果データ、
８１…学習プログラム、８５…第１データプール、
９１…記憶媒体、
２…データ生成装置、
２１…制御部、２２…記憶部、２３…通信インタフェース、
２４…入力装置、２５…出力装置、２６…ドライブ、
２１１…モデル取得部、
２１２…データ取得部（第２データ取得部）、
２１３…評価部、２１４…抽出部、２１５…生成部、
２１６…出力部、
２２１…第２訓練データ、２２２…評価値、
２２３…（抽出された）第２訓練データ、
２２５…第２正解データ、２２７…第２学習データセット、
８２…データ生成プログラム、８７…第２データプール、
９２…記憶媒体、
３…推定装置、
３１…制御部、３２…記憶部、３３…通信インタフェース、
３４…入力装置、３５…出力装置、３６…ドライブ、
３７…外部インタフェース、
３１１…データ取得部、
３１２…推定部、３１３…出力部、
３２１…対象データ、
８３…推定プログラム、９３…記憶媒体、
５０…第１ニューラルネットワーク、
５０１…入力層、５０３…注目層、
５０７…出力層、
５１…第２ニューラルネットワーク、
５１１…入力層、５１３…注目層、
５１７…出力層、
５２…学習モデル、
７０…推定器

Claims

第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを取得する第１データ取得部と、
取得された前記複数の第１学習データセットを使用して、複数のニューラルネットワークの機械学習を実施する学習処理部であって、
前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、
前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、
前記機械学習を実施することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように、前記各ニューラルネットワークを訓練することを含む、
学習処理部と、
複数件の第２訓練データを取得する第２データ取得部と、
訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得し、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出する評価部と、
前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出する抽出部と、
抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成する生成部と、
を備え、
前記学習処理部は、前記複数の第１学習データセット及び前記少なくとも１つ以上の第２学習データセットを使用して、前記複数のニューラルネットワークの機械学習を再度実施する、又は前記複数のニューラルネットワークとは別の学習モデルの教師あり学習を実施する、
学習システム。
前記各ニューラルネットワークは、畳み込みニューラルネットワークであり、
前記注目層は、畳み込み層である、
請求項１に記載の学習システム。
前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合することは、前記各畳み込みニューラルネットワークの前記畳み込み層より出力される特徴マップから導出されるアテンションマップが互いに一致することである、
請求項２に記載の学習システム。
前記各ニューラルネットワークの前記複数の層は、演算に利用される演算パラメータを備え、
前記各ニューラルネットワークを訓練することは、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力したときに、前記各ニューラルネットワークの前記出力層から出力される出力値と前記第１正解データとの誤差が小さくなるように、かつ前記各ニューラルネットワークの前記注目層から出力される出力値の間の誤差が小さくなるように、前記各ニューラルネットワークの前記演算パラメータの値の調整を繰り返すことを備え、
前記注目層から出力される出力値の間の誤差に関する学習率は、前記演算パラメータの値の調整を繰り返す度に大きくなるように設定される、
請求項１から３のいずれか１項に記載の学習システム。
前記各訓練データは、製品の写る画像データにより構成され、
前記特徴は、前記製品の状態に関する、
請求項１から４のいずれか１項に記載の学習システム。
前記各訓練データは、被験者の状態を観察するセンサにより得られたセンシングデータにより構成され、
前記特徴は、前記被験者の状態に関する、
請求項１から４のいずれか１項に記載の学習システム。
第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するモデル取得部であって、
前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、
前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、
前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、
モデル取得部と、
複数件の第２訓練データを取得するデータ取得部と、
訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得し、前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出する評価部と、
前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出する抽出部と、
抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成する生成部と、
を備える、
データ生成装置。
生成された前記少なくとも１つ以上の第２学習データセットを学習モデルの教師あり学習に使用可能に出力する出力部を更に備える、
請求項７に記載のデータ生成装置。
コンピュータが、
第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するステップであって、
前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、
前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、
前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、
ステップと、
複数件の第２訓練データを取得するステップと、
訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得するステップと、
前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出するステップと、
前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出するステップと、
抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成するステップと、
を実行する、
データ生成方法。
コンピュータに、
第１訓練データ、及び当該第１訓練データに含まれる特徴を示す第１正解データの組み合わせによりそれぞれ構成された複数の第１学習データセットを使用した機械学習により訓練された複数のニューラルネットワークを取得するステップであって、
前記各ニューラルネットワークは、入力側から出力側に並んで配置された複数の層を含み、
前記複数の層は、最も出力側に配置された出力層及び当該出力層よりも入力側に配置された注目層を含み、
前記各ニューラルネットワークは、前記機械学習により、前記各第１学習データセットについて、前記各ニューラルネットワークに前記第１訓練データを入力すると、前記各ニューラルネットワークの前記出力層から前記第１正解データに適合する出力値が出力されると共に、前記各ニューラルネットワークの前記注目層から出力される出力値が互いに適合するように訓練されている、
ステップと、
複数件の第２訓練データを取得するステップと、
訓練された前記各ニューラルネットワークに前記各件の第２訓練データを入力することで前記各ニューラルネットワークの前記注目層から出力値を取得するステップと、
前記各ニューラルネットワークの前記注目層から取得された前記出力値に基づいて、前記各件の第２訓練データに対する前記各ニューラルネットワークの出力の不安定性を示す評価値を算出するステップと、
前記不安定性が高いと判定するための条件を前記評価値が満たす少なくとも１件以上の第２訓練データを前記複数件の第２訓練データから抽出するステップと、
抽出された前記少なくとも１件以上の第２訓練データそれぞれに対して、前記第２訓練データに含まれる特徴を示す第２正解データの入力を受け付けることで、前記第２訓練データ及び前記第２正解データの組み合わせによりそれぞれ構成された少なくとも１つ以上の第２学習データセットを生成するステップと、
を実行させるための、
データ生成プログラム。