WO2022195762A1

WO2022195762A1 - 学習装置、学習方法、及び、記録媒体

Info

Publication number: WO2022195762A1
Application number: PCT/JP2021/010827
Authority: WO
Inventors: 周平吉田
Original assignee: 日本電気株式会社
Priority date: 2021-03-17
Filing date: 2021-03-17
Publication date: 2022-09-22
Also published as: JP7517589B2; JPWO2022195762A1

Abstract

第１の推論手段は、正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１の推論を行う。第１の損失計算手段は、第１の推論の結果と、正解付きデータに付与された正解とから第１の損失を計算する。第２の推論手段は、正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２の推論を行う。第３の推論手段は、正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３の推論を行う。疑似補ラベル生成手段は、第３の推論の結果から疑似補ラベルを生成する。第２の損失計算手段は、第２の推論の結果と、疑似補ラベルとに基づいて第２の損失を計算する。更新手段は、第１の損失及び第２の損失に基づいて、第１～第３の推論手段のパラメータを更新する。

Description

学習装置、学習方法、及び、記録媒体

　本開示は、機械学習モデルの学習方法に関する。

　近年、機械学習に基づく認識技術は、画像認識の分野を中心に極めて高い性能を示している。このような機械学習に基づく認識技術の高い精度は、大量の正解付きデータにより支えられている。即ち、大量の正解付きデータを用意して学習を行うことにより、高い精度が実現されている。

　しかし、大量の正解付きデータを用意するにはコストと時間を要する。この観点から、特許文献１は、通常の実教師データから人工教師データを生成して教師データの量を増やす手法を開示している。また、特許文献２は、教師ありデータと、教師なしデータとを用いて半教師あり学習を行う手法を開示している。

国際公開ＷＯ２０２０／０７０８７６号公報国際公開ＷＯ２０１４／１３６３１６号公報

　通常、正解のないデータであれば、運用時に低コストで蓄積することができるため、正解なしデータを有効に活用することにより、データ収集を低コスト化することが期待できる。

　本開示の１つの目的は、データ収集コストを抑えて、高精度な機械学習モデルを生成することにある。

　本開示の一つの観点では、学習装置は、
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１の推論を行う第１の推論手段と、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算する第１の損失計算手段と、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２の推論を行う第２の推論手段と、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３の推論を行う第３の推論手段と、
　前記第３の推論の結果から疑似補ラベルを生成する疑似補ラベル生成手段と、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算する第２の損失計算手段と、
　前記第１の損失及び前記第２の損失に基づいて、前記第１の推論手段、前記第２の推論手段及び前記第３の推論手段のパラメータを更新する更新手段と、を備える。

　本開示の他の観点では、学習方法は、
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する。

　本開示のさらに他の観点では、記録媒体は、
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する処理をコンピュータに実行させるプログラムを記録する。

　本開示によれば、データ収集コストを抑えて、高精度な機械学習モデルを生成することが可能となる。

第１実施形態の学習装置のハードウェア構成を示すブロック図である。第１実施形態の学習装置の機能構成を示すブロック図である。第１実施形態の学習装置による学習処理のフローチャートである。多クラス分類問題の場合のデータセットの例を示す。第１実施形態の推論装置の構成を示す。第２実施形態の学習装置の機能構成を示すブロック図である。第２実施形態の学習装置による学習処理のフローチャートである。

　以下、図面を参照して、本開示の好適な実施形態について説明する。
　＜第１実施形態＞
　［学習装置］
　まず、第１実施形態の学習装置について説明する。
　（ハードウェア構成）
　図１は、第１実施形態の学習装置１００のハードウェア構成を示すブロック図である。図示のように、学習装置１００は、インタフェース（Ｉ／Ｆ）１１と、プロセッサ１２と、メモリ１３と、記録媒体１４と、データベース（ＤＢ）１５と、を備える。

　インタフェース１１は、外部装置との間でデータの入出力を行う。具体的に、学習に使用される正解付きデータ及び正解なしデータは、インタフェース１１を通じて入力される。

　プロセッサ１２は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより学習装置１００の全体を制御する。なお、プロセッサ１２は、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）またはＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）であってもよい。プロセッサ１２は、後述する学習処理を実行する。

　メモリ１３は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などにより構成される。メモリ１３は、プロセッサ１２による各種の処理の実行中に作業メモリとしても使用される。

　記録媒体１４は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、学習装置１００に対して着脱可能に構成される。記録媒体１４は、プロセッサ１２が実行する各種のプログラムを記録している。学習装置１００が各種の処理を実行する際には、記録媒体１４に記録されているプログラムがメモリ１３にロードされ、プロセッサ１２により実行される。ＤＢ１５は、必要に応じて、学習のための正解付きデータ、正解なしデータを記憶する。

　（機能構成）
　図２は、第１実施形態の学習装置１００の機能構成を示すブロック図である。学習装置１００は、データ拡張部２１ａ～２１ｃと、推論部２２ａ～２２ｃと、正解付き損失計算部２３と、正解なし補ラベル損失計算部２４と、疑似補ラベル生成部２５と、勾配計算部２６と、更新部２７と、パラメータ保持部２８ａ、２８ｂと、を備える。

　正解付きデータは、入力データと、その入力データに対応する正解ラベルとを含む。例えば画像認識モデルを学習する場合、入力データは学習に使用される画像であり、正解ラベルはその画像に含まれる対象物のクラスを示す情報である。正解付きデータのうち、入力データはデータ拡張部２１ａに入力され、正解ラベルは正解付き損失計算部２３へ入力される。

　データ拡張部２１ａは、入力データに対してランダムな変換を行い、変換後の入力データを推論部２２ａに出力する。推論部２２ａは、機械学習モデルを用いて、入力データに対する推論を行う。例えば画像認識モデルを学習する場合、推論部２２ａは、入力データに含まれる対象物のクラスを推論し、正解付き損失計算部２３へ出力する。

　正解付き損失計算部２３は、推論部２２ａから入力される推論結果と、正解付きデータに含まれる正解ラベルとから正解付き損失を計算する。なお、正解付き損失計算部２３は、例えばクロスエントロピー損失など、一般的な多値分類向け損失関数を用いることができる。正解付き損失計算部２３は、計算した正解付き損失を勾配計算部２６へ出力する。

　正解なしデータは、入力データのみを含み、正解ラベルを含まないデータである。正解なしデータとしては、機械学習モデルを実際に運用する環境において収集されたデータなどを用いることができる。例えば、映像監視用の画像認識モデルを学習する場合、正解なしデータとして、監視対象となる環境に設置されたカメラによる撮影画像などを使用することができる。正解なしデータは、データ拡張部２１ｂ、２１ｃへ入力される。

　データ拡張部２１ｂは、入力された正解なしデータに対してランダムな変換行い、変換後のデータを推論部２２ｂへ出力する。同様に、データ拡張部２１ｃは、入力された正解なしデータに対してランダムな変換を行い、変換後のデータを推論部２２ｃへ出力する。なお、データ拡張部２１ａを含む３つのデータ拡張部２１ａ～２１ｃは、それぞれ入力データに対して独立にランダムな変換を作用させるが、その変換の種類は同一であってもよく、異なってもよい。なお、好適な例では、データ拡張部２１ｂによる変換は、データ拡張部２１ａ、２１ｃによる変換よりも強い変換とする。強い変換とは、入力データに対する変化が大きい変換を言い、例えば入力データが画像である場合、画像の内容をより大きく変えるような変換である。

　推論部２２ｂは、機械学習モデルを用いて、データ拡張部２１ｂによる変換後の入力データに対する推論を行い、推論結果を正解なし補ラベル損失計算部２４へ出力する。また、推論部２２ｃは、機械学習モデルを用いて、データ拡張部２１ｃによる変換後の入力データに対する推論を行い、推論結果を疑似補ラベル生成部２５へ出力する。

　疑似補ラベル生成部２５は、推論部２２ｃによる推論結果に基づいて疑似補ラベルを生成する。「補ラベル」とは、入力データに対して付与されるラベルであり、その入力データが特定のクラス（カテゴリー）に属さないことを示す。例えば、補ラベルｃは、その入力データがクラスｃに属さないことを示す。また、「疑似補ラベル」とは、学習途中又は学習済みのモデルの推論結果から生成した補ラベルをいう。

　以下、疑似補ラベルの生成方法について詳しく説明する。いま、推論部２２ａ～２２ｃが画像認識モデルを用いて多クラス（以下、Ｎクラスとする）の分類を行うとする。この場合、推論部２２ａ～２２ｃは、１つの入力データ（画像）に対して、その入力データがＮ個のクラスそれぞれに該当する確率を出力する。即ち、推論部２２ａ～２２ｃは、推論結果としてＮ個の確率値を出力する。疑似補ラベル生成部２５は、推論部２２ｃが出力したＮ個の確率値のうち、最大の確率値を有するクラス（以下、「最大クラス」とも呼ぶ。）をクラスｃとする。そして、疑似補ラベル生成部２５は、Ｎ個のクラスのうち、最大クラスｃ以外のクラスからランダムに選択したクラスｃ’を疑似補ラベルと決定する。

　このように疑似補ラベルを生成すると、推論部２２ｃの推論の精度が十分に高くなくても、疑似補ラベルの精度は高くなる。例えば、推論部２２ｃが１０クラス分類を行う場合を考える。この場合、推論部２２ｃが正しく推論するデータに対しては、１００％の確率で正しい疑似補ラベルが付与される。推論部２２ｃが間違って推論するデータに対しても、８８．９％の確率で正しい疑似補ラベルが付与される。また、推論部２２ｃの推論の精度が３０％であったとしても、疑似補ラベルの精度は９２．２％となる。よって、疑似補ラベルを用いることにより、正解なしデータに対して、精度の高い疑似ラベルを付与することができる。疑似補ラベル生成部２５は、生成した疑似補ラベルを正解なし補ラベル損失計算部２４へ出力する。

　正解なし補ラベル損失計算部２４は、正解なしデータに対して付与された疑似補ラベルと、推論部２２ｂから入力された推論結果とを用いて、補ラベル損失を計算する。補ラベル損失としては、例えば前方補正損失、下方有界な後方補正損失などを用いることができる。正解なし補ラベル損失計算部２４は、計算した補ラベル損失を勾配計算部２６へ出力する。

　勾配計算部２６は、入力された正解付き損失及び補ラベル損失の勾配を計算し、更新部２７へ出力する。例えば、勾配計算部２６は、正解付き損失と補ラベル損失の和又は重み付き和の勾配を算出し、更新部２７へ出力する。

　更新部２７は、入力された勾配を用いて推論部２２ａ、２２ｂのパラメータ（以下、「パラメータＰ１」と呼ぶ。）を更新し、パラメータ保持部２８ａへ出力する。パラメータ保持部２８ａは、推論部２２ａ、２２ｂに対して更新後のパラメータＰ１を設定する。こうして、正解付きデータについて推論を行う推論部２２ａと、正解なしデータについて推論を行う推論部２２ｂに、同一のパラメータＰ１が設定される。

　また、更新部２７は、入力された勾配を用いて、推論部２２ｃのパラメータ（以下、「パラメータＰ２」と呼ぶ。）を更新し、パラメータ保持部２８ｂへ出力する。パラメータ保持部２８ａは、更新後のパラメータＰ２を推論部２２ｃに設定する。ここで、パラメータ保持部２８ｂが保持するパラメータＰ２は、パラメータ保持部２８ａが保持するパラメータＰ１と同一であってもよく、推論部２２ａ、２２ｂのパラメータＰ１が更新されるごとに、その指数移動平均を取ったものとしてもよい。

　上記の構成において、データ拡張部２１ａ及び推論部２２ａは第１の推論手段の一例であり、正解付き損失計算部２３は第１の損失計算手段の一例である。データ拡張部２１ｂ及び推論部２２ｂは第２の推論手段の一例であり、データ拡張部２１ｃ及び推論部２２ｃは第３の推論手段の一例である。疑似補ラベル生成部２５は疑似補ラベル生成手段の一例であり、正解なし補ラベル損失計算部２４は第２の損失計算手段の一例である。勾配計算部２６、更新部２７、パラメータ保持部２８ａ、２８ｂは、更新手段の一例である。

　（学習処理）
　図３は、第１実施形態の学習装置１００による学習処理のフローチャートである。この処理は、図１に示すプロセッサ１２が予め用意されたプログラムを実行し、図２に示す各要素として動作することにより実現される。なお、この処理は、正解付きデータ及び正解なしデータが入力される毎に繰り返し実行される。

　まず、正解付きデータに含まれる入力データがデータ拡張部２１ａに入力され、正解付きデータに含まれる正解ラベルが正解付き損失計算部２３へ入力される。また、正解なしデータがデータ拡張部２１ｂ、２１ｃに入力される。

　データ拡張部２１ａは、正解付きデータの入力データを変換し、推論部２２ａへ出力する（ステップＳ１１）。推論部２２ａは、変換後の入力データから推論を行い、推論結果を正解付き損失計算部２３へ出力する（ステップＳ１２）。正解付き損失計算部２３は、推論結果と、正解ラベルとから損失を計算し、勾配計算部２６へ出力する（ステップＳ１３）。

　また、ステップＳ１１～Ｓ１３と並行して、データ拡張部２１ｃは、正解なしデータを変換し、推論部２２ｃへ出力する（ステップＳ１４）。推論部２２ｃは、変換後の入力データから推論を行い、推論結果を疑似補ラベル生成部２５へ出力する（ステップＳ１５）。疑似補ラベル生成部２５は、推論結果から疑似補ラベルを生成し、正解なし補ラベル損失計算部２４へ出力する（ステップＳ１６）。

　また、データ拡張部２１ｂは、正解なしデータを変換し、推論部２２ｂへ出力する（ステップＳ１７）。推論部２２ｂは、変換後の入力データから推論を行い、推論結果を正解なし補ラベル損失計算部２４へ出力する（ステップＳ１８）。正解なし補ラベル損失計算部２４は、推論部２２ｂから入力された推論結果と、疑似補ラベル生成部２５から入力された疑似補ラベルとから補ラベル損失を計算し、勾配計算部２６へ出力する（ステップＳ１９）。

　勾配計算部２６は、入力された正解付き損失及び補ラベル損失の勾配を計算し、更新部２７へ出力する（ステップＳ２０）。更新部２７は、入力された勾配に基づいて、推論部２２ａ、２２ｂのパラメータＰ１を更新してパラメータ保持部２８ａへ出力するとともに、推論部２２ｃのパラメータＰ２を更新してパラメータ保持部２８ｂへ出力する（ステップＳ２１）。そして、パラメータ保持部２８ａはパラメータＰ１を推論部２２ａ、２２ｂに設定し、パラメータ保持部２８ｂはパラメータＰ２を推論部２２ｃに設定する（ステップＳ２２）。こうして、推論部２２ａ～２２ｃのパラメータが更新される。

　（変形例）
（１）上記の実施形態では、正解なしデータを正解付きデータと別個に用意しているが、正解付きデータの入力データを正解なしデータとして使用してもよい。これにより、正解なしデータを容易に増量することができる。

（２）上記の実施形態において、正解付きデータとして、弱正解付きデータを使用してもよい。即ち、正解付きデータは、弱正解データも含む概念とする。通常の「正解」はそのデータが属する正解クラスを正しくただ一つ指定するのに対し、「弱正解」はあいまいさやノイズなどを含む正解である。この意味で、前述の「補ラベル」は弱正解の一例と捉えることができる。即ち、補ラベルｃは、そのデータがクラスｃ以外であることを示しており、クラス数が３つ以上ある場合、補ラベルは必ずあいまいさを含むため、弱正解と考えることができる。

　また、弱正解の他の例として、エキスパートデータセットを用いることができる。「エキスパートデータセット」とは、多クラス分類のモデルを学習する際に使用できる学習用データセットであり、複数の部分データセットにより構成されるものである。具体的に、エキスパートデータセットは、以下の条件を具備するように構成される。
　（Ａ）複数の部分データセットの各々には、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられている。
　（Ｂ）認識対象とする全てのカテゴリーが、複数の部分データセットのいずれかに割り当てられている。
　（Ｃ）部分データセットに含まれる各データには、当該部分データセットに割り当てられた責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解ラベルが付与されている。

　図４は、多クラス分類問題の場合の通常のデータセットと、エキスパートデータセットの例を示す。図４（Ａ）は、学習に使用される通常のデータセットを示す。いま、画像データに基づいて１００クラスの多クラス分類を行う物体認識モデルを学習するものとする。通常の学習用データセットとしては、用意された画像データの各々について、１００クラス、即ち、１００カテゴリーのうちの１つが正解ラベルとして割り当てられる。

　図４（Ｂ）は、エキスパートデータセットの例を示す。なお、このエキスパートデータセットでも、図４（Ａ）の例と同様に全体で１００クラスの多クラス分類を行うものとする。エキスパートデータセットでは、複数の部分データセットを用意する。図４（Ｂ）の例では、「水生哺乳類」、「人」などの複数の部分データセットが用意される。そして、各部分データセットには、それぞれ責任範囲が設定される。「水生哺乳類」の部分データセットには、５種類の水生哺乳類、「ビーバー」、「イルカ」、「カワウソ」、「アザラシ」、「クジラ」が責任範囲として割り当てられる。「人」の部分データセットには、５種類の人、「赤ん坊」、「男の子」、「女の子」、「男性」、「女性」が責任範囲として割り当てられる。ここで、責任範囲は、認識対象とする全てのクラス（カテゴリー）が、複数の部分データセットのいずれかに割り当てられるように決定されている。即ち、いずれの部分データセットにも割り当てられていないクラスが存在しないように、１００個のクラスが複数の部分データセットに割り当てられている。言い換えると、複数の部分データセットにより、１００個のクラスの認識対象全てが網羅されるように責任範囲が決定されている。これにより、エキスパートデータセットによっても、図４（Ａ）に示す通常のデータセットと同様に、１００クラスの多クラス分類の学習が可能となる。このようなエキスパートデータセットも、上記の実施形態における正解付きデータとして使用することができる。

　［推論装置］
　図５は、第１実施形態の推論装置の構成を示す。推論装置２００は、推論部２０１を備える。推論部２０１には、上記の学習処理により学習された機械学習モデルを使用する。即ち、推論部２０１には、上記の学習処理により得られたパラメータＰ１が設定される。

　推論時には、推論部２０１に、推論の対象となる入力データが入力される。この入力データは、推論装置２００が実際に運用される環境において取得された撮影画像などのデータであり、実際の画像認識などの対象となるデータである。推論部２０１は、入力データから推論を行い、推論結果を出力する。例えば多クラス分類を行う画像認識の場合、推論部２０１は、入力画像に基づいて各クラスの確率値を推論結果として出力する。

　＜第２実施形態＞

　図６は、第２実施形態の学習装置の機能構成を示すブロック図である。学習装置７０は、第１の推論手段７１と、第１の損失計算手段７２と、第２の推論手段７３と、第３の推論手段７４と、疑似補ラベル生成手段７５と、第２の損失計算手段７６と、更新手段７７と、を備える。

　図７は、第２実施形態の学習装置７０による学習処理のフローチャートである。第１の推論手段７１は、正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１の推論を行う（ステップＳ４１）。第１の損失計算手段７２は、第１の推論の結果と、正解付きデータに付与された正解とから第１の損失を計算する（ステップＳ４２）。第２の推論手段７３は、正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２の推論を行う（ステップＳ４３）。第３の推論手段７４は、正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３の推論を行う（ステップＳ４４）。疑似補ラベル生成手段７５は、第３の推論の結果から疑似補ラベルを生成する（ステップＳ４５）。第２の損失計算手段７６は、第２の推論の結果と、疑似補ラベルとに基づいて第２の損失を計算する（ステップＳ４６）。更新手段７７は、第１の損失及び第２の損失に基づいて、第１の推論手段、第２の推論手段及び第３の推論手段のパラメータを更新する（ステップＳ４７）。

　第２実施形態の学習装置によれば、正解なしデータを用いて高精度な機械学習モデルを生成することが可能となる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１の推論を行う第１の推論手段と、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算する第１の損失計算手段と、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２の推論を行う第２の推論手段と、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３の推論を行う第３の推論手段と、
　前記第３の推論の結果から疑似補ラベルを生成する疑似補ラベル生成手段と、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算する第２の損失計算手段と、
　前記第１の損失及び前記第２の損失に基づいて、前記第１の推論手段、前記第２の推論手段及び前記第３の推論手段のパラメータを更新する更新手段と、
　を備える学習装置。

　（付記２）
　前記第２のデータ拡張は、前記第１のデータ拡張及び前記第３のデータ拡張とは異なる付記１に記載の学習装置。

　（付記３）
　前記更新手段は、前記第１の推論手段及び前記第２の推論手段に対して同一のパラメータを設定する付記１又は２に記載の学習装置。

　（付記４）
　前記更新手段は、前記第１の推論手段及び前記第２の推論手段に設定したパラメータに基づいて別のパラメータを生成し、前記第３の推論手段に設定する付記３に記載の学習装置。

　（付記５）
　前記正解付きデータは、弱正解付きデータを含む付記１乃至４のいずれか一項に記載の学習装置。

　（付記６）
　前記正解付きデータは、入力データと、当該入力データに対する正解とを含み、
　前記正解なしデータは、前記正解付きデータの入力データを含む付記１乃至５のいずれか一項に記載の学習装置。

　（付記７）
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する学習方法。

　（付記８）
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する処理をコンピュータに実行させるプログラムを記録した記録媒体。

　以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。

　２１ａ～２１ｃ　データ拡張部
　２２ａ～２２ｃ　推論部
　２３　正解付き損失計算部
　２４　正解なし補ラベル損失計算部
　２５　疑似補ラベル生成部
　２６　勾配計算部
　２７　更新部
　２８ａ、２８ｂ　パラメータ保持部
　１００　学習装置
　２００　推論装置

Claims

　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１の推論を行う第１の推論手段と、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算する第１の損失計算手段と、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２の推論を行う第２の推論手段と、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３の推論を行う第３の推論手段と、
　前記第３の推論の結果から疑似補ラベルを生成する疑似補ラベル生成手段と、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算する第２の損失計算手段と、
　前記第１の損失及び前記第２の損失に基づいて、前記第１の推論手段、前記第２の推論手段及び前記第３の推論手段のパラメータを更新する更新手段と、
　を備える学習装置。
　前記第２のデータ拡張は、前記第１のデータ拡張及び前記第３のデータ拡張とは異なる請求項１に記載の学習装置。
　前記更新手段は、前記第１の推論手段及び前記第２の推論手段に対して同一のパラメータを設定する請求項１又は２に記載の学習装置。
　前記更新手段は、前記第１の推論手段及び前記第２の推論手段に設定したパラメータに基づいて別のパラメータを生成し、前記第３の推論手段に設定する請求項３に記載の学習装置。
　前記正解付きデータは、弱正解付きデータを含む請求項１乃至４のいずれか一項に記載の学習装置。
　前記正解付きデータは、入力データと、当該入力データに対する正解とを含み、
　前記正解なしデータは、前記正解付きデータの入力データを含む請求項１乃至５のいずれか一項に記載の学習装置。
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する学習方法。
　正解付きデータに対して第１のデータ拡張を行い、得られたデータから第１のモデルを用いて第１の推論を行い、
　前記第１の推論の結果と、前記正解付きデータに付与された正解とから第１の損失を計算し、
　正解なしデータに対して第２のデータ拡張を行い、得られたデータから第２のモデルを用いて第２の推論を行い、
　前記正解なしデータに対して第３のデータ拡張を行い、得られたデータから第３のモデルを用いて第３の推論を行い、
　前記第３の推論の結果から疑似補ラベルを生成し、
　前記第２の推論の結果と、前記疑似補ラベルとに基づいて第２の損失を計算し、
　前記第１の損失及び前記第２の損失に基づいて、前記第１のモデル、前記第２のモデル及び前記第３のモデルのパラメータを更新する処理をコンピュータに実行させるプログラムを記録した記録媒体。