WO2022259517A1

WO2022259517A1 - モデル学習装置、モデル学習方法、プログラム

Info

Publication number: WO2022259517A1
Application number: PCT/JP2021/022291
Authority: WO
Inventors: 圭吾若山; 翔一郎齊藤
Original assignee: 日本電信電話株式会社
Priority date: 2021-06-11
Filing date: 2021-06-11
Publication date: 2022-12-15
Also published as: JPWO2022259517A1; JP7540595B2

Abstract

マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習技術を提供する。１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、所定の式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算部と、リスク^-R(g:^-loss)を用いて、モデルを更新するモデル更新部と、を含む。

Description

モデル学習装置、モデル学習方法、プログラム

　本発明は、機械学習技術に関する。

　近年、音響イベント検知、画像セグメンテーション、画像認識などの分野において、機械学習が用いられている。機械学習の一般的な手順について、以下説明する。

（１）１つのデータに対してそのデータが属するクラスを示すラベル（正解ラベルという）を１つ付与し、正解ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、正解ラベルが付与されたデータの集合を生成する。

（２）正解ラベルが付与されたデータの集合を用いてモデルを学習する。

（３）学習済モデルを用いて、入力されたデータが属するクラス（正解クラスという）を推定する。

　上記手順に従い生成した学習済モデルを用いた正解クラスの推定において、推定精度を高めようとする場合、より多くの正解ラベルが付与されたデータが必要になる。また、推定対象となる、データが属するクラスの数を増やそうとする場合も、より多くの正解ラベルが付与されたデータが必要になる。しかし、正解ラベルを付与する作業は非常に手間がかかるものであり、正解ラベルが付与されたデータを大量に生成するのは困難である。

　そこで、非特許文献１では、以下の手順の機械学習を提案している。

（１）１つのデータに対してそのデータが属さないクラスを示すラベル（補ラベルという）を１つ付与し、間違ったラベルである補ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、補ラベルが付与されたデータの集合を生成する。

（２）補ラベルが付与されたデータの集合を用いてモデルを学習する。

　あるデータに正解ラベルを付与するよりも補ラベルを付与する方が手間がかからないため、より多くのラベルが付与されたデータを生成することができる。また、非特許文献１の手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度は、一般的な手順に従い生成した学習済モデルを用いた正解クラスの推定における推定精度と同程度である。

T. Ishida et al., "Complementary-Label Learning for Arbitrary Losses and Models," ICML 2019, pp.2971-2980, 2019.

　非特許文献１の技術では、１つのデータに対してそのデータが属するクラスが１つである問題（以下、多クラス分類問題という）を対象としており、１つのデータに対してそのデータが属するクラスが１つとは限らない（つまり、２つ以上ある場合もある）問題（以下、マルチラベル分類問題という）を扱うことができない。

　そこで本発明では、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習技術を提供することを目的とする。

　本発明の一態様は、１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成部と、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算部と、

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）、リスク^-R(g:^-loss)を用いて、モデルを更新するモデル更新部と、を含む。

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）、１個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第２リスク計算部と、リスク^-R(g:^-loss)とリスクR(g:loss)から、R(g)=α^-R(g:^-loss)+(1-α)(g:loss)（ただし、αは0<α<1を満たす定数）により、リスクR(g)を計算する第３リスク計算部と、リスクR(g)を用いて、モデルを更新するモデル更新部と、を含む。

　本発明によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。

モデル学習装置１００の構成を示すブロック図である。モデル学習装置１００の動作を示すフローチャートである。モデル学習装置２００の構成を示すブロック図である。モデル学習装置２００の動作を示すフローチャートである。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

　以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　各実施形態の説明に先立って、この明細書における表記方法について説明する。

　^（キャレット）は上付き添字を表す。例えば、x^{y^z}はy^zがxに対する上付き添字であり、x_y^zはy^zがxに対する下付き添字であることを表す。また、_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

　また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。

＜技術的背景＞
　本発明の実施形態では、１個以上の補ラベルが付与されたデータを用いてマルチラベル分類問題に対するモデルを学習する。なお、本発明の実施形態を用いて、１個以上の補ラベルが付与されたデータを用いて多クラス分類問題に対するモデルを学習することもできる。

　以下、データが属する可能性があるクラス、つまり、データを分類するクラスの数をK、正解ラベルの集合[K]={1, …, K}とする。ここで、正解ラベルとは、クラス1に属すことを示すラベル、…、クラスKに属すことを示すラベルのことであり、それぞれ、1, …, Kで表す。

　K個の補ラベルを考える。ここで、K個の補ラベルとは、クラス1に属さないことを示すラベル、…、クラスKに属さないことを示すラベルのことであり、それぞれ、^-1, …, ^-Kで表すこととする。また、補ラベルの集合[^-K]={^-1, …, ^-K}で表すこととする。

　そして、１以上の補ラベルが付与されたデータについて、本発明の実施形態では、次のように取り扱うこととする。M個の補ラベルが付与されたデータに対して、Mが2以上である場合、当該データから1個の補ラベルが付与されたデータM個生成する。このことを以下で説明する記号を用いて説明すると、“M個の補ラベルが付与されたデータ（x_i, (^-y₁, …, ^-y_M)）（ただし、x_i∈χ, ^-y₁, …, ^-y_M∈[^-K]）から、1個の補ラベルが付与されたデータ（x_i, ^-y₁）, …, （x_i, ^-y_M)を生成する”となる。

　以下、正解ラベル学習、補ラベル学習について詳しく説明する。ここで、正解ラベル学習とは、１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習することをいい、補ラベル学習とは、１個以上の補ラベルが付与されたデータの集合を用いてモデルを学習することをいう。

［正解ラベル学習］
　χをデータの集合、g:χ→R^Kを決定関数とする。また、g_kを決定関数gの第k要素とする。Dをχ×[K]上の分布（ただし、分布Dの確率変数を(X, Y)～Dと表す）、{P_k}_k=1 ^K（ただし、P_k=P(X|Y=k)）、{π_k}_k=1 ^K（ただし、π_k=P(Y=k)）、loss:[K]×R^K→R₊を正解ラベル学習の損失関数とすると、損失関数loss, 分布Dに関する決定関数gのリスクR(g:loss)は、次式で表される。

　また、リスクR(g:loss)は、次式で表すこともできる。

　マルチラベル分類問題に対するモデルを学習する場合、損失関数lossとして、以下のバイナリクロスエントロピーやマルチラベルソフトマージンを用いることができる。ここで、y_kはクラスkが存在する場合は1、それ以外の場合は0を表すものとする。

（バイナリクロスエントロピー）

（マルチラベルソフトマージン）

　なお、多クラス分類問題に対するモデルを学習する場合、損失関数lossとして、ソフトマックスクロスエントロピーを用いることができる。

［補ラベル学習］
　^-Dをχ×[^-K]上の分布（ただし、分布^-Dの確率変数を(X, ^-Y)～^-Dと表す）、{^-P_k}_k=1 ^K（ただし、^-P_k=P(X|^-Y=k)）、{^-π_k}_k=1 ^K（ただし、^-π_k=P(^-Y=k)）、^-loss:[^-K]×R^K→R₊を補ラベル学習の損失関数とすると、損失関数^-loss, 分布^-Dに関する決定関数gのリスク^-R(g:^-loss)は、次式で表される。

　また、リスク^-R(g:^-loss)は、次式で表すこともできる。

　損失関数^-lossは、損失関数lossを用いた次式で計算される。

　なお、１個以上の正解ラベルが付与されたデータの集合と１個以上の補ラベルが付与されたデータの集合とを用いてモデルを学習することもできる。この場合、決定関数gのリスクR(g)は、次式を用いて計算するとよい。

　ただし、αは0<α<1を満たす定数である。

＜第１実施形態＞
　以下、図１～図２を参照してモデル学習装置１００について説明する。図１は、モデル学習装置１００の構成を示すブロック図である。図２は、モデル学習装置１００の動作を示すフローチャートである。図１に示すようにモデル学習装置１００は、学習データ生成部１１０と、第１リスク計算部１２０と、モデル更新部１３０と、終了条件判定部１４０と、記録部１９０を含む。記録部１９０は、モデル学習装置１００の処理に必要な情報を適宜記録する構成部である。

　図２に従いモデル学習装置１００の動作について説明する。

　Ｓ１１０において、学習データ生成部１１０は、１個以上の補ラベルが付与されたデータの集合（以下、入力補ラベル付きデータ集合という）から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する。

　Ｓ１２０において、第１リスク計算部１２０は、Ｓ１１０で生成した学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する。

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　Ｓ１３０において、モデル更新部１３０は、Ｓ１２０で計算したリスク^-R(g:^-loss)を用いて、モデルを更新する。具体的には、モデル更新部１３０は、リスク^-R(g:^-loss)を最小化するように、モデルを更新する。音響イベント検知に用いるモデルを学習する場合、モデルは、参考非特許文献１に記載の自己注意機構を備えたDNNモデルとすることができる。また、画像セグメンテーションに用いるモデルを学習する場合、モデルは、参考非特許文献２に記載のクラスアクティベーションマップを備えたDNNモデルとすることができる。

（参考非特許文献１：Q. Kong et al., “Sound Event Detection of Weakly Labelled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp.2450-2460, 2020.）
（参考非特許文献２：Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,” CVPR 2020, pp.12275-12284, 2020.）
　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ１３０の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ１２０の処理に戻る。終了条件には、例えば、モデル更新回数の上限に達したか否かという条件を用いることができる。

（変形例）
　上記Ｓ１１０～Ｓ１４０の処理は、以下のようにしてもよい。

　Ｓ１１０において、学習データ生成部１１０は、１個以上の補ラベルが付与されたデータの集合（以下、入力補ラベル付きデータ集合という）から、入力補ラベル付きデータ集合の部分集合であるバッチを生成し、当該バッチから、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する。

　Ｓ１２０において、第１リスク計算部１２０は、Ｓ１１０で生成した学習データ集合を用いて、式(1)で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する。

　Ｓ１３０において、モデル更新部１３０は、Ｓ１２０で計算したリスク^-R(g:^-loss)を用いて、モデルを更新する。

　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ１３０の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ１１０の処理に戻る。

　本発明の実施形態によれば、マルチラベル分類問題を対象とする、補ラベルを用いたモデル学習が可能となる。補ラベルを付与したデータを用いることにより、より多くのデータを用いた学習が可能となり、学習済みモデルを用いた推定の精度を向上させることやより多くのクラスを対象とする推定が可能となる。

＜第２実施形態＞
　以下、図３～図４を参照してモデル学習装置２００について説明する。図３は、モデル学習装置２００の構成を示すブロック図である。図４は、モデル学習装置２００の動作を示すフローチャートである。図３に示すようにモデル学習装置２００は、学習データ生成部１１０と、第１リスク計算部１２０と、第２リスク計算部２２０と、第３リスク計算部２３０と、モデル更新部２４０と、終了条件判定部１４０と、記録部１９０を含む。記録部１９０は、モデル学習装置２００の処理に必要な情報を適宜記録する構成部である。

　図４に従いモデル学習装置２００の動作について説明する。

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　Ｓ２２０において、第２リスク計算部２２０は、１個以上の正解ラベルが付与されたデータの集合（以下、入力正解ラベル付きデータ集合という）の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。

　Ｓ２３０において、第３リスク計算部２３０は、Ｓ１２０で計算したリスク^-R(g:^-loss)とＳ１３０で計算したリスクR(g:loss)から、R(g)=α^-R(g:^-loss)+(1-α)(g:loss)（ただし、αは0<α<1を満たす定数）により、リスクR(g)を計算する。

　Ｓ２４０において、モデル更新部２４０は、Ｓ２３０で計算したリスクR(g)を用いて、モデルを更新する。具体的には、モデル更新部２４０は、リスクR(g)を最小化するように、モデルを更新する。また、第１実施形態と同様、音響イベント検知に用いるモデルを学習する場合は参考非特許文献１に記載のモデル、画像セグメンテーションに用いるモデルを学習する場合は参考非特許文献２に記載のモデルとすることができる。

　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ２４０の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ１２０の処理、Ｓ２２０の処理に戻る。

　Ｓ１２０において、第１リスク計算部１２０は、Ｓ１１０で生成した学習データ集合を用いて、式(2)で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する。

　Ｓ２２０において、第２リスク計算部２２０は、１個以上の正解ラベルが付与されたデータの集合（以下、入力正解ラベル付きデータ集合という）の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する。

　Ｓ２４０において、モデル更新部２４０は、Ｓ２３０で計算したリスクR(g)を用いて、モデルを更新する。

　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ２４０の処理で得られたモデルを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ１１０の処理、Ｓ２２０の処理に戻る。

＜補記＞
　図５は、上述の各装置（つまり、各ノード）を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

　本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

　ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

　ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

　１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成部と、
　前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算部と、

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　リスク^-R(g:^-loss)を用いて、モデルを更新するモデル更新部と、
　を含むモデル学習装置。
　１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成部と、
　前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算部と、

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　１個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第２リスク計算部と、
　リスク^-R(g:^-loss)とリスクR(g:loss)から、R(g)=α^-R(g:^-loss)+(1-α)(g:loss)（ただし、αは0<α<1を満たす定数）により、リスクR(g)を計算する第３リスク計算部と、
　リスクR(g)を用いて、モデルを更新するモデル更新部と、
　を含むモデル学習装置。
　モデル学習装置が、１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成ステップと、
　前記モデル学習装置が、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算ステップと、

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　前記モデル学習装置が、リスク^-R(g:^-loss)を用いて、モデルを更新するモデル更新ステップと、
　を含むモデル学習方法。
　モデル学習装置が、１個以上の補ラベルが付与されたデータの集合から、１個の補ラベルが付与されたデータの集合（以下、学習データ集合という）を生成する学習データ生成ステップと、
　前記モデル学習装置が、前記学習データ集合の部分集合であるバッチを用いて、次式で計算される損失関数^-lossに関する決定関数gのリスク^-R(g:^-loss)を計算する第１リスク計算ステップと、

（ただし、Kはデータを分類するクラスの数、lossは１個以上の正解ラベルが付与されたデータの集合を用いてモデルを学習する場合に用いる損失関数）
　前記モデル学習装置が、１個以上の正解ラベルが付与されたデータの集合の部分集合であるバッチを用いて、損失関数lossに関する決定関数gのリスクR(g:loss)を計算する第２リスク計算ステップと、
　前記モデル学習装置が、リスク^-R(g:^-loss)とリスクR(g:loss)から、R(g)=α^-R(g:^-loss)+(1-α)(g:loss)（ただし、αは0<α<1を満たす定数）により、リスクR(g)を計算する第３リスク計算ステップと、
　前記モデル学習装置が、リスクR(g)を用いて、モデルを更新するモデル更新ステップと、
　を含むモデル学習方法。
　請求項３または４に記載のモデル学習方法であって、
　損失関数lossは、バイナリクロスエントロピーまたはマルチラベルソフトマージンである
　ことを特徴とするモデル学習方法。
　請求項３ないし５のいずれか１項に記載のモデル学習方法をコンピュータに実行させるためのプログラム。