WO2023139755A1

WO2023139755A1 - モデル学習装置、モデル学習方法、プログラム

Info

Publication number: WO2023139755A1
Application number: PCT/JP2022/002210
Authority: WO
Inventors: 圭吾若山; 翔一郎齊藤
Original assignee: 日本電信電話株式会社
Priority date: 2022-01-21
Filing date: 2022-01-21
Publication date: 2023-07-27
Also published as: JPWO2023139755A1

Abstract

１以上の補ラベルが付与されたデータを用いるマルチラベル分類に対するモデル学習技術を提供する。１以上の補ラベルが付与されたデータの集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算部と、分類リスクR(f)を用いて、モデルfを更新するモデル更新部と、を含むモデル学習装置であって、xをモデルfへの入力データ、^-Yを入力データxに付与された補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、分類リスクR(f)は、集合^-Yの要素でないラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる。

Description

モデル学習装置、モデル学習方法、プログラム

　本発明は、機械学習技術に関する。

　近年、音響イベント検知、画像セグメンテーション、画像認識などの分野において、機械学習が用いられている。機械学習の一般的な手順は以下の通りである。
（１）１つのデータに対してそのデータが属するクラスを示すラベル（正解ラベルという）を１以上付与し、正解ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、正解ラベルが付与されたデータの集合を生成する。
（２）正解ラベルが付与されたデータの集合を用いてモデルを学習する。
（３）学習済モデルを用いて、入力されたデータに対して当該データが属するクラス（正解クラスという）を推定する。

　ここで、１つのデータに対する正解クラスが１つである場合におけるクラスの推定を多クラス分類という。また、１つのデータに対する正解クラスが複数ありうる場合におけるクラスの推定をマルチラベル分類という。多クラス分類では１つのデータに対して１つの正解ラベルが付与され、マルチラベル分類では１つのデータに対して１以上の正解ラベルが付与される。

　上記手順に従い生成した学習済モデルを用いた正解クラスの推定において、推定精度を高めようとする場合、より多くの正解ラベルが付与されたデータが必要になる。しかし、推定対象となるクラスの数が増加すると、類似するクラスが出てくることに伴い、正解ラベルが付与されたデータを大量かつ正確に生成するのが困難になる。

　そこで、非特許文献１では、マルチラベル分類を対象とする機械学習として以下の手順を提案している。
（１）１つのデータに対してそのデータが属さないクラスを示すラベル（補ラベルという）を１以上付与し、補ラベルが付与されたデータを生成する。この作業を多くのデータに対して行うことにより、補ラベルが付与されたデータの集合を生成する。定義からわかるように、補ラベルは、正解クラスでないことを示すラベルである。
（２）補ラベルが付与されたデータの集合を用いてモデルを学習する。
（３）学習済モデルを用いて、入力されたデータに対して正解クラスを推定する。

　一般にあるデータに正解ラベルを付与するよりも補ラベルを付与する方が容易であるため、より多くのラベルが付与されたデータを簡便に生成することができる。

若山圭吾, 齋藤翔一郎, "補ラベル学習に基づく音響イベント検知," 信学技報EA2021-17, pp.77-82, 2021.

　非特許文献１の技術では、上記（２）のステップにおいて２以上の補ラベルが付与されたデータを１つの補ラベルが付与されたデータに変換したうえで学習に用いる。そのため、学習に際して１つのデータに対して補ラベルが２以上付与されているという点を活かしきれていないという問題があった。

　そこで本発明では、１以上の補ラベルが付与されたデータを用いるマルチラベル分類に対するモデル学習技術を提供することを目的とする。

　本発明の一態様は、１以上の補ラベルが付与されたデータの集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算部と、分類リスクR(f)を用いて、モデルfを更新するモデル更新部と、を含むモデル学習装置であって、xをモデルfへの入力データ、^-Yを入力データxに付与された補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、分類リスクR(f)は、集合^-Yの要素でないラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる。

　本発明の一態様は、１以上の補ラベルが付与されたデータの集合から、１以上の候補ラベルが付与されたデータの集合（以下、候補ラベル付きデータ集合という）を生成する候補ラベル付きデータ集合生成部と、前記候補ラベル付きデータ集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算部と、分類リスクR(f)を用いて、モデルfを更新するモデル更新部と、を含むモデル学習装置であって、xをモデルfへの入力データ、Yを入力データxに付与された候補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、分類リスクR(f)は、集合Yの要素であるラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる。

　本発明によれば、１以上の補ラベルが付与されたデータを用いるマルチラベル分類に対するモデル学習が可能となる。

モデル学習装置１００の構成を示すブロック図である。モデル学習装置１００の動作を示すフローチャートである。モデル学習装置２００の構成を示すブロック図である。モデル学習装置２００の動作を示すフローチャートである。本発明の実施形態における各装置を実現するコンピュータの機能構成の一例を示す図である。

　以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　各実施形態の説明に先立って、この明細書における表記方法について説明する。

　^（キャレット）は上付き添字を表す。例えば、x^{y^z}はy^zがxに対する上付き添字であり、x_y^zはy^zがxに対する下付き添字であることを表す。また、_（アンダースコア）は下付き添字を表す。例えば、x^y_zはy_zがxに対する上付き添字であり、x_{y_z}はy_zがxに対する下付き添字であることを表す。

　ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。
＜技術的背景＞
　本発明の実施形態では、１以上の補ラベルが付与されたデータを用いてマルチラベル分類問題に対するモデルを学習する。

　データを分類するクラスの数をKとし、[K]={1, …, K}でラベルの集合を表す。正解ラベルとは、クラス1に属すことを示すラベル、…、クラスKに属すことを示すラベルのことであり、集合Sが正解ラベルの集合であるとは、集合Sが集合[K]の部分集合であり、集合Sの要素であるラベルは正解ラベルであることをいう。また、補ラベルとは、クラス1に属さないことを示すラベル、…、クラスKに属さないことを示すラベルのことであり、集合^-Tが補ラベルの集合であるとは、集合^-Tが集合[K]の部分集合であり、集合^-Tの要素であるラベルは補ラベルであることをいう。ここで、クラスkに属さないことを示すラベルとは、クラスk以外に属することを示すラベルであると換言できる。さらに、補ラベルの集合^-Tの補集合T=[K]-^-Tを候補ラベルの集合という。集合Tの要素であることは、正解候補ラベルであることを意味する。例えば、K=6のとき、データxの正解ラベルの集合SがS={1, 3}であることはデータxがクラス1、クラス3に属することを表す。同様に、データxの補ラベルの集合^-Tが^-T={2, 4, 6}であることはデータxがクラス2、クラス4、クラス6以外に属することを表し、データxの候補ラベルの集合TがT=[K]-^-T={1, 3, 5}であることはデータxがクラス1、クラス3、クラス5に属する可能性があることを表す。

　学習対象であるモデルfは、入力データxに対してラベルk∈[K]が正解である確率p_k(k=1, …, K)を第k要素とするK次元ベクトルを出力する関数である。以下、確率p_kをf(x)_kと表すことにする。

　以下、補ラベル学習、候補ラベル学習について説明する。ここで、補ラベル学習とは、１つ以上の補ラベルが付与されたデータの集合を用いてモデルfを学習することをいい、候補ラベル学習とは、１つ以上の候補ラベルが付与されたデータの集合を用いてモデルfを学習することをいう。
［補ラベル学習］
　補ラベル学習では、Nをバッチのサイズ、x_n (n=1, …, N)をバッチに含まれるn番目のデータ、^-Y_n(n=1, …, N)をデータx_nに付与された補ラベルの集合として、モデルfの分類リスクR(f)を次式により計算する。

　なお、式(1)の代わりに、次式を用いるようにしてもよい。

（ただし、εは所定の定数）
　そして、補ラベル学習では、分類リスクR(f)が小さくなるようにモデルfを更新する。なお、式(1’)の分類リスクR(f)を用いると、式(1)の分類リスクR(f)を用いる場合に比べて学習が安定する。
［候補ラベル学習］
　候補ラベル学習では、Nをバッチのサイズ、x_n (n=1, …, N)をバッチに含まれるn番目のデータ、Y_n (n=1, …, N)をデータx_nに付与された候補ラベルの集合、Z_n (n=1, …, N)をデータx_nの正解ラベルの集合として、モデルfの分類リスクR(f)を次式により計算する。

　なお、式(3)の代わりに、次式を用いるようにしてもよい。

（ただし、εは所定の定数）
　なお、集合Z_n (n=1, …, N)は正確に知ることはできないため、所定の方法で推定して得られる集合を集合Z_nとして用いる。

　そして、候補ラベル学習では、分類リスクR(f)が小さくなるようにモデルfを更新する。なお、式(3’)の分類リスクR(f)を用いると、式(3)の分類リスクR(f)を用いる場合に比べて学習が安定する。
＜第１実施形態＞
　モデル学習装置１００は、１以上の補ラベルが付与されたデータの集合（以下、補ラベル付きデータ集合という）を用いて、モデルfを学習する。音響イベント検知に用いるモデルを学習する場合、モデルfは参考非特許文献１に記載の自己注意機構を備えた深層ニューラルネットワーク(Deep Neural Network: DNN)として構成することができる。DNNとして、例えば、音響信号の時間周波数表現であるログメルスペクトログラムを入力とする畳み込みニューラルネットワーク(Convolutional Neural Network: CNN)とトランスフォーマ(Transformer)のエンコーダとを含むニューラルネットワークとすることができる。また、画像セグメンテーションに用いるモデルを学習する場合、モデルfは参考非特許文献２に記載のクラスアクティベーションマップを備えたDNNとして構成することができる。
（参考非特許文献１：Q. Kong et al., “Sound Event Detection of Weakly Labelled Data with CNN-Transformer and Automatic Threshold Optimization,” IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol.28, pp.2450-2460, 2020.）
（参考非特許文献２：Y. Wang et al., “Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation,” CVPR 2020, pp.12275-12284, 2020.）
　以下、図１～図２を参照してモデル学習装置１００について説明する。図１は、モデル学習装置１００の構成を示すブロック図である。図２は、モデル学習装置１００の動作を示すフローチャートである。図１に示すようにモデル学習装置１００は、初期化部１１０と、分類リスク計算部１２０と、モデル更新部１３０と、終了条件判定部１４０と、記録部１９０を含む。記録部１９０は、モデル学習装置１００の処理に必要な情報を適宜記録する構成部である。記録部１９０は、例えば、事前に補ラベル付きデータ集合を記録しておく。

　図２に従いモデル学習装置１００の動作について説明する。

　Ｓ１１０において、初期化部１１０は、モデルfの初期値を設定する。初期化部１１０は、例えば、モデルfを構成するDNNのパラメータの初期値を設定する。

　Ｓ１２０において、分類リスク計算部１２０は、記録部１９０に記録した補ラベル付きデータ集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する。分類リスク計算部１２０は、例えば、式(1)と式(2)により、または、式(1’)と式(2)により分類リスクR(f)を計算する。つまり、分類リスクR(f)は、xをモデルfへの入力データ、^-Yを入力データxに付与された補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、集合^-Yの要素でないラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる関数を用いて計算する。

　Ｓ１３０において、モデル更新部１３０は、Ｓ１２０で計算した分類リスクR(f)を用いて、モデルfを更新する。モデル更新部１３０は、例えば、分類リスクR(f)が小さくなるように、モデルfを構成するDNNのパラメータを更新する。

　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ１３０の処理で得られたモデルfを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ１２０の処理に戻る。終了条件には、例えば、モデル更新回数の上限に達したか否かという条件を用いることができる。

　本発明の実施形態によれば、１以上の補ラベルが付与されたデータを用いるマルチラベル分類に対するモデル学習が可能となる。１つの補ラベルが付与されたデータに変換することなく１以上の補ラベルが付与されたデータをそのまま用いて学習することにより、より精度の高いマルチラベル分類が可能となる。
＜第２実施形態＞
　モデル学習装置２００は、１以上の補ラベルが付与されたデータの集合（以下、補ラベル付きデータ集合という）を用いて、モデルfを学習する。

　以下、図３～図４を参照してモデル学習装置２００について説明する。図３は、モデル学習装置２００の構成を示すブロック図である。図４は、モデル学習装置２００の動作を示すフローチャートである。図３に示すようにモデル学習装置２００は、候補ラベル付きデータ集合生成部２０５と、初期化部１１０と、分類リスク計算部２２０と、モデル更新部１３０と、終了条件判定部１４０と、記録部１９０を含む。記録部１９０は、モデル学習装置２００の処理に必要な情報を適宜記録する構成部である。

　図４に従いモデル学習装置２００の動作について説明する。

　Ｓ２０５において、候補ラベル付きデータ集合生成部２０５は、記録部１９０に記録した補ラベル付きデータ集合から、１以上の候補ラベルが付与されたデータの集合（以下、候補ラベル付きデータ集合という）を生成する。

　Ｓ１１０において、初期化部１１０は、モデルfの初期値を設定する。

　Ｓ２２０において、分類リスク計算部２２０は、Ｓ２０５で生成した候補ラベル付きデータ集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する。分類リスク計算部２２０は、例えば、式(3)により、または、式(3’)により分類リスクR(f)を計算する。つまり、分類リスクR(f)は、xをモデルfへの入力データ、Yを入力データxに付与された候補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、集合Yの要素であるラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる関数を用いて計算する。

　Ｓ１３０において、モデル更新部１３０は、Ｓ２２０で計算した分類リスクR(f)を用いて、モデルfを更新する。

　Ｓ１４０において、終了条件判定部１４０は、所定の終了条件が満たされる場合には、Ｓ１３０の処理で得られたモデルfを学習済みモデルとして処理を終了し、それ以外の場合には、Ｓ２２０の処理に戻る。

　本発明の実施形態によれば、１以上の補ラベルが付与されたデータを用いるマルチラベル分類に対するモデル学習が可能となる。１以上の補ラベルが付与されたデータを１以上の候補ラベルが付与されたデータに変換したうえでそのまま用いて学習することにより、より精度の高いマルチラベル分類が可能となる。
＜補記＞
　図５は、上述の各装置（つまり、各ノード）を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部２０２０に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０などに動作させることで実施できる。

　本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

　ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

　ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成部）を実現する。

　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

　上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。

Claims

　１以上の補ラベルが付与されたデータの集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算部と、
　分類リスクR(f)を用いて、モデルfを更新するモデル更新部と、
　を含むモデル学習装置であって、
　xをモデルfへの入力データ、^-Yを入力データxに付与された補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、
　分類リスクR(f)は、集合^-Yの要素でないラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる
　モデル学習装置。
　請求項１に記載のモデル学習装置であって、
　Nをバッチのサイズ、x_n(n=1, …, N)をバッチに含まれるn番目のデータ、^-Y_n (n=1, …, N)をデータx_nに付与された補ラベルの集合、Kをラベルの数とし、
　分類リスクR(f)は、次式により計算される

　ことを特徴とするモデル学習装置。
　１以上の補ラベルが付与されたデータの集合から、１以上の候補ラベルが付与されたデータの集合（以下、候補ラベル付きデータ集合という）を生成する候補ラベル付きデータ集合生成部と、
　前記候補ラベル付きデータ集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算部と、
　分類リスクR(f)を用いて、モデルfを更新するモデル更新部と、
　を含むモデル学習装置であって、
　xをモデルfへの入力データ、Yを入力データxに付与された候補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、
　分類リスクR(f)は、集合Yの要素であるラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる
　モデル学習装置。
　請求項３に記載のモデル学習装置であって、
　Nをバッチのサイズ、x_n(n=1, …, N)をバッチに含まれるn番目のデータ、Y_n (n=1, …, N)をデータx_nに付与された候補ラベルの集合、Z_n(n=1, …, N)をデータx_nの正解ラベルの集合とし、
　分類リスクR(f)は、次式により計算される

　ことを特徴とするモデル学習装置。
　モデル学習装置が、１以上の補ラベルが付与されたデータの集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算ステップと、
　前記モデル学習装置が、分類リスクR(f)を用いて、モデルfを更新するモデル更新ステップと、
　を含むモデル学習方法であって、
　xをモデルfへの入力データ、^-Yを入力データxに付与された補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、
　分類リスクR(f)は、集合^-Yの要素でないラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる
　モデル学習方法。
　モデル学習装置が、１以上の補ラベルが付与されたデータの集合から、１以上の候補ラベルが付与されたデータの集合（以下、候補ラベル付きデータ集合という）を生成する候補ラベル付きデータ集合生成ステップと、
　前記モデル学習装置が、前記候補ラベル付きデータ集合の部分集合であるバッチを用いて、モデルfの分類リスクR(f)を計算する分類リスク計算ステップと、
　前記モデル学習装置が、分類リスクR(f)を用いて、モデルfを更新するモデル更新ステップと、
　を含むモデル学習方法であって、
　xをモデルfへの入力データ、Yを入力データxに付与された候補ラベルの集合、f(x)_kをラベルkに対するモデルf(x)の値とし、
　分類リスクR(f)は、集合Yの要素であるラベルkに対するモデルf(x)の値f(x)_kが大きくなるほどその値が小さくなる
　モデル学習方法。
　請求項１ないし４のいずれか１項に記載のモデル学習装置としてコンピュータを機能させるためのプログラム。