WO2024013911A1

WO2024013911A1 - 学習装置、学習方法、学習プログラム、推論装置、推論方法、及び推論プログラム

Info

Publication number: WO2024013911A1
Application number: PCT/JP2022/027626
Authority: WO
Inventors: 関利金井; 真弥山口; 真徳山田
Original assignee: 日本電信電話株式会社
Priority date: 2022-07-13
Filing date: 2022-07-13
Publication date: 2024-01-18

Abstract

計算部（１３１）は、入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する。更新部（１３３）は、複数のラベルのうち、入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて計算部（１３１）が計算した不正解スコアの最大値と、正解ラベルについて計算部（１３１）が計算した正解スコアと、の差が大きい一定の割合の入力データについて、正解スコアと不正解スコアとの間の損失である１対他損失が小さくなるように、モデルのパラメータを更新する。

Description

学習装置、学習方法、学習プログラム、推論装置、推論方法、及び推論プログラム

　本発明は、学習装置、学習方法、学習プログラム、推論装置、推論方法、及び推論プログラムに関する。

　深層学習、ディープニューラルネットワークは、画像認識及び音声認識等で大きな成功を収めている。例えば、深層学習を使った画像認識では、深層学習の多数の非線形関数を含んだモデルに画像を入力すると、その画像が何を写しているのかという分類結果を出力する。特に、畳み込みニューラルネットワークとＲｅＬＵ（Rectified　Linear　Unit）は、画像認識において頻繁に使用される技術である。

　しかしながら、悪意ある攻撃者が、モデルに最適なノイズを入力画像に加えると、小さなノイズで簡単に深層学習を誤分類させることができる。これは、敵対的攻撃と呼ばれており、例えば、ＰＧＤ（Projected　Gradient　Descent）等の攻撃方法が報告されている。

　また、敵対的攻撃に対し、モデルをロバスト化するための方法として、敵対的攻撃を受けたサンプルを使って学習する敵対的学習と呼ばれる方法が提案されている（例えば、非特許文献１を参照）。また、敵対的学習と類似のロバストな学習方法としてTRADESと呼ばれる方法が提案されている（例えば、非特許文献２を参照）。

Aleksander　Madry,　Aleksandar　Makelov,　Ludwig　Schmidt,　Dimitris　Tsipras,　Adrian　Vladu　,"Towards　deep　learning　models　resistant　to　adversarial　attacks",　arXiv　preprint:1706.06083(2017). Zhang,　Hongyang,　et　al.　,"Theoretically　principled　trade-off　between　robustness　and　accuracy.",International　conference　on　machine　learning".　ICML　2019.

　しかしながら、従来の技術には、敵対的攻撃に対するモデルの頑健性が十分でない場合があるという問題がある。

　上述した課題を解決し、目的を達成するために、学習装置は、入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する計算部と、前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算部が計算した不正解スコアの最大値と、前記正解ラベルについて前記計算部が計算した正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるように、前記モデルのパラメータを更新する更新部と、を有することを特徴とする。

　本発明によれば、敵対的攻撃に対するモデルの頑健性を向上させることができる。

図１は、モデルの構成を説明する図である。図２は、モデルの最終層の構成を説明する図である。図３は、第１の実施形態に係る学習装置の構成例を示す図である。図４は、第１の実施形態に係る学習処理の流れを示すフローチャートである。図５は、損失関数を作成する処理の流れを示すフローチャートである。図６は、学習プログラムを実行するコンピュータの一例を示す図である。

　以下に、本願に係る学習装置、学習方法、学習プログラム、推論装置、推論方法、及び推論プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。

［第１の実施形態］
　実施形態の学習装置は、深層学習のモデル（以下、単にモデルと呼ぶ）の学習（訓練）を行う。まず、図１を用いて、モデルの構成を説明する。深層学習のモデルは、ディープニューラルネットワークと言い換えられてもよい。

　図１に示すように、モデルは、信号が入る入力層と、入力層からの信号を様々に変換する１つ又は複数の中間層と、中間層の信号を確率等の出力に変換する最終層と、を含む。図１の例では、中間層の数はＬである（ただし、Ｌ≧１）。

　図２に示すように、最終層では、最後の中間層（図１の例では第Ｌ中間層）の出力をsoftmax関数に入力して出力が得られる。softmax関数の出力が、モデル全体の出力に相当する。

　図３を用いて、学習装置の構成を説明する。図３は、第１の実施形態に係る学習装置の構成例を示す図である。

　図３に示すように、学習装置１０は、通信部１１、記憶部１２及び制御部１３を有する。

　通信部１１は、他の装置との間でデータ通信を行う。例えば、通信部１１はＮＩＣ（Network　Interface　Card）である。また、通信部１１は、入力装置（例えばマウス及びキーボード）及び出力装置（例えばディスプレイ）との間でデータの入出力を行うためのインタフェースであってもよい。

　記憶部１２は、ＨＤＤ（Hard　Disk　Drive）、ＳＳＤ（Solid　State　Drive）、光ディスク等の記憶装置である。なお、記憶部１２は、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ、ＮＶＳＲＡＭ（Non　Volatile　Static　Random　Access　Memory）等のデータを書き換え可能な半導体メモリであってもよい。記憶部１２は、学習装置１０で実行されるＯＳ（Operating　System）や各種プログラムを記憶する。

　記憶部１２は、モデル情報１２１を記憶する。モデル情報１２１は、モデルを構築するためのパラメータである。例えば、モデル情報１２１は、ディープニューラルネットワークの重み、バイアス等である。また、モデル情報１２１は、学習により更新される。

　制御部１３は、学習装置１０全体を制御する。例えば、制御部１３は、ＣＰＵ（Central　Processing　Unit）、ＭＰＵ（Micro　Processing　Unit）、ＧＰＵ（Graphics　Processing　Unit）、ＡＳＩＣ（Application　Specific　Integrated　Circuit）、ＦＰＧＡ（Field　Programmable　Gate　Array）といった電子回路又は集積回路により実現される。

　また、制御部１３は、各種の処理手順を規定したプログラム及び制御データを格納するための内部メモリを有し、内部メモリを用いて各処理を実行する。また、制御部１３は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部１３は、計算部１３１、作成部１３２及び更新部１３３を有する。

　計算部１３１は、あらかじめ用意されたデータセット（教師データセット）から選択された入力データとラベルのうち、入力データをモデルに印可（入力）する。これにより、計算部１３１は、入力データに対応する出力データを計算する。また、モデルは、モデル情報１２１を基に構築される。

　なお、データセットにおいては、入力データとラベルが対応付けられているものとする。また、モデルは、適宜識別器、分類器のように言い換えられてもよい。

　モデルが画像認識に用いられるものである場合、入力データは画像から抽出された特徴量である。また、ラベルは、画像に写る物体を特定する情報である。また、例えば、モデルが出力するスコアは、画像に各ラベルに対応する物体が写っている確率である。

　作成部１３２は、モデルの出力データを基に損失関数を作成する。例えば、作成部１３２は、モデルの出力データが、入力データに対応するラベルと一致するほど（類似度が大きいほど）小さくなる損失関数を作成する。

　更新部１３３は、損失関数が最適化（例えば最小化）されるように、モデルのパラメータ、すなわちモデル情報１２１を更新する。

　このような一連の処理を繰り返すことにより、モデルの識別精度が向上する。学習装置１０は、評価基準が満たされた場合、学習処理を終了する。評価基準は、別途用意した評価用のデータセットに対するモデルの識別精度が閾値以上になったこと、パラメータの更新量が収束したこと、パラメータの更新が一定回数繰り返されたこと等である。

　また、本実施形態では、学習装置１０は、敵対的学習を行う。敵対的学習においては、一般的な学習と異なる損失関数が作成される。以降、本実施形態における敵対的学習について説明する。

　以降の数式において、大文字の太字は行列を表し、小文字の太字は列ベクトルを表す。また、行ベクトルは転置を使って表現される。

　ここでは、モデルが画像認識に用いられる場合を例に説明するが、本実施形態は、画像認識に限られず、深層学習を使った識別に一般に適用可能である。

　深層学習で入力データｘ∈Ｒ^ｄを認識し、Ｍ個のラベルから画像のラベルｙ∈｛１，…，Ｍ｝を求める問題を考える。ただしdは入力データの次元であり，簡単のためベクトルで記載しているがデータの構造は問わない。また、例えば、入力データｘは、画像の特徴を表すデータである。

　このとき、深層学習のモデルは、非線形関数と線形演算を繰り返して最終層でsoftmax関数を通して出力データを出力する。

　いま、モデルで変換されて最終的にsoftmaxに入力されるベクトル（図１の第Ｌ層の出力に相当）をｚ_θ（ｘ）＝［ｚ_１，θ（ｘ），ｚ_２，θ（ｘ），…，ｚ_Ｍ，θ（ｘ）］^Ｔとする。θは深層学習のモデルのパラメータ、すなわちモデル情報１２１である。また、ｚ_θ（ｘ）はlogitと呼ばれる。

　softmax関数をｆ_ｓ（・）とすると、モデルの出力はsoftmaxの出力ｆ_ｓ（ｚ_θ（ｘ））∈Ｒ^Ｍであり、ｋ番目の出力は（１）式で表される。

　（１）式の出力は、クラス分類において各ラベルに対するスコアを表し、（２）式によって得られる最も大きな出力の要素が深層学習の認識結果である。

　ただし、softmaxは大小関係を維持するため、（３）式のようにしても（２）式と結果は変わらない。

　画像認識はクラス分類の１つであり、分類を行うモデルｆ_ｓ（ｚ_θ（・））は分類器と呼ばれる。

　パラメータθは事前に用意したＮ個のデータセット｛（ｘ_ｉ，ｙ_ｉ）｝（ｉ＝１，…，Ｎ）から学習される。

　通常の学習では、ｙ_ｉ＝ａｒｇ　ｍａｘ_ｋｚ_ｋ，θ（ｘ）と正しく認識できるほど小さな値となるような損失関数ｌ（ｘ，ｙ，θ）が設定され、（４）式の最適化によりθが求められる。なお、この損失関数はクロスエントロピーである。

　一方、敵対的学習では、まず敵対的攻撃を各入力データに対して行う。すなわち、疑似的に敵対的攻撃を行った敵対的攻撃済みデータｘ´＝ｘ＋δが作成される。δは攻撃によるノイズであり、ノルム等が制約されている。敵対的攻撃済みデータｘ´の作成方法は、ここで説明したものに限られない。

　敵対的学習では、敵対的攻撃済みデータｘ´を用いて、（５）式の最適化によりθが求められる。

　これまでの説明を踏まえて、作成部１３２による損失関数の作成について説明する。

　モデルがデータを（３）式のlogitの大小で分類することから、（６）式のlogit　margin　loss　ｌ_ＬＭ（・）は、データ（ｘ，ｙ）の分類の難しさを表していると考えられる。

　ただし、ｚ_ｋ，θ（ｘ）は、logitであるｚ_θ（ｘ）のｋ番目の要素である。

　また、モデルに適当な滑らかさを仮定すれば、ｌ_ＬＭ（ｘ，ｙ，θ）が負の方向に大きいほど、敵対的攻撃済みデータｘ´に対してモデルは頑健であるといえる。そこで、（６）式に示す差を拡大し、頑健性を向上させるため、すなわちモデルをロバスト化するため、作成部１３２は、（７）式に示すような１対他損失（one-versus-the-rest　loss）ｌ_ＯＶＲを用いて損失関数を作成する。

　ここで、φは非負値の凸関数、かつ微分可能であり、ｚ＞０に対してφ（ｚ）＜φ（－ｚ）とする。ここでは、φ（ｚ）＝ｌｏｇ（１＋ｅ^－ｚ）（（８）式の右辺第２項）とする。その場合、（７）式のｌ_ＯＶＲは、（８）式のように表される。

　作成部１３２は、データセットに含まれるデータ（入力データとラベルの組）のうち、敵対的攻撃に対するlogit　margin　lossであるｌ_ＬＭ（ｘ´）が大きい値を持つ上位Ｈ％のデータサンプルを敵対的攻撃に対して適用する。ただし、０＜Ｈ＜１００であるものとする。

　データサンプルは、データセットに含まれる入力データに攻撃を行った敵対的攻撃済みデータｘ´と、入力データに対応付けられたラベルｙの組である。データサンプルは複数あるものとする。これより、作成部１３２は、（９）式の損失関数を作成する。なお、（９）式の右辺の［］内の第１項はクロスエントロピーであり、第２項が敵対的攻撃に関する１対他損失である。

　Ｓは、ｌ_ＬＭ（ｘ´）が小さい値を持つ下位（１００－Ｈ）％のデータサンプルの集合である。Ｌは、ｌ_ＬＭ（ｘ´）が大きい値を持つ上位Ｈ％のデータサンプルの集合である。λは損失の重みを決める調整パラメータである。

　例えば、データサンプルの数が１００であり、Ｈが２０である場合を考える。作成部１３２は、１００個のデータサンプルをｌ_ＬＭ（ｘ´）が大きい順にソートする。そして、作成部１３２は、ソートされたデータサンプルの先頭から２０個目までのデータサンプルを取得し、集合Ｌに加える。また、作成部１３２は、ソートされたデータサンプルの２１個目から１００個目のデータサンプルを取得し、集合Ｓに加える。

　（９）式では、集合Ｓの損失をクロスエントロピーとしたが、これに限定されず、他の損失であってもよい。

　また、Stochastic　gradient　descent（ＳＧＤ）のようなデータの一部（ミニバッチ）を用いるような最適化方法を用いる際には、ミニバッチの中でのｌ_ＬＭ（・）の大きさを基に、上位Ｈ％のデータサンプルに対して１対他損失を適用して最適化を行う。

　更新部１３３は、（９）式が最適化（最小化）されるように、モデルのパラメータを更新する。

（TRADESと１対他損失の組み合わせ）
　非特許文献２のTRADESでは、同様に敵対的攻撃済みデータｘ´を用いて、（１０）式の最適化によりθが求められる。

　ｌ_ＣＥは、クロスエントロピー損失である。また、ＫＬはＫＬ　divergenceである。

　TRADESにより、敵対的攻撃済みデータが作成される場合、作成部１３２は、（１１）式の損失関数を作成する。

　（１１）式の右辺の［］内の第３項は、ｐθ（ｋ｜ｘ_ｉ）＝ｐθ（ｋ｜ｘ_ｉ＋δ）０にならない点で、（１０）式のＫＬ　divergenceとは異なる（ただし、最小ではある）。そのため、（１１）式のβは、（１０）式のTRADESのβとは異なる。

［第１の実施形態の処理］
　図４を用いて、学習装置１０の処理の流れを説明する。図４は、第１の実施形態に係る学習処理の流れを示すフローチャートである。

　まず、図４に示すように、学習装置１０は、データセットからランダムに選択された入力データを識別器に印可する（ステップＳ１１）。識別器は、モデル情報１２１から構築されたモデルの一例である。識別器に印可される入力データは、敵対的攻撃済みデータであってもよい。

　次に、学習装置１０は、識別器の出力、及びデータセットに含まれるラベルを基に、敵対的攻撃について、１対他損失を含む損失関数を作成する（ステップＳ１２）。損失関数を作成する処理の詳細については後述する。

　そして、学習装置１０は、損失関数の勾配を使って識別器のパラメータを更新する（ステップＳ１３）。学習装置１０は、誤差逆伝播法等の既知の手法によりパラメータを更新することができる。

　ここで、評価基準が満たされた場合（ステップＳ１４、Ｙｅｓ）、学習装置１０は処理を終了する。一方、評価基準が満たされていない場合（ステップＳ１４、Ｎｏ）、学習装置１０はステップＳ１１に戻り処理を繰り返す。

　図５を用いて、損失関数を作成する処理（図４のステップＳ１２）の流れを説明する。図５は、損失関数を作成する処理の流れを示すフローチャートである。

　図５に示すように、まず、学習装置１０は、識別器に印可されたデータサンプルの中から、ランダムにいくつかのデータサンプルを選択する（ステップＳ１２１）。

　次に、学習装置１０は、選ばれたデータサンプルに対して敵対的攻撃を作成する（ステップＳ１２２）。学習装置１０は、ｘ´＝ｘ＋δのように敵対的攻撃を作成してもよいし、TRADESにより敵対的攻撃を作成してもよい。

　続いて、学習装置１０は、生成された攻撃に対して１対他損失を計算する（ステップＳ１２３）。ここで、学習装置１０は、１対他損失の大きな順にＨ％のデータサンプルの集合Ｌと、その他の集合Ｓを作成する（ステップＳ１２４）。

　そして、学習装置１０は、集合Ｌの攻撃に対して１対他損失を計算し、その他の集合Ｓにはクロスエントロピーを適用し、１対他損失とクロスエントロピーの和を損失関数として作成する（ステップＳ１２５）。ここで作成された損失関数は、（９）式のようになる。

　これまで説明してきたように、計算部１３１は、入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する。なお、ここでのスコアは、softmaxからの出力だけでなく、softmaxからの出力と大小関係が共通するlogitを含むものとする。敵対的攻撃済みデータは、例えばｘ´＝ｘ＋δである。

　更新部１３３は、複数のラベルのうち、入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて計算部１３１が計算した不正解スコアの最大値と、正解ラベルについて計算部１３１が計算した正解スコアと、の差が大きい一定の割合の入力データについて、正解スコアと不正解スコアとの間の損失である１対他損失が小さくなるように、モデルのパラメータを更新する。

　不正解ラベルについて計算部１３１が計算した不正解スコアの最大値と、正解ラベルについて計算部１３１が計算した正解スコアと、の差は、例えば（６）式に示す通りである。また、一定の割合は、例えばＨ％である。また、敵対的攻撃済みデータについての１対他損失は、例えば（７）式及び（８）式に示す通りである。

　このように、敵対的攻撃に対し１対他損失を適用することで、敵対的攻撃に対するモデルの頑健性を向上させることができる。

　更新部１３３は、敵対的攻撃済みデータをモデルに入力した場合の１対他損失に加え、敵対的攻撃済みデータをモデルに入力した場合のＫＬ　divergenceを合わせた損失関数が小さくなるように、モデルのパラメータを更新する。この場合の損失関数は、例えば（１０）式に示す通りである。

　このように、ＫＬ　divergenceのような通常の損失と、１対他損失を同時に最適化することができる。

　更新部１３３は、敵対的攻撃済みデータをモデルに入力した場合の１対他損失に加え、入力データをモデルに入力した場合の１対他損失と、入力データをモデルに入力した場合のＫＬ　divergenceを合わせた損失関数が小さくなるように、モデルのパラメータを更新する。この場合の損失関数は、例えば（１１）式に示す通りである。

　このように、本実施形態は、TRADESに適用することも可能である。

（推論装置について）
　推論装置は、学習装置１０によって更新されたモデル情報１２１を用いて、計算部１３１と同じ処理を行う。推論装置、推論方法及び推論プログラムは、学習装置１０の計算部１３１を用いて実現することができる。また、推論装置は、計算部１３１と同等の機能を有する学習装置１０とは異なる装置によって実現されてもよい。

　推論装置として機能する学習装置１０は、入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算し、複数のラベルのうち、入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて計算する処理で計算された不正解スコアの最大値と、正解ラベルについて計算する処理で計算された正解スコアと、の差が大きい一定の割合の入力データについて、正解スコアと不正解スコアとの間の損失である１対他損失が小さくなるようにパラメータが更新されたモデルを用いて、入力データに対する複数のラベルのスコアを計算する計算部１３１を有する。

［システム構成等］
　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、ＣＰＵ（Central　Processing　Unit）及び当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。なお、プログラムは、ＣＰＵだけでなく、ＧＰＵ等の他のプロセッサによって実行されてもよい。

　また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

［プログラム］
　一実施形態として、学習装置１０は、パッケージソフトウェアやオンラインソフトウェアとして上記の学習処理を実行する学習プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の学習プログラムを情報処理装置に実行させることにより、情報処理装置を学習装置１０として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やＰＨＳ（Personal　Handyphone　System）等の移動体通信端末、さらには、ＰＤＡ（Personal　Digital　Assistant）等のスレート端末等がその範疇に含まれる。

　また、学習装置１０は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の学習処理に関するサービスを提供する学習サーバ装置として実装することもできる。例えば、学習サーバ装置は、学習用のデータを入力とし、学習済みのモデルのパラメータを出力とする学習サービスを提供するサーバ装置として実装される。この場合、学習サーバ装置は、Ｗｅｂサーバとして実装することとしてもよいし、アウトソーシングによって上記の学習処理に関するサービスを提供するクラウドとして実装することとしてもかまわない。

　図６は、学習プログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ（Read　Only　Memory）１０１１及びＲＡＭ（Random　Access　Memory）１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、学習装置１０の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、学習装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid　State　Drive）により代替されてもよい。

　また、上述した実施形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０は、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して、上述した実施形態の処理を実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　１０　学習装置
　１１　通信部
　１２　記憶部
　１３　制御部
　１２１　モデル情報
　１３１　計算部
　１３２　作成部
　１３３　更新部

Claims

　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する計算部と、
　前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算部が計算した不正解スコアの最大値と、前記正解ラベルについて前記計算部が計算した正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるように、前記モデルのパラメータを更新する更新部と、
　を有することを特徴とする学習装置。
　前記更新部は、前記敵対的攻撃済みデータを前記モデルに入力した場合の前記１対他損失に加え、前記敵対的攻撃済みデータを前記モデルに入力した場合のＫＬ　divergenceを合わせた損失関数が小さくなるように、前記モデルのパラメータを更新することを特徴とする請求項１に記載の学習装置。
　前記更新部は、前記敵対的攻撃済みデータを前記モデルに入力した場合の前記１対他損失に加え、前記入力データを前記モデルに入力した場合の１対他損失と、前記入力データを前記モデルに入力した場合のＫＬ　divergenceを合わせた損失関数が小さくなるように、前記モデルのパラメータを更新することを特徴とする請求項１に記載の学習装置。
　学習装置によって実行される学習方法であって、
　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する計算工程と、
　前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算工程が計算した不正解スコアの最大値と、前記正解ラベルについて前記計算工程が計算した正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるように、前記モデルのパラメータを更新する更新工程と、
　を含むことを特徴とする学習方法。
　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算する計算ステップと、
　前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算ステップが計算した不正解スコアの最大値と、前記正解ラベルについて前記計算ステップが計算した正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるように、前記モデルのパラメータを更新する更新ステップと、
　をコンピュータに実行させることを特徴とする学習プログラム。
　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算し、前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算する処理で計算された不正解スコアの最大値と、前記正解ラベルについて前記計算する処理で計算された正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるようにパラメータが更新された前記モデルを用いて、
　入力データに対する前記複数のラベルのスコアを計算する計算部を有することを特徴とする推論装置。
　推論装置によって実行される推論方法であって、
　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算し、前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算する処理で計算された不正解スコアの最大値と、前記正解ラベルについて前記計算する処理で計算された正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるようにパラメータが更新された前記モデルを用いて、
　入力データに対する前記複数のラベルのスコアを計算する計算工程を含むことを特徴とする推論方法。
　入力データに疑似的に敵対的攻撃を行った敵対的攻撃済みデータをモデルに入力し、複数のラベルのそれぞれに対するスコアを計算し、前記複数のラベルのうち、前記入力データとあらかじめ対応付けられたラベルである正解ラベル以外のラベルである不正解ラベルについて前記計算する処理で計算された不正解スコアの最大値と、前記正解ラベルについて前記計算する処理で計算された正解スコアと、の差が大きい一定の割合の前記入力データについて、前記正解スコアと前記不正解スコアとの間の損失である１対他損失が小さくなるようにパラメータが更新された前記モデルを用いて、
　入力データに対する前記複数のラベルのスコアを計算する計算ステップをコンピュータに実行させることを特徴とする推論プログラム。