JP7331937B2

JP7331937B2 - ロバスト学習装置、ロバスト学習方法、プログラム及び記憶装置

Info

Publication number: JP7331937B2
Application number: JP2021550806A
Authority: JP
Inventors: 拓磨天田; 和也柿崎; 俊則荒木
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2019-10-01
Filing date: 2019-10-01
Publication date: 2023-08-23
Anticipated expiration: 2039-10-01
Also published as: US20220335298A1; JPWO2021064856A1; WO2021064856A1

Description

本発明は、複数機械学習モデルの構築を行うロバスト学習装置、ロバスト学習方法、プログラム及び記憶装置に関する。

機械学習、特に深層学習は、コンピュータ性能の向上やアルゴリズムの進歩によって人手によるルール記述、特徴量設計が不要かつ高精度なパターン認識を実現する。自動運転は、注目されているアプリケーションの一つである。また、画像人意識、音声認識を応用した高精度な生体認証技術も代表的なアプリケーションである。

一方で、機械学習によって構築された学習済みモデルには脆弱性が存在する。学習済みモデルを欺くように巧みに作られた人為的なサンプルである、敵対的サンプルを用いれば、訓練時に想定されていない誤動作が誘発されるという問題が知られている。敵対的サンプルを生成する一方式では、敵対的サンプルによる攻撃対象の人工知能、分類器が入力に対してどう反応するかを解析することで対象の分類器が誤りを生じやすい領域を特定し、当該領域に誘導するようなサンプルを人工的に生成することができる。こういったサンプルは分類器を判断ロジックとして利用するシステムやＡＩモデルに誤動作や暴走といったインシデントを誘発させることが可能となる。

例えば、交通標識を認識するタスクを学習した分類器に対する敵対的サンプルの一例として、特定の交通標識に誤分類するように巧みに作られたシールを既存の標識に張ったもの、ある標識の特定箇所を削ったもの、人間には認識できないほどのノイズを付加したもの等があげられる。敵対的サンプルの生成には、攻撃者が学習済みモデルのパラメータにアクセスできる状況で、学習済みモデルの出力と正解との誤差が大きくなるようにサンプルにノイズを載せる方法(white box攻撃)や、攻撃者はモデルのパラメータにアクセスせず、入力と出力の関係から、別の学習モデルを構築し、そのモデルへのwhite box攻撃により所望の敵対的サンプルを生成する方法がよく知られている。

これら敵対的サンプルによる問題への対策として、学習モデルをロバストに構築する方法が提案されている（非特許文献１）。ここで、「ロバスト」とは、あるサンプルとはわずかに異なる敵対的サンプルが入力されたとき、正常サンプルに対する正解クラス以外のクラスへの誤分類が生じづらい状態をいう。所定のロバスト性を達成しながら学習モデルを学習することをロバスト学習と呼ぶ。敵対的サンプルへのロバスト学習手法のうち、非特許文献１に記載の方法は、モデルを複数用意して、入力に対する勾配ベクトルの向きがモデル間で開くように学習する。敵対的サンプルを生成するために用いられたノイズによる影響がモデル間で異なりやすく、全てのモデルが同様に騙されることを防ぐ技術である。

機械学習のモデルの生成過程では、モデルの出力と学習データの正解ラベルとの誤差によって定められ、誤差が小さいほど学習データとネットワークの予測結果が近くなるように定められた予測損失関数と呼ばれる関数が用いられる。この予測損失関数を微分することで、予測損失関数の値が小さくなるようにパラメータを更新することでモデルの生成処理は進む。このような更新処理を複数回実行することで学習を進めていき、十分にモデルの出力が学習データの正解ラベルに近づくか、予定していただけの更新処理を行うことでモデルを生成する。

非特許文献１に記載の方法では、予測損失関数に加えて、各モデルのパラメータの更新方向が異なっているときに小さくなる関数を用いる。具体的には、予測損失関数が増加する入力データの変化の方向を示す勾配ベクトルの類似度をすべてのモデルについて和をとった関数を用いている。この関数を勾配損失関数と呼ぶ。勾配損失関数には例えば、２ベクトル間のcosine類似度の計算を行う。勾配ベクトルの方向がモデル毎に異なっているほど、勾配ベクトルのcosine類似度の和は小さくなる。

非特許文献１に記載の方法では、予測損失関数と勾配損失関数の和を微分し、和が小さくなるようにパラメータを更新することでモデルの生成処理を行う。この条件でパラメータの更新を繰り返すと、両方の条件を満たすパラメータに近づいていく。予測損失関数は予測精度の向上の役割を担い、勾配損失関数は各モデルの勾配ベクトルが異なる方向に更新する役割を担う。各モデルの勾配ベクトルが異なる方向に更新されると敵対的サンプルへの堅牢性が向上する。

非特許文献１に記載の方法では、学習の目的関数に予測損失関数と勾配損失関数を含み、勾配損失関数は学習対象のすべてのモデルの勾配ベクトルが含まれるため、生成された計算グラフを逆伝搬したときに、全てのモデルのネットワークパラメータの微分係数を求めるため、微分処理が重い。なお、全ての訓練データの予測結果を反映させてニューラルネットワークのパラメータを更新することを学習１エポックとし、学習済みモデルの生成には決められたエポック数だけ学習するか、推論において十分な精度を達成するまで学習する。

"Improving Adversarial Robustness of Ensembles with Diversity Training"、「online」、「令和１年８月２６日検索」、インターネット＜URL : https://arxiv.org/abs/1901.9981 ＞

非特許文献１に記載の、異なる特徴を持つ複数のモデルの生成方法は、計算量が大きい。例えば、非特許文献１に記載の方法では、モデルを学習する際の目的関数に、モデルの予測の正確性を表す予測損失と、他のモデルとの更新方向が異なるときに小さくなる勾配損失を用いている。勾配損失の計算には、全てのモデルの入力に対する勾配ベクトルを算出し、各ベクトルの類似度を計算する。生成するモデル数をｎとし、モデルｉ（=１、２、…、ｎ）についてパラメータの更新を行うとき、勾配損失算出でｎ個のベクトルを生成する。モデルｉの勾配ベクトルとその他のモデルの勾配ベクトルとの類似度を計算し、予測損失とを足し合わせて目的関数とする。このとき、モデルｉの目的関数には他モデルの勾配ベクトルが含まれており、勾配法でモデルパラメータの更新を行うと、モデルｉは識別の正確性が高まりかつ他のモデルとは異なるように更新され、モデルｉ以外のモデルはモデルｉとの類似度が低下するように更新される。モデルｉの更新でモデルｎ個分のパラメータを更新するため、並列に学習するモデル数が増加するとき、学習時間がＯ（ｎ^２）のオーダーで増加する。並列に学習するモデル数が増加するほど、学習時間が非効率である。

本発明は、上述の課題を解決することのできるロバスト学習装置、ロバスト学習方法、プログラム、及び記憶装置を提供する。

本発明の一つの態様によれば、ロバスト学習装置は、ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するロバスト学習装置であって、ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択するモデル選択部と、前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記モデル選択部が選択した前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する限定目的関数算出部と、前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う更新部と、を備える。

本発明の一つの態様によれば、ロバスト学習方法は、ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するロバスト学習方法であって、ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択し、前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出し、前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う。

本発明の一つの態様によれば、プログラムは、ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するコンピュータに、ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択する処理、前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する処理、前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う処理、を行わせる。

本発明の一つの態様によれば、記憶装置は、ｎ個のニューラルネットワークのパラメータ、訓練データ、正解ラベルを入力として、更新された前記パラメータを出力するコンピュータに、ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択する処理、前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する処理、前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う処理、を行わせるプログラムを記憶する。

上記したロバスト学習装置、ロバスト学習方法、プログラム、及び記憶装置によれば、敵対的サンプルが入力されても、想定外の動作を回避できるような学習モデルであって、その学習モデルが、並列に依存させて学習するモデルを複数含む場合に、並列に依存させて学習するモデルの数が増加しても、効率的に少ない学習時間で学習モデルを構築することができる。

本発明の第一実施形態に係るロバスト学習装置の一例を示すブロック図である。本発明の第一実施形態に係る限定目的関数算出装置の一例を示すブロック図である。本発明の第一実施形態に係るロバスト学習装置の動作例を示すフローチャートである。本発明の第二実施形態に係る限定目的関数算出装置の一例を示すブロック図である。本発明の第三実施形態に係るロバスト学習装置の一例を示すブロック図である。本発明の一実施形態に係るロバスト学習装置の最小構成を示す図である。本発明の一実施形態におけるロバスト学習装置のハードウェア構成の一例を示す図である。

以下、本発明の各実施形態について図面を参照して詳細に説明する。以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。以下の説明に用いる図面において、本発明に関係ない部分の構成については、記載を省略し、図示しない場合がある。

＜第一実施形態＞
（構成の説明）
図１は、本発明の第一実施形態に係るロバスト学習装置の一例を示すブロック図である。
図１に示すようにロバスト学習装置１０は、モデル選択部１１と、限定目的関数算出装置１００と、更新部１２と、を含む。

ロバスト学習装置１０は、自然数ｎに対して、互いに依存させながら学習させるｎ個のニューラルネットワークｆ＿１、ｆ＿２、・・・、ｆ＿ｎ、ｎ個のパラメータθ＿１、θ＿２、・・・、θ＿ｎ、複数の訓練データＸ、訓練データＸに対応する正解ラベルＹ、ハイパーパラメータＣを入力として受け付け、更新済みのニューラルネットワークのパラメータθ’＿１、…、θ’＿ｎを出力する。なお、パラメータθ＿１は、ニューラルネットワークｆ＿１のパラメータであり、他のパラメータθ＿２等についても同様である。

ニューラルネットワークｆ＿１～ｆ＿ｎは、ある目的で構築される１つの学習モデルを構成する。以下で説明するように、ニューラルネットワークｆ＿１～ｆ＿ｎのそれぞれは、同じ訓練データＸを入力すると、それぞれが正解ラベルＹに近い値を出力するように学習され、その一方で、ニューラルネットワークｆ＿１～ｆ＿ｎの類似度が小さくなるように学習される。１つの学習モデルに、このようなニューラルネットワークｆ＿１～ｆ＿ｎを並列に設けておくことで、敵対的なパラメータが入力されても、全てのニューラルネットワークが騙される可能性を下げることができ、学習モデル全体としては安全になる。例えば、学習モデルは、ニューラルネットワークｆ＿１～ｆ＿ｎを統括する機能を有しており、この機能が、ニューラルネットワークｆ＿１～ｆ＿ｎの出力の相違を見て、例えば、他と大きく異なる値を出力したニューラルネットワークについては騙された可能性があるとみなして、その出力を無視したり、騙されていないと考えられるニューラルネットワークについては、例えば、それらの出力の平均値を算出して、その平均値を学習モデルの最終的な出力として採用したりする。本発明は、学習モデルが備えるニューラルネットワークｆ＿１～ｆ＿ｎを、少ない学習時間および計算量で学習させる技術に関する。

モデル選択部１１は、ニューラルネットワークｆ＿１～ｆ＿ｎの中から、複数のニューラルネットワークを選択する。モデル選択部１１は、選択したモデルのインデックスｔ＿ｊ（ｊは、１～ｎのうちモデル選択部１１が選択したニューラルネットワークのインデックス）を出力する。なお、以下では、ニューラルネットワークｆ＿１～ｆ＿ｎの個々をモデルと記載する場合がある。

限定目的関数算出装置１００は、訓練データＸ、ニューラルネットワークｆ＿１～ｆ＿ｎと各ニューラルネットワークのパラメータθ＿１～θ＿ｎ、正解ラベルＹから、モデル選択部１１が選択したニューラルネットワークに関連する処理のみに関して、目的関数を算出し出力する。

更新部１２は、ハイパーパラメータＣと限定目的関数算出装置１００で算出した目的関数から、Ｃの比率でニューラルネットワークの出力と正解ラベルＹとの差が小さくなるよう、且つモデル間の勾配ベクトルの類似度が小さくなるように、ニューラルネットワークｆ＿ｉ等のパラメータθ＿ｉ等を更新する（ｉは１～ｎの任意の自然数）。

図２は、本発明の第一実施形態に係る限定目的関数算出装置の一例を示すブロック図である。
限定目的関数算出装置１００は、予測部１０１と、予測損失算出部１０２と、
勾配ベクトル算出部１０３と、勾配損失算出部１０４と、目的関数生成部１０５とを有する。
限定目的関数算出装置１００は、ニューラルネットワークｆ＿１～ｆ＿ｎと、各ニューラルネットワークのパラメータθ＿１～θ＿ｎと、訓練データＸ、正解ラベルＹ、ハイパーパラメータＣ、モデル選択部１１で選択したニューラルネットワークのインデックスｔ＿ｊを入力として受け付ける。

予測部１０１は、訓練データＸと複数のニューラルネットワークｆ＿１～ｆ＿ｎによる予測を行う。予測部１０１は、訓練データＸをニューラルネットワークｆ＿１～ｆ＿ｎに入力して、ニューラルネットワークｆ＿１～ｆ＿ｎが出力する値を出力する。本実施形態では、ここで入力とするｆ＿１～ｆ＿ｎ、θ＿１～θ＿ｎ、Ｘ、Ｙは、任意のものでよい。

予測損失算出部１０２は、訓練データＸと正解ラベルＹが対応するように各ニューラルネットワークｆ＿１～ｆ＿ｎの出力と正解ラベルＹとの誤差に基づいて、予測損失関数を計算する。例えば、ｆ＿ｉの予測損失関数ｌ＿ｉ（）には、交差エントロピーを用いることができる。
勾配ベクトル算出部１０３は、訓練データＸと予測損失算出部１０２の出力である誤差ｌ＿１～ｌ＿ｎから、以下のようなＸに対する誤差の勾配ベクトル∇＿ｉを算出する。

式（１）に示すように勾配ベクトルは、訓練データＸの摂動に対する予測損失関数の変化を示す。
勾配損失算出部１０４は、勾配ベクトル∇＿１～∇＿ｎを入力として、各ｆ＿ｉの勾配ベクトルに対応する∇＿ｉとそれ以外のｎ－１個の勾配ベクトルについて類似度の算出を行い、その和を勾配損失関数として出力する。類似度の算出は、例えば、２つの勾配ベクトルのcosine類似度を算出することにより評価することができる。

目的関数生成部１０５は予測損失算出部１０２と勾配損失算出部１０４から受け取る予測損失関数ｌ＿ｉ（）と勾配損失関数を、ハイパーパラメータＣに従って比率を調整し、モデル選択部１１で選択したニューラルネットワークに関連する値を目的関数として出力する。ここで、ニューラルネットワークｆ＿ｉの出力と正解ラベルＹとの差を示す予測損失関数ｌ＿ｉ（）、ニューラルネットワーク間の類似度の和を示す勾配損失関数Ｄ（）を用いると、目標関数ｌｏｓｓ＿ｉは、例えば、ｌｏｓｓ＿ｉ＝ｌ＿ｉ（）＋Ｃ×Ｄ（）で表すことができる。

（動作の説明）
次にロバスト学習装置１０の動作について説明する。
図３は、本発明の第一実施形態に係るロバスト学習装置の動作例を示すフローチャートである。
まず、ロバスト学習装置１０には、ｎ個のニューラルネットワークｆ＿１～ｆ＿ｎと、パラメータθ＿１～θ＿ｎと、訓練データＸと、正解ラベルＹと、ハイパーパラメータＣが入力される。
次に、モデル選択部１１は、更新するニューラルネットワークを複数選択する（Ｓ１）。選択するニューラルネットワークの数は任意である。モデル選択部１１は、選択したニューラルネットワークのインデックスｔ＿ｊを限定目的関数算出装置１００へ出力する。

次に、限定目的関数算出装置１００は、選択されたニューラルネットワークに関連する処理を含む目的関数を算出する（Ｓ２）。
例えば、モデル選択部１１が、ニューラルネットワークｆ＿１～ｆ＿ｎのうち、ニューラルネットワークｆ＿１～ｆ＿３を選択した場合（ｔ＿ｊが、ｔ＿１～ｔ＿３の場合）、限定目的関数算出装置１００は、例えば、以下の処理を行って、ｌｏｓｓ＿１～ｌｏｓｓ＿ｎを算出する。

予測部１０１は、訓練データＸをニューラルネットワークｆ＿１～ｆ＿ｎに入力して、ｎ個のニューラルネットワークによる予測を出力する。
予測損失算出部１０２は、ニューラルネットワークｆ＿１～ｆ＿ｎに関して、例えば、予測損失関数ｌ＿１（）～ｌ＿ｎ（）を算出する。
勾配ベクトル算出部１０３は、勾配ベクトル∇＿１～∇＿ｎを算出する。
勾配損失算出部１０４は、勾配ベクトル∇＿１～∇＿ｎのうち，選択されたニューラルネットワークに対応する勾配ベクトルの２つの全ての組合せについて、類似度を算出し、その和を算出する。例えば、本例の場合、ニューラルネットワークｆ＿ｉについては、∇＿ｉと∇＿１の類似度、∇＿ｉと∇＿２の類似度、∇＿ｉと∇＿３の類似度の和を算出する。
目的関数生成部１０５は、ニューラルネットワークｆ＿１～ｆ＿ｎについての目的関数ｌｏｓｓ＿１～ｌｏｓｓ＿ｎを出力する。

次に、更新部１２は、限定目的関数算出装置１００が出力した目的関数のニューラルネットワークのパラメータにおける微分係数からパラメータを更新する（Ｓ３）。例えば、更新部１２は、ニューラルネットワークｆ＿１のパラメータθ＿１を、目的関数ｌｏｓｓ＿１における予測損失関数の値（予測値と正解ラベルＹの誤差）が小さく、且つ、勾配損失関数の値が（各ニューラルネットワーク間の類似度）が小さくなるように調整する。パラメータθ＿２～θ＿ｎについても同様である。

Ｎ個のモデルによって構成される学習モデルの構築において、学習の目的関数に、予測精度の向上の役割を担う予測損失関数と、敵対的パラメータへの堅牢性を高めるための勾配損失関数を含み、勾配損失関数が２つのモデル間の勾配ベクトルの類似度によって計算される場合に、一般的な方法では、あるモデルｉについて、モデルｉは識別の正確性が高まり、かつ、他のモデルとは勾配ベクトルが異なるように更新され、モデルｉ以外のｎ－１個のモデルはモデルｉと勾配ベクトルが異なるように更新される。その為、Ｏ（ｎ^２）のオーダーで学習時間が必要となる。これに対し、本実施形態によれば、モデル数ｎのうち、モデル選択部１１がｐ個のモデルを選択するとき、勾配ベクトルについてはｐ個分のニューラルネットワークに限定して更新するため、Ｏ（ｎ×ｐ）のオーダーに実行時間を削減することができる。

これにより、本実施形態によれば、敵対的サンプルに対して、すべてのモデルが誤識別する可能性を下げ、かつ正常なサンプルに対する各モデルの識別精度を高めることができるという特徴を持ったモデル群を、例えば、非特許文献１に記載の方法よりも少ない計算量で、高速に構築することができる。また、本実施形態により構築された学習モデルを利用することで、敵対的サンプルが入力される可能性あるＡＩシステム・学習モデルを安全に利用できるようになる。

＜第二実施形態＞
（構成の説明）
以下、本発明の第二実施形態によるロバスト学習装置を、図４を参照して説明する。
図４は、本発明の第二実施形態に係る限定目的関数算出装置の一例を示すブロック図である。
第二実施形態に係るロバスト学習装置１０は、限定目的関数算出装置１００に代えて、限定目的関数算出装置２００を有している。
限定目的関数算出装置２００は、限定予測部２０１を含み、予測部１０１を含まない。その他の構成については、第一実施形態と同様である。第一実施形態と同様の構成要素については図１、図２と同一の符号を付し、詳細な説明を省略する。
限定予測部２０１は、モデル選択部１１が選択したニューラルネットワークｆ＿ｊに対してのみ予測を行い、モデル選択部１１で選択されたニューラルネットワークのみから訓練データＸに関する予測を出力する。

（動作の説明）
第一実施形態の説明に用いた図３を参考にして、第二実施形態の処理を説明する。
まず、ロバスト学習装置１０には、第一実施形態と同様の各値が入力される。
次に、モデル選択部１１は、更新するニューラルネットワークを複数選択する（Ｓ１）。モデル選択部１１は、選択したニューラルネットワークのインデックスを限定目的関数算出装置２００へ出力する。
次に、限定目的関数算出装置１００は、選択されたニューラルネットワークに関連する処理を含む目的関数を算出する（Ｓ２）。

例えば、モデル選択部１１が、ニューラルネットワークｆ＿１～ｆ＿ｎのうち、ニューラルネットワークｆ＿１～ｆ＿３を選択した場合、限定目的関数算出装置２００は以下の処理を行う。

限定予測部２０１は、訓練データＸをニューラルネットワークｆ＿１～ｆ＿３に入力して、３個のニューラルネットワークによる予測を出力する。
予測損失算出部１０２は、例えば、予測損失関数ｌ＿１（）～ｌ＿３（）を算出する。
勾配ベクトル算出部１０３は、勾配ベクトル∇＿１～∇＿３を算出する。
勾配損失算出部１０４は、勾配ベクトル∇＿１と∇＿２、∇＿１と∇＿３、∇＿２と∇＿３の類似度を算出し、その和を算出する。
目的関数生成部１０５は、目的関数ｌｏｓｓ＿１～ｌｏｓｓ＿３を出力する。

次に、更新部１２は、ニューラルネットワークのパラメータを更新する（Ｓ３）。例えば、更新部１２は、ニューラルネットワークｆ＿１～ｆ＿３のパラメータθ＿１～θ＿３を、予測損失関数の値が小さく、且つ、勾配損失関数の値が小さくなるように調整する。

本実施形態によれば、モデル数ｎのうち、モデル選択部１１がｐ個のモデルを選択するとき、あるモデルｉの更新で勾配損失関数に関してモデルｐ個分のパラメータを更新し、ｐ個分のニューラルネットワークについて予測損失関数に関してパラメータの算出を行うため、Ｏ（ｐ×ｐ）のオーダーに実行時間を削減することができる。

＜第三実施形態＞
以下、本発明の第三実施形態によるロバスト学習装置を、図５を参照して説明する。
図５は、本発明の第三実施形態に係るロバスト学習装置の一例を示すブロック図である。
第三実施形態に係るロバスト学習装置１０は、第一実施形態の構成と比較すると、モデル選択部１１に代えてモデル選択部１１´を有し、限定目的関数算出装置１００に代えて限定目的関数算出装置２００を有している。
モデル選択部１１´は、限定予測部２０１と、勾配損失算出部１０４に対して異なる数のニューラルネットワークを選択する。その他の構成については、第二実施形態と同様である。第一実施形態、第二実施形態と同様の構成要素については図１、図２と同一の符号を付し、詳細な説明を省略する。

第三実施形態は、第二実施形態において限定予測部２０１へ出力するために選択したニューラルネットワークの個数をｐ個、勾配損失算出部１０４へ出力するために選択したニューラルネットワークの個数をｋ個とする実施形態である。例えば、モデル選択部１１´は、ニューラルネットワークｆ＿１～ｆ＿５を選択して限定予測部２０１へ出力し、ニューラルネットワークｆ＿１～ｆ＿３を選択して勾配損失算出部１０４へ出力する。なお、勾配ベクトルの算出には予測損失関数が必要であることから、勾配損失算出部１０４へ出力するために選択するニューラルネットワークは、限定予測部２０１へ出力するために選択するニューラルネットワークの一部となる。この例の場合、限定目的関数算出装置２００は、図３のＳ２にて以下の処理を行う。

限定予測部２０１は、訓練データＸをニューラルネットワークｆ＿１～ｆ＿５に入力して、５個のニューラルネットワークによる予測を出力する。
予測損失算出部１０２は、予測損失関数ｌ＿１（）～ｌ＿５（）を算出する。
勾配ベクトル算出部１０３は、勾配ベクトル∇＿１～∇＿５を算出する。
勾配損失算出部１０４は、勾配ベクトル∇＿ｊ（ｊ＝１～５）と∇＿１～∇＿３の類似度を算出し、その和を算出する。例えば、ｊ＝１の場合、勾配損失算出部１０４は、∇＿１と∇＿２の類似度と、∇＿１と∇＿３の類似度の和を算出する。例えば、ｊ＝５の場合、勾配損失算出部１０４は、∇＿５と∇＿１の類似度と、∇＿５と∇＿２の類似度と、∇＿５と∇＿３の類似度の和を算出する。
目的関数生成部１０５は、目的関数ｌｏｓｓ＿１～ｌｏｓｓ＿５を出力する。

また、限定予測部２０１に対して選択するニューラルネットワークの個数をｐ個、勾配損失算出部１０４に対して選択するニューラルネットワークの個数をｋ個とすると、モデル選択部１１´は、勾配損失算出部１０４に対して選択するニューラルネットワークの個数を、ｋ＝ｎ／ｐとしてもよい。このとき、実行時間のオーダーはＯ（ｎ）となる。

本実施形態によれば、さらにパラメータ更新の時間を短縮することができる。

図６は、本発明の一実施形態に係るロバスト学習装置の最小構成を示す図である。
学習装置３０は、少なくともモデル選択部３１と、限定目的関数算出部３２と、更新部３３とを備える。
学習装置３０は、複数のニューラルネットワークのパラメータ、訓練データ、正解ラベルを入力する。モデル選択部３１は、複数のニューラルネットワークの中から２以上のニューラルネットワークを選択する。限定目的関数算出部３２は、パラメータの学習に用いる目的関数の算出過程において、モデル選択部３１が選択したニューラルネットワークに関連する処理のみを含む限定目的関数を算出する。訓練データに対するニューラルネットワークの出力が正解ラベルと近くなり、且つ、ニューラルネットワーク間の勾配ベクトルの類似度が小さくなると、限定目的関数の値は小さくなる。更新部３３は、限定目的関数の値が小さくなるようにパラメータの更新を行う。
非特許文献１において、実行時間において支配的であるのは、モデルｎ個分のパラメータをｎ回更新する点である。これに対し、本実施形態によれば、一部のモデルに限定してパラメータを更新することで、学習するモデル同士が異なる特徴を持つという性質を保ち、且つ学習における計算量を節約することができる。

図７は、本発明の一実施形態におけるロバスト学習装置のハードウェア構成の一例を示す図である。
上述した実施形態において、ロバスト学習装置１０が有する各構成要素は、機能単位のブロックを示している。ロバスト学習装置１０が有する各構成要素の一部又は全部は、例えば図７で示すような情報処理装置４００とプログラムの任意の組み合わせにより実現することができる。情報処理装置４００は、一例として、以下のような構成を含むことができる。つまり、情報処理装置４００は、ＣＰＵ（Central Processing Unit）４０１、ＲＯＭ（Read Only Memory）４０２、ＲＡＭ（Random Access Memory）４０３、ＲＡＭ４０３にロードされるプログラム群４０４、プログラム群４０４を格納する記憶装置４０５、情報処理装置４００外部の記録媒体４１０の読み書きを行うドライブ装置４０６、情報処理装置４００外部のネットワーク４１１と接続する通信インタフェース４０７、データの入出力を行う入出力インタフェース４０８、各構成要素を接続するパス４０９、を含む。

上述した実施形態におけるロバスト学習装置１０が有する各構成要素は、これらの機能を実現するプログラム群４０４をＣＰＵ４０１が取得して、ＲＡＭ４０３に展開し、実行することで実現することができる。ロバスト学習装置１０が有する各構成要素の機能を実現するプログラム群４０４は、例えば、予め記憶装置４０５やＲＯＭ４０２に格納されており、必要に応じてＣＰＵ４０１がＲＡＭ４０３にロードして実行する。なお、プログラム群４０４はネットワーク４１１を介してＣＰＵ４０１に供給されてもよいし、予め、記録媒体４１０に格納されており、ドライブ装置４０６が該プログラムを読みだしてＣＰＵ４０１に供給してもよい。また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を記憶装置４０５やＲＯＭ４０２に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であっても良い。
なお、図７は情報処理装置４００の構成の一例を示しており、情報処理装置４００の構成は上述した場合に例示されない。例えば、情報処理装置４００は、ドライブ装置４０６を有さないなど、上述した構成の一部から構成されても構わない。

その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。

上記した学習装置、学習方法、プログラム、及び記憶装置によれば、敵対的サンプルが入力されても、想定外の動作を回避できるような学習モデルであって、その学習モデルが、並列に依存させて学習するモデルを複数含む場合に、並列に依存させて学習するモデルの数が増加しても、効率的に少ない学習時間で学習モデルを構築することができる。

１０・・・ロバスト学習装置
１１・・・モデル選択部
１２・・・更新部
１００、２００、３００・・・限定目的関数算出装置
１０１・・・予測部
１０２・・・予測損失算出部
１０３・・・勾配ベクトル算出部
１０４・・・勾配損失算出部
１０５・・・目的関数生成部
２０１・・・限定予測部
３０１・・・限定勾配損失算出部
４００・・・情報処理装置
４０１・・・CPU（Central Processing Unit）
４０２・・・ROM（Read Only Memory）
４０３・・・RAM（Random Access Memory）
４０４・・・プログラム群
４０５・・・記憶装置
４０６・・・ドライブ装置
４０７・・・通信インタフェース
４０８・・・入出力インタフェース
４０９・・・パス
４１０・・・外部の記録媒体
４１１・・・ネットワーク

Claims

ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するロバスト学習装置であって、
ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択するモデル選択部と、
前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記モデル選択部が選択した前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する限定目的関数算出部と、
前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う更新部と、
を備えるロバスト学習装置。
前記限定目的関数算出部が、ｎ個の前記ニューラルネットワークのそれぞれと、前記モデル選択部よって選択された前記ニューラルネットワークとの間の類似度のみを算出して、ｎ個の前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、算出した前記類似度が小さくなるほどその値が小さくなる処理を含む前記限定目的関数を算出する、
請求項１に記載の学習装置。
前記限定目的関数算出部が、ｎ個の前記ニューラルネットワークのうち、前記モデル選択部よって選択された前記ニューラルネットワークのみを対象として、選択された前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、選択された前記ニューラルネットワークの少なくとも一部の間での類似度が小さくなるほどその値が小さくなる処理を含む前記限定目的関数を算出する、
請求項１に記載のロバスト学習装置。
ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するロバスト学習方法であって、
ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択し、
前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出し
前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う、
ロバスト学習方法。
ｎ個のニューラルネットワークのパラメータと、訓練データと、正解ラベルを入力として、更新された前記パラメータを出力するコンピュータに、
ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択する処理、
前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する処理、
前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う処理、
を行わせるプログラム。
ｎ個のニューラルネットワークのパラメータ、訓練データ、正解ラベルを入力として、更新された前記パラメータを出力するコンピュータに、
ｎ個の前記ニューラルネットワークの中からｎ未満、且つ、２以上の前記ニューラルネットワークを選択する処理、
前記訓練データに対する前記ニューラルネットワークの出力が前記正解ラベルと近くなり、且つ、前記ニューラルネットワーク間の類似度が小さくなるほどその値が小さくなる処理を含む目的関数の算出過程において、前記選択された前記ニューラルネットワークに関連する前記処理のみを含む限定目的関数を算出する処理、
前記限定目的関数の値が小さくなるように、前記パラメータの更新を行う処理、
を行わせるプログラムを記憶する記憶装置。