JP7484054B2

JP7484054B2 - 学習装置、特徴量計算プログラム生成方法、類似度計算機、類似度計算方法、学習プログラム、及び類似度計算プログラム

Info

Publication number: JP7484054B2
Application number: JP2022534494A
Authority: JP
Inventors: 拓磨天田; 和也柿崎
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-07-06
Filing date: 2020-07-06
Publication date: 2024-05-16
Anticipated expiration: 2040-07-06
Also published as: JPWO2022009258A1; US20230259818A1; WO2022009258A1

Description

本開示は、学習装置、特徴量計算プログラム生成方法、類似度計算機、類似度計算方法、学習プログラム、及び類似度計算プログラムに関する。

機械学習において、入力データに所定のノイズを加えることで誤判定を誘発させる敵対的サンプル（Adversarial Examples）という攻撃手法が知られている。非特許文献１には、複数のモデルの出力から最終的な出力を決定することで、敵対的サンプルの影響を抑える技術が開示されている。

非特許文献２には、入力データに対して抽出された特徴量と各クラスを代表する代表ベクトル群とのコサイン類似度を求め、入力データに対応するクラスの代表ベクトルとの類似度が、他クラスの代表ベクトルとの類似度よりも大きくなるようにモデルを学習する技術が開示されている。

Tianyu Pang、Kun Xu、Chao Du、Ning Chen、Jun Zhu: "Improving Adversarial Robustness via Promoting Ensemble Diversity"in arXiv:1901.08846 Jiankang Deng、Jia Guo、Niannan Xue、Stefanos Zafeiriou:" ArcFace: Additive Angular Margin Loss for Deep Face Recognition"in arXiv: 1801.07698

非特許文献１に記載の手法は、計算結果である特徴量ベクトルがモデル間で多様的になるように正則化することで、敵対的サンプルに対するロバスト性を高めるものである。ところで、非特許文献１に記載の手法のように、複数のモデルを用いて１つの特徴量ベクトルを求める場合、複数のモデルによって計算された複数の特徴量計算モデルの平均値を算出する。しかしながら非特許文献１に記載の手法では、特徴量ベクトルの平均値が近い値になり、計算精度が低下しうる。つまり、非特許文献１に記載の手法では、入力されるデータの特徴である特徴量がデータの種別ごとに近い値となることを妨げない。

本開示の目的は、上述した課題を解決するため、敵対的サンプルに対するロバスト性を高めつつ、特徴量ベクトルがデータの特徴を適切に表すような学習装置、特徴量計算プログラム生成方法、類似度計算機、類似度計算方法、学習プログラム、及び類似度計算プログラムをすることにある。

本発明の第１の態様によれば、学習装置は、複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出する演算手段と、複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、少なくとも前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出する類似度算出手段と、前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習する学習手段と、を備える。

本発明の第２の態様によれば、特徴量計算プログラム生成方法は、複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出し、複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出し、前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習し、学習済みの前記複数の特徴量計算モデルと、前記複数の特徴量計算モデルが出力する複数の特徴量ベクトルの平均値を算出するための出力関数とを組み合わせることで、特徴量計算プログラムを生成するを出力する。

本発明の第３の態様によれば、類似度計算機は、上記態様に係る特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出する特徴量算出手段と、前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段とを備える。

本発明の第４の態様によれば、類似度計算方法は、上記態様に係る特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出し、前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する。

本発明の第５の態様によれば、記録媒体に格納された学習プログラムは、コンピュータを、複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出する演算手段、複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出する類似度算出手段、前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習する学習手段、として機能させる。

本発明の第６の態様によれば、記録媒体に格納された類似度計算プログラムは、コンピュータを、上記態様に係る特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出する特徴量算出手段、前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段として機能させる。

上記態様のうち少なくとも１つの態様によれば、敵対的サンプルに対するロバスト性を高めつつ、特徴量ベクトルがデータの特徴を適切に表すことができる。

第１の実施形態に係る認証システム１の構成を示す概略ブロック図である。第１の実施形態に係る学習方法を示すフローチャートである。第１の実施形態に係る認証装置３０による認証方法を示すフローチャートである。学習装置の基本構成を示す概略ブロック図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

〈第１の実施形態〉
《認証システムの構成》
以下、図面を参照しながら実施形態について詳しく説明する。
図１は、第１の実施形態に係る認証システム１の構成を示す概略ブロック図である。
認証システム１は、学習装置１０と認証装置３０とを備える。
学習装置１０は、生体データが入力されると当該生体データの特徴量を出力するように、特徴量抽出モデルのパラメータを学習させる。生体データの例としては、顔画像、静脈画像、指紋データ、音声データなどが挙げられる。特徴量抽出モデルは、ニューラルネットワークなどの機械学習モデルによって表される。
認証装置３０は、学習装置１０によって学習されたパラメータを有する特徴量抽出モデル（学習済みモデル）を用いて、生体データに基づくユーザの認証を行う。
なお、第１の実施形態に係る認証システム１は、学習装置１０と認証装置３０とを別個の装置として備えるが、これに限られない。例えば、他の実施形態に係る認証システム１は、認証装置３０が学習装置１０の機能を有していてもよい。

《学習装置１０の構成》
学習装置１０は、特徴量抽出モデル記憶部１１、データセット取得部１２、代表ベクトル記憶部１３、演算部１４、類似度算出部１５、予測損失算出部１６、多様性評価部１７、評価関数算出部１８、学習部１９、出力部２０を備える。

特徴量抽出モデル記憶部１１は、ニューラルネットワークによって構成されたＮ個の特徴量抽出モデルを記憶する。各特徴量抽出モデルは、生体データを入力し、当該生体データの特徴量を示すＱ次元の特徴量ベクトルを出力する。生体データは多次元データの一例である。特徴量抽出モデルは、２層以上のニューラルネットワークによって構成される。特徴量抽出モデルは、入力されたベクトルを、低次元の特徴量ベクトルに変換する。

データセット取得部１２は、入力サンプルである生体データと、出力サンプルである人物ラベルとを関連付けた学習用データセットを取得する。人物ラベルは、データセットにおける人物の数をＰとした場合に、Ｐ次元のワンホットベクトルによって表される。

代表ベクトル記憶部１３は、学習用データセットに含まれる人物ごとに、当該人物の特徴量を代表するベクトルであるＱ次元の代表ベクトルを記憶する。つまり、代表ベクトルの次元数は、特徴量ベクトルの次元数と同じである。代表ベクトルは、認証装置３０の設計者が任意に設定してよい。ただし、異なる人物に係る代表ベクトル同士の距離は、十分に遠いことが好ましい。また、設計者は代表ベクトルの初期値のみを設定し、特徴量抽出モデルの学習に伴って学習部１９によって代表ベクトルが更新されるものであってもよい。

演算部１４は、特徴量抽出モデル記憶部１１が記憶するＮ個の特徴量計算モデルを用いて、データセット取得部１２が取得した入力サンプルから、Ｎ個の特徴量ベクトルを算出する。また、演算部は、Ｎ個の特徴量ベクトルの平均である平均特徴量ベクトルを算出する。

類似度算出部１５は、代表ベクトル記憶部１３が記憶する各代表ベクトルについて、演算部１４が算出した平均特徴量ベクトルとの類似度を算出する。類似度の例としては、コサイン類似度が挙げられる。類似度算出部１５は、各代表ベクトルと平均特徴量ベクトルとの類似度を要素とするＰ次元の類似度ベクトルを生成する。すなわち、類似度算出部１５は、以下の式（１）により類似度ｃｏｓ_ｉ，ｊを算出する。

式（１）において、ｆ_ｉ（）は、ｉ番目の特徴量計算モデルを示し、Ｘは、入力サンプルを示し、θ_ｉは、ｉ番目の特徴量計算モデルのパラメータを示し、Ｗ_ｊは、ｊ番目の代表ベクトルを示す。

予測損失算出部１６は、類似度算出部１５が算出した類似度ベクトルと出力サンプルとの交差エントロピーの平均値を得る損失関数を計算することで、スカラーである予測損失を得る。なお、予測損失算出部１６は、類似度ベクトルのうち出力サンプルに係る要素に特徴ベクトルと代表ベクトルのなす角度にマージンｍを取り、類似度ベクトル全体に係数ｓを乗算して交差エントロピーを算出してもよい。マージンｍおよび係数ｓはハイパーパラメータである。

多様性評価部１７は、演算部１４が算出したＮ個の特徴量ベクトルｖ_１－ｖ_Ｎに基づいて、複数の特徴量計算モデル間の多様性を示す多様性評価値ＥＤを算出する。多様性評価値ＥＤは、例えば式（２）によって表される。

つまり、第１の実施形態に係る多様性評価値は、Ｎ個の特徴量ベクトルｖ_１－ｖ_Ｎを並べたＮ×Ｑの特徴量行列を生成し、当該特徴量行列とその転置行列の積の行列式を計算することで、スカラーである多様性評価値ＥＤを得る。

評価関数算出部１８は、予測損失算出部１６が算出した予測損失ＥＣＥと、多様性評価部１７が算出した多様性評価値ＥＤとに基づく評価関数を算出する。評価関数Lossは、例えば、式（３）によって表される。式（３）におけるαはハイパーパラメータである。

学習部１９は、評価関数算出部１８が算出した評価関数が小さくなるように特徴量抽出モデル記憶部１１が記憶する複数の特徴量計算モデルのパラメータを学習する。

出力部２０は、特徴量抽出モデル記憶部１１が記憶する学習済みの複数の特徴量計算モデルを認証装置３０に出力する。

《学習方法》
図２は、第１の実施形態に係る学習方法を示すフローチャートである。
学習処理を開始すると、学習装置１０のデータセット取得部１２は、図示しないデータベースから予め用意されたデータセットを取得する（ステップＳ１）。学習装置１０は、取得したデータセットに含まれる入力サンプルと出力サンプルのペアを１つずつ選択し（ステップＳ２）、すべてのペアについて以下のステップＳ３からステップＳ１０の処理を実行する。

演算部１４は、ステップＳ２で選択したペアに係る入力サンプルを、特徴量抽出モデル記憶部１１が記憶するＮ個の特徴量抽出モデルに入力することで、Ｎ個の特徴量ベクトルを算出する（ステップＳ３）。演算部１４は、Ｎ個の特徴量ベクトルの各要素の平均値からなる平均ベクトルを算出する（ステップＳ４）。

類似度算出部１５は、ステップＳ４で算出した平均ベクトルと、代表ベクトル記憶部１３が記憶するＰ人の人物それぞれに対応するＰ個の代表ベクトルとの類似度を算出する（ステップＳ５）。類似度算出部１５は、算出した類似度を要素に持つＰ次元の類似度ベクトルを生成する（ステップＳ６）。当該類似度ベクトルは、理想的には入力サンプルが示す人物に対応する要素が１に近い値を取り、他の要素が０に近い値を取る。
予測損失算出部１６は、ステップＳ６で算出した類似度ベクトルと、ステップＳ２で選択したペアに係る出力サンプルのワンホットベクトルとの誤差とに基づいて、予測損失を算出する（ステップＳ７）。
多様性評価部１７は、ステップＳ３で算出したＮ個の特徴量ベクトルに基づいて、複数の特徴量計算モデル間の多様性を示す多様性評価値を算出する（ステップＳ８）。

評価関数算出部１８は、ステップＳ７で算出した予測損失とステップＳ８で算出した多様性評価値とに基づいて評価関数を計算する（ステップＳ９）。学習部１９は、ステップＳ９で計算した評価関数に基づいて、特徴量抽出モデル記憶部１１が記憶するＮ個の特徴量抽出モデルのパラメータを更新する（ステップＳ１０）。学習部１９は、例えば勾配降下法により各パラメータを更新する。

学習装置１０がデータセットに含まれる入力サンプルと出力サンプルのすべてのペアについて、上記のステップＳ３からステップＳ１０の処理を実行すると、学習部１９は、学習の終了条件が満たされたか否かを判定する（ステップＳ１１）。終了条件は、例えば繰り返し回数が設定されたエポック数を超えることや、評価関数の変化量が閾値未満になることなどが挙げられる。

終了条件が満たされていない場合（ステップＳ１１：ＮＯ）、学習装置１０はステップＳ２に処理を戻し、学習処理を繰り返す。他方、終了条件が満たされた場合（ステップＳ１１：ＹＥＳ）、出力部２０は、特徴量抽出モデル記憶部１１が記憶するＮ個の特徴量抽出モデルを認証装置３０に出力する（ステップＳ１２）。出力部２０は、例えば通信によって特徴量抽出モデルを出力してもよいし、リムーバブルメディアを介して特徴量抽出モデルを出力してもよい。

《認証装置３０の構成》
認証装置３０は、ユーザデータ記憶部３１、モデル取得部３２、抽出モデル記憶部３３、生体データ取得部３４、特徴量抽出部３５、平均化部３６、類似度算出部３７、認証部３８、及び検知部３９を備える。

ユーザデータ記憶部３１は、ユーザのアカウントデータと、当該ユーザの生体データとを関連付けて記憶する。
モデル取得部３２は、学習装置１０からＮ個の学習済みの特徴量抽出モデルを取得する。
抽出モデル記憶部３３は、モデル取得部３２が取得したＮ個の学習済みの特徴量抽出モデルを記憶する。
生体データ取得部３４は、認証装置３０に設けられたセンサ等から認証対象となる生体データを取得する。
特徴量抽出部３５は、抽出モデル記憶部３３が記憶するＮ個の特徴量抽出モデルを用いてユーザデータ記憶部３１が記憶する生体データ及び生体データ取得部３４が取得した生体データからＮ個の特徴量ベクトルを抽出する。
平均化部３６は、特徴量抽出部３５が抽出したＮ個の特徴量ベクトルの平均である平均特徴量ベクトルを算出する。平均化部３６は、Ｎ個の特徴量ベクトルの平均値を算出するための出力関数の一例である。
類似度算出部３７は、２つの平均特徴ベクトルどうしの類似度を算出する。類似度の尺度の例としては、Ｌ２距離、コサイン類似度、ＰＬＤＡ（Probabilistic Linear Discriminant Analysis）などが挙げられる。
認証部３８は、類似度算出部３７が算出した類似度に基づいて、ユーザデータ記憶部３１に記憶されたユーザであるか否かの認証を行う。認証部３８は、ユーザデータ記憶部３１に記憶されたユーザであると判定した場合、当該ユーザのアカウントデータを返す。
検知部３９は、類似度算出部３７が算出した類似度に基づいて、生体データ取得部３４が取得した生体データ又はユーザデータ記憶部３１に記憶された生体データが敵対的サンプルであるか否かの判定を行う。

なお、認証装置３０を実現するためのプログラムにおいて抽出モデル記憶部３３、特徴量抽出部３５及び平均化部３６を構成する部分は、特徴量計算プログラムであるといえる。

《認証方法》
図３は、第１の実施形態に係る認証装置３０による認証方法を示すフローチャートである。なお、認証方法の実行に先立ってモデル取得部３２は、学習装置１０から学習済みの特徴量抽出モデルを取得し、抽出モデル記憶部３３に記録しているものとする。つまり、モデル取得部３２は、学習済みのＮ個の特徴量計算モデルとＮ個の特徴量計算モデルが出力するＮ個の特徴量ベクトルの平均値を算出するための出力関数とを組み合わせることで特徴量計算プログラムを生成する。

認証装置３０の生体データ取得部３４は、認証装置３０に接続されたセンサ等から生体データを取得する（ステップＳ２１）。特徴量抽出部３５は、ステップＳ２１で取得した生体データを、抽出モデル記憶部３３が記憶する特徴量抽出モデルに入力することで、Ｎ個の特徴量ベクトルを算出する（ステップＳ２２）。平均化部３６は、Ｎ個の特徴量ベクトルから１つの平均特徴量ベクトルを生成する（ステップＳ２３）。次に、認証装置３０は、ユーザデータ記憶部３１が記憶するユーザを１つずつ選択し（ステップＳ２４）、以下に示すステップＳ２５からステップＳ２７を実行する。

まず、特徴量抽出部３５は、ステップＳ２４で選択されたユーザに関連付けられた生体データを、抽出モデル記憶部３３が記憶するＮ個の特徴量抽出モデルに入力することで、Ｎ個の特徴量ベクトルを算出する（ステップＳ２５）。平均化部３６は、Ｎ個の特徴量ベクトルから１つの平均特徴量ベクトルを生成する（ステップＳ２６）。次に、類似度算出部３７は、ステップＳ２３で算出した平均特徴量ベクトルと、ステップＳ２６で算出した平均特徴量ベクトルとの類似度を算出する（ステップＳ２７）。

認証部３８は、ユーザデータ記憶部３１が記憶する各ユーザについて、取得された生体データとの類似度を算出すると、算出された類似度のうち、所定の認証閾値を超えるものがあるか否かを判定する（ステップＳ２８）。すべての類似度が認証閾値以下である場合（ステップＳ２８：ＮＯ）、認証部３８は、ステップＳ２１で取得した生体データによる認証に失敗したと判定し（ステップＳ２９）、処理を終了する。

他方、少なくとも１つの類似度が認証閾値を超える場合（ステップＳ２８：ＹＥＳ）、検知部３９は、ステップＳ２２で算出したＮ個の特徴量ベクトルと、ステップＳ２５で算出したＮ個の特徴量ベクトルとに基づいて、Ｎ個の特徴量抽出モデルに対応するＬ２ノルム距離である個別距離を算出する（ステップＳ３０）。また、検知部３９は、ステップＳ２３で算出した平均特徴量ベクトルと、ステップＳ２６で算出した平均特徴量ベクトルとのＬ２ノルム距離である平均距離を算出する（ステップＳ３１）。検知部３９は、Ｎ個の個別距離それぞれと平均距離の差の総和を算出する（ステップＳ３２）。検知部３９は、ステップＳ３２で算出した距離の差の総和が所定の閾値未満であるか否かを判定する（ステップＳ３３）。

距離の差の総和が所定の閾値未満である場合（ステップＳ３３：ＹＥＳ）、認証部３８は、ステップＳ２８における最も高い類似度に係るユーザを特定し（ステップＳ３４）、当該ユーザのアカウントデータを出力する（ステップＳ３５）。
他方、距離の差の総和が所定の閾値以上である場合（ステップＳ３３：ＮＯ）、検知部３９は、ステップＳ２１で取得した生体データ又はステップＳ２８における最も高い類似度に係る生体データが敵対的サンプルであると判定する（ステップＳ３６）。

《作用・効果》
このように、第１の実施形態によれば、学習装置１０は、特徴量ベクトルと次元数を等しくする複数の代表ベクトルと複数の特徴量ベクトルの平均値との類似度を算出し、当該類似度を用いた評価関数に基づいて、複数の特徴量計算モデルのパラメータを学習する。代表ベクトルと平均特徴量ベクトルの類似度が高くなるように複数の特徴量計算モデルのパラメータを学習することで、異なるクラスに属する平均特徴量ベクトルが一定の距離を持つようになり、計算精度を向上させることができる。

なお、第１の実施形態に係る学習装置１０は、複数の代表ベクトルそれぞれと複数の特徴量ベクトルの平均値との類似度を算出し、当該類似度を要素に持つ類似度ベクトルと、入力サンプルが属するクラスを示すワンホットベクトルとの誤差が大きいほど値が大きくなる評価関数に基づいて複数の特徴量計算モデルのパラメータを学習するが、これに限られない。例えば、他の実施形態に係る学習装置１０は、入力サンプルが属するクラスに対応する代表ベクトルと平均特徴量ベクトルとの類似度を、評価関数の項に含んでもよい。

また、第１の実施形態に係る学習装置１０は、複数の特徴量ベクトルの多様性の高さに係る多様性指標値が小さいほど値が大きくなる評価関数を用いて複数の特徴量計算モデルのパラメータを学習する。これにより、複数の特徴量計算モデルが算出する特徴量ベクトルどうしの距離が遠くなり、敵対的サンプルに対するロバスト性を向上させることができる。

なお、他の実施形態に係る学習装置１０は、多様性指標値に代えて、各特徴量計算モデルの特徴量ベクトルの距離の総和に基づく評価関数を用いて複数の特徴量計算モデルのパラメータを学習してもよい。

〈その他の実施形態〉
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。すなわち、他の実施形態においては、上述の処理の順序が適宜変更されてもよい。また、一部の処理が並列に実行されてもよい。
上述した実施形態に係る学習装置１０は、単独のコンピュータによって構成されるものであってもよいし、学習装置１０の構成を複数のコンピュータに分けて配置し、複数のコンピュータが互いに協働することで学習装置１０として機能するものであってもよい。また、学習装置１０と認証装置３０とが同一のコンピュータによって実現されるものであってもよい。

また、上述した実施形態に係る学習装置１０は、平均特徴量ベクトルを求めた後、当該平均特徴量ベクトルと代表ベクトルとの類似度を算出することで、平均類似度を求めるが、他の実施形態においては、これに限られない。例えば、他の実施形態においては、学習装置１０は、個々の特徴量ベクトルと代表ベクトルとの類似度を求め、その平均を算出することで、平均類似度を求めてもよい。

〈基本構成〉
図４は、学習装置の基本構成を示す概略ブロック図である。
上述した実施形態では、学習装置の一実施形態として図１に示す構成について説明したが、学習装置の基本構成は、図４に示すとおりである。
すなわち、学習装置５０は、演算手段５１、類似度算出手段５２、及び学習手段５３を基本構成とする。

演算手段５１は、複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出する。
類似度算出手段５２は、複数のクラスに対応し、特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、入力サンプルが属するクラスに対応する代表ベクトルと、複数の特徴量ベクトルの平均値との類似度を算出する。
学習手段は、入力サンプルが属するクラスに対応する代表ベクトルと複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、複数の特徴量計算モデルのパラメータを学習する。
これにより、学習装置５０は、複数の特徴量ベクトルにより、敵対的サンプルに対するロバスト性を高めつつ、特徴量ベクトルがデータの特徴を適切に表すことができる。

〈コンピュータ構成〉
図５は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
コンピュータ９０は、プロセッサ９１、メインメモリ９２、ストレージ９３、インタフェース９４を備える。
上述の学習装置１０及び認証装置３０は、コンピュータ９０に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ９３に記憶されている。プロセッサ９１は、プログラム（学習プログラムまたは類似度計算プログラム）をストレージ９３から読み出してメインメモリ９２に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ９１は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ９２に確保する。プロセッサ９１の例としては、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、マイクロプロセッサなどが挙げられる。

プログラムは、コンピュータ９０に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージに既に記憶されている他のプログラムとの組み合わせ、又は他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ９０は、上記構成に加えて、又は上記構成に代えてＰＬＤ（Programmable Logic Device）などのカスタムＬＳＩ（Large Scale Integrated Circuit）を備えてもよい。ＰＬＤの例としては、ＰＡＬ(Programmable Array Logic)、ＧＡＬ(Generic Array Logic)、ＣＰＬＤ(Complex Programmable Logic Device)、ＦＰＧＡ（Field Programmable Gate Array）が挙げられる。この場合、プロセッサ９１によって実現される機能の一部又は全部が当該集積回路によって実現されてよい。このような集積回路も、プロセッサの一例に含まれる。

ストレージ９３の例としては、磁気ディスク、光磁気ディスク、光ディスク、半導体メモリ等が挙げられる。ストレージ９３は、コンピュータ９０のバスに直接接続された内部メディアであってもよいし、インタフェース９４又は通信回線を介してコンピュータ９０に接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ９０に配信される場合、配信を受けたコンピュータ９０が当該プログラムをメインメモリ９２に展開し、上記処理を実行してもよい。少なくとも１つの実施形態において、ストレージ９３は、一時的でない有形の記憶媒体である。

また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ９３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であってもよい。

１認証システム
１０学習装置
１１特徴量抽出モデル記憶部
１２データセット取得部
１３代表ベクトル記憶部
１４演算部
１５類似度算出部
１６予測損失算出部
１７多様性評価部
１８評価関数算出部
１９学習部
２０出力部
３０認証装置
３１ユーザデータ記憶部
３２モデル取得部
３３抽出モデル記憶部
３４生体データ取得部
３５特徴量抽出部
３６平均化部
３７類似度算出部
３８認証部
３９検知部

Claims

複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出する演算手段と、
複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出する類似度算出手段と、
前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習する学習手段と、
を備える学習装置。
前記類似度算出手段は、前記複数の代表ベクトルそれぞれと前記複数の特徴量ベクトルとの平均類似度を算出し、
前記評価関数は、クラスごとの前記平均類似度を要素に持つ類似度ベクトルと、前記入力サンプルが属するクラスを示すワンホットベクトルとの誤差が大きいほど値が大きくなる
請求項１に記載の学習装置。
前記複数の特徴量ベクトルの多様性の高さに係る多様性指標値を算出する多様性評価手段を備え、
前記評価関数は、前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなり、かつ前記多様性指標値が小さいほど値が大きくなる
請求項１又は請求項２に記載の学習装置。
前記多様性指標値は、複数の特徴量ベクトルを並べた行列と、当該行列の転置行列の積の行列式を、前記多様性指標値を算出する
請求項３に記載の学習装置。
複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出し、
複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出し、
前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習し、
学習済みの前記複数の特徴量計算モデルと、前記複数の特徴量計算モデルが出力する複数の特徴量ベクトルの平均値を算出するための出力関数とを組み合わせることで、特徴量計算プログラムを生成する
を出力する
特徴量計算プログラム生成方法。
前記複数の特徴量ベクトルの多様性の高さに係る多様性指標値を算出し、
前記評価関数は、前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなり、かつ前記多様性指標値が小さいほど値が大きくなる
請求項５に記載の特徴量計算プログラム生成方法。
請求項５又は請求項６に記載の特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出する特徴量算出手段と、
前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段と
を備える類似度計算機。
請求項５又は請求項６に記載の特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出し、
前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する
類似度計算方法。
コンピュータを、
複数の特徴量計算モデルを用いて、多次元データである入力サンプルから、入力サンプルの特徴量を示す複数の特徴量ベクトルを算出する演算手段、
複数のクラスに対応し、前記特徴量ベクトルと次元数を等しくする複数の代表ベクトルのうち、前記入力サンプルが属するクラスに対応する代表ベクトルと、前記複数の特徴量ベクトルの平均値との類似度を算出する類似度算出手段、
前記入力サンプルが属するクラスに対応する代表ベクトルと前記複数の特徴量ベクトルの平均値との類似度が小さいほど値が大きくなる評価関数に基づいて、前記複数の特徴量計算モデルのパラメータを学習する学習手段、
として機能させるための学習プログラム。
コンピュータを、
請求項５又は請求項６に記載の特徴量計算プログラム生成方法によって生成された特徴量計算プログラムを用いて、第１データに係る複数の特徴量と第２データに係る複数の特徴量とを算出する特徴量算出手段、
前記第１データに係る複数の特徴量の平均値と前記第２データに係る複数の特徴量の平均値とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段
として機能させるための類似度計算プログラム。