WO2021192249A1

WO2021192249A1 - 類似度計算機、認証システム、類似度計算方法、類似度計算プログラムおよび類似度計算プログラムの生成方法

Info

Publication number: WO2021192249A1
Application number: PCT/JP2020/014122
Authority: WO
Inventors: 康佑秋元; センペイリュウ; 諒水島; 功益李
Original assignee: 日本電気株式会社
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2021-09-30
Also published as: JPWO2021192249A1; US20230143808A1; JP7318804B2

Abstract

特徴量算出手段は、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する。類似度算出手段は、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とに基づいて、第１データと第２データの類似度を算出する。Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。

Description

類似度計算機、認証システム、類似度計算方法、類似度計算プログラムおよび類似度計算プログラムの生成方法

　本開示は、類似度計算機、認証システム、類似度計算方法、類似度計算プログラムおよび類似度計算プログラムの生成方法に関する。

　特許文献１には、生体認証技術において、生体から得られる特徴量と、照合対象との類似度に基づいて照合処理を行う技術が開示されている。

国際公開第２０１７／２０９２２８号

　機械学習において、入力データに所定のノイズを加えることで誤判定を誘発させる敵対的サンプル（Adversarial Examples）という攻撃手法が知られている。この手法は、学習済みモデルの演算の傾向に基づいて、誤判定させる対象となるデータと特徴量が近くなるようにノイズが算出される。

　機械学習の分類において敵対的サンプルの影響を抑える手法が検討されているが、特許文献１に記載されたような特徴量の抽出を機械学習されたモデルに計算させる技術について敵対的サンプルの影響を抑える技術については、検討が遅れている。
　本開示の目的の一例は、上述した課題を解決するために、学習に由来する変動に起因する誤判定の発生を抑えることができる類似度計算機、認証システム、類似度計算方法、類似度計算プログラムおよび類似度計算プログラムの生成方法を提供することにある。

　本発明の第１の態様によれば、類似度計算機は、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段と、前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段とを備え、前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。

　本発明の第２の態様によれば、認証システムは、上記態様に係る類似度計算機と、前記類似度計算機の計算結果に基づいて生体認証を行う認証装置とを備える。

　本発明の第３の態様によれば、類似度計算方法は、コンピュータが、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出し、前記コンピュータが、前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出し、前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。

　本発明の第４の態様によれば、類似度計算プログラムは、コンピュータを、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段、前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段として機能させ、前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。

　本発明の第５の態様によれば、類似度計算プログラムの生成方法は以下の手順を含む。すなわち、コンピュータが、データを入力サンプルとし、複数のクラスのうち当該データが属するクラスを示すワンホットベクトルを出力サンプルとする学習用データセットを用いて、入力されたデータに対応して当該データが属する前記クラスの事後確率を示すベクトルを出力するように、Ｎ個の特徴量計算モデルを有する第１層と、前記第１層の計算結果を入力とするモデルを有する第２層とを有するモデルネットワークを学習させ、前記コンピュータが、学習済みの前記Ｎ個の特徴量計算モデルと、第１データに係る前記Ｎ個の特徴量計算モデルの計算結果と第２データに係る前記Ｎ個の特徴量計算モデルの計算結果とに基づいて前記第１データと前記第２データの類似度を得るための類似度計算関数とを組み合わせることで、類似度計算プログラムを生成する。

　上記態様のうち少なくとも１つの態様によれば、学習に由来する変動に起因する誤判定の発生を抑えることができる。

第１の実施形態に係る認証システムの構成を示す概略ブロック図である。第１の実施形態に係る学習装置によって学習される分類モデルＭ０の構成図である。第１の実施形態に係る学習装置による特徴量モデルの学習方法を示すフローチャートである。第１の実施形態に係る認証装置による認証方法を示すフローチャートである。第２の実施形態に係る学習装置によって学習される分類モデルＭ０の構成図である。第３の実施形態に係る認証システムの構成を示す概略ブロック図である。第３の実施形態に係る認証装置による認証方法を示すフローチャートである。類似度計算機の基本構成を示す概略ブロック図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

〈第１の実施形態〉
《認証システムの構成》
　以下、図面を参照しながら実施形態について詳しく説明する。
　図１は、第１の実施形態に係る認証システム１の構成を示す概略ブロック図である。
　認証システム１は、学習装置１０と認証装置２０とを備える。
　学習装置１０は、生体データが入力されると当該生体データの特徴量を出力するように、特徴量抽出モデルのパラメータを学習させる。生体データの例としては、顔画像、静脈画像、指紋データ、音声データなどが挙げられる。特徴量抽出モデルは、ニューラルネットワークなどの機械学習モデルによって表される。
　認証装置２０は、学習装置１０によって学習されたパラメータを有する特徴量抽出モデル（学習済みモデル）を用いて、生体データに基づくユーザの認証を行う。
　なお、第１の実施形態に係る認証システム１は、学習装置１０と認証装置２０とを別個の装置として備えるが、これに限られない。例えば、他の実施形態に係る認証システム１は、認証装置２０が学習装置１０の機能を有していてもよい。

《学習装置１０の構成》
　図２は、第１の実施形態に係る学習装置１０によって学習される分類モデルＭ０の構成図である。
　学習装置１０は、分類モデル記憶部１１、データセット取得部１２、学習部１３、モデル抽出部１４、出力部１５を備える。
　分類モデル記憶部１１は、ニューラルネットワークによって構成された分類モデルＭ０を記憶する。分類モデルＭ０は、図２に示すように、入力部Ｍ０１、Ｎ個の特徴量算出部Ｍ０２、平均化部Ｍ０３、分類部Ｍ０４、出力部Ｍ０５を備える。

　データセット取得部１２は、入力サンプルである生体データと、出力サンプルである人物ラベルとを関連付けた学習用データセットを取得する。人物ラベルは、データセットにおける人物の数をＰとした場合に、Ｐ次元のワンホットベクトルによって表される。

　学習部１３は、データセット取得部１２が取得した学習用データセットを用いて、生体データが入力されると、当該生体データに該当する人物の事後確率を示すＰ次元のベクトルを出力するように、分類モデルＭ０のパラメータを学習させる。

　モデル抽出部１４は、学習部１３によって学習された分類モデルＭ０から入力部Ｍ０１、Ｎ個の特徴量算出部Ｍ０２、および平均化部Ｍ０３からなる部分モデルを、特徴量抽出モデルとして抽出する。
　出力部１５は、モデル抽出部１４によって抽出された特徴量抽出モデルを認証装置２０に出力する。出力は、ネットワーク等を介した通信によってなされてもよいし、可搬性の記憶装置を介してなされてもよい。

《分類モデルＭ０の構成》
　分類モデルＭ０は、図２に示すように、入力部Ｍ０１、Ｎ個の特徴量算出部Ｍ０２、平均化部Ｍ０３、および分類部Ｍ０４を備える。
　入力部Ｍ０１は、入力された生体データをベクトルとしてＮ個の特徴量算出部Ｍ０２に出力する。
　各特徴量算出部Ｍ０２は、２層以上のニューラルネットワークによって構成される。特徴量算出部Ｍ０２は、入力部Ｍ０１から入力されたベクトルを、低次元の特徴ベクトルに変換し、平均化部Ｍ０３に出力する。特徴ベクトルは特徴量の一例である。また特徴量算出部Ｍ０２は、特徴量関数、特徴量計算モデルの一例である。
　平均化部Ｍ０３は、Ｎ個の特徴量算出部Ｍ０２から入力されたＮ個の特徴ベクトルの平均値を算出し、分類部Ｍ０４に出力する。
　分類部Ｍ０４は、２層以上のニューラルネットワークによって構成される。分類部Ｍ０４は、平均化部Ｍ０３から入力された特徴ベクトルから、当該特徴ベクトルが表す人物の事後確率を示すＰ次元のベクトルに変換する。

《学習方法》
　図３は、第１の実施形態に係る学習装置１０による特徴量モデルの学習方法を示すフローチャートである。
　学習装置１０のデータセット取得部１２は、図示しないデータベースから予め用意されたデータセットを取得する（ステップＳ１）。学習部１３は、取得したデータセットを用いて、分類モデル記憶部１１が記憶する分類モデルＭ０のパラメータを学習させる（ステップＳ２）。このとき、学習部１３は、分類モデルＭ０の計算結果を用いて以下の式（１）に示す損失関数を最小化するように、勾配降下法により各パラメータを更新する。なお、学習部１３は、分類モデルＭ０のうち特徴量算出部Ｍ０２および分類部Ｍ０４のパラメータを更新する。

　ここで、評価値Ｌの第１項であるＬ_ＥＣＥは、分類モデルＭ０の出力値とデータセットの出力サンプルとのクロスエントロピー誤差である。なお、当該クロスエントロピー誤差には、定数項を含んだものであってもよい。行列Ｍは、Ｎ個の特徴ベクトルを並べて得られるＮ×Ｐの行列である。ｄｅｔ（）は、行列式を示す関数である。
　すなわち、第１の実施形態に係る損失関数の評価値Ｌの第２項は、Ｎ個の特徴量算出部Ｍ０２の内積が小さいほど、すなわち直交性が高いほど小さくなる。したがって、式（１）に係る損失関数を用いることで、Ｎ個の特徴量算出部Ｍ０２による特徴量の計算方法が互いに異なるように、パラメータを学習させることができる。このように学習されることで、Ｎ個の特徴量算出部Ｍ０２に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。
　学習部１３は、損失関数の評価値が所定の閾値を下回った場合、または所定回数だけ学習処理を繰り返した場合に、学習処理を終了する。

　学習部１３による学習処理が終了すると、モデル抽出部１４は、学習部１３によって学習された分類モデルＭ０から入力部Ｍ０１、Ｎ個の特徴量算出部Ｍ０２、および平均化部Ｍ０３からなる部分モデルを、特徴量抽出モデルとして抽出する（ステップＳ３）。そして、出力部１５は、抽出された特徴量抽出モデルを認証装置２０に出力する（ステップＳ４）。

《認証装置２０の構成》
　認証装置２０は、ユーザデータ記憶部２１、モデル取得部２２、抽出モデル記憶部２３、生体データ取得部２４、特徴量抽出部２５、類似度算出部２６、および認証部２７を備える。
　ユーザデータ記憶部２１は、ユーザのアカウントデータと、当該ユーザの生体データとを関連付けて記憶する。
　モデル取得部２２は、学習装置１０から学習済みの特徴量抽出モデルを取得する。
　抽出モデル記憶部２３は、モデル取得部２２が取得した学習済みの特徴量抽出モデルを記憶する。
　生体データ取得部２４は、認証装置２０に設けられたセンサ等から認証対象となる生体データを取得する。
　特徴量抽出部２５は、抽出モデル記憶部２３が記憶する特徴量抽出モデルを用いてユーザデータ記憶部２１が記憶する生体データおよび生体データ取得部２４が取得した生体データから特徴ベクトルを抽出する。
　類似度算出部２６は、２つの特徴ベクトルどうしの類似度を算出する。類似度の尺度の例としては、Ｌ２距離、コサイン類似度、ＰＬＤＡ（Probabilistic Linear Discriminant Analysis）などが挙げられる。なお、認証装置２０を実現するためのプログラムにおいて類似度算出部２６を構成する関数は、類似度計算関数であるといえる。
　認証部２７は、類似度算出部２６が算出した類似度に基づいて、ユーザデータ記憶部２１に記憶されたユーザであるか否かの認証を行う。認証部２７は、ユーザデータ記憶部２１に記憶されたユーザであると判定した場合、当該ユーザのアカウントデータを返す。

《認証方法》
　図４は、第１の実施形態に係る認証装置２０による認証方法を示すフローチャートである。なお、認証方法の実行に先立ってモデル取得部２２は、学習装置１０から学習済みの特徴量抽出モデルを取得し、抽出モデル記憶部２３に記録しているものとする。

　認証装置２０の生体データ取得部２４は、認証装置２０に接続されたセンサ等から生体データを取得する（ステップＳ２１）。特徴量抽出部２５は、ステップＳ２１で取得した生体データを、抽出モデル記憶部２３が記憶する特徴量抽出モデルに入力することで、特徴ベクトルを算出する（ステップＳ２２）。すなわち、特徴量抽出部２５は、Ｎ個の特徴量算出部Ｍ０２によりＮ個の特徴ベクトルを算出し、平均化部Ｍ０３によって当該Ｎ個の特徴ベクトルから１つの特徴ベクトルを生成する。次に、認証装置２０は、ユーザデータ記憶部２１が記憶するユーザを１つずつ選択し（ステップＳ２３）、以下に示すステップＳ２４からステップＳ２５を実行する。

　まず、特徴量抽出部２５は、ステップＳ２３で選択されたユーザに関連付けられた生体データを、抽出モデル記憶部２３が記憶する特徴量抽出モデルに入力することで、特徴ベクトルを算出する（ステップＳ２４）。すなわち、特徴量抽出部２５は、Ｎ個の特徴量算出部Ｍ０２によりＮ個の特徴ベクトルを算出し、平均化部Ｍ０３によって当該Ｎ個の特徴ベクトルから１つの特徴ベクトルを生成する。次に、類似度算出部２６は、ステップＳ２２で算出した特徴ベクトルと、ステップＳ２４で算出した特徴ベクトルとの類似度を算出する（ステップＳ２５）。

　認証部２７は、ユーザデータ記憶部２１が記憶する各ユーザについて、取得された生体データとの類似度を算出すると、算出された類似度のうち、所定の認証閾値を超えるものがあるか否かを判定する（ステップＳ２６）。すべての類似度が認証閾値以下である場合（ステップＳ２６：ＮＯ）、認証部２７は、ステップＳ２１で取得した生体データによる認証に失敗したと判定し（ステップＳ２７）、処理を終了する。

　他方、少なくとも１つの類似度が認証閾値を超える場合（ステップＳ２６：ＹＥＳ）、認証部２７は、最も高い類似度に係るユーザを特定し（ステップＳ２８）、当該ユーザのアカウントデータを出力する（ステップＳ２９）。

《作用・効果》
　このように、第１の実施形態に係る認証システム１によれば、Ｎ個の特徴量算出部Ｍ０２を有するニューラルネットワークを用いて、Ｎ個の特徴ベクトルを算出し、当該Ｎ個の特徴ベクトルに基づいて、取得された生体データとユーザデータ記憶部２１が記憶する生体データとの類似度を算出する。Ｎ個の特徴量算出部Ｍ０２を用いることで、出力される１つ１つの特徴量算出部Ｍ０２の演算の傾向を隠蔽することができる。したがって、Ｎ個の特徴量算出部Ｍ０２のアンサンブル学習の恩恵により、認証システム１は、学習に由来する変動に起因する誤判定の発生を抑えることができる。

〈第２の実施形態〉
　第２の実施形態に係る認証システムは、第１の実施形態と比較して特徴量抽出モデルの学習に係る計算量を低減する。
　第１の実施形態に係る認証システムは、図２に示す分類モデルを用いて特徴量抽出モデルの学習を行う。これに対し、第２の実施形態に係る認証システムは、図５に示す分類モデルを用いる。

　図５は、第２の実施形態に係る学習装置１０によって学習される分類モデルＭ０の構成図である。
　第２の実施形態に係る分類モデルＭ０は、図５に示すように、入力部Ｍ０１、共有特徴量算出部Ｍ１１、Ｎ個の特徴量算出部Ｍ１２、平均化部Ｍ０３、および分類部Ｍ０４を備える。
　入力部Ｍ０１は、入力された生体データをベクトルとして共有特徴量算出部Ｍ１１に出力する。
　共有特徴量算出部Ｍ１１は、２層以上のニューラルネットワークによって構成される。共有特徴量算出部Ｍ１１のネットワーク構造は、第１の実施形態に係る特徴量算出部Ｍ０２を前段部分と後段部分とに切り分けたときの前段部分と同様の構造となる。共有特徴量算出部Ｍ１１の計算結果は、Ｎ個の特徴量算出部Ｍ１２に出力される。
　各特徴量算出部Ｍ１２は、２層以上のニューラルネットワークによって構成される。特徴量算出部Ｍ１２のネットワーク構造は、第１の実施形態に係る特徴量算出部Ｍ０２を前段部分と後段部分とに切り分けたときの後段部分と同様の構造となる。Ｎ個の特徴量算出部Ｍ１２の計算結果は、それぞれ平均化部Ｍ０３に出力される。
　平均化部Ｍ０３は、Ｎ個の特徴量算出部Ｍ１２から入力されたＮ個の特徴ベクトルの平均値を算出し、分類部Ｍ０４に出力する。
　分類部Ｍ０４は、２層以上のニューラルネットワークによって構成される。分類部Ｍ０４は、平均化部Ｍ０３から入力された特徴ベクトルから、当該特徴ベクトルが表す人物の事後確率を示すＰ次元のベクトルに変換する。

　このように、第２の実施形態によれば、第１の実施形態と比較して、共有特徴量算出部Ｍ１１の数が少ないために、学習に係る計算量を低減することができる。なお、特徴量算出部Ｍ１２は、第１の実施形態に係る特徴量算出部Ｍ０２と比較して層の数が小さいため、少ない計算量で学習処理を行うことができる。

〈第３の実施形態〉
　第３の実施形態に係る認証システムは、第１の実施形態および第２の実施形態と比較して、誤判定を生じる可能性を低減する。

《認証装置２０の構成》
　図６は、第３の実施形態に係る認証システム１の構成を示す概略ブロック図である。
　第３の実施形態に係る認証装置２０は、第１の実施形態に係る構成に加え、さらに検知用データ記憶部２８を備える。
　検知用データ記憶部２８は、認証装置２０の誤判定を生じさせる敵対的データを検知するために用いる生体データ（以下、検知用データともいう）を記憶する。敵対的データの例としては、複数のユーザの音声データとの類似度が高くなるような音声データ（Master Voice）などが挙げられる。検知用データの例としては、ユーザデータ記憶部２１に記憶されていない、すなわちアカウントデータを有しない人物の生体データが挙げられる。

　なお、他の実施形態においては、検知用データが検知用データ記憶部２８に代えてユーザデータ記憶部２１に記憶されていてもよい。この場合、ユーザデータ記憶部２１は、検知用データに関連付けて、当該データが検知用データであることを示す情報を記憶する。

《認証方法》
　図７は、第３の実施形態に係る認証装置２０による認証方法を示すフローチャートである。なお、認証方法の実行に先立ってモデル取得部２２は、学習装置１０から学習済みの特徴量抽出モデルを取得し、抽出モデル記憶部２３に記録しているものとする。

　認証装置２０の生体データ取得部２４は、認証装置２０に接続されたセンサ等から生体データを取得する（ステップＳ４１）。特徴量抽出部２５は、ステップＳ４１で取得した生体データを、抽出モデル記憶部２３が記憶する特徴量抽出モデルに入力することで、特徴ベクトルを算出する（ステップＳ４２）。

　次に、認証装置２０は、検知用データ記憶部２８が記憶する検知用データを１つずつ選択し（ステップＳ４３）、以下に示すステップＳ４４からステップＳ４５を実行する。

　まず、特徴量抽出部２５は、ステップＳ４３で選択された敵対的サンプルに係る生体データを、抽出モデル記憶部２３が記憶する特徴量抽出モデルに入力することで、特徴ベクトルを算出する（ステップＳ４４）。次に、類似度算出部２６は、ステップＳ４２で算出した特徴ベクトルと、ステップＳ４４で算出した特徴ベクトルとの類似度を算出する（ステップＳ４５）。

　認証部２７は、検知用データ記憶部２８が記憶する各検知用データについて、取得された生体データとの類似度を算出すると、算出された類似度のうち、第１検出閾値を超えるものがあるか否かを判定する（ステップＳ４６）。少なくとも１つの検知用データとの類似度が第１検出閾値を超える場合（ステップＳ４６：ＹＥＳ）、ステップＳ４１で取得した生体データが敵対的データである可能性が高いため、認証部２７は、認証に失敗したと判定し（ステップＳ５２）、処理を終了する。
　また、認証部２７は、ステップＳ４５で算出された類似度の平均値が第２検出閾値を超えるものがあるか否かを判定する（ステップＳ４７）。少なくとも１つの検知用データとの類似度が検出閾値を超える場合（ステップＳ４７：ＹＥＳ）、ステップＳ４１で取得した生体データが敵対的データである可能性が高いため、認証部２７は、認証に失敗したと判定し（ステップＳ５２）、処理を終了する。これは、Master Voiceなどの敵対的データが、複数の生体データとの類似度が高くなる特徴を有するためである。

　他方、すべての検知用データとの類似度が検出閾値以下であり（ステップＳ４６：ＮＯ）、かつ類似度の平均値が第２検出閾値以下である場合（ステップＳ４７：ＮＯ）、認証装置２０は、ユーザデータ記憶部２１が記憶するユーザを１つずつ選択し（ステップＳ４８）、以下に示すステップＳ４９からステップＳ５０を実行する。

　まず、特徴量抽出部２５は、ステップＳ４７で選択されたユーザに関連付けられた生体データを、抽出モデル記憶部２３が記憶する特徴量抽出モデルに入力することで、特徴ベクトルを算出する（ステップＳ４９）。次に、類似度算出部２６は、ステップＳ４２で算出した特徴ベクトルと、ステップＳ４９で算出した特徴ベクトルとの類似度を算出する（ステップＳ５０）。

　認証部２７は、ユーザデータ記憶部２１が記憶する各ユーザについて、取得された生体データとの類似度を算出すると、算出された類似度のうち、所定の認証閾値を超えるものがあるか否かを判定する（ステップＳ５１）。なお認証閾値は、検出閾値と異なる値であってもよい。すべての類似度が認証閾値以下である場合（ステップＳ５２：ＮＯ）、認証部２７は、ステップＳ４１で取得した生体データによる認証に失敗したと判定し（ステップＳ５３）、処理を終了する。

　他方、少なくとも１つの類似度が認証閾値を超える場合（ステップＳ５１：ＹＥＳ）、認証部２７は、最も高い類似度に係るユーザを特定し（ステップＳ５３）、当該ユーザのアカウントデータを出力する（ステップＳ５４）。

《作用・効果》
　このように、第３の実施形態に係る認証システム１によれば、取得した生体データが未知の生体データと類似する場合に、ユーザの生体データとの比較を行わずに認証処理を終了する。これにより、認証システム１は、敵対的データによって誤判定を生じる可能性を低減することができる。
　なお、第３の実施形態において、認証部２７は、生体データが敵対的データであるか否かを判定するために、ステップＳ４６およびステップＳ２７の判定を行うが、これに限られない。例えば、他の実施形態に係る認証部２７は、ステップＳ４６およびステップＳ２７の何れか一方の判定のみを行ってもよい。

　以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。すなわち、他の実施形態においては、上述の処理の順序が適宜変更されてもよい。また、一部の処理が並列に実行されてもよい。
　上述した実施形態に係る認証システム１は、学習装置１０および認証装置２０によって構成されるが、単独のコンピュータによって構成されるものであってもよい。または、学習装置１０および認証装置２０がそれぞれ複数のコンピュータに分けて配置し、複数のコンピュータが互いに協働することで学習装置１０および認証装置２０として機能するものであってもよい。

　上述した実施形態に係る認証システム１は、損失関数として数（１）に示すものを用いるが、これに限られない。例えば、他の実施形態に係る認証システム１の学習装置１０は、以下に示す数（２）を損失関数としてもよい。

　すなわち、数（１）に、さらに第３項として、入力ｘの事後確率ベクトルｐ（ｋ｜ｘ）と、入力ｘの敵対的サンプルの事後確率ベクトルｐ（ｋ｜ＡＸ（ｘ））との差分のノルムを設けてもよい。

　また、上述の実施形態に係る認証システム１は、分類モデルＭ０から分類部Ｍ０４を除くことで特徴量抽出モデルを抽出するが、これに限られない。例えば、他の実施形態に係る認証システム１は、特徴量算出部Ｍ０２のみを抽出してもよい。この場合、認証装置２０は、予め入力部Ｍ０１および平均化部Ｍ０３に相当する機能を有する。

　また、上述の実施形態に係る認証システム１は、学習時にＮ個の特徴量算出部Ｍ０２を同じデータセットを用いて学習させるが、これに限られない。例えば、他の実施形態に係る認証システムは、特徴量算出部Ｍ０２を異なるデータセットを用いて学習させてもよい。

　また、上述の実施形態においては、類似度計算機を認証装置２０に実装させるが、これに限られない。他の実施形態においては、類似度計算機が単独に機能してもよいし、他の装置に組み込まれてもよい。

〈基本構成〉
　図８は、類似度計算機３０の基本構成を示す概略ブロック図である。
　上述した実施形態では、類似度計算機３０の一実施形態として図１に示す構成について説明したが、類似度計算機３０の基本構成は、図８に示すとおりである。
　すなわち、類似度計算機３０は、特徴量算出手段３１および類似度算出手段３２を基本構成とする。

　特徴量算出手段３１は、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する。
　類似度算出手段３２は、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とに基づいて、第１データと第２データの類似度を算出する。
　Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる。
　これにより、類似度計算機３０は、学習に由来する変動に起因する誤判定の発生を抑えることができる。

〈コンピュータ構成〉
　図９は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
　コンピュータ９０は、プロセッサ９１、メインメモリ９２、ストレージ９３、インタフェース９４を備える。
　上述の学習装置１０、認証装置２０、類似度計算機３０は、コンピュータ９０に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ９３に記憶されている。プロセッサ９１は、プログラ
ムをストレージ９３から読み出してメインメモリ９２に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ９１は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ９２に確保する。プロセッサ９１の例としては、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、マイクロプロセッサなどが挙げられる。

　プログラムは、コンピュータ９０に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、ストレージに既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ９０は、上記構成に加えて、または上記構成に代えてＰＬＤ（Programmable Logic Device）などのカスタムＬＳＩ（Large Scale Integrated Circuit）を備えてもよい。ＰＬＤの例としては、ＰＡＬ(Programmable Array Logic)、ＧＡＬ(Generic Array Logic)、ＣＰＬＤ(Complex Programmable Logic Device)、ＦＰＧＡ（Field Programmable Gate Array）が挙げられる。この場合、プロセッサ９１によって実現される機能の一部または全部が当該集積回路によって実現されてよい。このような集積回路も、プロセッサの一例に含まれる。

　ストレージ９３の例としては、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＤＶＤ－ＲＯＭ（Digital Versatile Disc Read Only Memory）、半導体メモリ等が挙げられる。ストレージ９３は、コンピュータ９０のバスに直接接続された内部メディアであってもよいし、インタフェース９４または通信回線を介してコンピュータ９０に接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ９０に配信される場合、配信を受けたコンピュータ９０が当該プログラムをメインメモリ９２に展開し、上記処理を実行してもよい。少なくとも１つの実施形態において、ストレージ９３は、一時的でない有形の記憶媒体である。

　また、当該プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、前述した機能をストレージ９３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であってもよい。

〈付記〉
　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段と、
　前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段と
　を備え、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算機。

　（付記２）
　データを入力することで前記Ｎ個の特徴量関数への入力として共有される共有特徴量を得るための共有特徴量関数を用いて、前記第１データに係る共有特徴量と前記第２データに係る共有特徴量とを算出する共有特徴量算出手段を備え、
　前記Ｎ個の特徴量関数は、それぞれ前記共有特徴量を入力することで前記特徴量を出力し、
　前記特徴量算出手段は、前記第１データに係る共有特徴量を前記Ｎ個の特徴量関数に入力することで前記第１データに係るＮ個の特徴量を算出し、前記第２データに係る共有特徴量を前記Ｎ個の特徴量関数に入力することで前記第２データに係るＮ個の特徴量を算出する
　付記１に記載の類似度計算機。

　（付記３）
　前記Ｎ個の特徴量関数は、
　データを入力サンプルとし、複数のクラスのうち当該データが属するクラスを示すワンホットベクトルを出力サンプルとする学習用データセットを用いて、入力されたデータに対応して当該データが属する前記クラスの事後確率を示すベクトルを出力するように学習された、Ｎ個の特徴量計算モデルを有する第１計算部と、前記第１計算部の計算結果を入力とするモデルを有する第２計算部とを有するモデルネットワークのうちの、学習済みの前記Ｎ個の特徴量計算モデルによって構成される
　付記１または付記２に記載の類似度計算機。

　（付記４）
　前記モデルネットワークは、前記入力サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果の内積が小さくなるように学習される
　付記３に記載の類似度計算機。

　（付記５）
　前記モデルネットワークは、前記入力サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果と、前記入力サンプルの敵対的サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果との差が小さくなるように学習される
　付記３または付記４に記載の類似度計算機。

　（付記６）
　前記データは生体情報を表すデータである
　付記１から付記５の何れかに記載の類似度計算機。

　（付記７）
　付記６に記載の類似度計算機と、
　前記類似度計算機の計算結果に基づいて生体認証を行う認証装置と
　を備える認証システム。

　（付記８）
　前記類似度計算機は、入力された生体データと、認証対象の人物に係る生体データとの類似度を計算し、
　前記認証装置は、前記類似度が第１閾値を超える場合に、認証に成功したと判定する
　付記７に記載の認証システム。

　（付記９）
　前記類似度計算機は、入力された生体データと、認証対象でない人物に係る生体データである検知用データとの類似度をさらに計算し、
　前記認証装置は、前記検知用データに係る類似度が第２閾値を超える場合に、認証対象の人物に係る生体データとの類似度に関わらず前記認証に失敗したと判定する
　付記８に記載の認証システム。

　（付記１０）
　コンピュータが、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出し、
　前記コンピュータが、前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出し、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算方法。

　（付記１１）
　コンピュータを、
　データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段、
　前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段
　として機能させ、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算プログラム。

　（付記１２）
　コンピュータが、データを入力サンプルとし、複数のクラスのうち当該データが属するクラスを示すワンホットベクトルを出力サンプルとする学習用データセットを用いて、入力されたデータに対応して当該データが属する前記クラスの事後確率を示すベクトルを出力するように、Ｎ個の特徴量計算モデルを有する第１計算部と、前記第１計算部の計算結果を入力とするモデルを有する第２計算部とを有するモデルネットワークを学習させ、
　前記コンピュータが、学習済みの前記Ｎ個の特徴量計算モデルと、第１データに係る前記Ｎ個の特徴量計算モデルの計算結果と第２データに係る前記Ｎ個の特徴量計算モデルの計算結果とに基づいて前記第１データと前記第２データの類似度を得るための類似度計算関数とを組み合わせることで、類似度計算プログラムを生成する
　類似度計算プログラムの生成方法。

　上記類似度計算機、認証システム、類似度計算方法、類似度計算プログラムおよび類似度計算プログラムの生成方法のうち少なくとも１つによれば、学習に由来する変動に起因する誤判定の発生を抑えることができる。

１　認証システム
１０　学習装置
１１　分類モデル記憶部
１２　データセット取得部
１３　学習部
１４　モデル抽出部
１５　出力部
２０　認証装置
２１　ユーザデータ記憶部
２２　モデル取得部
２３　抽出モデル記憶部
２４　生体データ取得部
２５　特徴量抽出部
２６　類似度算出部
２７　認証部

Claims

　データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段と、
　前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段と
　を備え、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算機。
　データを入力することで前記Ｎ個の特徴量関数への入力として共有される共有特徴量を得るための共有特徴量関数を用いて、前記第１データに係る共有特徴量と前記第２データに係る共有特徴量とを算出する共有特徴量算出手段を備え、
　前記Ｎ個の特徴量関数は、それぞれ前記共有特徴量を入力することで前記特徴量を出力し、
　前記特徴量算出手段は、前記第１データに係る共有特徴量を前記Ｎ個の特徴量関数に入力することで前記第１データに係るＮ個の特徴量を算出し、前記第２データに係る共有特徴量を前記Ｎ個の特徴量関数に入力することで前記第２データに係るＮ個の特徴量を算出する
　請求項１に記載の類似度計算機。
　前記Ｎ個の特徴量関数は、
　データを入力サンプルとし、複数のクラスのうち当該データが属するクラスを示すワンホットベクトルを出力サンプルとする学習用データセットを用いて、入力されたデータに対応して当該データが属する前記クラスの事後確率を示すベクトルを出力するように学習された、Ｎ個の特徴量計算モデルを有する第１計算部と、前記第１計算部の計算結果を入力とするモデルを有する第２計算部とを有するモデルネットワークのうちの、学習済みの前記Ｎ個の特徴量計算モデルによって構成される
　請求項１または請求項２に記載の類似度計算機。
　前記モデルネットワークは、前記入力サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果の内積が小さくなるように学習される
　請求項３に記載の類似度計算機。
　前記モデルネットワークは、前記入力サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果と、前記入力サンプルの敵対的サンプルを入力したときの前記Ｎ個の特徴量計算モデルの計算結果との差が小さくなるように学習される
　請求項３または請求項４に記載の類似度計算機。
　前記データは生体情報を表すデータである
　請求項１から請求項５の何れか１項に記載の類似度計算機。
　請求項６に記載の類似度計算機と、
　前記類似度計算機の計算結果に基づいて生体認証を行う認証装置と
　を備える認証システム。
　コンピュータが、データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出し、
　前記コンピュータが、前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出し、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算方法。
　コンピュータを、
　データに基づいて当該データに係る特徴量を得るためのＮ個の特徴量関数を用いて、第１データに係るＮ個の特徴量と第２データに係るＮ個の特徴量とを算出する特徴量算出手段、
　前記第１データに係るＮ個の特徴量と前記第２データに係るＮ個の特徴量とに基づいて、前記第１データと前記第２データの類似度を算出する類似度算出手段
　として機能させ、
　前記Ｎ個の特徴量関数に同じデータが代入された場合に得られるＮ個の特徴量の値は、互いに異なる
　類似度計算プログラム。
　コンピュータが、データを入力サンプルとし、複数のクラスのうち当該データが属するクラスを示すワンホットベクトルを出力サンプルとする学習用データセットを用いて、入力されたデータに対応して当該データが属する前記クラスの事後確率を示すベクトルを出力するように、Ｎ個の特徴量計算モデルを有する第１計算部と、前記第１計算部の計算結果を入力とするモデルを有する第２計算部とを有するモデルネットワークを学習させ、
　前記コンピュータが、学習済みの前記Ｎ個の特徴量計算モデルと、第１データに係る前記Ｎ個の特徴量計算モデルの計算結果と第２データに係る前記Ｎ個の特徴量計算モデルの計算結果とに基づいて前記第１データと前記第２データの類似度を得るための類似度計算関数とを組み合わせることで、類似度計算プログラムを生成する
　類似度計算プログラムの生成方法。