WO2022074786A1

WO2022074786A1 - データ生成方法、情報処理装置およびデータ生成プログラム

Info

Publication number: WO2022074786A1
Application number: PCT/JP2020/038139
Authority: WO
Inventors: 隆浩青木
Original assignee: 富士通株式会社
Priority date: 2020-10-08
Filing date: 2020-10-08
Publication date: 2022-04-14
Also published as: EP4227889A1; JPWO2022074786A1; US20230206605A1; EP4227889A4

Abstract

部分データを利用した生体認証の精度低下を抑制する。　生体画像（１３）から、複数の特徴量を含む特徴データ（１４）を算出する。特徴データ（１４）に含まれる複数の特徴量それぞれを、特徴量がとり得る値の出現確率を示す確率分布に基づいて、複数段階の離散値をとる正規化特徴量に正規化する。正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、正規化特徴量それぞれをビット列に変換して、複数の特徴量に対応する複数のビット列を含むバイナリ特徴データ（１６）を生成する。バイナリ特徴データ（１６）に含まれる複数のビット列それぞれから一部のビットを抽出して、複数のビット列に対応する複数の部分ビット列を含んでおりバイナリ特徴データ（１６）よりもビット長が小さい部分特徴データ（１７）を生成する。

Description

データ生成方法、情報処理装置およびデータ生成プログラム

　本発明はデータ生成方法、情報処理装置およびデータ生成プログラムに関する。

　ユーザの生体画像からユーザを認証する生体認証技術がある。生体認証として、顔画像を用いる顔認証、手のひらまたは指の静脈画像を用いる静脈認証、指紋画像を用いる指紋認証、目の虹彩画像を用いる虹彩認証などが挙げられる。生体認証技術は、建物の入室管理や秘密情報の保護などに利用されることがある。

　例えば、生体認証システムは、登録用の生体画像から特徴データを抽出し、特徴データをデータベースに登録する。特徴データは、複数次元の数値に相当する複数の特徴量を含む特徴ベクトルであることがある。生体認証システムは、認証時の生体画像から特徴データを抽出し、データベースに登録された特徴データと照合する。２つの特徴データが十分に近似する場合は認証が成功し、近似しない場合は認証が失敗する。

　なお、対象者の生体情報とデータベースに登録された複数の登録者それぞれの生体情報とを照合して対象者を識別する１対Ｎ認証を実行する認証装置が提案されている。提案の認証装置は、生体情報であるバイナリ画像をランレングス符号化し、ランレングスベクトルを用いて、対象者の生体情報とマッチする可能性がある登録者の生体情報を絞り込む。

　また、対象画像に写った人物が、データベースに登録された複数の登録画像に写った複数の人物のうちの何れと一致するか判定する画像識別装置が提案されている。提案の画像識別装置は、登録画像を生成する際に、所定の上限値を超える輝度を上限値にクリッピングすると共に、輝度の上位ビットを削除することで輝度を低減させる。

特開２０１０－２７７１９６号公報特開２０１２－５８９５４号公報

　生体認証システムは、処理時間の制約またはハードウェアリソースの制約から、最初に生成された特徴データの一部分を利用して簡易的に照合を行いたいことがある。例えば、生体認証システムは、１対Ｎ認証の前処理として、データベースに登録された多数のユーザの特徴データの中から、対象ユーザの特徴データとマッチする可能性がある特徴データ候補を絞り込むことが考えられる。しかし、照合に利用する部分データの生成方法によっては、生体認証の精度が大きく低下することがあるという問題がある。

　１つの側面では、本発明は、部分データを利用した生体認証の精度低下を抑制するデータ生成方法、情報処理装置およびデータ生成プログラムを提供することを目的とする。

　１つの態様では、コンピュータが以下の処理を実行するデータ生成方法が提供される。生体画像から、複数の特徴量を含む特徴データを算出する。特徴データに含まれる複数の特徴量それぞれを、特徴量がとり得る値の出現確率を示す確率分布に基づいて、複数段階の離散値をとる正規化特徴量に正規化する。正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、正規化特徴量それぞれをビット列に変換して、複数の特徴量に対応する複数のビット列を含むバイナリ特徴データを生成する。バイナリ特徴データに含まれる複数のビット列それぞれから一部のビットを抽出して、複数のビット列に対応する複数の部分ビット列を含んでおりバイナリ特徴データよりもビット長が小さい部分特徴データを生成する。

　また、１つの態様では、記憶部と処理部とを有する情報処理装置が提供される。また、１つの態様では、コンピュータに実行させるデータ生成プログラムが提供される。

　１つの側面では、部分データを利用した生体認証の精度低下を抑制できる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態の情報処理装置を説明するための図である。第２の実施の形態の情報処理システムの例を示す図である。生体画像とテンプレートの照合例を示す図である。特徴ベクトルの正規化およびバイナリ化の例を示す図である。バイナリ化とハミング距離の関係の例を示す図である。バイナリ特徴ベクトルの部分データ化の例を示す図である。選択ビットと部分特徴量の関係の例を示す図である。選択ビットの偶数奇数と部分特徴量の関係の例を示す図である。バイナリ特徴ベクトルの部分データ化の他の例を示す図である。認証装置の機能例を示すブロック図である。テンプレートテーブルと設定テーブルの例を示す図である。テンプレート登録の手順例を示すフローチャートである。絞り込み設定の手順例を示すフローチャートである。ユーザ認証の手順例を示すフローチャートである。第３の実施の形態の情報処理システムの例を示す図である。

　以下、本実施の形態を図面を参照して説明する。
　［第１の実施の形態］
　第１の実施の形態を説明する。

　図１は、第１の実施の形態の情報処理装置を説明するための図である。
　第１の実施の形態の情報処理装置１０は、生体認証を行う。生体認証は、顔認証、手のひら静脈認証、指静脈認証、指紋認証、虹彩認証など、任意の種類の生体認証でよい。情報処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１０は、コンピュータまたは認証装置と呼ばれてもよい。

　情報処理装置１０は、記憶部１１および処理部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。処理部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、処理部１２は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの特定用途の電子回路を含んでもよい。プロセッサは、ＲＡＭなどのメモリ（記憶部１１でもよい）に記憶されたプログラムを実行する。複数のプロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

　記憶部１１は、生体画像１３、特徴データ１４、正規化特徴データ１５、バイナリ特徴データ１６および部分特徴データ１７を記憶する。生体画像１３は、ユーザの身体的特徴または行動的特徴が写った画像である。例えば、生体画像１３は、撮像装置によって生成された顔画像、静脈画像、指紋画像または虹彩画像である。生体画像１３は、情報処理装置１０で生成されてもよいし、他の情報処理装置から受信されてもよい。特徴データ１４、正規化特徴データ１５、バイナリ特徴データ１６および部分特徴データ１７は、後述するように、生体画像１３から処理部１２によって生成される。

　処理部１２は、生体画像１３を解析して特徴データ１４を生成する。例えば、処理部１２は、生体画像１３からパターンマッチングによって特徴点を抽出し、特徴点を含む画像領域に対して主成分分析（ＰＣＡ：Principal Component Analysis）を実行する。特徴データ１４は、特徴量１４ａなどの複数の特徴量を含む。各特徴量は、浮動小数点数であってもよい。例えば、特徴データ１４は、複数次元の数値を含む特徴ベクトルである。

　処理部１２は、特徴データ１４に含まれる複数の特徴量それぞれを正規化特徴量に正規化する。これにより、処理部１２は、正規化特徴量１５ａなどの複数の正規化特徴量を含む正規化特徴データ１５を生成する。正規化特徴データ１５に含まれる正規化特徴量の個数は、特徴データ１４に含まれる特徴量の個数と同じでもよい。例えば、正規化特徴データ１５は、特徴データ１４と次元数が同じ正規化特徴ベクトルであってもよい。

　ここで、正規化特徴量は、複数段階の離散値をとる。例えば、正規化特徴量がとり得る値は、０から始まる連続する非負整数である。処理部１２は、特徴量がとり得る値の出現確率を示す確率分布に基づいて、特徴量を正規化する。例えば、処理部１２は、特徴量の出現確率が正規分布に従うと仮定して、特徴量の平均と分散に基づいて、特徴量の区間と正規化特徴量とを対応付ける。処理部１２は、異なる正規化特徴量の出現確率が均等になるように、特徴量のとり得る値を複数の区間に分割することが好ましい。処理部１２は、多数の生体画像のサンプルを解析することで、予め確率分布を算出してもよい。また、確率分布は次元毎に算出されてもよいし、全ての次元に共通に算出されてもよい。

　処理部１２は、正規化特徴データ１５に含まれる複数の正規化特徴量それぞれをビット列に変換する。これにより、処理部１２は、ビット列１６ａなどの複数のビット列を含むバイナリ特徴データ１６を生成する。バイナリ特徴データ１６に含まれるビット列の個数は、正規化特徴データ１５に含まれる正規化特徴量の個数と同じでもよい。例えば、バイナリ特徴データ１６は、特徴データ１４および正規化特徴データ１５と次元数が同じバイナリ特徴ベクトルであってもよい。

　ここで、処理部１２は、正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、ビット列を生成する。二値は０と１で表現されることがあり、特定の一方の値は１であってもよい。特定の一方の値をとるビットの個数は、正規化特徴量そのものであってもよい。例えば、正規化特徴量１５ａが２である場合、正規化特徴量１５ａから変換されるビット列１６ａは１のビットを２個含む。複数のビット列それぞれのビット長は同じであることが好ましい。ビット長は、正規化特徴量の最大値であってもよい。例えば、正規化特徴量の最大値が４である場合、ビット長は４である。処理部１２は、所望のビット長に合わせて正規化方法を決定してもよい。

　ビット列において、特定の一方の値は規則的な順序で並ぶ。特定の一方の値は、下位ビットから順に並んでもよいし、上位ビットから順に並んでもよい。例えば、正規化特徴量１５ａが２であり、ビット列１６ａのビット長が４であり、特定の一方の値が１である場合、ビット列１６ａの下位２ビットが１であり残りの上位２ビットが０である。特定の一方の値が並ぶ順序は、規則的な方法でシャッフルされてもよい。また、特定の一方の値が並ぶ順序は、複数のビット列の間で共通でもよいしビット列によって異なってもよい。

　処理部１２は、バイナリ特徴データ１６に含まれる複数のビット列それぞれから一部のビットを抽出する。これにより、処理部１２は、部分ビット列１７ａなどの複数の部分ビット列を含む部分特徴データ１７を生成する。部分特徴データ１７に含まれる部分ビット列の個数は、バイナリ特徴データ１６に含まれるビット列の個数と同じでもよい。例えば、部分特徴データ１７は、特徴データ１４、正規化特徴データ１５およびバイナリ特徴データ１６と次元数が同じ部分特徴ベクトルであってもよい。

　各部分ビット列のビット長は、バイナリ特徴データ１６のビット列よりも小さい。複数の部分ビット列それぞれのビット長は同じであることが好ましい。部分ビット列のビット長は、部分特徴データ１７の用途に応じて予め指定される。処理部１２は、ビット列のビット長と部分ビット列のビット長、すなわち、変換前のビット長と変換後のビット長に応じて、ビット列からビットを抽出する位置を決定してもよい。

　抽出されるビットは、ビット列全体からできる限り均等に選択されてもよい。例えば、ビット列１６ａのビット長が４であり、部分ビット列１７ａのビット長が２である場合、部分ビット列１７ａは、ビット列１６ａのビット＃０，＃２またはビット＃１，＃３である。なお、ビット＃０は最下位ビットを表す。抽出されるビットの位置は、複数の部分ビット列の間で共通でもよいし部分ビット列によって異なってもよい。また、処理部１２は、ビット列の中心ビットを含むように、ビットを抽出する位置を決定してもよい。ビット列のビット長が偶数である場合、中心ビットは、隣接する偶数番目のビットと奇数番目のビットの２つ存在する。処理部１２は、２つのうちの何れか一方を選択してもよい。

　処理部１２は、部分特徴データ１７を生体認証の高速化に利用してもよい。例えば、処理部１２は、前処理として、データベースに登録された多数のユーザのバイナリ特徴データの中からバイナリ特徴データ１６とマッチする可能性がある候補を絞り込むために、部分特徴データ１７を使用する。処理部１２は、部分特徴データ１７と他の部分特徴データとの間の類似度を、ハミング距離を用いて評価してもよい。ハミング距離は、２つの部分特徴データの間でビット毎の排他的論理和を求める論理演算を通じて算出できる。

　第１の実施の形態の情報処理装置１０によれば、生体画像１３から抽出された特徴データ１４に基づいて生体認証が実行される。また、特徴データ１４よりもデータ量の小さい部分特徴データ１７が生成され、部分特徴データ１７を用いて簡易的な照合処理が実行される。よって、処理時間の制約またはハードウェアリソースの制約がある場合でも、照合処理の計算量を削減でき生体認証を高速に実行できる。

　また、部分特徴データ１７を生成する過程で、特徴量の正規化およびバイナリ化が行われる。よって、２つの特徴量の間の差を、ハミング距離を求める論理演算を通じて評価することが可能となる。ビット毎の論理演算は、浮動小数点演算よりも計算量が小さく、組み込み用プロセッサなどの演算能力の低いハードウェアでも高速に実行できる。このため、生体認証を高速に実行することができる。

　また、部分特徴データ１７を生成するにあたり、バイナリ特徴データ１６に含まれる複数のビット列それぞれから一部ビットが間引かれる。よって、部分特徴データ１７は、バイナリ特徴データ１６の複数のビット列に対応する複数の部分ビット列を含んでおり、バイナリ特徴データ１６の特定のビット列全体が失われているわけではない。すなわち、特徴データ１４の特定の特徴量の情報が削除されているわけではない。このため、部分特徴データ１７を利用することによる認証精度の低下を抑制することができる。

　［第２の実施の形態］
　次に、第２の実施の形態を説明する。
　図２は、第２の実施の形態の情報処理システムの例を示す図である。

　第２の実施の形態の情報処理システムは、生体認証の１つである手のひら静脈認証によってユーザを認証し、ユーザの入室を管理する。情報処理システムは、認証装置１００およびドア制御装置３２を含む。認証装置１００は、手のひら静脈画像を用いてユーザ認証を行い、そのユーザが登録されたユーザであるか判定する。認証装置１００は、認証に成功した場合はドア制御装置３２に通行許可を指示し、認証に失敗した場合はドア制御装置３２に通行拒否を指示する。ドア制御装置３２は、認証装置１００に接続される。ドア制御装置３２は、認証装置１００からの指示に応じてドアのロックを制御する。

　認証装置１００は、情報処理装置またはコンピュータと呼ばれてもよい。認証装置１００は、第１の実施の形態の情報処理装置１０に対応する。認証装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、フラッシュメモリ１０３、表示装置１０４、入力デバイス１０５、媒体リーダ１０６、通信部１０７およびセンサデバイス１１０を有する。上記ユニットはバスに接続されている。ＣＰＵ１０１は、第１の実施の形態の処理部１２に対応する。ＲＡＭ１０２またはフラッシュメモリ１０３は、第１の実施の形態の記憶部１１に対応する。

　ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、低消費電力の組み込み用プロセッサでもよい。ＣＰＵ１０１は、フラッシュメモリ１０３に記憶されたプログラムおよびデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。認証装置１００は、複数のプロセッサを有してもよい。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

　ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムおよびＣＰＵ１０１が演算に使用するデータを一時的に記憶する揮発性半導体メモリである。認証装置１００は、ＲＡＭ以外の種類のメモリを有してもよい。フラッシュメモリ１０３は、ソフトウェアのプログラムおよびデータを記憶する不揮発性ストレージである。ソフトウェアには、ＯＳ（Operating System）、ミドルウェアおよびアプリケーションソフトウェアが含まれてもよい。認証装置１００は、ＨＤＤなどの他の種類の不揮発性ストレージを有してもよい。

　表示装置１０４は、ＣＰＵ１０１からの命令に従って画像を表示する。表示装置１０４は、例えば、液晶ディスプレイまたは有機ＥＬ（Electro-Luminescence）ディスプレイである。認証装置１００は、他の種類の出力デバイスを有してもよい。入力デバイス１０５は、ユーザの操作を検知して入力信号をＣＰＵ１０１に通知する。入力デバイス１０５は、例えば、タッチパネルやボタンキーなどである。

　媒体リーダ１０６は、記録媒体３１に記録されたプログラムまたはデータを読み取る読み取り装置である。記録媒体３１は、磁気ディスク、光ディスクまたは半導体メモリであってもよい。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）およびＨＤＤが含まれてもよい。光ディスクには、ＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disc）が含まれてもよい。媒体リーダ１０６は、例えば、記録媒体３１から読み取ったプログラムまたはデータを、フラッシュメモリ１０３などのストレージにコピーする。記録媒体３１は、可搬型記録媒体でもよい。記録媒体３１は、プログラムまたはデータの配布に用いられることがある。記録媒体３１およびフラッシュメモリ１０３が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。

　通信部１０７は、ドア制御装置３２と接続され、ドア制御装置３２と通信する。通信部１０７は、例えば、ドア制御装置３２とケーブルで接続される。通信部１０７は、ドアを開くことを示す信号またはドアを閉じることを示す信号をドア制御装置３２に送信する。

　センサデバイス１１０は、画像センサである。ユーザはドアを開けて入室しようとするとき、手のひらをセンサデバイス１１０にかざす。すると、センサデバイス１１０は、手のひらを検知し、手のひら静脈画像を生成してＲＡＭ１０２に格納する。センサデバイス１１０は、センサ制御部１１１、照明部１１２および撮像素子１１３を有する。

　センサ制御部１１１は、センサデバイス１１０の動作を制御する。センサ制御部１１１は、手のひらを検知し、照明部１１２および撮像素子１１３を制御して手のひら静脈画像を生成する。照明部１１２は、センサ制御部１１１からの命令に応じて、手のひらに対して光を照射する。撮像素子１１３は、センサ制御部１１１からの命令に応じて、照明部１１２の光によって浮かび上がった手のひらの静脈を撮像する。

　次に、生体認証の処理について説明する。
　図３は、生体画像とテンプレートの照合例を示す図である。
　ユーザがセンサデバイス１１０に手のひらをかざすと、センサデバイス１１０は生体画像１５１を生成する。認証装置１００は、生体画像１５１を解析する。生体画像１５１の解析では、認証装置１００は、パターンマッチングにより、異なるユーザが異なる特徴をもつことが知られている複数の特徴点を抽出する。抽出される特徴点は、例えば、静脈の端点および静脈の分岐点である。例えば、生体画像１５１から特徴点１５２－１，１５２－２，１５２－３が抽出される。特徴点１５２－１は、静脈の分岐点に相当する。特徴点１５２－２，１５２－３は、静脈の端点に相当する。

　認証装置１００は、複数の特徴点それぞれについて、特徴点を中心とする所定の大きさの画像領域を生体画像１５１から切り出し、その画像領域から特徴ベクトルを生成する。例えば、認証装置１００は、切り出した画像領域における画素値の分布に対して主成分分析を行って特徴ベクトルを生成する。特徴ベクトルの次元数は、例えば、６４次元、１２８次元、２５６次元、５１２次元などである。特徴ベクトルの各次元の要素は、浮動小数点で表現された数値である。例えば、認証装置１００は、特徴点１５２－１から特徴ベクトル１５３－１を生成し、特徴点１５２－２から特徴ベクトル１５３－２を生成し、特徴点１５２－３から特徴ベクトル１５３－３を生成する。

　認証装置１００が有するデータベースには、テンプレート１５４が登録されている。テンプレート１５４は、あるユーザの登録情報であり、特徴点１５２－１，１５２－２，１５２－３に相当する複数の特徴点の情報を含む。テンプレート１５４は、登録時の生体画像から生成される。認証装置１００は、特徴点毎に、生成された特徴ベクトルとテンプレート１５４の情報とを照合して、類似度を示すスコアを算出する。スコアは、類似度が高いほど数値が大きい相関値でもよいし、類似度が低いほど数値が大きい誤差値でもよい。

　例えば、認証装置１００は、特徴点１５２－１について、特徴ベクトル１５３－１からスコア１５５－１を算出する。また、認証装置１００は、特徴点１５２－２について、特徴ベクトル１５３－２からスコア１５５－２を算出する。また、認証装置１００は、特徴点１５２－３について、特徴ベクトル１５３－３からスコア１５５－３を算出する。

　認証装置１００は、複数の特徴点のスコアに基づいて、生体画像１５１とテンプレート１５４が同一人物を表すか判定する。例えば、認証装置１００は、複数の特徴点の平均スコアを算出する。類似度が高いほどスコアが大きい場合、認証装置１００は、平均スコアが閾値を超える場合に認証成功と判定し、平均スコアが閾値以下の場合に認証失敗と判定する。また、類似度が低いほどスコアが大きい場合、認証装置１００は、平均スコアが閾値未満の場合に認証成功と判定し、平均スコアが閾値以上の場合に認証失敗と判定する。

　ここで、照合処理を高速化するため、テンプレート１５４は、特徴点の登録情報として後述するバイナリ特徴ベクトルを含む。また、認証装置１００は、特徴ベクトル１５３－１，１５３－２，１５３－３をそれぞれバイナリ特徴ベクトルに変換し、テンプレート１５４に含まれるバイナリ特徴ベクトルと照合してスコアを算出する。認証装置１００は、以下のようにして特徴ベクトルをバイナリ特徴ベクトルに変換する。

　図４は、特徴ベクトルの正規化およびバイナリ化の例を示す図である。
　特徴ベクトル１６１は、各次元の要素が浮動小数点数であるベクトルである。認証装置１００は、特徴ベクトル１６１に対して正規化Ｓ１を実行して、特徴ベクトル１６１を正規化特徴ベクトル１６３に変換する。正規化特徴ベクトル１６３の次元数は、特徴ベクトル１６１と同じである。更に、認証装置１００は、正規化特徴ベクトル１６３に対してバイナリ化Ｓ２を実行して、正規化特徴ベクトル１６３をバイナリ特徴ベクトル１６５に変換する。バイナリ特徴ベクトル１６５の次元数は、正規化特徴ベクトル１６３と同じであり、よって、特徴ベクトル１６１と同じである。

　正規化Ｓ１では、認証装置１００は、確率分布１６２を使用する。確率分布１６２は、特徴ベクトル１６１の各次元の要素である特徴量の出現確率を表す。認証装置１００は、複数の次元に対して共通の確率分布を使用してもよいし、次元によって異なる確率分布を使用してもよい。確率分布１６２は、様々な生体画像から抽出された様々な特徴ベクトルを事前に分析することで推定される。事前の分析は、学習処理と呼ばれてもよい。確率分布１６２は正規分布とみなされ、特徴量の平均μと標準偏差σによって定義される。

　区間毎の出現確率が均等になるように、特徴量の値域が複数の区間に分割される。特徴量の区間は、平均μと標準偏差σを用いて規定することが可能である。区間の個数は、バイナリ特徴ベクトル１６５のビット長を考慮して予め指定される。そして、複数の区間それぞれに対して正規化特徴量が割り当てられる。これにより、特徴量と正規化特徴量とが対応付けられる。正規化特徴量がとり得る値の個数は、特徴量がとり得る値の個数よりも少ない。正規化特徴量は、非負整数である。正規化特徴量として、特徴量が小さい区間から順に０，１，２，…と昇順の非負整数が割り当てられる。

　例えば、認証装置１００は、特徴量０．５を正規化特徴量２に変換し、特徴量－０．９を正規化特徴量０に変換し、特徴量０．１を正規化特徴量１に変換し、特徴量１．２を正規化特徴量３に変換する。正規化特徴ベクトル１６３の要素は、正規化特徴量である。

　バイナリ化Ｓ２では、認証装置１００は、正規化特徴ベクトル１６３に含まれる各次元の正規化特徴量をバイナリ特徴量に変換する。バイナリ特徴ベクトル１６５の要素は、バイナリ特徴量である。正規化特徴量とバイナリ特徴量との間の対応関係は、テーブル１６４のように規定される。バイナリ特徴量は、各ビットが０または１の二値をとるビット列である。バイナリ特徴量のビット長は、正規化特徴量の最大値に等しい。バイナリ特徴量のビット長は、例えば、４ビット、８ビット、１６ビットなどである。図４の例では、正規化特徴量の最大値が３であり、バイナリ特徴量は３ビットのビット列である。

　バイナリ特徴量は、正規化特徴量と等しい個数だけ１のビットをもつ。下位ビットから優先的に１のビットになる。例えば、認証装置１００は、正規化特徴量０をバイナリ特徴量０００に変換し、正規化特徴量１をバイナリ特徴量００１に変換し、正規化特徴量２をバイナリ特徴量０１１に変換し、正規化特徴量３をバイナリ特徴量１１１に変換する。

　ただし、認証装置１００は、異なる特徴量の間の距離を評価できればよい。よって、認証装置１００は、確率分布１６２において、特徴量が大きい区間から順に０，１，２，…と昇順の非負整数を割り当ててもよい。また、認証装置１００は、正規化特徴量と等しい個数だけ０のビットをもつようにバイナリ特徴量を生成してもよい。また、認証装置１００は、上位ビットから優先的に１のビットになるようにバイナリ特徴量を生成してもよい。また、認証装置１００は、１のビットまたは０のビットが所定の優先順序で現れるように、バイナリ特徴量のビット列をシャッフルしてもよい。例えば、下位ビットから順にビット＃０，＃１，＃２と表記した場合に、認証装置１００は、ビット＃１，＃０，＃２という優先順位で１のビットを配置するようにしてもよい。

　認証装置１００は、一人の登録ユーザにつき、複数の特徴点それぞれのバイナリ特徴ベクトルを含むテンプレートをデータベースに登録しておく。認証装置１００は、入室許可を求めるユーザのバイナリ特徴ベクトルとテンプレートに含まれるバイナリ特徴ベクトルとの間でハミング距離を算出し、ハミング距離に基づいてスコアを算出する。ハミング距離は、２つのビット列の間で値が異なるビットの個数である。ハミング距離は、ビット毎の排他的論理和によって算出することができる。ハミング距離を算出する論理演算の計算負荷は、２つの浮動小数点数の差を算出する浮動小数点演算よりも小さい。

　スコアを算出するにあたり、認証装置１００は、次元毎に２つのバイナリ特徴量の間のハミング距離を算出し、全ての次元のハミング距離を合算してもよい。また、認証装置１００は、ハミング距離が大きいほどスコアが小さく、ハミング距離が小さいほどスコアが大きいように、ハミング距離をスコアに変換してもよい。ここで、バイナリ特徴量のハミング距離を利用する利点について説明する。

　図５は、バイナリ化とハミング距離の関係の例を示す図である。
　テーブル１４１は、正規化特徴量、バイナリ特徴量、バイナリ化前のハミング距離およびバイナリ化後のハミング距離の関係を示す。テーブル１４１では、正規化特徴量の最大値が４であり、バイナリ特徴量のビット長が４である場合を考える。

　正規化特徴量０の通常の二進数表記は、０ｂ０００である。正規化特徴量１の通常の二進数表記は、０ｂ００１である。正規化特徴量２の通常の二進数表記は、０ｂ０１０である。正規化特徴量３の通常の二進数表記は、０ｂ０１１である。正規化特徴量４の通常の二進数表記は、０ｂ１００である。正規化特徴量０と正規化特徴量０，１，２，３，４との間で通常の減算を行うと、ユークリッド距離０，１，２，３，４が算出される。

　ここで、正規化特徴量に対して、ビット毎の排他的論理和を求める論理演算を行うと、ハミング距離が０，１，１，２，１と算出される。しかし、このハミング距離はユークリッド距離と一致しておらず、２つの正規化特徴量の間の距離を適切に表現していない。一方、バイナリ特徴量に対して、ビット毎の排他的論理和を求める論理演算を行うと、ハミング距離が０，１，２，３，４と算出される。このハミング距離はユークリッド距離と一致しており、２つの正規化特徴量の間の距離を適切に表現している。

　このように、論理演算を通じて算出されるハミング距離を利用することで、計算負荷の高い浮動小数点演算が削減される。また、特徴量をバイナリ特徴量に変換することで、ユークリッド距離と整合するハミング距離が算出される。よって、生体認証の計算速度と認証精度とのバランスを図ることができる。

　なお、認証装置１００は、データベースにバイナリ特徴ベクトルそのものを格納してもよいし、バイナリ特徴ベクトルを暗号化した暗号化バイナリ特徴ベクトルを格納してもよい。バイナリ特徴ベクトルを暗号化する場合、認証装置１００は、バイナリ特徴ベクトルとサイズが同じであり認証装置１００に固有の暗号ビット列を用意する。認証装置１００は、バイナリ特徴ベクトルと暗号ビット列の間で排他的論理和を算出することで、暗号ビット列によってバイナリ特徴ベクトルをマスクする。

　認証対象のバイナリ特徴ベクトルとテンプレートとを照合する際には、認証装置１００は、認証対象のバイナリ特徴ベクトルと上記の暗号ビット列との間で排他的論理和を算出することで、認証対象のバイナリ特徴ベクトルを暗号化する。認証装置１００は、２つの暗号化バイナリ特徴ベクトルの間でハミング距離を算出してスコアを算出する。排他的論理和およびハミング距離の性質上、暗号化バイナリ特徴ベクトルを復号しなくても、復号した場合と同じハミング距離が算出される。

　次に、認証装置１００が実行する１対Ｎ認証について説明する。認証装置１００は、入室許可を求めるユーザからユーザＩＤが提供されなくても、生体画像からユーザを識別することができる１対Ｎ認証を実行する。１対Ｎ認証では、データベースに複数のユーザのテンプレートが登録される。データベースに登録され得るテンプレートの個数は、１００個から１，０００，０００個のように幅広い。認証装置１００は、あるユーザのバイナリ特徴ベクトルとデータベースに登録された複数のテンプレートそれぞれとの間でスコアを算出して、類似度が十分に高いテンプレートを検索する。例えば、スコアが閾値を超えるテンプレートが存在する場合に認証成功と判定され、入室が許可されたユーザはスコアが最も高いテンプレートに対応するユーザであると判定される。

　データベースにＮ個のテンプレートが登録されている場合、認証装置１００は、照合処理をＮ回行うことも考えられる。しかし、バイナリ特徴ベクトルのビット長が数千ビットになる可能性もあり、Ｎ個のテンプレート全てに対して詳細な照合処理を行うことは負荷が大きい。そこで、認証装置１００は、前処理として、データベースに登録されたＮ個のテンプレートのうち照合対象のテンプレートを絞り込む絞り込み処理を行う。

　絞り込み処理では、認証装置１００は、バイナリ特徴ベクトルよりもサイズが小さい部分特徴ベクトルを使用する。認証装置１００は、バイナリ特徴ベクトルから一部のビットを抽出し、抽出されたビットから成る部分特徴ベクトルを生成する。部分特徴ベクトルを用いて算出されるスコアが良好なテンプレートが、バイナリ特徴ベクトルを用いて算出されるスコアも良好である可能性がある候補テンプレートになる。詳細な照合処理は、Ｎ個のテンプレートのうち候補テンプレートに対してのみ実行すればよい。

　部分特徴ベクトルのサイズは、所望の絞り込み率やテンプレート数Ｎに応じて決定される。部分特徴ベクトルのサイズが小さいほど、絞り込みの精度が低く、絞り込み後の候補テンプレートが多くなる一方、絞り込み処理自体の負荷が低い。部分特徴ベクトルのサイズが大きいほど、絞り込みの精度が高く、絞り込み後の候補テンプレートが少なくなる一方、絞り込み処理自体の負荷が高い。

　第２の実施の形態では、以下に説明するように、部分特徴ベクトルの次元数はバイナリ特徴ベクトルの次元数と同じである。部分特徴ベクトルの各次元の部分特徴量のビット長が、バイナリ特徴ベクトルの各次元のバイナリ特徴量よりも小さい。すなわち、認証装置１００は、バイナリ特徴ベクトルの各次元から一部のビットを抽出する。これにより、次元数を削減する場合よりも絞り込み処理の精度が向上する。

　図６は、バイナリ特徴ベクトルの部分データ化の例を示す図である。
　バイナリ特徴ベクトル１７１は、複数次元の要素として、バイナリ特徴量１７１－１，１７２－２，１７１－３などの複数のバイナリ特徴量を含む。バイナリ特徴量１７１－１，１７２－２，１７１－３それぞれのビット長は８である。バイナリ特徴量１７１－１は００１１１１１１であり、正規化特徴量６に相当する。バイナリ特徴量１７１－２は００００００１１であり、正規化特徴量２に相当する。バイナリ特徴量１７１－３は００００１１１１であり、正規化特徴量４に相当する。

　８ビットのバイナリ特徴量を１ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７２を生成する。部分特徴ベクトル１７２の圧縮率は８分の１である。部分特徴ベクトル１７２は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７２－１，１７２－２，１７２－３を含む。認証装置１００は、バイナリ特徴量１７１－１から１ビットを抽出して部分特徴量１７２－１を生成する。また、認証装置１００は、バイナリ特徴量１７１－２から１ビットを抽出して部分特徴量１７２－２を生成する。また、認証装置１００は、バイナリ特徴量１７１－３から１ビットを抽出して部分特徴量１７２－３を生成する。

　８ビットのバイナリ特徴量を２ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７３を生成する。部分特徴ベクトル１７３の圧縮率は４分の１である。部分特徴ベクトル１７３は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７３－１，１７３－２，１７３－３を含む。認証装置１００は、バイナリ特徴量１７１－１から２ビットを抽出して部分特徴量１７３－１を生成する。また、認証装置１００は、バイナリ特徴量１７１－２から２ビットを抽出して部分特徴量１７３－２を生成する。また、認証装置１００は、バイナリ特徴量１７１－３から２ビットを抽出して部分特徴量１７３－３を生成する。

　８ビットのバイナリ特徴量を４ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７４を生成する。部分特徴ベクトル１７４の圧縮率は２分の１である。部分特徴ベクトル１７４は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７４－１，１７４－２，１７４－３を含む。認証装置１００は、バイナリ特徴量１７１－１から４ビットを抽出して部分特徴量１７４－１を生成する。また、認証装置１００は、バイナリ特徴量１７１－２から４ビットを抽出して部分特徴量１７４－２を生成する。また、認証装置１００は、バイナリ特徴量１７１－３から４ビットを抽出して部分特徴量１７４－３を生成する。

　ここで、認証装置１００は、バイナリ特徴量から抽出されるビットを以下のように選択する。バイナリ特徴量をｋ分の１に圧縮する場合、認証装置１００は、均等にビットが抽出されるように、バイナリ特徴量のビット列をｋ個毎に分割し、連続するｋビット毎に１ビットを抽出する。ｋビットのうち抽出されるビットは、バイナリ特徴量の中心ビットを基準にして決定される。認証装置１００は、バイナリ特徴量の中心ビットを特定し、中心ビットが属するｋビットの中で中心ビットが存在する相対位置を特定する。認証装置１００は、連続するｋビット毎に、特定した相対位置のビットを抽出する。

　バイナリ特徴量のビット長が奇数である場合、中心ビットは１個に定まる。一方、バイナリ特徴量のビット長が偶数である場合、中心ビットの候補として、偶数番目のビットと奇数番目のビットの２つが存在する。例えば、８ビットのバイナリ特徴量の中心ビットは、ビット＃０，＃１，＃２，＃３，＃４，＃５，＃６，＃７のうち、ビット＃３またはビット＃４である。そこで、認証装置１００には、中心ビットが偶数ビットであるか奇数ビットであるかを示す偶奇フラグが設定される。偶奇フラグは、例えば、認証装置１００の管理者によって予め指定されるパラメータである。複数の認証装置が存在する場合、偶奇フラグは認証装置によって異なってもよい。

　図６の例は、中心ビットが偶数ビットである場合、すなわち、中心ビットがビット＃４である場合を示している。部分特徴ベクトル１７２では、８個のビットのうちビット＃４が選択される。よって、部分特徴量１７２－１，１７２－２，１７２－３は、それぞれバイナリ特徴量１７１－１，１７１－２，１７１－３のビット＃４に相当する。

　部分特徴ベクトル１７３では、８個のビットが４ビット×２個に分割され、連続する４ビットのうちビット＃４の位置に相当する最下位ビットが選択される。よって、部分特徴量１７３－１，１７３－２，１７３－３は、それぞれバイナリ特徴量１７１－１，１７１－２，１７１－３のビット＃０，＃４に相当する。

　部分特徴ベクトル１７４では、８個のビットが２ビット×４個に分割され、連続する２ビットのうちビット＃４の位置に相当する下位ビットが選択される。よって、部分特徴量１７４－１，１７４－２，１７４－３は、それぞれバイナリ特徴量１７１－１，１７１－２，１７１－３のビット＃０，＃２，＃４，＃６に相当する。

　このように、認証装置１００は、バイナリ特徴ベクトルのサイズを削減する場合、複数次元の要素それぞれから一部のビットを抽出する。抽出されるビットは、少なくとも中心ビットを含む。ここで、中心ビットを抽出する利点について説明する。

　図７は、選択ビットと部分特徴量の関係の例を示す図である。
　テーブル１４２は、正規化特徴量、バイナリ特徴量、ビット＃０を抽出した場合の部分特徴量およびビット＃１を抽出した場合の部分特徴量の関係を示す。テーブル１４２は、正規化特徴量の最大値が４であり、バイナリ特徴量のビット長が４であり、部分特徴量のビット長が１である場合を示している。

　中心ビットではないビット＃０が抽出された場合、正規化特徴量０，１，２，３，４に対応する部分特徴量は０，１，１，１，１となる。この場合、５個の正規化特徴量のうち１個の正規化特徴量が部分特徴量０に変換され、４個の正規化特徴量が部分特徴量１に変換される。よって、異なる部分特徴量の間で出現確率に大きな偏りが生じてしまう。一方、中心ビットであるビット＃１が抽出された場合、正規化特徴量０，１，２，３，４に対応する部分特徴量は０，０，１，１，１となる。この場合、５個の正規化特徴量のうち２個の正規化特徴量が部分特徴量０に変換され、３個の正規化特徴量が部分特徴量１に変換される。よって、異なる部分特徴量の間の出現確率の偏りが小さい。

　バイナリ特徴量から均等にビットを抽出することは、正規化特徴量の分解能を下げることに相当する。中心ビットを含むようにバイナリ特徴量からビットを抽出することで、異なるバイナリ特徴量の間の距離の関係をできる限り保存することができる。次に、中心ビットが偶数ビットであるか奇数ビットであるかの違いについて説明する。

　図８は、選択ビットの偶数奇数と部分特徴量の関係の例を示す図である。
　テーブル１４３は、正規化特徴量、バイナリ特徴量、中心ビットが偶数ビットである場合の部分特徴量および中心ビットが奇数ビットである場合の部分特徴量の関係を示す。テーブル１４３は、正規化特徴量の最大値が４であり、バイナリ特徴量のビット長が４であり、部分特徴量のビット長が２である場合を示している。

　中心ビットが偶数ビットである場合、バイナリ特徴量のビット＃０，＃１，＃２，＃３のうちビット＃０，＃２が抽出される。この場合、正規特徴量０，１，２，３，４が、それぞれ部分特徴量００，０１，０１，１１，１１に変換される。この部分特徴量は、正規化特徴量を２で割って余りを切り上げた整数に相当する。一方、中心ビットが奇数ビットである場合、ビット＃１，＃３が抽出される。この場合、正規特徴量０，１，２，３，４が、それぞれ部分特徴量００，００，０１，０１，１１に変換される。この部分特徴量は、正規化特徴量を２で割って余りを切り捨てた整数に相当する。

　このように、ビット長が偶数のバイナリ特徴量において、中心ビットとして偶数番目のビットを選択することは、剰余を切り上げることを意味する。一方、中心ビットとして奇数番目のビットを選択することは、剰余を切り捨てることを意味する。上記では、バイナリ特徴ベクトルの複数の次元に対して、共通の偶奇フラグを適用している。ただし、次元によって異なる偶奇フラグを適用することも可能である。

　図９は、バイナリ特徴ベクトルの部分データ化の他の例を示す図である。
　ここでは、認証装置１００は、中心ビットとして偶数番目の次元のバイナリ特徴量からは偶数ビットを選択し、奇数番目の次元のバイナリ特徴量からは奇数ビットを選択する。

　８ビットのバイナリ特徴量を１ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７５を生成する。部分特徴ベクトル１７５は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７５－１，１７５－２，１７５－３を含む。部分特徴量１７５－１，１７５－３は、それぞれバイナリ特徴量１７１－１，１７１－３のビット＃４に相当する。一方、部分特徴量１７５－２は、バイナリ特徴量１７１－２のビット＃３に相当する。

　８ビットのバイナリ特徴量を２ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７６を生成する。部分特徴ベクトル１７６は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７６－１，１７６－２，１７６－３を含む。部分特徴量１７６－１，１７６－３は、それぞれバイナリ特徴量１７１－１，１７１－３のビット＃０，＃４に相当する。一方、部分特徴量１７６－２は、バイナリ特徴量１７１－２のビット＃３，＃７に相当する。

　８ビットのバイナリ特徴量を４ビットの部分特徴量に圧縮する場合、認証装置１００は、バイナリ特徴ベクトル１７１から部分特徴ベクトル１７７を生成する。部分特徴ベクトル１７７は、バイナリ特徴量１７１－１，１７１－２，１７１－３に対応する部分特徴量１７７－１，１７７－２，１７７－３を含む。部分特徴量１７７－１，１７７－３は、それぞれバイナリ特徴量１７１－１，１７１－３のビット＃０，＃２，＃４，＃６に相当する。一方、部分特徴量１７７－２は、バイナリ特徴量１７１－２のビット＃１，＃３，＃５，＃７に相当する。このように、次元によって中心ビットを変更することで、剰余の処理方法の偏りに起因する精度低下を抑制することができる。

　なお、前述のように、データベースに登録されたバイナリ特徴ベクトルが暗号化されていることがある。その場合、認証装置１００は、暗号化バイナリ特徴ベクトルの各次元から上記の方法によってビットを抽出すればよい。また、前述のように、バイナリ特徴量において１のビットが端から順に並んでおらずシャッフルされていることがある。その場合、認証装置１００は、シャッフル前のビットの順序を基準にして抽出ビットを決定する。

　次に、部分特徴ベクトルを利用した絞り込み処理の制御について説明する。認証装置１００は、データベースに登録されたテンプレートが多い場合、絞り込み処理を行うことで生体認証の全体の処理時間を短縮することができる。また、認証装置１００は、異なるサイズの部分特徴ベクトルを用いて多段階の絞り込み処理を行うことで、生体認証の全体の処理時間を短縮することができる場合がある。そこで、認証装置１００は、テンプレート数Ｎに応じて絞り込み処理の段数ｎを決定する。また、認証装置１００は、絞り込み処理の段数ｎに応じて、各段における部分特徴量のビット長を決定する。

　なお、データベースに登録されたテンプレートの個数は、認証装置１００の運用期間中に変動する。よって、部分特徴ベクトルの要否や最適なビット長も変動する。このため、第２の実施の形態では、認証装置１００は、テンプレートに対応する部分特徴ベクトルを事前に作成せずに、認証時に動的に部分特徴ベクトルを生成する。

　以下、絞り込み処理の段数ｎおよび部分特徴量のビット長の決定方法を説明する。絞り込み処理および照合処理それぞれに対して、ワークロードｗ_ｉが割り当てられる。ワークロードは、テンプレート１個当たりの負荷を示す変数である。ワークロードは仕事量と呼ばれてもよい。ワークロードは、部分特徴量のビット長と比例する。ビット長が大きいほどワークロードが大きく、ビット長が小さいほどワークロードが小さい。第２の実施の形態では、ワークロードｗ_ｉはビット長そのものを示している。

　処理ｉ（絞り込み処理の何れかの段または照合処理）におけるテンプレート１個当たりの処理時間ｔ_ｉは、数式（１）に示すように、ワークロードｗ_ｉに比例する。数式（１）において、ｔは所定の係数である。また、処理ｉにおける絞り込み率α_ｉは、数式（２）に示すように、ワークロードｗ_ｉに反比例する。絞り込み率α_ｉは、処理ｉの直前のテンプレート数に対する処理ｉの直後のテンプレート数の割合である。ワークロードｗ_ｉが大きいほど絞り込み率α_ｉが小さく、ワークロードｗ_ｉが小さいほど絞り込み率α_ｉが大きい。数式（２）において、αは所定の係数である。

　絞り込み処理が１段である場合、絞り込み処理と照合処理を含む全体の処理時間Ｔ_１は、数式（３）のように算出される。数式（３）において、ｗ_ｐは絞り込み処理のワークロード、ｗ_ｍは照合処理のワークロード、ｔ_ｐは絞り込み処理の単位処理時間、ｔ_ｍは照合処理の単位処理時間、α_ｐは絞り込み処理の絞り込み率、Ｎはデータベースに登録されたテンプレートの個数を示す。処理時間Ｔ_１が最小になるようにワークロードｗ_ｐを最適化すると、最小処理時間ＭｉｎＴ_１は数式（４）のように算出される。数式（４）の右辺第１項は絞り込み処理の処理時間であり、右辺第２項は照合処理の処理時間である。結果的に、絞り込み処理の処理時間と照合処理の処理時間が同じになる。

　同様にして、絞り込み処理が２段である場合、最小処理時間ＭｉｎＴ_２は数式（５）のように算出される。数式（５）の右辺第１項は絞り込み処理の１段目の処理時間であり、右辺第２項は絞り込み処理の２段目の処理時間であり、右辺第３項は照合処理の処理時間である。結果的に、絞り込み処理の各段の処理時間と照合処理の処理時間が同じになる。このように、絞り込み処理の各段および照合処理の処理時間を均等にすることで、絞り込み処理と照合処理を含む全体の処理時間が最小化される。

　認証装置１００は、絞り込み処理の段数ｎを、数式（６）の制約条件を満たす最小のｎに決定する。ｎは０，１，２，…という非負整数である。数式（６）において、α／ｗ_ｍは照合処理の精度に相当し、予め設定される。例えば、α／ｗ_ｍ＝１０^－６（１００万分の１）である。その場合、Ｎ≧１０，０００のときにｎ≧２となる。認証装置１００は、テンプレート数Ｎと最適な段数ｎの対応関係を規定したテーブルを保持していてもよい。

　段数ｎが決定されると、認証装置１００は、絞り込み処理の各段および照合処理の処理時間が均等になるように、数式（７）に従って絞り込み処理の各段のワークロードｗ_ｐｉを決定する。ここで、絞り込み処理の前のワークロードｗ_ｐ０を数式（８）のように規定しておく。数式（８）は、絞り込み処理の前の絞り込み率α_ｐ０が１であることを示している。これにより、ワークロードｗ_ｐｉからワークロードｗ_ｐｉ＋１が順に算出される。よって、絞り込み処理の各段で用いる部分特徴量のビット長が決定される。

　次に、認証装置１００の機能および処理手順について説明する。
　図１０は、認証装置の機能例を示すブロック図である。
　認証装置１００は、全体制御部１２１、データベース１２２、バッファメモリ１２３、特徴抽出部１２４、部分データ生成部１２５、照合部１２６および絞り込み部１３０を有する。データベース１２２は、例えば、フラッシュメモリ１０３を用いて実装される。バッファメモリ１２３は、例えば、ＲＡＭ１０２を用いて実装される。

　全体制御部１２１、特徴抽出部１２４、部分データ生成部１２５、照合部１２６および絞り込み部１３０は、例えば、ＣＰＵ１０１を用いて実装される。ただし、全体制御部１２１、特徴抽出部１２４、部分データ生成部１２５、照合部１２６および絞り込み部１３０が、異なるプロセッサに対応してもよい。また、全体制御部１２１、特徴抽出部１２４、部分データ生成部１２５、照合部１２６および絞り込み部１３０の一部または全部が、ＡＳＩＣやＦＰＧＡなどの専用ハードウェアを用いて実装されてもよい。

　全体制御部１２１は、登録用の生体画像を受け付け、データベース１２２へのテンプレートの登録を制御する。また、全体制御部１２１は、認証用の生体画像を受け付け、データベース１２２に対する絞り込み処理および照合処理を制御する。データベース１２２は、複数のユーザについてユーザＩＤとテンプレートとを対応付けて記憶する。テンプレートは、バイナリ特徴ベクトルまたは暗号化バイナリ特徴ベクトルを含む。バッファメモリ１２３は、処理中のデータを一時的に記憶する。

　特徴抽出部１２４は、全体制御部１２１からの指示に応じて、生体画像を分析して特徴ベクトルを生成する。例えば、特徴抽出部１２４は、パターンマッチングにより生体画像から特徴点を抽出し、特徴点を含む画像領域に対して主成分分析を行う。特徴抽出部１２４は、特徴ベクトルを正規化して正規化特徴ベクトルを生成し、正規化特徴ベクトルをバイナリ化してバイナリ特徴ベクトルを生成する。特徴抽出部１２４は、特徴量と正規化特徴量との対応関係を示すテーブルを保持してもよい。また、特徴抽出部１２４は、バイナリ特徴ベクトルを暗号化してもよい。

　部分データ生成部１２５は、全体制御部１２１からの指示に応じて、特徴抽出部１２４が生成したバイナリ特徴ベクトルまたは暗号化バイナリ特徴ベクトルから、各次元の一部ビットを抽出して部分特徴ベクトルを生成する。また、部分データ生成部１２５は、データベース１２２に登録されたテンプレートに含まれるバイナリ特徴ベクトルまたは暗号化バイナリ特徴ベクトルから部分特徴ベクトルを生成する。部分特徴ベクトルに含まれる各部分特徴量のビット長の情報は、絞り込み部１３０から与えられる。

　照合部１２６は、全体制御部１２１からの指示に応じて、特徴抽出部１２４が生成したバイナリ特徴ベクトルまたは暗号化バイナリ特徴ベクトルと、データベース１２２に登録されたテンプレートそれぞれとを照合してスコアを算出する。ただし、絞り込み部１３０が絞り込み処理を行った場合、絞り込まれたテンプレートのみ照合処理を行えばよい。照合部１２６は、スコアに基づいて認証成功または認証失敗を判定する。認証成功と判定した場合、照合部１２６は、ドア制御装置３２に対してドアを開くよう指示する。

　絞り込み部１３０は、全体制御部１２１からの指示に応じて、データベース１２２に登録されたテンプレートに対して絞り込み処理を行う。絞り込み部１３０は、スコア算出部１３１、設定部１３２および設定記憶部１３３を有する。

　スコア算出部１３１は、部分データ生成部１２５が生成した認証対象の部分特徴ベクトルとテンプレートの部分特徴ベクトルとの間でハミング距離を算出し、ハミング距離に基づいてテンプレートの仮スコアを算出する。スコア算出部１３１は、仮スコアを用いて、照合部１２６の照合処理に成功する可能性がある候補テンプレートを選択する。

　設定部１３２は、データベース１２２のテンプレート数Ｎを監視し、テンプレート数Ｎに応じて、絞り込み処理の最適な段数ｎと、絞り込み処理で用いる部分特徴量のビット長とを決定する。設定部１３２は、定期的に設定処理を行ってもよいし、データベース１２２のテンプレート数Ｎが変化したときに設定処理を行ってもよい。設定記憶部１３３は、設定部１３２によって生成された設定情報を記憶する。部分特徴量のビット長の情報は、絞り込み部１３０から部分データ生成部１２５に提供される。

　図１１は、テンプレートテーブルと設定テーブルの例を示す図である。
　テンプレートテーブル１４４は、データベース１２２に記憶される。テンプレートテーブル１４４は、複数のユーザそれぞれについてユーザＩＤとバイナリ特徴ベクトルとを対応付けて記憶する。説明を簡単にするため、図１１では１つのユーザＩＤに対して１つのバイナリ特徴ベクトルが対応付けられているが、１つのユーザＩＤに対して、複数の特徴点を示す複数のバイナリ特徴ベクトルが対応付けられていてもよい。また、テンプレートテーブル１４４に含まれるバイナリ特徴ベクトルは、暗号化されていてもよい。

　設定テーブル１４５は、設定記憶部１３３に記憶される。設定テーブル１４５は、テンプレート数Ｎ、絞り込み段数ｎ、絞り込み処理の各段のワークロードｗおよび偶奇フラグｆを含む。テンプレート数Ｎは、データベース１２２に登録されたテンプレートの個数であり、設定部１３２によって監視される。絞り込み段数ｎおよび各段のワークロードｗは、設定部１３２によって決定される。第２の実施の形態では、ワークロードｗは、部分特徴量のビット長そのものである。ただし、ワークロードｗがビット長そのものを表していない場合、設定部１３２は、ワークロードｗとビット長との関係を示すテーブルを保持していてもよい。偶奇フラグは、認証装置１００の管理者によって指定される。

　図１２は、テンプレート登録の手順例を示すフローチャートである。
　（Ｓ１０）全体制御部１２１は、センサデバイス１１０から生体画像を読み取る。
　（Ｓ１１）特徴抽出部１２４は、生体画像から特徴点を検出し、検出した特徴点を含む画像領域に対して主成分分析を行って特徴ベクトルを算出する。

　（Ｓ１２）特徴抽出部１２４は、特徴ベクトルの各次元の特徴量を、予め学習された確率分布に応じて正規化し、正規化特徴ベクトルを生成する。
　（Ｓ１３）特徴抽出部１２４は、正規化特徴ベクトルの各次元の正規化特徴量を、１のビットの個数を調整してバイナリ化し、バイナリ特徴ベクトルを生成する。

　（Ｓ１４）全体制御部１２１は、バイナリ特徴ベクトルを含むテンプレートを、ユーザＩＤを付与した上でデータベース１２２に登録する。
　図１３は、絞り込み設定の手順例を示すフローチャートである。

　（Ｓ２０）設定部１３２は、データベース１２２からテンプレート数Ｎを検出する。
　（Ｓ２１）設定部１３２は、ステップＳ２０で検出した最新のテンプレート数Ｎが、設定テーブル１４５に登録されたテンプレート数Ｎから変化しているか判断する。Ｎが変化した場合は処理がステップＳ２２に進み、変化していない場合は処理が終了する。

　（Ｓ２２）設定部１３２は、最新のテンプレート数Ｎに応じた絞り込み段数ｎを決定する。例えば、Ｎが１０，０００以上のときｎが２以上である。
　（Ｓ２３）設定部１３２は、バイナリ特徴量のビット長とステップＳ２２で決定した絞り込み段数ｎから、絞り込み処理の各段のビット長を示すワークロードｗを決定する。

　（Ｓ２４）設定部１３２は、テンプレート数Ｎ、絞り込み段数ｎおよび各段のワークロードｗを示す設定情報を、設定テーブル１４５に保存する。
　図１４は、ユーザ認証の手順例を示すフローチャートである。

　（Ｓ３０）全体制御部１２１は、センサデバイス１１０から生体画像を読み取る。
　（Ｓ３１）特徴抽出部１２４は、生体画像から特徴点を検出し、検出した特徴点を含む画像領域に対して主成分分析を行って特徴ベクトルを算出する。

　（Ｓ３２）特徴抽出部１２４は、特徴ベクトルの各次元の特徴量を正規化し、正規化特徴量をバイナリ化して、バイナリ特徴ベクトルを生成する。
　（Ｓ３３）絞り込み部１３０は、照合処理に進む前に絞り込み処理を一段階行うか、すなわち、未実行の絞り込み処理が残っているか判断する。絞り込み処理を一段階行う場合は処理がステップＳ３４に進み、行わない場合は処理がステップＳ３８に進む。

　（Ｓ３４）部分データ生成部１２５は、バイナリ特徴量のビット長に基づいて、バイナリ特徴量の中心ビットを特定する。バイナリ特徴量のビット長が偶数である場合、部分データ生成部１２５は、偶奇フラグに応じて、偶数番目のビットまたは奇数番目のビットを選択する。部分データ生成部１２５は、今回の絞り込み処理に対して設定された部分特徴量のビット長に基づいて、中心ビットを含む選択ビットを決定する。

　（Ｓ３５）部分データ生成部１２５は、ステップＳ３２で生成されたバイナリ特徴ベクトルを、各次元からステップＳ３４の選択ビットを抽出することで部分データ化し、対象バイナリ特徴ベクトルの部分特徴ベクトルを生成する。また、部分データ生成部１２５は、残っている候補テンプレートそれぞれに含まれるバイナリ特徴ベクトルを同様に部分データ化し、テンプレートの部分特徴ベクトルを生成する。

　（Ｓ３６）スコア算出部１３１は、部分特徴ベクトル同士でハミング距離を算出することで、残っている候補テンプレートそれぞれのスコアを算出する。
　（Ｓ３７）スコア算出部１３１は、ステップＳ３６で算出されたスコアに基づいて候補テンプレートを絞り込む。例えば、スコア算出部１３１は、スコアが閾値を超える候補テンプレートを選択する。また、例えば、スコア算出部１３１は、今回の絞り込み処理において出力することが期待される個数の候補テンプレートを、スコアの高い方から優先的に選択する。そして、処理がステップＳ３３に戻る。

　（Ｓ３８）照合部１２６は、ステップＳ３２で生成されたバイナリ特徴ベクトルと、残った候補テンプレートに含まれるバイナリ特徴ベクトルの間でハミング距離を算出することで、残った候補テンプレートそれぞれのスコアを算出する。

　（Ｓ３９）照合部１２６は、ステップＳ３８で算出されたスコアに基づいて、ステップＳ３０の生体画像とマッチするテンプレートの有無を判定する。例えば、照合部１２６は、スコアが最も高いテンプレートを選択し、当該スコアが閾値を超えるか判定する。生体画像とマッチするテンプレートが存在する場合、照合部１２６は、生体画像の人物と当該テンプレートの人物が同一であるとみなし、認証成功と判断する。生体画像とマッチするテンプレートが存在しない場合、照合部１２６は、生体画像の人物がデータベース１２２に登録されていないとみなし、認証失敗と判断する。

　（Ｓ４０）照合部１２６は、ステップＳ３９の判定結果に応じて、ドア制御装置３２に制御信号を送信してドアの開閉を制御する。照合部１２６は、認証成功の場合はドアのロックを解除し、認証失敗の場合はドアのロックを維持する。

　第２の実施の形態の認証装置１００によれば、１対Ｎ認証が行われる。よって、ユーザはユーザＩＤを入力しなくても、手のひらをかざすなどの生体情報の提示によって認証を受けることができ、ユーザの利便性が向上する。また、照合処理の前処理として、データベースに対して部分データを用いた絞り込み処理が行われる。よって、データベースに多数のテンプレートが登録されていても、計算量が削減され生体認証が高速化される。また、性能の制約が大きい組み込み用ハードウェアを利用することが可能となる。

　また、生体画像から生成される特徴ベクトルに対して正規化およびバイナリ化が行われ、バイナリ特徴ベクトル同士のハミング距離によって類似度が評価される。よって、浮動小数点演算よりも高速な論理演算によって類似度を判定することができ、絞り込み処理および照合処理が高速化される。特に、組み込み用プロセッサでも、絞り込み処理および照合処理を高速に実行できる。また、バイナリ特徴量は、正規化特徴量に相当する個数の１のビットを含む。よって、ハミング距離がユークリッド距離と一致し、ハミング距離を利用することによる精度の低下が抑制される。また、特徴量が、特徴量の確率分布に基づいて、各正規化特徴量の出現確率が均等になるように正規化される。よって、特徴の違いをできる限りハミング距離に反映させることができ、情報の欠落が抑制される。

　また、絞り込み処理に用いられる部分特徴ベクトルは、バイナリ特徴ベクトルの各次元から一部のビットを抽出することで生成される。部分特徴ベクトルの次元数は、バイナリ特徴ベクトルと同じである。また、絞り込み処理で扱う特徴点の個数は、照合処理で扱う特徴点の個数と同じである。よって、次元数を削減する方法や特徴点を削減する方法と比べて、情報の欠落が抑制されて精度の低下が抑制される。

　また、データベースには、バイナリ特徴ベクトルを暗号化して登録することが可能である。よって、ユーザの生体情報が漏洩するリスクが低減する。また、絞り込み処理および照合処理は、バイナリ特徴ベクトルを復号せずに実行することが可能である。よって、生体認証が高速化されると共に、セキュリティが向上する。

　［第３の実施の形態］
　次に、第３の実施の形態を説明する。第２の実施の形態との違いを中心に説明し、第２の実施の形態と同様の内容については説明を省略することがある。第２の実施の形態の認証装置１００は、１対Ｎ認証によって入室管理を行うものである。これに対し、第３の実施の形態の認証装置１００ａは、特定の部屋の入室管理を厳格化するため、１対Ｎ認証に加えて、ＩＣ（Integrated Circuit）カードを利用した１対１認証を併用する。

　図１５は、第３の実施の形態の情報処理システムの例を示す図である。
　認証装置１００ａは、第２の実施の形態の認証装置１００と同様のハードウェアを有する。認証装置１００ａには、ドア制御装置３２に加えて、ＩＣカードリーダ３３が接続されている。ＩＣカードリーダ３３は、ＩＣカード３４に記録されたデータを読み出し、読み出したデータを認証装置１００ａに送信する。

　セキュリティレベルが高い特定の部屋への入室が許可されたユーザには、ＩＣカード３４が配布される。ユーザは入室時に、センサデバイス１１０に手のひらをかざすと共に、携帯しているＩＣカード３４をＩＣカードリーダ３３にかざす。ＩＣカード３４には、そのユーザの生体画像から生成されたテンプレートが予め書き込まれている。

　認証装置１００ａは、入室時にセンサデバイス１１０が生成した生体画像とＩＣカードリーダ３３が読み出したテンプレートとを用いて、１対１認証を行う。このとき、認証装置１００ａは、データベースに登録された多数のテンプレートに対する絞り込み処理や照合処理を行わなくてよい。認証装置１００ａは、生体画像の特徴がＩＣカード３４に記録されたテンプレートとマッチすれば認証成功と判定し、マッチしなければ認証失敗と判定する。例えば、認証装置１００ａは、ＩＣカード３４に記録されたテンプレートのスコアを算出し、スコアが閾値を超えれば認証成功と判定する。

　ただし、ＩＣカード３４の記憶容量は小さいため、ＩＣカード３４は、生体画像から生成されるバイナリ特徴ベクトルの全体を記憶することができない場合がある。そこで、ＩＣカード３４は、バイナリ特徴ベクトルに代えて、第２の実施の形態で説明した部分特徴ベクトルを記憶する。この部分特徴ベクトルは、暗号化されていてもよい。部分特徴ベクトルの各次元のビット長は、ＩＣカード３４の記憶容量を考慮して予め決定される。

　認証装置１００ａは、ＩＣカードリーダ３３から部分特徴ベクトルを受信する。また、認証装置１００ａは、センサデバイス１１０を用いて生体画像を生成する。認証装置１００ａは、生体画像から特徴ベクトルを生成し、特徴ベクトルに対して正規化およびバイナリ化を行ってバイナリ特徴ベクトルを生成する。更に、認証装置１００ａは、バイナリ特徴ベクトルから、第２の実施の形態で説明した方法を用いて部分特徴ベクトルを生成する。ただし、各次元のビット長はテンプレートに合わせればよい。認証装置１００ａは、２つの部分特徴ベクトルの間でハミング距離を算出し、ハミング距離に基づいてスコアを算出する。認証装置１００ａは、スコアに基づいて認証の成否を判定する。

　第３の実施の形態の認証装置１００ａによれば、第２の実施の形態の認証装置１００と同様の効果が得られる。更に、認証装置１００ａによれば、ＩＣカードを利用した１対１認証が行われる。よって、入室管理を厳格化してセキュリティを向上させることができる。また、ＩＣカードには部分特徴ベクトルが記憶される。よって、データベースに登録されるバイナリ特徴ベクトルのサイズが大きい場合や、ＩＣカードの記憶容量が小さい場合であっても、ＩＣカードを利用した１対１認証が可能となる。

　上記については単に本発明の原理を示すものである。更に、多数の変形や変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応する全ての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１０　情報処理装置
　１１　記憶部
　１２　処理部
　１３　生体画像
　１４　特徴データ
　１４ａ　特徴量
　１５　正規化特徴データ
　１５ａ　正規化特徴量
　１６　バイナリ特徴データ
　１６ａ　ビット列
　１７　部分特徴データ
　１７ａ　部分ビット列

Claims

　コンピュータが、
　生体画像から、複数の特徴量を含む特徴データを算出し、
　前記特徴データに含まれる前記複数の特徴量それぞれを、特徴量がとり得る値の出現確率を示す確率分布に基づいて、複数段階の離散値をとる正規化特徴量に正規化し、
　前記正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、前記正規化特徴量それぞれをビット列に変換して、前記複数の特徴量に対応する複数のビット列を含むバイナリ特徴データを生成し、
　前記バイナリ特徴データに含まれる前記複数のビット列それぞれから一部のビットを抽出して、前記複数のビット列に対応する複数の部分ビット列を含んでおり前記バイナリ特徴データよりもビット長が小さい部分特徴データを生成する、
　データ生成方法。
　前記部分特徴データの生成では、前記複数のビット列それぞれから、当該ビット列のビット長に応じて決定される位置のビットを抽出する、
　請求項１記載のデータ生成方法。
　前記部分特徴データの生成では、前記複数のビット列それぞれから、当該ビット列の中心ビットを含むように前記一部のビットを抽出する、
　請求項１記載のデータ生成方法。
　前記ビット列のビット長が偶数である場合、前記中心ビットは、前記ビット列の中心で隣接する偶数番目のビットと奇数番目のビットの何れか一方であり、
　前記部分特徴データの生成では、前記複数のビット列のうちの一部のビット列から前記偶数番目のビットを抽出し、他のビット列から前記奇数番目のビットを抽出する、
　請求項３記載のデータ生成方法。
　前記コンピュータが更に、
　データベースに登録された他のバイナリ特徴データを読み出し、
　前記他のバイナリ特徴データから前記一部のビットに対応するビットを抽出して、前記他のバイナリ特徴データよりもビット長が小さい他の部分特徴データを生成し、
　前記部分特徴データと前記他の部分特徴データとの間のハミング距離に基づいて、前記バイナリ特徴データと前記他のバイナリ特徴データとがマッチするか否かを予測する、
　請求項１記載のデータ生成方法。
　生体画像から算出された複数の特徴量を含む特徴データを記憶する記憶部と、
　前記特徴データに含まれる前記複数の特徴量それぞれを、特徴量がとり得る値の出現確率を示す確率分布に基づいて、複数段階の離散値をとる正規化特徴量に正規化し、前記正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、前記正規化特徴量それぞれをビット列に変換して、前記複数の特徴量に対応する複数のビット列を含むバイナリ特徴データを生成し、前記バイナリ特徴データに含まれる前記複数のビット列それぞれから一部のビットを抽出して、前記複数のビット列に対応する複数の部分ビット列を含んでおり前記バイナリ特徴データよりもビット長が小さい部分特徴データを生成する処理部と、
　を有する情報処理装置。
　コンピュータに、
　生体画像から、複数の特徴量を含む特徴データを算出し、
　前記特徴データに含まれる前記複数の特徴量それぞれを、特徴量がとり得る値の出現確率を示す確率分布に基づいて、複数段階の離散値をとる正規化特徴量に正規化し、
　前記正規化特徴量が大きいほど二値のうちの特定の一方の値をとるビットの個数が大きくなるように、前記正規化特徴量それぞれをビット列に変換して、前記複数の特徴量に対応する複数のビット列を含むバイナリ特徴データを生成し、
　前記バイナリ特徴データに含まれる前記複数のビット列それぞれから一部のビットを抽出して、前記複数のビット列に対応する複数の部分ビット列を含んでおり前記バイナリ特徴データよりもビット長が小さい部分特徴データを生成する、
　処理を実行させるデータ生成プログラム。