JP7231879B2

JP7231879B2 - 制御方法、制御プログラムおよび情報処理装置

Info

Publication number: JP7231879B2
Application number: JP2022504800A
Authority: JP
Inventors: 秀継内田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-03-03
Filing date: 2020-03-03
Publication date: 2023-03-02
Anticipated expiration: 2040-03-03
Also published as: WO2021176544A1; EP4116928A4; CN115136187A; JPWO2021176544A1; US20220383458A1; EP4116928A1

Description

本発明は制御方法、制御プログラムおよび情報処理装置に関する。

現在、人物の認証に生体情報が利用されることがある。生体情報は、人間の身体的特徴または行動的特徴を示す情報である。身体的特徴としては、例えば、指紋、静脈、虹彩、顔などが挙げられる。行動的特徴としては、例えば、筆跡などが挙げられる。

例えば、機械学習モデルによる物体認識を行うシステムの提案がある。提案のシステムでは機械学習モデルは、オンライントレーニングの最中に観察される物体の１以上の例から、分類器のためのオフライントレーニングの最中に確立される所定の決定境界までの距離を決定し、距離の関数として決定ルールを更新するように構成される。また、機械学習モデルは、更新された決定ルールに基づいて、将来例を分類するように構成される。

国際公開第２０１６／１４４５２３号

情報処理装置により、ある人物に対してセンサなどにより取得された複数の撮影データから当該人物に対応する代表データを作成し、当該代表データに基づいて人物の認証を行うことがある。しかし、各撮影データには、センサによるセンシング条件に応じたノイズが混入し得る。このため、各撮影データに混入したノイズの影響により、人物の特徴が代表データに適切に反映されないことがある。人物の特徴が代表データに適切に反映されていないと、代表データに基づく人物の認証精度が低下する。

１つの側面では、本発明は、認証精度を向上できる制御方法、制御プログラムおよび情報処理装置を提供することを目的とする。

１つの態様では、制御方法が提供される。この制御方法では、コンピュータが、人物の複数の撮影データを受け付け、複数の撮影データそれぞれの品質と、複数の撮影データの数とに基づき、複数の撮影データそれぞれに適用する重みを示す重み情報を生成し、複数の撮影データから複数の撮影データを代表する代表データを算出する際に、生成した重み情報が示す重みが小さい程、代表データの算出結果への複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する。

また、１つの態様では、制御プログラムが提供される。
また、１つの態様では、情報処理装置が提供される。

１つの側面では、認証精度を向上できる。
本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態の情報処理装置の処理例を示す図である。第２の実施の形態の情報処理システムの例を示す図である。サーバのハードウェア例を示す図である。サーバの機能例を示す図である。学習データテーブルの例を示す図である。人物代表データテーブルの例を示す図である。クラスタ代表データテーブルの例を示す図である。人物代表ベクトル生成の例を示すフローチャートである。クラスタ代表ベクトル生成の例を示すフローチャートである。認証の例を示すフローチャートである。第３の実施の形態の人物代表ベクトル生成の例を示すフローチャートである。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理装置の処理例を示す図である。
情報処理装置１０は、人物の認証に用いられる人物ごとの代表データを生成する。代表データは、人物の生体的特徴を撮影した撮影データに基づいて生成される。生体的特徴は、人物の身体的特徴や行動的特徴を含む。身体的特徴としては、例えば指紋、静脈、虹彩、顔などが挙げられる。行動的特徴としては、例えば、筆跡などが挙げられる。代表データは、人物登録時に、当該人物に対して取得された複数の撮影データに基づいて生成される。撮影データは、例えば赤外光や可視光などを用いて撮影するカメラなどのセンサにより取得される画像である。

情報処理装置１０は、記憶部１１および処理部１２を有する。
記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性記憶装置でもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性記憶装置でもよい。処理部１２は、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）などを含み得る。処理部１２はプログラムを実行するプロセッサであってもよい。ここでいう「プロセッサ」には、複数のプロセッサの集合（マルチプロセッサ）も含まれ得る。

記憶部１１は、処理部１２の処理に用いられる情報を記憶する。記憶部１１は、センサにより予め撮影された人物の複数の撮影データ、および、複数の撮影データに対応する複数の品質情報を記憶する。品質情報は、各撮影データの品質を示す指標値を含む。

ここで、撮影データの品質は、撮影データのセンシング条件に応じて異なる。撮影データの品質に影響を及ぼす要素には、例えば、顔画像であれば、撮影時のブレ、照明の当たり具合およびカメラなどのレンズが向けられた撮影方向に対する顔の傾き（例えば、横を向いているなど）などが考えられる。よって、顔画像を対象にする場合、品質を示す指標値は、例えば、顔の特徴点（目、鼻、口など）の座標データから推定される、撮影方向に対する顔の傾きの大きさや、座標間での照明変動の大きさおよびブラーの大きさなどでもよい。品質を示す指標値が大きい、すなわち品質が良い程、撮影データにおけるノイズの影響は小さい。品質を示す指標値が小さい、すなわち品質が悪い程、撮影データにおけるノイズの影響は大きい。

品質情報は、各撮影データに対応付けて取得され、記憶部１１に予め格納される。品質情報は、各撮影データに対して、処理部１２により生成されて記憶部１１に格納されてもよい。また、記憶部１１は、処理部１２により生成された撮影データごとの重み情報や、人物の代表データを記憶する。

処理部１２は、人物の複数の撮影データを受け付け、複数の撮影データそれぞれの品質と、複数の撮影データの数とに基づき、複数の撮影データそれぞれに適用する重みを示す重み情報を生成する。

処理部１２は、複数の撮影データから複数の撮影データを代表する代表データを算出する際に、生成した重み情報が示す重みが小さい程、代表データの算出結果への複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する。

ここで、記憶部１１には、ある人物に対して撮影データ群２０および撮影データ群２０に対応する品質情報群３０が記憶されているとする。例えば、撮影データ２１は、撮影データ群２０に含まれる撮影データである。例えば、品質情報３１は、品質情報群３０に含まれる、撮影データ２１に対応する品質を示す指標値である。

処理部１２は、撮影データ群２０に対して重み情報群４０を生成する。例えば、重み情報４１は、撮影データ２１に対応する重みを示す情報である。処理部１２は、次のように重み情報群４０を生成する。

第１の例では、処理部１２は、ある人物の複数の撮影データの数を閾値と比較し、比較に応じて、人物ごとに重みの算出方法を選択する。ある人物の複数の撮影データの数が閾値以上の場合、処理部１２は、当該人物の複数の撮影データそれぞれの重みを同じにする。代表データを生成する際、サンプル数が多い程、ノイズの影響が軽減されるからである。

一方、ある人物の複数の撮影データの数が閾値よりも小さい場合、処理部１２は、撮影データの品質が良い程、当該撮影データの重みを大きくする。また、処理部１２は、撮影データの品質が悪い程、当該撮影データの重みを小さくする。品質が良い程、ノイズの影響が小さいので、該当の人物の特徴が撮影データに適切に反映されている可能性が高いからである。

このとき、処理部１２は、当該複数の撮影データの数の閾値に対する比率Ｒ１に応じて、重みへの品質の影響の大きさを決定してもよい。例えば、処理部１２は、比率Ｒ１が大きい程、重みへの品質の影響を小さく、比率Ｒ１が小さい程、重みへの品質の影響を大きくすることが考えられる。比率Ｒ１が小さい程、該当の人物の代表データがノイズの影響を受け易くなるからである。

あるいは、処理部１２は、当該複数の撮影データの数に対する、当該複数の撮影データのうち所定の品質よりも悪い品質の撮影データの数の比率Ｒ２に応じて、重みへの品質の影響の大きさを決定してもよい。例えば、処理部１２は、比率Ｒ２が小さい程、重みへの品質の影響を小さくし、比率Ｒ２が大きい程、重みへの品質の影響を大きくすることも考えられる。比率Ｒ２が大きい程、該当の人物の代表データがノイズの影響を受け易くなるからである。

第１の例の場合、例えば処理部１２は、該当の人物の各撮影データの特徴を示す特徴ベクトルを当該撮影データの重みにより重み付け平均したベクトルを、当該人物の代表データ５０とする。すると、重み情報が示す重みが小さい程、代表データ５０の算出結果への当該撮影データの影響が小さくなる。

第２の例では、処理部１２は、撮影データの特徴量と、品質を示す指標値との回帰モデルを用いて、特徴量に含まれるノイズ成分を推定する。ここで、特徴量は、撮影データの特徴ベクトルの１つの要素である。また、この場合の品質は、複数の指標値を持つベクトルで表される。回帰モデルは、例えば、複数の人物に対して得られた複数の撮影データに基づいて生成されてもよいし、該当の人物の複数の撮影データに基づいて生成されてもよい。回帰モデルの生成では、該当の人物の複数の撮影データの数が用いられる。

処理部１２は、推定されたノイズ成分を特徴量から引くことで、当該撮影データに対応する重み、あるいは、重み付け特徴量を、当該撮影データの特徴ベクトルの要素ごとに算出する。すなわち、第２の例では、撮影データに対応する重み、あるいは、重み付け特徴量がベクトル（重みベクトルまたは重み付け特徴ベクトルと呼ぶ）として得られる。この場合、処理部１２は、例えば、該当の人物の各撮影データに対して得られた重み付け特徴ベクトルを平均したベクトルを、当該人物の代表データ５０とする。すると、重み付け特徴ベクトルのうち、値の大きな要素程、重みが大きい、すなわちノイズの影響が小さい成分であり、当該要素に対応する代表データ５０の要素への影響が大きくなる。また、重み付け特徴ベクトルのうち、値の小さな要素程、重みが小さい、すなわちノイズの影響が大きい成分であり、当該要素に対応する代表データ５０の要素への影響が小さくなる。

情報処理装置１０によれば、人物の複数の撮影データが受け付けられる。複数の撮影データそれぞれの品質と、複数の撮影データの数とに基づき、複数の撮影データそれぞれに適用する重みを示す重み情報が生成される。複数の撮影データから複数の撮影データを代表する代表データが算出される際に、生成した重み情報が示す重みが小さい程、代表データの算出結果への複数の撮影データそれぞれの影響が小さくなるアルゴリズムが適用される。

これにより、認証精度を向上できる。
ここで、代表データの生成に用いられる各撮影データには、センサによるセンシング条件に応じたノイズが混入し得る。このため、各撮影データに混入したノイズの影響により、人物の特徴が代表データに適切に反映されないことがある。人物の特徴が代表データに適切に反映されていないと、代表データに基づく人物の認証精度が低下する。ノイズの影響が比較的大きな撮影データを、代表データの学習用のサンプルから排除することも考えられるが、サンプル数は代表データの精度に影響を与えるため、可能な限りサンプル数を維持することが好ましい。

そこで、情報処理装置１０は、撮影データごとの品質と複数の撮影データの数とに基づく、撮影データごとの重みを求め、当該重みに応じて、各撮影データの代表データに対する影響を調整する。すなわち、情報処理装置１０は、ノイズの影響が小さいと推定される撮影データの特徴ベクトルあるいは特徴量については、当該特徴ベクトルあるいは特徴量に近づくように代表データを算出する。これにより、ノイズの影響を軽減しつつ、データ量を活かした代表データの生成を行える。その結果、人物の生体的特徴を代表データに適切に反映させることができ、代表データに基づく人物の認証精度を向上できる。

例えば、情報処理装置１０は、ある人物を認証する際に、当該人物に対して取得された撮影データの特徴ベクトルと、記憶部１１に記憶された各人物の代表データとを照合することで、当該人物の認証を適切に行える。

また、情報処理装置１０は、複数の人物の複数の代表データに基づいて、各代表データをＫ－ｍｅａｎｓ法（Ｋ平均法）などのクラスタリング手法により複数のクラスタに分類し、各クラスタのクラスタ代表データを求めておいてもよい。この場合、情報処理装置１０は、ある人物を認証する際に、当該人物に対して取得された撮影データの特徴ベクトルと、クラスタ代表データとの照合により、当該特徴ベクトルと照合すべき人物の代表データを、絞り込むことができる。このように、クラスタ化により各代表データを分類する場合にも、代表データに人物ごとの生体的特徴が適切に反映されていることから、高精度なクラスタ化を行える。また、当該クラスタにより照合すべき代表データの絞り込みの精度を向上できる。その結果、人物の認証精度を向上できる。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理システムの例を示す図である。

第２の実施の形態の情報処理システムは、サーバ１００およびクライアント２００，３００を有する。サーバ１００およびクライアント２００，３００は、ネットワーク６０を介して接続される。ネットワーク６０は、例えばＬＡＮ（Local Area Network）でもよいし、インターネットやＷＡＮ（Wide Area Network）でもよい。

サーバ１００は、情報処理システムを利用する人物、すなわち、ユーザの生体認証を行う機能を提供するサーバコンピュータである。サーバ１００は、ユーザの顔の撮影データ、すなわち、顔画像に基づく顔認証を行う。ただし、認証に用いられる撮影データは、顔画像に限らず、ユーザの生体的特徴を表す他の種類の画像でもよい。例えば、撮影データは、指紋、静脈、虹彩あるいは身体のその他の部位や器官の画像、または、筆跡の画像などでもよい。認証に用いられるユーザの顔などの撮影データは、ユーザの生体的特徴を表しているため、生体データと呼ばれてもよい。サーバ１００は、第１の実施の形態の情報処理装置１０の一例である。

クライアント２００，３００は、ユーザにより利用されるクライアントコンピュータである。クライアント２００，３００は、それぞれカメラ２０１，３０１を有する。カメラ２０１，３０１は、ＣＣＤ(Charged-Coupled Devices)やＣＭＯＳ(Complementary Metal-Oxide-Semiconductor)などのイメージセンサを内蔵し、クライアント２００，３００それぞれを操作するユーザの顔を撮影して撮影データを生成する。クライアント２００，３００は、クライアント２００，３００における所定の機能の利用に際して、それぞれカメラ２０１，３０１により撮影された撮影データによる顔認証をサーバ１００に依頼し、認証が成功したユーザにのみ当該機能の利用を許可する。

利用に際してユーザの認証を要するクライアント２００，３００における機能としては、例えば、クライアント２００，３００におけるＯＳ（Operating System）やその他のアプリケーションへのログインなどが考えられる。あるいは、クライアント２００，３００と通信するＷｅｂサーバやアプリケーションサーバ（図示を省略している）などが提供する各種のサービスへのログインや当該Ｗｅｂサーバなどが提供する決済などの機能も考えられる。

なお、クライアント２００，３００は、スマートフォンやタブレット端末などのスマートデバイスでもよい。また、クライアント２００，３００は、汎用のコンピュータに限らず、例えばＡＴＭ（Automated Teller Machine）、ＰＯＳ（Point Of Sale）端末、自動販売機、ドアロックを制御する電子錠および入退室管理装置など、機能の提供に個人認証を伴う特定用途のコンピュータでもよい。

図３は、サーバのハードウェア例を示す図である。サーバ１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、画像信号処理部１０４、入力信号処理部１０５、媒体リーダ１０６およびＮＩＣ（Network Interface Card）１０７を有する。なお、ＣＰＵ１０１は、第１の実施の形態の処理部１２の一例である。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１の一例である。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、サーバ１００は複数のプロセッサを有してもよい。以下で説明する処理は複数のプロセッサまたはプロセッサコアを用いて並列に実行されてもよい。また、複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」ということがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、サーバ１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳやミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、サーバ１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

画像信号処理部１０４は、ＣＰＵ１０１からの命令に従って、サーバ１００に接続されたディスプレイ１１１に画像を出力する。ディスプレイ１１１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力信号処理部１０５は、サーバ１００に接続された入力デバイス１１２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス１１２としては、マウス・タッチパネル・タッチパッド・トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、サーバ１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０６は、記録媒体１１３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体１１３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０６は、例えば、記録媒体１１３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体１１３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体１１３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体ということがある。

ＮＩＣ１０７は、ネットワーク６０に接続され、ネットワーク６０を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０７は、例えば、スイッチやルータなどの通信装置とケーブルで接続される。

なお、サーバ１００は、カメラを内蔵したり、カメラと接続されたりしてもよく、サーバ１００のユーザの認証を行ってもよい。例えば、サーバ１００は、店舗などの施設に設置されたカメラと接続されることで、当該施設を訪れたユーザの認証、あるいは当該ユーザの識別を行うこともできる。

また、クライアント２００，３００もサーバ１００と同様のハードウェアにより実現される。
図４は、サーバの機能例を示す図である。

サーバ１００は、記憶部１２０、制御部１３０、撮影データ処理部１４０、品質算出部１５０、人物代表ベクトル算出部１６０、クラスタ代表ベクトル算出部１７０および認証部１８０を有する。記憶部１２０には、ＲＡＭ１０２やＨＤＤ１０３の記憶領域が用いられる。制御部１３０、撮影データ処理部１４０、品質算出部１５０、人物代表ベクトル算出部１６０、クラスタ代表ベクトル算出部１７０および認証部１８０は、プログラムにより実現される。

記憶部１２０は、複数のユーザそれぞれに対して予め取得された複数の撮影データを記憶する。記憶部１２０に予め記憶される複数の撮影データは、カメラ２０１，３０１により生成されたものでもよい。その場合、サーバ１００は、クライアント２００，３００から当該複数の撮影データを予め収集し、記憶部１２０に格納する。各撮影データは、ユーザの識別情報であるユーザＩＤ（IDentifier）に対応付けられている。

記憶部１２０は、学習データテーブル、人物代表データテーブルおよびクラスタ代表データテーブルを記憶する。
学習データテーブルは、学習データが登録されるテーブルである。学習データは、人物代表データの生成に用いられる。人物代表データは、該当のユーザの認証に先立って、記憶部１２０に予め記憶された複数の撮影データに基づいて生成され、サーバ１００に登録される情報である。

学習データは、ユーザの撮影データごとの特徴ベクトルと品質値とを含む。特徴ベクトルは、複数個の特徴量を要素とするベクトルである。品質値は、撮影データの品質を示す指標値である。撮影データの品質は、撮影データのセンシング条件に応じて異なる。撮影データの品質に影響を及ぼす要素には、撮影時のブレ、照明の当たり具合およびカメラなどのレンズが向けられた撮影方向に対する顔の傾き（例えば、横を向いているなど）などが考えられる。品質値が大きい程、撮影データの品質が良い、あるいは品質が高い。品質値が小さい程、撮影データの品質が悪い、あるいは品質が低い。

人物代表データテーブルは、人物代表データが登録されるテーブルである。人物代表データは、ユーザごとの複数の学習データに基づく、当該ユーザに対応する１つの代表データである。人物代表データは、撮影データの特徴ベクトルと同じ次元数を持つベクトルである。人物代表データは、人物代表ベクトルと呼ばれてもよい。

クラスタ代表データテーブルは、クラスタ代表データが登録されるテーブルである。クラスタ代表データは、クラスタに対応する１つの代表データである。クラスタは、複数の人物代表データのグループである。クラスタは複数存在する。１つの人物代表データは、１つのクラスタに属する。クラスタ代表データは、認証の際、照合すべき人物代表データの絞り込みに用いられる。クラスタ代表データは、撮影データの特徴ベクトルと同じ次元数を持つベクトルである。クラスタ代表データは、クラスタ代表ベクトルと呼ばれてもよい。

制御部１３０は、撮影データ処理部１４０、品質算出部１５０、人物代表ベクトル算出部１６０、クラスタ代表ベクトル算出部１７０および認証部１８０の動作を制御する。
撮影データ処理部１４０は、記憶部１２０に記憶された撮影データに基づいて、当該撮影データに対する特徴ベクトルを生成する。特徴ベクトルには、例えば該当のユーザの顔における、目、鼻、口などの位置に応じた特徴が反映される。顔画像に対する特徴ベクトルの生成には既存の方法を用いることができる。撮影データ処理部１４０は、撮影データに対して生成した特徴ベクトルを、ユーザＩＤに対応付けて、記憶部１２０に記憶された学習データテーブルに登録する。

品質算出部１５０は、記憶部１２０に記憶された撮影データの品質を評価し、当該撮影データに対する品質値を生成する。品質値は、撮影データから、特徴ベクトルとは独立に取得される情報である。品質値は、例えば、顔画像を対象にする場合、顔の特徴点（目、鼻、口など）の座標データから推定される、撮影方向に対する顔の傾きの大きさや、座標間での照明変動の大きさおよびブラーの大きさなどである。ブラーの大きさは、撮影時のブレの大きさを示す。顔の傾きの大きさ、照明変動の大きさおよびブラーの大きさにより表される品質値は、撮影データあるいは特徴ベクトルに混入するノイズに相関があると推定される。品質が良い、すなわち、品質値が大きい程、ノイズが小さいと推定される。また、品質が悪い、すなわち、品質値が小さい程、ノイズが大きいと推定される。品質算出部１５０は、撮影データに対して生成した品質値を、ユーザＩＤおよび当該撮影データの特徴ベクトルに対応付けて、記憶部１２０に記憶された学習データテーブルに登録する。

人物代表ベクトル算出部１６０は、ユーザごとの学習データに基づいて人物代表ベクトルを算出する。人物代表ベクトル算出部１６０は、該当のユーザに対して得られている撮影データの数に応じて、人物代表ベクトルの算出方法を選択する。ここで、撮影データのサンプルが得られているユーザの全体集合を｛Ｓ｝とする。集合｛Ｓ｝の全要素数、すなわち、全ユーザ数をＳとする。集合｛Ｓ｝に属するユーザをｓで表す。

まず、人物代表ベクトル算出部１６０は、該当のユーザｓに対して得られている撮影データの数Ｎ_ｓを閾値Ｔと比較する。Ｎ_ｓ≧Ｔのユーザの集合を人物サブセットＳｕとする。Ｎ_ｓ＜Ｔのユーザの集合を人物サブセットＳｌとする。

人物サブセットＳｕに属するユーザｓについて、人物代表ベクトル算出部１６０は、式（１）により、ユーザｓの人物代表ベクトルＨｕ^ｓを求める。

Ｘ^ｓ _ｎは、ユーザｓのｎ番目の撮影データの特徴ベクトルである。人物代表ベクトルＨｕ^ｓは、ユーザｓに対応する特徴ベクトルの平均である。
人物サブセットＳｌに属するユーザｓについて、人物代表ベクトル算出部１６０は、式（２）により、ユーザｓの人物代表ベクトルＨｌ^ｓを求める。

Ｗ^ｓ _ｎは、ユーザｓのｎ番目の撮影データの重みである。人物代表ベクトルＨｌ^ｓは、ユーザｓに対する特徴ベクトルの重み付き平均である。Ｗ^ｓ _ｎは、例えば式（３）により表される。

Ｑ^ｓ _ｎは、ユーザｓのｎ番目の撮影データの品質値である。品質値は、実数により表される。式（３）によれば、ユーザｓの撮影データの数Ｎ_ｓが小さい程、重みＷ^ｓ _ｎに対する品質値Ｑ^ｓ _ｎの影響が大きくなる。また、品質値Ｑ^ｓ _ｎが大きい程、重みＷ^ｓ _ｎが大きくなり、品質値Ｑ^ｓ _ｎが小さい程、重みＷ^ｓ _ｎが小さくなる。

なお、式（３）では、重みＷ^ｓ _ｎに与える品質値Ｑ^ｓ _ｎの影響を、品質値Ｑ^ｓ _ｎを変数とするシグモイド関数で表す例を示したが、他の非線形関数または線形関数を用いてもよい。

人物代表ベクトル算出部１６０は、ユーザごとに算出した人物代表ベクトルを、ユーザＩＤに対応付けて、記憶部１２０に記憶された人物代表データテーブルに登録する。
クラスタ代表ベクトル算出部１７０は、人物代表データテーブルに登録された複数の人物代表ベクトルを複数のクラスタに分類し、各クラスタのクラスタ代表ベクトルを求める。複数の人物代表ベクトルを複数のクラスタに分類し、各クラスタのクラスタ代表ベクトルを求める方法には、例えば、Ｋ－ｍｅａｎｓ法を用いることができる。例えば、クラスタ代表ベクトル算出部１７０は、Ｋ－ｍｅａｎｓ法によって、次のように、複数の人物代表ベクトルを複数のクラスタに分ける。

クラスタ代表ベクトル算出部１７０は、複数の人物代表ベクトルを、ランダムに、所定数のクラスタに分け、各クラスタの重心を求める。クラスタの重心は、当該クラスタに属する各人物代表ベクトルが示す特徴空間の座標の平均値である。

そして、クラスタ代表ベクトル算出部１７０は、各人物代表ベクトルを、当該人物代表ベクトルから最短の距離にある重心に割り当て直し、各クラスタの重心を計算し直す。クラスタ代表ベクトル算出部１７０は、この処理を繰り返し実行して、各クラスタの重心を補正する。クラスタ代表ベクトル算出部１７０は、例えば、クラスタに対する人物代表ベクトルの割り当てに変化がなくなった場合や割り当てが変更される人物代表ベクトルの数が所定数以下となった場合に、各クラスタの重心を確定する。確定時に、各クラスタに割り当てられている人物代表ベクトルが、当該クラスタに分類された人物代表ベクトルである。また、各クラスタの重心がクラスタ代表ベクトルである。

なお、クラスタ代表ベクトル算出部１７０は、例えば、ガウス混合モデル（ＧＭＭ：Gaussian Mixture Model）などの他のクラスタリング手法により、複数の人物代表ベクトルを複数のクラスタに分類してもよい。

クラスタ代表ベクトル算出部１７０は、算出したクラスタ代表ベクトルと、クラスタ代表ベクトルで表されるクラスタに分類された人物代表ベクトルに対応するユーザＩＤとを、記憶部１２０に記憶されたクラスタ代表データテーブルに登録する。

認証部１８０は、クライアント２００，３００から受信した認証要求に基づいて、顔認証を行う。認証要求は、認証対象のユーザの顔を撮影した撮影データを含む。認証部１８０は、撮影データ処理部１４０から当該撮影データに対する特徴ベクトルを取得し、取得した特徴ベクトルを、記憶部１２０に記憶されたクラスタ代表データテーブルにおけるクラスタ代表ベクトルと照合する。例えば、認証部１８０は、特徴ベクトルとクラスタ代表ベクトルとの類似度に基づいて、特徴ベクトルとクラスタ代表ベクトルとの照合を行う。類似度には、例えば、特徴空間における特徴ベクトルに対応する点と、クラスタ代表ベクトルに対応する点との距離が用いられる。すなわち、認証部１８０は、クラスタ代表データテーブルに登録されているクラスタ代表ベクトルのうち、特徴ベクトルに最も距離が近いクラスタ代表ベクトルを特定する。認証部１８０は、特徴ベクトルに距離が近いものを優先して、２以上の所定数のクラスタ代表ベクトルを特定してもよい。クラスタ代表ベクトルとの照合により、照合すべき人物代表ベクトルの絞り込みを行える。

認証部１８０は、特定したクラスタ代表ベクトルに分類されたユーザＩＤの人物代表ベクトルを、人物代表データテーブルから取得し、特徴ベクトルと照合する。例えば、認証部１８０は、特徴ベクトルと人物代表ベクトルとの類似度に基づいて、特徴ベクトルと人物代表ベクトルとの照合を行う。類似度には、例えば、特徴空間における特徴ベクトルに対応する点と、人物代表ベクトルに対応する点との距離が用いられる。すなわち、認証部１８０は、特徴ベクトルとの距離が所定値以下である人物代表ベクトルが存在するか否かを判定する。特徴ベクトルとの距離が所定値以下である人物代表ベクトルが存在する場合、認証部１８０は、クライアント２００を操作するユーザが、当該人物代表ベクトルに対応するユーザであると判定し、認証成功とする。すると、認証部１８０は、クライアント２００に認証成功を応答する。一方、該当の特徴ベクトルとの距離が所定値以下である人物代表ベクトルが存在しない場合、認証部１８０は、クライアント２００を操作するユーザが登録済のユーザではないと判定し、認証失敗とする。認証部１８０は、クライアント２００に認証失敗を応答する。

認証部１８０は、クライアント３００から受信した認証要求に対しても、上記と同様の認証処理を行う。
なお、撮影データ処理部１４０および品質算出部１５０の機能は、クライアント２００，３００に設けられてもよい。その場合、サーバ１００は、学習データテーブル１２１の各レコードを、クライアント２００，３００から収集してもよい。また、サーバ１００は、認証対象のユーザの撮影データに対する特徴ベクトルを、認証要求とともにクライアント２００，３００から取得してもよい。

次に、記憶部１２０に記憶されるデータの例を説明する。
図５は、学習データテーブルの例を示す図である。
学習データテーブル１２１は、ユーザＩＤ、特徴ベクトルおよび品質値の項目を含む。ユーザＩＤの項目には、ユーザＩＤが登録される。特徴ベクトルの項目には、撮影データの特徴ベクトルが登録される。

例えば、学習データテーブル１２１には、ユーザＩＤ「ＵＩＤ１」、特徴ベクトル「Ｘ^１ _１」、品質値「Ｑ^１ _１」というレコードが登録される。このレコードは、ユーザＩＤ「ＵＩＤ１」のユーザの１番目の撮影データに対する特徴ベクトルが「Ｘ^１ _１」であり、品質値が「Ｑ^１ _１」であることを示す。

学習データテーブル１２１には、ユーザＩＤ「ＵＩＤ１」のユーザに対する他の撮影データに対する特徴ベクトルおよび品質値のレコードも登録される。
学習データテーブル１２１には、他のユーザに対しても同様に、撮影データごとの特徴ベクトルおよび品質値のレコードが登録される。

図６は、人物代表データテーブルの例を示す図である。
人物代表データテーブル１２２は、ユーザＩＤおよび人物代表ベクトルの項目を含む。ユーザＩＤの項目には、ユーザＩＤが登録される。人物代表ベクトルの項目には、人物代表ベクトルが登録される。

例えば、人物代表データテーブル１２２には、ユーザＩＤ「ＵＩＤ１」および人物代表ベクトル「Ｈｕ^１」というレコードが登録される。このレコードは、ユーザＩＤ「ＵＩＤ１」のユーザの人物代表ベクトルが「Ｈｕ^１」であることを示す。

また、人物代表データテーブル１２２には、ユーザＩＤ「ＵＩＤ２」および人物代表ベクトル「Ｈｌ^２」というレコードが登録される。このレコードは、ユーザＩＤ「ＵＩＤ２」のユーザの人物代表ベクトルが「Ｈｌ^２」であることを示す。

人物代表データテーブル１２２には、他のユーザに対しても同様に、人物代表ベクトルが登録される。
図７は、クラスタ代表データテーブルの例を示す図である。

クラスタ代表データテーブル１２３は、クラスタ代表ベクトルおよびユーザＩＤの項目を含む。クラスタ代表ベクトルの項目には、クラスタ代表ベクトルが登録される。ユーザＩＤの項目には、該当のクラスタ代表ベクトルに対応するクラスタに分類された人物代表ベクトルのユーザＩＤが登録される。

例えば、クラスタ代表データテーブル１２３には、クラスタ代表ベクトルが「Ｃ１」、ユーザＩＤが「ＵＩＤ１，ＵＩＤ３，…」というレコードが登録される。このレコードは、クラスタ代表ベクトル「Ｃ１」のクラスタに分類されたユーザＩＤが「ＵＩＤ１，ＵＩＤ３，…」であることを示す。

クラスタ代表データテーブル１２３には、他のクラスタ代表ベクトルに対しても同様に、当該クラスタ代表ベクトルに分類されたユーザＩＤの組が登録される。
次に、サーバ１００の処理手順を説明する。まず、サーバ１００による人物代表ベクトルの生成の手順およびクラスタ代表ベクトルの生成の手順を例示する。

図８は、人物代表ベクトル生成の例を示すフローチャートである。
人物代表ベクトル算出部１６０は、下記の手順をユーザごとに実行する。
（Ｓ１０）人物代表ベクトル算出部１６０は、ユーザｓについて、当該ユーザ１人当たりの撮影データの数Ｎ_ｓが閾値Ｔ以上、すなわち、Ｎ_ｓ≧Ｔであるか否かを判定する。Ｎ_ｓ≧Ｔの場合、人物代表ベクトル算出部１６０は、ステップＳ１１に処理を進める。Ｎ_ｓ＜Ｔの場合、人物代表ベクトル算出部１６０は、ステップＳ１２に処理を進める。

（Ｓ１１）人物代表ベクトル算出部１６０は、撮影データ処理部１４０によりユーザｓの撮影データに対して生成された特徴ベクトル集合｛Ｘ^ｓ _ｎ｝を学習データテーブル１２１から取得する。そして、人物代表ベクトル算出部１６０は、式（１）に基づいて、ユーザｓに対する人物代表ベクトルＨｕ^ｓを計算する。なお、ユーザｓの撮影データに対する特徴ベクトルは、学習データテーブル１２１に予め登録されていてもよい。人物代表ベクトル算出部１６０は、人物代表ベクトルＨｕ^ｓを、ユーザｓのユーザＩＤに対応付けて、人物代表データテーブル１２２に登録する。そして、人物代表ベクトル算出部１６０は、ユーザｓに対する人物代表ベクトル生成を終了する。

（Ｓ１２）品質算出部１５０は、ユーザｓの各撮影データに対して、品質値を計算する。品質値は、前述のように、顔の特徴点（目、鼻、口など）の座標データから推定される、撮影方向に対する顔の傾きの大きさや、座標間での照明変動の大きさおよびブラーの大きさなどであり、既存の方法により計算される。品質値は、顔の傾きの大きさ、照明変動の大きさおよびブラーの大きさなどの指標値の２以上の組合せから所定の関数により求められる値でもよい。品質算出部１５０は、算出した品質値を、学習データテーブル１２１に登録する。なお、品質算出部１５０は、各撮影データに対する品質値を予め生成しておき、学習データテーブル１２１に登録しておいてもよい。その場合、人物代表ベクトル算出部１６０は、ステップＳ１２をスキップして、ステップＳ１３を実行してよい。

（Ｓ１３）人物代表ベクトル算出部１６０は、撮影データ処理部１４０によりユーザｓの撮影データに対して生成された特徴ベクトル集合｛Ｘ^ｓ _ｎ｝を学習データテーブル１２１から取得する。人物代表ベクトル算出部１６０は、品質算出部１５０によりユーザｓの撮影データに対して生成された品質値集合｛Ｑ^ｓ _ｎ｝を学習データテーブル１２１から取得する。人物代表ベクトル算出部１６０は、式（３）に基づいて、重み集合｛Ｗ^ｓ _ｎ｝を計算する。そして、人物代表ベクトル算出部１６０は、式（２）に基づいて、ユーザｓに対する人物代表ベクトルＨｌ^ｓを計算する。なお、ユーザｓの撮影データに対する特徴ベクトルは、学習データテーブル１２１に予め登録されていてもよい。人物代表ベクトル算出部１６０は、人物代表ベクトルＨｌ^ｓを、ユーザｓのユーザＩＤに対応付けて、人物代表データテーブル１２２に登録する。そして、人物代表ベクトル算出部１６０は、ユーザｓに対する人物代表ベクトル生成を終了する。

サーバ１００は、登録対象の全てのユーザに対して、人物代表ベクトル生成を実行すると、次のクラスタ代表ベクトル生成を実行する。
図９は、クラスタ代表ベクトル生成の例を示すフローチャートである。

（Ｓ２０）クラスタ代表ベクトル算出部１７０は、各ユーザの人物代表ベクトルをクラスタ化する。クラスタ化には、前述のＫ－ｍｅａｎｓ法やＧＭＭなどの方法を用いることができる。クラスタ代表ベクトル算出部１７０は、クラスタ化により、各クラスタのクラスタ代表ベクトルを計算し、各ユーザの人物代表ベクトルを、各クラスタに分類する。

（Ｓ２１）クラスタ代表ベクトル算出部１７０は、クラスタ代表ベクトルを所属ユーザＩＤとともにクラスタ代表データテーブル１２３に登録する。そして、クラスタ代表ベクトル算出部１７０は、クラスタ代表ベクトル生成を終了する。

次に、サーバ１００によるユーザ認証の手順を例示する。以下では、クライアント２００を例示するが、クライアント３００に対しても同様の手順となる。
図１０は、認証の例を示すフローチャートである。

下記の手順は、サーバ１００がクライアント２００から認証要求を受信すると実行される。
（Ｓ３０）認証部１８０は、クライアント２００から受信した認証要求に含まれる撮影データから取得された特徴ベクトルを、撮影データ処理部１４０から取得する。なお、クライアント２００から受信した認証要求は、クライアント２００のカメラ２０１で撮影された撮影データに対応する特徴ベクトルを含んでもよい。この場合、認証部１８０は、認証要求に含まれる特徴ベクトルを取得すればよい。

（Ｓ３１）認証部１８０は、クラスタ代表データテーブル１２３に登録されたクラスタ代表ベクトルの中から、ステップＳ３０で取得した特徴ベクトルと類似度の高いクラスタ代表ベクトルを特定する。例えば、認証部１８０は、当該特徴ベクトルとの距離が最も近いクラスタ代表ベクトルを特定してもよいし、当該距離が近いものを優先して所定数のクラスタ代表ベクトルを特定してもよい。

（Ｓ３２）認証部１８０は、特定したクラスタに属する人物代表ベクトルと、ステップＳ３０で取得した特徴ベクトルとを照合する。例えば、認証部１８０は、ステップＳ３１で特定したクラスタ代表ベクトルに対応するユーザＩＤをクラスタ代表データテーブル１２３から特定する。そして、認証部１８０は、人物代表データテーブル１２２から当該ユーザＩＤに対応する人物代表ベクトルを抽出して、特徴ベクトルと照合する。

（Ｓ３３）認証部１８０は、ステップＳ３２の照合の結果に基づいて、認証成功であるか否かを判定する。認証成功の場合、認証部１８０は、ステップＳ３４に処理を進める。認証失敗の場合、認証部１８０は、ステップＳ３５に処理を進める。例えば、ステップＳ３２の照合の結果、特徴ベクトルとの類似度、すなわち、距離が、所定値以下である人物代表ベクトルが存在する場合、認証部１８０は、認証成功と判定する。一方、ステップＳ３２の照合の結果、特徴ベクトルとの距離が所定値以下である人物代表ベクトルが存在しない場合、認証部１８０は、認証失敗と判定する。

（Ｓ３４）認証部１８０は、クライアント２００に認証成功を応答する。認証部１８０は、認証成功したユーザのユーザＩＤや当該ユーザに関する情報をクライアント２００または他のコンピュータに送信してもよい。認証部１８０は、認証成功したユーザのユーザＩＤをログなどに記録してもよい。そして、認証部１８０は、認証処理を終了する。

（Ｓ３５）認証部１８０は、クライアント２００に認証失敗を応答する。認証部１８０は、認証失敗したことをログなどに記録してもよい。そして、認証部１８０は、認証処理を終了する。

なお、認証部１８０は、認証対象のユーザに対して複数取得された撮影データから、人物代表ベクトル算出部１６０により算出された人物代表ベクトルを用いて認証を行ってもよい。この場合にも、人物代表ベクトル算出部１６０は、式（１）や式（２）、（３）を用いて、認証対象のユーザに対する人物代表ベクトルを算出することができる。

ここで、大規模な登録データを有する生体認証システムでは、カメラなどのセンサにより取得された情報に基づく人物代表データを類似度によって分類する、すなわち、クラスタリングすることで、照合すべき人物代表データを絞り込め、人物代表データの高速検索が可能になる。人物代表データのクラスタリングにおいては、将来において、同一人物の撮影データから得られる特徴データや人物代表データが同じクラスタに属するような分類器を構築することが重要となる。

分類器の構築では、与えられた学習データに基づいて、クラスタの代表点を求める。人物代表データをクラスタリングする際には、当該人物代表データと最も類似度が良い代表点が存在するクラスタに分類する。実際の運用環境では、カメラなどのセンサによるセンシング条件によって、人物代表データの基となる撮影データに対して、揺らぎに相当するノイズが付加される。このため、同一ユーザから別個のタイミングで得られた異なるデータ（当該ユーザに対する登録済データおよび登録済データと照合されるべき照合データ）が、各タイミングでのノイズの影響により異なるクラスタに分類されてしまい、検索時の精度が低下する。

撮影データに混入するノイズは、特徴量に作用し、ノイズが混入していない場合の理想的な特徴量に摂動を与える。クラスタリングモデルを構築する場合、撮影データに混入するノイズの影響を考慮するために、複数のユーザそれぞれの複数枚の撮影データのサンプルから成る学習データを用いる。すなわち、様々なノイズの影響を含んだ撮影データを用いることで、ノイズの影響の統計的性質をモデル化する。このとき、一般的に、ユーザの数および各ユーザに対するサンプル数、すなわち、撮影データの数が多い程、例えば平均化により各サンプルにおけるノイズの影響が相殺され、クラスタリングモデルの精度は向上する。

しかし、学習データにおける各ユーザのサンプルに注目したとき、特定の種類のノイズを含むサンプルのみで構成されるユーザは、当該ユーザの生体データが当該ノイズの影響を強く受けた状態でモデル化される。このような問題は、サンプル数が少ない人物において発生し易い。こうしたユーザを学習データから排除することも考えられるが、前述のように学習データの量はモデルの精度に影響を与えるため、可能な限りサンプル数を維持することが好ましい。

第２の実施の形態のサーバ１００は、まず、学習データに含まれる各ユーザの複数枚の撮影データのサンプルを用いて、サンプルの統計的性質から当該ユーザを表す人物代表ベクトルを算出する。サーバ１００は人物代表ベクトルの類似によってクラスタ構築することで、ユーザの類似度に沿ったクラスタリングを行う。このとき、サンプル数が比較的少ないユーザにおいては、特徴量のノイズの影響を受け易く、人物代表ベクトルが真の値から離れたものになる可能性が高い。一方で、生体認証では、特徴量とは独立して、撮影データから撮影データ自体の品質値を取得できる場合がある。例えば、撮影データとして顔画像を対象にした場合、品質値として、顔の特徴点（目、鼻、口など）の座標データから推定される顔の傾きの大きさ、照明変動の大きさ、ブラーの大きさなどを示す指標値が考えられる。これらの品質値は、特徴量に含まれるノイズとの相関が期待される。

そこで、サーバ１００は、品質値が良い特徴量は、ノイズの影響が少ないとみなして、当該特徴量に近づくように人物代表ベクトルを算出する。これにより、ノイズの影響を軽減しつつ、データ量を活かしたクラスタリングモデルの構築を行える。

人物代表ベクトルの精度が向上することで、人物代表ベクトルに基づいて得られるクラスタ代表ベクトルの精度が向上する。その結果、同一ユーザから得られた異なる生体データが異なるクラスタに分類される可能性を減らせる。よって、認証時において、照合データと照合すべき登録済データのクラスタによる絞り込みを適切に行えるようになり、認証精度が向上する。

なお、上記の例では、ユーザｓに対して取得された撮影データの数Ｎ_ｓの閾値Ｔに対する比率（Ｎ_ｓ／Ｔ）に応じて、品質値Ｑ^ｓ _ｎを用いた重みＷ^ｓ _ｎを求めるものとした。一方、撮影データそれぞれの品質と、撮影データの数とに基づく重みの算出方法には他の例も考えられる。例えば、撮影データの数Ｎ_ｓに対する、品質値Ｑ^ｓ _ｎが所定の閾値よりも低い低品質の撮影データの数ｍの比率（ｍ／Ｎ_ｓ）により、重みＷ^ｓ _ｎを求めることも考えられる。その場合、ステップＳ１３において、例えば、式（３）の（Ｎ_ｓ／Ｔ）を（１－（ｍ／Ｎ_ｓ））に置き換えればよい。

［第３の実施の形態］
次に第３の実施の形態を説明する。前述の第２の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。

第３の実施の形態のサーバ１００は、第２の実施の形態のサーバ１００と同様のハードウェアおよび機能を有する。ただし、第３の実施の形態では、サーバ１００の人物代表ベクトル算出部１６０による人物代表ベクトル生成の手順が第２の実施の形態と異なる。

ここで、第２の実施の形態では、品質値Ｑ^ｓ _ｎは、例えば、撮影方向に対する顔の傾きの大きさ、座標間での照明変動の大きさおよびブラーの大きさなどの複数の指標値を要素として含むベクトル（品質ベクトルという）で表される。

第２の実施の形態と同様に、特徴ベクトルＸ^ｓ _ｎは、ｓ番目のユーザ（ユーザｓとする）のｎ番目の撮影データの特徴ベクトルである。ｓは１≦ｓ≦Ｓの整数である。ｎは１≦ｎ≦Ｎｓの整数である。また、品質ベクトルＱ^ｓ _ｎは、ユーザｓのｎ番目の撮影データの品質ベクトルである。特徴ベクトルＸ^ｓ _ｎおよび品質ベクトルＱ^ｓ _ｎはそれぞれｄ_ｘ次元およびｄ_ｑ次元であるとする。ｄ_ｘ＝ｄ_ｑでもよいし、ｄ_ｘ≠ｄ_ｑでもよい。

図１１は、第３の実施の形態の人物代表ベクトル生成の例を示すフローチャートである。
（Ｓ４０）人物代表ベクトル算出部１６０は、サンプルとして得られている全ユーザの全撮影データの特徴ベクトルと品質ベクトルとの回帰モデルを生成する。具体的には、人物代表ベクトル算出部１６０は、特徴ベクトルと品質ベクトルとの全ペアに対して、式（４）の変換式Ｆ（Ｘ^ｓ _ｎ）を求める。

変換式Ｆ（Ｘ^ｓ _ｎ）による変換は、例えば、式（５）のような線形変換でよい。式（５）は回帰式とも呼ばれる。

変換係数Ａ，Ｂは、それぞれ行列またはベクトルである。人物代表ベクトル算出部１６０は、特徴ベクトルと品質ベクトルとの全ペアから求められる式（６）の変換誤差の総和ｅを最小にするように変換係数Ａ，Ｂを決定する。

ここで、||・||^２はベクトルのノルムを表す。また、Ｎ_ｓは、ユーザｓに対して取得されている撮影データの数である。
（Ｓ４１）人物代表ベクトル算出部１６０は、ユーザｓについて、当該ユーザ１人当たりの撮影データの数Ｎ_ｓが閾値Ｔ以上、すなわち、Ｎ_ｓ≧Ｔであるか否かを判定する。Ｎ_ｓ≧Ｔの場合、人物代表ベクトル算出部１６０は、ステップＳ４２に処理を進める。Ｎ_ｓ＜Ｔの場合、人物代表ベクトル算出部１６０は、ステップＳ４３に処理を進める。

（Ｓ４２）人物代表ベクトル算出部１６０は、ユーザｓの撮影データの特徴ベクトル集合｛Ｘ^ｓ _ｎ｝を学習データテーブル１２１から取得する。そして、人物代表ベクトル算出部１６０は、式（１）に基づいて、ユーザｓに対する人物代表ベクトルＨｕ^ｓを計算する。人物代表ベクトル算出部１６０は、人物代表ベクトルＨｕ^ｓを、ユーザｓのユーザＩＤに対応付けて、人物代表データテーブル１２２に登録する。そして、人物代表ベクトル算出部１６０は、ユーザｓに対する人物代表ベクトル生成を終了する。

（Ｓ４３）人物代表ベクトル算出部１６０は、ユーザｓの撮影データの特徴ベクトル集合｛Ｘ^ｓ _ｎ｝を学習データテーブル１２１から取得する。そして、人物代表ベクトル算出部１６０は、回帰モデルを基に、ユーザｓの各撮影データの特徴ベクトルの各成分からノイズの影響を除去する。すなわち、人物代表ベクトル算出部１６０は、式（７）により、ノイズ影響の除去後のベクトル（Ｘ’）^ｓ _ｎを生成する。

ここで、関数Ｆ^－１は、関数Ｆの逆関数である。
ベクトル（Ｘ’）^ｓ _ｎの各要素は、特徴ベクトルＸ^ｓ _ｎの各要素の重みを表しているということができる。すなわち、ベクトル（Ｘ’）^ｓ _ｎの各要素は、第１の実施の形態の重みの一例である。あるいは、ベクトル（Ｘ’）^ｓ _ｎの各要素は、特徴ベクトルＸ^ｓ _ｎの各要素の重みが反映された重み付き特徴量を表しているということもできる。

（Ｓ４４）人物代表ベクトル算出部１６０は、式（８）に基づいて、ユーザｓに対する人物代表ベクトルＨｌ^ｓを計算する。

式（８）で表される人物代表ベクトルＨｌ^ｓは、ベクトル（Ｘ’）^ｓ _ｎの平均である。すなわち、人物代表ベクトルＨｌ^ｓの１つの成分は、ベクトル（Ｘ’）^ｓ _ｎの対応する成分の平均である。人物代表ベクトル算出部１６０は、人物代表ベクトルＨｌ^ｓを、ユーザｓのユーザＩＤに対応付けて、人物代表データテーブル１２２に登録する。そして、人物代表ベクトル算出部１６０は、ユーザｓに対する人物代表ベクトル生成を終了する。

なお、人物代表ベクトル算出部１６０は、複数のユーザに対して、人物代表ベクトルを生成する場合、ステップＳ４１～Ｓ４４を各ユーザに対して繰り返し実行する。
第３の実施の形態でも、第２の実施の形態と同様にして、サーバ１００によりクラスタ代表ベクトル生成およびユーザの認証が行われる。

第３の実施の形態では、撮影データの特徴ベクトルの各要素におけるノイズの影響が式（５）の変換係数Ａ，Ｂに反映される。したがって、当該ノイズの影響を示すノイズ成分が、式（７）の右辺第２項のＦ^－１（Ｑ^ｓ _ｎ）で示されるように、品質値に応じて推定される。サーバ１００は、ノイズの影響が小さい特徴量については、人物代表ベクトルに対する当該特徴量の影響が大きくなるようにする。また、サーバ１００は、ノイズの影響が大きい特徴量については、人物代表ベクトルに対する当該特徴量の影響が小さくなるようにする。これにより、ノイズの影響を軽減しつつ、データ量を活かしたクラスタリングモデルの構築を行える。

第２の実施の形態と同様に、第３の実施の形態でも、人物代表ベクトルの精度が向上することで、人物代表ベクトルに基づいて得られるクラスタ代表ベクトルの精度が向上する。その結果、同一ユーザから得られた異なる生体データが異なるクラスタに分類される可能性を減らせる。よって、認証時において、照合データと照合すべき登録済データのクラスタによる絞り込みを適切に行えるようになり、認証精度が向上する。

第２，第３の実施の形態をまとめると、サーバ１００は、例えば、次のような機能を有する。
人物代表ベクトル算出部１６０は、複数の撮影データから複数の撮影データを代表する人物代表データを算出する際に、生成した重み情報が示す重みが小さい程、人物代表データの算出結果への複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する。当該アルゴリズムは、例えば、式（２）や式（８）で表される。すなわち、式（２）や式（８）の演算は、「生成した重み情報が示す重みが小さい程、人物代表データの算出結果への複数の撮影データそれぞれの影響が小さくなるアルゴリズム」の一例である。これにより、各撮影データに含まれる人物の生体的特徴の情報を、人物代表データにどの程度反映させるかを、撮影データの数や品質に応じて適切に調整できる。

人物代表ベクトル算出部１６０は、複数の撮影データの数が少ない程、複数の撮影データそれぞれの品質が複数の撮影データそれぞれの重みに与える影響を大きくする。これにより、高品質な撮影データが人物代表データに与える影響を大きくするとともに、低品質な撮影データが人物代表データに与える影響を小さくでき、人物代表データに人物（ユーザ）の生体的特徴を適切に反映させることができる。

また、人物代表ベクトル算出部１６０は、重み情報の生成では、閾値に対する複数の撮影データの数の比率に基づいて重みを算出する。例えば、人物代表ベクトル算出部１６０は、当該比率が小さいほど、複数の撮影データそれぞれの品質が複数の撮影データそれぞれの重みに与える影響を大きくする。これにより、高品質な撮影データが人物代表データに与える影響を大きくするとともに、低品質な撮影データが人物代表データに与える影響を小さくでき、人物代表データに人物（ユーザ）の生体的特徴を適切に反映させることができる。

あるいは、人物代表ベクトル算出部１６０は、複数の撮影データの数に対する、所定の品質よりも低品質の撮影データの数の比率に基づいて重みを算出する。例えば、人物代表ベクトル算出部１６０は、当該比率が大きい程、複数の撮影データそれぞれの品質が複数の撮影データそれぞれの重みに与える影響を大きくする。これにより、高品質な撮影データが人物代表データに与える影響を大きくするとともに、低品質な撮影データが人物代表データに与える影響を小さくでき、人物代表データに人物（ユーザ）の生体的特徴を適切に反映させることができる。

また、人物代表ベクトル算出部は、撮影データの品質が高い程、当該撮影データの重みを大きくする。これにより、人物代表データに対するノイズの影響を低減でき、人物（ユーザ）の生体的特徴を人物代表データに、適切に反映させることができる。

あるいは、人物代表ベクトル算出部１６０は、複数の撮影データそれぞれの特徴ベクトルと、複数の撮影データそれぞれの品質を示す品質ベクトルとの回帰モデルを生成し、回帰モデルに基づいて、特徴ベクトルの各要素に含まれるノイズ成分を推定する。これにより、特徴ベクトルの各要素から直接的にノイズ成分を除去することが可能になる。なお、回帰モデルの生成に用いられる撮影データは、複数の人物に対して得られたものでもよい。この場合、複数の人物に対して回帰モデルが生成される。ただし、回帰モデルは人物ごとに生成されてもよい。

人物代表ベクトル算出部１６０は、推定したノイズ成分を、当該ノイズ成分に対応する特徴ベクトルの第１の要素から引くことで、複数の撮影データそれぞれの特徴ベクトルの第１の要素の、当該第１の要素に対応する人物代表データの第２の要素に対する重みを算出する。ここで、第１の要素および第２の要素は、特徴ベクトルおよび人物代表データ（人物代表ベクトル）を列ベクトルとすると、特徴ベクトルおよび人物代表データの同じ行の要素である。人物代表データの第２の要素は、複数の撮影データの複数の特徴ベクトルの、第２の要素に対応する第１の要素の平均となる。すると、人物代表データの各要素に対する重みが小さい程、人物代表データの算出結果への複数の撮影データそれぞれの特徴ベクトルの、対応する要素の影響が小さくなる。このため、人物代表データに人物（ユーザ）の生体的特徴を適切に反映させることができる。

更に、クラスタ代表ベクトル算出部１７０は、複数の人物に対して算出された複数の人物代表データに基づいて、複数の代表データを分類する複数のクラスタに対応する複数のクラスタ代表データを算出する。前述のように、各人物の人物代表データには、各人物の生体的特徴が適切に反映される。このため、例えば、Ｋ－ｍｅａｎｓ法やＧＭＭなどにより、各人物代表データの類似度を基に、高精度なクラスタリングが可能になる。

また、認証部１８０は、人物の認証時に当該人物の撮影データを受け付け、複数のクラスタ代表データのうち撮影データの特徴データとの類似度が高いクラスタ代表データを優先的に選択する。認証部１８０は、選択したクラスタ代表データに対応するクラスタに分類された人物代表データと特徴データとを類似度に基づき照合する。各人物代表データが高精度にクラスタリングされるため、認証時の人物代表データの、クラスタによる絞り込みの精度が高まる。よって、認証精度を向上できる。

ここで、特徴データ、人物代表データおよびクラスタ代表データそれぞれは、同一の特徴空間におけるベクトルである。また、類似度は、特徴空間の２つのベクトルで示される２つの点の間の距離である。これにより、認証時の照合を適切に行える。

また、品質の情報は、撮影データにおけるブラーの大きさ、照明の変動の大きさおよび撮影方向に対する顔の傾きの大きさの少なくとも１つを示す指標値である。前述のように、品質の情報は、これらの指標値を複数個含む品質ベクトルでもよい。これらの指標値は、顔画像を用いた顔認証を行う際に好適であり、顔認証に用いられる人物代表データを生成する際、人物代表データを高精度で生成するために特に有用である。

なお、第１の実施の形態の情報処理は、処理部１２にプログラムを実行させることで実現できる。また、第２，第３の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体１１３に記録できる。

例えば、プログラムを記録した記録媒体１１３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体１１３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

上記については単に本発明の原理を示すものである。更に、多数の変形や変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応する全ての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

１０情報処理装置
１１記憶部
１２処理部
２０撮影データ群
２１撮影データ
３０品質情報群
３１品質情報
４０重み情報群
４１重み情報
５０代表データ

Claims

人物の複数の撮影データを受け付け、
前記複数の撮影データそれぞれの品質と、前記複数の撮影データの数とに基づき、前記複数の撮影データそれぞれに適用する重みを示す重み情報を生成し、
前記複数の撮影データから前記複数の撮影データを代表する代表データを算出する際に、生成した前記重み情報が示す前記重みが小さい程、前記代表データの算出結果への前記複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する、
処理をコンピュータが実行することを特徴とする制御方法。
前記重み情報の生成では、前記複数の撮影データの数が少ない程、前記複数の撮影データそれぞれの前記品質が前記複数の撮影データそれぞれの前記重みに与える影響を大きくする、
ことを特徴とする請求項１記載の制御方法。
前記重み情報の生成では、閾値に対する前記複数の撮影データの数の比率に基づいて前記重みを算出する、
ことを特徴とする請求項１記載の制御方法。
前記重み情報の生成では、前記複数の撮影データの数に対する、所定の品質よりも低品質の撮影データの数の比率に基づいて前記重みを算出する、
ことを特徴とする請求項１記載の制御方法。
前記重み情報の生成では、撮影データの品質が高い程、前記撮影データの前記重みを大きくする、
ことを特徴とする請求項１記載の制御方法。
前記重み情報の生成では、前記複数の撮影データそれぞれの特徴ベクトルと、前記複数の撮影データそれぞれの前記品質を示す品質ベクトルとの回帰モデルを生成し、前記回帰モデルに基づいて、前記特徴ベクトルの各要素に含まれるノイズ成分を推定する、
ことを特徴とする請求項１記載の制御方法。
前記重み情報の生成では、推定した前記ノイズ成分を、前記ノイズ成分に対応する前記特徴ベクトルの第１の要素から引くことで、前記複数の撮影データそれぞれの前記特徴ベクトルの前記第１の要素の、前記第１の要素に対応する前記代表データの第２の要素に対する前記重みを算出する、
ことを特徴とする請求項６記載の制御方法。
複数の人物に対して算出された複数の前記代表データに基づいて、複数の前記代表データを分類する複数のクラスタに対応する複数のクラスタ代表データを算出する、
処理を前記コンピュータが更に実行することを特徴とする請求項１記載の制御方法。
前記人物の認証時に前記人物の撮影データを受け付け、前記複数のクラスタ代表データのうち前記撮影データの特徴データとの類似度が高いクラスタ代表データを優先的に選択し、選択した前記クラスタ代表データに対応するクラスタに分類された前記代表データと前記特徴データとを前記類似度に基づき照合する、
処理を前記コンピュータが更に実行することを特徴とする請求項８記載の制御方法。
前記特徴データ、前記代表データおよび前記クラスタ代表データそれぞれは、同一の特徴空間におけるベクトルであり、
前記類似度は、前記特徴空間の２つの前記ベクトルで示される２つの点の間の距離である、
ことを特徴とする請求項９記載の制御方法。
前記品質の情報は、撮影データにおけるブラーの大きさ、照明の変動の大きさおよび撮影方向に対する顔の傾きの大きさの少なくとも１つを示す指標値である、
ことを特徴とする請求項１記載の制御方法。
人物の複数の撮影データを受け付け、
前記複数の撮影データそれぞれの品質と、前記複数の撮影データの数とに基づき、前記複数の撮影データそれぞれに適用する重みを示す重み情報を生成し、
前記複数の撮影データから前記複数の撮影データを代表する代表データを算出する際に、生成した前記重み情報が示す前記重みが小さい程、前記代表データの算出結果への前記複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する、
処理をコンピュータに実行させることを特徴とする制御プログラム。
人物の複数の撮影データを記憶する記憶部と、
前記複数の撮影データそれぞれの品質と、前記複数の撮影データの数とに基づき、前記複数の撮影データそれぞれに適用する重みを示す重み情報を生成し、前記複数の撮影データから前記複数の撮影データを代表する代表データを算出する際に、生成した前記重み情報が示す前記重みが小さい程、前記代表データの算出結果への前記複数の撮影データそれぞれの影響が小さくなるアルゴリズムを適用する処理部と、
を有することを特徴とする情報処理装置。