JP2007249179A

JP2007249179A - バイオメトリック特徴の変化に基づいてバイオメトリックモデルを更新するためのシステム、方法、およびコンピュータプログラム

Info

Publication number: JP2007249179A
Application number: JP2006351685A
Authority: JP
Inventors: Prabha Sundaram; プラバー・サンダラム; Clifford Tavares; クリフォード・タバレス
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2006-03-14
Filing date: 2006-12-27
Publication date: 2007-09-27
Also published as: US20070219801A1

Abstract

【課題】
ユーザのバイオメトリック特徴の変化に基づいて、バイオメトリクスシステムに登録されているユーザのバイオメトリックモデルを更新する。
【解決手段】
ユーザから受け取った第１のバイオメトリックサンプルの分析に基づいて、そのユーザが承認される。第１のバイオメトリックサンプルから抽出された特徴と、登録時にユーザから得られた第２のバイオメトリックサンプルを用いて生成された第１のモデルとを比較し、またこの特徴と、以前に承認された第３のバイオメトリックサンプルを用いて生成された第２のモデルとを比較して、この特徴が第１のモデルよりも第２のモデルの方によりぴったりとマッチしているかどうかを決定する。この特徴が第１のモデルよりも第２のモデルの方によりぴったりとマッチしていた場合、抽出された特徴に基づいてデータ記憶装置１０６の第１および第２のモデルを更新できる。
【選択図】図１

Description

本発明は、バイオメトリクス、より詳しくは、バイオメトリクス認証アプリケーションの適応、特に話者認証システムおよび方法に関する。

認証（承認、あるいは確認としても知られている）は、真のユーザであると主張しているユーザが真のユーザであるかを認証する処理である。認証の目的は、ユーザが、登録されている真のユーザであるかまたは詐称者（インポスタ）であるかどうかを決定することである。一般に、認証は、４つの段階、すなわち、入力を得る段階と、ノイズのような不要な入力をフィルタリングする段階と、入力を変換して、１組の特徴ベクトルを抽出する段階と、特徴ベクトルの統計表示を生成する段階と、登録手続き中に以前に収集された情報との比較を行う段階とを含む。

話者認証システム（音声認証システムとしても知られている）は、話者の音声の同一性が、認識されている音声に対する認証を受けられるように、話者の音声をマッチさせようとする。話者認証システムは、音声発声を用いることによって、安全なアクセスを保証するための手段を提供するのを支援する。所定の単語または語句の発話、あるいは単に、個々の話者のランダムに選択された単語または語句の音声サンプルは、アクセスを求めて話者認識システムおよび／または話者認証システムから承認を得ようとする場合に、要求者によって提供される。真の要求者とは、発声が、主張されている同一性に関連する認識されている特性にマッチした要求者のことである。

話者認証システムをトレーニングするために、要求者は、典型的に、要求者が主張した同一性に対応するモデルに対してスコアリングされる音声サンプルまたは音声発声を提供し、次に、要求者が主張した同一性が実際のものであることを確認するために、要求者のスコアが計算される。

従来の話者認証システムは、典型的に、話者認証を行うための比較的大きいメモリを必要とするという点で、複雑さが望ましくないほど高いという点で、また信頼性が低いという点で問題がある。例えば、多くの話者認証システムでは、話者の音声特性をモデル化するために、隠れマルコフモデル（Hidden Markov Model、ＨＭＭ）が用いられる。しかし、隠れマルコフモデルを用いると、資源制約付きまたは資源制限付きシステムに使用するには不適切な隠れマルコフモデルを作成する計算資源およびメモリ使用に関連して非常に費用がかかることがある。

他方、ベクトル量子化（Vector Quantization、ＶＱ）スキームを行う話者認証システムは、計算およびメモリ使用を少なく済ませることが可能である。あいにく、ベクトル量子化スキームには、しばしば、時間経過に伴う話者の音声の変化に対処できないという欠点があるが、この理由は、典型的なベクトル量子化スキームが、発声の期間にわたる人の音声の「静的スナップショット」を表すからである。

さらに、話者の気分（例えば、喜び、悲しみ、怒り）および話者の健康状態（例えば病気）のような種々の理由で、人の音声は変化することがある。話者が経年変化するにつれて、その話者の音声も変化し、すなわち、いずれにしても、話者認識アプリケーションにおいて、このような音声変化が音声認識アルゴリズムの適用における失敗の原因となることがある。

結果として、話者の音声の変化に適応させるかまたはそれを学習することができる音声バイオメトリクスアルゴリズムを開発することが望ましいであろう。

ユーザのバイオメトリック特徴の変化に基づいて、バイオメトリクスシステムに登録されているユーザのバイオメトリックモデルを更新するためのシステム、方法およびコンピュータプログラム製品の実施形態が記載されている。一実施形態によれば、ユーザから受け取った第１のバイオメトリックサンプルの分析に基づいて、そのユーザが承認される。第１のバイオメトリックサンプルと第１のモデルとを比較し、また前記サンプルと第２のモデルとを比較し得る。第１のバイオメトリックサンプルが、第１のモデルよりも第２のモデルの方によりぴったりとマッチしていた場合、第１のサンプルの特徴に基づいて第１のおよび第２のモデルを更新できる。第１のモデルは、登録時にユーザから得られた第２のバイオメトリックサンプルを用いて生成され、また第２のモデルは、以前に承認された第３のバイオメトリックサンプルを用いて生成される。

バイオメトリックサンプルが音声を含む実施形態を実施することが可能である。モデルの各々がコードブックを含むように、またベクトル量子化を用いて比較ステップを行うことができるように、それらのモデルを実行することも可能である。データ記憶装置を設けて、更新されたモデルを記憶することが可能である。

一実施形態では、比較ステップは、特徴と第１のモデルとの間で算出された歪みと、特徴と第２のモデルとの間で算出された歪みとを比較するステップを含むことができる。このような実施形態では、ユーザの承認中に、歪みを算出できる。

更新ステップが、各重心からの特徴の歪みに基づいてモデルの重心を再計算するステップを含む実施形態を実施することも可能である。更新ステップは、信頼係数をモデルに適用するステップも含み得る。

一実施形態では、特徴と第１のモデルとの相違点を判断し、また特徴と第２のモデルとの相違点を判断することによって、比較ステップを行うことが可能である。第１のバイオメトリックサンプルを分析して、第１のバイオメトリックサンプルの特徴の繰り返し発生に関する情報を確認することが可能である。次に、第１のバイオメトリックサンプルで発生した特徴の繰り返し発生に関する情報と、ユーザが発したと認識されるバイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報とを比較できる。繰り返し発生の比較に基づいて、判断された相違点にペナルティを付与し得る。このような実行方法では、モデルの更新ステップは、第１のバイオメトリックサンプルの特徴の繰り返し発生に関する情報に基づく係数によって、ユーザが発したと認識されるバイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報を修正するステップをさらに含むことが可能である。

本発明によれば、話者が本人であることを認証するための、より信頼性に優れたシステム、方法、およびプログラム製品を提供することができる。

概して、バイオメトリクスシステムに用いられている登録者の特定のバイオメトリクスの変化に、バイオメトリクスシステムに登録されているユーザ（すなわち登録者）のバイオメトリックデータ（例えばバイオメトリックモデル）を適応させるためのシステム、方法およびコンピュータプログラム製品の実施形態について説明する。

例えば、本明細書に記載されている実施形態を用いれば、システムに登録されている話者の声紋を適応させて、長時間にわたる話者の音声の変化を追跡することができる話者認識システムを実行することが可能である。声紋の変化の大きさは、例えば、話者の音声で検出された声質の変化に依存し得る。本明細書に記載されている実施形態は、システムの「誤った拒否率」（false rejection rate、ＦＲＲ）を低減するのを支援して、登録者のバイオメトリック特徴／特性が変化することにより登録者がバイオメトリクスシステムに頻繁に再登録する負担を回避するのを支援することによって、バイオメトリクス認識システムを改良するのを支援する際に有用であり得る。

一般に、ベクトル量子化システムは、典型的にコードブックとして公知のものを用いる。トレーニング中に、話者の音声の明確な特徴を符号化するエントリで、コードブックを構成することが可能である。トレーニングされると、次に、ベクトル量子化システムを使用して、話者の同一性を認証することが可能である。正当な人物であると主張している話者（「要求者」）の特徴と、予めトレーニングされたコードブックとを比較し得る。要求者が、コードブックの対応するエントリにぴったりマッチしていると決定された場合、話者の同一性が認証される。逆に、要求者がぴったりマッチしていないと決定された場合、話者が主張した同一性が否定される。概して、適応処理の実施形態は以下のように実施することが可能である（音声ベースのシステムに関連して）。

最初に、ユーザは、音声サンプル（例えば発声）を提供して声紋を生成することによってバイオメトリクスシステムに登録する。次に、この声紋を基本声紋として記憶できる。ユーザが引き続き認証を試みて、認証が成功した場合には、そのユーザの声紋を更新できる。更新された声紋は追跡声紋として記憶し得る。基本声紋および追跡声紋を共に用いて、ユーザの同一性を決定することが可能である。ユーザの音声は時間の経過と共に変化するので、追跡声紋を用いて、その人物の音声の変化を記録することが可能であり、認証アルゴリズムをユーザの音声に適応させまたその音声を学習することが可能になる。
バイオメトリクスシステム
概して、長時間にわたる登録者のバイオメトリック特徴（例えば特性）の変化に、バイオメトリクスシステムに登録されているユーザ（すなわち登録者または真のユーザ）のバイオメトリックデータを適応させ得る機構として、増分するトレーニング(incremental training)を用いることが可能である。例えば、増分するトレーニングを話者認証システムに用いて、登録者が経年変化するのに伴う登録者の音声の変化に登録者の声紋を適応させてもよい。各成功確認周期（すなわち、要求者が、バイオメトリクスシステムによって真（すなわち主張した登録者）であると決定される確認イベント）では、確認のために要求者から得たバイオメトリックサンプル（例えば音声サンプル）を用いて、登録者のバイオメトリックデータ（例えば登録声紋）を適応させ得る。したがって、増分するトレーニングは、バイオメトリクスシステムが、時間経過に伴う登録者のバイオメトリック特徴の変化に合わせて調節するのを支援するための追跡方法および適応方法であると考えることができる。本明細書の実施形態を説明する際には、バイオメトリックという用語は、例えば人のような生命体の身体特性または行動特性（例えば、音声、指紋、虹彩、外見、筆跡）を指すことが可能である。

図１は、増分するトレーニングを行うことができる模範的なバイオメトリクスシステム１００、より具体的には、話者認識（例えば認証）システムを示している。バイオメトリクスシステム１００は、同一性を主張する要求者のバイオメトリックデータと、同一性データとして認識されているバイオメトリックデータ（例えば、バイオメトリクスシステムの登録者のバイオメトリックデータ）とを比較して、同一性を主張した要求者が真であるかどうかを確認する（すなわち認証する）ためにバイオメトリクス認証処理を行うことができる認証モジュール１０２を含み得る。

図１に示したように、バイオメトリクスシステムに登録されているユーザ（すなわち登録者）の同一性を主張する要求者のバイオメトリックサンプル１０４（この場合音声サンプル）は、バイオメトリクスシステム１００の認証モジュール１０２によって入力１０４として受け取ることが可能である。認証モジュール１０２によって、入力サンプル１０４から特徴を抽出し得る。音声ベースの実行方法では、認証モジュール１０２は、当業者に公知の標準的な信号処理方法を用いて特徴抽出を行うことが可能である。特徴を抽出する前に、入力音声サンプル１０４を前処理して、ノイズ、利得制御等を除去することが可能であることに留意されたい。この前処理は、入力サンプル１０４が、認証モジュール１０２によって（例えば、ある種の前処理コンポーネントによって）または認証モジュール１０２自体によって受け取られる前に行うことが可能である。１つの実行方法では、入力音声サンプル１０４は、例えば、ほぼ約０．２秒〜４．０秒の短い持続時間の連続音声を含み得る。

バイオメトリクスシステム１００は、バイオメトリクスシステム１００に登録されているユーザ（すなわち登録者）に関連するバイオメトリックデータを記憶するためのデータベースのようなデータ記憶装置１０６も含むことが可能である。データ記憶装置１０６を認証モジュール１０２に接続することが可能であるので、認証モジュール１０２は、入力サンプル１０４から抽出された特徴と比較するために（すなわちバイオメトリクス認証処理中に）、データ記憶装置１０６に記憶されているバイオメトリックデータにアクセスできる。音声ベースの実行方法では、データ記憶装置１０６は、１つ以上の声紋を記憶することが可能であり、各声紋はバイオメトリクスシステム１００の登録者の固有の音声署名を表す。例えば、バイオメトリクスシステム１００によって行われる登録処理および／または適応処理中に、声紋を生成し得る。

要求者の入力サンプル１０４から抽出された特徴と登録者のバイオメトリックデータ（例えば声紋）との比較に基づいて、認証モジュール１０２は、比較したデータ間の類似度または逆に相違度を表すマッチングスコア１０８を出力することが可能である。

要求者が主張した同一性を承認する（すなわち、要求者が「真」であると承認する）かどうかを決定するための決定モジュールをバイオメトリクスシステム１００に含み得る。決定モジュール１１０を認証モジュール１０２に接続することが可能であるので、決定モジュール１１０は認証モジュール１０２からマッチングスコア１０８を受信することが可能である。決定モジュール１１０は、出力されたマッチングスコア１０８を信頼スコアに変換でき、および／または要求者が主張した同一性を承認するかどうかを決定するために「はい／いいえ」の決定を行うことが可能である。

図１に示したように、決定モジュール１１０が「はい」の決定を出力した場合（「はい」の経路１１２で図示）、要求者が主張した同一性を承認し得る（すなわち「開」状態になる）。他方、決定モジュール１１０が「いいえ」の決定を出力した場合（「いいえ」の経路１１４で図示）、同一性を主張した要求者の要求を拒否することが可能であり（すなわち「閉」状態になり）、このようにして、要求者は詐称者であると決定される（すなわち、主張した同一性は偽である）。

バイオメトリクスシステム１００は、増分するトレーニングによってテンプレート適応を行い、これによって、データ記憶装置１０６に記憶されているバイオメトリックデータを更新できるテンプレート適応モジュール１１６をさらに含み得る。図１に示したように、テンプレート適応処理の実行は、認証が成功した（すなわち「はい」の経路１１２に進んだ）かどうかに依存し、おそらくは、１つ以上の付加条件に依存することが可能である。
テンプレート適応
記載されているバイオメトリクスシステム１００では、認証中に、要求者の入力サンプルと、主張されている同一性（すなわち登録者）に関連して記憶されているバイオメトリックデータとを比較し得る。一実施形態では、要求者のサンプルと登録者のバイオメトリックデータとの間の歪みが閾値（例えば所定の閾値または予め規定された閾値）未満であった場合、認証は成功であるとみなすことが可能であり、またバイオメトリクスシステムによって、要求者を登録者として承認することが可能である。認証が成功すると、適応処理（「増分するトレーニング処理」と呼ぶことも可能である）に従って、今認証された要求者が入力したサンプルを用いて、バイオメトリクスシステムに記憶されている登録者のバイオメトリックデータを適応させることが可能である。

図２は、例示的な音声ベースのバイオメトリクスシステム（すなわち話者認識システム）に関連する適応処理を行うための模範的なアーキテクチャ２００を示している。この実行方法では、バイオメトリクスシステムは、バイオメトリクスシステムで話者を登録する間に話者が発した発声から、初期の声紋を生成し得る。登録者のこの元の声紋（「基本」声紋と呼ぶことが可能である）は、バイオメトリクスシステムによって「現状のままで」記憶することが可能である。要求者の認証が成功した、引き続く認証セッション（すなわち、要求者が、主張されている登録者であると特定された認証セッション）中に、その認証セッションで要求者が発した発声から生成された新たな声紋を用いて、元の声紋を適応させ得る。バイオメトリクスシステムは、要求者の発声から生成された声紋を、元の声紋とは別個の声紋（「適応される」または「追跡する」声紋と呼ぶことが可能である）として記憶することが可能である。一実施形態では、適応される声紋は、認証セッション中に入力された音声サンプルから生成された適応声紋と元の声紋との間の話者の音声の変化を表す増分量と元の声紋との和を含み得る。

図２に示したように、アーキテクチャ２００は、パターンマッチングを行うための１対のパターンマッチングモジュール２０２、２０４を含むことが可能である。一実施形態では、パターンマッチングモジュール２０２、２０４を、図１に示した認証モジュール１０２のサブモジュールとして含み得る。パターンマッチング処理の実行は、当業者に公知の方法に基づくことが可能であり、またパターンマッチングモジュール２０２、２０４は、１つ以上のパターンマッチング方法を行うこともでき得る。

図２に示した模範的な実行方法では、パターンマッチングモジュールの各々は、パターン照合方法を付加してまたは付加することなく、ベクトル量子化（ＶＱ）を用いてパターンマッチングを行うことができ得る。ベクトル量子化を用いて、要求者の音声サンプルから得られた特徴ベクトルと登録者の声紋との差を測定し、また測定された差に基づいてマッチングスコアを出力することが可能である。

認証セッション中に、パターンマッチングモジュール２０２、２０４の両方は、認証セッション中に提示された要求者の音声サンプルから抽出された特徴ベクトルを（入力２０６として）受け取る。次に、パターンマッチングモジュール２０２、２０４は、入力された特徴ベクトル２０６でパターンマッチングを行うことが可能であり、パターンマッチングモジュール２０２は、入力された特徴ベクトル２０６と、主張されている同一性の基本声紋２０８とを比較し、またパターンマッチングモジュール２０４は、入力された特徴ベクトル２０６と、主張されている同一性の追跡声紋２１０とを比較する。基本声紋（すなわち元の声紋）および／または追跡声紋のために、パターンマッチング処理を行い得る。

上述したように、ベクトル量子化を用いて、これらのパターンマッチングの比較を行うことが可能である。このような実行方法では、基本声紋２０８および追跡声紋２１０の各々は、コードブック２１２、２１４を含み得る。パターンマッチングの一環としてパターン照合も行う実行方法では、基本声紋２０８および追跡声紋２１０の各々は、登録者の音声の動的性質の表示を行うパターンテーブル２１６、２１８を含むことも可能である。登録者の基本声紋２０８および／または追跡声紋２１０は、データ記憶装置、例えば、図１に示したデータ記憶装置１０６に記憶しまたそこから読み出すことが可能である。

パターンマッチングの結果として、２つの別個のマッチングスコアｄ１、ｄ２（ベクトル量子化を用いた実施形態において歪みスコアを含み得る）が、パターンマッチングモジュール２０２、２０４から出力される。ベクトル量子化を用いて（パターンを追跡してまたはパターンを追跡することなく）パターンマッチングを行う実施形態では、出力されたマッチングスコアｄ１、ｄ２は、歪みスコアを含み得る。常に、マッチングスコアｄ１は、パターンマッチングモジュール２０４から出力され、また入力された特徴ベクトル２０６と追跡声紋２１０との相違量または相違度を表す。同様に、マッチングスコアｄ２は、パターンマッチングモジュール２０２から出力され、また入力された特徴ベクトル２０６と基本声紋２０８との相違量または相違度を表す。一実施形態では、低い値を有するマッチングスコアを用いて、入力された特徴ベクトル２０６と適切な声紋２０８、２１０との相違度が、より高い値を有するマッチングスコアよりも低いことを指示することが可能である（すなわち、マッチングスコア値が低くなるとそれだけ類似性が高くなる）。

代わりに、１対のパターンマッチングモジュールではなく、単一のパターンマッチングモジュールを用いて、実行方法を行い得ることに留意されたい。このような実行方法では、単一のマッチングモジュールは、適応処理に用いられる歪み値の両方を出力するために、入力された特徴ベクトルのパターンマッチングを２回行い、すなわち基本テンプレートで１回行って、追跡テンプレートで１回行うことが可能である。

決定モジュール２２０をパターンマッチングモジュールに接続して、出力されたマッチングスコアｄ１、ｄ２の両方を受信することが可能である。決定モジュール２２０は、入力された特徴ベクトル２０６が、基本声紋２０８よりも追跡声紋２１０の方によりマッチしている（すなわち、よりぴったりとマッチしている）かどうかを決定するために、マッチングスコアｄ１、ｄ２の比較を行い得る。

図２に示した実行方法では、マッチングスコアｄ１の値がマッチングスコアｄ２の値未満であった場合に、入力された特徴ベクトル２０６は、適応、追跡声紋２１０により良くマッチしていると決定される（これによって、入力された特徴ベクトル２０６と基本声紋２０８とよりも、入力された特徴ベクトル２０６と追跡声紋２１０との方が相違点が低い／類似性が高いことが示される）。入力された特徴ベクトル２０６が基本声紋２０８よりも適応、追跡声紋２１０の方によりぴったりとマッチしていることを決定モジュール２２０が決定した場合、決定モジュール２２０は、適応モジュール２２４を呼び出すための出力２２２（「はい」）を生成し得る。

一実施形態では、決定モジュール２２０は、マッチングスコアｄ１、ｄ２の比較の実行を、要求者が主張されている同一性／登録者にマッチしていると決定される（すなわち要求者が真であると決定される）認証セッションに制限し得る。このようにして、要求者が詐称者であると決定された（すなわち、要求者が、主張されている同一性にマッチしていないと決定された）場合、決定モジュール２２０は、マッチングスコアｄ１、ｄ２の比較を行わなくてもよい。１つの実行方法において、認証セッションを成功させるには、要求者を承認するかまたは拒否するかどうかを決定するために用いられる決定閾値よりも低い両方のマッチングスコアｄ１、ｄ２が必要となり得ることに留意されたい。

適応モジュール２２４は、時間経過に伴う（例えば登録者が経年変化するのに伴う）登録者の音声の変化に登録者の声紋を適応させるための適応処理を行うことができ得る。図２に示した実行方法では、適応モジュール２２４は、決定モジュール２２０によって生成された出力２２２によって呼び出されたときに適応処理の実行を開始し得る。この処理は、基本声紋（すなわち元の声紋）および追跡声紋の両方のために行うことが可能である。
適応処理
図３は、音声ベースのバイオメトリクスシステムの実行方法に関連する模範的な適応処理のフローチャート３００を示している。この適応処理は、例えば、図１と図２に示したバイオメトリクスシステム１００およびアーキテクチャ２００を用いて行うことが可能である。認証が成功した後に、この適応処理を用いて、コードブック値およびパターンテーブル値の両方を再計算し得る。

演算３０２では、バイオメトリックサンプル（例えば、話者の発声のような音声サンプル）は、バイオメトリクスシステムの登録者であると主張している（すなわち同一性を主張している）要求者（例えば話者）からの入力として得られる。演算３０４では、１つ以上の特徴ベクトルは、入力されたバイオメトリックサンプルから発生される。例えば、図１に示した認証モジュール１０２によって、演算３０４を行い得る。音声ベースの実行方法では、当業者に公知の音声処理方法を用いて、特徴ベクトルを入力サンプルから抽出することが可能である。

演算３０６では、マッチングスコアｄ１とｄ２（本明細書において「歪みスコア」または単に「歪み」と呼ぶことも可能である）は、要求者のサンプルから（演算３０４から）発生された特徴ベクトルと、登録者に関連する基本テンプレートおよび適応テンプレートとの間で計算することが可能であり、マッチングスコアｄ１は、特徴ベクトルと基本テンプレートとを用いて計算され、またマッチングスコアｄ２は、特徴ベクトルと適応テンプレートとを用いて計算される。図３に示した音声ベースの実行方法によって示したように、基本テンプレートおよび適応テンプレートの各々はコードブックを含むことが可能であり、またマッチングスコアは、ベクトル量子化方法（パターン照合処理を行ってまたは行うことなく）を用いて計算された歪みスコアまたは歪み値を含むことが可能である。例えば、図２に示したパターンマッチングモジュール２０２と２０４によって、演算３０６を行い得る。

決定３０８では、マッチングスコアｄ１とｄ２を用いて、要求者の特徴ベクトルが、基本テンプレートよりも適応テンプレートの方によりぴったりとマッチしているかどうかを決定することが可能である。一実施形態では、要求者が主張した同一性が認証された（すなわち要求者が真であると決定された）場合にのみ、決定３０８を行い得る。さらに、このような実施形態では、要求者が主張した同一性を承認するためにバイオメトリクスシステムによって設定された決定基準内に両方のマッチングスコアｄ１とｄ２の値が存在する（例えば決定閾値未満である）ことが認識されるそれらの認証セッションに、決定３０８を制限することが可能である。

上述したように、マッチングスコアｄ１、ｄ２は、要求者の特徴ベクトルと、それに対応するテンプレートとの相違度を表すことができ、マッチングスコアが低くなるということは、特徴ベクトルと所定のテンプレートとの類似度がそれだけ高くなる（すなわち相違点が低くなる）ということを示している。したがって、マッチングスコアｄ１の値がマッチングスコアｄ２の値よりも低かった（すなわちマッチングスコアｄ１＜マッチングスコアｄ２）場合、要求者の特徴ベクトルと基本テンプレートとよりも要求者の特徴ベクトルと適応テンプレートとの方が、類似性が高くなる（すなわち相違点が低くなる）ことを示している。例えば、図２に示した決定モジュール２２０によって、決定３０８を行い得る。

特徴ベクトルが、基本テンプレートよりも適応テンプレートの方に類似していないと決定された（すなわちマッチングスコアｄ１≧マッチングスコアｄ２）場合、適応処理を決定３０８で終了することが可能である。

他方、特徴ベクトルと適応テンプレートとの類似性が、特徴ベクトルと基本テンプレート歪みとの類似性よりも高いと決定された場合、処理は、各重心からの特徴ベクトル歪みに基づいて重心が再計算される演算３１０に進んでもよい。一実施形態では、適応されるテンプレート（すなわち、適応されるコードブック）および／または基本テンプレート（すなわち基本コードブック）の重心は、それぞれの各重心からの関連する特徴ベクトル歪み（例えば、適応されるテンプレートの重心からの歪み「ｄ１」、および元のコードブックの重心からの歪み「ｄ２」）に基づいて再計算することが可能である。例えば、図２に示した適応モジュール２２４によって、演算３１０を行い得る。

実行方法において、パターンマッチングの実行時にパターン照合方法が用いられた場合、演算３１２では、登録者に関連するパターンテーブル値は、例えばアクセスパターンに基づいて再計算される。例えば、図２に示した適応モジュール２２４によって、演算３１２を行い得る。

演算３１４では、演算３１２で再計算されたパターンテーブル（すなわち、基本パターンテーブルおよび適応されるパターンテーブル）の、および演算３１２で再計算されたパターンテーブルの形態を更新すると共に、演算３１０で算出された重心を再計算した状態で、登録者の基本テンプレートおよび適応されるテンプレートを（例えばデータ記憶装置１０６に）記憶することが可能である。
擬似コードの実施例
以下の模範的な擬似コードは、模範的な音声ベースの実行方法に関連する適応処理（すなわち演算３０２〜３０８）の意思決定部分を説明するのをさらに補足するように示されている。

すなわち、
特徴＿ベクトル = 特徴＿抽出(入力＿音声)；
歪み1 = 計算＿間隔(特徴＿ベクトル, 適応される＿コードブック)；
歪み2 = 計算＿間隔(特徴＿ベクトル, 元の＿コードブック)；
(歪み1 < 歪み2)であるならば、
重心を再計算
パターンテーブル値を再計算
終了
ここで、
「入力＿音声」は、要求者が入力した音声サンプルを表している。

「特徴＿抽出」は、音声サンプル「入力＿音声」から特徴ベクトルを抽出するための１つまたは複数の音声処理方法を表している。

「特徴＿ベクトル」は、１つまたは複数の音声処理方法「特徴＿抽出」を用いて音声サンプル「入力＿音声」から抽出された特徴ベクトルを表している。

「適応される＿コードブック」は、要求者が主張している登録者の適応テンプレートのベクトル量子化コードブックの実行方法を表している。

「元の＿コードブック」は、要求者が主張している登録者の基本テンプレートのベクトル量子化コードブックの実行方法を表している。

「計算＿間隔」は、特徴ベクトル「特徴＿ベクトル」と所定のコードブックの重心との間隔を算出するためのベクトル量子化方法を表している。

「歪み１」は、方法「計算＿間隔」を用いて、特徴ベクトル「特徴＿ベクトル」と、適応されるテンプレート「適応される＿コードブック」の重心とから算出された歪み（すなわちマッチングスコアｄ１）を表している。

「歪み２」は、方法「計算＿間隔」を用いて、特徴ベクトル「特徴＿ベクトル」と、基本テンプレート「元の＿コードブック」の重心とから算出された歪み（すなわちマッチングスコアｄ２）を表している。

「重心を再計算」では、基本テンプレートおよび適応されるテンプレートの重心を再計算するための処理が呼び出される（演算３１２を参照）。

「パターンテーブル値を再計算」では、基本テンプレートおよび適応されるテンプレートに関連するパターンテーブル値を再計算するための処理が呼び出される（演算３１４を参照）。

このようにして、上記の擬似コードに従って、要求者の特徴ベクトルのベクトル量子化歪みが、適応されるコードブックおよび基本コードブックの少なくとも１つに対して決定される。適応されるコードブック歪み（歪み１）が、基本コードブック歪み（歪み２）よりも小さい場合、複数のコードブックの内の１つに関する重心およびパターンテーブル値が再計算される。

以下の模範的な擬似コードは、模範的な音声ベースの実行方法に関連する適応処理（すなわち演算３１０と３１２）の再計算部分を説明するのをさらに補足するように示されている。

すなわち、
歪み = 計算＿間隔(特徴＿ベクトル, 元の＿コードブック)；
j = 1のコードブック＿サイズである場合、
適応される＿コードブック(j) = 元の＿コードブック(j) + (信頼＿係数) *平均(重心「j」に対応する特徴＿ベクトル)；
適応される＿パターン＿テーブル(j) = パターン＿テーブル(j) + パターン＿係数 * 新たな＿パターン；
終了
ここで、
「特徴＿ベクトル」は、要求者が提供したサンプルから抽出された特徴ベクトルを表している（ここで真であると決定される）。

「元の＿コードブック」は、認証セッションで用いられる基本テンプレートのベクトル量子化コードブックの実行方法を表している。

「歪み」は、方法「計算＿間隔」を用いて特徴ベクトル「特徴＿ベクトル」と基本テンプレート「元の＿コードブック」の重心とから算出された歪みを表している。

「コードブック＿サイズ」は、基本テンプレートの複数の重心を表している。

「適応される＿コードブック（ｊ）」は、サイズ「ｊ」の（すなわちｊの重心を有する）適応されるコードブックを表している。

「元の＿コードブック（ｊ）」は、サイズ「ｊ」の（すなわちｊの重心を有する）基本コードブックを表している。

「信頼＿係数」は、マッチングスコアに基づいて計算される値を表しており、また具体的な実行方法の利用環境に依存し得る。

「平均（重心「ｊ」に対応する特徴＿ベクトル）」は、対応する重心に対して最小の歪みを有する特徴ベクトルの平均を表している。

「適応される＿パターン＿テーブル（ｊ）」は、適応される＿コードブック（ｊ）に関連する適応されるパターンテーブルを表している。

「パターン＿テーブル（ｊ）」は、元の＿コードブック（ｊ）に関連する元のパターンテーブルまたは「基本」パターンテーブルを表している。

「パターン＿係数」は、所定の実行方法が用いられる環境の関数であり得る調整可能なパラメータを表している。

「新たな＿パターン」は、基本パターンテーブルと同様に算出されたパターンテーブルを表している。

上記の擬似コードに従って、認証セッションが成功した間に発せられた認証発声を用いることによって、登録者の声紋（すなわちテンプレート）を適応させることが可能である。認証発声から抽出された特徴は、正味の歪みに応じてコードブックの複数の重心に割り当てられる。次に、重心値を再計算し得る。より具体的には、各特徴ベクトルの歪みは、各コードブックエントリ（すなわち重心）に対して計算され、この結果、コードブックの重心の各々からの特徴ベクトルの歪みのすべてのエントリを有する歪み行列を生成できる。次に、コードブックのエントリ（すなわち重心）毎に、存在する重心と、信頼係数（例えば信頼＿係数）で修正された（すなわちそれで乗算された）当該特定のエントリに対して最小の歪みを有する特徴ベクトルの平均との和として、変更される重心を計算できる。パターンテーブルの値を再計算するために、同様の処理を適用し得る。コードブックを有する特徴ベクトルのパターンに応じて、パターンテーブルを適応させることができる。適応されるパターンテーブルは、存在するパターンテーブル（すなわち基本パターンテーブルまたは元のパターンテーブル）と、パターン係数（すなわちパターン＿係数）で修正された（すなわちそれで乗算された）新たなパターン（元のパターンテーブルと同様に算出された）との和を含み得る。
パターン照合
パターン照合をバイオメトリクス認証システム（例えば話者認証システム）に用いて、例えば短い発声のような範囲の狭いバイオメトリクスに用いるために適用可能であり得る修正されたベクトル量子化スキームを提供するのを支援することが可能である。この修正されたベクトル量子化スキームにより、音声の変化に関する一定の情報量を適時付加することによって、従来のベクトル量子化に基づく認証システムを改良するのを支援することができる。コードブックの長さ（すなわち、コードブックに含まれているエントリ量）は、典型的に、所定の話者の音声の明確な特性のすべてまたはほとんどに対応するように十分に長くなければならない。長い発声が話者認証システムに入力された場合、話者の音声のいくつかの特性が長時間にわたって繰り返され、これにより、コードブックのいくつかのエントリに関する複数の問い合わせが行われる。他方、短い発声のほとんどの特性は固有であると認識されている。結果として、短い発声が用いられるときには、コードブックエントリに関する複数の問い合わせはほとんど行われない場合がある。したがって、所定の話者および発声については、コードブックエントリの問い合わせの頻度を得ることによって、人の音声のいくつかの時間特性を得ることが可能になる。次に、認証中に、これらの特性を比較し得る（標準コードブックの比較に加えて）。

図４は、話者認証エンジン用の例示的な認証システムアーキテクチャ４００を示している。認証システムアーキテクチャ４００は、対象者（すなわち話者）からのバイオメトリック入力を受け取るためのバイオメトリックインタフェースコンポーネント４０２を含み得る。図４の実行方法に示したように、対象者が発した音声入力４０４（すなわち音響または発声）を受け取るために、バイオメトリックインタフェースコンポーネント４０２を適応させることが可能である。バイオメトリックインタフェースコンポーネントによって得られた１つまたは複数のバイオメトリック入力４０４を受け取り、またバイオメトリック入力４０４を、バイオメトリックアプリケーションによって利用可能な形態に変換するために、プリプロセッサコンポーネント４０６をバイオメトリックインタフェースコンポーネントに接続し得る。

プリプロセッサコンポーネント４０６の出力は、変換されたバイオメトリック入力をプリプロセッサコンポーネント４０６から受信する特徴抽出コンポーネント４０８に接続することが可能である。ＶＱトレーニングおよびルックアップコンポーネント４１０（より具体的にはベクトル量子化トレーニングおよびルックアップコンポーネント）を特徴抽出コンポーネント４０８に接続することにより、トレーニングおよびルックアップコンポーネント４１０が、特徴抽出コンポーネント４０８から出力されたデータを受信することが可能になる。トレーニングおよびルックアップコンポーネント４１０を用いて、ベクトル量子化を行い、また発声４０４から抽出された特徴ベクトルに基づいて特徴ベクトル分析を繰り返すことが可能である。

さらに、トレーニングおよびルックアップコンポーネント４１０をコードブックデータベース４１２（より具体的にはトークンデータベース用の話者コードブック）と時間タグカウントデータベース４１４（より具体的には、予めトレーニングされた時間タグカウントデータベースまたは参照ログデータベース）とに接続することが可能であり、これにより、トレーニングおよびルックアップコンポーネント４１０が、トレーニング中および認証中にデータを読み取りおよび／または書き込むことが可能になる。コードブックデータベース４１２および時間タグカウントデータベース４１４の各々は、適切なメモリおよび／または記憶装置に属し得る。

認証システムアーキテクチャ４００は決定モジュール／コンポーネント４１６をさらに含むことが可能であり、この決定モジュール／コンポーネント４１６をトレーニングおよびルックアップコンポーネント４１０に接続して、トレーニングおよびルックアップコンポーネント４１０から出力されたデータ／情報を受信することが可能である。適切なメモリおよび／または記憶装置に属する正当なインポスタモデルデータベース４１８を決定モジュールに接続して、正当なインポスタモデルデータベース４１８からデータを読み取りまたそのデータベース４１８にデータを書き込むことが可能である。決定モジュール４１６は、音声入力４０４に関連する対象者に承認４２０を発行するかまたは拒否４２２を発行するかどうかを決定するために（すなわち、話者が主張した同一性を認証するかまたは否定するかどうかを決定するために）、トレーニングおよびルックアップコンポーネント４１０と正当なインポスタモデルデータベース４１８とから得られたデータを用い得る。

図５Ａと図５Ｂは、一実施形態によるベクトル量子化（ＶＱ）トレーニング処理５００のフローチャートを示している。１つの実行方法では、図４に示したトレーニングおよびルックアップコンポーネント４１０によって、トレーニング処理５００を行うことが可能である。典型的な音声認証システムは、話者認証を成功させるために、典型的に、長く発話したパスワードまたは短い発声の組み合わせの入力を要求してくる。このようなシステムでは、発話したパスワードの長さが短くなることによって、話者認証の精度の著しい低下を招くことがある。本明細書に記載されている認証システムアーキテクチャの実行方法は、修正されたあまり複雑ではないベクトル量子化方法を用いることが可能である。これらの修正は、ベクトル量子化方法の実行時間を短くしてその方法をなお用いつつ、ダイナミックプログラミング（Dynamic Time Warping、ＤＴＷ）およびＨＭＭと同様の時間で音声の変化を考慮するように意図される。

演算５０２では、ベクトル量子化トレーニングは、所定の音声トークンおよび所定の話者のために行われる。ベクトル量子化トレーニングは、演算５０２を行うために、任意の公知のベクトル量子化トレーニング方法を用いることが可能である。例えば、トレーニングは、リンデ・ブゾ・グレイ（ＬＢＧ）アルゴリズム（ＬＢＧ設計アルゴリズムとも呼ばれる）を用い得る。すべての音声トークンおよび話者のために、ベクトル量子化トレーニング処理が完了するまで、音声トークンおよび話者毎に、演算５０２のベクトル量子化トレーニングを繰り返すことが可能である。

演算５０６では、コードブックへの参照リストは、演算５０２で行われたベクトル量子化トレーニング処理から得られる。コードブックへの参照リストは、発声で発生した特徴ベクトルのすべてのリストを含み得る。図５Ａに示したように、演算５０６は、以下の模範的な擬似コードを用い得る。

すなわち、
フレームインデックス[フレーム番号] = コードブックインデックス
ここで、
「フレームインデックス」は、端から端まで順序付けられたすべての繰り返しに関する音声フレームとコードブックエントリとの間のマップである。

「フレーム番号」は、設定｛１．．．最大フレーム｝と、最も近いマッチングコードブックエントリとの間の値である。

「コードブックインデックス」は、セット｛１．．．コードブック長さ｝の値である。

上記の擬似コードに記載されているように、参照リストは、発声で認識された特徴ベクトルを、各特徴ベクトルが認識される発声の１つまたは複数の特定のフレームにマッピングするフレームインデックスを含み得る。例示的な実施例として、フレームｘ、ｙおよびｚと、特徴ベクトルａ、ｂ、ｃおよびｄとを含む発声において、参照リスト（すなわちフレームインデックス）は、特徴ベクトルａがフレームｘとフレームｚとに発生すること、特徴ベクトルｂとｃのいずれかがフレームｙに発生すること、および特徴ベクトルｄがフレームｚに発生することを特定することが可能である。

演算５０８では、トークンコードブックカウント（「ｔｃｂＣｎｔ」）はゼロに初期化される。演算５１０では、トークンコードブックカウントはアクセスカウントで構成される。アクセスカウントは、発声において所定の特徴ベクトルが発生するその発生数を反映し得る。上記の例示的な実施例を引き続き説明すると、演算５０８は、特徴ベクトルａに関するアクセスカウントを５回発生させ、また特徴ベクトルｂ、ｃおよびｄの各々に関するアクセスカウントを１回発生させる。以下の模範的な擬似コードを用いて、演算５１０の実行方法についてさらに説明する。

すなわち、
ii = 1から最大フレームである場合、
//増分cbエントリアクセスカウント
RefLog(i(ii)) = RefLog(フレームインデックス[フレーム番号]) + 1；
終了
次に、以下の模範的な擬似コードによって示すように、演算２１２の繰り返し数に対してトークンコードブックカウントを平均化し得る。

すなわち、
//繰り返し数に対する平均指数
ii = 1からコードブック＿サイズである場合、
RefLog(ii) = RefLog(ii)/繰り返し数；
終了
このようにして、演算５１２では、発声の所定の特徴ベクトルの発生総数を、発声で認識された特徴ベクトルの繰り返し発生の総数で除算して、フレームインデックスの各特徴ベクトルの総アクセスカウントを平均化することが可能である。

トークン毎に演算５１０と５１２で得られたデータは、メモリおよび／または記憶装置に属し得る参照ログ５１４（「ＲｅｆＬｏｇ」）に記憶することが可能である（例えば図４のデータベース４１４）。各トークンの参照ログ５１４は、音声フレームによる参照数を各コードブックエントリに反映する。参照ログ５１４用の模範的なフォーマットが以下の表１に示されている。

上記の表１に示したように、所定のトークンの参照ログ５１４は、１に等しいエントリから、当該特定のトークンに関するコードブックサイズに等しいエントリまでのコードブックエントリ（すなわち左側の列）を含むことが可能である。例示的な参照ログ５１４の右側の列には、所定の特徴ベクトルにおけるその発生数ならびに発声における所定の特徴ベクトルの発生総数を記憶し得る。例えば、上記の表のコードブックエントリ「１」が、話者の以前の例示的なシナリオからの特徴ベクトルａに一致した場合、表の右側の列は、発声における合計で２回の発生（すなわち、特徴ベクトルａに関する２回の繰り返し発生）について特徴ベクトルａがフレームｘとｚに１回発生するコードブックエントリ「１」に関する行に指示を出すことが可能である。

演算５１６および決定５１８を参照すると、トレーニング中に、すべてのトークンに関する参照ログは、最大のコードブック参照数を含む新たな参照ログを生成するように組み合わせられる。参照ログは、多数の話者およびトークンに関する参照ログを有するデータベース５２０から得られる。コードブックエントリ毎に、最大の参照数フィールドが、すべての参照ログから選択され、またグローバル参照ログ５２２（ＧＲｅｆＬｏｇ）を構成するために用いられる。

グローバル参照ログデータベース５２２に関する模範的なフォーマットが以下の表に示されている（参照ログ５１４に関する模範的なフォーマットと同様である）。

演算５１６と５１８に示したように、コードブックエントリ「１」が第１の参照ログを２回、第２の参照ログを３回、また第３の（最後の）参照ログを５回繰り返したことが認識された場合、ＧＲｅｆＬｏｇのコードブックエントリ「１」に関する参照エントリ数は５回の繰り返し値に設定される。１つまたは複数のＲｅｆＬｏｇと同様に、生成されたＧＲｅｆＬｏｇはメモリおよび／または記憶装置に属し得る（例えば図４のデータベース４１４）。

図６は、一実施形態によるベクトル量子化認証処理６００に関するフローチャートを示している。この認証処理において、特定の同一性を主張する話者（すなわち要求者）の発声を分析して、話者が主張した同一性が実際のものであるかどうかを決定することが可能である。演算６０２では、所定の言語単語列部分集合（ＬＶＳ）、トークンおよび話者に関する特徴ベクトルをロードし得る。これらの特徴ベクトルのために、演算６０４において、最も近いマッチングエントリをコードブックから得ることが可能である。さらに、特徴ベクトルとマッチングエントリとの間隔（すなわち歪み測定値）を演算６０４で決定することも可能である。

演算６０６では、パターン照合を行い得る。発生数に関する基準を満たさなかった場合、ペナルティを付与することが可能である。以下の模範的な擬似コードを用いて、演算６０６の実行方法についてさらに説明する。

すなわち、
認証RefLog = 認証トークンに関する生成RefLog
stg = 認証RefLogからのトークンに関する参照総数
stc = RefLogからのトークンに関する参照総数
総ペナルティ = 0；
//アクセス番号の正規化
実際のもの = stg/stc；
認証RefLog[1...コードブック＿サイズ] = 認証RefLog[1...コードブック＿サイズ]/実際のもの；
//認証RefLogとRefLogとの差に基づくペナルティの付与
cb = 1 : コードブック＿サイズである場合、
mx = 最大(認証RefLog(cb), RefLog(cb))；
mn = 最小(認証RefLog(cb), RefLog(cb))；
(((mx - mn) >= noiseMin) & (mx >= mn * diffFact))であるならば、
((mx - mn) <= validDiff)であるならば、
patDif = (mx-mn)/2；
さもなければ
patDif = (mx - mn) * 1.5；
終了
ペナルティ = patDif * eer；
総ペナルティ = 総ペナルティ + ペナルティ；
終了
終了
間隔 = VQdist + 総ペナルティ
ここで、
「認証ＲｅｆＬｏｇ」は、要求者が発した発声から抽出された特徴ベクトルから生成されたＲｅｆＬｏｇである。図５Ａと図５Ｂの演算５０８〜５１８に記載されているのと同様の処理を用いて、要求者の発声における特徴ベクトルの繰り返し発生に関する情報を得ることによって、認証ＲｅｆＬｏｇを生成することが可能である。

「ｎｏｉｓｅＭｉｎ」は、声質が変化したことによる参照数の観察された変化である。上記の実施例では、ｎｏｉｓｅＭｉｎは２の値に設定される。

「ｄｉｆｆＦａｃｔ」は、ＲｅｆＬｏｇの参照数と認証ＲｅｆＬｏｇの参照数との係数差を表している。大きい値を用いることにより、ペナルティが付与される前に、人の音声のより大きい変化を許容できる。小さい値はその逆の効果を生じさせる。上記の実施例では、ｄｉｆｆＦａｃｔは２の値に設定される。

「ｖａｌｉｄＤｉｆｆ」は値である。この値よりも小さい差は、エラー（詐称者）の可能性がより低いことを表し、したがって、小さいペナルティ（５０％の差）が付与される。この実施例では、小さいペナルティは５に設定される。ｖａｌｉｄＤｉｆｆよりも大きい差は、エラーの可能性が高いことを表し、また大きいペナルティ（１５０％の差）が付与される。代わりに、固定値が２のペナルティではなく、付与されたペナルティとｖａｌｉｄＤｉｆｆとの間の連続関係を用いてもよい。

「ｅｅｒ」は、音声バイオメトリクス装置の動作特性から導出される等しいエラーレートである。

「間隔」は、入力された音声とトレーニングセッションからの音声との間隔の合計である。大きい間隔は音声サンプルの大きい差を示している。

演算６０６用の擬似コードはパターンマッチング照合処理を示している。ベクトル量子化アクセスパターンは、登録中に記憶されて、認証中にマッチされる。ペナルティは、マッチしなかった場合に付与される。

演算６０８では、擬似ノイズおよび／または擬似音響に関する照合を行い得る。任意のエントリが、最大のマッチング数よりも多くのマッチングを有していると決定された場合、ペナルティが付与される。演算６０６と６０８において、データベース６１０から得られたトークン参照ログおよびグローバル参照ログに関するデータを用いることが可能である。以下の模範的な擬似コードを用いて、演算６０８の実行方法についてさらに説明する。

すなわち、
cb = 1 : コードブック＿サイズである場合、
(認証RefLog(cb) >= GRefLog(cb))であるならば、
間隔 = 間隔 + 大きいペナルティ；
終了
終了
ここで、
「大きいペナルティ」は、間隔が詐称者を示すのに十分な大きさであろう値である。音声活動検出器（ＶＡＤ）が正確に機能せずに、擬似の非音声フレームが承認されてしまうことをノイズ／擬似音響照合が指示し得ることにも留意されたい。大きいペナルティの値は、性質または使用するＶＡＤエンジンを考慮するように調整することが可能である。

演算６０８用の擬似コードは擬似音響／ノイズ照合処理を示している。グローバルパターンマッチングテーブルＧＲｅｆＬｏｇは人の音声の最大の変化を示している。これらの値よりも大きい変化は擬似音響または擬似ノイズの存在を示している。

次に、修正されるベクトル量子化間隔（すなわち歪み）は演算６１２で決定される。図示したように、１つの実行方法では、演算６０４で算出された１つまたは複数の標準ベクトル量子化間隔から演算６０６と６０８で付与された総ペナルティを（もしあれば）加算（または減算）することによって、修正されるベクトル量子化間隔を算出することが可能である。

演算６１４では、調整されたベクトル量子化間隔と、所定の言語単語列部分集合および／またはトークンに関連する正当なインポスタモデルとを用いて、要求者の同一性を承認するかまたは否定するかどうかについての決定を行い得る。図示したように、決定モジュールによって、演算６１４を行うことが可能であり、また正当なインポスタモデルデータベース６１６から、正当なインポスタモデルを得ることが可能である。

図６の認証処理６００に記載されている１つまたは複数のペナルティ付与手順で示されている定数は、安全性および柔軟性の要求間のあるトレードオフを表していることに留意されたい。付与されたペナルティ（すなわち、付与されたペナルティ値）を変更または調整して、種々のアプリケーションシナリオに適合させることが可能である。

図７は、一実施形態による認証システムアーキテクチャを実行するための概略処理フローダイアグラムである。この実施形態では、トランザクションセンタ７０２はサブジェクト７０４にインタフェースで接続され、また音声識別エンジン７０６と通信する。この実施形態では、ベクトル量子化トレーニング７０８は、入力された音声とトレーニングセッションからの音声との近似を決定するために、ベクトル量子化認証７１０に利用可能なＲｅｆＬｏｇを生成し得る。

トランザクションセンタ７０２は、話者７０６が名前を提供し、また話者７０６が、話者に関連していると思われる名前を言って応答することを要求する（演算７１２と７１４を参照）。トランザクションセンタ７０２は話者の発声を得て、その得られた発声を演算７１６で音声識別エンジン７０４に転送する。音声識別エンジン７０４は、話者が認証システムに未だ登録していない場合に、トランザクションセンタ７０２に指示を出して、話者７０２が複数回発声を繰り返しおよび／または付加情報を提供することを要求することが可能である（演算７１８と７２０を参照）。この指示に応答して、トランザクションセンタ７０２は、話者から適切な情報／発声を要求する（演算７２２と７２４を参照）。図５Ａと図５Ｂに記載されているトレーニング処理５００を用いて、演算７１２〜４２４を実現し得る。

話者７０６がトレーニングセッション７０８を完了し、したがって認証システムに登録した後に、引き続き、話者７０６は認証７１０を受けることが可能である。図７に示した実行方法では、話者７０６は、システムに登録されている話者に関連していると思われる発声（例えば、発話した名前）をトランザクションセンタ７０２に提供する（演算７２６を参照）。発声は、トランザクションセンタ７０２によって得られて、演算７２８で音声識別エンジン７０４に転送される。演算７３０では、音声識別エンジン７０４は、発声を認証し、また認証結果（すなわち、話者が認証に合格したかまたは失敗したかどうか）をトランザクションセンタに送信しまた話者に伝達する（演算７３２と７３４を参照）。図６に記載されている認証処理６００を用いて、演算７２６〜４３４を実現し得る。

上記の種々のパターン照合の実行方法によれば、話者の同一性の認証を以下のように行うことが可能である。一実施形態では、特定の同一性を主張する話者（要求者とも呼ばれる）が発した発声（トークンとも呼ばれる）から抽出された特徴ベクトルが受け取られる。発声から抽出し得る特徴ベクトルのいくつかの例示的な実施例は、ケプストラム、ピッチ、韻律、および微細構造を含む。次に、主張されている同一性で構成されていることが認識される発声の形態（すなわち、要求者がここで主張している特定の同一性に関連してその話者が発話したこと）に関して、特徴ベクトル（符号語、符号ベクトル、重心とも呼ばれる）を含む同一性に関連するコードブックにアクセスし得る。

このコードブックでは、抽出された特徴ベクトルと、主張されている同一性で構成されていることが認識される発声の形態に関連するコードブックの対応する符号語（すなわち特徴ベクトル）との相違点を判断することが可能である（これに対して、相違点の代わりに、類似性を判断することも可能であることを理解されたい）。相違点／類似性の判断を歪み値、歪み測定値および／または間隔と呼んでもよい。

発声をさらに分析して、発声で認識された異なる特徴ベクトル毎に、繰り返し発生（繰り返し事象とも呼ばれる）に関する情報を確認することが可能である。この分析によって、発声で発生した特徴ベクトルの複数の事象（すなわち繰り返し事象または繰り返し）に関する情報を得て、発声に関する参照ログを生成することが可能である。すなわち、発声で２回以上発生した特徴ベクトルの発生に関する情報を得てもよい。

発声で発生した特徴ベクトルの繰り返し発生／事象に関する情報と、主張されている同一性で構成されていることが認識される発声の形態の特徴ベクトル（すなわち、同一性に関連するコードブックからの符号語）の繰り返し発生／事象に関する情報とを比較して、話者が発した発声と、主張されている同一性で構成されていることが認識される発声との特徴ベクトルの繰り返し発生の差を識別することが可能である。言い換えれば、発声で２回以上発生した事象を有する抽出された特徴ベクトルの発生に関する得られた情報と、主張されている同一性で構成されていることが認識される発声の形態（または少なくとも１つの形態）で２回以上発生した特徴ベクトルに関する情報とを比較し得る。

繰り返し発生／事象に関する情報の比較に基づいて、特徴ベクトルとコードブックとの判断された相違点（すなわち歪み測定値）にペナルティを付与することが可能である。付与されたペナルティによって修正されたような判断された相違点（すなわち歪み測定値）を用いて、話者の同一性を承認するかまたは否定するかどうかについての決定を行い得る。

一実施形態では、発声の特徴ベクトルのいずれかに関する繰り返し発生数（すなわちカウントまたは値）が、所定の最大の繰り返し発生数を超え、これによって、発声の擬似音響および／または擬似ノイズの存在を示した場合に、話者が主張した同一性を否定することが可能である。このような実施形態では、話者による発声の特徴ベクトルのいずれかが、最大の繰り返し発生数を超える繰り返し発生数を有していると決定された場合に、追加のペナルティを相違点に付与し得る。１つの実行方法では、話者が主張した同一性を承認／認定するかどうかについて決定する場合に、追加のペナルティは、発声を否定するのに十分な大きさであり得る。他の実行方法では、複数の話者が発した複数の発声（すなわち、認識されている同一性）を分析して、所定の特徴ベクトルの最大の繰り返し発生数を有する複数の発声の内の１つの発声を識別することによって、所定の特徴ベクトルに関する所定の最大数を得ることが可能である。このような実行方法では、最大数は、所定の特徴ベクトルの識別された最大の繰り返し発生数に関連しおよび／またはそれに等しくてもよい。このことは、一実施形態において、所定の特徴ベクトルを有する複数の発声のすべての発声を識別し、次に、識別された発声のこの部分集合を分析して、その部分集合のどの発声が、所定の特徴ベクトルに関する最大の繰り返し発生数を有しているかを決定することによって実現することが可能である。

他の実施形態では、ベクトル量子化を用いて、話者による発声の特徴ベクトルと、同一性で構成されていることが認識される発声の形態に関連するコードブックとの相違点を判断することが可能である。一実施形態では、発声は約０．１秒〜約５秒の継続時間であり得る。他の実施形態では、発声は約１秒〜約３秒の継続時間を有し得る。さらに他の実施形態では、発声は複数の音節の発声を含み得る（すなわち、発声は複数の音節を有し得る）。発声はまた、複数の単語の発声を含むことが可能である（すなわち、発声を２つ以上の単語から構成することが可能である）。

一実施形態では、付与されたペナルティは、発声の種々の特徴ベクトル毎に付与される別個のペナルティを含み得る。種々の特徴ベクトル毎に付与されるペナルティの測定値（すなわち値または量）は、発声のそれぞれの特徴ベクトルの繰り返し発生数と、同一性で構成されていることが認識される発声の形態の対応する特徴ベクトルの繰り返し発生数との差に基づいてもよい。

１つの実行方法では、発声のそれぞれの特徴ベクトルの繰り返し発生数と、同一性で構成されていることが認識される発声の形態の対応する特徴ベクトルの繰り返し発生数との差の程度に基づいて、所定の特徴ベクトルのために付与されるペナルティの値を調整し得る。別の実行方法では、話者による発声を得るために用いられる装置の動作特性を考慮するように、異なる特徴ベクトル毎に付与されるペナルティの値を調整することが可能である。

さらに他の実行方法では、発声のそれぞれの特徴ベクトルの繰り返し発生数と、同一性で構成されていることが認識される発声の形態の対応する特徴ベクトルの繰り返し発生数との差が、種々の時間に発声を行った場合に生じる可能性がある話者の音声の予想された（すなわち自然な）変化により発生した繰り返し発生の予想された差よりも小さいと決定された場合には、ペナルティを所定の特徴ベクトルに付与しなくてもよい。付加的な実行方法では、発声のそれぞれの特徴ベクトルの繰り返し発生数と、同一性で構成されていることが認識される発声の形態の対応する特徴ベクトルの繰り返し発生数との差が、同一性で構成されているような所定の特徴ベクトルの承認を誤るエラーの可能性が低くなる予め規定された値よりも小さいと決定された場合に、所定の特徴ベクトルのために付与されるペナルティの値を小さくすることが可能である。

付加的な実施形態では、話者の同一性を承認するかまたは否定するかどうかについて決定する場合に、付与されたペナルティによって修正されたような判断された相違点（すなわち歪み測定値）と、発声に関連する正当なインポスタモデルとを比較してもよい。別の実施形態では、発声は複数のフレームを含み得る。このような実施形態では、発声を分析して発声の特徴ベクトルの繰り返し発生／事象に関する情報を確認することが、各フレームに発生した特徴ベクトルを識別することと、発声の異なる各特徴ベクトルがフレームのすべてに発生する事象をカウントして各特徴ベクトルの繰り返し発生の合計を得ることと、各合計を、発声で発生した繰り返し発生の総数で除算することによって前記合計を平均化することを含んでもよい。

一実施形態では、複数のフレームを含みかつ複数の特徴ベクトルを有する発声を得ることによって、話者認証システムをトレーニングし得る。このような実施形態では、各フレームに存在する特徴ベクトルを識別することが可能であり、また発声全体に関するフレームによる特徴ベクトルの存在を表にすることが可能である。次に、発声で各特徴ベクトルが繰り返される事象数を識別することが可能であり、このことから、発声のすべての繰り返し事象の総数を算出することが可能である。その次に、特徴ベクトル毎の繰り返し数を総数で除算して、特徴ベクトル毎の平均値を得ることが可能であり、また特徴ベクトル毎の繰り返し数に関する情報を、発声に関連する参照ログに記憶することが可能である。１つの実行方法では、複数の話者が発した複数の発声の参照ログを検査して、参照ログに存在する種々の特徴ベクトルのすべてを含む１組の特徴ベクトルを識別することが可能である。次に、異なる特徴ベクトル毎に、単一の参照ログの当該特徴ベクトルに関する最大の繰り返し事象数を識別することが可能であり、またすべての特徴ベクトルに関する最大の繰り返し事象数を示すグローバル参照ログを生成することが可能である。

本明細書に記載されている種々の実施形態のために、発声は孤立単語または語句であることが可能であり、また関連音声または連続音声であることも可能である。一実施形態によれば、実行方法のための短い発声は、約４秒よりも短い、好ましくは最長約３秒の継続時間を有する発声であると考え得る。また、短い発声は、複数の音節であってもよく、および／または短い語句（すなわち、単語間の間隔が短い複数の別個の単語）を含む。

言語単語列部分集合は、所定の言語（例えば、英語、ドイツ語、フランス語、中国語等）の論理的または記述的な単語列部分集合を含み得る。例示的な言語単語列部分集合は、例えば、１〜１０の整数を含んでもよい。トークンは、話者が発した発声として規定することが可能である。したがって、例示的な言語単語列部分集合では、第１のトークンは発声「１」を含むことが可能であり、第２のトークンは発声「２」を含むことが可能であり、そのようにして、最終的には、第１０のトークンが発声「１０」を含むことが可能である。

話者認証システムアーキテクチャの実施形態では、時間タグカウントフィールドをコードブックの各エントリに含み得る。トレーニングされて構成されると、コードブックは２回目のトレーニングを受けることが可能になる。

上記の種々の擬似コードで認識される同じ言葉は、それぞれの擬似コードで指摘されない限り、同様に規定され得ることを理解されたい。

したがって、本発明の話者認証システムアーキテクチャの実行方法により、短い発声に関する人の音声の時間情報を考慮し、また暗騒音の影響を低減することによって、従来のベクトル量子化システムを改良するのを支援することが可能になる。本発明の実施形態により、既存の話者認証解決方法に匹敵する認証精度を提供しつつ、話者認証システムを実装するコストを低減するのを支援することが可能になる。さらに、本明細書に記載されている話者認証システムアーキテクチャの実施形態により、認証システムへの登録を行うための時間、ならびに認証を行うのに必要な時間を低減するのを支援することが可能になる。アルゴリズムの実行速度を向上させることによって、話者認証システムアーキテクチャの実行コストを低減し得る。この話者認証システムアーキテクチャにより、データ分類用の修正されたあまり複雑ではないベクトル量子化方法を用いることが可能になる。本発明の話者認証システムアーキテクチャでは、確実な登録および認証のために、認証精度を低下させることなく、短い音声の発声を用いることが可能である。短い音声の発声および短縮された実行時間は、登録時間および認証時間を速くするのを支援し、したがって、登録中にまた認証中にユーザが費やす時間量を低減する。本発明の話者認証システムアーキテクチャの実施形態により、複雑なノイズ抑制ハードウェアおよびソフトウェアを用いることなく、ノイズに対するロバスト性を提供するのを支援することが可能になる。
典型的な環境
本明細書に記載されているバイオメトリクスシステムの実施形態を用いて、例えば、同様のパーソナルコンピュータ、携帯端末（ＰＤＡ）、携帯電話、ナビゲーションシステム（例えばＧＰＳ）、環境制御盤等のような資源制約付き製品に関する安全性または利便性の特徴（例えば個人領域構成）を実行することが可能である。非侵入的利用において、例えば、人が発話した名前を用いて（または典型的に用いて）その人を識別することが可能であると共に、認証処理が進行していることをその人が気付くことなく、その人の同一性を認証し得る実行方法を含むトランザクションシステムにおいて、認証システムアーキテクチャの実施形態を実施し得る。

上記の説明によれば、ユーザのバイオメトリック特徴の変化に基づく、バイオメトリクスシステムに登録されているユーザ（すなわち登録者）のバイオメトリックモデル（例えば、テンプレート、コードブック、パターンテーブル等）の更新を以下のように行うことが可能である。一実施形態によれば、この処理は、認証セッション中にユーザから受け取ったバイオメトリックサンプル（すなわち「第１の」バイオメトリックサンプル）の分析に基づいて、ユーザ（すなわち要求者）がバイオメトリクスシステムで承認された（すなわち認証に成功した）場合に開始し得る。この処理において、第１のバイオメトリックサンプルから抽出された特徴ベクトルが、バイオメトリクスシステムへの登録時にユーザから得られた初期のバイオメトリックサンプル（すなわち「第２の」バイオメトリックサンプル）を用いて生成された（すなわち作成された）第１のモデル（すなわち、基本のまたは元のモデル／テンプレート／コードブック）と比較され、また以前に成功した認証セッションから得られた以前に承認されたバイオメトリックサンプル（すなわち「第３の」バイオメトリックサンプル）を用いて生成された第２のモデル（すなわち、追跡または適応したモデル／テンプレート／コードブック）と比較される。これらの比較は、特徴ベクトルが、基本モデルよりも追跡モデルの方によりぴったりとマッチしているかどうかを決定するために行われる。言い換えれば、抽出された特徴と基本モデルとよりも、抽出された特徴と追跡モデルとの方が類似性が高くなる（すなわち相違点が低くなる）かどうかを決定する。特徴が、基本モデルよりも追跡モデルの方によりぴったりとマッチしていた場合、この認証セッション中にユーザから得られた抽出特徴に基づいて、基本モデルおよび追跡モデルを更新し得る。

この処理の実施形態は、バイオメトリックサンプルがユーザの音声サンプル（すなわち発声）である音声認証システムで実施することが可能である。これらの実施形態は、各発声が短い、例えば約０．１秒〜約５秒の継続時間を有するシステムにおいても実施することができる。ベクトル量子化コードブックを含むモデルを有するベクトル量子化方法を用いて、実施形態を実施することも可能である。例えば、長時間にわたるユーザの音声の変化に基づいて、話者認証システムに登録されているユーザのコードブックを更新するために、実施形態を実施してもよい。このような実行方法では、話者の承認は、認証セッション中に話者から受け取った音声サンプルの分析に基づくことができる。音声サンプルから抽出された特徴ベクトルは、話者認証システムに話者を登録する際に得られた初期の音声サンプルから作成された元のコードブックと比較し、また以前の認証セッションから得られた以前に承認された音声サンプルを用いて計算された追跡コードブックと比較することができる。この比較から、特徴ベクトルが、元のテンプレートよりも追跡コードブックの方によりぴったりとマッチしているかどうかを決定することが可能である。特徴が、第１のテンプレートよりも第２のテンプレートの方によりぴったりとマッチしていた場合、コードブックを更新するために、抽出された特徴を用いて、コードブックの重心を再計算できる。

他の実施形態では、更新されたモデルをデータ記憶装置に記憶できる。別の実施形態では、更新は、信頼係数をモデルに適用することを含むことができる。一実施形態では、更新は、各重心からの特徴の歪みに基づいて第１および第２のモデルの重心を再計算することを含み得る。

一実施形態では、比較は、特徴と第１のモデルとの間で算出された歪みと、特徴と第２のモデルとの間で算出された歪みとを比較することを含んでもよい。このような実施形態では、ユーザの承認中に歪みを算出できる。

別の実施形態によれば、比較は、特徴と第１のモデルとの相違点を判断し、また特徴と第２のモデルとの相違点を判断することを含み得る。第１のバイオメトリックサンプルを分析して、第１のバイオメトリックサンプルの特徴の繰り返し発生に関する情報を確認することも可能である。例えば、音声ベースの実行方法では、発声を分析して、発声の特徴ベクトルの繰り返し発生に関する情報を確認することができる。第１のバイオメトリックサンプルで発生した特徴の繰り返し発生に関する情報と、ユーザが発したと認識されているバイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報とを比較し得る。上記の音声ベースの模範的な実行方法に続いて、例えば、発声で発生した特徴ベクトルの繰り返し発生に関する情報と、主張されている同一性で構成されていることが認識される発声の形態の特徴ベクトルの繰り返し発生に関する情報とを比較できる。繰り返し発生の比較に基づいて、判断された相違点にペナルティを付与し得る。このような実行方法では、モデルの更新は、第１のバイオメトリックサンプルの特徴の繰り返し発生に関する情報に基づく係数によって、ユーザが発したと認識されるバイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報を修正することをさらに含んでもよい。

コンピュータソフトウェア、ファームウェア、ハードウェア、あるいはそれらの任意の組み合わせまたは部分集合体を含むコンピュータプログラミングまたはエンジニアリング技術を用いて、本明細書に記載されている種々の実施形態をさらに実施し得る。本明細書に記載されているコンポーネントについて、種々のサブコンポーネントを有するものとして説明してきたが、種々のサブコンポーネントをシステムのコンポーネントとみなすことも可能である。例えば、システムの任意のコンポーネントで実行される特定のソフトウェアモジュールをシステムのコンポーネントとみなしてもよい。さらに、そのシステムの実施形態またはコンポーネントは、マイクロプロセッサのような中央処理装置と、バスを介して相互に接続されるいくつかの他の装置とを有するコンピュータで実行することが可能である。また、このようなコンピュータは、ランダムアクセスメモリ（ＲＡＭ）と、リードオンリメモリ（ＲＯＭ）と、例えばディスク記憶装置およびプリンタのような周辺装置をバスに接続するためのＩ／Ｏアダプタと、例えばキーボード、マウス、スピーカ、マイクロホンのような種々のユーザインタフェース装置を、および／あるいはタッチスクリーンまたはデジタルカメラのような他のユーザインタフェース装置をバスに接続するためのユーザインタフェースアダプタと、コンピュータを通信ネットワーク（例えばデータ処理ネットワーク）に接続するための通信アダプタと、バスを表示装置に接続するためのディスプレイアダプタとを含んでもよい。コンピュータは、例えば、ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ（登録商標）オペレーティングシステム（Ｏ／Ｓ）、ＭａｃｉｎｔｏｓｈＯ／Ｓ、Ｌｉｎｕｘ（登録商標）Ｏ／Ｓおよび／またはＵＮＩＸ（登録商標）Ｏ／Ｓのようなオペレーティングシステムを利用することが可能である。当業者は、記載した以外のプラットフォームおよびオペレーティングシステムにおいても、実施形態を実施し得ることを理解するであろう。当業者はまた、ソフトウェアと、適切な汎用コンピュータハードウェアまたは特殊目的コンピュータハードウェアとを組み合わせて、本明細書に記載されている種々の実施形態を実施するためのコンピュータシステムまたはコンピュータサブシステムを形成することができるであろう。使用する条件論理回路は、１つまたは複数のシーケンス機能を行う／果たすことができるハードウェアおよび／またはソフトウェアコンポーネントとして規定し得ることを理解されたい。したがって、論理回路は、コンピュータハードウェア、回路（または回路素子）および／またはソフトウェア、あるいはそれら任意の組み合わせを含むことが可能である。

本発明の実施形態は、例えば、ＡｃｔｉｖｅＸ（登録商標）、JAVA（登録商標）、Ｃ言語、およびＣ＋＋言語のようなコンピュータプログラム言語を用いて、またオブジェクト指向プログラミング方法を用いて実施することも可能である。コンピュータ読み取り可能なコードを有する任意のこのようなリザルトプログラムを１つ以上のコンピュータ読み取り可能な媒体で具体化するかまたはそれに提供することが可能であり、このようにして、コンピュータプログラム製品（すなわちアーティクルマニファクチャ）が作成される。コンピュータ読み取り可能な媒体は、例えば、固定（ハード）ディスクドライブ、フレキシブルディスク、光ディスク、磁気テープ、リードオンリメモリ（ＲＯＭ）のような半導体メモリ等であるか、あるいはインターネットまたは他の通信ネットワークまたは通信リンクのような任意の送信／受信媒体であり得る。１つの媒体からコードを直接実行することによって、コードを１つの媒体から他の媒体にコピーすることによって、あるいはネットワークを介してコードを送信することによって、コンピュータコードを含むアーティクルマニファクチャを作成しおよび／または用いることが可能である。

上記の仕様に基づき、コンピュータソフトウェア、ファームウェア、ハードウェア、あるいはそれらの任意の組み合わせまたは部分集合体を含むコンピュータプログラミングまたはエンジニアリング技術を用いて、本発明の実施形態を実施し得る。コンピュータ読み取り可能なコードを有する任意のこのようなリザルトプログラムを１つ以上のコンピュータ読み取り可能な媒体で具体化するかまたはそれに提供することが可能であり、このようにして、本明細書に記載されている１つ以上の実施形態のコンピュータプログラム製品（すなわち、アーティクルマニファクチャ）の実装が行われる。コンピュータ読み取り可能な媒体は、例えば、固定ディスクドライブ（例えばハードディスクドライブ）、フレキシブルディスク、光ディスク、磁気テープ、例えばリードオンリメモリ（ＲＯＭ）、フラッシュメモリのような半導体メモリ等であり、ならびに／あるいはインターネットおよび／または他の通信ネットワークまたは通信リンクのような任意の送信／受信媒体であり得る。１つの媒体からコードを直接実行することによって、コードを１つの媒体から他の媒体にコピーすることによって、および／あるいはネットワークを介してコードを送信することによって、コンピュータコードを含むアーティクルマニファクチャを作成しおよび／または用いることが可能である。さらに、コンピュータ技術の当業者は、説明してきたように作成されたソフトウェアと、適切な汎用コンピュータハードウェアまたは特殊目的コンピュータハードウェアとを組み合わせて、本明細書に記載されているシステムの実施形態または部分を具体化するコンピュータシステムまたはコンピュータサブシステムを形成することができるであろう。

種々の実施形態について説明してきたが、それらの実施形態は一例として示されているものに過ぎず、限定的なものではない。特に、音声ベースの実行方法において、記載されている多くの実施形態について説明してきたが、当業者は、例えば、指紋、虹彩、顔および他の身体的特徴、さらには筆跡のような他のバイオメトリック特徴および性質を用いて、本明細書に記載されている実施形態を実施することが可能であり得ることを理解すべきである。したがって、任意の実施形態の精神と範囲は、上記の模範的な実施形態のいずれによっても限定されるべきではなく、以下の請求項およびそれらの等価物によってのみ規定されるべきである。

実施形態に従って、増分するトレーニングを行うことができる模範的なバイオメトリクスシステムの概略ブロック図。例示的な音声ベースのバイオメトリクスシステムで適応処理を行うための模範的なアーキテクチャを示した概略ブロック図。例示的な音声ベースの実施形態による模範的な適応処理のフローチャート図。一実施形態によるパターン照合を用いることができる例示的な認証システムアーキテクチャの概略ブロック図。一実施形態によるパターン照合を含むバイオメトリクスシステムのトレーニング処理のフローチャート図。一実施形態によるパターン照合を含むバイオメトリクスシステムのトレーニング処理のフローチャート図。一実施形態によるパターン照合を用いることができる認証処理のフローチャート図。一実施形態によるパターン照合を用いて認証システムアーキテクチャを実行するための概略処理フローダイアグラムを示す図。

符号の説明

１００…バイオメトリクスシステム、１０２…認証モジュール、１０４…入力、１０６…データ記憶装置、１１６…テンプレート適応／増分するトレーニングモジュール、２００…アーキテクチャ、４０２…クライアントバイオメトリクスインタフェース、４０６…プリプロセッサ、４０８…特徴抽出、４１２…トークン用の話者コードブック、４１０…ＶＱトレーニングおよびルックアップ、４１４…予めトレーニングされた時間タグカウント、４１８…正当なインポスタモデル、４１６…決定モジュール、４２０…承認、４２２…拒否。

Claims

１．バイオメトリックシステムにおけるバイオメトリックモデルを更新するための方法であって、
ユーザから受け取った第１のバイオメトリックサンプルの分析に基づいて前記ユーザを承認するステップと、
前記第１のバイオメトリックサンプルから抽出された特徴と、登録時に前記ユーザから得られた第２のバイオメトリックサンプルを用いて生成された第１のモデルとを比較し、また前記特徴と、以前に承認された第３のバイオメトリックサンプルを用いて生成された第２のモデルとを比較して、前記特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしているかどうかを決定するステップと、
前記抽出された特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしていた場合に、抽出された前記特徴に基づいて前記第１および第２のモデルを更新するステップと
を含むバイオメトリックモデルを更新するための方法。
前記バイオメトリックサンプルが音声を含む請求項１に記載の方法。
前記モデルの各々がコードブックを含み、また前記比較が、ベクトル量子化を用いて行われる請求項１に記載の方法。
更新された前記モデルがデータ記憶装置に記憶される請求項１に記載の方法。
前記比較が、前記特徴と前記第１のモデルとの間で算出された第１の歪みと、前記特徴と前記第２のモデルとの間で算出された第２の歪みとを比較するステップを含む請求項１に記載の方法。
前記歪みが前記ユーザの承認中に算出される請求項５に記載の方法。
前記更新ステップが、各重心からの前記特徴の歪みに基づいて前記第１および第２のモデルの重心を再計算するステップを含む請求項１に記載の方法。
前記更新ステップが、信頼係数を前記モデルに適用するステップを含む請求項１に記載の方法。
前記比較が、
前記特徴と前記第１のモデルとの相違点を判断し、また前記特徴と前記第２のモデルとの相違点を判断するステップと、
前記第１のバイオメトリックサンプルを分析して、前記第１のバイオメトリックサンプルの前記特徴の繰り返し発生に関する情報を確認するステップと、
前記第１のバイオメトリックサンプルで発生した前記特徴の前記繰り返し発生に関する情報と、前記ユーザが発したと認識される前記バイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報とを比較するステップと、
前記繰り返し発生の比較に基づいて、前記判断された相違点にペナルティを付与するステップと
を含む請求項１に記載の方法。
前記更新ステップが、前記第１のバイオメトリックサンプルの前記特徴の前記繰り返し発生に関する情報に基づく係数によって、前記ユーザが発したと認識される前記バイオメトリックサンプルの前記少なくとも１つの以前の形態の前記特徴の前記繰り返し発生に関する情報を修正するステップを含む請求項９に記載の方法。
バイオメトリックモデルを更新するためのシステムであって、
ユーザから第１のバイオメトリックサンプルを受け取り、また該第１のバイオメトリックサンプルの分析に基づいて前記ユーザを承認するための認証モジュールと、
前記第１のバイオメトリックサンプルから抽出された特徴と、登録時に前記ユーザから得られた第２のバイオメトリックサンプルを用いて生成された第１のモデルとを比較し、また前記特徴と、以前に承認された第３のバイオメトリックサンプルを用いて生成された第２のモデルとを比較して、前記特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしているかどうかを決定するための決定モジュールと、
前記特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしていた場合に、抽出された前記特徴に基づいて前記第１および第２のモデルを更新するための適応モジュールと、
を備えるバイオメトリックモデルを更新するためのシステム。
前記バイオメトリックサンプルが音声を含む請求項１１に記載のシステム。
前記モデルの各々がコードブックを含み、また前記比較がベクトル量子化を用いて行われる
請求項１１に記載のシステム。
前記更新されたモデルが前記システムのデータ記憶装置に記憶される
請求項１１に記載のシステム。
前記決定モジュールは、前記特徴と前記第１のモデルとの間で算出された第１の歪みと、前記特徴と前記第２のモデルとの間で算出された第２の歪みとを比較する
請求項１１に記載のシステム。
前記適応モジュールは、各重心からの前記特徴の歪みに基づいて前記第１および第２のモデルの重心を再計算する
請求項１１に記載のシステム。
前記適応モジュールは、信頼係数を前記モデルに適用する
請求項１１に記載のシステム。
前記決定モジュールは、
前記特徴と前記第１のモデルとの相違点を判断し、また前記特徴と前記第２のモデルとの相違点を判断し、
第１のバイオメトリックサンプルを分析して、前記第１のバイオメトリックサンプルの前記特徴の繰り返し発生に関する情報を確認し、
前記第１のバイオメトリックサンプルで発生した前記特徴の前記繰り返し発生に関する情報と、前記ユーザが発したと認識される前記バイオメトリックサンプルの少なくとも１つの以前の形態の特徴の繰り返し発生に関する情報とを比較し、
前記繰り返し発生の比較に基づいて、前記判断された相違点にペナルティを付与する
請求項１１に記載のシステム。
前記更新ステップが、前記第１のバイオメトリックサンプルの前記特徴の前記繰り返し発生に関する情報に基づく係数によって、前記ユーザが発したと認識される前記バイオメトリックサンプルの前記少なくとも１つの以前の形態の前記特徴の前記繰り返し発生に関する情報を修正するステップを含む請求項１８に記載のシステム。
コンピュータで読み取ることができるコンピュータプログラムであって、
ユーザから受け取った第１のバイオメトリックサンプルの分析に基づいて前記ユーザを承認するためのコンピュータコードと、
前記第１のバイオメトリックサンプルから抽出された特徴と、登録時に前記ユーザから得られた第２のバイオメトリックサンプルを用いて生成された第１のモデルとを比較し、また前記特徴と、以前に承認された第３のバイオメトリックサンプルを用いて生成された第２のモデルとを比較して、前記特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしているかどうかを決定するためのコンピュータコードと、
前記特徴が前記第１のモデルよりも前記第２のモデルの方によりマッチしていた場合に、前記抽出された特徴に基づいて前記第１および第２のモデルを更新するためのコンピュータコードと
を含むコンピュータプログラム。