JP2006285205A - 対象者の登録受け入れ可否を判定する音声バイオメトリックスシステム、方法及びコンピュータプログラム - Google Patents
対象者の登録受け入れ可否を判定する音声バイオメトリックスシステム、方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2006285205A JP2006285205A JP2006009047A JP2006009047A JP2006285205A JP 2006285205 A JP2006285205 A JP 2006285205A JP 2006009047 A JP2006009047 A JP 2006009047A JP 2006009047 A JP2006009047 A JP 2006009047A JP 2006285205 A JP2006285205 A JP 2006285205A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- biometric
- instance
- biometric input
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000004590 computer program Methods 0.000 title claims description 11
- 239000013598 vector Substances 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims description 54
- 238000012545 processing Methods 0.000 description 13
- 238000012549 training Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 10
- 238000012795 verification Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000013480 data collection Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004256 retinal image Effects 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Collating Specific Patterns (AREA)
Abstract
【課題】対象者のシステムへの登録を受け入れるか否かを判定する音声バイオメトリックシステム及び方法を提供する。
【解決手段】対象者から取得したバイオメトリック入力の第一のインスタンスから抽出した特徴ベクトルから、テンプレートを生成する。前記対象者から取得した前記バイオメトリック入力の第二のインスタンスから抽出した特徴ベクトルと前記テンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて、合致スコアを生成する。前記合致スコアが所定の基準閾値を満たしていれば、バイオメトリックシステムへの前記登録者の登録を受け入れる。
【選択図】図1
【解決手段】対象者から取得したバイオメトリック入力の第一のインスタンスから抽出した特徴ベクトルから、テンプレートを生成する。前記対象者から取得した前記バイオメトリック入力の第二のインスタンスから抽出した特徴ベクトルと前記テンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて、合致スコアを生成する。前記合致スコアが所定の基準閾値を満たしていれば、バイオメトリックシステムへの前記登録者の登録を受け入れる。
【選択図】図1
Description
本発明は、概してデータ処理に関し、より詳細にはバイオメトリックシステムへの登録に関する。
バイオメトリックスとは、生物学的データを測定し、統計解析を行うための科学技術である。バイオメトリックは、測定可能な身体的特徴もしくは個人の行動の履歴に関するデータであって、登録者の身元の認識や、登録者に求められる身元の検証に使用されるデータである。概して、バイオメトリックスでは、個人に固有の特定の人体の構造上の特徴及び生理学的特徴を統計的に測定する。バイオメトリックスの例として、指紋、網膜画像、話者(音声)認識、署名認識及び筆跡認識等があげられる。
バイオメトリックスは、同一性の識別及び/又は検証に利用することができる。同一性の識別では、対象(例えば、人間)のバイオメトリック標本(すなわち、バイオメトリック入力)を、バイオメトリックシステムに格納されたバイオメトリックデータと比較することによって、その対象者の身元を確定することができる。検証(認証としても知られている)は、その対象者が要求している身元を検証する処理である。識別は、所定の対象者の身元を確認する処理である。検証の目的は、対象者(要求者ともいわれる)が、正真正銘の登録対象者(本人又は正当な対象者ともいわれる)か、又は他人であるかを判定することにある。
話者検証システム(音声検証システムとしても知られている)は、身元を検証している話者の音声と、既知の音声とを照合する。話者検証システムは、発話を用いることによって安全な入退出を確保する手段を提供するのに役立つ。要求者は、話者認識及び/又は話者検証システムを通過する必要があるときに、単語や熟語の発語、又は、ランダムに選択された個人による単語又は熟語の発語の標本を提供するだけでよい。要求者本人とは、その発語が、要求している身元に関連付けられる既知の特徴と合致する人物である。
バイオメトリックシステムでは、登録は、ある人物(すなわち、対象者)からバイオメトリックデータ標本(すなわち、バイオメトリック入力)を収集し、そのデータを、後で比較照合に使用する対象者の身元を表現する参照テンプレート内に保存する初期設定処理として定められている。登録時には、対象者はバイオメトリックデータ収集システムにバイオメトリック入力(例えば、音声、指紋など)を与える。環境におけるわずかな変化が収集されたバイオメトリックデータの特徴を変える可能性があるので、通常は、その対象者の参照テンプレートを作成するのに、当該人物のバイオメトリックデータの複数の標本が収集される。ただし、個人の特徴を表すバイオメトリックスが不十分であるため、識別及び/又は検証時に、システムによって、後でその人物を認識させる方法によって、このようなバイオメトリックシステムに当該人物を登録するのは、困難であると考えられる。このような条件を登録拒否として表す。例えば、個人の身元を示すバイオメトリックスが不十分である(例えば、もっぱら手で作業している人物の指紋は、多くの場合乱れており、指紋データの収集が困難である)とか、バイオメトリックの実現化(インプリメンテーション)によって、一貫性のあるバイオメトリックデータが提供されにくい(例えば、このようなシステムでは高い精度が要求されるので、かなり高い割合の人たちが網膜認識システムに登録することが不可能である)など、様々な理由で登録拒否が生じることが考えられる。
登録拒否条件発生率(登録拒否率と表される)は、バイオメトリックスシステムの性能を測るために使用される一つの測定法である。登録拒否率は、対象者に適した登録テンプレートを作成する際に、所定のバイオメトリックシステムが拒否する割合として定義できる。登録拒否のメカニズムは、信頼できないバイオメトリックデータ/対象者をシステムから除外することによって、登録処理における品質管理に、頻繁に使用されている。
対象者のバイオメトリック入力に基づいて、バイオメトリックシステムへの対象者の登録を受け入れるか拒否するかを判定するためのシステム、方法及びコンピュータプログラム製品の実施例について以下に述べる。本発明の一実施例によれば、参照テンプレートは、対象者から取得したバイオメトリック入力の第一のインスタンス(例えば、初回出現)から抽出された特徴ベクトルから生成することができる。対象者から取得したバイオメトリック入力の第二のインスタンス(例えば、2回目の出現)から抽出した特徴ベクトルを参照テンプレートと比較し、バイオメトリック入力の第一のインスタンスと第二のインスタンスとの間の類似性/相違性の程度に基づいて、合致スコアを生成することができる。バイオメトリック入力の第二のインスタンスには、バイオメトリック入力の第一のインスタンスの繰り返しが含まれている。合致スコアが基準閾値を満たすと、バイオメトリックシステムへの対象者の登録が認められる。
しかし、合致スコアが基準閾値を満たすことができなかった場合には、バイオメトリックシステムへの対象者の登録が拒否される。基準閾値は、正当な(又は、正真正銘の)対象者と他人との間における等誤り率に基づいてもよい。等誤り率は、正当な対象者の確率密度関数と他人の確率密度関数との交点によって定義することができる。
本発明の一実施例では、バイオメトリック入力には、それぞれ発話が含まれていてもよい。このような実施例では、各発話の持続期間は、約3秒未満とすることができる。他の実現例(インプリメンテーション)では、各発話の持続期間は、約2秒未満とすることができる。
合致スコアは、バイオメトリック入力の第一のインスタンスから抽出された特徴ベクトルから生成されたテンプレートからのバイオメトリック入力の第二のインスタンスの特徴ベクトルのひずみの程度を表すひずみスコアを含んでいてもよい。一つの実施例では、参照テンプレートは、16個以下の語句(コードワード)を含むことができ、さらに一つの実現例では、参照テンプレートは8個の語句(コードワード)を含むことができる。
一実施例では、対象者のバイオメトリック入力の第三のインスタンス(例えば、第三の出現)から抽出された特徴ベクトルを参照テンプレートと比較し、バイオメトリック入力の第一のインスタンスと第三のインスタンスとの間の類似性や相違性の程度に基づいて合致スコアを生成してもよい。
対象者の登録には、バイオメトリック入力の少なくとも第一のインスタンスと第二のインスタンスとに基づいた、対象者のコードブックを生成する処理を含むことができる。
ここでは、ユーザのバイオメトリック入力の質、例えばユーザの音声の質が、バイオメトリック検証及び/又は識別システムで使用するためのユーザ固有の参照テンプレートを作成するのに十分な信頼性を備えているかを判定するための手順を実現化する実施例について説明する。このようなメカニズムの実現化は、正真正銘の対象者、つまり正当な対象者(例えば、正真正銘の話者)の以前の誤った拒否や、他人の誤った認証の許可を救済するのに役立てることによって、バイオメトリックシステムの性能向上に役立つと考えられる。ここに記載の様々な実施例を利用すると、取得したバイオメトリックにおけるこのような矛盾を検出できるので、その結果バイオメトリックシステムへの登録拒否状態も検出可能となる。
一般に、参照テンプレートは、対象者から取得したバイオメトリック入力(例えば、発話)の第一のインスタンス(例えば、第一の出現)から抽出した特徴ベクトルから生成することができる。対象者から入手したバイオメトリック入力の第二のインスタンス(例えば、第二の出現)から抽出した特徴ベクトルを参照テンプレートと比較し、バイオメトリック入力の第一のインスタンスと第二のインスタンスとの間の類似性や相違性の程度に基づいて、合致スコアを生成することができる。バイオメトリック入力の第二のインスタンスは、バイオメトリック入力の第一のインスタンスの繰り返しを含む。合致スコアが基準閾値を満たすと、バイオメトリックシステムへの対象者の登録が認められる。ただし、合致スコアが基準閾値を満たさなかった場合には、バイオメトリックシステムへのその対象者の登録は拒否される。基準閾値は、正当な(又は、正真正銘の)対象者と他人との間の等誤り率を根拠とすることができる。等誤り率は、正当な対象者の確率密度関数と他人の確率密度関数との間の交点によって定義することができる。一実施例では、特徴ベクトルを対象者のバイオメトリック入力の第三のインスタンス(例えば、第三の出現)から抽出し、参照テンプレートと比較対照して、バイオメトリック入力の第一のインスタンスと第三のインスタンスとの間の類似性/相違性の程度に基づいて、合致スコアを生成することができる。一つの実現例(インプリメンテーション)では、各発話の持続期間は約3秒未満とすることができる。別の一つの実現例では、各発話は、約2秒未満とすることができる。合致スコアには、バイオメトリック入力の第一のインスタンスから抽出した特徴ベクトルから生成されたテンプレートからの、バイオメトリック入力の第二のインスタンスの特徴ベクトルのひずみの程度を表すひずみスコアを含むことができる。
図1は、説明される実施例によった、登録拒否メカニズムを実現化するのに利用できる典型的なバイオメトリック登録システム100の概略ブロック図である。この典型的なバイオメトリック登録システム100では、ユーザのバイオメトリック入力102(例えば、ユーザによる発話)は、データ収集部104によって取得することができる。バイオメトリック入力にユーザによる発話が含まれている実施例では、発話には、例えば、ユーザが話すパスワード等を含めることができる。データ収集部104は、ユーザのバイオメトリック入力を記録し、収集したバイオメトリック入力を特徴抽出部106に提供することができる。一実施例では、データ収集部104にバイオメトリック入力を一時的に保存するバッファを含むことができる。発話を用いた実現例では、バッファは音声バッファである。特徴抽出部106は、収集したバイオメトリック入力を処理して、特徴ベクトルと呼ばれるバイオメトリック入力の特徴的特徴を抽出する。特徴ベクトルには、例えば、バイオメトリック入力を一意に識別可能な特徴を含むことができる。
その抽出された特徴ベクトルを分析することによって、抽出された特徴ベクトルは、バイオメトリック入力の品質に基づいてバイオメトリックシステムにユーザを登録するか否かを判定可能な登録部108(登録拒否決定部とも表わす)に提供される。バイオメトリック入力に発話が含まれている実現例では、記録された発話の質が、後でユーザを識別するのに使用できるユーザ固有の声紋を生成するために利用するのに十分に優れた品質であるか否かを、登録部108が判定できる。登録部108が、ユーザ固有の声紋を生成するために、記録されたバイオメトリック入力を利用可能である(すなわち、抽出された特徴が、十分な品質又は好適な品質を備えている)と判定した場合には、”No”パスに従って、テンプレート生成部110が、例えば声紋照合技法などを用いて抽出した特徴ベクトルに基づいて、ユーザのテンプレートを生成することができる。生成されたテンプレートは、テンプレートデータベース112に保存される。バイオメトリック入力が発話であるような実現例では、生成されたテンプレートにユーザ固有の声紋を含むことができる。
逆に、登録部108が記録されたバイオメトリック入力を使用してユーザ固有の声紋を生成することはできない(すなわち、バイオメトリック入力の品質が低すぎてバイオメトリックシステムで使用できない)と判定した場合には、(”Yes”パスによって表されているように)登録拒否エラーが生成される。
図2は、説明される実施例によって登録拒否メカニズムを実現化する処理の一例200のフローチャートである。処理200は、例えば、バイオメトリック検証及び/又は識別システムで使用するためのバイオメトリック登録手順に対する前処理(precursor)として、又はその一部として実現化してもよい。この処理200の実施例は、ユーザのバイオメトリック入力である発話を用いたバイオメトリックシステムに使用することができる(このようなバイオメトリックシステムは、発話バイオメトリックシステムといわれる)。例えば、持続期間が2秒から3秒の発話など、持続期間の短い発話を用いた音声バイオメトリックシステムでは、特に効果的であると考えられる。この処理200の実施例は、図1に示す典型的なシステム100を用いて実現することができる。
処理200の一部として、自分のバイオメトリック入力の複数の標本を提供するように、プロンプトメッセージでユーザに指示することもできる。例えば、一実施例では、登録システムは、同じ発話(例えば、口頭によるパスワード入力)を少なくとも2回繰り返すようにユーザに要求してもよい。以下の説明では、処理200の実施例に関して、ユーザが同じバイオメトリック入力を少なくとも3回繰り返す(例えば、同じ発話を少なくとも3回繰り返す)場合を例にあげる。
ユーザの初期バイオメトリック入力をデータ収集処理202で取得する。一実施例では、ユーザのこの初期バイオメトリック入力は、そのユーザに提示された適切な入力の督促(プロンプト)に対応して、ユーザから取得される。図1に示す典型的なシステム100では、データ収集部104がデータ収集処理202を実行する。発話を用いた実現例では、取得されたバイオメトリック入力に、例えばユーザが口頭で入力するパスワードを含むことができる。
特徴ベクトルは、抽出処理200で収集されたバイオメトリック入力から、特徴抽出処理204によって抽出される。典型的なシステム100では、抽出処理204が特徴抽出部106によって実行される。
決定処理206では、ユーザのバイオメトリック入力が、ユーザから受信した初期バイオメトリック入力(すなわち、第一のインスタンス又は第一の繰り返し)の場合には繰り返し数が1となり、”Yes”パスに従って、ユーザの予備的テンプレート(又は参照テンプレート)が、テンプレート生成処理208によって初期バイオメトリック入力の特徴ベクトルに基づいて生成される。生成されたユーザの予備的テンプレートは、テンプレートデータベース210に保存される。発話を用いた実現例では、発話の持続期間が短い場合(すなわち、2秒から3秒の場合)、そのバイオメトリック入力は、あまり多くの音声学的変化を表すことができない。従って、このような制限された音声学的変化は、例えば8から16ポイントのベクトル定量化コードブックなど、小規模なテンプレートを用いてモデル化することができる。このような実現例では、それより規模の大きなコードブックを用いると、制限された利用可能なデータが、過剰に埋め込まれてしまう危険性がある。
参照テンプレートが生成されると、リターン処理212に従って、処理202と処理204の第二のパスを通じてバイオメトリック入力の第二の繰り返し(第二のインスタンス)を取得できる。このユーザから入手したバイオメトリック入力の第二の繰り返しから、特徴ベクトルが抽出される。バイオメトリックの第二のインスタンスは、例えばユーザに指示される対応するプロンプト(リクエスト)へのユーザの応答から取得することができる。
決定処理206における第二のパスでは、第二のバイオメトリック入力(すなわち反復回数が1以外)の場合に、”No”パスに従って、パターン照合処理214で、バイオメトリック入力の第二の繰り返しから抽出された特徴ベクトルを、予備テンプレートデータベース210から検索したそのユーザの予備テンプレートと比較することができる。例えば、一つの実施例では、バイオメトリック入力の第二の繰り返しから抽出された特徴ベクトルを、バイオメトリック入力の第一の繰り返しの特徴ベクトルと比較することができる。第二のバイオメトリック入力と予備テンプレートとの間の類似性/相違性の程度を表す合致スコア(例えば、ひずみスコア)は、パターン照合処理214における比較照合の結果として出力される。
閾値決定処理216では、保存された登録拒否決定閾値データベース218をから取得した閾値と、出力された合致スコアとを比較する。この合致スコアが、決定処理216における閾値を越えている場合(例えば、第一のバイオメトリック入力と第二のバイオメトリック入力との間の相違点があまりにも多いことを、ひずみスコアが示している場合(すなわち、第二のバイオメトリック入力が第一のバイオメトリック入力とあまりにも異なっている場合))には、その第二のバイオメトリック入力の品質は、登録に使用するには不十分であると判定される。その結果、処理220で登録拒絶エラーが生成され(従って、登録拒絶状態が示され)、その標本が拒否される。一つの実施例では、オフラインの訓練処理や統計分析処理によって、決定処理216で使用する閾値を提供する登録拒絶決定閾値データベース218へ入力してもよい。
一方、合致スコアが閾値より低い場合(例えば、ひずみスコアが、第一のバイオメトリックと第二のバイオメトリックとの間の相違が、バイオメトリックシステムにユーザを登録するのに、バイオメトリック入力を使用するための許容可能な類似性の範囲内にあることを示している場合(すなわち、これらのバイオメトリック入力を使用して、バイオメトリックシステムにユーザを登録できる場合))には、その後のサンプリング処理222に受け入れられるよう、少なくとも第一のバイオメトリック入力と第二のバイオメトリック入力を使用して、バイオメトリックシステムにユーザを登録するための処理を促すこともできる。
処理200は、バイオメトリック入力の第三の繰り返し(又は第三のバイオメトリック入力)を繰り返し実行する。このような処理の繰り返しでは、第三のバイオメトリック入力から抽出された特徴ベクトル(処理204を参照)が、第一のバイオメトリック入力の特徴ベクトルから生成された参照テンプレートと比較され、第三のバイオメトリック入力の特徴ベクトルが、第一のバイオメトリック入力の特徴ベクトルに比べて十分な相違性の範囲内にあるか否か、すなわちバイオメトリックシステムにユーザを登録する際に使用するのに適しているか否かが判定される。
一つの実施例では、少なくとも処理216を通じて、第二の繰り返しを処理した後で、バイオメトリック入力の第三の繰り返しを提供することを求めるプロンプトがユーザに示される。他の実施例では、第二のバイオメトリック入力及び第三のバイオメトリック入力が、前の入力の直後にユーザによって与えられる。このような実施例では、第二のバイオメトリック入力と第三のバイオメトリック入力が並行して処理される(すなわち、処理200の2回の繰り返しが相互に同時に又は並行して実行される)。あるいは、第三のバイオメトリック入力がシステム内でバッファされ、第二のバイオメトリック入力後に処理される(すなわち、処理200の2回の繰り返しが、順次、すなわち、逐次実行される)。
前述したように、決定処理216で使用される閾値を提供する登録拒否決定閾値データベース218へは、オフラインの訓練処理及び統計解析処理によって入力できる。図3は、音声(すなわち、発話)を用いてバイオメトリックシステムを説明する実施例の閾値を生成するための典型的な処理300のフローチャートである。この処理は、会話型バイオメトリックシステムに関する説明であるが、この実施例の処理は、他の種類のバイオメトリック入力を用いたバイオメトリックシステムにおいても実現可能であることが理解できる。このような処理300で生成された閾値は、図2に示される処理200を用いた実施例で使用できる。特に、処理300によって生成される閾値は、登録拒否閾判定処理216で使用され、登録拒否決定閾値データベース218に保存することができる。一つの実施例では、訓練処理300は、図2の処理200からオフラインで実施することもできる。
閾値生成処理300は、訓練用データベース302に保存されている、関連付けられる発話を複数繰り返している各話者と、所定の話者集合から発話集合(例えば、口頭によるパスワードなど)を格納している訓練用データベース302を利用することも可能である。例えば、訓練データベースには、個々の話者ごとに、所定の話者によって与えられる口頭によるパスワードの複数の繰り返しの複製を格納することもできる。持続期間の短い発話用に実現化された実施例では、データベース内の発話の全てに、持続期間の短い発話(例えば、3秒間以内の音声)を含むことができる。
訓練用データベース302の個々の話者ごとに、特徴抽出処理304で前記特定の話者の保存されている発話(すなわち、バイオメトリック入力)から特徴ベクトルを抽出し、テンプレート生成処理306で話者のテンプレートを(例えば、パターン照合技術等によって)生成することができる。持続期間の短い発話用に実現化された実施例では、生成された参照テンプレートに、8及び/又は16ポイントの参照テンプレートを生成することのできる低い複雑性及び/又は低い計算量のパターンマッチング(声紋照合)技術を用いて生成した、8及び/又は16ポイント参照テンプレートを含むことができる。生成されたテンプレートは、テンプレートデータベース308に保存される。
閾値生成処理300は、訓練データベース302に含まれているのと同じ話者集合から取得される同じ発話の複製を、試験データベース310に含むことができるように、訓練データベースの複製である試験データベース310を利用することも可能である(なお、訓練データベースと試験データベースとは、相互に排他的である)。特徴抽出処理312(処理304と類似)では、特徴ベクトルが個々の話者ごとに試験データベース内に保存されている複数回の発話の繰り返しから抽出される。テンプレート生成処理には、口頭によるパスワードの数回の繰り返しからの特徴抽出処理や、8又は16ポイントの参照テンプレートを生成するパターン照合技術が備わっている。個々の話者ごとに、テンプレートデータベース308から処理304によって生成されたテンプレートが検索され、パターン照合処理314で、処理312によって抽出された話者の特徴ベクトルと比較される。試験データベースから得られた個々の話者のバイオメトリックデータが、テンプレートの対応する特徴ベクトル及び/又は語句(コードワード)と比較される。そして、試験データベース内の所定の話者の発話から抽出された特徴ベクトルとテンプレートの特徴ベクトル(すなわち、訓練データベースから取得された発話の複製から抽出された特徴ベクトル)との間の類似性/相違性の程度を反映する、個々の話者ごとの合致スコアが得られる。これらの合致スコアには、本人と他人の合致スコアデータベース316に保存することのできる、正当性合致スコア(又は、本人合致スコア)集合が含まれる。
処理300を用いると、他人用の合致スコア(他人合致スコア)を生成することも可能である。他人合致スコアを生成する際には、正当なパスワードのテンプレートに対し、期待されるパスワード以外の話者からの口頭によるパスワード(正当な話者による不当なパスワード)と各話者のバイオメトリックデータとを比較する処理を、パターン照合処理314にさらに含んでいてもよい。この比較照合から得られた合致スコアには、合致スコアデータベース316に保存可能な、他人合致スコア集合を含んでいてもよい。他人合致スコアには、正当な話者/話者本人によって行われた不完全な発話の比較から生じたスコアも含むことができる。一つの実施例では、試験データベースから得られる個々の話者のバイオメトリックデータを、他の話者すべてのテンプレートと比較照合し、この比較照合から得られたスコアを他人合致スコア集合内に取り込むこともできる。
処理300で生成された正当性合致スコアと他人合致スコアの分布は、累積分布によってモデル化することも可能である。
図4は、持続期間の短い発話をバイオメトリック入力として用いて実現化された、典型的バイオメトリックシステムにおける累積確率密度関数をグラフ400に表わしたものである。図4に示されるように、確率密度関数グラフ400には、合致スコア値(例えば、ひずみスコア値)用の軸402と確率軸404とが示されている。正当性合致スコア408(すなわち、正当な対象者すなわち本人である対象者の確率密度関数)集合の正規曲線と、他人合致スコアの集合410(すなわち、他人の確率密度関数)との間の交点406(「臨界閾値」又は「等誤り率」又は「クロスオーバー誤り率」とも呼ばれる)は、正当な話者と他人との間の最大の分離点を表している。臨界閾値では、誤って受け入れた率(すなわち、システムが誤って他人を受け入れてしまった率)が、誤り拒否率(すなわち、システムによる正当な対象者の拒否率)と同じになる可能性がある。
持続期間の短い発話を用いたバイオメトリックシステムのひとつの典型的実現例では、正当な話者の合致スコアが臨界値の1.33倍以内である場合には、このような話者の音声の質は、バイオメトリックシステムが後で受入れ/拒否を決定できるだけの十分な信頼性を備えていると考えられる。このような閾値集合は、正当な話者によって口頭で入力された不完全なパスワードを拒否するのに役立つ。閾値を生成する際には、試験用パスワードに対して口頭で入力されたパスワードの3回の繰り返しを用いてテンプレートを生成し、生成されたテンプレートを比較することによって、ダンプされた合致スコアが生成された合致スコアに対応付けられる。実際のオンライン登録処理では、パスワードの繰り返しが、パスワードの1回の繰り返しを用いて生成されたテンプレートと比較される。このような実現例では、オフライン訓練用合致スコアの範囲と比較したときに、これらの合致スコアの範囲はそれと異なっているので、臨界閾値に対する33%の増加分を用いて、スコアの範囲内におけるばらつきを考慮することができる。
従って、典型的登録拒否(FTE)閾値は、以下のように計算することが可能である。
FTE閾値 = 臨界閾値 + 0.33 × 臨界閾値
算出された登録拒否閾値は、閾値データベース(例えば、図2に示されるデータベース218)に保存され、システムによる話者の登録時の決定に使用することができる(例えば、図2に示されている決定処理216)。
算出された登録拒否閾値は、閾値データベース(例えば、図2に示されるデータベース218)に保存され、システムによる話者の登録時の決定に使用することができる(例えば、図2に示されている決定処理216)。
所定のバイオメトリックシステムで使用するにはあまりにも信用できないユーザの登録を防止するのに役立つスクリーニングやフィルタを設けて、バイオメトリックスシステム(例えば、音声バイオメトリックシステム)の性能を向上させることができるよう、本明細書に記載された登録拒否メカニズムの各種実施例を実現化してもよい。登録拒否メカニズムの実施例は、テンプレートの大きさが小さいので(すなわち、テンプレートのメモリサイズが小さいので)、持続期間の短い固定した口頭パスワードを用いる複雑性が低いバイオメトリックシステムに有用であると考えられる。
本明細書に記載された様々な実施例は、さらに、コンピュータソフトウェア、ファームウェア、ハードウェア又はそれらの任意の組み合わせや、それらの一部の組み合わせ(サブセット)を含むコンピュータプログラミングやエンジニアリング技術を用いて論理的手段(論理部)実現化してもよい。本明細書に記載の構成は、各種二次的構成を備えるものとして記載されているが、この各種二次構成は、システムの構成であると考えることができる。例えば、システムの任意の構成で実行される特定のソフトウェアモジュールもシステムの構成と考えることができる。さらに、実施例やそれらの構成は、マイクロプロセッサなどの中央処理装置を備えたコンピュータや、バスを介して相互に接続された他の多数のユニットを備えたコンピュータによって実現化することができる。このようなコンピュータには、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、例えばディスク記憶ユニットやプリンターなどの周辺機器をバスに接続するためのI/Oアダプタ、例えばキーボード、マウス、スピーカ、マイクロフォン及び/又は他のタッチスクリーンやデジタルカメラなどの他のユーザインターフェースデバイスをバスに接続するためのユーザインターフェースアダプタ、コンピュータを通信ネットワーク(例えば、データ処理ネットワーク)に接続するための通信アダプタ及びバスをディスプレイ装置に接続するためのディスプレイアダプタ等が含まれる。コンピュータは、例えば、Microsoft Windowsオペレーティングシステム(O/S)、Macintosh O/S、Linux O/S及び/又はUNIX O/S等のオペレーティングシステムを利用することができる(Windows、UNIXは登録商標)。当技術分野における一般の当業者であれば、これら実施例が上記のシステム以外のプラットフォームやオペレーティングシステムでも実現化可能であることが理解されよう。
本発明の実施例は、例えばActiveX、Java(登録商標)、C及びC++言語等のコンピュータプログラム言語を用いて論理的手段(論理部)を実現化することも可能であり、オブジェクト指向プログラミング技法を用いることも可能である。コンピュータ読み取り可能コードが含まれるこのような生成されたプログラムのいずれも、ひとつ又は複数のコンピュータ読み取り可能媒体内で実現化又は提供可能であるので、コンピュータプログラム製品(すなわち、製造物)を構成することができる。コンピュータ読み取り可能媒体には、例えば、固定(ハード)ディスクドライブ、ディスケット(フレキシブルディスク)、光ディスク、磁気テープ、読み取り専用メモリ(ROM)などの半導体メモリ又はインターネット又は他の通信ネットワーク又はリンクなどといった送受信媒体のどれかを使用できる。コンピュータコードを含む製造物は、一つの媒体から直接コードを実行することによって、一つの媒体から別の媒体にコードを複製する。この複製によって、又はネットワークを介してコードを送信することによって、製造及び/又は使用することが可能である。
本技術分野における一般的な当業者であるなら、適切な汎用コンピュータハードウェア、又は専用コンピュータハードウェアとソフトウェアを統合し、本明細書に記載された各種実施例を実現化するためのコンピュータシステム又はコンピュータサブシステムを容易に生成することができるであろう。
今まで種々の実施例について説明してきたが、これらは例をあげることのみを目的としており、本発明がこれらの例に制限されるものではない。したがって、実施例のいずれもその範囲と目的とは、上記の実施例のいずれによっても制限すべきではなく、特許請求の範囲によってのみ定義されるべきである。
104 データ収集部
106 特徴抽出部
108 登録部(登録拒否決定部)
110 テンプレート生成部
112 テンプレートデータベース
106 特徴抽出部
108 登録部(登録拒否決定部)
110 テンプレート生成部
112 テンプレートデータベース
Claims (20)
- 対象者のシステムへの登録を受け入れるか否かを判定する方法であって、
前記対象者のバイオメトリック入力の第一のインスタンスから抽出された特徴ベクトルからテンプレートを生成し、
前記対象者の前記バイオメトリック入力の第二のインスタンスから抽出された特徴ベクトルと前記生成されたテンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて合致スコアを生成し、
前記生成された合致スコアが所定の基準閾値を満たしていれば、バイオメトリックシステムへの前記対象者の登録を受け入れることを特徴とする方法。 - 前記生成された合致スコアが前記基準閾値を満たさなければ、前記バイオメトリックシステムへの対象者の登録を拒否することを特徴とする請求項1に記載の方法。
- 各バイオメトリック入力に発話が含まれることを特徴とする請求項1に記載の方法。
- 各発話の持続期間が約3秒間未満であることを特徴する請求項3に記載の方法
- 前記合致スコアがひずみスコアを含むことを特徴とする請求項1に記載の方法。
- 前記テンプレートが16個以下の語句を含むことを特徴とする請求項1に記載の方法。
- 前記テンプレートが8個の語句を含むことを特徴とする請求項1に記載の方法。
- 登録処理は、前記バイオメトリック入力の前記第一のインスタンス及び前記第二のインスタンスの少なくとも一つに基づいて、前記対象者のコードブックを生成することを特徴とする請求項1に記載の方法。
- さらに、前記対象者の前記バイオメトリック入力の第三のインスタンスから抽出された特徴ベクトルを前記テンプレートと比較して、前記バイオメトリック入力の前記第一のインスタンスと前記第三のインスタンスとの間の類似度に基づいて合致スコアを生成することを特徴とする請求項1に記載の方法。
- 前記基準閾値が等誤り率に基づくことを特徴とする請求項1に記載の方法。
- 前記等誤り率が、正当な対象者の確率密度関数と他人の確率密度関数との交点で定義されることを特徴とする請求項10に記載の方法。
- 対象者のシステムへの登録を受け入れるか否かを判定するシステムであって、
前記対象者のバイオメトリック入力の第一のインスタンスから抽出された特徴ベクトルからテンプレートを生成する論理部と、
前記対象者の前記バイオメトリック入力の前記第二のインスタンスから抽出された特徴ベクトルと前記テンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて合致スコアを生成する論理部と、
前記生成された合致スコアが所定の基準閾値を満たしていれば、バイオメトリックシステムへの前記対象者の登録を受け入れる論理部と、を備えることを特徴とするシステム。 - 前記生成された合致スコアが前記基準閾値を満たさばければ、前記バイオメトリックシステムへの前記対象者の登録を拒否することを特徴とする請求項12に記載のシステム。
- 各バイオメトリック入力に発話が含まれることを特徴とする請求項12に記載のシステム。
- 各発話の持続期間が約3秒未満であることを特徴とする請求項14に記載のシステム。
- 前記テンプレートが16個以下の語句を含むことを特徴とする請求項12に記載のシステム。
- 対象者のシステムへの登録を受け入れるか否かを判定するコンピュータプログラムであって、
前記対象者のバイオメトリック入力の第一のインスタンスから抽出された特徴ベクトルからテンプレートを生成する手順と、
前記対象者の前記バイオメトリック入力の第二のインスタンスから抽出された特徴ベクトルと前記テンプレートとを比較し、前記バイオメトリック入力の前記第一のインスタンスと前記第二のインスタンスとの間の類似度に基づいて合致スコアを生成する手順と、
前記生成された合致スコアが所定の基準閾値を満たしていれば、バイオメトリックコンピュータプログラムへの前記対象者の登録を受け入れる手順と、をコンピュータに実行させるためのコンピュータコードを備えることを特徴とするコンピュータプログラム。 - 前記生成された合致スコアが基準閾値を満たさなければ前記バイオメトリック用のコンピュータプログラム製品への前記対象者の登録を拒否することを特徴とする手順をコンピュータに実行させるためのコンピュータコードを備えることを特徴とする請求項17に記載のコンピュータプログラム。
- 各バイオメトリック入力に発話が含まれることを特徴とする請求項17に記載のコンピュータプログラム。
- 各発話の持続期間が約3秒未満であることを特徴とする請求項19に記載のコンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/096,668 US20060222210A1 (en) | 2005-03-31 | 2005-03-31 | System, method and computer program product for determining whether to accept a subject for enrollment |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006285205A true JP2006285205A (ja) | 2006-10-19 |
Family
ID=37030415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006009047A Pending JP2006285205A (ja) | 2005-03-31 | 2006-01-17 | 対象者の登録受け入れ可否を判定する音声バイオメトリックスシステム、方法及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060222210A1 (ja) |
JP (1) | JP2006285205A (ja) |
CN (1) | CN1841402A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016009495A (ja) * | 2014-06-20 | 2016-01-18 | トムソン ライセンシングThomson Licensing | 装置およびユーザによってこの装置を制御する方法 |
JP2021021955A (ja) * | 2017-06-30 | 2021-02-18 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 声紋の作成・登録の方法及び装置 |
JP7400148B2 (ja) | 2020-10-21 | 2023-12-18 | グーグル エルエルシー | 話者認識性能の査定 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7620819B2 (en) * | 2004-10-04 | 2009-11-17 | The Penn State Research Foundation | System and method for classifying regions of keystroke density with a neural network |
US7603275B2 (en) * | 2005-10-31 | 2009-10-13 | Hitachi, Ltd. | System, method and computer program product for verifying an identity using voiced to unvoiced classifiers |
US8189783B1 (en) * | 2005-12-21 | 2012-05-29 | At&T Intellectual Property Ii, L.P. | Systems, methods, and programs for detecting unauthorized use of mobile communication devices or systems |
US8020005B2 (en) * | 2005-12-23 | 2011-09-13 | Scout Analytics, Inc. | Method and apparatus for multi-model hybrid comparison system |
US20070198712A1 (en) * | 2006-02-07 | 2007-08-23 | Biopassword, Inc. | Method and apparatus for biometric security over a distributed network |
US20070233667A1 (en) * | 2006-04-01 | 2007-10-04 | Biopassword, Llc | Method and apparatus for sample categorization |
US8842886B2 (en) * | 2006-08-15 | 2014-09-23 | Avery Glasser | Adaptive tuning of biometric engines |
JP5011987B2 (ja) * | 2006-12-04 | 2012-08-29 | 株式会社日立製作所 | 認証システムの管理方法 |
US8332932B2 (en) * | 2007-12-07 | 2012-12-11 | Scout Analytics, Inc. | Keystroke dynamics authentication techniques |
US8031981B2 (en) * | 2007-12-21 | 2011-10-04 | Daon Holdings Limited | Method and systems for generating a subset of biometric representations |
EP2279483B1 (en) | 2008-04-25 | 2019-06-05 | Aware, Inc. | Biometric identification and verification |
JP5121681B2 (ja) * | 2008-04-30 | 2013-01-16 | 株式会社日立製作所 | 生体認証システム、認証クライアント端末、及び生体認証方法 |
GB0819069D0 (en) * | 2008-10-17 | 2008-11-26 | Forensic Science Service Ltd | Improvements in and relating to methods and apparatus for comparison |
TWI421857B (zh) * | 2009-12-29 | 2014-01-01 | Ind Tech Res Inst | 產生詞語確認臨界值的裝置、方法與語音辨識、詞語確認系統 |
US9020208B2 (en) * | 2011-07-13 | 2015-04-28 | Honeywell International Inc. | System and method for anonymous biometrics analysis |
ES2754719T3 (es) * | 2011-10-03 | 2020-04-20 | Accenture Global Services Ltd | Motor de correspondencia biométrica |
US9600709B2 (en) | 2012-03-28 | 2017-03-21 | Synaptics Incorporated | Methods and systems for enrolling biometric data |
US9589399B2 (en) | 2012-07-02 | 2017-03-07 | Synaptics Incorporated | Credential quality assessment engine systems and methods |
US20140081637A1 (en) * | 2012-09-14 | 2014-03-20 | Google Inc. | Turn-Taking Patterns for Conversation Identification |
US9275212B2 (en) * | 2012-12-26 | 2016-03-01 | Cellco Partnership | Secure element biometric authentication system |
CN109215643B (zh) * | 2017-07-05 | 2023-10-24 | 阿里巴巴集团控股有限公司 | 一种交互方法、电子设备及服务器 |
CN107506629B (zh) * | 2017-07-28 | 2020-02-14 | Oppo广东移动通信有限公司 | 解锁控制方法及相关产品 |
GB201802309D0 (en) | 2017-11-14 | 2018-03-28 | Cirrus Logic Int Semiconductor Ltd | Enrolment in speaker recognition system |
CN107871236B (zh) * | 2017-12-26 | 2021-05-07 | 广州势必可赢网络科技有限公司 | 一种电子设备声纹支付方法及装置 |
US11216541B2 (en) * | 2018-09-07 | 2022-01-04 | Qualcomm Incorporated | User adaptation for biometric authentication |
US11158325B2 (en) * | 2019-10-24 | 2021-10-26 | Cirrus Logic, Inc. | Voice biometric system |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5913192A (en) * | 1997-08-22 | 1999-06-15 | At&T Corp | Speaker identification with user-selected password phrases |
US6107935A (en) * | 1998-02-11 | 2000-08-22 | International Business Machines Corporation | Systems and methods for access filtering employing relaxed recognition constraints |
WO1999045530A1 (en) * | 1998-03-03 | 1999-09-10 | Lernout & Hauspie Speech Products N.V. | Multi-resolution system and method for speaker verification |
US6519565B1 (en) * | 1998-11-10 | 2003-02-11 | Voice Security Systems, Inc. | Method of comparing utterances for security control |
US6826306B1 (en) * | 1999-01-29 | 2004-11-30 | International Business Machines Corporation | System and method for automatic quality assurance of user enrollment in a recognition system |
US6691089B1 (en) * | 1999-09-30 | 2004-02-10 | Mindspeed Technologies Inc. | User configurable levels of security for a speaker verification system |
US6473735B1 (en) * | 1999-10-21 | 2002-10-29 | Sony Corporation | System and method for speech verification using a confidence measure |
WO2002095554A2 (en) * | 2001-05-18 | 2002-11-28 | Imprivata Inc. | System and method for authentication using biometrics |
-
2005
- 2005-03-31 US US11/096,668 patent/US20060222210A1/en not_active Abandoned
- 2005-12-27 CN CNA2005101341911A patent/CN1841402A/zh active Pending
-
2006
- 2006-01-17 JP JP2006009047A patent/JP2006285205A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016009495A (ja) * | 2014-06-20 | 2016-01-18 | トムソン ライセンシングThomson Licensing | 装置およびユーザによってこの装置を制御する方法 |
JP2021021955A (ja) * | 2017-06-30 | 2021-02-18 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 声紋の作成・登録の方法及び装置 |
JP7062851B2 (ja) | 2017-06-30 | 2022-05-09 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 声紋の作成・登録の方法及び装置 |
JP7400148B2 (ja) | 2020-10-21 | 2023-12-18 | グーグル エルエルシー | 話者認識性能の査定 |
Also Published As
Publication number | Publication date |
---|---|
CN1841402A (zh) | 2006-10-04 |
US20060222210A1 (en) | 2006-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006285205A (ja) | 対象者の登録受け入れ可否を判定する音声バイオメトリックスシステム、方法及びコンピュータプログラム | |
US7249263B2 (en) | Method and system for user authentication and identification using behavioral and emotional association consistency | |
WO2017113658A1 (zh) | 基于人工智能的声纹认证方法以及装置 | |
EP2120232A1 (en) | A random voice print cipher certification system, random voice print cipher lock and generating method thereof | |
US7788101B2 (en) | Adaptation method for inter-person biometrics variability | |
US20100268537A1 (en) | Speaker verification system | |
US20080270132A1 (en) | Method and system to improve speaker verification accuracy by detecting repeat imposters | |
US6496800B1 (en) | Speaker verification system and method using spoken continuous, random length digit string | |
Krawczyk et al. | Securing electronic medical records using biometric authentication | |
Singh et al. | Voice biometric: A technology for voice based authentication | |
WO2013124455A1 (en) | System and method for speaker recognition on mobile devices | |
JP2007249179A (ja) | バイオメトリック特徴の変化に基づいてバイオメトリックモデルを更新するためのシステム、方法、およびコンピュータプログラム | |
CN115315699A (zh) | 用于语音用户接口的耳内活性检测 | |
Tan et al. | A survey on presentation attack detection for automatic speaker verification systems: State-of-the-art, taxonomy, issues and future direction | |
JP2006235623A (ja) | 短い発話登録を使用する話者認証のためのシステムおよび方法 | |
Folorunso et al. | A review of voice-base person identification: state-of-the-art | |
Orken et al. | Development of security systems using DNN and i & x-vector classifiers | |
US20140163986A1 (en) | Voice-based captcha method and apparatus | |
Maes et al. | Conversational speech biometrics | |
JP4143541B2 (ja) | 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム | |
KR20180049422A (ko) | 화자 인증 시스템 및 그 방법 | |
US20220366916A1 (en) | Access control system | |
Lee | A tutorial on speaker and speech verification | |
US7162641B1 (en) | Weight based background discriminant functions in authentication systems | |
Nallagatla et al. | Sequential decision fusion for controlled detection errors |