JPH06175680A - 最も近い隣接距離を使用した発声者確認装置 - Google Patents

最も近い隣接距離を使用した発声者確認装置

Info

Publication number
JPH06175680A
JPH06175680A JP5177018A JP17701893A JPH06175680A JP H06175680 A JPH06175680 A JP H06175680A JP 5177018 A JP5177018 A JP 5177018A JP 17701893 A JP17701893 A JP 17701893A JP H06175680 A JPH06175680 A JP H06175680A
Authority
JP
Japan
Prior art keywords
speaker
distance
speech
word
confirmation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5177018A
Other languages
English (en)
Inventor
Alan L Higgins
アラン・ローレンス・ヒギンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Standard Electric Corp
Original Assignee
International Standard Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Standard Electric Corp filed Critical International Standard Electric Corp
Publication of JPH06175680A publication Critical patent/JPH06175680A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/08Use of distortion metrics or a particular distance between probe pattern and reference templates
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、低いエラー率を有し、確認処理時
間が最小であり、コンピュータ処理電力も少ない発声者
確認システムを得ることを目的とする。 【構成】 発声されたテキストを処理してスピーチのフ
レームにする手段と、システム中に発声者を登録する手
段と、キーボード1 等により登録発声者であると主張し
た発声者の発声試験フレーズを引き出す手段2 と、この
試験フレーズと特定登録発声者の登録期間入力された対
応した“ワード”との間の確認距離を決定する距離決定
手段と、このような確認距離データから確認スコアを決
定して登録発声者であるか否かをそれと組合せて決定す
る手段7 を有し、発声された試験フレーズと関連したス
ピーチのフレームと登録発声者が登録期間中にシステム
に入力した“ワード”と関連したスピーチの対応したフ
レームとの間の最も近い隣接ユークリッド距離の決定す
る手段を具備していることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般に発声者確認システ
ム、特に現在発声されたワードと蓄積された登録ワード
との間で計算された最も近い隣接距離に基づいて発声者
同一の判定が行われるシステムに関する。
【0002】
【従来の技術】発声者確認システムは、システム内で前
に定められたアイデンティティを主張した人物が識別さ
れた人物によってシステムに入力された対応した“ワー
ド”を含む予め蓄積されたスピーチと識別要求時に識別
されることを求められた人物によって発声されたパスワ
ード(多数のスピーチ“ワード”でもよい)を比較する
ことによって識別された人物か否かを決定する。このよ
うなシステムは特に保護環境に関して入力/出力を制御
する手段として、或は保護通信システムへのアクセスを
許可するために有効である。
【0003】大部分の既存の発声者確認システムに関し
て、発声されたパスワードと識別された発声者によって
前にシステムに入力された基準スピーチ語彙との間の比
較は、デジタル形態に変換されたこのようなスピーチ成
分のコンピュータ処理を使用したパスワードスピーチお
よび基準スピーチの成分間のユークリッド距離の測定に
基づいている。このような比較はまた基準ベースとして
定められたパスワードスピーチの成分および一般スピー
チ成分からのこのような距離の測定を含んでいる。その
ように測定された距離が予め定められた値より小さい場
合、および基準スピーチ測定を使用した確認システムの
場合、発声者は識別された発声者であると判定され、し
きい値(または基準測定のうちの1つ以上)より大きい
場合には、発声者は詐称者であると判定される。このよ
うな発声者確認システムの一例はサコエ氏による米国特
許第 4,694,493号明細書(1987年 9月15日出願)に記載
されている。
【0004】全ての発声者確認システムの制限は、パス
ワードスピーチと基準スピーチとの間の正確な一致がも
し達成されるにしても少ないことである。これは、シス
テム中に基準スピーチの入力の時間と確認要求の時間の
間の特定発声者における音声の自然に発生した差のた
め、および基準スピーチとパスワードスピーチとの間の
発声者の音声の波形に振動がない場合でも、デジタル化
された音声成分に発声者の音声のアナログ波形を変換す
る処理が基準スピーチとパスワードスピーチとの間の発
声者の音声に小さい変化を生成することにより生じる。
【0005】この制限は発声者確認システムに対する2
つの可能なエラー:識別された発声者の間違った拒絶ま
たは詐称者の間違った承認のいずれかにおいて明確にさ
れる。このようなエラーの結果はパスワードスピーチ成
分と基準スピーチ成分との間で測定された距離との比較
のベースとして使用されるしきい値の選択によって管理
される。低いしきい値は詐称者の認承される可能性を最
小にすると予測されることができるが、識別された人物
が拒絶される可能性を高める。他方において、高いしき
い値は識別された人物が拒絶される可能性を少なくする
が、詐称者の認承される可能性を高める。このような発
声者確認システムの信頼性(すなわちエラーのある結果
の回避)は解析された音声成分の数を増加することによ
って改良されることができるが、この方法は、(1)計
算処理パワーの制限、および(2)確認処理時間が利用
者によって許容できるように非常に短くなければならな
い(おそらく15乃至20秒を越えない)人的な要因によっ
て並列的に制限される。
【0006】許容可能なレベルの安全性を達成し、一方
同時に識別される発声者が拒絶される可能性を最小にす
る匹敵した測定発声者確認システムの探索において、任
意抽出技術はまた識別された発声者によりシステムに入
力された基準“ワード”の語彙からのパスワードの成分
を決定するために使用される。従来の発声者確認システ
ムは典型的にパスワードとして固定されたフレーズを読
取るために識別を要求した人物を誘発し、識別された発
声者によって前に発声された同じフレーズまたはパスワ
ードとその発声したパスワードを比較した。固定された
誘発を使用することによって、このようなシステムは詐
称未遂者に非合法的に確認される機会を増加するために
先に応答(テープ記録応答を含む)を準備する機会を与
える。確認時にランダムに構成される試験フレーズの使
用および発声された音声のワード内容が誘発と整合する
ことを必要とすることにより、詐称者を認承する可能性
は著しく減少される。詐称未遂者が認承可能な応答を準
備する機会を事実上持たない非常に多数の可能な誘発が
存在している。スピーチ確認システムにおけるこのよう
な任意抽出技術の使用の1例はDr.George R.Doddi
ngton 氏による文献(Personal Identity Verification
Using Voice)に記載され、また他の論文(Proc.ELECT
RO-76 ,1976年 5月11乃至14日,22-4,1-5 頁)に示さ
れている。
【0007】しかしながら、試験フレーズの任意抽出技
術は新しい問題を導く。ワードは登録フレーズ中で発生
しなかった文脈(周辺ワードの)で生じる。ワードが発
声される文脈はスピーチ調音部の移動の限界によって発
生させられた同時調音によりその発音に影響を与える。
確認解析モデルに含まれないこれらの同時調音は試験お
よび登録音声間の測定された非類似性に寄与し、識別さ
れた発声者の間違った拒絶の可能性を増加させる。
【0008】本出願人による前の発明は、可能性スコア
リングと呼ばれるスコア方法によってこの問題を部分的
に克服している。A.Higgins、L.Bahler および
J.Porter 氏らによる文献(Speaker Verification U
sing Randomized Phrase Promrting,1991 )を参照され
たい。本発明はこの前の発明をさらに発展させ、同時調
音問題に対するより完全な解決方法を提供する。しかし
ながら、本発明は固定された(すなわちランダムでな
い)フレーズ誘発を使用した確認にも適応することに留
意されたい。
【0009】
【発明が解決しようとする課題】従来の発声者確認シス
テムはまた一般にスピーチ発音に整合するためのベース
としてワードテンプレートを使用している。これらの方
法において、ワードテンプレートは登録中発生されたワ
ード発声により得られる。このようなテンプレートの一
使用例として、本出願人であるITT社に譲渡された、
Higgins氏他による米国特許第4,773,093 号明細書(19
88年9月20日出願)を参照されたい。確認時、ワードテ
ンプレートは試験フレーズにおいて同じワードの発生と
一時的に整列され、距離または非類似性スコアを得るた
めに使用される。ワードテンプレートを得る2つの方法
が一般的に使用されており、それらは同時調音に関して
異なる問題を有している。1つの方法において、平均化
されたテンプレートは各ワードの全ての登録発生を一時
的に整列し、構成フレームを平均化することによって得
られる。平均化されたテンプレートに関する問題は、ワ
ード境界に近い同時調音のダイバーシティが平均によっ
てほとんど表わされないことである。第2の方法におい
て、個々のワード発生用の多数のテンプレートは登録フ
レーズ(各ワードの多数の表示を持つ)から取出され
る。多数のテンプレートに関する問題は、同時音調が各
ワードの始めおよび終りの両方に影響を与え、1ワード
当り非常に多数のテンプレートが両側で全ての可能な文
脈に同時に整合するため必要とされることである。
【0010】ワードテンプレート整合に関するこれらの
問題は、原子ユニットとしてワードではなく個々のフレ
ームを使用した登録フレーズと試験フレーズとの比較の
ような発声者確認技術における最近の発展によって軽減
される。登録データのフレームは平均せずに比較時に直
接使用される。したがって、多数のテンプレートの問題
は各フレームが単一の瞬間を表した実効的“スナップシ
ョット”であるために避けられる。スピーチデータのこ
のようなフレームの使用は、本出願人であるITT社に
譲渡された、Li 氏他による米国特許第4,720,863 号明
細書(1988年 1月19日出願)に記載されている。本出願
人であるITT社に譲渡されたWrench,Jr.氏他による
米国特許第4,837,830 号明細書(1989年 6月 6日出願)
も参照されたい。
【0011】スピーチデータの解析および比較における
別の改良はL.Bahler 氏によって開発され、本出願人
により1991年 5月13日に07/699,217で別出願された“Sp
eaker Sorter”と呼ばれる彼の発明において明瞭にされ
ている。Bahler 氏は、本質的に非パラメータ的であ
り、スピーチ特徴の統計的な分布に関する仮定を行わな
い発声者認承用のベースラインアルゴリズムの使用を示
唆している。所定の話者のスピーチパターンを特徴付け
るために使用される基準データは1組の評価された分布
パラメータでなく、大きいセットのスピーチ特徴ベクト
ルである。本当のスピーチにもっと正確に近似させる複
雑な分布へのパラメータ的方法の発展はこのようなモデ
ルに伴う増加した数の統計的パラメータ評価が困難であ
るため、Bahler 氏の方法論の重要な利点は非パラメー
タ的方法の使用である。本発明の目的は、低いエラー率
を有し、一方確認処理時間を最小にし、および、または
コンピュータ処理電力要求を減少する改良された発声者
確認システムを提供することである。
【0012】
【課題を解決するための手段】本発明によると、発声者
確認システムは、システムに入力されたスピーチを処理
し、それによってこのスピーチがサンプルされ、デジタ
ル化され、多数のスピーチベクトル成分から構成された
フレームに変換される入力スピーチプロセッサと、1つ
以上の発声者がシステムに登録され、発声者により発声
された予め定められたテキストが入力スピーチプロセッ
サによって処理されてシステムによって蓄積される登録
メカニズムと、特定された登録発声者によって入力され
た予め定められた発声テキストから得られる1つ以上の
“ワード”を含む誘発フレーズを生成し、誘発フレーズ
が主張する発声者によって発声され、発声された誘発フ
レーズがシステム中に入力され、入力スピーチプロセッ
サによって処理される特定された登録発声者であると主
張する発声者からの識別に対する要求に応答する機構
と、このような発声された誘発フレーズを含む“ワー
ド”の終点を検出するためにこのような発声された誘発
フレーズを解析する機構と、(1)最も近い隣接距離d
i,T および最も近い隣接距離dj,E を決定し、ここにお
いて最も近い隣接距離di,T は処理された発声された誘
発フレーズの各フレームと特定された登録発声者のシス
テムに登録中に蓄積された同じ“ワード”の各発生の対
応した領域からのスピーチフレームとの間のユークリッ
ド距離として計算され、最も近い隣接距離dj,E は処理
された発声された誘発フレーズにおける同じ“ワード”
の各発生の対応した領域からの誘発フレーズおよびスピ
ーチフレームから構成される各“ワード”の各発生の各
フレーム間のユークリッド距離として計算され、(2)
処理された発声された誘発フレーズと特定された登録発
声者のシステムへの登録中にシステムに入力された対応
した“ワード”との間の距離dT,E を計算し、距離d
T,E は全ての最も近い隣接距離i,T の平均および全ての
最も近い隣接距離dj,E の平均から導出され、(3)こ
のような距離データから確認スコアを決定し、(4)主
張した発声者が特定された登録発声者であるか否かをそ
こから決定する確認モジュールとを含む。
【0013】本発明の別の観点によると、最も近い隣接
距離di,T および最も近い隣接距離dj,E の確認モジュ
ールによる決定は、特定された登録発声者によりシステ
ムに入力された予め定められた発声されたテキストの反
復された発生におけるダイバーシティの効果を差引くよ
うに計算されたバイアス値によって各距離を加重し、ユ
ークリッド距離の計算はスコア限界値によって限定され
た範囲に制限される付加的なステップを含む。
【0014】本発明のさらに別の観点によると、確認モ
ジュールによる確認スコアの決定はさらに処理された発
生誘発フレーズと1組の基準発声者によってシステムに
入力され、距離dT,E と類似した方法で計算された対応
した“ワード”との間の距離dT,R を決定する手段を含
み、主張した発声者が特定された登録発声者か否かの決
定は距離dT,R 、距離dT,E および予め定められたしき
い値との間の関係から導出される。
【0015】
【実施例】本発明の動作を可能にする構造は図1のブロ
ック図に示されている。アイデンティティ主張がキーボ
ード1において入力されたとき、ランダム誘発発生器2
は送受話器4に発声するように利用者のためにCRTス
クリーン3上にフレーズ誘発を表示する。送受話器4か
らの電気信号は増幅され、デジタル形態に変換される。
この変換は12ビットサンプルを使用して8000Hzの速度
で信号をサンプルする。サンプルのシーケンスは22.4ミ
リ秒のフレームで解析される。図1中のフロントエンド
5はこの解析を実行する。この実施例において、解析は
各フレームごとに20個の成分のベクトルを生成する。ベ
クトルの第1の10個の成分はB.Gold およびC.M.
Radar氏らによる文献(“Digital Processing of Sign
als ”,McGraw Hill ,New York,1969年)に示された
ようなセプストラル(cepstral)係数であり、最後の10
はV.ViswanathanおよびJ.Makhoul氏らによる文献
(“Quantization Properties of Transmission Parame
ters in Linear Predictive Systems ”,IEEE Trans.o
n Acoustics ,Speech and Sig.Proc.,vol.ASSP-23 ,
309乃至321 頁,1975年 6月)に示されたようなログ領
域率である。セプストラル係数およびログ領域比の両者
は標準的LPC−10解析から得られる。このような直線
予測符号化解析の説明のために、T.Tremain氏による
文献(“The Government Standard Linear Predictive
Coding Algorithm”,LPC−10,Speech Technology
,40乃至49頁,1982年 4月)およびJ.D.Markel
およびA.H.Gray 氏らによる文献(“Linear Predi
ction of Speech ”,Spring-Verlag ,New York,1976
年)を参照されたい。フロントエンド5の詳細は本発明
に特有でなく、また重要でない。別のタイプの解析もま
た使用されることができる。
【0016】フロントエンド5からのフレーム流はシス
テムのワード認承装置6および発声者確認装置7に送ら
れる。ワード認承装置6はそのデータ流における各“ワ
ード”の終点をマークし、好ましい実施例において発声
された確認フレーズが誘発されたフレーズと整合するか
否かを決定する。そのフレーズ認承機能を実行するとき
に、ワード認承装置6は標準的な接続ワード認承アルゴ
リズムを使用し、その詳細は本発明に関係ない。利用者
は、ワード認承装置6が誘発されたフレーズが発声され
たことを決定した場合に拒絶される。フレーズが誘発さ
れたものとして発声されたことを決定された場合、ワー
ド認承装置6は発声されたフレーズ中の各ワードの開始
および終了フレーム数を含むリストを出力する。その
後、発声者確認装置7は[確認機能]の下に以下説明さ
れるようにその動作を開始する。
【0017】登録処理は、間違って発声されたと決定さ
れたフレーズが再度誘発されることを除いて上記と同じ
であり、登録成分は発声者確認装置の成分と置換する。 [確認機能]従来技術に対する重要な改良はシステムの
確認機能に認められる。この発声者確認機能を理解する
ために、最初に、上記のBahler 氏によって説明されよ
うに試験期間Tと登録期間Eとの間のユークリッド距離
の以下の測定を考慮する。tj をTのj番目のフレーム
とし、ei をEのi番目のフレームとする。tj からE
までの最も近い隣接した距離dj,E は dj,E =mini (|tj −ei2 ) (1a) およびei からTまでの最も近い隣接距離di,T は di,T =minj (|tj −ei2 ) (1b) フレーム間の距離(|tj −ei2 )は全ての対のフ
レームtj およびeiに対して計算され、ここでjは全
ての試験フレームにわたって範囲を定め、iは全ての登
録フレームにわたって範囲を定める。したがって、Tか
らEまでの距離(すなわち距離dT,E )の測定は dT,E =avgj (dj,E )+avgi (di,T ) (2) ここに示された発声者確認はこの従来技術に関して2つ
の方法で距離測定を改良する。第1に、登録期間の全て
のフレームと試験期間の全てのフレームを比較するので
はなく、本発明は同じワードの同じ領域からの試験およ
び登録期だけを比較する。例えば、ワード“Twen”
(語彙は以下で説明される)の方向の1/4の試験フレ
ームは、“Twen”のほぼ1/4の方向である登録フ
レームとだけ比較される。これは図2に示されている。
試験および登録期間のワード内のフレームの位置はワー
ド終点から決定され、ワード認承装置6によって供給さ
れる。ワードに属する全てのフレームはワードインデク
スおよびフレームインデクスに割当てられる。フレーム
iに対して、ワードインデクスW(j)はワードを識別
し、フレームF(i)は範囲0≦F(i) <8における値
である。Nフレームワードのn番目のフレームはインデ
クスF(n)=md[n*(8−1)/(N−1)0]
を割当てられており、ここでmd[*]は最も近い整数
値に四捨五入して表す。インデクスfを持つ試験フレー
ムは、f=0ならばインデクス0および1;或は1<f
<7ならばインデクスf−1,f,およびf+1;或は
f=7ならばインデクス6および7を持つ同じワードの
全ての登録フレームと比較される。登録フレームに整合
した探索範囲は同様に制限される。したがって式(1
a)および(1b)は dj,E = min (|tj −ei2 ) (3a) w(i)=w(j) F(j)-1≦F(i)≦F(j)+1 および、 di,T = min (|tj −ei2 ) (3b) w(j)=w(i) F(i)-1≦F(j)≦F(i)+1 この方向における最も近い隣接距離に対する探索範囲の
制限は、全てのフレームに対する探索と比較するとシス
テムの確認精度を改良し、計算の量を減少する二重の利
点を有する。それはまた所定のレベルの安全性に対する
確認処理時間を最小にすることが認められる。
【0018】従来技術に対する第2の改良は、さらに最
も近い隣接距離の計算に影響を与えることである。各登
録フレームei は登録過程中にバイアス値bi およびス
コア限界値li を割当てられる(以下に示された方法論
にしたがって)。バイアス値は所定の発声者の登録フレ
ーズにおけるスピーチ変化などからのダイバーシティの
効果を差引くように選択され、スコア限界値はこのよう
な値の大部分が認められる範囲の外側に存在する登録発
声者成分の効果を減少するように決定される。これらの
要因を適用すると、最も近い隣接距離dj,E および最も
近い隣接距離di,T は以下のように再度修正される
【0019】
【数3】 ここでhlim[*] はハード限界を表す。
【0020】 x2 hlim[x] = x1 (x<x1 ならば) x1 = x (x1 <x<x2 ならば) = x2 (x>x2 ならば) 図1を参照すると、フレーム間の最も近い隣接距離の上
記の計算が発声者確認装置3によって展開された後、式
2にしたがって試験フレーズTから登録期間Eまでの距
離dT,E が決定される。発声者確認動作における最終ス
テップである確認は予め定められたしきい値に対する距
離dT,E の関係に基づいて行われてもよいが、しかし好
ましい実施例では試験期間から主張された利用者の登録
期間まで、および試験期間から基準発声者と呼ばれる別
の発声者である1組のMの登録期間までの距離を計算す
る付加的なステップを含む。
【0021】一実施例において、20個の基準発声者が使
用される。所定の確認試験に対する基準発声者の組は主
張されたアイデンティティに依存している。基準発声者
は主張された利用者の音声に対する基準発声者音声の類
似性に基づいてこのような発声者の集合から選択され
る。基準発声者を選択する適切なアルゴリズムはA.H
iggins,L.Bahler およびJ.Porter 氏らによる文
献(“Speaker Verification Using Randomized Phrase
Prompting”,1991年,Digital Signal Processing ,
Vol.1 ,No.2,1991年 4月,Academic Press,Inc.,89
頁)に記載されている。最終的な確認スコアは
【0022】
【数4】
【0023】ここでCは主張された発声者であり、S
(C)はCの登録期間の数であり、ci は主張された発
声者のi番目の登録期間であり、S(j)は基準にされ
た発声者jの登録期間の数であり、rj k は基準にされ
た発声者jのk番目の登録期間である。最終確認スコア
は、間違った承認と間違って拒絶エラー率間の妥協によ
って調節されることができる固定されたしきい値と比較
される。利用者は確認スコアがしきい値を越えた場合に
拒絶され、そうでなければ承認される。 [バイアスおよびスコア限界値の決定]上記のように、
バイアス値およびスコア限界値は各登録期間の各フレー
ムに対する登録処理中に決定される。登録期間のフレー
ムjに対するバイアス値bj およびスコア限界値lj
【0024】
【数5】 ここで変数Wi ,Wj ,Fi およびFj は式3(a)お
よび3(b)に対して前に限定された通りである。 [登録語彙]本発明の好ましい実施例において、登録ス
ピーチ材料は“組合せロック”フレーズから構成され
る。一例は“35-72-41”であり、“thirty-five ,seve
nty-two ,forty-one ”と発音される。各フレーズは21
乃至97の数から構成される。登録語彙は56個のこのよう
な数を含み、90個の2桁の数によりスタートし、(1)
12およびteens 、(2)10を単位とするもの(20,30
等)、(3)二重数字および(4)8で終わる数を避け
る。したがって、563 または175 ,616 の可能な3つの
“ワード”誘発フレーズが存在し、このような3ワード
誘発フレーズは本発明の好ましい態様である。ワード認
承装置6は、部分的ワードテンプレート(“Thir-ti-fi
ve-Seven-ti-two-Four-ti-one ”)を使用してフレーズ
を整合する。これを行うことによって、全体的な語彙は
17個のテンプレートだけを使用して表されることができ
る。好ましい実施例において、確認期間は4つの誘発さ
れたフレーズの発声を要求する。登録期間は、典型的に
完了するのに約3分を必要とする24個のフレーズから構
成されている。
【0025】誘発された確認フレーズにおける“ワー
ド”は登録語彙から引き出され、好ましい実施例におい
て多数の可能なワード順位を実現する有限状態のシンタ
クスにしたがってワード順位をランダムに選択すること
によって組合せられる。登録フレーズは同じ“ワード”
から構成され、同じシンタクスにしたがって、しかし非
ランダム的に生成される。登録フレーズの組は全ての語
彙“ワード”の平均された表示を引き出すように選択さ
れる。登録および確認フレーズはワード間にポーズを入
れずに接続された方法で発声される。
【図面の簡単な説明】
【図1】本発明の好ましい実施例を示したブロック図。
【図2】本発明によって使用された距離測定方法の説明
図。

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 発声されたテキストを処理してスピーチ
    のフレームにする手段と、システム中に発声者を登録す
    る手段と、特定された登録発声者であると主張した発声
    者から発声された試験フレーズを引き出す手段と、前記
    発声された試験フレーズと前記特定された登録発声者の
    システム中への前記登録期間中にシステム中に入力され
    た対応した“ワード”との間において1つ以上の確認距
    離を決定する距離決定手段と、このような確認距離デー
    タから確認スコアを決定し、前記主張した発声者が前記
    特定された登録発声者であるか否かをそれと組合せて決
    定する手段とを有する発声者確認システムにおいて、 前記発声された試験フレーズと関連したスピーチのフレ
    ームと前記特定された登録発声者のシステム中への前記
    登録期間中にシステムに入力された前記“ワード”と関
    連したスピーチの対応したフレームとの間の最も近い隣
    接ユークリッド距離の決定のための前記距離決定手段に
    含まれる手段を具備していることを特徴とする発声者確
    認システム。
  2. 【請求項2】 前記確認距離の決定のための前記手段は
    さらに前記特定された登録発声者によるシステム中への
    登録期間中にシステムに入力された“ワード”の反復的
    発生におけるダイバーシティの効果を差引くように計算
    されたバイアス値によって決定された距離の加重を与え
    る手段を備え、最も近い隣接ユークリッド距離の前記決
    定はスコア限界値によって限定された範囲に制限される
    請求項1記載の発声者確認システム。
  3. 【請求項3】 確認スコアを決定する前記手段は前記確
    認距離と予め定められたしきい値との間の比較を行な
    い、前記主張した発声者が前記特定された登録発声者で
    あるか否かの決定は前記比較から得られる請求項1記載
    の発声者確認システム。
  4. 【請求項4】 確認スコアを決定する前記手段はさらに
    前記発声された試験フレーズと1組の基準発声者によっ
    てシステム中に入力され、前記確認距離のそれに類似し
    た方法で計算された対応した“ワード”との間の基準距
    離を決定する手段を含み、前記主張した発声者が前記特
    定された登録発声者であるか否かの決定は前記確認距
    離、前記基準距離および前記予め定められたしきい値と
    の間の関係から得られる請求項3記載の発声者確認シス
    テム。
  5. 【請求項5】 確認スコアを決定する前記手段は前記確
    認距離と予め定められたしきい値の間の比較を行ない、
    前記主張した発声者が前記特定された登録発声者である
    か否かの決定はこの比較から得られる請求項2記載の発
    声者確認システム。
  6. 【請求項6】 確認スコアを決定する前記手段はさらに
    前記発声された試験フレーズと1組の基準発声者によっ
    てシステム中に入力され、前記確認距離のそれに類似し
    た方法で計算された計算された対応した“ワード”との
    間の基準距離を決定する手段を含み、前記主張した発声
    者が前記特定された登録発声者であるか否かの決定は前
    記確認距離、前記基準距離および前記予め定められたし
    きい値の間の関係から得られる請求項2記載の発声者確
    認システム。
  7. 【請求項7】 システム中に入力された発声されたテキ
    ストを処理し、前記発声されたテキストがサンプルさ
    れ、デジタル化され、およびそれぞれ多数のスピーチベ
    クトル成分からなるスピーチのフレームに変換される手
    段と、 システム中に発声者を登録し、予め定められた発声され
    たテキストが前記発声者によってシステム中に入力さ
    れ、前記処理手段によって処理され、その後システムに
    よって蓄積される手段と、 前記特定された登録発声者によって入力された前記予め
    定められた発声されたテキストから得られた1つ以上の
    “ワード”を含む誘発フレーズを生成し、前記誘発フレ
    ーズは前記主張している発声者によって発声され、それ
    に対して前記発声された誘発フレーズはシステム中に入
    力され、前記処理手段によって処理される特定された登
    録発声者であると主張する発声者からの識別の要求に応
    答する手段と、 前記発声された誘発フレーズを含む“ワード”の終了点
    を検出するように前記処理された発声された誘発フレー
    ズを解析する手段と、 最も近い隣接距離di,T が前記処理された発声された誘
    発フレーズの各フレームと前記特定された登録発声者の
    システム中への前記登録中に蓄積された同じ“ワード”
    の各発生の対応した領域からのスピーチフレームとの間
    のユークリッド距離として計算される、最も近い隣接距
    離di,T を決定する手段と、 最も近い隣接距離dj,E が前記誘発フレーズを含む各
    “ワード”の各発生の各フレームと前記処理された発声
    された誘発フレーズにおける同じ“ワード”の各発生の
    対応した領域からのスピーチフレームとの間のユークリ
    ッド距離として計算される、最も近い隣接距離dj,E
    決定する手段と、 前記最も近い隣接距離di,T の全ての平均および前記最
    も近い隣接距離dj,Eの全ての平均から得られる、前記
    処理された生成された誘発フレーズと前記特定された登
    録発声者のシステムへの前記登録中にシステム中に入力
    された対応した“ワード”との間の距離dT,E を決定す
    る手段と、 このような距離データから確認スコアを決定し、前記主
    張した発声者が前記特定された登録発声者であるか否か
    をそこから決定する手段とを具備している発声者確認シ
    ステム。
  8. 【請求項8】 前記最も近い隣接距離di,T および前記
    最も近い隣接距離dj,E の決定は前記特定された登録発
    声者によってシステムに入力された前記予め定められた
    発声されたテキストの反復発生におけるダイバーシティ
    の効果を差引くように計算されたバイアス値によって前
    記各距離を加重する付加的なステップを含み、ユークリ
    ッド距離の前記計算はスコア限界値によって限定された
    範囲に制限される請求項7記載の発声者確認システム。
  9. 【請求項9】 確認スコアを決定する前記手段は前記距
    離dT,E と予め定められたしきい値との間の比較を行な
    い、前記主張する発声者が前記特定された登録発声者で
    あるか否かの前記決定は前記比較から得られる請求項7
    記載の発声者確認システム。
  10. 【請求項10】 確認スコアを決定する前記手段はさら
    に前記処理された発声された誘発フレーズと1組の基準
    発声者によってシステムに入力され、前記距離dT,E
    それに類似した方法で計算された対応した“ワード”と
    の間の距離dT,R を決定する手段を含み、前記主張した
    発声者が前記特定された登録発声者であるか否かの決定
    は前記距離dT,R 、前記距離dT,E および前記予め定め
    られたしきい値の間の関係から得られる請求項9記載の
    発声者確認システム。
  11. 【請求項11】 確認スコアを決定する前記手段は前記
    距離dT,E と予め定められたしきい値との間の比較を行
    ない、前記主張した発声者が前記特定された登録発声者
    であるか否かの決定は前記比較から得られる請求項8記
    載の発声者確認システム。
  12. 【請求項12】 確認スコアを決定する前記手段はさら
    に前記処理された発声された誘発フレーズと1組の基準
    発声者によってシステムに入力され、前記距離dT,E
    それに類似した方法で計算された対応した“ワード”と
    の間の距離dT,R を決定する手段を含み、前記主張した
    発声者が前記特定された登録発声者であるか否かの決定
    は前記距離dT,R 、前記距離dT,E および前記予め定め
    られたしきい値の間の関係から得られる請求項11記載の
    発声者確認システム。
  13. 【請求項13】 解析する手段はさらに前記発声された
    誘発フレーズを含む“ワード”が前記誘発フレーズ中の
    ワードに対応するか否かを決定し、このような対応性が
    存在しない場合は前記主張した発声者を拒絶する請求項
    7記載の発声者確認システム。
  14. 【請求項14】 システム中に発声されたテキストを入
    力する手段と、 前記発声されたテキストをサンプリングし、デジタル化
    する手段と、 前記デジタル化されたサンプルをそれぞれ多数のスピー
    チベクトル成分からなるスピーチのフレームに変換する
    手段と、 登録期間中に1つ以上の発声者をシステム中に登録し、
    それによって予め定められた発声されたテキストがこの
    ような各発声者によってシステムに入力され、サンプル
    する前記手段および変換する手段によって処理され、そ
    の後システムによって蓄積される手段と、 確認が求められる発声者としてシステムに登録された発
    声者の中から特定の発声者を識別する手段と、 登録期間中に前記特定の発声者によって入力された発声
    されたテキストから得られる1つ以上の“ワード”を識
    別する手段および確認期間中に発声者によって発声され
    る誘発として前記“ワード”を供給し、前記誘発された
    発声された“ワード”が前記入力手段を介してシステム
    に入力され、前記サンプリング手段および変換手段によ
    って処理される手段と、 終了点を検出するために前記誘発された発声された“ワ
    ード”を解析する手段と、 前記誘発された発声された“ワード”を蓄積する手段
    と、 前記特定の発声者の登録期間中に蓄積された同じ“ワー
    ド”の各発生の対応した領域からのスピーチフレームを
    備えた前記確認期間からの各スピーチフレームを比較
    し、このような全ての対の確認と登録フレームとの間の
    最も近い隣接距離di,T を計算する手段と、 前記特定の発声者の登録期間中に蓄積された前記誘発を
    含む“ワード”の各発生の各スピーチフレームを前記誘
    発された発声された“ワード”の対応する領域からのス
    ピーチフレームと比較し、このような全ての対の登録フ
    レームと確認フレームとの間の最も近い隣接距離di,T
    を計算する手段と、 全ての前記最も近い隣接距離di,T と全ての前記最も近
    い隣接距離dj,E の平均から距離dT,E を計算する手段
    と、 予め定められた値と前記距離dT,E を比較し、前記距離
    T,E と前記予め定められた値との間の差に基づいて出
    力信号を生じさせる手段とを具備している発声者確認シ
    ステム。
  15. 【請求項15】 前記最も近い隣接距離di,T と最も近
    い隣接距離dj,E の決定はバイアス値によって前記各距
    離を加重する付加的なステップを含み、前記距離の前記
    計算はスコア限界値によって限定された範囲に制限され
    る請求項14記載の発声者確認システム。
  16. 【請求項16】 予め定められた値と前記距離dT,E
    比較する前記手段はさらに前記誘発された発声された
    “ワード”と1組の基準発声者によってシステムに入力
    され、前記距離dT,E のそれと同様に計算された対応し
    た“ワード”との間の距離dT,R を決定する手段を含
    み、前記出力信号は前記距離dT,R 、前記距離dT,E
    よび前記予め定められたしきい値の間の関係に基づいて
    生成させられる請求項14記載の発声者確認システム。
  17. 【請求項17】 終了点を検出するために前記誘発され
    た発声された“ワード”を解析する手段はさらに前記発
    声された誘発フレーズを含む“ワード”が前記誘発フレ
    ーズ中のワードに対応するか否かを決定し、このような
    対応性が存在しない場合は前記主張した発声者を拒絶す
    る請求項14記載の発声者確認システム。
  18. 【請求項18】 前記入力スピーチを表すデジタルデー
    タの一連のフレームに発声された入力スピーチ信号を処
    理し、前記入力スピーチを含む“ワード”の終了点を識
    別し、スピーチ特徴の基準セットに対して入来したスピ
    ーチを比較し、各一致スコアをそれから生成する発声者
    確認モジュールによってスピーチフレームを解析し、入
    力スピーチが一致スコアに基づいて識別された発声者と
    対応するか否かを決定するステップを含んでいる主張さ
    れたアイデンティティに一致したものとして発声者を自
    動的に確認する方法において、 前記発声者認識モジュールによる基準スピーチ特徴に対
    する入来したスピーチの比較は、特定の“ワード”の所
    定の領域に対する入力スピーチフレームと前記入力スピ
    ーチの全ての“ワード”の全てのフレームに対する同じ
    “ワード”の同じ領域に対応したスピーチ特徴の前記基
    準セットからのスピーチフレームとの間の最小のユーク
    リッド2乗距離の平均に等しい第1のスコアセットと、
    スピーチ特徴の前記基準セットからの特定の“ワード”
    の所定の領域に対するスピーチフレームとスピーチ特徴
    の前記基準セットを含む全ての“ワード”の全てのフレ
    ームに対する同じ“ワード”の同じ領域に対応した入力
    スピーチフレームとの間の最小のユークリッド2乗距離
    の平均に等しい第2のスコアセットとの和である一致ス
    コアを生成することを特徴とする発声者確認方法。
  19. 【請求項19】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は、前記
    特定された登録発声者によってシステムに入力された前
    記予め定められた発声されたテキストの反復発生におけ
    るダイバーシティの効果を差引くように計算されたバイ
    アス値によって前記各ユークリッド距離を加重する付加
    的なステップを含み、前記ユークリッド距離はスコア限
    界値によって制限された範囲に対して計算される請求項
    18記載の発声者確認方法。
  20. 【請求項20】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は、1組
    の基準発声者に対して入力スピーチフレームと登録スピ
    ーチフレームとの間に最も近い隣接距離を設定する一致
    スコアを生成するステップを含んでいる請求項18記載の
    発声者確認方法。
  21. 【請求項21】 さらにしきい値確認を含み、入力スピ
    ーチ“ワード”の終了点を識別するサブステップはさら
    に確認フレーズの“ワード”が誘発されたときに発声さ
    れたか否かを認識し、このようなしきい値確認試験に合
    格しない時に確認要求を拒絶する請求項18記載の発声者
    確認方法。
  22. 【請求項22】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は、1組
    の基準発声者に対して入力スピーチフレームと登録スピ
    ーチフレームとの間に最も近い隣接距離を設定する一致
    スコアを発生するステップを含んでいる請求項19記載の
    発声者確認方法。
  23. 【請求項23】 さらにしきい値確認を含み、入力スピ
    ーチ“ワード”の終了点を識別するサブステップはさら
    に確認フレーズの“ワード”が誘発されたときに発声さ
    れたか否かを認識し、このようなしきい値確認試験に合
    格しない時に確認要求を拒絶する請求項19記載の発声者
    確認方法。
  24. 【請求項24】 主張されたアイデンティティを設定
    し、発声者によって発声される1つ以上の“ワード”を
    含む確認フレーズを生成し、入力スピーチを表すデジタ
    ルデータの一連のフレームに発声された入力スピーチ信
    号をデジタル化し、入力スピーチ“ワード”の終了点を
    識別し、前の登録期間中に得られた識別された発声者の
    スピーチ特徴の基準セットに対して入力スピーチを比較
    し、それから各一致スコアを生成する発声者確認モジュ
    ールによってスピーチフレームを解析し、入力スピーチ
    が一致スコアに基づいて識別された発声者と一致するか
    否かを決定するステップを含んでいる主張されたアイデ
    ンティティに一致したものとして発声者を自動的に確認
    する方法において、 前記発声者認識モジュールによる基準スピーチ特徴に対
    する入来したスピーチの比較は、特定の“ワード”の所
    定の領域に対する入力スピーチフレームと前記入力スピ
    ーチの全ての“ワード”の全てのフレームに対する同じ
    “ワード”の同じ領域に対応した登録スピーチフレーム
    との間の最小のユークリッド2乗距離の平均に等しい第
    1のスコアセットと、特定の“ワード”の所定の領域に
    対する登録されたスピーチフレームとスピーチ特徴の前
    記基準セットを含む全ての“ワード”の全てのフレーム
    に対する同じ“ワード”の同じ領域に対応した入力スピ
    ーチフレームとの間の最小のユークリッド2乗距離の平
    均に等しい第2のスコアセットとの和である一致スコア
    を生成することを含み、 ここにおいてtj から対応した登録“ワード”Eまでの
    距離は: 【数1】 i から対応した試験“ワード”Tまでの距離は: 【数2】 ここにおいて、tj は入力“ワード”Tのj番目のフレ
    ームであり、ei は登録“ワード”Eのi番目のフレー
    ムであり、Wi およびFi はそれぞれフレームiに対す
    るワードおよびフレームインデクスであり、Wj および
    j はそれぞれフレームjに対するワードおよびフレー
    ムインデクスであり、 前記第1のスコアは全てのフレームに対するdj,E の平
    均に等しく、前記第2のスコアは全てのフレームに対す
    るdi,T の平均に等しい発声者確認方法。
  25. 【請求項25】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は前記特
    定された登録発声者によってシステムに入力された前記
    予め定められた発声されたテキストの反復発生における
    ダイバーシティの効果を差引くように計算されたバイア
    ス値によって前記各ユークリッド距離を加重する付加的
    なステップを含み、前記ユークリッド距離はスコア限界
    値によって制限された範囲に対して計算される請求項24
    記載の発声者確認方法。
  26. 【請求項26】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は、1組
    の基準発声者に対して入力スピーチフレームと登録スピ
    ーチフレームとの間に最も近い隣接距離を設定する一致
    スコアを発生する別のステップを含んでいる請求項18記
    載の発声者確認方法。
  27. 【請求項27】 さらにしきい値確認を含み、入力スピ
    ーチ“ワード”の終了点を識別するサブステップはさら
    に確認フレーズの“ワード”が誘発されたときに発声さ
    れたか否かを認識し、このようなしきい値確認試験に合
    格しない時に確認要求を拒絶する請求項24記載の発声者
    確認方法。
  28. 【請求項28】 前記発声者認識モジュールによる基準
    スピーチ特徴に対する入来したスピーチの比較は、1組
    の基準発声者に対して入力スピーチフレームと登録スピ
    ーチフレームとの間に最も近い隣接距離を設定する一致
    スコアを発生するステップを含んでいる請求項25記載の
    発声者確認方法。
  29. 【請求項29】 さらにしきい値確認を含み、入力スピ
    ーチ“ワード”の終了点を識別するサブステップはさら
    に確認フレーズの“ワード”が誘発されたときに発声さ
    れたか否かを認識し、このようなしきい値確認試験に合
    格しない時に確認要求を拒絶する請求項25記載の発声者
    確認方法。
JP5177018A 1992-07-22 1993-07-16 最も近い隣接距離を使用した発声者確認装置 Pending JPH06175680A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/918,560 US5339385A (en) 1992-07-22 1992-07-22 Speaker verifier using nearest-neighbor distance measure
US918560 1992-07-22

Publications (1)

Publication Number Publication Date
JPH06175680A true JPH06175680A (ja) 1994-06-24

Family

ID=25440583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5177018A Pending JPH06175680A (ja) 1992-07-22 1993-07-16 最も近い隣接距離を使用した発声者確認装置

Country Status (3)

Country Link
US (1) US5339385A (ja)
JP (1) JPH06175680A (ja)
DE (1) DE4310190A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09230887A (ja) * 1996-02-12 1997-09-05 Texas Instr Inc <Ti> 発声音に関する話者の検証を行うためのシステム及び方法

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4207837A1 (de) * 1992-03-12 1993-09-16 Sel Alcatel Ag Verfahren und vorrichtung zur ueberpruefung und erlangung einer zugangsberechtigung
US5623539A (en) * 1994-01-27 1997-04-22 Lucent Technologies Inc. Using voice signal analysis to identify authorized users of a telephone system
US5937381A (en) * 1996-04-10 1999-08-10 Itt Defense, Inc. System for voice verification of telephone transactions
DE19630109A1 (de) * 1996-07-25 1998-01-29 Siemens Ag Verfahren zur Sprecherverifikation anhand mindestens eines von einem Sprecher eingesprochenen Sprachsignals, durch einen Rechner
WO1998035118A1 (de) * 1997-02-06 1998-08-13 Siemens Aktiengesellschaft Identifikationsvorrichtung
US5946654A (en) * 1997-02-21 1999-08-31 Dragon Systems, Inc. Speaker identification using unsupervised speech models
US6182037B1 (en) 1997-05-06 2001-01-30 International Business Machines Corporation Speaker recognition over large population with fast and detailed matches
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6076055A (en) * 1997-05-27 2000-06-13 Ameritech Speaker verification method
US5924070A (en) * 1997-06-06 1999-07-13 International Business Machines Corporation Corporate voice dialing with shared directories
AU752317B2 (en) 1998-06-17 2002-09-12 Motorola Australia Pty Ltd Cohort model selection apparatus and method
US6141644A (en) * 1998-09-04 2000-10-31 Matsushita Electric Industrial Co., Ltd. Speaker verification and speaker identification based on eigenvoices
GB9822931D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method
AU1393899A (en) * 1998-11-10 2000-05-29 Sherrie Ann Adcock Method of comparing utterances for security control
JP3699608B2 (ja) * 1999-04-01 2005-09-28 富士通株式会社 話者照合装置及び方法
DE19930522A1 (de) * 1999-07-05 2001-02-01 Univ Ilmenau Tech Verfahren zur Erkennung von Lautsignalen
ATE276557T1 (de) * 2000-07-10 2004-10-15 Voice Trust Ag Verfahren und system zur authentifizierung eines teilnehmers an einem geschäftsvorgang
DE50012605D1 (de) * 2000-07-14 2006-05-24 Voice Trust Ag Verfahren und System zur Autorisierung einer kommerziellen Transaktion
US6961703B1 (en) 2000-09-13 2005-11-01 Itt Manufacturing Enterprises, Inc. Method for speech processing involving whole-utterance modeling
US7185197B2 (en) * 2000-12-08 2007-02-27 Itt Manufacturing Enterprises, Inc. Method and apparatus to facilitate secure network communications with a voice responsive network interface device
TW490655B (en) * 2000-12-27 2002-06-11 Winbond Electronics Corp Method and device for recognizing authorized users using voice spectrum information
JP4489994B2 (ja) * 2001-05-11 2010-06-23 富士通株式会社 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体
US6810146B2 (en) * 2001-06-01 2004-10-26 Eastman Kodak Company Method and system for segmenting and identifying events in images using spoken annotations
US7711560B2 (en) * 2003-02-19 2010-05-04 Panasonic Corporation Speech recognition device and speech recognition method
KR100571574B1 (ko) * 2004-07-26 2006-04-17 한양대학교 산학협력단 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템
US7363223B2 (en) * 2004-08-13 2008-04-22 International Business Machines Corporation Policy analysis framework for conversational biometrics
US7890510B2 (en) * 2005-10-05 2011-02-15 International Business Machines Corporation Method and apparatus for analyzing community evolution in graph data streams
US8078618B2 (en) 2006-01-30 2011-12-13 Eastman Kodak Company Automatic multimode system for organizing and retrieving content data files
US7769583B2 (en) * 2006-05-13 2010-08-03 International Business Machines Corporation Quantizing feature vectors in decision-making applications
GB0616070D0 (en) * 2006-08-12 2006-09-20 Ibm Speech Recognition Feedback
US8831941B2 (en) * 2007-05-29 2014-09-09 At&T Intellectual Property Ii, L.P. System and method for tracking fraudulent electronic transactions using voiceprints of uncommon words
WO2010019831A1 (en) * 2008-08-14 2010-02-18 21Ct, Inc. Hidden markov model for speech processing with training method
RU2419890C1 (ru) 2009-09-24 2011-05-27 Общество с ограниченной ответственностью "Центр речевых технологий" Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
US8990085B2 (en) * 2009-09-30 2015-03-24 At&T Intellectual Property I, L.P. System and method for handling repeat queries due to wrong ASR output by modifying an acoustic, a language and a semantic model
US9318114B2 (en) * 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification
US8903929B2 (en) * 2012-07-05 2014-12-02 Microsoft Corporation Forgotten attachment detection
US8700396B1 (en) * 2012-09-11 2014-04-15 Google Inc. Generating speech data collection prompts
RU2530314C1 (ru) * 2013-04-23 2014-10-10 Общество с ограниченной ответственностью "ЦРТ-инновации" Способ гибридной генеративно-дискриминативной сегментации дикторов в аудио-потоке
US10303706B2 (en) * 2013-11-27 2019-05-28 William Scott Harten Condensed hierarchical data viewer
GB2552722A (en) * 2016-08-03 2018-02-07 Cirrus Logic Int Semiconductor Ltd Speaker recognition
US10223512B2 (en) * 2016-08-25 2019-03-05 Sensory, Incorporated Voice-based liveness verification
US11170790B2 (en) 2019-06-27 2021-11-09 Bose Corporation User authentication with audio reply
CN111260836A (zh) * 2019-12-31 2020-06-09 云南电网有限责任公司楚雄供电局 门禁控制方法、装置、系统、仓储系统及电子设备
US11823684B2 (en) * 2020-11-19 2023-11-21 Google Llc Generating and/or utilizing voice authentication biasing parameters for assistant devices

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720863A (en) * 1982-11-03 1988-01-19 Itt Defense Communications Method and apparatus for text-independent speaker recognition
JPS59178587A (ja) * 1983-03-30 1984-10-09 Nec Corp 話者確認システム
US4773093A (en) * 1984-12-31 1988-09-20 Itt Defense Communications Text-independent speaker recognition system and method based on acoustic segment matching
US4837830A (en) * 1987-01-16 1989-06-06 Itt Defense Communications, A Division Of Itt Corporation Multiple parameter speaker recognition system and methods
US5121428A (en) * 1988-01-20 1992-06-09 Ricoh Company, Ltd. Speaker verification system
US5216720A (en) * 1989-05-09 1993-06-01 Texas Instruments Incorporated Voice verification circuit for validating the identity of telephone calling card customers
US5167004A (en) * 1991-02-28 1992-11-24 Texas Instruments Incorporated Temporal decorrelation method for robust speaker verification

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09230887A (ja) * 1996-02-12 1997-09-05 Texas Instr Inc <Ti> 発声音に関する話者の検証を行うためのシステム及び方法

Also Published As

Publication number Publication date
DE4310190A1 (de) 1994-01-27
US5339385A (en) 1994-08-16

Similar Documents

Publication Publication Date Title
JPH06175680A (ja) 最も近い隣接距離を使用した発声者確認装置
US9646614B2 (en) Fast, language-independent method for user authentication by voice
US7447632B2 (en) Voice authentication system
KR0139949B1 (ko) 미지인 사람의 신원을 확인하기 위한 음성 검증 회로
US5548647A (en) Fixed text speaker verification method and apparatus
Naik Speaker verification: A tutorial
RU2161336C2 (ru) Система для верификации говорящего
KR100406307B1 (ko) 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템
JP2002514318A (ja) 録音された音声を検出するシステムおよび方法
JPH08314491A (ja) ミックスチャ分解識別による話者検証方法と装置
JP2007133414A (ja) 音声の識別能力推定方法及び装置、ならびに話者認証の登録及び評価方法及び装置
JPS6217240B2 (ja)
Pandit et al. Feature selection for a DTW-based speaker verification system
Campbell Speaker recognition
Chetouani et al. A New Nonlinear speaker parameterization algorithm for speaker identification
Sorokin et al. Speaker verification using the spectral and time parameters of voice signal
Ilyas et al. Speaker verification using vector quantization and hidden Markov model
AU580659B2 (en) Individual recognition by voice analysis
US10957318B2 (en) Dynamic voice authentication
WO2002029785A1 (en) Method, apparatus, and system for speaker verification based on orthogonal gaussian mixture model (gmm)
Gu et al. A hybrid score measurement for HMM-based speaker verification
Kabir et al. Vector quantization in text dependent automatic speaker recognition using mel-frequency cepstrum coefficient
JP2001350494A (ja) 照合装置及び照合方法
WO2006027844A1 (ja) 話者照合装置
Sharma et al. Speech recognition of Punjabi numerals using synergic HMM and DTW approach

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031216