JPH0354600A

JPH0354600A - 不明人物の同一性検証方法

Info

Publication number: JPH0354600A
Application number: JP2118491A
Authority: JP
Inventors: Jayant M Naik; ジェイアント　エム　ナイク; Lorin P Netsch; ローリン　ピー　ネッチ; George R Doddington; ジョージ　アール　ドッディントン
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 1989-05-09
Filing date: 1990-05-08
Publication date: 1991-03-08
Anticipated expiration: 2015-08-28
Also published as: KR0139949B1; AU5240390A; CA2013371C; DE69031189T2; EP0397399A3; DE69031189D1; KR900018910A; EP0397399A2; AU636335B2; CA2013371A1; US5054083A; JP3080388B2; EP0397399B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は全体として音声分析、殊に話し手の識別を含む
高性能話者確認装置に関する。

〔従来の技術〕

今日、数多くの用途において不明人物の同一性を確認す
る必要が存在する。同一性確認装置の一例は写真バッジ
である．写真バッジによって関係者はバッジ上の写真を
確認を要求する人物と比較してその主張を検証すること
ができる。

しかし、この検証方法は多くの欠点をもっている。第一
にバフジは紛失したり盗難されがちであって、複製と粗
悪化が比較的容易である。更に、バッジの検査は一人の
人間が行わなければならず、そのため確認を機械によっ
て行わなければならないような多くの状況には通用でき
ない。要するに、効果的な確認方式もしくは装置は費用
効果的で、高速正確かつ使いやすく不正な操作や扮装に
対して安全なものでなければならない。

例えば、長距Ｍ電話クレジットカードサービスは使用者
を確認して詐称者が別人物をかたって同サービスを使用
しないようにする必要がある。従来技術方式では長い確
認番号（呼出しカードナンバー）が設けられ、長距離電
話サービスを開始するには電話のキーパッドを介して同
番号を入力しなければならない。だが、この方法は濫用
されやすい。というのはｖ／ｉ認番号は盗難や単にその
確認番号を入力中に別人が盗み見たりすることによって
盗用されやすいからである。不法な使用によって長距離
電話サービスが蒙った損失は年に５００，００ｏ，ｏｏ
ｏ　　ドルを上廻るものと見積もられている。

話者ｉ！認システムはここ数年間利用されている．然し
なから、大部分の用途では真正の話者の棄却率が非常に
小さく、詐称者の承認率が小さいことが必要である。も
し真正の話者の棄却率が余りに高ければ、その確認シス
テムはユーザに対して負担を課すことになろう。また、
もし詐称者の承認率が大きすぎると、その確認システム
は無価値なものとなる虞れがある。従来技術による話者
確認システムは真正の話者と詐称者間の必要な区別を行
うことができず、そのため会話環境が望ましくないよう
用途では商業上受け入れることができなかった。

それ故、長距離電話サービス網上における話者の確認の
問題は今日、以前に克服されなかった挑戦を突きつけて
いる。送受マイクが異なると同じ話者について異なる送
受器から取集された会話データどうしが著しく不整合す
る結果になる。更に、電話回線は信号の歪みをもたらし
、話者確認システムの精度を低めている。同様に、話者
や音声条件に対して制御することが殆んど不可能である
。

それ故、産業上、電話回線上呼出しカードの濫用を防止
できるシステムに対する必要が生まれている。更に、特
に確認が長距離電話網上で行われるような環境の下で真
正の話者と詐称者を効果的に識別することのできる話者
確認システムを提供する必要が生じている。

〔発明が解決しようとする課題〕

本発明によれば、従来の確認システムに関連する諸問題
を実質上少なくすることのできる話者確認方法と装置が
提供される。

即ち、使用者が有効な使用者であるかそれとも詐称者で
あるかを判断する話者確認法を使用する長距Ｍ電話サー
ビスが提供される。使用者は或る種の６１認形式を提供
することによって、ｇ通には呼び出しカード番号を電話
のタフチトーンパッド上に入力することによってｌ＋！
認を要求する。

相手側は使用者に対して音声サンプルを発するように求
め、それは続いて変形されて有効な使用者によって提供
される音声サンプルからつくりだされた基準モデルと比
較される．その比較によって点数がつけられ、その点数
はその使用者を受入れるか拒否するかを判断するために
使用される。

本発明の電話サービスｉ認システムは従来技術に対して
著しい利点を提供することができる．承認されるために
は詐称者は正確な文句と適当な抑揚とリズム感を知って
おかなければならず、真正の話者に十分似かよった音声
の特徴を備える必要があろう。そのため同システムを出
し抜く可能性はすこぶる少ない。

〔課題を解決するための手段〕

本発明の話者確認システムは身元不明の話者からの入力
音声を受取る。音声信号はＬＰＧ解析に附され、音声信
号エネルギーと音声信号のスペクトル内容に基づいた一
組のスペクトルとエネルギーのパラメータを導き出す。

これらのパラメータは変換されて真正の話者と既知の詐
称者間の識別度を最大にするように設計された統計上最
適の特徴を有するテンプレートを導き出すようにする。

上記のテンプレートは真正の話者について先に記憶され
た基準モデルと比較される。その基準モデルとの比較か
ら一定のスコアが導き出され同スコアは闇値と比較され
てその道の話者が真正の話者であるか詐称者であるかが
判断される。入力音声の基準音声との比較はダイナミッ
クタイムヮーピングか陰マルコフ模型法（ｔｌｉｄｄｅ
ｎ　Ｍａｒｂｏｖ　Ｍｏｄｅ１ｉｎｇ）の何れかを使用
してユークリンド距離測定値（対応する特徴どうしの間
の距離の２乗の和）を用いて行う。

本発明の一面では、上記変換は２個のマトリックスを用
いて計算される。第１のマトリ．，クスはデータベース
内の真正話者全体の音声から導き出されるマトリックス
である。第２のマトリソクスはそのデータベース内の詐
称者全体から導き出されるマトリックスであって、それ
らの音声が真正の話者のそれと混同される可能性のある
ものである。

第２のデータベースは真正話者と既知の詐称者を識別す
ための基準を提供することによってシステムの識別度を
向上させる。

本発明の話者確認システムは従来技術によるシステムに
対して著しい利点を提供する。第一に、真正話者が棄却
される割合に対して詐称者が承認される割合は減少する
。第２に、変換マトリックスの次元数が減るためテンプ
レ−Ｐの記憶条件と計算上の負担を少なくすることがで
きる。

〔実施例〕

本発明の実施例は第１−６図を参照することによって最
も良く理解することができよう。

第１図は長距離呼出しカードサービスに関して話者確認
法を使用する人物確認法を描いたフローチャート１０を
示す。ブロック１２において、ある人物が唯一クしかな
い身元確認に相当する一定の情報を提供することによっ
て同一性確認を要求する。

例えば、長距離電話加入者であれば唯一のＩＤ番号を入
力してその同一性確認を要求する。ビル内に立入る場合
のようなその他の用途では写真バッジを提示することに
よって確認を要求することができよう。

ブロック１２で提示される確認方法は盗難されたり変更
されたりするから、本発明の人物確認システムではブロ
ック１４においてその人物から音声サンプルを要求する
ことになっている。ブロノク１６において、その人物か
ら提供された音声サンプルはその１ｉ１！認が求められ
ている話者（いかなる「真正の」話者）について先に得
た保存基準音声サンプルと比較される。許可を得ていな
い使用者が別の有効な使用者のために基準モデルを模造
しないようにするために追加的な気密保護対策が必要で
ある。もしその音声サンプルがデシジョンブロソク１８
内の予め規定された判断基準に従って保存音声サンプル
と相関性をもっていれば、その人物により提供された身
元確認はプロソク２０において承認される．もし基準音
声サンプルと入力された発声音声どうしを突合わせてそ
の結果がデシジョンブロックｌ８内の判断基準を充たさ
なければ、その提供された身元確認はブロック２２で棄
却される。

第２図はある使用者の音声を本発明の話者確認システム
内に組込んだ場合を示したブロック線図である。

上記績戒局面で、本システムの使用者はそれぞれ、使用
者がシステムに対するアクセス権を得るために使用する
許諾局面を伴う音声サンプルを提供する。登録された音
声サンプルはアナログデジタル（Ａ／Ｄ）変換器２４を
使用してデジタル化される。デジタル化された音声は回
路２６において線形予測符号化（Ｌ　Ｐ　Ｇ）解析に付
される。登録された音声サンプルの初めと終りは発声提
出回路２８によって検出される。発声検出回路２８は高
速上部方向適応と低速下部方向適応法を使用してＲＭＳ
エネルギー発声レベルパラメータを見積もる。（４０ｍ
ｓｅｃフレーム毎に計算される。）発声検出闇値はノイ
ズレベル評価値と所定の最小発声レベルより判断される
。

音声レベル評価値が特定の持続時間（例えば５　０　０
ｍｓｅｃ）についてピーク発声レベルの一定分数値（例
えば０．１２５）以下にとどまる場合に発声の終りが宣
言される。普通の場合、その発声は２〜３秒の持続時間
を有する。

特徴抽出回路３０はＬＰＧデータの各フレームから複数
のパラメータを計算する。特徴抽出回路３０は以下のも
のを含む３２個のパラメータを計算することが望ましい
。即ち、音声レベル評価値、ＲＭＳフレームエネルギー
、スペクトル変化率のスカラー値、フレームエネルギー
によって正規化されたＭＥＬ間隔シミュレーションフィ
ルタを使用した１４個のフィルタバンクの大きさ、４０
ｍｓｅｃにわたるフレームエネルギーの時間差、および
４０ｍｓｅｃにわたる１４個のフィルタバンク値の時間
差である。

特徴抽出回路３０は上記３２個のパラメータを計算して
各フレームにつきＬＰＧデータを線形変換して１４個の
特徴を導き出す．（最も重要性のない特徴は破棄される
。）第５図に関して線形変換マトリックスの形戒方法を
説明する。４０＋ｍｓｅｃフレーム毎に特徴抽出回路３
０により計算された１４個の特徴は基準テンプレートメ
モリ３２内に記憶される。

第３図はｌｉｉ認回路を示すブロック線図である。

アクセスを希望する人物は音声・確認システムに対して
許可文句を繰返さなければならない。正確な許可文句を
知らないために詐称者の多くは拒否されることになろう
。入力音声（以下「確認用音声」と称する）は処理ｆ１
！認回路３４に入力され、そこでその確認用音声は登録
中に提供された音声とマッチするかどうかが判断される
。もしその音声が判断論理３６によって承認されれば、
回路３８内で基準テンプレートが更新される。もし確認
用音声が棄却されれば、その人物は文句を繰返すことを
求められる。もし所定数だけその試みを繰返した後でそ
の確認用音声が棄却されれば、使用者はアクセスを拒絶
される。

確認がそれぞれ首尾良く行われた後に、基準テンプレー
トはその基準と最近の発声（特徴定義域における）を以
下の如く平均化することによって更新される。即ち、Ｒｎｅｗ　＝　（１−ａ）　Ｒａｉｄ　＋ａＴ但し、ａ　＝ｍｉｎ（　ｍａｙ（１／ｎ，　０．　０　５　）
，　０．　２　）ｎ−セッションインデックスＲ＝基準テンプレートデータＴ＝最終承認発声第４図に発声確認方法を示すブロック線図を示す。

使用者がアクセスを求めることによって提供された音声
はブロック４０−４４内のＡ／Ｄ変換、ＬＰＣ解析、お
よび特徴抽出に附される。上記Ａ／て変換、ＬＰＣ解析
および特徴抽出は第２図に関して説明したプロセスと同
一である．特徴抽出回路４４により計算されたパラメー
タはダイナミックタイムワービング比較回路４６に入力
される。ダイナミックタイムワービング（ＤＴＷ）は２
個の発声（基準音声と確認用音声）の等時点での時間整
合が非線形である場合に最適のワーピング機能を使用す
るものである。２個の発声間の相関関係は各フレームに
おいて時間整合した基準音声とｆＩＩ認用音声とを表わ
す特徴パラメータ間のユークリッド距離を時間積分する
ことによって導き出される。上記ＤＴＷ比較回路４６は
２個の音声間の類似性を表わすスコアを出力する。同ス
コアは判断論理３６によって所定闇値と比較され、その
音声が承認できるかそれとも拒否さるべきかが判断され
る。

特徴抽出回路４４、３０内に使用される線形変換マトリ
ックスを計算するために一群の使用者についての音声デ
ータベースを収集する。例えば、その音声データベース
が電話網と関連して使用される場合にはデータベースの
音声は長距離電話網について収集し、電話回線による偏
差と送受マイクロと信号の歪みに対して備えることにな
ろう。

音声は一連のセッションについて使用者から収集する。

各セッション中に使用者は“１６５０アトランタ、ジョ
ージア州”の如き許可用文句や“７６５−４８２１”の
如き電話番号を繰返すことになる。

第５ａ図は１人の使用者についての音声データを示す。

データベース音声はデシタル化され、第２図について論
じたようなＬＰＧ解析に付される。

その結果、各音声３８は一連の４Ｑｍｓｅｃフレーム５
０に分解される。各フレームは本文中で先に論じたよう
な３２個のパラメータによって表わされる。例えば、第
５ａ図において、それぞれの話者は４０個の発声を提供
する。真正の話者全部について計算されプール化された
共分散マトリソクスに対して実行された主戒分解析から
初期線形変換マトリックスもしくは「インクラスｊ共分
散マトリックス（Ｌ）が導き出される。初期線形変換マ
トリックス（Ｌ）を計算するためには４０個（もしくは
その他の所定数の）時間整合データベース音声について
各話者毎に共分散マトリックスを計算する。データベー
ス内の各話者について導き出された共分散マトリックス
は共にプール化され対角線状に行列化される。初期線形
変換マトリックスはプール化された共分散マトリソクス
の固有ベクトルより構威される。その結果、上記対角線
状に行列化された初期線形変換マｌ−　ＩＪックスは３
２×３２の次元を有することになろう。然しなから、そ
の結果得られるマトリフクスは統計的分散が少なくなる
順序に格付けされた非相関性の特徴を備えることになる
。それ故、最も重要でない特徴は廃棄することができる
。結果として得られる初期線形変換（上記の最も重要性
の少ない特徴を廃棄した後の）はデータ内の分散全体の
ほぼ９５％を占めることになる。

本発明の重要な局面は、上記初期線形変換マトリックス
が所与のデータベース中で真正話者と詐称者の識別度を
最大にするように調節される点である。相関性のない特
徴は、識別するためには優れた特徴ではないから、話者
の識別度は一組の統計上相関性のない特徴をつくりだす
よりもより望ましい目標である。

類別内のもしくは「混同」共分散マトリソクスを、所与
の真正話者について出し抜いた全ての詐称者に対する全
ての時間整合発声について計算する。例えば、もし真正
の話者以上の１２０人の詐称者によって提供された音声
データが真正の話者によるものと１認システムにより承
認されるであろうとデータベースが示した場合には、こ
れらの発声について共分散マトリックスが計算される。

それぞれの真正話者の詐称者について計算された共分散
マトリックスは全ての真正話者についてプールされる。

プール化された詐称者データに相当する共分散マトリッ
クスは「インタークラス」もしくは「混同」共分散マト
リックス（Ｃ）として知られる。

最後の線形変換マトリックス（ＬＴ）を計算するには、
初期線形変換共分散マトリソクス（Ｌ）が対角線状に行
列化されてマトリソクス（Ｌｄ）が得られる。マトリッ
クス（Ｌｄ）は混同マトリックス（ｃ）と乗ぜられた後
対角線状に行列化される。その結果得られるマトリック
スは線形変換マトリソクス（ＬＴ）である．第５ｂ図の
ブロック５２−５８内には線形変換マトリソクスのｈ十
算方法を示すブロック線図が示されている。

混同マトリックスにより提供される変換によって更に音
声特徴ベクトルが回転し、真正話者と詐称者間の識別度
が大きくなる。詐称者の棄却率が大きくなる他に、上記
変換によって音声表示に使用される特徴数（次元数）は
更に少なくすることができる。何故ならば、有力な次元
のみを保存すれば足りるからである。主要なスペクトル
戒分については１フレームあたり１８個の特徴ベクトル
を使用することが普通であるが、本発明に関しては１４
個の特徴ベクトルを使用できることが判った．特徴ベク
トル数が少なければ少ない程、それだけ変換に固有のノ
イズは少なくなる。

第６図には詐称者の承認率を真正話者の棄却率の関数と
して比較した実験効果が示されている。

第６図において、曲線“Ａ”は混同マトリックスを使用
せずに計算した詐称者の承認率を示す。曲線“Ｂ”は混
同マトリックスを使用して話者を識別する場合の詐称者
の承認率を示す。

同図より判る通り、ほぼ２％の真正話者の棄却率に対し
て本発明は詐称者の承認率をほぼｌＯ％だけ減らすこと
ができる。

基準音声と確認用音声の比較を行うダイナミックタイム
ワーピング（時間整合）法の他に、陰マルコフ模型式（
Ｈｉｄｄｅｎ　Ｍａｒｋｏｖ　Ｍｏｄｅｌ　（ＨＭＭ）
による比較法を使用することもできよう。）ＨＭＭ比較
によればそれぞれ上記の如く変換される基準音声と確認
用音声とを状況に応じて比較することができよう。

主として語間の句切りによってひきおこされる不正確さ
のために逐語的なＨＭＭ比較法は全文句比較に好適であ
ることが判った。

以上、本発明を詳説したが、請求範囲に規定する本発明
の精神と範囲から逸脱せずに各種の変更、置換ならびに
変形を施こすことが可能であることを了解されたい。な
らびに変形を施こすことが可能であることを了解された
い。

以下の記載に関連して以下の条項を開示する。

ｌ．不明人物より入力音声を受取り、同入力音声を一組の所定パラメータにコーディングし、同パラメータを真正話者と既知の詐称者間の識別度が最
大になるように変換する、段階とより成る不明人物の同
一性検証方法。

２．　上記変換段階がパラメータを線形変換マトリック
スによって変換する段階より成る１項記載の方法。

３．上記線形変換マトリックスによりパラメータを変換
する段階が、複数の話者から音声サンプルのデータベースを形成し、
同音声サンプルを複数のパラメータへコーディングし、
上記データベース内の真正話者全体のパラメータに基づ
いたインクラス共分散マトリックスをつくりだし、データベース内の成功した詐称者のパラメータに基づい
たインタークラス共分散マトリックスをつくりだし、上記インクラス共分散マトリックスとインタークラス共
分散マトリックスに基づいた線形変形マトリックスをつ
くりだす、段階より或る１項記載の方法。

４．上記線形変換マトリソクスをつくりだす段階が、インクラス共分散マトリソクスを対角線状に行列化し、インタークラス共分散マトリックスを対角線状に行列化
されたインクラス共分散マトリックスによって乗算し、同乗算段階において形成されたマトリックスを対角線状
に行列化する、段階より成る３もしくは１０項記載の方
法。

５．　上記音声をコーディングする段階が同音声に対し
て線形予測コーディングを実行しスペクトル情報を生成
させる段階より或る１もしくは８項記載の方法。

６．　上記音声コーディング段階が更らに同音声に対し
て線形予測コーディングを実行してエネルギー情報を生
戒される段階より成る５項もしくは１３項記載の方法。

７．　上記音声コーディング段階が更に同音声をデジタ
ル化した後、上記線形予測コーディングを実行する６項
もしくは１４項記載の方法。

８．電話網上で不明人物の同一性を検証する方法におい
て、電話網上で不明人物から入力音声を受取り、入力音声を
一組の所定パラメータにコーディングし、同パラメータを変換することによって真正話者と既知詐
称者間の識別度を最大化する、段階より成る前記方法。

９．上記変換段階が、電話網上で音声データを送る一群
の話者から受取った音声データに基づいて線形変換マト
リックスによりパラメータを変換する段階より成る８項
記載の方法。

１０．上記線形変換マトリックスによりパラメータを変
換する段階が電話網上の複数の話者から音声サンプルの
データベースを形威し、同音声サンプルを複数のパラメ
ータにコーディングし、上記データベース内の真正話者
全体のパラメータにもとづいてインクラス共分敗マトリ
ックスをつくりだし、データベース内の成功した詐称者のパラメータにもとづ
いてインタークラス共分散マトリックスをつくりだし、上記インクラス共分散マトリックスとインタークラス共
分散マトリソクスにもとづいて線形変換マトリックスを
つくりだす、段階より或る９項記載の方法。

１１．不明人物より入力音声を受取る回路と、同入力音
声を一組の所定パラメータにコーディングする回路と、同パラメータを変換することによって真正話者と既知詐
称者間の識別度を最大にする回路と、より成る不明人物
の同一性検証装置。

１２．上記変換回路が線形変換マトリソクスによりパラ
メータを変換する回路より成る１ｌ項記載の装置．１３．上記線形変換マトリソクスによってパラメータを
変換する回路が、複数の話者から音声サンプルのデータベースを形成する
回路と、同音声サンプルを複数のパラメータにコーディングする
回路と、データベース内の真正話者全体のパラメータに基づいて
インクラス共分散マトリックスをつくりだす回路と、データベース内の或功した詐称者のパラメータに基づい
てインタークラス共分散マトリソクスをつくりだす回路
と、上記インクラス共分散マトリノクスとインタークラス共
分散マトリソクスに基づいて線形ｆ換マトリックスをつ
くりだす回路と、より成る１１項記載の装置。

１４．上記線形変換マトリックスをつくりだす回路が、インクラス共分散マトリンクスを対角線状に行列化する
回路と、インタークラス共分散マトリックスを対角線化されたイ
ンクラス共分散マトリックスを乗ずる回路と、上記インタークラス共分散マトリソクスと対角線化され
たインクラス共分散マトリックスとの積を対角線状に行
列化する回路と、より或る１３項の装置。

１５．上記コーディング回路が上記音声に対して線形予
測コーディングを実行することによってスペクトル情報
を生戒する１１項記載の装置。

１６．上記コーディング回路が更に上記音声に対して線
形予測コーディングを実行して工不ルギー情報を生戒さ
せる回路より或る１５項記載の装置。

】７．上記コーディング回路が更に上記音声をデジタル
化した後に上記線形予測コーディングを実行する１６項
記載の装置。

１８．電話呼出しカードサービスの不明使用者の同一性
検証装置において、同サービスの有効使用者に相当する確認情報を受取る回
路と、上記不明の使用者に対して許可用文句を話すように求め
る回路と、同要求に応じて不明使用者の音声信号を受取る回路と、上記音声信号に基づいて不明使用者の同一性を検証する
回路と、より成る前記装置。

１９．上記確認情報を受取る回路が識別番号に相当する
信号を受取る回路より成る１８項記載の装置。

２０．上記要求回路が所望文句を明らかにせずに不明使
用者から音声入力を要求するように動作する１８項記載
の装置。

２１．上記要求回路が所望文句を出力し使用者に対して
その所望文句を繰返すように求める１８項記載の装置。

２２．上記検証回路が、音声信号を音声特徴に変換する回路と、同音声特徴を有
効な使用者から得た基準音声特徴を比較する回路と、より或る１８項の装置。

２３．更に、不明使用者が有効な使用者であることをｔ
ｉ認した後に基準音声特徴を更新する回路を備える２２
項記載の装置。

２４．電話呼出しカードサービスの不明使用者の同一性
検証方法において、同サービスの有効使用者に相当する６ｍ！認情報を受取
り、不明使用者に対して許可用文句を話すように求め、その要求に応じて不明使用者の音声１言号を受取り、同音声信号に基づいて不明使用者の同一性を確認する、前記方法。

２５．上記確認情報を受取る段階が識別番号に対応する
信号を受取る段階より或る２４項記載の方法。

２６．上記要求段階が許可用文句を明らかにせずに不明
使用者に対して同文句を話すように求める段階より成る
２４項記載の方法。

２７．上記要求段階がある文句を不明使用者に伝達し、
同使用者に対してその伝達文句を繰返すように求める２
４項記載の方法。

２８．上記確認段階が、音声信号を音声特徴に変換し、同音声特徴を有効な使用者から得た基準音声特徴と比較
する２４項記載の方法。

２９．更に、不明使用者が有効な使用者であることを確
認した後に基準音声特徴を更新する段階を備える２８項
記載の方法。

３０。話者確認装置が身元不明の話者からの入力音声を
受信する。

同音声は同様に変換された基準音声パラメータと比較さ
れる時に真正の話者と詐称者間の識別を最大にするよう
にＬＰＧ解析と変換に附される。

上記変換はデータベース内に成功した詐称者の“インタ
ークラス”共分散マトリックスを組込んでいる。

【図面の簡単な説明】

第１図は音声確認法を使用する長距離電話呼出しカード
サービスにおける人物の同一性確認システムを示すフロ
ーチャート、第２図は話者を本発明の話者確認システム中に登録した
状態を示すブロック線図、第３図は本発明に使用されるｆｉｌ認用音声と基準音声
の更新を示すプロ・ノク線図、第４図は本発明に使用される確認システムを示すブロッ
ク線図、第５ａ図は本発明において変換マトリックスを形威する
ために使用されるインクラスおよびインタークラスマト
リックス形戒用ベクトル図、第５ｂ図は話者識別変換マ
トリソクスの形或を示すブロック線図、第６図は従来技術話者確認システムと比較した時の本発
明の話者確認システムの比較図である。１０・・・７１：Ｉ−チャート、１８・・・アソアヨン
ブロック、２４・・・Ａ／Ｄ変換器、２８・・・発声検
出回路、３０・・特徴抽出回路、４６・・・ＤＴＭ比較
回路。ＦＩＣ；．１ＦＩＧ．２

Claims

【特許請求の範囲】不明人物より入力音声を受取り、同入力音声を一組の所定パラメータにコーディングし、同パラメータを真正話者と既知の詐称者間の識別度が最
大になるように変化する、段階とより成る不明人物の同
一性検証方法。