JPS63110496A - 話者確認装置 - Google Patents
話者確認装置Info
- Publication number
- JPS63110496A JPS63110496A JP61257485A JP25748586A JPS63110496A JP S63110496 A JPS63110496 A JP S63110496A JP 61257485 A JP61257485 A JP 61257485A JP 25748586 A JP25748586 A JP 25748586A JP S63110496 A JPS63110496 A JP S63110496A
- Authority
- JP
- Japan
- Prior art keywords
- person
- codebook
- quantization distortion
- voice
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明はテキスト独立形の話者確認装置の改良に関する
。
。
(従来の技術)
話者確認装置は、入力された音声を、前もって登録され
た音声パターンと比較し一致の度合を検定することによ
シ、発声者が登録人本人であるか否かを判定するシステ
ムである。このシステムに訃いて、システム側が発話内
容を知っている場合テキスト依存形と呼ばれ、発話内容
が不明の場合テキスト独立形と呼ばれる。テキスト依存
形は確認率が高いが、発話者がパスワードを忘れた場合
使用できない。一方、テキスト独立形は発話者がパスワ
ードを忘れても使用できる。本発明は後者の形式の話者
確認システムに関する。
た音声パターンと比較し一致の度合を検定することによ
シ、発声者が登録人本人であるか否かを判定するシステ
ムである。このシステムに訃いて、システム側が発話内
容を知っている場合テキスト依存形と呼ばれ、発話内容
が不明の場合テキスト独立形と呼ばれる。テキスト依存
形は確認率が高いが、発話者がパスワードを忘れた場合
使用できない。一方、テキスト独立形は発話者がパスワ
ードを忘れても使用できる。本発明は後者の形式の話者
確認システムに関する。
この様な話者確認装置は銀行業務における印鑑のかわシ
として、あるいは入門保安のための錠のかわりとして有
用であり、その実現が強く望まれている。
として、あるいは入門保安のための錠のかわりとして有
用であり、その実現が強く望まれている。
従来試みられているテキスト独立形話者確認装置は、例
えば1985年4月に発行されたIEEEのInter
nasionaA Conference onAco
ustics、5peech、and SignalP
rocessing の予稿集の第387頁から第3
89頁にrA Vectov Quantizati
onApproach to 5peaker R
ecoqnitionJと題して発表された論文に記載
されている。その概略を以下に説明する。
えば1985年4月に発行されたIEEEのInter
nasionaA Conference onAco
ustics、5peech、and SignalP
rocessing の予稿集の第387頁から第3
89頁にrA Vectov Quantizati
onApproach to 5peaker R
ecoqnitionJと題して発表された論文に記載
されている。その概略を以下に説明する。
あらかじめ、各人の音声よシ、その音声を代表する複数
個のベクトルを求め、コードブックとして記憶しておく
。このコードブックは音声サンプルよシフラスタリング
等によシ求めることができる。照合時には、名のった本
人のコードブックを用いて入力音声をコーディングする
。すなわち、入力音声の各フレームにおいて最も近いコ
ードベクトルを捜しそのコード列を作成する。このコー
ディング時の量子化歪を求め入力音声に対する評価量と
する。この評価量は入力音声がコードブックに対応する
人の音声にどの程度近いかを表わしている。この評価量
である量子化歪は入力ベクトルとコードベクトルとの差
の累積であシ、入力音声をXl t X2 m・・・
、Xj、・・・、XTとすると、(1)式のように表わ
される。
個のベクトルを求め、コードブックとして記憶しておく
。このコードブックは音声サンプルよシフラスタリング
等によシ求めることができる。照合時には、名のった本
人のコードブックを用いて入力音声をコーディングする
。すなわち、入力音声の各フレームにおいて最も近いコ
ードベクトルを捜しそのコード列を作成する。このコー
ディング時の量子化歪を求め入力音声に対する評価量と
する。この評価量は入力音声がコードブックに対応する
人の音声にどの程度近いかを表わしている。この評価量
である量子化歪は入力ベクトルとコードベクトルとの差
の累積であシ、入力音声をXl t X2 m・・・
、Xj、・・・、XTとすると、(1)式のように表わ
される。
ここでXtけ時刻tにおける入力ベクトルa五はpの人
の第1番目のコードベクトルd()はベクトル間距離で
ある。
の第1番目のコードベクトルd()はベクトル間距離で
ある。
このようにして求められた量子化歪Dp(X)が所定の
閾値よシ小さいときは、被照合者は本人であると判定さ
れ、逆に閾値よ)大きいとぎは詐称者であると判定され
る。
閾値よシ小さいときは、被照合者は本人であると判定さ
れ、逆に閾値よ)大きいとぎは詐称者であると判定され
る。
(発明が解決しようとする問題点)
従来方式の話者確認装置の問題は、閾値の適切な設定が
困難であるという点にある。すなわち、音声パターンは
発声するたびごとに変動があり、その変動の程度も個人
ごとに異なっている。このため、閾値をきびしく(すな
わち小さな値に)設定すると本人が詐称者と判定される
事態が多発し、逆に閾値をゆるく (すなわち大きな値
に)設定すると詐称者が本人であると誤判定し寸うこと
になる。
困難であるという点にある。すなわち、音声パターンは
発声するたびごとに変動があり、その変動の程度も個人
ごとに異なっている。このため、閾値をきびしく(すな
わち小さな値に)設定すると本人が詐称者と判定される
事態が多発し、逆に閾値をゆるく (すなわち大きな値
に)設定すると詐称者が本人であると誤判定し寸うこと
になる。
本発明は、上記欠点を解消し、よシ性能の高いテキスト
独立形の話者確認装置を提供することを目的としている
。
独立形の話者確認装置を提供することを目的としている
。
(問題点を解決するだめの手段)
本発明による話者確認装置は、本人の音声を代表する複
数個のベクトルを本人コードブックとして予め記憶して
おく本人コードブック記憶部と、七の本人ではない他人
の音声を代表する複数のベクトルを他人コードブックと
して予め記憶しておく他人コードブック記憶部と、前記
本人コードブックと前記他人コードブックを用いて被照
合者の入力パターンをそれぞれコード化しそれぞれのコ
ード化時の本人量子化歪と他人量子化歪を求めるコーデ
ィング部と、前記コーディング部にて求められた本人量
子化歪と他人量子化歪を用いて被照合者が本人であるか
否かを判定する判定部とを含むことを特徴とする。
数個のベクトルを本人コードブックとして予め記憶して
おく本人コードブック記憶部と、七の本人ではない他人
の音声を代表する複数のベクトルを他人コードブックと
して予め記憶しておく他人コードブック記憶部と、前記
本人コードブックと前記他人コードブックを用いて被照
合者の入力パターンをそれぞれコード化しそれぞれのコ
ード化時の本人量子化歪と他人量子化歪を求めるコーデ
ィング部と、前記コーディング部にて求められた本人量
子化歪と他人量子化歪を用いて被照合者が本人であるか
否かを判定する判定部とを含むことを特徴とする。
(作 用)
本発明では、個人ごとにその人の音声を代表する複数個
のベクトルを求め、コードブックとして記憶しておく。
のベクトルを求め、コードブックとして記憶しておく。
このコードブックは音声サンプルよシフラスタリング等
によシ求めることができる。
によシ求めることができる。
今、ある人をシステムに登録する場合、その人のコード
ブックを記憶すると共に、その人に似ている(すなわち
距離が小さい)他人のコードブックを1つまたは複数個
捜し他人コードブックとして記憶する。
ブックを記憶すると共に、その人に似ている(すなわち
距離が小さい)他人のコードブックを1つまたは複数個
捜し他人コードブックとして記憶する。
他人コードブックを求める方法として例えばコードブッ
ク間の距離を(2)式のように定義し q ただし、A、A はコードブック、Nはコードブック
サイズとするq〆pの条件下でD (A 。
ク間の距離を(2)式のように定義し q ただし、A、A はコードブック、Nはコードブック
サイズとするq〆pの条件下でD (A 。
Aq)の小さいものよシに個選択しpの人の他人コード
ブックとする。選択された他人を(It 、(It・・
・e qK とする。
ブックとする。選択された他人を(It 、(It・・
・e qK とする。
照合時には、被照合者の音声を本人コードブツp
ql
92りAおよび他人コードブックA、A、・・・。
ql
92りAおよび他人コードブックA、A、・・・。
AqK を用いてコーディングし量子化歪を求める量子
化歪は(1)式によシ求めることができ、本人量子化歪
はD (X)となシ、他人量子化歪はD91■Dq
t (X ) * ・・・、 D(IK(X) とな
る。
化歪は(1)式によシ求めることができ、本人量子化歪
はD (X)となシ、他人量子化歪はD91■Dq
t (X ) * ・・・、 D(IK(X) とな
る。
被照合者が本人であるか否かの判定は、本人量子化歪だ
けでなく他人量子化歪をも用いる。すなわち、(3)式 %式%()) または(4)式 Dp (X) <THI and Dqx (X)
> TH2−” (4)ただし、k=1.−・・、に の条件を満たした時「本人である」とし、満たさない時
「他人である」と判定する。
けでなく他人量子化歪をも用いる。すなわち、(3)式 %式%()) または(4)式 Dp (X) <THI and Dqx (X)
> TH2−” (4)ただし、k=1.−・・、に の条件を満たした時「本人である」とし、満たさない時
「他人である」と判定する。
(実施例)
第1図は本発明の一実施例を示すブロック図である。本
人コードブック記憶部60と他人コードブック記憶部7
04Cはあらかじめシステムに登録されている本人のコ
ードブックとその本人に近い他人のコードブックがそれ
ぞれ記憶されている。
人コードブック記憶部60と他人コードブック記憶部7
04Cはあらかじめシステムに登録されている本人のコ
ードブックとその本人に近い他人のコードブックがそれ
ぞれ記憶されている。
被照合者は登録番号指定部20のキーを操作して登録番
号pを入力すると共に、マイクロホン10よシ音声を入
力する。入力された音声は分析部30にて分析され、入
力パターンバッファ401C入力される(入力パターン
Xと呼ぶ)。
号pを入力すると共に、マイクロホン10よシ音声を入
力する。入力された音声は分析部30にて分析され、入
力パターンバッファ401C入力される(入力パターン
Xと呼ぶ)。
登録番号pが本人コードブック記憶部60と他人コード
ブック記憶部70に入力されると、それに応じてpの人
の本人コードブックApと他人コードブックA”、A”
、・・・、AqKが順次出力される0 コーディング部50では前記入力バター/Xを本人コー
ドブックまたは他人コードブックを用いて量子化歪が求
められる。初めに本人コードブッりAが本人コードブッ
ク記憶部60よシ与えら九人カバターンXとの量子化歪
Dp(X)が(1)式に従って求められる。続いて他人
コードブックA。
ブック記憶部70に入力されると、それに応じてpの人
の本人コードブックApと他人コードブックA”、A”
、・・・、AqKが順次出力される0 コーディング部50では前記入力バター/Xを本人コー
ドブックまたは他人コードブックを用いて量子化歪が求
められる。初めに本人コードブッりAが本人コードブッ
ク記憶部60よシ与えら九人カバターンXとの量子化歪
Dp(X)が(1)式に従って求められる。続いて他人
コードブックA。
qt (IK
A 、・・・、A が順次他人コードブック記憶部70
よシ与えられ、入力パターンとの量子化歪Dqs (
X) = D(12mやぼ詩霧に求められる。
よシ与えられ、入力パターンとの量子化歪Dqs (
X) = D(12mやぼ詩霧に求められる。
判定部80では、前記コーディング部50にて求められ
た量子化歪を用いて被照合者が本人であるか否かが判定
される。すなわち、Dq、(X)。
た量子化歪を用いて被照合者が本人であるか否かが判定
される。すなわち、Dq、(X)。
D9.(X)、・・・、 Dqx (X)の最小値が求
められ、その最小値よ!ID、(X)が小さいか比較さ
れ、さらにDp(X)が閾値TI(よシ小さいか比較さ
れる。
められ、その最小値よ!ID、(X)が小さいか比較さ
れ、さらにDp(X)が閾値TI(よシ小さいか比較さ
れる。
両者とも小さい場合、「本人である」と判定され、その
他の場合「他人である」と判定され、その結果が出力さ
れる。
他の場合「他人である」と判定され、その結果が出力さ
れる。
以上本発明の原理を実施例に基づいて説明したが、これ
らの記載は本発明の権利範囲を限定するものではない。
らの記載は本発明の権利範囲を限定するものではない。
特に本明細書では音声パターンを比較するのに距離を用
いたが相関のように大小関係が逆の量を用いてもよい。
いたが相関のように大小関係が逆の量を用いてもよい。
この場合、判定基準(3)と(4)の不等号が逆になる
のは自明の理である。
のは自明の理である。
(発明の効果)
本発明では、本人コードブックの他に本人に近い他人の
コードブックを利用し照合を行っている。
コードブックを利用し照合を行っている。
このため、他人コードブックによシ他人をリジェクトす
る能力が向上し、これに共い本人を受は入れる閾値をゆ
るく設定することが可能となる。すなわち、閾値の設定
が容易となシ照合率も向上する。
る能力が向上し、これに共い本人を受は入れる閾値をゆ
るく設定することが可能となる。すなわち、閾値の設定
が容易となシ照合率も向上する。
第1図は本発明の一実施例を示すブロック図である。
10・・・マイクロホン、20・・・登録番号指定部、
30・・・分析部、40・・・入力バタンバッファ、5
゜・・・コーディング部、6o・・・本人コードブック
記憶部、70・・・他人コードブック記憶部、8o・・
・判定部。
30・・・分析部、40・・・入力バタンバッファ、5
゜・・・コーディング部、6o・・・本人コードブック
記憶部、70・・・他人コードブック記憶部、8o・・
・判定部。
Claims (1)
- 本人の音声を代表する複数個のベクトルを本人コードブ
ックとして予め記憶しておく本人コードブック記憶部と
、その本人ではない他人の音声を代表する複数のベクト
ルを他人コードブックとして予め記憶しておく他人コー
ドブック記憶部と、前記本人コードブックと前記他人コ
ードブックを用いて被照合者の入力パターンをそれぞれ
コード化しそれぞれのコード化時の本人量子化歪と他人
量子化歪を求めるコーディング部と、前記コーディング
部にて求められた本人量子化歪と他人量子化歪を用いて
被照合者が本人であるか否かを判定する判定部とを含む
ことを特徴とする話者確認装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61257485A JPH0758435B2 (ja) | 1986-10-29 | 1986-10-29 | 話者確認装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61257485A JPH0758435B2 (ja) | 1986-10-29 | 1986-10-29 | 話者確認装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63110496A true JPS63110496A (ja) | 1988-05-14 |
JPH0758435B2 JPH0758435B2 (ja) | 1995-06-21 |
Family
ID=17306950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61257485A Expired - Lifetime JPH0758435B2 (ja) | 1986-10-29 | 1986-10-29 | 話者確認装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0758435B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032213A (ja) * | 2000-05-26 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | ボイス・メール・メッセージを転記する方法およびシステム |
-
1986
- 1986-10-29 JP JP61257485A patent/JPH0758435B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002032213A (ja) * | 2000-05-26 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | ボイス・メール・メッセージを転記する方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
JPH0758435B2 (ja) | 1995-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9524719B2 (en) | Bio-phonetic multi-phrase speaker identity verification | |
US7054811B2 (en) | Method and system for verifying and enabling user access based on voice parameters | |
AU636335B2 (en) | Voice verification circuit for validating the identity of telephone calling card customers | |
US6580814B1 (en) | System and method for compressing biometric models | |
WO1998054694A1 (en) | Speaker verification method using multiple class groups | |
US8032380B2 (en) | Method of accessing a dial-up service | |
US7630895B2 (en) | Speaker verification method | |
KR100779242B1 (ko) | 음성 인식/화자 인식 통합 시스템에서의 화자 인식 방법 | |
Wanfeng et al. | Experimental evaluation of a new speaker identification framework using PCA | |
Reynolds et al. | Automatic speaker recognition | |
JPS63110496A (ja) | 話者確認装置 | |
Shah et al. | Neural network solution for secure interactive voice response | |
JP3098157B2 (ja) | 話者照合方法及び装置 | |
Lotia et al. | A review of various score normalization techniques for speaker identification system | |
BenZeghiba et al. | Speaker verification based on user-customized password | |
Marinov | Text dependent and text independent speaker verification system: Technology and application | |
Ho et al. | A dual-factor authentication system featuring speaker verification and token technology | |
JP2002221990A (ja) | 個人認証装置 | |
James et al. | The CAVE speaker verification project—Experiments on the YOHO and SESP corpora | |
Nedic et al. | Recent developments in speaker verification at IDIAP | |
JPS62249199A (ja) | 話者確認システム | |
Hunt | New commercial applications of telephone-network-based speech recognition and speaker verification | |
JPS63253480A (ja) | 声紋確認カ−ドシステム | |
JPS58189700A (ja) | 個人照合装置 | |
Chen | Personalize mobile access by speaker authentication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |