JPH0758435B2 - 話者確認装置 - Google Patents

話者確認装置

Info

Publication number
JPH0758435B2
JPH0758435B2 JP61257485A JP25748586A JPH0758435B2 JP H0758435 B2 JPH0758435 B2 JP H0758435B2 JP 61257485 A JP61257485 A JP 61257485A JP 25748586 A JP25748586 A JP 25748586A JP H0758435 B2 JPH0758435 B2 JP H0758435B2
Authority
JP
Japan
Prior art keywords
person
codebook
quantization distortion
voice
code book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61257485A
Other languages
English (en)
Other versions
JPS63110496A (ja
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61257485A priority Critical patent/JPH0758435B2/ja
Publication of JPS63110496A publication Critical patent/JPS63110496A/ja
Publication of JPH0758435B2 publication Critical patent/JPH0758435B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はテキスト独立形の話者確認装置の改良に関す
る。
(従来の技術) 話者確認装置は、入力された音声を、前もつて登録され
た音声パターンと比較し一致の度合を検定することによ
り、発声者が登録人本人であるか否かを判定するシステ
ムである。このシステムにおいて、システム側が発話内
容を知つている場合テキスト依存形と呼ばれ、発話内容
が不明の場合テキスト独立形と呼ばれる。テキスト依存
形は確認率が高いが、発話者がパスワードを忘れた場合
使用できない。一方、テキスト独立形は発話者がパスワ
ードを忘れても使用できる。本発明は後者の形式の話者
確認システムに関する。
この様な話者確認装置は銀行業務における印鑑のかわり
として、あるいは入門保安のための錠のかわりとして有
用であり、その実現が強く望まれている。
従来試みられているテキスト独立形話者確認装置は、例
えば1985年4月に発行されたIEEEのInternasional Conf
erence on Acoustics,Speech,and Signal Processingの
予稿集の第387頁から第389頁に「A Vectov Quantizatio
n Approach to Speaker Recoqnition」と題して発表さ
れた論文に記載されている。その概略を以下に説明す
る。
あらかじめ、各人の音声より、その音声を代表する複数
個のベクトルを求め、コードブツクとして記憶してお
く。このコードブツクは音声サンプルよりクラスタリン
グ等により求めることができる。照合時には、名のつた
本人のコードブツクを用いて入力音声をコーデイングす
る。すなわち、入力音声の各フレームにおいても最も近
いコードベクトルを捜しそのコード列を作成する。この
コーデイング時の量子化歪を求め入力音声に対する評価
量とする。この評価量は入力音声がコードブツクに対応
する人の音声にどの程度近いかを表わしている。この評
価量である量子化歪は入力ベクトルとコードベクトルと
の差の累積であり、入力音声をx1,x2,…,xt,…,xTとす
ると、(1)式のように表わされる。
ここでxtは時刻tにおける入力ベクトル ▲ap i▼はpの人の第i番目のコードベクトル d()はベクトル間距離である。
このようにして求められた量子化歪Dp(X)が所定の閾
値より小さいときは、被照合者は本人であると判定さ
れ、逆に閾値より大きいときは詐称者であると判定され
る。
(発明が解決しようとする問題点) 従来方式の話者確認装置の問題は、閾値の適切な設定が
困難であるという点にある。すなわち、音声パターンは
発声するたびごとに変動があり、その変動の程度も個人
ごとに異なつている。このため、閾値をきびしく(すな
わち小さな値に)設定すると本人が詐称者と判定される
事態が多発し、逆に閾値をゆるく(すなわち大きな値
に)設定すると詐称者が本人であると誤判定しまうこと
になる。
本発明は、上記欠点を解消し、より性能の高いテキスト
独立形の話者確認装置を提供することを目的としてい
る。
(問題点を解決するための手段) 本発明による話者確認装置は、本人の音声を代表する複
数個のベクトルを本人コードブツクとして予め記憶して
おく本人コードブツク記憶部と、その本人ではない他人
の音声を代表する複数のベクトルを他人コードブツクと
して予め記憶しておく他人コードブツク記憶部と、前記
本人コードブツクと前記他人コードブツクを用いて被照
合者の入力パターンをそれぞれコード化しそれぞれのコ
ード化時の本人量子化歪と他人量子化歪を求めるコーデ
イング部と、前記コーデイング部にて求められた本人量
子化歪と他人量子化歪を用いて被照合者が本人であるか
否かを判定する判定部とを含むことを特徴とする。
(作 用) 本発明では、個人ごとにその人の音声を代表する複数個
のベクトルを求め、コードブツクとして記憶しておく。
このコードブツクは音声サンプルよりクラスタリング等
により求めることができる。今、ある人をシステムに登
録する場合、その人のコードブツクを記憶すると共に、
その人に似ている(すなわち距離が小さい)他人のコー
ドブツクを1つまたは複数個捜し他にコードブツクとし
て記憶する。
他人コードブツクを求める方法として例えばコードブツ
ク間の距離を(2)式のように定義し ただし、AP,Aqはコードブツク、Nはコードブツクサイ
ズとするq≠pの条件下でD(AP,Aq)の小さいものよ
りK個選択しpの人の他人コードブツクとする。選択さ
れた他人をq1,q2…,qKとする。
照合時には、被照合者の音声を本人コードブツクApおよ
び他人コードブツク を用いてコーデイングし量子化歪を求める量子化歪は
(1)式により求めることができ、本人量子化歪はD
p(X)となり、他人量子化歪は となる。
被照合者が本人であるか否かの判定は、本人量子化歪だ
けでなく他人量子化歪をも用いる。すなわち、(3)式 または(4)式 Dp(X)<TH1and DqK(X)>TH2 ……(4) ただし、k=1,…,K の条件を満たした時「本人である」とし、満たさない時
「他人である」と判定する。
(実施例) 第1図は本発明の一実施例を示すブロツク図である。本
人コードブツク記憶部60と他人コードブツク記憶部70に
はあらかじめシステムに登録されている本人のコードブ
ツクとその本人に近い他人のコードブツクがそれぞれ記
憶されている。被照合者は登録番号指定部20のキーを操
作して登録番号pを入力すると共に、マイクロホン10よ
り音声を入力する。入力された音声は分析部30にて分析
され、入力パターンバツフア40に入力される(入力パタ
ーンXと呼ぶ)。
登録番号pが本人コードブツク記憶部60と他人コードブ
ツク記憶部70に入力されると、それに応じてpの人の本
人コードブツクApと他人コードブツク が順次出力される。
コーデイング部50では前記入力パターンXを本人コード
ブツクまたは他人コードブツクを用いて量子化歪が求め
られる。初めに本人コードブツクApが本人コードブツク
記憶部60より与えられ入力パターンXとの量子化歪D
p(X)が(1)式に従つて求められる。続いて他人コ
ードブツク が順次他人コードブツク記憶部70より与えられ、入力パ
ターンとの量子化歪 が同様に求められる。
判定部80では、前記コーテイング部50にて求められた量
子化歪を用いて被照合者が本人であるか否かが判定され
る。すなわち、 の最小値が求められ、その最小値よりDp(X)が小さい
か比較され、さらにDp(X)が閾値THより小さいか比較
される。両者とも小さい場合、「本人である」と判定さ
れ、その他の場合「他人である」と判定され、その結果
が出力される。
以上本発明の原理を実施例に基づいて説明したが、これ
らの記載は本発明の権利範囲を限定するものではない。
特に本明細書では音声パターンを比較するのに距離を用
いたが相関のように大小関係が逆の量を用いてもよい。
この場合、判定基準(3)と(4)の不等号が逆になる
のは自明の理である。
(発明の効果) 本発明では、本人コードブツクの他に本人に近い他人の
コードブツクを利用し照合を行つている。このため、他
人コードブツクにより他人をリジエクトする能力が向上
し、これに共い本人を受け入れる閾値をゆるく設定する
ことが可能となる。すなわち、閾値の設定が容易となり
照合率も向上する。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図である。 10……マイクロホン、20……登録番号指定部、30……分
析部、40……入力パタンバツフア、50……コーデイング
部、60……本人コードブツク記憶部、70……他人コード
ブツク記憶部、80……判定部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】本人の音声を代表する複数個のベクトルを
    本人コードブツクとして予め記憶しておく本人コードブ
    ツク記憶部と、その本人ではない他人の音声を代表する
    複数のベクトルを他人コードブツクとして予め記憶して
    おく他人コードブツク記憶部と、前記本人コードブツク
    と前記他人コードブツクを用いて被照合者の入力パター
    ンをそれぞれコード化しそれぞれのコード化時の本人量
    子化歪と他人量子化歪を求めるコーデイング部と、前記
    コーデイング部にて求められた本人量子化歪と他人量子
    化歪を用いて被照合者が本人であるか否かを判定する判
    定部とを含むことを特徴とする話者確認装置。
JP61257485A 1986-10-29 1986-10-29 話者確認装置 Expired - Lifetime JPH0758435B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61257485A JPH0758435B2 (ja) 1986-10-29 1986-10-29 話者確認装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61257485A JPH0758435B2 (ja) 1986-10-29 1986-10-29 話者確認装置

Publications (2)

Publication Number Publication Date
JPS63110496A JPS63110496A (ja) 1988-05-14
JPH0758435B2 true JPH0758435B2 (ja) 1995-06-21

Family

ID=17306950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61257485A Expired - Lifetime JPH0758435B2 (ja) 1986-10-29 1986-10-29 話者確認装置

Country Status (1)

Country Link
JP (1) JPH0758435B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775651B1 (en) * 2000-05-26 2004-08-10 International Business Machines Corporation Method of transcribing text from computer voice mail

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集、昭和61年3月、1−1−21(P.41)

Also Published As

Publication number Publication date
JPS63110496A (ja) 1988-05-14

Similar Documents

Publication Publication Date Title
US9646614B2 (en) Fast, language-independent method for user authentication by voice
EP0983587B1 (en) Speaker verification method using multiple class groups
US6580814B1 (en) System and method for compressing biometric models
KR0139949B1 (ko) 미지인 사람의 신원을 확인하기 위한 음성 검증 회로
JPH06175680A (ja) 最も近い隣接距離を使用した発声者確認装置
JPS6217240B2 (ja)
US8433569B2 (en) Method of accessing a dial-up service
US20080071538A1 (en) Speaker verification method
Rodrı́guez-Liñares et al. On combining classifiers for speaker authentication
JPS62502571A (ja) 音声分析による個人の識別
JPH0758435B2 (ja) 話者確認装置
Ly-Van et al. Signature with text-dependent and text-independent speech for robust identity verification
Chauhan et al. A review of automatic speaker recognition system
Broun et al. Distributed speaker recognition using the ETSI distributed speech recognition standard
JP3098157B2 (ja) 話者照合方法及び装置
WO2006027844A1 (ja) 話者照合装置
de Lima et al. On the use of PCA in GMM and AR-vector models for text independent speaker verification
Ariyaeeinia et al. Speaker verification based on the orthogonalisation technique
Jin et al. A high-performance text-independent speaker identification system based on BCDM.
US9978373B2 (en) Method of accessing a dial-up service
JPS58189700A (ja) 個人照合装置
Geppener et al. Design of speaker verification systems with the use of an algorithm of Dynamic Time Warping (DTW)
JP2815667B2 (ja) 話者認識方法
JPH0695690A (ja) 話者認識方法
Adeosun et al. Performance Evaluation of Voice Classifier Algorithms for Voice Recognition Using Hidden Markov Model

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term