JPS62209500A - 話者認識装置 - Google Patents

話者認識装置

Info

Publication number
JPS62209500A
JPS62209500A JP61052122A JP5212286A JPS62209500A JP S62209500 A JPS62209500 A JP S62209500A JP 61052122 A JP61052122 A JP 61052122A JP 5212286 A JP5212286 A JP 5212286A JP S62209500 A JPS62209500 A JP S62209500A
Authority
JP
Japan
Prior art keywords
speaker
pattern
dissimilarity
time
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61052122A
Other languages
English (en)
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61052122A priority Critical patent/JPS62209500A/ja
Publication of JPS62209500A publication Critical patent/JPS62209500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本願発明は、入力された音声より話者を照合または識別
する話者認識装置に関する。
(従来の技術) 話者認識とは入力された音声より話者を推定することで
、話者照合と話者識別の2つの利用形態がある。
話者照合とは、入力された音声より自称した話者と利用
者が同一人であるか調べることであり、話者識別とは、
入力された音声の話者が登録話者内の誰であるか調べる
。このような話者認識は、IDカードなどと同罎に機械
の使用者を知る時に利用される。従来、話者照合には、
昭罪54年10月共立出版株式会社より出版された「音
声認識」(文献1と称する)の第211頁の図6.1に
記載されているパターンマツチング法が用いられている
。この方法では、入力された音声を周波数分析などで音
声分析し特徴ベクトルの時系列としてパターン化スる。
このパターンと利用者が自称した話者のvA準パターン
との間の相異度を求め、相異度が十分小さい場合「本人
」としている。
また話者識別も話者照合と同様にパターンマツチング法
が用いられている。すなわち、入力パターンと登録話者
の標準パターンとの間の相異度を求め、最も小さい相異
度が得られた標準パターンの話者を利用話者であると判
定している。
(発明が解決しようとする問題点) 従来の話者照合では、本人であるか否かの判定には、相
異度とあらかじめ定めた閾値との大小関係を用いていた
。しかしながら音声パターンには経時変化があり、本人
のパターンとの相異度は利用時期と登録時期とのずれに
よって変動する。通常ずれが大きくなるほど相異度も大
きくなる。このため経時変化による相異度の変動を許容
できる程度まで判定の閾値を大きく設定する必要があっ
た。一方、閾値が大きく設定されていると似ている他人
の音声を本人と誤ることが多く、詐称拒否率が低くなる
欠点があった。
また、従来の話者識別では入力パターンに最も似ている
標準パターンの話者を識別結果としている。しかしなが
ら、話者照合と同様に経時変化の影響を受け、入力パタ
ーンが本人の登録時刻の古い標準パターンから離れ、商
人の標準パターンに近づくことがある。そのため他人と
誤ることがあり識別率が低くなる欠点があった。
本願発明の目的は、話者照合や話者識別において利用時
刻と登録時刻の差を用い経時変化に適応した判定を行う
ことにより、認識率の高い話者認識装置を提供すること
である。
(問題点を解決するための手段) 本願の第1の発明による話者認識装置は利用話者の入力
音声を特徴ベクトルの時系列として保持する入力パター
ン記憶部と、登録話者があらかじめ発声した登録用音声
の標準パターンを記憶する標準パターン記憶部と、前記
登録用音声の発声した時刻を記憶する登録時刻記憶部と
、前記標準パターン記憶部より利用話者が自称した話者
の標準パターンを読み出し入力パターンとの相異度を求
めるパターン相λ度計算部と、前記パターン相異度計算
部にて求めた相異度と前記登録時刻記憶部より読み出さ
れた登録時刻をもとに自称した話者と利用者が同一人で
あるか照合する照合部とを有している。
また、本願の第2の発明による話者認識装置は登録話者
内のある話者の入力音声を特徴ベクトルの時系列パター
ンとして保持する入力パターン記憶部と、前記登録話者
があらかじめ発声した登録用音声の標準パターンを記憶
する標準パターン化tは部と、前記登録用音声の発声し
た時刻を記憶する登録時刻記憶部と、前記入力パターン
と前記標準パターンとの間の相異度を求めるパターン相
異度計算部と、前記パターン相異度計算部にて求めた相
異度と前記登録時刻記憶部、より読み出された登録時刻
をもとに入力音声の話者を識別する識別部とを有してい
る。
(作用) 入力された音声は周波数分析などで音声分析し、特徴ベ
クトルの時系列としてパターン化される。
この入力パターンと、利用者が別の方法で指示した(キ
ーボードや、IDカードなど)話者の標準パターンとの
間の相異度を求める。ここで用いる相異度は文献1の第
101頁より第ttS頁に記載されている時間正規化マ
ツチング法や、固定長パターンマツチング法により求め
ることができる。
話者照合では、前記相異度と閾値を用いて判定が行われ
る。この閾値は利用時刻と登録時刻の差によって定めら
れる。例えば第3図に示すような時間が大きくなる程閾
値が大きくなる増加閾値故Th(t)を用いる。
判定は以下のように行うことができる。入力パターンを
A、自称した話者Pの標準パターンをBi、i=1.・
・・+ n %標準パターンの登録時刻をtl、利用者
の入力時刻をt。、相異度をDとし、次式に従って判定
結果Rが求められる。
1fD(A、 sl)<Th(to−11)−・−+t
hen  Li = Oelse  Li = l  
………(11R=Oならば「本人である」とし、R=1
なら1 ば「他人である」と判定される。すなわち、異
なる登録時期の複alfAの標準パターンとの相異度の
内で利用時刻と登録時刻の差によって定められる閾値よ
り小さいものが1つでもあれば「本人である」とし、1
つもない時「他人である」と判定される。
一方、話者識別では、前記相異度と信頼度を用いて11
1定が行われる。この信頼度は利用時刻と登録時期の差
によって定められる。例えば第4図に示すような時間が
大きくなる程信頼度が小さくなる減少関数S(t、) 
 を用いる。
判定は以下のように行うことができる。登録語者p (
041fA準バターyをB1.1” L+ ””*  
np とすると、入力パターンとの話者相異度Dpは次
式に従って求めることができる。
このようにして求められた話者相異度DT3の最小値を
求め、戚小が得られた話者を識別結果とする。
(実施?1lL) 第1図は本願の第1の発明の一実施例を示すブロック図
である。この実施例では話者照合が実行される。
始めに入力された音声は周波数分析などの音声分析によ
り特徴ペクト/L/の時系列 A= (al t al t ”’t al )として
入力パターン記憶部1に記憶される。また、標準パター
ン記憶部2にはあらかじめ登録されている話者pの5個
の標準パターン が記憶されている。さらに、それぞれの標準パターンの
登録時刻が登録時刻記憶部4に記憶されている。
利用者は入力音声の発声とともに話者指定を行5゜この
話者pのnT)+l!の標準パターンと入力パターンと
の間の相異度がそれぞれパターン相異度計算部3にて求
められる。このパターン相異度D(A#B)は文献1の
第101頁より第108頁に記載されている時間正規化
マツチング法にて求めることができる。
続いて照合部5では、登録時刻記憶部4より標準パター
ンの登録された時刻t か読み出され、利用時刻toと
の差1o−1から閾値Th(t、o−度D(A、B)と
1(支)匝’rh(to−i)か比較i されLlが求められ、(2)式の、ra、lff1積R
が求められる。R=Oであるならば「本人である」が、
R=1であるならば「他人である」が照合結果として出
力される。
(実施例2) 第2図に本願の第2の発明の一実施例をブロック図で示
す。この実施例では話者識別が実行される。本実施例で
は第1図の実施例の照合部5が識別部6に変更されてい
る。それ以外は第1図の実施レリと同様の動作が行われ
る。
すなわち、始めに入力されたパターンAとすべての標準
パターンB との間の相異度D(A、B)が相異度計算
部3にて求められる。
続いて識別部6では、登録時刻記憶部4より標準パター
ンの登録された時刻t が読み出され、利用時刻t。ど
の差10−1  から信頼度S(t、。
−1)  か求められる。さらに(4)式のSStが求
められ、(3)式に従って1=1.・・・t npO内
で最■ 小となる〒1・o (AI B1)か求められる。最後
にすべての登録話者の内で最小となる話者相異度咋が求
められ、最小が得られた話者πが識別結果として出力さ
れる。
以上、本願発明を実施例に基づき説明したが、本願の第
2の発明の識別部における判定には前記第2図の実施例
以外にも、平均相異度Dpとしてまたは、上(iK個の
平均相異度Dp  としてま ただし、Qは■・D(A、B工)の小さいものに個の集
合を用いることもできる。
さらに、本願の第1の発明の照合部における判定には、
前記第1図の実施例以外にも、識別部で用いている話者
相異度を求め固定問直と大小関係を判定する方法も用い
ることができる。
(発明の効果) 本発明による話者認識装置は、入力音声の発声された利
用時刻と登録音声の発声された登録時刻の差を用いて判
定を行っている。これにより音声パターンの経時変化に
適応することができ、認識率が向上するという利点が生
じる。
【図面の簡単な説明】
第1図は本1頭の第1の発明の一実施例を示すブロック
図、第2図は本願の第2の発明の一実施例を示すブロッ
ク図、第3図は閾値関数を示す図、第4図は信頼度関数
を示す図である。 図において、1・・・入力パターン記憶部、2・・・標
準パターン記憶部、3・・・パターン相異度計算部、4
・・・登録時刻記憶部、5・・・照合部、6・・・識別
部である。 代理人 弁理士 本 庄 伸 介 第2図 −を 第3図 −を 第4図

Claims (2)

    【特許請求の範囲】
  1. (1)利用話者の入力音声を特徴ベクトルの時系列とし
    て保持する入力パターン記憶部と、登録話者があらかじ
    め発声した登録用音声の標準パターンを記憶する標準パ
    ターン記憶部と、前記登録用音声の発声した時刻を記憶
    する登録時刻記憶部と、前記標準パターン記憶部より利
    用話者が自称した話者の標準パターンを読み出し入力パ
    ターンとの相異度を求めるパターン相異度計算部と、前
    記パターン相異度計算部にて求めた相異度と前記登録時
    刻記憶部より読み出された登録時刻をもとに自称した話
    者と利用者が同一人であるか照合する照合部を持つこと
    を特徴とする話者認識装置。
  2. (2)登録話者内のある話者の入力音声を特徴ベクトル
    の時系列パターンとして保持する入力パターン記憶部と
    、前記登録話者があらかじめ発声した登録用音声の標準
    パターンを記憶する標準パターン記憶部と、前記登録用
    音声の発声した時刻を記憶する登録時刻記憶部と、前記
    入力パターンと前記標準パターンとの間の相異度を求め
    るパターン相異度計算部と、前記パターン相異度計算部
    にて求めた相異度と前記登録時刻記憶部より読み出され
    た登録時刻をもとに入力音声の話者を識別する識別部と
    を持つことを特徴とする話者認識装置。
JP61052122A 1986-03-10 1986-03-10 話者認識装置 Pending JPS62209500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61052122A JPS62209500A (ja) 1986-03-10 1986-03-10 話者認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61052122A JPS62209500A (ja) 1986-03-10 1986-03-10 話者認識装置

Publications (1)

Publication Number Publication Date
JPS62209500A true JPS62209500A (ja) 1987-09-14

Family

ID=12906069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61052122A Pending JPS62209500A (ja) 1986-03-10 1986-03-10 話者認識装置

Country Status (1)

Country Link
JP (1) JPS62209500A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142481A (ja) * 1999-08-26 2001-05-25 Matsushita Electric Ind Co Ltd 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム
JP2007127813A (ja) * 2005-11-02 2007-05-24 Canon Inc 音声認識装置およびその設定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001142481A (ja) * 1999-08-26 2001-05-25 Matsushita Electric Ind Co Ltd 音声/ビデオ装置用の制御システム及び音声/ビデオ構成を制御するための統合アクセスシステム
JP2007127813A (ja) * 2005-11-02 2007-05-24 Canon Inc 音声認識装置およびその設定方法

Similar Documents

Publication Publication Date Title
US6772119B2 (en) Computationally efficient method and apparatus for speaker recognition
DE60231617D1 (de) Sprecherverifikation
JPH0354600A (ja) 不明人物の同一性検証方法
US4910782A (en) Speaker verification system
JPS5876893A (ja) 音声認識装置
EP1023718B1 (en) Pattern recognition using multiple reference models
JPS62209500A (ja) 話者認識装置
JP2559031B2 (ja) 音声認識方式
JPH02210500A (ja) 標準パターン登録方式
JPS6232500A (ja) リジエクト機能付き音声認識装置
JPS5876892A (ja) 音声認識装置
KR100484210B1 (ko) 예측모델을사용한,특히억세스제어응용을위한발성자음성인식방법
JP2000067004A (ja) 本人確認方法及びその方法を用いた装置及び本人確認装置制御プログラムを記録した記録媒体
JPH0335297A (ja) 有音・無音検出方式
JPH0546196A (ja) 音声認識装置
JPH01156800A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS6364099A (ja) 音声認識装置
JPS6258517B2 (ja)
JPS61278896A (ja) 話者照合装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS58159598A (ja) 単音節音声認識方式
JPS61200596A (ja) 連続音声認識装置
JPS60147799A (ja) 音声認識方法
JPH0758435B2 (ja) 話者確認装置