JP2864511B2 - 話者識別方式と装置 - Google Patents

話者識別方式と装置

Info

Publication number
JP2864511B2
JP2864511B2 JP63317821A JP31782188A JP2864511B2 JP 2864511 B2 JP2864511 B2 JP 2864511B2 JP 63317821 A JP63317821 A JP 63317821A JP 31782188 A JP31782188 A JP 31782188A JP 2864511 B2 JP2864511 B2 JP 2864511B2
Authority
JP
Japan
Prior art keywords
sequence
correlation function
speaker
cross
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63317821A
Other languages
English (en)
Other versions
JPH02162400A (ja
Inventor
斉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63317821A priority Critical patent/JP2864511B2/ja
Publication of JPH02162400A publication Critical patent/JPH02162400A/ja
Application granted granted Critical
Publication of JP2864511B2 publication Critical patent/JP2864511B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Burglar Alarm Systems (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は盗難,機密漏洩の防止のために用いられる本
人の特定や認識方式及び装置に関し、特に話者の発声に
必要な声帯の振動上の特徴を用いて本人の特定や認識を
行う話者識別方式と装置に関する。
〔従来の技術〕
従来、この種の話者識別方式としては、識別したい話
者の発声音から話者の口腔の共振特性を抽出し、予め抽
出し記憶しておいたパタンとの照合を行い本人であるか
否かの判定や、話者が誰であるのかの特定を行うものが
ある。
〔発明が解決しようとする課題〕
上述した従来の話者識別方式では、一定時間間隔の分
析によって得られる音声の共振特性パラメータを、予め
記憶してある共振特性パラメータと時間軸上でパタン照
合するものである。しかしながら一定時間間隔の共振特
性パラメータを用いた時間軸上でのパタン照合では、話
者の発声の都度変化する発声速度、或いは発声の揺らぎ
によって生ずる共振特性パラメータの時間軸上での伸縮
を考慮していないため、同一話者による発声音であって
も識別困難になると言う欠点がある。更に前記方式の問
題点を改良する手段として時間伸縮を考慮したパタン照
合方法のDP(Dynamic Programing)マッチング技術を用
いて音声共振特性に着目したパタン照合の改善も試みら
れている。しかしながら、基本的に自然音声から抽出し
た共振特性パラメータを直接用いているため、話者の発
声の大きさの変動、周囲の雑音等による変化を吸収でき
ず、当該装置に慣れた協力的話者に対する識別に於いて
も十分な識別能力を有しない欠点がある。
これまでの話者識別方式は、時変系である音声の共振
特性は考慮しているものの、共振特性同様に話者の特徴
を示す発声機構の根幹である声帯音源特性を考慮にいれ
ておらず、話者識別の高精度化に限界を生じている。
本発明の目的は、時間伸縮に対する整合が比較的容易
で、話者の発声の大きさ変動及び周囲雑音に耐性の強い
話者識別を提供することにある。
〔課題を解決するための手段〕
本発明によれば、入力された一連の時間離散音声信号
の系列と、固定の或いは前記信号に適応的に定まる信号
系列との相互相関関数列を求め、予め求めた話者の相互
相関関数列と前記入力信号の相互相関関数とのパターン
照合を行い、話者の識別を行うことを特徴とする話者識
別方式が得られる。
又、本発明によれば、一連の時間離散音声信号の列を
入力する手段と、前記入力信号列と固定の或いは前記信
号に適応的に定まる信号列との相互相関関数列を求める
手段と、予め前記関数列抽出手段によって求めた少なく
とも一人以上の特定話者の相互相関関数列を記憶する手
段と、前記予め記憶した相互相関関数列と前記入力信号
列の相互相関関数列を照合する手段と、前記照合手段の
出力を基に入力信号列の発声話者の識別を行う判定手段
とを有することを特徴とする話者識別装置が得られる。
〔実施例〕
次に、本発明について図面を参照して説明する。
第1図は本発明の一実施例を示すブロック図である。
1は時間離散信号系列を入力する入力端子、10は相互相
関関数演算に用いる固定信号系列を発生する固定信号発
生器、20は入力端子1及び固定信号発生器10からの出力
を用いて相互相関関数を求める相互相関器、30は予め前
記手段によって求めた識別対象の話者の相互相関関数列
を記憶するメモリ、40は相互相関器20及びメモリ30から
の出力を用いて相互相関列の照合を行う照合器、50は照
合器40からの出力を用いて話者識別の判定を行う判定
器、2は話者識別判定結果を出力する結果出力端子であ
る。
第2図は本発明の第二の実施例を示すブロック図であ
る。第2図に於いて第1図と同一の番号を付けたブロッ
クは、第1図の対応するブロックと同一の機能を有する
もので有り、ここでは説明を省略する。端子1から入力
される時間離散信号の系列は、相互相関器20と特徴抽出
器11へ入力される。特徴抽出器11は例えば線形予測符号
化で用いられるLPCパラメータを抽出する。特徴抽出器1
1はこの他にも入力時間離散信号の系列の特徴を示す周
知のどの方法を用いても良い。特徴抽出器11で抽出され
た特徴パラメータは適応信号発生器12へ入力される。適
応信号発生器12は、入力されたパラメータ或いは、入力
されたパラメータに予め定めた係数を乗じて修正したパ
ラメータを用いて、入力時間離散信号の系列に適応的に
定まる適応信号を発生し相互相関器20へ入力する。相互
相関器20は、入力時間離散信号と適応信号発生器12から
入力される適応信号の相互相関を求める。相互相関器20
の出力に対する処理は第一の実施例と同一であるのでこ
こでは説明を省略する。
第1図及び第2図に於ける照合器40及び判定器50の動
作を第3図を用いて詳細に説明する。第3図のメモリ30
は、識別対象話者の発声音から予め求めた相互相関関数
列が記憶してある様子を図的に示したものである。メモ
リ30に記憶する内容は本方式及び装置の応用形態によっ
て変更可能である。即ち、特定の話者一人に対し本人で
あるか否かを識別する場合には、同一話者による複数の
単音節音声、単語音声、文章音声等の相関関数列を記憶
し任意の音節、単語、文章の発声によって話者の識別を
行う事が出来る。また複数話者による、予め決めた同一
内容の発声から抽出した話者毎の相互相関関数を記憶
し、話者の識別を行うことも出来る。
始めに前者の同一話者の重複発声を含む複数発声デー
タを用いて話者の識別を行う場合に付説明する。第3図
に於いてメモリ30内の1番地からN番地には予め求めた
認識対象話者の相互相関関数列が格納されている。ここ
では説明の簡単のため同一話者の氏名を予めN回発声し
て得られた相関関数列が記憶されているものとする。始
めに照合器40は相互相関器20から入力される相互相関関
数列とメモリ30の一番地に格納されている相関関数列を
基に照合を行う。照合の手段としては、従来周知の線形
伸縮パターンマッチング,DPマッチングなどの非線形伸
縮パタンマッチングや波形の類似度等のいかなる照合手
段を用いても良い。ここでは線形伸縮パターンマッチン
グを用いた場合の例を第3図を用いて説明する。照合器
40は相関器20から入力される相関関数列の始端をメモリ
30から入力される参照用相関関数列の始端に整合させ、
更に入力相関関数の終端が参照相関関数列の終端に一致
するように線形に伸縮させる(伸縮させる相関関数系列
を入替えても同様な結果が得られることは自明で有
る)。次に両相互相関関数列の各々対応する離散時間点
の値にたいし例えば幾何学距離等を求め各点の距離の二
乗和を始端から終端まで積算しその結果をメモリの内容
を読み出した番地と共に判定器50に送出する。照合器40
は上述の処理をメモリに格納された相関関数列の最終番
地まで実行し、その都度読み出したメモリの番地と積算
値を判定器50に送出する。判定器50は照合器40から逐次
入力される参照相関関数列の格納番地と入力相関関数列
の距離を一旦記憶し全てのデータが照合器40から入力さ
れた後、各番地の関数列に対する誤差距離が最小なもの
を選択し予め定めた認識拒否閾値と比較し最終判定を行
なう。
次に複数話者による、予め決めた同一内容の発声から
抽出した話者毎の相互相関関数を記憶し、話者の識別を
行う場合に付説明する。第3図に於いてメモリ30内の1
番地からN番地には予め求めた認識対象話者の相互相関
関数列が格納されている。ここでは説明の簡単のため異
なった話者N人の氏名を各人が予め発声して得られた相
関関数列が記憶されているものとする。始めに照合器40
は相互相関器20から入力される相互相関関数列とメモリ
30の一番地に格納されている第一番目の話者の相関関数
列を基に照合を行う。照合の手段としては、ここでは始
端固定終端開放型の非線形伸縮パターンマッチング(DP
法)を用いた場合の例を第3図を用いて説明する。照合
器40は相関器20から入力される相関関数列の始端をメモ
リ30から入力される参照用相関関数列の始端に整合させ
DPマッチングの評価関数を用いて距離計算を行う。例え
ば距離計算の尺度として各パタン間の距離の二乗和を始
端から終端まで積算しその結果をメモリの内容を読み出
した番地と共に判定器50に送出する。照合器40は上述の
処理をメモリに格納され相関関数列の最終番地まで実行
し、その都度読み出したメモリの番地と積算値を判定器
50に送出する。判定器50は照合器40から逐次入力される
参照相関関数列の格納番地と入力相関関数列の距離を一
旦記憶し全てのデータが照合器40から入力された後、各
番地の関数列に対する誤差距離が最小となるメモリの番
地を選択し、更に得られた最小距離を予め定めた認識拒
否閾値と比較し最終判定を行う。最終出力は話者を特定
する番号となる。
〔発明の効果〕
以上説明したように本発明は話者識別の手段に、従来
用いられていなかった話者の音源特性を相互相関関数列
のパラメータとして導入し、従来、発声音の共振特性の
みで行っていた話者識別に対し高精度で識別できる効果
がある。更に、本発明の装置は話者の音源特性を良く反
映する相互相関関数列を導出する手段を付加するだけで
簡単に構成出来る効果もある。相互相関関数の導出につ
いては音声の高能率符号化に於ける音源パルス検索の手
段として周知の技術を用いて簡単に実現出来る事も知ら
れている。パターンマッチング手法としては公知の如何
なる方式を用いても高精度な識別が出来る効果があり、
簡単に従来方式から移行できる効果もある。
【図面の簡単な説明】
第1図は本発明の第一の実施例のブロック図、第2図は
本発明の第二の実施例を示すブロック図である。第3図
は第1図、第2図の動作を説明する詳細説明図。 1……入力端子、2……出力端子、10……固定信号発生
器、11……特徴抽出器、12……適応信号発生器、20……
相互相関器、30……メモリ、40……照合器、50……判定
器。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された一連の時間離散音声信号の系列
    と、固定の或いは前記信号に適応的に定まる信号系列と
    の相互相関間数列を求め、予め求めた話者の相互相関関
    数列と前記入力信号の相互相関関数との照合を行い、話
    者の識別を行うことを特徴とする話者識別方式。
  2. 【請求項2】一連の時間離散音声信号の列を入力する手
    段と、前記入力信号列と固定の或いは前記信号に適応的
    に定まる信号列との相互相関関数列を求める手段と、予
    め前記関数列抽出手段によって求めた少なくとも一人以
    上の特定話者の相互相関関数列を記憶する手段と、前記
    予め記憶した相互相関関数列と前記入力信号列の相互相
    関関数列を照合する手段と、前記照合手段の出力を基に
    入力信号列の発声話者の識別を行う判定手段とを有する
    ことを特徴とする話者識別装置。
JP63317821A 1988-12-16 1988-12-16 話者識別方式と装置 Expired - Fee Related JP2864511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63317821A JP2864511B2 (ja) 1988-12-16 1988-12-16 話者識別方式と装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63317821A JP2864511B2 (ja) 1988-12-16 1988-12-16 話者識別方式と装置

Publications (2)

Publication Number Publication Date
JPH02162400A JPH02162400A (ja) 1990-06-21
JP2864511B2 true JP2864511B2 (ja) 1999-03-03

Family

ID=18092426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63317821A Expired - Fee Related JP2864511B2 (ja) 1988-12-16 1988-12-16 話者識別方式と装置

Country Status (1)

Country Link
JP (1) JP2864511B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6580814B1 (en) * 1998-07-31 2003-06-17 International Business Machines Corporation System and method for compressing biometric models

Also Published As

Publication number Publication date
JPH02162400A (ja) 1990-06-21

Similar Documents

Publication Publication Date Title
US7447632B2 (en) Voice authentication system
JP4672003B2 (ja) 音声認証システム
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
JPH03501657A (ja) パターン認識エラー低減装置
JPS58102299A (ja) 部分単位音声パタン発生装置
JP2006215499A (ja) 音声処理装置
KR20010102549A (ko) 화자 인식 방법 및 장치
JPH10274996A (ja) 音声認識装置
JP2864511B2 (ja) 話者識別方式と装置
JPH11231895A (ja) 音声認識方法及びその装置
JP2745562B2 (ja) ノイズ適応形音声認識装置
JPH0643895A (ja) 音声認識装置
JPS645320B2 (ja)
JP2005283646A (ja) 音声認識率推定装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS61180297A (ja) 話者照合装置
JP3357752B2 (ja) パターンマッチング装置
KR100677224B1 (ko) 안티워드 모델을 이용한 음성인식 방법
JPH11184492A (ja) 話者認識装置及びその方法
JPS60164800A (ja) 音声認識装置
JP2534241B2 (ja) パタ―ン比較方法
JPS6312000A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JP2018163295A (ja) 音声対話装置および音声対話方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees