JP3098157B2 - 話者照合方法及び装置 - Google Patents

話者照合方法及び装置

Info

Publication number
JP3098157B2
JP3098157B2 JP06041615A JP4161594A JP3098157B2 JP 3098157 B2 JP3098157 B2 JP 3098157B2 JP 06041615 A JP06041615 A JP 06041615A JP 4161594 A JP4161594 A JP 4161594A JP 3098157 B2 JP3098157 B2 JP 3098157B2
Authority
JP
Japan
Prior art keywords
code
speaker
codebook
vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06041615A
Other languages
English (en)
Other versions
JPH07248791A (ja
Inventor
雄偉 閔
憲也 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP06041615A priority Critical patent/JP3098157B2/ja
Publication of JPH07248791A publication Critical patent/JPH07248791A/ja
Application granted granted Critical
Publication of JP3098157B2 publication Critical patent/JP3098157B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は話者照合技術に関し、特
に、発話者の音声及び識別名称を入力として、発話者
が、表明した識別名称に対応する本人であるかどうかを
判定する基準となる閾値の決定方法及びそれを実現する
装置に関する。
【0002】
【従来の技術】話者照合装置は、発話者の表明した識別
名称が、発話者自身の真の識別名称と一致するかどうか
を判定する装置である。通常、話者照合を行う場合に
は、予め照合対象となる話者識別名称及びこの識別名称
に対応するコードブックを登録しておき、話者照合時
に、発話者の実音声と識別名称とを入力し、この識別名
称によって指定されたコードブックと発話者の実音声と
を比較してその特徴差を検出する。この特徴差が話者別
に設定された所定の閾値(本人閾値)以下の場合には表
明された識別名称が真の識別名称であり、発話者は本人
であると判定する。その他の場合は、表明された識別名
称は偽識別名称であり、発話者は詐称者であると判定す
る。このように、話者照合においては、本人閾値の設定
が重要であり、この値が適切な値であるかどうかによっ
て識別率が大きく左右される。
【0003】話者照合時の誤認識には大別して2つの原
因がある。1つは発話者が真の識別名称を表明している
にも拘わらず、識別名称が偽であると認識してしまう場
合である。この誤認識率を本人拒否率(FRR:False
Rejection Rate)と称する。もう1つは、発話者が偽名
称を表明しているにもかかわらずそれを真の識別名称と
認識してしまう場合である。この誤認識率を詐称者受理
率(FAR:FalseAcceptance Rate)と称する。
【0004】ところで、本人閾値の値を高く設定する
と、特徴差が大きくても発話者が本人であると判断する
確率が高くなる。従って、FRRは低くなるがFARは
高くなる。逆に、本人閾値の値を低く設定すると、FA
Rは低くなるが、FRRは高くなる。このように、FR
RとFARとは一方が低くなると他方が高くなるという
関係にある。誤認識率は両者の平均値で表されるので、
本人閾値の値を調整して両者をの平均値をできるだけ小
さくすることが求められている。
【0005】従来、この本人閾値を事後的に定める種々
の手法乃至手段が提案されている。例えば、”ディジタ
ル音声処理”(著者:古井 貞煕;出版者:東海大学出
版会)第9章に、FRRとFARとが等しくなるように
本人値を設定する等誤り率設定手段が示されており、
FRRとFARとが等しい場合に、両者の平均値である
誤認識率が最も小さくなるとしている。
【0006】図5は、この等誤り率設定手段の一例を示
すブロック図であり、まず本人の音声と詐称者(本人以
外の者の意、以下同じ)の音声とを用意し、音声入力端
子500、505にそれぞれを入力する。前処理部50
1、506では、ディジタル音声信号を一定時間長の音
声フレームごとに記憶する。特徴量抽出部502、50
7では、本人と詐称者の音声の特徴量をそれぞれ抽出す
る。一方のベクトル量子化部503は、本人の音声から
抽出された特徴量を、その識別名称に対応するコードブ
ック(本人コードブック)510に基づいてベクトル量
子化し、ベクトル量子化の歪み距離を入力音声の特徴量
とコードブックとの特徴差として本人FRR(本人拒否
率)計算部504に入力する。本人FRR計算部504
では、上記歪み距離と予め定められた値の本人閾値とを
用いてFRRを計算する。
【0007】同様に、他方のベクトル量子化部508
は、詐称者の音声から抽出された特徴量を本人コードブ
ック510に基づいてベクトル量子化し、ベクトル量子
化の歪み距離を詐称者FAR(詐称者受理率)計算部5
09に入力する。詐称者FAR計算部509では、上記
歪み距離と本人閾値とを用いてFARを計算する。
【0008】本人FRR、詐称者FAR比較部512で
は、両者の値を比較し、両者が等しくなければ値調整
部511において本人値を調整し、再度本人FRR計
算部504、詐称者FAR計算部509に戻る。そして
FRRとFARとが等しくなった時点で、値調整を終
え、値出力部513から本人値の値を出力する。
【0009】また、”Text-Dependent Speaker Verific
ation Using Vector QuantizationSource Coding”(D.
K. Burton, IEEE Transactions on Acoustics, Speech,
andSignal Processing, vol-ASSP, pp.133-143, Febru
ary 1987)にても閾値設定を行う装置が示されている。
【0010】図6はこの閾値設定装置の機能を説明する
ためのブロック図であり、上述のようなFRRとFAR
とが等しい場合に両者の平均値である誤認識率が最も小
さくなるとする方法とは異なるが、前処理部601,6
05、特徴量抽出部602,607、ベクトル量子化部
603,608までの処理は共通となる。この装置の特
徴は、ベクトル量子化部603,608で得られたベク
トル量子化歪み距離に対し、それぞれ特徴差の平均値計
算部604,609と、特徴差標準偏差計算部611,
612において、話者内、話者間の歪み距離の平均値と
標準偏差を求める。求められた4つの統計パラメータに
基づき、本人値を値計算部613で計算する。
【0011】更に、”統計的特徴と動的特徴による話者
認識”(古井 貞煕、研究実用化報告第30巻第8号、
pp.2045−2056、1981)では、話者間の
特徴差平均値と標準偏差による本人値設定装置も提案
されている。
【0012】図7は、その機能を説明するためのブロッ
ク図であり、音声入力端子700によって入力された詐
称者音声を特徴量抽出部702でその特徴量を抽出し、
この特徴量に対し、本人コードブック707に基づいて
ベクトル量子化を行う(703)。そして、ベクトル量
子化の歪み距離を話者間類似度平均値計算部704及び
話者間類似度標準偏差計算部705に入力する。そして
値計算部706で、上記2つの統計パラメータ、即ち
平均値及び標準偏差に関する線形方程式で本人値を計
算する。
【0013】
【発明が解決しようとする課題】上述の各従来例によれ
ば、それぞれ適正な値の本人閾値を得ることはできる。
しかしながら、いずれの手段も本人値は事後的にしか
決定できないので、新規話者の登録が常に要求される用
途や事前に本人閾値の設定を要する用途では必ずしも有
効に活用できない問題があった。しかもいずれの手段も
閾値決定に際しては大量の話者別学習音声サンプルが必
要となり、また長時間の実験を要する。特に、大量の音
声データが無く、長時間の値決定のための実験も不可
能な場合があるが、このような場合には話者照合が非常
に困難であった。
【0014】本発明は上記背景のもとになされたもの
で、実音声データや長時間の値決定のための実験を必
要とせず、話者別コードブックのみで、値を決定でき
る話者照合方法及びこの方法を用いた話者照合装置を提
供することを目的とする。
【0015】
【課題を解決するための手段】本発明が提供する話者照
合方法は、発話者の入力音声の特徴を表す特徴ベクトル
と発話者が表明した識別名称との一致性を、所定の閾値
との比較により判定する話者照合方法において、複数話
者の個人性特徴を話者別コードブックとして格納する段
階と、前記話者別コードブックから前記識別名称によっ
て指定された本人コードブックを選択する段階と、前記
話者別コードブックから前記本人コードブックを除いた
本人外コードブックを特定するとともに、特定した本人
外コードブックにおけるコードベクトルの出現制御を行
って前記識別名称以外の特徴を表すコードベクトル群を
出現させる段階と、出現したコードベクトル群を前記本
人コードブックによってベクトル量子化して両者の特徴
差の統計値を導出する段階と、前記統計値をパラメータ
として前記閾値を決定する段階と、を有することを特徴
とする。なお、統計値としては、特徴差の平均値、標準
偏差、分散等が挙げられる。
【0016】上述の方法において、閾値を決定する段階
は、例えば導出した特徴差の統計値を、前記識別名称以
外の特徴にそれぞれ対応する真の音声が入力された場合
に得られる統計値に近づくように変換し、該変換された
統計値に基づいて前記閾値を決定する過程を経る。ま
た、前記識別名称以外の特徴を表すコードベクトル群を
出現させる段階は、前記話者別コードブックの作成に用
いた学習音声サンプルの特徴量に対し、同じ学習音声サ
ンプルで作成されたコードブックによりベクトル量子化
を施すことでコードベクトルの符号列及び符号出現回数
データを得、前記符号列に基づいて前記本人外コードブ
ックから対応コードベクトルを選択するとともに、その
対応コードベクトルを前記符号出現回数データに従って
当該本人外コードブックから出現させる過程を経る。こ
のとき、前記符号列を代表するコードベクトルを当該符
号列の各符号出現回数データに従って出現させるように
しても良い。
【0017】また、本発明が提供する話者照合装置は、
発話者の入力音声信号と発話者が表明した識別名称との
一致性判定用の閾値を決定する閾値決定手段を備えた話
者照合装置において、前記閾値決定手段は、複数話者の
個人性特徴を表すコードブックを話者別に格納した話者
別コードブック格納部と、前記識別名称によって指定さ
れた本人コードブックを前記話者別コードブック格納部
から選択する本人コードブック選択手段と、選択された
本人コードブックを除く話者別コードブックからのコー
ドベクトルの出現を制御して前記識別名称以外の特徴を
表すコードベクトル群を生成するコードベクトル出現制
御手段と、生成されたコードベクトル群を前記選択され
た本人コードブックでベクトル量子化して両者の特徴差
の統計値を導出する統計値導出手段と、前記統計値をパ
ラメータとして前記閾値を決定する統計値変換手段と、
を有することを特徴とする。
【0018】上記構成において、コードベクトル出現制
御手段は、例えば、前記話者別コードブックの作成に用
いた学習音声サンプルの特徴量に対し、同じ学習音声サ
ンプルで作成されたコードブックによりベクトル量子化
を施すベクトル量子化手段と、この量子化により得たコ
ードベクトルの符号列及び符号出現回数データを格納す
るメモリと、本人コードブックを除く話者別コードブッ
クにアクセスし、メモリ内の符号列とその符号出現回数
データに従って当該コードブックにおける前記識別名称
以外のコードベクトルを選択してその出現回数を制御す
るコードベクトル出現回数制御部とを有し、出現したコ
ードベクトルの集合を前記統計値導出手段に導く。
【0019】また、前記統計値変換手段は、例えば前記
導出された特徴差の統計値を前記識別名称以外の特徴に
対応する真の音声が入力された場合のベクトル量子化歪
み距離(数値情報)に変換する第1の演算部と、変換さ
れたベクトル量子化歪み距離を収束せしめる第2の演算
部とを有している。
【0020】
【作用】本発明の話者照合方法では、まず、話者別コー
ドブックのうち、本人コードブックを除く全てのコード
ブックを本人外コードブックとして用意する。そしてこ
れら本人外コードブックから所定量のコードベクトルを
出現させ、これら出現したコードベクトル群を、本人コ
ードブックを用いてベクトル量子化して特徴差の統計値
を導出する。この場合の統計値は、例えばコードブック
間特徴差の平均値、標準偏差、分散等である。その後、
この統計値を、発話者が表明した識別名称以外の特徴に
対応する真の音声が入力された場合に得られる統計値に
近づくように変換し、変換された統計値に基づいて閾値
を決定する。
【0021】なお、コードブック群を出現させる段階
は、例えば話者別コードブックの作成に用いた学習音声
サンプルの特徴量に対し、同じ学習音声サンプルで作成
されたコードブックによりベクトル量子化を施すことで
コードベクトルの符号列及び符号出現回数データを検出
しておき、この符号列に基づいて本人外コードブックか
ら対応コードベクトルを選択するとともに、その対応コ
ードベクトルを上記符号出現回数データに従って本人外
コードブックから出現させる。
【0022】このように、本人外コードブックから所定
量のコードベクトルを出現させ、これらコードベクトル
群と本人コードブックを用いて得た特徴差の統計値に基
づいて閾値を決定するので、従来の各手段のように大量
のサンプルを必要とせず、話者別コードブックを作成し
た時点で閾値を決定することができる。
【0023】本発明の話者照合装置は、まず、話者別コ
ードブック格納部に格納された複数のコードブックから
発話者に対応する本人コードブックを選択する。そして
本人コードブックを除くコードブックを本人外コードブ
ックとし、この本人外コードブックからコードベクトル
出現制御手段が所定量のコードベクトルを出現させる。
統計値導出手段は、これらコードベクトルを本人コード
ブックでベクトル量子化して特徴差の統計値を導出し、
統計値変換手段でこの統計値をパラメータとして閾値を
決定する。
【0024】なお、コードベクトル出現制御手段は、本
人外コードブックから符号列と符号出現回数データを導
出するためのベクトル量子化手段と、上記符号化列等を
格納するメモリと、メモリ内の符号列と符号列の出現回
数データとに基づいてコードベクトルを選択してその出
現回数を制御するコードベクトル出現回数制御部とを有
し、また、統計値変換手段は、特徴差の統計値を所定の
ベクトル量子化歪み距離に変換する第1の演算部と、ベ
クトル量子化歪み距離を収束せしめる第2の演算部とを
有しており、それぞれ本発明の話者照合方法の実施に寄
与する。
【0025】
【実施例】次に、図面を参照して本発明の実施例を詳細
に説明する。図1は、本発明の一実施例のブロック図で
あり、VQ(ベクトル量子化)ベースの話者照合方法を
用いた話者照合装置の基本構成を示している。図1にお
いて、101は音声入力端子、102は前処理部、10
3は特徴量抽出部、104はベクトル量子化部、105
はID入力端子(ID:IDentification、話者の指定に
用いられる話者名、話者番号)、106は本人コードブ
ック指定部、107は話者別コードブック(話者別特徴
ベクトル群)格納部、108は話者判定部、109は本
値格納部、110は値決定部、111は話者判定
結果出力部を表している。
【0026】話者別コードブック格納部107には、各
話者ごとにコードブックが格納されている。このコード
ブックは、音声信号の特徴量を代表するコードベクト
ル、即ち特徴ベクトルをその構成要素とするものであ
る。話者照合を行う場合には、発話者の音声を表す信号
を音声入力端子101を通じて入力するとともに、ID
入力端子105を通じて発話者が表明する識別名称を入
力する。ID入力は、例えばIDカードを用いたり、暗
証番号を入力することによりなされる。
【0027】前処理部102では、入力端子101より
入力された音声信号に対してA/D変換(アナログ→デ
ィジタル)を行った後、音声分析区間を設定し、この分
析区間内の音声波形を一定の時間及び一定のシフト周期
で分析窓により切り出し、音声フレームを形成して記憶
する。なお、音声フレームの形成方法は、この方法に限
定するものではなく、他の任意の方法によっても形成す
ることができる。
【0028】特徴量抽出部103は、前処理部102よ
り得られた各音声フレームに基づき、音声信号に含まれ
ている個人性情報に関する特徴量を抽出する。このよう
に計算された特徴量をベクトル量子化部104へ入力す
る。本実施例においては、各音声フレームの音声データ
に対して、線形予測分析、ケプストラム分析等を施し、
ケプストラム係数やピッチなど入力音声信号の個人性特
徴量を抽出した。この個人性特徴量を含めて、任意の個
人性情報量は、他の任意の方法を用いても抽出すること
ができる。
【0029】一方、本人コードブック指定部106は、
ID入力部105より入力された識別名称に対応するコ
ードブックを話者別コードブック107から選択し、選
択されたコードブックを本人コードブックとしてベクト
ル量子化部104及び閾値決定部110に入力する。
【0030】ベクトル量子化部104では、この本人コ
ードブックに基づいて入力音声の特徴量に対してベクト
ル量子化を行い、入力音声と本人コードブックとの特徴
差を導出し、これを話者判定部108に入力する。
決定部110では、後述する手順に従って発話者本人に
関わる値、即ち本人閾値を決定して値格納部109
に格納する。本人閾値格納部109は、格納された本人
閾値を話者判定部108に入力する。
【0031】話者判定部108では、これらの入力をも
とに話者判定を行う。具体的には、上記特徴差が本人
値より大きい場合、発話者と識別名称とは一致しない、
つまり発話者は本人でないと判定する。他方、特徴差が
本人値より大きくない場合、発話者と識別名称とは一
致する、つまり発話者は本人であると判定する。その判
定結果は、話者判定結果出力部111より出力される。
【0032】次に、図2を参照して値決定部110に
おける本人値の決定手法について詳細に説明する。本
人外コードブック選択部201では、本人コードブック
指定部106で指定された本人コードブック以外の全て
の話者のコードブックを、話者別コードブック格納部1
07から選択抽出し、これらをVQコードベクトル出現
制御部202に入力する。
【0033】VQコードブック出現制御部202では、
入力された全ての話者別コードブックから所定量のコー
ドベクトルを出現させる。この出現頻度については後述
する。これらコードベクトルの集合は、発話者本人以外
の特徴を意味する詐称者コードブックとしてベクトル量
子化部203に出力される。
【0034】ベクトル量子化部203では、入力された
詐称者コードブックを本人コードブックを用いてベクト
ル量子化し、コードブック間特徴差、つまり特徴の類似
度を導出する。これら特徴差をコードブック間特徴差平
均値計算部204及びコードブック間特徴差標準偏差計
算部205に入力する。コードブック間特徴差平均値計
算部204では、その平均値を求めてコードブック間特
徴差標準偏差計算部205に入力する。コードブック間
特徴差標準偏差計算部205では、上記特徴差及びその
平均値を用いて特徴差標準偏差を求め、これを特徴差統
計値変換部206に入力する。なお、本実施例に示す2
つの統計パラメータ(平均値、標準偏差)以外の任意の
有効な統計パラメータ、例えば分散等を用いることも可
能である。
【0035】特徴差統計値変換部206では、上記特徴
差の平均値及び標準偏差からなる統計パラメータを、仮
に詐称者の真の音声の特徴量がベクトル量子化部203
に入力された場合に求められたそれぞれの値に近似する
ように変換する。具体的には、両者の歪み距離を収束さ
せるように演算する。このようにして変換された統計パ
ラメータに基づいて閾値計算部207で本人値を決定
する(閾値決定手段)。
【0036】次に、VQコードベクトル出現制御部20
2におけるコードベクトルの出現制御の内容について、
図3及び図4を参照して具体的に説明する。図3は、こ
こでの処理の前段階となる話者別コードブック作成手段
のブロック図であり、符号列及び符号出現回数データを
得るための構成を示してある。
【0037】図3を参照すると、話者別コードブックを
生成するために必要な学習音声サンプルは、マイクロホ
ン等の入力機器、音声入力端子301を通じて話者別学
習音声サンプル入力部302に入力される。話者別学習
音声サンプル入力部302は、入力サンプルをディジタ
ル化し、フレームごとに切り出す。特徴量抽出部303
は、その特徴量を抽出し、これらを話者別VQコードブ
ック作成部304に入力する。話者別VQコードブック
作成部304では、入力された特徴量に基づき、話者別
VQコードブック305を作成する。
【0038】ベクトル量子化部306は、作成された話
者別VQコードブック305を用いて、特徴量抽出部3
03から送られた特徴量に対してベクトル量子化を行
う。ベクトル量子化の結果として、学習音声サンプルの
特徴量を表す各ベクトルが、コードブックの各コードベ
クトルによって代表され、出力される。
【0039】量子化データ保持307では、ベクトル量
子化部306の出力となっているコードベクトルに対し
て例えばそれぞれのクラスタのセントロイドに対応する
符号を付与し、これら符号の集合を符号列として保持す
る。更に、ベクトル量子化部306の処理が全て終了す
るまでの過程において、それぞれのクラスタに配属され
た特徴量を表すベクトル数、即ちコードベクトルの出現
を検出してこの数を符号出現回数データとして保持す
る。このようにして話者別コードブック作成段階におい
て、全てのコードベクトルに対する符号列と符号出現回
数データを求め、それぞれ後述のVQコードベクトル符
号列格納部401、VQコードベクトル出現回数格納部
403に格納しておく。
【0040】次に図4を参照してVQコードベクトル出
現制御部202の具体的な動作を説明する。VQコード
ベクトル符号列格納部401には上記符号列が格納され
ており、VQコードベクトル出現回数格納部403に
は、上記符号出現回数データが格納されているものとす
る。
【0041】詐称者コードベクトル選択部402は、本
人外コードブック選択部201から入力される本人外コ
ードブックから前述の詐称者コードベクトルを複数種選
択し、選択された複数種の詐称者コードベクトルのう
ち、どれを何回出現させれば真の音声になるかを判定し
てその結果をVQコードベクトル出現回数制御部404
に出力する。この際、VQコードベクトル符号列格納部
401を用いて、各コードベクトルに対応する符号を検
出しておく。
【0042】VQコードベクトル出現回数制御部404
は、上記判定結果、各詐称者コードベクトルに付された
符号、及びVQコードベクトル出現回数格納部403に
格納された符号出現回数データに基づいて、詐称者コー
ドベクトル(符号又は符号列)の出現回数を決定する。
その際、VQコードベクトル符号列格納部403に格納
されている符号列を構成する各符号の出現回数をそのま
ま詐称者コードベクトルの出現回数としても良く、ある
いは、符号列を代表する詐称者コードベクトルを符号出
現回数データに従って出現させるようにしても良い。出
現した詐称者コードベクトルの集合は、詐称者コードブ
ックとしてベクトル量子化部203に送られ、以後は前
述の処理を経て閾値を決定する。
【0043】このように、本実施例によれば、話者別コ
ードブックのみを用いて話者別の閾値を決定できるの
で、大量の学習音声サンプルを別途収録する作業が不要
となり、しかも、話者別コードブックを作成した段階で
閾値決定及び話者照合が可能になる。従って、話者の新
規登録が常に必要となる用途において多大な効果を発揮
することができる。なお、本実施例においては、話者別
コードブック以外、各話者の値の設定に本人及び他話
者の音声データが確保できない状況を想定して説明した
が、本発明で提案した方法及び装置は、上記状況に限定
されないのは言うまでもない。
【0044】
【発明の効果】以上の説明から明らかなように、本発明
の話者照合方法は、予め用意された話者別コードブック
内の本人外コードブックから所定量のコードベクトルを
出現させ、これら出現したコードベクトルを本人コード
ブックでベクトル量子化して導出した特徴差の統計値に
基づいて話者照合の基準となる閾値を決定するので、話
者別コードブックを作成した段階で閾値の決定及び話者
照合が可能になる効果がある。また、事後的に閾値を決
定する従来手法において必要であった、大量の学習音声
サンプルの収録作業が不要になるとともに、閾値決定の
ための膨大なメモリ容量と計算時間も大幅に縮減、短縮
される効果もあり、人的資源及びコストを削減すること
ができる。
【0045】また、本発明の話者照合方法は、話者別コ
ードブックの作成に用いた学習音声サンプルの特徴量に
対し、同じ学習音声サンプルで作成されたコードブック
によりベクトル量子化を施すことでコードベクトルの符
号列及び符号出現回数データを検出しておき、この符号
列に基づいて本人外コードブックから対応コードベクト
ルを選択するとともにその対応コードベクトルを上記符
号出現回数データに従って本人外コードブックから出現
させる方法を採用するので、従来の大量の学習音声サン
プルを用意した場合と略同様の状況を簡易に実現するこ
とができる。
【0046】また、本発明の話者照合装置によれば、話
者別コードブック格納部に格納された複数のコードブッ
クから発話者の表明した識別名称に対応する本人コード
ブックとそれ以外の本人外コードブックとが選択され、
更に、本人外コードブックから出現した所定量のコード
ベクトルと本人コードブックとの特徴差の統計値に基づ
いて閾値が決定されるので、上記話者照合方法を容易に
実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る話者照合装置のブロッ
ク図。
【図2】本実施例による値決定手段のブロック図。
【図3】本実施例の前段階で実行される話者別コードブ
ック作成手段のブロック図。
【図4】本実施例によるVQコードベクトル出現制御部
の詳細ブロック図。
【図5】従来の値の決定手段の一例を示すブロック
図。
【図6】従来の他の構成に係る値の決定手段を示すブ
ロック図。
【図7】従来の他の構成に係る値の決定手段を示すブ
ロック図。
【符号の説明】
101 音声入力部 102 前処理部 103 特徴量抽出部 104 ベクトル量子化部 105 ID入力部 106 本人コードブック指定部 107 話者別コードブック格納部 108 話者判定部 109 本人閾値格納部 110 閾値決定部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 日本音響学会講演論文集(平成6年3 月)3−7−1,p.89〜90 電子情報通信学会技術研究報告[音声 ]Vol.94,No.42,SP94−2, p.9〜16(平成6年5月) (58)調査した分野(Int.Cl.7,DB名) G10L 17/00 G10L 15/06 G10L 15/28 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 発話者の入力音声の特徴を表す特徴ベク
    トルと発話者が表明した識別名称との一致性を、所定の
    閾値との比較により判定する話者照合方法において、 複数話者の個人性特徴を話者別コードブックとして格納
    する段階と、 前記話者別コードブックから前記識別名称によって指定
    された本人コードブックを選択する段階と、 前記話者別コードブックから前記本人コードブックを除
    いた本人外コードブックを特定するとともに、特定した
    本人外コードブックにおけるコードベクトルの出現制御
    を行って前記識別名称以外の特徴を表すコードベクトル
    群を出現させる段階と、 出現したコードベクトル群を前記本人コードブックによ
    ってベクトル量子化して両者の特徴差の統計値を導出す
    る段階と、 前記統計値をパラメータとして前記閾値を決定する段階
    と、 を有することを特徴とする話者照合方法。
  2. 【請求項2】 請求項1記載の話者照合方法において、
    前記識別名称以外の特徴を表すコードベクトル群を出現
    させる段階は、前記話者別コードブックの作成に用いた
    学習音声サンプルの特徴量に対し、同じ学習音声サンプ
    ルで作成されたコードブックによりベクトル量子化を施
    すことでコードベクトルの符号列及び符号出現回数デー
    タを得、前記符号列に基づいて前記本人外コードブック
    から対応コードベクトルを選択するとともに、その対応
    コードベクトルを前記符号出現回数データに従って当該
    本人外コードブックから出現させることを特徴とする話
    者照合方法。
  3. 【請求項3】 請求項記載の話者照合方法において、 前記符号列を代表するコードベクトルを、当該符号列の
    各符号出現回数データに従って出現させることを特徴と
    する話者照合方法。
  4. 【請求項4】 請求項又は記載の話者照合方法にお
    いて、 前記符号出現回数データは、前記学習音声サンプルに基
    づく話者別コードブックの作成に際して、同じクラスタ
    に配属された特徴ベクトル数データであり、前記符号列
    は、当該クラスタのセントロイドに対応するコードベク
    トル符号の列であることを特徴とする話者照合方法。
  5. 【請求項5】 発話者の入力音声信号と発話者が表明し
    た識別名称との一致性判定用の閾値を決定する閾値決定
    手段を備えた話者照合装置において、 前記閾値決定手段は、 複数話者の個人性特徴を表すコードブックを話者別に格
    納した話者別コードブック格納部と、 前記識別名称によって指定された本人コードブックを前
    記話者別コードブック格納部から選択する本人コードブ
    ック選択手段と、 選択された本人コードブックを除く話者別コードブック
    からのコードベクトルの出現を制御して前記識別名称以
    外の特徴を表すコードベクトル群を生成するコードベク
    トル出現制御手段と、 生成されたコードベクトル群を前記選択された本人コー
    ドブックでベクトル量子化して両者の特徴差の統計値を
    導出する統計値導出手段と、 前記統計値をパラメータとして前記閾値を決定する統計
    値変換手段と、 を有することを特徴とする話者照合装置。
  6. 【請求項6】 請求項記載の話者照合装置において、 前記コードベクトル出現制御手段は、 前記話者別コードブックの作成に用いた学習音声サンプ
    ルの特徴量に対し、同じ学習音声サンプルで作成された
    コードブックによりベクトル量子化を施すベクトル量子
    化手段と、 このベクトル量子化により得たコードベクトルの符号列
    及び符号出現回数データを格納するメモリと、 前記本人コードブックを除く話者別コードブックにアク
    セスし、前記格納された符号列とその符号出現回数デー
    タに従って当該コードブックにおける前記識別名称以外
    のコードベクトルを選択してその出現回数を制御するコ
    ードベクトル出現回数制御部とを有し、 出現したコードベクトルの集合を前記統計値導出手段に
    導くことを特徴とする話者照合装置。
JP06041615A 1994-03-11 1994-03-11 話者照合方法及び装置 Expired - Fee Related JP3098157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06041615A JP3098157B2 (ja) 1994-03-11 1994-03-11 話者照合方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06041615A JP3098157B2 (ja) 1994-03-11 1994-03-11 話者照合方法及び装置

Publications (2)

Publication Number Publication Date
JPH07248791A JPH07248791A (ja) 1995-09-26
JP3098157B2 true JP3098157B2 (ja) 2000-10-16

Family

ID=12613251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06041615A Expired - Fee Related JP3098157B2 (ja) 1994-03-11 1994-03-11 話者照合方法及び装置

Country Status (1)

Country Link
JP (1) JP3098157B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101781263B1 (ko) * 2015-07-30 2017-10-10 조명호 빗물받이
KR200485689Y1 (ko) * 2015-08-31 2018-02-07 조명호 빗물받이

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3507686B2 (ja) 1998-01-16 2004-03-15 日本電気株式会社 音声認識機能を有する通信装置及び通信方法
JP4967928B2 (ja) * 2007-08-27 2012-07-04 ヤマハ株式会社 音声処理装置およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
日本音響学会講演論文集(平成6年3月)3−7−1,p.89〜90
電子情報通信学会技術研究報告[音声]Vol.94,No.42,SP94−2,p.9〜16(平成6年5月)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101781263B1 (ko) * 2015-07-30 2017-10-10 조명호 빗물받이
KR200485689Y1 (ko) * 2015-08-31 2018-02-07 조명호 빗물받이

Also Published As

Publication number Publication date
JPH07248791A (ja) 1995-09-26

Similar Documents

Publication Publication Date Title
US6067517A (en) Transcription of speech data with segments from acoustically dissimilar environments
US9646614B2 (en) Fast, language-independent method for user authentication by voice
US7447632B2 (en) Voice authentication system
CN111916111B (zh) 带情感的智能语音外呼方法及装置、服务器、存储介质
US6539352B1 (en) Subword-based speaker verification with multiple-classifier score fusion weight and threshold adaptation
JP2982870B2 (ja) 話者識別方法および話者認識装置
US20070219801A1 (en) System, method and computer program product for updating a biometric model based on changes in a biometric feature of a user
WO2008100971A1 (en) Text-dependent speaker verification
KR101888058B1 (ko) 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
Ilyas et al. Speaker verification using vector quantization and hidden Markov model
JP3098157B2 (ja) 話者照合方法及び装置
WO2023274028A1 (zh) 声纹锁控制方法、装置、电子设备
Dustor et al. Speaker recognition system with good generalization properties
Chauhan et al. A review of automatic speaker recognition system
JP3251460B2 (ja) 話者照合方法および装置
JP4391179B2 (ja) 話者認識システム及び方法
JP2001265387A (ja) 話者照合装置及び方法
JP3058569B2 (ja) 話者照合方法及び装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP3036509B2 (ja) 話者照合における閾値決定方法及び装置
JP2991288B2 (ja) 話者認識装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
Jin et al. A high-performance text-independent speaker identification system based on BCDM.
JP2815667B2 (ja) 話者認識方法
Abdullah-al-MAMUN et al. Automatic Speaker Recognition system using Mel Frequency Cepstral Coefficients (MFCC) and Vector Quantization (VQ) approach

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080811

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080811

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090811

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090811

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100811

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110811

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110811

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120811

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120811

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130811

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees