JP3098157B2

JP3098157B2 - 話者照合方法及び装置

Info

Publication number: JP3098157B2
Application number: JP06041615A
Authority: JP
Inventors: 雄偉閔; 憲也村上
Original assignee: NTT Data Corp
Current assignee: NTT Data Corp
Priority date: 1994-03-11
Filing date: 1994-03-11
Publication date: 2000-10-16
Anticipated expiration: 2015-10-16
Also published as: JPH07248791A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は話者照合技術に関し、特
に、発話者の音声及び識別名称を入力として、発話者
が、表明した識別名称に対応する本人であるかどうかを
判定する基準となる閾値の決定方法及びそれを実現する
装置に関する。

【０００２】

【従来の技術】話者照合装置は、発話者の表明した識別
名称が、発話者自身の真の識別名称と一致するかどうか
を判定する装置である。通常、話者照合を行う場合に
は、予め照合対象となる話者識別名称及びこの識別名称
に対応するコードブックを登録しておき、話者照合時
に、発話者の実音声と識別名称とを入力し、この識別名
称によって指定されたコードブックと発話者の実音声と
を比較してその特徴差を検出する。この特徴差が話者別
に設定された所定の閾値（本人閾値）以下の場合には表
明された識別名称が真の識別名称であり、発話者は本人
であると判定する。その他の場合は、表明された識別名
称は偽識別名称であり、発話者は詐称者であると判定す
る。このように、話者照合においては、本人閾値の設定
が重要であり、この値が適切な値であるかどうかによっ
て識別率が大きく左右される。

【０００３】話者照合時の誤認識には大別して２つの原
因がある。１つは発話者が真の識別名称を表明している
にも拘わらず、識別名称が偽であると認識してしまう場
合である。この誤認識率を本人拒否率（ＦＲＲ：False
Rejection Rate）と称する。もう１つは、発話者が偽名
称を表明しているにもかかわらずそれを真の識別名称と
認識してしまう場合である。この誤認識率を詐称者受理
率（ＦＡＲ：FalseAcceptance Rate）と称する。

【０００４】ところで、本人閾値の値を高く設定する
と、特徴差が大きくても発話者が本人であると判断する
確率が高くなる。従って、ＦＲＲは低くなるがＦＡＲは
高くなる。逆に、本人閾値の値を低く設定すると、ＦＡ
Ｒは低くなるが、ＦＲＲは高くなる。このように、ＦＲ
ＲとＦＡＲとは一方が低くなると他方が高くなるという
関係にある。誤認識率は両者の平均値で表されるので、
本人閾値の値を調整して両者をの平均値をできるだけ小
さくすることが求められている。

【０００５】従来、この本人閾値を事後的に定める種々
の手法乃至手段が提案されている。例えば、”ディジタ
ル音声処理”（著者：古井貞煕；出版者：東海大学出
版会）第９章に、ＦＲＲとＦＡＲとが等しくなるように
本人閾値を設定する等誤り率設定手段が示されており、
ＦＲＲとＦＡＲとが等しい場合に、両者の平均値である
誤認識率が最も小さくなるとしている。

【０００６】図５は、この等誤り率設定手段の一例を示
すブロック図であり、まず本人の音声と詐称者（本人以
外の者の意、以下同じ）の音声とを用意し、音声入力端
子５００、５０５にそれぞれを入力する。前処理部５０
１、５０６では、ディジタル音声信号を一定時間長の音
声フレームごとに記憶する。特徴量抽出部５０２、５０
７では、本人と詐称者の音声の特徴量をそれぞれ抽出す
る。一方のベクトル量子化部５０３は、本人の音声から
抽出された特徴量を、その識別名称に対応するコードブ
ック（本人コードブック）５１０に基づいてベクトル量
子化し、ベクトル量子化の歪み距離を入力音声の特徴量
とコードブックとの特徴差として本人ＦＲＲ（本人拒否
率）計算部５０４に入力する。本人ＦＲＲ計算部５０４
では、上記歪み距離と予め定められた値の本人閾値とを
用いてＦＲＲを計算する。

【０００７】同様に、他方のベクトル量子化部５０８
は、詐称者の音声から抽出された特徴量を本人コードブ
ック５１０に基づいてベクトル量子化し、ベクトル量子
化の歪み距離を詐称者ＦＡＲ（詐称者受理率）計算部５
０９に入力する。詐称者ＦＡＲ計算部５０９では、上記
歪み距離と本人閾値とを用いてＦＡＲを計算する。

【０００８】本人ＦＲＲ、詐称者ＦＡＲ比較部５１２で
は、両者の値を比較し、両者が等しくなければ閾値調整
部５１１において本人閾値を調整し、再度本人ＦＲＲ計
算部５０４、詐称者ＦＡＲ計算部５０９に戻る。そして
ＦＲＲとＦＡＲとが等しくなった時点で、閾値調整を終
え、閾値出力部５１３から本人閾値の値を出力する。

【０００９】また、”Text-Dependent Speaker Verific
ation Using Vector QuantizationSource Coding”(D.
K. Burton, IEEE Transactions on Acoustics, Speech,
andSignal Processing, vol-ASSP, pp.133-143, Febru
ary 1987）にても閾値設定を行う装置が示されている。

【００１０】図６はこの閾値設定装置の機能を説明する
ためのブロック図であり、上述のようなＦＲＲとＦＡＲ
とが等しい場合に両者の平均値である誤認識率が最も小
さくなるとする方法とは異なるが、前処理部６０１，６
０５、特徴量抽出部６０２，６０７、ベクトル量子化部
６０３，６０８までの処理は共通となる。この装置の特
徴は、ベクトル量子化部６０３，６０８で得られたベク
トル量子化歪み距離に対し、それぞれ特徴差の平均値計
算部６０４，６０９と、特徴差標準偏差計算部６１１，
６１２において、話者内、話者間の歪み距離の平均値と
標準偏差を求める。求められた４つの統計パラメータに
基づき、本人閾値を閾値計算部６１３で計算する。

【００１１】更に、”統計的特徴と動的特徴による話者
認識”（古井貞煕、研究実用化報告第３０巻第８号、
ｐｐ．２０４５−２０５６、１９８１）では、話者間の
特徴差平均値と標準偏差による本人閾値設定装置も提案
されている。

【００１２】図７は、その機能を説明するためのブロッ
ク図であり、音声入力端子７００によって入力された詐
称者音声を特徴量抽出部７０２でその特徴量を抽出し、
この特徴量に対し、本人コードブック７０７に基づいて
ベクトル量子化を行う（７０３）。そして、ベクトル量
子化の歪み距離を話者間類似度平均値計算部７０４及び
話者間類似度標準偏差計算部７０５に入力する。そして
閾値計算部７０６で、上記２つの統計パラメータ、即ち
平均値及び標準偏差に関する線形方程式で本人閾値を計
算する。

【００１３】

【発明が解決しようとする課題】上述の各従来例によれ
ば、それぞれ適正な値の本人閾値を得ることはできる。
しかしながら、いずれの手段も本人閾値は事後的にしか
決定できないので、新規話者の登録が常に要求される用
途や事前に本人閾値の設定を要する用途では必ずしも有
効に活用できない問題があった。しかもいずれの手段も
閾値決定に際しては大量の話者別学習音声サンプルが必
要となり、また長時間の実験を要する。特に、大量の音
声データが無く、長時間の閾値決定のための実験も不可
能な場合があるが、このような場合には話者照合が非常
に困難であった。

【００１４】本発明は上記背景のもとになされたもの
で、実音声データや長時間の閾値決定のための実験を必
要とせず、話者別コードブックのみで、閾値を決定でき
る話者照合方法及びこの方法を用いた話者照合装置を提
供することを目的とする。

【００１５】

【課題を解決するための手段】本発明が提供する話者照
合方法は、発話者の入力音声の特徴を表す特徴ベクトル
と発話者が表明した識別名称との一致性を、所定の閾値
との比較により判定する話者照合方法において、複数話
者の個人性特徴を話者別コードブックとして格納する段
階と、前記話者別コードブックから前記識別名称によっ
て指定された本人コードブックを選択する段階と、前記
話者別コードブックから前記本人コードブックを除いた
本人外コードブックを特定するとともに、特定した本人
外コードブックにおけるコードベクトルの出現制御を行
って前記識別名称以外の特徴を表すコードベクトル群を
出現させる段階と、出現したコードベクトル群を前記本
人コードブックによってベクトル量子化して両者の特徴
差の統計値を導出する段階と、前記統計値をパラメータ
として前記閾値を決定する段階と、を有することを特徴
とする。なお、統計値としては、特徴差の平均値、標準
偏差、分散等が挙げられる。

【００１６】上述の方法において、閾値を決定する段階
は、例えば導出した特徴差の統計値を、前記識別名称以
外の特徴にそれぞれ対応する真の音声が入力された場合
に得られる統計値に近づくように変換し、該変換された
統計値に基づいて前記閾値を決定する過程を経る。ま
た、前記識別名称以外の特徴を表すコードベクトル群を
出現させる段階は、前記話者別コードブックの作成に用
いた学習音声サンプルの特徴量に対し、同じ学習音声サ
ンプルで作成されたコードブックによりベクトル量子化
を施すことでコードベクトルの符号列及び符号出現回数
データを得、前記符号列に基づいて前記本人外コードブ
ックから対応コードベクトルを選択するとともに、その
対応コードベクトルを前記符号出現回数データに従って
当該本人外コードブックから出現させる過程を経る。こ
のとき、前記符号列を代表するコードベクトルを当該符
号列の各符号出現回数データに従って出現させるように
しても良い。

【００１７】また、本発明が提供する話者照合装置は、
発話者の入力音声信号と発話者が表明した識別名称との
一致性判定用の閾値を決定する閾値決定手段を備えた話
者照合装置において、前記閾値決定手段は、複数話者の
個人性特徴を表すコードブックを話者別に格納した話者
別コードブック格納部と、前記識別名称によって指定さ
れた本人コードブックを前記話者別コードブック格納部
から選択する本人コードブック選択手段と、選択された
本人コードブックを除く話者別コードブックからのコー
ドベクトルの出現を制御して前記識別名称以外の特徴を
表すコードベクトル群を生成するコードベクトル出現制
御手段と、生成されたコードベクトル群を前記選択され
た本人コードブックでベクトル量子化して両者の特徴差
の統計値を導出する統計値導出手段と、前記統計値をパ
ラメータとして前記閾値を決定する統計値変換手段と、
を有することを特徴とする。

【００１８】上記構成において、コードベクトル出現制
御手段は、例えば、前記話者別コードブックの作成に用
いた学習音声サンプルの特徴量に対し、同じ学習音声サ
ンプルで作成されたコードブックによりベクトル量子化
を施すベクトル量子化手段と、この量子化により得たコ
ードベクトルの符号列及び符号出現回数データを格納す
るメモリと、本人コードブックを除く話者別コードブッ
クにアクセスし、メモリ内の符号列とその符号出現回数
データに従って当該コードブックにおける前記識別名称
以外のコードベクトルを選択してその出現回数を制御す
るコードベクトル出現回数制御部とを有し、出現したコ
ードベクトルの集合を前記統計値導出手段に導く。

【００１９】また、前記統計値変換手段は、例えば前記
導出された特徴差の統計値を前記識別名称以外の特徴に
対応する真の音声が入力された場合のベクトル量子化歪
み距離（数値情報）に変換する第１の演算部と、変換さ
れたベクトル量子化歪み距離を収束せしめる第２の演算
部とを有している。

【００２０】

【作用】本発明の話者照合方法では、まず、話者別コー
ドブックのうち、本人コードブックを除く全てのコード
ブックを本人外コードブックとして用意する。そしてこ
れら本人外コードブックから所定量のコードベクトルを
出現させ、これら出現したコードベクトル群を、本人コ
ードブックを用いてベクトル量子化して特徴差の統計値
を導出する。この場合の統計値は、例えばコードブック
間特徴差の平均値、標準偏差、分散等である。その後、
この統計値を、発話者が表明した識別名称以外の特徴に
対応する真の音声が入力された場合に得られる統計値に
近づくように変換し、変換された統計値に基づいて閾値
を決定する。

【００２１】なお、コードブック群を出現させる段階
は、例えば話者別コードブックの作成に用いた学習音声
サンプルの特徴量に対し、同じ学習音声サンプルで作成
されたコードブックによりベクトル量子化を施すことで
コードベクトルの符号列及び符号出現回数データを検出
しておき、この符号列に基づいて本人外コードブックか
ら対応コードベクトルを選択するとともに、その対応コ
ードベクトルを上記符号出現回数データに従って本人外
コードブックから出現させる。

【００２２】このように、本人外コードブックから所定
量のコードベクトルを出現させ、これらコードベクトル
群と本人コードブックを用いて得た特徴差の統計値に基
づいて閾値を決定するので、従来の各手段のように大量
のサンプルを必要とせず、話者別コードブックを作成し
た時点で閾値を決定することができる。

【００２３】本発明の話者照合装置は、まず、話者別コ
ードブック格納部に格納された複数のコードブックから
発話者に対応する本人コードブックを選択する。そして
本人コードブックを除くコードブックを本人外コードブ
ックとし、この本人外コードブックからコードベクトル
出現制御手段が所定量のコードベクトルを出現させる。
統計値導出手段は、これらコードベクトルを本人コード
ブックでベクトル量子化して特徴差の統計値を導出し、
統計値変換手段でこの統計値をパラメータとして閾値を
決定する。

【００２４】なお、コードベクトル出現制御手段は、本
人外コードブックから符号列と符号出現回数データを導
出するためのベクトル量子化手段と、上記符号化列等を
格納するメモリと、メモリ内の符号列と符号列の出現回
数データとに基づいてコードベクトルを選択してその出
現回数を制御するコードベクトル出現回数制御部とを有
し、また、統計値変換手段は、特徴差の統計値を所定の
ベクトル量子化歪み距離に変換する第１の演算部と、ベ
クトル量子化歪み距離を収束せしめる第２の演算部とを
有しており、それぞれ本発明の話者照合方法の実施に寄
与する。

【００２５】

【実施例】次に、図面を参照して本発明の実施例を詳細
に説明する。図１は、本発明の一実施例のブロック図で
あり、ＶＱ（ベクトル量子化）ベースの話者照合方法を
用いた話者照合装置の基本構成を示している。図１にお
いて、１０１は音声入力端子、１０２は前処理部、１０
３は特徴量抽出部、１０４はベクトル量子化部、１０５
はＩＤ入力端子（ＩＤ：IDentification、話者の指定に
用いられる話者名、話者番号）、１０６は本人コードブ
ック指定部、１０７は話者別コードブック（話者別特徴
ベクトル群）格納部、１０８は話者判定部、１０９は本
人閾値格納部、１１０は閾値決定部、１１１は話者判定
結果出力部を表している。

【００２６】話者別コードブック格納部１０７には、各
話者ごとにコードブックが格納されている。このコード
ブックは、音声信号の特徴量を代表するコードベクト
ル、即ち特徴ベクトルをその構成要素とするものであ
る。話者照合を行う場合には、発話者の音声を表す信号
を音声入力端子１０１を通じて入力するとともに、ＩＤ
入力端子１０５を通じて発話者が表明する識別名称を入
力する。ＩＤ入力は、例えばＩＤカードを用いたり、暗
証番号を入力することによりなされる。

【００２７】前処理部１０２では、入力端子１０１より
入力された音声信号に対してＡ／Ｄ変換（アナログ→デ
ィジタル）を行った後、音声分析区間を設定し、この分
析区間内の音声波形を一定の時間及び一定のシフト周期
で分析窓により切り出し、音声フレームを形成して記憶
する。なお、音声フレームの形成方法は、この方法に限
定するものではなく、他の任意の方法によっても形成す
ることができる。

【００２８】特徴量抽出部１０３は、前処理部１０２よ
り得られた各音声フレームに基づき、音声信号に含まれ
ている個人性情報に関する特徴量を抽出する。このよう
に計算された特徴量をベクトル量子化部１０４へ入力す
る。本実施例においては、各音声フレームの音声データ
に対して、線形予測分析、ケプストラム分析等を施し、
ケプストラム係数やピッチなど入力音声信号の個人性特
徴量を抽出した。この個人性特徴量を含めて、任意の個
人性情報量は、他の任意の方法を用いても抽出すること
ができる。

【００２９】一方、本人コードブック指定部１０６は、
ＩＤ入力部１０５より入力された識別名称に対応するコ
ードブックを話者別コードブック１０７から選択し、選
択されたコードブックを本人コードブックとしてベクト
ル量子化部１０４及び閾値決定部１１０に入力する。

【００３０】ベクトル量子化部１０４では、この本人コ
ードブックに基づいて入力音声の特徴量に対してベクト
ル量子化を行い、入力音声と本人コードブックとの特徴
差を導出し、これを話者判定部１０８に入力する。閾値
決定部１１０では、後述する手順に従って発話者本人に
関わる閾値、即ち本人閾値を決定して閾値格納部１０９
に格納する。本人閾値格納部１０９は、格納された本人
閾値を話者判定部１０８に入力する。

【００３１】話者判定部１０８では、これらの入力をも
とに話者判定を行う。具体的には、上記特徴差が本人閾
値より大きい場合、発話者と識別名称とは一致しない、
つまり発話者は本人でないと判定する。他方、特徴差が
本人閾値より大きくない場合、発話者と識別名称とは一
致する、つまり発話者は本人であると判定する。その判
定結果は、話者判定結果出力部１１１より出力される。

【００３２】次に、図２を参照して閾値決定部１１０に
おける本人閾値の決定手法について詳細に説明する。本
人外コードブック選択部２０１では、本人コードブック
指定部１０６で指定された本人コードブック以外の全て
の話者のコードブックを、話者別コードブック格納部１
０７から選択抽出し、これらをＶＱコードベクトル出現
制御部２０２に入力する。

【００３３】ＶＱコードブック出現制御部２０２では、
入力された全ての話者別コードブックから所定量のコー
ドベクトルを出現させる。この出現頻度については後述
する。これらコードベクトルの集合は、発話者本人以外
の特徴を意味する詐称者コードブックとしてベクトル量
子化部２０３に出力される。

【００３４】ベクトル量子化部２０３では、入力された
詐称者コードブックを本人コードブックを用いてベクト
ル量子化し、コードブック間特徴差、つまり特徴の類似
度を導出する。これら特徴差をコードブック間特徴差平
均値計算部２０４及びコードブック間特徴差標準偏差計
算部２０５に入力する。コードブック間特徴差平均値計
算部２０４では、その平均値を求めてコードブック間特
徴差標準偏差計算部２０５に入力する。コードブック間
特徴差標準偏差計算部２０５では、上記特徴差及びその
平均値を用いて特徴差標準偏差を求め、これを特徴差統
計値変換部２０６に入力する。なお、本実施例に示す２
つの統計パラメータ（平均値、標準偏差）以外の任意の
有効な統計パラメータ、例えば分散等を用いることも可
能である。

【００３５】特徴差統計値変換部２０６では、上記特徴
差の平均値及び標準偏差からなる統計パラメータを、仮
に詐称者の真の音声の特徴量がベクトル量子化部２０３
に入力された場合に求められたそれぞれの値に近似する
ように変換する。具体的には、両者の歪み距離を収束さ
せるように演算する。このようにして変換された統計パ
ラメータに基づいて閾値計算部２０７で本人閾値を決定
する（閾値決定手段）。

【００３６】次に、ＶＱコードベクトル出現制御部２０
２におけるコードベクトルの出現制御の内容について、
図３及び図４を参照して具体的に説明する。図３は、こ
こでの処理の前段階となる話者別コードブック作成手段
のブロック図であり、符号列及び符号出現回数データを
得るための構成を示してある。

【００３７】図３を参照すると、話者別コードブックを
生成するために必要な学習音声サンプルは、マイクロホ
ン等の入力機器、音声入力端子３０１を通じて話者別学
習音声サンプル入力部３０２に入力される。話者別学習
音声サンプル入力部３０２は、入力サンプルをディジタ
ル化し、フレームごとに切り出す。特徴量抽出部３０３
は、その特徴量を抽出し、これらを話者別ＶＱコードブ
ック作成部３０４に入力する。話者別ＶＱコードブック
作成部３０４では、入力された特徴量に基づき、話者別
ＶＱコードブック３０５を作成する。

【００３８】ベクトル量子化部３０６は、作成された話
者別ＶＱコードブック３０５を用いて、特徴量抽出部３
０３から送られた特徴量に対してベクトル量子化を行
う。ベクトル量子化の結果として、学習音声サンプルの
特徴量を表す各ベクトルが、コードブックの各コードベ
クトルによって代表され、出力される。

【００３９】量子化データ保持３０７では、ベクトル量
子化部３０６の出力となっているコードベクトルに対し
て例えばそれぞれのクラスタのセントロイドに対応する
符号を付与し、これら符号の集合を符号列として保持す
る。更に、ベクトル量子化部３０６の処理が全て終了す
るまでの過程において、それぞれのクラスタに配属され
た特徴量を表すベクトル数、即ちコードベクトルの出現
数を検出してこの数を符号出現回数データとして保持す
る。このようにして話者別コードブック作成段階におい
て、全てのコードベクトルに対する符号列と符号出現回
数データを求め、それぞれ後述のＶＱコードベクトル符
号列格納部４０１、ＶＱコードベクトル出現回数格納部
４０３に格納しておく。

【００４０】次に図４を参照してＶＱコードベクトル出
現制御部２０２の具体的な動作を説明する。ＶＱコード
ベクトル符号列格納部４０１には上記符号列が格納され
ており、ＶＱコードベクトル出現回数格納部４０３に
は、上記符号出現回数データが格納されているものとす
る。

【００４１】詐称者コードベクトル選択部４０２は、本
人外コードブック選択部２０１から入力される本人外コ
ードブックから前述の詐称者コードベクトルを複数種選
択し、選択された複数種の詐称者コードベクトルのう
ち、どれを何回出現させれば真の音声になるかを判定し
てその結果をＶＱコードベクトル出現回数制御部４０４
に出力する。この際、ＶＱコードベクトル符号列格納部
４０１を用いて、各コードベクトルに対応する符号を検
出しておく。

【００４２】ＶＱコードベクトル出現回数制御部４０４
は、上記判定結果、各詐称者コードベクトルに付された
符号、及びＶＱコードベクトル出現回数格納部４０３に
格納された符号出現回数データに基づいて、詐称者コー
ドベクトル（符号又は符号列）の出現回数を決定する。
その際、ＶＱコードベクトル符号列格納部４０３に格納
されている符号列を構成する各符号の出現回数をそのま
ま詐称者コードベクトルの出現回数としても良く、ある
いは、符号列を代表する詐称者コードベクトルを符号出
現回数データに従って出現させるようにしても良い。出
現した詐称者コードベクトルの集合は、詐称者コードブ
ックとしてベクトル量子化部２０３に送られ、以後は前
述の処理を経て閾値を決定する。

【００４３】このように、本実施例によれば、話者別コ
ードブックのみを用いて話者別の閾値を決定できるの
で、大量の学習音声サンプルを別途収録する作業が不要
となり、しかも、話者別コードブックを作成した段階で
閾値決定及び話者照合が可能になる。従って、話者の新
規登録が常に必要となる用途において多大な効果を発揮
することができる。なお、本実施例においては、話者別
コードブック以外、各話者の閾値の設定に本人及び他話
者の音声データが確保できない状況を想定して説明した
が、本発明で提案した方法及び装置は、上記状況に限定
されないのは言うまでもない。

【００４４】

【発明の効果】以上の説明から明らかなように、本発明
の話者照合方法は、予め用意された話者別コードブック
内の本人外コードブックから所定量のコードベクトルを
出現させ、これら出現したコードベクトルを本人コード
ブックでベクトル量子化して導出した特徴差の統計値に
基づいて話者照合の基準となる閾値を決定するので、話
者別コードブックを作成した段階で閾値の決定及び話者
照合が可能になる効果がある。また、事後的に閾値を決
定する従来手法において必要であった、大量の学習音声
サンプルの収録作業が不要になるとともに、閾値決定の
ための膨大なメモリ容量と計算時間も大幅に縮減、短縮
される効果もあり、人的資源及びコストを削減すること
ができる。

【００４５】また、本発明の話者照合方法は、話者別コ
ードブックの作成に用いた学習音声サンプルの特徴量に
対し、同じ学習音声サンプルで作成されたコードブック
によりベクトル量子化を施すことでコードベクトルの符
号列及び符号出現回数データを検出しておき、この符号
列に基づいて本人外コードブックから対応コードベクト
ルを選択するとともにその対応コードベクトルを上記符
号出現回数データに従って本人外コードブックから出現
させる方法を採用するので、従来の大量の学習音声サン
プルを用意した場合と略同様の状況を簡易に実現するこ
とができる。

【００４６】また、本発明の話者照合装置によれば、話
者別コードブック格納部に格納された複数のコードブッ
クから発話者の表明した識別名称に対応する本人コード
ブックとそれ以外の本人外コードブックとが選択され、
更に、本人外コードブックから出現した所定量のコード
ベクトルと本人コードブックとの特徴差の統計値に基づ
いて閾値が決定されるので、上記話者照合方法を容易に
実現することができる。

【図面の簡単な説明】

【図１】本発明の一実施例に係る話者照合装置のブロッ
ク図。

【図２】本実施例による閾値決定手段のブロック図。

【図３】本実施例の前段階で実行される話者別コードブ
ック作成手段のブロック図。

【図４】本実施例によるＶＱコードベクトル出現制御部
の詳細ブロック図。

【図５】従来の閾値の決定手段の一例を示すブロック
図。

【図６】従来の他の構成に係る閾値の決定手段を示すブ
ロック図。

【図７】従来の他の構成に係る閾値の決定手段を示すブ
ロック図。

【符号の説明】

１０１音声入力部１０２前処理部１０３特徴量抽出部１０４ベクトル量子化部１０５ＩＤ入力部１０６本人コードブック指定部１０７話者別コードブック格納部１０８話者判定部１０９本人閾値格納部１１０閾値決定部

───────────────────────────────────────────────────── フロントページの続き (56)参考文献日本音響学会講演論文集（平成６年３月）３−７−１，ｐ．89〜90 電子情報通信学会技術研究報告［音声］Ｖｏｌ．94，Ｎｏ．42，ＳＰ94−２, ｐ．９〜16（平成６年５月) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 17/00 G10L 15/06 G10L 15/28 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】発話者の入力音声の特徴を表す特徴ベク
トルと発話者が表明した識別名称との一致性を、所定の
閾値との比較により判定する話者照合方法において、複数話者の個人性特徴を話者別コードブックとして格納
する段階と、前記話者別コードブックから前記識別名称によって指定
された本人コードブックを選択する段階と、前記話者別コードブックから前記本人コードブックを除
いた本人外コードブックを特定するとともに、特定した
本人外コードブックにおけるコードベクトルの出現制御
を行って前記識別名称以外の特徴を表すコードベクトル
群を出現させる段階と、出現したコードベクトル群を前記本人コードブックによ
ってベクトル量子化して両者の特徴差の統計値を導出す
る段階と、前記統計値をパラメータとして前記閾値を決定する段階
と、を有することを特徴とする話者照合方法。
【請求項２】請求項１記載の話者照合方法において、
前記識別名称以外の特徴を表すコードベクトル群を出現
させる段階は、前記話者別コードブックの作成に用いた
学習音声サンプルの特徴量に対し、同じ学習音声サンプ
ルで作成されたコードブックによりベクトル量子化を施
すことでコードベクトルの符号列及び符号出現回数デー
タを得、前記符号列に基づいて前記本人外コードブック
から対応コードベクトルを選択するとともに、その対応
コードベクトルを前記符号出現回数データに従って当該
本人外コードブックから出現させることを特徴とする話
者照合方法。
【請求項３】請求項２記載の話者照合方法において、前記符号列を代表するコードベクトルを、当該符号列の
各符号出現回数データに従って出現させることを特徴と
する話者照合方法。
【請求項４】請求項２又は３記載の話者照合方法にお
いて、前記符号出現回数データは、前記学習音声サンプルに基
づく話者別コードブックの作成に際して、同じクラスタ
に配属された特徴ベクトル数データであり、前記符号列
は、当該クラスタのセントロイドに対応するコードベク
トル符号の列であることを特徴とする話者照合方法。
【請求項５】発話者の入力音声信号と発話者が表明し
た識別名称との一致性判定用の閾値を決定する閾値決定
手段を備えた話者照合装置において、前記閾値決定手段は、複数話者の個人性特徴を表すコードブックを話者別に格
納した話者別コードブック格納部と、前記識別名称によって指定された本人コードブックを前
記話者別コードブック格納部から選択する本人コードブ
ック選択手段と、選択された本人コードブックを除く話者別コードブック
からのコードベクトルの出現を制御して前記識別名称以
外の特徴を表すコードベクトル群を生成するコードベク
トル出現制御手段と、生成されたコードベクトル群を前記選択された本人コー
ドブックでベクトル量子化して両者の特徴差の統計値を
導出する統計値導出手段と、前記統計値をパラメータとして前記閾値を決定する統計
値変換手段と、を有することを特徴とする話者照合装置。
【請求項６】請求項５記載の話者照合装置において、前記コードベクトル出現制御手段は、前記話者別コードブックの作成に用いた学習音声サンプ
ルの特徴量に対し、同じ学習音声サンプルで作成された
コードブックによりベクトル量子化を施すベクトル量子
化手段と、このベクトル量子化により得たコードベクトルの符号列
及び符号出現回数データを格納するメモリと、前記本人コードブックを除く話者別コードブックにアク
セスし、前記格納された符号列とその符号出現回数デー
タに従って当該コードブックにおける前記識別名称以外
のコードベクトルを選択してその出現回数を制御するコ
ードベクトル出現回数制御部とを有し、出現したコードベクトルの集合を前記統計値導出手段に
導くことを特徴とする話者照合装置。