JP3058569B2 - 話者照合方法及び装置 - Google Patents
話者照合方法及び装置Info
- Publication number
- JP3058569B2 JP3058569B2 JP6265856A JP26585694A JP3058569B2 JP 3058569 B2 JP3058569 B2 JP 3058569B2 JP 6265856 A JP6265856 A JP 6265856A JP 26585694 A JP26585694 A JP 26585694A JP 3058569 B2 JP3058569 B2 JP 3058569B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- codebook
- distance
- distortion distance
- time difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 41
- 238000012795 verification Methods 0.000 title claims description 27
- 239000013598 vector Substances 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000013139 quantization Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000016507 interphase Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Description
声認識システムに用いられる話者照合技術に関し、特
に、発話者の声の特徴の経時変化に適応する話者別閾値
を少ない特徴サンプル量で短時間に推定する方法及びそ
の実現装置に関する。
名称が、発話者自身の真の識別名称と一致するかどうか
を判定する装置である。通常、話者照合を行う場合に
は、予め照合対象となる話者識別名称及びこの識別名称
に対応するコードブックを登録しておき、話者照合時
に、発話者の実音声と識別名称とを入力し、この識別名
称によって指定されたコードブックと発話者の実音声と
を比較してその特徴差を検出する。この特徴差が話者別
に設定された所定の閾値以下の場合には表明された識別
名称が真の識別名称であり、発話者は本人であると判定
する。その他の場合は、表明された識別名称は偽識別名
称であり、発話者は詐称者であると判定する。このよう
に、話者照合においては、話者別閾値をどのような値に
決定するかが重要であり、この値が適切な値であるかど
うかによって話者の識別率が大きく左右される。
因がある。1つは発話者が真の識別名称を表明している
にも拘わらず、識別名称が偽であると認識してしまう場
合であり、この誤認識率を本人拒否率(FRR:False
Rejection Rate)と称する。もう1つは、発話者が偽名
称を表明しているにも拘わらずそれを真の識別名称と認
識してしまう場合であり、この誤認識率を詐称者受理率
(FAR:False Acceptance Rate)と称する。ところ
で、話者別閾値の値を高くすると、特徴差が大きくても
発話者が本人であると判断する確率が高くなる。従っ
て、FRRは低くなるがFARは高くなる。逆に、話者
別閾値の値を低くすると、FARは低くなるがFRRは
高くなる。このように、FRRとFARとは一方が低く
なると他方が高くなるという関係にある。誤認識率は両
者の平均値で表されるので、話者別閾値を調整して両者
の平均値をできるだけ小さくすることが好ましい。
々提案されている。第1の手法として、FRRとFAR
とが等しくなるように話者別閾値を設定する等誤り率設
定法があり、”ディジタル音声処理”(著者:古井 貞
煕;出版者:東海大学出版会)第9章に紹介されてい
る。図4は、この等誤り率設定法を実現するためのブロ
ック図であり、本人学習音声及び詐称者学習音声を音声
入力端子400に入力し、前処理部401が各音声を一
定時間長の音声フレームごとに記憶する。特徴量抽出部
402は、各音声の特徴量を抽出する。ベクトル量子化
部403は、音声から抽出されたそれぞれの特徴量を識
別名称に対応する話者コードブック404に基づいてベ
クトル量子化し、これにより得られたコードベクトルの
同一話者内歪み距離(以下、話者内距離)、他話者間歪
み距離(以下、話者間距離)を話者内/話者間距離記憶
部405に記憶する。FRR・FAR計算部406は、
話者内距離と予め定められた初期閾値とを用いてFRR
を計算するとともに、話者間距離と上記初期閾値とを用
いてFARを計算する。FRR・FAR比較部408で
は、FRRとFARの値を比較し、両者が等しくなけれ
ば閾値調整部407において初期閾値を調整し、再度F
RR・FAR計算部406に戻る。そしてFRRとFA
Rとが等しくなった時点で、調整を終え、その値を当該
話者の閾値として出力する。
布を考慮して閾値を設定する方法(S.Furui,”Cepstral
Analysis Technique for Automatic Speaker Verifica
tion,"IEEE Trans.Acoustics, Speech, and Signal Pro
cessing, vol.ASSP-29, No.2,pp.254-272, April 1981
参照)が知られている。図5はこの手法を実現するため
のブロック図であり、音声入力端子500に学習音声が
入力された後、前処理部501、特徴量抽出部502、
ベクトル量子化部503、話者コードブック504まで
は図4の構成と同様となる。この手法の特徴は、ベクト
ル量子化部503で得られた話者間距離を話者間距離記
憶部505に記憶しておき、それぞれ話者間標準偏差計
算部506と話者間平均値計算部507において話者間
距離の平均値と標準偏差を求め、その結果得られた統計
パラメータに基づき閾値計算部508で閾値を導出する
ことにある。
り開示された「話者照合方法及び装置」(特願平6−4
1615号明細書参照)がある。この手法は、複数のコ
ードブックから発話者の表明した識別名称に対応する本
人コードブックとそれ以外の他話者コードブックとを選
択し、他話者コードブックから出現した所定量のコード
ベクトルと本人コードブックとの特徴差の統計値を計算
し、これにより閾値を得るものである。つまりコードブ
ック間距離を話者間距離に変換することを特徴とする。
この手法は、図6の各ブロック600〜612により実
現される。
も特定の一時期に収集した特徴サンプルに基づいて閾値
を決定する手法であり、人間の声の特徴に経時変化があ
ることを考慮していない。そのため、時間が経つにつれ
て話者の識別率が低下する場合があった。人間の声の特
徴の経時変化に適応する閾値を推定するには、発話者毎
にできるだけ長期間の特徴サンプルを用いて音声特徴の
標準パターンを作成しておくことでその対処が可能であ
る。しかしながら、長期間の特徴サンプルをそのまま保
存する場合或いは音声特徴を抽出して保存する場合のい
ずれであっても、話者照合装置に莫大なメモリ容量を確
保しなければならず、しかも、特徴サンプル等が膨大な
量になることから話者別閾値の計算に長時間を要する問
題があった。
でも事後的に閾値を設定する手法なので、推定等によっ
て事前に閾値の設定を要する用途では十分に活用でき
ず、また、第2及び第3の手法は、話者内距離のばらつ
きを考慮しないため、話者照合時に、本人を高い確率で
拒否してしまう可能性があった。
者内距離のばらつきが考慮され、しかも声の特徴の経時
変化に適応する閾値を、少ない特徴サンプル量及び短時
間で事前に推定する方法及びこの方法を実施するための
装置を提供することにある。
サイズが一定値以上であれば、コードブック内距離と話
者内距離、コードブック間距離と話者間距離との間に、
それぞれ図2及び図3に示すように強い相関関係があ
り、しかもこれらの相関関係は時期差に頑健であるとい
う性質を有効に利用して、話者内距離のばらつき及び同
一話者及び他話者の声の特徴の時期差を考慮した最適な
話者別閾値を決定する点に特徴がある。
さの文章の音声を所定フレーム長で抽出した特徴量を1
セットとした場合に、8セットの男性音声に基づくコー
ドブック内距離と話者内距離との間の相関実測図であ
る。例えばコードブックサイズは512であり、時期差
は9ケ月である。この図から明らかなように、同一話者
であれば両者は線形相関にあり、時期差話者内距離を
y、コードブック内距離をxとすると、y=ax+bの
関係にあることが本発明者による検証の結果明らかにな
った。この式において係数a,bについては多少のばら
つきはあるものの、全体的には時期差に頑健な傾向が現
れている。なお、図2の例では、aは0.944、bは
0.101であった。
くコードブック間距離と時期差話者間距離との間の相関
実測図であり、図2の場合と同様、コードブックサイズ
は512、時期差は9ケ月である。図3を参照すると1
セットであるにも拘わらず、図2と同様の線形相関であ
ることが明らかであり、しかもこの傾向は、セット数が
増えても同様となる。なお、図示を省略したが、男性音
声に基づくコードブック間距離と話者間距離との関係も
同様であった。即ち、コードブック内距離とコードブッ
ク間距離が判れば、これら相関関係に基づき、時期差話
者内距離と時期差話者間距離を導出することができる。
合方法は、閾値の決定対象となる第1話者の任意の時期
の音声特徴に基づき第1のコードブックを作成するとと
もに、第1話者のコードブック内距離及びコードブック
間歪み距離をそれぞれ導出し、更に、第1話者について
準備された前記コードブック内距離と当該時期の時期差
話者内距離との間の第1相関値及びコードブック間距離
と時期差話者間距離との間の第2相関値に基づき、当該
時期における時期差話者内距離及び時期差話者間距離を
導出する過程を経る。時期差話者内距離及び話者間距離
を導出した後は、従来の第1手法と同様に、これら各距
離と任意に定めた初期閾値とに基づき本人拒否率及び詐
称者受理率を計算するとともに、これら本人拒否率及び
詐称者受理率が等しい値になるように前記初期閾値を調
整すれば良い。
3から明らかなように、予め話者別に所定の時期間隔で
取得した値であり、第1相関値は前記コードブック内歪
み距離と同一話者内の時期差歪み距離との間の線形相関
値、第2相関値は前記コードブック間歪み距離と話者間
歪み距離との間の線形相関値である。
合装置は、各々異なる時期の話者別音声特徴に基づき各
時期の話者別コードブックを作成し、各話者別コードブ
ックの作成過程で出現したコードベクトルの出現回数を
当該時期の話者別コードブックと共にメモリに保存する
手段を有する。この手段は、公知技術を利用することで
実現することができる。また、閾値の決定対象となる第
1話者の第1のコードブックを作成する対象話者別コー
ドブック作成手段と、作成された第1のコードブックと
保存してある前記第1話者及び他話者の過去のコードブ
ックから各々前記出現回数のコードベクトルを出現さ
せ、これらコードベクトルを前記第1のコードブックの
コードベクトルで量子化して第1話者のコードブック内
歪み距離、及び第1話者と他話者との間のコードブック
間歪み距離を導出する手段と、予め話者別に所定の時期
間隔で実測した前記コードブック内歪み距離と同一話者
内の時期差歪み距離との間の第1相関値、及び前記コー
ドブック間歪み距離と他話者間の時期差歪み距離との間
の第2相関値を記憶した相関値記憶手段と、前記第1話
者に対応する前記第1及び第2相関値を読み出して当該
時期の第1話者内の時期差歪み距離及び他話者間の時期
差歪み距離を導出する時期差歪み距離導出手段と、各時
期差歪み距離と任意に定めた初期閾値とに基づき本人拒
否率及び詐称者受理率を計算するとともに、これら本人
拒否率及び詐称者受理率が等しい値になるように前記初
期閾値を調整する閾値調整手段と、を有する。
に、話者別に異なる時期の話者別コードブックを複数作
成しておき、その際、各話者別コードブックにおけるコ
ードベクトルの出現回数を保存しておく。また、好まし
くは閾値決定前に図2及び図3で示した相関関係、即ち
第1相関値及び第2相関値を相関値記憶手段に記憶させ
ておく。第1話者の閾値を決定するときは、過去の各時
期の第1話者及び他話者のコードブックからコードベク
トルを代表する符号列及び符号列の出現回数に従ってコ
ードベクトルを出現させ、閾値決定時期に対応するコー
ドブック内距離、及びコードブック間距離を求める。次
いで、このコードブック内距離、コードブック間距離と
上記相関値記憶手段から読み出した第1相関値及び第2
相関値に基づき、時期差話者内距離、時期差話者間距離
を導出する。
たコードブックを用いるだけで事前に第1話者の時期差
話者内距離と時期差話者間距離を近似表現することが可
能となり、話者照合装置におけるメモリ使用量が従来よ
りも大幅に節約される。因みに従来の各手法により音声
波形をそのまま保存する場合(short型)は、サン
プリング周波数(1/sec)×音声継続時間(se
c)×2(バイト)、音声波形からその特徴ベクトルを
抽出して保存する場合(double型)は、総フレー
ム数×特徴ベクトルサイズ×16(バイト)のメモリ容
量を必要とするのに対し、本発明の方法及び装置の場合
のメモリ使用量は、話者別コードブックサイズ×特徴ベ
クトルサイズ×16(バイト:double型)+話者
別コードブックサイズ×4(バイト:int型)であ
る。従って、サンプリング周波数が16KHzの単語音
声が10個あるとし、その平均の長さが3秒、分析フレ
ーム長が30msec、フレーム周期が16msecと
すると、1ヶ月毎に特徴サンプルの収録を重ね、1年間
で収録した100名の話者の特徴サンプルの特徴量のみ
を記憶するために必要なメモリ容量は、コードブックサ
イズが256であれば従来の1/11倍となる。つま
り、本発明によれば、約92%のメモリ容量が節約でき
る。計算量についても同様であり、本発明によれば、従
来の約92%の計算量が削減できる。上記時期差話者内
距離と時期差話者間距離が導出された後は、従来の第1
の手法と同様の手順乃至手段で等誤り率になるように初
期閾値を調整し、これを第1話者の閾値とする。
に説明する。図1は、本発明の一実施例の話者照合装置
における話者別閾値決定部のブロック図であり、100
はコードブックファイル、101は話者別コードブック
(D時期話者別コードブック)、102はベクトル量子
化部、103はコードブック内距離記憶部、104はコ
ードブック間距離記憶部、105は相関変換値記憶部、
106は時期差話者内距離変換部、107は時期差話者
間距離変換部、108はFRR・FAR計算部、109
はFRR・FAR比較部、110は閾値調整部である。
に異なる時期、図示の例ではA〜C時期に作成したコー
ドブックを記憶する話者別コードブック記憶部と、各話
者別コードブックのコードベクトルを代表する符号列及
び各符号の出現回数を記憶する符号データ記憶部とが格
納され、話者別の過去の音声特徴として随時再利用でき
るようになっている。時期A〜Cの間隔は、ある程度離
れた方が好ましい。これは、短期間では話者の音声特徴
に差異が生じない場合があるからである。また、一回も
出現しなかった符号乃至符号列については符号データ記
憶部への記憶を行わない。これによってコードブックフ
ァイル100のサイズ(メモリ使用量)及び以後の計算
量の削減が更に期待できる。なお、符号列とは、各コー
ドベクトルに対し、例えばそれぞれのクラスタのセント
ロイドに対応して付与された符号の集合をいい、符号の
出現回数とは、ベクトル量子化処理が終了するまでの過
程において、同じクラスタに配属された符号の出現回数
データをいう。
値設定対象となる第1話者(甲)のD時期における学習
音声から分析フレームを抽出して特徴量を求め、その特
徴量をベクトル量子化して作成したコードブックであ
る。このD時期は、任意の時期であるが、上述のA時
期、B時期、C時期よりも遅い時期である。
時期話者別コードブック101に基づき、コードブック
ファイル100内に既に格納されている同一話者(甲)
のA〜C時期のコードブックからコードベクトルを各符
号の出現回数に従って出現させ、これを例えばD時期話
者別コードブック101に出力させる。これにより同一
話者(甲)によるD時期のコードブックの特徴差、即ち
コードブック内距離が得られる。これをコードブック内
距離記憶部103に記憶する。
に格納されている他話者(乙)のA〜C時期の話者別コ
ードブックからコードベクトルを各符号の出現回数に従
って出現させ、これを例えばD時期の話者別コードブッ
ク101に出力させる。これにより上記話者と他話者に
よるD時期のコードブック特徴差、即ちコードブック間
距離が得られる。これをコードブック間距離記憶部10
4に記憶する。
図2及び図3基づく線形相関式とコードブック内距離/
コードブック間距離から一義的に導かれる相関値が記憶
されている(相関値記憶手段)。ここにいう相関値は、
コードブック内距離と時期差話者内距離との関係を表す
第1相関値、コードブック間距離と時期差話者間距離と
の関係を表す第2相関値である。これら相関値は、各話
者をキーに読み出され、各々第1相関値は時期差話者内
距離変換部106、第2相関値は時期差話者間距離変換
部107に入力される。この実施例の場合は、話者
(甲)及び他話者(乙)に関わる第1及び第2相関値を
それぞれ読み出す。
間距離変換部107は、それぞれ上記コードブック内距
離及びコードブック間距離と上記第1及び第2相関値に
基づいてD時期における話者(甲)の時期差話者内距離
及び時期差話者間距離を求め、これらをFRR・FAR
計算部108に入力する。
た時期差話者内距離と任意の初期閾値とを用いてFRR
を計算するとともに、入力された時期差話者間距離と初
期閾値とを用いてFARを計算する。FRR・FAR比
較部109では、FRRとFARの値を比較し、両者が
等しくなければ閾値調整部110において初期閾値を調
整し、再度FRR・FAR計算部108に戻る。そして
FRRとFARとが等しくなった時点で、調整を終え、
そのときの閾値を当該話者(甲)の閾値として出力す
る。
ック内距離と時期差話者内距離との相関関係、及びコー
ドブック間距離と時期差話者間距離との相関関係を求め
て相関変換値記憶部105に記憶しておき、また、話者
別に異なる時期に作成した複数の話者別コードブックを
保存しておき、閾値決定の際に、これら話者別コードブ
ックを用いてコードブック内距離及びコードブック間距
離を導出するとともに上記相関関係に基づき時期差話者
内距離及び時期差話者間距離を導出するようにしたの
で、最初の時期(コードブック作成時)を除けば以後の
各時期において話者別閾値を随時決定することができ
る。また、コードブックファイル100のメモリ使用量
が従来手法に比べて大幅に節約され、閾値計算に要する
時間も短縮化される。これにより従来の課題を解決する
ことができる。なお、本実施例では、第1及び第2相関
値を予め相関変換値記憶部105に記憶しておき、閾値
決定対象となる話者をキーとして読み出す構成とした
が、必ずしもこのような構成に限定されるものではな
く、随時計算して時期差話者内距離変換部106及び時
期差話者間距離変換部107に入力するようにしても良
い。
の話者照合方法によれば、コードブック内距離及びコー
ドブック間距離と予め取得した第1相関値及び第2相関
値に基づいて時期差話者内距離及び時期差話者間距離が
導出されるので、声の特徴の経時変化に対応する話者別
閾値を決定する際に、長期間の特徴サンプルを記憶する
必要がなくなり、話者照合装置のメモリ使用量を節約す
ることができる。更に、特徴サンプル量が少なくて済む
ことから計算時間が従来手法よりも大幅に短縮され、話
者別閾値を、短時間で推定し得る効果がある。
去の異なる時期に話者別に作成したコードブックを再利
用して事前に第1話者の時期差話者内距離と時期差話者
間距離を相関値によって近似表現することが可能となる
ので、声の特徴の経時変化に適応する話者別閾値を決定
する場合であってもメモリを余分に使用する必要がなく
なる。また、特徴サンプル量が少なく、各距離の計算時
間も短縮化されるので、話者別閾値の決定手段の全体構
成を簡略化し得る効果がある。
ロック図。
を示す実測図。
を示す実測図。
実現するためのブロック図。
慮した閾値設定方法を実現するためのブロック図。
話者間距離に変換する方法を実現するためのブロック
図。
ードブック 102 ベクトル量子化部 103 コードブック内距離記憶部 104 コードブック間距離記憶部 105 相関変換値記憶部(相関値記憶手段) 106 時期差話者内距離変換部 107 時期差話者間距離変換部 108 FRR・FAR計算部 109 FRR・FAR比較部 110 閾値調整部
Claims (5)
- 【請求項1】 他話者との識別に用いる話者別閾値を決
定する閾値決定過程を有する話者照合方法において、前
記閾値決定過程は、 前記閾値の決定対象となる第1話者の任意の時期の音声
特徴に基づき第1のコードブックを作成するとともに、
この第1のコードブックと当該時期以前に作成した第1
話者のコードブックとの間のコードブック内歪み距離、
及び第1のコードブックと当該時期以前に作成した他話
者のコードブックとの間のコードブック間歪み距離をそ
れぞれ導出し、更に、第1話者について準備された前記
コードブック内歪み距離と当該時期の第1話者の時期差
歪み距離との間の第1相関値及びコードブック間歪み距
離と他話者の時期差歪み距離との間の第2相関値に基づ
き、当該時期の第1話者内の時期差歪み距離及び第1話
者と他話者との間の時期差話者間歪み距離を導出する過
程を含むことを特徴とする話者照合方法。 - 【請求項2】 前記閾値決定過程は、更に、当該時期の
各時期差歪み距離と任意に定めた初期閾値とに基づき本
人拒否率及び詐称者受理率を計算するとともに、これら
本人拒否率及び詐称者受理率が等しい値になるように前
記初期閾値を調整する過程を含むことを特徴とする請求
項1記載の話者照合方法。 - 【請求項3】 前記第1及び第2相関値は、予め話者別
に所定の時期間隔で取得した値であり、前記第1相関値
は前記コードブック内歪み距離と同一話者内の時期差歪
み距離との間の線形相関値、前記第2相関値は前記コー
ドブック間歪み距離と話者間歪み距離との間の線形相関
値であることを特徴とする請求項1又は2記載の話者照
合方法。 - 【請求項4】 他話者との識別に用いる話者別閾値の決
定手段を有する話者照合装置において、 各々異なる時期の話者別音声特徴に基づき各時期の話者
別コードブックを作成し、各話者別コードブックの作成
過程で出現したコードベクトルの出現回数を当該時期の
話者別コードブックと共にメモリに保存する手段と、 前記閾値の決定対象となる第1話者の第1のコードブッ
クを作成する対象話者別コードブック作成手段と、 作成された第1のコードブックと保存してある前記第1
話者及び他話者の過去のコードブックから各々前記出現
回数のコードベクトルを出現させ、これらコードベクト
ルを前記第1のコードブックのコードベクトルで量子化
して第1話者のコードブック内歪み距離、及び第1話者
と他話者との間のコードブック間歪み距離を導出する手
段と、 予め話者別に所定の時期間隔で実測した前記コードブッ
ク内歪み距離と同一話者内の時期差歪み距離との間の第
1相関値、及び前記コードブック間歪み距離と他話者間
の時期差歪み距離との間の第2相関値を記憶した相関値
記憶手段と、 前記第1話者に対応する前記第1及び第2相関値を読み
出して当該時期の第1話者内の時期差歪み距離及び他話
者間の時期差歪み距離を導出する時期差歪み距離導出手
段と、 を有することを特徴とする話者照合装置。 - 【請求項5】 請求項1記載の話者照合装置において、 各時期差歪み距離と任意に定めた初期閾値とに基づき本
人拒否率及び詐称者受理率を計算するとともに、これら
本人拒否率及び詐称者受理率が等しい値になるように前
記初期閾値を調整する閾値調整手段と、 を有することを特徴とする話者照合装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6265856A JP3058569B2 (ja) | 1994-10-28 | 1994-10-28 | 話者照合方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6265856A JP3058569B2 (ja) | 1994-10-28 | 1994-10-28 | 話者照合方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08123475A JPH08123475A (ja) | 1996-05-17 |
JP3058569B2 true JP3058569B2 (ja) | 2000-07-04 |
Family
ID=17423039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6265856A Expired - Fee Related JP3058569B2 (ja) | 1994-10-28 | 1994-10-28 | 話者照合方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3058569B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3699608B2 (ja) | 1999-04-01 | 2005-09-28 | 富士通株式会社 | 話者照合装置及び方法 |
JP4967928B2 (ja) * | 2007-08-27 | 2012-07-04 | ヤマハ株式会社 | 音声処理装置およびプログラム |
-
1994
- 1994-10-28 JP JP6265856A patent/JP3058569B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
日本音響学会講演論文集(平成6年10〜11月)1−8−12,p.23〜24 |
電子情報通信学会技術研究報告[音声]Vol.94,No.42,SP94−2,p.9〜16(平成6年5月) |
Also Published As
Publication number | Publication date |
---|---|
JPH08123475A (ja) | 1996-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3955246B1 (en) | Voiceprint recognition method and device based on memory bottleneck feature | |
EP1159737B1 (en) | Speaker recognition | |
Sanderson et al. | Noise compensation in a person verification system using face and multiple speech features | |
JPH1083194A (ja) | 話し手照合システムのための2段階群選択方法 | |
JPS58130393A (ja) | 音声認識装置 | |
CN108922541A (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN113223536B (zh) | 声纹识别方法、装置及终端设备 | |
Bredin et al. | Audiovisual speech synchrony measure: application to biometrics | |
JP3298858B2 (ja) | 低複雑性スピーチ認識器の区分ベースの類似性方法 | |
CN116490920A (zh) | 用于针对由自动语音识别系统处理的语音输入检测音频对抗性攻击的方法、对应的设备、计算机程序产品和计算机可读载体介质 | |
CN113516987A (zh) | 一种说话人识别方法、装置、存储介质及设备 | |
US5522013A (en) | Method for speaker recognition using a lossless tube model of the speaker's | |
JP3058569B2 (ja) | 話者照合方法及び装置 | |
KR101925252B1 (ko) | 음성 특징벡터 및 파라미터를 활용한 화자확인 이중화 방법 및 장치 | |
JP3098157B2 (ja) | 話者照合方法及び装置 | |
CN114512133A (zh) | 发声对象识别方法、装置、服务器及存储介质 | |
US7454337B1 (en) | Method of modeling single data class from multi-class data | |
Bredin et al. | Measuring audio and visual speech synchrony: methods and applications | |
JPH01255000A (ja) | 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法 | |
JP3919314B2 (ja) | 話者認識装置及びその方法 | |
JP2000148187A (ja) | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 | |
JP2991288B2 (ja) | 話者認識装置 | |
JPH034918B2 (ja) | ||
Jin et al. | A high-performance text-independent speaker identification system based on BCDM | |
CN116453539A (zh) | 用于多说话人的语音分离方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090421 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090421 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100421 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110421 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120421 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130421 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |