JP2000227800A - 話者照合装置および話者照合装置における閾値設定方法 - Google Patents

話者照合装置および話者照合装置における閾値設定方法

Info

Publication number
JP2000227800A
JP2000227800A JP11028962A JP2896299A JP2000227800A JP 2000227800 A JP2000227800 A JP 2000227800A JP 11028962 A JP11028962 A JP 11028962A JP 2896299 A JP2896299 A JP 2896299A JP 2000227800 A JP2000227800 A JP 2000227800A
Authority
JP
Japan
Prior art keywords
pseudo
similarity
pattern
registration
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11028962A
Other languages
English (en)
Inventor
Eiko Yamada
栄子 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP11028962A priority Critical patent/JP2000227800A/ja
Publication of JP2000227800A publication Critical patent/JP2000227800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本人棄却誤り率が安定するような閾値を少な
い手間により設定する。 【解決手段】 擬似登録パターン作成部140におい
て、入力されたN個の登録用音声データの特徴ベクトル
のうちの一部であるM個の特徴ベクトルを用いて擬似登
録パターンを作成する。類似度計算部150では、その
擬似登録パターンと擬似登録パターン作成に用いていな
い残りの(N−M)個の登録用音声データの特徴ベクト
ルとの間の擬似本人類似度を求める。闘値計算部150
では、求めたその擬似本人類似度を、照合用音声データ
と登録パターンとの間の本人類似度と見なすことにより
閾値を決定する。照合時の本人類似度を模擬した値であ
る擬似本人類似度から閾値を求めるため、照合時の本人
棄却誤り率を安定させることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、発話者が本人かど
うかの判定を行うための話者照合装置に関し、特にテキ
スト依存方式の話者照合装置において闘値を設定するた
めの閾値設定方法に関する。
【0002】
【従来の技術】話者照合装置は、発話者が本人であるか
詐称者(本人以外の者であって本人であると主張してい
る者)であるかの判定を行うための装置であり、予め照
合対象者の音声パターンの特徴を登録パターンとして登
録しておき、話者照合を行う際に、入力された照合用音
声と予め登録された本人の登録パターンとの類似度を求
め、得られた類似度が予め設定された閾値よりも大きい
場合にはその発話者は本人であると判定し、低い場合に
は詐称者であると判定する。
【0003】この話者照合装置では、闘値を小さな値に
設定すると本人棄却誤り率が大きくなり、闘値を大きな
値に設定すると他人受理誤り率が大きくなってしまう。
ここで、本人棄却誤り率とは、発話者が照合対象者本人
であるにもかかわらず、詐称者であると判定してしまう
誤認識率であり、他人受理誤り率とは発話者が詐称者で
あるにもかかわらず照合対象者本人であると判定してし
まう誤認識率である。
【0004】そのため、発話者が本人であるかどうかの
判定の基準となる闘値をどのような値に設定するかとい
うことは、話者照合装置の性能にとって重要なことであ
り、闘値の設定には様々な方法が考えられている。
【0005】判定の基準となる閾値は、従来より複数話
者の複数単語データを用いた評価実験から事後的に設定
されることが多く、閾値設定に要する手間が大きいこと
が問題となっている。
【0006】この問題を解決する方法として事前に閾値
を設定する方法が、特願平10-069514号の出願
明細書(山田、服部、"話者照合における閾値決定方法
及び装置")に提案されている。この方法では予め複数
話者のサブワード単位の標準パターンを蓄えておき、登
録時に当該発声内容を表すサブワード単位の音声パター
ンを連結することで単語単位の標準パターンを作成し、
本人の登録用音声と本人以外の複数話者の単語単位の標
準パターンとの類似度を求める。ここで、サブワードと
は、音素、音節等の単語をさらに分割した単位である。
こうして作成された分布を本人標準パターンと詐称者音
声との類似度の分布と見なすことで閾値を決定する方法
である。
【0007】閾値の求め方については、一例として類似
度の分布中のKパーセンタイルの類似度を閾値とする方
法が挙げられる。この場合全体のKパーセンタイルにあ
たる類似度が閾値より高い値となり、これは詐称者を誤
って受理する受理誤り率をKパーセントに設定したこと
に相当している。そのため、この方法は所望する他人受
理誤り率を与える閾値を事前に設定することができる方
法であると言える。また登録音声から閾値を求めるた
め、事前に登録単語毎に適切な閾値を求めることができ
る方法である。
【0008】この従来の闘値設定方法は登録音声と本人
以外の複数話者の標準パターンとの類似度の分布を本人
の登録パターンと詐称者音声との類似度の分布であると
見なして閾値を求める方法であるため、所望の他人受理
誤り率を与えられる閾値を事前に求めることが可能であ
る。しかし、登録パターンと詐称者音声の類似度から閾
値を求めているため本人棄却誤り率の変動には無関係で
あり、他人受理誤り率よりも本人棄却誤り率を安定させ
たい場合には不向きな方法である。
【0009】
【発明が解決しようとする課題】上述した従来の話者照
合装置では、本人棄却誤り率を安定させられる閾値を設
定することができないという問題点があった。
【0010】本発明の目的は、本人棄却誤り率が安定す
るような閾値を少ない手間により設定することができる
話者照合装置および話者照合装置における闘値設定方法
を提供することである。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、本発明の話者照合装置は、予め照合対象者が発声し
た登録用音声の特徴を登録パターンとして登録してお
き、発話者から入力された照合用音声データと前記登録
パターンとを比較することにより該発話者が照合対象者
本人であるか詐称者であるかを判定するための話者照合
装置であって、入力されたN個の登録用音声データをそ
れぞれ特徴ベクトルに変換する第1の分析部と、前記第
1の分析部で分析されたN個の特徴ベクトルを記憶する
特徴ベクトル記憶部と、照合対象者の特徴を含まない一
般的な音声パターンである初期標準パターンをサブワー
ド単位で記憶している初期標準パターン記憶部と、前記
特徴ベクトル記憶部に記憶されたN個の登録用音声デー
タの特徴ベクトルのうちのM個の特徴ベクトルと、前記
初期標準パターン記憶部に記憶された初期標準パターン
とから擬似登録パターンを作成する擬似登録パターン作
成部と、前記特徴ベクトル記憶部に記憶されたN個の登
録用音声データのうちの前記擬似登録パターン作成に用
いられなかった(N−M)個の登録用音声データの特徴
ベクトルと前記擬似登録パターンとの間の疑似本人類似
度を計算する類似度計算部と、前記擬似登録パターン作
成に用いられたM個の特徴ベクトルと疑似本人類似度計
算に用いられた(N−M)個の特徴ベクトルの組み合わ
せを変化させながら擬似登録パターン作成と擬似本人類
似度計算をP回繰り返し行い、その結果計算されたP個
の疑似本人類似度から話者照合の際の判定基準となる閾
値を計算する閾値計算部と、前記閾値計算部で計算され
た閾値を記憶する閾値記憶部と、前記特徴ベクトル記憶
部に記憶されたN個の登録用音声データの特徴ベクトル
と、前記初期標準パターン記憶部に記憶された初期標準
パターンとから前記登録パターンを作成する登録パター
ン作成部と、前記登録パターン作成部において作成され
た登録パターンを記憶する登録パターン記憶部と、入力
された照合用音声データを特徴ベクトルに変換する第2
の分析部と、前記第2の分析部で分析された特徴ベクト
ルと前記登録パターン記憶部に記憶された照合対象者本
人の登録パターンとの間の本人類似度を計算する本人類
似度計算部と、前記本人類似度計算部で計算された本人
類似度が前記閾値記憶部に記憶された閾値より大きい場
合には前記発話者は照合対象者本人であると判定し、前
記本人類似度が前記闘値以下の場合には前記発話者は詐
称者であると判定する本人判定部とを有している。
【0012】本発明の話者照合装置では、擬似登録パタ
ーン作成部において、入力されたN個の登録用音声デー
タの特徴ベクトルのうちの一部であるM個の特徴ベクト
ルを用いて擬似登録パターンを作成し、類似度計算部に
おいて、その擬似登録パターンと擬似登録パターン作成
に用いていない残りの(N−M)個の登録用音声データ
の特徴ベクトルとの間の擬似本人類似度を求め、闘値計
算部では、求めたその擬似本人類似度を、話者照合の際
に判定される照合用音声データと登録パターンとの間の
本人類似度と見なすことにより閾値を決定する。したが
って、本発明の話者照合装置では、照合時の本人類似度
を模擬した値である擬似本人類似度から閾値を求めるた
め、照合時の本人棄却誤り率を安定させることができ
る。また、本発明の話者照合装置では、登録用音声から
閾値を求めるため登録単語毎に適切な閾値が設定可能で
ある。
【0013】また、本発明の話者照合装置では、第1お
よび第2の分析部は、ケプストラム、△ケプストラムで
構成される特徴ベクトルを求める。
【0014】また、本発明の話者照合装置では、擬似登
録パターン作成部は、話者適応方法またはフォワード−
バックワードアルゴリズムを用いて擬似登録パターンを
作成する。
【0015】また、本発明の話者照合装置は、類似度計
算部および本人類似度計算部は、ビタビアルゴリズムま
たはDPマッチングを用いて疑似本人類似度および本人
類似度を計算する。
【0016】上記目的を達成するために、本発明の話者
照合装置における闘値設定方法は、予め照合対象者が発
声した登録用音声の特徴を登録パターンとして登録して
おき、発話者から入力された照合用音声データと前記登
録パターンとを比較することにより該発話者が照合対象
者本人であるか詐称者であるかを判定する際の判定基準
として用いられる闘値を設定するための、話者照合装置
における闘値設定方法であって、入力されたN個の登録
用音声データの特徴ベクトルのうちのM個のデータの特
徴ベクトルを用いて擬似登録パターンを作成する処理
と、作成した前記擬似登録パターンと残りの(N−M)
個のデータの特徴ベクトルとの間の類似度である擬似本
人類似度を求める処理と、前記擬似登録パターンを作成
する処理と前記疑似本人類似度を求める処理を、疑似登
録パターンを作成する際のM個のデータを変化させなが
らP回繰り返す処理と、求められたP個の擬似本人類似
度から話者照合の際の判定基準となる閾値を求める処理
とを有する。
【0017】また、本発明の話者照合装置における闘値
設定方法では、特徴ベクトルから疑似登録パターンを作
成する処理の際に、話者適応方法またはフォワード−バ
ックワードアルゴリズムを用いて擬似登録パターンを作
成する。
【0018】また、本発明の話者照合装置における闘値
設定方法では、作成した前記擬似登録パターンと残りの
(N−M)個のデータの特徴ベクトルとの間の類似度で
ある擬似本人類似度を求める処理の際に、ビタビアルゴ
リズムまたはDPマッチングを用いて前記擬似本人類似
度を計算する。
【0019】本発明の話者照合装置における闘値設定方
法では、入力されたN個の登録用音声データの特徴ベク
トルのうちの一部であるM個の特徴ベクトルを用いて擬
似登録パターンを作成し、その擬似登録パターンと擬似
登録パターン作成に用いていない残りの(N−M)個の
登録用音声データの特徴ベクトルとの間の擬似本人類似
度を求め、求めたその擬似本人類似度を、話者照合の際
に判定される照合用音声データと登録パターンとの間の
本人類似度と見なすことにより閾値を決定する。したが
って、本発明の闘値決定方法は、照合時の本人類似度を
模擬した値である擬似本人類似度から閾値を求めるた
め、照合時の本人棄却誤り率を安定することができる。
また、本発明の闘値設定方法は、登録用音声から閾値を
求めるため登録単語毎に適切な閾値が設定可能である。
【0020】
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して詳細に説明する。
【0021】図1は本発明の一実施形態の話者照合装置
の構成を示すブロック図である。
【0022】本実施形態の話者照合装置は、分析部11
0と、特徴ベクトル記憶部120と、初期標準パターン
記憶部130と、擬似登録パターン作成部140と、類
似度計算部150と、閾値計算部160と、登録パター
ン作成部170と、登録パターン記憶部180と、閾値
記憶部190と、分析部200と、本人類似度計算部2
10と、本人判定部220とから構成されている。
【0023】分析部110は、入力された登録用音声デ
ータを特徴ベクトルに変換する。特徴ベクトル記憶部1
20は、分析部110で分析された特徴ベクトルを記憶
する。初期標準パターン記憶部130は、サブワード単
位の初期標準パターンを記憶している。初期標準パター
ンとは、照合対象者の特徴を含まない一般的な音声パタ
ーンである。
【0024】擬似登録パターン作成部140は、特徴ベ
クトル記憶部120に記憶されたN個の登録用音声デー
タのうちのM個の特徴ベクトルと、初期標準パターン記
憶部130に記憶された初期標準パターンとから擬似登
録パターンを作成する。
【0025】類似度計算部150は、特徴ベクトル記憶
部120に記憶されたN個の登録用音声データのうちの
擬似登録パターン作成に用いられなかった(N−M)個
の登録用音声データの特徴ベクトルと擬似登録パターン
作成部140で作成された擬似登録パターンとの間の類
似度である擬似本人類似度を計算する。
【0026】閾値計算部160は、擬似登録パターン作
成に用いられたM個の登録用音声データの特徴ベクトル
と擬似本人類似度計算に用いられた(N−M)個の登録
用音声データの特徴ベクトルの組み合わせを変化させな
がら擬似登録パターン作成と擬似本人類似度計算をP回
繰り返し行い、その結果計算されたP個の擬似本人類似
度から話者照合の際の判定基準となる閾値を計算する。
閾値記憶部190は、閾値計算部160で計算された閾
値を記憶する。
【0027】登録パターン作成部170は、特徴ベクト
ル記憶部120に記憶されたN個の登録用音声データの
特徴ベクトルと、初期標準パターン記憶部130に記憶
された初期標準パターンとから話者照合の際の基準とな
る登録パターンを作成する。登録パターン記憶部180
は、登録パターン作成部170で作成された本人の登録
パターンを記憶する。
【0028】分析部200は、照合用音声データを特徴
ベクトルに変換する。本人類似度計算部210は、分析
部200で分析された特徴ベクトルと登録パターン記憶
部180に記憶された本人の登録パターンとの間の類似
度を計算する。本人判定部220は、本人類似度計算部
210で計算された本人類似度が閾値記憶部190に記
憶された閾値より大きい場合には発話者は照合対象者本
人であると判定し、本人類似度が闘値以下の場合には発
話者は詐称者であると判定する本人判定を行う。
【0029】次に、本実施形態の話者照合装置の動作に
ついて図1を参照して詳細に説明する。先ず、本実施形
態の話者照合装置における登録時の動作について説明す
る。
【0030】入力された登録用音声は分析部110に入
力され特徴ベクトルに変換される。特徴ベクトルとして
はケプストラム、△ケプストラム(文献1:古井、"デ
ィジタル音声処理、"東海大学出版会、pp.44-47、1985
に詳しい。)等が用いられる。分析された特徴ベクトル
は特徴ベクトル記憶部120に入力される。登録回数が
N回であるとするとN個の登録用音声の特徴ベクトルが
記憶される。
【0031】特徴ベクトル記憶部120に記憶されたN
個の登録用音声データの特徴ベクトルは登録パターン作
成部170に送られる。登録パターン作成部170では
初期標準パターン記憶部130から送られたサブワード
単位の標準パターンが発声内容に従って連鎖され、連鎖
された単語単位の標準パターンを初期標準パターンと
し、特徴ベクトル記憶部120から送られたN個の登録
用音声データの特徴ベクトルを用い登録パターンの作成
が行われる。登録パターン作成方法としては話者適応方
法(文献2:篠田他、"半音節HMMによる音声認識の
ための話者適応、"音響講論、pp23-24、1991-9に詳し
い。)やフォワード−バックワードアルゴリズム(文献
3:中川、"確率モデルによる音声認識、"電子情報通信
学会、1988)を用いた作成方法等が用いられる。作成さ
れた登録パターンは登録パターン記憶部180に送られ
る。
【0032】また、特徴ベクトル記憶部120に記憶さ
れた特徴ベクトルのうちのM(M<N)個の特徴ベクトル
は擬似登録パターン作成部140に送られ、残りの(N
−M)個の特徴ベクトルは類似度計算部150に送られ
る。擬似登録パターン作成部140では初期標準パター
ン記憶部130から送られたサブワード単位の標準パタ
ーンが発声内容に従って連鎖され、連鎖された単語標準
パターンを初期標準パターンとし、特徴ベクトル記憶部
120から送られたM個の登録用音声データの特徴ベク
トルを用い擬似登録パターンの作成が行われる。擬似登
録パターン作成方法としては話者適応方法(文献2に詳
しい。)を用いた作成方法、フォワード−バックワード
アルゴリズム(文献3に詳しい。)を用いた作成方法等
が用いられる。
【0033】擬似登録パターン作成部140で作成され
た擬似登録パターンは類似度計算部150に送られる。
類似度計算部150では特徴ベクトル記憶部120から
送られた(N−M)個の特徴ベクトルと擬似登録パターン
作成部140から送られた擬似登録パターンとの間の擬
似本人類似度が計算される。擬似本人類似度の計算方法
はビタビアルゴリズム(文献3:中川、"確率モデルに
よる音声認識、"電子情報通信学会、1988に詳し
い。)、DP(ダイナミック プログラミング)マッチ
ング(文献4:迫江、"傾斜制限DPマッチングによる音
声認識、"音響講論、pp.67-68、1974に詳しい。)などが
用いられる。擬似登録パターン作成部140と類似度計
算部150の手順が発声データの組み合わせを変化させ
ながらP回繰り返され、P個の擬似本人類似度が求めら
れる。求められたP個の擬似本人類似度は閾値計算部1
60に送られる。閾値計算部160では類似度計算部1
50で計算されたP個の擬似本人類似度から閾値が計算
される。閾値の計算方法としては類似度の分布のKパー
センタイルの値を閾値にする方法や全類似度の平均値を
求める方法などが用いられる。求められた閾値は閾値記
憶部190に送られ、記憶される。
【0034】次に、上記で説明した本実施形態の話者照
合装置における闘値設定方法を図2を参照して説明す
る。
【0035】N個の登録用音声データのうちのM個の登
録用音声データを用い擬似登録パターンを作成する(ス
テップ301)。作成した擬似登録パターンと残りの
(N−M)個の登録用音声データとの間の類似度である
擬似本人類似度を求める(ステップ302)。N個のデ
ータの特徴ベクトルのうちから選択するM個の特徴ベク
トルを変化させながらステップ301、302の処理を
P回繰り返す(ステップ302)。そして、最後に求め
られたP個の擬似本人類似度から閾値を求める(ステッ
プ303)。
【0036】周囲雑音等の環境変化が小さければ、M個
の登録用音声データを用いて作成した擬似登録パターン
はN個の登録用音声データを用いて作成した登録パター
ンと等価であると考えられる。また、登録時と照合時の
環境差が小さければ登録時の発声と照合時の発声もほぼ
等価であるため、ステップ302で求めた擬似本人類似
度は照合用音声データと登録パターンの類似度である本
人度類似度を模擬した値であると考えられる。ステップ
304の閾値の求め方の例としては、登録発声回数Nが
大きい場合には、擬似本人類似度の分布のKパーセンタ
イルの値を閾値とする方法を用いることができる。この
方法によると分布中のKパーセントの擬似本人類似度が
閾値よりも低い値となる。これは照合時の本人類似度中
のKパーセントが閾値よりも低く、本人棄却誤り率がK
パーセントであることに相当している。これより、本方
法によって所望の本人棄却誤り率が得られる閾値を事前
に設定することが可能である。登録回数Nが小さい場合
には、擬似本人類似度の分布密度が粗であるため、N個
の擬似本人類似度の平均値を閾値とする方法を用いるこ
とができる。これによって擬似本人類似度の分布の密度
が粗である場合でも精度良い閾値を得ることができる。
【0037】次に、本実施形態の話者照合装置における
照合時の動作について説明する。
【0038】照合時には入力された照合用音声は分析部
200に送られ特徴ベクトルに変換される。特徴ベクト
ルとしてはケプストラム、Δケプストラム等が用いられ
る。分析された特徴ベクトルは本人類似度計算部210
に送られる。本人類似度計算部210では登録パターン
記憶部180から送られた登録パターンと分析部200
から送られた特徴ベクトルとの間の類似度である本人類
似度が計算される。類似度の計算方法はビタビアルゴリ
ズム(文献3に詳しい。)、DPマッチング(文献4に
詳しい。)などが用いられる。計算された本人類似度は
本人判定部220に送られる。本人判定部220では閾
値記憶部190から送られた閾値を基に発話者が本人で
あるか詐称者であるかの本人判定が行われる。本人類似
度計算部210から送られた本人類似度が閾値記憶部1
90から送られた閾値よりも大きい場合本人であると判
定され、小さい場合には詐称者であると判定される。
【0039】本実施形態による話者照合装置では、図2
に示したような閾値設定方法を用いて闘値を設定するこ
とにより、照合対象者は登録用音声データをN回発声す
るのみで闘値が設定され、少ない手間で予め登録単語毎
に適切な閾値が設定される。そして更に、本実施形態の
話者照合装置で用いられる閾値は話者照合の際の本人類
似度を模擬した値である擬似登録パターンから求められ
ているため、本人棄却誤り率を安定させることができ、
その結果良好な話者照合性能を得ることができる。
【0040】
【発明の効果】以上説明したように、本発明によれば、
本人棄却誤り率を安定させる閾値を少ない手間により事
前に設定することができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施形態の話者照合装置の構成を示
すブロック図である。
【図2】図1の話者照合装置における闘値設定方法を示
すフローチャートである。
【符号の説明】
110 分析部 120 特徴ベクトル記憶部 130 初期標準パターン記憶部 140 擬似登録パターン作成部 150 類似度計算部 160 閾値計算部 170 登録パターン作成部 180 登録パターン記憶部 190 閾値記憶部 200 分析部 210 本人類似度計算部 220 本人判定部 301〜304 ステップ

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 予め照合対象者が発声した登録用音声の
    特徴を登録パターンとして登録しておき、発話者から入
    力された照合用音声データと前記登録パターンとを比較
    することにより該発話者が照合対象者本人であるか詐称
    者であるかを判定するための話者照合装置であって、 入力されたN個の登録用音声データをそれぞれ特徴ベク
    トルに変換する第1の分析部と、 前記第1の分析部で分析されたN個の特徴ベクトルを記
    憶する特徴ベクトル記憶部と、 照合対象者の特徴を含まない一般的な音声パターンであ
    る初期標準パターンをサブワード単位で記憶している初
    期標準パターン記憶部と、 前記特徴ベクトル記憶部に記憶されたN個の登録用音声
    データの特徴ベクトルのうちのM個の特徴ベクトルと、
    前記初期標準パターン記憶部に記憶された初期標準パタ
    ーンとから擬似登録パターンを作成する擬似登録パター
    ン作成部と、 前記特徴ベクトル記憶部に記憶されたN個の登録用音声
    データのうちの前記擬似登録パターン作成に用いられな
    かった(N−M)個の登録用音声データの特徴ベクトル
    と前記擬似登録パターンとの間の疑似本人類似度を計算
    する類似度計算部と、 前記擬似登録パターン作成に用いられたM個の特徴ベク
    トルと疑似本人類似度計算に用いられた(N−M)個の
    特徴ベクトルの組み合わせを変化させながら擬似登録パ
    ターン作成と擬似本人類似度計算をP回繰り返し行い、
    その結果計算されたP個の疑似本人類似度から話者照合
    の際の判定基準となる閾値を計算する閾値計算部と、 前記閾値計算部で計算された閾値を記憶する閾値記憶部
    と、 前記特徴ベクトル記憶部に記憶されたN個の登録用音声
    データの特徴ベクトルと、前記初期標準パターン記憶部
    に記憶された初期標準パターンとから前記登録パターン
    を作成する登録パターン作成部と、 前記登録パターン作成部において作成された登録パター
    ンを記憶する登録パターン記憶部と、 入力された照合用音声データを特徴ベクトルに変換する
    第2の分析部と、 前記第2の分析部で分析された特徴ベクトルと前記登録
    パターン記憶部に記憶された照合対象者本人の登録パタ
    ーンとの間の本人類似度を計算する本人類似度計算部
    と、 前記本人類似度計算部で計算された本人類似度が前記閾
    値記憶部に記憶された閾値より大きい場合には前記発話
    者は照合対象者本人であると判定し、前記本人類似度が
    前記闘値以下の場合には前記発話者は詐称者であると判
    定する本人判定部とを有する話者照合装置。
  2. 【請求項2】 前記第1および第2の分析部は、ケプス
    トラム、△ケプストラムから構成される特徴ベクトルを
    求める請求項1記載の話者照合装置。
  3. 【請求項3】 前記擬似登録パターン作成部は、話者適
    応方法を用いて擬似登録パターンを作成する請求項1ま
    たは2記載の話者照合装置。
  4. 【請求項4】 前記擬似登録パターン作成部は、フォワ
    ード−バックワードアルゴリズムを用いて擬似登録パタ
    ーンを作成する請求項1または2記載の話者照合装置。
  5. 【請求項5】 前記類似度計算部および前記本人類似度
    計算部は、ビタビアルゴリズムを用いて疑似本人類似度
    および本人類似度を計算する請求項1から4のいずれか
    1項記載の話者照合装置。
  6. 【請求項6】 前記類似度計算部および前記本人類似度
    計算部は、DPマッチングを用いて疑似本人類似度およ
    び本人類似度を計算する請求項1から4のいずれか1項
    記載の話者照合装置。
  7. 【請求項7】 予め照合対象者が発声した登録用音声の
    特徴を登録パターンとして登録しておき、発話者から入
    力された照合用音声データと前記登録パターンとを比較
    することにより該発話者が照合対象者本人であるか詐称
    者であるかを判定する際の判定基準として用いられる闘
    値を設定するための、話者照合装置における闘値設定方
    法であって、 入力されたN個の登録用音声データの特徴ベクトルのう
    ちのM個のデータの特徴ベクトルを用いて擬似登録パタ
    ーンを作成する処理と、 作成した前記擬似登録パターンと残りの(N−M)個の
    データの特徴ベクトルとの間の類似度である擬似本人類
    似度を求める処理と、 前記擬似登録パターンを作成する処理と前記疑似本人類
    似度を求める処理を、疑似登録パターンを作成する際の
    M個のデータを変化させながらP回繰り返す処理と、 求められたP個の擬似本人類似度から話者照合の際の判
    定基準となる閾値を求める処理とを有する話者照合装置
    における闘値設定方法。
  8. 【請求項8】 特徴ベクトルから疑似登録パターンを作
    成する処理の際に、話者適応方法を用いて擬似登録パタ
    ーンを作成する請求項7記載の話者照合装置における闘
    値設定方法。
  9. 【請求項9】 特徴ベクトルから擬似登録パターンを作
    成する処理の際に、フォワード−バックワードアルゴリ
    ズムを用いて擬似登録パターンを作成する請求項7記載
    の話者照合装置における闘値設定方法。
  10. 【請求項10】 作成した前記擬似登録パターンと残り
    の(N−M)個のデータの特徴ベクトルとの間の類似度
    である擬似本人類似度を求める処理の際に、ビタビアル
    ゴリズムを用いて前記擬似本人類似度を計算する請求項
    8または9記載の話者照合装置における闘値設定方法。
  11. 【請求項11】 作成した前記擬似登録パターンと残り
    の(N−M)個のデータの特徴ベクトルとの間の類似度
    である擬似本人類似度を求める処理の際に、DPマッチ
    ングを用いて前記擬似類似度を計算する請求項8または
    9記載の話者照合装置における闘値設定方法。
JP11028962A 1999-02-05 1999-02-05 話者照合装置および話者照合装置における閾値設定方法 Pending JP2000227800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11028962A JP2000227800A (ja) 1999-02-05 1999-02-05 話者照合装置および話者照合装置における閾値設定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11028962A JP2000227800A (ja) 1999-02-05 1999-02-05 話者照合装置および話者照合装置における閾値設定方法

Publications (1)

Publication Number Publication Date
JP2000227800A true JP2000227800A (ja) 2000-08-15

Family

ID=12263053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11028962A Pending JP2000227800A (ja) 1999-02-05 1999-02-05 話者照合装置および話者照合装置における閾値設定方法

Country Status (1)

Country Link
JP (1) JP2000227800A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7643284B2 (en) 2006-10-30 2010-01-05 Lenovo Singapore Pte. Ltd Housing temperature suppressing structure in electronic device and portable computer
JPWO2020246041A1 (ja) * 2019-06-07 2020-12-10

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7643284B2 (en) 2006-10-30 2010-01-05 Lenovo Singapore Pte. Ltd Housing temperature suppressing structure in electronic device and portable computer
JPWO2020246041A1 (ja) * 2019-06-07 2020-12-10
WO2020246041A1 (ja) * 2019-06-07 2020-12-10 日本電気株式会社 音声処理装置、音声処理方法、及び、プログラムが格納された非一時的なコンピュータ可読媒体
JP7176628B2 (ja) 2019-06-07 2022-11-22 日本電気株式会社 音声処理装置、音声処理方法、及び、音声処理プログラム

Similar Documents

Publication Publication Date Title
US5913192A (en) Speaker identification with user-selected password phrases
CA2609247C (en) Automatic text-independent, language-independent speaker voice-print creation and speaker recognition
US6088669A (en) Speech recognition with attempted speaker recognition for speaker model prefetching or alternative speech modeling
CN111566729A (zh) 用于远场和近场声音辅助应用的利用超短语音分段进行的说话者标识
US20030220791A1 (en) Apparatus and method for speech recognition
JP5200712B2 (ja) 音声認識装置、音声認識方法及びコンピュータプログラム
Justin et al. Speaker de-identification using diphone recognition and speech synthesis
Li et al. Verbal information verification
JP4897040B2 (ja) 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム
CN112309406A (zh) 声纹注册方法、装置和计算机可读存储介质
Ilyas et al. Speaker verification using vector quantization and hidden Markov model
Ozaydin Design of a text independent speaker recognition system
Sarkar et al. Incorporating pass-phrase dependent background models for text-dependent speaker verification
Larcher et al. Constrained temporal structure for text-dependent speaker verification
JP3039634B2 (ja) 音声認識装置
Dey et al. Content normalization for text-dependent speaker verification
JP4391179B2 (ja) 話者認識システム及び方法
JP3090119B2 (ja) 話者照合装置、方法及び記憶媒体
Chakroun et al. An improved approach for text-independent speaker recognition
JP2000227800A (ja) 話者照合装置および話者照合装置における閾値設定方法
JP2001255887A (ja) 音声認識装置、音声認識方法及び音声認識方法を記録した媒体
JP3036509B2 (ja) 話者照合における閾値決定方法及び装置
JP5315976B2 (ja) 音声認識装置、音声認識方法、および、プログラム
KR100673834B1 (ko) 문맥 요구형 화자 독립 인증 시스템 및 방법
US20230317085A1 (en) Audio processing device, audio processing method, recording medium, and audio authentication system