JPH09127973A - 話者認識システムおよび話者認識方法 - Google Patents

話者認識システムおよび話者認識方法

Info

Publication number
JPH09127973A
JPH09127973A JP7306556A JP30655695A JPH09127973A JP H09127973 A JPH09127973 A JP H09127973A JP 7306556 A JP7306556 A JP 7306556A JP 30655695 A JP30655695 A JP 30655695A JP H09127973 A JPH09127973 A JP H09127973A
Authority
JP
Japan
Prior art keywords
terminal
speaker
speaker recognition
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7306556A
Other languages
English (en)
Other versions
JP3522421B2 (ja
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP30655695A priority Critical patent/JP3522421B2/ja
Priority to US08/733,394 priority patent/US5893057A/en
Publication of JPH09127973A publication Critical patent/JPH09127973A/ja
Application granted granted Critical
Publication of JP3522421B2 publication Critical patent/JP3522421B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 利用者が例えば銀行の窓口などに出向かずと
も、話者認識を行なうことができ、銀行などで提供され
ている入出金,残高照会などのアプリケーションを利用
できる。 【解決手段】 少なくとも1つの端末31と中央装置3
2とが、情報を送受信可能に設けられており、端末31
には、話者の音声を入力し音声信号とする音声入力手段
1と、音声信号の特徴量を抽出する特徴抽出部4と、特
徴抽出部4からの話者の音声の特徴量と話者認識用情報
としての音声特徴量とを照合して話者認識を行なう話者
認識部7とが設けられ、また、中央装置32には、話者
認識用情報を管理する話者認識管理手段10が設けられ
ており、端末31において話者認識に用いられる話者認
識用情報は、中央装置32から端末31に転送され、ま
た、端末31において得られた話者認識結果は、中央装
置32に転送される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、話者認識を行なう
話者認識システムおよび話者認識方法に関する。
【0002】
【従来の技術】従来、銀行などにおいて、例えば入出
金,残高照会などのアプリケーションを利用者が利用す
る際、この利用者が正規の利用者本人であることを確認
するために、暗証番号などを利用者に入力させるように
している。また、コンピュータでは、パスワードと称し
て、暗証番号と同様の暗証文字列を利用者に入力させる
ことによって本人の確認を行なっている。しかしなが
ら、このような暗証番号や暗証文字列などの入力による
確認は、他人が、暗証番号や暗証文字列を知りさえすれ
ば、難無く、これを盗用することができる。しかも、暗
証番号や暗証文字列は、それを登録した者(本人)の生年
月日や記念日、あるいは電話番号、氏名の綴りなどを利
用したものが多く、他人がこれを見破ることは差程難し
いことではない。
【0003】暗証番号や暗証文字列のこのような欠点を
回避するため、近年、声によって本人か否かを判定す
る、いわゆる話者認識が着目されている。この話者認識
は、ある話者が発声した音声の特徴量(特徴パターン)
が、予め登録されているこの話者の音声標準パターンと
一致するか否かを調べることにより、本人か否かを判定
(認識)するものである。すなわち、話者の音声から抽出
した特徴量(特徴パターン)とこの話者の音声標準パター
ンとの類似度を計算し、類似度の高低によって本人か否
かを判定するものであり、人間の肉体的特徴を利用する
ものであることから、音声は、暗証番号や暗証文字列に
比べて他人がこれを真似ることは難かしく、従って、他
人の盗用をより有効に防止することができる。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな話者認識システムは、従来一般的に、例えば銀行の
窓口などに設置され、従って、話者認識を行なうために
は、利用者は、その都度、銀行の窓口等へ出向かなけれ
ばならないという問題があった。
【0005】本発明は、利用者が例えば銀行の窓口など
に出向かずとも、話者認識を行なうことができ、銀行な
どで提供されている入出金,残高照会などのアプリケー
ションを利用することの可能な話者認識システムおよび
話者認識方法を提供することを目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、少なくとも1つの端末と中
央装置とが、情報を送受信可能に設けられており、端末
には、話者の音声を入力し音声信号とする音声入力手段
と、音声信号の特徴量を抽出する特徴抽出手段と、特徴
抽出手段からの話者の音声の特徴量と話者認識用情報と
しての音声特徴量とを照合して話者認識を行なう話者認
識手段とが設けられ、また、中央装置には、話者認識用
情報を管理する話者認識管理手段が設けられており、端
末において話者認識に用いられる話者認識用情報は、中
央装置から端末に転送され、また、端末において得られ
た話者認識結果は、中央装置に転送されるようになって
いることを特徴としている。
【0007】また、請求項2記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末には、話者の音声を入力し音声信号とす
る音声入力手段と、音声信号の特徴量を抽出する特徴抽
出手段と、話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出する類似度算出手段とが
設けられ、また、中央装置には、話者認識用情報を管理
する話者認識管理手段と、端末の類似度算出手段からの
類似度に基づき話者の判定を行なう判定手段とが設けら
れており、端末において、類似度算出に用いられる話者
認識用情報は、中央装置から端末に転送され、また端末
の類似度算出手段で算出された類似度は、端末から中央
装置に転送されるようになっていることを特徴としてい
る。
【0008】また、請求項3記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末には、話者の音声を入力し音声信号とす
る音声入力手段と、音声信号の特徴量を抽出する特徴抽
出手段と、話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出する類似度算出手段と、
類似度算出手段からの類似度に基づき話者の判定を行な
う第1の判定手段とが設けられ、また、中央装置には、
端末の類似度算出手段からの類似度に基づき話者の判定
を行なう第2の判定手段とが設けられており、端末の類
似度算出手段で算出された類似度は、端末の第1の判定
手段に与えられるか、または、端末から中央装置の第2
の判定手段に転送されるようになっていることを特徴と
している。
【0009】また、請求項4記載の発明は、請求項1,
請求項2または請求項3記載の話者認識システムにおい
て、さらに、中央装置から端末には、所定の情報が転送
され、端末に設けられている特徴抽出手段は、中央装置
から提供された情報に基づいて、入力された音声を特徴
量に変換することを特徴としている。
【0010】また、請求項5記載の発明は、請求項1ま
たは請求項2記載の話者認識システムにおいて、話者認
識管理手段によって管理されている話者認識用情報の変
更修正は、決められた端末からの情報でのみなされるこ
とを特徴としている。
【0011】また、請求項6記載の発明は、請求項1ま
たは請求項2記載の話者認識システムにおいて、中央装
置からの1人の話者認識用情報は、1つの端末のみにし
か同時には供給することができないように構成されてい
ることを特徴としている。
【0012】また、請求項7記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量とを照合して話
者認識を行なうようになっており、この際、端末におい
て話者認識に用いられる話者認識用情報は、中央装置か
ら端末に転送され、また、端末において得られた話者認
識結果は、中央装置に転送されることを特徴としてい
る。
【0013】また、請求項8記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量との類似度を算
出するようになっており、この際、端末において類似度
算出に用いられる話者認識用情報は、中央装置から端末
に転送され、また、端末で算出された類似度は、端末か
ら中央装置に転送され、中央装置では、転送された類似
度に基づき話者の判定を行なうことを特徴としている。
【0014】また、請求項9記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量との類似度を算
出するようになっており、端末で算出された類似度は、
端末において話者の判定に用いられるか、または、端末
から中央装置に転送されて中央装置において話者の判定
に用いられることを特徴としている。
【0015】また、請求項10記載の発明は、請求項
7,請求項8または請求項9記載の話者認識方法におい
て、端末が該端末の中だけの処理を行なうのか、外部の
装置との間で情報の送受信を行なうのかに応じて、話者
の判定のしきい値を変化させることを特徴としている。
【0016】
【発明の実施の形態】図1は一般的な話者認識システム
の構成例を示す図である。図1を参照すると、この話者
認識システムは、例えば銀行などにおける本人の確認を
話者認識により行なうためのものであって、利用者の音
声を入力するための音声入力手段(例えば、マイクロフ
ォン)1と、利用者に所定の指定情報を入力させるため
の指定手段(例えばキーボード)2と、音声入力手段1か
ら入力された信号の中から話者の音声の部分のみを音声
区間として検出する音声区間検出部3と、音声区間検出
部3で検出した音声区間内の音声信号から特徴量(特徴
パターン)を抽出する特徴抽出部4と、話者認識を行な
うに先立って話者の音声の標準的な特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部5に予
め登録する登録部6と、利用者(話者)の音声の特徴量
(特徴パターン)と話者認識用情報記憶部5に登録されて
いる標準パターンとを照合し、その類似度に基づいて話
者認識を行なう話者認識部7と、標準パターンの登録を
行なう登録モードと話者認識を行なう認識モードとの切
替を行なう切替部(例えばスイッチ)8とを有している。
【0017】ここで、特徴抽出部4は、音声信号を特徴
量(特徴パターン)として、スペクトルに変換しても良い
し、あるいはLPCケプストラムに変換しても良く、特
徴量の種類については特に限定するものではない。な
お、スペクトルに変換するためには、特徴量変換にはF
FTを用い、また、LPCケプストラムに変換するため
にはLPC分析などを用いるのがよい。
【0018】また、標準パターンの登録時(登録モード
時)において、登録部6は、ある話者が発声した音声に
基づいて特徴抽出部4で抽出された特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部5に登
録する際、図2に示すように、この話者により指定手段
2から入力された指定情報(例えば、この話者の名前や
生年月日,あるいはこの話者の暗証番号など)と対応付
けて、標準パターンを話者認識用情報記憶部5に登録す
ることができる。換言すれば、話者認識用情報記憶部5
には、話者認識に必要な話者認識用の情報が登録される
ようになっており、また、この話者認識用情報記憶部5
には、複数の話者(例えば利用者A,B,C,D,…)の
話者認識用情報が登録可能となっている。
【0019】また、話者認識用情報記憶部5に登録され
る音声の標準パターンとしては、この話者認識システム
の使用形態等に応じて、各利用者(話者)に予め言葉を発
声させたものであっても良いし、各利用者ごとにそれぞ
れ自由に所望の言葉を発声させたものであっても良い。
【0020】また、話者認識部7は、例えば、古井著
「ディジタル音声処理」(東海出版会)などに記載されて
いるように、現在の話者の音声の特徴パターンが話者認
識用情報記憶部5に登録されている複数の話者の標準パ
ターンのうちのどれに最も類似しているかを判定し、登
録されている複数の話者のうちから1人の話者を識別す
る話者識別方式のものであっても良いし、話者認識用情
報記憶部5に登録されている複数の話者の標準パターン
から現在の話者に対応する標準パターンを取り出し、こ
の標準パターンと現在の話者の特徴パターンとを照合
し、その類似度が所定基準値(しきい値)よりも高いか低
いかにより現在の話者が正規の話者本人であるか否かを
判定する話者照合方式のものであっても良い。
【0021】さらに、話者認識部7は、話者認識用情報
記憶部5に登録される音声の標準パターンが各利用者
(話者)に予め言葉を発声させたものである場合には、こ
れに対応した認識を行なうものにすることができ、ま
た、話者認識用情報記憶部5に登録される音声の標準パ
ターンが各利用者ごとにそれぞれ自由に所望の言葉を発
声させたものである場合には、これに対応した認識を行
なうものにすることができる。但し、各利用者(話者)に
予め決められた言葉を発声させて話者認識を行なう場
合、類似の判定基準(しきい値)を各話者に対して全て一
定値にすることができるが、各利用者ごとにそれぞれ所
望の言葉を発声させて話者認識を行なう場合には、類似
の判定基準(しきい値)を各話者ごとに相違させることも
できる。
【0022】以下では、説明の便宜上、話者認識システ
ムは、各利用者(話者)に予め決められた言葉(特定の言
葉)を発声させるものとし、また、話者認識部7では、
話者照合方式の話者認識がなされるとする。なお、話者
認識部7において、話者照合方式の話者認識がなされる
場合、この話者認識時に、利用者(話者)は、指定手段2
から登録モード時に入力した指定情報と同じ指定情報を
入力する必要がある。これにより、話者認識部7では、
話者認識用情報記憶部5に登録されている複数の話者の
標準パターンのうちから現在の話者に対応する標準パタ
ーンを取り出すことができ、この標準パターンと現在の
話者の音声の特徴パターンとの照合を行なうことができ
る。
【0023】このような構成の話者認識システムを利用
者(例えばD)が始めて利用する場合、この利用者(話者)
Dは、先ず、自己の音声を標準パターンとして登録する
必要がある。このため、この利用者Dは、切替部(例え
ばスイッチ)8を操作して、特徴抽出部4を登録部6に
接続し、登録モードに設定する。
【0024】次いで、利用者(話者)Dは、指定手段2か
ら所定の指定情報,例えば(利用者D)を入力する。ま
た、この際、利用者は、予め決められた特定の言葉を発
声する。この音声は、音声入力手段1から入力し、音声
区間検出部3,特徴抽出部4により、特徴量(特徴パタ
ーン)に変換され、この話者の音声の標準パターンとし
て、登録部6に与えられる。
【0025】これにより、登録部6は、この利用者(話
者)Dの音声の標準パターンを指定手段2から入力され
た指定情報と対応付けて、話者認識用情報記憶部5に登
録する。例えば過去に、この話者認識用情報記憶部5に
複数の利用者(異なる利用者)A,B,Cが自己の音声を
標準パターンとして登録しており、現在の利用者Dが上
記のように自己の音声を標準パターンとして登録すると
き、この標準パターンは、話者認識用情報記憶部5に図
2に示すように記憶(登録)される。
【0026】このようにして、この音声の標準パターン
が話者認識用情報記憶部5に記憶されると、利用者D
は、この話者認識システムにより、利用者Dについての
話者認識を行なわせることができる。すなわち、この利
用者Dは、このシステムを用いて、いま利用している利
用者が利用者D本人であるか否かの判定を行なわせるこ
とができる。
【0027】具体的に、利用者Dが以後、このシステム
を利用する場合、利用者Dは、切替部8を操作して、特
徴抽出部4を話者認識部7に接続し、このシステムを認
識モードに設定する。
【0028】次いで、利用者Dは、指定手段2から所定
の指定情報,例えば(利用者D)を入力する。また、この
際、利用者Dは、予め決められた特定の言葉を発声す
る。この音声は、音声入力手段1から入力し、音声区間
検出部3,特徴抽出部4により、特徴量(特徴パターン)
に変換されて、話者認識部7に与えられる。
【0029】これにより、話者認識部7は、指定手段2
から入力された指定情報(利用者D)に対応させて登録さ
れている標準パターンを話者認識用情報記憶部5から取
り出し、この標準パターンと特徴抽出部4からの特徴パ
ターンとを照合して、その類似度を算出し、この類似度
が所定基準値よりも高いか低いかを判定する。この結
果、類似度が低いと判定されたときには、利用者が正規
の話者本人Dではないと判別し、この利用者による利用
を拒絶する。これに対し、類似度が高いと判定されたと
きには、利用者が正規の話者本人Dであると判別し、利
用者による利用を許可する。すなわち、利用者によるア
プリケーション(例えば入出金,残高照会などの処理)の
利用を許可する。
【0030】ところで、図1のような話者認識システム
は、従来一般的に、例えば銀行の窓口などに設置され、
従って、話者認識を行なうためには、利用者は、その都
度、銀行の窓口等へ出向かなければならないという問題
があった。
【0031】本発明は、このような問題を回避し、利用
者が、利用者の自宅において、あるいは利用者の会社等
において、話者認識を行なうことができて、銀行などの
アプリケーション(入出金,残高照会などのアプリケー
ション)等を利用できるようにすることを意図してい
る。
【0032】図3は本発明に係る話者認識システムの第
1の構成例を示す図である。この第1の構成例では、話
者認識システムは、少なくとも1つの端末31−1〜3
1−nと中央装置32とが、情報を送受信可能に設けら
れている(例えば有線あるいは無線の通信手段33−1
〜33−nによって通信可能に設けられている)。ここ
で、各端末31−1〜31−nは、説明の便宜上、同じ
構成のものであるとする。
【0033】図3の構成例では、図1の構成例におい
て、音声入力手段1(あるいは、さらに、音声区間検出
部3),特徴抽出部4,話者認識部7が端末側に設けら
れ、また、話者認識管理手段10が中央装置32に設け
られたものとなっている。なお、ここで、話者認識管理
手段10は、図1の話者認識用情報記憶部5,登録部6
の機能を有し、さらに、これに話者認識全体の管理,制
御機能をももたせることもできる。また、図1の切替部
8の機能は、端末側にもたせても良いし、中央装置32
側にもたせても良いが、以下では、便宜上、切替部8の
機能は、端末側に設けられているものとする。
【0034】図4は図3の話者認識システムの具体例を
示す図である。なお、図4では、簡単のため、1つの端
末31−1だけが図示されているが、他の端末31−2
〜31−nも、端末31−1と同様の構成のものである
とする。図4を参照すると、端末31−1には、音声入
力手段1,指定手段2,音声区間検出部3,特徴抽出部
4,話者認識部7,切替部8が設けられ、さらに、端末
31−1には、中央装置32との間で情報を通信手段
(例えば電話回線あるいは無線)33−1を介して送受信
するための送受信インタフェース部34−1が設けられ
ている。また、中央装置32には、話者認識用情報記憶
部5,登録部6が設けられ、さらに中央装置32には、
各端末31−1〜31−nとの間で情報を送受信するた
めの送受信インタフェース部35が設けられている。
【0035】ここで、各端末31−1〜31−nとして
は、例えばパソコン(マイクロフォン,A/D変換など
の音声取込機能を備えたパソコン)を用いることが可能
であって、各端末31−1〜31−nの利用者は、自己
の端末を、例えば自宅や会社において、保有することが
できる。より具体的に、各端末31−1〜31−nに
は、既存のパソコン(パソコン通信機能を備えたパソコ
ン)を用いることができ、この場合、図4の構成例にお
いて、端末31−1の送受信インタフェース部34−1
は、例えば、パソコンに内蔵されているモデムとして実
現され、また、音声入力手段1は、パソコンに設けられ
ているマイクロフォンで実現され、指定手段2はパソコ
ンのコンソールで実現され、音声区間検出部3,特徴抽
出部4,話者認識部7は、パソコンに搭載されるソフト
ウェア,例えば、音声区間検出ソフト,特徴抽出ソフ
ト,話者認識ソフトとして実現される。
【0036】また、図4の構成例において、中央装置3
2の送受信インタフェース35には、例えば交換器を用
いることができる。また、登録部6は、この中央装置に
搭載される登録ソフトとして実現され、話者認識用情報
記憶部5には、中央装置32に設けられているメモリを
用いることができる。
【0037】また、図4の構成例において、端末側に設
けられている切替部8は、例えば、端末側の利用者によ
って操作されるスイッチとして構成できる。
【0038】ここで、話者認識用情報記憶部5には、話
者認識用情報として、例えば、図2に示したように、指
定情報と対応付けて標準パターンが記憶され、この場
合、端末側において話者認識がなされるときに、その旨
の指示が端末から中央装置32に転送されると、中央装
置32側では、話者認識用情報記憶部5に記憶されてい
る話者認識用情報を読出して、これを端末に伝送するよ
うになっている。これにより、端末側の話者認識部7
は、ある話者の音声の特徴パターンを、中央装置32か
ら伝送された話者認識用情報の標準パターンと照合し
て、この話者の特徴パターンと標準パターンとの類似度
を求めて、話者認識を行なうことができる。より具体的
には、端末側において例えば話者照合方式の話者認識が
なされるときに、中央装置32からは、この端末の指定
手段2からの指定情報に対応した標準パターンを話者認
識用情報として端末に伝送できる。
【0039】このような話者認識システムでは、標準パ
ターンの登録(さらには標準パターンの変更あるいは更
新),話者認識を行なうために、利用者は、利用者の家
庭や会社等に設置されている端末を操作することによっ
て、例えば銀行の窓口などに設置されている中央装置
(例えば話者認識装置ユニット)に対し、標準パターンの
登録操作,話者認識操作を、前述したと同様にして行な
うことができる。
【0040】例えば、標準パターンの登録を行なうと
き、利用者は、自己の端末,例えば31−1の切替部8
を操作して、特徴抽出部4が送受信インタフェース34
−1と直接接続するよう切替設定する。次いで、この利
用者が、指定手段2から所定の指定情報,例えば(利用
者D)を入力すると、この指定情報は、通信手段33−
1を介して中央装置32に伝えられる。また、この際、
利用者Dは、予め決められた特定の言葉を発声する。こ
の音声は、音声入力手段1から入力し、例えば音声区間
検出部3から音声信号として出力され、特徴抽出部4で
特徴量に変換されて、通信手段33−1を介して中央装
置32に伝送される。これにより、中央装置32の登録
部6では、伝送された指定情報に対応させて、伝送され
た特徴量(特徴パターン)信号を標準パターンとして、話
者認識用情報記憶部5に登録することができる。
【0041】また、この話者認識システムにおいて、話
者認識を行なうとき、利用者は、自己の端末,例えば3
1−1の切替部8を話者認識部7側に切替設定する。次
いで、この利用者が、指定手段2から所定の指定情報,
例えば(利用者D)を入力すると、この指定情報は、通信
手段33−1を介して中央装置32に伝えられ、これに
より、中央装置32からは、話者認識用情報として、例
えば、この指定情報に対応した標準パターン,例えば利
用者Dの標準パターンが話者認識用情報記憶部5から読
出されて、端末に伝送される。次いで、端末の利用者D
は、予め決められた特定の言葉を発声する。この音声
は、音声入力手段1から入力し、例えば音声区間検出部
3から音声信号として出力され、特徴抽出部4により特
徴量(特徴パターン)に変換されて、話者認識部7に与え
られる。
【0042】これにより、端末の話者認識部7は、中央
装置32から伝送された話者認識用情報(すなわち上記
例では標準パターン)と特徴抽出部4からの特徴パター
ンとを照合して、その類似度を算出し、この類似度が所
定基準値(しきい値)よりも高いか低いかを判定し(すな
わち、利用者が正規の利用者か否かを判定し)、この判
定結果を中央装置32に伝送する。中央装置32では、
端末からの判定結果に基づいて、アプリケーションを許
可するか否かを決定する。
【0043】すなわち、中央装置32は、類似度が低い
との判定結果が伝送されたときには、利用者が正規の話
者本人Dではないと判別し、この利用者による利用を拒
絶する。これに対し、類似度が高いとの判定結果が伝送
されたときには、利用者が正規の話者本人Dであると判
別し、利用者によるアプリケーション(例えば入出金,
残高照会などの処理)の利用を許可する。
【0044】このように、この話者認識システムでは、
利用者の自宅あるいは会社等に設置されている端末(例
えばパソコン)を用いて、話者認識を行なわせ、その判
定結果を、銀行などに設置されている中央装置(例えば
話者認識装置ユニット)に伝送し、中央装置において、
この判定結果に基づき、本人であることが確認された
後、入出金,残高照会などのアプリケーションを利用す
ることができる。すなわち、利用者は、銀行等にその都
度出向かずとも、自宅や会社などに設置されている端末
に話者認識を行なわせ、銀行等のアプリケーションを利
用することができる。
【0045】また、この構成例では、利用者側の端末と
して、既存のパソコン(パソコン通信機能を備えたパソ
コン)を用いることができる。
【0046】さらに、この構成例では、話者認識部7か
らの判定結果を通信手段(例えば電話回線や無線など)を
介して中央装置32に送信するようにしているので、通
信手段(電話回線や無線など)の品質や通信環境が多少悪
い場合でも、判定結果信号は、影響を受けにくく、従っ
て、中央装置32では、伝送された判定結果に基づき、
利用者にアプリケーションを利用させるか否かの判断を
正しく行なうことができる。また、判定結果信号は、デ
ータ量が極めて少なく、伝送時間を著しく短縮すること
ができる。
【0047】さらに、この構成例では、端末側に、音声
区間検出部3,特徴抽出部4,話者認識部7が設けられ
ていることによって、利用者は、自己の声の特性に適合
するよう、音声区間検出部3の特性,特徴抽出部4の特
性などを管理することができる。例えば、自己の声の音
量や音質に合わせて、音声区間検出の感度(声の大きさ
のしきい値)などを調整したりすることができる。
【0048】なお、一般に、話者認識部7は、特徴パタ
ーンと標準パターンとの類似度を算出する機能と算出さ
れた類似度がしきい値よりも高いか低いかを判定する機
能とを有し、これらの機能を、1つのブロックで構成す
ることもできるが、類似度算出部,判定部として別々の
ブロック(ソフト)として構成することもできる。
【0049】この場合には、例えば、図5に示すよう
に、端末31−1側に、類似度算出部60を設け、中央
装置32側に、判定部62を設けて、端末の類似度算出
部60で算出された特徴パターンと標準パターンとの類
似度を、通信手段33を介して中央装置の判定部62に
伝送し、中央装置の判定部62において話者の判定を行
なうように構成することもできる。なお、この場合に
も、図3,図4の構成例と同様に、端末において、類似
度算出に用いられる話者認識用情報は、中央装置から端
末に転送することができる。
【0050】また、あるいは、図6に示すように、端末
31−1側に、類似度算出部60,判定部61を設け、
また、中央装置32側に、端末の判定部61とは別に、
判定部62を設けて、端末の類似度算出部60で算出さ
れた特徴パターンと標準パターンとの類似度を、場合に
応じて、端末31−1の判定部61に与えて端末側にお
いて話者の判定を行なうか、中央装置32の判定部62
に与えて中央装置側で話者の判定を行なうかを選択する
ように構成することもできる。すなわち、図6の構成例
では、端末31−1内において、類似度算出部60と判
定部61とにより、第1の話者認識部が構成され、ま
た、中央装置32側では、端末の類似度算出部60と中
央装置の判定部62とにより、第2の話者認識部が構成
されており、第1の話者認識部で話者認識を行なうか、
第2の話者認識部で話者認識を行なうかを選択可能にな
っている。
【0051】なお、図6の構成例においても、話者認識
用情報(標準パターンなど)については、中央装置32の
話者認識管理手段10だけにより一括管理し、端末内だ
けの処理を行なう場合にも、中央装置32から転送させ
ることもできるが、中央装置32に設定されている話者
認識用情報(標準パターンなど)とは別の話者認識用情報
(標準パターンなど)を端末にも用意し、端末内だけで話
者認識を行なう場合には、標準パターンを中央装置から
伝送させることなく、端末内に設けられている話者認識
用情報(標準パターンなど)を用いることもできる。
【0052】ところで、一般に、正規の利用者本人が話
者認識のために発声した音声の特徴量(特徴パターン)と
この利用者本人によって予め登録されている音声の特徴
量(標準パターン)との間には、時間的なへだたりがある
ため、同じ発声者の音声であっても、特徴パターンが標
準パターンと完全に一致することは稀であり、通常は、
いくらか相違している。従って、端末の話者認識部7に
おいて、特徴パターンと標準パターンとの類似度に対す
る判定のしきい値は、適宜なものに設定されている必要
がある。
【0053】しかしながら、この判定のしきい値を高く
設定すると、話者認識の精度を高めることができるが、
反面、正規の利用者本人の音声であるにもかかわらず、
正規の利用者本人ではないと判定されてしまう確率が高
くなり、本人が利用しにくくなってしまう。一方、この
判定のしきい値を低く設定すると、正規の利用者本人以
外の他人の音声を正規の利用者本人の音声であると誤認
識する確率が高くなり、正規の利用者本人の情報が他人
に盗まれ、悪用される恐れが増加する。従って、しきい
値を常に一定の適宜なものに設定して話者認識を行なう
のは、難かしい場合がある。
【0054】本発明は、このような互いに相反する問題
を良好に解決する話者認識システムおよび話者認識方法
をさらに提供することを意図しており、このような問題
を解決するため、本発明では、場合に応じて、判定のし
きい値,すなわち認識精度を可変に設定して、話者認識
を行なうようにしている。
【0055】より具体的に、この端末(例えばパソコン)
に搭載されている話者認識機能をこの端末の中だけで利
用する場合(例えば、この端末の立ち上げ操作を行なう
ような、端末内だけのアプリケーションに利用する場
合)には、例えば通信回線等を介して他人に盗まれる恐
れが少ないので、判定のしきい値を低く設定して(認識
精度を低下させて)、正規の利用者本人の音声が、利用
者本人の音声であると判定される確率を高めるようにす
る。
【0056】また、この端末(例えばパソコン)に搭載さ
れている話者認識機能を、他の装置(例えば他の端末や
中央装置)と関連させてあるいは協働させて利用する場
合(例えば対外的に利用するような場合)には、例えば通
信回線等を介して他人に盗まれる恐れがあるので、判定
のしきい値を高く設定し(認識精度を高め)、これによ
り、正規の利用者本人の情報が他人に盗まれるのを防止
する。
【0057】なお、本発明のこのような機能(認識精度
を可変にする機能)は、図3,図4の構成例において、
例えば、1つの端末,例えば31−1内に複数のしきい
値を用意しておき、この端末の処理に応じて(例えば、
この端末がこの端末の中だけの処理を行なうのか、外部
の装置との間で情報の送受信を行なうのかに応じて)、
複数のしきい値のうちから最適なものを話者認識部7が
選択して用いることで、実現できる。
【0058】あるいは、図3,図4の構成例において、
端末内に全てのしきい値を用意しておくかわりに、例え
ば、端末の中だけの処理用のしきい値については、この
端末内に用意しておき、外部の装置との間での処理用の
しきい値については、この端末が外部の装置(例えば中
央装置)と通信接続されたときに、例えば中央装置の話
者認識管理手段10から伝送させることもできる。
【0059】例えば、この端末において話者認識を行な
うとき、この端末に、中央装置の話者認識管理手段10
から、この端末の利用者用の標準パターンを転送する
際、この標準パターンとともに、付随情報として、この
端末の中央装置との間での処理用のしきい値を転送させ
るようにすることもできる。
【0060】この場合には、話者,例えば利用者Dが、
例えば端末31−1から(利用者D)であることを入力す
ると、電話線あるいは無線等の通信手段を介して、中央
装置の話者認識管理手段10へ伝達され、これにより、
中央装置の話者認識管理手段10では、その話者に対応
した音声標準パターンと、付随情報として類似度のしき
い値とを、この端末31−1へ返送し、端末31−1で
は、話者認識部7において、本人であるか否かを判定す
るに際し、中央装置32の管理手段10から送られたし
きい値を用いることができる。これにより、中央装置3
2の話者認識管理手段10によって、端末31−1の認
識精度を制御することもできる。
【0061】このように、図3,図4の構成例におい
て、しきい値を場合に応じて、変えて用いることで(例
えば、端末内だけの処理の場合は、類似度のしきい値と
してより低いしきい値を用い、外部との装置との間での
処理の場合は、類似度のしきい値としてより高い値を用
いることで)、例えば、同じパソコンを端末として使っ
ていても、そのパソコンの中だけの認識する場合は、パ
ソコンの中で設定された緩やかな判定で、また、他の装
置とつながった時には、厳しい判定で、話者認識を実現
することができる。
【0062】また、認識精度を可変にする機能は、図6
の構成例では、例えば、端末の判定部61において用い
られるしきい値については、端末内において用意し、ま
た、中央装置32の判定部62において用いられるしき
い値については、中央装置32内において用意すること
で、実現できる。
【0063】すなわち、図6の構成では、端末の利用者
が、この端末内だけのアプリケーションのために話者認
識を行なおうとする場合には、類似度算出部60から算
出される類似度をこの端末内の判定部61に与えて判定
させるように、この端末に対して指示を与える。
【0064】この場合、この端末の利用者が話者認識の
ための音声を発生すると、この音声特徴量(特徴パター
ン)は、この端末の類似度算出部60で標準パターン(例
えば、この端末内に予め用意された標準パターン)との
類似度が算出され、この類似度は、この端末の話者認識
部7の判定部61に与えられる。判定部61において
は、この端末内に予め用意された所定のしきい値に対し
て類似度が高いか低いかを判定することで、話者認識を
行なうことができる。
【0065】一方、端末の利用者が、中央装置32のア
プリケーションを利用するために話者認識を行なおうと
する場合には、この端末から中央装置32(話者認識管
理手段10)に所定の指示を与える。これにより、中央
装置32は、端末からの指示に従って、例えば、標準パ
ターンをこの端末へ送る。次いで、この端末の利用者が
話者認識のための音声を発生すると、この音声特徴量
(特徴パターン)は、この端末の類似度算出部60で標準
パターン(例えば中央装置から伝送された標準パターン)
との類似度が算出され、この類似度は、中央装置32に
伝送され、中央装置32の判定部62に与えられる。中
央装置32の判定部62においては、中央装置32に予
め用意された所定のしきい値に対して類似度が高いか低
いかにより、本人か否かを判定する。
【0066】このように、図6の構成例では、端末内の
アプリケーションの利用の場合は、端末内の判定部61
で話者認識(判定)を行なわせ、中央装置のアプリケーシ
ョンの利用の場合は、中央装置の判定部62で話者認識
(判定)を行なわせることができ、端末の判定部61での
判定基準(しきい値)と中央装置32の判定部62での判
定基準(しきい値)とを、端末と中央装置32とで、それ
ぞれ独立に設定できるので(例えば、判定部61では判
定基準を緩く(しきい値を低く)設定し、判定部62では
判定基準を厳しく(しきい値を高く)設定できるので)、
場合に応じて、認識精度を相違させることができる。す
なわち、図3,図4の構成例と同様に、例えば、同じパ
ソコンを端末として使っていても、そのパソコンの中だ
けの認識する場合は、パソコンの中で設定された緩やか
な判定で、また、他の装置とつながった時には、厳しい
判定で、話者認識を実現することができる。
【0067】このように、本発明では、例えば、同じパ
ソコンを端末として使っていても、そのパソコンの中だ
けの認識する場合は、パソコンの中で設定された穏やか
な判定で、また、他の装置とつながった時には、厳しい
判定で、話者認識を行なうことが可能となる。すなわ
ち、同じパソコンを端末として使っていても、そのパソ
コンの中だけの認識と、他の装置とつながった場合と
で、認識精度を変えることのできるような話者認識を実
現できる。
【0068】なお、上述の各構成例において、しきい値
は、話者認識用情報とともに記憶されても良い。例えば
図3,図4の構成例において、例えば、中央装置32の
話者認識用情報記憶部5には、図7に示すように、標準
パターンの他に、類似度のしきい値などの各種の付随情
報が記憶されても良い。このときには、例えば、端末側
の話者認識部7は、ある話者の音声の特徴パターンを、
中央装置32の話者認識用情報記憶部5から読出され伝
送された標準パターンと照合して、この話者の特徴パタ
ーンと標準パターンとの類似度を求めたとき、この類似
度が例えば上記標準パターンとともに中央装置32の話
者認識用情報記憶部5から読出され伝送された付随情
報,すなわち、しきい値よりも高いか低いかにより、こ
の話者が本人であるか否かを判別することができる。
【0069】また、図3乃至図5の構成例において、例
えば話者認識用情報記憶部5に図7に示すように付随情
報として記憶されるしきい値としては、図7のように登
録されている各標準パターンごとに異なるしきい値を設
定することもできるし、登録されている全ての標準パタ
ーンに対して、同じ(一定の)しきい値を設定することも
できる。しきい値として、登録されている全ての標準パ
ターンに対して同じ(一定の)ものを用いる場合は、話者
認識用情報記憶部5(1つのメモリ)の中に1つのしきい
値だけを記憶しておいて共通に使用することができる。
同様に、図6の構成例においても、例えば端末側に設定
されるしきい値と中央装置側に設定されるしきい値との
それぞれのしきい値として、登録されている各標準パタ
ーンごとに異なるしきい値を設定することもできるし、
登録されている全ての標準パターンに対して、同じ(一
定の)しきい値を設定することもできる。
【0070】また、上述の各構成例では、利用者は、自
分の端末以外の端末をも利用することができるが、反
面、これにより、他人が、本人の知らないところで利用
する可能性を高めることにもなる。話者認識において、
本人か否かを判定するために特に重要なものは、話者認
識用情報(特に音声の標準パターン)であり、これが悪意
で書き換えられたりすると、以後、本人が利用すること
ができなくなったり、あるいは、他人によって本人の情
報が悪用されたりすることになる。
【0071】そこで、話者認識用情報の変更修正が、決
められた端末からの情報でのみ行なわれるよう、話者認
識システムを構成することもできる。例えば、自宅の端
末などを指定して、音声の標準パターンの書き換え,更
新等を、利用者の自宅の端末からのみ行なうことができ
るように構成することもできる。これによって、他人に
よる話者認識用情報の変更修正(書き換え)などを防止す
ることができる。
【0072】また、上述の各構成例において、話者認識
用情報記憶部5内の話者認識用情報をフラグ管理するよ
うにすることもできる。例えば、現在使用している話者
認識用情報(標準パターン)と使用していない話者認識用
情報(標準パターン)とを区別するように、話者認識用情
報(標準パターン)に“0”または“1”のフラグを設定
して、これを管理することもできる。この場合には、こ
のフラグ管理によって、1人の話者認識用情報(標準パ
ターン)を同時に1ヵ所のみにしか供給することができ
ないようにし、使用中の話者認識用情報(標準パターン)
をそれ以外の者が使用できないようにすることもでき
る。これによって、本人が使用中の場合、他人が使用す
ることを防止できるとともに、他人が使用している時
に、本人が使用した場合、この本人は、誰かが自分の音
声標準パターンを利用していることがわかり、迅速に対
策をとることができる。
【0073】また、例えば、図5,図6の構成例では、
端末側に、音声区間検出部3,特徴抽出部4,類似度算
出部60が設けられていることによって、利用者は、自
己の声の特性に適合するよう、音声区間検出部3の特
性,特徴抽出部4の特性を管理することができるという
利点を有しているが、その反面、音声区間検出,特徴抽
出,類似度算出等の処理と話者判定(しきい値判定)の処
理とが、端末側と中央装置側とで分散してなされ、ま
た、分散してなされることがあるため、中央装置側の管
理者は、正規の利用者を正規の利用者と認めなかった
り、他人を正規の利用者と認識したりする、いわゆる誤
認識が発生する場合に、この原因を中央装置側だけで一
括管理することができないことがある。例えば、この原
因が、端末の音声区間検出,特徴抽出,類似度算出によ
るものか、中央装置の話者判定(しきい値)によるものか
を、中央装置側だけで判別することができないことがあ
る。
【0074】誤認識を生じさせる原因としては、例え
ば、話者が発生した言葉の語頭や語尾が弱く、音声区間
検出が正常に行なわれず、特徴パターン上で、この部分
が欠落していることがあり、話者がこれに気付かずに何
回言い直しても同じような結果になってしまうという場
合があり、このときには、何回やり直しても正しい認識
ができない。
【0075】このような問題を回避するため、例えば上
述の各構成例において、例えば中央装置32(例えば話
者認識管理手段10)から端末,例えば31−1に所定
の情報を提供し、端末31−1の音声区間検出部3や特
徴抽出部4などは、中央装置32から提供された情報に
基づいて、音声区間検出や特徴量変換などを行なうこと
も可能である。
【0076】例えば、中央装置32側からは、情報とし
て、例えば音声区間検出の感度指示情報を提供すること
ができる。
【0077】この場合、端末側において、利用者が当初
音声を発声し、この音声が音声区間検出されるときに、
音声区間と判定された前後に、例えば0.5秒程度のデ
ータを付加し、このデータをも含めた音声区間内の音声
信号を、そのまま端末側のファイル(図示せず)に保存す
る。このようにして、端末側で利用者の音声信号がファ
イルに保存された後、これを特徴量(特徴パターン)に変
換して、類似度算出部60で類似度を算出し、中央装置
の判定部62において、類似度がしきい値よりも高いか
低いかにより話者の判定を行なわせる。この結果、利用
者本人ではないと判定された場合、中央装置32側で
は、例えば、話者認識用情報記憶部5に付随情報として
記憶されている音声区間検出の感度(声の大きさのしき
い値等)を高めて、これを端末側に、情報として提供(送
信)し、端末側において、ファイルに保存されている音
声信号に対して再度、音声区間検出を行なわせる。ま
た、話者認識用情報記憶部5に付随情報として記憶され
ている音声区間検出の感度を下げて、これを端末側に、
情報として提供(送信)し、端末側において、ファイルに
保存されている音声信号に対して再度、音声区間検出を
行なわせる。
【0078】このようにして、音声区間検出の感度を高
めた場合と下げた場合とで、それぞれ話者認識を行な
い、いずれかで正しい話者であることが判定されれば、
この利用者を正しい話者であると認識することができ
る。このように、音声区間検出の感度を高めることによ
って、例えば話者の声が小さい場合に、音声区間が正し
く検出されないという事態(検出漏れを起こすという事
態)が生じていたのを、改善することができ、また、音
声区間検出の感度を下げることによって、例えば話者の
音声の前後に雑音が生じるような場合に、音声区間検出
部が実際よりも長い音声を検出してしまうという事態が
生じていたのを、改善することができる。
【0079】上述の例では、中央装置32側から端末側
に提供する情報として、音声区間検出の感度を例にとっ
たが、特徴量変換のサンプリング周波数を情報として端
末側に提供することもでき、この場合には、端末側で
は、中央装置32からの情報によって特徴量変換のサン
プリング周波数を変えることができる。さらに、中央装
置32側から端末側には、上記以外の種々の情報を提供
することもできる。
【0080】このように、端末に、中央装置から所定情
報を与えることで、必要に応じて、話者認識のための音
声区間検出や特徴抽出,話者認識などを、中央装置側か
ら管理,制御することができる。
【0081】上述の各構成例の説明では、話者認識を行
なう場合について述べたが、標準パターンの新規登録や
変更,更新についても、端末側から同様にして行なうこ
とができる。なお、中央装置側において、話者認識に用
いたデータによって、自動的に標準パターンを更新する
機能が備わっている場合は、端末側からの操作を行なわ
ずとも、中央装置側で、自動的に標準パターンの更新を
行なうことができる。
【0082】また、上述した各構成例においては、特徴
パターンと標準パターンとの類似度を、これらが類似し
ている度合として捉えているが、これらの相違の度合と
して捉えることもできる。類似度を相違の度合として捉
える場合には、類似の度合として捉える場合と判定の仕
方が逆になり、類似度(相違度)がしきい値よりも高い場
合に、話者本人でないと判定し、類似度(相違度)がしき
い値よりも低い場合に、話者本人であると判定する。
【0083】また上述の例では、中央装置から標準パタ
ーンを転送するときに、これとともに類似度のしきい値
も転送するようにしたが、これらを別々に(異なるタイ
ミングで)転送することもできる。
【0084】また、上述の各構成例では、1つの端末と
中央装置32との間で情報の送受信がなされる場合を例
にとって説明したが、例えば、1人の利用者が端末を2
台持っているような場合、標準パターンの登録機能を例
えば端末31−1にもたせ、話者認識の機能を例えば端
末31−2にもたせて、端末31−1で標準パターンな
どの情報を登録して、使っている標準パターンなどの情
報を端末31−1から端末31−2に送って、端末31
−2での認識に使用することもできる。
【0085】また、上述の各構成例では、音声区間検出
部3の後に、特徴抽出部4が設けられているが、必要に
応じ、音声区間検出部3の前に、特徴抽出部4が設けら
れるように構成することも可能である。
【0086】
【発明の効果】以上に説明したように、請求項1乃至請
求項10記載の発明によれば、例えば利用者の自宅ある
いは会社等に設置されている端末を用いて、話者認識を
行なわせ、例えば銀行などの入出金,残高照会などのア
プリケーションを利用することができる。また、例え
ば、同じパソコンを端末として使っていても、そのパソ
コンの中だけの認識する場合は、パソコンの中で設定さ
れた緩やかな判定で、また、他の装置とつながった時に
は、厳しい判定で話者認識を実現できる。
【図面の簡単な説明】
【図1】一般的な話者認識システムの構成例を示す図で
ある。
【図2】話者認識用情報記憶部の構成例を示す図であ
る。
【図3】本発明に係る話者認識システムの構成例を示す
図である。
【図4】図3の話者認識システムの具体例を示す図であ
る。
【図5】本発明に係る話者認識システムの他の構成例を
示す図である。
【図6】本発明に係る話者認識システムの他の構成例を
示す図である。
【図7】話者認識用情報記憶部の構成例を示す図であ
る。
【符号の説明】
1 音声入力手段 2 指示手段 3 音声区間検出部 4 特徴抽出部 5 話者認識用情報記憶部 6 登録部 7 話者認識部 8 切替部 10 話者認識管理手段 31 端末 32 中央装置 33 通信手段 60 類似度算出部 61 判定部 62 判定部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末には、話
    者の音声を入力し音声信号とする音声入力手段と、音声
    信号の特徴量を抽出する特徴抽出手段と、前記特徴抽出
    手段からの話者の音声の特徴量と話者認識用情報として
    の音声特徴量とを照合して話者認識を行なう話者認識手
    段とが設けられ、また、前記中央装置には、話者認識用
    情報を管理する話者認識管理手段が設けられており、前
    記端末において話者認識に用いられる話者認識用情報
    は、前記中央装置から端末に転送され、また、前記端末
    において得られた話者認識結果は、中央装置に転送され
    るようになっていることを特徴とする話者認識システ
    ム。
  2. 【請求項2】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末には、話
    者の音声を入力し音声信号とする音声入力手段と、音声
    信号の特徴量を抽出する特徴抽出手段と、話者の音声の
    特徴量と話者認識用情報としての音声特徴量との類似度
    を算出する類似度算出手段とが設けられ、また、前記中
    央装置には、話者認識用情報を管理する話者認識管理手
    段と、前記端末の類似度算出手段からの類似度に基づき
    話者の判定を行なう判定手段とが設けられており、前記
    端末において、類似度算出に用いられる話者認識用情報
    は、中央装置から端末に転送され、また端末の類似度算
    出手段で算出された類似度は、端末から中央装置に転送
    されるようになっていることを特徴とする話者認識シス
    テム。
  3. 【請求項3】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末には、話
    者の音声を入力し音声信号とする音声入力手段と、音声
    信号の特徴量を抽出する特徴抽出手段と、話者の音声の
    特徴量と話者認識用情報としての音声特徴量との類似度
    を算出する類似度算出手段と、類似度算出手段からの類
    似度に基づき話者の判定を行なう第1の判定手段とが設
    けられ、また、前記中央装置には、前記端末の類似度算
    出手段からの類似度に基づき話者の判定を行なう第2の
    判定手段が設けられており、前記端末の類似度算出手段
    で算出された類似度は、端末の第1の判定手段に与えら
    れるか、または、端末から中央装置の第2の判定手段に
    転送されるようになっていることを特徴とする話者認識
    システム。
  4. 【請求項4】 請求項1,請求項2または請求項3記載
    の話者認識システムにおいて、さらに、前記中央装置か
    ら端末には、所定の情報が転送され、前記端末に設けら
    れている特徴抽出手段は、中央装置から提供された情報
    に基づいて、入力された音声を特徴量に変換することを
    特徴とする話者認識システム。
  5. 【請求項5】 請求項1または請求項2記載の話者認識
    システムにおいて、前記話者認識管理手段によって管理
    されている話者認識用情報の変更修正は、決められた端
    末からの情報でのみなされることを特徴とする話者認識
    システム。
  6. 【請求項6】 請求項1または請求項2記載の話者認識
    システムにおいて、中央装置からの1人の話者認識用情
    報は、1つの端末のみにしか同時には供給することがで
    きないように構成されていることを特徴とする話者認識
    システム。
  7. 【請求項7】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末において
    は、話者の音声が入力されると、該音声信号の特徴量を
    抽出し、該話者の音声の特徴量と話者認識用情報として
    の音声特徴量とを照合して話者認識を行なうようになっ
    ており、この際、前記端末において話者認識に用いられ
    る話者認識用情報は、前記中央装置から端末に転送さ
    れ、また、前記端末において得られた話者認識結果は、
    中央装置に転送されることを特徴とする話者認識方法。
  8. 【請求項8】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末において
    は、話者の音声が入力されると、該音声信号の特徴量を
    抽出し、該話者の音声の特徴量と話者認識用情報として
    の音声特徴量との類似度を算出するようになっており、
    この際、前記端末において類似度算出に用いられる話者
    認識用情報は、中央装置から端末に転送され、また、端
    末で算出された類似度は、端末から中央装置に転送さ
    れ、中央装置では、転送された類似度に基づき話者の判
    定を行なうことを特徴とする話者認識方法。
  9. 【請求項9】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末において
    は、話者の音声が入力されると、該音声信号の特徴量を
    抽出し、該話者の音声の特徴量と話者認識用情報として
    の音声特徴量との類似度を算出するようになっており、
    端末で算出された類似度は、前記端末において話者の判
    定に用いられるか、または、前記端末から中央装置に転
    送されて中央装置において話者の判定に用いられること
    を特徴とする話者認識方法。
  10. 【請求項10】 請求項7,請求項8または請求項9記
    載の話者認識方法において、前記端末が該端末の中だけ
    の処理を行なうのか、外部の装置との間で情報の送受信
    を行なうのかに応じて、前記話者の判定のしきい値を変
    化させることを特徴とする話者認識方法。
JP30655695A 1995-10-24 1995-10-31 話者認識システムおよび話者認識方法 Expired - Fee Related JP3522421B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP30655695A JP3522421B2 (ja) 1995-10-31 1995-10-31 話者認識システムおよび話者認識方法
US08/733,394 US5893057A (en) 1995-10-24 1996-10-18 Voice-based verification and identification methods and systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30655695A JP3522421B2 (ja) 1995-10-31 1995-10-31 話者認識システムおよび話者認識方法

Publications (2)

Publication Number Publication Date
JPH09127973A true JPH09127973A (ja) 1997-05-16
JP3522421B2 JP3522421B2 (ja) 2004-04-26

Family

ID=17958477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30655695A Expired - Fee Related JP3522421B2 (ja) 1995-10-24 1995-10-31 話者認識システムおよび話者認識方法

Country Status (1)

Country Link
JP (1) JP3522421B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017507352A (ja) * 2014-06-24 2017-03-16 グーグル インコーポレイテッド 発話者の検証のための動的な閾値
JP2017517027A (ja) * 2014-07-18 2017-06-22 グーグル インコーポレイテッド コロケーション情報を使用した話者照合
US10134398B2 (en) 2014-10-09 2018-11-20 Google Llc Hotword detection on multiple devices
US10497364B2 (en) 2017-04-20 2019-12-03 Google Llc Multi-user authentication on a device

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9972323B2 (en) 2014-06-24 2018-05-15 Google Llc Dynamic threshold for speaker verification
JP2017507352A (ja) * 2014-06-24 2017-03-16 グーグル インコーポレイテッド 発話者の検証のための動的な閾値
JP2017517027A (ja) * 2014-07-18 2017-06-22 グーグル インコーポレイテッド コロケーション情報を使用した話者照合
US10147429B2 (en) 2014-07-18 2018-12-04 Google Llc Speaker verification using co-location information
US11557299B2 (en) 2014-10-09 2023-01-17 Google Llc Hotword detection on multiple devices
US10134398B2 (en) 2014-10-09 2018-11-20 Google Llc Hotword detection on multiple devices
US11915706B2 (en) 2014-10-09 2024-02-27 Google Llc Hotword detection on multiple devices
US10593330B2 (en) 2014-10-09 2020-03-17 Google Llc Hotword detection on multiple devices
US10909987B2 (en) 2014-10-09 2021-02-02 Google Llc Hotword detection on multiple devices
US10522137B2 (en) 2017-04-20 2019-12-31 Google Llc Multi-user authentication on a device
US11238848B2 (en) 2017-04-20 2022-02-01 Google Llc Multi-user authentication on a device
US11087743B2 (en) 2017-04-20 2021-08-10 Google Llc Multi-user authentication on a device
US11721326B2 (en) 2017-04-20 2023-08-08 Google Llc Multi-user authentication on a device
US11727918B2 (en) 2017-04-20 2023-08-15 Google Llc Multi-user authentication on a device
US10497364B2 (en) 2017-04-20 2019-12-03 Google Llc Multi-user authentication on a device

Also Published As

Publication number Publication date
JP3522421B2 (ja) 2004-04-26

Similar Documents

Publication Publication Date Title
US5719921A (en) Methods and apparatus for activating telephone services in response to speech
US20180047397A1 (en) Voice print identification portal
EP1019904B1 (en) Model enrollment method for speech or speaker recognition
CA2549092C (en) System and method for providing improved claimant authentication
US6691089B1 (en) User configurable levels of security for a speaker verification system
US5913196A (en) System and method for establishing identity of a speaker
JP4588069B2 (ja) 操作者認識装置、操作者認識方法、および、操作者認識プログラム
US20020152078A1 (en) Voiceprint identification system
CN107395352A (zh) 基于声纹的身份识别方法及装置
US20010003173A1 (en) Method for increasing recognition rate in voice recognition system
JP4573792B2 (ja) ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム
AU2022287646B2 (en) Audio-based access control
JPH0354600A (ja) 不明人物の同一性検証方法
US7415410B2 (en) Identification apparatus and method for receiving and processing audible commands
US20170178632A1 (en) Multi-user unlocking method and apparatus
US20190244612A1 (en) Method of processing a speech signal for speaker recognition and electronic apparatus implementing same
CN115604707A (zh) 自然语言用户界面
JP6239826B2 (ja) 話者認識装置、話者認識方法及び話者認識プログラム
JP3522421B2 (ja) 話者認識システムおよび話者認識方法
JP3601631B2 (ja) 話者認識システムおよび話者認識方法
JP3849841B2 (ja) 話者認識装置
JP2002507298A (ja) 自動音声認識を有するアクセス制御コンピュータシステム
JP3592415B2 (ja) 話者認識システム
JP3506293B2 (ja) 話者識別システム
CN112085506A (zh) 一种交易方法及装置、终端、可读存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees