JPH09120293A - 話者認識システムおよび話者認識方法 - Google Patents

話者認識システムおよび話者認識方法

Info

Publication number
JPH09120293A
JPH09120293A JP7298927A JP29892795A JPH09120293A JP H09120293 A JPH09120293 A JP H09120293A JP 7298927 A JP7298927 A JP 7298927A JP 29892795 A JP29892795 A JP 29892795A JP H09120293 A JPH09120293 A JP H09120293A
Authority
JP
Japan
Prior art keywords
speaker recognition
speaker
terminal
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7298927A
Other languages
English (en)
Other versions
JP3601631B2 (ja
Inventor
Junichiro Fujimoto
潤一郎 藤本
Tatsuo Miyaji
達生 宮地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP29892795A priority Critical patent/JP3601631B2/ja
Priority to US08/733,394 priority patent/US5893057A/en
Publication of JPH09120293A publication Critical patent/JPH09120293A/ja
Application granted granted Critical
Publication of JP3601631B2 publication Critical patent/JP3601631B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 利用者が例えば銀行の窓口などに出向かずと
も、話者認識を行なうことができ、銀行などで提供され
ている入出金,残高照会などのアプリケーションを利用
することが可能である。 【解決手段】 この話者認識システムは、少なくとも1
つの端末11−1〜11−nと中央装置12とが、情報
を送受信可能に設けられている。ここで、音声入力手段
1(あるいは、さらに、音声区間検出部3)が端末側に設
けられ、また、特徴抽出手段4,話者認識管理手段1
0,話者認識部7が中央装置12に設けられたものとな
っている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、話者認識を行なう
話者認識システムおよび話者認識方法に関する。
【0002】
【従来の技術】従来、銀行などにおいて、例えば入出
金,残高照会などのアプリケーションを利用者が利用す
る際、この利用者が正規の利用者本人であることを確認
するために、暗証番号などを利用者に入力させるように
している。また、コンピュータでは、パスワードと称し
て、暗証番号と同様の暗証文字列を利用者に入力させる
ことによって本人の確認を行なっている。しかしなが
ら、このような暗証番号や暗証文字列などの入力による
確認は、他人が、暗証番号や暗証文字列を知りさえすれ
ば、難無く、これを盗用することができる。しかも、暗
証番号や暗証文字列は、それを登録した者(本人)の生年
月日や記念日、あるいは電話番号、氏名の綴りなどを利
用したものが多く、他人がこれを見破ることは差程難し
いことではない。
【0003】暗証番号や暗証文字列のこのような欠点を
回避するため、近年、声によって本人か否かを判定す
る、いわゆる話者認識が着目されている。この話者認識
は、ある話者が発声した音声の特徴量(特徴パターン)
が、予め登録されているこの話者の音声標準パターンと
一致するか否かを調べることにより、本人か否かを判定
(認識)するものである。すなわち、話者の音声から抽出
した特徴量(特徴パターン)とこの話者の音声標準パター
ンとの類似度を計算し、類似度の高低によって本人か否
かを判定するものであり、人間の肉体的特徴を利用する
ものであることから、音声は、暗証番号や暗証文字列に
比べて他人がこれを真似ることは難かしく、従って、他
人の盗用をより有効に防止することができる。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな話者認識システムは、従来一般的に、例えば銀行の
窓口などに設置され、従って、話者認識を行なうために
は、利用者は、その都度、銀行の窓口等へ出向かなけれ
ばならないという問題があった。
【0005】本発明は、利用者が例えば銀行の窓口など
に出向かずとも、話者認識を行なうことができ、銀行な
どで提供されている入出金,残高照会などのアプリケー
ションを利用することの可能な話者認識システムおよび
話者認識方法を提供することを目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、少なくとも1つの端末と中
央装置とが、情報を送受信可能に設けられており、端末
には、話者の音声を入力し音声信号とする音声入力手段
が設けられ、また、中央装置には、音声信号の特徴量を
抽出する特徴抽出手段と、話者認識用の情報を管理する
話者認識管理手段と、特徴抽出手段から話者の音声の特
徴量と話者認識管理手段によって管理されている話者認
識用情報とを照合して話者認識を行なう話者認識手段と
が設けられており、端末から中央装置に、音声信号を転
送するようになっていることを特徴としている。
【0007】また、請求項2記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末には、話者の音声を入力し音声信号とす
る音声入力手段と、音声信号の特徴量を抽出する特徴抽
出手段とが設けられ、また、中央装置には、話者認識用
の情報を管理する話者認識管理手段と、話者の音声の特
徴量と該話者認識管理手段によって管理されている話者
認識用情報とを照合して話者認識を行なう話者認識手段
とが設けられており、端末から中央装置に、話者の音声
の特徴量を転送するようになっていることを特徴として
いる。
【0008】また、請求項3記載の発明は、請求項2記
載の話者認識システムにおいて、さらに、中央装置から
端末には、所定の情報が転送され、端末に設けられてい
る特徴抽出手段は、中央装置から提供された情報に基づ
いて、入力された音声を特徴量に変換することを特徴と
している。
【0009】また、請求項4記載の発明は、請求項1ま
たは請求項2記載の話者認識システムにおいて、端末に
は、音声入力手段からの音声信号または特徴抽出手段か
らの特徴量を所定の暗号情報に基づいて暗号化する暗号
化手段がさらに設けられており、端末は、音声入力手段
からの音声信号または特徴抽出手段からの特徴量を所定
の暗号情報に基づいて暗号化して、中央装置に転送する
ことを特徴としている。
【0010】また、請求項5記載の発明は、請求項4記
載の話者認識システムにおいて、中央装置には、暗号情
報を生成する暗号情報生成手段と、復号化手段とが設け
られており、端末の暗号化手段は、中央装置の暗号情報
生成手段によって生成された暗号情報が中央装置から提
供されるとき、該暗号情報に基づいて、音声入力手段か
らの音声信号または特徴抽出手段からの特徴量に暗号化
を施し、また中央装置では、端末から暗号化された音声
信号または特徴量が転送されるとき、該暗号化された音
声信号または特徴量を暗号情報に基づいて復号化手段に
よって復号化するようになっていることを特徴としてい
る。
【0011】また、請求項6記載の発明は、請求項4ま
たは請求項5記載の話者認識システムにおいて、暗号情
報は、端末から中央装置への通信毎に、異なるものが用
いられることを特徴としている。
【0012】また、請求項7記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末に話者が音声を入力すると、話者の音声
信号は中央装置に転送され、中央装置では、端末から転
送された話者の音声信号から特徴量を抽出し、該特徴量
と該中央装置に予め管理されている話者認識用情報とを
照合して話者認識を行なうことを特徴としている。
【0013】また、請求項8記載の発明は、少なくとも
1つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末に話者が音声を入力すると、話者の音声
信号は特徴量に変換されて中央装置に転送され、中央装
置では、端末から転送された話者の音声の特徴量と該中
央装置に予め管理されている話者認識用情報とを照合し
て話者認識を行なうことを特徴としている。
【0014】また、請求項9記載の発明は、請求項8記
載の話者認識方法において、端末において特徴量の変換
処理がなされるに先立って、中央装置から端末には所定
の情報が転送され、端末は、中央装置から提供された情
報に基づいて、入力された音声信号を特徴量に変換する
ことを特徴としている。
【0015】また、請求項10記載の発明は、請求項7
または請求項8記載の話者認識方法において、端末は、
さらに、音声信号または特徴量に所定の暗号情報に基づ
いて暗号化を施して、中央装置に転送することを特徴と
している。
【0016】
【発明の実施の形態】図1は一般的な話者認識システム
の構成例を示す図である。図1を参照すると、この話者
認識システムは、例えば銀行などにおける本人の確認を
話者認識により行なうためのものであって、利用者の音
声を入力するための音声入力手段(例えば、マイクロフ
ォン)1と、利用者に所定の指定情報を入力させるため
の指定手段(例えばキーボード)2と、音声入力手段1か
ら入力された信号の中から話者の音声の部分のみを音声
区間として検出する音声区間検出部3と、音声区間検出
部3で検出した音声区間内の音声信号から特徴量(特徴
パターン)を抽出する特徴抽出部4と、話者認識を行な
うに先立って話者の音声の標準的な特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部5に予
め登録する登録部6と、利用者(話者)の音声の特徴量
(特徴パターン)と話者認識用情報記憶部5に登録されて
いる標準パターンとを照合し、その類似度に基づいて話
者認識を行なう話者認識部7と、標準パターンの登録を
行なう登録モードと話者認識を行なう認識モードとの切
替を行なう切替部(例えばスイッチ)8とを有している。
【0017】ここで、特徴抽出部4は、音声信号を特徴
量(特徴パターン)として、スペクトルに変換しても良い
し、あるいはLPCケプストラムに変換しても良く、特
徴量の種類については特に限定するものではない。な
お、スペクトルに変換するためには、特徴量変換にはF
FTを用い、また、LPCケプストラムに変換するため
にはLPC分析などを用いるのがよい。
【0018】また、標準パターンの登録時(登録モード
時)において、登録部6は、ある話者が発声した音声に
基づいて特徴抽出部4で抽出された特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部5に登
録する際、図2に示すように、この話者により指定手段
2から入力された指定情報(例えば、この話者の名前や
生年月日,あるいはこの話者の暗証番号など)と対応付
けて、標準パターンを話者認識用情報記憶部5に登録す
ることができる。換言すれば、話者認識用情報記憶部5
には、話者認識に必要な話者認識用の情報が登録される
ようになっており、また、この話者認識用情報記憶部5
には、複数の話者(例えば利用者A,B,C,D,…)の
話者認識用情報が登録可能となっている。
【0019】また、話者認識用情報記憶部5に登録され
る音声の標準パターンとしては、この話者認識システム
の使用形態等に応じて、各利用者(話者)に予め言葉を発
声させたものであっても良いし、各利用者ごとにそれぞ
れ自由に所望の言葉を発声させたものであっても良い。
【0020】また、話者認識部7は、例えば、古井著
「ディジタル音声処理」(東海出版会)などに記載されて
いるように、現在の話者の音声の特徴パターンが話者認
識用情報記憶部5に登録されている複数の話者の標準パ
ターンのうちのどれに最も類似しているかを判定し、登
録されている複数の話者のうちから1人の話者を識別す
る話者識別方式のものであっても良いし、話者認識用情
報記憶部5に登録されている複数の話者の標準パターン
から現在の話者に対応する標準パターンを取り出し、こ
の標準パターンと現在の話者の特徴パターンとを照合
し、その類似度が所定基準値(しきい値)よりも高いか低
いかにより現在の話者が正規の話者本人であるか否かを
判定する話者照合方式のものであっても良い。
【0021】さらに、話者認識部7は、話者認識用情報
記憶部5に登録される音声の標準パターンが各利用者
(話者)に予め言葉を発声させたものである場合には、こ
れに対応した認識を行なうものにすることができ、ま
た、話者認識用情報記憶部5に登録される音声の標準パ
ターンが各利用者ごとにそれぞれ自由に所望の言葉を発
声させたものである場合には、これに対応した認識を行
なうものにすることができる。但し、各利用者(話者)に
予め決められた言葉を発声させて話者認識を行なう場
合、類似の判定基準(しきい値)を各話者に対して全て一
定値にすることができるが、各利用者ごとにそれぞれ所
望の言葉を発声させて話者認識を行なう場合には、類似
の判定基準(しきい値)を各話者ごとに相違させることも
できる。
【0022】以下では、説明の便宜上、話者認識システ
ムは、各利用者(話者)に予め決められた言葉(特定の言
葉)を発声させるものとし、また、話者認識部7では、
話者照合方式の話者認識がなされるとする。なお、話者
認識部7において、話者照合方式の話者認識がなされる
場合、この話者認識時に、利用者(話者)は、指定手段2
から登録モード時に入力した指定情報と同じ指定情報を
入力する必要がある。これにより、話者認識部7では、
話者認識用情報記憶部5に登録されている複数の話者の
標準パターンのうちから現在の話者に対応する標準パタ
ーンを取り出すことができ、この標準パターンと現在の
話者の音声の特徴パターンとの照合を行なうことができ
る。
【0023】このような構成の話者認識システムを利用
者(例えばD)が始めて利用する場合、この利用者(話者)
Dは、先ず、自己の音声を標準パターンとして登録する
必要がある。このため、この利用者Dは、切替部(例え
ばスイッチ)8を操作して、特徴抽出部4を登録部6に
接続し、登録モードに設定する。
【0024】次いで、利用者(話者)Dは、指定手段2か
ら所定の指定情報,例えば(利用者D)を入力する。ま
た、この際、利用者は、予め決められた特定の言葉を発
声する。この音声は、音声入力手段1から入力し、音声
区間検出部3,特徴抽出部4により、特徴量(特徴パタ
ーン)に変換され、この話者の音声の標準パターンとし
て、登録部6に与えられる。
【0025】これにより、登録部6は、この利用者(話
者)Dの音声の標準パターンを指定手段2から入力され
た指定情報と対応付けて、話者認識用情報記憶部5に登
録する。例えば過去に、この話者認識用情報記憶部5に
複数の利用者(異なる利用者)A,B,Cが自己の音声を
標準パターンとして登録しており、現在の利用者Dが上
記のように自己の音声を標準パターンとして登録すると
き、この標準パターンは、話者認識用情報記憶部5に図
2に示すように記憶(登録)される。
【0026】このようにして、この音声の標準パターン
が話者認識用情報記憶部5に記憶されると、利用者D
は、この話者認識システムにより、利用者Dについての
話者認識を行なわせることができる。すなわち、この利
用者Dは、このシステムを用いて、いま利用している利
用者が利用者D本人であるか否かの判定を行なわせるこ
とができる。
【0027】具体的に、利用者Dが以後、このシステム
を利用する場合、利用者Dは、切替部8を操作して、特
徴抽出部4を話者認識部7に接続し、このシステムを認
識モードに設定する。
【0028】次いで、利用者Dは、指定手段2から所定
の指定情報,例えば(利用者D)を入力する。また、この
際、利用者Dは、予め決められた特定の言葉を発声す
る。この音声は、音声入力手段1から入力し、音声区間
検出部3,特徴抽出部4により、特徴量(特徴パターン)
に変換されて、話者認識部7に与えられる。
【0029】これにより、話者認識部7は、指定手段2
から入力された指定情報(利用者D)に対応させて登録さ
れている標準パターンを話者認識用情報記憶部5から取
り出し、この標準パターンと特徴抽出部4からの特徴パ
ターンとを照合して、その類似度を算出し、この類似度
が所定基準値よりも高いか低いかを判定する。この結
果、類似度が低いと判定されたときには、利用者が正規
の話者本人Dではないと判別し、この利用者による利用
を拒絶する。これに対し、類似度が高いと判定されたと
きには、利用者が正規の話者本人Dであると判別し、利
用者による利用を許可する。すなわち、利用者によるア
プリケーション(例えば入出金,残高照会などの処理)の
利用を許可する。
【0030】ところで、図1のような話者認識システム
は、従来一般的に、例えば銀行の窓口などに設置され、
従って、話者認識を行なうためには、利用者は、その都
度、銀行の窓口等へ出向かなければならないという問題
があった。
【0031】本発明は、このような問題を回避し、利用
者が、利用者の自宅において、あるいは利用者の会社等
において、話者認識を行ない、銀行などのアプリケーシ
ョン(入出金,残高照会などのアプリケーション)等を利
用できるようにすることを意図している。
【0032】図3は本発明に係る話者認識システムの第
1の構成例を示す図である。この第1の構成例では、話
者認識システムは、少なくとも1つの端末11−1〜1
1−nと中央装置12とが、情報を送受信可能に設けら
れている(例えば有線あるいは無線の通信手段13−1
〜13−nによって通信可能に設けられている)。ここ
で、各端末11−1〜11−nは、説明の便宜上、同じ
構成のものであるとする。
【0033】図3の構成例では、図1の構成例におい
て、音声入力手段1(あるいは、さらに、音声区間検出
部3)が端末側に設けられ、また、特徴抽出手段4,話
者認識管理手段10,話者認識部7が中央装置12に設
けられたものとなっている。なお、ここで、話者認識管
理手段10は、図1の話者認識用情報記憶部5,登録部
6の機能を有し、さらに、これに話者認識全体の管理,
制御機能、さらには、切替部8の機能をももたせること
もできる。すなわち、ここでは、話者認識管理手段10
とは、話者認識に関する管理,制御する機能を総称した
包括的な手段であるとする。
【0034】図4は図3の話者認識システムの具体例を
示す図である。なお、図4では、簡単のため、1つの端
末11−1だけが図示されているが、他の端末11−2
〜11−nも、端末11−1と同様の構成のものである
とする。図4を参照すると、端末11−1には、音声入
力手段1,指定手段2,音声区間検出部3が設けられ、
さらに、端末11−1には、中央装置12との間で情報
を通信手段(例えば電話回線あるいは無線)13−1を介
して送受信するための送受信インタフェース部14−1
が設けられている。また、中央装置12には、特徴抽出
部4,話者認識用情報記憶部5,登録部6,話者認識部
7,切替部8が設けられ、さらに中央装置12には、各
端末11−1〜11−nとの間で情報を送受信するため
の送受信インタフェース部15がさらに設けられてい
る。
【0035】ここで、各端末11−1〜11−nとして
は、例えば電話機やパソコン(マイクロフォン,A/D
変換などの音声取込機能を備えたパソコン)を用いるこ
とが可能であって、各端末11−1〜11−nの利用者
は、自己の端末を、例えば自宅や会社において、保有す
ることができる。
【0036】また、図4の構成例において、中央装置1
2の送受信インタフェース15には、例えば交換器を用
いることができる。また、特徴抽出部4,登録部6,話
者認識部7は、この中央装置に搭載される特徴抽出ソフ
ト,登録ソフト,話者認識ソフト(話者認識プログラム)
として実現され、話者認識用情報記憶部5には、中央装
置12に設けられているメモリを用いることができる。
また、切替部8は、例えば、端末からの指示が標準パタ
ーンの登録(あるいは変更)であるか、話者認識であるか
に応じて、登録ソフトを実行するか、話者認識ソフトを
実行するかを選択する選択プログラムとして構成でき
る。
【0037】また、図4の構成例において、話者認識用
情報記憶部5には、図5に示すように、標準パターンの
他に、標準パターンの更新日時,類似度のしきい値など
の各種の付随情報が記憶されても良い。この場合、例え
ば、話者認識部7は、ある話者の音声の特徴パターン
を、話者認識用情報記憶部5に記憶されている標準パタ
ーンと照合して、この話者の特徴パターンと標準パター
ンとの類似度を求めたとき、この標準パターンに対応す
るしきい値(付随情報)を話者認識用情報記憶部5から読
出し、上記類似度がこのしきい値よりも高いか低いかに
より、この話者が本人であるか否かを判別することがで
きる。
【0038】このような第1の構成例の話者認識システ
ムでは、標準パターンの登録(さらには標準パターンの
変更あるいは更新)や話者認識を行なうために、利用者
は、利用者の家庭や会社等に設置されている端末を操作
することによって、例えば銀行の窓口などに設置されて
いる中央装置(例えば話者認識装置ユニット)に対し、標
準パターンの登録操作,話者認識操作を、前述したと同
様にして行なうことができる。
【0039】例えば、話者認識を行なうとき、利用者
が、自己の端末,例えば11−1の指定手段2から、例
えば、話者認識を行なう旨の指示を入力すると、この指
定情報は、通信手段13−1を介して中央装置12に伝
えられ、中央装置12では、切替部8を話者認識部7側
に切替設定する。次いで、この利用者が、指定手段2か
ら所定の指定情報,例えば(利用者D)を入力すると、こ
の指定情報は、通信手段13−1を介して中央装置12
に伝えられる。また、この際、利用者Dは、予め決めら
れた特定の言葉を発声する。この音声は、音声入力手段
1から入力し、例えば音声区間検出部3から音声信号と
して出力され、通信手段13−1を介して中央装置12
に伝えられる。中央装置12では、伝送された音声信号
を特徴抽出部4により、特徴量(特徴パターン)に変換
し、話者認識部7に与える。
【0040】これにより、話者認識部7は、指定手段2
から伝送された指定情報(利用者D)に対応させて登録さ
れている標準パターンを話者認識用情報記憶部5から取
り出し、この標準パターンと特徴抽出部4からの特徴パ
ターンとを照合して、その類似度を算出し、この類似度
が所定基準値(しきい値)よりも高いか低いかを判定す
る。この結果、類似度が低いと判定されたときには、利
用者が正規の話者本人Dではないと判別し、この利用者
による利用を拒絶する。これに対し、類似度が高いと判
定されたときには、利用者が正規の話者本人Dであると
判別し、利用者による利用を許可する。すなわち、利用
者によるアプリケーション(例えば入出金,残高照会な
どの処理)の利用を許可する。
【0041】このように、第1の構成例の話者認識シス
テムでは、利用者の自宅あるいは会社等に設置されてい
る端末(例えば電話装置)を用いて、銀行などに設置され
ている中央装置(例えば話者認識装置ユニット)にアクセ
スして、話者認識を行なわせ、話者認識の結果、本人で
あることが確認された後、入出金,残高照会などのアプ
リケーションを利用することができる。すなわち、利用
者は、銀行等にその都度出向かずとも、自宅や会社など
から銀行等の話者認識装置ユニットに話者認識を行なわ
せ、銀行等のアプリケーションを利用することができ
る。
【0042】特に、この第1の構成例では、利用者側の
端末としては、単に、音声入力手段1(あるいは、これ
とともに指定手段2)だけが備わったものであっても良
く、従って、端末として、通常の電話器,携帯電話を用
いることができる。すなわち、電話器のハンドセットの
送話器を音声入力手段1として用い、また、電話器の操
作部(プッシュホン電話器のテンキー部)を指定手段2と
して用いることができる。
【0043】但し、この第1の構成例では、音声入力手
段1(あるいは音声区間検出部3)からの音声信号を通信
手段(例えば電話回線や無線)を介して中央装置12に送
信するため、通信手段(電話回線や無線)の品質や通信環
境などが悪い場合には、通信手段を伝送中に、音声信号
に雑音が混入したり、音声信号が劣化し、中央装置12
において話者認識を正しく行なうことができず、本人で
あるにもかかわらず、本人でないと判別されてアプリケ
ーションを利用できないといった事態が考えられる。ま
た、音声信号には、これをデジタル信号に変換してもデ
ータ量が多く、従って、音声信号を通信手段(電話回線)
を介して中央装置に送信する場合、相当の伝送時間を要
してしまうという問題も考えられる。
【0044】図6は本発明に係る話者認識システムの第
2の構成例を示す図であり、この第2の構成例では、第
1の構成例における上記のような問題を回避することを
意図している。すなわち、この第2の構成例において
も、少なくとも1つの端末31−1〜31−nと中央装
置32とが、情報を送受信可能に設けられている(例え
ば有線あるいは無線の通信手段33−1〜33−nによ
って通信可能に設けられている)が、この第2の構成例
では、音声入力手段1(さらには音声区間検出部3),特
徴抽出部4が端末側に設けられ、また、話者認識管理手
段10,話者認識部7が中央装置32に設けられてい
る。
【0045】図7は図6の話者認識システムの具体例を
示す図である。なお、図7では、簡単のため、1つの端
末31−1だけが図示されているが、他の端末31−2
〜31−nも、端末31−1と同様の構成のものである
とする。図7を参照すると、端末31−1には、音声入
力手段1,指定手段2,音声区間検出部3,特徴抽出部
4が設けられ、さらに、端末31−1には、中央装置3
2との間で情報を通信手段33−1を介して送受信する
ための送受信インタフェース部34−1が設けられてい
る。また、中央装置32には、話者認識用情報記憶部
5,登録部6,話者認識部7,切替部8が設けられ、さ
らに、中央装置32には、各端末31−1〜31−nと
の間で情報を送受信するための送受信インタフェース部
35が設けられている。
【0046】ここで、各端末31−1〜31−nとして
は、例えばパソコン(マイクロフォン,A/D変換など
の音声取込機能を備えたパソコン)を用いることが可能
であって、各端末31−1〜31−nの利用者は、自己
の端末を、例えば自宅や会社において、保有することが
できる。より具体的に、各端末31−1〜31−nに
は、既存のパソコン(パソコン通信機能を備えたパソコ
ン)を用いることができ、この場合、図7の構成例にお
いて、端末31−1の送受信インタフェース部34−1
は、例えば、パソコンに内蔵されているモデムとして実
現され、また、音声入力手段1は、パソコンに設けられ
ているマイクロフォンで実現され、指定手段2はパソコ
ンのコンソールで実現され、音声区間検出部3,特徴抽
出部4は、パソコンに搭載されるソフトウェア,例え
ば、音声区間検出ソフト,特徴抽出ソフトとして実現さ
れる。
【0047】また、図7の構成例において、中央装置3
2の送受信インタフェース35には、例えば交換器を用
いることができる。また、登録部6,話者認識部7は、
この中央装置に搭載される登録ソフト,話者認識ソフト
(話者認識プログラム)として実現され、話者認識用情報
記憶部5には、中央装置32に設けられているメモリを
用いることができる。また、切替部8は、例えば、端末
からの指示が標準パターンの登録(あるいは変更)である
か、話者認識であるかに応じて、登録ソフトを実行する
か、話者認識ソフトを実行するかを選択する選択プログ
ラムとして構成できる。
【0048】また、図7の構成例においても、図4の構
成例と同様、話者認識用情報記憶部5には、図5に示し
たように、標準パターンの他に、標準パターンの更新日
時,類似度のしきい値などの各種の付随情報が記憶され
ても良い。この場合、例えば、話者認識部7は、ある話
者の音声の特徴パターンを、話者認識用情報記憶部5に
記憶されている標準パターンと照合して、この話者の特
徴パターンと標準パターンとの類似度を求めたとき、こ
の標準パターンに対応するしきい値(付随情報)を話者認
識用情報記憶部5から読出し、上記類似度がこのしきい
値よりも高いか低いかにより、この話者が本人であるか
否かを判別することができる。
【0049】このような第2の構成例の話者認識システ
ムにおいても、標準パターンの登録(さらには標準パタ
ーンの変更あるいは更新),話者認識を行なうために、
利用者は、利用者の家庭や会社等に設置されている端末
を操作することによって、例えば銀行の窓口などに設置
されている話者認識装置ユニットに対し、標準パターン
の登録操作,話者認識操作を、前述したと同様にして行
なうことができる。
【0050】例えば、話者認識を行なうとき、利用者
は、自己の端末,例えば31−1の指定手段2から、例
えば、話者認識を行なう旨の指示を入力すると、この指
定情報は、通信手段33−1を介して中央装置32に伝
えられ、中央装置32では、切替部8を話者認識部7側
に切替設定する。次いで、この利用者が、指定手段2か
ら所定の指定情報,例えば(利用者D)を入力すると、こ
の指定情報は、通信手段33−1を介して中央装置32
に伝えられる。また、この際、利用者Dは、予め決めら
れた特定の言葉を発声する。この音声は、音声入力手段
1から入力し、例えば音声区間検出部3から音声信号と
して出力され、特徴抽出部4で特徴量に変換されて、通
信手段33−1を介して中央装置32に伝えられる。中
央装置32では、伝送された特徴量(特徴パターン)信号
を話者認識部7に与える。
【0051】これにより、話者認識部7は、指定手段2
から伝送された指定情報(利用者D)に対応させて登録さ
れている標準パターンを話者認識用情報記憶部5から取
り出し、この標準パターンと特徴量(特徴パターン)とを
照合して、その類似度を算出し、この類似度が所定基準
値よりも高いか低いかを判定する。この結果、類似度が
低いと判定されたときには、利用者が正規の話者本人D
ではないと判別し、この利用者による利用を拒絶する。
これに対し、類似度が高いと判定されたときには、利用
者が正規の話者本人Dであると判別し、利用者による利
用を許可する。すなわち、利用者によるアプリケーショ
ン(例えば入出金,残高照会などの処理)の利用を許可す
る。
【0052】このように、第2の構成例の話者認識シス
テムにおいても、利用者の自宅あるいは会社等に設置さ
れている端末(例えばパソコン)を用いて、銀行などに設
置されている中央装置(例えば話者認識装置ユニット)に
アクセスして、話者認識を行なわせ、話者認識の結果、
本人であることが確認された後、入出金,残高照会など
のアプリケーションを利用することができる。すなわ
ち、利用者は、銀行等にその都度出向かずとも、自宅や
会社などから銀行等の話者認識装置ユニットに話者認識
を行なわせ、銀行等のアプリケーションを利用すること
ができる。
【0053】また、この第2の構成例では、利用者側の
端末として、既存のパソコン(パソコン通信機能を備え
たパソコン)を用いることができる。
【0054】さらに、この第2の構成例では、特徴抽出
部4からの特徴量(特徴パターン)を通信手段(例えば電
話回線や無線など)を介して中央装置32に送信するよ
うにしているので、通信手段(電話回線や無線など)の品
質や通信環境が多少悪い場合でも、特徴量(特徴パター
ン)信号は、音声信号を送信する場合に比べて、影響を
受けにくく、従って、中央装置32において、話者認識
をより正しく行なうことができる。また、特徴量(特徴
パターン)信号は、音声信号に比べてデータ量がはるか
に少なく、特徴量(特徴パターン)信号を中央装置32に
送信する場合には、音声信号を送信する場合に比べて、
送信時間を著しく短縮することができる。
【0055】さらに、この第2の構成例では、端末側
に、音声区間検出部3,特徴抽出部4が設けられている
ことによって、利用者は、自己の声の特性に適合するよ
う、音声区間検出部3の特性,特徴抽出部4の特性を管
理することができる。例えば、自己の声の音量や音質に
合わせて、音声区間検出の感度(声の大きさのしきい値)
などを調整したりすることができる。
【0056】また、上述の第1,第2の構成例において
は、話者認識部7(話者認識ソフト)については、端末側
ではなく、中央装置側に設けられていることによって
(すなわち、話者認識部7に関しては中央装置の1ヵ所
で一括(集中)管理することによって)、例えば、利用者
側の端末の性能(例えば端末に搭載されるソフトウェア
の性能)によって認識結果が左右されたりするのを回避
し、どのような精度,性能の端末が用いられる場合で
も、中央装置側において、常に、一定の認識精度で話者
認識を行なうことができる。
【0057】また、新たな話者認識方式が開発され、こ
の新たな話者認識方式を導入する場合、中央装置の話者
認識部7,すなわち中央装置の話者認識ソフトを入れ替
えるだけで、以後全ての認識を新たな認識方式で行なう
ことができて、この新たな話者認識方式の導入,すなわ
ちバージョンアップを簡単に(容易に)行なうことができ
る。
【0058】このように、上述の構成例では、仮に端末
に話者認識ソフトが搭載されていたとしても、あるい
は、話者認識ソフトが搭載されていなくても、中央装置
側の話者認識ソフトを利用するため、安定した信頼度の
高い話者認識が可能になる。また、中央装置側の話者認
識ソフトを入れ替えるだけで、以後全ての認識を新しい
話者認識ソフトで行なうことができることから、そのメ
ンテナンス(例えばバージョンアップ)をも容易に行なう
ことができる。
【0059】なお、第1,第2の構成例では、上述した
ように、端末側に、音声区間検出部3,特徴抽出部4が
設けられていることによって、利用者は、自己の声の特
性に適合するよう、音声区間検出部3の特性,特徴抽出
部4の特性を管理することができるという利点を有して
いるが、その反面、音声区間検出,特徴抽出等の処理と
話者認識の処理とが、端末側と中央装置側とで分散して
なされるため、中央装置側の管理者は、正規の利用者を
正規の利用者と認めなかったり、他人を正規の利用者と
認識したりする、いわゆる誤認識が発生する場合に、こ
の原因を中央装置側だけで一括管理することができな
い。例えば、この原因が、端末の音声区間検出,特徴抽
出によるものか、中央装置の話者認識によるものかを、
中央装置側だけで判別することができない。
【0060】誤認識を生じさせる原因としては、例え
ば、話者が発生した言葉の語頭や語尾が弱く、音声区間
検出が正常に行なわれず、特徴パターン上で、この部分
が欠落していることがあり、話者がこれに気付かずに何
回言い直しても同じような結果になってしまうという場
合があり、このときには、何回やり直しても正しい認識
ができない。
【0061】このような問題を回避するため、第1,第
2の構成例において、例えば中央装置32(例えば話者
認識管理手段10または話者認識部7)から端末,例え
ば31−1に所定の情報を提供し、端末31−1の音声
区間検出部3や特徴抽出部4は、中央装置32から提供
された情報に基づいて、音声区間検出や特徴量変換を行
なうことも可能である。
【0062】例えば、中央装置32側からは、情報とし
て、例えば音声区間検出の感度指示情報を提供すること
ができる。
【0063】この場合、端末側において、利用者が当初
音声を発声し、この音声が音声区間検出されるときに、
音声区間と判定された前後に、例えば0.5秒程度のデ
ータを付加し、このデータをも含めた音声区間内の音声
信号を、そのまま端末側のファイル(図示せず)に保存す
る。このようにして、端末側で利用者の音声信号がファ
イルに保存された後、これを特徴量(特徴パターン)に変
換して中央装置に送信し、中央装置の話者認識部7で話
者認識を行なわせる。話者認識の結果、利用者本人では
ないと判定された場合、中央装置32側では、例えば、
話者認識用情報記憶部5に付随情報として記憶されてい
る音声区間検出の感度(声の大きさのしきい値等)を高め
て、これを端末側に、情報として提供(送信)し、端末側
において、ファイルに保存されている音声信号に対して
再度、音声区間検出を行なわせる。また、話者認識用情
報記憶部5に付随情報として記憶されている音声区間検
出の感度を下げて、これを端末側に、情報として提供
(送信)し、端末側において、ファイルに保存されている
音声信号に対して再度、音声区間検出を行なわせる。
【0064】このようにして、音声区間検出の感度を高
めた場合と下げた場合とで、それぞれ話者認識を行な
い、いずれかで正しい話者であることが判定されれば、
この利用者を正しい話者であると認識することができ
る。このように、音声区間検出の感度を高めることによ
って、例えば話者の声が小さい場合に、音声区間が正し
く検出されないという事態(検出漏れを起こすという事
態)が生じていたのを、改善することができ、また、音
声区間検出の感度を下げることによって、例えば話者の
音声の前後に雑音が生じるような場合に、音声区間検出
部が実際よりも長い音声を検出してしまうという事態が
生じていたのを、改善することができる。
【0065】上述の例では、中央装置32側から端末側
に提供する情報として、音声区間検出の感度を例にとっ
たが、第2の構成例においては、特徴量変換のサンプリ
ング周波数を情報として端末側に提供することもでき、
この場合には、端末側では、中央装置32からの情報に
よって特徴量変換のサンプリング周波数を変えることが
できる。さらに、中央装置32側から端末側には、上記
以外の種々の情報を提供することもできる。
【0066】このように、端末に、中央装置から所定情
報を与えることで、話者認識のみならず、必要に応じ
て、話者認識のための音声区間検出や特徴抽出などを
も、中央装置側から管理,制御することができる。
【0067】上述の各構成例の説明では、話者認識を行
なう場合について述べたが、標準パターンの新規登録や
変更,更新についても、端末側から同様にして行なうこ
とができる。なお、中央装置側において、話者認識に用
いたデータによって、自動的に標準パターンを更新する
機能が備わっている場合は、端末側からの操作を行なわ
ずとも、中央装置側で、自動的に標準パターンの更新を
行なうことができる。
【0068】また、上述した各構成例において、ある端
末から中央装置に通信手段(有線あるいは無線)を介して
伝送される音声信号あるいは特徴量(特徴パターン)信号
を、この端末の利用者以外の他人が例えば通信手段から
盗聴し、盗聴した音声信号あるいは特徴量(特徴パター
ン)信号を、この他人が正規の利用者になりすまして、
中央装置に送信して話者認識を行ない、正規の話者用の
アプリケーションを利用したりすることも考えられる。
【0069】このような他人による悪用を防止するた
め、上述の各構成例において、端末から音声信号あるい
は特徴量(特徴パターン)信号を、通信手段によって、中
央装置に送信する際、端末側において、送信しようとす
る音声信号あるいは特徴量(特徴パターン)信号を暗号化
し、暗号化した音声信号あるいは特徴量(特徴パターン)
信号を、通信手段を介して、中央装置に送信するように
することもできる。
【0070】図8は図3の話者認識システム(第1の構
成例の話者認識システム)において、音声入力手段1(あ
るいは音声区間検出手段2)から出力される音声信号を
暗号化して中央装置に送信する話者認識システムの構成
例を示す図である。図8を参照すると、この話者認識シ
ステムでは、端末において、音声入力手段1(あるいは
音声区間検出手段2)から出力される音声信号を暗号化
するための暗号化手段60がさらに設けられている。
【0071】また、図9は図8の具体例を示すものであ
り、図4の話者認識装置に対応したものとなっている。
図9を参照すると、この話者認識システムでは、端末,
例えば11−1において、暗号化手段60が音声区間検
出部3の後段に設けられている。
【0072】また、図8,図9において、中央装置12
には、端末の暗号化手段60に与えるための暗号情報を
生成する暗号情報生成手段61と、端末の暗号化手段6
0によって暗号化されて端末から送信された音声信号を
暗号情報生成手段61によって生成された暗号情報に基
づいて復号化する復号化手段62とが、さらに設けられ
ている。
【0073】このような構成の話者認識システムでは、
中央装置12は、端末,例えば11−1から話者認識の
対象となる音声信号が送信されるに先立って、暗号情報
生成手段61で暗号情報(例えば、暗号鍵)を生成し、音
声信号が送信されようとしている端末11−1に暗号情
報を提供する。なお、端末11−1に提供した暗号情報
は、この端末11−1からの音声信号(この暗号情報に
より暗号化された音声信号)に対して復号化処理を施す
ために、中央装置12において保存される。
【0074】このようにして、中央装置12から端末1
1−1に暗号情報が提供された後、端末の暗号化手段6
0では、中央装置12から提供された暗号情報に基づい
て音声信号を暗号化して中央装置12に送信する。中央
装置12では、この端末からの暗号化された音声信号を
受信すると、復号化手段62により、端末11−1に提
供されたと同じ暗号情報を用いて、暗号化された音声信
号を元の音声信号に復元し、しかる後、この音声信号か
ら特徴量(特徴パターン)を抽出して、話者認識を行な
う。
【0075】このように、この構成例では、端末11−
1から音声信号を暗号化して、通信手段13−1を介
し、中央装置12に送信するので、他人が通信手段13
−1からこれを盗聴しても、この他人は暗号情報を知ら
ない限り、これから音声信号を抽出することができず、
従って、利用者の音声信号が他人に盗まれて他人によっ
て悪用されるという事態を有効に防止することができ
る。
【0076】なお、中央装置12において、暗号情報
(暗号鍵)は、端末との通信の度に更新(変更)生成され
て、端末に提供され、また、復号化手段62で用いられ
るのが望ましい。これにより、端末からの音声信号は、
毎回、異なった暗号情報によって暗号化され、従って、
盗聴によって盗まれた信号は、次回以後、中央装置12
によって正しく復号化(復元)されず、正しい話者認識が
できなくなるので、他人による盗用を確実に防止するこ
とができる。
【0077】図10は図6の話者認識システム(第2の
構成例の話者認識システム)において、特徴抽出部4か
ら出力される特徴量(特徴パターン)信号を暗号化して中
央装置に送信する話者認識システムの構成例を示す図で
ある。図10を参照すると、この話者認識システムで
は、端末において、特徴抽出部4から出力される特徴量
(特徴パターン)信号を暗号化する暗号化手段70がさら
に設けられている。
【0078】また、図11は図10の具体例を示すもの
であり、図7の話者認識装置に対応したものとなってい
る。図11を参照すると、この話者認識システムでは、
端末,例えば31−1において、暗号化手段70が特徴
抽出部4の後段に設けられている。また、中央装置32
においては、端末の暗号化手段70に与えるための暗号
情報を生成する暗号情報生成手段71と、端末の暗号化
手段70によって暗号化されて端末から送信された特徴
量(特徴パターン)信号を暗号情報生成手段71によって
生成された暗号情報に基づいて復号化する復号化手段7
2とが、さらに設けられている。
【0079】このような構成の話者認識システムでは、
中央装置32は、端末,例えば31−1から話者認識の
対象となる特徴量(特徴パターン)信号が送信されるに先
立って、暗号情報生成手段71で暗号情報(例えば、暗
号鍵)を生成し、特徴量(特徴パターン)信号が送信され
ようとしている端末31−1に暗号情報を提供する。な
お、端末32−1に提供した暗号情報は、この端末から
の特徴量(特徴パターン)信号(この暗号情報により暗号
化された特徴量(特徴パターン)信号)に対して復号化処
理を施すために、中央装置32において保存される。
【0080】このようにして、中央装置32から端末3
1−1に暗号情報が提供された後、端末31−1の暗号
化手段70では、中央装置32から提供された暗号情報
に基づいて特徴量(特徴パターン)信号を暗号化して中央
装置32に送信する。中央装置32では、この端末31
−1からの暗号化された特徴量(特徴パターン)信号を受
信すると、復号化手段72により、端末31−1に提供
されたと同じ暗号情報を用いて、暗号化された特徴量
(特徴パターン)信号を元の特徴量(特徴パターン)信号に
復元し、しかる後、この特徴量(特徴パターン)信号によ
り、話者認識を行なう。
【0081】このように、この構成例では、端末31−
1から特徴量(特徴パターン)信号を暗号化して、通信手
段33−1を介し、中央装置32に送信するので、他人
が通信手段33−1からこれを盗聴しても、この他人は
暗号情報を知らない限り、これから特徴量(特徴パター
ン)信号を抽出することができず、従って、利用者の特
徴量(特徴パターン)信号が他人に盗まれて他人によって
悪用されるという事態を有効に防止することができる。
【0082】また、中央装置32において、暗号情報
(暗号鍵)は、端末との通信の度に更新(変更)生成され
て、端末に提供され、また、復号化手段72で用いられ
るのが望ましい。これにより、端末からの特徴量(特徴
パターン)信号は、毎回、異なった暗号情報によって暗
号化され、従って、盗聴によって盗まれた信号は、次回
以後、中央装置32によって正しく復号化(復元)され
ず、正しい話者認識ができなくなるので、他人による盗
用を確実に防止することができる。
【0083】上述の各構成例では、音声区間抽出部3の
後に、特徴抽出部4が設けられているが、必要に応じ、
音声区間抽出部3の前に、特徴抽出部4が設けられるよ
うに構成することも可能である。
【0084】また、上述の各構成例において、端末11
−1,31−1は、中央装置12,32に音声信号ある
いは特徴量(特徴パターン)信号を送信する際、音声信号
あるいは特徴量(特徴パターン)信号を一旦ファイルに蓄
積し、ファイルに蓄積した音声信号あるいは特徴量(特
徴パターン)信号を中央装置12,32に送信するよう
になっていても良い。また、この場合、図8乃至図11
の構成例において、暗号化手段60,70では、ファイ
ルの前段に設けられても良いし、ファイルの後段に設け
られても良い。
【0085】また、図8〜図11の各構成例において、
暗号情報として暗号鍵を用いた暗号化の手法には、すで
に実用化されている様々な方法が利用可能である。例え
ば、図10,図11の構成例の場合、中央装置32から
は、暗号鍵として1つの数字を送信することができ、こ
の場合、端末では、この数字の値に基づいて特徴量情報
の並び替えを行なえば良い。簡単な方法としては、例え
ば、特徴量情報がp1,…,pi,…,pnのn個の数値
で構成され、中央装置32から暗号鍵として数値Cが送
信されてきた場合、端末は特徴量情報をC番目の数値か
ら順に、pC,pC+1,…のように送信し、pnまで到達
したらp1に戻り、pC-1までn個の数値を送信するとい
うように、特徴量情報に対して暗号化を施すことができ
る。
【0086】より具体的に、例えば、特徴量情報が
1,…,p16の16個の数値で構成され、暗号鍵とし
て中央装置32から“5”が送信されてきた場合、端末
は16個の数値を、p5,p6,p7,p8,p9,p10
11,p12,p13,p14,p15,p16,p1,p2
3,p4のように順番を入れ替えて送信する。
【0087】上記例では、簡単な暗号化の例を示した
が、暗号化の手法はこの例に限定されるものではなく、
さらに高度な暗号化の手法を利用すれば、盗用に対して
より効果的な防護を行なうことが可能となる。
【0088】例えば、公開鍵方式と呼ばれる手法では、
2つの暗号鍵CとC’を用い、受信側はこれらの2つの
鍵を作成し、1つ(公開鍵)を送信側へ暗号化のために伝
送し、他方を手元に復号化のために保管する。これらの
2つの暗号鍵は、互いに他方の鍵によって暗号化された
情報を復号することは可能であるが、自身によって暗号
化された情報は復号することは出来ず、また一方の暗号
鍵から他方の暗号鍵を作成・類推することは困難である
ように構成されている。
【0089】従って、本発明に公開鍵方式を応用するに
は、中央装置の暗号情報生成手段でこれら2つの鍵を生
成し、そのうちの1つCを端末へ送信し、もう1つの鍵
C’を復号化手段で復号化に使用するために保管する。
端末では音声信号あるいは音声の特徴量信号を中央装置
からの鍵Cによって暗号化し、中央装置へ送信する。中
央装置では、保管されている鍵C’を用いて、端末から
の暗号化された音声信号あるいは音声の特徴量信号を復
号化する。この構成により、盗聴などの行為によって、
端末からの暗号化された音声信号あるいは音声の特徴量
信号のみならず、中央装置から端末への暗号情報(暗号
鍵)が盗まれたとしても、鍵Cは復号化を行うことは出
来ないから、中央装置に保管されている鍵C’が盗まれ
ない限り、端末からの暗号化された音声信号あるいは音
声の特徴量信号は復元できず、暗号情報(暗号鍵)の送信
毎の更新と組み合わせることで、盗用に対してより効果
的な防護を行うことが可能になる。
【0090】また、上述の説明では、話者認識の対象と
なる音声信号あるいは特徴量(特徴パターン)信号に対し
て暗号化を施すとしたが、標準パターン登録用の音声信
号あるいは特徴量(特徴パターン)信号に対しても同様に
して暗号化を施して中央装置に送信することができる。
さらに、話者認識システムが、標準パターンの変更,更
新を端末側からの操作によって行なう機能を有している
場合には、標準パターンの変更,更新用の音声信号ある
いは特徴量(特徴パターン)信号に対しても同様にして暗
号化を施して中央装置に送信することができる。
【0091】
【発明の効果】以上に説明したように、請求項1乃至請
求項10記載の発明によれば、例えば利用者の自宅ある
いは会社等に設置されている端末を用いて、銀行などに
設置されている中央装置にアクセスして、話者認識を行
なわせ、話者認識の結果、本人であることが確認された
後、入出金,残高照会などのアプリケーションを利用す
ることができる。また、仮に端末に話者認識ソフトが搭
載されていたとしても、あるいは、話者認識ソフトが搭
載されていなくても、中央装置側の話者認識ソフトを利
用するため、安定した信頼度の高い話者認識が可能にな
る。また、中央装置側の話者認識ソフトを入れ替えるだ
けで、以後全ての認識を新しい話者認識ソフトで行なう
ことができることから、そのメンテナンス(例えばバー
ジョンアップ)をも容易に行なうことができる。
【0092】特に、請求項1,請求項7記載の発明によ
れば、端末としては、単に、音声入力手段(あるいは、
これとともに指定手段)だけが備わったものであっても
良く、従って、端末として、通常の電話器,携帯電話を
用いることができる。
【0093】また、請求項2,請求項8記載の発明によ
れば、特徴抽出部からの特徴量(特徴パターン)を通信手
段(例えば電話回線や無線など)を介して中央装置に送信
するようにしているので、通信手段(電話回線や無線な
ど)の品質や通信環境が多少悪い場合でも、特徴量(特徴
パターン)信号は、音声信号を送信する場合に比べて、
影響を受けにくく、従って、中央装置において、話者認
識をより正しく行なうことができる。また、特徴量(特
徴パターン)信号は、音声信号に比べてデータ量がはる
かに少なく、特徴量(特徴パターン)信号を中央装置に送
信する場合には、音声信号を送信する場合に比べて、送
信時間を著しく短縮することができる。
【0094】また、請求項3,請求項9記載の発明によ
れば、端末に、中央装置から所定情報を与えることで、
話者認識のみならず、必要に応じて、話者認識のための
音声区間検出や特徴抽出などをも、中央装置側から管
理,制御することができる。
【0095】また、請求項4,請求項5,請求項10記
載の発明によれば、端末において音声信号あるいは特徴
量(特徴パターン)信号を暗号化して中央装置に送信する
ので、他人が通信手段からこれを盗聴しても、この他人
は暗号情報を知らない限り、これから音声信号,特徴量
(特徴パターン)信号を抽出することができず、従って、
利用者の音声信号,特徴量(特徴パターン)信号が他人に
盗まれて他人によって悪用されるという事態を有効に防
止することができる。
【0096】また、請求項6記載の発明によれば、端末
からの音声信号あるいは特徴量(特徴パターン)信号は、
毎回、異なった暗号情報によって暗号化され、従って、
盗聴によって盗まれた信号は、次回以後、中央装置によ
って正しく復号化(復元)されず、正しい話者認識ができ
なくなるので、他人による盗用を確実に防止することが
できる。
【図面の簡単な説明】
【図1】一般的な話者認識システムの構成例を示す図で
ある。
【図2】話者認識用情報記憶部の構成例を示す図であ
る。
【図3】本発明に係る話者認識システムの第1の構成例
を示す図である。
【図4】図3の話者認識システムの具体例を示す図であ
る。
【図5】話者認識用情報記憶部の構成例を示す図であ
る。
【図6】本発明に係る話者認識システムの第2の構成例
を示す図である。
【図7】図6の話者認識システムの具体例を示す図であ
る。
【図8】本発明に係る話者認識システムの他の構成例を
示す図である。
【図9】図8の話者認識システムの具体例を示す図であ
る。
【図10】本発明に係る話者認識システムの他の構成例
を示す図である。
【図11】図10の話者認識システムの具体例を示す図
である。
【符号の説明】
1 音声入力手段 2 指示手段 3 音声区間検出部 4 特徴抽出部 5 話者認識用情報記憶部 6 登録部 7 話者認識部 8 切替部 10 話者認識管理手段 11,31 端末 12,32 中央装置 13,33 通信手段 60,70 暗号化手段 61,71 暗号情報生成手段 62,72 復号化手段

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末には、話
    者の音声を入力し音声信号とする音声入力手段が設けら
    れ、また、前記中央装置には、音声信号の特徴量を抽出
    する特徴抽出手段と、話者認識用の情報を管理する話者
    認識管理手段と、前記特徴抽出手段から話者の音声の特
    徴量と前記話者認識管理手段によって管理されている話
    者認識用情報とを照合して話者認識を行なう話者認識手
    段とが設けられており、前記端末から前記中央装置に、
    音声信号を転送するようになっていることを特徴とする
    話者認識システム。
  2. 【請求項2】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末には、話
    者の音声を入力し音声信号とする音声入力手段と、音声
    信号の特徴量を抽出する特徴抽出手段とが設けられ、ま
    た、前記中央装置には、話者認識用の情報を管理する話
    者認識管理手段と、話者の音声の特徴量と該話者認識管
    理手段によって管理されている話者認識用情報とを照合
    して話者認識を行なう話者認識手段とが設けられてお
    り、前記端末から中央装置に、話者の音声の特徴量を転
    送するようになっていることを特徴とする話者認識シス
    テム。
  3. 【請求項3】 請求項2記載の話者認識システムにおい
    て、さらに、前記中央装置から端末には、所定の情報が
    転送され、前記端末に設けられている特徴抽出手段は、
    中央装置から提供された情報に基づいて、入力された音
    声を特徴量に変換することを特徴とする話者認識システ
    ム。
  4. 【請求項4】 請求項1または請求項2記載の話者認識
    システムにおいて、前記端末には、音声入力手段からの
    音声信号または特徴抽出手段からの特徴量を所定の暗号
    情報に基づいて暗号化する暗号化手段がさらに設けられ
    ており、前記端末は、音声入力手段からの音声信号また
    は特徴抽出手段からの特徴量を所定の暗号情報に基づい
    て暗号化して、前記中央装置に転送することを特徴とす
    る話者認識システム。
  5. 【請求項5】 請求項4記載の話者認識システムにおい
    て、前記中央装置には、暗号情報を生成する暗号情報生
    成手段と、復号化手段とが設けられており、前記端末の
    暗号化手段は、前記中央装置の暗号情報生成手段によっ
    て生成された暗号情報が中央装置から提供されるとき、
    該暗号情報に基づいて、音声入力手段からの音声信号ま
    たは特徴抽出手段からの特徴量に暗号化を施し、また前
    記中央装置では、端末から暗号化された音声信号または
    特徴量が転送されるとき、該暗号化された音声信号また
    は特徴量を前記暗号情報に基づいて復号化手段によって
    復号化するようになっていることを特徴とする話者認識
    システム。
  6. 【請求項6】 請求項4または請求項5記載の話者認識
    システムにおいて、前記暗号情報は、前記端末から前記
    中央装置への通信毎に、異なるものが用いられることを
    特徴とする話者認識システム。
  7. 【請求項7】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末に話者が
    音声を入力すると、話者の音声信号は中央装置に転送さ
    れ、前記中央装置では、前記端末から転送された話者の
    音声信号から特徴量を抽出し、該特徴量と該中央装置に
    予め管理されている話者認識用情報とを照合して話者認
    識を行なうことを特徴とする話者認識方法。
  8. 【請求項8】 少なくとも1つの端末と中央装置とが、
    情報を送受信可能に設けられており、前記端末に話者が
    音声を入力すると、話者の音声信号は特徴量に変換され
    て中央装置に転送され、前記中央装置では、前記端末か
    ら転送された話者の音声の特徴量と該中央装置に予め管
    理されている話者認識用情報とを照合して話者認識を行
    なうことを特徴とする話者認識方法。
  9. 【請求項9】 請求項8記載の話者認識方法において、
    前記端末において特徴量の変換処理がなされるに先立っ
    て、前記中央装置から端末には所定の情報が転送され、
    前記端末は、中央装置から提供された情報に基づいて、
    入力された音声信号を特徴量に変換することを特徴とす
    る話者認識方法。
  10. 【請求項10】 請求項7または請求項8記載の話者認
    識方法において、前記端末は、さらに、音声信号または
    特徴量に所定の暗号情報に基づいて暗号化を施して、前
    記中央装置に転送することを特徴とする話者認識方法。
JP29892795A 1995-10-24 1995-10-24 話者認識システムおよび話者認識方法 Expired - Fee Related JP3601631B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP29892795A JP3601631B2 (ja) 1995-10-24 1995-10-24 話者認識システムおよび話者認識方法
US08/733,394 US5893057A (en) 1995-10-24 1996-10-18 Voice-based verification and identification methods and systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29892795A JP3601631B2 (ja) 1995-10-24 1995-10-24 話者認識システムおよび話者認識方法

Publications (2)

Publication Number Publication Date
JPH09120293A true JPH09120293A (ja) 1997-05-06
JP3601631B2 JP3601631B2 (ja) 2004-12-15

Family

ID=17865992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29892795A Expired - Fee Related JP3601631B2 (ja) 1995-10-24 1995-10-24 話者認識システムおよび話者認識方法

Country Status (1)

Country Link
JP (1) JP3601631B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001216270A (ja) * 2000-01-31 2001-08-10 Netmarks Inc 認証局、認証システム及び認証方法
JP2002073566A (ja) * 2000-08-31 2002-03-12 Sony Corp 個人認証適用データ処理システム、個人認証適用データ処理方法、および情報処理装置、並びにプログラム提供媒体
US6615171B1 (en) 1997-06-11 2003-09-02 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US7039951B1 (en) 2000-06-06 2006-05-02 International Business Machines Corporation System and method for confidence based incremental access authentication
US7409543B1 (en) 2000-03-30 2008-08-05 Digitalpersona, Inc. Method and apparatus for using a third party authentication server
JP2010032861A (ja) * 2008-07-30 2010-02-12 Morita Mfg Co Ltd 医療用実習装置
US7698565B1 (en) 2000-03-30 2010-04-13 Digitalpersona, Inc. Crypto-proxy server and method of using the same
WO2011052412A1 (ja) * 2009-10-28 2011-05-05 日本電気株式会社 音声認識システム、音声認識要求装置、音声認識方法、音声認識用プログラムおよび記録媒体
WO2016017229A1 (ja) * 2014-07-30 2016-02-04 株式会社東芝 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
WO2023182015A1 (ja) * 2022-03-22 2023-09-28 パナソニックIpマネジメント株式会社 音声認証装置および音声認証方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6615171B1 (en) 1997-06-11 2003-09-02 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
JP2001216270A (ja) * 2000-01-31 2001-08-10 Netmarks Inc 認証局、認証システム及び認証方法
US7698565B1 (en) 2000-03-30 2010-04-13 Digitalpersona, Inc. Crypto-proxy server and method of using the same
US7409543B1 (en) 2000-03-30 2008-08-05 Digitalpersona, Inc. Method and apparatus for using a third party authentication server
US7895432B2 (en) 2000-03-30 2011-02-22 Digitalpersona, Inc. Method and apparatus for using a third party authentication server
US7039951B1 (en) 2000-06-06 2006-05-02 International Business Machines Corporation System and method for confidence based incremental access authentication
JP4660900B2 (ja) * 2000-08-31 2011-03-30 ソニー株式会社 個人認証適用データ処理システム、個人認証適用データ処理方法、および情報処理装置、並びにプログラム提供媒体
JP2002073566A (ja) * 2000-08-31 2002-03-12 Sony Corp 個人認証適用データ処理システム、個人認証適用データ処理方法、および情報処理装置、並びにプログラム提供媒体
JP2010032861A (ja) * 2008-07-30 2010-02-12 Morita Mfg Co Ltd 医療用実習装置
WO2011052412A1 (ja) * 2009-10-28 2011-05-05 日本電気株式会社 音声認識システム、音声認識要求装置、音声認識方法、音声認識用プログラムおよび記録媒体
JP5621993B2 (ja) * 2009-10-28 2014-11-12 日本電気株式会社 音声認識システム、音声認識要求装置、音声認識方法、及び音声認識用プログラム
US9520129B2 (en) 2009-10-28 2016-12-13 Nec Corporation Speech recognition system, request device, method, program, and recording medium, using a mapping on phonemes to disable perception of selected content
US9905227B2 (en) 2009-10-28 2018-02-27 Nec Corporation Speech recognition system, request device, method, program, and recording medium, using a mapping on phonemes to disable perception of selected content
WO2016017229A1 (ja) * 2014-07-30 2016-02-04 株式会社東芝 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
US10276191B2 (en) 2014-07-30 2019-04-30 Kabushiki Kaisha Toshiba Speech section detection device, voice processing system, speech section detection method, and computer program product
WO2023182015A1 (ja) * 2022-03-22 2023-09-28 パナソニックIpマネジメント株式会社 音声認証装置および音声認証方法

Also Published As

Publication number Publication date
JP3601631B2 (ja) 2004-12-15

Similar Documents

Publication Publication Date Title
US6615171B1 (en) Portable acoustic interface for remote access to automatic speech/speaker recognition server
US5717743A (en) Transparent telephone access system using voice authorization
US8943583B2 (en) System and method for managing sonic token verifiers
EP1481535B1 (en) System and method for wireless two factor authentication
US20030149881A1 (en) Apparatus and method for securing information transmitted on computer networks
JP6738867B2 (ja) 話者認証方法及び音声認識システム
US20020007462A1 (en) User authentication system
CN108062464A (zh) 基于声纹识别的终端控制方法及系统
CN100450120C (zh) 用于防止信息处理设备的未授权使用的装置和方法
KR20010023964A (ko) 음성 거래를 보안하기 위한 시스템 및 방법
US20030220095A1 (en) Biometric authentication of a wireless device user
CN102752453A (zh) 基于语音识别的手机解锁方法
JP3601631B2 (ja) 話者認識システムおよび話者認識方法
KR20160133463A (ko) 동적 음향 보안 정보에 의해 사람 및/또는 객체를 식별 혹은 인증하기 위한 방법 및 디바이스
KR20070105072A (ko) 인터넷 전자결제 서비스 시스템에서 음성신호를 이용한일회용 비밀번호 인증 시스템 및 그 방법
JP2004080080A (ja) 個人認証機能付き携帯電話機
JP2002269047A (ja) 音声ユーザ認証システム
KR20090126354A (ko) 이동 통신 단말기를 이용한 인식 시스템 및 방법
JP3522421B2 (ja) 話者認識システムおよび話者認識方法
JP3592415B2 (ja) 話者認識システム
JP2001144865A (ja) 携帯電話を用いた認証システム
US9646437B2 (en) Method of generating a temporarily limited and/or usage limited means and/or status, method of obtaining a temporarily limited and/or usage limited means and/or status, corresponding system and computer readable medium
US20060190735A1 (en) Method of entering a security code for a network apparatus
JP3506293B2 (ja) 話者識別システム
JPS5911146B2 (ja) 暗証番号入力方法とその装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040915

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101001

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111001

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees