JPH09127973A

JPH09127973A - 話者認識システムおよび話者認識方法

Info

Publication number: JPH09127973A
Application number: JP7306556A
Authority: JP
Inventors: Junichiro Fujimoto; 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1995-10-31
Filing date: 1995-10-31
Publication date: 1997-05-16
Anticipated expiration: 2015-10-31
Also published as: JP3522421B2

Abstract

(57)【要約】【課題】利用者が例えば銀行の窓口などに出向かずと
も、話者認識を行なうことができ、銀行などで提供され
ている入出金，残高照会などのアプリケーションを利用
できる。【解決手段】少なくとも１つの端末３１と中央装置３
２とが、情報を送受信可能に設けられており、端末３１
には、話者の音声を入力し音声信号とする音声入力手段
１と、音声信号の特徴量を抽出する特徴抽出部４と、特
徴抽出部４からの話者の音声の特徴量と話者認識用情報
としての音声特徴量とを照合して話者認識を行なう話者
認識部７とが設けられ、また、中央装置３２には、話者
認識用情報を管理する話者認識管理手段１０が設けられ
ており、端末３１において話者認識に用いられる話者認
識用情報は、中央装置３２から端末３１に転送され、ま
た、端末３１において得られた話者認識結果は、中央装
置３２に転送される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、話者認識を行なう
話者認識システムおよび話者認識方法に関する。

【０００２】

【従来の技術】従来、銀行などにおいて、例えば入出
金，残高照会などのアプリケーションを利用者が利用す
る際、この利用者が正規の利用者本人であることを確認
するために、暗証番号などを利用者に入力させるように
している。また、コンピュータでは、パスワードと称し
て、暗証番号と同様の暗証文字列を利用者に入力させる
ことによって本人の確認を行なっている。しかしなが
ら、このような暗証番号や暗証文字列などの入力による
確認は、他人が、暗証番号や暗証文字列を知りさえすれ
ば、難無く、これを盗用することができる。しかも、暗
証番号や暗証文字列は、それを登録した者(本人)の生年
月日や記念日、あるいは電話番号、氏名の綴りなどを利
用したものが多く、他人がこれを見破ることは差程難し
いことではない。

【０００３】暗証番号や暗証文字列のこのような欠点を
回避するため、近年、声によって本人か否かを判定す
る、いわゆる話者認識が着目されている。この話者認識
は、ある話者が発声した音声の特徴量(特徴パターン)
が、予め登録されているこの話者の音声標準パターンと
一致するか否かを調べることにより、本人か否かを判定
(認識)するものである。すなわち、話者の音声から抽出
した特徴量(特徴パターン)とこの話者の音声標準パター
ンとの類似度を計算し、類似度の高低によって本人か否
かを判定するものであり、人間の肉体的特徴を利用する
ものであることから、音声は、暗証番号や暗証文字列に
比べて他人がこれを真似ることは難かしく、従って、他
人の盗用をより有効に防止することができる。

【０００４】

【発明が解決しようとする課題】しかしながら、このよ
うな話者認識システムは、従来一般的に、例えば銀行の
窓口などに設置され、従って、話者認識を行なうために
は、利用者は、その都度、銀行の窓口等へ出向かなけれ
ばならないという問題があった。

【０００５】本発明は、利用者が例えば銀行の窓口など
に出向かずとも、話者認識を行なうことができ、銀行な
どで提供されている入出金，残高照会などのアプリケー
ションを利用することの可能な話者認識システムおよび
話者認識方法を提供することを目的としている。

【０００６】

【課題を解決するための手段】上記目的を達成するため
に、請求項１記載の発明は、少なくとも１つの端末と中
央装置とが、情報を送受信可能に設けられており、端末
には、話者の音声を入力し音声信号とする音声入力手段
と、音声信号の特徴量を抽出する特徴抽出手段と、特徴
抽出手段からの話者の音声の特徴量と話者認識用情報と
しての音声特徴量とを照合して話者認識を行なう話者認
識手段とが設けられ、また、中央装置には、話者認識用
情報を管理する話者認識管理手段が設けられており、端
末において話者認識に用いられる話者認識用情報は、中
央装置から端末に転送され、また、端末において得られ
た話者認識結果は、中央装置に転送されるようになって
いることを特徴としている。

【０００７】また、請求項２記載の発明は、少なくとも
１つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末には、話者の音声を入力し音声信号とす
る音声入力手段と、音声信号の特徴量を抽出する特徴抽
出手段と、話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出する類似度算出手段とが
設けられ、また、中央装置には、話者認識用情報を管理
する話者認識管理手段と、端末の類似度算出手段からの
類似度に基づき話者の判定を行なう判定手段とが設けら
れており、端末において、類似度算出に用いられる話者
認識用情報は、中央装置から端末に転送され、また端末
の類似度算出手段で算出された類似度は、端末から中央
装置に転送されるようになっていることを特徴としてい
る。

【０００８】また、請求項３記載の発明は、少なくとも
１つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末には、話者の音声を入力し音声信号とす
る音声入力手段と、音声信号の特徴量を抽出する特徴抽
出手段と、話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出する類似度算出手段と、
類似度算出手段からの類似度に基づき話者の判定を行な
う第１の判定手段とが設けられ、また、中央装置には、
端末の類似度算出手段からの類似度に基づき話者の判定
を行なう第２の判定手段とが設けられており、端末の類
似度算出手段で算出された類似度は、端末の第１の判定
手段に与えられるか、または、端末から中央装置の第２
の判定手段に転送されるようになっていることを特徴と
している。

【０００９】また、請求項４記載の発明は、請求項１，
請求項２または請求項３記載の話者認識システムにおい
て、さらに、中央装置から端末には、所定の情報が転送
され、端末に設けられている特徴抽出手段は、中央装置
から提供された情報に基づいて、入力された音声を特徴
量に変換することを特徴としている。

【００１０】また、請求項５記載の発明は、請求項１ま
たは請求項２記載の話者認識システムにおいて、話者認
識管理手段によって管理されている話者認識用情報の変
更修正は、決められた端末からの情報でのみなされるこ
とを特徴としている。

【００１１】また、請求項６記載の発明は、請求項１ま
たは請求項２記載の話者認識システムにおいて、中央装
置からの１人の話者認識用情報は、１つの端末のみにし
か同時には供給することができないように構成されてい
ることを特徴としている。

【００１２】また、請求項７記載の発明は、少なくとも
１つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量とを照合して話
者認識を行なうようになっており、この際、端末におい
て話者認識に用いられる話者認識用情報は、中央装置か
ら端末に転送され、また、端末において得られた話者認
識結果は、中央装置に転送されることを特徴としてい
る。

【００１３】また、請求項８記載の発明は、少なくとも
１つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量との類似度を算
出するようになっており、この際、端末において類似度
算出に用いられる話者認識用情報は、中央装置から端末
に転送され、また、端末で算出された類似度は、端末か
ら中央装置に転送され、中央装置では、転送された類似
度に基づき話者の判定を行なうことを特徴としている。

【００１４】また、請求項９記載の発明は、少なくとも
１つの端末と中央装置とが、情報を送受信可能に設けら
れており、端末においては、話者の音声が入力される
と、該音声信号の特徴量を抽出し、該話者の音声の特徴
量と話者認識用情報としての音声特徴量との類似度を算
出するようになっており、端末で算出された類似度は、
端末において話者の判定に用いられるか、または、端末
から中央装置に転送されて中央装置において話者の判定
に用いられることを特徴としている。

【００１５】また、請求項１０記載の発明は、請求項
７，請求項８または請求項９記載の話者認識方法におい
て、端末が該端末の中だけの処理を行なうのか、外部の
装置との間で情報の送受信を行なうのかに応じて、話者
の判定のしきい値を変化させることを特徴としている。

【００１６】

【発明の実施の形態】図１は一般的な話者認識システム
の構成例を示す図である。図１を参照すると、この話者
認識システムは、例えば銀行などにおける本人の確認を
話者認識により行なうためのものであって、利用者の音
声を入力するための音声入力手段(例えば、マイクロフ
ォン)１と、利用者に所定の指定情報を入力させるため
の指定手段(例えばキーボード)２と、音声入力手段１か
ら入力された信号の中から話者の音声の部分のみを音声
区間として検出する音声区間検出部３と、音声区間検出
部３で検出した音声区間内の音声信号から特徴量(特徴
パターン)を抽出する特徴抽出部４と、話者認識を行な
うに先立って話者の音声の標準的な特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部５に予
め登録する登録部６と、利用者(話者)の音声の特徴量
(特徴パターン)と話者認識用情報記憶部５に登録されて
いる標準パターンとを照合し、その類似度に基づいて話
者認識を行なう話者認識部７と、標準パターンの登録を
行なう登録モードと話者認識を行なう認識モードとの切
替を行なう切替部(例えばスイッチ)８とを有している。

【００１７】ここで、特徴抽出部４は、音声信号を特徴
量(特徴パターン)として、スペクトルに変換しても良い
し、あるいはＬＰＣケプストラムに変換しても良く、特
徴量の種類については特に限定するものではない。な
お、スペクトルに変換するためには、特徴量変換にはＦ
ＦＴを用い、また、ＬＰＣケプストラムに変換するため
にはＬＰＣ分析などを用いるのがよい。

【００１８】また、標準パターンの登録時(登録モード
時)において、登録部６は、ある話者が発声した音声に
基づいて特徴抽出部４で抽出された特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部５に登
録する際、図２に示すように、この話者により指定手段
２から入力された指定情報(例えば、この話者の名前や
生年月日，あるいはこの話者の暗証番号など)と対応付
けて、標準パターンを話者認識用情報記憶部５に登録す
ることができる。換言すれば、話者認識用情報記憶部５
には、話者認識に必要な話者認識用の情報が登録される
ようになっており、また、この話者認識用情報記憶部５
には、複数の話者(例えば利用者Ａ，Ｂ，Ｃ，Ｄ，…)の
話者認識用情報が登録可能となっている。

【００１９】また、話者認識用情報記憶部５に登録され
る音声の標準パターンとしては、この話者認識システム
の使用形態等に応じて、各利用者(話者)に予め言葉を発
声させたものであっても良いし、各利用者ごとにそれぞ
れ自由に所望の言葉を発声させたものであっても良い。

【００２０】また、話者認識部７は、例えば、古井著
「ディジタル音声処理」(東海出版会)などに記載されて
いるように、現在の話者の音声の特徴パターンが話者認
識用情報記憶部５に登録されている複数の話者の標準パ
ターンのうちのどれに最も類似しているかを判定し、登
録されている複数の話者のうちから１人の話者を識別す
る話者識別方式のものであっても良いし、話者認識用情
報記憶部５に登録されている複数の話者の標準パターン
から現在の話者に対応する標準パターンを取り出し、こ
の標準パターンと現在の話者の特徴パターンとを照合
し、その類似度が所定基準値(しきい値)よりも高いか低
いかにより現在の話者が正規の話者本人であるか否かを
判定する話者照合方式のものであっても良い。

【００２１】さらに、話者認識部７は、話者認識用情報
記憶部５に登録される音声の標準パターンが各利用者
(話者)に予め言葉を発声させたものである場合には、こ
れに対応した認識を行なうものにすることができ、ま
た、話者認識用情報記憶部５に登録される音声の標準パ
ターンが各利用者ごとにそれぞれ自由に所望の言葉を発
声させたものである場合には、これに対応した認識を行
なうものにすることができる。但し、各利用者(話者)に
予め決められた言葉を発声させて話者認識を行なう場
合、類似の判定基準(しきい値)を各話者に対して全て一
定値にすることができるが、各利用者ごとにそれぞれ所
望の言葉を発声させて話者認識を行なう場合には、類似
の判定基準(しきい値)を各話者ごとに相違させることも
できる。

【００２２】以下では、説明の便宜上、話者認識システ
ムは、各利用者(話者)に予め決められた言葉(特定の言
葉)を発声させるものとし、また、話者認識部７では、
話者照合方式の話者認識がなされるとする。なお、話者
認識部７において、話者照合方式の話者認識がなされる
場合、この話者認識時に、利用者(話者)は、指定手段２
から登録モード時に入力した指定情報と同じ指定情報を
入力する必要がある。これにより、話者認識部７では、
話者認識用情報記憶部５に登録されている複数の話者の
標準パターンのうちから現在の話者に対応する標準パタ
ーンを取り出すことができ、この標準パターンと現在の
話者の音声の特徴パターンとの照合を行なうことができ
る。

【００２３】このような構成の話者認識システムを利用
者(例えばＤ)が始めて利用する場合、この利用者(話者)
Ｄは、先ず、自己の音声を標準パターンとして登録する
必要がある。このため、この利用者Ｄは、切替部(例え
ばスイッチ)８を操作して、特徴抽出部４を登録部６に
接続し、登録モードに設定する。

【００２４】次いで、利用者(話者)Ｄは、指定手段２か
ら所定の指定情報，例えば(利用者Ｄ)を入力する。ま
た、この際、利用者は、予め決められた特定の言葉を発
声する。この音声は、音声入力手段１から入力し、音声
区間検出部３，特徴抽出部４により、特徴量(特徴パタ
ーン)に変換され、この話者の音声の標準パターンとし
て、登録部６に与えられる。

【００２５】これにより、登録部６は、この利用者(話
者)Ｄの音声の標準パターンを指定手段２から入力され
た指定情報と対応付けて、話者認識用情報記憶部５に登
録する。例えば過去に、この話者認識用情報記憶部５に
複数の利用者(異なる利用者)Ａ，Ｂ，Ｃが自己の音声を
標準パターンとして登録しており、現在の利用者Ｄが上
記のように自己の音声を標準パターンとして登録すると
き、この標準パターンは、話者認識用情報記憶部５に図
２に示すように記憶(登録)される。

【００２６】このようにして、この音声の標準パターン
が話者認識用情報記憶部５に記憶されると、利用者Ｄ
は、この話者認識システムにより、利用者Ｄについての
話者認識を行なわせることができる。すなわち、この利
用者Ｄは、このシステムを用いて、いま利用している利
用者が利用者Ｄ本人であるか否かの判定を行なわせるこ
とができる。

【００２７】具体的に、利用者Ｄが以後、このシステム
を利用する場合、利用者Ｄは、切替部８を操作して、特
徴抽出部４を話者認識部７に接続し、このシステムを認
識モードに設定する。

【００２８】次いで、利用者Ｄは、指定手段２から所定
の指定情報，例えば(利用者Ｄ)を入力する。また、この
際、利用者Ｄは、予め決められた特定の言葉を発声す
る。この音声は、音声入力手段１から入力し、音声区間
検出部３，特徴抽出部４により、特徴量(特徴パターン)
に変換されて、話者認識部７に与えられる。

【００２９】これにより、話者認識部７は、指定手段２
から入力された指定情報(利用者Ｄ)に対応させて登録さ
れている標準パターンを話者認識用情報記憶部５から取
り出し、この標準パターンと特徴抽出部４からの特徴パ
ターンとを照合して、その類似度を算出し、この類似度
が所定基準値よりも高いか低いかを判定する。この結
果、類似度が低いと判定されたときには、利用者が正規
の話者本人Ｄではないと判別し、この利用者による利用
を拒絶する。これに対し、類似度が高いと判定されたと
きには、利用者が正規の話者本人Ｄであると判別し、利
用者による利用を許可する。すなわち、利用者によるア
プリケーション(例えば入出金，残高照会などの処理)の
利用を許可する。

【００３０】ところで、図１のような話者認識システム
は、従来一般的に、例えば銀行の窓口などに設置され、
従って、話者認識を行なうためには、利用者は、その都
度、銀行の窓口等へ出向かなければならないという問題
があった。

【００３１】本発明は、このような問題を回避し、利用
者が、利用者の自宅において、あるいは利用者の会社等
において、話者認識を行なうことができて、銀行などの
アプリケーション(入出金，残高照会などのアプリケー
ション)等を利用できるようにすることを意図してい
る。

【００３２】図３は本発明に係る話者認識システムの第
１の構成例を示す図である。この第１の構成例では、話
者認識システムは、少なくとも１つの端末３１−１〜３
１−ｎと中央装置３２とが、情報を送受信可能に設けら
れている(例えば有線あるいは無線の通信手段３３−１
〜３３−ｎによって通信可能に設けられている)。ここ
で、各端末３１−１〜３１−ｎは、説明の便宜上、同じ
構成のものであるとする。

【００３３】図３の構成例では、図１の構成例におい
て、音声入力手段１(あるいは、さらに、音声区間検出
部３)，特徴抽出部４，話者認識部７が端末側に設けら
れ、また、話者認識管理手段１０が中央装置３２に設け
られたものとなっている。なお、ここで、話者認識管理
手段１０は、図１の話者認識用情報記憶部５，登録部６
の機能を有し、さらに、これに話者認識全体の管理，制
御機能をももたせることもできる。また、図１の切替部
８の機能は、端末側にもたせても良いし、中央装置３２
側にもたせても良いが、以下では、便宜上、切替部８の
機能は、端末側に設けられているものとする。

【００３４】図４は図３の話者認識システムの具体例を
示す図である。なお、図４では、簡単のため、１つの端
末３１−１だけが図示されているが、他の端末３１−２
〜３１−ｎも、端末３１−１と同様の構成のものである
とする。図４を参照すると、端末３１−１には、音声入
力手段１，指定手段２，音声区間検出部３，特徴抽出部
４，話者認識部７，切替部８が設けられ、さらに、端末
３１−１には、中央装置３２との間で情報を通信手段
(例えば電話回線あるいは無線)３３−１を介して送受信
するための送受信インタフェース部３４−１が設けられ
ている。また、中央装置３２には、話者認識用情報記憶
部５，登録部６が設けられ、さらに中央装置３２には、
各端末３１−１〜３１−ｎとの間で情報を送受信するた
めの送受信インタフェース部３５が設けられている。

【００３５】ここで、各端末３１−１〜３１−ｎとして
は、例えばパソコン(マイクロフォン，Ａ／Ｄ変換など
の音声取込機能を備えたパソコン)を用いることが可能
であって、各端末３１−１〜３１−ｎの利用者は、自己
の端末を、例えば自宅や会社において、保有することが
できる。より具体的に、各端末３１−１〜３１−ｎに
は、既存のパソコン(パソコン通信機能を備えたパソコ
ン)を用いることができ、この場合、図４の構成例にお
いて、端末３１−１の送受信インタフェース部３４−１
は、例えば、パソコンに内蔵されているモデムとして実
現され、また、音声入力手段１は、パソコンに設けられ
ているマイクロフォンで実現され、指定手段２はパソコ
ンのコンソールで実現され、音声区間検出部３，特徴抽
出部４，話者認識部７は、パソコンに搭載されるソフト
ウェア，例えば、音声区間検出ソフト，特徴抽出ソフ
ト，話者認識ソフトとして実現される。

【００３６】また、図４の構成例において、中央装置３
２の送受信インタフェース３５には、例えば交換器を用
いることができる。また、登録部６は、この中央装置に
搭載される登録ソフトとして実現され、話者認識用情報
記憶部５には、中央装置３２に設けられているメモリを
用いることができる。

【００３７】また、図４の構成例において、端末側に設
けられている切替部８は、例えば、端末側の利用者によ
って操作されるスイッチとして構成できる。

【００３８】ここで、話者認識用情報記憶部５には、話
者認識用情報として、例えば、図２に示したように、指
定情報と対応付けて標準パターンが記憶され、この場
合、端末側において話者認識がなされるときに、その旨
の指示が端末から中央装置３２に転送されると、中央装
置３２側では、話者認識用情報記憶部５に記憶されてい
る話者認識用情報を読出して、これを端末に伝送するよ
うになっている。これにより、端末側の話者認識部７
は、ある話者の音声の特徴パターンを、中央装置３２か
ら伝送された話者認識用情報の標準パターンと照合し
て、この話者の特徴パターンと標準パターンとの類似度
を求めて、話者認識を行なうことができる。より具体的
には、端末側において例えば話者照合方式の話者認識が
なされるときに、中央装置３２からは、この端末の指定
手段２からの指定情報に対応した標準パターンを話者認
識用情報として端末に伝送できる。

【００３９】このような話者認識システムでは、標準パ
ターンの登録(さらには標準パターンの変更あるいは更
新)，話者認識を行なうために、利用者は、利用者の家
庭や会社等に設置されている端末を操作することによっ
て、例えば銀行の窓口などに設置されている中央装置
(例えば話者認識装置ユニット)に対し、標準パターンの
登録操作，話者認識操作を、前述したと同様にして行な
うことができる。

【００４０】例えば、標準パターンの登録を行なうと
き、利用者は、自己の端末，例えば３１−１の切替部８
を操作して、特徴抽出部４が送受信インタフェース３４
−１と直接接続するよう切替設定する。次いで、この利
用者が、指定手段２から所定の指定情報，例えば(利用
者Ｄ)を入力すると、この指定情報は、通信手段３３−
１を介して中央装置３２に伝えられる。また、この際、
利用者Ｄは、予め決められた特定の言葉を発声する。こ
の音声は、音声入力手段１から入力し、例えば音声区間
検出部３から音声信号として出力され、特徴抽出部４で
特徴量に変換されて、通信手段３３−１を介して中央装
置３２に伝送される。これにより、中央装置３２の登録
部６では、伝送された指定情報に対応させて、伝送され
た特徴量(特徴パターン)信号を標準パターンとして、話
者認識用情報記憶部５に登録することができる。

【００４１】また、この話者認識システムにおいて、話
者認識を行なうとき、利用者は、自己の端末，例えば３
１−１の切替部８を話者認識部７側に切替設定する。次
いで、この利用者が、指定手段２から所定の指定情報，
例えば(利用者Ｄ)を入力すると、この指定情報は、通信
手段３３−１を介して中央装置３２に伝えられ、これに
より、中央装置３２からは、話者認識用情報として、例
えば、この指定情報に対応した標準パターン，例えば利
用者Ｄの標準パターンが話者認識用情報記憶部５から読
出されて、端末に伝送される。次いで、端末の利用者Ｄ
は、予め決められた特定の言葉を発声する。この音声
は、音声入力手段１から入力し、例えば音声区間検出部
３から音声信号として出力され、特徴抽出部４により特
徴量(特徴パターン)に変換されて、話者認識部７に与え
られる。

【００４２】これにより、端末の話者認識部７は、中央
装置３２から伝送された話者認識用情報(すなわち上記
例では標準パターン)と特徴抽出部４からの特徴パター
ンとを照合して、その類似度を算出し、この類似度が所
定基準値(しきい値)よりも高いか低いかを判定し(すな
わち、利用者が正規の利用者か否かを判定し)、この判
定結果を中央装置３２に伝送する。中央装置３２では、
端末からの判定結果に基づいて、アプリケーションを許
可するか否かを決定する。

【００４３】すなわち、中央装置３２は、類似度が低い
との判定結果が伝送されたときには、利用者が正規の話
者本人Ｄではないと判別し、この利用者による利用を拒
絶する。これに対し、類似度が高いとの判定結果が伝送
されたときには、利用者が正規の話者本人Ｄであると判
別し、利用者によるアプリケーション(例えば入出金，
残高照会などの処理)の利用を許可する。

【００４４】このように、この話者認識システムでは、
利用者の自宅あるいは会社等に設置されている端末(例
えばパソコン)を用いて、話者認識を行なわせ、その判
定結果を、銀行などに設置されている中央装置(例えば
話者認識装置ユニット)に伝送し、中央装置において、
この判定結果に基づき、本人であることが確認された
後、入出金，残高照会などのアプリケーションを利用す
ることができる。すなわち、利用者は、銀行等にその都
度出向かずとも、自宅や会社などに設置されている端末
に話者認識を行なわせ、銀行等のアプリケーションを利
用することができる。

【００４５】また、この構成例では、利用者側の端末と
して、既存のパソコン(パソコン通信機能を備えたパソ
コン)を用いることができる。

【００４６】さらに、この構成例では、話者認識部７か
らの判定結果を通信手段(例えば電話回線や無線など)を
介して中央装置３２に送信するようにしているので、通
信手段(電話回線や無線など)の品質や通信環境が多少悪
い場合でも、判定結果信号は、影響を受けにくく、従っ
て、中央装置３２では、伝送された判定結果に基づき、
利用者にアプリケーションを利用させるか否かの判断を
正しく行なうことができる。また、判定結果信号は、デ
ータ量が極めて少なく、伝送時間を著しく短縮すること
ができる。

【００４７】さらに、この構成例では、端末側に、音声
区間検出部３，特徴抽出部４，話者認識部７が設けられ
ていることによって、利用者は、自己の声の特性に適合
するよう、音声区間検出部３の特性，特徴抽出部４の特
性などを管理することができる。例えば、自己の声の音
量や音質に合わせて、音声区間検出の感度(声の大きさ
のしきい値)などを調整したりすることができる。

【００４８】なお、一般に、話者認識部７は、特徴パタ
ーンと標準パターンとの類似度を算出する機能と算出さ
れた類似度がしきい値よりも高いか低いかを判定する機
能とを有し、これらの機能を、１つのブロックで構成す
ることもできるが、類似度算出部，判定部として別々の
ブロック(ソフト)として構成することもできる。

【００４９】この場合には、例えば、図５に示すよう
に、端末３１−１側に、類似度算出部６０を設け、中央
装置３２側に、判定部６２を設けて、端末の類似度算出
部６０で算出された特徴パターンと標準パターンとの類
似度を、通信手段３３を介して中央装置の判定部６２に
伝送し、中央装置の判定部６２において話者の判定を行
なうように構成することもできる。なお、この場合に
も、図３，図４の構成例と同様に、端末において、類似
度算出に用いられる話者認識用情報は、中央装置から端
末に転送することができる。

【００５０】また、あるいは、図６に示すように、端末
３１−１側に、類似度算出部６０，判定部６１を設け、
また、中央装置３２側に、端末の判定部６１とは別に、
判定部６２を設けて、端末の類似度算出部６０で算出さ
れた特徴パターンと標準パターンとの類似度を、場合に
応じて、端末３１−１の判定部６１に与えて端末側にお
いて話者の判定を行なうか、中央装置３２の判定部６２
に与えて中央装置側で話者の判定を行なうかを選択する
ように構成することもできる。すなわち、図６の構成例
では、端末３１−１内において、類似度算出部６０と判
定部６１とにより、第１の話者認識部が構成され、ま
た、中央装置３２側では、端末の類似度算出部６０と中
央装置の判定部６２とにより、第２の話者認識部が構成
されており、第１の話者認識部で話者認識を行なうか、
第２の話者認識部で話者認識を行なうかを選択可能にな
っている。

【００５１】なお、図６の構成例においても、話者認識
用情報(標準パターンなど)については、中央装置３２の
話者認識管理手段１０だけにより一括管理し、端末内だ
けの処理を行なう場合にも、中央装置３２から転送させ
ることもできるが、中央装置３２に設定されている話者
認識用情報(標準パターンなど)とは別の話者認識用情報
(標準パターンなど)を端末にも用意し、端末内だけで話
者認識を行なう場合には、標準パターンを中央装置から
伝送させることなく、端末内に設けられている話者認識
用情報(標準パターンなど)を用いることもできる。

【００５２】ところで、一般に、正規の利用者本人が話
者認識のために発声した音声の特徴量(特徴パターン)と
この利用者本人によって予め登録されている音声の特徴
量(標準パターン)との間には、時間的なへだたりがある
ため、同じ発声者の音声であっても、特徴パターンが標
準パターンと完全に一致することは稀であり、通常は、
いくらか相違している。従って、端末の話者認識部７に
おいて、特徴パターンと標準パターンとの類似度に対す
る判定のしきい値は、適宜なものに設定されている必要
がある。

【００５３】しかしながら、この判定のしきい値を高く
設定すると、話者認識の精度を高めることができるが、
反面、正規の利用者本人の音声であるにもかかわらず、
正規の利用者本人ではないと判定されてしまう確率が高
くなり、本人が利用しにくくなってしまう。一方、この
判定のしきい値を低く設定すると、正規の利用者本人以
外の他人の音声を正規の利用者本人の音声であると誤認
識する確率が高くなり、正規の利用者本人の情報が他人
に盗まれ、悪用される恐れが増加する。従って、しきい
値を常に一定の適宜なものに設定して話者認識を行なう
のは、難かしい場合がある。

【００５４】本発明は、このような互いに相反する問題
を良好に解決する話者認識システムおよび話者認識方法
をさらに提供することを意図しており、このような問題
を解決するため、本発明では、場合に応じて、判定のし
きい値，すなわち認識精度を可変に設定して、話者認識
を行なうようにしている。

【００５５】より具体的に、この端末(例えばパソコン)
に搭載されている話者認識機能をこの端末の中だけで利
用する場合(例えば、この端末の立ち上げ操作を行なう
ような、端末内だけのアプリケーションに利用する場
合)には、例えば通信回線等を介して他人に盗まれる恐
れが少ないので、判定のしきい値を低く設定して(認識
精度を低下させて)、正規の利用者本人の音声が、利用
者本人の音声であると判定される確率を高めるようにす
る。

【００５６】また、この端末(例えばパソコン)に搭載さ
れている話者認識機能を、他の装置(例えば他の端末や
中央装置)と関連させてあるいは協働させて利用する場
合(例えば対外的に利用するような場合)には、例えば通
信回線等を介して他人に盗まれる恐れがあるので、判定
のしきい値を高く設定し(認識精度を高め)、これによ
り、正規の利用者本人の情報が他人に盗まれるのを防止
する。

【００５７】なお、本発明のこのような機能(認識精度
を可変にする機能)は、図３，図４の構成例において、
例えば、１つの端末，例えば３１−１内に複数のしきい
値を用意しておき、この端末の処理に応じて(例えば、
この端末がこの端末の中だけの処理を行なうのか、外部
の装置との間で情報の送受信を行なうのかに応じて)、
複数のしきい値のうちから最適なものを話者認識部７が
選択して用いることで、実現できる。

【００５８】あるいは、図３，図４の構成例において、
端末内に全てのしきい値を用意しておくかわりに、例え
ば、端末の中だけの処理用のしきい値については、この
端末内に用意しておき、外部の装置との間での処理用の
しきい値については、この端末が外部の装置(例えば中
央装置)と通信接続されたときに、例えば中央装置の話
者認識管理手段１０から伝送させることもできる。

【００５９】例えば、この端末において話者認識を行な
うとき、この端末に、中央装置の話者認識管理手段１０
から、この端末の利用者用の標準パターンを転送する
際、この標準パターンとともに、付随情報として、この
端末の中央装置との間での処理用のしきい値を転送させ
るようにすることもできる。

【００６０】この場合には、話者，例えば利用者Ｄが、
例えば端末３１−１から(利用者Ｄ)であることを入力す
ると、電話線あるいは無線等の通信手段を介して、中央
装置の話者認識管理手段１０へ伝達され、これにより、
中央装置の話者認識管理手段１０では、その話者に対応
した音声標準パターンと、付随情報として類似度のしき
い値とを、この端末３１−１へ返送し、端末３１−１で
は、話者認識部７において、本人であるか否かを判定す
るに際し、中央装置３２の管理手段１０から送られたし
きい値を用いることができる。これにより、中央装置３
２の話者認識管理手段１０によって、端末３１−１の認
識精度を制御することもできる。

【００６１】このように、図３，図４の構成例におい
て、しきい値を場合に応じて、変えて用いることで(例
えば、端末内だけの処理の場合は、類似度のしきい値と
してより低いしきい値を用い、外部との装置との間での
処理の場合は、類似度のしきい値としてより高い値を用
いることで)、例えば、同じパソコンを端末として使っ
ていても、そのパソコンの中だけの認識する場合は、パ
ソコンの中で設定された緩やかな判定で、また、他の装
置とつながった時には、厳しい判定で、話者認識を実現
することができる。

【００６２】また、認識精度を可変にする機能は、図６
の構成例では、例えば、端末の判定部６１において用い
られるしきい値については、端末内において用意し、ま
た、中央装置３２の判定部６２において用いられるしき
い値については、中央装置３２内において用意すること
で、実現できる。

【００６３】すなわち、図６の構成では、端末の利用者
が、この端末内だけのアプリケーションのために話者認
識を行なおうとする場合には、類似度算出部６０から算
出される類似度をこの端末内の判定部６１に与えて判定
させるように、この端末に対して指示を与える。

【００６４】この場合、この端末の利用者が話者認識の
ための音声を発生すると、この音声特徴量(特徴パター
ン)は、この端末の類似度算出部６０で標準パターン(例
えば、この端末内に予め用意された標準パターン)との
類似度が算出され、この類似度は、この端末の話者認識
部７の判定部６１に与えられる。判定部６１において
は、この端末内に予め用意された所定のしきい値に対し
て類似度が高いか低いかを判定することで、話者認識を
行なうことができる。

【００６５】一方、端末の利用者が、中央装置３２のア
プリケーションを利用するために話者認識を行なおうと
する場合には、この端末から中央装置３２(話者認識管
理手段１０)に所定の指示を与える。これにより、中央
装置３２は、端末からの指示に従って、例えば、標準パ
ターンをこの端末へ送る。次いで、この端末の利用者が
話者認識のための音声を発生すると、この音声特徴量
(特徴パターン)は、この端末の類似度算出部６０で標準
パターン(例えば中央装置から伝送された標準パターン)
との類似度が算出され、この類似度は、中央装置３２に
伝送され、中央装置３２の判定部６２に与えられる。中
央装置３２の判定部６２においては、中央装置３２に予
め用意された所定のしきい値に対して類似度が高いか低
いかにより、本人か否かを判定する。

【００６６】このように、図６の構成例では、端末内の
アプリケーションの利用の場合は、端末内の判定部６１
で話者認識(判定)を行なわせ、中央装置のアプリケーシ
ョンの利用の場合は、中央装置の判定部６２で話者認識
(判定)を行なわせることができ、端末の判定部６１での
判定基準(しきい値)と中央装置３２の判定部６２での判
定基準(しきい値)とを、端末と中央装置３２とで、それ
ぞれ独立に設定できるので(例えば、判定部６１では判
定基準を緩く(しきい値を低く)設定し、判定部６２では
判定基準を厳しく(しきい値を高く)設定できるので)、
場合に応じて、認識精度を相違させることができる。す
なわち、図３，図４の構成例と同様に、例えば、同じパ
ソコンを端末として使っていても、そのパソコンの中だ
けの認識する場合は、パソコンの中で設定された緩やか
な判定で、また、他の装置とつながった時には、厳しい
判定で、話者認識を実現することができる。

【００６７】このように、本発明では、例えば、同じパ
ソコンを端末として使っていても、そのパソコンの中だ
けの認識する場合は、パソコンの中で設定された穏やか
な判定で、また、他の装置とつながった時には、厳しい
判定で、話者認識を行なうことが可能となる。すなわ
ち、同じパソコンを端末として使っていても、そのパソ
コンの中だけの認識と、他の装置とつながった場合と
で、認識精度を変えることのできるような話者認識を実
現できる。

【００６８】なお、上述の各構成例において、しきい値
は、話者認識用情報とともに記憶されても良い。例えば
図３，図４の構成例において、例えば、中央装置３２の
話者認識用情報記憶部５には、図７に示すように、標準
パターンの他に、類似度のしきい値などの各種の付随情
報が記憶されても良い。このときには、例えば、端末側
の話者認識部７は、ある話者の音声の特徴パターンを、
中央装置３２の話者認識用情報記憶部５から読出され伝
送された標準パターンと照合して、この話者の特徴パタ
ーンと標準パターンとの類似度を求めたとき、この類似
度が例えば上記標準パターンとともに中央装置３２の話
者認識用情報記憶部５から読出され伝送された付随情
報，すなわち、しきい値よりも高いか低いかにより、こ
の話者が本人であるか否かを判別することができる。

【００６９】また、図３乃至図５の構成例において、例
えば話者認識用情報記憶部５に図７に示すように付随情
報として記憶されるしきい値としては、図７のように登
録されている各標準パターンごとに異なるしきい値を設
定することもできるし、登録されている全ての標準パタ
ーンに対して、同じ(一定の)しきい値を設定することも
できる。しきい値として、登録されている全ての標準パ
ターンに対して同じ(一定の)ものを用いる場合は、話者
認識用情報記憶部５(１つのメモリ)の中に１つのしきい
値だけを記憶しておいて共通に使用することができる。
同様に、図６の構成例においても、例えば端末側に設定
されるしきい値と中央装置側に設定されるしきい値との
それぞれのしきい値として、登録されている各標準パタ
ーンごとに異なるしきい値を設定することもできるし、
登録されている全ての標準パターンに対して、同じ(一
定の)しきい値を設定することもできる。

【００７０】また、上述の各構成例では、利用者は、自
分の端末以外の端末をも利用することができるが、反
面、これにより、他人が、本人の知らないところで利用
する可能性を高めることにもなる。話者認識において、
本人か否かを判定するために特に重要なものは、話者認
識用情報(特に音声の標準パターン)であり、これが悪意
で書き換えられたりすると、以後、本人が利用すること
ができなくなったり、あるいは、他人によって本人の情
報が悪用されたりすることになる。

【００７１】そこで、話者認識用情報の変更修正が、決
められた端末からの情報でのみ行なわれるよう、話者認
識システムを構成することもできる。例えば、自宅の端
末などを指定して、音声の標準パターンの書き換え，更
新等を、利用者の自宅の端末からのみ行なうことができ
るように構成することもできる。これによって、他人に
よる話者認識用情報の変更修正(書き換え)などを防止す
ることができる。

【００７２】また、上述の各構成例において、話者認識
用情報記憶部５内の話者認識用情報をフラグ管理するよ
うにすることもできる。例えば、現在使用している話者
認識用情報(標準パターン)と使用していない話者認識用
情報(標準パターン)とを区別するように、話者認識用情
報(標準パターン)に“０”または“１”のフラグを設定
して、これを管理することもできる。この場合には、こ
のフラグ管理によって、１人の話者認識用情報(標準パ
ターン)を同時に１ヵ所のみにしか供給することができ
ないようにし、使用中の話者認識用情報(標準パターン)
をそれ以外の者が使用できないようにすることもでき
る。これによって、本人が使用中の場合、他人が使用す
ることを防止できるとともに、他人が使用している時
に、本人が使用した場合、この本人は、誰かが自分の音
声標準パターンを利用していることがわかり、迅速に対
策をとることができる。

【００７３】また、例えば、図５，図６の構成例では、
端末側に、音声区間検出部３，特徴抽出部４，類似度算
出部６０が設けられていることによって、利用者は、自
己の声の特性に適合するよう、音声区間検出部３の特
性，特徴抽出部４の特性を管理することができるという
利点を有しているが、その反面、音声区間検出，特徴抽
出，類似度算出等の処理と話者判定(しきい値判定)の処
理とが、端末側と中央装置側とで分散してなされ、ま
た、分散してなされることがあるため、中央装置側の管
理者は、正規の利用者を正規の利用者と認めなかった
り、他人を正規の利用者と認識したりする、いわゆる誤
認識が発生する場合に、この原因を中央装置側だけで一
括管理することができないことがある。例えば、この原
因が、端末の音声区間検出，特徴抽出，類似度算出によ
るものか、中央装置の話者判定(しきい値)によるものか
を、中央装置側だけで判別することができないことがあ
る。

【００７４】誤認識を生じさせる原因としては、例え
ば、話者が発生した言葉の語頭や語尾が弱く、音声区間
検出が正常に行なわれず、特徴パターン上で、この部分
が欠落していることがあり、話者がこれに気付かずに何
回言い直しても同じような結果になってしまうという場
合があり、このときには、何回やり直しても正しい認識
ができない。

【００７５】このような問題を回避するため、例えば上
述の各構成例において、例えば中央装置３２(例えば話
者認識管理手段１０)から端末，例えば３１−１に所定
の情報を提供し、端末３１−１の音声区間検出部３や特
徴抽出部４などは、中央装置３２から提供された情報に
基づいて、音声区間検出や特徴量変換などを行なうこと
も可能である。

【００７６】例えば、中央装置３２側からは、情報とし
て、例えば音声区間検出の感度指示情報を提供すること
ができる。

【００７７】この場合、端末側において、利用者が当初
音声を発声し、この音声が音声区間検出されるときに、
音声区間と判定された前後に、例えば０．５秒程度のデ
ータを付加し、このデータをも含めた音声区間内の音声
信号を、そのまま端末側のファイル(図示せず)に保存す
る。このようにして、端末側で利用者の音声信号がファ
イルに保存された後、これを特徴量(特徴パターン)に変
換して、類似度算出部６０で類似度を算出し、中央装置
の判定部６２において、類似度がしきい値よりも高いか
低いかにより話者の判定を行なわせる。この結果、利用
者本人ではないと判定された場合、中央装置３２側で
は、例えば、話者認識用情報記憶部５に付随情報として
記憶されている音声区間検出の感度(声の大きさのしき
い値等)を高めて、これを端末側に、情報として提供(送
信)し、端末側において、ファイルに保存されている音
声信号に対して再度、音声区間検出を行なわせる。ま
た、話者認識用情報記憶部５に付随情報として記憶され
ている音声区間検出の感度を下げて、これを端末側に、
情報として提供(送信)し、端末側において、ファイルに
保存されている音声信号に対して再度、音声区間検出を
行なわせる。

【００７８】このようにして、音声区間検出の感度を高
めた場合と下げた場合とで、それぞれ話者認識を行な
い、いずれかで正しい話者であることが判定されれば、
この利用者を正しい話者であると認識することができ
る。このように、音声区間検出の感度を高めることによ
って、例えば話者の声が小さい場合に、音声区間が正し
く検出されないという事態(検出漏れを起こすという事
態)が生じていたのを、改善することができ、また、音
声区間検出の感度を下げることによって、例えば話者の
音声の前後に雑音が生じるような場合に、音声区間検出
部が実際よりも長い音声を検出してしまうという事態が
生じていたのを、改善することができる。

【００７９】上述の例では、中央装置３２側から端末側
に提供する情報として、音声区間検出の感度を例にとっ
たが、特徴量変換のサンプリング周波数を情報として端
末側に提供することもでき、この場合には、端末側で
は、中央装置３２からの情報によって特徴量変換のサン
プリング周波数を変えることができる。さらに、中央装
置３２側から端末側には、上記以外の種々の情報を提供
することもできる。

【００８０】このように、端末に、中央装置から所定情
報を与えることで、必要に応じて、話者認識のための音
声区間検出や特徴抽出，話者認識などを、中央装置側か
ら管理，制御することができる。

【００８１】上述の各構成例の説明では、話者認識を行
なう場合について述べたが、標準パターンの新規登録や
変更，更新についても、端末側から同様にして行なうこ
とができる。なお、中央装置側において、話者認識に用
いたデータによって、自動的に標準パターンを更新する
機能が備わっている場合は、端末側からの操作を行なわ
ずとも、中央装置側で、自動的に標準パターンの更新を
行なうことができる。

【００８２】また、上述した各構成例においては、特徴
パターンと標準パターンとの類似度を、これらが類似し
ている度合として捉えているが、これらの相違の度合と
して捉えることもできる。類似度を相違の度合として捉
える場合には、類似の度合として捉える場合と判定の仕
方が逆になり、類似度(相違度)がしきい値よりも高い場
合に、話者本人でないと判定し、類似度(相違度)がしき
い値よりも低い場合に、話者本人であると判定する。

【００８３】また上述の例では、中央装置から標準パタ
ーンを転送するときに、これとともに類似度のしきい値
も転送するようにしたが、これらを別々に(異なるタイ
ミングで)転送することもできる。

【００８４】また、上述の各構成例では、１つの端末と
中央装置３２との間で情報の送受信がなされる場合を例
にとって説明したが、例えば、１人の利用者が端末を２
台持っているような場合、標準パターンの登録機能を例
えば端末３１−１にもたせ、話者認識の機能を例えば端
末３１−２にもたせて、端末３１−１で標準パターンな
どの情報を登録して、使っている標準パターンなどの情
報を端末３１−１から端末３１−２に送って、端末３１
−２での認識に使用することもできる。

【００８５】また、上述の各構成例では、音声区間検出
部３の後に、特徴抽出部４が設けられているが、必要に
応じ、音声区間検出部３の前に、特徴抽出部４が設けら
れるように構成することも可能である。

【００８６】

【発明の効果】以上に説明したように、請求項１乃至請
求項１０記載の発明によれば、例えば利用者の自宅ある
いは会社等に設置されている端末を用いて、話者認識を
行なわせ、例えば銀行などの入出金，残高照会などのア
プリケーションを利用することができる。また、例え
ば、同じパソコンを端末として使っていても、そのパソ
コンの中だけの認識する場合は、パソコンの中で設定さ
れた緩やかな判定で、また、他の装置とつながった時に
は、厳しい判定で話者認識を実現できる。

【図面の簡単な説明】

【図１】一般的な話者認識システムの構成例を示す図で
ある。

【図２】話者認識用情報記憶部の構成例を示す図であ
る。

【図３】本発明に係る話者認識システムの構成例を示す
図である。

【図４】図３の話者認識システムの具体例を示す図であ
る。

【図５】本発明に係る話者認識システムの他の構成例を
示す図である。

【図６】本発明に係る話者認識システムの他の構成例を
示す図である。

【図７】話者認識用情報記憶部の構成例を示す図であ
る。

【符号の説明】

１音声入力手段２指示手段３音声区間検出部４特徴抽出部５話者認識用情報記憶部６登録部７話者認識部８切替部１０話者認識管理手段３１端末３２中央装置３３通信手段６０類似度算出部６１判定部６２判定部

Claims

【特許請求の範囲】

【請求項１】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末には、話
者の音声を入力し音声信号とする音声入力手段と、音声
信号の特徴量を抽出する特徴抽出手段と、前記特徴抽出
手段からの話者の音声の特徴量と話者認識用情報として
の音声特徴量とを照合して話者認識を行なう話者認識手
段とが設けられ、また、前記中央装置には、話者認識用
情報を管理する話者認識管理手段が設けられており、前
記端末において話者認識に用いられる話者認識用情報
は、前記中央装置から端末に転送され、また、前記端末
において得られた話者認識結果は、中央装置に転送され
るようになっていることを特徴とする話者認識システ
ム。
【請求項２】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末には、話
者の音声を入力し音声信号とする音声入力手段と、音声
信号の特徴量を抽出する特徴抽出手段と、話者の音声の
特徴量と話者認識用情報としての音声特徴量との類似度
を算出する類似度算出手段とが設けられ、また、前記中
央装置には、話者認識用情報を管理する話者認識管理手
段と、前記端末の類似度算出手段からの類似度に基づき
話者の判定を行なう判定手段とが設けられており、前記
端末において、類似度算出に用いられる話者認識用情報
は、中央装置から端末に転送され、また端末の類似度算
出手段で算出された類似度は、端末から中央装置に転送
されるようになっていることを特徴とする話者認識シス
テム。
【請求項３】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末には、話
者の音声を入力し音声信号とする音声入力手段と、音声
信号の特徴量を抽出する特徴抽出手段と、話者の音声の
特徴量と話者認識用情報としての音声特徴量との類似度
を算出する類似度算出手段と、類似度算出手段からの類
似度に基づき話者の判定を行なう第１の判定手段とが設
けられ、また、前記中央装置には、前記端末の類似度算
出手段からの類似度に基づき話者の判定を行なう第２の
判定手段が設けられており、前記端末の類似度算出手段
で算出された類似度は、端末の第１の判定手段に与えら
れるか、または、端末から中央装置の第２の判定手段に
転送されるようになっていることを特徴とする話者認識
システム。
【請求項４】請求項１，請求項２または請求項３記載
の話者認識システムにおいて、さらに、前記中央装置か
ら端末には、所定の情報が転送され、前記端末に設けら
れている特徴抽出手段は、中央装置から提供された情報
に基づいて、入力された音声を特徴量に変換することを
特徴とする話者認識システム。
【請求項５】請求項１または請求項２記載の話者認識
システムにおいて、前記話者認識管理手段によって管理
されている話者認識用情報の変更修正は、決められた端
末からの情報でのみなされることを特徴とする話者認識
システム。
【請求項６】請求項１または請求項２記載の話者認識
システムにおいて、中央装置からの１人の話者認識用情
報は、１つの端末のみにしか同時には供給することがで
きないように構成されていることを特徴とする話者認識
システム。
【請求項７】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末において
は、話者の音声が入力されると、該音声信号の特徴量を
抽出し、該話者の音声の特徴量と話者認識用情報として
の音声特徴量とを照合して話者認識を行なうようになっ
ており、この際、前記端末において話者認識に用いられ
る話者認識用情報は、前記中央装置から端末に転送さ
れ、また、前記端末において得られた話者認識結果は、
中央装置に転送されることを特徴とする話者認識方法。
【請求項８】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末において
は、話者の音声が入力されると、該音声信号の特徴量を
抽出し、該話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出するようになっており、
この際、前記端末において類似度算出に用いられる話者
認識用情報は、中央装置から端末に転送され、また、端
末で算出された類似度は、端末から中央装置に転送さ
れ、中央装置では、転送された類似度に基づき話者の判
定を行なうことを特徴とする話者認識方法。
【請求項９】少なくとも１つの端末と中央装置とが、
情報を送受信可能に設けられており、前記端末において
は、話者の音声が入力されると、該音声信号の特徴量を
抽出し、該話者の音声の特徴量と話者認識用情報として
の音声特徴量との類似度を算出するようになっており、
端末で算出された類似度は、前記端末において話者の判
定に用いられるか、または、前記端末から中央装置に転
送されて中央装置において話者の判定に用いられること
を特徴とする話者認識方法。
【請求項１０】請求項７，請求項８または請求項９記
載の話者認識方法において、前記端末が該端末の中だけ
の処理を行なうのか、外部の装置との間で情報の送受信
を行なうのかに応じて、前記話者の判定のしきい値を変
化させることを特徴とする話者認識方法。