JP3506293B2 - 話者識別システム - Google Patents
話者識別システムInfo
- Publication number
- JP3506293B2 JP3506293B2 JP30683395A JP30683395A JP3506293B2 JP 3506293 B2 JP3506293 B2 JP 3506293B2 JP 30683395 A JP30683395 A JP 30683395A JP 30683395 A JP30683395 A JP 30683395A JP 3506293 B2 JP3506293 B2 JP 3506293B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- speaker
- voice
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
話者識別システムに関する。
とを確認するために、暗証番号などを利用者に入力させ
るようにしている。また、コンピュータでは、パスワー
ドと称して、暗証番号と同様の暗証文字列を利用者に入
力させることによって本人の確認を行なっている。しか
しながら、このような暗証番号や暗証文字列などの入力
による確認は、他人が、暗証番号や暗証文字列を知りさ
えすれば、難無く、これを盗用することができる。しか
も、暗証番号や暗証文字列は、それを登録した者(本人)
の生年月日や記念日、あるいは電話番号、氏名の綴りな
どを利用したものが多く、他人がこれを見破ることは差
程難しいことではない。
回避するため、近年、声によって本人か否かを判定す
る、話者認識を用いた話者識別が着目されている。この
話者認識を用いた話者識別は、ある話者が発声した音声
の特徴パターンが、予め登録されているこの話者の音声
標準パターンと一致するか否かを調べることにより、本
人か否かを判定するものである。すなわち、話者の音声
から抽出した特徴量(特徴パターン)とこの話者の音声標
準パターンとの類似度を計算し、類似度の高低によって
本人か否かを判定するものであり、人間の肉体的特徴を
利用するものであることから、音声は、暗証番号や暗証
文字列に比べて他人がこれを真似ることは難かしく、従
って、他人の盗用をより有効に防止することができる。
たような従来の話者識別システムにおいては、利用者の
音声が、風邪などによって突然変化すると、話者認識を
用いた話者識別を行なうことができなくなってしまうと
いう問題があった。
して、話者認識を全く使えなくなった場合にも、このよ
うな事態に対処することの可能な話者識別システムを提
供することを目的としている。
に、請求項1記載の発明は、話者識別用情報が記憶され
る話者識別用情報記憶手段と、利用者を特定するための
特定用情報を入力するための特定用情報入力手段と、話
者の音声を入力するための音声入力手段と、音声入力手
段から入力された話者の音声の特徴と前記話者識別用情
報記憶手段に記憶されている話者の音声特徴のうち前記
特定用情報入力手段から入力された特定用情報に対応す
る音声特徴とが類似しているか否かの照合を行なう照合
手段と、前記照合の結果、類似していないと判別された
ときに、利用者に確認をとるための確認手段とを備えて
おり、前記確認手段は、前記照合の結果、類似していな
いと判別したときに、利用者に対して、正しい第2の特
定用情報を含む複数のダミーの特定用情報を提示し、利
用者にそのうちの1つを選択させるようになっているこ
とを特徴としている。
情報が記憶される話者識別用情報記憶手段と、利用者を
特定するための特定用情報を入力するための特定用情報
入力手段と、話者の音声を入力するための音声入力手段
と、音声入力手段から入力された話者の音声の特徴と前
記話者識別用情報記憶手段に記憶されている話者の音声
特徴のうち前記特定用情報入力手段から入力された特定
用情報に対応する音声特徴とが類似しているか否かの照
合を行なう照合手段と、前記照合の結果、類似していな
いと判別されたときに、利用者に確認をとるための確認
手段とを備えており、前記確認手段による確認の結果、
正規の利用者であるとの確認がとれなかった場合に、現
在の利用者の音声を再生可能に保存する音声記憶手段が
さらに設けられていることを特徴としている。
テムの構成例を示す図である。図1を参照すると、この
話者識別システムは、例えば銀行などにおける本人の確
認を話者認識により行なうためのものであって、利用者
の音声を入力するための音声入力手段(例えば、マイク
ロフォン)1と、利用者を特定するための特定用情報を
入力させるための特定用情報入力手段(例えばキーボー
ド)2と、音声入力手段1から入力された信号の中から
話者の音声の部分のみを音声区間として検出する音声区
間検出部3と、音声区間検出部3で検出した音声区間内
の音声信号から特徴量(特徴パターン)を抽出する特徴抽
出部4と、話者認識を行なうに先立って話者の音声の標
準的な特徴量(特徴パターン)を標準パターンとして話者
認識用情報記憶部5に予め登録する登録部6と、利用者
(話者)の音声の特徴量(特徴パターン)と話者認識用情報
記憶部5に登録されている標準パターンとを照合し、そ
の類似度に基づいて話者認識を行なう話者認識部7と、
標準パターンの登録を行なう登録モードと話者認識を行
なう認識モードとの切替を行なう切替部(例えばスイッ
チ)8とを有している。
量(特徴パターン)として、スペクトルに変換しても良い
し、あるいはLPCケプストラムに変換しても良く、特
徴量の種類については特に限定するものではない。な
お、スペクトルに変換するためには、特徴量変換にはF
FTを用い、また、LPCケプストラムに変換するため
にはLPC分析などを用いるのがよい。
時)において、登録部6は、ある話者が発声した音声に
基づいて特徴抽出部4で抽出された特徴量(特徴パター
ン)を標準パターンとして話者認識用情報記憶部5に登
録する際、図2に示すように、この話者により特定用情
報入力手段2から入力された特定用情報(例えば、この
話者の名前や生年月日,あるいはこの話者の暗証番号な
ど)と対応付けて、標準パターンを話者認識用情報記憶
部5に登録することができる。換言すれば、話者認識用
情報記憶部5には、話者識別に必要な話者認識用の情報
が登録されるようになっており、また、この話者認識用
情報記憶部5には、複数の話者(例えば利用者A,B,
C,D,…)の話者認識用情報が登録可能となってい
る。
る音声の標準パターンとしては、この話者識別システム
の使用形態等に応じて、各利用者(話者)に予め言葉を発
声させたものであっても良いし、各利用者ごとにそれぞ
れ自由に所望の言葉を発声させたものであっても良い。
記憶部5に登録されている複数の話者の標準パターンか
ら現在の話者に対応する標準パターンを取り出し、この
標準パターンと現在の話者の特徴パターンとを照合し、
その類似度が所定基準値(しきい値)よりも高いか低いか
により現在の話者が正規の話者本人であるか否かを判定
する話者照合方式のものを用いることができる。
式の話者認識がなされる場合、この話者認識時に、利用
者(話者)は、特定用情報入力手段2から登録モード時に
入力した特定用情報と同じ特定用情報を入力する必要が
ある。これにより、話者認識部7では、話者認識用情報
記憶部5に登録されている複数の話者の標準パターンの
うちから現在の話者に対応する標準パターンを取り出す
ことができ、この標準パターンと現在の話者の音声の特
徴パターンとの照合を行なうことができる。
記憶部5に登録される音声の標準パターンが各利用者
(話者)に予め言葉を発声させたものである場合には、こ
れに対応した認識を行なうものにすることができ、ま
た、話者認識用情報記憶部5に登録される音声の標準パ
ターンが各利用者ごとにそれぞれ自由に所望の言葉を発
声させたものである場合には、これに対応した認識を行
なうものにすることができる。但し、各利用者(話者)に
予め決められた言葉を発声させて話者認識を行なう場
合、類似の判定基準(しきい値)を各話者に対して全て一
定値にすることができるが、各利用者ごとにそれぞれ所
望の言葉を発声させて話者認識を行なう場合には、類似
の判定基準(しきい値)を各話者ごとに相違させることも
できる。
者(例えばD)が始めて利用する場合、この利用者(話者)
Dは、先ず、自己の音声を標準パターンとして登録する
必要がある。このため、この利用者Dは、切替部(例え
ばスイッチ)8を操作して、特徴抽出部4を登録部6に
接続し、登録モードに設定する。
力手段2から所定の特定用情報,例えば(利用者D)を入
力する。また、この際、利用者は、予め決められた特定
の言葉を発声する。この音声は、音声入力手段1から入
力し、音声区間検出部3,特徴抽出部4により、特徴量
(特徴パターン)に変換され、この話者の音声の標準パタ
ーンとして、登録部6に与えられる。
者)Dの音声の標準パターンを特定用情報入力手段2か
ら入力された特定用情報と対応付けて、話者認識用情報
記憶部5に登録する。例えば過去に、この話者認識用情
報記憶部5に複数の利用者(異なる利用者)A,B,Cが
自己の音声を標準パターンとして登録しており、現在の
利用者Dが上記のように自己の音声を標準パターンとし
て登録するとき、この標準パターンは、話者認識用情報
記憶部5に図2に示すように記憶(登録)される。
が話者認識用情報記憶部5に記憶されると、利用者D
は、この話者識別システムにより、利用者Dについての
話者認識を行なわせることができる。すなわち、この利
用者Dは、このシステムを用いて、いま利用している利
用者が利用者D本人であるか否かの判定を行なわせるこ
とができる。
を利用する場合、利用者Dは、切替部8を操作して、特
徴抽出部4を話者認識部7に接続し、このシステムを認
識モードに設定する。
2から所定の特定用情報,例えば(利用者D)を入力す
る。また、この際、利用者Dは、予め決められた特定の
言葉を発声する。この音声は、音声入力手段1から入力
し、音声区間検出部3,特徴抽出部4により、特徴量
(特徴パターン)に変換されて、話者認識部7に与えられ
る。
入力手段2から入力された特定用情報(利用者D)に対応
させて登録されている標準パターンを話者認識用情報記
憶部5から取り出し、この標準パターンと特徴抽出部4
からの特徴パターンとを照合して、その類似度を算出
し、この類似度が所定基準値よりも高いか低いかを判定
する。この結果、類似度が低いと判定されたときには、
利用者が正規の話者本人Dではないと判別し、この利用
者による利用を拒絶する。これに対し、類似度が高いと
判定されたときには、利用者が正規の話者本人Dである
と判別し、利用者による利用を許可する。すなわち、利
用者によるアプリケーション(例えば入出金,残高照会
などの処理)の利用を許可する。
おいては、前述したように、利用者(話者)の音声が、風
邪などによって突然変化すると、本人の音声であるにも
かかわらず、本人ではないと判定され、話者識別を行な
うことができなくなってしまう。
話者識別システムには、音声入力手段1から入力された
話者の音声の特徴と前記話者識別用情報記憶部5に記憶
されている話者の音声特徴のうち特定用情報入力手段2
から入力された特定用情報に対応する音声特徴とが類似
しているか否かの照合を行なった結果、類似していない
と判別されたときに、さらに、利用者に確認をとるため
の確認手段11が設けられており、この確認手段11に
よって、利用者が正規の話者本人であることが確認され
たときには、話者認識部7における話者照合の結果、類
似していないと判別されても、現在の利用者が正規の話
者本人であると識別するようになっている。
ある。図3の例では、確認手段11は、利用者を特定す
るための特定用情報に対応付けて付随情報が記憶される
付随情報記憶部12と、話者認識部7における話者照合
の結果、類似していないと判別されたときに、特定用情
報入力手段2から入力された特定用情報に対応付けて付
随情報記憶部12に記憶されている付随情報に従って利
用者に確認のための通知を行なう通知部13と、通知部
13によって利用者に通知がなされ、利用者から確認の
ための応答があったときに、該応答に基づき、利用者が
正規の話者本人であるか否かを判別する判別部14とを
有している。
図であり、図4の例では、付随情報記憶部12には、付
随情報として、利用者への通知の仕方が記憶されるよう
になっている。例えば正規の利用者の電話番号、あるい
は、この話者識別システムの例えば表示装置にガイダン
スなどを表示する旨などが記憶されるようになってい
る。
2には、特定用情報入力手段2から入力された特定用情
報と対応付けて、付随情報として、利用者を特定するた
めの第2の特定用情報が記憶されるようになっている。
用情報とは異なるものを用いることができる。なお、以
下では、特定用情報を、第2の特定用情報と区別するた
め、第1の特定用情報と呼ぶことにする。この場合、第
1の特定用情報としては、前述のように、例えば、利用
者の名前や生年月日、あるいは暗証番号(以下、第1の
暗証番号と呼ぶ)などを用いることができ、また、第2
の特定用情報としては、例えば、上記第1の暗証番号と
は異なる第2の暗証番号を用いることができる。
ば、利用者Dが自己の音声の標準パターンを新規に登録
する際に、特定用情報入力手段2から特定用情報ととも
に、入力することができ、これによって、付随情報記憶
部12には、利用者Dの特定用情報に対応させて、利用
者Dの付随情報が登録される。
記憶部12に付随情報として記憶される利用者への通知
の仕方に応じて、種々の形態のものを用いることができ
る。例えば、利用者への通知の仕方が、利用者に電話に
かけるものである場合(付随情報として、電話番号が設
定されている場合)には、通知部13としては、通信装
置(電話装置やパソコン通信機能をもつ端末など)を用い
ることができる。また、利用者への通知の仕方が、この
システムにおいて利用者にその旨をガイダンスなどで知
らせる場合には、通知部13としては、この話者識別シ
ステムに備わった表示装置や音声合成出力装置などを用
いることができる。
めの通知があったときに、利用者は、この通知に対する
応答として、例えば、第2の特定用情報を入力したり、
あるいは音声等で返答したりすることができる。なお、
第2の特定用情報を入力する場合、第2の特定用情報の
入力は、例えば特定用情報入力手段2を用いて(兼用し
て)行なうこともできるし、あるいは、特定用情報入力
手段2以外の入力手段から行なうこともできる。
知に対する利用者の応答として、第2の特定用情報が入
力されると、利用者によって入力された第2の特定用情
報と特定用情報入力手段2から入力された特定用情報に
対応させて付随情報記憶部12に記憶されている第2の
特定用情報とを照合して、正規の利用者か否かの判別を
行なうようになっている。
の種々の使用形態例を示す図である。図5の使用形態例
は、図3の構成例において、音声入力手段1,特定用情
報入力手段2,音声区間検出部3,特徴抽出部4,話者
認識用情報記憶部5,登録部6,話者認識部7,切替部
8,付随情報記憶部12,通知部13,判別部14,さ
らには表示装置16が、例えば、話者認識装置ユニット
30として、銀行の窓口などに設置されるものとなって
いる。
規登録,変更あるいは更新,話者認識を行なうために、
利用者は、例えば銀行の窓口などに設置されている話者
認識装置ユニット30のところに出向き、この話者認識
装置ユニット30によって、標準パターンの新規登録操
作,話者認識操作,標準パターンの変更あるいは更新操
作を、前述したようにして行なうことができる。なお、
この話者認識装置ユニット30に、標準パターンの自動
更新機能が備わっているときには、利用者は、標準パタ
ーンの変更あるいは更新操作を行なうことなく、標準パ
ターンは自動更新される。
識ユニット30によって利用者が例えば標準パターンの
新規登録操作を行なう際、利用者は、これとともに、付
随情報の入力を行ない、入力された付随情報を付随情報
記憶部12に記憶させることができる。すなわち、この
場合、付随情報記憶部12には、付随情報として、例え
ば、各利用者ごとの第2の特定用情報とともに、利用者
への通知の仕方として、例えば表示装置16へガイダン
スを表示する旨などが記憶される。
あるいは、変更,更新がなされ、認識モード時におい
て、例えば利用者Dが話者認識を行なうために特定用情
報入力手段2から第1の特定用情報を入力し、音声入力
手段1から音声を入力するとき、話者認識部7は、音声
入力手段1から入力された音声の特徴パターンと特定用
情報入力手段2から入力された第1の特定用情報に対応
した標準パターン(例えば利用者Dの標準パターン)とを
照合し、これらが類似しているか否かを判別する。
と利用者Dの標準パターンとが類似していると判別され
たときには、利用者が正規の利用者D本人であると識別
し、この利用者に対して、例えば、利用者D用のアプリ
ケーション(入出金,残高照会等のアプリケーション)の
利用を許可する。
ンと利用者Dの標準パターンとが類似していないと判別
されたときには、正規の利用者Dか否かの確認をとる。
すなわち、通知部13は、この利用者への通知の仕方を
付随情報記憶部12から読出し、この通知の仕方が、例
えば表示装置16へのガイダンス表示である場合、第2
の特定用情報を利用者に入力させる旨のガイダンス、例
えば「第2の特定用情報を入力して下さい」などのガイ
ダンスを、この話者認識装置ユニット30の表示装置1
6に画面表示し、利用者に知らせる。利用者が、これに
応答して、例えば特定用情報入力手段2から第2の特定
用情報を入力するとき、判別部14では、いま入力され
た第2の特定用情報と付随情報記憶部12に記憶されて
いる利用者Dの第2の特定用情報とを照合する。この結
果、これらが一致したときには、利用者が正規の利用者
D本人であると識別し、この利用者に対して、例えば、
利用者D用のアプリケーション(入出金,残高照会等の
アプリケーション)の利用を許可する。
果、これらが一致しないときには、この利用者に対し
て、例えば、利用者D用のアプリケーションの利用を禁
止する。
ば風邪などによって突然変化し、入力された音声の特徴
パターンと利用者Dの標準パターンとが類似しないもの
となっても、この正規の利用者Dが第2の特定用情報を
正しく入力することで、利用者が利用者Dであると識別
され、この利用者Dに対するアプリケーションの利用を
許可することができる。また、利用者D以外の他人,例
えばEが、利用者Dの第1の特定用情報を知得しても、
利用者Dの第2の特定用情報を知得しない限り、この他
人Eは、利用者D用のアプリケーションを利用すること
ができないので、悪意のある他人によって正規の利用者
用のアプリケーションが利用されてしまうという事態を
も、有効に防止することができる。
形態例において、利用者への通知を例えばオペレーショ
ンセンタ80を介して行なうものとなっている。この場
合、通知部13は、オペレーションセンタ80に設置さ
れているアクセス受動部24と、アクセス受動部24に
アクセスするためのアクセス部23とを有している。す
なわち、図6の使用形態例では、図3の構成例におい
て、音声入力手段1,特定用情報入力手段2,音声区間
検出部3,特徴抽出部4,話者認識用情報記憶部5,登
録部6,話者認識部7,切替部8,通知部13のアクセ
ス部23,判別部14は、図5の使用形態例と同様に、
例えば話者認識装置ユニット30として銀行の窓口など
に設置されているが、通知部13のアクセス受動部24
は、例えば電話装置としてオペレーションセンタ80の
管理者によって管理され、アクセス受動部24がアクセ
ス部23によってアクセスされたとき、オペレーション
センタ80の管理者が、別途、利用者の携帯電話などに
確認のための電話などを行なうように構成されている。
また、オペレーションセンタ80から利用者へ確認のた
めの通知を行なうため、付随情報記憶部12も、オペレ
ーションセンタ80側に設けられている。
ット30において、利用者の入力された音声の特徴パタ
ーンと例えば利用者Dの音声の標準パターンとの照合の
結果、これらが類似していないと判別されたとき、話者
認識装置ユニット30のアクセス部23は、オペレーシ
ョンセンタ80のアクセス受動部24を例えば電話で呼
出し、例えば、「利用者Dに確認をとって下さい」など
の音声ガイドを流し、アクセス受動部24の受話器から
オペレーションセンタ80の管理者に伝える。これによ
り、オペレーションセンタ80の管理者は、付随情報記
憶部12から利用者Dに対応する付随情報,例えば利用
者Dの電話番号を検索し、利用者Dに例えば電話で連絡
する。この結果、利用者D本人が話者認識を行なってい
るとの確認が得られると、管理者は、アクセス受動部2
4の送話器から例えば「利用者Dである」旨のメッセー
ジを発声する。あるいは、「利用者Dである」旨をアク
セス受動部24の所定の機能キー,例えば“*”で通知
する。これにより、アクセス部23はこれを受信して、
利用者に対し利用者D用のアプリケーションの利用を許
可する。
なっているとの確認が得られない場合には、オペレーシ
ョンセンタ80の管理者は、アクセス受動部24の送話
器から例えば「利用者Dではない」旨のメッセージを発
声する。あるいは、「利用者Dではない」旨をアクセス
受動部24の所定の機能キー,例えば“#”で通知す
る。これにより、アクセス部23はこれを受信して、利
用者に対し利用者D用のアプリケーションの利用を禁止
する。
も、図5の使用形態例と同様に、正規の利用者Dの音声
が例えば風邪などによって突然変化し、入力された音声
の特徴パターンと利用者Dの標準パターンとが類似しな
いものとなっても、この正規の利用者Dが第2の特定用
情報を正しく入力することで、利用者が利用者Dである
と識別され、この利用者Dに対するアプリケーションの
利用を許可することができる。また、利用者D以外の他
人,例えばEが、利用者Dの第1の特定用情報を知得し
ても、利用者Dの第2の特定用情報を知得しない限り、
この他人Eは、利用者D用のアプリケーションを利用す
ることができないので、悪意のある他人によって正規の
利用者用のアプリケーションが利用されてしまうという
事態をも、有効に防止することができる。
ョンセンタ80の管理者が利用者D本人に直接問い合せ
することができるので、このときには、利用者から第2
の特定用情報を入力させずとも、利用者が利用者D本人
であるかを直接確認することができる。従って、この場
合には、判別部14は設けずとも良い。但し、この場合
であっても、さらに、利用者から第2の特定用情報を入
力させることもでき、このときには、判別部14は設け
る必要がある。また、この場合、話者認識ユニット30
側にも付随情報記憶部12を設けることができる。
において、利用者が端末によって話者認識等の操作を行
なうものとなっている。すなわち、図7の例では、音声
入力手段1,特定用情報入力手段2,音声区間検出部
3,特徴抽出部4が、利用者の家庭や会社等に設置され
ている端末31(例えばパソコンや電話装置など)で実現
されており、切替部8,話者認識用情報記憶部5,登録
部6,話者認識部7,付随情報記憶部12,判別部14
が、例えば、銀行の窓口などに設置されている話者認識
装置ユニット32で実現されている。また、この場合、
通知部13は、端末31側に設けられているアクセス受
動部24と、話者認識装置ユニット32に設けられ、端
末31のアクセス受動部24にアクセスするアクセス部
23とにより実現されている。
用者ごとのアクセス受動部24の電話番号などが付随情
報(利用者への通知の仕方)として予め記憶されている。
また、利用者側の端末31と銀行などに設置されている
話者認識装置ユニット32とは、通信手段33,例えば
通信回線(有線)あるいは無線によって、互いに情報の送
受信がなされるようになっている。
者認識装置ユニット32に通信手段33を介して接続さ
れている場合のみが示されているが、話者認識装置ユニ
ット32には、1つのみならず、複数の端末を送受信可
能に接続することができる。また、図7では、音声入力
手段1,特定用情報入力手段2,アクセス受動部24が
一体のユニット(端末)として構成されているが、これら
は別々の装置として設置されていても良い。
規登録,変更あるいは更新,話者認識を行なうために、
利用者は、利用者の家庭や会社等に設置されている端末
31を操作することによって、例えば銀行の窓口などに
設置されている話者認識装置ユニット32に対し、標準
パターンの新規登録操作,話者認識操作,標準パターン
の変更あるいは更新操作を、前述したと同様にして行な
うことができる。但し、図7の使用形態例では、登録モ
ードにするか認識モードにするかの切替指示は、例え
ば、端末の特定用情報入力手段2から与えることがで
き、端末の特定用情報入力手段2から登録モードにする
か認識モードにするかの指示が通信手段33を介して伝
送されるとき、話者認識装置ユニット32側では、この
指示に応じて、切替部8の切替制御を行なうようになっ
ている。また、この話者認識装置ユニット32に、標準
パターンの自動更新機能が備わっているときには、利用
者は、標準パターンの変更あるいは更新操作を行なうこ
となく、標準パターンは自動更新される。
話者認識装置ユニット32の話者認識部7において、入
力された利用者の音声の特徴パターンと正規の利用者D
の標準パターンとを照合した結果、これらが類似してい
ないときには、話者認識装置ユニット32のアクセス部
23は、利用者Dの付随情報(例えば電話番号)を、付随
情報記憶部12から読出し、この利用者Dの付随情報
(電話番号)によって利用者Dのアクセス受動部24を呼
出し、例えば、「確認のため、第2の特定用情報を入力
して下さい」などの音声ガイドを流し、アクセス受動部
24の受話器から利用者Dに与える。利用者Dが、これ
に応答して、アクセス受動部24の送話器から例えば、
第2の特定用情報を発声するとき、あるいは、第2の特
定用情報をアクセス受動部24のキー操作によりプッシ
ュトーン等で通知し、アクセス部23がこれを受信する
とき、判別部14は、受信した第2の特定用情報を付随
情報記憶部12に記憶されている利用者Dの第2の特定
用情報と照合する。この結果、これらが一致すると、利
用者に対し利用者D用のアプリケーションの利用を許可
する。
特定用情報と付随情報記憶部12に記憶されている利用
者Dの第2の特定用情報とが一致しないとき、この利用
者に対し利用者D用のアプリケーションの利用を禁止す
る。
様に、正規の利用者Dの音声が例えば風邪などによって
突然変化し、入力された音声の特徴パターンと利用者D
の標準パターンとが類似しないものとなっても、この正
規の利用者Dが第2の特定用情報を正しく入力すること
で、利用者が利用者Dであると識別され、この利用者D
に対するアプリケーションの利用を許可することができ
る。また、利用者D以外の他人,例えばEが、利用者D
の第1の特定用情報を知得しても、利用者Dの第2の特
定用情報を知得しない限り、この他人Eは、利用者D用
のアプリケーションを利用することができないので、悪
意のある他人によって正規の利用者用のアプリケーショ
ンが利用されてしまうという事態をも、有効に防止する
ことができる。
認識装置ユニット30の管理者から利用者D本人に直接
確認のための電話等を行ない、利用者D本人に直接問い
合せることもできるので、このときには、利用者Dから
第2の特定用情報を入力させずとも、利用者が利用者D
本人であるか否かを直接確認することができる。従っ
て、この場合には、判別部14は設けずとも良い。但
し、この場合であっても、さらに、利用者から第2の特
定用情報を入力させることもでき、このときには、判別
部14は設ける必要がある。また、この場合、話者認識
ユニット30側にも付随情報記憶部12を設けることが
できる。
態例において、アクセス受動部24が例えばオペレーシ
ョンセンタ80に設置されたものとなっており、この場
合の操作,動作については、図6の使用形態例とほぼ同
様になされる。
態例において、音声入力手段1,特定用情報入力手段
2,アクセス受動部24を例えば、図9に示すように、
1つの電話装置(あるいはパソコン通信装置)35として
共用することもできる。すなわち、この電話装置(ある
いはパソコン通信装置)35としては、利用者の家庭や
会社等にある既存のもの(例えばプッシュホン電話器)を
用いることができ、この場合、電話装置35のハンドセ
ットの送話器を音声入力手段1として用い、また、ハン
ドセットの受話器をアクセス受動部24において例えば
音声ガイドの受信部として用い、また、電話装置35の
操作部(テンキー部)を特定用情報入力手段2として用い
ることができる。また、アクセス受動部24において、
確認の発信を例えば音声メッセージで行なうようになっ
ている場合、上記ハンドセットの送話器をアクセス受動
部24の確認発信部として用いることができ、また、ア
クセス受動部24において第2の特定用情報の発信をプ
ッシュトーンで行なうようになっている場合、電話装置
35の操作部(テンキー部)をアクセス受動部24の確認
発信部としても用いることができる。
いて、音声入力手段1,特定用情報入力手段2,アクセ
ス受動部24は、1つの電話装置(あるいはパソコン通
信装置)35で実現することが可能であり、この場合、
利用者は、別途、話者認識用の装置(音声入力手段1,
特定用情報入力手段2)を用意せずに済む。
4をこのように1つの電話装置(あるいはパソコン通信
装置)35で実現する場合、利用者が話者認識を行なう
ときには、この電話装置35のハンドセットが持ち上げ
られ、この電話装置35は、通話状態となっていること
から、話者の確認を行なうためアクセス部23がアクセ
ス受動部24をアクセスするとき、利用者が正規の利用
者(話者本人)である場合には、利用者先のアクセス受動
部すなわち電話装置35は、通話中となっている。
セス受動部24をアクセスしたときに通話中である場合
に、いま話者認識を行なっている利用者が正規の話者本
人であると判定し、確認を行なうこともできる。
部23,アクセス受動部24が設けられているが、これ
らを設けずに、確認手段11を実現することも可能であ
る。
者が自己の端末(例えば電話装置あるいはパソコン通信
装置)によって、例えば銀行等に設置されている話者認
識装置ユニットをアクセスするのに必要な電話番号を入
力し、この電話番号が自己の端末からデジタル信号で送
出されるとき、銀行等に設置されている話者認識装置ユ
ニットでは、利用者端末からデジタル信号で送出された
電話番号を例えば表示するように構成することもでき
る。
いる話者認識装置ユニットをアクセスした後、端末の特
定用情報入力手段2から特定用情報を入力し、また、音
声入力手段1から音声を発生し、音声入力手段1から入
力された利用者の音声の特徴パターンと利用者Dの標準
パターンとの照合を行なわせた結果、これらが類似して
いないと判別されたときには、この時点で、話者認識装
置ユニット側のオペレータ(例えば銀行等の係員)は、上
記のように表示されている電話番号と上記のように入力
された特定用情報に対応させて付随情報記憶部12に予
め登録されている正規の利用者の電話番号とを照合し、
この結果、一致したときには、利用者が正規の利用者で
あると確認することができる。これに対し、一致しない
ときには、利用者が正規の利用者ではないと判断するこ
とができる。
トから利用者のアクセス受動部24にアクセスせずと
も、確認を行なうことも可能である。
正規の利用者Dではなく、利用者D以外の他人であると
確認されたときに、さらに、この他人が誰であったかが
履歴として残れば、より都合良い。話者認識(すなわ
ち、話者識別)を行なうための音声特徴パターンには、
利用者の声の情報が含まれていることからこれを履歴と
して保存することもできるが、通常、音声特徴パターン
は、元の音声信号に対し、データ量が圧縮されているた
め、これに基づいて誰であるかを判定することは難かし
い。
正規の利用者でないと確認された場合、現話者の音声標
準パターンではなく、現話者の元の音声を再生可能に保
存するようにすることができる。
る機能を備えた話者識別システムの構成例を示す図であ
る。図10を参照すると、この話者識別システムでは、
認識モード時に、音声入力手段1から入力された音声信
号あるいは、音声区間検出後の音声信号(音声区間内の
音声信号)を再生可能に記憶する音声記憶手段(メモリ)
50がさらに設けられており、確認手段11において、
現話者が正規の話者本人であると確認されたときには、
この音声記憶手段50に記憶された音声信号を例えば確
認手段11からの制御によって消去する一方、現話者が
正規の話者本人ではないと判断されたときには、この音
声記憶手段50に記憶された音声信号を履歴として保存
するようになっている。
利用者が認識モード時に音声を発声するとき、音声入力
手段1からの入力音声信号は、音声記憶手段50に記憶
される。しかる後、確認手段11によって前述したよう
な種々の仕方で現話者が正規の話者本人であるか否かを
確認し、最終的に正規の話者本人でないと判断されたと
きには、音声記憶手段50にいま記憶された音声信号を
履歴とて保存し、この音声を後で再生することで、誰が
本人になりすまして利用しようとしたかを割り出すこと
ができる。
1から音声信号を音声記憶手段50に直接記憶させても
良いが、音声記憶手段50の容量を節約する場合には、
音声区間検出後の音声信号(音声区間内の音声信号)を記
憶させるのが良い。また、記憶すべき音声信号として、
PCMにするか、ADPCMを使うか、帯域をどの程度
まで残すかによって、音声のデータの量が決まるが、音
声記憶手段50には、話者の音声をできるだけ良い音質
で記憶するのがよい。
本人であると確認されたときは、メモリ容量を節約する
ため、音声記憶手段50に蓄積した音声信号を消去する
としたが、正規の話者本人であることが確認されたとき
にも、音声記憶手段50に蓄積した音声信号を消去せず
に、そのまま残しておき、例えば、正規の話者本人が次
に利用するときに、これに上書きするようにしてもよ
い。これにより、装置が誤って正規の話者本人と判断し
たときにも、音声記憶手段50に蓄積された音声信号に
基づき、本人にかわって誰が利用したかを割り出すこと
ができる。
を履歴として保存するようにしているが、利用者の映像
を履歴として残すことも可能である。すなわち、確認手
段11による確認の結果、正規の利用者でないと確認さ
れた場合、利用者の映像を保存するようにすることも可
能である。
えた話者識別システムの構成例を示す図である。図11
を参照すると、この話者識別システムでは、利用者の映
像を撮像する撮像手段(例えばカメラ)52と、撮像手段
52からの映像信号をA/D変換するA/D変換部53
と、A/D変換部53によりデジタル変換された映像信
号を記憶する映像記憶手段54とがさらに設けられてお
り、確認手段11において、現話者が正規の話者本人で
あると確認されたときには、この映像記憶手段54に記
憶された映像信号を例えば確認手段11の制御によって
消去する一方、現話者が正規の話者本人ではないと判断
されたときには、この映像記憶手段54に記憶された映
像信号を履歴として保存するようになっている。
利用者が認識のための操作を行なうとき、撮像手段52
からの映像信号は、映像記憶手段54に記憶される。し
かる後、確認手段11によって前述したような種々の仕
方で現話者が正規の話者本人であるか否かを確認し、正
規の話者本人でないと判断されたときには、映像記憶手
段54にいま記憶された映像信号を履歴とて保存し、こ
の映像を後で再生することで、誰が本人になりすまして
利用しようとしたかを割り出すことができる。
あると確認されたときは、メモリ容量を節約するため、
映像記憶手段54に蓄積した映像信号を消去するとした
が、正規の話者本人であることが確認されたときにも、
映像記憶手段54に蓄積した映像信号を消去せずに、そ
のまま残しておき、例えば、正規の話者本人が次に利用
するときに、これに上書きするようにしてもよい。これ
により、装置が誤って正規の話者本人と判断したときに
も、映像記憶手段54に蓄積された映像信号に基づき、
本人にかわって誰が利用したかを割り出すことができ
る。
は動画用のものであっても、静止用のものであっても良
く、必要に応じて、映像記憶手段54に保存されている
映像を見ることによって前回の使用者の映像を見ること
ができる。
可能に保存することで、他人が誰かを後で知ることがで
きる。なお、図10,図11の構成例では、音声あるい
は映像のいずれか一方を履歴として残すようになってい
るが、図10と図11とを組合せ、音声と映像との両方
を履歴として残すように構成することもできる。
風邪などによる声の変化は頻繁に起こるものではないた
め、利用者に第2の特定用情報を入力させる場合、利用
者が第2の特定用情報を正確に覚えていないことがあ
る。このような場合を考慮して、音声入力手段1から入
力された利用者の音声の特徴パターンと特定用情報入力
手段2から入力された特定用情報(第1の特定用情報)に
対応した利用者(例えば利用者D)の音声の標準パターン
とが類似していないと判別されたときに、利用者に対し
て、正しい第2の特定用情報を含む複数のダミーの特定
用情報を提示し、利用者にそのうちの1つを選択させる
こともできる。
数のダミーの特定用情報を利用者に提示し、利用者にそ
のうちの1つを選択させる機能を備えた話者識別システ
ムの構成例を示す図である。図12の構成例では、話者
認識部7において入力音声の特徴パターンと標準パター
ンとを照合の結果、これらが類似していないと判定した
場合は、第1の特定用情報に対応した第2の特定用情報
を付随情報記憶部から取り出し、取り出した第2の特定
用情報を含む複数の(例えば20個程度の)ダミーの特
定用情報を発生し、これらを、例えば表示装置16に表
示するダミー特定用情報発生部29がさらに設けられて
いる。
に表示された複数のダミーの特定用情報のうちのいずれ
か1つを利用者に選択させる。利用者によって1つの特
定用情報が選択されると、判別部14では、利用者によ
り選択された特定用情報と付随情報記憶部12に記憶さ
れている利用者Dの第2の特定用情報とを照合し、これ
らが一致したら、利用者が正規の利用者であると確認
し、この利用者にアプリケーションの利用を許可する。
これによって、利用者は、仮に第2の特定用情報を正確
に覚えていなくても、提示された複数の特定用情報の中
から正しい第2の特定用情報を見出し、これを選択する
ことができる。
えば、20個程度を表示すれば、他人が正しい第2の特
定用情報を選択する確率も5%程度しかないため、実用
上、第3者が第2の特定用情報を選択することを有効に
防止できる。また、このときに提示する複数のダミー特
定用情報は、ダミー特定用情報発生部29において、一
定の規則をもたせて、常に同じものが用いられるのが望
ましい。すなわち、正しい第2の特定用情報以外のダミ
ー特定用情報をランダムに発生させていると、正しい第
2の特定用情報以外の特定用情報については、毎回変わ
るので、例えば、複数のダミー特定用情報を2回表示さ
せて、両方に共通の特定用情報があればそれが正しい第
2の特定用情報であると他人にわかってしまう。
どで声が変わった時でも、しかも、第2の特定用情報を
正確に覚えていなくても、正しく利用することが可能と
なる。
部5とは別に、付随情報記憶部12が設けられている
が、例えば図13に示すように、付随情報記憶部12の
機能を話者認識用情報記憶部5にもたせることもでき
る。この場合には、通知部13,判別部14は、話者認
識用情報記憶部5から利用者への通知の仕方,第2の特
定用情報等を読出して、用いることができる。
3の後に、特徴抽出部4が設けられているが、これのか
わりに、音声区間検出部3の前に、特徴抽出部4が設け
られていても良い。
に音声区間検出部3,特徴抽出部4が設けられている
が、これらの一方あるいは両方を端末側ではなく、銀行
等に設置されている話者認識装置ユニット側に設けるこ
とも可能である。
装置ユニット側に話者認識部7が設けられているが、こ
れを、話者認識装置ユニット側ではなく、端末側に設け
ることも可能である。
求項2記載の発明によれば、音声入力手段から入力され
た話者の音声の特徴と話者識別用情報記憶手段に記憶さ
れている話者の音声特徴のうち特定用情報入力手段から
入力された特定用情報に対応する音声特徴とが類似して
いないと判別されたときに、利用者に確認をとるように
しているので、風邪などによって利用者の声が突然変化
しても、話者識別を行なうことができる。
図である。
る。
図である。
図である。
図である。
図である。
図である。
えた話者識別システムの構成例を示す図である。
別システムの構成例を示す図である。
を示す図である。
である。
置) 50 音声記憶手段 52 撮像手段 53 A/D変換部 54 映像記憶手段 80 オペレーションセンタ
Claims (2)
- 【請求項1】 話者識別用情報が記憶される話者識別用
情報記憶手段と、利用者を特定するための特定用情報を
入力するための特定用情報入力手段と、話者の音声を入
力するための音声入力手段と、音声入力手段から入力さ
れた話者の音声の特徴と前記話者識別用情報記憶手段に
記憶されている話者の音声特徴のうち前記特定用情報入
力手段から入力された特定用情報に対応する音声特徴と
が類似しているか否かの照合を行なう照合手段と、前記
照合の結果、類似していないと判別されたときに、利用
者に確認をとるための確認手段とを備えており、前記確
認手段は、前記照合の結果、類似していないと判別した
ときに、利用者に対して、正しい第2の特定用情報を含
む複数のダミーの特定用情報を提示し、利用者にそのう
ちの1つを選択させるようになっていることを特徴とす
る話者識別システム。 - 【請求項2】 話者識別用情報が記憶される話者識別用
情報記憶手段と、利用者を特定するための特定用情報を
入力するための特定用情報入力手段と、話者の音声を入
力するための音声入力手段と、音声入力手段から入力さ
れた話者の音声の特徴と前記話者識別用情報記憶手段に
記憶されている話者の音声特徴のうち前記特定用情報入
力手段から入力された特定用情報に対応する音声特徴と
が類似しているか否かの照合を行なう照合手段と、前記
照合の結果、類似していないと判別されたときに、利用
者に確認をとるための確認手段とを備えており、前記確
認手段による確認の結果、正規の利用者であるとの確認
がとれなかった場合に、現在の利用者の音声を再生可能
に保存する音声記憶手段がさらに設けられていることを
特徴とする話者識別システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30683395A JP3506293B2 (ja) | 1995-10-30 | 1995-10-30 | 話者識別システム |
US08/733,394 US5893057A (en) | 1995-10-24 | 1996-10-18 | Voice-based verification and identification methods and systems |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30683395A JP3506293B2 (ja) | 1995-10-30 | 1995-10-30 | 話者識別システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09127976A JPH09127976A (ja) | 1997-05-16 |
JP3506293B2 true JP3506293B2 (ja) | 2004-03-15 |
Family
ID=17961813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30683395A Expired - Fee Related JP3506293B2 (ja) | 1995-10-24 | 1995-10-30 | 話者識別システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3506293B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099076A (ja) * | 1998-09-25 | 2000-04-07 | Fujitsu Ltd | 音声認識を活用した実行環境設定装置及び方法 |
JP3656730B2 (ja) * | 2000-06-02 | 2005-06-08 | アイシン・エィ・ダブリュ株式会社 | 電話番号による地点検索出力装置及び記録媒体 |
US8650103B2 (en) | 2001-10-17 | 2014-02-11 | Ebay, Inc. | Verification of a person identifier received online |
-
1995
- 1995-10-30 JP JP30683395A patent/JP3506293B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09127976A (ja) | 1997-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4573792B2 (ja) | ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム | |
EP1156697B1 (en) | Biometrical authentication in a communication system | |
US6393305B1 (en) | Secure wireless communication user identification by voice recognition | |
US20030043047A1 (en) | Electronic doorbell system | |
US20020007462A1 (en) | User authentication system | |
CN100450120C (zh) | 用于防止信息处理设备的未授权使用的装置和方法 | |
KR100811077B1 (ko) | 이동통신단말기를 이용한 개인 보안시스템 및 그 보안방법 | |
US20060067164A1 (en) | User identification method, user identification device, electronic apparatus, and electronic system | |
JPH07234694A (ja) | 自動受付装置 | |
JP3506293B2 (ja) | 話者識別システム | |
JP2002032343A (ja) | 通信システム | |
JP3592415B2 (ja) | 話者認識システム | |
JP2014072701A (ja) | 通信端末 | |
JPS6126079B2 (ja) | ||
JP2006211562A (ja) | 音声メモシステム | |
JP3953368B2 (ja) | 認証システム及び認証装置 | |
JP3522421B2 (ja) | 話者認識システムおよび話者認識方法 | |
JP2005348240A (ja) | 電話装置 | |
KR101384943B1 (ko) | 전화번호 등록 방법 및 이동통신 단말기 | |
JP2000181490A (ja) | 利用者照合方法および利用者照合装置 | |
JP2007096833A (ja) | ドアホン装置 | |
JPH09284401A (ja) | 入退室監視区域電話転送システム | |
JP2007096831A (ja) | インターホン装置 | |
JP2004194008A (ja) | 電話機 | |
KR20010025961A (ko) | 지문인식이 가능한 비디오폰 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20031211 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071226 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081226 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081226 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091226 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101226 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101226 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111226 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111226 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121226 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |