JP2009145924A

JP2009145924A - 話者認識システム及びコンピュータプログラム

Info

Publication number: JP2009145924A
Application number: JP2006086165A
Authority: JP
Inventors: Yoshihiro Kawazoe; 佳洋川添; Soichi Toyama; 聡一外山; Teruya Komamura; 光弥駒村
Original assignee: Pioneer Electronic Corp; Tech Experts Inc
Current assignee: Pioneer Corp; Tech Experts Inc
Priority date: 2006-03-27
Filing date: 2006-03-27
Publication date: 2009-07-02
Also published as: WO2007111170A1

Abstract

【課題】話者認識システムにより、例えば話者認識における成りすまし或いは詐称を好適に回避し或いは予防する。
【解決手段】話者認識システム（１）は、話者認識を行う認識手段（１３２、１４）と、認識手段において一のユーザに係る話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段（６０）とを備える。更に、該検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に、話者認識が失敗した旨を示す失敗情報を、一のユーザに対して通報する通報手段（７０）を備える。
【選択図】図１

Description

本発明は、例えばカーナビ装置、ネットバンキング装置、オートロック装置、コンピュータの認識装置等の各種コンピュータ機器や各種電子電気機器に設けられ、そのユーザである話者の発話に基いて、話者認識を行う話者認識システム及びコンピュータをそのような話者認識システムとして機能させるコンピュータプログラムの技術分野に関する。

この種の話者認識システムには、認識に用いられる発話されたテキストが予め登録されているテキスト固定型或いはテキスト依存型と、このような登録が不要であり任意のテキストについて認識を行うテキスト独立型或いは非テキスト依存型と、認識の際或いは都度に認識にテキストが指定されるテキスト指定型の三種類がある（特許文献１参照）。そして、典型的な話者認識の構成として、例えばＨＭＭ（hidden Markov model:ＨＭＭ）による話者の登録操作と話者の認識操作とからなる技術が示されている（特許文献１参照）。そして、かかる認識操作の際に認識が失敗すると、例えば他人として棄却される（特許文献２参照）。

信学技報 TECHNICAL REPORT OF IEICE.SP95-111(1996-01) P.17-P.24 特開２００２−２３６６６６号公報

しかしながら、例えば前述の特許文献１及び特許文献２に開示されている技術によれば、認識自体に注目する技術であり、万が一認識が失敗した際の対策が十分とは言い難い。例えば、特許文献１では、認識が失敗した際の対策までについては特に触れておらず、或いは特許文献２では、詐称者は他人として棄却され、ロックが解除されないだけである。かかる対策のみでは、仮に、成りすましによる認識が試みられた場合、かかる事実をユーザが知る由もなく、何ら対策が採られぬまま、詐称者が再度成りすましを試みることを放置することになりかねないという技術的問題点がある。

本発明は、例えば上述した問題点に鑑みてなされたものであり、話者認識における成りすまし或いは詐称を効率的に防止可能な話者認識システム及びコンピュータをこのような話者認識システムとして機能させるコンピュータプログラムを提供することを課題とする。

本発明の請求項１に記載の第１の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段とを備える。

本発明の請求項２に記載の第２の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、前記一のユーザに対して前記履歴情報を通報する通報手段とを備える。

本発明の請求項１３に記載の第３の話者認識システムは上記課題を解決するために、音声入力手段を介して話者認識を行う認識手段と、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段とを備える。

本発明の請求項１８に記載のコンピュータプログラムは上記課題を解決するために、話者認識システムに備えられたコンピュータを、上述した本実施形態に係る、第１、第２又は第３の話者認識システム（但し、その各種態様を含む）として機能させる。

本発明の作用及び他の利得は次に説明する実施するための最良の形態から明らかにされよう。

以下、発明を実施するための最良の形態としての本発明の実施形態に係る、第１、第２及び第３の話者認識システム話者、並びにコンピュータプログラムについて順に説明する。

（話者認識システムの実施形態）
本発明の実施形態に係る第１の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段とを備える。

第１の話者認識システムによれば、話者認識段階で、次のような認識がなされる。

即ちその動作時には、先ず、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段によって、話者認識が行われる。ここに「話者認識」とは、認識を求める話者が、登録された話者（以下、「一のユーザ」とも言う）本人であるか、或いは詐称者であるかであるかを認識すること、即ち話者認識が成功するか失敗するかを調べることである。かかる話者認識は、典型的には話者の発話に基いて行われるが、発話に加えて又は代えて、例えば指紋、虹彩、顔等に基いて話者認識が行われてもよい。

そして、例えばプロセッサ、メモリ等を有してなる検知手段によって、認識手段において話者認識が所定回数に亘って連続して失敗したか否かが検知される。ここに「所定回数」とは、話者が詐称者であると推測されうる回数である。かかる回数は、典型的には、実験或いはシミュレーションにより、一のユーザ本人による動作時には到底有り得ない程に連続して失敗する回数として、話者認識システムの本人認識確率等を総合的に考慮して定められる。また「連続して失敗」とは、複数回に亘って成功を挟むことなく失敗する意味であり、連続した二つの失敗の発生時期の間に、ある程度の時間が空いていてもかまわないし、連続した二つの失敗が発生した場所が同一でなくてもかまわない。但し、簡単には、話者認識を行う際に、同一場所や同一機会に或いは一連の動作中に、連続して失敗する場合も勿論含む。

その結果、上記検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に、話者認識が失敗した旨を示す失敗情報が、例えばディスプレイ等を有してなる通報手段によって、一のユーザに対して通報される。ここに「通報」の態様は、当該話者認識システムが搭載された端末のディスプレイに表示する他、予め設定された電子メール、電話といった一のユーザがその失敗した旨を認識しうる限り各種態様をとっても構わない。この際、一のユーザに加えて、当該話者認識システムの管理者にも通報することで、一層的確且つ迅速な対処が図られる。

以上、第１の話者認識システムによると、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。仮に、詐称者が成りすましにより不正な認識を試みても、その際に連続して失敗したという失敗情報が捨てられることなく、一のユーザや管理者に通報されるので、一のユーザはパスワードの変更等の対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となる。このようにして、詐称者への対策が迅速かつ的確に講じられるので、詐称者が再度成りすましを試みる場合に、認識が成功する確率が一段と下がり、実践上非常に有利である。

本発明の実施形態に係る第２の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、前記一のユーザに対して前記履歴情報を通報する通報手段とを備える。

第２の話者認識システムによれば、話者認識段階で、次のような認識がなされる。

即ちその動作時には、先ず、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段によって、話者認識が行われる。

そして、例えばプロセッサ、メモリ等を有してなる検知手段によって、認識手段において一のユーザに係る話者認識が失敗したか否かが検知される。ここで検知される「失敗したか否か」については、連続しての失敗の回数は問わない。即ち、仮に１回でも失敗していれば、それが検知されてよい。実際には一のユーザ本人による操作に基づく失敗である可能性もあるが、それ以上に、用心深い詐称者も漏れなく検知することの実益を考慮したものである。

該検知手段により話者認識が失敗したことが検知された場合には、例えばプロセッサ、メモリ、データベース等を有してなる履歴格納手段によって、話者認識が失敗した旨を示す失敗情報を含む履歴情報が格納される。ここに「履歴情報」とは、一のユーザについての失敗情報を含む操作履歴が記録された情報であり、典型的には時系列で蓄積される。

その結果、通報手段によって、即座に又は遅延無く、事後的に、若しくは定期的に又は不定期的に、一のユーザに対して履歴情報が通報される。

以上、第２の話者認識システムによると、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。仮に、用心深い詐称者が成りすましにより不正な認識を試みても、その際に一度でも失敗したという失敗情報が捨てられることなく、一のユーザや管理者に通報されるので、一のユーザは再発防止に向けての各種対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となる。このようにして、詐称者への対策が迅速かつ的確に講じられるので、詐称者が再度成りすましを試みる場合に、認識が成功する確率が一段と下がり、実践上非常に有利である。

本実施形態に係る、第１又は第２の話者認識システムの一態様では、前記認識手段は、音声入力手段を介して前記話者認識を行い、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段を更に備え、前記履歴格納手段は、前記履歴情報として、前記記録された音声を更に格納する。

この態様によると、先ず認識手段において、音声入力手段を介した話者認識が行われる。この際、入力された音声が、例えばプロセッサ、メモリ、データベース等を有してなる音声記録手段によって記録され、履歴格納手段によって履歴情報として格納される。従って、このように格納された音声を、詐称者を特定するための有力な情報として活用することも可能となり、詐称者の音声を学習して当該話者認識システムの認識性能も向上可能となる。

この、記録された音声を更に格納する態様では、前記通報手段は、前記履歴情報を通報すると共に、前記一のユーザに対して前記記録された音声を再生してもよい。

この態様によると、例えば詐称者による不正な話者認識が試みられた際には、通報手段によって、一のユーザに対して、履歴情報が通報されるのに加えて記録された音声が再生される。それ故に、この再生される音声に基いて、一のユーザは、確実かつ迅速に不正使用を確認できる。その結果、パスワードの変更等の処理を迅速に行うことも可能となる。

上述した履歴格納手段を備える態様では、前記通報手段は、前記検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、前記一のユーザに対して前記履歴情報を通報してもよい。

この態様によると、検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、通報手段によって、一のユーザに対して履歴情報が通報される。この際、所定回数を、例えば履歴情報によって変更する等して、当該話者認識システムをより柔軟に制御可能となる。

この失敗の回数が連続して所定回数を超えるか否かが判断される態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記履歴格納手段は、前記話者認識が行われる前記端末の端末名を更に前記履歴情報に含めて格納し、前記格納された端末名が前記一のユーザによって普段使用される端末名と異なる場合には、同じ場合に比べて、前記所定回数が少なくされてもよい。

この態様によると、普段使用される端末名と異なる場合には、詐称者による不正使用の可能性が高いので、許容される連続失敗回数が少なくされ、一段と厳しい話者認識が行われる。他方で、普段使用される端末名と同じ場合には、一のユーザ本人である可能性が高いので、比較的寛容な話者認識が行われる。このように、音声以外の情報にも基いて、所定回数が好適に変更されると、話者認識システムの性能が補完されることになり、実践上非常に便利である。

或いは、上述した履歴格納手段を備える態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記履歴格納手段は、当該話者認識の直近で成功した前記話者認識が行われた日時及び前記端末の位置を更に前記履歴情報に含めて格納し、当該話者認識における日時と前記格納された日時との時間差に対する、当該話者認識における前記端末の位置と前記格納された前記端末の位置との距離差が、所定速度閾値を超える場合には、前記検知手段により前記話者認識が失敗したことが検知されてもよい。

この態様によると、履歴格納手段により格納された履歴情報に基いて、次のような判断処理がなされる。即ち、当該話者認識における日時と格納された日時との時間差に対する、当該話者認識における端末の位置と格納された端末の位置との距離差、即ち移動速度が所定速度閾値を超える場合には、話者認識が失敗したことが検知手段により検知される。ここに「所定速度閾値」とは、現実的に或いは物理的に移動するのが困難或いは不可能な速度であり、例えばそのような趣旨に基き最短距離探索のアルゴリズム等に基いて算出した速度として予め設定されてもよい。或いは、自身の経験に基き一のユーザ本人が設定する値としてもよい。尚、かかる閾値は、交通手段に関する技術の発展により変動するので、適宜更新されてもよい。このようにして、本態様では、端末間の移動速度に基き不正使用の疑いが推定される。即ち、移動可能性の観点から話者認識を補完することができる。

本実施形態に係る、第１又は第２の話者認識システムの他の態様では、前記通報手段は、通信手段を介して前記一のユーザに対して遅延なく通報する。

この態様によれば、上述の如く検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合、或いは話者認識が失敗したことが検知された場合には、その失敗情報或いは履歴情報が、通報手段によって、通信手段を介して一のユーザに対して遅延なく通報される。ここでの「通信手段」には、具体的に例えば電子メール、固定電話、携帯電話のような、一のユーザに対して比較的早く通信可能な手段が含まれる。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。

本実施形態に係る、第１又は第２の話者認識システムの他の態様では、前記通報手段は、前記一のユーザが、前記話者認識手段において前記失敗した話者認識の次の機会として前記話者認識を行う際に、前記一のユーザに対して通報する。

この態様によれば、上述の如く検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合、或いは話者認識が失敗したことが検知された場合には、その失敗情報或いは履歴情報が、その失敗の次の機会に一のユーザが話者認識を行う際に、通報手段によって、一のユーザに対して通報される。従って、特別な通信手段がなくとも、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。加えて、当該話者認識システムを現に利用している一のユーザに対してするので、通報と同時にその他の対策を促し、一のユーザはその場で対策を講ずることが可能となる。

本実施形態に係る、第１又は第２の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記通報手段は、通報する際に、前記パスワードを変更すべき旨の通報を行う。

この態様によれば、予め登録されているパスワードに対応する音声に基いて、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段による話者認識が行われる。そして、その話者認識の失敗情報或いは履歴情報が通報手段によって一のユーザに通報される際には、パスワードを変更すべき旨の通報も行われる。詐称者が執拗に成りすましを試みる理由としては、パスワードが漏洩している可能性が高いからである。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を的確に抑制可能となる。

本実施形態に係る、第１又は第２の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記検知手段により検知された場合に、前記パスワードを変更する処理を行う変更処理手段を更に備える。

この態様によれば、予め登録されているパスワードに対応する音声に基いて、認識手段による話者認識が行われる。そして、この話者認識における失敗が検知手段により検知された場合には、例えばプロセッサ、メモリ等を有してなる変更処理手段によってパスワードを変更する処理が行われる。例えば、上記検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合には、成りすましによる不正な話者認識処理が行われているとして、自動的にパスワードを仮のパスワードに変更する。その結果、それ以上同一のパスワードで成りすましを試みることが困難になる。かかる変更されたパスワードは、セキュリティに配慮した上で、通知手段により一のユーザへ通知されれば、一のユーザが当該話者認識システムを次回利用する際にも問題ない。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を極めて迅速に抑制可能となる。

本実施形態に係る、第１又は第２の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記検知手段により検知された場合に、前記パスワードを所定期間無効にする無効処理手段を更に備える。

この態様によれば、予め登録されているパスワードに対応する音声に基いて、認識手段による話者認識が行われる。そして、この話者認識における失敗が検知手段により検知された場合には、例えばプロセッサ、メモリ等を有してなる無効処理手段によって、パスワードが所定期間無効にされる。例えば、一度ならず二度も連続して失敗したような場合には、一時間パスワードが無効にされる。ここに所定時間は、詐称者が連続した試みを断念し得る期間として予め定められるか、或いは、正規ユーザが対策を講ずるのに十分な期間として予め定められるとよく、かかる所定期間は一のユーザ本人によって変更可能にしてもよい。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。

本発明の実施形態に係る第３の話者認識システムは上記課題を解決するために、音声入力手段を介して話者認識を行う認識手段と、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段とを備える。

第３の話者認識システムによれば、認識手段によって、音声入力手段を介して話者認識が行われる。そして、例えばプロセッサ、メモリ、データベース等を有してなる音声記録手段によって、話者認識が行われる際に音声入力手段に入力された音声が記録される。これと同時に又は相前後して、検知手段によって、認識手段において一のユーザに係る話者認識が失敗したか否かが検知される。ここで、該検知手段により話者認識が失敗したことが検知された場合には、履歴格納手段によって、話者認識が失敗したのに対応して記録された音声を含む履歴情報が格納される。

以上、第３の話者認識システムによると、履歴情報には音声も含まれるので、例えばこの音声を分析し、他のユーザに成りすまそうとする他の詐称者の音声との比較をすること等によって、或いは正規ユーザ等による聞き覚えの確認作業を行うこと等によって、詐称者像を割り出し、成りすましの予防等に利用することができる。このようにして、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層効率良く抑制可能となる。

第２又は第３の話者認識システムの他の態様では、前記履歴格納手段は、前記話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つを更に履歴情報に含めて格納する。

この態様によれば、失敗情報や音声データに加えて、話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つが更に、履歴格納手段によって履歴情報に含めて格納される。従って、失敗情報や音声データに加えて、日時、位置情報等も記録されるので、詐称者の特定速度及び精度を高め、詐称者の行動パターンも把握され、もって話者認識における成りすまし或いは詐称の再発を一層的確に抑制可能となる。その際、日時、位置情報等を考慮した結果、明らかに成りすましであると推測されるなら、たとえ連続しての失敗回数が所定回数に至らずとも、当該話者認識を中断して一のユーザ本人にかかる事実を通報するようにしてもよい。その結果、話者認識における成りすまし・詐称の予防され得る。

本実施形態に係る、第１、第２又は第３の話者認識システムの他の態様では、前記検知手段により検知された場合に、前記認識手段において、前記話者認識が、より失敗しやすくなるようにパラメータの変更が行われる。

この態様によれば、検知手段により検知された場合に、認識手段において、話者認識が、より失敗しやすくなるようにパラメータの変更が行われる。従って、詐称者が失敗を重ねるにつれて段々と認識され難くなるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層的確に抑制可能となる。

このパラメータの変更が行われる態様では、前記変更が行われるパラメータは、前記話者認識が失敗されたか否かを判定する際の基準となる、予め登録された前記一のユーザの音声と前記話者認識の際に入力される音声との類似度の閾値であってもよい。

この態様によると、話者認識において失敗されたことが検知される度に、認識手段において、類似度の閾値が引き上げられる。従って、詐称者が次の話者認識を試みる場合には、話者認識が、より失敗しやすくなる。ここで類似度が引き上げられる度合いは、例えば詐称者の学習能力の観点から下限を、体調等による一のユーザ本人の音声変動の観点から上限を夫々設定するとよい。

本実施形態に係る、第１の話者認識システムの他の態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記通報手段は、前記検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、前記話者認識の失敗に係る前記端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合に、前記一のユーザに対して通報する。

この態様によれば、その動作時には、認識手段に通信手段を介して接続された端末からのアクセスを介して認識手段による話者認識が行われる。ここでの端末には、例えば銀行の支店或いはコンビニエンスストアに設けられ、専用線に接続されたＡＴＭ（Auto Teller Machine：ＡＴＭ）、ＧＰＳ（Global Positioning System：ＧＰＳ）機能を搭載するモバイルバンキング可能な携帯電話等が挙げられる。このような認識手段による話者認識の際、検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、即ち、仮に一度きりの失敗が検知された場合であっても、話者認識の失敗に係る端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合には、通報手段は一のユーザに対して通報する。例えば、前回の端末の利用時間と今回の端末の利用時間との時間差及び両端末の距離を勘案して、かかる時間差内に移動することが物理的に不可能であると判断される場合には、詐称者である可能性が比較的高いとして通報がなされる。従って、発話に加えて又は代えて、一のユーザによる利用下では常識的にはありえないような状況を的確に捉えることで、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層的確に抑制可能となる。

（コンピュータプログラムの実施形態）
本実施形態のコンピュータプログラムは、話者認識システムに備えられたコンピュータを、上述した本実施形態に係る、第１、第２又は第３の話者認識システム（但し、その各種態様を含む）として機能させる。

本実施形態のコンピュータプログラムによれば、当該コンピュータプログラムを格納するＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ等の記録媒体から、当該コンピュータプログラムを、話者認識システムに備えられたコンピュータに読み込んで実行させれば、或いは、当該コンピュータプログラムを通信手段を介してダウンロードさせた後に実行させれば、上述した本実施形態の話者認識システムを比較的簡単に構築できる。これにより、上述した本実施形態の話者認識システムの場合と同様に、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。

以上詳細に説明したように、本実施形態の話者認識システムによれば、認識手段、検知手段及び通報手段を備えるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。更に、本実施形態のコンピュータプログラムによれば、コンピュータを認識手段、検知手段及び通報手段として機能させるので、上述した本実施形態の話者認識システムを、比較的容易に構築できる。

本実施形態の作用及び他の利得は次に説明する実施例から明らかにされよう。

以下、本発明の実施例を図面に基いて説明する。

（１）第１実施例
第１実施例に係る話者認識システムの構成及び動作処理を、図１及び図２を参照して説明する。ここに、図１は、本発明の第１実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図であり、図２は、第１実施例に係る、話者認識システムに備わる認識部の基本構成及び基本動作を概念的に示すブロック図である。

図１において、本実施例に係る話者認識システム１は、本発明に係る「認識手段」の一例としてのマイクロホン１３２及び認識部１４と、表示画面５２と、本発明に係る「検知手段」の一例としての検知部６０と、本発明に係る「通報手段」の一例としての通報部７０とを備え、以下の構成下で話者Ａ１２１或いは詐称者１２２の話者認識を行う。

マイクロホン１３２は、話者Ａ１２１或いは詐称者１２２がキーワードの発話を行う際、該発話を電気信号に変換して話者認識システム１に入力する機器である。

認識部１４は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、話者認識時には、認識を求める任意の話者（話者Ａ１２１或いは詐称者１２２）の発話と、登録された話者モデルとを照合することで、かかる話者が、登録された話者モデルの話者Ａ１２１本人であるか否かを認識する。

ここで、図２を用いて認識部１４について説明を加える。

図２において、本実施例に係る認識部１４は、音声部分抽出部１４２と、特徴量算出部２０１と、類似度算出部１５と、話者モデルデータベース４５と、照合部３０とを備える。

ここに、音声部分抽出部１４２は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、背景雑音と音声発話区間とのパワー差を利用する一般的な音声区間検出方法等により、入力される発話に係る電気信号即ち発話データからキーワードが発話されている発話音声部分を切り出す演算装置である。

特徴量算出部２０１は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、入力される発話音声部分を特徴量に変換する。かかる特徴量は、MFCC（Mel Frequency Cepstrum Coefficient：ＭＦＣＣ）、LPC（Linear Predictive Coding：ＬＰＣ）ケプストラム等によって変換される演算装置である。

類似度算出部１５は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、キーワードが発話されている発話音声部分の特徴量と、話者モデルデータベース４５に予め登録されているパスワードに対応する音声の特徴量との類似度の算出を行う。

照合部３０は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、算出された類似度が本人に相当する類似度を示す所定基準に達しているか否かを確認し、話者Ａ１２１或いは詐称者１２２が、登録された話者Ａ１２１本人であるか否かを照合し、この照合結果（例えば、話者認識が成功か失敗か）を出力する。尚、本人に相当する類似度を示す所定基準は、適宜変更され得る値でもよい。具体的には、詐称者１３２が失敗を重ねるにつれて、その失敗が検知部６０により検知され、より失敗しやすくなるように所定基準の変更が行われると、一層詐称され難くなる。

再び図１に戻り、表示画面５２は、例えば液晶ディスプレイ等であり、認識結果を表示する表示機器であり、認識部１４による認識の結果、例えば本人と認識されれば認識成功のメッセージを、本人と認識されなければ認識失敗のメッセージを表示する。

検知部６０は、認識部１４において話者認識が所定回数に亘って連続して失敗したか否かを検知する。例えば、話者認識が、同一機会に又は異なる機会に跨って、５回に亘って連続して失敗した場合には、もはや本人ではなく詐称者である可能性が比較的高いからである。そして、この話者認識が失敗した旨を示す失敗情報が通報部７０に送られる。

通報部７０は、この話者認識が失敗した旨を示す失敗情報を、例えばディスプレイ等を介して、一のユーザ本人（この場合は話者Ａ１２１）に対して通報する。この際、予め設定された電子メール、電話等の通信手段を介せば、失敗情報が話者Ａ１２１に対して遅延なく通報される。或いは、その失敗情報等が、その失敗の次の機会に話者Ａ１２１が話者認識を行う際に通報されば、話者Ａ１２１が通信手段を何ら所持しない場合にも対応できる。加えて、この失敗情報を通報する際に併せてパスワードを変更すべき旨の通報も行えば、パスワードの漏洩にも対応できる。

以上、図１及び図２によると、例えば話者Ａ１２１が認識を求める場合には話者認識が成功する一方で、詐称者１２２が認識を求める場合には、その失敗情報が好適に話者Ａ１２１へと通報されるので、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。

（２）第２実施例
続いて、第２実施例に係る話者認識システムの構成及び基本的な動作を、図１に加えて図３を参照して説明する。ここに、図３は、第２実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図３において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。

図３に係る話者認識システム１は、図１に係る話者認識システム１に加えて、本発明に係る「変更処理手段」の一例としての変更処理部６５と、本発明に係る「無効処理手段」の一例としての無効処理部６６とを更に備える。

例えば、検知部６０により話者認識が所定回数に亘って連続して失敗したことが検知された場合には、変更処理部６５が、話者認識に用いられるパスワードを変更する処理を行う。或いは無効処理部６６が、パスワードを所定期間無効にする。

以上、図３によると、一のユーザ本人に通報されて対策がとられるまでに、パスワードが変更され、或いは無効にされるので、本実施例でも話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。

（３）第３実施例
続いて、第３実施例に係る話者認識システムの構成及び基本的な動作を、図３に加えて図４を参照して説明する。ここに図４は、第３実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図４において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。

図４に係る話者認識システム１は、図３に係る話者認識システム１に加えて、本発明に係る「履歴格納手段」の一例としての履歴格納部８０及び履歴データベース８５を更に備える。

履歴格納部８０は、話者認識が失敗した旨を示す失敗情報を含む履歴情報を、履歴データベース８５に格納する。履歴データベース８５に格納されるテーブル構造は、テーブル８６のようになる。テーブル８６には例えば、話者認識が行われた日時、利用された端末名、その際に連続して失敗した回数（連続失敗回数）、そして認識結果が格納される。そして、この履歴情報に基づき、連続失敗回数が所定回数（例えば５回）より少ないまま認識部１４により一のユーザ本人と認識されれば、当該話者認識は成功であるとされ、他方で一度も一のユーザ本人と認識されぬまま連続失敗回数が所定回数以上になると、当該話者認識は失敗である上に詐称者１３２によるものとされ、通報の対象となる。尚、一のユーザ本人による失敗回数が不用意に蓄積されぬよう、連続失敗回数を数えるためのカウンタは、所定時間又は所定期間を経過した後或いは認識が成功した後に初期値０とされるとよい。或いは、所定時間又は所定期間内に失敗が連続して発生した場合のみを、通報の対象としてもよい。

以上、図４によると、履歴情報に基づき、一のユーザは再発防止に向けての各種対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層効率良く抑制可能となる。

（４）第４実施例
続いて、第４実施例に係る話者認識システムの構成及び基本的な動作を、図１及び図４に加えて図５を参照して説明する。ここに図５は、第４実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図５において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。

図５に係る話者認識システム１は、図４に係る話者認識システム１に加えて、複数の端末（例えば端末Ａ９１及び端末Ｂ９２）と、本発明に係る「音声記録手段」の一例としての音声記録部１４５とを更に備える。

複数の端末は夫々マイクロホン１３２及び表示画面５２を含み、そのうち例えば端末Ａ９１は北海道の支店に、端末Ｂ９２は福岡県の支店に夫々設置される。そのネットワーク構成は、例えば各端末をクライアント内に、その他をサーバ内に配置する、いわゆるクライアント・サーバ型でよい。但し、ネットワーク構成はこれに限らず、例えば履歴データベース８５のみをサーバ内に配置するような構成でもよい。

音声記録部１４５は、当該話者認識が行われる際にマイクロホン１３２に入力された音声を例えば履歴情報に添えて、履歴データベース８５に記録する。そして、例えば詐称者１２２による不正な話者認識が試みられた際には、通報部７０による通報に加えて、記録された音声が再生される。この再生される音声に基いて、一のユーザは、確実かつ迅速に不正使用を確認できるので、パスワードの変更等の処理を迅速に行うことも可能となる。

履歴データベース８５に格納されるテーブル構造は、例えばテーブル８７のようになる。テーブル８７には例えば、話者認識が行われた日時、利用された端末名、その端末が地理的に何処に設置されているかを示す位置情報、音声データ、そして認識結果が格納される。勿論これらに加えて、その際に連続して失敗した回数（連続失敗回数）が格納されてもよい。そして、この履歴情報に基づき、詐称者１２２の割り出しをし、或いは詐称を未然に防ぐ防衛策を施すようにしてもよい。例えば、2006年2月1日に北海道の端末Ａで話者認識が成功しているのにも関わらず、その１分後に福岡県の端末Ｂで話者認識が試みられた場合、１分間で北海道から福岡県へ移動することは物理的に或いは技術的に不可能であるとして、たとえ連続失敗回数が所定回数に至らずとも、この端末Ｂでの話者認識を中断して一のユーザ本人にかかる事実を通報する。この際、音声データも記録されているので、詐称者の特定が飛躍的に高まる。

以上、図５によると、失敗情報に加えて、音声データ、日時及び位置情報等も記録されているので、詐称者の特定速度及び精度を高め、詐称者の行動パターンも把握され、もって話者認識における成りすまし或いは詐称の再発を一層的確に抑制可能となる。この際、上記情報を物理的な困難性の観点等から分析することで、話者認識における成りすまし・詐称も予防され得る。

（５）第５実施例
続いて、第５実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図５に加えて図６を参照して説明する。ここに図６は、第５実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第４実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。

図６において、話者認識にあたりユーザにより音声が入力されると、認識部１４は、入力された音声と、予め登録されている音声との類似度を算出し（ステップＳ１）、この類似度が所定閾値を超えるか否かによってこのユーザが一のユーザ本人か否かが判断される（ステップＳ２）。例えば、所定閾値を０．８とし、０から１の範囲内で求められる類似度が０．８以上であるか否かにより、一のユーザ本人か否かが判断される。

ここで、類似度が所定閾値を超えない場合（ステップＳ２：Ｎｏ）、続いて、検知部１４により、連続認識失敗回数が既定値を超えるか否かが判断され、認識失敗フラグがセットされる（ステップＳ３２）。例えば、既定値を５回とし、連続認識失敗回数が５回を超えるか否かが判断される。

ここで、未だ連続認識失敗回数が既定値の５回を超えない場合（ステップＳ３２：Ｎｏ）、ユーザは再度音声を入力し直して話者認識を再試行する。一のユーザ本人でも雑音や体調により何度か失敗することはあり得るからである。

他方で、連続認識失敗回数が既定値の５回を超える場合（ステップＳ３２：Ｙｅｓ）、もはや雑音如何が言い訳にならない失敗回数であり、詐称者である可能性が比較的高いとして、当該話者認識の処理が全体として失敗した旨が表示画面５２に表示される。加えて、無効処理部６６はパスワードを一時的に無効にし、履歴格納部８０は当該話者認識に関する失敗情報を含む履歴情報を、音声記録部１４５は当該話者認識において入力された音声データを夫々履歴データベース８５に格納する（ステップＳ４２）。

他方で、類似度が所定閾値を超える場合（ステップＳ２：Ｙｅｓ）、即ち、一のユーザ本人であると認識される場合、基本的にこの時点で認識は成功である。そして詐称者の出現がある場合には対策を促すために、認識失敗フラグがセットされているか否かに基いて、前回の話者認識が失敗しているか否かが確認される（ステップＳ３１）。

ここで、前回の話者認識が失敗している場合（ステップＳ３１：Ｙｅｓ）、通報部７０は、認識失敗履歴（即ち、詐称者による認識が行われたという事実）を今回の認識に成功したユーザに対して通報し、これを受けたユーザが身に覚えがなければパスワードを変更する等の対策を採ることでシステムの安全性を確保できる（ステップＳ４１）。逆に、身に覚えがあれば変更をする必要はない。

他方で、前回の話者認識が失敗していない場合（ステップＳ３１：Ｎｏ）、特に詐称者による認識が行われたという形跡もないので、そのまま認識成功処理として、このユーザが許可され、表示画面５２にその旨が表示される（ステップＳ４３）。

以上、本実施例では、図６に示した処理が行われるので、好適に話者認識が行われる。特に、認識が連続して失敗する際の対策が採られており、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。

（６）第６実施例
続いて、第６実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図５及び図６に加えて図７を参照して説明する。ここに図７は、第６実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第４実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第５実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。

図７では図６と比べて特に、認識を失敗するたびに、一のユーザ本人以外の認識がさらに困難になるように、認識部１４による類似度判定の閾値を上げる処理が追加されている（ステップＳ５２）。

従って、本実施例では、詐称者が、連続して認識失敗する度に一のユーザ本人の音声に近づくように学習して認識に成功してしまうような事態を回避可能となり、実践上非常に有利である。

（７）第７実施例
続いて、第７実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図５及び図６に加えて図８を参照して説明する。ここに図８は、第７実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第４実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第５実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。

図８では図６と比べて特に、一のユーザ本人が普段使っている端末と今回使用している端末が異なるか否かを確認する処理が追加されている。具体的には、今回使っている端末が普段使っている端末か否かが判定される（ステップＳ２２０）。この際、普段使っている端末は、例えば、一のユーザ本人によって予め設定されるとよい。そして、普段使っている端末と判定された場合（ステップＳ２２０：Ｙｅｓ）、連続失敗回数の既定値にαが代入される（ステップＳ２２１）。他方で、普段使っている端末でないと判定された場合（ステップＳ２２０：Ｎｏ）、連続失敗回数の既定値にβが代入される（ステップＳ２２２）。ここに、α＞βである。なぜなら、今回使用している端末が普段使っている端末ではないということは、一のユーザ本人以外の人物が認識処理を行おうとしている可能性が高いと推定されるため、連続失敗回数の既定値を小さくした方が好ましいからである。

以上、本実施例では、使用される端末から一のユーザ本人か否かの可能性を絞込まれ、一層適切に話者認識が行われる。

（８）第８実施例
続いて、第８実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図５及び図６に加えて図９を参照して説明する。ここに図９は、第８実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第４実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第５実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。

図９では図６と比べて特に、前回と今回使っている端末間の移動可能性に基いて、話者認識を補助する処理が追加されている。具体的には、先ず、予め設定された各端末の地理的な情報から前回の認識と今回の認識とで使用された端末間の距離である使用端末間距離Ｄが取得される（ステップＳ２２５）。加えて、前回の認識時と今回の認識時との時刻差である使用時刻差Ｔが取得される（ステップＳ２２６）。続いて、この使用端末間距離Ｄと、使用時刻差Ｔとから、前回の認識で使用された端末と今回の認識で使用された端末との間の移動速度Ｖが、Ｖ＝Ｄ／Ｔとして算出される（ステップＳ２２７）。そして、この移動速度Ｖが所定速度閾値を超えるか否かが判断される（ステップ３２１）。ここに、「所定速度閾値」とは、移動するのが困難或いは不可能な速度として予め設定された値であり、例えば１０００ｋｍ／ｈである。ここで、移動速度Ｖが所定速度閾値を超える場合（ステップＳ３２１：Ｙｅｓ）、一のユーザ本人がこのよう速度で移動するとは考えられない、即ち、詐称者による不正使用である疑いが強いので、認識失敗処理等が行われる（ステップＳ４２）。他方、移動速度Ｖが所定速度閾値を超えない場合（ステップＳ３２１：Ｎｏ）、移動速度Ｖからは不正使用の疑いを推定できないので、引き続き話者認識が行われる（ステップＳ１）。

以上、本実施例では、前回と今回使っている端末間の移動可能性に基いて、不正使用の疑いが推定されるので、一層適切に話者認識が行われる。

（９）第９実施例
続いて、第９実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図５及び図６に加えて図１０を参照して説明する。ここに図１０は、第９実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第４実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第５実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。

図１０では図６と比べて特に、連続認識失敗回数が既定値を超える場合（ステップＳ３２：Ｙｅｓ）に、失敗情報を通報するタイミングが異なる。具体的には、図６において失敗情報が通報されるタイミングは、この失敗情報に係る認識以降の認識において認識が成功する時（ステップＳ４１）であり、失敗時との間に比較的長いタイムラグが生じる。それに対して、図７において失敗情報が通報されるタイミングは、この失敗情報に係る認識が行われる時点（ステップＳ４２２）であり、失敗時との間に生じるタイムラグは比較的短くて済む。故に、一のユーザ本人や当該話者認識システムの管理者が迅速に対策を講ずることが可能である。加えて、例えばパスワードが一時的に無効にされている状況下で、一のユーザ本人がかかる無効の事実を知らずに、認識に失敗してしまうことを回避可能となる。

以上、本実施例では、図１０に示した処理が行われるので、好適に話者認識が行われる。特に、認識が連続して失敗する際の、適切なタイミングで一のユーザ本人が通報を受けるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。

尚、本発明は、上述した実施例に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨、或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う話者認識システム及びコンピュータプログラムもまた、本発明の技術的範囲に含まれるものである。

本発明の第１実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。第１実施例に係る、話者認識システムに備わる認識部の基本構成及び基本動作を概念的に示すブロック図である。第２実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。第３実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。第４実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。第５実施例に係る、話者認識システムの動作処理を示すフローチャートである。第６実施例に係る、話者認識システムの動作処理を示すフローチャートである。第７実施例に係る、話者認識システムの動作処理を示すフローチャートである。第８実施例に係る、話者認識システムの動作処理を示すフローチャートである。第９実施例に係る、話者認識システムの動作処理を示すフローチャートである。

符号の説明

１話者認識システム
１３２マイクロホン
１４認識部
５２表示画面
６０検知部
７０通報部
６５変更処理部
６６無効処理部
８０履歴格納部
８５履歴データベース
１４５音声記録部

Claims

話者認識を行う認識手段と、
前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、
該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段と
を備えることを特徴とする話者認識システム。
話者認識を行う認識手段と、
前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、
該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、
前記一のユーザに対して前記履歴情報を通報する通報手段と
を備えることを特徴とする話者認識システム。
前記認識手段は、音声入力手段を介して前記話者認識を行い、
前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段を更に備え、
前記履歴格納手段は、前記履歴情報として、前記記録された音声を更に格納する
ことを特徴とする請求項２に記載の話者認識システム。
前記通報手段は、前記履歴情報を通報すると共に、前記一のユーザに対して前記記録された音声を再生する
ことを特徴とする請求項３に記載の話者認識システム。
前記通報手段は、前記検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、前記一のユーザに対して前記履歴情報を通報する
ことを特徴とする請求項２から４のいずれか一項に記載の話者認識システム。
前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
前記履歴格納手段は、前記話者認識が行われる前記端末の端末名を更に前記履歴情報に含めて格納し、
前記格納された端末名が前記一のユーザによって普段使用される端末名と異なる場合には、同じ場合に比べて、前記所定回数が少ない
ことを特徴とする請求項５に記載の話者認識システム。
前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
前記履歴格納手段は、当該話者認識の直近で成功した前記話者認識が行われた日時及び前記端末の位置を更に前記履歴情報に含めて格納し、
当該話者認識における日時と前記格納された日時との時間差に対する、当該話者認識における前記端末の位置と前記格納された前記端末の位置との距離差が、所定速度閾値を超える場合には、前記検知手段により前記話者認識が失敗したことが検知される
ことを特徴とする請求項２から６のいずれか一項に記載の話者認識システム。
前記通報手段は、通信手段を介して前記一のユーザに対して遅延なく通報することを特徴とする請求項１から７のいずれか一項に記載の話者認識システム。
前記通報手段は、前記一のユーザが、前記話者認識手段において前記失敗した話者認識の次の機会として前記話者認識を行う際に、前記一のユーザに対して通報することを特徴とする請求項１から８のいずれか一項に記載の話者認識システム。
前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
前記通報手段は、通報する際に、前記パスワードを変更すべき旨の通報を行う
ことを特徴とする請求項１から９のいずれか一項に記載の話者認識システム。
前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
前記検知手段により検知された場合に、前記パスワードを変更する処理を行う変更処理手段を更に備える
ことを特徴とする請求項１から１０のいずれか一項に記載の話者認識システム。
前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
前記検知手段により検知された場合に、前記パスワードを所定期間無効にする無効処理手段を更に備える
ことを特徴とする請求項１から１１のいずれか一項に記載の話者認識システム。
音声入力手段を介して話者認識を行う認識手段と、
前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、
前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、
該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段と
を備えることを特徴とする話者認識システム。
前記履歴格納手段は、前記話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つを更に前記履歴情報に含めて格納する
ことを特徴とする請求項２又は請求項１３に記載の話者認識システム。
前記検知手段により検知された場合に、前記認識手段において、前記話者認識が、より失敗しやすくなるようにパラメータの変更が行われる
ことを特徴とする請求項１から１４のいずれか一項に記載の話者認識システム。
前記変更が行われるパラメータは、前記話者認識が失敗されたか否かを判定する際の基準となる、予め登録された前記一のユーザの音声と前記話者認識の際に入力される音声との類似度の閾値である
ことを特徴とする請求項１５に記載の話者認識システム。
前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
前記通報手段は、前記検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、前記話者認識の失敗に係る前記端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合に、前記一のユーザに対して通報する
ことを特徴とする請求項１に記載の話者認識システム。
コンピュータを、請求項１から１７のいずれか一項に記載の話者認識システムとして機能させることを特徴とするコンピュータプログラム。