JP2009145924A - 話者認識システム及びコンピュータプログラム - Google Patents

話者認識システム及びコンピュータプログラム Download PDF

Info

Publication number
JP2009145924A
JP2009145924A JP2006086165A JP2006086165A JP2009145924A JP 2009145924 A JP2009145924 A JP 2009145924A JP 2006086165 A JP2006086165 A JP 2006086165A JP 2006086165 A JP2006086165 A JP 2006086165A JP 2009145924 A JP2009145924 A JP 2009145924A
Authority
JP
Japan
Prior art keywords
speaker recognition
recognition
speaker
user
failed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006086165A
Other languages
English (en)
Inventor
Yoshihiro Kawazoe
佳洋 川添
Soichi Toyama
聡一 外山
Teruya Komamura
光弥 駒村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Tech Experts Inc
Original Assignee
Pioneer Electronic Corp
Tech Experts Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp, Tech Experts Inc filed Critical Pioneer Electronic Corp
Priority to JP2006086165A priority Critical patent/JP2009145924A/ja
Priority to PCT/JP2007/055434 priority patent/WO2007111170A1/ja
Publication of JP2009145924A publication Critical patent/JP2009145924A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Alarm Systems (AREA)

Abstract

【課題】話者認識システムにより、例えば話者認識における成りすまし或いは詐称を好適に回避し或いは予防する。
【解決手段】話者認識システム(1)は、話者認識を行う認識手段(132、14)と、認識手段において一のユーザに係る話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段(60)とを備える。更に、該検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に、話者認識が失敗した旨を示す失敗情報を、一のユーザに対して通報する通報手段(70)を備える。
【選択図】図1

Description

本発明は、例えばカーナビ装置、ネットバンキング装置、オートロック装置、コンピュータの認識装置等の各種コンピュータ機器や各種電子電気機器に設けられ、そのユーザである話者の発話に基いて、話者認識を行う話者認識システム及びコンピュータをそのような話者認識システムとして機能させるコンピュータプログラムの技術分野に関する。
この種の話者認識システムには、認識に用いられる発話されたテキストが予め登録されているテキスト固定型或いはテキスト依存型と、このような登録が不要であり任意のテキストについて認識を行うテキスト独立型或いは非テキスト依存型と、認識の際或いは都度に認識にテキストが指定されるテキスト指定型の三種類がある(特許文献1参照)。そして、典型的な話者認識の構成として、例えばHMM(hidden Markov model:HMM)による話者の登録操作と話者の認識操作とからなる技術が示されている(特許文献1参照)。そして、かかる認識操作の際に認識が失敗すると、例えば他人として棄却される(特許文献2参照)。
信学技報 TECHNICAL REPORT OF IEICE.SP95-111(1996-01) P.17-P.24 特開2002−236666号公報
しかしながら、例えば前述の特許文献1及び特許文献2に開示されている技術によれば、認識自体に注目する技術であり、万が一認識が失敗した際の対策が十分とは言い難い。例えば、特許文献1では、認識が失敗した際の対策までについては特に触れておらず、或いは特許文献2では、詐称者は他人として棄却され、ロックが解除されないだけである。かかる対策のみでは、仮に、成りすましによる認識が試みられた場合、かかる事実をユーザが知る由もなく、何ら対策が採られぬまま、詐称者が再度成りすましを試みることを放置することになりかねないという技術的問題点がある。
本発明は、例えば上述した問題点に鑑みてなされたものであり、話者認識における成りすまし或いは詐称を効率的に防止可能な話者認識システム及びコンピュータをこのような話者認識システムとして機能させるコンピュータプログラムを提供することを課題とする。
本発明の請求項1に記載の第1の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段とを備える。
本発明の請求項2に記載の第2の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、前記一のユーザに対して前記履歴情報を通報する通報手段とを備える。
本発明の請求項13に記載の第3の話者認識システムは上記課題を解決するために、音声入力手段を介して話者認識を行う認識手段と、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段とを備える。
本発明の請求項18に記載のコンピュータプログラムは上記課題を解決するために、話者認識システムに備えられたコンピュータを、上述した本実施形態に係る、第1、第2又は第3の話者認識システム(但し、その各種態様を含む)として機能させる。
本発明の作用及び他の利得は次に説明する実施するための最良の形態から明らかにされよう。
以下、発明を実施するための最良の形態としての本発明の実施形態に係る、第1、第2及び第3の話者認識システム話者、並びにコンピュータプログラムについて順に説明する。
(話者認識システムの実施形態)
本発明の実施形態に係る第1の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段とを備える。
第1の話者認識システムによれば、話者認識段階で、次のような認識がなされる。
即ちその動作時には、先ず、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段によって、話者認識が行われる。ここに「話者認識」とは、認識を求める話者が、登録された話者(以下、「一のユーザ」とも言う)本人であるか、或いは詐称者であるかであるかを認識すること、即ち話者認識が成功するか失敗するかを調べることである。かかる話者認識は、典型的には話者の発話に基いて行われるが、発話に加えて又は代えて、例えば指紋、虹彩、顔等に基いて話者認識が行われてもよい。
そして、例えばプロセッサ、メモリ等を有してなる検知手段によって、認識手段において話者認識が所定回数に亘って連続して失敗したか否かが検知される。ここに「所定回数」とは、話者が詐称者であると推測されうる回数である。かかる回数は、典型的には、実験或いはシミュレーションにより、一のユーザ本人による動作時には到底有り得ない程に連続して失敗する回数として、話者認識システムの本人認識確率等を総合的に考慮して定められる。また「連続して失敗」とは、複数回に亘って成功を挟むことなく失敗する意味であり、連続した二つの失敗の発生時期の間に、ある程度の時間が空いていてもかまわないし、連続した二つの失敗が発生した場所が同一でなくてもかまわない。但し、簡単には、話者認識を行う際に、同一場所や同一機会に或いは一連の動作中に、連続して失敗する場合も勿論含む。
その結果、上記検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に、話者認識が失敗した旨を示す失敗情報が、例えばディスプレイ等を有してなる通報手段によって、一のユーザに対して通報される。ここに「通報」の態様は、当該話者認識システムが搭載された端末のディスプレイに表示する他、予め設定された電子メール、電話といった一のユーザがその失敗した旨を認識しうる限り各種態様をとっても構わない。この際、一のユーザに加えて、当該話者認識システムの管理者にも通報することで、一層的確且つ迅速な対処が図られる。
以上、第1の話者認識システムによると、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。仮に、詐称者が成りすましにより不正な認識を試みても、その際に連続して失敗したという失敗情報が捨てられることなく、一のユーザや管理者に通報されるので、一のユーザはパスワードの変更等の対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となる。このようにして、詐称者への対策が迅速かつ的確に講じられるので、詐称者が再度成りすましを試みる場合に、認識が成功する確率が一段と下がり、実践上非常に有利である。
本発明の実施形態に係る第2の話者認識システムは上記課題を解決するために、話者認識を行う認識手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、前記一のユーザに対して前記履歴情報を通報する通報手段とを備える。
第2の話者認識システムによれば、話者認識段階で、次のような認識がなされる。
即ちその動作時には、先ず、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段によって、話者認識が行われる。
そして、例えばプロセッサ、メモリ等を有してなる検知手段によって、認識手段において一のユーザに係る話者認識が失敗したか否かが検知される。ここで検知される「失敗したか否か」については、連続しての失敗の回数は問わない。即ち、仮に1回でも失敗していれば、それが検知されてよい。実際には一のユーザ本人による操作に基づく失敗である可能性もあるが、それ以上に、用心深い詐称者も漏れなく検知することの実益を考慮したものである。
該検知手段により話者認識が失敗したことが検知された場合には、例えばプロセッサ、メモリ、データベース等を有してなる履歴格納手段によって、話者認識が失敗した旨を示す失敗情報を含む履歴情報が格納される。ここに「履歴情報」とは、一のユーザについての失敗情報を含む操作履歴が記録された情報であり、典型的には時系列で蓄積される。
その結果、通報手段によって、即座に又は遅延無く、事後的に、若しくは定期的に又は不定期的に、一のユーザに対して履歴情報が通報される。
以上、第2の話者認識システムによると、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。仮に、用心深い詐称者が成りすましにより不正な認識を試みても、その際に一度でも失敗したという失敗情報が捨てられることなく、一のユーザや管理者に通報されるので、一のユーザは再発防止に向けての各種対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となる。このようにして、詐称者への対策が迅速かつ的確に講じられるので、詐称者が再度成りすましを試みる場合に、認識が成功する確率が一段と下がり、実践上非常に有利である。
本実施形態に係る、第1又は第2の話者認識システムの一態様では、前記認識手段は、音声入力手段を介して前記話者認識を行い、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段を更に備え、前記履歴格納手段は、前記履歴情報として、前記記録された音声を更に格納する。
この態様によると、先ず認識手段において、音声入力手段を介した話者認識が行われる。この際、入力された音声が、例えばプロセッサ、メモリ、データベース等を有してなる音声記録手段によって記録され、履歴格納手段によって履歴情報として格納される。従って、このように格納された音声を、詐称者を特定するための有力な情報として活用することも可能となり、詐称者の音声を学習して当該話者認識システムの認識性能も向上可能となる。
この、記録された音声を更に格納する態様では、前記通報手段は、前記履歴情報を通報すると共に、前記一のユーザに対して前記記録された音声を再生してもよい。
この態様によると、例えば詐称者による不正な話者認識が試みられた際には、通報手段によって、一のユーザに対して、履歴情報が通報されるのに加えて記録された音声が再生される。それ故に、この再生される音声に基いて、一のユーザは、確実かつ迅速に不正使用を確認できる。その結果、パスワードの変更等の処理を迅速に行うことも可能となる。
上述した履歴格納手段を備える態様では、前記通報手段は、前記検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、前記一のユーザに対して前記履歴情報を通報してもよい。
この態様によると、検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、通報手段によって、一のユーザに対して履歴情報が通報される。この際、所定回数を、例えば履歴情報によって変更する等して、当該話者認識システムをより柔軟に制御可能となる。
この失敗の回数が連続して所定回数を超えるか否かが判断される態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記履歴格納手段は、前記話者認識が行われる前記端末の端末名を更に前記履歴情報に含めて格納し、前記格納された端末名が前記一のユーザによって普段使用される端末名と異なる場合には、同じ場合に比べて、前記所定回数が少なくされてもよい。
この態様によると、普段使用される端末名と異なる場合には、詐称者による不正使用の可能性が高いので、許容される連続失敗回数が少なくされ、一段と厳しい話者認識が行われる。他方で、普段使用される端末名と同じ場合には、一のユーザ本人である可能性が高いので、比較的寛容な話者認識が行われる。このように、音声以外の情報にも基いて、所定回数が好適に変更されると、話者認識システムの性能が補完されることになり、実践上非常に便利である。
或いは、上述した履歴格納手段を備える態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記履歴格納手段は、当該話者認識の直近で成功した前記話者認識が行われた日時及び前記端末の位置を更に前記履歴情報に含めて格納し、当該話者認識における日時と前記格納された日時との時間差に対する、当該話者認識における前記端末の位置と前記格納された前記端末の位置との距離差が、所定速度閾値を超える場合には、前記検知手段により前記話者認識が失敗したことが検知されてもよい。
この態様によると、履歴格納手段により格納された履歴情報に基いて、次のような判断処理がなされる。即ち、当該話者認識における日時と格納された日時との時間差に対する、当該話者認識における端末の位置と格納された端末の位置との距離差、即ち移動速度が所定速度閾値を超える場合には、話者認識が失敗したことが検知手段により検知される。ここに「所定速度閾値」とは、現実的に或いは物理的に移動するのが困難或いは不可能な速度であり、例えばそのような趣旨に基き最短距離探索のアルゴリズム等に基いて算出した速度として予め設定されてもよい。或いは、自身の経験に基き一のユーザ本人が設定する値としてもよい。尚、かかる閾値は、交通手段に関する技術の発展により変動するので、適宜更新されてもよい。このようにして、本態様では、端末間の移動速度に基き不正使用の疑いが推定される。即ち、移動可能性の観点から話者認識を補完することができる。
本実施形態に係る、第1又は第2の話者認識システムの他の態様では、前記通報手段は、通信手段を介して前記一のユーザに対して遅延なく通報する。
この態様によれば、上述の如く検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合、或いは話者認識が失敗したことが検知された場合には、その失敗情報或いは履歴情報が、通報手段によって、通信手段を介して一のユーザに対して遅延なく通報される。ここでの「通信手段」には、具体的に例えば電子メール、固定電話、携帯電話のような、一のユーザに対して比較的早く通信可能な手段が含まれる。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。
本実施形態に係る、第1又は第2の話者認識システムの他の態様では、前記通報手段は、前記一のユーザが、前記話者認識手段において前記失敗した話者認識の次の機会として前記話者認識を行う際に、前記一のユーザに対して通報する。
この態様によれば、上述の如く検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合、或いは話者認識が失敗したことが検知された場合には、その失敗情報或いは履歴情報が、その失敗の次の機会に一のユーザが話者認識を行う際に、通報手段によって、一のユーザに対して通報される。従って、特別な通信手段がなくとも、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。加えて、当該話者認識システムを現に利用している一のユーザに対してするので、通報と同時にその他の対策を促し、一のユーザはその場で対策を講ずることが可能となる。
本実施形態に係る、第1又は第2の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記通報手段は、通報する際に、前記パスワードを変更すべき旨の通報を行う。
この態様によれば、予め登録されているパスワードに対応する音声に基いて、例えばマイクロホン、カメラ、プロセッサ、メモリ等を有してなる認識手段による話者認識が行われる。そして、その話者認識の失敗情報或いは履歴情報が通報手段によって一のユーザに通報される際には、パスワードを変更すべき旨の通報も行われる。詐称者が執拗に成りすましを試みる理由としては、パスワードが漏洩している可能性が高いからである。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を的確に抑制可能となる。
本実施形態に係る、第1又は第2の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記検知手段により検知された場合に、前記パスワードを変更する処理を行う変更処理手段を更に備える。
この態様によれば、予め登録されているパスワードに対応する音声に基いて、認識手段による話者認識が行われる。そして、この話者認識における失敗が検知手段により検知された場合には、例えばプロセッサ、メモリ等を有してなる変更処理手段によってパスワードを変更する処理が行われる。例えば、上記検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合には、成りすましによる不正な話者認識処理が行われているとして、自動的にパスワードを仮のパスワードに変更する。その結果、それ以上同一のパスワードで成りすましを試みることが困難になる。かかる変更されたパスワードは、セキュリティに配慮した上で、通知手段により一のユーザへ通知されれば、一のユーザが当該話者認識システムを次回利用する際にも問題ない。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を極めて迅速に抑制可能となる。
本実施形態に係る、第1又は第2の話者認識システムの他の態様では、前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、前記検知手段により検知された場合に、前記パスワードを所定期間無効にする無効処理手段を更に備える。
この態様によれば、予め登録されているパスワードに対応する音声に基いて、認識手段による話者認識が行われる。そして、この話者認識における失敗が検知手段により検知された場合には、例えばプロセッサ、メモリ等を有してなる無効処理手段によって、パスワードが所定期間無効にされる。例えば、一度ならず二度も連続して失敗したような場合には、一時間パスワードが無効にされる。ここに所定時間は、詐称者が連続した試みを断念し得る期間として予め定められるか、或いは、正規ユーザが対策を講ずるのに十分な期間として予め定められるとよく、かかる所定期間は一のユーザ本人によって変更可能にしてもよい。従って、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。
本発明の実施形態に係る第3の話者認識システムは上記課題を解決するために、音声入力手段を介して話者認識を行う認識手段と、前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段とを備える。
第3の話者認識システムによれば、認識手段によって、音声入力手段を介して話者認識が行われる。そして、例えばプロセッサ、メモリ、データベース等を有してなる音声記録手段によって、話者認識が行われる際に音声入力手段に入力された音声が記録される。これと同時に又は相前後して、検知手段によって、認識手段において一のユーザに係る話者認識が失敗したか否かが検知される。ここで、該検知手段により話者認識が失敗したことが検知された場合には、履歴格納手段によって、話者認識が失敗したのに対応して記録された音声を含む履歴情報が格納される。
以上、第3の話者認識システムによると、履歴情報には音声も含まれるので、例えばこの音声を分析し、他のユーザに成りすまそうとする他の詐称者の音声との比較をすること等によって、或いは正規ユーザ等による聞き覚えの確認作業を行うこと等によって、詐称者像を割り出し、成りすましの予防等に利用することができる。このようにして、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層効率良く抑制可能となる。
第2又は第3の話者認識システムの他の態様では、前記履歴格納手段は、前記話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つを更に履歴情報に含めて格納する。
この態様によれば、失敗情報や音声データに加えて、話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つが更に、履歴格納手段によって履歴情報に含めて格納される。従って、失敗情報や音声データに加えて、日時、位置情報等も記録されるので、詐称者の特定速度及び精度を高め、詐称者の行動パターンも把握され、もって話者認識における成りすまし或いは詐称の再発を一層的確に抑制可能となる。その際、日時、位置情報等を考慮した結果、明らかに成りすましであると推測されるなら、たとえ連続しての失敗回数が所定回数に至らずとも、当該話者認識を中断して一のユーザ本人にかかる事実を通報するようにしてもよい。その結果、話者認識における成りすまし・詐称の予防され得る。
本実施形態に係る、第1、第2又は第3の話者認識システムの他の態様では、前記検知手段により検知された場合に、前記認識手段において、前記話者認識が、より失敗しやすくなるようにパラメータの変更が行われる。
この態様によれば、検知手段により検知された場合に、認識手段において、話者認識が、より失敗しやすくなるようにパラメータの変更が行われる。従って、詐称者が失敗を重ねるにつれて段々と認識され難くなるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層的確に抑制可能となる。
このパラメータの変更が行われる態様では、前記変更が行われるパラメータは、前記話者認識が失敗されたか否かを判定する際の基準となる、予め登録された前記一のユーザの音声と前記話者認識の際に入力される音声との類似度の閾値であってもよい。
この態様によると、話者認識において失敗されたことが検知される度に、認識手段において、類似度の閾値が引き上げられる。従って、詐称者が次の話者認識を試みる場合には、話者認識が、より失敗しやすくなる。ここで類似度が引き上げられる度合いは、例えば詐称者の学習能力の観点から下限を、体調等による一のユーザ本人の音声変動の観点から上限を夫々設定するとよい。
本実施形態に係る、第1の話者認識システムの他の態様では、前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、前記通報手段は、前記検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、前記話者認識の失敗に係る前記端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合に、前記一のユーザに対して通報する。
この態様によれば、その動作時には、認識手段に通信手段を介して接続された端末からのアクセスを介して認識手段による話者認識が行われる。ここでの端末には、例えば銀行の支店或いはコンビニエンスストアに設けられ、専用線に接続されたATM(Auto Teller Machine:ATM)、GPS(Global Positioning System:GPS)機能を搭載するモバイルバンキング可能な携帯電話等が挙げられる。このような認識手段による話者認識の際、検知手段により話者認識が所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、即ち、仮に一度きりの失敗が検知された場合であっても、話者認識の失敗に係る端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合には、通報手段は一のユーザに対して通報する。例えば、前回の端末の利用時間と今回の端末の利用時間との時間差及び両端末の距離を勘案して、かかる時間差内に移動することが物理的に不可能であると判断される場合には、詐称者である可能性が比較的高いとして通報がなされる。従って、発話に加えて又は代えて、一のユーザによる利用下では常識的にはありえないような状況を的確に捉えることで、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層的確に抑制可能となる。
(コンピュータプログラムの実施形態)
本実施形態のコンピュータプログラムは、話者認識システムに備えられたコンピュータを、上述した本実施形態に係る、第1、第2又は第3の話者認識システム(但し、その各種態様を含む)として機能させる。
本実施形態のコンピュータプログラムによれば、当該コンピュータプログラムを格納するCD−ROM、DVD−ROM等の記録媒体から、当該コンピュータプログラムを、話者認識システムに備えられたコンピュータに読み込んで実行させれば、或いは、当該コンピュータプログラムを通信手段を介してダウンロードさせた後に実行させれば、上述した本実施形態の話者認識システムを比較的簡単に構築できる。これにより、上述した本実施形態の話者認識システムの場合と同様に、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。
以上詳細に説明したように、本実施形態の話者認識システムによれば、認識手段、検知手段及び通報手段を備えるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を抑制可能となる。更に、本実施形態のコンピュータプログラムによれば、コンピュータを認識手段、検知手段及び通報手段として機能させるので、上述した本実施形態の話者認識システムを、比較的容易に構築できる。
本実施形態の作用及び他の利得は次に説明する実施例から明らかにされよう。
以下、本発明の実施例を図面に基いて説明する。
(1)第1実施例
第1実施例に係る話者認識システムの構成及び動作処理を、図1及び図2を参照して説明する。ここに、図1は、本発明の第1実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図であり、図2は、第1実施例に係る、話者認識システムに備わる認識部の基本構成及び基本動作を概念的に示すブロック図である。
図1において、本実施例に係る話者認識システム1は、本発明に係る「認識手段」の一例としてのマイクロホン132及び認識部14と、表示画面52と、本発明に係る「検知手段」の一例としての検知部60と、本発明に係る「通報手段」の一例としての通報部70とを備え、以下の構成下で話者A121或いは詐称者122の話者認識を行う。
マイクロホン132は、話者A121或いは詐称者122がキーワードの発話を行う際、該発話を電気信号に変換して話者認識システム1に入力する機器である。
認識部14は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、話者認識時には、認識を求める任意の話者(話者A121或いは詐称者122)の発話と、登録された話者モデルとを照合することで、かかる話者が、登録された話者モデルの話者A121本人であるか否かを認識する。
ここで、図2を用いて認識部14について説明を加える。
図2において、本実施例に係る認識部14は、音声部分抽出部142と、特徴量算出部201と、類似度算出部15と、話者モデルデータベース45と、照合部30とを備える。
ここに、音声部分抽出部142は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、背景雑音と音声発話区間とのパワー差を利用する一般的な音声区間検出方法等により、入力される発話に係る電気信号即ち発話データからキーワードが発話されている発話音声部分を切り出す演算装置である。
特徴量算出部201は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、入力される発話音声部分を特徴量に変換する。かかる特徴量は、MFCC(Mel Frequency Cepstrum Coefficient:MFCC)、LPC(Linear Predictive Coding:LPC)ケプストラム等によって変換される演算装置である。
類似度算出部15は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、キーワードが発話されている発話音声部分の特徴量と、話者モデルデータベース45に予め登録されているパスワードに対応する音声の特徴量との類似度の算出を行う。
照合部30は、例えばプロセッサ、メモリ等を備えたコンピュータ内にプログラムに従って論理的に構築されるものであり、算出された類似度が本人に相当する類似度を示す所定基準に達しているか否かを確認し、話者A121或いは詐称者122が、登録された話者A121本人であるか否かを照合し、この照合結果(例えば、話者認識が成功か失敗か)を出力する。尚、本人に相当する類似度を示す所定基準は、適宜変更され得る値でもよい。具体的には、詐称者132が失敗を重ねるにつれて、その失敗が検知部60により検知され、より失敗しやすくなるように所定基準の変更が行われると、一層詐称され難くなる。
再び図1に戻り、表示画面52は、例えば液晶ディスプレイ等であり、認識結果を表示する表示機器であり、認識部14による認識の結果、例えば本人と認識されれば認識成功のメッセージを、本人と認識されなければ認識失敗のメッセージを表示する。
検知部60は、認識部14において話者認識が所定回数に亘って連続して失敗したか否かを検知する。例えば、話者認識が、同一機会に又は異なる機会に跨って、5回に亘って連続して失敗した場合には、もはや本人ではなく詐称者である可能性が比較的高いからである。そして、この話者認識が失敗した旨を示す失敗情報が通報部70に送られる。
通報部70は、この話者認識が失敗した旨を示す失敗情報を、例えばディスプレイ等を介して、一のユーザ本人(この場合は話者A121)に対して通報する。この際、予め設定された電子メール、電話等の通信手段を介せば、失敗情報が話者A121に対して遅延なく通報される。或いは、その失敗情報等が、その失敗の次の機会に話者A121が話者認識を行う際に通報されば、話者A121が通信手段を何ら所持しない場合にも対応できる。加えて、この失敗情報を通報する際に併せてパスワードを変更すべき旨の通報も行えば、パスワードの漏洩にも対応できる。
以上、図1及び図2によると、例えば話者A121が認識を求める場合には話者認識が成功する一方で、詐称者122が認識を求める場合には、その失敗情報が好適に話者A121へと通報されるので、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。
(2)第2実施例
続いて、第2実施例に係る話者認識システムの構成及び基本的な動作を、図1に加えて図3を参照して説明する。ここに、図3は、第2実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図3において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。
図3に係る話者認識システム1は、図1に係る話者認識システム1に加えて、本発明に係る「変更処理手段」の一例としての変更処理部65と、本発明に係る「無効処理手段」の一例としての無効処理部66とを更に備える。
例えば、検知部60により話者認識が所定回数に亘って連続して失敗したことが検知された場合には、変更処理部65が、話者認識に用いられるパスワードを変更する処理を行う。或いは無効処理部66が、パスワードを所定期間無効にする。
以上、図3によると、一のユーザ本人に通報されて対策がとられるまでに、パスワードが変更され、或いは無効にされるので、本実施例でも話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。
(3)第3実施例
続いて、第3実施例に係る話者認識システムの構成及び基本的な動作を、図3に加えて図4を参照して説明する。ここに図4は、第3実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図4において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。
図4に係る話者認識システム1は、図3に係る話者認識システム1に加えて、本発明に係る「履歴格納手段」の一例としての履歴格納部80及び履歴データベース85を更に備える。
履歴格納部80は、話者認識が失敗した旨を示す失敗情報を含む履歴情報を、履歴データベース85に格納する。履歴データベース85に格納されるテーブル構造は、テーブル86のようになる。テーブル86には例えば、話者認識が行われた日時、利用された端末名、その際に連続して失敗した回数(連続失敗回数)、そして認識結果が格納される。そして、この履歴情報に基づき、連続失敗回数が所定回数(例えば5回)より少ないまま認識部14により一のユーザ本人と認識されれば、当該話者認識は成功であるとされ、他方で一度も一のユーザ本人と認識されぬまま連続失敗回数が所定回数以上になると、当該話者認識は失敗である上に詐称者132によるものとされ、通報の対象となる。尚、一のユーザ本人による失敗回数が不用意に蓄積されぬよう、連続失敗回数を数えるためのカウンタは、所定時間又は所定期間を経過した後或いは認識が成功した後に初期値0とされるとよい。或いは、所定時間又は所定期間内に失敗が連続して発生した場合のみを、通報の対象としてもよい。
以上、図4によると、履歴情報に基づき、一のユーザは再発防止に向けての各種対策を採り、管理者は一のユーザを含む全てのユーザに対して対策を促すことが可能となるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を一層効率良く抑制可能となる。
(4)第4実施例
続いて、第4実施例に係る話者認識システムの構成及び基本的な動作を、図1及び図4に加えて図5を参照して説明する。ここに図5は、第4実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。尚、図5において、上記図面に係る構成と同一の構成には同一の符号を付し、その説明は適宜省略する。
図5に係る話者認識システム1は、図4に係る話者認識システム1に加えて、複数の端末(例えば端末A91及び端末B92)と、本発明に係る「音声記録手段」の一例としての音声記録部145とを更に備える。
複数の端末は夫々マイクロホン132及び表示画面52を含み、そのうち例えば端末A91は北海道の支店に、端末B92は福岡県の支店に夫々設置される。そのネットワーク構成は、例えば各端末をクライアント内に、その他をサーバ内に配置する、いわゆるクライアント・サーバ型でよい。但し、ネットワーク構成はこれに限らず、例えば履歴データベース85のみをサーバ内に配置するような構成でもよい。
音声記録部145は、当該話者認識が行われる際にマイクロホン132に入力された音声を例えば履歴情報に添えて、履歴データベース85に記録する。そして、例えば詐称者122による不正な話者認識が試みられた際には、通報部70による通報に加えて、記録された音声が再生される。この再生される音声に基いて、一のユーザは、確実かつ迅速に不正使用を確認できるので、パスワードの変更等の処理を迅速に行うことも可能となる。
履歴データベース85に格納されるテーブル構造は、例えばテーブル87のようになる。テーブル87には例えば、話者認識が行われた日時、利用された端末名、その端末が地理的に何処に設置されているかを示す位置情報、音声データ、そして認識結果が格納される。勿論これらに加えて、その際に連続して失敗した回数(連続失敗回数)が格納されてもよい。そして、この履歴情報に基づき、詐称者122の割り出しをし、或いは詐称を未然に防ぐ防衛策を施すようにしてもよい。例えば、2006年2月1日に北海道の端末Aで話者認識が成功しているのにも関わらず、その1分後に福岡県の端末Bで話者認識が試みられた場合、1分間で北海道から福岡県へ移動することは物理的に或いは技術的に不可能であるとして、たとえ連続失敗回数が所定回数に至らずとも、この端末Bでの話者認識を中断して一のユーザ本人にかかる事実を通報する。この際、音声データも記録されているので、詐称者の特定が飛躍的に高まる。
以上、図5によると、失敗情報に加えて、音声データ、日時及び位置情報等も記録されているので、詐称者の特定速度及び精度を高め、詐称者の行動パターンも把握され、もって話者認識における成りすまし或いは詐称の再発を一層的確に抑制可能となる。この際、上記情報を物理的な困難性の観点等から分析することで、話者認識における成りすまし・詐称も予防され得る。
(5)第5実施例
続いて、第5実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図5に加えて図6を参照して説明する。ここに図6は、第5実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第4実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。
図6において、話者認識にあたりユーザにより音声が入力されると、認識部14は、入力された音声と、予め登録されている音声との類似度を算出し(ステップS1)、この類似度が所定閾値を超えるか否かによってこのユーザが一のユーザ本人か否かが判断される(ステップS2)。例えば、所定閾値を0.8とし、0から1の範囲内で求められる類似度が0.8以上であるか否かにより、一のユーザ本人か否かが判断される。
ここで、類似度が所定閾値を超えない場合(ステップS2:No)、続いて、検知部14により、連続認識失敗回数が既定値を超えるか否かが判断され、認識失敗フラグがセットされる(ステップS32)。例えば、既定値を5回とし、連続認識失敗回数が5回を超えるか否かが判断される。
ここで、未だ連続認識失敗回数が既定値の5回を超えない場合(ステップS32:No)、ユーザは再度音声を入力し直して話者認識を再試行する。一のユーザ本人でも雑音や体調により何度か失敗することはあり得るからである。
他方で、連続認識失敗回数が既定値の5回を超える場合(ステップS32:Yes)、もはや雑音如何が言い訳にならない失敗回数であり、詐称者である可能性が比較的高いとして、当該話者認識の処理が全体として失敗した旨が表示画面52に表示される。加えて、無効処理部66はパスワードを一時的に無効にし、履歴格納部80は当該話者認識に関する失敗情報を含む履歴情報を、音声記録部145は当該話者認識において入力された音声データを夫々履歴データベース85に格納する(ステップS42)。
他方で、類似度が所定閾値を超える場合(ステップS2:Yes)、即ち、一のユーザ本人であると認識される場合、基本的にこの時点で認識は成功である。そして詐称者の出現がある場合には対策を促すために、認識失敗フラグがセットされているか否かに基いて、前回の話者認識が失敗しているか否かが確認される(ステップS31)。
ここで、前回の話者認識が失敗している場合(ステップS31:Yes)、通報部70は、認識失敗履歴(即ち、詐称者による認識が行われたという事実)を今回の認識に成功したユーザに対して通報し、これを受けたユーザが身に覚えがなければパスワードを変更する等の対策を採ることでシステムの安全性を確保できる(ステップS41)。逆に、身に覚えがあれば変更をする必要はない。
他方で、前回の話者認識が失敗していない場合(ステップS31:No)、特に詐称者による認識が行われたという形跡もないので、そのまま認識成功処理として、このユーザが許可され、表示画面52にその旨が表示される(ステップS43)。
以上、本実施例では、図6に示した処理が行われるので、好適に話者認識が行われる。特に、認識が連続して失敗する際の対策が採られており、話者認識における成りすまし或いは詐称を好適に回避し或いは予防可能となる。
(6)第6実施例
続いて、第6実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図5及び図6に加えて図7を参照して説明する。ここに図7は、第6実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第4実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第5実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。
図7では図6と比べて特に、認識を失敗するたびに、一のユーザ本人以外の認識がさらに困難になるように、認識部14による類似度判定の閾値を上げる処理が追加されている(ステップS52)。
従って、本実施例では、詐称者が、連続して認識失敗する度に一のユーザ本人の音声に近づくように学習して認識に成功してしまうような事態を回避可能となり、実践上非常に有利である。
(7)第7実施例
続いて、第7実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図5及び図6に加えて図8を参照して説明する。ここに図8は、第7実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第4実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第5実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。
図8では図6と比べて特に、一のユーザ本人が普段使っている端末と今回使用している端末が異なるか否かを確認する処理が追加されている。具体的には、今回使っている端末が普段使っている端末か否かが判定される(ステップS220)。この際、普段使っている端末は、例えば、一のユーザ本人によって予め設定されるとよい。そして、普段使っている端末と判定された場合(ステップS220:Yes)、連続失敗回数の既定値にαが代入される(ステップS221)。他方で、普段使っている端末でないと判定された場合(ステップS220:No)、連続失敗回数の既定値にβが代入される(ステップS222)。ここに、α>βである。なぜなら、今回使用している端末が普段使っている端末ではないということは、一のユーザ本人以外の人物が認識処理を行おうとしている可能性が高いと推定されるため、連続失敗回数の既定値を小さくした方が好ましいからである。
以上、本実施例では、使用される端末から一のユーザ本人か否かの可能性を絞込まれ、一層適切に話者認識が行われる。
(8)第8実施例
続いて、第8実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図5及び図6に加えて図9を参照して説明する。ここに図9は、第8実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第4実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第5実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。
図9では図6と比べて特に、前回と今回使っている端末間の移動可能性に基いて、話者認識を補助する処理が追加されている。具体的には、先ず、予め設定された各端末の地理的な情報から前回の認識と今回の認識とで使用された端末間の距離である使用端末間距離Dが取得される(ステップS225)。加えて、前回の認識時と今回の認識時との時刻差である使用時刻差Tが取得される(ステップS226)。続いて、この使用端末間距離Dと、使用時刻差Tとから、前回の認識で使用された端末と今回の認識で使用された端末との間の移動速度Vが、V=D/Tとして算出される(ステップS227)。そして、この移動速度Vが所定速度閾値を超えるか否かが判断される(ステップ321)。ここに、「所定速度閾値」とは、移動するのが困難或いは不可能な速度として予め設定された値であり、例えば1000km/hである。ここで、移動速度Vが所定速度閾値を超える場合(ステップS321:Yes)、一のユーザ本人がこのよう速度で移動するとは考えられない、即ち、詐称者による不正使用である疑いが強いので、認識失敗処理等が行われる(ステップS42)。他方、移動速度Vが所定速度閾値を超えない場合(ステップS321:No)、移動速度Vからは不正使用の疑いを推定できないので、引き続き話者認識が行われる(ステップS1)。
以上、本実施例では、前回と今回使っている端末間の移動可能性に基いて、不正使用の疑いが推定されるので、一層適切に話者認識が行われる。
(9)第9実施例
続いて、第9実施例に係る話者認識システムにおける話者モデル登録装置の基本的な動作を、図5及び図6に加えて図10を参照して説明する。ここに図10は、第9実施例に係る、話者認識システムの動作処理を示すフローチャートである。尚、本実施例における構成は、第4実施例に係る構成と同一でよく、同一の構成には同一の符号を付し、その説明は適宜省略する。また、第5実施例と同一のステップには、同一の符号を付し、その説明は適宜省略する。
図10では図6と比べて特に、連続認識失敗回数が既定値を超える場合(ステップS32:Yes)に、失敗情報を通報するタイミングが異なる。具体的には、図6において失敗情報が通報されるタイミングは、この失敗情報に係る認識以降の認識において認識が成功する時(ステップS41)であり、失敗時との間に比較的長いタイムラグが生じる。それに対して、図7において失敗情報が通報されるタイミングは、この失敗情報に係る認識が行われる時点(ステップS422)であり、失敗時との間に生じるタイムラグは比較的短くて済む。故に、一のユーザ本人や当該話者認識システムの管理者が迅速に対策を講ずることが可能である。加えて、例えばパスワードが一時的に無効にされている状況下で、一のユーザ本人がかかる無効の事実を知らずに、認識に失敗してしまうことを回避可能となる。
以上、本実施例では、図10に示した処理が行われるので、好適に話者認識が行われる。特に、認識が連続して失敗する際の、適切なタイミングで一のユーザ本人が通報を受けるので、話者認識における成りすまし或いは詐称の再発の可能性或いは再発時の成功率を迅速に抑制可能となる。
尚、本発明は、上述した実施例に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨、或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う話者認識システム及びコンピュータプログラムもまた、本発明の技術的範囲に含まれるものである。
本発明の第1実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。 第1実施例に係る、話者認識システムに備わる認識部の基本構成及び基本動作を概念的に示すブロック図である。 第2実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。 第3実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。 第4実施例に係る、話者認識システムの基本構成及び基本動作を概念的に示すブロック図である。 第5実施例に係る、話者認識システムの動作処理を示すフローチャートである。 第6実施例に係る、話者認識システムの動作処理を示すフローチャートである。 第7実施例に係る、話者認識システムの動作処理を示すフローチャートである。 第8実施例に係る、話者認識システムの動作処理を示すフローチャートである。 第9実施例に係る、話者認識システムの動作処理を示すフローチャートである。
符号の説明
1 話者認識システム
132 マイクロホン
14 認識部
52 表示画面
60 検知部
70 通報部
65 変更処理部
66 無効処理部
80 履歴格納部
85 履歴データベース
145 音声記録部

Claims (18)

  1. 話者認識を行う認識手段と、
    前記認識手段において一のユーザに係る前記話者認識が所定回数に亘って連続して失敗したか否かを検知する検知手段と、
    該検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を、前記一のユーザに対して通報する通報手段と
    を備えることを特徴とする話者認識システム。
  2. 話者認識を行う認識手段と、
    前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、
    該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗した旨を示す失敗情報を含む履歴情報を格納する履歴格納手段と、
    前記一のユーザに対して前記履歴情報を通報する通報手段と
    を備えることを特徴とする話者認識システム。
  3. 前記認識手段は、音声入力手段を介して前記話者認識を行い、
    前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段を更に備え、
    前記履歴格納手段は、前記履歴情報として、前記記録された音声を更に格納する
    ことを特徴とする請求項2に記載の話者認識システム。
  4. 前記通報手段は、前記履歴情報を通報すると共に、前記一のユーザに対して前記記録された音声を再生する
    ことを特徴とする請求項3に記載の話者認識システム。
  5. 前記通報手段は、前記検知手段によって検知された失敗の回数が連続して所定回数を超える場合に、前記一のユーザに対して前記履歴情報を通報する
    ことを特徴とする請求項2から4のいずれか一項に記載の話者認識システム。
  6. 前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
    前記履歴格納手段は、前記話者認識が行われる前記端末の端末名を更に前記履歴情報に含めて格納し、
    前記格納された端末名が前記一のユーザによって普段使用される端末名と異なる場合には、同じ場合に比べて、前記所定回数が少ない
    ことを特徴とする請求項5に記載の話者認識システム。
  7. 前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
    前記履歴格納手段は、当該話者認識の直近で成功した前記話者認識が行われた日時及び前記端末の位置を更に前記履歴情報に含めて格納し、
    当該話者認識における日時と前記格納された日時との時間差に対する、当該話者認識における前記端末の位置と前記格納された前記端末の位置との距離差が、所定速度閾値を超える場合には、前記検知手段により前記話者認識が失敗したことが検知される
    ことを特徴とする請求項2から6のいずれか一項に記載の話者認識システム。
  8. 前記通報手段は、通信手段を介して前記一のユーザに対して遅延なく通報することを特徴とする請求項1から7のいずれか一項に記載の話者認識システム。
  9. 前記通報手段は、前記一のユーザが、前記話者認識手段において前記失敗した話者認識の次の機会として前記話者認識を行う際に、前記一のユーザに対して通報することを特徴とする請求項1から8のいずれか一項に記載の話者認識システム。
  10. 前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
    前記通報手段は、通報する際に、前記パスワードを変更すべき旨の通報を行う
    ことを特徴とする請求項1から9のいずれか一項に記載の話者認識システム。
  11. 前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
    前記検知手段により検知された場合に、前記パスワードを変更する処理を行う変更処理手段を更に備える
    ことを特徴とする請求項1から10のいずれか一項に記載の話者認識システム。
  12. 前記認識手段は、予め登録されているパスワードに対応する音声に基いて、前記話者認識を行い、
    前記検知手段により検知された場合に、前記パスワードを所定期間無効にする無効処理手段を更に備える
    ことを特徴とする請求項1から11のいずれか一項に記載の話者認識システム。
  13. 音声入力手段を介して話者認識を行う認識手段と、
    前記話者認識が行われる際に前記音声入力手段に入力された音声を記録する音声記録手段と、
    前記認識手段において一のユーザに係る前記話者認識が失敗したか否かを検知する検知手段と、
    該検知手段により前記話者認識が失敗したことが検知された場合に、前記話者認識が失敗したのに対応して記録された前記音声を含む履歴情報を格納する履歴格納手段と
    を備えることを特徴とする話者認識システム。
  14. 前記履歴格納手段は、前記話者認識が行われた日時、位置情報及び端末名のうち少なくとも一つを更に前記履歴情報に含めて格納する
    ことを特徴とする請求項2又は請求項13に記載の話者認識システム。
  15. 前記検知手段により検知された場合に、前記認識手段において、前記話者認識が、より失敗しやすくなるようにパラメータの変更が行われる
    ことを特徴とする請求項1から14のいずれか一項に記載の話者認識システム。
  16. 前記変更が行われるパラメータは、前記話者認識が失敗されたか否かを判定する際の基準となる、予め登録された前記一のユーザの音声と前記話者認識の際に入力される音声との類似度の閾値である
    ことを特徴とする請求項15に記載の話者認識システム。
  17. 前記認識手段は、前記認識手段に通信手段を介して接続された端末からのアクセスを介して前記話者認識を行い、
    前記通報手段は、前記検知手段により前記話者認識が前記所定回数に亘って連続して失敗したことが検知された場合に加えて又は代えて、前記話者認識の失敗に係る前記端末の時間的な位置及び空間的な位置のうち少なくとも一方についての所定条件を満たさない場合に、前記一のユーザに対して通報する
    ことを特徴とする請求項1に記載の話者認識システム。
  18. コンピュータを、請求項1から17のいずれか一項に記載の話者認識システムとして機能させることを特徴とするコンピュータプログラム。
JP2006086165A 2006-03-27 2006-03-27 話者認識システム及びコンピュータプログラム Pending JP2009145924A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006086165A JP2009145924A (ja) 2006-03-27 2006-03-27 話者認識システム及びコンピュータプログラム
PCT/JP2007/055434 WO2007111170A1 (ja) 2006-03-27 2007-03-16 話者認識システム及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006086165A JP2009145924A (ja) 2006-03-27 2006-03-27 話者認識システム及びコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2009145924A true JP2009145924A (ja) 2009-07-02

Family

ID=38541090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006086165A Pending JP2009145924A (ja) 2006-03-27 2006-03-27 話者認識システム及びコンピュータプログラム

Country Status (2)

Country Link
JP (1) JP2009145924A (ja)
WO (1) WO2007111170A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム
JP2015014475A (ja) * 2013-07-03 2015-01-22 三菱重工業株式会社 車載器、及びスプーフィング検知方法
JP2019201299A (ja) * 2018-05-16 2019-11-21 コニカミノルタ株式会社 画像処理装置、画像形成装置、機密情報管理方法及びプログラム
JP2020067566A (ja) * 2018-10-24 2020-04-30 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法、情報処理装置、及び、プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008050765A1 (fr) * 2006-10-24 2008-05-02 Ihc Corp. Système d'authentification individuelle

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3592415B2 (ja) * 1995-10-30 2004-11-24 株式会社リコー 話者認識システム
JP2002064861A (ja) * 2000-08-14 2002-02-28 Pioneer Electronic Corp 本人認証システム
JP2002278938A (ja) * 2001-03-21 2002-09-27 Fuji Xerox Co Ltd 個人識別方法、個人識別装置、個人識別プログラム、及び個人認証システム
JP4252289B2 (ja) * 2002-11-11 2009-04-08 株式会社リコー 生体情報を用いる文書管理システム、生体情報を用いる情報管理システム、生体情報を用いる文書管理方法およびこの方法をコンピュータに実行させるプログラム
JP2005018186A (ja) * 2003-06-24 2005-01-20 Hitachi Ltd アクセス管理方法及び装置並びにその処理プログラム
JP2005122251A (ja) * 2003-10-14 2005-05-12 Nec Fielding Ltd セキュリティシステム、サーバコンピュータ、セキュリティ方法、セキュリティ用プログラム
JP2005165704A (ja) * 2003-12-03 2005-06-23 Yokogawa Electric Corp セキュリティチェックシステム
JP2005293490A (ja) * 2004-04-05 2005-10-20 Hitachi Ltd 生体認証システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム
JP2015014475A (ja) * 2013-07-03 2015-01-22 三菱重工業株式会社 車載器、及びスプーフィング検知方法
JP2019201299A (ja) * 2018-05-16 2019-11-21 コニカミノルタ株式会社 画像処理装置、画像形成装置、機密情報管理方法及びプログラム
JP7119558B2 (ja) 2018-05-16 2022-08-17 コニカミノルタ株式会社 画像処理装置、画像形成装置、機密情報管理方法及びプログラム
JP2020067566A (ja) * 2018-10-24 2020-04-30 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法、情報処理装置、及び、プログラム
JP7376985B2 (ja) 2018-10-24 2023-11-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理方法、情報処理装置、及び、プログラム

Also Published As

Publication number Publication date
WO2007111170A1 (ja) 2007-10-04

Similar Documents

Publication Publication Date Title
EP3157009B1 (en) Hotword recognition
US9747926B2 (en) Hotword recognition
CN107016999B (zh) 热词识别
KR102349985B1 (ko) 음성 쿼리들 검출 및 억제
US10303864B2 (en) Continuous user authentication tool for mobile device communications
KR101824158B1 (ko) 화자 검증을 위한 동적 임계치
JP4573792B2 (ja) ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム
US10182148B2 (en) Method and system for filtering undesirable incoming telephone calls
US9728191B2 (en) Speaker verification methods and apparatus
US20070038460A1 (en) Method and system to improve speaker verification accuracy by detecting repeat imposters
EP2622832B1 (en) Speech comparison
EP3147768A1 (en) Screen interface unlocking method and screen interface unlocking device
US20140075570A1 (en) Method, electronic device, and machine readable storage medium for protecting information security
JP2009145924A (ja) 話者認識システム及びコンピュータプログラム
CN110767214A (zh) 语音识别方法及其装置和语音识别系统
JP6407634B2 (ja) 通話装置、声紋データの判定結果通知方法およびプログラム
KR102199831B1 (ko) 보이스피싱 방지 시스템, 보이스피싱 방지 방법 및 기록 매체
JP2007266944A (ja) 電話端末装置および発信者検証方法
KR20200081950A (ko) 보이스피싱 탐지 방법, 보이스피싱 탐지 장치 및 기록 매체
GB2584827A (en) Multilayer set of neural networks
WO2018187555A1 (en) System and method for providing suicide prevention and support
WO2022107242A1 (ja) 処理装置、処理方法およびプログラム
US12010260B2 (en) Detecting synthetic sounds in call audio
JP6772832B2 (ja) 犯罪判定装置、中継システム、電話システム、犯罪判定方法及びプログラム
WO2022107241A1 (ja) 処理装置、処理方法およびプログラム