JP2008532116A - ウェブ・ベースの多モード・インターフェースを用いるユーザ検証 - Google Patents

ウェブ・ベースの多モード・インターフェースを用いるユーザ検証 Download PDF

Info

Publication number
JP2008532116A
JP2008532116A JP2007555566A JP2007555566A JP2008532116A JP 2008532116 A JP2008532116 A JP 2008532116A JP 2007555566 A JP2007555566 A JP 2007555566A JP 2007555566 A JP2007555566 A JP 2007555566A JP 2008532116 A JP2008532116 A JP 2008532116A
Authority
JP
Japan
Prior art keywords
user
mode
voice
markup language
script
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007555566A
Other languages
English (en)
Other versions
JP4871885B2 (ja
JP2008532116A5 (ja
Inventor
ハラミジョ、デビッド
マッコブ、ジェラルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008532116A publication Critical patent/JP2008532116A/ja
Publication of JP2008532116A5 publication Critical patent/JP2008532116A5/ja
Application granted granted Critical
Publication of JP4871885B2 publication Critical patent/JP4871885B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/38Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections
    • H04M3/382Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords
    • H04M3/385Graded-service arrangements, i.e. some subscribers prevented from establishing certain connections using authorisation codes or passwords using speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証する方法は、多モード・マークアップ言語文書をリモート・コンピューティング装置に送信するステップであって、多モード・マークアップ言語文書はリモート・コンピューティング装置によってレンダリングされると、ユーザにユーザ識別子を問い合わせ、ユーザの声の音声をウェブ・ベースの多モード・アプリケーションに送信させるステップを含むことができる。クライアント装置からユーザ識別子及び音声をほぼ同時に受信することができる。音声を、ユーザ識別子と関連する声紋と比較することができる。比較するステップから獲得された結果に従って、システムにアクセスするリモート・コンピューティング装置のユーザを選択的に許可することができる。

Description

本発明は、ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証することに関する。
多モード・インターフェースによって、ユーザは、視覚及び音声手段を介してアプリケーションまたは他のシステムと通信することができる。例えば、ユーザは、グラフィカル・ユーザ・インターフェース(GUI)を介して1つ以上の話し言葉を発することによって、または、GUI入力及び音声入力の組み合わせを行うことによって通信することができる。システムと通信するため、多モード対話は、より直観的な手段をユーザに提供することができる。
スマート・フォン、携帯情報端末及び、小型フォーム・ファクタを有する他の装置のような携帯用コンピューティング装置に関して、多モード・インターフェースは、状況に基づいて対話の手段をユーザに選択させる。幾つかの場合ではGUIを用いるのが有益であるが、他の場合では、音声データ入力の方が有利または便利である。通常の状況では、例えば、ユーザは音声対話を選択することがある。その理由は、音声対話が直観的かつ高速であるためである。どちらも使用するのに厄介かつ面倒であるミニ・キーパッドまたは小型GUIを用いる必要性から音声データ入力は更にユーザを解放する。
しかし、雑音の多い環境では、音声データ入力ができないことがある。ユーザの発話の正確な認識が不可能となるほどまでに周囲の雑音レベルがユーザの音声入力を覆い隠すことがある。ユーザの同一性を検証する場合のような他の状況では、ユーザはキーパッド入力または言葉以外の対話をも選択することがある。一般的に、ユーザ検証は、ユーザ名及びパスワードを用いて実行される。このような情報を多モード・インターフェースに話しかけることによって、他人に機密情報を立ち聞きされることがあるので、ユーザは、GUIまたはキーパッドを用いてこのような情報を入力することが多い。しかし、前述したように、このようにしてこのような情報を携帯用コンピューティング装置に入力することは、厄介かつ面倒であることがある。
パスワードを用いるのに他の欠点もある。一般的に、パスワードは、記憶にとどめるのが困難であって、あまり安全ではない。ユーザによって保持され、ユーザ名及びパスワードを各々必要とする多量のアカウントの観点から、パスワードを記憶にとどめることは特に困難であることがある。各パスワードを記憶にとどめる必要性を回避するため、ユーザは、複数のアカウントに対して共通のパスワードを用いるか、アクセス・カードすなわちATMカードの裏にパスワードを書き留めるか、または、アカウントに対してユーザのユーザ名と同じであるパスワードを用いる傾向にある。これらの行為はどれも、ユーザ・アカウントのセキュリティを危険にさらすことがある。
更に、銀行取引、航空機の予約、製品購買などのような機能がウェブ・ベースの多モード・インターフェースへ移り始めるにつれて、ユーザ検証はますます重要になってくる。このようなシステムは、取引が安全である場合であって、ユーザが、ユーザであると主張する人であることをシステムが保証する場合のみに成功することができる。従って、上述した欠陥を克服する多モード・インターフェースを介してユーザを検証する技術を提供することは有益である。
本発明は、通信ネットワークを介してユーザの同一性を検証するための解決策を提供する。本発明の一実施形態は、ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証する方法を含むことができる。この方法は、多モード・マークアップ言語文書をリモート・コンピューティング装置に送信するステップであって、多モード・マークアップ言語文書はリモート・コンピューティング装置によってレンダリングされると、ユーザにユーザ識別子を問い合わせ、ユーザの声の音声をウェブ・ベースの多モード・アプリケーションに送信させるステップを含むことができる。クライアント装置からユーザ識別子及び記録をほぼ同時に受信することができる。音声を、ユーザ識別子と関連する声紋と比較することができる。従って、比較するステップから獲得された結果に従って、オンライン・システムにアクセスするリモート・コンピューティング装置のユーザを選択的に許可することができる。
本発明の別の実施形態は、ユーザの同一性を検証するシステムを含むことができる。このシステムは、ユーザ識別子と各々関連する複数の声紋を含む声紋データベースを有する検証システムを含むことができる。このシステムは、多モード・マークアップ言語文書をクライアント装置に送信するように構成された多モード・アプリケーションをも含むことができる。多モード・マークアップ言語文書はランダム・スクリプトを指定することができ、多モード・マークアップ言語文書が実行されると、これによって、ユーザ識別子と、話者が声に出して読んでいるランダム・スクリプトのデジタル表現を備える音声とが多モード・アプリケーションに返信される。多モード・アプリケーションは、記録と、複数の声紋から選択され、ユーザ識別子と関連する声紋とを比較することによって話者の同一性を検証する検証システムにスクリプト、記録及びユーザ識別子を送信することができる。
本発明の他の実施形態は、本明細書で説明された様々なステップをマシンに実行させるようにプログラムされているマシン可読ストレージを含むことができる。
次に、ほんの一例として添付図面を参照して本発明の実施形態を説明する。
ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証する例示的な技術及びシステムを以下に説明する。音声識別技術を用いてユーザの同一性を検証することができる。ウェブ・ベースの多モード・アプリケーションから受信された多モード文書をユーザに表示することができる。多モード文書すなわち、ウェブ・ページ・タイプのインターフェースは、ユーザがユーザ識別子またはユーザ名(以降、ユーザID)及び音声サンプルを提供することをリクエストすることができる。ユーザID及び音声サンプルをウェブ・ベースの多モード・アプリケーションに返信することができる。音声サンプルに関してユーザIDを参照して音声検証を実行することができる。音声検証の結果に基づいて、オンライン・システムにアクセスすることをユーザに許可することができ、または、エントリを拒否することができる。
図1は、本明細書で開示された本発明の構成によるウェブ・ベースの多モード・インターフェースを用いてユーザ検証を実行するシステム100を示す概略図である。図示のように、システム100は、クライアント装置105と、多モード・アプリケーション120を含むサーバ110と、声紋データベース130を有する検証システム125とを含むことができる。
一実施形態では、クライアント装置105を、デスクトップ・コンピュータ、サーバなどのような様々なコンピューティング装置のいずれかとすることができる。別の実施形態では、コンピューティング装置105を、ラップトップ・コンピュータ、有線または無線のどちらにしてもインターネット通信用に構成された携帯情報端末(PDA)、携帯電話などのような携帯用またはモバイルあるいは携帯用モバイル・コンピューティング装置とすることができる。いずれの場合でも、クライアント装置105は、リクエストをサーバ110に送信し、サーバ110から情報を受信する適切なソフトウェアを含むことができる。例えば、クライアント装置105は、多モード・マークアップ言語(MML)文書を含むマークアップ言語文書をレンダリングすることができる適切なブラウザを含むことができる。
MML文書は、ユーザ対話の視覚及び音声構成要素を指定することができる。従って、MML文書は任意のマークアップ言語ベース文書またはファイルを含むことができ、このマークアップ言語ベース文書またはファイルがレンダリングされると、これによって、ユーザは、グラフィカル・ユーザ・インターフェース(GUI)のような視覚手段と、発話することによる音声手段とを介して入力を行うことができ、または、デュアル・トーン・マルチ周波数入力を行うことができる。このようなマークアップ言語の一例として、X+Vマークアップ言語が挙げられる。X+Vは、拡張可能ハイパーテキスト・マークアップ言語(XHTML)及び音声拡張可能マークアップ言語(VoiceXML)のサブセットを組み合わせる多モード・ウェブ・ページを作成する提案マークアップ言語である。
一般的に、XHTMLは、拡張可能マークアップ言語(XML)の規則に準拠するように調整されたHTML4.0のバージョンである。VoiceXMLは、ワールド・ワイド・ウェブ・コンソーシアム(W3C)を通じて開発されたXMLベース言語である。VoiceXMLは、音声ベース・アプリケーションを構築する標準化フォーマットを提供する。XHTML及びVoiceXML(X+V)によって、ウェブ開発者は、音声入力及び出力を従来のグラフ・ベース・ウェブ・ページに追加することができる。
MMLの別の例は、音声アプリケーション言語タグ(SALT)をXHTML、ハイパーテキスト・マークアップ言語(HTML)のようなホスト・マークアップ言語またはスケーラブル・ベクトル・グラフィックス(SVG)に追加することに基づく。SALTは、視覚モード及び音声モードの両方のユーザ対話をサポートする多モード・ウェブ・ページを作成するのに用いることができる提案マークアップ言語である。SALTは、SALTフォーラムを通じて開発されたXMLベース言語である。
サーバ110を、通信ネットワークを介してリクエストを処理し情報を提供することができる様々な情報処理システムのいずれか、例えばウェブ・サーバとすることができる。図示のように、サーバ110及びクライアント装置105は、インターネット、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)、モバイルまたはセルラ・ネットワーク、別の様々な通信ネットワーク、または、それらの任意の組み合わせのような通信ネットワーク115を介して通信することができる。
多モード・アプリケーション120はサーバ110内で実行することができる。従って、多モード・アプリケーション120はクライアント装置105からリクエスト及び情報を受信し、多モードの有無を問わず返信としてマークアップ言語文書のような情報を提供することができる。図には示されていないが、多モード・アプリケーション120は、テキスト‐音声(TTS)、音声認識またはデュアル・トーン・マルチ周波数処理のいずれか1つまたは任意の組み合わせのような音声処理サービスを含むことができ、または、このような音声処理サービスにアクセスすることができる。これらのサービスをサーバ110内に位置付けることができ、または、多モード・アプリケーション120内に通信可能にリンクされた異なるコンピューティング・システム内に位置付けることができる。
検証システム125は、声紋データベース130に格納された声紋と、ユーザの声の記録とを比較することによってユーザの同一性を検証することができる。声紋データベース130は、検証システム125に登録されたユーザからの複数の異なる声紋を含むことができる。各声紋は、ユーザIDに対応または関連することができる。声の記録が受信されると、検証システム125は、声の記録を声紋データベース130内の声紋と比較して、一致が存在するかどうかを決定することができる。
動作中、クライアント装置105は、MML文書をリクエストしている多モード・アプリケーション120にリクエスト135を送信することができる。多モード・アプリケーション120は、MML文書140すなわち多モード・ウェブ・ページを送信することによって応答することができる。MML文書140をレンダリングすると、クライアント装置105は、MML文書の指示の下、ユーザからのユーザID及び音声サンプルをリクエストすることができる。一実施形態では、文書は、音声サンプルを提供するときにユーザによって読まれるスクリプトを提供することができる。特に、任意のプロンプトを、記録された音声またはTTSのどちらにしても音声プロンプトとすることができ、または、クライアント装置105の表示画面に表示されるテキスト・プロンプトとすることができる。
例えば、ユーザがスクリプトを声に出して読むと、クライアント装置105はユーザの声のデジタル記録を行うことができる。ユーザID及びユーザの声の記録がクライアント装置105によって獲得された後、クライアント装置105は、MML文書140の指示の下、ユーザID及びユーザの声の記録の両方を多モード・アプリケーション120に送信することができる。記録145及びユーザID150をほぼ同時に送信することができる。多モード・アプリケーション120は、ユーザID150及び記録145を受信すると、その両方を処理のため検証システム125に提供することができる。検証システム125は、提供されたユーザID150を用いて声紋を声紋データベース130内に位置付けることができる。次に、検証システム125は声紋を記録145と比較して、記録145が声紋と一致するかどうかを決定することができる。記録145が声紋と一致する場合、ユーザが、銀行取引、予約などのためにウェブ・サイトのようなオンライン・システムにアクセスすることを許可することができる。記録145が声紋と一致しない場合、アクセスを拒否することができる。
別の実施形態では、音声をクライアント装置105に記録するのではなく、むしろ、データ接続を介してクライアント装置105から多モード・アプリケーション120にストリーミングする必要がある。ボイス・オーバーIP(VoIP)として既知であるデータ・チャネルを介する音声をサポートする携帯電話のようなモバイル装置は、音声のストリーミングをサポートすることができる。音声がクライアント装置105からストリーミングされた場合、音声を多モード・アプリケーション120によって記録することができる。
図2は、本明細書で開示された本発明の構成によるユーザ検証の目的でユーザを登録する方法200を示すフローチャートである。図1を参照して説明されたシステム、または別の適切なシステムによって方法200を実行することができる。方法200をステップ205で開始することができ、オンライン・システムにとって新しいユーザはウェブ・ベースの多モード・アプリケーションにアクセスすることができる。ユーザはクライアント装置を介してウェブ・ベースの多モード・アプリケーションにアクセスすることができる。
ステップ210では、ウェブ・ベースの多モード・アプリケーションは安全なMML文書をクライアント装置のユーザに提供することができる。前述したように、MML文書は、ウェブ・ベースの多モード・インターフェースまたはウェブ・ページを指定することができる。例えば、MML文書は、ユーザIDと、電話番号、住所、電子メール・アドレスなどのような必要とされることがある他の個人情報とを受信するフィールドを指定することができる。更に、MML文書は登録スクリプトを指定することができる。登録スクリプトは、テキスト、番号、記号、文字などを含むことができる。
ステップ215では、クライアント装置はMML文書をレンダリングすると、登録スクリプトを声に出して読むようにユーザにプロンプトを出すことができる。プロンプトを、テキスト・ベース、すなわち、ウェブ・ページに書かれた命令とすることができ、あるいは、TTSまたは、事前に記録された音声のどちらにしても音声プロンプトとすることができる。登録スクリプトをテキストとしてクライアント装置の表示画面に表示することができる。ステップ220では、ユーザは登録スクリプトを声に出して読む、すなわち、登録スクリプトを発話することができる。ステップ225では、クライアント装置は、ユーザが声に出して読んでいる登録スクリプトを記録し、ユーザによって提供されたユーザID及び他の任意の個人情報を獲得する。本発明の一実施形態によれば、MML文書内の記録命令は、ユーザの発話のデジタル記録を行うようにクライアント装置に指示することができる。例えば、X+Vで書かれたMML文書内では、レコード・タグを用いることができる。
ステップ230では、ユーザが登録スクリプトを声に出して読むことを終了すると、クライアント装置は、記録された音声を、サーバ上で実行している多モード・アプリケーションに転送することができる。記録された音声に加えて、MML文書のフィールドに入力された任意の情報、特にユーザIDをウェブ・ベースの多モード・アプリケーションに送信することができる。当然のことながら、MML文書のフィールドから獲得されたデータと、記録された音声とを同時に、または、ほぼ同時に送信することができる。MML文書が実行されたとき、このような情報がMML文書によって指定されたので、クライアント装置はこのような情報を転送する。
前述したように、別の実施形態では、登録または検証あるいはその両方の音声をクライアント装置からウェブ・ベースの多モード・アプリケーションにストリーミングすることができる。このような実施形態では、ウェブ・ベースの多モード・アプリケーションによって音声を記録することができる。この場合、MML文書内のストリーミング命令は、ユーザの発話の音声をウェブ・ベースの多モード・アプリケーションにストリーミングするようにクライアント装置に指示することができる。
ステップ235では、ウェブ・ベースの多モード・アプリケーションは、音声と、クライアント装置でMML文書に入力されたユーザIDのような他の任意の情報とを受信することができる。ステップ240では、ウェブ・ベースの多モード・アプリケーションは、ユーザID、音声及び登録スクリプトを検証システムに送信する。ステップ245では、検証システムは、ユーザに固有の声紋を音声及び登録スクリプトのテキストから生成することができる。結果として生成された声紋をユーザIDと関連付け、声紋データベース内に格納することができる。ユーザの登録が成功した後、ステップ250では、ウェブ・ベースの多モード・アプリケーションは安全なウェルカム・ページをユーザに送信し、これによって、ユーザは、サーバまたは別のサーバ内にある他の安全なページにアクセスすることができる。
図3は、本明細書で開示された本発明の構成によるユーザ検証を実行する方法300を示すフローチャートである。図1を参照して説明されたシステム、または別の同等のシステムを用いて方法300を実行することができる。ステップ305では、登録されたユーザは、クライアント装置を介してウェブ・ベースの多モード・アプリケーションにアクセスしてウェブ・ページをリクエストするか、または、別の方法でシステムにログインすることができる。ステップ310では、多モード・アプリケーションは、MML文書、この場合、安全なウェブ・ベースのログイン・ページを送信することができる。ステップ315では、MML文書をクライアント装置によってレンダリングすることができる。
安全なログイン・ページは、ユーザIDのようなユーザ入力を受信する1つ以上のフィールドを指定することができる。更に、安全なログイン・ページはスクリプトを指定することができる。スクリプトを、文字、番号または単語のいずれか1つまたは任意の組み合わせのランダム系列とすることができる。ウェブ・ベースの多モード・アプリケーションによって、例えば、単語、文字または番号のいずれか1つまたは任意の組み合わせをこのようなテキストの集合から選択することによってスクリプトをランダムに生成することができる。一実施形態では、スクリプトは、登録スクリプトからランダムに生成された任意の単語、文字または番号を含むことができる。
ランダムに生成されたスクリプトは、偽者が検証システムを騙そうとしないようにする。偽者が、登録されたユーザの発話の事前に記録された部分を再生しようとする場合、事前に記録された発話は、声紋の比較に用いられるための期待されたユーザの発話に一致しない。事前に記録されたユーザの発話は、ランダムに生成されたスクリプトに指定された単語と異なる単語を含む。従って、ユーザ検証は失敗する。このように、本発明の一実施形態によれば、偽者がシステムを騙すのに、事前に記録されたユーザの発話を用いることを阻止するため、音声検証に加えて音声認識を用いることができる。
ステップ320では、ユーザは、クライアント装置の表示部分にレンダリングされたMML文書の適切なフィールドにユーザIDを入力することができる。ユーザは、発話、キーパッド入力、スタイラス入力などを用いてユーザIDを入力することができる。ユーザがユーザIDを入力する特定の方法は、本発明を限定するものではない。いずれの場合でも、クライアント装置内に一時的にユーザIDを格納することができる。
ステップ325では、クライアント装置の表示部分に表示されたスクリプトを声に出して読むようにユーザに指示することができる。TTSプロンプトまたは音声プロンプトを介して、あるいは、レンダリングされたMML文書に表示されたテキスト命令によってユーザにプロンプトを出すことができる。ステップ330では、クライアント装置は、ユーザが声に出して読んでいるスクリプトのデジタル記録を行うことができる。一実施形態では、デジタル記録をPCMデータとして格納することができる。しかし、当然のことながら、音声がデータ接続を介してウェブ・ベースの多モード・アプリケーションにストリーミングされる場合に用いることができるADPCM、MP3、AACまたは圧縮DSRのような様々な異なるデジタル音声フォーマットのいずれをも用いることができるので、特定フォーマットのデジタル音声ファイルは本発明を限定するものではない。
ステップ335では、ユーザが発話を終了すると、クライアント装置はスクリプト及びユーザIDをウェブ・ベースの多モード・アプリケーションに送信することができる。完全な記録または、ストリーミングされた音声のどちらにしてもユーザID及び音声すなわち検証音声をクライアントからほぼ同時に送信し、ウェブ・ベースの多モード・アプリケーションによってほぼ同時に受信することができる。ステップ340では、ウェブ・ベースの多モード・アプリケーションは、音声及びユーザIDを受信することができる。ステップ345では、ウェブ・ベースの多モード・アプリケーションは音声、スクリプト及びユーザIDを検証システムに転送することができる。
ステップ350では、検証システムは、参照としてユーザIDを用いてユーザの声紋を位置付けるか、または、声紋データベースから取り出す。ステップ355では、検証システムは、音声と、ユーザIDに一致する声紋とを比較して、音声が声紋と一致するかどうかを決定することができる。音声が声紋と一致する場合、方法はステップ360に進むことができ、従来の視覚的ウェブ・ページまたは多モード・ウェブ・ページとすることができる安全なウェルカム・ページをウェブ・ベースの多モード・アプリケーションからユーザ装置のユーザに提供することができる。サイト及び他の安全なウェブ・ページにアクセスすることを、検証されたユーザに許可することができる。記録された音声が声紋に一致しない場合、ステップ365では、ユーザはウェブ・ベースの多モード・アプリケーションによってアクセスを拒否される。
本発明は、ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証するための解決策を提供する。本発明によれば、話者検証システムは、話者の声の物理特性に基づいて話者の同一性を検証する。多モード・インターフェースを介してユーザは登録するだけでなく、その後、検証システムによってユーザを検証することができる。ユーザがテキストの長い一節を記憶にとどめる必要がないように登録スクリプトがユーザに視覚的テキストとして表示されるという点で登録は容易になる。
話者検証部分は、多モード・アプリケーションによって提供されたランダム・スクリプトをユーザに話すよう要求する。ランダム・スクリプトは、偽者が検証システムを騙そうとして、別のユーザの発話の事前に記録された部分を再生しようとすることを阻止する。ランダムに生成されたスクリプトによって指定されるので、事前に記録された発話は、期待されたユーザの発話に一致しなくなる。ユーザの同一性を検証するのに用いられるスクリプトを、登録スクリプトに類似して視覚的にも表示することができる。視覚的パスワード及び音声検証を同時に要求することができるので、ただ1つの形態を用いる場合よりも、多モード・インターフェースを用いる検証を安全にすることができる。
ハードウェア、ソフトウェア、または、ハードウェア及びソフトウェアの組み合わせで本発明を実現することができる。集中的に1つのコンピュータ・システム内に、または、異なる要素が幾つかの相互接続されたコンピュータ・システムにわたって散在するように分散的に本発明を実現することができる。本明細書で説明された方法を行うように適合されたいかなる種類のコンピュータ・システムまたは他の装置も適する。ハードウェア及びソフトウェアの一般的な組み合わせを、コンピュータ・プログラムを有する汎用コンピュータ・システムとすることができ、コンピュータ・プログラムがロードされ実行されると、本明細書で説明された方法をコンピュータ・システムが行うようにコンピュータ・システムを制御する。
また、本明細書で説明された方法の実施を可能にするすべての特徴を備えるコンピュータ・プログラム製品に本発明を統合することができ、コンピュータ・プログラム製品がコンピュータ・システムにロードされると、これらの方法を行うことができる。本明細書では、コンピュータ・プログラム、ソフトウェア・アプリケーションまたはこれらの用語の他の変形のいずれか1つまたは任意の組み合わせは、情報処理能力を有するシステムに特定の機能を直接に実行させるか、あるいは、a)別の言語、コードまたは表記への変換と、b)異なる形態での再生との両方またはいずれか一方の後で実行させることを目的とする一連の命令のあらゆる言語、コードまたは表記のいかなる表現をも意味する。
本発明の意図または本質的な特性から逸脱することなく本発明を他の形式で統合することができる。従って、本発明の範囲を示すため、本明細書というよりも特許請求の範囲を参照すべきである。
本明細書で開示された本発明の構成によるウェブ・ベースの多モード・インターフェースを用いてユーザ検証を実行するシステムを示す概略図である。 本明細書で開示された本発明の構成によるユーザ検証の目的でユーザを登録する方法を示すフローチャートである。 本明細書で開示された本発明の構成によるユーザ検証を実行する方法を示すフローチャートである。

Claims (13)

  1. ウェブ・ベースの多モード・インターフェースを用いてユーザの同一性を検証する方法であって、
    多モード・マークアップ言語文書をリモート・コンピューティング装置に送信するステップであって、前記多モード・マークアップ言語文書は前記リモート・コンピューティング装置によってレンダリングされると、ユーザにユーザ識別子及び前記ユーザの声の音声を問い合わせるステップと、
    前記ユーザ識別子及び前記音声をウェブ・ベースの多モード・アプリケーションで受信するステップと、
    前記音声を、前記ユーザ識別子と関連する声紋と比較するステップと、
    前記比較するステップから獲得された結果に従って、オンライン・システムにアクセスする前記リモート・コンピューティング装置の前記ユーザを選択的に許可するステップと、
    を含む方法。
  2. 前記多モード・マークアップ言語文書は、前記音声をストリーミングする命令を含み、前記多モード・マークアップ言語文書をレンダリングし、前記音声をストリーミングする前記命令を解釈することに応答して、前記リモート・コンピューティング装置は前記音声を前記ウェブ・ベースの多モード・アプリケーションにストリーミングするステップを更に含む、請求項1に記載の方法。
  3. 前記多モード・マークアップ言語文書は、前記音声を記録する命令を含み、前記多モード・マークアップ言語文書をレンダリングし、前記記録する命令を解釈することに応答して、前記リモート・コンピューティング装置は前記ユーザの声のデジタル記録を行うステップを更に含む、請求項1に記載の方法。
  4. 前記多モード・マークアップ言語文書は、前記ユーザによって声に出して読まれるスクリプトを指定する、請求項1に記載の方法。
  5. 前記スクリプトは、ランダムに生成されたテキストを少なくとも部分的に備える、請求項4に記載の方法。
  6. 前記音声は、前記ユーザが声に出して読んでいる前記スクリプトのデジタル表現である、請求項4に記載の方法。
  7. 前記比較するステップは、前記ウェブ・ベースの多モード・アプリケーションが最初に前記音声、前記スクリプト及び前記ユーザ識別子を検証システムに送信することを更に含む、請求項6に記載の方法。
  8. 最初に、登録スクリプトを指定する多モード・マークアップ言語文書を前記リモート・コンピューティング装置に送信するステップと、
    前記ユーザ識別子と、前記ユーザが発話する前記登録スクリプトのデジタル表現を備える音声とを受信するステップと、
    前記ユーザが前記登録スクリプトを発話する前記音声からの声紋を決定し、前記声紋を前記ユーザ識別子と関連付けることによって前記ユーザをオンライン・システムに登録するステップと
    を更に含む、請求項1に記載の方法。
  9. ユーザの同一性を検証するシステムであって、前記システムは、
    ユーザ識別子と各々関連する複数の声紋を含む声紋データベースを有する検証システムと、
    スクリプトを含む多モード・マークアップ言語文書をクライアント装置に送信するように構成された多モード・アプリケーションであって、前記多モード・マークアップ言語文書が前記クライアント装置によってレンダリングされると、これによって、ユーザ識別子と、話者が声に出して読んでいる前記スクリプトのデジタル表現を備える音声とが返信される多モード・アプリケーションとを備え、
    前記多モード・アプリケーションは、前記音声を、前記ユーザ識別子と関連する声紋と比較することによって前記話者の同一性を検証する前記検証システムに前記スクリプト、前記音声及び前記ユーザ識別子を送信するように動作するシステム。
  10. 前記音声及び前記ユーザ識別子はほぼ同時に前記クライアント装置から前記多モード・アプリケーションに送信される、請求項9に記載のシステム。
  11. 前記多モード・マークアップ言語文書は、前記音声をストリーミングする命令を含み、これによって、前記多モード・マークアップ言語文書をレンダリングし、前記音声をストリーミングする前記命令を解釈することに応答して、前記リモート・コンピューティング装置は前記音声を前記多モード・アプリケーションにストリーミングする、請求項9に記載のシステム。
  12. 前記多モード・マークアップ言語文書は、前記音声を記録する命令を含み、これによって、前記多モード・マークアップ言語文書をレンダリングし、前記記録する命令を解釈することに応答して、前記クライアント装置は、前記話者が声に出して読んでいる前記スクリプトを記録する、請求項9に記載のシステム。
  13. 請求項1〜8のいずれか一項に記載の方法の前記ステップのすべてを行うコンピュータ実行可能命令を備えるコンピュータ・プログラム。
JP2007555566A 2005-02-22 2006-01-19 ウェブ・ベースの多モード・インターフェースを用いるユーザ検証 Expired - Fee Related JP4871885B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/062,731 2005-02-22
US11/062,731 US8725514B2 (en) 2005-02-22 2005-02-22 Verifying a user using speaker verification and a multimodal web-based interface
PCT/EP2006/050308 WO2006089822A1 (en) 2005-02-22 2006-01-19 User verification with a multimodal web-based interface

Publications (3)

Publication Number Publication Date
JP2008532116A true JP2008532116A (ja) 2008-08-14
JP2008532116A5 JP2008532116A5 (ja) 2008-11-27
JP4871885B2 JP4871885B2 (ja) 2012-02-08

Family

ID=36097126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007555566A Expired - Fee Related JP4871885B2 (ja) 2005-02-22 2006-01-19 ウェブ・ベースの多モード・インターフェースを用いるユーザ検証

Country Status (6)

Country Link
US (2) US8725514B2 (ja)
EP (3) EP2273414B1 (ja)
JP (1) JP4871885B2 (ja)
CN (2) CN102222190A (ja)
TW (1) TWI358223B (ja)
WO (1) WO2006089822A1 (ja)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011887A (ja) * 2004-06-28 2006-01-12 Digital Electronics Corp プログラマブル・ロジック・コントローラ、グラフィック・ロジック・コントローラ、制御プログラム作成装置、プログラム、および、記録媒体
US9083798B2 (en) * 2004-12-22 2015-07-14 Nuance Communications, Inc. Enabling voice selection of user preferences
US8725514B2 (en) * 2005-02-22 2014-05-13 Nuance Communications, Inc. Verifying a user using speaker verification and a multimodal web-based interface
US20060287858A1 (en) * 2005-06-16 2006-12-21 Cross Charles W Jr Modifying a grammar of a hierarchical multimodal menu with keywords sold to customers
US8032825B2 (en) * 2005-06-16 2011-10-04 International Business Machines Corporation Dynamically creating multimodal markup documents
US7917365B2 (en) * 2005-06-16 2011-03-29 Nuance Communications, Inc. Synchronizing visual and speech events in a multimodal application
US20060287865A1 (en) * 2005-06-16 2006-12-21 Cross Charles W Jr Establishing a multimodal application voice
US20060288309A1 (en) * 2005-06-16 2006-12-21 Cross Charles W Jr Displaying available menu choices in a multimodal browser
US8090584B2 (en) 2005-06-16 2012-01-03 Nuance Communications, Inc. Modifying a grammar of a hierarchical multimodal menu in dependence upon speech command frequency
US20060287863A1 (en) * 2005-06-16 2006-12-21 International Business Machines Corporation Speaker identification and voice verification for voice applications
JP4755689B2 (ja) 2005-07-27 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 正規受信者への安全なファイル配信のためのシステムおよび方法
US8073700B2 (en) 2005-09-12 2011-12-06 Nuance Communications, Inc. Retrieval and presentation of network service results for mobile device using a multimodal browser
US8719034B2 (en) 2005-09-13 2014-05-06 Nuance Communications, Inc. Displaying speech command input state information in a multimodal browser
US7848314B2 (en) * 2006-05-10 2010-12-07 Nuance Communications, Inc. VOIP barge-in support for half-duplex DSR client on a full-duplex network
US20070274297A1 (en) * 2006-05-10 2007-11-29 Cross Charles W Jr Streaming audio from a full-duplex network through a half-duplex device
US9208785B2 (en) * 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US8332218B2 (en) * 2006-06-13 2012-12-11 Nuance Communications, Inc. Context-based grammars for automated speech recognition
US7676371B2 (en) * 2006-06-13 2010-03-09 Nuance Communications, Inc. Oral modification of an ASR lexicon of an ASR engine
US8145493B2 (en) 2006-09-11 2012-03-27 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application
US8374874B2 (en) 2006-09-11 2013-02-12 Nuance Communications, Inc. Establishing a multimodal personality for a multimodal application in dependence upon attributes of user interaction
US7957976B2 (en) * 2006-09-12 2011-06-07 Nuance Communications, Inc. Establishing a multimodal advertising personality for a sponsor of a multimodal application
US8086463B2 (en) 2006-09-12 2011-12-27 Nuance Communications, Inc. Dynamically generating a vocal help prompt in a multimodal application
US8073697B2 (en) 2006-09-12 2011-12-06 International Business Machines Corporation Establishing a multimodal personality for a multimodal application
US7827033B2 (en) * 2006-12-06 2010-11-02 Nuance Communications, Inc. Enabling grammars in web page frames
US8069047B2 (en) * 2007-02-12 2011-11-29 Nuance Communications, Inc. Dynamically defining a VoiceXML grammar in an X+V page of a multimodal application
US7801728B2 (en) 2007-02-26 2010-09-21 Nuance Communications, Inc. Document session replay for multimodal applications
US8150698B2 (en) * 2007-02-26 2012-04-03 Nuance Communications, Inc. Invoking tapered prompts in a multimodal application
US7840409B2 (en) * 2007-02-27 2010-11-23 Nuance Communications, Inc. Ordering recognition results produced by an automatic speech recognition engine for a multimodal application
US7809575B2 (en) * 2007-02-27 2010-10-05 Nuance Communications, Inc. Enabling global grammars for a particular multimodal application
US8713542B2 (en) * 2007-02-27 2014-04-29 Nuance Communications, Inc. Pausing a VoiceXML dialog of a multimodal application
US7822608B2 (en) * 2007-02-27 2010-10-26 Nuance Communications, Inc. Disambiguating a speech recognition grammar in a multimodal application
US9208783B2 (en) * 2007-02-27 2015-12-08 Nuance Communications, Inc. Altering behavior of a multimodal application based on location
US20080208586A1 (en) * 2007-02-27 2008-08-28 Soonthorn Ativanichayaphong Enabling Natural Language Understanding In An X+V Page Of A Multimodal Application
US20080208589A1 (en) * 2007-02-27 2008-08-28 Cross Charles W Presenting Supplemental Content For Digital Media Using A Multimodal Application
US8938392B2 (en) * 2007-02-27 2015-01-20 Nuance Communications, Inc. Configuring a speech engine for a multimodal application based on location
US8843376B2 (en) 2007-03-13 2014-09-23 Nuance Communications, Inc. Speech-enabled web content searching using a multimodal browser
US7945851B2 (en) * 2007-03-14 2011-05-17 Nuance Communications, Inc. Enabling dynamic voiceXML in an X+V page of a multimodal application
US8515757B2 (en) 2007-03-20 2013-08-20 Nuance Communications, Inc. Indexing digitized speech with words represented in the digitized speech
US8670987B2 (en) * 2007-03-20 2014-03-11 Nuance Communications, Inc. Automatic speech recognition with dynamic grammar rules
US20080235029A1 (en) * 2007-03-23 2008-09-25 Cross Charles W Speech-Enabled Predictive Text Selection For A Multimodal Application
US8909532B2 (en) * 2007-03-23 2014-12-09 Nuance Communications, Inc. Supporting multi-lingual user interaction with a multimodal application
US8788620B2 (en) * 2007-04-04 2014-07-22 International Business Machines Corporation Web service support for a multimodal client processing a multimodal application
US8862475B2 (en) * 2007-04-12 2014-10-14 Nuance Communications, Inc. Speech-enabled content navigation and control of a distributed multimodal browser
US8725513B2 (en) * 2007-04-12 2014-05-13 Nuance Communications, Inc. Providing expressive user interaction with a multimodal application
US8121837B2 (en) * 2008-04-24 2012-02-21 Nuance Communications, Inc. Adjusting a speech engine for a mobile computing device based on background noise
US8214242B2 (en) * 2008-04-24 2012-07-03 International Business Machines Corporation Signaling correspondence between a meeting agenda and a meeting discussion
US8229081B2 (en) * 2008-04-24 2012-07-24 International Business Machines Corporation Dynamically publishing directory information for a plurality of interactive voice response systems
US9349367B2 (en) * 2008-04-24 2016-05-24 Nuance Communications, Inc. Records disambiguation in a multimodal application operating on a multimodal device
US8082148B2 (en) * 2008-04-24 2011-12-20 Nuance Communications, Inc. Testing a grammar used in speech recognition for reliability in a plurality of operating environments having different background noise
JP5042194B2 (ja) 2008-10-27 2012-10-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 話者テンプレートを更新する装置及び方法
US8380513B2 (en) * 2009-05-19 2013-02-19 International Business Machines Corporation Improving speech capabilities of a multimodal application
US8290780B2 (en) 2009-06-24 2012-10-16 International Business Machines Corporation Dynamically extending the speech prompts of a multimodal application
US8510117B2 (en) * 2009-07-09 2013-08-13 Nuance Communications, Inc. Speech enabled media sharing in a multimodal application
US8416714B2 (en) * 2009-08-05 2013-04-09 International Business Machines Corporation Multimodal teleconferencing
US9318114B2 (en) 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification
US9262612B2 (en) * 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
RU2451346C1 (ru) * 2011-04-27 2012-05-20 Сергей Владимирович Дворянкин Способ контактно-разностной акустической идентификации личности
US9646613B2 (en) 2013-11-29 2017-05-09 Daon Holdings Limited Methods and systems for splitting a digital signal
US9257120B1 (en) * 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
WO2016058540A1 (zh) * 2014-10-15 2016-04-21 腾讯科技(深圳)有限公司 身份验证方法、装置和存储介质
CN104967622B (zh) * 2015-06-30 2017-04-05 百度在线网络技术(北京)有限公司 基于声纹的通讯方法、装置和系统
US10269372B1 (en) * 2015-09-24 2019-04-23 United Services Automobile Association (Usaa) System for sound analysis and recognition
KR102401170B1 (ko) 2015-10-21 2022-05-24 삼성전자주식회사 복합 인증 장치 및 방법
TWI574255B (zh) * 2016-02-22 2017-03-11 華碩電腦股份有限公司 語音辨識方法、電子裝置及語音辨識系統
US10542010B2 (en) * 2016-05-27 2020-01-21 Microsoft Technology Licensing, Llc Account verification in deferred provisioning systems
CN106850539A (zh) * 2016-12-07 2017-06-13 广东小天才科技有限公司 一种验证信息获取方法和装置
US10592649B2 (en) * 2017-08-09 2020-03-17 Nice Ltd. Authentication via a dynamic passphrase
CN108986825A (zh) * 2018-07-02 2018-12-11 北京百度网讯科技有限公司 基于语音交互的上下文获取方法及设备
CN110491389B (zh) * 2019-08-19 2021-12-14 效生软件科技(上海)有限公司 一种话务系统的声纹识别方法
CN111312257A (zh) * 2019-12-16 2020-06-19 五八有限公司 一种多账号的识别方法、装置、电子设备及存储介质
BR112022025286A2 (pt) * 2020-06-11 2023-02-28 Vonage Business Inc Sistemas e métodos para verificar identidade usando dados biométricos

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030163739A1 (en) * 2002-02-28 2003-08-28 Armington John Phillip Robust multi-factor authentication for secure application environments
JP2004013274A (ja) * 2002-06-04 2004-01-15 Ntt Comware Corp ユーザ認証システム、ユーザ認証方法、ユーザ認証プログラムおよび記録媒体
JP2004077966A (ja) * 2002-08-21 2004-03-11 Yamatosokki Joho Center Co Ltd デジタル速記システム
JP2004139221A (ja) * 2002-10-16 2004-05-13 Ntt Docomo Tokai Inc 認証システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073101A (en) 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
US6266640B1 (en) * 1996-08-06 2001-07-24 Dialogic Corporation Data network with voice verification means
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6107935A (en) 1998-02-11 2000-08-22 International Business Machines Corporation Systems and methods for access filtering employing relaxed recognition constraints
AU4135199A (en) 1998-04-20 1999-11-08 Koninklijke Kpn N.V. Threshold setting and training of a speaker verification system
US6219639B1 (en) 1998-04-28 2001-04-17 International Business Machines Corporation Method and apparatus for recognizing identity of individuals employing synchronized biometrics
US6691089B1 (en) * 1999-09-30 2004-02-10 Mindspeed Technologies Inc. User configurable levels of security for a speaker verification system
US7280970B2 (en) * 1999-10-04 2007-10-09 Beepcard Ltd. Sonic/ultrasonic authentication device
WO2001082190A1 (en) 2000-04-26 2001-11-01 Global Transaction Company Multi-tiered identity verification authority for e-commerce
US6754628B1 (en) 2000-06-13 2004-06-22 International Business Machines Corporation Speaker recognition using cohort-specific feature transforms
US7406657B1 (en) * 2000-09-22 2008-07-29 International Business Machines Corporation Audible presentation and verbal interaction of HTML-like form constructs
US20040177097A1 (en) * 2000-12-01 2004-09-09 Philips Electronics North America Corporation Web-based, biometric authentication system and method
US7805310B2 (en) * 2001-02-26 2010-09-28 Rohwer Elizabeth A Apparatus and methods for implementing voice enabling applications in a converged voice and data network environment
US7610547B2 (en) * 2001-05-04 2009-10-27 Microsoft Corporation Markup language extensions for web enabled recognition
US6801604B2 (en) * 2001-06-25 2004-10-05 International Business Machines Corporation Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources
US7177814B2 (en) * 2002-02-07 2007-02-13 Sap Aktiengesellschaft Dynamic grammar for voice-enabled applications
US20040186724A1 (en) 2003-03-19 2004-09-23 Philippe Morin Hands-free speaker verification system relying on efficient management of accuracy risk and user convenience
US8396973B2 (en) * 2004-10-22 2013-03-12 Microsoft Corporation Distributed speech service
US8725514B2 (en) * 2005-02-22 2014-05-13 Nuance Communications, Inc. Verifying a user using speaker verification and a multimodal web-based interface

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030163739A1 (en) * 2002-02-28 2003-08-28 Armington John Phillip Robust multi-factor authentication for secure application environments
JP2006505021A (ja) * 2002-02-28 2006-02-09 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 安全なアプリケーション環境のためのローバスト多要素認証
JP2004013274A (ja) * 2002-06-04 2004-01-15 Ntt Comware Corp ユーザ認証システム、ユーザ認証方法、ユーザ認証プログラムおよび記録媒体
JP2004077966A (ja) * 2002-08-21 2004-03-11 Yamatosokki Joho Center Co Ltd デジタル速記システム
JP2004139221A (ja) * 2002-10-16 2004-05-13 Ntt Docomo Tokai Inc 認証システム

Also Published As

Publication number Publication date
US20140249819A1 (en) 2014-09-04
CN101120350B (zh) 2011-07-20
EP1854039A1 (en) 2007-11-14
EP2273414A1 (en) 2011-01-12
JP4871885B2 (ja) 2012-02-08
CN102222190A (zh) 2011-10-19
TW200637331A (en) 2006-10-16
EP2273414B1 (en) 2017-03-15
US8725514B2 (en) 2014-05-13
US20060190264A1 (en) 2006-08-24
EP2273412B1 (en) 2017-03-15
TWI358223B (en) 2012-02-11
WO2006089822A1 (en) 2006-08-31
US10818299B2 (en) 2020-10-27
EP2273412A1 (en) 2011-01-12
CN101120350A (zh) 2008-02-06

Similar Documents

Publication Publication Date Title
JP4871885B2 (ja) ウェブ・ベースの多モード・インターフェースを用いるユーザ検証
US10417405B2 (en) Device access using voice authentication
JP6561219B1 (ja) 話者照合
US20140343943A1 (en) Systems, Computer Medium and Computer-Implemented Methods for Authenticating Users Using Voice Streams
US9620127B2 (en) System and method for voice authentication over a computer network
US8082448B2 (en) System and method for user authentication using non-language words
US20130006626A1 (en) Voice-based telecommunication login
JP2008544327A (ja) セキュア情報のための音声認識システム
WO2014022602A2 (en) Using the ability to speak as a human interactive proof
US20060287863A1 (en) Speaker identification and voice verification for voice applications
KR101424962B1 (ko) 음성 기반 인증시스템 및 방법
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
KR20040068548A (ko) 행동 모델을 사용한 비-개입적 화자 인증 방법 및 시스템
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
CN106850539A (zh) 一种验证信息获取方法和装置
KR100309219B1 (ko) 네트워크 기반의 화자 학습 및 화자 확인 방법 및 장치
KR20040074810A (ko) 음성인식과 화자인증 및 지문인증 통합 기술을 이용한클라이언트 컴퓨터상에서 인터넷 브라우저의 제어와인터넷 서비스의 자동접속 방법
Pathak et al. Interacting with the Speech API
FI126129B (en) Audiovisual associative authentication procedure and equivalent system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081008

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081008

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090930

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111121

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees