JP2008544327A - セキュア情報のための音声認識システム - Google Patents

セキュア情報のための音声認識システム Download PDF

Info

Publication number
JP2008544327A
JP2008544327A JP2008518142A JP2008518142A JP2008544327A JP 2008544327 A JP2008544327 A JP 2008544327A JP 2008518142 A JP2008518142 A JP 2008518142A JP 2008518142 A JP2008518142 A JP 2008518142A JP 2008544327 A JP2008544327 A JP 2008544327A
Authority
JP
Japan
Prior art keywords
speech unit
input
security
word speech
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008518142A
Other languages
English (en)
Other versions
JP2008544327A5 (ja
Inventor
ジー.オラソン デービッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2008544327A publication Critical patent/JP2008544327A/ja
Publication of JP2008544327A5 publication Critical patent/JP2008544327A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Abstract

セキュア情報のための音声認識システム。音声認識システムの実施形態はセキュリティシステムと連動する下位語音声認識システムを含む。下位語音声認識構成要素はパスワード又はセキュリティコードのような入力された発話に対し下位語音声単位を提供する。入力された発話についての下位語音声単位は、認証のためにセキュリティシステムに提供される。

Description

この発明は音声認識システムに関する。
多くの自動化されたシステムは情報へアクセスするため又は種々の機能を実行するため電話のキーを使用して入力される確かなパスワード又はコードを必要とする。例えば、自動化されたバンキングシステムは口座情報を読み出すために確かなパスワード又はセキュリティコードを必要とする。このようなシステムはユーザに誕生日又は社会保障番号のような秘密情報又はユーザに関連する他のパスワードを入力させるように促す。次にシステムはユーザの真偽を検証するため秘密情報又はパスワードの記憶されたレコードに対してユーザの入力又は応答を検証する。これらの簡単な数字パスワードは、しばしば密かに発見することが比較的容易である。
様々なアプリケーションがタスクを実行するために、ユーザがプロンプトに対する応答として音声情報を入力するように促すための電話や対話システムを使用する。これらのアプリケーションは入力された音声を認識するため、音声認識システムを使用する。このような音声認識システムは話された発話中の語群(words)を認識するため文典(grammar)を使用する。セキュア情報のための電話又は対話システムに関連して、セキュアデータのための文典を確立することは困難である。これは文典が語を認識するためには、その語についての書かれた規則を持たねばならないからである。このため、秘密のパスワード情報としてしばしば使用される固有の名称及び他の語は文典において旨く処理されていない。更にたとえ文典は秘密パスワードを含んでも、もし自動音声認識が電話の対話システムで起こるならば、セキュアアプリケーション又はシステムの外で、秘密のパスワード情報は一般にセキュアではなくなるため、セキュリティは低下する。
本発明の実施形態はこれらの問題および/または他の問題の1つ以上を対象とする。上記背景技術は本発明を如何なる意味でも限定することを意図せず、単なる例示として提供される。
本発明の実施形態はセキュア情報のための音声認識システムに関する。音声認識システムはセキュリティシステムと連動する下位の語音声単位認識構成要素(sub-word speech unit recognition component)を含む。下位語音声単位認識構成要素は、ユーザからパスワード又は秘密情報を表す音声入力を受け、発話中の下位語音声単位を認識し、そして下位語音声単位を記憶された情報又はデータと比較するため、下位語音声単位をセキュリティシステムへ提供する。
上記要約は以下の詳細説明の項で更に述べる概念を選択的に簡略化して紹介するために提供される。この要約は請求の対象の重要な特徴又は必須の特徴を特定することを意図せず、請求する対象の範囲を決定するための助けとして使用されることを意図する。
本発明の実施形態はセキュア情報のための下位語音声認識に関する。本発明をより詳細に説明するのに先立ち、本発明を実施することができる1つの例示的なコンピュータ環境100の実施形態を図1に関して説明する。
図1に示すコンピュータシステム環境100は適切なコンピュータ環境の一例に過ぎず、本発明の使用又は機能の範囲に関する限定を示唆する意図はない。また、典型的作動環境100に示す要素又は要素の組み合わせに関する依存又は必要性を有すると解釈するべきでない。
本発明は種々の他の一般的目的又は特定目的のコンピュータシステム環境又は構成で使用できる。本発明の使用に適する既知のコンピュータシステム、環境および/または構成の例には、限定しないが、パーソナルコンピュータ、サーバコンピュータ、携帯装置又はラップトップ装置、マルチプロセッサシステム、マイクロプロセッサ系システム、セットトップボックス、プログラマブル電子装置、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記システム又は装置のいずれかを含む分散コンピュータ環境などがある。
本発明はコンピュータにより実行されるプログラムモジュールのようなコンピュータで実行可能な命令の一般的文脈で記述される。一般に、プログラムモジュールには、特定業務を実行するか又は特定の抽象データ型を実装する、ルーティン、プログラム、オブジェクト、コンポーネント、データ構造がある。当業者はここで提供される説明と図面に基づき、コンピュータで読取可能媒体上に記憶される命令として、この発明の態様を実施することができる。
本発明は、またタスクが通信ネットワークを介して接続されるリモートプロセッサデバイスにより実行される分散コンピュータ環境でも実行される。分散コンピュータ環境で、プログラムモジュールは記憶装置を含むローカル及びリモートコンピュータ記憶媒体の両方に設置される。
図1に関して、本発明を実施するための典型的なシステムにはコンピュータ100の形の汎用コンピュータ装置がある。コンピュータ100の構成要素には限定しないが、プロセッサユニット120、システムメモリ130及びシステムメモリを含む種々のシステム構成要素をプロセッサユニット120へ接続するシステムバス121がある。システムバス121は、メモリバス又はメモリコントローラ、周辺バス、種々のバスアーキテクチャのいずれかを使用するローカルバスを含むいくつかの種類のバス構造の1つとすることができる。限定しないが例として、このようなアーキテクチャにはISA(Industrial Standard Architecture bus)バス、マイクロチャネル・アーキテクチャ(MCA)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、及びメザニンバスとしても知られるPCI(Peripheral Components Interconnect bus)バス、がある。
コンピュータ110には一般に種々のコンピュータで読み取り可能な媒体がある。コンピュータで読取可能な媒体は、コンピュータ110でアクセスでき、揮発性及び不揮発性媒体の双方を含み、取外し可能な及び取外し不可能な媒体を含む利用可能な媒体のいずれかとすることができる。限定しない例として、コンピュータで読取可能な媒体にはコンピュータ記憶媒体及び通信媒体がある。コンピュータ記憶媒体は、コンピュータで読取可能な命令、データ構造、プログラムモジュール又は他のデータのような情報の記憶のための方法又は技術を実装した揮発性媒体及び不揮発性媒体の双方を含み、取外可能な媒体及び取外し不可能な媒体を含む。
コンピュータ記憶媒体には、限定しないがRAM、ROM、EEPROM、フラッシュメモリ又は他のメモリ技術、CD‐ROM、デジタル多用途ディスク(DVD:Digital Versatile Disks)又は他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、または他の磁気式記憶装置、又は所望の情報を記憶するために使用でき、そしてコンピュータ100によりアクセス可能な他の媒体がある。通信媒体は、一般にコンピュータで読取可能な命令、データ構造、プログラムモジュール又は他のデータを、搬送キャリアWAV又は他の搬送機構のような変調データ信号内に具現化する、情報伝達媒体のいずれかを含む。“変調データ信号”なる語句は、信号中の情報を符号化するように設定又は変更された1つまたは複数のその特徴を有する信号を意味する。限定しない1つの例で、通信媒体には有線回線又は直接配線接続のような有線媒体及び音響、FR、赤外線及び他の無線媒体のような無線媒体がある。上記のいずれかの組合せはコンピュータで読取可能な媒体の範囲に含まれる。
システムメモリ130には読み取り専用メモリ(ROM)131やランダムアクセスメモリ(RAM)132のような揮発性そして/または不揮発性メモリの形のコンピュータ記憶媒体がある。スタートアップの間のようなコンピュータ内の要素間の情報伝送に役立つ基本ルーティンを含む基本入力/出力システム(BIOS)133は一般にROM131内に記憶される。RAM132は一般にデータおよび/または直ちにアクセスでき、および/またはプロセッサユニット120により現在処理されているプログラムモジュールを含む。限定しない例として、図1はオペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136及びプログラムデータ137を示す。
また、コンピュータ110は取り外し可能な/取外し不可能な揮発性/不揮発性の他のコンピュータ記憶媒体も含む。単なる例として、図1は取外し不可の不揮発性磁気媒体から読み取り又はこれへ書き込むハードディスク・ドライブ141、取外し可能な不揮発性磁気ディスク152から読取り又はこれへ書き込む磁気ディスクドライブ151、及びCD‐ROM又は他の光媒体のような取外し可能な不揮発性光ディスクドライブ155を示す。典型的な動作環境で使用できる取外し可能な/取外し不可能な揮発性/不揮発性の他のコンピュータ記憶媒体には、限定しないが、磁気テープカセット、フラッシュメモリ・カード、デジタル多用途ディスク、デジタルビデオ・テープ、半導体RAM、半導体ROM等がある。一般に、ハードディスク・ドライブ141は、インタフェース140のような取外し不可のメモリインタフェースを介して、システムバス121へ接続される。また一般に、磁気ディスクドライブ151と光ディスクドライブ155はインタフェース150のような取外し可能なメモリインタフェースによりシステムバス121へ接続される。
上で論じ、そして図1に例示したドライブ及びそれらに関連するコンピュータ記憶媒体はコンピュータ110のためのコンピュータで読取り可能な命令、データ構造、プログラムモジュール及び他のデータの記憶を提供する。例えば図1で、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146及びプログラムデータ147の記憶のためのハードディスク・ドライブ141を図示する。これらの構成要素はオペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、及びプログラムデータ137と同じものとするか、又は異なるものとすることができる。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、及びプログラムデータ147には少なくともそれらが異なるコピーであることを示すため、ここでは異なる番号が付与している。
ユーザはキーボード、マイクロホン、マウスやトラックボール又はタッチパッドのようなポインティングデバイス(b)のような入力装置を介してコマンド及び情報をコンピュータ110へ入力する。他の入力装置(図示しない)にはジョイスティック、ゲームパッド、衛星アンテナ、スキヤナ等がある。これらや他の入力装置はしばしば、システムバスに接続されるが、パラレルポート、ゲームポート又はUSB(Universal Serial Bus)のような他のインタフェースとバス構造により接続されるユーザ入力インタフェース160を介してプロセッサユニット120へ接続される。モニタ191又は他の種類の表示装置もビデオインタフェース190のようなインタフェースを介してシステムバス121へ接続される。モニタの他に、コンピュータは出力周辺機器インタフェース190を介して接続されるスピーカ197やプリンタ196のような他の周辺出力装置を含む。
コンピュータ110は、リモートコンピュータ180のような1つ又は複数のリモートコンピュータへの論理接続を使用してネットワーク化された環境で作動する。リモートコンピュータ180はパーソナルコンピュータ、携帯デバイス、サーバ、ルータ、ネットワークPC、ピアデバイス又は他の一般的なネットワークノードであり、そして一般にコンピュータ110に関する上記要素の多く又は全てを含む。図1に示す論理接続はローカルエリアネットワーク(LAN)171及びワイドエリアネットワーク173を含むが、他のネットワークも含む。このようなネットワーク環境は事務所、企業規模のコンピュータネットワーク、イントラネット及びインタネットではよく知られている。
LANネットワーク環境で使用される場合、コンピュータ110はネットワークインタフェース又はネットワークアダプタ170を介してLAN171へ接続される。WANネットワーク環境を使用する場合、一般に、コンピュータ110はインタネットのようなWAN173に跨る通信を確立するためのモデム172又は他の手段を含む。内部又は外部にあるモデム172はユーザ入力インタフェース160又は他の適切な構造を介してシステムバス121へ接続される。ネットワーク化された環境では、コンピュータ110関して示されるプログラムモジュール又はその一部は、リモートメモリ記憶装置に記憶される。限定しない例として、図1はリモートコンピュータ180上に存在するリモートアプリケーションプログラム185を図示する。示されたネットワーク接続は一例であり、コンピュータ間の通信接続の確立のための他の手段も使用できることは理解されるだろう。
この発明の実施形態は、種々のアプリケーションを有し、示される特定実施形態に限定されない、セキュア情報のための音声認識システム200に関する。図2に示す実施形態において、音声認識システム200は、アプリケーション202とセキュリティシステム204とを含む。図2において、アプリケーション202は、概して、オーディオプロンプト208でユーザ207を促し、音声応答210を受け、そしてユーザが音声指令とプロンプトに対する音声応答を使用して、あるタスクを実行することを可能にする音声認識システム206を有する電話システム又は対話システムを例証する。
一実施形態では、音声認識システム206は下位の語音声単位認識構成要素212を含む。下位語音声単位認識構成要素212はユーザ207からの応答又は発話210を受ける。構成要素212は、入力された音声の発話又は応答210に音素のような下位語音声単位214を認識する。
示された実施形態では、セキュリティシステム204は、セキュアデータベース又はセキュア情報220を含む。説明する実施形態で、データベース220は、パスワードやセキュリティコードのようなセキュリティデータに対応する下位語音声単位を含む。図示するように、認識構成要素212は入力された音声又は発話210の認証のためセキュアインタフェース222を介してセキュリティシステム204と連動する。セキュアインタフェース222は図示のようにセキュリティプロトコルを利用するファイヤウォール又は他のインタフェースである。特定のインタフェース又はプロトコルはこの発明の目的にとって重要ではなく、むしろセキュリティシステム204内のデータがアプリケーション202内のデータよりも安全を確保されているということである。
特に、例示した実施形態では、システム200を使用してパスワード又はセキュリティコードの検証又は認証を行う。パスワード又はコードはプロンプト208に応答してユーザ207により入力される。発話は下位語音声単位認識構成要素212により、下位語音声単位214へ処理される。アプリケーション202はユーザ名、アカウント番号又は他の識別コードのようなユーザ識別子224と併せて、下位語音声単位をセキュリティシステム204へ提供する。
セキュリティシステム204は、受け取ったユーザ識別子224に対応するパスワード又はセキュリティコードを示す記憶された情報へアクセスするため、下位語音声単位214及びユーザ識別子224を使用する。記憶された情報は、例えば記憶された下位語音声単位である。入力音声に対応する下位語音声単位を音声単位比較器構成要素225により記憶されたデータ又は記憶された下位語音声単位と比較する。
入力された下位語音声単位214が記憶されたパスワード又はセキュリティコードに合えば、パスワードが正しいという認可メッセージ226がセキュアインタフェース222を介してアプリケーション202へ提供される。さもなければ、メッセージ226はパスワードが正しくないことを示す。上述したように、セキュア情報に対し、下位語音声単位だけがアプリケーション202で認識され、セキュアインタフェース222を介してセキュリティシステム204へ送られる。これにより、セキュア情報の語レベルの認識はセキュリティシステム204の外では利用できず、情報のセキュリティを守ることができる。
図3はセキュリティコード又はパスワードのようなセキュアデータのためのセキュア音声認識の実施形態を実施するステップをより詳細に図示する。図示された実施形態では、ブロック230に示すようにユーザ207が業務を実行するため、アプリケーション202にアクセスし、ブロック232により示すようにユーザ207は、パスワードやセキュリティコードのようなセキュア情報を入力するよう促される。
ブロック234に示すように、プロンプト208に応答して、ユーザ207が応答210を発話する。ブロック236に示すように、発話された応答210内の下位語音声単位を下位語音声単位認識要素212により認識する。ステップ238で示すように、下位語音声単位214は、他の識別情報224と共にセキュアインタフェース222を介してセキュリティシステム204へ提供される。セキュリティシステム204は、下位語音声単位214を記憶装置220に記憶された識別されたユーザ207についてのセキュアデータ又は情報と比較する。
特に例示した実施形態では、ブロック240で示すように、音声単位比較器構成要素225はセキュアデータ又は情報に対する記憶された下位語音声単位を検索し、記憶された下位語音声単位を入力された発話についての入力された下位語音声単位214と比較する。ブロック242により示すように、記憶された下位語音声単位と入力された音声又は発話についての下位語音声単位とを比較し、入力された発話がユーザ207についての記憶されたデータ又はパスワードに合致するかどうかを判定する。
もし合致していれば、次いでブロック248に示すように、セキュリティシステム又はアプリケーション204は合致を検証するアプリケーション202へメッセージ226を送り、ブロック250に示すように、アプリケーション202はユーザ207により求められたタスク又は情報を解放する。例えば、入力された発話についての下位語音声単位が記憶された情報に対する下位語音声単位又は音素に合致すれば、セキュリティシステムは、ユーザが他の状態では解放された情報へアクセスし、又は所望のタスクを実行できるようにアプリケーション202を解放できる。
合致しなければ、ブロック252で示すように、セキュリティシステム204は、合致しないことのメッセージをアプリケーション202へ送り、そしてブロック254で示すように、ロックしたままとし、および/又はエラーメッセージをユーザ207へ表示する。
説明した実施形態では、セキュア情報はセキュリティシステム204の外では決して十分に認識されない。代わりにセキュア情報に対応する下位語音声単位のみが認識され、セキュリティシステム204へ送られる。このため、セキュア情報のための語レベルの文典は、セキュリティシステム204の外で利用できるようにする必要はない。例えば、もしユーザが、テレホンバンキングシステムの銀行口座を開錠するために、ユーザの母の旧姓の入力するよう促されるならば、語レベルの認識はセキュリティシステム204の外では利用できない。代わりに、入力されたユーザの母の旧姓の発話は下位語音声単位として認識され、そしてユーザが入力した発話がセキュアデータベース220に記憶されたユーザの母の旧姓に対するデータに合致することを検証するために、下位語音声単位をセキュリティシステム204へ送る。
図4はシステム200への登録又は参加のための実施形態を示す。プロセスは、セキュアデータベース220に記憶するためユーザのセキュア情報を識別する下位語音声単位の入力すること又は生成することを含む。図4は、ユーザが情報をセキュリティシステム204へ直接入力する実施形態を示す。しかしセキュア情報を、図2のシステム200におけるアプリケーション202を介して入力することもできることは認識されるだろう。図4に示す実施形態では、セキュア情報は、音声又は音響入力装置260(電話又は他の音声対話システムのような)を使用して、又は英数字キーボード又はキーパッドのような非音響入力装置262を使用して、セキュリティシステム204へ入力できる。図4に示す実施形態では、セキュリティシステム204は、例えばユーザにユーザの母の旧姓のようなセキュア情報又はデータを入力するようなセキュリティプロンプト264を提供する。セキュリティプロンプト264に応答して、ユーザは音響の応答や発話又は非音響の応答(テキストの応答のような)を提供することができる。
図4に示すように、ユーザの入力が音響入力装置260によるならば、音響の応答における下位語音声単位が下位語音声単位認識装置268により認識される。ユーザの応答が(テキストの形式によるような)非音響入力装置262を介して入力されるものであるならば、下位語音声単位発生器270はテキスト入力に対する下位語音声単位を発生させる。例えば、示した実施形態において、下位語音声単位は音素であり、入力された語群を識別するための辞書又は用語集と、認識された語群に対する音素を発生させるための文字から音への規則274とを使用して下位語音声単位発生器270によりテキストから発生させる。いずれの場合も、下位語音声単位発生器270又は下位語音声認識装置268からの下位語音声単位がセキュアデータベース220へ記憶される。
図5はセキュア情報をセキュアデータベース220へ入力するためのステップをより詳細に示す。図示のように、ブロック280に示すように、ユーザは、セキュリティシステム204へアクセスし、ブロック282に示すように、登録のためユーザの識別情報(例えば名前、電話番号など)を入力することをプロンプト264で促される。ブロック284により示すように、ユーザはセキュア情報(例えばパスワード又はセキュリティコード)を入力することも促される。セキュア情報はブロック286により示すように、音声入力装置260又は非音響入力装置262を介してユーザにより入力される。
ブロック288により示すように、システムはユーザの応答が非音響(テキストのような)か又は音声かを決定する。ユーザのセキュア情報を、音響入力装置260を介して入力するならば、ブロック290で示すように、ユーザにより入力されるセキュア情報に対する下位語音声単位を下位語音声単位認識装置268で認識する。ユーザ応答がテキスト入力として入力されたならば、ステップ292により示すように、下位言語音声ユニットを、テキスト入力又はテキスト応答に対し、下位語音声単位発生器270により発生させる。一旦下位語音声単位271を発生させ又は認識すると、ブロック294により示すように、下位語音声単位271をユーザの識別子やアカウントの下でセキュアデータベース220へ記憶する。
この発明は特定の実施形態に関し述べてきたが、本発明の要旨と範囲から逸脱することなく、形式的な変更及び細部の変更できることを、当業者は認識するだろう。
この発明の実施形態を使用又は実施することができるコンピュータ環境の1つを例示するブロック図である。 セキュア情報のための音声認識システムを例示するブロック図である。 セキュア情報に関してユーザが入力した発話の認証の一実施形態を示すフローチャートである。 セキュリティシステムにおいてセキュア情報を入力する実施形態を説明するブロック図である。 セキュリティシステムにおいてセキュア情報を登録するステップの実施形態を説明するフローチャートである。

Claims (18)

  1. セキュリティデータを示す入力された発話についての下位語音声単位を提供するように構成された下位語音声単位認識構成要素と、
    前記下位語音声認識構成要素から分離され、前記下位言語音声単位を受けとり、セキュリティデータを示す記憶された情報と前記下位語音声単位を比較するように構成されたセキュリティシステムと
    を備える音声認識システム。
  2. 前記下位語音声認識構成要素と前記セキュリティシステムとが、セキュアインタフェースで接続されたことを特徴とする、請求項1に記載の音声認識システム。
  3. 前記セキュリティシステムは、前記セキュリティデータついて記憶された下位言音声ユニットを読み出し、当該記憶された下位語音声単位を前記入力された発話についての下位語音声単位と比較することを特徴とする、請求項1に記載の音声認識システム。
  4. 前記セキュリティデータは、セキュアデータベースに記憶されたパスワード又はセキュリティコードを含むことを特徴とする、請求項1に記載の音声認識システム。
  5. 下位語音声単位認識構成要素とともに作動可能な、ユーザ識別子を前記セキュリティシステムへ提供するように構成されたアプリケーションをさらに備え、
    前記セキュリティシステムは、前記ユーザ識別子についての前記記憶された下位語音声単位を読み出すことを特徴とする、請求項3に記載の音声認識システム。
  6. 前記セキュリティシステムは、前記記憶された下位言音声ユニットと前記入力された発話についての下位語音声ユニットとの比較に基づいて、前記セキュリティデータが正しい旨のメッセージをアプリケーションへ提供することを特徴とする、請求項5に記載の音声認識システム。
  7. 前記アプリケーションは前記比較における合致に応答して解放されることを特徴とする、請求項6に記載の音声認識システム。
  8. 入力された発話についての下位語音声単位を認識するように構成された下位語音声単位認識構成要素を備え、前記下位語音声単位をセキュリティシステムへ提供し、前記セキュリティシステムから前記下位語音声単位に基づいたセキュリティ認可を受け取るように構成されたことを特徴とするアプリケーション。
  9. 前記アプリケーションは、セキュリティデータを入力させるプロンプトに応答した前記入力された発話を受け取り、前記下位語音声単位を認識するため、前記入力された発話を下位語音声単位認識構成要素へ提供することを特徴とする、請求項8に記載のアプリケーション。
  10. 前記アプリケーションは、プロンプトに応答したユーザ識別子を受け取り、前記ユーザ識別子を前記セキュリティシステムへ提供することを特徴とする、請求項8に記載のアプリケーション。
  11. 前記アプリケーションは、セキュアインタフェースを介して前記セキュリティシステムへ接続されるように構成されたことを特徴とする、請求項8に記載のアプリケーション。
  12. 入力された発話を受け取るステップと、
    前記入力された発話に対応する下位言語音声単位を認識するステップと、
    前記入力された発話に対応する下位語音声単位と記憶された下位語音声単位とに基づいてセキュリティ情報を認証するために、前記入力された発話についての前記下位語音声単位を、セキュアインタフェースを介してセキュリティシステムへ提供するステップと、
    を含むことを特徴とする方法。
  13. ユーザ識別子を前記セキュリティシステムへ提供するステップと、
    前記下位語音声単位と前記ユーザ識別子とに基づいてセキュリティ情報を認証するステップと
    を含むことを特徴とする、請求項12に記載する方法。
  14. 前記入力された発言は、ユーザにより入力されたセキュリティ情報であり、
    前記ユーザ識別子に基づいて、セキュアデータベースから前記記憶された下位語音声単位を読み出すステップと、
    前記入力された発話についての前記下位語音声単位が前記ユーザ識別子についての前記読み出された下位語音声単位に合致するかどうかを判定するステップと
    を含むことを特徴とする、請求項13に記載の方法。
  15. 前記入力された発話についての前記下位語音声単位が前記ユーザ識別子についての前記記憶された下位語音声単位に合致するときに、ユーザアプリケーションを解法するステップをさらに含むことを特徴とする、請求項14に記載の方法。
  16. セキュアデータベースへユーザ識別子と共に前記セキュリティ情報を入力するステップと、
    前記入力されたセキュリティ情報についての下位語音声単位を提供するステップと、
    前記下位語音声単位を前記セキュアデータベースへ記憶するステップと
    をさらに含むことを特徴とする、請求項12に記載の方法。
  17. 発話として入力される前記セキュリティ情報は、音響入力装置を介して入力され、前記入力されたセキュリティ情報についての前記下位語音声単位を提供するステップは、
    前記入力された発話の下位語音声単位を認識するステップを含むことを特徴とする、請求項16に記載の方法。
  18. テキストとして入力される前記セキュリティ情報は、テキスト入力装置を介して入力され、前記入力されたセキュリティ情報についての前記下位語音声単位を提供するステップは、
    前記テキスト入力装置から入力された前記テキストついての前記下位語音声単位を発生させるステップを含むことを特徴とする、請求項16に記載の方法。
JP2008518142A 2005-06-22 2006-04-21 セキュア情報のための音声認識システム Pending JP2008544327A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/158,830 US20060293898A1 (en) 2005-06-22 2005-06-22 Speech recognition system for secure information
PCT/US2006/015250 WO2007001602A2 (en) 2005-06-22 2006-04-21 Speech recognition system for secure information

Publications (2)

Publication Number Publication Date
JP2008544327A true JP2008544327A (ja) 2008-12-04
JP2008544327A5 JP2008544327A5 (ja) 2009-05-14

Family

ID=37568670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008518142A Pending JP2008544327A (ja) 2005-06-22 2006-04-21 セキュア情報のための音声認識システム

Country Status (6)

Country Link
US (1) US20060293898A1 (ja)
EP (1) EP1894186A4 (ja)
JP (1) JP2008544327A (ja)
KR (1) KR20080019210A (ja)
CN (1) CN101208739A (ja)
WO (1) WO2007001602A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020004192A (ja) * 2018-06-29 2020-01-09 株式会社フュートレック 通信装置および通信装置を備える音声認識端末装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8010367B2 (en) * 2006-12-22 2011-08-30 Nuance Communications, Inc. Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
CN102254559A (zh) * 2010-05-20 2011-11-23 盛乐信息技术(上海)有限公司 基于声纹的身份认证系统及方法
US11451618B2 (en) 2014-05-15 2022-09-20 Universal Electronics Inc. Universal voice assistant
US11700412B2 (en) 2019-01-08 2023-07-11 Universal Electronics Inc. Universal voice assistant
US11792185B2 (en) 2019-01-08 2023-10-17 Universal Electronics Inc. Systems and methods for associating services and/or devices with a voice assistant
US8898064B1 (en) * 2012-03-19 2014-11-25 Rawles Llc Identifying candidate passwords from captured audio
CN103379488A (zh) * 2012-04-26 2013-10-30 国民技术股份有限公司 密钥钥匙装置及使用方法
CN103077341B (zh) * 2013-01-30 2016-01-20 广东欧珀移动通信有限公司 一种应用程序解锁方法及装置
KR102140770B1 (ko) * 2013-09-27 2020-08-03 에스케이플래닛 주식회사 음성에 기반한 잠금 해제를 수행하는 사용자 장치, 음성에 기반한 사용자 장치의 잠금 해제 방법 및 컴퓨터 프로그램이 기록된 기록매체
US8812320B1 (en) * 2014-04-01 2014-08-19 Google Inc. Segment-based speaker verification using dynamically generated phrases
US11445011B2 (en) 2014-05-15 2022-09-13 Universal Electronics Inc. Universal voice assistant
EP4350558A2 (en) 2014-11-07 2024-04-10 Samsung Electronics Co., Ltd. Speech signal processing method and speech signal processing apparatus
EP3018654B1 (en) 2014-11-07 2020-05-06 Samsung Electronics Co., Ltd. Speech signal processing method and speech signal processing apparatus
CN105245729B (zh) * 2015-11-02 2019-02-26 北京奇虎科技有限公司 移动终端消息阅读方法和装置
US10909978B2 (en) * 2017-06-28 2021-02-02 Amazon Technologies, Inc. Secure utterance storage
KR102489487B1 (ko) 2017-12-19 2023-01-18 삼성전자주식회사 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
KR102623727B1 (ko) 2018-10-29 2024-01-11 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11776539B2 (en) * 2019-01-08 2023-10-03 Universal Electronics Inc. Voice assistant with sound metering capabilities
US11665757B2 (en) 2019-01-08 2023-05-30 Universal Electronics Inc. Universal audio device pairing assistant

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1127750A (ja) * 1997-07-08 1999-01-29 Koorasu Computer Kk アクセス認証方法、接続制御装置、及び通信システム
JPH11327585A (ja) * 1998-04-07 1999-11-26 Lucent Technol Inc 自由音声評点法を用いた動的音声認識の方法および装置
JP2001111652A (ja) * 1999-10-12 2001-04-20 Fujitsu Ltd 音声・pb信号変換電話による音声応答システム
JP2001249689A (ja) * 2000-03-02 2001-09-14 Animo:Kk 電子認証システム、電子認証方法及び記録媒体
US20030004726A1 (en) * 2000-11-27 2003-01-02 Meinrad Niemoeller Access control arrangement and method for access control
JP2004096204A (ja) * 2002-08-29 2004-03-25 Nippon Telegraph & Telephone East Corp 遠隔音声制御装置、および遠隔音声制御装置による本人認証方法ならびにデータ登録方法、自動音声通知方法、遠隔音声制御プログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1160148B (it) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom Dispositivo per la verifica del parlatore
US5548647A (en) * 1987-04-03 1996-08-20 Texas Instruments Incorporated Fixed text speaker verification method and apparatus
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US5430827A (en) * 1993-04-23 1995-07-04 At&T Corp. Password verification system
US5677989A (en) * 1993-04-30 1997-10-14 Lucent Technologies Inc. Speaker verification system and process
US5907597A (en) * 1994-08-05 1999-05-25 Smart Tone Authentication, Inc. Method and system for the secure communication of data
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling
US5752231A (en) * 1996-02-12 1998-05-12 Texas Instruments Incorporated Method and system for performing speaker verification on a spoken utterance
US6529881B2 (en) * 1996-06-28 2003-03-04 Distributed Software Development, Inc. System and method for identifying an unidentified customer at the point of sale
JP2001505688A (ja) * 1996-11-22 2001-04-24 ティ―ネティックス,インコーポレイテッド 情報システムアクセスおよび取引処理のための音声認識
US5995927A (en) * 1997-03-14 1999-11-30 Lucent Technologies Inc. Method for performing stochastic matching for use in speaker verification
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US6246988B1 (en) * 1998-02-10 2001-06-12 Dsc Telecom L.P. Method and apparatus for accessing a data base via speaker/voice verification
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6519565B1 (en) * 1998-11-10 2003-02-11 Voice Security Systems, Inc. Method of comparing utterances for security control
US6671672B1 (en) * 1999-03-30 2003-12-30 Nuance Communications Voice authentication system having cognitive recall mechanism for password verification
US6393305B1 (en) * 1999-06-07 2002-05-21 Nokia Mobile Phones Limited Secure wireless communication user identification by voice recognition
US6691089B1 (en) * 1999-09-30 2004-02-10 Mindspeed Technologies Inc. User configurable levels of security for a speaker verification system
US6356868B1 (en) * 1999-10-25 2002-03-12 Comverse Network Systems, Inc. Voiceprint identification system
US6401063B1 (en) * 1999-11-09 2002-06-04 Nortel Networks Limited Method and apparatus for use in speaker verification
US7130800B1 (en) * 2001-09-20 2006-10-31 West Corporation Third party verification system
US20020128844A1 (en) * 2001-01-24 2002-09-12 Wilson Raymond E. Telephonic certification of electronic death registration
US6985861B2 (en) * 2001-12-12 2006-01-10 Hewlett-Packard Development Company, L.P. Systems and methods for combining subword recognition and whole word recognition of a spoken input
US7194069B1 (en) * 2002-01-04 2007-03-20 Siebel Systems, Inc. System for accessing data via voice
US7224786B2 (en) * 2003-09-11 2007-05-29 Capital One Financial Corporation System and method for detecting unauthorized access using a voice signature
US20050071168A1 (en) * 2003-09-29 2005-03-31 Biing-Hwang Juang Method and apparatus for authenticating a user using verbal information verification
US20060229879A1 (en) * 2005-04-06 2006-10-12 Top Digital Co., Ltd. Voiceprint identification system for e-commerce

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1127750A (ja) * 1997-07-08 1999-01-29 Koorasu Computer Kk アクセス認証方法、接続制御装置、及び通信システム
JPH11327585A (ja) * 1998-04-07 1999-11-26 Lucent Technol Inc 自由音声評点法を用いた動的音声認識の方法および装置
JP2001111652A (ja) * 1999-10-12 2001-04-20 Fujitsu Ltd 音声・pb信号変換電話による音声応答システム
JP2001249689A (ja) * 2000-03-02 2001-09-14 Animo:Kk 電子認証システム、電子認証方法及び記録媒体
US20030004726A1 (en) * 2000-11-27 2003-01-02 Meinrad Niemoeller Access control arrangement and method for access control
JP2004096204A (ja) * 2002-08-29 2004-03-25 Nippon Telegraph & Telephone East Corp 遠隔音声制御装置、および遠隔音声制御装置による本人認証方法ならびにデータ登録方法、自動音声通知方法、遠隔音声制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020004192A (ja) * 2018-06-29 2020-01-09 株式会社フュートレック 通信装置および通信装置を備える音声認識端末装置

Also Published As

Publication number Publication date
EP1894186A2 (en) 2008-03-05
CN101208739A (zh) 2008-06-25
WO2007001602A3 (en) 2007-12-13
US20060293898A1 (en) 2006-12-28
EP1894186A4 (en) 2009-05-20
WO2007001602A2 (en) 2007-01-04
KR20080019210A (ko) 2008-03-03

Similar Documents

Publication Publication Date Title
JP2008544327A (ja) セキュア情報のための音声認識システム
US8010367B2 (en) Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
RU2406163C2 (ru) Аутентификация пользователя посредством комбинирования установления личности говорящего и обратного теста тьюринга
US10818299B2 (en) Verifying a user using speaker verification and a multimodal web-based interface
US8082448B2 (en) System and method for user authentication using non-language words
US9620127B2 (en) System and method for voice authentication over a computer network
US20180047397A1 (en) Voice print identification portal
US20140343943A1 (en) Systems, Computer Medium and Computer-Implemented Methods for Authenticating Users Using Voice Streams
KR20180050365A (ko) 화자 검증
US11252152B2 (en) Voiceprint security with messaging services
JP2006235623A (ja) 短い発話登録を使用する話者認証のためのシステムおよび方法
US11902275B2 (en) Context-based authentication of a user
US20130339245A1 (en) Method for Performing Transaction Authorization to an Online System from an Untrusted Computer System
KR101424962B1 (ko) 음성 기반 인증시스템 및 방법
KR20140076056A (ko) 음성 기반 캡차 방법 및 장치
KR102604319B1 (ko) 화자 인증 시스템 및 그 방법
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
US8254530B2 (en) Authenticating personal identification number (PIN) users
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
WO2000058947A1 (en) User authentication for consumer electronics
US20230247021A1 (en) Voice verification factor in a multi-factor authentication system using deep learning
KR100809662B1 (ko) 화자 인증을 이용한 온라인 컨텐츠의 사용자 인증 시스템및 방법
Felker et al. Voice input for authentication

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111206

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120316