JP2016538658A - アプリケーションへのアクセスを制御するための方法および装置 - Google Patents

アプリケーションへのアクセスを制御するための方法および装置 Download PDF

Info

Publication number
JP2016538658A
JP2016538658A JP2016542025A JP2016542025A JP2016538658A JP 2016538658 A JP2016538658 A JP 2016538658A JP 2016542025 A JP2016542025 A JP 2016542025A JP 2016542025 A JP2016542025 A JP 2016542025A JP 2016538658 A JP2016538658 A JP 2016538658A
Authority
JP
Japan
Prior art keywords
voice command
security level
threshold
electronic device
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016542025A
Other languages
English (en)
Other versions
JP2016538658A5 (ja
JP6306190B2 (ja
Inventor
ユン、スングラック
キム、テス
チョ、ジュン−チョル
パク、ミン−キュ
ホワン、キュ・ウォン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016538658A publication Critical patent/JP2016538658A/ja
Publication of JP2016538658A5 publication Critical patent/JP2016538658A5/ja
Application granted granted Critical
Publication of JP6306190B2 publication Critical patent/JP6306190B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/105Multiple levels of security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/20Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本開示の一態様によれば、電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法が開示される。本方法は、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証することとを含む。本方法では、各アプリケーションは、しきい値を有するセキュリティレベルに関連する。本方法は、ボイスコマンドがユーザを示すことを検証された場合、ボイスコマンドを用いて話者モデルを更新することと、更新された話者モデルに基づいてしきい値のうちの少なくとも1つを調整することとをさらに含む。【選択図】 図6

Description

関連出願の相互参照
[001]本出願は、その内容全体が参照により本明細書に明確に組み込まれる、2013年9月16日に出願された、米国非仮特許出願第14/028,139号の優先権を主張する。
[002]本開示は、電子デバイスにおけるアプリケーションにアクセスすることに関し、より詳細には、ボイスコマンド(voice command)に応答してアプリケーションへのアクセスを制御することに関する。
[003]近年、アプリケーションを実行することが可能な電子デバイスは、ユーザの間で非常に普及してきている。たとえば、スマートフォン、タブレットコンピュータ、およびパーソナルコンピュータなどの電子デバイスは、メッセージングアプリケーション、連絡先アプリケーション、カレンダーアプリケーション、写真アプリケーションなどのアプリケーションを含み得る。さらに、ユーザは、インターネットを介してアプリケーションプロバイダから他のアプリケーション(たとえば、バンキング(banking)アプリケーション)を探索し、ダウンロードし得る。これらのアプリケーションは、様々な機能および情報への便利なアクセスをユーザに与える。
[004]ユーザによってアクセスされるアプリケーションは、しばしば、他人がアクセスすることをユーザが希望しないことがある個人情報またはプライベート情報を含む。たとえば、メッセージングアプリケーション(たとえば、電子メールアプリケーション)における電子メールは、個人使用またはビジネス使用のための情報を含み得る。同様に、ユーザのバンキングアプリケーションは、口座番号および勘定残高などのユーザの財務情報へのアクセスを含むか、または可能にし得る。
[005]アプリケーションを通してアクセスされ得る情報の機密性質を鑑みて、従来の電子デバイスは、概して、そのようなアプリケーションへのアクセスを制限するために1つまたは複数のセキュリティ機能を与える。そのようなセキュリティ機能は、アプリケーションにアクセスするためのユーザの認証を必要とし得る。たとえば、ユーザは、個人コードを入力するように要求され、コードが検証されたときにアプリケーションへのアクセスを可能にされ得る。
[006]また、いくつかの従来の電子デバイスは音声認識能力を装備している。そのようなデバイスでは、ユーザからの話されたコマンドに応答して、アプリケーションがアクセスされ得る。アプリケーションへの無許可のアクセスを防ぐために、これらのデバイスは、許可されたユーザのボイス特性に基づいて話されたコマンドの真正性を検証し得る。しかしながら、許可されたユーザのボイス特性が、時間とともに、またはユーザの状態の結果として変化し得るので、そのようなデバイスにおける許可されたユーザの認証は信頼できないことがある。
[007]本開示は、話者モデル(speaker model)を更新することと、セキュリティレベルに関連するしきい値を調整することとによって、異なるセキュリティレベルを有するアプリケーションへのアクセスを制御することに関する。
[008]本開示の一態様によれば、電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法が開示される。本方法は、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証することとを含む。本方法では、各アプリケーションは、しきい値を有するセキュリティレベルに関連する。本方法は、ボイスコマンドがユーザを示すことを検証された場合、ボイスコマンドを用いて話者モデルを更新し、更新された話者モデルに基づいてしきい値のうちの少なくとも1つを調整する。本開示はまた、本方法に関係する装置、デバイス、システム、手段の組合せ、およびコンピュータ可読媒体についても説明する。
[009]本開示の別の態様によれば、複数のアプリケーションへのアクセスを制御するための電子デバイスが開示される。本電子デバイスは、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサー(sound sensor)と、複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、およびアプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニット(storage unit)とを含む。各アプリケーションは、複数のしきい値の中のしきい値を有する複数のセキュリティレベルの中のセキュリティレベルに関連する。本電子デバイスはまた、許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証するように構成された話者検証ユニット(speaker verification unit)と、ボイスコマンドがユーザを示すことを検証された場合にボイスコマンドを用いて話者モデルを更新し、更新された話者モデルに基づいてしきい値のうちの少なくとも1つを調整するように構成されたデータベース更新ユニット(database updating unit)とを含む。
[010]本開示の発明的態様の実施形態は、以下の発明を実施するための形態を参照し、添付の図面とともに読めば理解されよう。
[011]本開示の一実施形態による、話者のボイスコマンドに応答して、複数のセキュリティレベルに基づいて複数のアプリケーションがアクセスされ得るモバイルデバイスを示す図。 [012]本開示の一実施形態による、話者のボイスコマンドに応答してアプリケーションについてのセキュリティレベルのしきい値を調整することによって複数のアプリケーションへのアクセスを制御するように構成された電子デバイスのブロック図。 [013]本開示の一実施形態による、話者からのボイスコマンドを検証するための、電子デバイスにおけるアプリケーションアクセスデータベースのブロック図。 [014]本開示の一実施形態による、話者と無許可の話者との音サンプル(sound sample)に基づいて、複数のセキュリティレベルについての初期しきい値を含む、電子デバイスにおける話者検証データベースをセットアップすることの図。 [015]本開示の一実施形態による、話者からのボイスコマンドが検証されたときにアプリケーションにアクセスするように構成された、電子デバイスにおけるボイスアクティベーションユニットのブロック図。 [016]本開示の一実施形態による、電子デバイスにおいてボイスコマンドに基づいてアプリケーションへのアクセスを行い、アプリケーションに対するアクセスを調整するための方法のフローチャート。 [017]本開示の一実施形態による、話者からのボイスコマンドを検証することによってアプリケーションにアクセスするように構成された、電子デバイスにおける話者検証ユニットのブロック図。 [018]本開示の一実施形態による、検証されたボイスコマンドに基づいて、話者モデルを更新し、セキュリティレベルについてのしきい値を調整するように構成された、電子デバイスにおけるデータベース更新ユニットのブロック図。 [019]本開示の一実施形態による、検証されたボイスコマンドについての新しい音サンプルを用いて更新され得る、電子デバイスにおける話者検証データベースの図。 [020]本開示の一実施形態による、ボイスコマンドについての信頼性値に基づいて話者モデルを更新するための方法のフローチャート。 [021]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、新しい音サンプルのセキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [022]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、新しい音サンプルのセキュリティレベルとは異なるセキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [023]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、セキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [024]本開示の一実施形態による、セキュリティレベルについてのしきい値のうちの少なくとも1つを調整するための方法のフローチャート。 [025]本開示のいくつかの実施形態による、アプリケーションへのアクセスを制御するための方法および装置が実装され得る例示的なモバイルデバイスのブロック図。
[026]次に、添付の図面にそれの例が示されている、様々な実施形態を詳細に参照する。以下の発明を実施するための形態では、本開示の発明的態様の完全な理解を与えるために多数の具体的な詳細を記載する。ただし、本開示の発明的態様はこれらの具体的な詳細なしに実施され得ることが当業者には明らかであろう。他の事例では、様々な実施形態の態様を不必要に不明瞭にしないように、よく知られている方法、プロシージャ、システム、および構成要素については詳細に説明していない。
[027]図1に、本開示の一実施形態による、話者110のボイスコマンドに応答して、複数のセキュリティレベルに基づいて複数のアプリケーション122、124、および126がアクセスされ得るモバイルデバイス120を示す。モバイルデバイス120はアプリケーション122、124、および126を含み、それらは、それぞれ、話者110からのボイスコマンド「バンキング」、「写真」、および「連絡先」に応答してアクセスされ得る。モバイルデバイス120がアプリケーション122、124、および126とともに示されているが、モバイルデバイス120は、1つまたは複数の機能を実行するための他のアプリケーションを含み得る。アプリケーションにアクセスするコンテキストにおける、本明細書で使用する「アクセス」という用語は、アプリケーションまたはアプリケーション中の機能を実行する(perform)こと、実行する(execute)こと、実行する(run)こと、アクティブにすること、または動作させることを指す。さらに、「ボイスコマンド」という用語は、モバイルデバイス120において実行されるべき行為を示す、話者から発せられた1つまたは複数のワードのデジタルまたはアナログ表現を指し、命令、要求、指令、キーワードなどを含む。
[028]モバイルデバイス120におけるアプリケーション122、124、および126の各々は、関連するアプリケーションにアクセスするためのセキュリティレベルで構成される。アプリケーション122、124、および126についてのセキュリティレベルの各々は、関連するアプリケーション122、124、または126にアクセスするための最小信頼性値を示すしきい値にマッピングされる。モバイルデバイス120は、話者110からのボイスコマンドが、アプリケーションに関連するしきい値に基づいて許可されたユーザからのものであることを認識され、検証されたとき、アプリケーションにアクセスし得る。本開示のいくつかの実施形態によれば、アプリケーションが高いセキュリティレベルを必要とする場合、高いしきい値にマッピングされた高いセキュリティレベルが割り当てられ得る。
[029]図示の実施形態では、モバイルデバイス120は、話者110からの関連するボイスコマンドに応答して、話者110が、許可されたユーザとしてアプリケーション122、124、および126にアクセスすることを可能にするように構成される。図示のように、話者110は、モバイルデバイス120におけるアプリケーション122、124、または126にアクセスするための入力音としてボイスコマンドを話し得る。モバイルデバイス120が、アプリケーション122、124、および126のうちの1つにアクセスするためのコマンドとして入力音中のボイスコマンドを認識するとき、モバイルデバイス120は、ボイスコマンドが許可されたユーザのボイスコマンドである可能性を示す、ボイスコマンドの信頼性値を決定する。ボイスコマンドの信頼性値が、アプリケーション122、124、または126に関連するしきい値を超えた場合、モバイルデバイス120は、ボイスコマンドに関連するアプリケーション122、124、または126にアクセスする。
[030]図1では、モバイルデバイス120は、話者110からのボイスコマンドに応答して、異なるセキュリティレベルをもつアプリケーション122、124、および126にアクセスする。たとえば、モバイルデバイス120は、話者110からの入力音としてボイスコマンド「バンキング」を受信し得る。モバイルデバイス120は、最高セキュリティレベルを示すセキュリティレベル「1」を有するバンキングアプリケーション122にアクセスするためのコマンドとしてボイスコマンドを認識し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「1」に関連するしきい値よりも高いと決定された場合、モバイルデバイス120は、ボイスコマンドが許可されたユーザからのものであることを検証し、話者110のためのバンキングアプリケーション122にアクセスする。
[031]別の例では、モバイルデバイス120がボイスコマンド「写真」を入力音として受信したとき、モバイルデバイス120は、中間セキュリティレベルを示すセキュリティレベル「3」を有する写真アプリケーション124にアクセスするためのコマンドとしてボイスコマンドを認識し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「3」に関連するしきい値よりも高いと決定された場合、モバイルデバイス120は、ボイスコマンドが許可されたユーザからのものであることを検証し、写真アプリケーション124にアクセスする。
[032]さらに、受信された入力音がボイスコマンド「連絡先」を含む場合、モバイルデバイス120は、セキュリティレベル「5」に関連する連絡先アプリケーション126にアクセスするためのコマンドとしてボイスコマンドを認識し得る。たとえば、セキュリティレベル「5」は最低セキュリティレベルを示し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「5」に関連するしきい値よりも高いと決定された場合、モバイルデバイス120は、ボイスコマンドが許可されたユーザからのものであることを検証し、連絡先アプリケーション126にアクセスする。
[033]図2に、本開示の一実施形態による、話者のボイスコマンドに応答してアプリケーションについてのセキュリティレベルのしきい値を調整することによって複数のアプリケーションへのアクセスを制御するように構成された電子デバイス200のブロック図を示す。電子デバイス200は、音センサー210と、I/Oユニット220と、通信ユニット230と、プロセッサ240と、記憶ユニット270とを含む。電子デバイス200は、セルラーフォン、スマートフォン、ラップトップコンピュータ、パーソナルコンピュータ、タブレットコンピュータ、ゲームデバイスおよびマルチメディアデバイスを含み得るモバイルデバイス、スマートテレビジョン、パーソナルコンピュータなど、音キャプチャおよび処理能力を装備した任意の好適なデバイスであり得る。
[034]プロセッサ240はデジタル信号プロセッサ(DSP:digital signal processor)250とデータベース更新ユニット260とを含み、電子デバイス200を管理し、動作させるためのアプリケーションプロセッサ(AP:application processor)または中央処理ユニット(CPU)であり得る。DSP250は音声検出器252とボイスアクティベーションユニット254とを含む。一実施形態では、DSP250は、入力音ストリームを処理する際の電力消費を低減するための低電力プロセッサである。この構成では、DSP250中のボイスアクティベーションユニット254は、入力音ストリーム中のボイスコマンドが認識され、検証されたとき、記憶ユニット270に記憶されたバンキングアプリケーション272、写真アプリケーション274、および連絡先アプリケーション276などのアプリケーションにアクセスするように構成される。
[035]音センサー210は、入力音ストリームを受信し、それをDSP250中の音声検出器252に与えるように構成され得る。音センサー210は、1つまたは複数のマイクロフォン、または入力音ストリームを受信し、キャプチャし、検知し、および/または検出するために使用され得る他のタイプの音センサーを含み得る。さらに、音センサー210は、そのような機能を実行するための任意の好適なソフトウェアおよび/またはハードウェアを採用し得る。
[036]一実施形態では、音センサー210は、デューティサイクルに従って入力音ストリームを周期的に受信するように構成され得る。この場合、音センサー210は、入力音ストリームの受信された部分の強度がしきい値強度よりも大きいかどうかを決定し得る。受信された部分の強度がしきい値強度を超えたとき、音センサー210は音声検出器252をアクティブにし、受信された部分をDSP250中の音声検出器252に与える。代替的に、音センサー210は、入力音ストリームの一部分を周期的に受信し、音声検出器252をアクティブにして、受信された部分の強度がしきい値強度を超えるかどうかを決定することなしに、受信された部分を音声検出器252に与え得る。本明細書で使用する「音ストリーム」という用語は、一連の1つまたは複数の音信号または音データを指す。
[037]DSP250中の音声検出器252は、音センサー210から入力音ストリームの一部分を受信するように構成される。一実施形態では、音声検出器252は、受信された部分から複数の音特徴を抽出し、ガウス混合モデル(GMM:Gaussian mixture model)ベースの分類器、ニューラルネットワーク、隠れマルコフモデル(HMM:hidden Markov model)、グラフィカルモデル、およびサポートベクターマシン(SVM:Support Vector Machine)などの任意の好適な音分類方法を使用することによって、抽出された音特徴が人間音声など、当該の音を示すかどうかを決定し得る。受信された部分が当該の音であると決定された場合、音声検出器252はボイスアクティベーションユニット254をアクティブにし、入力音ストリームの受信された部分および残りの部分はボイスアクティベーションユニット254に与えられる。いくつかの他の実施形態では、音声検出器252はDSP250において省略され得る。この場合、受信された入力音ストリームの強度がしきい値強度よりも大きいとき、音センサー210はボイスアクティベーションユニット254をアクティブにし、受信された入力音ストリームをボイスアクティベーションユニット254に直接与える。
[038]アプリケーションにアクセスするためのボイスコマンドを認識する際に使用するために、記憶ユニット270は、ボイスコマンドの複数の部分に関連する複数の状態に関する状態情報とともに、アプリケーションの各々についてのボイスコマンド(たとえば、ターゲットキーワード)を記憶する。一実施形態では、記憶ユニット270は、ボイスコマンドを認識するための音声または音響モデルを記憶し得る。音声または音響モデルは、ボイスコマンドの音声特性を表すモデルであり、そのような音声特性の統計モデルであり得る。
[039]音声または音響モデルの場合、ボイスコマンドは、単音(phone)、音素(phoneme)、またはそれらのサブ単位など、複数の基本音単位に分割され得る。この場合、ボイスコマンドを表す複数の部分は、基本音単位に基づいて生成され得る。ボイスコマンドの基本音単位の各々は、任意の好適な音声認識方法隠れマルコフモデル(HMM)、ガウス混合モデル(GMM)セミマルコフモデル(SMM)などを使用して分析され得る。分析に基づいて、基本音単位の各々の平均および分散が決定され得る。ボイスコマンドについての基本音単位についての決定された平均および分散は、ボイスコマンドについての音声または音響モデルを生成するために使用される。
[040]記憶ユニット270はまた、プロセッサ240によってアクセスされ得るバンキングアプリケーション272と、写真アプリケーション274と、連絡先アプリケーション276とを記憶する。図示の実施形態では、記憶ユニット270はバンキングアプリケーション272と、写真アプリケーション274と、連絡先アプリケーション276とを記憶するが、記憶ユニット270は、プロセッサ240によって実行され得る他のアプリケーションまたは機能をも記憶し得る。記憶ユニット270は、RAM(ランダムアクセスメモリ)、ROM(読取り専用メモリ)、EEPROM(登録商標)(電気的消去可能プログラマブル読取り専用メモリ)、フラッシュメモリ、またはSSD(ソリッドステートドライブ)など、任意の好適なストレージまたはメモリデバイスを使用して実装され得る。
[041]さらに、記憶ユニット270は、ボイスアクティベーションユニット254とデータベース更新ユニット260とによってアクセスされるアプリケーションアクセスデータベース278を記憶し得る。アプリケーションアクセスデータベース278は、ボイスコマンドをアプリケーションに関連付ける情報と、アプリケーションに関連するセキュリティレベルとを含む。さらに、アプリケーションアクセスデータベース278は、話者検証データベースおよび話者モデルなど、許可されたユーザを検証するための情報をも含み得る。
[042]DSP250中のボイスアクティベーションユニット254は、音声検出器252において受信された部分から開始する入力音ストリームを受信するように構成される。次いで、アプリケーションにアクセスするためのボイスコマンドがボイスアクティベーションユニット254中の入力音ストリームから認識され得る。ボイスコマンドを認識するために、1つまたは複数の音特徴(たとえば、オーディオフィンガーフィンガープリント、MFCCベクトル)が、受信された入力音ストリームから抽出され、隠れマルコフモデル(HMM)、セミマルコフモデル(SMM)などに基づく任意の好適な音声認識方法を使用して分析され得る。
[043]ボイスコマンドが認識されると、ボイスアクティベーションユニット254は、記憶ユニット270中のアプリケーションアクセスデータベース278に基づいて、ボイスコマンドに関連する、アクセスされるべきアプリケーションと、アプリケーションに関連するセキュリティレベルと、セキュリティレベルに関連するしきい値とを識別する。たとえば、ボイスコマンド「バンキング」が認識されたとき、ボイスアクティベーションユニット254は、アプリケーションアクセスデータベース278に基づいてバンキングアプリケーション272と、関連するセキュリティレベル(たとえば、セキュリティレベル「1」)と、セキュリティレベルについてのしきい値(たとえば、しきい値「9」)とを識別し得る。
[044]ボイスアクティベーションユニット254はまた、アプリケーションアクセスデータベース278中の抽出された音特徴と話者モデルとに基づいて、ボイスコマンドの信頼性値を決定するように構成される。話者モデルは話者の音特性を表すモデルであり、そのような音特性の統計モデルであり得る。ボイスコマンドの信頼性値は、次いで、アクセスされるべきアプリケーションに関連するしきい値と比較される。信頼性値がしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。この場合、ボイスアクティベーションユニット254は、ボイスコマンドに関連するアプリケーションにアクセスするためにアクティべーション信号を生成する。ボイスコマンドが検証されたとき、ボイスアクティベーションユニット254は、アクセスされたアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドについての音特徴とをデータベース更新ユニット260に送信する。一実施形態では、ボイスコマンドについての入力音ストリームは、ボイスコマンドについての音特徴に加えてまたはそれの代わりにデータベース更新ユニット260に送信され得る。
[045]アクセスされたアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドの音特徴とを受信すると、データベース更新ユニット260は記憶ユニット270中の話者モデルを更新する。たとえば、ボイスコマンドの音特徴は、新しい音サンプルとして既存の音サンプルに追加される。統計的話者モデルの場合、話者モデルについての音サンプルの新しい平均および新しい分散は、新しい音サンプルと、既存の音サンプルの前の平均および分散とに基づいて決定され得る。データベース更新ユニット260は、次いで、更新された話者モデルを使用してセキュリティレベルについてのしきい値のうちの少なくとも1つを調整する。電子デバイス200は、次いで、アプリケーション272、274、および276にアクセスするための後続のボイスコマンドを検証するために、更新された話者モデルと調整されたしきい値とを使用し得る。
[046]図3に、本開示の一実施形態による、話者からのボイスコマンドを検証するためのアプリケーションアクセスデータベース278のブロック図を示す。アプリケーションアクセスデータベース278は、アプリケーションセキュリティデータベース310と、話者検証データベース320と、話者モデル330とを含む。アプリケーションセキュリティデータベース310は、複数のコマンド312と、複数のアプリケーション識別子314と、複数のセキュリティレベル316とを含む。話者検証データベース320は、複数のセキュリティレベル316と、複数のしきい値322と、複数の音サンプル324とを含む。
[047]アプリケーションセキュリティデータベース310は、コマンド312を、アクセスされるべきアプリケーションを示すアプリケーション識別子314にマッピングする。アプリケーション識別子314は、アクセスされるべきアプリケーションについてのセキュリティレベルを決定するためのセキュリティレベル316に関連する。一実施形態では、コマンド312、アプリケーション識別子314、およびセキュリティレベル316は、コマンド312に応答してアプリケーション識別子314とセキュリティレベル316とを決定するためのルックアップテーブルまたは任意の好適なデータ構造の形態で記憶され得る。アプリケーションセキュリティデータベース310を使用して、ボイスアクティベーションユニット254は、ボイスコマンドがコマンド312のうちの1つとして認識されたとき、アクセスされるべきアプリケーションのセキュリティレベルを決定する。
[048]話者検証データベース320では、セキュリティレベル316は、認識されたボイスコマンドの信頼性値がセキュリティレベル316に関連するアプリケーションにアクセスするために超える必要がある最小値を示すしきい値322にマッピングされる。一実施形態では、セキュリティレベルは、セキュリティレベルについての最小信頼性値を示すしきい値にマッピングされる。話者の音サンプル324は、セキュリティレベル316のしきい値322に従って話者検証データベース320中のセキュリティレベル316に割り当てられる。セキュリティレベル316と、しきい値322と、音サンプル324とを含む話者検証データベース320は、ルックアップテーブルまたは任意の好適なデータ構造の形態で記憶され得る。
[049]アプリケーションアクセスデータベース278中の話者モデル330は、話者のボイスコマンドを検証する際に使用するためのボイスコマンドの信頼性値を計算するために使用される。話者モデル330は、音サンプル324についての平均332および分散334などの統計データを含むGMMモデルであり得る。他の実施形態では、話者モデル330はまた、音サンプル324の最大値、最小値、雑音電力、SNR、信号電力、エントロピー、尖度、高次運動量などを含み得る。ボイスアクティベーションユニット254は、ボイスコマンドの信頼性値と、アクセスされるべきアプリケーションについてのセキュリティレベルのしきい値とを比較する。ボイスコマンドの信頼性値がアプリケーションのしきい値を超えた場合、ボイスアクティベーションユニット254はボイスコマンドが許可されたユーザからのものであることを検証し、アプリケーションにアクセスするためのアクティベーション信号を生成する。
[050]図4に、本開示の一実施形態による、許可されたユーザと無許可のユーザとの音サンプルに基づいて、複数のセキュリティレベルについての初期しきい値を含む話者検証データベース320をセットアップすることの図を示す。図示のように、話者検証データベース320は5つのセキュリティレベル「1」〜「5」を含み、セキュリティレベル「1」は最高セキュリティレベルである。モバイルデバイス120における各アプリケーションは、アクセスについてのセキュリティレベルのうちの1つを割り当てられ得る。話者検証データベース320は、5つのセキュリティレベルを用いて示されているが、それは任意の好適な数のセキュリティレベルを含み得る。
[051]話者検証データベース320をセットアップするために、電子デバイス200は、許可されたユーザとしての話者から複数の音サンプルS1〜S10を受信および記憶し、無許可のユーザ(すなわち、詐称者)から複数の音サンプルU1〜U10を受信および記憶する。上記で説明したように、許可されたユーザの音サンプルS1〜S10は、音サンプルの統計データ(たとえば、平均および分散)を使用して話者モデルを生成するために使用される。次いで、話者モデルに基づいて、音サンプルS1〜S10の信頼性値および音サンプルU1〜U10の信頼性値が決定される。この場合、許可されたユーザについての音サンプルの信頼性値は、概して、無許可のユーザについての音サンプルの信頼性値よりも実質的に高くなる。
[052]音サンプルS1〜S10の信頼性値および音サンプルU1〜U10の信頼性値が決定された後、最高しきい値と最低しきい値とが信頼性値の中で選択される。電子デバイス200は、最高しきい値を、許可されたユーザについての音サンプルS1〜S10の信頼性値の中の最小値であると決定し得る。その場合、最高しきい値は最高セキュリティレベル「1」にマッピングされる。一方、電子デバイス200は、最低しきい値を、無許可のユーザについての音サンプルU1〜U10の信頼性値の中の最大値であると決定し得る。この場合、最低しきい値は最低セキュリティレベル「5」にマッピングされる。
[053]最高セキュリティレベル「1」と最低セキュリティレベル「5」とにそれぞれ対応する最高しきい値と最低しきい値との間の間隔は、次いで、セキュリティレベル「1」と「5」との間の中間セキュリティレベル「2」、「3」、および「4」についてのしきい値を決定するために区分または分割され得る。一実施形態では、電子デバイス200は、最高しきい値と最低しきい値との間の差を等しく区分することによって、セキュリティレベル「2」、「3」、および「4」についてのしきい値を決定する。この場合、しきい値増分を計算するために、差は4(すなわち、中間セキュリティレベルの数+1)で除算される。次いで、中間セキュリティレベル「2」、「3」、および「4」についてのしきい値を決定するために、1つまたは複数のしきい値増分が最低しきい値に加算され得る。代替的に、中間セキュリティレベル「2」、「3」、および「4」についてのしきい値を決定するために、1つまたは複数のしきい値増分が最高しきい値から減算され得る。このようにして、セキュリティレベルの各々は、セキュリティレベルについての最小信頼性値を示すそれの関連するしきい値によって増分的に定義され得る。
[054]図5に、本開示の一実施形態による、話者からのボイスコマンドが検証されたときにアプリケーションにアクセスするように構成されたボイスアクティベーションユニット254のブロック図を示す。ボイスアクティベーションユニット254は、コマンド検出ユニット510と、セキュリティレベル決定ユニット520と、話者検証ユニット530とを含む。コマンド検出ユニット510は、入力音ストリームから、アプリケーションにアクセスするためのボイスコマンドを認識し、セキュリティレベル決定ユニット520はアプリケーションについてのセキュリティレベルを決定する。次いで、話者検証ユニット530は、ボイスコマンドが許可されたユーザからのものであることを検証された場合、アプリケーションにアクセスする。
[055]ボイスアクティベーションユニット254では、コマンド検出ユニット510は、音声検出器252から入力音ストリームを受信し、入力音ストリームから、アプリケーションにアクセスするためのボイスコマンドを認識するように構成される。ボイスコマンドを認識するために、コマンド検出ユニット510は、受信された入力音ストリームから1つまたは複数の音特徴(たとえば、オーディオフィンガーフィンガープリント、MFCCベクトル)を抽出する。抽出された音特徴は、次いで、ボイスコマンドを認識するために、HMM、SMMなどに基づく任意の好適な音声認識方法を使用して分析される。一実施形態では、コマンド検出ユニット510は、入力音ストリームを音素などの複数の基本音単位に分割し、次いで、ボイスコマンドを認識するために、記憶ユニット270に記憶されたボイスコマンドについての音声または音響モデルにアクセスし得る。ボイスコマンドが認識された場合、コマンド検出ユニット510は、認識されたボイスコマンドをセキュリティレベル決定ユニット520に送信する。一実施形態では、抽出された音特徴は、ボイスコマンドを検証する際に使用するために話者検証ユニット530に送信され得る。
[056]セキュリティレベル決定ユニット520は、ボイスコマンドを受信し、認識されたボイスコマンドに基づいて、アクセスされるべきアプリケーションを識別する。一実施形態では、複数のコマンドと、ボイスコマンドに関連するアプリケーション識別子と、アプリケーションについてのセキュリティレベルとが記憶ユニット270のアプリケーションセキュリティデータベース310に記憶される。ボイスコマンドに基づいて、セキュリティレベル決定ユニット520は、アプリケーションセキュリティデータベース310から、アクセスされるべきアプリケーションを識別する。セキュリティレベル決定ユニット520はまた、アプリケーションセキュリティデータベース310から、アクセスされるべきアプリケーションに関連するセキュリティレベルを決定し得る。次いで、アプリケーションにアクセスするためのアプリケーション識別子、およびそれのセキュリティレベルが話者検証ユニット530に送信される。
[057]話者検証ユニット530は、入力音ストリームと、それのセキュリティレベルをもつアプリケーション識別子とを受信し、ボイスコマンドが、アプリケーションにアクセスすることを許可されたユーザからのものであるかどうかを検証するように構成される。話者検証ユニット530は、話者モデル330に基づいて入力音ストリーム中のボイスコマンドの信頼性値を決定し、入力音ストリームから抽出された音特徴を決定し得る。この場合、話者検証ユニット530は、入力音ストリームから音特徴を抽出するか、またはコマンド検出ユニット510から受信された抽出された音特徴を使用し得る。一実施形態では、音特徴の各々についての信頼性値は、話者モデル330に基づいて計算され得、音特徴の信頼性値の平均値は、ボイスコマンドについての信頼性値として使用され得る。
[058]話者検証ユニット530はまた、記憶ユニット270中の話者検証データベース320からアプリケーション識別子のセキュリティレベルについてのしきい値を取得するように構成される。話者検証ユニット530は、次いで、信頼性値がしきい値を超えるかどうかを決定するために、しきい値とボイスコマンドの信頼性値とを比較する。信頼性値がしきい値を超えない場合、ボイスコマンドは、許可されたユーザからのものであることを検証されない。この場合、話者検証ユニット530は、アプリケーションにアクセスするためのボイスコマンドをさらに認証するために話者から追加の入力を受信し得る。話者が検証されない場合、アプリケーションはアクセスされない。
[059]一方、ボイスコマンドの信頼性値がしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。話者検証ユニット530は、次いで、ボイスコマンドに応答して識別されたアプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、話者検証ユニット530は、アクセスされるアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドについての新しい音サンプルとしての音特徴とをデータベース更新ユニット260に送信する。
[060]図6に、本開示の一実施形態による、電子デバイス200においてボイスコマンドに基づいてアプリケーションに対するアクセスを制御するための方法600のフローチャートを示す。電子デバイス200は複数のアプリケーションを備える。アプリケーションの各々は、アプリケーションにアクセスするためのしきい値として最小信頼性値を有するセキュリティレベルに関連する。
[061]610において、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを含む入力音ストリームを受信する。ボイスコマンドが、ターゲットアプリケーションにアクセスするためのコマンドとして認識されると、次いで、620において、ボイスコマンドが、許可されたユーザの話者モデル330に基づいて、許可されたユーザを示すかどうかを検証する。ボイスコマンドが検証された場合、ターゲットアプリケーションにアクセスするためのアクティベーション信号が生成され、ターゲットアプリケーションはアクセスされる。さらに、630において、ボイスコマンドが検証された場合、新しい音サンプルとしてボイスコマンドを用いて話者モデル330を更新する。640において、更新された話者モデルに基づいて、セキュリティレベルについてのしきい値のうちの少なくとも1つを調整する。したがって、電子デバイス200は、アプリケーションにアクセスするための後続のボイスコマンドを検証するために、更新された話者モデルと調整されたしきい値とを使用し得る。
[062]図7は、本開示の一実施形態による、話者からのボイスコマンドを検証することによってアプリケーションにアクセスするように構成された話者検証ユニット530のブロック図である。話者検証ユニット530はボイス検証ユニット710と2次検証ユニット740とを含む。ボイス検証ユニット710は、信頼性決定ユニット720とアプリケーションアクセスコントローラ730とをさらに含む。
[063]ボイス検証ユニット710は、セキュリティレベル決定ユニット520から、アクセスされるべきアプリケーションを示すアプリケーション識別子と、アプリケーションのセキュリティレベルとを受信する。さらに、ボイス検証ユニット710は、音声検出器252から入力音ストリームを受信し、入力音ストリームから音特徴を抽出し得る。代替的に、ボイス検証ユニット710は、コマンド検出ユニット510から、抽出された音特徴を受信し得る。次いで、信頼性決定ユニット720は、抽出された音特徴と記憶ユニット270からの話者モデル330とに基づいて、ボイスコマンドの信頼性値を決定する。次いで、ボイスコマンドの信頼性値はアプリケーションアクセスコントローラ730に送信される。
[064]信頼性決定ユニット720はボイスコマンドの信頼性値を決定する。一実施形態では、信頼性決定ユニット720は、話者モデル330に基づく音特徴の各々についての信頼性値と、音特徴の信頼性値の平均値とを計算し得る。この場合、平均信頼性値はボイスコマンドについての信頼性値として使用され得る。たとえば、話者モデル330が、平均と分散とを含むGMMモデルであるとき、信頼性決定ユニット720は、音特徴が信頼性値としてGMMモデルに属する可能性を計算する。次いで、ボイスコマンドの音特徴についての信頼性値は、音特徴についての平均信頼性値を生成するために平均化され得る。他の実施形態では、信頼性決定ユニット720は、隠れマルコフモデル、パターンマッチングアルゴリズム、ニューラルネットワーク、ベクトル量子化および決定ツリー、アンチ話者技法(anti-speaker technique)(たとえば、ユニバーサルバックグラウンドモデル(universal background model))など、ボイスコマンドの信頼性値を決定するための任意の他の好適なアルゴリズムを使用し得る。
[065]話者検証データベース320から、アプリケーションアクセスコントローラ730は、アクセスされるべきアプリケーションについてのセキュリティレベルのしきい値を取得する。次いで、セキュリティレベルのしきい値とボイスコマンドの信頼性値とが比較される。信頼性値がセキュリティレベルのしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。この場合、アプリケーションアクセスコントローラ730は、アプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、話者モデル330を更新し、セキュリティレベルについてのしきい値のうちの少なくとも1つを調整するために、信頼性値、アプリケーションのセキュリティレベル、および新しい音サンプルとしての音特徴はデータベース更新ユニット260に送信される。
[066]一方、入力音の信頼性値がセキュリティレベルのしきい値を超えない場合、ボイス検証ユニット710は、ボイスコマンドが許可されたユーザからのものであることを検証するために話者から追加の入力を受信するように2次検証ユニット740に通知する。その場合、2次検証ユニット740は、I/Oユニット220を介して、追加のボイスサンプル、パスワード、虹彩走査、指紋走査、顔走査などを含む生体走査など、1つまたは複数の入力を与えるように話者に要求し得る。
[067]話者から入力が受信されると、2次検証ユニット740は、追加の入力が許可されたユーザからのものであるかどうかを決定するように構成される。たとえば、2次検証ユニット740が検証のためのパスワードを要求した場合、話者は、I/Oユニット220におけるキーパッドを介してパスワードを入力し得る。入力されたパスワードが、記憶ユニット270に記憶された許可されたユーザのパスワードと同じであるとき、2次検証ユニット740は、ボイスコマンドの話者が許可されたユーザであることを検証されたことをアプリケーションアクセスコントローラ730に通知する。別の例では、追加のボイスサンプルが受信されたとき、それは、追加のボイスサンプルが許可されたユーザからのものであることを検証するために、ボイス検証ユニット710に送信され得る。
[068]追加の話者検証に基づいて、2次検証ユニット740は、最初に検証されなかったボイスコマンドが、アプリケーションにアクセスすることを許可されたユーザからのものであることを検証し得る。ボイスコマンドの話者が追加の話者検証に基づいて検証された場合、2次検証ユニット740は、ボイスコマンドの話者が検証されたことをボイス検証ユニット710に通知する。それに応じて、アプリケーションアクセスコントローラ730は、アプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、アプリケーションアクセスコントローラ730は、信頼性値と、アプリケーションのセキュリティレベルと、新しい音サンプルとしてのボイスコマンドの音特徴とをデータベース更新ユニット260に送信する。
[069]図8に、本開示の一実施形態による、検証されたボイスコマンドに基づいて、話者モデル330を更新し、セキュリティレベル316についてのしきい値322を調整するように構成されたデータベース更新ユニット260のブロック図を示す。検証されたボイスコマンドに応答して、話者モデル330が更新され、セキュリティレベル316についてのしきい値322が調整されたとき、それらは、アプリケーションにアクセスするための後続のボイスコマンドを検証するために使用され得る。データベース更新ユニット260は話者モデル更新ユニット810としきい値調整ユニット820とを含む。
[070]話者モデル更新ユニット810は、検証されたボイスコマンドについての新しい音サンプルと、新しい音サンプルについて決定された信頼性値とを受信するように構成される。話者モデル更新ユニット810は、次いで、新しい音サンプルを追加することによって、話者検証データベース320の音サンプル324を更新する。一実施形態では、音サンプル324は、それらの信頼性値に基づいて、関連するセキュリティレベル316にマッピングされる。たとえば、新しい音サンプルに関連する信頼性値が9.1であり、セキュリティレベル「1」のしきい値が9.0である場合、新しい音サンプルはセキュリティレベル「1」にマッピングされる。
[071]図示のように、話者モデル更新ユニット810は、平均332と分散334とに基づいて新しい平均と新しい分散とを決定し、新しい音サンプルの信頼性値を決定することによって、話者モデル330を更新する。代替的に、話者モデル更新ユニット810は、話者モデル330についての新しい平均と新しい分散とを決定するために、更新された音サンプル324を使用し得る。話者モデル330の新しい平均と分散とを決定する際に、新しい音サンプルは、それの信頼性値に従って重み付けされ得る。たとえば、新しい音サンプルの信頼性値が低い場合、新しい音サンプルは、話者モデル330の新しい平均と分散とを計算する際に低い重みを与えられ得る。一方、新しい音サンプルの信頼性値が高い場合、新しい音サンプルは、話者モデル330の新しい平均と分散とを計算する際に高い重みを与えられ得る。
[072]いくつかの実施形態では、話者モデル330の平均332および分散334は、最大事後確率(MAP:Maximum a posteriori)適応技法を使用することによって更新され得る。この場合、平均332および/または分散334は、前の平均および/または分散と、新しい音サンプルを使用して計算される新しい平均および/または分散との線形結合を実行することによって更新される。前の平均および/または分散と新しい平均および/または分散との各々は、新しい音サンプルの信頼性値に基づいて別様に重み付けされる。たとえば、新しい音サンプルの信頼性値が高い場合、新しい平均についての大きい係数値が、線形結合を実行するときに使用され得る。新しい音サンプルを使用して、話者モデル330の平均332および分散334は、次いで更新され得る。話者モデル更新ユニット810はまた、話者モデル330が更新されたことをしきい値調整ユニット820に通知する。
[073]しきい値調整ユニット820は、話者モデル更新ユニット810から更新通知を受信するように構成される。しきい値調整ユニット820は、次いで、更新された音サンプル324についての信頼性値を再計算するために、更新された話者モデル330にアクセスする。一実施形態では、しきい値調整ユニット820は、アクセスされたアプリケーションのセキュリティレベルに関連する音サンプルについての信頼性値を再計算し得る。再計算された信頼性値は、次いで、アクセスされたアプリケーションのセキュリティレベルについての新しいしきい値を決定するために使用され得る。たとえば、新しいしきい値は、再計算された信頼性値の中の最小信頼性値であり得る。したがって、最小信頼性値がセキュリティレベルについての前のしきい値とは異なる場合、しきい値は、再計算された信頼性値の中の最小信頼性値に調整され得る。
[074]代替的に、しきい値調整ユニット820は、話者検証データベース320中の音サンプル324についての信頼性値を再計算し得る。この場合、話者検証データベース320中のセキュリティレベル316についてのしきい値322は、セキュリティレベル316のための新しい最小信頼性値を反映するように調整され得る。別の実施形態では、しきい値調整ユニット820は、新しい音サンプルがマッピングされる、セキュリティレベルに関連する音サンプル324についての信頼性値を再計算し得る。このセキュリティレベルについてのしきい値は、セキュリティレベルに関連する音サンプルについての再計算された信頼性値の中の最小信頼性値になるように調整されることになる。
[075]図9に、本開示の一実施形態による、検証されたボイスコマンドについての新しい音サンプルを用いて更新され得る話者検証データベース320の図を示す。話者検証データベース320は、しきい値9.0、7.0、5.0、3.0、および1.0にそれぞれ関連する5つのセキュリティレベル「1」〜「5」を含む。しきい値の各々は、関連するセキュリティレベルについての最小信頼性値を示す。セキュリティレベル「1」〜「5」はまた、音サンプルグループ910、920、930、940、および950にそれぞれ関連する。音サンプルグループ910、920、930、940、および950の各々は、FIFO(先入れ先出し)データ構造を使用するキュー、バッファなどの形態で実装され得、0から所定の数までの音サンプルのセットを含み得る。
[076]図示の話者検証データベース320では、音サンプルグループ910、920、930、940、および950の各々は最高4つの音サンプルを含み得るが、それはまた、任意の好適な数の音サンプルを含み得る。図9の例では、音サンプルグループ910、920、930、940、および950は、話者検証データベース320の初期セットアップの後に、前に検証されたボイスコマンドについての音サンプルを含む。話者からの後続のボイスコマンドがさらに検証されるので、検証されたコマンドについての音特徴は、話者検証データベース320に新しい音サンプルとして追加され得る。
[077]音サンプルは、それらの信頼性値とセキュリティレベル「1」〜「5」についてのしきい値とに基づいて音サンプルグループ910〜950に割り当てられる。たとえば、音サンプルの信頼性値よりも小さいしきい値を有する1つまたは複数のセキュリティレベルを決定するために、音サンプルの信頼性値がセキュリティレベル「1」〜「5」についてのしきい値と比較され得る。音サンプルは、次いで、決定されたしきい値の中の最高しきい値を有するセキュリティレベルに関連する音サンプルグループに割り当てられる。たとえば、音サンプルS3_2の信頼性値が6.3である場合、しきい値5.0、3.0、および1.0は、信頼性値6.3よりも小さいと決定される。音サンプルS3_2は、次いで、決定されたしきい値5.0、3.0、および1.0の中の最高しきい値5.0を有するセキュリティレベル「3」に関連する音サンプルグループ930に割り当てられる。
[078]最初に、図4に示されているように、セキュリティレベルおよびそれらの初期しきい値は、許可されたユーザの音サンプルと無許可のユーザの音サンプルとに基づいて決定される。ボイスコマンドが受信され、検証されるとき、話者検証データベース320は、次いで、それらの信頼性値に基づいて、検証されたボイスコマンドについての音サンプルを音サンプルグループ910、920、930、940、および950に割り当てる。話者検証データベース320では、音サンプルグループ910、920、930、940、および950は、それぞれ、3つの音サンプル(たとえば、S1_1、S1_2、およびS1_3)と、2つの音サンプル(たとえば、S2_1およびS2_2)と、4つの音サンプル(たとえば、S3_1、S3_2、S3_3、およびS3_4)と、1つの音サンプル(たとえば、S4_1)と、4つの音サンプル(たとえば、S5_1、S5_2、S5_3、およびS5_4)とを含む。
[079]検証されたボイスコマンドについての新しい音サンプルおよびそれの信頼性値が受信されたとき、音サンプルグループは新しい音サンプルの信頼性値に基づいて決定される。新しい音サンプルは、次いで、決定された音サンプルグループに追加されることになる。たとえば、8.2の信頼性値をもつ新しい音サンプルS_INが受信された場合、新しい音サンプルは、7.0のしきい値をもつセキュリティレベル「2」の音サンプルグループ920に追加される。音サンプルグループが、音サンプルグループ930および950の場合のようにいっぱいである場合、新しい音サンプルを追加するために、既存の音サンプルが削除され得る。そのようなイベントでは、既存の音サンプルは先入れ先出しに基づいて削除され得る。たとえば、新しい音サンプル(たとえば、S3_5)が、最高4つの音サンプルS3_1〜S3_4を有する音サンプルグループ930に追加されるべきであるとき、第1の音サンプルS3_1は削除され得、新しい音サンプルが音サンプルグループ930に追加され得る。
[080]話者検証データベース320中の音サンプルが更新された後、データベース更新ユニット260は話者モデル330の統計データを更新し得る。一実施形態では、話者モデル330は、新たに追加された音サンプルの信頼性値を用いて更新され得る。たとえば、話者モデル330の新しい統計データは、新しい音サンプルと前の統計データとに基づいて計算され得る。新しい音サンプルのために場所を空けるために既存の音サンプルが削除された場合、新しい統計データは、削除された音サンプルと新しい音サンプルと前の統計データとに基づいて計算され得る。いくつかの実施形態では、新しい音サンプルは、新しい音サンプルの信頼性値に比例して重み付けされ得る。
[081]図10に、本開示の一実施形態による、ボイスコマンドについての信頼性値に基づいて話者モデル330を更新するための方法1000のフローチャートを示す。ボイスアクティベーションユニット254は、ボイスコマンドについての信頼性値を決定することによってボイスコマンドを検証する。ボイスコマンドが検証されると、ボイスアクティベーションユニット254は、検証されたボイスコマンドについての1つまたは複数の音特徴を新しい音サンプルとしてデータベース更新ユニット260に与える。
[082]図10に示されているように、1010において、データベース更新ユニット260は、検証されたボイスコマンドについての新しい音サンプルを受信する。さらに、データベース更新ユニット260はまた、ボイスアクティベーションユニット254から、検証されたボイスコマンドについての信頼性値を受信する。受信された新しい音サンプルおよび信頼性値は、話者モデル330を更新する際に使用される。このプロセスでは、1020において、ボイスコマンドについての信頼性値に比例して新しい音サンプルを重み付けする。次いで、1030において、重み付けされた新しい音サンプルに基づいて話者モデル330を更新する。
[083]図11に、本開示の一実施形態による、新しい音サンプルS_INを受信したことに応答して、新しい音サンプルS_INのセキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース320の図を示す。この実施形態では、新しい音サンプルS_INは、話者検証データベース320を更新するために、それの信頼性値に従って、セキュリティレベル「1」に関連する音サンプルグループ910に追加される。上記で説明したように、話者モデル330は、次いで、話者検証データベース320中の新しい音サンプルS_INに基づいて更新され得る。
[084]話者モデル330が更新された後、データベース更新ユニット260は、新しい音サンプルS_INを含むセキュリティレベル「1」についての音サンプルグループ910に関連するしきい値9.0を更新する。この場合、セキュリティレベル「1」に関連する音サンプルグループ910中の音サンプル(たとえば、S1_1、S1_2、S1_3、およびS_IN)についての信頼性値は、更新された話者モデル330を使用して再計算される。次いで、再計算された信頼性値の中の最小信頼性値が、セキュリティレベル「1」についての新しいしきい値として選択され得る。したがって、セキュリティレベル「1」についての前に設定された9.0のしきい値が最小信頼性値とは異なる場合、図11中の矢印によって示されるように、しきい値は最小信頼性値に調整され得る。
[085]図12に、本開示の一実施形態による、新しい音サンプルS_INを受信したことに応答して、新しい音サンプルS_INのセキュリティレベルとは異なるセキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース320の図を示す。図11と同様に、新しい音サンプルS_INは、話者検証データベース320を更新するために、それの信頼性値に従って、セキュリティレベル「1」に関連する音サンプルグループ910に追加される。また、話者モデル330は、話者検証データベース320中の新しい音サンプルS_INに基づいて更新され得る。
[086]図示の実施形態では、データベース更新ユニット260は、ボイスアクティベーションユニット254から、検証されたボイスコマンドに関連するアプリケーションに関連するセキュリティレベルを受信する。この例では、アプリケーションに関連するセキュリティレベルは、セキュリティレベル「3」であると仮定される。したがって、データベース更新ユニット260は、セキュリティレベル「3」についての音サンプルグループ930に関連するしきい値5.0を更新する。この場合、セキュリティレベル「3」に関連する音サンプルグループ930中の音サンプル(たとえば、S3_1、S3_2、S3_3、およびS3_4)についての信頼性値は、更新された話者モデル330を使用して再計算される。次いで、再計算された信頼性値の中の最小信頼性値が、セキュリティレベル「3」についての新しいしきい値として選択され得る。したがって、セキュリティレベル「3」についての前に設定された5.0のしきい値が最小信頼性値とは異なる場合、図12中の矢印によって示されるように、しきい値は最小信頼性値に調整され得る。
[087]図13に、本開示の一実施形態による、新しい音サンプルS_INを受信したことに応答して、セキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース320の図を示す。図11と同様に、新しい音サンプルS_INは、話者検証データベース320を更新するために、それの信頼性値に従って、セキュリティレベル「1」に関連する音サンプルグループ910に追加される。また、話者モデル330は、話者検証データベース320中の新しい音サンプルS_INに基づいて更新され得る。
[088]更新された話者モデルを用いて、データベース更新ユニット260は、セキュリティレベル「1」〜「5」についての音サンプルグループ910、920、930、940、および950に関連するしきい値(たとえば、9.0、7.0、5.0、3.0、および1.0)を更新する。この場合、音サンプルグループ910(たとえば、S1_1、S1_2、S1_3、およびS_IN)、音サンプルグループ920(たとえば、S2_1およびS2_2)、音サンプルグループ930(たとえば、S3_1、S3_2、S3_3、およびS3_4)、音サンプルグループ940(たとえば、S4_1)、ならびに音サンプルグループ950(たとえば、S5_1、S5_2、S5_3、およびS5_4)中の音サンプルについての信頼性値は、更新された話者モデル330に基づいて再計算される。音サンプルグループ910、920、930、940、および950の各々における音サンプルについての再計算された信頼性値の中で最小信頼性値が選択され、選択された最小信頼性値は、それぞれ、セキュリティレベル「1」〜「5」についての新しいしきい値であると決定される。したがって、セキュリティレベル「1」〜「5」についてのしきい値は、図13中の矢印によって示されるようにセキュリティレベル「1」〜「5」についての新しい最小信頼性値を反映するように調整され得る。
[089]別の実施形態では、話者検証データベース320は、すべての前に検証されたボイスコマンドをもつ音サンプルグループを音サンプルとして含み得る。新しい音サンプルが受信および検証されたとき、新しい音サンプルは音サンプルグループに追加される。上記で説明したように、話者モデル330は、話者検証データベース320中の新しい音サンプルに基づいて更新され得る。
[090]更新された話者モデル330に基づいて、新しい音サンプルを含む音サンプルグループ中の音サンプルのすべてについての信頼性値が決定され得る。最低信頼性値および最高信頼性値が信頼性値の中で選択され得、最低値は、最低セキュリティレベル(たとえば、セキュリティレベル「5」)についてのしきい値であると決定され得る。最高信頼性値と最低信頼性値との間の差は、次いで、各範囲が下限を有する複数の範囲に区分され得る。いくつかの実施形態では、差は、しきい値増分を計算するために、セキュリティレベルの数で除算され得る。下限は、次いで、セキュリティレベル(たとえば、セキュリティレベル「1」、「2」、「3」、および「4」)についてのしきい値として割り当てられ得る。
[091]図14に、本開示の一実施形態による、複数のセキュリティレベルについての複数のしきい値を調整するための方法1400のフローチャートを示す。ボイスコマンドが検証された後、データベース更新ユニット260は、検証されたボイスコマンドについての新しい音サンプルを受信する。新しい音サンプルは、次いで、それの信頼性値に従ってセキュリティレベルに関連する音サンプルグループに追加され、話者モデル330は、新しい音サンプルに基づいて更新される。
[092]次いで、1410において、更新された話者モデル330に基づいて、複数のセキュリティレベルの中で選択されたセキュリティレベルに関連する音サンプルの各々についての新しい信頼性値を決定する。一実施形態では、セキュリティレベルは、新しい音サンプルの信頼性値に従って選択される。別の実施形態では、ボイスコマンドのアプリケーションにマッピングされたセキュリティレベルが複数のセキュリティレベルの中で選択される。代替的に、データベース更新ユニット260は、セキュリティレベルを選択することなしにすべてのセキュリティレベルについての音サンプルの新しい信頼性値を決定し得る。
[093]1420において、選択されたセキュリティレベルに関連する音サンプルについての新しい信頼性値の中で最小信頼性値を選択する。次いで、1430において、選択されたセキュリティレベルの前のしきい値を最小信頼性値に調整する。すべてのセキュリティレベルについての新しい信頼性値を決定する場合、セキュリティレベルの各々についての新しい信頼性値の中で最小信頼性値が選択され、選択された最小信頼性値は、それぞれ、セキュリティレベルについての新しいしきい値であると決定される。
[094]図15は、本開示のいくつかの実施形態による、アプリケーションへのアクセスを制御するための方法および装置が実装され得る例示的なモバイルデバイス1500のブロック図である。モバイルデバイス1500の構成は、図1〜図14を参照しながら説明した上記の実施形態に従ってモバイルデバイス中で実装され得る。モバイルデバイス1500は、セルラーフォン、スマートフォン、端末、ハンドセット、携帯情報端末(PDA)、ワイヤレスモデム、コードレスフォンなどであり得る。ワイヤレス通信システムは、符号分割多元接続(CDMA)システム、モバイル通信用ブロードキャストシステム(GSM(登録商標):Broadcast System for Mobile Communications)システム、広帯域CDMA(WCDMA(登録商標))システム、ロングターンエボリューション(LTE(登録商標):Long Tern Evolution)システム、LTE Advancedシステムなどであり得る。さらに、モバイルデバイス1500は、たとえば、Wi−Fi Direct(登録商標)、Bluetooth(登録商標)、またはFlashLinq技術を使用して、別のモバイルデバイスと直接通信し得る。
[095]モバイルデバイス1500は、受信経路および送信経路を介して双方向通信を行うことが可能である。受信経路上では、基地局によって送信された信号は、アンテナ1512によって受信され、受信機(RCVR)1514に与えられる。受信機1514は、受信信号を調整し、デジタル化し、さらなる処理のために調整およびデジタル化されたデジタル信号などのサンプルをデジタルセクションに与える。送信経路上では、送信機(TMTR)1516は、デジタルセクション1520から送信されるべきデータを受信し、データを処理し、調整し、被変調信号を生成し、被変調信号はアンテナ1512を介して基地局に送信される。受信機1514および送信機1516は、CDMA、GSM、LTE、LTEアドバンストなどをサポートし得るトランシーバの一部であり得る。
[096]デジタルセクション1520は、たとえば、モデムプロセッサ1522、縮小命令セットコンピュータ/デジタル信号プロセッサ(RISC/DSP)1524、コントローラ/プロセッサ1526、内部メモリ1528、一般化オーディオエンコーダ1532、一般化オーディオデコーダ1534、グラフィックス/ディスプレイプロセッサ1536、および外部バスインターフェース(EBI)1538など、様々な処理ユニット、インターフェースユニット、およびメモリユニットを含む。モデムプロセッサ1522は、データ送信および受信のための処理、たとえば、符号化、変調、復調、および復号を実行し得る。RISC/DSP1524は、モバイルデバイス1500のための一般的処理と専用処理とを実行し得る。コントローラ/プロセッサ1526は、デジタルセクション1520内の様々な処理ユニットおよびインターフェースユニットの演算を実行し得る。内部メモリ1528は、デジタルセクション1520内の様々なユニットのためのデータおよび/または命令を記憶し得る。
[097]一般化オーディオエンコーダ1532は、オーディオソース1542、マイクロフォン1543などからの入力信号に対して符号化を実行し得る。一般化オーディオデコーダ1534は、コード化オーディオデータに対して復号を実行し得、出力信号を機能決定エンジン1544に与え得る。グラフィックス/ディスプレイプロセッサ1536は、ディスプレイユニット1546に提示され得る、グラフィックス、ビデオ、画像、およびテキストのための処理を実行し得る。EBI1538は、デジタルセクション1520とデータベース1548との間のデータの転送を可能にし得る。
[098]デジタルセクション1520は、1つまたは複数のプロセッサ、DSP、マイクロプロセッサ、RISCなどを用いて実装され得る。デジタルセクション1520はまた、1つまたは複数の特定用途向け集積回路(ASIC)、および/または何らかの他のタイプの集積回路(IC)上に作製され得る。
[099]概して、本明細書で説明したいかなるデバイスも、ワイヤレスフォン、セルラーフォン、ラップトップコンピュータ、ワイヤレスマルチメディアデバイス、ワイヤレス通信パーソナルコンピュータ(PC)カード、PDA、外部または内部モデム、ワイヤレスチャネルを介して通信するデバイスなど、様々なタイプのデバイスを表し得る。デバイスは、アクセス端末(AT)、アクセスユニット、加入者ユニット、移動局、モバイルデバイス、モバイルユニット、モバイルフォン、モバイル、リモート局、リモート端末、リモートユニット、ユーザデバイス、ユーザ機器、ハンドヘルドデバイスなど、様々な名前を有し得る。本明細書で説明したいかなるデバイスも、命令とデータとを記憶するためのメモリ、ならびにハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せを有し得る。
[0100]本明細書で説明した技法は、様々な手段によって実装され得る。たとえば、これらの技法は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実装され得る。さらに、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者は諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップについて、上記では概してそれらの機能に関して説明した。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0100]ハードウェア実装の場合、本技法を実行するために使用される処理ユニットは、1つまたは複数のASIC、DSP、デジタル信号処理デバイス(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書で説明した機能を実行するように設計された他の電子ユニット、コンピュータ、またはそれらの組合せ内で実装され得る。
[0101]したがって、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、DSP、ASIC、FPGAまたは他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいは本明細書で説明した機能を実行するように設計されたそれらの任意の組合せで実装または実行される。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成としても実装され得る。
[0102]ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され得る。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体とコンピュータ通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気ストレージデバイス、あるいは命令またはデータ構造の形態の所望のプログラムコードを搬送または記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびblu−ray(登録商標)ディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0103]本開示の前述の説明は、いかなる当業者でも本開示を作成または使用することができるように提供される。本開示への様々な修正は当業者には容易に明らかとなり、本明細書で定義した一般原理は、本開示の趣旨または範囲から逸脱することなく他の変形形態に適用される。したがって、本開示は、本明細書で説明した例に限定されるものではなく、本明細書で開示した原理および新規の特徴に合致する最も広い範囲を与えられるべきである。
[0104]例示的な実装形態は、1つまたは複数のスタンドアロンコンピュータシステムの文脈で、本開示の主題の態様を利用することに言及するが、主題は、そのように限定されるのではなく、ネットワークまたは分散コンピューティング環境など、任意のコンピューティング環境に関連して実施され得る。またさらに、本開示の主題の態様は、複数の処理チップまたはデバイスにおいてあるいはそれらにわたって実装され得、同様に複数のデバイスにわたって記憶が実施され得る。そのようなデバイスは、PCと、ネットワークサーバと、ハンドヘルドデバイスとを含み得る。
[0105]主題について構造的機能および/または方法論的行為に特有の言語で説明したが、添付の特許請求の範囲において定義される主題は、必ずしも上記で説明した特定の特徴または行為に限定されるとは限らないことを理解されたい。むしろ、上記で説明した特定の特徴および行為は、特許請求の範囲を実施することの例示的な形態として開示される。
[0105]主題について構造的機能および/または方法論的行為に特有の言語で説明したが、添付の特許請求の範囲において定義される主題は、必ずしも上記で説明した特定の特徴または行為に限定されるとは限らないことを理解されたい。むしろ、上記で説明した特定の特徴および行為は、特許請求の範囲を実施することの例示的な形態として開示される。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1] 電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法であって、前記方法は、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整することとを備える、方法。
[C2] 前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することとをさらに備える、C1に記載の方法。
[C3] 前記ボイスコマンドが前記ユーザを示すかどうかを検証することは、
前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、
前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを備える、C1に記載の方法。
[C4] 前記話者モデルを更新することが、
前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、
前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを備える、C3に記載の方法。
[C5] 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも1つの音特徴の統計データを備える、C1に記載の方法。
[C6] 前記話者モデルを更新することが、前記ボイスコマンドから抽出された少なくとも1つの音特徴を用いて前記統計データを更新することを備える、C5に記載の方法。
[C7] 前記しきい値のうちの前記少なくとも1つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを備える、C1に記載の方法。
[C8] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、C7に記載の方法。
[C9] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、C7に記載の方法。
[C10] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、C7に記載の方法。
[C11] 前記しきい値のうちの前記少なくとも1つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを備える、C1に記載の方法。
[C12] 前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることとを備える、C11に記載の方法。
[C13] 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、C1に記載の方法。
[C14] 前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの1つに追加することをさらに備える、C13に記載の方法。
[C15] 前記ボイスコマンドが前記ユーザを示すことを検証されない場合、前記話者からの入力に基づいて前記ボイスコマンドを前記ユーザのものであると認証することをさらに備える、C1に記載の方法。
[C16] 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも1つを含む、C15に記載の方法。
[C17] 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサーと、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニットと、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するように構成された話者検証ユニットと、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整するように構成されたデータベース更新ユニットとを備える、電子デバイス。
[C18] 前記音センサーが、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するようにさらに構成され、
前記話者検証ユニットは、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するようにさらに構成された、C17に記載の電子デバイス。
[C19] 前記話者検証ユニットは、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うようにさらに構成された、C17に記載の電子デバイス。
[C20] 前記データベース更新ユニットが、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うようにさらに構成された、C19に記載の電子デバイス。
[C21] 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも1つの音特徴の統計データを備える、C17に記載の電子デバイス。
[C22] 前記データベース更新ユニットが、前記ボイスコマンドから抽出された少なくとも1つの音特徴を用いて前記統計データを更新するようにさらに構成された、C21に記載の電子デバイス。
[C23] 前記データベース更新ユニットが、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、C17に記載の電子デバイス。
[C24] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、C23に記載の電子デバイス。
[C25] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、C23に記載の電子デバイス。
[C26] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、C23に記載の電子デバイス。
[C27] 前記データベース更新ユニットが、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、C17に記載の電子デバイス。
[C28] 前記データベース更新ユニットが、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、前記データベース更新ユニットが、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、C27に記載の電子デバイス。
[C29] 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、C17に記載の電子デバイス。
[C30] 前記データベース更新ユニットが、前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの1つに追加するようにさらに構成された、C29に記載の電子デバイス。
[C31] 前記ボイスコマンドが前記許可されたユーザを示すことを検証されない場合、前記話者検証ユニットが、前記話者からの入力に基づいて前記ボイスコマンドを認証するようにさらに構成された、C17に記載の電子デバイス。
[C32] 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも1つを含む、C31に記載の電子デバイス。
[C33] 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するための手段と、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するための手段と、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するための手段と、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整するための手段とを備える、電子デバイス。
[C34] 受信するための前記手段が、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するように構成され、
検証するための前記手段は、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するように構成された、C33に記載の電子デバイス。
[C35] 検証するための前記手段は、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うように構成された、C33に記載の電子デバイス。
[C36] 更新するための前記手段が、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うように構成された、C35に記載の電子デバイス。
[C37] 更新するための前記手段が、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うように構成された、C33に記載の電子デバイス。
[C38] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、C37に記載の電子デバイス。
[C39] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、C37に記載の電子デバイス。
[C40] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、C37に記載の電子デバイス。
[C41] 更新するための前記手段が、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、C33に記載の電子デバイス。
[C42] 更新するための前記手段が、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、更新するための前記手段が、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、C41に記載の電子デバイス。
[C43] 複数のアプリケーションへのアクセスを制御するための命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令は、電子デバイスのプロセッサに、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整することとの動作を実行させる、非一時的コンピュータ可読記憶媒体。
[C44] 前記命令は、
前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することとをさらに備える、C43に記載の記憶媒体。
[C45] 前記しきい値のうちの前記少なくとも1つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを備える、C43に記載の記憶媒体。
[C46] 前記少なくとも1つの音サンプルが複数の音サンプルを含む場合、前記選択されたセキュリティレベルの前記しきい値が、前記複数の音サンプルについての前記信頼性値の中の最低信頼性値に調整される、C45に記載の記憶媒体。
[C47] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、C45に記載の記憶媒体。
[C48] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、C45に記載の記憶媒体。
[C49] 前記しきい値のうちの前記少なくとも1つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを備える、C43に記載の記憶媒体。
[C50] 前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることとを備える、C49に記載の記憶媒体。

Claims (50)

  1. 電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法であって、前記方法は、
    話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
    前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
    前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
    前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整することと
    を備える、方法。
  2. 前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
    前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することと
    をさらに備える、請求項1に記載の方法。
  3. 前記ボイスコマンドが前記ユーザを示すかどうかを検証することは、
    前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、
    前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることと
    を備える、請求項1に記載の方法。
  4. 前記話者モデルを更新することが、
    前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、
    前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することと
    を備える、請求項3に記載の方法。
  5. 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも1つの音特徴の統計データを備える、請求項1に記載の方法。
  6. 前記話者モデルを更新することが、前記ボイスコマンドから抽出された少なくとも1つの音特徴を用いて前記統計データを更新することを備える、請求項5に記載の方法。
  7. 前記しきい値のうちの前記少なくとも1つを調整することが、
    前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、
    前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することと
    を備える、請求項1に記載の方法。
  8. 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項7に記載の方法。
  9. 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項7に記載の方法。
  10. 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項7に記載の方法。
  11. 前記しきい値のうちの前記少なくとも1つを調整することが、
    前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
    前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することと
    を備える、請求項1に記載の方法。
  12. 前記しきい値を調整することは、
    前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
    前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
    前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることと
    を備える、請求項11に記載の方法。
  13. 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、請求項1に記載の方法。
  14. 前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの1つに追加することをさらに備える、請求項13に記載の方法。
  15. 前記ボイスコマンドが前記ユーザを示すことを検証されない場合、前記話者からの入力に基づいて前記ボイスコマンドを前記ユーザのものであると認証することをさらに備える、請求項1に記載の方法。
  16. 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも1つを含む、請求項15に記載の方法。
  17. 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
    話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサーと、
    前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニットと、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
    前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するように構成された話者検証ユニットと、
    前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整するように構成されたデータベース更新ユニットと
    を備える、電子デバイス。
  18. 前記音センサーが、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するようにさらに構成され、
    前記話者検証ユニットは、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するようにさらに構成された、請求項17に記載の電子デバイス。
  19. 前記話者検証ユニットは、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うようにさらに構成された、請求項17に記載の電子デバイス。
  20. 前記データベース更新ユニットが、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うようにさらに構成された、請求項19に記載の電子デバイス。
  21. 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも1つの音特徴の統計データを備える、請求項17に記載の電子デバイス。
  22. 前記データベース更新ユニットが、前記ボイスコマンドから抽出された少なくとも1つの音特徴を用いて前記統計データを更新するようにさらに構成された、請求項21に記載の電子デバイス。
  23. 前記データベース更新ユニットが、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項17に記載の電子デバイス。
  24. 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項23に記載の電子デバイス。
  25. 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項23に記載の電子デバイス。
  26. 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項23に記載の電子デバイス。
  27. 前記データベース更新ユニットが、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項17に記載の電子デバイス。
  28. 前記データベース更新ユニットが、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
    ここにおいて、前記複数の範囲の各々が下限を含み、
    ここにおいて、前記データベース更新ユニットが、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、請求項27に記載の電子デバイス。
  29. 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、請求項17に記載の電子デバイス。
  30. 前記データベース更新ユニットが、前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの1つに追加するようにさらに構成された、請求項29に記載の電子デバイス。
  31. 前記ボイスコマンドが前記許可されたユーザを示すことを検証されない場合、前記話者検証ユニットが、前記話者からの入力に基づいて前記ボイスコマンドを認証するようにさらに構成された、請求項17に記載の電子デバイス。
  32. 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも1つを含む、請求項31に記載の電子デバイス。
  33. 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
    話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するための手段と、
    前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するための手段と、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
    前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するための手段と、
    前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整するための手段と
    を備える、電子デバイス。
  34. 受信するための前記手段が、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するように構成され、
    検証するための前記手段は、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するように構成された、請求項33に記載の電子デバイス。
  35. 検証するための前記手段は、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うように構成された、請求項33に記載の電子デバイス。
  36. 更新するための前記手段が、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うように構成された、請求項35に記載の電子デバイス。
  37. 更新するための前記手段が、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うように構成された、請求項33に記載の電子デバイス。
  38. 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも1つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項37に記載の電子デバイス。
  39. 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項37に記載の電子デバイス。
  40. 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項37に記載の電子デバイス。
  41. 更新するための前記手段が、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項33に記載の電子デバイス。
  42. 更新するための前記手段が、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
    ここにおいて、前記複数の範囲の各々が下限を含み、
    ここにおいて、更新するための前記手段が、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、請求項41に記載の電子デバイス。
  43. 複数のアプリケーションへのアクセスを制御するための命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令は、電子デバイスのプロセッサに、
    話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
    前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
    前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
    前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも1つを調整することと
    の動作を実行させる、非一時的コンピュータ可読記憶媒体。
  44. 前記命令は、
    前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
    前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することと
    をさらに備える、請求項43に記載の記憶媒体。
  45. 前記しきい値のうちの前記少なくとも1つを調整することが、
    前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも1つの音サンプルの各々についての信頼性値を決定することと、
    前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することと
    を備える、請求項43に記載の記憶媒体。
  46. 前記少なくとも1つの音サンプルが複数の音サンプルを含む場合、前記選択されたセキュリティレベルの前記しきい値が、前記複数の音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項45に記載の記憶媒体。
  47. 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項45に記載の記憶媒体。
  48. 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項45に記載の記憶媒体。
  49. 前記しきい値のうちの前記少なくとも1つを調整することが、
    前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
    前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することと
    を備える、請求項43に記載の記憶媒体。
  50. 前記しきい値を調整することは、
    前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
    前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
    前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることと
    を備える、請求項49に記載の記憶媒体。
JP2016542025A 2013-09-16 2014-09-05 アプリケーションへのアクセスを制御するための方法および装置 Active JP6306190B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/028,139 US9343068B2 (en) 2013-09-16 2013-09-16 Method and apparatus for controlling access to applications having different security levels
US14/028,139 2013-09-16
PCT/US2014/054352 WO2015038435A1 (en) 2013-09-16 2014-09-05 Method and apparatus for controlling access to applications

Publications (3)

Publication Number Publication Date
JP2016538658A true JP2016538658A (ja) 2016-12-08
JP2016538658A5 JP2016538658A5 (ja) 2017-10-12
JP6306190B2 JP6306190B2 (ja) 2018-04-04

Family

ID=51570907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016542025A Active JP6306190B2 (ja) 2013-09-16 2014-09-05 アプリケーションへのアクセスを制御するための方法および装置

Country Status (6)

Country Link
US (1) US9343068B2 (ja)
EP (1) EP3047622B1 (ja)
JP (1) JP6306190B2 (ja)
KR (1) KR101868711B1 (ja)
CN (1) CN105556920B (ja)
WO (1) WO2015038435A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018527609A (ja) * 2015-07-23 2018-09-20 アリババ グループ ホウルディング リミテッド ユーザ声紋モデルを構築するための方法、装置、及びシステム
JP2019028465A (ja) * 2017-07-26 2019-02-21 ネイバー コーポレーションNAVER Corporation 話者検証方法及び音声認識システム
JP2019028464A (ja) * 2017-07-26 2019-02-21 ネイバー コーポレーションNAVER Corporation 話者認証方法及び音声認識システム
JP2019219574A (ja) * 2018-06-21 2019-12-26 株式会社東芝 話者モデル作成システム、認識システム、プログラムおよび制御装置

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US12014347B2 (en) * 2011-07-18 2024-06-18 Rabih S. Ballout Kit, system and associated method and service for providing a platform to prevent fraudulent financial transactions
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10541997B2 (en) * 2016-12-30 2020-01-21 Google Llc Authentication of packetized audio signals
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
CN104423552B (zh) * 2013-09-03 2017-11-03 联想(北京)有限公司 一种处理信息的方法和电子设备
US11334314B2 (en) * 2013-10-25 2022-05-17 Voyetra Turtle Beach, Inc. Networked gaming headset with automatic social networking
US9928839B1 (en) * 2013-12-04 2018-03-27 United Services Automobile Association (Usaa) Systems and methods for authentication using voice biometrics and device verification
US9607137B2 (en) * 2013-12-17 2017-03-28 Lenovo (Singapore) Pte. Ltd. Verbal command processing based on speaker recognition
EP3100259A4 (en) * 2014-01-31 2017-08-30 Hewlett-Packard Development Company, L.P. Voice input command
US11288346B1 (en) * 2014-03-03 2022-03-29 Charles Schwab & Co., Inc. System and method for authenticating users using weak authentication techniques, with differences for different features
US10540979B2 (en) 2014-04-17 2020-01-21 Qualcomm Incorporated User interface for secure access to a device using speaker verification
CN104142909B (zh) * 2014-05-07 2016-04-27 腾讯科技(深圳)有限公司 一种汉字注音方法及装置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
US9384738B2 (en) * 2014-06-24 2016-07-05 Google Inc. Dynamic threshold for speaker verification
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102261552B1 (ko) * 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
KR102281178B1 (ko) * 2014-07-09 2021-07-23 삼성전자주식회사 멀티-레벨 음성 인식 방법 및 장치
US9257120B1 (en) 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
WO2016015687A1 (zh) * 2014-07-31 2016-02-04 腾讯科技(深圳)有限公司 声纹验证方法及装置
US9313219B1 (en) * 2014-09-03 2016-04-12 Trend Micro Incorporated Detection of repackaged mobile applications
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
US10111093B2 (en) * 2015-01-09 2018-10-23 Qualcomm Incorporated Mobile device to provide continuous and discrete user authentication
KR102371697B1 (ko) * 2015-02-11 2022-03-08 삼성전자주식회사 음성 기능 운용 방법 및 이를 지원하는 전자 장치
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
GB2539185B (en) * 2015-06-02 2021-11-03 Bae Systems Plc Aircraft avionics system interface
EP3304289B1 (en) 2015-06-02 2023-11-08 BAE Systems PLC Safe aircraft avionics system interface
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
CN106709399B (zh) * 2015-08-21 2021-02-09 小米科技有限责任公司 指纹识别方法及装置
US9978374B2 (en) 2015-09-04 2018-05-22 Google Llc Neural networks for speaker verification
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10013996B2 (en) 2015-09-18 2018-07-03 Qualcomm Incorporated Collaborative audio processing
US9706300B2 (en) 2015-09-18 2017-07-11 Qualcomm Incorporated Collaborative audio processing
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
GB2552082A (en) * 2016-06-06 2018-01-10 Cirrus Logic Int Semiconductor Ltd Voice user interface
US10127926B2 (en) * 2016-06-10 2018-11-13 Google Llc Securely executing voice actions with speaker identification and authentication input types
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10621581B2 (en) 2016-06-11 2020-04-14 Apple Inc. User interface for transactions
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
CN114693289A (zh) 2016-06-11 2022-07-01 苹果公司 用于交易的用户界面
US9972320B2 (en) * 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US20180068313A1 (en) 2016-09-06 2018-03-08 Apple Inc. User interfaces for stored-value accounts
US10304463B2 (en) * 2016-10-03 2019-05-28 Google Llc Multi-user personalization at a voice interface device
GB2555661A (en) * 2016-11-07 2018-05-09 Cirrus Logic Int Semiconductor Ltd Methods and apparatus for biometric authentication in an electronic device
KR102241970B1 (ko) 2016-11-07 2021-04-20 구글 엘엘씨 기록된 미디어 핫워드 트리거 억제
US11416593B2 (en) 2016-11-11 2022-08-16 Asahi Kasel Kabushiki Kaisha Electronic device, control method for electronic device, and control program for electronic device
US10956545B1 (en) * 2016-11-17 2021-03-23 Alarm.Com Incorporated Pin verification
US11216540B2 (en) * 2016-12-13 2022-01-04 Motorola Mobility Llc Flexible security level for device interaction
KR20180082033A (ko) 2017-01-09 2018-07-18 삼성전자주식회사 음성을 인식하는 전자 장치
EP3569182A4 (en) * 2017-01-11 2020-01-22 Sony Corporation INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS, PROGRAM, SCREEN AND INFORMATION MARKING SYSTEM
KR102640423B1 (ko) * 2017-01-31 2024-02-26 삼성전자주식회사 음성 입력 처리 방법, 이를 지원하는 전자 장치, 및 시스템
US11189281B2 (en) * 2017-03-17 2021-11-30 Samsung Electronics Co., Ltd. Method and system for automatically managing operations of electronic device
WO2018195185A1 (en) 2017-04-20 2018-10-25 Google Llc Multi-user authentication on a device
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US11221744B2 (en) 2017-05-16 2022-01-11 Apple Inc. User interfaces for peer-to-peer transfers
KR102409769B1 (ko) 2017-05-16 2022-06-16 애플 인크. 피어 투 피어 전송들을 위한 사용자 인터페이스들
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
CN109102802B (zh) * 2017-06-21 2023-10-17 三星电子株式会社 用于处理用户话语的系统
US10896673B1 (en) 2017-09-21 2021-01-19 Wells Fargo Bank, N.A. Authentication of impaired voices
US11521609B2 (en) * 2017-09-28 2022-12-06 Kyocera Corporation Voice command system and voice command method
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
US10433230B2 (en) * 2017-12-12 2019-10-01 Cassia Networks Inc. Methods, devices, and systems for supporting wireless roaming
CN111357048A (zh) * 2017-12-31 2020-06-30 美的集团股份有限公司 用于控制家庭助手装置的方法和系统
US10789959B2 (en) * 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
KR102595184B1 (ko) 2018-05-25 2023-10-30 삼성전자주식회사 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
CN112219203A (zh) 2018-06-03 2021-01-12 苹果公司 用于转账账户的用户界面
US11100498B2 (en) 2018-06-03 2021-08-24 Apple Inc. User interfaces for transfer accounts
CN108766448B (zh) * 2018-06-19 2020-05-01 苏州科达科技股份有限公司 混音测试系统、方法、装置及存储介质
RU2763392C1 (ru) * 2018-06-29 2021-12-28 Хуавэй Текнолоджиз Ко., Лтд. Способ голосового управления, носимое устройство и терминал
EP3740949B1 (en) * 2018-07-06 2022-01-26 Veridas Digital Authentication Solutions, S.L. Authenticating a user
CN109189310B (zh) * 2018-07-27 2020-10-27 维沃移动通信有限公司 一种解锁方法及终端设备
US11580002B2 (en) * 2018-08-17 2023-02-14 Intensity Analytics Corporation User effort detection
KR102184300B1 (ko) * 2018-09-20 2020-12-01 현대오토에버 주식회사 음성 인식 기반 제어 시스템
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
KR102622350B1 (ko) 2018-10-12 2024-01-09 삼성전자주식회사 전자 장치 및 그 제어 방법
US10922433B2 (en) * 2018-11-26 2021-02-16 Wells Fargo Bank, N.A. Interrupting receipt of sensitive information
KR20200100481A (ko) * 2019-02-18 2020-08-26 삼성전자주식회사 생체 정보를 인증하기 위한 전자 장치 및 그의 동작 방법
US11468886B2 (en) * 2019-03-12 2022-10-11 Lg Electronics Inc. Artificial intelligence apparatus for performing voice control using voice extraction filter and method for the same
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11328352B2 (en) 2019-03-24 2022-05-10 Apple Inc. User interfaces for managing an account
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
EP4297021A3 (en) * 2019-05-31 2024-03-20 Apple Inc. Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
WO2020242595A1 (en) * 2019-05-31 2020-12-03 Apple Inc. Voice identification in digital assistant systems
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN112397060B (zh) * 2019-07-31 2024-02-23 北京声智科技有限公司 一种语音指令处理方法、系统、设备及介质
US11205433B2 (en) * 2019-08-21 2021-12-21 Qualcomm Incorporated Method and apparatus for activating speech recognition
KR20210050884A (ko) * 2019-10-29 2021-05-10 삼성전자주식회사 화자 인식을 위한 등록 방법 및 장치
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111833868A (zh) * 2020-06-30 2020-10-27 北京小米松果电子有限公司 语音助手控制方法、装置及计算机可读存储介质
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
KR20220040875A (ko) * 2020-09-24 2022-03-31 삼성전자주식회사 음성 인식 서비스를 위한 등록 사용자에 대한 화자 인증 학습 장치 및 그 동작 방법
KR20220082258A (ko) * 2020-12-10 2022-06-17 삼성전자주식회사 전자 장치 및 전자 장치에서 기억 서비스를 제공하는 방법
US11983702B2 (en) 2021-02-01 2024-05-14 Apple Inc. Displaying a representation of a card with a layered structure
CN112951243A (zh) * 2021-02-07 2021-06-11 深圳市汇顶科技股份有限公司 语音唤醒方法、装置、芯片、电子设备及存储介质
US11921992B2 (en) 2021-05-14 2024-03-05 Apple Inc. User interfaces related to time
KR20240041318A (ko) * 2021-07-27 2024-03-29 퀄컴 인코포레이티드 콘텍스트 정보 및 사용자 감정을 사용한 음성 또는 스피치 인식
US11784956B2 (en) 2021-09-20 2023-10-10 Apple Inc. Requests to add assets to an asset account
CN114005435A (zh) * 2021-11-02 2022-02-01 北京元心君盛科技有限公司 一种响应语音信息的方法、装置、设备、介质及程序产品
KR102639755B1 (ko) * 2023-05-31 2024-02-23 농협은행(주) 전자 장치 제어를 지원하는 서버 및 이의 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002055957A (ja) * 2000-06-06 2002-02-20 Internatl Business Mach Corp <Ibm> 信頼性ベースの増分アクセス認証用のシステムおよび方法
WO2008126254A1 (ja) * 2007-03-30 2008-10-23 Pioneer Corporation 話者認識装置、音響モデル更新方法及び音響モデル更新処理プログラム
JP2010108074A (ja) * 2008-10-28 2010-05-13 Hitachi Ltd 生体認証システム及び方法
JP2010198384A (ja) * 2009-02-25 2010-09-09 Kyocera Corp 通信端末装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4837830A (en) * 1987-01-16 1989-06-06 Itt Defense Communications, A Division Of Itt Corporation Multiple parameter speaker recognition system and methods
US5805674A (en) 1995-01-26 1998-09-08 Anderson, Jr.; Victor C. Security arrangement and method for controlling access to a protected system
CN1244984A (zh) 1996-11-22 2000-02-16 T-内提克斯公司 用于信息系统访问和交易处理的语音识别
US6691089B1 (en) 1999-09-30 2004-02-10 Mindspeed Technologies Inc. User configurable levels of security for a speaker verification system
US7212969B1 (en) 2000-09-29 2007-05-01 Intel Corporation Dynamic generation of voice interface structure and voice content based upon either or both user-specific contextual information and environmental information
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US7457745B2 (en) * 2002-12-03 2008-11-25 Hrl Laboratories, Llc Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments
US7404086B2 (en) 2003-01-24 2008-07-22 Ac Technology, Inc. Method and apparatus for biometric authentication
US8775187B2 (en) * 2008-09-05 2014-07-08 Auraya Pty Ltd Voice authentication system and methods
CN101697514B (zh) * 2009-10-22 2016-08-24 中兴通讯股份有限公司 一种身份验证的方法及系统
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
CN102223367B (zh) * 2011-06-10 2014-04-23 安徽科大讯飞信息科技股份有限公司 移动用户访问网站的方法、设备及系统
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及系统
US9042867B2 (en) * 2012-02-24 2015-05-26 Agnitio S.L. System and method for speaker recognition on mobile devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002055957A (ja) * 2000-06-06 2002-02-20 Internatl Business Mach Corp <Ibm> 信頼性ベースの増分アクセス認証用のシステムおよび方法
WO2008126254A1 (ja) * 2007-03-30 2008-10-23 Pioneer Corporation 話者認識装置、音響モデル更新方法及び音響モデル更新処理プログラム
JP2010108074A (ja) * 2008-10-28 2010-05-13 Hitachi Ltd 生体認証システム及び方法
JP2010198384A (ja) * 2009-02-25 2010-09-09 Kyocera Corp 通信端末装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018527609A (ja) * 2015-07-23 2018-09-20 アリババ グループ ホウルディング リミテッド ユーザ声紋モデルを構築するための方法、装置、及びシステム
US11043223B2 (en) 2015-07-23 2021-06-22 Advanced New Technologies Co., Ltd. Voiceprint recognition model construction
JP2019028465A (ja) * 2017-07-26 2019-02-21 ネイバー コーポレーションNAVER Corporation 話者検証方法及び音声認識システム
JP2019028464A (ja) * 2017-07-26 2019-02-21 ネイバー コーポレーションNAVER Corporation 話者認証方法及び音声認識システム
JP2019219574A (ja) * 2018-06-21 2019-12-26 株式会社東芝 話者モデル作成システム、認識システム、プログラムおよび制御装置
US11495235B2 (en) 2018-06-21 2022-11-08 Kabushiki Kaisha Toshiba System for creating speaker model based on vocal sounds for a speaker recognition system, computer program product, and controller, using two neural networks

Also Published As

Publication number Publication date
US20150081295A1 (en) 2015-03-19
CN105556920A (zh) 2016-05-04
EP3047622B1 (en) 2017-08-23
KR101868711B1 (ko) 2018-06-18
JP6306190B2 (ja) 2018-04-04
CN105556920B (zh) 2018-11-09
US9343068B2 (en) 2016-05-17
WO2015038435A1 (en) 2015-03-19
KR20160055839A (ko) 2016-05-18
EP3047622A1 (en) 2016-07-27

Similar Documents

Publication Publication Date Title
JP6306190B2 (ja) アプリケーションへのアクセスを制御するための方法および装置
US10460735B2 (en) Speaker verification using co-location information
CN111699528B (zh) 电子装置及执行电子装置的功能的方法
US20150302856A1 (en) Method and apparatus for performing function by speech input
US10705789B2 (en) Dynamic volume adjustment for virtual assistants
US20200184963A1 (en) Virtual assistant augmentation system
CN106663430B (zh) 使用用户指定关键词的说话者不相依关键词模型的关键词检测
KR101824157B1 (ko) 화자 검증을 위한 동적 임계치
US20180130475A1 (en) Methods and apparatus for biometric authentication in an electronic device
US9916431B2 (en) Context-based access verification
JP2018512619A (ja) 発話の方向に基づく電子デバイスの制御
KR20160145766A (ko) 스피치 입력에 의해 애플리케이션을 활성화하는 방법 및 장치
US11757870B1 (en) Bi-directional voice authentication
US11776550B2 (en) Device operation based on dynamic classifier
JP2019536078A (ja) 音声の分類化
US11676608B2 (en) Speaker verification using co-location information
CN112583782B (zh) 过滤用户请求信息的系统和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170809

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170829

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170829

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180307

R150 Certificate of patent or registration of utility model

Ref document number: 6306190

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250