JP2016538658A

JP2016538658A - アプリケーションへのアクセスを制御するための方法および装置

Info

Publication number: JP2016538658A
Application number: JP2016542025A
Authority: JP
Inventors: ユン、スングラック; キム、テス; チョ、ジュン−チョル; パク、ミン−キュ; ホワン、キュ・ウォン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-09-16
Filing date: 2014-09-05
Publication date: 2016-12-08
Anticipated expiration: 2034-09-05
Also published as: US20150081295A1; CN105556920A; EP3047622B1; KR101868711B1; JP6306190B2; CN105556920B; US9343068B2; WO2015038435A1; KR20160055839A; EP3047622A1

Abstract

本開示の一態様によれば、電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法が開示される。本方法は、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証することとを含む。本方法では、各アプリケーションは、しきい値を有するセキュリティレベルに関連する。本方法は、ボイスコマンドがユーザを示すことを検証された場合、ボイスコマンドを用いて話者モデルを更新することと、更新された話者モデルに基づいてしきい値のうちの少なくとも１つを調整することとをさらに含む。【選択図】図６

Description

関連出願の相互参照
[001]本出願は、その内容全体が参照により本明細書に明確に組み込まれる、２０１３年９月１６日に出願された、米国非仮特許出願第１４／０２８，１３９号の優先権を主張する。

[002]本開示は、電子デバイスにおけるアプリケーションにアクセスすることに関し、より詳細には、ボイスコマンド（voice command）に応答してアプリケーションへのアクセスを制御することに関する。

[003]近年、アプリケーションを実行することが可能な電子デバイスは、ユーザの間で非常に普及してきている。たとえば、スマートフォン、タブレットコンピュータ、およびパーソナルコンピュータなどの電子デバイスは、メッセージングアプリケーション、連絡先アプリケーション、カレンダーアプリケーション、写真アプリケーションなどのアプリケーションを含み得る。さらに、ユーザは、インターネットを介してアプリケーションプロバイダから他のアプリケーション（たとえば、バンキング（banking）アプリケーション）を探索し、ダウンロードし得る。これらのアプリケーションは、様々な機能および情報への便利なアクセスをユーザに与える。

[004]ユーザによってアクセスされるアプリケーションは、しばしば、他人がアクセスすることをユーザが希望しないことがある個人情報またはプライベート情報を含む。たとえば、メッセージングアプリケーション（たとえば、電子メールアプリケーション）における電子メールは、個人使用またはビジネス使用のための情報を含み得る。同様に、ユーザのバンキングアプリケーションは、口座番号および勘定残高などのユーザの財務情報へのアクセスを含むか、または可能にし得る。

[005]アプリケーションを通してアクセスされ得る情報の機密性質を鑑みて、従来の電子デバイスは、概して、そのようなアプリケーションへのアクセスを制限するために１つまたは複数のセキュリティ機能を与える。そのようなセキュリティ機能は、アプリケーションにアクセスするためのユーザの認証を必要とし得る。たとえば、ユーザは、個人コードを入力するように要求され、コードが検証されたときにアプリケーションへのアクセスを可能にされ得る。

[006]また、いくつかの従来の電子デバイスは音声認識能力を装備している。そのようなデバイスでは、ユーザからの話されたコマンドに応答して、アプリケーションがアクセスされ得る。アプリケーションへの無許可のアクセスを防ぐために、これらのデバイスは、許可されたユーザのボイス特性に基づいて話されたコマンドの真正性を検証し得る。しかしながら、許可されたユーザのボイス特性が、時間とともに、またはユーザの状態の結果として変化し得るので、そのようなデバイスにおける許可されたユーザの認証は信頼できないことがある。

[007]本開示は、話者モデル（speaker model）を更新することと、セキュリティレベルに関連するしきい値を調整することとによって、異なるセキュリティレベルを有するアプリケーションへのアクセスを制御することに関する。

[008]本開示の一態様によれば、電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法が開示される。本方法は、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証することとを含む。本方法では、各アプリケーションは、しきい値を有するセキュリティレベルに関連する。本方法は、ボイスコマンドがユーザを示すことを検証された場合、ボイスコマンドを用いて話者モデルを更新し、更新された話者モデルに基づいてしきい値のうちの少なくとも１つを調整する。本開示はまた、本方法に関係する装置、デバイス、システム、手段の組合せ、およびコンピュータ可読媒体についても説明する。

[009]本開示の別の態様によれば、複数のアプリケーションへのアクセスを制御するための電子デバイスが開示される。本電子デバイスは、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサー（sound sensor）と、複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、およびアプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニット（storage unit）とを含む。各アプリケーションは、複数のしきい値の中のしきい値を有する複数のセキュリティレベルの中のセキュリティレベルに関連する。本電子デバイスはまた、許可されたユーザの話者モデルに基づいて、ボイスコマンドが許可されたユーザを示すかどうかを検証するように構成された話者検証ユニット（speaker verification unit）と、ボイスコマンドがユーザを示すことを検証された場合にボイスコマンドを用いて話者モデルを更新し、更新された話者モデルに基づいてしきい値のうちの少なくとも１つを調整するように構成されたデータベース更新ユニット（database updating unit）とを含む。

[010]本開示の発明的態様の実施形態は、以下の発明を実施するための形態を参照し、添付の図面とともに読めば理解されよう。

[011]本開示の一実施形態による、話者のボイスコマンドに応答して、複数のセキュリティレベルに基づいて複数のアプリケーションがアクセスされ得るモバイルデバイスを示す図。 [012]本開示の一実施形態による、話者のボイスコマンドに応答してアプリケーションについてのセキュリティレベルのしきい値を調整することによって複数のアプリケーションへのアクセスを制御するように構成された電子デバイスのブロック図。 [013]本開示の一実施形態による、話者からのボイスコマンドを検証するための、電子デバイスにおけるアプリケーションアクセスデータベースのブロック図。 [014]本開示の一実施形態による、話者と無許可の話者との音サンプル（sound sample）に基づいて、複数のセキュリティレベルについての初期しきい値を含む、電子デバイスにおける話者検証データベースをセットアップすることの図。 [015]本開示の一実施形態による、話者からのボイスコマンドが検証されたときにアプリケーションにアクセスするように構成された、電子デバイスにおけるボイスアクティベーションユニットのブロック図。 [016]本開示の一実施形態による、電子デバイスにおいてボイスコマンドに基づいてアプリケーションへのアクセスを行い、アプリケーションに対するアクセスを調整するための方法のフローチャート。 [017]本開示の一実施形態による、話者からのボイスコマンドを検証することによってアプリケーションにアクセスするように構成された、電子デバイスにおける話者検証ユニットのブロック図。 [018]本開示の一実施形態による、検証されたボイスコマンドに基づいて、話者モデルを更新し、セキュリティレベルについてのしきい値を調整するように構成された、電子デバイスにおけるデータベース更新ユニットのブロック図。 [019]本開示の一実施形態による、検証されたボイスコマンドについての新しい音サンプルを用いて更新され得る、電子デバイスにおける話者検証データベースの図。 [020]本開示の一実施形態による、ボイスコマンドについての信頼性値に基づいて話者モデルを更新するための方法のフローチャート。 [021]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、新しい音サンプルのセキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [022]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、新しい音サンプルのセキュリティレベルとは異なるセキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [023]本開示の一実施形態による、新しい音サンプルを受信したことに応答して、セキュリティレベルについてのしきい値がそこにおいて調整される、電子デバイスの話者検証データベースの図。 [024]本開示の一実施形態による、セキュリティレベルについてのしきい値のうちの少なくとも１つを調整するための方法のフローチャート。 [025]本開示のいくつかの実施形態による、アプリケーションへのアクセスを制御するための方法および装置が実装され得る例示的なモバイルデバイスのブロック図。

[026]次に、添付の図面にそれの例が示されている、様々な実施形態を詳細に参照する。以下の発明を実施するための形態では、本開示の発明的態様の完全な理解を与えるために多数の具体的な詳細を記載する。ただし、本開示の発明的態様はこれらの具体的な詳細なしに実施され得ることが当業者には明らかであろう。他の事例では、様々な実施形態の態様を不必要に不明瞭にしないように、よく知られている方法、プロシージャ、システム、および構成要素については詳細に説明していない。

[027]図１に、本開示の一実施形態による、話者１１０のボイスコマンドに応答して、複数のセキュリティレベルに基づいて複数のアプリケーション１２２、１２４、および１２６がアクセスされ得るモバイルデバイス１２０を示す。モバイルデバイス１２０はアプリケーション１２２、１２４、および１２６を含み、それらは、それぞれ、話者１１０からのボイスコマンド「バンキング」、「写真」、および「連絡先」に応答してアクセスされ得る。モバイルデバイス１２０がアプリケーション１２２、１２４、および１２６とともに示されているが、モバイルデバイス１２０は、１つまたは複数の機能を実行するための他のアプリケーションを含み得る。アプリケーションにアクセスするコンテキストにおける、本明細書で使用する「アクセス」という用語は、アプリケーションまたはアプリケーション中の機能を実行する（perform）こと、実行する（execute）こと、実行する（run）こと、アクティブにすること、または動作させることを指す。さらに、「ボイスコマンド」という用語は、モバイルデバイス１２０において実行されるべき行為を示す、話者から発せられた１つまたは複数のワードのデジタルまたはアナログ表現を指し、命令、要求、指令、キーワードなどを含む。

[028]モバイルデバイス１２０におけるアプリケーション１２２、１２４、および１２６の各々は、関連するアプリケーションにアクセスするためのセキュリティレベルで構成される。アプリケーション１２２、１２４、および１２６についてのセキュリティレベルの各々は、関連するアプリケーション１２２、１２４、または１２６にアクセスするための最小信頼性値を示すしきい値にマッピングされる。モバイルデバイス１２０は、話者１１０からのボイスコマンドが、アプリケーションに関連するしきい値に基づいて許可されたユーザからのものであることを認識され、検証されたとき、アプリケーションにアクセスし得る。本開示のいくつかの実施形態によれば、アプリケーションが高いセキュリティレベルを必要とする場合、高いしきい値にマッピングされた高いセキュリティレベルが割り当てられ得る。

[029]図示の実施形態では、モバイルデバイス１２０は、話者１１０からの関連するボイスコマンドに応答して、話者１１０が、許可されたユーザとしてアプリケーション１２２、１２４、および１２６にアクセスすることを可能にするように構成される。図示のように、話者１１０は、モバイルデバイス１２０におけるアプリケーション１２２、１２４、または１２６にアクセスするための入力音としてボイスコマンドを話し得る。モバイルデバイス１２０が、アプリケーション１２２、１２４、および１２６のうちの１つにアクセスするためのコマンドとして入力音中のボイスコマンドを認識するとき、モバイルデバイス１２０は、ボイスコマンドが許可されたユーザのボイスコマンドである可能性を示す、ボイスコマンドの信頼性値を決定する。ボイスコマンドの信頼性値が、アプリケーション１２２、１２４、または１２６に関連するしきい値を超えた場合、モバイルデバイス１２０は、ボイスコマンドに関連するアプリケーション１２２、１２４、または１２６にアクセスする。

[030]図１では、モバイルデバイス１２０は、話者１１０からのボイスコマンドに応答して、異なるセキュリティレベルをもつアプリケーション１２２、１２４、および１２６にアクセスする。たとえば、モバイルデバイス１２０は、話者１１０からの入力音としてボイスコマンド「バンキング」を受信し得る。モバイルデバイス１２０は、最高セキュリティレベルを示すセキュリティレベル「１」を有するバンキングアプリケーション１２２にアクセスするためのコマンドとしてボイスコマンドを認識し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「１」に関連するしきい値よりも高いと決定された場合、モバイルデバイス１２０は、ボイスコマンドが許可されたユーザからのものであることを検証し、話者１１０のためのバンキングアプリケーション１２２にアクセスする。

[031]別の例では、モバイルデバイス１２０がボイスコマンド「写真」を入力音として受信したとき、モバイルデバイス１２０は、中間セキュリティレベルを示すセキュリティレベル「３」を有する写真アプリケーション１２４にアクセスするためのコマンドとしてボイスコマンドを認識し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「３」に関連するしきい値よりも高いと決定された場合、モバイルデバイス１２０は、ボイスコマンドが許可されたユーザからのものであることを検証し、写真アプリケーション１２４にアクセスする。

[032]さらに、受信された入力音がボイスコマンド「連絡先」を含む場合、モバイルデバイス１２０は、セキュリティレベル「５」に関連する連絡先アプリケーション１２６にアクセスするためのコマンドとしてボイスコマンドを認識し得る。たとえば、セキュリティレベル「５」は最低セキュリティレベルを示し得る。この場合、ボイスコマンドについての信頼性値が、セキュリティレベル「５」に関連するしきい値よりも高いと決定された場合、モバイルデバイス１２０は、ボイスコマンドが許可されたユーザからのものであることを検証し、連絡先アプリケーション１２６にアクセスする。

[033]図２に、本開示の一実施形態による、話者のボイスコマンドに応答してアプリケーションについてのセキュリティレベルのしきい値を調整することによって複数のアプリケーションへのアクセスを制御するように構成された電子デバイス２００のブロック図を示す。電子デバイス２００は、音センサー２１０と、Ｉ／Ｏユニット２２０と、通信ユニット２３０と、プロセッサ２４０と、記憶ユニット２７０とを含む。電子デバイス２００は、セルラーフォン、スマートフォン、ラップトップコンピュータ、パーソナルコンピュータ、タブレットコンピュータ、ゲームデバイスおよびマルチメディアデバイスを含み得るモバイルデバイス、スマートテレビジョン、パーソナルコンピュータなど、音キャプチャおよび処理能力を装備した任意の好適なデバイスであり得る。

[034]プロセッサ２４０はデジタル信号プロセッサ（ＤＳＰ：digital signal processor）２５０とデータベース更新ユニット２６０とを含み、電子デバイス２００を管理し、動作させるためのアプリケーションプロセッサ（ＡＰ：application processor）または中央処理ユニット（ＣＰＵ）であり得る。ＤＳＰ２５０は音声検出器２５２とボイスアクティベーションユニット２５４とを含む。一実施形態では、ＤＳＰ２５０は、入力音ストリームを処理する際の電力消費を低減するための低電力プロセッサである。この構成では、ＤＳＰ２５０中のボイスアクティベーションユニット２５４は、入力音ストリーム中のボイスコマンドが認識され、検証されたとき、記憶ユニット２７０に記憶されたバンキングアプリケーション２７２、写真アプリケーション２７４、および連絡先アプリケーション２７６などのアプリケーションにアクセスするように構成される。

[035]音センサー２１０は、入力音ストリームを受信し、それをＤＳＰ２５０中の音声検出器２５２に与えるように構成され得る。音センサー２１０は、１つまたは複数のマイクロフォン、または入力音ストリームを受信し、キャプチャし、検知し、および／または検出するために使用され得る他のタイプの音センサーを含み得る。さらに、音センサー２１０は、そのような機能を実行するための任意の好適なソフトウェアおよび／またはハードウェアを採用し得る。

[036]一実施形態では、音センサー２１０は、デューティサイクルに従って入力音ストリームを周期的に受信するように構成され得る。この場合、音センサー２１０は、入力音ストリームの受信された部分の強度がしきい値強度よりも大きいかどうかを決定し得る。受信された部分の強度がしきい値強度を超えたとき、音センサー２１０は音声検出器２５２をアクティブにし、受信された部分をＤＳＰ２５０中の音声検出器２５２に与える。代替的に、音センサー２１０は、入力音ストリームの一部分を周期的に受信し、音声検出器２５２をアクティブにして、受信された部分の強度がしきい値強度を超えるかどうかを決定することなしに、受信された部分を音声検出器２５２に与え得る。本明細書で使用する「音ストリーム」という用語は、一連の１つまたは複数の音信号または音データを指す。

[037]ＤＳＰ２５０中の音声検出器２５２は、音センサー２１０から入力音ストリームの一部分を受信するように構成される。一実施形態では、音声検出器２５２は、受信された部分から複数の音特徴を抽出し、ガウス混合モデル（ＧＭＭ：Gaussian mixture model）ベースの分類器、ニューラルネットワーク、隠れマルコフモデル（ＨＭＭ：hidden Markov model）、グラフィカルモデル、およびサポートベクターマシン（ＳＶＭ：Support Vector Machine）などの任意の好適な音分類方法を使用することによって、抽出された音特徴が人間音声など、当該の音を示すかどうかを決定し得る。受信された部分が当該の音であると決定された場合、音声検出器２５２はボイスアクティベーションユニット２５４をアクティブにし、入力音ストリームの受信された部分および残りの部分はボイスアクティベーションユニット２５４に与えられる。いくつかの他の実施形態では、音声検出器２５２はＤＳＰ２５０において省略され得る。この場合、受信された入力音ストリームの強度がしきい値強度よりも大きいとき、音センサー２１０はボイスアクティベーションユニット２５４をアクティブにし、受信された入力音ストリームをボイスアクティベーションユニット２５４に直接与える。

[038]アプリケーションにアクセスするためのボイスコマンドを認識する際に使用するために、記憶ユニット２７０は、ボイスコマンドの複数の部分に関連する複数の状態に関する状態情報とともに、アプリケーションの各々についてのボイスコマンド（たとえば、ターゲットキーワード）を記憶する。一実施形態では、記憶ユニット２７０は、ボイスコマンドを認識するための音声または音響モデルを記憶し得る。音声または音響モデルは、ボイスコマンドの音声特性を表すモデルであり、そのような音声特性の統計モデルであり得る。

[039]音声または音響モデルの場合、ボイスコマンドは、単音（phone）、音素（phoneme）、またはそれらのサブ単位など、複数の基本音単位に分割され得る。この場合、ボイスコマンドを表す複数の部分は、基本音単位に基づいて生成され得る。ボイスコマンドの基本音単位の各々は、任意の好適な音声認識方法隠れマルコフモデル（ＨＭＭ）、ガウス混合モデル（ＧＭＭ）セミマルコフモデル（ＳＭＭ）などを使用して分析され得る。分析に基づいて、基本音単位の各々の平均および分散が決定され得る。ボイスコマンドについての基本音単位についての決定された平均および分散は、ボイスコマンドについての音声または音響モデルを生成するために使用される。

[040]記憶ユニット２７０はまた、プロセッサ２４０によってアクセスされ得るバンキングアプリケーション２７２と、写真アプリケーション２７４と、連絡先アプリケーション２７６とを記憶する。図示の実施形態では、記憶ユニット２７０はバンキングアプリケーション２７２と、写真アプリケーション２７４と、連絡先アプリケーション２７６とを記憶するが、記憶ユニット２７０は、プロセッサ２４０によって実行され得る他のアプリケーションまたは機能をも記憶し得る。記憶ユニット２７０は、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（読取り専用メモリ）、ＥＥＰＲＯＭ（登録商標）（電気的消去可能プログラマブル読取り専用メモリ）、フラッシュメモリ、またはＳＳＤ（ソリッドステートドライブ）など、任意の好適なストレージまたはメモリデバイスを使用して実装され得る。

[041]さらに、記憶ユニット２７０は、ボイスアクティベーションユニット２５４とデータベース更新ユニット２６０とによってアクセスされるアプリケーションアクセスデータベース２７８を記憶し得る。アプリケーションアクセスデータベース２７８は、ボイスコマンドをアプリケーションに関連付ける情報と、アプリケーションに関連するセキュリティレベルとを含む。さらに、アプリケーションアクセスデータベース２７８は、話者検証データベースおよび話者モデルなど、許可されたユーザを検証するための情報をも含み得る。

[042]ＤＳＰ２５０中のボイスアクティベーションユニット２５４は、音声検出器２５２において受信された部分から開始する入力音ストリームを受信するように構成される。次いで、アプリケーションにアクセスするためのボイスコマンドがボイスアクティベーションユニット２５４中の入力音ストリームから認識され得る。ボイスコマンドを認識するために、１つまたは複数の音特徴（たとえば、オーディオフィンガーフィンガープリント、ＭＦＣＣベクトル）が、受信された入力音ストリームから抽出され、隠れマルコフモデル（ＨＭＭ）、セミマルコフモデル（ＳＭＭ）などに基づく任意の好適な音声認識方法を使用して分析され得る。

[043]ボイスコマンドが認識されると、ボイスアクティベーションユニット２５４は、記憶ユニット２７０中のアプリケーションアクセスデータベース２７８に基づいて、ボイスコマンドに関連する、アクセスされるべきアプリケーションと、アプリケーションに関連するセキュリティレベルと、セキュリティレベルに関連するしきい値とを識別する。たとえば、ボイスコマンド「バンキング」が認識されたとき、ボイスアクティベーションユニット２５４は、アプリケーションアクセスデータベース２７８に基づいてバンキングアプリケーション２７２と、関連するセキュリティレベル（たとえば、セキュリティレベル「１」）と、セキュリティレベルについてのしきい値（たとえば、しきい値「９」）とを識別し得る。

[044]ボイスアクティベーションユニット２５４はまた、アプリケーションアクセスデータベース２７８中の抽出された音特徴と話者モデルとに基づいて、ボイスコマンドの信頼性値を決定するように構成される。話者モデルは話者の音特性を表すモデルであり、そのような音特性の統計モデルであり得る。ボイスコマンドの信頼性値は、次いで、アクセスされるべきアプリケーションに関連するしきい値と比較される。信頼性値がしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。この場合、ボイスアクティベーションユニット２５４は、ボイスコマンドに関連するアプリケーションにアクセスするためにアクティべーション信号を生成する。ボイスコマンドが検証されたとき、ボイスアクティベーションユニット２５４は、アクセスされたアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドについての音特徴とをデータベース更新ユニット２６０に送信する。一実施形態では、ボイスコマンドについての入力音ストリームは、ボイスコマンドについての音特徴に加えてまたはそれの代わりにデータベース更新ユニット２６０に送信され得る。

[045]アクセスされたアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドの音特徴とを受信すると、データベース更新ユニット２６０は記憶ユニット２７０中の話者モデルを更新する。たとえば、ボイスコマンドの音特徴は、新しい音サンプルとして既存の音サンプルに追加される。統計的話者モデルの場合、話者モデルについての音サンプルの新しい平均および新しい分散は、新しい音サンプルと、既存の音サンプルの前の平均および分散とに基づいて決定され得る。データベース更新ユニット２６０は、次いで、更新された話者モデルを使用してセキュリティレベルについてのしきい値のうちの少なくとも１つを調整する。電子デバイス２００は、次いで、アプリケーション２７２、２７４、および２７６にアクセスするための後続のボイスコマンドを検証するために、更新された話者モデルと調整されたしきい値とを使用し得る。

[046]図３に、本開示の一実施形態による、話者からのボイスコマンドを検証するためのアプリケーションアクセスデータベース２７８のブロック図を示す。アプリケーションアクセスデータベース２７８は、アプリケーションセキュリティデータベース３１０と、話者検証データベース３２０と、話者モデル３３０とを含む。アプリケーションセキュリティデータベース３１０は、複数のコマンド３１２と、複数のアプリケーション識別子３１４と、複数のセキュリティレベル３１６とを含む。話者検証データベース３２０は、複数のセキュリティレベル３１６と、複数のしきい値３２２と、複数の音サンプル３２４とを含む。

[047]アプリケーションセキュリティデータベース３１０は、コマンド３１２を、アクセスされるべきアプリケーションを示すアプリケーション識別子３１４にマッピングする。アプリケーション識別子３１４は、アクセスされるべきアプリケーションについてのセキュリティレベルを決定するためのセキュリティレベル３１６に関連する。一実施形態では、コマンド３１２、アプリケーション識別子３１４、およびセキュリティレベル３１６は、コマンド３１２に応答してアプリケーション識別子３１４とセキュリティレベル３１６とを決定するためのルックアップテーブルまたは任意の好適なデータ構造の形態で記憶され得る。アプリケーションセキュリティデータベース３１０を使用して、ボイスアクティベーションユニット２５４は、ボイスコマンドがコマンド３１２のうちの１つとして認識されたとき、アクセスされるべきアプリケーションのセキュリティレベルを決定する。

[048]話者検証データベース３２０では、セキュリティレベル３１６は、認識されたボイスコマンドの信頼性値がセキュリティレベル３１６に関連するアプリケーションにアクセスするために超える必要がある最小値を示すしきい値３２２にマッピングされる。一実施形態では、セキュリティレベルは、セキュリティレベルについての最小信頼性値を示すしきい値にマッピングされる。話者の音サンプル３２４は、セキュリティレベル３１６のしきい値３２２に従って話者検証データベース３２０中のセキュリティレベル３１６に割り当てられる。セキュリティレベル３１６と、しきい値３２２と、音サンプル３２４とを含む話者検証データベース３２０は、ルックアップテーブルまたは任意の好適なデータ構造の形態で記憶され得る。

[049]アプリケーションアクセスデータベース２７８中の話者モデル３３０は、話者のボイスコマンドを検証する際に使用するためのボイスコマンドの信頼性値を計算するために使用される。話者モデル３３０は、音サンプル３２４についての平均３３２および分散３３４などの統計データを含むＧＭＭモデルであり得る。他の実施形態では、話者モデル３３０はまた、音サンプル３２４の最大値、最小値、雑音電力、ＳＮＲ、信号電力、エントロピー、尖度、高次運動量などを含み得る。ボイスアクティベーションユニット２５４は、ボイスコマンドの信頼性値と、アクセスされるべきアプリケーションについてのセキュリティレベルのしきい値とを比較する。ボイスコマンドの信頼性値がアプリケーションのしきい値を超えた場合、ボイスアクティベーションユニット２５４はボイスコマンドが許可されたユーザからのものであることを検証し、アプリケーションにアクセスするためのアクティベーション信号を生成する。

[050]図４に、本開示の一実施形態による、許可されたユーザと無許可のユーザとの音サンプルに基づいて、複数のセキュリティレベルについての初期しきい値を含む話者検証データベース３２０をセットアップすることの図を示す。図示のように、話者検証データベース３２０は５つのセキュリティレベル「１」〜「５」を含み、セキュリティレベル「１」は最高セキュリティレベルである。モバイルデバイス１２０における各アプリケーションは、アクセスについてのセキュリティレベルのうちの１つを割り当てられ得る。話者検証データベース３２０は、５つのセキュリティレベルを用いて示されているが、それは任意の好適な数のセキュリティレベルを含み得る。

[051]話者検証データベース３２０をセットアップするために、電子デバイス２００は、許可されたユーザとしての話者から複数の音サンプルＳ１〜Ｓ１０を受信および記憶し、無許可のユーザ（すなわち、詐称者）から複数の音サンプルＵ１〜Ｕ１０を受信および記憶する。上記で説明したように、許可されたユーザの音サンプルＳ１〜Ｓ１０は、音サンプルの統計データ（たとえば、平均および分散）を使用して話者モデルを生成するために使用される。次いで、話者モデルに基づいて、音サンプルＳ１〜Ｓ１０の信頼性値および音サンプルＵ１〜Ｕ１０の信頼性値が決定される。この場合、許可されたユーザについての音サンプルの信頼性値は、概して、無許可のユーザについての音サンプルの信頼性値よりも実質的に高くなる。

[052]音サンプルＳ１〜Ｓ１０の信頼性値および音サンプルＵ１〜Ｕ１０の信頼性値が決定された後、最高しきい値と最低しきい値とが信頼性値の中で選択される。電子デバイス２００は、最高しきい値を、許可されたユーザについての音サンプルＳ１〜Ｓ１０の信頼性値の中の最小値であると決定し得る。その場合、最高しきい値は最高セキュリティレベル「１」にマッピングされる。一方、電子デバイス２００は、最低しきい値を、無許可のユーザについての音サンプルＵ１〜Ｕ１０の信頼性値の中の最大値であると決定し得る。この場合、最低しきい値は最低セキュリティレベル「５」にマッピングされる。

[053]最高セキュリティレベル「１」と最低セキュリティレベル「５」とにそれぞれ対応する最高しきい値と最低しきい値との間の間隔は、次いで、セキュリティレベル「１」と「５」との間の中間セキュリティレベル「２」、「３」、および「４」についてのしきい値を決定するために区分または分割され得る。一実施形態では、電子デバイス２００は、最高しきい値と最低しきい値との間の差を等しく区分することによって、セキュリティレベル「２」、「３」、および「４」についてのしきい値を決定する。この場合、しきい値増分を計算するために、差は４（すなわち、中間セキュリティレベルの数＋１）で除算される。次いで、中間セキュリティレベル「２」、「３」、および「４」についてのしきい値を決定するために、１つまたは複数のしきい値増分が最低しきい値に加算され得る。代替的に、中間セキュリティレベル「２」、「３」、および「４」についてのしきい値を決定するために、１つまたは複数のしきい値増分が最高しきい値から減算され得る。このようにして、セキュリティレベルの各々は、セキュリティレベルについての最小信頼性値を示すそれの関連するしきい値によって増分的に定義され得る。

[054]図５に、本開示の一実施形態による、話者からのボイスコマンドが検証されたときにアプリケーションにアクセスするように構成されたボイスアクティベーションユニット２５４のブロック図を示す。ボイスアクティベーションユニット２５４は、コマンド検出ユニット５１０と、セキュリティレベル決定ユニット５２０と、話者検証ユニット５３０とを含む。コマンド検出ユニット５１０は、入力音ストリームから、アプリケーションにアクセスするためのボイスコマンドを認識し、セキュリティレベル決定ユニット５２０はアプリケーションについてのセキュリティレベルを決定する。次いで、話者検証ユニット５３０は、ボイスコマンドが許可されたユーザからのものであることを検証された場合、アプリケーションにアクセスする。

[055]ボイスアクティベーションユニット２５４では、コマンド検出ユニット５１０は、音声検出器２５２から入力音ストリームを受信し、入力音ストリームから、アプリケーションにアクセスするためのボイスコマンドを認識するように構成される。ボイスコマンドを認識するために、コマンド検出ユニット５１０は、受信された入力音ストリームから１つまたは複数の音特徴（たとえば、オーディオフィンガーフィンガープリント、ＭＦＣＣベクトル）を抽出する。抽出された音特徴は、次いで、ボイスコマンドを認識するために、ＨＭＭ、ＳＭＭなどに基づく任意の好適な音声認識方法を使用して分析される。一実施形態では、コマンド検出ユニット５１０は、入力音ストリームを音素などの複数の基本音単位に分割し、次いで、ボイスコマンドを認識するために、記憶ユニット２７０に記憶されたボイスコマンドについての音声または音響モデルにアクセスし得る。ボイスコマンドが認識された場合、コマンド検出ユニット５１０は、認識されたボイスコマンドをセキュリティレベル決定ユニット５２０に送信する。一実施形態では、抽出された音特徴は、ボイスコマンドを検証する際に使用するために話者検証ユニット５３０に送信され得る。

[056]セキュリティレベル決定ユニット５２０は、ボイスコマンドを受信し、認識されたボイスコマンドに基づいて、アクセスされるべきアプリケーションを識別する。一実施形態では、複数のコマンドと、ボイスコマンドに関連するアプリケーション識別子と、アプリケーションについてのセキュリティレベルとが記憶ユニット２７０のアプリケーションセキュリティデータベース３１０に記憶される。ボイスコマンドに基づいて、セキュリティレベル決定ユニット５２０は、アプリケーションセキュリティデータベース３１０から、アクセスされるべきアプリケーションを識別する。セキュリティレベル決定ユニット５２０はまた、アプリケーションセキュリティデータベース３１０から、アクセスされるべきアプリケーションに関連するセキュリティレベルを決定し得る。次いで、アプリケーションにアクセスするためのアプリケーション識別子、およびそれのセキュリティレベルが話者検証ユニット５３０に送信される。

[057]話者検証ユニット５３０は、入力音ストリームと、それのセキュリティレベルをもつアプリケーション識別子とを受信し、ボイスコマンドが、アプリケーションにアクセスすることを許可されたユーザからのものであるかどうかを検証するように構成される。話者検証ユニット５３０は、話者モデル３３０に基づいて入力音ストリーム中のボイスコマンドの信頼性値を決定し、入力音ストリームから抽出された音特徴を決定し得る。この場合、話者検証ユニット５３０は、入力音ストリームから音特徴を抽出するか、またはコマンド検出ユニット５１０から受信された抽出された音特徴を使用し得る。一実施形態では、音特徴の各々についての信頼性値は、話者モデル３３０に基づいて計算され得、音特徴の信頼性値の平均値は、ボイスコマンドについての信頼性値として使用され得る。

[058]話者検証ユニット５３０はまた、記憶ユニット２７０中の話者検証データベース３２０からアプリケーション識別子のセキュリティレベルについてのしきい値を取得するように構成される。話者検証ユニット５３０は、次いで、信頼性値がしきい値を超えるかどうかを決定するために、しきい値とボイスコマンドの信頼性値とを比較する。信頼性値がしきい値を超えない場合、ボイスコマンドは、許可されたユーザからのものであることを検証されない。この場合、話者検証ユニット５３０は、アプリケーションにアクセスするためのボイスコマンドをさらに認証するために話者から追加の入力を受信し得る。話者が検証されない場合、アプリケーションはアクセスされない。

[059]一方、ボイスコマンドの信頼性値がしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。話者検証ユニット５３０は、次いで、ボイスコマンドに応答して識別されたアプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、話者検証ユニット５３０は、アクセスされるアプリケーションについてのセキュリティレベルと、ボイスコマンドについての信頼性値と、ボイスコマンドについての新しい音サンプルとしての音特徴とをデータベース更新ユニット２６０に送信する。

[060]図６に、本開示の一実施形態による、電子デバイス２００においてボイスコマンドに基づいてアプリケーションに対するアクセスを制御するための方法６００のフローチャートを示す。電子デバイス２００は複数のアプリケーションを備える。アプリケーションの各々は、アプリケーションにアクセスするためのしきい値として最小信頼性値を有するセキュリティレベルに関連する。

[061]６１０において、話者から、複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを含む入力音ストリームを受信する。ボイスコマンドが、ターゲットアプリケーションにアクセスするためのコマンドとして認識されると、次いで、６２０において、ボイスコマンドが、許可されたユーザの話者モデル３３０に基づいて、許可されたユーザを示すかどうかを検証する。ボイスコマンドが検証された場合、ターゲットアプリケーションにアクセスするためのアクティベーション信号が生成され、ターゲットアプリケーションはアクセスされる。さらに、６３０において、ボイスコマンドが検証された場合、新しい音サンプルとしてボイスコマンドを用いて話者モデル３３０を更新する。６４０において、更新された話者モデルに基づいて、セキュリティレベルについてのしきい値のうちの少なくとも１つを調整する。したがって、電子デバイス２００は、アプリケーションにアクセスするための後続のボイスコマンドを検証するために、更新された話者モデルと調整されたしきい値とを使用し得る。

[062]図７は、本開示の一実施形態による、話者からのボイスコマンドを検証することによってアプリケーションにアクセスするように構成された話者検証ユニット５３０のブロック図である。話者検証ユニット５３０はボイス検証ユニット７１０と２次検証ユニット７４０とを含む。ボイス検証ユニット７１０は、信頼性決定ユニット７２０とアプリケーションアクセスコントローラ７３０とをさらに含む。

[063]ボイス検証ユニット７１０は、セキュリティレベル決定ユニット５２０から、アクセスされるべきアプリケーションを示すアプリケーション識別子と、アプリケーションのセキュリティレベルとを受信する。さらに、ボイス検証ユニット７１０は、音声検出器２５２から入力音ストリームを受信し、入力音ストリームから音特徴を抽出し得る。代替的に、ボイス検証ユニット７１０は、コマンド検出ユニット５１０から、抽出された音特徴を受信し得る。次いで、信頼性決定ユニット７２０は、抽出された音特徴と記憶ユニット２７０からの話者モデル３３０とに基づいて、ボイスコマンドの信頼性値を決定する。次いで、ボイスコマンドの信頼性値はアプリケーションアクセスコントローラ７３０に送信される。

[064]信頼性決定ユニット７２０はボイスコマンドの信頼性値を決定する。一実施形態では、信頼性決定ユニット７２０は、話者モデル３３０に基づく音特徴の各々についての信頼性値と、音特徴の信頼性値の平均値とを計算し得る。この場合、平均信頼性値はボイスコマンドについての信頼性値として使用され得る。たとえば、話者モデル３３０が、平均と分散とを含むＧＭＭモデルであるとき、信頼性決定ユニット７２０は、音特徴が信頼性値としてＧＭＭモデルに属する可能性を計算する。次いで、ボイスコマンドの音特徴についての信頼性値は、音特徴についての平均信頼性値を生成するために平均化され得る。他の実施形態では、信頼性決定ユニット７２０は、隠れマルコフモデル、パターンマッチングアルゴリズム、ニューラルネットワーク、ベクトル量子化および決定ツリー、アンチ話者技法（anti-speaker technique）（たとえば、ユニバーサルバックグラウンドモデル（universal background model））など、ボイスコマンドの信頼性値を決定するための任意の他の好適なアルゴリズムを使用し得る。

[065]話者検証データベース３２０から、アプリケーションアクセスコントローラ７３０は、アクセスされるべきアプリケーションについてのセキュリティレベルのしきい値を取得する。次いで、セキュリティレベルのしきい値とボイスコマンドの信頼性値とが比較される。信頼性値がセキュリティレベルのしきい値を超えた場合、ボイスコマンドは、許可されたユーザからのものであることを検証される。この場合、アプリケーションアクセスコントローラ７３０は、アプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、話者モデル３３０を更新し、セキュリティレベルについてのしきい値のうちの少なくとも１つを調整するために、信頼性値、アプリケーションのセキュリティレベル、および新しい音サンプルとしての音特徴はデータベース更新ユニット２６０に送信される。

[066]一方、入力音の信頼性値がセキュリティレベルのしきい値を超えない場合、ボイス検証ユニット７１０は、ボイスコマンドが許可されたユーザからのものであることを検証するために話者から追加の入力を受信するように２次検証ユニット７４０に通知する。その場合、２次検証ユニット７４０は、Ｉ／Ｏユニット２２０を介して、追加のボイスサンプル、パスワード、虹彩走査、指紋走査、顔走査などを含む生体走査など、１つまたは複数の入力を与えるように話者に要求し得る。

[067]話者から入力が受信されると、２次検証ユニット７４０は、追加の入力が許可されたユーザからのものであるかどうかを決定するように構成される。たとえば、２次検証ユニット７４０が検証のためのパスワードを要求した場合、話者は、Ｉ／Ｏユニット２２０におけるキーパッドを介してパスワードを入力し得る。入力されたパスワードが、記憶ユニット２７０に記憶された許可されたユーザのパスワードと同じであるとき、２次検証ユニット７４０は、ボイスコマンドの話者が許可されたユーザであることを検証されたことをアプリケーションアクセスコントローラ７３０に通知する。別の例では、追加のボイスサンプルが受信されたとき、それは、追加のボイスサンプルが許可されたユーザからのものであることを検証するために、ボイス検証ユニット７１０に送信され得る。

[068]追加の話者検証に基づいて、２次検証ユニット７４０は、最初に検証されなかったボイスコマンドが、アプリケーションにアクセスすることを許可されたユーザからのものであることを検証し得る。ボイスコマンドの話者が追加の話者検証に基づいて検証された場合、２次検証ユニット７４０は、ボイスコマンドの話者が検証されたことをボイス検証ユニット７１０に通知する。それに応じて、アプリケーションアクセスコントローラ７３０は、アプリケーションにアクセスするためのアクティベーション信号を生成する。さらに、アプリケーションアクセスコントローラ７３０は、信頼性値と、アプリケーションのセキュリティレベルと、新しい音サンプルとしてのボイスコマンドの音特徴とをデータベース更新ユニット２６０に送信する。

[069]図８に、本開示の一実施形態による、検証されたボイスコマンドに基づいて、話者モデル３３０を更新し、セキュリティレベル３１６についてのしきい値３２２を調整するように構成されたデータベース更新ユニット２６０のブロック図を示す。検証されたボイスコマンドに応答して、話者モデル３３０が更新され、セキュリティレベル３１６についてのしきい値３２２が調整されたとき、それらは、アプリケーションにアクセスするための後続のボイスコマンドを検証するために使用され得る。データベース更新ユニット２６０は話者モデル更新ユニット８１０としきい値調整ユニット８２０とを含む。

[070]話者モデル更新ユニット８１０は、検証されたボイスコマンドについての新しい音サンプルと、新しい音サンプルについて決定された信頼性値とを受信するように構成される。話者モデル更新ユニット８１０は、次いで、新しい音サンプルを追加することによって、話者検証データベース３２０の音サンプル３２４を更新する。一実施形態では、音サンプル３２４は、それらの信頼性値に基づいて、関連するセキュリティレベル３１６にマッピングされる。たとえば、新しい音サンプルに関連する信頼性値が９．１であり、セキュリティレベル「１」のしきい値が９．０である場合、新しい音サンプルはセキュリティレベル「１」にマッピングされる。

[071]図示のように、話者モデル更新ユニット８１０は、平均３３２と分散３３４とに基づいて新しい平均と新しい分散とを決定し、新しい音サンプルの信頼性値を決定することによって、話者モデル３３０を更新する。代替的に、話者モデル更新ユニット８１０は、話者モデル３３０についての新しい平均と新しい分散とを決定するために、更新された音サンプル３２４を使用し得る。話者モデル３３０の新しい平均と分散とを決定する際に、新しい音サンプルは、それの信頼性値に従って重み付けされ得る。たとえば、新しい音サンプルの信頼性値が低い場合、新しい音サンプルは、話者モデル３３０の新しい平均と分散とを計算する際に低い重みを与えられ得る。一方、新しい音サンプルの信頼性値が高い場合、新しい音サンプルは、話者モデル３３０の新しい平均と分散とを計算する際に高い重みを与えられ得る。

[072]いくつかの実施形態では、話者モデル３３０の平均３３２および分散３３４は、最大事後確率（ＭＡＰ：Maximum a posteriori）適応技法を使用することによって更新され得る。この場合、平均３３２および／または分散３３４は、前の平均および／または分散と、新しい音サンプルを使用して計算される新しい平均および／または分散との線形結合を実行することによって更新される。前の平均および／または分散と新しい平均および／または分散との各々は、新しい音サンプルの信頼性値に基づいて別様に重み付けされる。たとえば、新しい音サンプルの信頼性値が高い場合、新しい平均についての大きい係数値が、線形結合を実行するときに使用され得る。新しい音サンプルを使用して、話者モデル３３０の平均３３２および分散３３４は、次いで更新され得る。話者モデル更新ユニット８１０はまた、話者モデル３３０が更新されたことをしきい値調整ユニット８２０に通知する。

[073]しきい値調整ユニット８２０は、話者モデル更新ユニット８１０から更新通知を受信するように構成される。しきい値調整ユニット８２０は、次いで、更新された音サンプル３２４についての信頼性値を再計算するために、更新された話者モデル３３０にアクセスする。一実施形態では、しきい値調整ユニット８２０は、アクセスされたアプリケーションのセキュリティレベルに関連する音サンプルについての信頼性値を再計算し得る。再計算された信頼性値は、次いで、アクセスされたアプリケーションのセキュリティレベルについての新しいしきい値を決定するために使用され得る。たとえば、新しいしきい値は、再計算された信頼性値の中の最小信頼性値であり得る。したがって、最小信頼性値がセキュリティレベルについての前のしきい値とは異なる場合、しきい値は、再計算された信頼性値の中の最小信頼性値に調整され得る。

[074]代替的に、しきい値調整ユニット８２０は、話者検証データベース３２０中の音サンプル３２４についての信頼性値を再計算し得る。この場合、話者検証データベース３２０中のセキュリティレベル３１６についてのしきい値３２２は、セキュリティレベル３１６のための新しい最小信頼性値を反映するように調整され得る。別の実施形態では、しきい値調整ユニット８２０は、新しい音サンプルがマッピングされる、セキュリティレベルに関連する音サンプル３２４についての信頼性値を再計算し得る。このセキュリティレベルについてのしきい値は、セキュリティレベルに関連する音サンプルについての再計算された信頼性値の中の最小信頼性値になるように調整されることになる。

[075]図９に、本開示の一実施形態による、検証されたボイスコマンドについての新しい音サンプルを用いて更新され得る話者検証データベース３２０の図を示す。話者検証データベース３２０は、しきい値９．０、７．０、５．０、３．０、および１．０にそれぞれ関連する５つのセキュリティレベル「１」〜「５」を含む。しきい値の各々は、関連するセキュリティレベルについての最小信頼性値を示す。セキュリティレベル「１」〜「５」はまた、音サンプルグループ９１０、９２０、９３０、９４０、および９５０にそれぞれ関連する。音サンプルグループ９１０、９２０、９３０、９４０、および９５０の各々は、ＦＩＦＯ（先入れ先出し）データ構造を使用するキュー、バッファなどの形態で実装され得、０から所定の数までの音サンプルのセットを含み得る。

[076]図示の話者検証データベース３２０では、音サンプルグループ９１０、９２０、９３０、９４０、および９５０の各々は最高４つの音サンプルを含み得るが、それはまた、任意の好適な数の音サンプルを含み得る。図９の例では、音サンプルグループ９１０、９２０、９３０、９４０、および９５０は、話者検証データベース３２０の初期セットアップの後に、前に検証されたボイスコマンドについての音サンプルを含む。話者からの後続のボイスコマンドがさらに検証されるので、検証されたコマンドについての音特徴は、話者検証データベース３２０に新しい音サンプルとして追加され得る。

[077]音サンプルは、それらの信頼性値とセキュリティレベル「１」〜「５」についてのしきい値とに基づいて音サンプルグループ９１０〜９５０に割り当てられる。たとえば、音サンプルの信頼性値よりも小さいしきい値を有する１つまたは複数のセキュリティレベルを決定するために、音サンプルの信頼性値がセキュリティレベル「１」〜「５」についてのしきい値と比較され得る。音サンプルは、次いで、決定されたしきい値の中の最高しきい値を有するセキュリティレベルに関連する音サンプルグループに割り当てられる。たとえば、音サンプルＳ３＿２の信頼性値が６．３である場合、しきい値５．０、３．０、および１．０は、信頼性値６．３よりも小さいと決定される。音サンプルＳ３＿２は、次いで、決定されたしきい値５．０、３．０、および１．０の中の最高しきい値５．０を有するセキュリティレベル「３」に関連する音サンプルグループ９３０に割り当てられる。

[078]最初に、図４に示されているように、セキュリティレベルおよびそれらの初期しきい値は、許可されたユーザの音サンプルと無許可のユーザの音サンプルとに基づいて決定される。ボイスコマンドが受信され、検証されるとき、話者検証データベース３２０は、次いで、それらの信頼性値に基づいて、検証されたボイスコマンドについての音サンプルを音サンプルグループ９１０、９２０、９３０、９４０、および９５０に割り当てる。話者検証データベース３２０では、音サンプルグループ９１０、９２０、９３０、９４０、および９５０は、それぞれ、３つの音サンプル（たとえば、Ｓ１＿１、Ｓ１＿２、およびＳ１＿３）と、２つの音サンプル（たとえば、Ｓ２＿１およびＳ２＿２）と、４つの音サンプル（たとえば、Ｓ３＿１、Ｓ３＿２、Ｓ３＿３、およびＳ３＿４）と、１つの音サンプル（たとえば、Ｓ４＿１）と、４つの音サンプル（たとえば、Ｓ５＿１、Ｓ５＿２、Ｓ５＿３、およびＳ５＿４）とを含む。

[079]検証されたボイスコマンドについての新しい音サンプルおよびそれの信頼性値が受信されたとき、音サンプルグループは新しい音サンプルの信頼性値に基づいて決定される。新しい音サンプルは、次いで、決定された音サンプルグループに追加されることになる。たとえば、８．２の信頼性値をもつ新しい音サンプルＳ＿ＩＮが受信された場合、新しい音サンプルは、７．０のしきい値をもつセキュリティレベル「２」の音サンプルグループ９２０に追加される。音サンプルグループが、音サンプルグループ９３０および９５０の場合のようにいっぱいである場合、新しい音サンプルを追加するために、既存の音サンプルが削除され得る。そのようなイベントでは、既存の音サンプルは先入れ先出しに基づいて削除され得る。たとえば、新しい音サンプル（たとえば、Ｓ３＿５）が、最高４つの音サンプルＳ３＿１〜Ｓ３＿４を有する音サンプルグループ９３０に追加されるべきであるとき、第１の音サンプルＳ３＿１は削除され得、新しい音サンプルが音サンプルグループ９３０に追加され得る。

[080]話者検証データベース３２０中の音サンプルが更新された後、データベース更新ユニット２６０は話者モデル３３０の統計データを更新し得る。一実施形態では、話者モデル３３０は、新たに追加された音サンプルの信頼性値を用いて更新され得る。たとえば、話者モデル３３０の新しい統計データは、新しい音サンプルと前の統計データとに基づいて計算され得る。新しい音サンプルのために場所を空けるために既存の音サンプルが削除された場合、新しい統計データは、削除された音サンプルと新しい音サンプルと前の統計データとに基づいて計算され得る。いくつかの実施形態では、新しい音サンプルは、新しい音サンプルの信頼性値に比例して重み付けされ得る。

[081]図１０に、本開示の一実施形態による、ボイスコマンドについての信頼性値に基づいて話者モデル３３０を更新するための方法１０００のフローチャートを示す。ボイスアクティベーションユニット２５４は、ボイスコマンドについての信頼性値を決定することによってボイスコマンドを検証する。ボイスコマンドが検証されると、ボイスアクティベーションユニット２５４は、検証されたボイスコマンドについての１つまたは複数の音特徴を新しい音サンプルとしてデータベース更新ユニット２６０に与える。

[082]図１０に示されているように、１０１０において、データベース更新ユニット２６０は、検証されたボイスコマンドについての新しい音サンプルを受信する。さらに、データベース更新ユニット２６０はまた、ボイスアクティベーションユニット２５４から、検証されたボイスコマンドについての信頼性値を受信する。受信された新しい音サンプルおよび信頼性値は、話者モデル３３０を更新する際に使用される。このプロセスでは、１０２０において、ボイスコマンドについての信頼性値に比例して新しい音サンプルを重み付けする。次いで、１０３０において、重み付けされた新しい音サンプルに基づいて話者モデル３３０を更新する。

[083]図１１に、本開示の一実施形態による、新しい音サンプルＳ＿ＩＮを受信したことに応答して、新しい音サンプルＳ＿ＩＮのセキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース３２０の図を示す。この実施形態では、新しい音サンプルＳ＿ＩＮは、話者検証データベース３２０を更新するために、それの信頼性値に従って、セキュリティレベル「１」に関連する音サンプルグループ９１０に追加される。上記で説明したように、話者モデル３３０は、次いで、話者検証データベース３２０中の新しい音サンプルＳ＿ＩＮに基づいて更新され得る。

[084]話者モデル３３０が更新された後、データベース更新ユニット２６０は、新しい音サンプルＳ＿ＩＮを含むセキュリティレベル「１」についての音サンプルグループ９１０に関連するしきい値９．０を更新する。この場合、セキュリティレベル「１」に関連する音サンプルグループ９１０中の音サンプル（たとえば、Ｓ１＿１、Ｓ１＿２、Ｓ１＿３、およびＳ＿ＩＮ）についての信頼性値は、更新された話者モデル３３０を使用して再計算される。次いで、再計算された信頼性値の中の最小信頼性値が、セキュリティレベル「１」についての新しいしきい値として選択され得る。したがって、セキュリティレベル「１」についての前に設定された９．０のしきい値が最小信頼性値とは異なる場合、図１１中の矢印によって示されるように、しきい値は最小信頼性値に調整され得る。

[085]図１２に、本開示の一実施形態による、新しい音サンプルＳ＿ＩＮを受信したことに応答して、新しい音サンプルＳ＿ＩＮのセキュリティレベルとは異なるセキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース３２０の図を示す。図１１と同様に、新しい音サンプルＳ＿ＩＮは、話者検証データベース３２０を更新するために、それの信頼性値に従って、セキュリティレベル「１」に関連する音サンプルグループ９１０に追加される。また、話者モデル３３０は、話者検証データベース３２０中の新しい音サンプルＳ＿ＩＮに基づいて更新され得る。

[086]図示の実施形態では、データベース更新ユニット２６０は、ボイスアクティベーションユニット２５４から、検証されたボイスコマンドに関連するアプリケーションに関連するセキュリティレベルを受信する。この例では、アプリケーションに関連するセキュリティレベルは、セキュリティレベル「３」であると仮定される。したがって、データベース更新ユニット２６０は、セキュリティレベル「３」についての音サンプルグループ９３０に関連するしきい値５．０を更新する。この場合、セキュリティレベル「３」に関連する音サンプルグループ９３０中の音サンプル（たとえば、Ｓ３＿１、Ｓ３＿２、Ｓ３＿３、およびＳ３＿４）についての信頼性値は、更新された話者モデル３３０を使用して再計算される。次いで、再計算された信頼性値の中の最小信頼性値が、セキュリティレベル「３」についての新しいしきい値として選択され得る。したがって、セキュリティレベル「３」についての前に設定された５．０のしきい値が最小信頼性値とは異なる場合、図１２中の矢印によって示されるように、しきい値は最小信頼性値に調整され得る。

[087]図１３に、本開示の一実施形態による、新しい音サンプルＳ＿ＩＮを受信したことに応答して、セキュリティレベルについてのしきい値がそこにおいて調整される話者検証データベース３２０の図を示す。図１１と同様に、新しい音サンプルＳ＿ＩＮは、話者検証データベース３２０を更新するために、それの信頼性値に従って、セキュリティレベル「１」に関連する音サンプルグループ９１０に追加される。また、話者モデル３３０は、話者検証データベース３２０中の新しい音サンプルＳ＿ＩＮに基づいて更新され得る。

[088]更新された話者モデルを用いて、データベース更新ユニット２６０は、セキュリティレベル「１」〜「５」についての音サンプルグループ９１０、９２０、９３０、９４０、および９５０に関連するしきい値（たとえば、９．０、７．０、５．０、３．０、および１．０）を更新する。この場合、音サンプルグループ９１０（たとえば、Ｓ１＿１、Ｓ１＿２、Ｓ１＿３、およびＳ＿ＩＮ）、音サンプルグループ９２０（たとえば、Ｓ２＿１およびＳ２＿２）、音サンプルグループ９３０（たとえば、Ｓ３＿１、Ｓ３＿２、Ｓ３＿３、およびＳ３＿４）、音サンプルグループ９４０（たとえば、Ｓ４＿１）、ならびに音サンプルグループ９５０（たとえば、Ｓ５＿１、Ｓ５＿２、Ｓ５＿３、およびＳ５＿４）中の音サンプルについての信頼性値は、更新された話者モデル３３０に基づいて再計算される。音サンプルグループ９１０、９２０、９３０、９４０、および９５０の各々における音サンプルについての再計算された信頼性値の中で最小信頼性値が選択され、選択された最小信頼性値は、それぞれ、セキュリティレベル「１」〜「５」についての新しいしきい値であると決定される。したがって、セキュリティレベル「１」〜「５」についてのしきい値は、図１３中の矢印によって示されるようにセキュリティレベル「１」〜「５」についての新しい最小信頼性値を反映するように調整され得る。

[089]別の実施形態では、話者検証データベース３２０は、すべての前に検証されたボイスコマンドをもつ音サンプルグループを音サンプルとして含み得る。新しい音サンプルが受信および検証されたとき、新しい音サンプルは音サンプルグループに追加される。上記で説明したように、話者モデル３３０は、話者検証データベース３２０中の新しい音サンプルに基づいて更新され得る。

[090]更新された話者モデル３３０に基づいて、新しい音サンプルを含む音サンプルグループ中の音サンプルのすべてについての信頼性値が決定され得る。最低信頼性値および最高信頼性値が信頼性値の中で選択され得、最低値は、最低セキュリティレベル（たとえば、セキュリティレベル「５」）についてのしきい値であると決定され得る。最高信頼性値と最低信頼性値との間の差は、次いで、各範囲が下限を有する複数の範囲に区分され得る。いくつかの実施形態では、差は、しきい値増分を計算するために、セキュリティレベルの数で除算され得る。下限は、次いで、セキュリティレベル（たとえば、セキュリティレベル「１」、「２」、「３」、および「４」）についてのしきい値として割り当てられ得る。

[091]図１４に、本開示の一実施形態による、複数のセキュリティレベルについての複数のしきい値を調整するための方法１４００のフローチャートを示す。ボイスコマンドが検証された後、データベース更新ユニット２６０は、検証されたボイスコマンドについての新しい音サンプルを受信する。新しい音サンプルは、次いで、それの信頼性値に従ってセキュリティレベルに関連する音サンプルグループに追加され、話者モデル３３０は、新しい音サンプルに基づいて更新される。

[092]次いで、１４１０において、更新された話者モデル３３０に基づいて、複数のセキュリティレベルの中で選択されたセキュリティレベルに関連する音サンプルの各々についての新しい信頼性値を決定する。一実施形態では、セキュリティレベルは、新しい音サンプルの信頼性値に従って選択される。別の実施形態では、ボイスコマンドのアプリケーションにマッピングされたセキュリティレベルが複数のセキュリティレベルの中で選択される。代替的に、データベース更新ユニット２６０は、セキュリティレベルを選択することなしにすべてのセキュリティレベルについての音サンプルの新しい信頼性値を決定し得る。

[093]１４２０において、選択されたセキュリティレベルに関連する音サンプルについての新しい信頼性値の中で最小信頼性値を選択する。次いで、１４３０において、選択されたセキュリティレベルの前のしきい値を最小信頼性値に調整する。すべてのセキュリティレベルについての新しい信頼性値を決定する場合、セキュリティレベルの各々についての新しい信頼性値の中で最小信頼性値が選択され、選択された最小信頼性値は、それぞれ、セキュリティレベルについての新しいしきい値であると決定される。

[094]図１５は、本開示のいくつかの実施形態による、アプリケーションへのアクセスを制御するための方法および装置が実装され得る例示的なモバイルデバイス１５００のブロック図である。モバイルデバイス１５００の構成は、図１〜図１４を参照しながら説明した上記の実施形態に従ってモバイルデバイス中で実装され得る。モバイルデバイス１５００は、セルラーフォン、スマートフォン、端末、ハンドセット、携帯情報端末（ＰＤＡ）、ワイヤレスモデム、コードレスフォンなどであり得る。ワイヤレス通信システムは、符号分割多元接続（ＣＤＭＡ）システム、モバイル通信用ブロードキャストシステム（ＧＳＭ（登録商標）：Broadcast System for Mobile Communications）システム、広帯域ＣＤＭＡ（ＷＣＤＭＡ（登録商標））システム、ロングターンエボリューション（ＬＴＥ（登録商標）：Long Tern Evolution）システム、ＬＴＥＡｄｖａｎｃｅｄシステムなどであり得る。さらに、モバイルデバイス１５００は、たとえば、Ｗｉ−ＦｉＤｉｒｅｃｔ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＦｌａｓｈＬｉｎｑ技術を使用して、別のモバイルデバイスと直接通信し得る。

[095]モバイルデバイス１５００は、受信経路および送信経路を介して双方向通信を行うことが可能である。受信経路上では、基地局によって送信された信号は、アンテナ１５１２によって受信され、受信機（ＲＣＶＲ）１５１４に与えられる。受信機１５１４は、受信信号を調整し、デジタル化し、さらなる処理のために調整およびデジタル化されたデジタル信号などのサンプルをデジタルセクションに与える。送信経路上では、送信機（ＴＭＴＲ）１５１６は、デジタルセクション１５２０から送信されるべきデータを受信し、データを処理し、調整し、被変調信号を生成し、被変調信号はアンテナ１５１２を介して基地局に送信される。受信機１５１４および送信機１５１６は、ＣＤＭＡ、ＧＳＭ、ＬＴＥ、ＬＴＥアドバンストなどをサポートし得るトランシーバの一部であり得る。

[096]デジタルセクション１５２０は、たとえば、モデムプロセッサ１５２２、縮小命令セットコンピュータ／デジタル信号プロセッサ（ＲＩＳＣ／ＤＳＰ）１５２４、コントローラ／プロセッサ１５２６、内部メモリ１５２８、一般化オーディオエンコーダ１５３２、一般化オーディオデコーダ１５３４、グラフィックス／ディスプレイプロセッサ１５３６、および外部バスインターフェース（ＥＢＩ）１５３８など、様々な処理ユニット、インターフェースユニット、およびメモリユニットを含む。モデムプロセッサ１５２２は、データ送信および受信のための処理、たとえば、符号化、変調、復調、および復号を実行し得る。ＲＩＳＣ／ＤＳＰ１５２４は、モバイルデバイス１５００のための一般的処理と専用処理とを実行し得る。コントローラ／プロセッサ１５２６は、デジタルセクション１５２０内の様々な処理ユニットおよびインターフェースユニットの演算を実行し得る。内部メモリ１５２８は、デジタルセクション１５２０内の様々なユニットのためのデータおよび／または命令を記憶し得る。

[097]一般化オーディオエンコーダ１５３２は、オーディオソース１５４２、マイクロフォン１５４３などからの入力信号に対して符号化を実行し得る。一般化オーディオデコーダ１５３４は、コード化オーディオデータに対して復号を実行し得、出力信号を機能決定エンジン１５４４に与え得る。グラフィックス／ディスプレイプロセッサ１５３６は、ディスプレイユニット１５４６に提示され得る、グラフィックス、ビデオ、画像、およびテキストのための処理を実行し得る。ＥＢＩ１５３８は、デジタルセクション１５２０とデータベース１５４８との間のデータの転送を可能にし得る。

[098]デジタルセクション１５２０は、１つまたは複数のプロセッサ、ＤＳＰ、マイクロプロセッサ、ＲＩＳＣなどを用いて実装され得る。デジタルセクション１５２０はまた、１つまたは複数の特定用途向け集積回路（ＡＳＩＣ）、および／または何らかの他のタイプの集積回路（ＩＣ）上に作製され得る。

[099]概して、本明細書で説明したいかなるデバイスも、ワイヤレスフォン、セルラーフォン、ラップトップコンピュータ、ワイヤレスマルチメディアデバイス、ワイヤレス通信パーソナルコンピュータ（ＰＣ）カード、ＰＤＡ、外部または内部モデム、ワイヤレスチャネルを介して通信するデバイスなど、様々なタイプのデバイスを表し得る。デバイスは、アクセス端末（ＡＴ）、アクセスユニット、加入者ユニット、移動局、モバイルデバイス、モバイルユニット、モバイルフォン、モバイル、リモート局、リモート端末、リモートユニット、ユーザデバイス、ユーザ機器、ハンドヘルドデバイスなど、様々な名前を有し得る。本明細書で説明したいかなるデバイスも、命令とデータとを記憶するためのメモリ、ならびにハードウェア、ソフトウェア、ファームウェア、またはそれらの組合せを有し得る。

[0100]本明細書で説明した技法は、様々な手段によって実装され得る。たとえば、これらの技法は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実装され得る。さらに、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者は諒解されよう。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップについて、上記では概してそれらの機能に関して説明した。そのような機能がハードウェアとして実装されるか、ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。

[0100]ハードウェア実装の場合、本技法を実行するために使用される処理ユニットは、１つまたは複数のＡＳＩＣ、ＤＳＰ、デジタル信号処理デバイス（ＤＳＰＤ）、プログラマブル論理デバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書で説明した機能を実行するように設計された他の電子ユニット、コンピュータ、またはそれらの組合せ内で実装され得る。

[0101]したがって、本明細書の開示に関して説明した様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、ＤＳＰ、ＡＳＩＣ、ＦＰＧＡまたは他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいは本明細書で説明した機能を実行するように設計されたそれらの任意の組合せで実装または実行される。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成としても実装され得る。

[0102]ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され得る。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体とコンピュータ通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージまたは他の磁気ストレージデバイス、あるいは命令またはデータ構造の形態の所望のプログラムコードを搬送または記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。さらに、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびｂｌｕ−ｒａｙ（登録商標）ディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。

[0103]本開示の前述の説明は、いかなる当業者でも本開示を作成または使用することができるように提供される。本開示への様々な修正は当業者には容易に明らかとなり、本明細書で定義した一般原理は、本開示の趣旨または範囲から逸脱することなく他の変形形態に適用される。したがって、本開示は、本明細書で説明した例に限定されるものではなく、本明細書で開示した原理および新規の特徴に合致する最も広い範囲を与えられるべきである。

[0104]例示的な実装形態は、１つまたは複数のスタンドアロンコンピュータシステムの文脈で、本開示の主題の態様を利用することに言及するが、主題は、そのように限定されるのではなく、ネットワークまたは分散コンピューティング環境など、任意のコンピューティング環境に関連して実施され得る。またさらに、本開示の主題の態様は、複数の処理チップまたはデバイスにおいてあるいはそれらにわたって実装され得、同様に複数のデバイスにわたって記憶が実施され得る。そのようなデバイスは、ＰＣと、ネットワークサーバと、ハンドヘルドデバイスとを含み得る。

[0105]主題について構造的機能および／または方法論的行為に特有の言語で説明したが、添付の特許請求の範囲において定義される主題は、必ずしも上記で説明した特定の特徴または行為に限定されるとは限らないことを理解されたい。むしろ、上記で説明した特定の特徴および行為は、特許請求の範囲を実施することの例示的な形態として開示される。

[0105]主題について構造的機能および／または方法論的行為に特有の言語で説明したが、添付の特許請求の範囲において定義される主題は、必ずしも上記で説明した特定の特徴または行為に限定されるとは限らないことを理解されたい。むしろ、上記で説明した特定の特徴および行為は、特許請求の範囲を実施することの例示的な形態として開示される。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[Ｃ１] 電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法であって、前記方法は、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整することとを備える、方法。
[Ｃ２] 前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することとをさらに備える、Ｃ１に記載の方法。
[Ｃ３] 前記ボイスコマンドが前記ユーザを示すかどうかを検証することは、
前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、
前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを備える、Ｃ１に記載の方法。
[Ｃ４] 前記話者モデルを更新することが、
前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、
前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを備える、Ｃ３に記載の方法。
[Ｃ５] 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも１つの音特徴の統計データを備える、Ｃ１に記載の方法。
[Ｃ６] 前記話者モデルを更新することが、前記ボイスコマンドから抽出された少なくとも１つの音特徴を用いて前記統計データを更新することを備える、Ｃ５に記載の方法。
[Ｃ７] 前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを備える、Ｃ１に記載の方法。
[Ｃ８] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、Ｃ７に記載の方法。
[Ｃ９] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、Ｃ７に記載の方法。
[Ｃ１０] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、Ｃ７に記載の方法。
[Ｃ１１] 前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを備える、Ｃ１に記載の方法。
[Ｃ１２] 前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることとを備える、Ｃ１１に記載の方法。
[Ｃ１３] 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、Ｃ１に記載の方法。
[Ｃ１４] 前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの１つに追加することをさらに備える、Ｃ１３に記載の方法。
[Ｃ１５] 前記ボイスコマンドが前記ユーザを示すことを検証されない場合、前記話者からの入力に基づいて前記ボイスコマンドを前記ユーザのものであると認証することをさらに備える、Ｃ１に記載の方法。
[Ｃ１６] 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも１つを含む、Ｃ１５に記載の方法。
[Ｃ１７] 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサーと、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニットと、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するように構成された話者検証ユニットと、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整するように構成されたデータベース更新ユニットとを備える、電子デバイス。
[Ｃ１８] 前記音センサーが、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するようにさらに構成され、
前記話者検証ユニットは、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するようにさらに構成された、Ｃ１７に記載の電子デバイス。
[Ｃ１９] 前記話者検証ユニットは、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うようにさらに構成された、Ｃ１７に記載の電子デバイス。
[Ｃ２０] 前記データベース更新ユニットが、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うようにさらに構成された、Ｃ１９に記載の電子デバイス。
[Ｃ２１] 前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも１つの音特徴の統計データを備える、Ｃ１７に記載の電子デバイス。
[Ｃ２２] 前記データベース更新ユニットが、前記ボイスコマンドから抽出された少なくとも１つの音特徴を用いて前記統計データを更新するようにさらに構成された、Ｃ２１に記載の電子デバイス。
[Ｃ２３] 前記データベース更新ユニットが、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、Ｃ１７に記載の電子デバイス。
[Ｃ２４] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、Ｃ２３に記載の電子デバイス。
[Ｃ２５] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、Ｃ２３に記載の電子デバイス。
[Ｃ２６] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、Ｃ２３に記載の電子デバイス。
[Ｃ２７] 前記データベース更新ユニットが、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、Ｃ１７に記載の電子デバイス。
[Ｃ２８] 前記データベース更新ユニットが、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、前記データベース更新ユニットが、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、Ｃ２７に記載の電子デバイス。
[Ｃ２９] 前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、Ｃ１７に記載の電子デバイス。
[Ｃ３０] 前記データベース更新ユニットが、前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの１つに追加するようにさらに構成された、Ｃ２９に記載の電子デバイス。
[Ｃ３１] 前記ボイスコマンドが前記許可されたユーザを示すことを検証されない場合、前記話者検証ユニットが、前記話者からの入力に基づいて前記ボイスコマンドを認証するようにさらに構成された、Ｃ１７に記載の電子デバイス。
[Ｃ３２] 前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも１つを含む、Ｃ３１に記載の電子デバイス。
[Ｃ３３] 複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するための手段と、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するための手段と、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するための手段と、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整するための手段とを備える、電子デバイス。
[Ｃ３４] 受信するための前記手段が、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するように構成され、
検証するための前記手段は、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するように構成された、Ｃ３３に記載の電子デバイス。
[Ｃ３５] 検証するための前記手段は、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うように構成された、Ｃ３３に記載の電子デバイス。
[Ｃ３６] 更新するための前記手段が、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うように構成された、Ｃ３５に記載の電子デバイス。
[Ｃ３７] 更新するための前記手段が、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うように構成された、Ｃ３３に記載の電子デバイス。
[Ｃ３８] 前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、Ｃ３７に記載の電子デバイス。
[Ｃ３９] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、Ｃ３７に記載の電子デバイス。
[Ｃ４０] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、Ｃ３７に記載の電子デバイス。
[Ｃ４１] 更新するための前記手段が、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、Ｃ３３に記載の電子デバイス。
[Ｃ４２] 更新するための前記手段が、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、更新するための前記手段が、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、Ｃ４１に記載の電子デバイス。
[Ｃ４３] 複数のアプリケーションへのアクセスを制御するための命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令は、電子デバイスのプロセッサに、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整することとの動作を実行させる、非一時的コンピュータ可読記憶媒体。
[Ｃ４４] 前記命令は、
前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することとをさらに備える、Ｃ４３に記載の記憶媒体。
[Ｃ４５] 前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを備える、Ｃ４３に記載の記憶媒体。
[Ｃ４６] 前記少なくとも１つの音サンプルが複数の音サンプルを含む場合、前記選択されたセキュリティレベルの前記しきい値が、前記複数の音サンプルについての前記信頼性値の中の最低信頼性値に調整される、Ｃ４５に記載の記憶媒体。
[Ｃ４７] 前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、Ｃ４５に記載の記憶媒体。
[Ｃ４８] 前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、Ｃ４５に記載の記憶媒体。
[Ｃ４９] 前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを備える、Ｃ４３に記載の記憶媒体。
[Ｃ５０] 前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることとを備える、Ｃ４９に記載の記憶媒体。

Claims

電子デバイスにおける複数のアプリケーションへのアクセスを制御するための方法であって、前記方法は、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整することと
を備える、方法。
前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することと
をさらに備える、請求項１に記載の方法。
前記ボイスコマンドが前記ユーザを示すかどうかを検証することは、
前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、
前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることと
を備える、請求項１に記載の方法。
前記話者モデルを更新することが、
前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、
前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することと
を備える、請求項３に記載の方法。
前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも１つの音特徴の統計データを備える、請求項１に記載の方法。
前記話者モデルを更新することが、前記ボイスコマンドから抽出された少なくとも１つの音特徴を用いて前記統計データを更新することを備える、請求項５に記載の方法。
前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することと
を備える、請求項１に記載の方法。
前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項７に記載の方法。
前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項７に記載の方法。
前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項７に記載の方法。
前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することと
を備える、請求項１に記載の方法。
前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることと
を備える、請求項１１に記載の方法。
前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、請求項１に記載の方法。
前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの１つに追加することをさらに備える、請求項１３に記載の方法。
前記ボイスコマンドが前記ユーザを示すことを検証されない場合、前記話者からの入力に基づいて前記ボイスコマンドを前記ユーザのものであると認証することをさらに備える、請求項１に記載の方法。
前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも１つを含む、請求項１５に記載の方法。
複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するように構成された音センサーと、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するように構成された記憶ユニットと、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するように構成された話者検証ユニットと、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整するように構成されたデータベース更新ユニットと
を備える、電子デバイス。
前記音センサーが、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するようにさらに構成され、
前記話者検証ユニットは、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するようにさらに構成された、請求項１７に記載の電子デバイス。
前記話者検証ユニットは、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うようにさらに構成された、請求項１７に記載の電子デバイス。
前記データベース更新ユニットが、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うようにさらに構成された、請求項１９に記載の電子デバイス。
前記話者モデルが、前記許可されたユーザの複数の音サンプルから抽出された少なくとも１つの音特徴の統計データを備える、請求項１７に記載の電子デバイス。
前記データベース更新ユニットが、前記ボイスコマンドから抽出された少なくとも１つの音特徴を用いて前記統計データを更新するようにさらに構成された、請求項２１に記載の電子デバイス。
前記データベース更新ユニットが、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項１７に記載の電子デバイス。
前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項２３に記載の電子デバイス。
前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項２３に記載の電子デバイス。
前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項２３に記載の電子デバイス。
前記データベース更新ユニットが、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項１７に記載の電子デバイス。
前記データベース更新ユニットが、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、前記データベース更新ユニットが、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、請求項２７に記載の電子デバイス。
前記セキュリティレベルの各々が、前記セキュリティレベルについての前記しきい値よりも大きい信頼性値を有する音サンプルのセットに関連する、請求項１７に記載の電子デバイス。
前記データベース更新ユニットが、前記ボイスコマンドを、前記ボイスコマンドの信頼性値に基づいて選択されたセキュリティレベルについての音サンプルの前記セットのうちの１つに追加するようにさらに構成された、請求項２９に記載の電子デバイス。
前記ボイスコマンドが前記許可されたユーザを示すことを検証されない場合、前記話者検証ユニットが、前記話者からの入力に基づいて前記ボイスコマンドを認証するようにさらに構成された、請求項１７に記載の電子デバイス。
前記話者からの前記入力が、顔の画像と、指紋と、個人識別番号と、追加のボイスコマンドとのうちの少なくとも１つを含む、請求項３１に記載の電子デバイス。
複数のアプリケーションへのアクセスを制御するための電子デバイスであって、前記電子デバイスは、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信するための手段と、
前記複数のアプリケーション、複数のセキュリティレベル、複数のしきい値、および前記アプリケーションにアクセスすることを許可されたユーザの話者モデルを記憶するための手段と、各アプリケーションが、前記複数のしきい値の中のしきい値を有する前記複数のセキュリティレベルの中のセキュリティレベルに関連する、
前記許可されたユーザの前記話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証するための手段と、
前記ボイスコマンドが前記許可されたユーザを示すことを検証された場合に前記ボイスコマンドを用いて前記話者モデルを更新し、前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整するための手段と
を備える、電子デバイス。
受信するための前記手段が、前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信するように構成され、
検証するための前記手段は、前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証するように構成された、請求項３３に記載の電子デバイス。
検証するための前記手段は、前記話者モデルに基づいて前記ボイスコマンドの信頼性値を決定することと、前記ボイスコマンドの前記信頼性値が前記ターゲットアプリケーションの前記セキュリティレベルについての前記しきい値を超えた場合、前記ターゲットアプリケーションにアクセスすることとを行うように構成された、請求項３３に記載の電子デバイス。
更新するための前記手段が、前記ボイスコマンドの前記信頼性値に比例して前記ボイスコマンドを重み付けすることと、前記重み付けされたボイスコマンドに基づいて前記話者モデルを更新することとを行うように構成された、請求項３５に記載の電子デバイス。
更新するための前記手段が、前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することとを行うように構成された、請求項３３に記載の電子デバイス。
前記選択されたセキュリティレベルの前記しきい値が、前記少なくとも１つの音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項３７に記載の電子デバイス。
前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項３７に記載の電子デバイス。
前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項３７に記載の電子デバイス。
更新するための前記手段が、前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することとを行うようにさらに構成された、請求項３３に記載の電子デバイス。
更新するための前記手段が、前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することとを行うようにさらに構成され、
ここにおいて、前記複数の範囲の各々が下限を含み、
ここにおいて、更新するための前記手段が、前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てるようにさらに構成された、請求項４１に記載の電子デバイス。
複数のアプリケーションへのアクセスを制御するための命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令は、電子デバイスのプロセッサに、
話者から、前記複数のアプリケーションの中のターゲットアプリケーションにアクセスするためのボイスコマンドを受信することと、各アプリケーションが、しきい値を有するセキュリティレベルに関連する、
前記アプリケーションにアクセスすることを許可されたユーザの話者モデルに基づいて、前記ボイスコマンドが前記許可されたユーザを示すかどうかを検証することと、
前記ボイスコマンドが前記ユーザを示すことを検証された場合、前記ボイスコマンドを用いて前記話者モデルを更新することと、
前記更新された話者モデルに基づいて前記しきい値のうちの少なくとも１つを調整することと
の動作を実行させる、非一時的コンピュータ可読記憶媒体。
前記命令は、
前記アプリケーションの中の新しいターゲットアプリケーションにアクセスするための新しいボイスコマンドを受信することと、
前記更新された話者モデルに基づいて、前記新しいボイスコマンドが前記アプリケーションにアクセスすることを許可された前記ユーザを示すかどうかを検証することと
をさらに備える、請求項４３に記載の記憶媒体。
前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて、前記セキュリティレベルから選択されたセキュリティレベルに関連する少なくとも１つの音サンプルの各々についての信頼性値を決定することと、
前記信頼性値に基づいて、前記選択されたセキュリティレベルの前記しきい値を新しいしきい値に調整することと
を備える、請求項４３に記載の記憶媒体。
前記少なくとも１つの音サンプルが複数の音サンプルを含む場合、前記選択されたセキュリティレベルの前記しきい値が、前記複数の音サンプルについての前記信頼性値の中の最低信頼性値に調整される、請求項４５に記載の記憶媒体。
前記選択されたセキュリティレベルが、前記ターゲットアプリケーションに関連する前記セキュリティレベルである、請求項４５に記載の記憶媒体。
前記選択されたセキュリティレベルが、前記ボイスコマンドの信頼性値に基づいて決定される、請求項４５に記載の記憶媒体。
前記しきい値のうちの前記少なくとも１つを調整することが、
前記更新された話者モデルに基づいて複数の音サンプルについての信頼性値を決定することと、
前記信頼性値に基づいて、前記しきい値を新しいしきい値に調整することと
を備える、請求項４３に記載の記憶媒体。
前記しきい値を調整することは、
前記信頼性値の中の最低信頼性値と最高信頼性値とを決定することと、
前記最低信頼性値と前記最高信頼性値との間の差を、前記セキュリティレベルに関連する複数の範囲に区分することと、ここにおいて、前記複数の範囲の各々が下限を含む、
前記下限を前記セキュリティレベルについての前記新しいしきい値として割り当てることと
を備える、請求項４９に記載の記憶媒体。