JP2019535035A - 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション - Google Patents
音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション Download PDFInfo
- Publication number
- JP2019535035A JP2019535035A JP2019517878A JP2019517878A JP2019535035A JP 2019535035 A JP2019535035 A JP 2019535035A JP 2019517878 A JP2019517878 A JP 2019517878A JP 2019517878 A JP2019517878 A JP 2019517878A JP 2019535035 A JP2019535035 A JP 2019535035A
- Authority
- JP
- Japan
- Prior art keywords
- electronic device
- user
- voice
- implementations
- devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 claims abstract description 105
- 238000000034 method Methods 0.000 claims abstract description 71
- 230000000007 visual effect Effects 0.000 claims description 37
- 238000003860 storage Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 21
- 230000000670 limiting effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 32
- 238000004891 communication Methods 0.000 description 28
- 238000012549 training Methods 0.000 description 17
- 230000009471 action Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000116 mitigating effect Effects 0.000 description 8
- 230000003213 activating effect Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000002411 adverse Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000005286 illumination Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 241000238558 Eucarida Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101100408383 Mus musculus Piwil1 gene Proteins 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
マイクが組み込まれた電子デバイスは、ユーザからの音声入力を収集しこの音声入力に従って音声起動機能を実現するために、広範囲にわたって使用されてきた。たとえば、多くの最新モバイルデバイスは音声アシスタント機能(たとえばSiri(登録商標)、Googleアシスタント(登録商標))を含む。音声アシスタント機能は、音声入力を用いて、通話を開始する、レストラン検索を実行する、地図上でルーティングを開始する、カレンダーイベントを作成する、ソーシャルネットワークにポストを追加する、歌を認識する、およびその他多くのタスクを完了するように、構成されている。
このように、複数のユーザを扱うため、複数のデバイスを調整してリーダーを決定するため、および雑音緩和のための方法およびシステムを取り入れた音声アシスタントシステムおよび/または音声アシスタントサーバシステムを備える電子デバイスに対する需要がある。上記デバイスおよび/またはサーバシステムは、音声モデルとの比較に基づいて音声入力の話し手を識別し、識別した話し手に合わせてレスポンスをパーソナライズするように構成することができる。また、このデバイスおよび/またはサーバシステムは、話し手に対して返答するためのリーダーシップを複数のデバイスの中で協議により決定するように構成することができる。さらに、このデバイスおよび/またはサーバシステムは、デバイスの周囲の環境の雑音が十分に大きいことを検出しホットワード音声入力に代わるデバイスの起動方法を推奨するように構成することができる。
実装例の説明
デジタル革命は、情報の公開共有から、地球規模の共同体という感覚まで、数多くの利益を提供してきたが、出現した新たな技術はしばしば、消費者の間に混乱、懐疑、および不安を生じさせ、そのために、消費者がこの技術の利益を享受するのが妨げられることがある。電子デバイスは、ユーザからの音声入力を受信し音声起動機能を開始することにより、既存の技術および出現した技術双方にアプローチするための、アイズフリー・ハンズフリーソリューションを提供する、音声インターフェイスとして、便利に使用される。具体的には、電子デバイスで受信する音声入力は、たとえユーザの視線が不明瞭でありかつ手が塞がっていても、命令および情報を伝えることができる。ハンズフリー・アイズフリー体験を可能にするために、音声起動電子デバイスは、常に周囲の音を聴いている(すなわち、常に周囲から収集したオーディオ信号を処理している)、または、トリガされたときにのみ周囲の音を聴く。一方、ユーザのアイデンティティは、ユーザの声とユーザが使用する言語とに関連付けられる。ユーザのアイデンティティを守るために、これらの音声起動電子デバイスは通常、保護され管理された親密な空間(たとえば自宅および自動車)である非公共的な場所で使用される。
図1は、いくつかの実装例に従う動作環境の一例である。動作環境100は、1つ以上の音声起動電子デバイス190(たとえば電子デバイス190−1〜190−N)を含む。この1つ以上の音声起動電子デバイス190は、1つ以上の場所に置かれていてもよい(たとえば、すべてが1つの部屋の中もしくは構造物(structure)の空間の中にあってもよく、1つの構造物の中の複数の空間に分散していてもよく、または、複数の構造物に分散していてもよい(たとえば1つは家屋内、1つはユーザの車の中))。任意に、環境100は、音声起動電子デバイス190が通信できるようにするために用いられる1つ以上のデバイス(たとえばメディアデバイス、スマートホームデバイス)(図示せず)を含む。
いくつかの実装例において、キャストデバイスおよび音声起動電子デバイス190双方が、共通のユーザドメインに委託されリンクされた後に、音声起動電子デバイス190を音声ユーザインターフェイスとして用いて、キャストデバイスにストリーミングされるメディアコンテンツのアイズフリー・ハンズフリー制御を、遠隔制御、クライアントデバイスまたは他の第2の画面デバイスを伴わずに、行うことができる。たとえば、ユーザは、「リビングルームのスピーカでレディー・ガガを再生」といった音声コマンドを与えることができる。レディー・ガガの楽曲またはビデオクリップが、「リビングルームのスピーカ」に対応付けられたキャストデバイスにストリーミングされる。クライアントデバイスも、クライアントデバイスにロードされたいずれのキャストデバイスアプリケーションまたはメディア再生アプリケーションも、関与していない。
いくつかの実装例において、動作環境100は、第1のキャストデバイス(図示せず)と、第1のキャストデバイスに結合された第1の出力デバイス(図示せず)とを含む。また、動作環境100は、第2のキャストデバイス(図示せず)と、第2のキャストデバイスに結合された第2の出力デバイス(図示せず)とを含む。これらのキャストデバイスは、任意に、同一の場所(たとえばリビングルーム)にあってもよく、動作環境100の中の異なる2つの場所(たとえば2つの部屋)にあってもよい。キャストデバイスは各々、それぞれのキャストデバイスに結合された出力デバイスで表示するためのメディアコンテンツまたはインターネットコンテンツをコンテンツホスト114から取得するように構成される。第1および第2のキャストデバイスはどちらも、音声アシスタントサーバ112に通信可能に結合され、任意にクラウドキャストサービスサーバに通信可能に結合され、コンテンツホスト114に通信可能に結合される。
図2A〜図2Bは、いくつかの実装例に従う、動作環境(たとえば動作環境100)においてユーザ音声コマンドを収集するための音声インターフェイスとして適用される一例としての電子デバイス190を示すブロック図である。電子デバイス190は、典型的に、1つ以上の処理ユニット(CPU)502と、1つ以上のネットワークインターフェイス504と、メモリ506と、これらのコンポーネント(チップセットと呼ばれることもある)を相互に接続するための1つ以上の通信バス508とを含む。電子デバイス190は、ボタン512、タッチセンスアレイ514、および1つ以上のマイク516等の、ユーザ入力を容易にする1つ以上の入力デバイス510を含む。電子デバイス190はまた、1つ以上のスピーカ520と、任意にLEDアレイ522と、任意にディスプレイ524とを含む、1つ以上の出力デバイス518を含む。いくつかの実装例において、LEDアレイ522はフルカラーLEDのアレイである。いくつかの実装例において、電子デバイス190は、デバイスの種類に応じて、LEDアレイ522およびディスプレイ524のうちのいずれか、または双方を有する。いくつかの実装例において、電子デバイス190はまた、位置検出装置526(たとえばGPSモジュール)と、1つ以上のセンサ528(たとえば加速度計、ジャイロスコープ、光センサ等)とを含む。
・1つ以上のネットワークインターフェイス504(有線または無線)と、インターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク(たとえばローカルネットワーク104)、メトロポリタンエリアネットワーク等の1つ以上のネットワーク110とを介して、電子デバイス190を他のデバイス(たとえば、サーバシステム140、1つ以上のキャストデバイス、1つ以上のクライアントデバイス、1つ以上のスマートホームデバイス、および他の電子デバイス190)に接続するためのネットワーク通信モジュール534
・1つ以上の入力デバイスを介して入力を受信し、1つ以上の出力デバイス518を介して電子デバイス190で情報を提示することを可能にするための入出力制御モジュール536であって、
−電子デバイス190の周囲の環境で収集されたオーディオ入力もしくは音声メッセージを処理するため、または、音声アシスタントサーバ112での処理のために収集されたオーディオ入力もしくは音声メッセージを準備するための音声処理モジュール538、
−電子デバイス190のデバイス状態に従ってLED522上に視覚的パターンを生成するためのLED制御モジュール540、および
−電子デバイス190の上面上(たとえばタッチセンサアレイ514上)のタッチイベントを検知するためのタッチセンスモジュール542
を含む。
−電子デバイス190自体に対応付けられた情報を記憶するための音声デバイス設定546であり、これは、共通デバイス設定(たとえば、サービス層(service tier)、デバイスモデル、記憶容量、処理能力、通信能力等)、ユーザドメイン内の1つ以上のユーザアカウントの情報、登録されていないユーザを扱うときの制限に関する設定、および、LED522によって表示される1つ以上の視覚的パターンに対応付けられた表示仕様を含み、
−オーディオ信号、音声メッセージ、レスポンスメッセージ、および、電子デバイス190の音声インターフェイス機能に関するその他のデータを記憶するための音声制御データ548、および
−電子デバイス190に対応付けられた、ユーザドメイン内のユーザに対応する音声モデルまたは音声フィンガープリントを記憶するための音声モデルデータ550、
を含む。
・電子デバイス190に対応付けられた、ユーザドメイン内のユーザを識別し明らかにするために使用できる音声モデルまたは音声フィンガープリント550を訓練し生成するための音声モデル訓練モジュール554
・音声アシスタントサーバ112が生成した音声要求レスポンスに含まれる命令を実行するための、また、いくつかの実装例では、特定の音声入力に対するレスポンスを生成するための、レスポンスモジュール556
・電子デバイス190の周囲の雑音レベルを求め、妨害雑音レベルを表示し電子デバイスを起動する代替方法を使用するよう示唆するための雑音モジュール558。
・電子デバイス190に音声入力を与えたユーザを識別し明確にするためのユーザ識別モジュール560、
・電子デバイス190を起動するためのホットワードを音声入力が含むか否かを判断し、音声入力中のそのホットワードを認識するためのホットワード認識モジュール562、
・音声入力に含まれるユーザ要求を判断するための要求認識モジュール564、
・音声入力中のホットワードおよび/または要求の認識の品質の程度(たとえばスコア)を求めるための認識品質モジュール566、
を含む。
・特定の電子デバイス190に関して、音声処理モジュール538(たとえば、特にホットワード認識モジュール562および/または要求認識モジュール564)の動作に対して異なるレベルの雑音がどのように影響するかを解析するための認識解析モジュール568、
・電子デバイス190から所定の距離について、電子デバイス190に対してユーザが発する音声入力の最大快適音量レベルを求めるためのユーザ音量しきい値モジュール568、
・電子デバイス190の周囲の雑音レベルおよび雑音プロファイルを求めるための雑音判定モジュール572、
・音声入力内のホットワードおよび/または要求の認識を妨害する雑音の雑音プロファイルを訓練し生成するための雑音プロファイルモジュール574、および、
・妨害すると判断された雑音プロファイルを保存するための雑音プロファイルストア576、
を含む。
・1つ以上のネットワークインターフェイス704(有線または無線)と、インターネット、他のワイドエリアネットワーク、ローカルエリアネットワーク、メトロポリタンエリアネットワーク等の1つ以上のネットワーク110とを介して、サーバシステム140を他のデバイス(たとえば、サーバシステム140内の各種サーバ、クライアントデバイス、キャストデバイス、電子デバイス190、およびスマートホームデバイス)に接続するためのネットワーク通信モジュール718
・クライアントデバイスで情報(たとえば、アプリケーション826〜830、ウィジェット、ウェブサイト、およびそのウェブページ、および/またはゲーム、オーディオおよび/またはビデオコンテンツ、テキスト等)を提示することを可能にするためのユーザインターフェイスモジュール720
・サーバ側で実行されるコマンド実行モジュール721(たとえば、ゲーム、ソーシャルネットワークアプリケーション、スマートホームアプリケーション、および/またはクライアントデバイス、キャストデバイス、電子デバイス190、およびスマートホームデバイスを制御しこれらのデバイスが捕捉したデータをレビューするための、その他のウェブもしくは非ウェブベースのアプリケーション)であって、
−キャストデバイスに対応付けられた、デバイスプロビジョニング、デバイス制御、およびユーザアカウント管理のためのサーバ側機能を提供するために実行されるキャストデバイスアプリケーション722、
−対応するメディアソースに対応付けられた、メディア表示およびユーザアカウント管理のためのサーバ側機能を提供するために実行される1つ以上のメディアプレーヤアプリケーション724、
−対応するスマートホームデバイスの、デバイスプロビジョニング、デバイス制御、データ処理およびデータレビューのためのサーバ側機能を提供するために実行される1つ以上のスマートホームデバイスアプリケーション、および、
−電子デバイス190から受信した音声メッセージの音声処理を手配するため、または、音声メッセージを直接処理することによってユーザ音声コマンドおよびユーザ音声コマンドのための1つ以上のパラメータを抽出するために実行される音声アシスタントアプリケーション、
のうちの1つ以上を含む。
−共通デバイス設定(たとえば、サービス層、デバイスモデル、記憶容量、処理能力、通信能力等)、および自動メディア表示制御のための情報を含む、1つ以上のクライアントデバイスに対応付けられた情報を格納するためのクライアントデバイス設定732、
−アカウントアクセス情報、デバイス設定用の情報(たとえば、サービス層、デバイスモデル、記憶容量、処理能力、通信能力等)、および自動メディア表示制御用の情報のうちの1つ以上を含む、キャストデバイスアプリケーション722のユーザアカウントに対応付けられた情報を格納するためのキャストデバイス設定734、
−アカウントアクセス情報、メディアコンテンツタイプのユーザ嗜好、レビュー履歴データ、および自動メディア表示制御用の情報を含む、1つ以上のメディアプレーヤアプリケーション724のユーザアカウントに対応付けられた情報を格納するためのメディアプレーヤアプリケーション設定736、
−アカウントアクセス情報、1つ以上のスマートホームデバイスの情報(たとえばサービス層、デバイスモデル、記憶容量、処理能力、通信能力等)のうちの1つ以上を含む、スマートホームアプリケーション726のユーザアカウントに対応付けられた情報を格納するためのスマードホームデバイス設定738、
−アカウントアクセス情報、1つ以上の電子デバイス190のための情報(たとえば、サーバ層、デバイスモデル、記憶容量、処理能力、通信能力等)のうちの1つ以上を含む、音声アシスタントアプリケーション728のユーザアカウントに対応付けられた情報を格納する音声アシスタントデータ740、
−ユーザのサブスクリプション(たとえば音楽ストリーミングサービス加入、ビデオストリーミングサービス加入、ニューズレター購読)、ユーザデバイス(たとえばそれぞれのユーザに対応付けられたデバイスレジストリ118に登録されたデバイス)、ユーザアカウント(たとえば、ユーザの電子メールアカウント、カレンダーアカウント、財務アカウント)、およびその他のユーザデータを含む、ユーザドメイン内のユーザに対応付けられた情報を格納するためのユーザデータ742、および
−たとえばユーザの音声モデルまたは音声フィンガープリントおよびユーザの快適音量レベルしきい値を含む、ユーザドメイン内のユーザの音声プロファイルを格納するためのユーザ音声プロファイル744、
のうちの1つ以上を含む。
・動作環境内の電子デバイス190間におけるデバイスリーダーシップの決定を仲裁するためのデバイスリーダーシップモデレータ780
・電子デバイス190の周囲の雑音レベルを求めるための雑音モジュール790
・電子デバイス190の周囲の環境で収集されたオーディオ入力または音声メッセージを処理するための音声処理モジュール7100。
図4A〜図4Bは、いくつかの実装例に従う、複数の電子デバイス(たとえば電子デバイス190)間におけるデバイスリーダーシップの協議の一例を示す。複数の電子デバイス190を有する動作環境(たとえば動作環境100)において、この環境内のユーザが音声入力を行うと、複数の電子デバイス190のうちの1つ以上が、この音声入力を検出し受信する。電子デバイス190は、このユーザの音声入力に応答しこのユーザからのさらに他の音声入力を検出するためのリーダーを、これらの電子デバイスの中から決定する。
図5は、いくつかの実装例に従う、ユーザの音声入力に応答する方法1100を示すフロー図である。方法1100は、1つ以上のマイクと、スピーカと、1つ以上のプロセッサと、1つ以上のプロセッサが実行する1つ以上のプログラムを格納するメモリとを備える電子デバイス190において実現される。
図6は、いくつかの実装例に従う、複数の音声インターフェイスデバイスの中からデバイスリーダーシップを協議により決定する方法1200を示すフロー図である。この方法1200は、2つ以上の電子デバイス190(電子デバイス1002)のうちのある電子デバイス(たとえばデバイス1002−1、1002−2、または1002−3)において実現され、2つ以上の電子デバイスは各々、1つ以上のマイクと、スピーカと、1つ以上のプロセッサと、1つ以上のプロセッサが実行する1つ以上のプログラムを格納するメモリとを含む。
図7は、いくつかの実装例に従う音声インターフェイスデバイスの周囲の雑音を緩和する方法1300を示すフロー図である。この方法1300は、1つ以上のマイクと、スピーカと、1つ以上のプロセッサと、1つ以上のプロセッサが実行する1つ以上のプログラムを格納するメモリとを備える電子デバイス190において実現される。電子デバイス190は、音声ベースのアフォーダンス(たとえばホットワードを含む音声入力)を含む複数のアフォーダンスのうちのいずれかによって起動されるように構成される。
Claims (12)
- 1つ以上のマイクと、スピーカと、1つ以上のプロセッサと、前記1つ以上のプロセッサが実行する1つ以上のプログラムを格納するメモリとを備える電子デバイスにおいて、
自由形式の第1の音声入力を受信するステップと、
前記第1の音声入力を、前記電子デバイスに対応付けられた複数のユーザに対応付けられた音声モデルのセットと比較するステップとを含み、前記音声モデルは前記電子デバイスに合わせて訓練され、
前記比較に基づいて、前記第1の音声入力は前記複数のユーザのうちの第1のユーザに対応すると判断するステップと、
前記判断に従ってレスポンスを与えるステップとを含む、方法。 - 前記レスポンスは可聴音声出力であり、前記レスポンスを与えるステップは、前記可聴音声出力を出力するステップを含む、請求項1に記載の方法。
- 前記第1の音声入力に基づいてユーザ要求を判断するステップと、
前記判断したユーザ要求に従って前記レスポンスを生成するステップとをさらに含む、請求項1または2に記載の方法。 - 前記判断したユーザ要求は、前記電子デバイスを起動することを求める要求を含み、
前記レスポンスは可聴挨拶を含み、前記挨拶は、前記判断における前記第1のユーザのアイデンティティの表示を含む、請求項3に記載の方法。 - 前記判断したユーザ要求は、情報を求める要求を含み、
前記判断した要求に従って前記レスポンスを生成するステップは、前記第1のユーザについて要求された前記情報を取得するステップを含む、請求項3に記載の方法。 - 前記判断における前記第1のユーザについて要求された前記情報を取得するステップは、前記第1のユーザに対応付けられたアカウントにアクセスするステップを含む、請求項5に記載の方法。
- 第2の音声入力を受信するステップと、
前記第2の音声入力を前記音声モデルのセットと比較するステップと、
前記比較に基づいて、前記第2の音声入力は前記複数のユーザのうちの第2のユーザに対応すると判断するステップと、
前記第2の音声入力は前記第2のユーザに対応するという判断に従ってレスポンスを与えるステップとをさらに含む、請求項1〜6のいずれか1項に記載の方法。 - 第3の音声入力を受信するステップと、
前記第3の音声入力を前記音声モデルのセットと比較するステップと、
前記比較に基づいて、前記第3の音声入力は前記複数のユーザのうちのいずれのユーザにも対応しないと判断するステップと、
前記第3の音声入力は前記複数のユーザのうちのいずれのユーザにも対応しないという判断に従い、前記電子デバイスの機能を制限するステップとさらに含む、請求項1〜7のいずれか1項に記載の方法。 - 前記電子デバイスはディスプレイを含み、
前記方法は、前記判断における前記第1のユーザのアイデンティティの表示を前記ディスプレイに示すステップをさらに含む、請求項1〜8のいずれか1項に記載の方法。 - 前記電子デバイスはディスプレイを含み、
前記方法は、前記判断における前記第1のユーザに対応付けられた視覚ユーザインターフェイスを前記ディスプレイに示すステップをさらに含む、請求項1〜9のいずれか1項に記載の方法。 - 1つ以上のマイクと、
スピーカと、
1つ以上のプロセッサと、
請求項1〜10に記載の方法のうちのいずれかを実施するために前記1つ以上のプロセッサが実行する1つ以上のプログラムを格納するメモリとを備える、電子デバイス。 - 1つ以上のプログラムを格納する非一時的なコンピュータ読取可能記憶媒体であって、前記1つ以上のプログラムは、1つ以上のマイクとスピーカと1つ以上のプロセッサとを備える電子デバイスによって実行されると前記電子デバイスに請求項1〜10に記載の方法のうちのいずれかを実行させる命令を含む、非一時的なコンピュータ読取可能記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021074212A JP7225301B2 (ja) | 2016-10-03 | 2021-04-26 | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/284,476 | 2016-10-03 | ||
US15/284,476 US10304463B2 (en) | 2016-10-03 | 2016-10-03 | Multi-user personalization at a voice interface device |
PCT/US2017/054890 WO2018067531A1 (en) | 2016-10-03 | 2017-10-03 | Multi-user personalization at a voice interface device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021074212A Division JP7225301B2 (ja) | 2016-10-03 | 2021-04-26 | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019535035A true JP2019535035A (ja) | 2019-12-05 |
JP6906048B2 JP6906048B2 (ja) | 2021-07-21 |
Family
ID=60159288
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019517878A Active JP6906048B2 (ja) | 2016-10-03 | 2017-10-03 | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
JP2021074212A Active JP7225301B2 (ja) | 2016-10-03 | 2021-04-26 | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021074212A Active JP7225301B2 (ja) | 2016-10-03 | 2021-04-26 | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
Country Status (8)
Country | Link |
---|---|
US (4) | US10304463B2 (ja) |
EP (1) | EP3519935A1 (ja) |
JP (2) | JP6906048B2 (ja) |
KR (3) | KR102458751B1 (ja) |
CN (3) | CN210325195U (ja) |
DE (1) | DE202017105819U1 (ja) |
GB (1) | GB2556656B (ja) |
WO (1) | WO2018067531A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019193069A (ja) * | 2018-04-24 | 2019-10-31 | キヤノン株式会社 | 通信装置、その制御方法、およびそのプログラム |
JP2021119403A (ja) * | 2016-10-03 | 2021-08-12 | グーグル エルエルシーGoogle LLC | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
JP7349533B2 (ja) | 2018-03-20 | 2023-09-22 | シャープ株式会社 | 情報処理システム、及び情報処理方法 |
Families Citing this family (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
EP3264266B1 (en) * | 2015-05-20 | 2020-08-05 | Huawei Technologies Co. Ltd. | Method for positioning sounding location, and terminal device |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10679608B2 (en) | 2016-12-30 | 2020-06-09 | Google Llc | Conversation-aware proactive notifications for a voice interface device |
US10147415B2 (en) * | 2017-02-02 | 2018-12-04 | Microsoft Technology Licensing, Llc | Artificially generated speech for a communication session |
US10708265B2 (en) * | 2017-03-13 | 2020-07-07 | Amazon Technologies, Inc. | Batch registration and configuration of devices |
US10258295B2 (en) | 2017-05-09 | 2019-04-16 | LifePod Solutions, Inc. | Voice controlled assistance for monitoring adverse events of a user and/or coordinating emergency actions such as caregiver communication |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10565191B2 (en) * | 2017-06-05 | 2020-02-18 | International Business Machines Corporation | Cognitive program suite for a cognitive device and a mobile device |
US10449440B2 (en) * | 2017-06-30 | 2019-10-22 | Electronic Arts Inc. | Interactive voice-controlled companion application for a video game |
US10846387B2 (en) * | 2017-07-12 | 2020-11-24 | At&T Intellectual Property I, L.P. | Managing access based on activities of entities |
US20190019505A1 (en) * | 2017-07-12 | 2019-01-17 | Lenovo (Singapore) Pte. Ltd. | Sustaining conversational session |
US11145203B2 (en) * | 2017-09-12 | 2021-10-12 | Google Llc | Systems and methods of hands-free assistant-requested communication |
JP7121330B2 (ja) | 2017-09-26 | 2022-08-18 | カシオ計算機株式会社 | 電子機器、音響機器、電子機器の制御方法及び制御プログラム |
US10504513B1 (en) * | 2017-09-26 | 2019-12-10 | Amazon Technologies, Inc. | Natural language understanding with affiliated devices |
US11509726B2 (en) * | 2017-10-20 | 2022-11-22 | Apple Inc. | Encapsulating and synchronizing state interactions between devices |
US10567515B1 (en) * | 2017-10-26 | 2020-02-18 | Amazon Technologies, Inc. | Speech processing performed with respect to first and second user profiles in a dialog session |
US10749855B2 (en) | 2017-10-30 | 2020-08-18 | Vmware, Inc. | Securely managing digital assistants that access third-party applications |
US10805301B2 (en) * | 2017-10-30 | 2020-10-13 | Vmware, Inc. | Securely managing digital assistants that access third-party applications |
KR102527278B1 (ko) * | 2017-12-04 | 2023-04-28 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 |
KR102428782B1 (ko) * | 2017-12-29 | 2022-08-03 | 엘지전자 주식회사 | 세탁기 및 세탁기의 동작방법 |
US10241588B1 (en) | 2018-01-31 | 2019-03-26 | Piccolo Labs Inc. | System for localizing devices in a room |
US10296102B1 (en) | 2018-01-31 | 2019-05-21 | Piccolo Labs Inc. | Gesture and motion recognition using skeleton tracking |
US10885910B1 (en) | 2018-03-14 | 2021-01-05 | Amazon Technologies, Inc. | Voice-forward graphical user interface mode management |
US11127405B1 (en) * | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10877637B1 (en) | 2018-03-14 | 2020-12-29 | Amazon Technologies, Inc. | Voice-based device operation mode management |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US11017768B2 (en) * | 2018-04-26 | 2021-05-25 | Pepsico, Inc. | Systems and methods for dispensing consumable products with voice interface |
US11094316B2 (en) * | 2018-05-04 | 2021-08-17 | Qualcomm Incorporated | Audio analytics for natural language processing |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10713343B2 (en) * | 2018-05-10 | 2020-07-14 | Lenovo (Singapore) Pte. Ltd. | Methods, devices and systems for authenticated access to electronic device in a closed configuration |
KR20190130376A (ko) * | 2018-05-14 | 2019-11-22 | 삼성전자주식회사 | 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법 |
KR20190133100A (ko) | 2018-05-22 | 2019-12-02 | 삼성전자주식회사 | 어플리케이션을 이용하여 음성 입력에 대한 응답을 출력하는 전자 장치 및 그 동작 방법 |
TWI727326B (zh) * | 2018-05-28 | 2021-05-11 | 仁寶電腦工業股份有限公司 | 語音助理系統的啟動方法及電子裝置 |
CN108766420B (zh) * | 2018-05-31 | 2021-04-02 | 中国联合网络通信集团有限公司 | 语音交互设备唤醒词生成方法及装置 |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) * | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11170085B2 (en) | 2018-06-03 | 2021-11-09 | Apple Inc. | Implementation of biometric authentication |
US10847153B2 (en) | 2018-06-06 | 2020-11-24 | Amazon Technologies, Inc. | Temporary account association with voice-enabled devices |
CN112513845A (zh) * | 2018-06-06 | 2021-03-16 | 亚马逊技术股份有限公司 | 与语音使能设备的暂时账户关联 |
CN109005383A (zh) * | 2018-07-06 | 2018-12-14 | 杭州涂鸦信息技术有限公司 | 一种随处播放iot监控视频流的方法 |
JP7078478B2 (ja) * | 2018-07-10 | 2022-05-31 | 株式会社バンダイナムコエンターテインメント | 連動設定方法、連動用サーバ、ゲームサーバ、マネージメントサーバ及びゲームシステム |
KR102592769B1 (ko) * | 2018-07-20 | 2023-10-24 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10623696B1 (en) | 2018-08-06 | 2020-04-14 | Paula Muller | Communication system for use with protected persons |
CN109377987B (zh) | 2018-08-31 | 2020-07-28 | 百度在线网络技术(北京)有限公司 | 智能语音设备间的交互方法、装置、设备及存储介质 |
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN110956961A (zh) * | 2018-09-27 | 2020-04-03 | 中强光电股份有限公司 | 智能语音系统及利用智能语音系统控制投影机的方法 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11508378B2 (en) | 2018-10-23 | 2022-11-22 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
KR20200052804A (ko) * | 2018-10-23 | 2020-05-15 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
US10944588B2 (en) | 2018-11-29 | 2021-03-09 | International Business Machines Corporation | Resolving conflicting commands received by an electronic device |
CN111902865A (zh) | 2018-12-03 | 2020-11-06 | 谷歌有限责任公司 | 文本无关的说话者识别 |
KR20200074690A (ko) * | 2018-12-17 | 2020-06-25 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11256794B2 (en) * | 2019-02-03 | 2022-02-22 | Fmr Llc | Systems and methods for securely authenticating a caller over a voice channel |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US10943598B2 (en) * | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
JP7259446B2 (ja) * | 2019-03-20 | 2023-04-18 | 沖電気工業株式会社 | 音声処理装置、エージェントシステム、プログラム、および、音声処理方法 |
JP7278830B2 (ja) * | 2019-03-27 | 2023-05-22 | 本田技研工業株式会社 | 端末装置、端末装置の制御方法、およびプログラム |
US11328717B2 (en) * | 2019-04-18 | 2022-05-10 | Lg Electronics Inc. | Electronic device, operating method thereof, system having plural artificial intelligence devices |
CN110109645A (zh) * | 2019-04-30 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐试听方法、装置和终端 |
US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
CN111754997B (zh) * | 2019-05-09 | 2023-08-04 | 北京汇钧科技有限公司 | 控制装置及其操作方法,和语音交互装置及其操作方法 |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11580973B2 (en) * | 2019-05-31 | 2023-02-14 | Apple Inc. | Multi-user devices in a connected home environment |
KR102436985B1 (ko) | 2019-05-31 | 2022-08-29 | 애플 인크. | 오디오 미디어 제어를 위한 사용자 인터페이스 |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US10867608B1 (en) | 2019-05-31 | 2020-12-15 | Apple Inc. | Multi-user configuration |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11516221B2 (en) * | 2019-05-31 | 2022-11-29 | Apple Inc. | Multi-user devices in a connected home environment |
US11010121B2 (en) | 2019-05-31 | 2021-05-18 | Apple Inc. | User interfaces for audio media control |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN110600041B (zh) * | 2019-07-29 | 2022-04-29 | 华为技术有限公司 | 一种声纹识别的方法及设备 |
KR102280690B1 (ko) * | 2019-08-15 | 2021-07-22 | 엘지전자 주식회사 | 지능적 음성 출력 방법, 음성 출력 장치 및 지능형 컴퓨팅 디바이스 |
CN114303132B (zh) * | 2019-08-22 | 2024-03-01 | 三星电子株式会社 | 在虚拟个人助手中使用唤醒词进行上下文关联和个性化的方法和系统 |
US10839060B1 (en) * | 2019-08-27 | 2020-11-17 | Capital One Services, Llc | Techniques for multi-voice speech recognition commands |
KR20190109341A (ko) * | 2019-09-06 | 2019-09-25 | 엘지전자 주식회사 | 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 |
US11676589B2 (en) * | 2019-09-17 | 2023-06-13 | Global Strategies International LLC | Systems and methods for voice search and response retrieval |
US11399028B1 (en) * | 2019-09-20 | 2022-07-26 | Amazon Technologies, Inc. | Merging accounts associated with computing devices |
US11615801B1 (en) * | 2019-09-20 | 2023-03-28 | Apple Inc. | System and method of enhancing intelligibility of audio playback |
US11528274B1 (en) | 2019-09-20 | 2022-12-13 | Amazon Technologies, Inc. | Accountless device control |
US11086743B2 (en) * | 2019-10-21 | 2021-08-10 | International Business Machines Corporation | Context based IoT device management |
WO2021086127A1 (en) * | 2019-11-01 | 2021-05-06 | Samsung Electronics Co., Ltd. | Hub device, multi-device system including the hub device and plurality of devices, and operating method of the hub device and multi-device system |
CN111028835B (zh) * | 2019-11-18 | 2022-08-09 | 北京小米移动软件有限公司 | 资源置换方法、装置、系统、计算机可读存储介质 |
CN110992940B (zh) | 2019-11-25 | 2021-06-15 | 百度在线网络技术(北京)有限公司 | 语音交互的方法、装置、设备和计算机可读存储介质 |
CN210725185U (zh) * | 2019-12-31 | 2020-06-09 | 苏州清听声学科技有限公司 | 一种基于定向音频的柜台对讲系统 |
CN113115251B (zh) * | 2020-01-09 | 2023-10-31 | 博泰车联网科技(上海)股份有限公司 | 用于信息处理的方法、设备和计算机存储介质 |
CN113470634B (zh) * | 2020-04-28 | 2024-05-17 | 海信集团有限公司 | 语音交互设备的控制方法、服务器及语音交互设备 |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
KR20220013837A (ko) * | 2020-07-27 | 2022-02-04 | 엘지전자 주식회사 | 전자 기기의 관리 방법 및 장치 |
KR20220055789A (ko) * | 2020-10-27 | 2022-05-04 | 삼성전자주식회사 | 사용자 모델을 관리하는 전자 장치 및 이의 동작 방법 |
US11929079B2 (en) | 2020-10-27 | 2024-03-12 | Samsung Electronics Co., Ltd | Electronic device for managing user model and operating method thereof |
WO2022182744A1 (en) * | 2021-02-23 | 2022-09-01 | Dathomir Laboratories Llc | Digital assistant interactions in copresence sessions |
US11960615B2 (en) | 2021-06-06 | 2024-04-16 | Apple Inc. | Methods and user interfaces for voice-based user profile management |
CN113436614B (zh) * | 2021-07-02 | 2024-02-13 | 中国科学技术大学 | 语音识别方法、装置、设备、系统及存储介质 |
US11410655B1 (en) | 2021-07-26 | 2022-08-09 | LifePod Solutions, Inc. | Systems and methods for managing voice environments and voice routines |
US11404062B1 (en) | 2021-07-26 | 2022-08-02 | LifePod Solutions, Inc. | Systems and methods for managing voice environments and voice routines |
WO2024068032A1 (en) * | 2022-09-29 | 2024-04-04 | Verisure Sàrl | Security installations and methods |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005534065A (ja) * | 2002-07-25 | 2005-11-10 | ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング | マンマシンインタフェースユニットの動作及び/又は制御方法 |
US20070156684A1 (en) * | 2003-09-11 | 2007-07-05 | Capital One Financial Corporation | System and Method for Detecting Unauthorized Access Using a Voice Signature |
US20150172463A1 (en) * | 2013-12-16 | 2015-06-18 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US20160035349A1 (en) * | 2014-07-29 | 2016-02-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
JP2016090655A (ja) * | 2014-10-30 | 2016-05-23 | シャープ株式会社 | 音声認識ロボットシステム、音声認識ロボット、音声認識ロボットの制御装置、音声認識ロボットを制御するための通信端末、およびプログラム |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073101A (en) * | 1996-02-02 | 2000-06-06 | International Business Machines Corporation | Text independent speaker recognition for transparent command ambiguity resolution and continuous access control |
WO2000058947A1 (en) * | 1999-03-31 | 2000-10-05 | Veritel Corporation | User authentication for consumer electronics |
EP1164576B1 (en) * | 2000-06-15 | 2006-02-22 | Swisscom Fixnet AG | Speaker authentication method and system from speech models |
US8812319B2 (en) * | 2001-01-31 | 2014-08-19 | Ibiometrics, Inc. | Dynamic pass phrase security system (DPSS) |
KR100418113B1 (ko) * | 2001-09-07 | 2004-02-11 | 주식회사 엠보이스텔레소프트 | 음성인식을 이용한 별정통신 시스템 및 그를 이용한별정통신 서비스 제공방법 |
KR20030033890A (ko) * | 2001-10-25 | 2003-05-01 | (주)인터루션 | 사용자의 음성정보 분석을 통한 사이버 비서 시스템 및 그방법 |
US6882971B2 (en) * | 2002-07-18 | 2005-04-19 | General Instrument Corporation | Method and apparatus for improving listener differentiation of talkers during a conference call |
JP4333455B2 (ja) | 2004-04-09 | 2009-09-16 | ソニー株式会社 | コンテンツ再生装置,プログラム及びコンテンツ再生制御方法 |
US7912206B2 (en) * | 2004-07-30 | 2011-03-22 | Miller John S | Technique for providing a personalized electronic messaging service through an information assistance provider |
US7484102B2 (en) * | 2004-09-07 | 2009-01-27 | Microsoft Corporation | Securing audio-based access to application data |
WO2007008248A2 (en) * | 2005-07-11 | 2007-01-18 | Voicedemand, Inc. | Voice control of a media player |
KR20050080172A (ko) | 2005-07-21 | 2005-08-11 | (주)예스테크놀로지 | 생체 인증 시 음성인식 활용 방안 |
JP2009146263A (ja) * | 2007-12-17 | 2009-07-02 | Panasonic Corp | 本人認証システム |
JP2009237774A (ja) | 2008-03-26 | 2009-10-15 | Advanced Media Inc | 認証サーバ、サービス提供サーバ、認証方法、通信端末、およびログイン方法 |
DE102008024527A1 (de) | 2008-05-25 | 2009-11-26 | Lenze Automation Gmbh | Verfahren und Vorrichtung zur Überwachung eines Drehwinkelaufnehmers |
EP2313870B1 (en) * | 2008-06-30 | 2013-12-04 | Telecom Italia S.p.A. | Method and system for communicating access authorization requests based on user personal identification as well as method and system for determining access authorizations |
KR101198862B1 (ko) * | 2009-11-17 | 2012-11-06 | 에스케이플래닛 주식회사 | 음성인식을 이용한 사용자 인터페이스 제공단말기 및 방법 |
US20120136658A1 (en) * | 2010-11-30 | 2012-05-31 | Cox Communications, Inc. | Systems and methods for customizing broadband content based upon passive presence detection of users |
US9444816B2 (en) * | 2011-03-30 | 2016-09-13 | Qualcomm Incorporated | Continuous voice authentication for a mobile device |
US20130011051A1 (en) * | 2011-07-07 | 2013-01-10 | Lockheed Martin Corporation | Coded aperture imaging |
US9511150B2 (en) * | 2011-07-19 | 2016-12-06 | CellMosaic, Inc. | Crosslinking reagents, macromolecules, therapeutic bioconjugates, and synthetic methods thereof |
US20130110511A1 (en) * | 2011-10-31 | 2013-05-02 | Telcordia Technologies, Inc. | System, Method and Program for Customized Voice Communication |
US8811638B2 (en) * | 2011-12-01 | 2014-08-19 | Elwha Llc | Audible assistance |
US9251792B2 (en) * | 2012-06-15 | 2016-02-02 | Sri International | Multi-sample conversational voice verification |
US20140094987A1 (en) * | 2012-09-28 | 2014-04-03 | Intel Corporation | Tiered level of access to a set of vehicles |
US20140164476A1 (en) * | 2012-12-06 | 2014-06-12 | At&T Intellectual Property I, Lp | Apparatus and method for providing a virtual assistant |
US9524071B2 (en) * | 2013-02-05 | 2016-12-20 | Microsoft Technology Licensing, Llc | Threshold view |
BR112015018905B1 (pt) * | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US9117451B2 (en) | 2013-02-20 | 2015-08-25 | Google Inc. | Methods and systems for sharing of adapted voice profiles |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US9922642B2 (en) * | 2013-03-15 | 2018-03-20 | Apple Inc. | Training an at least partial voice command system |
US9081944B2 (en) * | 2013-06-21 | 2015-07-14 | General Motors Llc | Access control for personalized user information maintained by a telematics unit |
GB2515527B (en) * | 2013-06-26 | 2016-08-31 | Cirrus Logic Int Semiconductor Ltd | Speech Recognition |
US20150056951A1 (en) * | 2013-08-21 | 2015-02-26 | GM Global Technology Operations LLC | Vehicle telematics unit and method of operating the same |
US9343068B2 (en) * | 2013-09-16 | 2016-05-17 | Qualcomm Incorporated | Method and apparatus for controlling access to applications having different security levels |
US20150255068A1 (en) * | 2014-03-10 | 2015-09-10 | Microsoft Corporation | Speaker recognition including proactive voice model retrieval and sharing features |
EP3158427B1 (en) * | 2014-06-19 | 2022-12-28 | Robert Bosch GmbH | System and method for speech-enabled personalized operation of devices and services in multiple operating environments |
US9740841B2 (en) * | 2014-09-08 | 2017-08-22 | Tessera Advanced Technologies, Inc. | Using biometric user-specific attributes |
JP6544693B2 (ja) | 2014-12-25 | 2019-07-17 | エイディシーテクノロジー株式会社 | ロボット |
CN107920784B (zh) * | 2015-08-28 | 2021-02-26 | 金泰克斯公司 | 车辆安全性附件和身份认证方法 |
US10304463B2 (en) * | 2016-10-03 | 2019-05-28 | Google Llc | Multi-user personalization at a voice interface device |
-
2016
- 2016-10-03 US US15/284,476 patent/US10304463B2/en active Active
-
2017
- 2017-09-14 GB GB1714819.8A patent/GB2556656B/en active Active
- 2017-09-26 DE DE202017105819.0U patent/DE202017105819U1/de active Active
- 2017-09-30 CN CN201920004042.0U patent/CN210325195U/zh active Active
- 2017-09-30 CN CN201721291209.3U patent/CN208444593U/zh active Active
- 2017-09-30 CN CN201710918757.2A patent/CN107910007B/zh active Active
- 2017-10-03 KR KR1020217031955A patent/KR102458751B1/ko active IP Right Grant
- 2017-10-03 WO PCT/US2017/054890 patent/WO2018067531A1/en active Application Filing
- 2017-10-03 JP JP2019517878A patent/JP6906048B2/ja active Active
- 2017-10-03 KR KR1020227036617A patent/KR20220158769A/ko not_active Application Discontinuation
- 2017-10-03 KR KR1020197012616A patent/KR102311684B1/ko active IP Right Grant
- 2017-10-03 EP EP17790893.6A patent/EP3519935A1/en not_active Ceased
-
2019
- 2019-03-27 US US16/367,177 patent/US10748543B2/en active Active
-
2020
- 2020-08-17 US US16/995,646 patent/US11527249B2/en active Active
-
2021
- 2021-04-26 JP JP2021074212A patent/JP7225301B2/ja active Active
-
2022
- 2022-11-02 US US17/979,181 patent/US20230045838A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005534065A (ja) * | 2002-07-25 | 2005-11-10 | ソニー インターナショナル (ヨーロッパ) ゲゼルシャフト ミット ベシュレンクテル ハフツング | マンマシンインタフェースユニットの動作及び/又は制御方法 |
US20070156684A1 (en) * | 2003-09-11 | 2007-07-05 | Capital One Financial Corporation | System and Method for Detecting Unauthorized Access Using a Voice Signature |
US20150172463A1 (en) * | 2013-12-16 | 2015-06-18 | Nuance Communications, Inc. | Systems and methods for providing a virtual assistant |
US20160035349A1 (en) * | 2014-07-29 | 2016-02-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
JP2016090655A (ja) * | 2014-10-30 | 2016-05-23 | シャープ株式会社 | 音声認識ロボットシステム、音声認識ロボット、音声認識ロボットの制御装置、音声認識ロボットを制御するための通信端末、およびプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021119403A (ja) * | 2016-10-03 | 2021-08-12 | グーグル エルエルシーGoogle LLC | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
US11527249B2 (en) | 2016-10-03 | 2022-12-13 | Google Llc | Multi-user personalization at a voice interface device |
JP7225301B2 (ja) | 2016-10-03 | 2023-02-20 | グーグル エルエルシー | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション |
JP7349533B2 (ja) | 2018-03-20 | 2023-09-22 | シャープ株式会社 | 情報処理システム、及び情報処理方法 |
JP2019193069A (ja) * | 2018-04-24 | 2019-10-31 | キヤノン株式会社 | 通信装置、その制御方法、およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
GB2556656A (en) | 2018-06-06 |
US20210012779A1 (en) | 2021-01-14 |
GB201714819D0 (en) | 2017-11-01 |
US10748543B2 (en) | 2020-08-18 |
JP7225301B2 (ja) | 2023-02-20 |
CN210325195U (zh) | 2020-04-14 |
KR20220158769A (ko) | 2022-12-01 |
KR20190064613A (ko) | 2019-06-10 |
EP3519935A1 (en) | 2019-08-07 |
KR20210122920A (ko) | 2021-10-12 |
US10304463B2 (en) | 2019-05-28 |
GB2556656B (en) | 2020-09-30 |
WO2018067531A1 (en) | 2018-04-12 |
KR102311684B1 (ko) | 2021-10-08 |
US20230045838A1 (en) | 2023-02-16 |
US11527249B2 (en) | 2022-12-13 |
CN107910007B (zh) | 2024-04-26 |
JP6906048B2 (ja) | 2021-07-21 |
DE202017105819U1 (de) | 2018-01-17 |
CN107910007A (zh) | 2018-04-13 |
JP2021119403A (ja) | 2021-08-12 |
KR102458751B1 (ko) | 2022-10-24 |
US20190221215A1 (en) | 2019-07-18 |
CN208444593U (zh) | 2019-01-29 |
US20180096690A1 (en) | 2018-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7225301B2 (ja) | 音声インターフェイスデバイスにおけるマルチユーザパーソナライゼーション | |
US11024311B2 (en) | Device leadership negotiation among voice interface devices | |
US11869527B2 (en) | Noise mitigation for a voice interface device | |
WO2018067528A1 (en) | Device leadership negotiation among voice interface devices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190627 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210426 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20210426 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20210510 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20210518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6906048 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |