JP2021513693A - デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 - Google Patents
デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 Download PDFInfo
- Publication number
- JP2021513693A JP2021513693A JP2020531042A JP2020531042A JP2021513693A JP 2021513693 A JP2021513693 A JP 2021513693A JP 2020531042 A JP2020531042 A JP 2020531042A JP 2020531042 A JP2020531042 A JP 2020531042A JP 2021513693 A JP2021513693 A JP 2021513693A
- Authority
- JP
- Japan
- Prior art keywords
- digital assistant
- computing device
- assistant computing
- input audio
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 374
- 230000005236 sound signal Effects 0.000 claims abstract description 315
- 230000009471 action Effects 0.000 claims abstract description 175
- 238000000034 method Methods 0.000 claims abstract description 159
- 230000008569 process Effects 0.000 claims abstract description 106
- 238000010801 machine learning Methods 0.000 claims description 30
- 239000008186 active pharmaceutical agent Substances 0.000 description 40
- 238000003058 natural language processing Methods 0.000 description 36
- 230000004044 response Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 238000005108 dry cleaning Methods 0.000 description 7
- 238000011143 downstream manufacturing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013515 script Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000026676 system process Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
- H04L67/125—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Cardiology (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Circuit For Audible Band Transducer (AREA)
- Selective Calling Equipment (AREA)
Abstract
Description
る。命令は、たとえば、入力オーディオ信号を含むデータパケットをデータ処理システム102に送信するためのトリガキーワードまたはその他のキーワードまたは承認を含み得る。プリプロセッサ134は、入力信号を検出し、入力信号が信号処理のための閾値を満たすかどうかを判定する信号品質チェッカ136を含むかまたは実行することができる。
ッチインターフェース、ジェスチャインターフェース、センサ、キーボード、もしくはマウス)を有する可能性があるために入力オーディオ信号を処理するのにより適している可能性がある。このようにして、システム100は、入力オーディオ信号のより正確な処理を容易にし得る。
102 データ処理システム
104 デジタルアシスタントコンピューティングデバイス
105 ネットワーク
106 ネットワーク接続されたデバイス
108 インターフェース
110 自然言語プロセッサコンポーネント
112 オーケストレータコンポーネント
114 ダイレクトアクションAPI
116 データリポジトリ
118 アカウントデータ構造
120 閾値データ構造
122 モデル
124 テンプレート
126 光源
128 センサ
130 トランスデューサ
132 オーディオドライバ
134 プリプロセッサ
136 信号品質チェッカ
146 第三者デバイス
150 クライアントコンピューティングデバイス
200 システム
202 デジタルアシスタントコンピューティングデバイス
204 デジタルアシスタントコンピューティングデバイス
206 接続されたサーモスタット、インターネットに接続されたデバイス
208 接続されたランプ、インターネットに接続されたデバイス
210 接続されたスピーカ、インターネットに接続されたデバイス
212 接続されたマルチメディアディスプレイ、インターネットに接続されたデバイス
214 ワイヤレスゲートウェイ
216 接続された電気通信デバイス、インターネットに接続されたデバイス
218 入力オーディオ信号
232 ユーザ
234 部屋
300 方法
400 システム
405 バス
410 プロセッサ
415 メインメモリ
420 読出し専用メモリ(ROM)
425 ストレージデバイス
430 入力デバイス
435 ディスプレイ、タッチスクリーンディスプレイ
Claims (20)
- 音声駆動式のコンピューティング環境においてコンピューティングデバイスの間で信号処理を調整するためのシステムであって、
第1のデジタルアシスタントコンピューティングデバイスおよび第2のデジタルアシスタントコンピューティングデバイスを含む複数のデジタルアシスタントコンピューティングデバイスであって、前記複数のデジタルアシスタントコンピューティングデバイスが、複数のネットワーク接続されたデバイスを制御するように動作可能である、複数のデジタルアシスタントコンピューティングデバイスと、
オーケストレータコンポーネントおよびダイレクトアクションアプリケーションプログラミングインターフェース(ダイレクトアクションAPI)を実行するための1つまたは複数のプロセッサおよびメモリを含むデータ処理システムであって、前記データ処理システムが、前記第1のデジタルアシスタントコンピューティングデバイスをプライマリ信号プロセッサとして設定し、前記第2のデジタルアシスタントコンピューティングデバイスをセカンダリ信号プロセッサとして設定するための、データ処理システムと、
前記第1のデジタルアシスタントコンピューティングデバイスのセンサによって入力オーディオ信号を検出するための前記第1のデジタルアシスタントコンピューティングデバイスと、
前記第1のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記入力オーディオ信号が信号処理のための閾値を満たすと判定し、前記第1のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるというインジケーションを前記データ処理システムに送信するために前記第1のデジタルアシスタントコンピューティングデバイスによって実行される信号品質チェッカと、
前記第2のデジタルアシスタントコンピューティングデバイスのセンサによって前記入力オーディオ信号を検出するための前記第2のデジタルアシスタントコンピューティングデバイスと、
前記第2のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記入力オーディオ信号が信号処理のための前記閾値を満たすと判定し、前記第2のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるというインジケーションを前記データ処理システムに送信するために前記第2のデジタルアシスタントコンピューティングデバイスによって実行される前記信号品質チェッカと、
前記データ処理システムの前記オーケストレータコンポーネントであって、
前記第1のデジタルアシスタントコンピューティングデバイスからの前記インジケーションおよび前記第2のデジタルアシスタントコンピューティングデバイスからの前記インジケーションを受信し、
前記プライマリ信号プロセッサとして設定された前記第1のデジタルアシスタントコンピューティングデバイス、および前記第1のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるという前記インジケーションに基づいて、前記入力オーディオ信号を処理するために第1のデジタルアシスタントを選択し、
前記入力オーディオ信号を処理するように前記第1のデジタルアシスタントコンピューティングデバイスに命令し、
前記第2のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理することを防止するために前記第2のデジタルアシスタントコンピューティングデバイスにスタンバイモードになるように命令するための、前記オーケストレータコンポーネントと、
前記ダイレクトアクションAPIであって、
前記第1のデジタルアシスタントコンピューティングデバイスからコマンドを含むデータパケットを受信することであって、前記コマンドが、前記入力オーディオ信号に基づいて前記第1のデジタルアシスタントコンピューティングデバイスによって生成される、ことと、
前記複数のネットワーク接続されたデバイスのうちから選択されたネットワーク接続されたデバイスのために、前記コマンドに基づいてアクションデータ構造を生成することと、
前記ネットワーク接続されたデバイスを制御するために前記ネットワーク接続されたデバイスに前記アクションデータ構造を送信することとを行うための、前記ダイレクトアクションAPIとを含む、
システム。 - 前記複数のデジタルアシスタントコンピューティングデバイスが、異種のデバイスであり、
前記第1のデジタルアシスタントコンピューティングデバイスが、第1の種類のデバイスを含み、
前記第2のデジタルアシスタントコンピューティングデバイスが、第2の種類のデバイスを含む、
請求項1に記載のシステム。 - 前記第1のデジタルアシスタントコンピューティングデバイス、前記第2のデジタルアシスタントコンピューティングデバイス、および前記ネットワーク接続されたデバイスの各々が、アシスタントソフトウェア開発キットを用いて構成され、
前記第1の種類のデバイスが、スピーカデバイス、テレビデバイス、モバイルデバイス、およびウェアラブルデバイスのうちの少なくとも1つを含み、
前記第2の種類のデバイスが、前記スピーカデバイス、前記テレビデバイス、前記モバイルデバイス、および前記ウェアラブルデバイスのうちの少なくとも1つを含み、
前記ネットワーク接続されたデバイスが、前記スピーカデバイス、前記テレビデバイス、前記モバイルデバイス、前記ウェアラブルデバイス、デジタルランプ、デジタルサーモスタット、デジタル家電、およびデジタル自動車のうちの少なくとも1つを含む、
請求項2に記載のシステム。 - 前記第1のデジタルアシスタントコンピューティングデバイスの1つまたは複数の特徴を取得するために前記第1のデジタルアシスタントコンピューティングデバイスにポーリングし、
前記第2のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴を取得するために第2のデジタルアシスタントコンポーネントにポーリングし、
前記第1のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴および前記第2のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴の比較に基づいて、前記第1のデジタルアシスタントコンピューティングデバイスをプライマリ信号プロセッサとして設定し、前記第2のデジタルアシスタントコンピューティングデバイスをセカンダリ信号プロセッサとして設定すると決定し、
前記第1のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサとして設定し、前記第2のデジタルアシスタントコンピューティングデバイスを前記セカンダリ信号プロセッサとして設定するための前記データ処理システムを含む、
請求項1から3のいずれか一項に記載のシステム。 - 前記メモリ内の集中化されたアカウントに、前記第1のデジタルアシスタントコンピューティングデバイスと前記ネットワーク接続されたデバイスとの間の第1のリンク、および前記第2のデジタルアシスタントコンピューティングデバイスと前記ネットワーク接続されたデバイスとの間の第2のリンクを記憶し、
前記第1のデジタルアシスタントコンピューティングデバイスの選択に応じて、前記第1のリンクに基づいて、前記集中化されたアカウントにアクセスして前記アクションデータ構造の生成のための情報を取り出すための前記データ処理システムを含む、
請求項1から4のいずれか一項に記載のシステム。 - 前記集中化されたアカウントが、前記第1のデジタルアシスタントおよび第2のデジタルアシスタントのうちの少なくとも1つへのリンクを有する複数の異種のネットワーク接続されたデバイスに関連する情報を記憶し、前記システムが、
前記第1のデジタルアシスタントコンピューティングデバイスによって検出された前記入力オーディオ信号の特徴の第1の値を前記第2のデジタルアシスタントコンピューティングデバイスによって検出された前記入力オーディオ信号の前記特徴の第2の値と比較し、
前記比較に基づいて、前記複数のネットワーク接続されたデバイスから前記ネットワーク接続されたデバイスを選択するための前記データ処理システムを含む、
請求項5に記載のシステム。 - 機械学習モデルに基づいて、前記第1のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサとして設定すると決定するための前記データ処理システムを含む、
請求項1から6のいずれか一項に記載のシステム。 - 前記第1のデジタルアシスタントコンピューティングデバイスの状態の変化を検出し、
前記第1のデジタルアシスタントコンピューティングデバイスの前記状態の前記変化に基づいて、前記第2のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサに切り替え、前記第1のデジタルアシスタントコンピューティングデバイスを前記セカンダリ信号プロセッサに切り替えるための前記データ処理システムを含む、
請求項1から7のいずれか一項に記載のシステム。 - 機械学習モデルに基づいて信号処理のための前記閾値を決定し、
前記閾値を前記メモリ内の集中化されたアカウントに記憶するための前記データ処理システムを含む、
請求項1から8のいずれか一項に記載のシステム。 - 第2の入力オーディオ信号を受け取るための前記第1のデジタルアシスタントコンピューティングデバイスの前記センサと、
前記第1のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記第2の入力オーディオ信号が信号処理のための前記閾値を満たすことができないと判定し、前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でないというインジケーションを前記データ処理システムに送信するために前記第1のデジタルアシスタントコンピューティングデバイスによって実行される前記信号品質チェッカと、
前記第2の入力オーディオ信号を受け取るための前記第2のデジタルアシスタントコンピューティングデバイスの前記センサと、
前記第2のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記第2の入力オーディオ信号が信号処理のための前記閾値を満たすと判定し、前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であるというインジケーションを前記データ処理システムに送信するために前記第2のデジタルアシスタントコンピューティングデバイスによって実行される前記信号品質チェッカと、
前記データ処理システムであって、
前記第1のデジタルアシスタントコンピューティングデバイスから、前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でないという前記インジケーションを受信し、
前記第2のデジタルアシスタントコンピューティングデバイスから、前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であるという前記インジケーションを受信し、
前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でなく、前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であることに基づいて、前記第2の入力オーディオ信号を処理するために前記第2のデジタルアシスタントコンピューティングデバイスを選択するための、
前記データ処理システムと、
前記第2のデジタルアシスタントコンピューティングデバイスから第2のコマンドを含むデータパケットを受信するための前記ダイレクトアクションAPIとを含む、
請求項1から9のいずれか一項に記載のシステム。 - 音声駆動式のコンピューティング環境においてコンピューティングデバイスの間で信号処理を調整する方法であって、
第1のデジタルアシスタントコンピューティングデバイスのセンサにより前記第1のデジタルアシスタントコンピューティングデバイスによって入力オーディオ信号を検出するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスによって実行される信号品質チェッカによって、前記第1のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記入力オーディオ信号が信号処理のための閾値を満たすと判定するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるというインジケーションを、1つまたは複数のプロセッサおよびメモリを含むデータ処理システムに送信するステップと、
第2のデジタルアシスタントコンピューティングデバイスのセンサにより前記第2のデジタルアシスタントコンピューティングデバイスによって前記入力オーディオ信号を検出するステップと、
前記第2のデジタルアシスタントコンピューティングデバイスによって実行される信号品質チェッカによって、前記第2のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記入力オーディオ信号が信号処理のための前記閾値を満たすと判定するステップと、
前記第2のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるというインジケーションを前記データ処理システムに送信するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスからの前記インジケーションおよび前記第2のデジタルアシスタントコンピューティングデバイスからの前記インジケーションを前記データ処理システムによって受信するステップと、
プライマリ信号プロセッサとして設定された前記第1のデジタルアシスタントコンピューティングデバイス、および前記第1のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるという前記インジケーションに基づいて、前記データ処理システムによって、前記入力オーディオ信号を処理するために第1のデジタルアシスタントを選択するステップと、
前記データ処理システムによって、前記入力オーディオ信号を処理するように前記第1のデジタルアシスタントコンピューティングデバイスに命令するステップと、
前記データ処理システムによって、前記第2のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理することを防止するために前記第2のデジタルアシスタントコンピューティングデバイスにスタンバイモードになるように命令するステップと、
前記データ処理システムによって、前記第1のデジタルアシスタントコンピューティングデバイスからコマンドを含むデータパケットを受信するステップであって、前記コマンドが、前記入力オーディオ信号に基づいて前記第1のデジタルアシスタントコンピューティングデバイスによって生成される、ステップと、
複数のネットワーク接続されたデバイスのうちから選択されたネットワーク接続されたデバイスのために前記データ処理システムによって、前記コマンドに基づいてアクションデータ構造を生成するステップと、
前記データ処理システムによって、ネットワーク接続されたデバイスを制御するために前記ネットワーク接続されたデバイスに前記アクションデータ構造を送信するステップとを含む、
方法。 - 前記第1のデジタルアシスタントコンピューティングデバイスが、第1の種類のデバイスを含み、前記第2のデジタルアシスタントコンピューティングデバイスが、第2の種類のデバイスを含み、
前記第1のデジタルアシスタントコンピューティングデバイス、前記第2のデジタルアシスタントコンピューティングデバイス、および前記ネットワーク接続されたデバイスの各々が、アシスタントソフトウェア開発キットを用いて構成され、
前記第1の種類のデバイスが、スピーカデバイス、テレビデバイス、モバイルデバイス、およびウェアラブルデバイスのうちの少なくとも1つを含み、
前記第2の種類のデバイスが、前記スピーカデバイス、前記テレビデバイス、前記モバイルデバイス、および前記ウェアラブルデバイスのうちの少なくとも1つを含み、
前記ネットワーク接続されたデバイスが、前記スピーカデバイス、前記テレビデバイス、前記モバイルデバイス、前記ウェアラブルデバイス、デジタルランプ、デジタルサーモスタット、デジタル家電、およびデジタル自動車のうちの少なくとも1つを含む、
請求項11に記載の方法。 - 前記第1のデジタルアシスタントコンピューティングデバイスの1つまたは複数の特徴を取得するために前記第1のデジタルアシスタントコンピューティングデバイスにポーリングするステップと、
前記第2のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴を取得するために第2のデジタルアシスタントコンポーネントにポーリングするステップと、
前記第1のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴および前記第2のデジタルアシスタントコンピューティングデバイスの前記1つまたは複数の特徴の比較に基づいて、前記第1のデジタルアシスタントコンピューティングデバイスをプライマリ信号プロセッサとして設定し、前記第2のデジタルアシスタントコンピューティングデバイスをセカンダリ信号プロセッサとして設定すると決定するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサとして設定し、前記第2のデジタルアシスタントコンピューティングデバイスを前記セカンダリ信号プロセッサとして設定するステップとを含む、
請求項11または12に記載の方法。 - 前記データ処理システムによって、前記メモリ内の集中化されたアカウントに、前記第1のデジタルアシスタントコンピューティングデバイスと前記ネットワーク接続されたデバイスとの間の第1のリンク、および前記第2のデジタルアシスタントコンピューティングデバイスと前記ネットワーク接続されたデバイスとの間の第2のリンクを記憶するステップと、
前記データ処理システムによって、前記第1のデジタルアシスタントコンピューティングデバイスの選択に応じて、前記第1のリンクに基づいて、前記集中化されたアカウントにアクセスして前記アクションデータ構造の生成のための情報を取り出すステップとを含む、
請求項11から13のいずれか一項に記載の方法。 - 機械学習モデルに基づいて、前記第1のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサとして設定すると決定するステップを含む、
請求項11から14のいずれか一項に記載の方法。 - 前記第1のデジタルアシスタントコンピューティングデバイスの状態の変化を検出するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスの前記状態の前記変化に基づいて、前記第2のデジタルアシスタントコンピューティングデバイスを前記プライマリ信号プロセッサに切り替えるステップと、
前記第1のデジタルアシスタントコンピューティングデバイスをセカンダリ信号プロセッサに切り替えるステップとを含む、
請求項11から15のいずれか一項に記載の方法。 - 機械学習モデルに基づいて信号処理のための前記閾値を決定するステップと、
前記閾値を前記メモリ内の集中化されたアカウントに記憶するステップとを含む、
請求項11から16のいずれか一項に記載の方法。 - 前記第1のデジタルアシスタントコンピューティングデバイスの前記センサによって第2の入力オーディオ信号を受け取るステップと、
前記第1のデジタルアシスタントコンピューティングデバイスによって実行される前記信号品質チェッカによって、前記第1のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記第2の入力オーディオ信号が信号処理のための前記閾値を満たすことができないと判定するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスによって前記データ処理システムに、前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でないというインジケーションを送信するステップと、
前記第2のデジタルアシスタントコンピューティングデバイスの前記センサによって前記第2の入力オーディオ信号を受け取るステップと、
前記第2のデジタルアシスタントコンピューティングデバイスによって実行される前記信号品質チェッカによって、前記第2のデジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記第2の入力オーディオ信号が信号処理のための前記閾値を満たすと判定するステップと、
前記第2のデジタルアシスタントコンピューティングデバイスによって前記データ処理システムに、前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であるというインジケーションを送信するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でないという前記インジケーションを前記第1のデジタルアシスタントコンピューティングデバイスから前記データ処理システムによって受信するステップと、
前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であるという前記インジケーションを前記第2のデジタルアシスタントコンピューティングデバイスから前記データ処理システムによって受信するステップと、
前記第1のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能でなく、前記第2のデジタルアシスタントコンピューティングデバイスが前記第2の入力オーディオ信号を処理するように動作可能であることに基づいて、前記データ処理システムによって、前記第2の入力オーディオ信号を処理するために前記第2のデジタルアシスタントコンピューティングデバイスを選択するステップと、
ダイレクトアクションアプリケーションプログラミングインターフェース(ダイレクトアクションAPI)によって、前記第2のデジタルアシスタントコンピューティングデバイスから第2のコマンドを含むデータパケットを受信するステップとを含む、
請求項11から17のいずれか一項に記載の方法。 - デジタルアシスタントコンピューティングデバイスであって、
入力オーディオ信号を検出するためのセンサと、
オーディオドライバと、
プリプロセッサコンポーネントによって実行される信号品質チェッカと、
前記センサおよび前記オーディオドライバに結合された前記プリプロセッサコンポーネントであって、前記プリプロセッサコンポーネントが、
前記デジタルアシスタントコンピューティングデバイスの前記センサによって検出された前記入力オーディオ信号が信号処理のための閾値を満たすと判定し、
ネットワークを介してデータ処理システムに、前記デジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるというインジケーションを送信して、前記データ処理システムに、
前記デジタルアシスタントコンピューティングデバイスから前記インジケーションを受信することと、
前記デジタルアシスタントコンピューティングデバイスがプライマリ信号プロセッサとして設定され、前記入力オーディオ信号を検出する第2のデジタルコンピューティングデバイスがセカンダリ信号プロセッサとして設定されると決定することであって、前記第2のデジタルコンピューティングデバイスが、前記入力オーディオ信号を処理するように動作可能である、ことと、
前記プライマリ信号プロセッサとして設定された前記デジタルアシスタントコンピューティングデバイス、および前記デジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理するように動作可能であるという前記インジケーションに基づいて、前記入力オーディオ信号を処理するためにデジタルアシスタントを選択することとを行わせ、
前記入力オーディオ信号を処理する命令を前記デジタルアシスタントコンピューティングデバイスに送信し、
第2のデジタルアシスタントコンピューティングデバイスが前記入力オーディオ信号を処理することを防止するためにスタンバイモードになる命令を前記第2のデジタルアシスタントコンピューティングデバイスに送信し、
前記デジタルアシスタントコンピューティングデバイスの前記プリプロセッサコンポーネントが、
前記入力オーディオ信号を処理する前記命令を受信し、
前記入力オーディオ信号に基づいてコマンドを含むデータパケットを生成し、
前記データ処理システムに前記データパケットを送信して、前記データ処理システムに、
複数のネットワーク接続されたデバイスのうちから選択されたネットワーク接続されたデバイスのために、前記デジタルアシスタントコンピューティングデバイスから受信された前記コマンドに基づいてアクションデータ構造を生成させ、
前記ネットワーク接続されたデバイスを制御するために前記ネットワーク接続されたデバイスに前記アクションデータ構造を送信させるための、前記プリプロセッサコンポーネントとを含む、
デジタルアシスタントコンピューティングデバイス。 - オーディオドライバと、
スピーカコンポーネントと、
前記ネットワーク接続されたデバイスに送信された前記アクションデータ構造のステータスのインジケーションを受信し、前記スピーカコンポーネントに前記ステータスの前記インジケーションに対応するオーディオ出力を送出させるための出力オーディオ信号を生成するように前記オーディオドライバに命令するための前記プリプロセッサコンポーネントとを含む、
請求項19に記載のデバイス。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021183503A JP7328304B2 (ja) | 2017-12-08 | 2021-11-10 | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2017/065462 WO2019112625A1 (en) | 2017-12-08 | 2017-12-08 | Signal processing coordination among digital voice assistant computing devices |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021183503A Division JP7328304B2 (ja) | 2017-12-08 | 2021-11-10 | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021513693A true JP2021513693A (ja) | 2021-05-27 |
JP6977169B2 JP6977169B2 (ja) | 2021-12-08 |
Family
ID=60943105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020531042A Active JP6977169B2 (ja) | 2017-12-08 | 2017-12-08 | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11037555B2 (ja) |
EP (2) | EP3707607B1 (ja) |
JP (1) | JP6977169B2 (ja) |
KR (2) | KR102480949B1 (ja) |
CN (2) | CN117632482A (ja) |
WO (1) | WO2019112625A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023106269A (ja) * | 2022-01-20 | 2023-08-01 | マインドウェアワークス カンパニー リミテッド | 問い合わせ処理装置 |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10649727B1 (en) * | 2018-05-14 | 2020-05-12 | Amazon Technologies, Inc. | Wake word detection configuration |
JP7131077B2 (ja) * | 2018-05-24 | 2022-09-06 | カシオ計算機株式会社 | 会話装置、ロボット、会話装置制御方法及びプログラム |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
CN108922528B (zh) * | 2018-06-29 | 2020-10-23 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
CN112805182B (zh) * | 2018-10-05 | 2024-01-12 | 本田技研工业株式会社 | 智能体装置、智能体控制方法及存储介质 |
KR102179085B1 (ko) * | 2018-10-26 | 2020-11-16 | 주식회사 뮤즈라이브 | 비접촉 방식의 사용자 인증 방법 |
KR20200085593A (ko) * | 2019-01-07 | 2020-07-15 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법. |
CN113348505A (zh) * | 2019-02-08 | 2021-09-03 | 谷歌有限责任公司 | 适应第三方服务器的设备状态报告的差异 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US20210050003A1 (en) * | 2019-08-15 | 2021-02-18 | Sameer Syed Zaheer | Custom Wake Phrase Training |
TWI842905B (zh) * | 2019-12-16 | 2024-05-21 | 南韓商恩希軟件股份有限公司 | 線上服務存取控制裝置及方法 |
KR20210079004A (ko) | 2019-12-19 | 2021-06-29 | 삼성전자주식회사 | 컴퓨팅 장치 및 그 동작 방법 |
US11393471B1 (en) * | 2020-03-30 | 2022-07-19 | Amazon Technologies, Inc. | Multi-device output management based on speech characteristics |
US11038934B1 (en) * | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11810578B2 (en) | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
JP7310706B2 (ja) * | 2020-05-18 | 2023-07-19 | トヨタ自動車株式会社 | エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム |
US11367447B2 (en) * | 2020-06-09 | 2022-06-21 | At&T Intellectual Property I, L.P. | System and method for digital content development using a natural language interface |
US11735197B2 (en) * | 2020-07-07 | 2023-08-22 | Google Llc | Machine-learned differentiable digital signal processing |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11907676B1 (en) * | 2020-08-28 | 2024-02-20 | Amazon Technologies, Inc. | Processing orchestration for systems including distributed components |
EP3989218A1 (de) * | 2020-10-21 | 2022-04-27 | Deutsche Telekom AG | Bedienungsfreundlicher virtueller sprachassistent |
US11538480B1 (en) * | 2021-03-30 | 2022-12-27 | Amazon Technologies, Inc. | Integration of speech processing functionality with organization systems |
US11605387B1 (en) * | 2021-03-30 | 2023-03-14 | Amazon Technologies, Inc. | Assistant determination in a skill |
CN113689884B (zh) * | 2021-09-17 | 2024-01-26 | 中国电子科技集团公司第五十八研究所 | 多通道语音信号评估系统及方法 |
US20230134400A1 (en) * | 2021-11-03 | 2023-05-04 | Merlyn Mind, Inc. | Automatic adaptation of multi-modal system components |
US20230334241A1 (en) * | 2022-04-19 | 2023-10-19 | International Business Machines Corporation | Syntactic and semantic autocorrect learning |
US20240111811A1 (en) * | 2022-09-30 | 2024-04-04 | Google Llc | Selecting a device to respond to device-agnostic user requests |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2017520008A (ja) * | 2014-10-09 | 2017-07-20 | グーグル インコーポレイテッド | 複数のデバイス上でのホットワード検出 |
US20170287485A1 (en) * | 2016-02-24 | 2017-10-05 | Google Inc. | Methods And Systems For Detecting And Processing Speech Signals |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0765084A3 (en) | 1995-09-21 | 1997-10-15 | At & T Corp | Automatic video tracking system |
KR100506168B1 (ko) * | 2003-03-11 | 2005-08-05 | 현대통신 주식회사 | 원격에서 음성인식을 이용한 홈오토메이션/홈네트웍 상태감시 장치 및 그방법 |
US20060085183A1 (en) | 2004-10-19 | 2006-04-20 | Yogendra Jain | System and method for increasing recognition accuracy and modifying the behavior of a device in response to the detection of different levels of speech |
KR20090022379A (ko) * | 2007-08-30 | 2009-03-04 | 주식회사 티이씨앤코 | 홈서버 기능이 내장된 다기능 인터넷 화상전화기 및 그것을이용한 홈네트워크 시스템 |
US8159990B2 (en) * | 2009-03-11 | 2012-04-17 | Sony Ericsson Mobile Communications Ab | Wireless audio data distribution using broadcast and bidirectional communication channels |
JP5521908B2 (ja) * | 2010-08-30 | 2014-06-18 | ヤマハ株式会社 | 情報処理装置、音響処理装置、音響処理システムおよびプログラム |
JP2013257418A (ja) | 2012-06-12 | 2013-12-26 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
US9547647B2 (en) * | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9875494B2 (en) * | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
CN105981082B (zh) | 2013-10-07 | 2018-08-31 | 谷歌有限责任公司 | 提供针对检测事件的有用的跟踪通信的智能住家危险检测器 |
US20150195649A1 (en) | 2013-12-08 | 2015-07-09 | Flyover Innovations, Llc | Method for proximity based audio device selection |
CA2929479A1 (en) | 2013-12-19 | 2015-06-25 | Intel Corporation | Context-aware collaborative user tracking |
US20150221307A1 (en) | 2013-12-20 | 2015-08-06 | Saurin Shah | Transition from low power always listening mode to high power speech recognition mode |
US20160049147A1 (en) * | 2014-08-13 | 2016-02-18 | Glen J. Anderson | Distributed voice input processing based on power and sensing |
US20160071399A1 (en) | 2014-09-08 | 2016-03-10 | On Guard LLC | Personal security system |
US10204622B2 (en) | 2015-09-10 | 2019-02-12 | Crestron Electronics, Inc. | Acoustic sensory network |
KR101630067B1 (ko) | 2014-10-02 | 2016-06-13 | 유한회사 밸류스트릿 | 복수의 모바일 기기들을 이용한 사용자 위치 파악 및 사용자 제스쳐 인식에 의한 오디오 데이터 컨트롤 방법 및 장치 |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US10079012B2 (en) * | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US9848075B1 (en) * | 2015-05-14 | 2017-12-19 | Invoy Technologies, Llc | Communication system for pairing user devices with medical devices |
US9924010B2 (en) * | 2015-06-05 | 2018-03-20 | Apple Inc. | Audio data routing between multiple wirelessly connected devices |
WO2016210007A1 (en) | 2015-06-22 | 2016-12-29 | Loose Cannon Systems, Inc. | Portable group communication device and method of use |
CN106469040B (zh) * | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
KR20170027999A (ko) | 2015-09-03 | 2017-03-13 | 삼성전자주식회사 | 사용자 단말 장치, 시스템 및 그 제어 방법 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
CN105242556A (zh) | 2015-10-28 | 2016-01-13 | 小米科技有限责任公司 | 智能设备的语音控制方法、装置、控制设备及智能设备 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10044798B2 (en) | 2016-02-05 | 2018-08-07 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
US9749583B1 (en) | 2016-03-31 | 2017-08-29 | Amazon Technologies, Inc. | Location based device grouping with voice control |
CN107404381A (zh) * | 2016-05-19 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 一种身份认证方法和装置 |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US11188289B2 (en) | 2016-07-29 | 2021-11-30 | Hewlett-Packard Development Company, L.P. | Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data |
CN106448658B (zh) * | 2016-11-17 | 2019-09-20 | 海信集团有限公司 | 智能家居设备的语音控制方法及智能家居网关 |
US10839795B2 (en) * | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
CN107135445A (zh) | 2017-03-28 | 2017-09-05 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
KR101925034B1 (ko) | 2017-03-28 | 2018-12-04 | 엘지전자 주식회사 | 스마트 컨트롤링 디바이스 및 그 제어 방법 |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10237393B1 (en) | 2017-09-12 | 2019-03-19 | Intel Corporation | Safety systems and methods that use portable electronic devices to monitor the personal safety of a user |
US10685648B2 (en) | 2017-11-08 | 2020-06-16 | International Business Machines Corporation | Sensor fusion model to enhance machine conversational awareness |
-
2017
- 2017-12-08 CN CN202311517679.7A patent/CN117632482A/zh active Pending
- 2017-12-08 CN CN201780098121.6A patent/CN111542810B/zh active Active
- 2017-12-08 EP EP17826346.3A patent/EP3707607B1/en active Active
- 2017-12-08 US US15/764,907 patent/US11037555B2/en active Active
- 2017-12-08 KR KR1020207018067A patent/KR102480949B1/ko active IP Right Grant
- 2017-12-08 EP EP23154081.6A patent/EP4191412A1/en active Pending
- 2017-12-08 WO PCT/US2017/065462 patent/WO2019112625A1/en unknown
- 2017-12-08 KR KR1020227044827A patent/KR102691427B1/ko active IP Right Grant
- 2017-12-08 JP JP2020531042A patent/JP6977169B2/ja active Active
-
2021
- 2021-06-11 US US17/346,009 patent/US11705127B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003223188A (ja) * | 2002-01-29 | 2003-08-08 | Toshiba Corp | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2017520008A (ja) * | 2014-10-09 | 2017-07-20 | グーグル インコーポレイテッド | 複数のデバイス上でのホットワード検出 |
US20170287485A1 (en) * | 2016-02-24 | 2017-10-05 | Google Inc. | Methods And Systems For Detecting And Processing Speech Signals |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023106269A (ja) * | 2022-01-20 | 2023-08-01 | マインドウェアワークス カンパニー リミテッド | 問い合わせ処理装置 |
JP7406838B2 (ja) | 2022-01-20 | 2023-12-28 | マインドウェアワークス カンパニー リミテッド | 問い合わせ処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US11037555B2 (en) | 2021-06-15 |
WO2019112625A1 (en) | 2019-06-13 |
EP3707607A1 (en) | 2020-09-16 |
JP6977169B2 (ja) | 2021-12-08 |
US20200312317A1 (en) | 2020-10-01 |
CN111542810B (zh) | 2023-12-01 |
EP4191412A1 (en) | 2023-06-07 |
US20210304761A1 (en) | 2021-09-30 |
EP3707607B1 (en) | 2023-02-01 |
CN111542810A (zh) | 2020-08-14 |
KR20230004947A (ko) | 2023-01-06 |
US11705127B2 (en) | 2023-07-18 |
KR102480949B1 (ko) | 2022-12-23 |
KR102691427B1 (ko) | 2024-08-05 |
KR20200089728A (ko) | 2020-07-27 |
CN117632482A (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6977169B2 (ja) | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 | |
US11823704B2 (en) | Signal processing coordination among digital voice assistant computing devices | |
JP6797916B2 (ja) | スタック形式のデータ構造のデジタルアシスタント処理 | |
US11119723B2 (en) | User-adaptive volume selection | |
JP6471174B2 (ja) | ホームオートメーションのためのインテリジェントアシスタント | |
WO2018157721A1 (zh) | 信息获取方法、提供方法、装置及系统、存储介质 | |
EP4029012B1 (en) | Techniques for dialog processing using contextual data | |
US11056114B2 (en) | Voice response interfacing with multiple smart devices of different types | |
JP7071504B2 (ja) | ネットワーク化されたシステムにおける分散型の識別 | |
JP2018506105A (ja) | 音声ベースシステムにおけるアプリケーションフォーカス | |
JP2019174846A (ja) | データ送信のためのフィードバックコントローラ | |
US20230044403A1 (en) | Inferring semantic label(s) for assistant device(s) based on device-specific signal(s) | |
JP7328304B2 (ja) | デジタル音声アシスタントコンピューティングデバイスの間の信号処理の調整 | |
US11442692B1 (en) | Acoustic workflow system distribution | |
EP3792912A1 (en) | Improved wake-word recognition in low-power devices | |
JP6995966B2 (ja) | スタック形式のデータ構造のデジタルアシスタント処理 | |
US20230368785A1 (en) | Processing voice input in integrated environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6977169 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |