JP6640993B2 - 音声対応デバイス間の調停 - Google Patents
音声対応デバイス間の調停 Download PDFInfo
- Publication number
- JP6640993B2 JP6640993B2 JP2018511666A JP2018511666A JP6640993B2 JP 6640993 B2 JP6640993 B2 JP 6640993B2 JP 2018511666 A JP2018511666 A JP 2018511666A JP 2018511666 A JP2018511666 A JP 2018511666A JP 6640993 B2 JP6640993 B2 JP 6640993B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- audio
- voice
- metric value
- enabled device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 369
- 238000000034 method Methods 0.000 claims description 74
- 230000015654 memory Effects 0.000 claims description 23
- 230000003595 spectral effect Effects 0.000 claims description 16
- 238000005259 measurement Methods 0.000 claims description 13
- 230000004907 flux Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 37
- 230000004044 response Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
- User Interface Of Digital Computer (AREA)
Description
本出願は、2015年9年11日に出願された米国特許出願第14/852,022号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
本開示は、複数の音声対応デバイスによって検出される音声入力を扱う音声対応デバイスを選択するためのアーキテクチャ及び技術を記載する。一部の例では、音声対応デバイスが各々ユーザに近い範囲内に位置するために、複数の音声対応デバイスが、ほぼ同時にユーザからの音声入力を検出する場合がある。アーキテクチャ及び技術は、音声対応デバイスに関する多様な種類の音声信号のメトリック値を分析して、音声入力の処理を扱う音声対応デバイスを指定することができる。これは、重複する入力処理を回避することによって、ユーザエクスペリエンスを高めることができる。さらに、これは最適な音声信号が処理されることを可能にし得る。
図1は、本明細書に記載される技術が実装され得るアーキテクチャ100を一例として示す。アーキテクチャ100は、複数の音声対応デバイス104(1)−(N)(まとめて「音声対応デバイス104))と通信することで、様々な処理を促進するように構成されている。例えばサービスプロバイダ102は、1つ又は複数のユーザ106(以後「ユーザ106」)によって提供された音声入力に関して音声対応デバイス104から音声信号を受信することができる。サービスプロバイダ102は、この音声信号を処理して、ユーザ106のためにタスクを実行する、ユーザ106に対する応答を考案するなどできる。一部の例では、サービスプロバイダ102は、音声対応デバイス104のうちのいくつかのデバイスによって検出された音声入力を扱う音声対応デバイス104のうちの1つを選択することができる。追加として又は代替として、一部の例ではサービスプロバイダ102は、音声出力を扱う、音声対応デバイス104のうちの同一の1つ又は異なる1つを選択する場合もある。サービスプロバイダ102と、音声対応デバイス104は、1つ又は複数のネットワーク108を介して通信することができる。1つ又は複数のネットワーク108は、例えばセルラーネットワーク、無線ネットワーク、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、パーソナルエリアネットワーク(PAN)、インターネットなど、任意の1つのネットワーク又は複数の異なるタイプのネットワーク組み合わせを含む場合がある。図1に図示されていないが、音声対応デバイス104の各々は、無線ルータ、セルタワーなどの無線アクセスポイントに接続されてよい。例えば音声対応デバイス104の各々は、ユーザ106の住居内に位置する無線ルータに無線接続されてよい。あるいは又は追加として、音声対応デバイス104は、有線接続を介して互いに接続される場合もある。
図2は、図1のサービスプロバイダ102の構成要素を一例として示している。上記で考察したように、サービスプロバイダ102は、1つ又は複数のコンピューティングデバイスとして実装されてよい。1つ又は複数のコンピューティングデバイスには、1つ又は複数のプロセッサ202,メモリ204及び1つ又は複数のネットワークインターフェース206が装備されてよい。1つ又は複数のプロセッサ202は、中央処理装置(CPU)、グラフィックプロセッシングユニット(GPU)、マイクロプロセッサ、デジタル信号プロセッサなどを含んでよい。
図3は、図1の音声対応デバイス104のうちの1つの構成要素の一例を示す。音声対応デバイス104は、1つ又は複数のプロセッサ302と、メモリ304と、1つ又は複数のネットワークインターフェース306と、1つ又は複数のマイクロフォン308(以後「マイクロフォン308」)とを含んでよい。1つ又は複数のプロセッサ302は、中央処理装置(CPU)、グラフィックプロセッシングユニット(GPU)、マイクロプロセッサ、デジタル信号プロセッサなどを含んでよい。例示されていないが、音声対応デバイス104は、1つ又は複数の入/出力デバイス(例えばマウス、キーボードなど)、1つ又は複数のカメラ(例えば後方向き、前方向きなど)、1つ又は複数のディスプレイ(例えばタッチスクリーン、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、有機LEDディスプレイ、プラズマディスプレイ、電子ペーパディスプレイなど)、1つ又は複数のセンサ(例えば加速度計、磁力計など)、1つ又は複数のスピーカ、1つ又は複数の照明などを含んでよい。音声対応デバイス104の任意の数の構成要素を使用して、ユーザから入力を受信する及び/又は応答を出力することができる。例えばマイクロフォン308は、ユーザからの発話を検出し、スピーカ又は照明が、この発話入力に対してタスクが行われたことの指示(例えば「あなたのために製品を注文しました」という音声出力、照明を使用可能にするなど)によって応答することができる。さらに、1つ又は複数のネットワークインターフェース306は、1つ又は複数のネットワークを介して通信することができる(例えば音声信号、音声信号メトリック値などの情報を受信する、又はサービスプロバイダ102に情報を送信するなど)。
{y(1)(k),y(2)(k),...,y(N)(k)},
{f(1)(k),f(2)(k),...,f(N)(k)},
{S(1)(k),S(2)(k),...,S(N)(k)},
S(k)=alpha*S(k-1)+(1-alpha)*f(k)
(f(k)>S(k))ならば、
S(k)=alpha_attack*S(k-l)+(1-alpha_attack)*f(k)
そうでなければ、
S(k)=alpha_release*S(k-l)+(l-alpha_release)*f(k)
図4及び図5は、本明細書に記載される技術を採用するためのプロセス400及び500を一例として示す。例示し易くするために、プロセス400及び500は、図1のアーキテクチャ100において実施されるように説明される。例えばプロセス400及び500の個々の動作のうちの1つ又は複数は、サービスプロバイダ102及び/又は音声対応デバイス104のいずれかによって実行されてよい。しかしながらプロセス400及び500は、他のアーキテクチャにおいて実行される場合もある。さらにアーキテクチャ100は、他のプロセスを実行するのに使用される場合もある。
いくつかの実施形態が、構造的特徴及び/又は方法論的行為に特有の言語で説明されているが、本開示は必ずしも上述の特定の特徴又は行為に限定されないことを理解されたい。むしろ、特定の特徴及び動作は、これらの実施形態を実施する例示的な形態として本明細書に開示される。
Claims (13)
- 1つ又は複数のプロセッサと、
前記1つ又は複数のプロセッサに通信可能に結合されたメモリであって、前記1つ又は複数のプロセッサによって実行される際、前記1つ又は複数のプロセッサに、
第1の音声対応デバイスに対応付けられた第1の音声信号に対応付けられた第1の音声信号メトリック値を識別することと、
第2の音声対応デバイスに対応付けられる第2の音声信号メトリック値を識別することであって、
前記第2の音声信号メトリック値は少なくとも第3の音声信号メトリック値及び第4の音声信号メトリック値の平均であり、
前記第3の音声信号メトリック値は前記第2の音声対応デバイスの第1のマイクロフォンにより特定される第3の音声信号に対応付けられ、
前記第4の音声信号メトリック値は前記第2の音声対応デバイスの第2のマイクロフォンにより特定される第4の音声信号に対応付けられる、第2の音声信号メトリック値を識別することと、
前記第1の音声信号メトリック値及び前記第2の音声信号メトリック値に少なくとも一部基づいて、前記第1の音声信号を選択することと、
前記第1の音声信号を処理することとを含む動作を実行させる実行可能命令を記憶する前記メモリとを備えるシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声信号及び第2の音声信号が互いの閾値の時間の範囲内で生成されたことを特定すること
を含む動作を実行させる命令を更に含む、請求項1に記載のシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声対応デバイス及び前記第2の音声対応デバイスが互いの所定の距離の範囲内に配置されていると特定すること
を含む動作を実行させる命令を更に含む、請求項1又は請求項2に記載のシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声対応デバイス及び前記第2の音声対応デバイスが同じアカウントに対応付けられていることを特定すること
を含む動作を実行させる命令を更に含む請求項1〜3のいずれか一項に記載のシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声信号と、第2の音声信号との間の対応関係の強度を示す値が閾値以上であることを特定すること
を含む動作を実行させる命令を更に含む、請求項1〜4のいずれか一項に記載のシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声信号に関する第1の認識信頼度スコアが閾値を超えており、第2の音声信号に関する第2の認識信頼度スコアが前記閾値を超えていることを特定することであって、前記第1の認識信頼度スコアは、特定の単語が前記第1の音声信号の中で正確に検出される第1の信頼度のレベルを指しており、前記第2の認識信頼度スコアは、前記特定の単語及び異なる単語が前記第2の音声信号の中で正確に検出される第2の信頼度のレベルを指していること
を含む動作をさらに実行させる命令を更に含む、請求項1〜5のいずれか一項に記載のシステム。 - 前記第1の音声信号メトリック値は、信号対ノイズ比、スペクトル重心計測値、音声エネルギーレベル、スペクトルフラックス、特定のパーセンタイル周波数、周期性、明瞭性又は調和性のうちの少なくとも1つを含む、請求項1〜6のいずれか一項に記載のシステム。
- 前記第1の音声信号メトリック値は、前記第2の音声信号メトリック値、前記第3の音声信号メトリック値、及び前記第4の音声信号メトリック値より高い値に対応する、請求項1〜7のいずれか一項に記載のシステム。
- 前記第1の音声信号メトリック値は、最も高い値を有する音声信号メトリック値と、最も低い値を有する別の音声信号メトリック値との差によって重み付けされている、請求項1〜8のいずれか一項に記載のシステム。
- 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声信号に対応付けられたタスクを実行することと、
前記第1の音声対応デバイスに、前記第1の音声対応デバイスが前記タスクが完了したことの指示を出力することをリクエストする命令を送信することと
を含む動作をさらに実行させる命令を更に含む、請求項1〜9のいずれか一項に記載のシステム。 - 1つ又は複数のプロセッサと、
前記1つ又は複数のプロセッサに通信可能に結合されたメモリであって、前記1つ又は複数のプロセッサによって実行される際、前記1つ又は複数のプロセッサに、
第1の音声対応デバイス及び第2の音声対応デバイスがほぼ同時に音声入力を受信したことを特定することと、
最も高い値を有する第1のビーム形成音声信号メトリック値と、最も低い値を有すると第2のビーム形成音声信号メトリック値との差を求めることであって、
前記第1のビーム形成音声信号メトリック値は、前記第1の音声対応デバイスの第1のマイクロフォンにより特定される第1の音声信号と対応付けられており、
前記第2のビーム形成音声信号メトリック値は、前記第1の音声対応デバイスの第2のマイクロフォンにより特定される第2の音声信号と対応付けられている、差を求めることと、
前記差に少なくとも一部基づいて、第1の音声信号メトリック値を特定することと、
と、
前記受信した音声入力を処理することを続けるように前記第1の音声信号を選択することと、
前記第1の音声信号が処理されるようにすることと
を含む動作を実行するようにさせる実行可能命令を記憶する前記メモリとを備えるシステム。 - 前記第1の音声対応デバイスは、前記第1のマイクロフォン及び前記第2のマイクロフォンを含むマイクロフォンアレイを備え、前記第1のマイクロフォン及び前記第2のマイクロフォンが、前記受信した音声入力に関してそれぞれ入力信号を特定するようにさらに構成されており、
前記システムは、前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声対応デバイスの前記マイクロフォンアレイから受信した前記入力信号に少なくとも一部基づいて第1のビーム形成音声信号及び第2のビーム形成音声信号を特定し、前記第1のビーム形成音声信号は、前記第1の音声対応デバイスに対する第1の方向に関して特定され、及び前記第2のビーム形成音声信号は、前記第1の音声対応デバイスに対する第2の方向に関して特定されることと、
前記第1の音声信号メトリック値を特定することと
を含む動作をさらに実行させる命令を更に含む、請求項11に記載のシステム。 - 前記1つ又は複数のプロセッサにより実行される際、前記1つ又は複数のプロセッサに、
前記第1の音声信号メトリック値に少なくとも一部基づいて、前記第1のビーム形成音声信号を選択することと、
前記第1のビーム形成音声信号に関して第3の音声信号メトリック値を識別することと
を含む動作をさらに実行させる命令を更に含む、請求項12に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/852,022 | 2015-09-11 | ||
US14/852,022 US10026399B2 (en) | 2015-09-11 | 2015-09-11 | Arbitration between voice-enabled devices |
PCT/US2016/050784 WO2017044629A1 (en) | 2015-09-11 | 2016-09-08 | Arbitration between voice-enabled devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018532151A JP2018532151A (ja) | 2018-11-01 |
JP6640993B2 true JP6640993B2 (ja) | 2020-02-05 |
Family
ID=56940440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018511666A Active JP6640993B2 (ja) | 2015-09-11 | 2016-09-08 | 音声対応デバイス間の調停 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10026399B2 (ja) |
EP (1) | EP3347894B1 (ja) |
JP (1) | JP6640993B2 (ja) |
KR (1) | KR102089485B1 (ja) |
CN (1) | CN107924681B (ja) |
CA (1) | CA2997934C (ja) |
WO (1) | WO2017044629A1 (ja) |
Families Citing this family (289)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8914290B2 (en) | 2011-05-20 | 2014-12-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
EP3809407A1 (en) | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9432769B1 (en) | 2014-07-30 | 2016-08-30 | Amazon Technologies, Inc. | Method and system for beam selection in microphone array beamformers |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
AU2015390534B2 (en) | 2015-04-10 | 2019-08-22 | Honor Device Co., Ltd. | Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9734822B1 (en) * | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
US11587559B2 (en) * | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10142754B2 (en) | 2016-02-22 | 2018-11-27 | Sonos, Inc. | Sensor on moving component of transducer |
US9947323B2 (en) * | 2016-04-01 | 2018-04-17 | Intel Corporation | Synthetic oversampling to enhance speaker identification or verification |
KR20170132622A (ko) * | 2016-05-24 | 2017-12-04 | 삼성전자주식회사 | 음성 인식 기능을 갖는 전자 장치 및 전자 장치의 동작 방법 |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10714121B2 (en) | 2016-07-27 | 2020-07-14 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
US9693164B1 (en) | 2016-08-05 | 2017-06-27 | Sonos, Inc. | Determining direction of networked microphone device relative to audio playback device |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9972320B2 (en) * | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US9794720B1 (en) | 2016-09-22 | 2017-10-17 | Sonos, Inc. | Acoustic position measurement |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
EP3430617B1 (en) | 2016-11-07 | 2019-10-23 | Google LLC | Recorded media hotword trigger suppression |
US10827263B2 (en) | 2016-11-21 | 2020-11-03 | Harman Becker Automotive Systems Gmbh | Adaptive beamforming |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10467509B2 (en) * | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10839795B2 (en) * | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
US10621980B2 (en) * | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
CN107154265A (zh) * | 2017-03-30 | 2017-09-12 | 联想(北京)有限公司 | 一种采集控制方法及电子设备 |
US10825471B2 (en) * | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US10748531B2 (en) * | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336892A1 (en) * | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US10665232B2 (en) * | 2017-05-24 | 2020-05-26 | Harman International Industries, Inc. | Coordination among multiple voice recognition devices |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10069976B1 (en) * | 2017-06-13 | 2018-09-04 | Harman International Industries, Incorporated | Voice agent forwarding |
US10636428B2 (en) | 2017-06-29 | 2020-04-28 | Microsoft Technology Licensing, Llc | Determining a target device for voice command interaction |
US10360909B2 (en) * | 2017-07-27 | 2019-07-23 | Intel Corporation | Natural machine conversing method and apparatus |
US11205421B2 (en) * | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10304475B1 (en) * | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
EP3447768A1 (en) * | 2017-08-21 | 2019-02-27 | Vestel Elektronik Sanayi ve Ticaret A.S. | Method of transferring a call, user device and a computer program |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US10546583B2 (en) * | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10224033B1 (en) * | 2017-09-05 | 2019-03-05 | Motorola Solutions, Inc. | Associating a user voice query with head direction |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
KR20190033384A (ko) * | 2017-09-21 | 2019-03-29 | 삼성전자주식회사 | 사용자 발화를 처리하기 위한 전자 장치 및 그 전자 장치의 제어 방법 |
JP2019537071A (ja) * | 2017-09-25 | 2019-12-19 | ボーズ・コーポレーションBosecorporation | 分散したマイクロホンからの音声の処理 |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
EP3467819A1 (en) * | 2017-10-05 | 2019-04-10 | Harman Becker Automotive Systems GmbH | Apparatus and method using multiple voice command devices |
KR102421255B1 (ko) * | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR102517219B1 (ko) | 2017-11-23 | 2023-04-03 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
EP3493200B1 (en) * | 2017-11-30 | 2023-07-26 | Vestel Elektronik Sanayi ve Ticaret A.S. | Voice-controllable device and method of voice control |
KR102527278B1 (ko) * | 2017-12-04 | 2023-04-28 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 |
WO2019112614A1 (en) | 2017-12-08 | 2019-06-13 | Google Llc | Isolating a device, from multiple devices in an environment, for being responsive to spoken assistant invocation(s) |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US10536286B1 (en) * | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10536288B1 (en) * | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10536287B1 (en) | 2017-12-13 | 2020-01-14 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10374816B1 (en) * | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10762900B2 (en) * | 2018-03-07 | 2020-09-01 | Microsoft Technology Licensing, Llc | Identification and processing of commands by digital assistants in group device environments |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
CN108510987B (zh) * | 2018-03-26 | 2020-10-23 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US11145299B2 (en) * | 2018-04-19 | 2021-10-12 | X Development Llc | Managing voice interface devices |
DE102018110759A1 (de) | 2018-05-04 | 2019-11-07 | Sennheiser Electronic Gmbh & Co. Kg | Mikrofonarray |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10607610B2 (en) | 2018-05-29 | 2020-03-31 | Nortek Security & Control Llc | Audio firewall |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
CN112513845A (zh) * | 2018-06-06 | 2021-03-16 | 亚马逊技术股份有限公司 | 与语音使能设备的暂时账户关联 |
US10714085B2 (en) | 2018-06-06 | 2020-07-14 | Amazon Technologies, Inc. | Temporary account association with voice-enabled devices |
US10847153B2 (en) | 2018-06-06 | 2020-11-24 | Amazon Technologies, Inc. | Temporary account association with voice-enabled devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
NO20181210A1 (en) * | 2018-08-31 | 2020-03-02 | Elliptic Laboratories As | Voice assistant |
US11076018B1 (en) * | 2018-09-04 | 2021-07-27 | Amazon Technologies, Inc. | Account association for voice-enabled devices |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
WO2020060311A1 (en) * | 2018-09-20 | 2020-03-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US10878812B1 (en) * | 2018-09-26 | 2020-12-29 | Amazon Technologies, Inc. | Determining devices to respond to user requests |
US11100926B2 (en) | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
KR20200052804A (ko) | 2018-10-23 | 2020-05-15 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
WO2020085794A1 (en) * | 2018-10-23 | 2020-04-30 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
KR20200047311A (ko) * | 2018-10-24 | 2020-05-07 | 삼성전자주식회사 | 복수의 장치들이 있는 환경에서의 음성 인식 방법 및 장치 |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
KR102051011B1 (ko) * | 2018-11-27 | 2019-12-02 | 오아 주식회사 | 학습 기반 음성 인식 단말을 제어하는 서버 및 제어 방법 |
KR102051016B1 (ko) * | 2018-11-27 | 2019-12-02 | 오아 주식회사 | 학습 기반 음성 인식 단말을 제어하는 서버 및 제어 방법 |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
KR20200074680A (ko) | 2018-12-17 | 2020-06-25 | 삼성전자주식회사 | 단말 장치 및 이의 제어 방법 |
US10811032B2 (en) * | 2018-12-19 | 2020-10-20 | Cirrus Logic, Inc. | Data aided method for robust direction of arrival (DOA) estimation in the presence of spatially-coherent noise interferers |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11503422B2 (en) | 2019-01-22 | 2022-11-15 | Harman International Industries, Incorporated | Mapping virtual sound sources to physical speakers in extended reality applications |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11170799B2 (en) * | 2019-02-13 | 2021-11-09 | Harman International Industries, Incorporated | Nonlinear noise reduction system |
US11417323B2 (en) | 2019-02-27 | 2022-08-16 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
KR20200109140A (ko) * | 2019-03-12 | 2020-09-22 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11938820B2 (en) | 2019-04-09 | 2024-03-26 | Harman International Industries, Incorporated | Voice control of vehicle systems |
CN111862988B (zh) * | 2019-04-26 | 2023-03-03 | 广东美的白色家电技术创新中心有限公司 | 语音识别设备及其唤醒响应方法、计算机存储介质 |
US11120794B2 (en) * | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
KR20200132613A (ko) * | 2019-05-16 | 2020-11-25 | 삼성전자주식회사 | 웨이크 언 보이스(Wake on Voice, WoV) 기술을 이용한 음성 인식 수행 방법 및 장치 |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11056114B2 (en) | 2019-05-30 | 2021-07-06 | International Business Machines Corporation | Voice response interfacing with multiple smart devices of different types |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
KR102228549B1 (ko) * | 2019-06-11 | 2021-03-16 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스 |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
KR102246661B1 (ko) * | 2019-06-25 | 2021-05-03 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법 및 장치 |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
CN110517676A (zh) * | 2019-08-21 | 2019-11-29 | Oppo广东移动通信有限公司 | 一种语音唤醒方法及终端、服务器、存储介质 |
CN110364161A (zh) | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及系统 |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
CN110517682B (zh) * | 2019-09-02 | 2022-08-30 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、设备及存储介质 |
CN110718219B (zh) * | 2019-09-12 | 2022-07-22 | 百度在线网络技术(北京)有限公司 | 一种语音处理方法、装置、设备和计算机存储介质 |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
CN110890092B (zh) * | 2019-11-07 | 2022-08-05 | 北京小米移动软件有限公司 | 唤醒控制方法及装置、计算机存储介质 |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN111276139B (zh) * | 2020-01-07 | 2023-09-19 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
CN113345421B (zh) * | 2020-02-18 | 2022-08-02 | 中国科学院声学研究所 | 一种基于角度谱特征的多通道远场的目标语音识别方法 |
US11538483B2 (en) * | 2020-03-25 | 2022-12-27 | Vmware, Inc. | Task redirection by a voice assistant |
CN111540350B (zh) * | 2020-03-31 | 2024-03-01 | 北京小米移动软件有限公司 | 一种智能语音控制设备的控制方法、装置及存储介质 |
CN111640431B (zh) * | 2020-04-30 | 2023-10-27 | 海尔优家智能科技(北京)有限公司 | 一种设备响应处理方法及装置 |
KR20210136463A (ko) * | 2020-05-07 | 2021-11-17 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11810578B2 (en) * | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11393473B1 (en) * | 2020-05-18 | 2022-07-19 | Amazon Technologies, Inc. | Device arbitration using audio characteristics |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
KR20210147678A (ko) * | 2020-05-29 | 2021-12-07 | 엘지전자 주식회사 | 인공 지능 장치 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
KR20220034571A (ko) * | 2020-09-11 | 2022-03-18 | 삼성전자주식회사 | 음성에 포함된 커맨드를 확인하는 전자 장치와 이의 동작 방법 |
KR20220049778A (ko) | 2020-10-15 | 2022-04-22 | 주식회사 케이티 | 복수의 음성 인식 단말을 이용하여 음성 인식 서비스를 제공하는 서버, 음성 인식 단말 및 방법 |
EP4216211A4 (en) * | 2020-10-30 | 2024-03-27 | Samsung Electronics Co Ltd | ELECTRONIC DEVICE AND CONTROL METHOD THEREOF |
WO2022102893A1 (ko) * | 2020-11-11 | 2022-05-19 | 삼성전자주식회사 | 전자 장치, 시스템 및 그 제어 방법 |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
JP7154335B2 (ja) * | 2021-03-18 | 2022-10-17 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
US11915708B2 (en) * | 2021-03-18 | 2024-02-27 | Samsung Electronics Co., Ltd. | Methods and systems for invoking a user-intended internet of things (IoT) device from a plurality of IoT devices |
US20220366170A1 (en) * | 2021-04-21 | 2022-11-17 | Meta Platforms, Inc. | Auto-Capture of Interesting Moments by Assistant Systems |
US11861315B2 (en) | 2021-04-21 | 2024-01-02 | Meta Platforms, Inc. | Continuous learning for natural-language understanding models for assistant systems |
US20220358917A1 (en) * | 2021-04-21 | 2022-11-10 | Meta Platforms, Inc. | Multi-device Mediation for Assistant Systems |
DE202022101069U1 (de) | 2022-02-24 | 2022-03-23 | Pankaj Agarwal | Intelligentes Geräuscherkennungssystem auf der Grundlage der Verarbeitung mehrerer Geräusche durch künstliche Intelligenz |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57124626A (en) * | 1981-01-23 | 1982-08-03 | Toshiba Corp | Cooker |
CN1192358C (zh) * | 1997-12-08 | 2005-03-09 | 三菱电机株式会社 | 声音信号加工方法和声音信号加工装置 |
JP2001075594A (ja) * | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
JP4086280B2 (ja) * | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
US6983244B2 (en) * | 2003-08-29 | 2006-01-03 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for improved speech recognition with supplementary information |
DE602004015987D1 (de) * | 2004-09-23 | 2008-10-02 | Harman Becker Automotive Sys | Mehrkanalige adaptive Sprachsignalverarbeitung mit Rauschunterdrückung |
JP4821489B2 (ja) * | 2006-08-04 | 2011-11-24 | トヨタ自動車株式会社 | ロボット装置及びロボット装置の制御方法 |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8831944B2 (en) * | 2009-12-15 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for tightly coupling automatic speech recognition and search |
JP5411807B2 (ja) * | 2010-05-25 | 2014-02-12 | 日本電信電話株式会社 | チャネル統合方法、チャネル統合装置、プログラム |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
CN103002171B (zh) * | 2011-09-30 | 2015-04-29 | 斯凯普公司 | 处理音频信号的方法和装置 |
US9093076B2 (en) | 2012-04-30 | 2015-07-28 | 2236008 Ontario Inc. | Multipass ASR controlling multiple applications |
US10229697B2 (en) * | 2013-03-12 | 2019-03-12 | Google Technology Holdings LLC | Apparatus and method for beamforming to obtain voice and noise signals |
US9542947B2 (en) * | 2013-03-12 | 2017-01-10 | Google Technology Holdings LLC | Method and apparatus including parallell processes for voice recognition |
DE102014109121B4 (de) | 2013-07-10 | 2023-05-04 | Gm Global Technology Operations, Llc | Systeme und Verfahren zur Arbitrierung eines Sprachdialogdienstes |
US9432769B1 (en) * | 2014-07-30 | 2016-08-30 | Amazon Technologies, Inc. | Method and system for beam selection in microphone array beamformers |
US9812126B2 (en) * | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
-
2015
- 2015-09-11 US US14/852,022 patent/US10026399B2/en active Active
-
2016
- 2016-09-08 CA CA2997934A patent/CA2997934C/en active Active
- 2016-09-08 WO PCT/US2016/050784 patent/WO2017044629A1/en unknown
- 2016-09-08 CN CN201680049580.0A patent/CN107924681B/zh active Active
- 2016-09-08 KR KR1020187006764A patent/KR102089485B1/ko active IP Right Grant
- 2016-09-08 EP EP16766788.0A patent/EP3347894B1/en active Active
- 2016-09-08 JP JP2018511666A patent/JP6640993B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US10026399B2 (en) | 2018-07-17 |
WO2017044629A1 (en) | 2017-03-16 |
EP3347894B1 (en) | 2020-04-08 |
US20170076720A1 (en) | 2017-03-16 |
CN107924681A (zh) | 2018-04-17 |
CA2997934C (en) | 2021-03-23 |
JP2018532151A (ja) | 2018-11-01 |
CA2997934A1 (en) | 2017-03-16 |
KR102089485B1 (ko) | 2020-03-17 |
CN107924681B (zh) | 2022-05-17 |
KR20180039135A (ko) | 2018-04-17 |
EP3347894A1 (en) | 2018-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6640993B2 (ja) | 音声対応デバイス間の調停 | |
US11600271B2 (en) | Detecting self-generated wake expressions | |
CN108351872B (zh) | 用于响应用户语音的方法和系统 | |
US11289087B2 (en) | Context-based device arbitration | |
US11138977B1 (en) | Determining device groups | |
US10353495B2 (en) | Personalized operation of a mobile device using sensor signatures | |
Guo et al. | Localising speech, footsteps and other sounds using resource-constrained devices | |
JP2023546703A (ja) | マルチチャネル音声アクティビティ検出 | |
US20220270601A1 (en) | Multi-modal smart audio device system attentiveness expression | |
US20170206898A1 (en) | Systems and methods for assisting automatic speech recognition | |
US11792570B1 (en) | Parallel noise suppression | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6640993 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |