JP6942763B2 - 複数の音声サービス - Google Patents

複数の音声サービス Download PDF

Info

Publication number
JP6942763B2
JP6942763B2 JP2019145039A JP2019145039A JP6942763B2 JP 6942763 B2 JP6942763 B2 JP 6942763B2 JP 2019145039 A JP2019145039 A JP 2019145039A JP 2019145039 A JP2019145039 A JP 2019145039A JP 6942763 B2 JP6942763 B2 JP 6942763B2
Authority
JP
Japan
Prior art keywords
voice
audio
voice service
nmd
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019145039A
Other languages
English (en)
Other versions
JP2020005273A (ja
Inventor
デイン・ウィルバーディング
Original Assignee
ソノズ インコーポレイテッド
ソノズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソノズ インコーポレイテッド, ソノズ インコーポレイテッド filed Critical ソノズ インコーポレイテッド
Publication of JP2020005273A publication Critical patent/JP2020005273A/ja
Priority to JP2021146144A priority Critical patent/JP7346508B2/ja
Application granted granted Critical
Publication of JP6942763B2 publication Critical patent/JP6942763B2/ja
Priority to JP2023144387A priority patent/JP2023164960A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/165Controlling the light source following a pre-assigned programmed sequence; Logic control [LC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Description

関連出願の相互参照
本願は、2016年8月5日に出願された米国特許出願第15/229,868号に基づく優先権を主張するものであり、当該米国特許出願の内容は参照することによりその全体が本明細書に組み込まれる。
本願は、コンシューマ製品に関するものであり、特に、メディア再生に向けられた方法、システム、製品、機能、サービス、および他の要素に関するものや、それらのいくつかの態様に関する。
2003年に、ソノス・インコーポレイテッドが最初の特許出願のうちの1つである「複数のネットワークデバイス間のオーディオ再生を同期する方法」と題する特許出願をし、2005年にメディア再生システムの販売を開始するまで、アウトラウド設定におけるデジタルオーディオへのアクセスおよび試聴のオプションは制限されていた。ソノス無線HiFiシステムによって、人々は1つ又は複数のネットワーク再生デバイスを介して多くのソースから音楽を体験できるようになっている。スマートフォン、タブレット、又はコンピュータにインストールされたソフトウェアコントロールアプリケーションを通じて、ネットワーク再生デバイスを備えたいずれの部屋においても、人々は自分が望む音楽を再生することができる。また、例えばコントローラを用いて、再生デバイスを備えた各部屋に異なる歌をストリーミングすることもできるし、同期再生のために複数の部屋をグループ化することもできるし、全ての部屋において同期して同じ歌を聞くこともできる。
これまでのデジタルメディアに対する関心の高まりを考えると、試聴体験を更に向上させることができるコンシューマアクセス可能な技術を更に開放出することにニーズがある。
本明細書で開示されている技術の特徴、態様、および利点は、以下の記載、添付の特許請求の範囲、および添付の図面を参照するとより理解しやすい。
ある実施形態で実施可能な例示的なメデイア再生システムの構成を示す図 例示的な再生デバイスの機能ブロック図 例示的な制御デバイスの機能ブロック図 例示的なコントローラインタフェースを示す図 例示的な複数のネットワークデバイスを示す図 例示的なネットワークマイクロフォンデバイスの機能ブロック図 例示的な実施形態における音声サービスに音声入力を処理させる技術を示す図 例示的な実施形態における音声サービスに音声入力を処理させる別の技術を示す図 例示的な実施形態における音声サービスを登録する技術を示す図
図面は、いくつかの例示的な実施形態を説明することを目的としているが、本発明が、図面に示した配置および手段に限定されるものではないことは理解される。
I.概要
ネットワークマイクロフォンデバイス(NMD、Networked microphone devices)を使用することで、音声コントロールを使用しながら家庭内をコントロールすることができる。NMDは、マイクロフォンを介して音声入力を受信することができる、例えばソノス(登録商標)の再生デバイス、サーバ、又はシステムであってもよい。またNMDは、マイクロフォンを介して音声入力を受信することができる、ソノス(登録商標)の再生デバイス、サーバ、又はシステム以外のデバイスであってもよい(例えば、アマゾン(登録商標)社のECHO(登録商標)、アップル(登録商標)社のIPHONES(登録商標))。「デフォルト再生デバイスの指定」と題する米国特許出願第15/098,867号が本明細書に参照として援用されており、それは音声起動型家庭用アーキテクチャの例を提供している。音声コントロールは、再生デバイス、無線照明デバイス、サーモスタット、ドアロック、ホームオートメーション、および他の例を含む、「スマート」ホーム機能を有する様々なデバイスにとって有益であり得る。
ある実施形態では、NMDによって検出される音声入力は、処理を目的として音声サービスへと送信されている。再生デバイスなどのNMDは、この音声サービスに対するマイクロフォンインタフェース又はスピーカインタフェースとして機能してもよい。音声入力はNMDのマイクロフォンによって検出され、次いで処理を目的として特定の音声サービスへと送信される。その後音声サービスは、コマンド又は音声入力の他の結果を返すことができる。
特定の音声サービスが、場合によっては設定手順の間に、メディア再生システムに対して選択されてもよい。ユーザは、自身のスマートフォンやタブレットコンピュータ(又はその他のパーソナル電子装置)で使用中の音声サービスと同じサービスを選択し得、おそらくこれは、ユーザがその音声サービスに慣れ親しんでいたり、あるいは自身のスマートフォンで使用中の音声コントロールと同じ制御を再生デバイスでも使用して、同様の体験を得たいと望んでいる可能性があるからである。特定の音声サービスがユーザのスマートフォン上に設定されている場合、このスマートフォンは、その音声サービス用の設定情報(例えば、ユーザ認証情報)をNMDに送信して、その音声サービスの自動設定がNMDで容易に行われるようにすることができる。
場合によっては、複数の音声サービスをNMD、又はNMDのシステム(例えば、複数の再生デバイスを備えるメディア再生システム)に対して設定してもよい。設定手順の間に、1つ又は複数のサービスが設定される場合がある。追加の音声サービスを、後で本システムに設定してもよい。したがって、本明細書に記載されるNMDは複数の音声サービスとのインタフェースとして機能してもよく、おそらくそれぞれの音声サービスと対話するために、それぞれの音声サービスからのNMDを備える必要性を軽減できる可能性がある。更にまた、NMDは、家庭内に存在するサービス固有のNMDと協調して動作して、所定の音声コマンドを処理することができる。
NMDに対して2つ以上の音声サービスが設定されている場合、特定の音声サービスに対応する起動ワークを発することによって、この特定の音声サービスを起動することができる。例えば、アマゾン(登録商標)社のサービスに質問する場合、ユーザは「Alexa」というウェイクワードを発し、これに続けて音声入力を行う可能性がある。その他の例としては、グーグル(登録商標)社のサービスに質問する場合の「オッケー、Google」や、アップル(登録商標)社のサービスに質問する場合の「ヘイ、Siri」が挙げられる。
あるいは、所定の音声入力に対していずれのウェイクワードも使用されていない場合、NMDはその音声入力を処理するための音声サービスを識別することができる。場合によっては、NMDがデフォルトの音声サービスを識別することがある。あるいは、NMDは、コンテキストに基づいて特定の音声サービスを識別してもよい。例えば、NMDは、最近質問が行われた音声サービスを、ユーザが再び同じ音声サービスを使用することを望むという仮定に基づいて使用してもよい。他の例も可能である。
上述したように、一般的ウェイクワードを使用してNMDへの音声入力を示すことができる場合がある。場合によっては、これは、任意の特定の音声サービスと関連付けられたウェイクワードではなく(例えば、NMDがソノス(登録商標)の再生デバイスである場合、「ヘイ、Sonos」)、製造元固有のウェイクワードであってもよい。そのようなウェイクワードを受信すると、NMDは当該要求を処理するために特定の音声サービスを識別することができる。例えば、ウェイクワードに続く音声入力が特定の種類のコマンド(例えば、音楽の再生)に関連している場合、その音声入力は、その種類のコマンドと関連付けられた特定の音声サービス(例えば、音声コマンド機能を有する音楽ストリーミングサービス)に送信されてもよい。
NMDは、場合によっては音声入力を複数の音声サービスに送信してもよく、その結果として、質問が行われた音声サービスからそれぞれの結果を得てもよい。NMDはこれらの結果を評価し、「最良の」結果(例えば、目的の行動に最大限一致している結果)をもって応答することができる。例えば、音声入力が「ヘイ、Sonos、テイラー・スウィフトの曲を再生して」であった場合、第1音声サービスは「テイラー・スウィフト」に関する検索結果で応答する一方、第2音声サービスは、テイラー・スウィフトというアーティストによるオーディオトラックの識別子で応答する可能性がある。その場合、NMDは、第2音声サービスからのテイラー・スウィフトによるオーディオトラックの識別子を使用して、音声入力に従ってテイラー・スウィフトの曲を再生することができる。
上述したように、例示的な技術は音声サービスに関連している。例示的な実施形態は、NMDがマイクロフォンを介して、音声入力を示す音声データを受信するステップを含んでもよい。NMDは、メディア再生システムに登録されている複数の音声サービスの中から、当該音声入力を処理するための音声サービスを識別し、識別したその音声サービスに当該音声入力を処理させてもよい。
別の例示的な実施形態は、NMDが、メディア再生システムに1つ又は複数の音声サービスを登録するように命じるコマンドを示す入力データを受信するステップを含んでもよい。NMDは、NMDに登録されている音声サービスを検出することができる。NMDは、NMDに登録されている音声サービスがメディア再生システムに登録されるようにしてもよい。
第3の例示的な実施形態は、NMDがマイクロフォンを介して、音声入力を示す音声データを受信するステップを含んでもよい。NMDは、受信した音声データの一部が、特定の音声サービスに対応していない一般的ウェイクワードを示していると決定してもよい。NMDは、複数の音声サービスに音声入力の処理を実行させてもよい。NMDは、複数の音声サービスのうちの所定の1つから得た結果を出力してもよい。
これらの例示的な実施形態のそれぞれは、方法、本実施形態を実行するように構成されたデバイス、本実施形態を実行するように構成されたデバイスのシステム、又は1つ又は複数のプロセッサによって実行されて本実施形態を実行する命令を含む、非一時的なコンピュータ読取り可能媒体その他として具現化されてもよい。本開示が、本明細書に記載の例示的な特徴を組み合わせたものを含む、他の多数の実施形態を含むことは、当業者には理解されよう。また、ある技術を例示するために、所定のデバイスによって実行されるものとして記載されている任意の例示的な動作が、本明細書に記載のデバイスを含む、任意の適切なデバイスによって実行されてもよい。更にまた、任意のデバイスによって、別のデバイスに本明細書に記載の動作のうちのいずれかを実行させてもよい。
本明細書に記載されるいくつかの例は、「ユーザ」および/又は他のエンティティなどの所定のアクターによって実行される機能を参照するが、これは説明の目的に過ぎない。特許請求の範囲自体の言葉によって明示的に要求されない限り、そのような例示的なアクターによるアクションが要求されるものと解釈されるべきではない。
II.動作環境の例
図1は、本明細書で開示されている1つ又は複数の実施形態で実施可能又は実装可能なメディア再生システム100の例示的な構成を示す。図示されるように、メディア再生システム100は、複数の部屋および空間、例えば、主寝室、オフィス、ダイニングルーム、およびリビングルームを有する例示的なホーム環境と関連付けられている。図1の例に示されるように、メディア再生システム100は、再生デバイス102、104、106、108、110、112、114、116、118、120、122、124、制御デバイス126および128、有線又は無線のネットワークルータ130を含む。
更に、例示的なメディア再生システム100の異なる構成要素、および異なる構成要素がどのように作用してユーザにメディア体験を提供するかに関しての説明は、以下のセクションで述べられている。本明細書における説明は、概してメディア再生システム100を参照しているが、本明細書で述べられている技術は、図1に示されるホーム環境の用途に限定されるものではない。例えば、本明細書で述べられている技術は、マルチゾーンオーディオが望まれる環境、例えば、レストラン、モール、又は空港のような商業的環境、スポーツ用多目的車(SUV)、バス又は車のような車両、船、若しくはボード、飛行機などの環境において有益である。
a.例示的なゾーンプレーヤー
図2は、図1のメディア再生システム100の再生デバイス102〜124の1つ又は複数を構成する例示的な再生デバイス200の機能ブロック図を示す。再生デバイス200は、プロセッサ202、ソフトウェアコンポーネント204、メモリ206、オーディオ処理コンポーネント208、オーディオアンプ210、スピーカ212、およびネットワークインタフェース214を含んでもよい。ネットワークインタフェース214は、無線インタフェース216、有線インタフェース218およびマイクロフォン220を含む。ある場合では、再生デバイス200は、スピーカ212を含まないが、再生デバイス200を外部スピーカに接続するためのスピーカインタフェースを含んでいてもよい。別の場合では、再生デバイス200は、スピーカ212もオーディオアンプ210も含まないが、再生デバイス200を外部オーディオアンプ又はオーディオビジュアルレシーバーに接続するためのオーディオインタフェースを含んでもよい。
ある例では、プロセッサ202は、メモリ206に記憶された命令に基づいて、入力データを処理するように構成されたクロック駆動コンピュータコンポーネントであってもよい。メモリ206は、プロセッサ202によって実行可能な命令を記憶するように構成された非一時的なコンピュータ読取り可能記録媒体であってもよい。例えば、メモリ206は、ある機能を実行するためにプロセッサ202によって実行可能なソフトウェアコンポーネント204の1つ又は複数をロードすることができるデータストレージであってもよい。ある例では、機能は、再生デバイス200がオーディオソース又は別の再生デバイスからオーディオデータを読み出すステップを含んでもよい。別の例では、機能は、再生デバイス200がネットワーク上の別のデバイス又は再生デバイスにオーディオデータを送信するステップを含んでもよい。更に別の例では、機能は、マルチチャネルオーディオ環境を作るために、再生デバイス200と1つ又は複数の再生デバイスとをペアリングするステップを含んでもよい。
ある機能は、再生デバイス200が、1つ又は複数の他の再生デバイスと、オーディオコンテンツの再生を同期するステップを含む。再生を同期している間、再生デバイス200によるオーディオコンテンツの再生と1つ又は複数の他の再生デバイスによる再生との間の遅延を、リスナーが気づかないことが好ましい。「複数の独立クロックデジタルデータ処理デバイス間の動作を同期するシステムおよび方法」と題する米国特許第8,234,395号が本明細書に参照として援用されており、それは再生デバイス間のオーディオ再生を同期することが述べられたより詳細な例を提供している。
更に、メモリ206は、データを記憶するように構成されていてもよい。データは、例えば、1つ又は複数のゾーンおよび/又はゾーングループに一部として含まれる再生デバイス200などの再生デバイス200、再生デバイス200によりアクセス可能なオーディオソース、又は再生デバイス200(又は他の再生デバイス)と関連付け可能な再生キュー、に関連付けられている。データは、定期的に更新され、再生デバイス200の状態を示す1つ又は複数の状態変数として記憶されてもよい。また、メモリ206は、メディアシステムの他のデバイスの状態と関連付けられたデータを含んでもよく、デバイス間で随時共有することによって、1つ又は複数のデバイスが、システムと関連するほぼ直近のデータを有することができる。他の実施形態も可能である。
オーディオ処理コンポーネント208は、1つ又は複数のデジタル−アナログ変換器(DAC)、オーディオ処理コンポーネント、オーディオ強化コンポーネント、又はデジタルシグナルプロセッサ(DSP)等を含んでいてもよい。ある実施形態では、1つ又は複数のオーディオ処理コンポーネント208は、プロセッサ202のサブコンポーネントであってもよい。ある実施形態では、オーディオコンテンツが、オーディオ処理コンポーネント208によって処理および/又は意図的に変更されることによって、オーディオ信号を生成してもよい。生成されたオーディオ信号は、オーディオアンプ210に送信され、増幅され、スピーカ212を通じて再生される。特に、オーディオアンプ210は、1つ又は複数のスピーカ212を駆動できるレベルまでオーディオ信号を増幅するように構成されたデバイスを含んでもよい。スピーカ212は、独立した変換器(例えば、「ドライバ」)又は1つ又は複数のドライバを内包する筐体を含む完全なスピーカシステムを備えてもよい。スピーカ212に備えられたあるドライバは、例えば、サブウーファー(例えば、低周波用)、ミドルレンジドライバ(例えば、中間周波用)、および/又はツイーター(高周波用)を含んでもよい。ある場合では、1つ又は複数のスピーカ212のそれぞれの変換器は、オーディオアンプ210の対応する個々のオーディオアンプによって駆動されてもよい。再生デバイス200で再生するアナログ信号を生成することに加えて、オーディオ処理コンポーネント208は、オーディオコンテンツを処理し、そのオーディオコンテンツを1つ又は複数の他の再生デバイスに再生させるために送信する。
再生デバイス200によって処理および/又は再生されるオーディオコンテンツは、外部ソース、例えば、オーディオライン−イン入力接続(例えば、オートディテクティング3.5mmオーディオラインイン接続)又はネットワークインタフェース214を介して、受信されてもよい。
ネットワークインタフェース214は、データネットワーク上で再生デバイス200と1つ又は複数の他のデバイスとの間のデータフローを可能にするように構成されてもよい。このように、再生デバイス200は、再生デバイスと通信する1つ又は複数の他の再生デバイス、ローカルエリアネットワーク内のネットワークデバイス、又は例えば、インターネット等のワイドエリアネットワーク上のオーディオコンテンツソースから、データネットワークを介してオーディオコンテンツを受信するように構成されていてもよい。ある例では、再生デバイス200によって送信および受信されたオーディオコンテンツおよび他の信号は、インターネットプロトコル(IP)に基づくソースアドレスおよびIPに基づく宛先アドレスを含むデジタルパケットの形で送信されてもよい。そのような場合、ネットワークインタフェース214は、デジタルパケットデータを解析することによって、再生デバイス200宛てのデータを、再生デバイス200によって適切に受信して処理することができる。
図示されるように、ネットワークインタフェース214は、無線インタフェース216と有線インタフェース218とを含んでもよい。無線インタフェース216は、再生デバイス200用のネットワークインタフェース機能を提供し、通信プロトコル(例えば、無線規格IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4Gモバイル通信基準などを含む無線基準(規格)のいずれか)に基づいて、他のデバイス(例えば、再生デバイス200に関連付けられたデータネットワーク内の他の再生デバイス、スピーカ、レシーバー、ネットワークデバイス、制御デバイス)と無線通信してもよい。有線インタフェース218は、再生デバイス200用のネットワークインタフェース機能を提供し、通信プロトコル(例えば、IEEE802.3)に基づいて他のデバイスとの有線接続を介して通信してもよい。図2に示されるネットワークインタフェース214は、無線インタフェース216と有線インタフェース218との両方を含んでいるが、ネットワークインタフェース214は、ある実施形態において、無線インタフェースのみか、又は有線インタフェースのみを含んでいてもよい。
マイクロフォン220は、再生デバイス200の環境内の音を検出するように構成してもよい。マイクロフォンは例えば、再生デバイスの筐体の外壁に取り付けてもよい。マイクロフォンは、コンデンサーマイクロフォン、エレクトレットコンデンサーマイクロフォン、またはダイナミックマイクロフォンなど、現在知られているか又は後で開発される任意の種類のマイクロフォンであってもよい。マイクロフォンは、スピーカ220の一部の周波数範囲に対して高感度であってもよい。スピーカ220のうちの1つ又は複数が、マイクロフォン220とは逆に動作してもよい。いくつかの態様では、再生デバイス200は、マイクロフォン220を含まなくてもよい。
ある例では、再生デバイス200と他の再生デバイスとは、ペアにされて、オーディオコンテンツの2つの別々のオーディオコンポーネントを再生してもよい。例えば、再生デバイス200は、左チャネルオーディオコンポーネントを再生するように構成される一方、他の再生デバイスは、右チャネルオーディオコンポーネントを再生するように構成されてもよい。これにより、オーディオコンテンツのステレオ効果を生成するか、又は強化することができる。ペアにされた再生デバイス(「結合再生デバイス」とも言う)は、更に、他の再生デバイスと同期してオーディオコンテンツを再生してもよい。
別の例では、再生デバイス200は、1つ又は複数の他の再生デバイスと音響的に統合され、単一の統合された再生デバイス(統合再生デバイス)を形成してもよい。統合再生デバイスは、統合されていない再生デバイス又はペアにされた再生デバイスと比べて、サウンドの処理や再現を異なるように構成することができる。なぜならば、統合再生デバイスは、オーディオコンテンツを再生するスピーカ追加することができるからである。例えば、再生デバイス200が、低周波レンジのオーディオコンテンツを再生するように設計されている場合(例えば、サブウーファー)、再生デバイス200は、全周波数レンジのオーディオコンテンツを再生するように設計された再生デバイスと統合されてもよい。この場合、全周波数レンジの再生デバイスは、低周波の再生デバイス200と統合されたとき、オーディオコンテンツの中高周波コンポーネントのみを再生するように構成されてもよい。一方で低周波レンジの再生デバイス200は、オーディオコンテンツの低周波コンポーネントを再生する。更に、統合再生デバイスは、単一の再生デバイス、又は更に他の統合再生デバイスとペアにされてもよい。
例として、現在、ソノス・インコーポレイテッドは、「PLAY:1」、「PLAY:3」、「PLAY:5」、「PLAYBAR」、「CONNECT:AMP」、「CONNECT」、および「SUB」を含む再生デバイスを販売提供している。他の過去、現在、および/又は将来のいずれの再生デバイスにおいても、追加的に又は代替的に本明細書で開示された実施例の再生デバイスに実装して使用することができる。更に、再生デバイスは、図2に示された特定の例又は提供されるソノス製品に限定されないことは理解される。例えば、再生デバイスは、有線又は無線のヘッドホンを含んでもよい。別の例では、再生デバイスは、パーソナルモバイルメディア再生デバイス用のドッキングステーションを含むか、又は、それらと対話してもよい。更に別の例では、再生デバイスは、別のデバイス又はコンポーネント、例えば、テレビ、照明器具、又は屋内又は屋外で使用するためのいくつかの他のデバイスと一体化されてもよい。
b.例示的な再生ゾーン構成
図1のメディア再生システムに戻って、環境は、1つ又は複数の再生ゾーンを有しており、それぞれの再生ゾーンは1つ又は複数の再生デバイスを含んでいる。メディア再生システム100は、1つ又は複数の再生ゾーンで形成されており、後で1つ又は複数のゾーンが追加又は削除して、図1に示す例示的な構成としてもよい。それぞれのゾーンは、異なる部屋又は空間、例えば、オフィス、浴室、主寝室、寝室、キッチン、ダイニングルーム、リビングルーム、および/又はバルコニーに基づく名前が与えられてもよい。ある場合では、単一の再生ゾーンは複数の部屋又は空間を含んでいてもよい。別の場合では、単一の部屋又は空間は、複数の再生ゾーンを含んでいてもよい。
図1に示されるように、バルコニー、ダイニングルーム、キッチン、浴室、オフィス、および寝室のゾーンのそれぞれは、1つの再生デバイスを有する一方、リビングルームおよび主寝室のゾーンのそれぞれは、複数の再生デバイスを有する。リビングルームゾーンは、再生デバイス104、106、108、および110が、別々の再生デバイスとしてか、1つ又は複数の結合再生デバイスとしてか、1つ又は複数の統合再生デバイスとしてか、又はこれらのいずれかの組み合わせで、オーディオコンテンツを同期して再生するように構成されてもよい。同様に、主寝室の場合では、再生デバイス122および124が、別々の再生デバイスとしてか、結合再生デバイスとしてか、又は統合再生デバイスとして、オーディオコンテンツを同期して再生するように構成されてもよい。
ある例では、図1の環境における1つ又は複数の再生ゾーンは、それぞれ異なるオーディオコンテンツを再生している。例えば、ユーザは、バルコニーゾーンでグリルしながら、再生デバイス102によって再生されるヒップホップ音楽を聞くことができる。一方、別のユーザは、キッチンゾーンで食事を準備しながら、再生デバイス114によって再生されるクラシック音楽を聞くことができる。別の例では、再生ゾーンは、同じオーディオコンテンツを別の再生ゾーンと同期して再生してもよい。例えば、ユーザがオフィスゾーンにいる場合、オフィスゾーンの再生デバイス118が、バルコニーの再生デバイス102で再生されている音楽と同じ音楽を再生してもよい。そのような場合、再生デバイス102および118は、ロック音楽を同期して再生しているため、ユーザは、異なる再生ゾーン間を移動してもアウト−ラウドで再生されるオーディオコンテンツをシームレス(又は少なくともほぼシームレス)に楽しむことができる。再生ゾーン間の同期は、前述の米国特許第8,234,395号で述べられているような再生デバイス間の同期と同様の方法で行ってもよい。
上述したように、メディア再生システム100のゾーン構成は、動的に変更してもよく、ある実施形態では、メディア再生システム100は、複数の構成をサポートする。例えば、ユーザが1つ又は複数の再生デバイスを、物理的にゾーンに移動させるか、又はゾーンから移動させる場合、メディア再生システム100は変更に対応するように再構成されてもよい。例えば、ユーザが再生デバイス102をバルコニーゾーンからオフィスゾーンに物理的に移動させる場合、オフィスゾーンは、再生デバイス118と再生デバイス102との両方を含んでもよい。必要に応じて、制御デバイス、例えば制御デバイス126と128とを介して、再生デバイス102が、ペアにされるか、又はオフィスゾーンにグループ化されるか、および/又はリネームされてもよい。一方、1つ又は複数の再生デバイスが、再生ゾーンを未だ設定していないホーム環境において、ある領域に移動させられた場合、新しい再生ゾーンがその領域に形成されてもよい。
更に、メディア再生システム100の異なる再生ゾーンは、動的にゾーングループに組み合わされてもよいし、又は別々の再生ゾーンに分割されてもよい。例えば、ダイニングルームゾーンとキッチンゾーン114とがディナーパーティ用のゾーングループに組み合わされることによって、再生デバイス112と114とがオーディオコンテンツを同期して再生することができる。一方、あるユーザがテレビを見たい一方、他のユーザがリビングルーム空間の音楽を聞きたい場合、リビングルームゾーンが、再生デバイス104を含むテレビゾーンと、再生デバイス106、108および110を含むリスニングゾーンと、に分けられてもよい。
c.例示的な制御デバイス
図3は、メディア再生システム100の制御デバイス126と128とうちの一方又は両方を構成する例示的な制御デバイス300の機能ブロック図を示す。図示されるように、制御デバイス300は、プロセッサ302、メモリ304、ネットワークインタフェース306、ユーザインタフェース308、マイクロフォン310、およびソフトウェアコンポーネント312を含んでもよい。ある例では、制御デバイス300は、メディア再生システム100専用の制御デバイスであってもよい。別の例では、制御デバイス300は、メディア再生システムコントローラアプリケーションソフトウェアをインストールされたネットワークデバイス、例えば、iPhone(登録商標)、iPad(登録商標)、又は任意の他のスマートフォン、タブレットあるいはネットワークデバイス(例えば、PC又はMac(登録商標)などのネットワークコンピュータ)であってもよい。
プロセッサ302は、メディア再生システム100のユーザアクセス、コントロール、および構成を可能にすることに関する機能を実行するように構成されてもよい。メモリ304は、プロセッサ302によって実行されて機能を発揮する1つ又は複数のソフトウェアコンポーネントを搭載可能なデータストレージであってもよい。また、メモリ304は、メディア再生システムコントローラアプリケーションソフトウェアと、メディア再生システム100とユーザとに関連付けられた他のデータを記憶するように構成されていてもよい。
ある例では、ネットワークインタフェース306は、工業規格(例えば、赤外線、無線、IEEE802.3などの有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15などの無線規格、4G通信規格など)に基づいてもよい。ネットワークインタフェース306においては、制御デバイス300がメディア再生システム100内の他のデバイスと通信するための手段を提供してもよい。ある例では、データおよび情報(例えば、状態変数)は、ネットワークインタフェース306を介して制御デバイス300と他のデバイスとの間で通信されてもよい。例えば、メディア再生システム100における再生ゾーンおよびゾーングループの構成は、制御デバイス300によって、再生デバイス又は別のネットワークデバイスから受信されてもよいし、あるいは制御デバイス300によって、ネットワークインタフェース306を介して別の再生デバイス又はネットワークデバイスに送信されてもよい。ある場合では、他のネットワークデバイスは、別の制御デバイスであってもよい。
ボリュームコントロールおよびオーディオ再生コントロールなどの再生デバイス制御コマンドは、ネットワークインタフェース306を介して制御デバイス300から再生デバイスに通信されてもよい。上述したように、メディア再生システム100の構成の変更は、ユーザにより制御デバイス300を用いて行うことができる。構成の変更は、1つ又は複数の再生デバイスをゾーンに追加すること、1つ又は複数の再生デバイスをゾーンから取り除くこと、1つ又は複数のゾーンをゾーングループに追加すること、1つ又は複数のゾーンをゾーングループから取り除くこと、結合プレーヤー又は統合プレーヤーを形成すること、結合プレーヤー又は統合プレーヤーから1つ又は複数の再生デバイスに分けることなどを含んでもよい。このように、制御デバイス300は、コントローラと呼ばれてもよく、制御デバイス300は、メディア再生システムコントローラアプリケーションソフトウェアをインストールした専用のコントローラか、又はネットワークデバイスであってもよい。
制御デバイス300は、マイクロフォン310を含んでもよい。マイクロフォン310は、制御デバイス300の環境内の音を検出するように構成してもよい。マイクロフォン310は、コンデンサーマイク、エレクトレットコンデンサーマイク、ダイナミックマイクなど、現在知られている又は今後開発される任意の種類のマイクロフォンであってもよい。マイクロフォンは、一部の周波数範囲に対して高感度であってもよい。2つ以上のマイクロフォン310が、音源(例えば、音声、可聴音)の位置情報を取得する、および/又は、背景雑音のフィルタリングを補助するために設けられてもよい。
制御デバイス300のユーザインタフェース308は、図4に示されるコントローラインタフェース400などのようなコントローラインタフェースを提供することによって、メディア再生システム100のユーザアクセスおよび制御を可能にするように構成されていてもよい。コントローラインタフェース400は、再生制御領域410、再生ゾーン領域420、再生ステータス領域430、再生キュー領域440、およびオーディオコンテンツソース領域450を含む。図示されるユーザインタフェース400は、図3の制御デバイス300などのようなネットワークデバイス(および/又は図1の制御デバイス126および128)を設けられたユーザインタフェースの単なる一例であって、ユーザによってメディア再生システム100などのようなメディア再生システムを制御するためにアクセスされるものである。あるいは、様々なフォーマット、スタイル、および対話型シーケンスを他のユーザのインタフェースを1つ又は複数のネットワークデバイスに実装し、メディア再生システムへ類似の制御アクセスを提供してもよい。
再生制御領域410は、(例えば、タッチ又はカーソルを用いることで)選択可能なアイコンを含んでもよい。このアイコンによって、選択された再生ゾーン又はゾーングループ内の再生デバイスが、再生又は停止、早送り、巻き戻し、次にスキップ、前にスキップ、シャッフルモードのオン/オフ、リピートモードのオン/オフ、クロスフェードモードのオン/オフを行う。再生制御領域410は、別の選択可能なアイコンを含んでもよい。別の選択可能なアイコンは、イコライゼーション設定、再生ボリュームなど他の設定などを変更してもよい。
再生ゾーン領域420は、メディア再生システム100内の再生ゾーンの表示を含んでもよい。ある実施形態では、再生ゾーンのグラフィック表示が選択可能であってもよい。追加の選択可能なアイコンを移動させることによって、メディア再生システム内の再生ゾーンを管理又は構成することができる。例えば、結合ゾーンの作成、ゾーングループの作成、ゾーングループの分割、およびゾーングループのリネームなど他の管理又は構成を行うことができる。
例えば、図示されるように、「グループ」アイコンは、再生ゾーンのグラフィック表示のそれぞれに設けられてもよい。あるゾーンのグラフィック表示内の「グループ」アイコンは、メディア再生システム内の1つ又は複数のゾーンを選択して、あるゾーンとグループ化するオプションを出せるように選択可能であってもよい。一度グループ化すると、あるゾーンとグループ化されたゾーン内の再生デバイスは、あるゾーン内の再生デバイスと同期してオーディオコンテンツを再生するように構成される。同様に、「グループ」アイコンは、ゾーングループのグラフィック表示内に設けられてもよい。この場合、「グループ」アイコンは、ゾーングループ内の1つ又は複数のゾーンをゾーングループから取り除くために、ゾーングループ内の1つ又は複数のゾーンを選択から外すというオプションを出すように選択可能であってもよい。ユーザインタフェース400等のユーザインタフェースを介してゾーンをグループ化およびグループ解除するための他の対話をすることも可能であるし、実施することも可能である。再生ゾーン領域420内の再生ゾーンの表示は、再生ゾーン又はゾーングループ構成が変更されると、動的に更新されてもよい。
再生ステータス領域430は、現在再生されているオーディオコンテンツ、前に再生されたオーディオコンテンツ、又は選択された再生ゾーン又はゾーングループ内で次に再生するように予定されているオーディオコンテンツ、のグラフィック表示を含んでもよい。選択可能な再生ゾーン又は再生グループは、ユーザインタフェース上で、例えば、再生ゾーン領域420および/又は再生ステータス領域430内で視覚的に区別されてもよい。グラフィック表示は、トラックタイトル、アーティスト名、アルバム名、アルバム年、トラックの長さ、およびメディア再生システムを、ユーザインタフェース400を介して制御するときに、ユーザにとって有益な他の関連情報を含んでいてもよい。
再生キュー領域440は、選択された再生ゾーン又はゾーングループと関連付けられた再生キュー内のオーディオコンテンツのグラフィック表示を含んでもよい。ある実施形態では、それぞれの再生ゾーン又はゾーングループは、再生ゾーン又は再生グループによって再生される0以上のオーディオアイテムに対応する情報を含む再生キューと関連付けられていてもよい。例えば、再生キュー内のそれぞれのオーディオアイテムは、ユー・アール・アイ(URI)、ユー・アール・エル(URL)、又は再生ゾーン又はゾーングループ内の再生デバイスによって使用可能な他の識別子を含んでいてもよい。これらによって、ローカルオーディオコンテンツソース又はネットワークオーディオコンテンツソース、からオーディオアイテムを見つけ、および/又は取り出し、再生デバイスによって再生することができる。
ある例では、プレイリストが再生キューに追加されてもよい。この場合、プレイリスト内のそれぞれのオーディオアイテムに対応する情報が再生キューに追加されてもよい。別の例では、再生キュー内のオーディオアイテムは、プレイリストとして保存されてもよい。更に別の例では、再生デバイスがストリーミングオーディオコンテンツ、例えば、再生時間を有することで連続して再生されないオーディオアイテムよりも、停止しない限り連続して再生されるインターネットラジオを再生し続けているとき、再生キューは、空であってもよいし、又は「未使用」であるが埋められていてもよい。別の実施形態では、再生キューは、インターネットラジオおよび/又は他のストリーミングオーディオコンテンツアイテムを含むことができ、且つ再生ゾーン又はゾーングループがそれらのアイテムを再生しているとき「未使用」とすることができる。他の例も可能である。
再生ゾーン又はゾーングループが「グループ化される」か、又は「グループ解除」されるとき、影響を受ける再生ゾーン又はゾーングループに関連付けられた再生キューは、クリアされてもよいし、又は再び関連付けられてもよい。例えば、第1再生キューを含む第1再生ゾーンが、第2再生キューを含む第2再生ゾーンとグループ化された場合、形成されたゾーングループは、関連付けられた再生キューを有していてもよい。関連付けられた再生キューは、最初は空であるか、(例えば、第2再生ゾーンが第1再生ゾーンに追加された場合、)第1再生キューのオーディオアイテムを含むか、(例えば、第1再生ゾーンが第2再生ゾーンに追加された場合、)第2再生キューのオーディオアイテムを含むか、又は第1再生キューと第2再生キューとの両方のオーディオアイテムを組み合わせられる。その後、形成されたゾーングループがグループ解除された場合、グループ解除された第1再生ゾーンは、前の第1再生キューと再び関連付けられてもよいし、空の新しい再生キューと関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループと関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューと関連付けられてもよい。同様に、グループ解除された第2再生ゾーンは、前の第2再生キューと再び関連付けられてもよいし、空の新しい再生キューと関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループと関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューと関連付けられてもよい。その他の例も可能である。
図4のユーザインタフェース400に戻って、再生キュー領域440内のオーディオコンテンツのグラフィック表示は、トラックタイトル、アーティスト名、トラックの長さ、および再生キュー内のオーディオコンテンツと関連付けられた他の関連情報を含んでいてもよい。ある例では、オーディオコンテンツのグラフィック表示は、追加の選択可能なアイコンを選択して移動させることができる。これにより、再生キューおよび/又は再生キューに表示されたオーディオコンテンツを管理および/又は操作することができる。例えば、表示されたオーディオコンテンツは、再生キューから取り除いてもよいし、再生キュー内の異なる位置に移動させてもよいし、すぐに再生させるか若しくは現在再生しているオーディオコンテンツの後に再生するように選択されてもよいし、あるいは他の動作を実行してもよい。再生ゾーン又はゾーングループに関連付けられた再生キューは、再生ゾーン又はゾーングループ内の1つ又は複数の再生デバイスのメモリ、再生ゾーン又はゾーングループに入っていない再生デバイスのメモリ、および/又は他の指定のデバイスのメモリに記憶されていてもよい。
オーディオコンテンツソース領域450は、選択可能なオーディオコンテンツソースのグラフィック表示を含んでいてもよい。このオーディオコンテンツソースにおいては、オーディオコンテンツが選択された再生ゾーン又はゾーングループによって取り出され、再生されてもよい。オーディオコンテンツソースに関する説明は、以降のセクションを参照することができる。
d.例示的なオーディオコンテンツソース
前回図示したように、ゾーン又はゾーングループ内の1つ又は複数の再生デバイスは、再生するオーディオコンテンツを、(例えば、オーディオコンテンツの対応するURI又はURLに基づいて、)複数の入手可能なオーディオコンテンツソースから取り出すように構成されていてもよい。ある例では、オーディオコンテンツは、再生デバイスによって、対応するオーディオコンテンツソース(例えば、ライン−イン接続)から直接取り出されてもよい。別の例では、オーディオコンテンツは、1つ又は複数の他の再生デバイス若しくはネットワークデバイスを介してネットワーク上の再生デバイスに提供されてもよい。
例示的なオーディオコンテンツソースは、メディア再生システム内の1つ又は複数の再生デバイスのメモリを含んでもよい。メディア再生システムとしては、例えば、図1のメディア再生システム100、1つ又は複数のネットワークデバイス上のローカルミュージックライブラリ(例えば、制御デバイス、ネットワーク対応のパーソナルコンピュータ、又はネットワーク接続ストレージ(NAS)など)、インターネット(例えば、クラウド)を介してオーディオコンテンツを提供するストリーミングオーディオサービス、あるいは再生デバイス又はネットワークデバイスのライン−イン入力接続を介してメディア再生システムに接続されるオーディオソース、他の可能なシステムであってもよい。
ある実施形態では、オーディオコンテンツソースは、図1のメディア再生システム100などのようなメディア再生システムに定期的に追加されてもよいし、定期的に取り除かれてもよい。ある例では、1つ又は複数のオーディオコンテンツソースが追加される、取り除かれる、又は更新される度に、オーディオアイテムのインデックス付けが行われてもよい。オーディオアイテムのインデックス付けは、ネットワーク上で共有される全てのフォルダ/ディレクトリ内の識別可能なオーディオアイテムをスキャンすることを含んでもよい。ここで、ネットワークは、メディア再生システム内の再生デバイスによってアクセス可能である。また、オーディオアイテムのインデックス付けは、メタデータ(例えば、タイトル、アーティスト、アルバム、トラックの長さなど)と他の関連情報とを含むオーディオコンテンツデータベースを作成すること、又は更新すること、を含んでもよい。他の関連情報とは、例えば、それぞれの識別可能なオーディオアイテムを見つけるためのURI又はURLを含んでもよい。オーディオコンテンツソースを管理し、且つ維持するための他の例も可能である。
再生デバイス、制御デバイス、再生ゾーン構成、およびメディアコンテンツソースに関する上記の説明は、以下に記載される機能および方法を実装できる動作環境のうちの、一部の例を示しているに過ぎない。メディア再生システム、再生デバイス、およびネットワークデバイスに関して、本明細書に明示的に記載されていない他の動作環境および構成も同様に適用可能であり、本機能および本方法を実装するのに適している可能性がある。
e.複数の例示的なネットワークデバイス
図5は、音声コントロールに基づいてオーディオ再生体験を提供するように構成される、複数の例示的なデバイス500を示した図である。当業者であれば、図5に示されるデバイスは例示する目的のみのものであり、異なるおよび/又は追加のデバイスを含む変形例が実行可能であり得ることを理解するであろう。図示されるように、複数のデバイス500は、コンピューティングデバイス504、506、および508と、ネットワークマイクロフォンデバイス(NMD)512、514、および516と、再生デバイス(PBD)532、534、536、および538と、制御デバイス(CR)522とを含む。
複数のデバイス500のそれぞれは、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、およびパーソナルエリアネットワーク(PAN)などの1つ又は複数の種類のネットワークを介して、NFC、Bluetooth(登録商標)、Ethernet、およびIEEE802.11その他の1つ又は複数のネットワークプロトコルに従って、複数のデバイスにおける1つ又は複数の他のデバイスとの通信を確立することができる、ネットワーク対応デバイスであってもよい。
図示されるように、コンピューティングデバイス504、506、および508はクラウドネットワーク502の一部であってもよい。クラウドネットワーク502は追加のコンピューティングデバイスを含んでもよい。ある例では、コンピューティングデバイス504、506、および508は異なるサーバであってもよく、別の例では、コンピューティングデバイス504、506、および508のうちの2つ以上は単一サーバのモジュールであってもよい。同様に、コンピューティングデバイス504、506、および508のそれぞれは、1つ又は複数のモジュール若しくはサーバを含んでもよい。本明細書での例示を容易に行うために、コンピューティングデバイス504、506、および508のそれぞれは、クラウドネットワーク502内で特定の機能を実行するように構成されてもよい。例えば、コンピューティングデバイス508は、音楽ストリーミングサービス用のオーディオコンテンツのソースであってもよい。
図示されるように、コンピューティングデバイス504は、通信経路542を介してNMD512、514、および516とインタフェースするように構成されてもよい。NMD512、514、および516は、1つ又は複数の「スマートホーム」システムのコンポーネントであってもよい。ある場合では、NMD512、514、および516は、図1に示されるデバイスの配置と同様に、家庭全体に物理的に配置されてもよい。別の場合では、NMD512、514、および516の2つ以上は、互いに比較的近接するように物理的に配置されてもよい。通信経路542は、インターネットを含むWAN、LAN、および/又はPANその他などの、1つ又は複数の種類のネットワークを備えてもよい。
ある例では、NMD512、514、および516のうちの1つ又は複数は、主に音声検出を行うように構成されたデバイスであってもよい。別の例では、NMD512、514、および516のうちの1つ又は複数は、様々な主要ユーティリティを有するデバイスのコンポーネントであってもよい。例えば、図2および図3に関連して上述したように、NMD512、514、および516のうちの1つ又は複数は、再生デバイス200のマイクロフォン(複数可)220又はネットワークデバイス300のマイクロフォン(複数可)310であってもよい。また場合によっては、NMD512、514、および516のうちの1つ又は複数は、再生デバイス200又はネットワークデバイス300であってもよい。ある例では、NMD512、514、および/又は516のうちの1つ又は複数は、マイクロフォンアレイに配置される複数のマイクロフォンを含んでいてもよい。
図示されるように、コンピューティングデバイス506は、通信経路544を介してCR522並びにPBD532、534、536、および538とインタフェースするように構成されてもよい。ある例では、CR522は、図2のネットワークデバイス200などのネットワークデバイスであってもよい。したがって、CR522は、図4のコントローラインタフェース400を提供するように構成されてもよい。同様に、PBD532、534、536、および538は、図3の再生デバイス300などの再生デバイスであってもよい。このため、PBD532、534、536、および538は、図1に示されるように家庭全体に物理的に配置されてもよい。例示する目的上、PBD536および538は結合ゾーン530の一部であってもよく、その一方で、PBD532および534は自身が属するそれぞれのゾーンの一部であってもよい。上述したように、PBD532、534、536、および538は動的に結合、グループ化、結合解除、かつグループ解除されてもよい。通信経路544は、インターネットを含むWAN、LAN、および/又はPANその他などの1つ又は複数の種類のネットワークを備えてもよい。
ある例では、NMD512、514、および516と同様に、CR522並びにPBD532、534、536、および538も、1つ又は複数の「スマートホーム」システムのコンポーネントであってもよい。ある場合では、PBD532、534、536、および538は、NMD512、514、および516と同じ家庭全体に配置されてもよい。更に、上述したように、PBD532、534、536、および538のうちの1つ又は複数は、NMD512、514、および516のうちの1つ又は複数であってもよい。
NMD512、514、および516はローカルエリアネットワークの一部であってもよく、通信経路542は、NMD512、514、および516が属するローカルエリアネットワークを、WANを介してコンピューティングデバイス504にリンクする(通信経路は図示せず)アクセスポイントを含んでいてもよい。同様に、NMD512、514、および516のそれぞれは、そのようなアクセスポイントを介して互いと通信してもよい。
同様に、CR522並びにPBD532、534、536、および538は、前のセクションで説明したように、ローカルエリアネットワークおよび/又はローカル再生ネットワークの一部であってもよく、また通信経路544は、CR522並びにPBD532、534、536、および538が属するローカルエリアネットワークおよび/又はローカル再生ネットワークを、WANを介してコンピューティングデバイス506にリンクするアクセスポイントを含んでいてもよい。したがって、CR522並びにPBD532、534、536、および538のそれぞれもまた、そのようなアクセスポイントを介して互いと通信してもよい。
ある例では、単一のアクセスポイントは通信経路542および544を含んでもよい。ある例では、NMD512、514、および516、CR522、並びにPBD532、534、536、および538のそれぞれは、家庭用の同じアクセスポイントを介してクラウドネットワーク502にアクセスしてもよい。
図5に示されるように、NMD512、514、および516、CR522、並びにPBD532、534、536、および538のそれぞれはまた、通信手段546を介して他のデバイスのうちの1つ又は複数と直接通信してもよい。本明細書に記載の通信手段546は、1つ又は複数の種類のネットワークを介した、1つ又は複数のネットワークプロトコルによるデバイス間の1つ又は複数の形式の通信を含んでもよく、および/又は1つ又は複数の他のネットワークデバイスを介した通信を含んでもよい。例えば通信手段546は、一例として、Bluetooth(商標)(IEEE802.15)、NFC、Wireless Direct、および/又はプロプライエタリ無線その他のうちの1つ又は複数を含んでいてもよい。
ある例では、CR522はBluetooth(商標)を介してNMD532と通信し、別のローカルエリアネットワークを介してPBD534と通信してもよい。別の例では、NMD514は別のローカルエリアネットワークを介してCR522と通信し、Bluetoothを介してPBD536と通信してもよい。更に別の例では、PBD532、534、536、および538のそれぞれは、ローカル再生ネットワークを介し、スパニングツリープロトコルに従って互いと通信してもよく、その一方で、ローカル再生ネットワークとは異なるローカルエリアネットワークを介してCR522とそれぞれ通信してもよい。他の例も可能である。
場合によっては、NMD512、514、および516、CR522、並びにPBD532、534、536、および538間の通信手段は、デバイス間の通信の種類、ネットワーク状態、および/又は待ち時間要求に応じて変化してもよい。例えば、NMD516をPBD532、534、536、および538と共に最初に家庭に導入するときに、通信手段546を使用してもよい。ある場合では、NMD516は、NFCを介してNMD516に対応する識別情報をPBD538に送信してもよく、またPBD538はこれに応じて、NFC(又は他の何らかの通信形式)を介してローカルエリアネットワーク情報をNMD516に送信してもよい。ただし、ひとたびNMD516を家庭内に設置した後、NMD516とPBD538との通信手段は変化してもよい。例えばNMD516は、通信経路542、クラウドネットワーク502、および通信経路544を連続的に経由してPBD538と通信してもよい。別の例では、NMDとPBDとは、ローカル通信手段546を介して決して通信しないようにしてもよい。更に別の例では、NMDとPBDとは、主としてローカル通信手段546を介して通信してもよい。他の例も可能である。
例示的な例では、NMD512、514、および516は、PBD532、534、536、および538を制御するための音声入力を受信するように構成されてもよい。利用可能な制御コマンドは、再生ボリュームコントロール、再生トランスポートコントロール、音楽ソース選択、およびグループ化その他など、前述した任意のメディア再生システムの制御を含んでいてもよい。例えばNMD512は、PBD532、534、536、および538のうちの1つ又は複数を制御するための音声入力を受信してもよい。音声入力を受信したことに応答して、NMD512は通信経路542を介して、処理を目的としてその音声入力をコンピューティングデバイス504に送信してもよい。ある例では、コンピューティングデバイス504は、音声入力を同等のテキストコマンドに変換し、そのテキストコマンドを解析してコマンドを識別してもよい。次いでコンピューティングデバイス504は、続けてそのテキストコマンドをコンピューティングデバイス506に送信してもよい。別の例では、コンピューティングデバイス504は、音声入力を同等のテキストコマンドに変換し、次いで、続けてそのテキストコマンドをコンピューティングデバイス506に送信してもよい。その後コンピューティングデバイス506は、そのテキストコマンドを解析して、1つ又は複数の再生コマンドを識別してもよい。
例えば、そのテキストコマンドが「『ストリーミングサービス1』から『アーティスト1』による『トラック1』を『ゾーン1』で再生して」である場合、コンピューティングデバイス506は(i)「ストリーミングサービス1」から入手可能な「アーティスト1」による「トラック1」のURLと、(ii)「ゾーン1」内の少なくとも1つの再生デバイスとを識別してもよい。本例では、「ストリーミングサービス1」からの「アーティスト1」による「トラック1」のURLは、コンピューティングデバイス508を指すURLであってもよく、「ゾーン1」は結合ゾーン530であってもよい。したがって、URLとPBD536および538の一方又は両方とを識別すると、コンピューティングデバイス506は通信経路544を介して、PBD536および538の一方又は両方に、識別された再生用のURLを送信してもよい。PBD536および538の一方又は両方は、これに応じて、受信したURLに従ってコンピューティングデバイス508からオーディオコンテンツを取り出し、かつ「ストリーミングサービス1」から「アーティスト1」による「トラック1」の再生を開始してもよい。
当業者であれば、上記は単なる例示的な例であり、他の実施形態も実行可能であることを理解する。ある場合では、上述したように、複数のデバイス500のうちの1つ又は複数によって実行される動作は、複数のデバイス500における1つ又は複数の他のデバイスによって実行されてもよい。例えば、音声入力からテキストコマンドへの変換は、NMD512、コンピューティングデバイス506、PBD536、および/又はPBD538などの他のデバイスによって代替的に、部分的に若しくは完全に実行されてもよい。同様にURLの識別は、NMD512、コンピューティングデバイス504、PBD536、および/又はPBD538などの別のデバイス若しくは複数のデバイスによって代替的に、部分的に若しくは完全に実行されてもよい。
f.例示的なネットワークマイクロフォンデバイス
図6は、図5のNMD512、514、および516のうちの1つ又は複数を構成する例示的なネットワークマイクロフォンデバイス600の機能ブロック図を示す。図示されるように、ネットワークマイクロフォンデバイス600は、プロセッサ602、メモリ604、マイクロフォンアレイ606、ネットワークインタフェース608、ユーザインタフェース610、ソフトウェアコンポーネント612、およびスピーカ(複数可)614を含む当業者であれば、他のネットワークマイクロフォンデバイスの構成および配置も可能であることを理解する。例えば、ネットワークマイクロフォンデバイスは、代替案としてスピーカ(複数可)614を除外するか、又はマイクロフォンアレイ606の代わりに単一のマイクロフォンを有することができる。
プロセッサ602は、汎用プロセッサ若しくはコントローラ又は専用プロセッサ若しくはコントローラの形態をとる、1つ又は複数のプロセッサおよび/又はコントローラを含んでいてもよい。例えば、処理ユニット602は、マイクロプロセッサ、マイクロコントローラ、特定用途向け集積回路、およびデジタル信号プロセッサなどを含んでいてもよい。メモリ604は、プロセッサ602によって実行されて機能を発揮する1つ又は複数のソフトウェアコンポーネントを搭載可能なデータストレージであってもよい。したがって、メモリ604は、ランダムアクセスメモリ、レジスタ、キャッシュなどが例として挙げられる1つ又は複数の非一時的なコンピュータ読取り可能記録媒体と、読取り専用メモリ、ハードディスクドライブ、ソリッドステートドライブ、フラッシュメモリ、および/又は光学記憶装置その他などの1つ又は複数の不揮発性記録媒体とを備えていてもよい。
マイクロフォンアレイ606は、ネットワークマイクロフォンデバイス600の環境内の音を検出するように構成された、複数のマイクロフォンであってもよい。マイクロフォンアレイ606は、コンデンサーマイク、エレクトレットコンデンサーマイク、又はダイナミックマイクなど、現在知られている又は今後開発される任意の種類のマイクロフォンを含んでもよい。ある例では、マイクロフォンアレイは、ネットワークマイクロフォンデバイスに対する1つ又は複数の方向から音声を検出するように構成されてもよい。マイクロフォンアレイ606は、一部の周波数範囲に対して高感度であってもよく、ある例では、マイクロフォンアレイ606の第1サブセットは第1周波数範囲に対して高感度であってもよい一方、マイクロフォンアレイの第2サブセットは第2周波数範囲に対して高感度であってもよい。更に、マイクロフォンアレイ606は、オーディオソース(例えば、音声、可聴音)の位置情報を取得する、および/又は、背景雑音のフィルタリングを補助するために設けられてもよい。特にある実施形態では、マイクロフォンアレイは、複数のマイクロフォンではなく、単一のマイクロフォンのみから構成されてもよい。
ネットワークインタフェース608は、図5に関連してCR522、PBD532〜538、コンピューティングデバイス504〜508などのクラウドネットワーク502内の様々なネットワークデバイス、および他のネットワークマイクロフォンデバイスなどの間における無線および/又は有線通信を容易にするように構成されてもよい。このため、ネットワークインタフェース608は、これらの機能を実行するのに適した任意の形態をとることができ、その例としては、Ethernetインタフェース、シリアルバスインタフェース(例えば、FireWire、USB2.0など)、無線通信を容易にするように構成されたチップセットおよびアンテナ、並びに/又は有線および/又は無線通信を提供する他の任意のインタフェースが挙げられる。ある例では、ネットワークインタフェース608は、工業規格(例えば、赤外線、無線、IEEE802.3などの有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15などの無線規格、4G通信規格など)に基づいてもよい。
ネットワークマイクロフォンデバイス600のユーザインタフェース610は、ネットワークマイクロフォンデバイスとのユーザ対話を容易にするように構成されていてもよい。ある例では、ユーザインタフェース608は、ユーザがネットワークマイクロフォンデバイス600に直接入力できるようにするために、物理的ボタン、タッチセンサ画面(複数可)および/又は面(複数可)に設けられるグラフィカルインタフェースその他のうちの1つ又は複数を含んでいてもよい。ユーザインタフェース610は、視覚的および/又は聴覚的フィードバックをユーザに提供するために、1つ又は複数の照明およびスピーカ(複数可)614を更に含んでいてもよい。ある例では、ネットワークマイクロフォンデバイス600は、スピーカ(複数可)614を介してオーディオコンテンツを再生するように更に構成されていてもよい。
ここでいくつかの例示的な実施形態である、図7、図8、および図9に示される実施形態700、800、並びに900を参照すると、本明細書に記載される技術の例示的な実施形態がそれぞれ提示されている。例えば、図1のメディア再生システム100、図2の再生デバイス200の1つ又は複数、又は図3の制御デバイス300の1つ又は複数、並びに本明細書に記載の他のデバイスおよび/又は他の適切なデバイスを含む動作環境内に、これらの例示的な実施形態を実装することができる。更に、メディア再生システムによって実行されるものとして例として図示されている動作は、メディア再生システムの再生デバイス又は制御デバイスなどの任意の適切なデバイスによって実行されてもよい。実施形態700、800、および900は、図7、図8、および図9に示されるブロックのうちの1つ又は複数によって図示されるように、1つ又は複数の動作、機能、若しくはアクションを含んでもよい。ブロックを順番に図示しているが、これらのブロックは同時に、および/又は本明細書に記載の順番とは異なる順番で実行されてもよい。また、様々なブロックは、より少数のブロックに組み合わされるか、追加のブロックに分割されるか、および/又は所望の実施形態に基づいて取り除かれてもよい。
更に、本明細書に開示される実施形態について、フローチャートは、本実施形態の実行可能な1つの実施態様の機能および動作を示す。これに関してそれぞれのブロックは、プロセッサによって実行されてプロセスにおける特定の論理機能又はステップを実装するための1つ又は複数の命令を含むプログラムコードのモジュール、セグメント、又は一部を表すことができる。このプログラムコードは、例えばディスク又はハードドライブを含むストレージデバイスなどの、任意の種類のコンピュータ読取り可能媒体に記憶されてもよい。コンピュータ読取り可能媒体としては、例えばレジスタメモリ、プロセッサキャッシュ、およびランダムアクセスメモリ(RAM)のように短期間データを記憶するコンピュータ読取り可能媒体などの、非一時的なコンピュータ読取り可能媒体が挙げられる。更に、コンピュータ読取り可能媒体として、例えば読取り専用メモリ(ROM)、光ディスク又は磁気ディスク、コンパクトディスク読取り専用メモリ(CD−ROM)のように二次的な、又は永続的な長期ストレージなどの非一時的な記録媒体も挙げることができる。また、コンピュータ読取り可能媒体は、他の任意の揮発性又は不揮発性ストレージシステムであってもよい。コンピュータ読取り可能媒体は、例えばコンピュータ読取り可能記録媒体、又は有形のストレージデバイスと見なすことができる。更に、本明細書に開示される実施形態について、それぞれのブロックは、プロセスにおける特定の論理機能を実行するように配線されている回路を表すことができる。
III.音声サービスを起動するための例示的なシステムおよび方法
上述したように、ある例では、コンピューティングデバイスは音声サービスを使用して音声コマンドを処理することができる。実施形態700は、音声サービスに音声入力を処理させるための例示的な技術である。
a.音声入力を示す音声データの受信
ブロック702で、実施形態700は、音声入力を示す音声データを受信するステップを含む。例えば、NMD600などのNMDはマイクロフォンを介して、音声入力を示す音声データを受信することができる。更に別の例として、図1の再生デバイス102、104、106、108、110、112、114、116、118、120、122、および124又は制御デバイス126および128のいずれかはNMDであってもよく、また音声入力を示す音声データを受信してもよい。更に別の例では、NMDは、図5のNMD512、514、および516、PBD532、534、536、および538、並びにCR522を含む。
NMDは、1つ又は複数のマイクロフォンを介して、周辺雑音を継続的に録音(すなわち、音声入力を聞く)してもよい。NMDは、この継続的な録音をリングバッファ又はサーキュラバッファに記憶してもよい。そのようなバッファにおいては、その録音は音声入力を含まない限り上書き(すなわち、破棄される)されてもよい。このバッファは、本明細書に記載のデバイス又はサーバのいずれかを介して、ローカルおよび/又はリモートに記憶されてもよい。そのような場合、音声入力を示す音声データを受信するステップは、音声入力を含む音声データをバッファに録音するステップを含んでもよい。
NMDは、音声データの一部がウェイクワード又はウェイクフレーズを含んでいることを検出することにより、音声入力が受信されたことを検出することができる。例えば音声入力は、ウェイクワードとそれに続く音声コマンドとを含んでいる場合がある。ウェイクワードは、NMDが音声入力を能動的に聞き取るための時間間隔又は時間枠を開始することができる。時間間隔又は時間枠は、一定の時間(例えば、NMDが最初の音声入力を受信してから1分後)が経過すると期限切れになるようにしてもよい。「ユーザIDに基づくアクション」と題する米国特許出願第15/131,776号が本明細書に参照として援用されており、それには更に別の例が記載されている。商業的に使用されているいくつかの例示的なウェイクワードとしては、「ヘイ、Siri」(アップル(登録商標)社)、「オッケー、Google」(グーグル(登録商標)社)、および「Alexa」(アマゾン(登録商標)社)が挙げられる。あるいは、ウェイクワードは独自のものであってもよい(例えば、ユーザ定義の)。
例示のために図1に戻って、ユーザは、主寝室ゾーンにいる間に特定の音声入力を発することができる。NMDとして機能している再生デバイス122(および/又は再生デバイス124)は、音声入力を聞き取り(すなわち、マイクロフォンを介した録音であり、おそらくはバッファに録音される)、かつユーザの声を音声入力として検出することができる。特定の音声入力は、NMDにユーザの声を音声入力として容易に認識させるようにするためのウェイクワードを含んでもよい。
例示的な音声コマンドは、メディア再生システムの制御又は再生設定のいずれかを変更するように命じるコマンドを含んでもよい。再生設定には、例えば再生ボリューム、再生トランスポートコントロール、音楽ソース選択、およびグループ化その他が含まれていてもよい。他の音声コマンドは、他のデバイス操作の中でもとりわけ、テレビコントロール又は再生設定、携帯電話端末の設定、又は照明装置を調整するための操作を含んでいてもよい。より多くの家庭用装置が「スマート」になるにつれて(例えば、ネットワークインタフェースを搭載することによって)、音声コマンドを使用して様々な家庭用装置をコントロールすることができるようになる。
一例として、NMDは音声入力を示す音声データを、ネットワークインタフェースを介して、おそらくは家庭内の別のNMDから受信することができる。NMDはマイクロフォンを介して、音声入力を示す音声データを受信することに加えて、当該録音を受信してもよい(例えば、2つのNMDが両方とも音声入力の検出範囲内にある場合)。
そのような実施形態では、NMDは周辺雑音を継続的に録音しない可能性がある。むしろ、場合によってはNMDは、NMDに対して「起動」して音声入力又はコマンドの録音を開始するように指示する音声入力又は指示を受信してもよい。例えば、第1NMD(例えば、図1に示される再生デバイス104)は音声入力を受信し、本明細書に記載のある状況では、録音を開始するように指示する指示を1つ又は複数の第2NMD(例えば、再生デバイス106および/又は108その他など)に送信してもよい。
いくつかの例においては、NMDデバイスが音声データを受信する前に、複数のNMDからの音声録音が精査され、処理され、および/又は単一の音声入力にまとめられてもよい。例として、NMD512は、514又は516などの1つ又は複数の他のNMDから音声録音を受信することができる。いくつかの実施形態では、PBD532、534、536および/又は538はNMDとして構成されてもよく、またNMD512は、PBD532、534、536および/又は538のうちの1つから音声録音を受信してもよい。NMD(又は複数のNMD)は、音声録音を精査し、処理し、および/又はまとめて単一の音声入力にし、さらなる処理を目的として、この単一の音声入力をコンピューティングデバイスに送信してもよい。
b.音声入力を処理するための音声サービス(複数可)の識別
ブロック704で、実施形態700は、音声入力を処理するための1つ又は複数の音声サービスを識別するステップを含む。例えば、NMDは、受信した音声データに示されている音声入力を処理するための特定の音声サービスを識別することができる。あるいは、NMDは、音声入力を処理するための複数の音声サービスを識別してもよい。
NMDは、音声入力を処理するための特定の音声サービスを、利用可能な音声サービスの中から識別することができる。音声サービスは、様々な技術を使用してNMDで利用可能となってもよい。利用可能な音声サービスは、NMDに登録されている音声サービスを含んでいてもよい。NMDに所定の音声サービスを登録する作業は、音声サービスのユーザ認証情報(例えば、ユーザ名およびパスワード)をNMDに提供するステップ、および/又はNMDの識別子を音声サービスに提供するステップを含んでいてもよい。そのような登録作業において、音声サービスに代わって音声入力を受信するようにNMDを構成し、またおそらくは処理を目的として、NMDから音声入力を受信するように音声サービスを構成してもよい。登録作業は設定手順の間に行われてもよい。
場合によっては、NMDはメディア再生システムと関連付けられてもよい。NMDは、メディア再生システム自体の一部として(例えば、制御デバイス又は再生デバイスとして)、又はメディア再生システムと相互接続された別のデバイスとして機能し、場合によってはメディア再生システムの特定の動作(例えば、再生デバイスの音声コントロール)を容易に行うことができる。1つ又は複数の音声サービスが所定のメディア再生システムに登録されてもよく、NMDは音声入力を処理するために、登録された音声サービスを識別することができる。
メディア再生システムの登録作業において、音声サービスに代わって音声入力を受信するように、メディア再生システムのNMD(例えば、制御デバイス、再生デバイス、又はその他の関連デバイス)を構成してもよい。更に、こうした登録作業において、処理を目的としてこれらのデバイスから音声入力を受信するように、音声サービスを構成してもよい。メディア再生システムに音声サービスを登録する作業は、設定手順の間に行われてもよい。例示的な設定手順は、再生デバイス(又は複数の再生デバイス)および/又は制御デバイスを新たなメディア再生システムに設定する手順を含む。他の例示的な設定手順は、メディア再生システムを変更するための手順(例えば、デバイスを本システムに追加、又は本システムから取り除く手順、あるいは本システムに音声サービスを設定する手順)を含む。
場合によっては、単一の音声サービスがNMDで利用可能であってもよく、これによって音声入力を処理するための音声サービスを簡便に識別することができるようになる。NMDによって受信された音声入力は音声サービスに直接送信されてもよく、またNMDによって応答が提供されてもよい。そのような実施形態では、NMDは単一の音声サービス用のマイクロフォンインタフェースおよびスピーカインタフェースとして機能することになる。
他の場合では、音声入力を処理するために、複数の音声サービスがNMDで利用可能であってもよい。そのような場合、NMDは、音声入力を処理するための特定の音声サービスを、複数の音声サービスの中から識別することができる。例えば、NMDは、メディア再生システムに登録されている複数の音声サービスの中から、特定の音声サービスを識別することができる。上述したように、NMDはメディア再生システムの一部(例えば、再生デバイス又は制御デバイスとして)であってもよく、あるいは本システムと関連付けられていてもよい。
音声入力を処理するための特定の音声サービスを識別するステップは、音声入力におけるウェイクワード又はウェイクフレーズに基づいてもよい。例えば、音声入力を示す音声データを受信した後、NMDは、音声データの一部が特定のウェイクワードを表していると決定することができる。更に、NMDは、この特定のウェイクワードが特定の音声サービスに対応していると決定してもよい。換言すれば、NMDは、特定のウェイクワード又はウェイクフレーズが特定の音声サービスを起動するために使用されていると決定してもよい。例えば、特定のウェイクワードとしては、アップル(登録商標)社の音声サービスを起動するための「ヘイ、Siri」、グーグル(登録商標)社の音声サービスを起動するための「オッケー、Google」、アマゾン(登録商標)社の音声サービスを起動するための「Alexa」、又はマイクロソフト社の音声サービスを起動するための「ヘイ、Cortana」が挙げられる。あるいは、特定の音声サービスを起動するために、独自のウェイクワード(例えば、ユーザ定義の)を定義することができる。NMDが、受信した音声データにおける特定のウェイクワードが特定の音声サービスに対応していると決定した場合、NMDはその特定の音声サービスを、音声データにおける音声入力を処理するための音声サービスとして識別することができる。
特定のウェイクワードが特定の音声サービスに対応していると決定するステップは、音声データ(例えば、ウェイクワード又はウェイクフレーズに対応している音声データの一部)を用いて1つ又は複数の音声サービスにクエリを実行するステップを含んでもよい。例えば、音声サービスは、音声データがその音声サービスに対応するウェイクワード又はウェイクフレーズを含んでいるかどうかを決定するためにNMDが呼び出すことができる、アプリケーションプログラミングインタフェースを提供してもよい。NMDは、受信した音声データにおいてウェイクワード部分を表すデータと共に、その音声サービスに関する特定のクエリを音声サービスに送信することによって、APIを呼び出すことができる。あるいは、NMDはNMD自体のAPIを呼び出すことができる。NMD又はメディア再生システムに音声サービスを登録する作業により、音声サービスのAPI又は他のアーキテクチャをNMDと一体化させることができる。
複数の音声サービスがNMDで利用可能である場合、NMDは、複数の音声サービスにおけるそれぞれの音声サービスに対応するウェイクワード検出アルゴリズムでクエリを実行する可能性がある。上述したように、そのような検出アルゴリズムでクエリを実行するステップは、NMD上でローカルに、又はネットワークインタフェースを使用してリモートに、複数の音声サービスのそれぞれのAPIを呼び出すステップを含んでもよい。所定の音声サービスのウェイクワード検出アルゴリズムに関するクエリへの応答として、NMDは、クエリにおける音声データがその音声サービスに対応するウェイクワードを含んでいたかどうかを示す応答を受信することができる。受信した音声データが特定の音声サービスに対応する特定のウェイクワードを表していることを特定の音声サービスのウェイクワード検出アルゴリズムが検出した場合、NMDはその特定の音声サービスを、音声入力を処理するための音声サービスとして選択してもよい。
場合によっては、受信された音声データが、特定の音声サービスに対応する認識可能なウェイクワードを含んでいないにもかかわらず、音声入力を含んでいることがある。そのような状況は、周辺雑音又は他の要因のために、所定のウェイクワードが明確に検出されない場合に発生し、その結果、ウェイクワード検出アルゴリズム(複数可)が所定のウェイクワードを、任意の特定の音声サービスに対応するものとして認識しない可能性がある。あるいは、ユーザが特定の音声サービスに対応するウェイクワードを発していない可能性もある。例えば、特定の音声サービスに対応していない一般的ウェイクワードを使用して、音声入力の処理を呼び出している場合がある(例えば、「ヘイ、Sonos」)。
そのような場合、NMDはコンテキストに基づいて、音声入力を処理するためのデフォルトの音声サービスを識別することができる。デフォルトの音声サービスはあらかじめ決定されていてもよい(例えば、上述の例示的な手順などの設定手順中に設定される)。その場合、NMDは、受信した音声データが特定の音声サービスに対応するウェイクワードを含んでいないと決定すると(例えば、NMDが音声データにおいて特定の音声サービスに対応するウェイクワードを検出しなかった場合)、音声入力を処理するためにデフォルトの音声サービスを選択することができる。
上述したように、いくつかの例示的なシステムは、場合によっては複数のゾーンに設置された複数のNMD(例えば、リビングルーム、キッチン、ダイニングルーム、および寝室ゾーンを対象とし、各自がそれぞれの再生デバイスを有する図1のメディア再生システム100)を含んでもよい。このようなシステムでは、デフォルトの音声サービスはNMDごと、又はゾーンごとに設定されてもよい。その場合、所定のNMD又はゾーンによって検出された音声入力は、そのNMD又はゾーンのデフォルトの音声サービスによって処理されてもよい。場合によってはNMDは、所定のNMD又はゾーンによって検出された音声入力が、そのゾーンと関連付けられている音声サービスによって処理されることが意図されていると想定してもよい。ただし他の場合では、ウェイクワード又はウェイクフレーズにより、音声入力は特定のNMD又はゾーンに送信されてもよい(例えば、「ヘイ、キッチン」の場合は、音声入力はキッチンゾーンへと送信される)。
例示のために図1を参照すると、再生デバイス122および/又は124は、主寝室ゾーンのNMDとして機能していてもよい。このゾーンによって検出された、および/又はこのゾーンに送信された音声入力(例えば、「ヘイ主寝室、今日の天気はどう?」)は、主寝室ゾーンのデフォルトの音声サービスによって処理されてもよい。例えば、主寝室ゾーンのデフォルトの音声サービスが「アマゾン(登録商標)社のAlexa(登録商標)」である場合、主寝室ゾーンにあるNMDの少なくとも1つが、Alexaに天気に関するクエリを実行することになる。音声入力が特定の音声サービスに対応するウェイクワード又はウェイクフレーズを含んでいる場合、そのウェイクワード又はウェイクフレーズによってデフォルトの音声サービスが無効にされ(特定の音声サービスがデフォルトの音声サービスと異なる場合)、NMDがその特定の音声サービスを、音声入力を処理するために識別できるようになる。
いくつかの実施形態では、NMDは、その音声入力を提供しているユーザの識別情報に基づいて、音声サービスを識別してもよい。人間の声は高さ、声質、および他の特性によって異なる可能性があり、これらによってそのユーザの声によって特定のユーザを識別するための特性が、もたらされてもよい。場合によっては、家庭内のユーザがそれぞれの声を認識させるように、NMDを訓練してもよい。
家庭内のユーザは各自、それぞれ独自の好みの音声サービスを利用してもよい。例えば、家庭内の第1ユーザおよび第2ユーザは、第1音声サービスと第2音声サービスとをそれぞれ使用するように、NMDを設定してもよい(例えば、SIRI(登録商標)およびCORTANA(登録商標))。NMDが音声入力において第1ユーザの声を認識した場合、NMDは音声コマンドを処理するために、第1音声サービスを識別してもよい。ただし、NMDが音声入力において第2ユーザの声を認識した場合、NMDは音声コマンドを処理するために、第2音声サービスを代わりに識別することができる。
あるいは、NMDはコンテキストに基づいて、音声入力を処理するための特定の音声サービスを識別してもよい。例えば、NMDは、コマンドの種類に基づいて特定の音声サービスを識別してもよい。NMD(例えば、メディア再生システムと関連付けられたNMD)は、特定の種類のコマンド(例えば、メディア再生コマンド)として、一定のコマンド(例えば、再生、停止、前方読みとばしなど)を認識することができる。そのような場合において、NMDは、その音声入力が特定の種類のコマンド(例えば、メディア再生コマンド)を含んでいると決定したとき、その音声入力を処理するための音声サービスとして、その種のコマンドを処理するように構成されている特定の音声サービスを識別してもよい。更に例示すると、検索クエリは別の例示的な種類のコマンド(例えば、「今日の天気はどう?」や「デヴィッド・ボウイの出生地はどこ?」)であってもよい。NMDは、音声入力が検索クエリを含んでいると決定した場合、検索クエリを含むその音声入力を処理するために、特定の音声サービス(例えば、「GOOGLE」)を識別してもよい。
NMDは場合によっては、その音声入力が特定の種類のデバイスを対象とした音声コマンドを含んでいると決定してもよい。そのような場合、NMDは、その種のデバイスを対象とした音声入力を処理するように構成されている特定の音声サービスを、当該音声入力を処理するために識別してもよい。例えば、NMDは、所定の音声入力が1つ又は複数の無線照明デバイスを対象としている(例えば、「ここの電気をつけて」は、NMDと同じ部屋にある「スマート」電球を対象としている)と決定し、その音声入力を処理するための音声サービスとして、無線照明デバイスを対象とした音声入力を処理するように構成されている特定の音声サービスを識別してもよい。別の例として、NMDは、所定の音声入力が再生デバイスを対象としていると決定し、その音声入力を処理するための音声サービスとして、再生デバイスを対象とした音声入力を処理するように構成されている特定の音声サービスを識別してもよい。
いくつかの例においては、NMDは以前の入力に基づいて、その音声入力を処理するために特定の音声サービスを識別することができる。ユーザは、第1音声入力が所定の音声サービスによって処理されていた場合において、後に続く第2音声入力が、他の想定可能なコンテキスト上の要素の中でもとりわけ、同じ種類の同じデバイスを対象としているか、あるいは第1コマンドの直後にこれが提供されているとき、この第2音声入力も同様に、当該音声サービスによって処理されることを期待している可能性がある。例えば、NMDは、以前の音声入力が所定の音声サービスによって処理されたことと、現在の音声入力が以前の音声入力と同じ種類の動作を対象としていることとを決定することができる(例えば、両方ともメディア再生コマンドであると決定する)。そのような状況では、NMDは、現在の音声入力を処理するために当該音声サービスを識別してもよい。
別の例として、NMDは、以前の音声入力が所定の音声サービスによって処理されたことと、現在の音声入力が、以前の音声入力受信後の閾値時間内(例えば、1〜2分以内)に受信されたこととを決定することができる。例示すると、再生デバイス114は、第1音声入力(「ヘイキッチン、ジャニス・ジョプリンの曲を再生して」)を受信し、その第1音声入力を処理するための音声サービスを識別し、その結果、再生デバイス114がジャニス・ジョプリンによるオーディオトラックを再生することができる。その後、再生デバイス114は、後に続く第2音声入力を受信し(「ボリュームを上げて」)、その第2音声入力を処理するための音声サービスを識別してもよい。メディア再生コマンドとしてのこの種のコマンド間の類似性および/又は2つの音声入力間における経過時間を所定として、再生デバイス114は、第2音声入力を処理するために、第1音声入力を処理するために識別したのと同じ音声サービスを識別してもよい。
一例として、NMDは、音声入力を処理するために第1音声サービスを識別し、その後、第1音声サービスが音声入力を処理するために利用できないと決定してもよい(おそらく、一定時間内に結果を受信できなかったことによって)。音声サービスは、当該サービスの有効期限切れ、クラウドサービスに関する技術的問題、又は可用性を侵害する悪意のあるイベント(例えば、分散型サービス妨害の攻撃)などを含む、いくつかの理由で利用できなくなる可能性がある。
そのような場合、NMDは音声入力を処理するために、代替の第2音声サービスを識別することができる。この代替音声サービスは、デフォルトの音声サービスである可能性がある。あるいは、システムに登録される複数の音声サービスが優先順位によってランク付けされてもよく、この代替音声サービスは次に優先順位の高い音声サービスであってもよい。他の例も可能である。
場合によっては、NMDは、代替音声サービスを識別する際にユーザからの入力を要求してもよい。例えば、NMDは、ユーザが代替音声サービスを指定するように要求してもよい(例えば、「GOOGLE(登録商標)は現在応答していません。別のサービスを検索しますか?」となる)。更にまた、NMDは代替音声サービスを識別し、ユーザに対して、代わりにこの代替音声サービスを検索したいかどうかを確認してもよい(例えば、「SIRI(登録商標)は現在応答していません。代わりにALEXA(登録商標)を検索しますか?」)となる)。あるいは、別の例として、NMDが代替音声サービスに対してクエリを実行し、結果を返すときにユーザに通知してもよい(例えば、「CORTANA(登録商標)は利用できませんでした。以下の結果はSIRI(登録商標)から得ました」となる)。元の音声サービスがひとたび利用可能になると、NMDはこの状況変化をユーザに通知し、おそらくは現在の音声サービスを変更してもよい(例えば、「SIRI(登録商標)は現在利用可能である。代わりにSIRI(登録商標)に問い合わせますか?」となる)。そのような応答は、NMDのデータストレージ上に記憶されたオーディオデータから、又はNMDがアクセスできるオーディオデータから生成されてもよい。
代替の第2音声サービスにクエリを実行する場合、NMDは第1音声サービスの1つ又は複数の設定値を第2音声サービスに適用しようと試みることができる。例えば、そのクエリが特定のアーティストによるメディアコンテンツを再生することであり、デフォルトのオーディオサービスが第1音声サービス(例えば、特定のメディアストリーミングサービス)に対して設定されている場合、NMDは第2音声サービスに対して、デフォルトのオーディオサービスからの特定のアーティストによるオーディオトラックについてクエリの実行を試みてもよい。ただし、異なる設定値(例えば、異なるデフォルトサービス)が第2音声サービスに対して設定されている場合、そのような設定値により、第2音声サービスにクエリを実行するときに第1音声サービスの設定値が上書きされてもよい。
場合によっては、単一の音声サービスのみがNMDで利用可能となっている。例えば、メディア再生システムの設定中に、メディア再生システムに対して特定の音声サービスが選択されていてもよい。一例として、特定の音声サービスが選択されている場合、他の音声サービスに対応するウェイクワードが非アクティブになり、これらのウェイクワードを検出しても処理が開始されないようにすることができる。音声サービスは、音声入力でクエリを実行されたときに音声サービスの動作を変更するための、様々な設定値を含んでもよい。例えば、優先されるメディアストリーミングサービス、又はデフォルトのメディアストリーミングサービスを設定することができる。メディア再生音声コマンド(例えば、「ケイティ・ペリーの曲を再生して」)は、その特定の音楽サービスからメディアコンテンツ(例えば、ケイティ・ペリーによるオーディオトラック)を参照することになる。
c.識別された音声サービス(複数可)による音声入力処理の実行
ブロック706で、実施形態700は、識別された音声サービス(複数可)に音声入力を処理させるステップを含む。例えば、NMDはネットワークインタフェースを介して、識別された音声サービス(複数可)の1つ又は複数のサーバに対して、音声入力を示すデータと、音声入力を示すデータを処理するように命じるコマンド又はクエリとを送信してもよい。このコマンド又はクエリは、識別された音声サービス(複数可)に音声コマンドを処理させてもよい。このコマンド又はクエリは、これらが識別された音声サービスに(例えば、当該音声サービスのAPIに)適合するように、識別された音声サービスに応じて異なってもよい。
上述したように、音声データは音声入力を示していてもよく、この音声入力は、ウェイクワードを表す第1部分と音声コマンドを表す第2部分とを含んでいてもよい。NMDは場合によっては、音声入力において少なくとも第2部分(例えば、音声コマンドを表す部分)を示すデータのみを送信してもよい。第1部分を含まないことによって、NMDは、他の想定可能な利点の中でもとりわけ、コマンドを送信するのに必要な帯域幅を低減し、かつウェイクワードに起因して発生し得る音声入力に対する誤処理を回避することができる。あるいはNMDは、音声入力において両方の部分を示しているか、又は音声データの他の何らかの部分を示しているデータを送信してもよい。
識別された音声サービスに音声入力を処理させた後、NMDはその処理の結果を受信することができる。例えば、その音声入力が検索クエリを示していた場合、NMDは検索結果を受信してもよい。別の例として、その音声入力がデバイスに対するコマンド(例えば、再生デバイスに対するメディア再生コマンド)を示していた場合、NMDはコマンドと、おそらくはそのコマンドと関連付けられた追加のデータ(例えば、コマンドと関連付けられたメディアのソース)とを受信してもよい。NMDはこれらの結果を、コマンドの種類と受信結果とに応じて適切に出力することができる。
あるいは、音声コマンドが当該NMD以外の別のデバイスを対象としていた場合、結果は当該NMDではなくそのデバイスに送信される可能性がある。例えば、図1を参照すると、キッチンゾーンの再生デバイス114は、ダイニングルームゾーンの再生デバイス112を対象とした音声入力(例えば、再生デバイス112にメディア再生を調整させるための)を受信する場合がある。そのような実施形態では、再生デバイス114がその音声入力の処理を円滑に進めるが、この処理の結果(例えば、メディア再生の調整を命じるコマンドは再生デバイス112に送信されてもよい)。あるいは、音声サービスが結果を再生デバイス114に送信してもよく、再生デバイス114が当該コマンドを再生デバイス112に送信してもよく、又は再生デバイス112に当該コマンドを実行させてもよい。
NMDは、識別された音声サービスにいくつかの音声入力を処理させることができるが、他の音声入力がNMD自体によって処理されてもよい。例えば、NMDがメディア再生システムの再生デバイス、制御デバイス、又は他のデバイスである場合、NMDはメディア再生コマンドの音声認識を含んでいてもよい。別の例として、NMDは音声入力のウェイクワード部分を処理してもよい。場合によっては、NMDが処理すると、音声サービスを使用して処理するよりも高速の応答時間が可能になり得る。ただし、場合によっては、音声サービスを使用して処理するとより有効な結果、および/又はNMDを介した処理では得られない結果が得られる可能性がある。いくつかの実施形態では、NMDと関連付けられた音声サービス(例えば、NMDの製造業者によって運営されている)は、そのような音声認識を容易に行うことができる。
IV.音声サービスを起動するための例示的システムおよび方法
上述したように、ある例では、コンピューティングデバイスは音声サービスを使用して音声コマンドを処理することができる。実施形態800は、音声サービスに音声入力を処理させるための例示的な技術である。
a.音声入力を示す音声データの受信
ブロック802で、実施形態800は、音声入力を示す音声データを受信するステップを含む。例えば、NMDは、他の実行可能な実施形態の中でもとりわけ、実施形態700のブロック702に関連して上述した例示的な技術のいずれかを使用して、マイクロフォンを介して音声入力を示す音声データを受信することができる。
b.受信した音声データに一般的ウェイクワードを表す部分が含まれている場合の決定
ブロック804で、実施形態800は、受信した音声データに一般的ウェイクワードを表す部分が含まれていると決定するステップを含む。一般的ウェイクワードは、特定の音声サービスに対応していない可能性がある。その代わりに、一般的ウェイクワードは、全般的にNMD又はメディア再生システムに対応していてもよい(例えば、ソノス(登録商標)のメディア再生システムの場合は「ヘイ、Sonos」、あるいはメディア再生システムのキッチンゾーンの場合は「ヘイ、キッチン」)。一般的であることで、一般的ウェイクワードによって特定の音声サービスが起動しないことが想定され得る。むしろ、複数の音声サービスが登録されている場合、一般的ウェイクワードによってこれらの音声サービス全てが起動して、最良の結果を得ようとすることが想定され得る。あるいは、単一の音声サービスが登録されている場合、一般的ウェイクワードによって、その音声サービスが起動することが想定され得る。
c.音声サービス(複数可)による音声入力処理の実行
ブロック806で、実施形態800は、1つ又は複数の音声サービス(複数可)に音声入力を処理させるステップを含む。例えば、NMDは、他の実行可能な実施形態の中でもとりわけ、実施形態700のブロック706に関連して上述した例示的な技術のいずれかを使用して、音声サービス(複数可)に音声入力を処理させることができる。
場合によっては、複数の音声サービスがNMDで利用可能となっている。例えば、複数の音声サービスが、NMDと関連付けられたメディア再生システムに登録されている。そのような例では、NMDは利用可能な音声サービスのそれぞれに音声入力を処理させてもよい。例えば、NMDはネットワークインタフェースを介して、複数の音声サービス(複数可)のそれぞれのサーバに対して、音声入力を示すデータと、音声入力を示すデータを処理するように命じるコマンド又はクエリとを送信してもよい。このコマンド又はクエリは、識別された音声サービス(複数可)に音声コマンドを処理させてもよい。このコマンド又はクエリは、これらが当該音声サービスに(例えば、当該音声サービスのAPIに)適合するように、それぞれの音声サービスに応じて異なってもよい。
音声サービス(複数可)に音声入力を処理させた後、NMDはその処理の結果を受信することができる。例えば、その音声入力が検索クエリ又はメディア再生コマンドを示していた場合、NMDは検索結果又はコマンドをそれぞれ受信してもよい。NMDは、それぞれの音声サービス又は音声サービスのサブセットから結果を受信してもよい。一部の音声サービスでは、発生し得る全ての入力に対して結果を返すとは限らない。
d.音声サービス(複数可)のうちの特定の音声サービスからの出力結果
ブロック806で、実施形態800は、音声サービス(複数可)のうちの特定の音声サービスからの結果を出力するステップを含む。1つの音声サービスからのみ結果を受信した場合、NMDはその結果を出力してもよい。ただし、複数の音声サービスから結果を受信した場合、NMDは、複数の音声サービスからのそれぞれの結果の中から特定の結果を選択し、その結果を出力してもよい。
例示として、ある例では、NMDは「ヘイキッチン、テイラー・スウィフトの曲を再生して」という音声入力を受信してもよい。NMDは、音声入力のウェイクワード部分(「ヘイ、キッチン」)が特定の音声サービスを指定していないことから、一般的であると決定してもよい。この種のウェイクワードを受信した場合、NMDは複数の音声サービスに音声入力を処理させてもよい。ただし、音声入力のウェイクワード部分が特定の音声サービスに対応するウェイクワード(例えば、「ヘイ、Siri」)を含んでいる場合、NMDは、代わりに対応する音声サービスのみに音声入力を処理させる可能性がある。
複数の音声サービスに音声入力を処理させた後、NMDはこれらの複数の音声サービスからそれぞれの結果を受信することができる。例えば、「テイラー・スウィフトの曲を再生して」という音声コマンドに対して、NMDは、第1音声サービス(例えば、ALEXA(登録商標))からテイラー・スウィフトのオーディオトラックを受信し、第2音声サービス(例えば、GOOGLE(登録商標))からテイラー・スウィフトに関連する検索結果を受信してもよい。コマンドはテイラー・スウィフトの曲を「再生する」ことであったので、NMDは第2音声サービスからの検索結果よりも、第1音声サービスからのオーディオトラックを選択してもよい。NMDは、キッチンゾーンに当該オーディオトラックの再生を開始させることによって、この結果を出力してもよい。
別の例では、処理作業に関係する音声サービスは、特定の種類のコマンドに固有のものであってもよい。例えば、メディアストリーミングサービス(例えば、SPOTIFY(登録商標))は、オーディオ再生関連のコマンド用の音声サービスコンポーネントを有している可能性がある。ある例では、NMDは「天気はどう?」という音声入力を受信してもよい。この入力に対して、メディアストリーミングサービスの音声サービスは有用な結果を返さない可能性がある(例えば、ヌル結果又はエラー結果)。NMDは、別の音声サービスからの結果を選択する可能性がある。
V.音声サービスを登録するための例示的なシステムおよび方法
上述したように、ある例では、コンピューティングデバイスは、音声コマンドを処理するために1つ又は複数の音声サービスを登録することができる。実施形態900は、NMDに少なくとも1つの音声サービスを登録させるための例示的な技術である。
a.音声サービス(複数可)を登録するように命じるコマンドを示す入力データの受信
ブロック902で、実施形態900は、1つ又は複数の第2デバイスに1つ又は複数の音声サービスを登録するように命じるコマンドを示す、入力データを受信するステップを含む。例えば、第1デバイス(例えば、NMD)はユーザインタフェース(例えば、タッチスクリーン)を介して、1つ又は複数の再生デバイスを含むメディア再生システムに対して、1つ又は複数の音声サービスを登録するように命じるコマンドを示す入力データを受信してもよい。ある例では、NMDは、他の実行可能な実施形態の中でもとりわけ、実施形態700のブロック702に関連して上述した例示的な技術のいずれかを使用して、メディア再生システムを設定する手順の一部として当該入力を受信する。
b.NMDに登録されている音声サービスの検出
ブロック904で、実施形態900は、第1デバイス(例えば、NMD)に登録されている1つ又は複数の音声サービスを検出するステップを含む。そのような音声サービスは、NMDにインストールされているか、又はNMDに固有の(例えば、NMDのオペレーティングシステムの一部である)音声サービスを含んでいてもよい。
例えば、NMDがスマートフォン又はタブレットである場合、音声サービスとインタフェースする1つ又は複数のアプリケーション(「アプリ」)をインストールしている可能性がある。NMDは、任意の適切な技術を用いてこれらのアプリケーションを検出することができる。こうした技術は、NMDの製造業者又はオペレーティングシステムによって異なっていてもよい。ある例ではNMDは、インストールされているアプリケーションのリスト又はデータベースを、サポートされている音声サービスのリストと比較して、NMDにインストール中の音声サービスのうちでどのサービスがサポートされているかを決定してもよい。
他の例では、音声サービスはNMDに固有のものであってもよい。例えば、アップル(登録商標)社およびグーグル(登録商標)社の音声サービスは、それぞれiOSおよびAndroidのオペレーティングシステムを実行しているデバイスに組み込まれているか、又はプレインストールされている場合がある。更に、これらのオペレーティングシステムにおいてカスタマイズされたいくつかのディストリビューション(例えば、アマゾン(登録商標)社のFireOS(登録商標))は、固有の音声サービス(例えば、ALEX A(登録商標))を含んでいる場合がある。
c.検出された音声サービス(複数可)のデバイスへの登録の実行
ブロック906で、実施形態900は、検出された音声サービスのうちの少なくとも1つを、1つ又は複数の第2デバイスに登録させるステップを含む。例えば、NMDは、検出された音声サービスのうちの少なくとも1つを、1つ又は複数の再生デバイスを含むメディア再生システム(例えば、図1のメディア再生システム100)に登録させてもよい。この音声サービスを登録させるステップは、ネットワークインタフェースを介して、その音声サービスに関する認証情報を示すメッセージをメディア再生システム(すなわち、その少なくとも1つのデバイス)に送信するステップを含んでもよい。このメッセージは、NMDからの認証情報を使用して、メディア再生システムに音声サービスを登録するように命じるコマンド、要求、又は他のクエリを更に含んでいてもよい。このようにして、ユーザのメディア再生システムには、ユーザのNMD(例えば、スマートフォン)に登録されているのと同じ音声サービスのうちの1つ又は複数が、ユーザのNMDと同じ認証情報を利用して登録されていてもよく、これによって登録作業を早めることができる。他の利点も想定可能である。
VI.結論
本明細書は、様々な例示のシステム、方法、装置、および製品などを開示しており、それらは、他のコンポーネントの中で、ハードウェア上で実行されるファームウェアおよび/又はソフトウェアを含む。そのような例は、単なる例示であり、限定されるものとみなすべきではないと理解される。例えば、これらのファームウェア、ハードウェア、および/又はソフトウェアの態様又はコンポーネントのいくつか又はすべてが、専らハードウェアに、専らソフトウェアに、専らファームウェアに、又はハードウェア、ソフトウェア、および/又はファームウェアの任意の組み合わせを実施することができることが意図されている。したがって、提供されているそれらの例は、それらのシステム、方法、装置、および/又は生産物を実施する唯一の方法ではない。
(特徴1)マイクロフォンを介して、音声入力を示す音声データを受信するステップと、メディア再生システムに登録されている複数の音声サービスの中から、前記音声入力を処理するための音声サービスを識別するステップと、ネットワークインタフェースを介して、前記識別された音声サービスに前記音声入力を処理させるステップとを含む、方法。
(特徴2)前記音声入力を処理するための音声サービスを識別するステップは、受信した前記音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表していると決定するステップと、前記音声入力を処理するための音声サービスとして、前記特定のウェイクワードに対応する前記特定の音声サービスを識別するステップであって、前記メディア再生システムに登録されている複数の音声サービスのそれぞれは、それぞれのウェイクワードに対応している、ステップとを含む、特徴1に記載の方法。
(特徴3)前記受信した音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表していると決定するステップは、前記複数の音声サービスのそれぞれの音声サービスに対応するウェイクワード検出アルゴリズムに対して、前記受信した音声データを用いてクエリを実行するステップと、前記受信した音声データの一部が前記特定の音声サービスに対応する特定のウェイクワードを表していることを、前記特定の音声サービスのウェイクワード検出アルゴリズムが検出したと決定するステップとを含む、特徴2に記載の方法。
(特徴4)前記音声入力を処理するための音声サービスを識別するステップは、前記受信した音声データが、前記メディア再生システムに登録されている前記複数の音声サービスのうちの、所定の音声サービスに対応する任意のウェイクワードを含んでいないと決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、前記複数の音声サービスの中からデフォルトの音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴5)前記音声入力を処理するための音声サービスを識別するステップは、(i)以前の音声入力が特定の音声サービスによって処理されたこと、および(ii)前記音声入力が、前記以前の音声入力受信後の閾値時間内に受信されていることを決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、前記以前の音声入力を処理した前記特定の音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴6)前記音声入力を処理するための音声サービスを識別するステップは、(i)以前の音声入力が特定の音声サービスによって処理されたこと、および(ii)前記音声入力が前記以前の音声入力と同じ種類の動作を対象としていることを決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、前記以前の音声入力を処理した前記特定の音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴7)前記音声入力を処理するための音声サービスを識別するステップは、前記音声入力がメディア再生コマンドを含んでいると決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、メディア再生コマンドを処理するように構成されている特定の音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴8)前記音声入力を処理するための音声サービスを識別するステップは、前記音声入力が無線照明デバイスを対象としていると決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、無線照明デバイスを対象とした音声入力を処理するように構成されている特定の音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴9)前記音声入力を処理するための音声サービスを識別するステップは、前記受信した音声データの一部が、任意の特定の音声サービスに対応していない一般的ウェイクワードを表していると決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、前記複数の音声サービスの中からデフォルトの音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴10)前記メディア再生システムは複数のゾーンを含み、前記音声入力を処理するための音声サービスを識別するステップは、前記音声入力が、前記複数のゾーンのうちの特定のゾーンを対象としていると決定するステップと、前記決定に基づいて、前記音声入力を処理するための音声サービスとして、前記メディア再生システムの前記特定のゾーンを対象とした音声入力を処理するように構成されている、特定の音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴11)前記音声入力を処理するための音声サービスを識別するステップは、前記受信した音声データの一部が第1音声サービスに対応する特定のウェイクワードを表していると決定するステップと、前記音声入力を処理するにあたり、前記第1音声サービスが現在利用できないと決定するステップと、前記音声入力を処理するための音声サービスとして、前記第1音声サービスとは異なる第2音声サービスを識別するステップとを含む、特徴1に記載の方法。
(特徴12)前記音声入力は、ウェイクワードを表す第1部分と音声コマンドを表す第2部分とを含み、前記識別された音声サービスに前記音声入力を処理させるステップは、ネットワークインタフェースを介して、前記識別された音声サービスの1つ又は複数のサーバに対して、(i)前記音声入力において少なくとも前記第2部分を示すデータ、および(ii)前記音声コマンドを示すデータの処理を命じるコマンドを送信するステップを含む、特徴1に記載の方法。
(特徴13)1つ又は複数のプロセッサによって実行されて特徴1から12のいずれか一項に記載の方法を実行させる命令を記憶している、有形の非一時的なコンピュータ読取り可能媒体。
(特徴14)特徴1から12のいずれか一項に記載の方法を実行するように構成された、デバイス。
(特徴15)特徴1から12のいずれか一項に記載の方法を実行するように構成された、メディア再生システム。
(特徴16)
ネットワーク化されたマイクロフォンデバイスは、(i)マイクロフォンと、(ii)ネットワークインタフェースと、(iii)1つ又は複数のプロセッサと、(iv)1つ又は複数のプロセッサによって実行されると、ネットワーク化されたマイクロフォンデバイスにある方法を実行させるように動作可能な命令を記憶した有形非一時的コンピュータ可読媒体とを備え、当該方法は、(a)マイクロフォンを介して、音声入力を示す音声データを受信するステップ、(b)メディア再生システムに登録されている複数の音声サービスの中から、音声入力を処理するための音声サービスを識別するステップ、(c)ネットワークインタフェースを介して、識別された音声サービスに音声入力を処理させるステップ、を含む。
(特徴17)
音声竜力を処理するための音声サービスを識別するステップは、(i)受信した音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表すものであることを決定するステップ、(ii)当該特定のウェイクワードに対応する特定の音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、ここで、メディア再生システムに登録されている複数の音声サービスの各々は各ウェイクワードに対応する、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴18)
受信した音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表すものであることを決定するステップは、(i)受信した音声データを用いて、複数の音声サービスの各々に対応するウェイクワード検知アルゴリズムに問合せするステップ、(ii)特定の音声サービスのウェイクワード検知アルゴリズムが、受信した音声データの一部が当該特定の音声サービスに対応する特定のウェイクワードを表すものであることを検知したことを決定するステップ、を含む、特徴17に記載のマイクロフォンデバイス。
(特徴19)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データが、メディア再生システムに登録されている複数の音声サービスのうちの所定の音声サービスに対応する任意のウェイクワードを除外していることを決定するステップ、(ii)当該決定に基づいて、複数の音声サービスのうちのデフォルトの音声サービスを、音声入力を処理するための音声サービスとして識別するステップを含む、特徴16に記載のマイクロフォンデバイス。
(特徴20)
音声入力を処理するための音声サービスを識別するステップは、(i)(a)前の音声入力が特定の音声サービスによって処理されたこと、(b)前の音声入力が受信されてから閾値期間内に次の音声入力が受信されたこと、を決定するステップ、(ii)当該決定に基づいて、当該特定の音声サービスを次の音声入力を処理するための音声サービスとして識別するステップを含む、特徴16に記載のマイクロフォンデバイス。
(特徴21)
音声入力を処理するための音声サービスを識別するステップは、(i)(a)前の音声入力が特定の音声サービスによって処理されたこと、(b)次の音声入力が前の音声入力と同じ種類の動作を対象としていること、を決定するステップ、(ii)当該決定に基づいて、当該特定の音声サービスを次の音声入力を処理するための音声サービスとして識別するステップを含む、特徴16に記載のマイクロフォンデバイス。
(特徴22)
音声入力を処理するための音声サービスを識別するステップは、(i)音声入力がメディア再生コマンドを含むことを決定するステップ、(ii)当該決定に基づいて、メディア再生コマンドを処理するように構成された特定の音声サービスを、当該音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴23)
音声入力を処理するための音声サービスを識別するステップは、(i)音声入力が無線照明デバイスを対象としていると決定するステップ、(ii)当該決定に基づいて、無線照明デバイスを対象とした音声入力を処理するように構成された特定の音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴24)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データの一部が任意の音声サービスに対応しない一般的なウェイクワードを表すものであることを決定するステップ、(ii)当該決定に基づいて、複数の音声サービスのうちのデフォルトの音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴25)
メディア再生システムは複数のゾーンを含み、音声入力を処理するための音声サービスを識別するステップは、(i)音声入力が複数のゾーンのうちの特定のゾーンを対象としていることを決定するステップ、(ii)当該決定に基づいて、当該特定のゾーンを対象とした音声入力を処理するように構成された特定の音声サービスを、音声入力を処理する音声サービスとして識別するステップ、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴26)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データが第1の音声サービスに対応する特定のウェイクワードを表すことを決定するステップ、(ii)第1の音声サービスが音声入力の処理のために現在利用可能でないことを決定するステップ、(iii)第1の音声サービスとは異なる第2の音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴16に記載のマイクロフォンデバイス。
(特徴27)
音声入力は、ウェイクワードを表す第1の部分と、音声コマンドを表す第2の部分とを含み、識別された音声サービスに音声入力を処理させるステップは、識別された音声サービスの1つ又は複数のサーバに対して、ネットワークインタフェースを介して、(i)音声入力の少なくとも第2の部分を表すデータと、(ii)当該データの処理を命じるコマンドとを送信するステップを含む、特徴16に記載のマイクロフォンデバイス。
(特徴28)
有形非一時的コンピュータ可読媒体は、1つ又は複数のプロセッサによって実行されると、ネットワーク化されたマイクロフォンデバイスにある方法を実行させるように動作可能な命令を記憶したており、当該方法は、(i)マイクロフォンを介して、音声入力を示す音声データを受信するステップ、(ii)メディア再生システムに登録されている複数の音声サービスの中から、音声入力を処理するための音声サービスを識別するステップ、(iii)ネットワークインタフェースを介して、識別された音声サービスに音声入力を処理させるステップ、を含む。
(特徴29)
音声竜力を処理するための音声サービスを識別するステップは、(i)受信した音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表すことを決定するステップ、(ii)当該特定のウェイクワードに対応する特定の音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、ここで、メディア再生システムに登録されている複数の音声サービスの各々は各ウェイクワードに対応する、を含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴30)
受信した音声データの一部が特定の音声サービスに対応する特定のウェイクワードを表すものであることを決定するステップは、(i)受信した音声データを用いて、複数の音声サービスの各々に対応するウェイクワード検知アルゴリズムに問合せするステップ、(ii)特定の音声サービスのウェイクワード検知アルゴリズムが、受信した音声データの一部が当該特定の音声サービスに対応する特定のウェイクワードを表すものであることを検知したことを決定するステップ、を含む、特徴29に記載の有形非一時的コンピュータ可読媒体。
(特徴31)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データが、メディア再生システムに登録されている複数の音声サービスのうちの所定の音声サービスに対応する任意のウェイクワードを除外していることを決定するステップ、(ii)当該決定に基づいて、複数の音声サービスのうちのデフォルトの音声サービスを、音声入力を処理するための音声サービスとして識別するステップを含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴32)
音声入力を処理するための音声サービスを識別するステップは、(i)(a)前の音声入力が特定の音声サービスによって処理されたこと、(b)前の音声入力が受信されてから閾値期間内に次の音声入力が受信されたこと、を決定するステップ、(ii)当該決定に基づいて、当該特定の音声サービスを次の音声入力を処理するための音声サービスとして識別するステップを含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴33)
音声入力を処理するための音声サービスを識別するステップは、(i)(a)前の音声入力が特定の音声サービスによって処理されたこと、(b)次の音声入力が前の音声入力と同じ種類の動作を対象としていること、を決定するステップ、(ii)当該決定に基づいて、当該特定の音声サービスを次の音声入力を処理するための音声サービスとして識別するステップを含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴34)
音声入力を処理するための音声サービスを識別するステップは、(i)音声入力がメディア再生コマンドを含むことを決定するステップ、(ii)当該決定に基づいて、メディア再生コマンドを処理するように構成された特定の音声サービスを、当該音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴35)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データの一部が任意の音声サービスに対応しない一般的なウェイクワードを表すものであることを決定するステップ、(ii)当該決定に基づいて、複数の音声サービスのうちのデフォルトの音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴36)
メディア再生システムは複数のゾーンを含み、音声入力を処理するための音声サービスを識別するステップは、(i)音声入力が複数のゾーンのうちの特定のゾーンを対象としていることを決定するステップ、(ii)当該決定に基づいて、当該特定のゾーンを対象とした音声入力を処理するように構成された特定の音声サービスを、音声入力を処理する音声サービスとして識別するステップ、を含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴37)
音声入力を処理するための音声サービスを識別するステップは、(i)受信した音声データが第1の音声サービスに対応する特定のウェイクワードを表すことを決定するステップ、(ii)第1の音声サービスが音声入力の処理のために現在利用可能でないことを決定するステップ、(iii)第1の音声サービスとは異なる第2の音声サービスを、音声入力を処理するための音声サービスとして識別するステップ、を含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴38)
音声入力は、ウェイクワードを表す第1の部分と、音声コマンドを表す第2の部分とを含み、識別された音声サービスに音声入力を処理させるステップは、識別された音声サービスの1つ又は複数のサーバに対して、ネットワークインタフェースを介して、(i)音声入力の少なくとも第2の部分を表すデータと、(ii)当該データの処理を命じるコマンドとを送信するステップを含む、特徴28に記載の有形非一時的コンピュータ可読媒体。
(特徴39)
(i)ネットワーク化されたマイクロフォンデバイスのマイクロフォンを介して、音声入力を示す音声データを受信するステップ、(ii)受信した音声データの一部が、メディア再生システムに登録されている複数の音声サービスのうちの特定の音声サービスに対応する特定のウェイクワードを表すことを決定するステップ、ここで、メディア再生システムに登録されている複数の音声サービスの各々は各ウェイクワードに対応するものである、(iii)ネットワーク化されたマイクロフォンデバイスのネットワークインタフェースを介して、特定の音声サービスに音声入力を処理させるステップ、ここで、特定の音声サービスに音声入力を処理させるステップは、マイクロフォンデバイスのネットワークインタフェースを介して、音声入力を示すデータを特定の音声サービスの1つ又は複数のサーバに送信するステップを含む、方法。
さらに、本明細書での「実施形態」への言及は、その実施形態に関連して記載される特定の特徴、構造、又は特性が、本発明の少なくとも1つの例示的な実施形態に含まれ得ることを意味する。明細書における様々な部分でのこのフレーズの使用は、同じ実施形態を必ずしも言及しておらず、また、他の実施形態と互いに排他的な別個の又は代替的な実施形態でもない。このように、本明細書に記載の実施形態を他の実施形態と組み合わせてもよいことが、明示的および暗示的に当業者によって理解される。
本明細書は、例示的な環境、システム、手順、ステップ、論理ブロック、処理、および他のシンボル表現に関して広く示されており、それらは直接又は間接的にネットワークに接続されるデータ処理デバイスの動作に類似するものである。これらの処理説明および表現は、一般的に当業者によって使用され、それらの仕事の内容を他の当業者に最も効率良く伝えることができる。多くの具体的な内容が、本開示を理解するために提供されている。しかしながら、当業者にとって、本開示の特定の実施形態が特定の、具体的な詳細なしに実施され得ることは理解される。他の例では、周知の方法、手順、コンポーネント、および回路が、実施形態を不必要に曖昧にすることを避けるため、詳細に説明していない。したがって、本開示の範囲は、上記した実施形態よりむしろ添付された特許請求の範囲によって定義される。
添付の特許請求の範囲のいずれかが単にソフトウェアおよび/又はファームウェアへの実装をカバーするように読み取ると、少なくとも1つの例における要素の1つ又は複数は、本明細書では、ソフトウェアおよび/又はファームウェアを記憶する有形の非一時的な記憶媒体、例えば、メモリ、DVD、CD、Blu−ray(登録商標)等を含むことが明確に定められている。

Claims (17)

  1. ネットワークインタフェースと、少なくとも1つのマイクと、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプとを備える再生デバイスのための方法であって、
    少なくとも1つのマイクを介して、1つ又は複数のバッファの中にオーディオを継続的にキャプチャするステップ、
    第1、第2のウェイクワード検出アルゴリズムを用いて、キャプチャしたオーディオを解析するステップ、ここで、第1、第2のウェイクワード検出アルゴリズムは、第1、第2のウェイクワードにそれぞれ関連付けられた第1、第2の音声サービスにそれぞれ対応するものである、
    1のウェイクワード検出アルゴリズムを介して、キャプチャしたオーディオの中に第1のウェイクワードを検出するステップ、
    第1の音声サービスがキャプチャしたオーディオの処理に利用でないことを決定するステップ、
    上記決定に応じて、キャプチャしたオーディオの処理を行う代替の音声サービスを特定するステップ、
    特定した代替の音声サービスに関連付けられた1つ又は複数のサーバへ、キャプチャしたオーディオを送信するステップ、
    キャプチャしたオーディオを送信した後に、ネットワークインタフェースを介して、少なくとも1つの命令を受信するステップ、ここで、少なくとも1つの命令は、キャプチャしたオーディオ内の音声入力に基づくものである、
    少なくとも1つの命令に基づいて、1つ又は複数のアクションを実行するステップ、
    を含む、方法。
  2. 1つ又は複数のアクションは、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプを介して、少なくとも1つの命令に基づいてオーディオを出力するステップを含む、請求項1に記載の方法。
  3. 1つ又は複数のアクションは、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプを介して、受信したオーディオを再生するステップを含む、請求項1又は2に記載の方法。
  4. 少なくとも1つの命令は、少なくとも1つのオーディオトラックを再生する命令を含み、1つ又は複数のアクションは、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプを介して、少なくとも1つのオーディオトラックを受信および再生するステップを含む、請求項1から3のいずれか1つに記載の方法。
  5. 1つ又は複数のアクションは、再生デバイスを備えるメディア再生システムの少なくとも1つの再生設定を修正するステップを含む、請求項1から4のいずれか1つに記載の方法。
  6. オーディオを継続的にキャプチャするステップの前に、
    再生デバイスを第1の音声サービスに登録するステップ、
    その後、コンピューティングデバイスから、再生デバイスを第2の音声サービスに登録する命令を受信するステップ、
    その後、第1、第2の音声サービスに同時に登録された状態となるように、再生デバイスを第2の音声サービスに登録するステップ、
    を含む、請求項1から5のいずれか1つに記載の方法。
  7. コンピューティングデバイスから、再生デバイスを第2の音声サービスに登録する命令を受信するステップは、第2の音声サービスに関連付けられたリモートのコンピューティングデバイスから当該命令を受信するステップを含む、請求項6に記載の方法。
  8. なくとも1つのマイクを介して、1つ又は複数のバッファの中にオーディオをさらにキャプチャするステップ、
    第1、第2のウェイクワード検出アルゴリズムを用いて、さらにキャプチャしたオーディオを解析するステップ、
    第2のウェイクワード検出アルゴリズムを介して、さらにキャプチャしたオーディオデータの中に第2のウェイクワードを検出するステップ、
    をさらに含む、請求項1から7のいずれか1つに記載の方法。
  9. 第2のウェイクワードを検出した後に、第2の音声サービスに関連付けられた1つ又は複数のサーバに、さらにキャプチャしたオーディオを送信するステップ、
    をさらに含む、請求項8に記載の方法。
  10. さらにキャプチャしたオーディオを送信した後に、ネットワークインタフェースを介して、第2の音声サービスから、さらにキャプチャしたオーディオに基づく少なくとも1つの命令を受信するステップ、
    その後、当該命令に基づく1つ又は複数のアクションを実行するステップ、
    をさらに含む、請求項9に記載の方法。
  11. さらにキャプチャしたオーディオはクエリを含み、
    受信した少なくとも1つの命令は、クエリの結果に対応するデータを含み、
    1つ又は複数のアクションは、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプを介して、当該データに基づいてオーディオを再生するステップを含む、請求項10に記載の方法。
  12. さらにキャプチャしたオーディオは、特定のオーディオを再生する音声コマンドを含み、
    受信した少なくとも1つの命令は、少なくとも1つのオーディオトラックを再生する命令を含み、
    1つ又は複数のアクションは、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプを介して、当該オーディオトラックを再生するステップを含む、請求項10に記載の方法。
  13. 第1の音声サービスをデフォルトの音声サービスに割り当てるステップ、
    をさらに含む、請求項1から12のいずれか1つに記載の方法。
  14. 少なくとも1つのマイクを介して、1つ又は複数のバッファの中にオーディオをさらにキャプチャするステップ、
    第1、第2のウェイクワード検出アルゴリズムを用いて、さらにキャプチャしたオーディオを解析するステップ、
    第1のウェイクワード検出アルゴリズムを介して、さらにキャプチャしたオーディオの中に第1のウェイクワードを検出するステップ、
    第1の音声サービスが、さらにキャプチャしたオーディオの処理に利用可能でないか否かを決定するステップ、
    第1の音声サービスが、さらにキャプチャしたオーディオの処理に利用可能であるとの決定に応じて、第1の音声サービスに関連する1つ又は複数のサーバへさらにキャプチャしたオーディオを送信するステップ、
    をさらに含む、請求項1から13のいずれか1つに記載の方法。
  15. 少なくとも1つのマイクを介して、1つ又は複数のバッファの中にオーディオをさらにキャプチャするステップ、
    第1、第2のウェイクワード検出アルゴリズムを用いて、さらにキャプチャしたオーディオを解析するステップ、
    第2のウェイクワード検出アルゴリズムを介して、さらにキャプチャしたオーディオの中に第2のウェイクワードを検出するステップ、
    第2の音声サービスが、さらにキャプチャしたオーディオの処理に利用可能でないことを決定するステップ、
    当該決定に応じて、第1の音声サービスに関連付けられた1つ又は複数のサーバに、さらにキャプチャしたオーディオを送信するステップ、
    その後、第1の音声サービスの1つ又は複数のサーバから、ネットワークインタフェースを介して、さらにキャプチャしたオーディオに基づく少なくとも1つの命令を受信するステップ、
    その後、第1の音声サービスからの少なくとも1つの命令に基づく1つ又は複数のアクションを実行するステップ、
    をさらに含む、請求項1から14のいずれか1つに記載の方法。
  16. 1つ又は複数のプロセッサによって実行されたときに、請求項1から15のいずれか1つに記載の方法を再生デバイスに実行させる命令を記憶した不揮発性コンピュータ読み取り可能記録媒体であって、再生デバイスは、ネットワークインタフェースと、少なくとも1つのマイクと、1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプとを備える、不揮発性コンピュータ読み取り可能記録媒体。
  17. 1つ又は複数のスピーカを駆動するように構成された1つ又は複数のアンプと、
    少なくとも1つのマイクと、
    ネットワークインタフェースと、
    1つ又は複数のプロセッサと、
    1つ又は複数のプロセッサによって実行されたときに、請求項1から15のいずれか1つに記載の方法を再生デバイスに実行させる命令を記憶したデータストレージと、
    を備える、再生デバイス。
JP2019145039A 2016-08-05 2019-08-07 複数の音声サービス Active JP6942763B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021146144A JP7346508B2 (ja) 2016-08-05 2021-09-08 複数の音声サービス
JP2023144387A JP2023164960A (ja) 2016-08-05 2023-09-06 複数の音声サービス

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/229,868 US10115400B2 (en) 2016-08-05 2016-08-05 Multiple voice services
US15/229,868 2016-08-05
JP2019506379A JP6571302B1 (ja) 2016-08-05 2017-08-04 複数の音声サービス

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019506379A Division JP6571302B1 (ja) 2016-08-05 2017-08-04 複数の音声サービス

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021146144A Division JP7346508B2 (ja) 2016-08-05 2021-09-08 複数の音声サービス

Publications (2)

Publication Number Publication Date
JP2020005273A JP2020005273A (ja) 2020-01-09
JP6942763B2 true JP6942763B2 (ja) 2021-09-29

Family

ID=59700180

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2019506379A Active JP6571302B1 (ja) 2016-08-05 2017-08-04 複数の音声サービス
JP2019145039A Active JP6942763B2 (ja) 2016-08-05 2019-08-07 複数の音声サービス
JP2021146144A Active JP7346508B2 (ja) 2016-08-05 2021-09-08 複数の音声サービス
JP2023144387A Pending JP2023164960A (ja) 2016-08-05 2023-09-06 複数の音声サービス

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019506379A Active JP6571302B1 (ja) 2016-08-05 2017-08-04 複数の音声サービス

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2021146144A Active JP7346508B2 (ja) 2016-08-05 2021-09-08 複数の音声サービス
JP2023144387A Pending JP2023164960A (ja) 2016-08-05 2023-09-06 複数の音声サービス

Country Status (5)

Country Link
US (7) US10115400B2 (ja)
EP (2) EP3618064A1 (ja)
JP (4) JP6571302B1 (ja)
CN (2) CN112382303A (ja)
WO (1) WO2018027142A1 (ja)

Families Citing this family (166)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8572513B2 (en) 2009-03-16 2013-10-29 Apple Inc. Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate
US10706096B2 (en) 2011-08-18 2020-07-07 Apple Inc. Management of local and remote media items
US9002322B2 (en) 2011-09-29 2015-04-07 Apple Inc. Authentication with secondary approver
WO2014143776A2 (en) 2013-03-15 2014-09-18 Bodhi Technology Ventures Llc Providing remote interactions with host device using a wireless device
EP4365725A2 (en) 2014-05-30 2024-05-08 Apple Inc. Continuity
EP3400661A4 (en) 2016-01-06 2019-04-24 TVision Insights, Inc. SYSTEMS AND METHODS FOR EVALUATING A SPECTATOR COMMITMENT
US11540009B2 (en) 2016-01-06 2022-12-27 Tvision Insights, Inc. Systems and methods for assessing viewer engagement
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
DK201670622A1 (en) 2016-06-12 2018-02-12 Apple Inc User interfaces for transactions
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) * 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10079015B1 (en) * 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
MX2019009438A (es) * 2017-02-07 2020-02-07 Lutron Tech Co Llc Sistema de control de carga basado en audio.
US10776887B2 (en) * 2017-02-07 2020-09-15 Enseo, Inc. System and method for making reservations in a hospitality establishment
US10839795B2 (en) * 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
WO2018195391A1 (en) * 2017-04-20 2018-10-25 Tvision Insights, Inc. Methods and apparatus for multi-television measurements
US11431836B2 (en) * 2017-05-02 2022-08-30 Apple Inc. Methods and interfaces for initiating media playback
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US20180322869A1 (en) * 2017-05-04 2018-11-08 Unlimiter Mfa Co., Ltd. Voice transmission device and method for executing voice assistant program thereof
CN111343060B (zh) 2017-05-16 2022-02-11 苹果公司 用于家庭媒体控制的方法和界面
US20220279063A1 (en) 2017-05-16 2022-09-01 Apple Inc. Methods and interfaces for home media control
CN111201565A (zh) 2017-05-24 2020-05-26 调节股份有限公司 用于声对声转换的系统和方法
US10599377B2 (en) 2017-07-11 2020-03-24 Roku, Inc. Controlling visual indicators in an audio responsive electronic device, and capturing and providing audio using an API, by native and non-native computing devices and services
US10504511B2 (en) * 2017-07-24 2019-12-10 Midea Group Co., Ltd. Customizable wake-up voice commands
US11145311B2 (en) * 2017-08-02 2021-10-12 Panasonic Intellectual Property Management Co., Ltd. Information processing apparatus that transmits a speech signal to a speech recognition server triggered by an activation word other than defined activation words, speech recognition system including the information processing apparatus, and information processing method
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
KR102384643B1 (ko) * 2017-08-17 2022-04-08 엘지전자 주식회사 전자 장치 및 그 제어 방법
US10777197B2 (en) 2017-08-28 2020-09-15 Roku, Inc. Audio responsive device with play/stop and tell me something buttons
US11062710B2 (en) * 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
TWI639114B (zh) * 2017-08-30 2018-10-21 元鼎音訊股份有限公司 具有智慧語音服務功能之電子裝置及調整輸出聲音之方法
US10904615B2 (en) * 2017-09-07 2021-01-26 International Business Machines Corporation Accessing and analyzing data to select an optimal line-of-sight and determine how media content is distributed and displayed
US11004444B2 (en) * 2017-09-08 2021-05-11 Amazon Technologies, Inc. Systems and methods for enhancing user experience by communicating transient errors
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
JP2019086903A (ja) * 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
US10999733B2 (en) 2017-11-14 2021-05-04 Thomas STACHURA Information security/privacy via a decoupled security accessory to an always listening device
US10872607B2 (en) 2017-11-14 2020-12-22 Thomas STACHURA Information choice and security via a decoupled router with an always listening assistant device
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US20190196779A1 (en) * 2017-12-21 2019-06-27 Harman International Industries, Incorporated Intelligent personal assistant interface system
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US10636416B2 (en) * 2018-02-06 2020-04-28 Wistron Neweb Corporation Smart network device and method thereof
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
US10789940B2 (en) * 2018-03-27 2020-09-29 Lenovo (Singapore) Pte. Ltd. Dynamic wake word identification
EP3564949A1 (en) 2018-04-23 2019-11-06 Spotify AB Activation trigger processing
CN115346525A (zh) * 2018-05-07 2022-11-15 谷歌有限责任公司 验证与数字助理应用交接的代理的操作状态
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10649727B1 (en) * 2018-05-14 2020-05-12 Amazon Technologies, Inc. Wake word detection configuration
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
CA3102093A1 (en) * 2018-06-05 2019-12-12 Voicify, LLC Voice application platform
US10235999B1 (en) 2018-06-05 2019-03-19 Voicify, LLC Voice application platform
US10636425B2 (en) 2018-06-05 2020-04-28 Voicify, LLC Voice application platform
US11437029B2 (en) 2018-06-05 2022-09-06 Voicify, LLC Voice application platform
US10979242B2 (en) * 2018-06-05 2021-04-13 Sap Se Intelligent personal assistant controller where a voice command specifies a target appliance based on a confidence score without requiring uttering of a wake-word
US10803865B2 (en) * 2018-06-05 2020-10-13 Voicify, LLC Voice application platform
EP3815384A1 (en) * 2018-06-28 2021-05-05 Sonos Inc. Systems and methods for associating playback devices with voice assistant services
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US20210280187A1 (en) * 2018-07-03 2021-09-09 Sony Corporation Information processing apparatus and information processing method
JP7000268B2 (ja) * 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
KR102592769B1 (ko) 2018-07-20 2023-10-24 삼성전자주식회사 전자 장치 및 그의 동작 방법
CN108962259B (zh) * 2018-07-25 2021-06-15 联想(北京)有限公司 处理方法及第一电子设备
TWI683306B (zh) * 2018-08-28 2020-01-21 仁寶電腦工業股份有限公司 多語音助理之控制方法
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
CN110867182B (zh) * 2018-08-28 2022-04-12 仁宝电脑工业股份有限公司 多语音助理的控制方法
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
KR102628211B1 (ko) * 2018-08-29 2024-01-23 삼성전자주식회사 전자 장치 및 그 제어 방법
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11152003B2 (en) 2018-09-27 2021-10-19 International Business Machines Corporation Routing voice commands to virtual assistants
US11100926B2 (en) * 2018-09-27 2021-08-24 Coretronic Corporation Intelligent voice system and method for controlling projector by using the intelligent voice system
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11412295B2 (en) * 2018-10-02 2022-08-09 Comcast Cable Communications, Llc Systems and methods for determining usage information
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11348089B2 (en) * 2018-10-26 2022-05-31 Mastercard International Incorporated System and methods for providing audible instructions for performing a transaction
WO2020091454A1 (en) * 2018-10-31 2020-05-07 Samsung Electronics Co., Ltd. Method and apparatus for capability-based processing of voice queries in a multi-assistant environment
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
FR3089035A1 (fr) * 2018-11-27 2020-05-29 Psa Automobiles Sa Procédé d’activation sélective d’assistants personnels virtuels dans un véhicule automobile
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
JP7415952B2 (ja) * 2019-01-16 2024-01-17 ソニーグループ株式会社 応答処理装置及び応答処理方法
US20220108694A1 (en) * 2019-01-28 2022-04-07 Samsung Electronics Co., Ltd. Method and appartaus for supporting voice instructions
EP3921830A4 (en) 2019-02-07 2022-11-02 Thomas Stachura PRIVACY DEVICE FOR SMART SPEAKERS
US11315556B2 (en) * 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
EP3729422B1 (en) * 2019-02-27 2023-08-09 Google LLC Detecting continuing conversations with computing devices
JP2020144274A (ja) * 2019-03-07 2020-09-10 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144275A (ja) * 2019-03-07 2020-09-10 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
EP3709194A1 (en) 2019-03-15 2020-09-16 Spotify AB Ensemble-based data comparison
JP7274901B2 (ja) * 2019-03-25 2023-05-17 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US10904029B2 (en) 2019-05-31 2021-01-26 Apple Inc. User interfaces for managing controllable external devices
US11010121B2 (en) 2019-05-31 2021-05-18 Apple Inc. User interfaces for audio media control
CN117170620A (zh) 2019-05-31 2023-12-05 苹果公司 用于音频媒体控件的用户界面
DK201970533A1 (en) 2019-05-31 2021-02-15 Apple Inc Methods and user interfaces for sharing audio
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
CN110544475B (zh) * 2019-07-08 2022-03-11 三星电子(中国)研发中心 一种多语音助手的实现方法
CN112712803B (zh) * 2019-07-15 2022-02-25 华为技术有限公司 一种语音唤醒的方法和电子设备
US11176939B1 (en) * 2019-07-30 2021-11-16 Suki AI, Inc. Systems, methods, and storage media for performing actions based on utterance of a command
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
CN110474973B (zh) * 2019-08-08 2022-02-08 三星电子(中国)研发中心 一种多设备共享智能引擎的方法、系统和设备
WO2021024466A1 (ja) * 2019-08-08 2021-02-11 三菱電機株式会社 音声対話装置、音声対話方法およびプログラム記録媒体
WO2021030759A1 (en) 2019-08-14 2021-02-18 Modulate, Inc. Generation and detection of watermark for real-time voice conversion
US10614800B1 (en) 2019-08-19 2020-04-07 Voicify, LLC Development of voice and other interaction applications
US10762890B1 (en) 2019-08-19 2020-09-01 Voicify, LLC Development of voice and other interaction applications
US11508365B2 (en) 2019-08-19 2022-11-22 Voicify, LLC Development of voice and other interaction applications
US11094319B2 (en) 2019-08-30 2021-08-17 Spotify Ab Systems and methods for generating a cleaned version of ambient sound
US10827028B1 (en) 2019-09-05 2020-11-03 Spotify Ab Systems and methods for playing media content on a target device
KR20210043107A (ko) 2019-10-11 2021-04-21 삼성전자주식회사 서로 다른 전자 장치들 사이의 통신 방법, 이를 지원하는 서버 및 전자 장치
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11176942B2 (en) * 2019-11-26 2021-11-16 Vui, Inc. Multi-modal conversational agent platform
US11295741B2 (en) * 2019-12-05 2022-04-05 Soundhound, Inc. Dynamic wakewords for speech-enabled devices
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
CN111128125A (zh) * 2019-12-30 2020-05-08 深圳市优必选科技股份有限公司 语音服务配置系统及其语音服务配置方法和装置
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
JP2021117302A (ja) * 2020-01-23 2021-08-10 トヨタ自動車株式会社 エージェントシステム、エージェントサーバおよびエージェントプログラム
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308959B2 (en) 2020-02-11 2022-04-19 Spotify Ab Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices
US11328722B2 (en) 2020-02-11 2022-05-10 Spotify Ab Systems and methods for generating a singular voice audio stream
CN115210692A (zh) * 2020-02-28 2022-10-18 谷歌有限责任公司 用于数字动作执行的接口和模式选择
US11513667B2 (en) 2020-05-11 2022-11-29 Apple Inc. User interface for audio message
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
KR20210147678A (ko) * 2020-05-29 2021-12-07 엘지전자 주식회사 인공 지능 장치
US11893984B1 (en) * 2020-06-22 2024-02-06 Amazon Technologies, Inc. Speech processing system
CN112087847B (zh) * 2020-08-18 2021-09-07 深圳市中天视觉数码科技有限公司 一种用于智能建筑的室内光控系统及其设计方法
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN112165640B (zh) * 2020-09-21 2023-04-14 Vidaa美国公司 一种显示设备
US11392291B2 (en) 2020-09-25 2022-07-19 Apple Inc. Methods and interfaces for media control with dynamic feedback
JP2023546989A (ja) 2020-10-08 2023-11-08 モジュレイト インク. コンテンツモデレーションのためのマルチステージ適応型システム
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US11847378B2 (en) 2021-06-06 2023-12-19 Apple Inc. User interfaces for audio routing
WO2023287477A1 (en) * 2021-07-15 2023-01-19 Arris Enterprises Llc Audio services agent manager
CA3231640A1 (en) * 2021-09-16 2023-03-23 Maria-Jose RAMOS Techniques for re-bonding playback devices
WO2023113877A1 (en) * 2021-12-13 2023-06-22 Google Llc Selecting between multiple automated assistants based on invocation properties
US20230335127A1 (en) * 2022-04-15 2023-10-19 Google Llc Multiple concurrent voice assistants

Family Cites Families (1255)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US999715A (en) 1911-05-31 1911-08-01 Hans Gundersen Flying-machine.
US4941187A (en) 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US4741038A (en) 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPS63301998A (ja) 1987-06-02 1988-12-08 日本電気株式会社 音声認識応答装置
US4974213A (en) 1988-12-16 1990-11-27 Siwecki Thomas L Passive active underwater sound detection apparatus
US5036538A (en) 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5440644A (en) 1991-01-09 1995-08-08 Square D Company Audio distribution system having programmable zoning features
EP0548836B1 (en) 1991-12-20 1997-06-11 Matsushita Electric Industrial Co., Ltd. A bass reproduction speaker apparatus
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JPH0883091A (ja) 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 音声認識装置
US5740260A (en) 1995-05-22 1998-04-14 Presonus L.L.P. Midi to analog sound processor interface
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5857172A (en) 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
JP2002116797A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体
US7174299B2 (en) 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
FR2739736B1 (fr) 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3094900B2 (ja) 1996-02-20 2000-10-03 ヤマハ株式会社 ネットワーク機器およびデータ送受信方法
US6404811B1 (en) 1996-05-13 2002-06-11 Tektronix, Inc. Interactive multimedia system
JP3679526B2 (ja) 1996-10-31 2005-08-03 キヤノン株式会社 画像共有装置、画面制御方法及びコンピュータ可読メモリ
US6469633B1 (en) 1997-01-06 2002-10-22 Openglobe Inc. Remote control of electronic devices
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6611537B1 (en) 1997-05-30 2003-08-26 Centillium Communications, Inc. Synchronous network for digital media streams
US6088459A (en) 1997-10-30 2000-07-11 Hobelsberger; Maximilian Hans Loudspeaker system with simulated baffle for improved base reproduction
US6408078B1 (en) 1997-10-30 2002-06-18 Maximilian Hobelsberger Active reactive acoustical elements
JPH11146071A (ja) * 1997-11-06 1999-05-28 Sharp Corp ドアホンシステム
US6032202A (en) 1998-01-06 2000-02-29 Sony Corporation Of Japan Home audio/video network with two level device control
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US6301603B1 (en) 1998-02-17 2001-10-09 Euphonics Incorporated Scalable audio processing on a heterogeneous processor array
US6953886B1 (en) 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
US6839410B2 (en) 1998-09-01 2005-01-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
JP2002527800A (ja) 1998-10-02 2002-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 会話ブラウザおよび会話システム
US20020116196A1 (en) 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US6243676B1 (en) 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US7130616B2 (en) 2000-04-25 2006-10-31 Simple Devices System and method for providing content, management, and interactivity for client devices
US6256554B1 (en) 1999-04-14 2001-07-03 Dilorenzo Mark Multi-room entertainment system with in-room media player/dispenser
US6414251B1 (en) 1999-04-19 2002-07-02 Breck Colquett Weighing apparatus and method having automatic tolerance analysis and calibration
US7657910B1 (en) 1999-07-26 2010-02-02 E-Cast Inc. Distributed electronic entertainment method and apparatus
GB2352933A (en) 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6542868B1 (en) 1999-09-23 2003-04-01 International Business Machines Corporation Audio notification management system
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6611604B1 (en) 1999-10-22 2003-08-26 Stillwater Designs & Audio, Inc. Ultra low frequency transducer and loud speaker comprising same
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US6522886B1 (en) 1999-11-22 2003-02-18 Qwest Communications International Inc. Method and system for simultaneously sharing wireless communications among multiple wireless handsets
US6219645B1 (en) 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
EP1104968B1 (en) 1999-12-03 2007-02-14 Telefonaktiebolaget LM Ericsson (publ) A method of simultaneously playing back audio files in two telephones
KR20010054622A (ko) 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US20010042107A1 (en) 2000-01-06 2001-11-15 Palm Stephen R. Networked audio player transport protocol and architecture
US7661107B1 (en) 2000-01-18 2010-02-09 Advanced Micro Devices, Inc. Method and apparatus for dynamic allocation of processing resources
JP2004500651A (ja) 2000-01-24 2004-01-08 フリスキット インコーポレイテッド ストリーミングメディアの検索および再生システム
AU2001231115A1 (en) 2000-01-24 2001-07-31 Zapmedia, Inc. System and method for the distribution and sharing of media assets between mediaplayers devices
ATE372625T1 (de) 2000-02-18 2007-09-15 Bridgeco Ag Mehrtor-brücke zur lieferung von netzwerkverbindungen
JP2001236093A (ja) 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US6631410B1 (en) 2000-03-16 2003-10-07 Sharp Laboratories Of America, Inc. Multimedia wired/wireless content synchronization system and method
AU4219601A (en) 2000-03-31 2001-10-15 Classwave Wireless Inc. Dynamic protocol selection and routing of content to mobile devices
GB2363036B (en) 2000-05-31 2004-05-12 Nokia Mobile Phones Ltd Conference call method and apparatus therefor
US20050164664A1 (en) 2000-07-21 2005-07-28 Difonzo Daniel F. Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks
US20040105566A1 (en) 2000-07-27 2004-06-03 International Business Machines Corporation Body set type speaker unit
WO2002023389A1 (en) 2000-09-15 2002-03-21 Robert Fish Systems and methods for translating an item of information using a distal computer
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US20020054685A1 (en) 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US20020072816A1 (en) 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6778869B2 (en) 2000-12-11 2004-08-17 Sony Corporation System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment
US7143939B2 (en) 2000-12-19 2006-12-05 Intel Corporation Wireless music device and method therefor
US20020124097A1 (en) 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
GB2372864B (en) * 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6885989B2 (en) 2001-04-02 2005-04-26 International Business Machines Corporation Method and system for collaborative speech recognition for small-area network
US6757517B2 (en) 2001-05-10 2004-06-29 Chin-Chi Chang Apparatus and method for coordinated music playback in wireless ad-hoc networks
US7136934B2 (en) 2001-06-19 2006-11-14 Request, Inc. Multimedia synchronization method and device
KR100420069B1 (ko) 2001-08-23 2004-02-25 한국과학기술원 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법
US6892083B2 (en) 2001-09-05 2005-05-10 Vocera Communications Inc. Voice-controlled wireless communications system and method
US7756917B2 (en) 2001-09-28 2010-07-13 Baseline, Llc Two wire communication apparatus and method
US7536704B2 (en) 2001-10-05 2009-05-19 Opentv, Inc. Method and apparatus automatic pause and resume of playback for a popup on interactive TV
CA2407123C (en) 2001-10-16 2007-12-18 Audio Products International Corp. Low distortion loudspeaker cone suspension
CA2408045A1 (en) 2001-10-16 2003-04-16 Audio Products International Corp. Loudspeaker with large displacement motional feedback
US7006639B2 (en) 2001-11-20 2006-02-28 Maximilian Hans Hobelsberger Active noise-attenuating duct element
US7103542B2 (en) 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
AU2002361767A1 (en) 2001-12-17 2003-07-09 Becomm Corporation Method and system for synchronization of content rendering
DE10163213A1 (de) 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
US8103009B2 (en) 2002-01-25 2012-01-24 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
US7853341B2 (en) 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP4086280B2 (ja) 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
AU2003216319A1 (en) 2002-02-20 2003-09-09 Meshnetworks, Inc. A system and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity
JP3715584B2 (ja) 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
WO2003093950A2 (en) 2002-05-06 2003-11-13 David Goldberg Localized audio networks and associated digital accessories
AU2003241405B2 (en) 2002-05-09 2008-06-19 Netstreams, Llc Audio network distribution system
US6961423B2 (en) 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
JP3815388B2 (ja) 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
US8060225B2 (en) 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
EP1389853B1 (en) 2002-08-14 2006-03-29 Sony Deutschland GmbH Bandwidth oriented reconfiguration of wireless ad hoc networks
JP2004096520A (ja) 2002-09-02 2004-03-25 Hosiden Corp 音声認識リモコン
JP3910898B2 (ja) 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
US7228275B1 (en) 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
JP2004163590A (ja) 2002-11-12 2004-06-10 Denso Corp 再生装置及びプログラム
KR20040042242A (ko) * 2002-11-13 2004-05-20 삼성전자주식회사 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템
US7295548B2 (en) 2002-11-27 2007-11-13 Microsoft Corporation Method and system for disaggregating audio/visual components
CN100392723C (zh) 2002-12-11 2008-06-04 索夫塔马克斯公司 在稳定性约束下使用独立分量分析的语音处理系统和方法
US7076428B2 (en) 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
KR100668297B1 (ko) 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US6823050B2 (en) 2003-02-13 2004-11-23 International Business Machines Corporation System and method for interfacing with a personal telephony recorder
CN1781291B (zh) 2003-03-03 2011-12-14 美国在线服务公司 用于数字通信的源音频标识符
JP2004347943A (ja) 2003-05-23 2004-12-09 Clarion Co Ltd データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2004354721A (ja) 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
US10613817B2 (en) 2003-07-28 2020-04-07 Sonos, Inc. Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US7961892B2 (en) 2003-07-28 2011-06-14 Texas Instruments Incorporated Apparatus and method for monitoring speaker cone displacement in an audio speaker
US7571014B1 (en) 2004-04-01 2009-08-04 Sonos, Inc. Method and apparatus for controlling multimedia players in a multi-zone system
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US20050031137A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Calibration of an actuator
US20060104451A1 (en) 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
US20050031133A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Process for position indication
US20050031138A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of measuring a cant of an actuator
US20050031134A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using infrared light
US20050031132A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Control system
US20050031139A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using impedance
US20050031140A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using a capacitance measurement
US20050031131A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of modifying dynamics of a system
KR20050023841A (ko) 2003-09-03 2005-03-10 삼성전자주식회사 비선형 왜곡 저감 방법 및 장치
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US20050077843A1 (en) 2003-10-11 2005-04-14 Ronnie Benditt Method and apparatus for controlling a performing arts show by an onstage performer
JP2007509558A (ja) 2003-10-24 2007-04-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 適応型音声再生
DE602004021716D1 (de) 2003-11-12 2009-08-06 Honda Motor Co Ltd Spracherkennungssystem
US7705565B2 (en) 2003-12-31 2010-04-27 Motorola, Inc. Method and system for wireless charging
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4269973B2 (ja) 2004-02-27 2009-05-27 株式会社デンソー カーオーディオシステム
US7483538B2 (en) 2004-03-02 2009-01-27 Ksc Industries, Inc. Wireless and wired speaker hub for a home theater system
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
JP4059214B2 (ja) 2004-03-04 2008-03-12 ソニー株式会社 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム
US10200504B2 (en) 2007-06-12 2019-02-05 Icontrol Networks, Inc. Communication protocols over internet protocol (IP) networks
US7372966B2 (en) 2004-03-19 2008-05-13 Nokia Corporation System for limiting loudspeaker displacement
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7630501B2 (en) 2004-05-14 2009-12-08 Microsoft Corporation System and method for calibration of an acoustic system
US7792311B1 (en) 2004-05-15 2010-09-07 Sonos, Inc., Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7006938B2 (en) 2004-06-16 2006-02-28 Ami Semiconductor, Inc. Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US20060004834A1 (en) 2004-06-30 2006-01-05 Nokia Corporation Dynamic shortcuts
JP2006092482A (ja) 2004-09-27 2006-04-06 Yamaha Corp 音声認識通報装置
US7720232B2 (en) 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
DE102004000043A1 (de) 2004-11-17 2006-05-24 Siemens Ag Verfahren zur selektiven Aufnahme eines Schallsignals
US8386523B2 (en) 2004-12-30 2013-02-26 Texas Instruments Incorporated Random access audio decoder
TWI272860B (en) 2005-01-03 2007-02-01 Lite On Technology Corp Audio receiver and volume reminder method
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
JP5147412B2 (ja) 2005-01-21 2013-02-20 サーティコム コーポレーション 楕円曲線乱数生成
US20060190968A1 (en) 2005-01-31 2006-08-24 Searete Llc, A Limited Corporation Of The State Of The State Of Delaware Sharing between shared audio devices
EP1715669A1 (en) 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
US8594320B2 (en) 2005-04-19 2013-11-26 (Epfl) Ecole Polytechnique Federale De Lausanne Hybrid echo and noise suppression method and device in a multi-channel audio signal
US7991167B2 (en) 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
JP4760160B2 (ja) 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP4804052B2 (ja) * 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US20070018844A1 (en) 2005-07-19 2007-01-25 Sehat Sutardja Two way remote control
JP4285457B2 (ja) 2005-07-20 2009-06-24 ソニー株式会社 音場測定装置及び音場測定方法
EP1912468B1 (en) 2005-07-29 2013-08-14 Panasonic Corporation Loudspeaker device
CN1909625A (zh) 2005-08-05 2007-02-07 鸿富锦精密工业(深圳)有限公司 一种自动调整音量的电视装置及控制方法
US7904300B2 (en) 2005-08-10 2011-03-08 Nuance Communications, Inc. Supporting multiple speech enabled user interface consoles within a motor vehicle
JP2009505321A (ja) 2005-08-19 2009-02-05 グレースノート インコーポレイテッド 再生装置の動作を制御する方法およびシステム
US20070060054A1 (en) 2005-09-15 2007-03-15 Sony Ericsson Mobile Communications Ab Wireless home communication system method and apparatus
JP4519041B2 (ja) 2005-09-20 2010-08-04 ローランド株式会社 楽器用スピーカ装置
JP2009508560A (ja) 2005-09-21 2009-03-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 遠隔に位置するマイクロフォンを使用して音声起動される制御を有する超音波イメージングシステム
WO2007051493A1 (en) 2005-11-07 2007-05-10 Telecom Italia S.P.A. Method for managing a conference call in a telephone network
EP1971183A1 (en) 2005-11-15 2008-09-17 Yamaha Corporation Teleconference device and sound emission/collection device
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
US20070140058A1 (en) 2005-11-21 2007-06-21 Motorola, Inc. Method and system for correcting transducer non-linearities
US7600194B2 (en) 2005-12-02 2009-10-06 Microsoft Corporation Start menu operation for computer user interface
JP2007174233A (ja) 2005-12-21 2007-07-05 Pioneer Electronic Corp スピーカー装置及び携帯電話機
JP4677341B2 (ja) 2005-12-21 2011-04-27 パイオニア株式会社 スピーカー装置及び携帯電話機
US20160066087A1 (en) 2006-01-30 2016-03-03 Ludger Solbach Joint noise suppression and acoustic echo cancellation
KR100762636B1 (ko) 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
JP4422692B2 (ja) 2006-03-03 2010-02-24 日本電信電話株式会社 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体
WO2007103937A2 (en) 2006-03-06 2007-09-13 General Innovations, Inc. Positionally sequenced loudspeaker system
CN101449538A (zh) 2006-04-04 2009-06-03 约翰逊控制技术公司 媒体文件的文本-语法改进
DE602006005228D1 (de) 2006-04-18 2009-04-02 Harman Becker Automotive Sys System und Verfahren zur Mehrkanal-Echokompensation
KR100786108B1 (ko) 2006-05-01 2007-12-18 김준식 음파통신 네트워크
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
DE602006007685D1 (de) 2006-05-10 2009-08-20 Harman Becker Automotive Sys Kompensation von Mehrkanalechos durch Dekorrelation
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
JP4984683B2 (ja) 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US8189765B2 (en) 2006-07-06 2012-05-29 Panasonic Corporation Multichannel echo canceller
US20080037814A1 (en) 2006-08-09 2008-02-14 Jeng-Jye Shau Precision audio speakers
EP2050304B1 (en) 2006-08-10 2018-10-24 Claudio Lastrucci Improvements to systems for acoustic diffusion
US10013381B2 (en) 2006-08-31 2018-07-03 Bose Corporation Media playing from a docked handheld media device
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8473618B2 (en) * 2006-09-19 2013-06-25 Motorola Solutions, Inc. Method and system for processing multiple communication sessions in a communication network
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7747293B2 (en) 2006-10-17 2010-06-29 Marvell Worl Trade Ltd. Display control for cellular phone
TWI435591B (zh) 2006-10-17 2014-04-21 Marvell World Trade Ltd 用於蜂巢電話之顯示控制
WO2008046141A1 (en) 2006-10-17 2008-04-24 Avega Systems Pty Ltd Unification of multimedia devices
US9124650B2 (en) 2006-12-13 2015-09-01 Quickplay Media Inc. Digital rights management in a mobile environment
US8391501B2 (en) 2006-12-13 2013-03-05 Motorola Mobility Llc Method and apparatus for mixing priority and non-priority audio signals
US20080146289A1 (en) 2006-12-14 2008-06-19 Motorola, Inc. Automatic audio transducer adjustments based upon orientation of a mobile communication device
JP2008158868A (ja) 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
US7973857B2 (en) 2006-12-27 2011-07-05 Nokia Corporation Teleconference group formation using context information
US20090013255A1 (en) 2006-12-30 2009-01-08 Matthew John Yuschik Method and System for Supporting Graphical User Interfaces
KR101316750B1 (ko) 2007-01-23 2013-10-08 삼성전자주식회사 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법
TW200833152A (en) 2007-01-31 2008-08-01 Bluepacket Comm Co Ltd Multimedia switching system
JPWO2008096414A1 (ja) 2007-02-06 2010-05-20 パイオニア株式会社 コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体
US20090228919A1 (en) 2007-11-16 2009-09-10 Zott Joseph A Media playlist management and viewing remote control
US20080208594A1 (en) 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
JP4728982B2 (ja) 2007-03-05 2011-07-20 株式会社東芝 利用者と対話する装置、方法およびプログラム
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US20080221884A1 (en) * 2007-03-07 2008-09-11 Cerra Joseph P Mobile environment speech processing facility
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8019076B1 (en) 2007-03-14 2011-09-13 Clearone Communications, Inc. Portable speakerphone device and subsystem utilizing false doubletalk detection
GB0706074D0 (en) 2007-03-28 2007-05-09 Skype Ltd Detection of communication states
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8983051B2 (en) 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8406439B1 (en) 2007-04-04 2013-03-26 At&T Intellectual Property I, L.P. Methods and systems for synthetic audio placement
US8848879B1 (en) 2007-05-03 2014-09-30 Avaya Inc. Customizable notification based on recent communication history
KR100827613B1 (ko) 2007-05-04 2008-05-07 삼성전자주식회사 휴대용 단말기의 마이크 제어 장치 및 방법
US8041565B1 (en) 2007-05-04 2011-10-18 Foneweb, Inc. Precision speech to text conversion
US8032383B1 (en) 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8136040B2 (en) 2007-05-16 2012-03-13 Apple Inc. Audio variance for multiple windows
WO2008144586A1 (en) 2007-05-18 2008-11-27 Smarttouch, Inc. System and method for enhanced communications via small data rate communication systems
US20080291916A1 (en) 2007-05-22 2008-11-27 Bo Xiong Systems and methods for dynamic quality of service
EP1998446A1 (en) 2007-05-31 2008-12-03 Alcatel Lucent Remote control for devices with connectivity to a service delivery platform
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
JP4985151B2 (ja) 2007-06-29 2012-07-25 ヤマハ株式会社 コンテンツ配信システム及びセンタ装置
JP4916394B2 (ja) 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
WO2009020617A1 (en) 2007-08-06 2009-02-12 Orison Corporation System and method for three-dimensional ultrasound imaging
US20090046866A1 (en) 2007-08-15 2009-02-19 Fortemedia, Inc. Apparatus capable of performing acoustic echo cancellation and a method thereof
US8676273B1 (en) 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
US8073125B2 (en) 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US7844724B2 (en) 2007-10-24 2010-11-30 Social Communications Company Automated real-time data stream switching in a shared virtual area communication environment
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8013720B2 (en) 2007-11-02 2011-09-06 Reverse Control, Inc. Signal apparatus for facilitating safe backup of vehicles
CN101584225B (zh) 2007-11-20 2013-11-06 松下电器产业株式会社 扬声器、视频设备、以及便携式信息处理装置
US9247346B2 (en) 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US20090153289A1 (en) 2007-12-12 2009-06-18 Eric James Hope Handheld electronic devices with bimodal remote control functionality
US9386154B2 (en) 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8473081B2 (en) 2007-12-25 2013-06-25 Personics Holdings, Inc. Method and system for event reminder using an earpiece
WO2009086599A1 (en) 2008-01-07 2009-07-16 Avega Systems Pty Ltd A user interface for managing the operation of networked media playback devices
US9992314B2 (en) 2008-01-24 2018-06-05 Garmin Switzerland Gmbh Automatic device mode switching
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE102008039330A1 (de) 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8072905B2 (en) 2008-02-04 2011-12-06 Sony Ericsson Mobile Communications Ab Intelligent interaction between devices in a local network
US8213598B2 (en) 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression
US8638908B2 (en) 2008-02-28 2014-01-28 Computer Products Introductions, Corp Contextual conversation processing in telecommunication applications
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
US20090248397A1 (en) 2008-03-25 2009-10-01 Microsoft Corporation Service Initiation Techniques
US20090249222A1 (en) 2008-03-25 2009-10-01 Square Products Corporation System and method for simultaneous media presentation
US7516068B1 (en) 2008-04-07 2009-04-07 International Business Machines Corporation Optimized collection of audio for speech recognition
CN101562671A (zh) 2008-04-18 2009-10-21 鸿富锦精密工业(深圳)有限公司 音频设备的音量控制方法及通信装置
JP5423670B2 (ja) 2008-04-30 2014-02-19 日本電気株式会社 音響モデル学習装置および音声認識装置
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8831948B2 (en) 2008-06-06 2014-09-09 At&T Intellectual Property I, L.P. System and method for synthetically generated speech describing media content
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8325909B2 (en) 2008-06-25 2012-12-04 Microsoft Corporation Acoustic echo suppression
US8693663B2 (en) 2008-06-27 2014-04-08 Centurylink Intellectual Property Llc System and method for implementing do-not-disturb during playback of media content
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8505056B2 (en) 2008-07-10 2013-08-06 Apple Inc. Updating properties of remote A/V performance nodes
EP2146519B1 (en) 2008-07-16 2012-06-06 Nuance Communications, Inc. Beamforming pre-processing for speaker localization
US8781833B2 (en) 2008-07-17 2014-07-15 Nuance Communications, Inc. Speech recognition semantic classification training
US8639830B2 (en) 2008-07-22 2014-01-28 Control4 Corporation System and method for streaming audio
US8325938B2 (en) 2008-08-12 2012-12-04 Sony Corporation Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method
JP5206234B2 (ja) 2008-08-27 2013-06-12 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US8676586B2 (en) 2008-09-16 2014-03-18 Nice Systems Ltd Method and apparatus for interaction or discourse analytics
KR20100034229A (ko) 2008-09-23 2010-04-01 삼성전자주식회사 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
KR20210152028A (ko) 2008-11-10 2021-12-14 구글 엘엘씨 멀티센서 음성 검출
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
US8095368B2 (en) 2008-12-04 2012-01-10 At&T Intellectual Property I, L.P. System and method for voice authentication over a computer network
JP5347472B2 (ja) 2008-12-12 2013-11-20 ヤマハ株式会社 遠隔制御装置および遠隔制御システム
US8548812B2 (en) 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
KR101467796B1 (ko) 2009-01-12 2014-12-10 엘지전자 주식회사 이동단말기 및 그 제어 방법
US8351617B2 (en) 2009-01-13 2013-01-08 Fortemedia, Inc. Method for phase mismatch calibration for an array microphone and phase calibration module for the same
US20100179874A1 (en) 2009-01-13 2010-07-15 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons and brands
US20130283169A1 (en) 2012-04-24 2013-10-24 Social Communications Company Voice-based virtual area navigation
US8428758B2 (en) 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
FR2943875A1 (fr) 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
KR101064976B1 (ko) 2009-04-06 2011-09-15 한국과학기술원 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇
US8243949B2 (en) 2009-04-14 2012-08-14 Plantronics, Inc. Network addressible loudspeaker and audio play
EP2420050B1 (en) 2009-04-15 2013-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multichannel echo canceller
US8483398B2 (en) 2009-04-30 2013-07-09 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses
JP5550456B2 (ja) 2009-06-04 2014-07-16 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
JP4820434B2 (ja) 2009-06-08 2011-11-24 レノボ・シンガポール・プライベート・リミテッド マイクロフォンのミュート・コントロール
US20100332236A1 (en) 2009-06-25 2010-12-30 Blueant Wireless Pty Limited Voice-triggered operation of electronic devices
US8625775B2 (en) 2009-08-06 2014-01-07 Hti Ip, L.L.C. Method and system for reducing echo and noise in a vehicle passenger compartment environment
US8478982B2 (en) 2009-08-06 2013-07-02 Broadcom Corporation Media access control security management in physical layer
JP5440053B2 (ja) 2009-09-14 2014-03-12 ソニー株式会社 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
JP5342005B2 (ja) 2009-09-17 2013-11-13 株式会社日立メディコ 超音波探触子及び超音波撮像装置
US20110091055A1 (en) 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
US8600073B2 (en) 2009-11-04 2013-12-03 Cambridge Silicon Radio Limited Wind noise suppression
KR101301535B1 (ko) 2009-12-02 2013-09-04 한국전자통신연구원 하이브리드 번역 장치 및 그 방법
US20110145581A1 (en) 2009-12-14 2011-06-16 Verizon Patent And Licensing, Inc. Media playback across devices
JP5641186B2 (ja) 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
NO332437B1 (no) 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
WO2011091402A1 (en) 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8713571B2 (en) 2010-02-17 2014-04-29 Microsoft Corporation Asynchronous task execution
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9209987B2 (en) 2010-03-02 2015-12-08 Microsoft Technology Licensing, Llc Social media playback
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9514476B2 (en) 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8437339B2 (en) * 2010-04-28 2013-05-07 Hewlett-Packard Development Company, L.P. Techniques to provide integrated voice service management
JP5572445B2 (ja) 2010-04-30 2014-08-13 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
KR101582436B1 (ko) 2010-05-04 2016-01-04 샤잠 엔터테인먼트 리미티드 미디어의 동기화 방법 및 시스템
EP2986034B1 (en) 2010-05-06 2017-05-31 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9736600B2 (en) 2010-05-17 2017-08-15 Iii Holdings 4, Llc Devices and methods for collecting acoustic data
US20110289506A1 (en) 2010-05-18 2011-11-24 Google Inc. Management of computing resources for applications
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8831761B2 (en) 2010-06-02 2014-09-09 Sony Corporation Method for determining a processed audio signal and a handheld device
JP2011259097A (ja) 2010-06-07 2011-12-22 Sony Corp 音声信号処理装置及び音声信号処理方法
US8588849B2 (en) 2010-07-09 2013-11-19 Blackberry Limited System and method for resuming media
US8699723B2 (en) 2010-07-20 2014-04-15 International Business Machines Corporation Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device
US8762144B2 (en) 2010-07-21 2014-06-24 Samsung Electronics Co., Ltd. Method and apparatus for voice activity detection
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9349368B1 (en) 2010-08-05 2016-05-24 Google Inc. Generating an audio notification based on detection of a triggering event
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
KR101450491B1 (ko) 2010-08-27 2014-10-13 인텔 코오퍼레이션 원격 제어형 장치들의 트랜스코더 가능 클라우드
US20120078635A1 (en) * 2010-09-24 2012-03-29 Apple Inc. Voice control system
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
DE112010005918B4 (de) * 2010-10-01 2016-12-22 Mitsubishi Electric Corp. Spracherkennungsvorrichtung
US9240111B2 (en) 2010-10-06 2016-01-19 Microsoft Technology Licensing, Llc Inferring building metadata from distributed sensors
CN103222192B (zh) 2010-10-08 2019-05-07 日本电气株式会社 信号处理设备和信号处理方法
CN103299649A (zh) 2010-10-22 2013-09-11 Dts(英属维尔京群岛)有限公司 媒体分配架构
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
EP2456199A3 (en) 2010-11-22 2014-07-16 DDS Newco Inc. Method and systems of dynamically managing content for use by a media playback device
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
US9508358B2 (en) 2010-12-15 2016-11-29 Koninklijke Philips N.V. Noise reduction system with remote noise detector
JP5771002B2 (ja) 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US9241227B2 (en) 2011-01-06 2016-01-19 Bose Corporation Transducer with integrated sensor
US8489398B1 (en) 2011-01-14 2013-07-16 Google Inc. Disambiguation of spoken proper names
JP2012150237A (ja) 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
CN102123188A (zh) 2011-03-03 2011-07-13 曾超宁 移动电话耳麦装置
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
KR20120100514A (ko) 2011-03-04 2012-09-12 삼성전자주식회사 디바이스 그룹핑 방법 및 이를 적용한 서버
US8804977B2 (en) 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
KR101284134B1 (ko) 2011-03-31 2013-07-10 주식회사 원캐스트 하이브리드망 기반의 구내방송 서비스 장치
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9493130B2 (en) 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
KR20120128542A (ko) 2011-05-11 2012-11-27 삼성전자주식회사 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치
US9342516B2 (en) 2011-05-18 2016-05-17 Microsoft Technology Licensing, Llc Media presentation playback annotation
US8320577B1 (en) 2011-05-20 2012-11-27 Google Inc. Method and apparatus for multi-channel audio processing using single-channel components
KR101569863B1 (ko) 2011-05-31 2015-11-27 구글 인코포레이티드 통신 세션에서의 참가자들의 묵음화
US8897465B2 (en) 2011-06-01 2014-11-25 Robert Bosch Gmbh Class D micro-speaker
US8958571B2 (en) 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US8738925B1 (en) 2013-01-07 2014-05-27 Fitbit, Inc. Wireless portable biometric device syncing
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
US9762967B2 (en) 2011-06-14 2017-09-12 Comcast Cable Communications, Llc System and method for presenting content with time based metadata
US8731765B2 (en) 2011-06-28 2014-05-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a torque machine of a powertrain system
US20130018659A1 (en) 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US20130024018A1 (en) 2011-07-22 2013-01-24 Htc Corporation Multimedia control method and multimedia control system
JP5289517B2 (ja) 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
US9148742B1 (en) 2011-07-29 2015-09-29 Google Inc. Proximity detection via audio
EP2555598A1 (en) 2011-08-05 2013-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for generating optical radiation by means of electrically operated pulsed discharges
JP5640918B2 (ja) 2011-08-05 2014-12-17 ブラザー工業株式会社 サーバ装置、対応付け方法、及び携帯機器用プログラム
EP2557813A2 (en) 2011-08-08 2013-02-13 Bang & Olufsen A/S A modular, configurable speaker system and a method of operating it
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
US20130211826A1 (en) 2011-08-22 2013-08-15 Claes-Fredrik Urban Mannby Audio Signals as Buffered Streams of Audio Signals and Metadata
US8750677B2 (en) 2011-08-23 2014-06-10 Microsoft Corporation Method for transferring media playback from a different device
US20130073293A1 (en) 2011-09-20 2013-03-21 Lg Electronics Inc. Electronic device and method for controlling the same
US9094539B1 (en) 2011-09-22 2015-07-28 Amazon Technologies, Inc. Dynamic device adjustments based on determined user sleep state
US8996381B2 (en) 2011-09-27 2015-03-31 Sensory, Incorporated Background speech recognition assistant
US8768707B2 (en) 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9729631B2 (en) 2011-09-30 2017-08-08 Apple Inc. Asynchronous data manipulation
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US8971546B2 (en) 2011-10-14 2015-03-03 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to control audio playback devices
CN103052001B (zh) 2011-10-17 2015-06-24 联想(北京)有限公司 智能设备及其控制方法
GB201118784D0 (en) 2011-10-31 2011-12-14 Omnifone Ltd Djml
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
US8983089B1 (en) 2011-11-28 2015-03-17 Rawles Llc Sound source localization using multiple microphone arrays
CN102567468B (zh) 2011-12-06 2014-06-04 上海聚力传媒技术有限公司 一种用于对媒体文件的播放音量进行调节的方法与设备
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
JP5878987B2 (ja) 2011-12-13 2016-03-08 インテル・コーポレーション キーワードの選択による、接続されたメディア機器におけるチャンネルナビゲーション
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
KR102022318B1 (ko) 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
KR20130083657A (ko) 2012-01-13 2013-07-23 삼성전자주식회사 복수 음성 신호 출력 단자를 가진 단말 및 그의 음성 신호 출력 방법
US9654817B2 (en) 2012-01-27 2017-05-16 Avaya Inc. System and method to synchronize video playback on mobile devices
US9401058B2 (en) 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
WO2013115748A1 (en) 2012-01-30 2013-08-08 Echostar Ukraine, L.L.C. Apparatus, systems and methods for adjusting output audio volume based on user location
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9418658B1 (en) 2012-02-08 2016-08-16 Amazon Technologies, Inc. Configuration of voice controlled assistant
US9947333B1 (en) 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
US9065895B2 (en) 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
EP2632141B1 (en) 2012-02-22 2014-10-15 Dialog Semiconductor B.V. Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
US20130238326A1 (en) 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
US9361878B2 (en) 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
US9198204B2 (en) 2012-04-11 2015-11-24 Google Inc. Apparatus and method for seamless commissioning of wireless devices
EP2839391A4 (en) 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9633186B2 (en) 2012-04-23 2017-04-25 Apple Inc. Systems and methods for controlling output of content based on human recognition data detection
US9117449B2 (en) 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
EP2845189B1 (en) 2012-04-30 2018-09-05 Creative Technology Ltd. A universal reconfigurable echo cancellation system
US8886524B1 (en) 2012-05-01 2014-11-11 Amazon Technologies, Inc. Signal processing based on audio context
US11452153B2 (en) 2012-05-01 2022-09-20 Lisnr, Inc. Pairing and gateway connection using sonic tones
US20130294611A1 (en) 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
US9584909B2 (en) 2012-05-10 2017-02-28 Google Inc. Distributed beamforming based on message passing
US9768829B2 (en) 2012-05-11 2017-09-19 Intel Deutschland Gmbh Methods for processing audio signals and circuit arrangements therefor
US8908879B2 (en) 2012-05-23 2014-12-09 Sonos, Inc. Audio content auditioning
US9633368B2 (en) 2012-05-25 2017-04-25 Apple Inc. Content ranking and serving on a multi-user device or interface
CN103456332A (zh) 2012-05-28 2013-12-18 富泰华工业(深圳)有限公司 音频播放装置及音量调节方法
US20130324031A1 (en) 2012-05-31 2013-12-05 Nokia Corporation Dynamic allocation of audio channel for surround sound systems
CN104541473B (zh) 2012-06-01 2017-09-12 黑莓有限公司 基于概率方法的用于保证多格式音频系统中的锁定的通用同步引擎
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
US10156455B2 (en) 2012-06-05 2018-12-18 Apple Inc. Context-aware voice guidance
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US9301073B2 (en) 2012-06-08 2016-03-29 Apple Inc. Systems and methods for determining the condition of multiple microphones
US9183845B1 (en) 2012-06-12 2015-11-10 Amazon Technologies, Inc. Adjusting audio signals based on a specific frequency range associated with environmental noise characteristics
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9031255B2 (en) 2012-06-15 2015-05-12 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to provide low-latency audio
US10354650B2 (en) 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US9674587B2 (en) 2012-06-26 2017-06-06 Sonos, Inc. Systems and methods for networked music playback including remote add to queue
US9137564B2 (en) 2012-06-28 2015-09-15 Sonos, Inc. Shift to corresponding media in a playback queue
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9384737B2 (en) 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US20140006825A1 (en) 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
US20140003635A1 (en) 2012-07-02 2014-01-02 Qualcomm Incorporated Audio signal processing device calibration
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
US9615171B1 (en) 2012-07-02 2017-04-04 Amazon Technologies, Inc. Transformation inversion to reduce the effect of room acoustics
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
KR101972955B1 (ko) 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US8972762B2 (en) 2012-07-11 2015-03-03 Blackberry Limited Computing devices and methods for resetting inactivity timers on computing devices
US8983844B1 (en) 2012-07-31 2015-03-17 Amazon Technologies, Inc. Transmission of noise parameters for improving automatic speech recognition
US8831957B2 (en) 2012-08-01 2014-09-09 Google Inc. Speech recognition models based on location indicia
KR20190000390A (ko) 2012-08-03 2019-01-02 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 장치 및 조명 장치
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
DK3190587T3 (en) 2012-08-24 2019-01-21 Oticon As Noise estimation for noise reduction and echo suppression in personal communication
US9532153B2 (en) 2012-08-29 2016-12-27 Bang & Olufsen A/S Method and a system of providing information to a user
US9088336B2 (en) 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
US20140075311A1 (en) 2012-09-11 2014-03-13 Jesse William Boettcher Methods and apparatus for controlling audio volume on an electronic device
US20140075306A1 (en) 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US8798598B2 (en) 2012-09-13 2014-08-05 Alain Rossmann Method and system for screencasting Smartphone video game software to online social networks
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US8983383B1 (en) 2012-09-25 2015-03-17 Rawles Llc Providing hands-free service to multiple devices
US9319816B1 (en) 2012-09-26 2016-04-19 Amazon Technologies, Inc. Characterizing environment using ultrasound pilot tones
JP2014071138A (ja) 2012-09-27 2014-04-21 Xing Inc カラオケ装置
US8725125B2 (en) 2012-09-28 2014-05-13 United Video Properties, Inc. Systems and methods for controlling audio playback on portable devices with vehicle equipment
KR102091236B1 (ko) 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
WO2014055312A1 (en) 2012-10-02 2014-04-10 Mh Acoustics, Llc Earphones having configurable microphone arrays
US8484025B1 (en) 2012-10-04 2013-07-09 Google Inc. Mapping an audio utterance to an action using a classifier
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN102902253B (zh) 2012-10-09 2015-07-15 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
US20140108010A1 (en) 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures
US10317373B2 (en) 2012-10-15 2019-06-11 Msi Dfat Llc Direct field acoustic testing in a semi-reverberant enclosure
US9232310B2 (en) 2012-10-15 2016-01-05 Nokia Technologies Oy Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones
DE102012020271A1 (de) 2012-10-17 2014-04-17 Wolfgang Klippel Anordnung und Verfahren zur Steuerung von Wandlern
KR101978688B1 (ko) 2012-10-22 2019-05-15 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
US9319445B2 (en) 2012-10-22 2016-04-19 Spotify Ab Systems and methods for pre-fetching media content
US20150228274A1 (en) 2012-10-26 2015-08-13 Nokia Technologies Oy Multi-Device Speech Recognition
KR20140054643A (ko) 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US10381002B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US8761349B2 (en) 2012-10-31 2014-06-24 Citrix Systems, Inc. Systems and methods of monitoring performance of acoustic echo cancellation
US9275637B1 (en) * 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
KR20140060040A (ko) * 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9275642B2 (en) 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
CN102999161B (zh) * 2012-11-13 2016-03-02 科大讯飞股份有限公司 一种语音唤醒模块的实现方法及应用
US9685171B1 (en) 2012-11-20 2017-06-20 Amazon Technologies, Inc. Multiple-stage adaptive filtering of audio signals
US9070367B1 (en) 2012-11-26 2015-06-30 Amazon Technologies, Inc. Local speech recognition of frequent utterances
US20140149118A1 (en) 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9131298B2 (en) 2012-11-28 2015-09-08 Qualcomm Incorporated Constrained dynamic amplitude panning in collaborative sound systems
WO2014142702A1 (en) * 2013-03-15 2014-09-18 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Selective speech recognition for chat and digital personal assistant systems
US9203045B2 (en) 2012-11-29 2015-12-01 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
WO2014088588A1 (en) 2012-12-07 2014-06-12 Empire Technology Development Llc Personal assistant context building
US20140161263A1 (en) 2012-12-10 2014-06-12 Microsoft Corporation Facilitating recognition of real-time content
US9704486B2 (en) * 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
EP2932650B1 (en) 2012-12-13 2021-01-27 Samsung Electronics Co., Ltd. Apparatus for controlling devices in home network system
US9226071B2 (en) 2012-12-13 2015-12-29 Maxim Integrated Products, Inc. Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker
US9271111B2 (en) 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
US9607046B2 (en) 2012-12-14 2017-03-28 Microsoft Technology Licensing, Llc Probability-based state modification for query dialogues
US9300910B2 (en) 2012-12-14 2016-03-29 Biscotti Inc. Video mail capture, processing and distribution
CN103095911B (zh) * 2012-12-18 2014-12-17 苏州思必驰信息科技有限公司 一种通过语音唤醒寻找手机的方法及系统
KR102102246B1 (ko) 2012-12-18 2020-04-22 삼성전자주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
US9098467B1 (en) 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
US9047857B1 (en) 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
US20150338917A1 (en) 2012-12-26 2015-11-26 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
US9620115B2 (en) 2013-01-03 2017-04-11 Telenav, Inc. Content delivery system with barge-in mechanism and method of operation thereof
KR102051588B1 (ko) 2013-01-07 2019-12-03 삼성전자주식회사 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치
US9318125B2 (en) 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
JP2014137590A (ja) 2013-01-18 2014-07-28 Yoji Fukinuki 音楽コンテンツ配信方法
US9646605B2 (en) 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US20140215332A1 (en) 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
US9818407B1 (en) 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
TWI593294B (zh) 2013-02-07 2017-07-21 晨星半導體股份有限公司 收音系統與相關方法
US9300266B2 (en) 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
US9237384B2 (en) 2013-02-14 2016-01-12 Sonos, Inc. Automatic configuration of household playback devices
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9172747B2 (en) 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
US9195432B2 (en) 2013-02-26 2015-11-24 Sonos, Inc. Pre-caching of audio content
WO2014132167A1 (en) 2013-02-26 2014-09-04 Koninklijke Philips N.V. Method and apparatus for generating a speech signal
CN104010251B (zh) 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音系统与相关方法
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9460715B2 (en) 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US20140258292A1 (en) 2013-03-05 2014-09-11 Clip Interactive, Inc. Apparatus, system, and method for integrating content and content services
JP6429465B2 (ja) 2013-03-07 2018-11-28 株式会社半導体エネルギー研究所 装置及びその作製方法
JP6326071B2 (ja) 2013-03-07 2018-05-16 アップル インコーポレイテッド 部屋およびプログラム反応型ラウドスピーカシステム
US9349386B2 (en) * 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9161126B2 (en) 2013-03-08 2015-10-13 Cirrus Logic, Inc. Systems and methods for protecting a speaker
CN105122844B (zh) 2013-03-11 2018-09-21 苹果公司 用于在整个指向性范围内保持扬声器的音色恒定性的方法、系统和音频接收器
TWI533686B (zh) 2013-03-11 2016-05-11 緯創資通股份有限公司 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體
CN104053088A (zh) 2013-03-11 2014-09-17 联想(北京)有限公司 一种麦克风阵列调整方法、麦克风阵列及电子设备
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US9173021B2 (en) 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
KR20140111859A (ko) 2013-03-12 2014-09-22 삼성전자주식회사 콘텐트 공유 방법 및 이를 위한 디바이스
EP3709293A1 (en) 2013-03-12 2020-09-16 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
WO2014165032A1 (en) 2013-03-12 2014-10-09 Aawtend, Inc. Integrated sensor-array processor
US9060052B2 (en) 2013-03-13 2015-06-16 Accusonus S.A. Single channel, binaural and multi-channel dereverberation
KR101571338B1 (ko) 2013-03-13 2015-11-24 삼성전자주식회사 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치
JP6013951B2 (ja) 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法
US20140274185A1 (en) 2013-03-14 2014-09-18 Aliphcom Intelligence device connection for wireless media ecosystem
KR102152754B1 (ko) 2013-03-14 2020-09-07 삼성전자주식회사 블루루스 디바이스에서 통신 연결 방법 및 그 장치
AU2014243797B2 (en) 2013-03-14 2016-05-19 Apple Inc. Adaptive room equalization using a speaker and a handheld listening device
US8898063B1 (en) 2013-03-15 2014-11-25 Mark Sykes Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form
US9201865B2 (en) 2013-03-15 2015-12-01 Bao Tran Automated assistance for user request that determines semantics by domain, task, and parameter
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
US9626436B2 (en) 2013-03-15 2017-04-18 Spotify Ab Systems, methods, and computer readable medium for generating playlists
US20140278933A1 (en) 2013-03-15 2014-09-18 F. Gavin McMillan Methods and apparatus to measure audience engagement with media
US9888316B2 (en) 2013-03-21 2018-02-06 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
KR102233619B1 (ko) 2013-03-26 2021-03-30 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기, 및 조명 장치
JP6300589B2 (ja) 2013-04-04 2018-03-28 株式会社半導体エネルギー研究所 半導体装置の作製方法
US9689960B1 (en) 2013-04-04 2017-06-27 Amazon Technologies, Inc. Beam rejection in multi-beam microphone systems
WO2014161091A1 (en) 2013-04-04 2014-10-09 Rand James S Unified communications system and method
JP6198432B2 (ja) 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
US20140310614A1 (en) 2013-04-15 2014-10-16 Chacha Search, Inc Method and system of increasing user interaction
US9875494B2 (en) 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
US9501533B2 (en) 2013-04-16 2016-11-22 Sonos, Inc. Private queue for a media playback system
US9304736B1 (en) 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
US9390716B2 (en) 2013-04-19 2016-07-12 Panasonic Intellectual Property Corporation Of America Control method for household electrical appliance, household electrical appliance control system, and gateway
US9491033B1 (en) 2013-04-22 2016-11-08 Amazon Technologies, Inc. Automatic content transfer
US9936290B2 (en) 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
KR102230139B1 (ko) 2013-05-17 2021-03-18 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 조명 장치, 발광 장치, 및 전자 기기
WO2014189486A1 (en) 2013-05-20 2014-11-27 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
US9472201B1 (en) 2013-05-22 2016-10-18 Google Inc. Speaker localization by means of tactile input
US20140358535A1 (en) 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US9390708B1 (en) 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US10715973B2 (en) 2013-05-29 2020-07-14 Sonos, Inc. Playback queue control transition
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
US20140357248A1 (en) 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US9438193B2 (en) 2013-06-05 2016-09-06 Sonos, Inc. Satellite volume control
US20140365225A1 (en) 2013-06-05 2014-12-11 DSP Group Ultra-low-power adaptive, user independent, voice triggering schemes
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9654073B2 (en) 2013-06-07 2017-05-16 Sonos, Inc. Group volume control
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200887A1 (en) 2013-06-09 2014-12-18 Apple Inc. Bluetooth alert notification service
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US8953778B2 (en) 2013-06-17 2015-02-10 Avaya Inc. Real-time intelligent mute interactive features
US9100618B2 (en) 2013-06-17 2015-08-04 Spotify Ab System and method for allocating bandwidth between media streams
US9324322B1 (en) 2013-06-18 2016-04-26 Amazon Technologies, Inc. Automatic volume attenuation for speech enabled devices
US9494683B1 (en) 2013-06-18 2016-11-15 Amazon Technologies, Inc. Audio-based gesture detection
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9640179B1 (en) 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
WO2014210429A1 (en) 2013-06-28 2014-12-31 Harman International Industries, Inc. Wireless control of linked devices
US9298415B2 (en) 2013-07-09 2016-03-29 Sonos, Inc. Systems and methods to provide play/pause content
US20150019201A1 (en) 2013-07-09 2015-01-15 Stanley F. Schoenbach Real-time interpreting systems and methods
US9396727B2 (en) 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
US9293480B2 (en) 2013-07-10 2016-03-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and display device including the semiconductor device
CN110096253B (zh) * 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
DE102014109122A1 (de) 2013-07-12 2015-01-15 Gm Global Technology Operations, Llc Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
WO2015009748A1 (en) 2013-07-15 2015-01-22 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
US9445196B2 (en) 2013-07-24 2016-09-13 Mh Acoustics Llc Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation
US9772994B2 (en) 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9666187B1 (en) 2013-07-25 2017-05-30 Google Inc. Model for enabling service providers to address voice-activated commands
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US9418651B2 (en) 2013-07-31 2016-08-16 Google Technology Holdings LLC Method and apparatus for mitigating false accepts of trigger phrases
WO2015017303A1 (en) 2013-07-31 2015-02-05 Motorola Mobility Llc Method and apparatus for adjusting voice recognition processing based on noise characteristics
US10186262B2 (en) 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
US9565497B2 (en) 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
DE102013012811B4 (de) 2013-08-01 2024-02-22 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler
US10873997B2 (en) 2013-08-01 2020-12-22 Fong-Min Chang Voice controlled artificial intelligent smart illumination device
WO2015026933A2 (en) 2013-08-21 2015-02-26 Honeywell International Inc. Devices and methods for interacting with an hvac controller
US9940927B2 (en) 2013-08-23 2018-04-10 Nuance Communications, Inc. Multiple pass automatic speech recognition methods and apparatus
US9190043B2 (en) 2013-08-27 2015-11-17 Bose Corporation Assisting conversation in noisy environments
US9514747B1 (en) 2013-08-28 2016-12-06 Amazon Technologies, Inc. Reducing speech recognition latency
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
KR20160048960A (ko) 2013-08-30 2016-05-04 후아웨이 테크놀러지 컴퍼니 리미티드 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템
JP6037026B2 (ja) 2013-09-11 2016-11-30 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
US9672812B1 (en) 2013-09-18 2017-06-06 Amazon Technologies, Inc. Qualifying trigger expressions in speech-based systems
US9516081B2 (en) 2013-09-20 2016-12-06 Amazon Technologies, Inc. Reduced latency electronic content system
US9848260B2 (en) 2013-09-24 2017-12-19 Nuance Communications, Inc. Wearable communication enhancement device
US9668052B2 (en) 2013-09-25 2017-05-30 Google Technology Holdings LLC Audio routing system for routing audio data to and from a mobile device
US9355555B2 (en) 2013-09-27 2016-05-31 Sonos, Inc. System and method for issuing commands in a media playback system
US9443527B1 (en) 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
CN103546616A (zh) 2013-09-30 2014-01-29 深圳市同洲电子股份有限公司 一种调节音量的方法及装置
US9288596B2 (en) 2013-09-30 2016-03-15 Sonos, Inc. Coordinator device for paired or consolidated players
KR102114219B1 (ko) 2013-10-10 2020-05-25 삼성전자주식회사 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9633671B2 (en) 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
TWI642170B (zh) 2013-10-18 2018-11-21 半導體能源研究所股份有限公司 顯示裝置及電子裝置
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
US9818061B1 (en) 2013-10-22 2017-11-14 Lumin, LLC Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment
WO2015060867A1 (en) 2013-10-25 2015-04-30 Intel Corporation Techniques for preventing voice replay attacks
EP3796678A1 (en) 2013-11-05 2021-03-24 Oticon A/s A binaural hearing assistance system allowing the user to modify a location of a sound source
JP2015090570A (ja) 2013-11-06 2015-05-11 ソニー株式会社 情報処理装置および制御方法
US10311482B2 (en) 2013-11-11 2019-06-04 At&T Intellectual Property I, Lp Method and apparatus for adjusting a digital assistant persona
US8775191B1 (en) 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
JP6236303B2 (ja) * 2013-11-26 2017-11-22 株式会社デンソーアイティーラボラトリ 制御装置、制御方法およびプログラム
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9704478B1 (en) 2013-12-02 2017-07-11 Amazon Technologies, Inc. Audio output masking for improved automatic speech recognition
US9373321B2 (en) 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
CN104143326B (zh) 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
US8768712B1 (en) 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
US8719039B1 (en) * 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
US10720153B2 (en) 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
US10055190B2 (en) 2013-12-16 2018-08-21 Amazon Technologies, Inc. Attribute-based audio channel arbitration
US9378651B2 (en) 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
US9721570B1 (en) 2013-12-17 2017-08-01 Amazon Technologies, Inc. Outcome-oriented dialogs on a speech recognition platform
US10224056B1 (en) 2013-12-17 2019-03-05 Amazon Technologies, Inc. Contingent device actions during loss of network connectivity
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
GB2524222B (en) 2013-12-18 2018-07-18 Cirrus Logic Int Semiconductor Ltd Activating speech processing
US9899021B1 (en) 2013-12-20 2018-02-20 Amazon Technologies, Inc. Stochastic modeling of user interactions with a detection system
US9099974B2 (en) 2013-12-20 2015-08-04 Vmware, Inc. Volume redirection
US20150179181A1 (en) 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
WO2015094369A1 (en) 2013-12-20 2015-06-25 Intel Corporation Transition from low power always listening mode to high power speech recognition mode
EP2890160B1 (en) 2013-12-24 2019-08-14 Nxp B.V. Loudspeaker controller
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
US8938394B1 (en) 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
US9443516B2 (en) 2014-01-09 2016-09-13 Honeywell International Inc. Far-field speech recognition systems and methods
WO2015105788A1 (en) 2014-01-10 2015-07-16 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US9300647B2 (en) 2014-01-15 2016-03-29 Sonos, Inc. Software application and zones
US9288597B2 (en) 2014-01-20 2016-03-15 Sony Corporation Distributed wireless speaker system with automatic configuration determination when new speakers are added
WO2015112137A1 (en) 2014-01-22 2015-07-30 Pearl Capital Developments Llc Coordinated hand-off of audio data transmission
US9356882B2 (en) 2014-02-04 2016-05-31 Printeron Inc. Streamlined system for the transmission of network resource data
US9443876B2 (en) 2014-02-05 2016-09-13 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module
US9929368B2 (en) 2014-02-06 2018-03-27 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, lighting device, and electronic appliance
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
TWI658597B (zh) 2014-02-07 2019-05-01 日商半導體能源研究所股份有限公司 半導體裝置
US9318112B2 (en) 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
FR3018024B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
JP6289936B2 (ja) 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
FR3018025B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
US9408008B2 (en) 2014-02-28 2016-08-02 Sonos, Inc. Playback zone representations
US10015593B2 (en) 2014-03-03 2018-07-03 University Of Utah Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
EP3739460A1 (en) 2014-03-03 2020-11-18 Sony Corporation Information processing apparatus, information processing method, and program
US9489171B2 (en) 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
US9679054B2 (en) 2014-03-05 2017-06-13 Sonos, Inc. Webpage media playback
US10599287B2 (en) 2014-03-11 2020-03-24 Sonos, Inc. Group volume control
US9640669B2 (en) 2014-03-13 2017-05-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9226062B2 (en) 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
US10514747B2 (en) 2014-03-24 2019-12-24 Silicon Laboratories Inc. Low-power communication apparatus with wakeup detection and associated methods
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US9648564B1 (en) 2014-03-26 2017-05-09 Amazon Technologies, Inc. Wake-up management for mobile devices
US9916839B1 (en) 2014-03-27 2018-03-13 Amazon Technologies, Inc. Shared audio functionality based on device grouping
US9431021B1 (en) 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
KR102146462B1 (ko) 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US9547468B2 (en) 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
US8874448B1 (en) 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
EP2930716B1 (en) 2014-04-07 2018-10-31 Samsung Electronics Co., Ltd Speech recognition using electronic device and server
US9560437B2 (en) 2014-04-08 2017-01-31 Doppler Labs, Inc. Time heuristic audio control
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
DE102014005381B3 (de) 2014-04-11 2014-12-11 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler
US20150302856A1 (en) 2014-04-17 2015-10-22 Qualcomm Incorporated Method and apparatus for performing function by speech input
US20150334471A1 (en) 2014-05-15 2015-11-19 Echostar Technologies L.L.C. Multiple simultaneous audio video data decoding
WO2015178950A1 (en) 2014-05-19 2015-11-26 Tiskerling Dynamics Llc Directivity optimized sound reproduction
CN106465458B (zh) 2014-05-23 2019-12-13 三星电子株式会社 用于提供通知的方法和设备
US9860289B2 (en) 2014-05-23 2018-01-02 Radeeus, Inc. Multimedia digital content retrieval, matching, and syncing systems and methods of using the same
US9900723B1 (en) 2014-05-28 2018-02-20 Apple Inc. Multi-channel loudspeaker matching using variable directivity
US9715875B2 (en) * 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
TWI777568B (zh) 2014-05-30 2022-09-11 日商半導體能源研究所股份有限公司 發光元件,發光裝置,電子裝置以及照明裝置
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US9720642B2 (en) 2014-06-04 2017-08-01 Sonos, Inc. Prioritizing media content requests
US20150355818A1 (en) 2014-06-04 2015-12-10 Sonos, Inc. Continuous Playback Queue
US10624612B2 (en) 2014-06-05 2020-04-21 Chikayoshi Sumi Beamforming method, measurement and imaging instruments, and communication instruments
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
CN104092936B (zh) 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
US20150363061A1 (en) 2014-06-13 2015-12-17 Autonomic Controls, Inc. System and method for providing related digital content
US9767159B2 (en) 2014-06-13 2017-09-19 Google Inc. Ranking search results
US9520139B2 (en) 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
US9589556B2 (en) 2014-06-19 2017-03-07 Yang Gao Energy adjustment of acoustic echo replica signal for speech enhancement
US20150373100A1 (en) 2014-06-19 2015-12-24 Pavel KRAVETS Context sharing between different clients
US9766702B2 (en) 2014-06-19 2017-09-19 Apple Inc. User detection by a computing device
US9697828B1 (en) 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
US20150371628A1 (en) 2014-06-23 2015-12-24 Harman International Industries, Inc. User-adapted speech recognition
US10152987B2 (en) 2014-06-23 2018-12-11 Google Llc Remote invocation of mobile device actions
US9632748B2 (en) 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9691379B1 (en) 2014-06-26 2017-06-27 Amazon Technologies, Inc. Selecting from multiple content sources
US9368105B1 (en) * 2014-06-26 2016-06-14 Amazon Technologies, Inc. Preventing false wake word detections with a voice-controlled device
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US9335819B1 (en) 2014-06-26 2016-05-10 Audible, Inc. Automatic creation of sleep bookmarks in content items
US9398392B2 (en) 2014-06-30 2016-07-19 Microsoft Technology Licensing, Llc Audio calibration and adjustment
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US11330100B2 (en) 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
US9374634B2 (en) 2014-07-10 2016-06-21 Nxp B.V. System for controlling displacement of a loudspeaker
US9467737B2 (en) 2014-07-14 2016-10-11 Sonos, Inc. Zone group control
JP2016024212A (ja) 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN104155938B (zh) 2014-07-21 2018-01-09 惠州Tcl移动通信有限公司 一种家居设备管理方法及系统
US10209947B2 (en) 2014-07-23 2019-02-19 Sonos, Inc. Device grouping
US9671997B2 (en) 2014-07-23 2017-06-06 Sonos, Inc. Zone grouping
US9263042B1 (en) 2014-07-25 2016-02-16 Google Inc. Providing pre-computed hotword models
KR20160017253A (ko) 2014-08-01 2016-02-16 삼성전자주식회사 디스플레이 구동용 집적 회로 칩
US9874997B2 (en) 2014-08-08 2018-01-23 Sonos, Inc. Social playback queues
US9548066B2 (en) 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
US20160055847A1 (en) 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
US9769552B2 (en) 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
JP6118838B2 (ja) 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
KR20160026317A (ko) 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
US9560050B2 (en) 2014-09-08 2017-01-31 At&T Intellectual Property I, L.P System and method to share a resource or a capability of a device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9354687B2 (en) 2014-09-11 2016-05-31 Nuance Communications, Inc. Methods and apparatus for unsupervised wakeup with time-correlated acoustic events
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9747011B2 (en) 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US9548053B1 (en) 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
US10645130B2 (en) 2014-09-24 2020-05-05 Sonos, Inc. Playback updates
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
GB2525051B (en) 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
JP6624368B2 (ja) 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
US9641919B1 (en) 2014-09-30 2017-05-02 Amazon Technologies, Inc. Audio assemblies for electronic devices
US9681228B2 (en) 2014-09-30 2017-06-13 Apple Inc. Capacitive position sensing for transducers
US9009805B1 (en) 2014-09-30 2015-04-14 Google Inc. Method and system for provisioning an electronic device
KR102342623B1 (ko) * 2014-10-01 2021-12-22 엑스브레인, 인크. 음성 및 연결 플랫폼
US10817672B2 (en) 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR102287943B1 (ko) 2014-10-14 2021-08-09 삼성전자주식회사 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법
EP3010251B1 (en) 2014-10-15 2019-11-13 Nxp B.V. Audio system
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary
US11115704B2 (en) 2014-10-30 2021-09-07 Verizon Patent And Licensing Inc. Media channel navigation user interface systems and methods
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10368121B2 (en) 2014-11-07 2019-07-30 Roku, Inc. System and method for collecting data
US9699550B2 (en) 2014-11-12 2017-07-04 Qualcomm Incorporated Reduced microphone power-up latency
US20160134982A1 (en) 2014-11-12 2016-05-12 Harman International Industries, Inc. System and method for estimating the displacement of a speaker cone
JP2016095383A (ja) 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US10116748B2 (en) 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US9992596B2 (en) 2014-11-28 2018-06-05 Audera Acoustics Inc. High displacement acoustic transducer systems
US9812126B2 (en) 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
US10192549B2 (en) 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
US10126406B2 (en) 2014-12-02 2018-11-13 Qualcomm Incorporated Method and apparatus for performing ultrasonic presence detection
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US9779725B2 (en) 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
US9661105B2 (en) 2014-12-11 2017-05-23 Wand Labs, Inc. Virtual assistant system to enable actionable messaging
US9813812B2 (en) 2014-12-12 2017-11-07 Analog Devices Global Method of controlling diaphragm excursion of electrodynamic loudspeakers
US9552816B2 (en) 2014-12-19 2017-01-24 Amazon Technologies, Inc. Application focus in speech-based systems
CN104575504A (zh) 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
US9560441B1 (en) 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
CN104635539A (zh) 2014-12-26 2015-05-20 东莞市掌商信息科技有限公司 一种智能硬件远程语音安全控制方法及其系统
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
WO2016112113A1 (en) 2015-01-07 2016-07-14 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US9934406B2 (en) 2015-01-08 2018-04-03 Microsoft Technology Licensing, Llc Protecting private information in input understanding system
US9584915B2 (en) 2015-01-19 2017-02-28 Microsoft Technology Licensing, Llc Spatial audio with remote speakers
US20160210110A1 (en) 2015-01-21 2016-07-21 Ford Global Technologies, Llc Audio synchronization between vehicles and mobile devices
CN104581510B (zh) 2015-01-22 2018-01-16 广东欧珀移动通信有限公司 音箱音量设置方法及装置
KR102351366B1 (ko) 2015-01-26 2022-01-14 삼성전자주식회사 음성 인식 방법 및 장치
US9947313B2 (en) 2015-01-26 2018-04-17 William Drewes Method for substantial ongoing cumulative voice recognition error reduction
CN104572009B (zh) 2015-01-28 2018-01-09 合肥联宝信息技术有限公司 一种自适应外界环境的音频控制方法及装置
US9633661B1 (en) 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
GB201501791D0 (en) 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
US20160232451A1 (en) 2015-02-09 2016-08-11 Velocee Ltd. Systems and methods for managing audio content
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
JP6501217B2 (ja) * 2015-02-16 2019-04-17 アルパイン株式会社 情報端末システム
US20160239255A1 (en) 2015-02-16 2016-08-18 Harman International Industries, Inc. Mobile interface for loudspeaker optimization
US20160253050A1 (en) 2015-02-26 2016-09-01 Fingertips Lab, Inc. System and method for audio and tactile based browsing
JPWO2016136062A1 (ja) 2015-02-27 2017-12-07 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9697826B2 (en) 2015-03-27 2017-07-04 Google Inc. Processing multi-channel audio waveforms
US10762894B2 (en) 2015-03-27 2020-09-01 Google Llc Convolutional neural networks
US10192546B1 (en) 2015-03-30 2019-01-29 Amazon Technologies, Inc. Pre-wakeword speech processing
US10034109B2 (en) 2015-04-09 2018-07-24 Audera Acoustics Inc. Acoustic transducer systems with position sensing
US9678707B2 (en) 2015-04-10 2017-06-13 Sonos, Inc. Identification of audio content facilitated by playback device
WO2016165067A1 (en) 2015-04-14 2016-10-20 Motorola Solutions, Inc. Method and apparatus for a volume of a device
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US10178474B2 (en) 2015-04-21 2019-01-08 Google Llc Sound signature database for initialization of noise reduction in recordings
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN104853405B (zh) 2015-05-12 2018-11-30 浙江生辉照明有限公司 智能联网方法及智能设备
KR101807513B1 (ko) 2015-05-13 2017-12-12 한국전자통신연구원 3차원 공간에서 영상정보를 이용한 사용자 의도 분석장치 및 분석방법
KR102623039B1 (ko) 2015-05-15 2024-01-08 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기 및 조명 장치
US10282424B2 (en) 2015-05-19 2019-05-07 Researchgate Gmbh Linking documents using citations
KR20180011134A (ko) 2015-05-21 2018-01-31 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
TWI757234B (zh) 2015-05-21 2022-03-11 日商半導體能源研究所股份有限公司 發光元件、顯示裝置、電子裝置、及照明裝置
US10070237B2 (en) 2015-05-21 2018-09-04 Analog Devices, Inc. Optical and capacitive sensing of electroacoustic transducers
JP2016218852A (ja) 2015-05-22 2016-12-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US9837547B2 (en) 2015-05-22 2017-12-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising oxide conductor and display device including the semiconductor device
EP3099047A1 (en) 2015-05-28 2016-11-30 Nxp B.V. Echo controller
US9706320B2 (en) 2015-05-29 2017-07-11 Sound United, LLC System and method for providing user location-based multi-zone media
US10657949B2 (en) 2015-05-29 2020-05-19 Sound United, LLC System and method for integrating a home media system and other home systems
US9734822B1 (en) 2015-06-01 2017-08-15 Amazon Technologies, Inc. Feedback based beamformed signal selection
US9864571B2 (en) 2015-06-04 2018-01-09 Sonos, Inc. Dynamic bonding of playback devices
US9672821B2 (en) 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
US10249205B2 (en) 2015-06-08 2019-04-02 Novel Effect, Inc. System and method for integrating special effects with a text source
KR102444075B1 (ko) 2015-06-09 2022-09-16 삼성전자주식회사 전자 장치, 주변 기기 및 그 제어 방법
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
WO2016203350A1 (en) 2015-06-17 2016-12-22 Semiconductor Energy Laboratory Co., Ltd. Iridium complex, light-emitting element, display device, electronic device, and lighting device
US20160373909A1 (en) 2015-06-17 2016-12-22 Hive Life, LLC Wireless audio, security communication and home automation
JP6739907B2 (ja) 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
US10025447B1 (en) 2015-06-19 2018-07-17 Amazon Technologies, Inc. Multi-device user interface
KR102317526B1 (ko) 2015-06-25 2021-10-26 엘지전자 주식회사 헤드셋 및 그 제어 방법
US9554210B1 (en) 2015-06-25 2017-01-24 Amazon Technologies, Inc. Multichannel acoustic echo cancellation with unique individual channel estimations
KR20170001173A (ko) 2015-06-25 2017-01-04 엘지전자 주식회사 와치 타입 이동 단말기 및 그의 동작 방법
US9472203B1 (en) 2015-06-29 2016-10-18 Amazon Technologies, Inc. Clock synchronization for multichannel system
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3317878B1 (de) 2015-06-30 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum erzeugen einer datenbank
KR20240035638A (ko) 2015-07-08 2024-03-15 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 장치, 및 조명 장치
US10304440B1 (en) 2015-07-10 2019-05-28 Amazon Technologies, Inc. Keyword spotting using multi-task configuration
CN105101083A (zh) 2015-07-15 2015-11-25 魅族科技(中国)有限公司 室内电子设备的控制方法及装置
US9686625B2 (en) 2015-07-21 2017-06-20 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
KR102655709B1 (ko) 2015-07-21 2024-04-05 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9769563B2 (en) 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
KR102516496B1 (ko) 2015-07-23 2023-04-04 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US20170034263A1 (en) 2015-07-30 2017-02-02 Amp Me Inc. Synchronized Playback of Streamed Audio Content by Multiple Internet-Capable Portable Devices
US10529318B2 (en) 2015-07-31 2020-01-07 International Business Machines Corporation Implementing a classification model for recognition processing
US9691361B2 (en) 2015-08-03 2017-06-27 International Business Machines Corporation Adjusting presentation of content on a display
KR102402512B1 (ko) 2015-08-04 2022-05-27 삼성전자주식회사 외부장치의 음량을 조정하는 전자장치 및 방법
CN105187907A (zh) 2015-08-05 2015-12-23 四川长虹电器股份有限公司 智能电视音量控制系统及控制方法
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10333904B2 (en) 2015-08-08 2019-06-25 Peter J. Tormey Voice access and control
KR102386854B1 (ko) 2015-08-20 2022-04-13 삼성전자주식회사 통합 모델 기반의 음성 인식 장치 및 방법
US10270041B2 (en) 2015-08-28 2019-04-23 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US20180249267A1 (en) 2015-08-31 2018-08-30 Apple Inc. Passive microphone array localizer
US10031719B2 (en) 2015-09-02 2018-07-24 Harman International Industries, Incorporated Audio system with multi-screen application
US10339917B2 (en) 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
US10026399B2 (en) 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
KR20170031392A (ko) 2015-09-11 2017-03-21 삼성전자주식회사 전자 장치, 음향 시스템 및 오디오 출력 방법
CN105206281B (zh) 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
KR20170032096A (ko) 2015-09-14 2017-03-22 삼성전자주식회사 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
CN105204357B (zh) 2015-09-18 2018-02-06 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
US10289734B2 (en) 2015-09-18 2019-05-14 Samsung Electronics Co., Ltd. Entity-type search system
US10706873B2 (en) 2015-09-18 2020-07-07 Sri International Real-time speaker state analytics platform
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
KR102446392B1 (ko) 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
CN105162886B (zh) 2015-09-25 2019-04-12 北京奇艺世纪科技有限公司 一种声音控制方法及装置
US10186276B2 (en) 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
EP3357252B1 (en) 2015-09-28 2023-09-06 Google LLC Time-synchronized, multizone media streaming
JP6536320B2 (ja) 2015-09-28 2019-07-03 富士通株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US9996316B2 (en) 2015-09-28 2018-06-12 Amazon Technologies, Inc. Mediation of wakeword response for multiple devices
US10241754B1 (en) 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
TW202316695A (zh) 2015-09-30 2023-04-16 日商半導體能源研究所股份有限公司 發光元件,顯示裝置,電子裝置,及照明裝置
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
US11025569B2 (en) 2015-09-30 2021-06-01 Apple Inc. Shared content presentation with integrated messaging
KR20170038681A (ko) 2015-09-30 2017-04-07 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9542941B1 (en) 2015-10-01 2017-01-10 Lenovo (Singapore) Pte. Ltd. Situationally suspending wakeup word to enable voice command input
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
US9754580B2 (en) 2015-10-12 2017-09-05 Technologies For Voice Interface System and method for extracting and using prosody features
KR102429260B1 (ko) 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
WO2017063706A1 (en) 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. A sound processing node of an arrangement of sound processing nodes
JP6463710B2 (ja) 2015-10-16 2019-02-06 グーグル エルエルシー ホットワード認識
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
US9747926B2 (en) 2015-10-16 2017-08-29 Google Inc. Hotword recognition
US10453450B2 (en) 2015-10-20 2019-10-22 Bragi GmbH Wearable earpiece voice command control system and method
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105427861B (zh) 2015-11-03 2019-02-15 胡旻波 智能家居协同麦克风语音控制的系统及其控制方法
US9691378B1 (en) 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10863267B2 (en) 2015-11-10 2020-12-08 Savant Systems, Inc. Volume control for audio/video devices
US9990209B2 (en) 2015-11-12 2018-06-05 Microsoft Technology Licensing, Llc Digital assistance device for facilitating multi-stage setup
US10706852B2 (en) * 2015-11-13 2020-07-07 Microsoft Technology Licensing, Llc Confidence features for automated speech recognition arbitration
US10592949B2 (en) 2015-11-13 2020-03-17 [24]7.ai, Inc. Method and apparatus for linking customer interactions with customer messaging platforms
US20170140750A1 (en) 2015-11-17 2017-05-18 Le Holdings (Beijing) Co., Ltd. Method and device for speech recognition
CN105472191B (zh) 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
US11929088B2 (en) 2015-11-20 2024-03-12 Synaptics Incorporated Input/output mode control for audio processing
WO2017090115A1 (ja) 2015-11-25 2017-06-01 三菱電機株式会社 音声対話装置および音声対話方法
US10040423B2 (en) 2015-11-27 2018-08-07 Bragi GmbH Vehicle with wearable for identifying one or more vehicle occupants
US9484030B1 (en) 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9699597B2 (en) 2015-12-07 2017-07-04 Google Inc. Wireless signal forwarding
US9747920B2 (en) 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
US10134388B1 (en) 2015-12-23 2018-11-20 Amazon Technologies, Inc. Word generation for speech recognition
US10311862B2 (en) 2015-12-23 2019-06-04 Rovi Guides, Inc. Systems and methods for conversations with devices about media using interruptions and changes of subjects
CN105679318A (zh) 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
CN105632486B (zh) 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
US9826599B2 (en) 2015-12-28 2017-11-21 Amazon Technologies, Inc. Voice-controlled light switches
US10547942B2 (en) 2015-12-28 2020-01-28 Samsung Electronics Co., Ltd. Control of electrodynamic speaker driver using a low-order non-linear model
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US9992642B1 (en) * 2015-12-29 2018-06-05 Amazon Technologies, Inc. Automated messaging
US9820036B1 (en) 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9813810B1 (en) 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
KR20170086814A (ko) 2016-01-19 2017-07-27 삼성전자주식회사 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
CN105741838B (zh) 2016-01-20 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
KR102392113B1 (ko) 2016-01-20 2022-04-29 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령 처리 방법
US9749731B2 (en) 2016-01-21 2017-08-29 Bose Corporation Sidetone generation using multiple microphones
KR20170091913A (ko) 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치
US9659555B1 (en) 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
WO2017138934A1 (en) 2016-02-10 2017-08-17 Nuance Communications, Inc. Techniques for spatially selective wake-up word recognition and related systems and methods
US9858927B2 (en) 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US9898250B1 (en) 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US10264030B2 (en) * 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
WO2017147936A1 (zh) 2016-03-04 2017-09-08 茹旷 智能家居助手
US10133612B2 (en) 2016-03-17 2018-11-20 Nuance Communications, Inc. Session processing interaction between two or more virtual assistants
US9769420B1 (en) 2016-03-18 2017-09-19 Thomas Lawrence Moses Portable wireless remote monitoring and control systems
US10373612B2 (en) * 2016-03-21 2019-08-06 Amazon Technologies, Inc. Anchored speech detection and speech recognition
US9805714B2 (en) 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
US10365887B1 (en) 2016-03-25 2019-07-30 Amazon Technologies, Inc. Generating commands based on location and wakeword
US10332508B1 (en) 2016-03-31 2019-06-25 Amazon Technologies, Inc. Confidence checking for speech processing and query answering
WO2017174136A1 (en) 2016-04-07 2017-10-12 Sonova Ag Hearing assistance system
US9952827B2 (en) 2016-04-13 2018-04-24 Comcast Cable Communications, Llc Dynamic adjustment of equalization settings of audio components via a sound device profile
EP4030295B1 (en) 2016-04-18 2024-06-05 Google LLC Automated assistant invocation of appropriate agent
US10318236B1 (en) * 2016-05-05 2019-06-11 Amazon Technologies, Inc. Refining media playback
US10447748B2 (en) 2016-05-12 2019-10-15 Apple Inc. Sharing media information between applications on client devices
US20170329397A1 (en) 2016-05-12 2017-11-16 Rovi Guides, Inc. Systems and methods for navigating a media guidance application using gaze control
JP2019518985A (ja) 2016-05-13 2019-07-04 ボーズ・コーポレーションBose Corporation 分散したマイクロホンからの音声の処理
US10149049B2 (en) 2016-05-13 2018-12-04 Bose Corporation Processing speech from distributed microphones
US10187440B2 (en) 2016-05-27 2019-01-22 Apple Inc. Personalization of media streams
US10063965B2 (en) 2016-06-01 2018-08-28 Google Llc Sound source estimation using neural networks
US10079027B2 (en) 2016-06-03 2018-09-18 Nxp B.V. Sound signal detector
US10474419B2 (en) 2016-06-03 2019-11-12 Crestron Electronics, Inc. Audio digital signal processor utilizing a hybrid network architecture
US10235124B2 (en) 2016-06-08 2019-03-19 Google Llc Audio announcement prioritization system
AU2017100581B4 (en) 2016-06-08 2018-02-01 Apple Inc. Intelligent automated assistant for media exploration
US9754605B1 (en) 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
AU2017100486C4 (en) 2016-06-11 2019-09-05 Apple Inc. Intelligent device arbitration and control
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179034B1 (en) 2016-06-12 2017-09-04 Apple Inc Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs
US10212029B2 (en) 2016-06-15 2019-02-19 Microsoft Technology Licensing, Llc Service provisioning in cloud computing systems
WO2017217978A1 (en) 2016-06-15 2017-12-21 Nuance Communications, Inc. Techniques for wake-up word recognition and related systems and methods
US20170364371A1 (en) 2016-06-15 2017-12-21 Microsoft Technology Licensing, Llc Context-Dependent Digital Action-Assistance Tool
KR20170142001A (ko) 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9875740B1 (en) * 2016-06-20 2018-01-23 A9.Com, Inc. Using voice information to influence importance of search result categories
US9749738B1 (en) 2016-06-20 2017-08-29 Gopro, Inc. Synthesizing audio corresponding to a virtual microphone location
ITUA20164622A1 (it) 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10332513B1 (en) 2016-06-27 2019-06-25 Amazon Technologies, Inc. Voice enablement and disablement of speech processing functionality
US10091545B1 (en) 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US9728188B1 (en) 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
KR102471499B1 (ko) 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
EP3270377B1 (en) 2016-07-12 2020-02-19 Dolby Laboratories Licensing Corporation Assessment and adjustment of audio installation
WO2018013564A1 (en) 2016-07-12 2018-01-18 Bose Corporation Combining gesture and voice user interfaces
US10152969B2 (en) * 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US9979680B2 (en) 2016-07-21 2018-05-22 Fujitsu Limited Smart notification scheduling and modality selection
US10621992B2 (en) 2016-07-22 2020-04-14 Lenovo (Singapore) Pte. Ltd. Activating voice assistant based on at least one of user proximity and context
KR102575634B1 (ko) 2016-07-26 2023-09-06 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
CN106028223A (zh) 2016-07-26 2016-10-12 广东欧珀移动通信有限公司 一种智能音箱的控制方法、装置及智能音箱
US20180033429A1 (en) 2016-07-26 2018-02-01 Ford Global Technologies, Llc Extendable vehicle system
US10431211B2 (en) 2016-07-29 2019-10-01 Qualcomm Incorporated Directional processing of far-field audio
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US10115400B2 (en) * 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
US9967382B2 (en) 2016-08-19 2018-05-08 Amazon Technologies, Inc. Enabling voice control of telephone device
CN107767863B (zh) 2016-08-22 2021-05-04 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
US20180061396A1 (en) 2016-08-24 2018-03-01 Knowles Electronics, Llc Methods and systems for keyword detection using keyword repetitions
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US10461953B2 (en) 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10360910B2 (en) 2016-08-29 2019-07-23 Garmin Switzerland Gmbh Automatic speech recognition (ASR) utilizing GPS and sensor data
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10057698B2 (en) 2016-09-02 2018-08-21 Bose Corporation Multiple room communication system and method
JP6577159B1 (ja) 2016-09-06 2019-09-18 ディープマインド テクノロジーズ リミテッド ニューラルネットワークを使用したオーディオの生成
EP3297298B1 (en) 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9972318B1 (en) 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
JP6520878B2 (ja) 2016-09-21 2019-05-29 トヨタ自動車株式会社 音声取得システムおよび音声取得方法
US9942678B1 (en) * 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US10409548B2 (en) 2016-09-27 2019-09-10 Grabango Co. System and method for differentially locating and modifying audio sources
JP2018055259A (ja) 2016-09-27 2018-04-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US9959861B2 (en) 2016-09-30 2018-05-01 Robert Bosch Gmbh System and method for speech recognition
WO2018067350A1 (en) 2016-10-03 2018-04-12 Google Llc. Processing voice commands based on device topology
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
EP3504705B1 (en) 2016-10-03 2022-09-21 Google LLC Multi computational agent performance of tasks
CN107919116B (zh) 2016-10-11 2019-09-13 芋头科技(杭州)有限公司 一种语音激活检测方法及装置
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180122372A1 (en) 2016-10-31 2018-05-03 Soundhound, Inc. Distinguishable open sounds
EP3535645B1 (en) 2016-11-03 2023-07-26 Zimmer US, Inc. Augmented reality therapeutic movement display and gesture analyzer
US10783883B2 (en) 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device
EP3637414B1 (en) 2016-11-07 2024-01-03 Google LLC Recorded media hotword trigger suppression
US10154496B2 (en) 2016-11-10 2018-12-11 Futurewei Technologies, Inc. System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems
US10382806B2 (en) 2016-11-14 2019-08-13 DISH Technologies L.L.C. Apparatus, systems and methods for controlling presentation of content using a multi-media table
US10170110B2 (en) 2016-11-17 2019-01-01 Robert Bosch Gmbh System and method for ranking of hybrid speech recognition results with neural networks
CN106708403A (zh) 2016-11-30 2017-05-24 努比亚技术有限公司 输入滑动操作时同步播放提示音的方法及装置
US10079015B1 (en) 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10186265B1 (en) 2016-12-06 2019-01-22 Amazon Technologies, Inc. Multi-layer keyword detection to avoid detection of keywords in output audio
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10255032B2 (en) 2016-12-13 2019-04-09 EVA Automation, Inc. Wireless coordination of audio sources
US11184764B2 (en) 2016-12-14 2021-11-23 Amzetta Technologies, Llc Methods and systems of establishing communication between devices
CN106531165A (zh) 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
US10339957B1 (en) 2016-12-20 2019-07-02 Amazon Technologies, Inc. Ending communications session based on presence data
US10068573B1 (en) 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
CN106910500B (zh) 2016-12-23 2020-04-17 北京小鸟听听科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
JP7175441B2 (ja) 2016-12-23 2022-11-21 シナプティクス インコーポレイテッド 雑音のある時変環境のための重み付け予測誤差に基づくオンライン残響除去アルゴリズム
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
US10580405B1 (en) 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10276161B2 (en) 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10593328B1 (en) 2016-12-27 2020-03-17 Amazon Technologies, Inc. Voice control of remote device
US10186266B1 (en) 2016-12-28 2019-01-22 Amazon Technologies, Inc. Message playback using a shared device
US10229680B1 (en) 2016-12-29 2019-03-12 Amazon Technologies, Inc. Contextual entity resolution
US10831366B2 (en) 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
KR102412202B1 (ko) 2017-01-03 2022-06-27 삼성전자주식회사 냉장고 및 이의 정보 표시 방법
US10248613B2 (en) 2017-01-10 2019-04-02 Qualcomm Incorporated Data bus activation in an electronic device
US10672387B2 (en) 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US11164570B2 (en) 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
US10306254B2 (en) 2017-01-17 2019-05-28 Seiko Epson Corporation Encoding free view point data in movie data container
KR20180084392A (ko) 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
KR102556840B1 (ko) 2017-01-20 2023-07-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20180085931A (ko) 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
US20180218747A1 (en) 2017-01-28 2018-08-02 Bose Corporation Audio Device Filter Modification
KR20180090586A (ko) 2017-02-03 2018-08-13 삼성전자주식회사 알림을 제공하는 방법 및 그 전자 장치
MX2019009438A (es) 2017-02-07 2020-02-07 Lutron Tech Co Llc Sistema de control de carga basado en audio.
US10762891B2 (en) 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN108446281B (zh) 2017-02-13 2021-03-12 北京嘀嘀无限科技发展有限公司 确定用户亲密度的方法、装置及存储介质
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US20180293221A1 (en) 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
US10839795B2 (en) 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
US10431217B2 (en) 2017-02-15 2019-10-01 Amazon Technologies, Inc. Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point
US10264358B2 (en) 2017-02-15 2019-04-16 Amazon Technologies, Inc. Selection of master device for synchronized audio
CN106921560B (zh) 2017-02-28 2020-06-02 北京小米移动软件有限公司 语音通信方法、装置及系统
US10706843B1 (en) 2017-03-09 2020-07-07 Amazon Technologies, Inc. Contact resolution for communications systems
US10089981B1 (en) 2017-03-09 2018-10-02 Amazon Technologies, Inc. Messaging account disambiguation
US20180262793A1 (en) 2017-03-09 2018-09-13 Google Inc. Reverse Casting from a First Screen Device to a Second Screen Device
US10540961B2 (en) 2017-03-13 2020-01-21 Baidu Usa Llc Convolutional recurrent neural networks for small-footprint keyword spotting
US10074371B1 (en) 2017-03-14 2018-09-11 Amazon Technologies, Inc. Voice control of remote device by disabling wakeword detection
WO2018167948A1 (ja) 2017-03-17 2018-09-20 ヤマハ株式会社 コンテンツ再生機器、方法、及びコンテンツ再生システム
US10600406B1 (en) 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10621980B2 (en) 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
WO2018173293A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法
US11183181B2 (en) * 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107135443B (zh) 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10643609B1 (en) 2017-03-29 2020-05-05 Amazon Technologies, Inc. Selecting speech inputs
US10373630B2 (en) 2017-03-31 2019-08-06 Intel Corporation Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
US10825471B2 (en) 2017-04-05 2020-11-03 Avago Technologies International Sales Pte. Limited Voice energy detection
US11188808B2 (en) 2017-04-11 2021-11-30 Lenovo (Singapore) Pte. Ltd. Indicating a responding virtual assistant from a plurality of virtual assistants
US10748531B2 (en) 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
CN107122158A (zh) 2017-04-14 2017-09-01 北京小米移动软件有限公司 播放信息提示音频的方法及装置、电子设备
KR102068182B1 (ko) 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR102392297B1 (ko) 2017-04-24 2022-05-02 엘지전자 주식회사 전자기기
KR102298947B1 (ko) 2017-04-28 2021-09-08 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10311870B2 (en) 2017-05-10 2019-06-04 Ecobee Inc. Computerized device with voice command input capability
US10013995B1 (en) 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10628484B2 (en) 2017-05-17 2020-04-21 Board Of Trustees Of The University Of Illinois Vibrational devices as sound sensors
US10564928B2 (en) 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
US10403299B2 (en) 2017-06-02 2019-09-03 Apple Inc. Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US10531196B2 (en) 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
US10805370B2 (en) 2017-06-02 2020-10-13 Apple Inc. Alarms for a system of smart media playback devices
US10522146B1 (en) 2019-07-09 2019-12-31 Instreamatic, Inc. Systems and methods for recognizing and performing voice commands during advertisement
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10410635B2 (en) 2017-06-09 2019-09-10 Soundhound, Inc. Dual mode speech recognition
US10983753B2 (en) 2017-06-09 2021-04-20 International Business Machines Corporation Cognitive and interactive sensor based smart home solution
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US10028069B1 (en) 2017-06-22 2018-07-17 Sonos, Inc. Immersive audio in a media playback system
US10950228B1 (en) 2017-06-28 2021-03-16 Amazon Technologies, Inc. Interactive voice controlled entertainment
US11189273B2 (en) 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
US11264019B2 (en) 2017-06-30 2022-03-01 Google Llc Methods, systems, and media for voice-based call operations
US10038419B1 (en) 2017-07-06 2018-07-31 Bose Corporation Last mile equalization
US10687353B2 (en) 2017-07-10 2020-06-16 Qualcomm Incorporated Management of conflicting scheduling commands in wireless networks
US20190013019A1 (en) 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US10310082B2 (en) 2017-07-27 2019-06-04 Quantenna Communications, Inc. Acoustic spatial diagnostics for smart home management
US11205421B2 (en) 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US11424947B2 (en) 2017-08-02 2022-08-23 Lenovo (Singapore) Pte. Ltd. Grouping electronic devices to coordinate action based on context awareness
US11798544B2 (en) 2017-08-07 2023-10-24 Polycom, Llc Replying to a spoken command
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102389041B1 (ko) 2017-08-11 2022-04-21 엘지전자 주식회사 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US10304475B1 (en) 2017-08-14 2019-05-28 Amazon Technologies, Inc. Trigger word based beam selection
US10204624B1 (en) 2017-08-14 2019-02-12 Lenovo (Singapore) Pte. Ltd. False positive wake word
KR102411766B1 (ko) 2017-08-25 2022-06-22 삼성전자주식회사 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US20190066710A1 (en) 2017-08-28 2019-02-28 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US10553235B2 (en) 2017-08-28 2020-02-04 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US10546583B2 (en) 2017-08-30 2020-01-28 Amazon Technologies, Inc. Context-based device arbitration
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10366699B1 (en) 2017-08-31 2019-07-30 Amazon Technologies, Inc. Multi-path calculations for device energy levels
US10911596B1 (en) 2017-08-31 2021-02-02 Amazon Technologies, Inc. Voice user interface for wired communications system
US10847149B1 (en) 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
US10482895B2 (en) 2017-09-01 2019-11-19 Cirrus Logic, Inc. Acoustic echo cancellation (AEC) rate adaptation
US11361763B1 (en) 2017-09-01 2022-06-14 Amazon Technologies, Inc. Detecting system-directed speech
US20190082255A1 (en) 2017-09-08 2019-03-14 Olympus Corporation Information acquiring apparatus, information acquiring method, and computer readable recording medium
JP6571144B2 (ja) 2017-09-08 2019-09-04 シャープ株式会社 監視システム、監視機器、サーバ、および監視方法
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10083006B1 (en) 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
KR102338376B1 (ko) 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
US11314214B2 (en) 2017-09-15 2022-04-26 Kohler Co. Geographic analysis of water conditions
US9973849B1 (en) 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10719507B2 (en) 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10580411B2 (en) 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
US10586534B1 (en) 2017-09-27 2020-03-10 Amazon Technologies, Inc. Voice-controlled device control using acoustic echo cancellation statistics
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11233782B2 (en) 2017-10-04 2022-01-25 Resilience Magnum IP, LLC Single node network connectivity for structure automation functionality
US10897680B2 (en) 2017-10-04 2021-01-19 Google Llc Orientation-based device interface
KR102543693B1 (ko) 2017-10-17 2023-06-16 삼성전자주식회사 전자 장치 및 그의 동작 방법
KR102421255B1 (ko) 2017-10-17 2022-07-18 삼성전자주식회사 음성 신호를 제어하기 위한 전자 장치 및 방법
US10403266B2 (en) 2017-10-18 2019-09-03 Intel Corporation Detecting keywords in audio using a spiking neural network
CN107808670B (zh) 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
US10567515B1 (en) 2017-10-26 2020-02-18 Amazon Technologies, Inc. Speech processing performed with respect to first and second user profiles in a dialog session
JP2019086903A (ja) * 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
CN107832837B (zh) 2017-11-28 2021-09-28 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
US20190163153A1 (en) 2017-11-30 2019-05-30 International Business Machines Corporation Enforcing dynamic volume thresholds of an entertainment device
US10546593B2 (en) 2017-12-04 2020-01-28 Apple Inc. Deep learning driven multi-channel filtering for speech enhancement
US10445365B2 (en) 2017-12-04 2019-10-15 Amazon Technologies, Inc. Streaming radio with personalized content integration
US10510340B1 (en) 2017-12-05 2019-12-17 Amazon Technologies, Inc. Dynamic wakeword detection
US10777189B1 (en) 2017-12-05 2020-09-15 Amazon Technologies, Inc. Dynamic wakeword detection
US20190172452A1 (en) * 2017-12-06 2019-06-06 GM Global Technology Operations LLC External information rendering
EP3958112A1 (en) 2017-12-06 2022-02-23 Google LLC Ducking and erasing audio from nearby devices
CN107919123B (zh) 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
US11182122B2 (en) 2017-12-08 2021-11-23 Amazon Technologies, Inc. Voice control of computing devices
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US20190179611A1 (en) 2017-12-11 2019-06-13 Sonos, Inc. Systems and Methods of Receiving Voice Input
US10425247B2 (en) 2017-12-12 2019-09-24 Rovi Guides, Inc. Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset
US10051600B1 (en) 2017-12-12 2018-08-14 Amazon Technologies, Inc. Selective notification delivery based on user presence detections
US10847137B1 (en) 2017-12-12 2020-11-24 Amazon Technologies, Inc. Trigger word detection using neural network waveform processing
US10374816B1 (en) 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US10540971B2 (en) 2017-12-15 2020-01-21 Blue Jeans Network, Inc. System and methods for in-meeting group assistance using a virtual assistant
US10663313B2 (en) 2017-12-15 2020-05-26 Google Llc Providing traffic warnings to a user based on return journey
JP6752870B2 (ja) 2017-12-18 2020-09-09 ネイバー コーポレーションNAVER Corporation 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム
US11409816B2 (en) 2017-12-19 2022-08-09 Motorola Solutions, Inc. Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information
WO2019129511A1 (en) 2017-12-26 2019-07-04 Robert Bosch Gmbh Speaker identification with ultra-short speech segments for far and near field voice assistance applications
CN111742330B (zh) 2017-12-28 2023-04-04 森田公司 始终开启的关键字检测器
US10614811B2 (en) 2017-12-29 2020-04-07 Intel Corporation Hierarchical speech recognition resolution
EP3692522A4 (en) 2017-12-31 2020-11-11 Midea Group Co., Ltd. METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES
WO2019128541A1 (en) 2017-12-31 2019-07-04 Midea Group Co., Ltd. Method and system for controlling multiple home devices
US9972343B1 (en) 2018-01-08 2018-05-15 Republic Wireless, Inc. Multi-step validation of wakeup phrase processing
US10795332B2 (en) 2018-01-16 2020-10-06 Resilience Magnum IP, LLC Facilitating automating home control
US11475899B2 (en) 2018-01-23 2022-10-18 Cirrus Logic, Inc. Speaker identification
CN108198548B (zh) 2018-01-25 2020-11-20 苏州奇梦者网络科技有限公司 一种语音唤醒方法及其系统
US20190237067A1 (en) 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10157042B1 (en) 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
US11024307B2 (en) 2018-02-08 2021-06-01 Computime Ltd. Method and apparatus to provide comprehensive smart assistant services
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
US10720173B2 (en) 2018-02-21 2020-07-21 Bose Corporation Voice capture processing modified by back end audio processing state
US10425780B1 (en) 2018-02-22 2019-09-24 Amazon Technologies, Inc. Outputting notifications using device groups
US10749828B2 (en) 2018-03-14 2020-08-18 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10491962B2 (en) 2018-03-14 2019-11-26 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10685669B1 (en) 2018-03-20 2020-06-16 Amazon Technologies, Inc. Device selection from audio data
US10440440B1 (en) 2018-03-23 2019-10-08 Rovi Guides, Inc. Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device
US10777203B1 (en) 2018-03-23 2020-09-15 Amazon Technologies, Inc. Speech interface device with caching component
US10755706B2 (en) 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
US10446169B1 (en) 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
US11151991B2 (en) 2018-03-30 2021-10-19 Verizon Media Inc. Electronic message transmission
WO2019195799A1 (en) 2018-04-05 2019-10-10 Synaptics Incorporated Context-aware control for smart devices
WO2019193378A1 (en) 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US10720166B2 (en) 2018-04-09 2020-07-21 Synaptics Incorporated Voice biometrics systems and methods
US10679629B2 (en) 2018-04-09 2020-06-09 Amazon Technologies, Inc. Device arbitration by multiple speech processing systems
CN108520741B (zh) 2018-04-12 2021-05-04 科大讯飞股份有限公司 一种耳语音恢复方法、装置、设备及可读存储介质
US10928917B2 (en) 2018-04-12 2021-02-23 International Business Machines Corporation Multiple user interaction with audio devices using speech and gestures
US10679615B2 (en) 2018-04-16 2020-06-09 Google Llc Adaptive interface in a voice-based networked system
CN108538305A (zh) 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
EP3564949A1 (en) 2018-04-23 2019-11-06 Spotify AB Activation trigger processing
US10803864B2 (en) 2018-05-07 2020-10-13 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11308947B2 (en) 2018-05-07 2022-04-19 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
JP2019204025A (ja) 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10777195B2 (en) 2018-05-31 2020-09-15 International Business Machines Corporation Wake command nullification for digital assistance and voice recognition technologies
US20190371324A1 (en) 2018-06-01 2019-12-05 Apple Inc. Suppression of voice response by device rendering trigger audio
EP3756087A4 (en) 2018-06-05 2021-04-21 Samsung Electronics Co., Ltd. PASSIVE WAKE-UP PROCESSES AND SYSTEMS OF A USER INTERACTION DEVICE
US10433058B1 (en) 2018-06-14 2019-10-01 Sonos, Inc. Content rules engines for audio playback devices
US11373645B1 (en) 2018-06-18 2022-06-28 Amazon Technologies, Inc. Updating personalized data on a speech interface device
US10762896B1 (en) 2018-06-25 2020-09-01 Amazon Technologies, Inc. Wakeword detection
US10832671B2 (en) 2018-06-25 2020-11-10 Intel Corporation Method and system of audio false keyphrase rejection using speaker recognition
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
NL2021308B1 (en) 2018-07-16 2020-01-24 Hazelebach & Van Der Ven Holding B V Methods for a voice processing system
JP7000268B2 (ja) 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
US11144596B2 (en) 2018-07-24 2021-10-12 Harman International Industries, Incorporated Retroactive information searching enabled by neural sensing
GB2576016B (en) 2018-08-01 2021-06-23 Arm Ip Ltd Voice assistant devices
US11514917B2 (en) 2018-08-27 2022-11-29 Samsung Electronics Co., Ltd. Method, device, and system of selectively using multiple voice data receiving devices for intelligent service
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
TWI683306B (zh) 2018-08-28 2020-01-21 仁寶電腦工業股份有限公司 多語音助理之控制方法
KR102225984B1 (ko) 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US10622009B1 (en) 2018-09-10 2020-04-14 Amazon Technologies, Inc. Methods for detecting double-talk
US20200090647A1 (en) 2018-09-14 2020-03-19 Comcast Cable Communications, Llc Keyword Detection In The Presence Of Media Output
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10650807B2 (en) 2018-09-18 2020-05-12 Intel Corporation Method and system of neural network keyphrase detection
KR20200034430A (ko) 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
US10861444B2 (en) 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10950249B2 (en) 2018-09-25 2021-03-16 Amazon Technologies, Inc. Audio watermark encoding/decoding
US11170758B2 (en) 2018-09-27 2021-11-09 Rovi Guides, Inc. Systems and methods for providing notifications within a media asset without breaking immersion
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
KR102606789B1 (ko) 2018-10-01 2023-11-28 삼성전자주식회사 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치
US10971158B1 (en) 2018-10-05 2021-04-06 Facebook, Inc. Designating assistants in multi-assistant environment based on identified wake word received from a user
US20200110571A1 (en) 2018-10-05 2020-04-09 Sonos, Inc. Systems and methods for media content selection
US10346122B1 (en) 2018-10-18 2019-07-09 Brent Foster Morgan Systems and methods for a supplemental display screen
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US10943599B2 (en) 2018-10-26 2021-03-09 Spotify Ab Audio cancellation for voice recognition
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11198446B2 (en) 2019-01-04 2021-12-14 Faraday & Future Inc. On-board vehicle query system
JP2020112692A (ja) 2019-01-11 2020-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 方法、制御装置、及びプログラム
US11349834B2 (en) 2019-01-30 2022-05-31 Ncr Corporation Multi-factor secure operation authentication
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
CN109712626B (zh) 2019-03-04 2021-04-30 腾讯科技(深圳)有限公司 一种语音数据处理方法及装置
US10943598B2 (en) 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US10964314B2 (en) 2019-03-22 2021-03-30 Cirrus Logic, Inc. System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array
US10984783B2 (en) 2019-03-27 2021-04-20 Intel Corporation Spoken keyword detection based utterance-level wake on intent system
US20200310751A1 (en) 2019-03-29 2020-10-01 Qualcomm Incorporated System and method of managing device sound level
DK3726856T3 (da) 2019-04-17 2023-01-09 Oticon As Høreanordning omfattende en nøgleordsdetektor og en egen stemme-detektor
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US20200409926A1 (en) 2019-06-28 2020-12-31 Rovi Guides, Inc. Automated contact creation based on content communications
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11159878B1 (en) 2019-08-15 2021-10-26 Amazon Technologies, Inc. Autonomously motile device with beamforming
JP7191793B2 (ja) 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
US11172328B2 (en) 2019-09-27 2021-11-09 Sonos, Inc. Systems and methods for device localization
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
US20220301561A1 (en) 2019-12-10 2022-09-22 Rovi Guides, Inc. Systems and methods for local automated speech-to-text processing
US11823659B2 (en) 2019-12-11 2023-11-21 Amazon Technologies, Inc. Speech recognition through disambiguation feedback
US11445301B2 (en) 2020-02-12 2022-09-13 Sonos, Inc. Portable playback devices with network operation modes
CN111341306B (zh) 2020-02-14 2022-06-17 东南大学 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法
US11206052B1 (en) 2020-06-18 2021-12-21 HAJEN Co., Ltd Smart speaker
US20220050585A1 (en) 2020-08-14 2022-02-17 Apple Inc. Audio media playback user interface

Also Published As

Publication number Publication date
JP6571302B1 (ja) 2019-09-04
EP3494574B1 (en) 2019-11-27
US20180040324A1 (en) 2018-02-08
CN109791765B (zh) 2020-11-03
US20190074014A1 (en) 2019-03-07
US20230289133A1 (en) 2023-09-14
WO2018027142A1 (en) 2018-02-08
JP2023164960A (ja) 2023-11-14
US20210289607A1 (en) 2021-09-16
US11934742B2 (en) 2024-03-19
CN112382303A (zh) 2021-02-19
JP2020005273A (ja) 2020-01-09
JP7346508B2 (ja) 2023-09-19
JP2019533182A (ja) 2019-11-14
US20190295556A1 (en) 2019-09-26
US10354658B2 (en) 2019-07-16
CN109791765A (zh) 2019-05-21
US20190295555A1 (en) 2019-09-26
EP3494574A1 (en) 2019-06-12
US20200184980A1 (en) 2020-06-11
US10565999B2 (en) 2020-02-18
US10115400B2 (en) 2018-10-30
US11531520B2 (en) 2022-12-20
US10847164B2 (en) 2020-11-24
EP3618064A1 (en) 2020-03-04
US10565998B2 (en) 2020-02-18
JP2022003396A (ja) 2022-01-11

Similar Documents

Publication Publication Date Title
JP6942763B2 (ja) 複数の音声サービス
JP6884245B2 (ja) アービトレーションに基づく音声認識
US11184969B2 (en) Contextualization of voice inputs
US20220157307A1 (en) Systems and Methods of Multiple Voice Services
US10860284B2 (en) Playback expansion
US9965243B2 (en) Playback expansion
EP3111674A1 (en) Playback expansion

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190904

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210908

R150 Certificate of patent or registration of utility model

Ref document number: 6942763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150