JP6963673B2 - ウェイクワード検出の抑制 - Google Patents

ウェイクワード検出の抑制 Download PDF

Info

Publication number
JP6963673B2
JP6963673B2 JP2020506725A JP2020506725A JP6963673B2 JP 6963673 B2 JP6963673 B2 JP 6963673B2 JP 2020506725 A JP2020506725 A JP 2020506725A JP 2020506725 A JP2020506725 A JP 2020506725A JP 6963673 B2 JP6963673 B2 JP 6963673B2
Authority
JP
Japan
Prior art keywords
wake
audio content
playback
playback device
nmd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020506725A
Other languages
English (en)
Other versions
JP2020530585A (ja
Inventor
ジョナサン・ピー・ラング
Original Assignee
ソノズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソノズ インコーポレイテッド filed Critical ソノズ インコーポレイテッド
Publication of JP2020530585A publication Critical patent/JP2020530585A/ja
Application granted granted Critical
Publication of JP6963673B2 publication Critical patent/JP6963673B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Control Of Stepping Motors (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)

Description

関連出願の参照
本願は、2017年8月7日に出願された米国特許出願第15/670,361号に基づく優先権を主張しており、参照によりその開示内容全体を本願明細書の一部とする。
本開示は、消費財に関し、更に具体的には、メディア再生を対象とする方法、システム、製品、機能、サービス、及び他の要素、又はその一部の態様に関する。
音声を出している状況でデジタルオーディオにアクセスして聴取するための選択肢は、2003年までは限られていたが、この年、SONOS,Inc.は、最初の特許出願「Method for Synchronizing Audio Playback between Multiple Networked Devices(複数のネットワーク装置間でオーディオ再生を同期させる方法)」を申請し、2005年にメディア再生システムの販売を開始した。Sonos Wireless HiFi Systemにより、1つ又は複数のネットワーク再生装置を介して、多くのソースから音楽を体験することが可能となる。スマートフォン、タブレット、又はコンピュータにインストールされたソフトウェア制御アプリケーションにより、ネットワーク再生装置を有する任意の部屋で、希望するものを再生することができる。加えて、コントローラを使用して、例えば、再生装置のある部屋毎に異なる曲をストリーミングすること、部屋をグループ化して同期再生すること、又は同じ曲を全ての部屋で同期して聴くことができる。
デジタルメディアへの関心が高まり続けていることを考えると、リスニング体験を更に向上させるために、消費者がアクセス可能な技術を開発する必要性は、引き続き存在している。
本開示技術の特徴、態様、及び利点は、以下の記載、添付の特許請求の範囲、及び添付図面により、更に良く理解され得る。
特定の実施形態を実施可能なメディア再生システム構成例を示す図 再生装置の例の機能ブロック図 制御装置の例の機能ブロック図 コントローラインタフェースの例を示す図 処理システムの例を示す図 本明細書に記載の態様による複数のネットワーク装置の例を示す図 本明細書に記載の態様によるネットワークマイクロホン装置の機能ブロック図 1つ又は複数のNMDのウェイク応答を無効にするフローの例を示す図 NMDにウェイクワードを無視させるメッセージの例を示す図 NMDにウェイクワードを無視させる命令の例を示す図 NMDにウェイクワードを無視させる命令の例を示す図 NMDにウェイクワードを無視させる命令の例を示す図 NMDにウェイクワードを無視させる命令の例を示す図 1つ又は複数のNMDのウェイク応答を無効にするフローの例を示す図 1つ又は複数のNMDのウェイク応答を無効にするフローの例を示す図 ウェイク応答を抑制するフローの例を示す図
図面は、例示的な実施形態を説明することを目的としているが、本発明は、図面に示した配置及び手段に限定されないと理解される。
I.概要
ネットワークマイクロホン装置(NMD)は、音声制御により住居を制御するために使用し得る。NMDは、例えば、マイクロホンを介して音声入力を受信可能なSONOS(登録商標)再生装置、サーバ、若しくはシステム、又はその一部となり得る。一部の例において、再生装置は、SONOS(登録商標)再生装置である。更に、NMDは、マイクロホンを介して音声入力を受信可能な別の装置、サーバ、又はシステム(例えば、例として特にAMAZON(登録商標) ECHO(登録商標)、APPLE(登録商標) IPHONE(登録商標)、又はその一部となり得る。出典を明記することによりその開示内容全体を本願明細書の一部とする2017年2月21日提出の米国出願第15/438,749号「メディア再生システムの音声制御」には、音声対応の家庭用アーキテクチャの例が記載されている。音声制御は、再生装置、無線照明装置、サーモスタット、ドアロック、ホームオートメーション等の「スマート」ホームでの様々な装置、及びその他の例にとって有益となり得る。
一部の実施において、NMDにより検出された音声入力は、処理のために音声サービスに送られる。NMDは、再生装置と共に、音声サービスへのマイクロホン/スピーカインタフェースとして動作し得る。音声入力はNMDのマイクロホンにより検出され、処理のために特定の音声サービスに送信される。音声サービスは、その後、音声入力のコマンド又は他の結果を返し得る。
ウェイクワードの発話により、音声サービスを呼び出し得る。例えば、AMAZON(登録商標)音声サービスに問い合わせる場合、ユーザは、ウェイクワード「Alexa」を話した後、音声入力を行い得る。他の例には、GOOGLE(登録商標)音声サービスに問い合わせるための「Ok、Google」、及びAPPLE音声サービスに問い合わせるための「Hey、Siri」が含まれる。ウェイクワード及び音声サービスには他の例が存在する。ウェイクワードを検出すると、NMDは、ウェイクワードに続く音声コマンドを、マイクロホンを介して聞くことにより応答し得る。この応答は、本明細書においてNMDの「ウェイク応答」と呼ばれる。
状況によっては、ウェイクワードを含む音声コンテンツを再生することで、NMDのウェイク応答が誤ってトリガされる場合がある。多くの音声サービスのウェイクワードは、既存言語の語彙から選択された既存の単語である。例えば、幾つかの一般的な音声サービスでは、特定の名前をウェイクワードとして用いている(例えば「Alexa」及び「Siri」)。したがって、状況によっては、特に、トークショー、映画、テレビ番組、ポッドキャスト、インターネットストリーミングビデオ等の記録済み音声コンテンツに、ウェイクワード又は類似するものが含まれ得る。このような音声コンテンツをNMDの範囲内で再生すると、NMDが誤ってトリガされる恐れがあり、これは、音声コンテンツの楽しみを妨げる等、多くの理由で望ましくない場合がある。
例えば、テレビは特定の音声サービスのコマーシャルを再生する場合がある。コマーシャル中、俳優又は女優は、恐らくは音声サービスを呼び出す様子を示すために、音声サービスのウェイクワードを話す可能性がある。テレビと同じ部屋にあるNMDは、テレビからの音声出力を検出し、NMDがコマーシャル内のウェイクワードを検出した時に音声サービスを呼び出す可能性がある。これは、望ましくない場合がある。更に、コマーシャルは、多くのテレビで同時に再生され得るため、コマーシャルは同時に多くのNMDをトリガする恐れがあり、音声サービスへの要求が望ましくない形で急増し得る。
コマーシャルにより誤ってトリガされるのを避けるために、音声サービスの運営者は、ウェイクワードを含むコマーシャルの(複数の)部分をマークし、これらのマークされた(複数の)部分を無視するようにNMDをプログラムし得る。例えば、運営者は、音声サービスのコマーシャルにトーン音又は他の音声マーカをミックスし、この音声マーカと共に検出されるウェイクワードを無視するようにNMDをプログラムし得る。この実施は、このマーカを音声サービスの運営者が音声コンテンツに埋め込むことが可能な音声サービスのコマーシャル等、限られた場合に有用となり得る。しかしながら、この実施は、音声サービスの運営者が制御できない他の殆どの音声コンテンツに関しては有用ではない。
本明細書に記載の技術の例は、音声コンテンツが再生装置により聞き取り可能に再生される前に、再生装置による再生対象の音声コンテンツを処理することと、音声コンテンツが1つ又は複数のウェイクワードを含むかを判断することと、及び再生装置により再生された際に、ウェイクワードを無視するにように1つ又は複数のNMDに通知することと、を含み得る。このようにして、当該手法は、NMDの誤ったトリガ動作の防止を支援し得る。特に、このような技術は、再生装置による再生の対象となる任意の記録済み音声コンテンツに適用可能である。
例えば、再生装置は、再生用の音声コンテンツを受信し得る。音声コンテンツを再生する前に、再生装置は、音声コンテンツをメモリ(例えばバッファ)に記憶し、音声コンテンツに対してウェイクワード検出アルゴリズムを実行する。音声コンテンツにおいてウェイクワードが検出された場合、再生装置(NMD自体であってもよい)は、再生装置が最終的に音声コンテンツを再生する際に、1つ又は複数のNMDにこれらのウェイクワードを無視させる。
他の例として、NMDは、再生装置による再生に指定された音声コンテンツを受信してもよい。音声コンテンツが再生装置により再生される前に、NMDは、音声コンテンツに対してウェイクワード検出アルゴリズムを実行し得る。音声コンテンツにおいてウェイクワードが検出された場合、NMDは、最終的に再生装置により再生された際に、そのNMD(及び場合により近傍の他のNMD)がこれらのウェイクワードを無視するようし得る。
NMDは、様々な技術の何れかを用いてウェイクワードを無視し得る。一部の場合において、例として特に、恐らくはウェイクワードの聞き取りを停止するようにNMDに指示すること、NMDのマイクロホンアレイを一定期間無効にすること、又は再生装置の方向にリスニングNULL(listening NULL)を作成することにより、再生装置により再生される際にウェイクワードを検出しないようにNMDを指示し得る。又は、NMDは、最初はウェイクワードの検出を進めるものの、恐らくは特定の期間中、ウェイクワードを無視すること、又は特定の期間中、記録された音声を全て無視することにより、ウェイクワードの検出に応じて音声サービスを呼び出すようにプログラムされたウェイク応答を抑制するように指示し得る。
再生装置が音声コンテンツを聞き取り可能に再生する前に音声コンテンツを処理する場合、処理装置(再生装置又はNMD等)は、記録済み音声コンテンツ内でウェイクワードが含まれるセクションを判断することもできる。これらのセクションは、ウェイクワードの開始時間及び停止時間等、音声コンテンツ内の期間により定義することができる(例えば、ポッドキャストのウェイクワードが33:52.543に開始し、33:54.013に終了する)。音声コンテンツが再生される際には、近傍のNMDに、これらの期間中、ウェイクワードを無視するように指示することができる。
他の例として、処理装置は、音声コンテンツ(又は音声コンテンツの一部)内のウェイクワードの数をカウントし得る。例えば、コマーシャルの音声コンテンツを処理している再生装置は、そのコマーシャル内でウェイクワードの4つのインスタンスを検出する場合がある。その後、再生装置は、カウントと等しい数のウェイクワードを検出するまでウェイクワードを無視するように(例えば、次の4つのウェイクワードを無視するように)、再生装置近傍のNMDに指示し得る。
他の例において、処理装置は、記録済み音声コンテンツに音声トーン又は他のマーカを動的に挿入して、音声コンテンツで検出されたウェイクワードを指定し得る。その後、音声コンテンツが再生装置により再生される際に、ウェイクワードと共に音声マーカを検出するNMDには、ウェイクワードのインスタンスを無視するように指示することができる。再生装置の可聴範囲内(in audible range of the playback device)の複数のNMDは、それぞれウェイクワードを検出し、関連する音声マーカを検出することに応じて、ウェイクワードを無視し得る。
技術の例は、1つ又は複数のNMDのウェイク応答を無効にすることを含み得る。第1の実施は、ネットワークインタフェースを介して、再生装置による再生用の音声コンテンツを表すデータを受信することと、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することと、を含み得る。第1の実施は、更に、再生装置により音声コンテンツを再生中に、1つ又は複数のネットワークマイクロホン装置において検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることを含み、ここで、ウェイク応答が有効とされた時、特定のウェイクワードに対する所定のネットワークマイクロホン装置のウェイク応答により、当該所定のネットワークマイクロホン装置は、マイクロホンを介して、特定のウェイクワードに続く音声コマンドを聞き取る。第1の実施は、更に、1つ又は複数のスピーカを介して音声コンテンツを再生することを含み得る。
第2の実施は、ネットワークインタフェースを介して、再生装置による再生用の音声コンテンツを表すデータを受信することを含み得る。第2の実施は、更に、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することを含み得る。第2の実施は、更に、再生装置により音声コンテンツを再生中に、検出された1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にすることと、再生装置が音声コンテンツを再生している間に、マイクロホンを介して、再生された音声コンテンツを検出することと、を含み得る。
第3の実施は、計算システムのインタフェースを介して、1つ又は複数の再生装置による再生用の音声コンテンツを受信することを含み得る。第3の実施は、更に、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することを含み得る。第3の実施は、更に、再生装置により音声コンテンツを再生中に、1つ又は複数のネットワークマイクロホン装置において検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることを含み得る。
第4の実施は、ネットワークインタフェースを介して、1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にする命令を受信することを含み得る。第4の実施は、更に、マイクロホンを介して、1つ又は複数の再生装置により再生されている音声コンテンツを検出することを含み得る。第4の実施は、更に、検出された音声コンテンツが1つ又は複数のウェイクワードを含むことを判断することと、受信した命令に応じて、検出された音声コンテンツ内の1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にすることと、を含み得る。
これらの実施の例のそれぞれは、特に、方法、実施を実行するように構成された装置、実施を実行するように構成された装置のシステム、又は実施を実行するために1つ又は複数のプロセッサにより実行可能な命令を含む非一時的コンピュータ読み取り可能媒体として実現し得る。本開示が、本明細書に記載の特徴例の組み合わせを含む他の多数の実施形態を含むことは、当業者に理解されよう。更に、技術を例示するために所定の装置により実行されるものとして記載された動作例は、本明細書に記載の装置を含む任意の適切な装置により実行され得る。更にまた、任意の装置は、他の装置に、本明細書に記載の動作の何れかを実行させ得る。
本明細書に記載の一部の例は、「ユーザ」及び/又は他の実体等、所定の主体により実行される機能を示す場合があるが、この記載は、説明の目的のみを有することを理解されたい。特許請求の範囲自体に明示的に必要であることが記載されていない限り、こうした任意の主体例による行動が必要であると解釈されるべきではない。
II.動作環境の例
図1は、本明細書に開示した1つ又は複数の実施形態を実現又は実施し得るメディア再生システム100の構成例を示す。図示したメディア再生システム100は、例えば、主寝室、オフィス、ダイニングルーム、及びリビングルーム等の幾つかの部屋及び空間を有する例示的な住居環境に関連する。図1の例に示すように、メディア再生システム100は、再生装置102、104、106、108、110、112、114、116、118、120、112、及び124と、制御装置126及び128と、有線又は無線ネットワークルータ130とを含む。図1には、NMD132及び134も存在する。
例示したメディア再生システム100の様々な構成要素、及びユーザにメディア体験を提供するために様々な構成要素がどのように相互作用するかに関しては、以下の節で更に説明している。本明細書の説明は、全般的に、例示したメディア再生システム100を示すものとなり得るが、本明細書に記載の技術は、特に、図1に示した住居環境内の用途に限定されない。例えば、本明細書に記載の技術は、例えばレストラン、モール、又は空港等の商業施設、スポーツユーティリティビークル(SUV)等の車両、バス又は客車、船舶、飛行機等、マルチゾーンオーディオが望まれる環境において有用となり得る。
a.再生装置の例
図2は、図1のメディア再生システム100の再生装置102乃至124の1つ又は複数として構成可能な再生装置200の例の機能ブロック図を示す。再生装置200は、プロセッサ202、ソフトウェアコンポーネント204、メモリ206、オーディオ処理コンポーネント208、オーディオアンプ210、スピーカ212、並びに無線インタフェース216及び有線インタフェース218を含むネットワークインタフェース214を含み得る。一例において、再生装置200は、スピーカ212を含まず、再生装置200を外部スピーカに接続するためのスピーカインタフェースを含んでもよい。他の例において、再生装置200は、スピーカ212もオーディオアンプ210も含まず、再生装置200を外部のオーディオアンプ又はAVレシーバに接続するための音声インタフェースを含んでもよい。
一例において、プロセッサ202は、メモリ206に記憶された命令により入力データを処理するように構成されたクロック駆動計算コンポーネントにし得る。メモリ206は、プロセッサ202により実行可能な命令を記憶するように構成された有形のコンピュータ可読媒体にし得る。例えば、メモリ206は、特定の機能を達成するためにプロセッサ202により実行可能なソフトウェアコンポーネント204の1つ又は複数をロードできるデータストレージにし得る。一例において、機能は、再生装置200が音源又は別の再生装置から音声データを取得することを含み得る。他の例において、機能は、再生装置200が音声データをネットワーク上の別の装置又は再生装置に送信することを含み得る。更に他の例において、機能は、マルチチャネルオーディオ環境を作成するために、再生装置200を1つ又は複数の再生装置とペアリングすることを含み得る。
特定の機能は、再生装置200が音声コンテンツの再生を他の1つ又は複数の再生装置と同期させることを含み得る。同期再生中、再生装置200と1つ又は複数の他の再生装置とによる音声コンテンツの再生の間で、時間遅延差を聴取者が知覚できないことが好ましい。出典を明記することによりその開示内容全体を本願明細書の一部とする米国特許第8,234,395号「独立してクロックされる複数のデジタルデータ処理装置間で動作を同期するためのシステム及び方法」には、再生装置間のオーディオ再生を同期する幾つかの例が更に詳細に記載されている。
メモリ206は、更に、再生装置200がその一部である1つ又は複数のゾーン及び/又はゾーングループ、再生装置200がアクセス可能な音源、又は再生装置200(又は他の何らかの再生装置)と関連し得る再生キュー等、再生装置200に関連するデータを記憶するように構成可能である。データは、周期的に更新されると共に再生装置200の状態を記述するために使用される1つ又は複数の状態変数として記憶し得る。メモリ206は、メディアシステムの他の装置の状態に関連すると共に1つ又は複数の装置がシステムに関連付けられた最新のデータを有するように装置間で随時共有されるデータを含んでもよい。他の実施形態も可能である。
オーディオ処理コンポーネント208は、1つ又は複数のデジタル/アナログ変換器(DAC)、オーディオ前処理コンポーネント、オーディオ強化コンポーネント、又はデジタル信号プロセッサ(DSP)等を含み得る。一実施形態において、オーディオ処理コンポーネント208の1つ又は複数は、プロセッサ202のサブコンポーネントにし得る。一例において、音声コンテンツは、音声信号を生成するために、オーディオ処理コンポーネント208により処理及び/又は意図的に変更され得る。生成された音声信号は、その後、増幅及びスピーカ212を介した再生のためにオーディオアンプ210に提供され得る。特に、オーディオアンプ210は、スピーカ212の1つ又は複数を駆動するためのレベルまで音声信号を増幅するように構成された装置を含み得る。スピーカ212は、個別のトランスデューサ(例えば、「ドライバ」)、又は1つ以上のドライバを有するエンクロージャを含む完全なスピーカシステムを含み得る。スピーカ212の特定のドライバは、例えば、サブウーハ(例えば、低周波用)、ミッドレンジドライバ(例えば、中周波用)、及び/又はツイータ(例えば、高周波用)を含み得る。場合により、1つ又は複数のスピーカ212内の各トランスデューサは、オーディオアンプ210の個々の対応するオーディオアンプにより駆動される。再生装置200による再生用にアナログ信号を生成することに加え、オーディオ処理コンポーネント208は、再生のために1つ又は複数の他の再生装置に送信される音声コンテンツを処理するように構成可能である。
再生装置200により処理及び/又は再生される音声コンテンツは、外部のソースから、オーディオラインイン入力接続(例えば、自動検出3.5mmオーディオラインイン接続)又はネットワークインタフェース214等を介して受信してもよい。
ネットワークインタフェース214は、再生装置200とデータネットワーク上の1つ又は複数の他の装置との間のデータフローを容易にするように構成可能である。したがって、再生装置200は、再生装置200と通信する1つ又は複数の他の再生装置、ローカルエリアネットワーク内のネットワーク装置、又はインターネット等のワイドエリアネットワーク上の音声コンテンツソースから、データネットワークを介して音声コンテンツを受信するように構成可能である。一例において、再生装置200により送受信される音声コンテンツ及び他の信号は、インターネットプロトコル(IP)に基づく送信元アドレス及びIPに基づく宛先アドレスを含むデジタルパケットデータの形態で送信し得る。このような場合、ネットワークインタフェース214は、再生装置200宛てのデータが再生装置200により適切に受信及び処理されるように、デジタルパケットデータを解析するように構成可能である。
図示したように、ネットワークインタフェース214は、無線インタフェース216及び有線インタフェース218を含み得る。無線インタフェース216は、再生装置200が他の装置(例えば、再生デバイス200が関連付けられたデータネットワーク内の他の再生装置、スピーカ、レシーバ、ネットワーク装置、制御装置)と、通信プロトコル(例えば、IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移動体通信規格等を含む任意の無線規格)に従って、無線通信するためのネットワークインタフェース機能を提供し得る。有線インタフェース218は、再生装置200が、通信プロトコル(例えば、IEEE802.3)に従って、他の装置と有線接続を介して通信するためのネットワークインタフェース機能を提供し得る。図2に示したネットワークインタフェース214は、無線インタフェース216及び有線インタフェース218を共に含むが、一部の実施形態において、ネットワークインタフェース214は、無線インタフェースのみ又は有線インタフェースのみを含み得る。
一例において、再生装置200と他の1つの再生装置は、音声コンテンツの2つの別個の音声成分を再生するためにペアリングされる。例えば、再生装置200は、左チャネル音声成分を再生するように構成され、他方の再生装置は、右チャネル音声成分を再生するように構成され、これにより音声コンテンツのステレオ効果を生成又は強化し得る。ペアリングした再生装置(「結合再生装置」ともいう)は、更に、他の再生装置と同期して音声コンテンツを再生し得る。
他の例において、再生装置200は、1つ又は複数の他の再生装置と音響的に統合し、単一の統合再生装置を形成し得る。統合再生装置は、音声コンテンツを再生可能な追加のスピーカドライバを有し得ることから、未統合の再生装置又はペアリングされた再生装置とは異なる形で音声を処理及び再生するように構成可能である。例えば、再生装置200が低周波数レンジの音声コンテンツを再生するように設計された再生装置(即ち、サブウーハ)である場合、再生装置200は、フル周波数レンジの音声コンテンツを再生するように設計された再生装置と統合し得る。このような場合、フル周波数レンジ再生装置は、低周波再生装置200と統合された時、低周波レンジ再生装置200が音声コンテンツの低周波数成分を再生する一方で、音声コンテンツの中及び高周波数成分のみを再生するように構成可能である。統合再生装置は、更に、単一の再生装置又は更に別の統合再生装置とペアリングされ得る。
例えば、SONOS,Inc.は、「PLAY:1」、「PLAY:3」、「PLAY:5」、「PLAYBAR」、「CONNECT:AMP」、「CONNECT」、及び「SUB」を含む特定の再生装置を現在販売している(又はしていた)。他の任意の過去、現在、及び/又は将来の再生装置を追加として又は代替として用いて、本明細書に開示した実施形態例の再生装置を実施してもよい。加えて、再生装置は、図2に示す例又はSONOSが提供する製品に限定されないと理解される。例えば、再生装置は、有線又は無線ヘッドフォンを含み得る。他の例において、再生装置は、個人用モバイルメディア再生装置用のドッキングステーションを含む場合、又はそれと相互作用する場合がある。更に他の例において、再生装置は、テレビ、照明器具、又は屋内若しくは屋外で使用する他の何らかの装置等、別の装置又はコンポーネントに統合されてもよい。
b.再生ゾーン構成の例
図1のメディア再生システム100を再び参照すると、環境は、それぞれ1つ又は複数の再生装置を有する1つ又は複数の再生ゾーンを有し得る。メディア再生システム100は、1つ又は複数の再生ゾーンで構築され、その後1つ又は複数のゾーンを追加又は削除し得ることで、図1に示す構成例となってもよい。各ゾーンには、オフィス、浴室、主寝室、寝室、キッチン、ダイニングルーム、リビングルーム、バルコニー等、異なる部屋又は空間に応じて名前を付けてもよい。一例において、単一の再生ゾーンは、複数の部屋又は空間を含み得る。他の事例において、単一の部屋又は空間は、複数の再生ゾーンを含み得る。
図1に示すように、バルコニー、ダイニングルーム、キッチン、浴室、オフィス、寝室ゾーンには、それぞれ1つの再生装置があり、リビングルーム及び主寝室ゾーンには、それぞれ複数の再生装置がある。リビングルームゾーンにおいて、再生装置104、106、108、及び110は、個々の再生装置として、1つ又は複数の結合再生装置として、1つ又は複数の統合再生装置として、又はそれらの任意の組み合わせとして、音声コンテンツを同期して再生するように構成可能である。同様に、主寝室の場合、再生装置122及び124は、個々の再生装置として、結合再生装置として、又は統合再生装置として、音声コンテンツを同期して再生するように構成可能である。
一例において、図1の環境内の1つ又は複数の再生ゾーンは、それぞれ異なる音声コンテンツを再生し得る。例えば、あるユーザがバルコニーゾーンで網焼きをしつつ再生装置102で再生されているヒップホップ音楽を聴いている一方、別のユーザは、キッチンゾーンで食べ物の準備をしつつ再生装置114で再生されているクラシック音楽を聴いている場合がある。他の例において、再生ゾーンでは、別の再生ゾーンと同期して同じ音声コンテンツを再生し得る。例えば、オフィスゾーンにユーザがいて、オフィスゾーンでは、バルコニーゾーンで再生装置102により再生されているものと同じロック音楽を再生装置118が再生している場合がある。このような場合、再生装置102及び118は、ユーザが異なる再生ゾーン間を移動しながら、音を出して再生されている音声コンテンツをシームレスに(又は少なくとも実質的にシームレスに)楽しめるように、同期してロック音楽を再生し得る。再生ゾーン間の同期は、前掲の米国特許第8,234,395号に記載された再生装置間の同期と同様に達成し得る。
上記で示唆したように、メディア再生システム100のゾーン構成は、動的に修正し得るものであり、一部の実施形態において、メディア再生システム100は多数の構成をサポートする。例えば、ユーザが1つ又は複数の再生装置をゾーンの外部又は内部に物理的に移動させる場合、メディア再生システム100は、(複数の)変更に対応するように再構成可能である。例えば、ユーザが再生装置102をバルコニーゾーンからオフィスゾーンに物理的に移動させる場合、オフィスゾーンは、これにより再生装置118と再生装置102の両方を含み得る。再生装置102は、オフィスゾーンとペアリング又はグループ化され、及び/又は望ましい場合、制御装置126及び128等の制御装置を介して名前を変更し得る。一方、1つ又は複数の再生装置が、まだ再生ゾーンになっていない住居環境の特定のエリアに移動された場合、当該特定のエリアに対して新しい再生ゾーンを形成し得る。
更に、メディア再生システム100の異なる再生ゾーンは、動的に組み合わせてゾーングループとしてよく、又は個々の再生ゾーンに分割してもよい。例えば、ダイニングルームゾーン及びキッチンゾーン114を組み合わせて、再生装置112及び114が同期して音声コンテンツを再生し得るように、ディナーパーティ用のゾーングループにしてもよい。一方、リビングルームゾーンは、リビングルームの空間で音楽を聴きたいユーザと、テレビを観たい別のユーザとがいる場合、再生装置104を含むテレビゾーンと、再生装置106、108、及び110を含むリスニングゾーンとに分割し得る。
c.制御装置の例
図3は、メディア再生システム100の制御装置126及び128の一方又は両方となるように構成可能な制御装置300の例の機能ブロック図を示す。制御装置300はコントローラ300と呼ばれる場合がある。図示したように、制御装置300は、プロセッサ302、メモリ304、ネットワークインタフェース306、及びユーザインタフェース308を含み得る。一例において、制御装置300は、メディア再生システム100の専用コントローラにし得る。他の例において、制御装置300は、例えば、iPhone(登録商標)、iPad(登録商標)、又は他の任意のスマートフォン、タブレット、若しくはネットワーク装置(例えば、PC又はMac(登録商標)等のネットワークコンピュータ)等、メディア再生システムのコントローラアプリケーションソフトウェアをインストールし得るネットワーク装置であってよい。
プロセッサ302は、メディア再生システム100のユーザアクセス、制御、及び構成を容易にすることに関連する機能を実行するように構成可能である。メモリ304は、これらの機能を実行するためにプロセッサ302により実行可能な命令を記憶するように構成可能である。メモリ304は、更に、メディア再生システムのコントローラアプリケーションソフトウェア、及びメディア再生システム100とユーザに関連する他のデータを記憶するように構成可能である。
一例において、ネットワークインタフェース306は、業界標準(例えば、赤外線、無線、IEEE802.3を含む有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移動体通信規格を含む無線規格等)に基づく。ネットワークインタフェース306は、制御装置300がメディア再生システム100内の他の装置と通信するための手段を提供し得る。一例において、データ及び情報(例えば、状態変数等)は、ネットワークインタフェース306を介して制御装置300と他の装置との間で通信され得る。例えば、メディア再生システム100における再生ゾーン及びゾーングループ構成は、再生装置又は別のネットワーク装置から制御装置300により受信し、又は制御装置300によりネットワークインタフェース306を介して別の再生装置又はネットワーク装置に送信し得る。場合により、他のネットワーク装置は、別の制御装置となり得る。
音量制御及びオーディオ再生制御等の再生装置制御コマンドも、制御装置300からネットワークインタフェース306を介して再生装置に通信され得る。上記で示唆したように、メディア再生システム100の構成の変更は、ユーザが制御装置300を使用することで実行してもよい。構成の変更は、特に、1つ又は複数の再生装置のゾーンでの追加/削除、1つ又は複数のゾーンのゾーングループでの追加/削除、結合又は統合プレーヤの形成、1つ又は複数の再生装置の結合又は統合されたプレーヤからの分離を含み得る。したがって、制御装置300は、専用の制御装置であっても、メディア再生システムのコントローラアプリケーションソフトウェアがインストールされたネットワーク装置であっても、コントローラと呼ばれる場合がある。
制御装置300のユーザインタフェース308は、図4に示したコントローラインタフェース400等のコントローラインタフェースを提供することにより、メディア再生システム100のユーザアクセス及び制御を容易にするように構成可能である。コントローラインタフェース400は、再生制御領域410、再生ゾーン領域420、再生ステータス領域430、再生キュー領域440、及び音声コンテンツソース領域450を含む。図示したユーザインタフェース400は、図3の制御装置300(及び/又は図1の制御装置126及び128)等のネットワーク装置上に設けられると共に、メディア再生システム100等のメディア再生システムを制御するためにユーザがアクセスし得るユーザインタフェースの一例にすぎない。メディア再生システムへの同等の制御アクセスを提供するように、様々な形式、スタイル、及びインタラクティブなシーケンスの他のユーザインタフェースが、代わりに1つ又は複数のネットワーク装置において実施されてもよい。
再生制御領域410は、選択された再生ゾーン又はゾーングループ内の再生装置に、再生又は一時停止、早送り、巻き戻し、次へスキップ、前へスキップ、シャッフルモードの開始/終了、リピートモードの開始/終了、クロスフェードモードの開始/終了を実行させる、(例えば、タッチ又はカーソルの使用により)選択可能なアイコンを含み得る。再生制御領域410は、可能なものとして特に、イコライゼーション設定及び再生音量を修正するための選択可能なアイコンを含み得る。
再生ゾーン領域420は、メディア再生システム100内の再生ゾーンを表現したものを含み得る。一部の実施形態において、再生ゾーンのグラフィック表現は、可能なものとして特に、結合ゾーンの作成、ゾーングループの作成、ゾーングループの分離、ゾーングループの名前変更等、メディア再生システムにおいて再生ゾーンの管理又は設定を行う追加の選択可能アイコンを呼び出すために、選択可能にし得る。
例えば、図示したように、「グループ」アイコンを、再生ゾーンのグラフィック表現内に提供し得る。特定のゾーンのグラフィック表現内に提供される「グループ」アイコンは、当該特定のゾーンとグループ化されるメディア再生システム内の1つ又は複数の他のゾーンを選択するオプションを呼び出すために、選択可能にし得る。グループ化されると、特定のゾーンとグループ化されたゾーンの再生装置は、特定のゾーンの再生装置と同期して音声コンテンツを再生するように構成される。同様に、ゾーングループのグラフィック表示内に「グループ」アイコンを提供してもよい。この場合、「グループ」アイコンを選択して、ゾーングループから削除するべきゾーングループ内の1つ又は複数のゾーンを選択解除するオプションを呼び出すことができる。ユーザインタフェース400等のユーザインタフェースを介してゾーンのグループ化及びグループ化解除を行うための他のインタラクション及び実施も可能である。再生ゾーン領域420内の再生ゾーンの表現は、再生ゾーン又はゾーングループの構成が修正された際に動的に更新され得る。
再生ステータス領域430は、選択された再生ゾーン又はゾーングループにおいて、現在再生中の音声コンテンツ、以前に再生した音声コンテンツ、又は次に再生予定の音声コンテンツのグラフィック表現を含み得る。選択された再生ゾーン又はゾーングループは、再生ゾーン領域420及び/又は再生ステータス領域430内等において、ユーザインタフェース上で視覚的に区別され得る。グラフィック表示は、トラックタイトル、アーティスト名、アルバム名、アルバム年、トラック長、及びユーザインタフェース400を介してメディア再生システムを制御する際にユーザが知っていると有用な他の関連情報を含み得る。
再生キュー領域440は、選択された再生ゾーン又はゾーングループに関連する再生キュー内の音声コンテンツのグラフィック表現を含み得る。一部の実施形態において、各再生ゾーン又はゾーングループは、再生ゾーン又はゾーングループにより再生されるゼロ個以上の音声アイテムに対応する情報を含む再生キューに関連付けられる。例えば、再生キュー内の各音声アイテムは、ユニフォームリソース識別子(URI)、ユニフォームリソースロケータ(URL)、又は、恐らくは再生装置による再生用にローカル音声コンテンツソース又はネットワーク音声コンテンツソースから音声アイテムを検索及び/又は取得するために、再生ゾーン又はゾーングループにおいて再生装置が使用し得る他の何らかの識別子を含み得る。
一例では、プレイリストが再生キューに追加される。この場合、プレイリスト内の各音声アイテムに対応する情報が再生キューに追加される。別の例では、再生キュー内の音声アイテムがプレイリストとして記憶される。他の例では、再生キューは空であってよく、又は、再生ゾーン又はゾーングループが、再生時間を有する個別の音声アイテムではなく、停止されるまで再生が継続し得るインターネットラジオ等の連続ストリーミング音声コンテンツを再生している場合、内容を有しても「未使用」とし得る。代替的な実施形態において、再生キューは、インターネットラジオ及び/又は他のストリーミング音声コンテンツのアイテムを含むことが可能であり、再生ゾーン又はゾーングループがこれらのアイテムを再生している時に「使用中」とすることができる。他の例も可能である。
再生ゾーン又はゾーングループが「グループ化」又は「グループ化解除」された際には、影響される再生ゾーン又はゾーングループに関連付けられた再生キューは、消去されても、改めて関連付けされてもよい。例えば、第1の再生キューを含む第1の再生ゾーンが、第2の再生キューを含む第2の再生ゾーンとグループ化される場合、確立されたゾーングループが有し得る関連再生キューは、最初は空であるか、第1の再生キューからの音声アイテムを含むか(第2の再生ゾーンが第1の再生ゾーンに追加された場合等)、第2の再生キューからの音声アイテムを含むか(第1の再生ゾーンが第2の再生ゾーンに追加された場合等)、又は第1及び第2の両方の再生キューからの音声アイテムの組み合わせとなる。その後、確立されたゾーングループがグループ化解除された場合、結果的に生じた第1の再生ゾーンは、以前の第1の再生キューに改めて関連付けられてもよく、又は、空である新しい再生キュー、若しくは確立されたゾーングループのグループ化解除前に、確立されたゾーングループに関連付けられていた再生キューからの音声アイテムを含む新しい再生キューに関連付けられてもよい。同様に、結果的に生じた第2の再生ゾーンは、以前の第2の再生キューに改めて関連付けられてもよく、又は、空である新しい再生キュー、若しくは確立されたゾーングループのグループ化解除前に、確立されたゾーングループに関連付けられていた再生キューからの音声アイテムを含む新しい再生キューに関連付けられてもよい。他の例も可能である。
図4のユーザインタフェース400を再び参照すると、再生キュー領域440内の音声コンテンツのグラフィック表現は、トラックタイトル、アーティスト名、トラック長、及び再生キュー内の音声コンテンツに関連する他の関連情報を含み得る。一例において、音声コンテンツのグラフィック表現は、再生キュー及び/又は再生キュー内に表現された音声コンテンツを管理及び/又は操作する追加の選択可能アイコンを呼び出すために、選択可能にし得る。例えば、表現された音声コンテンツには、可能なものとして特に、再生キューからの削除、再生キュー内の異なる位置への移動、又は直ちに再生されるか現在再生中の音声コンテンツの後に再生するかの選択が実行され得る。再生ゾーン又はゾーングループに関連付けられた再生キューは、再生ゾーン又はゾーングループ内にある1つ又は複数の再生装置、再生ゾーン又はゾーングループ内にない再生装置、及び/又は他の何らかの指定された装置上のメモリに記憶され得る。このような再生キューの再生は、1つ又は複数の再生装置がキューのメディアアイテムを、恐らくは連続した順序又はランダムな順序で、再生することを含み得る。
音声コンテンツソース領域450は、選択された再生ゾーン又はゾーングループにより音声コンテンツを取得して再生し得る、選択可能な音声コンテンツソースのグラフィック表現を含み得る。音声コンテンツソースに関しては、以下の節で説明する。
d.音声コンテンツソースの例
前述のように、ゾーン又はゾーングループ内の1つ又は複数の再生装置は、様々な利用可能な音声コンテンツソースから(例えば、音声コンテンツの対応するURI又はURLに従って)再生音声コンテンツを取得するように構成可能である。一例において、音声コンテンツは、対応する音声コンテンツソース(例えば、ラインイン接続)から直接、再生装置により取得され得る。他の例において、音声コンテンツは、1つ又は複数の他の再生装置又はネットワーク装置を介してネットワーク上で再生装置に提供され得る。
音声コンテンツソースの例は、可能なものとして特に、図1のメディア再生システム100等のメディア再生システム内の1つ又は複数の再生装置のメモリ、1つ又は複数のネットワーク装置(制御装置、ネットワーク対応パーソナルコンピュータ、又はネットワーク接続ストレージ(NAS)等)上のローカル音楽ライブラリ、インターネット(例えばクラウド)を介して音声コンテンツを提供するストリーミングオーディオサービス、又は再生装置若しくはネットワーク装置上でライン入力接続を介してメディア再生システムに接続された音源を含み得る。
一部の実施形態において、音声コンテンツソースは、図1のメディア再生システム100等のメディア再生システムにおいて定期的に追加又は削除されてもよい。一例において、1つ又は複数の音声コンテンツソースが追加、削除、又は更新された時は常に、音声アイテムのインデキシングを実行し得る。音声アイテムのインデキシングは、メディア再生システム内の再生装置がアクセス可能な、ネットワーク上で共有される全てのフォルダ/ディレクトリ内で特定可能な音声アイテムのスキャニングと、音声コンテンツデータベースの生成又は更新とを含み得る。音声コンテンツデータベースは、メタデータ(例えば、特に、タイトル、アーティスト、アルバム、トラック長)及び見つかった特定可能な音声アイテム毎のURI又はURLといった他の関連情報を含む。音声コンテンツソースを管理及び維持する他の例も可能である。
e.処理システムの例
図5は、オーディオ入力/出力コンポーネント502、ウェイクワード検出コンポーネント504、及び通知コンポーネント506を含む処理システム500の例の機能ブロック図を示す。動作中、処理システム500は、記録済み音声コンテンツ内のウェイクワードを検出すると共に、NMDに、ウェイクワードの検出に対するプログラム済みウェイク応答を無視するか、他の形で抑制するように通知する。様々な実施形態において、処理システム500は、特に、再生装置、NMD、又はクラウドサーバ等の別個の処理装置において実施され得る。一部の実施形態において、処理システム(及び/又はその機能)の様々な構成要素は、複数の装置に分散される。
動作中、オーディオ入力/出力コンポーネント502は、入力インタフェースを介して、再生装置による再生のために指定された記録済み音声コンテンツを受信する。例えば、制御装置(図1の制御装置126又は128等)は、再生装置(例えば、図1の任意の再生装置)に、特定の音声コンテンツの再生を指示し得る。当該指示は、例として特に、恐らくはそのコンテンツを再生装置の再生キューに入れて再生装置に音声コンテンツを取得させること、音声コンテンツのストリーミングを再生装置に送ること、又はアナログ又はデジタルラインインインタフェースを介して再生装置に音声コンテンツを送ることにより行われる。処理システム500の音声/入力コンポーネント502は、音声コンテンツが再生装置により再生される前に、この記録済み音声コンテンツを受信する。
上述したように、一部の例において、処理システム500は再生装置内で実施される。このような実施形態では、再生装置500は、再生のため必然的に音声コンテンツへのアクセスを既に有している。例えば、再生装置は、可能なものとして特に、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、及びパーソナルエリアネットワーク(PAN)等の1種類以上のネットワーク上のネットワークインタフェースを介して、ネットワークソース(例えば、ストリーミングメディアサービス又はモバイル装置)から音声コンテンツを受信し得る。又は、再生装置は、アナログ(例えば、RCA)又はデジタル(例えば、TosLink(登録商標)又はHDMI(登録商標))のラインインインタフェースを介して音声コンテンツを受信し得る。
他の例において、処理システム500は、再生装置とは別のNMD又は他の処理装置内で実施される。このような実施形態において、処理システム500は、例として特に、再生装置又は音声コンテンツのソースから、ネットワークインタフェースを介して音声コンテンツを受信し得る。別の例において、ラインインインタフェースが音声コンテンツをNMDに直接提供してもよく、又は、再生装置がラインインインタフェースを介して音声コンテンツを受信し、1つ又は複数のネットワークを介して処理システム500にコンテンツを中継してもよい。
例えば、処理システム500は、再生装置の再生キューへのアクセスを有し得る。上述したように、再生キュー内の各音声アイテムは、ユニフォームリソース識別子(URI)、ユニフォームリソースロケータ(URL)、又は、他の何らかの識別子を含み得る。他の何らかの識別子は、恐らくは再生装置による再生用に、ローカル音声コンテンツソース又はネットワーク音声コンテンツソースから音声アイテムを検索及び/又は取得するために、再生ゾーン又はゾーングループにおいて再生装置が使用し得るものである。処理システム500は、再生装置による再生の前に、このような識別子を同様に用いて、ローカル音声コンテンツソース又はネットワーク音声コンテンツソースから音声コンテンツを取得し得る。
一部の実施において、再生キューは、再生装置のデータストレージに記憶される。他の実施において、再生キューは、クラウドサーバに記憶される。クラウドサーバに記憶された再生キュー(即ち、クラウドキュー)は、再生装置に記憶された再生キューのインスタンス又は表現となる。クラウドキューは、再生装置での再生の現在の状態を表す再生ポインタ又は他のステータス情報を含み得る。
一部の例において、処理システム500は、受信した音声コンテンツをウェイクワード検出に適したフォーマットに変換し得る。例えば、音声コンテンツがアナログラインインインタフェースを介して音声/入力コンポーネント502に提供される場合、処理システム500は、(例えば、ソフトウェア又はハードウェアに基づくアナログ/デジタル変換器を用いて)アナログ音声をデジタル化し得る。他の例として、受信した音声コンテンツが、分析に適さないデジタル形式で受信された場合、処理システム500は、その記録を適切なフォーマットにトランスコードし得る。
ウェイクワード検出コンポーネント504は、受信した音声コンテンツを分析して、その記録にウェイクワードが存在するかを判断する。ウェイクワード検出コンポーネント504は、ウェイクワード検出アルゴリズムを用いて、受信した音声コンテンツを分析し得る。ウェイクワード検出アルゴリズムの例は、音声記録を入力として受け取り、その記録にウェイクワードが存在するかを示すインジケーションを出力として提供する。
一部の実施において、ウェイクワード検出コンポーネント504は、マイクロホンを介して記録された音声内のウェイクワードを検出するためにNMDが利用するものと同じアルゴリズムを記録に対して使用し得る。一般的な動作中、NMDの例は、音声を常に記録し、記録された音声にウェイクワードが含まれているかを判断するために、記録されたオーディオストリームをウェイクワード検出アルゴリズムに提供する。ここで、NMDのマイクロホンにより記録された音声をウェイクワード検出アルゴリズムに提供する代わりに、ウェイクワード検出コンポーネント504は、再生用に指定された、事前に記録済み音声コンテンツを提供する。
分析中、ウェイクワード検出コンポーネント504は、更に、受信した音声コンテンツ内で各ウェイクワードが発生する場所を判断する。例えば、ウェイクワード検出コンポーネント504は、受信した音声コンテンツを既知の長さのセグメントに分割し得る。次に、ウェイクワード検出コンポーネント504は、ウェイクワードが検出されたセグメントを特定することにより、ウェイクワードが発生する記録の場所を判断し得る。例えば、各セグメントの長さが5秒であり、ウェイクワードが第4のセグメントで検出された場合、ウェイクワードは、記録の15乃至20秒の間に位置することになる。ウェイクワード検出コンポーネント504は、恐らくは1つ又は複数のタイムスタンプ(例えば、ウェイクワードの開始時間を示すタイムスタンプ、及び恐らくはウェイクワードの停止時間を示す別のタイムスタンプ)を使用して、ウェイクワードを含む音声コンテンツの部分を記録し得る。このようなタイムスタンプは、音声記録の開始から、又は音声記録内の別の特定の位置から、それぞれの時間オフセットを定義し得る。一部の例において、ウェイクワード検出コンポーネント504は、ウェイクワードが分割され、認識不能な部分となることを避けるために、音声記録を重複するセグメントに分離してもよい。音声記録内のウェイクワードの位置を決定する他の技術を利用することもできる。
例の中で、処理システム500は、受信した音声コンテンツをメモリにバッファリングし得る。例えば、処理システム500は、受信した音声コンテンツを先入れ先出しバッファ(例えば、循環バッファ)に記憶し得る。このような実施において、受信した音声の一部は、受信時にバッファに記憶され、受信した音声コンテンツにウェイクワードが含まれるかを判断するために処理されると削除される。
一部の例において、ウェイクワード検出コンポーネント504は、受信した音声コンテンツに対して複数のウェイクワード検出アルゴリズムを同時に(又は実質的に同時に)実行する。上述したように、様々な音声サービス(例えば、AMAZONのALEXA(登録商標)、APPLEのSIRI(登録商標)、又はMICROSOFTのCORTANA(登録商標))では、それぞれの音声サービスの呼び出しに異なるウェイクワードを使用している。複数のサービスをサポートするために、ウェイクワード検出コンポーネント504は、受信した音声コンテンツに対して、サポートしている各音声サービス用のウェイクワード検出アルゴリズムを並行して実行し得る。
音声コンテンツ内で1つ又は複数のウェイクワードが検出された場合、通知コンポーネント506は、1つ又は複数のNMD(例えば、図1のNMD132及び/又は134)に通知する。この通知により、NMDは、再生装置がウェイクワードを含む音声コンテンツを再生する過程で、当該ウェイクワードが検出された際に、検出されたウェイクワードを無視する。例えば、通知コンポーネント506は、特定のウェイクワード又は特定の数のウェイクワードを無視するように、ネットワークインタフェースを介して1つ又は複数のNMDに命令を送信し得る。
一部の例において、通知コンポーネント506は、ウェイクワードが再生装置により再生される際に、NMDがウェイクワードを検出しないようにしてもよい。例えば、通知コンポーネント506は、ある期間に亘り、ウェイクワードの聴取を停止する(例えば、記録された音声の処理を停止する)ようにNMDに指示し得る。又は、通知コンポーネント506は、NMDに対して、一時的に(例えば、ウェイクワードが再生装置により再生されると予想される時間に対応する期間中に)、そのマイクロホンアレイを無効にするように指示し得る。更に他の例として、通知コンポーネント506は、NMDがウェイクワードを検出しないように、再生装置がマイクロホンアレイを使用する方向にリスニングNULLを作成するようにNMDに指示し得る。他の例も可能である。
又は、NMDがウェイクワードを検出し得る一方で、通知コンポーネント506は、NMDに、ウェイクワードの検出に応じて音声サービスを呼び出すプログラム済みウェイク応答を抑制するように指示する。例えば、通知コンポーネント506は、特定の期間中、ウェイクワードを無視するように、又は特定の期間中、全ての音声を無視するように、NMDに指示し得る。他の例も可能である。
再生装置が音声コンテンツを聞き取り可能に再生する前に音声コンテンツを処理する場合、処理装置(再生装置又はNMD等)は、記録済み音声コンテンツ内でウェイクワードが含まれるセクションを判断することもできる。これらのセクションは、ウェイクワードの開始時間及び停止時間等、音声コンテンツ内の期間により定義することができる(例えば、ポッドキャストのウェイクワードが33:52.543に開始し、33:54.013に終了する)。音声コンテンツが再生される際には、近傍のNMDに、これらの期間中、ウェイクワードを無視するように指示することができる。
他の例として、処理システム500は、音声コンテンツ(又は音声コンテンツの一部)内のウェイクワードの数をカウントし得る。例えば、処理システム500は、音声コンテンツの例(例えば、テレビ番組)において3つのウェイクワードを検出する場合がある。上述したように、このようなインスタンスは、異なる音声サービスの異なるウェイクワードを含め、ウェイクワードの任意の組み合わせを含み得る。次に、処理システム500は、カウントと等しい数のウェイクワードを検出するまでウェイクワードを無視するように(例えば、次の3つのウェイクワードを無視するように)、近傍のNMDに指示し得る。
他の例において、処理システム500は、記録済み音声コンテンツに音声トーン又は他のマーカを動的に挿入して、音声コンテンツで検出されたウェイクワードを指定し得る。その後、音声コンテンツが再生装置により再生される際に、ウェイクワードと共に音声マーカを検出するNMDには、ウェイクワードのインスタンスを無視するように指示することができる。複数のNMDが再生装置の可聴範囲内にある場合、ウェイクワードを検出する各NMDは、関連する音声マーカを検出することに応じて、ウェイクワードを無視し得る。場合により、音声マーカは、人間の可聴範囲外(例えば、20kHz超)の音声周波数で構成されるため、人間の聴取者は、挿入されたトーンに気付かない。
一部の実施において、処理システム500は、音声コンテンツのソースと再生装置との間の媒介として動作する。例えば、処理システム500が音声マーカを用いてNMDに通知する実施において、処理システムは、再生装置による再生に指定された音声コンテンツを修正する。このような実施形態において、処理システム500は、音源から音声コンテンツを受信し(例えば、ネットワーク又はラインインインタフェースを介して)、音声コンテンツを分析し、恐らくはネットワークインタフェースを介して、修正された音声コンテンツを再生のため再生装置に提供し得る。
又は、上述したように、処理システム500は、再生装置自体において実施される。このような場合、音声コンテンツを分析した後、再生装置は、音声コンテンツの再生に進み得る。更に、上述したように、場合によっては、再生装置は、(例えば、ゾーングループ、ステレオペア、又はサラウンドサウンド構成において)1つ又は複数の追加の再生装置と同期して音声コンテンツを再生するように構成可能である。このような状況において、再生装置は、恐らくはネットワークインタフェースを介して、1つ又は複数の追加の再生装置に(場合より修正された)音声コンテンツを提供し得る。
他の例において、処理システム500は、NMDにおいて実施される。このような場合、処理システム500は、NMD自体に、再生時に音声コンテンツのウェイクワードを無視させ得る。更に、NMDは、ウェイクワードを無視するように他のNMDに指示し得る。例えば、NMD132は、ウェイクワードを無視するようにNMD134に指示し得る。更に、NMDが再生装置(例えば、再生装置104)において実施される場合、NMD/再生装置は、他のNMD(これらも再生装置において実施されている場合がある)にウェイクワードを無視するように指示し得る。
f.複数のネットワーク装置の例
図6は、音声制御に基づいてオーディオ再生体験を提供するように構成可能な複数の装置600の例を示す。図6に示した装置が例示のみを目的とし、異なる及び/又は追加の装置を含む変形が可能となり得ることは、当業者に理解されよう。図示したように、複数の装置600は、計算装置604、606、608と、ネットワークマイクロホン装置(NMD)612、614、616と、再生装置(PBD)632、634、636、638と、コントローラ装置(CR)622とを含む。
複数の装置600のそれぞれは、例として特に、NFC、Bluetooth(登録商標)、イーサネット、及びIEEE802.11等の1つ又は複数のネットワークプロトコルにより、1種類以上のネットワークを介して、複数の装置において1つ又は複数の他の装置との通信を確立することが可能なネットワーク対応装置にし得る。1種類以上のネットワークは、例えば、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、パーソナルエリアネットワーク(PAN)等である。
図示したように、計算装置604、606、608は、クラウドネットワーク602の一部であってよい。クラウドネットワーク602は、追加の計算装置を含み得る。一例において、計算装置604、606、608は、異なるサーバであってもよい。他の例において、計算装置604、606、608のうちの2つ以上は、単一のサーバのモジュールであってもよい。同様に、計算装置604、606、608のそれぞれは、1つ又は複数のモジュール又はサーバを含み得る。本明細書での例示の目的を容易にするため、計算装置604、606、608のそれぞれは、クラウドネットワーク602内で特定の機能を実行するように構成可能である。例えば、計算装置608は、ストリーミング音楽サービス用の音声コンテンツのソースであってもよい。
図示したように、計算装置604は、通信経路642を介して、NMD612、614、616と連動するように構成可能である。NMD612、614、616は、1つ又は複数の「スマートホーム」システムの構成要素であってもよい。一例において、NMD612、614、616は、図1に示す装置の分布と同様に、住居全体に物理的に分布させ得る。他の例において、NMD612、614、616の2つ以上は、物理的に互いに比較的近接して配置され得る。通信経路642は、可能なものとして特に、インターネットを含むWAN、LAN、及び/又はPAN等の1種類以上のネットワークを含み得る。
一例において、NMD612、614、616の1つ又は複数は、主に音声検出用に構成された装置である。他の例において、NMD612、614、616の1つ又は複数は、様々な主要用途を有する装置の構成要素である。例えば、図2及び3に関連して上述したように、NMD612、614、616の1つ又は複数は、再生装置200のマイクロホン220又はネットワーク装置300のマイクロホン310であってもよい。更に、場合により、NMD612、614、616の1つ又は複数は、再生装置200又はネットワーク装置300であってもよい。一例において、NMD612、614、及び/又は616の1つ又は複数は、マイクロホンアレイに配置された複数のマイクロホンを含み得る。
図示したように、計算装置606は、通信経路644を介してCR622及びPBD632、634、636、638と連動するように構成可能である。一例において、CR622は、図2のネットワーク装置200等のネットワーク装置であってもよい。したがって、CR622は、図4のコントローラインタフェース400を提供するように構成可能である。同様に、PBD632、634、636、638は、図3の再生装置300等の再生装置であってもよい。そのため、PBD632、634、636、638は、図1に示すように、住居全体に物理的に分布させ得る。例示のために、PBD636及び638を結合ゾーン630の一部とする一方、PBD632及び634は、それぞれのゾーンの一部としてもよい。上述したように、PBD632、634、636、638は、動的に結合、グループ化、結合解除、及びグループ化解除され得る。通信経路644は、可能なものとして特に、インターネットを含むWAN、LAN、及び/又はPAN等の1種類以上のネットワークを含み得る。
一例において、NMD612、614、616と同様に、CR622及びPBD632、634、636、638は、1つ又は複数の「スマートホーム」システムの構成要素である。一例において、PBD632、634、636、638は、NMD612、614、616と同じ住居全体に分布させ得る。更に、上記で示唆したように、PBD632、634、636、638の1つ又は複数は、NMD612、614、616の1つ又は複数であってもよい。
NMD612、614、616は、ローカルエリアネットワークの一部としてよく、通信経路642は、NMD612、614、616のローカルエリアネットワークを計算装置604にWANを介して連結するアクセスポイントを含み得る(通信経路は図示せず)。同様に、NMD612、614、616のそれぞれは、そのようなアクセスポイントを介して互いに通信し得る。
同様に、CR622及びPBD632、634、636、638は、前節で説明したローカルエリアネットワーク及び/又はローカル再生ネットワークの一部にしてよく、通信経路644は、CR622及びPBD632、634、636、638のローカルエリアネットワーク及び/又はローカル再生ネットワークを、計算装置606にWANを介して連結するアクセスポイントを含み得る。そのため、CR622及びPBD632、634、636、638のそれぞれは、このようなアクセスポイントを介してそれぞれと通信し得る。
一例において、通信経路642及び644は、同じアクセスポイントを備え得る。一例において、NMD612、614、616、CR622、及びPBD632、634、636、638のそれぞれは、家庭用の同じアクセスポイントを介してクラウドネットワーク602にアクセスし得る。
図6に示すように、NMD612、614、616、CR622、及びPBD632、634、636、638のそれぞれは、更に、通信手段646を介して他の装置の1つ又は複数と直接通信し得る。本明細書に記載の通信手段646は、1種類以上のネットワークを介した、1つ又は複数のネットワークプロトコルによる、装置間の1つ又は複数の通信形態を含んでよく、及び/又は1つ又は複数の他のネットワーク装置を介した通信を含んでよい。例えば、通信手段646は、可能なものとして特に、Bluetooth(IEEE802.15)、NFC、ワイヤレスダイレクト、及び/又は独自のワイヤレスの1つ又は複数を含み得る。
一例において、CR622は、Bluetoothを介してNMD612と通信し、別のローカルエリアネットワークを介してPBD634と通信し得る。他の例において、NMD614は、別のローカルエリアネットワークを介してCR622と通信し、Bluetoothを介してPBD636と通信し得る。更に他の例では、PBD632、634、636、638のそれぞれは、ローカル再生ネットワークを介してスパニングツリープロトコルにより互いに通信し得る一方、ローカル再生ネットワークとは異なるローカルエリアネットワークを介して、CR622とそれぞれ通信する。他の例も可能である。
場合により、NMD612、614、616、CR622、及びPBD632、634、636、638間の通信手段は、装置間の通信の種類、ネットワーク条件、及び/又はレイテンシ要求に応じて変化し得る。例えば、NMD616がPBD632、634、636、638を有する住居に最初に導入される時には、通信手段646が使用されてもよい。一例において、NMD616は、NFCを介してPBD638に、NMD616に対応する識別情報を送信し、これに応じて、PBD638は、NFC(又は他の通信形態)を介してNMD616に、ローカルエリアネットワーク情報を送信し得る。しかしながら、NMD616が住居内で設定されると、NMD616とPBD638との間の通信手段は、変化し得る。例えば、NMD616は、その後、通信経路642、クラウドネットワーク602、及び通信経路644を介してPBD638と通信し得る。他の例において、NMD及びPBDは、ローカルの通信手段646を介して通信しなくてもよい。更に他の例において、NMD及びPBDは、主にローカルの通信手段646を介して通信してもよい。他の例も可能である。
説明のための例において、NMD612、614、616は、音声入力を受信してPBD632、634、636、638を制御するように構成可能である。利用可能な制御コマンドには、可能なものとして特に、再生音量制御、再生トランスポート制御、音楽ソース選択、グループ化等、前述した任意のメディア再生システム制御が含まれ得る。一例において、NMD612は、音声入力を受信して、PBD632、634、636、638の1つ又は複数を制御し得る。音声入力の受信に応じて、NMD612は、通信経路642を介して、処理のために音声入力を計算装置604に送信し得る。一例において、計算装置604は、音声入力を同等のテキストコマンドに変換し、テキストコマンドを解析してコマンドを特定し得る。その後、計算装置604は、テキストコマンドを計算装置606に送信し得る。他の例において、計算装置604は、音声入力を同等のテキストコマンドに変換し、次に、テキストコマンドを計算装置606に送信し得る。その後、計算装置606は、テキストコマンドを解析して、1つ又は複数の再生コマンドを特定し得る。
例えば、テキストコマンドが「「ゾーン1」の「ストリーミングサービス1」から「アーティスト1」による「トラック1」を再生」である場合、計算装置606は、(i)「ストリーミングサービス1」から利用可能な「アーティスト1」による「トラック1」のURL、及び(ii)「ゾーン1」の少なくとも1つの再生装置を特定し得る。この例において、「ストリーミングサービス1」からの「アーティスト1」による「トラック1」のURLは、計算装置608を指すURLであってよく、「ゾーン1」は、結合ゾーン630であってよい。そのため、URL及びPBD636及び638の一方又は両方を特定すると、計算装置606は、通信経路644を介して、PBD636及び638の一方又は両方に対して、特定したURLを再生のために送信し得る。PBD636及び638の一方又は両方は、これに反応して、受信したURLに従って計算装置608から音声コンテンツを取得し、「ストリーミングサービス1」から「アーティスト1」による「トラック1」の再生を開始し得る。
更に他の例において、計算装置604は、ユーザの関連コマンド又は意図を特定する何らかの処理を実行し、音声入力に関連するメディアコンテンツに関する情報を計算装置606へ提供し得る。例えば、計算装置604は、音声入力の音声テキスト化変換を実行し、音声入力を、コマンド又は意図(例えば、再生、一時停止、停止、音量アップ、音量ダウン、スキップ、次へ、グループ化、グループ化解除)について、どのようにコマンドを実行するかに関する他の情報と共に分析し得る。計算装置604又は計算装置606は、どのPBDコマンドが計算装置604により決定されたコマンド又は意図に対応するかを決定し得る。音声入力及び/又はコマンドの実行に関連する他の情報から決定されたコマンド又は意図は、計算装置604から計算装置606に送信され得る。計算装置604での処理は、アプリケーション、モジュール、アドオンソフトウェア、ネイティブのネットワークマイクロホンシステムのソフトウェアプラットフォームとの統合、及び/又はネイティブのネットワークマイクロホンシステムのソフトウェアプラットフォームにより実行し得る。
上記が単なる説明のための例に過ぎず、他の実施も可能であることは当業者に理解されよう。一例では、複数の装置600の1つ又は複数により実行される動作は、上述したように、複数の装置600内の1つ又は複数の他の装置が実行してもよい。例えば、音声入力からテキストコマンドへの変換は、NMD612、計算装置606、PBD636、及び/又はPBD638等の他の装置又は装置群が、代わりに、部分的に、又は全てを実行してもよい。同様に、URLの特定は、NMD612、計算装置604、PBD636、及び/又はPBD638等の別の装置又は装置群が、代わりに、部分的に、又は全てを実行してもよい。
f.ネットワークマイクロホン装置の例
図7は、図7のNMD712、714、716の1つ又は複数として構成可能なネットワークマイクロホン装置700の例の機能ブロック図を示す。図示したように、ネットワークマイクロホン装置700は、プロセッサ702、メモリ704、マイクロホンアレイ706、ネットワークインタフェース708、ユーザインタフェース710、ソフトウェアコンポーネント712、及びスピーカ714を含む。他のネットワークマイクロホン装置の構成及び配置も可能であることは、当業者に理解されよう。例えば、ネットワークマイクロホン装置は、スピーカ714を含まなくてもよく、又はマイクロホンアレイ706の代わりに単一のマイクロホンを有してもよい。
プロセッサ702は、汎用又は専用プロセッサ又はコントローラの形態となり得る1つ又は複数のプロセッサ及び/又はコントローラを含み得る。例えば、プロセッサ702は、マイクロホンプロセッサ、マイクロホンコントローラ、特定用途向け集積回路、デジタル信号プロセッサ等を含み得る。メモリ704は、これらの機能を実行するためにプロセッサ702により実行可能な1つ又は複数のソフトウェアコンポーネントをロード可能なデータストレージであってよい。したがって、メモリ704は、1つ又は複数の非一時的コンピュータ読み取り可能媒体を含むことができ、その例には、可能なものとして特に、ランダムアクセスメモリ、レジスタ、キャッシュ等の揮発性記憶媒体と、読み取り専用メモリ、ハードディスクドライブ、ソリッドステートドライブ、フラッシュメモリ、及び/又は光記憶装置等の不揮発性記憶媒体とが含まれ得る。
マイクロホンアレイ706は、ネットワークマイクロホン装置700の環境内の音を検出するように配置された複数のマイクロホンであってよい。マイクロホンアレイ706は、可能なものとして特に、コンデンサマイクロホン、エレクトレットコンデンサマイクロホン、又はダイナミックマイクロホン等、現在公知の又は今後開発される任意の種類のマイクロホンを含み得る。一例において、マイクロホンアレイは、ネットワークマイクロホン装置に対する1つ又は複数の方向からの音声を検出するように配置され得る。マイクロホンアレイ706は、周波数範囲の一部に対して感度を有し得る。一例において、マイクロホンアレイ706の第1のサブセットは、第1の周波数範囲に対して感度を有し、マイクロホンアレイの第2のサブセットは第2の周波数範囲に対して感度を有し得る。マイクロホンアレイ706は、更に、音源(例えば、声、可聴音)の位置情報を取り込むように、及び/又は背景雑音のフィルタリングを支援するように、配置され得る。特に、一部の実施形態において、マイクロホンアレイは、複数のマイクロホンではなく、単一のマイクロホンのみで構成されてもよい。
ネットワークインタフェース708は、様々なネットワーク装置間の無線及び/又は有線通信を容易にするように構成可能である。様々なネットワーク装置は、図7に関連して、可能なものとして特に、CR722、PBD732乃至738、クラウドネットワーク702内の計算装置704乃至708、及び他のネットワークマイクロホン装置等である。そのため、ネットワークインタフェース708は、これらの機能を達成するための任意の適切な形態にしてよく、その例には、イーサネットインタフェース、シリアルバスインタフェース(例えば、FireWire、USB2.0等)、無線通信を容易にするチップセット及びアンテナ、及び/又は有線及び/又は無線通信を提供する他の任意のインタフェースが含まれる。一例において、ネットワークインタフェース708は、業界標準(例えば、赤外線、無線、IEEE802.3を含む有線規格、IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移動体通信規格を含む無線規格等)に基づく。
ネットワークマイクロホン装置700のユーザインタフェース710は、ネットワークマイクロホン装置とのユーザのやりとりを容易にするように構成可能である。一例において、ユーザインタフェース708は、ユーザがネットワークマイクロホン装置700に直接入力を行うために、可能なものとして特に、1つ又は複数の物理的なボタン、タッチセンサ式画面及び/又は表面上に設けられたグラフィカルインタフェースを含み得る。ユーザインタフェース710は、更に、視覚及び/又は音声フィードバックをユーザに提供する1つ又は複数のライト及びスピーカ714を含み得る。一例において、ネットワークマイクロホン装置700は、更に、スピーカ7714を介して音声コンテンツを再生するように構成可能である。
III.ウェイク応答を無効にする再生装置の技術の例
上述したように、本明細書に記載の実施形態は、ウェイク応答を無効にすることを含み得る。図8は、再生装置が1つ又は複数のNMDのウェイク応答を無効にする実施800の例を示す。
a.再生用の音声コンテンツを表すデータを受信
ブロック802において、実施802は、再生用の音声コンテンツを表すデータを受信することを含む。例えば、再生装置は、再生装置による再生用の音声コンテンツを受信し得る。再生装置の例には、図1に示した再生装置102、104、106、108、110、112、114、116、118、120、112、124の何れかが含まれ、例えば、図2の再生装置200に示したように実施され得る。一部の実施において、再生装置は、処理システム(例えば、処理システム500)を含み、オーディオ音声入力/出力コンポーネント(図5のオーディオ音声入力/出力コンポーネント502等)を用いて音声コンテンツを表すデータを受信し得る。
音声コンテンツの例には、多くの音声コンテンツの形態の中で特に、1つ又は複数の音声トラック、トークショー、映画、テレビ番組、ポッドキャスト、インターネットストリーミングビデオが含まれる。音声コンテンツは、映像を伴う音声コンテンツ(例えば、ビデオの音声トラック)又は映像を伴わない音声を含み得る。
再生装置は、例として特に、有線若しくは無線ネットワークインタフェース又はアナログ若しくはデジタルラインインインタフェースである入力インタフェースを介して音声コンテンツを受信し得る。例えば、再生装置は、可能なものとして特に、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、パーソナルエリアネットワーク(PAN)等の1種類以上のネットワーク経由で、ネットワークインタフェースを介してネットワークソースから音声コンテンツを受信し得る。
再生装置は、ローカル又はリモート音源から音声コンテンツを表すデータを受信し得る。例えば、再生装置は、ローカルメディアサーバ又はローカルエリアネットワーク上の他の装置から、媒体(CD、DVD、Blu−Ray(登録商標)、フラッシュメモリ、ハードドライブ等)から、又は再生装置自体のデータストレージから、音声コンテンツを受信し得る。媒体は、再生装置により、又は(例えば、ローカルエリアネットワーク経由でネットワークインタフェースを介して)再生装置と通信する他の装置により読み取られる。再生装置は、恐らくは1つ又は複数のクラウドサーバから、音声コンテンツストリームとして音声コンテンツを受信し得る。例えば、再生装置は、URLからネットワークインタフェースを介して音声コンテンツストリームを取得し得る。又は、再生装置は、再生装置上又は(例えば、ネットワークインタフェースを介したローカルエリアネットワーク経由で)再生装置と通信する他の装置上のラインインインタフェースから、音声コンテンツを受信し得る。
場合により、再生装置は、恐らくはアナログラインインインタフェースを介して、アナログ形式で音声コンテンツを受信し得る。このような場合、再生装置は、(例えば、ソフトウェア又はハードウェアに基づくアナログ/デジタル変換器を用いて)アナログ音声を処理に適した形式にデジタル化する。又は、再生装置と通信する装置は、アナログ形式で音声コンテンツを受信し、音声コンテンツをデジタル化し、音声コンテンツを表すデータを再生装置に送信し得る。
上述したように、受信した音声コンテンツは、再生装置による再生用に設計されている。例えば、制御装置(図1の制御装置126又は128等)は、恐らくはそのコンテンツを再生装置の再生キューに入れることにより、特定の音声コンテンツを再生するように再生装置に指示し得る。音声トラック又はその他の音声コンテンツを、このようなキューに入れることにより、恐らくは制御装置又は再生装置自体における制御(例えば、再生/一時停止ボタン)を介して再生が開始された後、再生装置は、音声コンテンツを取得する。再生装置は、ローカル又はリモート音源から音声コンテンツを取得し得る。音声コンテンツの取得は、例として特に、ネットワークインタフェースを介して音声コンテンツストリームを再生装置へ送ることにより、又はアナログ若しくはデジタルラインインインタフェースを介して音声コンテンツを再生装置へ送ることにより行われる。
例の中で、再生装置は、受信した音声コンテンツの少なくとも一部をメモリに記憶し得る。例えば、再生装置は、受信した音声コンテンツを先入れ先出しバッファ(例えば、循環バッファ)にバッファリングし得る。このような実施において、受信した音声の一部は、受信時にバッファに記憶され、受信した音声コンテンツにウェイクワードが含まれるかを再生装置が判断できるように処理されると削除される。
b.音声コンテンツにおいて1つ又は複数のウェイクワードを検出
図8を再び参照すると、ブロック804において、実施800は、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて1つ又は複数のウェイクワードを検出することを含む。例えば、再生装置は、音声コンテンツを表す受信データを分析して、何れかの音声サービス用のウェイクワードが、音声コンテンツの再生時に聞き取り可能に再生されるように音声コンテンツ内で表されているかを判断し得る。上述したように、一部の実施において、再生装置は、処理システム(例えば、処理システム500)を含み、ウェイクワード検出コンポーネント(図5のウェイクワード検出コンポーネント504等)を用いて音声コンテンツ内のウェイクワードを検出し得る。
再生装置は、1つ又は複数のウェイクワード検出アルゴリズムを用いて、受信した音声コンテンツを分析し得る。ウェイクワード検出アルゴリズムの例は、音声記録を入力として受け取り、その記録にウェイクワードが存在するかを示すインジケーションを出力として提供する。多くのファーストパーティ及びサードパーティのウェイクワード検出アルゴリズムが公知であり、市販されている。例えば、音声サービスの運営者は、そのアルゴリズムのサードパーティの装置での使用を可能にし得る。又は、特定のウェイクワードを検出するようにアルゴリズムをトレーニングし得る。
一部の実施において、再生装置は、マイクロホンを介して記録された音声内のウェイクワードを検出するためにNMDが利用するものと同じ又は類似するアルゴリズムを、音声コンテンツを表す受信データに対して使用し得る。このようにして、再生装置は、音声コンテンツがNMDの可聴範囲で再生されたかをNMDが検出するものと同じ又は類似するウェイクワードを、音声コンテンツにおいて検出し得る。しかしながら、NMDは、通常、変化する環境条件(例えば、場合により騒音の多い住居)において幅広い人間の声で話されたマイクロホン録音音声に対してウェイクワード検出アルゴリズムを実行することを考えると、このような変化の可能性がない受信音声コンテンツに対してウェイクワードアルゴリズムを動作させることは、ウェイクワードの検出において更に効果的となり得る。
分析中、再生装置は、受信した音声コンテンツ内で各ウェイクワードが発生する場所を判断し得る。ウェイクワードを含むと判断された音声コンテンツの部分を特定した後、再生装置は、1つ又は複数のタイムスタンプ(例えば、ウェイクワードの開始時間を示すタイムスタンプ、及び恐らくはウェイクワードの停止時間を示す別のタイムスタンプ)を使用して、これらの音声コンテンツの部分を記録し得る。最終的に、これらのタイムスタンプを使用して、各タイムスタンプに対応するウェイクワードに対する1つ又は複数のNMDのウェイク応答を無効にし得る。
一例において、再生装置は、受信した音声コンテンツを既知の長さのセグメントに分割し得る。次に、再生装置は、ウェイクワードが検出されたセグメントを特定することにより、ウェイクワードを含む音声コンテンツの部分、即ちセグメント、を特定する。例えば、各セグメントの長さが3秒であり、ウェイクワードが第4のセグメントで検出された場合、ウェイクワードは、記録の9乃至12秒の間に位置することになる。一部の例において、再生装置は、ウェイクワードが分割され、認識不能な部分(例えば、「Hey」を表すセクションと、「Siri」を表す別のセグメント)となることを避けるために、音声記録を重複するセグメントに分離してもよい。音声記録内のウェイクワードの位置を決定する他の技術を利用することもできる。
一部の例において、再生装置は、受信した音声コンテンツに対して複数のウェイクワード検出アルゴリズムを同時に(又は実質的に同時に)実行する。上述したように、様々な音声サービス(例えば、AMAZONのALEXA、APPLEのSIRI、又はMICROSOFTのCORTANA)では、それぞれの音声サービスの呼び出しに異なるウェイクワードを使用している。更に、一部の音声サービスでは、ユーザが好きなウェイクワードを選択すること、又はカスタムウェイクワードを設定することができる。複数のサービス(及び/又は異なるウェイクワード)をサポートするために、再生装置は、受信した音声コンテンツに対して、サポートしている各音声サービス用のウェイクワード検出アルゴリズムを並行して実行し得る。例えば、再生装置は、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第1の音声サービス用の少なくとも1つの第1のウェイクワードを検出するために第1の音声サービス用の第1の音声検出アルゴリズムを適用し、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第2の音声サービス用の少なくとも1つの第2のウェイクワードを検出するために第2の音声サービス用の第2の音声検出アルゴリズムを適用し得る。再生装置は、場合によってはそれぞれの音声サービスのために、追加の音声検出アルゴリズムを音声コンテンツに適用してもよい。
c.音声コンテンツの再生中、1つ又は複数のNMDにおいて検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効化
図8では、ブロック806において、実施800は、音声コンテンツの再生中、1つ又は複数のネットワークマイクロホン装置において検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることを含む。例えば、再生装置は、音声コンテンツの再生中、再生装置の可聴範囲内にあるNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。上述したように、再生装置は、通知コンポーネント(例えば、図5の通知コンポーネント506)を含む処理システム500を実施し、通知コンポーネントを用いて、1つ又は複数のNMDにおいて、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。
上述したように、NMDのウェイク応答とは、ウェイクワードの検出に対するプログラムされた応答を指す。ウェイク応答が有効な場合、ウェイクワードの検出に応じて、NMDのウェイク応答により、NMDは、マイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取る。NMDは、音声サービスを呼び出して音声コマンドを実行する。しかしながら、ウェイク応答が無効である場合、NMDは、音声コマンドを聞き取らなくてもよく、音声コマンドを実行するために音声サービスを呼び出さない。
一部の実施において、再生装置自体がNMDを含む(例えば、NMD700が再生装置内で実施される)。このような実施では、再生装置が音声コンテンツを再生している間、再生装置は、検出された1つ又は複数のウェイクワードに対する、自装置のNMDのウェイク応答を無効にする。例えば、再生装置において実施された処理システム500のインスタンスは、1つ又は複数のウェイクワード及びそれらに対応する再生時間をNMDに通知して、検出された1つ又は複数のウェイクワードに対するNMDのウェイク応答をNMDにおいて無効にする。例えば、処理システムは、例として特に、ウェイク応答を無効にするためにRAM内のフラグを変更することにより、又は内部通信バスを使用してNMDにメッセージを送ることにより、NMDに通知し得る。その後、音声コンテンツの再生中、再生装置のNMDは、マイクロホンを介して、再生装置により再生されている音声コンテンツを記録し、記録済み音声コンテンツ内の1つ又は複数のウェイクワードに対するNMDのそれぞれのウェイク応答を無効にする。
実施の例の中で、再生装置は、住居内の全てのネットワークマイクロホン装置において、それぞれのウェイク応答を無効にさせ得る。例えば、図1に示した再生装置104は、1つ又は複数のウェイクワードを含む音声コンテンツを再生装置104が再生する時に、NMD132及び134において、それぞれのウェイク応答を無効にさせ得る。更に、再生装置102又は106乃至124の何れかがNMDを実施する場合、再生装置104は、再生装置104が1つ又は複数のウェイクワードを含む音声コンテンツを再生する時に、これらの再生装置において、それぞれのウェイク応答を無効にさせ得る。更に、再生装置104自体がNMDを実施する場合、又は制御装置126又は128がNMDを実施する場合、再生装置104は、再生装置104が音声コンテンツを再生する時に、これらの装置において、それぞれのウェイク応答を無効にさせ得る。
又は、再生装置は、住居内のNMDのサブセットにおいて、それぞれのウェイク応答を無効にさせ得る。例えば、再生装置は、再生装置の可聴範囲内のNMDにおいて、それぞれのウェイク応答を無効にさせ得る。又は、再生装置は、再生装置に関連付けられたNMDにおいて、それぞれのウェイク応答を無効にさせ得る。
可聴範囲は、任意の適切な技術を用いて判断し得る。一部の実施において、可聴範囲は、再生装置の再生構成に基づいて確立される。例えば、再生装置が1つ又は複数の再生装置との同期再生構成にある場合、これらの再生装置は、当該再生装置の可聴範囲にあると考えられる。したがって、これらの再生装置の何れかがNMDを実施している場合、これらの再生装置のそれぞれのウェイク応答は、無効化される。再生装置は、住居内の再生装置間で同期される1つ又は複数の状態変数に記憶され得る再生装置の構成を参照することにより、このようなNMDが再生装置の可聴範囲内にあることを判断し得る。
他の例において、可聴範囲は、設定手順(例えば、較正手順)中に確立される。このような設定手順中に、住居内のNMDに対して、住居内の再生装置により再生される音声信号(例えば、トーン音)を聞き取るように指示することができる。NMDがマイクロホンを介して音声信号を検出できる場合、そのNMDは、可聴範囲内にあると考えられる。住居内の再生装置は、異なる音声で音声信号の再生を繰り返すように指示されて、任意の音声レベルで各再生装置の可聴範囲内にあるNMDの組を決定してもよい。較正手順の例には、住居内のNMDによる検出対象となる音声信号の役割も果たし得る較正音の出力が含まれ得る。
例示として、設定手順の例の間、図1の制御装置126は、主寝室ゾーン内の再生装置に、音声信号を出力するように指示し得る(即ち、再生装置122及び124)。殆どの音量レベルでは、この出力は、NMD134により検出される。しかしながら、音量レベルが上がると、他のNMDも出力を検出し始める。例えば、再生装置118及び制御装置128は、それぞれNMDを実施し、比較的高い音量レベルで音声信号出力を検出し得る。そのため、設定手順の例により、NMD134は、特定の音量範囲(例えば、5%乃至100%)において、再生装置122及び124の可聴範囲内にあるものとして確立され、再生装置118及び制御装置128は、特定の更に高い音量範囲(例えば、音量レベル80%超)において、再生装置122及び124の可聴範囲内にあるものと見做される。この手順は、住居内の他の再生装置及びNMDに対して繰り返すことができる。
他の例において、NMDは、既知の物理的近接度に基づいて1つ又は複数の再生装置とペアリングし得る。例えば、図1を再び参照すると、NMD134は、主寝室ゾーンのNMDとして再生装置122及び/又は124とペアリングし得る。このようなペアリングは、制御装置126又は128等の制御装置上のユーザインタフェースを介して構成可能である。他の例として、NMD132は、NMD132がキッチンゾーンとペアリングされ、キッチンゾーンがダイニングルーム及び/又はリビングルームゾーンと物理的に近接していることが既知であるという理由から、又はキッチンゾーンがダイニングルーム又はリビングルームゾーンと共にゾーングループを形成しているという理由から、再生装置104、106、108、110、112、及び/又は114とペアリングされてもよい。NMDが1つ又は複数の再生装置とペアリングされている場合、NMDは、これらの再生装置の可聴範囲内にあると考えてもよい。
メディア再生システムの再生装置近傍にあるNMDの存在を判断する他の例は、2016年4月14日提出の特許出願第15/098,867号「デフォルト再生装置の指定」、2016年4月14日提出の特許出願第15/098,892号「デフォルト再生装置」、特許出願第15/237,133号「音声応答の再生」、及び2016年8月5日提出の特許出願第15/229,855号「オーディオ再生装置に対するネットワークマイクロホン装置の方向の決定」において説明されている。これらの出願のそれぞれは、出典を明記することによりその開示内容全体を本願明細書の一部とする。
上記で示唆したように、場合により、再生装置は、恐らくはゾーングループ、ステレオペア、又はサラウンドサウンド構成において、1つ又は複数の追加の再生装置と同期して音声を再生するように構成される。このような構成では、当該再生装置又は1つ又は複数の追加の再生装置の何れかの可聴範囲内の任意のNMDが、これらの同期した再生装置により再生された音声コンテンツ内のウェイクワードに応答して誤ってトリガされると、再生装置の可聴範囲が拡張される場合がある。そのため、再生装置が現在1つ又は複数の追加の再生装置と共に同期再生構成にある場合、再生装置は、可聴範囲内にあるか又はこれらの追加の再生装置と他の形で関連付けられているNMDのそれぞれのウェイク応答を無効にし得る。
一部の実施において、再生装置は、受信した音声コンテンツの再生中に、ネットワークインタフェースを介して、1つ又は複数のNMDに対して1つ又は複数それぞれのウェイク応答を無効にさせる命令を送信することにより、1つ又は複数のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる。上述したように、メディア再生システムの様々な装置(例えば、制御装置、再生装置、及びNMD)は、ローカルエリアネットワークを介して(例えば、図1の有線又は無線ネットワークルータ130により形成されたローカルエリアネットワークを介して)相互接続され、住居内の装置間での命令及び他のメッセージのやりとりを許可してもよい。メディア再生システムのこれらの装置は、それぞれシステム内の他の装置からの特定の命令に応答するようにプログラムし得る。
一部の例において、このような命令は、ウェイクワードが再生装置により再生される際に、1つ又は複数のNMDがウェイクワードを検出することを防止する。例えば、再生装置は、1つ又は複数の期間(即ち、恐らくはタイムスタンプにより記録された、ウェイクワードが再生装置により再生される時間に対応する期間)に亘り、ウェイクワードの聞き取りを停止する(例えば、記録された音声の処理を停止する)ように1つ又は複数のNMDに指示し得る。又は、再生装置は、それぞれのマイクロホンを一時的に(例えば、上述した期間中)無効にするように1つ又は複数のNMDに指示し得る。更に他の例として、再生装置は、NMDがウェイクワードを検出しないように、再生装置がマイクロホンアレイを使用する方向にリスニングNULLを作成するように1つ又は複数のNMDに指示し得る。他の例も可能である。例えば、再生装置がウェイクワードを含む音声コンテンツの部分を再生する直前に、再生装置は、ウェイクワードの検出を無効にするように1つ又は複数のNMDに指示する第1のメッセージを送信し得る。その後、再生装置がウェイクワードを含む音声コンテンツの部分を再生した直後に、再生装置は、ウェイクワードの検出を有効にするように1つ又は複数のNMDに指示する第2のメッセージを送信し得る。
例示として、図9は、再生装置が、1つ又は複数のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせるために、1つ又は複数のNMDに送信し得るメッセージ900の例を示す。メッセージ900は、IEEE802.3の仕様(イーサネットパケット及びフレームの構造を指定)等の仕様に準拠したものにし得る。図示したように、メッセージ900は、ネットワーク上の装置(例えば、特にNMD、再生装置、及び/又は制御装置)が受信者クロックを同期させるのに用い得る反転ビットのパターンを含むプリアンブル902を含む。メッセージ900は、更に、プリアンブルの終わり(イーサネットパケットの第1のフィールド)とメッセージのイーサネットフレーム部分の始まりとを示すフレームデリミタの開始(SFD)904を含む。メッセージ900は、更に、宛先(例えば、NMD)及び送信元(例えば、再生装置)を示す宛先アドレス906及び送信元アドレス908を含む。メッセージ900は、更に、ペイロード910を含む。ペイロード910は、NMD(即ち、宛先アドレス906が示すNMD)に対して、1つ又は複数のウェイクワードに対するウェイク応答を無効にさせる命令を含む。メッセージ900は、更に、受信したフレーム内の破損データの検出を可能にする巡回冗長検査値であるフレームチェックシーケンス(FCS)912を含む。
命令は、2つ以上のイーサネットパケット(例えば、2つ以上のメッセージ900)を用いて送信し得る。例えば、1つのNMDへの命令は、メッセージ900の2つ以上のインスタンスのペイロードにわたって分割し得る。更に、複数のNMDへの命令は、それぞれメッセージ900の1つ又は複数の各インスタンスにおいて送信され得る。他の例も可能である。
例として、図10A、10B、10C、10Dは、1つ又は複数のメッセージのペイロード(例えば、メッセージ900のペイロード910)においてNMDに送信される、命令1000A、1000B、100C、100Dの例を示す。図10Aに示したように、命令1000Aは、タイムスタンプ1004A、1006A、1008A、1010Aにより定義される特定の期間中、NMDにウェイク応答を無効にさせるコマンド1002Aを含む。一部の例において、タイムスタンプ1004A及び1006Aは、再生装置が第1のウェイクワードを含む音声コンテンツの部分を再生する期間の開始及び終了をそれぞれ指定する。同様に、タイムスタンプ1008A及び1010Aは、再生装置が第2のウェイクワードを含む音声コンテンツの部分を再生する期間の開始及び終了をそれぞれ指定し得る。命令1000Aは、追加の期間を定義するタイムスタンプを更に含み得る。又は、スタンプ1004A、1006A、1008A、1010Aは、例として特に、音声の特定のフレームの再生時間、送信又は受信装置のシステムクロックに対応する時間、又は、NMD及び再生装置の両方が知るグローバルクロックに対応する時間に対応し得る。
図10Bは、座標1004B及び1006Bにより定義される特定の方向でNMDにリスニングNULLを作成させるコマンド1002Bを含む命令100Bを示す。座標1004B及び1006Bは、NMDに対するそれぞれの再生装置の方向を示す。例えば、図1を再度参照すると、命令1000Bのインスタンスの例は、NMD134に対する再生装置122及び124の方向を示す座標1004B及び1006Bを含み得る。この例では、座標1004B及び1006Bは、再生装置122がNMD134に対して0°(即ち、NMD134の前)であり、再生装置122がNMD134に対して左45°であることを、NMD134に示し得る。住居内のそれぞれの装置の相対的な位置は、セットアップ又は構成手順により事前に確立することができる。
図10C及び10Dは、それぞれ命令100C及び100Dを示す。命令1000Cは、受信するNMDにウェイクワードの検出を無効にさせるコマンド1002Cを含む。再生装置は、ウェイクワードを含む音声コンテンツの部分を再生する直前に、このような命令を送信し得る。命令100Dは、受信するNMDにウェイクワードの検出を有効にさせるコマンド1002Dを含む。再生装置は、ウェイクワードを含む音声コンテンツの部分を再生した直後に、このような命令を送信し得る。
更に他の例において、1つ又は複数のNMDは、ウェイクワードを検出し得るが、再生装置は、1つ又は複数のNMDに、そのウェイク応答を抑制するように指示する。例えば、再生装置は、特定の期間中、ウェイクワードを無視するように、又は特定の期間中、全ての音声を無視するように、1つ又は複数のNMDに指示し得る。他の例も可能である。
他の例として、再生装置は、音声コンテンツ(又は音声コンテンツの一部)内のウェイクワードの数をカウントし得る。例えば、再生装置は、音声コンテンツの例において3つのウェイクワードを検出する場合がある。上述したように、このようなインスタンスは、異なる音声サービスの異なるウェイクワードを含め、ウェイクワードの任意の組み合わせを含み得る。次に、再生装置は、カウントと等しい数のウェイクワードを検出するまでウェイクワードを無視するように(例えば、次の3つのウェイクワードを無視するように)、近傍の1つ又は複数のNMDに指示し得る。
又は、再生装置は、音声コンテンツを動的に修正して音声コンテンツのセグメントに音響マーカを組み込むことにより、1つ又は複数のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる。例えば、再生装置は、記録済み音声コンテンツに音声トーン又は他のマーカを挿入(例えば、ミックス)し、音声コンテンツ内で検出されるウェイクワードを指定し得る。次に、ウェイクワードに関連する音声マーカを検出した場合(ウェイクワードの直前又はウェイクワードと同時に)、ウェイクワードのインスタンスを無視するように、NMDに指示すること又はNMDを事前にプログラムすることができる。このような技術を使用することで、再生装置の可聴範囲内にあるNMDを事前に決定又は推定する必要がなくなる。寧ろ、音響マーカが音声コンテンツと共に再生されるため、音声コンテンツを検出する可聴範囲内にある(そのため、このコンテンツにより誤ってトリガされる恐れがある)NMDは、音響マーカを検出する範囲内にもあり、これに反応して、ウェイク応答を無効にする。複数のNMDが再生装置の可聴範囲内にある場合、ウェイクワードを検出する各NMDは、関連する音響マーカを検出したことを受け、これに反応してウェイクワードに対するウェイク応答を無効にする。
d.音声コンテンツを再生
図8では、ブロック808において、実施800は、1つ又は複数のスピーカを介して音声コンテンツを再生することを含む。再生装置は、1つ又は複数のオーディオトランスデューサ(例えば、スピーカ)を介して音声コンテンツを再生する。一部の例において、スピーカは、同じハウジング内で再生装置と共に配置される。又は、再生装置は、スピーカジャックを介して、増幅された音声を1つ又は複数の別個のパッシブスピーカに提供し得る。他の例として、再生装置は、ラインレベルの音声をアンプに提供することにより音声コンテンツを再生してもよく、アンプは、その後、スピーカジャックを介して1つ又は複数のパッシブスピーカに増幅された音声を提供する。
上述したように、一部の例において、再生装置は、1つ又は複数の追加の再生装置との同期再生構成となるように構成される。このような場合、音声コンテンツを再生することは、1つ又は複数の追加の再生装置と同期して音声コンテンツを再生することを含む。一部の再生構成(例えば、ステレオペア又はサラウンド)において、再生構成内の各再生装置は、再生構成内の他の再生装置と同期して音声コンテンツの一部を再生する。
一部の実施において、再生装置は、再生のために1つ又は複数の追加の再生装置に音声コンテンツを提供して、その音声コンテンツの当該再生装置との同期再生を容易にする。このような実施形態において、再生装置は、再生装置及び1つ又は複数の追加の再生装置を含む同期グループのグループコーディネータとして動作し得る。グループコーディネータとして、再生装置は、タイミング情報を1つ又は複数の追加の再生装置に追加的に提供し、同期グループスケジューリング同期再生を容易にし得る。再生装置は、ネットワークインタフェースを介して音声コンテンツ及び/又はタイミング情報を提供する。
上述したように、場合により、再生装置は、音声コンテンツを修正して音響マーカを含める。このような実施形態では、再生装置が同期グループ内にある場合、再生装置は、修正された音声コンテンツを同期グループの他の再生装置に提供し得る。同期グループ内の各再生装置は、修正された音声コンテンツを、グループ内の他の再生装置と同期して再生し得る。
例示として、一例において、再生装置114及び122及び124は、音声コンテンツを同期して再生するように構成されたゾーングループ(即ち、キッチン+主寝室ゾーングループ)内にある。ゾーングループによる再生に指定された音声コンテンツ内のウェイクワードを検出した後、再生装置114は、音声コンテンツ内のウェイクワードを指定する音響マーカを含めるように音声コンテンツを修正し得る。その後、再生装置114は、修正された音声コンテンツの同期再生を容易にするため、修正された音声コンテンツを再生装置122及び/又は124に提供し得る。
IV.ウェイク応答を無効にするNMDの技術の例
上述したように、本明細書に記載の実施形態は、ウェイク応答を無効にすることを含み得る。図11は、NMDが1つ又は複数の検出ウェイクワードに対するウェイク応答を無効にする実施1100の例を示す。
a.再生用の音声コンテンツを表すデータを受信
ブロック1102において、実施1100は、記録済み音声コンテンツを表すデータを受信することを含む。例えば、NMDは、再生装置により再生するための音声コンテンツを受信し得る。NMDの例には、図1に示したNMD132及び134の何れかが含まれ、例えば、図7のNMD700として実施される。再生装置の例には、図1に示した再生装置102、104、106、108、110、112、114、116、118、120、112、124の何れかが含まれ、例えば、図2の再生装置200により表したように実施し得る。NMDの他の例には、これらの再生装置及び/又は制御装置126及び128の何れかを含めてよく、これらの装置は、再生又は制御装置としての機能に加えてNMDを実施し得る。NMDは、処理システム(例えば、処理システム500)を含み、オーディオ音声入力/出力コンポーネント(図5のオーディオ音声入力/出力コンポーネント502等)を使用して音声コンテンツを表すデータを受信し得る。
NMDは、例として特に有線若しくは無線ネットワークインタフェース又はアナログ若しくはデジタルラインインインタフェースである入力インタフェースを介して、音声コンテンツを受信し得る。例えば、NMDは、可能なものとして特に、WAN、LAN、PAN等の1種類以上のネットワーク経由で、ネットワークインタフェースを介してネットワークソースから音声コンテンツを受信し得る。
NMDは、ローカル又はリモート音源から音声コンテンツを表すデータを受信し得る。例えば、NMDは、ローカルメディアサーバ又はローカルエリアネットワーク上の他の装置から、媒体(CD、DVD、Blu−Ray、フラッシュメモリ、ハードドライブ等)から、又はNMD自体のデータストレージから、音声コンテンツを受信し得る。媒体は、NMDにより、又はNMDと通信する他の装置(例えば、ローカルエリアネットワーク経由でネットワークインタフェースを介してNMDに接続された再生装置)により読み取られる。
NMDは、恐らくは1つ又は複数のクラウドサーバから、音声コンテンツストリームとして音声コンテンツを受信し得る。例えば、NMDは、URLからネットワークインタフェースを介して音声コンテンツストリームを取得し得る。又は、NMDは、NMD上又はNMDと通信する他の装置(例えば、ローカルエリアネットワーク経由でネットワークインタフェースを介してNMDに接続された再生装置)上のラインインインタフェースから、音声コンテンツを受信し得る。
場合により、NMDは、恐らくはアナログラインインインタフェースを介して、アナログ形式で音声コンテンツを受信し得る。このような場合、NMDは、(例えば、ソフトウェア又はハードウェアに基づくアナログ/デジタル変換器を用いて)アナログ音声を処理に適した形式にデジタル化する。又は、NMDと通信する装置(例えば、再生装置)は、アナログ形式で音声コンテンツを受信し、音声コンテンツをデジタル化し、音声コンテンツを表すデータを再生装置に送信し得る。
上述したように、受信した音声コンテンツは、再生装置による再生用に設計されている。例えば、制御装置(図1の制御装置126又は128等)は、恐らくはそのコンテンツを再生装置の再生キューに入れることにより、特定の音声コンテンツを再生するように再生装置に指示し得る。音声トラック又はその他の音声コンテンツを、このようなキューに入れることにより、恐らくは制御装置又は再生装置自体における制御(例えば、再生/一時停止ボタン)を介して再生が開始された後、再生装置は、音声コンテンツを取得する。NMDは、このキューにアクセスし得る(例えば、キューの内容は、LAN又は他のネットワークを介してNMDと共有し得る)。このようなアクセスがあれば、NMDは、ローカル又はリモート音源から音声コンテンツを取得し得る。音声コンテンツの取得は、例として特に、ネットワークインタフェースを介して音声コンテンツストリームをNMDへ送ることにより、又はアナログ若しくはデジタルラインインインタフェースを介して音声コンテンツを再生装置へ送ることにより行われる。
場合により、受信した音声コンテンツは、2つ以上の再生装置による再生用に設計されている。例えば、2つ以上の再生装置は、同期グループ(ゾーングループ、ステレオペア、又はサラウンドサウンド構成等)となるように構成可能である。特定の音声コンテンツは、この同期グループによる再生用に指定し得る。
例において、処理システム500は、受信した音声コンテンツの少なくとも一部をメモリに記憶し得る。例えば、処理システム500は、受信した音声コンテンツを先入れ先出しバッファ(例えば、循環バッファ)にバッファリングし得る。このような実施において、受信した音声の一部は、受信時にバッファに記憶され、受信した音声コンテンツにウェイクワードが含まれるかを再生装置が判断できるように処理されると削除される。
b.音声コンテンツにおいて1つ又は複数のウェイクワードを検出
図11では、ブロック1104において、実施1100は、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて1つ又は複数のウェイクワードを検出することを含む。例えば、NMDは、音声コンテンツを表す受信データを分析して、何れかの音声サービス用のウェイクワードが、音声コンテンツの再生時に聞き取り可能に再生されるように音声コンテンツ内で表されているかを判断し得る。上述したように、一部の実施において、NMDは、処理システム(例えば、処理システム500)を含み、ウェイクワード検出コンポーネント(図5のウェイクワード検出コンポーネント504等)を用いて音声コンテンツ内のウェイクワードを検出され得る。
NMDは、1つ又は複数のウェイクワード検出アルゴリズムを用いて、受信した音声コンテンツを分析し得る。ウェイクワード検出アルゴリズムの例は、音声記録を入力として受け取り、その記録にウェイクワードが存在するかを示すインジケーションを出力として提供する。多くのファーストパーティ及びサードパーティのウェイクワード検出アルゴリズムが公知であり、市販されている。例えば、音声サービスの運営者は、そのアルゴリズムのサードパーティの装置での使用を可能にし得る。又は、アルゴリズムは、特定のウェイクワードを検出するようにトレーニングされてもよい。
通常の動作において、NMDは、住居又は他の環境でマイクロホンを介して音(例えば、人間の声)を聞き取り、その音の音声記録にウェイクワード検出アルゴリズムを実行して、音にウェイクワードが含まれていたかを検出する。この処理において、NMDは、人間の声で話されたウェイクワードを検出するためにNMDにより使用されるものと同じ又は類似のアルゴリズムを使用し得る。但し、アルゴリズムへの入力は、マイクロホンを介して記録された音声ではなく、再生装置による再生用の音声コンテンツとなる。このようにして、NMDは、音声コンテンツがNMDの可聴範囲内で再生されたかを検出する際と同じ又は類似するウェイクワードを、音声コンテンツにおいて検出し得る。しかしながら、NMDは、通常、変化する環境条件(例えば、場合により騒音の多い住居)において幅広い人間の声で話されたマイクロホン録音音声に対してウェイクワード検出アルゴリズムを実行することを考えると、このような変化の可能性がない受信音声コンテンツに対してウェイクワードアルゴリズムを動作させることは、ウェイクワードの検出において更に効果的となり得る。
分析中、NMDは、受信した音声コンテンツ内で各ウェイクワードが発生する場所を判断し得る。ウェイクワードを含むと判断された音声コンテンツの部分を特定した後、NMDは、1つ又は複数のタイムスタンプ(例えば、ウェイクワードの開始時間を示すタイムスタンプ、及び恐らくはウェイクワードの停止時間を示す別のタイムスタンプ)を使用して、これらの音声コンテンツの部分を記録し得る。最終的に、これらのタイムスタンプを使用して、各タイムスタンプに対応するウェイクワードに対するNMDのウェイク応答を無効にし得る。
一例において、NMDは、受信した音声コンテンツを既知の長さのセグメントに分割し得る。次に、NMDは、ウェイクワードが検出されたセグメントを特定することにより、ウェイクワードを含む音声コンテンツの部分、即ちセグメント、を特定する。例えば、各セグメントの長さが4秒であり、ウェイクワードが第6のセグメントで検出された場合、ウェイクワードは、記録の20乃至24秒の間に位置することになる。一部の例において、NMDは、ウェイクワードが分割され、認識不能な部分(例えば、「Hey」を表すセクションと、「Aelxa」を表す別のセグメント)となることを避けるために、音声記録を重複するセグメントに分離してもよい。音声記録内のウェイクワードの位置を決定する他の技術を利用することもできる。
一部の例において、NMDは、受信した音声コンテンツに対して複数のウェイクワード検出アルゴリズムを同時に実行する。上述したように、様々な音声サービス(例えば、AMAZONのALEXA、APPLEのSIRI、又はMICROSOFTのCORTANA)では、それぞれの音声サービスの呼び出しに異なるウェイクワードを使用している。更に、各音声サービスは、複数のウェイクワード及び/又はカスタムウェイクワードをサポートし得る。複数の音声サービスをサポートするために、NMDは、音声コンテンツ内で表される可能性のある異なるウェイクワードを検出するように、受信した音声コンテンツに対して、サポートしている各音声サービス用のウェイクワード検出アルゴリズムを並行して実行し得る。例えば、NMDは、第1の音声サービス用の少なくとも1つの第1のウェイクワードを検出するために第1の音声サービス用の第1の音声検出アルゴリズムを適用し、第2の音声サービス用の少なくとも1つの第2のウェイクワードを検出するために第2の音声サービス用の第2の音声検出アルゴリズムを適用し得る。音声コンテンツが再生装置により再生される前に、NMDは、恐らくはそれぞれの音声サービスのために、追加の音声検出アルゴリズムを音声コンテンツに適用してもよい。
c.音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するウェイク応答を無効化
図11では、ブロック1106において、実施1100は、音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するウェイク応答を無効にすることを含む。例えば、NMDは、音声コンテンツが再生装置により聞き取り可能に再生される時に、音声コンテンツにおいて検出された1つ又は複数のウェイクワードに対するウェイク応答を無効にし得る。
上述したように、NMDのウェイク応答とは、ウェイクワードの検出に対するプログラムされた応答を指す。ウェイク応答が有効な場合、ウェイクワードの検出に応じて、NMDのウェイク応答により、NMDは、マイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取る。NMDは、音声サービスを呼び出して音声コマンドを実行する。しかしながら、ウェイク応答が無効である場合、NMDは、音声コマンドを聞き取らなくてもよく、音声コマンドを実行するために音声サービスを呼び出さない。
一部の実施において、NMDは、ウェイクワードが再生装置により再生される際にNMDがウェイクワードを検出しないようにすることで、ウェイク応答を無効にする。例えば、NMDは、1つ又は複数の期間(即ち、恐らくはタイムスタンプにより記録された、ウェイクワードが再生装置により再生される時間に対応する期間)に亘り、ウェイクワードの聞き取りを停止し得る(例えば、記録された音声の処理を停止する)。又は、NMDは、マイクロホンを一時的に(例えば、上述した期間中)無効にする。更に他の例として、NMDは、NMDがウェイクワードを検出しないように、再生装置がマイクロホンアレイを使用する方向にリスニングNULLを作成し得る。他の例も可能である。
更に他の例では、NMDは、ウェイクワードが再生装置により再生される際にウェイクワードを検出するが、検出されたウェイクワードに対するウェイク応答を抑制する。例えば、NMDは、特定の期間中、ウェイクワードを無視してよく、又は特定の期間中、全ての音声を無視してもよい。他の例も可能である。
他の例として、NMDは、音声コンテンツ(又は音声コンテンツの一部)内のウェイクワードの数をカウントし得る。例えば、NMDは、音声コンテンツの例において3つのウェイクワードを検出する場合がある。上述したように、このようなインスタンスは、異なる音声サービスの異なるウェイクワードを含め、ウェイクワードの任意の組み合わせを含み得る。次に、NMDは、カウントと等しい数のウェイクワードを検出するまで(例えば、次の3つのウェイクワードを無視することで)、ウェイク応答を無効にし得る。
又は、NMDは、音声コンテンツを動的に修正して音声コンテンツのセグメントに音響マーカを組み込むことにより、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にし得る。例えば、NMDは、記録済み音声コンテンツに音声トーン又は他のマーカを挿入(例えば、ミックス)し、音声コンテンツ内で検出されるウェイクワードを指定し得る。このような音声マーカの検出に応じて、ウェイク応答を無効にするようにNMDがプログラムされている場合、その後、NMDは、再生装置により再生される音声コンテンツ内のウェイクワードを検出した際に、ウェイク応答を自動的に抑制する。
一部の例において、NMDは、1つ又は複数の追加のマイクロホン装置において、ウェイクワードが再生装置により再生された時に、検出されたウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。例えば、図1を参照すると、NMD132は、NMD134において、そのウェイク応答を無効にさせ得る。更に、住居内の再生装置及び/又は制御装置の何れかがNMDを実施してもよく、NMD132は、これらの再生装置の何れかのウェイク応答を無効にしてもよい。
NMDは、住居内の特定のNMDの組を無効にし得る。場合により、ウェイク応答が無効にされたNMDの組は、メディア再生システムのゾーン又はゾーングループの構成に基づくものとなる。例えば、NMDが特定のゾーンに関連付けられている場合(例えば、NMD132がキッチンゾーンに関連付けられている場合)、NMDは、同じゾーンに関連付けられている任意のNMDのそれぞれのウェイク応答を無効にさせ得る。これらのNMDは、NMDを実施する様々な装置(例えば、再生装置)と、専用のNMDとを含むことができる。更に、NMDが関連付けられた特定のゾーンに、ゾーングループ内の1つ又は複数の追加ゾーンが加わった場合、NMDは、更に1つ又は複数の追加ゾーンに関連付けられている任意のNMDのそれぞれのウェイク応答を無効にさせ得る。上記のように、NMDとメディア再生システムのゾーンとの間に関連性が形成され、恐らくは住居の特定の部屋(例えば、キッチンゾーン)での協働を容易にし得る。
又は、ウェイク応答が無効になっている特定の追加NMDは、ウェイクワードを含む音声コンテンツを再生している再生装置の可聴範囲に基づくものとなる。可聴範囲は、任意の適切な技術を用いて判断し得る。一部の実施では、可聴範囲は、上記のように、NMDと1つ又は複数のゾーンとの関連性に基づいて確立される。他の例において、可聴範囲は、第III節で説明したように、設定手順(例えば、較正手順)中に確立される。ゾーン構成及び/又は設定手順により確立された可聴範囲は、1つ又は複数の状態変数として記憶し、ネットワーク(例えば、図1に示した住居内のルータ130により確立されたLAN)内の装置間で共有することができる。このような情報へのアクセスを有することにより、NMDは、音声コンテンツを再生する再生装置の可聴範囲内にあるNMDの組を決定し、これらのNMDの組のそれぞれのウェイク応答を無効にすることができる。
例示として、一例において、図1のNMD132は、キッチンゾーン内の再生装置114による再生用に設計された特定の音声コンテンツ内で1つ又は複数のウェイクワードを検出する。これに応じて、NMD132は、これらのウェイクワードに対するウェイク応答を無効にする。再生装置114もNMDであるため、NMD132は、再生装置114のウェイク応答を無効にする。更に、キッチンゾーンは、ダイニングルームゾーンと共にゾーングループ内にあるため、NMD132は、同じくNMDである再生装置112のウェイク応答も無効にし、これにより、音声コンテンツがキッチンゾーンと同期してダイニングルームゾーンで再生された際に、再生装置112のNMDは、誤ってトリガされなくなる。
他の例において、図1のNMD134は、主寝室ゾーン内の再生装置122及び124による再生用に設計された特定の音声コンテンツ内の1つ又は複数のウェイクワードを検出する。これに応じて、NMD134は、これらのウェイクワードに対するウェイク応答を無効にする。再生装置116は、NMDを実施しており、現在の音量レベルで再生装置122及び124の可聴範囲内にあることが事前に確定しているため、NMD134は、再生装置116のウェイク応答も無効にする。NMD134は、ルータ130により形成されたLANを介してNMD134と共有される1つ又は複数の状態変数から、現在の音量レベルで再生装置116が再生装置122及び124の可聴範囲内にあることを認識している。このような状態変数は、再生装置122及び124の現在の再生構成(例えば、ステレオペア)、その現在の音量レベル、及びこの再生構成及びこの音量レベルにおいて、どのNMDが、これらの再生装置の可聴範囲内にあると判断されているか等、メディア再生システム100の様々な側面の状況をNMD134に対して示す。
NMDは、1つ又は複数の追加のNMDにおいて、任意の適切な技術を用いて、それぞれのウェイク応答を無効にさせ得る。NMDは、通知コンポーネント(例えば、図5の通知コンポーネント506)を含む処理システム500を実施し、通知コンポーネントを用いて、1つ又は複数のNMDの組において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。
一部の実施において、NMDは、受信した音声コンテンツの再生中に、ネットワークインタフェースを介して、1つ又は複数のNMDに対して1つ又は複数それぞれのウェイク応答を無効にさせる命令を送信することにより、1つ又は複数の追加のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる。上述したように、メディア再生システムの様々な装置(例えば、制御装置、再生装置、及びNMD)は、ローカルエリアネットワークを介して(例えば、図1の有線又は無線ネットワークルータ130により形成されたローカルエリアネットワークを介して)相互接続して、住居内の装置間での命令及び他のメッセージのやりとりを許可し得る。メディア再生システムのこれらの装置は、それぞれシステム内の他の装置からの特定の命令に応答するようにプログラムされ得る。メッセージ及び命令の例は、図9、10A、10B、10C、10Dに関連して上述している。
又は、NMDは、音声コンテンツを修正して音声コンテンツのセグメントに音響マーカを組み込むことにより、1つ又は複数のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる。このような技術を使用することで、再生装置の可聴範囲内にあるNMDを事前に決定又は推定する必要がなくなる。寧ろ、音響マーカが音声コンテンツと共に再生されるため、音声コンテンツを検出する可聴範囲内にある(そのため、このコンテンツにより誤ってトリガされる恐れがある)NMDは、音響マーカを検出する範囲内にもあり、これに反応して、ウェイク応答を無効にする。複数のNMDがNMDの可聴範囲内にある場合、ウェイクワードを検出する各NMDは、関連する音響マーカを検出したことを受け、これに反応してウェイクワードに対するウェイク応答を無効にする。
NMDが音声コンテンツを修正するような一部の実施において、NMDは、再生装置に音声コンテンツを提供する。このような場合、NMDは、音声コンテンツのソースと再生装置との間の媒介として動作する。再生装置は、受信した音声コンテンツを再生するように構成可能であるため、音声コンテンツを再生装置に送信することにより、再生装置は、音声コンテンツを再生し得る。NMDは、ネットワークインタフェース等の任意の適切な通信インタフェースを介して、音声コンテンツを再生装置に提供し得る。複数の再生装置が音声コンテンツを再生するように構成されている場合、NMDは、全ての再生装置に音声コンテンツを提供してもよい。又は、NMDは、音声コンテンツを再生装置のサブセット(例えば、グループコーディネータ)に送信してよく、再生装置のサブセットは、その後、音声コンテンツをグループ内の他の再生装置に、恐らくは同期再生をスケジュールするタイミング情報と共に配信する。
例示として、一例において、再生装置112及び124は、音声コンテンツを同期して再生するように構成されたゾーングループ(即ち、キッチン+ダイニングルームゾーングループ)内にある。ゾーングループによる再生に指定された音声コンテンツ内のウェイクワードを検出した後、NMD132は、音声コンテンツ内のウェイクワードを指定する音響マーカを含めるように音声コンテンツを修正し得る。その後、再生装置132は、修正された音声コンテンツの同期再生を容易にするため、修正された音声コンテンツを再生装置122及び/又は124に提供し得る。
d.再生された音声コンテンツを検出
ブロック1108において、実施1100は、マイクロホンを介して、再生された音声コンテンツを検出することを含む。例えば、再生装置が1つ又は複数の検出されたウェイクワードを含む音声コンテンツを再生している間に、NMDは、マイクロホンを介して、再生された音声コンテンツを検出し得る。NMDのウェイク応答が有効になっている構成において、ウェイクワードを含む再生音声コンテンツの部分を検出することで、NMDのウェイク応答がトリガされる。しかしながら、NMDは音声コンテンツ内の1つ又は複数のウェイクワードに対するウェイク応答を無効にしているため、ウェイク応答は、トリガされない。
一部の実施において、再生装置は、NMDを実施する。このような例において、再生装置は、1つ又は複数のスピーカを介して、受信した音声コンテンツを再生し得る。一部の例において、スピーカは、同じハウジング内でNMDと共に配置される。又は、再生装置は、スピーカジャックを介して、増幅された音声を1つ又は複数の別個のパッシブスピーカに提供し得る。他の例として、再生装置は、ラインレベルの音声をアンプに提供することにより音声コンテンツを再生してもよく、アンプは、その後、スピーカジャックを介して1つ又は複数のパッシブスピーカに増幅された音声を提供する。
一部の例において、NMDは、1つ又は複数の追加の再生装置と共に同期再生構成となるように構成される。このような場合、音声コンテンツを再生することは、1つ又は複数の追加の再生装置と同期して音声コンテンツを再生することを含む。一部の再生構成(例えば、ステレオペア又はサラウンド)において、再生構成内の各再生装置は、再生構成内の他の再生装置と同期して音声コンテンツの一部を再生する。
上述したように、一部の実施において、NMDは、再生のために1つ又は複数の再生装置に音声コンテンツを提供する。一部の例において、NMDは、音声コンテンツを1つ又は複数の再生装置に提供して、その音声コンテンツのNMDとの同期再生を容易にする。このような実施形態において、NMDは、NMD及び1つ又は複数の追加の再生装置を含む同期グループのグループコーディネータとして動作し得る。グループコーディネータとして、NMDは、タイミング情報を1つ又は複数の追加の再生装置に追加的に提供し、同期グループスケジューリング同期再生を容易にし得る。再生装置は、ネットワークインタフェースを介して音声コンテンツ及び/又はタイミング情報を提供する。
V.ウェイク応答を無効にするための計算システムの技術の例
上述したように、本明細書に記載の実施形態は、ウェイク応答を無効にすることを含み得る。図12は、計算システムが音声コンテンツ内の1つ又は複数のウェイクワードに対する1つ又は複数のNMDのウェイク応答を無効にする実施1200の例を示す。様々な実施形態において、計算システムはクラウドサーバにし得る。又は、計算システムは、ローカル処理装置(例えば、メディア再生システムと同じLANに接続された装置)にし得る。計算システムは、再生装置又はNMDを実施し得る。
a.記録済み音声コンテンツを表すデータを受信
ブロック1202において、実施1200は、記録済み音声コンテンツを表すデータを受信することを含む。例えば、計算システムは、再生装置により再生するための音声コンテンツを受信し得る。再生装置の例には、図1に示した再生装置102、104、106、108、110、112、114、116、118、120、112、124の何れかが含まれ、例えば、図2の再生装置200に示したように実施し得る。処理システムは、処理システム(例えば、処理システム500)を含み、オーディオ音声入力/出力コンポーネント(図5のオーディオ音声入力/出力コンポーネント502等)を用いて音声コンテンツを表すデータを受信し得る。計算システムは、第II、III、及びIV節で説明した技術等、任意の適切な技術を用いて音声コンテンツを受信し得る。
b.音声コンテンツにおいて1つ又は複数のウェイクワードを検出
図12では、ブロック1204において、実施1200は、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて1つ又は複数のウェイクワードを検出することを含む。例えば、計算システムは、音声コンテンツを表す受信データを分析して、何れかの音声サービス用のウェイクワードが、音声コンテンツの再生時に聞き取り可能に再生されるように音声コンテンツ内で表されているかを判断する。上述したように、一部の実施において、計算システムは、処理システム(例えば、処理システム500)を含み、ウェイクワード検出コンポーネント(図5のウェイクワード検出コンポーネント504等)を用いて音声コンテンツ内のウェイクワードを検出し得る。計算システムは、第II、III、及びIV節で説明した技術等、任意の適切な技術を用いてウェイクワードを検出し得る。
c.音声コンテンツの再生中、1つ又は複数のNMDにおいて検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効化
図12では、ブロック1206において、実施1200は、音声コンテンツの再生中、1つ又は複数のネットワークマイクロホン装置において、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることを含む。例えば、計算システムは、再生装置の可聴範囲内にあるNMDにおいて、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。上述したように、計算システムは、通知コンポーネント(例えば、図5の通知コンポーネント506)を含む処理システム500を実施し、通知コンポーネントを用いて、1つ又は複数のNMDにおいて、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。計算システムは、第II、III、及びIV節で説明した技術等、任意の適切な技術を用いて、音声コンテンツの再生中、1つ又は複数のNMDにおいて、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせ得る。
VI.ウェイク応答を抑制する技術の例
上述したように、本明細書に記載の実施形態は、ウェイク応答を抑制することを含み得る。図13は、NMDがウェイク応答を無効にする実施1300の例を示す。
a.1つ又は複数のウェイクワードに対するNMDのウェイク応答を無効にする命令を受信
ブロック1302において、実施1300は、1つ又は複数のウェイクワードに対するNMDのウェイク応答を無効にする命令を受信することを含む。例えば、NMD(例えば、NMD132)は、別のNMD、再生装置、計算システム、又は他の任意の装置から命令を受信し得る。この命令により、NMDは、1つ又は複数の再生装置による再生に指定された特定の音声コンテンツ内で表される1つ又は複数のウェイクワードに対するウェイク応答を無効にする。
一部の実施において、1つ又は複数のウェイクワードに対するNMDのウェイク応答を無効にするために受信される命令は、暗黙的となる。例えば、例として特に、恐らくはウェイクワードの聞き取りを停止するようにNMDに指示すること、NMDのマイクロホンアレイを一定期間無効にすること、又は再生装置の方向にリスニングNULLを作成することにより、再生装置により再生される際にウェイクワードを検出しないようにNMDに指示することができる。又は、NMDは、ウェイクワードを検出するが、恐らくは特定の期間中、ウェイクワードを無視すること、又は特定の期間中、記録された音声を全て無視することにより、ウェイクワードの検出に応じて音声サービスを呼び出すプログラム済みウェイク応答を抑制するように指示され得る。第II、III、及びIV節で説明したような任意の適切な命令を用いてNMDに指示することができる。
又は、受信される命令は、暗黙的となる。例えば、上記のように、音声コンテンツは、ウェイクワードを指定する音響マーカを含むように修正される。このような実施において、受信される命令は、音響マーカの形態であってもよい。場合により、受信される命令は、音響マーカが検出された際にNMDのウェイク応答を無効にする命令であってもよい。
b.1つ又は複数の再生装置により再生されている音声コンテンツを検出
図13では、ブロック1304において、実施1300は、1つ又は複数の再生装置により再生されている音声コンテンツを検出することを含む。例えば、NMDは、マイクロホンを介して、単一の再生装置により再生されている音声コンテンツを検出し得る。又は、NMDは、2つ以上の装置により(例えば同期して)再生されている音声コンテンツを検出し得る。
c.検出された音声コンテンツが1つ又は複数のウェイクワードを含むと判断
図13では、ブロック1306において、実施1300は、検出された音声コンテンツが1つ又は複数のウェイクワードを含むことを判断することを含む。例えば、NMDは、検出された音声コンテンツに対して1つ又は複数のウェイクワード検出アルゴリズムを実行することにより、検出された音声コンテンツが1つ又は複数のウェイクワードを含むことを判断し得る。一部の例において、NMDは、検出された音声コンテンツに対して複数のウェイクワード検出アルゴリズム(例えば、場合により異なる音声サービス用である、異なるウェイクワードに対するウェイクワード検出アルゴリズム)を実行し得る。ウェイクワード検出アルゴリズムの例は、本開示全体で説明されている。
d.検出された音声コンテンツ内の1つ又は複数のウェイクワードに対するNMDのウェイク応答を無効化
図13では、ブロック1308において、実施1300は、検出された音声コンテンツ内の1つ又は複数のウェイクワードに対するNMDのウェイク応答を無効にすることを含む。上述したように、NMDのウェイク応答とは、ウェイクワードの検出に対するプログラムされた応答を指す。ウェイク応答が有効な場合、ウェイクワードの検出に応じて、NMDのウェイク応答により、NMDは、マイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取る。NMDは、音声サービスを呼び出して音声コマンドを実行する。しかしながら、ウェイク応答が無効である場合、NMDは、音声コマンドを聞き取らなくてもよく、音声コマンドを実行するために音声サービスを呼び出さない。
VII.結論
上記の説明は、多数の構成要素のうち、ハードウェア上で実行されるファームウェア及び/又はソフトウェアを含む、様々なシステム、方法、装置、及び製品の例を特に開示している。このような例は、単なる例示的なものであり、限定的と見做すべきではないと理解される。例えば、ファームウェア、ハードウェア、及び/又はソフトウェアの態様又は構成要素の何れか又は全ては、ハードウェアのみで、ソフトウェアのみで、ファームウェアのみで、又はハードウェア、ソフトウェア、及び/又はファームウェアの任意の組み合わせにおいて、実施可能であると考えられる。したがって、提示した例は、このようなシステム、方法、装置、及び/又は製品を実現する唯一の方法ではない。
(特徴1)再生装置を介して、再生装置による再生用の音声コンテンツを表すデータを受信することと、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することと、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答であって、有効とされた時、特定のウェイクワードに対する所定のネットワークマイクロホン装置のウェイク応答により、所定のネットワークマイクロホン装置がマイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取るウェイク応答を無効にさせることと、1つ又は複数のスピーカを介して音声コンテンツを再生することと、を含む、方法。
(特徴2)再生装置は、所定のネットワークマイクロホン装置を含み、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、音声コンテンツの再生中に、マイクロホンを介して、再生されている音声コンテンツを記録することと、記録済み音声コンテンツ内の1つ又は複数のウェイクワードに対する所定のネットワークマイクロホン装置のそれぞれのウェイク応答を無効にすることと、を含む、特徴1の方法。
(特徴3)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、ネットワークインタフェースを介して1つ又は複数のネットワークマイクロホン装置に対して、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することを含む、特徴1の方法。
(特徴4)1つ又は複数のネットワークマイクロホン装置は、住居内のネットワークマイクロホン装置のサブセットであり、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲(audible vicinity of the audio content)にあることを判断することと、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することに応じて、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することと、を含む、特徴2の方法。
(特徴5)1つ又は複数のネットワークマイクロホン装置は、それぞれの再生装置を備え、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置と共に同期再生構成内にあることを判断することを含む、特徴4の方法。
(特徴6)1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置の可聴範囲にあることを判断することを含む、特徴4の方法。
(特徴7)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、音声コンテンツを再生する前に、音声コンテンツを修正して、それぞれのウェイクワードを表す音声コンテンツのセグメントに音響マーカを組み込むことを含み、音響マーカを検出することにより、1つ又は複数のネットワークマイクロホン装置は、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にする、特徴1の方法。
(特徴8)1つ又は複数のウェイクワードを検出することは、複数のウェイクワード検出アルゴリズムを音声コンテンツに適用することを含み、複数のウェイクワード検出アルゴリズムは、第1の音声サービス用の第1のウェイクワード検出アルゴリズムと、第2の音声サービス用の第2のウェイクワード検出アルゴリズムとを含み、音声コンテンツが再生装置により再生される前に複数のウェイクワード検出アルゴリズムを音声コンテンツに適用することは、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第1の音声サービス用の少なくとも1つの第1のウェイクワードを検出するために第1の音声サービス用の第1のウェイクワード検出アルゴリズムを適用することと、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第2の音声サービス用の少なくとも1つの第2のウェイクワードを検出するために第2の音声サービス用の第2のウェイクワード検出アルゴリズムを適用することと、を含み、第2のウェイクワードは、第1のウェイクワードとは異なるワードである、特徴1の方法。
(特徴9)1つ又は複数のネットワークマイクロホン装置は、第1のネットワークマイクロホン装置及び第2のネットワークマイクロホン装置を含み、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、第1のネットワークマイクロホン装置において、検出された少なくとも1つの第1のウェイクワードに対するそれぞれのウェイク応答を無効にさせることと、第2のネットワークマイクロホン装置において、検出された少なくとも1つの第2のウェイクワードに対するそれぞれのウェイク応答を無効にさせることと、を含む、特徴1の方法。
(特徴10)音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することは、音声コンテンツ内で特定のウェイクワードの複数のインスタンスを検出することを含み、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、各ネットワークマイクロホン装置が、音声コンテンツ内で検出された特定のウェイクワードの複数のインスタンスの数に等しい数のウェイクワードを検出するまで、1つ又は複数のネットワークマイクロホン装置において、それぞれのウェイク応答を無効にさせることを含む、特徴1の方法。
(特徴11)特徴1乃至10の何れかの方法を装置に実行させるために1つ又は複数のプロセッサにより実行可能な命令を記憶した、有形の非一時的コンピュータ読み取り可能媒体。
(特徴12)特徴1乃至10の何れかの方法を実行するように構成された装置。
(特徴13)特徴1乃至10の何れかの方法を実行するように構成されたメディア再生システム。
(特徴14)ネットワークマイクロホン装置を介して、再生装置による再生用の音声コンテンツを表すデータを受信することと、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することと、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答であって、有効とされた時、特定のウェイクワードに対するネットワークマイクロホン装置のウェイク応答により、ネットワークマイクロホン装置がマイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取るウェイク応答を無効にすることと、再生装置が音声コンテンツを再生している間に、マイクロホンを介して再生された音声コンテンツを検出することと、を含む方法。
(特徴15)更に、再生装置に音声コンテンツを再生させるために、ネットワークインタフェースを介して再生装置に対して、音声コンテンツを表すデータを送信することを含む、特徴14の方法。
(特徴16)再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にすることは、再生装置に対して音声コンテンツを表すデータを送信する前に、音声コンテンツを修正して、それぞれのウェイクワードを表す音声コンテンツのセグメントに音響マーカを組み込むことを含み、音響マーカを検出することにより、ネットワークマイクロホン装置は、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にする、特徴15の方法。
(特徴17)更に、1つ又は複数の追加のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることを含む、特徴14の方法。
(特徴18)1つ又は複数の追加のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、ネットワークインタフェースを介して1つ又は複数の追加のネットワークマイクロホン装置に対して、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することを含む、特徴17の方法。
(特徴19)前記1つ又は複数の追加のネットワークマイクロホン装置は、住居内のネットワークマイクロホン装置のサブセットであり、1つ又は複数の追加のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することと、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することに応じて、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することと、を含む、特徴17の方法。
(特徴20)1つ又は複数のネットワークマイクロホン装置は、それぞれの再生装置を備え、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置と共に同期再生構成内にあることを判断することを含む、特徴19の方法。
(特徴21)1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置の可聴範囲にあることを判断することを含む、特徴14の方法。
(特徴22)1つ又は複数のウェイクワードを検出することは、複数のウェイクワード検出アルゴリズムを音声コンテンツに適用することを含み、複数のウェイクワード検出アルゴリズムは、第1の音声サービス用の第1のウェイクワード検出アルゴリズムと、第2の音声サービス用の第2のウェイクワード検出アルゴリズムとを含み、音声コンテンツが再生装置により再生される前に複数のウェイクワード検出アルゴリズムを音声コンテンツに適用することは、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第1の音声サービス用の少なくとも1つの第1のウェイクワードを検出するために第1の音声サービス用の第1のウェイクワード検出アルゴリズムを適用することと、音声コンテンツが再生装置により再生される前に音声コンテンツに対して、第2の音声サービス用の少なくとも1つの第2のウェイクワードを検出するために第2の音声サービス用の第2のウェイクワード検出アルゴリズムを適用することと、を含み、第2のウェイクワードは、第1のウェイクワードとは異なるワードである、特徴14の方法。
(特徴23)ネットワークマイクロホン装置は、再生装置を備え、方法は、更に、1つ又は複数のスピーカを介して音声コンテンツを再生することを含む、特徴14の方法。
(特徴24)特徴14乃至23の何れかの方法を装置に実行させるために1つ又は複数のプロセッサにより実行可能な命令を記憶した、有形の非一時的コンピュータ読み取り可能媒体。
(特徴25)特徴14乃至23の何れかの方法を実行するように構成された装置。
(特徴26)特徴14乃至23の何れかの方法を実行するように構成されたメディア再生システム。
(特徴27)計算システムのインタフェースを介して、1つ又は複数の再生装置による再生用の音声コンテンツを受信することと、音声コンテンツが再生装置により再生される前に、音声コンテンツにおいて、1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出することと、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答であって、有効とされた時、特定のウェイクワードに対する所定のネットワークマイクロホン装置のウェイク応答により、所定のネットワークマイクロホン装置がマイクロホンを介して特定のウェイクワードに続く音声コマンドを聞き取るウェイク応答を無効にさせることと、を含む、方法。
(特徴28)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、ネットワークインタフェースを介して1つ又は複数のネットワークマイクロホン装置に対して、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することを含む、特徴27の方法。
(特徴29)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することは、1つ又は複数の再生装置がそれぞれのウェイクワードを表す音声コンテンツのセグメントを再生する時間に対応する1つ又は複数の期間中、1つ又は複数のネットワークマイクロホン装置において、それぞれのウェイク応答を無効にさせる命令を送信することを含む、特徴28の方法。
(特徴30)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することは、1つ又は複数の再生装置がそれぞれのウェイクワードを表す音声コンテンツのセグメントを再生する時間に対応する1つ又は複数の期間中、1つ又は複数のネットワークマイクロホン装置において、それぞれのマイクロホンを無効にさせる命令を送信することを含む、特徴28の方法。
(特徴31)計算システムは、音声コンテンツ内の特定の数のウェイクワードを検出し、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することは、1つ又は複数のネットワークマイクロホン装置が、音声コンテンツ内で検出された特定の数のウェイクワードに等しい数のウェイクワードを検出するまで、1つ又は複数のネットワークマイクロホン装置において、それぞれのウェイク応答を無効にさせる命令を送信することを含む、特徴28の方法。
(特徴32)1つ又は複数のネットワークマイクロホン装置は、住居内のネットワークマイクロホン装置のサブセットであり、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することと、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することに応じて、1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせる命令を送信することと、を含む、特徴28の方法。
(特徴33)1つ又は複数のネットワークマイクロホン装置は、それぞれの再生装置を備え、1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置と共に同期再生構成内にあることを判断することを含む、特徴32の方法。
(特徴34)1つ又は複数のネットワークマイクロホン装置が音声コンテンツの可聴範囲にあることを判断することは、1つ又は複数のネットワークマイクロホン装置が再生装置の可聴範囲にあることを判断することを含む、特徴32の方法。
(特徴35)1つ又は複数のネットワークマイクロホン装置において、再生装置による音声コンテンツの再生中、検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にさせることは、1つ又は複数の再生装置が音声コンテンツを再生する前に、音声コンテンツを修正して、それぞれのウェイクワードを表す音声コンテンツのセグメントに音響マーカを組み込み、音響マーカを検出することにより、1つ又は複数のネットワークマイクロホン装置が、再生装置による音声コンテンツの再生中、1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効にすることと、1つ又は複数の再生装置による再生のために、修正された音声コンテンツを1つ又は複数の再生装置の少なくとも1つに送信することと、を含む、特徴27の方法。
(特徴36)1つ又は複数の再生装置による再生用の音声コンテンツを受信することは、(a)インタフェースのネットワークインタフェースを介して、音声コンテンツを表すデータを受信すること、又は(b)インタフェースのアナログインタフェースを介して、音声コンテンツを表すアナログ信号受信すること、を含む特徴35の方法。
(特徴37)計算システムは、1つ又は複数の再生装置の特定の再生装置を備え、動作は、更に、音声コンテンツを再生することを含む、特徴27の方法。
(特徴38)計算システムは、1つ又は複数のネットワークマイクロホン装置の特定のネットワークマイクロホン装置を備え、動作は、更に、マイクロホンを介して、1つ又は複数の再生装置により再生されている音声コンテンツを検出することを含む、特徴27の方法。
(特徴39)特徴27乃至38の何れかの方法を装置に実行させるために1つ又は複数のプロセッサにより実行可能な命令を記憶した、有形の非一時的コンピュータ読み取り可能媒体。
(特徴40)特徴27乃至38の何れかの方法を実行するように構成された装置。
(特徴41)特徴27乃至38の何れかの方法を実行するように構成されたメディア再生システム。
(特徴42)ネットワークマイクロホン装置を介して、1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答であって、有効とされた時、所定のウェイクワードに対するネットワークマイクロホン装置のウェイク応答により、ネットワークマイクロホン装置がマイクロホンを介して所定のウェイクワードに続く音声コマンドを聞き取るウェイク応答を無効にする命令を受信することと、マイクロホンを介して、1つ又は複数の再生装置により再生されている音声コンテンツを検出することと、検出された音声コンテンツが1つ又は複数のウェイクワードを含むと判断することと、検出された音声コンテンツ内の1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にすることと、を含む方法。
(特徴43)1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にする命令を受信することは、1つ又は複数の再生装置がそれぞれの検出されたウェイクワードに対応する音声コンテンツのセグメントを再生する時間に対応する1つ又は複数の期間中、ウェイク応答を無効にする命令を受信することを含む、特徴42の方法。
(特徴44)1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にする命令を受信することは、1つ又は複数の再生装置がそれぞれの検出されたウェイクワードに対応する音声コンテンツのセグメントを再生する時間に対応する1つ又は複数の期間中、マイクロホンを無効にする命令を受信することを含む、特徴42の方法。
(特徴45)1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にする命令を受信することは、ネットワークマイクロホン装置が特定の数のウェイクワードに等しい数のウェイクワードを検出するまで、連続するウェイクワードが検出された際にウェイク応答を無効にする命令を受信することを含む、特徴42の方法。
(特徴46)1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にする命令を受信することは、音響マーカが検出された際にウェイク応答を無効にする命令を受信することを含み、検出された音声コンテンツ内の1つ又は複数のウェイクワードに対するネットワークマイクロホン装置のウェイク応答を無効にすることは、それぞれの検出されたウェイクワードに対応する、検出された音声コンテンツ内の音響マーカを検出することと、各音響マーカを検出することに応じて、ウェイク応答を無効にすることと、を含む、特徴42の方法。
(特徴47)検出された音声コンテンツが1つ又は複数のウェイクワードを含むと判断することは、検出された音声コンテンツに対して、1つ又は複数のウェイクワード検出アルゴリズムを適用することを含む、特徴42の方法。
(特徴48)特徴42乃至47の何れかの方法を装置に実行させるために1つ又は複数のプロセッサにより実行可能な命令を記憶した、有形の非一時的コンピュータ読み取り可能媒体。
(特徴49)特徴42乃至47の何れかの方法を実行するように構成された装置。
(特徴50)特徴42乃至47の何れかの方法を実行するように構成されたメディア再生システム。
本願明細書は、例示的な環境、システム、手順、ステップ、論理ブロック、処理、及び他のシンボル表現に関して広く示されており、それらは直接的又は間接的にネットワークに接続されるデータ処理装置の動作に類似する。これらの処理の説明及び表現は、一般に、当業者が、その作業の内容を他の当業者に最も効果的に伝えるために使用されるものである。本開示の完全な理解を提供するため、多数の具体的な詳細を述べている。しかしながら、本開示の特定の実施形態が特定の具体的な詳細なしに実施可能であることは、当業者に理解される。他の例では、周知の方法、手順、構成要素、及び回路については、実施形態の態様を不必要に曖昧にすることを避けるために、詳細な説明を省略している。したがって、本開示の範囲は、上記の実施形態よりむしろ添付の記特許請求の範囲により定義される。
添付の特許請求の範囲の何れかが、純粋にソフトウェア及び/又はファームウェアの実施を対象とすると読み取られる場合、少なくとも1つの例の少なくとも1つの要素は、本明細書では、ソフトウェア及び/又はファームウェアを記憶するメモリ、DVD、CD、Blu−ray等の有形の非一時的な媒体を含むことが明確に定められている。

Claims (14)

  1. 再生装置のための方法であって、
    前記再生装置のネットワークインタフェースを介して、前記再生装置による再生用の音声コンテンツを表すデータを受信するステップ、
    前記再生装置により前記音声コンテンツを再生する前に、前記音声コンテンツの中に1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出するステップ、
    1つ又は複数のネットワークマイクロホン装置が前記再生装置の可聴範囲にあることを判断するステップ、
    1つ又は複数のネットワークマイクロホン装置が前記音声コンテンツの可聴範囲にあることを判断することに応じて、当該1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化するステップ、ここで、ウェイク応答が有効化された場合、所定のネットワークマイクロホン装置における特定のウェイクワードに対するウェイク応答によって、前記所定のネットワークマイクロホン装置がマイクロホンを介して、前記特定のウェイクワードに続く音声コマンドを聞き取る、
    前記再生装置の1つ又は複数のスピーカを介して前記音声コンテンツを再生するステップ、を含む、方法。
  2. 前記再生装置は、前記所定のネットワークマイクロホン装置を備える、請求項1記載の方法。
  3. 前記1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化するステップは、
    前記音声コンテンツの再生中に、前記1つ又は複数のネットワークマイクロホン装置を介して、再生されている前記音声コンテンツを記録するステップと、
    前記所定のネットワークマイクロホン装置における、記録済み前記音声コンテンツ内の前記1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効化するステップと、を含む、請求項1又は2記載の方法。
  4. 前記1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化するステップは、
    前記再生装置の前記ネットワークインタフェースを介して前記1つ又は複数のネットワークマイクロホン装置に対して、前記1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効にさせる命令を送信することを含む、請求項1又は2記載の方法。
  5. 前記再生装置の可聴範囲にあると判断された前記1つ又は複数のネットワークマイクロホン装置は、住居内のネットワークマイクロホン装置のサブセットである、請求項1から4のいずれか1項に記載の方法。
  6. 特定のネットワークマイクロホン装置が前記音声コンテンツの可聴範囲にあることを判断するステップは、前記特定のネットワークマイクロホン装置が前記再生装置と共に同期再生構成内にあることを判断するステップを含み、ここで、前記特定のネットワークマイクロホン装置は再生装置を備える、請求項1から5のいずれか1項に記載の方法。
  7. 前記1つ又は複数のネットワークマイクロホン装置が前記音声コンテンツの可聴範囲にあることを判断するステップは、前記1つ又は複数のネットワークマイクロホン装置が前記再生装置の可聴範囲にあることを判断するステップを含む、請求項1から6のいずれか1項に記載の方法。
  8. 前記1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化するステップは、
    前記音声コンテンツを再生する前に、それぞれのウェイクワードを表す前記音声コンテンツのセグメントに音響マーカを組み込むように前記音声コンテンツを修正するステップを含み、ここで、前記音響マーカを検出することにより、前記1つ又は複数のネットワークマイクロホン装置における前記1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化する、請求項1から7のいずれか1項に記載の方法。
  9. 前記1つ又は複数のウェイクワードを検出するステップは、各音声サービスに関連付けられたそれぞれのウェイクワード用の複数のウェイクワード検出アルゴリズムを、前記音声コンテンツに適用するステップを含む、請求項1から8のいずれか1項に記載の方法。
  10. 1つ又は複数のウェイクワードを検出するステップは、複数のウェイクワードを検出するステップを含み、
    前記1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を無効化するステップは、
    1のネットワークマイクロホン装置において、前記検出された少なくとも1つの第1のウェイクワードに対するそれぞれのウェイク応答を無効にさせるステップと、
    2のネットワークマイクロホン装置において、前記検出された少なくとも1つの第2のウェイクワードに対するそれぞれのウェイク応答を無効にさせるステップと、を含む、請求項9記載の方法。
  11. 前記音声コンテンツの中に1つ又は複数の音声サービス用の1つ又は複数のウェイクワードを検出するステップは、前記音声コンテンツ内で特定のウェイクワードの複数のインスタンスを検出するステップを含む、請求項1記載の方法。
  12. 前記1つ又は複数のネットワークマイクロホン装置における前記検出された1つ又は複数のウェイクワードに対するそれぞれのウェイク応答を、前記再生装置が前記音声コンテンツを再生する間において無効化するステップは、各ネットワークマイクロホン装置が、前記音声コンテンツ内で検出された前記特定のウェイクワードの前記複数のインスタンスの数に等しい数のウェイクワードを検出するまで、前記1つ又は複数のネットワークマイクロホン装置において、それぞれのウェイク応答を無効にさせるステップを含む、請求項11記載の方法。
  13. 再生装置に請求項1から12のいずれか1項に記載の方法を実行させるために1つ又は複数のプロセッサにより実行可能なプログラムを記憶した有形の非一時的コンピュータ読み取り可能媒体。
  14. ネットワークインタフェースと、
    1つ又は複数のプロセッサと、
    請求項13に記載の有形の非一時的コンピュータ読み取り可能媒体と、を備える、再生装置。
JP2020506725A 2017-08-07 2018-08-06 ウェイクワード検出の抑制 Active JP6963673B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/670,361 US10475449B2 (en) 2017-08-07 2017-08-07 Wake-word detection suppression
US15/670,361 2017-08-07
PCT/US2018/045397 WO2019032462A1 (en) 2017-08-07 2018-08-06 REMOVAL OF AWAKENING WORD DETECTION

Publications (2)

Publication Number Publication Date
JP2020530585A JP2020530585A (ja) 2020-10-22
JP6963673B2 true JP6963673B2 (ja) 2021-11-10

Family

ID=63405364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020506725A Active JP6963673B2 (ja) 2017-08-07 2018-08-06 ウェイクワード検出の抑制

Country Status (8)

Country Link
US (4) US10475449B2 (ja)
EP (2) EP4040285A1 (ja)
JP (1) JP6963673B2 (ja)
KR (1) KR102315053B1 (ja)
CN (2) CN116954545A (ja)
AU (1) AU2018312989B2 (ja)
CA (2) CA3140979C (ja)
WO (1) WO2019032462A1 (ja)

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
CN107591151B (zh) * 2017-08-22 2021-03-16 百度在线网络技术(北京)有限公司 远场语音唤醒方法、装置和终端设备
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) * 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10733990B2 (en) * 2017-10-18 2020-08-04 Motorola Mobility Llc Preventing initiation of a voice recognition session
US10152966B1 (en) * 2017-10-31 2018-12-11 Comcast Cable Communications, Llc Preventing unwanted activation of a hands free device
US20190130898A1 (en) * 2017-11-02 2019-05-02 GM Global Technology Operations LLC Wake-up-word detection
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
FR3075442B1 (fr) * 2017-12-19 2019-11-22 Sagemcom Broadband Sas Dispositif et procede d'assistance vocale
CN108039175B (zh) * 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11127405B1 (en) * 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10885910B1 (en) 2018-03-14 2021-01-05 Amazon Technologies, Inc. Voice-forward graphical user interface mode management
US10877637B1 (en) 2018-03-14 2020-12-29 Amazon Technologies, Inc. Voice-based device operation mode management
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
US10685666B2 (en) * 2018-04-06 2020-06-16 Intel Corporation Automatic gain adjustment for improved wake word recognition in audio systems
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10649727B1 (en) * 2018-05-14 2020-05-12 Amazon Technologies, Inc. Wake word detection configuration
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
WO2020005202A1 (en) 2018-06-25 2020-01-02 Google Llc Hotword-aware speech synthesis
US10929097B2 (en) * 2018-06-26 2021-02-23 ROVl GUIDES, INC. Systems and methods for switching operational modes based on audio triggers
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
KR102580521B1 (ko) * 2018-07-13 2023-09-21 삼성전자주식회사 전자 장치 및 전자 장치의 음량 조절 방법
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US11151994B2 (en) * 2019-01-04 2021-10-19 International Business Machines Corporation Methods and systems for managing voice commands and the execution thereof
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11024290B2 (en) * 2019-02-11 2021-06-01 Amazon Technologies, Inc. Wakeword detection using a secondary microphone
CN110109645A (zh) * 2019-04-30 2019-08-09 百度在线网络技术(北京)有限公司 一种交互式音乐试听方法、装置和终端
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
JPWO2020235141A1 (ja) * 2019-05-17 2020-11-26
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
CN112712803B (zh) * 2019-07-15 2022-02-25 华为技术有限公司 一种语音唤醒的方法和电子设备
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) * 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11521599B1 (en) * 2019-09-20 2022-12-06 Amazon Technologies, Inc. Wakeword detection using a neural network
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
JP7483421B2 (ja) 2020-03-12 2024-05-15 キヤノン株式会社 撮像装置、制御方法、及びプログラム
CN111429917B (zh) * 2020-03-18 2023-09-22 北京声智科技有限公司 一种设备唤醒方法及终端设备
KR20210123633A (ko) * 2020-04-03 2021-10-14 삼성전자주식회사 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법
CN111554298B (zh) * 2020-05-18 2023-03-28 阿波罗智联(北京)科技有限公司 语音交互方法、语音交互设备和电子设备
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
CN111640426A (zh) * 2020-06-10 2020-09-08 北京百度网讯科技有限公司 用于输出信息的方法和装置
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
JP7491147B2 (ja) 2020-08-31 2024-05-28 セイコーエプソン株式会社 表示システムの制御方法、表示システム、及び、表示装置の制御方法
US11657814B2 (en) * 2020-10-08 2023-05-23 Harman International Industries, Incorporated Techniques for dynamic auditory phrase completion
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11562748B2 (en) * 2020-12-01 2023-01-24 Google Llc Detecting and suppressing commands in media that may trigger another automated assistant
US12001260B1 (en) * 2020-12-11 2024-06-04 Amazon Technologies, Inc. Preventing inadvertent wake in a speech-controlled device
US20220215835A1 (en) * 2021-01-06 2022-07-07 Comcast Cable Communications, Llc Evaluating user device activations
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US12057116B2 (en) * 2021-01-29 2024-08-06 Salesforce, Inc. Intent disambiguation within a virtual agent platform
US11557293B2 (en) * 2021-05-17 2023-01-17 Google Llc Contextual suppression of assistant command(s)
US20240265921A1 (en) * 2021-09-30 2024-08-08 Sonos, Inc. Conflict management for wake-word detection processes
US11769506B1 (en) * 2022-05-09 2023-09-26 Amazon Technologies, Inc. Response orchestrator for natural language interface

Family Cites Families (1204)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US186265A (en) * 1877-01-16 Improvement in odorless receptacles
US4941187A (en) 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US4741038A (en) 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPS63301998A (ja) 1987-06-02 1988-12-08 日本電気株式会社 音声認識応答装置
US4974213A (en) 1988-12-16 1990-11-27 Siwecki Thomas L Passive active underwater sound detection apparatus
US5036538A (en) 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5440644A (en) 1991-01-09 1995-08-08 Square D Company Audio distribution system having programmable zoning features
EP0548836B1 (en) 1991-12-20 1997-06-11 Matsushita Electric Industrial Co., Ltd. A bass reproduction speaker apparatus
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JPH0883091A (ja) 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 音声認識装置
US5740260A (en) 1995-05-22 1998-04-14 Presonus L.L.P. Midi to analog sound processor interface
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5857172A (en) 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
US7174299B2 (en) 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
FR2739736B1 (fr) 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3094900B2 (ja) 1996-02-20 2000-10-03 ヤマハ株式会社 ネットワーク機器およびデータ送受信方法
US6404811B1 (en) 1996-05-13 2002-06-11 Tektronix, Inc. Interactive multimedia system
JP3679526B2 (ja) 1996-10-31 2005-08-03 キヤノン株式会社 画像共有装置、画面制御方法及びコンピュータ可読メモリ
US6469633B1 (en) 1997-01-06 2002-10-22 Openglobe Inc. Remote control of electronic devices
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6611537B1 (en) 1997-05-30 2003-08-26 Centillium Communications, Inc. Synchronous network for digital media streams
US6408078B1 (en) 1997-10-30 2002-06-18 Maximilian Hobelsberger Active reactive acoustical elements
US6088459A (en) 1997-10-30 2000-07-11 Hobelsberger; Maximilian Hans Loudspeaker system with simulated baffle for improved base reproduction
US6032202A (en) 1998-01-06 2000-02-29 Sony Corporation Of Japan Home audio/video network with two level device control
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US6301603B1 (en) 1998-02-17 2001-10-09 Euphonics Incorporated Scalable audio processing on a heterogeneous processor array
US6953886B1 (en) 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
US6839410B2 (en) 1998-09-01 2005-01-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
IL140805A0 (en) 1998-10-02 2002-02-10 Ibm Structure skeletons for efficient voice navigation through generic hierarchical objects
US20020116196A1 (en) 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US6243676B1 (en) 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US7130616B2 (en) 2000-04-25 2006-10-31 Simple Devices System and method for providing content, management, and interactivity for client devices
US6256554B1 (en) 1999-04-14 2001-07-03 Dilorenzo Mark Multi-room entertainment system with in-room media player/dispenser
US6414251B1 (en) 1999-04-19 2002-07-02 Breck Colquett Weighing apparatus and method having automatic tolerance analysis and calibration
US7657910B1 (en) 1999-07-26 2010-02-02 E-Cast Inc. Distributed electronic entertainment method and apparatus
GB2352933A (en) 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6542868B1 (en) 1999-09-23 2003-04-01 International Business Machines Corporation Audio notification management system
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6611604B1 (en) 1999-10-22 2003-08-26 Stillwater Designs & Audio, Inc. Ultra low frequency transducer and loud speaker comprising same
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US6522886B1 (en) 1999-11-22 2003-02-18 Qwest Communications International Inc. Method and system for simultaneously sharing wireless communications among multiple wireless handsets
US6219645B1 (en) 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
ES2277419T3 (es) 1999-12-03 2007-07-01 Telefonaktiebolaget Lm Ericsson (Publ) Un metodo para producir simultaneamente ficheros de audio en dos telefonos.
KR20010054622A (ko) 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US20010042107A1 (en) 2000-01-06 2001-11-15 Palm Stephen R. Networked audio player transport protocol and architecture
US7661107B1 (en) 2000-01-18 2010-02-09 Advanced Micro Devices, Inc. Method and apparatus for dynamic allocation of processing resources
WO2001053994A2 (en) 2000-01-24 2001-07-26 Friskit, Inc. Streaming media search and playback system
AU2001231115A1 (en) 2000-01-24 2001-07-31 Zapmedia, Inc. System and method for the distribution and sharing of media assets between mediaplayers devices
EP1256207B1 (en) 2000-02-18 2007-09-05 Bridgeco AG Multi-portal bridge for providing network connectivity
JP2001236093A (ja) 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
US6631410B1 (en) 2000-03-16 2003-10-07 Sharp Laboratories Of America, Inc. Multimedia wired/wireless content synchronization system and method
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
AU4219601A (en) 2000-03-31 2001-10-15 Classwave Wireless Inc. Dynamic protocol selection and routing of content to mobile devices
GB2363036B (en) 2000-05-31 2004-05-12 Nokia Mobile Phones Ltd Conference call method and apparatus therefor
US20050164664A1 (en) 2000-07-21 2005-07-28 Difonzo Daniel F. Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks
US20040105566A1 (en) 2000-07-27 2004-06-03 International Business Machines Corporation Body set type speaker unit
US8165867B1 (en) 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US20020054685A1 (en) 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US20020072816A1 (en) 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6778869B2 (en) 2000-12-11 2004-08-17 Sony Corporation System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment
US7143939B2 (en) 2000-12-19 2006-12-05 Intel Corporation Wireless music device and method therefor
US20020124097A1 (en) 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6885989B2 (en) 2001-04-02 2005-04-26 International Business Machines Corporation Method and system for collaborative speech recognition for small-area network
US6757517B2 (en) 2001-05-10 2004-06-29 Chin-Chi Chang Apparatus and method for coordinated music playback in wireless ad-hoc networks
US7136934B2 (en) 2001-06-19 2006-11-14 Request, Inc. Multimedia synchronization method and device
KR100420069B1 (ko) 2001-08-23 2004-02-25 한국과학기술원 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법
US6892083B2 (en) 2001-09-05 2005-05-10 Vocera Communications Inc. Voice-controlled wireless communications system and method
US7536704B2 (en) 2001-10-05 2009-05-19 Opentv, Inc. Method and apparatus automatic pause and resume of playback for a popup on interactive TV
CA2408045A1 (en) 2001-10-16 2003-04-16 Audio Products International Corp. Loudspeaker with large displacement motional feedback
CA2407123C (en) 2001-10-16 2007-12-18 Audio Products International Corp. Low distortion loudspeaker cone suspension
US7006639B2 (en) 2001-11-20 2006-02-28 Maximilian Hans Hobelsberger Active noise-attenuating duct element
US7103542B2 (en) 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
AU2002361767A1 (en) 2001-12-17 2003-07-09 Becomm Corporation Method and system for synchronization of content rendering
DE10163213A1 (de) 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
US8103009B2 (en) 2002-01-25 2012-01-24 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
US7853341B2 (en) 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP4086280B2 (ja) 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
JP2005518734A (ja) 2002-02-20 2005-06-23 メシュネットワークス、インコーポレイテッド チャンネル間で802.11データトラフィックをルーティングしてアドホックネットワーク容量を増大するシステムおよび方法
JP3715584B2 (ja) 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
EP1510031A4 (en) 2002-05-06 2009-02-04 Syncronation Inc LOCALIZED AUDIO NETWORKS AND ASSOCIATED DIGITAL TOOLS
AU2003241405B2 (en) 2002-05-09 2008-06-19 Netstreams, Llc Audio network distribution system
US6961423B2 (en) 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
JP3815388B2 (ja) 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
US8060225B2 (en) 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
EP1389853B1 (en) 2002-08-14 2006-03-29 Sony Deutschland GmbH Bandwidth oriented reconfiguration of wireless ad hoc networks
JP3910898B2 (ja) 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
US7228275B1 (en) 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
JP2004163590A (ja) 2002-11-12 2004-06-10 Denso Corp 再生装置及びプログラム
KR20040042242A (ko) 2002-11-13 2004-05-20 삼성전자주식회사 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템
US7295548B2 (en) 2002-11-27 2007-11-13 Microsoft Corporation Method and system for disaggregating audio/visual components
CN100392723C (zh) 2002-12-11 2008-06-04 索夫塔马克斯公司 在稳定性约束下使用独立分量分析的语音处理系统和方法
US7076428B2 (en) 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
KR100668297B1 (ko) 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US6823050B2 (en) 2003-02-13 2004-11-23 International Business Machines Corporation System and method for interfacing with a personal telephony recorder
CA2518121A1 (en) 2003-03-03 2004-09-16 America Online, Inc. Source audio identifiers for digital communications
JP2004347943A (ja) 2003-05-23 2004-12-09 Clarion Co Ltd データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2004354721A (ja) 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
US7571014B1 (en) 2004-04-01 2009-08-04 Sonos, Inc. Method and apparatus for controlling multimedia players in a multi-zone system
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US10613817B2 (en) 2003-07-28 2020-04-07 Sonos, Inc. Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group
US7961892B2 (en) 2003-07-28 2011-06-14 Texas Instruments Incorporated Apparatus and method for monitoring speaker cone displacement in an audio speaker
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US20050031133A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Process for position indication
US20050031139A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using impedance
US20050031140A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using a capacitance measurement
US20060104451A1 (en) 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
US20050031134A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using infrared light
US20050031138A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of measuring a cant of an actuator
US20050031131A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of modifying dynamics of a system
US20050031132A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Control system
US20050031137A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Calibration of an actuator
KR20050023841A (ko) 2003-09-03 2005-03-10 삼성전자주식회사 비선형 왜곡 저감 방법 및 장치
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US20050077843A1 (en) 2003-10-11 2005-04-14 Ronnie Benditt Method and apparatus for controlling a performing arts show by an onstage performer
CN1871874A (zh) 2003-10-24 2006-11-29 皇家飞利浦电子股份有限公司 自适应声音再现
JP4516527B2 (ja) 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
US7705565B2 (en) 2003-12-31 2010-04-27 Motorola, Inc. Method and system for wireless charging
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4269973B2 (ja) 2004-02-27 2009-05-27 株式会社デンソー カーオーディオシステム
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7483538B2 (en) 2004-03-02 2009-01-27 Ksc Industries, Inc. Wireless and wired speaker hub for a home theater system
JP4059214B2 (ja) 2004-03-04 2008-03-12 ソニー株式会社 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム
US10200504B2 (en) 2007-06-12 2019-02-05 Icontrol Networks, Inc. Communication protocols over internet protocol (IP) networks
US7372966B2 (en) 2004-03-19 2008-05-13 Nokia Corporation System for limiting loudspeaker displacement
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7630501B2 (en) 2004-05-14 2009-12-08 Microsoft Corporation System and method for calibration of an acoustic system
US7792311B1 (en) 2004-05-15 2010-09-07 Sonos, Inc., Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7006938B2 (en) 2004-06-16 2006-02-28 Ami Semiconductor, Inc. Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US20060004834A1 (en) 2004-06-30 2006-01-05 Nokia Corporation Dynamic shortcuts
JP2006092482A (ja) 2004-09-27 2006-04-06 Yamaha Corp 音声認識通報装置
US7720232B2 (en) 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8386523B2 (en) 2004-12-30 2013-02-26 Texas Instruments Incorporated Random access audio decoder
TWI272860B (en) 2005-01-03 2007-02-01 Lite On Technology Corp Audio receiver and volume reminder method
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
WO2006076804A1 (en) 2005-01-21 2006-07-27 Certicom Corp. Elliptic curve random number generation
US20060190968A1 (en) 2005-01-31 2006-08-24 Searete Llc, A Limited Corporation Of The State Of The State Of Delaware Sharing between shared audio devices
EP1715669A1 (en) 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
WO2006111370A1 (en) 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US7991167B2 (en) 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
JP4760160B2 (ja) 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP4804052B2 (ja) 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US20070018844A1 (en) 2005-07-19 2007-01-25 Sehat Sutardja Two way remote control
JP4285457B2 (ja) 2005-07-20 2009-06-24 ソニー株式会社 音場測定装置及び音場測定方法
EP1912468B1 (en) 2005-07-29 2013-08-14 Panasonic Corporation Loudspeaker device
CN1909625A (zh) 2005-08-05 2007-02-07 鸿富锦精密工业(深圳)有限公司 一种自动调整音量的电视装置及控制方法
JP2009505321A (ja) 2005-08-19 2009-02-05 グレースノート インコーポレイテッド 再生装置の動作を制御する方法およびシステム
US20070060054A1 (en) 2005-09-15 2007-03-15 Sony Ericsson Mobile Communications Ab Wireless home communication system method and apparatus
JP4519041B2 (ja) 2005-09-20 2010-08-04 ローランド株式会社 楽器用スピーカ装置
US20080253589A1 (en) 2005-09-21 2008-10-16 Koninklijke Philips Electronics N.V. Ultrasound Imaging System with Voice Activated Controls Using Remotely Positioned Microphone
EP1952619B1 (en) 2005-11-07 2018-02-28 Telecom Italia S.p.A. Method for managing a conference call in a telephone network
CA2629801C (en) 2005-11-15 2011-02-01 Yamaha Corporation Remote conference apparatus and sound emitting/collecting apparatus
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
US20070140058A1 (en) 2005-11-21 2007-06-21 Motorola, Inc. Method and system for correcting transducer non-linearities
US7600194B2 (en) 2005-12-02 2009-10-06 Microsoft Corporation Start menu operation for computer user interface
JP4677341B2 (ja) 2005-12-21 2011-04-27 パイオニア株式会社 スピーカー装置及び携帯電話機
JP2007174233A (ja) 2005-12-21 2007-07-05 Pioneer Electronic Corp スピーカー装置及び携帯電話機
US20160066087A1 (en) 2006-01-30 2016-03-03 Ludger Solbach Joint noise suppression and acoustic echo cancellation
KR100762636B1 (ko) 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
JP4422692B2 (ja) 2006-03-03 2010-02-24 日本電信電話株式会社 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体
WO2007103937A2 (en) 2006-03-06 2007-09-13 General Innovations, Inc. Positionally sequenced loudspeaker system
US9092435B2 (en) 2006-04-04 2015-07-28 Johnson Controls Technology Company System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
EP1848243B1 (en) 2006-04-18 2009-02-18 Harman/Becker Automotive Systems GmbH Multi-channel echo compensation system and method
KR100786108B1 (ko) 2006-05-01 2007-12-18 김준식 음파통신 네트워크
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
ATE436151T1 (de) 2006-05-10 2009-07-15 Harman Becker Automotive Sys Kompensation von mehrkanalechos durch dekorrelation
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
JP4984683B2 (ja) 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US8189765B2 (en) 2006-07-06 2012-05-29 Panasonic Corporation Multichannel echo canceller
US20080037814A1 (en) 2006-08-09 2008-02-14 Jeng-Jye Shau Precision audio speakers
WO2008018099A1 (en) 2006-08-10 2008-02-14 Claudio Lastrucci Improvements to systems for acoustic diffusion
US10013381B2 (en) 2006-08-31 2018-07-03 Bose Corporation Media playing from a docked handheld media device
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8473618B2 (en) 2006-09-19 2013-06-25 Motorola Solutions, Inc. Method and system for processing multiple communication sessions in a communication network
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
TWI435591B (zh) 2006-10-17 2014-04-21 Marvell World Trade Ltd 用於蜂巢電話之顯示控制
US7747293B2 (en) 2006-10-17 2010-06-29 Marvell Worl Trade Ltd. Display control for cellular phone
JP2010507294A (ja) 2006-10-17 2010-03-04 アベガ システムズ ピーティーワイ リミテッド マルチメディアデバイスの統合
US8391501B2 (en) 2006-12-13 2013-03-05 Motorola Mobility Llc Method and apparatus for mixing priority and non-priority audio signals
US9124650B2 (en) 2006-12-13 2015-09-01 Quickplay Media Inc. Digital rights management in a mobile environment
US20080146289A1 (en) 2006-12-14 2008-06-19 Motorola, Inc. Automatic audio transducer adjustments based upon orientation of a mobile communication device
JP2008158868A (ja) 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
US7973857B2 (en) 2006-12-27 2011-07-05 Nokia Corporation Teleconference group formation using context information
US20090013255A1 (en) 2006-12-30 2009-01-08 Matthew John Yuschik Method and System for Supporting Graphical User Interfaces
KR101316750B1 (ko) 2007-01-23 2013-10-08 삼성전자주식회사 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법
TW200833152A (en) 2007-01-31 2008-08-01 Bluepacket Comm Co Ltd Multimedia switching system
JPWO2008096414A1 (ja) 2007-02-06 2010-05-20 パイオニア株式会社 コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体
US20090228919A1 (en) 2007-11-16 2009-09-10 Zott Joseph A Media playlist management and viewing remote control
US20080208594A1 (en) 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
JP4728982B2 (ja) 2007-03-05 2011-07-20 株式会社東芝 利用者と対話する装置、方法およびプログラム
US8880405B2 (en) 2007-03-07 2014-11-04 Vlingo Corporation Application text entry in a mobile environment using a speech processing facility
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8019076B1 (en) 2007-03-14 2011-09-13 Clearone Communications, Inc. Portable speakerphone device and subsystem utilizing false doubletalk detection
GB0706074D0 (en) 2007-03-28 2007-05-09 Skype Ltd Detection of communication states
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8983051B2 (en) 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8406439B1 (en) 2007-04-04 2013-03-26 At&T Intellectual Property I, L.P. Methods and systems for synthetic audio placement
US8848879B1 (en) 2007-05-03 2014-09-30 Avaya Inc. Customizable notification based on recent communication history
KR100827613B1 (ko) 2007-05-04 2008-05-07 삼성전자주식회사 휴대용 단말기의 마이크 제어 장치 및 방법
US8041565B1 (en) 2007-05-04 2011-10-18 Foneweb, Inc. Precision speech to text conversion
US8032383B1 (en) 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8136040B2 (en) 2007-05-16 2012-03-13 Apple Inc. Audio variance for multiple windows
CN101681484B (zh) 2007-05-18 2013-10-16 速函移动公司 用于通过小数据速率通信系统的增强型通信的系统和方法
US20080291916A1 (en) 2007-05-22 2008-11-27 Bo Xiong Systems and methods for dynamic quality of service
EP1998446A1 (en) 2007-05-31 2008-12-03 Alcatel Lucent Remote control for devices with connectivity to a service delivery platform
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
JP4985151B2 (ja) 2007-06-29 2012-07-25 ヤマハ株式会社 コンテンツ配信システム及びセンタ装置
JP4916394B2 (ja) 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
WO2009020617A1 (en) 2007-08-06 2009-02-12 Orison Corporation System and method for three-dimensional ultrasound imaging
US20090046866A1 (en) 2007-08-15 2009-02-19 Fortemedia, Inc. Apparatus capable of performing acoustic echo cancellation and a method thereof
US8073125B2 (en) 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US7844724B2 (en) 2007-10-24 2010-11-30 Social Communications Company Automated real-time data stream switching in a shared virtual area communication environment
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8013720B2 (en) 2007-11-02 2011-09-06 Reverse Control, Inc. Signal apparatus for facilitating safe backup of vehicles
CN103648071B (zh) 2007-11-20 2018-11-02 松下知识产权经营株式会社 扬声器、视频设备、以及便携式信息处理装置
US9247346B2 (en) 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US20090153289A1 (en) 2007-12-12 2009-06-18 Eric James Hope Handheld electronic devices with bimodal remote control functionality
US9386154B2 (en) 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8473081B2 (en) 2007-12-25 2013-06-25 Personics Holdings, Inc. Method and system for event reminder using an earpiece
WO2009086599A1 (en) 2008-01-07 2009-07-16 Avega Systems Pty Ltd A user interface for managing the operation of networked media playback devices
US9992314B2 (en) 2008-01-24 2018-06-05 Garmin Switzerland Gmbh Automatic device mode switching
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE102008039330A1 (de) 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8072905B2 (en) 2008-02-04 2011-12-06 Sony Ericsson Mobile Communications Ab Intelligent interaction between devices in a local network
US8213598B2 (en) 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression
US8638908B2 (en) 2008-02-28 2014-01-28 Computer Products Introductions, Corp Contextual conversation processing in telecommunication applications
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
WO2009120301A2 (en) 2008-03-25 2009-10-01 Square Products Corporation System and method for simultaneous media presentation
US20090248397A1 (en) 2008-03-25 2009-10-01 Microsoft Corporation Service Initiation Techniques
US7516068B1 (en) 2008-04-07 2009-04-07 International Business Machines Corporation Optimized collection of audio for speech recognition
CN101562671A (zh) 2008-04-18 2009-10-21 鸿富锦精密工业(深圳)有限公司 音频设备的音量控制方法及通信装置
US8751227B2 (en) 2008-04-30 2014-06-10 Nec Corporation Acoustic model learning device and speech recognition device
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8831948B2 (en) 2008-06-06 2014-09-09 At&T Intellectual Property I, L.P. System and method for synthetically generated speech describing media content
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8325909B2 (en) 2008-06-25 2012-12-04 Microsoft Corporation Acoustic echo suppression
US8693663B2 (en) 2008-06-27 2014-04-08 Centurylink Intellectual Property Llc System and method for implementing do-not-disturb during playback of media content
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8505056B2 (en) 2008-07-10 2013-08-06 Apple Inc. Updating properties of remote A/V performance nodes
EP2146519B1 (en) 2008-07-16 2012-06-06 Nuance Communications, Inc. Beamforming pre-processing for speaker localization
US8781833B2 (en) 2008-07-17 2014-07-15 Nuance Communications, Inc. Speech recognition semantic classification training
US8639830B2 (en) 2008-07-22 2014-01-28 Control4 Corporation System and method for streaming audio
US8325938B2 (en) 2008-08-12 2012-12-04 Sony Corporation Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method
JP5206234B2 (ja) 2008-08-27 2013-06-12 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US8676586B2 (en) 2008-09-16 2014-03-18 Nice Systems Ltd Method and apparatus for interaction or discourse analytics
KR20100034229A (ko) 2008-09-23 2010-04-01 삼성전자주식회사 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
EP3258468B1 (en) 2008-11-10 2019-08-21 Google LLC Multisensory speech detection
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
JP5347472B2 (ja) 2008-12-12 2013-11-20 ヤマハ株式会社 遠隔制御装置および遠隔制御システム
US8548812B2 (en) 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
KR101467796B1 (ko) 2009-01-12 2014-12-10 엘지전자 주식회사 이동단말기 및 그 제어 방법
US20100179874A1 (en) 2009-01-13 2010-07-15 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons and brands
US8351617B2 (en) 2009-01-13 2013-01-08 Fortemedia, Inc. Method for phase mismatch calibration for an array microphone and phase calibration module for the same
US20130283169A1 (en) 2012-04-24 2013-10-24 Social Communications Company Voice-based virtual area navigation
US8428758B2 (en) 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
FR2943875A1 (fr) 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
KR101064976B1 (ko) 2009-04-06 2011-09-15 한국과학기술원 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇
US8243949B2 (en) 2009-04-14 2012-08-14 Plantronics, Inc. Network addressible loudspeaker and audio play
EP2420050B1 (en) 2009-04-15 2013-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multichannel echo canceller
US8483398B2 (en) 2009-04-30 2013-07-09 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses
JP5550456B2 (ja) 2009-06-04 2014-07-16 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
JP4820434B2 (ja) 2009-06-08 2011-11-24 レノボ・シンガポール・プライベート・リミテッド マイクロフォンのミュート・コントロール
US20100332236A1 (en) 2009-06-25 2010-12-30 Blueant Wireless Pty Limited Voice-triggered operation of electronic devices
US8625775B2 (en) 2009-08-06 2014-01-07 Hti Ip, L.L.C. Method and system for reducing echo and noise in a vehicle passenger compartment environment
US8478982B2 (en) 2009-08-06 2013-07-02 Broadcom Corporation Media access control security management in physical layer
JP5440053B2 (ja) 2009-09-14 2014-03-12 ソニー株式会社 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
WO2011033887A1 (ja) 2009-09-17 2011-03-24 株式会社日立メディコ 超音波探触子及び超音波撮像装置
US20110091055A1 (en) 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
US8600073B2 (en) 2009-11-04 2013-12-03 Cambridge Silicon Radio Limited Wind noise suppression
KR101301535B1 (ko) 2009-12-02 2013-09-04 한국전자통신연구원 하이브리드 번역 장치 및 그 방법
US20110145581A1 (en) 2009-12-14 2011-06-16 Verizon Patent And Licensing, Inc. Media playback across devices
JP5641186B2 (ja) 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
NO332437B1 (no) 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011091402A1 (en) 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8713571B2 (en) 2010-02-17 2014-04-29 Microsoft Corporation Asynchronous task execution
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9209987B2 (en) 2010-03-02 2015-12-08 Microsoft Technology Licensing, Llc Social media playback
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9514476B2 (en) 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8437339B2 (en) 2010-04-28 2013-05-07 Hewlett-Packard Development Company, L.P. Techniques to provide integrated voice service management
JP5572445B2 (ja) 2010-04-30 2014-08-13 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
CA2943957C (en) 2010-05-04 2017-10-03 Avery Li-Chun Wang Methods and systems for synchronizing media
CN102893633B (zh) 2010-05-06 2015-04-15 杜比实验室特许公司 用于便携式媒体回放装置的音频系统均衡化
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9736600B2 (en) 2010-05-17 2017-08-15 Iii Holdings 4, Llc Devices and methods for collecting acoustic data
US20110289506A1 (en) 2010-05-18 2011-11-24 Google Inc. Management of computing resources for applications
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8831761B2 (en) 2010-06-02 2014-09-09 Sony Corporation Method for determining a processed audio signal and a handheld device
JP2011259097A (ja) 2010-06-07 2011-12-22 Sony Corp 音声信号処理装置及び音声信号処理方法
US8588849B2 (en) 2010-07-09 2013-11-19 Blackberry Limited System and method for resuming media
US8699723B2 (en) 2010-07-20 2014-04-15 International Business Machines Corporation Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device
US8762144B2 (en) 2010-07-21 2014-06-24 Samsung Electronics Co., Ltd. Method and apparatus for voice activity detection
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9349368B1 (en) 2010-08-05 2016-05-24 Google Inc. Generating an audio notification based on detection of a triggering event
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
EP2609488A4 (en) 2010-08-27 2015-03-11 Intel Corp APPARATUS AND METHOD FOR PRESSURE ACTIVATION
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
JP5259020B2 (ja) 2010-10-01 2013-08-07 三菱電機株式会社 音声認識装置
US9240111B2 (en) 2010-10-06 2016-01-19 Microsoft Technology Licensing, Llc Inferring building metadata from distributed sensors
CN103222192B (zh) 2010-10-08 2019-05-07 日本电气株式会社 信号处理设备和信号处理方法
WO2012054872A2 (en) 2010-10-22 2012-04-26 Phorus Llc Media distribution architecture
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
EP2456199A3 (en) 2010-11-22 2014-07-16 DDS Newco Inc. Method and systems of dynamically managing content for use by a media playback device
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
EP2652737B1 (en) 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
JP5771002B2 (ja) 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US9241227B2 (en) 2011-01-06 2016-01-19 Bose Corporation Transducer with integrated sensor
JP2012150237A (ja) 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
CN102123188A (zh) 2011-03-03 2011-07-13 曾超宁 移动电话耳麦装置
KR20120100514A (ko) 2011-03-04 2012-09-12 삼성전자주식회사 디바이스 그룹핑 방법 및 이를 적용한 서버
US8804977B2 (en) 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9493130B2 (en) 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
KR20120128542A (ko) 2011-05-11 2012-11-27 삼성전자주식회사 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치
US9342516B2 (en) 2011-05-18 2016-05-17 Microsoft Technology Licensing, Llc Media presentation playback annotation
US8320577B1 (en) 2011-05-20 2012-11-27 Google Inc. Method and apparatus for multi-channel audio processing using single-channel components
CN103703719B (zh) 2011-05-31 2018-06-05 谷歌有限责任公司 使通信会话中的参与者静音的方法及设备
US8897465B2 (en) 2011-06-01 2014-11-25 Robert Bosch Gmbh Class D micro-speaker
US8958571B2 (en) 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US8738925B1 (en) 2013-01-07 2014-05-27 Fitbit, Inc. Wireless portable biometric device syncing
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
US9762967B2 (en) 2011-06-14 2017-09-12 Comcast Cable Communications, Llc System and method for presenting content with time based metadata
US8731765B2 (en) 2011-06-28 2014-05-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a torque machine of a powertrain system
US20130018659A1 (en) 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US20130024018A1 (en) 2011-07-22 2013-01-24 Htc Corporation Multimedia control method and multimedia control system
JP5289517B2 (ja) 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
US9148742B1 (en) 2011-07-29 2015-09-29 Google Inc. Proximity detection via audio
JP5640918B2 (ja) 2011-08-05 2014-12-17 ブラザー工業株式会社 サーバ装置、対応付け方法、及び携帯機器用プログラム
EP2555598A1 (en) 2011-08-05 2013-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for generating optical radiation by means of electrically operated pulsed discharges
US20130039527A1 (en) 2011-08-08 2013-02-14 Bang & Olufsen A/S Modular, configurable speaker and a method of operating it
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
US20130211826A1 (en) 2011-08-22 2013-08-15 Claes-Fredrik Urban Mannby Audio Signals as Buffered Streams of Audio Signals and Metadata
US8750677B2 (en) 2011-08-23 2014-06-10 Microsoft Corporation Method for transferring media playback from a different device
US20130073293A1 (en) 2011-09-20 2013-03-21 Lg Electronics Inc. Electronic device and method for controlling the same
US9094539B1 (en) 2011-09-22 2015-07-28 Amazon Technologies, Inc. Dynamic device adjustments based on determined user sleep state
US8996381B2 (en) 2011-09-27 2015-03-31 Sensory, Incorporated Background speech recognition assistant
US8768707B2 (en) 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9729631B2 (en) 2011-09-30 2017-08-08 Apple Inc. Asynchronous data manipulation
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US8971546B2 (en) 2011-10-14 2015-03-03 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to control audio playback devices
CN103052001B (zh) 2011-10-17 2015-06-24 联想(北京)有限公司 智能设备及其控制方法
GB201118784D0 (en) 2011-10-31 2011-12-14 Omnifone Ltd Djml
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
US8983089B1 (en) 2011-11-28 2015-03-17 Rawles Llc Sound source localization using multiple microphone arrays
CN102567468B (zh) 2011-12-06 2014-06-04 上海聚力传媒技术有限公司 一种用于对媒体文件的播放音量进行调节的方法与设备
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
WO2013089675A1 (en) 2011-12-13 2013-06-20 Intel Corporation Channel navigation in connected media devices through keyword selection
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
KR102022318B1 (ko) 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9654817B2 (en) 2012-01-27 2017-05-16 Avaya Inc. System and method to synchronize video playback on mobile devices
WO2013115748A1 (en) 2012-01-30 2013-08-08 Echostar Ukraine, L.L.C. Apparatus, systems and methods for adjusting output audio volume based on user location
US9401058B2 (en) 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
US9418658B1 (en) 2012-02-08 2016-08-16 Amazon Technologies, Inc. Configuration of voice controlled assistant
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9947333B1 (en) 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
EP2632141B1 (en) 2012-02-22 2014-10-15 Dialog Semiconductor B.V. Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components
US9065895B2 (en) 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
US20130238326A1 (en) 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
US9361878B2 (en) 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
US20130263237A1 (en) * 2012-03-30 2013-10-03 Ebay Inc. User authentication and authorization using personas
US9198204B2 (en) 2012-04-11 2015-11-24 Google Inc. Apparatus and method for seamless commissioning of wireless devices
EP2839391A4 (en) 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9633186B2 (en) 2012-04-23 2017-04-25 Apple Inc. Systems and methods for controlling output of content based on human recognition data detection
US9117449B2 (en) 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
CN104395957B (zh) 2012-04-30 2018-02-13 创新科技有限公司 一种通用可重构回声消除系统
US8886524B1 (en) 2012-05-01 2014-11-11 Amazon Technologies, Inc. Signal processing based on audio context
US11452153B2 (en) 2012-05-01 2022-09-20 Lisnr, Inc. Pairing and gateway connection using sonic tones
US20130294611A1 (en) 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
US9584909B2 (en) 2012-05-10 2017-02-28 Google Inc. Distributed beamforming based on message passing
US9768829B2 (en) 2012-05-11 2017-09-19 Intel Deutschland Gmbh Methods for processing audio signals and circuit arrangements therefor
US8908879B2 (en) 2012-05-23 2014-12-09 Sonos, Inc. Audio content auditioning
US9633368B2 (en) 2012-05-25 2017-04-25 Apple Inc. Content ranking and serving on a multi-user device or interface
CN103456332A (zh) 2012-05-28 2013-12-18 富泰华工业(深圳)有限公司 音频播放装置及音量调节方法
US20130324031A1 (en) 2012-05-31 2013-12-05 Nokia Corporation Dynamic allocation of audio channel for surround sound systems
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
EP2856690B1 (en) 2012-06-01 2020-12-02 BlackBerry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US9301073B2 (en) 2012-06-08 2016-03-29 Apple Inc. Systems and methods for determining the condition of multiple microphones
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9031255B2 (en) 2012-06-15 2015-05-12 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to provide low-latency audio
US10354650B2 (en) 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US9674587B2 (en) 2012-06-26 2017-06-06 Sonos, Inc. Systems and methods for networked music playback including remote add to queue
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9137564B2 (en) 2012-06-28 2015-09-15 Sonos, Inc. Shift to corresponding media in a playback queue
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9384737B2 (en) 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US20140006825A1 (en) 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
US20140003635A1 (en) 2012-07-02 2014-01-02 Qualcomm Incorporated Audio signal processing device calibration
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
US9615171B1 (en) 2012-07-02 2017-04-04 Amazon Technologies, Inc. Transformation inversion to reduce the effect of room acoustics
KR101972955B1 (ko) 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8972762B2 (en) 2012-07-11 2015-03-03 Blackberry Limited Computing devices and methods for resetting inactivity timers on computing devices
US8983844B1 (en) 2012-07-31 2015-03-17 Amazon Technologies, Inc. Transmission of noise parameters for improving automatic speech recognition
US8831957B2 (en) 2012-08-01 2014-09-09 Google Inc. Speech recognition models based on location indicia
DE112013007782B3 (de) 2012-08-03 2022-02-17 Semiconductor Energy Laboratory Co., Ltd. Lichtemittierende Vorrichtung
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
EP3462452A1 (en) 2012-08-24 2019-04-03 Oticon A/s Noise estimation for use with noise reduction and echo cancellation in personal communication
US9532153B2 (en) 2012-08-29 2016-12-27 Bang & Olufsen A/S Method and a system of providing information to a user
US9088336B2 (en) 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
US20140075311A1 (en) 2012-09-11 2014-03-13 Jesse William Boettcher Methods and apparatus for controlling audio volume on an electronic device
US20140075306A1 (en) 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US8798598B2 (en) 2012-09-13 2014-08-05 Alain Rossmann Method and system for screencasting Smartphone video game software to online social networks
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US8983383B1 (en) 2012-09-25 2015-03-17 Rawles Llc Providing hands-free service to multiple devices
US9319816B1 (en) 2012-09-26 2016-04-19 Amazon Technologies, Inc. Characterizing environment using ultrasound pilot tones
JP2014071138A (ja) 2012-09-27 2014-04-21 Xing Inc カラオケ装置
US8725125B2 (en) 2012-09-28 2014-05-13 United Video Properties, Inc. Systems and methods for controlling audio playback on portable devices with vehicle equipment
KR102091236B1 (ko) 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
WO2014055312A1 (en) 2012-10-02 2014-04-10 Mh Acoustics, Llc Earphones having configurable microphone arrays
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US8484025B1 (en) 2012-10-04 2013-07-09 Google Inc. Mapping an audio utterance to an action using a classifier
CN102902253B (zh) 2012-10-09 2015-07-15 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
US20140108010A1 (en) 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures
CA2888016C (en) 2012-10-15 2022-05-31 Msi Dfat Llc Direct field acoustic testing in a semi-reverberant enclosure
US9232310B2 (en) 2012-10-15 2016-01-05 Nokia Technologies Oy Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones
DE102012020271A1 (de) 2012-10-17 2014-04-17 Wolfgang Klippel Anordnung und Verfahren zur Steuerung von Wandlern
KR101978688B1 (ko) 2012-10-22 2019-05-15 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
US9319445B2 (en) 2012-10-22 2016-04-19 Spotify Ab Systems and methods for pre-fetching media content
WO2014064324A1 (en) 2012-10-26 2014-05-01 Nokia Corporation Multi-device speech recognition
KR20140054643A (ko) 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10381001B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US8761349B2 (en) 2012-10-31 2014-06-24 Citrix Systems, Inc. Systems and methods of monitoring performance of acoustic echo cancellation
US9275637B1 (en) 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9275642B2 (en) 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
CN102999161B (zh) 2012-11-13 2016-03-02 科大讯飞股份有限公司 一种语音唤醒模块的实现方法及应用
US9685171B1 (en) 2012-11-20 2017-06-20 Amazon Technologies, Inc. Multiple-stage adaptive filtering of audio signals
US9070367B1 (en) 2012-11-26 2015-06-30 Amazon Technologies, Inc. Local speech recognition of frequent utterances
US20140149118A1 (en) 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9131298B2 (en) 2012-11-28 2015-09-08 Qualcomm Incorporated Constrained dynamic amplitude panning in collaborative sound systems
WO2014142702A1 (en) 2013-03-15 2014-09-18 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Selective speech recognition for chat and digital personal assistant systems
US9203045B2 (en) 2012-11-29 2015-12-01 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
WO2014088588A1 (en) 2012-12-07 2014-06-12 Empire Technology Development Llc Personal assistant context building
US20140161263A1 (en) 2012-12-10 2014-06-12 Microsoft Corporation Facilitating recognition of real-time content
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9226071B2 (en) 2012-12-13 2015-12-29 Maxim Integrated Products, Inc. Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker
US9607046B2 (en) 2012-12-14 2017-03-28 Microsoft Technology Licensing, Llc Probability-based state modification for query dialogues
US9300910B2 (en) 2012-12-14 2016-03-29 Biscotti Inc. Video mail capture, processing and distribution
US9271111B2 (en) 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
WO2014098477A1 (ko) 2012-12-18 2014-06-26 삼성전자 주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
US9047857B1 (en) 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
US9098467B1 (en) 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
WO2014102722A1 (en) 2012-12-26 2014-07-03 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
US9620115B2 (en) 2013-01-03 2017-04-11 Telenav, Inc. Content delivery system with barge-in mechanism and method of operation thereof
KR102051588B1 (ko) 2013-01-07 2019-12-03 삼성전자주식회사 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치
US9318125B2 (en) 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
JP2014137590A (ja) 2013-01-18 2014-07-28 Yoji Fukinuki 音楽コンテンツ配信方法
US9646605B2 (en) 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US20140215332A1 (en) 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
US9818407B1 (en) 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
TWI593294B (zh) 2013-02-07 2017-07-21 晨星半導體股份有限公司 收音系統與相關方法
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9300266B2 (en) 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
US9237384B2 (en) 2013-02-14 2016-01-12 Sonos, Inc. Automatic configuration of household playback devices
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9172747B2 (en) 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
CN105308681B (zh) 2013-02-26 2019-02-12 皇家飞利浦有限公司 用于生成语音信号的方法和装置
US9195432B2 (en) 2013-02-26 2015-11-24 Sonos, Inc. Pre-caching of audio content
CN104010251B (zh) 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音系统与相关方法
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9460715B2 (en) 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US20140258292A1 (en) 2013-03-05 2014-09-11 Clip Interactive, Inc. Apparatus, system, and method for integrating content and content services
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
JP6429465B2 (ja) 2013-03-07 2018-11-28 株式会社半導体エネルギー研究所 装置及びその作製方法
US9349386B2 (en) 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
WO2014138489A1 (en) 2013-03-07 2014-09-12 Tiskerling Dynamics Llc Room and program responsive loudspeaker system
US9161126B2 (en) 2013-03-08 2015-10-13 Cirrus Logic, Inc. Systems and methods for protecting a speaker
JP6211677B2 (ja) 2013-03-11 2017-10-11 アップル インコーポレイテッド ラウドスピーカの指向性範囲にまたがる音色の一定性
CN104053088A (zh) 2013-03-11 2014-09-17 联想(北京)有限公司 一种麦克风阵列调整方法、麦克风阵列及电子设备
TWI533686B (zh) 2013-03-11 2016-05-11 緯創資通股份有限公司 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
US9173021B2 (en) 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
WO2014165032A1 (en) 2013-03-12 2014-10-09 Aawtend, Inc. Integrated sensor-array processor
US11393461B2 (en) * 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
KR20140111859A (ko) 2013-03-12 2014-09-22 삼성전자주식회사 콘텐트 공유 방법 및 이를 위한 디바이스
CN105009203A (zh) 2013-03-12 2015-10-28 纽昂斯通讯公司 用于检测语音命令的方法和装置
KR101571338B1 (ko) 2013-03-13 2015-11-24 삼성전자주식회사 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치
US9060052B2 (en) 2013-03-13 2015-06-16 Accusonus S.A. Single channel, binaural and multi-channel dereverberation
US20140274185A1 (en) 2013-03-14 2014-09-18 Aliphcom Intelligence device connection for wireless media ecosystem
KR102152754B1 (ko) 2013-03-14 2020-09-07 삼성전자주식회사 블루루스 디바이스에서 통신 연결 방법 및 그 장치
JP6013951B2 (ja) 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法
KR101764660B1 (ko) 2013-03-14 2017-08-03 애플 인크. 스피커 및 핸드헬드 청취 디바이스를 사용한 적응적 공간 등화
US20140278933A1 (en) 2013-03-15 2014-09-18 F. Gavin McMillan Methods and apparatus to measure audience engagement with media
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
US9626436B2 (en) 2013-03-15 2017-04-18 Spotify Ab Systems, methods, and computer readable medium for generating playlists
WO2014149050A1 (en) 2013-03-21 2014-09-25 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
KR102173936B1 (ko) 2013-03-26 2020-11-04 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기, 및 조명 장치
JP6300589B2 (ja) 2013-04-04 2018-03-28 株式会社半導体エネルギー研究所 半導体装置の作製方法
US9462115B2 (en) 2013-04-04 2016-10-04 James S. Rand Unified communications system and method
JP6198432B2 (ja) 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
WO2014172299A1 (en) 2013-04-15 2014-10-23 Chacha Search, Inc. Method and system of increasing user interaction
US9501533B2 (en) 2013-04-16 2016-11-22 Sonos, Inc. Private queue for a media playback system
US9875494B2 (en) 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
US9304736B1 (en) 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
JP6416752B2 (ja) 2013-04-19 2018-10-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
US9936290B2 (en) 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
KR102230139B1 (ko) 2013-05-17 2021-03-18 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 조명 장치, 발광 장치, 및 전자 기기
WO2014189486A1 (en) 2013-05-20 2014-11-27 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
US9472201B1 (en) 2013-05-22 2016-10-18 Google Inc. Speaker localization by means of tactile input
US9390708B1 (en) 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US20140358535A1 (en) 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
US20140357248A1 (en) 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US20140365225A1 (en) 2013-06-05 2014-12-11 DSP Group Ultra-low-power adaptive, user independent, voice triggering schemes
US9438193B2 (en) 2013-06-05 2016-09-06 Sonos, Inc. Satellite volume control
US9654073B2 (en) 2013-06-07 2017-05-16 Sonos, Inc. Group volume control
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
DE112014002749B4 (de) 2013-06-09 2021-08-26 Apple Inc. Bluetooth-Alarmbenachrichtigungsdienst
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US8953778B2 (en) 2013-06-17 2015-02-10 Avaya Inc. Real-time intelligent mute interactive features
US9066048B2 (en) 2013-06-17 2015-06-23 Spotify Ab System and method for switching between audio content while navigating through video streams
US9324322B1 (en) 2013-06-18 2016-04-26 Amazon Technologies, Inc. Automatic volume attenuation for speech enabled devices
US9494683B1 (en) 2013-06-18 2016-11-15 Amazon Technologies, Inc. Audio-based gesture detection
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9640179B1 (en) 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
WO2014210429A1 (en) 2013-06-28 2014-12-31 Harman International Industries, Inc. Wireless control of linked devices
US9298415B2 (en) 2013-07-09 2016-03-29 Sonos, Inc. Systems and methods to provide play/pause content
US20150019201A1 (en) 2013-07-09 2015-01-15 Stanley F. Schoenbach Real-time interpreting systems and methods
US9396727B2 (en) 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
US9293480B2 (en) 2013-07-10 2016-03-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and display device including the semiconductor device
CN110096253B (zh) 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
DE102014109122A1 (de) 2013-07-12 2015-01-15 Gm Global Technology Operations, Llc Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
US9426598B2 (en) 2013-07-15 2016-08-23 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
US9445196B2 (en) 2013-07-24 2016-09-13 Mh Acoustics Llc Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US9772994B2 (en) 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9666187B1 (en) 2013-07-25 2017-05-30 Google Inc. Model for enabling service providers to address voice-activated commands
WO2015017303A1 (en) 2013-07-31 2015-02-05 Motorola Mobility Llc Method and apparatus for adjusting voice recognition processing based on noise characteristics
US10186262B2 (en) 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
US9418651B2 (en) 2013-07-31 2016-08-16 Google Technology Holdings LLC Method and apparatus for mitigating false accepts of trigger phrases
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
DE102013012811B4 (de) 2013-08-01 2024-02-22 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler
US9565497B2 (en) 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
US10873997B2 (en) 2013-08-01 2020-12-22 Fong-Min Chang Voice controlled artificial intelligent smart illumination device
EP3036594B1 (en) 2013-08-21 2021-05-26 Ademco Inc. Devices and methods for interacting with an hvac controller
EP2862164B1 (en) 2013-08-23 2017-05-31 Nuance Communications, Inc. Multiple pass automatic speech recognition
US9190043B2 (en) 2013-08-27 2015-11-17 Bose Corporation Assisting conversation in noisy environments
US9514747B1 (en) 2013-08-28 2016-12-06 Amazon Technologies, Inc. Reducing speech recognition latency
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
KR20160048960A (ko) 2013-08-30 2016-05-04 후아웨이 테크놀러지 컴퍼니 리미티드 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템
JP6037026B2 (ja) 2013-09-11 2016-11-30 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
US9672812B1 (en) 2013-09-18 2017-06-06 Amazon Technologies, Inc. Qualifying trigger expressions in speech-based systems
US9516081B2 (en) 2013-09-20 2016-12-06 Amazon Technologies, Inc. Reduced latency electronic content system
US9848260B2 (en) 2013-09-24 2017-12-19 Nuance Communications, Inc. Wearable communication enhancement device
US9668052B2 (en) 2013-09-25 2017-05-30 Google Technology Holdings LLC Audio routing system for routing audio data to and from a mobile device
US9443527B1 (en) 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
US9355555B2 (en) 2013-09-27 2016-05-31 Sonos, Inc. System and method for issuing commands in a media playback system
CN103546616A (zh) 2013-09-30 2014-01-29 深圳市同洲电子股份有限公司 一种调节音量的方法及装置
US9288596B2 (en) 2013-09-30 2016-03-15 Sonos, Inc. Coordinator device for paired or consolidated players
KR102114219B1 (ko) 2013-10-10 2020-05-25 삼성전자주식회사 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9633671B2 (en) 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
TWI642170B (zh) 2013-10-18 2018-11-21 半導體能源研究所股份有限公司 顯示裝置及電子裝置
US9818061B1 (en) 2013-10-22 2017-11-14 Lumin, LLC Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment
WO2015060867A1 (en) 2013-10-25 2015-04-30 Intel Corporation Techniques for preventing voice replay attacks
EP2869599B1 (en) 2013-11-05 2020-10-21 Oticon A/s A binaural hearing assistance system comprising a database of head related transfer functions
JP2015090570A (ja) 2013-11-06 2015-05-11 ソニー株式会社 情報処理装置および制御方法
US10311482B2 (en) 2013-11-11 2019-06-04 At&T Intellectual Property I, Lp Method and apparatus for adjusting a digital assistant persona
US8775191B1 (en) 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
JP6236303B2 (ja) 2013-11-26 2017-11-22 株式会社デンソーアイティーラボラトリ 制御装置、制御方法およびプログラム
US9373321B2 (en) 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9704478B1 (en) 2013-12-02 2017-07-11 Amazon Technologies, Inc. Audio output masking for improved automatic speech recognition
CN104143326B (zh) 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
US8719039B1 (en) 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
US10720153B2 (en) * 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
US10055190B2 (en) 2013-12-16 2018-08-21 Amazon Technologies, Inc. Attribute-based audio channel arbitration
US9378651B2 (en) 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
US10224056B1 (en) 2013-12-17 2019-03-05 Amazon Technologies, Inc. Contingent device actions during loss of network connectivity
US9721570B1 (en) 2013-12-17 2017-08-01 Amazon Technologies, Inc. Outcome-oriented dialogs on a speech recognition platform
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
CN105723451B (zh) 2013-12-20 2020-02-28 英特尔公司 从低功率始终侦听模式到高功率语音识别模式的转换
US20150179181A1 (en) 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US9899021B1 (en) 2013-12-20 2018-02-20 Amazon Technologies, Inc. Stochastic modeling of user interactions with a detection system
US9099974B2 (en) 2013-12-20 2015-08-04 Vmware, Inc. Volume redirection
EP2890160B1 (en) 2013-12-24 2019-08-14 Nxp B.V. Loudspeaker controller
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
US9443516B2 (en) 2014-01-09 2016-09-13 Honeywell International Inc. Far-field speech recognition systems and methods
US8938394B1 (en) 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
EP3092824B1 (en) 2014-01-10 2017-11-01 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US9300647B2 (en) 2014-01-15 2016-03-29 Sonos, Inc. Software application and zones
US9288597B2 (en) 2014-01-20 2016-03-15 Sony Corporation Distributed wireless speaker system with automatic configuration determination when new speakers are added
WO2015112137A1 (en) 2014-01-22 2015-07-30 Pearl Capital Developments Llc Coordinated hand-off of audio data transmission
US9356882B2 (en) 2014-02-04 2016-05-31 Printeron Inc. Streamlined system for the transmission of network resource data
US9443876B2 (en) 2014-02-05 2016-09-13 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
US9929368B2 (en) 2014-02-06 2018-03-27 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, lighting device, and electronic appliance
TWI658597B (zh) 2014-02-07 2019-05-01 日商半導體能源研究所股份有限公司 半導體裝置
US9318112B2 (en) 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
JP6289936B2 (ja) 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
FR3018025B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
FR3018024B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
US9408008B2 (en) 2014-02-28 2016-08-02 Sonos, Inc. Playback zone representations
WO2015133022A1 (ja) 2014-03-03 2015-09-11 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US10015593B2 (en) 2014-03-03 2018-07-03 University Of Utah Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
US9489171B2 (en) 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
US9679054B2 (en) 2014-03-05 2017-06-13 Sonos, Inc. Webpage media playback
US10599287B2 (en) 2014-03-11 2020-03-24 Sonos, Inc. Group volume control
US9640669B2 (en) 2014-03-13 2017-05-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9226062B2 (en) 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
US10514747B2 (en) 2014-03-24 2019-12-24 Silicon Laboratories Inc. Low-power communication apparatus with wakeup detection and associated methods
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US9648564B1 (en) 2014-03-26 2017-05-09 Amazon Technologies, Inc. Wake-up management for mobile devices
US9916839B1 (en) 2014-03-27 2018-03-13 Amazon Technologies, Inc. Shared audio functionality based on device grouping
US9431021B1 (en) 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
US9547468B2 (en) 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
KR102146462B1 (ko) 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US8874448B1 (en) 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
CN104978965B (zh) 2014-04-07 2019-04-26 三星电子株式会社 电子装置及利用电子装置和服务器的语音识别执行方法
US9560437B2 (en) 2014-04-08 2017-01-31 Doppler Labs, Inc. Time heuristic audio control
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
DE102014005381B3 (de) 2014-04-11 2014-12-11 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler
US20150302856A1 (en) 2014-04-17 2015-10-22 Qualcomm Incorporated Method and apparatus for performing function by speech input
US20150334471A1 (en) 2014-05-15 2015-11-19 Echostar Technologies L.L.C. Multiple simultaneous audio video data decoding
WO2015178950A1 (en) 2014-05-19 2015-11-26 Tiskerling Dynamics Llc Directivity optimized sound reproduction
EP3146796B1 (en) 2014-05-23 2021-10-27 Samsung Electronics Co., Ltd. Method and apparatus for providing notification
US9860289B2 (en) 2014-05-23 2018-01-02 Radeeus, Inc. Multimedia digital content retrieval, matching, and syncing systems and methods of using the same
US9900723B1 (en) 2014-05-28 2018-02-20 Apple Inc. Multi-channel loudspeaker matching using variable directivity
TWI849490B (zh) 2014-05-30 2024-07-21 日商半導體能源研究所股份有限公司 發光元件,發光裝置,電子裝置以及照明裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US9720642B2 (en) 2014-06-04 2017-08-01 Sonos, Inc. Prioritizing media content requests
US20150355818A1 (en) 2014-06-04 2015-12-10 Sonos, Inc. Continuous Playback Queue
US10624612B2 (en) 2014-06-05 2020-04-21 Chikayoshi Sumi Beamforming method, measurement and imaging instruments, and communication instruments
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
CN104092936B (zh) 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
US20150363061A1 (en) 2014-06-13 2015-12-17 Autonomic Controls, Inc. System and method for providing related digital content
US9767159B2 (en) 2014-06-13 2017-09-19 Google Inc. Ranking search results
US9589556B2 (en) 2014-06-19 2017-03-07 Yang Gao Energy adjustment of acoustic echo replica signal for speech enhancement
US9520139B2 (en) 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
US9766702B2 (en) 2014-06-19 2017-09-19 Apple Inc. User detection by a computing device
US20150373100A1 (en) 2014-06-19 2015-12-24 Pavel KRAVETS Context sharing between different clients
US9697828B1 (en) 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
US10152987B2 (en) 2014-06-23 2018-12-11 Google Llc Remote invocation of mobile device actions
US9632748B2 (en) 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9335819B1 (en) 2014-06-26 2016-05-10 Audible, Inc. Automatic creation of sleep bookmarks in content items
US9368105B1 (en) * 2014-06-26 2016-06-14 Amazon Technologies, Inc. Preventing false wake word detections with a voice-controlled device
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US9691379B1 (en) 2014-06-26 2017-06-27 Amazon Technologies, Inc. Selecting from multiple content sources
US9398392B2 (en) 2014-06-30 2016-07-19 Microsoft Technology Licensing, Llc Audio calibration and adjustment
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9420331B2 (en) 2014-07-07 2016-08-16 Google Inc. Method and system for categorizing detected motion events
US11330100B2 (en) 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
US9374634B2 (en) 2014-07-10 2016-06-21 Nxp B.V. System for controlling displacement of a loudspeaker
US9467737B2 (en) 2014-07-14 2016-10-11 Sonos, Inc. Zone group control
JP2016024212A (ja) 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9671997B2 (en) 2014-07-23 2017-06-06 Sonos, Inc. Zone grouping
US10209947B2 (en) 2014-07-23 2019-02-19 Sonos, Inc. Device grouping
US9263042B1 (en) 2014-07-25 2016-02-16 Google Inc. Providing pre-computed hotword models
KR20160017253A (ko) 2014-08-01 2016-02-16 삼성전자주식회사 디스플레이 구동용 집적 회로 칩
US9874997B2 (en) 2014-08-08 2018-01-23 Sonos, Inc. Social playback queues
US9548066B2 (en) 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
US9769552B2 (en) 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
US20160055847A1 (en) 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
JP6118838B2 (ja) 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
KR20160026317A (ko) 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
US9560050B2 (en) 2014-09-08 2017-01-31 At&T Intellectual Property I, L.P System and method to share a resource or a capability of a device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9354687B2 (en) 2014-09-11 2016-05-31 Nuance Communications, Inc. Methods and apparatus for unsupervised wakeup with time-correlated acoustic events
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9747011B2 (en) 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US9548053B1 (en) * 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
US10645130B2 (en) 2014-09-24 2020-05-05 Sonos, Inc. Playback updates
US9681228B2 (en) 2014-09-30 2017-06-13 Apple Inc. Capacitive position sensing for transducers
JP6624368B2 (ja) 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
GB2525051B (en) 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
US9641919B1 (en) 2014-09-30 2017-05-02 Amazon Technologies, Inc. Audio assemblies for electronic devices
US10235996B2 (en) 2014-10-01 2019-03-19 XBrain, Inc. Voice and connection platform
US10817672B2 (en) 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
KR102287943B1 (ko) 2014-10-14 2021-08-09 삼성전자주식회사 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법
EP3010251B1 (en) 2014-10-15 2019-11-13 Nxp B.V. Audio system
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary
US9788047B2 (en) 2014-10-30 2017-10-10 Verizon Patent And Licensing Inc. Media guide user interface systems and methods
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10368121B2 (en) 2014-11-07 2019-07-30 Roku, Inc. System and method for collecting data
US9699550B2 (en) 2014-11-12 2017-07-04 Qualcomm Incorporated Reduced microphone power-up latency
US20160134982A1 (en) 2014-11-12 2016-05-12 Harman International Industries, Inc. System and method for estimating the displacement of a speaker cone
JP2016095383A (ja) 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US10116748B2 (en) 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10192549B2 (en) 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
WO2016082046A1 (en) 2014-11-28 2016-06-02 Audera Acoustics Inc. High displacement acoustic transducer systems
US10126406B2 (en) 2014-12-02 2018-11-13 Qualcomm Incorporated Method and apparatus for performing ultrasonic presence detection
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
CN107209549B (zh) 2014-12-11 2020-04-17 微软技术许可有限责任公司 能够实现可动作的消息传送的虚拟助理系统
CN104538030A (zh) 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US9779725B2 (en) 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method
US9813812B2 (en) 2014-12-12 2017-11-07 Analog Devices Global Method of controlling diaphragm excursion of electrodynamic loudspeakers
US9552816B2 (en) 2014-12-19 2017-01-24 Amazon Technologies, Inc. Application focus in speech-based systems
CN104575504A (zh) 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
US9560441B1 (en) 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
CN104635539A (zh) 2014-12-26 2015-05-20 东莞市掌商信息科技有限公司 一种智能硬件远程语音安全控制方法及其系统
US10045140B2 (en) * 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US9934406B2 (en) 2015-01-08 2018-04-03 Microsoft Technology Licensing, Llc Protecting private information in input understanding system
US9584915B2 (en) 2015-01-19 2017-02-28 Microsoft Technology Licensing, Llc Spatial audio with remote speakers
US20160210110A1 (en) 2015-01-21 2016-07-21 Ford Global Technologies, Llc Audio synchronization between vehicles and mobile devices
US9947313B2 (en) 2015-01-26 2018-04-17 William Drewes Method for substantial ongoing cumulative voice recognition error reduction
KR102351366B1 (ko) 2015-01-26 2022-01-14 삼성전자주식회사 음성 인식 방법 및 장치
CN104572009B (zh) * 2015-01-28 2018-01-09 合肥联宝信息技术有限公司 一种自适应外界环境的音频控制方法及装置
US9633661B1 (en) * 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
GB201501791D0 (en) 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
US20160232451A1 (en) 2015-02-09 2016-08-11 Velocee Ltd. Systems and methods for managing audio content
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US20160239255A1 (en) 2015-02-16 2016-08-18 Harman International Industries, Inc. Mobile interface for loudspeaker optimization
US20160253050A1 (en) 2015-02-26 2016-09-01 Fingertips Lab, Inc. System and method for audio and tactile based browsing
EP3264258A4 (en) 2015-02-27 2018-08-15 Sony Corporation Information processing device, information processing method, and program
US9721566B2 (en) * 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9697826B2 (en) 2015-03-27 2017-07-04 Google Inc. Processing multi-channel audio waveforms
US10762894B2 (en) 2015-03-27 2020-09-01 Google Llc Convolutional neural networks
US10192546B1 (en) 2015-03-30 2019-01-29 Amazon Technologies, Inc. Pre-wakeword speech processing
US10034109B2 (en) 2015-04-09 2018-07-24 Audera Acoustics Inc. Acoustic transducer systems with position sensing
US9678707B2 (en) 2015-04-10 2017-06-13 Sonos, Inc. Identification of audio content facilitated by playback device
US10198242B2 (en) 2015-04-14 2019-02-05 Motorola Solutions, Inc. Method and apparatus for a volume of a device
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US10178474B2 (en) 2015-04-21 2019-01-08 Google Llc Sound signature database for initialization of noise reduction in recordings
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN104853405B (zh) 2015-05-12 2018-11-30 浙江生辉照明有限公司 智能联网方法及智能设备
KR102623039B1 (ko) 2015-05-15 2024-01-08 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기 및 조명 장치
EP3096277A1 (en) 2015-05-19 2016-11-23 ResearchGate GmbH Enhanced online user-interaction tracking
WO2016185321A1 (en) 2015-05-21 2016-11-24 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, display device, electronic device, and lighting device
US10070237B2 (en) 2015-05-21 2018-09-04 Analog Devices, Inc. Optical and capacitive sensing of electroacoustic transducers
TWI837587B (zh) 2015-05-21 2024-04-01 日商半導體能源研究所股份有限公司 發光元件、顯示裝置、電子裝置、及照明裝置
JP2016218852A (ja) 2015-05-22 2016-12-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US9837547B2 (en) 2015-05-22 2017-12-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising oxide conductor and display device including the semiconductor device
EP3099047A1 (en) 2015-05-28 2016-11-30 Nxp B.V. Echo controller
US9584935B2 (en) 2015-05-29 2017-02-28 Sound United, Llc. Multi-zone media system and method for providing multi-zone media
US10657949B2 (en) 2015-05-29 2020-05-19 Sound United, LLC System and method for integrating a home media system and other home systems
US9734822B1 (en) 2015-06-01 2017-08-15 Amazon Technologies, Inc. Feedback based beamformed signal selection
US9864571B2 (en) 2015-06-04 2018-01-09 Sonos, Inc. Dynamic bonding of playback devices
US9672821B2 (en) 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
US10249205B2 (en) 2015-06-08 2019-04-02 Novel Effect, Inc. System and method for integrating special effects with a text source
KR102444075B1 (ko) 2015-06-09 2022-09-16 삼성전자주식회사 전자 장치, 주변 기기 및 그 제어 방법
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
US20160373909A1 (en) * 2015-06-17 2016-12-22 Hive Life, LLC Wireless audio, security communication and home automation
DE112016002728B4 (de) 2015-06-17 2024-09-12 Semiconductor Energy Laboratory Co., Ltd. Licht emittierendes Element, Anzeigevorrichtung, elektronisches Gerät und Beleuchtungsvorrichtung
JP6739907B2 (ja) 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
US10025447B1 (en) 2015-06-19 2018-07-17 Amazon Technologies, Inc. Multi-device user interface
KR102317526B1 (ko) 2015-06-25 2021-10-26 엘지전자 주식회사 헤드셋 및 그 제어 방법
US9554210B1 (en) 2015-06-25 2017-01-24 Amazon Technologies, Inc. Multichannel acoustic echo cancellation with unique individual channel estimations
KR20170001173A (ko) 2015-06-25 2017-01-04 엘지전자 주식회사 와치 타입 이동 단말기 및 그의 동작 방법
US9472203B1 (en) 2015-06-29 2016-10-18 Amazon Technologies, Inc. Clock synchronization for multichannel system
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3317879B1 (de) 2015-06-30 2020-02-19 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum zuordnen von geräuschen und zum analysieren
CN113889586A (zh) 2015-07-08 2022-01-04 株式会社半导体能源研究所 发光元件、显示装置、电子设备以及照明装置
US10304440B1 (en) 2015-07-10 2019-05-28 Amazon Technologies, Inc. Keyword spotting using multi-task configuration
KR102655709B1 (ko) 2015-07-21 2024-04-05 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9686625B2 (en) 2015-07-21 2017-06-20 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
US9769563B2 (en) 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
KR102616411B1 (ko) 2015-07-23 2023-12-26 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
WO2017015759A1 (en) 2015-07-30 2017-02-02 Amp Me Inc. Synchronized playback of streamed audio content by multiple internet-capable portable devices
US10529318B2 (en) 2015-07-31 2020-01-07 International Business Machines Corporation Implementing a classification model for recognition processing
US9691361B2 (en) 2015-08-03 2017-06-27 International Business Machines Corporation Adjusting presentation of content on a display
KR102402512B1 (ko) 2015-08-04 2022-05-27 삼성전자주식회사 외부장치의 음량을 조정하는 전자장치 및 방법
CN105187907A (zh) 2015-08-05 2015-12-23 四川长虹电器股份有限公司 智能电视音量控制系统及控制方法
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10333904B2 (en) 2015-08-08 2019-06-25 Peter J. Tormey Voice access and control
KR102386854B1 (ko) 2015-08-20 2022-04-13 삼성전자주식회사 통합 모델 기반의 음성 인식 장치 및 방법
US10270041B2 (en) 2015-08-28 2019-04-23 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US20180249267A1 (en) 2015-08-31 2018-08-30 Apple Inc. Passive microphone array localizer
US10031719B2 (en) 2015-09-02 2018-07-24 Harman International Industries, Incorporated Audio system with multi-screen application
US10339917B2 (en) 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
US10026399B2 (en) * 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
KR20170031392A (ko) 2015-09-11 2017-03-21 삼성전자주식회사 전자 장치, 음향 시스템 및 오디오 출력 방법
CN105206281B (zh) 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
KR20170032096A (ko) 2015-09-14 2017-03-22 삼성전자주식회사 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
US10289734B2 (en) 2015-09-18 2019-05-14 Samsung Electronics Co., Ltd. Entity-type search system
US10706873B2 (en) 2015-09-18 2020-07-07 Sri International Real-time speaker state analytics platform
CN105204357B (zh) 2015-09-18 2018-02-06 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
KR102446392B1 (ko) 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
US10186276B2 (en) 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
CN105162886B (zh) 2015-09-25 2019-04-12 北京奇艺世纪科技有限公司 一种声音控制方法及装置
WO2017058654A1 (en) 2015-09-28 2017-04-06 Google Inc. Time-synchronized, multizone media streaming
US9996316B2 (en) 2015-09-28 2018-06-12 Amazon Technologies, Inc. Mediation of wakeword response for multiple devices
JP6536320B2 (ja) 2015-09-28 2019-07-03 富士通株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US10241754B1 (en) 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
TW201721922A (zh) 2015-09-30 2017-06-16 半導體能源研究所股份有限公司 發光元件,顯示裝置,電子裝置,及照明裝置
KR20170038681A (ko) 2015-09-30 2017-04-07 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
KR102429260B1 (ko) 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
US9754580B2 (en) 2015-10-12 2017-09-05 Technologies For Voice Interface System and method for extracting and using prosody features
EP3311590B1 (en) 2015-10-15 2019-08-14 Huawei Technologies Co., Ltd. A sound processing node of an arrangement of sound processing nodes
US9747926B2 (en) * 2015-10-16 2017-08-29 Google Inc. Hotword recognition
JP6463710B2 (ja) 2015-10-16 2019-02-06 グーグル エルエルシー ホットワード認識
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
US10453450B2 (en) 2015-10-20 2019-10-22 Bragi GmbH Wearable earpiece voice command control system and method
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105427861B (zh) 2015-11-03 2019-02-15 胡旻波 智能家居协同麦克风语音控制的系统及其控制方法
US9691378B1 (en) 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10863267B2 (en) 2015-11-10 2020-12-08 Savant Systems, Inc. Volume control for audio/video devices
US9990209B2 (en) 2015-11-12 2018-06-05 Microsoft Technology Licensing, Llc Digital assistance device for facilitating multi-stage setup
US10706852B2 (en) 2015-11-13 2020-07-07 Microsoft Technology Licensing, Llc Confidence features for automated speech recognition arbitration
US10592949B2 (en) 2015-11-13 2020-03-17 [24]7.ai, Inc. Method and apparatus for linking customer interactions with customer messaging platforms
US20170140750A1 (en) 2015-11-17 2017-05-18 Le Holdings (Beijing) Co., Ltd. Method and device for speech recognition
CN105472191B (zh) 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
US11929088B2 (en) 2015-11-20 2024-03-12 Synaptics Incorporated Input/output mode control for audio processing
WO2017090115A1 (ja) 2015-11-25 2017-06-01 三菱電機株式会社 音声対話装置および音声対話方法
US10040423B2 (en) 2015-11-27 2018-08-07 Bragi GmbH Vehicle with wearable for identifying one or more vehicle occupants
US9484030B1 (en) 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9699597B2 (en) 2015-12-07 2017-07-04 Google Inc. Wireless signal forwarding
US9747920B2 (en) 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
US10311862B2 (en) 2015-12-23 2019-06-04 Rovi Guides, Inc. Systems and methods for conversations with devices about media using interruptions and changes of subjects
CN105632486B (zh) * 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105679318A (zh) 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
US10134388B1 (en) 2015-12-23 2018-11-20 Amazon Technologies, Inc. Word generation for speech recognition
US9826599B2 (en) 2015-12-28 2017-11-21 Amazon Technologies, Inc. Voice-controlled light switches
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US10547942B2 (en) 2015-12-28 2020-01-28 Samsung Electronics Co., Ltd. Control of electrodynamic speaker driver using a low-order non-linear model
US9992642B1 (en) 2015-12-29 2018-06-05 Amazon Technologies, Inc. Automated messaging
US9820036B1 (en) 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9813810B1 (en) 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
KR20170086814A (ko) 2016-01-19 2017-07-27 삼성전자주식회사 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR102392113B1 (ko) 2016-01-20 2022-04-29 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령 처리 방법
CN105741838B (zh) 2016-01-20 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
US9997151B1 (en) 2016-01-20 2018-06-12 Amazon Technologies, Inc. Multichannel acoustic echo cancellation for wireless applications
US9749731B2 (en) 2016-01-21 2017-08-29 Bose Corporation Sidetone generation using multiple microphones
KR20170091913A (ko) 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치
US9659555B1 (en) 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
EP3414759B1 (en) 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US9898250B1 (en) 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US9858927B2 (en) 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
WO2017147936A1 (zh) 2016-03-04 2017-09-08 茹旷 智能家居助手
US10133612B2 (en) 2016-03-17 2018-11-20 Nuance Communications, Inc. Session processing interaction between two or more virtual assistants
US9769420B1 (en) 2016-03-18 2017-09-19 Thomas Lawrence Moses Portable wireless remote monitoring and control systems
US10373612B2 (en) 2016-03-21 2019-08-06 Amazon Technologies, Inc. Anchored speech detection and speech recognition
US9805714B2 (en) 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
US10365887B1 (en) 2016-03-25 2019-07-30 Amazon Technologies, Inc. Generating commands based on location and wakeword
US10332508B1 (en) 2016-03-31 2019-06-25 Amazon Technologies, Inc. Confidence checking for speech processing and query answering
US9952827B2 (en) 2016-04-13 2018-04-24 Comcast Cable Communications, Llc Dynamic adjustment of equalization settings of audio components via a sound device profile
CN109074292B (zh) 2016-04-18 2021-12-14 谷歌有限责任公司 适当的代理的自动化助理调用
US10318236B1 (en) 2016-05-05 2019-06-11 Amazon Technologies, Inc. Refining media playback
US20170329397A1 (en) 2016-05-12 2017-11-16 Rovi Guides, Inc. Systems and methods for navigating a media guidance application using gaze control
US10447748B2 (en) 2016-05-12 2019-10-15 Apple Inc. Sharing media information between applications on client devices
US20170330564A1 (en) 2016-05-13 2017-11-16 Bose Corporation Processing Simultaneous Speech from Distributed Microphones
US10149049B2 (en) 2016-05-13 2018-12-04 Bose Corporation Processing speech from distributed microphones
US10187440B2 (en) 2016-05-27 2019-01-22 Apple Inc. Personalization of media streams
US10063965B2 (en) 2016-06-01 2018-08-28 Google Llc Sound source estimation using neural networks
US10474419B2 (en) 2016-06-03 2019-11-12 Crestron Electronics, Inc. Audio digital signal processor utilizing a hybrid network architecture
AU2017100581B4 (en) 2016-06-08 2018-02-01 Apple Inc. Intelligent automated assistant for media exploration
US10235124B2 (en) 2016-06-08 2019-03-19 Google Llc Audio announcement prioritization system
US9754605B1 (en) 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
AU2017100486C4 (en) 2016-06-11 2019-09-05 Apple Inc. Intelligent device arbitration and control
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179034B1 (en) 2016-06-12 2017-09-04 Apple Inc Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs
ES2806204T3 (es) 2016-06-15 2021-02-16 Cerence Operating Co Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados
US10212029B2 (en) 2016-06-15 2019-02-19 Microsoft Technology Licensing, Llc Service provisioning in cloud computing systems
US20170364371A1 (en) 2016-06-15 2017-12-21 Microsoft Technology Licensing, Llc Context-Dependent Digital Action-Assistance Tool
KR20170142001A (ko) 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9875740B1 (en) 2016-06-20 2018-01-23 A9.Com, Inc. Using voice information to influence importance of search result categories
US9749738B1 (en) 2016-06-20 2017-08-29 Gopro, Inc. Synthesizing audio corresponding to a virtual microphone location
ITUA20164622A1 (it) 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10091545B1 (en) 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US9728188B1 (en) 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
KR102471499B1 (ko) 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
EP3270377B1 (en) 2016-07-12 2020-02-19 Dolby Laboratories Licensing Corporation Assessment and adjustment of audio installation
US20180018965A1 (en) 2016-07-12 2018-01-18 Bose Corporation Combining Gesture and Voice User Interfaces
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US9979680B2 (en) 2016-07-21 2018-05-22 Fujitsu Limited Smart notification scheduling and modality selection
US10621992B2 (en) 2016-07-22 2020-04-14 Lenovo (Singapore) Pte. Ltd. Activating voice assistant based on at least one of user proximity and context
CN106028223A (zh) 2016-07-26 2016-10-12 广东欧珀移动通信有限公司 一种智能音箱的控制方法、装置及智能音箱
KR102575634B1 (ko) 2016-07-26 2023-09-06 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
US10431211B2 (en) 2016-07-29 2019-10-01 Qualcomm Incorporated Directional processing of far-field audio
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
US9967382B2 (en) 2016-08-19 2018-05-08 Amazon Technologies, Inc. Enabling voice control of telephone device
CN107767863B (zh) 2016-08-22 2021-05-04 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
WO2018039045A1 (en) 2016-08-24 2018-03-01 Knowles Electronics, Llc Methods and systems for keyword detection using keyword repetitions
US10360910B2 (en) 2016-08-29 2019-07-23 Garmin Switzerland Gmbh Automatic speech recognition (ASR) utilizing GPS and sensor data
US10461953B2 (en) 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US10057698B2 (en) 2016-09-02 2018-08-21 Bose Corporation Multiple room communication system and method
CA3036067C (en) 2016-09-06 2023-08-01 Deepmind Technologies Limited Generating audio using neural networks
EP3297298B1 (en) 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9972318B1 (en) 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
JP6520878B2 (ja) 2016-09-21 2019-05-29 トヨタ自動車株式会社 音声取得システムおよび音声取得方法
US10409548B2 (en) 2016-09-27 2019-09-10 Grabango Co. System and method for differentially locating and modifying audio sources
JP2018055259A (ja) 2016-09-27 2018-04-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US9959861B2 (en) 2016-09-30 2018-05-01 Robert Bosch Gmbh System and method for speech recognition
JP6683893B2 (ja) 2016-10-03 2020-04-22 グーグル エルエルシー デバイストポロジーに基づく音声コマンドの処理
CN109844855B (zh) 2016-10-03 2023-12-05 谷歌有限责任公司 任务的多重计算代理执行
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
CN107919116B (zh) 2016-10-11 2019-09-13 芋头科技(杭州)有限公司 一种语音激活检测方法及装置
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180122372A1 (en) 2016-10-31 2018-05-03 Soundhound, Inc. Distinguishable open sounds
US10783883B2 (en) 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device
KR102241970B1 (ko) * 2016-11-07 2021-04-20 구글 엘엘씨 기록된 미디어 핫워드 트리거 억제
US10154496B2 (en) 2016-11-10 2018-12-11 Futurewei Technologies, Inc. System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems
US10382806B2 (en) 2016-11-14 2019-08-13 DISH Technologies L.L.C. Apparatus, systems and methods for controlling presentation of content using a multi-media table
US10170110B2 (en) 2016-11-17 2019-01-01 Robert Bosch Gmbh System and method for ranking of hybrid speech recognition results with neural networks
CN106708403A (zh) 2016-11-30 2017-05-24 努比亚技术有限公司 输入滑动操作时同步播放提示音的方法及装置
US10079015B1 (en) * 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10186265B1 (en) 2016-12-06 2019-01-22 Amazon Technologies, Inc. Multi-layer keyword detection to avoid detection of keywords in output audio
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10255032B2 (en) 2016-12-13 2019-04-09 EVA Automation, Inc. Wireless coordination of audio sources
US11184764B2 (en) 2016-12-14 2021-11-23 Amzetta Technologies, Llc Methods and systems of establishing communication between devices
CN106531165A (zh) 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
US10339957B1 (en) 2016-12-20 2019-07-02 Amazon Technologies, Inc. Ending communications session based on presence data
US10068573B1 (en) 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
DE112017006486T5 (de) 2016-12-23 2019-09-12 Synaptics Incorporated Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen
CN106910500B (zh) * 2016-12-23 2020-04-17 北京小鸟听听科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
US10580405B1 (en) 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10276161B2 (en) 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10593328B1 (en) 2016-12-27 2020-03-17 Amazon Technologies, Inc. Voice control of remote device
US10186266B1 (en) 2016-12-28 2019-01-22 Amazon Technologies, Inc. Message playback using a shared device
US10831366B2 (en) 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US10229680B1 (en) 2016-12-29 2019-03-12 Amazon Technologies, Inc. Contextual entity resolution
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
KR102412202B1 (ko) 2017-01-03 2022-06-27 삼성전자주식회사 냉장고 및 이의 정보 표시 방법
US10248613B2 (en) 2017-01-10 2019-04-02 Qualcomm Incorporated Data bus activation in an electronic device
US10672387B2 (en) 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US11164570B2 (en) 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
US10306254B2 (en) 2017-01-17 2019-05-28 Seiko Epson Corporation Encoding free view point data in movie data container
KR20180084392A (ko) 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
KR102556840B1 (ko) 2017-01-20 2023-07-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20180085931A (ko) 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
US20180218747A1 (en) 2017-01-28 2018-08-02 Bose Corporation Audio Device Filter Modification
KR102716757B1 (ko) 2017-02-03 2024-10-15 삼성전자주식회사 알림을 제공하는 방법 및 그 전자 장치
CN114067794A (zh) 2017-02-07 2022-02-18 路创技术有限责任公司 基于音频的负载控制系统
US10762891B2 (en) 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN108446281B (zh) 2017-02-13 2021-03-12 北京嘀嘀无限科技发展有限公司 确定用户亲密度的方法、装置及存储介质
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US20180293221A1 (en) 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
US10264358B2 (en) 2017-02-15 2019-04-16 Amazon Technologies, Inc. Selection of master device for synchronized audio
US10431217B2 (en) 2017-02-15 2019-10-01 Amazon Technologies, Inc. Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point
US10839795B2 (en) 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
CN106921560B (zh) 2017-02-28 2020-06-02 北京小米移动软件有限公司 语音通信方法、装置及系统
US20180262793A1 (en) 2017-03-09 2018-09-13 Google Inc. Reverse Casting from a First Screen Device to a Second Screen Device
US10706843B1 (en) 2017-03-09 2020-07-07 Amazon Technologies, Inc. Contact resolution for communications systems
US10089981B1 (en) 2017-03-09 2018-10-02 Amazon Technologies, Inc. Messaging account disambiguation
US10540961B2 (en) 2017-03-13 2020-01-21 Baidu Usa Llc Convolutional recurrent neural networks for small-footprint keyword spotting
US10074371B1 (en) 2017-03-14 2018-09-11 Amazon Technologies, Inc. Voice control of remote device by disabling wakeword detection
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10600406B1 (en) 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US10621980B2 (en) 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
WO2018173293A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107135443B (zh) 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10643609B1 (en) 2017-03-29 2020-05-05 Amazon Technologies, Inc. Selecting speech inputs
US10373630B2 (en) 2017-03-31 2019-08-06 Intel Corporation Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
US10825471B2 (en) 2017-04-05 2020-11-03 Avago Technologies International Sales Pte. Limited Voice energy detection
US11188808B2 (en) 2017-04-11 2021-11-30 Lenovo (Singapore) Pte. Ltd. Indicating a responding virtual assistant from a plurality of virtual assistants
US10748531B2 (en) 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
CN107122158A (zh) 2017-04-14 2017-09-01 北京小米移动软件有限公司 播放信息提示音频的方法及装置、电子设备
KR102068182B1 (ko) 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR102392297B1 (ko) 2017-04-24 2022-05-02 엘지전자 주식회사 전자기기
KR102298947B1 (ko) 2017-04-28 2021-09-08 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10311870B2 (en) 2017-05-10 2019-06-04 Ecobee Inc. Computerized device with voice command input capability
US10013995B1 (en) 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10628484B2 (en) 2017-05-17 2020-04-21 Board Of Trustees Of The University Of Illinois Vibrational devices as sound sensors
US10564928B2 (en) 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
US10403299B2 (en) 2017-06-02 2019-09-03 Apple Inc. Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US10531196B2 (en) 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
US10522146B1 (en) 2019-07-09 2019-12-31 Instreamatic, Inc. Systems and methods for recognizing and performing voice commands during advertisement
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10983753B2 (en) 2017-06-09 2021-04-20 International Business Machines Corporation Cognitive and interactive sensor based smart home solution
US10410635B2 (en) 2017-06-09 2019-09-10 Soundhound, Inc. Dual mode speech recognition
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US10028069B1 (en) 2017-06-22 2018-07-17 Sonos, Inc. Immersive audio in a media playback system
US10950228B1 (en) 2017-06-28 2021-03-16 Amazon Technologies, Inc. Interactive voice controlled entertainment
US11189273B2 (en) 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
WO2019005227A1 (en) 2017-06-30 2019-01-03 Google Llc METHODS, SYSTEMS AND MEDIA FOR VOICE CALL OPERATIONS
US10687353B2 (en) 2017-07-10 2020-06-16 Qualcomm Incorporated Management of conflicting scheduling commands in wireless networks
US20190013019A1 (en) 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US10310082B2 (en) 2017-07-27 2019-06-04 Quantenna Communications, Inc. Acoustic spatial diagnostics for smart home management
US11205421B2 (en) 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US11798544B2 (en) 2017-08-07 2023-10-24 Polycom, Llc Replying to a spoken command
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102389041B1 (ko) 2017-08-11 2022-04-21 엘지전자 주식회사 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US10304475B1 (en) 2017-08-14 2019-05-28 Amazon Technologies, Inc. Trigger word based beam selection
US20190066710A1 (en) 2017-08-28 2019-02-28 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US10553235B2 (en) 2017-08-28 2020-02-04 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US10546583B2 (en) 2017-08-30 2020-01-28 Amazon Technologies, Inc. Context-based device arbitration
US10911596B1 (en) 2017-08-31 2021-02-02 Amazon Technologies, Inc. Voice user interface for wired communications system
US10366699B1 (en) 2017-08-31 2019-07-30 Amazon Technologies, Inc. Multi-path calculations for device energy levels
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10482895B2 (en) 2017-09-01 2019-11-19 Cirrus Logic, Inc. Acoustic echo cancellation (AEC) rate adaptation
US10847149B1 (en) 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
JP6571144B2 (ja) 2017-09-08 2019-09-04 シャープ株式会社 監視システム、監視機器、サーバ、および監視方法
US20190082255A1 (en) 2017-09-08 2019-03-14 Olympus Corporation Information acquiring apparatus, information acquiring method, and computer readable recording medium
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10083006B1 (en) 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
KR102338376B1 (ko) 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US9973849B1 (en) 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10719507B2 (en) 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10580411B2 (en) 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
US10586534B1 (en) 2017-09-27 2020-03-10 Amazon Technologies, Inc. Voice-controlled device control using acoustic echo cancellation statistics
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11233782B2 (en) 2017-10-04 2022-01-25 Resilience Magnum IP, LLC Single node network connectivity for structure automation functionality
US10897680B2 (en) 2017-10-04 2021-01-19 Google Llc Orientation-based device interface
KR102421255B1 (ko) 2017-10-17 2022-07-18 삼성전자주식회사 음성 신호를 제어하기 위한 전자 장치 및 방법
KR102543693B1 (ko) 2017-10-17 2023-06-16 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10403266B2 (en) 2017-10-18 2019-09-03 Intel Corporation Detecting keywords in audio using a spiking neural network
CN107808670B (zh) 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
JP2019086903A (ja) 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
CN107832837B (zh) 2017-11-28 2021-09-28 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
US20190163153A1 (en) 2017-11-30 2019-05-30 International Business Machines Corporation Enforcing dynamic volume thresholds of an entertainment device
US10546593B2 (en) 2017-12-04 2020-01-28 Apple Inc. Deep learning driven multi-channel filtering for speech enhancement
US10445365B2 (en) 2017-12-04 2019-10-15 Amazon Technologies, Inc. Streaming radio with personalized content integration
US10777189B1 (en) 2017-12-05 2020-09-15 Amazon Technologies, Inc. Dynamic wakeword detection
US10510340B1 (en) 2017-12-05 2019-12-17 Amazon Technologies, Inc. Dynamic wakeword detection
US20190172452A1 (en) 2017-12-06 2019-06-06 GM Global Technology Operations LLC External information rendering
CN110678922A (zh) 2017-12-06 2020-01-10 谷歌有限责任公司 闪避和擦除来自附近设备的音频
CN107919123B (zh) 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
US11182122B2 (en) 2017-12-08 2021-11-23 Amazon Technologies, Inc. Voice control of computing devices
US20190179611A1 (en) 2017-12-11 2019-06-13 Sonos, Inc. Systems and Methods of Receiving Voice Input
US10051600B1 (en) 2017-12-12 2018-08-14 Amazon Technologies, Inc. Selective notification delivery based on user presence detections
US10847137B1 (en) 2017-12-12 2020-11-24 Amazon Technologies, Inc. Trigger word detection using neural network waveform processing
US10425247B2 (en) 2017-12-12 2019-09-24 Rovi Guides, Inc. Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset
US10374816B1 (en) 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US10540971B2 (en) 2017-12-15 2020-01-21 Blue Jeans Network, Inc. System and methods for in-meeting group assistance using a virtual assistant
US10663313B2 (en) 2017-12-15 2020-05-26 Google Llc Providing traffic warnings to a user based on return journey
US11409816B2 (en) 2017-12-19 2022-08-09 Motorola Solutions, Inc. Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information
US11295748B2 (en) 2017-12-26 2022-04-05 Robert Bosch Gmbh Speaker identification with ultra-short speech segments for far and near field voice assistance applications
US10504507B2 (en) 2017-12-28 2019-12-10 Syntiant Always-on keyword detector
US10614811B2 (en) 2017-12-29 2020-04-07 Intel Corporation Hierarchical speech recognition resolution
CN111357048B (zh) 2017-12-31 2024-10-08 美的集团股份有限公司 用于控制家庭助手装置的方法和系统
CN111512365B (zh) 2017-12-31 2023-06-13 美的集团股份有限公司 对多个家庭装置进行控制的方法和系统
US9972343B1 (en) 2018-01-08 2018-05-15 Republic Wireless, Inc. Multi-step validation of wakeup phrase processing
US10795332B2 (en) 2018-01-16 2020-10-06 Resilience Magnum IP, LLC Facilitating automating home control
CN108198548B (zh) 2018-01-25 2020-11-20 苏州奇梦者网络科技有限公司 一种语音唤醒方法及其系统
US20190237067A1 (en) 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10157042B1 (en) 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
US11024307B2 (en) 2018-02-08 2021-06-01 Computime Ltd. Method and apparatus to provide comprehensive smart assistant services
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
US10425780B1 (en) 2018-02-22 2019-09-24 Amazon Technologies, Inc. Outputting notifications using device groups
US10749828B2 (en) 2018-03-14 2020-08-18 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10491962B2 (en) 2018-03-14 2019-11-26 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10685669B1 (en) 2018-03-20 2020-06-16 Amazon Technologies, Inc. Device selection from audio data
US10440440B1 (en) 2018-03-23 2019-10-08 Rovi Guides, Inc. Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device
US10777203B1 (en) 2018-03-23 2020-09-15 Amazon Technologies, Inc. Speech interface device with caching component
US10446169B1 (en) 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
US10755706B2 (en) 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
US11151991B2 (en) 2018-03-30 2021-10-19 Verizon Media Inc. Electronic message transmission
US11217240B2 (en) 2018-04-05 2022-01-04 Synaptics Incorporated Context-aware control for smart devices
US20190311710A1 (en) 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US10720166B2 (en) 2018-04-09 2020-07-21 Synaptics Incorporated Voice biometrics systems and methods
US10679629B2 (en) 2018-04-09 2020-06-09 Amazon Technologies, Inc. Device arbitration by multiple speech processing systems
US10928917B2 (en) 2018-04-12 2021-02-23 International Business Machines Corporation Multiple user interaction with audio devices using speech and gestures
CN108520741B (zh) 2018-04-12 2021-05-04 科大讯飞股份有限公司 一种耳语音恢复方法、装置、设备及可读存储介质
US10679615B2 (en) 2018-04-16 2020-06-09 Google Llc Adaptive interface in a voice-based networked system
CN108538305A (zh) 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
EP3561806B1 (en) 2018-04-23 2020-04-22 Spotify AB Activation trigger processing
US10803864B2 (en) 2018-05-07 2020-10-13 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11308947B2 (en) 2018-05-07 2022-04-19 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
JP2019204025A (ja) 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10777195B2 (en) 2018-05-31 2020-09-15 International Business Machines Corporation Wake command nullification for digital assistance and voice recognition technologies
US20190371324A1 (en) 2018-06-01 2019-12-05 Apple Inc. Suppression of voice response by device rendering trigger audio
CN112272819B (zh) 2018-06-05 2024-04-26 三星电子株式会社 被动唤醒用户交互设备的方法和系统
US10433058B1 (en) 2018-06-14 2019-10-01 Sonos, Inc. Content rules engines for audio playback devices
US10762896B1 (en) 2018-06-25 2020-09-01 Amazon Technologies, Inc. Wakeword detection
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
NL2021308B1 (en) 2018-07-16 2020-01-24 Hazelebach & Van Der Ven Holding B V Methods for a voice processing system
JP7000268B2 (ja) 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
US11144596B2 (en) 2018-07-24 2021-10-12 Harman International Industries, Incorporated Retroactive information searching enabled by neural sensing
GB2576016B (en) 2018-08-01 2021-06-23 Arm Ip Ltd Voice assistant devices
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
KR102225984B1 (ko) 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US10622009B1 (en) 2018-09-10 2020-04-14 Amazon Technologies, Inc. Methods for detecting double-talk
US20200090647A1 (en) 2018-09-14 2020-03-19 Comcast Cable Communications, Llc Keyword Detection In The Presence Of Media Output
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10650807B2 (en) 2018-09-18 2020-05-12 Intel Corporation Method and system of neural network keyphrase detection
KR20200034430A (ko) 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
US10861444B2 (en) 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10950249B2 (en) 2018-09-25 2021-03-16 Amazon Technologies, Inc. Audio watermark encoding/decoding
US11170758B2 (en) 2018-09-27 2021-11-09 Rovi Guides, Inc. Systems and methods for providing notifications within a media asset without breaking immersion
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
KR102606789B1 (ko) 2018-10-01 2023-11-28 삼성전자주식회사 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치
US20200110571A1 (en) 2018-10-05 2020-04-09 Sonos, Inc. Systems and methods for media content selection
US10971158B1 (en) 2018-10-05 2021-04-06 Facebook, Inc. Designating assistants in multi-assistant environment based on identified wake word received from a user
US10346122B1 (en) 2018-10-18 2019-07-09 Brent Foster Morgan Systems and methods for a supplemental display screen
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US10943599B2 (en) 2018-10-26 2021-03-09 Spotify Ab Audio cancellation for voice recognition
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11198446B2 (en) 2019-01-04 2021-12-14 Faraday & Future Inc. On-board vehicle query system
JP2020112692A (ja) 2019-01-11 2020-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 方法、制御装置、及びプログラム
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
CN109712626B (zh) 2019-03-04 2021-04-30 腾讯科技(深圳)有限公司 一种语音数据处理方法及装置
US10943598B2 (en) 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US10964314B2 (en) 2019-03-22 2021-03-30 Cirrus Logic, Inc. System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array
US10984783B2 (en) 2019-03-27 2021-04-20 Intel Corporation Spoken keyword detection based utterance-level wake on intent system
US20200310751A1 (en) 2019-03-29 2020-10-01 Qualcomm Incorporated System and method of managing device sound level
EP3726856B1 (en) 2019-04-17 2022-11-16 Oticon A/s A hearing device comprising a keyword detector and an own voice detector
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US20200409926A1 (en) 2019-06-28 2020-12-31 Rovi Guides, Inc. Automated contact creation based on content communications
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
JP7191793B2 (ja) 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
US11172328B2 (en) 2019-09-27 2021-11-09 Sonos, Inc. Systems and methods for device localization
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11823659B2 (en) 2019-12-11 2023-11-21 Amazon Technologies, Inc. Speech recognition through disambiguation feedback
US11445301B2 (en) 2020-02-12 2022-09-13 Sonos, Inc. Portable playback devices with network operation modes
CN111341306B (zh) 2020-02-14 2022-06-17 东南大学 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法
US11206052B1 (en) 2020-06-18 2021-12-21 HAJEN Co., Ltd Smart speaker
US20220050585A1 (en) 2020-08-14 2022-02-17 Apple Inc. Audio media playback user interface

Also Published As

Publication number Publication date
EP3665562A1 (en) 2020-06-17
AU2023203687A1 (en) 2023-07-06
AU2018312989B2 (en) 2023-06-15
US11380322B2 (en) 2022-07-05
US20200075010A1 (en) 2020-03-05
WO2019032462A1 (en) 2019-02-14
US20240321271A1 (en) 2024-09-26
US10475449B2 (en) 2019-11-12
AU2018312989A1 (en) 2020-03-05
CA3140979C (en) 2024-02-27
CN111194439A (zh) 2020-05-22
KR102315053B1 (ko) 2021-10-20
US11900937B2 (en) 2024-02-13
CN111194439B (zh) 2023-07-07
CA3072492C (en) 2023-01-24
CA3140979A1 (en) 2019-02-14
EP4040285A1 (en) 2022-08-10
CN116954545A (zh) 2023-10-27
JP2020530585A (ja) 2020-10-22
CA3072492A1 (en) 2019-02-14
US20190043492A1 (en) 2019-02-07
US20230021785A1 (en) 2023-01-26
EP3665562B1 (en) 2022-06-15
KR20200035118A (ko) 2020-04-01

Similar Documents

Publication Publication Date Title
JP6963673B2 (ja) ウェイクワード検出の抑制
JP7108084B2 (ja) アービトレーションに基づく音声認識
US11664023B2 (en) Voice detection by multiple devices
US11184969B2 (en) Contextualization of voice inputs
JP6942763B2 (ja) 複数の音声サービス
US10860284B2 (en) Playback expansion
AU2023203687B2 (en) Wake-word detection suppression

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200403

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211015

R150 Certificate of patent or registration of utility model

Ref document number: 6963673

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250