JP2022514894A - ネットワークマイクロフォンデバイスのノイズ分類による最適化 - Google Patents

ネットワークマイクロフォンデバイスのノイズ分類による最適化 Download PDF

Info

Publication number
JP2022514894A
JP2022514894A JP2021535871A JP2021535871A JP2022514894A JP 2022514894 A JP2022514894 A JP 2022514894A JP 2021535871 A JP2021535871 A JP 2021535871A JP 2021535871 A JP2021535871 A JP 2021535871A JP 2022514894 A JP2022514894 A JP 2022514894A
Authority
JP
Japan
Prior art keywords
nmd
noise
metadata
sound
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021535871A
Other languages
English (en)
Other versions
JP7271674B2 (ja
Inventor
トーマス ソト,カート
Original Assignee
ソノズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソノズ インコーポレイテッド filed Critical ソノズ インコーポレイテッド
Publication of JP2022514894A publication Critical patent/JP2022514894A/ja
Application granted granted Critical
Publication of JP7271674B2 publication Critical patent/JP7271674B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/001Adaptation of signal processing in PA systems in dependence of presence of noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/005Audio distribution systems for home, i.e. multi-room use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Abstract

ノイズ分類を利用してネットワークマイクロフォンデバイスを最適化するためのシステムおよび方法が開示されている。一例では、ネットワークマイクロフォンデバイス(NMD)に含まれる複数のマイクロフォンのそれぞれがサウンドを検出する。サウンドデータを分析して、ウェイクワードなどのトリガーイベントを検出する。サウンドデータに関連付けられたメタデータは、NMDのルックバックバッファにキャプチャされる。トリガーイベントを検出した後、メタデータを分析してサウンドデータのノイズを分類する。分類されたノイズに基づいて、NMDの少なくとも1つのパフォーマンスパラメータが変更される。

Description

本出願は、2018年12月20日に出願された米国特許出願第16/227,308号の優先権を主張するものであり、この出願はその全体が参照により本明細書に組み込まれる。
本技術は、コンシューマ製品に関するものであり、より詳細には、音声制御が可能なメディア再生システムまたはそれに関連する内容の方法、システム、製品、特徴、サービス、およびその他の要素に関するものである。
2003年にSONOS社が「Method for Synchronizing Audio Playback between Multiple Networked Devices(複数のネットワークデバイス間でオーディオ再生を同期させる方法)」と題した最初の特許出願をし、2005年にメディア再生システムの販売を開始するまでは、デジタルオーディオをアウトラウドな環境でアクセスして聴くための選択肢は限られていた。SONOS Wireless HiFi Systemは、ネットワークに接続された1台または複数の再生機器を介して、さまざまなソースの音楽を体験することができる。スマートフォンやタブレット、パソコンにインストールされたソフトウェア制御アプリケーションを介して、ネットワーク接続された再生機器がある部屋であれば、好きな曲を再生することができる。さらに、コントローラを使って、例えば、再生機がある部屋ごとに異なる曲を流したり、複数の部屋をグループ化して同期再生したり、すべての部屋で同じ曲を同期して聴かせたりすることができる。
デジタルメディアへの関心がますます高まっている中で、リスニング体験をさらに向上させるために、消費者がアクセス可能な技術を開発する必要がある。
ここに開示されている技術の特徴、側面、および利点は、以下の説明、添付の特許請求の範囲、および添付の図面を参照することで、よりよく理解することができる。
開示された技術の態様に従って構成されたメディア再生システムを有する環境の部分切断図 図1Aのメディア再生システムと1つ以上のネットワークの概略図 再生装置の一例の機能ブロック図 図2Aの再生装置の筐体の一例を示す斜視図 種々の形態による再生装置の構成例を示す図 種々の形態による再生装置の構成例を示す図 種々の形態による再生装置の構成例を示す図 種々の形態による再生装置の構成例を示す図 種々の形態による再生装置の構成例を示す図 一形態による例示的なコントローラデバイスの機能ブロック図 一形態による例示的なコントローラインタフェースの図 一形態による例示的なコントローラインタフェースの図 一形態による例示的なネットワークマイクロフォンデバイスに含まれる特定の構成要素の機能ブロック図 音声入力の一例を示す波形図 一形態による例示的な音響標本を示すグラフ 主成分分析によって定義された座標空間において、特定のノイズを分離したグラフ 一形態に基づき、ネットワークマイクロフォンデバイスを介してノイズを分類するための例示的な方法の図 一形態によるコントローラインタフェースの図 一形態によるコントローラインタフェースの図 一形態による例示的なノイズ分類およびネットワークマイクロフォンデバイス適応の機能フロー図 種々の距離に対する、ファンノイズのスペクトルの例を示すグラフ マイクロフォンのスペクトルデータを主成分分析して得られた基底ベクトルのグラフの一例 ノイズデータを分類するための再構成されたスペクトルのグラフの一例 大人数のネットワークマイクロフォンデバイスから得られたスペクトル分布の一例を示すグラフ
図面は、例示的な実施形態を説明するためのものであるが、本発明は、図面に示された配置および器具に限定されないことを理解される。図面上、同一の参照番号は、少なくとも概ね類似した要素を示す。特定の要素の説明を容易にするため、参照番号の最上位桁は、その要素が最初に紹介された図の番号を示す。例えば、要素103aは、図1Aにおいて最初に紹介される。
I.概要
音声による制御は、ワイヤレスオーディオ再生装置、照明装置、ホームオートメーション装置(サーモスタット、ドアロック等)など、通信ネットワークに接続されたスマート家電や装置を含む「スマート」ホームにおいて有益である。いくつかの用途においては、スマートホームデバイスを制御するため、ネットワークマイクロフォンデバイスが用いられることができる。
ネットワークマイクロフォンデバイス(「NMD」)は、典型的には、NMDの環境に存在する音を検出するように構成されたマイクロフォンアレイなどのマイクロフォンの配列を含むネットワーク化されたコンピューティングデバイスである。検出された音には、人の話し声と背景音(再生機から出力される音楽やその他の環境音)が混ざっている場合がある。実際には、NMDは検出された音をフィルタリングして人の音声から背景雑音を取り除き、音声制御を示す音声入力が含まれているかどうかを識別しやすくする。そうであれば、NMDはそのような音声入力に基づいて行動を起こしてもよい。
NMDは、通常、NMDに搭載されているウェイクワードエンジンを採用し、NMDによって検出された音が、特定のウェイクワードを含む音声入力を含んでいるかどうかを識別する。ウェイクワードエンジンは、1つまたは複数の識別アルゴリズムを使用して、特定のウェイクワードを識別(すなわち、「スポット(特定)」)するように構成されてもよい。このウェイクワードの識別プロセスは、一般的に "キーワードスポッティング "と呼ばれている。実際には、キーワードスポッティングを容易にするために、NMDは、NMDのマイクによって検出された音をバッファリングし、ウェイクワードエンジンを使用して、バッファリングされた音を処理して、ウェイクワードが存在するかどうかを判断する。
ウェイクワードエンジンが、検出された音の中にウェイクワードをスポットすると、NMDは、ウェイクワードイベント(すなわち、「ウェイクワードトリガー」)が発生したと判断してもよく、これは、NMDが音声入力を含む音を検出した可能性があることを示す。ウェイクワードイベントが発生すると、NMDは検出された音に関連する追加の処理を実行する。いくつかの実施形態では、追加プロセスとして、ウェイクワードが識別されたことを示すアラート(例えば、可聴チャイムおよび/またはライトインジケータ)を出力することや、バッファから検出されたサウンドデータを抽出することなどを含めることができる。検出された音を抽出する工程には、特定のフォーマットに従って検出された音のストリームを読み出してパッケージ化することや、パッケージ化されたサウンドデータを解釈のために適切なVASに送信することが含まれる。
続いて、ウェイクワードエンジンで特定されたウェイクワードに対応するVASは、通信ネットワークを介してNMDから送信されたサウンドデータを受信する。VASは一般的に、音声入力を処理するように構成された1つまたは複数のクラウドサーバーを使用して実行されるリモートサービスの形態をとる(例:AMAZON(登録商標)のALEXA(登録商標)、APPLE(登録商標)のSIRI(登録商標)、MICROSOFT(登録商標)のCORTANA(登録商標)、GOOGLE(登録商標)のASSISTANT(登録商標)など)。いくつかの例では、VASの特定のコンポーネントや機能が、ローカルおよびリモートのデバイスに分散されている場合がある。さらに、VASは、NMDまたはNMDを構成するメディア再生システムに実装されたローカルサービスの形態をとり、音声入力または特定の種類の音声入力(例えば、初歩的なコマンド)がリモートVASの介入なしにローカルで処理されるようにしてもよい。
いずれにせよ、VASが検出したサウンドデータを受信すると、VASは通常、このデータを処理し、音声入力を識別し、音声入力に含まれる単語の意図を決定することができる。その後、VASは、決定された意図に応じた何らかの指示をNMDに返す応答を提供してもよい。その指示に基づいて、NMDは1つまたは複数のスマートデバイスにアクションを実行させてもよい。例えば、VASからの指示に従って、NMDは再生装置に特定の曲を再生させたり、イルミネーション装置を点灯/消灯させたりすることができる。場合によっては、NMD、またはNMDを備えたメディアシステム(例えば、NMDを搭載した再生装置を備えたメディア再生システム)が、複数のVASと相互作用するように構成されていてもよい。実際には、NMDは、NMDが検出した音の中で特定された特定のウェイクワードに基づいて、一つのVASを多数のVASの中から選択することができる。
ある実施形態では、ネットワークメディア再生システムの一部となるように構成された再生装置は、NMDのコンポーネントおよび機能を含むことができる(すなわち、再生装置は「NMD装備」である)。この点において、このような再生装置は、人の話声、再生装置自身または近くにある別の再生装置が出力している音声、またはその他の周囲の雑音など、再生装置の環境に存在する音を検出するように構成されたマイクロフォンを含み、また、ウェイクワード識別を容易にするため、検出された音をバッファリングするコンポーネントを含んでもよい。
NMDを搭載した再生機は、再生機を壁のコンセントなどに物理的に接続することなく動作させることができる内部電源(例えば、充電式バッテリー)を含んでも良い。なお、ここでは、このような再生装置を "ポータブル再生装置 "と呼ぶ。一方、壁のコンセントなどからの電力に依存するように構成された再生機器は、ここでは「据え置き型の再生装置」と呼ぶが、実際には家庭内などの環境で移動可能である。実際には、1台以上の据え置き型の再生機が置かれている自宅などの環境に、ポータブル再生機を持ち運ぶことが多い。
場合によっては、NMD、または複数のNMDで構成されるシステム(例えば、再生装置のメディア再生システム)に対して、複数の音声サービスが構成されている。1つまたは複数のサービスをセットアップ時に設定することもできるし、後から追加で音声サービスのシステムに設定することができる。この場合、NMDは複数の音声サービスとのインターフェースとして機能するため、それぞれの音声サービスと相互利用するために、それぞれの音声サービスのNMDを用意する必要性を軽減することができる。さらに、NMDは、家庭内に存在するサービス専用のNMDと連携して、与えられた音声コマンドを処理することができる。
NMDに2つ以上の音声サービスが設定されている場合、特定の音声サービスに対応するウェイクワードを発声することで、特定の音声サービスを呼び出すことができる。例えば、AMAZON(登録商標)を検索する場合、ユーザは "Alexa(アレクサ)"というウェイクワードを話し、その後に音声コマンドを発する。他の例として、GOOGLE(登録商標)への問い合わせには「Ok, Google(オーケーグーグル)」、APPLE(登録商標)への問い合わせには「Hey, Siri(ヘイ、シリ)」などがある。
いくつかのケースでは、NMDへの音声入力を示すために、汎用のウェイクワードを使用することができる。また、いくつかのケースでは、任意の特定の音声サービスに結び付けられたウェイクワードではなく、製造者固有のウェイクワードである(例えば、NMDがSONOS(登録商標)再生デバイスである場合、「Hey,Sonos(ヘイ、ソノス)」となる。)。このようなウェイクワードを用い、NMDはリクエストを処理する特定の音声サービスを識別することができる。例えば、ウェイクワードに続く音声入力が特定の種類のコマンド(例えば、音楽再生)に関するものであれば、その音声入力は、その種類のコマンドに関する特定の音声サービス(例えば、音声コマンド機能を有するストリーミング音楽サービス)に送信される。
NMDは、個々のマイクロフォンが複数集まったアレイを含むことができる。動作時、NMDは、個々のマイクロフォンのそれぞれからサウンドデータを受信し、それを処理して、ウェイクワードが検出されたかどうかを評価する。上述のようにして、ウェイクワードが検出された場合、NMDは後続のオーディオ入力をVASに送り、更なる処理がなされる。ノイズ(例えば、近くの家電製品、背景の会話、交通、工事などからの環境ノイズ)があれば、ネットワークマイクロフォンデバイスの機能が損なわれることがある。ノイズが存在すると、下流側の処理に悪影響を及ぼしたり、ウェイクワードの検出の誤判定率(誤りを正しいと判定したり、正しいものを誤りと判定する率)が上昇したり、VASの性能低下(音声コマンドを正確に解読できない、応答できないなど)につながる。
以下に詳細に説明するように、ここではノイズの存在下での音声入力処理を強化するように構成された様々な技術および装置が開示されている。例えば、いくつかの実施形態では、NMDの性能を向上させるために、NMDの1つまたは複数のパラメータを調整することができる。いくつかの実施形態では、例えば、ノイズをユーザの環境のノイズサンプルやより大きなサンプル集団からの既知のノイズサンプルと比較することにより、ノイズを分類することができる。例えば、ノイズについて識別されたクラスが存在する場合、ウェイクワード感度パラメータを調整することができる。代替的にまたは追加的に、下流側での処理を行う前に、識別された家電製品のノイズに対応する特定の周波数帯域を、検出されたサウンドデータから無視またはフィルタリングすることができる。また、特定の方向からのノイズ(例えば、固定された家電製品からのノイズ)を抑制するために、空間的な処理を調整することもできる。音声データに含まれるノイズの特性に応じてNMDの性能を変更することで、音声検出や下流側の処理を向上させることができる。
いくつかの実施形態では、NMDは、評価およびノイズ分類のために、サウンドメタデータ(例えば、スペクトルデータ、信号レベル、方向検出など)をリモートコンピューティングデバイスに提供する。ユーザのプライバシーを守るため、オリジナルのオーディオコンテンツ(録音された音声入力の内容やその他の検出されたサウンドデータなど)を明らかにしないサウンドメタデータのみに頼ることも可能とする。NMDは、検出されたサウンドデータから、サウンドメタデータにアクセスしなければ元のオーディオ信号を解読できないような方法で、サウンドメタデータを導き出すことができる。例えば、サウンドメタデータを、時間領域の情報ではなく、多くのサンプリングフレームで平均化された周波数領域の情報に限定して用いることで、NMDは、サウンドメタデータを利用して検出した元のサウンドデータを判読不能にすることができる。NMDは、サウンドメタデータを収集し、このメタデータをリモートにある評価装置である1つまたは複数のコンピューティングデバイスに送信し、評価および比較を行うことができる。そして、リモートの評価装置は、サウンドメタデータを評価して、サウンドメタデータの特徴を特定し、ノイズやNMDの性能低下の原因となる他の要因を見つけることができる。このようにして、いくつかの実施形態では、システムは、録音された音声コンテンツをリモートの評価装置に送信することにより、ユーザのプライバシーを侵害することなく、環境中のノイズを検出し、分類することができる。
ここに記載されているいくつかの実施形態は、「ユーザ」および/または他のエンティティなどの所定の登場人物によって実行される機能に言及している場合があるが、この記載は説明のみを目的としていることを理解すべきである。特許請求の範囲において、文言で明示的に示されない限り、そのような例示的な登場人物の行為に限定されない。
II.動作環境の例
図1Aおよび図1Bは、ここに開示された1つまたは複数の実施形態が実施され得るメディア再生システム100(または「MPS100」)の構成例を示す。まず、図1Aを参照すると、図示されているMPS100は、複数の部屋と空間を有する例示的な家庭環境に関連付けられており、これらは総称して「家庭環境」、「スマートホーム」、または「環境101」とも言う。環境101は、マスターバスルーム101a、マスターベッドルーム101b(ここでは「ニックの部屋」と呼ぶ)、セカンドベッドルーム101c、ファミリールームまたはデン101d、オフィス101e、リビングルーム101f、ダイニングルーム101g、キッチン101h、および屋外パティオ101iを含み、いくつかの部屋、スペース、および/または再生ゾーンを有する家庭からなる。以下では、家庭環境の下での特定の実施形態や例を説明するが、ここで説明する技術は他のタイプの環境でも実施可能である。いくつかの実施形態では、例えば、MPS100は、1つ以上の商業環境(例えば、レストラン、モール、空港、ホテル、小売店などの店舗)、1つ以上の車両(例えば、スポーツユーティリティビークル、バス、車、船、ボート、飛行機)、複数の環境(例えば、家庭環境と車両環境の組み合わせ)、および/または、マルチゾーンオーディオが望ましいと思われる別の適切な環境で実施することができる。
これらの部屋や空間の中で、MPS100は1つ以上のコンピューティングデバイスを含む。図1Aおよび図1Bを一緒に参照すると、そのようなコンピューティングデバイスは、再生デバイス102(再生デバイス102a~102oとして個別に識別される)、ネットワークマイクロフォンデバイス103(「NMD」103a~102iとして個別に識別される)、およびコントローラデバイス104aおよび104b(総称して「コントローラデバイス104」)を含むことができる。図1Bを参照すると、家庭環境は、1つまたは複数のスマートイルミネーションデバイス108(図1B)、スマートサーモスタット110、およびローカルコンピューティングデバイス105(図1A)などの、ローカルネットワークデバイスを有する、追加および/または他のコンピューティングデバイスを含んでもよい。以下に説明する実施形態では、様々な再生装置102のうち1つ以上は携帯型の再生装置として構成されてもよく、他は据置型の再生装置として構成されてもよい。例えば、ヘッドフォン102o(図1B)は携帯型の再生装置であり、本棚に設置された再生装置102dは据置型の装置であってもよい。別の例として、パティオの再生装置102cは、バッテリ駆動の装置であってもよく、これにより、壁のコンセントなどに接続されていない状態で、環境101内の様々な場所や、環境101外に持ち運ぶことができる。
なお、図1Bを参照すると、MPS100の様々な再生装置、ネットワークマイクロフォン、およびコントローラ装置102~104および/または他のネットワーク装置は、ネットワークルータ109を含むLAN111を介して、ポイントツーポイント接続および/または有線および/または無線である他の接続を介して、互いに組合せ(couple)されてもよい。例えば、デン101d(図1A)にある再生装置102jは、「左」の装置として指定されることがあり、同じくデン101dにあり、「右」の装置として指定されることがある再生装置102aとポイントツーポイントで接続されることがある。関連する実施形態では、左再生装置102jは、LAN111を介したポイントツーポイント接続および/または他の接続を介して、「前」の装置として指定されることがある再生装置102bなどの他のネットワーク装置と通信してもよい。
図1Bにさらに示すように、MPS100は、ワイドエリアネットワーク(「WAN」)107を介して1つまたは複数のリモートコンピューティングデバイス106に組合せされてもよい。いくつかの実施形態では、各リモートコンピューティングデバイス106は、1つまたは複数のクラウドサーバの形態をとってもよい。リモートコンピューティングデバイス106は、様々な方法で環境101のコンピューティングデバイスと対話するように構成されてもよい。例えば、リモートコンピューティングデバイス106は、家庭環境101において、オーディオなどのメディアコンテンツのストリーミングおよび/または再生制御を容易にするように構成されてもよい。
いくつかの実装では、様々な再生デバイス、NMD、および/またはコントローラデバイス102~104は、VASに関連する少なくとも1つのリモートコンピューティングデバイス、およびメディアコンテンツサービス(「MCS」)に関連する少なくとも1つのリモートコンピューティングデバイスに通信可能に組合せされてもよい。例えば、図1Bの例示された例では、リモートコンピューティングデバイス106aは、VAS190に関連付けられており、リモートコンピューティングデバイス106bは、MCS192に関連付けられている。図1Bの例では、分かりやすくするために、単一のVAS190と単一のMCS192のみを示しているが、MPS100は、複数の異なるVASおよび/またはMCSに組合せされていてもよい。いくつかの実装では、VASは、AMAZON(登録商標)、GOOGLE(登録商標)、APPLE(登録商標)、MICROSOFT(登録商標)、SONOS(登録商標)、または他の音声アシスタントプロバイダーの1つまたは複数によって運営されてもよい。いくつかの実装では、MCSは、SPOTIFY(登録商標)、PANDORA(登録商標)、AMAZON MUSIC(登録商標)、または他のメディアコンテンツサービスの1つまたは複数によって運営されてもよい。
図1Bにさらに示すように、リモートコンピューティングデバイス106は、メディア再生機能の遠隔促進、デバイスおよびシステムのステータス情報の管理、MPS100のデバイスと1つまたは複数のVASおよび/またはMCSとの間の通信の指示など、特定の動作を実行するように構成されたリモートコンピューティングデバイス106cをさらに含む。一例では、リモートコンピューティングデバイス106cは、1つまたは複数のSONOS Wireless HiFi Systemのクラウドサーバを提供する。
様々な実装において、再生デバイス102の1つまたは複数は、オンボード(例えば、統合された)ネットワークマイクロフォンデバイスの形態をとるか、またはそれを含むことができる。例えば、再生装置102a~eは、それぞれNMD103a~eを含む、またはそれに対応するものを備えている。なお、ここでは、NMDを搭載した再生機を、特に断りのない限り、再生機またはNMDと呼ぶ。いくつかのケースでは、NMD103のうちの1つまたは複数が、スタンドアロン型のデバイスであってもよい。例えば、NMD103fおよび103gは、スタンドアロン型の装置であってもよい。単体のNMDでは、スピーカや関連電子機器など、再生機器に含まれる部品や機能が省略されている場合がある。例えば、このような場合、スタンドアロンのNMDは、音声出力を行わないか、出力できても限られた音声出力(例えば、比較的低品質の音声出力)を行う。
MPS100の様々な再生装置およびネットワークマイクロフォンデバイス102および103は、それぞれ固有の名前と関連付けされていてもよく、この名前は、これらのデバイスの1つまたは複数のセットアップ中などに、ユーザによってそれぞれのデバイスに割り当てられてもよい。例えば、図1Bの図示例に示すように、再生装置102dが物理的に本棚の上に位置していることから、ユーザは「本棚」という名前を付けてもよい。同様に、NMD 103fは、キッチン101h(図1A)のアイランドカウンター上に物理的に位置しているため、「アイランド」という名称を割り当ててもよい。再生装置の中には、ゾーンや部屋に応じた名前が割り当ててもよく、例えば、再生装置102e、102l、102m、102nには、それぞれ「ベッドルーム」、「ダイニングルーム」、「リビングルーム」、「オフィス」という名前を付けても良い。さらに、特定の再生装置は、機能的に記述的な名前を持つことができる。例えば、再生装置102aと102bには、それぞれ「右」と「前」という名前が割り当てられるが、これは、これら2つの装置が、デン101d(図1A)のゾーンでのメディア再生時に、特定のオーディオチャンネルを提供するように構成されているからである。パティオの再生装置102cは、バッテリ駆動であること、および/または、環境101の異なる領域に容易に持ち運び可能であることから、ポータブルと名前を付けられてもよい。他の命名規則も可能である。
上述したように、NMDは、NMDの周辺にいる人の会話の音声と背景雑音が混ざった音など、環境からの音を検出し、処理することができる。例えば、NMDが環境中で音を検出すると、NMDは検出された音を処理して、その音がNMDを、最終的には特定のVASを意図した音声入力を含むスピーチを含んでいるかどうかを判断することができる。例えば、NMDは、音声に特定のVASに関連するウェイクワードが含まれているかどうかを識別することができる。
図1Bの例示された例では、NMD103は、LAN111およびルータ109を介してネットワーク上でVAS190と対話するように構成されている。VAS190とのインタラクションは、例えば、NMDが検出した音の中に潜在的なウェイクワードを識別したときに開始される。この識別により、ウェイクワードイベントが発生し、NMDが検出した音データをVAS190へ送信することが開始される。いくつかの実施形態では、MPS100の様々なローカルネットワークデバイス102~105(図1A)および/またはリモートコンピューティングデバイス106cは、選択されたVASに関連するリモートコンピューティングデバイスと様々なフィードバック、情報、命令、および/または関連データを交換してもよい。このような情報の交換は、音声入力を含む送信メッセージに関連している場合もあれば、独立している場合もある。ある実施形態では、リモートコンピューティングデバイス(複数可)およびメディア再生システム100は、ここに記載されているような通信パスを介して、および/または、2017年2月21日に出願され、「Voice Control of a Media Playback System」と題された米国出願第15/438,749号に記載されているメタデータ交換チャネルを使用して、データを交換してもよい。米国出願第15/438,749号を参照することにより、その内容の全ては、本願明細書の中に含まれるものとする。
サウンドデータのストリームを受信すると、VAS190は、NMDからのデータストリームに音声入力があるかどうかを判断し、ある場合にはVAS190は、音声入力に含まれる用語の意図も判断する。VAS190は、次に、リスポンスをMPS100に返送するが、このリスポンスは、ウェイクワードイベントを引き起こしたNMDに直接送信する。このリスポンスは、VAS190が音声入力に意図が存在すると判断した事に基づいて行われる。一例として、VAS190が「ビートルズのヘイジュードを再生(Play Hey Jude by The Beatles)」という命令を伴う音声入力を受信したことに応答して、VAS190は、音声入力の基本的な意図が再生を開始することであると判断し、さらに音声入力の意図が特定の曲"ヘイジュード(Hey Jude)"を再生することであると判断してもよい。これらの決定の後、VAS190は、コンテンツ(すなわち、曲「ヘイジュード(Hey Jude)」)を取得するためのコマンドを特定のMCS192に送信してもよく、そのMCS192は、続いて、このコンテンツをMPS100に直接、またはVAS190を介して間接的に提供(例えば、ストリーム提供)する。いくつかの実施形態では、VAS190は、MPS100にコマンドを送信し、MPS100自身がMCS192からコンテンツを取得する様にしてもよい。
ある実施形態においては、互いに近接して配置された二つ以上のNMDによって検出された音声に音声入力が識別された場合、NMDは、互いの仲裁処理を行うことができる。例えば、環境101(図1A)にあるNMD搭載の再生装置102dは、リビングルームにあるNMD搭載の再生装置102mと近接しており、両装置102d、102mは少なくとも同時に同じ音を検出することがある。このような場合、どのデバイスがリモートVASに検知したサウンドデータを送信する責任があるかについて、仲裁が必要になる。NMD間の仲裁の例は、例えば、先に説明した米国出願第15/438,749号明細書に記載されている。
ある実施形態では、NMDは、NMDを含まない再生デバイスと、指定により、又はデフォルトにより関連付けされていてもよい。例えば、キッチン101h(図1A)にあるアイランドNMD103fを、アイランドNMD103fと比較的近い場所にあるダイニングルームの再生装置102lに割り当ててもよい。実際、NMDからの音声入力をリモートVASが受けたことに応答して、NMDは、割り当てられている再生装置にオーディオを生成させるように指示しても良い。ここで、ユーザが特定の曲、アルバム、プレイリストなどを再生するコマンドを話したことに応じてNMDからVASに音声入力が送られる。NMDや再生装置を指定装置またはデフォルト装置として割り当てることについての詳細は、例えば、先に説明した米国特許出願第15/438,749号明細書に記載されている。
例示的なMPS100の異なる構成要素に関連するさらなる側面、および異なる構成要素がどのように相互作用してユーザにメディア体験を提供するかについては、以下のセクションに記載されている。ここでの議論は一般的に例示のMPS100に言及しているが、ここで説明する技術は、特に上述の家庭環境内でのアプリケーションに限定されるものではない。例えば、ここに記載の技術は、再生装置、ネットワークマイクロフォン、および/またはコントローラ装置102~104のいずれかをより多くまたはより少なく構成した他の家庭環境の構成においても有用である。例えば、ここに記載の技術は、単一の再生装置102および/または単一のNMD103を有する環境内で利用することができる。かかる場合、LAN111(図1B)を廃止し、単一の再生装置102および/または単一のNMD103が、リモートコンピューティング装置106a~dと直接通信してもよい。ある実施形態では、通信ネットワーク(例えば、LTEネットワーク、5Gネットワークなど)が、LANとは独立して、様々な再生装置、ネットワークマイクロフォン、および/またはコントローラ装置102~104と通信してもよい。
a.再生装置及びネットワークマイクロフォンデバイスの例
図2Aは、図1Aおよび図1BのMPS100の再生装置102の1つの特定の側面を示す機能ブロック図である。図示されているように、再生装置102は、それぞれが以下でさらに詳細に説明される様々な構成要素を含み、再生装置102の様々な構成要素は、システムバス、通信ネットワーク、又は何らかの他の接続機構を介して、互いに動作可能に組合せされている。図2Aの図示された例では、再生装置102は、図1Aに示されたNMD103の一例の様に、NMDの機能をサポートするコンポーネントを含むため、「NMD搭載」再生装置と呼ぶことがある。
図示されているように、再生装置102は、少なくとも1つのプロセッサ212を含み、このプロセッサは、メモリ213に格納された命令に従って入力データを処理するように構成されたクロック駆動型コンピューティングコンポーネントであってもよい。メモリ213は、プロセッサ212によって実行可能な命令を格納するように構成され、有形で、非一過性の、コンピュータ可読媒体である。例えば、メモリ213は、特定の機能を実現するためにプロセッサ212によって実行可能なソフトウェアコード214をロードすることができるデータストレージである。
一例では、これらの機能は、再生装置102(他の再生装置であってもよい)が、オーディオソースからオーディオデータを取得する機能を含む。別の例では、機能は、再生装置102が、音声データ、検出されたサウンドデータ(例えば、音声入力に対応する)、および/または他の情報を、少なくとも1つのネットワークインターフェース224を介して、ネットワーク上の別の装置に送信することを含む。さらに別の例では、機能は、再生装置102が、1つまたは複数の他の再生装置に、再生装置102と同期して音声を再生させることを含んでもよい。さらに別の例では、機能は、再生装置102が1つ以上の他の再生装置とペアリングまたはその他の方法で結合することを可能にし、マルチチャネルオーディオ環境を作成することを含む。他にも多数の機能例が考えられるが、そのうちのいくつかを以下に説明する。
上述したように、特定の機能には、再生装置102が1つ以上の他の再生装置とオーディオコンテンツの再生を同期させることを含む。同期再生時には、リスナーは、同期再生機器によるオーディオコンテンツの再生間の時間差を認識できない。2004年4月4日に出願された米国特許第8,234,395号の明細書は、「独立したクロックを持つ複数のデジタルデータ処理装置間で動作を同期させるシステムおよび方法(System and method for synchronizing operations among a plurality of independently clocked digital data processing devices)」という発明の名称であり、再生機器間でのオーディオ再生の同期化に関するいくつかの例をより詳細に説明している。
オーディオの再生を容易にするため、再生デバイス102は、再生デバイス102がオーディオをレンダリングする前にオーディオを処理するように構成されたオーディオ処理コンポーネント216を含む。このため、オーディオ処理コンポーネント216は、1つまたは複数のデジタル-アナログコンバータ(「DAC」)、1つまたは複数のオーディオ前処理コンポーネント、1つまたは複数のオーディオエンハンスメントコンポーネント、1つまたは複数のデジタルシグナルプロセッサ(「DSP」)などを含んでいる。いくつかの実施形態では、オーディオ処理コンポーネント216の1つまたは複数は、プロセッサ212のサブコンポーネントであってもよい。オーディオ処理コンポーネント216は、アナログおよび/またはデジタルのオーディオを受信し、処理し、またはその他の方法で意図的に変更して、再生用のオーディオ信号を生成する。
生成されたオーディオ信号は、次に、増幅のために1つまたは複数の増幅器217に送られ、増幅器217に動作可能に組合された1つまたは複数のスピーカ218を介して再生される。オーディオ増幅器217は、オーディオ信号を、1つ以上のスピーカ218を駆動するためのレベルに増幅するように構成されたコンポーネントを含んでもよい。
スピーカ218の各々は、それぞれトランスデューサ(例えば、「ドライバ」)を含んでいてもよいし、スピーカ群としてのスピーカ218は、1つ以上のドライバを有するエンクロージャを含む完全なスピーカシステムを含んでいてもよい。スピーカ218の特定のドライバは、例えば、サブウーファ(例えば、低周波用)、ミッドレンジドライバ(例えば、中周波用)、および/またはツイータ(例えば、高周波用)を含んでもよい。あるケースでは、トランスデューサは、オーディオ増幅器群217のそれぞれの対応するオーディオ増幅器によって駆動されてもよい。いくつかの実施形態では、再生装置は、スピーカ218を含まず、代わりに、再生装置を外部スピーカに接続するためのスピーカインターフェースを含んでもよい。特定の実施形態では、再生装置は、スピーカ218もオーディオ増幅器217も含まず、代わりに、再生装置を外部のオーディオ増幅器またはオーディオビジュアル受信機に接続するためのオーディオインターフェース(図示せず)を含んでもよい。
再生装置102による再生のためにオーディオ信号を生成することに加えて、オーディオ処理コンポーネント216は、再生のために、ネットワークインターフェース224を介して、1つまたは複数の他の再生装置に送信されるオーディオを処理するように構成されてもよい。例示的なシナリオでは、再生装置102によって処理および/または再生されるオーディオコンテンツは、再生装置102のオーディオラインインインターフェース(例えば、自動検出3.5mmオーディオラインイン接続)を介して(図示せず)、または後述するようにネットワークインターフェース224を介してなど、外部ソースから受信されてもよい。
図示されているように、少なくとも1つのネットワークインターフェース224は、1つ以上の無線インターフェース225および/または1つ以上の有線インターフェース226の形態をとることができる。無線インターフェースは、再生装置102が通信プロトコル(例えば、IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4Gモバイル通信規格等を含む任意の無線規格)に従って他の装置(例えば、他の再生装置(複数可)、NMD(複数可)、および/またはコントローラ装置(複数可))と無線通信するためのネットワークインターフェース機能を提供してもよい。有線インターフェースは、再生装置102が通信プロトコル(例えば、IEEE 802.3)に従って他の装置と有線接続で通信するためのネットワークインターフェース機能を提供してもよい。図2Aに示すネットワークインターフェース224は、有線および無線の両方のインターフェースを含むが、再生装置102は、いくつかの実施形態において、無線インターフェースのみ、または、有線インターフェースのみを含んでもよい。
一般的に、ネットワークインターフェース224は、再生装置102と、データネットワーク上の1つ以上の他の装置との間のデータフローを容易にする。例えば、再生装置102は、1つまたは複数の他の再生装置、LAN内のネットワーク装置、および/またはインターネットなどのWANを介したオーディオコンテンツソースから、データネットワークを介してオーディオコンテンツを受信するように構成されてもよい。一例では、再生装置102によって送受信されるオーディオコンテンツおよびその他の信号は、インターネットプロトコル(IP)ベースのソースアドレスおよびIPベースのデスティネーションアドレスからなるデジタルパケットデータの形態で送信されてもよい。このような場合、ネットワークインターフェース224は、再生装置102に向けられたデータが再生装置102によって適切に受信および処理されるように、デジタルパケットデータを解析するように構成されてもよい。
図2Aに示すように、再生装置102は、1つまたは複数のマイクロフォン222に動作可能に組合される音声処理コンポーネント220も含む。マイクロフォン222は、再生装置102の環境における音(すなわち、音響波でありサウンドとも言う)を検出するように構成されており、その音は音声処理コンポーネント220に提供される。より具体的には、各マイクロフォン222は、音を検出し、その検出された音をデジタル信号またはアナログ信号に変換するように構成され、更に、以下でより詳細に説明するように、検出された音に基づいて、音声処理コンポーネント220に様々な機能を実行させる。ある実施形態では、マイクロフォン222は、複数のマイクロフォンが集まったアレイ(例えば、6個のマイクロフォンのアレイ)として配置されている。また、ある実施形態では、再生装置102は、6つ以上のマイクロフォン(例えば、8つのマイクロフォンまたは12のマイクロフォン)または6つ以下のマイクロフォン(例えば、4つのマイクロフォン、2つのマイクロフォン、または単一のマイクロフォン)を含む。
動作において、音声処理コンポーネント220は、一般に、マイクロフォン222を介して受信された音を検出および処理し、検出された音の中で潜在的な音声入力を識別し、検出された音データを抽出するように構成され、これにより、VAS190(図1B)などのVASにより検出された音データの中で識別された音声入力を処理できるようにする。音声処理コンポーネント220は、種々のコンポーネントを含み、例えば、1つまたは複数のアナログ-デジタル変換器、音響エコーキャンセラ(「AEC」)、空間プロセッサ(例えば、1つまたは複数のマルチチャネルWienerフィルタ、1つまたは複数の他のフィルタ、および/または1つまたは複数のビームフォーマコンポーネント)、1つまたは複数のバッファ(例えば。1つまたは複数の円形バッファ)、1つまたは複数のウェイクワードエンジン、1つまたは複数の音声抽出器、および/または1つまたは複数の音声処理コンポーネント(例えば、特定のユーザ又はある世帯における複数の特定のユーザの音声を認識することができるコンポーネント)などを含む。 例示的な実施形態では、音声処理コンポーネント220は、1つまたは複数のDSPまたは1つまたは複数のDSP用のモジュールを含む。この点において、特定の音声処理コンポーネント220は、特定の機能を実現するために修正またはその他の方法で調整される特定のパラメータ(例えば、ゲインおよび/またはスペクトルパラメータ)を有することもできる。いくつかの実施形態では、音声処理コンポーネント220の1つまたは複数は、プロセッサ212のサブコンポーネントであってもよい。
いくつかの実施形態では、音声処理コンポーネント220は、MPS100のユーザアカウントに関連付けられているユーザの音声プロファイルを検出し、格納してもよい。例えば、音声プロファイルは、一連のコマンド情報やデータテーブルに格納された変数として格納され、また、格納されている変数と比較される。音声プロファイルは、ユーザの声のトーンまたは周波数や、他のユニークな特徴を含むことができ、その詳細は先に説明した米国特許出願第15/438,749号に詳細に記載されている。
図2Aにさらに示すように、再生装置102は、パワーコンポーネント227も含む。パワーコンポーネント227は、少なくとも外部パワーインターフェース228を含み、再生装置102をコンセントやその他の外部電源に物理的に接続する電源ケーブルなどを介して、電源(図示せず)に組合されてもよい。パワーコンポーネントとして他に、例えば、電力を設定するトランス、コンバータなどがある。
いくつかの実施形態では、再生装置102のパワーコンポーネント227は、外部電源への物理的な接続なしに再生装置102に電力を供給するように構成された内部パワーソース229(例えば、1つまたは複数の電池)をさらに含んでもよい。内部パワーソース229を備える場合、再生装置102は、外部パワーソースに依存せずに動作することができる。いくつかのそのような実施形態では、外部パワーソースインターフェース228は、内部パワーソース229の充電を容易にするように構成されてもよい。前述したように、内部パワーソースを備えた再生装置を、ここでは 「ポータブル再生装置」と呼ぶことがある。一方、外部パワーソースを利用して動作する再生装置を「据え置き型再生装置」と呼ぶが、実際には家庭内などで移動可能である。
再生装置102は、ユーザインタフェース240をさらに含み、それによりユーザインタラクションが容易にされ、さらに、1つまたは複数のコントローラ装置104により容易にされたユーザインタラクションと連動するようにしてもよい。様々な実施形態において、ユーザインターフェース240は、1つ以上の物理的なボタンを含むものもあれば、ユーザの直接入力が可能な、タッチセンシティブなスクリーン(複数可)および/または表面(複数可)が提供されるグラフィカルインターフェースをサポートするものもある。ユーザインターフェース240は、視覚的および/または音声的なフィードバックを提供するライト(例えば、LED)およびスピーカのうちの1つまたは複数をさらに含んでもよい。
例として、図2Bは、再生装置102のハウジング230を示し、ハウジング230の上部分234にコントロールエリア232の形でユーザインタフェースを含む。コントロールエリア232には、オーディオの再生やボリュームレベルなどをコントロールするためのボタン236a~cが含まれている。また、コントロールエリア232には、マイクロフォン222をオン状態とオフ状態のいずれかに切り替えるためのボタン236dが設けられている。
図2Bにさらに示すように、コントロールエリア232は、ハウジング230の上面部234に形成された開口部によって少なくとも部分的に囲まれており、それを介してマイクロフォン222(図2Bでは見えない)が再生装置102の環境下で音を受信する。マイクロフォン222は、再生装置102に対して1つまたは複数の方向からの音を検出するように、ハウジング230の上面部234または他の領域に沿っておよび/またはその中の様々な位置に配置されてもよい。
例示として、ソノス株式会社(SONOS,Inc.)は、ここに開示された特定の実施形態を実施することができる特定の再生装置を販売しており、それらは、「PLAY:1」、「PLAY:3」、「PLAY:5」、「PLAYBAR」、「CONNECT:AMP」、「PLAYBASE」、「BEAM」、「CONNECT」、および「SUB」を含む。過去、現在、および/または未来に出される他の再生装置が、ここで開示される例示的な実施形態の再生装置を実施するために追加的または代替的に使用されてもよい。さらに、再生装置は、図2Aまたは2Bに示された例や、ソノス製品の提供に限定されない。例えば、再生装置は、有線または無線のヘッドフォンセットを含むか、またはそのような形態をとってもよく、ネットワークインターフェースなどを介してメディア再生システム100の一部として動作してもよい。別の例として、再生装置は、個人用モバイルメディア再生装置のためのドッキングステーションを含むか、それと相互作用することができる。さらに別の例では、再生装置は、テレビや照明器具など、屋内外で使用される他の機器や部品と一体化が可能である。
b.再生装置の構成例
図3A~3Eは、再生装置の例示的な構成を示す。最初に図3Aを参照すると、いくつかの例示的な実施形態では、単一の再生装置がゾーンに属してもよい。例えば、パティオの再生装置102c(図1A)は、ゾーンAに属していてもよい。以下に説明するいくつかの実施形態では、複数の再生機器を「結合(bond)」して「結合ペア」を形成し、それらが一緒になって1つのゾーンを形成することができる。例えば、図3Aで「ベッド1」と名付けられた再生装置102f(図1A)と、図3Aで「ベッド2」と名付けられた再生装置102g(図1A)とを結合して、ゾーンBを形成してもよい。結合された再生装置のそれぞれは、異なる再生責任(例えば、チャンネル責任)を持つ。後述する別の実施形態では、複数の再生装置を統合して1つのゾーンを形成することができる。統合された再生装置102d、102mには、特に異なる再生責任が割り当てられていなくてもよい。すなわち、統合された再生装置102d、102mは、同期してオーディオコンテンツを再生することは勿論であるが、それぞれが統合されていない場合と同様にオーディオコンテンツを再生してもよい。
制御のために、MPS100の各ゾーンは、単一のユーザーインターフェース(「UI」)エンティティとして表されてもよい。例えば、コントローラデバイス104によって表示されるように、ゾーンAは、「ポータブル」という名前の単一のエンティティとして提供されてもよく、ゾーンBは、「ステレオ」という名前の単一のエンティティとして提供されてもよく、ゾーンCは、「リビングルーム」という名前の単一のエンティティとして提供されてもよい。
様々な実施形態において、ゾーンは、そのゾーンが属する場を再生装置の1つの名前として引き継いでもよい。例えば、ゾーンCは、(図のように)リビングルームを再生装置102mの名前として引き継いでもよい。別の例では、ゾーンCは代わりに本棚を再生装置102dの名前として名乗ってもよい。さらなる例では、ゾーンCは、本棚にある再生装置102dとリビングルームにある再生装置102mを何らかの形で組み合わせた名前を取ることができる。選択される名前は、コントローラデバイス104での入力を介してユーザが選択することができる。いくつかの実施形態では、ゾーンには、そのゾーンに属する再生装置とは異なる名前が与えられることがある。例えば、図3AのゾーンBには「ステレオ」という名前が付けられているが、ゾーンBにはこの名前を持つ再生装置はない。一例では、ゾーンBは、構成デバイスである「ベッド1」と「ベッド2」で構成された「ステレオ」という名前の単一デバイスを表す単一のUIエンティティである。ある実施形態では、ベッド1の再生装置は、マスターベッドルーム101h(図1A)にある再生装置102fであってもよく、ベッド2の再生装置は、同じくマスターベッドルーム101h(図1A)にある再生装置102gであってもよい。
上述したように、結合された再生装置は、特定のオーディオチャネルの再生責任など、異なる再生責任を持つ場合がある。例えば、図3Bに示すように、ベッド1およびベッド2のデバイス102fおよび102gは、オーディオコンテンツのステレオ効果を生成または強化するように結合されてもよい。この例では、ベッド1の再生装置102fは、左チャンネルのオーディオコンポーネントを再生するように構成されていてもよく、ベッド2の再生装置102gは、右チャンネルのオーディオコンポーネントを再生するように構成されていてもよい。いくつかの実施形態では、このようなステレオ結合は、「ペアリング」とも呼ばれる。
さらに、結合されるように構成された再生装置は、追加および/または異なるそれぞれのスピーカドライバを有することができる。図3Cに示すように、「前」という名前の再生装置102bは、「サブ」という名前の再生装置102kと結合してもよい。なお、「前」の再生装置102bは、中~高域の範囲をレンダリングしてもよく、「サブ」の再生装置102kは、例えばサブウーファーのように低域をレンダリングしてもよい。結合が解かれた時には、「前」の再生装置102bは、フルレンジの周波数をレンダリングするように構成されていてもよい。別の例として、図3Dでは、「前」と「サブ」の再生装置102bと102kが、それぞれ右と左の再生装置102aと102jとさらに結合している様子を示している。いくつかの実施形態では、右および左の再生装置102aおよび102jは、ホームシアターシステムのサラウンドまたは「サテライト」チャネルを形成してもよい。結合された再生装置102a、102b、102j、102kは、単一のゾーンDを形成してもよい(図3A)。
いくつかの実施形態では、再生デバイスは「マージ(merged)」されることもある。結合された再生装置とは異なり、マージされた再生装置は、再生責任が割り当てられておらず、それぞれの再生装置の可能な範囲でオーディオコンテンツのフルレンジをレンダリングする。それにもかかわらず、マージされた複数の再生装置は、単一のUIエンティティ(すなわち、上述したようにゾーン)として提供されることがある。例えば、図3Eでは、リビングルームの再生装置102dと102mがマージされており、これらの再生装置がゾーンCの単一のUIエンティティとして提供されることになる。ある実施形態では、再生装置102dおよび102mは、同期してオーディオを再生してもよく、その間、それぞれの再生装置102dおよび102mがレンダリング可能な範囲でオーディオコンテンツのフルレンジを出力する。
いくつかの実施形態では、スタンドアロンのNMDがそれ自体でゾーンに加わっていてもよい。例えば、図1AのNMD103hは、「クローゼット」と名付けられ、図3AにおいてゾーンIを形成する。また、NMDは他のデバイスと結合したり、マージしたりして、ゾーンを形成することもできる。例えば、"アイランド"と名付けられたNMDデバイス103fは、再生装置102iキッチンと結合され、これらは共に"キッチン"と名付けられてゾーンFを形成してもよい。NMDや再生装置を指定装置またはデフォルト装置として割り当てることについての詳細は、例えば、先に説明した米国特許出願第15/438,749号明細書に記載されている。いくつかの実施形態では、スタンドアロンのNMDはゾーンに割り当てられない場合がある。
個々の装置、結合された装置、および/またはマージされた装置で構成されるゾーンに含まれる複数の再生装置は、同期してオーディオを再生する再生装置の集合体であるセットを形成するように配置される。このような再生装置のセットは、「グループ」、「ゾーングループ」、「シンクログループ」、または「再生グループ」と呼ばれることがある。コントローラデバイス104を介して提供される入力に応答して、複数の再生装置は、動的にグループ化の形成(グループ化)およびグループ化の解除(グループ解除)が成され、オーディオコンテンツを同期再生する新しいまたは異なるグループを形成する。例えば、図3Aを参照すると、ゾーンAはゾーンBとグループ化され、2つのゾーンの再生装置を含むゾーングループを形成することができる。別の例として、ゾーンAは、1つ以上の他のゾーンC~Iとグループ化されてもよい。ゾーンA~Iは、多数の方法でグループ化されたり、グループ解除されたりする。例えば、ゾーンA~Iのうち、3つ、4つ、5つ、またはそれ以上(例えば、すべて)のゾーンをグループ化してもよい。グループ化された場合、ゾーンにある個々の再生装置や結合された再生装置は、先に説明した米国特許第8,234,395号明細書に記載されているように、互いに同期してオーディオを再生することができる。グループ化された再生装置や結合された再生装置は、ポータブル再生装置とステーショナリー再生装置の間の関連付けの例であり、係る関連付けは、上述したように、トリガーイベントに応じて引き起こされ、以下でより詳細に説明する。
様々な実施形態において、環境内のゾーンには特定の名前が割り当てられてもよく、その名前は、ゾーングループ内のゾーンのデフォルトの名前であってもよいし、図3Aに示すように「ダイニングルーム+キッチン」のようにゾーングループ内のゾーンの名前の組み合わせであってもよい。ある実施形態では、ゾーングループには、図3Aにも示されているように、「ニックの部屋」のように、ユーザによって選択された固有の名前が与えられてもよい。「ニックの部屋」という名前は、ゾーングループのための以前の名前として元々あった「マスターベッドルーム」という部屋名に変えて、ユーザが選んだ名前である。
図2Aにおいて、特定のデータは、1つまたは複数の状態変数としてメモリ213に格納されてもよい。変数は、定期的に更新され、再生ゾーン、再生装置(複数可)、および/またはそれに関連するゾーングループの状態を記述するために使用される。また、メモリ213には、メディア再生システム100の他の装置の状態に関連するデータが含まれていてもよい。係る関連するデータは、1つまたは複数の装置がシステムに関連する最新のデータを持つように、装置間で随時共有されてもよい。
いくつかの実施形態では、再生装置102のメモリ213は、状態に関連付けられた様々な変数タイプのインスタンス(時事変化する状態)を格納してもよい。変数のインスタンスは、タイプに対応した識別子(タグなど)を付けて保存することができる。例えば、特定の識別子としては、ゾーンにある再生装置を識別するための第1のタイプ「a1」、ゾーン内で結合状態にある再生装置を識別するための第2のタイプ「b1」、およびゾーンが属するゾーングループを識別するための第3のタイプ「c1」であってもよい。関連する例として、図1Aでは、「パティオ」と名付けられた装置に対応する識別子は、「パティオ」は特定のゾーンにある唯一の再生装置であり、いずれのゾーングループに含まれないことを示す。「リビングルーム」に対応する識別子は、「リビングルーム」が他のゾーンとグループ化されておらず、結合された再生装置102a、102b、102j、102kを含むことを示す。「ダイニングルーム」に対応する識別子は、「ダイニングルーム」が「ダイニングルーム+キッチン」グループの一部であり、デバイス103fと102iが結合されていることを示す。「キッチン」に対応する識別子は、「キッチン」が「ダイニングルーム+キッチン」のゾーングループの一部であるので、同一または類似の情報を示す。その他のゾーン変数と識別子の例を以下に示す。
さらに別の例では、MPS100は、図3Aに示すように、エリアに対応する識別子など、ゾーンやゾーングループとは異なる関連性を表す変数または識別子を含んでもよい。エリアには、ゾーングループのクラスタや、ゾーングループに属さないゾーンが含まれることがある。例えば、図3Aには、「第1エリア」と名付けられた第1のエリアと、「第2エリア」と名付けられた第2のエリアが示されている。第1エリアには、「パティオ」「デン」「ダイニング」「キッチン」「バスルーム」のゾーンとゾーングループがある。第2エリアには、「バスルーム」「ニックの部屋」「ベッドルーム」「リビングルーム」のゾーンとゾーングループがある。ある実施形態では、「エリア」を使って、ゾーンのクラスタや、1つ以上のゾーンを共有するゾーングループのクラスタや、ゾーングループの別のクラスタを呼び出すことができる。この場合、このエリアは、他のゾーングループとゾーンを共有しないゾーングループとは異なる。エリアを実施するための技術のさらなる例は、次の米国特許出願の明細書に記載されている。2017年8月21日に出願された米国出願第15/682,506号で、発明の名称は「名前に基づく部屋の関連づけ(Room Association Based on Name)」、および2007年9月11日に出願された米国特許第8,483,853号で、発明の名称は「マルチゾーンメディアシステムにおけるグループ化の制御と操作(Controlling and manipulating groupings in a multi-zone media system)」である。これらの各出願の内容は、参照することにより、その全体が本明細書に取り込まれるものとする。いくつかの実施形態では、MPS100は「エリア」を用いない場合もあり、その場合、システムはエリアに関連する変数を保存しない。
メモリ213は、他のデータを格納するようにさらに構成されてもよい。そのようなデータは、再生装置102によってアクセス可能なオーディオソース、または再生装置(またはいくつかの他の再生装置(複数可))が関連付けられ得る再生キューに関係してもよい。後述する実施形態では、メモリ213は、音声入力を処理する際に特定のVASを選択するためのコマンドデータのセットを格納するように構成されている。
動作中、図1Aの環境における1つまたは複数の再生ゾーンは、それぞれ異なるオーディオコンテンツを再生してもよい。例えば、あるユーザが「パティオ」ゾーンで焼き肉をしながら、再生装置102cで再生されるヒップホップ音楽を聴いている一方、別のユーザが「キッチン」ゾーンで料理の準備をしながら、再生装置102iで再生されるクラシック音楽を聴いている場合が考えられる。別の例では、ある再生ゾーンと別の再生ゾーンとが同期して同じオーディオコンテンツを再生している場合がある。例えば、ユーザは「オフィス」ゾーンにいて、そこでは、再生装置102nが「パティオ」ゾーンで再生装置102cが再生しているのと同じヒップホップ音楽を再生している場合がある。このような場合、再生装置102cおよび102nは、ユーザが異なる再生ゾーン間を移動しながら、シームレスに(または少なくとも実質的にシームレスに)大音量で再生されているオーディオコンテンツを楽しむことができるように、同期してヒップホップを再生することができる。再生ゾーン間の同期は、先に説明した米国特許第8,234,395号に記載された再生装置間の同期と同様の方法で実現することができる。
上述したように、MPS100のゾーン構成は、動的に変更されてもよい。このように、MPS100は、多数の構成をサポートしてもよい。例えば、ユーザが1つまたは複数の再生装置を物理的にあるゾーンに又はあるゾーンから移動させた場合、MPS100はその変更に対応するために再構成される。例えば、ユーザが再生装置102cを「パティオ」ゾーンから「オフィス」ゾーンに物理的に移動させた場合、「オフィス」ゾーンには再生装置102cと102nの両方が含まれることとなる。場合によっては、ユーザは、例えば、1つのコントローラデバイス104および/または音声入力を用いて、移動した再生デバイス102cを「オフィス」ゾーンのものとペアリングまたはグループ化し、さらに「オフィス」ゾーン内の再生装置の名前を変更することができる。別の例として、1つまたは複数の再生装置102が、まだ再生ゾーンではない家庭環境の特定の空間に移動された場合、移動された再生装置(複数可)は、名前が変更されるか、または特定の空間の再生ゾーンに関連付けられてもよい。
さらに、MPS100の異なる複数の再生ゾーンを動的に組み合わせてゾーングループにしたり、独立した再生ゾーンに分割したりすることができる。例えば、「ダイニングルーム」ゾーンと「キッチン」ゾーンは、再生装置102iと102lが同期してオーディオコンテンツをレンダリングするように、ディナーパーティーのためのゾーングループにまとめてもよい。別の例として、「デン」ゾーンにある結合済の再生装置を、(i)「テレビ」ゾーンと(ii)別の「リスニング」ゾーンに分けてもよい。「テレビ」ゾーンには、「前」の再生装置102bが含まれていてもよい。「リスニング」ゾーンには、上述したように、グループ化、ペア化、またはマージ化された右、左、サブの再生装置102a、102j、102kが含まれていてもよい。このように「デン」ゾーンを分割することで、あるユーザはリビングルーム空間のあるエリアである「リスニング」ゾーンで音楽を聴き、別のユーザはリビングルーム空間の別のエリアでテレビを見ることができる。関連する例では、ユーザは、NMD103aまたは103b(図1B)のいずれかを利用して、「テレビ」ゾーンと「リスニング」ゾーンに分離される前の「デン」ゾーンを制御することができる。分離されると、「リスニング」ゾーンは、例えば、NMD103aの近傍にいるユーザが制御し、「テレビ」ゾーンは、例えば、NMD103bの近傍にいるユーザにより制御される。
c.コントローラデバイスの例
図4Aは、図1AのMPS100のコントローラデバイス104のうちの選択された1つの例を示す機能ブロック図である。このようなコントローラデバイスは、ここでは「コントロールデバイス」または「コントローラ」と呼ぶ。図4Aに示すコントローラデバイスは、プロセッサ412、プログラムソフトウェア414を格納するメモリ413、少なくとも1つのネットワークインターフェース424、および1つまたは複数のマイクロフォン422など、上述したネットワークデバイスの特定のコンポーネントと一般的に類似したコンポーネントを含む。一例として、コントローラデバイスは、MPS100の専用コントローラであってもよい。別の例では、コントローラデバイスは、例えば、iPhone(登録商標)、iPad(登録商標)、その他のスマートフォン、タブレット、ネットワークデバイス(例えば、PCやMac(登録商標)などのネットワークコンピュータ)など、メディア再生システムのコントローラーアプリケーションソフトウェアがインストールされているネットワークデバイスであってもよい。
コントローラデバイス104のメモリ413は、MPS100および/またはシステム100のユーザに関連するコントローラアプリケーションソフトウェアおよび他のデータを格納するように構成されてもよい。メモリ413には、MPS100のユーザアクセス、制御、および/または構成を容易にするなど、特定の機能を実現するためにプロセッサ412によって実行可能なソフトウェア414の命令が格納されてもよい。コントローラデバイス104は、上述したように、無線インターフェースの形態をとってもよいネットワークインターフェース424を介して、他のネットワークデバイスと通信するように構成されている。
一例では、システム情報(例えば、状態変数など)は、ネットワークインターフェース424を介して、コントローラデバイス104と他のデバイスとの間で通信されてもよい。例えば、コントローラデバイス104は、再生デバイス、NMD、または他のネットワークデバイスから、MPS100における再生ゾーンの構成やゾーングループの構成に係る情報を受信してもよい。同様に、コントローラデバイス104は、そのようなシステム情報を、ネットワークインターフェース424を介して再生装置や他のネットワーク装置に送信してもよい。いくつかの例では、他のネットワークデバイスは、別のコントローラデバイスであってもよい。
また、コントローラ装置104は、ネットワークインターフェース424を介して、音量調整や音声再生制御などの再生装置制御コマンドを再生装置に通信してもよい。上述したように、MPS100の構成に対する変更は、コントローラデバイス104を使用するユーザによっても実行され得る。構成の変更には、1つまたは複数の再生装置をゾーンに追加/削除すること、1つまたは複数のゾーンをゾーングループに追加/削除すること、結合またはマージされたプレーヤーを形成すること、1つまたは複数の再生装置を結合またはマージされた再生装置から分離することなどが含まれる。
図4Aに示すように、コントローラデバイス104は、一般的に、MPS100のユーザアクセスおよび制御を容易にするように構成されたユーザインタフェース440も含む。ユーザインタフェース440は、図4Bおよび図4Cに示すコントローラインタフェース440aや440bのような、様々なグラフィカルなコントローラインタフェースを提供するように構成されたタッチスクリーンディスプレイまたは他の物理的インタフェースを含んでもよい。図4Bおよび図4Cを合わせて参照すると、コントローラインタフェース440aおよび440bは、再生制御領域442、再生ゾーン領域443、再生ステータス領域444、再生キュー領域446、およびソース領域448を含む。図示されているユーザインタフェースは、図4Aに示されているコントローラデバイスのようなネットワークデバイス上に提供され、MPS100のようなメディア再生システムを制御するためにユーザによってアクセスされる可能性のあるインターフェースの一例である。メディア再生システムへの同様な制御アクセスを提供するために、様々なフォーマット、スタイル、およびインタラクティブなシーケンスの他のユーザインタフェースが、1つまたは複数のネットワークデバイスに実装されてもよい。
再生制御領域442(図4B)は、選択されると、選択された再生ゾーンまたはゾーングループ内の再生デバイスに、再生または一時停止、早送り、巻き戻し、次へのスキップ、前へのスキップ、シャッフルモードの開始/終了、リピートモードの開始/終了、クロスフェードモードの開始/終了などを行わせるため、選択可能なアイコン(例えば、タッチまたはカーソルを使用する方法による)を含んでもよい。また、再生制御領域442は、選択されると、他の可能性も含めて、イコライゼーション設定および/または再生音量を変更する選択可能なアイコンを含んでもよい。
再生ゾーン領域443(図4C)は、MPS100内の再生ゾーンの現状を含んでもよい。また、再生ゾーン領域443は、図示のように、「ダイニングルーム+キッチン」ゾーングループなどのゾーングループの現状を含んでもよい。いくつかの実施形態では、再生ゾーンのグラフィカルな表示は、結合ゾーンの生成、ゾーングループの生成、ゾーングループの分離、ゾーングループの名前の変更など、MPS100の再生ゾーンを管理または設定するための追加の選択可能なアイコンを含めても良い。
例えば、図示のように、「グループ」アイコンが、再生ゾーンのグラフィカルな枠のそれぞれの中に提供されてもよい。ゾーンを示すグラフィカルな枠の中にある「グループ」アイコンを選択すると、MPS100内の他のゾーンがオプションとして表れ、1つまたは複数のゾーンが選択可能となり、そのゾーンとグループ化される。選択したゾーンはそのゾーンとグループ化され、そのゾーンの再生装置と、選択したゾーンの再生装置は、同期してオーディオコンテンツを再生するように構成される。同様に、ゾーングループを示すグラフィカルな枠の中に「グループ」アイコンが表示されてもよい。この場合、「グループ」アイコンを選択すると、ゾーングループ内にあるゾーンがオプションとして現れ、その中のゾーンを解除するため選択すると、ゾーングループから1つまたは複数のゾーンを削除することができる。また、ユーザインタフェースを介して、ゾーンをグループ化したり、グループ解除したりするための他のインタラクションや実装も可能である。再生ゾーン領域443(図4C)における再生ゾーンの表示は、再生ゾーンまたはゾーングループの構成が変更されると、動的に更新される。
再生状況領域444(図4B)は、選択された再生ゾーンまたはゾーングループにおいて、現在再生されている、以前に再生された、または次に再生される予定のオーディオコンテンツのグラフィカルな表示を含むことができる。選択された再生ゾーンまたはゾーングループは、コントローラインタフェース上の再生ゾーン領域443および/または再生ステータス領域444内において、視覚的に区別される。グラフィカルな表示には、トラックタイトル、アーティスト名、アルバム名、アルバム年、トラックの長さ、および/または、ユーザが知っておくと便利なその他の関連情報が含まれ、コントローラインターフェースを介してMPS100を制御する際に便利である。
再生キュー領域446は、選択された再生ゾーンまたはゾーングループと関連する再生キューの形でオーディオコンテンツのグラフィカルな表示を含んでもよい。ある実施形態では、各再生ゾーンまたはゾーングループは、再生キューと関連付けられており、その再生キューは、再生ゾーンまたはゾーングループによる再生のためのゼロまたは複数のオーディオアイテムに対応する情報を含む。例えば、再生キュー内の各オーディオアイテムは、ユニフォームリソース識別子(URI)、ユニフォームリソースロケータ(URL)、または他の識別子を含んでいてもよく、他の識別子は、再生ゾーンまたはゾーングループ内の再生装置で用いられ、ローカルオーディオコンテンツソースまたはネットワークオーディオコンテンツソースからオーディオアイテムを検索および/または取得し、これらはその後、再生装置によって再生される。
ある例では、プレイリストが再生キューに追加されることがあり、この場合、プレイリスト内の各オーディオアイテムに対応する情報が再生キューに追加されることがある。別の例では、再生キュー内のオーディオアイテムは、プレイリストとして保存されてもよい。別の例では、再生キューは、空であるか、または、詰まってはいるが「使用されていない」ことがあり、この場合は、再生ゾーンまたはゾーングループが、再生時間が有限の個別のオーディオアイテムではなく、停止されるまで再生し続けることができるインターネットラジオなどの連続的にストリーミングされるオーディオコンテンツを再生しているときである。更に別の例では、再生キューは、インターネットラジオおよび/または他のストリーミングオーディオコンテンツアイテムを含むことができ、再生ゾーンまたはゾーングループがそれらのアイテムを再生しているときには「使用中」となる。他の例も可能である。
再生ゾーンまたはゾーングループが「グループ化」または「グループ解除」された場合、影響を受けた再生ゾーンまたはゾーングループに関連付けられた再生キューは、クリアまたは再関連付けされてもよい。例えば、第1の再生キューを含む第1の再生ゾーンと、第2の再生キューを含む第2の再生ゾーンとがグループ化された場合、確立された新たなゾーングループは、最初は空の再生キューを有するか、第1の再生キューからのオーディオアイテムを含む再生キュー(第2の再生ゾーンが第1の再生ゾーンに追加された場合)を有するか、第2の再生キューからのオーディオアイテムを含む再生キュー(第1の再生ゾーンが第2の再生ゾーンに追加された場合)を有するか、または第1と第2の両方の再生キューからのオーディオアイテムの組み合わせを有する関連再生キューを有してもよい。また、その後、確立されたゾーングループがグループ解除された場合、結果として得られた第1再生ゾーンは、以前の第1再生キューと再び関連付けされるか、空とされるか、または確立されたゾーングループがグループ解除される前に確立されたゾーングループに関連付けられた再生キューからのオーディオアイテムを含む新しい再生キューと関連付けされてもよい。同様に、結果として得られた第2再生ゾーンは、以前の第2再生キューと再び関連付けされるか、空の再生キューとされるか、または確立されたゾーングループがグループ解除される前に確立されたゾーングループに関連付けられた再生キューからのオーディオアイテムを含む新しい再生キューと関連付けされてもよい。他の例も可能である。
図4Bおよび4Cにおいて、再生キュー領域446(図4B)におけるオーディオコンテンツのグラフィカルな表示は、トラックタイトル、アーティスト名、トラックの長さ、および/または再生キュー内のオーディオコンテンツに関連する他の関連情報を含んでもよい。ある例では、オーディオコンテンツのグラフィカルな表示は、再生キューおよび/または再生キューで示されるオーディオコンテンツの管理および/または操作するための追加の選択可能なアイコンを表示するために選択子があってもよい。例えば、表示されたオーディオコンテンツは、再生キューから削除されたり、再生キュー内の別の位置に移動されたり、すぐに再生されるように選択されたり、現在再生中のオーディオコンテンツの後に再生されるように選択されたりすることが可能である。再生ゾーンまたはゾーングループに関連付けられた再生キューは、再生ゾーンまたはゾーングループ内の1つまたは複数の再生装置、再生ゾーンまたはゾーングループに属さない再生装置、および/または他の指定された機器のメモリに格納されてもよい。このような再生キューによる再生は、1つまたは複数の再生装置が、キューのメディアアイテムを、シーケンシャルまたはランダムな順序で再生する。
ソース領域448は、対応するVASに関連付けられた選択可能なオーディオコンテンツソースおよび/または選択可能な音声アシスタントのグラフィカルな表示を含んでもよい。VASは選択的に割り当てられてもよい。いくつかの例では、AMAZON(登録商標)のアレクサ(Alexa)(登録商標)、MICROSOFT(登録商標)のコルタナ(Cortana)(登録商標)などの複数のVASが、同じNMDによって起動可能であってもよい。ある実施形態では、ユーザはVASを1つまたは複数のNMDに独占的に割り当てることができる。例えば、ユーザは、図1Aに示すリビングルームのNMD102aおよび102bの一方または両方に第1のVASを割り当て、キッチンのNMD103fに第2のVASを割り当ててもよい。その他の例も可能である。
d.オーディオコンテンツソースの例
ソース領域448内のオーディオソースは、選択された再生ゾーンまたはゾーングループによってオーディオコンテンツが取得され、再生され得るオーディオコンテンツソースである。ゾーンまたはゾーングループ内の1つまたは複数の再生装置は、利用可能なさまざまなオーディオコンテンツソースからオーディオコンテンツを(例えば、オーディオコンテンツに対応するURIまたはURLに従って)再生のために取得するように構成されている。ある例では、オーディオコンテンツは、再生装置によって、対応するオーディオコンテンツソースから直接(例えば、ラインイン接続を介して)取得され得る。別の例では、オーディオコンテンツは、1つまたは複数の他の再生装置またはネットワーク装置を介してネットワーク上の再生装置に提供される。以下で詳しく説明するように、ある実施形態では、オーディオコンテンツは、1つまたは複数のメディアコンテンツサービスによって提供され得る。
オーディオコンテンツソースの例としては、図1のMPS100などのメディア再生システムにおける1つまたは複数の再生デバイスのメモリ、1つまたは複数のネットワークデバイス(例えば、コントローラデバイス、ネットワーク対応パーソナルコンピュータ、またはネットワーク接続ストレージ(「NAS」))上のローカル音楽ライブラリ、インターネットを介してオーディオコンテンツを提供するストリーミングオーディオサービス(例えば、クラウドベースの音楽サービス)、または再生デバイスまたはネットワークデバイス上のラインイン入力接続を介してメディア再生システムに接続されたオーディオソースが挙げられ、他のものも可能である。
ある実施形態では、オーディオコンテンツソースは、図1AのMPS100などのメディア再生システムから追加または削除されてもよい。ある例では、1つ以上のオーディオコンテンツソースが追加、削除、または更新されるたびに、オーディオアイテムの索引付けが実行される。オーディオアイテムの索引付けは、メディア再生システム内の再生装置がアクセス可能なネットワーク上で共有されているすべてのフォルダ/ディレクトリ内の識別可能なオーディオアイテムをスキャンすること、メタデータ(例えば、タイトル、アーティスト、アルバム、トラックの長さなど)と、見つかった識別可能な各オーディオアイテムのURIまたはURL等の他の関連情報からなるオーディオコンテンツデータベースを生成すること、または更新すること、を含む。また、オーディオコンテンツソースを管理・維持するための他の例も考えられる。
e.ネットワークマイクロフォンデバイス(NMD)の例
図5は、本開示の実施形態に基づいて構成されたNMD503を機能的に示すブロック図である。NMD503は、ボイスキャプチャコンポーネント(「VCC」、または総称して「ボイスプロセッサ560」)、ウェイクワードエンジン570、および少なくとも1つの音声抽出器572を含み、これらの各々はボイスプロセッサ560に動作可能に結合されている。NMD503は、上述したマイクロフォン222および少なくとも1つのネットワークインタフェース224をさらに含み、また、明確にするために図5には示されていない、オーディオアンプ、インタフェースなどの他のコンポーネントを含んでもよい。
NMD503のマイクロフォン222は、NMD503の環境から検出されたサウンドSDを音声プロセッサ560に提供するように構成されている。検出されたサウンドSDは、1つまたは複数のアナログまたはデジタル信号の形をとることがある。例示的な実施形態では、検出されたサウンドSDは、複数のチャネル562に関連するよう複数の信号で構成され、音声プロセッサ560に供給される。
チャネル562のそれぞれは、特定のマイクロフォン222に対応してもよい。例えば、6つのマイクロフォンを有するNMDは、6つの対応するチャネルを有してもよい。検出されたサウンドSDの各チャンネルは、他のチャンネルとある種の類似性を持っているが、ある種の点では異なる。これの一つの要因は、あるチャンネルの対応するマイクが、他のチャンネルのマイクと相対的な位置関係にあるためである。例えば、検出されたサウンドSDの1つまたは複数のチャンネルは、他のチャンネルに比べて、音声と背景ノイズの信号対雑音比(「SNR」)が大きい場合がある。
図5に示すように、音声プロセッサ560は、AEC564、空間プロセッサ566、および1つまたは複数のバッファ568を含む。動作において、AEC564は、検出されたサウンドSDを受信し、エコーを抑制するために、および/または、検出されたサウンドSDの品質を向上させるために、音をフィルタリングまたはその他の方法で処理する。その処理されたサウンドは、その後、空間プロセッサ566に送られる。
空間プロセッサ566は、典型的には、検出されたサウンドSDを分析して、音の振幅(例えば、デシベルレベル)、周波数スペクトル、指向性などの特定の特性を識別するように構成されている。空間プロセッサ566は、上述したように、検出されたサウンドSDの構成チャンネル562の類似性および相違性に基づいて、検出されたサウンドSDの周囲の雑音を潜在的なユーザの音声からフィルタリングまたは抑制するのを助けることができる。一例では、空間プロセッサ566は、音声を他の音から区別するメトリクスをモニタしてもよい。このようなメトリクスには、例えば、バックグラウンドノイズに対するスピーチバンド内のエネルギーや、スピーチバンド内のエントロピー(スペクトル構造の指標)の検出などがある。ある実施形態では、空間プロセッサ566は、音声存在確率を決定するように構成されてもよく、そのような機能性の例は、2018年5月18日に出願された、「Linear Filtering for Noise-Suppressed Speech Detection(ノイズを抑制した音声検出用のリニアフィルタ)」と題された米国特許出願第15/984,073号明細書、および2018年9月29日に出願された、「Linear Filtering for Noise-Suppressed Speech Detection via Multiple Network Microphone Devices(複数のネットワークマイクロフォンデバイスを介してのノイズを抑制した音声検出用のリニアフィルタ)」と題された米国特許出願第16/147,710号明細書に開示されており、それらの記載内容の全体は、それをここで参照することにより本明細書に組み込まれるものとする。
ウェイクワードエンジン570は、受信したオーディオを監視および分析して、オーディオ内にウェイクワードが存在するかどうかを判断するように構成されている。ウェイクワードエンジン570は、ウェイクワード検出アルゴリズムを用いて、受信したオーディオを分析してもよい。ウェイクワードエンジン570がウェイクワードを検出した場合、ネットワークマイクロフォンデバイスは、受信したオーディオに含まれる音声入力を処理する。一例では、ウェイクワード検出アルゴリズムは、オーディオを入力として受け入れ、オーディオの中にウェイクワードが存在するかどうかの表示を行う。種々の第一者や第三者によるウェイクワード検出アルゴリズムが知られており、市販もされている。例えば、音声サービスの運営者は、そのアルゴリズムを第三者の機器で使用できるようにすることができる。また、特定のウェイクワードを検出するようにアルゴリズムを学習させることもできる。
ある実施形態では、ウェイクワードエンジン570は、受信したオーディオに対し、複数のウェイクワード検出アルゴリズムを同時に(または実質的に同時に)実行する。上述したように、異なる音声サービス(AMAZON(登録商標)のAlexa(登録商標)、APPLE(登録商標)のSiri(登録商標)、MICROSOFT(登録商標)のCortana(登録商標)、GOOGLE(登録商標)のAssistantなど)は、それぞれの音声サービスを開始するため、それぞれ異なるウェイクワードを使用している。複数のサービスをサポートするため、ウェイクワードエンジン570は、サポートされている各音声サービスのウェイクワード検出アルゴリズムを通して、受信したオーディオを並行して実行してもよい。そのような実施形態では、ネットワークマイクロフォンデバイス103は、音声入力を適切な音声アシスタントサービスに渡すように構成されたVASセレクタコンポーネント574を含んでもよい。他の実施形態では、VASセレクタコンポーネント574は省略してもよい。ある実施形態では、MPS100の個々のNMD103は、それぞれのVASに関連した個々に異なるウェイクワード検出アルゴリズムを実行するように構成されてもよい。例えば、リビングルームの再生装置102a、102bのNMDは、AMAZON(登録商標)のALEXA(登録商標)に関連付けられ、対応するウェイクワード検出アルゴリズムを実行するように構成されていてもよく(例えば、ウェイクワード「Alexa」または他の関連するウェイクワードを検出するように構成されている)、一方、キッチンの再生装置102fのNMDは、GOOGLEのアシスタントに関連付けられ、対応するウェイクワード検出アルゴリズムを実行するように構成されていてもよい(例えば、ウェイクワード「OK, Google」または他の関連するウェイクワードを検出するように構成されている)。
いくつかの実施形態では、ネットワークマイクロフォンデバイスは、特定のユーザの認識または家庭に関連する複数のユーザを認識するように訓練された音声認識を実行することなどにより、音声処理をさらに容易にするように構成された音声処理コンポーネントを含むことができる。音声認識ソフトウェアは、特定の音声プロファイルに合わせて調整可能な音声処理アルゴリズムを実装することができる。
動作において、1つまたは複数のバッファ568(そのうちの1つまたは複数は、メモリ213(図2A)の一部であってもよいし、メモリ213とは別個であってもよい)は、検出されたサウンドSDに対応するデータをキャプチャする(取り込む)。より具体的には、1つまたは複数のバッファ568は、上流側にあるAEC564および空間プロセッサ566によって処理され検出されたサウンドデータを捕捉する。
一般に、検出されたサウンドのデータは、マイクロフォン222によって検出されたサウンドのデジタル信号SDS(すなわち、サウンドデータストリーム)を形成する。実際には、サウンドデータストリームSDSは様々な形態をとる。一例としては、サウンドデータストリームSDSはフレームで構成されてもよく、フレームの各々は1つ以上のサウンドサンプルを含んでもよい。フレームは、NMD503のウェイクワードエンジン570および音声抽出器572などの下流側のコンポーネントによる更なる処理のために、1つまたは複数のバッファ568からストリーミングされてもよい(すなわち、読み出される)。
ある実施形態では、少なくとも1つのバッファ568は、最も最近に捕捉された検出サウンドデータの所定の量(すなわち、所定のウィンドウ)が少なくとも1つのバッファ568に保持される一方で、古い検出サウンドデータがウィンドウから外れたときに上書きされ、このようなスライディングウィンドウアプローチを利用して検出サウンドデータを捕捉する。例えば、少なくとも1つのバッファ568は、ある期間でサウンドの標本として20フレームを一時的に保持することができ、期間終了後に最も古い一つのフレームを廃棄し、その後、新しい一つのフレームをキャプチャして、19個あるサウンドの標本に続いて新しいフレームを追加することができる。
実際には、サウンドデータストリームSDSが複数のフレームで構成されている場合、それらのフレームは、様々な特徴を持つ様々な形態をとることができる。1つの可能性として、フレームは、サンプリングレート(例えば、44,100Hz)に基づいた所定の分解能(例えば、16ビットの分解能)を有するオーディオフレームの形態をとることができる。さらに、または代替的に、フレームは、フレームが定義する所定の音響標本に対応する情報、例えば、所定の音響標本の周波数応答、電力入力レベル、S/N比、マイクチャネルの識別、および/または他の情報を示すメタデータ等を含んでもよい。したがって、ある実施形態では、フレームは、サウンドの部分(例えば、所定のサウンドの標本の1つ以上のサンプル)と、そのサウンドの部分に関するメタデータとを含んでもよい。他の実施形態では、フレームは、サウンドの一部分のみ(例えば、所定のサウンドの標本の1つ以上のサンプル)またはサウンドの一部分に関するメタデータのみを含んでもよい。
音声プロセッサ560はまた、少なくとも1つのルックバックバッファ569を含み、これは、メモリ213(図2A)の一部であってもよいし、メモリ213とは別であってもよい。動作において、ルックバックバッファ569は、マイクロフォン222から受信した検出サウンドデータSDに基づいて処理されたサウンドのメタデータを格納することができる。上述したように、マイクロフォン224は、アレイ状に配置された複数のマイクロフォンを含むことができる。サウンドメタデータは、例えば以下のものを含むことができる。(1)アレイの個々のマイクロフォンの周波数応答データ、(2)エコーリターンロス強化指標(すなわち、各マイクロフォンの音響エコーキャンセラー(AEC)の有効性の指標)、(3)音声方向指標、(4)アービトレーション統計(例えば、異なるマイクロフォンに関連する空間処理ストリームの信号と雑音の推定値)、および/または(5)音声スペクトルデータ(すなわち、音響エコーキャンセレーションおよび空間処理が実行された後に処理された音声出力で評価された周波数応答)。また、検出されたサウンドデータSDのノイズを識別および/または分類するために、他のサウンドメタデータが使用されることもある。ある実施形態では、ルックバックバッファ569からネットワークインターフェース224に延びる矢印で示される様に、サウンドメタデータは、サウンドデータストリームSDSとは別に送信されてもよい。例えば、サウンドメタデータは、ルックバックバッファ569から、サウンドデータストリームSDSを受信するVASとは別の1つまたは複数のリモートコンピューティングデバイスに送信されてもよい。ある実施形態では、例えば、以下で詳しく説明するように、ノイズ分類器を構築または修正するため、また分析のために、メタデータをリモートサービスプロバイダに送信することができる。
図7~図13でより詳細に説明するように、ある実施形態では、リモートコンピューティングデバイス106cまたはローカルNMD503は、サウンドデータストリームSDSの下流側での処理に影響を与える(例えば、悪影響を与える)可能性のあるノイズを識別および/または分類するために、サウンドメタデータに対して追加の計算を実行することができる。
いずれにしても、NMD503の構成要素であって、音声処理装置560の下流側にあるものは、サウンドデータストリームSDSを処理してもよい。例えば、ウェイクワードエンジン570は、1つ以上の識別アルゴリズムをサウンドデータストリームSDS(例えば、ストリームされたサウンドフレーム)に適用して、検出されたサウンドSD内の潜在的なウェイクワードを検出するように構成することができる。ウェイクワードエンジン570が潜在的なウェイクワードを検出すると、ウェイクワードエンジン570は、「ウェイクワードイベント」(「ウェイクワードトリガー」とも呼ばれる)の指示を信号SWの形で音声抽出器572に提供することができる。
ウェイクワードイベントに応答して(例えば、ウェイクワードイベントを示すウェイクワードエンジン570からの信号SWに応答して)、音声抽出器572は、サウンドデータストリームSDSを受信してフォーマットする(例えば、パケット化する)ように構成される。例えば、音声抽出部572は、サウンドデータストリームSDSのフレームをメッセージにパケット化する。音声抽出器572は、音声入力を含む可能性のあるこれらのメッセージMVを、ネットワークインターフェース218を介して、VAS190(図1B)などのリモートVASにリアルタイムまたはほぼリアルタイムで送信またはストリーミングする。
VASは、NMD503から送信されたメッセージMVに含まれるサウンドデータストリームSDSを処理するように構成されている。具体的には、VASは、サウンドデータストリームSDSに基づいて、音声入力を識別するように構成されている。図6Aによると、音声入力680は、ウェイクワード部分680aおよび声の発話部分680bを含んでいる。ウェイクワード部分680aは、ウェイクワードイベントの原因となった検出音に対応している。例えば、ウェイクワード部分680aは、ウェイクワードエンジン570がウェイクワードイベントの指示を音声抽出器572に提供する原因となった検出音に対応する。発話部680bは、ウェイクワード部分680aに続く、ユーザの要求を構成すると思われる部分の検出されたサウンドに対応する。
例として、図6Bは、例示的な第1の音標本を示す。この例では、音標本は、サウンドデータストリームSDS(例えば、1つまたは複数のオーディオフレーム)の内の図6Aのウェイクワード680aの部分に対応する。図示されているように、例示された第1の音標本は、再生装置102iの環境で検出された音から構成され、(i)ウェイクワードが話される直前の部分(時刻t0とt1の間)、(ii)ウェイクワードが話されている間の部分(時刻t1とt2の間)、および/または(iii)ウェイクワードが話された後の部分(時刻t2とt3の間)を有する。他の音標本も可能である。
通常、VASは、最初に、サウンドデータストリームSDS内のウェイクワード部分680aを処理して、ウェイクワードの存在を検証することができる。場合によっては、VASは、ウェイクワード部分680aが偽のウェイクワードを含むと決定することができる(例えば、単語「アレクサ」がターゲットウェイクワードである場合の単語「エレクション」)。そのような場合、VASは、NMD503(図5)に応答を送信し、NMD503が音声データの抽出を停止するように指示することができ、これにより、音声抽出器572は、検出された音声データのさらなるストリーミングをVASに送ることを停止することができる。ウェイクワードエンジン570は、別の潜在的なウェイクワードを見つけて別のウェイクワードイベントが開始されることを期待して、サウンドの標本を捕えてモニタリングを再開または継続することができる。
ある実装形態では、VASは、ウェイクワード部分680aを処理または受信せず、代わりに、発話部分680bのみを処理することができる。単語は、特定のコマンドおよび特定のキーワード684(図6Aにおける、第1のキーワード684aおよび第2のキーワード684bとして個別に識別される)に対応し得る。キーワードは、例えば、MPS100内の特定のデバイスまたはグループを特定する音声入力680内の単語であり得る。 例えば、図示した例では、キーワード684は、「リビングルーム」や「ダイニングルーム」など、音楽が再生される1つまたは複数のゾーンを特定する1つまたは複数の単語であり得る(図1A)。
単語の意図を決定するために、VASは、通常、1つまたは複数のデータベース(図示せず)であって、VAS(図示せず)と関連したデータベースおよび/またはMPS100と関連したデータベースと通信する。そのようなデータベースは、自然言語処理および/または他の処理のための様々なユーザーデータ、分析、カタログ、および他の情報を格納することができる。ある実装形態では、そのようなデータベースは、音声入力処理に基づくニューラルネットワークの適応学習およびフィードバックのために更新され得る。場合によっては、発話部分680bは、図6Aに示されるように、ユーザによって話された単語間で検出された休止(例えば、非発話の期間)などの追加情報を含み得る。休止は、発話部分680b内でユーザによって話された別個のコマンド、キーワード、または他の情報の位置を区切ることができる。
特定のコマンド基準に基づいて、VASは、コマンド682などの音声入力内の1つまたは複数のコマンドを識別した結果としてアクションをとることができる。コマンド基準は、音声入力内の特定のキーワード群に含まれているものに基づく場合があり、他の可能性もある。さらに、または代わりに、コマンドのコマンド基準は、1つまたは複数の特定のコマンドの識別と併せて、1つまたは複数の制御状態変数および/またはゾーン状態変数の識別に係ることもある。制御状態変数は、例えば、音量のレベルを識別するインジケータ、1つまたは複数のデバイスに関連付けられたキューを識別するインジケータ、およびデバイスがキューを再生しているか、一時停止しているかなどの再生状態を識別するインジケータ含み得る。ゾーン状態変数には、たとえば、どのゾーンプレーヤーがグループ化されているかを識別するインジケータが含まれる場合がある。
音声入力を処理した後、VASは、音声入力から決定された意図に基づいて1つまたは複数のアクションを実行するための命令を伴う応答をMPS100に送信することができる。例えば、音声入力に基づいて、VASは、MPS100に指示して、再生デバイス102のうちの1つまたは複数で再生を開始すること、これらのデバイスのうちの1つまたは複数を制御すること(例えば、音量を上げる/下げる、デバイスをグループ化する/グループ解除する、など)、特定のスマートデバイスをオン/オフすること、その他のアクションを実行することができる。VASからの応答を受信した後、ウェイクワードエンジン570、NMD 503は再稼働して、上記のように、別の潜在的なウェイクワードを発見するまで、サウンドデータストリームSDSを監視し続けることができる。
図5を参照すると、マルチVASの実装では、NMD503は、VASセレクタ574(破線で示す)を含んでいてもよい。VASセレクタ574は、一般に、音声抽出器による音声データストリームSDSの抽出および送信を適切なVASに指示するように構成される。この指示は、あるウェイクワードが、第1のウェイクワードエンジン570a、第2のウェイクワードエンジン570b、または追加のウェイクワードエンジン571などの特定のウェイクワードエンジンによって識別されたときになされる。そのような実施形態では、NMD503は、複数の異なるウェイクワードエンジンおよび/または音声抽出器を含むことができ、各ウェイクワードエンジンや音声抽出器は特定のVASによってサポートされる。上記の議論と同様に、各ウェイクワードエンジンは、1つまたは複数のバッファ568からサウンドデータストリームSDSを入力として受信し、識別アルゴリズムを適用して、適切なVASに対してウェイクワードトリガーを引き起こすように構成される。したがって、一例として、第1のウェイクワードエンジン570aは、ウェイクワード「アレクサ」を識別し、「アレクサ」が検出されたときにNMD503にAMAZON用のVASを呼び出させるように構成される。別の例として、第2のウェイクワードエンジン570bは、ウェイクワード「オーケー、グーグル」を識別し、「オーケー、グーグル」が検出されたときにNMD503にGOOGLE用のVASを呼び出すように構成される。VASが一つしかない実施形態では、VASセレクタ574は省略される。
追加のまたは代替の実装形態では、NMD503は、リモートVASの支援なしにNMD503が動作する他の音声入力識別エンジン571(破線で示される)を含む。一例として、そのようなエンジンは、検出されたサウンド内において、特定のコマンド(例えば、「再生」、「一時停止」、「オンにする」など)や特定のキーワードまたはフレーズ、例えば、ある再生装置に割り当てられたユニークな名前(「本棚」、「パティオ」、「オフィス」など)を識別することができる。これらのコマンド、キーワード、および/またはフレーズの1つまたは複数を識別することに応答して、NMD503は、音声処理コンポーネント216(図2A)に1つまたは複数のアクションを実行させる信号(図5には示されていない)を通信することができる。例えば、ユーザが「ねえソノス、オフィスでの音楽を止めなさい」と言えば、NMD503は、信号を、直接的に、またはMPS100の他の1つまたは複数のデバイスを介して間接的に、オフィス再生デバイス102nに伝達し、オフィスデバイス102nはオーディオ再生を停止する。リモートVASからの支援の必要性を減らすかなくすと、音声入力をリモートで処理するときに発生する可能性のある遅延を減らすことができる。使用される識別アルゴリズムによっては、先行するウェイクワードが含まれることなく話されたコマンドを識別するように構成することもできる。例えば、上記の例では、NMD503は、ユーザが最初に「ねえソノス」または別のウェイクワードを言わずに、オフィスで音楽を停止するイベントをトリガーする識別アルゴリズムを採用することができる。
III.ノイズ分類に基づいてNMD操作を変更するためのシステムと方法の例
動作において、NMDは、交通、器具(例えば、ファン、流し、冷蔵庫など)、建設、干渉するスピーチなどの様々な異なるタイプのノイズにさらされる可能性がある。このようなノイズが存在する場合にキャプチャされたオーディオ入力をより適切に分析するには、オーディオ入力のノイズを分類することが望まれる。異なるノイズ源は異なるサウンドを生成し、それらの異なるサウンドはサウンドメタデータ(例えば、周波数応答、信号レベルなど)について異なった特性を有する。さまざまなノイズソースに関連付けられたさまざまなサウンドメタデータには、あるノイズソースを別のノイズソースから区別するシグネチャ(個性)を認めることができる。したがって、サウンドメタデータを分析し、異なるシグニチャを識別することにより、異なるノイズ源を分類することができる。図7は、4つのノイズ源に関連して分析されたサウンドメタデータを示す。左上のプロットは、NMDから3フィート離れ、高い位置に設定されたファンのノイズであり、右上のプロットは環境ノイズであり、左下のプロットは、NMDから3フィート離れたランニングシンク(流し台)のノイズであり、右下のプロットは、NMDから3フィート離れたところにある料理の焼ける音である。ある実施形態では、プロットに表示されるこれらのシグネチャは、信号の主要成分の分析を使用して生成することができる。図10~図13により詳細に説明するように、種々のNMDから収集されたデータは、可能な周波数応答スペクトルの全体的な分布を提供することができる。一般的に、主要成分の分析(PCA)を用いて、すべてのフィールドデータの分散を記述する直交基底を見つけることができる。この固有空間は、図7のプロットに示されている等高線に反映されている。プロットにおける各ドットは、固有空間に投影される既知のノイズ値(たとえば、注目のノイズ源にさらされたNMDからの単一の周波数応答スペクトル)を表わす。図7に示すように、これらの既知のノイズ値は、固有空間に投影されるとクラスター化され、さまざまなノイズ源に対してさまざまに異なるシグネチャ分布を生成する。以下でより詳細に説明するように、このノイズの分類を使用して、NMDのパフォーマンスを向上させることができる。
上述したように、NMD503などのネットワークマイクロフォンデバイスは、NMDの1つまたは複数のマイクロフォンによって捕捉された検出サウンドにおける音声入力の識別および処理に影響を与える種々の調整可能なパラメータを有することができる。検出されたサウンドに含まれるノイズを分類したことに応じて、これらのパラメータの1つまたは複数を変更し、デバイスの性能を向上させることができる。例えば、検出されたサウンドに含まれるノイズを分類することに対応して、処理中のサウンドデータに適用されるゲインを上げたり下げたりする調整をして、音声検出を向上させることができる。ある例では、NMDは、検出されたサウンドデータのノイズを分類することに基づいて、食洗器が動作していることを検出することができる。これに応答して、NMDは、NMDを介して再生される音声のゲインを上げるか、又は音量レベルを上げてもよい。NMDが、食洗器がもはや実行されていないことを検出すると(例えば、検出されたサウンドデータにおいてそれまで分類されていたノイズをもはや識別しないことにより)、再生が以前の音量レベルに戻るように、ゲインレベルを下げることができる。
もう1つの調整可能なパラメータはノイズ低減であり、例えば、NMDがサウンドデータまたはサウンドデータストリームを処理してノイズを低減したり、S/N比を改善したりする範囲を変更することができる。また、NMDは、(例えば、図5のAEC564の動作を変更することで)アコースティックエコーキャンセレーション(AEC)パラメータを変更したり、音声プロセッサ560や他のNMDコンポーネントの他のパラメータを変更したりしてもよい。さらに別の例として、NMDの空間処理アルゴリズムを変更してもよい。例えば、音声処理パスは、ノイズの少ない環境のためにマイクチャンネルの数を減らすことができる。特に、NMDが、検出されたサウンドデータに低レベルのノイズが存在すると判断した場合、NMDの1つまたは複数のマイクをオフにしたり、電源を落としたり、またはその他の方法で破棄して、下流側の処理がそれらのマイクからの入力に依存しないようにすることができる。ある側面では、マイクロフォンチャネルの数を減らすことで、計算資源の需要を減らし、節約することができる。これに関連して、計算機資源を節約することで、これらの資源を他の資源、例えば、NMDに搭載されているか、または他の方法で結合されている追加のウェークワードエンジンをサポートするために使用することができる。その後、NMDがノイズレベルの上昇を検出した場合(例えば、NMDが検出されたサウンドデータの中に特定のノイズを識別した場合)、非活性化されたマイクロフォンの一部またはすべてが再び活性化されることがある。NMDの1つまたは複数のマイクロフォンの選択的な非活性化に関する詳細な説明は、米国出願第16/147,710号に記載されており、参照することによりその全体が本明細書に組み込まれる。
別の調整可能なパラメータは、ウェイクワード検出感度パラメータである。例えば、ウェイクワードエンジン570(または追加のウェイクワードエンジン571のいずれか)は、音声入力中のウェイクワードを識別するための感度または閾値を調整する1つまたは複数のパラメータを有してもよい。このパラメータを調整することで、分類されたある種のノイズが存在する場合のNMD性能を向上させることができる。閾値を下げる(または感度を上げる)と、偽陽性の割合が増え、偽陰性の割合が減る。逆に、しきい値を上げる(感度を下げる)と、偽陽性の割合が減り、偽陰性の割合が増える。ウェークワード検出感度パラメータを調整することで、NMDが経験する特定のノイズ条件に応じて変化する、偽陰性率と偽陽性率の間の適切なトレードオフを達成することがでる。
上記のパラメータに加えて、または代わりに、ある実施形態では、NMDは、分類されたある種のノイズの存在下で音声入力を検出および処理する際の性能を向上させるために、空間処理アルゴリズムを変更する(例えば、図5の空間プロセッサ566の動作を変更する)ことができる。ある実施形態において、空間処理アルゴリズムは、1つまたは複数のマルチチャネルウィナーフィルタ、その他のフィルタ、および/または1つまたは複数のビームフォーミングアルゴリズムを含むことができ、これらの詳細は、例えば、先に参照した米国特許の出願番号15/984,073および16/147,710に記載されている。1つの可能性として、空間プロセッサ566は、音声を他の音から区別するメトリクスをモニタすることができる。このようなメトリクスには、例えば、背景雑音に対する音声帯域内のエネルギーや、音声帯域内のエントロピー(スペクトル構造の測定値)が含まれ、これらは、一般的な背景雑音よりも音声では一般的に低い。ある実装形態では、空間プロセッサ566は、音声存在確率を決定するように構成されてもよい。これらの指標に関連する閾値または係数(例えば、特定の帯域内のエネルギー、エントロピーなど)は、分類されたある種のノイズがある場合に音声入力を検出して処理する際のNMDの性能を向上させるために調整することができる。例えば、冷蔵庫のブーンという音がノイズとして識別され、NMDによって分類される。この分類に対応して、マルチチャネルウィーナーフィルタの空間処理アルゴリズムの1つまたは複数のパラメータを調整して、このノイズの存在下でのNMDのパフォーマンスを向上させることができる。このようなパラメータには、マルチチャンネルウィナーフィルタのノイズ除去部分のスペクトルフロアを反映した最小ゲインを含めることができる。マルチチャンネルウィナーフィルタの他のパラメータを変更することで、NMDの性能を向上させることができる。
種々の実施形態において、NMDの性能パラメータは、個々のデバイスの個性に応じて、家庭または環境(例えば、ある家庭内のすべてのNMDを一まとめにした環境)に応じて、または人の密集状態(例えば、所定の地域のすべてのNMDを一まとめにした状態)に応じて調整することができる。詳細は後述するが、1つ以上のNMD性能パラメータは、サウンドメタデータを用いて導き出されるノイズの分類に基づいて変更することができる。サウンドメタデータは、NMDの個々のマイクロフォンを介して得られたサウンドデータSDから、および/または、ボイスプロセッサ560(図5)によって提供されたサウンドデータストリームSDSから得ることができる。サウンドメタデータは、以下を含む:(1)周波数応答データ;(2)エコー・リターン・ロス・エンハンスメント・メジャー(音響エコーキャンセラー(AEC)の効果を示す指標);(3)音声方向の測定値;(4)アービトレーション統計値(例えば、異なるマイクロフォンに関連する空間処理ストリームの信号およびノイズの推定値)、および/または(5)音声スペクトルデータ(すなわち、音響エコーキャンセレーションと空間処理が実行された後に処理された音声出力で評価された周波数応答)。
図8Aは、ノイズを分類し、ネットワークマイクロフォンデバイスのパフォーマンスを修正するための例示的な方法800を示す。方法800は、ブロック802で、NMDがNMDの個々のマイクロフォンによりサウンドを検出する。次に、方法800はブロック804に進み、NMDは検出されたサウンドを少なくとも第1のバッファに取り込む。例えば、キャプチャしたサウンドをサウンドデータSDとしてバッファ(複数可)568(図5)に格納する。
ブロック806において、NMDは、サウンドデータに関連するメタデータを少なくとも第2のバッファに取り込む。例えば、サウンドメタデータは、ルックバックバッファ569(図5)や、NMDに関連する他のメモリに格納することができる。上述したように、ユーザのプライバシーを守るため、オリジナルのオーディオコンテンツ(例えば、録音された音声そのもの内容やその他の検出されたサウンドデータそのもの)を明らかにしないサウンドメタデータのみに頼ることが有効である。このようなサウンドメタデータの例としては以下を含む。(1)周波数応答データ;(2)エコー・リターン・ロス・エンハンスメント・メジャー;(3)音声方向の測定値;(4)アービトレーション統計値;(5)音声スペクトルデータ。また、他のサウンドメタデータもキャプチャされ、第2バッファに保存される。
次に、方法800は、ブロック808において、検出された音を分析してトリガイベントを検出する。ある実施形態では、トリガーイベントは、ウェイクワードの検出である。ウェイクワードは、例えば、上述したウェイクワードエンジン570(図5)を介して検出することができる。ある実施形態では、トリガーイベントは他の形態をとることができる。例えば、トリガーイベントは、いくつかの指定された特性を有するオーディオ信号(例えば、検出されたオーディオの音量が所定の閾値以上であるオーディオ信号、検出された長さが所定の長さの時間であるオーディオ信号、など)の検出であることができる。
トリガーイベントを検出した後、方法800は、ブロック810において、NMDを介して音声入力を抽出する。例えば、音声抽出器572(図5)は、サウンドデータのストリームを受信し、ネットワークインタフェースを介してリモートVASまたは他のリモートコンピューティングデバイスにリアルタイムまたはほぼリアルタイムで送信されるようにメッセージにフォーマット(例えば、パケット化)する。
方法800のブロック812では、検出された音の中のノイズを分類するために、サウンドのメタデータを分析する。この分析は、NMDがローカル(自分自身)で行うこともでき、又は1つ以上のリモートコンピューティングデバイスでリモートに(遠隔的に)行うこともできる。ある実施形態では、ブロック812の分析は、ブロック808のトリガー・イベント検出と同時に行うことができる。別の実施形態では、ブロック812での分析は、ブロック808でトリガーイベントが検出された後にのみ行われる。
サウンドメタデータの分析は、サウンドメタデータの1つまたは複数の特徴を、既知のノイズの基準値と比較すること、または既知のノイズのサンプル集団データと比較することができる。例えば、信号レベル、周波数応答スペクトルなどのサウンドメタデータのあらゆる特徴は、ノイズの基準値や、サンプル集団を収集し平均した値と比較することができる。ある実施形態では、サウンドメタデータの分析は、NMDの集団から寄せ集められた周波数応答スペクトルに対応する固有空間に、周波数応答スペクトルを投影することを含む(図10~図13でより詳細に説明する)。少なくともある実施形態では、周波数応答スペクトルを固有空間に投影することは、下流側の分類を容易にするための前処理ステップとして実行できる。ある実施形態では、サウンドメタデータを使用してノイズを分類するため、種々の異なる技術を使用することができ、例えば、決定木を使用した機械学習、またはベイジアン(Bayesian)分類器、ニューラルネットワーク、または他の任意の分類技術を使用することができる。更に、代替的または追加的に、K-Meansクラスタリング、Mean-Shiftクラスタリング、期待値最大化クラスタリング、または他の適切なクラスタリング技術など、さまざまなクラスタリング技術を使用することができる。
ある実施形態では、ノイズ基準サンプルは、制御された条件下でサンプルをキャプチャする(例えば、NMDに対して異なる位置にあるファンからのオーディオ入力をキャプチャする)ことによって、または既知のノイズ条件を模倣するように設計されたシミュレーションから得ることができる。また、別の方法として、ユーザが入力した情報をもとに、ノイズリファレンスサンプルを取得することもできる。例えば、キッチンのシンクをつける、天井のファンをつけるなど、あらかじめ特定された音を発生させるように、ユーザが(例えば、制御装置104を介して)指示され、NMD503は、発生されるオーディオ入力を記録することができる。ユーザの操作により発生させた異なる条件下でのオーディオ入力をキャプチャすることで、種々のノイズ基準値を取得し、NMD503にローカルとして、またはコンピューティングデバイスにリモートとして保存することができる。
図8Bおよび図8Cは、事前に特定されたノイズを生成し、ノイズ測定値をユーザ入力として受信するためのコントローラインタフェースを示す。図8に示すように、特定のNMD(ここでは「プレーヤーA」)について、ユーザはあらかじめ入力された集合リストの中からデバイスの位置を選択することができる。特定の場所(例えば「キッチン」)が選択されると、様々な潜在的なノイズの源が、ユーザによって選択可能なオプションとして表示される。図8Bに示すように、「キッチン」に関連するノイズオプションの例は、「蛇口」、「換気扇」、「皿洗い器」、「その他」である。同様に、他の場所については他の関連するノイズオプションがあり、例えば「ガレージ」については、ガレージドアの開閉、ガレージ用の洗濯機等がある。
更に、ユーザが選択したノイズ源に加えて、ある異なる場所に対しては、可能性の高いノイズ源が関連付けされており、用途選択が必要とされない場合もある。例えば、ユーザがNMDの位置としてキッチンを指示した場合、当然に検出されるサウンドとして、油などの食材を切る調理音や、冷蔵庫の扉を閉める音など、キッチンに関連する音が含まれる。同様に、他の位置では、その場所に固有と思われる他の関連ノイズを持つことができ、例えば、子供部屋では子供の声、バスルームではトイレの水流の音などがある。NMDの位置を特定することで、ユーザは種々の機器で検出されるべきノイズを分類するための追加の関連情報を準備しておくことができる。
図8Cでは、ユーザがコントローラインタフェースを介してノイズ源として「蛇口」を選択している。この選択に続いて、ユーザは蛇口をオンにするよう促される。すると、ユーザはノイズの発生を開始したことを示すと(例えば、ユーザが蛇口をひねると)、NMDはサウンドデータおよび/またはメタデータを収集する。このデータは蛇口によるノイズとして関連付けされるので、このNMDや他の機器において、今後のオーディオ入力に含まれるノイズの分類を助けるために使用することができる。ある実施形態においては、ユーザは、指定された音(例えば、蛇口をひねることによる音)を何回も、そして異なる条件下で繰り返すように促されてもよい。さらに、ノイズ源に関連する追加情報、例えば、ノイズ源が発生されると思われる頻度(「皿洗い器をどのくらいの頻度で動かすか」など)、特定の家電製品のメーカやモデルなどについて、ユーザに質問し応答を受けるようにすることができる。このような情報やその他の関連情報は、図8Bおよび図8Cに示すように、ユーザがコントローラインタフェースを介してやり取りすることができる。このようにしてオーディオ入力をキャプチャすると、既知のノイズリファレンスとして、ローカルなNMDに、またはリモートのコンピューティングデバイスに保存することができるため、収集した情報はノイズ分類の改善に使用することができる。
図8Aに戻り、方法800のブロック814において、NMDの性能はブロック812における評価に基づいて修正される。NMDの修正は、分類されたノイズに応じて様々な形で行われる。例えば、デバイスの修正には、再生音量の調整、固定ゲインの調整、ノイズリダクションパラメータの変更、ウェイクワード検出感度パラメータの変更、空間処理アルゴリズムの調整などが含まれる。ある実施形態においては、NMDは、特定の分類されたノイズに応じて種々の性能パラメータを変更するように構成することができる。
ブロック816では、ブロック812で得られた特定のノイズ分類に基づいて、ノイズ分類器を更新することができる。詳細は後述するが、ノイズ分類器は、検出されたサウンドデータやメタデータに含まれるさまざまなタイプのノイズを識別するように構成されたニューラルネットワークやその他の数学的モデルを含むことができる。このようなノイズ分類器は、学習と評価のための利用可能なデータを増やすことで改善することができる。したがって、多数のNMDからノイズデータを取得し、新たなノイズ分類やその他のノイズデータを取得するたびに、ノイズ分類器の更新や修正を行うことができる。また、多数のNMDから収集したデータを用いることで、個々のノイズの相対的な優劣を評価し、ノイズ分類器の更新に利用することができる。ある実施形態では、メタデータがノイズ分類器に有用な追加情報を提供しない場合や、メタデータが異常と思われる場合など、ブロック812で得られた分類に基づいてノイズ分類器を更新しない場合もある。
図9は、例示的なノイズ分類およびマイクロフォン適応の機能フローチャート900である。フローチャート900は、NMD503上で発生する機能だけでなく、例えば、以下でより詳細に説明するように、ノイズ分類のためのサウンドメタデータの遠隔評価および処理を行うことができる遠隔コンピューティングデバイス(複数可)106c上で発生することができる機能を示している。一例として、リモートコンピューティングデバイス106cは、1つまたは複数のSONOS Wireless HiFi Systemのクラウドサーバーを提供する。少なくともある実施形態では、フローチャート900に描かれた機能のいずれかまたはすべてを、リモートコンピューティングデバイス106cではなく、NMD503で実行することができる。
NMD503から始まり、個々のマイクロフォン242a~242nで構成されるアレイは、サウンドを検出し、複数のチャネル(例えば、各マイクロフォンに対応するチャネルを集めた複数のチャンネル)を介して音声プロセッサ560にサウンドデータを送る。図5で説明したように、音声プロセッサ560は、ルックバックバッファ569に加えて、1つまたは複数のバッファ568を含むことができる。また、音声処理装置560は、AEC564と空間プロセッサ566を含む。マイクロフォン242a~242nは、NMD503が置かれている環境下でサウンドを検出する。一例では、マイクロフォン(複数可)242a~242nは、NMD503に向かって来る1つ以上の方向からのオーディオを検出するように配置されている。マイクロフォン242a~242nは、さらに、オーディオ源(例えば、音声、聞き取り可能な音)の位置情報を捕捉するように設定され、および/または識別されたノイズのフィルタリングを支援するよう設定される。
音声プロセッサ560は、マイクロフォン242a~242nのそれぞれからのサウンドデータを、所定の時間のインターバルで1つ以上のバッファに格納することができる。例えば、ある実施形態では、音声プロセッサ560には、5秒未満、4秒未満、3秒未満、2秒未満、または1秒未満の間、バッファに上書きしつつなどしてサウンドデータを保存する。ある実施形態では、音声プロセッサ560は、スライディングウィンドウアプローチを利用して、最新に検出されたサウンドデータを所定の量(すなわち、所定のウィンドウに入る量)だけを少なくとも1つのバッファ568に保持される一方、古いサウンドデータはウィンドウから外れるときは上書きされてしまうようにサウンドデータを捕捉するバッファ(例えば、バッファ568)を含む。例えば、少なくとも1つのバッファ568は、所定の時間にサウンド標本の20フレームを一時的に保持し、満了時間後に最も古いフレームを廃棄し、その後、新しいフレームをキャプチャし、そのフレームを現に存在する19個のサウンド標本の最後に追加することができる。
音声プロセッサ560は、音データストリームをブロック905に出力し、イベントトリガが実行される。ここで、NMD503は、サウンドデータストリームを評価して、所定のトリガーイベントを検出する。例えば、ブロック905でのトリガーイベントの検出は、サウンドデータストリームにおけるウェイクワードの検出(例えば、図5に示すウェイクワードエンジン570を使用しての検出)である。ある実施形態では、トリガーイベントは他の形態をとることができる。例えば、トリガーイベントの検出は、何らかの特別な特性を持つオーディオ信号の検出(例えば、所定の閾値を超えるオーディオレベルの検出、所定の時間長さのオーディオ信号の検出など)とすることができる。ブロック905でトリガイベントが検出されない場合、音声プロセッサ560内で検出されたサウンドデータは、削除、廃棄、または上書きされ、マイクロフォン242a~242nは、新たに取得されたサウンドデータを音声プロセッサ560に渡し続け、これはブロック905でトリガイベントが検出されるまで続けられる。
ブロック905でトリガイベントが検出されると、サウンドデータストリームはデバイスの機能としてのブロック907に送られる。例えば、ブロック905でのトリガーイベントの検出に続いて、ブロック907では、複数のVASのうちの1つを選択することができ、処理された音声をさらなる処理のためにVASに送信することができ、可聴出力をユーザに提供することができ、関連する再生デバイスに指示を送信することができ、または他の任意の適切な動作を実行することができる。
ブロック905においてトリガイベントが検出されると、音声プロセッサ560に指示が送られ、音声プロセッサ560は、ブロック909におけるサウンドメタデータをリモートコンピューティングデバイス106cに送信することができる。サウンドメタデータ909は、マイクロフォン242a~242nからのサウンドデータに基づくものである。上述したように、ユーザのプライバシーを守るため、オリジナルのオーディオコンテンツ(例えば、録音された音声入力の内容やその他の検出されたサウンドデータ)を明らかにしないサウンドメタデータのみに頼るようにする。NMD503は、検出されたサウンドデータから、サウンドメタデータにアクセスしなければ元のサウンドデータを解読できないような方法で、サウンドメタデータを導出することができる。上述したように、サウンドメタデータの例としては、以下を含む。(1)周波数特性データ;(2)エコー・リターン・ロス・エンハンスメント・メジャー(音響エコーキャンセラー(AEC)の効果を示す指標);(3)音声方向の測定値;(4)アービトレーション統計値(例えば、異なるマイクロフォンに関連する空間処理ストリームの信号およびノイズの推定値)、および/または(5)音声スペクトルデータ(すなわち、音響エコーキャンセレーションと空間処理が実行された後に処理された音声出力で評価された周波数応答)。また、検出されたサウンドデータに含まれるノイズを識別および/または分類するために、他のサウンドメタデータが使用しても良い。
NMD503のブロック909から、サウンドメタデータがリモートコンピューティングデバイス106cのブロック911に送信され、そこでクラウド収集が成される。例えば、リモートコンピューティングデバイス106cは、1つまたは複数のNMDからサウンドメタデータデータを収集することができる。ある実施形態では、リモートコンピューティングデバイス106cは、NMDが複数集まった集団からサウンドメタデータを収集することができ、そのような集団からのメタデータは、ノイズを分類し、平均値を導出し、外れ値を識別し、種々にクラス分けされたノイズの存在下でもNMD503の動作を改善するためにNMD性能パラメータの修正を導くために使用することができる。サウンドメタデータは、サウンドデータから導出されるが、サウンドデータの復元を行わないため、サウンドメタデータのみをリモートコンピューティングデバイス106cに送信することで、サウンドデータが抽出された実際のオーディオコンテンツを暴露することなく、NMDの性能を評価することができる。
リモートコンピューティングデバイス106cのブロック913において、サウンドメタデータを分析し、ノイズを分類する。ある実施形態では、サウンドメタデータを分析には、サウンドメタデータの1つまたは複数の特徴を、ノイズの基準値またはサンプル集団の値と比較することを含む。例えば、サウンドメタデータのいずれかの特徴(周波数応答データ、信号レベルなど)は、図10~図13で詳細に説明するように、既知のノイズ基準値またはサンプル集団から収集した平均値と比較することができる。ある実施形態では、サウンドメタデータの分析は、リモートコンピューティングデバイス106cによって実行され評価されるよりも、またはそれとは別に、ブロック914に示すように、NMDによってローカルに実行されても良い。
引き続き図9を参照すると、コンピューティングデバイス106cのブロック915においては、種々のノイズが存在する条件下でも音声入力の検出および処理の改善ができるようにデバイス調整を、その必要性を認識し、モデリングを予測して実行することができる。例えば、仮想テストフレームワークを使って、モンテカルロ法を用いた多数のシミュレーションを行い、現実的にユーザが期待するNMDの性能を提供することができる。種々のノイズ成分(例えば、ノイズの種類(ファン、シンク、トラフィックなど)や、NMDに対するノイズ源の位置関係などに依存する)が含まれる一連のオーディオ入力に対し、異なる範囲のパラメータ値を持ち、異なる性能が発揮でき、シミュレーション済のNMDで処理することができる。そして、シミュレーション結果に基づいて、最も性能の良いパラメータ値を特定することができる。ある実施形態では、最良の性能が発揮されるパラメータは、少なくとも部分的に、ウェイクワード検出における偽陽性および偽陰性の割合によって決定される。このようにして特定された、性能を左右するパラメータは、実際に用いられるNMDの性能を改善するために使用される。これは、特定の種類のノイズ入力を経験するNMD(例えば、流水ノイズ、冷蔵庫のノイズ、交通のノイズなどを経験するNMD)に対してのみ、性能を左右するパラメータを更新することができる。
リモートコンピューティングデバイス106cのブロック917において、ブロック913でのノイズ分類および/またはブロック915での予測型モデリングに基づいて、NMD性能を修正する必要があるかどうかを判断する。修正の必要性がないと判断された場合、プロセスはブロック913のデータ解析に戻り、新たに受信したサウンドメタデータの解析を行う。判定ブロック917において、修正が必要であると判断された場合は、プロセスはブロック919に進み、NMDの動作調整を実行する。
ブロック919では、NMDの修正は、メタデータの識別された特徴に応じて、いくつかの形態をとることができる。例えば、再生音量の調整、固定ゲインの調整、ノイズリダクションパラメータの調整、ウェイクワード検出感度パラメータの調整、空間処理アルゴリズムの調整などがある。
図7および図10-図12は、NMDによってキャプチャされたオーディオ入力のノイズを分類するために、サウンドメタデータを既知のノイズ基準値と比較するアプローチの一例を示している。上述したように、ある実施形態では、NMDによってキャプチャされたサウンドメタデータは、周波数応答スペクトルを含むことができ、これはある時間に亙って平均化され、周波数軸に沿って対数的にサンプリングすることができる。
種々のNMDから収集したデータは、可能な周波数応答スペクトルの全体的な分布を示す。各スペクトルは、パワーの線形空間に変換することなく、すべてのスペクトルビンの平均値を差し引くことで正規化することができる。この操作により、スペクトルが垂直方向に変換されます。同じようなノイズ源のスペクトルはすべて同じような形をしているので、すべてのスペクトルはより狭い分布になる。このシンプルな操作により、全体の音量に起因する変動がなくなり、音量に依存しないノイズの分類が可能になる。
図10は、ファンの速度を変えたり、NMDからファンまでの距離を変えたりしてファンからのノイズを測定した結果について、類似したスペクトル形状であって垂直方向に変換された複数のスペクトル例を用いて示している。各グループは、特定の構成に対する測定値の分布を示す。この挙動は、ホワイトノイズやピンクノイズなど、よく知られたノイズタイプの挙動と一致しており、ノイズの全体的なスペクトル形状は、絶対的なレベルではなく、スペクトルのスロープによって特定される。このような周波数応答データの全体的な分布を生成するため、ユーザの自宅や制御された条件下で、複数のNMDを介して多くのスペクトルを収集する。
多数のNMDから得られたスペクトルデータには、各測定においては明確に判定できない多種多様な可能性のあるノイズタイプが含まれている。しかし、この多数の測定値を利用して、最も分散の大きい軸を特定することができる主成分分析(PCA)により、直交基底(固有空間)を定義することができる。例えば、現実に用いられている多数のNMDから収集した約1,000万個のスペクトルデータを用いて、マイクロフォンのスペクトルをスペクトルビンごとに平均化した後、上述のように正規化することができる。その後、PCAを用いて直交基底を定義することができる。図11は、固有空間を定義するいくつかの基底ベクトルの例を示す。5つの基底ベクトルが例示されているが、ある実施形態においては、基底ベクトルの数は、例えば、2つ、3つ、または4つの基底ベクトル、あるいは代替として、6つ、7つ、8つ、またはそれ以上の基底ベクトルなど、様々なものがある。
この操作により、行列のセットが生成される。
X = USVT
ここで、Xは、すべてのフィールドスペクトルを含む元のベクトル空間である。Uはユニタリー行列、Sは特異値の対角線行列である。VTは最高分散の軸を定義する固有ベクトルの行列である。
これらの固有ベクトル(例えば、図11に示された基底ベクトル)を用いて、新たに観測されたスペクトルNは、新たなスペクトルとこの基底との間でドットプロダクトを行う(N’=NV)ことにより、新たな空間に投影することができる。この計算により、各スペクトルの固有値が定義され、それは、これらの固有ベクトルと固有値の任意のサブセットの線形結合として再構成される。図12は、これらのスペクトルのうち、母集団の分布の変動を最もよく表す固有ベクトルのサブセットを用いて再構成したものを示す。図12に示すように、観測されたスペクトルでは、複数の離散的な周波数応答値が得られます。再構成されたスペクトルは、基底ベクトル(例えば、図11に示す基底ベクトル)の組み合わせを表しており、各基底ベクトルの強さは変化し、観測されたスペクトルに最も適合する。このように、再構成されたスペクトルは、観測されたスペクトルとほぼ一致する。動作において、新たに受信した周波数応答スペクトルは、基底ベクトルの線形結合(例えば、図11に示す基底ベクトル)を用いて再構成することができる。
現実に使用されているNMDが遭遇する可能性のあるすべてのノイズを分類することは、現実的ではない。しかし、上記の固有スペクトルのサブセットにおけるノイズの分布を可視化することができる。図13は、観測されたフィールドスペクトルの全体的な分布を、最初の2つの固有ベクトル(例えば、図11に示した基底ベクトルのうち、観測された分散に最も影響を与えた2つのベクトル)の強さとして示したものである。図13において、「特徴1」は、再構成されたスペクトル(例えば、図12に示す再構成されたスペクトル)における第1の固有ベクトルの強さであり、「特徴2」は、再構成されたスペクトル(例えば、図12に示す再構成されたスペクトル)における第2の固有ベクトルの強さである。図13のプロットでは、2つの特徴量(例えば、再構成されたスペクトルにおける2つの基底ベクトルの強さ)の値を示しているが、追加の特徴量の値を用いてノイズを分類することもできる。例えば、3つ、4つ、5つ、またはそれ以上の特徴を用い、それぞれが再構成されたスペクトルの異なる基底ベクトルの強さに対応する様にしてもよい。新たに観測されたスペクトルを付加的な特徴で評価することで、異なる種類のノイズをより容易に区別することができ、ノイズの分類が向上する。
現場で受ける混在したノイズの分離作業は、絶え間なく続ける必要があり、種々のノイズのクラスターが含まれているので、簡単には識別できない場合がある。これは、どの種類のノイズにおいてもばらつきが小さいので、領域間の識別性が低くなり、特定のノイズ領域を識別することが困難になっている。ノイズの分布は、シミュレーションソフトウェアを使って、記録された既知のノイズのセットを取り込んで、現場と同様の方法でスペクトルを生成することで、正確に表すことが可能であるが、これは制御された再現性の高い方法である。これらの既知のテストサンプルのスペクトルは、フィールドノイズの分布の中でその存在を追跡する「テスト点粒子」として固有空間に投影することができる。図7に示すプロットでは、フィールドの密度分布が等高線で示されており、個々の点はシミュレーションで実行されたテストサンプルで、パラメータ空間の異なる配置を示している。図7に見られるように、ノイズ源の違いによって、固有空間に投影される点のクラスターが異なる。
多数のNMDから収集したデータをこのように分析することで、種々のタイプのノイズの相対的な占有域を特定することができる。さらに、ニューラルネットワークを用いて分類器を構築し、1つ以上のNMDからの収集データのノイズを識別することができる。例えば、ニューラルネットワークは、母集団の固有空間に投影された既知のラベル付きノイズのセットを用い、学習することができる。これらの既知のラベル付けされた種々のノイズは、シミュレーションソフトウェアによって処理され、「アンビエント」、「ファン」、「シンク」、「干渉するスピーチ」などに分類された種々のラベルにグループ化され、多くの種類の典型的なノイズとして表すことができ、それぞれが、例えば、ノイズキャンセルアルゴリズムや他のオーディオ処理アルゴリズムを修正するように、NMDの性能パラメータを調整するための十分な有益情報を提供することができる。ある実施形態では、分類器を用いて、個別のデバイスについて、そのデバイスが受けるノイズの相対的な寄与をさらに分析することができる。例えば、あるデバイスが平均よりも高いレベルのファンノイズを受ける環境にあれば、そのNMDに合った特定の性能パラメータを用い、高いファンノイズに対応するように変更され、また、別のNMDについては、予想よりも高いレベルのトラフィックノイズを受ける環境にあればそれに対応した別の方法で調整される。
上記の例では、主成分分析を用いて種々のタイプのノイズの分類を実行させているが、分類プロセスは、他の技術やアルゴリズムを使用してもよい。例えば、決定木やベイジアン分類器、ニューラルネットワーク、その他の分類技術を用いた機械学習を採用しても良い。代替的または追加的に、K-Meansクラスタリング、Mean-Shiftクラスタリング、期待値最大化クラスタリング、または他の適切なクラスタリング技術など、さまざまなクラスタリング技術を使用することができる。
結論
以上の説明では、とりわけ、ハードウェア上で実行されるファームウェアおよび/またはソフトウェアを含む、さまざまな例示的なシステム、方法、装置、および製造品を開示した。上記の説明は単なる例示であり、限定的なものと解されるべきではない。例えば、ファームウェア、ハードウェア、および/またはソフトウェアの側面またはコンポーネントのいずれかまたはすべてが、ハードウェアのみ、ソフトウェアのみ、ファームウェアのみ、またはハードウェア、ソフトウェア、および/またはファームウェアの任意の組み合わせで具現化できることが企図されている。したがって、これらの例は、そのようなシステム、方法、装置、および製造品を実装する唯一の方法ではない。
据え置き型の再生装置に関してここで説明した例に加えて、本技術の実施形態は、ヘッドフォン、イヤフォン、または他のインイヤーまたはオーバーイヤー型の再生装置に適用することができる。例えば、このようなインイヤー式またはオーバーイヤー式の再生機器は、再生中にユーザが外部の騒音を感じるのを軽減するためのノイズキャンセリング機能を含むことができる。ある実施形態では、ノイズ分類を使用して、特定の条件下でノイズキャンセルを変調させることができる。例えば、ユーザがノイズキャンセリングヘッドフォンで音楽を聴いている場合、ユーザのドアベルが鳴ると、ノイズキャンセリング機能が一時的に無効になったり、制御能力をダウンしたりすることも可能である。また、ドアベルの音を検知して、再生音量を調整することも可能である。ドアベルの音を検出することで(例えば、受信したサウンドメタデータに基づいてドアベルを正しく分類することで)、ノイズキャンセリングヘッドフォンを装着していてもユーザがドアベルの音を聞くことができるように、ノイズキャンセリング機能を変更することができる。ここで説明したノイズ分類技術に基づいて、ヘッドフォンなどの性能パラメータを調整することにより、さまざまな他のアプローチに使用することができる。
ここでの説明は、例示的な環境、システム、手順、ステップ、論理ブロック、処理、についてなされており、更に他の象徴的に表されたものであって、ネットワークに接続されたデータ処理装置の動作に直接または間接的に類似したものについてなされている。このようなプロセスの説明や表現は、当業者が自分の仕事の本質を最も効果的に他の当業者に伝えるために使用される。ここでの説明を十分に理解できるために、多数の具体的な内容を記載している。しかし、ここで説明した特定の実施形態は、特定の具体的な詳細がなくても実施できることが当業者には理解される。他の例では、よく知られている方法、手順、コンポーネント、および回路は、実施形態の側面を不必要に不明瞭にすることを避けるため、詳細な説明は省略されている。したがって、本開示の範囲は、上述の実施形態の説明ではなく、添付の特許請求の範囲によって特定される。
添付の特許請求の範囲のいずれかが純粋にソフトウェアおよび/またはファームウェアの実装をカバーするように読まれる場合、少なくとも1つの例における要素の少なくとも1つは、ソフトウェアおよび/またはファームウェアを格納する、メモリ、DVD、CD、Blu-ray(登録商標)などの有形の非一過性媒体を含むように、ここで明示的に定義される。
本技術は、例えば、以下に説明する様々な側面に従って説明される。本技術の側面の様々な例は、便宜上、番号付きの例(1、2、3など)として説明される。これらは例示であり、本技術を制限するものではない。従属的な例のいずれも、任意の組み合わせで、それぞれの独立した例の中に入れることができる。他の例も同様の方法で示すことができる。
例1:ネットワークマイクロフォンデバイス(NMD)の1つ以上のマイクを介してサウンドを検出するステップと、検出されたサウンドに基づいてNMDの第1バッファにサウンドデータを取り込むステップと、NMDを介してサウンドデータを分析してトリガーイベントを検出するステップと、NMDの少なくとも第2バッファにサウンドデータに関連するメタデータを取り込むステップと、トリガーイベントを検出した後、サウンドデータ内のノイズを分類するためメタデータを分析するステップと、分類されたノイズに基づいてNMDの少なくとも1つの性能パラメータを修正するステップと、を含む方法。
例2:例1に記載の方法であって、メタデータを分析してサウンドデータ内のノイズを分類するステップは、メタデータを、既知のノイズイベントに関連する参照メタデータと比較することを含む、ことを特徴とする方法。
例3:例2に記載の方法であって、メタデータは、周波数応答スペクトルを含み、メタデータを参照メタデータと比較することが、周波数応答スペクトルを、NMDの集団から集約された周波数応答スペクトルに対応する固有空間に投影することを含む、ことを特徴とする方法。
例4:例1に記載の方法であって、NMDの少なくとも1つの性能パラメータを修正するステップは、NMDのウェイクワード検出感度パラメータを修正すること、NMDに関連する再生デバイスの再生音量を調整すること、またはNMDのノイズキャンセリングアルゴリズムを修正することのうちの少なくとも1つを含む、ことを特徴とする方法。
例5:例1に記載の方法であって、更に、NMDを介して、分類されたノイズに対応するデータを、広域ネットワークを介して1つまたは複数のリモートコンピューティングデバイスに送信するステップを含む、ことを特徴とする方法。
例6:例1に記載の方法であって、前記メタデータは、マイクロフォンの周波数応答データ、マイクロフォンのスペクトルデータ、アコースティックエコーキャンセレーション(AEC)データ、エコーリターンロスエンハンスメント(ERLE)データ、アービトレーションデータ、信号レベルデータ、または方向検出データのうちの少なくとも1つを含む、ことを特徴とする方法。
例7:例1の方法であって、前記サウンドデータは前記メタデータから導出できないことを特徴とする方法。
例8:ネットワークマイクロフォンデバイス(NMD)であって、1つまたは複数のプロセッサと、1つまたは複数のマイクロフォンと、1つまたは複数のプロセッサによって実行可能な命令を格納する有形の非一過性のコンピュータ可読媒体であって、再生デバイスに所定の動作を実行させるものを備えたNMDであり、所定の動作には次のステップを含む:
1つ以上のマイクロフォンを介してサウンドを検出するステップと、検出されたサウンドに基づいてNMDの第1バッファにサウンドデータを取り込むステップと、NMDを介してサウンドデータを分析してトリガーイベントを検出するステップと、NMDの少なくとも第2バッファにサウンドデータに関連するメタデータを取り込むステップと、トリガーイベントを検出した後、サウンドデータ内のノイズを分類するためメタデータを分析するステップと、分類されたノイズに基づいてNMDの少なくとも1つの性能パラメータを修正するステップ、
ことを特徴とする再生装置。
例9:例8の再生装置であって、メタデータを分析してサウンドデータ内のノイズを分類するステップは、メタデータを、既知のノイズイベントに関連する参照メタデータと比較することを含む、ことを特徴とする再生装置。
例10:例9の再生装置であって、メタデータは、周波数応答スペクトルを含み、メタデータを参照メタデータと比較することが、周波数応答スペクトルを、NMDの集団から集約された周波数応答スペクトルに対応する固有空間に投影することを含む、ことを特徴とする再生装置。
例11:例8の再生装置であって、NMDの少なくとも1つの性能パラメータを修正するステップは、NMDのウェイクワード検出感度パラメータを修正すること、NMDに関連する再生デバイスの再生音量を調整すること、またはNMDのノイズキャンセリングアルゴリズムを修正することのうちの少なくとも1つを含む、ことを特徴とする再生装置。
例12:例8の再生装置であって、更に、NMDを介して、分類されたノイズに対応するデータを、広域ネットワークを介して1つまたは複数のリモートコンピューティングデバイスに送信するステップを含む、ことを特徴とする再生装置。
例13:例8の再生装置であって、前記メタデータは、マイクロフォンの周波数応答データ、マイクロフォンのスペクトルデータ、アコースティックエコーキャンセレーション(AEC)データ、エコーリターンロスエンハンスメント(ERLE)データ、アービトレーションデータ、信号レベルデータ、または方向検出データのうちの少なくとも1つを含む、ことを特徴とする再生装置。
例14:例8の再生装置であって、前記サウンドデータは前記メタデータから導出できないことを特徴とする再生装置。
例15:ネットワークマイクロフォン装置(NMD)に所定の動作を実行させるために、1つ以上のプロセッサによって実行可能な命令を格納した有形、非一過性のコンピュータ可読媒体であって、所定の動作には次のステップを含む:
1つ以上のマイクロフォンを介してサウンドを検出するステップと、検出されたサウンドに基づいてNMDの第1バッファにサウンドデータを取り込むステップと、NMDを介してサウンドデータを分析してトリガーイベントを検出するステップと、NMDの少なくとも第2バッファにサウンドデータに関連するメタデータを取り込むステップと、トリガーイベントを検出した後、サウンドデータ内のノイズを分類するためメタデータを分析するステップと、分類されたノイズに基づいてNMDの少なくとも1つの性能パラメータを修正するステップ、
ことを特徴とする有形、非一過性のコンピュータ可読媒体。
例16:例15に記載の有形、非一過性、コンピュータ可読媒体であって、メタデータを分析してサウンドデータ内のノイズを分類するステップは、メタデータを、既知のノイズイベントに関連する参照メタデータと比較することを含む、ことを特徴とする有形、非一過性、コンピュータ可読媒体。
例17:例16に記載の有形の非一過性のコンピュータ可読媒体であって、メタデータは、周波数応答スペクトルを含み、メタデータを参照メタデータと比較することが、周波数応答スペクトルを、NMDの集団から集約された周波数応答スペクトルに対応する固有空間に投影することを含む、ことを特徴とする有形の非一過性のコンピュータ可読媒体。
例18:実施例15に記載の有形の非一過性のコンピュータ可読媒体であって、NMDの少なくとも1つの性能パラメータを修正するステップは、NMDのウェイクワード検出感度パラメータを修正すること、NMDに関連する再生デバイスの再生音量を調整すること、またはNMDのノイズキャンセリングアルゴリズムを修正することのうちの少なくとも1つを含む、ことを特徴とする有形の非一過性のコンピュータ可読媒体。
例19:例8の有形の非一過性のコンピュータ可読媒体であって、更に、NMDを介して、分類されたノイズに対応するデータを、広域ネットワークを介して1つまたは複数のリモートコンピューティングデバイスに送信するステップを含む、ことを特徴とする有形の非一過性のコンピュータ可読媒体。
例20:例8の有形の非一過性のコンピュータ可読媒体であって、前記メタデータは、マイクロフォンの周波数応答データ、マイクロフォンのスペクトルデータ、アコースティックエコーキャンセレーション(AEC)データ、エコーリターンロスエンハンスメント(ERLE)データ、アービトレーションデータ、信号レベルデータ、または方向検出データのうちの少なくとも1つを含む、ことを特徴とする有形の非一過性のコンピュータ可読媒体。

Claims (19)

  1. ネットワークマイクロフォンデバイス(NMD)の1つ以上のマイクロフォンを介してサウンドを検出するステップと、
    検出されたサウンドに基づいてNMDの第1バッファにサウンドデータをキャプチャするステップと、
    トリガーイベントを検出するためにNMDを介してサウンドデータを分析するステップと、
    NMDの少なくとも第2バッファにサウンドデータに関連するメタデータをキャプチャするステップと、
    トリガーイベントを検出した後、サウンドデータ内のノイズを分類するためメタデータの分析を発動するステップと、
    分類されたノイズに基づいてNMDの少なくとも1つの性能パラメータを修正するステップと
    を含む方法。
  2. 請求項1に記載の方法であって、前記サウンドデータは、前記メタデータから導出できないことを特徴とする方法。
  3. 請求項1または2に記載の方法であって、サウンドデータ内のノイズを分類するためメタデータを分析することは、メタデータを、既知のノイズイベントに関連する参照メタデータと比較することである、ことを特徴とする方法。
  4. 上述の請求項のいずれかに記載の方法であって、メタデータを参照メタデータと比較することは、メタデータをそれぞれのノイズイベントのシグネチャと比較することを含み、ここでシグネチャは、それぞれのノイズイベントにさらされたマイクロフォンデバイスの複数の周波数応答に適用される主成分分析を使用して生成される、ことを特徴とする方法。
  5. 請求項4に記載の方法であって、前記複数の周波数応答が、
    制御された条件でキャプチャされたサンプル、および
    ユーザの入力から得られたサンプル
    の少なくとも1つを含む、ことを特徴とする方法。
  6. 上述の請求項のいずれかに記載の方法であって、前記メタデータは、周波数応答スペクトルを含む一方、前記メタデータを参照メタデータと比較することは、NMDの集団から収集された周波数応答スペクトルに対応する固有空間に周波数応答スペクトルを投影することを含む、ことを特徴とする方法。
  7. 上述の請求項のいずれかに記載の方法であって、更に、多くのサンプリングフレーム間で平均化された周波数領域の情報にメタデータを限定することによって、メタデータをキャプチャされたサウンドデータから導出するステップを含む、ことを特徴とする方法。
  8. 上述の請求項のいずれかに記載の方法であって、更に、
    NMDの位置を示す入力をユーザから受信するステップと、
    少なくとも1つのノイズイベントに対する可能性が、示された位置に基づいているだろうとの判断するステップと
    を含む、ことを特徴とする方法。
  9. 上述の請求項のいずれかに記載の方法であって、更に、
    低いレベルのノイズが検出された場合、サウンドデータを分析するために処理されるマイクロフォンのチャンネル数を減らすステップを含む、ことを特徴とする方法。
  10. 請求項9に記載の方法であって、マイクロフォンのチャネル数を減らすステップは、1つ以上のマイクロフォンの、チャンネルをオフにする、チャンネルの電源を落とす、又は、チャンネルからの読み取り値を廃棄することである、ことを特徴とする方法。
  11. 上述の請求項のいずれかに記載の方法であって、更に、
    ノイズが検出されている間に、NMDの性能パラメータを調整し、ノイズが検出されなくなった後に、NMDの性能パラメータをノイズが検出される前の状態に戻すステップを含む、ことを特徴とする方法。
  12. 上述の請求項のいずれかに記載の方法であって、NMDの少なくとも1つの性能パラメータを修正するステップは、
    前記NMDのウェイクワード検出感度パラメータを調整すること、
    前記NMDに関連する再生デバイスの再生音量を調整すること、及び
    前記NMDのノイズキャンセリングアルゴリズムを変更すること、
    の少なくとも1つを含む、ことを特徴とする方法。
  13. 上述の請求項のいずれかに記載の方法であって、更に、
    NMDを介して、分類されたノイズに対応するデータを、ワイドエリアネットワークを通って1つ以上のリモートコンピューティングデバイスに送信するステップ
    を含む、ことを特徴とする方法。
  14. 上述の請求項のいずれかに記載の方法であって、NMDの少なくとも1つの性能パラメータを修正するステップは、環境に存在する複数のNMDの少なくとも1つの性能パラメータを修正することをさらに含む、ことを特徴とする方法。
  15. 上述の請求項のいずれかに記載の方法であって、前記メタデータは、
    マイクロフォンの周波数応答データ、
    マイクロフォンのスペクトルデータ、
    アコースティックエコーキャンセレーション(AEC)データ、
    エコーリターンロスエンハンスメント(ERLE)データ、
    アービトレーションデータ、
    信号レベルデータ、及び
    方向検出データ
    の少なくとも1つを含む、ことを特徴とする方法。
  16. 上述の請求項のいずれかに記載の方法であって、NMDの少なくとも1つの性能パラメータを修正するステップは、
    NMDまたはリモートデバイスによって、シミュレートされたノイズイベントまたはノイズイベントと音声入力の組合せに適用される種々の性能パラメータを用いて行われる、予測型モデリングを実行することと、
    特定のノイズイベントまたは組み合わせされたノイズイベントについて、最適な性能パラメータ値を決定することと、
    決定された最適な性能パラメータ値に基づいて、NMDの性能パラメータを修正すること、
    を含む、ことを特徴とする方法。
  17. 請求項16に記載の方法であって、前記予測型モデリングは、既知のノイズのセットでトレーニングされたニューラルネットワークを用いて実行される、ことを特徴とする方法。
  18. ネットワークマイクロフォンデバイス(NMD)に、上述の請求項のいずれかの方法を実行させるために、1つ以上のプロセッサによって実行可能な命令を格納した有形、非一時的、コンピュータ可読媒体。
  19. ネットワークマイクロフォンデバイス(NMD)であって、
    1つ以上のプロセッサと、
    1つ以上のマイクロフォンと、
    請求項18に記載の有形、非一時的、コンピュータ可読媒体と
    を含む、ネットワークマイクロフォンデバイス。
JP2021535871A 2018-12-20 2019-12-19 ネットワークマイクロフォンデバイスのノイズ分類による最適化 Active JP7271674B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/227,308 US10602268B1 (en) 2018-12-20 2018-12-20 Optimization of network microphone devices using noise classification
US16/227,308 2018-12-20
PCT/US2019/067576 WO2020132298A1 (en) 2018-12-20 2019-12-19 Optimization of network microphone devices using noise classification

Publications (2)

Publication Number Publication Date
JP2022514894A true JP2022514894A (ja) 2022-02-16
JP7271674B2 JP7271674B2 (ja) 2023-05-11

Family

ID=69185708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021535871A Active JP7271674B2 (ja) 2018-12-20 2019-12-19 ネットワークマイクロフォンデバイスのノイズ分類による最適化

Country Status (7)

Country Link
US (4) US10602268B1 (ja)
EP (1) EP3900395A1 (ja)
JP (1) JP7271674B2 (ja)
CN (1) CN113330752A (ja)
AU (1) AU2019405936A1 (ja)
CA (1) CA3123601A1 (ja)
WO (1) WO2020132298A1 (ja)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9947333B1 (en) * 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
WO2017213810A1 (en) * 2016-06-08 2017-12-14 Exxonmobil Research And Engineering Company Automatic visual and acoustic analytics for event detection
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11854566B2 (en) 2018-06-21 2023-12-26 Magic Leap, Inc. Wearable system speech processing
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11410651B2 (en) * 2018-10-22 2022-08-09 Google Llc Network source identification via audio signals
WO2020086050A1 (en) * 2018-10-22 2020-04-30 Google Llc Network source identification via audio signals
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) * 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
TWI719385B (zh) * 2019-01-11 2021-02-21 緯創資通股份有限公司 電子裝置及其語音指令辨識方法
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
CN113748462A (zh) 2019-03-01 2021-12-03 奇跃公司 确定用于语音处理引擎的输入
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11012780B2 (en) * 2019-05-14 2021-05-18 Bose Corporation Speaker system with customized audio experiences
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) * 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11328740B2 (en) 2019-08-07 2022-05-10 Magic Leap, Inc. Voice onset detection
KR102281602B1 (ko) * 2019-08-21 2021-07-29 엘지전자 주식회사 사용자의 발화 음성을 인식하는 인공 지능 장치 및 그 방법
DE102019213809B3 (de) * 2019-09-11 2020-11-26 Sivantos Pte. Ltd. Verfahren zum Betrieb eines Hörgeräts sowie Hörgerät
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US20210201928A1 (en) * 2019-12-31 2021-07-01 Knowles Electronics, Llc Integrated speech enhancement for voice trigger application
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11917384B2 (en) * 2020-03-27 2024-02-27 Magic Leap, Inc. Method of waking a device using spoken voice commands
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN112183647A (zh) * 2020-09-30 2021-01-05 国网山西省电力公司大同供电公司 一种基于深度学习的变电站设备声音故障检测及定位方法
US11551700B2 (en) * 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN113190207A (zh) 2021-04-26 2021-07-30 北京小米移动软件有限公司 信息处理方法、装置、电子设备及存储介质
WO2023056280A1 (en) 2021-09-30 2023-04-06 Sonos, Inc. Noise reduction using synthetic audio

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004109361A (ja) * 2002-09-17 2004-04-08 Toshiba Corp 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP2014510481A (ja) * 2011-03-03 2014-04-24 マイクロソフト コーポレーション マイクロホンアレイのためのノイズ適応的ビームフォーミング
US20160316293A1 (en) * 2015-04-21 2016-10-27 Google Inc. Sound signature database for initialization of noise reduction in recordings
US20170270919A1 (en) * 2016-03-21 2017-09-21 Amazon Technologies, Inc. Anchored speech detection and speech recognition
US9947333B1 (en) * 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
WO2018140777A1 (en) * 2017-01-28 2018-08-02 Bose Corporation Audio device filter modification

Family Cites Families (968)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3014423A (en) 1959-11-27 1961-12-26 Jersey Prod Res Co Apparatus for drilling boreholes with explosive charges
US4941187A (en) 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US4741038A (en) 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPS63301998A (ja) 1987-06-02 1988-12-08 日本電気株式会社 音声認識応答装置
US4974213A (en) 1988-12-16 1990-11-27 Siwecki Thomas L Passive active underwater sound detection apparatus
US5036538A (en) 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5440644A (en) 1991-01-09 1995-08-08 Square D Company Audio distribution system having programmable zoning features
DE69220342T2 (de) 1991-12-20 1997-11-20 Matsushita Electric Ind Co Ltd Lautsprecherapparat zur Basswiedergabe
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JPH0883091A (ja) 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 音声認識装置
US5740260A (en) 1995-05-22 1998-04-14 Presonus L.L.P. Midi to analog sound processor interface
US7174299B2 (en) 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
JP3094900B2 (ja) 1996-02-20 2000-10-03 ヤマハ株式会社 ネットワーク機器およびデータ送受信方法
US6404811B1 (en) 1996-05-13 2002-06-11 Tektronix, Inc. Interactive multimedia system
JP3679526B2 (ja) 1996-10-31 2005-08-03 キヤノン株式会社 画像共有装置、画面制御方法及びコンピュータ可読メモリ
US6469633B1 (en) 1997-01-06 2002-10-22 Openglobe Inc. Remote control of electronic devices
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6611537B1 (en) 1997-05-30 2003-08-26 Centillium Communications, Inc. Synchronous network for digital media streams
US6088459A (en) 1997-10-30 2000-07-11 Hobelsberger; Maximilian Hans Loudspeaker system with simulated baffle for improved base reproduction
US6408078B1 (en) 1997-10-30 2002-06-18 Maximilian Hobelsberger Active reactive acoustical elements
US6032202A (en) 1998-01-06 2000-02-29 Sony Corporation Of Japan Home audio/video network with two level device control
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US6301603B1 (en) 1998-02-17 2001-10-09 Euphonics Incorporated Scalable audio processing on a heterogeneous processor array
US6953886B1 (en) 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
US6839410B2 (en) 1998-09-01 2005-01-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
US7137126B1 (en) 1998-10-02 2006-11-14 International Business Machines Corporation Conversational computing via conversational virtual machine
US20020116196A1 (en) 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US7130616B2 (en) 2000-04-25 2006-10-31 Simple Devices System and method for providing content, management, and interactivity for client devices
US6256554B1 (en) 1999-04-14 2001-07-03 Dilorenzo Mark Multi-room entertainment system with in-room media player/dispenser
US6414251B1 (en) 1999-04-19 2002-07-02 Breck Colquett Weighing apparatus and method having automatic tolerance analysis and calibration
US7657910B1 (en) 1999-07-26 2010-02-02 E-Cast Inc. Distributed electronic entertainment method and apparatus
GB2352933A (en) 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6542868B1 (en) 1999-09-23 2003-04-01 International Business Machines Corporation Audio notification management system
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6611604B1 (en) 1999-10-22 2003-08-26 Stillwater Designs & Audio, Inc. Ultra low frequency transducer and loud speaker comprising same
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US6522886B1 (en) 1999-11-22 2003-02-18 Qwest Communications International Inc. Method and system for simultaneously sharing wireless communications among multiple wireless handsets
DE69935147T2 (de) 1999-12-03 2007-10-31 Telefonaktiebolaget Lm Ericsson (Publ) Verfahren zur gleichzeitigen Wiedergabe von Audio Signalen in zwei Telefonen
KR20010054622A (ko) 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US20010042107A1 (en) 2000-01-06 2001-11-15 Palm Stephen R. Networked audio player transport protocol and architecture
US7661107B1 (en) 2000-01-18 2010-02-09 Advanced Micro Devices, Inc. Method and apparatus for dynamic allocation of processing resources
JP2004500651A (ja) 2000-01-24 2004-01-08 フリスキット インコーポレイテッド ストリーミングメディアの検索および再生システム
US20020026442A1 (en) 2000-01-24 2002-02-28 Lipscomb Kenneth O. System and method for the distribution and sharing of media assets between media players devices
AU2001237673A1 (en) 2000-02-18 2001-08-27 Bridgeco Ag Reference time distribution over a network
JP2001236093A (ja) 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
US6631410B1 (en) 2000-03-16 2003-10-07 Sharp Laboratories Of America, Inc. Multimedia wired/wireless content synchronization system and method
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20020022453A1 (en) 2000-03-31 2002-02-21 Horia Balog Dynamic protocol selection and routing of content to mobile devices
GB2363036B (en) 2000-05-31 2004-05-12 Nokia Mobile Phones Ltd Conference call method and apparatus therefor
US20050164664A1 (en) 2000-07-21 2005-07-28 Difonzo Daniel F. Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks
US20040105566A1 (en) 2000-07-27 2004-06-03 International Business Machines Corporation Body set type speaker unit
US8165867B1 (en) 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US20020072816A1 (en) 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6778869B2 (en) 2000-12-11 2004-08-17 Sony Corporation System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment
US7143939B2 (en) 2000-12-19 2006-12-05 Intel Corporation Wireless music device and method therefor
US20020124097A1 (en) 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6757517B2 (en) 2001-05-10 2004-06-29 Chin-Chi Chang Apparatus and method for coordinated music playback in wireless ad-hoc networks
US7136934B2 (en) 2001-06-19 2006-11-14 Request, Inc. Multimedia synchronization method and device
KR100420069B1 (ko) 2001-08-23 2004-02-25 한국과학기술원 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법
US6892083B2 (en) 2001-09-05 2005-05-10 Vocera Communications Inc. Voice-controlled wireless communications system and method
US7536704B2 (en) 2001-10-05 2009-05-19 Opentv, Inc. Method and apparatus automatic pause and resume of playback for a popup on interactive TV
CA2407123C (en) 2001-10-16 2007-12-18 Audio Products International Corp. Low distortion loudspeaker cone suspension
CA2408045A1 (en) 2001-10-16 2003-04-16 Audio Products International Corp. Loudspeaker with large displacement motional feedback
US7006639B2 (en) 2001-11-20 2006-02-28 Maximilian Hans Hobelsberger Active noise-attenuating duct element
US7103542B2 (en) 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
US7391791B2 (en) 2001-12-17 2008-06-24 Implicit Networks, Inc. Method and system for synchronization of content rendering
DE10163213A1 (de) 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
US8103009B2 (en) 2002-01-25 2012-01-24 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
US7853341B2 (en) 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP4086280B2 (ja) 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
JP2005518734A (ja) 2002-02-20 2005-06-23 メシュネットワークス、インコーポレイテッド チャンネル間で802.11データトラフィックをルーティングしてアドホックネットワーク容量を増大するシステムおよび方法
JP3715584B2 (ja) 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
JP4555072B2 (ja) 2002-05-06 2010-09-29 シンクロネイション インコーポレイテッド ローカライズされたオーディオ・ネットワークおよび関連するディジタル・アクセサリ
CA2485104A1 (en) 2002-05-09 2003-11-20 Herman Cardenas Audio network distribution system
US6961423B2 (en) 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
JP3815388B2 (ja) 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
US8060225B2 (en) 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
EP1389853B1 (en) 2002-08-14 2006-03-29 Sony Deutschland GmbH Bandwidth oriented reconfiguration of wireless ad hoc networks
US7228275B1 (en) 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
KR20040042242A (ko) 2002-11-13 2004-05-20 삼성전자주식회사 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템
US7295548B2 (en) 2002-11-27 2007-11-13 Microsoft Corporation Method and system for disaggregating audio/visual components
US7076428B2 (en) 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
JP2004347943A (ja) 2003-05-23 2004-12-09 Clarion Co Ltd データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2004354721A (ja) 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
US7961892B2 (en) 2003-07-28 2011-06-14 Texas Instruments Incorporated Apparatus and method for monitoring speaker cone displacement in an audio speaker
US7571014B1 (en) 2004-04-01 2009-08-04 Sonos, Inc. Method and apparatus for controlling multimedia players in a multi-zone system
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US9207905B2 (en) 2003-07-28 2015-12-08 Sonos, Inc. Method and apparatus for providing synchrony group status information
US20050031139A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using impedance
US20050031137A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Calibration of an actuator
US20060104451A1 (en) 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
US20050031134A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using infrared light
US20050031138A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of measuring a cant of an actuator
US20050031133A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Process for position indication
US20050031131A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of modifying dynamics of a system
US20050031140A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using a capacitance measurement
US20050031132A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Control system
KR20050023841A (ko) 2003-09-03 2005-03-10 삼성전자주식회사 비선형 왜곡 저감 방법 및 장치
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US20050077843A1 (en) 2003-10-11 2005-04-14 Ronnie Benditt Method and apparatus for controlling a performing arts show by an onstage performer
CN1871874A (zh) 2003-10-24 2006-11-29 皇家飞利浦电子股份有限公司 自适应声音再现
JP4516527B2 (ja) 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4269973B2 (ja) 2004-02-27 2009-05-27 株式会社デンソー カーオーディオシステム
US7483538B2 (en) 2004-03-02 2009-01-27 Ksc Industries, Inc. Wireless and wired speaker hub for a home theater system
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
JP4059214B2 (ja) 2004-03-04 2008-03-12 ソニー株式会社 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム
US10200504B2 (en) 2007-06-12 2019-02-05 Icontrol Networks, Inc. Communication protocols over internet protocol (IP) networks
US7372966B2 (en) 2004-03-19 2008-05-13 Nokia Corporation System for limiting loudspeaker displacement
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7630501B2 (en) 2004-05-14 2009-12-08 Microsoft Corporation System and method for calibration of an acoustic system
US7792311B1 (en) 2004-05-15 2010-09-07 Sonos, Inc., Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7006938B2 (en) 2004-06-16 2006-02-28 Ami Semiconductor, Inc. Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US20060004834A1 (en) 2004-06-30 2006-01-05 Nokia Corporation Dynamic shortcuts
JP2006092482A (ja) 2004-09-27 2006-04-06 Yamaha Corp 音声認識通報装置
US7720232B2 (en) 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8386523B2 (en) 2004-12-30 2013-02-26 Texas Instruments Incorporated Random access audio decoder
TWI272860B (en) 2005-01-03 2007-02-01 Lite On Technology Corp Audio receiver and volume reminder method
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US8396213B2 (en) 2005-01-21 2013-03-12 Certicom Corp. Elliptic curve random number generation
US20060190968A1 (en) 2005-01-31 2006-08-24 Searete Llc, A Limited Corporation Of The State Of The State Of Delaware Sharing between shared audio devices
US7991167B2 (en) 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
JP4760160B2 (ja) 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP4804052B2 (ja) 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US20070018844A1 (en) 2005-07-19 2007-01-25 Sehat Sutardja Two way remote control
JP4285457B2 (ja) 2005-07-20 2009-06-24 ソニー株式会社 音場測定装置及び音場測定方法
WO2007013622A1 (ja) 2005-07-29 2007-02-01 Matsushita Electric Industrial Co., Ltd. スピーカ装置
CN1909625A (zh) 2005-08-05 2007-02-07 鸿富锦精密工业(深圳)有限公司 一种自动调整音量的电视装置及控制方法
EP1934828A4 (en) 2005-08-19 2008-10-08 Gracenote Inc METHOD AND SYSTEM FOR MANAGING THE OPERATION OF A REPRODUCTION DEVICE
US20070060054A1 (en) 2005-09-15 2007-03-15 Sony Ericsson Mobile Communications Ab Wireless home communication system method and apparatus
JP4519041B2 (ja) 2005-09-20 2010-08-04 ローランド株式会社 楽器用スピーカ装置
WO2007051493A1 (en) 2005-11-07 2007-05-10 Telecom Italia S.P.A. Method for managing a conference call in a telephone network
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
US8135143B2 (en) 2005-11-15 2012-03-13 Yamaha Corporation Remote conference apparatus and sound emitting/collecting apparatus
US20070140058A1 (en) 2005-11-21 2007-06-21 Motorola, Inc. Method and system for correcting transducer non-linearities
US7600194B2 (en) 2005-12-02 2009-10-06 Microsoft Corporation Start menu operation for computer user interface
JP2007174233A (ja) 2005-12-21 2007-07-05 Pioneer Electronic Corp スピーカー装置及び携帯電話機
JP4677341B2 (ja) 2005-12-21 2011-04-27 パイオニア株式会社 スピーカー装置及び携帯電話機
KR100762636B1 (ko) 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
WO2007103937A2 (en) 2006-03-06 2007-09-13 General Innovations, Inc. Positionally sequenced loudspeaker system
CN101467142A (zh) 2006-04-04 2009-06-24 约翰逊控制技术公司 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法
KR100786108B1 (ko) 2006-05-01 2007-12-18 김준식 음파통신 네트워크
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
JP4984683B2 (ja) 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US20080037814A1 (en) 2006-08-09 2008-02-14 Jeng-Jye Shau Precision audio speakers
US8428278B2 (en) 2006-08-10 2013-04-23 Claudio Lastrucci Improvements to systems for acoustic diffusion
US10013381B2 (en) 2006-08-31 2018-07-03 Bose Corporation Media playing from a docked handheld media device
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8473618B2 (en) 2006-09-19 2013-06-25 Motorola Solutions, Inc. Method and system for processing multiple communication sessions in a communication network
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
TWI435591B (zh) 2006-10-17 2014-04-21 Marvell World Trade Ltd 用於蜂巢電話之顯示控制
US7747293B2 (en) 2006-10-17 2010-06-29 Marvell Worl Trade Ltd. Display control for cellular phone
EP2080272B1 (en) 2006-10-17 2019-08-21 D&M Holdings, Inc. Unification of multimedia devices
US8391501B2 (en) 2006-12-13 2013-03-05 Motorola Mobility Llc Method and apparatus for mixing priority and non-priority audio signals
US9124650B2 (en) 2006-12-13 2015-09-01 Quickplay Media Inc. Digital rights management in a mobile environment
US20080146289A1 (en) 2006-12-14 2008-06-19 Motorola, Inc. Automatic audio transducer adjustments based upon orientation of a mobile communication device
JP2008158868A (ja) 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
KR101316750B1 (ko) 2007-01-23 2013-10-08 삼성전자주식회사 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법
TW200833152A (en) 2007-01-31 2008-08-01 Bluepacket Comm Co Ltd Multimedia switching system
US20090228919A1 (en) 2007-11-16 2009-09-10 Zott Joseph A Media playlist management and viewing remote control
US20080208594A1 (en) 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US20080221884A1 (en) 2007-03-07 2008-09-11 Cerra Joseph P Mobile environment speech processing facility
US8019076B1 (en) 2007-03-14 2011-09-13 Clearone Communications, Inc. Portable speakerphone device and subsystem utilizing false doubletalk detection
GB0706074D0 (en) 2007-03-28 2007-05-09 Skype Ltd Detection of communication states
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8983051B2 (en) 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8406439B1 (en) 2007-04-04 2013-03-26 At&T Intellectual Property I, L.P. Methods and systems for synthetic audio placement
US8848879B1 (en) 2007-05-03 2014-09-30 Avaya Inc. Customizable notification based on recent communication history
US8032383B1 (en) 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8041565B1 (en) 2007-05-04 2011-10-18 Foneweb, Inc. Precision speech to text conversion
KR100827613B1 (ko) 2007-05-04 2008-05-07 삼성전자주식회사 휴대용 단말기의 마이크 제어 장치 및 방법
US8136040B2 (en) 2007-05-16 2012-03-13 Apple Inc. Audio variance for multiple windows
CN101681484B (zh) 2007-05-18 2013-10-16 速函移动公司 用于通过小数据速率通信系统的增强型通信的系统和方法
EP1998446A1 (en) 2007-05-31 2008-12-03 Alcatel Lucent Remote control for devices with connectivity to a service delivery platform
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
JP4985151B2 (ja) 2007-06-29 2012-07-25 ヤマハ株式会社 コンテンツ配信システム及びセンタ装置
JP4916394B2 (ja) 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
WO2009020617A1 (en) 2007-08-06 2009-02-12 Orison Corporation System and method for three-dimensional ultrasound imaging
US8073125B2 (en) 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US8013720B2 (en) 2007-11-02 2011-09-06 Reverse Control, Inc. Signal apparatus for facilitating safe backup of vehicles
JP5441710B2 (ja) 2007-11-20 2014-03-12 パナソニック株式会社 スピーカ、映像機器、および携帯型情報処理装置
US20090153289A1 (en) 2007-12-12 2009-06-18 Eric James Hope Handheld electronic devices with bimodal remote control functionality
US9386154B2 (en) 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8473081B2 (en) 2007-12-25 2013-06-25 Personics Holdings, Inc. Method and system for event reminder using an earpiece
WO2009086599A1 (en) 2008-01-07 2009-07-16 Avega Systems Pty Ltd A user interface for managing the operation of networked media playback devices
US9992314B2 (en) 2008-01-24 2018-06-05 Garmin Switzerland Gmbh Automatic device mode switching
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
US8072905B2 (en) 2008-02-04 2011-12-06 Sony Ericsson Mobile Communications Ab Intelligent interaction between devices in a local network
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
WO2009120301A2 (en) 2008-03-25 2009-10-01 Square Products Corporation System and method for simultaneous media presentation
US20090248397A1 (en) 2008-03-25 2009-10-01 Microsoft Corporation Service Initiation Techniques
CN101562671A (zh) 2008-04-18 2009-10-21 鸿富锦精密工业(深圳)有限公司 音频设备的音量控制方法及通信装置
JP5423670B2 (ja) 2008-04-30 2014-02-19 日本電気株式会社 音響モデル学習装置および音声認識装置
US8831948B2 (en) 2008-06-06 2014-09-09 At&T Intellectual Property I, L.P. System and method for synthetically generated speech describing media content
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8693663B2 (en) 2008-06-27 2014-04-08 Centurylink Intellectual Property Llc System and method for implementing do-not-disturb during playback of media content
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8505056B2 (en) 2008-07-10 2013-08-06 Apple Inc. Updating properties of remote A/V performance nodes
EP2146519B1 (en) 2008-07-16 2012-06-06 Nuance Communications, Inc. Beamforming pre-processing for speaker localization
US8781833B2 (en) 2008-07-17 2014-07-15 Nuance Communications, Inc. Speech recognition semantic classification training
US8639830B2 (en) 2008-07-22 2014-01-28 Control4 Corporation System and method for streaming audio
US8325938B2 (en) 2008-08-12 2012-12-04 Sony Corporation Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method
JP5206234B2 (ja) 2008-08-27 2013-06-12 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
KR20100034229A (ko) 2008-09-23 2010-04-01 삼성전자주식회사 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9009053B2 (en) 2008-11-10 2015-04-14 Google Inc. Multisensory speech detection
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
JP5347472B2 (ja) 2008-12-12 2013-11-20 ヤマハ株式会社 遠隔制御装置および遠隔制御システム
US8548812B2 (en) 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
KR101467796B1 (ko) 2009-01-12 2014-12-10 엘지전자 주식회사 이동단말기 및 그 제어 방법
US20100179874A1 (en) 2009-01-13 2010-07-15 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons and brands
US8428758B2 (en) 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
FR2943875A1 (fr) * 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
KR101064976B1 (ko) 2009-04-06 2011-09-15 한국과학기술원 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇
JP4820434B2 (ja) 2009-06-08 2011-11-24 レノボ・シンガポール・プライベート・リミテッド マイクロフォンのミュート・コントロール
US8625775B2 (en) 2009-08-06 2014-01-07 Hti Ip, L.L.C. Method and system for reducing echo and noise in a vehicle passenger compartment environment
US8478982B2 (en) 2009-08-06 2013-07-02 Broadcom Corporation Media access control security management in physical layer
JP5440053B2 (ja) 2009-09-14 2014-03-12 ソニー株式会社 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
US8753279B2 (en) 2009-09-17 2014-06-17 Hitachi Medical Corporation Ultrasound probe and ultrasound imaging device
US20110091055A1 (en) 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
US8600073B2 (en) 2009-11-04 2013-12-03 Cambridge Silicon Radio Limited Wind noise suppression
KR101301535B1 (ko) 2009-12-02 2013-09-04 한국전자통신연구원 하이브리드 번역 장치 및 그 방법
US20110145581A1 (en) 2009-12-14 2011-06-16 Verizon Patent And Licensing, Inc. Media playback across devices
JP5641186B2 (ja) 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011091402A1 (en) 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8718290B2 (en) * 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8713571B2 (en) 2010-02-17 2014-04-29 Microsoft Corporation Asynchronous task execution
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9209987B2 (en) 2010-03-02 2015-12-08 Microsoft Technology Licensing, Llc Social media playback
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9514476B2 (en) 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US8437339B2 (en) 2010-04-28 2013-05-07 Hewlett-Packard Development Company, L.P. Techniques to provide integrated voice service management
CA2798072C (en) 2010-05-04 2017-02-14 Shazam Entertainment Ltd. Methods and systems for synchronizing media
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
EP2986034B1 (en) 2010-05-06 2017-05-31 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9736600B2 (en) 2010-05-17 2017-08-15 Iii Holdings 4, Llc Devices and methods for collecting acoustic data
US20110289506A1 (en) 2010-05-18 2011-11-24 Google Inc. Management of computing resources for applications
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
US8831761B2 (en) 2010-06-02 2014-09-09 Sony Corporation Method for determining a processed audio signal and a handheld device
JP2011259097A (ja) 2010-06-07 2011-12-22 Sony Corp 音声信号処理装置及び音声信号処理方法
US8588849B2 (en) 2010-07-09 2013-11-19 Blackberry Limited System and method for resuming media
US8699723B2 (en) 2010-07-20 2014-04-15 International Business Machines Corporation Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device
US8762144B2 (en) 2010-07-21 2014-06-24 Samsung Electronics Co., Ltd. Method and apparatus for voice activity detection
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
WO2012027605A2 (en) 2010-08-27 2012-03-01 Intel Corporation Intelligent remote control system
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
JP5259020B2 (ja) 2010-10-01 2013-08-07 三菱電機株式会社 音声認識装置
US9240111B2 (en) 2010-10-06 2016-01-19 Microsoft Technology Licensing, Llc Inferring building metadata from distributed sensors
JP6363324B2 (ja) 2010-10-08 2018-09-12 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
KR20140035310A (ko) 2010-10-22 2014-03-21 포러스, 인코포레이티드 미디어 배포 아키텍처
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
US8799395B2 (en) 2010-11-22 2014-08-05 Deluxe Media Inc. Methods and systems of dynamically managing content for use by a media playback device
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
EP2652737B1 (en) 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
JP5771002B2 (ja) 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US9241227B2 (en) 2011-01-06 2016-01-19 Bose Corporation Transducer with integrated sensor
JP2012150237A (ja) 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
CN102123188A (zh) 2011-03-03 2011-07-13 曾超宁 移动电话耳麦装置
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9342516B2 (en) 2011-05-18 2016-05-17 Microsoft Technology Licensing, Llc Media presentation playback annotation
EP2715972B1 (en) 2011-05-31 2016-02-24 Google, Inc. Muting participants in a communication session
US8897465B2 (en) 2011-06-01 2014-11-25 Robert Bosch Gmbh Class D micro-speaker
US8958571B2 (en) 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US8738925B1 (en) 2013-01-07 2014-05-27 Fitbit, Inc. Wireless portable biometric device syncing
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
WO2012174301A1 (en) 2011-06-14 2012-12-20 Related Content Database, Inc. System and method for presenting content with time based metadata
US8731765B2 (en) 2011-06-28 2014-05-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a torque machine of a powertrain system
US20130018659A1 (en) 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US20130024018A1 (en) 2011-07-22 2013-01-24 Htc Corporation Multimedia control method and multimedia control system
JP5289517B2 (ja) * 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
US9148742B1 (en) 2011-07-29 2015-09-29 Google Inc. Proximity detection via audio
JP5640918B2 (ja) 2011-08-05 2014-12-17 ブラザー工業株式会社 サーバ装置、対応付け方法、及び携帯機器用プログラム
US20130039527A1 (en) 2011-08-08 2013-02-14 Bang & Olufsen A/S Modular, configurable speaker and a method of operating it
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
US20130211826A1 (en) 2011-08-22 2013-08-15 Claes-Fredrik Urban Mannby Audio Signals as Buffered Streams of Audio Signals and Metadata
US8750677B2 (en) 2011-08-23 2014-06-10 Microsoft Corporation Method for transferring media playback from a different device
US9094539B1 (en) 2011-09-22 2015-07-28 Amazon Technologies, Inc. Dynamic device adjustments based on determined user sleep state
US9729631B2 (en) 2011-09-30 2017-08-08 Apple Inc. Asynchronous data manipulation
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US8971546B2 (en) 2011-10-14 2015-03-03 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to control audio playback devices
CN103052001B (zh) 2011-10-17 2015-06-24 联想(北京)有限公司 智能设备及其控制方法
US8983089B1 (en) 2011-11-28 2015-03-17 Rawles Llc Sound source localization using multiple microphone arrays
CN102567468B (zh) 2011-12-06 2014-06-04 上海聚力传媒技术有限公司 一种用于对媒体文件的播放音量进行调节的方法与设备
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
CN103988515A (zh) 2011-12-13 2014-08-13 英特尔公司 通过关键字选择在已连接媒体设备中进行频道导航
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
KR102022318B1 (ko) 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9654817B2 (en) 2012-01-27 2017-05-16 Avaya Inc. System and method to synchronize video playback on mobile devices
US9401058B2 (en) 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
US9431980B2 (en) 2012-01-30 2016-08-30 Echostar Ukraine Llc Apparatus, systems and methods for adjusting output audio volume based on user location
US9418658B1 (en) 2012-02-08 2016-08-16 Amazon Technologies, Inc. Configuration of voice controlled assistant
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
US9065895B2 (en) 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
US9361878B2 (en) 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
WO2013155619A1 (en) 2012-04-20 2013-10-24 Sam Pasupalak Conversational agent
US9633186B2 (en) 2012-04-23 2017-04-25 Apple Inc. Systems and methods for controlling output of content based on human recognition data detection
US8886524B1 (en) 2012-05-01 2014-11-11 Amazon Technologies, Inc. Signal processing based on audio context
US11452153B2 (en) 2012-05-01 2022-09-20 Lisnr, Inc. Pairing and gateway connection using sonic tones
US9584909B2 (en) 2012-05-10 2017-02-28 Google Inc. Distributed beamforming based on message passing
US8908879B2 (en) 2012-05-23 2014-12-09 Sonos, Inc. Audio content auditioning
US9633368B2 (en) 2012-05-25 2017-04-25 Apple Inc. Content ranking and serving on a multi-user device or interface
CN103456332A (zh) 2012-05-28 2013-12-18 富泰华工业(深圳)有限公司 音频播放装置及音量调节方法
US20130324031A1 (en) 2012-05-31 2013-12-05 Nokia Corporation Dynamic allocation of audio channel for surround sound systems
KR101733273B1 (ko) 2012-06-01 2017-05-24 블랙베리 리미티드 다중 포맷 오디오 시스템들에서의 확률적 로크 보장 방법에 기초한 범용 동기화 엔진
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US9301073B2 (en) 2012-06-08 2016-03-29 Apple Inc. Systems and methods for determining the condition of multiple microphones
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US10354650B2 (en) 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US9674587B2 (en) 2012-06-26 2017-06-06 Sonos, Inc. Systems and methods for networked music playback including remote add to queue
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9137564B2 (en) 2012-06-28 2015-09-15 Sonos, Inc. Shift to corresponding media in a playback queue
US9384737B2 (en) 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US20140006825A1 (en) 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
US20140003635A1 (en) 2012-07-02 2014-01-02 Qualcomm Incorporated Audio signal processing device calibration
US9615171B1 (en) 2012-07-02 2017-04-04 Amazon Technologies, Inc. Transformation inversion to reduce the effect of room acoustics
KR101972955B1 (ko) 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8972762B2 (en) 2012-07-11 2015-03-03 Blackberry Limited Computing devices and methods for resetting inactivity timers on computing devices
US8983844B1 (en) 2012-07-31 2015-03-17 Amazon Technologies, Inc. Transmission of noise parameters for improving automatic speech recognition
US8831957B2 (en) 2012-08-01 2014-09-09 Google Inc. Speech recognition models based on location indicia
KR20230048452A (ko) 2012-08-03 2023-04-11 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 장치 및 조명 장치
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
US9532153B2 (en) 2012-08-29 2016-12-27 Bang & Olufsen A/S Method and a system of providing information to a user
US20140075311A1 (en) 2012-09-11 2014-03-13 Jesse William Boettcher Methods and apparatus for controlling audio volume on an electronic device
US20140075306A1 (en) 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US8798598B2 (en) 2012-09-13 2014-08-05 Alain Rossmann Method and system for screencasting Smartphone video game software to online social networks
US8983383B1 (en) 2012-09-25 2015-03-17 Rawles Llc Providing hands-free service to multiple devices
US9319816B1 (en) 2012-09-26 2016-04-19 Amazon Technologies, Inc. Characterizing environment using ultrasound pilot tones
JP2014071138A (ja) 2012-09-27 2014-04-21 Xing Inc カラオケ装置
KR102091236B1 (ko) 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
US8725125B2 (en) 2012-09-28 2014-05-13 United Video Properties, Inc. Systems and methods for controlling audio playback on portable devices with vehicle equipment
EP2759147A1 (en) 2012-10-02 2014-07-30 MH Acoustics, LLC Earphones having configurable microphone arrays
US8484025B1 (en) 2012-10-04 2013-07-09 Google Inc. Mapping an audio utterance to an action using a classifier
CN102902253B (zh) 2012-10-09 2015-07-15 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
WO2014062729A1 (en) 2012-10-15 2014-04-24 Msi Dfat Llc Direct field acoustic testing in a semi-reverberant enclosure
US9232310B2 (en) 2012-10-15 2016-01-05 Nokia Technologies Oy Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones
DE102012020271A1 (de) 2012-10-17 2014-04-17 Wolfgang Klippel Anordnung und Verfahren zur Steuerung von Wandlern
US9319445B2 (en) 2012-10-22 2016-04-19 Spotify Ab Systems and methods for pre-fetching media content
KR101978688B1 (ko) 2012-10-22 2019-05-15 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
WO2014064324A1 (en) 2012-10-26 2014-05-01 Nokia Corporation Multi-device speech recognition
KR20140054643A (ko) 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US10381001B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US9275637B1 (en) 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9275642B2 (en) 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
US9685171B1 (en) 2012-11-20 2017-06-20 Amazon Technologies, Inc. Multiple-stage adaptive filtering of audio signals
WO2014142702A1 (en) 2013-03-15 2014-09-18 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Selective speech recognition for chat and digital personal assistant systems
US20140149118A1 (en) 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9124966B2 (en) 2012-11-28 2015-09-01 Qualcomm Incorporated Image generation for collaborative sound systems
US9203045B2 (en) 2012-11-29 2015-12-01 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US9171092B2 (en) 2012-12-07 2015-10-27 Empire Technology Development Llc Personal assistant context building
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9226071B2 (en) 2012-12-13 2015-12-29 Maxim Integrated Products, Inc. Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker
US9300910B2 (en) 2012-12-14 2016-03-29 Biscotti Inc. Video mail capture, processing and distribution
US9271111B2 (en) 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
EP2938022A4 (en) 2012-12-18 2016-08-24 Samsung Electronics Co Ltd METHOD AND DEVICE FOR REMOTE CONTROL OF A HOME DEVICE IN A HOME NETWORK SYSTEM
US9098467B1 (en) 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
WO2014102722A1 (en) 2012-12-26 2014-07-03 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
KR102051588B1 (ko) 2013-01-07 2019-12-03 삼성전자주식회사 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치
JP2014137590A (ja) 2013-01-18 2014-07-28 Yoji Fukinuki 音楽コンテンツ配信方法
US9646605B2 (en) 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US20140215332A1 (en) 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
TWI593294B (zh) 2013-02-07 2017-07-21 晨星半導體股份有限公司 收音系統與相關方法
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US9818407B1 (en) 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
US9300266B2 (en) 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9172747B2 (en) 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
US9195432B2 (en) 2013-02-26 2015-11-24 Sonos, Inc. Pre-caching of audio content
RU2648604C2 (ru) 2013-02-26 2018-03-26 Конинклейке Филипс Н.В. Способ и аппаратура для генерации сигнала речи
CN104010251B (zh) 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音系统与相关方法
US9460715B2 (en) 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US20140258292A1 (en) 2013-03-05 2014-09-11 Clip Interactive, Inc. Apparatus, system, and method for integrating content and content services
JP6429465B2 (ja) 2013-03-07 2018-11-28 株式会社半導体エネルギー研究所 装置及びその作製方法
KR101887983B1 (ko) 2013-03-07 2018-08-14 애플 인크. 룸 및 프로그램 응답 확성기 시스템
US9349386B2 (en) 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9161126B2 (en) 2013-03-08 2015-10-13 Cirrus Logic, Inc. Systems and methods for protecting a speaker
CN104053088A (zh) 2013-03-11 2014-09-17 联想(北京)有限公司 一种麦克风阵列调整方法、麦克风阵列及电子设备
EP2974382B1 (en) 2013-03-11 2017-04-19 Apple Inc. Timbre constancy across a range of directivities for a loudspeaker
TWI533686B (zh) 2013-03-11 2016-05-11 緯創資通股份有限公司 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
WO2014159581A1 (en) 2013-03-12 2014-10-02 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
KR20140111859A (ko) 2013-03-12 2014-09-22 삼성전자주식회사 콘텐트 공유 방법 및 이를 위한 디바이스
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US9173021B2 (en) 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
KR101571338B1 (ko) 2013-03-13 2015-11-24 삼성전자주식회사 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치
US20140274185A1 (en) 2013-03-14 2014-09-18 Aliphcom Intelligence device connection for wireless media ecosystem
JP6084750B2 (ja) 2013-03-14 2017-02-22 アップル インコーポレイテッド スピーカー及び携帯リスニング装置を用いた室内の適応等化
KR102152754B1 (ko) 2013-03-14 2020-09-07 삼성전자주식회사 블루루스 디바이스에서 통신 연결 방법 및 그 장치
JP6013951B2 (ja) 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法
US20140278933A1 (en) 2013-03-15 2014-09-18 F. Gavin McMillan Methods and apparatus to measure audience engagement with media
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
US9626436B2 (en) 2013-03-15 2017-04-18 Spotify Ab Systems, methods, and computer readable medium for generating playlists
US9888316B2 (en) 2013-03-21 2018-02-06 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
WO2014157433A1 (en) 2013-03-26 2014-10-02 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US9462115B2 (en) 2013-04-04 2016-10-04 James S. Rand Unified communications system and method
JP6300589B2 (ja) 2013-04-04 2018-03-28 株式会社半導体エネルギー研究所 半導体装置の作製方法
JP6198432B2 (ja) 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
WO2014172299A1 (en) 2013-04-15 2014-10-23 Chacha Search, Inc. Method and system of increasing user interaction
US9875494B2 (en) 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
US9501533B2 (en) 2013-04-16 2016-11-22 Sonos, Inc. Private queue for a media playback system
US9304736B1 (en) 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
WO2014171144A1 (ja) 2013-04-19 2014-10-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
KR102230139B1 (ko) 2013-05-17 2021-03-18 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 조명 장치, 발광 장치, 및 전자 기기
US9472201B1 (en) 2013-05-22 2016-10-18 Google Inc. Speaker localization by means of tactile input
US9390708B1 (en) 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US20140358535A1 (en) 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
US20140357248A1 (en) 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US9438193B2 (en) 2013-06-05 2016-09-06 Sonos, Inc. Satellite volume control
US9654073B2 (en) 2013-06-07 2017-05-16 Sonos, Inc. Group volume control
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US8953778B2 (en) 2013-06-17 2015-02-10 Avaya Inc. Real-time intelligent mute interactive features
US9494683B1 (en) 2013-06-18 2016-11-15 Amazon Technologies, Inc. Audio-based gesture detection
US9324322B1 (en) * 2013-06-18 2016-04-26 Amazon Technologies, Inc. Automatic volume attenuation for speech enabled devices
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9640179B1 (en) 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
WO2014210429A1 (en) 2013-06-28 2014-12-31 Harman International Industries, Inc. Wireless control of linked devices
US9298415B2 (en) 2013-07-09 2016-03-29 Sonos, Inc. Systems and methods to provide play/pause content
US20150019201A1 (en) 2013-07-09 2015-01-15 Stanley F. Schoenbach Real-time interpreting systems and methods
US9293480B2 (en) 2013-07-10 2016-03-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and display device including the semiconductor device
US9396727B2 (en) 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
WO2015005927A1 (en) 2013-07-11 2015-01-15 Intel Corporation Device wake and speaker verification using the same audio input
DE102014109122A1 (de) 2013-07-12 2015-01-15 Gm Global Technology Operations, Llc Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
WO2015009748A1 (en) 2013-07-15 2015-01-22 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
US9666187B1 (en) 2013-07-25 2017-05-30 Google Inc. Model for enabling service providers to address voice-activated commands
WO2015017303A1 (en) 2013-07-31 2015-02-05 Motorola Mobility Llc Method and apparatus for adjusting voice recognition processing based on noise characteristics
US10186262B2 (en) 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
DE102013012811B4 (de) 2013-08-01 2024-02-22 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler
US9565497B2 (en) 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
US10873997B2 (en) 2013-08-01 2020-12-22 Fong-Min Chang Voice controlled artificial intelligent smart illumination device
EP2862164B1 (en) 2013-08-23 2017-05-31 Nuance Communications, Inc. Multiple pass automatic speech recognition
US9190043B2 (en) 2013-08-27 2015-11-17 Bose Corporation Assisting conversation in noisy environments
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
KR20160048960A (ko) 2013-08-30 2016-05-04 후아웨이 테크놀러지 컴퍼니 리미티드 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템
WO2015037396A1 (ja) 2013-09-11 2015-03-19 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
US9516081B2 (en) 2013-09-20 2016-12-06 Amazon Technologies, Inc. Reduced latency electronic content system
US9668052B2 (en) 2013-09-25 2017-05-30 Google Technology Holdings LLC Audio routing system for routing audio data to and from a mobile device
US9355555B2 (en) 2013-09-27 2016-05-31 Sonos, Inc. System and method for issuing commands in a media playback system
US9443527B1 (en) 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
CN103546616A (zh) 2013-09-30 2014-01-29 深圳市同洲电子股份有限公司 一种调节音量的方法及装置
US9288596B2 (en) 2013-09-30 2016-03-15 Sonos, Inc. Coordinator device for paired or consolidated players
KR102114219B1 (ko) 2013-10-10 2020-05-25 삼성전자주식회사 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
TWI642170B (zh) 2013-10-18 2018-11-21 半導體能源研究所股份有限公司 顯示裝置及電子裝置
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
US9633671B2 (en) 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
US9818061B1 (en) 2013-10-22 2017-11-14 Lumin, LLC Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment
US10229256B2 (en) 2013-10-25 2019-03-12 Intel Corporation Techniques for preventing voice replay attacks
EP2869599B1 (en) 2013-11-05 2020-10-21 Oticon A/s A binaural hearing assistance system comprising a database of head related transfer functions
JP2015090570A (ja) 2013-11-06 2015-05-11 ソニー株式会社 情報処理装置および制御方法
US10311482B2 (en) 2013-11-11 2019-06-04 At&T Intellectual Property I, Lp Method and apparatus for adjusting a digital assistant persona
US8775191B1 (en) 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
JP6236303B2 (ja) 2013-11-26 2017-11-22 株式会社デンソーアイティーラボラトリ 制御装置、制御方法およびプログラム
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9704478B1 (en) 2013-12-02 2017-07-11 Amazon Technologies, Inc. Audio output masking for improved automatic speech recognition
CN104143326B (zh) 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
US8719039B1 (en) 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
US10720153B2 (en) 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
US10055190B2 (en) 2013-12-16 2018-08-21 Amazon Technologies, Inc. Attribute-based audio channel arbitration
US9721570B1 (en) 2013-12-17 2017-08-01 Amazon Technologies, Inc. Outcome-oriented dialogs on a speech recognition platform
US9378651B2 (en) 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
US10224056B1 (en) 2013-12-17 2019-03-05 Amazon Technologies, Inc. Contingent device actions during loss of network connectivity
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
US20150179181A1 (en) 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US9099974B2 (en) 2013-12-20 2015-08-04 Vmware, Inc. Volume redirection
EP2890160B1 (en) 2013-12-24 2019-08-14 Nxp B.V. Loudspeaker controller
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
US9443516B2 (en) 2014-01-09 2016-09-13 Honeywell International Inc. Far-field speech recognition systems and methods
US8938394B1 (en) 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
EP3092824B1 (en) 2014-01-10 2017-11-01 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US9300647B2 (en) 2014-01-15 2016-03-29 Sonos, Inc. Software application and zones
US9288597B2 (en) 2014-01-20 2016-03-15 Sony Corporation Distributed wireless speaker system with automatic configuration determination when new speakers are added
US10162593B2 (en) 2014-01-22 2018-12-25 Apple Inc. Coordinated hand-off of audio data transmission
US9356882B2 (en) 2014-02-04 2016-05-31 Printeron Inc. Streamlined system for the transmission of network resource data
US9443876B2 (en) 2014-02-05 2016-09-13 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module
US9929368B2 (en) 2014-02-06 2018-03-27 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, lighting device, and electronic appliance
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
TWI685116B (zh) 2014-02-07 2020-02-11 日商半導體能源研究所股份有限公司 半導體裝置
US9318112B2 (en) 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
JP6289936B2 (ja) 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
FR3018024B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
FR3018025B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
US9408008B2 (en) 2014-02-28 2016-08-02 Sonos, Inc. Playback zone representations
US10015593B2 (en) 2014-03-03 2018-07-03 University Of Utah Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
US9489171B2 (en) 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
US9679054B2 (en) 2014-03-05 2017-06-13 Sonos, Inc. Webpage media playback
US10599287B2 (en) 2014-03-11 2020-03-24 Sonos, Inc. Group volume control
US9640669B2 (en) 2014-03-13 2017-05-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9226062B2 (en) 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
US10514747B2 (en) 2014-03-24 2019-12-24 Silicon Laboratories Inc. Low-power communication apparatus with wakeup detection and associated methods
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US9648564B1 (en) 2014-03-26 2017-05-09 Amazon Technologies, Inc. Wake-up management for mobile devices
US9916839B1 (en) 2014-03-27 2018-03-13 Amazon Technologies, Inc. Shared audio functionality based on device grouping
US9431021B1 (en) 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
US9547468B2 (en) 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
KR102146462B1 (ko) 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US8874448B1 (en) 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
CN109949815A (zh) 2014-04-07 2019-06-28 三星电子株式会社 电子装置
DE102014005381B3 (de) 2014-04-11 2014-12-11 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler
US20150302856A1 (en) 2014-04-17 2015-10-22 Qualcomm Incorporated Method and apparatus for performing function by speech input
US20150334471A1 (en) 2014-05-15 2015-11-19 Echostar Technologies L.L.C. Multiple simultaneous audio video data decoding
US10368183B2 (en) 2014-05-19 2019-07-30 Apple Inc. Directivity optimized sound reproduction
CN106465458B (zh) 2014-05-23 2019-12-13 三星电子株式会社 用于提供通知的方法和设备
US9860289B2 (en) 2014-05-23 2018-01-02 Radeeus, Inc. Multimedia digital content retrieval, matching, and syncing systems and methods of using the same
US9900723B1 (en) 2014-05-28 2018-02-20 Apple Inc. Multi-channel loudspeaker matching using variable directivity
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
TWI729649B (zh) 2014-05-30 2021-06-01 日商半導體能源研究所股份有限公司 發光元件,發光裝置,電子裝置以及照明裝置
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US20150355818A1 (en) 2014-06-04 2015-12-10 Sonos, Inc. Continuous Playback Queue
US9720642B2 (en) 2014-06-04 2017-08-01 Sonos, Inc. Prioritizing media content requests
US10624612B2 (en) 2014-06-05 2020-04-21 Chikayoshi Sumi Beamforming method, measurement and imaging instruments, and communication instruments
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
CN104092936B (zh) 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
US9767159B2 (en) 2014-06-13 2017-09-19 Google Inc. Ranking search results
US20150363061A1 (en) 2014-06-13 2015-12-17 Autonomic Controls, Inc. System and method for providing related digital content
US9589556B2 (en) 2014-06-19 2017-03-07 Yang Gao Energy adjustment of acoustic echo replica signal for speech enhancement
US9520139B2 (en) 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
US9697828B1 (en) * 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
US10152987B2 (en) 2014-06-23 2018-12-11 Google Llc Remote invocation of mobile device actions
US9632748B2 (en) 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9691379B1 (en) 2014-06-26 2017-06-27 Amazon Technologies, Inc. Selecting from multiple content sources
US9335819B1 (en) 2014-06-26 2016-05-10 Audible, Inc. Automatic creation of sleep bookmarks in content items
US9368105B1 (en) 2014-06-26 2016-06-14 Amazon Technologies, Inc. Preventing false wake word detections with a voice-controlled device
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US11330100B2 (en) 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
US9374634B2 (en) 2014-07-10 2016-06-21 Nxp B.V. System for controlling displacement of a loudspeaker
US9467737B2 (en) 2014-07-14 2016-10-11 Sonos, Inc. Zone group control
JP2016024212A (ja) 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US10209947B2 (en) 2014-07-23 2019-02-19 Sonos, Inc. Device grouping
US9263042B1 (en) 2014-07-25 2016-02-16 Google Inc. Providing pre-computed hotword models
KR20160017253A (ko) 2014-08-01 2016-02-16 삼성전자주식회사 디스플레이 구동용 집적 회로 칩
US9874997B2 (en) 2014-08-08 2018-01-23 Sonos, Inc. Social playback queues
US9548066B2 (en) 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
US9769552B2 (en) 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
JP6118838B2 (ja) 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9560050B2 (en) 2014-09-08 2017-01-31 At&T Intellectual Property I, L.P System and method to share a resource or a capability of a device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9747011B2 (en) 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US9548053B1 (en) 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
US10645130B2 (en) 2014-09-24 2020-05-05 Sonos, Inc. Playback updates
US9641919B1 (en) 2014-09-30 2017-05-02 Amazon Technologies, Inc. Audio assemblies for electronic devices
GB2525051B (en) 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
JP6624368B2 (ja) 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
US9681228B2 (en) 2014-09-30 2017-06-13 Apple Inc. Capacitive position sensing for transducers
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10235996B2 (en) 2014-10-01 2019-03-19 XBrain, Inc. Voice and connection platform
US10817672B2 (en) 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR102287943B1 (ko) 2014-10-14 2021-08-09 삼성전자주식회사 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법
EP3010251B1 (en) 2014-10-15 2019-11-13 Nxp B.V. Audio system
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary
US9788047B2 (en) 2014-10-30 2017-10-10 Verizon Patent And Licensing Inc. Media guide user interface systems and methods
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US9699550B2 (en) 2014-11-12 2017-07-04 Qualcomm Incorporated Reduced microphone power-up latency
US20160134982A1 (en) 2014-11-12 2016-05-12 Harman International Industries, Inc. System and method for estimating the displacement of a speaker cone
JP2016095383A (ja) 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US10116748B2 (en) 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US10303644B2 (en) 2014-11-21 2019-05-28 International Business Machines Corporation Providing remote, reliant and high performance PCI express device in cloud computing environments
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US9812126B2 (en) 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
US9992596B2 (en) 2014-11-28 2018-06-05 Audera Acoustics Inc. High displacement acoustic transducer systems
US10192549B2 (en) 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
US10126406B2 (en) 2014-12-02 2018-11-13 Qualcomm Incorporated Method and apparatus for performing ultrasonic presence detection
CN104538030A (zh) 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
WO2016094807A1 (en) 2014-12-11 2016-06-16 Vishal Sharma Virtual assistant system to enable actionable messaging
US9779725B2 (en) 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method
US9813812B2 (en) 2014-12-12 2017-11-07 Analog Devices Global Method of controlling diaphragm excursion of electrodynamic loudspeakers
US9552816B2 (en) 2014-12-19 2017-01-24 Amazon Technologies, Inc. Application focus in speech-based systems
US9560441B1 (en) 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
CN104575504A (zh) 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN104635539A (zh) 2014-12-26 2015-05-20 东莞市掌商信息科技有限公司 一种智能硬件远程语音安全控制方法及其系统
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US9934406B2 (en) 2015-01-08 2018-04-03 Microsoft Technology Licensing, Llc Protecting private information in input understanding system
US9584915B2 (en) 2015-01-19 2017-02-28 Microsoft Technology Licensing, Llc Spatial audio with remote speakers
US20160210110A1 (en) 2015-01-21 2016-07-21 Ford Global Technologies, Llc Audio synchronization between vehicles and mobile devices
KR102351366B1 (ko) 2015-01-26 2022-01-14 삼성전자주식회사 음성 인식 방법 및 장치
US9947313B2 (en) 2015-01-26 2018-04-17 William Drewes Method for substantial ongoing cumulative voice recognition error reduction
US9633661B1 (en) 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
GB201501791D0 (en) 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
US20160232451A1 (en) 2015-02-09 2016-08-11 Velocee Ltd. Systems and methods for managing audio content
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US20160239255A1 (en) 2015-02-16 2016-08-18 Harman International Industries, Inc. Mobile interface for loudspeaker optimization
US20160253050A1 (en) 2015-02-26 2016-09-01 Fingertips Lab, Inc. System and method for audio and tactile based browsing
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10762894B2 (en) 2015-03-27 2020-09-01 Google Llc Convolutional neural networks
US9697826B2 (en) 2015-03-27 2017-07-04 Google Inc. Processing multi-channel audio waveforms
US10192546B1 (en) 2015-03-30 2019-01-29 Amazon Technologies, Inc. Pre-wakeword speech processing
US10034109B2 (en) 2015-04-09 2018-07-24 Audera Acoustics Inc. Acoustic transducer systems with position sensing
WO2016165067A1 (en) 2015-04-14 2016-10-20 Motorola Solutions, Inc. Method and apparatus for a volume of a device
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN104853405B (zh) 2015-05-12 2018-11-30 浙江生辉照明有限公司 智能联网方法及智能设备
KR102623039B1 (ko) 2015-05-15 2024-01-08 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기 및 조명 장치
US10070237B2 (en) 2015-05-21 2018-09-04 Analog Devices, Inc. Optical and capacitive sensing of electroacoustic transducers
TWI757234B (zh) 2015-05-21 2022-03-11 日商半導體能源研究所股份有限公司 發光元件、顯示裝置、電子裝置、及照明裝置
DE112016002297T5 (de) 2015-05-21 2018-03-15 Semiconductor Energy Laboratory Co., Ltd. Licht emittierendes Element, Anzeigevorrichtung, elektronisches Gerät und Beleuchtungsvorrichtung
JP2016218852A (ja) 2015-05-22 2016-12-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US9837547B2 (en) 2015-05-22 2017-12-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising oxide conductor and display device including the semiconductor device
EP3099047A1 (en) 2015-05-28 2016-11-30 Nxp B.V. Echo controller
US9584935B2 (en) 2015-05-29 2017-02-28 Sound United, Llc. Multi-zone media system and method for providing multi-zone media
US9734822B1 (en) 2015-06-01 2017-08-15 Amazon Technologies, Inc. Feedback based beamformed signal selection
US9864571B2 (en) 2015-06-04 2018-01-09 Sonos, Inc. Dynamic bonding of playback devices
US9672821B2 (en) 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
KR102444075B1 (ko) 2015-06-09 2022-09-16 삼성전자주식회사 전자 장치, 주변 기기 및 그 제어 방법
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
US20160373909A1 (en) 2015-06-17 2016-12-22 Hive Life, LLC Wireless audio, security communication and home automation
CN107710441B (zh) 2015-06-17 2020-10-16 株式会社半导体能源研究所 铱配合物、发光元件、显示装置、电子设备以及照明装置
JP6739907B2 (ja) 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
US10025447B1 (en) 2015-06-19 2018-07-17 Amazon Technologies, Inc. Multi-device user interface
KR20170001173A (ko) 2015-06-25 2017-01-04 엘지전자 주식회사 와치 타입 이동 단말기 및 그의 동작 방법
US9554210B1 (en) 2015-06-25 2017-01-24 Amazon Technologies, Inc. Multichannel acoustic echo cancellation with unique individual channel estimations
KR102317526B1 (ko) 2015-06-25 2021-10-26 엘지전자 주식회사 헤드셋 및 그 제어 방법
US9472203B1 (en) 2015-06-29 2016-10-18 Amazon Technologies, Inc. Clock synchronization for multichannel system
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3317878B1 (de) * 2015-06-30 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum erzeugen einer datenbank
KR102646440B1 (ko) 2015-07-08 2024-03-13 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 장치, 및 조명 장치
KR20240047495A (ko) 2015-07-21 2024-04-12 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9686625B2 (en) 2015-07-21 2017-06-20 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
US9769563B2 (en) 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
TWI804457B (zh) 2015-07-23 2023-06-11 日商半導體能源研究所股份有限公司 發光元件,顯示裝置,電子裝置,以及照明裝置
WO2017015759A1 (en) 2015-07-30 2017-02-02 Amp Me Inc. Synchronized playback of streamed audio content by multiple internet-capable portable devices
US10529318B2 (en) 2015-07-31 2020-01-07 International Business Machines Corporation Implementing a classification model for recognition processing
US9691361B2 (en) 2015-08-03 2017-06-27 International Business Machines Corporation Adjusting presentation of content on a display
KR102402512B1 (ko) 2015-08-04 2022-05-27 삼성전자주식회사 외부장치의 음량을 조정하는 전자장치 및 방법
CN105187907A (zh) 2015-08-05 2015-12-23 四川长虹电器股份有限公司 智能电视音量控制系统及控制方法
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10333904B2 (en) 2015-08-08 2019-06-25 Peter J. Tormey Voice access and control
KR102386854B1 (ko) 2015-08-20 2022-04-13 삼성전자주식회사 통합 모델 기반의 음성 인식 장치 및 방법
US10270041B2 (en) 2015-08-28 2019-04-23 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US20180249267A1 (en) 2015-08-31 2018-08-30 Apple Inc. Passive microphone array localizer
EP3142389B1 (en) 2015-09-02 2020-07-08 Harman International Industries, Inc. Audio system with multi-screen application
US10339917B2 (en) 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
US10026399B2 (en) 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
KR20170031392A (ko) 2015-09-11 2017-03-21 삼성전자주식회사 전자 장치, 음향 시스템 및 오디오 출력 방법
CN105206281B (zh) 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
KR20170032096A (ko) 2015-09-14 2017-03-22 삼성전자주식회사 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
US10706873B2 (en) 2015-09-18 2020-07-07 Sri International Real-time speaker state analytics platform
CN105204357B (zh) 2015-09-18 2018-02-06 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
KR102446392B1 (ko) 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
WO2017058654A1 (en) 2015-09-28 2017-04-06 Google Inc. Time-synchronized, multizone media streaming
JP6536320B2 (ja) 2015-09-28 2019-07-03 富士通株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US9996316B2 (en) 2015-09-28 2018-06-12 Amazon Technologies, Inc. Mediation of wakeword response for multiple devices
US10241754B1 (en) 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
WO2017055963A1 (en) 2015-09-30 2017-04-06 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, display device, electronic device, and lighting device
KR20170038681A (ko) 2015-09-30 2017-04-07 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
KR102429260B1 (ko) 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
US9754580B2 (en) 2015-10-12 2017-09-05 Technologies For Voice Interface System and method for extracting and using prosody features
US9747926B2 (en) 2015-10-16 2017-08-29 Google Inc. Hotword recognition
US10453450B2 (en) 2015-10-20 2019-10-22 Bragi GmbH Wearable earpiece voice command control system and method
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US9691378B1 (en) 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10863267B2 (en) 2015-11-10 2020-12-08 Savant Systems, Inc. Volume control for audio/video devices
US9990209B2 (en) 2015-11-12 2018-06-05 Microsoft Technology Licensing, Llc Digital assistance device for facilitating multi-stage setup
US10706852B2 (en) 2015-11-13 2020-07-07 Microsoft Technology Licensing, Llc Confidence features for automated speech recognition arbitration
US10592949B2 (en) 2015-11-13 2020-03-17 [24]7.ai, Inc. Method and apparatus for linking customer interactions with customer messaging platforms
US11929088B2 (en) 2015-11-20 2024-03-12 Synaptics Incorporated Input/output mode control for audio processing
CN108292502A (zh) 2015-11-25 2018-07-17 三菱电机株式会社 语音对话装置及语音对话方法
US10040423B2 (en) 2015-11-27 2018-08-07 Bragi GmbH Vehicle with wearable for identifying one or more vehicle occupants
US9484030B1 (en) 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9747920B2 (en) 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
US10134388B1 (en) 2015-12-23 2018-11-20 Amazon Technologies, Inc. Word generation for speech recognition
CN105679318A (zh) 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
US10547942B2 (en) 2015-12-28 2020-01-28 Samsung Electronics Co., Ltd. Control of electrodynamic speaker driver using a low-order non-linear model
US9826599B2 (en) 2015-12-28 2017-11-21 Amazon Technologies, Inc. Voice-controlled light switches
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US9820036B1 (en) 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9813810B1 (en) 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
KR20170086814A (ko) 2016-01-19 2017-07-27 삼성전자주식회사 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR102392113B1 (ko) 2016-01-20 2022-04-29 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령 처리 방법
CN105741838B (zh) 2016-01-20 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
US9749731B2 (en) 2016-01-21 2017-08-29 Bose Corporation Sidetone generation using multiple microphones
US9659555B1 (en) 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
EP3414759B1 (en) 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US9858927B2 (en) 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10743101B2 (en) 2016-02-22 2020-08-11 Sonos, Inc. Content mixing
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
WO2017147936A1 (zh) 2016-03-04 2017-09-08 茹旷 智能家居助手
US10133612B2 (en) 2016-03-17 2018-11-20 Nuance Communications, Inc. Session processing interaction between two or more virtual assistants
US9769420B1 (en) 2016-03-18 2017-09-19 Thomas Lawrence Moses Portable wireless remote monitoring and control systems
US9805714B2 (en) 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
US10365887B1 (en) 2016-03-25 2019-07-30 Amazon Technologies, Inc. Generating commands based on location and wakeword
US10447748B2 (en) 2016-05-12 2019-10-15 Apple Inc. Sharing media information between applications on client devices
US10149049B2 (en) 2016-05-13 2018-12-04 Bose Corporation Processing speech from distributed microphones
US20170330565A1 (en) 2016-05-13 2017-11-16 Bose Corporation Handling Responses to Speech Processing
US10187440B2 (en) 2016-05-27 2019-01-22 Apple Inc. Personalization of media streams
US10063965B2 (en) 2016-06-01 2018-08-28 Google Llc Sound source estimation using neural networks
US10474419B2 (en) 2016-06-03 2019-11-12 Crestron Electronics, Inc. Audio digital signal processor utilizing a hybrid network architecture
AU2017100581B4 (en) 2016-06-08 2018-02-01 Apple Inc. Intelligent automated assistant for media exploration
US10235124B2 (en) 2016-06-08 2019-03-19 Google Llc Audio announcement prioritization system
US9754605B1 (en) 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
AU2017100486C4 (en) 2016-06-11 2019-09-05 Apple Inc. Intelligent device arbitration and control
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10212029B2 (en) 2016-06-15 2019-02-19 Microsoft Technology Licensing, Llc Service provisioning in cloud computing systems
ITUA20164622A1 (it) 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10091545B1 (en) 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US9728188B1 (en) 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
EP3270377B1 (en) 2016-07-12 2020-02-19 Dolby Laboratories Licensing Corporation Assessment and adjustment of audio installation
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10621992B2 (en) 2016-07-22 2020-04-14 Lenovo (Singapore) Pte. Ltd. Activating voice assistant based on at least one of user proximity and context
KR102575634B1 (ko) 2016-07-26 2023-09-06 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
CN106028223A (zh) 2016-07-26 2016-10-12 广东欧珀移动通信有限公司 一种智能音箱的控制方法、装置及智能音箱
US10431211B2 (en) 2016-07-29 2019-10-01 Qualcomm Incorporated Directional processing of far-field audio
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
US10187503B2 (en) 2016-08-19 2019-01-22 Amazon Technologies, Inc. Enabling voice control of telephone device
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
WO2018039045A1 (en) 2016-08-24 2018-03-01 Knowles Electronics, Llc Methods and systems for keyword detection using keyword repetitions
US10461953B2 (en) 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10057698B2 (en) 2016-09-02 2018-08-21 Bose Corporation Multiple room communication system and method
EP3497629B1 (en) 2016-09-06 2020-11-04 Deepmind Technologies Limited Generating audio using neural networks
EP3297298B1 (en) 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9972318B1 (en) 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
JP6520878B2 (ja) 2016-09-21 2019-05-29 トヨタ自動車株式会社 音声取得システムおよび音声取得方法
JP2018055259A (ja) 2016-09-27 2018-04-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US10409548B2 (en) 2016-09-27 2019-09-10 Grabango Co. System and method for differentially locating and modifying audio sources
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
KR20200035476A (ko) 2016-10-03 2020-04-03 구글 엘엘씨 디바이스 토폴로지에 기초한 음성 명령 프로세싱
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
JP6882463B2 (ja) 2016-10-03 2021-06-02 グーグル エルエルシーGoogle LLC コンピュータによるエージェントのための合成音声の選択
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180122372A1 (en) 2016-10-31 2018-05-03 Soundhound, Inc. Distinguishable open sounds
US10783883B2 (en) 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device
KR102241970B1 (ko) 2016-11-07 2021-04-20 구글 엘엘씨 기록된 미디어 핫워드 트리거 억제
US10154496B2 (en) 2016-11-10 2018-12-11 Futurewei Technologies, Inc. System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems
CN106708403A (zh) 2016-11-30 2017-05-24 努比亚技术有限公司 输入滑动操作时同步播放提示音的方法及装置
US10186265B1 (en) 2016-12-06 2019-01-22 Amazon Technologies, Inc. Multi-layer keyword detection to avoid detection of keywords in output audio
US10079015B1 (en) 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10255032B2 (en) 2016-12-13 2019-04-09 EVA Automation, Inc. Wireless coordination of audio sources
US11184764B2 (en) 2016-12-14 2021-11-23 Amzetta Technologies, Llc Methods and systems of establishing communication between devices
CN106531165A (zh) 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
US10339957B1 (en) 2016-12-20 2019-07-02 Amazon Technologies, Inc. Ending communications session based on presence data
US10068573B1 (en) 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
US10580405B1 (en) 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10276161B2 (en) 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10186266B1 (en) 2016-12-28 2019-01-22 Amazon Technologies, Inc. Message playback using a shared device
US10229680B1 (en) 2016-12-29 2019-03-12 Amazon Technologies, Inc. Contextual entity resolution
US10831366B2 (en) 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
KR102412202B1 (ko) 2017-01-03 2022-06-27 삼성전자주식회사 냉장고 및 이의 정보 표시 방법
US10672387B2 (en) 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US11164570B2 (en) 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
KR20180084392A (ko) 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10306254B2 (en) 2017-01-17 2019-05-28 Seiko Epson Corporation Encoding free view point data in movie data container
KR20180085931A (ko) 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
KR102556840B1 (ko) 2017-01-20 2023-07-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20180090586A (ko) 2017-02-03 2018-08-13 삼성전자주식회사 알림을 제공하는 방법 및 그 전자 장치
WO2018148315A1 (en) 2017-02-07 2018-08-16 Lutron Electronics Co., Inc. Audio-based load control system
US10762891B2 (en) 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN108446281B (zh) 2017-02-13 2021-03-12 北京嘀嘀无限科技发展有限公司 确定用户亲密度的方法、装置及存储介质
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US10264358B2 (en) 2017-02-15 2019-04-16 Amazon Technologies, Inc. Selection of master device for synchronized audio
US10839795B2 (en) 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
US10431217B2 (en) 2017-02-15 2019-10-01 Amazon Technologies, Inc. Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point
CN106921560B (zh) 2017-02-28 2020-06-02 北京小米移动软件有限公司 语音通信方法、装置及系统
US10706843B1 (en) 2017-03-09 2020-07-07 Amazon Technologies, Inc. Contact resolution for communications systems
US20180262793A1 (en) 2017-03-09 2018-09-13 Google Inc. Reverse Casting from a First Screen Device to a Second Screen Device
US10089981B1 (en) 2017-03-09 2018-10-02 Amazon Technologies, Inc. Messaging account disambiguation
US10540961B2 (en) 2017-03-13 2020-01-21 Baidu Usa Llc Convolutional recurrent neural networks for small-footprint keyword spotting
US10074371B1 (en) 2017-03-14 2018-09-11 Amazon Technologies, Inc. Voice control of remote device by disabling wakeword detection
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10600406B1 (en) 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US10621980B2 (en) 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10643609B1 (en) 2017-03-29 2020-05-05 Amazon Technologies, Inc. Selecting speech inputs
CN107135443B (zh) 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10373630B2 (en) 2017-03-31 2019-08-06 Intel Corporation Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
US11188808B2 (en) 2017-04-11 2021-11-30 Lenovo (Singapore) Pte. Ltd. Indicating a responding virtual assistant from a plurality of virtual assistants
US10748531B2 (en) 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
KR102068182B1 (ko) 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR102298947B1 (ko) 2017-04-28 2021-09-08 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10013995B1 (en) 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
US10628484B2 (en) 2017-05-17 2020-04-21 Board Of Trustees Of The University Of Illinois Vibrational devices as sound sensors
US10564928B2 (en) 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
US10522146B1 (en) 2019-07-09 2019-12-31 Instreamatic, Inc. Systems and methods for recognizing and performing voice commands during advertisement
US10983753B2 (en) 2017-06-09 2021-04-20 International Business Machines Corporation Cognitive and interactive sensor based smart home solution
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US10950228B1 (en) 2017-06-28 2021-03-16 Amazon Technologies, Inc. Interactive voice controlled entertainment
US10687353B2 (en) 2017-07-10 2020-06-16 Qualcomm Incorporated Management of conflicting scheduling commands in wireless networks
US20190013019A1 (en) 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US10310082B2 (en) 2017-07-27 2019-06-04 Quantenna Communications, Inc. Acoustic spatial diagnostics for smart home management
US11205421B2 (en) 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US11798544B2 (en) 2017-08-07 2023-10-24 Polycom, Llc Replying to a spoken command
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102389041B1 (ko) 2017-08-11 2022-04-21 엘지전자 주식회사 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US10546583B2 (en) * 2017-08-30 2020-01-28 Amazon Technologies, Inc. Context-based device arbitration
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10366699B1 (en) 2017-08-31 2019-07-30 Amazon Technologies, Inc. Multi-path calculations for device energy levels
US10911596B1 (en) 2017-08-31 2021-02-02 Amazon Technologies, Inc. Voice user interface for wired communications system
US10847149B1 (en) 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
US10482895B2 (en) 2017-09-01 2019-11-19 Cirrus Logic, Inc. Acoustic echo cancellation (AEC) rate adaptation
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
JP6571144B2 (ja) 2017-09-08 2019-09-04 シャープ株式会社 監視システム、監視機器、サーバ、および監視方法
US20190082255A1 (en) 2017-09-08 2019-03-14 Olympus Corporation Information acquiring apparatus, information acquiring method, and computer readable recording medium
US10083006B1 (en) 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
KR102338376B1 (ko) 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US9973849B1 (en) 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10719507B2 (en) 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10580411B2 (en) 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10897680B2 (en) 2017-10-04 2021-01-19 Google Llc Orientation-based device interface
US11233782B2 (en) 2017-10-04 2022-01-25 Resilience Magnum IP, LLC Single node network connectivity for structure automation functionality
KR102543693B1 (ko) 2017-10-17 2023-06-16 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10403266B2 (en) 2017-10-18 2019-09-03 Intel Corporation Detecting keywords in audio using a spiking neural network
JP2019086903A (ja) 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
US20190163153A1 (en) 2017-11-30 2019-05-30 International Business Machines Corporation Enforcing dynamic volume thresholds of an entertainment device
US10445365B2 (en) 2017-12-04 2019-10-15 Amazon Technologies, Inc. Streaming radio with personalized content integration
US10510340B1 (en) 2017-12-05 2019-12-17 Amazon Technologies, Inc. Dynamic wakeword detection
US10777189B1 (en) 2017-12-05 2020-09-15 Amazon Technologies, Inc. Dynamic wakeword detection
US10958467B2 (en) 2017-12-06 2021-03-23 Google Llc Ducking and erasing audio from nearby devices
US20190172452A1 (en) 2017-12-06 2019-06-06 GM Global Technology Operations LLC External information rendering
CN107919123B (zh) 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
US11182122B2 (en) 2017-12-08 2021-11-23 Amazon Technologies, Inc. Voice control of computing devices
US20190179611A1 (en) 2017-12-11 2019-06-13 Sonos, Inc. Systems and Methods of Receiving Voice Input
US10051600B1 (en) 2017-12-12 2018-08-14 Amazon Technologies, Inc. Selective notification delivery based on user presence detections
US10425247B2 (en) 2017-12-12 2019-09-24 Rovi Guides, Inc. Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset
US10374816B1 (en) 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US11295748B2 (en) 2017-12-26 2022-04-05 Robert Bosch Gmbh Speaker identification with ultra-short speech segments for far and near field voice assistance applications
US10504507B2 (en) 2017-12-28 2019-12-10 Syntiant Always-on keyword detector
WO2019128541A1 (en) 2017-12-31 2019-07-04 Midea Group Co., Ltd. Method and system for controlling multiple home devices
CN111357048A (zh) 2017-12-31 2020-06-30 美的集团股份有限公司 用于控制家庭助手装置的方法和系统
US9972343B1 (en) 2018-01-08 2018-05-15 Republic Wireless, Inc. Multi-step validation of wakeup phrase processing
US10795332B2 (en) 2018-01-16 2020-10-06 Resilience Magnum IP, LLC Facilitating automating home control
US20190237067A1 (en) 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10157042B1 (en) 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
US11024307B2 (en) 2018-02-08 2021-06-01 Computime Ltd. Method and apparatus to provide comprehensive smart assistant services
US10425780B1 (en) 2018-02-22 2019-09-24 Amazon Technologies, Inc. Outputting notifications using device groups
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10749828B2 (en) 2018-03-14 2020-08-18 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications
US10491962B2 (en) 2018-03-14 2019-11-26 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10685669B1 (en) 2018-03-20 2020-06-16 Amazon Technologies, Inc. Device selection from audio data
US10440440B1 (en) 2018-03-23 2019-10-08 Rovi Guides, Inc. Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device
US10446169B1 (en) 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
US10755706B2 (en) 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
US11151991B2 (en) 2018-03-30 2021-10-19 Verizon Media Inc. Electronic message transmission
WO2019193378A1 (en) 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US10679629B2 (en) 2018-04-09 2020-06-09 Amazon Technologies, Inc. Device arbitration by multiple speech processing systems
CN108520741B (zh) 2018-04-12 2021-05-04 科大讯飞股份有限公司 一种耳语音恢复方法、装置、设备及可读存储介质
US10928917B2 (en) 2018-04-12 2021-02-23 International Business Machines Corporation Multiple user interaction with audio devices using speech and gestures
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
JP2019204025A (ja) 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10777195B2 (en) 2018-05-31 2020-09-15 International Business Machines Corporation Wake command nullification for digital assistance and voice recognition technologies
US10433058B1 (en) 2018-06-14 2019-10-01 Sonos, Inc. Content rules engines for audio playback devices
US10762896B1 (en) 2018-06-25 2020-09-01 Amazon Technologies, Inc. Wakeword detection
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11144596B2 (en) 2018-07-24 2021-10-12 Harman International Industries, Incorporated Retroactive information searching enabled by neural sensing
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
KR102225984B1 (ko) 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US10622009B1 (en) 2018-09-10 2020-04-14 Amazon Technologies, Inc. Methods for detecting double-talk
US20200090647A1 (en) 2018-09-14 2020-03-19 Comcast Cable Communications, Llc Keyword Detection In The Presence Of Media Output
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10650807B2 (en) 2018-09-18 2020-05-12 Intel Corporation Method and system of neural network keyphrase detection
US10861444B2 (en) 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US10950249B2 (en) 2018-09-25 2021-03-16 Amazon Technologies, Inc. Audio watermark encoding/decoding
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11170758B2 (en) 2018-09-27 2021-11-09 Rovi Guides, Inc. Systems and methods for providing notifications within a media asset without breaking immersion
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
KR102606789B1 (ko) 2018-10-01 2023-11-28 삼성전자주식회사 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치
US10971158B1 (en) 2018-10-05 2021-04-06 Facebook, Inc. Designating assistants in multi-assistant environment based on identified wake word received from a user
US10346122B1 (en) 2018-10-18 2019-07-09 Brent Foster Morgan Systems and methods for a supplemental display screen
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11198446B2 (en) 2019-01-04 2021-12-14 Faraday & Future Inc. On-board vehicle query system
JP2020112692A (ja) 2019-01-11 2020-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 方法、制御装置、及びプログラム
EP3690575B1 (de) 2019-02-04 2022-08-24 Siemens Aktiengesellschaft Verfahren zur überprüfung einer konsistenten erfassung von rohrleitungen in einem projektierungssystem, projektierungssystem und steuerungsprogramm
CN109712626B (zh) 2019-03-04 2021-04-30 腾讯科技(深圳)有限公司 一种语音数据处理方法及装置
US10943598B2 (en) 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US10984783B2 (en) 2019-03-27 2021-04-20 Intel Corporation Spoken keyword detection based utterance-level wake on intent system
US20200310751A1 (en) 2019-03-29 2020-10-01 Qualcomm Incorporated System and method of managing device sound level
DK3726856T3 (da) 2019-04-17 2023-01-09 Oticon As Høreanordning omfattende en nøgleordsdetektor og en egen stemme-detektor
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
JP7191793B2 (ja) 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11823659B2 (en) 2019-12-11 2023-11-21 Amazon Technologies, Inc. Speech recognition through disambiguation feedback
CN111341306B (zh) 2020-02-14 2022-06-17 东南大学 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004109361A (ja) * 2002-09-17 2004-04-08 Toshiba Corp 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP2014510481A (ja) * 2011-03-03 2014-04-24 マイクロソフト コーポレーション マイクロホンアレイのためのノイズ適応的ビームフォーミング
US9947333B1 (en) * 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US20160316293A1 (en) * 2015-04-21 2016-10-27 Google Inc. Sound signature database for initialization of noise reduction in recordings
US20170270919A1 (en) * 2016-03-21 2017-09-21 Amazon Technologies, Inc. Anchored speech detection and speech recognition
JP2019514045A (ja) * 2016-03-21 2019-05-30 アマゾン テクノロジーズ インコーポレイテッド 話者照合方法及びシステム
WO2018140777A1 (en) * 2017-01-28 2018-08-02 Bose Corporation Audio device filter modification
JP2020505648A (ja) * 2017-01-28 2020-02-20 ボーズ・コーポレーションBose Corporation オーディオデバイスフィルタの変更

Also Published As

Publication number Publication date
JP7271674B2 (ja) 2023-05-11
US20230217165A1 (en) 2023-07-06
US11540047B2 (en) 2022-12-27
US20220007106A1 (en) 2022-01-06
WO2020132298A1 (en) 2020-06-25
CN113330752A (zh) 2021-08-31
US11159880B2 (en) 2021-10-26
US10602268B1 (en) 2020-03-24
CA3123601A1 (en) 2020-06-25
AU2019405936A1 (en) 2021-07-15
EP3900395A1 (en) 2021-10-27
US20200213729A1 (en) 2020-07-02

Similar Documents

Publication Publication Date Title
JP7271674B2 (ja) ネットワークマイクロフォンデバイスのノイズ分類による最適化
US11727936B2 (en) Voice detection optimization based on selected voice assistant service
US11538460B2 (en) Networked microphone devices, systems, and methods of localized arbitration
JP7351937B2 (ja) コマンドキーワード調整を伴うネットワークマイクロフォンデバイス
KR102308525B1 (ko) 뉴럴 네트워크 모델을 사용하여 선택적 활성 단어 검출을 위한 시스템 및 방법
US20240004609A1 (en) Noise classification for event detection
US10878811B2 (en) Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11790937B2 (en) Voice detection optimization using sound metadata
US11915687B1 (en) Systems and methods for generating labeled data to facilitate configuration of network microphone devices
US20230097522A1 (en) Mapping and characterizing acoustic events within an environment via audio playback devices
WO2023056280A1 (en) Noise reduction using synthetic audio

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230426

R150 Certificate of patent or registration of utility model

Ref document number: 7271674

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150