JP2023164959A - ボイスアシスタンスを備えたメディア再生システム - Google Patents
ボイスアシスタンスを備えたメディア再生システム Download PDFInfo
- Publication number
- JP2023164959A JP2023164959A JP2023144379A JP2023144379A JP2023164959A JP 2023164959 A JP2023164959 A JP 2023164959A JP 2023144379 A JP2023144379 A JP 2023144379A JP 2023144379 A JP2023144379 A JP 2023144379A JP 2023164959 A JP2023164959 A JP 2023164959A
- Authority
- JP
- Japan
- Prior art keywords
- voice input
- vas
- playback
- zone
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 123
- 230000004044 response Effects 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims description 44
- 230000015654 memory Effects 0.000 claims description 37
- 238000003860 storage Methods 0.000 claims description 22
- 238000010586 diagram Methods 0.000 description 73
- 230000008569 process Effects 0.000 description 24
- 230000006870 function Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000003213 activating effect Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000004330 variable angle spinning Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000238558 Eucarida Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 241001236678 Gila pandora Species 0.000 description 1
- 241000502522 Luscinia megarhynchos Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/436—Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
- H04N21/43615—Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
- Software Systems (AREA)
- Selective Calling Equipment (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
Abstract
【課題】メディア再生システムのボイスアシスタンスを発動させる方法及びネットワークマイクロフォンデバイスを提供する。【解決手段】方法は、メディア再生システムが、少なくとも1つのマイクロフォンデバイスを介してボイス入力を取得することと、ボイス入力内に1つ又は複数のコマンドが含まれていることを検出することと、1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドに関連するコマンドクライテリアを満たすことを判断することと、判断に基づいて、第一のボイスアシスタントサービス(VAS)を選択して第二のVASの選択を放棄し、ボイス入力を第一のVASに送信することと、ボイス入力の送信後、第一のVASからのボイス入力への返答を受信することと、を含む。【選択図】図7B
Description
この出願は、2017年9月29日に出願された米国特許出願第15/721、141号明細書に基づく優先権を主張する。この出願の内容は、その全体が参照により本明細書に組み込まれる。
本願は、コンシューマ製品に関するものであり、特に、メディア再生のボイス制御に向けられた方法、システム、製品、機能、サービス、及び他の要素に関するものや、それらのいくつかの態様に関する。
2003年に、ソノズ・インコーポレイテッドが最初の特許出願のうちの1つである「複数のネットワークデバイス間のオーディオ再生を同期する方法」と題する特許出願をし、2005年にメディア再生システムの販売を開始するまで、アウトラウド設定におけるデジタルオーディオへのアクセス及び試聴のオプションは制限されていた。人々は、ソノズ無線HiFiシステムによって、1つ又は複数のネットワーク再生デバイスを介して多くのソースから音楽を実質的に無制限に体験できるようになっている。スマートフォン、タブレット、又はコンピュータにインストールされたソフトウェアコントロールアプリケーションを通じて、ネットワーク再生デバイスを備えた全ての部屋において、人々は自分が望む音楽を再生することができる。加えて、例えばコントローラを用いて、再生デバイスを備えた各部屋に異なる歌をストリーミングすることもできるし、同期再生のために複数の部屋をグループ化することもできるし、同期して同じ歌を全ての部屋において聞くこともできる。
デジタルメディアに対する関心の継続的な高まりを考えると、試聴体験をさらに向上させることができるコンシューマアクセス可能な技術をさらに開発することにニーズがあり続ける。
本明細書で開示されている技術の特徴、態様、及び利点は、以下の記載、添付の特許請求の範囲、及び添付の図面を参照するとより理解しやすい。
図面は、いくつかの例示的な実施形態を説明することを目的としているが、本発明が、図面に示した配置及び手段に限定されるものではないことは理解される。特定のいかなる要素の説明をも容易にするために、部品符号の重要な桁の値はその要素が初めて紹介された図を参照する。例えば、要素107は、図1を参照して初めて紹介され説明された。
I.概要
無線照明デバイス、ホームオートメーションデバイス(例えばサーモスタット、ドアロック、等)、及びオーディオ再生デバイス等のスマート家電品及びその関連デバイスを有する「スマートホーム」にとって、ボイス制御は有益であり得る。いくつかの実施例において、ネットワークマイクロフォンデバイスがスマートホームのデバイスを制御するために使用され得る。ネットワークマイクロフォンデバイスは通常ボイス入力を受信するためのマイクロフォンを含む。ネットワークマイクロフォンデバイスは、ボイス入力をボイスアシスタントサービス(VAS)に転送できる。従来のVASは、クラウドサーバーがボイス入力を処理することにより実施される遠隔サービスであり得る。VASはボイス入力を処理してボイス入力の意図を判断し得る。応答に基づいて、ネットワークマイクロフォンデバイスは1つ又は複数のスマートデバイスに動作をさせる。例えば、VASからの指示への応答に基づいてネットワークマイクロフォンデバイスは照明デバイスをオン・オフさせ得る。
無線照明デバイス、ホームオートメーションデバイス(例えばサーモスタット、ドアロック、等)、及びオーディオ再生デバイス等のスマート家電品及びその関連デバイスを有する「スマートホーム」にとって、ボイス制御は有益であり得る。いくつかの実施例において、ネットワークマイクロフォンデバイスがスマートホームのデバイスを制御するために使用され得る。ネットワークマイクロフォンデバイスは通常ボイス入力を受信するためのマイクロフォンを含む。ネットワークマイクロフォンデバイスは、ボイス入力をボイスアシスタントサービス(VAS)に転送できる。従来のVASは、クラウドサーバーがボイス入力を処理することにより実施される遠隔サービスであり得る。VASはボイス入力を処理してボイス入力の意図を判断し得る。応答に基づいて、ネットワークマイクロフォンデバイスは1つ又は複数のスマートデバイスに動作をさせる。例えば、VASからの指示への応答に基づいてネットワークマイクロフォンデバイスは照明デバイスをオン・オフさせ得る。
ネットワークマイクロフォンデバイスによって検出されるボイス入力は、ウェイクワード(wake word)と、続いてユーザのリクエストを含む発声を通常含む。ウェイクワードは通常VASを起動させてボイス入力の意図の解釈のために発動させる目的で使われる所定の単語又はフレーズである。例えば、AMAZON(登録商標)のVASに問いかけるときにユーザは「Alexa」というウェイクワードを発するであろう。他の例としては、GOOGLE(登録商標)のVASを発動させるための「Ok、Google」、及びAPPLE(登録商標)を発動させるための「Hey、Siri」、又はSONOS(登録商標)が提供するVASのための「Hey、Sonos」などが含まれる。
ネットワークマイクロフォンデバイスは、ボイス入力中のウェイクワードに付随するユーザのリクエスト又はコマンドに耳を澄ませる。いくつかの例において、ユーザのリクエストは、例えばサーモスタット(例えばNEST(登録商標)サーモスタット)、照明デバイス(例えばPHILIPS HUE(登録商標)照明デバイス)、又はメディア再生デバイス(例えばSonos(登録商標)再生デバイス)などのサードパーティーのデバイスを制御するコマンドを含み得る。例えば、ユーザは、AMAZON(登録商標)VASを使って家の温度を設定するために、ウェイクワード「Alexa」に続いて「サーモスタットを68度に設定して」と発声し得る。ユーザは、家のリビングルームエリアの照明デバイスをオンにするために、同じウェイクワードに続いて「リビングルームを点灯して」と発声し得る。ユーザは同様に、ウェイクワードに続いて特定の曲、アルバム、又は音楽のプレイリストを家の再生デバイスにおいて再生するリクエストを発声し得る。
VASは、ボイス入力を処理するために自然言語理解(NLU:natural language understanding)システムを採用し得る。NLUシステムは通常、所与のボイス入力の根底の意図を検出するようにプログラムされた複数の遠隔サーバを必要とする。例えば、サーバは、ユーザの意図を判断するために言語の語彙集(lexicon)、パーサ(parser)、文法及び意味のルール、及び関連した処理アルゴリズムを管理し得る。
従来のVASが遭遇する課題の1つは、NLU処理の演算負荷が重いことである。例えば、語法(parlance)のニュアンス、文章構造、発音、及びその他の会話の特徴を扱うために、ボイス処理アルゴリズムは常時アップデートされる必要がある。したがって、VASの提供者は、世界中のユーザから受信される無数のボイス入力を扱うために、処理アルゴリズムを管理し、継続的に開発し、追加のクラウドサーバーなどの増大する複数の資源を展開しなければならない。
関連する課題の1つは、特定のスマートデバイスのボイス制御が比較的複雑なボイス処理アルゴリズムを必要とし得て、VAS資源にさらなる負担をかけ得ることである。例えば、リビングルームの一セットの照明デバイスのスイッチをオンにするために、あるユーザは「灯りをつけて(flip on the lights)」と言うのを好むかもしれないが、別のユーザは「リビングを点灯させて(turn on the living room)」と言うのを好むかもしれない。両方のユーザは照明デバイスを点灯させるという同一の意図を有するが、動詞を含むフレーズの構造は異なるし、その上、後者のフレーズはリビングルームのデバイスであることを識別しているが前者は識別していないことは言うまでもない。これらの課題に対応するため、例えばコマンドの構造及び関連する構文(syntax)の微妙でありながらも意味のあるバリエーションを区別するためのアルゴリズムなどの、特に複雑なボイス処理資源及びアルゴリズムを必要とするスマートデバイスを制御するとき、VASは、ユーザの意図を解読するためにさらなる資源を捧げなければならない。
スマートデバイスの消費者需要が増大し、これらのデバイスが多様化するにつれて、VAS提供者の中には進歩に追いつくのが困難となるものもあり得る。VASのシステム資源に限界があり、入ってくるボイス入力に正しく応答することができない場合もある。例えば、上記の例において、VASは、「灯りを点灯して(turn on the lights)」との発声を処理する能力を有するが、「灯りをつけて(flip on the lights)」との発声を処理する能力に欠けるかもしれず、これはシステムが、後者のより慣用的なフレーズの意図を認識できないアルゴリズムを使っているかもしれないからである。そのような場合、ユーザは、「リビングルームの照明を点灯しろ(turn on the lights in the living room)」と言うなどのさらに限定的な情報で元の要求を言い換える必要があり得る。代わりにVASは、そのような要求は処理できない、とユーザに通知してもよいし、又はVASは、単に要求を完全無視してもよい。これらのいずれの場合も、ユーザは拙いボイス制御の体験に不満を感じ得る。
マルチゾーン再生システムなどのメディア再生システムの場合、従来のVASには特に制限される場合がある。例えば、従来のVASがサポートするのは基本的な再生のボイス制御のみであり得て、又はユーザは、デバイスと交信するために自然な対話ではなく特定の誇張したフレーズ回しを使う必要があり得る。さらに、従来のVASはマルチゾーン再生、又はユーザが制御したいデバイスグルーピング、マルチルーム音量、イコライザーパラメータ、及び/又は所与の再生シナリオのオーディオコンテンツ、などのその他の機能をサポートしない場合がある。そのような機能を制御するためには、基本的な再生に必要であるよりも著しく大きい資源を必要とし得る。
ここで説明されるメディア再生システムは従来のVASのこれらの及びその他の制限に対応可能である。例えば、いくつかの実施形態において、ボイス入力を処理するためにメディア再生は第二のVAS(例えば、従来のVAS)よりも第一のVAS(例えば、強化されたVAS)を選択するように構成される。そのような場合、メディア再生システムは、メディア再生システムの比較的高度な他の機能を制御するためのボイス入力などの特定のボイス入力を処理するために第二よりも第一のVASを選択することにより介入し得る。1つの態様において、第二のVAS単独により提供されるボイス制御と比較して、第一のVASはボイス制御を向上させ得る。いくつかの実施形態において、メディア再生システムをターゲットとする少なくともいくつかのボイス入力は、第二のVASを介しては発動不可であり得る。これら及びその他の実施形態において、少なくともいくつかのボイス入力は、第二のVASを介して発動可能ではあるが、第一のVASが特定のボイス入力を処理する方が好ましいかもしれない。例えば、第一のVASの方が第二のVASよりも特定のボイス入力をより高い信頼性でより正確に処理できるかもしれない。いくつかの実施形態において、第二のVASが、特定のタイプのボイス入力が通常送られるデフォルトのVASであり得る。例えば、いくつかの実施形態において、「今日の天気は?」というボイス入力などの基本的なインターネットクエリ(query)を含む要求を扱うためには従来のVASの方がより適している場合がある。関連する実施形態において、ユーザは、(「ヘイ、サマンサ」などの)同じウェイクワードを第一及び第二の両方のVASを発動させるときに使い得る。1つの態様において、ボイス入力を発声するとき、VASの選択が見えないところで起こっていることに気づかない場合がある。一実施形態において、ウェイクワードは、AMAZONのALEXA(登録商標)などの従来のVASに関連したウェイクワードでもよい。
一実施形態において、メディア再生システムは、ボイス入力を取得(capture)するためのネットワークマイクロフォンデバイスを含んでもよい。メディア再生システムは、(i)少なくとも1つのマイクロフォンデバイスを介してボイス入力を取得し、(ii)取得されたボイス入力中にコマンドの1つ又は複数が含まれていることを検出し、(iii)その1つ又は複数のコマンドが1セットのコマンド情報の対応するコマンドクライテリアを満たすことを判断し、(iv)その判断に応じて(a)第二のVASの選択を放棄して第一のVASを選択し、(b)ボイス入力を第一のVASに送り、(c)ボイス入力を送った後、第一のVASからのボイス入力への応答を処理するように構成される。
いくつかの実施形態において、ネットワークマイクロフォンデバイスは、ネットワークマイクロフォンデバイスのローカルメモリにコマンド情報のセットを記憶するように構成される。いくつかの実施形態において、コマンド情報のセットは、ローカルエリアネットワーク(LAN)上の別のネットワークマイクロフォンデバイス又は再生デバイスなどの別のネットワークデバイスに記憶されてもよい。いくつかの実施形態において、コマンド情報のセットはLAN上に、及び/又は遠隔的に、複数のネットワークデバイスにわたって記憶されてもよい。下に説明される様々な実施形態において、コマンド情報のセットは、メディア再生システムが第二のVASの選択を放棄して第一のVASを選択すべきか否かを判断する工程において使用されてもよい。
いくつかの実施形態において、ネットワークマイクロフォンデバイスは所定のコマンド、及びコマンドと関連するコマンドクライテリアのリストを記憶してもよい。コマンドは、例えば、再生、制御、及びゾーンターゲットするコマンドを含んでもよい。コマンドクライテリアは、例えば、特定のコマンドに関連した所定のキーワードを含み得る。ボイス入力中のキーワードの組み合わせは、例えば、家の第一の部屋の名前(例えば、リビングルーム)の発声、及びの第二の部屋の名前(例えば、寝室)の発声を含んでもよい。ユーザが特定のコマンド(音楽を再生するコマンドなど)を含むボイス入力をキーワードと組み合わせて発声するとき、メディア再生システムはボイス入力を処理するために第一のVASを選択して発動させる。
いくつかの実施形態において、キーワードはトレーニング及び適応的学習アルゴリズムによって開発されてもよい。特定の実施形態において、そのようなキーワードは、キーワードを含むボイス入力を処理する最中にその場で判断され得る。そのような場合、キーワードはボイス入力を処理する前に事前に決定されないものの、第一のVASがコマンドに基づいて発動することを可能とする。関連した実施形態において、キーワードは、同じ意図を有するコマンドの特定の同義語(cognate)と関連し得る。
いくつかの実施形態において、第一のVASを発動することは、1つ又は複数の第一のVASの遠隔サーバにボイス入力を送ることを含んでもよい。上の例において、第一のVASは第一及び第二の部屋で音楽を再生するユーザの意図を判断し、望むオーディオを第一及び第二の部屋でメディア再生システムに再生させることによって応答してもよい。第一のVASはまた、第一及び第二の部屋からなるグループを形成するようにメディア再生システムに指示してもよい。
本明細書に記載されるいくつかの実施形態は、「ユーザ」、及び/又は他の実体等、所定の行為者により実行される機能を示す場合があるが、この記載は、説明の目的のみであることを理解されたい。特許請求の範囲自体に明示的に必要であることが記載されていない限り、こうした任意の行為者による行動が必要であると解釈されるべきではない。
II.例示的な動作環境
図1は、本明細書で開示されている1つ又は複数の実施形態で実施可能なメディア再生システム100の例示的な構成を示す。図示されるように、メディア再生システム100は、複数の部屋及び空間、例えば、オフィス、ダイニングルーム、及びリビングルームを有する例示的なホーム環境に関連している。これらの部屋及び空間内に、メディア再生システム100は、再生デバイス102(再生デバイス102a-102mとして個々に識別される)、ネットワークマイクロフォンデバイス193(「NMD」103a-103gとして個々に識別される)、及びコントローラデバイス104a、104b(集合的に「コントローラデバイス104」)を含む。ホーム環境は、1つ又は複数のスマート照明デバイス108及びスマートサーモスタット110などの他のネットワークデバイスを含んでもよい。
図1は、本明細書で開示されている1つ又は複数の実施形態で実施可能なメディア再生システム100の例示的な構成を示す。図示されるように、メディア再生システム100は、複数の部屋及び空間、例えば、オフィス、ダイニングルーム、及びリビングルームを有する例示的なホーム環境に関連している。これらの部屋及び空間内に、メディア再生システム100は、再生デバイス102(再生デバイス102a-102mとして個々に識別される)、ネットワークマイクロフォンデバイス193(「NMD」103a-103gとして個々に識別される)、及びコントローラデバイス104a、104b(集合的に「コントローラデバイス104」)を含む。ホーム環境は、1つ又は複数のスマート照明デバイス108及びスマートサーモスタット110などの他のネットワークデバイスを含んでもよい。
メディア再生システム100の様々な再生デバイス、ネットワークマイクロフォンデバイス、及びコントローラデバイス102-104、及び/又は他のネットワークデバイスは、ポイント間接続及び/又はネットワークルータ106を含むLANを介した有線及び/又は無線のその他の接続を介してお互いに連結してもよい。例えば、再生デバイス102j(「左」と名付けられる)は、再生デバイス102a(「右」と名付けられる)とポイント間接続(point-to-point connection)を有してもよい。一実施形態において、「左」再生デバイス102jはポイント間接続を介して「右」再生デバイス102aと通信してもよい。関連した実施形態において、「左」再生デバイス102jはポイント間接続及び/又はLANを介した他の接続などを介して他のネットワークデバイスと通信してもよい。
ネットワークルータ106は、ワイドエリアネットワーク(WAN)を介して1つ又は複数のリモートコンピュータ105に連結してもよい。いくつかの実施形態において、リモートコンピュータはクラウドサーバーでもよい。リモートコンピュータ105は、様々な方法でメディア再生システム100と対話するように構成されてもよい。例えば、リモートコンピュータは、ホーム環境におけるオーディオなどのメディアコンテンツ再生のストリーミング及び制御を容易にするように構成されてもよい。下により詳細に説明される技術の一態様において、リモートコンピュータ105はメディア再生システム100に第一のVAS160を提供するように構成される。
いくつかの実施形態において、再生デバイス102の1つ又は複数は、オンボード(例えば、統合された)ネットワークマイクロフォンデバイスを含んでもよい。例えば、再生デバイス102a-eは、対応するNMD103a-eをそれぞれ含む。ネットワークマイクロフォンデバイスを含む再生デバイスは、明細書で特に記述がない限り、ここでは再生デバイス又はネットワークマイクロフォンデバイスと交換可能で参照され得る。
いくつかの実施形態において、NMD103の1つ又は複数は、独立したデバイスでもよい。例えば、NMD103f及び103gは独立したネットワークマイクロフォンデバイスでもよい。独立したネットワークマイクロフォンデバイスは、再生デバイスに通常含まれるスピーカ又は関連した電子部品などのコンポーネントを省いてもよい。そのような場合、独立したネットワークマイクロフォンデバイスはオーディオ出力を生成しなくてもよく、又は限定的なオーディオ出力(例えば、比較的低品質のオーディオ出力)を生成してもよい。
使用中、ネットワークマイクロフォンデバイスは、近傍にいるユーザからのボイス入力を受信して処理し得る。例えば、ネットワークマイクロフォンデバイスはユーザが入力を発声したことを検出するとボイス入力を取得するようにしてもよい。図示した例において、リビングルームの再生デバイス102aのNMD103aは、近傍にいるユーザからのボイス入力を取得し得る。いくつかの例において、ボイス入力のソース(例えば、ユーザ)の近傍にある他のネットワークマイクロフォンデバイス(例えば、NMD103b及び103f)もボイス入力を検出し得る。そのような場合、ネットワークマイクロフォンデバイス群は、お互いの間で調停を行い、いずれのデバイスが検出したボイス入力を取得及び/又は処理するべきかを判断し得る。ネットワークマイクロフォンデバイス間での選択及び調停の例は、例えば2017年2月21日付けの米国特許出願公開第15/438、749号明細書に記載されており、この出願の名称は「メディア再生システムのボイス制御」であり、その全体がここで参照され援用される。
特定の実施形態において、ネットワークマイクロフォンデバイスは、ネットワークマイクロフォンデバイスを含み得ない再生デバイスに割り当てられてもよい。例えば、NMD103fが、近傍の再生デバイス102i及び/又は102lに割り当てられてもよい。関連した例において、ネットワークマイクロフォンデバイスは、それが割り当てられた再生デバイスを通してオーディオを出力し得る。ネットワークマイクロフォンデバイスと再生デバイスとを指名されたデバイス、又はデフォルトのデバイスとして関連付けることに関するさらなる詳細は、例えば既に参照した米国特許出願第15/438、749号明細書に記載されている。
例示的なメディア再生システム100の異なる構成要素、及び異なる構成要素がどのように対話してユーザにメディア体験を提供するかに関するさらなる態様は、以下のセクションで述べられている。本明細書における説明は、概してメディア再生システム100を参照しているかもしれないが、本明細書で述べられている技術は、図1に示されるホーム環境内など、その他の用途に限定されるものではない。例えば、本明細書で述べられている技術は、再生デバイス、ネットワークマイクロフォンデバイス、及び/又はコントローラデバイス102-104を多く又は少なく含む別のホーム環境構成において有用かもしれない。加えて、本明細書で述べられている技術は、マルチゾーンオーディオが望まれる環境、例えば、レストラン、モール、又は空港のような商業的環境、スポーツ用多目的車(SUV)、バス又は車のような車両、船、若しくはボード、飛行機などの環境において有用かもしれない。
a.例示的な再生デバイス及びネットワークマイクロフォンデバイス
図2Aは、図1に示す再生デバイス102から選択された1つの、ある態様を示す機能ブロック図である。図示されるように、そのような再生デバイスは、プロセッサ212、ソフトウェアコンポーネント214、メモリ216、オーディオ処理コンポーネント218、オーディオ増幅器220、スピーカ222、及び無線インタフェース232と有線インタフェース234を含むネットワークインタフェース230を含んでもよい。いくつかの実施形態において、再生デバイスはスピーカ222を含まなくてもよく、代わりに再生デバイスを外付けスピーカに接続するためのスピーカインタフェースを含み得る。特定の実施形態において、再生デバイスはスピーカ222もオーディオ増幅器222のいずれも含まないかもしれず、代わりに再生デバイスを外付けオーディオ増幅器又は視聴覚レシーバに接続するためのオーディオインタフェースを含み得る。
図2Aは、図1に示す再生デバイス102から選択された1つの、ある態様を示す機能ブロック図である。図示されるように、そのような再生デバイスは、プロセッサ212、ソフトウェアコンポーネント214、メモリ216、オーディオ処理コンポーネント218、オーディオ増幅器220、スピーカ222、及び無線インタフェース232と有線インタフェース234を含むネットワークインタフェース230を含んでもよい。いくつかの実施形態において、再生デバイスはスピーカ222を含まなくてもよく、代わりに再生デバイスを外付けスピーカに接続するためのスピーカインタフェースを含み得る。特定の実施形態において、再生デバイスはスピーカ222もオーディオ増幅器222のいずれも含まないかもしれず、代わりに再生デバイスを外付けオーディオ増幅器又は視聴覚レシーバに接続するためのオーディオインタフェースを含み得る。
再生デバイスはさらにユーザインタフェース236を含んでもよい。ユーザインタフェース236は、コントローラデバイス104の1つ又は複数から独立して、又はそれと併せてユーザの対話を容易にしてもよい。様々な実施形態において、ユーザインタフェース236は、ユーザが直接入力を提供するために、1つ又は複数の実際のボタン、及び/又はタッチ感応スクリーン及び/又は表面の上に提供されるグラフィカルインタフェースを含み、その他の可能性もある。ユーザインタフェース236はさらに、視覚的及び/又は聴覚的フィードバックをユーザに提供するために光源及びスピーカの1つ又は複数を含んでもよい。
いくつかの実施形態において、プロセッサ212は、メモリ216に記憶された命令に基づいて、入力データを処理するように構成されたクロック駆動のコンピュータコンポーネントであってもよい。メモリ216は、プロセッサ212によって実行可能な命令を記憶するように構成された実体のあるコンピュータ読み取り可能記録媒体であってもよい。例えば、メモリ216は、ある機能を実行するためにプロセッサ212によって実行可能なソフトウェアコンポーネント214の1つ又は複数を搭載することができるデータストレージであってもよい。ある例においては、機能は、再生デバイスがオーディオソース又は別の再生デバイスからオーディオデータを読み出すステップに関与してもよい。別の例においては、機能は、再生デバイスがネットワーク上の別のデバイスにオーディオデータを送信するステップに関与してもよい。さらに別の例においては、機能は、マルチチャンネルオーディオ環境を作るために、再生デバイスと1つ又は複数の再生デバイスとをペアリングすることに関与してもよい。
ある機能は、再生デバイスが、1つ又は複数の他の再生デバイスと、オーディオコンテンツの再生を同期することに関与してもよい。同期した再生の間、同期した再生デバイス同士のオーディオコンテンツの再生の遅延を、聴取者が気づかないかもしれない。2004年4月4日付けの「複数の独立クロックデジタルデータ処理デバイス間の動作を同期するシステム及び方法」と題する米国特許第8、234、395号の全体が本明細書に参照として援用されており、それは再生デバイス間のオーディオ再生を同期することのより詳細な例を提供している。
オーディオ処理コンポーネント218は、1つ又は複数のデジタル-アナログ変換器(DAC)、オーディオ処理コンポーネント、オーディオ強化コンポーネント、又はデジタルシグナルプロセッサ(DSP)などを含んでいてもよい。いくつかの実施形態において、オーディオ処理コンポーネント218の1つ又は複数は、プロセッサ212のサブコンポーネントであってもよい。一例において、オーディオコンテンツが、オーディオ処理コンポーネント218によって処理及び/又は意図的に変更されることによって、オーディオ信号を生成してもよい。生成されたオーディオ信号は次に、オーディオ増幅器210による増幅のために送信され、スピーカ212を通じて再生されてもよい。特に、オーディオ増幅器210は、スピーカ212の1つ又は複数を駆動できるレベルまでオーディオ信号を増幅するように構成されたデバイスを含んでもよい。スピーカ212は、独立した変換器(例えば、「ドライバ」)又は1つ又は複数のドライバを内包する筐体を含む完全なスピーカシステムを備えてもよい。スピーカ212に備えられた特定のドライバは、例えば、サブウーファ(例えば、低周波用)、ミドルレンジドライバ(例えば、中間周波用)、及び/又はツイータ(高周波用)を含んでもよい。ある場合においては、1つ又は複数のスピーカ212のそれぞれの変換器は、オーディオ増幅器210の対応する個々のオーディオ増幅器によって駆動されてもよい。再生するアナログ信号を生成することに加えて、オーディオ処理コンポーネント208は、オーディオコンテンツを処理し、そのオーディオコンテンツを1つ又は複数の他の再生デバイスに再生させるために送信するように構成されてもよい。
再生デバイスによって処理及び/又は再生されるオーディオコンテンツは、外部ソース、例えば、オーディオライン-イン入力接続(例えば、オートディテクティング3.5mmオーディオライン-イン接続)又はネットワークインタフェース230を介して、受信されてもよい。
ネットワークインタフェース230は、データネットワーク上で再生デバイスと1つ又は複数の他のデバイスとの間のデータフローを容易にするように構成されてもよい。このように、再生デバイスは、再生デバイスと通信する1つ又は複数の他の再生デバイス、ローカルエリアネットワーク内のネットワークデバイス、又は例えば、インターネット等のワイドエリアネットワーク上のオーディオコンテンツソースから、データネットワークを介してオーディオコンテンツを受信するように構成されてもよい。ある例では、再生デバイスによって送信及び受信されたオーディオコンテンツ及び他の信号は、インターネットプロトコル(IP)に基づくソースアドレス及びIPに基づく宛先アドレスを含むデジタルパケットデータの形で送信されてもよい。そのような場合、ネットワークインタフェース230は、デジタルパケットデータを解析することによって、再生デバイス宛てのデータが、再生デバイスによって適切に受信されて処理されることができるように構成されてもよい。
図示されるように、ネットワークインタフェース230は、無線インタフェース232と有線インタフェース234とを含んでもよい。無線インタフェース232は、再生デバイスが、通信プロトコル(例えば、無線規格IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4Gモバイル通信基準などを含む無線基準(規格)のいずれか)に基づいて、他のデバイス(例えば、再生デバイスに関連付けられたデータネットワーク内の他の再生デバイス、スピーカ、レシーバ、ネットワークデバイス、制御デバイス)と無線通信するためにネットワークインタフェース機能を提供してもよい。有線インタフェース234は、再生デバイスが、通信プロトコル(例えば、IEEE802.3)に基づいて他のデバイスとの有線接続を介して通信するためのネットワークインタフェース機能を提供してもよい。図2に示されるネットワークインタフェース230は、無線インタフェース232と有線インタフェース234との両方を含んでいるが、ネットワークインタフェース230は、ある実施形態において、無線インタフェースのみか、又は有線インタフェースのみを含んでもよい。
上で説明されたとおり、再生デバイスは図1に示されるNMD103の1つなどのネットワークマイクロフォンデバイスを含んでもよい。ネットワークマイクロフォンデバイスは、プロセッサ212、メモリ216、マイクロフォン224などの再生デバイスのいくつかの又は全てのコンポーネントを共用してもよい。別の例において、ネットワークマイクロフォンデバイスはネットワークマイクロフォンデバイスの動作の面のみに特化したコンポーネントを含む。例えば、ネットワークマイクロフォンデバイスは、再生デバイスが含まない場合もある遠方マイクロフォン(far-field microphone)及び/又はボイス処理コンポーネントを含んでもよい。別の例において、ネットワークマイクロフォンデバイスは、マイクロフォンをオン・オフするタッチ感応ボタンを含んでもよい。さらに別の例において、ネットワークマイクロフォンデバイスは上述のような独立したデバイスであり得る。図2Bは、ネットワークマイクロフォンデバイスを組み入れた例示的な再生デバイス202を示す等角図である。再生デバイス202は、マイクロフォンをオン・オフするためのコントロール領域237をデバイスの頂上に有する。コントロール領域237は、デバイスの頂上で、再生を制御するための別の領域239の隣にある。
例示として、ソノズ・インコーポレイテッドは、「PLAY:1」、「PLAY:3」、「PLAY:5」、「PLAYBAR」、「CONNECT:AMP」、「CONNECT」、及び「SUB」を含む再生デバイスを現在販売提供している(又は、していた)。他の過去、現在、及び/又は将来のいずれの再生デバイスにおいても、追加的に又は代替的に本明細書で開示された実施例の再生デバイスに実装して使用することができる。さらに、再生デバイスは、図2Aに示された特定の例、又は提供されるソノズ製品に限定されないことは理解される。例えば、再生デバイスは、有線又は無線のヘッドホンを含んでもよい。別の例において、再生デバイスは、パーソナルモバイルメディア再生デバイス用のドッキングステーションを含むか、又は、それらと対話してもよい。さらに別の例において、再生デバイスは、別のデバイス又はコンポーネント、例えば、テレビ、照明器具、又は屋内又は屋外で使用するためのいくつかの他のデバイスと一体化されてもよい。
b.例示的な再生デバイス構成
図3A-3Eは、ゾーン及びゾーングループの再生デバイスの構成例を示す。はじめに図3Eを参照して、1つの例として、単一の再生デバイスが1つのゾーンに属していてもよい。例えば、「バルコニー」の再生デバイス102cは「ゾーンA」に属してもよい。下に説明するいくつかの実施例において、複数の再生デバイスが「結合」され(bonded)、一緒に1つのゾーンを形成する「結合ペア」を形成してもよい。例えば、図1において「ヌック」と名付けられた再生デバイス102fが「壁」と名付けられた再生デバイス102gに結合されて「ゾーンB」を形成してもよい。結合された再生デバイスは、異なる再生担当を有してもよい(例えば、チャンネル担当)。下に説明される別の実施例において、複数の再生デバイスは併合され(merged)、1つのゾーンを形成してもよい。例えば、「オフィス」と名付けられた再生デバイス102dが「ウィンドウ」と名付けられた再生デバイス102mと併合されて「ゾーンC」を形成してもよい。併合された再生デバイス102d及び102mには、特に異なる再生担当を割り当てられない場合もある。すなわち、併合された再生デバイス102d及び102mは、オーディオコンテンツを同期して再生することを除けば、まるで併合されていないかのようにオーディオコンテンツをそれぞれが再生してもよい。
図3A-3Eは、ゾーン及びゾーングループの再生デバイスの構成例を示す。はじめに図3Eを参照して、1つの例として、単一の再生デバイスが1つのゾーンに属していてもよい。例えば、「バルコニー」の再生デバイス102cは「ゾーンA」に属してもよい。下に説明するいくつかの実施例において、複数の再生デバイスが「結合」され(bonded)、一緒に1つのゾーンを形成する「結合ペア」を形成してもよい。例えば、図1において「ヌック」と名付けられた再生デバイス102fが「壁」と名付けられた再生デバイス102gに結合されて「ゾーンB」を形成してもよい。結合された再生デバイスは、異なる再生担当を有してもよい(例えば、チャンネル担当)。下に説明される別の実施例において、複数の再生デバイスは併合され(merged)、1つのゾーンを形成してもよい。例えば、「オフィス」と名付けられた再生デバイス102dが「ウィンドウ」と名付けられた再生デバイス102mと併合されて「ゾーンC」を形成してもよい。併合された再生デバイス102d及び102mには、特に異なる再生担当を割り当てられない場合もある。すなわち、併合された再生デバイス102d及び102mは、オーディオコンテンツを同期して再生することを除けば、まるで併合されていないかのようにオーディオコンテンツをそれぞれが再生してもよい。
メディア再生システム100の各ゾーンは、単一のユーザインタフェース(UI)エンティティとしての制御のために提供されてもよい。例えば、「ゾーンA」は「バルコニー」と名付けられた単一のエンティティとして提供されてもよい。「ゾーンC」は「オフィス」と名付けられた単一のエンティティとして提供されてもよい。「ゾーンB」は「シェルフ」と名付けられた単一のエンティティとして提供されてもよい。
様々な実施形態において、ゾーンはそのゾーンに属する再生デバイスの1つの名前を踏襲してもよい。例えば、「ゾーンC」は「オフィス」デバイス102d(図示のとおり)の名前を踏襲してもよい。別の例において、「ゾーンC」は「ウィンドウ」デバイス102mの名前を踏襲してもよい。さらなる例において、「ゾーンC」は「オフィス」デバイス102dと「ウィンドウ」デバイス102mとの何らかの組み合わせである名前を使ってもよい。選択される名前はユーザによって選択されてもよい。いくつかの実施形態において、ゾーンはそのゾーンに属するデバイス以外の名前が与えられてもよい。例えば、「ゾーンB」は「シェルフ」と名付けられるが、「ゾーンB」のデバイスがどれもこの名前を有していない。
結合された再生デバイスは、特定のオーディオチャンネル担当などの異なる再生担当を有してもよい。例えば、図3Aに示すように、オーディオコンテンツのステレオ効果を生み出す又は強化するように「ヌック」及び「壁」デバイス102f及び102gが結合されてもよい。この例において、「ヌック」再生デバイス102fは、左チャンネルのオーディオコンポーネントを再生するように構成されてもよく、「壁」再生デバイス102gは、右チャンネルのオーディオコンポーネントを再生するように構成されてもよい。いくつかの実施例において、そのようなステレオ結合は「ペアリング」と呼ばれてもよい。
加えて、結合した再生デバイスは追加の及び/又は異なるスピーカドライバをそれぞれ有してもよい。図3Bに示されるように、「フロント」と名付けられた再生デバイス102bは「サブ」と名付けられた再生デバイス102kと結合されてもよい。「フロント」デバイス102bは中間周波から高周波のレンジを提供し、「サブ」デバイス102kが例えばサブウーファとして低周波を提供してもよい。結合が解かれたとき、「フロント」デバイス102bが全周波レンジを提供してもよい。別の例として、図3Cは、それぞれ「右」及び「左」デバイス102a及び102jとしてさらに結合された「フロント」及び「サブ」デバイス102b及び102kを示す。いくつかの実施例において、「右」及び「左」デバイス102a及び102jは、ホームシアターシステムのサラウンド又は「サテライト」チャンネルを形成してもよい。結合された再生デバイス102a、102b、102j、及び102kは単一の「ゾーンD」(図3E)を形成してもよい。
併合された再生デバイスは、割り当てられた再生担当を有さないかもしれず、それぞれの再生デバイスが可能なオーディオコンテンツの全レンジをそれぞれが提供してもよい。それにもかかわらず、併合されたデバイスは単一のUIエンティティ(すなわち上述のとおり、1つのゾーン)を代表してもよい。例えば、「オフィス」の再生デバイス102d及び102mは、「ゾーンC」という単一のUIエンティティである。一実施形態において、再生デバイス102d及び102mは、それぞれの再生デバイス102d及び102mが可能なオーディオコンテンツの全レンジをそれぞれが同期して出力してもよい。
いくつかの実施例において、独立したネットワークマイクロフォンデバイスは、1つのゾーンの中に単独で存在し得る。例えば、「天井」と名付けられた図1のNMD103gが「ゾーンE」であってもよい。ネットワークマイクロフォンデバイスはまた、別のデバイスと結合又は併合されてゾーンを形成してもよい。例えば、「アイランド」と名付けられたNMDデバイス103fは再生デバイス102i「キッチン」と結合されて、一緒に、それもまた「キッチン」と名付けられる「ゾーンG」を形成してもよい。ネットワークマイクロフォンデバイスと再生デバイスとを指名された又はデフォルトのデバイスとして関連付けることに関するさらなる詳細は、例えば既に参照した米国特許出願公開第15/438、749号明細書に記載されている。いくつかの実施例において、独立したネットワークマイクロフォンデバイスは1つのゾーンと関連していないかもしれない。
個々の、結合された、及び/又は併合されたデバイスのゾーンはグループ化されてゾーングループを形成してもよい。例えば、図3Eを参照して、「ゾーンA」が「ゾーンB」とグループ化されて2つのゾーンを含むゾーングループを形成してもよい。別の例として、「ゾーンA」は1つ又は複数の他の「ゾーンC-I」とグループ化されてもよい。「ゾーンA-I」は多数の方法でグループ化及びグループ解除ができる。例えば、「ゾーンA-I」のうちの3つ、4つ、5つ、又はそれ以上(例えば全部)がグループ化できる。グループ化されると、既に参照した米国特許第8、234、395号明細書に説明されるように、個々の、及び/又は結合された再生デバイスはオーディオを互いに同期して再生してもよい。再生デバイスは動的にグループ化及びグループ解除されて新しい、又は異なるグループを形成し、オーディオコンテンツを同期して再生してもよい。
様々な実施例において、例えば図3Eに示される「ダイニングルーム+キッチン」のように、ある環境の中のゾーンが、グループ内のゾーンのデフォルトの名前又はゾーングループ内のゾーン名の組み合わせであり得る。いくつかの実施形態において、また図3Eに示される「ニックの部屋」のように、ゾーングループはユーザが選択した固有の名前が与えられてもよい。
再び図2Aを参照して、メモリ216に、定期的に更新されて再生ゾーン、再生デバイス、及び/又はそれらと関連するゾーングループの状態を記述するために使われるあるデータが1つ又は複数の状態変数(state variable)として記憶されてもよい。メモリ216はまた、メディアシステム内の他のデバイスの状態に関連し、時々デバイス間で共有されるデータを含んでもよく、デバイスの1つ又は複数がシステムに関連する最新のデータを有することになる。
いくつかの実施形態において、メモリは状態と関連する様々な変数タイプのインスタンスを記憶してもよい。変数インスタンス(variables instances)はタイプに対応する識別子(identifier:例えば、タグ)とともに記憶されてもよい。例えば、特定の識別子は、あるゾーンの再生デバイスを識別する第一のタイプ「a1」、ゾーンに結合されていてもよい再生デバイスを識別する第二のタイプ「b1」、及びゾーンが属し得るゾーングループを識別する第三のタイプ「c1」であってもよい。関連する例として、図1において「バルコニー」と関連する識別子は、「バルコニー」は、「バルコニー」が特定のゾーンにあってゾーングループに入っていない唯一の再生デバイスであることを示しているかもしれない。「リビングルーム」に関連する識別子は、「リビングルーム」が他のゾーンとグループ化されていないが、結合された再生デバイス102a、102b、102j、及び10kを含んでいることを示していてもよい。「ダイニングルーム」と関連する識別子は、「ダイニングルーム」が「ダイニングルーム+キッチン」のグループの一部であり、デバイス103f及び102iが結合されていることを示していてもよい。「キッチン」と関連する識別子は、「キッチン」が、「ダイニングルーム+キッチン」ゾーングループの一部であることにより、同じ又は類似した情報を示していてもよい。他の例示的なゾーン変数及び識別子は、下に説明される。
さらに別の例において、メディア再生システム100は、図3に示される「エリア」に関連する識別子などのように、ゾーン及びゾーングループの他の関連性を表す変数又は識別子を有してもよい。あるエリアはゾーングループ及び/又はゾーングループに属さないゾーンのクラスタに関与してもよい。例えば、図3Eは、「フロントエリア」と名付けられた第一のエリア及び「バックエリア」と名付けられた第二のエリアを示す。「フロントエリア」は、「バルコニー」、「リビングルーム」、「ダイニングルーム」、「キッチン」、及び「バスルーム」のゾーン及びゾーングループを含む。「バックエリア」は、「バスルーム」、「ニックの部屋」、「寝室」、及び「オフィス」のゾーン及びゾーングループを含む。一態様において、「エリア」は、別のクラスタの1つ又は複数のゾーン及び/又はゾーングループを共有するゾーングループ及び/又はゾーンのクラスタを発動するために使われてもよい。別の態様において、これは別のゾーングループとゾーンを共有しないゾーングループと異なる。「エリア」を実施する技術のさらなる例は、例えば2017年8月21日付けの「名前に基づく部屋の関連付け」と題する米国特許出願第15/682、506号明細書、及び2007年9月11日付けの「マルチゾーンメディアシステムの制御とグループ作成操作」と題する米国特許第8、483、853号明細書に記載がある。これらの出願はその全体がここに参照され援用される。いくつかの実施例において、メディア再生システム100は、「エリア」を実施しないかもしれないが、その場合、システムは「エリア」に関連する変数を記憶しないかもしれない。
メモリ216はさらに、他のデータを記憶するように構成されてもよい。そのようなデータは、再生デバイス、又はその再生デバイス(又は別の再生デバイス)が関連し得る再生キュー(playback queue)によってアクセス可能なオーディオソースに関連してもよい。下に説明される実施形態において、ボイス入力を処理するとき、メモリ216は、第一のVAS160などの特定のVASを選択するための一セットのコマンドデータを記憶するように構成される。
動作中、図1の環境における1つ又は複数の再生ゾーンは、それぞれ異なるオーディオコンテンツを再生していてもよい。例えば、ユーザは、「バルコニー」ゾーンでグリルしながら、再生デバイス102cによって再生されるヒップホップ音楽を聞くことができる。一方、別のユーザは、「キッチン」ゾーンで食事を準備しながら、再生デバイス102iによって再生されるクラシック音楽を聞くことができる。別の例では、再生ゾーンは、同じオーディオコンテンツを別の再生ゾーンと同期して再生してもよい。例えば、ユーザが「オフィス」ゾーンにいる場合、「オフィス」ゾーンの再生デバイス102dが、「バルコニー」ゾーンの再生デバイス102cで再生されている音楽と同じヒップホップ音楽を再生してもよい。そのような場合、再生デバイス102c及び102dは、ヒップホップ音楽を同期して再生しているため、ユーザは、異なる再生ゾーン間を移動してもアウト-ラウドで再生されるオーディオコンテンツをシームレス(又は少なくともほぼシームレス)に楽しむことができる。再生ゾーン間の同期は、前述の米国特許第8、234、395号明細書で述べられているような再生デバイス間の同期と同様の方法で行ってもよい。
上に示唆したように、メディア再生システム100のゾーン構成は、動的に変更してもよい。したがって、メディア再生システム100は、多くの構成をサポートしてもよい。例えば、ユーザが1つ又は複数の再生デバイスを、物理的にゾーンに移動させるか、又はゾーンから移動させる場合、メディア再生システム100は変更に対応するように再構成されてもよい。例えば、ユーザが再生デバイス102cを「バルコニー」ゾーンから「オフィス」ゾーンに物理的に移動させる場合、「オフィス」ゾーンは、そこから再生デバイス102cと再生デバイス102dとの両方を含んでもよい。場合によっては、ユーザは例えばコントローラデバイス104及び/又はボイス入力を使って、移動された再生デバイス102cを「オフィス」ゾーンとペアにする又はグループ化する、及び/又は、「オフィス」ゾーンの再生デバイスの名称変更をしてもよい。別の例として、1つ又は複数の再生デバイスが、ホーム環境において、再生ゾーンを未だ設定していない特定のエリアに移動させられた場合、移動された再生デバイスは名称変更されてもよく、又は特定のエリアの再生ゾーンに関連付けられてもよい。
さらに、メディア再生システム100の異なる再生ゾーンは、動的にゾーングループに組み合わされてもよいし、又は別々の再生ゾーンに分割されてもよい。例えば、「ダイニングルーム」ゾーンと「キッチン」ゾーンとがディナーパーティ用のゾーングループに組み合わされることによって、再生デバイス102iと102lとがオーディオコンテンツを同期して再生することができる。一方、「リビングルーム」ゾーンの結合された再生デバイス102は、(i)テレビゾーンと(ii)別のリスニングゾーンとに分割されてもよい。テレビゾーンは、「フロント」再生デバイス102bを含んでもよい。リスニングゾーンは、「右」、「左」、及び「サブ」再生デバイス102a、102j、及び102kを含んでもよく、それらは上述のとおり、グループ化、ペア化、又は併合されてもよい。「リビングルーム」ゾーンをそのように分割することにより、一人のユーザがリビングルームのあるエリアのリスニングゾーンで音楽を聴き、別のユーザがリビングルーム空間の別のエリアでテレビを見ることが可能となり得る。関連した例において、テレビゾーンとリスニングゾーンとに分割される前に「リビングルーム」ゾーンを制御するために、ユーザはNMD103a又は103bのいずれも実施し得る。一旦分割されると、リスニングゾーンは例えばNMD103aの近傍のユーザによって制御され、テレビゾーンは例えばNMD103bの近傍のユーザによって制御されてもよい。しかし、上述のとおり、いずれのNMD103もメディア再生システム100の様々な再生及びその他のデバイスを制御するように構成されてもよい。
c.例示的なコントローラデバイス
図4は、図1のメディア再生システム100のコントローラデバイス104の選択された1つのある態様を示す機能ブロック図である。そのようなコントローラデバイスは、コントローラとも呼ばれ得る。図3に示されるコントローラデバイスは概して、プロセッサ412、メモリ416、マイクロフォン424、及びネットワークインタフェース430などの上述のネットワークデバイスの特定のコンポーネントに類似したコンポーネントを含んでもよい。1つの例において、コントローラデバイスは、メディア再生システム100の専用のコントローラデバイスであってもよい。別の例では、コントローラデバイスは、例えばiPhone(登録商標)、iPad(登録商標)、又はその他のスマートフォン、タブレット又はネットワークデバイス(例えば、PCやMac(登録商標)などのネットワーク接続されたコンピュータ)などの、メディア再生システムのコントローラアプリケーションソフトウェアが搭載されていてもよいネットワークデバイスであり得る。
図4は、図1のメディア再生システム100のコントローラデバイス104の選択された1つのある態様を示す機能ブロック図である。そのようなコントローラデバイスは、コントローラとも呼ばれ得る。図3に示されるコントローラデバイスは概して、プロセッサ412、メモリ416、マイクロフォン424、及びネットワークインタフェース430などの上述のネットワークデバイスの特定のコンポーネントに類似したコンポーネントを含んでもよい。1つの例において、コントローラデバイスは、メディア再生システム100の専用のコントローラデバイスであってもよい。別の例では、コントローラデバイスは、例えばiPhone(登録商標)、iPad(登録商標)、又はその他のスマートフォン、タブレット又はネットワークデバイス(例えば、PCやMac(登録商標)などのネットワーク接続されたコンピュータ)などの、メディア再生システムのコントローラアプリケーションソフトウェアが搭載されていてもよいネットワークデバイスであり得る。
コントローラデバイスのメモリ416は、コントローラアプリケーションソフトウェア及びメディア再生システム100、及びシステム100のユーザに関連したその他のデータを記憶するように構成されてもよい。メモリ416には、メディア再生システム100のユーザアクセス、制御、及び構成を容易にするなどの特定の機能を達成するためにプロセッサ412によって実行可能な1つ又は複数のソフトウェアコンポーネント414が搭載されてもよい。上述のように、コントローラデバイスは他のネットワークデバイスとワイヤレスインタフェースなどのネットワークインタフェース430上で通信する。
1つの例において、データ及び情報(例えば、状態変数など)は、ネットワークインタフェース430を介してコントローラデバイスとその他のデバイスとの間で伝達されてもよい。例えば、メディア再生システム100の再生ゾーンとゾーングループの構成は、ネットワークインタフェース406を介して、再生デバイス、ネットワークマイクロフォンデバイス、又はその他のネットワークデバイスからコントローラデバイスによって受信され得て、又はコントローラデバイスによって別の再生デバイス又はネットワークデバイスに送信され得る。場合によっては、他のネットワークデバイスは、別のコントローラデバイスでもよい。
音量制御及びオーディオ再生制御などの再生デバイスの制御コマンドも、ネットワークインタフェース430を介してコントローラデバイスから再生デバイスへ伝達されてもよい。上述のとおり、メディア再生システム100の構成変更もコントローラデバイスを使ってユーザによって実行されてもよい。構成変更は、1つ又は複数の再生デバイスの追加/削除、1つ又は複数のゾーンのゾーングループへの追加/削除、結合又は併合再生デバイスの形成、結合又は併合再生デバイスからの1つ又は複数の再生デバイスの分離、その他、を含んでもよい。
コントローラデバイスのユーザインタフェース440は、図4A及び4Bにそれぞれ示され、集合的にコントローラインタフェース440と呼ばれるコントローラインタフェース440a及び440bなどのコントローラインタフェースを提供することによりメディア再生システム100のユーザアクセス及び制御を容易にするように構成されてもよい。図4A及び4Bを同時に参照して、コントローラインタフェース440は再生制御領域442、再生ゾーン領域443、再生ステータス領域444、再生キュー領域446、及びソース領域448を含む。図示のユーザインタフェース400は、図3に示され、メディア再生システム100などのメディア再生システムを制御するためにユーザによってアクセスされるコントローラデバイスなどのネットワークデバイス上に提供され得るユーザインタフェースの一例にすぎない。異なるフォーマット、スタイル、及び対話型シーケンスによるその他のユーザインタフェースが、1つ又は複数のネットワークデバイス上において代わりに実施され、類似した制御アクセスをメディア再生システムに提供してもよい。
再生制御領域442(図4A)は、選択可能で(例えば、タッチの方法で、又はカーソルを使って)、選択された再生ゾーン又はゾーングループにある再生デバイスに、再生又は停止、早送り、巻き戻し、次へスキップ、前へスキップ、シャッフルモードの開始/終了、リピートモードの開始/終了、クロスフェードモードの開始/終了をさせるアイコンを含んでもよい。再生制御領域442はまた、イコライザの設定、及び再生音量、その他種々の変更を行う選択可能アイコンを含んでもよい。
再生制御領域443(図4B)は、メディア再生システム100内の再生ゾーンの表示を含んでもよい。再生ゾーン領域はまた、図示の「ダイニングルーム+キッチン」ゾーングループなどのゾーングループの表示を含んでもよい。いくつかの実施例において、再生ゾーンのグラフィカルな表示が、例えば、結合されたゾーンの作成、ゾーングループの作成、ゾーングループの分割、ゾーングループの名称変更、その他など、メディア再生システム内の再生ゾーンを管理又は構成するための追加の選択可能なアイコンを表示させるように選択可能でもよい。
例えば、図示のように「グループ」アイコンは再生ゾーンのグラフィカル表示それぞれに提供されてもよい。特定のゾーンのグラフィカル表示内に提供される「グループ」アイコンは、特定のゾーンとグループ化されるためのメディア再生システムの1つ又は複数の他のゾーンの選択肢を表示するために選択可能でもよい。一旦グループ化されると、特定のゾーンとグループ化されたゾーン内の再生デバイスは、特定のゾーンの再生デバイスと同期してオーディオコンテンツを再生するように構成される。類似的に、「グループ」アイコンはゾーングループのグラフィカル表示内に提供されてもよい。この場合、「グループ」アイコンは、ゾーングループから削除されるゾーングループ内の1つ又は複数のゾーンの選択を外す選択肢を表示するために選択可能でもよい。ユーザインタフェース400などのユーザインタフェースを介して、ゾーンをグループ化及びグループ解除をするための他の対話及び実施もまた可能である。再生ゾーン領域443(図4B)内の再生ゾーンの表示は、再生ゾーン又はゾーングループの構成が変更されるとともに動的に更新されてもよい。
再生ステータス領域444(図4A)は、現在再生されているオーディオコンテンツ、前に再生されたオーディオコンテンツ、又は選択された再生ゾーン又はゾーングループ内で次に再生するように予定されているオーディオコンテンツ、のグラフィック表示を含んでもよい。選択可能な再生ゾーン又は再生グループは、ユーザインタフェース上で、例えば、再生ゾーン領域443及び/又は再生ステータス領域444内で視覚的に区別されてもよい。グラフィック表示は、トラックタイトル、アーティスト名、アルバム名、アルバム年、トラック長さ、及びメディア再生システムを、ユーザインタフェース440を介して制御するときに、ユーザにとって有益かもしれない他の関連情報を含んでもよい。
再生キュー領域446は、選択された再生ゾーン又はゾーングループに関連付けられた再生キュー内のオーディオコンテンツのグラフィック表示を含んでもよい。いくつかの実施形態において、それぞれの再生ゾーン又はゾーングループは、再生ゾーン又はゾーングループによって再生される0以上のオーディオアイテムに対応する情報を含む再生キューに関連付けられてもよい。例えば、再生キュー内のそれぞれのオーディオアイテムは、ユー・アール・アイ(URI)、ユー・アール・エル(URL)、又は再生ゾーン又はゾーングループ内の再生デバイスによって使用可能な他の識別子を含んでもよい。これらによって、ローカルオーディオコンテンツソース又はネットワークオーディオコンテンツソース、からオーディオアイテムを見つけ、及び/又は取り出し、再生デバイスによって再生することができる。
ある例では、プレイリストが再生キューに追加されてもよい。この場合、プレイリスト内のそれぞれのオーディオアイテムに対応する情報が再生キューに追加されてもよい。別の例では、再生キュー内のオーディオアイテムは、プレイリストとして保存されてもよい。さらに別の例では、再生デバイスがストリーミングオーディオコンテンツ、例えば、再生時間を有する個別のオーディオアイテムよりも、停止しない限り連続して再生され得るインターネットラジオを再生し続けているとき、再生キューは、空であってもよいし、又は埋まっているが「未使用」であってもよい。別の実施形態では、再生キューは、インターネットラジオ及び/又は他のストリーミングオーディオコンテンツアイテムを含むことができ、且つ再生ゾーン又はゾーングループがそれらのアイテムを再生しているとき「使用中」とすることができる。他の例も可能である。
再生ゾーン又はゾーングループが「グループ化される」、又は「グループ解除される」とき、影響を受ける再生ゾーン又はゾーングループに関連した再生キューは、クリアされてもよいし、又は再び関連付けられてもよい。例えば、第一の再生キューを含む第一の再生ゾーンが、第二の再生キューを含む第二の再生ゾーンとグループ化された場合、形成されたゾーングループは、関連付けられた再生キューを有してもよく、関連付けられた再生キューは、最初は空であるか、(例えば、第二の再生ゾーンが第一の再生ゾーンに追加された場合、)第一の再生キューのオーディオアイテムを含むか、(例えば、第一の再生ゾーンが第二の再生ゾーンに追加された場合、)第二の再生キューのオーディオアイテムを含むか、又は第一の再生キューと第二の再生キューとの両方のオーディオアイテムを組み合わせられてもよい。その後、形成されたゾーングループがグループ解除された場合、その結果の第一の再生ゾーンは、前の第一の再生キューと再び関連付けられてもよいし、空の新しい再生キューに関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループに関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューに関連付けられてもよい。同様に、グループ解除された第二の再生ゾーンは、前の第二の再生キューと再び関連付けられてもよいし、空の新しい再生キューに関連付けられてもよいし、あるいはゾーングループがグループ解除される前にゾーングループに関連付けられていた再生キューのオーディオアイテムを含む新しい再生キューに関連付けられてもよい。その他の例もまた可能である。
図4A及び4Bを引き続き参照して、再生キュー領域446(図4B)内のオーディオコンテンツのグラフィック表示は、トラックタイトル、アーティスト名、トラックの長さ、及び再生キュー内のオーディオコンテンツに関連付けられた他の関連情報を含んでもよい。ある例においては、オーディオコンテンツのグラフィック表示は、追加の選択可能なアイコンを選択して移動させることができる。これにより、再生キュー及び/又は再生キューに表示されたオーディオコンテンツを管理及び/又は編集することができる。例えば、表示されたオーディオコンテンツは、再生キューから取り除いてもよいし、再生キュー内の異なる位置に移動させてもよいし、すぐに再生させるか若しくは現在再生しているオーディオコンテンツの後に再生するように選択されてもよいし、あるいは他の動作を実行してもよい。再生ゾーン又はゾーングループに関連付けられた再生キューは、再生ゾーン又はゾーングループ内の1つ又は複数の再生デバイスのメモリ、再生ゾーン又はゾーングループに入っていない再生デバイスのメモリ、及び/又は他の指定のデバイスのメモリに記憶されていてもよい。そのような再生キューの再生には、キューのメディアアイテムを、おそらく順次又はランダムな順序で再生する1つ又は複数の再生デバイスが関係していてもよい。
ソース領域448は、対応するVASに関連した選択可能なオーディオコンテンツ及び選択可能なボイスアシスタントのグラフィカル表示を含んでもよい。VASは選択的に割り当てられてもよい。いくつかの例において、AMAZONのALEXA(登録商標)及び別のボイスサービスなどの複数のVASが、同じネットワークマイクロフォンデバイスによって発動可能でもよい。いくつかの実施形態において、ユーザはあるVASを1つ又は複数のネットワークマイクロフォンデバイス専用に割り当ててもよい。例えば、ユーザは第一のVAS160を図1に示される「リビングルーム」のNMD102a及び102bのうちの1つ又は両方に割り当て、第二のVASを「キッチン」のNMD103fに割り当ててもよい。その他の例も可能である。
d.例示的なオーディオコンテンツソース
ソース領域448のオーディオソースは、そこからオーディオコンテンツが取り出され、選択された再生ゾーン又はゾーングループで再生されるオーディオコンテンツソースでもよい。ゾーン又はゾーングループ内の1つ又は複数の再生デバイスは、再生するオーディオコンテンツを、(例えば、オーディオコンテンツの対応するURI又はURLに基づいて、)複数の入手可能なオーディオコンテンツソースから取り出すように構成されてもよい。一例において、オーディオコンテンツは、再生デバイスによって、対応するオーディオコンテンツソース(例えば、ライン-イン接続)から直接取り出されてもよい。別の例では、オーディオコンテンツは、1つ又は複数の他の再生デバイス若しくはネットワークデバイスを介してネットワーク上の再生デバイスに提供されてもよい。
ソース領域448のオーディオソースは、そこからオーディオコンテンツが取り出され、選択された再生ゾーン又はゾーングループで再生されるオーディオコンテンツソースでもよい。ゾーン又はゾーングループ内の1つ又は複数の再生デバイスは、再生するオーディオコンテンツを、(例えば、オーディオコンテンツの対応するURI又はURLに基づいて、)複数の入手可能なオーディオコンテンツソースから取り出すように構成されてもよい。一例において、オーディオコンテンツは、再生デバイスによって、対応するオーディオコンテンツソース(例えば、ライン-イン接続)から直接取り出されてもよい。別の例では、オーディオコンテンツは、1つ又は複数の他の再生デバイス若しくはネットワークデバイスを介してネットワーク上の再生デバイスに提供されてもよい。
例示的なオーディオコンテンツソースは、メディア再生システム内の1つ又は複数の再生デバイスのメモリを含んでもよい。メディア再生システムとしては、例えば、図1のメディア再生システム100、1つ又は複数のネットワークデバイス上のローカルミュージックライブラリ(例えば、コントローラデバイス、ネットワーク対応のパーソナルコンピュータ、又はネットワーク接続ストレージ(NAS)など)、インターネット(例えば、クラウド)を介してオーディオコンテンツを提供するストリーミングオーディオサービス、あるいは再生デバイス又はネットワークデバイスのライン-イン入力接続を介してメディア再生システムに接続されるオーディオソース、他の可能なシステムであってもよい。
ある実施形態では、オーディオコンテンツソースは、図1のメディア再生システム100などのようなメディア再生システムに定期的に追加されてもよいし、定期的に取り除かれてもよい。ある例では、1つ又は複数のオーディオコンテンツソースが追加される、取り除かれる、又は更新される度に、オーディオアイテムのインデックス付けが行われてもよい。オーディオアイテムのインデックス付けは、ネットワーク上で共有される全てのフォルダ/ディレクトリ内の識別可能なオーディオアイテムをスキャンすることを含んでもよい。ここで、ネットワークは、メディア再生システム内の再生デバイスによってアクセス可能である。また、オーディオアイテムのインデックス付けは、メタデータ(例えば、タイトル、アーティスト、アルバム、トラックの長さ、その他、など)、及び他の関連情報を含むオーディオコンテンツデータベースを作成すること、又は更新すること、を含んでもよい。他の関連情報とは、例えば、見つかったそれぞれの識別可能なオーディオアイテムのURI又はURLを含んでもよい。オーディオコンテンツソースを管理し、且つ維持するための他の例も可能である。
e.例示的なネットワークマイクロフォンデバイス
図5Aは、本開示の態様に係るNMD103の1つ又は複数の追加の機能を示す機能ブロック図である。図5Aに示されるネットワークマイクロフォンデバイスは、プロセッサ212(図1)、ネットワークインタフェース230(図2A)、マイクロフォン224、及びメモリ216などの上述のネットワークマイクロフォンデバイスの特定のコンポーネントと概して類似したコンポーネントを含んでもよい。明確性のため図示されないが、ネットワークマイクロフォンデバイスは、上述のようにスピーカ、増幅器、信号処理装置などの他のコンポーネントを含んでもよい。
図5Aは、本開示の態様に係るNMD103の1つ又は複数の追加の機能を示す機能ブロック図である。図5Aに示されるネットワークマイクロフォンデバイスは、プロセッサ212(図1)、ネットワークインタフェース230(図2A)、マイクロフォン224、及びメモリ216などの上述のネットワークマイクロフォンデバイスの特定のコンポーネントと概して類似したコンポーネントを含んでもよい。明確性のため図示されないが、ネットワークマイクロフォンデバイスは、上述のようにスピーカ、増幅器、信号処理装置などの他のコンポーネントを含んでもよい。
マイクロフォン224は、ネットワークマイクロフォンデバイス環境で音を検出するように構成された複数のマイクロフォンでもよい。一例において、マイクロフォン224は、ネットワークマイクロフォンデバイスから見て1つ又は複数の方向からのオーディオを検出するように構成されてもよい。マイクロフォン224は、周波数レンジの一部に敏感でもよい。一例において、マイクロフォン224の第一のサブセットが、第一の周波数レンジに敏感で、マイクロフォン224の第二のサブセットが、第二の周波数レンジに敏感でもよい。マイクロフォン224はさらに、オーディオソース(例えば、ボイス、可聴音)の位置情報を獲得するように構成されてもよく、及び/又は背景ノイズをフィルタすることを補助するように構成されてもよい。注目すべきことに、いくつかの実施例において、マイクロフォン224は、複数のマイクロフォンではなく、1つのマイクロフォンを有しても良い。
ネットワークマイクロフォンデバイスはさらに、ビーム形成器コンポーネント551、音響エコー除去(AEC)コンポーネント552、ボイス活動検出器コンポーネント553、ウェイクワード検出器コンポーネント554、スピーチ/テキスト変換コンポーネント555(例えば、ボイスからテキストへ、及びテキストからボイスへ)、及びVAS選択器コンポーネント556を含んでもよい。様々な実施形態において、コンポーネント551-556の1つ又は複数はプロセッサ512のサブコンポーネントでもよい。
ビーム形成及びAECコンポーネント551及び552は、オーディオ信号を検出し、方向、振幅、周波数スペクトラムなどの、検出されたオーディオ内のボイス入力のアスペクトを判断するように構成される。例えば、ビーム形成及びAECコンポーネント551及び552は、ネットワークマイクロフォンデバイスとネットワークマイクロフォンデバイスに話しかけているユーザとの間のおよその距離を判断する工程において使われてもよい。別の例において、ネットワークマイクロフォンデバイスは、メディア再生システムのもう1つのネットワークマイクロフォンデバイスへのユーザの相対的な近さを検出してもよい。
ボイス活動検出器コンポーネント553は、ビーム形成及びAECコンポーネント551及び552と密接に関連して動作し、ボイス活動が検出された方向からの音を取得するよう構成される。スピーチを他の音と区別する指標(metrics)をモニタすることにより、潜在的なスピーチの方向が識別可能である。そのような指標は、例えば背景ノイズに対するスピーチ帯域内のエネルギ、及びスペクトラム構造の尺度であるスピーチ帯域内のエントロピーを含み得る。典型的にスピーチはほとんどの普通の背景ノイズよりも低いエントロピーを有する。
ウェイクワード検出器コンポーネント554は、受信したオーディオをモニタして分析し、オーディオ内にいずれかのウェイクワードが存在するか否かを判断するよう構成される。ウェイクワード検出器コンポーネント554は、ウェイクワード検出アルゴリズムを使って、受信したオーディオを分析してもよい。ウェイクワード検出器554がウェイクワードを検出した場合、ネットワークマイクロフォンデバイスが受信したオーディオに含まれるボイス入力を処理してもよい。例示的なウェイクワード検出アルゴリズムは、オーディオを入力として受付け、ウェイクワードがオーディオ内に存在するか否かの指示を提供する。多くの当事者の、及びサードパーティーのウェイクワード検出アルゴリズムが知られており、市販されている。例えば、ボイスサービスの事業者が独自のアルゴリズムを作りサードパーティーのデバイス上で使っていてもよい。代わりに、アルゴリズムは、特定のウェイクワードを検出するようにトレーニングさせられてもよい。
いくつかの実施形態において、ウェイクワード検出器554は、受信したオーディオに対し、複数のウェイクワード検出アルゴリズムを同時(又は実質的に同時に)に実行する。上述のとおり、異なるボイスサービス(例えば、AMAZONのALEXA(登録商標)、APPLEのSIRI(登録商標)、又はMICROSOFTのCORTANA(登録商標))は、それぞれのボイスサービスを発動するために、それぞれ異なるウェイクワードを使う。複数のサービスをサポートするために、ウェイクワード検出器554は、受信したオーディオに対し、サポートされている各ボイスサービスのウェイクワード検出アルゴリズムを並行して実行してもよい。
VAS選択器コンポーネント556は、ボイス入力内でユーザが発言したコマンドを検出するように構成される。スピーチ/テキスト変換コンポーネント555は、ボイス入力内のスピーチをテキストに変換することにより処理工程を容易にし得る。いくつかの実施例において、ネットワークマイクロフォンデバイスは、特定のユーザ又はある家庭に関連した特定のグループのユーザについてトレーニングされたボイス認識ソフトウェアを含んでもよい。そのようなボイス認識ソフトウェアは、特定のボイスプロフィールに適合されたボイス処理アルゴリズムを実行してもよい。特定のボイスプロフィールに適合させることは、通常大多数のユーザや、メディア再生システムをターゲットとしない様々なリクエストからサンプリングする従来のVASの場合よりも演算負荷が低いアルゴリズムを必要とするだけで済むかもしれない。
VAS選択器コンポーネント556はまた、ボイス入力内に検出された特定のコマンドに関し、特定のコマンドクライテリアが満足されたか否かを判断するよう構成される。ボイス入力内の所与のコマンドに関するコマンドクライテリアは、例えばボイス入力内に特定のキーワードが含まれていることに基づいてもよい。キーワードは、例えば特定のデバイス又はメディア再生システム100内のグループを指定するボイス入力内の単語でもよい。ここで使用されるにあたり、「キーワード」という用語は単一の単語(例えば「寝室」)又は単語のグループ(例えば「リビングルーム」)を参照し得る。
加えて又は代わりに、所与のコマンドに関するコマンドクライテリアは、所与のコマンドの検出とともに、1つ又は複数の制御状態変数及び/又はゾーン状態変数の検出に関連してもよい。制御状態変数は、例えば音量レベルを示すインジケータ、1つ又は複数のデバイスに関連するキュー、及びデバイスがキューを再生中か、休止中かなどの再生状態を含んでもよい。ゾーン状態変数は、例えば、ゾーンの再生装置がグループ化されている場合、それがいずれのゾーンであるかを示すインジケータを含んでもよい。下により詳細に説明されるように、VAS選択器コンポーネント556はメモリ216内に、コマンド及び関連したコマンドクライテリアのリストを含むデータテーブル590内などにコマンド情報のセットを記憶してもよい。
いくつかの実施形態において、上述のコンポーネント551-556の1つ又は複数は、メディア再生システム100のユーザアカウントに関連したユーザのボイスプロフィールを検出して記憶するためにマイクロフォン224とともに動作可能である。下に説明されるように、いくつかの実施形態において、ボイスプロフィールは、コマンド情報590のセットに記憶される変数として記憶されてもよく、及び/又はその変数と比較されてもよい。ボイスプロフィールは、ユーザのボイスの音色又は周波数の特徴、及び/又はユーザの別の固有の特徴を含んでもよく、固有の特徴は既に参照した米国特許出願第15/438、749号明細書に記載されているものなどである。
いくつかの実施形態において、上述のコンポーネント551-556の1つ又は複数は、ホーム環境内の、及び/又はNMD103の1つ又は複数の位置に相対的なユーザの位置を判断するためにマイクロフォンアレイ524とともに動作可能である。下に説明されるように、ユーザの位置又は近さは、検出され、コマンド情報590に記憶された変数と比較されてもよい。ユーザの位置又は近さを判断する技術は、既に参照した米国特許出願第15/438、749号明細書、2011年12月29日付けの「Sound Field Calibration Using Listener Localization」と題する米国特許第9、084、058号明細書、及び2012年8月31日付けの「Acoustic Optimization」と題する米国特許第8、965、033号明細書に開示される1つ又は複数の技術を含んでもよい。これらの出願はそれぞれその全体がここに参照されて援用される。
図5Bは、本開示の態様に係る例示的なボイス入力の図である。ボイス入力は、図1に示されるNMD103の1つ又は複数などのネットワークマイクロフォンデバイスにより取得されてもよい。ボイス入力は、ウェイクワード部557a及びボイス発声部557b(集合的に「ボイス入力557」)を含んでもよい。いくつかの実施形態において、ウェイクワード557aはAMAZONのALEXA(登録商標)に関連する「Alexa」などの周知のウェイクワードであり得る。別の実施形態において、ボイス入力557は、ウェイクワードを含まない場合がある。
いくつかの実施形態において、ネットワークマイクロフォンデバイスは、ウェイクワード部557aを検出すると可聴及び/又は可視の応答を出力してもよい。加えて、又は代わりに、ネットワークマイクロフォンデバイスは、ボイス入力又は一連のボイス入力(例えば、マルチターン(multi-turn)リクエストの場合)の処理後に可聴及び/又は可視の応答を出力してもよい。
ボイス発声部557bは、例えば、1つ又は複数の発声されたコマンド558(第一のコマンド558a及び第二のコマンド558bとして個々に識別される)及び1つ又は複数の発声されたキーワード559(第一のキーワード559a及び第二のキーワード559bとして個々に識別される)を含んでもよい。一例において、第一のコマンド558aは、特定の曲、アルバム、再生リスト、等の音楽を再生するコマンドであり得る。この例において、キーワード559は、図1に示される「リビングルーム」及び「ダイニングルーム」などの音楽が再生されるべき1つ又は複数のゾーンを示す1つ又は複数の単語でもよい。いくつかの例において、ボイス発声部557bは、図5Bに示すように、ユーザによって話された単語の間隔などの検出された休止(例えば、発声がない期間)など、その他の情報を含み得る。休止が、ボイス発声部557b内において、ユーザによって話された別のコマンド、キーワード、又はその他の情報の位置を区切って(demarcate)もよい。
いくつかの実施形態において、メディア再生システム100は、ウェイクワード部557aを検出している間にそれが再生中のオーディオコンテンツの音量を一時的に減らすよう構成される。メディア再生システム100は、図5Bに示すように、ボイス入力557を処理した後に音量を元に戻してもよい。そのような工程はダッキングと呼ばれ得て、その例は既に参照した米国特許出願第15/438、749号明細書に開示されている。
f.例示的なネットワークとリモートコンピュータシステム
図6は、図1のリモートコンピュータ105のさらなる詳細を示す機能ブロック図である。様々な実施形態において、リモートコンピュータ105は、図1に示すようにNMD103の1つ又は複数からWAN107を介してボイス入力を受信してもよい。図示の目的で、ボイス入力557(図5B)の選択された通信経路が図6に矢印で示される。一実施形態において、リモートコンピュータ105によって処理されたボイス入力557は、ボイス発声部557bを含んでもよい(図5B)。別の実施形態において、処理されたボイス入力557は、ボイス発声部557bとウェイクワード557aの両方を含んでもよい(図5B)。
図6は、図1のリモートコンピュータ105のさらなる詳細を示す機能ブロック図である。様々な実施形態において、リモートコンピュータ105は、図1に示すようにNMD103の1つ又は複数からWAN107を介してボイス入力を受信してもよい。図示の目的で、ボイス入力557(図5B)の選択された通信経路が図6に矢印で示される。一実施形態において、リモートコンピュータ105によって処理されたボイス入力557は、ボイス発声部557bを含んでもよい(図5B)。別の実施形態において、処理されたボイス入力557は、ボイス発声部557bとウェイクワード557aの両方を含んでもよい(図5B)。
リモートコンピュータ105は、1つ又は複数のプロセッサ、意図エンジン(intent engine)602、及びメモリ616を含むシステムコントローラ612を含む。メモリ616は、システムコントローラ612、及び/又は1つ又は複数の再生デバイス、ネットワークマイクロフォンデバイス、及び/又はコントローラデバイス102-104によって実行可能な指示を記憶するように構成された実体のあるコンピュータ読み取り可能な記憶媒体でもよい。
意図エンジン662は、ボイス入力を処理し、入力の意図を判断するように構成される。いくつかの実施形態において、意図エンジン662は、システムコントローラ612のサブコンポーネントでもよい。意図エンジン662は、1つ又は複数のVASデータベース664などの1つ又は複数のデータベースと対話してボイス入力を処理してもよい。VASデータベース664は、メモリ616内に存在してもよく、又は再生デバイス、ネットワークマイクロフォンデバイス、及び/又はコントローラデバイス102-104の1つ又は複数のメモリ内などの他の場所に存在してもよい。いくつかの実施形態において、VASデータベース664は、適応的学習、及びボイス入力処理に基づくフィードバックのために更新されてもよい。VASデータベース664は、NLU関連の処理及び/又はその他の処理のための様々なユーザデータ、分析、カタログ、及びその他の情報を記憶してもよい。
リモートコンピュータ105は、様々なフィードバック情報、指示、及び/又は関連するデータを、メディア再生システム100の様々な再生デバイス、ネットワークマイクロフォンデバイス、及び/又はコントローラデバイス102-104と情報交換してもよい。そのような情報交換は、ボイス入力を含む伝達されたメッセージと関連してもよく、又は独立していてもよい。いくつかの実施形態において、リモートコンピュータ105及びメディア再生システム100は、ここで説明されるような通信経路、及び/又は既に参照した米国特許出願第15/438、749号明細書に開示されているメタデータ交換チャンネルを使った通信経路を介して、交換してもよい。
メディア再生システム100のデバイスによるボイス入力の処理は、少なくとも部分的に、リモートコンピュータ105によるボイス入力の処理と並行して実行されてもよい。加えて、ネットワークマイクロフォンデバイスのスピーチ/テキスト変換コンポーネント555は、リモートコンピュータ105からの応答をスピーチに変換して、1つ又は複数のスピーカを使った可聴出力としてもよい。
本開示の様々な実施形態によれば、リモートコンピュータ105は、メディア再生システム100の第一のVAS160の機能を実行する。図7Aは、第一のVAS160を含む例示的なネットワークシステム700の模式図である。図示されるとおり、リモートコンピュータ105は、WAN107(図1)、及び/又はWAN107に接続されたLAN706を介してメディア再生システム100と接続される。この方法によれば、メディア再生システム100の様々な再生デバイス、ネットワークマイクロフォンデバイス、及びコントローラデバイス102-104は、リモートコンピュータ105と通信して第一のVAS160の機能を発動してもよい。
ネットワークシステム700はさらに、第一のリモートコンピュータ705a(例えば、クラウドサーバー)及び第二のリモートコンピュータ705b(例えば、クラウドサーバー)を追加で含む。第二のリモートコンピュータ705bは、SPOTIFY(登録商標)又はPANDORA(登録商標)などのメディアサービスプロバイダ767と関連してもよい。いくつかの実施形態において、第二のリモートコンピュータ705bは、第一のVAS160のコンピュータと直接通信してもよい。加えて、又は代わりに、第二のリモートコンピュータ705bは、メディア再生システム100及び/又は介在する他のリモートコンピュータと通信してもよい。
第一のリモートコンピュータ705aは、第二のVAS760と関連していてもよい。第二のVAS760は、例えば、AMAZONのALEXA(登録商標)、APPLEのSIRI(登録商標)、MICROSOFTのCORTANA(登録商標)などと関連する従来のVASプロバイダ、又はその他のVASプロバイダでもよい。明確性のため図示されないが、ネットワークコンピュータシステム700はさらに、追加の従来のVASなどの1つ又は複数の追加のVASに関連したリモートコンピュータを含んでもよい。そのような実施形態において、メディア再生システム100は、第二のVASやその他のVASよりも、第一のVAS160を選択するように構成されてもよい。
図7Bは、図7Aのネットワークコンピュータシステム700における様々なデータのやり取りを示すメッセージの流れ図である。メディア再生システム100は、図1に示されるNMD103の1つ以上などのネットワークマイクロフォンデバイス(ブロック771)を介してボイス入力を取得する。下に説明されるとおり、メディア再生システム100は、コマンド情報590のセット内のコマンド及び関連したコマンドクライテリアに基づいて適切なVASを選択してもよい(ブロック771-774)。第二のVAS760が選択された場合、メディア再生システム100は、ボイス入力を含む1つ又は複数のメッセージ781(例えば、パケット)を処理するために第二のVAS760に伝達してもよい。
逆に、第一のVAS160が選択された場合、メディア再生システム100は、ボイス入力を含む1つ又は複数のメッセージ782(例えば、パケット)をVAS160に伝達する。メディア再生システム100は、メッセージ782と同時に別の情報をVAS160に伝達してもよい。例えば、メディア再生システム100は、既に参照した米国特許出願第15/131、244号明細書に記載されるように、メタデータチャンネルを通してデータを伝達してもよい。
第一のVAS160は、メッセージ782の中のボイス入力を処理して意図を判断してもよい(ブロック775)。その意図に基づいて、VAS160は、1つ又は複数の応答メッセージ783(例えば、パケット)をメディア再生システム100に送信してもよい。いくつかの例において、応答メッセージ783は、メディア再生システム100の1つ又は複数のデバイスに命令して指示を実行させる(ブロック776)ペイロード(payload)を含んでもよい。例えば、指示はメディア再生システム100に命令してメディアコンテンツを再生させる、デバイスをグループ化させる、及び/又は下に説明されるその他の機能を実行させてもよい。加えて、又は代わりに、VAS160からの応答メッセージ783は、マルチターンコマンドの場合のように、さらなる情報のリクエストを含むペイロードを含んでもよい。
いくつかの実施形態において、VAS160から送られた応答メッセージ783は、メディア再生システム100に命令してメディアサービス767からオーディオコンテンツなどのメディアコンテンツをリクエストさせてもよい。別の実施形態において、メディア再生システム100はVAS160に依存せずにコンテンツをリクエストしてもよい。いずれの場合も、メディア再生システム100は、例えばオーディオコンテンツなどを含むメディアストリーム784などを介してコンテンツを受信するためにメッセージをやり取りしてもよい。
いくつかの実施形態において、メディア再生システム100は、ネットワークインタフェースを介したLANを通して、再生デバイス、ネットワークマイクロフォンデバイス、又はその他のデバイスにおいてライン入力インタフェースからオーディオコンテンツを受信してもよい。例示的なオーディオコンテンツには、多くのオーディオコンテンツの形体の可能性の中から、1つ又は複数のオーディオトラック、トークショー、フィルム、テレビ番組、ポッドキャスト、インターネットストリーミング動画などが含まれる。オーディオコンテンツは、(例えば、ビデオのオーディオトラックのように)動画を伴ってもよく、又はオーディオコンテンツは、動画を伴わないコンテンツであり得る。
いくつかの実施形態において、トレーニング、及び適応的なトレーニングと学習のために、メディア再生システム100、及び/又は第一のVAS160は、VASからの応答の成功(又は不成功)の結果となるボイス入力を使ってもよい(ブロック777及び778)。トレーニング及び適応的学習は、メディア再生システム100及び/又は第一のVAS160によるボイス処理の正確度を向上させ得る。一例において、意図エンジン662(図6)は、メディア再生システム100に関連する1つ又は複数のユーザアカウントのVASデータベース664内においてトレーニング学習データをアップデートして保全してもよい。
III.VASを発動させる方法及びシステムの例
上述のとおり、ここで説明される実施形態は、第一のVAS160を発動させることに関与してもよい。一態様において、第一のVAS160は、メディア再生システム100のための強化された制御機能を提供し得る。別の態様において、第一のVASは、上述のような従来のVAS等の他のVASと比較して、メディア再生システム100を制御するための改良されたVAS体験を提供し得る。
上述のとおり、ここで説明される実施形態は、第一のVAS160を発動させることに関与してもよい。一態様において、第一のVAS160は、メディア再生システム100のための強化された制御機能を提供し得る。別の態様において、第一のVASは、上述のような従来のVAS等の他のVASと比較して、メディア再生システム100を制御するための改良されたVAS体験を提供し得る。
いくつかの実施形態において、図7Bに示される第二のVAS760などの従来のVASは、比較的に簡単な再生/休止/スキップ機能などの比較的基本的な制御を実行するためにメディア再生システム100によって発動され得る。いくつかの実施形態において、第二のVAS760は、第一のVAS160によって容易に発動されないかもしれない他のサービスを提供し得る。例えば、特定の実施において、従来のVASは、第一のVASが提供しないかもしれないボイスに基づくインターネット検索を提供し得る。
図8は、VASを発動するための方法800の例示的な流れ図である。方法800は、例えばメディア再生システム100、又は本開示の実施形態に従って構成されたその他のメディア再生システムを含む動作環境内で実行されうる方法の実施形態を示す。下に説明される例において、方法800は第二のVAS760より第一のVAS160を選択することに関与する。
方法800は、ここに説明されるような、及び/又は既に参照した米国特許出願第15/438、749号明細書に開示されているような様々なデバイス及びシステムの間で情報を送受信することを含んでもよい。例えば、方法は、再生デバイス、ネットワークマイクロフォンデバイス、コントローラデバイス、及び再生システムのリモートコンピュータ102-104の1つ又は複数、メディアサービス667のリモートコンピュータ705b、及び/又は第二のVAS670のリモートコンピュータ705aの間で情報を送受信することを含んでもよい。図8のブロックは、順番に図示されているが、これらのブロックはまた、並行して実行されてもよく、及び/又はここに説明される順番とは異なる順番で実行されてもよい。また、様々なブロックが組み合わされてブロック数が減ってもよく、分割されてブロック数が増えてもよく、及び/又は望ましい実施に基づいて削除されてもよい。
加えて、方法800及びここに開示されるその他の工程及び方法について、フロー図は、本実施形態の実施の1つの可能な機能及び動作を示す。すなわち、各ブロックは、工程内の特定の論理機能又はステップを実行するためにプロセッサによって実行可能な1つ又は複数の指示を含むプログラムコードのモジュール、セグメント、又は部分を代表し得る。プログラムコードは、例えば、ディスク又はハードドライブを含む記憶デバイスなどのコンピュータ読み取り可能な記憶媒体のいかなるタイプのものに記憶されてもよい。コンピュータ読み取り可能な記憶媒体は、例えばレジスタメモリ、プロセッサキャッシュ、及びランダムアクセスメモリ(RAM)などのようなデータを短時間記憶するコンピュータ読み取り可能な記憶媒体などの非一時的なコンピュータ読み取り可能な記憶媒体を含んでもよい。コンピュータ読み取り可能な記憶媒体はまた、例えば、リードオンリーメモリ(ROM)、光学又は磁気ディスク、CD-ROMのようなセカンダリ又は持続的な長期記憶装置などの非一時的なコンピュータ読み取り可能な記憶媒体を含んでもよい。コンピュータ読み取り可能な記憶媒体はまた、他のいかなる揮発性又は非揮発性の記憶システムでもよい。コンピュータ読み取り可能な記憶媒体は、例えば、コンピュータ読み取り可能な記憶媒体又は実体のある記憶デバイスであってもよい。コンピュータ読み取り可能な記憶媒体は、様々な再生デバイス、ネットワークマイクロフォンデバイス、コントローラデバイス、及びリモートコンピュータを参照して上述の1つ又は複数のメモリを含んでもよい。加えて、方法800及びここに開示されるその他の工程及び方法について、図8は、工程の特定の論理機能を実行するように配線された回路を示す。
いくつかの実施形態において、方法800は、システム情報を表示、選択、及び入力するなどのために、アプリケーションを起動するユーザ入力を受信すること、ユーザ及びユーザアカウントの情報を受信すること、システムのパラメータを判断すること、音楽サービスと対話すること、及び/又はコントローラと対話することにさらに関与してもよい。様々な実施形態において、方法800は、「メディア再生システムのボイス制御」と題し、その全体がここに参照され援用される2016年7月29日付けの特許出願第15/223、218号に説明される例示的な方法及びシステムを組み入れてもよい。
a.コマンド及びコマンドに関連するクライテリアのリストを含むコマンド情報のセットをメモリ内に記憶させる
ブロック801において、方法800は、ネットワークマイクロフォンデバイスのメモリ216に記憶されたコマンド情報590のセットなどのコマンド情報のセットを記憶することに関与する。図8Bを参照して、例示的なコマンド情報890のセットは、コマンド892のリストを含んでもよい。コマンド情報890のセットは、データテーブル又はその他のデータ構造でもよい。コマンド情報890のセットは、例えば1つ又は複数の、再生デバイス、コントローラデバイス、ネットワークマイクロフォンデバイス、及び/又はリモートコンピュータ102-105のメモリに記憶されてもよい。いくつかの実施形態において、コマンド情報890のセットは、メタデータ交換チャンネル及び/又はメディア再生システムとリモートコンピュータシステムとの間のその他のいかなる通信経路を介してもアクセス可能でもよい。
ブロック801において、方法800は、ネットワークマイクロフォンデバイスのメモリ216に記憶されたコマンド情報590のセットなどのコマンド情報のセットを記憶することに関与する。図8Bを参照して、例示的なコマンド情報890のセットは、コマンド892のリストを含んでもよい。コマンド情報890のセットは、データテーブル又はその他のデータ構造でもよい。コマンド情報890のセットは、例えば1つ又は複数の、再生デバイス、コントローラデバイス、ネットワークマイクロフォンデバイス、及び/又はリモートコンピュータ102-105のメモリに記憶されてもよい。いくつかの実施形態において、コマンド情報890のセットは、メタデータ交換チャンネル及び/又はメディア再生システムとリモートコンピュータシステムとの間のその他のいかなる通信経路を介してもアクセス可能でもよい。
図示された例において、コマンド892のセットは、第一から、第n番目までの「コマンド」を含む。例として、第一の「コマンド」は、ユーザが「音楽を再生して」と発声するなどの再生を開始するコマンドでもよい。第二の「コマンド」は、例えば再生の休止、再開、スキップなどのためのトランスポートコントロールコマンドなどの制御コマンドでもよい。例えば、第二のコマンドは、ユーザが曲の次のトラックへスキップすることを要求することに関与するコマンドでもよい。第三の「コマンド」は、再生デバイスのグループ化、結合、及び併合などのゾーンターゲットコマンドでもよい。例えば、第三のコマンドは、ユーザが「リビングルーム」と「ダイニングルーム」をグループ化することを要求することに関するコマンドでもよい。
ここで説明されるコマンドは、例であって、他のコマンドも可能である。例えば、図9A-9Cは、追加の例示的な再生開始、制御及びゾーンターゲットコマンドのテーブルを示す。追加の例として、コマンドは問合せコマンドを含んでもよい。問合せコマンドは、例えば現在再生中のオーディオを問合せるユーザによるクエリを含んでもよい。例えば、ユーザは「リビングルームで何を再生中か教えて」という問合せコマンドを発声してもよい。
図8Bにさらに示されるように、コマンド892は、それもコマンドデータ890のセット内に記憶されたコマンドクライテリアと関連する。例えば、第一の「コマンド」は、1つ又は複数の第一のコマンド「クライテリア_1」と関連し、第二の「コマンド」は、1つ又は複数の第二のコマンド「クライテリア_2」と関連し、第三の「コマンド」は、1つ又は複数の第三のコマンド「クライテリア_3」と関連する。コマンドクライテリアは、特定の変数インスタンスに関連した判断に関与してもよい。変数インスタンスは、ユーザアカウントと関連しているかもしれない又は関連していないかもしれない識別子(例えば、タグ)とともに記憶されてもよい。変数インスタンスは、ユーザによって加えられる又は削除される、又はユーザアカウントに関連した新規カスタム名を含むために継続的に、定期的に、又は不定期にアップデートされてもよい。カスタム名は、ユーザによって供給されるいかなる名前でもよく、データベース内に既存であってもよいし、又は既存ではなくてもよい。
変数インスタンスは、ボイス入力中のキーワードに存在し得る、状態テーブル(state table)に記憶された名称及び/又は値として参照され得る、及び/又は1つ又は複数の再生デバイス、ネットワークマイクロフォンデバイス、コントローラデバイス、及び/又はリモートコンピュータ102-105を介して状態テーブルに動的に記憶及び修正され得る。例示的な変数インスタンスは、ゾーン変数インスタンス、制御状態変数インスタンス、ターゲット変数インスタンス、及びその他の変数インスタンスを含んでもよい。ゾーン変数インスタンスは、例えば、上に説明したものを含むゾーン、ゾーングループ、再生デバイス、ネットワークマイクロフォンデバイス、結合された状態、エリア等、を代表する識別子に関与してもよい。制御状態変数は、例えば、音楽を再生しているデバイスを示す情報、デバイスの音量、デバイスに記憶されたキュー等の個々の再生及びネットワークマイクロフォンデバイス、及び/又は複数のデバイスの現在の制御状態に関与してもよい。ターゲット変数インスタンスは、例えば、特定の制御状態及び/又はデバイス、結合されたデバイス、及び併合されたデバイスのグループの高度の状態情報に関与してもよい。ターゲット可変変数はまた、メディア再生システム100内の様々なデバイスのイコライザ設定などの較正状態に対応してもよい。
他の変数インスタンスも可能である。例えば、メディア変数インスタンスは、オーディオコンテンツ(例えば、特定のトラック、アルバム、アーティスト、プレイリスト、ステーション、又は音楽のジャンル)などのメディアコンテンツを識別してもよい。いくつかの実施形態において、メディア変数は、ユーザが望むオーディオ又はコンテンツを探してデータベースを検索することに応答して識別されてもよい。メディア変数は、上で説明したとおり、ボイス入力中に存在し得る、参照され得る、保全され得る、及び状態テーブルにアップデートされ得る、又はクエリで参照され得る。別の例として、特定の変数インスタンスは、ユーザのボイスプロフィールが所与のボイス入力内に検出されたか否か、特定のウェイクワードが検出されたか否か等、ホーム環境内のユーザの位置又は近さを示してもよい。変数インスタンスは、カスタム変数インスタンスを含んでもよい。
特定の実施形態において、コマンド情報890のセットに記憶されたクライテリアの少なくともいくつかは、変数インスタンス又は他のそのような変数インスタンスのセットのスカラベクトルを含んでもよい。例えば、「クライテリア_1」は、図1のメディア再生システム100に示されるゾーンを代表するゾーン変数を識別するベクトルを含んでもよい。そのようなベクトルは、「バルコニー、リビングルーム、ダイニングルーム、キッチン、オフィス、寝室、ニックの部屋」を含んでもよい。一実施形態において、「クライテリア_1」は、ベクトル内に2つ以上のゾーン変数がボイス入力内のキーワードとして検出された場合、満たされるかもしれない。
コマンド情報890のセットはまた、ユーザ固有の情報894及びカスタム情報896などの他の情報を含んでもよい。ユーザ固有の情報894は、ユーザアカウント及び/又は家庭識別子(HHI:household identifier)と関連していてもよい。カスタム情報896は、カスタムゾーン名、カスタムプレイリスト、及び/又はカスタムプレイリスト名などのカスタム変数を例えば含んでもよい。例えば、「ニックのお気に入り」は、ユーザが作ったカスタム名を有するカスタムプレイリストであり得る。
b.ボイス入力を取得する
図8Aの参照に戻り、ブロック802及び803において、方法800は、ボイス入力内のウェイクワードをモニタして検出することに関与する。例えば、メディア再生システム100は、ボイス入力を代表する受信したオーディオを分析して、ウェイクワードが含まれているか否かを判断してもよい。メディア再生システム100は、上に説明したとおりウェイクワード検出コンポーネントなどの1つ又は複数のウェイクワード検出アルゴリズムを使って受信したオーディオを分析してもよい。
図8Aの参照に戻り、ブロック802及び803において、方法800は、ボイス入力内のウェイクワードをモニタして検出することに関与する。例えば、メディア再生システム100は、ボイス入力を代表する受信したオーディオを分析して、ウェイクワードが含まれているか否かを判断してもよい。メディア再生システム100は、上に説明したとおりウェイクワード検出コンポーネントなどの1つ又は複数のウェイクワード検出アルゴリズムを使って受信したオーディオを分析してもよい。
ブロック804において、方法800は、ブロック802及び803におけるウェイクワードの検出に続いてボイス入力を取得することに関与する。様々な実施形態において、ボイス入力は、再生システム100のNMD103の1つ又は複数を介して取得され得る。ここで使用されるにあたり、「取得する」又は「取得」の用語は、ウェイクワードの後のボイス発声などのボイス入力の少なくとも一部を録音することを含む工程を指し得る。いくつかの実施形態において、取得されたボイス入力は、ウェイクワードを含んでもよい。下に説明される特定の実施形態において、「取得する」又は「取得」の用語はまた、ボイス入力の少なくとも一部を録音し、ボイス入力を例えば、スピーチからテキストへの変換を使ってテキストなどの特定のフォーマットに変換することを指し得る。
c.取得したボイス入力内にコマンドの1つ又は複数を検出する
ブロック805及び806において、方法800は、ブロック804で取得されたボイス入力内に1つ又は複数のコマンド892(図8B)を検出することに関与する。様々な実施形態において、方法800は、ボイス入力を解析してコマンド892の1つが取得されたボイス入力内に見つけた語法と一致する語法を有するか否かを判断することによりコマンドを検出してもよい。この方法によれば、方法800は、語法の一致を使ってボイス入力内のコマンドの意図を検出できる。一致する語法は単語、単語群、フレーズなどでもよい。1つの例示的なコマンドにおいて、ユーザは、「バルコニーとリビングルームでビートルズを再生して」と言う場合がある。この例において、方法800は、「再生して」の語法がコマンド情報890のセット内の第一の再生開始「コマンド」の語法と一致していると認識してもよい。加えて、方法800は、「ビートルズ」をメディア変数として、そして「バルコニー」及び「リビングルーム」をゾーン変数として認識してもよい。したがって、コマンドの語法は、次のような変数インスタンスに従って示されてもよい:「(メディア変数)を、(第一のゾーン変数)及び(第二のゾーン変数)で、再生せよ」。類似したコマンドとして、「(メディア変数)を、(第一のゾーン変数)及び(第二のゾーン変数)で、聴かせて」が含まれてもよい。下に説明するように、「聴かせて」は「再生して」と同義語であってもよい。
ブロック805及び806において、方法800は、ブロック804で取得されたボイス入力内に1つ又は複数のコマンド892(図8B)を検出することに関与する。様々な実施形態において、方法800は、ボイス入力を解析してコマンド892の1つが取得されたボイス入力内に見つけた語法と一致する語法を有するか否かを判断することによりコマンドを検出してもよい。この方法によれば、方法800は、語法の一致を使ってボイス入力内のコマンドの意図を検出できる。一致する語法は単語、単語群、フレーズなどでもよい。1つの例示的なコマンドにおいて、ユーザは、「バルコニーとリビングルームでビートルズを再生して」と言う場合がある。この例において、方法800は、「再生して」の語法がコマンド情報890のセット内の第一の再生開始「コマンド」の語法と一致していると認識してもよい。加えて、方法800は、「ビートルズ」をメディア変数として、そして「バルコニー」及び「リビングルーム」をゾーン変数として認識してもよい。したがって、コマンドの語法は、次のような変数インスタンスに従って示されてもよい:「(メディア変数)を、(第一のゾーン変数)及び(第二のゾーン変数)で、再生せよ」。類似したコマンドとして、「(メディア変数)を、(第一のゾーン変数)及び(第二のゾーン変数)で、聴かせて」が含まれてもよい。下に説明するように、「聴かせて」は「再生して」と同義語であってもよい。
いくつかの実施形態において、ユーザは、1つのゾーン変数インスタンスを伴う、又はゾーン変数インスタンスを伴わないコマンドを発声してもよい。一例において、ユーザは、「ビートルズを何か再生して」と単に発声するボイス入力を提供してもよい。そのような場合、方法800は、デフォルトのゾーンにおいて「ビートルズを何か再生して」という意図であると判断してもよい。別の例において、方法800は、ユーザがビートルズを再生するようにリクエストしたときに特定のゾーンにユーザの存在が検出された場合などの、そのコマンドに対して満たされる他のコマンドクライテリアに基づいて1つ又は複数の再生デバイスにおいて「ビートルズを何か再生して」という意図であると判断してもよい。例えば、メディア再生システム100は、ボイス入力がこのゾーンに位置する「右」再生デバイス102aによって検出された場合、図1に示される「リビングルーム」ゾーンでビートルズを何か再生してもよい。
別の例示的なコマンドは、選択されたメディアコンテンツをキューのトップに加え、あるゾーンにおいて次に再生させる「次を再生して」コマンドでもよい。このコマンドの例示的な語法は「(メディア変数)を次に再生して」でもよい。
コマンドの別の例は、現在再生中の音楽及び/又はあるゾーンの再生キューを1つのゾーンから別のゾーンへ移動(move)又は移転(transfer)させる、移動又は移転コマンドでもよい。例えば、ユーザは、「(ゾーン変数)へ、音楽を移動させよ」というボイス入力を発声してもよく、「移動せよ」又は「移転せよ」のコマンドワードは、再生状態を別のゾーンへ移動させる意図に対応してもよい。関連した例として、音楽を移動させる意図は、2つのメディア再生システムコマンドに対応してもよい。2つのコマンドは、第一のゾーンを第二のゾーンとグループ化し、次に第二のゾーンをグループから分離し、事実上第二のゾーンの状態を第一のゾーンへ移転させてもよい。
ボイス入力内に検出され得るコマンド及び変数インスタンスの意図は、ユーザの意図(例えば、再生、休止、キューに追加、グループ化、その他の移転制御や、例えば制御デバイス104を介して利用可能な制御)と関連し得る多くの既定の語法に基づいてもよい。いくつかの実施形態において、コマンド及び関連した変数インスタンスの処理は、語法内においてコマンド及び変数が特定されることが予測される所定の「スロット」に基づいてもよい。これらの、及びその他の実施において、ユーザの意図を判断するために使われる単語や語彙のセットは、上に説明したとおり、ユーザのカスタマイズ及び嗜好、フィードバック、及び適応的学習に応じてアップデートされてもよい。
いくつかの実施形態において、コマンドに使われる異なるワード、語法、及び/又はフレーズが、同じ意図に関連してもよい。例えば、「再生(play)」、「聴く(listen)」、又は「聞こえる(hear)」のコマンドワードをボイス入力内に含むことは、メディア再生システムがメディアコンテンツを再生するという同じ意図を反映する同義語に対応してもよい。
図9A-9Cは、同義語のさらなる例を示す。例えば、テーブル900の左側のコマンドは、テーブルの右側に示される特定の同義語を有してもよい。図9Aを参照して、例えば、左側コラムの「play」のコマンドは、「break it down」、「let’s jam」、「bust it」を含む右側コラムの同義フレーズと同じ意図を有する。様々な実施形態において、テーブル900内のコマンド及び同義語は、追加、削除、又は編集されてもよい。例えば、コマンド及び同義語は、上に説明したとおり、ユーザのカスタマイズ及び嗜好、フィードバック、トレーニング及び適応的学習に応じて追加、削除、又は編集されてもよい。図9B及び9Cは、制御及びゾーンターゲットにそれぞれ関連する例示的な同義語を示す。
いくつかの実施形態において、変数インスタンスは、コマンドの同義語と類似した方法で既定された同義語を有してもよい。例えば、メディア再生システム100の「バルコニー」ゾーン変数は、同じゾーン変数を代表する「アウトサイド」という同義語を有してもよい。別の例として、「リビングルーム」ゾーン変数は、「リビングエリア」、「テレビルーム」、「ファミリールーム」という同義語を有してもよい。
d.1つ又は複数のコマンドがコマンド情報セット内の対応するクライテリアを満たすことを判断する
図8Aと8Bを一緒に参照して、ブロック807において、方法800は、ブロック806において検出された1つ又は複数のコマンドがコマンド情報890のセット内のコマンドクライテリアを満たすと判断することに関与する。図8Bを参照して、例えば、第一のコマンドが検出された場合、方法800は、第一のコマンドが「クライテリア_1」を満たすか否かを判断し、第二の「コマンド」が検出された場合、方法800は、コマンドが「クライテリア_2」を満たすか否かを判断し、以下同様。
図8Aと8Bを一緒に参照して、ブロック807において、方法800は、ブロック806において検出された1つ又は複数のコマンドがコマンド情報890のセット内のコマンドクライテリアを満たすと判断することに関与する。図8Bを参照して、例えば、第一のコマンドが検出された場合、方法800は、第一のコマンドが「クライテリア_1」を満たすか否かを判断し、第二の「コマンド」が検出された場合、方法800は、コマンドが「クライテリア_2」を満たすか否かを判断し、以下同様。
コマンドは、コマンドクライテリアの複数のセットと比較されてもよい。いくつかの実施形態において、クライテリアの特定のセットは、論理演算子(logical operator)と関連してもよい。例えば、第三の「コマンド」がコマンド「クライテリア_2」及びコマンド「クライテリア_3」と比較される。これらのコマンドは、論理AND演算子によって連結される。したがって、第三の「コマンド」は、2つのセットのクライテリアが満たされる必要がある。対照的に、n番目の「コマンド」は、論理OR演算子によって連結されたクライテリア(クライテリア_x、クライテリア_y、及びクライテリア_z)と関連する。この場合、n番目の「コマンド」は、このコマンドのコマンドクライテリアのセットの内1つのみを満たす必要がある。コマンドが特定のコマンドクライテリアを満たすか否かを判断するために、XOR演算子を含む様々な論理演算子の組み合わせが可能である。
いくつかの実施形態において、コマンドクライテリアは、ボイス入力が1つ又は複数のコマンドを含んでいるか否か判断してもよい。例えば、「(メディア変数)で再生して」のコマンドを備えたボイス入力は、「(ゾーン変数)でも再生して」という第二のコマンドを伴ってもよい。この例において、メディア再生システム100は、「再生して」を1つのコマンドとして認識し、「でも再生して」を後のコマンドを含むことによって満たされるコマンドクライテリアとして認識してもよい。いくつかの実施形態において、上述の例のコマンドが同じボイス入力内で一緒に発声されるとき、それはグループ化の意図に対応し得る。
類似した実施形態において、ボイス入力は、続けて発声される2つのコマンド又はフレーズを含んでもよい。方法800は、そのような連続したコマンド又はフレーズを関連し得ると認識してもよい。例えば、ユーザは、「クラシック音楽を何か再生して」に続いて、「リビングルーム」と「ダイニングルーム」において、というボイス入力を提供し得て、それは、「リビングルーム」と「ダイニングルーム」における再生デバイスのグループ化を推測させるコマンドである。
いくつかの実施形態において、メディア再生システム100は、単語又はフレーズを順番に処理するとき、限定された長さの休止(例えば、1、2秒間)を検出してもよい。いくつかの実施形態において、休止は、コマンドとフレーズの間を区切って、比較的長い一連のコマンド及び情報のボイス処理を容易にするためにユーザによって意図的に行われてもよい。休止には、メディア再生システム100にブロック802においてウェイクワードのモニタ再開をさせることなく一連のコマンド及び情報を取得するために十分な所定の期間があってもよい。一態様において、ユーザは、そのような休止を使って、実行を望むコマンドごとにウェイクワードを繰り返すことなく複数のコマンドを実行してもよい。
e.判断するステップに応じて、第一のVASを選択し、他のVASの選択を放棄し、第一のVASを介して1つ又は複数のコマンドを処理する
特定の所定のコマンドクライテリアを満たすコマンドは、メディア再生システム100に第一のVAS160を発動させるが、所定のクライテリアを満たさないコマンドは、別のVASを発動させ得る、又はVASを全く発動させなくてもよい。例示的な方法800は、ブロック807及び808に示されるように、ボイス入力内の所与のコマンドのコマンドクライテリアを満たすと判断されたボイス入力を送ること、及びブロック809に示されるように、所与のコマンドがクライテリアを満たさないとき、ボイス入力を別のVASに送ることに関与する。
特定の所定のコマンドクライテリアを満たすコマンドは、メディア再生システム100に第一のVAS160を発動させるが、所定のクライテリアを満たさないコマンドは、別のVASを発動させ得る、又はVASを全く発動させなくてもよい。例示的な方法800は、ブロック807及び808に示されるように、ボイス入力内の所与のコマンドのコマンドクライテリアを満たすと判断されたボイス入力を送ること、及びブロック809に示されるように、所与のコマンドがクライテリアを満たさないとき、ボイス入力を別のVASに送ることに関与する。
ブロック810において、方法800は、ブロック808においてボイス入力を受信したVASからの応答を受信して処理することに関与する。一実施形態において、VASからの応答を処理することはVASからの指示を処理して、上述のような再生、制御、ゾーンターゲット、その他のコマンドなどのボイス入力内のコマンドを実行することを含んでもよい。いくつかの実施形態において、リモートコンピュータは、初めのボイス入力に含まれ得る、又はデータベース検索の結果であり得るメディア変数と関連するコンテンツの再生を開始又は制御するように命令されてもよい。
いくつかの実施形態において、ブロック810において応答を処理することは、メディアコンテンツを回収させ得る。一実施形態において、メディア変数はメディアコンテンツのデータベース検索の結果としてメディア再生システム100に提供されてもよい。いくつかの実施形態において、メディア再生システム100は1つ又は複数のメディアサービスからメディアコンテンツを直接回収してもよい。別の実施形態において、VASはブロック800で受信したボイス入力の処理とともにメディアコンテンツを自動的に回収してもよい。様々な実施形態において、メディア変数はメタデータ交換チャンネル及び/又はメディア再生システム100との間で確立したいずれかの通信経路を通して通信されてもよい。そのような通信は、図7Bを参照して上に説明したとおり、コンテンツストリーミングを開始し得る。
いくつかの実施形態において、データベース検索は、ボイス入力内に検出されたメディア変数に基づいた結果を返し得る。例えば、データベース検索は、メディア変数と同じ名前のアルバムを有するアーティスト、メディア変数と一致又は類似したアルバム名、メディア変数の名前がついたトラック、メディア変数のラジオ局、メディア変数の名前がついたプレイリスト、メディア変数に関連したコンテンツのストリーミングサービス供給元識別子、及び/又は生のスピーチからテキストへの変換結果を返すかもしれない。「アメリカン・パイ」の例をとれば、検索結果はアーティスト「ドン・マクリーン」、「アメリカン・パイ」という名のアルバム、「アメリカン・パイ」という名のトラック、「アメリカン・パイ」という名のラジオ局(例えば、「アメリカン・パイ」のPandoraラジオ局の識別子)、音楽サービス(例えばSPOTIFY(登録商標)又はPANDORA(登録商標)などのストリーミング音楽サービス)の「アメリカン・パイ」のトラック識別子(例えばSPOTIFY(登録商標)の「アメリカン・パイ」のトラック識別子、URI、及び/又はURL)、及び/又は「アメリカン・パイ」の生のスピーチからテキストへの結果、を返すかもしれない。
いくつかの実施形態において、方法800は、再生キューの部分がクラウドネットワークのプレイリスト又は再生キューの一部又は全体と一致するように、クラウドネットワークに記憶されたプレイリスト又は再生キューの変更に応じて再生デバイスに記憶された再生キューをアップデートすることに関与してもよい。
メディア再生システム100内の動作を起こすことに応じて、方法800は、ブロック810において、動作に関連した情報をアップデートすること及び/又は記憶することに関与してもよい。例えば、1つ又は複数の制御状態、ゾーン状態、ゾーン識別子、又はその他の情報がブロック800においてアップデートされてもよい。アップデートされる他の情報は、例えば、特定のメディア項目を現在再生している特定の再生デバイスを識別する情報、及び/又は特定のメディア項目が再生デバイスに記憶されたキューに追加された情報を含んでいてもよい。
いくつかの実施形態において、ブロック810において応答を処理することは、ブロック811及び812に示されるように、VASが追加の情報を必要としており、音でユーザにこの情報の要求をしている(prompting)ことの判断につながり得る。例えば、方法800は、マルチターンコマンドを実行するとき、ユーザに追加の情報を要求してもよい。そのような場合、方法800は、ブロック804に戻って追加のボイス入力を取得してもよい。
方法及びシステムは、ここでメディアコンテンツ(例えば、音楽コンテンツ、ビデオコンテンツ)に関して説明されているが、ここで説明される方法及びシステムは、メディアコンテンツ再生システムによって再生可能な関連したオーディオを有する様々なコンテンツに適用されてもよい。例えば、音楽カタログの一部ではないかもしれない過去に録音された音がボイス入力に応じて再生されてもよい。1つの例は、「ナイチンゲールはどんな声で啼くの?」というボイス入力である。このボイス入力に対するネットワークマイクロフォンシステムの応答は識別子付きの音楽コンテンツではなくてもよく、かわりに短いオーディオクリップであってもよい。メディア再生システムは短いオーディオクリップを再生することに関連した情報(例えば、メモリアドレス、リンク、URL、ファイル)、及び短いオーディオクリップを再生するというメディア再生システムのコマンドを受信してもよい。ポッドキャスト、ニュースクリップ、通知音、警報、等の別の例も考えられる。
IV.メディア再生システムのボイス制御の例示的な実施
図10A-20Bは、メディア再生システム100によって処理されるボイス入力、及びボイス入力の処理後、又は処理前のメディア再生システム100の状態を示し得る制御インタフェースの様々な例を示す模式図である。下に説明されるように、ボイス入力内の特定のボイスコマンドに関連したコマンドクライテリアは、上述のVAS160などの強化されたVASボイス制御を提供してもよい。ボイス入力は、上述のように、再生デバイス102の1つに組み入れられていないかもしれないNMD103の1つ又は複数によって受信されてもよい。
図10A-20Bは、メディア再生システム100によって処理されるボイス入力、及びボイス入力の処理後、又は処理前のメディア再生システム100の状態を示し得る制御インタフェースの様々な例を示す模式図である。下に説明されるように、ボイス入力内の特定のボイスコマンドに関連したコマンドクライテリアは、上述のVAS160などの強化されたVASボイス制御を提供してもよい。ボイス入力は、上述のように、再生デバイス102の1つに組み入れられていないかもしれないNMD103の1つ又は複数によって受信されてもよい。
明確性のために図示されないが、上述のように下の様々な例におけるボイス入力は、AMAZONのALEXA(登録商標)又はその他のウェイクワードなどのウェイクワードに先行されてもよい。一態様において、従来のVASなどの第一のVAS又は第二のVASに送信される予定のボイス入力のボイス取得を開始するために同じウェイクワードが使用されてもよい。そのような場合、ボイス発声をするユーザは、裏で1つのVASが別のVASの代わりに選択されていることに気づいていないかもしれない。特定の実施形態において、「ヘイ、SONOS」などの固有のウェイクワードは、さらなる考慮なくユーザによって発声されて第一のVASを発動させてもよい。この場合、再生システム100は別のVASの代わりに第一のVASを選択することを判断するステップを回避し得る。
一態様において、コマンドクライテリアは、デバイスをグループ化するように構成され得る。いくつかの実施形態において、そのようなコマンドクライテリアは、ボイス入力がメディア変数に関与するとき、及び/又は起動したデバイスが再生キューと関連するとき、再生を同時に開始してもよい。例えば図10Aは、NMD103aに「リビングルームとバルコニーでビートルズを再生して」というボイス入力を発声するユーザを示し、図10Bのコントローラインタフェースは、「リビングルーム」と「バルコニー」のグループ化の結果を示す。別の例において、ユーザは特定のトラック、プレイリスト、ムード、又はその他、ここで説明されるようにメディア再生を開始するための情報を発声してもよい。
図10Aのボイス入力は「(メディア変数)を(第一のゾーン変数)及び(第二のゾーン変数)で再生して」という語法の構造を含む。この例において、再生してというコマンドは、2つ以上のゾーン変数をボイス入力内のキーワードとして必要とするコマンドクライテリアを満たす。いくつかの実施形態において、図10Aにおいて示されるボイス入力の発声前後で、「リビングルーム」の再生デバイス102a、102b、102j、及び102kは、結合されたメディア再生デバイス構成に留まってもよい。
いくつかの実施形態において、ゾーン変数が発声される順番が、いずれの再生デバイスが「グループヘッド」に指定されるかを決定し得る。例えば、ユーザが「リビングルーム」のキーワードに引き続き「バルコニー」のキーワードを含むボイス入力を発声したとき、この順番により「リビングルーム」がグループヘッドに決まり得る。グループヘッドはコマンド情報890のセット内においてゾーン変数として記憶されてもよい。グループヘッドは、再生デバイスのグループを参照するための呼び名(handle)になるかもしれない。ユーザがグループの呼び名を含むボイス入力を発声したとき、メディア再生システム100は、「リビングルーム」とともにグループ化された全てのデバイスを参照しているという意図を検出し得る。この方法によれば、デバイスを集合的に制御するとき、ユーザは、デバイスのグループ内の各ゾーンのキーワードを発声する必要がない。関連した実施形態において、ユーザはグループヘッドを別のデバイス又はゾーンに変更するボイス入力を発声し得る。例えば、ユーザは「リビングルーム」ゾーンのグループヘッドを「バルコニー」に変更し得る(そのような場合、インタフェースはグループの順番を「リビングルーム+バルコニー」ではなく、「バルコニー+リビングルーム」と示してもよい)。
代替の例において、図10Cは、ユーザが「ビートルズを再生して」というボイス入力を発声するが、図10Aのボイス入力内の他のキーワードを省略することを示す。この例において、コマンドが上述のようにコマンド情報890のセットのいずれのクライテリアも満たさない場合、ボイス入力は別のVASに送られ得る。
別の例において、コマンドの他のコマンドクライテリアが満たされた場合、上述のキーワードを省略した「ビートルズを再生して」のボイス入力は、なお第一のVAS160に送られ得る。そのような他のコマンドクライテリアは例えば、ゾーン変数、制御状態変数、ターゲット変数、及び/又はその他の変数に関与したクライテリアを含んでもよい。一態様において、変数インスタンスは、ユーザのネットワークマイクロフォンデバイスからの近さ(例えば、計算により、又はその他の方法で判断された距離)であり得る。例えば、図10Cのボイス入力は、ユーザがNMD103の近傍(例えば、所定の半径r1に基づく)に検出されたとき、第一のVAS160に送られ得る。近傍の判断は、例えばボイス入力ソースの信号の強さに基づいてもよい。別の態様において、図10Cのボイス入力は、ユーザのボイスプロフィールが検出されたとき、ユーザの近さが検出されたか否かにかかわらず、第一のVAS160に送られ得る。
さらに別の態様において、近さ及び/又はその他コマンドクライテリアは、従来のVASによって容易に処理できないボイス入力の解明を容易にし得る。例えば、図11Aに示されるように、「バルコニーの音量上げて」というボイス入力を発声するユーザは、バルコニーが同じ名前を有する照明デバイス108を含むため、従来のVASによっては解明できないかもしれない。図1を参照して、第一のVAS160は、ユーザが再生デバイス102cの近傍にいるか否か、及び/又は「バルコニー」が現在関連した制御変数に基づいて再生中か否かを判断することにより、そのような重複したデバイス名を解明できるかもしれない。関連した態様において、第一のVAS160は、ユーザがいない「リビングルーム」の音量ではなく、ユーザが近傍にいる「バルコニー」の再生デバイス102cの音量を上げるよう判断するかもしれない。そのような場合、図11Bに示されるように、メディア再生システム100は、「バルコニー」の音量を上げるが、「リビングルーム」の音量は上げないかもしれない。
同様に、第一のVAS160は、類似したコマンド命名慣習を有するデバイス間のコマンドの重複を解明し得る。例えば、図1に示される「ダイニングルーム」のサーモスタット110は、ユーザによって「設定して」のボイス入力が発声されると、特定の温度(例えば60度から85度の間のレベル)に設定するようにユーザによってプログラムされ得る。同様に、ユーザが「設定して」のボイス入力を発声すると「ダイニングルーム」を特定の音量レベル(例えば、0から100パーセントの音量レベル)に設定し得る。一例において、「ダイニングルームを75に設定せよ」のボイス入力を発声するユーザは、「ダイニングルーム」ゾーンがコマンド情報890のセットに記憶されたコマンドクライテリアに基づいて現在再生中であるから、第一のVAS160によって解明可能である。対照的に、従来のVASは、「ダイニングルーム」の音量レベルを75に変更するべきか、又は「ダイニングルーム」のサーモスタットの温度を75に設定するべきか、判断できない場合がある。
様々な実施形態において、ボイス入力は、個々の再生デバイス、ネットワークマイクロフォンデバイス、及びコントローラデバイス102-104を介したユーザからの他の入力とともに処理されてもよい。例えば、ユーザは、図11Bに示されるインタフェース上のソフトボタン及び制御機能を使って、グループの音量、個々の音量、再生状態、などを独立して制御してもよい。加えて、図11Bの例において、ユーザは、「グループ」のラベルがついたソフトボタンを押して、デバイスのグループ化及びグループ解除を手動で行う別のインタフェースにアクセスしてもよい。一態様において、ボイス入力、コントローラ入力、及び手動デバイス入力を介してメディア再生システム100と対話する複数の方法を提供することにより、滑らかな制御の連続性とユーザ体験の向上が得られるかもしれない。
別のグループ化/グループ分解の例として、「ボブマーリーをバルコニーで再生せよ」というボイス入力は、「バルコニー」を自動的に「リビングルーム」から分離させ得る。そのような場合、「バルコニー」は、ボブマーリーを再生し得て、「リビングルーム」はビートルズの再生を続け得る。代わりに、「リビングルーム」がもはや再生デバイスのグループのグループヘッドではないとコマンドクライテリアが指令する場合、「リビングルーム」は、再生を止めるかもしれない。別の実施形態において、コマンドクライテリアは、再生開始コマンドに応答してデバイスが自動的にグループ解除しないように指令し得る。
コマンドクライテリアは、現在再生中の音楽及び/又はあるゾーンの再生キューを1つのゾーンから別のゾーンへ移動又は移転させるように構成されてもよい。例えば、図12Aに示されるように、ユーザは「『リビングルーム』から『ダイニングルーム』へ、音楽を移動させて」というボイス入力を発声してもよい。図12Bのコントローラインタフェースに示されるように、音楽を移動させるリクエストは「リビングルーム」で再生中の音楽を「ダイニングルーム」へ移動させ得る。関連した例において、ユーザは「音楽をここへ移動させて」のボイス入力を図1に示される「ダイニングルーム」の近くのNMD103fへ直接発声することによって音楽を「ダイニングルーム」へ移動させてもよい。この場合、ユーザは明確に「ダイニングルーム」を参照しないが、VAS160は、ユーザが「ダイニングルーム」に近いことに基づいて意図を推定する。関連した実施形態において、VAS160は、NMD103fが「ダイニングルーム」の再生デバイス102lと結合していると判断した場合、他の隣接した部屋(例えば「キッチン」)ではなく、「ダイニングルーム」へ音楽を移動するように判断してもよい。別の例において、再生システム100は、現在再生中コンテンツのメタデータから情報を推定してもよい。そのような一例において、ユーザは「レットイットビー(又はビートルズ)を『ダイニングルーム』へ移動させて」と発声してもよく、望ましい再生ゾーン及び/又はゾーングループへ移動させる特定の音楽を識別する。この方法によれば、メディア再生システムは、いずれのコンテンツを移動させるかを判断するために、別の再生ゾーン及び/又はゾーングループで現在再生中及び/又は再生キューにあるかもしれないコンテンツの間で区別ができる。
さらに別の例において、「リビングルーム」などのグループヘッドと関連する全てのデバイスは、音楽をグループヘッドから「ダイニングルーム」に移動すると、再生を停止し得る。関連した例において、音楽が移動してしまったとき、「リビングルーム」ゾーンはグループヘッドとしての指定を失ってもよい。
コマンドクライテリアは、ボイス入力コマンドを使って存在するグループにデバイスを加えるように構成されてもよい。例えば、図13A及び13Bに示されるように、ユーザは、「『リビングルーム』を『ダイニングルーム』に追加して」とのボイス入力を発声することによって「リビングルーム」ゾーンを加えて、「ダイニングルーム」とグループを形成させ得る。関連した実施形態において、ユーザは、「ここでも再生して」というボイス入力を図1に示す「リビングルーム」のNMD103aに直接発声することにより「リビングルーム」を加えてもよい。この場合、ユーザはボイス入力内で明確にリビングルームを参照しないが、VAS160は、ユーザの近さに基づいて「リビングルーム」を追加されるべきと推定してもよい。別の例において、この意図を有するとき「ダイニングルーム」にいると仮定すれば、「リビングルームを追加して」のコマンドを発声してもよい。この場合、ダイニングルームターゲットは入力デバイスを含む部屋から暗示されてもよい。
さらに別の例において、ユーザは、「リビングルーム」と「ダイニングルーム」のいずれがグループヘッドになるかをボイス入力内で示してもよく、又はVAS160がユーザにグループヘッドを指定するようにリクエストしてもよい。
グループを加える又は形成する別の例として、ユーザはカスタムゾーン変数に関連したキーワードを備えたボイス入力を使ってグループのインスタンスを形成(instantiate)してもよい。例えば、ユーザは上述の「フロントエリア」のカスタムゾーン変数を生成してもよい。ユーザは、図14A及び14Bに示されるように、「バンヘイレンを『フロントエリア』で再生して」などのボイス入力を発声することによって「フロントエリア」グループのインスタンスを形成してもよい。図13Bの前の「ダイニングルーム」グループは図14Aに示されるボイス入力に応答して置き換えられてもよい。
コマンドクライテリアは、ボイス入力コマンドを使ってデバイスを既存のグループから削除するように構成されてもよい。例えば、ユーザは、図15A及び15Bに示されるように「フロントエリア」グループから「バルコニー」を取り除くために「『バルコニー』を外して」のボイス入力を発声してもよい。別の例として、バルコニーの「停止/削除」のコマンドが同じことをし得る。上に説明したとおり、他の例示的な同義語もあり得る。さらに別の例において、ユーザがバルコニーにいると仮定して、ユーザは同じ結果を達成するために図1の「バルコニー」のNMD103cへ「ここを止めて」又は「この部屋を止めて」などを発声することにより直接発声してもよい。
コマンドクライテリアは、オーディオコンテンツソースを選択して関連した機能を実施するように構成されてもよい。例えば、図16Aは、「テレビを見たい」というボイス入力をNMD103aに発声しているユーザを示す。図16Bに示されるように、応答してメディア再生システム100は、オーディオコンテンツソースを音楽ソースからテレビソースに切り替える。いくつかの実施形態において、メディア再生システム100にテレビソースを再生するよう指示することにより、自動的に「リビングルーム」を他のゾーンから分離してもよい。例えば図16Bにおいて、「ダイニングルーム」及び「キッチン」においてバンヘイレンの再生が継続するが、「リビングルーム」はテレビソースに切り替わる。いくつかの例において、上述のように、ユーザは続いてグループ化することによりホーム環境の他のゾーンでテレビソースを再生するためのコマンドを発声してもよい。
関連した実施形態において、メディア再生システム100は、「リビングルーム」がテレビソースに接続しているときを示す状態情報を記憶してもよい。「リビングルーム」がこの状態のとき、テレビソースに関連するボイスコマンドはVASによって実行され得ると、図9Bに示されるソースコマンド(例えば、スピーチを強化、静かなモードに変更)のようにコマンドクライテリアが命令してもよい。
コマンドクライテリアは、デバイスを結合するように構成されてもよい。例えば、図17Aは、ユーザが「フロントのテレビを見たい」というボイス入力を発声するところを示す。応答してVAS160は、図16Bに示されるように、コマンドクライテリアに基づいて、図1の「フロント」の再生デバイス102bが「リビングルーム」ゾーンから離れてテレビゾーンを形成すると判断してもよい。関連する例において、ユーザは直接「フロント」の再生デバイス102bのNMD103bにボイス入力を発声し、このデバイスを分離してもよい。リビングルームの残りの結合されたデバイス、すなわち「右」、「左」、及び「サブ」デバイス102a、102j、及び102k、は音楽の再生を終わってもよい。制御インタフェースはまたこれらのデバイスを「リビングルーム」ゾーンの一部ではなくなったものとして表示してもよい。
結合の別の例として、ユーザは、「フロント」の再生デバイス102bと分離した後、リビングルームエリアの残りのデバイスとともに異なる結合構成を形成してもよい。例えば、図18A及び18Bに示されるようにユーザは、「サテライトとサブでボブマーリーを再生してリスニングゾーンを形成せよ」とボイス入力を発声することによりリスニングゾーンを形成してもよい。「サテライト」という用語は、「右」再生デバイス102a及び「左」再生デバイス102jを参照するカスタムゾーン変数であってもよい。図18Aのボイス入力はまた、新規に形成されたリスニングゾーンにおいてボブマーリーの再生を開始する。図18Bのコントローラインタフェースにさらに示されるとおり、図示の例において、図17A-18Bの結合操作は「ダイニングルーム」及び「キッチン」におけるバンヘイレンの再生を中断しなかった。
コマンドクライテリアは、デバイスをペアにする/結合するように構成されてもよい。例えば、図19Aは、ユーザが「『ダイニングルーム』と『キッチン』をステレオでペアにして」のボイス入力を発声するマルチターンコマンドを示す。この例において、VASは、NMD103の1つ以上に、ユーザに注意を促す(prompt)よう指示し、「ダイニングルーム」ゾーンが右のチャンネルであるべきか否かを尋ねる。ユーザが「ダイニングルーム」が右のチャンネルであると確認する場合、「キッチン」ゾーンが左のチャンネルとなる。ユーザが「ダイニングルーム」が右のチャンネルではないと示す場合、「ダイニングルーム」がデフォルトにより左のチャンネルとなり「キッチン」ゾーンが右のチャンネルとなる。結合されたとき、「ダイニングルーム」と「キッチン」のうちの1つがグループヘッドとして選定されてもよい。VASは、図19Bに示されるようにユーザに結合されたデバイスに、「Cocina]などの固有名を含む名称を指名するように注意を促してもよい。「Cocina]ゾーンは、バンヘイレンの再生を再開してもよく、これは元の「ダイニングルーム」及び「キッチン」ゾーンのいずれかの再生キューからの移転かもしれない。
関連する実施形態において、デバイスの結合及び併合は、図20A及び20Bに示されるようにVASにマルチターン又は再生デバイスを較正するためのその他のコマンドを開始させることができる。一例において、VAS160は、「ダイニングルーム」と「キッチン」ゾーンをペアにした後、図19Aの一連のマルチターンコマンドを継続してもよい。いくつかの実施形態において、コマンドクライテリアは、較正を開始する前に、ユーザがコントローラデバイス103の1つを操作していることの検出を必要としてもよい。この方法によれば、図20Bに示されるように、VAS160は、較正用のSONOSのTRUEPLAY(登録商標)などの較正ソフトウェアを準備してもよい。
VII.結論
上記の説明は、とりわけ、コンポーネント、ファームウェア及び/又はハードウェア上で実行されるソフトウェアを含む様々な例示的なシステム、方法、装置、及び製品を開示している。そのような例は単に例示的なものであり、限定的であると見なされるべきではないことが理解される。例えば、ファームウェア、ハードウェア及び/又はソフトウェアの態様又はコンポーネントのいずれか又は全てを、ハードウェアのみ、ソフトウェアのみ、ファームウェアのみ、又はハードウェア、ソフトウェア及び/又はファームウェアの任意の組み合わせで実施できることが考えられる。したがって、提供される例は、そのようなシステム、方法、装置、及び/又は製品を実施するための唯一の方法ではない。
上記の説明は、とりわけ、コンポーネント、ファームウェア及び/又はハードウェア上で実行されるソフトウェアを含む様々な例示的なシステム、方法、装置、及び製品を開示している。そのような例は単に例示的なものであり、限定的であると見なされるべきではないことが理解される。例えば、ファームウェア、ハードウェア及び/又はソフトウェアの態様又はコンポーネントのいずれか又は全てを、ハードウェアのみ、ソフトウェアのみ、ファームウェアのみ、又はハードウェア、ソフトウェア及び/又はファームウェアの任意の組み合わせで実施できることが考えられる。したがって、提供される例は、そのようなシステム、方法、装置、及び/又は製品を実施するための唯一の方法ではない。
(特徴1)メディア再生システムの第一のボイスアシスタントサービス(VAS)を発動させる方法であって、方法は、
コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
ネットワークマイクロフォンデバイスの少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
ボイス入力内に1つ又は複数のコマンドが含まれていることを検出するステップと、
1つ又は複数のコマンドが、コマンド情報のセット内の対応するコマンドクライテリアを満たすことを判断するステップと、を含み、
判断に応答して、第一のVASを選択し第二のVASの選択を放棄し、(ii)ボイス入力を第一のVASに送信し、(iii)ボイス入力の送信後、第一のVASからのボイス入力への返答を受信する、
方法。
コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
ネットワークマイクロフォンデバイスの少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
ボイス入力内に1つ又は複数のコマンドが含まれていることを検出するステップと、
1つ又は複数のコマンドが、コマンド情報のセット内の対応するコマンドクライテリアを満たすことを判断するステップと、を含み、
判断に応答して、第一のVASを選択し第二のVASの選択を放棄し、(ii)ボイス入力を第一のVASに送信し、(iii)ボイス入力の送信後、第一のVASからのボイス入力への返答を受信する、
方法。
(特徴2)メディア再生システムが複数の再生デバイスを含み、
1つ又は複数のコマンドが、複数の再生デバイスのうち2つ又はそれ以上の再生デバイスをグループ化し、2つ又はそれ以上の再生デバイスを含むグループでオーディオコンテンツの再生を開始する、
特徴1に記載の方法。
1つ又は複数のコマンドが、複数の再生デバイスのうち2つ又はそれ以上の再生デバイスをグループ化し、2つ又はそれ以上の再生デバイスを含むグループでオーディオコンテンツの再生を開始する、
特徴1に記載の方法。
(特徴3)判断するステップは、1つ又は複数のキーワードがボイス入力内に含まれることを検出することを含み、
1つ又は複数のキーワードが、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴2に記載の方法。
1つ又は複数のキーワードが、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴2に記載の方法。
(特徴4)2つ又はそれ以上の再生デバイスのうちの1つは、ネットワークマイクロフォンデバイスを含む、
特徴2に記載の方法。
特徴2に記載の方法。
(特徴5)1つ又は複数のコマンドがメディア再生システムに向けられ、
方法は、第一のVASからの応答に基づいてメディア再生システムを介して1つ又は複数のコマンドを処理するステップをさらに含む、
特徴1に記載の方法。
方法は、第一のVASからの応答に基づいてメディア再生システムを介して1つ又は複数のコマンドを処理するステップをさらに含む、
特徴1に記載の方法。
(特徴6)1つ又は複数のコマンドは、再生コマンド及びトランスポート制御コマンドの少なくとも1つを含む、
特徴5に記載の方法。
特徴5に記載の方法。
(特徴7)ボイス入力は、第一のボイス入力であり、
方法は、第一のVASからの応答に基づいて可聴の要求を出力するステップをさらに含む、
特徴1に記載の方法。
方法は、第一のVASからの応答に基づいて可聴の要求を出力するステップをさらに含む、
特徴1に記載の方法。
(特徴8)ボイス入力は、第一のボイス入力であり、
方法は、第一のVASからの応答に基づいて第二のボイス入力への可聴の要求を出力するステップをさらに含む、
特徴1に記載の方法。
方法は、第一のVASからの応答に基づいて第二のボイス入力への可聴の要求を出力するステップをさらに含む、
特徴1に記載の方法。
(特徴9)メディア再生システムは、複数の再生デバイスを含み、
1つ又は複数のコマンドは、2つ又はそれ以上の再生デバイスをペアにするコマンドを含み、
可聴の要求は、2つ又はそれ以上の再生デバイスの少なくとも1つをオーディオチャンネルに割り当てるリクエストを含み、
第二のボイス入力は、2つ又はそれ以上の再生デバイスの少なくとも1つの選択を含む、
特徴8に記載の方法。
1つ又は複数のコマンドは、2つ又はそれ以上の再生デバイスをペアにするコマンドを含み、
可聴の要求は、2つ又はそれ以上の再生デバイスの少なくとも1つをオーディオチャンネルに割り当てるリクエストを含み、
第二のボイス入力は、2つ又はそれ以上の再生デバイスの少なくとも1つの選択を含む、
特徴8に記載の方法。
(特徴10)メディア再生システムは、1つ又は複数の再生デバイスを含み、
可聴の要求は、1つ又は複数の再生デバイスのイコライザ設定を較正するリクエストを含む、
特徴8に記載の方法。
可聴の要求は、1つ又は複数の再生デバイスのイコライザ設定を較正するリクエストを含む、
特徴8に記載の方法。
(特徴11)判断するステップは、ボイス入力ソースの存在を検出することを含む、
特徴1に記載の方法。
特徴1に記載の方法。
(特徴12)存在を検出することは、ボイス入力ソースからボイス入力がネットワークマイクロフォンデバイスによって受信される方向を検出することを含む、
特徴11に記載の方法。
特徴11に記載の方法。
(特徴13)存在を検出することは、ネットワークマイクロフォンデバイスとボイス入力ソースとの間の距離を検出することを含む、
特徴11に記載の方法。
特徴11に記載の方法。
(特徴14)判断するステップは、コントローラデバイスの使用を検出することを含む、
特徴1に記載の方法。
特徴1に記載の方法。
(特徴15)判断するステップは、ボイス入力ソースのボイスプロフィールを検出することを含む、
特徴1に記載の方法。
特徴1に記載の方法。
(特徴16)1つ又は複数のコマンドは、1つ又は複数の第一のコマンドであり、
判断するステップは、ボイス入力内に1つ又は複数の第二のコマンドを検出することを含む、
特徴1に記載の方法。
判断するステップは、ボイス入力内に1つ又は複数の第二のコマンドを検出することを含む、
特徴1に記載の方法。
(特徴17)判断するステップは、1つ又は複数の第一のコマンドと1つ又は複数の第二のコマンドとの間で、ボイス入力内に少なくとも1つの休止を検出することをさらに含む、
特徴16に記載の方法。
特徴16に記載の方法。
(特徴18)メディア再生システムのネットワークマイクロフォンデバイスであって、
(i)プロセッサと、
(ii)少なくとも1つのマイクロフォンと、
(iii)プロセッサによって実行されるとき、ネットワークマイクロフォンデバイスにメディア再生システムの機能を実施させる指示を記憶した、実体のあるコンピュータ読み取り可能な記憶媒体と、を含み、
機能は、
(a)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(b)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(c)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(d)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(e)判断に応答して、
(i)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(ii)ボイス入力を第一のVASに送信し、
(iii)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含むメディア再生システムのネットワークマイクロフォンデバイス。
(i)プロセッサと、
(ii)少なくとも1つのマイクロフォンと、
(iii)プロセッサによって実行されるとき、ネットワークマイクロフォンデバイスにメディア再生システムの機能を実施させる指示を記憶した、実体のあるコンピュータ読み取り可能な記憶媒体と、を含み、
機能は、
(a)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(b)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(c)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(d)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(e)判断に応答して、
(i)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(ii)ボイス入力を第一のVASに送信し、
(iii)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含むメディア再生システムのネットワークマイクロフォンデバイス。
(特徴19)メディア再生システムが複数の再生デバイスを含み、
1つ又は複数のコマンドが、再生デバイスの2つ又はそれ以上をグループ化し、オーディオコンテンツの再生を2つ又はそれ以上の再生デバイスを含むグループで開始させるコマンドを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
1つ又は複数のコマンドが、再生デバイスの2つ又はそれ以上をグループ化し、オーディオコンテンツの再生を2つ又はそれ以上の再生デバイスを含むグループで開始させるコマンドを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴20)判断するステップは、ボイス入力内に1つ又は複数のキーワードが含まれることの検出を含み、
1つ又は複数のキーワードが、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴19に記載のネットワークマイクロフォンデバイス。
1つ又は複数のキーワードが、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴19に記載のネットワークマイクロフォンデバイス。
(特徴21)2つ又はそれ以上の再生デバイスのうちの1つは、ネットワークマイクロフォンデバイスを含む、
特徴19に記載のネットワークマイクロフォンデバイス。
特徴19に記載のネットワークマイクロフォンデバイス。
(特徴22)1つ又は複数のコマンドは、メディア再生システムに向けられ、
機能は、第一のVASからの応答に基づいてメディア再生システムを介して1つ又は複数のコマンドを処理するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
機能は、第一のVASからの応答に基づいてメディア再生システムを介して1つ又は複数のコマンドを処理するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴23)1つ又は複数のコマンドは、再生コマンド及びトランスポート制御コマンドの少なくとも1つを含む、
特徴22に記載のネットワークマイクロフォンデバイス。
特徴22に記載のネットワークマイクロフォンデバイス。
(特徴24)ボイス入力は、第一のボイス入力であり、
機能は、第一のVASからの応答に基づいて可聴の要求を出力するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
機能は、第一のVASからの応答に基づいて可聴の要求を出力するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴25)ボイス入力は、第一のボイス入力であり、
機能は、第一のVASからの応答に基づいて第二のボイス入力への可聴の要求を出力するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
機能は、第一のVASからの応答に基づいて第二のボイス入力への可聴の要求を出力するステップをさらに含む、
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴26)メディア再生システムは、複数の再生デバイスを含み、
1つ又は複数のコマンドは、2つ又はそれ以上の再生デバイスをペアにするコマンドを含み、
可聴の要求は、2つ又はそれ以上の再生デバイスの少なくとも1つをオーディオチャンネルに割り当てるリクエストを含み、
第二のボイス入力は、2つ又はそれ以上の再生デバイスの少なくとも1つの選択を含む、
特徴25に記載のネットワークマイクロフォンデバイス。
1つ又は複数のコマンドは、2つ又はそれ以上の再生デバイスをペアにするコマンドを含み、
可聴の要求は、2つ又はそれ以上の再生デバイスの少なくとも1つをオーディオチャンネルに割り当てるリクエストを含み、
第二のボイス入力は、2つ又はそれ以上の再生デバイスの少なくとも1つの選択を含む、
特徴25に記載のネットワークマイクロフォンデバイス。
(特徴27)メディア再生システムは、1つ又は複数の再生デバイスを含み、
可聴の要求は、1つ又は複数の再生デバイスのイコライザ設定を較正するリクエストを含む、
特徴25に記載のネットワークマイクロフォンデバイス。
可聴の要求は、1つ又は複数の再生デバイスのイコライザ設定を較正するリクエストを含む、
特徴25に記載のネットワークマイクロフォンデバイス。
(特徴28)判断するステップは、ボイス入力ソースの存在を検出することを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴29)存在を検出することは、ボイス入力ソースからボイス入力がネットワークマイクロフォンデバイスによって受信される方向を検出することを含む
特徴28に記載のネットワークマイクロフォンデバイス。
特徴28に記載のネットワークマイクロフォンデバイス。
(特徴30)存在を検出することは、ネットワークマイクロフォンデバイスとボイス入力ソースとの間の距離を検出することを含む、
特徴28に記載のネットワークマイクロフォンデバイス。
特徴28に記載のネットワークマイクロフォンデバイス。
(特徴31)判断するステップは、コントローラデバイスの使用を検出することを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴32)判断するステップは、ボイス入力ソースのボイスプロフィールを検出することを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴33)1つ又は複数のコマンドは、1つ又は複数の第一のコマンドであり、
判断するステップは、ボイス入力内に1つ又は複数の第二のコマンドを検出することを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
判断するステップは、ボイス入力内に1つ又は複数の第二のコマンドを検出することを含む、
特徴18に記載のネットワークマイクロフォンデバイス。
(特徴34)判断するステップは、1つ又は複数の第一のコマンドと1つ又は複数の第二のコマンドとの間で、ボイス入力内に少なくとも1つの休止を検出することをさらに含む、
特徴33に記載のネットワークマイクロフォンデバイス。
特徴33に記載のネットワークマイクロフォンデバイス。
(特徴35)メディア再生システムの第一のボイスアシスタントサービス(VAS)を発動させる方法であって、
方法は、
(i)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(ii)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(iii)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(iv)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(v)判断に応答して、
(a)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(b)ボイス入力を第一のVASに送信し、
(c)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含む方法。
方法は、
(i)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(ii)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(iii)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(iv)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(v)判断に応答して、
(a)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(b)ボイス入力を第一のVASに送信し、
(c)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含む方法。
(特徴36)メディア再生システムは、複数の再生デバイスを含み、
1つ又は複数のコマンドが、複数の再生デバイスの2つ又はそれ以上の再生デバイスをグループ化し、オーディオコンテンツの再生を2つ又はそれ以上の再生デバイスを含むグループで開始させるコマンドを含み、
判断するステップは、ボイス入力内に1つ又は複数のキーワードが含まれることの検出を含み、
1つ又は複数のキーワードは、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴35に記載の方法。
1つ又は複数のコマンドが、複数の再生デバイスの2つ又はそれ以上の再生デバイスをグループ化し、オーディオコンテンツの再生を2つ又はそれ以上の再生デバイスを含むグループで開始させるコマンドを含み、
判断するステップは、ボイス入力内に1つ又は複数のキーワードが含まれることの検出を含み、
1つ又は複数のキーワードは、(i)2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、(ii)2つ又はそれ以上の再生デバイスを含むグループと、のうちの少なくとも1つを含む、
特徴35に記載の方法。
(特徴37)1つ又は複数のプロセッサによって実行されるとネットワークマイクロフォンデバイスにメディア再生システム内の操作をさせる指示を中に記憶し、実体があり非一時的なコンピュータ読み取り可能な記憶媒体であって、
操作は、
(i)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(ii)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(iii)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(iv)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(v)判断に応答して、
(a)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(b)ボイス入力を第一のVASに送信し、
(c)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含むメディア。
操作は、
(i)コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメモリに記憶させるステップと、
(ii)少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
(iii)ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
(iv)1つ又は複数のコマンドが、コマンド情報のセット内の1つ又は複数のコマンドと関連する対応コマンドクライテリアを満たすことを判断するステップと、
(v)判断に応答して、
(a)第一のボイスアシスタントサービス(VAS)を選択し、第二のVASの選択を放棄し、
(b)ボイス入力を第一のVASに送信し、
(c)ボイス入力を送信後、第一のVASからボイス入力を受信するステップと、を含むメディア。
本明細書は、例示的な環境、システム、手順、ステップ、論理ブロック、処理、及び他のシンボル表現に関して広く示されており、それらは直接又は間接的にネットワークに接続されるデータ処理デバイスの動作に類似するものである。これらの処理説明及び表現は、一般的に当業者によって使用され、それらの仕事の内容を他の当業者に最も効率良く伝えることができる。多くの具体的な内容が、本開示を理解するために提供されている。しかしながら、当業者にとって、本開示の特定の実施形態が特定の、具体的な詳細なしに実施され得ることは理解される。他の例では、周知の方法、手順、コンポーネント、及び回路が、実施形態を不必要に曖昧にすることを避けるため、詳細に説明していない。したがって、本開示の範囲は、上記した実施形態よりむしろ添付された特許請求の範囲によって定義される。
添付の特許請求の範囲のいずれかが単にソフトウェア及び/又はファームウェアへの実装をカバーするように読み取ると、少なくとも1つの例における要素の1つ又は複数は、本明細書では、ソフトウェア及び/又はファームウェアを記憶する有形の非一時的な記憶媒体、例えば、メモリ、DVD、CD、Blu-ray(登録商標)等を含むことが明確に定められている。
Claims (14)
- コマンド及び関連するコマンドクライテリアのリストを含むコマンド情報のセットをメディア再生システムのネットワークマイクロフォンデバイスのメモリに記憶させるステップと、
前記ネットワークマイクロフォンデバイスの少なくとも1つのマイクロフォンを介してボイス入力を取得するステップと、
前記ボイス入力内に1つ又は複数のコマンドが含まれることを検出するステップと、
前記1つ又は複数のコマンドが、コマンド情報のセット内の前記1つ又は複数のコマンドに関連する対応コマンドクライテリアを満たすことを判断するステップと、
前記判断に応答して、(i)第一のボイスアシスタントサービス(VAS)を選択し第二のVASの選択を放棄し、(ii)前記ボイス入力を第一のVASに送信し、(iii)前記ボイス入力の送信後、前記第一のVASからのボイス入力への応答を受信するステップと、を含む方法。 - 前記メディア再生システムが複数の再生デバイスを含み、
前記1つ又は複数のコマンドが、前記再生デバイスの2つ又はそれ以上をグループ化し、前記2つ又はそれ以上の再生デバイスを含むグループでオーディオコンテンツの再生を開始するコマンドを含む、
請求項1に記載の方法。 - 前記判断するステップは、前記ボイス入力内に1つ又は複数のキーワードが含まれることを検出することを含み、
前記1つ又は複数のキーワードは、
(i)前記2つ又はそれ以上の再生デバイスのうちの1つと関連する第一のキーワードならびに2つ又はそれ以上の再生デバイスのうちの別の1つと関連する第二のキーワードと、
(ii)前記2つ又はそれ以上の再生デバイスを含むグループと、
のうちの少なくとも1つを含む、
請求項2に記載の方法。 - 前記2つ又はそれ以上の再生デバイスのうちの1つは、前記ネットワークマイクロフォンデバイスを含む、
請求項2又は3に記載の方法。 - 前記1つ又は複数のコマンドは、前記メディア再生システムに向けられ、
前記方法は、前記第一のVASからの応答に基づいて前記メディア再生システムを介して前記1つ又は複数のコマンドを処理するステップをさらに含む、
請求項1-4のいずれか1つに記載の方法。 - 前記ボイス入力は、第一のボイス入力であり、
前記方法は、前記第一のVASからの応答に基づいて可聴の要求を出力するステップをさらに含む、
請求項1-5のいずれか1つに記載の方法。 - 前記ボイス入力は、第一のボイス入力であり、
前記方法は、前記第一のVASからの応答に基づいて第二のボイス入力への可聴の要求を出力するステップをさらに含む、
請求項1-6のいずれか1つに記載の方法。 - 前記メディア再生システムは、複数の再生デバイスを含み、
前記1つ又は複数のコマンドは、前記複数の再生デバイスのうちの2つ又はそれ以上の再生デバイスをペアにするコマンドを含み、
前記可聴の要求は、前記2つ又はそれ以上の再生デバイスのうちの少なくとも1つをオーディオチャンネルに割り当てるリクエストを含み、
前記第二のボイス入力は、前記2つ又はそれ以上の再生デバイスのうちの少なくとも1つの選択を含む、
請求項7に記載の方法。 - 前記メディア再生システムは、1つ又は複数の再生デバイスを含み、
前記可聴の要求は、前記1つ又は複数の再生デバイスのイコライザ設定を較正するリクエストを含む、
請求項7又は8に記載の方法。 - 前記判断するステップは、ボイス入力ソースの存在を検出することを含み、
前記存在を検出することは、
前記ボイス入力ソースから前記ボイス入力が前記ネットワークマイクロフォンデバイスによって受信される方向、及び
前記ネットワークマイクロフォンデバイスと前記ボイス入力ソースとの間の距離、
のうちの少なくとも1つを検出することを含む、
請求項1-9のいずれか1つに記載の方法。 - 前記判断するステップは、
コントローラデバイスの使用、及び
ボイス入力ソースのボイスプロフィール、
のうちの少なくとも1つを検出することを含む、
請求項1-10のいずれか1つに記載の方法。 - 前記1つ又は複数のコマンドは、1つ又は複数の第一のコマンドであり、
前記判断するステップは、前記ボイス入力内に1つ又は複数の第二のコマンドを検出すること、及び前記1つ又は複数の第一のコマンドと前記1つ又は複数の第二のコマンドとの間で、前記ボイス入力内に少なくとも1つの休止を検出することを含む、
請求項1-11のいずれか1つに記載の方法。 - 1つ又は複数のプロセッサによって実行されるとネットワークマイクロフォンデバイスに請求項1-12のいずれか1つに記載の方法を実施させる指示を含む、非一時的なコンピュータ読み取り可能な記録媒体。
- 1つ又は複数のマイクロフォンと、
1つ又は複数のプロセッサと、
請求項13に記載の前記非一時的なコンピュータ読み取り可能な記録媒体を含む、
ネットワークマイクロフォンデバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/721,141 | 2017-09-29 | ||
US15/721,141 US10466962B2 (en) | 2017-09-29 | 2017-09-29 | Media playback system with voice assistance |
PCT/US2018/053472 WO2019067930A1 (en) | 2017-09-29 | 2018-09-28 | MULTIMEDIA VOICE ASSISTED READING SYSTEM |
JP2020518400A JP6987230B2 (ja) | 2017-09-29 | 2018-09-28 | ボイスアシスタンスを備えたメディア再生システム |
JP2021194522A JP7346529B2 (ja) | 2017-09-29 | 2021-11-30 | ボイスアシスタンスを備えたメディア再生システム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021194522A Division JP7346529B2 (ja) | 2017-09-29 | 2021-11-30 | ボイスアシスタンスを備えたメディア再生システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023164959A true JP2023164959A (ja) | 2023-11-14 |
Family
ID=63963452
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020518400A Active JP6987230B2 (ja) | 2017-09-29 | 2018-09-28 | ボイスアシスタンスを備えたメディア再生システム |
JP2021194522A Active JP7346529B2 (ja) | 2017-09-29 | 2021-11-30 | ボイスアシスタンスを備えたメディア再生システム |
JP2023144379A Pending JP2023164959A (ja) | 2017-09-29 | 2023-09-06 | ボイスアシスタンスを備えたメディア再生システム |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020518400A Active JP6987230B2 (ja) | 2017-09-29 | 2018-09-28 | ボイスアシスタンスを備えたメディア再生システム |
JP2021194522A Active JP7346529B2 (ja) | 2017-09-29 | 2021-11-30 | ボイスアシスタンスを備えたメディア再生システム |
Country Status (8)
Country | Link |
---|---|
US (5) | US10466962B2 (ja) |
EP (2) | EP3688995B1 (ja) |
JP (3) | JP6987230B2 (ja) |
KR (3) | KR102597285B1 (ja) |
CN (2) | CN115857747A (ja) |
AU (2) | AU2018338812A1 (ja) |
CA (1) | CA3084279A1 (ja) |
WO (1) | WO2019067930A1 (ja) |
Families Citing this family (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9954996B2 (en) | 2007-06-28 | 2018-04-24 | Apple Inc. | Portable electronic device with conversation management for incoming instant messages |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8689128B2 (en) | 2009-03-16 | 2014-04-01 | Apple Inc. | Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10706096B2 (en) | 2011-08-18 | 2020-07-07 | Apple Inc. | Management of local and remote media items |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
EP3149554B1 (en) | 2014-05-30 | 2024-05-01 | Apple Inc. | Continuity |
US20150350141A1 (en) | 2014-05-31 | 2015-12-03 | Apple Inc. | Message user interfaces for capture and transmittal of media and location content |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
WO2016036541A2 (en) | 2014-09-02 | 2016-03-10 | Apple Inc. | Phone user interface |
CN113824998A (zh) | 2014-09-02 | 2021-12-21 | 苹果公司 | 音乐用户界面 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US10928980B2 (en) | 2017-05-12 | 2021-02-23 | Apple Inc. | User interfaces for playing and managing audio items |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10372298B2 (en) | 2017-09-29 | 2019-08-06 | Apple Inc. | User interface for multi-user communication session |
JP7192208B2 (ja) * | 2017-12-01 | 2022-12-20 | ヤマハ株式会社 | 機器制御システム、デバイス、プログラム、及び機器制御方法 |
US10157042B1 (en) * | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
CN108428452B (zh) * | 2018-03-14 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 终端支架和远场语音交互系统 |
CN108510987B (zh) * | 2018-03-26 | 2020-10-23 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US20190311710A1 (en) * | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US11250840B1 (en) | 2018-04-09 | 2022-02-15 | Perceive Corporation | Machine-trained network detecting context-sensitive wake expressions for a digital assistant |
US10629203B2 (en) * | 2018-04-17 | 2020-04-21 | Flex, Ltd. | Method and systems for bookmarking complex commands using voice |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
DK180130B1 (da) | 2018-05-07 | 2020-06-02 | Apple Inc. | Multi-participant live communication user interface |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10938994B2 (en) * | 2018-06-25 | 2021-03-02 | Cypress Semiconductor Corporation | Beamformer and acoustic echo canceller (AEC) system |
CN108922528B (zh) * | 2018-06-29 | 2020-10-23 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
US11189275B2 (en) * | 2018-08-02 | 2021-11-30 | Polycom, Inc. | Natural language processing while sound sensor is muted |
KR20200034430A (ko) * | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11100926B2 (en) * | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11128792B2 (en) | 2018-09-28 | 2021-09-21 | Apple Inc. | Capturing and displaying images with multiple focal planes |
US10978046B2 (en) * | 2018-10-15 | 2021-04-13 | Midea Group Co., Ltd. | System and method for customizing portable natural language processing interface for appliances |
KR20200109467A (ko) * | 2019-03-13 | 2020-09-23 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
JP7236919B2 (ja) * | 2019-04-12 | 2023-03-10 | 三菱電機株式会社 | 音声入力装置、音声操作システム、音声操作方法及びプログラム |
CN110109645A (zh) * | 2019-04-30 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐试听方法、装置和终端 |
US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11544463B2 (en) | 2019-05-09 | 2023-01-03 | Intel Corporation | Time asynchronous spoken intent detection |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970533A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Methods and user interfaces for sharing audio |
US11010121B2 (en) | 2019-05-31 | 2021-05-18 | Apple Inc. | User interfaces for audio media control |
US10867608B1 (en) | 2019-05-31 | 2020-12-15 | Apple Inc. | Multi-user configuration |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11363071B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User interfaces for managing a local network |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
KR102436985B1 (ko) | 2019-05-31 | 2022-08-29 | 애플 인크. | 오디오 미디어 제어를 위한 사용자 인터페이스 |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
WO2020246634A1 (ko) * | 2019-06-04 | 2020-12-10 | 엘지전자 주식회사 | 다른 기기의 동작을 제어할 수 있는 인공 지능 기기 및 그의 동작 방법 |
KR20210055347A (ko) * | 2019-11-07 | 2021-05-17 | 엘지전자 주식회사 | 인공 지능 장치 |
CN111601163B (zh) * | 2020-04-26 | 2023-03-03 | 百度在线网络技术(北京)有限公司 | 播放控制方法、装置、电子设备及存储介质 |
US11659229B2 (en) | 2020-04-29 | 2023-05-23 | Arris Enterprises Llc | System and method for management and presentation of alternate media |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
EP3910467A1 (en) * | 2020-05-11 | 2021-11-17 | Apple Inc. | Digital assistant hardware abstraction |
KR102523917B1 (ko) * | 2020-05-11 | 2023-04-19 | 애플 인크. | 디지털 어시스턴트 하드웨어 추출 |
CN112732624A (zh) * | 2020-05-11 | 2021-04-30 | 苹果公司 | 数字助理硬件抽象 |
US11513667B2 (en) * | 2020-05-11 | 2022-11-29 | Apple Inc. | User interface for audio message |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
EP4162698A1 (en) * | 2020-06-08 | 2023-04-12 | Sonos Inc. | Control with distributed command processing |
CN111724784A (zh) * | 2020-06-28 | 2020-09-29 | 北京小米松果电子有限公司 | 设备控制方法及装置 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112165640B (zh) * | 2020-09-21 | 2023-04-14 | Vidaa美国公司 | 一种显示设备 |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11657814B2 (en) * | 2020-10-08 | 2023-05-23 | Harman International Industries, Incorporated | Techniques for dynamic auditory phrase completion |
CN112507708B (zh) * | 2020-12-16 | 2023-09-15 | 青岛海尔科技有限公司 | 信息录入方法、装置、存储介质及电子装置 |
US11431891B2 (en) | 2021-01-31 | 2022-08-30 | Apple Inc. | User interfaces for wide angle video conference |
CN113205807B (zh) * | 2021-04-06 | 2023-08-29 | 珠海格力电器股份有限公司 | 一种语音设备的控制方法、装置、存储介质及语音设备 |
US11449188B1 (en) | 2021-05-15 | 2022-09-20 | Apple Inc. | Shared-content session user interfaces |
US11907605B2 (en) | 2021-05-15 | 2024-02-20 | Apple Inc. | Shared-content session user interfaces |
US11893214B2 (en) | 2021-05-15 | 2024-02-06 | Apple Inc. | Real-time communication user interface |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
US11960615B2 (en) | 2021-06-06 | 2024-04-16 | Apple Inc. | Methods and user interfaces for voice-based user profile management |
US11575758B1 (en) * | 2021-09-13 | 2023-02-07 | Amazon Technologies, Inc. | Session-based device grouping |
US11770600B2 (en) | 2021-09-24 | 2023-09-26 | Apple Inc. | Wide angle video conference |
WO2023056258A1 (en) | 2021-09-30 | 2023-04-06 | Sonos, Inc. | Conflict management for wake-word detection processes |
US11977816B1 (en) * | 2022-08-25 | 2024-05-07 | Amazon Technologies, Inc. | Time-based context for voice user interface |
US11886773B1 (en) | 2023-03-28 | 2024-01-30 | Volley Inc. | Systems and methods for a voice-controlled interactive application |
Family Cites Families (1219)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US999715A (en) | 1911-05-31 | 1911-08-01 | Hans Gundersen | Flying-machine. |
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPS63301998A (ja) | 1987-06-02 | 1988-12-08 | 日本電気株式会社 | 音声認識応答装置 |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
EP0548836B1 (en) | 1991-12-20 | 1997-06-11 | Matsushita Electric Industrial Co., Ltd. | A bass reproduction speaker apparatus |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
JPH0883091A (ja) | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5857172A (en) | 1995-07-31 | 1999-01-05 | Microsoft Corporation | Activation control of a speech recognizer through use of a pointing device |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
FR2739736B1 (fr) | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
EP1125277A4 (en) | 1998-10-02 | 2002-02-20 | Ibm | STRUCTURAL SKELETON FOR EFFICIENT VOICE NAVIGATION BY GENERICALLY HIERARCHICAL OBJECTS |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US6243676B1 (en) | 1998-12-23 | 2001-06-05 | Openwave Systems Inc. | Searching and retrieving multimedia information |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
US6219645B1 (en) | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
DE69935147T2 (de) | 1999-12-03 | 2007-10-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Verfahren zur gleichzeitigen Wiedergabe von Audio Signalen in zwei Telefonen |
KR20010054622A (ko) | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
WO2001053963A1 (en) | 2000-01-24 | 2001-07-26 | Zapmedia, Inc. | System and method for the distribution and sharing of media assets between media players devices |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
ATE372625T1 (de) | 2000-02-18 | 2007-09-15 | Bridgeco Ag | Mehrtor-brücke zur lieferung von netzwerkverbindungen |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU4219601A (en) | 2000-03-31 | 2001-10-15 | Classwave Wireless Inc. | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
US8165867B1 (en) | 2000-09-15 | 2012-04-24 | Fish Robert D | Methods for translating a device command |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020054685A1 (en) | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US20020072816A1 (en) | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6885989B2 (en) | 2001-04-02 | 2005-04-26 | International Business Machines Corporation | Method and system for collaborative speech recognition for small-area network |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
AU2002361767A1 (en) | 2001-12-17 | 2003-07-09 | Becomm Corporation | Method and system for synchronization of content rendering |
DE10163213A1 (de) | 2001-12-21 | 2003-07-10 | Philips Intellectual Property | Verfahren zum Betrieb eines Spracherkennungssystems |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
AU2003216319A1 (en) | 2002-02-20 | 2003-09-09 | Meshnetworks, Inc. | A system and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
WO2003093950A2 (en) | 2002-05-06 | 2003-11-13 | David Goldberg | Localized audio networks and associated digital accessories |
KR100966415B1 (ko) | 2002-05-09 | 2010-06-28 | 넷스트림스 엘엘씨 | 오디오 네트워크 분산 시스템 |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
DE60210177T2 (de) | 2002-08-14 | 2006-12-28 | Sony Deutschland Gmbh | Bandbreitenorientierte Neukonfigurierung von drahtlosen Ad-Hoc-Netzen |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
JP2004163590A (ja) | 2002-11-12 | 2004-06-10 | Denso Corp | 再生装置及びプログラム |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
CN100392723C (zh) | 2002-12-11 | 2008-06-04 | 索夫塔马克斯公司 | 在稳定性约束下使用独立分量分析的语音处理系统和方法 |
US7076428B2 (en) * | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
KR100668297B1 (ko) | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US6823050B2 (en) | 2003-02-13 | 2004-11-23 | International Business Machines Corporation | System and method for interfacing with a personal telephony recorder |
WO2004079929A2 (en) | 2003-03-03 | 2004-09-16 | America Online, Inc. | Source audio identifiers for digital communications |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
JP2004354721A (ja) | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
US8234395B2 (en) | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US9207905B2 (en) | 2003-07-28 | 2015-12-08 | Sonos, Inc. | Method and apparatus for providing synchrony group status information |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
KR20060093722A (ko) | 2003-10-24 | 2006-08-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 적응성 사운드 재생 |
DE602004021716D1 (de) | 2003-11-12 | 2009-08-06 | Honda Motor Co Ltd | Spracherkennungssystem |
US7705565B2 (en) | 2003-12-31 | 2010-04-27 | Motorola, Inc. | Method and system for wireless charging |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
EP1844392B1 (en) | 2005-01-21 | 2012-07-04 | Certicom Corp. | Elliptic curve random number generation |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
US8594320B2 (en) | 2005-04-19 | 2013-11-26 | (Epfl) Ecole Polytechnique Federale De Lausanne | Hybrid echo and noise suppression method and device in a multi-channel audio signal |
EP1715669A1 (en) | 2005-04-19 | 2006-10-25 | Ecole Polytechnique Federale De Lausanne (Epfl) | A method for removing echo in an audio signal |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US7720684B2 (en) | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
EP1912468B1 (en) | 2005-07-29 | 2013-08-14 | Panasonic Corporation | Loudspeaker device |
CN1909625A (zh) | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
KR20080043358A (ko) | 2005-08-19 | 2008-05-16 | 그레이스노트 아이엔씨 | 재생 디바이스의 동작을 제어하는 방법 및 시스템 |
US20070060054A1 (en) | 2005-09-15 | 2007-03-15 | Sony Ericsson Mobile Communications Ab | Wireless home communication system method and apparatus |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
WO2007034392A2 (en) | 2005-09-21 | 2007-03-29 | Koninklijke Philips Electronics N.V. | Ultrasound imaging system with voice activated controls using remotely positioned microphone |
EP1952619B1 (en) | 2005-11-07 | 2018-02-28 | Telecom Italia S.p.A. | Method for managing a conference call in a telephone network |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
US8135143B2 (en) | 2005-11-15 | 2012-03-13 | Yamaha Corporation | Remote conference apparatus and sound emitting/collecting apparatus |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
JP4422692B2 (ja) | 2006-03-03 | 2010-02-24 | 日本電信電話株式会社 | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
EP1999993A4 (en) | 2006-03-06 | 2011-03-30 | Gen Innovations Inc | POSITIONALLY SEQUENCED SPEAKER SYSTEM |
CN101449538A (zh) | 2006-04-04 | 2009-06-03 | 约翰逊控制技术公司 | 媒体文件的文本-语法改进 |
ATE423433T1 (de) | 2006-04-18 | 2009-03-15 | Harman Becker Automotive Sys | System und verfahren zur mehrkanal- echokompensation |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
ATE436151T1 (de) | 2006-05-10 | 2009-07-15 | Harman Becker Automotive Sys | Kompensation von mehrkanalechos durch dekorrelation |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US8041057B2 (en) | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP4984683B2 (ja) | 2006-06-29 | 2012-07-25 | ヤマハ株式会社 | 放収音装置 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US8189765B2 (en) | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
EP2050304B1 (en) | 2006-08-10 | 2018-10-24 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
EP2080272B1 (en) | 2006-10-17 | 2019-08-21 | D&M Holdings, Inc. | Unification of multimedia devices |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US8391501B2 (en) | 2006-12-13 | 2013-03-05 | Motorola Mobility Llc | Method and apparatus for mixing priority and non-priority audio signals |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
US7973857B2 (en) | 2006-12-27 | 2011-07-05 | Nokia Corporation | Teleconference group formation using context information |
US20090013255A1 (en) | 2006-12-30 | 2009-01-08 | Matthew John Yuschik | Method and System for Supporting Graphical User Interfaces |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
WO2008096414A1 (ja) | 2007-02-06 | 2008-08-14 | Pioneer Corporation | コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体 |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
JP4728982B2 (ja) | 2007-03-05 | 2011-07-20 | 株式会社東芝 | 利用者と対話する装置、方法およびプログラム |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8996379B2 (en) | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
BRPI0810285A2 (pt) | 2007-05-18 | 2014-12-30 | Shorthand Mobile Inc | "sistema e processo para comunicações aperfeiçoadas via sistemas de comunicação de pequena taxa de dados" |
US20080291916A1 (en) | 2007-05-22 | 2008-11-27 | Bo Xiong | Systems and methods for dynamic quality of service |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
US8323201B2 (en) | 2007-08-06 | 2012-12-04 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US20090046866A1 (en) | 2007-08-15 | 2009-02-19 | Fortemedia, Inc. | Apparatus capable of performing acoustic echo cancellation and a method thereof |
US8073125B2 (en) | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US7844724B2 (en) | 2007-10-24 | 2010-11-30 | Social Communications Company | Automated real-time data stream switching in a shared virtual area communication environment |
US8639214B1 (en) | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
CN103648071B (zh) | 2007-11-20 | 2018-11-02 | 松下知识产权经营株式会社 | 扬声器、视频设备、以及便携式信息处理装置 |
US9247346B2 (en) | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US20090153289A1 (en) | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
US8423893B2 (en) | 2008-01-07 | 2013-04-16 | Altec Lansing Australia Pty Limited | User interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
DE102008039330A1 (de) | 2008-01-31 | 2009-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8213598B2 (en) | 2008-02-26 | 2012-07-03 | Microsoft Corporation | Harmonic distortion residual echo suppression |
US8638908B2 (en) | 2008-02-28 | 2014-01-28 | Computer Products Introductions, Corp | Contextual conversation processing in telecommunication applications |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
WO2009120301A2 (en) | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US7516068B1 (en) | 2008-04-07 | 2009-04-07 | International Business Machines Corporation | Optimized collection of audio for speech recognition |
CN101562671A (zh) | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
WO2009133719A1 (ja) | 2008-04-30 | 2009-11-05 | 日本電気株式会社 | 音響モデル学習装置および音声認識装置 |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8831948B2 (en) | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8325909B2 (en) | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8781833B2 (en) | 2008-07-17 | 2014-07-15 | Nuance Communications, Inc. | Speech recognition semantic classification training |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
US8325938B2 (en) | 2008-08-12 | 2012-12-04 | Sony Corporation | Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
EP2351021B1 (en) | 2008-11-10 | 2017-09-06 | Google, Inc. | Determining an operating mode based on the orientation of a mobile device |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
US8095368B2 (en) * | 2008-12-04 | 2012-01-10 | At&T Intellectual Property I, L.P. | System and method for voice authentication over a computer network |
JP5347472B2 (ja) | 2008-12-12 | 2013-11-20 | ヤマハ株式会社 | 遠隔制御装置および遠隔制御システム |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US8351617B2 (en) | 2009-01-13 | 2013-01-08 | Fortemedia, Inc. | Method for phase mismatch calibration for an array microphone and phase calibration module for the same |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US20130283169A1 (en) | 2012-04-24 | 2013-10-24 | Social Communications Company | Voice-based virtual area navigation |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
US8243949B2 (en) | 2009-04-14 | 2012-08-14 | Plantronics, Inc. | Network addressible loudspeaker and audio play |
CN102804747B (zh) | 2009-04-15 | 2014-04-02 | 弗兰霍菲尔运输应用研究公司 | 多通道回波对消器 |
US8483398B2 (en) | 2009-04-30 | 2013-07-09 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses |
JP5550456B2 (ja) | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US20100332236A1 (en) | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
US8478982B2 (en) | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
JP5440053B2 (ja) | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
WO2011033887A1 (ja) | 2009-09-17 | 2011-03-24 | 株式会社日立メディコ | 超音波探触子及び超音波撮像装置 |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
KR101301535B1 (ko) | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US20110145581A1 (en) | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
NO332437B1 (no) | 2010-01-18 | 2012-09-17 | Cisco Systems Int Sarl | Apparat og fremgangsmate for a supprimere et akustisk ekko |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
JP5572445B2 (ja) | 2010-04-30 | 2014-08-13 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
EP3418917B1 (en) | 2010-05-04 | 2022-08-17 | Apple Inc. | Methods and systems for synchronizing media |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
EP2986034B1 (en) | 2010-05-06 | 2017-05-31 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US20110289506A1 (en) | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) * | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US9349368B1 (en) | 2010-08-05 | 2016-05-24 | Google Inc. | Generating an audio notification based on detection of a triggering event |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US9237383B2 (en) | 2010-08-27 | 2016-01-12 | Intel Corporation | Peer to peer streaming of DVR buffered program data |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
CN103038816B (zh) | 2010-10-01 | 2015-02-25 | 三菱电机株式会社 | 声音识别装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
JP6363324B2 (ja) | 2010-10-08 | 2018-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
US20120099594A1 (en) | 2010-10-22 | 2012-04-26 | Phorus Llc | Media distribution architecture |
EP2444967A1 (en) | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
EP2456199A3 (en) | 2010-11-22 | 2014-07-16 | DDS Newco Inc. | Method and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
US9508358B2 (en) | 2010-12-15 | 2016-11-29 | Koninklijke Philips N.V. | Noise reduction system with remote noise detector |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
KR20120100514A (ko) | 2011-03-04 | 2012-09-12 | 삼성전자주식회사 | 디바이스 그룹핑 방법 및 이를 적용한 서버 |
US8804977B2 (en) | 2011-03-18 | 2014-08-12 | Dolby Laboratories Licensing Corporation | Nonlinear reference signal processing for echo suppression |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
JPWO2012127831A1 (ja) * | 2011-03-22 | 2014-07-24 | パナソニック株式会社 | 光情報装置及びそのギャップ制御方法 |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
KR20120128542A (ko) | 2011-05-11 | 2012-11-27 | 삼성전자주식회사 | 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치 |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
US8320577B1 (en) | 2011-05-20 | 2012-11-27 | Google Inc. | Method and apparatus for multi-channel audio processing using single-channel components |
US9893902B2 (en) | 2011-05-31 | 2018-02-13 | Google Llc | Muting participants in a communication session |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9264553B2 (en) | 2011-06-11 | 2016-02-16 | Clearone Communications, Inc. | Methods and apparatuses for echo cancelation with beamforming microphone arrays |
US9762967B2 (en) | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US20130018659A1 (en) | 2011-07-12 | 2013-01-17 | Google Inc. | Systems and Methods for Speech Command Processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
EP2555598A1 (en) | 2011-08-05 | 2013-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and device for generating optical radiation by means of electrically operated pulsed discharges |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
US20130039527A1 (en) | 2011-08-08 | 2013-02-14 | Bang & Olufsen A/S | Modular, configurable speaker and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US8750677B2 (en) | 2011-08-23 | 2014-06-10 | Microsoft Corporation | Method for transferring media playback from a different device |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8996381B2 (en) | 2011-09-27 | 2015-03-31 | Sensory, Incorporated | Background speech recognition assistant |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9729631B2 (en) | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US8971546B2 (en) | 2011-10-14 | 2015-03-03 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to control audio playback devices |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
GB201118784D0 (en) | 2011-10-31 | 2011-12-14 | Omnifone Ltd | Djml |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
US20150237406A1 (en) * | 2011-12-13 | 2015-08-20 | Claudio J. Ochoa | Channel navigation in connected media devices through keyword selection |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
WO2013115748A1 (en) | 2012-01-30 | 2013-08-08 | Echostar Ukraine, L.L.C. | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
EP2632141B1 (en) | 2012-02-22 | 2014-10-15 | Dialog Semiconductor B.V. | Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9198204B2 (en) | 2012-04-11 | 2015-11-24 | Google Inc. | Apparatus and method for seamless commissioning of wireless devices |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
CN104395957B (zh) | 2012-04-30 | 2018-02-13 | 创新科技有限公司 | 一种通用可重构回声消除系统 |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US20130294611A1 (en) | 2012-05-04 | 2013-11-07 | Sony Computer Entertainment Inc. | Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
CA2874899C (en) | 2012-06-01 | 2017-07-11 | Blackberry Limited | Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems |
US9997069B2 (en) | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9183845B1 (en) | 2012-06-12 | 2015-11-10 | Amazon Technologies, Inc. | Adjusting audio signals based on a specific frequency range associated with environmental noise characteristics |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9031255B2 (en) | 2012-06-15 | 2015-05-12 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to provide low-latency audio |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9106192B2 (en) * | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
KR101972955B1 (ko) * | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
DE112013003843B4 (de) | 2012-08-03 | 2022-03-31 | Semiconductor Energy Laboratory Co., Ltd. | Lichtemittierendes Element, lichtemittierende Vorrichtung, elektronische Vorrichtung und Beleuchtungsvorrichtung |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
EP2701145B1 (en) | 2012-08-24 | 2016-10-12 | Retune DSP ApS | Noise estimation for use with noise reduction and echo cancellation in personal communication |
US9532153B2 (en) | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US8965033B2 (en) | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
US9088336B2 (en) | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US8725125B2 (en) | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
EP2759147A1 (en) | 2012-10-02 | 2014-07-30 | MH Acoustics, LLC | Earphones having configurable microphone arrays |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
CN102902253B (zh) | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制系统 |
US20140108010A1 (en) | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
ES2886325T3 (es) | 2012-10-15 | 2021-12-17 | Msi Dfat Llc | Pruebas acústicas de campo directo en un recinto semirreverberante |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
WO2014064531A1 (en) | 2012-10-22 | 2014-05-01 | Spotify Ab | Systems and methods for pre-fetching media content |
US20150228274A1 (en) | 2012-10-26 | 2015-08-13 | Nokia Technologies Oy | Multi-Device Speech Recognition |
KR20140054643A (ko) * | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381001B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US8761349B2 (en) | 2012-10-31 | 2014-06-24 | Citrix Systems, Inc. | Systems and methods of monitoring performance of acoustic echo cancellation |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
CN102999161B (zh) | 2012-11-13 | 2016-03-02 | 科大讯飞股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US9070367B1 (en) | 2012-11-26 | 2015-06-30 | Amazon Technologies, Inc. | Local speech recognition of frequent utterances |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
US20140149118A1 (en) | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9124966B2 (en) | 2012-11-28 | 2015-09-01 | Qualcomm Incorporated | Image generation for collaborative sound systems |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2014088588A1 (en) | 2012-12-07 | 2014-06-12 | Empire Technology Development Llc | Personal assistant context building |
US20140161263A1 (en) | 2012-12-10 | 2014-06-12 | Microsoft Corporation | Facilitating recognition of real-time content |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9607046B2 (en) | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
KR102102246B1 (ko) | 2012-12-18 | 2020-04-22 | 삼성전자주식회사 | 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치 |
US9047857B1 (en) | 2012-12-19 | 2015-06-02 | Rawles Llc | Voice commands for transitioning between device states |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
US20150338917A1 (en) | 2012-12-26 | 2015-11-26 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
US9620115B2 (en) | 2013-01-03 | 2017-04-11 | Telenav, Inc. | Content delivery system with barge-in mechanism and method of operation thereof |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
US9318125B2 (en) | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
TWI593294B (zh) * | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9237384B2 (en) | 2013-02-14 | 2016-01-12 | Sonos, Inc. | Automatic configuration of household playback devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) * | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
US9195432B2 (en) | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
CN105308681B (zh) | 2013-02-26 | 2019-02-12 | 皇家飞利浦有限公司 | 用于生成语音信号的方法和装置 |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音系统与相关方法 |
US10395651B2 (en) | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
JP6326071B2 (ja) | 2013-03-07 | 2018-05-16 | アップル インコーポレイテッド | 部屋およびプログラム反応型ラウドスピーカシステム |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
JP6211677B2 (ja) | 2013-03-11 | 2017-10-11 | アップル インコーポレイテッド | ラウドスピーカの指向性範囲にまたがる音色の一定性 |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
KR20140111859A (ko) | 2013-03-12 | 2014-09-22 | 삼성전자주식회사 | 콘텐트 공유 방법 및 이를 위한 디바이스 |
EP3709293A1 (en) | 2013-03-12 | 2020-09-16 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
WO2014165032A1 (en) | 2013-03-12 | 2014-10-09 | Aawtend, Inc. | Integrated sensor-array processor |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9060052B2 (en) | 2013-03-13 | 2015-06-16 | Accusonus S.A. | Single channel, binaural and multi-channel dereverberation |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
JP6084750B2 (ja) | 2013-03-14 | 2017-02-22 | アップル インコーポレイテッド | スピーカー及び携帯リスニング装置を用いた室内の適応等化 |
JP6013951B2 (ja) | 2013-03-14 | 2016-10-25 | 本田技研工業株式会社 | 環境音検索装置、環境音検索方法 |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
US9854081B2 (en) | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
US9201865B2 (en) * | 2013-03-15 | 2015-12-01 | Bao Tran | Automated assistance for user request that determines semantics by domain, task, and parameter |
US20140278933A1 (en) | 2013-03-15 | 2014-09-18 | F. Gavin McMillan | Methods and apparatus to measure audience engagement with media |
EP3036657A4 (en) | 2013-03-15 | 2017-06-21 | Spotify AB | Systems, methods, and computer readable medium for generating playlists |
WO2014149050A1 (en) | 2013-03-21 | 2014-09-25 | Nuance Communications, Inc. | System and method for identifying suboptimal microphone performance |
KR102173936B1 (ko) | 2013-03-26 | 2020-11-04 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기, 및 조명 장치 |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
WO2014161091A1 (en) | 2013-04-04 | 2014-10-09 | Rand James S | Unified communications system and method |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
WO2014172299A1 (en) | 2013-04-15 | 2014-10-23 | Chacha Search, Inc. | Method and system of increasing user interaction |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
US9390716B2 (en) | 2013-04-19 | 2016-07-12 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
US9936290B2 (en) | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
CN105122353B (zh) | 2013-05-20 | 2019-07-09 | 英特尔公司 | 用于语音识别的计算装置和用于计算装置上的语音识别的方法 |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
US20140358535A1 (en) | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
US20140365225A1 (en) | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9654073B2 (en) | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
TWI545979B (zh) | 2013-06-09 | 2016-08-11 | 蘋果公司 | 藍芽警報通知服務 |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US20140368737A1 (en) | 2013-06-17 | 2014-12-18 | Spotify Ab | System and method for playing media during navigation between media streams |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
CN105340011B (zh) | 2013-06-28 | 2020-08-18 | 哈曼国际工业有限公司 | 链接设备的无线控制 |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
CN110096253B (zh) | 2013-07-11 | 2022-08-30 | 英特尔公司 | 利用相同的音频输入的设备唤醒和说话者验证 |
DE102014109122A1 (de) | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
WO2015009748A1 (en) | 2013-07-15 | 2015-01-22 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9445196B2 (en) | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
US9772994B2 (en) | 2013-07-25 | 2017-09-26 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
US9431014B2 (en) | 2013-07-25 | 2016-08-30 | Haier Us Appliance Solutions, Inc. | Intelligent placement of appliance response to voice command |
US10186262B2 (en) | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
WO2015013835A1 (en) | 2013-07-31 | 2015-02-05 | Merck Sharp & Dohme Corp. | Piperazine derivatives as hiv protease inhibitors |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US9418651B2 (en) | 2013-07-31 | 2016-08-16 | Google Technology Holdings LLC | Method and apparatus for mitigating false accepts of trigger phrases |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
EP3036594B1 (en) | 2013-08-21 | 2021-05-26 | Ademco Inc. | Devices and methods for interacting with an hvac controller |
US9940927B2 (en) | 2013-08-23 | 2018-04-10 | Nuance Communications, Inc. | Multiple pass automatic speech recognition methods and apparatus |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
US9514747B1 (en) | 2013-08-28 | 2016-12-06 | Amazon Technologies, Inc. | Reducing speech recognition latency |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
EP2879345A4 (en) | 2013-08-30 | 2015-08-19 | Huawei Tech Co Ltd | METHOD FOR MULTIPLE DEVICES FOR THE COOPERATIVE REPRODUCTION OF MULTIMEDIA FILES AND RELATED DEVICE AND SYSTEM |
US10163435B2 (en) | 2013-09-11 | 2018-12-25 | Denso Corporation | Voice output control device, voice output control method, and recording medium |
US9672812B1 (en) | 2013-09-18 | 2017-06-06 | Amazon Technologies, Inc. | Qualifying trigger expressions in speech-based systems |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
CN103546616A (zh) | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
KR102114219B1 (ko) | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
WO2015060867A1 (en) | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
DK2869599T3 (da) | 2013-11-05 | 2020-12-14 | Oticon As | Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US10055190B2 (en) | 2013-12-16 | 2018-08-21 | Amazon Technologies, Inc. | Attribute-based audio channel arbitration |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
US9378651B2 (en) | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US10224056B1 (en) * | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
US20150221307A1 (en) | 2013-12-20 | 2015-08-06 | Saurin Shah | Transition from low power always listening mode to high power speech recognition mode |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9443516B2 (en) | 2014-01-09 | 2016-09-13 | Honeywell International Inc. | Far-field speech recognition systems and methods |
WO2015105788A1 (en) | 2014-01-10 | 2015-07-16 | Dolby Laboratories Licensing Corporation | Calibration of virtual height speakers using programmable portable devices |
US9300647B2 (en) | 2014-01-15 | 2016-03-29 | Sonos, Inc. | Software application and zones |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
US10162593B2 (en) | 2014-01-22 | 2018-12-25 | Apple Inc. | Coordinated hand-off of audio data transmission |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9652532B2 (en) | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
WO2015118426A2 (en) | 2014-02-06 | 2015-08-13 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
TWI658597B (zh) | 2014-02-07 | 2019-05-01 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
US9408008B2 (en) | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
EP3115905A4 (en) | 2014-03-03 | 2017-10-25 | Sony Corporation | Information processing apparatus, information processing method, and program |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US10514747B2 (en) | 2014-03-24 | 2019-12-24 | Silicon Laboratories Inc. | Low-power communication apparatus with wakeup detection and associated methods |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9431021B1 (en) | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9916839B1 (en) * | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
KR102146462B1 (ko) | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
US8874448B1 (en) | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
CN104978965B (zh) | 2014-04-07 | 2019-04-26 | 三星电子株式会社 | 电子装置及利用电子装置和服务器的语音识别执行方法 |
US9560437B2 (en) | 2014-04-08 | 2017-01-31 | Doppler Labs, Inc. | Time heuristic audio control |
US9510094B2 (en) | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
EP3146796B1 (en) | 2014-05-23 | 2021-10-27 | Samsung Electronics Co., Ltd. | Method and apparatus for providing notification |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
TWI777568B (zh) | 2014-05-30 | 2022-09-11 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US20150355818A1 (en) | 2014-06-04 | 2015-12-10 | Sonos, Inc. | Continuous Playback Queue |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9766702B2 (en) | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US20150373100A1 (en) | 2014-06-19 | 2015-12-24 | Pavel KRAVETS | Context sharing between different clients |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
JP2016009193A (ja) * | 2014-06-23 | 2016-01-18 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | ユーザ適合音声認識 |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9335819B1 (en) | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9368105B1 (en) | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9398392B2 (en) | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9779307B2 (en) | 2014-07-07 | 2017-10-03 | Google Inc. | Method and system for non-causal zone search in video monitoring |
US11330100B2 (en) | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US9467737B2 (en) | 2014-07-14 | 2016-10-11 | Sonos, Inc. | Zone group control |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9671997B2 (en) | 2014-07-23 | 2017-06-06 | Sonos, Inc. | Zone grouping |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) * | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
JP6118838B2 (ja) | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
KR20160026317A (ko) | 2014-08-29 | 2016-03-09 | 삼성전자주식회사 | 음성 녹음 방법 및 장치 |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9354687B2 (en) | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
JP6624368B2 (ja) | 2014-09-30 | 2019-12-25 | パナソニックIpマネジメント株式会社 | 接客モニタリングシステム及び接客モニタリング方法 |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
KR102342623B1 (ko) * | 2014-10-01 | 2021-12-22 | 엑스브레인, 인크. | 음성 및 연결 플랫폼 |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
KR102287943B1 (ko) | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9576575B2 (en) * | 2014-10-27 | 2017-02-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Providing voice recognition shortcuts based on user verbal input |
US9560409B2 (en) | 2014-10-30 | 2017-01-31 | Verizon Patent And Licensing Inc. | Media service personalization systems and methods |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10368121B2 (en) | 2014-11-07 | 2019-07-30 | Roku, Inc. | System and method for collecting data |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
JP2016095383A (ja) * | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
WO2016082046A1 (en) | 2014-11-28 | 2016-06-02 | Audera Acoustics Inc. | High displacement acoustic transducer systems |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
CN111427534B (zh) | 2014-12-11 | 2023-07-25 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) * | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN104635539A (zh) * | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其系统 |
WO2016112113A1 (en) | 2015-01-07 | 2016-07-14 | Knowles Electronics, Llc | Utilizing digital microphones for low power keyword detection and noise suppression |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
KR102351366B1 (ko) | 2015-01-26 | 2022-01-14 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN104572009B (zh) | 2015-01-28 | 2018-01-09 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
CN104735589B (zh) * | 2015-01-30 | 2018-01-23 | 广东欧珀移动通信有限公司 | 一种基于gps的智能音箱分组的音量调节系统和方法 |
US9633661B1 (en) | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
EP3264258A4 (en) | 2015-02-27 | 2018-08-15 | Sony Corporation | Information processing device, information processing method, and program |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
US9678707B2 (en) | 2015-04-10 | 2017-06-13 | Sonos, Inc. | Identification of audio content facilitated by playback device |
US10198242B2 (en) | 2015-04-14 | 2019-02-05 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
CN104853405B (zh) | 2015-05-12 | 2018-11-30 | 浙江生辉照明有限公司 | 智能联网方法及智能设备 |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
US9753922B2 (en) | 2015-05-19 | 2017-09-05 | Researchgate Gmbh | Enhanced online user-interaction tracking |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
TWI757234B (zh) | 2015-05-21 | 2022-03-11 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
WO2016185321A1 (en) | 2015-05-21 | 2016-11-24 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, display device, electronic device, and lighting device |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
JP2016218852A (ja) * | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US9584935B2 (en) | 2015-05-29 | 2017-02-28 | Sound United, Llc. | Multi-zone media system and method for providing multi-zone media |
US10657949B2 (en) | 2015-05-29 | 2020-05-19 | Sound United, LLC | System and method for integrating a home media system and other home systems |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
US10249205B2 (en) | 2015-06-08 | 2019-04-02 | Novel Effect, Inc. | System and method for integrating special effects with a text source |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
CN107710441B (zh) | 2015-06-17 | 2020-10-16 | 株式会社半导体能源研究所 | 铱配合物、发光元件、显示装置、电子设备以及照明装置 |
US20160373909A1 (en) | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
JP6739907B2 (ja) | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US10025447B1 (en) | 2015-06-19 | 2018-07-17 | Amazon Technologies, Inc. | Multi-device user interface |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
EP3317878B1 (de) | 2015-06-30 | 2020-03-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Verfahren und vorrichtung zum erzeugen einer datenbank |
KR20240035638A (ko) | 2015-07-08 | 2024-03-15 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 장치, 및 조명 장치 |
US10304440B1 (en) | 2015-07-10 | 2019-05-28 | Amazon Technologies, Inc. | Keyword spotting using multi-task configuration |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
KR102655709B1 (ko) | 2015-07-21 | 2024-04-05 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
CN107851727B (zh) | 2015-07-23 | 2020-01-21 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子装置及照明装置 |
WO2017015759A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized playback of streamed audio content by multiple internet-capable portable devices |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US9691361B2 (en) | 2015-08-03 | 2017-06-27 | International Business Machines Corporation | Adjusting presentation of content on a display |
KR102402512B1 (ko) | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制系统及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
KR102386854B1 (ko) | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2017039632A1 (en) | 2015-08-31 | 2017-03-09 | Nunntawi Dynamics Llc | Passive self-localization of microphone arrays |
US10031719B2 (en) | 2015-09-02 | 2018-07-24 | Harman International Industries, Incorporated | Audio system with multi-screen application |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
US10026399B2 (en) | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
KR20170032114A (ko) * | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 음성 인식 장치 및 그의 제어방법 |
KR20170032096A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체 |
US10706873B2 (en) | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
US10289734B2 (en) | 2015-09-18 | 2019-05-14 | Samsung Electronics Co., Ltd. | Entity-type search system |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102420450B1 (ko) | 2015-09-23 | 2022-07-14 | 삼성전자주식회사 | 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체 |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
US10186276B2 (en) | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
CN105162886B (zh) | 2015-09-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种声音控制方法及装置 |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US10334306B2 (en) | 2015-09-28 | 2019-06-25 | Google Llc | Time-synchronized, multizone medial streaming |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US10241754B1 (en) | 2015-09-29 | 2019-03-26 | Amazon Technologies, Inc. | Systems and methods for providing supplemental information with a response to a command |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
CN111354874B (zh) | 2015-09-30 | 2023-07-04 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备及照明装置 |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
US9754580B2 (en) | 2015-10-12 | 2017-09-05 | Technologies For Voice Interface | System and method for extracting and using prosody features |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
CN107925818B (zh) | 2015-10-15 | 2020-10-16 | 华为技术有限公司 | 用于声音处理节点装置的声音处理节点 |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
JP6463710B2 (ja) | 2015-10-16 | 2019-02-06 | グーグル エルエルシー | ホットワード認識 |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105427861B (zh) | 2015-11-03 | 2019-02-15 | 胡旻波 | 智能家居协同麦克风语音控制的系统及其控制方法 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US20170140750A1 (en) | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
CN105472191B (zh) | 2015-11-18 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
DE112015007147T5 (de) | 2015-11-25 | 2018-08-09 | Mitsubishi Electric Corporation | Sprachdialogvorrichtung und Sprachdialogverfahren |
US10040423B2 (en) | 2015-11-27 | 2018-08-07 | Bragi GmbH | Vehicle with wearable for identifying one or more vehicle occupants |
US9484030B1 (en) | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9699597B2 (en) | 2015-12-07 | 2017-07-04 | Google Inc. | Wireless signal forwarding |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
CN105679318A (zh) | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示系统和空调 |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
CN105632486B (zh) | 2015-12-23 | 2019-12-17 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US9992642B1 (en) | 2015-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated messaging |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
CN105741838B (zh) | 2016-01-20 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN105700364A (zh) * | 2016-01-20 | 2016-06-22 | 宇龙计算机通信科技(深圳)有限公司 | 一种智能家居控制方法及可穿戴设备 |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
KR20170091913A (ko) | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
WO2017138934A1 (en) | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9858927B2 (en) | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US9898250B1 (en) | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9826306B2 (en) | 2016-02-22 | 2017-11-21 | Sonos, Inc. | Default playback device designation |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) * | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US10133612B2 (en) * | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US10332508B1 (en) | 2016-03-31 | 2019-06-25 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
US9952827B2 (en) | 2016-04-13 | 2018-04-24 | Comcast Cable Communications, Llc | Dynamic adjustment of equalization settings of audio components via a sound device profile |
JP6686226B2 (ja) | 2016-04-18 | 2020-04-22 | グーグル エルエルシー | 適切なエージェントの自動化アシスタント呼び出し |
US10318236B1 (en) | 2016-05-05 | 2019-06-11 | Amazon Technologies, Inc. | Refining media playback |
US10447748B2 (en) | 2016-05-12 | 2019-10-15 | Apple Inc. | Sharing media information between applications on client devices |
US20170329397A1 (en) | 2016-05-12 | 2017-11-16 | Rovi Guides, Inc. | Systems and methods for navigating a media guidance application using gaze control |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
WO2017197312A2 (en) | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing speech from distributed microphones |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10079027B2 (en) * | 2016-06-03 | 2018-09-18 | Nxp B.V. | Sound signal detector |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
DK179034B1 (en) | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
US20170364371A1 (en) | 2016-06-15 | 2017-12-21 | Microsoft Technology Licensing, Llc | Context-Dependent Digital Action-Assistance Tool |
ES2806204T3 (es) | 2016-06-15 | 2021-02-16 | Cerence Operating Co | Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
KR20170142001A (ko) | 2016-06-16 | 2017-12-27 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9749738B1 (en) | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
US9875740B1 (en) | 2016-06-20 | 2018-01-23 | A9.Com, Inc. | Using voice information to influence importance of search result categories |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US10091545B1 (en) | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
KR102471499B1 (ko) | 2016-07-05 | 2022-11-28 | 삼성전자주식회사 | 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
WO2018013564A1 (en) | 2016-07-12 | 2018-01-18 | Bose Corporation | Combining gesture and voice user interfaces |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9979680B2 (en) | 2016-07-21 | 2018-05-22 | Fujitsu Limited | Smart notification scheduling and modality selection |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
CN106027806A (zh) * | 2016-07-25 | 2016-10-12 | 乐视控股(北京)有限公司 | 智能家居设备的控制方法及移动终端 |
US20180033429A1 (en) * | 2016-07-26 | 2018-02-01 | Ford Global Technologies, Llc | Extendable vehicle system |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10026403B2 (en) | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10326869B2 (en) | 2016-08-19 | 2019-06-18 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
CN107767863B (zh) | 2016-08-22 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
US20180061396A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10360910B2 (en) | 2016-08-29 | 2019-07-23 | Garmin Switzerland Gmbh | Automatic speech recognition (ASR) utilizing GPS and sensor data |
US10461953B2 (en) * | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
CN109891434B (zh) | 2016-09-06 | 2020-10-30 | 渊慧科技有限公司 | 使用神经网络生成音频 |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9959861B2 (en) | 2016-09-30 | 2018-05-01 | Robert Bosch Gmbh | System and method for speech recognition |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10283138B2 (en) * | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
WO2018067350A1 (en) | 2016-10-03 | 2018-04-12 | Google Llc. | Processing voice commands based on device topology |
WO2018067402A1 (en) | 2016-10-03 | 2018-04-12 | Google Inc. | Selection of computational agent for task performance |
CN107919116B (zh) | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
JP6616048B1 (ja) | 2016-11-07 | 2019-12-04 | グーグル エルエルシー | 記録されたメディアホットワードトリガ抑制 |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
US10382806B2 (en) | 2016-11-14 | 2019-08-13 | DISH Technologies L.L.C. | Apparatus, systems and methods for controlling presentation of content using a multi-media table |
US10170110B2 (en) | 2016-11-17 | 2019-01-01 | Robert Bosch Gmbh | System and method for ranking of hybrid speech recognition results with neural networks |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10079015B1 (en) | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10134396B2 (en) | 2016-12-07 | 2018-11-20 | Google Llc | Preventing of audio attacks |
US10255032B2 (en) | 2016-12-13 | 2019-04-09 | EVA Automation, Inc. | Wireless coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) * | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制系统及控制方法 |
US10339957B1 (en) | 2016-12-20 | 2019-07-02 | Amazon Technologies, Inc. | Ending communications session based on presence data |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
DE112017006486T5 (de) | 2016-12-23 | 2019-09-12 | Synaptics Incorporated | Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen |
CN106910500B (zh) | 2016-12-23 | 2020-04-17 | 北京小鸟听听科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
US10546578B2 (en) | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10580405B1 (en) | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
US10593328B1 (en) | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
US10186266B1 (en) | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10831366B2 (en) | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
US10224031B2 (en) | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
KR102412202B1 (ko) | 2017-01-03 | 2022-06-27 | 삼성전자주식회사 | 냉장고 및 이의 정보 표시 방법 |
US10248613B2 (en) | 2017-01-10 | 2019-04-02 | Qualcomm Incorporated | Data bus activation in an electronic device |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR20180085931A (ko) | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR20180090586A (ko) | 2017-02-03 | 2018-08-13 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
CA3155434A1 (en) | 2017-02-07 | 2018-08-16 | Lutron Technology Company Llc | Audio-based load control system |
US10762891B2 (en) | 2017-02-10 | 2020-09-01 | Synaptics Incorporated | Binary and multi-class classification systems and methods using connectionist temporal classification |
CN108446281B (zh) | 2017-02-13 | 2021-03-12 | 北京嘀嘀无限科技发展有限公司 | 确定用户亲密度的方法、装置及存储介质 |
US20180293221A1 (en) | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US10431217B2 (en) * | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
CN106921560B (zh) | 2017-02-28 | 2020-06-02 | 北京小米移动软件有限公司 | 语音通信方法、装置及系统 |
US10706843B1 (en) | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10089981B1 (en) | 2017-03-09 | 2018-10-02 | Amazon Technologies, Inc. | Messaging account disambiguation |
US10540961B2 (en) | 2017-03-13 | 2020-01-21 | Baidu Usa Llc | Convolutional recurrent neural networks for small-footprint keyword spotting |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10600406B1 (en) | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
JP6791356B2 (ja) | 2017-03-24 | 2020-11-25 | ヤマハ株式会社 | 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10643609B1 (en) | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
US10825471B2 (en) | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US10748531B2 (en) | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
CN107122158A (zh) | 2017-04-14 | 2017-09-01 | 北京小米移动软件有限公司 | 播放信息提示音频的方法及装置、电子设备 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102392297B1 (ko) | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10311870B2 (en) | 2017-05-10 | 2019-06-04 | Ecobee Inc. | Computerized device with voice command input capability |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10531196B2 (en) | 2017-06-02 | 2020-01-07 | Apple Inc. | Spatially ducking audio produced through a beamforming loudspeaker array |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10403299B2 (en) | 2017-06-02 | 2019-09-03 | Apple Inc. | Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10410635B2 (en) | 2017-06-09 | 2019-09-10 | Soundhound, Inc. | Dual mode speech recognition |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US10028069B1 (en) | 2017-06-22 | 2018-07-17 | Sonos, Inc. | Immersive audio in a media playback system |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US11189273B2 (en) | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
US11264019B2 (en) | 2017-06-30 | 2022-03-01 | Google Llc | Methods, systems, and media for voice-based call operations |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10304475B1 (en) | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10553235B2 (en) | 2017-08-28 | 2020-02-04 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US20190066710A1 (en) | 2017-08-28 | 2019-02-28 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10515625B1 (en) | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US11361763B1 (en) | 2017-09-01 | 2022-06-14 | Amazon Technologies, Inc. | Detecting system-directed speech |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
US10847149B1 (en) | 2017-09-01 | 2020-11-24 | Amazon Technologies, Inc. | Speech-based attention span for voice user interface |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
KR102338376B1 (ko) | 2017-09-13 | 2021-12-13 | 삼성전자주식회사 | 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법 |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
US10586534B1 (en) | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
KR102421255B1 (ko) | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR102543693B1 (ko) | 2017-10-17 | 2023-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
CN107808670B (zh) | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107832837B (zh) | 2017-11-28 | 2021-09-28 | 南京大学 | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10546593B2 (en) | 2017-12-04 | 2020-01-28 | Apple Inc. | Deep learning driven multi-channel filtering for speech enhancement |
US10445365B2 (en) | 2017-12-04 | 2019-10-15 | Amazon Technologies, Inc. | Streaming radio with personalized content integration |
US10777189B1 (en) | 2017-12-05 | 2020-09-15 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10847137B1 (en) | 2017-12-12 | 2020-11-24 | Amazon Technologies, Inc. | Trigger word detection using neural network waveform processing |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10663313B2 (en) | 2017-12-15 | 2020-05-26 | Google Llc | Providing traffic warnings to a user based on return journey |
US10540971B2 (en) | 2017-12-15 | 2020-01-21 | Blue Jeans Network, Inc. | System and methods for in-meeting group assistance using a virtual assistant |
US11409816B2 (en) | 2017-12-19 | 2022-08-09 | Motorola Solutions, Inc. | Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information |
DE112018002857T5 (de) | 2017-12-26 | 2020-02-27 | Robert Bosch Gmbh | Sprecheridentifikation mit ultrakurzen Sprachsegmenten für Fern- und Nahfeld-Sprachunterstützungsanwendungen |
US10504507B2 (en) | 2017-12-28 | 2019-12-10 | Syntiant | Always-on keyword detector |
US10614811B2 (en) | 2017-12-29 | 2020-04-07 | Intel Corporation | Hierarchical speech recognition resolution |
WO2019128550A1 (en) | 2017-12-31 | 2019-07-04 | Midea Group Co., Ltd. | Method and system for controlling home assistant devices |
WO2019128541A1 (en) | 2017-12-31 | 2019-07-04 | Midea Group Co., Ltd. | Method and system for controlling multiple home devices |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US10795332B2 (en) | 2018-01-16 | 2020-10-06 | Resilience Magnum IP, LLC | Facilitating automating home control |
CN108198548B (zh) | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其系统 |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US11024307B2 (en) | 2018-02-08 | 2021-06-01 | Computime Ltd. | Method and apparatus to provide comprehensive smart assistant services |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US11127405B1 (en) | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10491962B2 (en) | 2018-03-14 | 2019-11-26 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications |
US10749828B2 (en) | 2018-03-14 | 2020-08-18 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10685669B1 (en) | 2018-03-20 | 2020-06-16 | Amazon Technologies, Inc. | Device selection from audio data |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
CN111868824A (zh) | 2018-04-05 | 2020-10-30 | 辛纳普蒂克斯公司 | 智能设备的情境感知控制 |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10720166B2 (en) | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
CN108520741B (zh) | 2018-04-12 | 2021-05-04 | 科大讯飞股份有限公司 | 一种耳语音恢复方法、装置、设备及可读存储介质 |
US10679615B2 (en) | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
CN108538305A (zh) | 2018-04-20 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
EP3564949A1 (en) | 2018-04-23 | 2019-11-06 | Spotify AB | Activation trigger processing |
US10803864B2 (en) | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11308947B2 (en) | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
JP2019204025A (ja) | 2018-05-24 | 2019-11-28 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、及びプログラム |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10777195B2 (en) | 2018-05-31 | 2020-09-15 | International Business Machines Corporation | Wake command nullification for digital assistance and voice recognition technologies |
US20190371324A1 (en) | 2018-06-01 | 2019-12-05 | Apple Inc. | Suppression of voice response by device rendering trigger audio |
CN112272819B (zh) | 2018-06-05 | 2024-04-26 | 三星电子株式会社 | 被动唤醒用户交互设备的方法和系统 |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
NL2021308B1 (en) | 2018-07-16 | 2020-01-24 | Hazelebach & Van Der Ven Holding B V | Methods for a voice processing system |
JP7000268B2 (ja) | 2018-07-18 | 2022-01-19 | 株式会社東芝 | 情報処理装置、情報処理方法、およびプログラム |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
GB2576016B (en) | 2018-08-01 | 2021-06-23 | Arm Ip Ltd | Voice assistant devices |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
KR102225984B1 (ko) | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US20200090647A1 (en) | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10650807B2 (en) | 2018-09-18 | 2020-05-12 | Intel Corporation | Method and system of neural network keyphrase detection |
KR20200034430A (ko) | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US10861444B2 (en) | 2018-09-24 | 2020-12-08 | Rovi Guides, Inc. | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US10950249B2 (en) | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
KR102606789B1 (ko) | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
US20200110571A1 (en) | 2018-10-05 | 2020-04-09 | Sonos, Inc. | Systems and methods for media content selection |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10943599B2 (en) | 2018-10-26 | 2021-03-09 | Spotify Ab | Audio cancellation for voice recognition |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
KR102570384B1 (ko) | 2018-12-27 | 2023-08-25 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
JP2020112692A (ja) | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
US11349834B2 (en) | 2019-01-30 | 2022-05-31 | Ncr Corporation | Multi-factor secure operation authentication |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
CN109712626B (zh) | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
US10964314B2 (en) | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US10984783B2 (en) | 2019-03-27 | 2021-04-20 | Intel Corporation | Spoken keyword detection based utterance-level wake on intent system |
US20200310751A1 (en) | 2019-03-29 | 2020-10-01 | Qualcomm Incorporated | System and method of managing device sound level |
EP4184949A1 (en) | 2019-04-17 | 2023-05-24 | Oticon A/s | A hearing device comprising a transmitter |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US20200409926A1 (en) | 2019-06-28 | 2020-12-31 | Rovi Guides, Inc. | Automated contact creation based on content communications |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11159878B1 (en) | 2019-08-15 | 2021-10-26 | Amazon Technologies, Inc. | Autonomously motile device with beamforming |
JP7191793B2 (ja) | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11172328B2 (en) | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210066647A (ko) | 2019-11-28 | 2021-06-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US20220301561A1 (en) | 2019-12-10 | 2022-09-22 | Rovi Guides, Inc. | Systems and methods for local automated speech-to-text processing |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
US11445301B2 (en) | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
US11206052B1 (en) | 2020-06-18 | 2021-12-21 | HAJEN Co., Ltd | Smart speaker |
US20220050585A1 (en) | 2020-08-14 | 2022-02-17 | Apple Inc. | Audio media playback user interface |
-
2017
- 2017-09-29 US US15/721,141 patent/US10466962B2/en active Active
-
2018
- 2018-09-28 KR KR1020227021879A patent/KR102597285B1/ko active IP Right Grant
- 2018-09-28 AU AU2018338812A patent/AU2018338812A1/en not_active Abandoned
- 2018-09-28 CN CN202211314552.0A patent/CN115857747A/zh active Pending
- 2018-09-28 WO PCT/US2018/053472 patent/WO2019067930A1/en unknown
- 2018-09-28 EP EP18792656.3A patent/EP3688995B1/en active Active
- 2018-09-28 KR KR1020207011843A patent/KR102415967B1/ko active IP Right Grant
- 2018-09-28 KR KR1020237036702A patent/KR20230152813A/ko active Application Filing
- 2018-09-28 CA CA3084279A patent/CA3084279A1/en active Pending
- 2018-09-28 CN CN201880077216.4A patent/CN111418216B/zh active Active
- 2018-09-28 JP JP2020518400A patent/JP6987230B2/ja active Active
- 2018-09-28 EP EP21193616.6A patent/EP3951586A1/en active Pending
-
2019
- 2019-11-04 US US16/672,764 patent/US10606555B1/en active Active
-
2020
- 2020-03-30 US US16/834,483 patent/US11288039B2/en active Active
-
2021
- 2021-01-25 US US17/157,686 patent/US11175888B2/en active Active
- 2021-11-30 JP JP2021194522A patent/JP7346529B2/ja active Active
-
2022
- 2022-03-28 US US17/656,794 patent/US11893308B2/en active Active
-
2023
- 2023-09-06 JP JP2023144379A patent/JP2023164959A/ja active Pending
- 2023-09-27 AU AU2023237094A patent/AU2023237094A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111418216A (zh) | 2020-07-14 |
US20190102145A1 (en) | 2019-04-04 |
AU2018338812A1 (en) | 2020-04-30 |
KR102415967B1 (ko) | 2022-07-04 |
US11893308B2 (en) | 2024-02-06 |
EP3951586A1 (en) | 2022-02-09 |
CA3084279A1 (en) | 2019-04-04 |
CN111418216B (zh) | 2022-11-11 |
WO2019067930A1 (en) | 2019-04-04 |
US10466962B2 (en) | 2019-11-05 |
KR20230152813A (ko) | 2023-11-03 |
US11288039B2 (en) | 2022-03-29 |
EP3688995A1 (en) | 2020-08-05 |
EP3688995B1 (en) | 2021-09-01 |
US11175888B2 (en) | 2021-11-16 |
CN115857747A (zh) | 2023-03-28 |
US20220222039A1 (en) | 2022-07-14 |
AU2023237094A1 (en) | 2023-10-12 |
JP2020536274A (ja) | 2020-12-10 |
WO2019067930A9 (en) | 2019-09-26 |
JP6987230B2 (ja) | 2021-12-22 |
KR20200055776A (ko) | 2020-05-21 |
KR20220093280A (ko) | 2022-07-05 |
US20210141600A1 (en) | 2021-05-13 |
JP7346529B2 (ja) | 2023-09-19 |
US20200326909A1 (en) | 2020-10-15 |
KR102597285B1 (ko) | 2023-11-02 |
US10606555B1 (en) | 2020-03-31 |
JP2022037012A (ja) | 2022-03-08 |
US20200089469A1 (en) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7346529B2 (ja) | ボイスアシスタンスを備えたメディア再生システム | |
US11797263B2 (en) | Systems and methods for voice-assisted media content selection | |
US20240103804A1 (en) | Systems and methods of receiving voice input | |
US11676590B2 (en) | Home graph | |
US11696074B2 (en) | Systems and methods for associating playback devices with voice assistant services | |
US20200110571A1 (en) | Systems and methods for media content selection | |
US20240080621A1 (en) | Device designation of playback and network microphone device arrangements |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231010 |