CN115857747A - 具有语音辅助的媒体回放系统 - Google Patents
具有语音辅助的媒体回放系统 Download PDFInfo
- Publication number
- CN115857747A CN115857747A CN202211314552.0A CN202211314552A CN115857747A CN 115857747 A CN115857747 A CN 115857747A CN 202211314552 A CN202211314552 A CN 202211314552A CN 115857747 A CN115857747 A CN 115857747A
- Authority
- CN
- China
- Prior art keywords
- playback
- vas
- command
- commands
- devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims description 119
- 238000012545 processing Methods 0.000 claims description 43
- 230000015654 memory Effects 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 26
- 238000010586 diagram Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 30
- 238000004330 variable angle spinning Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 241000854291 Dianthus carthusianorum Species 0.000 description 1
- 241000238558 Eucarida Species 0.000 description 1
- 241000502522 Luscinia megarhynchos Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000021167 banquet Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/436—Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
- H04N21/43615—Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
- Software Systems (AREA)
- Selective Calling Equipment (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
Abstract
本发明涉及一种具有语音辅助的媒体回放系统。在一些实施例中,媒体回放系统被配置为(i)经由至少一个麦克风设备捕获语音输入,(ii)检测所述语音输入中是否包括一个或多个命令,(iii)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准,以及(iv)响应于所述确定,选择第一语音助手服务(VAS)和(a)放弃选择第二VAS,(b)向第一VAS发送所述语音输入,并且(c)在发送所述语音输入之后,接收对来自所述第一VAS的语音输入的响应。
Description
分案说明
本申请是申请日为2018年9月28日、申请号为201880077216.4、发明名称为“具有语音辅助的媒体回放系统”的发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2017年9月29日提交的美国专利申请No.15/721,141 的优先权,其全部内容通过引用并入本文。
技术领域
本公开涉及消费品,并且更具体地涉及针对媒体回放或其某个方面的语音控制的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置的数字音频的选项是有限的,直到2003年 SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices”的专利申请,并在2005年开始出售媒体回放系统为止。Sonos无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
发明内容
本发明涉及一种1.一种方法,包括:使(801)命令信息(590,890) 的集合被存储在媒体回放系统的网络麦克风设备的存储器(216)中,所述集合包括命令的列表和与所述命令相关联的命令标准;经由所述网络麦克风设备中的至少一个麦克风捕获语音输入;检测所述语音输入内是否包括一个或多个命令;确定所述一个或多个命令满足与所述命令信息集合内的一个或多个命令相关联的相应命令标准;以及响应于所述确定,选择第一语音助手服务VAS和放弃选择第二VAS,(ii) 向所述第一VAS发送所述语音输入,(iii)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
附图说明
参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:
图1示出了可以实践某些实施例的媒体回放系统;
图2A是示例回放设备的功能框图;
图2B是包括网络麦克风设备的示例回放设备的等距图;
图3A、3B、3C、3D和3E是示出了根据本公开各方面的示例区域和区域分组的图;
图4A是根据本公开各方面的示例控制器设备的功能框图;
图4B和图4C是根据本公开各方面的控制器接口;
图5A是根据本公开各方面的示例网络麦克风设备的功能框图;
图5B是根据本公开各方面的示例语音输入的图;
图6是根据本公开各方面的示例远程计算设备的功能框图;
图7A是根据本公开各方面的示例网络系统的示意图;
图7B是根据本公开各方面的由图7A的示例网络系统实现的示例消息流;
图8A是根据本公开各方面的用于调用语音助手服务的示例方法的流程图;
图8B是根据本公开各方面的示例命令信息集合的框图;
图9A、9B和9C是根据本公开各方面的具有示例语音输入命令和相关联信息的表格;
图10A、图10B和图10C是示出了根据本公开各方面的用于调用 VAS的示例语音输入的图;
图11A和图11B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图12A和图12B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图13A和图13B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图14A和图14B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图15A和图15B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图16A和图16B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图17A和图17B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图18A和图18B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图19A和图19B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;以及
图20A和图20B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图。
附图用于示出示例实施例的目的,但可以理解,本发明不限于附图所示的布置和手段。在附图中,相同的附图标记识别至少大致相似的元件。为了促进对任何特定元件的讨论,任何参考数字中的一个或多个最高有效位指的是首次引入该元件的附图。例如,首先参照图1 介绍和讨论元件107。
具体实施方式
I.概述
语音控制对于具有智能应用和相关设备(例如,无线照明设备、家庭自动化设备(例如,恒温器、门锁等)和音频回放设备)的“智能”家居可以是有益的。在一些实施方式中,联网的麦克风设备可以用于控制智能家居设备。网络麦克风设备通常将包括用于接收语音输入的麦克风。网络麦克风设备可以将语音输入转发到语音助手服务 (VAS)。传统VAS可以是由云服务器实现以处理语音输入的远程服务。VAS可以处理语音输入以确定该语音输入的意图。基于该响应,网络麦克风设备可以使一个或多个智能设备执行动作。例如,网络麦克风设备可以基于对来自VAS的指令的响应来指示照明设备打开/关闭。
由网络麦克风设备检测到的语音输入通常将包括一个唤醒词,其后跟包含用户请求的发声。唤醒词通常是用于“唤醒”并调用VAS来解释语音输入意图的预定词或短语。例如,在查询VAS 时,用户可能会说出唤醒词“Alexa”。其他示例包括:用于调用/>VAS的“Ok,Google”,以及用于调用/>VAS的“Hey, Siri”,或者用于由/>提供的VAS的“Hey,Sonos”。
网络麦克风设备在语音输入中侦听伴随唤醒字的用户请求或命令。在一些实例中,用户请求可以包括控制第三方设备(例如,恒温器(例如,恒温器)、照明设备(例如,PHILIPS/>照明设备)或媒体回放设备(例如,/>回放设备))的命令。例如,用户可以说出唤醒词“Alexa”,其后跟“将恒温器设置为68度”的发声,以使用/>VAS设置家庭中的温度。用户可以说出相同的唤醒词,其后跟“点亮客厅”的发声,以打开家庭客厅区域中的照明设备。用户可以类似地说出唤醒词,其后跟在家庭中的回放设备上播放特定歌曲、专辑或音乐播放列表的请求。
VAS可以采用自然语言理解(NLU)系统来处理语音输入。NLU 系统通常需要多个远程服务器,这些远程服务器被编程以检测给定语音输入的基本意图。例如,这些服务器可以维护语言词典;解析器;语法和语义规则;以及相关的处理算法来确定用户的意图。
传统VAS遇到的一个挑战是NLU处理是计算密集型的。例如,语音处理算法需要定期更新,以处理措辞、句子结构、发音和其他语音特征中的细微差别。因此,VAS提供商必须维护并不断开发处理算法,并部署越来越多的资源(例如,其他云服务器),以处理从世界各地的用户收到的无数的语音输入。
一个相关的挑战是某些智能设备的语音控制可能需要相对复杂的语音处理算法,这可能会进一步增加VAS资源的负担。例如,要打开客厅中的一组照明设备,一个用户可能更喜欢说“开启灯”,而另一个用户可能更喜欢说“打开客厅”。两个用户都有打开照明设备的相同的基本意图,但是短语(包括动词)的结构不同,更不用说后一个短语标识了客厅中的设备,而前者则没有。为了解决这些问题,VAS必须投入更多资源来破解用户意图,特别是在控制需要复杂语音处理资源和算法的智能设备时,例如,用于区分命令结构和相关语法中细微但有意义的变化的算法。
随着消费者对智能设备的需求增长,并且这些设备变得更加多样化,某些VAS提供商可能很难跟上发展。在一些情况下,VAS可能具有有限的系统资源,这削弱了VAS成功响应入站语音输入的能力。例如,在以上示例中,VAS可能具有处理语音发声“打开灯”的能力,但是可能缺乏处理语音发声“开启灯”的能力,因为该服务可能使用无法识别后者惯用语背后的意图的算法。在这种情况下,用户可能不得不用其他符合条件的信息来重述原始请求,例如,通过说“打开客厅的灯”。备选地,VAS可以通知用户其无法处理这样的请求,或者 VAS可以简单地完全忽略该请求。在任何这些情况下,用户可能会由于不良的语音控制体验而感到不满意。
在媒体回放系统(例如,多区域回放系统)的情况下,常规VAS 可能特别受限制。例如,传统VAS可能仅支持用于基本回放的语音控制,或者要求用户使用特定的并且惯用的措辞与设备进行交互,而不是自然对话。此外,传统VAS可能不支持多区域回放或用户希望控制的其他特征,例如,设备组合、多房间音量、均衡参数和/或用于给定回放场景的音频内容。控制这些功能可能需要比基本回放所需的资源明显更多的资源。
本文描述的媒体回放系统可以解决传统VAS的这些和其他限制。例如,在一些实施例中,媒体回放被配置为选择第一VAS(例如,增强VAS)而不是第二VAS(例如,传统VAS)以处理语音输入。在这种情况下,媒体回放系统可以通过选择第一VAS而不是第二VAS来干预以处理某些语音输入,例如,用于控制媒体回放系统的相对高级和其他特征的语音输入。在一个方面,相对于仅由第二VAS提供的语音控制,第一VAS可以增强语音控制。在一些实施例中,针对媒体回放系统的至少一些语音输入可能不能经由第二VAS来调用。在这些和其他实施例中,可以经由第二VAS调用至少一些语音输入,但是对于第一VAS处理某些语音输入可以是优选的。例如,第一VAS可以比第二VAS更可靠并且更准确地处理某些请求。在一些实施例中,第二 VAS可以是默认VAS,通常向其发送某些类型的语音输入。例如,在一些实施例中,传统VAS可能更适合处理涉及通用互联网查询的请求,例如,说“告诉我今天的天气”的语音输入。在相关实施例中,当调用第一VAS和第二VAS中的任一个时,用户可以使用相同的唤醒工作(例如,“Hey Samantha”)。在一个方面,可能不知道在说出语音输入时幕后正在发生一个VAS与另一个VAS的选择。在一个实施例中,唤醒工作可以是与传统VAS(例如,亚马逊的)相关联的唤醒词。
在一个实施例中,媒体回放系统可以包括被配置为捕获语音输入的网络麦克风设备。媒体回放系统被配置为(i)经由至少一个麦克风设备捕获语音输入,(ii)检测捕获的语音输入中是否包括一个或多个命令,(iii)确定该一个或多个命令满足命令信息集合中的相应命令标准,以及(iv)响应于该确定,(a)选择第一(VAS)并放弃选择第二VAS,(b)向第一VAS发送语音输入,并且(c)在发送该语音输入之后,处理来自第一VAS的对语音输入的响应。
在一些实施例中,网络麦克风设备被配置为在网络麦克风设备的本地存储器中存储命令信息集合。在一些实施例中,命令信息集合可以存储在另一个网络设备上,例如,另一个网络麦克风设备或局域网 (LAN)上的回放设备。在一些实施例中,命令信息集合可以跨LAN 上的多个网络设备和/或远程地跨多个网络设备存储。在以下所述的各种实施例中,可以在过程中使用命令信息集合来确定媒体回放系统是否应该选择第一VAS并且放弃选择第二VAS。
在一些实施例中,网络麦克风设备可以存储预定命令列表和与这些命令相关联的命令标准。这些命令可以包括例如回放、控制和区域定位命令。命令标准可以包括例如与特定命令相关联的预定关键字。语音输入中的关键字组合可以包括:例如,家庭中第一房间的名称的发声(例如,客厅)和该家庭中第二房间的名称的发声(例如,卧室)。当用户说出包括与关键字结合的特定命令(例如,播放音乐的命令) 的语音输入时,媒体回放系统选择并调用第一VAS来处理该语音输入。
在一些实施例中,可以通过训练和自适应学习算法来开发关键字。在某些实施例中,可以在处理包括关键字的语音输入时动态地确定这样的关键字。在这种情况下,关键字在处理语音输入之前不是预先确定的,但是仍然可以基于命令使第一VAS被调用。在相关实施例中,关键字可以与具有相同意图的命令的某些认知相关联。
在一些实施例中,调用第一VAS可以包括向第一VAS的一个或多个远程服务器发送语音输入。在以上示例中,第一VAS可以确定用户在第一房间和第二房间中播放的意图,并通过指示媒体回放系统在第一房间和第二房间中播放期望的音频来进行响应。第一VAS还可以指示媒体回放系统形成包括第一房间和第二房间的分组。
尽管本文描述的一些实施例可以涉及由给定行动者(例如,“用户”和/或其他实体)执行的功能,但是应当理解,该描述仅出于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。
II.示例操作环境
图1示出了可以实现本文公开的一个或多个实施例的媒体回放系统100的示例配置。如图所示的媒体回放系统100与具有若干房间和空间(例如,书房、餐厅和客厅)的示例家居环境相关联。在这些房间和空间内,媒体回放系统100包括回放设备102(单独地标识为回放设备102a-102m)、网络麦克风设备103(单独地标识为“NMD” 103a-103g)以及控制器设备104a和104b(统称为“控制器设备104”)。家居环境可以包括其他网络设备,例如,一个或多个智能照明设备108 和智能恒温器110。
媒体回放系统100的各种回放/网络麦克风和控制器设备102-104 和/或其他网络设备可以经由点对点连接和/或经由包括网络路由器 106的LAN的其他连接(其可以是有线的和/或无线的)而彼此耦接。例如,回放设备102j(指定为“左”)可以与回放设备102a(指定为“右”)具有点对点连接。在一个实施例中,左回放设备102j可以通过点对点连接与右回放设备102a通信。在相关实施例中,左回放设备 102j可以经由点对点连接和/或经由LAN的其他连接与其他网络设备通信。
网络路由器106可以经由广域网(WAN)107与一个或多个远程计算设备105耦接。在一些实施例中,一个或多个远程计算设备可以是云服务器。远程计算设备105可以被配置为以各种方式与媒体回放系统100交互。例如,远程计算设备可以被配置为促进在家居环境中流媒体和控制媒体内容(例如,音频)的回放。在下面更详细描述的技术的一个方面中,远程计算设备105被配置为为媒体回放系统100 提供第一VAS 160。
在一些实施例中,一个或多个回放设备102可以包括机载(例如,集成的)网络麦克风设备。例如,回放设备102a-e分别包括对应的 NMD 103a-e。除非在说明书中另外指出,否则包括网络麦克风设备的回放设备在本文中可互换地称为回放设备或网络麦克风设备。
在一些实施例中,一个或多个NMD 103可以是独立设备。例如, NMD 103f和103g可以是独立网络麦克风设备。独立网络麦克风设备可以省略通常包括在回放设备(例如,扬声器或相关电子设备)中的组件。在这种情况下,独立网络麦克风设备可能不产生音频输出或可能产生有限的音频输出(例如,相对低质量的音频输出)。
在使用中,网络麦克风设备可以接收并处理来自其附近的用户的语音输入。例如,网络麦克风设备可以在检测到用户说出输入时捕获语音输入。在示出的示例中,客厅中的回放设备102a的NMD 103a 可以捕获在其附近的用户的语音输入。在一些实例中,语音输入源(例如,用户)附近的其他网络麦克风设备(例如,NMD 103b和103f) 也可以检测语音输入。在这种实例中,网络麦克风设备可以在彼此之间进行仲裁以确定哪个(哪些)设备应该捕获和/或处理检测到的语音输入。例如在2017年2月21日提交的题为“Voice Control ofa Media Playback System”的美国申请No.15/438,749中可以找到在网络麦克风设备之间进行选择和仲裁的示例,该申请通过引用整体并入本文。
在某些实施例中,可以将网络麦克风设备分配给可能不包括网络麦克风设备的回放设备。例如,NMD 103f可以被分配给其附近的回放设备102i和/或102l。在相关示例中,网络麦克风设备可以通过被分配了音频的回放设备输出音频。例如,在先前引用的美国专利申请 No.15/438,749中可以找到关于将网络麦克风设备和回放设备关联为指定设备或默认设备的附加细节。
可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件可以如何交互以向用户提供媒体体验的其他方面。虽然本文的讨论可能总体上涉及示例媒体回放系统100,但是本文描述的技术不限于尤其如图1所示的家居环境内的应用。例如,本文所述的技术在其他家居环境配置中可能是有用的,该其他家居环境配置包括更多或更少的回放/网络麦克风和/或控制器设备102-104中的任何一个。另外,本文描述的技术在可能期望多区音频的环境中可能是有用的,例如,诸如餐馆、购物中心或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或小汽车、轮船或船只、飞机之类的交通工具等。
a.示例回放和网络麦克风设备
图2A是示出了图1所示的所选择的回放设备102中的一个的某些方面的某些方面的功能框图。如图所示,这样的回放设备可以包括处理器212、软件组件214、存储器216、音频处理组件218、音频放大器220、扬声器222以及包括无线接口232和有线接口234的网络接口230。在一些实施例中,回放设备可以不包括扬声器222,而是可以包括用于将该回放设备与外部扬声器连接的扬声器接口。在某些实施例中,回放设备可以既不包括扬声器222也不包括音频放大器222,而是可以包括用于将回放设备与外部音频放大器或视听接收机连接的音频接口。
回放设备还可以包括用户界面236。用户界面236可以促进独立于或结合一个或多个控制器设备104的用户交互。在各种实施例中,除其他可能性之外,用户界面236包括一个或多个物理按钮和/或设置在触敏屏幕和/或表面上的图形界面,以供用户直接提供输入。用户界面236还可以包括灯和扬声器中的一个或多个,以向用户提供视觉和/ 或音频反馈。
在一些实施例中,处理器212可以是时钟驱动计算组件,其被配置为根据存储器216中存储的指令处理输入数据。存储器216可以是有形计算机可读介质,其被配置为存储可由处理器212执行的指令。例如,存储器216可以是数据存储设备,其可以加载有可由处理器212 执行以实现某些功能的一个或多个软件组件214。在一个示例中,这些功能可以涉及回放设备从音频源或另一回放设备获取音频数据。在另一个示例中,这些功能可以涉及回放设备向网络上的另一设备发送音频数据。在又一示例中,这些功能可以涉及将回放设备与一个或多个其他回放设备配对以创建多声道音频环境。
某些功能可以涉及回放设备与一个或多个其他回放设备同步回放音频内容。在同步回放期间,听众可能无法感知同步回放设备在音频内容回放之间的时间延迟差异。通过引用整体并入本文的2004年4 月4日提交的题为“System and method for synchronizingoperations among a plurality of independently clocked digital data processingdevices”的美国专利No.8,234,395,更详细地提供了回放设备之间的音频回放同步的一些示例。
音频处理组件218可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一些实施例中,一个或多个音频处理组件218可以是处理器212的子组件。在一个示例中,音频处理组件218可以处理和/或有意地改变音频内容以产生音频信号。然后,所产生的音频信号可被提供至音频放大器210 进行放大,并通过扬声器212回放。具体地,音频放大器210可以包括被配置为将音频信号放大到用于驱动扬声器212中的一个或多个的电平的设备。扬声器212可包括单独的换能器(例如,“驱动器”)或具有一个或多个驱动器的包括外壳的完整扬声器系统。例如,扬声器 212的特殊驱动器可以包括例如低音喇叭(例如,针对低频)、中频段驱动器(例如,针对中频)和/或高频扬声器(例如,针对高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的各个对应的音频放大器来驱动。除了产生用于回放的模拟信号之外,音频处理组件208可以被配置为处理要向一个或多个其他回放设备发送以进行回放的音频内容。
可以例如通过音频线路输入的输入连接(例如,自动检测3.5mm 音频线路输入连接)或网络接口230从外部源接收要由回放设备处理和/或回放的音频内容。
网络接口230可以被配置为促进回放设备与数据网络上的一个或多个其他设备之间的数据流。因此,回放设备可以被配置为通过数据网络从与回放设备通信的一个或多个其他回放设备、局域网内的网络设备或广域网(例如,互联网)上的音频内容源接收音频内容。在一个示例中,回放设备发送和接收的音频内容和其他信号可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字数据包数据的形式来发送。在这种情况下,网络接口230可以被配置为解析数字数据包数据,使得去往回放设备的数据被该回放设备正确地接收和处理。
如图所示,网络接口230可以包括无线接口232和有线接口234。无线接口232可以为回放设备提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、 802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)无线通信。有线接口234可以为回放设备提供网络接口功能,以根据通信协议(例如,IEEE802.3)通过有线连接与其他设备通信。虽然图2A中所示的网络接口230包括无线接口232和有线接口234,但是在一些实施例中,网络接口230可以仅包括无线接口或仅包括有线接口。
如上所述,回放设备可以包括网络麦克风设备,例如,图1所示的NMD 103中的一个。网络麦克风设备可以共享回放设备的一些或全部组件,例如,处理器212、存储器216、麦克风224等。在其他示例中,网络麦克风设备包括专用于网络麦克风设备的操作方面的组件。例如,网络麦克风设备可以包括远场麦克风和/或语音处理组件,在一些实例中,回放设备可以不包括它们。在另一示例中,网络麦克风设备可以包括用于启用/禁用麦克风的触敏按钮。在又一示例中,如上所述,网络麦克风设备可以是独立设备。图2B是示出了并入了网络麦克风设备的示例回放设备202的等距图。回放设备202在设备顶部具有控制区域237,以用于启用/禁用麦克风。控制区域237与设备顶部处的另一区域239相邻,以用于控制回放。
举例来说,SONOS公司目前提供(或已经提供)销售某些回放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”、和“SUB”。任何其他过去、现在和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。另外,应该理解,回放设备不限于图2A所示的示例或SONOS产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括个人移动媒体回放设备的扩展基座,或与其交互。在又一示例中,回放设备可以集成到另一设备或组件,例如,电视、照明器材或在室内或室外使用的一些其他设备。
b.示例回放设备配置
图3A-3E示出了区域和区域分组中的回放设备的示例配置。首先参考图3E,在一个示例中,单个回放设备可以属于一个区域。例如,阳台中的回放设备102c可以属于区域A。在以下所述的一些实施方式中,多个回放设备可以被“绑定”以形成“绑定对”,它们一起形成单个区域。例如,可以将图1中名为角落的回放设备102f与名为墙壁的回放设备102g绑定以形成区域B。绑定的回放设备可以具有不同的回放职责(例如,声道职责)。在以下所述的另一实施方式中,多个回放设备可以被合并以形成单个区域。例如,可以将名为书房的回放设备 102d与名为窗户的回放设备102m合并以形成单个区域C。合并的回放设备102d和102m可以不被具体地分配不同的回放职责。即,合并的回放设备102d和102m除了可以同步播放音频内容之外,还可以如未合并时那样各自播放音频内容。
媒体回放系统100中的每个区域可以作为单个用户界面(UI)实体被提供以进行控制。例如,区域A可以作为名为阳台的单个实体提供。区域C可以作为名为书房的单个实体提供。区域B可以作为名为架子的单个实体提供。
在各种实施例中,区域可以采用属于该区域的回放设备中的一个的名称。例如,区域C可以采用书房设备102d的名称(如图所示)。在另一示例中,区域C可以采用窗户设备102m的名称。在另一示例中,区域C可以采用书房设备102d和窗户设备102m的某种组合的名称。选择的名称可以由用户选择。在一些实施例中,可以将区域命名为与属于该区域的设备不同的名称。例如,区域B被命名为架子,但是区域B中的所有设备都不具有该名称。
绑定的回放设备可以具有不同的回放职责,例如,某些音频声道的职责。例如,如图3A所示,角落和墙壁设备102f和102g可以被绑定,以便产生或增强音频内容的立体声效果。在该示例中,角落回放设备102f可以被配置为播放左声道音频分量,而墙壁回放设备102g 可以被配置为播放右声道音频分量。在一些实施方式中,这种立体声绑定可以被称为“配对”。
另外,绑定的回放设备可以具有附加的和/或不同的相应扬声器驱动器。如图3B所示,可以将名为前置(Front)的回放设备102b与名为低音炮(SUB)的回放设备102k绑定。前置设备102b可以呈现中高频范围,并且低音炮设备102k可以呈现低频,例如,重低音。当未绑定时,前置设备102b可以呈现整个频率范围。作为另一示例,图3C示出了前置设备和低音炮设备102b和102k分别进一步与右回放设备和左回放设备102a和102k绑定。在一些实施方式中,右设备和左设备102a和102k可以形成家庭影院系统的环绕或“卫星”声道。绑定的回放设备102a、102b、102j和102k可以形成单个区域D(图3E)。
合并的回放设备可能没有分配回放职责,并且可以分别呈现相应回放设备能够回放的音频内容的全部范围。然而,合并的设备可以被表示为单个UI实体(即,如上所述的区域)。例如,书房中的回放设备102d和102m具有区域C的单个UI实体。在一个实施例中,回放设备102d和102m可以各自输出每个回放设备102d和102m能够同步回放的音频内容的全部范围。
在一些实施例中,独立网络麦克风设备本身可以在一个区域中。例如,图1中名为天花板的NMD 103g可以是区域E。网络麦克风设备也可以与另一个设备绑定或合并,以形成区域。例如,可以将名为岛台的NMD设备103f与回放设备102i厨房绑定,后者一起形成区域G,该区域F也被称为厨房。例如,在先前引用的美国专利申请 No.15/438,749中可以找到关于将网络麦克风设备和回放设备关联为指定设备或默认设备的附加细节。在一些实施例中,独立网络麦克风设备可以不与区域相关联。
可以将单个、绑定和/或合并的设备的区域分组,以形成区域分组。例如,参考图3E,区域A可以与区域B组合,以形成包括该两个区域的区域分组。作为另一示例,区域A可以与一个或多个其他区域 C-I分在一组。可以以多种方式对区域A-I进行分组和取消分组。例如,可以将三个、四个、五个或更多个(例如,全部)区域A-I分在一组。如先前参考的美国专利No.8,234,395中所述,当被分组时,单个和/ 或绑定的回放设备的区域可以彼此同步地回放音频。回放设备可以动态分组和取消分组,以形成同步回放音频内容的新的或不同的分组。
在各种实施方式中,环境中的区域可以是分组内区域的默认名称,或者是区域分组内区域名称的组合,例如,餐厅+厨房,如图3E所示。在一些实施例中,还可以将区域分组命名为由用户选择的唯一名称,例如,尼克的房间(Nick’s Room),如图3E所示。
再次参考图2A,某些数据可以作为一个或多个状态变量被存储在存储器213中,该状态变量被周期性地更新并且用于描述回放区域、回放设备和/或关联的区域分组的状态。存储器216还可以包括与媒体系统的其他设备的状态相关联的数据,并且间或地在设备之间共享,使得设备中的一个或多个具有与系统相关联的最新数据。
在一些实施例中,存储器可以存储与状态相关联的各种变量类型的实例。变量实例可以与对应于类型的标识符(例如,标签)一起存储。例如,某些标识符可以是用于识别区域的回放设备的第一类型“a1”、用于识别可以绑定在该区域中的回放设备的第二类型“b1”和用于识别该区域可能所属的区域分组的第三类型“c1”。作为相关示例,在图 1中,与阳台相关联的标识符可以指示该阳台是特定区域的唯一回放设备,而不是在区域分组中。与客厅相关联的标识符可以指示该客厅没有与其他区域分在一组,而是包括绑定的回放设备102a、102b、102j 和102k。与餐厅相关联的标识符可以指示该餐厅是餐厅+厨房组的一部分,并且设备103f和102i被绑定。由于厨房是餐厅+厨房区域分组的一部分,因此与该厨房关联的标识符可以指示相同或相似的信息。其他示例区域变量和标识符如下所述。
在又一示例中,媒体回放系统100可以表示区域和区域分组的其他关联的变量或标识符,例如,与区域相关联的标识符,如图3E所示。区域可以涉及区域分组和/或不在区域分组内的区域的集群。例如,图3E示出了名为前部区域的第一区域和名为后部区域的第二区域。前部区域包括阳台、客厅、餐厅、厨房和浴室的区域和区域分组。后部区域包括浴室、尼克的房间(Nick’s Room)、卧室和书房的区域和区域分组。在一个方面,区域可以用于调用共享另一集群的一个或多个区域和/或区域分组的区域分组和/或区域的集群。在另一方面,这不同于区域分组,区域分组不与另一区域分组共享区域。用于实现区域的技术的其他示例可以在例如2017年8月21日提交的题为“Room Association Based on Name”的美国申请No.15/682,506和2007 年9月11日提交的题为“Controlling and manipulatinggroupings in a multi-zone media system”的美国专利No.8,483,853中找到。这些申请中的每一个通过引用整体并入本文。在一些实施例中,媒体回放系统 100可以不实现区域,在这种情况下,系统可以不存储与区域相关联的变量。
存储器216还可以被配置为存储其他数据。这样的数据可以涉及回放设备可访问的音频源或该回放设备(或一些其他回放设备)可以与之关联的回放队列。在以下所述的实施例中,存储器216被配置为在处理语音输入时存储用于选择特定VAS(例如,第一VAS 160)的命令数据集合。
在操作过程中,图1环境中的一个或多个回放区可能每个都在播放不同的音频内容。例如,用户可能正在阳台区烧烤并收听由回放设备102c播放的嘻哈音乐,而另一用户可能正在厨房区中准备食物并收听由回放设备102i播放的古典音乐。在另一示例中,回放区可以与另一个回放区同步地播放相同的音频内容。例如,用户可以在书房区中,其中,回放设备102d正在播放与阳台区中的回放设备102c正在播放的嘻哈音乐相同的音乐。在这种情况下,回放设备102c和102d可以同步地播放嘻哈音乐,使得用户可以在不同回放区之间移动时无缝地 (或至少基本上无缝地)欣赏被外放的音频内容。可以以类似于如先前引用的编号为8,234,395的美国专利中所述的回放设备之间的同步的方式来实现回放区域之间的同步。
如上所述,可以动态地修改媒体回放系统100的区域配置。因此,媒体回放系统100可以支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域中或从区域中移出,则可以重新配置媒体回放系统100以适应改变。例如,如果用户将回放设备102c从阳台区物理地移动到书房区,则该书房区现在可以包括回放设备102c和102d。在一些情况下,用户可以使用例如控制器设备104中的一个和/或语音输入将移动的回放设备102c与书房区配对或组合和/或重命名书房区中的播放器。作为另一示例,如果将一个或多个回放设备102移动到家居环境中还不是回放区的特定空间,则可以将移动的回放设备重命名或与该特定区域的回放区相关联。
此外,媒体回放系统100的不同回放区可以被动态组合为区域分组或分成单独的回放区。例如,餐厅区和厨房区可以被组合成用于宴会的区域分组,使得回放设备102i和1021可以同步地呈现音频内容。作为另一示例,客厅区域中的绑定的回放设备102可以被划分为(i) 电视区和(ii)单独的收听区。电视区可以包括前置回放设备102b。收听区可以包括右回放设备102a、左回放设备102j和低音炮回放设备 102k,如上所述,它们可以被组合、配对或合并。以这种方式划分客厅区可以允许一个用户在客厅空间的一个区域中的收听区中听音乐,而另一用户在客厅空间的另一区域中观看电视。在相关示例中,用户可以在将客厅区划分为电视区和收听区之前,实现NMD 103a或103b 中的任何一个来控制客厅区。一旦划分,可以例如由NMD 103a附近的用户控制收听区,并且可以例如由NMD 103b附近的用户控制电视区。然而,如上所述,任何NMD 103可以被配置为控制媒体回放系统100的各种回放设备和其他设备。
c.示例控制器设备
图4A是示出了图1的媒体回放系统100的所选择的控制器设备 104中的一个的某些方面的功能框图。这种控制器设备也可以被称为控制器。图4A所示的控制器设备可以包括通常与上述网络设备的某些组件类似的组件,例如,处理器412、存储器416、麦克风424和网络接口430。在一个示例中,控制器设备可以是用于媒体回放系统100 的专用控制器。在另一示例中,控制器设备可以是可以在其上安装媒体回放系统控制器应用软件网络设备,例如,iPhoneTM、iPadTM或任何其他智能电话、平板电脑或网络设备(例如,联网计算机(例如,PC 或MacTM))。
控制器设备的存储器416可以被配置为存储控制器应用软件以及与媒体回放系统100和系统100的用户相关联的其他数据。存储器416 可以加载有一个或多个可由处理器412执行的软件组件414以实现某些功能,例如,促进媒体回放系统100的用户访问、控制和配置。如上所述,控制器设备通过网络接口430(例如,无线接口)与其他网络设备通信。
在一个示例中,可以经由网络接口430在控制器设备和其他设备之间传送数据和信息(例如,状态变量)。例如,媒体回放系统100 中的回放区和区域分组配置可以由控制器设备从回放设备、网络麦克风设备或另一网络设备接收,或者由控制器设备经由网络接口406向另一回放设备或网络设备发送。在一些情况下,另一网络设备可以是另一控制器设备。
回放设备控制命令(例如,音量控制和音频回放控制)也可以经由网络接口430从控制器设备向回放设备传送。如以上所建议的,也可以由用户使用控制器设备来执行对媒体回放系统100的配置的更改。配置更改可以包括:将一个或多个回放设备添加到区域/从区域中删除;将一个或多个区域添加到区域分组/从区域分组中删除;形成绑定或合并的播放器;将一个或多个回放设备与绑定或合并的播放器分离等。
控制器设备的用户界面440可以被配置为通过分别提供控制器界面(例如,如图4B和图4C所示的控制器界面440a和440b,其可以统称为控制器界面440),来促进用户访问和控制媒体回放系统100。一起参考图4B和图4C,控制器界面440包括回放控制区域442、回放区域区域443、回放状态区域444、回放队列区域446和源区域448。如图所示的用户界面400仅是可以在网络设备(例如,图4A所示的控制器设备)上提供并且由用户访问以控制媒体回放系统(例如,媒体回放系统100)的用户界面的一个示例。备选地,可以在一个或多个网络设备上实现变化的格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的类似的控制访问。
回放控制区域442(图4B)可以包括可选择(例如,通过触摸或通过使用光标)图标,以使所选择的回放区域或区域分组中的回放设备播放或暂停、快进、快退、跳到下一个、跳到前一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式。回放控制区域442还可以包括用于修改均衡设置、回放音量等的可选择图标。
回放区域区域443(图4C)可以包括媒体回放系统100内的回放区域的表示。如图所示,回放区域区域也可以包括区域分组的表示,例如,餐厅+厨房区域分组。在一些实施例中,回放区域的图形表示可以是可选择的,以调出附加的可选择图标来管理或配置媒体回放系统中的回放区域,例如,创建绑定的区域、创建区域分组、分离区域分组、重命名区域分组等。
例如,如图所示,可以在回放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以调出用于选择媒体回放系统中要与特定区域分在一组的一个或多个其他区域的选项。一旦被分组,已经与特定区域分在一组的区域中的回放设备将被配置为与特定区域中的回放设备同步地播放音频内容。类似地,可以在区域分组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以调出用于取消选择区域分组中的要从该区域分组中移除的一个或多个区域的选项。经由用户界面(例如,用户界面400)对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区或区域分组配置被修改时,可以动态地更新回放区区域443(图4C)中的回放区的表示。
回放状态区域444(图4B)可以包括在所选择的回放区或区域分组中当前正在播放、先前播放或被安排为接下来播放的音频内容的图形表示。可以在用户界面上可视地区分所选择的回放区或区域分组,例如,在回放区区域443和/或回放状态区域444内。图形表示可以包括曲目名称、艺术家姓名、专辑名称、专辑年份、曲目长度以及当经由用户界面440控制媒体回放系统时用户知道了会有用的其他相关信息。
回放队列区域446可以包括与所选择的回放区或区域分组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区或区域分组可以与回放队列相关联,该回放队列包含与由该回放区或区域分组回放的零个或更多个音频项相对应的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符 (URL)或一些其他标识符,其可以由回放区或区域分组中的回放设备用于从本地音频内容源或联网音频内容源查找和/或获取音频项,可能供回放设备回放。
在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在另外的示例中,当回放区域或区域分组正在持续播放流媒体音频内容(例如,互联网收音机,其可以持续播放直到被停止),而不是具有回放持续时间的分立音频项时,回放队列可以是空的或被填充但是“未使用”。在备选实施例中,回放队列可以包括互联网收音机和/或其他流媒体音频内容项,并且当回放区域或区域分组正在播放这些项时处于“使用中”。其他示例也是可能的。
当回放区域或区域分组被“分组”或“取消分组”时,可以清除与受影响的回放区域或区域分组相关联的回放队列,或者重新关联。例如,如果包括第一回放队列的第一回放区与包括第二回放队列的第二回放区分在一组,则所建立的区域分组可以具有相关联的回放队列,其最初是空的,包含来自第一回放队列的音频项(例如,如果第二回放区被添加到第一回放区),或包含来自第二回放队列的音频项(例如,如果第一回放区被添加到第二回放区),或包含来自第一回放队列和第二回放队列二者的音频项的组合。随后,如果所建立的区域分组被取消分组,则所得到的第一回放区可以与先前的第一回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含与来自在所建立的区域分组被取消分组之前所建立的区域分组相关联的回放队列的音频项。类似地,所得到的第二回放区可以与先前的第二回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在与所建立的区域分组被取消分组之前所建立的区域分组相关联的回放队列的音频项。其他示例也是可能的。
仍然参考图4B和4C,回放队列区域446(图4C)中的音频内容的图形表示可以包括曲目标题、艺术家名称、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以调出附加的可选择图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以将所表示的音频内容从回放队列中移除,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以立即播放,或者在任何当前播放的音频内容之后进行播放等。与回放区或区域分组相关联的回放队列可以存储于该回放区或区域分组中的一个或多个回放设备上、不在该回放区或区域分组中的回放设备上和/或一些其他指定设备上的存储器中。这种回放队列的回放可以涉及一个或多个回放设备可能按顺序或随机顺序回放队列中的媒体项。
源区域448可以包括与对应的VAS相关联的可选择音频内容源和可选择语音助手的图形表示。可以选择性地分配VAS。在一些示例中,同一网络麦克风设备可以调用多个VAS,例如,AMAZON的和另一语音服务。在一些实施例中,用户可以将VAS专门分配给一个或多个网络麦克风设备。例如,用户可以将第一VAS 160分配给图1 所示的客厅中的NMD 102a和102b中的一个或两者,并将第二VAS 分配给厨房中的NMD 103f。其他示例是可能。
d.示例音频内容源
源区域448中的音频源可以是音频内容源,可以通过所选择的回放区或区域分组从该音频内容源中获取音频内容并播放。区域或区域分组中的一个或多个回放设备可以被配置为从各种可用音频内容源中获取回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,回放设备可以直接从对应的音频内容源(例如,线路输入连接)中获取音频内容。在另一示例中,可以在网络上,经由一个或多个其他回放设备或网络设备向回放设备提供音频内容。
示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制器设备、支持网络的个人计算机、或者网络附接存储器(NAS)等)上的本地音乐库、通过互联网(例如,云)提供音频内容的流媒体音频服务、或者通过回放设备或网络设备上的线路输入连接连接至媒体回放系统的音频源等。
在一些实施例中,可以在媒体回放系统(例如,图1的媒体回放系统100)中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描由媒体回放系统中的回放设备可访问的网络上共享的所有文件夹/目录中的可识别音频项,并且生成或更新包含元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或 URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能的。
e.示例网络麦克风设备
图5A是示出了根据本公开各方面的一个或多个NMD 103的附加特征的功能框图。图5A所示的网络麦克风设备可以包括与上述网络麦克风设备的某些组件大致类似的组件,例如,处理器212(图1)、网络接口230(图2A)、麦克风224和存储器216。尽管为了清楚起见未示出,网络麦克风设备可以包括其他组件,例如,扬声器、放大器、信号处理器,如上所述。
麦克风224可以是多个麦克风,其被布置为检测网络麦克风设备的环境中的声音。在一个示例中,麦克风224可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风224可以对频段的一部分敏感。在一个示例中,麦克风224的第一子集可以对第一频段敏感,而麦克风224的第二子集可以对第二频段敏感。麦克风 224还可以被布置为捕获音频源(例如,语音,可听声音)的位置信息和/或帮助过滤背景噪声。值得注意的是,在一些实施例中,麦克风 224可以具有单个麦克风而不是多个麦克风。
网络麦克风设备还可以包括波束形成器组件551、声学回声消除 (AEC)组件552、语音活动检测器组件553、唤醒词检测器组件554、语音/文本转换组件555(例如,语音到文本和文本到语音)以及VAS 选择器组件556。在各种实施例中,组件551-556中的一个或多个可以是处理器512的子组件。
波束成形和AEC组件551和552被配置为检测音频信号并确定所检测的音频内的语音输入的各个方面,例如,方向、幅度、频谱等。例如,波束成形和AEC组件551和552在过程中可以用于确定网络麦克风设备和与该网络麦克风设备讲话的用户之间的近似距离。在另一示例中,网络麦克风设备可以检测用户与媒体回放系统中的另一网络麦克风设备的相对接近度。
语音活动检测器活动组件553被配置为与波束成形以及AEC组件 551和552紧密协作,以捕获来自检测到语音活动的方向的声音。可以通过监视将语音与其他声音区分开的度量来识别潜在的语音方向。这种度量可以包括例如相对于背景噪声的语音频带内的能量和该语音频带内的熵(其是频谱结构的测量)。语音通常具有比大多数常见的背景噪声低的熵。
唤醒词检测器组件554被配置为监视和分析接收到的音频以确定该音频中是否存在任何唤醒词。唤醒词检测器组件554可以使用唤醒词检测算法来分析接收到的音频。如果唤醒词检测器554检测到唤醒词,则网络麦克风设备可以处理该接收到的音频中包含的语音输入。示例唤醒词检测算法接受音频作为输入,并且提供在该音频中是否存在唤醒词的指示。许多第一方和第三方唤醒词检测算法是已知的并且可商购的。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在一些实施例中,唤醒词检测器554在接收到的音频上同时(或基本同时)运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的APPLE的/>或MICROSOFT的/>)各自使用不同的唤醒词来调用它们各自的语音服务。为了支持多种服务,唤醒词检测器554可以针对每个支持的语音服务通过唤醒词检测算法并行地运行接收到的音频。
VAS选择器组件556被配置为检测语音输入内由用户说出的命令。语音/文本转换组件555可以通过将语音输入中的语音转换为文本来促进处理。在一些实施例中,网络麦克风设备可以包括针对与家庭相关联的特定用户或特定用户集合训练的语音识别软件。这样的语音识别软件可以实现被调谐到特定语音简档的语音处理算法。调谐到特定的语音简档可以需要比传统VAS更少的计算密集型算法,传统VAS 通常从广泛的用户基础和不针对媒体回放系统的各种请求中进行采样。
VAS选择器组件556还被配置为确定在语音输入中检测到的特定命令是否满足某些命令标准。针对语音输入中给定命令的命令标准可以例如基于在该语音输入内包括某些关键字。关键字可以是例如语音输入中识别媒体回放系统100中的特定设备或分组的单词。如本文所使用的,术语“关键字”可以指单个单词(例如,“bedroom(卧室)”) 或一组单词(例如,“the living room(客厅)”)。
附加地或备选地,针对给定命令的命令标准可以涉及与检测该给定命令结合的一个或多个控制状态和/或区域状态变量的检测。控制状态变量可以包括:例如,识别音量级别的指示符、与一个或多个设备相关联的队列以及回放状态,例如,设备是否正在播放队列、是否暂停等。区域状态变量可以包括:例如,识别哪些区域播放器被分在一组的指示符。VAS选择器组件556可以在存储器216中存储命令信息集合,例如,在数据表590中,该命令信息集合包含命令列表和相关联的命令标准,下面将对其进行详细描述。
在一些实施例中,上述组件551-556中的一个或多个可以与麦克风224结合操作以检测和存储用户的语音简档,该语音简档可以与媒体回放系统100的用户账户相关联。在一些实施例中,语音简档可以被存储为和/或与存储在命令信息集合590中的变量进行比较,如下所述。语音简档可以包括用户语音的音调或频率方面和/或用户的其他独特方面,例如,先前引用的美国专利申请No.15/438,749中所描述的那些。
在一些实施例中,上述组件551-556中的一个或多个可以与麦克风阵列524结合操作以确定用户在家居环境中的位置和/或相对于一个或多个NMD 103的位置。如下所述,可以检测用户的位置或接近度并将其与存储在命令信息590中的变量进行比较。用于确定用户的位置或接近度的技术可以包括在先前引用的美国专利申请 No.15/438,749、2011年12月29日提交的题为“Sound Field Calibration Using Listener Localization”的美国专利No.9,084,058、以及2012年8 月31日提交的题为“Acoustic Optimization”的美国专利No.8,965,033 中公开的更多技术。这些申请中的每一个通过引用整体并入本文。
图5B是根据本公开各方面的示例语音输入的图。语音输入可以由网络麦克风设备捕获,例如,由图1所示的一个或多个NMD 103 捕获。语音输入可以包括唤醒词部分557a和语音发声部分557b(统称为“语音输入557”)。在一些实施例中,唤醒词557a可以是已知的唤醒词,例如,与AMAZON的相关联的“Alexa”。在其他实施例中,语音输入557可以不包括唤醒词。
在一些实施例中,网络麦克风设备可以在检测到唤醒词部分557a 时输出听觉和/或视觉响应。附加地或备选地,网络麦克风设备可以在处理语音输入和/或一系列语音输入(例如,在多回合请求的情况下) 之后输出听觉和/或视觉响应。
语音发声部分557b可以包括:例如,一个或多个口头命令558(分别被识别为第一命令558a和第二命令558b)和一个或多个口头关键字559(分别被识别为第一关键字559a和第二关键字559b)。在一个示例中,第一命令557a可以是播放音乐的命令,例如,特定的歌曲、专辑、播放列表等。在该示例中,关键字559可以是识别要在其中播放音乐的一个或多个区域(例如,图1中所示的客厅和餐厅)的一个或多个单词。在一些示例中,语音发声部分557b可以包括其他信息,例如,检测到的在用户说出的单词之间的停顿(例如,非语音的时段),如图5B所示。停顿可以在语音发声部分557b内划分由用户说出的单独命令、关键字或其他信息的位置。
在一些实施例中,媒体回放系统100被配置为在检测到唤醒词部分557a的同时临时减小其正在播放的音频内容的音量。媒体回放系统 100可以在处理语音输入557之后恢复音量,如图5B所示。这样的过程可以被称为闪避,其示例在先前引用的美国专利申请No.15/438,749 中公开。
f.示例网络和远程计算系统
图6是示出了图1中的远程计算设备105的附加细节的功能框图。在各种实施例中,远程计算设备105可以通过图1所示的WAN 107 从一个或多个NMD 103接收语音输入。为了说明的目的,由图6中的箭头表示语音输入557(图5B)的选定通信路径。在一个实施例中,由远程计算设备105处理的语音输入557可以包括语音发声部分557b (图5B)。在另一实施例中,处理后的语音输入557可以包括语音发声部分557b和唤醒词557a(图5B)。
远程计算设备105包括系统控制器612,该系统控制器612包括一个或多个处理器、意图引擎602和存储器616。存储器616可以是有形的计算机可读介质,其被配置为存储可由系统控制器612和/或回放/网络麦克风和/或控制器设备102-104中的一个或多个执行的指令。
意图引擎662被配置为处理语音输入并确定该输入的意图。在一些实施例中,意图引擎662可以是系统控制器612的子组件。意图引擎662可以与一个或多个数据库(例如,一个或多个VAS数据库664) 交互以处理语音输入。VAS数据库664可以驻留在存储器616中或其他地方,例如,在回放/网络麦克风和/或控制器设备102-104中的一个或多个的存储器中。在一些实施例中,可以基于语音输入处理来更新 VAS数据库664以用于自适应学习和反馈。VAS数据库664可以存储各种用户数据、分析、目录以及用于与NLU相关的和/或其他处理的其他信息。
远程计算设备105可以与媒体回放系统100的各种回放/网络麦克风和/或控制器设备102-104交换各种反馈、信息、指令和/或相关数据。这样的交换可以与包含语音输入的发送消息有关或独立于该消息。在一些实施例中,远程计算设备105和媒体回放系统100可以经由如本文所述的通信路径和/或使用如先前引用的美国专利申请 No.15/438,749中所述的元数据交换信道来交换数据。
媒体回放系统100的设备对语音输入的处理可以至少部分地与远程计算设备105对该语音输入的处理并行地执行。另外,网络麦克风设备的语音/文本转换组件555可以将来自远程计算设备105的响应转换为语音,以经由一个或多个扬声器进行可听输出。
根据本公开的各种实施例,远程计算设备105为媒体回放系统100 执行第一VAS160的功能。图7A是包括第一VAS 160的示例网络系统700的示意图。如图所示,远程计算设备105经由WAN 107(图1) 和/或与WAN 107连接的LAN 706与媒体回放系统100耦接。以此方式,媒体回放系统100的各种回放/网络麦克风和控制器设备102-104 可以与远程计算设备105通信以调用第一VAS 160的功能。
网络系统700还包括附加的第一远程计算设备705a(例如,云服务器)和第二远程计算设备705b(例如,云服务器)。第二远程计算设备705b可以与媒体服务提供商767(例如,或/>)相关联。在一些实施例中,第二远程计算设备705b可以与第一VAS 160的计算设备直接通信。附加地或备选地,第二远程计算设备705b可以与媒体回放系统100和/或其他中间远程计算设备通信。
第一远程计算设备705a可以与第二VAS 760相关联。第二VAS 760可以是与例如AMAZON的APPLE的/> MICROSOFT的/>或其他VAS提供商相关联的传统VAS提供商。尽管为了清楚起见未示出,网络计算系统700还可以包括与一个或多个附加VAS(例如,附加传统VAS)相关联的远程计算设备。在这样的实施例中,媒体回放系统100可以被配置为选择第一VAS 160 而不是第二VAS 760,以及另一VAS。
图7B是示出了图7A的网络计算系统700中的各种数据交换的消息流程图。媒体回放系统100经由网络麦克风设备(例如,经由图1 所示的一个或多个NMD 103)捕获语音输入(框771)。如下所述,媒体回放系统100可以基于命令和命令信息集合590中的相关联的命令标准来选择适当的VAS(框771-774)。如果选择了第二VAS 760,则媒体回放系统100可以向第二VAS 760发送包含语音输入的一个或多个消息781(例如,数据包)以进行处理。
另一方面,如果选择了第一VAS 160,则媒体回放系统100向VAS 160发送包含语音输入的一个或多个消息782(例如,数据包)。媒体回放系统100可以向VAS 160同时发送其他信息和消息782。例如,如先前引用的美国专利申请No.15/131,244中所述,媒体回放系统100 可以在元数据信道上发送数据。
第一VAS 160可以处理消息782中的语音输入以确定意图(框 775)。基于该意图,VAS 160可以向媒体回放系统100发送一个或多个响应消息783(例如,数据包)。在一些实例中,响应消息783可以包括有效载荷,该有效载荷指导媒体回放系统100的一个或多个设备执行指令(框776)。例如,该指令可以指导媒体回放系统100回放媒体内容、对设备进行分组和/或执行以下所述的其他功能。附加地或备选地,例如在多回合命令的情况下,来自VAS160的响应消息783可以包括带有对更多信息的请求的有效载荷。
在一些实施例中,从第一VAS 160发送的响应消息783可以指导媒体回放系统100从媒体服务667请求媒体内容,例如,音频内容。在其他实施例中,媒体回放系统100可以从VAS 160独立地请求内容。在任一情况下,媒体回放系统100可以例如经由包括例如音频内容的媒体流784来交换用于接收内容的消息。
在一些实施例中,媒体回放系统100可以经由网络接口从回放/ 网络麦克风或局域网中的其他设备上的输入接口接收音频内容。示例音频内容包括一个或多个音频曲目、脱口秀、电影、电视节目、播客、互联网流视频以及许多其他可能形式的音频内容。音频内容可以伴随视频(例如,视频的音频曲目),或者音频内容可以是不伴随视频的内容。
在一些实施例中,媒体回放系统100和/或第一VAS 160可以使用语音输入,该语音输入导致来自VAS的成功(或不成功)响应以用于训练以及自适应训练和学习(框777和778)。训练和自适应学习可以增强媒体回放系统100和/或第一VAS 160的语音处理的准确性。在一个示例中,意图引擎662(图6)可以针对与媒体回放系统100相关联的一个或多个用户帐户,更新和维护VAS数据库664中的训练学习数据。
III.用于调用VAS的示例方法和系统
如上所述,本文描述的实施例可以涉及调用第一VAS 160。在一个方面,第一VAS160可以为媒体回放系统100提供增强的控制特征。在另一方面,如上所述,与其他VAS(例如,传统VAS)相比,第一 VAS可以提供用于控制媒体回放系统100的改进的VAS体验。
在一些实施例中,传统VAS(例如,图7B所示的第二VAS 760) 可以被媒体回放系统100调用以执行相对基本的控制,例如,相对简单的播放/暂停/跳过功能。在一些实施方式中,第二VAS 760可以提供可能无法经由第一VAS 160立刻调用的其他服务。例如,在某些实施方式中,传统VAS可以提供基于语音的互联网搜索,而第一VAS 160 无法提供。
图8A是用于调用VAS的方法800的示例流程图。方法800呈现了可以在涉及例如根据本公开的实施例配置的媒体回放系统100或另一媒体回放系统的操作环境内实现的方法的实施例。在以下所述的示例中,方法800涉及选择第一VAS 160而不是第二VAS760。
方法800可以涉及发送和接收如本文所述和/或先前引用的美国专利申请No.15/438,749中所述的各种设备和系统之间的信息。例如,该方法可以涉及在回放系统的回放/网络麦克风、控制器和远程计算设备102-104、媒体服务667的远程计算设备705b和/或第二VAS 670 的远程计算设备705a中的一个或多个之间发送和接收信息。尽管以连续顺序示出了图8A中的框,但是这些框也可以并行执行,和/或以与本文描述的顺序不同的顺序执行。而且,根据所需的实现,可以将各个框组合成更少的框,分成更多的框,和/或移除框。
另外,针对本文公开的方法800以及其他过程和方法,流程图示出了本实施例的一种可能实现的功能和操作。在这方面,每个框可以表示模块、段或程序代码的一部分,其包括可由处理器执行以实现过程中的特定逻辑功能或步骤的一个或多个指令。程序代码可以存储在任何类型的计算机可读介质上,例如,包括磁盘或硬盘驱动器的储存设备。计算机可读介质可以包括非暂时性计算机可读介质,例如,短时间存储数据的计算机可读介质,如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)。计算机可读介质还可以包括非暂时性介质,例如,辅存或持久性长期储存器,如只读存储器(ROM)、光盘或磁盘、紧凑盘只读存储器(CD-ROM)等。计算机可读介质还可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是计算机可读存储介质,例如有形的储存设备。计算机可读介质可以由以上参照各种回放/网络麦克风、控制器和远程计算设备所述的一个或多个存储器构成。另外,针对本文公开的方法800以及其他过程和方法,图8A中的每个框可以表示被连接以执行过程中的特定逻辑功能的电路。
在一些实施例中,方法800还可以涉及:接收用于启动应用的用户输入;接收用户和用户账户信息;确定系统参数;与音乐服务交互和/或与控制器交互,例如用于显示、选择以及输入系统信息。在各种实施例中,方法800可以结合在2016年7月29日提交的题为“Voice Control 0fa Media Playback System”的申请No.15/223,218中所述的示例方法和系统,该申请通过引用整体并入本文。
a.导致包括命令列表以及要存储在内存中的命令的相关标准的命令信息集合
在框801处,方法800涉及存储命令信息集合,例如,存储在网络麦克风设备的存储器216中的命令信息集合590。参照图8B,示例命令信息集合890可以包含命令列表892。命令信息集合890可以是数据表或其他数据结构。命令信息集合890可以例如存储在回放、控制器、网络麦克风和/或远程计算设备102-105中的一个或多个的存储器中。在一些实施例中,可以经由元数据交换信道和/或媒体回放系统与远程计算系统之间的任何其他通信路径来访问命令信息集合890。
在所示的示例中,命令集合892包括第一至第n命令。作为示例,第一命令可以是用于发起回放的命令,例如当用户说“播放音乐”时。第二命令可以是控制命令,例如,传输控制命令(例如,暂停、恢复、跳过、回放)。例如,第二命令可以是涉及用户要求“跳到歌曲中的下一曲目”的命令。第三命令可以是区域定位命令,例如,用于将回放设备组合、绑定和合并的命令。例如,第三命令可以是涉及用户要求“将客厅和餐厅分在一组”的命令。
本文描述的命令是示例,并且其他命令也是可能的。例如,图 9A-9C示出了带有附加示例回放发起、控制和区域定位命令的表。作为附加示例,命令可以包括查询命令。查询命令可以涉及例如用户关于当前正在播放什么音频的查询。例如,用户可以说出询问命令“告诉我客厅里正在播放什么”。
如图8B进一步所示,命令892与也存储在命令数据集合890中的命令标准相关联。例如,第一命令与一个或多个第一命令标准_1 (Criteria_1)相关联,第二命令与一个或第二命令标准_2(Criteria_2) 相关联,并且第三命令与一个或多个第三命令标准_3(Criteria_3)相关联。命令标准可以涉及与某些变量实例有关的确定。变量实例可以与标识符(例如,标签)一起存储,该标识符可以或可以不与用户帐户相关联。变量实例可以连续的、定期地或不定期地更新,以包括由用户添加或删除或与用户帐户相关联的新的自定义名称。自定义名称可以是用户提供的任何名称,其可能存在或不存在于数据库中。
变量实例可以出现在语音输入的关键字中;引用为存储在状态表中的名称和/或值;和/或经由回放/网络麦克风、控制器和远程计算设备102-105中的一个或多个,在状态表中动态存储和修改。示例变量实例可以包括区域变量实例、控制状态变量实例、目标变量实例和其他变量实例。区域变量实例可以涉及例如代表区域、区域分组、回放设备、网络麦克风设备、绑定状态、区域等的标识符,包括上述那些标识符。控制状态变量可以包括例如各个回放和网络麦克风设备和/ 或多个设备的当前控制状态,例如,指示播放音乐的设备的信息、设备的音量、存储在设备上的队列等。目标变量实例可以涉及例如与一组设备、绑定的设备和合并的设备相对应的某些控制状态和/或高级状态信息。目标变量还可以对应于媒体回放系统100中的各种设备的校准状态,例如,均衡设置。
其他变量实例也是可能的。例如,媒体变量实例可以识别媒体内容,例如,音频内容(例如,特定曲目、专辑、艺术家、播放列表、电台或音乐流派)。在一些实施例中,可以响应于在数据库中搜索用户期望的音频或内容来识别媒体变量。媒体变量可以出现在语音输入中;在状态表中引用、维护和更新;或在查询中引用,如上所述。作为另一示例,某些变量实例可以指示用户在家居环境中的位置或接近程度、是否在给定的语音输入中检测到用户的语音简档、是否检测到特定唤醒词等。变量实例可以包括自定义变量实例。
在某些实施例中,存储在命令信息集合890中的标准中的至少一些可以包括变量实例的标量向量或变量实例的其他此类集合。例如,标准_1可以包括向量,该向量识别表示图1的媒体回放系统100中所示的区域的区域变量。这样的向量可以包括[阳台,客厅,餐厅,厨房,书房,卧室,尼克的房间]。在一个实施例中,如果在语音输入中向量中的两个或更多个区域变量被检测为关键字,则可以满足标准_1。
命令信息集合890还可以包括其他信息,例如,用户特定信息894 和自定义信息896。用户特定信息894可以与用户帐户和/或家庭标识符(HHI)相关联。自定义信息896可以包括例如自定义变量,例如,自定义区域名称、自定义播放列表和/或自定义播放列表名称。例如,“尼克的最爱”可以是具有用户创建的自定义名称的自定义播放列表。
b.捕获语音输入
返回参考图8A,在框802和803处,方法800涉及监视和检测语音输入中的唤醒词。例如,媒体回放系统100可以分析表示语音输入的接收到的音频以确定是否表示唤醒词。媒体回放系统100可以使用一个或多个种唤醒词检测算法来分析接收到的音频,例如,经由唤醒词检测组件,如上所述。
在框804处,方法800涉及在框802和803处检测到唤醒词之后捕获语音输入。在各种实施例中,可以经由回放系统100的一个或多个NMD 103来捕获语音输入。如本文所使用的,术语“捕获”或“正在捕获”可以指代包括记录语音输入的至少一部分(例如,在唤醒词之后的语音发声)的过程。在一些实施例中,捕获到的语音输入可以包括唤醒词。在下文所述的某些实施例中,术语“捕获”或“正在捕获”还可以指代记录语音输入的至少一部分并使用例如语音到文本转换将语音输入转换为特定格式(例如,文本)。
c.检测捕获到的语音输入内的一个或多个命令
在框805和806处,方法800涉及检测在框804处捕获到的语音输入内的一个或多个命令892(图8B)。在各种实施例中,方法800 可以通过解析语音输入并确定命令892中的一个是否具有与在捕获到的语音输入中找到的语法相匹配的语法来检测命令。以这种方式,方法800可以使用匹配语法来检测语音输入中的命令的意图。匹配语法可以是一个单词、一组单词、一个短语等。在一个示例命令中,用户可以说“在阳台和客厅中播放披头士(TheBeatles)”。在该示例中,方法800可以将“播放”的语法识别为与命令信息集合890中的第一回放发起命令的语法相匹配。另外,方法800可以将“披头士(The Beatles)”识别为媒体变量,并且将“阳台”和“客厅”识别为区域变量。因此,命令的语法也可以以变量实例的形式表示,如下所示:“在 [第一区域变量]和[第二区域变量]中播放[媒体变量]。”类似的命令可以包括“让我听见[第一区域变量]和[第二/组设备变量]中的[媒体变量]。”如下所述,“让我听见”可以是“播放”意图的关联。
在一些实施例中,用户可以说出伴随一个区域变量实例或没有区域变量实例的命令。在一个示例中,用户可以通过简单地说“播放一些披头士(Beatles)”来给出语音输入。在这种情况下,方法800可以确定在默认区域中“播放一些披头士”的意图。在另一种情况下,方法800可以基于可能满足该命令的其他命令标准来确定在一个或多个回放设备上“播放一些披头士”的意图,例如,当在特定区域中检测到用户的存在时,用户请求播放披头士。例如,如果语音输入被位于该区域的右回放设备102a检测到,则媒体回放系统100可以在图1 所示的客厅区域中回放一些披头士。
另一示例命令可以是播放下一首命令,其可以使所选择的媒体内容被添加到在区域中下一个要播放的队列的顶部。该命令的示例语法可以是“下一首播放[媒体变量]”。
命令的另一示例可以是移动或转移命令,其可以将当前正在播放的音乐和/或区域的回放队列从一个区域移动或转移到另一个区域。例如,用户可以说出“将音乐移动到[区域变量]”的语音输入,其中命令字“移动”或“传送”可以对应于将回放状态移动到另一区域的意图。作为相关示例,移动音乐的意图可以对应于两个媒体回放系统命令。这两个命令可以将第一区域与第二区域分在一组,然后从该组中移除第二区域,从而有效地将第二区域的状态传送到第一区域。
可以在语音输入中检测到的命令和变量实例的意图可以基于预定义语法中的任何一个,该预定义语法可以与用户意图(例如,播放、暂停、添加到队列、组合、其他传输控件、经由例如控制设备104的可用控件)相关联。在一些实施方式中,命令和相关联的变量实例的处理可以基于预定义的“槽(slots)”,其中,期望在语法中指定一个或多个命令和/或一个或多个变量。在这些和其他实施方式中,如上所述,可以响应于用户自定义和偏好、反馈和自适应学习来更新用于确定用户意图的单词或词汇集合。
在一些实施例中,用于命令的不同的单词、语法和/或短语可以与同一意图相关联。例如,在语音输入中包括命令词“播放”、“收听”或“听”可以对应于反映与媒体回放系统回放媒体内容相同意图的同源词。
图9A-图9C示出了同源词的其他例子。例如,表格900的左侧中的命令可以具有在该表格的右侧中表示的某些同源词。例如,参考图 9A,左侧栏中的“播放”命令与右侧栏中的同源短语具有相同的意图,包括“跟我摇摆”、“让我们狂欢吧”、“嗨起来”。在各种实施例中,可以在表格900中添加、移除或编辑命令和同源词。例如,如上所述,可以响应于用户自定义和偏好、反馈、训练和自适应学习来添加、移除或编辑命令和同源词。图9B和图9C分别示出了与控制和区域定位有关的示例同源词。
在一些实施例中,变量实例可以具有以类似于命令的同源词的方式预定义的同源词。例如,媒体回放系统100中的“阳台”区域变量可以具有表示相同区域变量的同源词“外部”。作为另一示例,“客厅”区域变量可以具有“生活区域”、“电视室”、“家庭室”等同源词。
d.确定一个或多个命令符合命令信息集合中的相应标准
一起参考图8A和图8B,在框807处,方法800涉及确定在框806 中检测到的一个或多个命令满足命令信息集合890中的相应命令标准。例如,参考图8B,如果检测到第一命令,则方法800将确定该第一命令是否满足标准_1;如果检测到第二命令,则方法800将确定该命令是否满足标准_2;以及以此类推。
可以将命令与多个命令标准集合进行比较。在一些实施例中,某些标准集合可以与逻辑运算符相关联。例如,将第三命令与命令标准 _2和命令标准_3进行比较。这些命令由逻辑与(AND)运算符连接。因此,第三命令需要满足两个标准集合。相比之下,第n命令与由逻辑或(OR)运算符连接的标准(标准_x、标准_y和标准_z)相关联。在这种情况下,第n命令必须仅满足该命令的命令标准集合中的一个。逻辑运算符的各种组合(包括XOR运算符)可以用于确定命令是否满足某些命令标准。
在一些实施例中,命令标准可以确定语音输入是否包括多于一个命令。例如,带有“播放[媒体变量]”命令的语音输入可以伴随有第二命令“也在[区域变量]中播放”。在该示例中,媒体回放系统100可以将“播放”识别为一个命令,并且将“也播放”识别为通过包含后一个命令而满足的命令标准。在一些实施例中,当以上示例命令在同一语音输入中一起被说出时,这可以对应于组合意图。
在类似的实施例中,语音输入可以包括依次说出的两个命令或短语。方法800可以识别这样依次的命令或短语可以是相关的。例如,用户可以提供语音输入“播放一些古典音乐”后跟在“客厅”和“餐厅”中,这是将客厅和餐厅中的回放设备组合的推论命令。
在一些实施例中,当依次处理单词或短语时,媒体回放系统100 可以检测有限持续时间(例如,1至2秒)的暂停。在一些实施方式中,用户可以有意地暂停以在命令和短语之间划界以促进对相对较长的命令和信息链的语音处理。暂停可以具有足以捕获命令和信息链的预定持续时间,而不会引起媒体回放系统100空闲回到框802处的唤醒词监视。在一个方面中,用户可以使用这样的暂停来执行多个命令,而不必针对要执行的每个期望命令重新说出唤醒词。
e.响应于确定,选择第一VAS并放弃选择其他VAS,并经由第一VAS处理一个或多个 命令
满足某些预定命令标准的命令将使媒体回放系统100调用第一 VAS 160,而不满足预定标准的命令可以使媒体回放系统100调用另一VAS或根本不调用VAS。示例方法800包括:如框807和框808 所示,向VAS 160发送被确定为满足语音点中给定命令的命令标准的语音输入,并且如框809所示,在该给定命令不满足该标准时,向另一VAS发送该语音输入。
在框810处,该方法涉及800接收和处理来自VAS的响应,该VAS接收框808处的语音输入。在一个实施例中,处理来自VAS的响应可以包括处理来自VAS的指令以执行语音输入中的命令,例如,回放、控制、区域定向和以上讨论的其他命令。在一些实施例中,可以指示远程计算设备发起或控制与媒体变量相关联的内容的回放,该媒体变量可以被包括在初始语音输入中或者是数据库搜索的结果。
在一些实施例中,在框810中处理响应可以使媒体内容被获取。在一个实施例中,可以将媒体变量作为数据库搜索媒体内容的结果提供给媒体回放系统100。在一些实施例中,媒体回放系统100可以直接从一个或多个媒体服务中获取媒体内容。在其他实施例中,VAS可以结合处理在框800处接收到的语音输入来自动获取媒体内容。在各种实施例中,可以通过元数据交换信道和/或在媒体回放系统100之间建立的任何其他通信路径来传递媒体变量。如上面参考图7B所讨论的,这样的通信可以发起内容流。
在一些实施例中,数据库搜索可以基于在语音输入中检测到的媒体变量来返回结果。例如,数据库搜索可以返回:具有专辑名称与媒体变量相同的艺术家、与媒体变量匹配或相似的专辑名称、名为媒体变量的曲目、媒体变量的广播电台、名为媒体变量的播放列表、与媒体变量有关的内容的流服务提供商标识符和/或原始语音到文本转换结果。使用“美国派(American Pie)”的示例,搜索结果可以返回:艺术家“Don McLean”、名为“美国派”的专辑、名为“美国派”的曲目、名为“美国派”的广播电台(例如,“美国派”的Pandora广播电台的标识符)、曲目“美国派”的音乐服务(例如,流音乐服务,例如,或/>)曲目标识符(例如,“美国派”的/>曲目标识符、URI和/或URL)和/或“美国派”的原始语音到文本结果。
在一些实施例中,方法800可以涉及响应于播放列表或存储在云网络上的回放队列的变化来更新存储在回放设备上的回放队列,以使得回放队列的一部分与云网络中播放列表或回放队列的一部分或全部相匹配。
响应于在媒体回放系统100中引起动作,方法800可以涉及在框800处更新和/或存储与该动作有关的信息。例如,可以在框800处更新一个或多个控制状态、区域状态、区域标识符或其他信息。可以更新的其他信息可以包括例如识别当前正在播放特定媒体项目的特定回放设备的信息和/或特定媒体项目被添加到存储在回放设备上的队列中。
在一些实施例中,如框811和框812所示,在框810中处理响应可以导致确定VAS需要附加信息并以声音提示用户该信息。例如,方法800可以在执行多回合命令时提示用户附加信息。在这种情况下,方法800可以返回到框804以捕获附加语音输入。
虽然本文已经关于媒体内容(例如,音乐内容、视频内容)描述了方法和系统,但是本文描述的方法和系统可以应用于可以具有可由媒体回放系统播放的相关音频的各种内容。例如,可以响应于语音输入来播放可能不是音乐目录的一部分的预先录制的声音。一个示例是语音输入“夜莺的声音是什么样的?”。联网麦克风系统对该语音输入的响应可能不是具有标识符的音乐内容,而可能是短音频剪辑。媒体回放系统可以接收与回放短音频剪辑相关联的信息(例如,存储地址、链接、URL、文件)以及用于播放短音频剪辑的媒体回放系统命令。其他示例是可能的,包括播客、新闻剪辑、通知声音、警报等。
IV.用于媒体回放系统的语音控制的示例实现
图10A-图20B是示出了由媒体回放系统100处理的语音输入和控制接口的各种示例的示意图,该控制接口可以表示在处理语音输入之前或之后媒体回放系统100的状态。如下所述,与语音输入内的特定语音命令相关联的命令标准可以为VAS(例如,上述的VAS160)提供增强的语音控制。语音输入可以由一个或多个NMD 103接收,如上所述,该NMD 103可以合并也可以不合并到回放设备102中的一个。
尽管为了清楚起见未示出,如上所述,以下各个示例中的语音输入可以在前面加上唤醒词,例如,AMAZON的或其他唤醒词。在一个方面,相同的唤醒词可以用于发起将要向第一VAS或第二 VAS(例如,传统VAS)发送的语音输入的语音捕获。在这种情况下,说出语音发声的用户可能不知道幕后正在发生一个VAS与另一个 VAS的选择。在某些实施例中,用户可以说出独特唤醒词(例如,“Hey Sonos”)来调用第一VAS,而无需进一步考虑。在这种情况下,回放系统100可以避免确定选择第一VAS而不是另一VAS的步骤。
在一个方面中,命令标准可以被配置为对设备进行组合。在一些实施例中,当语音输入涉及媒体变量和/或受影响的设备与回放队列相关联时,这样的命令标准可以同时发起回放。例如,图10A示出了用户向NMD 103a说出语音输入以“在客厅和阳台中播放披头士”,并且图10B中的控制器界面示出了客厅和阳台的结果分组。在另一示例中,用户可以说出特定曲目、播放列表、心情或其他信息,以发起本文所述的媒体回放。
图10A中的语音输入包括“在[第一区域变量]和[第二区域变量] 中播放[媒体变量]”的语法结构。在该示例中,要播放的命令符合要求两个或更多个区域变量作为语音输入中的关键字的命令标准。在一些实施例中,客厅的回放设备102a、102b、102j和102k可以在图10A 所示的语音输入之前和之后保持在绑定的媒体回放设备布置中。
在一些实施例中,说出的区域变量的顺序可以指示哪个回放设备被指定在“组头”。例如,当用户说出包含关键字“客厅”后跟关键字“阳台”的语音输入时,该顺序可以指示客厅将成为组头。组头可以作为区域变量存储在命令信息集合890中。组头可以是用于引用分组回放设备的句柄。当用户说出包含组句柄的语音输入时,媒体回放系统100可以检测到与客厅分在一组的所有设备的意图。以这种方式,当集中控制设备时,用户不必针对一组设备中的每一个区域说出关键字。在相关实施例中,用户可以说出语音输入以将组头更改为另一设备或区域。例如,用户可以将客厅区域的组头更改为阳台(在这种情况下,界面可以将分组的顺序显示为阳台+客厅而不是客厅+阳台)。
在备选示例中,图10C示出了用户说出语音输入“播放披头士”,但是省略了图10B的语音输入中的其他关键字。在该示例中,如上所述,如果命令不满足命令信息集合890中的任何标准,则可以向另一个VAS发送语音输入。
在另一示例中,如果命令满足其他命令标准,则可以向第一VAS 160发送忽略上述关键字的“播放披头士”的语音输入。其他这样的命令标准可以包括例如涉及区域变量、控制状态变量、目标变量和/ 或其他变量的标准。在一个方面中,变量实例可以是用户与网络麦克风设备的接近度(例如,计算出的或以其他方式确定的距离)。例如,当检测到用户在NMD 103附近(例如,具有预定半径r1)时,可以向第一VAS 160发送图10C的语音输入。接近度的确定可以基于例如语音输入源的信号强度。在另一方面中,当检测到用户的语音简档时,可以向第一VAS 160发送图10C的语音输入,这可以与是否检测到用户的接近度无关。
在另一方面中,接近度和/或其他命令标准可以促进解析传统VAS 无法立刻处理的语音输入。例如,如图11A所示,说出语音输入以“提高阳台音量”的用户可能无法通过传统VAS解析,因为阳台包括照明设备108,其可以具有相同的名称。参照图1,第一VAS 160可以通过基于关联的控制变量确定用户是否在回放设备102c附近和/或阳台当前是否正在播放来解析这种冲突的设备名称。在相关方面中,当用户在阳台附近时,第一VAS 160可以确定增加阳台上的回放设备102c 的音量,但是不增加用户不位于其内的客厅中的音量。在这种情况下,如图11B所示,媒体回放系统100可以增加阳台而不是客厅的音量。
类似地,第一VAS 160可以为具有相似命令命名约定的设备解析冲突的命令。例如,图1所示的餐厅中的恒温器110可以通过用户说出语音输入来编程,以由用户“设置”到特定温度(例如,在60度和 85度之间的级别)。同样,用户可以说出语音输入以将餐厅区域“设置”到某个音量级别(例如,在0%和100%之间的级别)。在一个示例中,说出语音输入“将餐厅设置为75”的用户可以由第一VAS 160 解析,因为基于存储在命令信息集合890中的命令标准检测到了餐厅区域正在播放。相比之下,传统VAS可能无法确定是将餐厅区域的音量更改为75级还是将餐厅恒温器的温度设置为75。
在各种实施例中,可以经由各个回放/网络麦克风设备和控制器设备102-104结合来自用户的其他输入来处理语音输入。例如,用户可以使用图11B所示界面上的软按钮和控制特征来独立控制组音量、单个音量、回放状态等。另外,在图11B的示例中,用户可以按下标有“分组”的软按钮来访问另一个用于手动组合和取消分组设备的界面。在一个方面中,提供经由语音输入、控制器输入和手动设备输入来与媒体回放系统100交互的多种方式可以提供控件的无缝连续性以增强用户体验。
作为另一个分组/取消分组示例,语音输入“在阳台上播放Bob Marley”可以使阳台自动从客厅取消分组。在这种情况下,阳台可以播放Bob Marley,而客厅可以继续播放披头士。备选地,如果命令标准指示客厅不再是一组回放设备的组头,则客厅可以停止回放。在另一实施例中,命令标准可以指示设备不响应于回放发起命令而自动取消分组。
命令标准可以被配置为将当前正在播放的音乐和/或区域的回放队列从一个区域移动或转移到另一区域。例如,用户可以说出“将音乐从客厅移动到餐厅”的语音输入,如图12A所示。移动音乐的请求可以将在客厅区域中播放的音乐移动到餐厅,如图12B的控制器界面所示。在相关示例中,用户可以通过直接向图1所示餐厅附近的NMD 103f说出“将音乐移动到这里”的语音输入,将音乐移动到餐厅。在这种情况下,用户没有明确提及餐厅,但是VAS 160可以基于用户与餐厅的接近程度来推断意图。在相关实施例中,如果VAS 160确定将 NMD 103f绑定到餐厅中的回放设备1021,则VAS 160可以确定将音乐移动到餐厅而不是另一个相邻房间(例如,厨房)。在另一示例中,回放系统100可以从当前正在播放内容的元数据推断信息。在一个这样的示例中,用户可以说“将‘Let it Be’(或‘披头士’)移动到餐厅”,其识别特定音乐以移动到期望的回放区域和/或区域分组。以此方式,媒体回放系统可以在其他回放区域和/或区域分组中正在主动播放和/或排队等待回放的内容之间进行区分,以确定要转移的内容。
在又一示例中,与组头(例如,客厅)相关联的所有设备可以在将音乐从组头移动到餐厅时停止回放。在相关示例中,当音乐从客厅区域移开时,客厅区域可能失去其作为组头的头衔。
命令标准可以被配置为使用语音输入命令将设备添加到现有分组。例如,如图13A和图13B所示,用户可以通过说出“将客厅添加到餐厅”的语音输入,重新添加客厅区域以与餐厅区域形成组。在相关实施例中,用户可以通过直接向图1所示的客厅区域中的NMD 103a说出“也在这里播放”的语音输入来添加客厅。在这种情况下,用户可能没有在语音输入中明确提及客厅,但是VAS 160可以基于用户的接近程度推断出要添加客厅区域。在另一示例中,如果假设听众在有该意图时在餐厅中,则他或她可以说出命令“添加客厅”。在这种情况下,输入设备的容纳房间可以暗示餐厅目标。
在又一示例中,用户可以在语音输入中指示客厅和餐厅中的哪一个将成为组头,或者VAS 160可以请求用户指定组头。
作为添加或形成组的另一示例,用户可以使用具有与自定义区域变量相关联的关键字的语音输入实例化组。例如,用户可以为上面讨论的前部区域创建自定义区域变量。用户可以通过说出语音输入(例如,“在前部区域播放Van Halen”)来实例化前部区域分组,如图14A 和图14B所示。响应于图14A所示的语音输入,可以取代图13B所示的先前的餐厅组。
命令标准可以被配置为使用语音输入命令将设备移至现有分组。例如,用户可以说出“放弃阳台”的语音输入以将阳台从“前部区域”分组中移除,如图15A和15B所示。作为另一示例,阳台上的命令“停止/移除”可以执行相同的操作。如上所述,其他示例同源词也是可能的。在又一示例中,假设用户在阳台上,用户可以直接向图1所示阳台中的NMD 103c讲话以达到相同的结果,例如通过说“在这里停止”或“在这个房间里停止”。
命令标准可以被配置为选择音频内容源并实现相关特征。例如,图16A示出了用户向NMD 103a说出语音输入“我想看电视”。作为响应,媒体回放系统100将音频内容源从音乐源切换到电视源,如图 16B所示。在一些实施例中,指示媒体回放系统100播放电视源可以自动取消客厅与其他区域的分组。例如,在图16B中,当客厅被切换到电视源时,Van Halen继续在餐厅和厨房中播放。在一些实例中,如上所述,用户随后可以通过分组说出命令以在家居环境中的其他区域中播放电视源。
在相关实施例中,媒体回放系统100可以存储指示客厅何时与电视源连接的状态信息。当客厅处于该状态时,命令标准可以指示与电视源相关的语音命令可以由VAS实现,例如,图9B所示的源命令(例如,增强语音、打开静音模式等)。
命令标准可以被配置为绑定设备。例如,图17A示出了用户说出语音输入“我想看前置电视”。作为响应,VAS 160可以基于命令标准来确定图1中的前置回放设备102b以将其与客厅区域分开并形成电视区域,如图16B所示。在相关示例中,用户可以直接向前回放设备102b 的NMD 103b说出语音输入,以取消对该设备的绑定。客厅中其余的绑定设备,即,右、左和低音炮设备102a、102j和102k可以停止播放音乐。控制界面还可以将这些设备显示为不再是客厅区域的一部分。
作为绑定的另一示例,用户可以在分离前回放设备102b之后与客厅区域中的其余设备形成不同的绑定布置。例如,如图18A和图18B 所示,用户可以通过说出“在我的卫星箱和低音炮上播放Bob Marley 并创建收听区域”的语音输入来形成收听区域。术语“卫星箱”可以是指代右回放设备102a和左回放设备102k的自定义区域变量。图18A 中的语音输入也在新形成的收听区域中发起Bob Marley的回放。在所示的示例中,图17A-图18B中的绑定操作并未中断在餐厅和厨房区域中Van Halen的回放,如图18B的控制器界面中进一步所示。
命令标准可以被配置为配对/绑定设备。例如,图17A示出了多回合命令,其中,用户说出语音输入以“将餐厅和厨房立体声配对”。在该示例中,VAS指示一个或多个NMD 103提示用户并查询餐厅区域是否为左声道。如果用户确认餐厅为右声道,则厨房区域将为右声道。如果用户指示餐厅不是右声道,则餐厅可以默认为左声道,而厨房区域将为右声道。当合并后,餐厅和厨房中的一个可以被指定为组头。 VAS可以提示用户为绑定设备指定名称,包括唯一名称,例如,“Cocina”,如图19B所示。Cocina区域可以继续Van Halen的回放,而Van Halen可能已经从先前的餐厅和厨房区域中的任何一个的回放队列中转移了。
在相关实施例中,如图20A和图20B所示,绑定和合并设备可以使VAS发起多回合命令或其他命令来校准回放设备。在一个示例中,在将餐厅和厨房区域配对之后,VAS 160可以继续图19A中的多回合命令序列。在一些实施例中,命令标准可以要求在发起校准之前检测用户操作控制器设备103中的一个。以此方式,VAS 160可以准备校准软件(例如,SONOS的软件)以进行校准,如图20B 所示。
VII.结论
以上描述尤其公开了各种示例系统、方法、装置和尤其包括在硬件上执行的固件和/或软件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
(特征1)一种为媒体回放系统调用第一语音助手服务(VAS) 的方法,所述方法包括:使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;经由网络麦克风设备的至少一个麦克风捕获语音输入;检测所述语音输入中是否包括一个或多个命令;确定所述一个或多个命令满足所述命令信息集合中的相应命令标准;以及响应于所述确定,选择第一(VAS)和放弃选择第二VAS,(ii)向所述第一VAS发送所述语音输入,(iii)在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征2)根据特征1所述的方法,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括用于将所述回放设备中的两个或更多个进行组合并在包括所述回放设备中的两个或更多个的组上发起音频内容回放的命令。
(特征3)根据特征2所述的方法,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
(特征4)根据特征2所述的方法,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
(特征5)根据特征1所述的方法,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述功能还包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
(特征6)根据特征5所述的方法,其中,所述一个或多个命令包括回放命令和传输控制命令中的至少一个。
(特征7)根据特征1所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
(特征8)根据特征1所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
(特征9)根据特征8所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括对所述回放设备中的两个或更多个中的至少一个的选择。
(特征10)根据特征8所述的方法,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括用于校准所述回放设备中的一个或多个的均衡设置的请求。
(特征11)根据特征1所述的方法,其中,所述确定包括检测语音输入源的存在。
(特征12)根据特征11所述的方法,其中,检测所述存在包括:检测所述网络麦克风设备从所述语音输入源接收所述语音输入的方向。
(特征13)根据特征11的所述方法,其中,检测所述存在包括:检测所述网络麦克风设备与所述语音输入源之间的距离。
(特征14)根据特征1所述的方法,其中,所述确定包括:检测对控制器设备的使用。
(特征15)根据特征1所述的方法,其中,所述确定包括:检测语音输入源的语音简档。
(特征16)根据特征1所述的方法,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:检测所述语音输入内的一个或多个第二命令。
(特征17)根据特征16所述的方法,其中,所述确定还包括:在所述一个或多个第一命令与所述一个或多个第二命令之间的语音输入内检测至少一个暂停。
(特征18)一种媒体回放系统的网络麦克风设备,包括:(i)处理器;(ii)至少一个麦克风;以及(iii)具有存储在其上的指令的有形计算机可读存储器,所述指令在由所述处理器执行时使所述网络麦克风设备执行媒体回放系统的功能,所述功能包括:(a)使包括命令列表和相关联命令标准的命令信息集合被存储在存储器中;(b)经由所述至少一个麦克风捕获语音输入;(c)检测所述语音输入中是否包括一个或多个命令;(d)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准;以及(e)响应于所述确定,(a)选择第一语音助手服务(VAS)和放弃选择第二VAS, (ii)向所述第一VAS发送所述语音输入,(iii)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征19)根据特征18所述的网络麦克风设备,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括用于将所述回放设备中的两个或更多个进行分组并在包括所述回放设备中的两个或更多个的分组上发起音频内容回放的命令。
(特征20)根据特征19所述的网络麦克风设备,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
(特征21)根据特征19所述的网络麦克风设备,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
(特征22)根据特征18所述的网络麦克风设备,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述功能还包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
(特征23)根据特征22所述的网络麦克风设备,其中,所述一个或多个命令包括回放命令和传输控制命令中的至少一个。
(特征24)根据特征18所述的网络麦克风设备,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
(特征25)根据特征18所述的网络麦克风设备,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
(特征26)根据特征25所述的网络麦克风设备,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括选择所述回放设备中的两个或更多个中的至少一个。
(特征27)根据特征25所述的网络麦克风设备,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括用于校准所述回放设备中的一个或多个的均衡设置的请求。
(特征28)根据特征18所述的网络麦克风设备,其中,所述确定包括检测语音输入源的存在。
(特征29)根据特征28所述的网络麦克风设备,其中,检测所述存在包括:检测所述网络麦克风设备从所述语音输入源接收所述语音输入的方向。
(特征30)根据特征28所述的网络麦克风设备,其中,检测所述存在包括:检测所述网络麦克风设备与所述语音输入源之间的距离。
(特征31)根据特征18所述的网络麦克风设备,其中,所述确定包括:检测对控制器设备的使用。
(特征32)根据特征18所述的网络麦克风设备,其中,所述确定包括:检测语音输入源的语音简档。
(特征33)根据特征18所述的网络麦克风设备,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:检测所述语音输入内的一个或多个第二命令。
(特征34)根据特征33所述的网络麦克风设备,其中,所述确定还包括:在所述一个或多个第一命令与所述一个或多个第二命令之间的语音输入内检测至少一个暂停。
(特征35)一种为媒体回放系统调用第一语音助手服务(VAS) 的方法,所述方法包括:(i)使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;(ii)经由网络麦克风设备的至少一个麦克风捕获语音输入;(iii)检测所述语音输入中是否包括一个或多个命令;(iv)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准;以及(v)响应于所述确定,(a) 选择第一语音助手服务(VAS)和放弃选择第二VAS,(b)向所述第一VAS发送所述语音输入,(c)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征36)根据特征35所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括用于对两个或更多个回放设备进行组合并在包括以下各项的组上发起音频内容的回放的命令:所述两个或更多个回放设备,其中,所述确定包括检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下各项中的至少一个(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的组。
(功能37)一种有形的非暂时性计算机可读介质,其存储可由一个或多个处理器执行的指令,以使网络麦克风设备在媒体回放系统中执行操作,所述操作包括:(i)使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;(ii)经由网络麦克风设备的至少一个麦克风捕获语音输入;(iii)检测所捕获的语音输入中的一个或多个命令;(iv)确定所述一个或多个命令满足所述命令信息集合中的一个或多个相应标准;以及(v)响应于所述确定,(a)选择第一语音助手服务(VAS)和放弃选择第二VAS,(b)向所述第一VAS发送所述语音输入,(c)在发送所述语音输入之后,处理来自所述第一VAS的对所述语音输入的响应。
主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦接到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
当随附权利要求中的任一项权利要求被理解成涵盖纯软件和/或固件实现时,在此明确限定至少一个示例中的至少一个元素以包括存储软件和/或固件的非暂时性有形介质,如存储器、DVD、CD、蓝光等。
Claims (15)
1.一种用于媒体回放系统的方法,所述方法包括:
经由网络麦克风设备中的至少一个麦克风捕获语音输入;
在所述语音输入内检测是否包括命令信息集合中所包括的一个或多个命令,所述命令信息集合包括命令列表和与所述命令相关联的命令标准,所述命令标准包括与特定命令相关联的一个或多个关键字;
当所述一个或多个命令满足与所述命令信息集合内的一个或多个命令相关联的所述命令标准时:
选择第一语音助手服务VAS和放弃选择第二VAS,
向所述第一VAS发送所述语音输入,并且
在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
2.根据权利要求1所述的方法,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括将所述回放设备中的两个或更多个回放设备进行分组并在包括所述回放设备中的两个或更多个回放设备的分组上发起音频内容回放的命令。
3.根据权利要求2所述的方法,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
4.根据权利要求2或3所述的方法,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
5.根据任一项前述权利要求所述的方法,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述方法功能包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
6.根据任一项前述权利要求所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
7.根据任一项前述权利要求所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
8.根据权利要求7所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括对所述回放设备中的两个或更多个中的至少一个的选择。
9.根据权利要求7或8所述的方法,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括校准所述回放设备中的一个或多个回放设备的均衡设置的请求。
10.根据前述权利要求中任一项所述的方法,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:
检测所述语音输入内的一个或多个第二命令;以及
检测所述语音输入内的在所述一个或多个第一命令与所述一个或多个第二命令之间的至少一个暂停。
11.根据前述权利要求中任一项所述的方法,其中,所述命令信息集合被存储在所述媒体回放系统的一个或多个网络设备的存储器中。
12.根据权利要求11所述的方法,其中,所述媒体播放系统的网络设备通过局域网连接。
13.根据前述权利要求中任一项所述的方法,其中,所捕获的语音输入包括唤醒词。
14.一种计算机可读存储器,包括指令,所述指令当由一个或多个处理器执行时,使网络麦克风设备执行权利要求1-13中任一项所述的方法。
15.一种网络麦克风设备,包括:
一个或多个麦克风;
一个或多个处理器;以及
根据权利要求14所述的计算机可读存储器。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/721,141 | 2017-09-29 | ||
US15/721,141 US10466962B2 (en) | 2017-09-29 | 2017-09-29 | Media playback system with voice assistance |
CN201880077216.4A CN111418216B (zh) | 2017-09-29 | 2018-09-28 | 具有语音辅助的媒体回放系统 |
PCT/US2018/053472 WO2019067930A1 (en) | 2017-09-29 | 2018-09-28 | MULTIMEDIA VOICE ASSISTED READING SYSTEM |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880077216.4A Division CN111418216B (zh) | 2017-09-29 | 2018-09-28 | 具有语音辅助的媒体回放系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115857747A true CN115857747A (zh) | 2023-03-28 |
Family
ID=63963452
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211314552.0A Pending CN115857747A (zh) | 2017-09-29 | 2018-09-28 | 具有语音辅助的媒体回放系统 |
CN201880077216.4A Active CN111418216B (zh) | 2017-09-29 | 2018-09-28 | 具有语音辅助的媒体回放系统 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880077216.4A Active CN111418216B (zh) | 2017-09-29 | 2018-09-28 | 具有语音辅助的媒体回放系统 |
Country Status (8)
Country | Link |
---|---|
US (5) | US10466962B2 (zh) |
EP (2) | EP3688995B1 (zh) |
JP (3) | JP6987230B2 (zh) |
KR (3) | KR102597285B1 (zh) |
CN (2) | CN115857747A (zh) |
AU (2) | AU2018338812A1 (zh) |
CA (1) | CA3084279A1 (zh) |
WO (1) | WO2019067930A1 (zh) |
Families Citing this family (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9954996B2 (en) | 2007-06-28 | 2018-04-24 | Apple Inc. | Portable electronic device with conversation management for incoming instant messages |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8689128B2 (en) | 2009-03-16 | 2014-04-01 | Apple Inc. | Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10706096B2 (en) | 2011-08-18 | 2020-07-07 | Apple Inc. | Management of local and remote media items |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
EP3149554B1 (en) | 2014-05-30 | 2024-05-01 | Apple Inc. | Continuity |
US20150350141A1 (en) | 2014-05-31 | 2015-12-03 | Apple Inc. | Message user interfaces for capture and transmittal of media and location content |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
WO2016036541A2 (en) | 2014-09-02 | 2016-03-10 | Apple Inc. | Phone user interface |
CN113824998A (zh) | 2014-09-02 | 2021-12-21 | 苹果公司 | 音乐用户界面 |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US10928980B2 (en) | 2017-05-12 | 2021-02-23 | Apple Inc. | User interfaces for playing and managing audio items |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10372298B2 (en) | 2017-09-29 | 2019-08-06 | Apple Inc. | User interface for multi-user communication session |
JP7192208B2 (ja) * | 2017-12-01 | 2022-12-20 | ヤマハ株式会社 | 機器制御システム、デバイス、プログラム、及び機器制御方法 |
US10157042B1 (en) * | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
CN108428452B (zh) * | 2018-03-14 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 终端支架和远场语音交互系统 |
CN108510987B (zh) * | 2018-03-26 | 2020-10-23 | 北京小米移动软件有限公司 | 语音处理方法及装置 |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US20190311710A1 (en) * | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US11250840B1 (en) | 2018-04-09 | 2022-02-15 | Perceive Corporation | Machine-trained network detecting context-sensitive wake expressions for a digital assistant |
US10629203B2 (en) * | 2018-04-17 | 2020-04-21 | Flex, Ltd. | Method and systems for bookmarking complex commands using voice |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
DK180130B1 (da) | 2018-05-07 | 2020-06-02 | Apple Inc. | Multi-participant live communication user interface |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10938994B2 (en) * | 2018-06-25 | 2021-03-02 | Cypress Semiconductor Corporation | Beamformer and acoustic echo canceller (AEC) system |
CN108922528B (zh) * | 2018-06-29 | 2020-10-23 | 百度在线网络技术(北京)有限公司 | 用于处理语音的方法和装置 |
US11189275B2 (en) * | 2018-08-02 | 2021-11-30 | Polycom, Inc. | Natural language processing while sound sensor is muted |
KR20200034430A (ko) * | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US11087754B2 (en) | 2018-09-27 | 2021-08-10 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11100926B2 (en) * | 2018-09-27 | 2021-08-24 | Coretronic Corporation | Intelligent voice system and method for controlling projector by using the intelligent voice system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11128792B2 (en) | 2018-09-28 | 2021-09-21 | Apple Inc. | Capturing and displaying images with multiple focal planes |
US10978046B2 (en) * | 2018-10-15 | 2021-04-13 | Midea Group Co., Ltd. | System and method for customizing portable natural language processing interface for appliances |
KR20200109467A (ko) * | 2019-03-13 | 2020-09-23 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
JP7236919B2 (ja) * | 2019-04-12 | 2023-03-10 | 三菱電機株式会社 | 音声入力装置、音声操作システム、音声操作方法及びプログラム |
CN110109645A (zh) * | 2019-04-30 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐试听方法、装置和终端 |
US11973894B2 (en) | 2019-04-30 | 2024-04-30 | Apple Inc. | Utilizing context information with an electronic device |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11544463B2 (en) | 2019-05-09 | 2023-01-03 | Intel Corporation | Time asynchronous spoken intent detection |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970533A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Methods and user interfaces for sharing audio |
US11010121B2 (en) | 2019-05-31 | 2021-05-18 | Apple Inc. | User interfaces for audio media control |
US10867608B1 (en) | 2019-05-31 | 2020-12-15 | Apple Inc. | Multi-user configuration |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11363071B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User interfaces for managing a local network |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
KR102436985B1 (ko) | 2019-05-31 | 2022-08-29 | 애플 인크. | 오디오 미디어 제어를 위한 사용자 인터페이스 |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
WO2020246634A1 (ko) * | 2019-06-04 | 2020-12-10 | 엘지전자 주식회사 | 다른 기기의 동작을 제어할 수 있는 인공 지능 기기 및 그의 동작 방법 |
KR20210055347A (ko) * | 2019-11-07 | 2021-05-17 | 엘지전자 주식회사 | 인공 지능 장치 |
CN111601163B (zh) * | 2020-04-26 | 2023-03-03 | 百度在线网络技术(北京)有限公司 | 播放控制方法、装置、电子设备及存储介质 |
US11659229B2 (en) | 2020-04-29 | 2023-05-23 | Arris Enterprises Llc | System and method for management and presentation of alternate media |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
EP3910467A1 (en) * | 2020-05-11 | 2021-11-17 | Apple Inc. | Digital assistant hardware abstraction |
KR102523917B1 (ko) * | 2020-05-11 | 2023-04-19 | 애플 인크. | 디지털 어시스턴트 하드웨어 추출 |
CN112732624A (zh) * | 2020-05-11 | 2021-04-30 | 苹果公司 | 数字助理硬件抽象 |
US11513667B2 (en) * | 2020-05-11 | 2022-11-29 | Apple Inc. | User interface for audio message |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
EP4162698A1 (en) * | 2020-06-08 | 2023-04-12 | Sonos Inc. | Control with distributed command processing |
CN111724784A (zh) * | 2020-06-28 | 2020-09-29 | 北京小米松果电子有限公司 | 设备控制方法及装置 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112165640B (zh) * | 2020-09-21 | 2023-04-14 | Vidaa美国公司 | 一种显示设备 |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US11657814B2 (en) * | 2020-10-08 | 2023-05-23 | Harman International Industries, Incorporated | Techniques for dynamic auditory phrase completion |
CN112507708B (zh) * | 2020-12-16 | 2023-09-15 | 青岛海尔科技有限公司 | 信息录入方法、装置、存储介质及电子装置 |
US11431891B2 (en) | 2021-01-31 | 2022-08-30 | Apple Inc. | User interfaces for wide angle video conference |
CN113205807B (zh) * | 2021-04-06 | 2023-08-29 | 珠海格力电器股份有限公司 | 一种语音设备的控制方法、装置、存储介质及语音设备 |
US11449188B1 (en) | 2021-05-15 | 2022-09-20 | Apple Inc. | Shared-content session user interfaces |
US11907605B2 (en) | 2021-05-15 | 2024-02-20 | Apple Inc. | Shared-content session user interfaces |
US11893214B2 (en) | 2021-05-15 | 2024-02-06 | Apple Inc. | Real-time communication user interface |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
US11960615B2 (en) | 2021-06-06 | 2024-04-16 | Apple Inc. | Methods and user interfaces for voice-based user profile management |
US11575758B1 (en) * | 2021-09-13 | 2023-02-07 | Amazon Technologies, Inc. | Session-based device grouping |
US11770600B2 (en) | 2021-09-24 | 2023-09-26 | Apple Inc. | Wide angle video conference |
WO2023056258A1 (en) | 2021-09-30 | 2023-04-06 | Sonos, Inc. | Conflict management for wake-word detection processes |
US11977816B1 (en) * | 2022-08-25 | 2024-05-07 | Amazon Technologies, Inc. | Time-based context for voice user interface |
US11886773B1 (en) | 2023-03-28 | 2024-01-30 | Volley Inc. | Systems and methods for a voice-controlled interactive application |
Family Cites Families (1219)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US999715A (en) | 1911-05-31 | 1911-08-01 | Hans Gundersen | Flying-machine. |
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPS63301998A (ja) | 1987-06-02 | 1988-12-08 | 日本電気株式会社 | 音声認識応答装置 |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
EP0548836B1 (en) | 1991-12-20 | 1997-06-11 | Matsushita Electric Industrial Co., Ltd. | A bass reproduction speaker apparatus |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
JPH0883091A (ja) | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5857172A (en) | 1995-07-31 | 1999-01-05 | Microsoft Corporation | Activation control of a speech recognizer through use of a pointing device |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
FR2739736B1 (fr) | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
EP1125277A4 (en) | 1998-10-02 | 2002-02-20 | Ibm | STRUCTURAL SKELETON FOR EFFICIENT VOICE NAVIGATION BY GENERICALLY HIERARCHICAL OBJECTS |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US6243676B1 (en) | 1998-12-23 | 2001-06-05 | Openwave Systems Inc. | Searching and retrieving multimedia information |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) * | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
US6219645B1 (en) | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
DE69935147T2 (de) | 1999-12-03 | 2007-10-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Verfahren zur gleichzeitigen Wiedergabe von Audio Signalen in zwei Telefonen |
KR20010054622A (ko) | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
WO2001053963A1 (en) | 2000-01-24 | 2001-07-26 | Zapmedia, Inc. | System and method for the distribution and sharing of media assets between media players devices |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
ATE372625T1 (de) | 2000-02-18 | 2007-09-15 | Bridgeco Ag | Mehrtor-brücke zur lieferung von netzwerkverbindungen |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU4219601A (en) | 2000-03-31 | 2001-10-15 | Classwave Wireless Inc. | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
US8165867B1 (en) | 2000-09-15 | 2012-04-24 | Fish Robert D | Methods for translating a device command |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020054685A1 (en) | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US20020072816A1 (en) | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6885989B2 (en) | 2001-04-02 | 2005-04-26 | International Business Machines Corporation | Method and system for collaborative speech recognition for small-area network |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
AU2002361767A1 (en) | 2001-12-17 | 2003-07-09 | Becomm Corporation | Method and system for synchronization of content rendering |
DE10163213A1 (de) | 2001-12-21 | 2003-07-10 | Philips Intellectual Property | Verfahren zum Betrieb eines Spracherkennungssystems |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
AU2003216319A1 (en) | 2002-02-20 | 2003-09-09 | Meshnetworks, Inc. | A system and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
WO2003093950A2 (en) | 2002-05-06 | 2003-11-13 | David Goldberg | Localized audio networks and associated digital accessories |
KR100966415B1 (ko) | 2002-05-09 | 2010-06-28 | 넷스트림스 엘엘씨 | 오디오 네트워크 분산 시스템 |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
DE60210177T2 (de) | 2002-08-14 | 2006-12-28 | Sony Deutschland Gmbh | Bandbreitenorientierte Neukonfigurierung von drahtlosen Ad-Hoc-Netzen |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
JP2004163590A (ja) | 2002-11-12 | 2004-06-10 | Denso Corp | 再生装置及びプログラム |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
CN100392723C (zh) | 2002-12-11 | 2008-06-04 | 索夫塔马克斯公司 | 在稳定性约束下使用独立分量分析的语音处理系统和方法 |
US7076428B2 (en) * | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
KR100668297B1 (ko) | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US6823050B2 (en) | 2003-02-13 | 2004-11-23 | International Business Machines Corporation | System and method for interfacing with a personal telephony recorder |
WO2004079929A2 (en) | 2003-03-03 | 2004-09-16 | America Online, Inc. | Source audio identifiers for digital communications |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
JP2004354721A (ja) | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
US8234395B2 (en) | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US9207905B2 (en) | 2003-07-28 | 2015-12-08 | Sonos, Inc. | Method and apparatus for providing synchrony group status information |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
KR20060093722A (ko) | 2003-10-24 | 2006-08-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 적응성 사운드 재생 |
DE602004021716D1 (de) | 2003-11-12 | 2009-08-06 | Honda Motor Co Ltd | Spracherkennungssystem |
US7705565B2 (en) | 2003-12-31 | 2010-04-27 | Motorola, Inc. | Method and system for wireless charging |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
EP1844392B1 (en) | 2005-01-21 | 2012-07-04 | Certicom Corp. | Elliptic curve random number generation |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
US8594320B2 (en) | 2005-04-19 | 2013-11-26 | (Epfl) Ecole Polytechnique Federale De Lausanne | Hybrid echo and noise suppression method and device in a multi-channel audio signal |
EP1715669A1 (en) | 2005-04-19 | 2006-10-25 | Ecole Polytechnique Federale De Lausanne (Epfl) | A method for removing echo in an audio signal |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US7720684B2 (en) | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
EP1912468B1 (en) | 2005-07-29 | 2013-08-14 | Panasonic Corporation | Loudspeaker device |
CN1909625A (zh) | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
KR20080043358A (ko) | 2005-08-19 | 2008-05-16 | 그레이스노트 아이엔씨 | 재생 디바이스의 동작을 제어하는 방법 및 시스템 |
US20070060054A1 (en) | 2005-09-15 | 2007-03-15 | Sony Ericsson Mobile Communications Ab | Wireless home communication system method and apparatus |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
WO2007034392A2 (en) | 2005-09-21 | 2007-03-29 | Koninklijke Philips Electronics N.V. | Ultrasound imaging system with voice activated controls using remotely positioned microphone |
EP1952619B1 (en) | 2005-11-07 | 2018-02-28 | Telecom Italia S.p.A. | Method for managing a conference call in a telephone network |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
US8135143B2 (en) | 2005-11-15 | 2012-03-13 | Yamaha Corporation | Remote conference apparatus and sound emitting/collecting apparatus |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
JP4422692B2 (ja) | 2006-03-03 | 2010-02-24 | 日本電信電話株式会社 | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
EP1999993A4 (en) | 2006-03-06 | 2011-03-30 | Gen Innovations Inc | POSITIONALLY SEQUENCED SPEAKER SYSTEM |
CN101449538A (zh) | 2006-04-04 | 2009-06-03 | 约翰逊控制技术公司 | 媒体文件的文本-语法改进 |
ATE423433T1 (de) | 2006-04-18 | 2009-03-15 | Harman Becker Automotive Sys | System und verfahren zur mehrkanal- echokompensation |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
ATE436151T1 (de) | 2006-05-10 | 2009-07-15 | Harman Becker Automotive Sys | Kompensation von mehrkanalechos durch dekorrelation |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US8041057B2 (en) | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP4984683B2 (ja) | 2006-06-29 | 2012-07-25 | ヤマハ株式会社 | 放収音装置 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US8189765B2 (en) | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
EP2050304B1 (en) | 2006-08-10 | 2018-10-24 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
EP2080272B1 (en) | 2006-10-17 | 2019-08-21 | D&M Holdings, Inc. | Unification of multimedia devices |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US8391501B2 (en) | 2006-12-13 | 2013-03-05 | Motorola Mobility Llc | Method and apparatus for mixing priority and non-priority audio signals |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
US7973857B2 (en) | 2006-12-27 | 2011-07-05 | Nokia Corporation | Teleconference group formation using context information |
US20090013255A1 (en) | 2006-12-30 | 2009-01-08 | Matthew John Yuschik | Method and System for Supporting Graphical User Interfaces |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
WO2008096414A1 (ja) | 2007-02-06 | 2008-08-14 | Pioneer Corporation | コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体 |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
JP4728982B2 (ja) | 2007-03-05 | 2011-07-20 | 株式会社東芝 | 利用者と対話する装置、方法およびプログラム |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8996379B2 (en) | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
BRPI0810285A2 (pt) | 2007-05-18 | 2014-12-30 | Shorthand Mobile Inc | "sistema e processo para comunicações aperfeiçoadas via sistemas de comunicação de pequena taxa de dados" |
US20080291916A1 (en) | 2007-05-22 | 2008-11-27 | Bo Xiong | Systems and methods for dynamic quality of service |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
US8323201B2 (en) | 2007-08-06 | 2012-12-04 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US20090046866A1 (en) | 2007-08-15 | 2009-02-19 | Fortemedia, Inc. | Apparatus capable of performing acoustic echo cancellation and a method thereof |
US8073125B2 (en) | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US7844724B2 (en) | 2007-10-24 | 2010-11-30 | Social Communications Company | Automated real-time data stream switching in a shared virtual area communication environment |
US8639214B1 (en) | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
CN103648071B (zh) | 2007-11-20 | 2018-11-02 | 松下知识产权经营株式会社 | 扬声器、视频设备、以及便携式信息处理装置 |
US9247346B2 (en) | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US20090153289A1 (en) | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
US8423893B2 (en) | 2008-01-07 | 2013-04-16 | Altec Lansing Australia Pty Limited | User interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
DE102008039330A1 (de) | 2008-01-31 | 2009-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8213598B2 (en) | 2008-02-26 | 2012-07-03 | Microsoft Corporation | Harmonic distortion residual echo suppression |
US8638908B2 (en) | 2008-02-28 | 2014-01-28 | Computer Products Introductions, Corp | Contextual conversation processing in telecommunication applications |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
WO2009120301A2 (en) | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US7516068B1 (en) | 2008-04-07 | 2009-04-07 | International Business Machines Corporation | Optimized collection of audio for speech recognition |
CN101562671A (zh) | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
WO2009133719A1 (ja) | 2008-04-30 | 2009-11-05 | 日本電気株式会社 | 音響モデル学習装置および音声認識装置 |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8831948B2 (en) | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8325909B2 (en) | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8781833B2 (en) | 2008-07-17 | 2014-07-15 | Nuance Communications, Inc. | Speech recognition semantic classification training |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
US8325938B2 (en) | 2008-08-12 | 2012-12-04 | Sony Corporation | Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
EP2351021B1 (en) | 2008-11-10 | 2017-09-06 | Google, Inc. | Determining an operating mode based on the orientation of a mobile device |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
US8095368B2 (en) * | 2008-12-04 | 2012-01-10 | At&T Intellectual Property I, L.P. | System and method for voice authentication over a computer network |
JP5347472B2 (ja) | 2008-12-12 | 2013-11-20 | ヤマハ株式会社 | 遠隔制御装置および遠隔制御システム |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US8351617B2 (en) | 2009-01-13 | 2013-01-08 | Fortemedia, Inc. | Method for phase mismatch calibration for an array microphone and phase calibration module for the same |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US20130283169A1 (en) | 2012-04-24 | 2013-10-24 | Social Communications Company | Voice-based virtual area navigation |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
US8243949B2 (en) | 2009-04-14 | 2012-08-14 | Plantronics, Inc. | Network addressible loudspeaker and audio play |
CN102804747B (zh) | 2009-04-15 | 2014-04-02 | 弗兰霍菲尔运输应用研究公司 | 多通道回波对消器 |
US8483398B2 (en) | 2009-04-30 | 2013-07-09 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses |
JP5550456B2 (ja) | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US20100332236A1 (en) | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
US8478982B2 (en) | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
JP5440053B2 (ja) | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
WO2011033887A1 (ja) | 2009-09-17 | 2011-03-24 | 株式会社日立メディコ | 超音波探触子及び超音波撮像装置 |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
KR101301535B1 (ko) | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US20110145581A1 (en) | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
NO332437B1 (no) | 2010-01-18 | 2012-09-17 | Cisco Systems Int Sarl | Apparat og fremgangsmate for a supprimere et akustisk ekko |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
JP5572445B2 (ja) | 2010-04-30 | 2014-08-13 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
EP3418917B1 (en) | 2010-05-04 | 2022-08-17 | Apple Inc. | Methods and systems for synchronizing media |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
EP2986034B1 (en) | 2010-05-06 | 2017-05-31 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US20110289506A1 (en) | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) * | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US9349368B1 (en) | 2010-08-05 | 2016-05-24 | Google Inc. | Generating an audio notification based on detection of a triggering event |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US9237383B2 (en) | 2010-08-27 | 2016-01-12 | Intel Corporation | Peer to peer streaming of DVR buffered program data |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
CN103038816B (zh) | 2010-10-01 | 2015-02-25 | 三菱电机株式会社 | 声音识别装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
JP6363324B2 (ja) | 2010-10-08 | 2018-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
US20120099594A1 (en) | 2010-10-22 | 2012-04-26 | Phorus Llc | Media distribution architecture |
EP2444967A1 (en) | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
EP2456199A3 (en) | 2010-11-22 | 2014-07-16 | DDS Newco Inc. | Method and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
US9508358B2 (en) | 2010-12-15 | 2016-11-29 | Koninklijke Philips N.V. | Noise reduction system with remote noise detector |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
KR20120100514A (ko) | 2011-03-04 | 2012-09-12 | 삼성전자주식회사 | 디바이스 그룹핑 방법 및 이를 적용한 서버 |
US8804977B2 (en) | 2011-03-18 | 2014-08-12 | Dolby Laboratories Licensing Corporation | Nonlinear reference signal processing for echo suppression |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
JPWO2012127831A1 (ja) * | 2011-03-22 | 2014-07-24 | パナソニック株式会社 | 光情報装置及びそのギャップ制御方法 |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
KR20120128542A (ko) | 2011-05-11 | 2012-11-27 | 삼성전자주식회사 | 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치 |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
US8320577B1 (en) | 2011-05-20 | 2012-11-27 | Google Inc. | Method and apparatus for multi-channel audio processing using single-channel components |
US9893902B2 (en) | 2011-05-31 | 2018-02-13 | Google Llc | Muting participants in a communication session |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9264553B2 (en) | 2011-06-11 | 2016-02-16 | Clearone Communications, Inc. | Methods and apparatuses for echo cancelation with beamforming microphone arrays |
US9762967B2 (en) | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US20130018659A1 (en) | 2011-07-12 | 2013-01-17 | Google Inc. | Systems and Methods for Speech Command Processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
EP2555598A1 (en) | 2011-08-05 | 2013-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and device for generating optical radiation by means of electrically operated pulsed discharges |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
US20130039527A1 (en) | 2011-08-08 | 2013-02-14 | Bang & Olufsen A/S | Modular, configurable speaker and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US8750677B2 (en) | 2011-08-23 | 2014-06-10 | Microsoft Corporation | Method for transferring media playback from a different device |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8996381B2 (en) | 2011-09-27 | 2015-03-31 | Sensory, Incorporated | Background speech recognition assistant |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9729631B2 (en) | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US8971546B2 (en) | 2011-10-14 | 2015-03-03 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to control audio playback devices |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
GB201118784D0 (en) | 2011-10-31 | 2011-12-14 | Omnifone Ltd | Djml |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
US20150237406A1 (en) * | 2011-12-13 | 2015-08-20 | Claudio J. Ochoa | Channel navigation in connected media devices through keyword selection |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
WO2013115748A1 (en) | 2012-01-30 | 2013-08-08 | Echostar Ukraine, L.L.C. | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
EP2632141B1 (en) | 2012-02-22 | 2014-10-15 | Dialog Semiconductor B.V. | Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9198204B2 (en) | 2012-04-11 | 2015-11-24 | Google Inc. | Apparatus and method for seamless commissioning of wireless devices |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
CN104395957B (zh) | 2012-04-30 | 2018-02-13 | 创新科技有限公司 | 一种通用可重构回声消除系统 |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US20130294611A1 (en) | 2012-05-04 | 2013-11-07 | Sony Computer Entertainment Inc. | Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
CA2874899C (en) | 2012-06-01 | 2017-07-11 | Blackberry Limited | Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems |
US9997069B2 (en) | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9183845B1 (en) | 2012-06-12 | 2015-11-10 | Amazon Technologies, Inc. | Adjusting audio signals based on a specific frequency range associated with environmental noise characteristics |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9031255B2 (en) | 2012-06-15 | 2015-05-12 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to provide low-latency audio |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9106192B2 (en) * | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
KR101972955B1 (ko) * | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
DE112013003843B4 (de) | 2012-08-03 | 2022-03-31 | Semiconductor Energy Laboratory Co., Ltd. | Lichtemittierendes Element, lichtemittierende Vorrichtung, elektronische Vorrichtung und Beleuchtungsvorrichtung |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
EP2701145B1 (en) | 2012-08-24 | 2016-10-12 | Retune DSP ApS | Noise estimation for use with noise reduction and echo cancellation in personal communication |
US9532153B2 (en) | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US8965033B2 (en) | 2012-08-31 | 2015-02-24 | Sonos, Inc. | Acoustic optimization |
US9088336B2 (en) | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US8725125B2 (en) | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
EP2759147A1 (en) | 2012-10-02 | 2014-07-30 | MH Acoustics, LLC | Earphones having configurable microphone arrays |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
CN102902253B (zh) | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制系统 |
US20140108010A1 (en) | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
ES2886325T3 (es) | 2012-10-15 | 2021-12-17 | Msi Dfat Llc | Pruebas acústicas de campo directo en un recinto semirreverberante |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
WO2014064531A1 (en) | 2012-10-22 | 2014-05-01 | Spotify Ab | Systems and methods for pre-fetching media content |
US20150228274A1 (en) | 2012-10-26 | 2015-08-13 | Nokia Technologies Oy | Multi-Device Speech Recognition |
KR20140054643A (ko) * | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381001B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US8761349B2 (en) | 2012-10-31 | 2014-06-24 | Citrix Systems, Inc. | Systems and methods of monitoring performance of acoustic echo cancellation |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
CN102999161B (zh) | 2012-11-13 | 2016-03-02 | 科大讯飞股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US9070367B1 (en) | 2012-11-26 | 2015-06-30 | Amazon Technologies, Inc. | Local speech recognition of frequent utterances |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
US20140149118A1 (en) | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9124966B2 (en) | 2012-11-28 | 2015-09-01 | Qualcomm Incorporated | Image generation for collaborative sound systems |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2014088588A1 (en) | 2012-12-07 | 2014-06-12 | Empire Technology Development Llc | Personal assistant context building |
US20140161263A1 (en) | 2012-12-10 | 2014-06-12 | Microsoft Corporation | Facilitating recognition of real-time content |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9607046B2 (en) | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
KR102102246B1 (ko) | 2012-12-18 | 2020-04-22 | 삼성전자주식회사 | 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치 |
US9047857B1 (en) | 2012-12-19 | 2015-06-02 | Rawles Llc | Voice commands for transitioning between device states |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
US20150338917A1 (en) | 2012-12-26 | 2015-11-26 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
US9620115B2 (en) | 2013-01-03 | 2017-04-11 | Telenav, Inc. | Content delivery system with barge-in mechanism and method of operation thereof |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
US9318125B2 (en) | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
BR112015018905B1 (pt) | 2013-02-07 | 2022-02-22 | Apple Inc | Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
TWI593294B (zh) * | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9237384B2 (en) | 2013-02-14 | 2016-01-12 | Sonos, Inc. | Automatic configuration of household playback devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) * | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
US9195432B2 (en) | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
CN105308681B (zh) | 2013-02-26 | 2019-02-12 | 皇家飞利浦有限公司 | 用于生成语音信号的方法和装置 |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音系统与相关方法 |
US10395651B2 (en) | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
JP6326071B2 (ja) | 2013-03-07 | 2018-05-16 | アップル インコーポレイテッド | 部屋およびプログラム反応型ラウドスピーカシステム |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
JP6211677B2 (ja) | 2013-03-11 | 2017-10-11 | アップル インコーポレイテッド | ラウドスピーカの指向性範囲にまたがる音色の一定性 |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
KR20140111859A (ko) | 2013-03-12 | 2014-09-22 | 삼성전자주식회사 | 콘텐트 공유 방법 및 이를 위한 디바이스 |
EP3709293A1 (en) | 2013-03-12 | 2020-09-16 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
WO2014165032A1 (en) | 2013-03-12 | 2014-10-09 | Aawtend, Inc. | Integrated sensor-array processor |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9060052B2 (en) | 2013-03-13 | 2015-06-16 | Accusonus S.A. | Single channel, binaural and multi-channel dereverberation |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
JP6084750B2 (ja) | 2013-03-14 | 2017-02-22 | アップル インコーポレイテッド | スピーカー及び携帯リスニング装置を用いた室内の適応等化 |
JP6013951B2 (ja) | 2013-03-14 | 2016-10-25 | 本田技研工業株式会社 | 環境音検索装置、環境音検索方法 |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
US9854081B2 (en) | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
US9201865B2 (en) * | 2013-03-15 | 2015-12-01 | Bao Tran | Automated assistance for user request that determines semantics by domain, task, and parameter |
US20140278933A1 (en) | 2013-03-15 | 2014-09-18 | F. Gavin McMillan | Methods and apparatus to measure audience engagement with media |
EP3036657A4 (en) | 2013-03-15 | 2017-06-21 | Spotify AB | Systems, methods, and computer readable medium for generating playlists |
WO2014149050A1 (en) | 2013-03-21 | 2014-09-25 | Nuance Communications, Inc. | System and method for identifying suboptimal microphone performance |
KR102173936B1 (ko) | 2013-03-26 | 2020-11-04 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기, 및 조명 장치 |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
WO2014161091A1 (en) | 2013-04-04 | 2014-10-09 | Rand James S | Unified communications system and method |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
WO2014172299A1 (en) | 2013-04-15 | 2014-10-23 | Chacha Search, Inc. | Method and system of increasing user interaction |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
US9390716B2 (en) | 2013-04-19 | 2016-07-12 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
US9936290B2 (en) | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
CN105122353B (zh) | 2013-05-20 | 2019-07-09 | 英特尔公司 | 用于语音识别的计算装置和用于计算装置上的语音识别的方法 |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
US20140358535A1 (en) | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
US20140365225A1 (en) | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9654073B2 (en) | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
TWI545979B (zh) | 2013-06-09 | 2016-08-11 | 蘋果公司 | 藍芽警報通知服務 |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US20140368737A1 (en) | 2013-06-17 | 2014-12-18 | Spotify Ab | System and method for playing media during navigation between media streams |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
CN105340011B (zh) | 2013-06-28 | 2020-08-18 | 哈曼国际工业有限公司 | 链接设备的无线控制 |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
CN110096253B (zh) | 2013-07-11 | 2022-08-30 | 英特尔公司 | 利用相同的音频输入的设备唤醒和说话者验证 |
DE102014109122A1 (de) | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
WO2015009748A1 (en) | 2013-07-15 | 2015-01-22 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9445196B2 (en) | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
US9772994B2 (en) | 2013-07-25 | 2017-09-26 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
US9431014B2 (en) | 2013-07-25 | 2016-08-30 | Haier Us Appliance Solutions, Inc. | Intelligent placement of appliance response to voice command |
US10186262B2 (en) | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
WO2015013835A1 (en) | 2013-07-31 | 2015-02-05 | Merck Sharp & Dohme Corp. | Piperazine derivatives as hiv protease inhibitors |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US9418651B2 (en) | 2013-07-31 | 2016-08-16 | Google Technology Holdings LLC | Method and apparatus for mitigating false accepts of trigger phrases |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
EP3036594B1 (en) | 2013-08-21 | 2021-05-26 | Ademco Inc. | Devices and methods for interacting with an hvac controller |
US9940927B2 (en) | 2013-08-23 | 2018-04-10 | Nuance Communications, Inc. | Multiple pass automatic speech recognition methods and apparatus |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
US9514747B1 (en) | 2013-08-28 | 2016-12-06 | Amazon Technologies, Inc. | Reducing speech recognition latency |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
EP2879345A4 (en) | 2013-08-30 | 2015-08-19 | Huawei Tech Co Ltd | METHOD FOR MULTIPLE DEVICES FOR THE COOPERATIVE REPRODUCTION OF MULTIMEDIA FILES AND RELATED DEVICE AND SYSTEM |
US10163435B2 (en) | 2013-09-11 | 2018-12-25 | Denso Corporation | Voice output control device, voice output control method, and recording medium |
US9672812B1 (en) | 2013-09-18 | 2017-06-06 | Amazon Technologies, Inc. | Qualifying trigger expressions in speech-based systems |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
CN103546616A (zh) | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
KR102114219B1 (ko) | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
WO2015060867A1 (en) | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
DK2869599T3 (da) | 2013-11-05 | 2020-12-14 | Oticon As | Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US10055190B2 (en) | 2013-12-16 | 2018-08-21 | Amazon Technologies, Inc. | Attribute-based audio channel arbitration |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
US9378651B2 (en) | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US10224056B1 (en) * | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
US20150221307A1 (en) | 2013-12-20 | 2015-08-06 | Saurin Shah | Transition from low power always listening mode to high power speech recognition mode |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9443516B2 (en) | 2014-01-09 | 2016-09-13 | Honeywell International Inc. | Far-field speech recognition systems and methods |
WO2015105788A1 (en) | 2014-01-10 | 2015-07-16 | Dolby Laboratories Licensing Corporation | Calibration of virtual height speakers using programmable portable devices |
US9300647B2 (en) | 2014-01-15 | 2016-03-29 | Sonos, Inc. | Software application and zones |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
US10162593B2 (en) | 2014-01-22 | 2018-12-25 | Apple Inc. | Coordinated hand-off of audio data transmission |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9652532B2 (en) | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
WO2015118426A2 (en) | 2014-02-06 | 2015-08-13 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
TWI658597B (zh) | 2014-02-07 | 2019-05-01 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
US9408008B2 (en) | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
EP3115905A4 (en) | 2014-03-03 | 2017-10-25 | Sony Corporation | Information processing apparatus, information processing method, and program |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US10514747B2 (en) | 2014-03-24 | 2019-12-24 | Silicon Laboratories Inc. | Low-power communication apparatus with wakeup detection and associated methods |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9431021B1 (en) | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9916839B1 (en) * | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
KR102146462B1 (ko) | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
US8874448B1 (en) | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
CN104978965B (zh) | 2014-04-07 | 2019-04-26 | 三星电子株式会社 | 电子装置及利用电子装置和服务器的语音识别执行方法 |
US9560437B2 (en) | 2014-04-08 | 2017-01-31 | Doppler Labs, Inc. | Time heuristic audio control |
US9510094B2 (en) | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
EP3146796B1 (en) | 2014-05-23 | 2021-10-27 | Samsung Electronics Co., Ltd. | Method and apparatus for providing notification |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
TWI777568B (zh) | 2014-05-30 | 2022-09-11 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US20150355818A1 (en) | 2014-06-04 | 2015-12-10 | Sonos, Inc. | Continuous Playback Queue |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9766702B2 (en) | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US20150373100A1 (en) | 2014-06-19 | 2015-12-24 | Pavel KRAVETS | Context sharing between different clients |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
JP2016009193A (ja) * | 2014-06-23 | 2016-01-18 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | ユーザ適合音声認識 |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9335819B1 (en) | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9368105B1 (en) | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9398392B2 (en) | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9779307B2 (en) | 2014-07-07 | 2017-10-03 | Google Inc. | Method and system for non-causal zone search in video monitoring |
US11330100B2 (en) | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US9467737B2 (en) | 2014-07-14 | 2016-10-11 | Sonos, Inc. | Zone group control |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9671997B2 (en) | 2014-07-23 | 2017-06-06 | Sonos, Inc. | Zone grouping |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) * | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
JP6118838B2 (ja) | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
KR20160026317A (ko) | 2014-08-29 | 2016-03-09 | 삼성전자주식회사 | 음성 녹음 방법 및 장치 |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9354687B2 (en) | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
JP6624368B2 (ja) | 2014-09-30 | 2019-12-25 | パナソニックIpマネジメント株式会社 | 接客モニタリングシステム及び接客モニタリング方法 |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
KR102342623B1 (ko) * | 2014-10-01 | 2021-12-22 | 엑스브레인, 인크. | 음성 및 연결 플랫폼 |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
KR102287943B1 (ko) | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9576575B2 (en) * | 2014-10-27 | 2017-02-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Providing voice recognition shortcuts based on user verbal input |
US9560409B2 (en) | 2014-10-30 | 2017-01-31 | Verizon Patent And Licensing Inc. | Media service personalization systems and methods |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10368121B2 (en) | 2014-11-07 | 2019-07-30 | Roku, Inc. | System and method for collecting data |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
JP2016095383A (ja) * | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
WO2016082046A1 (en) | 2014-11-28 | 2016-06-02 | Audera Acoustics Inc. | High displacement acoustic transducer systems |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
CN111427534B (zh) | 2014-12-11 | 2023-07-25 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) * | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104575504A (zh) * | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN104635539A (zh) * | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其系统 |
WO2016112113A1 (en) | 2015-01-07 | 2016-07-14 | Knowles Electronics, Llc | Utilizing digital microphones for low power keyword detection and noise suppression |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
KR102351366B1 (ko) | 2015-01-26 | 2022-01-14 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN104572009B (zh) | 2015-01-28 | 2018-01-09 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
CN104735589B (zh) * | 2015-01-30 | 2018-01-23 | 广东欧珀移动通信有限公司 | 一种基于gps的智能音箱分组的音量调节系统和方法 |
US9633661B1 (en) | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
EP3264258A4 (en) | 2015-02-27 | 2018-08-15 | Sony Corporation | Information processing device, information processing method, and program |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
US9678707B2 (en) | 2015-04-10 | 2017-06-13 | Sonos, Inc. | Identification of audio content facilitated by playback device |
US10198242B2 (en) | 2015-04-14 | 2019-02-05 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US9472196B1 (en) * | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
CN104853405B (zh) | 2015-05-12 | 2018-11-30 | 浙江生辉照明有限公司 | 智能联网方法及智能设备 |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
US9753922B2 (en) | 2015-05-19 | 2017-09-05 | Researchgate Gmbh | Enhanced online user-interaction tracking |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
TWI757234B (zh) | 2015-05-21 | 2022-03-11 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
WO2016185321A1 (en) | 2015-05-21 | 2016-11-24 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, display device, electronic device, and lighting device |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
JP2016218852A (ja) * | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US9584935B2 (en) | 2015-05-29 | 2017-02-28 | Sound United, Llc. | Multi-zone media system and method for providing multi-zone media |
US10657949B2 (en) | 2015-05-29 | 2020-05-19 | Sound United, LLC | System and method for integrating a home media system and other home systems |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
US10249205B2 (en) | 2015-06-08 | 2019-04-02 | Novel Effect, Inc. | System and method for integrating special effects with a text source |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
CN107710441B (zh) | 2015-06-17 | 2020-10-16 | 株式会社半导体能源研究所 | 铱配合物、发光元件、显示装置、电子设备以及照明装置 |
US20160373909A1 (en) | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
JP6739907B2 (ja) | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US10025447B1 (en) | 2015-06-19 | 2018-07-17 | Amazon Technologies, Inc. | Multi-device user interface |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
EP3317878B1 (de) | 2015-06-30 | 2020-03-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Verfahren und vorrichtung zum erzeugen einer datenbank |
KR20240035638A (ko) | 2015-07-08 | 2024-03-15 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 장치, 및 조명 장치 |
US10304440B1 (en) | 2015-07-10 | 2019-05-28 | Amazon Technologies, Inc. | Keyword spotting using multi-task configuration |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
KR102655709B1 (ko) | 2015-07-21 | 2024-04-05 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
CN107851727B (zh) | 2015-07-23 | 2020-01-21 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子装置及照明装置 |
WO2017015759A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized playback of streamed audio content by multiple internet-capable portable devices |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US9691361B2 (en) | 2015-08-03 | 2017-06-27 | International Business Machines Corporation | Adjusting presentation of content on a display |
KR102402512B1 (ko) | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制系统及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
KR102386854B1 (ko) | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2017039632A1 (en) | 2015-08-31 | 2017-03-09 | Nunntawi Dynamics Llc | Passive self-localization of microphone arrays |
US10031719B2 (en) | 2015-09-02 | 2018-07-24 | Harman International Industries, Incorporated | Audio system with multi-screen application |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
US10026399B2 (en) | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
KR20170032114A (ko) * | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 음성 인식 장치 및 그의 제어방법 |
KR20170032096A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체 |
US10706873B2 (en) | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
US10289734B2 (en) | 2015-09-18 | 2019-05-14 | Samsung Electronics Co., Ltd. | Entity-type search system |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102420450B1 (ko) | 2015-09-23 | 2022-07-14 | 삼성전자주식회사 | 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체 |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
US10186276B2 (en) | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
CN105162886B (zh) | 2015-09-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种声音控制方法及装置 |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US10334306B2 (en) | 2015-09-28 | 2019-06-25 | Google Llc | Time-synchronized, multizone medial streaming |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US10241754B1 (en) | 2015-09-29 | 2019-03-26 | Amazon Technologies, Inc. | Systems and methods for providing supplemental information with a response to a command |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
CN111354874B (zh) | 2015-09-30 | 2023-07-04 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备及照明装置 |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
US9754580B2 (en) | 2015-10-12 | 2017-09-05 | Technologies For Voice Interface | System and method for extracting and using prosody features |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
CN107925818B (zh) | 2015-10-15 | 2020-10-16 | 华为技术有限公司 | 用于声音处理节点装置的声音处理节点 |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
JP6463710B2 (ja) | 2015-10-16 | 2019-02-06 | グーグル エルエルシー | ホットワード認識 |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105427861B (zh) | 2015-11-03 | 2019-02-15 | 胡旻波 | 智能家居协同麦克风语音控制的系统及其控制方法 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US20170140750A1 (en) | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
CN105472191B (zh) | 2015-11-18 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
DE112015007147T5 (de) | 2015-11-25 | 2018-08-09 | Mitsubishi Electric Corporation | Sprachdialogvorrichtung und Sprachdialogverfahren |
US10040423B2 (en) | 2015-11-27 | 2018-08-07 | Bragi GmbH | Vehicle with wearable for identifying one or more vehicle occupants |
US9484030B1 (en) | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9699597B2 (en) | 2015-12-07 | 2017-07-04 | Google Inc. | Wireless signal forwarding |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
CN105679318A (zh) | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示系统和空调 |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
CN105632486B (zh) | 2015-12-23 | 2019-12-17 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US9992642B1 (en) | 2015-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated messaging |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
CN105741838B (zh) | 2016-01-20 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN105700364A (zh) * | 2016-01-20 | 2016-06-22 | 宇龙计算机通信科技(深圳)有限公司 | 一种智能家居控制方法及可穿戴设备 |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
KR20170091913A (ko) | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
WO2017138934A1 (en) | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9858927B2 (en) | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US9898250B1 (en) | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9826306B2 (en) | 2016-02-22 | 2017-11-21 | Sonos, Inc. | Default playback device designation |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) * | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US10133612B2 (en) * | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US10332508B1 (en) | 2016-03-31 | 2019-06-25 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
US9952827B2 (en) | 2016-04-13 | 2018-04-24 | Comcast Cable Communications, Llc | Dynamic adjustment of equalization settings of audio components via a sound device profile |
JP6686226B2 (ja) | 2016-04-18 | 2020-04-22 | グーグル エルエルシー | 適切なエージェントの自動化アシスタント呼び出し |
US10318236B1 (en) | 2016-05-05 | 2019-06-11 | Amazon Technologies, Inc. | Refining media playback |
US10447748B2 (en) | 2016-05-12 | 2019-10-15 | Apple Inc. | Sharing media information between applications on client devices |
US20170329397A1 (en) | 2016-05-12 | 2017-11-16 | Rovi Guides, Inc. | Systems and methods for navigating a media guidance application using gaze control |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
WO2017197312A2 (en) | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing speech from distributed microphones |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10079027B2 (en) * | 2016-06-03 | 2018-09-18 | Nxp B.V. | Sound signal detector |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
DK179034B1 (en) | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
US20170364371A1 (en) | 2016-06-15 | 2017-12-21 | Microsoft Technology Licensing, Llc | Context-Dependent Digital Action-Assistance Tool |
ES2806204T3 (es) | 2016-06-15 | 2021-02-16 | Cerence Operating Co | Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
KR20170142001A (ko) | 2016-06-16 | 2017-12-27 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9749738B1 (en) | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
US9875740B1 (en) | 2016-06-20 | 2018-01-23 | A9.Com, Inc. | Using voice information to influence importance of search result categories |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US10091545B1 (en) | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
KR102471499B1 (ko) | 2016-07-05 | 2022-11-28 | 삼성전자주식회사 | 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
WO2018013564A1 (en) | 2016-07-12 | 2018-01-18 | Bose Corporation | Combining gesture and voice user interfaces |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9979680B2 (en) | 2016-07-21 | 2018-05-22 | Fujitsu Limited | Smart notification scheduling and modality selection |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
CN106027806A (zh) * | 2016-07-25 | 2016-10-12 | 乐视控股(北京)有限公司 | 智能家居设备的控制方法及移动终端 |
US20180033429A1 (en) * | 2016-07-26 | 2018-02-01 | Ford Global Technologies, Llc | Extendable vehicle system |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10026403B2 (en) | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US10326869B2 (en) | 2016-08-19 | 2019-06-18 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
CN107767863B (zh) | 2016-08-22 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
US20180061396A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10360910B2 (en) | 2016-08-29 | 2019-07-23 | Garmin Switzerland Gmbh | Automatic speech recognition (ASR) utilizing GPS and sensor data |
US10461953B2 (en) * | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
CN109891434B (zh) | 2016-09-06 | 2020-10-30 | 渊慧科技有限公司 | 使用神经网络生成音频 |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9959861B2 (en) | 2016-09-30 | 2018-05-01 | Robert Bosch Gmbh | System and method for speech recognition |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10283138B2 (en) * | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
WO2018067350A1 (en) | 2016-10-03 | 2018-04-12 | Google Llc. | Processing voice commands based on device topology |
WO2018067402A1 (en) | 2016-10-03 | 2018-04-12 | Google Inc. | Selection of computational agent for task performance |
CN107919116B (zh) | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
JP6616048B1 (ja) | 2016-11-07 | 2019-12-04 | グーグル エルエルシー | 記録されたメディアホットワードトリガ抑制 |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
US10382806B2 (en) | 2016-11-14 | 2019-08-13 | DISH Technologies L.L.C. | Apparatus, systems and methods for controlling presentation of content using a multi-media table |
US10170110B2 (en) | 2016-11-17 | 2019-01-01 | Robert Bosch Gmbh | System and method for ranking of hybrid speech recognition results with neural networks |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10079015B1 (en) | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10134396B2 (en) | 2016-12-07 | 2018-11-20 | Google Llc | Preventing of audio attacks |
US10255032B2 (en) | 2016-12-13 | 2019-04-09 | EVA Automation, Inc. | Wireless coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) * | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制系统及控制方法 |
US10339957B1 (en) | 2016-12-20 | 2019-07-02 | Amazon Technologies, Inc. | Ending communications session based on presence data |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
DE112017006486T5 (de) | 2016-12-23 | 2019-09-12 | Synaptics Incorporated | Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen |
CN106910500B (zh) | 2016-12-23 | 2020-04-17 | 北京小鸟听听科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
US10546578B2 (en) | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10580405B1 (en) | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
US10593328B1 (en) | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
US10186266B1 (en) | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10831366B2 (en) | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
US10224031B2 (en) | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
KR102412202B1 (ko) | 2017-01-03 | 2022-06-27 | 삼성전자주식회사 | 냉장고 및 이의 정보 표시 방법 |
US10248613B2 (en) | 2017-01-10 | 2019-04-02 | Qualcomm Incorporated | Data bus activation in an electronic device |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR20180085931A (ko) | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR20180090586A (ko) | 2017-02-03 | 2018-08-13 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
CA3155434A1 (en) | 2017-02-07 | 2018-08-16 | Lutron Technology Company Llc | Audio-based load control system |
US10762891B2 (en) | 2017-02-10 | 2020-09-01 | Synaptics Incorporated | Binary and multi-class classification systems and methods using connectionist temporal classification |
CN108446281B (zh) | 2017-02-13 | 2021-03-12 | 北京嘀嘀无限科技发展有限公司 | 确定用户亲密度的方法、装置及存储介质 |
US20180293221A1 (en) | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US10431217B2 (en) * | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
CN106921560B (zh) | 2017-02-28 | 2020-06-02 | 北京小米移动软件有限公司 | 语音通信方法、装置及系统 |
US10706843B1 (en) | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10089981B1 (en) | 2017-03-09 | 2018-10-02 | Amazon Technologies, Inc. | Messaging account disambiguation |
US10540961B2 (en) | 2017-03-13 | 2020-01-21 | Baidu Usa Llc | Convolutional recurrent neural networks for small-footprint keyword spotting |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10600406B1 (en) | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
JP6791356B2 (ja) | 2017-03-24 | 2020-11-25 | ヤマハ株式会社 | 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10643609B1 (en) | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
US10825471B2 (en) | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US10748531B2 (en) | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
CN107122158A (zh) | 2017-04-14 | 2017-09-01 | 北京小米移动软件有限公司 | 播放信息提示音频的方法及装置、电子设备 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102392297B1 (ko) | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10311870B2 (en) | 2017-05-10 | 2019-06-04 | Ecobee Inc. | Computerized device with voice command input capability |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10531196B2 (en) | 2017-06-02 | 2020-01-07 | Apple Inc. | Spatially ducking audio produced through a beamforming loudspeaker array |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10403299B2 (en) | 2017-06-02 | 2019-09-03 | Apple Inc. | Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10410635B2 (en) | 2017-06-09 | 2019-09-10 | Soundhound, Inc. | Dual mode speech recognition |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US10028069B1 (en) | 2017-06-22 | 2018-07-17 | Sonos, Inc. | Immersive audio in a media playback system |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US11189273B2 (en) | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
US11264019B2 (en) | 2017-06-30 | 2022-03-01 | Google Llc | Methods, systems, and media for voice-based call operations |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10304475B1 (en) | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10553235B2 (en) | 2017-08-28 | 2020-02-04 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US20190066710A1 (en) | 2017-08-28 | 2019-02-28 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10515625B1 (en) | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US11361763B1 (en) | 2017-09-01 | 2022-06-14 | Amazon Technologies, Inc. | Detecting system-directed speech |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
US10847149B1 (en) | 2017-09-01 | 2020-11-24 | Amazon Technologies, Inc. | Speech-based attention span for voice user interface |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
KR102338376B1 (ko) | 2017-09-13 | 2021-12-13 | 삼성전자주식회사 | 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법 |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
US10586534B1 (en) | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
KR102421255B1 (ko) | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR102543693B1 (ko) | 2017-10-17 | 2023-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
CN107808670B (zh) | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107832837B (zh) | 2017-11-28 | 2021-09-28 | 南京大学 | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10546593B2 (en) | 2017-12-04 | 2020-01-28 | Apple Inc. | Deep learning driven multi-channel filtering for speech enhancement |
US10445365B2 (en) | 2017-12-04 | 2019-10-15 | Amazon Technologies, Inc. | Streaming radio with personalized content integration |
US10777189B1 (en) | 2017-12-05 | 2020-09-15 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10847137B1 (en) | 2017-12-12 | 2020-11-24 | Amazon Technologies, Inc. | Trigger word detection using neural network waveform processing |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10663313B2 (en) | 2017-12-15 | 2020-05-26 | Google Llc | Providing traffic warnings to a user based on return journey |
US10540971B2 (en) | 2017-12-15 | 2020-01-21 | Blue Jeans Network, Inc. | System and methods for in-meeting group assistance using a virtual assistant |
US11409816B2 (en) | 2017-12-19 | 2022-08-09 | Motorola Solutions, Inc. | Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information |
DE112018002857T5 (de) | 2017-12-26 | 2020-02-27 | Robert Bosch Gmbh | Sprecheridentifikation mit ultrakurzen Sprachsegmenten für Fern- und Nahfeld-Sprachunterstützungsanwendungen |
US10504507B2 (en) | 2017-12-28 | 2019-12-10 | Syntiant | Always-on keyword detector |
US10614811B2 (en) | 2017-12-29 | 2020-04-07 | Intel Corporation | Hierarchical speech recognition resolution |
WO2019128550A1 (en) | 2017-12-31 | 2019-07-04 | Midea Group Co., Ltd. | Method and system for controlling home assistant devices |
WO2019128541A1 (en) | 2017-12-31 | 2019-07-04 | Midea Group Co., Ltd. | Method and system for controlling multiple home devices |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US10795332B2 (en) | 2018-01-16 | 2020-10-06 | Resilience Magnum IP, LLC | Facilitating automating home control |
CN108198548B (zh) | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其系统 |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US11024307B2 (en) | 2018-02-08 | 2021-06-01 | Computime Ltd. | Method and apparatus to provide comprehensive smart assistant services |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US11127405B1 (en) | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10491962B2 (en) | 2018-03-14 | 2019-11-26 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications |
US10749828B2 (en) | 2018-03-14 | 2020-08-18 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10685669B1 (en) | 2018-03-20 | 2020-06-16 | Amazon Technologies, Inc. | Device selection from audio data |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
CN111868824A (zh) | 2018-04-05 | 2020-10-30 | 辛纳普蒂克斯公司 | 智能设备的情境感知控制 |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10720166B2 (en) | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
CN108520741B (zh) | 2018-04-12 | 2021-05-04 | 科大讯飞股份有限公司 | 一种耳语音恢复方法、装置、设备及可读存储介质 |
US10679615B2 (en) | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
CN108538305A (zh) | 2018-04-20 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
EP3564949A1 (en) | 2018-04-23 | 2019-11-06 | Spotify AB | Activation trigger processing |
US10803864B2 (en) | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11308947B2 (en) | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
JP2019204025A (ja) | 2018-05-24 | 2019-11-28 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、及びプログラム |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10777195B2 (en) | 2018-05-31 | 2020-09-15 | International Business Machines Corporation | Wake command nullification for digital assistance and voice recognition technologies |
US20190371324A1 (en) | 2018-06-01 | 2019-12-05 | Apple Inc. | Suppression of voice response by device rendering trigger audio |
CN112272819B (zh) | 2018-06-05 | 2024-04-26 | 三星电子株式会社 | 被动唤醒用户交互设备的方法和系统 |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
NL2021308B1 (en) | 2018-07-16 | 2020-01-24 | Hazelebach & Van Der Ven Holding B V | Methods for a voice processing system |
JP7000268B2 (ja) | 2018-07-18 | 2022-01-19 | 株式会社東芝 | 情報処理装置、情報処理方法、およびプログラム |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
GB2576016B (en) | 2018-08-01 | 2021-06-23 | Arm Ip Ltd | Voice assistant devices |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
KR102225984B1 (ko) | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US20200090647A1 (en) | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10650807B2 (en) | 2018-09-18 | 2020-05-12 | Intel Corporation | Method and system of neural network keyphrase detection |
KR20200034430A (ko) | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US10861444B2 (en) | 2018-09-24 | 2020-12-08 | Rovi Guides, Inc. | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US10950249B2 (en) | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
KR102606789B1 (ko) | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
US20200110571A1 (en) | 2018-10-05 | 2020-04-09 | Sonos, Inc. | Systems and methods for media content selection |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10943599B2 (en) | 2018-10-26 | 2021-03-09 | Spotify Ab | Audio cancellation for voice recognition |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
KR102570384B1 (ko) | 2018-12-27 | 2023-08-25 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
JP2020112692A (ja) | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
US11349834B2 (en) | 2019-01-30 | 2022-05-31 | Ncr Corporation | Multi-factor secure operation authentication |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
CN109712626B (zh) | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
US10964314B2 (en) | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US10984783B2 (en) | 2019-03-27 | 2021-04-20 | Intel Corporation | Spoken keyword detection based utterance-level wake on intent system |
US20200310751A1 (en) | 2019-03-29 | 2020-10-01 | Qualcomm Incorporated | System and method of managing device sound level |
EP4184949A1 (en) | 2019-04-17 | 2023-05-24 | Oticon A/s | A hearing device comprising a transmitter |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US20200409926A1 (en) | 2019-06-28 | 2020-12-31 | Rovi Guides, Inc. | Automated contact creation based on content communications |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11159878B1 (en) | 2019-08-15 | 2021-10-26 | Amazon Technologies, Inc. | Autonomously motile device with beamforming |
JP7191793B2 (ja) | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11172328B2 (en) | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210066647A (ko) | 2019-11-28 | 2021-06-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US20220301561A1 (en) | 2019-12-10 | 2022-09-22 | Rovi Guides, Inc. | Systems and methods for local automated speech-to-text processing |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
US11445301B2 (en) | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
US11206052B1 (en) | 2020-06-18 | 2021-12-21 | HAJEN Co., Ltd | Smart speaker |
US20220050585A1 (en) | 2020-08-14 | 2022-02-17 | Apple Inc. | Audio media playback user interface |
-
2017
- 2017-09-29 US US15/721,141 patent/US10466962B2/en active Active
-
2018
- 2018-09-28 KR KR1020227021879A patent/KR102597285B1/ko active IP Right Grant
- 2018-09-28 AU AU2018338812A patent/AU2018338812A1/en not_active Abandoned
- 2018-09-28 CN CN202211314552.0A patent/CN115857747A/zh active Pending
- 2018-09-28 WO PCT/US2018/053472 patent/WO2019067930A1/en unknown
- 2018-09-28 EP EP18792656.3A patent/EP3688995B1/en active Active
- 2018-09-28 KR KR1020207011843A patent/KR102415967B1/ko active IP Right Grant
- 2018-09-28 KR KR1020237036702A patent/KR20230152813A/ko active Application Filing
- 2018-09-28 CA CA3084279A patent/CA3084279A1/en active Pending
- 2018-09-28 CN CN201880077216.4A patent/CN111418216B/zh active Active
- 2018-09-28 JP JP2020518400A patent/JP6987230B2/ja active Active
- 2018-09-28 EP EP21193616.6A patent/EP3951586A1/en active Pending
-
2019
- 2019-11-04 US US16/672,764 patent/US10606555B1/en active Active
-
2020
- 2020-03-30 US US16/834,483 patent/US11288039B2/en active Active
-
2021
- 2021-01-25 US US17/157,686 patent/US11175888B2/en active Active
- 2021-11-30 JP JP2021194522A patent/JP7346529B2/ja active Active
-
2022
- 2022-03-28 US US17/656,794 patent/US11893308B2/en active Active
-
2023
- 2023-09-06 JP JP2023144379A patent/JP2023164959A/ja active Pending
- 2023-09-27 AU AU2023237094A patent/AU2023237094A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111418216A (zh) | 2020-07-14 |
US20190102145A1 (en) | 2019-04-04 |
AU2018338812A1 (en) | 2020-04-30 |
KR102415967B1 (ko) | 2022-07-04 |
US11893308B2 (en) | 2024-02-06 |
EP3951586A1 (en) | 2022-02-09 |
CA3084279A1 (en) | 2019-04-04 |
CN111418216B (zh) | 2022-11-11 |
WO2019067930A1 (en) | 2019-04-04 |
US10466962B2 (en) | 2019-11-05 |
KR20230152813A (ko) | 2023-11-03 |
US11288039B2 (en) | 2022-03-29 |
EP3688995A1 (en) | 2020-08-05 |
EP3688995B1 (en) | 2021-09-01 |
US11175888B2 (en) | 2021-11-16 |
US20220222039A1 (en) | 2022-07-14 |
AU2023237094A1 (en) | 2023-10-12 |
JP2020536274A (ja) | 2020-12-10 |
WO2019067930A9 (en) | 2019-09-26 |
JP6987230B2 (ja) | 2021-12-22 |
KR20200055776A (ko) | 2020-05-21 |
KR20220093280A (ko) | 2022-07-05 |
US20210141600A1 (en) | 2021-05-13 |
JP7346529B2 (ja) | 2023-09-19 |
US20200326909A1 (en) | 2020-10-15 |
KR102597285B1 (ko) | 2023-11-02 |
JP2023164959A (ja) | 2023-11-14 |
US10606555B1 (en) | 2020-03-31 |
JP2022037012A (ja) | 2022-03-08 |
US20200089469A1 (en) | 2020-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111418216B (zh) | 具有语音辅助的媒体回放系统 | |
US11797263B2 (en) | Systems and methods for voice-assisted media content selection | |
US20240103804A1 (en) | Systems and methods of receiving voice input | |
US11696074B2 (en) | Systems and methods for associating playback devices with voice assistant services | |
US20210210095A1 (en) | Devices, systems, and methods for distributed voice processing | |
US20200110571A1 (en) | Systems and methods for media content selection | |
US20240080621A1 (en) | Device designation of playback and network microphone device arrangements | |
CN112640475B (zh) | 用于将回放设备与语音助理服务相关联的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |