CN115857747A - 具有语音辅助的媒体回放系统 - Google Patents

具有语音辅助的媒体回放系统 Download PDF

Info

Publication number
CN115857747A
CN115857747A CN202211314552.0A CN202211314552A CN115857747A CN 115857747 A CN115857747 A CN 115857747A CN 202211314552 A CN202211314552 A CN 202211314552A CN 115857747 A CN115857747 A CN 115857747A
Authority
CN
China
Prior art keywords
playback
vas
command
commands
devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211314552.0A
Other languages
English (en)
Inventor
戴恩·威尔伯丁
约翰·托洛梅伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sonos Inc
Original Assignee
Sonos Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sonos Inc filed Critical Sonos Inc
Publication of CN115857747A publication Critical patent/CN115857747A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/43615Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/453Help systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)
  • Software Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

本发明涉及一种具有语音辅助的媒体回放系统。在一些实施例中,媒体回放系统被配置为(i)经由至少一个麦克风设备捕获语音输入,(ii)检测所述语音输入中是否包括一个或多个命令,(iii)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准,以及(iv)响应于所述确定,选择第一语音助手服务(VAS)和(a)放弃选择第二VAS,(b)向第一VAS发送所述语音输入,并且(c)在发送所述语音输入之后,接收对来自所述第一VAS的语音输入的响应。

Description

具有语音辅助的媒体回放系统
分案说明
本申请是申请日为2018年9月28日、申请号为201880077216.4、发明名称为“具有语音辅助的媒体回放系统”的发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2017年9月29日提交的美国专利申请No.15/721,141 的优先权,其全部内容通过引用并入本文。
技术领域
本公开涉及消费品,并且更具体地涉及针对媒体回放或其某个方面的语音控制的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置的数字音频的选项是有限的,直到2003年 SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices”的专利申请,并在2005年开始出售媒体回放系统为止。Sonos无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
发明内容
本发明涉及一种1.一种方法,包括:使(801)命令信息(590,890) 的集合被存储在媒体回放系统的网络麦克风设备的存储器(216)中,所述集合包括命令的列表和与所述命令相关联的命令标准;经由所述网络麦克风设备中的至少一个麦克风捕获语音输入;检测所述语音输入内是否包括一个或多个命令;确定所述一个或多个命令满足与所述命令信息集合内的一个或多个命令相关联的相应命令标准;以及响应于所述确定,选择第一语音助手服务VAS和放弃选择第二VAS,(ii) 向所述第一VAS发送所述语音输入,(iii)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
附图说明
参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:
图1示出了可以实践某些实施例的媒体回放系统;
图2A是示例回放设备的功能框图;
图2B是包括网络麦克风设备的示例回放设备的等距图;
图3A、3B、3C、3D和3E是示出了根据本公开各方面的示例区域和区域分组的图;
图4A是根据本公开各方面的示例控制器设备的功能框图;
图4B和图4C是根据本公开各方面的控制器接口;
图5A是根据本公开各方面的示例网络麦克风设备的功能框图;
图5B是根据本公开各方面的示例语音输入的图;
图6是根据本公开各方面的示例远程计算设备的功能框图;
图7A是根据本公开各方面的示例网络系统的示意图;
图7B是根据本公开各方面的由图7A的示例网络系统实现的示例消息流;
图8A是根据本公开各方面的用于调用语音助手服务的示例方法的流程图;
图8B是根据本公开各方面的示例命令信息集合的框图;
图9A、9B和9C是根据本公开各方面的具有示例语音输入命令和相关联信息的表格;
图10A、图10B和图10C是示出了根据本公开各方面的用于调用 VAS的示例语音输入的图;
图11A和图11B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图12A和图12B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图13A和图13B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图14A和图14B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图15A和图15B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图16A和图16B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图17A和图17B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图18A和图18B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;
图19A和图19B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图;以及
图20A和图20B是示出了根据本公开各方面的用于调用VAS的示例语音输入的图。
附图用于示出示例实施例的目的,但可以理解,本发明不限于附图所示的布置和手段。在附图中,相同的附图标记识别至少大致相似的元件。为了促进对任何特定元件的讨论,任何参考数字中的一个或多个最高有效位指的是首次引入该元件的附图。例如,首先参照图1 介绍和讨论元件107。
具体实施方式
I.概述
语音控制对于具有智能应用和相关设备(例如,无线照明设备、家庭自动化设备(例如,恒温器、门锁等)和音频回放设备)的“智能”家居可以是有益的。在一些实施方式中,联网的麦克风设备可以用于控制智能家居设备。网络麦克风设备通常将包括用于接收语音输入的麦克风。网络麦克风设备可以将语音输入转发到语音助手服务 (VAS)。传统VAS可以是由云服务器实现以处理语音输入的远程服务。VAS可以处理语音输入以确定该语音输入的意图。基于该响应,网络麦克风设备可以使一个或多个智能设备执行动作。例如,网络麦克风设备可以基于对来自VAS的指令的响应来指示照明设备打开/关闭。
由网络麦克风设备检测到的语音输入通常将包括一个唤醒词,其后跟包含用户请求的发声。唤醒词通常是用于“唤醒”并调用VAS来解释语音输入意图的预定词或短语。例如,在查询
Figure BDA0003907320010000041
VAS 时,用户可能会说出唤醒词“Alexa”。其他示例包括:用于调用/>
Figure BDA0003907320010000042
VAS的“Ok,Google”,以及用于调用/>
Figure BDA0003907320010000043
VAS的“Hey, Siri”,或者用于由/>
Figure BDA0003907320010000044
提供的VAS的“Hey,Sonos”。
网络麦克风设备在语音输入中侦听伴随唤醒字的用户请求或命令。在一些实例中,用户请求可以包括控制第三方设备(例如,恒温器(例如,
Figure BDA0003907320010000045
恒温器)、照明设备(例如,PHILIPS/>
Figure BDA0003907320010000046
照明设备)或媒体回放设备(例如,/>
Figure BDA0003907320010000047
回放设备))的命令。例如,用户可以说出唤醒词“Alexa”,其后跟“将恒温器设置为68度”的发声,以使用/>
Figure BDA0003907320010000048
VAS设置家庭中的温度。用户可以说出相同的唤醒词,其后跟“点亮客厅”的发声,以打开家庭客厅区域中的照明设备。用户可以类似地说出唤醒词,其后跟在家庭中的回放设备上播放特定歌曲、专辑或音乐播放列表的请求。
VAS可以采用自然语言理解(NLU)系统来处理语音输入。NLU 系统通常需要多个远程服务器,这些远程服务器被编程以检测给定语音输入的基本意图。例如,这些服务器可以维护语言词典;解析器;语法和语义规则;以及相关的处理算法来确定用户的意图。
传统VAS遇到的一个挑战是NLU处理是计算密集型的。例如,语音处理算法需要定期更新,以处理措辞、句子结构、发音和其他语音特征中的细微差别。因此,VAS提供商必须维护并不断开发处理算法,并部署越来越多的资源(例如,其他云服务器),以处理从世界各地的用户收到的无数的语音输入。
一个相关的挑战是某些智能设备的语音控制可能需要相对复杂的语音处理算法,这可能会进一步增加VAS资源的负担。例如,要打开客厅中的一组照明设备,一个用户可能更喜欢说“开启灯”,而另一个用户可能更喜欢说“打开客厅”。两个用户都有打开照明设备的相同的基本意图,但是短语(包括动词)的结构不同,更不用说后一个短语标识了客厅中的设备,而前者则没有。为了解决这些问题,VAS必须投入更多资源来破解用户意图,特别是在控制需要复杂语音处理资源和算法的智能设备时,例如,用于区分命令结构和相关语法中细微但有意义的变化的算法。
随着消费者对智能设备的需求增长,并且这些设备变得更加多样化,某些VAS提供商可能很难跟上发展。在一些情况下,VAS可能具有有限的系统资源,这削弱了VAS成功响应入站语音输入的能力。例如,在以上示例中,VAS可能具有处理语音发声“打开灯”的能力,但是可能缺乏处理语音发声“开启灯”的能力,因为该服务可能使用无法识别后者惯用语背后的意图的算法。在这种情况下,用户可能不得不用其他符合条件的信息来重述原始请求,例如,通过说“打开客厅的灯”。备选地,VAS可以通知用户其无法处理这样的请求,或者 VAS可以简单地完全忽略该请求。在任何这些情况下,用户可能会由于不良的语音控制体验而感到不满意。
在媒体回放系统(例如,多区域回放系统)的情况下,常规VAS 可能特别受限制。例如,传统VAS可能仅支持用于基本回放的语音控制,或者要求用户使用特定的并且惯用的措辞与设备进行交互,而不是自然对话。此外,传统VAS可能不支持多区域回放或用户希望控制的其他特征,例如,设备组合、多房间音量、均衡参数和/或用于给定回放场景的音频内容。控制这些功能可能需要比基本回放所需的资源明显更多的资源。
本文描述的媒体回放系统可以解决传统VAS的这些和其他限制。例如,在一些实施例中,媒体回放被配置为选择第一VAS(例如,增强VAS)而不是第二VAS(例如,传统VAS)以处理语音输入。在这种情况下,媒体回放系统可以通过选择第一VAS而不是第二VAS来干预以处理某些语音输入,例如,用于控制媒体回放系统的相对高级和其他特征的语音输入。在一个方面,相对于仅由第二VAS提供的语音控制,第一VAS可以增强语音控制。在一些实施例中,针对媒体回放系统的至少一些语音输入可能不能经由第二VAS来调用。在这些和其他实施例中,可以经由第二VAS调用至少一些语音输入,但是对于第一VAS处理某些语音输入可以是优选的。例如,第一VAS可以比第二VAS更可靠并且更准确地处理某些请求。在一些实施例中,第二 VAS可以是默认VAS,通常向其发送某些类型的语音输入。例如,在一些实施例中,传统VAS可能更适合处理涉及通用互联网查询的请求,例如,说“告诉我今天的天气”的语音输入。在相关实施例中,当调用第一VAS和第二VAS中的任一个时,用户可以使用相同的唤醒工作(例如,“Hey Samantha”)。在一个方面,可能不知道在说出语音输入时幕后正在发生一个VAS与另一个VAS的选择。在一个实施例中,唤醒工作可以是与传统VAS(例如,亚马逊的
Figure BDA0003907320010000061
)相关联的唤醒词。
在一个实施例中,媒体回放系统可以包括被配置为捕获语音输入的网络麦克风设备。媒体回放系统被配置为(i)经由至少一个麦克风设备捕获语音输入,(ii)检测捕获的语音输入中是否包括一个或多个命令,(iii)确定该一个或多个命令满足命令信息集合中的相应命令标准,以及(iv)响应于该确定,(a)选择第一(VAS)并放弃选择第二VAS,(b)向第一VAS发送语音输入,并且(c)在发送该语音输入之后,处理来自第一VAS的对语音输入的响应。
在一些实施例中,网络麦克风设备被配置为在网络麦克风设备的本地存储器中存储命令信息集合。在一些实施例中,命令信息集合可以存储在另一个网络设备上,例如,另一个网络麦克风设备或局域网 (LAN)上的回放设备。在一些实施例中,命令信息集合可以跨LAN 上的多个网络设备和/或远程地跨多个网络设备存储。在以下所述的各种实施例中,可以在过程中使用命令信息集合来确定媒体回放系统是否应该选择第一VAS并且放弃选择第二VAS。
在一些实施例中,网络麦克风设备可以存储预定命令列表和与这些命令相关联的命令标准。这些命令可以包括例如回放、控制和区域定位命令。命令标准可以包括例如与特定命令相关联的预定关键字。语音输入中的关键字组合可以包括:例如,家庭中第一房间的名称的发声(例如,客厅)和该家庭中第二房间的名称的发声(例如,卧室)。当用户说出包括与关键字结合的特定命令(例如,播放音乐的命令) 的语音输入时,媒体回放系统选择并调用第一VAS来处理该语音输入。
在一些实施例中,可以通过训练和自适应学习算法来开发关键字。在某些实施例中,可以在处理包括关键字的语音输入时动态地确定这样的关键字。在这种情况下,关键字在处理语音输入之前不是预先确定的,但是仍然可以基于命令使第一VAS被调用。在相关实施例中,关键字可以与具有相同意图的命令的某些认知相关联。
在一些实施例中,调用第一VAS可以包括向第一VAS的一个或多个远程服务器发送语音输入。在以上示例中,第一VAS可以确定用户在第一房间和第二房间中播放的意图,并通过指示媒体回放系统在第一房间和第二房间中播放期望的音频来进行响应。第一VAS还可以指示媒体回放系统形成包括第一房间和第二房间的分组。
尽管本文描述的一些实施例可以涉及由给定行动者(例如,“用户”和/或其他实体)执行的功能,但是应当理解,该描述仅出于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。
II.示例操作环境
图1示出了可以实现本文公开的一个或多个实施例的媒体回放系统100的示例配置。如图所示的媒体回放系统100与具有若干房间和空间(例如,书房、餐厅和客厅)的示例家居环境相关联。在这些房间和空间内,媒体回放系统100包括回放设备102(单独地标识为回放设备102a-102m)、网络麦克风设备103(单独地标识为“NMD” 103a-103g)以及控制器设备104a和104b(统称为“控制器设备104”)。家居环境可以包括其他网络设备,例如,一个或多个智能照明设备108 和智能恒温器110。
媒体回放系统100的各种回放/网络麦克风和控制器设备102-104 和/或其他网络设备可以经由点对点连接和/或经由包括网络路由器 106的LAN的其他连接(其可以是有线的和/或无线的)而彼此耦接。例如,回放设备102j(指定为“左”)可以与回放设备102a(指定为“右”)具有点对点连接。在一个实施例中,左回放设备102j可以通过点对点连接与右回放设备102a通信。在相关实施例中,左回放设备 102j可以经由点对点连接和/或经由LAN的其他连接与其他网络设备通信。
网络路由器106可以经由广域网(WAN)107与一个或多个远程计算设备105耦接。在一些实施例中,一个或多个远程计算设备可以是云服务器。远程计算设备105可以被配置为以各种方式与媒体回放系统100交互。例如,远程计算设备可以被配置为促进在家居环境中流媒体和控制媒体内容(例如,音频)的回放。在下面更详细描述的技术的一个方面中,远程计算设备105被配置为为媒体回放系统100 提供第一VAS 160。
在一些实施例中,一个或多个回放设备102可以包括机载(例如,集成的)网络麦克风设备。例如,回放设备102a-e分别包括对应的 NMD 103a-e。除非在说明书中另外指出,否则包括网络麦克风设备的回放设备在本文中可互换地称为回放设备或网络麦克风设备。
在一些实施例中,一个或多个NMD 103可以是独立设备。例如, NMD 103f和103g可以是独立网络麦克风设备。独立网络麦克风设备可以省略通常包括在回放设备(例如,扬声器或相关电子设备)中的组件。在这种情况下,独立网络麦克风设备可能不产生音频输出或可能产生有限的音频输出(例如,相对低质量的音频输出)。
在使用中,网络麦克风设备可以接收并处理来自其附近的用户的语音输入。例如,网络麦克风设备可以在检测到用户说出输入时捕获语音输入。在示出的示例中,客厅中的回放设备102a的NMD 103a 可以捕获在其附近的用户的语音输入。在一些实例中,语音输入源(例如,用户)附近的其他网络麦克风设备(例如,NMD 103b和103f) 也可以检测语音输入。在这种实例中,网络麦克风设备可以在彼此之间进行仲裁以确定哪个(哪些)设备应该捕获和/或处理检测到的语音输入。例如在2017年2月21日提交的题为“Voice Control ofa Media Playback System”的美国申请No.15/438,749中可以找到在网络麦克风设备之间进行选择和仲裁的示例,该申请通过引用整体并入本文。
在某些实施例中,可以将网络麦克风设备分配给可能不包括网络麦克风设备的回放设备。例如,NMD 103f可以被分配给其附近的回放设备102i和/或102l。在相关示例中,网络麦克风设备可以通过被分配了音频的回放设备输出音频。例如,在先前引用的美国专利申请 No.15/438,749中可以找到关于将网络麦克风设备和回放设备关联为指定设备或默认设备的附加细节。
可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件可以如何交互以向用户提供媒体体验的其他方面。虽然本文的讨论可能总体上涉及示例媒体回放系统100,但是本文描述的技术不限于尤其如图1所示的家居环境内的应用。例如,本文所述的技术在其他家居环境配置中可能是有用的,该其他家居环境配置包括更多或更少的回放/网络麦克风和/或控制器设备102-104中的任何一个。另外,本文描述的技术在可能期望多区音频的环境中可能是有用的,例如,诸如餐馆、购物中心或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或小汽车、轮船或船只、飞机之类的交通工具等。
a.示例回放和网络麦克风设备
图2A是示出了图1所示的所选择的回放设备102中的一个的某些方面的某些方面的功能框图。如图所示,这样的回放设备可以包括处理器212、软件组件214、存储器216、音频处理组件218、音频放大器220、扬声器222以及包括无线接口232和有线接口234的网络接口230。在一些实施例中,回放设备可以不包括扬声器222,而是可以包括用于将该回放设备与外部扬声器连接的扬声器接口。在某些实施例中,回放设备可以既不包括扬声器222也不包括音频放大器222,而是可以包括用于将回放设备与外部音频放大器或视听接收机连接的音频接口。
回放设备还可以包括用户界面236。用户界面236可以促进独立于或结合一个或多个控制器设备104的用户交互。在各种实施例中,除其他可能性之外,用户界面236包括一个或多个物理按钮和/或设置在触敏屏幕和/或表面上的图形界面,以供用户直接提供输入。用户界面236还可以包括灯和扬声器中的一个或多个,以向用户提供视觉和/ 或音频反馈。
在一些实施例中,处理器212可以是时钟驱动计算组件,其被配置为根据存储器216中存储的指令处理输入数据。存储器216可以是有形计算机可读介质,其被配置为存储可由处理器212执行的指令。例如,存储器216可以是数据存储设备,其可以加载有可由处理器212 执行以实现某些功能的一个或多个软件组件214。在一个示例中,这些功能可以涉及回放设备从音频源或另一回放设备获取音频数据。在另一个示例中,这些功能可以涉及回放设备向网络上的另一设备发送音频数据。在又一示例中,这些功能可以涉及将回放设备与一个或多个其他回放设备配对以创建多声道音频环境。
某些功能可以涉及回放设备与一个或多个其他回放设备同步回放音频内容。在同步回放期间,听众可能无法感知同步回放设备在音频内容回放之间的时间延迟差异。通过引用整体并入本文的2004年4 月4日提交的题为“System and method for synchronizingoperations among a plurality of independently clocked digital data processingdevices”的美国专利No.8,234,395,更详细地提供了回放设备之间的音频回放同步的一些示例。
音频处理组件218可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一些实施例中,一个或多个音频处理组件218可以是处理器212的子组件。在一个示例中,音频处理组件218可以处理和/或有意地改变音频内容以产生音频信号。然后,所产生的音频信号可被提供至音频放大器210 进行放大,并通过扬声器212回放。具体地,音频放大器210可以包括被配置为将音频信号放大到用于驱动扬声器212中的一个或多个的电平的设备。扬声器212可包括单独的换能器(例如,“驱动器”)或具有一个或多个驱动器的包括外壳的完整扬声器系统。例如,扬声器 212的特殊驱动器可以包括例如低音喇叭(例如,针对低频)、中频段驱动器(例如,针对中频)和/或高频扬声器(例如,针对高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的各个对应的音频放大器来驱动。除了产生用于回放的模拟信号之外,音频处理组件208可以被配置为处理要向一个或多个其他回放设备发送以进行回放的音频内容。
可以例如通过音频线路输入的输入连接(例如,自动检测3.5mm 音频线路输入连接)或网络接口230从外部源接收要由回放设备处理和/或回放的音频内容。
网络接口230可以被配置为促进回放设备与数据网络上的一个或多个其他设备之间的数据流。因此,回放设备可以被配置为通过数据网络从与回放设备通信的一个或多个其他回放设备、局域网内的网络设备或广域网(例如,互联网)上的音频内容源接收音频内容。在一个示例中,回放设备发送和接收的音频内容和其他信号可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字数据包数据的形式来发送。在这种情况下,网络接口230可以被配置为解析数字数据包数据,使得去往回放设备的数据被该回放设备正确地接收和处理。
如图所示,网络接口230可以包括无线接口232和有线接口234。无线接口232可以为回放设备提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、 802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)无线通信。有线接口234可以为回放设备提供网络接口功能,以根据通信协议(例如,IEEE802.3)通过有线连接与其他设备通信。虽然图2A中所示的网络接口230包括无线接口232和有线接口234,但是在一些实施例中,网络接口230可以仅包括无线接口或仅包括有线接口。
如上所述,回放设备可以包括网络麦克风设备,例如,图1所示的NMD 103中的一个。网络麦克风设备可以共享回放设备的一些或全部组件,例如,处理器212、存储器216、麦克风224等。在其他示例中,网络麦克风设备包括专用于网络麦克风设备的操作方面的组件。例如,网络麦克风设备可以包括远场麦克风和/或语音处理组件,在一些实例中,回放设备可以不包括它们。在另一示例中,网络麦克风设备可以包括用于启用/禁用麦克风的触敏按钮。在又一示例中,如上所述,网络麦克风设备可以是独立设备。图2B是示出了并入了网络麦克风设备的示例回放设备202的等距图。回放设备202在设备顶部具有控制区域237,以用于启用/禁用麦克风。控制区域237与设备顶部处的另一区域239相邻,以用于控制回放。
举例来说,SONOS公司目前提供(或已经提供)销售某些回放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”、和“SUB”。任何其他过去、现在和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。另外,应该理解,回放设备不限于图2A所示的示例或SONOS产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括个人移动媒体回放设备的扩展基座,或与其交互。在又一示例中,回放设备可以集成到另一设备或组件,例如,电视、照明器材或在室内或室外使用的一些其他设备。
b.示例回放设备配置
图3A-3E示出了区域和区域分组中的回放设备的示例配置。首先参考图3E,在一个示例中,单个回放设备可以属于一个区域。例如,阳台中的回放设备102c可以属于区域A。在以下所述的一些实施方式中,多个回放设备可以被“绑定”以形成“绑定对”,它们一起形成单个区域。例如,可以将图1中名为角落的回放设备102f与名为墙壁的回放设备102g绑定以形成区域B。绑定的回放设备可以具有不同的回放职责(例如,声道职责)。在以下所述的另一实施方式中,多个回放设备可以被合并以形成单个区域。例如,可以将名为书房的回放设备 102d与名为窗户的回放设备102m合并以形成单个区域C。合并的回放设备102d和102m可以不被具体地分配不同的回放职责。即,合并的回放设备102d和102m除了可以同步播放音频内容之外,还可以如未合并时那样各自播放音频内容。
媒体回放系统100中的每个区域可以作为单个用户界面(UI)实体被提供以进行控制。例如,区域A可以作为名为阳台的单个实体提供。区域C可以作为名为书房的单个实体提供。区域B可以作为名为架子的单个实体提供。
在各种实施例中,区域可以采用属于该区域的回放设备中的一个的名称。例如,区域C可以采用书房设备102d的名称(如图所示)。在另一示例中,区域C可以采用窗户设备102m的名称。在另一示例中,区域C可以采用书房设备102d和窗户设备102m的某种组合的名称。选择的名称可以由用户选择。在一些实施例中,可以将区域命名为与属于该区域的设备不同的名称。例如,区域B被命名为架子,但是区域B中的所有设备都不具有该名称。
绑定的回放设备可以具有不同的回放职责,例如,某些音频声道的职责。例如,如图3A所示,角落和墙壁设备102f和102g可以被绑定,以便产生或增强音频内容的立体声效果。在该示例中,角落回放设备102f可以被配置为播放左声道音频分量,而墙壁回放设备102g 可以被配置为播放右声道音频分量。在一些实施方式中,这种立体声绑定可以被称为“配对”。
另外,绑定的回放设备可以具有附加的和/或不同的相应扬声器驱动器。如图3B所示,可以将名为前置(Front)的回放设备102b与名为低音炮(SUB)的回放设备102k绑定。前置设备102b可以呈现中高频范围,并且低音炮设备102k可以呈现低频,例如,重低音。当未绑定时,前置设备102b可以呈现整个频率范围。作为另一示例,图3C示出了前置设备和低音炮设备102b和102k分别进一步与右回放设备和左回放设备102a和102k绑定。在一些实施方式中,右设备和左设备102a和102k可以形成家庭影院系统的环绕或“卫星”声道。绑定的回放设备102a、102b、102j和102k可以形成单个区域D(图3E)。
合并的回放设备可能没有分配回放职责,并且可以分别呈现相应回放设备能够回放的音频内容的全部范围。然而,合并的设备可以被表示为单个UI实体(即,如上所述的区域)。例如,书房中的回放设备102d和102m具有区域C的单个UI实体。在一个实施例中,回放设备102d和102m可以各自输出每个回放设备102d和102m能够同步回放的音频内容的全部范围。
在一些实施例中,独立网络麦克风设备本身可以在一个区域中。例如,图1中名为天花板的NMD 103g可以是区域E。网络麦克风设备也可以与另一个设备绑定或合并,以形成区域。例如,可以将名为岛台的NMD设备103f与回放设备102i厨房绑定,后者一起形成区域G,该区域F也被称为厨房。例如,在先前引用的美国专利申请 No.15/438,749中可以找到关于将网络麦克风设备和回放设备关联为指定设备或默认设备的附加细节。在一些实施例中,独立网络麦克风设备可以不与区域相关联。
可以将单个、绑定和/或合并的设备的区域分组,以形成区域分组。例如,参考图3E,区域A可以与区域B组合,以形成包括该两个区域的区域分组。作为另一示例,区域A可以与一个或多个其他区域 C-I分在一组。可以以多种方式对区域A-I进行分组和取消分组。例如,可以将三个、四个、五个或更多个(例如,全部)区域A-I分在一组。如先前参考的美国专利No.8,234,395中所述,当被分组时,单个和/ 或绑定的回放设备的区域可以彼此同步地回放音频。回放设备可以动态分组和取消分组,以形成同步回放音频内容的新的或不同的分组。
在各种实施方式中,环境中的区域可以是分组内区域的默认名称,或者是区域分组内区域名称的组合,例如,餐厅+厨房,如图3E所示。在一些实施例中,还可以将区域分组命名为由用户选择的唯一名称,例如,尼克的房间(Nick’s Room),如图3E所示。
再次参考图2A,某些数据可以作为一个或多个状态变量被存储在存储器213中,该状态变量被周期性地更新并且用于描述回放区域、回放设备和/或关联的区域分组的状态。存储器216还可以包括与媒体系统的其他设备的状态相关联的数据,并且间或地在设备之间共享,使得设备中的一个或多个具有与系统相关联的最新数据。
在一些实施例中,存储器可以存储与状态相关联的各种变量类型的实例。变量实例可以与对应于类型的标识符(例如,标签)一起存储。例如,某些标识符可以是用于识别区域的回放设备的第一类型“a1”、用于识别可以绑定在该区域中的回放设备的第二类型“b1”和用于识别该区域可能所属的区域分组的第三类型“c1”。作为相关示例,在图 1中,与阳台相关联的标识符可以指示该阳台是特定区域的唯一回放设备,而不是在区域分组中。与客厅相关联的标识符可以指示该客厅没有与其他区域分在一组,而是包括绑定的回放设备102a、102b、102j 和102k。与餐厅相关联的标识符可以指示该餐厅是餐厅+厨房组的一部分,并且设备103f和102i被绑定。由于厨房是餐厅+厨房区域分组的一部分,因此与该厨房关联的标识符可以指示相同或相似的信息。其他示例区域变量和标识符如下所述。
在又一示例中,媒体回放系统100可以表示区域和区域分组的其他关联的变量或标识符,例如,与区域相关联的标识符,如图3E所示。区域可以涉及区域分组和/或不在区域分组内的区域的集群。例如,图3E示出了名为前部区域的第一区域和名为后部区域的第二区域。前部区域包括阳台、客厅、餐厅、厨房和浴室的区域和区域分组。后部区域包括浴室、尼克的房间(Nick’s Room)、卧室和书房的区域和区域分组。在一个方面,区域可以用于调用共享另一集群的一个或多个区域和/或区域分组的区域分组和/或区域的集群。在另一方面,这不同于区域分组,区域分组不与另一区域分组共享区域。用于实现区域的技术的其他示例可以在例如2017年8月21日提交的题为“Room Association Based on Name”的美国申请No.15/682,506和2007 年9月11日提交的题为“Controlling and manipulatinggroupings in a multi-zone media system”的美国专利No.8,483,853中找到。这些申请中的每一个通过引用整体并入本文。在一些实施例中,媒体回放系统 100可以不实现区域,在这种情况下,系统可以不存储与区域相关联的变量。
存储器216还可以被配置为存储其他数据。这样的数据可以涉及回放设备可访问的音频源或该回放设备(或一些其他回放设备)可以与之关联的回放队列。在以下所述的实施例中,存储器216被配置为在处理语音输入时存储用于选择特定VAS(例如,第一VAS 160)的命令数据集合。
在操作过程中,图1环境中的一个或多个回放区可能每个都在播放不同的音频内容。例如,用户可能正在阳台区烧烤并收听由回放设备102c播放的嘻哈音乐,而另一用户可能正在厨房区中准备食物并收听由回放设备102i播放的古典音乐。在另一示例中,回放区可以与另一个回放区同步地播放相同的音频内容。例如,用户可以在书房区中,其中,回放设备102d正在播放与阳台区中的回放设备102c正在播放的嘻哈音乐相同的音乐。在这种情况下,回放设备102c和102d可以同步地播放嘻哈音乐,使得用户可以在不同回放区之间移动时无缝地 (或至少基本上无缝地)欣赏被外放的音频内容。可以以类似于如先前引用的编号为8,234,395的美国专利中所述的回放设备之间的同步的方式来实现回放区域之间的同步。
如上所述,可以动态地修改媒体回放系统100的区域配置。因此,媒体回放系统100可以支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域中或从区域中移出,则可以重新配置媒体回放系统100以适应改变。例如,如果用户将回放设备102c从阳台区物理地移动到书房区,则该书房区现在可以包括回放设备102c和102d。在一些情况下,用户可以使用例如控制器设备104中的一个和/或语音输入将移动的回放设备102c与书房区配对或组合和/或重命名书房区中的播放器。作为另一示例,如果将一个或多个回放设备102移动到家居环境中还不是回放区的特定空间,则可以将移动的回放设备重命名或与该特定区域的回放区相关联。
此外,媒体回放系统100的不同回放区可以被动态组合为区域分组或分成单独的回放区。例如,餐厅区和厨房区可以被组合成用于宴会的区域分组,使得回放设备102i和1021可以同步地呈现音频内容。作为另一示例,客厅区域中的绑定的回放设备102可以被划分为(i) 电视区和(ii)单独的收听区。电视区可以包括前置回放设备102b。收听区可以包括右回放设备102a、左回放设备102j和低音炮回放设备 102k,如上所述,它们可以被组合、配对或合并。以这种方式划分客厅区可以允许一个用户在客厅空间的一个区域中的收听区中听音乐,而另一用户在客厅空间的另一区域中观看电视。在相关示例中,用户可以在将客厅区划分为电视区和收听区之前,实现NMD 103a或103b 中的任何一个来控制客厅区。一旦划分,可以例如由NMD 103a附近的用户控制收听区,并且可以例如由NMD 103b附近的用户控制电视区。然而,如上所述,任何NMD 103可以被配置为控制媒体回放系统100的各种回放设备和其他设备。
c.示例控制器设备
图4A是示出了图1的媒体回放系统100的所选择的控制器设备 104中的一个的某些方面的功能框图。这种控制器设备也可以被称为控制器。图4A所示的控制器设备可以包括通常与上述网络设备的某些组件类似的组件,例如,处理器412、存储器416、麦克风424和网络接口430。在一个示例中,控制器设备可以是用于媒体回放系统100 的专用控制器。在另一示例中,控制器设备可以是可以在其上安装媒体回放系统控制器应用软件网络设备,例如,iPhoneTM、iPadTM或任何其他智能电话、平板电脑或网络设备(例如,联网计算机(例如,PC 或MacTM))。
控制器设备的存储器416可以被配置为存储控制器应用软件以及与媒体回放系统100和系统100的用户相关联的其他数据。存储器416 可以加载有一个或多个可由处理器412执行的软件组件414以实现某些功能,例如,促进媒体回放系统100的用户访问、控制和配置。如上所述,控制器设备通过网络接口430(例如,无线接口)与其他网络设备通信。
在一个示例中,可以经由网络接口430在控制器设备和其他设备之间传送数据和信息(例如,状态变量)。例如,媒体回放系统100 中的回放区和区域分组配置可以由控制器设备从回放设备、网络麦克风设备或另一网络设备接收,或者由控制器设备经由网络接口406向另一回放设备或网络设备发送。在一些情况下,另一网络设备可以是另一控制器设备。
回放设备控制命令(例如,音量控制和音频回放控制)也可以经由网络接口430从控制器设备向回放设备传送。如以上所建议的,也可以由用户使用控制器设备来执行对媒体回放系统100的配置的更改。配置更改可以包括:将一个或多个回放设备添加到区域/从区域中删除;将一个或多个区域添加到区域分组/从区域分组中删除;形成绑定或合并的播放器;将一个或多个回放设备与绑定或合并的播放器分离等。
控制器设备的用户界面440可以被配置为通过分别提供控制器界面(例如,如图4B和图4C所示的控制器界面440a和440b,其可以统称为控制器界面440),来促进用户访问和控制媒体回放系统100。一起参考图4B和图4C,控制器界面440包括回放控制区域442、回放区域区域443、回放状态区域444、回放队列区域446和源区域448。如图所示的用户界面400仅是可以在网络设备(例如,图4A所示的控制器设备)上提供并且由用户访问以控制媒体回放系统(例如,媒体回放系统100)的用户界面的一个示例。备选地,可以在一个或多个网络设备上实现变化的格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的类似的控制访问。
回放控制区域442(图4B)可以包括可选择(例如,通过触摸或通过使用光标)图标,以使所选择的回放区域或区域分组中的回放设备播放或暂停、快进、快退、跳到下一个、跳到前一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式。回放控制区域442还可以包括用于修改均衡设置、回放音量等的可选择图标。
回放区域区域443(图4C)可以包括媒体回放系统100内的回放区域的表示。如图所示,回放区域区域也可以包括区域分组的表示,例如,餐厅+厨房区域分组。在一些实施例中,回放区域的图形表示可以是可选择的,以调出附加的可选择图标来管理或配置媒体回放系统中的回放区域,例如,创建绑定的区域、创建区域分组、分离区域分组、重命名区域分组等。
例如,如图所示,可以在回放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以调出用于选择媒体回放系统中要与特定区域分在一组的一个或多个其他区域的选项。一旦被分组,已经与特定区域分在一组的区域中的回放设备将被配置为与特定区域中的回放设备同步地播放音频内容。类似地,可以在区域分组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以调出用于取消选择区域分组中的要从该区域分组中移除的一个或多个区域的选项。经由用户界面(例如,用户界面400)对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区或区域分组配置被修改时,可以动态地更新回放区区域443(图4C)中的回放区的表示。
回放状态区域444(图4B)可以包括在所选择的回放区或区域分组中当前正在播放、先前播放或被安排为接下来播放的音频内容的图形表示。可以在用户界面上可视地区分所选择的回放区或区域分组,例如,在回放区区域443和/或回放状态区域444内。图形表示可以包括曲目名称、艺术家姓名、专辑名称、专辑年份、曲目长度以及当经由用户界面440控制媒体回放系统时用户知道了会有用的其他相关信息。
回放队列区域446可以包括与所选择的回放区或区域分组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区或区域分组可以与回放队列相关联,该回放队列包含与由该回放区或区域分组回放的零个或更多个音频项相对应的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符 (URL)或一些其他标识符,其可以由回放区或区域分组中的回放设备用于从本地音频内容源或联网音频内容源查找和/或获取音频项,可能供回放设备回放。
在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在另外的示例中,当回放区域或区域分组正在持续播放流媒体音频内容(例如,互联网收音机,其可以持续播放直到被停止),而不是具有回放持续时间的分立音频项时,回放队列可以是空的或被填充但是“未使用”。在备选实施例中,回放队列可以包括互联网收音机和/或其他流媒体音频内容项,并且当回放区域或区域分组正在播放这些项时处于“使用中”。其他示例也是可能的。
当回放区域或区域分组被“分组”或“取消分组”时,可以清除与受影响的回放区域或区域分组相关联的回放队列,或者重新关联。例如,如果包括第一回放队列的第一回放区与包括第二回放队列的第二回放区分在一组,则所建立的区域分组可以具有相关联的回放队列,其最初是空的,包含来自第一回放队列的音频项(例如,如果第二回放区被添加到第一回放区),或包含来自第二回放队列的音频项(例如,如果第一回放区被添加到第二回放区),或包含来自第一回放队列和第二回放队列二者的音频项的组合。随后,如果所建立的区域分组被取消分组,则所得到的第一回放区可以与先前的第一回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含与来自在所建立的区域分组被取消分组之前所建立的区域分组相关联的回放队列的音频项。类似地,所得到的第二回放区可以与先前的第二回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在与所建立的区域分组被取消分组之前所建立的区域分组相关联的回放队列的音频项。其他示例也是可能的。
仍然参考图4B和4C,回放队列区域446(图4C)中的音频内容的图形表示可以包括曲目标题、艺术家名称、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以调出附加的可选择图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以将所表示的音频内容从回放队列中移除,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以立即播放,或者在任何当前播放的音频内容之后进行播放等。与回放区或区域分组相关联的回放队列可以存储于该回放区或区域分组中的一个或多个回放设备上、不在该回放区或区域分组中的回放设备上和/或一些其他指定设备上的存储器中。这种回放队列的回放可以涉及一个或多个回放设备可能按顺序或随机顺序回放队列中的媒体项。
源区域448可以包括与对应的VAS相关联的可选择音频内容源和可选择语音助手的图形表示。可以选择性地分配VAS。在一些示例中,同一网络麦克风设备可以调用多个VAS,例如,AMAZON的
Figure BDA0003907320010000211
和另一语音服务。在一些实施例中,用户可以将VAS专门分配给一个或多个网络麦克风设备。例如,用户可以将第一VAS 160分配给图1 所示的客厅中的NMD 102a和102b中的一个或两者,并将第二VAS 分配给厨房中的NMD 103f。其他示例是可能。
d.示例音频内容源
源区域448中的音频源可以是音频内容源,可以通过所选择的回放区或区域分组从该音频内容源中获取音频内容并播放。区域或区域分组中的一个或多个回放设备可以被配置为从各种可用音频内容源中获取回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,回放设备可以直接从对应的音频内容源(例如,线路输入连接)中获取音频内容。在另一示例中,可以在网络上,经由一个或多个其他回放设备或网络设备向回放设备提供音频内容。
示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制器设备、支持网络的个人计算机、或者网络附接存储器(NAS)等)上的本地音乐库、通过互联网(例如,云)提供音频内容的流媒体音频服务、或者通过回放设备或网络设备上的线路输入连接连接至媒体回放系统的音频源等。
在一些实施例中,可以在媒体回放系统(例如,图1的媒体回放系统100)中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描由媒体回放系统中的回放设备可访问的网络上共享的所有文件夹/目录中的可识别音频项,并且生成或更新包含元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或 URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能的。
e.示例网络麦克风设备
图5A是示出了根据本公开各方面的一个或多个NMD 103的附加特征的功能框图。图5A所示的网络麦克风设备可以包括与上述网络麦克风设备的某些组件大致类似的组件,例如,处理器212(图1)、网络接口230(图2A)、麦克风224和存储器216。尽管为了清楚起见未示出,网络麦克风设备可以包括其他组件,例如,扬声器、放大器、信号处理器,如上所述。
麦克风224可以是多个麦克风,其被布置为检测网络麦克风设备的环境中的声音。在一个示例中,麦克风224可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风224可以对频段的一部分敏感。在一个示例中,麦克风224的第一子集可以对第一频段敏感,而麦克风224的第二子集可以对第二频段敏感。麦克风 224还可以被布置为捕获音频源(例如,语音,可听声音)的位置信息和/或帮助过滤背景噪声。值得注意的是,在一些实施例中,麦克风 224可以具有单个麦克风而不是多个麦克风。
网络麦克风设备还可以包括波束形成器组件551、声学回声消除 (AEC)组件552、语音活动检测器组件553、唤醒词检测器组件554、语音/文本转换组件555(例如,语音到文本和文本到语音)以及VAS 选择器组件556。在各种实施例中,组件551-556中的一个或多个可以是处理器512的子组件。
波束成形和AEC组件551和552被配置为检测音频信号并确定所检测的音频内的语音输入的各个方面,例如,方向、幅度、频谱等。例如,波束成形和AEC组件551和552在过程中可以用于确定网络麦克风设备和与该网络麦克风设备讲话的用户之间的近似距离。在另一示例中,网络麦克风设备可以检测用户与媒体回放系统中的另一网络麦克风设备的相对接近度。
语音活动检测器活动组件553被配置为与波束成形以及AEC组件 551和552紧密协作,以捕获来自检测到语音活动的方向的声音。可以通过监视将语音与其他声音区分开的度量来识别潜在的语音方向。这种度量可以包括例如相对于背景噪声的语音频带内的能量和该语音频带内的熵(其是频谱结构的测量)。语音通常具有比大多数常见的背景噪声低的熵。
唤醒词检测器组件554被配置为监视和分析接收到的音频以确定该音频中是否存在任何唤醒词。唤醒词检测器组件554可以使用唤醒词检测算法来分析接收到的音频。如果唤醒词检测器554检测到唤醒词,则网络麦克风设备可以处理该接收到的音频中包含的语音输入。示例唤醒词检测算法接受音频作为输入,并且提供在该音频中是否存在唤醒词的指示。许多第一方和第三方唤醒词检测算法是已知的并且可商购的。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在一些实施例中,唤醒词检测器554在接收到的音频上同时(或基本同时)运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的
Figure BDA0003907320010000231
APPLE的/>
Figure BDA0003907320010000232
或MICROSOFT的/>
Figure BDA0003907320010000233
)各自使用不同的唤醒词来调用它们各自的语音服务。为了支持多种服务,唤醒词检测器554可以针对每个支持的语音服务通过唤醒词检测算法并行地运行接收到的音频。
VAS选择器组件556被配置为检测语音输入内由用户说出的命令。语音/文本转换组件555可以通过将语音输入中的语音转换为文本来促进处理。在一些实施例中,网络麦克风设备可以包括针对与家庭相关联的特定用户或特定用户集合训练的语音识别软件。这样的语音识别软件可以实现被调谐到特定语音简档的语音处理算法。调谐到特定的语音简档可以需要比传统VAS更少的计算密集型算法,传统VAS 通常从广泛的用户基础和不针对媒体回放系统的各种请求中进行采样。
VAS选择器组件556还被配置为确定在语音输入中检测到的特定命令是否满足某些命令标准。针对语音输入中给定命令的命令标准可以例如基于在该语音输入内包括某些关键字。关键字可以是例如语音输入中识别媒体回放系统100中的特定设备或分组的单词。如本文所使用的,术语“关键字”可以指单个单词(例如,“bedroom(卧室)”) 或一组单词(例如,“the living room(客厅)”)。
附加地或备选地,针对给定命令的命令标准可以涉及与检测该给定命令结合的一个或多个控制状态和/或区域状态变量的检测。控制状态变量可以包括:例如,识别音量级别的指示符、与一个或多个设备相关联的队列以及回放状态,例如,设备是否正在播放队列、是否暂停等。区域状态变量可以包括:例如,识别哪些区域播放器被分在一组的指示符。VAS选择器组件556可以在存储器216中存储命令信息集合,例如,在数据表590中,该命令信息集合包含命令列表和相关联的命令标准,下面将对其进行详细描述。
在一些实施例中,上述组件551-556中的一个或多个可以与麦克风224结合操作以检测和存储用户的语音简档,该语音简档可以与媒体回放系统100的用户账户相关联。在一些实施例中,语音简档可以被存储为和/或与存储在命令信息集合590中的变量进行比较,如下所述。语音简档可以包括用户语音的音调或频率方面和/或用户的其他独特方面,例如,先前引用的美国专利申请No.15/438,749中所描述的那些。
在一些实施例中,上述组件551-556中的一个或多个可以与麦克风阵列524结合操作以确定用户在家居环境中的位置和/或相对于一个或多个NMD 103的位置。如下所述,可以检测用户的位置或接近度并将其与存储在命令信息590中的变量进行比较。用于确定用户的位置或接近度的技术可以包括在先前引用的美国专利申请 No.15/438,749、2011年12月29日提交的题为“Sound Field Calibration Using Listener Localization”的美国专利No.9,084,058、以及2012年8 月31日提交的题为“Acoustic Optimization”的美国专利No.8,965,033 中公开的更多技术。这些申请中的每一个通过引用整体并入本文。
图5B是根据本公开各方面的示例语音输入的图。语音输入可以由网络麦克风设备捕获,例如,由图1所示的一个或多个NMD 103 捕获。语音输入可以包括唤醒词部分557a和语音发声部分557b(统称为“语音输入557”)。在一些实施例中,唤醒词557a可以是已知的唤醒词,例如,与AMAZON的
Figure BDA0003907320010000251
相关联的“Alexa”。在其他实施例中,语音输入557可以不包括唤醒词。
在一些实施例中,网络麦克风设备可以在检测到唤醒词部分557a 时输出听觉和/或视觉响应。附加地或备选地,网络麦克风设备可以在处理语音输入和/或一系列语音输入(例如,在多回合请求的情况下) 之后输出听觉和/或视觉响应。
语音发声部分557b可以包括:例如,一个或多个口头命令558(分别被识别为第一命令558a和第二命令558b)和一个或多个口头关键字559(分别被识别为第一关键字559a和第二关键字559b)。在一个示例中,第一命令557a可以是播放音乐的命令,例如,特定的歌曲、专辑、播放列表等。在该示例中,关键字559可以是识别要在其中播放音乐的一个或多个区域(例如,图1中所示的客厅和餐厅)的一个或多个单词。在一些示例中,语音发声部分557b可以包括其他信息,例如,检测到的在用户说出的单词之间的停顿(例如,非语音的时段),如图5B所示。停顿可以在语音发声部分557b内划分由用户说出的单独命令、关键字或其他信息的位置。
在一些实施例中,媒体回放系统100被配置为在检测到唤醒词部分557a的同时临时减小其正在播放的音频内容的音量。媒体回放系统 100可以在处理语音输入557之后恢复音量,如图5B所示。这样的过程可以被称为闪避,其示例在先前引用的美国专利申请No.15/438,749 中公开。
f.示例网络和远程计算系统
图6是示出了图1中的远程计算设备105的附加细节的功能框图。在各种实施例中,远程计算设备105可以通过图1所示的WAN 107 从一个或多个NMD 103接收语音输入。为了说明的目的,由图6中的箭头表示语音输入557(图5B)的选定通信路径。在一个实施例中,由远程计算设备105处理的语音输入557可以包括语音发声部分557b (图5B)。在另一实施例中,处理后的语音输入557可以包括语音发声部分557b和唤醒词557a(图5B)。
远程计算设备105包括系统控制器612,该系统控制器612包括一个或多个处理器、意图引擎602和存储器616。存储器616可以是有形的计算机可读介质,其被配置为存储可由系统控制器612和/或回放/网络麦克风和/或控制器设备102-104中的一个或多个执行的指令。
意图引擎662被配置为处理语音输入并确定该输入的意图。在一些实施例中,意图引擎662可以是系统控制器612的子组件。意图引擎662可以与一个或多个数据库(例如,一个或多个VAS数据库664) 交互以处理语音输入。VAS数据库664可以驻留在存储器616中或其他地方,例如,在回放/网络麦克风和/或控制器设备102-104中的一个或多个的存储器中。在一些实施例中,可以基于语音输入处理来更新 VAS数据库664以用于自适应学习和反馈。VAS数据库664可以存储各种用户数据、分析、目录以及用于与NLU相关的和/或其他处理的其他信息。
远程计算设备105可以与媒体回放系统100的各种回放/网络麦克风和/或控制器设备102-104交换各种反馈、信息、指令和/或相关数据。这样的交换可以与包含语音输入的发送消息有关或独立于该消息。在一些实施例中,远程计算设备105和媒体回放系统100可以经由如本文所述的通信路径和/或使用如先前引用的美国专利申请 No.15/438,749中所述的元数据交换信道来交换数据。
媒体回放系统100的设备对语音输入的处理可以至少部分地与远程计算设备105对该语音输入的处理并行地执行。另外,网络麦克风设备的语音/文本转换组件555可以将来自远程计算设备105的响应转换为语音,以经由一个或多个扬声器进行可听输出。
根据本公开的各种实施例,远程计算设备105为媒体回放系统100 执行第一VAS160的功能。图7A是包括第一VAS 160的示例网络系统700的示意图。如图所示,远程计算设备105经由WAN 107(图1) 和/或与WAN 107连接的LAN 706与媒体回放系统100耦接。以此方式,媒体回放系统100的各种回放/网络麦克风和控制器设备102-104 可以与远程计算设备105通信以调用第一VAS 160的功能。
网络系统700还包括附加的第一远程计算设备705a(例如,云服务器)和第二远程计算设备705b(例如,云服务器)。第二远程计算设备705b可以与媒体服务提供商767(例如,
Figure BDA0003907320010000271
或/>
Figure BDA0003907320010000272
)相关联。在一些实施例中,第二远程计算设备705b可以与第一VAS 160的计算设备直接通信。附加地或备选地,第二远程计算设备705b可以与媒体回放系统100和/或其他中间远程计算设备通信。
第一远程计算设备705a可以与第二VAS 760相关联。第二VAS 760可以是与例如AMAZON的
Figure BDA0003907320010000273
APPLE的/>
Figure BDA0003907320010000274
MICROSOFT的/>
Figure BDA0003907320010000275
或其他VAS提供商相关联的传统VAS提供商。尽管为了清楚起见未示出,网络计算系统700还可以包括与一个或多个附加VAS(例如,附加传统VAS)相关联的远程计算设备。在这样的实施例中,媒体回放系统100可以被配置为选择第一VAS 160 而不是第二VAS 760,以及另一VAS。
图7B是示出了图7A的网络计算系统700中的各种数据交换的消息流程图。媒体回放系统100经由网络麦克风设备(例如,经由图1 所示的一个或多个NMD 103)捕获语音输入(框771)。如下所述,媒体回放系统100可以基于命令和命令信息集合590中的相关联的命令标准来选择适当的VAS(框771-774)。如果选择了第二VAS 760,则媒体回放系统100可以向第二VAS 760发送包含语音输入的一个或多个消息781(例如,数据包)以进行处理。
另一方面,如果选择了第一VAS 160,则媒体回放系统100向VAS 160发送包含语音输入的一个或多个消息782(例如,数据包)。媒体回放系统100可以向VAS 160同时发送其他信息和消息782。例如,如先前引用的美国专利申请No.15/131,244中所述,媒体回放系统100 可以在元数据信道上发送数据。
第一VAS 160可以处理消息782中的语音输入以确定意图(框 775)。基于该意图,VAS 160可以向媒体回放系统100发送一个或多个响应消息783(例如,数据包)。在一些实例中,响应消息783可以包括有效载荷,该有效载荷指导媒体回放系统100的一个或多个设备执行指令(框776)。例如,该指令可以指导媒体回放系统100回放媒体内容、对设备进行分组和/或执行以下所述的其他功能。附加地或备选地,例如在多回合命令的情况下,来自VAS160的响应消息783可以包括带有对更多信息的请求的有效载荷。
在一些实施例中,从第一VAS 160发送的响应消息783可以指导媒体回放系统100从媒体服务667请求媒体内容,例如,音频内容。在其他实施例中,媒体回放系统100可以从VAS 160独立地请求内容。在任一情况下,媒体回放系统100可以例如经由包括例如音频内容的媒体流784来交换用于接收内容的消息。
在一些实施例中,媒体回放系统100可以经由网络接口从回放/ 网络麦克风或局域网中的其他设备上的输入接口接收音频内容。示例音频内容包括一个或多个音频曲目、脱口秀、电影、电视节目、播客、互联网流视频以及许多其他可能形式的音频内容。音频内容可以伴随视频(例如,视频的音频曲目),或者音频内容可以是不伴随视频的内容。
在一些实施例中,媒体回放系统100和/或第一VAS 160可以使用语音输入,该语音输入导致来自VAS的成功(或不成功)响应以用于训练以及自适应训练和学习(框777和778)。训练和自适应学习可以增强媒体回放系统100和/或第一VAS 160的语音处理的准确性。在一个示例中,意图引擎662(图6)可以针对与媒体回放系统100相关联的一个或多个用户帐户,更新和维护VAS数据库664中的训练学习数据。
III.用于调用VAS的示例方法和系统
如上所述,本文描述的实施例可以涉及调用第一VAS 160。在一个方面,第一VAS160可以为媒体回放系统100提供增强的控制特征。在另一方面,如上所述,与其他VAS(例如,传统VAS)相比,第一 VAS可以提供用于控制媒体回放系统100的改进的VAS体验。
在一些实施例中,传统VAS(例如,图7B所示的第二VAS 760) 可以被媒体回放系统100调用以执行相对基本的控制,例如,相对简单的播放/暂停/跳过功能。在一些实施方式中,第二VAS 760可以提供可能无法经由第一VAS 160立刻调用的其他服务。例如,在某些实施方式中,传统VAS可以提供基于语音的互联网搜索,而第一VAS 160 无法提供。
图8A是用于调用VAS的方法800的示例流程图。方法800呈现了可以在涉及例如根据本公开的实施例配置的媒体回放系统100或另一媒体回放系统的操作环境内实现的方法的实施例。在以下所述的示例中,方法800涉及选择第一VAS 160而不是第二VAS760。
方法800可以涉及发送和接收如本文所述和/或先前引用的美国专利申请No.15/438,749中所述的各种设备和系统之间的信息。例如,该方法可以涉及在回放系统的回放/网络麦克风、控制器和远程计算设备102-104、媒体服务667的远程计算设备705b和/或第二VAS 670 的远程计算设备705a中的一个或多个之间发送和接收信息。尽管以连续顺序示出了图8A中的框,但是这些框也可以并行执行,和/或以与本文描述的顺序不同的顺序执行。而且,根据所需的实现,可以将各个框组合成更少的框,分成更多的框,和/或移除框。
另外,针对本文公开的方法800以及其他过程和方法,流程图示出了本实施例的一种可能实现的功能和操作。在这方面,每个框可以表示模块、段或程序代码的一部分,其包括可由处理器执行以实现过程中的特定逻辑功能或步骤的一个或多个指令。程序代码可以存储在任何类型的计算机可读介质上,例如,包括磁盘或硬盘驱动器的储存设备。计算机可读介质可以包括非暂时性计算机可读介质,例如,短时间存储数据的计算机可读介质,如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)。计算机可读介质还可以包括非暂时性介质,例如,辅存或持久性长期储存器,如只读存储器(ROM)、光盘或磁盘、紧凑盘只读存储器(CD-ROM)等。计算机可读介质还可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是计算机可读存储介质,例如有形的储存设备。计算机可读介质可以由以上参照各种回放/网络麦克风、控制器和远程计算设备所述的一个或多个存储器构成。另外,针对本文公开的方法800以及其他过程和方法,图8A中的每个框可以表示被连接以执行过程中的特定逻辑功能的电路。
在一些实施例中,方法800还可以涉及:接收用于启动应用的用户输入;接收用户和用户账户信息;确定系统参数;与音乐服务交互和/或与控制器交互,例如用于显示、选择以及输入系统信息。在各种实施例中,方法800可以结合在2016年7月29日提交的题为“Voice Control 0fa Media Playback System”的申请No.15/223,218中所述的示例方法和系统,该申请通过引用整体并入本文。
a.导致包括命令列表以及要存储在内存中的命令的相关标准的命令信息集合
在框801处,方法800涉及存储命令信息集合,例如,存储在网络麦克风设备的存储器216中的命令信息集合590。参照图8B,示例命令信息集合890可以包含命令列表892。命令信息集合890可以是数据表或其他数据结构。命令信息集合890可以例如存储在回放、控制器、网络麦克风和/或远程计算设备102-105中的一个或多个的存储器中。在一些实施例中,可以经由元数据交换信道和/或媒体回放系统与远程计算系统之间的任何其他通信路径来访问命令信息集合890。
在所示的示例中,命令集合892包括第一至第n命令。作为示例,第一命令可以是用于发起回放的命令,例如当用户说“播放音乐”时。第二命令可以是控制命令,例如,传输控制命令(例如,暂停、恢复、跳过、回放)。例如,第二命令可以是涉及用户要求“跳到歌曲中的下一曲目”的命令。第三命令可以是区域定位命令,例如,用于将回放设备组合、绑定和合并的命令。例如,第三命令可以是涉及用户要求“将客厅和餐厅分在一组”的命令。
本文描述的命令是示例,并且其他命令也是可能的。例如,图 9A-9C示出了带有附加示例回放发起、控制和区域定位命令的表。作为附加示例,命令可以包括查询命令。查询命令可以涉及例如用户关于当前正在播放什么音频的查询。例如,用户可以说出询问命令“告诉我客厅里正在播放什么”。
如图8B进一步所示,命令892与也存储在命令数据集合890中的命令标准相关联。例如,第一命令与一个或多个第一命令标准_1 (Criteria_1)相关联,第二命令与一个或第二命令标准_2(Criteria_2) 相关联,并且第三命令与一个或多个第三命令标准_3(Criteria_3)相关联。命令标准可以涉及与某些变量实例有关的确定。变量实例可以与标识符(例如,标签)一起存储,该标识符可以或可以不与用户帐户相关联。变量实例可以连续的、定期地或不定期地更新,以包括由用户添加或删除或与用户帐户相关联的新的自定义名称。自定义名称可以是用户提供的任何名称,其可能存在或不存在于数据库中。
变量实例可以出现在语音输入的关键字中;引用为存储在状态表中的名称和/或值;和/或经由回放/网络麦克风、控制器和远程计算设备102-105中的一个或多个,在状态表中动态存储和修改。示例变量实例可以包括区域变量实例、控制状态变量实例、目标变量实例和其他变量实例。区域变量实例可以涉及例如代表区域、区域分组、回放设备、网络麦克风设备、绑定状态、区域等的标识符,包括上述那些标识符。控制状态变量可以包括例如各个回放和网络麦克风设备和/ 或多个设备的当前控制状态,例如,指示播放音乐的设备的信息、设备的音量、存储在设备上的队列等。目标变量实例可以涉及例如与一组设备、绑定的设备和合并的设备相对应的某些控制状态和/或高级状态信息。目标变量还可以对应于媒体回放系统100中的各种设备的校准状态,例如,均衡设置。
其他变量实例也是可能的。例如,媒体变量实例可以识别媒体内容,例如,音频内容(例如,特定曲目、专辑、艺术家、播放列表、电台或音乐流派)。在一些实施例中,可以响应于在数据库中搜索用户期望的音频或内容来识别媒体变量。媒体变量可以出现在语音输入中;在状态表中引用、维护和更新;或在查询中引用,如上所述。作为另一示例,某些变量实例可以指示用户在家居环境中的位置或接近程度、是否在给定的语音输入中检测到用户的语音简档、是否检测到特定唤醒词等。变量实例可以包括自定义变量实例。
在某些实施例中,存储在命令信息集合890中的标准中的至少一些可以包括变量实例的标量向量或变量实例的其他此类集合。例如,标准_1可以包括向量,该向量识别表示图1的媒体回放系统100中所示的区域的区域变量。这样的向量可以包括[阳台,客厅,餐厅,厨房,书房,卧室,尼克的房间]。在一个实施例中,如果在语音输入中向量中的两个或更多个区域变量被检测为关键字,则可以满足标准_1。
命令信息集合890还可以包括其他信息,例如,用户特定信息894 和自定义信息896。用户特定信息894可以与用户帐户和/或家庭标识符(HHI)相关联。自定义信息896可以包括例如自定义变量,例如,自定义区域名称、自定义播放列表和/或自定义播放列表名称。例如,“尼克的最爱”可以是具有用户创建的自定义名称的自定义播放列表。
b.捕获语音输入
返回参考图8A,在框802和803处,方法800涉及监视和检测语音输入中的唤醒词。例如,媒体回放系统100可以分析表示语音输入的接收到的音频以确定是否表示唤醒词。媒体回放系统100可以使用一个或多个种唤醒词检测算法来分析接收到的音频,例如,经由唤醒词检测组件,如上所述。
在框804处,方法800涉及在框802和803处检测到唤醒词之后捕获语音输入。在各种实施例中,可以经由回放系统100的一个或多个NMD 103来捕获语音输入。如本文所使用的,术语“捕获”或“正在捕获”可以指代包括记录语音输入的至少一部分(例如,在唤醒词之后的语音发声)的过程。在一些实施例中,捕获到的语音输入可以包括唤醒词。在下文所述的某些实施例中,术语“捕获”或“正在捕获”还可以指代记录语音输入的至少一部分并使用例如语音到文本转换将语音输入转换为特定格式(例如,文本)。
c.检测捕获到的语音输入内的一个或多个命令
在框805和806处,方法800涉及检测在框804处捕获到的语音输入内的一个或多个命令892(图8B)。在各种实施例中,方法800 可以通过解析语音输入并确定命令892中的一个是否具有与在捕获到的语音输入中找到的语法相匹配的语法来检测命令。以这种方式,方法800可以使用匹配语法来检测语音输入中的命令的意图。匹配语法可以是一个单词、一组单词、一个短语等。在一个示例命令中,用户可以说“在阳台和客厅中播放披头士(TheBeatles)”。在该示例中,方法800可以将“播放”的语法识别为与命令信息集合890中的第一回放发起命令的语法相匹配。另外,方法800可以将“披头士(The Beatles)”识别为媒体变量,并且将“阳台”和“客厅”识别为区域变量。因此,命令的语法也可以以变量实例的形式表示,如下所示:“在 [第一区域变量]和[第二区域变量]中播放[媒体变量]。”类似的命令可以包括“让我听见[第一区域变量]和[第二/组设备变量]中的[媒体变量]。”如下所述,“让我听见”可以是“播放”意图的关联。
在一些实施例中,用户可以说出伴随一个区域变量实例或没有区域变量实例的命令。在一个示例中,用户可以通过简单地说“播放一些披头士(Beatles)”来给出语音输入。在这种情况下,方法800可以确定在默认区域中“播放一些披头士”的意图。在另一种情况下,方法800可以基于可能满足该命令的其他命令标准来确定在一个或多个回放设备上“播放一些披头士”的意图,例如,当在特定区域中检测到用户的存在时,用户请求播放披头士。例如,如果语音输入被位于该区域的右回放设备102a检测到,则媒体回放系统100可以在图1 所示的客厅区域中回放一些披头士。
另一示例命令可以是播放下一首命令,其可以使所选择的媒体内容被添加到在区域中下一个要播放的队列的顶部。该命令的示例语法可以是“下一首播放[媒体变量]”。
命令的另一示例可以是移动或转移命令,其可以将当前正在播放的音乐和/或区域的回放队列从一个区域移动或转移到另一个区域。例如,用户可以说出“将音乐移动到[区域变量]”的语音输入,其中命令字“移动”或“传送”可以对应于将回放状态移动到另一区域的意图。作为相关示例,移动音乐的意图可以对应于两个媒体回放系统命令。这两个命令可以将第一区域与第二区域分在一组,然后从该组中移除第二区域,从而有效地将第二区域的状态传送到第一区域。
可以在语音输入中检测到的命令和变量实例的意图可以基于预定义语法中的任何一个,该预定义语法可以与用户意图(例如,播放、暂停、添加到队列、组合、其他传输控件、经由例如控制设备104的可用控件)相关联。在一些实施方式中,命令和相关联的变量实例的处理可以基于预定义的“槽(slots)”,其中,期望在语法中指定一个或多个命令和/或一个或多个变量。在这些和其他实施方式中,如上所述,可以响应于用户自定义和偏好、反馈和自适应学习来更新用于确定用户意图的单词或词汇集合。
在一些实施例中,用于命令的不同的单词、语法和/或短语可以与同一意图相关联。例如,在语音输入中包括命令词“播放”、“收听”或“听”可以对应于反映与媒体回放系统回放媒体内容相同意图的同源词。
图9A-图9C示出了同源词的其他例子。例如,表格900的左侧中的命令可以具有在该表格的右侧中表示的某些同源词。例如,参考图 9A,左侧栏中的“播放”命令与右侧栏中的同源短语具有相同的意图,包括“跟我摇摆”、“让我们狂欢吧”、“嗨起来”。在各种实施例中,可以在表格900中添加、移除或编辑命令和同源词。例如,如上所述,可以响应于用户自定义和偏好、反馈、训练和自适应学习来添加、移除或编辑命令和同源词。图9B和图9C分别示出了与控制和区域定位有关的示例同源词。
在一些实施例中,变量实例可以具有以类似于命令的同源词的方式预定义的同源词。例如,媒体回放系统100中的“阳台”区域变量可以具有表示相同区域变量的同源词“外部”。作为另一示例,“客厅”区域变量可以具有“生活区域”、“电视室”、“家庭室”等同源词。
d.确定一个或多个命令符合命令信息集合中的相应标准
一起参考图8A和图8B,在框807处,方法800涉及确定在框806 中检测到的一个或多个命令满足命令信息集合890中的相应命令标准。例如,参考图8B,如果检测到第一命令,则方法800将确定该第一命令是否满足标准_1;如果检测到第二命令,则方法800将确定该命令是否满足标准_2;以及以此类推。
可以将命令与多个命令标准集合进行比较。在一些实施例中,某些标准集合可以与逻辑运算符相关联。例如,将第三命令与命令标准 _2和命令标准_3进行比较。这些命令由逻辑与(AND)运算符连接。因此,第三命令需要满足两个标准集合。相比之下,第n命令与由逻辑或(OR)运算符连接的标准(标准_x、标准_y和标准_z)相关联。在这种情况下,第n命令必须仅满足该命令的命令标准集合中的一个。逻辑运算符的各种组合(包括XOR运算符)可以用于确定命令是否满足某些命令标准。
在一些实施例中,命令标准可以确定语音输入是否包括多于一个命令。例如,带有“播放[媒体变量]”命令的语音输入可以伴随有第二命令“也在[区域变量]中播放”。在该示例中,媒体回放系统100可以将“播放”识别为一个命令,并且将“也播放”识别为通过包含后一个命令而满足的命令标准。在一些实施例中,当以上示例命令在同一语音输入中一起被说出时,这可以对应于组合意图。
在类似的实施例中,语音输入可以包括依次说出的两个命令或短语。方法800可以识别这样依次的命令或短语可以是相关的。例如,用户可以提供语音输入“播放一些古典音乐”后跟在“客厅”和“餐厅”中,这是将客厅和餐厅中的回放设备组合的推论命令。
在一些实施例中,当依次处理单词或短语时,媒体回放系统100 可以检测有限持续时间(例如,1至2秒)的暂停。在一些实施方式中,用户可以有意地暂停以在命令和短语之间划界以促进对相对较长的命令和信息链的语音处理。暂停可以具有足以捕获命令和信息链的预定持续时间,而不会引起媒体回放系统100空闲回到框802处的唤醒词监视。在一个方面中,用户可以使用这样的暂停来执行多个命令,而不必针对要执行的每个期望命令重新说出唤醒词。
e.响应于确定,选择第一VAS并放弃选择其他VAS,并经由第一VAS处理一个或多个 命令
满足某些预定命令标准的命令将使媒体回放系统100调用第一 VAS 160,而不满足预定标准的命令可以使媒体回放系统100调用另一VAS或根本不调用VAS。示例方法800包括:如框807和框808 所示,向VAS 160发送被确定为满足语音点中给定命令的命令标准的语音输入,并且如框809所示,在该给定命令不满足该标准时,向另一VAS发送该语音输入。
在框810处,该方法涉及800接收和处理来自VAS的响应,该VAS接收框808处的语音输入。在一个实施例中,处理来自VAS的响应可以包括处理来自VAS的指令以执行语音输入中的命令,例如,回放、控制、区域定向和以上讨论的其他命令。在一些实施例中,可以指示远程计算设备发起或控制与媒体变量相关联的内容的回放,该媒体变量可以被包括在初始语音输入中或者是数据库搜索的结果。
在一些实施例中,在框810中处理响应可以使媒体内容被获取。在一个实施例中,可以将媒体变量作为数据库搜索媒体内容的结果提供给媒体回放系统100。在一些实施例中,媒体回放系统100可以直接从一个或多个媒体服务中获取媒体内容。在其他实施例中,VAS可以结合处理在框800处接收到的语音输入来自动获取媒体内容。在各种实施例中,可以通过元数据交换信道和/或在媒体回放系统100之间建立的任何其他通信路径来传递媒体变量。如上面参考图7B所讨论的,这样的通信可以发起内容流。
在一些实施例中,数据库搜索可以基于在语音输入中检测到的媒体变量来返回结果。例如,数据库搜索可以返回:具有专辑名称与媒体变量相同的艺术家、与媒体变量匹配或相似的专辑名称、名为媒体变量的曲目、媒体变量的广播电台、名为媒体变量的播放列表、与媒体变量有关的内容的流服务提供商标识符和/或原始语音到文本转换结果。使用“美国派(American Pie)”的示例,搜索结果可以返回:艺术家“Don McLean”、名为“美国派”的专辑、名为“美国派”的曲目、名为“美国派”的广播电台(例如,“美国派”的Pandora广播电台的标识符)、曲目“美国派”的音乐服务(例如,流音乐服务,例如,
Figure BDA0003907320010000361
或/>
Figure BDA0003907320010000362
)曲目标识符(例如,“美国派”的/>
Figure BDA0003907320010000363
曲目标识符、URI和/或URL)和/或“美国派”的原始语音到文本结果。
在一些实施例中,方法800可以涉及响应于播放列表或存储在云网络上的回放队列的变化来更新存储在回放设备上的回放队列,以使得回放队列的一部分与云网络中播放列表或回放队列的一部分或全部相匹配。
响应于在媒体回放系统100中引起动作,方法800可以涉及在框800处更新和/或存储与该动作有关的信息。例如,可以在框800处更新一个或多个控制状态、区域状态、区域标识符或其他信息。可以更新的其他信息可以包括例如识别当前正在播放特定媒体项目的特定回放设备的信息和/或特定媒体项目被添加到存储在回放设备上的队列中。
在一些实施例中,如框811和框812所示,在框810中处理响应可以导致确定VAS需要附加信息并以声音提示用户该信息。例如,方法800可以在执行多回合命令时提示用户附加信息。在这种情况下,方法800可以返回到框804以捕获附加语音输入。
虽然本文已经关于媒体内容(例如,音乐内容、视频内容)描述了方法和系统,但是本文描述的方法和系统可以应用于可以具有可由媒体回放系统播放的相关音频的各种内容。例如,可以响应于语音输入来播放可能不是音乐目录的一部分的预先录制的声音。一个示例是语音输入“夜莺的声音是什么样的?”。联网麦克风系统对该语音输入的响应可能不是具有标识符的音乐内容,而可能是短音频剪辑。媒体回放系统可以接收与回放短音频剪辑相关联的信息(例如,存储地址、链接、URL、文件)以及用于播放短音频剪辑的媒体回放系统命令。其他示例是可能的,包括播客、新闻剪辑、通知声音、警报等。
IV.用于媒体回放系统的语音控制的示例实现
图10A-图20B是示出了由媒体回放系统100处理的语音输入和控制接口的各种示例的示意图,该控制接口可以表示在处理语音输入之前或之后媒体回放系统100的状态。如下所述,与语音输入内的特定语音命令相关联的命令标准可以为VAS(例如,上述的VAS160)提供增强的语音控制。语音输入可以由一个或多个NMD 103接收,如上所述,该NMD 103可以合并也可以不合并到回放设备102中的一个。
尽管为了清楚起见未示出,如上所述,以下各个示例中的语音输入可以在前面加上唤醒词,例如,AMAZON的
Figure BDA0003907320010000371
或其他唤醒词。在一个方面,相同的唤醒词可以用于发起将要向第一VAS或第二 VAS(例如,传统VAS)发送的语音输入的语音捕获。在这种情况下,说出语音发声的用户可能不知道幕后正在发生一个VAS与另一个 VAS的选择。在某些实施例中,用户可以说出独特唤醒词(例如,“Hey Sonos”)来调用第一VAS,而无需进一步考虑。在这种情况下,回放系统100可以避免确定选择第一VAS而不是另一VAS的步骤。
在一个方面中,命令标准可以被配置为对设备进行组合。在一些实施例中,当语音输入涉及媒体变量和/或受影响的设备与回放队列相关联时,这样的命令标准可以同时发起回放。例如,图10A示出了用户向NMD 103a说出语音输入以“在客厅和阳台中播放披头士”,并且图10B中的控制器界面示出了客厅和阳台的结果分组。在另一示例中,用户可以说出特定曲目、播放列表、心情或其他信息,以发起本文所述的媒体回放。
图10A中的语音输入包括“在[第一区域变量]和[第二区域变量] 中播放[媒体变量]”的语法结构。在该示例中,要播放的命令符合要求两个或更多个区域变量作为语音输入中的关键字的命令标准。在一些实施例中,客厅的回放设备102a、102b、102j和102k可以在图10A 所示的语音输入之前和之后保持在绑定的媒体回放设备布置中。
在一些实施例中,说出的区域变量的顺序可以指示哪个回放设备被指定在“组头”。例如,当用户说出包含关键字“客厅”后跟关键字“阳台”的语音输入时,该顺序可以指示客厅将成为组头。组头可以作为区域变量存储在命令信息集合890中。组头可以是用于引用分组回放设备的句柄。当用户说出包含组句柄的语音输入时,媒体回放系统100可以检测到与客厅分在一组的所有设备的意图。以这种方式,当集中控制设备时,用户不必针对一组设备中的每一个区域说出关键字。在相关实施例中,用户可以说出语音输入以将组头更改为另一设备或区域。例如,用户可以将客厅区域的组头更改为阳台(在这种情况下,界面可以将分组的顺序显示为阳台+客厅而不是客厅+阳台)。
在备选示例中,图10C示出了用户说出语音输入“播放披头士”,但是省略了图10B的语音输入中的其他关键字。在该示例中,如上所述,如果命令不满足命令信息集合890中的任何标准,则可以向另一个VAS发送语音输入。
在另一示例中,如果命令满足其他命令标准,则可以向第一VAS 160发送忽略上述关键字的“播放披头士”的语音输入。其他这样的命令标准可以包括例如涉及区域变量、控制状态变量、目标变量和/ 或其他变量的标准。在一个方面中,变量实例可以是用户与网络麦克风设备的接近度(例如,计算出的或以其他方式确定的距离)。例如,当检测到用户在NMD 103附近(例如,具有预定半径r1)时,可以向第一VAS 160发送图10C的语音输入。接近度的确定可以基于例如语音输入源的信号强度。在另一方面中,当检测到用户的语音简档时,可以向第一VAS 160发送图10C的语音输入,这可以与是否检测到用户的接近度无关。
在另一方面中,接近度和/或其他命令标准可以促进解析传统VAS 无法立刻处理的语音输入。例如,如图11A所示,说出语音输入以“提高阳台音量”的用户可能无法通过传统VAS解析,因为阳台包括照明设备108,其可以具有相同的名称。参照图1,第一VAS 160可以通过基于关联的控制变量确定用户是否在回放设备102c附近和/或阳台当前是否正在播放来解析这种冲突的设备名称。在相关方面中,当用户在阳台附近时,第一VAS 160可以确定增加阳台上的回放设备102c 的音量,但是不增加用户不位于其内的客厅中的音量。在这种情况下,如图11B所示,媒体回放系统100可以增加阳台而不是客厅的音量。
类似地,第一VAS 160可以为具有相似命令命名约定的设备解析冲突的命令。例如,图1所示的餐厅中的恒温器110可以通过用户说出语音输入来编程,以由用户“设置”到特定温度(例如,在60度和 85度之间的级别)。同样,用户可以说出语音输入以将餐厅区域“设置”到某个音量级别(例如,在0%和100%之间的级别)。在一个示例中,说出语音输入“将餐厅设置为75”的用户可以由第一VAS 160 解析,因为基于存储在命令信息集合890中的命令标准检测到了餐厅区域正在播放。相比之下,传统VAS可能无法确定是将餐厅区域的音量更改为75级还是将餐厅恒温器的温度设置为75。
在各种实施例中,可以经由各个回放/网络麦克风设备和控制器设备102-104结合来自用户的其他输入来处理语音输入。例如,用户可以使用图11B所示界面上的软按钮和控制特征来独立控制组音量、单个音量、回放状态等。另外,在图11B的示例中,用户可以按下标有“分组”的软按钮来访问另一个用于手动组合和取消分组设备的界面。在一个方面中,提供经由语音输入、控制器输入和手动设备输入来与媒体回放系统100交互的多种方式可以提供控件的无缝连续性以增强用户体验。
作为另一个分组/取消分组示例,语音输入“在阳台上播放Bob Marley”可以使阳台自动从客厅取消分组。在这种情况下,阳台可以播放Bob Marley,而客厅可以继续播放披头士。备选地,如果命令标准指示客厅不再是一组回放设备的组头,则客厅可以停止回放。在另一实施例中,命令标准可以指示设备不响应于回放发起命令而自动取消分组。
命令标准可以被配置为将当前正在播放的音乐和/或区域的回放队列从一个区域移动或转移到另一区域。例如,用户可以说出“将音乐从客厅移动到餐厅”的语音输入,如图12A所示。移动音乐的请求可以将在客厅区域中播放的音乐移动到餐厅,如图12B的控制器界面所示。在相关示例中,用户可以通过直接向图1所示餐厅附近的NMD 103f说出“将音乐移动到这里”的语音输入,将音乐移动到餐厅。在这种情况下,用户没有明确提及餐厅,但是VAS 160可以基于用户与餐厅的接近程度来推断意图。在相关实施例中,如果VAS 160确定将 NMD 103f绑定到餐厅中的回放设备1021,则VAS 160可以确定将音乐移动到餐厅而不是另一个相邻房间(例如,厨房)。在另一示例中,回放系统100可以从当前正在播放内容的元数据推断信息。在一个这样的示例中,用户可以说“将‘Let it Be’(或‘披头士’)移动到餐厅”,其识别特定音乐以移动到期望的回放区域和/或区域分组。以此方式,媒体回放系统可以在其他回放区域和/或区域分组中正在主动播放和/或排队等待回放的内容之间进行区分,以确定要转移的内容。
在又一示例中,与组头(例如,客厅)相关联的所有设备可以在将音乐从组头移动到餐厅时停止回放。在相关示例中,当音乐从客厅区域移开时,客厅区域可能失去其作为组头的头衔。
命令标准可以被配置为使用语音输入命令将设备添加到现有分组。例如,如图13A和图13B所示,用户可以通过说出“将客厅添加到餐厅”的语音输入,重新添加客厅区域以与餐厅区域形成组。在相关实施例中,用户可以通过直接向图1所示的客厅区域中的NMD 103a说出“也在这里播放”的语音输入来添加客厅。在这种情况下,用户可能没有在语音输入中明确提及客厅,但是VAS 160可以基于用户的接近程度推断出要添加客厅区域。在另一示例中,如果假设听众在有该意图时在餐厅中,则他或她可以说出命令“添加客厅”。在这种情况下,输入设备的容纳房间可以暗示餐厅目标。
在又一示例中,用户可以在语音输入中指示客厅和餐厅中的哪一个将成为组头,或者VAS 160可以请求用户指定组头。
作为添加或形成组的另一示例,用户可以使用具有与自定义区域变量相关联的关键字的语音输入实例化组。例如,用户可以为上面讨论的前部区域创建自定义区域变量。用户可以通过说出语音输入(例如,“在前部区域播放Van Halen”)来实例化前部区域分组,如图14A 和图14B所示。响应于图14A所示的语音输入,可以取代图13B所示的先前的餐厅组。
命令标准可以被配置为使用语音输入命令将设备移至现有分组。例如,用户可以说出“放弃阳台”的语音输入以将阳台从“前部区域”分组中移除,如图15A和15B所示。作为另一示例,阳台上的命令“停止/移除”可以执行相同的操作。如上所述,其他示例同源词也是可能的。在又一示例中,假设用户在阳台上,用户可以直接向图1所示阳台中的NMD 103c讲话以达到相同的结果,例如通过说“在这里停止”或“在这个房间里停止”。
命令标准可以被配置为选择音频内容源并实现相关特征。例如,图16A示出了用户向NMD 103a说出语音输入“我想看电视”。作为响应,媒体回放系统100将音频内容源从音乐源切换到电视源,如图 16B所示。在一些实施例中,指示媒体回放系统100播放电视源可以自动取消客厅与其他区域的分组。例如,在图16B中,当客厅被切换到电视源时,Van Halen继续在餐厅和厨房中播放。在一些实例中,如上所述,用户随后可以通过分组说出命令以在家居环境中的其他区域中播放电视源。
在相关实施例中,媒体回放系统100可以存储指示客厅何时与电视源连接的状态信息。当客厅处于该状态时,命令标准可以指示与电视源相关的语音命令可以由VAS实现,例如,图9B所示的源命令(例如,增强语音、打开静音模式等)。
命令标准可以被配置为绑定设备。例如,图17A示出了用户说出语音输入“我想看前置电视”。作为响应,VAS 160可以基于命令标准来确定图1中的前置回放设备102b以将其与客厅区域分开并形成电视区域,如图16B所示。在相关示例中,用户可以直接向前回放设备102b 的NMD 103b说出语音输入,以取消对该设备的绑定。客厅中其余的绑定设备,即,右、左和低音炮设备102a、102j和102k可以停止播放音乐。控制界面还可以将这些设备显示为不再是客厅区域的一部分。
作为绑定的另一示例,用户可以在分离前回放设备102b之后与客厅区域中的其余设备形成不同的绑定布置。例如,如图18A和图18B 所示,用户可以通过说出“在我的卫星箱和低音炮上播放Bob Marley 并创建收听区域”的语音输入来形成收听区域。术语“卫星箱”可以是指代右回放设备102a和左回放设备102k的自定义区域变量。图18A 中的语音输入也在新形成的收听区域中发起Bob Marley的回放。在所示的示例中,图17A-图18B中的绑定操作并未中断在餐厅和厨房区域中Van Halen的回放,如图18B的控制器界面中进一步所示。
命令标准可以被配置为配对/绑定设备。例如,图17A示出了多回合命令,其中,用户说出语音输入以“将餐厅和厨房立体声配对”。在该示例中,VAS指示一个或多个NMD 103提示用户并查询餐厅区域是否为左声道。如果用户确认餐厅为右声道,则厨房区域将为右声道。如果用户指示餐厅不是右声道,则餐厅可以默认为左声道,而厨房区域将为右声道。当合并后,餐厅和厨房中的一个可以被指定为组头。 VAS可以提示用户为绑定设备指定名称,包括唯一名称,例如,“Cocina”,如图19B所示。Cocina区域可以继续Van Halen的回放,而Van Halen可能已经从先前的餐厅和厨房区域中的任何一个的回放队列中转移了。
在相关实施例中,如图20A和图20B所示,绑定和合并设备可以使VAS发起多回合命令或其他命令来校准回放设备。在一个示例中,在将餐厅和厨房区域配对之后,VAS 160可以继续图19A中的多回合命令序列。在一些实施例中,命令标准可以要求在发起校准之前检测用户操作控制器设备103中的一个。以此方式,VAS 160可以准备校准软件(例如,SONOS的
Figure BDA0003907320010000431
软件)以进行校准,如图20B 所示。
VII.结论
以上描述尤其公开了各种示例系统、方法、装置和尤其包括在硬件上执行的固件和/或软件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
(特征1)一种为媒体回放系统调用第一语音助手服务(VAS) 的方法,所述方法包括:使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;经由网络麦克风设备的至少一个麦克风捕获语音输入;检测所述语音输入中是否包括一个或多个命令;确定所述一个或多个命令满足所述命令信息集合中的相应命令标准;以及响应于所述确定,选择第一(VAS)和放弃选择第二VAS,(ii)向所述第一VAS发送所述语音输入,(iii)在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征2)根据特征1所述的方法,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括用于将所述回放设备中的两个或更多个进行组合并在包括所述回放设备中的两个或更多个的组上发起音频内容回放的命令。
(特征3)根据特征2所述的方法,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
(特征4)根据特征2所述的方法,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
(特征5)根据特征1所述的方法,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述功能还包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
(特征6)根据特征5所述的方法,其中,所述一个或多个命令包括回放命令和传输控制命令中的至少一个。
(特征7)根据特征1所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
(特征8)根据特征1所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
(特征9)根据特征8所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括对所述回放设备中的两个或更多个中的至少一个的选择。
(特征10)根据特征8所述的方法,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括用于校准所述回放设备中的一个或多个的均衡设置的请求。
(特征11)根据特征1所述的方法,其中,所述确定包括检测语音输入源的存在。
(特征12)根据特征11所述的方法,其中,检测所述存在包括:检测所述网络麦克风设备从所述语音输入源接收所述语音输入的方向。
(特征13)根据特征11的所述方法,其中,检测所述存在包括:检测所述网络麦克风设备与所述语音输入源之间的距离。
(特征14)根据特征1所述的方法,其中,所述确定包括:检测对控制器设备的使用。
(特征15)根据特征1所述的方法,其中,所述确定包括:检测语音输入源的语音简档。
(特征16)根据特征1所述的方法,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:检测所述语音输入内的一个或多个第二命令。
(特征17)根据特征16所述的方法,其中,所述确定还包括:在所述一个或多个第一命令与所述一个或多个第二命令之间的语音输入内检测至少一个暂停。
(特征18)一种媒体回放系统的网络麦克风设备,包括:(i)处理器;(ii)至少一个麦克风;以及(iii)具有存储在其上的指令的有形计算机可读存储器,所述指令在由所述处理器执行时使所述网络麦克风设备执行媒体回放系统的功能,所述功能包括:(a)使包括命令列表和相关联命令标准的命令信息集合被存储在存储器中;(b)经由所述至少一个麦克风捕获语音输入;(c)检测所述语音输入中是否包括一个或多个命令;(d)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准;以及(e)响应于所述确定,(a)选择第一语音助手服务(VAS)和放弃选择第二VAS, (ii)向所述第一VAS发送所述语音输入,(iii)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征19)根据特征18所述的网络麦克风设备,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括用于将所述回放设备中的两个或更多个进行分组并在包括所述回放设备中的两个或更多个的分组上发起音频内容回放的命令。
(特征20)根据特征19所述的网络麦克风设备,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
(特征21)根据特征19所述的网络麦克风设备,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
(特征22)根据特征18所述的网络麦克风设备,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述功能还包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
(特征23)根据特征22所述的网络麦克风设备,其中,所述一个或多个命令包括回放命令和传输控制命令中的至少一个。
(特征24)根据特征18所述的网络麦克风设备,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
(特征25)根据特征18所述的网络麦克风设备,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
(特征26)根据特征25所述的网络麦克风设备,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括选择所述回放设备中的两个或更多个中的至少一个。
(特征27)根据特征25所述的网络麦克风设备,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括用于校准所述回放设备中的一个或多个的均衡设置的请求。
(特征28)根据特征18所述的网络麦克风设备,其中,所述确定包括检测语音输入源的存在。
(特征29)根据特征28所述的网络麦克风设备,其中,检测所述存在包括:检测所述网络麦克风设备从所述语音输入源接收所述语音输入的方向。
(特征30)根据特征28所述的网络麦克风设备,其中,检测所述存在包括:检测所述网络麦克风设备与所述语音输入源之间的距离。
(特征31)根据特征18所述的网络麦克风设备,其中,所述确定包括:检测对控制器设备的使用。
(特征32)根据特征18所述的网络麦克风设备,其中,所述确定包括:检测语音输入源的语音简档。
(特征33)根据特征18所述的网络麦克风设备,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:检测所述语音输入内的一个或多个第二命令。
(特征34)根据特征33所述的网络麦克风设备,其中,所述确定还包括:在所述一个或多个第一命令与所述一个或多个第二命令之间的语音输入内检测至少一个暂停。
(特征35)一种为媒体回放系统调用第一语音助手服务(VAS) 的方法,所述方法包括:(i)使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;(ii)经由网络麦克风设备的至少一个麦克风捕获语音输入;(iii)检测所述语音输入中是否包括一个或多个命令;(iv)确定所述一个或多个命令满足与所述命令信息集合中的一个或多个命令相关联的相应命令标准;以及(v)响应于所述确定,(a) 选择第一语音助手服务(VAS)和放弃选择第二VAS,(b)向所述第一VAS发送所述语音输入,(c)并且在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
(特征36)根据特征35所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括用于对两个或更多个回放设备进行组合并在包括以下各项的组上发起音频内容的回放的命令:所述两个或更多个回放设备,其中,所述确定包括检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下各项中的至少一个(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的组。
(功能37)一种有形的非暂时性计算机可读介质,其存储可由一个或多个处理器执行的指令,以使网络麦克风设备在媒体回放系统中执行操作,所述操作包括:(i)使包括命令列表和相关命令标准的命令信息集合被存储在存储器中;(ii)经由网络麦克风设备的至少一个麦克风捕获语音输入;(iii)检测所捕获的语音输入中的一个或多个命令;(iv)确定所述一个或多个命令满足所述命令信息集合中的一个或多个相应标准;以及(v)响应于所述确定,(a)选择第一语音助手服务(VAS)和放弃选择第二VAS,(b)向所述第一VAS发送所述语音输入,(c)在发送所述语音输入之后,处理来自所述第一VAS的对所述语音输入的响应。
主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦接到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
当随附权利要求中的任一项权利要求被理解成涵盖纯软件和/或固件实现时,在此明确限定至少一个示例中的至少一个元素以包括存储软件和/或固件的非暂时性有形介质,如存储器、DVD、CD、蓝光等。

Claims (15)

1.一种用于媒体回放系统的方法,所述方法包括:
经由网络麦克风设备中的至少一个麦克风捕获语音输入;
在所述语音输入内检测是否包括命令信息集合中所包括的一个或多个命令,所述命令信息集合包括命令列表和与所述命令相关联的命令标准,所述命令标准包括与特定命令相关联的一个或多个关键字;
当所述一个或多个命令满足与所述命令信息集合内的一个或多个命令相关联的所述命令标准时:
选择第一语音助手服务VAS和放弃选择第二VAS,
向所述第一VAS发送所述语音输入,并且
在发送所述语音输入之后,接收来自所述第一VAS的对所述语音输入的响应。
2.根据权利要求1所述的方法,其中,所述媒体回放系统包括多个回放设备,并且其中,所述一个或多个命令包括将所述回放设备中的两个或更多个回放设备进行分组并在包括所述回放设备中的两个或更多个回放设备的分组上发起音频内容回放的命令。
3.根据权利要求2所述的方法,其中,所述确定包括:检测所述语音输入中是否包括一个或多个关键字,其中,所述一个或多个关键字包括以下中的至少一个:(i)与所述两个或更多个回放设备中的一个相关联的第一关键字,以及与所述两个或更多个回放设备中的另一个相关联的第二关键字,以及(ii)包括所述两个或更多个回放设备的分组。
4.根据权利要求2或3所述的方法,其中,所述两个或更多个回放设备中的一个包括所述网络麦克风设备。
5.根据任一项前述权利要求所述的方法,其中,所述一个或多个命令被定向到所述媒体回放系统,并且其中,所述方法功能包括:基于来自所述第一VAS的响应,经由所述媒体回放系统来处理所述一个或多个命令。
6.根据任一项前述权利要求所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出声音提示。
7.根据任一项前述权利要求所述的方法,其中,所述语音输入是第一语音输入,并且其中,所述功能还包括:基于来自所述第一VAS的响应,输出用于第二语音输入的声音提示。
8.根据权利要求7所述的方法,其中,所述媒体回放系统包括多个回放设备,其中,所述一个或多个命令包括将所述回放设备中的两个或更多个配对的命令,其中,所述声音提示包括将所述回放设备中的两个或更多个中的至少一个分配给音频声道的请求,并且其中,所述第二语音输入包括对所述回放设备中的两个或更多个中的至少一个的选择。
9.根据权利要求7或8所述的方法,其中,所述媒体回放系统包括一个或多个回放设备,并且其中,所述声音提示包括校准所述回放设备中的一个或多个回放设备的均衡设置的请求。
10.根据前述权利要求中任一项所述的方法,其中,所述一个或多个命令是一个或多个第一命令,并且其中,所述确定包括:
检测所述语音输入内的一个或多个第二命令;以及
检测所述语音输入内的在所述一个或多个第一命令与所述一个或多个第二命令之间的至少一个暂停。
11.根据前述权利要求中任一项所述的方法,其中,所述命令信息集合被存储在所述媒体回放系统的一个或多个网络设备的存储器中。
12.根据权利要求11所述的方法,其中,所述媒体播放系统的网络设备通过局域网连接。
13.根据前述权利要求中任一项所述的方法,其中,所捕获的语音输入包括唤醒词。
14.一种计算机可读存储器,包括指令,所述指令当由一个或多个处理器执行时,使网络麦克风设备执行权利要求1-13中任一项所述的方法。
15.一种网络麦克风设备,包括:
一个或多个麦克风;
一个或多个处理器;以及
根据权利要求14所述的计算机可读存储器。
CN202211314552.0A 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统 Pending CN115857747A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US15/721,141 2017-09-29
US15/721,141 US10466962B2 (en) 2017-09-29 2017-09-29 Media playback system with voice assistance
CN201880077216.4A CN111418216B (zh) 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统
PCT/US2018/053472 WO2019067930A1 (en) 2017-09-29 2018-09-28 MULTIMEDIA VOICE ASSISTED READING SYSTEM

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880077216.4A Division CN111418216B (zh) 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统

Publications (1)

Publication Number Publication Date
CN115857747A true CN115857747A (zh) 2023-03-28

Family

ID=63963452

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211314552.0A Pending CN115857747A (zh) 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统
CN201880077216.4A Active CN111418216B (zh) 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201880077216.4A Active CN111418216B (zh) 2017-09-29 2018-09-28 具有语音辅助的媒体回放系统

Country Status (8)

Country Link
US (5) US10466962B2 (zh)
EP (2) EP3688995B1 (zh)
JP (3) JP6987230B2 (zh)
KR (3) KR102597285B1 (zh)
CN (2) CN115857747A (zh)
AU (2) AU2018338812A1 (zh)
CA (1) CA3084279A1 (zh)
WO (1) WO2019067930A1 (zh)

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9954996B2 (en) 2007-06-28 2018-04-24 Apple Inc. Portable electronic device with conversation management for incoming instant messages
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8689128B2 (en) 2009-03-16 2014-04-01 Apple Inc. Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10706096B2 (en) 2011-08-18 2020-07-07 Apple Inc. Management of local and remote media items
US9002322B2 (en) 2011-09-29 2015-04-07 Apple Inc. Authentication with secondary approver
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014143776A2 (en) 2013-03-15 2014-09-18 Bodhi Technology Ventures Llc Providing remote interactions with host device using a wireless device
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
EP3149554B1 (en) 2014-05-30 2024-05-01 Apple Inc. Continuity
US20150350141A1 (en) 2014-05-31 2015-12-03 Apple Inc. Message user interfaces for capture and transmittal of media and location content
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10339293B2 (en) 2014-08-15 2019-07-02 Apple Inc. Authenticated device used to unlock another device
WO2016036541A2 (en) 2014-09-02 2016-03-10 Apple Inc. Phone user interface
CN113824998A (zh) 2014-09-02 2021-12-21 苹果公司 音乐用户界面
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
DK179186B1 (en) 2016-05-19 2018-01-15 Apple Inc REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670622A1 (en) 2016-06-12 2018-02-12 Apple Inc User interfaces for transactions
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US11431836B2 (en) 2017-05-02 2022-08-30 Apple Inc. Methods and interfaces for initiating media playback
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US10928980B2 (en) 2017-05-12 2021-02-23 Apple Inc. User interfaces for playing and managing audio items
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
CN111343060B (zh) 2017-05-16 2022-02-11 苹果公司 用于家庭媒体控制的方法和界面
US20220279063A1 (en) 2017-05-16 2022-09-01 Apple Inc. Methods and interfaces for home media control
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10372298B2 (en) 2017-09-29 2019-08-06 Apple Inc. User interface for multi-user communication session
JP7192208B2 (ja) * 2017-12-01 2022-12-20 ヤマハ株式会社 機器制御システム、デバイス、プログラム、及び機器制御方法
US10157042B1 (en) * 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
CN108428452B (zh) * 2018-03-14 2019-12-13 百度在线网络技术(北京)有限公司 终端支架和远场语音交互系统
CN108510987B (zh) * 2018-03-26 2020-10-23 北京小米移动软件有限公司 语音处理方法及装置
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US20190311710A1 (en) * 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US11250840B1 (en) 2018-04-09 2022-02-15 Perceive Corporation Machine-trained network detecting context-sensitive wake expressions for a digital assistant
US10629203B2 (en) * 2018-04-17 2020-04-21 Flex, Ltd. Method and systems for bookmarking complex commands using voice
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
DK180130B1 (da) 2018-05-07 2020-06-02 Apple Inc. Multi-participant live communication user interface
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10938994B2 (en) * 2018-06-25 2021-03-02 Cypress Semiconductor Corporation Beamformer and acoustic echo canceller (AEC) system
CN108922528B (zh) * 2018-06-29 2020-10-23 百度在线网络技术(北京)有限公司 用于处理语音的方法和装置
US11189275B2 (en) * 2018-08-02 2021-11-30 Polycom, Inc. Natural language processing while sound sensor is muted
KR20200034430A (ko) * 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
US11087754B2 (en) 2018-09-27 2021-08-10 Coretronic Corporation Intelligent voice system and method for controlling projector by using the intelligent voice system
US11100926B2 (en) * 2018-09-27 2021-08-24 Coretronic Corporation Intelligent voice system and method for controlling projector by using the intelligent voice system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11128792B2 (en) 2018-09-28 2021-09-21 Apple Inc. Capturing and displaying images with multiple focal planes
US10978046B2 (en) * 2018-10-15 2021-04-13 Midea Group Co., Ltd. System and method for customizing portable natural language processing interface for appliances
KR20200109467A (ko) * 2019-03-13 2020-09-23 삼성전자주식회사 전자 장치 및 그 제어 방법
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
JP7236919B2 (ja) * 2019-04-12 2023-03-10 三菱電機株式会社 音声入力装置、音声操作システム、音声操作方法及びプログラム
CN110109645A (zh) * 2019-04-30 2019-08-09 百度在线网络技术(北京)有限公司 一种交互式音乐试听方法、装置和终端
US11973894B2 (en) 2019-04-30 2024-04-30 Apple Inc. Utilizing context information with an electronic device
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11544463B2 (en) 2019-05-09 2023-01-03 Intel Corporation Time asynchronous spoken intent detection
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970533A1 (en) 2019-05-31 2021-02-15 Apple Inc Methods and user interfaces for sharing audio
US11010121B2 (en) 2019-05-31 2021-05-18 Apple Inc. User interfaces for audio media control
US10867608B1 (en) 2019-05-31 2020-12-15 Apple Inc. Multi-user configuration
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11363071B2 (en) 2019-05-31 2022-06-14 Apple Inc. User interfaces for managing a local network
US10904029B2 (en) 2019-05-31 2021-01-26 Apple Inc. User interfaces for managing controllable external devices
KR102436985B1 (ko) 2019-05-31 2022-08-29 애플 인크. 오디오 미디어 제어를 위한 사용자 인터페이스
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
WO2020246634A1 (ko) * 2019-06-04 2020-12-10 엘지전자 주식회사 다른 기기의 동작을 제어할 수 있는 인공 지능 기기 및 그의 동작 방법
KR20210055347A (ko) * 2019-11-07 2021-05-17 엘지전자 주식회사 인공 지능 장치
CN111601163B (zh) * 2020-04-26 2023-03-03 百度在线网络技术(北京)有限公司 播放控制方法、装置、电子设备及存储介质
US11659229B2 (en) 2020-04-29 2023-05-23 Arris Enterprises Llc System and method for management and presentation of alternate media
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
EP3910467A1 (en) * 2020-05-11 2021-11-17 Apple Inc. Digital assistant hardware abstraction
KR102523917B1 (ko) * 2020-05-11 2023-04-19 애플 인크. 디지털 어시스턴트 하드웨어 추출
CN112732624A (zh) * 2020-05-11 2021-04-30 苹果公司 数字助理硬件抽象
US11513667B2 (en) * 2020-05-11 2022-11-29 Apple Inc. User interface for audio message
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
EP4162698A1 (en) * 2020-06-08 2023-04-12 Sonos Inc. Control with distributed command processing
CN111724784A (zh) * 2020-06-28 2020-09-29 北京小米松果电子有限公司 设备控制方法及装置
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112165640B (zh) * 2020-09-21 2023-04-14 Vidaa美国公司 一种显示设备
US11392291B2 (en) 2020-09-25 2022-07-19 Apple Inc. Methods and interfaces for media control with dynamic feedback
US11657814B2 (en) * 2020-10-08 2023-05-23 Harman International Industries, Incorporated Techniques for dynamic auditory phrase completion
CN112507708B (zh) * 2020-12-16 2023-09-15 青岛海尔科技有限公司 信息录入方法、装置、存储介质及电子装置
US11431891B2 (en) 2021-01-31 2022-08-30 Apple Inc. User interfaces for wide angle video conference
CN113205807B (zh) * 2021-04-06 2023-08-29 珠海格力电器股份有限公司 一种语音设备的控制方法、装置、存储介质及语音设备
US11449188B1 (en) 2021-05-15 2022-09-20 Apple Inc. Shared-content session user interfaces
US11907605B2 (en) 2021-05-15 2024-02-20 Apple Inc. Shared-content session user interfaces
US11893214B2 (en) 2021-05-15 2024-02-06 Apple Inc. Real-time communication user interface
US11847378B2 (en) 2021-06-06 2023-12-19 Apple Inc. User interfaces for audio routing
US11960615B2 (en) 2021-06-06 2024-04-16 Apple Inc. Methods and user interfaces for voice-based user profile management
US11575758B1 (en) * 2021-09-13 2023-02-07 Amazon Technologies, Inc. Session-based device grouping
US11770600B2 (en) 2021-09-24 2023-09-26 Apple Inc. Wide angle video conference
WO2023056258A1 (en) 2021-09-30 2023-04-06 Sonos, Inc. Conflict management for wake-word detection processes
US11977816B1 (en) * 2022-08-25 2024-05-07 Amazon Technologies, Inc. Time-based context for voice user interface
US11886773B1 (en) 2023-03-28 2024-01-30 Volley Inc. Systems and methods for a voice-controlled interactive application

Family Cites Families (1219)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US999715A (en) 1911-05-31 1911-08-01 Hans Gundersen Flying-machine.
US4941187A (en) 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US4741038A (en) 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPS63301998A (ja) 1987-06-02 1988-12-08 日本電気株式会社 音声認識応答装置
US4974213A (en) 1988-12-16 1990-11-27 Siwecki Thomas L Passive active underwater sound detection apparatus
US5036538A (en) 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5440644A (en) 1991-01-09 1995-08-08 Square D Company Audio distribution system having programmable zoning features
EP0548836B1 (en) 1991-12-20 1997-06-11 Matsushita Electric Industrial Co., Ltd. A bass reproduction speaker apparatus
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JPH0883091A (ja) 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 音声認識装置
US5740260A (en) 1995-05-22 1998-04-14 Presonus L.L.P. Midi to analog sound processor interface
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5857172A (en) 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
US7174299B2 (en) 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
FR2739736B1 (fr) 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3094900B2 (ja) 1996-02-20 2000-10-03 ヤマハ株式会社 ネットワーク機器およびデータ送受信方法
US6404811B1 (en) 1996-05-13 2002-06-11 Tektronix, Inc. Interactive multimedia system
JP3679526B2 (ja) 1996-10-31 2005-08-03 キヤノン株式会社 画像共有装置、画面制御方法及びコンピュータ可読メモリ
US6469633B1 (en) 1997-01-06 2002-10-22 Openglobe Inc. Remote control of electronic devices
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6611537B1 (en) 1997-05-30 2003-08-26 Centillium Communications, Inc. Synchronous network for digital media streams
US6088459A (en) 1997-10-30 2000-07-11 Hobelsberger; Maximilian Hans Loudspeaker system with simulated baffle for improved base reproduction
US6408078B1 (en) 1997-10-30 2002-06-18 Maximilian Hobelsberger Active reactive acoustical elements
US6032202A (en) 1998-01-06 2000-02-29 Sony Corporation Of Japan Home audio/video network with two level device control
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US6301603B1 (en) 1998-02-17 2001-10-09 Euphonics Incorporated Scalable audio processing on a heterogeneous processor array
US6953886B1 (en) 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
US6839410B2 (en) 1998-09-01 2005-01-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
EP1125277A4 (en) 1998-10-02 2002-02-20 Ibm STRUCTURAL SKELETON FOR EFFICIENT VOICE NAVIGATION BY GENERICALLY HIERARCHICAL OBJECTS
US20020116196A1 (en) 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US6243676B1 (en) 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US7130616B2 (en) 2000-04-25 2006-10-31 Simple Devices System and method for providing content, management, and interactivity for client devices
US6256554B1 (en) 1999-04-14 2001-07-03 Dilorenzo Mark Multi-room entertainment system with in-room media player/dispenser
US6414251B1 (en) 1999-04-19 2002-07-02 Breck Colquett Weighing apparatus and method having automatic tolerance analysis and calibration
US7657910B1 (en) 1999-07-26 2010-02-02 E-Cast Inc. Distributed electronic entertainment method and apparatus
GB2352933A (en) 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6542868B1 (en) 1999-09-23 2003-04-01 International Business Machines Corporation Audio notification management system
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6611604B1 (en) 1999-10-22 2003-08-26 Stillwater Designs & Audio, Inc. Ultra low frequency transducer and loud speaker comprising same
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6594630B1 (en) * 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US6522886B1 (en) 1999-11-22 2003-02-18 Qwest Communications International Inc. Method and system for simultaneously sharing wireless communications among multiple wireless handsets
US6219645B1 (en) 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
DE69935147T2 (de) 1999-12-03 2007-10-31 Telefonaktiebolaget Lm Ericsson (Publ) Verfahren zur gleichzeitigen Wiedergabe von Audio Signalen in zwei Telefonen
KR20010054622A (ko) 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US20010042107A1 (en) 2000-01-06 2001-11-15 Palm Stephen R. Networked audio player transport protocol and architecture
US7661107B1 (en) 2000-01-18 2010-02-09 Advanced Micro Devices, Inc. Method and apparatus for dynamic allocation of processing resources
WO2001053963A1 (en) 2000-01-24 2001-07-26 Zapmedia, Inc. System and method for the distribution and sharing of media assets between media players devices
WO2001053994A2 (en) 2000-01-24 2001-07-26 Friskit, Inc. Streaming media search and playback system
ATE372625T1 (de) 2000-02-18 2007-09-15 Bridgeco Ag Mehrtor-brücke zur lieferung von netzwerkverbindungen
JP2001236093A (ja) 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
US6631410B1 (en) 2000-03-16 2003-10-07 Sharp Laboratories Of America, Inc. Multimedia wired/wireless content synchronization system and method
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
AU4219601A (en) 2000-03-31 2001-10-15 Classwave Wireless Inc. Dynamic protocol selection and routing of content to mobile devices
GB2363036B (en) 2000-05-31 2004-05-12 Nokia Mobile Phones Ltd Conference call method and apparatus therefor
US20050164664A1 (en) 2000-07-21 2005-07-28 Difonzo Daniel F. Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks
US20040105566A1 (en) 2000-07-27 2004-06-03 International Business Machines Corporation Body set type speaker unit
US8165867B1 (en) 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US20020054685A1 (en) 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US20020072816A1 (en) 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6778869B2 (en) 2000-12-11 2004-08-17 Sony Corporation System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment
US7143939B2 (en) 2000-12-19 2006-12-05 Intel Corporation Wireless music device and method therefor
US20020124097A1 (en) 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6885989B2 (en) 2001-04-02 2005-04-26 International Business Machines Corporation Method and system for collaborative speech recognition for small-area network
US6757517B2 (en) 2001-05-10 2004-06-29 Chin-Chi Chang Apparatus and method for coordinated music playback in wireless ad-hoc networks
US7136934B2 (en) 2001-06-19 2006-11-14 Request, Inc. Multimedia synchronization method and device
KR100420069B1 (ko) 2001-08-23 2004-02-25 한국과학기술원 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법
US6892083B2 (en) 2001-09-05 2005-05-10 Vocera Communications Inc. Voice-controlled wireless communications system and method
US7536704B2 (en) 2001-10-05 2009-05-19 Opentv, Inc. Method and apparatus automatic pause and resume of playback for a popup on interactive TV
CA2407123C (en) 2001-10-16 2007-12-18 Audio Products International Corp. Low distortion loudspeaker cone suspension
CA2408045A1 (en) 2001-10-16 2003-04-16 Audio Products International Corp. Loudspeaker with large displacement motional feedback
US7006639B2 (en) 2001-11-20 2006-02-28 Maximilian Hans Hobelsberger Active noise-attenuating duct element
US7103542B2 (en) 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
AU2002361767A1 (en) 2001-12-17 2003-07-09 Becomm Corporation Method and system for synchronization of content rendering
DE10163213A1 (de) 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
US8103009B2 (en) 2002-01-25 2012-01-24 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
US7853341B2 (en) 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP4086280B2 (ja) 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
AU2003216319A1 (en) 2002-02-20 2003-09-09 Meshnetworks, Inc. A system and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity
JP3715584B2 (ja) 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
WO2003093950A2 (en) 2002-05-06 2003-11-13 David Goldberg Localized audio networks and associated digital accessories
KR100966415B1 (ko) 2002-05-09 2010-06-28 넷스트림스 엘엘씨 오디오 네트워크 분산 시스템
US6961423B2 (en) 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
JP3815388B2 (ja) 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
US8060225B2 (en) 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
DE60210177T2 (de) 2002-08-14 2006-12-28 Sony Deutschland Gmbh Bandbreitenorientierte Neukonfigurierung von drahtlosen Ad-Hoc-Netzen
JP3910898B2 (ja) 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
US7228275B1 (en) 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
JP2004163590A (ja) 2002-11-12 2004-06-10 Denso Corp 再生装置及びプログラム
KR20040042242A (ko) 2002-11-13 2004-05-20 삼성전자주식회사 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템
US7295548B2 (en) 2002-11-27 2007-11-13 Microsoft Corporation Method and system for disaggregating audio/visual components
CN100392723C (zh) 2002-12-11 2008-06-04 索夫塔马克斯公司 在稳定性约束下使用独立分量分析的语音处理系统和方法
US7076428B2 (en) * 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
KR100668297B1 (ko) 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US6823050B2 (en) 2003-02-13 2004-11-23 International Business Machines Corporation System and method for interfacing with a personal telephony recorder
WO2004079929A2 (en) 2003-03-03 2004-09-16 America Online, Inc. Source audio identifiers for digital communications
JP2004347943A (ja) 2003-05-23 2004-12-09 Clarion Co Ltd データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2004354721A (ja) 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US7961892B2 (en) 2003-07-28 2011-06-14 Texas Instruments Incorporated Apparatus and method for monitoring speaker cone displacement in an audio speaker
US7571014B1 (en) 2004-04-01 2009-08-04 Sonos, Inc. Method and apparatus for controlling multimedia players in a multi-zone system
US9207905B2 (en) 2003-07-28 2015-12-08 Sonos, Inc. Method and apparatus for providing synchrony group status information
US20050031134A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using infrared light
US20050031138A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of measuring a cant of an actuator
US20050031140A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using a capacitance measurement
US20060104451A1 (en) 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
US20050031132A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Control system
US20050031131A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of modifying dynamics of a system
US20050031139A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using impedance
US20050031133A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Process for position indication
US20050031137A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Calibration of an actuator
KR20050023841A (ko) 2003-09-03 2005-03-10 삼성전자주식회사 비선형 왜곡 저감 방법 및 장치
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US20050077843A1 (en) 2003-10-11 2005-04-14 Ronnie Benditt Method and apparatus for controlling a performing arts show by an onstage performer
KR20060093722A (ko) 2003-10-24 2006-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 적응성 사운드 재생
DE602004021716D1 (de) 2003-11-12 2009-08-06 Honda Motor Co Ltd Spracherkennungssystem
US7705565B2 (en) 2003-12-31 2010-04-27 Motorola, Inc. Method and system for wireless charging
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4269973B2 (ja) 2004-02-27 2009-05-27 株式会社デンソー カーオーディオシステム
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7483538B2 (en) 2004-03-02 2009-01-27 Ksc Industries, Inc. Wireless and wired speaker hub for a home theater system
JP4059214B2 (ja) 2004-03-04 2008-03-12 ソニー株式会社 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム
US10200504B2 (en) 2007-06-12 2019-02-05 Icontrol Networks, Inc. Communication protocols over internet protocol (IP) networks
US7372966B2 (en) 2004-03-19 2008-05-13 Nokia Corporation System for limiting loudspeaker displacement
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7630501B2 (en) 2004-05-14 2009-12-08 Microsoft Corporation System and method for calibration of an acoustic system
US7792311B1 (en) 2004-05-15 2010-09-07 Sonos, Inc., Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7006938B2 (en) 2004-06-16 2006-02-28 Ami Semiconductor, Inc. Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US20060004834A1 (en) 2004-06-30 2006-01-05 Nokia Corporation Dynamic shortcuts
JP2006092482A (ja) 2004-09-27 2006-04-06 Yamaha Corp 音声認識通報装置
US7720232B2 (en) 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8386523B2 (en) 2004-12-30 2013-02-26 Texas Instruments Incorporated Random access audio decoder
TWI272860B (en) 2005-01-03 2007-02-01 Lite On Technology Corp Audio receiver and volume reminder method
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
EP1844392B1 (en) 2005-01-21 2012-07-04 Certicom Corp. Elliptic curve random number generation
US20060190968A1 (en) 2005-01-31 2006-08-24 Searete Llc, A Limited Corporation Of The State Of The State Of Delaware Sharing between shared audio devices
US8594320B2 (en) 2005-04-19 2013-11-26 (Epfl) Ecole Polytechnique Federale De Lausanne Hybrid echo and noise suppression method and device in a multi-channel audio signal
EP1715669A1 (en) 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
US7991167B2 (en) 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
JP4760160B2 (ja) 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP4804052B2 (ja) 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US20070018844A1 (en) 2005-07-19 2007-01-25 Sehat Sutardja Two way remote control
JP4285457B2 (ja) 2005-07-20 2009-06-24 ソニー株式会社 音場測定装置及び音場測定方法
EP1912468B1 (en) 2005-07-29 2013-08-14 Panasonic Corporation Loudspeaker device
CN1909625A (zh) 2005-08-05 2007-02-07 鸿富锦精密工业(深圳)有限公司 一种自动调整音量的电视装置及控制方法
KR20080043358A (ko) 2005-08-19 2008-05-16 그레이스노트 아이엔씨 재생 디바이스의 동작을 제어하는 방법 및 시스템
US20070060054A1 (en) 2005-09-15 2007-03-15 Sony Ericsson Mobile Communications Ab Wireless home communication system method and apparatus
JP4519041B2 (ja) 2005-09-20 2010-08-04 ローランド株式会社 楽器用スピーカ装置
WO2007034392A2 (en) 2005-09-21 2007-03-29 Koninklijke Philips Electronics N.V. Ultrasound imaging system with voice activated controls using remotely positioned microphone
EP1952619B1 (en) 2005-11-07 2018-02-28 Telecom Italia S.p.A. Method for managing a conference call in a telephone network
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
US8135143B2 (en) 2005-11-15 2012-03-13 Yamaha Corporation Remote conference apparatus and sound emitting/collecting apparatus
US20070140058A1 (en) 2005-11-21 2007-06-21 Motorola, Inc. Method and system for correcting transducer non-linearities
US7600194B2 (en) 2005-12-02 2009-10-06 Microsoft Corporation Start menu operation for computer user interface
JP4677341B2 (ja) 2005-12-21 2011-04-27 パイオニア株式会社 スピーカー装置及び携帯電話機
JP2007174233A (ja) 2005-12-21 2007-07-05 Pioneer Electronic Corp スピーカー装置及び携帯電話機
US20160066087A1 (en) 2006-01-30 2016-03-03 Ludger Solbach Joint noise suppression and acoustic echo cancellation
KR100762636B1 (ko) 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
JP4422692B2 (ja) 2006-03-03 2010-02-24 日本電信電話株式会社 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体
EP1999993A4 (en) 2006-03-06 2011-03-30 Gen Innovations Inc POSITIONALLY SEQUENCED SPEAKER SYSTEM
CN101449538A (zh) 2006-04-04 2009-06-03 约翰逊控制技术公司 媒体文件的文本-语法改进
ATE423433T1 (de) 2006-04-18 2009-03-15 Harman Becker Automotive Sys System und verfahren zur mehrkanal- echokompensation
KR100786108B1 (ko) 2006-05-01 2007-12-18 김준식 음파통신 네트워크
ATE436151T1 (de) 2006-05-10 2009-07-15 Harman Becker Automotive Sys Kompensation von mehrkanalechos durch dekorrelation
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
JP4984683B2 (ja) 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US8189765B2 (en) 2006-07-06 2012-05-29 Panasonic Corporation Multichannel echo canceller
US20080037814A1 (en) 2006-08-09 2008-02-14 Jeng-Jye Shau Precision audio speakers
EP2050304B1 (en) 2006-08-10 2018-10-24 Claudio Lastrucci Improvements to systems for acoustic diffusion
US10013381B2 (en) 2006-08-31 2018-07-03 Bose Corporation Media playing from a docked handheld media device
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8473618B2 (en) 2006-09-19 2013-06-25 Motorola Solutions, Inc. Method and system for processing multiple communication sessions in a communication network
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
TWI435591B (zh) 2006-10-17 2014-04-21 Marvell World Trade Ltd 用於蜂巢電話之顯示控制
US7747293B2 (en) 2006-10-17 2010-06-29 Marvell Worl Trade Ltd. Display control for cellular phone
EP2080272B1 (en) 2006-10-17 2019-08-21 D&M Holdings, Inc. Unification of multimedia devices
US9124650B2 (en) 2006-12-13 2015-09-01 Quickplay Media Inc. Digital rights management in a mobile environment
US8391501B2 (en) 2006-12-13 2013-03-05 Motorola Mobility Llc Method and apparatus for mixing priority and non-priority audio signals
US20080146289A1 (en) 2006-12-14 2008-06-19 Motorola, Inc. Automatic audio transducer adjustments based upon orientation of a mobile communication device
JP2008158868A (ja) 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
US7973857B2 (en) 2006-12-27 2011-07-05 Nokia Corporation Teleconference group formation using context information
US20090013255A1 (en) 2006-12-30 2009-01-08 Matthew John Yuschik Method and System for Supporting Graphical User Interfaces
KR101316750B1 (ko) 2007-01-23 2013-10-08 삼성전자주식회사 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법
TW200833152A (en) 2007-01-31 2008-08-01 Bluepacket Comm Co Ltd Multimedia switching system
WO2008096414A1 (ja) 2007-02-06 2008-08-14 Pioneer Corporation コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体
US20090228919A1 (en) 2007-11-16 2009-09-10 Zott Joseph A Media playlist management and viewing remote control
US20080208594A1 (en) 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
JP4728982B2 (ja) 2007-03-05 2011-07-20 株式会社東芝 利用者と対話する装置、方法およびプログラム
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8996379B2 (en) 2007-03-07 2015-03-31 Vlingo Corporation Speech recognition text entry for software applications
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8019076B1 (en) 2007-03-14 2011-09-13 Clearone Communications, Inc. Portable speakerphone device and subsystem utilizing false doubletalk detection
GB0706074D0 (en) 2007-03-28 2007-05-09 Skype Ltd Detection of communication states
US8983051B2 (en) 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8406439B1 (en) 2007-04-04 2013-03-26 At&T Intellectual Property I, L.P. Methods and systems for synthetic audio placement
US8848879B1 (en) 2007-05-03 2014-09-30 Avaya Inc. Customizable notification based on recent communication history
KR100827613B1 (ko) 2007-05-04 2008-05-07 삼성전자주식회사 휴대용 단말기의 마이크 제어 장치 및 방법
US8041565B1 (en) 2007-05-04 2011-10-18 Foneweb, Inc. Precision speech to text conversion
US8032383B1 (en) 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8136040B2 (en) 2007-05-16 2012-03-13 Apple Inc. Audio variance for multiple windows
BRPI0810285A2 (pt) 2007-05-18 2014-12-30 Shorthand Mobile Inc "sistema e processo para comunicações aperfeiçoadas via sistemas de comunicação de pequena taxa de dados"
US20080291916A1 (en) 2007-05-22 2008-11-27 Bo Xiong Systems and methods for dynamic quality of service
EP1998446A1 (en) 2007-05-31 2008-12-03 Alcatel Lucent Remote control for devices with connectivity to a service delivery platform
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
JP4985151B2 (ja) 2007-06-29 2012-07-25 ヤマハ株式会社 コンテンツ配信システム及びセンタ装置
JP4916394B2 (ja) 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
US8323201B2 (en) 2007-08-06 2012-12-04 Orison Corporation System and method for three-dimensional ultrasound imaging
US20090046866A1 (en) 2007-08-15 2009-02-19 Fortemedia, Inc. Apparatus capable of performing acoustic echo cancellation and a method thereof
US8073125B2 (en) 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US7844724B2 (en) 2007-10-24 2010-11-30 Social Communications Company Automated real-time data stream switching in a shared virtual area communication environment
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8013720B2 (en) 2007-11-02 2011-09-06 Reverse Control, Inc. Signal apparatus for facilitating safe backup of vehicles
CN103648071B (zh) 2007-11-20 2018-11-02 松下知识产权经营株式会社 扬声器、视频设备、以及便携式信息处理装置
US9247346B2 (en) 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US20090153289A1 (en) 2007-12-12 2009-06-18 Eric James Hope Handheld electronic devices with bimodal remote control functionality
US9386154B2 (en) 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8473081B2 (en) 2007-12-25 2013-06-25 Personics Holdings, Inc. Method and system for event reminder using an earpiece
US8423893B2 (en) 2008-01-07 2013-04-16 Altec Lansing Australia Pty Limited User interface for managing the operation of networked media playback devices
US9992314B2 (en) 2008-01-24 2018-06-05 Garmin Switzerland Gmbh Automatic device mode switching
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE102008039330A1 (de) 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8072905B2 (en) 2008-02-04 2011-12-06 Sony Ericsson Mobile Communications Ab Intelligent interaction between devices in a local network
US8213598B2 (en) 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression
US8638908B2 (en) 2008-02-28 2014-01-28 Computer Products Introductions, Corp Contextual conversation processing in telecommunication applications
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
US20090248397A1 (en) 2008-03-25 2009-10-01 Microsoft Corporation Service Initiation Techniques
WO2009120301A2 (en) 2008-03-25 2009-10-01 Square Products Corporation System and method for simultaneous media presentation
US7516068B1 (en) 2008-04-07 2009-04-07 International Business Machines Corporation Optimized collection of audio for speech recognition
CN101562671A (zh) 2008-04-18 2009-10-21 鸿富锦精密工业(深圳)有限公司 音频设备的音量控制方法及通信装置
WO2009133719A1 (ja) 2008-04-30 2009-11-05 日本電気株式会社 音響モデル学習装置および音声認識装置
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8831948B2 (en) 2008-06-06 2014-09-09 At&T Intellectual Property I, L.P. System and method for synthetically generated speech describing media content
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8325909B2 (en) 2008-06-25 2012-12-04 Microsoft Corporation Acoustic echo suppression
US8693663B2 (en) 2008-06-27 2014-04-08 Centurylink Intellectual Property Llc System and method for implementing do-not-disturb during playback of media content
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8505056B2 (en) 2008-07-10 2013-08-06 Apple Inc. Updating properties of remote A/V performance nodes
EP2146519B1 (en) 2008-07-16 2012-06-06 Nuance Communications, Inc. Beamforming pre-processing for speaker localization
US8781833B2 (en) 2008-07-17 2014-07-15 Nuance Communications, Inc. Speech recognition semantic classification training
US8639830B2 (en) 2008-07-22 2014-01-28 Control4 Corporation System and method for streaming audio
US8325938B2 (en) 2008-08-12 2012-12-04 Sony Corporation Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method
JP5206234B2 (ja) 2008-08-27 2013-06-12 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US8676586B2 (en) 2008-09-16 2014-03-18 Nice Systems Ltd Method and apparatus for interaction or discourse analytics
KR20100034229A (ko) 2008-09-23 2010-04-01 삼성전자주식회사 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
EP2351021B1 (en) 2008-11-10 2017-09-06 Google, Inc. Determining an operating mode based on the orientation of a mobile device
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
US8095368B2 (en) * 2008-12-04 2012-01-10 At&T Intellectual Property I, L.P. System and method for voice authentication over a computer network
JP5347472B2 (ja) 2008-12-12 2013-11-20 ヤマハ株式会社 遠隔制御装置および遠隔制御システム
US8548812B2 (en) 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
KR101467796B1 (ko) 2009-01-12 2014-12-10 엘지전자 주식회사 이동단말기 및 그 제어 방법
US8351617B2 (en) 2009-01-13 2013-01-08 Fortemedia, Inc. Method for phase mismatch calibration for an array microphone and phase calibration module for the same
US20100179874A1 (en) 2009-01-13 2010-07-15 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons and brands
US20130283169A1 (en) 2012-04-24 2013-10-24 Social Communications Company Voice-based virtual area navigation
US8428758B2 (en) 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
FR2943875A1 (fr) 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
KR101064976B1 (ko) 2009-04-06 2011-09-15 한국과학기술원 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇
US8243949B2 (en) 2009-04-14 2012-08-14 Plantronics, Inc. Network addressible loudspeaker and audio play
CN102804747B (zh) 2009-04-15 2014-04-02 弗兰霍菲尔运输应用研究公司 多通道回波对消器
US8483398B2 (en) 2009-04-30 2013-07-09 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses
JP5550456B2 (ja) 2009-06-04 2014-07-16 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
JP4820434B2 (ja) 2009-06-08 2011-11-24 レノボ・シンガポール・プライベート・リミテッド マイクロフォンのミュート・コントロール
US20100332236A1 (en) 2009-06-25 2010-12-30 Blueant Wireless Pty Limited Voice-triggered operation of electronic devices
US8625775B2 (en) 2009-08-06 2014-01-07 Hti Ip, L.L.C. Method and system for reducing echo and noise in a vehicle passenger compartment environment
US8478982B2 (en) 2009-08-06 2013-07-02 Broadcom Corporation Media access control security management in physical layer
JP5440053B2 (ja) 2009-09-14 2014-03-12 ソニー株式会社 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
WO2011033887A1 (ja) 2009-09-17 2011-03-24 株式会社日立メディコ 超音波探触子及び超音波撮像装置
US20110091055A1 (en) 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
US8600073B2 (en) 2009-11-04 2013-12-03 Cambridge Silicon Radio Limited Wind noise suppression
KR101301535B1 (ko) 2009-12-02 2013-09-04 한국전자통신연구원 하이브리드 번역 장치 및 그 방법
US20110145581A1 (en) 2009-12-14 2011-06-16 Verizon Patent And Licensing, Inc. Media playback across devices
JP5641186B2 (ja) 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
NO332437B1 (no) 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011091402A1 (en) 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8713571B2 (en) 2010-02-17 2014-04-29 Microsoft Corporation Asynchronous task execution
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9209987B2 (en) 2010-03-02 2015-12-08 Microsoft Technology Licensing, Llc Social media playback
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9514476B2 (en) 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8437339B2 (en) 2010-04-28 2013-05-07 Hewlett-Packard Development Company, L.P. Techniques to provide integrated voice service management
JP5572445B2 (ja) 2010-04-30 2014-08-13 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
EP3418917B1 (en) 2010-05-04 2022-08-17 Apple Inc. Methods and systems for synchronizing media
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
EP2986034B1 (en) 2010-05-06 2017-05-31 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9736600B2 (en) 2010-05-17 2017-08-15 Iii Holdings 4, Llc Devices and methods for collecting acoustic data
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
US20110289506A1 (en) 2010-05-18 2011-11-24 Google Inc. Management of computing resources for applications
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8831761B2 (en) 2010-06-02 2014-09-09 Sony Corporation Method for determining a processed audio signal and a handheld device
JP2011259097A (ja) 2010-06-07 2011-12-22 Sony Corp 音声信号処理装置及び音声信号処理方法
US8588849B2 (en) 2010-07-09 2013-11-19 Blackberry Limited System and method for resuming media
US8699723B2 (en) 2010-07-20 2014-04-15 International Business Machines Corporation Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device
US8762144B2 (en) * 2010-07-21 2014-06-24 Samsung Electronics Co., Ltd. Method and apparatus for voice activity detection
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9349368B1 (en) 2010-08-05 2016-05-24 Google Inc. Generating an audio notification based on detection of a triggering event
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
US9237383B2 (en) 2010-08-27 2016-01-12 Intel Corporation Peer to peer streaming of DVR buffered program data
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
CN103038816B (zh) 2010-10-01 2015-02-25 三菱电机株式会社 声音识别装置
US9240111B2 (en) 2010-10-06 2016-01-19 Microsoft Technology Licensing, Llc Inferring building metadata from distributed sensors
JP6363324B2 (ja) 2010-10-08 2018-09-12 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US20120099594A1 (en) 2010-10-22 2012-04-26 Phorus Llc Media distribution architecture
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
EP2456199A3 (en) 2010-11-22 2014-07-16 DDS Newco Inc. Method and systems of dynamically managing content for use by a media playback device
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
US9508358B2 (en) 2010-12-15 2016-11-29 Koninklijke Philips N.V. Noise reduction system with remote noise detector
JP5771002B2 (ja) 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US9241227B2 (en) 2011-01-06 2016-01-19 Bose Corporation Transducer with integrated sensor
JP2012150237A (ja) 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
CN102123188A (zh) 2011-03-03 2011-07-13 曾超宁 移动电话耳麦装置
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
KR20120100514A (ko) 2011-03-04 2012-09-12 삼성전자주식회사 디바이스 그룹핑 방법 및 이를 적용한 서버
US8804977B2 (en) 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
JPWO2012127831A1 (ja) * 2011-03-22 2014-07-24 パナソニック株式会社 光情報装置及びそのギャップ制御方法
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9493130B2 (en) 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
KR20120128542A (ko) 2011-05-11 2012-11-27 삼성전자주식회사 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치
US9342516B2 (en) 2011-05-18 2016-05-17 Microsoft Technology Licensing, Llc Media presentation playback annotation
US8320577B1 (en) 2011-05-20 2012-11-27 Google Inc. Method and apparatus for multi-channel audio processing using single-channel components
US9893902B2 (en) 2011-05-31 2018-02-13 Google Llc Muting participants in a communication session
US8897465B2 (en) 2011-06-01 2014-11-25 Robert Bosch Gmbh Class D micro-speaker
US8958571B2 (en) 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US8738925B1 (en) 2013-01-07 2014-05-27 Fitbit, Inc. Wireless portable biometric device syncing
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
US9762967B2 (en) 2011-06-14 2017-09-12 Comcast Cable Communications, Llc System and method for presenting content with time based metadata
US8731765B2 (en) 2011-06-28 2014-05-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a torque machine of a powertrain system
US20130018659A1 (en) 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US20130024018A1 (en) 2011-07-22 2013-01-24 Htc Corporation Multimedia control method and multimedia control system
JP5289517B2 (ja) 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
US9148742B1 (en) 2011-07-29 2015-09-29 Google Inc. Proximity detection via audio
EP2555598A1 (en) 2011-08-05 2013-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for generating optical radiation by means of electrically operated pulsed discharges
JP5640918B2 (ja) 2011-08-05 2014-12-17 ブラザー工業株式会社 サーバ装置、対応付け方法、及び携帯機器用プログラム
US20130039527A1 (en) 2011-08-08 2013-02-14 Bang & Olufsen A/S Modular, configurable speaker and a method of operating it
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
US20130211826A1 (en) 2011-08-22 2013-08-15 Claes-Fredrik Urban Mannby Audio Signals as Buffered Streams of Audio Signals and Metadata
US8750677B2 (en) 2011-08-23 2014-06-10 Microsoft Corporation Method for transferring media playback from a different device
US20130073293A1 (en) 2011-09-20 2013-03-21 Lg Electronics Inc. Electronic device and method for controlling the same
US9094539B1 (en) 2011-09-22 2015-07-28 Amazon Technologies, Inc. Dynamic device adjustments based on determined user sleep state
US8768707B2 (en) 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US8996381B2 (en) 2011-09-27 2015-03-31 Sensory, Incorporated Background speech recognition assistant
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9729631B2 (en) 2011-09-30 2017-08-08 Apple Inc. Asynchronous data manipulation
US8340975B1 (en) * 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US8971546B2 (en) 2011-10-14 2015-03-03 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to control audio playback devices
CN103052001B (zh) 2011-10-17 2015-06-24 联想(北京)有限公司 智能设备及其控制方法
GB201118784D0 (en) 2011-10-31 2011-12-14 Omnifone Ltd Djml
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
US8983089B1 (en) 2011-11-28 2015-03-17 Rawles Llc Sound source localization using multiple microphone arrays
CN102567468B (zh) 2011-12-06 2014-06-04 上海聚力传媒技术有限公司 一种用于对媒体文件的播放音量进行调节的方法与设备
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
US20150237406A1 (en) * 2011-12-13 2015-08-20 Claudio J. Ochoa Channel navigation in connected media devices through keyword selection
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
KR102022318B1 (ko) 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9654817B2 (en) 2012-01-27 2017-05-16 Avaya Inc. System and method to synchronize video playback on mobile devices
US9401058B2 (en) 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
WO2013115748A1 (en) 2012-01-30 2013-08-08 Echostar Ukraine, L.L.C. Apparatus, systems and methods for adjusting output audio volume based on user location
US9418658B1 (en) 2012-02-08 2016-08-16 Amazon Technologies, Inc. Configuration of voice controlled assistant
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9947333B1 (en) 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
EP2632141B1 (en) 2012-02-22 2014-10-15 Dialog Semiconductor B.V. Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components
US9065895B2 (en) 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
US20130238326A1 (en) 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
US9361878B2 (en) 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
US9198204B2 (en) 2012-04-11 2015-11-24 Google Inc. Apparatus and method for seamless commissioning of wireless devices
EP2839391A4 (en) 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9633186B2 (en) 2012-04-23 2017-04-25 Apple Inc. Systems and methods for controlling output of content based on human recognition data detection
US9117449B2 (en) 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
CN104395957B (zh) 2012-04-30 2018-02-13 创新科技有限公司 一种通用可重构回声消除系统
US11452153B2 (en) 2012-05-01 2022-09-20 Lisnr, Inc. Pairing and gateway connection using sonic tones
US8886524B1 (en) 2012-05-01 2014-11-11 Amazon Technologies, Inc. Signal processing based on audio context
US20130294611A1 (en) 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
US9584909B2 (en) 2012-05-10 2017-02-28 Google Inc. Distributed beamforming based on message passing
US9768829B2 (en) 2012-05-11 2017-09-19 Intel Deutschland Gmbh Methods for processing audio signals and circuit arrangements therefor
US8908879B2 (en) 2012-05-23 2014-12-09 Sonos, Inc. Audio content auditioning
US9633368B2 (en) 2012-05-25 2017-04-25 Apple Inc. Content ranking and serving on a multi-user device or interface
CN103456332A (zh) 2012-05-28 2013-12-18 富泰华工业(深圳)有限公司 音频播放装置及音量调节方法
US20130324031A1 (en) 2012-05-31 2013-12-05 Nokia Corporation Dynamic allocation of audio channel for surround sound systems
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
CA2874899C (en) 2012-06-01 2017-07-11 Blackberry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9301073B2 (en) 2012-06-08 2016-03-29 Apple Inc. Systems and methods for determining the condition of multiple microphones
US9183845B1 (en) 2012-06-12 2015-11-10 Amazon Technologies, Inc. Adjusting audio signals based on a specific frequency range associated with environmental noise characteristics
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9031255B2 (en) 2012-06-15 2015-05-12 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to provide low-latency audio
US10354650B2 (en) 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US9674587B2 (en) 2012-06-26 2017-06-06 Sonos, Inc. Systems and methods for networked music playback including remote add to queue
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9106192B2 (en) * 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9137564B2 (en) 2012-06-28 2015-09-15 Sonos, Inc. Shift to corresponding media in a playback queue
US9384737B2 (en) 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US20140006825A1 (en) 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
US9615171B1 (en) 2012-07-02 2017-04-04 Amazon Technologies, Inc. Transformation inversion to reduce the effect of room acoustics
US20140003635A1 (en) 2012-07-02 2014-01-02 Qualcomm Incorporated Audio signal processing device calibration
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
KR101972955B1 (ko) * 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US8972762B2 (en) 2012-07-11 2015-03-03 Blackberry Limited Computing devices and methods for resetting inactivity timers on computing devices
US8983844B1 (en) 2012-07-31 2015-03-17 Amazon Technologies, Inc. Transmission of noise parameters for improving automatic speech recognition
US8831957B2 (en) 2012-08-01 2014-09-09 Google Inc. Speech recognition models based on location indicia
DE112013003843B4 (de) 2012-08-03 2022-03-31 Semiconductor Energy Laboratory Co., Ltd. Lichtemittierendes Element, lichtemittierende Vorrichtung, elektronische Vorrichtung und Beleuchtungsvorrichtung
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
EP2701145B1 (en) 2012-08-24 2016-10-12 Retune DSP ApS Noise estimation for use with noise reduction and echo cancellation in personal communication
US9532153B2 (en) 2012-08-29 2016-12-27 Bang & Olufsen A/S Method and a system of providing information to a user
US8965033B2 (en) 2012-08-31 2015-02-24 Sonos, Inc. Acoustic optimization
US9088336B2 (en) 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
US20140075311A1 (en) 2012-09-11 2014-03-13 Jesse William Boettcher Methods and apparatus for controlling audio volume on an electronic device
US20140075306A1 (en) 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US8798598B2 (en) 2012-09-13 2014-08-05 Alain Rossmann Method and system for screencasting Smartphone video game software to online social networks
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US8983383B1 (en) 2012-09-25 2015-03-17 Rawles Llc Providing hands-free service to multiple devices
US9319816B1 (en) 2012-09-26 2016-04-19 Amazon Technologies, Inc. Characterizing environment using ultrasound pilot tones
JP2014071138A (ja) 2012-09-27 2014-04-21 Xing Inc カラオケ装置
KR102091236B1 (ko) 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
US8725125B2 (en) 2012-09-28 2014-05-13 United Video Properties, Inc. Systems and methods for controlling audio playback on portable devices with vehicle equipment
EP2759147A1 (en) 2012-10-02 2014-07-30 MH Acoustics, LLC Earphones having configurable microphone arrays
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US8484025B1 (en) 2012-10-04 2013-07-09 Google Inc. Mapping an audio utterance to an action using a classifier
CN102902253B (zh) 2012-10-09 2015-07-15 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
US20140108010A1 (en) 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures
ES2886325T3 (es) 2012-10-15 2021-12-17 Msi Dfat Llc Pruebas acústicas de campo directo en un recinto semirreverberante
US9232310B2 (en) 2012-10-15 2016-01-05 Nokia Technologies Oy Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones
DE102012020271A1 (de) 2012-10-17 2014-04-17 Wolfgang Klippel Anordnung und Verfahren zur Steuerung von Wandlern
KR101978688B1 (ko) 2012-10-22 2019-05-15 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
WO2014064531A1 (en) 2012-10-22 2014-05-01 Spotify Ab Systems and methods for pre-fetching media content
US20150228274A1 (en) 2012-10-26 2015-08-13 Nokia Technologies Oy Multi-Device Speech Recognition
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10381001B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US8761349B2 (en) 2012-10-31 2014-06-24 Citrix Systems, Inc. Systems and methods of monitoring performance of acoustic echo cancellation
US9275637B1 (en) 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
CN102999161B (zh) 2012-11-13 2016-03-02 科大讯飞股份有限公司 一种语音唤醒模块的实现方法及应用
US9275642B2 (en) 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
US9685171B1 (en) 2012-11-20 2017-06-20 Amazon Technologies, Inc. Multiple-stage adaptive filtering of audio signals
US9070367B1 (en) 2012-11-26 2015-06-30 Amazon Technologies, Inc. Local speech recognition of frequent utterances
WO2014142702A1 (en) 2013-03-15 2014-09-18 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Selective speech recognition for chat and digital personal assistant systems
US20140149118A1 (en) 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9124966B2 (en) 2012-11-28 2015-09-01 Qualcomm Incorporated Image generation for collaborative sound systems
US9203045B2 (en) 2012-11-29 2015-12-01 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
WO2014088588A1 (en) 2012-12-07 2014-06-12 Empire Technology Development Llc Personal assistant context building
US20140161263A1 (en) 2012-12-10 2014-06-12 Microsoft Corporation Facilitating recognition of real-time content
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9226071B2 (en) 2012-12-13 2015-12-29 Maxim Integrated Products, Inc. Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker
US9300910B2 (en) 2012-12-14 2016-03-29 Biscotti Inc. Video mail capture, processing and distribution
US9607046B2 (en) 2012-12-14 2017-03-28 Microsoft Technology Licensing, Llc Probability-based state modification for query dialogues
US9271111B2 (en) 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
KR102102246B1 (ko) 2012-12-18 2020-04-22 삼성전자주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
US9047857B1 (en) 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
US9098467B1 (en) 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
US20150338917A1 (en) 2012-12-26 2015-11-26 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
US9620115B2 (en) 2013-01-03 2017-04-11 Telenav, Inc. Content delivery system with barge-in mechanism and method of operation thereof
KR102051588B1 (ko) 2013-01-07 2019-12-03 삼성전자주식회사 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치
US9318125B2 (en) 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
JP2014137590A (ja) 2013-01-18 2014-07-28 Yoji Fukinuki 音楽コンテンツ配信方法
US9646605B2 (en) 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US20140215332A1 (en) 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US9818407B1 (en) 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
TWI593294B (zh) * 2013-02-07 2017-07-21 晨星半導體股份有限公司 收音系統與相關方法
US9300266B2 (en) 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
US9237384B2 (en) 2013-02-14 2016-01-12 Sonos, Inc. Automatic configuration of household playback devices
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9172747B2 (en) * 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
US9195432B2 (en) 2013-02-26 2015-11-24 Sonos, Inc. Pre-caching of audio content
CN105308681B (zh) 2013-02-26 2019-02-12 皇家飞利浦有限公司 用于生成语音信号的方法和装置
CN104010251B (zh) 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音系统与相关方法
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9460715B2 (en) 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US20140258292A1 (en) 2013-03-05 2014-09-11 Clip Interactive, Inc. Apparatus, system, and method for integrating content and content services
JP6429465B2 (ja) 2013-03-07 2018-11-28 株式会社半導体エネルギー研究所 装置及びその作製方法
JP6326071B2 (ja) 2013-03-07 2018-05-16 アップル インコーポレイテッド 部屋およびプログラム反応型ラウドスピーカシステム
US9349386B2 (en) 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9161126B2 (en) 2013-03-08 2015-10-13 Cirrus Logic, Inc. Systems and methods for protecting a speaker
JP6211677B2 (ja) 2013-03-11 2017-10-11 アップル インコーポレイテッド ラウドスピーカの指向性範囲にまたがる音色の一定性
TWI533686B (zh) 2013-03-11 2016-05-11 緯創資通股份有限公司 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體
CN104053088A (zh) 2013-03-11 2014-09-17 联想(北京)有限公司 一种麦克风阵列调整方法、麦克风阵列及电子设备
US9173021B2 (en) 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
KR20140111859A (ko) 2013-03-12 2014-09-22 삼성전자주식회사 콘텐트 공유 방법 및 이를 위한 디바이스
EP3709293A1 (en) 2013-03-12 2020-09-16 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
WO2014165032A1 (en) 2013-03-12 2014-10-09 Aawtend, Inc. Integrated sensor-array processor
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9060052B2 (en) 2013-03-13 2015-06-16 Accusonus S.A. Single channel, binaural and multi-channel dereverberation
KR101571338B1 (ko) 2013-03-13 2015-11-24 삼성전자주식회사 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치
JP6084750B2 (ja) 2013-03-14 2017-02-22 アップル インコーポレイテッド スピーカー及び携帯リスニング装置を用いた室内の適応等化
JP6013951B2 (ja) 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法
US20140274185A1 (en) 2013-03-14 2014-09-18 Aliphcom Intelligence device connection for wireless media ecosystem
KR102152754B1 (ko) 2013-03-14 2020-09-07 삼성전자주식회사 블루루스 디바이스에서 통신 연결 방법 및 그 장치
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
US9201865B2 (en) * 2013-03-15 2015-12-01 Bao Tran Automated assistance for user request that determines semantics by domain, task, and parameter
US20140278933A1 (en) 2013-03-15 2014-09-18 F. Gavin McMillan Methods and apparatus to measure audience engagement with media
EP3036657A4 (en) 2013-03-15 2017-06-21 Spotify AB Systems, methods, and computer readable medium for generating playlists
WO2014149050A1 (en) 2013-03-21 2014-09-25 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
KR102173936B1 (ko) 2013-03-26 2020-11-04 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기, 및 조명 장치
JP6300589B2 (ja) 2013-04-04 2018-03-28 株式会社半導体エネルギー研究所 半導体装置の作製方法
WO2014161091A1 (en) 2013-04-04 2014-10-09 Rand James S Unified communications system and method
JP6198432B2 (ja) 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
WO2014172299A1 (en) 2013-04-15 2014-10-23 Chacha Search, Inc. Method and system of increasing user interaction
US9875494B2 (en) 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
US9501533B2 (en) 2013-04-16 2016-11-22 Sonos, Inc. Private queue for a media playback system
US9304736B1 (en) 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
US9390716B2 (en) 2013-04-19 2016-07-12 Panasonic Intellectual Property Corporation Of America Control method for household electrical appliance, household electrical appliance control system, and gateway
US9936290B2 (en) 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
KR102230139B1 (ko) 2013-05-17 2021-03-18 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 조명 장치, 발광 장치, 및 전자 기기
CN105122353B (zh) 2013-05-20 2019-07-09 英特尔公司 用于语音识别的计算装置和用于计算装置上的语音识别的方法
US9472201B1 (en) 2013-05-22 2016-10-18 Google Inc. Speaker localization by means of tactile input
US9390708B1 (en) 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US20140358535A1 (en) 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
US20140357248A1 (en) 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US9438193B2 (en) 2013-06-05 2016-09-06 Sonos, Inc. Satellite volume control
US20140365225A1 (en) 2013-06-05 2014-12-11 DSP Group Ultra-low-power adaptive, user independent, voice triggering schemes
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9654073B2 (en) 2013-06-07 2017-05-16 Sonos, Inc. Group volume control
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
TWI545979B (zh) 2013-06-09 2016-08-11 蘋果公司 藍芽警報通知服務
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US20140368737A1 (en) 2013-06-17 2014-12-18 Spotify Ab System and method for playing media during navigation between media streams
US8953778B2 (en) 2013-06-17 2015-02-10 Avaya Inc. Real-time intelligent mute interactive features
US9324322B1 (en) 2013-06-18 2016-04-26 Amazon Technologies, Inc. Automatic volume attenuation for speech enabled devices
US9494683B1 (en) 2013-06-18 2016-11-15 Amazon Technologies, Inc. Audio-based gesture detection
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
US9640179B1 (en) 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
CN105340011B (zh) 2013-06-28 2020-08-18 哈曼国际工业有限公司 链接设备的无线控制
US9298415B2 (en) 2013-07-09 2016-03-29 Sonos, Inc. Systems and methods to provide play/pause content
US20150019201A1 (en) 2013-07-09 2015-01-15 Stanley F. Schoenbach Real-time interpreting systems and methods
US9293480B2 (en) 2013-07-10 2016-03-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and display device including the semiconductor device
US9396727B2 (en) 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
CN110096253B (zh) 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
DE102014109122A1 (de) 2013-07-12 2015-01-15 Gm Global Technology Operations, Llc Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
WO2015009748A1 (en) 2013-07-15 2015-01-22 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
US9445196B2 (en) 2013-07-24 2016-09-13 Mh Acoustics Llc Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation
US9666187B1 (en) 2013-07-25 2017-05-30 Google Inc. Model for enabling service providers to address voice-activated commands
US9772994B2 (en) 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US10186262B2 (en) 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
WO2015013835A1 (en) 2013-07-31 2015-02-05 Merck Sharp & Dohme Corp. Piperazine derivatives as hiv protease inhibitors
WO2015017303A1 (en) 2013-07-31 2015-02-05 Motorola Mobility Llc Method and apparatus for adjusting voice recognition processing based on noise characteristics
US9418651B2 (en) 2013-07-31 2016-08-16 Google Technology Holdings LLC Method and apparatus for mitigating false accepts of trigger phrases
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
US9565497B2 (en) 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
DE102013012811B4 (de) 2013-08-01 2024-02-22 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler
US10873997B2 (en) 2013-08-01 2020-12-22 Fong-Min Chang Voice controlled artificial intelligent smart illumination device
EP3036594B1 (en) 2013-08-21 2021-05-26 Ademco Inc. Devices and methods for interacting with an hvac controller
US9940927B2 (en) 2013-08-23 2018-04-10 Nuance Communications, Inc. Multiple pass automatic speech recognition methods and apparatus
US9190043B2 (en) 2013-08-27 2015-11-17 Bose Corporation Assisting conversation in noisy environments
US9514747B1 (en) 2013-08-28 2016-12-06 Amazon Technologies, Inc. Reducing speech recognition latency
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
EP2879345A4 (en) 2013-08-30 2015-08-19 Huawei Tech Co Ltd METHOD FOR MULTIPLE DEVICES FOR THE COOPERATIVE REPRODUCTION OF MULTIMEDIA FILES AND RELATED DEVICE AND SYSTEM
US10163435B2 (en) 2013-09-11 2018-12-25 Denso Corporation Voice output control device, voice output control method, and recording medium
US9672812B1 (en) 2013-09-18 2017-06-06 Amazon Technologies, Inc. Qualifying trigger expressions in speech-based systems
US9516081B2 (en) 2013-09-20 2016-12-06 Amazon Technologies, Inc. Reduced latency electronic content system
US9848260B2 (en) 2013-09-24 2017-12-19 Nuance Communications, Inc. Wearable communication enhancement device
US9668052B2 (en) 2013-09-25 2017-05-30 Google Technology Holdings LLC Audio routing system for routing audio data to and from a mobile device
US9443527B1 (en) 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
US9355555B2 (en) 2013-09-27 2016-05-31 Sonos, Inc. System and method for issuing commands in a media playback system
US9288596B2 (en) 2013-09-30 2016-03-15 Sonos, Inc. Coordinator device for paired or consolidated players
CN103546616A (zh) 2013-09-30 2014-01-29 深圳市同洲电子股份有限公司 一种调节音量的方法及装置
KR102114219B1 (ko) 2013-10-10 2020-05-25 삼성전자주식회사 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
TWI642170B (zh) 2013-10-18 2018-11-21 半導體能源研究所股份有限公司 顯示裝置及電子裝置
US9633671B2 (en) 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
US9818061B1 (en) 2013-10-22 2017-11-14 Lumin, LLC Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment
WO2015060867A1 (en) 2013-10-25 2015-04-30 Intel Corporation Techniques for preventing voice replay attacks
DK2869599T3 (da) 2013-11-05 2020-12-14 Oticon As Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner
JP2015090570A (ja) 2013-11-06 2015-05-11 ソニー株式会社 情報処理装置および制御方法
US10311482B2 (en) 2013-11-11 2019-06-04 At&T Intellectual Property I, Lp Method and apparatus for adjusting a digital assistant persona
US8775191B1 (en) 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
JP6236303B2 (ja) 2013-11-26 2017-11-22 株式会社デンソーアイティーラボラトリ 制御装置、制御方法およびプログラム
US9704478B1 (en) 2013-12-02 2017-07-11 Amazon Technologies, Inc. Audio output masking for improved automatic speech recognition
US9373321B2 (en) 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
CN104143326B (zh) 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
US8719039B1 (en) 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
US10720153B2 (en) 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
US10055190B2 (en) 2013-12-16 2018-08-21 Amazon Technologies, Inc. Attribute-based audio channel arbitration
US9721570B1 (en) 2013-12-17 2017-08-01 Amazon Technologies, Inc. Outcome-oriented dialogs on a speech recognition platform
US9378651B2 (en) 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
US10224056B1 (en) * 2013-12-17 2019-03-05 Amazon Technologies, Inc. Contingent device actions during loss of network connectivity
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
US9899021B1 (en) 2013-12-20 2018-02-20 Amazon Technologies, Inc. Stochastic modeling of user interactions with a detection system
US9099974B2 (en) 2013-12-20 2015-08-04 Vmware, Inc. Volume redirection
US20150179181A1 (en) 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US20150221307A1 (en) 2013-12-20 2015-08-06 Saurin Shah Transition from low power always listening mode to high power speech recognition mode
EP2890160B1 (en) 2013-12-24 2019-08-14 Nxp B.V. Loudspeaker controller
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
US8938394B1 (en) 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
US9443516B2 (en) 2014-01-09 2016-09-13 Honeywell International Inc. Far-field speech recognition systems and methods
WO2015105788A1 (en) 2014-01-10 2015-07-16 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US9300647B2 (en) 2014-01-15 2016-03-29 Sonos, Inc. Software application and zones
US9288597B2 (en) 2014-01-20 2016-03-15 Sony Corporation Distributed wireless speaker system with automatic configuration determination when new speakers are added
US10162593B2 (en) 2014-01-22 2018-12-25 Apple Inc. Coordinated hand-off of audio data transmission
US9356882B2 (en) 2014-02-04 2016-05-31 Printeron Inc. Streamlined system for the transmission of network resource data
US9443876B2 (en) 2014-02-05 2016-09-13 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
WO2015118426A2 (en) 2014-02-06 2015-08-13 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, lighting device, and electronic appliance
TWI658597B (zh) 2014-02-07 2019-05-01 日商半導體能源研究所股份有限公司 半導體裝置
US9318112B2 (en) 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
FR3018024B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
FR3018025B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
JP6289936B2 (ja) 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
US9408008B2 (en) 2014-02-28 2016-08-02 Sonos, Inc. Playback zone representations
US10015593B2 (en) 2014-03-03 2018-07-03 University Of Utah Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
EP3115905A4 (en) 2014-03-03 2017-10-25 Sony Corporation Information processing apparatus, information processing method, and program
US9489171B2 (en) 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
US9679054B2 (en) 2014-03-05 2017-06-13 Sonos, Inc. Webpage media playback
US10599287B2 (en) 2014-03-11 2020-03-24 Sonos, Inc. Group volume control
US9640669B2 (en) 2014-03-13 2017-05-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9226062B2 (en) 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
US10514747B2 (en) 2014-03-24 2019-12-24 Silicon Laboratories Inc. Low-power communication apparatus with wakeup detection and associated methods
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US9648564B1 (en) 2014-03-26 2017-05-09 Amazon Technologies, Inc. Wake-up management for mobile devices
US9431021B1 (en) 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
US9916839B1 (en) * 2014-03-27 2018-03-13 Amazon Technologies, Inc. Shared audio functionality based on device grouping
KR102146462B1 (ko) 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US9547468B2 (en) 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
US8874448B1 (en) 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
CN104978965B (zh) 2014-04-07 2019-04-26 三星电子株式会社 电子装置及利用电子装置和服务器的语音识别执行方法
US9560437B2 (en) 2014-04-08 2017-01-31 Doppler Labs, Inc. Time heuristic audio control
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
DE102014005381B3 (de) 2014-04-11 2014-12-11 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler
US20150302856A1 (en) 2014-04-17 2015-10-22 Qualcomm Incorporated Method and apparatus for performing function by speech input
US20150334471A1 (en) 2014-05-15 2015-11-19 Echostar Technologies L.L.C. Multiple simultaneous audio video data decoding
WO2015178950A1 (en) 2014-05-19 2015-11-26 Tiskerling Dynamics Llc Directivity optimized sound reproduction
US9860289B2 (en) 2014-05-23 2018-01-02 Radeeus, Inc. Multimedia digital content retrieval, matching, and syncing systems and methods of using the same
EP3146796B1 (en) 2014-05-23 2021-10-27 Samsung Electronics Co., Ltd. Method and apparatus for providing notification
US9900723B1 (en) 2014-05-28 2018-02-20 Apple Inc. Multi-channel loudspeaker matching using variable directivity
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
TWI777568B (zh) 2014-05-30 2022-09-11 日商半導體能源研究所股份有限公司 發光元件,發光裝置,電子裝置以及照明裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US9720642B2 (en) 2014-06-04 2017-08-01 Sonos, Inc. Prioritizing media content requests
US20150355818A1 (en) 2014-06-04 2015-12-10 Sonos, Inc. Continuous Playback Queue
US10624612B2 (en) 2014-06-05 2020-04-21 Chikayoshi Sumi Beamforming method, measurement and imaging instruments, and communication instruments
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
CN104092936B (zh) 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
US20150363061A1 (en) 2014-06-13 2015-12-17 Autonomic Controls, Inc. System and method for providing related digital content
US9767159B2 (en) 2014-06-13 2017-09-19 Google Inc. Ranking search results
US9766702B2 (en) 2014-06-19 2017-09-19 Apple Inc. User detection by a computing device
US9589556B2 (en) 2014-06-19 2017-03-07 Yang Gao Energy adjustment of acoustic echo replica signal for speech enhancement
US20150373100A1 (en) 2014-06-19 2015-12-24 Pavel KRAVETS Context sharing between different clients
US9520139B2 (en) 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
US9697828B1 (en) 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
JP2016009193A (ja) * 2014-06-23 2016-01-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド ユーザ適合音声認識
US10152987B2 (en) 2014-06-23 2018-12-11 Google Llc Remote invocation of mobile device actions
US9632748B2 (en) 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9335819B1 (en) 2014-06-26 2016-05-10 Audible, Inc. Automatic creation of sleep bookmarks in content items
US9368105B1 (en) 2014-06-26 2016-06-14 Amazon Technologies, Inc. Preventing false wake word detections with a voice-controlled device
US9691379B1 (en) 2014-06-26 2017-06-27 Amazon Technologies, Inc. Selecting from multiple content sources
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US9398392B2 (en) 2014-06-30 2016-07-19 Microsoft Technology Licensing, Llc Audio calibration and adjustment
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9779307B2 (en) 2014-07-07 2017-10-03 Google Inc. Method and system for non-causal zone search in video monitoring
US11330100B2 (en) 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
US9374634B2 (en) 2014-07-10 2016-06-21 Nxp B.V. System for controlling displacement of a loudspeaker
US9467737B2 (en) 2014-07-14 2016-10-11 Sonos, Inc. Zone group control
JP2016024212A (ja) 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9671997B2 (en) 2014-07-23 2017-06-06 Sonos, Inc. Zone grouping
US10209947B2 (en) 2014-07-23 2019-02-19 Sonos, Inc. Device grouping
US9263042B1 (en) 2014-07-25 2016-02-16 Google Inc. Providing pre-computed hotword models
KR20160017253A (ko) 2014-08-01 2016-02-16 삼성전자주식회사 디스플레이 구동용 집적 회로 칩
US9874997B2 (en) 2014-08-08 2018-01-23 Sonos, Inc. Social playback queues
US9548066B2 (en) * 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
US9769552B2 (en) 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
US20160055847A1 (en) 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
JP6118838B2 (ja) 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
KR20160026317A (ko) 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
US9560050B2 (en) 2014-09-08 2017-01-31 At&T Intellectual Property I, L.P System and method to share a resource or a capability of a device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9354687B2 (en) 2014-09-11 2016-05-31 Nuance Communications, Inc. Methods and apparatus for unsupervised wakeup with time-correlated acoustic events
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9747011B2 (en) 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US9548053B1 (en) 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
US10645130B2 (en) 2014-09-24 2020-05-05 Sonos, Inc. Playback updates
JP6624368B2 (ja) 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
US9641919B1 (en) 2014-09-30 2017-05-02 Amazon Technologies, Inc. Audio assemblies for electronic devices
GB2525051B (en) 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9681228B2 (en) 2014-09-30 2017-06-13 Apple Inc. Capacitive position sensing for transducers
US10817672B2 (en) 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
KR102342623B1 (ko) * 2014-10-01 2021-12-22 엑스브레인, 인크. 음성 및 연결 플랫폼
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR102287943B1 (ko) 2014-10-14 2021-08-09 삼성전자주식회사 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법
EP3010251B1 (en) 2014-10-15 2019-11-13 Nxp B.V. Audio system
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary
US9576575B2 (en) * 2014-10-27 2017-02-21 Toyota Motor Engineering & Manufacturing North America, Inc. Providing voice recognition shortcuts based on user verbal input
US9560409B2 (en) 2014-10-30 2017-01-31 Verizon Patent And Licensing Inc. Media service personalization systems and methods
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10368121B2 (en) 2014-11-07 2019-07-30 Roku, Inc. System and method for collecting data
US20160134982A1 (en) 2014-11-12 2016-05-12 Harman International Industries, Inc. System and method for estimating the displacement of a speaker cone
US9699550B2 (en) 2014-11-12 2017-07-04 Qualcomm Incorporated Reduced microphone power-up latency
JP2016095383A (ja) * 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US10116748B2 (en) 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US9812126B2 (en) 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
WO2016082046A1 (en) 2014-11-28 2016-06-02 Audera Acoustics Inc. High displacement acoustic transducer systems
US10192549B2 (en) 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
US10126406B2 (en) 2014-12-02 2018-11-13 Qualcomm Incorporated Method and apparatus for performing ultrasonic presence detection
CN104538030A (zh) 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US9779725B2 (en) 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method
CN111427534B (zh) 2014-12-11 2023-07-25 微软技术许可有限责任公司 能够实现可动作的消息传送的虚拟助理系统
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
US9813812B2 (en) 2014-12-12 2017-11-07 Analog Devices Global Method of controlling diaphragm excursion of electrodynamic loudspeakers
US9552816B2 (en) * 2014-12-19 2017-01-24 Amazon Technologies, Inc. Application focus in speech-based systems
US9560441B1 (en) 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN104635539A (zh) * 2014-12-26 2015-05-20 东莞市掌商信息科技有限公司 一种智能硬件远程语音安全控制方法及其系统
WO2016112113A1 (en) 2015-01-07 2016-07-14 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US9934406B2 (en) 2015-01-08 2018-04-03 Microsoft Technology Licensing, Llc Protecting private information in input understanding system
US9584915B2 (en) 2015-01-19 2017-02-28 Microsoft Technology Licensing, Llc Spatial audio with remote speakers
US20160210110A1 (en) 2015-01-21 2016-07-21 Ford Global Technologies, Llc Audio synchronization between vehicles and mobile devices
US9947313B2 (en) 2015-01-26 2018-04-17 William Drewes Method for substantial ongoing cumulative voice recognition error reduction
KR102351366B1 (ko) 2015-01-26 2022-01-14 삼성전자주식회사 음성 인식 방법 및 장치
CN104572009B (zh) 2015-01-28 2018-01-09 合肥联宝信息技术有限公司 一种自适应外界环境的音频控制方法及装置
CN104735589B (zh) * 2015-01-30 2018-01-23 广东欧珀移动通信有限公司 一种基于gps的智能音箱分组的音量调节系统和方法
US9633661B1 (en) 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
GB201501791D0 (en) 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
US20160232451A1 (en) 2015-02-09 2016-08-11 Velocee Ltd. Systems and methods for managing audio content
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US20160239255A1 (en) 2015-02-16 2016-08-18 Harman International Industries, Inc. Mobile interface for loudspeaker optimization
US20160253050A1 (en) 2015-02-26 2016-09-01 Fingertips Lab, Inc. System and method for audio and tactile based browsing
EP3264258A4 (en) 2015-02-27 2018-08-15 Sony Corporation Information processing device, information processing method, and program
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10762894B2 (en) 2015-03-27 2020-09-01 Google Llc Convolutional neural networks
US9697826B2 (en) 2015-03-27 2017-07-04 Google Inc. Processing multi-channel audio waveforms
US10192546B1 (en) 2015-03-30 2019-01-29 Amazon Technologies, Inc. Pre-wakeword speech processing
US10034109B2 (en) 2015-04-09 2018-07-24 Audera Acoustics Inc. Acoustic transducer systems with position sensing
US9678707B2 (en) 2015-04-10 2017-06-13 Sonos, Inc. Identification of audio content facilitated by playback device
US10198242B2 (en) 2015-04-14 2019-02-05 Motorola Solutions, Inc. Method and apparatus for a volume of a device
US10178474B2 (en) 2015-04-21 2019-01-08 Google Llc Sound signature database for initialization of noise reduction in recordings
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US9472196B1 (en) * 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN104853405B (zh) 2015-05-12 2018-11-30 浙江生辉照明有限公司 智能联网方法及智能设备
KR102623039B1 (ko) 2015-05-15 2024-01-08 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기 및 조명 장치
US9753922B2 (en) 2015-05-19 2017-09-05 Researchgate Gmbh Enhanced online user-interaction tracking
US10070237B2 (en) 2015-05-21 2018-09-04 Analog Devices, Inc. Optical and capacitive sensing of electroacoustic transducers
TWI757234B (zh) 2015-05-21 2022-03-11 日商半導體能源研究所股份有限公司 發光元件、顯示裝置、電子裝置、及照明裝置
WO2016185321A1 (en) 2015-05-21 2016-11-24 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, display device, electronic device, and lighting device
US9837547B2 (en) 2015-05-22 2017-12-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising oxide conductor and display device including the semiconductor device
JP2016218852A (ja) * 2015-05-22 2016-12-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
EP3099047A1 (en) 2015-05-28 2016-11-30 Nxp B.V. Echo controller
US9584935B2 (en) 2015-05-29 2017-02-28 Sound United, Llc. Multi-zone media system and method for providing multi-zone media
US10657949B2 (en) 2015-05-29 2020-05-19 Sound United, LLC System and method for integrating a home media system and other home systems
US9734822B1 (en) 2015-06-01 2017-08-15 Amazon Technologies, Inc. Feedback based beamformed signal selection
US9864571B2 (en) 2015-06-04 2018-01-09 Sonos, Inc. Dynamic bonding of playback devices
US9672821B2 (en) 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
US10249205B2 (en) 2015-06-08 2019-04-02 Novel Effect, Inc. System and method for integrating special effects with a text source
KR102444075B1 (ko) 2015-06-09 2022-09-16 삼성전자주식회사 전자 장치, 주변 기기 및 그 제어 방법
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
CN107710441B (zh) 2015-06-17 2020-10-16 株式会社半导体能源研究所 铱配合物、发光元件、显示装置、电子设备以及照明装置
US20160373909A1 (en) 2015-06-17 2016-12-22 Hive Life, LLC Wireless audio, security communication and home automation
JP6739907B2 (ja) 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
US10025447B1 (en) 2015-06-19 2018-07-17 Amazon Technologies, Inc. Multi-device user interface
KR20170001173A (ko) 2015-06-25 2017-01-04 엘지전자 주식회사 와치 타입 이동 단말기 및 그의 동작 방법
US9554210B1 (en) 2015-06-25 2017-01-24 Amazon Technologies, Inc. Multichannel acoustic echo cancellation with unique individual channel estimations
KR102317526B1 (ko) 2015-06-25 2021-10-26 엘지전자 주식회사 헤드셋 및 그 제어 방법
US9472203B1 (en) 2015-06-29 2016-10-18 Amazon Technologies, Inc. Clock synchronization for multichannel system
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3317878B1 (de) 2015-06-30 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum erzeugen einer datenbank
KR20240035638A (ko) 2015-07-08 2024-03-15 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 장치, 및 조명 장치
US10304440B1 (en) 2015-07-10 2019-05-28 Amazon Technologies, Inc. Keyword spotting using multi-task configuration
US9686625B2 (en) 2015-07-21 2017-06-20 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
KR102655709B1 (ko) 2015-07-21 2024-04-05 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9769563B2 (en) 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
CN107851727B (zh) 2015-07-23 2020-01-21 株式会社半导体能源研究所 发光元件、显示装置、电子装置及照明装置
WO2017015759A1 (en) 2015-07-30 2017-02-02 Amp Me Inc. Synchronized playback of streamed audio content by multiple internet-capable portable devices
US10529318B2 (en) 2015-07-31 2020-01-07 International Business Machines Corporation Implementing a classification model for recognition processing
US9691361B2 (en) 2015-08-03 2017-06-27 International Business Machines Corporation Adjusting presentation of content on a display
KR102402512B1 (ko) 2015-08-04 2022-05-27 삼성전자주식회사 외부장치의 음량을 조정하는 전자장치 및 방법
CN105187907A (zh) 2015-08-05 2015-12-23 四川长虹电器股份有限公司 智能电视音量控制系统及控制方法
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10333904B2 (en) 2015-08-08 2019-06-25 Peter J. Tormey Voice access and control
KR102386854B1 (ko) 2015-08-20 2022-04-13 삼성전자주식회사 통합 모델 기반의 음성 인식 장치 및 방법
US10270041B2 (en) 2015-08-28 2019-04-23 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
WO2017039632A1 (en) 2015-08-31 2017-03-09 Nunntawi Dynamics Llc Passive self-localization of microphone arrays
US10031719B2 (en) 2015-09-02 2018-07-24 Harman International Industries, Incorporated Audio system with multi-screen application
US10339917B2 (en) 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
KR20170031392A (ko) 2015-09-11 2017-03-21 삼성전자주식회사 전자 장치, 음향 시스템 및 오디오 출력 방법
US10026399B2 (en) 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
CN105206281B (zh) 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
KR20170032114A (ko) * 2015-09-14 2017-03-22 삼성전자주식회사 음성 인식 장치 및 그의 제어방법
KR20170032096A (ko) 2015-09-14 2017-03-22 삼성전자주식회사 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
US10706873B2 (en) 2015-09-18 2020-07-07 Sri International Real-time speaker state analytics platform
US10289734B2 (en) 2015-09-18 2019-05-14 Samsung Electronics Co., Ltd. Entity-type search system
CN105204357B (zh) 2015-09-18 2018-02-06 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
KR102446392B1 (ko) 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
US10186276B2 (en) 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
CN105162886B (zh) 2015-09-25 2019-04-12 北京奇艺世纪科技有限公司 一种声音控制方法及装置
US9996316B2 (en) 2015-09-28 2018-06-12 Amazon Technologies, Inc. Mediation of wakeword response for multiple devices
US10334306B2 (en) 2015-09-28 2019-06-25 Google Llc Time-synchronized, multizone medial streaming
JP6536320B2 (ja) 2015-09-28 2019-07-03 富士通株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US10241754B1 (en) 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
KR20170038681A (ko) 2015-09-30 2017-04-07 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
CN111354874B (zh) 2015-09-30 2023-07-04 株式会社半导体能源研究所 发光元件、显示装置、电子设备及照明装置
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
US9754580B2 (en) 2015-10-12 2017-09-05 Technologies For Voice Interface System and method for extracting and using prosody features
KR102429260B1 (ko) 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
CN107925818B (zh) 2015-10-15 2020-10-16 华为技术有限公司 用于声音处理节点装置的声音处理节点
US9747926B2 (en) 2015-10-16 2017-08-29 Google Inc. Hotword recognition
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
JP6463710B2 (ja) 2015-10-16 2019-02-06 グーグル エルエルシー ホットワード認識
US10453450B2 (en) 2015-10-20 2019-10-22 Bragi GmbH Wearable earpiece voice command control system and method
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105427861B (zh) 2015-11-03 2019-02-15 胡旻波 智能家居协同麦克风语音控制的系统及其控制方法
US9691378B1 (en) 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10863267B2 (en) 2015-11-10 2020-12-08 Savant Systems, Inc. Volume control for audio/video devices
US9990209B2 (en) 2015-11-12 2018-06-05 Microsoft Technology Licensing, Llc Digital assistance device for facilitating multi-stage setup
US10706852B2 (en) 2015-11-13 2020-07-07 Microsoft Technology Licensing, Llc Confidence features for automated speech recognition arbitration
US10592949B2 (en) 2015-11-13 2020-03-17 [24]7.ai, Inc. Method and apparatus for linking customer interactions with customer messaging platforms
US20170140750A1 (en) 2015-11-17 2017-05-18 Le Holdings (Beijing) Co., Ltd. Method and device for speech recognition
CN105472191B (zh) 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
US11929088B2 (en) 2015-11-20 2024-03-12 Synaptics Incorporated Input/output mode control for audio processing
DE112015007147T5 (de) 2015-11-25 2018-08-09 Mitsubishi Electric Corporation Sprachdialogvorrichtung und Sprachdialogverfahren
US10040423B2 (en) 2015-11-27 2018-08-07 Bragi GmbH Vehicle with wearable for identifying one or more vehicle occupants
US9484030B1 (en) 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9699597B2 (en) 2015-12-07 2017-07-04 Google Inc. Wireless signal forwarding
US9747920B2 (en) 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
CN105679318A (zh) 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
US10311862B2 (en) 2015-12-23 2019-06-04 Rovi Guides, Inc. Systems and methods for conversations with devices about media using interruptions and changes of subjects
CN105632486B (zh) 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
US10134388B1 (en) 2015-12-23 2018-11-20 Amazon Technologies, Inc. Word generation for speech recognition
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US9826599B2 (en) 2015-12-28 2017-11-21 Amazon Technologies, Inc. Voice-controlled light switches
US10547942B2 (en) 2015-12-28 2020-01-28 Samsung Electronics Co., Ltd. Control of electrodynamic speaker driver using a low-order non-linear model
US9992642B1 (en) 2015-12-29 2018-06-05 Amazon Technologies, Inc. Automated messaging
US9820036B1 (en) 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9813810B1 (en) 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
KR20170086814A (ko) 2016-01-19 2017-07-27 삼성전자주식회사 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR102392113B1 (ko) 2016-01-20 2022-04-29 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령 처리 방법
CN105741838B (zh) 2016-01-20 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
CN105700364A (zh) * 2016-01-20 2016-06-22 宇龙计算机通信科技(深圳)有限公司 一种智能家居控制方法及可穿戴设备
US9749731B2 (en) 2016-01-21 2017-08-29 Bose Corporation Sidetone generation using multiple microphones
KR20170091913A (ko) 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치
US9659555B1 (en) 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
WO2017138934A1 (en) 2016-02-10 2017-08-17 Nuance Communications, Inc. Techniques for spatially selective wake-up word recognition and related systems and methods
US9858927B2 (en) 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US9898250B1 (en) 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
WO2017147936A1 (zh) * 2016-03-04 2017-09-08 茹旷 智能家居助手
US10133612B2 (en) * 2016-03-17 2018-11-20 Nuance Communications, Inc. Session processing interaction between two or more virtual assistants
US9769420B1 (en) 2016-03-18 2017-09-19 Thomas Lawrence Moses Portable wireless remote monitoring and control systems
US10373612B2 (en) 2016-03-21 2019-08-06 Amazon Technologies, Inc. Anchored speech detection and speech recognition
US9805714B2 (en) 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
US10365887B1 (en) 2016-03-25 2019-07-30 Amazon Technologies, Inc. Generating commands based on location and wakeword
US10332508B1 (en) 2016-03-31 2019-06-25 Amazon Technologies, Inc. Confidence checking for speech processing and query answering
US9952827B2 (en) 2016-04-13 2018-04-24 Comcast Cable Communications, Llc Dynamic adjustment of equalization settings of audio components via a sound device profile
JP6686226B2 (ja) 2016-04-18 2020-04-22 グーグル エルエルシー 適切なエージェントの自動化アシスタント呼び出し
US10318236B1 (en) 2016-05-05 2019-06-11 Amazon Technologies, Inc. Refining media playback
US10447748B2 (en) 2016-05-12 2019-10-15 Apple Inc. Sharing media information between applications on client devices
US20170329397A1 (en) 2016-05-12 2017-11-16 Rovi Guides, Inc. Systems and methods for navigating a media guidance application using gaze control
US10149049B2 (en) 2016-05-13 2018-12-04 Bose Corporation Processing speech from distributed microphones
WO2017197312A2 (en) 2016-05-13 2017-11-16 Bose Corporation Processing speech from distributed microphones
US10187440B2 (en) 2016-05-27 2019-01-22 Apple Inc. Personalization of media streams
US10063965B2 (en) 2016-06-01 2018-08-28 Google Llc Sound source estimation using neural networks
US10079027B2 (en) * 2016-06-03 2018-09-18 Nxp B.V. Sound signal detector
US10474419B2 (en) 2016-06-03 2019-11-12 Crestron Electronics, Inc. Audio digital signal processor utilizing a hybrid network architecture
AU2017100581B4 (en) 2016-06-08 2018-02-01 Apple Inc. Intelligent automated assistant for media exploration
US10235124B2 (en) 2016-06-08 2019-03-19 Google Llc Audio announcement prioritization system
US9754605B1 (en) 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
AU2017100486C4 (en) 2016-06-11 2019-09-05 Apple Inc. Intelligent device arbitration and control
DK179034B1 (en) 2016-06-12 2017-09-04 Apple Inc Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs
US20170364371A1 (en) 2016-06-15 2017-12-21 Microsoft Technology Licensing, Llc Context-Dependent Digital Action-Assistance Tool
ES2806204T3 (es) 2016-06-15 2021-02-16 Cerence Operating Co Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados
US10212029B2 (en) 2016-06-15 2019-02-19 Microsoft Technology Licensing, Llc Service provisioning in cloud computing systems
KR20170142001A (ko) 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9749738B1 (en) 2016-06-20 2017-08-29 Gopro, Inc. Synthesizing audio corresponding to a virtual microphone location
US9875740B1 (en) 2016-06-20 2018-01-23 A9.Com, Inc. Using voice information to influence importance of search result categories
ITUA20164622A1 (it) 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10091545B1 (en) 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US9728188B1 (en) 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
KR102471499B1 (ko) 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
WO2018013564A1 (en) 2016-07-12 2018-01-18 Bose Corporation Combining gesture and voice user interfaces
EP3270377B1 (en) 2016-07-12 2020-02-19 Dolby Laboratories Licensing Corporation Assessment and adjustment of audio installation
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US9979680B2 (en) 2016-07-21 2018-05-22 Fujitsu Limited Smart notification scheduling and modality selection
US10621992B2 (en) 2016-07-22 2020-04-14 Lenovo (Singapore) Pte. Ltd. Activating voice assistant based on at least one of user proximity and context
CN106027806A (zh) * 2016-07-25 2016-10-12 乐视控股(北京)有限公司 智能家居设备的控制方法及移动终端
US20180033429A1 (en) * 2016-07-26 2018-02-01 Ford Global Technologies, Llc Extendable vehicle system
KR102575634B1 (ko) 2016-07-26 2023-09-06 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
CN106028223A (zh) 2016-07-26 2016-10-12 广东欧珀移动通信有限公司 一种智能音箱的控制方法、装置及智能音箱
US10431211B2 (en) 2016-07-29 2019-10-01 Qualcomm Incorporated Directional processing of far-field audio
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10326869B2 (en) 2016-08-19 2019-06-18 Amazon Technologies, Inc. Enabling voice control of telephone device
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
CN107767863B (zh) 2016-08-22 2021-05-04 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
US20180061396A1 (en) 2016-08-24 2018-03-01 Knowles Electronics, Llc Methods and systems for keyword detection using keyword repetitions
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US10360910B2 (en) 2016-08-29 2019-07-23 Garmin Switzerland Gmbh Automatic speech recognition (ASR) utilizing GPS and sensor data
US10461953B2 (en) * 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10057698B2 (en) 2016-09-02 2018-08-21 Bose Corporation Multiple room communication system and method
CN109891434B (zh) 2016-09-06 2020-10-30 渊慧科技有限公司 使用神经网络生成音频
EP3297298B1 (en) 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9972318B1 (en) 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
JP6520878B2 (ja) 2016-09-21 2019-05-29 トヨタ自動車株式会社 音声取得システムおよび音声取得方法
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US10409548B2 (en) 2016-09-27 2019-09-10 Grabango Co. System and method for differentially locating and modifying audio sources
JP2018055259A (ja) 2016-09-27 2018-04-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US9959861B2 (en) 2016-09-30 2018-05-01 Robert Bosch Gmbh System and method for speech recognition
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10283138B2 (en) * 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
WO2018067350A1 (en) 2016-10-03 2018-04-12 Google Llc. Processing voice commands based on device topology
WO2018067402A1 (en) 2016-10-03 2018-04-12 Google Inc. Selection of computational agent for task performance
CN107919116B (zh) 2016-10-11 2019-09-13 芋头科技(杭州)有限公司 一种语音激活检测方法及装置
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180122372A1 (en) 2016-10-31 2018-05-03 Soundhound, Inc. Distinguishable open sounds
US10783883B2 (en) 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device
JP6616048B1 (ja) 2016-11-07 2019-12-04 グーグル エルエルシー 記録されたメディアホットワードトリガ抑制
US10154496B2 (en) 2016-11-10 2018-12-11 Futurewei Technologies, Inc. System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems
US10382806B2 (en) 2016-11-14 2019-08-13 DISH Technologies L.L.C. Apparatus, systems and methods for controlling presentation of content using a multi-media table
US10170110B2 (en) 2016-11-17 2019-01-01 Robert Bosch Gmbh System and method for ranking of hybrid speech recognition results with neural networks
CN106708403A (zh) 2016-11-30 2017-05-24 努比亚技术有限公司 输入滑动操作时同步播放提示音的方法及装置
US10079015B1 (en) 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10186265B1 (en) 2016-12-06 2019-01-22 Amazon Technologies, Inc. Multi-layer keyword detection to avoid detection of keywords in output audio
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10255032B2 (en) 2016-12-13 2019-04-09 EVA Automation, Inc. Wireless coordination of audio sources
US11184764B2 (en) 2016-12-14 2021-11-23 Amzetta Technologies, Llc Methods and systems of establishing communication between devices
CN106531165A (zh) * 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
US10339957B1 (en) 2016-12-20 2019-07-02 Amazon Technologies, Inc. Ending communications session based on presence data
US10068573B1 (en) 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
DE112017006486T5 (de) 2016-12-23 2019-09-12 Synaptics Incorporated Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen
CN106910500B (zh) 2016-12-23 2020-04-17 北京小鸟听听科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
US10276161B2 (en) 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10580405B1 (en) 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10593328B1 (en) 2016-12-27 2020-03-17 Amazon Technologies, Inc. Voice control of remote device
US10186266B1 (en) 2016-12-28 2019-01-22 Amazon Technologies, Inc. Message playback using a shared device
US10229680B1 (en) 2016-12-29 2019-03-12 Amazon Technologies, Inc. Contextual entity resolution
US10831366B2 (en) 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
KR102412202B1 (ko) 2017-01-03 2022-06-27 삼성전자주식회사 냉장고 및 이의 정보 표시 방법
US10248613B2 (en) 2017-01-10 2019-04-02 Qualcomm Incorporated Data bus activation in an electronic device
US10672387B2 (en) 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US11164570B2 (en) 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
US10306254B2 (en) 2017-01-17 2019-05-28 Seiko Epson Corporation Encoding free view point data in movie data container
KR20180084392A (ko) 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
KR20180085931A (ko) 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
KR102556840B1 (ko) 2017-01-20 2023-07-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
US20180218747A1 (en) 2017-01-28 2018-08-02 Bose Corporation Audio Device Filter Modification
KR20180090586A (ko) 2017-02-03 2018-08-13 삼성전자주식회사 알림을 제공하는 방법 및 그 전자 장치
CA3155434A1 (en) 2017-02-07 2018-08-16 Lutron Technology Company Llc Audio-based load control system
US10762891B2 (en) 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN108446281B (zh) 2017-02-13 2021-03-12 北京嘀嘀无限科技发展有限公司 确定用户亲密度的方法、装置及存储介质
US20180293221A1 (en) 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US10431217B2 (en) * 2017-02-15 2019-10-01 Amazon Technologies, Inc. Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point
US10264358B2 (en) 2017-02-15 2019-04-16 Amazon Technologies, Inc. Selection of master device for synchronized audio
US10839795B2 (en) 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
CN106921560B (zh) 2017-02-28 2020-06-02 北京小米移动软件有限公司 语音通信方法、装置及系统
US10706843B1 (en) 2017-03-09 2020-07-07 Amazon Technologies, Inc. Contact resolution for communications systems
US20180262793A1 (en) 2017-03-09 2018-09-13 Google Inc. Reverse Casting from a First Screen Device to a Second Screen Device
US10089981B1 (en) 2017-03-09 2018-10-02 Amazon Technologies, Inc. Messaging account disambiguation
US10540961B2 (en) 2017-03-13 2020-01-21 Baidu Usa Llc Convolutional recurrent neural networks for small-footprint keyword spotting
US10074371B1 (en) 2017-03-14 2018-09-11 Amazon Technologies, Inc. Voice control of remote device by disabling wakeword detection
US10600406B1 (en) 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10621980B2 (en) 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
JP6791356B2 (ja) 2017-03-24 2020-11-25 ヤマハ株式会社 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107135443B (zh) 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10643609B1 (en) 2017-03-29 2020-05-05 Amazon Technologies, Inc. Selecting speech inputs
US10373630B2 (en) 2017-03-31 2019-08-06 Intel Corporation Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
US10825471B2 (en) 2017-04-05 2020-11-03 Avago Technologies International Sales Pte. Limited Voice energy detection
US11188808B2 (en) 2017-04-11 2021-11-30 Lenovo (Singapore) Pte. Ltd. Indicating a responding virtual assistant from a plurality of virtual assistants
US10748531B2 (en) 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
CN107122158A (zh) 2017-04-14 2017-09-01 北京小米移动软件有限公司 播放信息提示音频的方法及装置、电子设备
KR102068182B1 (ko) 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR102392297B1 (ko) 2017-04-24 2022-05-02 엘지전자 주식회사 전자기기
KR102298947B1 (ko) 2017-04-28 2021-09-08 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10311870B2 (en) 2017-05-10 2019-06-04 Ecobee Inc. Computerized device with voice command input capability
US10013995B1 (en) 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10628484B2 (en) 2017-05-17 2020-04-21 Board Of Trustees Of The University Of Illinois Vibrational devices as sound sensors
US10531196B2 (en) 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
US10564928B2 (en) 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
US10403299B2 (en) 2017-06-02 2019-09-03 Apple Inc. Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US10522146B1 (en) 2019-07-09 2019-12-31 Instreamatic, Inc. Systems and methods for recognizing and performing voice commands during advertisement
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10983753B2 (en) 2017-06-09 2021-04-20 International Business Machines Corporation Cognitive and interactive sensor based smart home solution
US10410635B2 (en) 2017-06-09 2019-09-10 Soundhound, Inc. Dual mode speech recognition
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US10028069B1 (en) 2017-06-22 2018-07-17 Sonos, Inc. Immersive audio in a media playback system
US10950228B1 (en) 2017-06-28 2021-03-16 Amazon Technologies, Inc. Interactive voice controlled entertainment
US11189273B2 (en) 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
US11264019B2 (en) 2017-06-30 2022-03-01 Google Llc Methods, systems, and media for voice-based call operations
US10687353B2 (en) 2017-07-10 2020-06-16 Qualcomm Incorporated Management of conflicting scheduling commands in wireless networks
US20190013019A1 (en) 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US10310082B2 (en) 2017-07-27 2019-06-04 Quantenna Communications, Inc. Acoustic spatial diagnostics for smart home management
US11205421B2 (en) 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US11798544B2 (en) 2017-08-07 2023-10-24 Polycom, Llc Replying to a spoken command
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102389041B1 (ko) 2017-08-11 2022-04-21 엘지전자 주식회사 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US10304475B1 (en) 2017-08-14 2019-05-28 Amazon Technologies, Inc. Trigger word based beam selection
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US10553235B2 (en) 2017-08-28 2020-02-04 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US20190066710A1 (en) 2017-08-28 2019-02-28 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US10546583B2 (en) 2017-08-30 2020-01-28 Amazon Technologies, Inc. Context-based device arbitration
US10366699B1 (en) 2017-08-31 2019-07-30 Amazon Technologies, Inc. Multi-path calculations for device energy levels
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10911596B1 (en) 2017-08-31 2021-02-02 Amazon Technologies, Inc. Voice user interface for wired communications system
US11361763B1 (en) 2017-09-01 2022-06-14 Amazon Technologies, Inc. Detecting system-directed speech
US10482895B2 (en) 2017-09-01 2019-11-19 Cirrus Logic, Inc. Acoustic echo cancellation (AEC) rate adaptation
US10847149B1 (en) 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
JP6571144B2 (ja) 2017-09-08 2019-09-04 シャープ株式会社 監視システム、監視機器、サーバ、および監視方法
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US20190082255A1 (en) 2017-09-08 2019-03-14 Olympus Corporation Information acquiring apparatus, information acquiring method, and computer readable recording medium
US10083006B1 (en) 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
KR102338376B1 (ko) 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US9973849B1 (en) 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10719507B2 (en) 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10580411B2 (en) 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
US10586534B1 (en) 2017-09-27 2020-03-10 Amazon Technologies, Inc. Voice-controlled device control using acoustic echo cancellation statistics
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US11233782B2 (en) 2017-10-04 2022-01-25 Resilience Magnum IP, LLC Single node network connectivity for structure automation functionality
US10897680B2 (en) 2017-10-04 2021-01-19 Google Llc Orientation-based device interface
KR102421255B1 (ko) 2017-10-17 2022-07-18 삼성전자주식회사 음성 신호를 제어하기 위한 전자 장치 및 방법
KR102543693B1 (ko) 2017-10-17 2023-06-16 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10403266B2 (en) 2017-10-18 2019-09-03 Intel Corporation Detecting keywords in audio using a spiking neural network
CN107808670B (zh) 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
JP2019086903A (ja) 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
CN107832837B (zh) 2017-11-28 2021-09-28 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
US20190163153A1 (en) 2017-11-30 2019-05-30 International Business Machines Corporation Enforcing dynamic volume thresholds of an entertainment device
US10546593B2 (en) 2017-12-04 2020-01-28 Apple Inc. Deep learning driven multi-channel filtering for speech enhancement
US10445365B2 (en) 2017-12-04 2019-10-15 Amazon Technologies, Inc. Streaming radio with personalized content integration
US10777189B1 (en) 2017-12-05 2020-09-15 Amazon Technologies, Inc. Dynamic wakeword detection
US10510340B1 (en) 2017-12-05 2019-12-17 Amazon Technologies, Inc. Dynamic wakeword detection
US20190172452A1 (en) 2017-12-06 2019-06-06 GM Global Technology Operations LLC External information rendering
EP3610480B1 (en) 2017-12-06 2022-02-16 Google LLC Ducking and erasing audio signals from nearby devices
CN107919123B (zh) 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
US11182122B2 (en) 2017-12-08 2021-11-23 Amazon Technologies, Inc. Voice control of computing devices
US20190179611A1 (en) 2017-12-11 2019-06-13 Sonos, Inc. Systems and Methods of Receiving Voice Input
US10847137B1 (en) 2017-12-12 2020-11-24 Amazon Technologies, Inc. Trigger word detection using neural network waveform processing
US10425247B2 (en) 2017-12-12 2019-09-24 Rovi Guides, Inc. Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset
US10051600B1 (en) 2017-12-12 2018-08-14 Amazon Technologies, Inc. Selective notification delivery based on user presence detections
US10374816B1 (en) 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US10663313B2 (en) 2017-12-15 2020-05-26 Google Llc Providing traffic warnings to a user based on return journey
US10540971B2 (en) 2017-12-15 2020-01-21 Blue Jeans Network, Inc. System and methods for in-meeting group assistance using a virtual assistant
US11409816B2 (en) 2017-12-19 2022-08-09 Motorola Solutions, Inc. Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information
DE112018002857T5 (de) 2017-12-26 2020-02-27 Robert Bosch Gmbh Sprecheridentifikation mit ultrakurzen Sprachsegmenten für Fern- und Nahfeld-Sprachunterstützungsanwendungen
US10504507B2 (en) 2017-12-28 2019-12-10 Syntiant Always-on keyword detector
US10614811B2 (en) 2017-12-29 2020-04-07 Intel Corporation Hierarchical speech recognition resolution
WO2019128550A1 (en) 2017-12-31 2019-07-04 Midea Group Co., Ltd. Method and system for controlling home assistant devices
WO2019128541A1 (en) 2017-12-31 2019-07-04 Midea Group Co., Ltd. Method and system for controlling multiple home devices
US9972343B1 (en) 2018-01-08 2018-05-15 Republic Wireless, Inc. Multi-step validation of wakeup phrase processing
US10795332B2 (en) 2018-01-16 2020-10-06 Resilience Magnum IP, LLC Facilitating automating home control
CN108198548B (zh) 2018-01-25 2020-11-20 苏州奇梦者网络科技有限公司 一种语音唤醒方法及其系统
US20190237067A1 (en) 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10157042B1 (en) 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
US11024307B2 (en) 2018-02-08 2021-06-01 Computime Ltd. Method and apparatus to provide comprehensive smart assistant services
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
US10425780B1 (en) 2018-02-22 2019-09-24 Amazon Technologies, Inc. Outputting notifications using device groups
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10491962B2 (en) 2018-03-14 2019-11-26 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications
US10749828B2 (en) 2018-03-14 2020-08-18 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10685669B1 (en) 2018-03-20 2020-06-16 Amazon Technologies, Inc. Device selection from audio data
US10440440B1 (en) 2018-03-23 2019-10-08 Rovi Guides, Inc. Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device
US10777203B1 (en) 2018-03-23 2020-09-15 Amazon Technologies, Inc. Speech interface device with caching component
US10755706B2 (en) 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
US10446169B1 (en) 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
US11151991B2 (en) 2018-03-30 2021-10-19 Verizon Media Inc. Electronic message transmission
CN111868824A (zh) 2018-04-05 2020-10-30 辛纳普蒂克斯公司 智能设备的情境感知控制
US20190311710A1 (en) 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US10720166B2 (en) 2018-04-09 2020-07-21 Synaptics Incorporated Voice biometrics systems and methods
US10679629B2 (en) 2018-04-09 2020-06-09 Amazon Technologies, Inc. Device arbitration by multiple speech processing systems
US10928917B2 (en) 2018-04-12 2021-02-23 International Business Machines Corporation Multiple user interaction with audio devices using speech and gestures
CN108520741B (zh) 2018-04-12 2021-05-04 科大讯飞股份有限公司 一种耳语音恢复方法、装置、设备及可读存储介质
US10679615B2 (en) 2018-04-16 2020-06-09 Google Llc Adaptive interface in a voice-based networked system
CN108538305A (zh) 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
EP3564949A1 (en) 2018-04-23 2019-11-06 Spotify AB Activation trigger processing
US10803864B2 (en) 2018-05-07 2020-10-13 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11308947B2 (en) 2018-05-07 2022-04-19 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
JP2019204025A (ja) 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10777195B2 (en) 2018-05-31 2020-09-15 International Business Machines Corporation Wake command nullification for digital assistance and voice recognition technologies
US20190371324A1 (en) 2018-06-01 2019-12-05 Apple Inc. Suppression of voice response by device rendering trigger audio
CN112272819B (zh) 2018-06-05 2024-04-26 三星电子株式会社 被动唤醒用户交互设备的方法和系统
US10433058B1 (en) 2018-06-14 2019-10-01 Sonos, Inc. Content rules engines for audio playback devices
US10762896B1 (en) 2018-06-25 2020-09-01 Amazon Technologies, Inc. Wakeword detection
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
NL2021308B1 (en) 2018-07-16 2020-01-24 Hazelebach & Van Der Ven Holding B V Methods for a voice processing system
JP7000268B2 (ja) 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
US11144596B2 (en) 2018-07-24 2021-10-12 Harman International Industries, Incorporated Retroactive information searching enabled by neural sensing
GB2576016B (en) 2018-08-01 2021-06-23 Arm Ip Ltd Voice assistant devices
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
KR102225984B1 (ko) 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US10622009B1 (en) 2018-09-10 2020-04-14 Amazon Technologies, Inc. Methods for detecting double-talk
US20200090647A1 (en) 2018-09-14 2020-03-19 Comcast Cable Communications, Llc Keyword Detection In The Presence Of Media Output
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10650807B2 (en) 2018-09-18 2020-05-12 Intel Corporation Method and system of neural network keyphrase detection
KR20200034430A (ko) 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
US10861444B2 (en) 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10950249B2 (en) 2018-09-25 2021-03-16 Amazon Technologies, Inc. Audio watermark encoding/decoding
US11170758B2 (en) 2018-09-27 2021-11-09 Rovi Guides, Inc. Systems and methods for providing notifications within a media asset without breaking immersion
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
KR102606789B1 (ko) 2018-10-01 2023-11-28 삼성전자주식회사 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치
US20200110571A1 (en) 2018-10-05 2020-04-09 Sonos, Inc. Systems and methods for media content selection
US10971158B1 (en) 2018-10-05 2021-04-06 Facebook, Inc. Designating assistants in multi-assistant environment based on identified wake word received from a user
US10346122B1 (en) 2018-10-18 2019-07-09 Brent Foster Morgan Systems and methods for a supplemental display screen
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US10943599B2 (en) 2018-10-26 2021-03-09 Spotify Ab Audio cancellation for voice recognition
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11198446B2 (en) 2019-01-04 2021-12-14 Faraday & Future Inc. On-board vehicle query system
JP2020112692A (ja) 2019-01-11 2020-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 方法、制御装置、及びプログラム
US11349834B2 (en) 2019-01-30 2022-05-31 Ncr Corporation Multi-factor secure operation authentication
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
CN109712626B (zh) 2019-03-04 2021-04-30 腾讯科技(深圳)有限公司 一种语音数据处理方法及装置
US10943598B2 (en) 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US10964314B2 (en) 2019-03-22 2021-03-30 Cirrus Logic, Inc. System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array
US10984783B2 (en) 2019-03-27 2021-04-20 Intel Corporation Spoken keyword detection based utterance-level wake on intent system
US20200310751A1 (en) 2019-03-29 2020-10-01 Qualcomm Incorporated System and method of managing device sound level
EP4184949A1 (en) 2019-04-17 2023-05-24 Oticon A/s A hearing device comprising a transmitter
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US20200409926A1 (en) 2019-06-28 2020-12-31 Rovi Guides, Inc. Automated contact creation based on content communications
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11159878B1 (en) 2019-08-15 2021-10-26 Amazon Technologies, Inc. Autonomously motile device with beamforming
JP7191793B2 (ja) 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
US11172328B2 (en) 2019-09-27 2021-11-09 Sonos, Inc. Systems and methods for device localization
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
US20220301561A1 (en) 2019-12-10 2022-09-22 Rovi Guides, Inc. Systems and methods for local automated speech-to-text processing
US11823659B2 (en) 2019-12-11 2023-11-21 Amazon Technologies, Inc. Speech recognition through disambiguation feedback
US11445301B2 (en) 2020-02-12 2022-09-13 Sonos, Inc. Portable playback devices with network operation modes
CN111341306B (zh) 2020-02-14 2022-06-17 东南大学 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法
US11206052B1 (en) 2020-06-18 2021-12-21 HAJEN Co., Ltd Smart speaker
US20220050585A1 (en) 2020-08-14 2022-02-17 Apple Inc. Audio media playback user interface

Also Published As

Publication number Publication date
CN111418216A (zh) 2020-07-14
US20190102145A1 (en) 2019-04-04
AU2018338812A1 (en) 2020-04-30
KR102415967B1 (ko) 2022-07-04
US11893308B2 (en) 2024-02-06
EP3951586A1 (en) 2022-02-09
CA3084279A1 (en) 2019-04-04
CN111418216B (zh) 2022-11-11
WO2019067930A1 (en) 2019-04-04
US10466962B2 (en) 2019-11-05
KR20230152813A (ko) 2023-11-03
US11288039B2 (en) 2022-03-29
EP3688995A1 (en) 2020-08-05
EP3688995B1 (en) 2021-09-01
US11175888B2 (en) 2021-11-16
US20220222039A1 (en) 2022-07-14
AU2023237094A1 (en) 2023-10-12
JP2020536274A (ja) 2020-12-10
WO2019067930A9 (en) 2019-09-26
JP6987230B2 (ja) 2021-12-22
KR20200055776A (ko) 2020-05-21
KR20220093280A (ko) 2022-07-05
US20210141600A1 (en) 2021-05-13
JP7346529B2 (ja) 2023-09-19
US20200326909A1 (en) 2020-10-15
KR102597285B1 (ko) 2023-11-02
JP2023164959A (ja) 2023-11-14
US10606555B1 (en) 2020-03-31
JP2022037012A (ja) 2022-03-08
US20200089469A1 (en) 2020-03-19

Similar Documents

Publication Publication Date Title
CN111418216B (zh) 具有语音辅助的媒体回放系统
US11797263B2 (en) Systems and methods for voice-assisted media content selection
US20240103804A1 (en) Systems and methods of receiving voice input
US11696074B2 (en) Systems and methods for associating playback devices with voice assistant services
US20210210095A1 (en) Devices, systems, and methods for distributed voice processing
US20200110571A1 (en) Systems and methods for media content selection
US20240080621A1 (en) Device designation of playback and network microphone device arrangements
CN112640475B (zh) 用于将回放设备与语音助理服务相关联的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination