CN109076284B - 媒体回放系统的语音控制 - Google Patents
媒体回放系统的语音控制 Download PDFInfo
- Publication number
- CN109076284B CN109076284B CN201780025028.2A CN201780025028A CN109076284B CN 109076284 B CN109076284 B CN 109076284B CN 201780025028 A CN201780025028 A CN 201780025028A CN 109076284 B CN109076284 B CN 109076284B
- Authority
- CN
- China
- Prior art keywords
- media
- playback
- playback system
- user
- media playback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 168
- 238000003860 storage Methods 0.000 claims description 21
- 230000001960 triggered effect Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 description 59
- 238000004891 communication Methods 0.000 description 52
- 230000006870 function Effects 0.000 description 45
- 238000012545 processing Methods 0.000 description 34
- 230000009471 action Effects 0.000 description 29
- 241000254173 Coleoptera Species 0.000 description 26
- 230000008569 process Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 22
- 230000008859 change Effects 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 239000011435 rock Substances 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 208000032580 NMDA receptor encephalitis Diseases 0.000 description 2
- 241000282376 Panthera tigris Species 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 241000502522 Luscinia megarhynchos Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 235000021167 banquet Nutrition 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- IXSZQYVWNJNRAL-UHFFFAOYSA-N etoxazole Chemical compound CCOC1=CC(C(C)(C)C)=CC=C1C1N=C(C=2C(=CC=CC=2F)F)OC1 IXSZQYVWNJNRAL-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2807—Exchanging configuration information on appliance services in a home automation network
- H04L12/2809—Exchanging configuration information on appliance services in a home automation network indicating that an appliance service is present in a home automation network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/007—Monitoring arrangements; Testing arrangements for public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/005—Discovery of network devices, e.g. terminals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/22—Processing or transfer of terminal data, e.g. status or physical capabilities
- H04W8/24—Transfer of terminal data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/2847—Home automation networks characterised by the type of home appliance used
- H04L2012/2849—Audio/video appliances
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/003—Digital PA systems using, e.g. LAN or internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/005—Audio distribution systems for home, i.e. multi-room use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/10—Small scale networks; Flat hierarchical networks
- H04W84/12—WLAN [Wireless Local Area Networks]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Circuit For Audible Band Transducer (AREA)
- User Interface Of Digital Computer (AREA)
- Quality & Reliability (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
- Telephonic Communication Services (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Abstract
接收包括命令字、一个或多个媒体变量实例和一个或多个区域变量实例的语音输入。确定对应于命令字的媒体回放系统命令。识别对应于一个或多个媒体变量实例的媒体内容。媒体回放系统可以基于一个或多个区域变量实例对媒体内容执行媒体回放系统命令。
Description
相关申请的交叉引用
本申请根据PCT第8条要求以下各项的优先权权益:(i)2016年7月29日提交的题为“Voice Control of a Media Playback System”的美国非临时专利申请No.15/223,218、(ii)2016年4月14日提交的题为“Music Service Selection”的美国非临时专利申请No.15/098,718、(iii)2016年4月14日提交的题为“Room-Corrected Voice Detection”的美国非临时专利申请No.15/098,805、(iv)2016年4月18日提交的题为“Action based onUser ID”的美国非临时专利申请No.15/131,776、(v)2016年3月23日提交的题为“VoiceControl of a Media Playback System”的美国临时专利申请No.62/312,350、(vi)2016年2月22日提交的题为“Audio Response Playback”的美国临时专利申请No.62/298,418、(vii)2016年2月22日提交的题为“Music Service Selection”的美国临时专利申请No.62/298,425、(vii)2016年2月22日提交的题为“Metadata Exchange Involving a NetworkedPlayback System and a Networked Microphone System”的美国临时专利申请No.62/298,350、(viii)2016年2月22日提交的题为“Handling of Loss of Pairing BetweenNetworked Devices”的美国临时专利申请No.62/298,388、(ix)2016年2月22日提交的题为“Default Playback Device(s)”的美国临时专利申请No.62/298,410、(x)2016年2月22日提交的题为“Room-Corrected Voice Detection”的美国临时专利申请No.62/298,433、(xi)2016年2月22日提交的题为“Content Mixing”的美国临时专利申请No.62/298,439、以及(xii)2016年2月22日提交的题为“Action Based on User ID”的美国临时专利申请No.62/298,393。这些专利申请中的每件专利申请的内容通过引用全部合并于此。
技术领域
本公开涉及消费者产品,更具体地,涉及与媒体回放或者其某个方面有关的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices”的专利申请,并在2005年开始出售媒体回放系统为止。Sonos无线高保真系统使人们可以通过一个或多个联网回放设备体验来自多个源的音乐。通过安装在智能电话、平板电脑或计算机上的软件控制应用,人们可以在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,可以将不同的歌曲流传输到具有回放设备的每个房间,可以将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
附图说明
参考以下说明书、所附权利要求和附图,将更好地理解本公开的技术的特征、方面和优点,在附图中:
图1示出了可以实施某些实施例的示例媒体回放系统配置;
图2示出了根据本文描述的方面的示例回放设备的功能框图;
图3示出了根据本文描述的方面的示例控制设备的功能框图;
图4示出了根据本文描述的方面的示例控制器界面;
图5示出了根据本文描述的方面的示例多个网络设备;
图6示出了根据本文描述的方面的示例网络麦克风设备的功能框图;
图7是关于向网络麦克风设备提供环境的声学特性(acoustics)的示例流程图;
图8是关于向网络麦克风设备提供环境的声学特性的另一示例流程图;
图9是关于解释网络麦克风设备接收的语音输入的示例流程图;
图10是关于确定环境的声学特性的示例流程图;
图11是关于对回放设备播放的音频内容施加方向性的另一示例流程图;
图12示出了根据本文描述的方面的示例音乐控制方法的流程图;
图13A-13D示出了根据本文描述的方面的配置过程的示例用户界面;
图14示出了根据一些实施例的示例方法;
图15示出了根据一些实施例的另一示例方法;
图16是关于通过网络麦克风设备识别流传输音乐服务的示例流程图;以及
图17是关于通过网络麦克风设备识别流传输音乐服务的另一示例流程图。
附图用于示出示例实施例的目的,但可以理解,本发明不限于附图所示的布置和手段。
具体实施方式
I.概述
通常,语音命令可以是控制本文讨论的任何媒体回放系统控制的命令。例如,语音命令可以是媒体回放系统通过该媒体回放系统的一个或多个回放设备来播放媒体内容的命令。在另一示例中,语音命令可以是修改媒体回放系统的一个或多个媒体回放设备的回放设置的命令。回放设置可以包括例如回放音量、回放传输控制、音乐源选择、分组等。
在一个方面中,本文描述的示例涉及向网络麦克风设备(NMD)提供NMD的操作环境的声学特性。NMD可以在解释NMD接收的语音命令时使用环境的声学特性。
NMD可以是通过麦克风阵列接收语音输入(例如,讲话)并基于语音输入执行功能的设备。例如,NMD可以接收语音命令并解释接收到的语音命令。然后,NMD可以基于语音命令执行功能。具体地,NMD可以接收“播放来自‘流传输服务1’的‘艺术家1’的‘曲目1’”的语音命令,确定语音输入是播放音频内容的命令,然后促使播放所请求的来自‘流传输服务1’的‘艺术家1’的‘曲目1’。其他布置也是可能的。
NMD的操作环境可以具有特定声学特性。声学特性定义了声音在环境中的行进方式。可以以许多方式确定环境的声学特性。作为一个示例,具有扬声器和麦克风的回放设备可以通过扬声器输出测试音调,通过麦克风接收测试音调,并且分析接收到的测试音调来确定环境的声学特性。在另一示例中,另一网络设备(例如,控制设备、第一回放设备或甚至NMD自身)可以包括从第二回放设备的扬声器接收测试音调的麦克风,并分析接收到的测试音调以确定环境的声学特性。测试音调可以是不同频率的音频声音。这些声学特性可以存储在通信网络中的计算设备上或回放设备上,以供回放设备在回放音频内容时使用。
在一些示例中,可以基于环境的已知特性(如房间的大小、房间天花板的高度和房间中的家具)来推断声学特性。数据库可以存储具有不同特性的房间的声学特性。存储在数据库中的声学特性可以是基于对具有特定特征的房间进行的预先分析而确定的。用户可以输入房间的特性,并且数据库可以输出环境的声学特性。声学特性还可以存储在回放设备自身或数据库中,以供回放设备使用。
题为“Playback Device Calibration”的美国非临时专利No.14/481,511、题为“Audio Settings Based on Environment”的美国非临时专利No.14/216,306、题为“Hybrid Test Tone for Space-Averaged Rom Audio Calibration Using a MovingMicrophone”的美国非临时专利No.14/805,140、题为“Multi-Channel Pairing in MediaSystem”的美国非临时专利No.14/825,961、以及题为“System and Method for DevicePlayback Calibration”的美国专利No.9,106,192也描述了用于校准回放设备的各种示例,其内容均通过引用整体并入本文。
NMD通常可以通过麦克风响应来处理语音输入。麦克风响应是麦克风关于频率的灵敏度的指示。在实施例中,NMD还可以使用环境的声学特性来处理语音输入以校正语音输入中的失真。这样可以更好地解释语音输入。
回放设备可以向NMD提供环境的声学特性。由于媒体回放系统可以具有多个回放设备,所以提供声学特性的回放设备可以是最靠近NMD的回放设备。作为另一示例,提供声学特性的回放设备可以是在同一区域的回放设备。在一些情况下,回放设备可以与NMD绑定(分组或配对)。绑定可以表示回放设备和NMD彼此非常靠近,例如,在同一房间或同一区域中,和/或同步播放内容。当NMD与回放设备绑定时,NMD可以被布置为从绑定的回放设备接收环境的声学特性。此外,如果NMD被移动并且绑定到另一回放设备,则其所绑定到的该另一回放设备可以提供NMD所处环境的新的声学特性。
NMD可以使用其所处环境的声学特性来改进其操作。例如,NMD可以基于声学特性来定义滤波器。NMD可以将滤波器应用于网络麦克风设备接收的语音输入,以校正环境的声学特性,例如,语音输入中的频谱、空间和时间失真。这样可以更好地解释语音输入。
在许多情况下,NMD可以放置在媒体回放系统附近。媒体回放系统可以包括回放音频内容的多个回放设备。这些回放设备可以分布在家中的各个位置,并且这些位置可以被称为区域,例如家中的卧室或起居室。由此,NMD可能需要在存在也是由媒体回放系统回放的音频内容(如音乐)时解释语音输入。
在一些情况下,回放设备可以向NMD提供对正在回放的内容的指示,使得NMD不仅可以将滤波器应用于语音输入以校正环境的声学特性,还可以使用正在回放的音频内容以更好地分隔语音输入。
附加地或备选地,NMD可以能够确定语音输入的方向性。方向性可以定义语音输入来自的方向。该方向性可被提供至媒体回放系统。媒体回放系统包括多个扬声器。媒体回放系统可以使用该方向性来调整多个扬声器的音频输出。例如,媒体回放系统也可以将一个或多个回放设备产生的音频声音引导至语音输入来自的方向。这可以是收听者所在的位置。其他布置也是可能的。
在另一方面中,本文描述的一些示例涉及通过语音输入控制媒体回放系统。本文提供的一些示例可以涉及一种方法。该方法可以包括接收包括命令字和一个或多个媒体变量实例的语音输入,以及确定语音输入对应于音乐控制。该方法还可以包括确定对应于命令字的命令,以及处理语音输入以识别对应于意图的媒体回放系统命令。可以处理语音输入以识别与一个或多个音乐变量实例相关的媒体内容,并且可以确定媒体内容的一个或多个媒体项。可以使媒体回放系统对一个或多个媒体项执行命令。
在其他示例中,提供了一种非暂时性计算机可读介质。非暂时性计算机可读介质上存储有指令,所述指令可由计算设备执行以使计算设备执行功能。这些功能包括接收包括命令字和一个或多个媒体变量实例的语音输入,以及确定语音输入对应于音乐控制。这些功能还可以包括确定对应于命令字的命令,以及处理语音输入以识别对应于意图的媒体回放系统命令。可以处理语音输入以识别与一个或多个音乐变量实例相关的媒体内容,并且可以确定媒体内容的一个或多个媒体项。可以使媒体回放系统对一个或多个媒体项执行命令。
根据另一些示例,提供了一种系统。该系统包括处理器和存储器。存储器上存储有可由装置执行以使系统执行功能的指令。这些功能包括接收包括命令字和一个或多个媒体变量实例的语音输入,以及确定语音输入对应于音乐控制。这些功能还可以包括确定对应于命令字的命令,以及处理语音输入以识别对应于意图的媒体回放系统命令。可以处理语音输入以识别与一个或多个音乐变量实例相关的媒体内容,并且可以确定媒体内容的一个或多个媒体项。可以使媒体回放系统对一个或多个媒体项执行命令。
在又一方面中,本文描述的示例包括媒体回放系统(或者其可能的一个或多个组件)接收语音命令,并基于用户识别确定媒体回放系统执行的适当动作。
收听外放媒体内容可以一种涉及家人、朋友和访客的社交活动。媒体内容可以包括,例如,热线广播、有声读物(books)、来自电视的音频、存储在本地驱动器上的音乐、来自媒体源(例如,Radio、Radio、Google PlayTM、iTunesRadio)的音乐以及其他可听材料。例如,在家中,人们可以在聚会和其他社交聚会上以外放方式播放音乐。在这种环境下,人们可能希望在一个收听区域或同时在多个收听区域中播放音乐,使得每个收听区域中的音乐可以是同步的,而没有可听见的回声或干扰(glitch)。当人们可以使用语音命令来控制音频回放设备或系统时,可以进一步丰富这种体验。例如,人们可能希望改变音频内容、播放列表或收听区域,将音乐曲目添加到播放列表或回放队列,或者改变回放设置(例如,播放、暂停、下一曲目、前一曲目、回放音量和EQ设置等)。
收听外放媒体内容也可以是个人体验。例如,个人可以在工作前的早晨、锻炼时、晚餐时、或者白天在家中或工作时的其他时间为自己以外放方式播放音乐。针对这些个人体验,个人可以选择将音频内容的回放限制在单个收听区域或收听处。当个人可以使用语音命令来选择收听区域、音频内容、回放设置及其他设置时,可以进一步丰富这种体验。
对尝试执行语音命令的人进行识别也可以是体验的重要元素。可能希望基于这个人是谁以及这个人希望媒体回放设备或系统做什么来执行语音命令。作为说明,在家中进行聚会或社交聚会时,主人或家庭所有者可能希望阻止某些访客使用语音命令来改变音频内容、收听区域或回放设置。在一些情况下,主人或家庭所有者可能希望允许某些访客使用语音命令来改变音频内容、收听区域或回放设置,同时阻止其他访客进行此类改变。基于用户简档或语音配置设置的用户识别可以帮助区分家庭所有者的语音和访客的语音。
在另一示例中,用户识别可以用于区分成人的语音和儿童的语音。在一些情况下,家庭所有者可能希望阻止儿童使用语音命令来收听不适合儿童的音频内容。在其他情况下,家庭所有者可能希望阻止儿童改变收听区域或回放设置。例如,家庭所有者可能希望以特定音量收听音频内容并且阻止儿童改变音频内容的音量。用户识别可以帮助设置家长控制设置或约束设置,以阻止儿童访问特定内容或者改变收听区域或回放设置。例如,基于用户简档或语音配置设置的用户识别可以帮助确定这个儿童是谁,允许这个儿童听什么,或者允许这个儿童改变什么设置。
在又一示例中,用户识别可以用于防止无意的语音命令。例如,家庭所有者可能希望防止来自电视的音频或任何其他音频内容无意中触发语音命令。本文描述了与上述示例类似和不同的许多其他示例,并且示出了基于语音识别的不同类型的动作。
本文描述的一些实施例包括媒体回放系统(或者其可能的一个或多个组件)接收语音命令,并基于用户识别确定媒体回放系统执行的适当动作。
在示例配置中,媒体回放系统包括单独的或与诸如媒体回放系统服务器之类的计算设备组合的一个或多个媒体回放设备。在另一示例配置中,媒体回放系统可以包括联网麦克风系统服务器和一个或多个NMD或与之通信。在又一示例配置中,媒体回放系统服务器和/或联网麦克风系统服务器可以是基于云的服务器系统。这些设备和/或服务器中的任一个或组合可以接收用于媒体回放系统的语音命令。
在示例操作中,一个或多个功能可以由联网麦克风系统单独地或与媒体回放系统组合地执行。例如,接收语音命令可以包括联网麦克风系统通过一个或多个NMD接收语音命令,以及向媒体回放系统发送语音命令以进行进一步处理。然后,媒体回放系统可以将语音命令转换为等效的文本命令,并解析文本命令以识别命令。在另一情况下,联网麦克风系统可将语音命令转换为等效的文本命令,并向媒体回放系统发送文本命令以解析文本命令和识别命令。
语音命令可以是控制本文讨论的任何媒体回放系统控制的命令。例如,在一些实施例中,语音命令可以是媒体回放系统通过该媒体回放系统的一个或多个回放设备来播放媒体内容的命令。在一些实施例中,语音命令可以是修改媒体回放系统的一个或多个媒体回放设备的回放设置的命令。回放设置可以包括例如回放音量、回放传输控制、音乐源选择、分组等。
在接收到语音命令之后,媒体回放系统的计算设备可以确定是否是从媒体回放系统的注册用户接收到语音命令。例如,媒体回放系统可以注册到家中的一个或多个用户或特定用户。媒体回放系统的计算设备可以被配置为基于存储在计算设备中的用户简档将语音命令与注册用户相关联。注册用户可以具有创建并存储在计算设备中的用户简档。用户简档可以包含特定于用户的信息。例如,用户简档可以包含关于用户的年龄、位置、偏好回放设置、偏好播放列表、偏好音频内容、对该用户设置的访问约束的信息以及识别用户语音的信息等。
媒体回放系统的计算设备可以被配置为基于用户设置的语音配置设置将语音命令与用户相关联。例如,媒体回放系统可以要求用户提供一个语音输入或一系列语音输入。然后,媒体回放系统的计算设备可以处理语音输入,将语音输入与用户相关联,并存储信息,使得媒体回放系统可以识别来自用户的语音命令。
在一些示例中,媒体回放系统的计算设备可以被配置为确定与语音命令相关联的置信度水平,这可以进一步帮助确定是从注册用户接收到语音命令。可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
响应于确定是从注册用户接收到语音命令,媒体回放系统的计算设备可以配置用于媒体回放系统的指令。指令可以基于语音命令中的内容和注册用户的用户简档中的信息。附加地或备选地,指令可以基于语音命令中的内容和存储在计算设备上的语音配置设置。
如本文的示例中所述,语音命令可包括各种内容。在一个示例中,语音命令中的内容可以包括一个或多个回放设备播放媒体内容的命令。在一些情况下,基于一个或多个回放设备播放媒体内容的命令和注册用户的用户简档中的信息,媒体回放系统的计算设备可以配置指令,使得一个或多个回放设备从注册用户的偏好媒体源(例如,音乐流传输服务)获得媒体内容。然后,计算设备可以配置指令,使得媒体回放系统通过媒体回放系统的一个或多个回放设备播放媒体内容。在其他情况下,基于一个或多个回放设备播放媒体内容的命令和注册用户的用户简档中的信息,计算设备可以包括指令,以便(i)将一个或多个回放设备配置有注册用户的一个或多个偏好回放设置,和(ii)使得一个或多个回放设备通过媒体回放系统按照注册用户的偏好回放设置来播放媒体内容。
在另一示例中,语音命令中的内容可以包括一个或多个回放设备播放媒体内容的命令,但是可以不识别媒体回放系统的特定收听区域或回放区域。基于语音命令中的内容和注册用户的用户简档中的信息,计算设备可以配置指令,使得一个或多个回放设备通过媒体回放系统的特定回放区域内的一个或多个媒体回放设备来播放媒体内容。
在又一示例中,语音命令中的内容可以包括使媒体回放系统修改回放设置的命令。基于语音命令中的内容和注册用户的用户简档中的信息,计算设备可以配置指令,使得媒体回放系统修改媒体回放系统的一个或多个回放设备的回放设置。
其他示例可以涉及媒体回放系统确定优先顺序,以解决从不同用户接收的冲突语音命令。例如,媒体回放系统可以分配优先顺序,其中从注册的访客接收的语音命令具有比非注册的访客更高的优先级。例如,冲突语音命令可以包括从用户接收的播放歌曲的语音命令和随后从另一用户接收的停止播放歌曲的语音命令。本文描述了与上述示例类似和不同的许多其他示例。
在另一示例中,媒体回放系统可以基于接收到的与注册用户或注册的访客用户相关联的唤醒词或唤醒短语来采取动作。唤醒词或唤醒短语(例如,“嘿Sonos”)可以用于触发时间段,在该时间段内系统将基于接收到的唤醒词接受来自用户的附加命令。例如,主人或授权访客可以发送将歌曲添加到播放队列的语音命令(例如,“嘿Sonos,让我们队列(queueup)歌曲”),这可以开启一个时间段(例如,五分钟),用于主人或授权访客发送将特定歌曲添加到播放队列的附加语音命令。本文描述了与上述示例类似和不同的许多其他示例。
在配置了用于媒体回放系统的一个指令或一组指令之后,计算设备的一些实施例可以将一个指令或一组指令发送到媒体回放系统的一个或多个回放设备。
在又一示例中,媒体回放系统的计算设备可以确定是否是从儿童接收到语音命令。计算设备可以被配置为基于用户简档或访客简档中的信息来区分成人和儿童。具体地,计算设备可以基于用户语音的音调或频率来区分成人和儿童。
响应于确定是从儿童接收到语音命令,可以防止一个或多个回放设备播放可能不适合该儿童的给定媒体内容。在一些情况下,可以防止计算设备和/或一个或多个回放设备基于儿童的语音命令的内容来修改回放设置。
在又一示例中,动作可以基于确定是否是从访客用户而不是媒体回放系统的注册用户接收到语音命令。在一个示例中,注册用户可能已经为访客用户创建了访客简档。访客简档可以包括用户简档中包括的任何信息。在另一示例中,媒体回放系统的计算设备可以确定语音命令不是从注册用户接收的,然后可以询问注册用户该语音命令是否来自注册用户的访客。
响应于确定是从访客用户接收到语音命令,媒体回放系统的计算设备可以(1)为访客用户分配约束设置,(2)基于语音命令中的内容和为访客用户分配的约束设置来配置用于一个或多个回放设备的指令,以及(3)向一个或多个回放设备发送指令。约束设置可以是限制对媒体回放系统的控制的任何设置。
在另一方面,本文描述的示例涉及基于命令来识别和访问合适的流传输服务(例如,流传输音频曲目)。
可以基于NMD提供的语音命令来识别和访问流传输服务。例如,NMD可以接收语音命令“播放70年代的摇滚乐电台”,确定该语音是播放来自特定流传输服务的特定电台的命令,然后促使对来自该服务的电台的回放。在其他实现中,流传输服务的选择可以基于经由控制器设备的用户界面的命令输入(例如,文本输入)。其它类型的命令也是可能的。
在另一示例中,命令可能未明确指定用户期望访问哪个流传输服务。例如,用户可以发出更普通的命令,例如“播放Queen”或“播放70年代摇滚乐”。在这种情况下,现有系统在区分用户期望播放的内容类型方面(即,艺术家Queen还是专辑Queen、70年代摇滚乐电台还是70年代摇滚乐的“最佳”专辑)的能力有限。另外,这种系统不能将用户想要的内容类型与各种流传输服务的内容类型能力进行匹配(即,哪些服务能够播放广播电台、艺术家、专辑)。
鉴于不断增加的内容量和可用流传输服务数量,需要一种系统,其能够智能地基于用户命令选择与提供给用户的内容类型相匹配的所期望的流传输服务。
在示例中,可以由包括多个支持网络的设备的网络配置来完成对流传输服务的选择。网络配置可以包括接收、处理和分析命令的NMD、回放设备、计算设备和/或控制器设备(例如,平板电脑、智能电话)。该配置还可以包括基于对接收到的命令的处理和分析从一个或多个音乐内容服务器检索和/或请求音频内容。然后,NMD、控制器设备和/或任何数量的回放设备可以获得音频内容,以基于命令提供音频回放体验。网络配置也可以采用其他形式。
在另一示例中,选择可以基于单独或组合的多个标准。在一种情况下,流传输服务的选择可以取决于命令所指示的内容类型(例如,歌曲、流派(genre)、无线电台)以及特定流传输服务是否支持所指示的内容类型。在这种情况下,可以利用内容类型逻辑来将命令或命令的部分与内容类型相关联。然后,可以将通过逻辑识别的内容类型映射到具有可用内容类型的流传输服务。可以以各种其他方式执行对通过命令指示的内容类型的分析。
在又一示例中,流传输服务的选择可以部分地基于用户历史,这可以考虑用户的流传输服务偏好。用户偏好可以基于每个区域、最常播放的内容类型等。另外,可以包含各种形式的“外部”数据,包括但不限于地理数据、人口统计数据和天气类型数据。可能存在其他类型的选择影响标准。
除了选择流传输服务之外,对用户命令的处理可以导致输出替代的指示。在这样的示例中,系统可以输出能够播放命令所指示的内容类型的流传输服务的建议。在另一示例中,系统可以输出“内容不可用”的指示。可以通过网络麦克风设备或控制器在NMD、控制器处或在一个或多个回放设备处输出这样的指示。
各种选择标准可以用作算法的输入,以确定各种流传输服务的置信度指标(metric)。置信度指标可以是特定流传输服务是否是用户可能希望收听的流传输服务的指示。例如,置信度水平可以是分配给流传输服务的概率值或百分比(例如,1-100)。在一个示例中,可以提供具有最高置信度指标的流传输服务以用于流传输。在另一情况下,如果所计算的最高置信度指标未超过阈值置信度值或者前N个置信度水平在彼此的指定范围内,则可以触发错误状态。在这种情况下,错误状态可以使得网络麦克风设备(1)输出“内容不可用”的指示,(2)要求用户重复/进一步指定命令,(3)使得音频由优选的合作伙伴或默认服务来播放等。置信度指标可以以多种其他方式使用。
虽然本文描述的一些示例可以涉及由诸如“用户”和/或其他实体之类的给定行动者执行的功能,但是应该理解,这仅仅出于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。本领域普通技术人员将理解,本公开包括许多其他实施例。
II.示例操作环境
图1示出了媒体回放系统100的示例配置,在媒体回放系统100中可以实施或实现本文公开的一个或多个实施例。如图所示的媒体回放系统100与具有若干房间和空间(例如,主卧室、书房、餐厅和起居室)的示例家居环境相关联。如图1的示例所示,媒体回放系统100包括回放设备102-124、控制设备126和128、以及有线或无线网络路由器130。
可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件如何交互,以便向用户提供媒体体验的进一步讨论。虽然本文的讨论会总体上涉及示例媒体回放系统100,但是本文描述的技术不限于如图1所示的家居环境等等内的应用。例如,本文描述的技术可以在可能需要多区域音频的环境中有用,例如,诸如餐馆、商场或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或小汽车之类的载运工具、船舶或船只、飞机等。
a.示例回放设备
图2示出了示例回放设备200的功能框图,该示例回放设备200可以被配置为图1的媒体回放系统100的回放设备102-124中的一个或多个。回放设备200可以包括处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、包括无线接口216和有线接口218的网络接口214、以及麦克风220。在一种情况下,回放设备200可以不包括扬声器212,而是包括用于将回放设备200连接到外部扬声器的扬声器接口。在另一种情况下,回放设备200可以既不包括扬声器212也不包括音频放大器210,而是包括用于将回放设备200连接到外部音频放大器或视听接收器的音频接口。
在一个示例中,处理器202是时钟驱动计算组件,其被配置为根据存储器206中存储的指令处理输入数据。存储器206可以是有形计算机可读介质,其被配置为存储可由处理器202执行的指令。例如,存储器206可以是数据存储设备,其可以加载有可由处理器202执行以实现某些功能的一个或多个软件组件204。在一个示例中,功能可以包括回放设备200从音频源或另一回放设备检索音频数据。在另一示例中,功能可以包括回放设备200向网络上的另一设备或回放设备发送音频数据。在又一示例中,功能可以包括将回放设备200与一个或多个回放设备配对以创建多声道音频环境。
某些功能可以包括回放设备200与一个或多个其他回放设备对音频内容的同步回放。在同步回放期间,收听者将优选地不能够感知回放设备200和一个或多个其他回放设备对音频内容的回放之间的时间延迟差异。通过引用合并于此的题为“System and methodfor synchronizing operations among a plurality of independently clockeddigital data processing devices”的美国专利No.8,234,395,更详细地提供了回放设备之间的音频回放同步的一些示例。
存储器206还可以被配置为存储与回放设备200相关联的数据,例如,回放设备200所属的一个或多个区域和/或区域组、回放设备200可访问的音频源、或回放设备200(或某个其他回放设备)可能与之相关联的回放队列。数据可以存储为一个或多个状态变量,该状态变量被周期性地更新并用于描述回放设备200的状态。存储器206还可以包括与媒体系统的其他设备的状态相关联的数据,并且间或地在设备之间共享,使得一个或多个设备具有与系统相关联的最新数据。其他实施例也是可能的。
音频处理组件208可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施例中,音频处理组件208中的一个或多个可以是处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地改变音频内容以产生音频信号。然后,所产生的音频信号可被提供至音频放大器210进行放大,并通过扬声器212回放。具体地,音频放大器210可以包括被配置为将音频信号放大到用于驱动一个或多个扬声器212的电平的设备。扬声器212可包括单独的换能器(例如,“驱动器”)或具有一个或多个驱动器的包括壳体的完整扬声器系统。例如,扬声器212的特定驱动器可以包括例如低音炮(例如,针对低频)、中频段驱动器(例如,针对中频)和/或高频扬声器(例如,针对高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的每个对应的音频放大器来驱动。除了产生用于由回放设备200回放的模拟信号之外,音频处理组件208还可以被配置为处理要向一个或多个其他回放设备发送以进行回放的音频内容。
可以例如通过音频线路输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由回放设备200处理和/或回放的音频内容。
网络接口214可以被配置为促进数据网络上回放设备200与一个或多个其他设备之间的数据流。这样,回放设备200可以被配置为通过数据网络从与回放设备200通信的一个或多个其他回放设备、在局域网内从网络设备或通过诸如互联网之类的广域网从音频内容源接收音频内容。在一个示例中,回放设备200发送和接收的音频内容和其他信号可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字分组数据的形式来发送。在这种情况下,网络接口214可以被配置为解析数字分组数据,使得去往回放设备200的数据被回放设备200正确地接收和处理。
如图所示,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为回放设备200提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备(例如,数据网络内与回放设备200相关联的其他回放设备、扬声器、接收器、网络设备、控制设备)进行无线通信。有线接口218可以为回放设备200提供网络接口功能,以根据通信协议(例如,IEEE 802.3)通过有线连接与其他设备进行通信。虽然图2中所示的网络接口214包括无线接口216和有线接口218,但是在一些实施例中,网络接口214可以仅包括无线接口或仅包括有线接口。
麦克风220可以被布置为检测回放设备200的环境中的声音。例如,麦克风可以安装在回放设备的壳体的外壁上。麦克风可以是现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对扬声器220的部分频段敏感。一个或多个扬声器220可以与麦克风220相反地操作。在一些方面,回放设备200可以没有麦克风220。
在一个示例中,回放设备200和另一回放设备可以配对,以播放音频内容的两个单独的音频分量。例如,回放设备200可以被配置为播放左声道音频分量,而另一回放设备可以被配置为播放右声道音频分量,从而产生或增强音频内容的立体声效果。配对的回放设备(也称为“绑定的回放设备”)还可以与其他回放设备同步播放音频内容。
在另一示例中,回放设备200可以与一个或多个其他回放设备声音合并以形成单个合并的回放设备。合并的回放设备可以被配置为与非合并的回放设备或配对的回放设备不同地处理和再现声音,这是因为合并的回放设备可以具有可用于呈现音频内容的附加的扬声器驱动器。例如,如果回放设备200是被设计为呈现低频段音频内容的回放设备(即,低音炮),则回放设备200可以与被设计为呈现全频率段音频内容的回放设备合并。在这种情况下,当与低频回放设备200合并时,全频率段回放设备可以被配置为仅呈现音频内容的中高频分量,而低频段回放设备200则呈现音频内容的低频分量。合并的回放设备还可以与单个回放设备或另一合并的回放设备配对。
举例来说,SONOS公司目前提供(或已经提供)销售某些回放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”、和“SUB”。任意其他过去、现在和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。此外,应当理解,回放设备不限于图2示出的示例或SONOS的产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括个人移动媒体回放设备的扩展基座,或与其交互。在又一示例中,回放设备可以是诸如电视、照明器材或在室内外使用的一些其他设备之类的另一设备或组件的组成部分。
b.示例回放区域配置
返回参考图1的媒体回放系统100,环境可以具有一个或多个回放区域,每个回放区域具有一个或多个回放设备。媒体回放系统100可以建立有一个或多个回放区域,之后可以添加或移除一个或多个区域以达到图1所示的示例配置。每个区域可以根据不同的房间或空间被赋予名称,例如书房、浴室、主卧室、卧室、厨房、餐厅、起居室和/或阳台。在一种情况下,单个回放区域可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个回放区域。
如图1所示,阳台、餐厅、厨房、浴室、书房和卧室区域均具有一个回放设备,而起居室和主卧室区域均具有多个回放设备。在起居室区域中,回放设备104、106、108和110可以被配置为作为单独的回放设备、作为一个或多个绑定的回放设备、作为一个或多个合并的回放设备或其任何组合来同步播放音频内容。类似地,在主卧室的情况下,回放设备122和124可以被配置为作为单独的回放设备、作为绑定的回放设备、或作为合并的回放设备来同步播放音频内容。
在一个示例中,图1的环境中的一个或多个回放区域可以分别播放不同的音频内容。例如,用户可以在阳台区域中烧烤并收听回放设备102播放的嘻哈音乐,而另一用户可以正在厨房区域中准备食物并收听回放设备114播放的古典音乐。在另一示例中,回放区域可以与另一回放区域同步地播放相同的音频内容。例如,用户可以在书房区域中,其中回放设备118正在播放与阳台区域中的回放设备102正在播放的摇滚音乐相同的摇滚音乐。在这种情况下,回放设备102和118可以同步播放摇滚音乐,使得用户在不同回放区域之间移动时可以无缝地(或至少基本上无缝地)享受被外放播放的音频内容。可以以类似于如先前引用的美国专利No.8,234,395中所述的回放设备之间的同步方式来实现回放区域之间的同步。
如上所述,可以动态地修改媒体回放系统100的区域配置,并且在一些实施例中,媒体回放系统100支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域中或从区域中移出,则可以重新配置媒体回放系统100以适应这些改变。例如,如果用户将回放设备102从阳台区域物理地移动到书房区域,则书房区域现在可以包括回放设备118和回放设备102。可以通过诸如控制设备126和128之类的控制设备,将回放设备102与书房区域配对或分组,和/或重新命名(如果需要)。另一方面,如果一个或多个回放设备被移动到家居环境中还不是回放区域的特定区域,则可以针对该特定区域创建新的回放区域。
此外,媒体回放系统100的不同回放区域可以被动态组合为区域组或分成单独的回放区域。例如,餐厅区域和厨房区域114可以组合为用于宴会的区域组,使得回放设备112和114可以同步呈现音频内容。另一方面,如果用户希望在起居室空间中听音乐,而另一用户希望看电视,则起居室区域可以被分成包括回放设备104的电视区域和包括回放设备106、108和110的收听区域。
c.示例控制设备
图3示出了示例控制设备300的功能框图,该示例控制设备300可以被配置成媒体回放系统100的控制设备126和128中的一个或两者。如图所示,控制设备300可以包括处理器302、存储器304、网络接口306、用户界面308、麦克风310和软件组件312。在一个示例中,控制设备300可以是媒体回放系统100的专用控制器。在另一示例中,控制设备300可以是可安装媒体回放系统控制器应用软件的网络设备,例如,iPhoneTM、iPadTM或任何其他智能电话、平板电脑或网络设备(例如,联网计算机,如PC或MacTM)。
处理器302可以被配置为执行与有助于用户对媒体回放系统100进行访问、控制和配置相关的功能。存储器304可以是数据存储设备,其可以加载有可由处理器302执行以实现这些功能的一个或多个软件组件。存储器304还可以被配置为存储媒体回放系统控制器应用软件和与媒体回放系统100和用户相关联的其他数据。
在一个示例中,网络接口306可以基于行业标准(例如,红外、无线电、包括IEEE802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准的无线标准等)。网络接口306可以提供用于控制设备300与媒体回放系统100中的其他设备通信的手段。在一个示例中,可以通过网络接口306在控制设备300和其他设备之间传送数据和信息(例如,状态变量)。例如,媒体回放系统100中的回放区域和区域组配置可以由控制设备300经由网络接口306从回放设备或另一网络设备接收,或者由控制设备300向另一回放设备或网络设备发送。在一些情况下,该另一网络设备可以是另一控制设备。
诸如音量控制和音频回放控制之类的回放设备控制命令也可以通过网络接口306从控制设备300向回放设备传送。如上所述,还可以由用户使用控制设备300来执行对媒体回放系统100的配置的改变。配置改变可以包括:在区域中增加或从中移除一个或多个回放设备、在区域组中增加或从中移除一个或多个区域、形成绑定或合并的播放器、将一个或多个回放设备从绑定的或合并的播放器中分离等。因此,控制设备300有时可以被称为控制器,无论控制设备300是专用控制器还是安装有媒体回放系统控制器应用软件的网络设备。
控制设备300可以包括麦克风310。麦克风310可以被布置成检测控制设备300的环境中的声音。麦克风310可以是现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对部分频段敏感。两个或更多个麦克风310可以被布置为捕捉音频源(例如,语音、可听声音)的位置信息和/或帮助滤除背景噪声。
控制设备300的用户界面308可以被配置为通过提供诸如图4中所示的控制器界面400之类的控制器界面来帮助用户访问和控制媒体回放系统100。控制器界面400包括回放控制区410、回放区域区420、回放状态区430、回放队列区440和音频内容源区450。所示的用户界面400仅是可以在诸如图3的控制设备300(和/或图1的控制设备126和128)之类的网络设备上提供,并由用户访问以控制媒体回放系统(例如,媒体回放系统100)的用户界面的一个示例。备选地,可以在一个或多个网络设备上实现不同格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的可比较的控制访问。
回放控制区410可以包括可选择(例如,通过触摸或通过使用光标)图标,其用于使得所选择的回放区域或区域组中的回放设备播放或暂停、快进、回退、跳到下一个、跳到前一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉播放模式(cross fademode)。回放控制区410还可以包括用于修改均衡设置、回放音量等的可选择图标。
回放区域区420可以包括媒体回放系统100内的回放区域的表示。在一些实施例中,回放区域的图形表示可以是可选择的,以便调出附加的可选择图标来管理或配置媒体回放系统中的回放区域,例如,创建绑定的区域、创建区域组、分离区域组、重命名区域组等。
例如,如图所示,可以在回放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以便调出用于选择媒体回放系统中的、将与特定区域分在一组的一个或多个其他区域的选项。在分组之后,已经与特定区域分在一组的区域中的回放设备将被配置为与特定区域中的回放设备同步地播放音频内容。类似地,可以在区域组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以调出用于取消选择区域组中的要从该区域组中移除的一个或多个区域的选项。通过诸如用户界面400之类的用户界面对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区域或区域组配置被修改时,可以动态地更新回放区域在回放区域区420中的表示。
回放状态区430可以包括在所选择的回放区域或区域组中当前正在播放、先前播放或安排为接下来播放的音频内容的图形表示。可以在用户界面上可视地区分所选择的回放区域或区域组,例如,在回放区域区420和/或回放状态区430内。图形表示可以包括曲目标题、艺术家姓名、专辑名称、专辑年份、曲目长度以及当经由用户界面400控制媒体回放系统时用户知道了会有用的其他相关信息。
回放队列区440可以包括与所选择的回放区域或区域组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区域或区域组可以与回放队列相关联,该回放队列包含对应于由该回放区域或区域组回放的零个或多个音频项的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其可以由回放区域或区域组中的回放设备用于从本地音频内容源或联网音频内容源查找和/或检索音频项,可能供回放设备回放。
在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在另一示例中,当回放区域或区域组正在持续播放流传输音频内容(例如,互联网收音机,其可以持续播放直到被停止),而不是具有回放持续时间的分立音频项时,回放队列可以是空的或被填充但是“未使用”。在备选实施例中,回放队列可以包括互联网收音机和/或其他流传输音频内容项,并且当回放区域或区域组正在播放这些内容项时处于“使用中”。其他示例也是可能的。
当回放区域或区域组被“分组”或“取消分组”时,可以清除与受影响的回放区域或区域组相关联的回放队列,或者重新关联。例如,如果包括第一回放队列的第一回放区域与包括第二回放队列的第二回放区域被分在一组,则所建立的区域组可以具有关联的回放队列,其最初是空的,包含来自第一回放队列的音频项(例如,如果第二回放区域被添加到第一回放区域),或包含来自第二回放队列的音频项(例如,如果第一回放区域被添加到第二回放区域),或包含来自第一回放队列和第二回放队列二者的音频项的组合。随后,如果所建立的区域组被取消分组,则所得到的第一回放区域可以与先前的第一回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在所建立的区域组被取消分组之前与所建立的区域组相关联的回放队列的音频项。类似地,所得到的第二回放区域可以与先前的第二回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在所建立的区域组被取消分组之前与所建立的区域组相关联的回放队列的音频项。其他示例也是可能的。
返回参考图4的用户界面400,音频内容在回放队列区440中的图形表示可以包括曲目标题、艺术家姓名、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以调出附加的可选择图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以将所表示的音频内容从回放队列中移除,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以立即播放,或者在任何当前播放的音频内容之后进行播放等。与回放区域或区域组相关联的回放队列可以存储于该回放区域或区域组中的一个或多个回放设备上、不在该回放区域或区域组中的回放设备上和/或一些其他指定设备上的存储器中。
音频内容源区450可以包括可选择的音频内容源的图形表示,可以从音频内容源中检索音频内容,并由所选择的回放区域或区域组来播放。有关音频内容源的讨论可参见以下部分。
d.示例音频内容源
如前所述,区域或区域组中的一个或多个回放设备可以被配置为从各种可用音频内容源中检索回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,回放设备可以直接从对应的音频内容源(例如,线路输入连接)中检索音频内容。在另一示例中,可以通过网络,经由一个或多个其他回放设备或网络设备向回放设备提供音频内容。
示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制设备、支持网络的个人计算机、或者网络附接存储器(NAS))上的本地音乐库、通过互联网(例如,云)提供音频内容的流传输音频服务、或者回放设备或网络设备上通过线路输入连接来连接到媒体回放系统的音频源等。
在一些实施例中,可以在诸如图1的媒体回放系统100之类的媒体回放系统中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描通过媒体回放系统中的回放设备可访问的网络共享的所有文件夹/目录中的可识别音频项,以及生成或更新包含元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能的。
以上关于回放设备、控制器设备、回放区域配置和媒体内容源的讨论仅提供了操作环境的一些示例,在该操作环境中可以实现下面描述的功能和方法。本文未明确描述的媒体回放系统、回放设备和网络设备的配置和其他操作环境也可以适用且适于功能和方法的实现。
e.示例多个联网设备
图5示出了示例多个设备500,其可以被配置为基于语音控制提供音频回放体验。本领域普通技术人员将理解,图5中所示的设备仅用于说明目的,并且包括不同和/或附加设备的变型是可能的。如图所示,多个设备500包括:计算设备504、506和508;网络麦克风设备(NMD)512、514和516;回放设备(PBD)532、534、536和538;以及控制器设备(CR)522。
多个设备500中的每个设备可以是具有网络功能的设备,其可以根据一个或多个网络协议(例如,NFC、蓝牙、以太网和IEEE 802.11等),通过一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)与多个设备中的一个或多个其他设备建立通信。
如图所示,计算设备504、506和508可以是云网络502的一部分。云网络502可以包括附加的计算设备。在一个示例中,计算设备504、506和508可以是不同的服务器。在另一示例中,计算设备504、506和508中的两个或更多个可以是单个服务器的模块。类似地,计算设备504、506和508中的每一个可以包括一个或多个模块或服务器。本文中为了便于说明,计算设备504、506和508中的每一个可以被配置为在云网络502内执行特定功能。例如,计算设备508可以是用于流传输音乐服务的音频内容源。
如图所示,计算设备504可以被配置为通过通信路径542与NMD 512、514和516接口连接。NMD 512、514和516可以是一个或多个“智能家居”系统的组件。在一种情况下,NMD512、514和516可以物理地分布在整个家中,类似于图1所示的设备分布。在另一种情况下,NMD 512、514和516中的两个或更多个可以物理地位置彼此相对靠近。通信路径542可以包括一种或多种类型的网络,例如,包括互联网的WAN、LAN和/或PAN等。
在一个示例中,NMD 512、514和516中的一个或多个可以是被配置为主要用于音频检测的设备。在另一示例中,NMD 512、514和516中的一个或多个可以是具有各种主要实用程序(utility)的设备的组件。例如,如上面结合图2和图3所讨论的,NMD 512、514和516中的一个或多个可以是回放设备200的麦克风220或网络设备300的麦克风310。此外,在一些情况下,NMD 512、514和516中的一个或多个可以是回放设备200或网络设备300。在示例中,NMD 512、514和/或516中的一个或多个可以包括布置在麦克风阵列中的多个麦克风。
如图所示,计算设备506可以被配置为通过通信路径544与CR 522和PBD 532、534、536和538接口连接。在一个示例中,CR 522可以是网络设备,例如图2的网络设备200。因此,CR 522可以被配置为提供图4的控制器界面400。类似地,PBD 532、534、536和538可以是回放设备,例如图3的回放设备300。这样,PBD 532、534、536和538可以物理地分布在整个家中,如图1所示。为了说明目的,PBD 536和538可以是绑定区域530的一部分,而PBD 532和534可以是它们各自区域的一部分。如上所述,PBD 532、534、536和538可以被动态地绑定、分组、解除绑定和取消分组。通信路径544可以包括一种或多种类型的网络,例如包括互联网的WAN、LAN和/或PAN等。
在一个示例中,与NMD 512、514和516一样,CR 522和PBD 532、534、536和538也可以是一个或多个“智能家居”系统的组件。在一种情况下,PBD 532、534、536和538与NMD512、514和516分布在相同的家中。此外,如上所述,PBD 532、534、536和538中的一个或多个可以是NMD 512、514和516中的一个或多个。
NMD 512、514和516可以是局域网的一部分,并且通信路径542可以包括通过WAN(通信路径,未示出)将NMD 512、514和516的局域网链接到计算设备504的接入点。同样地,NMD 512、514和516中的每一个可以通过该接入点彼此通信。
类似地,CR 522和PBD 532、534、536和538可以是局域网和/或本地回放网络的一部分(如前面部分中讨论的),并且通信路径544可以包括通过WAN将CR 522和PBD 532、534、536和538的局域网和/或本地回放网络链接到计算设备506的接入点。这样,CR 522和PBD532、534、536和538中的每一个也可以通过该接入点彼此进行通信。
在一个示例中,通信路径542和544可以包括相同的接入点。在示例中,NMD 512、514和516、CR 522和PBD 532、534、536和538中的每一个可以通过家庭的相同接入点来访问云网络502。
如图5所示,NMD 512、514和516、CR 522和PBD 532、534、536和538中的每一个还可以通过通信方式546与一个或多个其他设备直接通信。如本文所述的通信方式546可以包括根据一个或多个网络协议通过一种或多种类型的网络在设备之间的一种或多种形式的通信,和/或可以包括通过一个或多个其他网络设备的通信。例如,通信方式546可以包括蓝牙TM(IEEE 802.15)、NFC、无线直连和/或专有无线等中的一个或多个。
在一个示例中,CR 522可以通过蓝牙TM与NMD 512通信,并且可以通过另一局域网与PBD 534通信。在另一示例中,NMD 514可以通过另一局域网与CR 522通信,并且可以通过蓝牙与PBD 536通信。在又一示例中,PBD 532、534、536和538中的每一个可以根据生成树协议通过本地回放网络彼此通信,同时分别通过不同于本地回放网络的局域网与CR 522通信。其他示例也是可能的。
在一些情况下,NMD 512、514和516、CR 522和PBD 532、534、536和538之间的通信方式可以根据设备间的通信类型、网络状况和/或时延要求而改变。例如,当NMD 516首先被引入具有PBD 532、534、536和538的家中时,可以使用通信方式546。在一种情况下,NMD 516可以通过NFC向PBD 538发送对应于NMD 516的标识信息,并且作为响应,PBD 538可以通过NFC(或一些其他形式的通信)向NMD 516发送局域网信息。然而,在家中配置了NMD 516之后,NMD 516和PBD 538之间的通信方式可能会改变。例如,NMD 516可以随后通过通信路径542、云网络502和通信路径544与PBD 538通信。在另一示例中,NMD和PBD可能从不通过本地通信方式546进行通信。在另一示例中,NMD和PBD可以主要通过本地通信方式546进行通信。其他示例也是可能的。
在说明性示例中,NMD 512、514和516可以被配置为接收用于控制PBD 532、534、536和538的语音输入。可用的控制命令可以包括先前讨论的任何媒体回放系统控制,例如回放音量控制、回放传输控制、音乐源选择和分组等。在一种情况下,NMD 512可以接收用于控制PBD 532、534、536和538中的一个或多个的语音输入。响应于接收到语音输入,NMD 512可以通过通信路径542向计算设备504发送语音输入以进行处理。在一个示例中,计算设备504可以将语音输入转换为等效的文本命令,并解析该文本命令以识别命令。然后,计算设备504可以随后向计算设备506发送文本命令。在另一示例中,计算设备504可以将语音输入转换为等效的文本命令,然后向计算设备506发送文本命令。然后,计算设备506可以解析文本命令以识别一个或多个回放命令。
例如,如果文本命令是“在区域1中播放来自流传输服务1的艺术家1的曲目1”,则计算设备506可以识别(i)从流传输服务1可得的艺术家1的曲目1的URL,以及(ii)区域1中的至少一个回放设备。在该示例中,来自流传输服务1的艺术家1的曲目1的URL可以是指向计算设备508的URL,并且区域1可以是绑定区域530。这样,当识别出URL以及PBD 536和538中的一个或两个时,计算设备506可以通过通信路径544向PBD 536和538中的一个或两个发送所识别的URL,用于回放。作为响应,PBD 536和538中的一个或两个可以根据接收到的URL从计算设备508中检索音频内容,并且开始播放来自流传输服务1的艺术家1的曲目1。
在又一示例中,计算设备504可以执行一些处理以识别用户的意图或相关命令,并且向计算设备506提供与语音输入相关的媒体内容的相关信息。例如,计算设备504可以对语音输入执行话语到文本转换,并分析语音输入,以得到命令或意图(例如,播放、暂停、停止、音量增大、音量减小、跳过、下一个、分组、取消分组)以及关于如何执行命令的其他信息。计算设备504或计算设备506可以确定哪些PBD命令对应于由计算设备504确定的命令或意图。可以从计算设备504向计算设备506发送从语音输入确定的命令或意图和/或与执行命令相关的其他信息。计算设备504上的处理可以由应用、模块、附加软件、具有本地联网麦克风系统软件平台的集成件、和/或本地联网麦克风系统软件平台来执行。
本领域普通技术人员将理解,以上仅是一个说明性示例,并且其他实现也是可能的。在一种情况下,如上所述,多个设备500中的一个或多个执行的操作可以由多个设备500中的一个或多个其他设备来执行。例如,从语音输入到文本命令的转换可以替代地、部分地或完全由另一个或多个设备来执行,例如NMD 512、计算设备506、PBD 536和/或PBD 538。类似地,URL的标识可以替代地、部分地或完全由另一个或多个设备执行,例如NMD 512、计算设备504、PBD 536和/或PBD 538。
f.示例网络麦克风设备
图6示出了示例网络麦克风设备600的功能框图,该示例网络麦克风设备600可以被配置为图5的NMD 512、514和516中的一个或多个。如图所示,网络麦克风设备600包括处理器602、存储器604、麦克风阵列606、网络接口608、用户界面610、软件组件612和扬声器614。本领域普通技术人员将理解,其他网络麦克风设备配置和布置也是可能的。例如,备选地,网络麦克风设备可以不包括扬声器614,或者具有单个麦克风而不是麦克风阵列606。
处理器602可以包括一个或多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,处理单元602可以包括微处理器、微控制器、专用集成电路、数字信号处理器等。存储器604可以是数据存储设备,其可以加载有可由处理器602执行以实现上述功能的一个或多个软件组件。因此,存储器604可以包括一个或多个非暂时性计算机可读存储介质,其示例可以包括:易失性存储介质(例如,随机存取存储器、寄存器、高速缓存等)、以及非易失性存储介质(例如,只读存储器、硬盘驱动器、固态驱动器、闪存和/或光存储设备等)。
麦克风阵列606可以是多个麦克风,其被布置为检测网络麦克风设备600的环境中的声音。麦克风阵列606可以包括现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风等。在一个示例中,麦克风阵列可以被布置为检测相对于网络麦克风设备来自一个或多个方向的音频。麦克风阵列606可以对部分频段敏感。在一个示例中,麦克风阵列606的第一子集可以对第一频段敏感,而麦克风阵列的第二子集可以对第二频段敏感。麦克风阵列606还可以被布置为捕捉音频源(例如,语音、可听声音)的位置信息和/或帮助滤除背景噪声。值得注意的是,在一些实施例中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
网络接口608可以被配置为促进各种网络设备(例如,参考图5,其中的CR 522、PBD532-538、云网络502中的计算设备504-508,以及其他网络麦克风设备等)之间的无线和/或有线通信。这样,网络接口608可以采用任何合适的形式来执行这些功能,其示例可以包括:以太网接口、串行总线接口(例如,FireWire、USB 2.0等)、适于促进无线通信的芯片组和天线、和/或提供有线和/或无线通信的任何其他接口。在一个示例中,网络接口608可以基于行业标准(例如,红外、无线电、包括IEEE 802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准的无线标准等)。
网络麦克风设备600的用户界面610可以被配置为促进与网络麦克风设备的用户交互。在一个示例中,用户界面608可以包括物理按钮、设置在触敏屏幕和/或表面上的图形界面等中的一个或多个,以供用户直接向网络麦克风设备600提供输入。用户界面610还可以包括灯和扬声器614中的一个或多个,以便向用户提供视觉和/或音频反馈。在一个示例中,网络麦克风设备600还可以被配置为通过扬声器614回放音频内容。
III.用于房间校正语音检测的示例系统、装置和方法
在许多情况下,网络麦克风设备可以放置在回放设备附近。例如,回放设备可以与网络麦克风设备放置在同一房间中。
本文描述的示例涉及向NMD提供NMD操作的环境的声学特性。环境可以是家中的房间,例如卧室或起居室。环境的声学特性可以定义声音在房间中行进的方式。NMD可以使用环境的声学特性来解释对NMD说出的语音输入。在许多情况下,网络麦克风设备(NMD)可以放置在回放设备附近。例如,回放设备可以与NMD放置在同一房间中。
声学特性通常由环境中的表面定义。例如,房间中的硬表面可以反射声音。另一方面,软表面可以吸收声音。环境中这些不同类型的表面的存在及其布置将影响房间的声学特性和NMD解释语音输入的能力。
NMD可能需要考虑这些声学特性以准确地恢复说出的语音输入。另外,在一些情况下,可以在NMD接收语音输入的同一时间由回放设备同时回放音频内容。NMD可以使用内容回放和/或环境的声学特性的知识来解释语音输入。
图7-11给出了可以在所公开的操作环境中实现的实施例。
图7是可以执行以改进对NMD接收的语音输入的解释的功能的流程图。在一些示例中,所描述的这些功能中的一个或多个可以由回放设备执行。在其他示例中,诸如504-508之类的计算设备还可以结合回放设备或代替回放设备来执行这些功能中的一个或多个。计算设备可以与回放设备相关联,并执行与回放设备相关联的处理。
在702处,可以获得环境的声学特性。声学特性可以与回放设备操作的环境相关联。已经以各种方式确定了声学特性。例如,回放系统可以已经通过某个校准阶段确定了环境的声学特性。媒体回放系统的回放设备可以具有麦克风和扬声器。扬声器可以输出一个或多个音调,并且一个或多个扬声器可以使用相应的麦克风接收音调。音调可以是音频的一个或多个频率。每个回放设备可以输出音调。基于多个回放设备接收的音调,可以确定环境的声学特性。在另一示例中,另一网络设备(如控制设备、第一回放设备或者甚至NMD自身)可以包括接收第二回放设备的扬声器输出的测试音调的麦克风。其他网络设备(替代回放设备或作为回放设备的补充)可以分析接收到的测试音调以确定环境的声学特性。其他布置也是可能的。
声学特性可以由音调的频谱响应、空间响应和时间响应来定义。频谱响应可以是对麦克风处接收的声能的分析。空间响应可以是对麦克风处接收的声能的方向的分析。时间响应可以是对麦克风处接收的声能的回响的分析。回放系统可以分析这些响应,并且还可以考虑接收音调的方向以确定环境的声学特性。声学特性特征的指示可以存储在回放设备和/或计算设备504-508中的一个或多个上。
在另一示例中,可以基于环境的已知特征(如房间的大小、房间天花板的高度和房间中的家具)来预定义声学特性。计算设备504-508中的一个或多个维护的数据库可以存储具有不同类型特征的房间的声学特性。存储在计算设备上的声学特性可以是基于对具有特定特征的房间进行的预先分析而确定的。用户可以在媒体回放系统的控制器设备上输入房间的特征,并且控制器设备可以访问该数据库以确定房间的声学特性。然后可以将这些声学特性提供给位于环境中的回放设备或存储在计算设备上。
作为示例,声学特性可以指示房间的左侧具有硬表面、右侧具有软表面并且房间是矩形形状。从本质上讲,声学特性可以从声学角度描绘房间的特征。
媒体回放系统可以包括多个回放设备。每个回放设备可以具有回放设备操作的环境的声学特性。在704处,可以识别一个或多个NMD。一个或多个NMD可以在同一环境中。在一些示例中,向NMD发送声学特性的回放设备可以是最靠近NMD的回放设备。在其他示例中,向NMD发送声学特性的回放设备可以是与NMD在同一区域中的回放设备。可以在回放设备和/或NMD的设置期间的一些校准过程中指示接近度。例如,NMD可以向回放设备发送其存在的指示。该存在可以由回放设备中的状态变量来指示。回放设备可以访问该状态变量以识别NMD。类似地,NMD可以具有识别回放设备的存在的类似状态变量。
在其他示例中,媒体回放系统的回放设备可以与NMD绑定(配对或分组)。绑定也可以指示回放设备和NMD彼此非常靠近,例如在同一房间或同一区域中,或同步播放音频内容。回放设备和NMD之间的绑定在某些方面可以类似于回放设备和回访设备的绑定方式。该绑定可以反映在回放设备存储的状态变量中。当NMD与回放设备绑定时,回放设备可以被布置为识别NMD。此外,如果NMD被移动并绑定到另一回放设备,则可以更新另一回放设备中的状态变量以反映与NMD的绑定。类似地,NMD可以更新其状态变量以反映存在新的回放设备。
在一些示例中,绑定的回放设备和NMD可以使用各种联网技术来减少它们之间的时延。例如,可以使用本地网络连接而不是WAN网络连接(LAN或蓝牙)进行通信。作为另一示例,当回放设备绑定到NMD时,通信可以回到本地网络中的不同频段,例如,从“典型的”2.4Ghz通信切换到5Ghz通信。作为又一示例,通信可以切换到2.4或5Ghz频谱上的保留通道,或者当回放设备和NMD绑定时可以减少其他网络流量,例如,回放设备可以停止用作其他网络流量的中继节点。其他布置也是可能的。
在706处,可以提供声学特性,使得将声学特性应用于语音输入。在一个实施例中,声学特性可以作为消息通过通信网络546中的一个或多个从回放设备发送到NMD。在其他实施例中,回放设备可以使计算设备上的声学特性通过通信链路542被发送到NMD。在其他实施例中,声学特性可以在与回放设备相关联的计算设备上,并且回放设备可以使与NMD相关联的计算设备能够访问声学特性。其他布置也是可能的。
在一些实施例中,回放设备可能不需要向NMD提供声学特性。相反,NMD自身可能能够从计算设备检索声学特性。NMD可以提供其接近(绑定、配对或其他方式)的回放设备的指示,并且计算设备可以提供环境的声学特性。其他布置也是可能的。
NMD通常可以通过麦克风响应来处理语音输入。麦克风响应是麦克风关于频率的灵敏度的指示。
在实施例中,NMD可以对其接收的语音输入应用声学特性,以校正语音输入中的失真。这样,NMD可以能够更好地解释语音输入。NMD可以由自身来应用此声学特性,和/或将处理卸载至计算设备,在这种情况下,NMD上的处理可以是基于云的。
NMD可以在对语音输入应用声学特性时基于声学特性来定义滤波器。滤波器可以包括环境的频谱响应、空间响应和时间响应。NMD可以在解释语音输入之前将滤波器应用于NMD接收到的语音输入,以校正失真。可以基于以下推导来确定滤波器:
Xa(w)x P(w)x h(w)x m(w)=Ya(w)
其中,Xa是校准音调,P是回放设备的扬声器响应,h是房间响应(例如,房间的声学特性),m是麦克风响应,Ya是处理后的响应,其可以是与校准过程中发送的音调对应的接收到的音调。符号x表示频域中的卷积函数。由于Xa、P、m和Ya是已知的,房间响应(例如,滤波器)可以被计算为:
h-1(w):Xa(w)x P(w)x m(w)=Ya(w)x h-1(w)
然后,如果接收到语音输入Yb,则可以应用房间响应h(例如,滤波器),将语音输入Xb确定为:
Xb(w)=Yb(w)x h-1(w)x P-1(w)x m-1(w)
在一些实施例中,回放系统可以周期性地确定环境的声学特性以考虑环境的变化。在这种情况下,一个或多个回放设备可以周期性地执行操作702-706,使得NMD可以将当前声学特性应用于接收到的语音输入,以正确地解释它。
图8是可以执行以改进对NMD的语音输入的恢复的功能的另一流程图。在一些示例中,所描述的这些功能中的一个或多个可以由回放设备执行。在其他示例中,诸如504-508之类的计算设备还可以结合回放设备或代替回放设备来执行这些功能中的一个或多个。计算设备可以与回放设备相关联,并执行与回放设备相关联的处理。
在802处,可以获得环境的声学特性;在804处,可以识别NMD;并且在806处,可以提供声学特性。声学特性可以被提供给NMD和/或与NMD相关联的计算设备。
在一些情况下,NMD可以在媒体回放系统也在回放音频内容的环境中操作。NMD可以在正在播放音频内容的同时接收语音输入。
在808处,可以提供音频内容。音频内容可以被提供给NMD和/或与NMD相关联的计算设备。例如,内容可以是回放设备正在播放的音乐流。回放设备可以将音频内容提供给该NMD附近、与该NMD在同一区域中的NMD,或者提供给可以绑定至该NMD(或分在一组)的NMD。在一些实施例中,可以通过计算设备将内容提供给NMD,例如,当NMD的处理基于云时。在其他实施例中,例如,当NMD和/或回放设备的处理基于云时,可以通过与回放设备相关联的计算设备将内容提供给与NMD相关联的计算设备。
在808处,可以将声学特性(以及可选地音频内容)应用于语音输入。例如,NMD(或与NMD相关联的计算设备)可以将滤波器应用于NMD接收到的语音输入以解释语音输入。例如,NMD(或与NMD相关联的计算设备)可以使用与语音输入一起正在回放的音频内容,以更好地分离语音输入。为了解释语音输入的目的,回放设备正在播放的音频内容实际上可能是噪声。在这一方面,可以从接收到的语音输入中减去音频内容,以便更好地分离接收到的语音输入。
图9是NMD和/或相关联的计算设备在解释语音输入时执行的功能的流程图。在902处,可以获得环境的声学特性的指示。在904处,可选地,还可以接收回放设备正在播放的音频内容。在存在NMD或者绑定到NMD的情况下,回放设备可以在同一区域中。在906处,例如,NMD可以接收语音输入。语音输入可以是语音命令。通过NMD上的某个按钮按压或语音输入中指示其为语音输入的命令字,NMD可以知道它已经接收到语音输入。在908处,可以应用/使用滤波器和/或回放设备正在播放的音频内容中的一个或多个来解释接收到的语音输入。
图10是例如使NMD能够确定环境的声学特性,而不是由回放设备提供该声学特性的功能的流程图。这些功能可以由回放设备和/或与回放设备相关联的计算设备来执行。
NMD可以发送用于一个或多个回放设备播放音调的指示。NMD向其发送指示的回放设备可以包括NMD附近的那些回放设备和/或绑定到NMD(或分在一组)或在同一区域中的那些回放设备。
在1002处,可以接收指示以播放音频音调。可以从NMD或与NMD相关联的计算设备接收指示。作为响应,在1004处,回放设备可以输出音频音调。NMD可以使用麦克风阵列606接收音调。麦克风阵列606可以提供音调幅度的指示。另外,麦克风阵列606可以提供音调方向的指示。可以基于从多个回放设备接收音调来确定方向。基于从多个回放设备接收音调,NMD和/或相关联的计算设备然后可以确定环境的声学特性。这样,NMD可能不需要从回放设备获得该声学特性。
麦克风阵列606可以使NMD能够确定语音输入来自的方向。该方向可以被回放设备用于改善音频内容的回放。例如,媒体回放系统也可以将一个或多个回放设备产生的音频声音引导至语音输入所来自的相同方向。这可以是收听者所在的位置。其他布置也是可能的。
图11是回放设备和/或相关联的计算设备执行的、与使用通过NMD确定的方向性相关联的功能的流程图。
在1102处,可以接收方向的指示。其可以是从NMD和/或相关联的计算设备接收的。方向可以指示NMD接收语音输入的位置以及因此用户在环境中可能所处的位置。回放设备可以具有多个扬声器,扬声器的输出可以被控制以影响回放设备回放的音频内容的方向性。在1104处,回放设备可以使用该方向性来调整多个扬声器的音频输出。音频输出可以是音乐内容的回放。回放设备可以根据NMD指示的方向性来调整扬声器输出的音频信号的相位,以产生音频输出的方向性。在这一方面,音频内容可以指向用户,因此改善了收听音频体验。附加地或备选地,回放设备还可以调整音频输出的幅度(例如,音量)。在一些情况下,NMD也可以产生音频输出。音频输出可以是对语音输入的语音响应,或某种类型的其他声音,例如哔哔声或音调。再附加地或备选地,回放系统可以使用方向性来识别可能适合于替代NMD或作为补充而输出该音频输出的回放设备。例如,所识别的回放设备可能位于收听者的正前方,使收听者更容易听到音频输出。其他布置也是可能的。
IV.用于媒体回放系统的语音控制的示例系统、装置和方法
本文描述的示例可以涉及控制媒体回放系统。具体地,图12示出了用于播放音频响应的方法的示例流程图1200。方法1200呈现了可以在操作环境内实现的方法的实施例,该操作环境包括,例如,图1的媒体回放系统100、图2的回放设备200中的一个或多个、图3的控制设备300中的一个或多个、图5的系统500中的多个设备中的一个或多个。方法1200可以包括,如本文所述,通过各种通信路径在联网麦克风系统和媒体回放系统之间发送和接收信息,和/或如2016年2月22日提交的题为“Metadata exchange involving a networkedplayback system and a networked microphone system”的专利申请No.62/298,350所述,使用元数据交换通道。该申请由此通过引用全部合并于此。方法1200可以包括一个或多个操作、功能或动作。
在一些示例中,NMD 512、514、516中的一个或多个可以连接到一个或多个网络或通信路径542、546。NMD可以被配置为与媒体回放系统(例如,计算设备506、CR522、PBD 532、534、536、538)集成或接口连接。NMD可以包括在联网麦克风系统中(例如,NMD 512、514、516、504)。
在框1202处,为了配置NMD以使NMD与媒体回放系统接口连接或关联,用户可以选择例如控制设备(例如,CR 522)来启动与NMD或联网麦克风系统或媒体回放系统相关联的应用。应用可以是用于控制联网麦克风系统和/或媒体回放系统的特征或设置的应用。联网麦克风系统可以具有一个或多个专用附加功能,可用于向联网麦克风系统提供附加或增强的功能。
在框1204处,可以显示联网麦克风系统的可用的附加功能以供用户选择。图13A中示出了示例用户界面1300,其显示可用的附加功能。NMD可以具有一个或多个可用的附加特征1302、1304、1306。特征1302可以是音乐控制特征,其可以例如控制媒体回放系统的回放。在框1206处,控制设备可以接收用于将音乐控制特征或技能添加到NMD的用户输入。例如,用户可以通过选择特征1302来选择添加音乐控制特征1302。音乐控制特征1302可以是用户将音乐控制功能或技能添加到联网麦克风系统的应用。在选择了添加音乐控制特征1302时,显示器可以改变以示出用户界面1308,提示需要用户的账户信息。
在框1208处,控制设备可以通过用户界面1308和输入字段1310和1312接收用于音乐控制特征的账户信息。账户信息可以是用户具有的媒体回放系统和/或音乐服务账户。账户信息可以包括账户的用户名和密码。可以在字段1310中输入用户名,并且可以在字段1312中输入密码。用户可以选择按钮(例如,提交按钮1314)来提交用户名和密码,用于向媒体回放系统(例如,计算设备506)和/或音乐服务(例如,计算设备508)进行认证。可以通过通信路径542、544、546和/或元数据交换通道中的任何一个来发送账户信息,用于在计算设备504、计算设备506和/或计算设备508处进行认证。一旦被认证,与账户相关联的用户信息可以从媒体回放系统被发送到联网麦克风系统。用户信息可以是自定义名称(例如,自定义区域名、自定义播放列表名、自定义歌曲名、自定义专辑名、自定义艺术家名等)、与用户信息相关联的家庭标识符、PBD标识符、和/或区域标识符。自定义名称可以是用户提供的任何名称。例如,媒体回放系统可以提供公共区域名称的列表,供用户在对区域命名时进行选择,和/或向用户提供键入区域名称的选项。控制设备300的界面可以显示公共区域名称的列表和/或显示字段,用户可以通过由控制设备300接收到的输入(例如,语音、文本)在字段中输入自定义区域名称。自定义名称信息可以被发送到系统500中的任何设备或与之共享。
在框1210处,可以为NMD确定一个默认区域(例如,一个或多个回放设备)或多个默认区域(例如,不同区域、包括至少两个区域的组中的至少两个回放设备)。可以如2016年2月22日提交的题为“Default Playback Device(s)”的专利申请No.62/298,410中所描述的那样确定默认区域或回放设备。该申请由此通过引用全部合并于此。
在一些方面,用户可以在初始配置或设置期间指定默认区域。图13C中所示的用户界面1316示出了示例用户界面,其使用户能够选择默认回放区域与NMD相关联。用户界面1316可以显示可用回放区域1318的列表。可用回放区域的显示名称可包括与在框1208处输入的用户账户相关联的自定义名称。例如,可用回放区域1318的列表可以包括“起居室”和“厨房”以及“Nick的房间”的自定义区域名。所显示的列表可以是可选择的,以使用户能够指定用于响应于NMD或其他控制设备接收到的命令而回放语音响应和/或音乐的默认区域。图13C示出了用户选择厨房作为默认区域的示例。用户可以选择按钮1320(例如,提交按钮)以确认选择默认区域,并提交对默认区域的选择。可以显示图13D中所示的确认屏幕1322,以向用户确认设置过程完成,并且用户可以选择按钮1326以关闭确认屏幕1322。
在框1212处,可以从例如媒体回放系统向联网麦克风系统发送用户特定回放信息。用户特定信息可以是自定义回放信息,例如自定义区域名称、自定义播放列表和/或自定义播放列表名称。在一些方面,用户特定信息和/或用户账户可以与家庭标识符(HHI)相关联。可以通过例如元数据交换通道和/或媒体回放系统和联网麦克风系统之间的任何其他通信路径,从媒体回放系统(例如,计算设备506、CR 522、PBD 532、PBD 534、PBD 536和/或PBD 538)向联网麦克风系统(例如,计算设备504、NMD 512、NMD 514和/或NMD 516)发送用户特定回放信息。
计算设备504可以将自定义回放信息存储为动态变量,该动态变量可以是能够与不同变量类型动态关联的变量。例如,“Nick的房间”可以是自定义区域名称,并且可以被存储为与区域变量类型相关联的动态变量。作为另一示例,“Nick的收藏”可以是具有用户创建的自定义名称的自定义播放列表。名称“Nick的收藏”可以被存储为动态变量,并与播放列表变量类型相关联。以这种方式,联网麦克风系统可以知道并且可以在语音输入中识别出与用户相关联的自定义信息。
动态变量可以存储在表或其他数据结构中,并与不同的变量类型动态关联。例如,每个动态变量可以与一个或多个变量类型相关联。动态变量可以和与用户账户相关联的标识符一起存储。例如,自定义区域名称“Nick的房间”可以与“Nick的房间”区域中的媒体回放系统的区域标识符和/或PBD的标识符相关联。作为另一示例,自定义区域名称“Nick的房间”可以和区域标识符标签一起存储,和/或“Nick的房间”区域中的PBD的标识符可以和“Nick的房间”区域的标签一起存储。动态变量可以连续地、周期性地或非周期性地更新,以包括用户所添加或移除的、或者与用户的账户相关联的新的自定义名称。自定义名称可以是用户提供的任何名称,其可能存在或不存在于数据库中。
在一些示例中,每个动态变量可以与标识符一起存储或与之相关联,该标识符可以用于识别媒体回放系统命令中的动态变量。例如,区域名称“Nick的房间”可以与特定于媒体回放系统的区域标识符一起存储,并且当命令请求对“Nick的房间”中的回放设备执行动作时,可以使用媒体回放系统命令提供“Nick的房间”的区域标识符,作为“Nick的房间”的补充或替代。
在框1214处,用户可以通过说出可被NMD接收的命令或请求来提供语音输入。联网麦克风系统可以将语音输入从语音转换为文本,并解析单词以确定语音输入的语法。口头命令可以具有特定语法,联网麦克风系统可以将其识别为在音乐回放控制的域或范畴中。例如,用户可以说“在厨房和Nick的房间中播放甲壳虫(The Beatles)”。联网麦克风系统可以将单词“播放”识别为对应于意图的命令或直接识别为与音乐回放相关联的意图,并且可以在框1216处将口头命令识别为在音乐回放控制的域或范畴。
在另一示例中,存在或包括一个或多个媒体变量实例和/或一个或多个区域变量实例可以指示命令字“播放”对应于“播放”意图。联网麦克风系统可以通过搜索可包括音乐元数据的音乐目录和确定例如艺术家名为“甲壳虫”,来确定“甲壳虫”对应于媒体变量实例。联网麦克风系统可以基于与区域变量类型相关联的动态变量和/或公共区域名称来确定“厨房”和/或“Nick的房间”对应于区域名称。命令字“播放”与媒体变量“甲壳虫”和/或“Nick的房间”的组合可以使联网麦克风系统能够确定语音输入对应于播放所请求音乐的音乐控制意图。
因为口头命令被识别为在音乐回放控制的域或范畴中,所以联网麦克风系统可以优先考虑与著名艺术家“甲壳虫(The Beatles)”相关的音乐内容的搜索结果,并且不优先考虑或排除与同音字“the beetles”相关的音乐内容的搜索结果,该同音字“the beetles”可能不与任何著名艺术家关联。换句话说,响应于识别出语音输入在音乐域中,用于语音到文本识别的一组单词或词汇可以被改变为特定于该音乐域,其可以包括一般在词典中找不到的单词,和/或在词典中或者是与口头语言不同的语言中的单词。
例如,响应于确定语音输入在音乐域中,可以更新用于语音到文本识别的一组单词或词汇,以包括媒体项目的元数据信息(例如,艺术家姓名、曲目名、专辑名、歌曲名)。在一些方面,语音输入可以包括例如自定义名称(例如,区域、播放列表)、媒体变量、和/或艺术家姓名、专辑名和/或曲目名的字母和/或符号的口述。作为另一示例,在处理音乐控制命令之前,可以改变语音到文本转换的所得文本中的单词,以使用媒体特定单词。媒体变量实例的语音到文本转换可以使用在音乐元数据、媒体目录和/或自定义或本地媒体标识符(例如,播放列表名、曲目名、专辑名、艺术家名等)中找到的单词,替代联网麦克风系统所使用的标准单词或作为其补充。类似地,区域变量的语音到文本转换可以使用自定义区域名称。
在框1218处,可以处理包含音乐控制命令的语音输入。联网麦克风系统可以具有各种预定义的语法,这些语法可以与用户的意图(例如,播放、暂停、添加到队列、分组、通过控制设备300可进行的一个或多个其他传输控制)相关联。每个意图可以对应于一个或多个媒体回放系统命令,其可以与意图相同或不同,或者与意图相似或不相似。例如,将音乐回放从第一区域移动到第二区域的意图可以对应于将当前正在播放的媒体项和/或回放队列从第一区域移动到第二区域的媒体回放系统命令。在另一示例中,移动音乐的意图可以对应于媒体回放系统将第一区域的回放队列复制到第二区域的回放队列,和/或将第一区域的状态变量复制到第二区域的状态变量的回放队列复制命令。
作为又一示例,移动音乐的意图可以对应于两个媒体回放系统命令。这两个命令可以是将第二区域与第一区域分在一组,然后从组中移除第一区域,从而实际上将第一区域的状态传送到第二区域。
媒体回放系统命令可以包括应用程序接口(API),其响应于确定意图对应于媒体回放系统命令而被调用。联网麦克风系统和/或媒体回放系统可以具有用户意图和媒体回放系统命令之间的定义的映射或对应关系。
在一些示例中,可以对云网络502中的计算设备(例如,计算设备504、计算设备506、计算设备508)中存储的数据执行媒体回放系统命令。例如,将媒体项(例如,曲目、专辑、播放列表)添加到另一播放列表或回放队列的意图可以被添加至存储在云网络502中的播放列表或回放队列。可以响应于存储在云网络502中的播放列表或回放队列的改变来更新存储在PBD 532、534、536、538上的回放队列,使得回放队列的一部分与云网络502中的播放列表或回放队列的一部分或全部相匹配。
某些单词、语法和/或短语可以与相同的意图相关联。例如,语音输入中包括命令字“播放”、“收听”或“听”可以对应于让媒体回放系统回放媒体内容的用户意图。每个意图可以具有不同类型的预定义变量或间隙(slot),其中对变量或间隙执行命令或意图指定的动作。变量或间隙可以位于各种短语的预定义位置或定位处。例如,“播放”命令语法可以具有用户希望回放的媒体的媒体变量,并且还可以具有用户希望相关联的回放设备回放媒体内容的位置或区域的位置或区域变量。在“在厨房中播放甲壳虫”的口头命令的示例中,媒体或音乐变量的实例可以是“甲壳虫”,并且区域变量的实例可以是“厨房”。在识别对应于媒体变量实例和/或区域变量实例的相关对象时,联网麦克风系统和/或媒体回放系统分开地处理媒体变量和区域变量,和/或对它们进行不同的处理。
可以与“播放”意图相关联的语法或短语的另一示例可以是语法“让我在[区域变量]中收听[媒体变量]”。这种语法的一个示例可以是“让我在Emily的房间中收听PaulSimon”,其中“让我…收听…”可能与“播放”意图相关联,“Paul Simon”可能是媒体变量的实例,而“Emily的房间”可能是区域变量的实例。联网麦克风系统可以解析语音输入,并确定存储在联网麦克风系统中的哪个语法与语音输入匹配以识别语音输入的意图。语法可以存储在联网麦克风系统中的任何设备中。
用于“播放”意图或命令的语法或短语的又一示例可以是语法“我想在[区域变量]中收听[媒体变量]”。单词“收听”或句式“我想…收听…”可能与“播放”意图相关联。“播放”意图的其他语法是可能的。
另一示例命令或意图可以与将媒体内容添加到可存储在媒体回放系统中(例如,存储在PBD、计算设备506和/或CR 522中)的队列相关。示例的添加到队列语法可以是“将[媒体变量]添加到[区域变量]中的队列”。与本文描述的其他方面类似,区域变量可以是可选的,并且系统可以基于各种技术或方法来确定命令所应用的区域(例如,使用默认区域,使用最后使用的区域,基于用户存在信息,使用积极播放媒体的区域)。可以将与媒体变量对应的所选择的媒体内容添加到区域中的队列。
作为另一示例,命令或意图可以是下一首播放命令,其可以使所选择的媒体内容被添加到队列的顶部,以在区域中接下来播放。该命令的示例语法可以是“下一首播放[媒体变量]”。类似于本文描述的其他方面,区域变量可以是可选的。
命令或意图的另一示例可以是移动或传送命令,其可以将当前播放的音乐和/或区域的回放队列从一个区域移动或传送到另一区域。例如,用户可以说出“将音乐移动到[区域变量]”的语音输入,其中命令字“移动”或“传送”可以对应于将回放状态移动到另一区域的意图。
本文描述的命令和意图是示例,其他意图或命令是可能的。例如,可用于通过控制设备300控制媒体回放系统(如本文所述)的每种控制可以具有可用于控制该系统的对应意图。例如,控制命令的名称可以对应于意图。如果控制命令涉及一个或多个媒体项,则命令的语法可以包括一个或多个媒体变量。如果控制命令涉及一个或多个区域,则命令的语法可以包括一个或多个区域。与不同意图一起使用的其他变量也是可能的。
可用于通过控制设备300控制媒体回放系统的控制的示例可以包括传输控制命令。这些命令或意图可以与当前正在播放的媒体项相关,例如,传输命令(例如,停止、暂停、跳过、倒回、快进、返回、音量等)或者与将当前播放的媒体项保存或添加到另一回放队列或播放列表相关的命令。用于对正在播放的媒体项采取的意图或动作的语法可以更为简单,并且可以对应于传输控制的名称。例如,用于暂停音乐回放的意图的语音输入可以是语音输入“暂停”。
可以在不同的命令语法中使用不同类型的变量。对于媒体变量,媒体变量可以是语法中的变量或间隙,其中用户可以通过语音输入在变量或间隙处指定用户希望收听或播放的媒体内容。媒体变量可以是与音乐相关的各种特征或特性(例如,媒体变量的类型),包括但不限于:专辑名称、艺术家姓名、歌曲名称、播放列表名称、自定义播放列表名称、流派(例如,流行音乐、古典音乐、乡村音乐、摇滚音乐、R&B等)、情绪(例如,浪漫、运动、高效(productive))、音乐节奏(例如,欢快、慢节拍)、电台名称、作曲家姓名、音乐时代(例如,巴洛克、浪漫、古典、20世纪)、时间段(例如,80年代、90年代)、播放列表创建者的姓名、排名(例如,最佳、前40名)和/或其他音乐识别特征。音乐变量可以具有自定义名称,该自定义名称可以是由用户账户的用户创建的自定义播放列表名称和/或其他自定义名称(例如,自定义歌曲名称、自定义专辑名称、自定义艺术家姓名)。
对于区域变量,区域变量可以是语法中的变量或间隙,其中用户可以通过语音输入在该变量或间隙处指定执行所请求的动作或意图(例如,播放所请求的音乐)的位置或区域。用户可以在语音输入中包括区域实例,也可以不包括。在这种情况下,用户未指定区域,例如,通过简单地说“播放一些甲壳虫”,联网麦克风系统和/或媒体回放系统可以确定在默认区域中和/或基于其他输入(例如,用户存在信息、上下文信息(context information)、位置信息)在其他区域中“播放一些甲壳虫”。区域变量可以包括用户提供的自定义区域名称的动态变量。作为另一示例,自定义区域名称可以是例如“Nick的房间”或“三楼会议室”。
在一些示例中,语法可以包括媒体服务或应用或者其他媒体相关服务、产品或应用(例如,媒体回放系统)执行语音输入的媒体服务变量。系统可以识别用于所有媒体相关内容的默认回放系统或区域,或者将不同的回放系统或区域与不同的服务相关联。例如,用户可以说“在卧室里播放Spotify上的Josh Groban”。系统(例如,联网麦克风系统和/或媒体回放系统)可以将“Spotify”识别为媒体服务变量的实例,将“Josh Groban”识别为音乐变量的实例,并将“卧室”识别为区域变量的实例。系统可以在媒体服务的媒体目录中搜索与“Josh Groban”相关的媒体内容,如本文所讨论的。
一些类型的变量可以是标量,因为标量变量可以形成为包含同一变量的多个实例的向量或集合。标量变量的向量可以具有用户说出的格式或语法:“[第一标量变量]和[第二标量变量]”、“[第一标量变量]、[第二标量变量]和[第三标量变量]”、或者“[第一标量变量][第二标量变量][第三标量变量]”。例如,区域变量可以是标量变量,并且用户可以指定在多个区域“厨房、起居室和餐厅”中播放媒体内容。在一些方面,可以为向量或标量变量的预定义集合命名。例如,名为“楼下”的预定义向量可以与家庭环境中位于楼下的所有区域相关联。在图1所示的示例环境中,“楼下”可以是“起居室”、“餐厅”、“书房”、“主卧室”、“卧室”和“浴室”区域。控制设备300可以示出区域列表,并且用户可以从区域列表中选择这些区域以与名称或标签“楼下”相关联。
在一些示例中,媒体变量可以是标量变量。可以在单个命令短语中说出一个以上相同类型的音乐变量,并且可以独立于其他媒体变量实例或者与其他媒体变量实例组合地,针对相应的媒体项来处理每个媒体变量实例。例如,语音输入可以是“让我们听甲壳虫和海滩男孩(the Beach Boys)的音乐”,其可以对应于语法“让我们听[第一媒体变量]和[第二媒体变量]的音乐”。在一个方面,第一媒体变量实例“甲壳虫”可以独立于“海滩男孩”来进行处理。在独立于“海滩男孩”而处理“甲壳虫”时,可以针对任何与甲壳虫相关的媒体项来处理“甲壳虫”,并且可以针对任何与“海滩男孩”相关的媒体项来处理“海滩男孩”,将参考框1218更详细地描述。在另一方面,第一媒体变量实例“甲壳虫”和第二媒体变量实例“海滩男孩”可以被处理为一种组合,其中系统可以处理与“甲壳虫”和“海滩男孩”两者相关的媒体项(例如,甲壳虫和海滩男孩表演和/或被列为艺术家的歌曲)。
联网麦克风系统和/或媒体回放系统可以将向量或区域变量实例集合与分组命令相关联。例如,联网麦克风系统和/或媒体回放系统可以识别房间变量的标量变量语法,并确定该语法对应于对区域变量的指定实例进行分组的媒体回放系统命令。作为示例,用户可以指定在“起居室、厨房和Nick的房间”中播放媒体内容。系统500(例如,联网麦克风系统和/或媒体回放系统)可以基于在短语中说出“Nick的房间”的位置或地方,将“Nick的房间”识别为区域变量,并在存储动态变量的表中搜索对应于“Nick的房间”的自定义区域名称。搜索可以由计算设备504和/或计算设备506执行,并且可以基于对表的搜索,在计算设备504和计算设备506之间传输自定义区域名称和/或标识符。可以通过元数据交换通道和/或计算设备504和计算设备506之间的任何其他通信路径来进行传输。
可被媒体回放系统识别为分组命令的语法的另一示例可以是“添加[区域变量]”或“也在[区域变量]中播放”。例如,联网麦克风系统可以将单词“添加”或短语“也在……中播放”识别为对应于分组意图或命令。系统可以仅基于在语法的命令字位置中包括“添加”或“也在……中播放”的命令字的语音输入,或者基于包括命令字和区域变量实例的语音输入,来确定意图。这种类型的分组可以基于上下文,例如,哪些区域中已经正在播放音乐的上下文。媒体回放系统可以通过任何通信路径和/或元数据交换通道向联网麦克风系统发送该信息。在一些方面,媒体回放系统可以接收信息,并且理解也在指定区域中播放当前正在一个或多个区域中播放的音乐,和/或将指定区域包括在现有的组中。
在一些示例中,音乐变量可以是标量变量。例如,用户可以指定“播放后街男孩(Backstreet Boys)90年代的音乐”。“后街男孩”可以是艺术家的姓名,“90年代”可以是音乐的时间段。另一个示例可以是“播放麦当娜(Madonna)的American Pie”,其中“AmericanPie”可以是曲目名称,而“麦当娜”可以是艺术家的姓名。
可以通过在音乐数据库中搜索与特定音乐变量相关的信息来处理音乐变量。数据库可以是计算设备504、计算设备506和/或计算设备508处的音乐数据库。例如,用户可以说“播放American Pie”。联网麦克风系统可以在计算设备504中搜索与“American Pie”相关的任何音乐信息。计算设备504可以返回如下结果,例如,具有与该音乐变量相同名称的专辑的艺术家、与该音乐变量匹配或类似的专辑名称、名称为该音乐变量的曲目、具有该音乐变量的无线电台、名称为该音乐变量的播放列表、与该音乐变量相关的内容的流传输服务提供商标识符、和/或原始语音到文本转换结果。使用“American Pie”的示例,则搜索结果可能会返回艺术家“Don McLean”、名为“American Pie”的专辑、名为“American Pie”的曲目、名为“American Pie”的无线电台(例如,针对“American Pie”的Pandora无线电台的标识符)、针对曲目“American Pie”的音乐服务(例如,流传输音乐服务,如或)曲目标识符(例如,针对“American Pie”的曲目标识符、URI和/或URL)、和/或“American Pie”的原始语音到文本结果。联网麦克风系统可以向媒体回放系统提供来自数据库搜索的一组结果。可以通过元数据交换通道和/或在联网麦克风系统和媒体回放系统之间建立的任何其他通信路径来提供结果。
在一些示例中,口头命令可以指定要播放的特定媒体内容(例如,歌曲、艺术家)或一组媒体内容(例如,专辑),例如,“播放专辑American Pie”,在这种情况下,搜索结果可以返回名为“American Pie”的专辑和名为“American Pie”的专辑的音乐服务标识符。
作为另一示例,用户可以说出命令“播放foofoo”,其中音乐变量是“foofoo”。“foofoo”可能不对应于任何音乐特征或特性,因此,数据库可能没有任何对应于音乐变量“foofoo”的艺术家、专辑和/或曲目。在此示例中,返回的结果可能只是“foofoo”的语音到文本转换的结果。语音到文本转换或原始文本可以用于搜索自定义名称(例如,自定义专辑名称、自定义歌曲名称、自定义艺术家姓名)。原始文本可以用于搜索存储在设备(例如,CR522)上,或存储在支持网络的存储设备(例如,网络附接存储(NAS)设备)上的内容。支持网络的存储设备可以能够通过通信路径542、544、546与媒体回放系统和/或联网麦克风系统进行通信。在一些情况下,用户可以将自定义内容存储在计算设备508上。支持网络的存储设备中的内容可以在系统500中的任何设备上被索引,并且可以是基于原始文本可搜索的。
作为又一示例,用户可以说出命令“播放甲壳虫”。在音乐上下文之外,“甲壳虫”(Beatles)可能会被解释为对应于“甲壳虫”(beetles),因为这些词是同音异义词。由于在框716中可以将口头命令识别为在音乐控制域,因此联网麦克风系统可以知道在语音命令“播放甲壳虫”中“甲壳虫”可能对应于名为“甲壳虫”的艺术家或其他音乐内容。搜索数据库可以产生如下结果:艺术家甲壳虫、针对不同流传输服务的甲壳虫的艺术家标识符、基于艺术家甲壳虫的推荐播放列表的标识符、和/或语音“甲壳虫”的语音到文本转换的原始结果。
作为另一示例,用户说出的语音输入可以是“播放爵士乐”。系统500可以基于对存储流派列表的数据库的搜索来将“爵士乐”识别为流派。系统可以搜索对应于爵士乐流派的相关媒体内容。例如,搜索结果可以是各种音乐服务的数据库中“爵士乐”流派的标识符和/或对应于“爵士乐”流派的播放列表的播放列表名称或播放列表标识符。
在一些示例中,语音输入可以包括依次说出的两个命令或短语。联网麦克风系统可以识别出依次说出的两个命令可能是相关的。第一命令可以包含第一变量类型,第二命令可以包含第一变量类型的子集。例如,用户可以提供语音输入“播放一些古典音乐”,然后是“播放一些浪漫音乐”。两个命令之间可能会有暂停。系统500可以具有与音乐变量的古典实例相关联的各个时代的古典音乐。系统500可以认识出“浪漫”指的是古典音乐的浪漫时代,并且可以将命令处理为播放一些浪漫时代的音乐的命令,而不是播放一些浪漫情绪的音乐的命令。作为另一示例,用户可以说“播放一些*NSync”,然后短暂停顿,然后说“播放NoStrings Attached”。系统500可以识别出“No Strings Attached”是艺术家*NSync的专辑,并且可以播放该专辑,而不是另一位艺术家的名为“No Strings Attached”的专辑。
在一些示例中,该命令可以包括用于媒体回放系统名称的系统名称变量。媒体回放系统可以与名称(例如,媒体回放系统制造商的名称(例如,)、自定义名称和/或其他名称)相关联。语音输入可以包括系统名称,用于识别与用户账户相关联的执行命令或意图的特定系统。在一些情况下,在框1216中,口头命令中媒体回放系统名称变量的存在,可以用于自动将语音输入识别为在音乐控制域中。
在框1220处,媒体回放系统可以通过执行每个被解析的命令和变量来执行口头音乐控制命令。媒体回放系统可以从联网麦克风系统和/或一个或多个媒体回放系统命令接收搜索结果。媒体回放系统可以在来自联网麦克风系统的一个或多个消息中接收媒体回放系统命令和/或媒体信息(例如,搜索结果)。基于搜索结果,媒体回放系统(例如,计算设备506、控制设备522和/或回放设备532、534、536、538)可以决定响应于口头命令所要播放的媒体内容或进行回放的队列。当接收到除原始文本到语音转换之外的搜索结果时,可以使用各种技术来确定响应于口头命令而播放什么。
在一些方面,媒体回放系统可以基于各种数据点和/或偏好给不同的结果权重。例如,不同结果的权重可以基于以下任何项:流行度、用户回放历史、与用户账户相关联的音乐服务、媒体回放系统可用的音乐服务、存储在与媒体回放系统相关联的存储设备上的音乐和/或用户偏好。例如,不同艺术家的歌曲可能具有相同的名称。如果搜索结果返回不同艺术家的具有相同名称的歌曲,则可以选择更流行的歌曲,和/或给其更大的权重。可以基于各种源,例如用户播放计数、无线电播放计数、音乐排行榜排名、销售的拷贝和/或其他可用数据来确定歌曲的流行度。作为另一示例,用户最近播放的媒体项可以具有较大的权重。
在一些示例中,用户可以针对媒体变量指示用于选择媒体项的优先顺序。例如,用户可以指示自定义播放列表是优先的,接着是无线电台、组织的播放列表、曲目、专辑、艺术家。系统可以基于用户偏好给予优先级较高的媒体变量类型较大的权重。用户偏好可以存储在用户简档中和/或以其他方式与用户账户相关联,使得用户偏好可以被发送到联网麦克风系统和/或媒体回放系统。一些媒体变量类型可以被赋予相同的优先级或权重。
在一些示例中,如果用户未提供用户偏好,则可以使用默认优先级排序。系统可以使用不同媒体变量类型的优先级的任意组合。例如,系统可以优先考虑对应于专辑的媒体内容,然后是艺术家和曲目、再然后是对应于原始文本的结果。
作为另一示例,媒体变量实例可以是艺术家的姓名,并且艺术家可以对应于播放列表和无线电台。对于媒体变量实例,播放无线电台可以优于播放列表。
作为又一示例,媒体回放系统可以过滤掉与用户和/或媒体回放系统不具有访问权的音乐服务相关联的结果。在过滤掉不可访问的结果之后,媒体回放系统可以基于本文描述的各种方法或技术来选择要播放的媒体内容。
本文描述的选择方法是说明性的,并且可以使用其他示例方法或技术,用于响应于“播放”命令来选择要播放的媒体项。
作为对响应于接收到“播放”命令或意图而选择要播放的内容的响应,媒体回放系统可以使用搜索结果中提供的标识符和/或其他识别信息来识别内容的源。标识符可以是网络地址或链接,其中,媒体回放系统可以检索相应的内容,例如,网络存储位置或统一资源定位符(URL)和/或元数据(例如,艺术家姓名、专辑名称、曲目号、无线电台名称、播放列表名称、媒体服务名称等)。
在一些示例中,命令或意图可以是传输命令(例如,暂停、暂停指定时间后播放、跳过、后退、倒回、快进)。如上所述,系统500可以确定对应于命令或意图的媒体回放系统命令,并执行相应的媒体回放系统命令。联网麦克风系统可以通过向媒体回放系统发送消息来使媒体回放系统执行命令,该消息包括识别命令对应的意图(例如,播放、暂停等)和命令的相关对象(例如,诸如区域名称、区域标识符、组标识符、媒体标识符之类的变量)的命令信息。例如,传输命令可以包括要在其中执行命令的区域的区域变量的实例(例如,Nick的房间、厨房或区域的其他标识符)。
响应于基于语音输入在PBD上引起动作,媒体回放系统可以更新和/或存储与PBD执行的动作相关的状态信息。例如,PBD可以更新状态变量以指示区域的状态,例如,区域或特定回放设备当前正在播放特定媒体项,和/或特定媒体项被添加到存储在PBD上的队列。状态变量可以被系统500中的任何设备访问,以便实现系统500中的各种设备的无缝回放和/或控制。
虽然本文已经关于媒体内容(例如,音乐内容、视频内容)描述了方法和系统,但是本文描述的方法和系统可以应用于可以具有可由媒体回放系统播放的相关音频的各种内容。例如,可以响应于语音输入来播放可能不是音乐目录的一部分的预先录制的声音。一个示例是语音输入“夜莺的声音是什么样的?”。联网麦克风系统对该语音输入的响应可能不是具有标识符的音乐内容,而可能是短音频剪辑。媒体回放系统可以接收与回放短音频剪辑相关联的信息(例如,存储地址、链接、URL、文件)以及用于播放短音频剪辑的媒体回放系统命令。其他示例是可能的,包括播客、新闻剪辑、通知声音、警报等。
V.用于基于用户识别的动作的示例系统、装置和方法
本文描述的示例包括媒体回放系统(或者其可能的一个或多个组件)接收语音命令,并基于用户识别(或至少基于说出语音命令的用户)确定媒体回放系统执行的适当动作。在一些示例中,媒体回放系统可以包括计算设备506(其被配置为媒体回放系统服务器)以及PBD 532、534、536和538中的一个或多个。在一些实施例中,媒体回放系统可以包括联网麦克风系统或与联网麦克风系统通信,该联网麦克风系统包括计算设备504(其被配置为联网麦克风系统服务器)以及NMD 512、514和516中的一个或多个。
通常,应当理解,本文描述的一个或多个功能可以由联网麦克风系统单独地或与媒体回放系统组合地执行。还应理解,计算设备506执行的一个或多个功能可以由媒体回放系统的PBD 532、534、536和538中的一个或多个和/或CR 522来执行。
如上所述,语音命令的示例包括用于控制先前讨论的任何媒体回放系统控制的命令。例如,语音命令可以是媒体回放系统通过该媒体回放系统的一个或多个回放设备来播放媒体内容的命令。在另一示例中,语音命令可以是触发时间段或窗口的命令,在该时间段或窗口中接收与初始语音命令相关联的附加语音命令。在又一示例中,语音命令可以是修改媒体回放系统的一个或多个媒体回放设备的回放设置的命令。回放设置可以包括例如回放音量、回放传输控制、音乐源选择、分组等。
媒体内容的示例包括:热线广播、有声读物、来自电视的音频、存储在本地驱动器上的音乐、或来自媒体源的音乐等。媒体源的示例包括Radio、Radio、Google PlayTM和iTunes Radio等。
用户识别的示例包括将用户识别为注册用户、访客用户、儿童或未知用户。
示例注册用户包括通过用户简档和/或语音配置设置等与媒体回放系统链接或相关联的一个或多个用户。示例用户简档可以包括关于用户的年龄、位置、偏好的回放设置、偏好的播放列表、偏好的音频内容、对该用户设置的访问约束的信息以及识别用户语音的信息、用户历史等。识别用户语音的示例信息包括用户语音的音调或频率、年龄、性别和用户历史等。示例语音配置设置可以包括让用户提供语音输入或一系列语音输入以供媒体回放系统识别和关联用户的设置。
示例访客用户包括通过注册用户的用户简档、或者注册用户或注册用户许可的访客用户创建的访客简档与媒体回放系统链接或相关联的一个或多个用户。示例访客简档可以包括用户简档中包括的任何类型的信息。
在一些示例中,在他或她自己的家中具有他或她自己的媒体回放系统的访客可以将与他或她自己的媒体回放系统相关联的用户简档存储在计算设备506中。当访客来到主人家中并尝试使用语音命令来控制主人的媒体回放系统时,连接到主人的回放系统的计算设备506可以能够访问访客的用户简档设置,包括但不限于:(i)访客具有用户账户的音乐服务、(ii)访客的播放列表、(iii)主人是否已给访客授权了控制主人的媒体回放系统的访问权、和/或(iv)访客的用户简档中其他可能信息。
可以识别儿童用户,例如通过用户简档中的信息(如果儿童是媒体回放系统的注册用户之一)、访客简档中的信息和/或用户语音的音调或频率。
在一些示例中,接收语音命令包括媒体回放系统通过PBD 532、534、536和538中的一个或多个和/或计算设备506(其被配置为媒体回放系统服务器)接收语音命令。计算设备506可以将语音命令转换为等效的文本命令,并解析文本命令以识别命令。
在另外的示例中,一个或多个功能可以由联网麦克风系统单独地或与媒体回放系统组合地执行。例如,接收语音命令包括联网麦克风系统通过NMD 512、514或516中的一个或多个接收语音命令,以及向计算设备506和/或PBD 532、534、536和538中的一个或多个发送语音命令,用于进一步处理。计算设备506可以将语音命令转换为等效的文本命令,并解析文本命令以识别命令。在一些情况下,联网麦克风系统可以将语音命令转换为等效的文本命令,并向计算设备506和/或PBD 532、534、536和538中的一个或多个发送文本命令,以解析文本命令和识别命令。
在接收到语音命令之后,计算设备506和/或PBD 532、534、536和538中的一个或多个可以确定是否是从媒体回放系统的注册用户接收到该语音命令。在一些示例中,确定是否是从注册用户接收到语音命令可以包括:计算设备506和/或PBD 532、534、536和538中的一个或多个确定是否存在与语音命令相关联的存储在媒体回放系统上的用户简档。例如,计算设备506和/或PBD 532、534、536和538中的一个或多个可以尝试将语音命令与识别用户语音的信息匹配,该信息可以包括在存储在媒体回放系统上的用户简档中。单独地或与媒体回放系统组合地,联网麦克风系统可以通过与计算设备506通信来确定是否是从媒体回放系统的注册用户接收到语音命令。
在其他示例中,确定是否是从注册用户接收到语音命令可以包括:计算设备506和/或PBD 532、534、536和538中的一个或多个确定语音命令是否与媒体回放系统的语音配置设置中的语音输入匹配。例如,用户可以已经通过提供一个语音输入或一系列语音输入以供媒体回放系统识别并与用户关联,来预先配置媒体回放系统以识别用户语音。一个语音输入或一系列语音输入可以存储在计算设备506和/或PBD 532、534、536和538中的一个或多个上。在一些实施例中,一个语音输入或一系列语音输入可以存储在联网麦克风系统上。
在又一示例中,确定是否是从注册用户接收到语音命令可以包括:计算设备506、CR 522和/或PBD 532、534、536和538中的一个或多个单独地或组合地,确定与接收到的语音命令相关联的置信度水平。可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
例如,媒体回放系统可以在厨房中从注册用户接收第一语音命令,并基于接收到的语音命令确定置信度。媒体回放系统可以从NMD 512-513、CR 522和PBD 532-538中的任何一个或多个接收第一语音命令。此外,媒体回放系统可以在用户家中的另一房间中从注册用户接收相同的语音命令,并基于接收到的语音命令确定置信度。媒体回放系统可以从NMD 512-513、CR 522和PBD 532-538中的任何一个或多个接收第二语音命令。然后,媒体回放系统可以基于从用户整个家中的不同计算设备(例如,CR 522)、NMD和/或PBD接收的命令来确定新的置信度。相应地,则媒体回放系统可以具有从注册用户接收语音命令的较高置信度水平。
在另一情况下,媒体回放系统可以从注册用户接收语音命令,并基于用户历史确定置信度水平。在操作中,媒体回放系统可以从NMD 512-513、CR 522和PBD 532-538中的任何一个或多个接收语音命令。在接收到语音命令之后,如果接收到的语音命令包括艺术家、播放列表、流派、或在通常与注册用户相关联的用户简档中找到的任何其他信息,则计算设备506、CR 522、和/或PBD 532、534、536和538中的一个或多个可以单独地或组合地确定较高的置信度水平。例如,如果注册用户通常听Michael Jackson的歌曲,则媒体回放系统可以具有关于从注册用户接收到播放Michael Jackson的“Thriller”的语音命令的较大置信度水平。与上述类似和不同的许多其他示例是可能的。
在其他情况下,媒体回放系统可以基于在用户简档中找到的注册用户的语音命令模式来建立置信度水平。例如,媒体回放系统可以从注册用户接收播放Britney Spears的特定歌曲的语音命令,并基于接收到的语音命令确定置信度水平。每当媒体回放系统接收到相同的语音命令或类似的语音命令时,例如播放Britney Spears的另一首歌的命令,媒体回放系统可以建立较高的置信度水平,因此可以具有关于从注册用户接收到语音命令的较大置信度水平。
通常,如前所述,应当理解,本文描述的一个或多个功能可以由联网麦克风系统单独地或与媒体回放系统组合地执行。还应理解,计算设备506执行的一个或多个功能可以由CR 522和/或媒体回放系统的PBD 532、534、536和538中的一个或多个和/或可能由NMD512、514和516中的一个或多个来执行。
在一些示例中,确定置信度水平包括媒体回放系统通过计算设备506(其被配置为媒体回放系统服务器)、CR 522和/或PBD 532、534、536和538中的一个或多个(单独或相互组合地)来确定置信度水平。例如,CR 522和/或PBD 532、534、536和538中的一个或多个可以(i)确定与接收到的语音命令相关联的置信度水平,(ii)基于所确定的置信度水平,确定是从注册用户接收到语音命令,以及(iii)向计算设备506(其被配置为媒体回放系统服务器)发送用于执行语音命令的指令。在另一实例中,CR 522和/或PBD 532、534、536和538中的一个或多个可以(i)确定与接收到的语音命令相关联的置信度水平,以及(ii)向计算设备506发送与置信度水平相关联的数据,用于进一步处理。然后,计算设备506可以(i)基于所确定的置信度水平确定是从注册用户接收到语音命令,以及(ii)向CR 522和/或PBD532、534、536和538中的一个或多个发送用于执行语音命令的指令。
在其他示例中,确定置信度水平包括:媒体回放系统单独地或与联网麦克风系统组合地确定置信度水平。例如,媒体回放系统可以通过CR 522和/或媒体回放系统的PBD532、534、536和538中的一个或多个和/或可能的NMD 512、514和516中的一个或多个来接收语音命令。响应于接收到的语音命令,媒体回放系统可以向NMD 512、514或516中的一个或多个发送与置信度水平相关联的数据。然后,联网麦克风可以(i)确定与接收到的数据相关联的置信度水平,以及(ii)执行命令或向媒体回放系统发送用于执行命令的指令。响应于确定是从注册用户接收到语音命令,计算设备506可以配置用于媒体回放系统的一个或多个PBD的指令。指令可以基于语音命令中的内容和注册用户的用户简档中的信息。附加地或备选地,该指令可以基于语音命令中的内容和存储在计算设备506、PBD 532、534、536和538中的一个或多个、或联网麦克风系统上的语音配置设置。
在一些示例中,语音命令中的内容可以包括用于使媒体回放系统的一个或多个PBD播放媒体内容的命令。在一些实施例中,基于使媒体回放系统播放媒体内容的命令和注册用户的用户简档中的信息,计算设备506可以配置一个指令或一组指令,以使得一个或多个PBD从注册用户的偏好媒体源获得媒体内容。
在另一示例中,基于使媒体回放系统播放媒体内容的命令和注册用户的用户简档中的信息,计算设备506可以配置指令,以使得媒体回放系统通过媒体回放系统的一个或多个PBD来播放媒体内容。例如,计算设备506可以包括以下指令:(i)将媒体回放系统配置有注册用户的偏好回放设置中的一个或多个,以及(ii)使得一个或多个PBD在注册用户的偏好回放设置下播放媒体内容。
偏好回放设置可以是存储在注册用户的用户简档中的偏好回放设置。附加地或备选地,偏好回放设置可以基于存储在注册用户的用户简档中的用户历史。用户历史可以包括用户播放媒体内容的常用或先前使用的回放设置。
在又一示例中,语音命令中的内容可以包括使媒体回放系统播放媒体内容的命令,但是可以不识别媒体回放系统的特定回放区域。基于注册用户的用户简档中的内容和信息,例如用户历史,计算设备506可以(i)配置使得媒体回放系统通过媒体回放系统的特定回放区域内的一个或多个PDB来播放媒体内容的指令,和(ii)实现所配置的指令,以通过一个或多个PBD播放媒体内容。
在又一示例中,语音命令中的内容可以包括使媒体回放系统修改回放设置的命令。基于使媒体回放系统修改回放设置的命令和注册用户的用户简档中的信息,计算设备506可以(i)配置用于使媒体回放系统修改用于媒体回放系统的一个或多个PBD的回放设置的指令,和(ii)实现所配置的指令,以修改一个或多个PBD的回放设置。
其他的示例可以包括媒体回放系统确定是否是从儿童接收到语音命令。例如,如果儿童是媒体回放系统的注册用户之一,则计算设备506可以基于用户简档中的信息来区分成人和儿童。在另一情况下,计算设备506可以基于用户语音的音调或频率来区分成人和儿童。
在又一情况下,确定是否是从儿童接收到语音命令可以包括:计算设备506、CR522和/或PBD 532、534、536和538中的一个或多个单独地或组合地,确定与接收到的语音命令相关联的置信度。如上所述,可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
在示例操作中,媒体回放系统可以从儿童可能所在的特定房间(例如,儿童的卧室、游戏室、地下室等)中的NMD或PBD接收语音命令。因为语音命令是从儿童可能所在的房间中的设备(NMD或PBD)接收的,所以媒体回放系统可以具有关于从儿童接收到语音命令的较高置信度水平。
在另一示例中,媒体回放系统可以接收针对特定类型内容的语音命令,并且基于内容的类型,确定关于从儿童接收到语音命令的较高置信度水平。例如,如果媒体回放系统接收到播放卡通节目或电影的原声音乐的语音命令,则媒体回放系统可以具有关于从儿童接收到语音命令的较高置信度水平。与上述类似和不同的许多其他示例是可能的。
响应于确定从儿童接收到语音命令,一些示例可以包括阻止一个或多个PBD播放可能不适合儿童的给定媒体。在一些情况下,可以防止计算设备506和/或一个或多个PBD基于儿童语音命令的内容来修改回放设置。例如,计算设备506和/或一个或多个PBD可以忽略增加一个或多个PBD的音量的儿童语音命令。
在一些情况下,媒体回放设备可以基于确定语音命令来自访客用户而不是媒体回放系统的注册用户来采取动作。例如,计算设备506可以存储可与特定访客相关联的预先创建的访客简档。在另一示例中,计算设备506可以确定语音命令不是从注册用户接收的,然后可以询问注册用户该语音命令是否来自访客。然后,注册用户可以具有阻止计算设备506和/或一个或多个PBD执行语音命令的全部或部分内容的选项。
在又一示例中,确定是否是从访客用户接收到语音命令可以包括:计算设备506、CR 522和/或PBD 532、534、536和538中的一个或多个单独地或组合地,确定与接收到的语音命令相关联的置信度水平。如上所述,可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
响应于确定从访客用户接收到语音命令,计算设备506可以(1)分配访客用户的约束设置,(2)基于语音命令中的内容和分配的访客用户的约束设置来配置用于一个或多个PBD的指令,以及(3)向一个或多个PBD发送指令,以用于执行。在一些示例中,分配访客用户的约束设置可以包括:计算设备506将语音命令与存储在计算设备506和/或一个或多个PBD上的特定访客简档相匹配。访客简档可以包括约束设置,以及关于特定访客用户的语音的信息,例如访客语音的频率或音调,以及先前描述的其他信息。约束设置可以是限制对媒体回放系统的控制的任何设置。
其他示例包括媒体回放系统确定优先顺序,以解决从不同用户接收的冲突语音命令。例如,冲突语音命令可以是从用户接收的播放歌曲的语音命令和随后从另一用户接收的停止播放歌曲的语音命令。其他示例也是可能的,例如,从用户接收的增加一个或多个PBD 532、534、536和538的音量的语音命令,以及随后从另一用户接收的减小音量的语音命令。
具体地,媒体回放系统(通过NMD 512-516、CR 522、PBD 532-538和/或计算设备506中的一个或多个)可以从注册用户或主人接收在回放区域中播放歌曲的语音命令。随后,媒体回放系统可能从非注册用户或访客接收到停止在该回放区域中播放歌曲的冲突语音命令。为解决该冲突,媒体回放系统可以应用优先顺序,其中从注册用户接收的语音命令具有比非注册用户或访客更高的优先级。
在另一示例中,媒体回放系统可以分配优先顺序,其中从注册的访客接收的语音命令具有比非注册的访客更高的优先级。在一些情况下,从一个注册的访客接收的语音命令可以具有比另一个注册的访客更高的优先级。附加地或备选地,从成人接收的语音命令可以具有比儿童更高的优先级。
在又一示例中,媒体回放系统接收到的控制器发布的命令(例如,由CR 522或被配置为控制媒体回放系统的另一计算设备发出的命令)可以具有比注册用户更低的优先级,但是可以具有被比非注册用户或访客更高的优先级。在一些情况下,一些注册的访客可以具有比控制器发出的命令更高的优先级。确定和分配优先顺序的其他示例是可能的。
另外,媒体回放系统可以基于接收到与注册用户相关联的唤醒词或唤醒短语来采取动作。唤醒词或短语可以包括存储在注册用户的简档中的特定单词或短语(例如,“嘿,Sonos”)。在一些情况下,不同的用户可以给媒体回放系统配置不同的唤醒词或短语。在其他情况下,媒体回放系统可以被配置有用于所有(或任何)用户的相同唤醒词或短语。
在一些示例中,注册用户可以具有通用唤醒词或短语,其触发时间段或窗口,以用于媒体回放系统从注册用户、访客和/或非注册用户接收与唤醒词或短语相关联的附加语音命令。例如,注册用户或主人可以发送在播放队列中添加歌曲的语音命令(例如,“嘿,Sonos,让我们队列歌曲”),这可以打开一个时间段或窗口(例如,五分钟),在此期间,注册用户可以发送附加的语音命令,以将特定歌曲添加到播放队列中(例如,“添加MichaelJackson的Thriller”)。在另一示例中,注册用户或主人可以发送语音命令(例如,“嘿Sonos,开放对我的家居系统的控制”),其授权家中所有访客在用户定义或默认的时间段或窗口内、或者在特定时间段内发送语音命令来将歌曲添加到播放队列、播放歌曲、或改变音量等(例如,“嘿Sonos,在接下来的4小时内开放对我的家居系统的控制”或“嘿Sonos,从现在开始到周六下午2点,开放对我的家居系统的控制”)。在一些情况下,注册用户或主人可以发送语音命令(例如,“嘿Sonos,对我的起居室的控制限于授权访客”),其仅授权一些访客在一个时间段或窗口内发送语音命令来控制回放区域中的一个或多个PBD 532、534、536和538和/或计算设备506。
在另一示例中,注册用户可以具有用于不同语音命令的不同唤醒词或短语,其触发时间段或窗口,以用于媒体回放系统接收与唤醒词或短语相关联的附加语音命令。例如,注册用户或主人可以具有用户特定的唤醒词或短语以发送语音命令将歌曲添加到播放队列(例如,“嘿Sonos,让我们队列歌曲”,“哟,Sonos,队列歌曲”,“阿尔法(Alpha)歌曲队列”等),并且可以具有不同的用户特定的唤醒词或短语,以授权家中的访客控制媒体回放设备(例如,“嘿Sonos,开放访问”,“派对时间到了”等)。
在又一示例中,注册用户或主人可具有用户特定或通用的唤醒词或短语,以发送授权家中的某些访客在一个时间段或窗口内具有对媒体回放系统的约束性控制的语音命令。题为“Systems,Methods,Apparatus,and Articles of Manufacture to Provide aCrowd-Sourced Playlist with Guest Access”的美国专利公开No.2013/0346859更详细地提供了对媒体回放系统进行约束性控制的一些示例,该专利通过引用将其整体并入本文。
在另一示例中,注册用户或主人可具有用户特定或通用的唤醒词或短语,以发送语音命令,用于授权家中的注册访客在一个时间段或窗口内具有对媒体回放系统的开放控制或约束性控制,同时防止未注册访客进行控制。在一些情况下,注册用户或主人可具有用户特定或通用的唤醒词或短语,以发送语音命令,用于授权家中的成人在一个时间段或窗口内具有对媒体回放系统的开放控制或约束性控制,同时防止儿童进行控制。与上述类似和不同的许多其他示例是可能的。
在一些情况下,注册用户或主人可以指定媒体回放系统接收附加语音命令的时间段或窗口。例如,注册用户或主人可以发送语音命令(例如,“嘿,Sonos,我的家居系统开放控制一小时”),其授权访客在指定时间段内(例如,一小时)发送附加语音命令来控制媒体回放系统。与上述类似和不同的许多其他示例是可能的。
在其他情况下,注册用户或主人可以关闭或切断用于接收与初始唤醒词或短语相关联的附加语音命令的时间段或窗口。例如,如果注册用户或主人说出具有唤醒词或短语的语音命令,该语音命令开启用于在一小时内接收附加语音命令的时间段或窗口,则注册用户或主人可以在一小时的时间段到期之前发送另一语音命令(例如,“嘿,Sonos,队列歌曲完成”)以切断该一小时的时间段或窗口。与上述类似和不同的许多其他示例是可能的。
进一步地,示例可以涉及媒体回放系统基于从注册访客用户接收到的唤醒词或唤醒短语来采取动作。注册的访客用户可以具有被存储在访客简档中的唤醒词或短语。响应于确定从访客用户接收到唤醒词或唤醒短语,媒体回放系统可以(i)确定是否存在与访客用户相关联的约束设置,(ii)基于唤醒词或短语以及针对访客用户分配的约束设置,配置用于一个或多个PBD的指令,以及(iii)向一个或多个PBD发送该指令以供执行(例如,开启一个时间段或窗口,以用于接收与唤醒词命令相关联的附加语音命令)。
在一些情况下,例如,如果媒体回放系统已经从注册用户或主人接收到具有唤醒词或短语的语音命令,而且用于接收附加命令的时间段或窗口尚未到期,则媒体回放系统可以抑制基于从注册的访客用户接收唤醒词或短语来采取动作。
在其他情况下,媒体回放系统可以基于从注册的访客用户接收唤醒词或唤醒短语而采取动作,并且如果随后媒体回放系统接收到来自注册用户或主人的语音命令,则可以随后关闭或切断用于接收附加语音命令的时间段或窗口。在一些实施例中,注册访客可以在时间段或窗口到期之前将其关闭或切断。在其他实施例中,如果注册访客是儿童,则成人可以在时间段或窗口到期之前将其关闭或切断。与上述类似和不同的许多其他示例是可能的。
在配置用于媒体回放系统的指令之后,一些示例可以包括将指令发送到媒体回放系统的一个或多个PBD以执行指令。在一些示例中,媒体回放系统可以将指令发送到计算设备506。在其他示例中,媒体回放系统可以向联网麦克风系统发送指令。
图14中所示的方法1400呈现了可以在包括或包含以下各项的操作环境内实现的方法的实施例:例如,图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备300、图4的用户界面和/或图5中所示的配置。方法1400可以包括一个或多个操作、功能或动作,如框1402-1406中的一个或多个所示。
方法1400开始于框1402,其包括接收针对媒体回放系统的语音命令。在一些实施例中,接收语音命令包括媒体回放系统通过PBD 532、534、536和538中的一个或多个和/或计算设备506(其被配置为媒体回放系统服务器)接收语音命令。在一个示例中,计算设备506可以将语音命令转换为等效的文本命令,并解析该文本命令以识别命令。
在一个示例中,一个或多个功能可以由联网麦克风系统单独地或与媒体回放系统组合地执行。在一些实施例中,接收语音命令包括联网麦克风系统通过NMD 512、514或516中的一个或多个接收语音命令,以及向计算设备506和/或PBD 532、534、536和538中的一个或多个发送语音命令,用于进一步处理。在另一示例中,计算设备506和/或PBD 532、534、536和538中的一个或多个可以将语音命令转换为等效的文本命令,并解析文本命令以识别命令。在另一示例中,联网麦克风系统可以将语音命令转换为等效的文本命令,并向计算设备506和/或PBD 532、534、536和538中的一个或多个发送文本命令,以解析文本命令和识别命令。
接下来,方法1400进行到框1404,其包括确定是否是从媒体回放系统的注册用户接收到语音命令。在一些示例中,确定是否是从注册用户接收到语音命令可以包括:计算设备506确定是否存在与语音命令相关联的存储在媒体回放系统上的用户简档。例如,计算设备506可以尝试将语音命令与用户简档中识别用户语音的信息进行匹配。
在另一示例中,确定是否是从注册用户接收到语音命令可以包括:确定语音命令是否与媒体回放系统的语音配置设置中存储的语音输入匹配。例如,用户可以已经通过提供一个语音输入或一系列语音输入以供媒体回放系统识别并与用户关联,来预先配置媒体回放系统以识别用户语音。语音配置设置可以存储在计算设备506和/或PBD 532、534、536和538中的一个或多个上。备选地,计算设备506可以与联网麦克风系统通信以存储语音配置设置。
在又一示例中,确定是否是从注册用户接收到语音命令可以包括:确定与接收到的语音命令相关联的置信度水平。置信度水平可以是与说出命令的人相关联的置信度水平,例如,从普通注册用户接收命令的置信度水平、从特定注册用户接收命令的置信度水平、从注册用户以外的其他人接收命令的置信度水平、从注册访客接收命令的置信度水平、从儿童接收命令的置信度水平、和/或从特定儿童接收命令的置信度水平。置信度水平也可以是与请求的内容相关联的置信度水平,例如,该请求是播放“AC/DC”而不是例如“HayseedDixie”的请求的置信度水平,这两个乐队非常不同,但名字听起来很相似。可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。在操作中,置信度水平的确定可以由CR 522、PBD 532-538、NMD 512-516和/或计算设备504-508中的任何一个或多个单独地或组合地执行。
在示例操作中,媒体回放系统可以在厨房中从注册用户接收语音命令,并基于接收到的语音命令确定置信度。媒体回放设备可以从CR 522、NMD 512-516和/或PBD 532-538中的任何一个或多个接收语音命令。接下来,媒体回放系统可以在用户家中的另一房间中从注册用户接收相同的语音命令,并基于接收到的语音命令确定置信度。然后,媒体回放系统可以至少部分地基于接收到语音命令的房间,基于从用户的整个家中的不同房间中的不同设备接收的命令来确定新的置信度水平。相应地,则媒体回放系统可以具有从注册用户接收语音命令的较高置信度水平。
在另一示例中,媒体回放系统可以从注册用户接收语音命令,并基于用户历史确定置信度水平。具体地,如果接收的语音命令包括艺术家、播放列表、流派或在通常与注册用户相关联的用户简档中找到的任何其他信息,则媒体回放系统可以确定较高的置信度水平。例如,如果注册用户通常听Michael Jackson的歌曲,则媒体回放系统可以具有关于从注册用户接收到“播放Thriller”的语音命令的较大置信度水平。同样,如果注册用户通常听Michael Jackson的歌曲或大约1980年代的歌曲,则媒体回放系统可以具有关于“播放Thriller”的语音命令是播放艺术家Michael Jackson的“Thriller”而不是Fall Out Boy乐队的歌曲“Thriller”的命令的较大置信度水平。与上述类似和不同的许多其他示例是可能的。
在又一示例中,媒体回放系统可以基于在用户简档中找到的注册用户的语音命令模式来建立置信度水平。例如,媒体回放系统可以从注册用户接收播放Britney Spears的特定歌曲的语音命令,并基于接收到的语音命令确定置信度水平。每当媒体回放系统接收到相同的语音命令或类似的语音命令时,例如播放Britney Spears的另一首歌的命令,媒体回放系统可以建立较高的置信度水平,并且可以具有关于从注册用户接收到语音命令的较大置信度水平。
最后,方法1400进行到框1406,其包括响应于确定是从注册用户接收到语音命令,基于来自语音命令的内容和注册用户的用户简档中的信息来配置用于媒体回放系统的指令。
在一些示例中,语音命令中的内容可以包括用于使媒体回放系统的一个或多个PBD播放媒体内容的命令。在一些情况下,基于使一个或多个PBD播放媒体内容的命令和注册用户的用户简档中的信息,计算设备506可以配置指令,使得媒体播放系统从注册用户的偏好媒体源获得媒体或音频内容。
在其他情况下,基于使媒体回放系统播放媒体内容的命令和注册用户的用户简档中的信息,媒体回放系统可以配置指令,以使得媒体回放系统通过媒体回放系统的一个或多个PBD来播放媒体内容。具体地,计算设备506可以包括以下指令:(i)将媒体回放系统配置有注册用户的偏好回放设置中的一个或多个,以及(ii)使得媒体回放系统的一个或多个PBD在注册用户的偏好回放设置下播放媒体内容。偏好回放设置可以是存储在注册用户的用户简档中的偏好回放设置。附加地或备选地,偏好回放设置可以基于存储在注册用户的用户简档中的用户历史。用户历史可以包括用户播放媒体内容的常用或先前使用的回放设置。
在一些情况下,语音命令中的内容可以包括使媒体回放系统的一个或多个PBD播放媒体内容的命令,但是可以不识别媒体回放系统的特定收听区域或回放区域。基于该内容和注册用户的用户简档中的信息,例如用户历史,计算设备506可以配置一个指令或一组指令,使得媒体回放系统通过媒体回放系统的特定回放区域内的一个或多个媒体回放设备播放媒体内容。
在另一情况下,语音命令中的内容可以包括使媒体回放系统修改回放设置的命令。基于使媒体回放系统修改回放设置的命令和注册用户的用户简档中的信息,计算设备506可以(i)配置用于使媒体回放系统修改用于媒体回放系统的一个或多个PBD的回放设置的一个或一组指令,和(ii)实现所配置的一个或一组指令,以修改一个或多个PBD的回放设置。
其他的示例可以包括媒体回放系统确定是否是从儿童接收到语音命令。例如,如果儿童是媒体回放系统的注册用户之一,则计算设备506可以基于用户简档中的信息来区分成人和儿童。在另一示例中,计算设备506可以基于用户语音的音调或频率来区分成人和儿童。
在又一示例中,确定是否是从儿童接收到语音命令可以包括:确定与接收到的语音命令相关联的置信度水平。如上所述,可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
在一些情况下,媒体回放系统可以通过儿童可能所在的特定房间(例如,儿童的卧室、游戏室、地下室等)中的设备(例如,NMD 512-516或PBD 532-538中的任何一个)接收语音命令。因为命令是从儿童可能所在的房间中的设备接收的,所以媒体回放系统可以具有关于从儿童接收到语音命令的较高置信度水平。
在其他情况下,媒体回放系统可以接收语音命令,并基于语音命令的内容确定是从儿童接收到命令的置信度水平。例如,如果媒体回放系统接收到播放卡通节目或电影的原声音乐的语音命令,则媒体回放系统可以具有关于从儿童接收到语音命令的较高置信度水平。与上述类似和不同的许多其他示例是可能的。
响应于确定从儿童接收到语音命令,一些示例可以包括阻止媒体回放系统的一个或多个PBD播放可能不适合儿童的给定媒体。一些示例可以涉及防止计算设备506和/或一个或多个PBD基于儿童语音命令的内容来修改回放设置。例如,计算设备506可以忽略增加一个或多个PBD的音量的儿童语音命令。
另外,其他示例可以涉及基于确定是从访客用户而不是媒体回放系统的注册用户接收到语音命令的动作。在一些情况下,计算设备506可以存储可与特定访客相关联的预先创建的访客简档。在其他情况下,计算设备506可以确定语音命令不是从注册用户接收的,然后可以询问注册用户该语音命令是否来自访客。
此外,确定是否是从访客用户接收到语音命令可以包括:媒体回放系统确定与接收到的语音命令相关联的置信度水平。如上所述,可以基于用户历史、位置单独地或者与通常在用户简档中找到的任何其他信息组合地,来确定置信度水平。
响应于确定从访客用户接收到语音命令,计算设备506可以(1)分配访客用户的约束设置,(2)基于语音命令中的内容和分配的访客用户的约束设置来配置用于一个或多个PBD的指令,以及(3)向一个或多个PBD发送指令,以用于执行。在一些实施例中,分配访客用户的约束设置可以包括:计算设备506将语音命令与存储在计算设备506上的特定访客简档相匹配。
另外,示例可以涉及媒体回放系统应用优先顺序来解决从不同用户接收的冲突语音命令。例如,冲突语音命令可以是从用户接收的播放歌曲的语音命令和随后从另一用户接收的停止播放歌曲的语音命令。其他示例也是可能的,例如,从用户接收的增加一个或多个回放设备(例如,PBD 532、534、536和538)的音量的语音命令,以及随后从另一用户接收的减小音量的语音命令。具体地,媒体回放系统可以从注册用户或主人接收在回放区域中播放歌曲的语音命令。随后,媒体回放系统可能从非注册用户或访客接收到停止在该回放区域中播放歌曲的冲突语音命令。为解决该冲突,媒体回放系统可以应用优先顺序,其中从注册用户接收的语音命令具有比来自非注册用户或访客的语音命令更高的优先级。
在一些示例中,媒体回放系统可以分配优先顺序,其中从注册的访客接收的语音命令具有比来自非注册的访客的语音命令更高的优先级。在一种情况下,从一个注册的访客接收的语音命令可以具有比另一个注册的访客更高的优先级。在另一情况下,从成人接收的语音命令可以具有比儿童更高的优先级。
在其他情况下,媒体回放系统接收的控制器发布的命令(例如,从CR 522或被配置为控制媒体回放系统的其他计算设备接收的命令,或者可能是从计算设备506接收的命令)可以具有低于注册用户的优先级,但可以具有高于非注册用户或非注册访客的优先级。在一些实施例中,一些注册的访客可以具有高于控制器发布的命令的优先级。确定和分配优先顺序的其他示例是可能的。
在配置用于媒体回放系统的指令之后,一些实施例可以向媒体回放系统的一个或多个PBD发送指令以执行指令。在一些实施例中,计算设备506可以向联网麦克风系统发送指令。
图15中所示的方法1500呈现了可以在包括或包含以下各项的操作环境内实现的方法的实施例:例如,图1的媒体回放系统100、图2的一个或多个回放设备200、图3的一个或多个控制设备300、图4的用户界面和/或图5中所示的配置。方法1500可以包括一个或多个操作、功能或动作,如框1502-1506中的一个或多个所示。
方法1500开始于框1502,其包括接收与针对媒体回放系统的语音命令相关联的唤醒词或唤醒短语。如上所述,唤醒词或短语可以是存储在用户简档中的特定单词或短语(例如,“嘿,Sonos”)。在一些实施例中,媒体回放系统可以接收与注册用户的语音命令相关联的通用唤醒词或短语(例如,“嘿Sonos”)。附加地或备选地,媒体回放系统可以接收与注册的访客用户的语音命令相关联的通用唤醒词或短语。在一些情况下,媒体回放系统可以被配置为针对不同注册用户具有不同唤醒词或短语。
具体地,注册用户可以具有针对不同语音命令的不同的用户特定唤醒词或短语。例如,媒体回放系统可以接收唤醒词或短语以将歌曲添加到播放队列(例如,“嘿Sonos,让我们队列歌曲”,“哟,Sonos,队列歌曲”,“阿尔法歌曲队列”等),并且可以接收不同的用户特定的唤醒词或短语,以授权家中的访客控制媒体回放设备(例如,“嘿Sonos,开放访问”,“派对时间到了”等)。
接下来,方法1500进行到框1504,其包括确定是否是从媒体回放系统的注册用户接收到与语音命令相关联的唤醒词。在一些实施例中,确定是否是从注册用户接收到与语音命令相关联的唤醒词可以类似于在方法1400的框1404中描述的确定是否是从注册用户接收到语音命令。
最后,方法1500进行到框1506,其包括响应于确定是从注册用户接收到与语音命令相关联的唤醒词,基于接收到的唤醒词、来自语音命令的内容和注册用户的用户简档中的信息来配置用于媒体回放系统的指令。
在一些示例中,用于媒体回放系统的指令可以包括开启一个时间段或窗口,用于媒体回放系统从注册用户、访客和/或非注册用户接收与接收到的唤醒词相关联的附加语音命令。例如,响应于确定是从注册用户接收到将歌曲添加到播放队列的唤醒词,媒体回放系统可以开启一个时间段(例如,五分钟),用于注册用户发送将特定歌曲添加到播放队列中的附加语音命令(例如,“添加Michael Jackson的Thriller”)。
在另一示例中,响应于确定是从注册用户接收到授权所有访客控制媒体回放系统的唤醒词,媒体回放系统可以开启一个时间段(例如,一小时),用于允许家中所有访客发送将歌曲添加到播放队列、播放歌曲或改变音量等用于用户定义或默认的时间段或窗口的其他功能的语音命令。
接下来,方法1500进行到框1506,其包括响应于确定是从注册用户接收到唤醒词,基于接收到的唤醒词或短语、语音命令中的内容和注册用户的用户简档中的信息来确定唤醒词是否与约束设置相关联。
在一些示例中,媒体回放系统可以基于注册用户或注册的访客用户的用户简档中的约束设置来配置指令。从注册用户接收的唤醒词可以与某些访客的约束设置相关联。例如,注册用户或主人可以发送语音命令(例如,“嘿Sonos,对我的起居室的控制限于授权访客”),其授权注册的访客在一个时间段或窗口内发送附加语音命令以控制回放区域中的一个或多个PBD 532、534、536和538和/或计算设备506,同时阻止未注册的访客发送附加语音命令。在另一种情况下,接收到的唤醒词可以与儿童的约束设置相关联。与上述类似和不同的许多其他示例是可能的,包括但不限于本文其他地方描述的示例。
在其他示例中,从注册用户接收的唤醒词可以与约束设置相关联,该约束设置允许某些访客在一个时间段或窗口内对媒体回放系统具有约束性控制。题为“Systems,Methods,Apparatus,and Articles of Manufacture to Provide a Crowd-SourcedPlaylist with Guest Access”的美国专利公开No.2013/0346859更详细地提供了对媒体回放系统进行约束性控制的一些示例,该专利通过引用将其整体并入本文。
响应于确定从访客用户接收到唤醒词或唤醒短语,媒体回放系统可以(i)确定是否存在与访客用户相关联的约束设置,(ii)基于唤醒词或短语以及针对访客用户分配的约束设置,配置用于一个或多个PBD的指令,以及(iii)向一个或多个PBD发送该指令以供执行(例如,开启一个时间段或窗口,以用于接收与唤醒词命令相关联的附加语音命令)。
在一些示例中,例如,如果媒体回放系统已经从注册用户或主人接收到具有唤醒词或短语的语音命令,而且用于接收附加命令的时间段或窗口尚未到期,则媒体回放设备可以通过一个或多个PBD 532、534、536和538和/或计算设备506,抑制基于从注册的访客用户接收到唤醒词或短语来采取动作。
在配置用于媒体回放系统的指令之后,一些示例可以包括向媒体回放系统的一个或多个PBD发送命令以执行指令。在一些示例中,计算设备506可以向媒体回放系统的一个或多个PBD发送一个命令或一组命令。
在一些情况下,在配置用于媒体回放系统执行的指令之后,注册用户或主人可以关闭或切断用于接收与指令相关联的附加语音命令的时间段或窗口。例如,如果注册用户或主人发送具有唤醒词或短语的语音命令,该语音命令开启用于在一小时内接收附加语音命令的时间段或窗口,则注册用户或主人可以在一小时的时间段到期之前发送另一语音命令(例如,“嘿,Sonos,队列歌曲完成”)以切断该一小时的时间段或窗口。与上述类似和不同的许多其他示例是可能的。
其他示例可以包括媒体回放系统基于从注册的访客用户接收唤醒词或唤醒短语而采取动作,并且如果随后媒体回放系统接收到来自注册用户或主人的语音命令,则可以随后关闭或切断用于接收附加语音命令的时间段或窗口。在一些实施例中,注册访客可以在时间段或窗口到期之前将其关闭或切断。在其他实施例中,如果注册访客是儿童,则成人可以在时间段或窗口到期之前将其关闭或切断。与上述类似和不同的许多其他示例是可能的。
VI.用于音乐服务选择的示例系统、装置和方法
本文描述的示例涉及基于命令来识别和访问合适的流传输服务(例如,流传输音频曲目)。
图16和图17中所示的方法1600和1700呈现了可以在操作环境内实现的方法的实施例,该操作环境包括,例如,图1的媒体回放系统100、图2的回放设备200中的一个或多个以及图3的控制设备300中的一个或多个。方法1600和1700可以包括一个或多个操作、功能或动作,如框1602-1614和1702-1708中的一个或多个所示。
图16是与用于识别流传输音乐服务的过程相关的示例流程图。在1602处,NMD512-516或CR 522可以接收命令的指示,其可以指示从流传输服务提供用于回放的音频内容。在一些情况下,NMD 512-516接收的命令可以采取语音命令的形式,而CR 522接收的命令可以是用户界面上的文本命令输入。
通常,接收的命令可以包括与一个或多个音频内容类型有关的信息。在一些情况下,命令可以包括艺术家、歌曲、专辑或流派的名称(即,“播放Led Zeppelin”,“播放70年代的摇滚乐”)。另外,命令可以包括可以进一步指示内容类型的前缀和/或后缀类型信息(例如,“最佳......”、“......无线电”、“......播放列表”)。例如,命令“播放Led Zeppelin无线电”可以指示用户希望以无线电格式收听特定艺术家的音乐。接收的命令还可以包括指示内容类型的各种其他形式的信息。
可以以各种方式处理在1602处接收的命令指示。在一个实现中,命令的处理可以通过云网络502完成。在这种情况下,由NMD 512-516接收的语音命令可以使语音输入通过通信网络546发送到计算设备504-508中的一个或多个以进行处理。云计算设备可以将语音输入转换为等效的文本命令,并解析文本命令以识别命令。在另一配置中,云计算设备可以仅将语音输入转换为等效的文本格式,并向第二计算设备发送该等效文本以进行解析和命令识别。在其他情况下,NMD 512-516可以在通过通信网络546传输之前将语音输入转换为文本,或者将语音输入转换为文本并且执行解析以识别命令。在CR 522接收文本命令的情况下,可以通过通信网络546向计算设备504-508之一发送文本输入以进行解析和命令识别。在另一情况下,CR 522可以执行对文本输入的解析以识别命令。
在另一实现中,命令的处理可以通过本地网络在本地完成。在这种情况下,NMD512-516接收的语音命令可以使语音输入通过本地网络被发送到一个或多个本地计算设备以进行处理。本地计算设备可以将语音输入转换为等效的文本命令,并解析文本命令以识别命令。在另一配置中,本地计算设备可以仅将语音输入转换为等效的文本格式,并向第二本地计算设备发送该等效的文本格式以进行解析和命令识别。在其他情况下,NMD 512-16可以在通过本地网络传输之前将语音输入转换为文本,或者将语音输入转换为文本并且执行解析以识别命令。在CR 522接收文本命令的情况下,可以通过本地网络向本地计算设备发送文本输入以进行解析和命令识别。在另一情况下,CR 522可以执行对文本输入的解析以识别命令。可以存在用于处理命令的其他配置。
在1604处,计算设备可以识别命令所指示的内容类型。内容类型的标识可以通过云网络502或通过本地网络在本地完成。
在一个实现中,计算设备可以使用内容类型逻辑来将命令或命令的部分与内容类型相关联。使用“播放Led Zeppelin无线电”的上述示例,计算设备可以将内容类型识别为“艺术家/无线电台”。在另一示例中,命令“播放电子舞曲”可以使内容类型被识别为“流派”。可以对各种其他内容类型进行类似的识别。对内容类型的识别可以例如通过输入诸如“舞曲”之类的命令关键词来完成,并且数据库可以将关键词映射到诸如流派之类的内容类型指示。在一些示例中,数据库可以驻留在计算设备上或网络麦克风设备上。
如果确定在1608处没有识别出内容类型,则该方法可以直接进行到1614。内容类型可能因多种原因而不可识别,这些原因包括用户输入错误、语音输入质量差、背景噪声、或者根本不知道这样的内容类型。例如,可能无法识别指示鲜为人知的艺术家姓名的命令的内容类型。
在1614处,指示可以由计算设备输出,并且通过通信网络546发送到NMD 512-516、PBD 532-538或CR 522中的任何一个或全部,以指示“内容不可用”。然后可以向用户可听地或可视地呈现没有可用内容的指示。例如,NMD和PBD可以输出可听指示,而CR可以能够输出可听和可视指示。附加地或备选地,所发送的指示可以使得向用户输出指示他或她重新输入命令的建议。例如,建议可以是让用户指定一些附加识别特性以便帮助识别内容类型。
然而,如果在1606处确定已经识别出内容类型,则该方法可以进行到1608以识别能够播放在1604处识别的内容类型的流传输服务。通常,特定流传输服务可能与其他流传输服务显著不同,不仅在于它们提供的音频内容不同,而且在于它们呈现内容的方式不同。例如,每个流传输服务可以拥有流式传输某些艺术家或专辑的音乐内容的相对专有权利。在另一种情况下,一些流传输服务,例如可能只以无线电台格式进行流式传输,而其他一些流传输服务,例如可能能够根据艺术家、歌曲、专辑或无线电台按要求来流式传输音乐。鉴于这一事实,显然并非所有的流传输服务都能够流式传输在704处识别的内容类型。
在一种情况下,计算设备可以通过将所识别的内容类型的元数据与查找表进行比较来识别合适的流传输服务,该查找表可以包含可用内容的条目,以及各种流传输服务能够以什么格式来提供内容。在一些情况下,计算设备可以将查询引导到所有可用的流传输服务。在其他情况下,计算设备可以仅查询可用流传输服务的子集。这种子集可以由计算设备基于多个因素单独或组合地进行选择,这些因素包括用户注册的流传输服务、自用户上次使用流传输服务以来的天数、流传输服务流行度、用户设置等。例如,如果用户仅在和上注册,则计算设备可以仅查询这些流传输服务以确定哪些是合适的。
这样的查找表可以存储在计算设备上的存储器中、或存储在诸如计算设备之类的外部位置、或者存储在音乐服务处。考虑到各种查找表可能分布于多个音乐服务,计算设备可以同时或顺序地查询每个音乐服务以便找到匹配。识别合适的流传输服务的其他方式也是可能的。
在一个实现中,在1608处对流传输服务的识别还可以包括确定用户注册的流传输服务的当前可用回放容量。通常,一些流传输服务可能会限制在任意给定时间注册用户可用的活动流的数量。例如,可能只允许每个注册账户单个活动流。在一种情况下,计算设备可以通过查询用户注册的服务的使用状态(即,有多少活动流),然后将使用状态与容量约束数据(即,Spotify=仅1个活动流)进行比较,来确定当前可用的回放容量。在另一示例中,流传输服务可以响应于查询而输出二进制值以指示是否有可用的流。可以以其他方式确定可用回放容量。
在该实现中,在1608处,计算设备可以将注册的服务识别为支持命令指示的内容类型,并进一步确定注册的服务没有可用的流。例如,如果用户及其配偶共享账户,并且当用户发出命令“播放Eye of the Tiger”时,音乐正被流式传输到在健身房的配偶的智能电话设备,则计算设备可以将识别为能够播放这首歌以及流不可用。这种情况可以使计算设备识别能够支持该内容类型的另一流传输服务,例如Apple
在另一种情况下,计算设备可能无法识别可支持该内容类型的另一流传输服务。例如,如果用户请求了由单个流传输服务独家提供的内容,计算设备仅考虑流传输服务的子集等,则可能发生上述情况。在这种情况下,计算设备可以使当前活动流“被盗”以用于提供对应于命令的内容。使用上述示例,如果没有其他流传输服务能够支持“Eye of theTiger”,则可以取消在健身房的配偶的流并将其提供给用户。
在一种情况下,在可用的流传输服务被识别(1610处)为能够支持所识别的内容类型的情况下,该过程可以进行到1614以使PBD 532-538的任何组合回放音频内容。在一种情况下,可以通过向服务API查询内容并使内容被流式传输来访问音乐服务。根据来自PBD532-538或计算设备504-506的请求,音频内容可以直接从计算设备508或从与流传输音乐服务相关联的各种其他计算设备直接地流式传输到PBD 532-538。还存在发起和引起对流媒体内容的回放的其他方式。
在另一种情况下,如果在710处识别的流传输服务当前不可用(即,未安装应用,用户未注册),则在714处,计算设备可以输出与使得音乐服务能够被使用的建议动作步骤有关的指示。该指示可以被发送NMD 512-516、PBD 532-538或CR 522的任何组合,并且可以产生可听和/或视觉建议,指示所识别的音乐服务能够支持内容类型,和/或呈现关于如何注册、下载或以其他方式使用音乐服务的指令。
图17是与图16的框1610和1612中用于识别流传输音乐服务的示例过程相关的另一示例流程图。在1702处,计算设备可以至少部分地基于命令识别的内容类型来产生要针对流传输服务确定的一个或多个置信度指标。通常,置信度指标可以是针对一个或多个流传输服务计算的数值或百分比值(例如,1-100)。这种置信度指标可以反映选择特定音乐服务来提供流传输音频将向用户提供他或她所期望的内容的可能性。例如,被分配了置信度指标80的流传输服务可能比置信度指标为45的流传输服务更适合于进行内容提供,其中较高的数字表示较高的适用置信度水平。
所计算的流传输服务的置信度指标可以基于诸如内容类型、回放容量、使用历史、外部数据等的数字标准。这样的标准可以由各种数据类型构成,并且可以从诸如NMD、CR、PBD、计算设备、音乐服务和各种外部源之类的各种源检索。数据可以被合计并存储在中央位置(例如,与计算设备504或506相关联的数据库),或者以分布式方式存储。
在一种情况下,置信度指标可以考虑流传输服务支持命令指示的内容类型的适用性。确定各种流传输服务提供内容类型的适用性可以包括,将与所识别的内容类型有关的元数据映射到查找表或者查询具有各种音乐服务的表,并给匹配的字段的数量赋值。作为示例,指定“播放Jackson 5播放列表”的命令可以具有内容类型“艺术家/播放列表”。在这种情况下,具有两个流传输服务(例如,和)的查找表都可能在艺术家字段中包含对Jackson 5的引用。但是,只有可能包含标识Jackson 5的播放列表字段,因为不支持播放列表的内容类型。在这种情况下,可以被提供内容类型值2,被提供值1。
附加地或备选地,可以采用字段匹配的强度。使用上述示例并假设服务不包含与Jackson 5对应的艺术家字段但具有Michael Jackson的艺术家条目,其可以由计算设备利用音乐元数据被识别为Jackson 5的前成员。在这种情况下,服务可能不会在艺术家字段被赋值0,而是该服务被提供小于1的调整值。确定流传输服务内容类型适用性值的其他形式是可能的。
在另一种情况下,可以部分地基于各种形式的历史使用数据来计算置信度指标。各种历史数据类型可以从诸如NMD、CR、PBD、计算设备、音乐服务和各种外部源之类的各种源检索。数据可以被合计并存储在中央位置(例如,与计算设备504或506相关联的数据库),或者以分布式方式存储。
例如,使用数据可以指示用户访问给定流传输服务的频率。作为另一示例,使用数据可以包括基于时间的数据,以识别用户通常在一天中的不同时间、一周中的各天和一年中的各个月所使用的服务。例如,用户可能更喜欢在早上收听在晚上收听作为另一示例,在多区域环境中,这些使用数据可以基于每个区域指示关于流传输服务的用户偏好。例如,如果用户通常在浴室区域中90%的时间访问在生活区域中80%的时间访问则与和对应的置信度指标可能会有很大差异,具体取决于用户打算将音频流式传输到哪个区域。在这种情况下,如果用户希望在浴室中听音乐,则将是更好的选择。还可以存在各种其他类型的历史使用数据。
另外,可以部分地基于各种“外部”数据类型来确定置信度指标。这样的数据可以包括宏观类型数据,其可以考虑地理位置或人口统计数据等。例如,这种宏观数据可以指示特定流传输服务在世界的某些区域或国家的子区域中不可用或不受欢迎,这可以导致较低的置信度指标。在这种情况下,流传输服务的置信度指标可以根据地理位置而变化。“外部”数据的类型还可以包括天气数据,可以考虑天气数据,例如,用户喜欢在凉爽干燥的夏季夜晚在露台上收听另外,可以考虑日历数据,以识别假日,以及通常在这些日子流式传输的音乐服务。可以存在其他形式的外部数据。
此外,可以组合各种标准以确定给定流传输服务的置信度指标。例如,用户可能更喜欢使用在起居室中收听各种古典音乐,但可能仅使用Apple在卧室中收听他们最喜欢的艺术家的完整专辑。在这种情况下,内容类型(流派、艺术家)可以与关于特定音乐服务的使用位置的用户历史相结合,以确定特定音乐服务的置信度指标。可以存在许多其他组合。
计算机实现的算法可以将上述标准映射到流传输服务的置信度指标。例如,可以将一个或多个标准映射到输出置信度指标的表中。在一些实施例中,算法可以涉及对各种标准(例如,内容类型、使用历史和/或“外部数据”)进行加权。算法可以基于相对重要性为各种标准分配不同的权重。例如,可以认为用户偏好比人口统计数据更有影响力并且为其提供更大的权重。输入的权重可以由系统、通过用户设置定义,或者可基于用户反馈动态调整。每个加权输入可以被输入到表中,例如,用于映射到置信度指标,然后将其组合,以整体形成音乐服务的合计置信度指标。
在1704处,计算设备504或506可以确定给定流传输服务是否满足置信度条件。可以以多种方式满足置信度条件。在一种情况下,如果给定流传输服务的置信度指标超过置信度水平阈值(其可以是默认系统设置或者可由用户调整),则可以满足置信度条件。例如,如果三个置信度指标被计算为服务1=85、服务2=83、服务3=25且阈值置信度为80,则在1706处,可以使得输出服务1以进行流式传输或者向用户建议服务1(如上文参考1614所讨论的)。
在另一种情况下,仅当(1)流传输服务的所计算的置信度指标大于阈值置信度水平,且(2)所计算的两个最高置信度指标不在彼此的阈值范围内时,才满足置信度条件。例如,如果在上面刚刚提到的情况下置信度水平范围是3,则由于服务1和服务2的置信度指标,将不满足置信度条件。置信度条件可以附加地或备选地包含各种其他规则。
如果在1708处发现不满足置信度条件,则计算设备504或506可以在1708处触发错误状态。错误状态可以触发引起某些事件,例如,输出内容不可用的指示,如参考1616所讨论的。在另一种情况下,触发的错误状态可以使得内容通过默认流传输服务或优选的合作伙伴服务进行流式传输。在又一情况下,错误状态可以使计算设备向NMD 512-516、PBD532-538或CR 522中的一个或全部输出指示,以引起对用于获得与已接收的命令有关的更多信息的指令或查询的听觉或视觉呈现。
在一种情况下,可以指示用户提供诸如艺术家或专辑之类的附加内容类型。例如,如果初始命令是“播放无线电台”,则可以向用户指示“请提供流派”。
在另一种情况下,可以向用户询问可帮助进一步调整初始命令从而调整各种流传输服务的置信度指标的一个问题或一系列问题。例如,如果初始命令针对的是宽泛的流派“电子乐”,则可以询问用户他们是否喜欢特定的子流派,例如“鼓和贝斯”或“迷幻曲”。附加地或备选地,可以询问用户与音乐无关的问题,例如“你在做什么?”或“你感觉如何?”来推断用户可能希望收听的子流派。例如,如果用户对上述问题回答“阅读”和/或“放松”,则可以推断出用户对子流派“迷幻曲”感兴趣。询问的其他示例是可能的。
用户对指令或问题的响应可以采用可被NMD接收的语音输入或者可通过CR的图形界面接收的文本输入的形式。用户响应可以使过程1600重复,这可能导致满足置信度条件或者触发附加错误状态。
VII.其他示例特征
(特征1)一种用于回放系统的方法,所述回放系统包括至少一个回放设备和包括麦克风设备的网络设备,所述方法包括:获得回放设备所处环境的声学特性;识别所述回放设备的环境中的网络麦克风设备;向所述网络麦克风设备提供所述声学特性;以及由所述网络麦克风设备将所述声学特性应用于所述网络麦克风设备接收的语音输入。
(特征2)根据特征1所述的方法,还包括:
向所述网络麦克风设备提供由所述回放设备在所述环境中回放的音频内容;由所述麦克风设备将所提供的音频内容应用于所述网络麦克风设备接收的语音输入。
(特征3)根据特征1或2所述的方法,其中,所识别的网络麦克风设备处于以下中的至少一种情形:被绑定到所述回放设备;以及和所述回放设备在同一区域中。
(特征4)根据前述任一特征所述的方法,其中,向所述麦克风设备发送所述声学特性的所述回放设备是所述媒体回放系统中的多个回放设备中最靠近所述麦克风设备的回放设备。
(特征5)根据前述任一特征所述的方法,还包括:从所述网络麦克风设备接收对所述语音输入的方向的指示;以及基于接收到的对所述语音输入的方向的指示,调整所述回放设备播放的音频内容的方向性。
(特征6)根据前述任一特征所述的方法,其中,使得所述网络麦克风设备将所述声学特性应用于所述网络麦克风设备接收的语音输入包括:使得所述回放设备将基于所述声学特性的滤波器应用于接收到的语音输入。
(特征7)根据前述任一特征所述的方法,其中,在校准阶段中获得所述环境的所述声学特性,在所述校准阶段中:一个或多个回放设备输出一个或多个音调,所述网络设备的麦克风接收所述一个或多个回放设备输出的所述音调;以及分析接收到的音调以确定所述环境的所述声学特性。
(特征8)根据前述任一特征所述的方法,其中,向所述麦克风设备提供所述声学特性包括以下中的一个:将所述声学特性作为消息发送到所述麦克风设备;以及为所述麦克风设备提供对所述声学特性的访问权。
(特征9)一种计算机可读存储介质,包括用于由处理器执行的指令,所述指令在被执行时使得所述处理器实现根据任一前述特征的方法。
(特征10)一种媒体回放系统,包括至少一个回放设备和包括麦克风设备的网络设备,所述媒体回放系统被配置为执行任一前述特征所述的方法。
(特征11)一种用于计算设备的方法,所述方法包括:接收语音输入,所述语音输入包括:命令字、一个或多个媒体变量实例和一个或多个区域变量实例;确定对应于所述命令字的媒体回放系统命令;识别对应于所述一个或多个媒体变量实例的媒体内容;以及使得媒体回放系统基于所述一个或多个区域变量实例对所述媒体内容执行所述媒体回放系统命令。
(特征12)根据特征11所述的方法,还包括:在确定所述媒体回放系统命令对应于所述命令字之前,确定所述语音输入对应于音乐控制,其中,基于对应于音乐控制的可用命令来确定对应于所述命令字的所述媒体回放系统命令。
(特征13)根据特征11或12所述的方法,还包括:从所识别的媒体内容中确定一个或多个媒体项;以及发送指示所述一个或多个媒体项的网络存储位置的标识符。
(特征14)根据特征11至13中任一项所述的方法,还包括:基于所述命令字在第一位置来识别所述语音输入中的所述命令字;基于所述一个或多个媒体变量实例在第二位置,来识别所述语音输入中的所述一个或多个媒体变量实例;以及基于所述一个或多个区域变量实例在第三位置来识别所述语音输入中的所述一个或多个区域变量实例。
(特征15)根据前述特征11至14中任一项所述的方法,其中,确定对应于所述命令字的所述媒体回放系统命令包括:确定对应于所述命令字的意图;以及确定对应于所述意图的所述媒体回放系统命令。
(特征16)根据前述特征11至15中任一项所述的方法,其中,接收到的语音输入的所述一个或多个区域变量实例指示媒体回放系统的一个或多个区域,所述一个或多个区域包括一个或多个回放设备。
(特征17)根据前述特征11至16中任一项所述的方法,其中,使得所述媒体回放系统对所述媒体内容执行所述媒体回放系统命令包括:从所述计算设备向所述媒体回放系统发送消息,所述消息包括:识别所述媒体回放系统命令的命令信息,识别对应于所述一个或多个媒体变量实例的媒体内容的媒体信息;以及对应于所述一个或多个区域变量实例的一个或多个区域标识符。
(特征18)一种存储指令的有形的非暂时性计算机可读介质,所述指令当被计算设备的一个或多个处理器执行时,使得所述计算设备执行前述特征11-17中任一项的方法。
(特征19)一种计算设备,包括:一个或多个处理器;存储指令的存储器,所述指令在被所述一个或多个处理器执行时,使得所述计算设备执行特征11至17中任一项的方法。
(特征20)一种方法,包括:接收用于媒体回放系统的语音命令;确定是否是从所述媒体回放系统的注册用户接收到所述语音命令;以及如果是从注册用户接收到所述语音命令,则基于来自所述语音命令的内容和所述注册用户的用户简档中的信息来配置用于所述媒体回放系统的指令。
(特征21)根据特征20所述的方法,还包括向所述媒体回放系统的一个或多个回放设备发送所述指令。
(特征23)根据特征21或22所述的方法,其中,所述语音命令是所述媒体回放系统播放媒体内容的命令。
(特征24)根据特征23所述的方法,其中,所配置的指令指示所述媒体回放系统从所述注册用户的偏好媒体源获得所述媒体内容。
(特征25)根据特征23所述的方法,其中,所配置的指令使得所述媒体回放系统通过所述媒体回放系统的一个或多个媒体回放设备来播放所述媒体内容。
(特征26)根据特征23所述的方法,其中,所配置的指令包括用于以下操作的指令:将所述媒体回放系统配置有所述注册用户的偏好回放设置中的一个或多个偏好回放设置;以及使得所述媒体回放系统通过所述媒体回放系统按照所述注册用户的偏好回放设置来播放所述媒体内容。
(特征27)根据特征26所述的方法,其中,所述注册用户的偏好回放设置包括以下中的一个或多个:偏好回放音量和偏好音频均衡设置。
(特征28)根据特征21或22所述的方法,其中,所述语音命令是所述媒体回放系统修改回放设置的命令,并且所配置的指令使得所述媒体回放系统修改所述媒体回放系统的一个或多个媒体回放设备的回放设置。
(特征29)根据前述特征20至28中任一项所述的方法,还包括:如果并非是从注册用户接收到所述语音命令,则确定是否是从访客用户接收到所述语音命令;以及如果是从访客用户接收到所述语音命令,则:为所述访客用户分配约束设置;基于来自所述语音命令的内容以及为所述访客用户分配的约束设置,配置用于所述媒体回放系统的指令;以及向所述媒体回放系统发送所述指令。
(特征30)根据前述特征20至29中任一项所述的方法,其中,所述媒体回放系统包括回放网络和一个或多个回放设备。
(特征31)根据前述特征20至30中任一项所述的方法,还包括如果并非是从注册用户接收到所述语音命令,则忽略所述语音命令。
(特征32)一种编码有指令的有形的非暂时性计算机可读介质,其中当一个或多个处理器执行时,所述指令使计算设备执行根据前述特征20至31中任一项所述的方法。
(特征33)一种媒体回放系统,包括:一个或多个处理器;以及根据特征32的有形的非暂时性计算机可读介质。
(特征34)一种方法,包括:接收内容的指示;基于接收到的指示来识别至少一种内容类型;从多个音乐服务中确定支持所述至少一种内容类型的至少一个音乐服务;基于支持所述至少一种内容类型的所述至少一个音乐服务,使得所述至少一个音乐服务发送与所述内容类型相关联的音频内容。
(特征35)根据特征34所述的方法,其中,通过网络麦克风设备来接收内容的指示。
(特征36)根据特征34或35所述的方法,其中,确定所述至少一个音乐服务包括确定与所述多个音乐服务中的所述至少一个音乐服务对应的置信度指标。
(特征37)根据特征34或35所述的方法,其中,确定所述至少一个音乐服务包括确定是否满足置信度水平条件。
(特征38)根据特征37所述的方法,其中,所述置信度指标基于对所述多个音乐服务中的音乐服务的访问的历史。
(特征39)根据特征38所述的方法,其中,所述置信度指标还基于使用特定音乐服务的特定位置。
(特征40)根据特征34至39中任一项所述的方法,还包括:接收内容的第二指示;基于接收到的指示来识别至少一种内容类型;确定所述多个音乐服务中没有一个音乐服务支持所述至少一种内容类型;以及使得错误状态被触发。
(特征41)根据前述特征34至40中任一项所述的方法,其中,所述内容类型选自包括艺术家、流派、歌曲、专辑和无线电台的组。
(特征42)根据前述特征34至41中任一项所述的方法,其中,确定所述至少一个音乐服务包括访问查找表,所述查找表包含所述多个流传输服务的可用内容的条目。
(特征43)根据前述特征24至42中任一项所述的方法,还包括仅查询所述多个音乐服务中用户注册过的音乐服务。
(特征44)根据前述特征34至43中任一项所述的方法,还包括在识别所述内容类型之后,向用户询问一个或多个问题以进一步指定在内容的初始指示中指示的所述内容类型;接收指示更具体的内容类型的进一步用户输入;以及基于所述更具体的内容类型确定所述一个或多个音乐服务。
(特征45)一种网络设备,包括:网络接口,被配置为通过网络与多个联网设备通信;包括指令的处理器,所述指令在被执行时使得所述处理器执行根据前述特征34至44中任一项所述的方法。
(特征46)一种计算机可读存储介质,包括用于由处理器执行的指令,所述指令在被执行时使得所述处理器实现根据特征34至44中任一项的方法。
VIII.结论
以上描述公开了各种示例系统、方法、装置和包括在硬件上执行的固件和/或软件等组件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
本文公开的方法和其他过程可以包括一个或多个操作、功能或动作。尽管以连续顺序示出了各个框,但是这些框也可以并行执行,和/或以与本文描述的顺序不同的顺序执行。而且,根据所需的实现,可以将各个框组合成更少的框,分成更多的框,和/或移除框。
另外,对于本文公开的方法和其他过程和方法,流程图示出了本实施例的一种可能实现的功能和操作。在这方面,每个框可以表示模块、段或程序代码的一部分,其包括可由处理器执行以实现过程中的特定逻辑功能或步骤的一个或多个指令。程序代码可以存储在任何类型的计算机可读介质上,例如,包括磁盘或硬盘驱动器的存储设备。计算机可读介质可以包括非暂时性计算机可读介质,例如,短时间存储数据的计算机可读介质,如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)。计算机可读介质还可以包括非暂时性介质,例如,辅存或持久性长期存储设备,如只读存储器(ROM)、光盘或磁盘、紧凑盘只读存储器(CD-ROM)。计算机可读介质还可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是计算机可读存储介质,例如有形的存储设备。另外,图中的每个框可以表示被硬连线以执行过程中的特定逻辑功能的电路。
此外,本文对“实施例”的提及意味着结合实施例描述的特定特征、结构或特性可以包括在本发明的至少一个示例性实施例中。在说明书中各处出现该短语不一定都指代相同的实施例,也不是与其他实施例互斥的分离的或备选的实施例。因此,本领域技术人员应当显式地和隐式地理解的是,本文所描述的实施例可以与其他实施例组合。
主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦合到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
当随附的任一项权利要求被理解成涵盖纯软件和/或固件的实现时,在此明确限定至少一个示例中的至少一个单元以包括存储软件和/或固件的非暂时性有形介质,如存储器、DVD、CD、蓝光等。
Claims (32)
1.一种用于计算设备的方法,所述方法包括:
接收语音输入,所述语音输入包括:
命令字,
一个或多个媒体变量实例,以及
一个或多个区域变量实例;
确定所述语音输入对应于音乐控制;
确定对应于所述命令字的媒体回放系统命令,其中,基于对应于音乐控制的可用命令来确定对应于所述命令字的所述媒体回放系统命令;
由所述计算设备识别对应于所述一个或多个媒体变量实例的媒体内容;以及
使得媒体回放系统基于所述一个或多个区域变量实例对所述媒体内容执行所述媒体回放系统命令。
2.根据权利要求1所述的方法,还包括:
从所识别的媒体内容中确定一个或多个媒体项;以及
发送指示所述一个或多个媒体项的网络存储位置的标识符。
3.根据权利要求1或2所述的方法,还包括:
基于所述命令字在第一位置来识别所述语音输入中的所述命令字;
基于所述一个或多个媒体变量实例在第二位置来识别所述语音输入中的所述一个或多个媒体变量实例;以及
基于所述一个或多个区域变量实例在第三位置来识别所述语音输入中的所述一个或多个区域变量实例。
4.根据权利要求1或2所述的方法,其中,确定对应于所述命令字的所述媒体回放系统命令包括:
确定对应于所述命令字的意图;以及
确定对应于所述意图的所述媒体回放系统命令。
5.根据权利要求1或2所述的方法,其中,接收到的语音输入的所述一个或多个区域变量实例指示媒体回放系统的一个或多个区域,所述一个或多个区域包括一个或多个回放设备。
6.根据权利要求1或2所述的方法,其中,使得所述媒体回放系统对所述媒体内容执行所述媒体回放系统命令包括:
从所述计算设备向所述媒体回放系统发送消息,所述消息包括:
识别所述媒体回放系统命令的命令信息,
识别对应于所述一个或多个媒体变量实例的媒体内容的媒体信息;以及
对应于所述一个或多个区域变量实例的一个或多个区域标识符。
7.根据权利要求1或2所述的方法,其中,接收到的一个或多个媒体变量实例包括媒体内容的指示,所述方法还包括:
基于接收到的指示来识别至少一种内容类型;
从多个音乐服务中确定支持所述至少一种内容类型的至少一个音乐服务;
基于支持所述至少一种内容类型的所述至少一个音乐服务,使得所述至少一个音乐服务发送与所述内容类型相关联的音频内容。
8.根据权利要求7所述的方法,其中,通过网络麦克风设备来接收内容的指示。
9.根据权利要求7所述的方法,其中,确定所述至少一个音乐服务包括以下至少一个:
确定与所述多个音乐服务中的所述至少一个音乐服务相对应的置信度指标;以及
确定所述至少一个音乐服务包括确定是否满足置信度水平条件。
10.根据权利要求9所述的方法,其中,所述置信度指标基于以下至少一个:
对所述多个音乐服务中的音乐服务的访问的历史;以及
使用特定音乐服务的特定位置。
11.根据权利要求7所述的方法,还包括:
接收内容的第二指示;
基于接收到的指示来识别至少一种内容类型;以及
当确定所述多个音乐服务中没有一个音乐服务支持所述至少一种内容类型时,使得错误状态被触发。
12.根据权利要求7所述的方法,其中,所述内容类型选自包括艺术家、流派、歌曲、专辑和无线电台的组。
13.根据权利要求7所述的方法,其中,确定所述至少一个音乐服务包括访问查找表,所述查找表包含多个流传输服务的可用内容的条目。
14.根据权利要求7所述的方法,还包括仅查询所述多个音乐服务中用户注册过的音乐服务。
15.根据权利要求7所述的方法,还包括在识别所述内容类型之后,
向用户询问一个或多个问题以进一步指定在内容的初始指示中指示的所述内容类型;
接收指示更具体的内容类型的进一步用户输入;以及
基于所述更具体的内容类型确定所述一个或多个音乐服务。
16.根据权利要求1或2所述的方法,还包括:
确定是否是从所述媒体回放系统的注册用户接收到所述语音输入;以及
当确定是从注册用户接收到所述语音输入时,进一步基于所述注册用户的用户简档中的信息来确定所述媒体回放系统命令。
17.根据权利要求16所述的方法,其中,所述媒体回放系统命令指示所述媒体回放系统从所述注册用户的偏好媒体源获得所述媒体内容。
18.根据权利要求16所述的方法,其中,所述媒体回放系统命令包括用于以下操作的指令:
将所述媒体回放系统配置有所述注册用户的偏好回放设置中的一个或多个偏好回放设置;以及
使得所述媒体回放系统通过所述媒体回放系统按照所述注册用户的偏好回放设置来播放所述媒体内容。
19.根据权利要求18所述的方法,其中,所述注册用户的偏好回放设置包括以下中的一个或多个:
偏好回放音量,以及
偏好音频均衡设置。
20.根据权利要求16所述的方法,还包括:
接收指示所述媒体回放系统修改回放设置的第二语音输入,以及
确定媒体回放系统命令,所述媒体回放系统命令指示所述媒体回放系统修改所述媒体回放系统的一个或多个媒体回放设备的回放设置。
21.根据权利要求16所述的方法,还包括:
如果并非是从注册用户接收到所述语音输入,则确定是否是从访客用户接收到所述语音输入;以及
如果是从访客用户接收到所述语音输入,则:
为所述访客用户分配约束设置;
基于来自所述语音输入的内容以及为所述访客用户分配的约束设置,配置用于所述媒体回放系统的指令;以及
向所述媒体回放系统发送所述指令。
22.根据权利要求16所述的方法,还包括:向所述媒体回放系统的一个或多个回放设备发送所述媒体回放系统命令;其中,所述媒体回放系统命令使得所述媒体回放系统通过所述媒体回放系统的一个或多个媒体回放设备来播放所述媒体内容。
23.根据权利要求1或2所述的方法,还包括:
获得回放设备所处环境的声学特性;
识别所述回放设备的环境中的网络麦克风设备;
向所述网络麦克风设备提供所述声学特性;以及
由所述网络麦克风设备将所述声学特性应用于所述网络麦克风设备接收的语音输入。
24.根据权利要求23所述的方法,其中,在校准阶段中获得所述环境的所述声学特性,在所述校准阶段中:
一个或多个回放设备输出一个或多个音调,
所述网络麦克风设备接收所述一个或多个回放设备输出的音调;以及
分析接收到的音调以确定所述环境的所述声学特性。
25.根据权利要求23所述的方法,还包括:
向所述网络麦克风设备提供由所述回放设备在所述环境中回放的音频内容;
由所述麦克风设备将所提供的音频内容应用于所述网络麦克风设备接收的语音输入。
26.根据权利要求23所述的方法,其中,所识别的网络麦克风设备处于以下中的至少一种情形:
被绑定到所述回放设备;以及
和所述回放设备在同一区域中。
27.根据权利要求23所述的方法,其中,向所述麦克风设备发送所述声学特性的所述回放设备是所述媒体回放系统中的多个回放设备中最靠近所述麦克风设备的回放设备。
28.根据权利要求23所述的方法,还包括:
从所述网络麦克风设备接收对所述语音输入的方向的指示;以及
基于接收到的对所述语音输入的方向的指示,调整所述回放没备播放的音频内容的方向性。
29.根据权利要求23所述的方法,其中,使得所述网络麦克风设备将所述声学特性应用于所述网络麦克风设备接收的语音输入包括:使得所述回放设备将基于所述声学特性的滤波器应用于接收到的语音输入。
30.根据权利要求23所述的方法,其中,向所述麦克风设备提供所述声学特性包括以下中的一个:
将所述声学特性作为消息发送到所述麦克风设备;以及
为所述麦克风设备提供对所述声学特性的访问权。
31.一种存储指令的有形的非暂时性计算机可读介质,所述指令当被计算设备的一个或多个处理器执行时,使得所述计算设备执行前述任一项权利要求所述的方法。
32.一种计算设备,包括:
一个或多个处理器;
存储指令的存储器,所述指令在被所述一个或多个处理器执行时,使得所述计算设备执行权利要求1至30中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010302650.7A CN111479196B (zh) | 2016-02-22 | 2017-02-21 | 媒体回放系统的语音控制方法 |
Applications Claiming Priority (27)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662298350P | 2016-02-22 | 2016-02-22 | |
US201662298388P | 2016-02-22 | 2016-02-22 | |
US201662298410P | 2016-02-22 | 2016-02-22 | |
US201662298433P | 2016-02-22 | 2016-02-22 | |
US201662298418P | 2016-02-22 | 2016-02-22 | |
US201662298393P | 2016-02-22 | 2016-02-22 | |
US201662298439P | 2016-02-22 | 2016-02-22 | |
US201662298425P | 2016-02-22 | 2016-02-22 | |
US62/298,393 | 2016-02-22 | ||
US62/298,410 | 2016-02-22 | ||
US62/298,425 | 2016-02-22 | ||
US62/298,439 | 2016-02-22 | ||
US62/298,388 | 2016-02-22 | ||
US62/298,350 | 2016-02-22 | ||
US62/298,433 | 2016-02-22 | ||
US62/298,418 | 2016-02-22 | ||
US201662312350P | 2016-03-23 | 2016-03-23 | |
US62/312,350 | 2016-03-23 | ||
US15/098,805 | 2016-04-14 | ||
US15/098,718 | 2016-04-14 | ||
US15/098,805 US9772817B2 (en) | 2016-02-22 | 2016-04-14 | Room-corrected voice detection |
US15/098,718 US10097919B2 (en) | 2016-02-22 | 2016-04-14 | Music service selection |
US15/131,776 | 2016-04-18 | ||
US15/131,776 US9965247B2 (en) | 2016-02-22 | 2016-04-18 | Voice controlled media playback system based on user profile |
US15/223,218 US9947316B2 (en) | 2016-02-22 | 2016-07-29 | Voice control of a media playback system |
US15/223,218 | 2016-07-29 | ||
PCT/US2017/018739 WO2017147081A1 (en) | 2016-02-22 | 2017-02-21 | Voice control of a media playback system |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010302650.7A Division CN111479196B (zh) | 2016-02-22 | 2017-02-21 | 媒体回放系统的语音控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109076284A CN109076284A (zh) | 2018-12-21 |
CN109076284B true CN109076284B (zh) | 2020-05-12 |
Family
ID=59629393
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780025029.7A Active CN109076285B (zh) | 2016-02-22 | 2017-02-21 | 音频响应回放 |
CN202010302650.7A Active CN111479196B (zh) | 2016-02-22 | 2017-02-21 | 媒体回放系统的语音控制方法 |
CN201780025028.2A Active CN109076284B (zh) | 2016-02-22 | 2017-02-21 | 媒体回放系统的语音控制 |
CN202010179593.8A Active CN111510821B (zh) | 2016-02-22 | 2017-02-21 | 音频响应回放 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780025029.7A Active CN109076285B (zh) | 2016-02-22 | 2017-02-21 | 音频响应回放 |
CN202010302650.7A Active CN111479196B (zh) | 2016-02-22 | 2017-02-21 | 媒体回放系统的语音控制方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010179593.8A Active CN111510821B (zh) | 2016-02-22 | 2017-02-21 | 音频响应回放 |
Country Status (8)
Country | Link |
---|---|
US (20) | US10743101B2 (zh) |
EP (4) | EP3974957A1 (zh) |
JP (7) | JP6511590B1 (zh) |
KR (9) | KR20210035351A (zh) |
CN (4) | CN109076285B (zh) |
AU (11) | AU2017223395B2 (zh) |
CA (2) | CA3015491C (zh) |
WO (2) | WO2017147075A1 (zh) |
Families Citing this family (397)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11467856B2 (en) | 2002-12-12 | 2022-10-11 | Flexiworld Technologies, Inc. | Portable USB device for internet access service |
US10915296B2 (en) | 2000-11-01 | 2021-02-09 | Flexiworld Technologies, Inc. | Information apparatus that includes a touch sensitive screen interface for managing or replying to e-mails |
US11204729B2 (en) | 2000-11-01 | 2021-12-21 | Flexiworld Technologies, Inc. | Internet based digital content services for pervasively providing protected digital content to smart devices based on having subscribed to the digital content service |
AU2002226948A1 (en) | 2000-11-20 | 2002-06-03 | Flexiworld Technologies, Inc. | Tobile and pervasive output components |
US20020097419A1 (en) * | 2001-01-19 | 2002-07-25 | Chang William Ho | Information apparatus for universal data output |
US7908401B2 (en) | 2002-12-12 | 2011-03-15 | Flexiworld Technology, Inc. | Method and device for wireless communication between computing devices |
CN101208657B (zh) | 2003-04-11 | 2017-11-14 | 富意科技 | 一种便携式集成电路存储设备及其运行方法 |
US10972536B2 (en) | 2004-06-04 | 2021-04-06 | Apple Inc. | System and method for synchronizing media presentation at multiple recipients |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US8689128B2 (en) | 2009-03-16 | 2014-04-01 | Apple Inc. | Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10706096B2 (en) | 2011-08-18 | 2020-07-07 | Apple Inc. | Management of local and remote media items |
US9002322B2 (en) | 2011-09-29 | 2015-04-07 | Apple Inc. | Authentication with secondary approver |
US9654821B2 (en) | 2011-12-30 | 2017-05-16 | Sonos, Inc. | Systems and methods for networked music playback |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
CN113470641B (zh) | 2013-02-07 | 2023-12-15 | 苹果公司 | 数字助理的语音触发器 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014143776A2 (en) | 2013-03-15 | 2014-09-18 | Bodhi Technology Ventures Llc | Providing remote interactions with host device using a wireless device |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9247363B2 (en) | 2013-04-16 | 2016-01-26 | Sonos, Inc. | Playback queue transfer in a media playback system |
US9361371B2 (en) | 2013-04-16 | 2016-06-07 | Sonos, Inc. | Playlist update in a media playback system |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
EP4365725A3 (en) | 2014-05-30 | 2024-07-17 | Apple Inc. | Continuity |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10339293B2 (en) | 2014-08-15 | 2019-07-02 | Apple Inc. | Authenticated device used to unlock another device |
US9521497B2 (en) | 2014-08-21 | 2016-12-13 | Google Technology Holdings LLC | Systems and methods for equalizing audio for playback on an electronic device |
US10552009B2 (en) | 2014-09-02 | 2020-02-04 | Apple Inc. | Stopwatch and timer user interfaces |
CN110072131A (zh) | 2014-09-02 | 2019-07-30 | 苹果公司 | 音乐用户界面 |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9329831B1 (en) | 2015-02-25 | 2016-05-03 | Sonos, Inc. | Playback expansion |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10001965B1 (en) | 2015-09-03 | 2018-06-19 | Sonos, Inc. | Playback system join with base |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10743101B2 (en) * | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US10097939B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Compensation for speaker nonlinearities |
US20190057703A1 (en) * | 2016-02-29 | 2019-02-21 | Faraday&Future Inc. | Voice assistance system for devices of an ecosystem |
CN109076271B (zh) * | 2016-03-30 | 2021-08-03 | 惠普发展公司,有限责任合伙企业 | 用于指示个人辅助应用的状态的指示器 |
DK179186B1 (en) | 2016-05-19 | 2018-01-15 | Apple Inc | REMOTE AUTHORIZATION TO CONTINUE WITH AN ACTION |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US20220043986A1 (en) * | 2016-06-09 | 2022-02-10 | Apple Inc. | Intelligent automated assistant in a home environment |
DK179309B1 (en) * | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK201670622A1 (en) | 2016-06-12 | 2018-02-12 | Apple Inc | User interfaces for transactions |
US10091545B1 (en) * | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
EP3264802A1 (en) * | 2016-06-30 | 2018-01-03 | Nokia Technologies Oy | Spatial audio processing for moving sound sources |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US11188289B2 (en) * | 2016-07-29 | 2021-11-30 | Hewlett-Packard Development Company, L.P. | Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10492156B2 (en) * | 2016-08-31 | 2019-11-26 | Inizio Capital Llc | Dynamic direct multinode (DDM) wireless network |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US9794720B1 (en) | 2016-09-22 | 2017-10-17 | Sonos, Inc. | Acoustic position measurement |
US10043516B2 (en) * | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
CN106656689B (zh) * | 2016-10-17 | 2018-10-30 | 珠海格力电器股份有限公司 | 一种基于终端的智能家居的控制方法和终端 |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10127908B1 (en) * | 2016-11-11 | 2018-11-13 | Amazon Technologies, Inc. | Connected accessory for a voice-controlled device |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11430434B1 (en) * | 2017-02-15 | 2022-08-30 | Amazon Technologies, Inc. | Intelligent privacy protection mediation |
WO2018163378A1 (ja) * | 2017-03-09 | 2018-09-13 | ヤマハ株式会社 | 操作装置、コマンド処理装置、及びコンテンツ再生システム |
WO2018168200A1 (ja) * | 2017-03-13 | 2018-09-20 | ソニー株式会社 | 端末装置及び通信方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
CN107015781B (zh) * | 2017-03-28 | 2021-02-19 | 联想(北京)有限公司 | 语音识别方法和系统 |
US10147439B1 (en) * | 2017-03-30 | 2018-12-04 | Amazon Technologies, Inc. | Volume adjustment for listening environment |
TWI689865B (zh) * | 2017-04-28 | 2020-04-01 | 塞席爾商元鼎音訊股份有限公司 | 智慧語音系統、語音輸出調整之方法及電腦可讀取記憶媒體 |
US11431836B2 (en) | 2017-05-02 | 2022-08-30 | Apple Inc. | Methods and interfaces for initiating media playback |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US12123200B2 (en) | 2019-02-27 | 2024-10-22 | Louisiana-Pacific Corp. | Fire-resistant manufactured-wood based siding |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20220279063A1 (en) | 2017-05-16 | 2022-09-01 | Apple Inc. | Methods and interfaces for home media control |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
AU2018203023B2 (en) * | 2017-05-16 | 2019-09-19 | Apple Inc. | Transferring playback queues between devices |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
EP3593538B1 (en) | 2017-05-16 | 2021-12-08 | Apple Inc. | Credential delegation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
CN111343060B (zh) | 2017-05-16 | 2022-02-11 | 苹果公司 | 用于家庭媒体控制的方法和界面 |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10564928B2 (en) * | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10847163B2 (en) * | 2017-06-20 | 2020-11-24 | Lenovo (Singapore) Pte. Ltd. | Provide output reponsive to proximate user input |
US10038419B1 (en) | 2017-07-06 | 2018-07-31 | Bose Corporation | Last mile equalization |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US20190061336A1 (en) * | 2017-08-29 | 2019-02-28 | Xyzprinting, Inc. | Three-dimensional printing method and three-dimensional printing apparatus using the same |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10438594B2 (en) * | 2017-09-08 | 2019-10-08 | Amazon Technologies, Inc. | Administration of privileges by speech for voice assistant system |
US10902847B2 (en) * | 2017-09-12 | 2021-01-26 | Spotify Ab | System and method for assessing and correcting potential underserved content in natural language understanding applications |
US10475454B2 (en) * | 2017-09-18 | 2019-11-12 | Motorola Mobility Llc | Directional display and audio broadcast |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10985982B2 (en) * | 2017-09-27 | 2021-04-20 | Sonos, Inc. | Proximal playback devices |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10545720B2 (en) | 2017-09-29 | 2020-01-28 | Spotify Ab | Automatically generated media preview |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10748533B2 (en) | 2017-11-08 | 2020-08-18 | Harman International Industries, Incorporated | Proximity aware voice agent |
US10458840B2 (en) * | 2017-11-08 | 2019-10-29 | Harman International Industries, Incorporated | Location classification for intelligent personal assistant |
CN107895016B (zh) * | 2017-11-14 | 2022-02-15 | 百度在线网络技术(北京)有限公司 | 一种播放多媒体的方法和装置 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10797670B2 (en) * | 2017-12-04 | 2020-10-06 | Lutron Technology Company, LLC | Audio device with dynamically responsive volume |
KR102527278B1 (ko) * | 2017-12-04 | 2023-04-28 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
US11182122B2 (en) * | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
EP4343550A1 (en) * | 2017-12-08 | 2024-03-27 | Google Llc | Content source allocation between computing devices |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
KR102502319B1 (ko) * | 2017-12-12 | 2023-02-21 | 로비 가이드스, 인크. | 미디어 자산의 재생과 관련 없는 구두 명령에 응답하여 미디어 자산의 재생을 수정하기 위한 시스템 및 방법 |
EP3729770B1 (en) * | 2017-12-22 | 2022-07-20 | British Telecommunications public limited company | Managing streamed audio communication sessions |
CN107845388B (zh) * | 2017-12-25 | 2021-06-01 | 青岛海信移动通信技术股份有限公司 | 语音识别方法及装置 |
US10937431B2 (en) | 2017-12-27 | 2021-03-02 | Rovi Guides, Inc. | Systems and methods for identifying users based on voice data and media consumption data |
CN108124510B (zh) * | 2017-12-29 | 2020-06-30 | 深圳市名宗科技有限公司 | 一种无线配对系统及配对方法 |
CN111357048B (zh) * | 2017-12-31 | 2024-10-08 | 美的集团股份有限公司 | 用于控制家庭助手装置的方法和系统 |
US10887387B2 (en) * | 2018-01-05 | 2021-01-05 | Barrett Adams | Digital media synchronization system and method |
EP3776880A4 (en) * | 2018-01-08 | 2022-06-22 | Polk Audio, LLC | SYNCHRONIZED VOICE CONTROL MODULE, SPEAKER SYSTEM AND METHOD OF INCORPORATING VC FUNCTIONALITY INTO A SEPARATE SPEAKER SYSTEM |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US20190235831A1 (en) * | 2018-01-31 | 2019-08-01 | Amazon Technologies, Inc. | User input processing restriction in a speech processing system |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US11343614B2 (en) * | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US10157042B1 (en) * | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US11087752B2 (en) * | 2018-03-07 | 2021-08-10 | Google Llc | Systems and methods for voice-based initiation of custom device actions |
CN110574105B (zh) | 2018-03-07 | 2024-01-23 | 谷歌有限责任公司 | 用于基于语音发起定制装置动作的系统和方法 |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
CN108600911B (zh) * | 2018-03-30 | 2021-05-18 | 联想(北京)有限公司 | 一种输出方法及电子设备 |
US10993274B2 (en) | 2018-03-30 | 2021-04-27 | Apple Inc. | Pairing devices by proxy |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
CN108566634B (zh) * | 2018-03-30 | 2021-06-25 | 深圳市冠旭电子股份有限公司 | 降低蓝牙音箱连续唤醒延时的方法、装置及蓝牙音箱 |
US11297369B2 (en) | 2018-03-30 | 2022-04-05 | Apple Inc. | Remotely controlling playback devices |
US10832537B2 (en) * | 2018-04-04 | 2020-11-10 | Cirrus Logic, Inc. | Methods and apparatus for outputting a haptic signal to a haptic transducer |
CN118102037A (zh) | 2018-05-07 | 2024-05-28 | 苹果公司 | 用于查看实况视频馈送和录制视频的用户界面 |
US11308947B2 (en) | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10803864B2 (en) * | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
KR20210002109A (ko) * | 2018-05-25 | 2021-01-06 | 삼성전자주식회사 | 지능형 응답을 제공하는 방법 및 장치 |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
JP2021144065A (ja) | 2018-06-12 | 2021-09-24 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
KR102580521B1 (ko) * | 2018-07-13 | 2023-09-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음량 조절 방법 |
US11841854B2 (en) | 2018-07-24 | 2023-12-12 | MachEye, Inc. | Differentiation of search results for accurate query output |
US11282020B2 (en) * | 2018-07-24 | 2022-03-22 | MachEye, Inc. | Dynamic playback of synchronized narrated analytics playlists |
US11816436B2 (en) | 2018-07-24 | 2023-11-14 | MachEye, Inc. | Automated summarization of extracted insight data |
US11341126B2 (en) | 2018-07-24 | 2022-05-24 | MachEye, Inc. | Modifying a scope of a canonical query |
US11853107B2 (en) | 2018-07-24 | 2023-12-26 | MachEye, Inc. | Dynamic phase generation and resource load reduction for a query |
US11651043B2 (en) * | 2018-07-24 | 2023-05-16 | MachEye, Inc. | Leveraging analytics across disparate computing devices |
CN112272846A (zh) * | 2018-08-21 | 2021-01-26 | 谷歌有限责任公司 | 用于调用自动助理的动态的和/或特定于场境的热词 |
US20200168317A1 (en) | 2018-08-22 | 2020-05-28 | Centre For Addiction And Mental Health | Tool for assisting individuals experiencing auditory hallucinations to differentiate between hallucinations and ambient sounds |
US11206484B2 (en) * | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
CN109147800A (zh) | 2018-08-30 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 应答方法和装置 |
KR102575697B1 (ko) * | 2018-09-06 | 2023-09-06 | 주식회사 케이티 | 음향을 제어하는 공용 단말, 방법 및 컴퓨터 프로그램 |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
CN109117052A (zh) * | 2018-09-21 | 2019-01-01 | 深圳市二八智能家居有限公司 | 多区域音乐播放的控制方法及装置 |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11152003B2 (en) * | 2018-09-27 | 2021-10-19 | International Business Machines Corporation | Routing voice commands to virtual assistants |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11423920B2 (en) * | 2018-09-28 | 2022-08-23 | Rovi Guides, Inc. | Methods and systems for suppressing vocal tracks |
US10871815B2 (en) | 2018-09-28 | 2020-12-22 | Sonos, Inc. | Network identification of portable electronic devices while changing power states |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
GB2577879B (en) * | 2018-10-08 | 2022-08-24 | B & W Group Ltd | Content playback system |
US11416209B2 (en) | 2018-10-15 | 2022-08-16 | Sonos, Inc. | Distributed synchronization |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US10833886B2 (en) * | 2018-11-07 | 2020-11-10 | International Business Machines Corporation | Optimal device selection for streaming content |
DE102018128162A1 (de) * | 2018-11-12 | 2020-05-14 | Sennheiser Electronic Gmbh & Co. Kg | Verfahren zum Empfangen von Audiodatenströmen mit Mobilgeräten und entsprechend konfiguriertes Mobilgerät |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US10958698B2 (en) * | 2018-11-16 | 2021-03-23 | Spotify Ab | Responding to ambiguous play requests |
GB2579554A (en) | 2018-12-03 | 2020-07-01 | Audiogum Uk Ltd | Content playback system |
US20220053236A1 (en) * | 2018-12-06 | 2022-02-17 | D&M Holdings, Inc. | Virtual Media Service |
US11183183B2 (en) * | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11393478B2 (en) * | 2018-12-12 | 2022-07-19 | Sonos, Inc. | User specific context switching |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11079916B2 (en) * | 2019-01-14 | 2021-08-03 | Microsoft Technology Licensing, Llc | Multiple source media management |
CA3126937A1 (en) | 2019-01-18 | 2020-07-23 | Sonos, Inc. | Power management techniques for waking-up processors in media playback systems |
US11740854B2 (en) * | 2019-01-20 | 2023-08-29 | Sonos, Inc. | Playing media content in response to detecting items having corresponding media content associated therewith |
KR20200092763A (ko) * | 2019-01-25 | 2020-08-04 | 삼성전자주식회사 | 사용자 음성을 처리하는 전자장치 및 그 제어 방법 |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10694309B1 (en) | 2019-02-12 | 2020-06-23 | Sonos, Inc. | Systems and methods for authenticating and calibrating passive speakers with a graphical user interface |
USD994694S1 (en) | 2019-02-13 | 2023-08-08 | Sonos, Inc. | Display screen or portion thereof with graphical user interface for podcasts |
USD902234S1 (en) | 2019-02-13 | 2020-11-17 | Sonos, Inc. | Display screen or portion thereof with graphical user interface for podcasts |
US20200280800A1 (en) | 2019-02-28 | 2020-09-03 | Sonos, Inc. | Playback Transitions |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN110069657A (zh) * | 2019-04-30 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐点播方法、装置及终端 |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11544463B2 (en) | 2019-05-09 | 2023-01-03 | Intel Corporation | Time asynchronous spoken intent detection |
US11170774B2 (en) * | 2019-05-21 | 2021-11-09 | Qualcomm Incorproated | Virtual assistant device |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
GB2597009B (en) * | 2019-05-22 | 2023-01-25 | Solos Tech Limited | Microphone configurations for eyewear devices, systems, apparatuses, and methods |
JP7335979B2 (ja) * | 2019-05-24 | 2023-08-30 | エルジー エレクトロニクス インコーポレイティド | 音声認識を用いて装置を制御する方法、及びこれを具現する装置 |
US11363382B2 (en) * | 2019-05-31 | 2022-06-14 | Apple Inc. | Methods and user interfaces for audio synchronization |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970533A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Methods and user interfaces for sharing audio |
US10904029B2 (en) | 2019-05-31 | 2021-01-26 | Apple Inc. | User interfaces for managing controllable external devices |
US10867608B1 (en) * | 2019-05-31 | 2020-12-15 | Apple Inc. | Multi-user configuration |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
CN115562613A (zh) | 2019-05-31 | 2023-01-03 | 苹果公司 | 用于音频媒体控件的用户界面 |
US10996917B2 (en) | 2019-05-31 | 2021-05-04 | Apple Inc. | User interfaces for audio media control |
US11363071B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User interfaces for managing a local network |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
CN112017650B (zh) * | 2019-05-31 | 2024-05-24 | 百度在线网络技术(北京)有限公司 | 电子设备的语音控制方法、装置、计算机设备和存储介质 |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
WO2020247811A1 (en) | 2019-06-07 | 2020-12-10 | Sonos, Inc. | Automatically allocating audio portions to playback devices |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
WO2021010884A1 (en) * | 2019-07-18 | 2021-01-21 | Dirac Research Ab | Intelligent audio control platform |
CA3148908A1 (en) * | 2019-07-29 | 2021-02-04 | Siemens Industry, Inc. | Building automation system for controlling conditions of a room |
US20220345820A1 (en) * | 2019-07-30 | 2022-10-27 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
US11968268B2 (en) | 2019-07-30 | 2024-04-23 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
KR20210015234A (ko) * | 2019-08-01 | 2021-02-10 | 삼성전자주식회사 | 전자 장치, 및 그의 음성 명령에 따른 기능이 실행되도록 제어하는 방법 |
EP4010781A1 (en) | 2019-08-09 | 2022-06-15 | Rajasekaran Ramasubramanian | Power management and distributed audio processing techniques for playback devices |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US11464055B2 (en) | 2019-09-04 | 2022-10-04 | Sonos, Inc. | Systems and methods for configuring a media player device on a local network using a graphical user interface |
KR20210031265A (ko) | 2019-09-11 | 2021-03-19 | 삼성전자주식회사 | 전자 장치 및 그 동작방법 |
US11483085B1 (en) * | 2019-09-16 | 2022-10-25 | Amazon Technologies, Inc. | Device time synchronization by networking device |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11551670B1 (en) | 2019-09-26 | 2023-01-10 | Sonos, Inc. | Systems and methods for generating labeled data to facilitate configuration of network microphone devices |
US11172328B2 (en) * | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11749265B2 (en) * | 2019-10-04 | 2023-09-05 | Disney Enterprises, Inc. | Techniques for incremental computer-based natural language understanding |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR102135859B1 (ko) * | 2019-10-24 | 2020-07-20 | 주식회사 유니온플레이스 | 개인화된 가상 비서를 제공하는 장치 |
US11636855B2 (en) | 2019-11-11 | 2023-04-25 | Sonos, Inc. | Media content based on operational data |
US11204737B2 (en) | 2019-11-11 | 2021-12-21 | Sonos, Inc. | Playback queues for shared experiences |
USD923656S1 (en) | 2019-11-11 | 2021-06-29 | Sonos, Inc. | Display screen or portion thereof with graphical user interface |
CN114730580A (zh) * | 2019-11-11 | 2022-07-08 | 苹果公司 | 基于时间段的精选播放列表的用户界面 |
US10891105B1 (en) | 2019-11-11 | 2021-01-12 | Sonos, Inc. | Systems and methods for displaying a transitional graphical user interface while loading media information for a networked media playback system |
WO2021112646A1 (ko) | 2019-12-06 | 2021-06-10 | 엘지전자 주식회사 | 무선 통신 시스템에서 근거리 무선 통신을 이용한 오디오 데이터 전송 방법 및 이에 대한 장치 |
US11089379B2 (en) * | 2019-12-11 | 2021-08-10 | Apple Inc. | Preload hinting for low latency HTTP live streaming system |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
CN110764484A (zh) * | 2019-12-24 | 2020-02-07 | 南京创维信息技术研究院有限公司 | 家庭设备控制系统 |
US11129011B2 (en) * | 2019-12-26 | 2021-09-21 | Process Integration System Inc. | System and method to detect and report to the authorities high level sounds that infringe the law |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11533116B2 (en) | 2020-03-19 | 2022-12-20 | Sonos, Inc. | Systems and methods for state detection via wireless radios |
CN111540350B (zh) * | 2020-03-31 | 2024-03-01 | 北京小米移动软件有限公司 | 一种智能语音控制设备的控制方法、装置及存储介质 |
US11483608B2 (en) | 2020-04-21 | 2022-10-25 | Sonos, Inc. | Priority media content |
US11729464B2 (en) | 2020-04-24 | 2023-08-15 | Capital One Services, Llc | Methods and systems for transition-coded media, measuring engagement of transition-coded media, and distribution of components of transition-coded media |
US11397967B2 (en) | 2020-04-24 | 2022-07-26 | Capital One Services, Llc | Methods and systems for transition-coded media, measuring engagement of transition-coded media, and distribution of components of transition-coded media |
US11540011B2 (en) | 2020-04-24 | 2022-12-27 | Capital One Services, Llc | Methods and systems for transition-coded media, measuring engagement of transition-coded media, and distribution of components of transition-coded media |
USD956593S1 (en) * | 2020-04-28 | 2022-07-05 | Vulcan, Inc. | Test station terminal |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11079913B1 (en) | 2020-05-11 | 2021-08-03 | Apple Inc. | User interface for status indicators |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11810578B2 (en) | 2020-05-11 | 2023-11-07 | Apple Inc. | Device arbitration for digital assistant-based intercom systems |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
CN113765754A (zh) * | 2020-06-02 | 2021-12-07 | 云米互联科技(广东)有限公司 | 音频同步播放方法、设备及计算机可读存储介质 |
USD954019S1 (en) | 2020-06-05 | 2022-06-07 | Sonos, Inc. | Headphone |
US20210399578A1 (en) | 2020-06-17 | 2021-12-23 | Sonos, Inc. | Wireless charger for playback devices |
CN111726681B (zh) * | 2020-06-19 | 2021-11-02 | 海信视像科技股份有限公司 | 一种音频输出设备的选择方法及显示设备 |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US20240298265A1 (en) | 2020-08-25 | 2024-09-05 | Sonos, Inc. | Smart Networking Techniques for Portable Playback Devices |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
KR102218201B1 (ko) * | 2020-09-01 | 2021-02-23 | 주식회사 비젼코스모 | 지능형 음향 시스템 장치 및 그 동작 방법 |
US11758326B2 (en) | 2020-09-09 | 2023-09-12 | Sonos, Inc. | Wearable audio device within a distributed audio playback system |
JP2023543796A (ja) | 2020-09-25 | 2023-10-18 | ソノズ インコーポレイテッド | 再生デバイスのためのインテリジェントセットアップ |
US11392291B2 (en) | 2020-09-25 | 2022-07-19 | Apple Inc. | Methods and interfaces for media control with dynamic feedback |
US20220101870A1 (en) * | 2020-09-29 | 2022-03-31 | Zinfanite Technologies, Inc. | Noise filtering and voice isolation device and method |
WO2022072154A1 (en) * | 2020-10-01 | 2022-04-07 | Arris Enterprises Llc | Controlling a media device to provide an improved sonic environment for the reception of a voice command |
USD991214S1 (en) | 2020-10-08 | 2023-07-04 | Sonos, Inc. | Headphone ear cushion attachment mechanism |
DE202021105460U1 (de) | 2020-10-08 | 2022-01-17 | Sonos, Inc. | Mechanismus zur Befestigung von Kopfhörer-Ohrpolstern |
US11694684B1 (en) * | 2020-11-10 | 2023-07-04 | Amazon Technologies, Inc. | Generation of computing functionality using devices |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11984124B2 (en) * | 2020-11-13 | 2024-05-14 | Apple Inc. | Speculative task flow execution |
CN112383757B (zh) * | 2020-11-16 | 2022-07-05 | 四川九洲空管科技有限责任公司 | 一种无人机综合监视数据多模式回放方法及系统 |
US11562748B2 (en) * | 2020-12-01 | 2023-01-24 | Google Llc | Detecting and suppressing commands in media that may trigger another automated assistant |
EP4256815A2 (en) * | 2020-12-03 | 2023-10-11 | Dolby Laboratories Licensing Corporation | Progressive calculation and application of rendering configurations for dynamic applications |
EP4231286A4 (en) * | 2020-12-11 | 2024-03-27 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE AND ASSOCIATED CONTROL METHOD |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
WO2022192143A1 (en) | 2021-03-08 | 2022-09-15 | Sonos, Inc. | Updating network configuration parameters |
EP4305517A1 (en) | 2021-03-08 | 2024-01-17 | Sonos Inc. | Off-lan experience for portables |
CA3223760A1 (en) | 2021-05-10 | 2022-11-17 | Won So | Audio encryption in a media playback system |
CA3223764A1 (en) | 2021-05-10 | 2022-11-17 | Brandon Wright | Managing content quality and related characteristics of a media playback system |
US11847378B2 (en) | 2021-06-06 | 2023-12-19 | Apple Inc. | User interfaces for audio routing |
US11960615B2 (en) | 2021-06-06 | 2024-04-16 | Apple Inc. | Methods and user interfaces for voice-based user profile management |
US11789691B2 (en) | 2021-06-16 | 2023-10-17 | Kyndryl, Inc. | Audio management for a priority computing device application |
US11599330B2 (en) | 2021-06-29 | 2023-03-07 | Blackberry Limited | Audio management for guests |
EP4402904A2 (en) | 2021-09-13 | 2024-07-24 | Sonos, Inc. | Techniques for flexible control of playback devices |
US11575758B1 (en) | 2021-09-13 | 2023-02-07 | Amazon Technologies, Inc. | Session-based device grouping |
US12021806B1 (en) | 2021-09-21 | 2024-06-25 | Apple Inc. | Intelligent message delivery |
US20240292167A1 (en) * | 2021-09-30 | 2024-08-29 | Sonos, Inc. | Spatial mapping of media playback system components |
US20230099144A1 (en) | 2021-09-30 | 2023-03-30 | Sonos, Inc. | Enabling and Disabling Microphones and Voice Assistants |
EP4409433A1 (en) | 2021-09-30 | 2024-08-07 | Sonos, Inc. | Media content search in connection with multiple media content services |
CN114822530A (zh) * | 2022-03-18 | 2022-07-29 | 深圳绿米联创科技有限公司 | 智能设备控制方法、装置、电子设备及存储介质 |
WO2024073428A1 (en) | 2022-09-26 | 2024-04-04 | Sonos, Inc. | Systems and methods for disturbance localization |
WO2024073415A1 (en) | 2022-09-27 | 2024-04-04 | Sonos, Inc. | Configurable multi-band home theater architecture |
WO2024073649A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Network handoff for portable playback devices |
WO2024073354A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Localization techniques for playback devices |
WO2024073651A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Method of configuring a portable playback device, corresponding playback device and playback system |
WO2024073647A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Voice disambiguation techniques in media playback systems |
US20240111483A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Dynamic Volume Control |
WO2024073297A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Generative audio playback via wearable playback devices |
US20240111486A1 (en) | 2022-09-30 | 2024-04-04 | Sonos, Inc. | Adjustable Mounting Assembly |
US11838582B1 (en) * | 2022-12-12 | 2023-12-05 | Google Llc | Media arbitration |
WO2024178362A1 (en) | 2023-02-24 | 2024-08-29 | Sonos, Inc. | Playback devices with dedicated high-frequency transducers |
WO2024186739A1 (en) | 2023-03-06 | 2024-09-12 | Sonos, Inc. | Sleep modes for plugged-in players |
WO2024206496A1 (en) | 2023-03-27 | 2024-10-03 | Sonos, Inc. | Adaptive streaming content selection for playback groups |
CN118708147A (zh) * | 2023-03-27 | 2024-09-27 | 华为技术有限公司 | 音频播放方法、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354721A (ja) * | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
JP2010141748A (ja) * | 2008-12-12 | 2010-06-24 | Yamaha Corp | 遠隔制御装置および遠隔制御システム |
Family Cites Families (1297)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US999715A (en) | 1911-05-31 | 1911-08-01 | Hans Gundersen | Flying-machine. |
US3014423A (en) | 1959-11-27 | 1961-12-26 | Jersey Prod Res Co | Apparatus for drilling boreholes with explosive charges |
JPS57116999U (zh) * | 1981-01-14 | 1982-07-20 | ||
JPS5988705U (ja) * | 1982-12-06 | 1984-06-15 | 株式会社明電舎 | 警報回路 |
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPS63301998A (ja) | 1987-06-02 | 1988-12-08 | 日本電気株式会社 | 音声認識応答装置 |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
DE69220342T2 (de) | 1991-12-20 | 1997-11-20 | Matsushita Electric Ind Co Ltd | Lautsprecherapparat zur Basswiedergabe |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
JPH0883091A (ja) | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5857172A (en) | 1995-07-31 | 1999-01-05 | Microsoft Corporation | Activation control of a speech recognizer through use of a pointing device |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
FR2739736B1 (fr) | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
IL142366A0 (en) | 1998-10-02 | 2002-03-10 | Ibm | Conversational browser and conversational systems |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US6243676B1 (en) | 1998-12-23 | 2001-06-05 | Openwave Systems Inc. | Searching and retrieving multimedia information |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
US6219645B1 (en) | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
EP1104968B1 (en) | 1999-12-03 | 2007-02-14 | Telefonaktiebolaget LM Ericsson (publ) | A method of simultaneously playing back audio files in two telephones |
KR20010054622A (ko) | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
AU2001231115A1 (en) | 2000-01-24 | 2001-07-31 | Zapmedia, Inc. | System and method for the distribution and sharing of media assets between mediaplayers devices |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
AU2001240986A1 (en) | 2000-02-18 | 2001-08-27 | Bridgeco Ag | Multi-portal bridge for providing network connectivity |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU4219601A (en) | 2000-03-31 | 2001-10-15 | Classwave Wireless Inc. | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
US8165867B1 (en) | 2000-09-15 | 2012-04-24 | Fish Robert D | Methods for translating a device command |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020054685A1 (en) | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US20020072816A1 (en) * | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US20020095294A1 (en) * | 2001-01-12 | 2002-07-18 | Rick Korfin | Voice user interface for controlling a consumer media data storage and playback device |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6885989B2 (en) | 2001-04-02 | 2005-04-26 | International Business Machines Corporation | Method and system for collaborative speech recognition for small-area network |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7756917B2 (en) | 2001-09-28 | 2010-07-13 | Baseline, Llc | Two wire communication apparatus and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
WO2003054686A2 (en) | 2001-12-17 | 2003-07-03 | Becomm Corporation | Method and system for synchronization of content rendering |
DE10163213A1 (de) * | 2001-12-21 | 2003-07-10 | Philips Intellectual Property | Verfahren zum Betrieb eines Spracherkennungssystems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
CA2476506A1 (en) | 2002-02-20 | 2003-08-28 | Meshnetworks, Inc. | A system and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
EP1510031A4 (en) | 2002-05-06 | 2009-02-04 | Syncronation Inc | LOCALIZED AUDIO NETWORKS AND ASSOCIATED DIGITAL TOOLS |
KR100966415B1 (ko) * | 2002-05-09 | 2010-06-28 | 넷스트림스 엘엘씨 | 오디오 네트워크 분산 시스템 |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
DE60210177T2 (de) | 2002-08-14 | 2006-12-28 | Sony Deutschland Gmbh | Bandbreitenorientierte Neukonfigurierung von drahtlosen Ad-Hoc-Netzen |
JP2004096520A (ja) | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
JP2004163590A (ja) | 2002-11-12 | 2004-06-10 | Denso Corp | 再生装置及びプログラム |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
CN100392723C (zh) | 2002-12-11 | 2008-06-04 | 索夫塔马克斯公司 | 在稳定性约束下使用独立分量分析的语音处理系统和方法 |
US7076428B2 (en) | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
KR100668297B1 (ko) | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US6823050B2 (en) | 2003-02-13 | 2004-11-23 | International Business Machines Corporation | System and method for interfacing with a personal telephony recorder |
KR100749456B1 (ko) | 2003-03-03 | 2007-08-14 | 에이오엘 엘엘씨 | 디지털 통신용 소스 오디오 식별자 |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
US7571014B1 (en) * | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US10613817B2 (en) * | 2003-07-28 | 2020-04-07 | Sonos, Inc. | Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group |
US8234395B2 (en) * | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
US20070071255A1 (en) | 2003-10-24 | 2007-03-29 | Koninklijke Philips Electronics N.V. | Adaptive Sound Reproduction |
JP4516527B2 (ja) | 2003-11-12 | 2010-08-04 | 本田技研工業株式会社 | 音声認識装置 |
US7705565B2 (en) | 2003-12-31 | 2010-04-27 | Motorola, Inc. | Method and system for wireless charging |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US9374607B2 (en) | 2012-06-26 | 2016-06-21 | Sonos, Inc. | Media playback system with guest access |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
DE102004000043A1 (de) | 2004-11-17 | 2006-05-24 | Siemens Ag | Verfahren zur selektiven Aufnahme eines Schallsignals |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
US8396213B2 (en) | 2005-01-21 | 2013-03-12 | Certicom Corp. | Elliptic curve random number generation |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
WO2006111370A1 (en) | 2005-04-19 | 2006-10-26 | Epfl (Ecole Polytechnique Federale De Lausanne) | A method and device for removing echo in a multi-channel audio signal |
EP1715669A1 (en) | 2005-04-19 | 2006-10-25 | Ecole Polytechnique Federale De Lausanne (Epfl) | A method for removing echo in an audio signal |
US7720684B2 (en) | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
CN101233783B (zh) | 2005-07-29 | 2011-12-21 | 松下电器产业株式会社 | 扬声器装置 |
CN1909625A (zh) * | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
US7904300B2 (en) | 2005-08-10 | 2011-03-08 | Nuance Communications, Inc. | Supporting multiple speech enabled user interface consoles within a motor vehicle |
EP1934828A4 (en) | 2005-08-19 | 2008-10-08 | Gracenote Inc | METHOD AND SYSTEM FOR MANAGING THE OPERATION OF A REPRODUCTION DEVICE |
US20070060054A1 (en) * | 2005-09-15 | 2007-03-15 | Sony Ericsson Mobile Communications Ab | Wireless home communication system method and apparatus |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
US20080253589A1 (en) | 2005-09-21 | 2008-10-16 | Koninklijke Philips Electronics N.V. | Ultrasound Imaging System with Voice Activated Controls Using Remotely Positioned Microphone |
WO2007051493A1 (en) | 2005-11-07 | 2007-05-10 | Telecom Italia S.P.A. | Method for managing a conference call in a telephone network |
EP1971183A1 (en) | 2005-11-15 | 2008-09-17 | Yamaha Corporation | Teleconference device and sound emission/collection device |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
JP4422692B2 (ja) | 2006-03-03 | 2010-02-24 | 日本電信電話株式会社 | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
US8284982B2 (en) | 2006-03-06 | 2012-10-09 | Induction Speaker Technology, Llc | Positionally sequenced loudspeaker system |
CN101467142A (zh) | 2006-04-04 | 2009-06-24 | 约翰逊控制技术公司 | 在车辆中从数字媒体存储设备提取元数据以用于媒体选择的系统和方法 |
EP1848243B1 (en) | 2006-04-18 | 2009-02-18 | Harman/Becker Automotive Systems GmbH | Multi-channel echo compensation system and method |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
ATE436151T1 (de) | 2006-05-10 | 2009-07-15 | Harman Becker Automotive Sys | Kompensation von mehrkanalechos durch dekorrelation |
US8041057B2 (en) * | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP4984683B2 (ja) | 2006-06-29 | 2012-07-25 | ヤマハ株式会社 | 放収音装置 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US8189765B2 (en) | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US20080031475A1 (en) | 2006-07-08 | 2008-02-07 | Personics Holdings Inc. | Personal audio assistant device and method |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
EP2050304B1 (en) | 2006-08-10 | 2018-10-24 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
EP2080272B1 (en) | 2006-10-17 | 2019-08-21 | D&M Holdings, Inc. | Unification of multimedia devices |
US8391501B2 (en) * | 2006-12-13 | 2013-03-05 | Motorola Mobility Llc | Method and apparatus for mixing priority and non-priority audio signals |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
US7973857B2 (en) | 2006-12-27 | 2011-07-05 | Nokia Corporation | Teleconference group formation using context information |
US20090013255A1 (en) | 2006-12-30 | 2009-01-08 | Matthew John Yuschik | Method and System for Supporting Graphical User Interfaces |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
WO2008096414A1 (ja) | 2007-02-06 | 2008-08-14 | Pioneer Corporation | コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体 |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
JP4728982B2 (ja) | 2007-03-05 | 2011-07-20 | 株式会社東芝 | 利用者と対話する装置、方法およびプログラム |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8996379B2 (en) | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8977255B2 (en) * | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
US8374636B2 (en) | 2007-05-18 | 2013-02-12 | Shorthand Mobile, Inc. | System and method for enhanced communications via small data rate communication systems |
US20080291916A1 (en) | 2007-05-22 | 2008-11-27 | Bo Xiong | Systems and methods for dynamic quality of service |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
WO2009020617A1 (en) | 2007-08-06 | 2009-02-12 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US20090046866A1 (en) | 2007-08-15 | 2009-02-19 | Fortemedia, Inc. | Apparatus capable of performing acoustic echo cancellation and a method thereof |
US8676273B1 (en) | 2007-08-24 | 2014-03-18 | Iwao Fujisaki | Communication device |
US8073125B2 (en) * | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US7844724B2 (en) | 2007-10-24 | 2010-11-30 | Social Communications Company | Automated real-time data stream switching in a shared virtual area communication environment |
US8639214B1 (en) | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
US8542861B2 (en) | 2007-11-20 | 2013-09-24 | Panasonic Corporation | Loudspeaker, video device, and portable information processing apparatus |
US9247346B2 (en) | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US20090153289A1 (en) | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
US8423893B2 (en) | 2008-01-07 | 2013-04-16 | Altec Lansing Australia Pty Limited | User interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
DE102008039330A1 (de) | 2008-01-31 | 2009-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8213598B2 (en) | 2008-02-26 | 2012-07-03 | Microsoft Corporation | Harmonic distortion residual echo suppression |
US8638908B2 (en) | 2008-02-28 | 2014-01-28 | Computer Products Introductions, Corp | Contextual conversation processing in telecommunication applications |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
WO2009120301A2 (en) * | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
US7516068B1 (en) | 2008-04-07 | 2009-04-07 | International Business Machines Corporation | Optimized collection of audio for speech recognition |
CN101562671A (zh) * | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
JP5423670B2 (ja) | 2008-04-30 | 2014-02-19 | 日本電気株式会社 | 音響モデル学習装置および音声認識装置 |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8831948B2 (en) | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8325909B2 (en) | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8781833B2 (en) | 2008-07-17 | 2014-07-15 | Nuance Communications, Inc. | Speech recognition semantic classification training |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
US8325938B2 (en) * | 2008-08-12 | 2012-12-04 | Sony Corporation | Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR101829865B1 (ko) | 2008-11-10 | 2018-02-20 | 구글 엘엘씨 | 멀티센서 음성 검출 |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
US8095368B2 (en) | 2008-12-04 | 2012-01-10 | At&T Intellectual Property I, L.P. | System and method for voice authentication over a computer network |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) * | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US8351617B2 (en) | 2009-01-13 | 2013-01-08 | Fortemedia, Inc. | Method for phase mismatch calibration for an array microphone and phase calibration module for the same |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US20130283166A1 (en) | 2012-04-24 | 2013-10-24 | Social Communications Company | Voice-based virtual area navigation |
US8428758B2 (en) * | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
US8243949B2 (en) | 2009-04-14 | 2012-08-14 | Plantronics, Inc. | Network addressible loudspeaker and audio play |
JP5384721B2 (ja) | 2009-04-15 | 2014-01-08 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音響エコー抑制ユニットと会議開催フロントエンド |
US8483398B2 (en) | 2009-04-30 | 2013-07-09 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses |
JP5550456B2 (ja) | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US20100332236A1 (en) | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
US8478982B2 (en) | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
JP5440053B2 (ja) | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
WO2011033887A1 (ja) | 2009-09-17 | 2011-03-24 | 株式会社日立メディコ | 超音波探触子及び超音波撮像装置 |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
KR101301535B1 (ko) | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US20110145581A1 (en) * | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
NO332437B1 (no) | 2010-01-18 | 2012-09-17 | Cisco Systems Int Sarl | Apparat og fremgangsmate for a supprimere et akustisk ekko |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
JP5572445B2 (ja) | 2010-04-30 | 2014-08-13 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
CN102959544B (zh) | 2010-05-04 | 2016-06-08 | 沙扎姆娱乐有限公司 | 用于同步媒体的方法和系统 |
JP2013530420A (ja) | 2010-05-06 | 2013-07-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 可搬型メディア再生装置に関するオーディオ・システム等化処理 |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US20110289506A1 (en) | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) * | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US9349368B1 (en) | 2010-08-05 | 2016-05-24 | Google Inc. | Generating an audio notification based on detection of a triggering event |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
KR101442441B1 (ko) * | 2010-08-27 | 2014-09-17 | 인텔 코오퍼레이션 | 지능형 리모트 컨트롤 시스템 |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
JP5259020B2 (ja) | 2010-10-01 | 2013-08-07 | 三菱電機株式会社 | 音声認識装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
WO2012046582A1 (ja) | 2010-10-08 | 2012-04-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
CN103299649A (zh) * | 2010-10-22 | 2013-09-11 | Dts(英属维尔京群岛)有限公司 | 媒体分配架构 |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
EP2444967A1 (en) | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
US8799395B2 (en) | 2010-11-22 | 2014-08-05 | Deluxe Media Inc. | Methods and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
JP6012621B2 (ja) | 2010-12-15 | 2016-10-25 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | リモートノイズ検知器を使用したノイズ削減システム |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
US8489398B1 (en) | 2011-01-14 | 2013-07-16 | Google Inc. | Disambiguation of spoken proper names |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
KR20120100514A (ko) | 2011-03-04 | 2012-09-12 | 삼성전자주식회사 | 디바이스 그룹핑 방법 및 이를 적용한 서버 |
US8804977B2 (en) | 2011-03-18 | 2014-08-12 | Dolby Laboratories Licensing Corporation | Nonlinear reference signal processing for echo suppression |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
KR101284134B1 (ko) | 2011-03-31 | 2013-07-10 | 주식회사 원캐스트 | 하이브리드망 기반의 구내방송 서비스 장치 |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
KR20120128542A (ko) | 2011-05-11 | 2012-11-27 | 삼성전자주식회사 | 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치 |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
US8320577B1 (en) | 2011-05-20 | 2012-11-27 | Google Inc. | Method and apparatus for multi-channel audio processing using single-channel components |
EP2715972B1 (en) | 2011-05-31 | 2016-02-24 | Google, Inc. | Muting participants in a communication session |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9226088B2 (en) | 2011-06-11 | 2015-12-29 | Clearone Communications, Inc. | Methods and apparatuses for multiple configurations of beamforming microphone arrays |
US9762967B2 (en) | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US20130018659A1 (en) | 2011-07-12 | 2013-01-17 | Google Inc. | Systems and Methods for Speech Command Processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
WO2013018138A1 (ja) * | 2011-08-03 | 2013-02-07 | パイオニア株式会社 | 音声伝送方法、スピーカーシステム、音声伝送装置、スピーカーおよびプログラム |
EP2555598A1 (en) | 2011-08-05 | 2013-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and device for generating optical radiation by means of electrically operated pulsed discharges |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
EP2557813A2 (en) | 2011-08-08 | 2013-02-13 | Bang & Olufsen A/S | A modular, configurable speaker system and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US8750677B2 (en) | 2011-08-23 | 2014-06-10 | Microsoft Corporation | Method for transferring media playback from a different device |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US8798995B1 (en) | 2011-09-23 | 2014-08-05 | Amazon Technologies, Inc. | Key word determinations from voice data |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8996381B2 (en) | 2011-09-27 | 2015-03-31 | Sensory, Incorporated | Background speech recognition assistant |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9729631B2 (en) | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US8971546B2 (en) | 2011-10-14 | 2015-03-03 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to control audio playback devices |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
GB201118784D0 (en) | 2011-10-31 | 2011-12-14 | Omnifone Ltd | Djml |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
EP2792152A4 (en) | 2011-12-13 | 2015-07-22 | Intel Corp | NAVIGATING CHANNELS IN MULTIMEDIA DEVICES CONNECTED BY SELECTING KEYWORDS |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
KR20130083657A (ko) | 2012-01-13 | 2013-07-23 | 삼성전자주식회사 | 복수 음성 신호 출력 단자를 가진 단말 및 그의 음성 신호 출력 방법 |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
US9431980B2 (en) | 2012-01-30 | 2016-08-30 | Echostar Ukraine Llc | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
EP2632141B1 (en) | 2012-02-22 | 2014-10-15 | Dialog Semiconductor B.V. | Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9198204B2 (en) | 2012-04-11 | 2015-11-24 | Google Inc. | Apparatus and method for seamless commissioning of wireless devices |
US9575963B2 (en) | 2012-04-20 | 2017-02-21 | Maluuba Inc. | Conversational agent |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
SG11201407085UA (en) | 2012-04-30 | 2014-12-30 | Creative Tech Ltd | A universal reconfigurable echo cancellation system |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US20130294611A1 (en) | 2012-05-04 | 2013-11-07 | Sony Computer Entertainment Inc. | Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) * | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
CN104541473B (zh) | 2012-06-01 | 2017-09-12 | 黑莓有限公司 | 基于概率方法的用于保证多格式音频系统中的锁定的通用同步引擎 |
US9230556B2 (en) | 2012-06-05 | 2016-01-05 | Apple Inc. | Voice instructions during navigation |
US9997069B2 (en) | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9183845B1 (en) | 2012-06-12 | 2015-11-10 | Amazon Technologies, Inc. | Adjusting audio signals based on a specific frequency range associated with environmental noise characteristics |
US9031255B2 (en) | 2012-06-15 | 2015-05-12 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to provide low-latency audio |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US8880648B1 (en) * | 2012-06-27 | 2014-11-04 | Audible, Inc. | Automated transition of content consumption across devices |
US9225307B2 (en) | 2012-06-28 | 2015-12-29 | Sonos, Inc. | Modification of audio responsive to proximity detection |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
KR101972955B1 (ko) | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
KR20140008870A (ko) * | 2012-07-12 | 2014-01-22 | 삼성전자주식회사 | 컨텐츠 정보 제공 방법 및 이를 적용한 방송 수신 장치 |
EP2874411A4 (en) * | 2012-07-13 | 2016-03-16 | Sony Corp | INFORMATION PROCESSING SYSTEM AND STORAGE MEDIUM |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
KR20150038093A (ko) | 2012-08-03 | 2015-04-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 장치 및 조명 장치 |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
EP2701145B1 (en) | 2012-08-24 | 2016-10-12 | Retune DSP ApS | Noise estimation for use with noise reduction and echo cancellation in personal communication |
US9532153B2 (en) | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US9088336B2 (en) | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
JP2014052469A (ja) * | 2012-09-06 | 2014-03-20 | Sony Corp | 音声処理装置、音声処理方法、及び、プログラム |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
US8725125B2 (en) * | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
WO2014055312A1 (en) | 2012-10-02 | 2014-04-10 | Mh Acoustics, Llc | Earphones having configurable microphone arrays |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
CN102902253B (zh) * | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制系统 |
US20140108010A1 (en) | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
US10317373B2 (en) | 2012-10-15 | 2019-06-11 | Msi Dfat Llc | Direct field acoustic testing in a semi-reverberant enclosure |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
US20150339698A1 (en) * | 2012-10-18 | 2015-11-26 | Dimension Media It Limited | A media system with a server and distributed player devices at different geographical locations |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
WO2014064531A1 (en) * | 2012-10-22 | 2014-05-01 | Spotify Ab | Systems and methods for pre-fetching media content |
WO2014064324A1 (en) | 2012-10-26 | 2014-05-01 | Nokia Corporation | Multi-device speech recognition |
KR20140054643A (ko) | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381002B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US8761349B2 (en) | 2012-10-31 | 2014-06-24 | Citrix Systems, Inc. | Systems and methods of monitoring performance of acoustic echo cancellation |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
CN102999161B (zh) | 2012-11-13 | 2016-03-02 | 科大讯飞股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US9070367B1 (en) | 2012-11-26 | 2015-06-30 | Amazon Technologies, Inc. | Local speech recognition of frequent utterances |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
US9154877B2 (en) * | 2012-11-28 | 2015-10-06 | Qualcomm Incorporated | Collaborative sound system |
US20140149118A1 (en) | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2014088588A1 (en) | 2012-12-07 | 2014-06-12 | Empire Technology Development Llc | Personal assistant context building |
US20140161263A1 (en) | 2012-12-10 | 2014-06-12 | Microsoft Corporation | Facilitating recognition of real-time content |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
KR102062580B1 (ko) | 2012-12-13 | 2020-02-11 | 삼성전자주식회사 | 홈 네트워크 시스템에서 디바이스 제어 방법 및 장치 |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9607046B2 (en) | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
WO2014098477A1 (ko) | 2012-12-18 | 2014-06-26 | 삼성전자 주식회사 | 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치 |
US9047857B1 (en) | 2012-12-19 | 2015-06-02 | Rawles Llc | Voice commands for transitioning between device states |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
US20150279351A1 (en) | 2012-12-19 | 2015-10-01 | Google Inc. | Keyword detection based on acoustic alignment |
US8977555B2 (en) * | 2012-12-20 | 2015-03-10 | Amazon Technologies, Inc. | Identification of utterance subjects |
WO2014102722A1 (en) | 2012-12-26 | 2014-07-03 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
CN103021403A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 基于语音识别的选择方法及其移动终端装置及信息系统 |
US9620115B2 (en) | 2013-01-03 | 2017-04-11 | Telenav, Inc. | Content delivery system with barge-in mechanism and method of operation thereof |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
US9318125B2 (en) | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
TWI593294B (zh) | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
CN113470641B (zh) | 2013-02-07 | 2023-12-15 | 苹果公司 | 数字助理的语音触发器 |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9237384B2 (en) | 2013-02-14 | 2016-01-12 | Sonos, Inc. | Automatic configuration of household playback devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
US9195432B2 (en) | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
RU2648604C2 (ru) | 2013-02-26 | 2018-03-26 | Конинклейке Филипс Н.В. | Способ и аппаратура для генерации сигнала речи |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音系统与相关方法 |
US10395651B2 (en) | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
US10091583B2 (en) | 2013-03-07 | 2018-10-02 | Apple Inc. | Room and program responsive loudspeaker system |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
CN105122844B (zh) | 2013-03-11 | 2018-09-21 | 苹果公司 | 用于在整个指向性范围内保持扬声器的音色恒定性的方法、系统和音频接收器 |
JP6111753B2 (ja) | 2013-03-11 | 2017-04-12 | 株式会社リコー | 情報処理装置、伝送システム、プログラム |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
WO2014159581A1 (en) | 2013-03-12 | 2014-10-02 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
KR20140111859A (ko) * | 2013-03-12 | 2014-09-22 | 삼성전자주식회사 | 콘텐트 공유 방법 및 이를 위한 디바이스 |
US9443529B2 (en) | 2013-03-12 | 2016-09-13 | Aawtend, Inc. | Integrated sensor-array processor |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
US9060052B2 (en) | 2013-03-13 | 2015-06-16 | Accusonus S.A. | Single channel, binaural and multi-channel dereverberation |
US10133546B2 (en) * | 2013-03-14 | 2018-11-20 | Amazon Technologies, Inc. | Providing content on multiple devices |
JP6013951B2 (ja) | 2013-03-14 | 2016-10-25 | 本田技研工業株式会社 | 環境音検索装置、環境音検索方法 |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
EP2974386A1 (en) | 2013-03-14 | 2016-01-20 | Apple Inc. | Adaptive room equalization using a speaker and a handheld listening device |
EP3036657A4 (en) | 2013-03-15 | 2017-06-21 | Spotify AB | Systems, methods, and computer readable medium for generating playlists |
US9201865B2 (en) | 2013-03-15 | 2015-12-01 | Bao Tran | Automated assistance for user request that determines semantics by domain, task, and parameter |
US8898063B1 (en) | 2013-03-15 | 2014-11-25 | Mark Sykes | Method for converting speech to text, performing natural language processing on the text output, extracting data values and matching to an electronic ticket form |
US9854081B2 (en) * | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
US20140278933A1 (en) | 2013-03-15 | 2014-09-18 | F. Gavin McMillan | Methods and apparatus to measure audience engagement with media |
EP2976897B8 (en) | 2013-03-21 | 2020-07-01 | Cerence Operating Company | System and method for identifying suboptimal microphone performance |
KR102233619B1 (ko) | 2013-03-26 | 2021-03-30 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기, 및 조명 장치 |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
US9689960B1 (en) | 2013-04-04 | 2017-06-27 | Amazon Technologies, Inc. | Beam rejection in multi-beam microphone systems |
CA2897539C (en) | 2013-04-04 | 2016-05-17 | James S. RAND | Unified communications system and method |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
US20140310614A1 (en) | 2013-04-15 | 2014-10-16 | Chacha Search, Inc | Method and system of increasing user interaction |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
WO2014171144A1 (ja) | 2013-04-19 | 2014-10-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 家電機器の制御方法、家電機器制御システム、及びゲートウェイ |
US9491033B1 (en) | 2013-04-22 | 2016-11-08 | Amazon Technologies, Inc. | Automatic content transfer |
US9936290B2 (en) | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
WO2014189486A1 (en) | 2013-05-20 | 2014-11-27 | Intel Corporation | Natural human-computer interaction for virtual personal assistant systems |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
EP2816554A3 (en) | 2013-05-28 | 2015-03-25 | Samsung Electronics Co., Ltd | Method of executing voice recognition of electronic device and electronic device using the same |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
CN105409161B (zh) * | 2013-05-29 | 2019-06-14 | 搜诺思公司 | 移动设备上经由播放列表的回放队列控制 |
US10715973B2 (en) | 2013-05-29 | 2020-07-14 | Sonos, Inc. | Playback queue control transition |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US20140365225A1 (en) | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9654073B2 (en) * | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
TWI545979B (zh) | 2013-06-09 | 2016-08-11 | 蘋果公司 | 藍芽警報通知服務 |
US9787273B2 (en) * | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9066048B2 (en) | 2013-06-17 | 2015-06-23 | Spotify Ab | System and method for switching between audio content while navigating through video streams |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
EP3014610B1 (en) | 2013-06-28 | 2023-10-04 | Harman International Industries, Incorporated | Wireless control of linked devices |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
WO2015005927A1 (en) | 2013-07-11 | 2015-01-15 | Intel Corporation | Device wake and speaker verification using the same audio input |
DE102014109122A1 (de) | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
US9426598B2 (en) | 2013-07-15 | 2016-08-23 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9445196B2 (en) | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9772994B2 (en) | 2013-07-25 | 2017-09-26 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
US9431014B2 (en) | 2013-07-25 | 2016-08-30 | Haier Us Appliance Solutions, Inc. | Intelligent placement of appliance response to voice command |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
US10186262B2 (en) | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US9418651B2 (en) | 2013-07-31 | 2016-08-16 | Google Technology Holdings LLC | Method and apparatus for mitigating false accepts of trigger phrases |
US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
US20150053779A1 (en) | 2013-08-21 | 2015-02-26 | Honeywell International Inc. | Devices and methods for interacting with an hvac controller |
US9940927B2 (en) | 2013-08-23 | 2018-04-10 | Nuance Communications, Inc. | Multiple pass automatic speech recognition methods and apparatus |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
US9514747B1 (en) | 2013-08-28 | 2016-12-06 | Amazon Technologies, Inc. | Reducing speech recognition latency |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
CN103718528B (zh) * | 2013-08-30 | 2016-09-28 | 华为技术有限公司 | 一种多终端协同播放多媒体文件的方法和相关装置及系统 |
JP6037026B2 (ja) | 2013-09-11 | 2016-11-30 | 株式会社デンソー | 音声出力制御装置、プログラムおよび記録媒体 |
US9672812B1 (en) | 2013-09-18 | 2017-06-06 | Amazon Technologies, Inc. | Qualifying trigger expressions in speech-based systems |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9122451B2 (en) * | 2013-09-30 | 2015-09-01 | Sonos, Inc. | Capacitive proximity sensor configuration including a speaker grille |
CN103546616A (zh) * | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
KR102114219B1 (ko) | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
WO2015060867A1 (en) | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
DK2869599T3 (da) | 2013-11-05 | 2020-12-14 | Oticon As | Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) * | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8768712B1 (en) | 2013-12-04 | 2014-07-01 | Google Inc. | Initiating actions based on partial hotwords |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US10055190B2 (en) | 2013-12-16 | 2018-08-21 | Amazon Technologies, Inc. | Attribute-based audio channel arbitration |
US9378651B2 (en) | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
US10224056B1 (en) | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
GB2524222B (en) | 2013-12-18 | 2018-07-18 | Cirrus Logic Int Semiconductor Ltd | Activating speech processing |
EP3084760A4 (en) | 2013-12-20 | 2017-08-16 | Intel Corporation | Transition from low power always listening mode to high power speech recognition mode |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9443516B2 (en) | 2014-01-09 | 2016-09-13 | Honeywell International Inc. | Far-field speech recognition systems and methods |
WO2015105788A1 (en) | 2014-01-10 | 2015-07-16 | Dolby Laboratories Licensing Corporation | Calibration of virtual height speakers using programmable portable devices |
US9300647B2 (en) * | 2014-01-15 | 2016-03-29 | Sonos, Inc. | Software application and zones |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
DE112014006235T5 (de) * | 2014-01-22 | 2016-10-13 | Apple Inc. | Koordiniertes Weiterreichen einer Audiodatenübermittlung |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9652532B2 (en) | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
US9929368B2 (en) | 2014-02-06 | 2018-03-27 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
TWI685116B (zh) | 2014-02-07 | 2020-02-11 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
US9226072B2 (en) * | 2014-02-21 | 2015-12-29 | Sonos, Inc. | Media content based on playback zone awareness |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
US9408008B2 (en) * | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
US10102848B2 (en) | 2014-02-28 | 2018-10-16 | Google Llc | Hotwords presentation framework |
EP3739460A1 (en) | 2014-03-03 | 2020-11-18 | Sony Corporation | Information processing apparatus, information processing method, and program |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US10514747B2 (en) | 2014-03-24 | 2019-12-24 | Silicon Laboratories Inc. | Low-power communication apparatus with wakeup detection and associated methods |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9431021B1 (en) * | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9916839B1 (en) | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
KR102146462B1 (ko) | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
US8874448B1 (en) * | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US9560437B2 (en) | 2014-04-08 | 2017-01-31 | Doppler Labs, Inc. | Time heuristic audio control |
US9542948B2 (en) * | 2014-04-09 | 2017-01-10 | Google Inc. | Text-dependent speaker identification |
US9510094B2 (en) | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
WO2015178562A1 (en) | 2014-05-23 | 2015-11-26 | Samsung Electronics Co., Ltd. | Method and apparatus for providing notification |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
TWI777568B (zh) | 2014-05-30 | 2022-09-11 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US20150355818A1 (en) | 2014-06-04 | 2015-12-10 | Sonos, Inc. | Continuous Playback Queue |
WO2015184525A1 (en) | 2014-06-05 | 2015-12-10 | Interdev Technologies | Systems and methods of interpreting speech data |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US20150373100A1 (en) | 2014-06-19 | 2015-12-24 | Pavel KRAVETS | Context sharing between different clients |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9766702B2 (en) | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US20150371628A1 (en) | 2014-06-23 | 2015-12-24 | Harman International Industries, Inc. | User-adapted speech recognition |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9368105B1 (en) | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9335819B1 (en) | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9398392B2 (en) | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9082018B1 (en) | 2014-09-30 | 2015-07-14 | Google Inc. | Method and system for retroactively changing a display characteristic of event indicators on an event timeline |
US11330100B2 (en) | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US9467737B2 (en) * | 2014-07-14 | 2016-10-11 | Sonos, Inc. | Zone group control |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN104155938B (zh) * | 2014-07-21 | 2018-01-09 | 惠州Tcl移动通信有限公司 | 一种家居设备管理方法及系统 |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9671997B2 (en) * | 2014-07-23 | 2017-06-06 | Sonos, Inc. | Zone grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
JP6118838B2 (ja) | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
KR20160026317A (ko) | 2014-08-29 | 2016-03-09 | 삼성전자주식회사 | 음성 녹음 방법 및 장치 |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9354687B2 (en) | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
JP6624368B2 (ja) | 2014-09-30 | 2019-12-25 | パナソニックIpマネジメント株式会社 | 接客モニタリングシステム及び接客モニタリング方法 |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10235996B2 (en) | 2014-10-01 | 2019-03-19 | XBrain, Inc. | Voice and connection platform |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
KR102287943B1 (ko) * | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9576575B2 (en) * | 2014-10-27 | 2017-02-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Providing voice recognition shortcuts based on user verbal input |
US9967610B2 (en) | 2014-10-30 | 2018-05-08 | Verizon Patent And Licensing Inc. | Methods and systems for providing context-based customer support for a user interface view associated with a television service |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10368121B2 (en) | 2014-11-07 | 2019-07-30 | Roku, Inc. | System and method for collecting data |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
JP2016095383A (ja) | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
WO2016082046A1 (en) | 2014-11-28 | 2016-06-02 | Audera Acoustics Inc. | High displacement acoustic transducer systems |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
WO2016094807A1 (en) | 2014-12-11 | 2016-06-16 | Vishal Sharma | Virtual assistant system to enable actionable messaging |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104575504A (zh) | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
CN104635539A (zh) | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其系统 |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
DE112016000287T5 (de) | 2015-01-07 | 2017-10-05 | Knowles Electronics, Llc | Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
CN104581510B (zh) * | 2015-01-22 | 2018-01-16 | 广东欧珀移动通信有限公司 | 音箱音量设置方法及装置 |
US9947313B2 (en) * | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
KR102351366B1 (ko) | 2015-01-26 | 2022-01-14 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
CN104572009B (zh) | 2015-01-28 | 2018-01-09 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
US9633661B1 (en) | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
US20170337921A1 (en) | 2015-02-27 | 2017-11-23 | Sony Corporation | Information processing device, information processing method, and program |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
US9678707B2 (en) | 2015-04-10 | 2017-06-13 | Sonos, Inc. | Identification of audio content facilitated by playback device |
US10198242B2 (en) | 2015-04-14 | 2019-02-05 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
CN104853405B (zh) | 2015-05-12 | 2018-11-30 | 浙江生辉照明有限公司 | 智能联网方法及智能设备 |
KR101807513B1 (ko) | 2015-05-13 | 2017-12-12 | 한국전자통신연구원 | 3차원 공간에서 영상정보를 이용한 사용자 의도 분석장치 및 분석방법 |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
US9753922B2 (en) | 2015-05-19 | 2017-09-05 | Researchgate Gmbh | Enhanced online user-interaction tracking |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
CN107534090B (zh) | 2015-05-21 | 2019-10-18 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备及照明装置 |
TWI757234B (zh) | 2015-05-21 | 2022-03-11 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
JP2016218852A (ja) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US10657949B2 (en) | 2015-05-29 | 2020-05-19 | Sound United, LLC | System and method for integrating a home media system and other home systems |
US9584935B2 (en) | 2015-05-29 | 2017-02-28 | Sound United, Llc. | Multi-zone media system and method for providing multi-zone media |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
US10249205B2 (en) | 2015-06-08 | 2019-04-02 | Novel Effect, Inc. | System and method for integrating special effects with a text source |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
US20160373909A1 (en) | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
WO2016203350A1 (en) | 2015-06-17 | 2016-12-22 | Semiconductor Energy Laboratory Co., Ltd. | Iridium complex, light-emitting element, display device, electronic device, and lighting device |
JP6739907B2 (ja) | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US10025447B1 (en) | 2015-06-19 | 2018-07-17 | Amazon Technologies, Inc. | Multi-device user interface |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
CN108028047B (zh) | 2015-06-30 | 2022-08-30 | 弗劳恩霍夫应用研究促进协会 | 用于生成数据库的方法和设备 |
CN113889586A (zh) | 2015-07-08 | 2022-01-04 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备以及照明装置 |
US10304440B1 (en) | 2015-07-10 | 2019-05-28 | Amazon Technologies, Inc. | Keyword spotting using multi-task configuration |
CN105101083A (zh) * | 2015-07-15 | 2015-11-25 | 魅族科技(中国)有限公司 | 室内电子设备的控制方法及装置 |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
WO2017013526A1 (en) | 2015-07-21 | 2017-01-26 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, display device, electronic device, and lighting device |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
KR102404096B1 (ko) | 2015-07-23 | 2022-05-31 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
WO2017015759A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized playback of streamed audio content by multiple internet-capable portable devices |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US9691361B2 (en) | 2015-08-03 | 2017-06-27 | International Business Machines Corporation | Adjusting presentation of content on a display |
KR102402512B1 (ko) * | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) * | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制系统及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
KR102386854B1 (ko) | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
US20180249267A1 (en) | 2015-08-31 | 2018-08-30 | Apple Inc. | Passive microphone array localizer |
US10031719B2 (en) * | 2015-09-02 | 2018-07-24 | Harman International Industries, Incorporated | Audio system with multi-screen application |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
US10026399B2 (en) | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
KR20170032096A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체 |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
KR20170032114A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 음성 인식 장치 및 그의 제어방법 |
US10706873B2 (en) | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US10289734B2 (en) | 2015-09-18 | 2019-05-14 | Samsung Electronics Co., Ltd. | Entity-type search system |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
KR102420450B1 (ko) | 2015-09-23 | 2022-07-14 | 삼성전자주식회사 | 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
CN105162886B (zh) | 2015-09-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种声音控制方法及装置 |
US10186276B2 (en) | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
WO2017058654A1 (en) | 2015-09-28 | 2017-04-06 | Google Inc. | Time-synchronized, multizone media streaming |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
US10241754B1 (en) | 2015-09-29 | 2019-03-26 | Amazon Technologies, Inc. | Systems and methods for providing supplemental information with a response to a command |
US11025569B2 (en) | 2015-09-30 | 2021-06-01 | Apple Inc. | Shared content presentation with integrated messaging |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
TW201721922A (zh) | 2015-09-30 | 2017-06-16 | 半導體能源研究所股份有限公司 | 發光元件,顯示裝置,電子裝置,及照明裝置 |
US9542941B1 (en) | 2015-10-01 | 2017-01-10 | Lenovo (Singapore) Pte. Ltd. | Situationally suspending wakeup word to enable voice command input |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
US9754580B2 (en) | 2015-10-12 | 2017-09-05 | Technologies For Voice Interface | System and method for extracting and using prosody features |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
EP3311590B1 (en) | 2015-10-15 | 2019-08-14 | Huawei Technologies Co., Ltd. | A sound processing node of an arrangement of sound processing nodes |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
CN107016999B (zh) | 2015-10-16 | 2022-06-14 | 谷歌有限责任公司 | 热词识别 |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105427861B (zh) | 2015-11-03 | 2019-02-15 | 胡旻波 | 智能家居协同麦克风语音控制的系统及其控制方法 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US20170140750A1 (en) | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
CN105472191B (zh) | 2015-11-18 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
DE112015007147T5 (de) | 2015-11-25 | 2018-08-09 | Mitsubishi Electric Corporation | Sprachdialogvorrichtung und Sprachdialogverfahren |
US10040423B2 (en) | 2015-11-27 | 2018-08-07 | Bragi GmbH | Vehicle with wearable for identifying one or more vehicle occupants |
US9484030B1 (en) | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9699597B2 (en) | 2015-12-07 | 2017-07-04 | Google Inc. | Wireless signal forwarding |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
CN105632486B (zh) | 2015-12-23 | 2019-12-17 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
CN105679318A (zh) | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示系统和空调 |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US9992642B1 (en) | 2015-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated messaging |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
US9997151B1 (en) | 2016-01-20 | 2018-06-12 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation for wireless applications |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
CN105741838B (zh) | 2016-01-20 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
KR20170091913A (ko) | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
EP3414759B1 (en) | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9858927B2 (en) | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US9898250B1 (en) | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10743101B2 (en) * | 2016-02-22 | 2020-08-11 | Sonos, Inc. | Content mixing |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US10133612B2 (en) | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US10332508B1 (en) | 2016-03-31 | 2019-06-25 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
WO2017174136A1 (en) | 2016-04-07 | 2017-10-12 | Sonova Ag | Hearing assistance system |
US9952827B2 (en) | 2016-04-13 | 2018-04-24 | Comcast Cable Communications, Llc | Dynamic adjustment of equalization settings of audio components via a sound device profile |
EP4030295B1 (en) | 2016-04-18 | 2024-06-05 | Google LLC | Automated assistant invocation of appropriate agent |
US10318236B1 (en) | 2016-05-05 | 2019-06-11 | Amazon Technologies, Inc. | Refining media playback |
EP3455719A1 (en) | 2016-05-10 | 2019-03-20 | Google LLC | Implementations for voice assistant on devices |
US20170329397A1 (en) | 2016-05-12 | 2017-11-16 | Rovi Guides, Inc. | Systems and methods for navigating a media guidance application using gaze control |
US10447748B2 (en) | 2016-05-12 | 2019-10-15 | Apple Inc. | Sharing media information between applications on client devices |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
JP2019518985A (ja) | 2016-05-13 | 2019-07-04 | ボーズ・コーポレーションBose Corporation | 分散したマイクロホンからの音声の処理 |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10079027B2 (en) | 2016-06-03 | 2018-09-18 | Nxp B.V. | Sound signal detector |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
DK179034B1 (en) | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
ES2806204T3 (es) | 2016-06-15 | 2021-02-16 | Cerence Operating Co | Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados |
US20170364371A1 (en) | 2016-06-15 | 2017-12-21 | Microsoft Technology Licensing, Llc | Context-Dependent Digital Action-Assistance Tool |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
KR20170142001A (ko) | 2016-06-16 | 2017-12-27 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9875740B1 (en) | 2016-06-20 | 2018-01-23 | A9.Com, Inc. | Using voice information to influence importance of search result categories |
US9749738B1 (en) | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US10332513B1 (en) | 2016-06-27 | 2019-06-25 | Amazon Technologies, Inc. | Voice enablement and disablement of speech processing functionality |
US10091545B1 (en) | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
KR102471499B1 (ko) | 2016-07-05 | 2022-11-28 | 삼성전자주식회사 | 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
US20180018965A1 (en) | 2016-07-12 | 2018-01-18 | Bose Corporation | Combining Gesture and Voice User Interfaces |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US9979680B2 (en) | 2016-07-21 | 2018-05-22 | Fujitsu Limited | Smart notification scheduling and modality selection |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
US20180033429A1 (en) | 2016-07-26 | 2018-02-01 | Ford Global Technologies, Llc | Extendable vehicle system |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10026403B2 (en) | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9967382B2 (en) | 2016-08-19 | 2018-05-08 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
CN107767863B (zh) | 2016-08-22 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
WO2018039045A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US10360910B2 (en) | 2016-08-29 | 2019-07-23 | Garmin Switzerland Gmbh | Automatic speech recognition (ASR) utilizing GPS and sensor data |
US10461953B2 (en) | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
EP3822863B1 (en) | 2016-09-06 | 2022-11-02 | DeepMind Technologies Limited | Generating audio using neural networks |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US9959861B2 (en) | 2016-09-30 | 2018-05-01 | Robert Bosch Gmbh | System and method for speech recognition |
WO2018067350A1 (en) | 2016-10-03 | 2018-04-12 | Google Llc. | Processing voice commands based on device topology |
US10283138B2 (en) | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
JP6882463B2 (ja) | 2016-10-03 | 2021-06-02 | グーグル エルエルシーGoogle LLC | コンピュータによるエージェントのための合成音声の選択 |
CN107919116B (zh) | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
CA3042535C (en) | 2016-11-03 | 2022-05-17 | Zimmer, Inc. | Augmented reality therapeutic movement display and gesture analyzer |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
EP3637414B1 (en) | 2016-11-07 | 2024-01-03 | Google LLC | Recorded media hotword trigger suppression |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
US10127908B1 (en) | 2016-11-11 | 2018-11-13 | Amazon Technologies, Inc. | Connected accessory for a voice-controlled device |
US10382806B2 (en) | 2016-11-14 | 2019-08-13 | DISH Technologies L.L.C. | Apparatus, systems and methods for controlling presentation of content using a multi-media table |
US10170110B2 (en) | 2016-11-17 | 2019-01-01 | Robert Bosch Gmbh | System and method for ranking of hybrid speech recognition results with neural networks |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10079015B1 (en) | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10134396B2 (en) | 2016-12-07 | 2018-11-20 | Google Llc | Preventing of audio attacks |
US10241748B2 (en) | 2016-12-13 | 2019-03-26 | EVA Automation, Inc. | Schedule-based coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制系统及控制方法 |
US10339957B1 (en) | 2016-12-20 | 2019-07-02 | Amazon Technologies, Inc. | Ending communications session based on presence data |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
CN110100457B (zh) | 2016-12-23 | 2021-07-30 | 辛纳普蒂克斯公司 | 基于噪声时变环境的加权预测误差的在线去混响算法 |
CN106910500B (zh) | 2016-12-23 | 2020-04-17 | 北京小鸟听听科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
US10546578B2 (en) | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
US10580405B1 (en) | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
US10593328B1 (en) | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10186266B1 (en) | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10831366B2 (en) | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
US10224031B2 (en) | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
KR102412202B1 (ko) | 2017-01-03 | 2022-06-27 | 삼성전자주식회사 | 냉장고 및 이의 정보 표시 방법 |
US10248613B2 (en) | 2017-01-10 | 2019-04-02 | Qualcomm Incorporated | Data bus activation in an electronic device |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR20180085931A (ko) | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR102716757B1 (ko) | 2017-02-03 | 2024-10-15 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
EP3580999B1 (en) | 2017-02-07 | 2021-03-17 | Lutron Technology Company LLC | Audio-based load control system |
US10762891B2 (en) | 2017-02-10 | 2020-09-01 | Synaptics Incorporated | Binary and multi-class classification systems and methods using connectionist temporal classification |
CN108446281B (zh) | 2017-02-13 | 2021-03-12 | 北京嘀嘀无限科技发展有限公司 | 确定用户亲密度的方法、装置及存储介质 |
US20180293221A1 (en) | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US10431217B2 (en) | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
CN106921560B (zh) | 2017-02-28 | 2020-06-02 | 北京小米移动软件有限公司 | 语音通信方法、装置及系统 |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10706843B1 (en) | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US10089981B1 (en) | 2017-03-09 | 2018-10-02 | Amazon Technologies, Inc. | Messaging account disambiguation |
US10540961B2 (en) | 2017-03-13 | 2020-01-21 | Baidu Usa Llc | Convolutional recurrent neural networks for small-footprint keyword spotting |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
JP6558513B2 (ja) | 2017-03-17 | 2019-08-14 | ヤマハ株式会社 | コンテンツ再生機器、方法、及びコンテンツ再生システム |
US10600406B1 (en) | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
WO2018173293A1 (ja) | 2017-03-24 | 2018-09-27 | ヤマハ株式会社 | 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10643609B1 (en) | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
US10825471B2 (en) | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US10748531B2 (en) | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
CN107122158A (zh) | 2017-04-14 | 2017-09-01 | 北京小米移动软件有限公司 | 播放信息提示音频的方法及装置、电子设备 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102392297B1 (ko) | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10311870B2 (en) | 2017-05-10 | 2019-06-04 | Ecobee Inc. | Computerized device with voice command input capability |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10380852B2 (en) | 2017-05-12 | 2019-08-13 | Google Llc | Systems, methods, and devices for activity monitoring via a home assistant |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10531196B2 (en) | 2017-06-02 | 2020-01-07 | Apple Inc. | Spatially ducking audio produced through a beamforming loudspeaker array |
US10403299B2 (en) | 2017-06-02 | 2019-09-03 | Apple Inc. | Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10805370B2 (en) | 2017-06-02 | 2020-10-13 | Apple Inc. | Alarms for a system of smart media playback devices |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10410635B2 (en) | 2017-06-09 | 2019-09-10 | Soundhound, Inc. | Dual mode speech recognition |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US10028069B1 (en) | 2017-06-22 | 2018-07-17 | Sonos, Inc. | Immersive audio in a media playback system |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US11189273B2 (en) | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
WO2019005227A1 (en) | 2017-06-30 | 2019-01-03 | Google Llc | METHODS, SYSTEMS AND MEDIA FOR VOICE CALL OPERATIONS |
US10038419B1 (en) | 2017-07-06 | 2018-07-31 | Bose Corporation | Last mile equalization |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US11424947B2 (en) | 2017-08-02 | 2022-08-23 | Lenovo (Singapore) Pte. Ltd. | Grouping electronic devices to coordinate action based on context awareness |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10204624B1 (en) | 2017-08-14 | 2019-02-12 | Lenovo (Singapore) Pte. Ltd. | False positive wake word |
US10304475B1 (en) | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
KR102411766B1 (ko) | 2017-08-25 | 2022-06-22 | 삼성전자주식회사 | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 |
US20190066710A1 (en) | 2017-08-28 | 2019-02-28 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10553235B2 (en) | 2017-08-28 | 2020-02-04 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10515625B1 (en) | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
US10847149B1 (en) | 2017-09-01 | 2020-11-24 | Amazon Technologies, Inc. | Speech-based attention span for voice user interface |
US11361763B1 (en) | 2017-09-01 | 2022-06-14 | Amazon Technologies, Inc. | Detecting system-directed speech |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
KR102338376B1 (ko) | 2017-09-13 | 2021-12-13 | 삼성전자주식회사 | 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법 |
US11314214B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Geographic analysis of water conditions |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
US10586534B1 (en) | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
KR102543693B1 (ko) | 2017-10-17 | 2023-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR102421255B1 (ko) | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
CN107808670B (zh) | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
US10567515B1 (en) | 2017-10-26 | 2020-02-18 | Amazon Technologies, Inc. | Speech processing performed with respect to first and second user profiles in a dialog session |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107895573B (zh) | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
CN107832837B (zh) | 2017-11-28 | 2021-09-28 | 南京大学 | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10546593B2 (en) | 2017-12-04 | 2020-01-28 | Apple Inc. | Deep learning driven multi-channel filtering for speech enhancement |
US10445365B2 (en) | 2017-12-04 | 2019-10-15 | Amazon Technologies, Inc. | Streaming radio with personalized content integration |
US10777189B1 (en) | 2017-12-05 | 2020-09-15 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10847137B1 (en) | 2017-12-12 | 2020-11-24 | Amazon Technologies, Inc. | Trigger word detection using neural network waveform processing |
US10885091B1 (en) | 2017-12-12 | 2021-01-05 | Amazon Technologies, Inc. | System and method for content playback |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10540971B2 (en) | 2017-12-15 | 2020-01-21 | Blue Jeans Network, Inc. | System and methods for in-meeting group assistance using a virtual assistant |
US10663313B2 (en) | 2017-12-15 | 2020-05-26 | Google Llc | Providing traffic warnings to a user based on return journey |
JP6752870B2 (ja) | 2017-12-18 | 2020-09-09 | ネイバー コーポレーションNAVER Corporation | 複数のウェイクワードを利用して人工知能機器を制御する方法およびシステム |
US11409816B2 (en) | 2017-12-19 | 2022-08-09 | Motorola Solutions, Inc. | Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information |
WO2019129511A1 (en) | 2017-12-26 | 2019-07-04 | Robert Bosch Gmbh | Speaker identification with ultra-short speech segments for far and near field voice assistance applications |
EP3732626A4 (en) | 2017-12-28 | 2021-09-15 | Syntiant | ALWAYS ACTIVE KEYWORD DETECTOR |
US10614811B2 (en) | 2017-12-29 | 2020-04-07 | Intel Corporation | Hierarchical speech recognition resolution |
CN111512365B (zh) | 2017-12-31 | 2023-06-13 | 美的集团股份有限公司 | 对多个家庭装置进行控制的方法和系统 |
CN111357048B (zh) | 2017-12-31 | 2024-10-08 | 美的集团股份有限公司 | 用于控制家庭助手装置的方法和系统 |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US10795332B2 (en) | 2018-01-16 | 2020-10-06 | Resilience Magnum IP, LLC | Facilitating automating home control |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
KR102115222B1 (ko) | 2018-01-24 | 2020-05-27 | 삼성전자주식회사 | 사운드를 제어하는 전자 장치 및 그 동작 방법 |
CN108198548B (zh) | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其系统 |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US11024307B2 (en) | 2018-02-08 | 2021-06-01 | Computime Ltd. | Method and apparatus to provide comprehensive smart assistant services |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10720173B2 (en) | 2018-02-21 | 2020-07-21 | Bose Corporation | Voice capture processing modified by back end audio processing state |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US10491962B2 (en) | 2018-03-14 | 2019-11-26 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications |
US10749828B2 (en) | 2018-03-14 | 2020-08-18 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications |
US11127405B1 (en) | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10685669B1 (en) | 2018-03-20 | 2020-06-16 | Amazon Technologies, Inc. | Device selection from audio data |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
WO2019195799A1 (en) | 2018-04-05 | 2019-10-10 | Synaptics Incorporated | Context-aware control for smart devices |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US10720166B2 (en) | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
CN108520741B (zh) | 2018-04-12 | 2021-05-04 | 科大讯飞股份有限公司 | 一种耳语音恢复方法、装置、设备及可读存储介质 |
US10679615B2 (en) | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
CN108538305A (zh) | 2018-04-20 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
EP3564949A1 (en) | 2018-04-23 | 2019-11-06 | Spotify AB | Activation trigger processing |
KR20230128586A (ko) | 2018-05-04 | 2023-09-05 | 구글 엘엘씨 | 사용자와 자동화된 어시스턴트 인터페이스 간의 거리에 따른 자동화된 어시스턴트 콘텐츠의 생성 및/또는 적용 |
US10803864B2 (en) | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11308947B2 (en) | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
JP2019204025A (ja) | 2018-05-24 | 2019-11-28 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、及びプログラム |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10777195B2 (en) | 2018-05-31 | 2020-09-15 | International Business Machines Corporation | Wake command nullification for digital assistance and voice recognition technologies |
US20190371324A1 (en) | 2018-06-01 | 2019-12-05 | Apple Inc. | Suppression of voice response by device rendering trigger audio |
CN112272819B (zh) | 2018-06-05 | 2024-04-26 | 三星电子株式会社 | 被动唤醒用户交互设备的方法和系统 |
CN112166350B (zh) | 2018-06-05 | 2023-12-05 | 谷歌有限责任公司 | 智能设备中的超声感测的系统和方法 |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US11373645B1 (en) | 2018-06-18 | 2022-06-28 | Amazon Technologies, Inc. | Updating personalized data on a speech interface device |
US10832671B2 (en) | 2018-06-25 | 2020-11-10 | Intel Corporation | Method and system of audio false keyphrase rejection using speaker recognition |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
NL2021308B1 (en) | 2018-07-16 | 2020-01-24 | Hazelebach & Van Der Ven Holding B V | Methods for a voice processing system |
JP7000268B2 (ja) | 2018-07-18 | 2022-01-19 | 株式会社東芝 | 情報処理装置、情報処理方法、およびプログラム |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
GB2576016B (en) | 2018-08-01 | 2021-06-23 | Arm Ip Ltd | Voice assistant devices |
US11514917B2 (en) | 2018-08-27 | 2022-11-29 | Samsung Electronics Co., Ltd. | Method, device, and system of selectively using multiple voice data receiving devices for intelligent service |
TWI683306B (zh) | 2018-08-28 | 2020-01-21 | 仁寶電腦工業股份有限公司 | 多語音助理之控制方法 |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
KR102225984B1 (ko) | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US20200090647A1 (en) | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10650807B2 (en) | 2018-09-18 | 2020-05-12 | Intel Corporation | Method and system of neural network keyphrase detection |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
KR20200034430A (ko) | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US10861444B2 (en) | 2018-09-24 | 2020-12-08 | Rovi Guides, Inc. | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence |
US10950249B2 (en) | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
KR102606789B1 (ko) | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US20200110571A1 (en) | 2018-10-05 | 2020-04-09 | Sonos, Inc. | Systems and methods for media content selection |
KR20200043902A (ko) | 2018-10-18 | 2020-04-28 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10943599B2 (en) | 2018-10-26 | 2021-03-09 | Spotify Ab | Audio cancellation for voice recognition |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
KR102570384B1 (ko) | 2018-12-27 | 2023-08-25 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
JP2020112692A (ja) | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
US11349834B2 (en) | 2019-01-30 | 2022-05-31 | Ncr Corporation | Multi-factor secure operation authentication |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US10971159B2 (en) | 2019-02-19 | 2021-04-06 | Salesforce.Com, Inc. | Cross account access for a virtual personal assistant via voice printing |
CN109712626B (zh) | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
US10964314B2 (en) | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US10984783B2 (en) | 2019-03-27 | 2021-04-20 | Intel Corporation | Spoken keyword detection based utterance-level wake on intent system |
WO2020196955A1 (ko) | 2019-03-27 | 2020-10-01 | 엘지전자 주식회사 | 인공 지능 기기 및 인공 지능 기기의 동작 방법 |
US20200310751A1 (en) | 2019-03-29 | 2020-10-01 | Qualcomm Incorporated | System and method of managing device sound level |
DK3726856T3 (da) | 2019-04-17 | 2023-01-09 | Oticon As | Høreanordning omfattende en nøgleordsdetektor og en egen stemme-detektor |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US20200409926A1 (en) | 2019-06-28 | 2020-12-31 | Rovi Guides, Inc. | Automated contact creation based on content communications |
KR20190092333A (ko) | 2019-07-19 | 2019-08-07 | 엘지전자 주식회사 | 음성 인식 디바이스와 통신하는 장치, 음성 인식 능력을 가진 장치 및 음성 인식 능력을 가진 장치를 제어하는 방법 |
US11653148B2 (en) | 2019-07-22 | 2023-05-16 | Apple Inc. | Modifying and transferring audio between devices |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11159878B1 (en) | 2019-08-15 | 2021-10-26 | Amazon Technologies, Inc. | Autonomously motile device with beamforming |
JP7191793B2 (ja) | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11172328B2 (en) | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US12001754B2 (en) | 2019-11-21 | 2024-06-04 | Motorola Mobility Llc | Context based media selection based on preferences setting for active consumer(s) |
KR20210066647A (ko) | 2019-11-28 | 2021-06-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CA3143944A1 (en) | 2019-12-10 | 2021-06-17 | Rovi Guides, Inc. | Systems and methods for local automated speech-to-text processing |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11445301B2 (en) | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11206052B1 (en) | 2020-06-18 | 2021-12-21 | HAJEN Co., Ltd | Smart speaker |
US20220050585A1 (en) | 2020-08-14 | 2022-02-17 | Apple Inc. | Audio media playback user interface |
US11709653B1 (en) | 2022-04-11 | 2023-07-25 | Google Llc | Contextual assistant using mouse pointing or touch cues |
KR20230164398A (ko) | 2022-05-25 | 2023-12-04 | 현대자동차주식회사 | 차량 및 그 제어 방법 |
-
2016
- 2016-04-14 US US15/098,760 patent/US10743101B2/en active Active
- 2016-04-14 US US15/098,867 patent/US9826306B2/en active Active
- 2016-04-14 US US15/098,718 patent/US10097919B2/en active Active
- 2016-04-14 US US15/098,892 patent/US9820039B2/en active Active
- 2016-04-14 US US15/098,805 patent/US9772817B2/en active Active
-
2017
- 2017-02-21 WO PCT/US2017/018728 patent/WO2017147075A1/en active Application Filing
- 2017-02-21 CN CN201780025029.7A patent/CN109076285B/zh active Active
- 2017-02-21 KR KR1020217008937A patent/KR20210035351A/ko active Application Filing
- 2017-02-21 CN CN202010302650.7A patent/CN111479196B/zh active Active
- 2017-02-21 CN CN201780025028.2A patent/CN109076284B/zh active Active
- 2017-02-21 KR KR1020187027452A patent/KR102095250B1/ko active IP Right Grant
- 2017-02-21 KR KR1020237032988A patent/KR20230149835A/ko not_active Application Discontinuation
- 2017-02-21 EP EP21180778.9A patent/EP3974957A1/en active Pending
- 2017-02-21 KR KR1020207034425A patent/KR102343902B1/ko active IP Right Grant
- 2017-02-21 US US15/438,749 patent/US10499146B2/en active Active
- 2017-02-21 WO PCT/US2017/018739 patent/WO2017147081A1/en active Application Filing
- 2017-02-21 KR KR1020187027451A patent/KR102080002B1/ko active IP Right Grant
- 2017-02-21 KR KR1020227016656A patent/KR102584751B1/ko active IP Right Grant
- 2017-02-21 EP EP17757075.1A patent/EP3420737B1/en active Active
- 2017-02-21 EP EP17757070.2A patent/EP3420736B1/en active Active
- 2017-02-21 CA CA3015491A patent/CA3015491C/en active Active
- 2017-02-21 KR KR1020217041862A patent/KR102422270B1/ko active IP Right Grant
- 2017-02-21 CA CA3015496A patent/CA3015496C/en active Active
- 2017-02-21 KR KR1020207004425A patent/KR102187147B1/ko active IP Right Grant
- 2017-02-21 AU AU2017223395A patent/AU2017223395B2/en active Active
- 2017-02-21 CN CN202010179593.8A patent/CN111510821B/zh active Active
- 2017-02-21 JP JP2018544254A patent/JP6511590B1/ja active Active
- 2017-02-21 KR KR1020207008486A patent/KR102234804B1/ko active Application Filing
- 2017-02-21 EP EP23188226.7A patent/EP4258690A3/en active Pending
- 2017-02-21 AU AU2017222436A patent/AU2017222436B2/en active Active
- 2017-02-21 JP JP2018544253A patent/JP6511589B2/ja active Active
- 2017-11-13 US US15/811,468 patent/US10212512B2/en active Active
- 2017-11-20 US US15/818,051 patent/US10225651B2/en active Active
-
2018
- 2018-10-08 US US16/154,071 patent/US10555077B2/en active Active
-
2019
- 2019-03-01 US US16/290,599 patent/US11006214B2/en active Active
- 2019-04-02 AU AU2019202257A patent/AU2019202257B2/en active Active
- 2019-04-08 JP JP2019073349A patent/JP7026078B2/ja active Active
- 2019-04-08 JP JP2019073348A patent/JP2019146229A/ja active Pending
- 2019-09-26 AU AU2019236722A patent/AU2019236722B2/en active Active
- 2019-12-02 US US16/700,607 patent/US10764679B2/en active Active
-
2020
- 2020-02-03 US US16/780,483 patent/US11184704B2/en active Active
- 2020-08-10 US US16/989,350 patent/US12047752B2/en active Active
- 2020-08-31 US US17/008,104 patent/US11212612B2/en active Active
-
2021
- 2021-05-04 AU AU2021202786A patent/AU2021202786B2/en active Active
- 2021-05-10 US US17/315,599 patent/US11750969B2/en active Active
- 2021-08-06 AU AU2021212112A patent/AU2021212112B2/en active Active
- 2021-10-04 JP JP2021163622A patent/JP7346516B2/ja active Active
- 2021-11-05 JP JP2021181224A patent/JP2022020760A/ja active Pending
- 2021-11-22 US US17/532,674 patent/US11832068B2/en active Active
- 2021-12-27 US US17/562,412 patent/US11736860B2/en active Active
-
2022
- 2022-12-20 AU AU2022291481A patent/AU2022291481B2/en active Active
-
2023
- 2023-01-13 AU AU2023200179A patent/AU2023200179B2/en active Active
- 2023-02-23 AU AU2023201078A patent/AU2023201078A1/en not_active Abandoned
- 2023-05-23 AU AU2023203239A patent/AU2023203239B2/en active Active
- 2023-07-21 JP JP2023118922A patent/JP2023134786A/ja active Pending
- 2023-08-21 US US18/453,052 patent/US20240244368A1/en active Pending
- 2023-09-01 US US18/460,198 patent/US20240305925A1/en active Pending
- 2023-09-29 AU AU2023237192A patent/AU2023237192A1/en active Pending
- 2023-11-27 US US18/520,531 patent/US20240214726A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004354721A (ja) * | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
JP2010141748A (ja) * | 2008-12-12 | 2010-06-24 | Yamaha Corp | 遠隔制御装置および遠隔制御システム |
Non-Patent Citations (1)
Title |
---|
How to start using Google app voice commands to make your life easier;Jacob Siegal;《BGR News》;20160122;第1页 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109076284B (zh) | 媒体回放系统的语音控制 | |
US10971139B2 (en) | Voice control of a media playback system | |
CN112640475A (zh) | 用于将回放设备与语音助理服务相关联的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |