CN109716429B - 由多个设备进行的语音检测 - Google Patents
由多个设备进行的语音检测 Download PDFInfo
- Publication number
- CN109716429B CN109716429B CN201780056695.7A CN201780056695A CN109716429B CN 109716429 B CN109716429 B CN 109716429B CN 201780056695 A CN201780056695 A CN 201780056695A CN 109716429 B CN109716429 B CN 109716429B
- Authority
- CN
- China
- Prior art keywords
- voice
- nmd
- playback
- nmds
- recordings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title abstract description 6
- 238000000034 method Methods 0.000 claims abstract description 73
- 239000008187 granular material Substances 0.000 claims description 14
- 238000004891 communication Methods 0.000 description 32
- 238000012545 processing Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 230000004044 response Effects 0.000 description 13
- 238000003860 storage Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000007670 refining Methods 0.000 description 5
- 208000032580 NMDA receptor encephalitis Diseases 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本文公开了用于由多个NMD进行语音检测的示例技术。示例实现可以涉及:从NMD集合接收语音记录集合,以及识别语音记录子集,其中根据语音记录子集来确定给定语音命令。示例实现还可以涉及:使所识别的语音记录子集被分析以确定给定语音命令。
Description
相关申请的交叉引用
本申请要求于2016年7月15日提交的第15/211,748号美国专利申请的优先权,该申请通过引用整体并入本文。本申请还通过引用将2016年4月14日提交的题为“DefaultPlayback Device Designation”的第15/098,867号美国申请的全部内容并入本文。
技术领域
本公开内容涉及消费品,并且更特别地,涉及针对媒体回放或其一些方面的方法、系统、产品、特征、服务和其他元素。
背景技术
直到在2003年SONOS公司申请题为“Method for Synchronizing Audio Playbackbetween Multiple Networked Devices”的其首批专利申请之一,并且在2005年开始提供媒体回放系统用于出售时,用于以大声设置访问和收听数字音频的选择受到限制。Sonos无线高保真系统使人能经由一个或更多个联网回放设备来体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,一个人可以在具有联网回放设备的任何房间中播放他或她想要的内容。另外,使用控制器,例如,可以利用回放设备将不同的歌曲流送至每个房间,房间可以被分组在一起以用于同步回放,或者可以在所有房间中同步地收听同一歌曲。
鉴于对数字媒体的日益增长的兴趣,仍然需要开发消费者可访问的技术以进一步增强收听体验。
附图说明
考虑以下描述、所附权利要求以及附图,可以更好地理解本公开技术的特征、方面和优点,在附图中:
图1示出了其中可以实践某些实施方式的示例媒体回放系统配置;
图2示出了示例回放设备的功能框图;
图3示出了示例控制设备的功能框图;
图4示出了示例控制器接口;
图5示出了示例的多个网络设备;
图6示出了示例网络麦克风设备的功能框图;
图7示出了根据示例实施方式的技术。
附图是出于说明示例实施方式的目的,但是应该理解的是,本发明不限于附图中示出的布置和手段。
具体实施方式
I.概述
大声地收听媒体内容可以是涉及家人、朋友和客人的社交活动。媒体内容可以包括例如谈话电台、书籍、来自电视的音频、存储在本地驱动器上的音乐、来自媒体源(例如,Radio,Radio,Google PlayTM,iTunes Radio)的音乐以及其他可听的材料。在家庭中,例如,人们可以在聚会和其他社交集会上大声播放音乐。在这样的环境中,人们可能希望在一个收听区或同时在多个收听区中播放音乐,使得每个收听区中的音乐可以同步,而没有可听的回声或干扰(glitch)。
在使用语音命令控制音频回放设备或系统以及家庭中的其他设备(例如灯)时,可以丰富这样的体验。例如,用户可能希望使用各种语音命令来改变音频内容、播放列表或收听区,将音乐曲目添加到播放列表或回放队列,或者改变回放设置(例如,播放、暂停、下一曲目、前一曲目、回放音量和EQ设置等)。一些示例音频回放设备或系统可以包括用于检测这样的语音命令的麦克风。
在一些情况下,大声地收听媒体内容是个人体验。例如,个人可以在早晨在工作之前、在锻炼期间、在夜晚在晚餐期间或者在家中或工作中在一天中的其他时间为自己大声播放音乐。对于这些个人体验,个人可以选择将音频内容的回放限制到单个收听区或区域。在个人可以使用语音命令来选择收听区、音频内容和回放设置以及其他设置时,可以丰富这样的体验。
在一些情况下,可以使用联网麦克风设备(NMD)来控制家庭。NMD可以是例如能够经由麦克风接收语音输入的回放设备、服务器或系统。另外,NMD可以是除了回放设备、服务器或系统之外的能够经由麦克风接收语音输入的设备(例如, )。通过引用在此并入的题为“Default Playback Device Designation”的第15/098,867号美国申请提供了支持语音的家庭体系结构的示例。
在一些常规方法中,单个NMD可以独立地接收或处理语音输入或命令。的确,一些商业可用设备设想单个NMD的存在。因此,在多个这样的常规NMD存在于单个位置的情况下,常规NMD可能独立地对单个语音输入做出反应。在存在多个NMD的这样的家庭中,协调并识别NMD集合可以提供增强用户体验的改进的语音识别技术,在该NMD集合中根据相应NMD的语音记录来确定语音命令。
在一些示例中,给定家庭中的NMD可以各自具有用于记录来自用户的语音输入或命令的一个或更多个麦克风。计算设备可以从一个或更多个NMD接收相应的语音记录集合,并且在计算设备处本地地处理语音记录或者在通过一个或更多个网络连接至计算设备的另一设备上远程地处理语音记录。例如,计算设备可以与联网麦克风系统服务器、一个或更多个NMD、回放设备和/或另一计算设备通信以接收或处理语音记录。在一些实施方式中,计算设备、媒体回放系统服务器和/或联网麦克风系统服务器可以是基于云的服务器系统。在其他实施方式中,计算设备本身可以是NMD、回放设备或本文中描述的任何其他设备或服务器。
计算设备可以在从多个NMD接收的语音记录集合中识别要处理哪个语音记录以确定给定语音命令。例如,在一些实施方式中,来自登记语音输入的任何NMD的语音输入被处理。可替选地,计算设备可以识别记录的子集。该子集可能包括将给定语音命令登记为处于给定阈值(例如阈值声压级)或以上的任何NMD。作为另一示例,该子集可能包括来自预定义数目个NMD(例如,将语音命令登记为处于给定阈值或以上的三个NMD)的语音输入。其他示例也是可行的。
例如,计算设备可以基于预定规则从多个记录的语音输入之中进行选择。为了说明,在NMD是回放设备的情况下,可以基于回放设备的区配置选择语音输入的子集以用于处理。例如,来自结合在一起作为绑定对(例如立体对或环绕声配置)的多个回放设备的给定命令的记录可以被一起处理。在一些情况下,来自绑定区之外的设备的记录可以被忽略。作为另一示例,来自被分组在一起(作为区组)的多个区的给定命令的记录可以被一起处理。还可以设想其他示例。
计算设备可以使所识别的语音记录子集被分析以确定给定语音命令。换言之,多个NMD的语音记录可以被处理以确定单个语音命令。处理语音记录的特定子集可以提高细化和处理语音记录的精确度,这又能实现语音命令的更高质量的语音至文本转换。更特别地,细化所识别的记录可以防止对相同语音记录(或语音记录的相同部分)的重复、冗余或分开的处理。在其他实例中,识别语音记录子集可以减少确定给定语音命令的处理时间,可能通过避免对相同语音记录的重复、冗余或分开的处理而减少处理时间。本文中进一步描述示例。
除了其他示例之外,NMD可以响应于触发来连续进行记录或开始进行记录。例如,给定NMD可以连续记录环境噪声,但可能仅在以下情况下将其记录提供给计算设备(以可能包括在处理中):给定NMD(1)本身被唤醒词或语音输入唤醒,或者(2)从另一设备接收到用以将记录提供给计算设备的指令。在这样的实现中,可以触发对给定NMD的记录的处理,尽管给定NMD不一定登记远场语音输入本身(例如,通过登记唤醒词或语音输入)。
虽然本文中描述的一些示例可以涉及由给定的行动者例如“用户”和/或其他实体执行的功能,但是应该理解的是,这仅仅出于说明的目的。除非权利要求本身的语言明确要求,否则权利要求不应该被解释为需要任何这样的示例行动者的行动。本领域普通技术人员将理解的是,本公开内容包括许多其他实施方式。此外,本文中描述的示例可以扩展到通过以任何合适的方式组合示例特征而形成的多个实施方式。
II.示例操作环境
图1示出了其中可以实践或实现本文中公开的一个或更多个实施方式的媒体回放系统100的示例配置。所示出的媒体回放系统100与具有若干房间和空间——例如主卧室、办公室、餐厅和起居室——的示例家庭环境相关联。如图1的示例中所示,媒体回放系统100包括回放设备102至回放设备124、控制设备126和128以及有线或无线网络路由器130。
可以在下面的部分中找到与示例媒体回放系统100的不同组件以及不同组件可以如何交互以向用户提供媒体体验有关的进一步讨论。虽然本文中的讨论可以通常涉及示例媒体回放系统100,但是本文中描述的技术不限于如图1所示的家庭环境等内的应用。例如,本文中描述的技术可以在以下可能期望多区音频的环境中有用:例如商业环境如餐馆、商场或机场,交通工具如运动型多功能车(SUV)、公共汽车或汽车、舰或船、飞机等。
a.示例回放设备
图2示出了示例回放设备200的功能框图,该示例回放设备200可以被配置为图1的媒体回放系统100的回放设备102至回放设备124中的一个或更多个。回放设备200可以包括:处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、包括无线接口216和有线接口218的网络接口214以及麦克风220。在一种情况下,回放设备200可以不包括扬声器212,而可以包括用于将回放设备200连接至外部扬声器的扬声器接口。在另一种情况下,回放设备200可以既不包括扬声器212也不包括音频放大器210,而可以包括用于将回放设备200连接至外部音频放大器或视听接收器的音频接口。
在一个示例中,处理器202可以是被配置成根据存储在存储器206中的指令来处理输入数据的时钟驱动计算组件。存储器206可以是被配置成存储能够由处理器202执行的指令的有形计算机可读介质。例如,存储器206可以是可以加载有能够由处理器202执行以实现某些功能的软件组件204中的一个或更多个的数据存储装置。在一个示例中,功能可以涉及回放设备200从音频源或另一回放设备检索音频数据。在另一示例中,功能可以涉及回放设备200向网络上的另一设备或回放设备发送音频数据。在又一示例中,功能可以涉及回放设备200与一个或更多个回放设备的配对以创建多声道音频环境。
某些功能可以涉及回放设备200与一个或更多个其他回放设备同步对音频内容的回放。在同步回放期间,收听者优选地将不能感知回放设备200对音频内容的回放与一个或更多个其他回放设备对音频内容的回放之间的时间延迟差异。在此通过引用并入本文的题为“System and method for synchronizing operations among a plurality ofindependently clocked digital data processing devices”的第8,234,395号美国专利更详细地提供了用于回放设备之间的音频回放同步的一些示例。
存储器206还可以被配置成存储与回放设备200相关联的数据,例如回放设备200是其一部分的一个或更多个区和/或区组、可由回放设备200访问的音频源、或者可与回放设备200(或某些其他回放设备)相关联的回放队列。该数据可以被存储为周期性地更新并且用来描述回放设备200的状态的一个或更多个状态变量。存储器206还可以包括这样的数据:该数据与媒体系统的其他设备的状态相关联,并且不时地在设备之间共享,使得设备中的一个或更多个具有与系统相关联的最新数据。其他实施方式也是可行的。
音频处理组件208可以包括一个或更多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施方式中,音频处理组件208中的一个或更多个可以是处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地改变音频内容以产生音频信号。然后,可以将产生的音频信号提供至音频放大器210以用于放大并且通过扬声器212进行回放。特别地,音频放大器210可以包括被配置成将音频信号放大至用于驱动扬声器212中的一个或更多个的水平的设备。扬声器212可以包括单独的换能器(例如,“驱动器”),或者包括具有一个或更多个驱动器的外壳的完整扬声器系统。扬声器212的特定驱动器可以包括例如超低音扬声器(例如,用于低频)、中档驱动器(例如,用于中频)和/或高频扬声器(例如,用于高频)。在一些情况下,一个或更多个扬声器212中的每个换能器可以由音频放大器210的单独相应音频放大器来驱动。除了产生用于由回放设备200回放的模拟信号以外,音频处理组件208可以被配置成对要被发送至一个或更多个其他回放设备以供回放的音频内容进行处理。
可以例如经由音频线路输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由回放设备200处理和/或回放的音频内容。
网络接口214可以被配置成促进回放设备200与数据网络上的一个或更多个其他设备之间的数据流动。同样地,回放设备200可以被配置成通过数据网络从与该回放设备200通信的一个或更多个其他回放设备、局域网内的网络设备或者广域网如互联网上的音频内容源接收音频内容。在一个示例中,可以以包含基于互联网协议(IP)的源地址和基于IP的目标地址的数字分组数据的形式发送由回放设备200发送和接收的音频内容和其他信号。在这样的情况下,网络接口214可以被配置成对数字分组数据进行解析,使得回放设备200正确地接收和处理去往该回放设备200的数据。
如所示出的,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为回放设备200提供网络接口功能以根据通信协议(例如任何无线标准,包括IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备200相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)进行无线通信。有线接口218可以为回放设备200提供网络接口功能以根据通信协议(例如,IEEE 802.3)通过有线连接与其他设备进行通信。虽然图2中示出的网络接口214包括无线接口216和有线接口218两者,但是在一些实施方式中,网络接口214可以仅包括无线接口或仅包括有线接口。
麦克风220可以被布置成检测回放设备200的环境中的声音。例如,麦克风可以安装在回放设备的壳体的外壁上。麦克风可以是现在已知或以后开发的任何类型的麦克风,例如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对扬声器220的频率范围的一部分敏感。一个或更多个扬声器220可以与麦克风220相反地操作。在一些方面,回放设备200可能不包括麦克风220。
在一个示例中,可以将回放设备200与一个其他回放设备进行配对以播放音频内容的两个分开的音频分量。例如,回放设备200可以被配置成播放左声道音频分量,而其他回放设备可以被配置成播放右声道音频分量,从而产生或增强音频内容的立体声效果。配对的回放设备(也被称为“绑定的回放设备”)还可以与其他回放设备同步地播放音频内容。
在另一示例中,可以将回放设备200与一个或更多个其他回放设备在声音上联合以形成单个联合的回放设备。因为联合的回放设备可以具有额外的扬声器驱动器,其中可以通过该扬声器驱动器来呈现音频内容,所以联合的回放设备可以被配置成与非联合的回放设备或配对的回放设备不同地处理和再现声音。例如,如果回放设备200是被设计成呈现低频范围音频内容的回放设备(即,超低音扬声器),则回放设备200可以与被设计成呈现全频范围音频内容的回放设备联合。在这样的情况下,当与低频回放设备200联合时,全频范围回放设备可以被配置成仅呈现音频内容的中频分量和高频分量,而低频范围回放设备200呈现音频内容的低频分量。联合的回放设备还可以与单个回放设备或另一联合的回放设备配对。
举例来说,SONOS公司目前公开发售(或已经公开发售)某些回放设备,某些回放设备包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”和“SUB”。另外地或可替选地,任何其他过去的、现在的和/或将来的回放设备可以用于实现本文公开的示例实施方式的回放设备。另外,应当理解的是,回放设备不限于图2中示出的示例或SONOS产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括用于个人移动媒体回放设备的对接站或与该对接站交互。在又一示例中,回放设备可以集成至另一设备或组件如电视、照明器材或供室内或室外使用的一些其他设备。
b.示例回放区配置
返回参照图1的媒体回放系统100,环境可以具有一个或更多个回放区,每个回放区具有一个或更多个回放设备。媒体回放系统100可以与一个或更多个回放区一起建立,此后,一个或更多个区可以被添加或移除以得到图1中示出的示例配置。可以根据不同的房间或空间——例如办公室、浴室、主卧室、卧室、厨房、餐厅、起居室和/或阳台——给每个区命名。在一种情况下,单个回放区可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个回放区。
如图1示出的,阳台、餐厅、厨房、浴室、办公室和卧室区各有一个回放设备,而起居室区和主卧室区各有多个回放设备。在起居室区中,回放设备104、106、108和110可以被配置成:作为单独的回放设备、作为一个或更多个绑定的回放设备、作为一个或更多个联合的回放设备或者其任意组合来同步地播放音频内容。类似地,在主卧室的情况下,回放设备122和124可以被配置成:作为单独的回放设备、作为绑定的回放设备或者作为联合的回放设备来同步地播放音频内容。
在一个示例中,图1的环境中的一个或更多个回放区可以各自正在播放不同的音频内容。例如,用户可以正在阳台区中烧烤并且收听正由回放设备102播放的嘻哈音乐,同时另一用户可以正在厨房区中准备食物并且收听正由回放设备114播放的古典音乐。在另一示例中,回放区可以与另一回放区同步地播放相同的音频内容。例如,用户可以在办公室区中,在该办公室区中回放设备118正在播放与阳台区中的回放设备102正播放的摇滚音乐相同的摇滚音乐。在这样的情况下,回放设备102和回放设备118可以同步播放摇滚音乐,使得当用户在不同回放区之间移动时可以无缝地(或至少基本上无缝地)享受正被大声播放的音频内容。如在先前引用的第8,234,395号美国专利中描述的,可以以与回放设备之间的同步方式类似的方式实现回放区之间的同步。
如上面提出的,可以动态地修改媒体回放系统100的区配置,并且在一些实施方式中,媒体回放系统100支持许多配置。例如,如果用户物理地将一个或更多个回放设备移动至区或从区移出一个或更多个回放设备,则媒体回放系统100可以被重新配置以适应改变。例如,如果用户物理地将回放设备102从阳台区移动至办公室区,则办公室区现在可以包括回放设备118和回放设备102两者。如果需要,则可以经由控制设备如控制设备126和控制设备128将回放设备102与办公室区配对或分组在一起和/或对该回放设备102重命名。另一方面,如果一个或更多个回放设备被移动至家庭环境中的尚不是回放区的特定区域,则可以针对该特定区域创建新的回放区。
此外,可以将媒体回放系统100的不同回放区动态地组合成区组或将其划分成单独的回放区。例如,可以将餐厅区和厨房区114组合成用于晚餐聚会的区组,使得回放设备112和114可以同步地呈现音频内容。另一方面,如果用户希望在起居室空间中收听音乐而另一用户希望看电视,则可以将起居室区划分成包括回放设备104的电视区以及包括回放设备106、108和110的收听区。
c.示例控制设备
图3示出了示例控制设备300的功能框图,该示例控制设备300可以被配置为媒体回放系统100的控制设备126和控制设备128中的一者或两者。如示出的,控制设备300可以包括处理器302、存储器304、网络接口306、用户接口308、麦克风310和软件组件312。在一个示例中,控制设备300可以是用于媒体回放系统100的专用控制器。在另一示例中,控制设备300可以是可以安装媒体回放系统控制器应用软件的网络设备,例如,iPhoneTM、iPadTM或者任何其他智能电话、平板计算机或网络设备(例如,联网的计算机如PC或MacTM)。
处理器302可以被配置成执行与促进对媒体回放系统100的用户访问、控制和配置有关的功能。存储器304可以是可以加载能由处理器302执行以执行那些功能的软件组件中的一个或更多个的数据存储装置。存储器304还可以被配置成存储媒体回放系统控制器应用软件以及与媒体回放系统100和用户相关联的其他数据。
在一个示例中,网络接口306可以基于行业标准(例如,包括IEEE802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15的无线标准、4G移动通信标准等)。网络接口306可以提供用于控制设备300与媒体回放系统100中的其他设备进行通信的装置。在一个示例中,可以经由网络接口306在控制设备300与其他设备之间传送数据和信息(例如,如状态变量)。例如,控制设备300可以经由网络接口306从回放设备或另一网络设备接收媒体回放系统100中的回放区和区组配置或者控制设备300可以经由网络接口306将媒体回放系统100中的回放区和区组配置发送至另一回放设备或网络设备。在一些情况下,其他网络设备可以是另一控制设备。
还可以经由网络接口306将回放设备控制命令如音量控制和音频回放控制从控制设备300传送至回放设备。如上面提出的,用户还可以使用控制设备300来执行对媒体回放系统100的配置的改变。配置改变可以包括:将一个或更多个回放设备添加至区或从区移除一个或更多个回放设备;将一个或更多个区添加至区组或从区组移除一个或更多个区;形成绑定的或联合的播放器;从绑定的或联合的播放器分离一个或更多个回放设备等。因此,有时可以将控制设备300称为控制器,而不论控制设备300是专用控制器还是安装有媒体回放系统控制器应用软件的网络设备。
控制设备300可以包括麦克风310。麦克风310可以被布置成检测控制设备300的环境中的声音。麦克风310可以是现在已知或以后开发的任何类型的麦克风,例如电容式麦克风、驻极体电容式麦克风或动态麦克风。麦克风可以对频率范围的一部分敏感。两个或更多个麦克风310可以被布置成捕获音频源(例如,语音、可听声音)的位置信息以及/或者帮助过滤背景噪声。
控制设备300的用户接口308可以被配置成通过提供控制器接口例如图4示出的控制器接口400来促进对媒体回放系统100的用户访问和控制。控制器接口400包括回放控制区域410、回放区区域420、回放状态区域430、回放队列区域440以及音频内容源区域450。示出的用户接口400仅是可以在网络设备如图3的控制设备300(和/或图1的控制设备126和128)上提供并且由用户访问以控制媒体回放系统如媒体回放系统100的用户接口的一个示例。可替选地,可以在一个或更多个网络设备上实现不同格式、样式和交互序列的其他用户接口以提供对媒体回放系统的可比较的控制访问。
回放控制区域410可以包括用于使所选择的回放区或区组中的回放设备播放或暂停、快进、倒回、跳到下一首、跳到上一首、进入/退出随机模式、进入/退出重复模式、进入/退出交叉渐变模式的可选(例如,通过触摸或通过使用光标)图标。回放控制区域410还可以包括用于修改均衡设定和回放音量以及其他可能性的可选图标。
回放区区域420可以包括媒体回放系统100内的回放区的表示。在一些实施方式中,回放区的图形表示可以是可选的以产生另外的可选图标,以管理或配置媒体回放系统中的回放区,例如,绑定区的创建、区组的创建、区组的分离和区组的重命名,以及其他可能性。
例如,如示出的,可以在回放区的图形表示中的每一个内设置“分组”图标。在特定区的图形表示内设置的“分组”图标可以是可选的,以产生用于选择媒体回放系统中的要与该特定区分组在一起的一个或更多个其他区的选项。一旦被分组,已经与特定区分组在一起的区中的回放设备将被配置成与特定区中的回放设备同步地播放音频内容。类似地,可以在区组的图形表示内设置“分组”图标。在这种情况下,“分组”图标可以是可选的,以产生用于取消选择区组中的要从该区组移除的一个或更多个区的选项。用于经由用户接口如用户接口400对区进行分组和取消分组的其他交互和实现也是可行的。随着回放区或区组配置被修改,可以动态地更新回放区区域420中的回放区的表示。
回放状态区域430可以包括所选择的回放区或区组中的当前正在被播放、先前被播放或被安排接下来要播放的音频内容的图形表示。可以在用户接口上——例如在回放区区域420和/或回放状态区域430内——在视觉上区分所选择的回放区或区组。图形表示可以包括曲目名称、艺术家姓名、专辑名、专辑年份、曲目长度以及对用户了解何时经由用户接口400来控制媒体回放系统而言有用的其他相关信息。
回放队列区域440可以包括与所选择的回放区或区组相关联的回放队列中的音频内容的图形表示。在一些实施方式中,每个回放区或区组可以与这样的回放队列相关联,该回放队列包含与用于由回放区或区组回放的零个或更多个音频项相对应的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其他标识符可以由回放区或区组中的回放设备使用以从本地音频内容源或联网音频内容源查找和/或检索音频项,可能用于由回放设备回放。
在一个示例中,可以将播放列表添加至回放队列,在这种情况下,可以将与播放列表中的每个音频项相对应的信息添加至回放队列。在另一示例中,可以将回放队列中的音频项保存为播放列表。在又一示例中,当回放区或区组正在连续播放流式音频内容——例如,可以连续播放直到以其他方式被停止的互联网广播,而不是播放具有回放持续时间的离散音频项时,回放队列可以是空的或者被填充但“不在使用中”。在替选实施方式中,回放队列可以包括互联网广播和/或其他流式音频内容项并且当回放区或区组正在播放那些项时回放队列“在使用中”。其他示例也是可行的。
当回放区或区组被“分组”或被“取消分组”时,可以清除或重新关联与受影响的回放区或区组相关联的回放队列。例如,如果将包括第一回放队列的第一回放区与包括第二回放队列的第二回放区分组在一起,则所建立的区组可以具有相关联的回放队列,该相关联的回放队列最初为空,包含来自第一回放队列的音频项(例如,如果第二回放区被添加至第一回放区),包含来自第二回放队列的音频项(例如,如果第一回放区被添加至第二回放区),或者来自第一回放队列和第二回放队列两者的音频项的组合。随后,如果建立的区组被取消分组,则所得到的第一回放区可以与先前的第一回放队列重新关联,或者可以与以下新的回放队列相关联,该新的回放队列是空的或者包含来自在所建立的区组被取消分组之前与所建立的区组相关联的回放队列的音频项。类似地,所得到的第二回放区可以与先前的第二回放队列重新关联,或者与以下新的回放队列相关联,该新的回放队列是空的或者包含来自在所建立的区组被取消分组之前与所建立的区组相关联的回放队列的音频项。其他示例也是可行的。
返回参照图4的用户接口400,回放队列区域440中的音频内容的图形表示可以包括曲目名称、艺术家姓名、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选的以产生另外的可选图标,以管理和/或操纵回放队列和/或回放队列中呈现的音频内容。例如,所呈现的音频内容可以从回放队列中移除,可以被移动至回放队列内的不同位置,或者被选择以立即播放或者在任何当前播放的音频内容之后播放,以及其他可能性。与回放区或区组相关联的回放队列可以被存储在回放区或区组中的一个或更多个回放设备上的存储器中、不在回放区或区组中的回放设备上的存储器中和/或一些其他指定设备上的存储器中。
音频内容源区域450可以包括可选音频内容源的图形表示,可以从该可选音频内容源检索音频内容并且由所选择的回放区或区组播放音频内容。可以在下面部分中找到关于音频内容源的论述。
d.示例音频内容源
如前面指出的,区或区组中的一个或更多个回放设备可以被配置成从各种可用音频内容源检索用于回放的音频内容(例如,根据音频内容的相应URI或URL)。在一个示例中,可以由回放设备直接从相应的音频内容源(例如,线路输入连接)检索音频内容。在另一示例中,可以经由一个或更多个其他回放设备或网络设备通过网络将音频内容提供给回放设备。
示例音频内容源可以包括:媒体回放系统例如图1的媒体回放系统100中的一个或更多个回放设备的存储器、一个或更多个网络设备(例如,如控制设备、支持网络的个人计算机或网络附加存储装置(NAS))上的本地音乐库、经由互联网(例如,云)提供音频内容的流式音频服务或者经由回放设备或网络设备上的线路输入连接与媒体回放系统连接的音频源,以及其他可能性。
在一些实施方式中,可以有规律地从媒体回放系统例如图1的媒体回放系统100添加或移除音频内容源。在一个示例中,每当添加、移除或更新一个或更多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以涉及:扫描在能够由媒体回放系统中的回放设备访问的网络上共享的所有文件夹/目录中的可识别音频项;以及生成或更新音频内容数据库,该音频内容数据库包含元数据(例如,名称、艺术家、专辑、曲目长度等)以及其他关联信息,例如找到的每个可识别音频项的URI或URL。用于管理和保持音频内容源的其他示例也是可行的。
以上关于回放设备、控制器设备、回放区域配置和媒体内容源的讨论仅提供了其中可以实现下面描述的功能和方法的操作环境的一些示例。本文中未明确描述的媒体回放系统、回放设备和网络设备的其他操作环境和配置也可以适用于并适合于功能和方法的实现。
e.示例多个联网设备
图5示出了可以被配置成基于语音控制来提供音频回放体验的示例性多个设备500。本领域普通技术人员将理解的是,图5中示出的设备仅出于说明目的,并且包括不同和/或附加设备的变体是可行的。如示出的,多个设备500包括计算设备504、506和508;网络麦克风设备(NMD)512、514和516;回放设备(PBD)532、534、536和538以及控制器设备(CR)522。
多个设备500中的每一个可以是能够联网的设备,其可以根据一个或更多个网络协议例如NFC、蓝牙、以太网和IEEE 802.11以及其他示例在一种或更多种类型的网络——例如广域网(WAN)、局域网(LAN)和个人区域网(PAN)以及其他可能性——上与多个设备中的一个或更多个其他设备建立通信。
如示出的,计算设备504、506和508可以是云网络502的一部分。云网络502可以包括另外的计算设备。在一个示例中,计算设备504、506和508可以是不同的服务器。在另一示例中,计算设备504、506和508中的两个或更多个可以是单个服务器的模块。类似地,计算设备504、506和508中的每一个可以包括一个或更多个模块或服务器。本文中出于便于说明的目的,计算设备504、506和508中的每一个可以被配置成在云网络502内执行特定功能。例如,计算设备508可以是用于流式音乐服务的音频内容的源。
如示出的,计算设备504可以被配置成经由通信路径542与NMD512、514和516接口。NMD 512、514和516可以是一个或更多个“智能家居”系统的组件。在一种情况下,NMD 512、514和516可以物理地分布在整个家庭中,类似于图1中示出的设备的分布。在另一种情况下,NMD512、514和516中的两个或更多个可以物理地定位在彼此相对接近的范围内。通信路径542可以包括一种或更多种类型的网络,例如包括互联网的WAN、LAN和/或PAN以及其他可能性。
在一个示例中,NMD 512、514和516中的一个或更多个可以是主要配置用于音频检测的设备。在另一示例中,NMD 512、514和516中的一个或更多个可以是具有各种主要功用的设备的组件。例如,如上面结合图2和图3所讨论的,NMD 512、514和516中的一个或更多个可以是回放设备200的麦克风220或网络设备300的麦克风310。此外,在一些情况下,NMD512、514和516中的一个或更多个可以是回放设备200或网络设备300。在示例中,NMD 512、514和/或516中的一个或更多个可以包括布置在麦克风阵列中的多个麦克风。
如示出的,计算设备506可以被配置成经由通信路径544与CR 522和PBD 532、534、536和538接口。在一个示例中,CR 522可以是网络设备例如图2的网络设备200。因此,CR522可以被配置成提供图4的控制器接口400。类似地,PBD 532、534、536和538可以是回放设备例如图3的回放设备300。因此,PBD 532、534、536和538可以物理地分布在整个家庭中,如图1所示。出于说明的目的,PBD 536和PBD 538可以是绑定区530的一部分,而PBD 532和PBD534可以是它们各自区的一部分。如上面讨论的,PBD 532、534、536和538可以动态地绑定、分组、解除绑定和取消分组。通信路径544可以包括一种或更多种类型的网络,例如包括互联网的WAN、LAN和/或PAN以及其他可能性。
在一个示例中,与NMD 512、514和516一样,CR 522和PBD 532、534、536和538也可以是一个或更多个“智能家居”系统的组件。在一种情况下,PBD 532、534、536和538可以与NMD 512、514和516分布在相同的家庭中。此外,如上面提到的,PBD 532、534、536和538中的一个或更多个可以是NMD 512、514和516中的一个或更多个。
NMD 512、514和516可以是局域网的一部分,并且通信路径542可以包括通过WAN(未示出的通信路径)将NMD 512、514和516的局域网链接至计算设备504的接入点。同样地,NMD 512、514和516中的每一个可以经由这样的接入点彼此通信。
类似地,CR 522和PBD 532、534、536和538可以是如先前部分中讨论的局域网和/或本地回放网络的一部分,并且通信路径544可以包括通过WAN将CR 522和PBD 532、534、536和538的局域网和/或本地回放网络链接至计算设备506的接入点。因此,CR 522和PBD532、534、536和538中的每一个也可以通过这样的接入点彼此进行通信。
在一个示例中,单个接入点可以包括通信路径542和通信路径544。在示例中,NMD512、514和516,CR 522以及PBD 532、534、536和538中的每一个可以经由用于家庭的相同接入点来访问云网络502。
如图5所示,NMD 512、514和516,CR 522以及PBD 532、534、536和538中的每一个还可以经由通信装置546直接与其他设备中的一个或更多个通信。如本文中描述的通信装置546可以涉及根据一个或更多个网络协议通过一种或更多种类型的网络的设备之间的一种或更多种形式的通信,以及/或者可以涉及经由一个或更多个其他网络设备的通信。例如,通信装置546可以包括例如BluetoothTM(IEEE 802.15)、NFC、无线直接(Wireless direct)和/或专有无线中的一个或更多个以及其他可能性。
在一个示例中,CR 522可以通过BluetoothTM与NMD 512通信,并且通过另一局域网与PBD 534通信。在另一示例中,NMD 514可以通过另一局域网与CR 522通信,并且通过蓝牙与PBD 536通信。在又一示例中,PBD 532、534、536和538中的每一个可以根据生成树协议通过本地回放网络彼此通信,同时各自通过不同于本地回放网络的局域网与CR 522通信。其他示例也是可行的。
在一些情况下,可以根据设备之间的通信的类型、网络状况和/或延迟要求来改变NMD 512、514和516,CR 522以及PBD 532、534、536和538之间的通信装置。例如,当NMD 516首次被引入具有PBD 532、534、536和538的家庭时,可以使用通信装置546。在一种情况下,NMD516可以经由NFC将与NMD 516相对应的标识信息发送至PBD 538,并且PBD 538作为响应可以经由NFC(或一些其他形式的通信)将局域网信息发送至NMD 516。然而,一旦在家庭内配置了NMD 516,NMD 516与PBD 538之间的通信装置可能会变化。例如,NMD 516可以随后经由通信路径542、云网络502和通信路径544与PBD 538通信。在另一示例中,NMD和PBD可能永远不会经由本地通信装置546进行通信。在又一示例中,NMD和PBD可以主要经由本地通信装置546进行通信。其他示例也是可行的。
在说明性示例中,NMD 512、514和516可以被配置成接收语音输入以控制PBD 532、534、536和538。可用的控制命令可以包括先前讨论的任何媒体回放系统控制,例如回放音量控制、回放传输控制、音乐源选择和分组,以及其他可能性。在一个实例中,NMD 512可以接收语音输入以控制PBD 532、534、536和538中的一个或更多个。响应于接收到语音输入,NMD 512可以经由通信路径542将语音输入发送至计算设备504以用于进行处理。在一个示例中,计算设备504可以将语音输入转换成等效文本命令,并解析文本命令以识别命令。然后,计算设备504可以随后将文本命令发送至计算设备506。在另一示例中,计算设备504可以将语音输入转换成等效文本命令,随后将文本命令发送至计算设备506。然后,计算设备506可以解析文本命令以识别一个或更多个回放命令。
例如,如果文本命令是“在“区1”中播放来自“流服务1”的“艺术家1”的“曲目1””,则计算设备506可以识别:(i)可从“流服务1”获得的“艺术家1”的“曲目1”的URL,以及(ii)“区1”中的至少一个回放设备。在该示例中,来自“流服务1”的“艺术家1”的“曲目1”的URL可以是指向计算设备508的URL,并且“区1”可以是绑定区530。因此,一旦识别了URL以及PBD536和PBD 538中的一个或两个,计算设备506可以经由通信路径544向PBD 536和PBD 538中的一个或两个发送所识别的URL以用于回放。PBD 536和PBD 538中的一个或两个可以响应地根据所接收的URL从计算设备508检索音频内容,并且开始播放来自“流服务”的“艺术家1”的“曲目1”。
本领域普通技术人员将理解的是,上文仅是一个说明性示例,并且其他实现也是可行的。在一种情况下,如上面描述的,由多个设备500中的一个或更多个执行的操作可以由多个设备500中的一个或更多个其他设备执行。例如,从语音输入到文本命令的转换可以替选地、部分地或完全由另外的设备——例如NMD 512、计算设备506、PBD 536和/或PBD538执行。类似地,URL的识别可以替选地、部分地或完全地由另外的设备例如NMD 512、计算设备504、PBD 536和/或PBD 538执行。
f.示例网络麦克风设备
图6示出了示例网络麦克风设备600的功能框图,示例网络麦克风设备600可以被配置为图5的NMD 512、514和516中的一个或更多个。如示出的,网络麦克风设备600包括:处理器602、存储器604、麦克风阵列606、网络接口608、用户接口610、软件组件612以及扬声器614。本领域普通技术人员将理解的是,其他网络麦克风设备配置和布置也是可行的。例如,网络麦克风设备可以替选地排除扬声器614,或者具有单个麦克风而不是麦克风阵列606。
处理器602可以包括一个或更多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,处理单元602可以包括微处理器、微控制器、专用集成电路、数字信号处理器等。存储器604可以是可以加载有可由处理器602执行以执行那些功能的一个或更多个软件组件的数据存储装置。因此,存储器604可以包括一个或更多个非暂态计算机可读存储介质,其示例可以包括易失性存储介质如随机存取存储器、寄存器、高速缓存等,以及非易失性存储介质如只读存储器、硬盘驱动器、固态驱动器、闪存和/或光学存储设备,以及其他可能性。
麦克风阵列606可以是被布置成检测网络麦克风设备600的环境中的声音的多个麦克风。麦克风阵列606可以包括现在已知或以后开发的任何类型的麦克风,诸如电容式麦克风、驻极体电容式麦克风或动态麦克风,以及其他可能性。在一个示例中,麦克风阵列可以被布置成检测来自相对于网络麦克风设备的一个或更多个方向的音频。麦克风阵列606可以对频率范围的一部分敏感。在一个示例中,麦克风阵列606的第一子集可以对第一频率范围敏感,而麦克风阵列的第二子集可以对第二频率范围敏感。麦克风阵列606还可以被布置成捕获音频源(例如,语音、可听声音)的位置信息和/或帮助过滤背景噪声。值得注意的是,在一些实施方式中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
网络接口608可以被配置成促进各种网络设备——例如参照图5的云网络502中的CR 522、PBD 532至PBD 538、计算设备504至508和其他网络麦克风设备以及其他可能性——之间的无线通信和/或有线通信。因此,网络接口608可以采用用于执行这些功能的任何合适的形式,其示例可以包括以太网接口、串行总线接口(例如,FireWire、USB 2.0等)、芯片组和适于促进无线通信的天线和/或提供有线通信和/或无线通信的任何其他接口。在一个示例中,网络接口608可以基于行业标准(例如,包括IEEE 802.3的红外、无线电、有线标准,包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15的无线标准,4G移动通信标准等)。
网络麦克风设备600的用户接口610可以被配置成促进与网络麦克风设备的用户交互。在一个示例中,用户接口608可以包括物理按钮、在触敏屏幕和/或触敏表面上设置的图形接口以及其他可能性中的一个或更多个,以用于用户直接向网络麦克风设备600提供输入。用户接口610还可以包括灯和扬声器614中的一个或更多个,以向用户提供视觉和/或音频反馈。在一个示例中,网络麦克风设备600还可以被配置成经由扬声器614回放音频内容。
III.用于由多个NMD进行的语音检测的示例系统和方法
如上面讨论的,在一些示例中,计算设备可以促进并协调多个NMD的语音记录以确定语音命令。示例语音命令可以包括用以修改媒体回放系统控制或回放设置中的任何一个的命令。回放设置可以包括例如回放音量、回放传输控制、音乐源选择和分组以及其他可能性。其他语音命令可以包括用于调整电视控制或播放设置、移动电话设备设置或照明设备的操作以及其他设备操作。随着更多的家庭设备变得“智能”(例如,通过并入网络接口),可以使用语音命令来控制这些家庭设备。
通常,应当理解的是,本文中描述的一个或更多个功能可以由计算设备单独执行,或者与媒体回放系统服务器、联网麦克风系统服务器、PBD532至PBD 538、NMD 512至NMD516、CR 522或本文中描述的任何其他设备结合来执行。可替选地,计算设备本身可以是媒体回放系统服务器、联网麦克风系统服务器、PBD 532至PBD 538之一、NMD 512至NMD 516之一、CR 522或本文中描述的任何其他设备。
图7中示出的实现700呈现了本文中描述的示例技术的实施方式。实现700可以在包括或涉及例如图1的媒体回放系统100、图2的一个或更多个回放设备200、图3的一个或更多个控制设备300、图4的用户接口和/或图5中示出的配置的操作环境内实现。实现700可以包括如通过框702至框706中的一个或更多个示出的一个或更多个操作、功能或动作。尽管以顺序次序示出了框,但是这些框也可以并行执行,和/或以与本文中描述的次序不同的次序执行。此外,可以基于期望的实现将各种框组合成更少的框、划分成额外的框以及/或者移除。
另外,对于本文中公开的实现700、其他处理和方法,该流程图示出了一些实施方式的一种可能实现的功能和操作。在这方面,每个框可以表示程序代码的模块、区段或一部分,其包括可以由处理器执行以用于实现该处理中的特定逻辑功能或步骤的一个或更多个指令。程序代码可以存储在任何类型的计算机可读介质上,例如,包括磁盘或硬盘驱动器的存储设备。计算机可读介质可以包括非暂态计算机可读介质,例如,短时间存储数据的有形、非暂态计算机可读介质,如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)。计算机可读介质还可以包括非暂态介质,例如二级或持久长期存储装置,例如只读存储器(ROM)、光盘或磁盘、致密盘只读存储器(CD-ROM)。计算机可读介质还可以是任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是例如计算机可读存储介质或有形存储设备。另外,对于本文中公开的实现700、其他处理和方法,图7中的每个框可以表示被连线以执行处理中的特定逻辑功能的电路。
a.接收语音记录集合
在框702处,实现700涉及接收语音记录集合。例如,计算设备例如计算设备506可以从一个或更多个NMD接收语音记录集合。在一些实施方式中,给定NMD可以具有一个或更多个麦克风以记录来自用户的语音输入或命令。例如,位于家庭的起居室中或附近的一个或更多个NMD可以记录来自位于起居室中的用户的语音输入。另外地,计算设备本身可以作为NMD操作并且包括一个或更多个麦克风以记录语音输入或命令。
在一些情况下,可能除了经由计算设备的麦克风接收语音记录之外,计算设备可以经由计算设备的网络接口接收语音记录。例如,计算设备可以从媒体回放系统服务器、联网麦克风系统服务器、PBD 532至PBD 538、NMD 512至NMD 516、CR 522或本文描述的任何其他设备传送和接收语音记录。在一些实施方式中,媒体回放系统服务器和/或联网麦克风系统服务器可以是基于云的服务器系统。处理NMD可以从这些设备和/或服务器中的任何一个或其组合接收语音记录。
NMD可以经由一个或更多个麦克风连续记录环境噪声(例如,收听语音输入)。可以将连续的记录存储在环形缓冲器或循环缓冲器中,其中,可以丢弃记录,除非需要该记录以用于处理和确定给定语音命令。缓冲器可以被本地存储以及/或者经由本文中描述的设备或服务器中的任何一个远程存储。
在其他实施方式中,一些NMD可能不会连续地记录环境噪声。确切地说,在一些实例中,一个或更多个NMD可以接收指示一个或更多个NMD“唤醒”并开始记录语音输入或命令的语音输入或指示。例如,计算设备506可以接收语音输入并且在本文中描述的某些情况下,向一个或更多个NMD发送用以开始记录的指示。在其他示例中,一个或更多个NMD可以接收触发一个或更多个NMD开始记录或收听语音命令的特定“唤醒词”(例如,“嗨Sonos”、“Siri”、“Alexa”)。
除了其他选择之外,NMD可以在检测到语音命令时或在被指示发送其记录时将其语音记录发送至计算设备。例如,NMD可以在登记该语音命令(例如,通过登记唤醒词之后的语音命令)之后,发送给定语音命令的语音记录。可替选地,另一NMD或其他设备可以登记语音命令并指示NMD将最近的记录发送至计算设备。
在其他示例中,计算设备可以从多个NMD接收语音记录中的仅一些。可以基于本文中进一步描述的各种标准将所选择的语音记录提供给计算设备。例如,在记录满足特定标准(例如,语音记录被登记为处于或高于阈值声压级)的情况下,给定NMD可以将其记录提供给计算设备。作为另一示例,另一设备可以登记语音命令,并且如果所登记的语音命令满足特定标准,则可以指示NMD将与语音命令相对应的最近记录发送至计算设备。
在示例中,在计算设备接收语音记录之前,来自多个NMD的语音记录可以被细化、处理和/或组合成单个语音输入。作为示例,媒体回放系统服务器可以从一个或更多个NMD例如512至516接收语音记录。在一些实施方式中,PBD 532至PBD 538可以被配置为NMD,并且媒体回放系统服务器可以从PBD 532至PBD 538接收语音记录。媒体回放系统可以细化、处理语音记录和/或将语音记录组合成单个语音输入并且将单个语音输入发送至计算设备以用于进一步处理。涉及本文中描述的设备和/或服务器的组合的其他示例是可行的。
在一些示例中,计算设备可以从多个NMD接收处于不同声压级的语音记录。例如,相对于远离用户的第二NMD,接近用户的第一NMD可以以用户语音命令的较高声压级语音记录来记录用户语音命令。作为另一示例,用户在提供语音命令时可能不是静止的(例如,用户可能从起居室向卧室移动)。在这样的实例中,第一NMD可能记录了用户语音命令的第一部分的较高声压级语音记录,并且第二NMD可能记录了用户语音命令的第二部分的较高声压级记录,这是由于用户在说出语音命令的同时的移动而引起的。
在一些情况下,多个NMD可能记录了用户语音输入的相同部分。例如,第一NMD和第二NMD可以彼此接近并且可以各自一直收听语音输入。在其他情况下,多个NMD可能记录了用户语音输入的不同部分(例如,记录的内容可能根本不重叠或可能在某种程度上重叠)。作为示例,第二NMD可能最初未收听语音输入或者用户可能没有在附近(或者可能在提供语音输入的同时移动至另一位置)。在第一NMD检测到语音命令的第一部分之后,第一NMD可以指示第二NMD开始记录,这可以使第二NMD检测语音命令的第二部分。可替选地,如上面提到的,第二NMD可以连续地进行记录,并且计算设备可以指示第二NMD将其记录中的与语音命令相对应的部分发送至计算设备。
如上面提到的,计算设备本身可以作为NMD操作。在一些情况下,计算设备可以登记语音命令并且可能指示其他NMD来记录语音命令。例如,计算设备可以经由计算设备的一个或更多个麦克风来记录给定语音命令的至少第一部分,并且使一个或更多个NMD记录给定语音命令的至少第二部分。
在一些实现中,给定NMD可以连续地记录环境噪声但可能仅在以下情况下将其记录提供给计算设备:给定NMD(1)本身被唤醒词或语音输入唤醒,或者(2)接收到来自另一NMD、设备或系统的用以将记录提供给计算设备的指令。例如,第一NMD可以连续地进行记录,并且在一些实例中,可以记录从用户接收的给定语音命令的至少一部分。第二NMD可以使第一NMD经由网络接口将语音记录发送至计算设备。在这样的示例中,对给定NMD的连续记录的特定部分的处理可以被触发,尽管给定NMD不一定登记远场语音输入本身。
为了说明,返回参照图1,用户可以在从主卧室区走向浴室区的同时说出特定语音命令。作为NMD操作的回放设备122(和/或回放设备124)可以通过在用户处于主卧室时讲出的唤醒词将用户语音登记为语音命令。回放设备122可以记录特定语音命令的第一部分。可以指示回放设备116、118和120发送其记录中的与回放设备122检测到语音命令的时间段相对应的一部分。鉴于在该示例中用户移动至浴室区,回放设备116可以检测特定语音命令的第二部分并且将该第二部分发送至计算设备,以用于与由回放设备122进行的特定语音命令的第一部分的记录一起处理。在该示例中,由回放设备116进行的记录被处理,尽管回放设备116未登记语音命令本身。
另外地或可替选地,可以记录环境噪声和/或给定语音命令的至少一部分的给定NMD可以从另一NMD、设备或系统接收到用以停止记录的指令。这样的实施方式可以防止对相同语音输入的重复或分开的处理,并且可以提供对语音记录的更快处理以确定给定语音命令。
在一些实现中,各种NMD可以被配置成联合操作,这可以影响将哪些记录发送至计算设备。例如,一些NMD可以包括回放设备功能(或者反之亦然)。如上面提到的,回放设备可以形成各种分组(例如,绑定区或区组,以及其他示例)。当组中的NMD检测到语音命令时,该NMD可以指示该组中的其他NMD将其与语音命令相对应的记录发送至计算设备。
例如,计算设备可以从第一NMD(例如,被配置为NMD的PBD)接收与给定语音命令的至少第一部分相对应的第一语音记录。在计算设备接收到第一语音记录时(或之后),计算设备可以确定第一NMD和第二NMD是通常与其他回放设备同步播放媒体内容的配对设备(或者绑定的回放设备)。基于确定第一NMD和第二NMD是配对设备,计算设备可以使第二NMD记录并提供与给定语音命令的至少第二部分相对应的第二语音记录。在第二NMD连续地进行记录的一些实例中,计算设备可以使第二NMD将语音记录提供给计算设备。可替选地,计算设备可以使第二NMD停止记录以防止对相同语音输入的重复处理。
在其他示例中,计算设备可以从第一NMD(例如,配置为NMD的PBD)接收与给定语音命令的至少第一部分相对应的第一语音记录。在计算设备接收到第一语音记录时(或之后),计算设备可以确定第一NMD和一个或更多个其他NMD是通常在回放区内同步地播放媒体内容的区组的一部分。在一些实例中,计算设备可以确定第一NMD和一个或更多个其他NMD是区场景的一部分(例如,位于家庭的第一层的回放设备,或者在工作日下午5点分组在一起的回放设备)。基于这样的确定,计算设备可以使一个或更多个其他NMD记录并提供与给定语音命令的至少第二部分相对应的第二语音记录。在一个或更多个其他NMD连续地进行记录的一些实例中,计算设备使一个或更多个其他NMD将语音记录提供给计算设备。可替选地,计算设备可以使一个或更多个其他NMD停止记录以防止对相同语音输入的重复处理。
在一些实施方式中,用户可以定义标识NMD(例如,被配置为NMD的PBD)集合的语音输入或命令,该NMD集合可以一起用作绑定设备、回放区和/或区场景以记录给定语音命令的一部分。在这样的实施方式中,计算设备可以接收标识被分组在一起作为绑定对、回放区或区场景的NMD集合的用户定义的命令。因此,计算设备可以使被分组在一起的一个或更多个NMD记录和/或提供给定语音命令的一部分。例如,用户可以定义“楼下”作为将家庭底部中的NMD集合标识为区场景的给定语音命令的部分。计算设备可以使所标识NMD中的作为底部区场景的一部分的一个或更多个NMD记录与给定语音命令相对应的用户的语音输入。
在其他实施方式中,在预定义的条件被触发时,计算设备可以使被分组在一起作为绑定对、回放区或区场景的NMD集合记录和/或提供给定语音命令。例如,仅在用户的命令是出于例如看电影或控制一个或更多个回放设置(例如,播放或暂停歌曲、播放下一首或前一首歌曲、调整音量等)的回放目的时,计算设备可以使作为区组的部分的NMD集合记录和/或提供给定语音命令的至少一部分。
在其他实施方式中,计算设备可以了解NMD集合通常被分组在一起作为区场景以联合操作(例如,同步地播放媒体内容)。这样的了解可以基于NMD的配置历史。例如,示例配置历史可以指示该NMD集合已经在多于阈值数目个实例上被分组在一起。如上面提到的,为了说明,这样的区场景可能包括位于房屋的给定层的NMD、在彼此附近收听的NMD、通常在特定时间(例如,周末聚会模式)或其他场景分组在一起的NMD。因此,响应于从特定区场景中的第一NMD接收到给定语音命令的一部分,计算设备可以使通常与第一NMD分组在一起的一个或更多个其他NMD记录给定语音命令的至少一部分和/或向计算设备提供给定语音命令的至少一部分。
在其他实施方式中,计算设备可以从第一NMD接收给定语音命令的至少一部分的第一语音记录,并且确定给定语音命令相对于第一NMD的定向或方向(例如,在记录语音命令时用户面对的相对方向)。基于给定语音命令相对于第一NMD的方向,计算设备(或任何其他设备/服务器)可以使第二NMD收听并记录表示给定语音命令的至少一部分的第二语音记录。
为了说明,返回参照图1,回放设备104可以检测来自浴室区与办公室区之间过道的方向的语音命令。鉴于语音命令的方向,可以指示回放设备116和/或回放设备118记录与语音命令相对应的记录和/或向计算设备发送该记录。
作为又一示例,仍然参照图1,用户可以从起居室朝主卧室移动。随着用户移动,起居室中的回放设备(例如,回放设备104)可以向卧室中的第二NMD发送这样的指示:第二NMD可以在预期用户的语音命令或输入时开始记录和/或预处理。例如,第一NMD可以向第二NMD发送以下指示:开始滤除人类语音的基频带(例如,85Hz-255Hz)之外的噪声。在其他实例中,可以将第二NMD中的一个或更多个麦克风操纵成朝向用户面对的方向(例如,卧室的入口)。可以基于如本文中进一步描述的确定给定语音命令相对于NMD的定向或方向来完成这样的示例实施方式。
在示例中,接收语音命令的媒体回放系统、计算设备和/或NMD可以确认提供语音命令的特定用户的身份以区别其他语音输入(例如,其他扬声器、电视等)。在一些实例中,媒体回放系统、计算设备和/或NMD可以基于存储在媒体回放系统和/或本文中描述的设备的一个或更多个组合中的用户简档或语音配置设置来识别特定用户。可以经由网络接口在设备中的任何设备之间共享用户简档信息。示例用户简档可以包括语音特征,语音特征包括特定用户的语音的音调或频率、年龄、性别和用户历史以及标识特定用户的其他信息。
在示例操作中,返回参照图1,用户可以在提供语音命令的同时从起居室朝主卧室移动。随着用户移动,起居室中的回放设备(例如,回放设备104)可以基于用户简档识别用户并且向卧室中的第二NMD发送第二NMD可以在预期用户语音命令或输入时开始记录和/或预处理的指示。知道了用户的身份,起居室中的回放设备104和卧室中的第二NMD可以区别来自附近电视的可能干扰用户语音命令的记录的语音输入。
在其他实例中,在特定位置处接收到用户的语音输入的一部分时,媒体回放系统、计算设备和/或NMD可以响应于确定了用户的语音特征来识别特定用户。作为示例,返回参照图1,男性用户可以处于可以具有一个或更多个NMD(例如,回放设备122、回放设备124)的主卧室中。在男性用户在主卧室附近或内部提供语音命令或输入时,一个或更多个NMD可以确认用户的身份并且确定用户的语音特征(例如,男性用户的语音的频率和音调)。随着用户从主卧室移动离开,主卧室中的一个或更多个NMD可以向位于附近其他生活空间(例如,浴室、起居室等)中的其他NMD发送该语音特征,并且指示其他NMD主动地收听与用户的语音特征相匹配的语音输入,以区别来自其他源(例如,电视、女性用户等)的语音输入。
在其他实例中,特定位置处的NMD可以接收这样的语音命令或输入,该语音命令或输入可以触发用于该NMD或任何一个或更多个其他NMD主动地收听额外的语音输入或命令的时段或窗口。在一些示例中,唤醒词或短语(例如,嗨Sonos)可以触发用于一个或更多个NMD主动地收听额外的语音输入或命令的时段或窗口。在其他示例中,接收语音输入的至少一部分的一个或更多个NMD可以触发用于一个或更多个其他NMD主动地收听额外的语音输入或命令的时段或窗口。在示例中,接收语音输入的至少一部分的一个或更多个NMD可以确认特定用户的身份,并且触发用于一个或更多个其他NMD主动地收听来自特定用户的额外的语音输入或命令的时段或窗口。
在一些实现中,时段或窗口可以在特定持续时间(例如,在一个或更多个NMD接收到初始语音输入之后一分钟)之后到期。在其他实现中,用户可以指定用于一个或更多个NMD接收额外语音输入或命令的时段或窗口。特别地,一个或更多个NMD可以接收语音命令(例如,“让我们用一会儿排队一些歌曲”),该语音命令指定用于一个或更多个NMD主动地收听额外的语音输入(例如,用以将歌曲加入回放队列的语音输入)的时段或窗口(例如,一分钟)。在其他实现中,一个或更多个NMD可以在用于接收额外的语音输入的时段或窗口到期之前结束或终止这样的时段或窗口。通过引用在此并入的题为“Action based on UserID”的美国申请第15/131,776描述了另外的示例。
在一些实施方式中,可以基于语音输入或命令的频率响应来确定定向或方向。通常,在记录语音输入或命令的同时用户面对的NMD可能比用户未面对的NMD具有更大的高频分量。对这样的分量的分析可以向计算设备指示语音命令的方向性。例如,鉴于(1)表示多个NMD的相应麦克风的频率响应的数据以及(2)多个NMD的语音输入的单独的时间对准记录,计算设备可以使语音输入的相应记录的频率响应(例如,35Hz-22.05kHz)相对于低频带标准化。例如,可以使用第二NMD相对于人类语音的基频带(例如,85Hz-255Hz)来标准化从第一NMD记录的语音输入的频率响应。然后可以比较语音输入的标准化响应的高频分量以确定在记录语音命令的同时用户面对的方向。
在其他实施方式中,可以通过使用NMD的两个或更多个麦克风的已知极性响应的方差来确定语音输入的定向或方向。方差可以帮助确定用户(或语音输入)相对于与两个或更多个麦克风的平面垂直的NMD的角度。用户相对于NMD的角度可以帮助更精确地定位在记录语音输入的同时用户面向的方向,并且可以增加从特定方向或定向接收语音输入的额外置信度。可以通过同时测量每个麦克风处的语音输入的极性响应并将方差与已知的极性响应相匹配来识别这样的角度。
在其他实施方式中,可以通过测量跨其间具有已知距离的两个或更多个麦克风的延迟来确定用户相对于NMD的角度。另外的示例可以包括:视觉成像,测量跨两个或更多个麦克风或NMD的相对大小,NMD与另一个计算设备例如移动电话之间的蓝牙接近度检测,或者监视WiFi接收信号强度指示(RSSI)以检测用户接近度和/或位置。
b.识别语音记录子集
在框704处,实现700涉及识别语音记录子集。例如,计算设备(例如,计算设备506)可以在该语音记录集合中识别根据其来确定给定语音命令的语音记录子集。可替选地,计算设备可以使用从相应NMD接收的所有语音记录来确定给定语音命令。
在一些实例中,识别语音记录子集可以包括:除了计算设备之外的设备(例如,媒体回放服务器)本地或远程地(经由网络接口)确定语音记录子集并且向计算设备提供该子集。一些实现可以涉及:除了计算设备之外的设备或服务器的一个或更多个组合确定语音记录子集。
在一些实施方式中,计算设备可以通过将从NMD集合接收的语音记录与阈值声压级或阈值音量级进行比较来识别语音记录子集。阈值例如可以是绝对阈值例如量值,或者是可以根据语音记录的最高量值标准化的相对阈值。在一些实施方式中,计算设备可以将超过阈值水平的语音记录(或NMD)识别为语音记录(或NMD)子集以确定给定语音命令。在其他实施方式中,计算设备可以识别记录了给定语音命令中的处于最高声压级的至少一部分的预定数目个NMD(例如,三个NMD)以确定给定语音命令。以这种方式识别语音记录子集可以确保在细化和处理语音记录方面更大的精确度,并且能够实现更高质量的语音至文本转换以确定给定语音命令。
在其他实施方式中,计算设备可以基于各种规则和标准来识别NMD的语音记录。例如,可以将来自被分组在一起作为绑定对、回放区和/或区场景的NMD的语音记录识别为根据其来确定给定语音命令的语音记录子集。
在语音命令被用于回放目的时,以这种方式识别语音记录子集可以有用。例如,家庭的起居室和厨房中的NMD可以记录用户的语音命令的至少一部分。计算设备可以将起居室中的NMD的语音记录识别为根据其来确定给定语音命令的语音记录子集。在其他示例中,起居室中的NMD集合可以记录用户的语音命令的至少一部分。计算设备可以将起居室中的绑定在一起的一对NMD的语音记录识别为根据其来确定给定语音命令的语音记录子集。
在其他示例中,家庭的第一层和第二层的NMD集合可以记录用户的语音命令的至少一部分。计算设备可以将第一层的NMD的语音记录识别为根据其来确定给定语音命令的语音记录子集。在一些实例中,如上面描述的,计算设备可以将在预定数目个实例上通常被分组在一起作为区场景的NMD的语音记录识别为根据其来确定给定语音命令的语音记录子集。
在其他实施方式中,计算设备可以将在声学上耦合的NMD的两个或更多个语音记录识别为根据其来确定给定语音命令的语音记录子集。在一些实例中,计算设备可以使NMD确定其是否在声学上耦合至一个或更多个其他NMD。例如,计算设备可以使第一NMD播放或输出测试音调(或任何其他音频内容)并且可以使第二NMD经由第二NMD的一个或更多个麦克风来检测音调。计算设备可以将所检测的测试音调的量值与阈值声压级进行比较以确定第一NMD和第二NMD是否在声学上耦合。在其他示例中,第一NMD可以正在播放音频内容并且第二NMD可以经由一个或更多个麦克风登记音频内容。计算设备可以将所登记的音频内容的量值与阈值声压级进行比较以确定第一NMD和第二NMD是否在声学上耦合。基于两个或更多个NMD的声耦合,计算设备可以将这样的NMD识别为根据其来确定给定语音命令的子集。
c.使所识别的语音记录子集被分析以确定给定语音命令
在框706处,实现700涉及使所识别的语音记录子集被分析以确定给定语音命令。例如,计算设备例如计算设备506可以使语音记录子集被分析以确定给定语音命令。
在一些情况下,计算设备本身可以分析语音记录子集。可替选地,本文中描述的设备或服务器中的任何一个或其组合可以使所识别的语音记录子集被分析以确定给定语音命令,这可以由连接设备的一个或更多个网络(例如,连接装置546)促进。
在一些示例中,计算设备可以通过与NMD通信来使所识别的语音记录子集被分析。计算设备可以将所识别的记录发送至NMD,并且NMD可以确定并执行语音命令。在示例中,计算设备可以根据所识别的语音记录子集来确定给定语音命令,并且将所确定的语音命令发送至NMD以执行语音命令。涉及本文中描述的设备或服务器中的一个或其组合的其他示例是可行的。
在一些实施方式中,计算设备可以通过处理并细化所识别的语音记录子集来使所识别的语音记录子集被分析以确定给定语音命令。可替选地,计算设备可以处理所识别的语音记录子集,而无细化。然而,对所识别的记录进行细化能够实现更高质量的语音至文本的转换。在一些实现中,可以在识别语音记录子集之前细化语音记录子集。例如,计算设备506可以接收语音记录集合并且在识别语音记录子集之前本地或远程地细化该语音记录。在其他示例中,在计算设备(例如计算设备506)接收该语音记录集合之前,可以由设备或服务器的一个或更多个组合来细化该语音记录集合。计算设备可以从所接收的该细化的语音记录集合中识别语音记录子集。
计算设备可以对所识别的语音记录子集进行时间对准。对语音记录进行时间对准可以防止对给定语音命令的冗余或重复的部分的处理。例如,第一NMD和第二NMD可能在给定时间处记录了给定语音命令的至少一部分。第一NMD可能在第二NMD可能一直在记录的给定时间处记录了一些重叠部分。因此,计算设备可以对来自第一NMD和第二NMD的语音记录进行时间对准,并且根据本文中描述的各种标准来细化或去除语音记录的重叠部分。
在一些示例中,计算设备可以采用所识别的语音记录子集的量值加权平均值。具有较高量值(例如,较高声压级)的语音记录的相应部分可以被赋予较高权重,并且更可能被处理以确定给定语音命令。
在其他示例中,计算设备可以通过确定所识别的语音记录子集的平均值来组合记录。可以根据相应NMD的麦克风的质量和/或数量对这样的平均值进行加权。一些NMD可以具有多个麦克风并且一些NMD可以比其他NMD具有更好质量的麦克风。因此,计算设备可以基于这样的因素来确定所识别的语音记录子集的量值加权平均值。
计算设备可以“切割(chop)”所识别的语音记录子集并且将它们拼接在一起。例如,如上面提到的,用户可以在提供给定语音命令的同时从家庭的起居室向卧室移动。基于确定相应NMD的所识别的语音记录子集的相对定向或方向,计算设备可以使用来自起居室的所识别的语音记录子集作为根据其来确定给定语音命令的第一部分,并且使用来自卧室的所识别的语音记录子集作为根据其来确定给定语音命令的第二部分。
IV.结论
除了别的以外,上面的描述公开了各种示例系统、方法、装置和包括在硬件上执行的固件和/或软件以及其他组件的制品。应该理解的是,这样的示例仅仅是说明性的,并且不应被认为是限制性的。例如,可以设想的是,固件、硬件和/或软件方面或组件中的任何一个或全部可以专门以硬件、专门以软件、专门以固件或者以硬件、软件和/或固件的任意组合来实现。因此,所提供的示例不是实现这样的系统、方法、装置和/或制品的唯一方式。
(特征1)一种方法,包括:(i)经由计算设备接收语音记录集合,其中,经由联网麦克风设备(NMD)集合中的相应NMD来检测该语音记录集合中的每个语音记录;(ii)经由计算设备从该语音记录集合中识别语音记录子集,其中根据该语音记录子集来确定给定语音命令;以及(iii)使所识别的语音记录子集被分析以确定给定语音命令。
(特征2)根据特征1所述的方法,其中,接收语音记录集合:经由计算设备的网络接口来接收表示给定语音命令的至少第一部分的第一语音记录,其中,从该NMD集合中的第一NMD记录第一语音记录,并且其中,第二NMD使第一NMD将第一语音记录发送至计算设备。
(特征3)根据特征1所述的方法,其中,接收语音记录集合包括:(i)经由计算设备的麦克风来接收表示给定语音命令的至少第一部分的第一语音记录;以及(ii)使该NMD集合中的第二NMD记录表示给定语音命令的至少第二部分的第二语音输入。
(特征4)根据特征1所述的方法,其中,接收语音记录集合包括:接收经由该NMD集合中的第一NMD检测到的第一语音记录,以及接收经由该NMD集合中的第二NMD检测到的第二语音记录,并且其中,识别根据其来确定给定语音命令的语音记录子集包括:(i)确定第一语音记录和第二语音记录超过阈值声压级,其中,第一语音记录和第二语音记录各自表示给定语音命令的至少一部分;以及(ii)将第一语音记录和第二语音记录识别为根据其来确定给定语音命令的语音记录子集。
(特征5)根据特征1所述的方法,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录以及接收经由该NMD集合中的第二NMD检测到的第二语音记录;(ii)确定第一语音记录表示给定语音命令的第一部分;以及(iii)确定第二语音记录表示给定语音命令的第二部分,其中,第二部分至少部分地与第一部分不同。
(特征6)根据特征1所述的方法,其中,接收语音记录集合包括:接收处于相应声压级的语音记录集合,并且其中,识别根据其来确定给定语音命令的语音记录子集包括:将来自预定数目个NMD的语音记录识别为语音记录子集,所述预定数目个NMD检测到给定语音命令中的处于相应声压级中的最高声压级的至少一部分。
(特征7)根据特征1所述的方法,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录,其中,第一语音记录表示给定语音命令的至少第一部分;(ii)确定第一语音记录是在相对于第一NMD的给定方向上记录的;以及(iii)使该NMD集合中的第二NMD在给定方向上记录第二语音记录,其中,第二语音记录表示给定语音命令的至少第二部分。
(特征8)根据特征1所述的方法,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录,其中,第一语音记录表示给定语音命令的至少第一部分;(ii)确定该NMD集合中的第一NMD和第二NMD被布置为绑定区以回放多声道媒体内容的相应声道;以及(iii)使第二NMD记录第二语音记录,其中,第二语音记录表示给定语音命令的至少第二部分。
(特征9)根据特征8所述的方法,其中,识别根据其来确定给定语音命令的语音记录子集包括:将第一语音记录和第二语音记录识别为根据其来确定给定语音命令的语音记录子集。
(特征10)根据特征1所述的方法,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录,其中,第一语音记录表示给定语音命令的至少第一部分;(ii)确定该NMD集合中的第一NMD和第二NMD被结合成区组以同步地回放媒体内容;以及(iii)使第二NMD记录第二语音记录,其中,第二语音记录表示给定语音命令的至少第二部分。
(特征11)根据特征10所述的方法,其中,识别根据其来确定给定语音命令的语音记录子集包括:使所识别的语音输入集合被处理成给定语音命令包括将第一语音记录和第二语音记录识别为根据其来确定给定语音命令的语音记录子集。
(特征12)根据特征1所述的方法,其中,该NMD集合中的两个或更多个特定NMD包括媒体回放系统的相应区,并且其中,识别根据其来确定给定语音命令的语音记录子集包括:(i)确定相应区被布置成以预定布置同步地回放媒体的区的区场景;以及(ii)将经由两个或更多个特定NMD检测到的语音记录识别为根据其来确定给定语音命令的该语音记录集合。
(特征13)根据特征1所述的方法,其中,该NMD集合中的第一NMD和第二NMD分别包括媒体回放系统的第一区和第二区,并且其中,识别根据其来确定给定语音命令的语音记录子集包括:(i)基于第一区和第二区的配置历史来确定第一区和第二区在多于阈值数目个实例上被布置成区场景,其中,第一区和第二区被配置成在被布置成区场景时同步地回放媒体;以及(iii)将经由第一NMD和第二NMD检测到的语音记录识别为根据其来确定给定语音命令的语音记录子集。
(特征14)根据特征1所述的方法,其中,识别根据其来确定给定语音命令的语音记录子集包括:(i)确定该NMD集合中的两个或更多个特定NMD在声学上耦合;以及(ii)将经由两个或更多个特定NMD检测到的语音输入识别为根据其来确定给定语音命令的语音记录子集。
(特征15)根据特征14所述的方法,其中,确定该NMD集合中的两个或更多个特定NMD在声学上耦合包括:(i)使两个或更多个特定NMD中的第一NMD输出给定声音;(ii)使两个或更多个特定NMD中的第二NMD检测给定声音;以及(iii)确定所检测的给定声音超过阈值声压级。
(特征16)一种编码有指令的有形非暂态计算机可读介质,其中,指令在由一个或更多个处理器执行时使计算设备执行包括以下操作的方法:(i)接收语音记录集合,其中,经由联网麦克风设备(NMD)集合中的相应NMD来检测该语音记录集合中的每个语音记录;(ii)从该语音记录集合中识别语音记录子集,其中根据该语音记录子集来确定给定语音命令;以及(iii)使所识别的语音记录子集被分析以确定给定语音命令。
(特征17)根据特征16所述的有形非暂态计算机可读介质,其中,接收语音记录集合包括:接收经由该NMD集合中的第一NMD检测到的第一语音记录以及接收经由该NMD集合中的第二NMD检测到的第二语音记录,并且其中,识别根据其来确定给定语音命令的语音记录子集包括:(i)确定第一语音记录和第二语音记录超过阈值声压级,其中,第一语音记录和第二语音记录各自表示给定语音命令的至少一部分;以及(ii)将第一语音记录和第二语音记录识别为根据其来确定给定语音命令的语音记录子集。
(特征18)根据特征16所述的有形非暂态计算机可读介质,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录以及接收经由该NMD集合中的第二NMD检测到的第二语音记录;(ii)确定第一语音记录表示给定语音命令的第一部分;以及(iii)确定第二语音记录表示给定语音命令的第二部分,其中,第二部分至少部分地与第一部分不同。
(特征19)一种计算设备,包括:(i)网络接口;(ii)一个或更多个处理器;以及(iii)编码有指令的计算机可读介质,其中,指令在由一个或更多个处理器执行时使计算设备执行包括以下功能的功能:(a)接收语音记录集合,其中,经由联网麦克风设备(NMD)集合中的相应NMD来检测该语音记录集合中的每个语音记录;(b)从该语音记录集合中识别语音记录子集,其中根据该语音记录子集来确定给定语音命令;以及(c)使所识别的语音记录子集被分析以确定给定语音命令。
(特征20)根据特征19所述的计算设备,其中,接收语音记录集合包括:(i)接收经由该NMD集合中的第一NMD检测到的第一语音记录以及接收经由该NMD集合中的第二NMD检测到的第二语音记录;(ii)确定第一语音记录表示给定语音命令的第一部分;以及(iii)确定第二语音记录表示给定语音命令的第二部分,其中,第二部分至少部分地与第一部分不同。
另外,本文对“实施方式”的提及意指:结合该实施方式所描述的特定特征、结构或特性可以包括在本发明的至少一个示例实施方式中。该短语在说明书中的各个地方的出现不一定都指代同一实施方式,也不是与其他实施方式相互排斥的单独或替选的实施方式。同样地,本领域技术人员明确地和隐含地理解的本文中描述的实施方式可以与其他实施方式进行组合。
主要从说明性环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦接至网络的数据处理设备的操作相类似的其他象征性表示的方面,提出本说明书。本领域技术人员通常使用这些处理描述和表示来向本领域其他技术人员最有效地传达他们的工作内容。阐述了许多具体细节,以提供对本公开内容的透彻理解。然而,本领域技术人员应当理解的是,可以在没有某些具体细节的情况下实践本公开内容的某些实施方式。在其他实例中,没有详细描述熟知的方法、过程、组件和电路,以避免不必要地使实施方式的各方面模糊。因此,本公开内容的范围由所附权利要求而不是对实施方式的前述描述来限定。
当所附权利要求中的任意权利要求被理解为涵盖纯软件和/或固件实现时,在此将至少一个示例中的至少一个元素明确限定为包括存储软件和/或固件的有形非暂态介质,如存储器、DVD、CD、蓝光等。
Claims (14)
1.一种用于计算设备的方法,所述方法包括:
接收包括至少第一语音记录和第二语音记录的语音记录集合,其中,经由相应联网麦克风设备NMD来检测所述集合中的每个语音记录;
从所述语音记录集合中识别语音记录子集,其中,根据所述语音记录子集来确定给定语音命令;以及
使所识别的语音记录子集被分析以确定所述给定语音命令,
其中,经由第一NMD检测所述第一语音记录,并且所述第一语音记录表示所述给定语音命令的至少第一部分;并且
所述方法还包括:
确定所述第一NMD和第二NMD被布置为以下之一:
用以回放多声道媒体内容的相应声道的绑定区;以及
用以同步地回放媒体内容的区组;以及
使所述第二NMD记录第二语音记录,其中,所述第二语音记录表示所述给定语音命令的至少第二部分。
2.根据权利要求1所述的方法,其中:
经由所述计算设备的网络接口从第一NMD接收所述第一语音记录,并且
第二NMD使所述第一NMD向所述计算设备发送所述第一语音记录。
3.根据权利要求1所述的方法,其中:
经由所述计算设备的麦克风接收所述第一语音记录,其中,所述计算设备是NMD,
所述第一语音记录表示所述给定语音命令的至少第一部分;并且
所述方法还包括:使第二NMD记录表示所述给定语音命令的至少第二部分的第二语音输入。
4.根据权利要求1至3中的任意一项所述的方法,其中:
在确定所述第一语音记录和所述第二语音记录超过阈值声压级时,将所述第一语音记录和所述第二语音记录识别为所述语音记录子集的部分;并且
分别由第一NMD和第二NMD来检测所述第一语音记录和所述第二语音记录,并且所述第一语音记录和所述第二语音记录各自表示所述给定语音命令的至少一部分。
5.根据权利要求1至3中的任意一项所述的方法,
还包括:确定所述第一语音记录和所述第二语音记录分别表示所述给定语音命令的第一部分和第二部分;其中:
所述第二部分至少部分地不同于所述第一部分;
分别经由第一NMD和第二NMD来检测所述第一语音记录和所述第二语音记录。
6.根据权利要求1至3中的任意一项所述的方法,其中:
所述语音记录集合中的每个语音记录包括相应声压级;并且
将来自检测到所述给定语音命令中的处于所述相应声压级中的最高声压级的至少一部分的预定数目个NMD的语音记录识别为所述子集的部分。
7.根据权利要求1至3中的任意一项所述的方法,其中:
经由第一NMD检测所述第一语音记录,并且所述第一语音记录表示所述给定语音命令的至少第一部分;并且
所述方法还包括:
确定所述第一语音记录是在相对于所述第一NMD的给定方向上记录的;以及
使第二NMD在所述给定方向上记录第二语音记录,其中,所述第二语音记录表示所述给定语音命令的至少第二部分。
8.根据权利要求7所述的方法,其中,将所述第一语音记录和所述第二语音记录识别为所述语音记录子集的部分。
9.根据权利要求1至3中的任意一项所述的方法,其中:
两个或更多个NMD与媒体回放系统的相应区相对应;
所述方法还包括:确定所述相应区被布置成以预定布置同步地回放媒体的区的区场景;并且
将经由与所述媒体回放系统的相应区相对应的所述两个或更多个NMD检测到的语音记录识别为所述语音记录子集的部分。
10.根据权利要求1至3中的任意一项所述的方法,其中:
第一NMD和第二NMD分别与媒体回放系统的第一区和第二区相对应,
所述方法还包括:基于所述第一区和所述第二区的配置历史来确定所述第一区和所述第二区在多于阈值数目个实例上被布置成这样的区场景,在所述区场景中所述第一区和所述第二区被配置成同步地回放媒体;以及
将经由所述第一NMD和所述第二NMD检测到的语音记录识别为所述语音记录子集的部分。
11.根据权利要求1至3中的任意一项所述的方法,
还包括:确定NMD集合中的两个或更多个NMD在声学上耦合,
其中,将经由在声学上耦合的所述两个或更多个NMD检测到的语音输入识别为所述语音记录子集的部分。
12.根据权利要求11所述的方法,其中,确定所述NMD集合中的所述两个或更多个NMD在声学上耦合包括:
使所述两个或更多个NMD中的第一NMD输出给定声音;
使所述两个或更多个NMD中的第二NMD检测所述给定声音;以及
确定所检测的所述给定声音超过阈值声压级。
13.一种编码有指令的有形非暂态计算机可读介质,其中,所述指令在由一个或更多个处理器执行时使计算设备执行根据权利要求1至12之一所述的方法。
14.一种计算设备,包括:
网络接口;以及
一个或更多个处理器,其被配置成执行根据权利要求1至12之一所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/211,748 | 2016-07-15 | ||
US15/211,748 US10152969B2 (en) | 2016-07-15 | 2016-07-15 | Voice detection by multiple devices |
PCT/US2017/042227 WO2018013978A1 (en) | 2016-07-15 | 2017-07-14 | Voice detection by multiple devices |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109716429A CN109716429A (zh) | 2019-05-03 |
CN109716429B true CN109716429B (zh) | 2023-02-28 |
Family
ID=59684011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780056695.7A Active CN109716429B (zh) | 2016-07-15 | 2017-07-14 | 由多个设备进行的语音检测 |
Country Status (4)
Country | Link |
---|---|
US (5) | US10152969B2 (zh) |
EP (3) | EP3485488B1 (zh) |
CN (1) | CN109716429B (zh) |
WO (1) | WO2018013978A1 (zh) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10152969B2 (en) * | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10831440B2 (en) * | 2016-09-26 | 2020-11-10 | Lenovo (Singapore) Pte. Ltd. | Coordinating input on multiple local devices |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
JP2018124805A (ja) * | 2017-02-01 | 2018-08-09 | トヨタ自動車株式会社 | 車載情報端末及び情報検索プログラム |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10839795B2 (en) * | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
CN111033611A (zh) | 2017-03-23 | 2020-04-17 | 乔伊森安全系统收购有限责任公司 | 使嘴部图像与输入指令关联的系统和方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10825471B2 (en) * | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
KR102392297B1 (ko) * | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
CN109147770B (zh) * | 2017-06-16 | 2023-07-28 | 阿里巴巴集团控股有限公司 | 声音识别特征的优化、动态注册方法、客户端和服务器 |
CN107564532A (zh) * | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 电子设备的唤醒方法、装置、设备及计算机可读存储介质 |
US11489691B2 (en) * | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US10930276B2 (en) | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
WO2019014425A1 (en) | 2017-07-13 | 2019-01-17 | Pindrop Security, Inc. | SAFE PARTY WITH SEVERAL PARTIES KNOWING NO VOICE IMPRESSIONS |
US10582250B2 (en) * | 2017-07-24 | 2020-03-03 | Advanced Micro Devices, Inc. | Integrated video codec and inference engine |
WO2019021953A1 (ja) * | 2017-07-26 | 2019-01-31 | 日本電気株式会社 | 音声操作装置及びその制御方法 |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
WO2019152722A1 (en) | 2018-01-31 | 2019-08-08 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US20190237067A1 (en) * | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US11150869B2 (en) | 2018-02-14 | 2021-10-19 | International Business Machines Corporation | Voice command filtering |
US10623403B1 (en) | 2018-03-22 | 2020-04-14 | Pindrop Security, Inc. | Leveraging multiple audio channels for authentication |
US10665244B1 (en) | 2018-03-22 | 2020-05-26 | Pindrop Security, Inc. | Leveraging multiple audio channels for authentication |
CN108566634B (zh) * | 2018-03-30 | 2021-06-25 | 深圳市冠旭电子股份有限公司 | 降低蓝牙音箱连续唤醒延时的方法、装置及蓝牙音箱 |
US11145299B2 (en) * | 2018-04-19 | 2021-10-12 | X Development Llc | Managing voice interface devices |
US11200890B2 (en) * | 2018-05-01 | 2021-12-14 | International Business Machines Corporation | Distinguishing voice commands |
US11238856B2 (en) | 2018-05-01 | 2022-02-01 | International Business Machines Corporation | Ignoring trigger words in streamed media content |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
CN108737872A (zh) * | 2018-06-08 | 2018-11-02 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
DE102018212902A1 (de) * | 2018-08-02 | 2020-02-06 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10861457B2 (en) * | 2018-10-26 | 2020-12-08 | Ford Global Technologies, Llc | Vehicle digital assistant authentication |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10936281B2 (en) | 2018-12-19 | 2021-03-02 | International Business Machines Corporation | Automatic slide page progression based on verbal and visual cues |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
CA3129378A1 (en) * | 2019-02-07 | 2020-08-13 | Thomas Stachura | Privacy device for smart speakers |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11170783B2 (en) | 2019-04-16 | 2021-11-09 | At&T Intellectual Property I, L.P. | Multi-agent input coordination |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
CN110234044A (zh) * | 2019-05-10 | 2019-09-13 | 万魔声学科技有限公司 | 一种语音唤醒方法、语音唤醒装置及耳机 |
CN110047471A (zh) * | 2019-05-13 | 2019-07-23 | 深圳市智宇盟科技有限公司 | 语音唤醒方法 |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
CN110196914B (zh) * | 2019-07-29 | 2019-12-27 | 上海肇观电子科技有限公司 | 一种将人脸信息录入数据库的方法和装置 |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11355108B2 (en) | 2019-08-20 | 2022-06-07 | International Business Machines Corporation | Distinguishing voice commands |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
WO2021134548A1 (zh) * | 2019-12-31 | 2021-07-08 | 李庆远 | 基于移动设备的录音装置 |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
KR20210112726A (ko) * | 2020-03-06 | 2021-09-15 | 엘지전자 주식회사 | 차량의 좌석별로 대화형 비서를 제공하는 방법 |
US11335361B2 (en) * | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11961523B2 (en) * | 2020-07-22 | 2024-04-16 | Vmware, Inc. | Secure enterprise access with voice assistant devices |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
KR20220059629A (ko) * | 2020-11-03 | 2022-05-10 | 현대자동차주식회사 | 차량 및 그의 제어방법 |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US20220148575A1 (en) * | 2020-11-12 | 2022-05-12 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US20220179615A1 (en) * | 2020-12-09 | 2022-06-09 | Cerence Operating Company | Automotive infotainment system with spatially-cognizant applications that interact with a speech interface |
US20220208185A1 (en) * | 2020-12-24 | 2022-06-30 | Cerence Operating Company | Speech Dialog System for Multiple Passengers in a Car |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
CN114915916B (zh) * | 2021-02-08 | 2023-08-22 | 华为技术有限公司 | 定向控制电子设备的方法及电子设备、可读介质 |
WO2024129103A1 (en) * | 2022-12-15 | 2024-06-20 | Google Llc | Pairing audio data channels based on initiating, using a first client device, playback of media on a second client device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101427154A (zh) * | 2005-09-21 | 2009-05-06 | 皇家飞利浦电子股份有限公司 | 使用远程位置麦克风进行语音激活控制的超声成像系统 |
CN104885406A (zh) * | 2012-12-18 | 2015-09-02 | 三星电子株式会社 | 用于在家庭网络系统中远程控制家庭设备的方法和设备 |
CN105389099A (zh) * | 2014-08-29 | 2016-03-09 | 三星电子株式会社 | 用于语音记录和回放的方法和设备 |
CN105427861A (zh) * | 2015-11-03 | 2016-03-23 | 胡旻波 | 智能家居协同麦克风语音控制系统及控制方法 |
Family Cites Families (831)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
EP0548836B1 (en) | 1991-12-20 | 1997-06-11 | Matsushita Electric Industrial Co., Ltd. | A bass reproduction speaker apparatus |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
ES2277419T3 (es) | 1999-12-03 | 2007-07-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Un metodo para producir simultaneamente ficheros de audio en dos telefonos. |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
US20020026442A1 (en) | 2000-01-24 | 2002-02-28 | Lipscomb Kenneth O. | System and method for the distribution and sharing of media assets between media players devices |
WO2001061939A2 (en) | 2000-02-18 | 2001-08-23 | Bridgeco Ag | Multi-portal bridge for providing network connectivity |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
US20020022453A1 (en) | 2000-03-31 | 2002-02-21 | Horia Balog | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
US8165867B1 (en) | 2000-09-15 | 2012-04-24 | Fish Robert D | Methods for translating a device command |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020072816A1 (en) | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) * | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
US7391791B2 (en) | 2001-12-17 | 2008-06-24 | Implicit Networks, Inc. | Method and system for synchronization of content rendering |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
US20030157951A1 (en) | 2002-02-20 | 2003-08-21 | Hasty William V. | System and method for routing 802.11 data traffic across channels to increase ad-hoc network capacity |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
WO2003093950A2 (en) | 2002-05-06 | 2003-11-13 | David Goldberg | Localized audio networks and associated digital accessories |
US7643894B2 (en) | 2002-05-09 | 2010-01-05 | Netstreams Llc | Audio network distribution system |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
EP1389853B1 (en) | 2002-08-14 | 2006-03-29 | Sony Deutschland GmbH | Bandwidth oriented reconfiguration of wireless ad hoc networks |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
US7076428B2 (en) | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
JP2004354721A (ja) | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
US8234395B2 (en) | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US10613817B2 (en) | 2003-07-28 | 2020-04-07 | Sonos, Inc. | Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
CN1871874A (zh) | 2003-10-24 | 2006-11-29 | 皇家飞利浦电子股份有限公司 | 自适应声音再现 |
WO2005048239A1 (ja) | 2003-11-12 | 2005-05-26 | Honda Motor Co., Ltd. | 音声認識装置 |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
US7720684B2 (en) * | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
US8073149B2 (en) | 2005-07-29 | 2011-12-06 | Panasonic Corporation | Loudspeaker device |
CN1909625A (zh) | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
EP1934828A4 (en) | 2005-08-19 | 2008-10-08 | Gracenote Inc | METHOD AND SYSTEM FOR MANAGING THE OPERATION OF A REPRODUCTION DEVICE |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
EP1952619B1 (en) | 2005-11-07 | 2018-02-28 | Telecom Italia S.p.A. | Method for managing a conference call in a telephone network |
US8135143B2 (en) | 2005-11-15 | 2012-03-13 | Yamaha Corporation | Remote conference apparatus and sound emitting/collecting apparatus |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
US8284982B2 (en) | 2006-03-06 | 2012-10-09 | Induction Speaker Technology, Llc | Positionally sequenced loudspeaker system |
WO2007123797A1 (en) | 2006-04-04 | 2007-11-01 | Johnson Controls Technology Company | System and method for extraction of meta data from a digital media storage device for media selection in a vehicle |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
US8428278B2 (en) | 2006-08-10 | 2013-04-23 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
US7987294B2 (en) | 2006-10-17 | 2011-07-26 | Altec Lansing Australia Pty Limited | Unification of multimedia devices |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8886545B2 (en) * | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8996379B2 (en) | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
BRPI0810285A2 (pt) | 2007-05-18 | 2014-12-30 | Shorthand Mobile Inc | "sistema e processo para comunicações aperfeiçoadas via sistemas de comunicação de pequena taxa de dados" |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
WO2009020617A1 (en) | 2007-08-06 | 2009-02-12 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US8073125B2 (en) | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
CN103648071B (zh) | 2007-11-20 | 2018-11-02 | 松下知识产权经营株式会社 | 扬声器、视频设备、以及便携式信息处理装置 |
US20090153289A1 (en) | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
US8423893B2 (en) | 2008-01-07 | 2013-04-16 | Altec Lansing Australia Pty Limited | User interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
WO2009120301A2 (en) | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
CN101562671A (zh) | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
US8831948B2 (en) | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR101829865B1 (ko) | 2008-11-10 | 2018-02-20 | 구글 엘엘씨 | 멀티센서 음성 검출 |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
JP5347472B2 (ja) | 2008-12-12 | 2013-11-20 | ヤマハ株式会社 | 遠隔制御装置および遠隔制御システム |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US8478982B2 (en) | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
JP5440053B2 (ja) * | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
US8753279B2 (en) | 2009-09-17 | 2014-06-17 | Hitachi Medical Corporation | Ultrasound probe and ultrasound imaging device |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
US20110145581A1 (en) | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) * | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
KR101582436B1 (ko) | 2010-05-04 | 2016-01-04 | 샤잠 엔터테인먼트 리미티드 | 미디어의 동기화 방법 및 시스템 |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US20110289506A1 (en) | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
JP2013538522A (ja) | 2010-08-27 | 2013-10-10 | インテル コーポレイション | オブジェクトに基づく動作のための技術 |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
JP5259020B2 (ja) | 2010-10-01 | 2013-08-07 | 三菱電機株式会社 | 音声認識装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
WO2012046582A1 (ja) | 2010-10-08 | 2012-04-12 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
WO2012054872A2 (en) | 2010-10-22 | 2012-04-26 | Phorus Llc | Media distribution architecture |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
US8799395B2 (en) | 2010-11-22 | 2014-08-05 | Deluxe Media Inc. | Methods and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
CN103238182B (zh) | 2010-12-15 | 2015-07-22 | 皇家飞利浦电子股份有限公司 | 具有远程噪声检测器的降噪系统 |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) * | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
CN103703719B (zh) | 2011-05-31 | 2018-06-05 | 谷歌有限责任公司 | 使通信会话中的参与者静音的方法及设备 |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9264553B2 (en) | 2011-06-11 | 2016-02-16 | Clearone Communications, Inc. | Methods and apparatuses for echo cancelation with beamforming microphone arrays |
WO2012174301A1 (en) | 2011-06-14 | 2012-12-20 | Related Content Database, Inc. | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) * | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
EP2557813A2 (en) | 2011-08-08 | 2013-02-13 | Bang & Olufsen A/S | A modular, configurable speaker system and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
KR101649499B1 (ko) | 2011-12-13 | 2016-08-19 | 인텔 코포레이션 | 연결된 미디어 장치들에서의 키워드 선택을 통한 채널 네비게이션 |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) * | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
US9431980B2 (en) * | 2012-01-30 | 2016-08-30 | Echostar Ukraine Llc | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) * | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
JP6362277B2 (ja) | 2012-06-01 | 2018-07-25 | ブラックベリー リミテッドBlackBerry Limited | マルチフォーマットオーディオシステムにおけるロック保証のための確率的方法に基づく汎用同期エンジン |
US9997069B2 (en) | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
KR101972955B1 (ko) | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
DE112013007830B4 (de) | 2012-08-03 | 2024-07-04 | Semiconductor Energy Laboratory Co., Ltd. | Lichtemittierendes Element, lichtemittierende Vorrichtung und Beleuchtungsvorrichtung |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
US9532153B2 (en) * | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US8725125B2 (en) | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
WO2014055312A1 (en) | 2012-10-02 | 2014-04-10 | Mh Acoustics, Llc | Earphones having configurable microphone arrays |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
CN102902253B (zh) | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制系统 |
ES2886325T3 (es) | 2012-10-15 | 2021-12-17 | Msi Dfat Llc | Pruebas acústicas de campo directo en un recinto semirreverberante |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
WO2014064531A1 (en) | 2012-10-22 | 2014-05-01 | Spotify Ab | Systems and methods for pre-fetching media content |
US20150228274A1 (en) | 2012-10-26 | 2015-08-13 | Nokia Technologies Oy | Multi-Device Speech Recognition |
KR20140054643A (ko) | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381002B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US9154877B2 (en) | 2012-11-28 | 2015-10-06 | Qualcomm Incorporated | Collaborative sound system |
US9875741B2 (en) | 2013-03-15 | 2018-01-23 | Google Llc | Selective speech recognition for chat and digital personal assistant systems |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
US9171092B2 (en) | 2012-12-07 | 2015-10-27 | Empire Technology Development Llc | Personal assistant context building |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
US20150338917A1 (en) | 2012-12-26 | 2015-11-26 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
KR20150104615A (ko) | 2013-02-07 | 2015-09-15 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
TWI593294B (zh) | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
US9195432B2 (en) * | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
EP2962300B1 (en) | 2013-02-26 | 2017-01-25 | Koninklijke Philips N.V. | Method and apparatus for generating a speech signal |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音系统与相关方法 |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
KR101887983B1 (ko) | 2013-03-07 | 2018-08-14 | 애플 인크. | 룸 및 프로그램 응답 확성기 시스템 |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
KR101787224B1 (ko) | 2013-03-11 | 2017-10-18 | 애플 인크. | 다양한 지향에 걸친 라우드스피커의 음색 항상성 |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
EP3709293A1 (en) | 2013-03-12 | 2020-09-16 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
WO2014160419A1 (en) | 2013-03-14 | 2014-10-02 | Tiskerling Dynamics Llc | Adaptive room equalization using a speaker and a handheld listening device |
US9854081B2 (en) | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
WO2014144773A2 (en) | 2013-03-15 | 2014-09-18 | The Echo Nest Corporation | Systems, methods, and computer readable medium for generating playlists |
EP2976897B8 (en) | 2013-03-21 | 2020-07-01 | Cerence Operating Company | System and method for identifying suboptimal microphone performance |
WO2014157433A1 (en) | 2013-03-26 | 2014-10-02 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
US9462115B2 (en) | 2013-04-04 | 2016-10-04 | James S. Rand | Unified communications system and method |
WO2014172299A1 (en) | 2013-04-15 | 2014-10-23 | Chacha Search, Inc. | Method and system of increasing user interaction |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
US9390716B2 (en) | 2013-04-19 | 2016-07-12 | Panasonic Intellectual Property Corporation Of America | Control method for household electrical appliance, household electrical appliance control system, and gateway |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9654073B2 (en) | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
US10255930B2 (en) | 2013-06-28 | 2019-04-09 | Harman International Industries, Incorporated | Wireless control of linked devices |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
CN105283836B (zh) | 2013-07-11 | 2019-06-04 | 英特尔公司 | 用于设备唤醒的设备、方法、装置及计算机可读存储介质 |
US9426598B2 (en) | 2013-07-15 | 2016-08-23 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
KR20160048960A (ko) | 2013-08-30 | 2016-05-04 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템 |
JP6037026B2 (ja) | 2013-09-11 | 2016-11-30 | 株式会社デンソー | 音声出力制御装置、プログラムおよび記録媒体 |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
CN103546616A (zh) | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
KR102114219B1 (ko) * | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
WO2015060867A1 (en) | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
DK2869599T3 (da) | 2013-11-05 | 2020-12-14 | Oticon As | Binauralt høreassistancesystem, der omfatter en database med hovedrelaterede overføringsfunktioner |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US9378651B2 (en) | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
US10224056B1 (en) | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) * | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
DE112014006235T5 (de) | 2014-01-22 | 2016-10-13 | Apple Inc. | Koordiniertes Weiterreichen einer Audiodatenübermittlung |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9929368B2 (en) | 2014-02-06 | 2018-03-27 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
US9652532B2 (en) * | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
TWI685116B (zh) | 2014-02-07 | 2020-02-11 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
US9408008B2 (en) | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9916839B1 (en) | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
US9431021B1 (en) | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
US8874448B1 (en) | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
EP2930716B1 (en) | 2014-04-07 | 2018-10-31 | Samsung Electronics Co., Ltd | Speech recognition using electronic device and server |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
CN106465458B (zh) | 2014-05-23 | 2019-12-13 | 三星电子株式会社 | 用于提供通知的方法和设备 |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
TWI682563B (zh) | 2014-05-30 | 2020-01-11 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9368105B1 (en) | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9335819B1 (en) | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
DE112015003945T5 (de) | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US9548053B1 (en) | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
JP6671379B2 (ja) | 2014-10-01 | 2020-03-25 | エクスブレイン・インコーポレーテッド | 音声および接続プラットフォーム |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
KR102287943B1 (ko) | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9544637B2 (en) | 2014-10-30 | 2017-01-10 | Verizon Patent And Licensing Inc. | Context-based media program presentation methods and systems |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
JP2016095383A (ja) | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US9812126B2 (en) | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US9992596B2 (en) | 2014-11-28 | 2018-06-05 | Audera Acoustics Inc. | High displacement acoustic transducer systems |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
CN107209549B (zh) | 2014-12-11 | 2020-04-17 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
CN104575504A (zh) | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104635539A (zh) | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其系统 |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
US9633661B1 (en) | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
WO2016165067A1 (en) | 2015-04-14 | 2016-10-20 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
DE112016002297T5 (de) | 2015-05-21 | 2018-03-15 | Semiconductor Energy Laboratory Co., Ltd. | Licht emittierendes Element, Anzeigevorrichtung, elektronisches Gerät und Beleuchtungsvorrichtung |
TWI757234B (zh) | 2015-05-21 | 2022-03-11 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
JP2016218852A (ja) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US9584935B2 (en) | 2015-05-29 | 2017-02-28 | Sound United, Llc. | Multi-zone media system and method for providing multi-zone media |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
KR20180017077A (ko) | 2015-06-17 | 2018-02-20 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 이리듐 착체, 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US20160373909A1 (en) | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
JP6739907B2 (ja) | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
KR20240035638A (ko) | 2015-07-08 | 2024-03-15 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 장치, 및 조명 장치 |
KR20240047495A (ko) | 2015-07-21 | 2024-04-12 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
TWI804457B (zh) | 2015-07-23 | 2023-06-11 | 日商半導體能源研究所股份有限公司 | 發光元件,顯示裝置,電子裝置,以及照明裝置 |
US20170034263A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized Playback of Streamed Audio Content by Multiple Internet-Capable Portable Devices |
KR102402512B1 (ko) | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制系统及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2017039632A1 (en) | 2015-08-31 | 2017-03-09 | Nunntawi Dynamics Llc | Passive self-localization of microphone arrays |
CN106488302B (zh) | 2015-09-02 | 2021-02-23 | 哈曼国际工业有限公司 | 切换音频输出的方法、回放设备及回放系统 |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
US10026399B2 (en) | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
US10706873B2 (en) | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
CN107710770B (zh) | 2015-09-28 | 2021-02-09 | 谷歌有限责任公司 | 用于时间同步的多区域媒体流式传输的系统和方法 |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
TW202316695A (zh) | 2015-09-30 | 2023-04-16 | 日商半導體能源研究所股份有限公司 | 發光元件,顯示裝置,電子裝置,及照明裝置 |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
US9747926B2 (en) | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
US10706853B2 (en) | 2015-11-25 | 2020-07-07 | Mitsubishi Electric Corporation | Speech dialogue device and speech dialogue method |
US9484030B1 (en) * | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
EP3414759B1 (en) | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9858927B2 (en) | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9772817B2 (en) * | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US20170330564A1 (en) | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing Simultaneous Speech from Distributed Microphones |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US10134399B2 (en) * | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) * | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10026403B2 (en) | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9967382B2 (en) | 2016-08-19 | 2018-05-08 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
WO2018039045A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
US10461953B2 (en) | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10283138B2 (en) | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
WO2018067403A1 (en) | 2016-10-03 | 2018-04-12 | Google Inc. | Multi computational agent performance of tasks |
KR20200035476A (ko) | 2016-10-03 | 2020-04-03 | 구글 엘엘씨 | 디바이스 토폴로지에 기초한 음성 명령 프로세싱 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
KR102241970B1 (ko) | 2016-11-07 | 2021-04-20 | 구글 엘엘씨 | 기록된 미디어 핫워드 트리거 억제 |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10079015B1 (en) | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10255032B2 (en) | 2016-12-13 | 2019-04-09 | EVA Automation, Inc. | Wireless coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制系统及控制方法 |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR20180090586A (ko) | 2017-02-03 | 2018-08-13 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
CN110506452B (zh) | 2017-02-07 | 2021-12-03 | 路创技术有限责任公司 | 基于音频的负载控制系统 |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10431217B2 (en) | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
EP3610480B1 (en) | 2017-12-06 | 2022-02-16 | Google LLC | Ducking and erasing audio signals from nearby devices |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
JP7044415B2 (ja) | 2017-12-31 | 2022-03-30 | 美的集団股▲フン▼有限公司 | ホームアシスタント装置を制御するための方法及びシステム |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
EP3726856B1 (en) | 2019-04-17 | 2022-11-16 | Oticon A/s | A hearing device comprising a keyword detector and an own voice detector |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
-
2016
- 2016-07-15 US US15/211,748 patent/US10152969B2/en active Active
-
2017
- 2017-07-14 EP EP17755301.3A patent/EP3485488B1/en active Active
- 2017-07-14 WO PCT/US2017/042227 patent/WO2018013978A1/en unknown
- 2017-07-14 EP EP21212763.3A patent/EP4036912A1/en active Pending
- 2017-07-14 CN CN201780056695.7A patent/CN109716429B/zh active Active
- 2017-07-14 EP EP20166332.5A patent/EP3709292B1/en active Active
-
2018
- 2018-12-10 US US16/214,666 patent/US10297256B2/en active Active
-
2019
- 2019-05-20 US US16/416,752 patent/US10699711B2/en active Active
-
2020
- 2020-06-29 US US16/915,234 patent/US11664023B2/en active Active
-
2023
- 2023-05-25 US US18/323,726 patent/US20240029731A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101427154A (zh) * | 2005-09-21 | 2009-05-06 | 皇家飞利浦电子股份有限公司 | 使用远程位置麦克风进行语音激活控制的超声成像系统 |
CN104885406A (zh) * | 2012-12-18 | 2015-09-02 | 三星电子株式会社 | 用于在家庭网络系统中远程控制家庭设备的方法和设备 |
CN105389099A (zh) * | 2014-08-29 | 2016-03-09 | 三星电子株式会社 | 用于语音记录和回放的方法和设备 |
CN105427861A (zh) * | 2015-11-03 | 2016-03-23 | 胡旻波 | 智能家居协同麦克风语音控制系统及控制方法 |
Also Published As
Publication number | Publication date |
---|---|
US20190108839A1 (en) | 2019-04-11 |
EP4036912A1 (en) | 2022-08-03 |
US10297256B2 (en) | 2019-05-21 |
WO2018013978A1 (en) | 2018-01-18 |
EP3709292A1 (en) | 2020-09-16 |
US10699711B2 (en) | 2020-06-30 |
US11664023B2 (en) | 2023-05-30 |
CN109716429A (zh) | 2019-05-03 |
US20190341045A1 (en) | 2019-11-07 |
US20200395015A1 (en) | 2020-12-17 |
EP3709292B1 (en) | 2021-12-08 |
US20180018964A1 (en) | 2018-01-18 |
US20240029731A1 (en) | 2024-01-25 |
US10152969B2 (en) | 2018-12-11 |
EP3485488A1 (en) | 2019-05-22 |
EP3485488B1 (en) | 2020-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109716429B (zh) | 由多个设备进行的语音检测 | |
CN109690672B (zh) | 对语音输入进行上下文化 | |
US11641559B2 (en) | Audio playback settings for voice interaction | |
US11947870B2 (en) | Audio response playback | |
CN109791765B (zh) | 多个语音服务 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |