CN111194439B - 唤醒词检测抑制 - Google Patents
唤醒词检测抑制 Download PDFInfo
- Publication number
- CN111194439B CN111194439B CN201880064916.XA CN201880064916A CN111194439B CN 111194439 B CN111194439 B CN 111194439B CN 201880064916 A CN201880064916 A CN 201880064916A CN 111194439 B CN111194439 B CN 111194439B
- Authority
- CN
- China
- Prior art keywords
- wake
- audio content
- playback
- playback device
- networked microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 79
- 230000001629 suppression Effects 0.000 title description 2
- 230000004044 response Effects 0.000 claims abstract description 215
- 238000000034 method Methods 0.000 claims abstract description 118
- 230000001360 synchronised effect Effects 0.000 claims description 22
- 238000004891 communication Methods 0.000 description 40
- 239000003550 marker Substances 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 241000238558 Eucarida Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 235000021167 banquet Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Oscillators With Electromechanical Resonators (AREA)
- Control Of Stepping Motors (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
Abstract
示例技术涉及确定NMD的方向。示例实现包括一种回放设备,回放设备接收表示音频内容的数据,以供回放设备进行回放。在回放设备回放音频内容之前,回放设备在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。回放设备使一个或多个联网麦克风设备在回放设备回放音频内容期间停用该一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,并且经由一个或多个扬声器回放音频内容。在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使给该定联网麦克风设备经由麦克风收听特定唤醒词之后的语音命令。
Description
相关申请的交叉引用
本申请要求2017年8月7日提交的美国专利申请No.15/670,361的优先权,其全部内容通过引用并入本文。
技术领域
本公开涉及消费者产品,更具体地,涉及与媒体播放或者其某个方面有关的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices”的专利申请,并在2005年开始出售媒体播放系统为止。Sonos无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
附图说明
参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:
图1示出可以实施某些实施例的示例媒体回放系统配置;
图2示出示例回放设备的功能框图;
图3示出示例控制设备的功能框图;
图4示出示例控制器接口;
图5示出示例处理系统;
图6示出根据本文描述的方面的示例多个网络设备;
图7示出根据本文描述的方面的示例网络麦克风设备的功能框图;
图8示出停用一个或多个MD的唤醒响应的示例流程图;
图9示出使NMD忽略唤醒词的示例消息;
图10A、图10B、图10C、图10D示出了使NMD忽略唤醒词的示例指令;
图11示出停用一个或多个NMD的唤醒响应的示例流程图;
图12示出停用一个或多个NMD的唤醒响应的示例流程图;以及
图13示出抑制唤醒响应的示例流程图。
附图用于示出示例实施例的目的,但可以理解,本发明不限于附图中示出的布置和手段。
具体实施方式
I.概述
联网麦克风设备(NMD)可用于使用语音控制来控制家庭。NMD可以是例如能够经由麦克风接收语音输入的回放设备、服务器或系统,或者其一部分。在一些示例中,回放设备是/>回放设备。另外,NMD可以是能够经由麦克风接收语音输入的另一设备、服务器或系统(例如,/>等),或者其一部分。2017年2月21日提交的题为“Voice Control of a Media Playback System”的美国申请No.15/438,749通过引用整体并入本文,其提供了启用语音的家庭架构的示例。语音控制对于“智能”家庭情况下的各种设备(例如回放设备、无线照明设备、恒温器、门锁、家庭自动化以及其他示例)可以是有益的。
在一些实施方式中,由NMD检测到的语音输入被发送给语音服务以进行处理。NMD与回放设备一起可以用作到语音服务的麦克风/扬声器接口。语音输入由NMD的麦克风检测,然后传输给特定的语音服务进行处理。然后,语音服务可以返回命令或语音输入的其他结果。
唤醒词的发音可以调用语音服务。例如,在查询语音服务时,用户可以说出唤醒词“Alexa”,然后进行语音输入。其他示例包括用于查询/>语音服务的“好,Google”和用于查询/>语音服务的“嘿,Siri”。存在唤醒词和语音服务的其他示例。在检测到唤醒词之后,NMD可以通过经由麦克风收听唤醒词之后的语音命令来做出响应。该响应在本文中被称为NMD的“唤醒响应”。
在一些情况下,回放包括唤醒词的音频内容可能错误地触发NMD的唤醒响应。许多语音服务的唤醒词是从现有语言的词汇中选择的预先存在的词。例如,几种流行的语音服务使用给定名称作为唤醒词(例如“Alexa”和“Siri”)。因此,在一些情况下,诸如谈话节目、电影、电视节目、播客、互联网流式视频等的所记录的音频内容可能包括唤醒词或类似词。在NMD范围内回放这类音频内容可能错误地触发NMD,出于许多原因,这可能是不希望的,原因包括它可能干扰对音频内容的赏析。
例如,电视可以回放针对给定语音服务的广告。在广告期间,演员可能说出语音服务的唤醒词,也许是为了演示语音服务是如何被调用的。与电视位于同一房间的NMD可能检测到来自电视的音频输入,并且当NMD检测到广告中的唤醒词时调用语音服务。这可能是不希望的。此外,由于广告可以同时在许多电视上播放,因此广告可以同时触发许多NMD,这可能导致对语音服务的请求发生不希望的激增。
为了避免其广告引起误触发,语音服务的运营商可以标记其广告中包括唤醒词的部分,并对他们的NMD进行编程以忽视这些被标记的部分。例如,运营商可以将音调或其他音频标记混入语音服务的广告中,并对他们的NMD进行编程,以忽视与该音频标记一起检测到的唤醒词。该实现在有限的情况下(例如语音服务的广告,其中语音服务的运营商可以将该标记嵌入音频内容中)可能是有用的。然而,对于语音服务的运营商无法控制的绝大多数其他音频内容,该实现没有用。
本文描述的示例技术可以包括:在音频内容被回放设备可听地回放之前,对要被回放设备回放的音频内容进行处理,确定音频内容是否包括一个或多个唤醒词,并且通知一个或多个NMD在该一个或多个回放设备回放唤醒词时忽略这些唤醒词。以这种方式,该技术可以帮助防止NMD的错误触发。显然,这些技术可以适用于要被回放设备回放的任何所记录的音频内容。
例如,回放设备可以接收音频内容以供回放。在播放音频内容之前,回放设备将音频内容存储在存储器中(例如,在缓冲器中),并对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当回放设备最终回放音频内容时,回放设备(可以是NMD本身)使一个或多个NMD忽略这些唤醒词。
作为另一示例,NMD可以接收已经被指定由回放设备回放的音频内容。在回放设备回放音频内容之前,NMD可以对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当唤醒词最终被回放设备回放时,NMD可以使其本身(以及可能附近的其他NMD)忽略这些唤醒词。
NMD可以使用各种技术中的任一种来忽略唤醒词。在一些情况下,可以指示NMD在唤醒词被回放设备回放时不检测唤醒词,这可能通过指示NMD停止收听唤醒词,通过停用NMD的麦克风阵列一段时间,或者通过在回放设备的方向创建收听无效(NULL)等来进行。备选地,NMD可以继续最初地检测唤醒词,但是NMD被指示抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务,这可能通过在某些时段期间忽略唤醒词,或者通过在某些时段期间忽略所有所记录的音频来进行。
当在回放设备可听地回放音频内容之前处理音频内容时,处理设备(例如,回放设备或NMD)也可以确定所记录的音频内容的哪些部分包含唤醒词。这些部分可以由音频内容内的时间段来定义,例如唤醒词的开始和停止时间(例如,播客中的唤醒词从33:52.543开始并在33:54.013结束)。在回放音频内容时,可以指示附近的NMD在这些时间段期间忽略唤醒词。
作为另一示例,处理设备可以对音频内容(或音频内容的一部分)中唤醒词的数量进行计数。例如,正在处理广告的音频内容的回放设备可能在该广告中检测到唤醒词的四个实例。然后,回放设备可以指示回放设备附近的NMD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的四个唤醒词)。
在其他示例中,处理设备可以在所记录的音频内容中动态插入音频音调或其他标记,以指定在音频内容中检测到的唤醒词。然后,当回放设备回放音频内容时,可以指示将音频标记和唤醒词一起检测到的NMD忽略该唤醒词的实例。响应于检测到相关联的音频标记,在回放设备的可听范围内的多个NMD可以各自检测唤醒词并且忽略唤醒词。
示例技术可以涉及停用一个或多个NMD的唤醒响应。第一实施方式可以包括:经由网络接口接收表示音频内容的数据,以供回放设备回放,并且在回放设备回放音频内容之前,在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第一实施方式还可以包括:使一个或多个联网麦克风设备在回放设备回放音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令。第一实施方式还可以包括经由一个或多个扬声器回放所述音频内容。
第二实施方式可以包括经由网络接口接收表示音频内容的数据,以供所述回放设备回放。第二实施方式还可以包括:在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第二实施方式还可以包括:在所述回放设备回放所述音频内容期间停用联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应,并且当所述回放设备正在回放所述音频内容时,经由麦克风检测所回放的音频内容。
第三实施方式可以包括经由计算系统的接口接收述音频内容,以供一个或多个回放设备回放。第三实施方式还可以包括:在回放设备回放音频内容之前,在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第三实施方式还可以包括:使一个或多个联网麦克风设备在回放设备回放音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
第四实施方式可以包括经由网络接口接收指令,以停用联网麦克风设备对一个或多个唤醒词的唤醒响应。第四实施方式还可以包括经由麦克风检测由一个或多个回放设备回放的音频内容。第四实施方式还可以包括:确定检测到的音频内容包括一个或多个唤醒词,并且响应于所接收的指令,停用联网麦克风设备对检测到的音频内容中的一个或多个唤醒词的唤醒响应。
这些示例实施方式中的每一个可以被体现为方法、被配置为执行该实施方式的设备、被配置为执行该实施方式的设备系统、或包含指令的非暂时性计算机可读介质等,所述指令能够由所述一个或多个处理器执行以执行该实现。本领域普通技术人员将理解,本公开包括许多其他实施例,包括本文描述的示例特征的组合。此外,描述为由给定设备执行以说明技术的任何示例操作可以由任何合适的设备执行,包括本文描述的设备。此外,任何设备可以使另一设备执行本文描述的任何操作。
尽管本文描述的一些示例可以涉及由给定行动者(例如“用户”和/或其他实体)执行的功能,但是应当理解,该描述仅出于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。
II.示例操作环境
图1示出了媒体回放系统100的示例配置,在媒体回放系统100中可以实施或实现本文公开的一个或多个实施例。如图所示的媒体回放系统100与具有若干房间和空间(例如,主卧室、书房、餐厅和客厅)的示例家居环境相关联。如图1的示例所示,媒体回放系统100包括回放设备102、104、106、108、110、112、114、116、118、120、122和124、控制设备126和128、以及有线或无线网络路由器130。图1中还示出了MD 132和134。
可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件可以如何交互以向用户提供媒体体验的进一步讨论。虽然本文的讨论可能总体上涉及示例媒体回放系统100,但是本文描述的技术不限于尤其如图1所示的家居环境内的应用。例如,本文描述的技术可以在可能期望多区域音频的环境中有用,例如,诸如餐馆、商场或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或小汽车之类的载运工具、船舶或船只、飞机等。
a.示例回放设备
图2示出示例回放设备200的功能框图,示例回放设备200可以被配置为图1的媒体回放系统100的回放设备102—124中的一个或多个。回放设备200可以包括处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、以及包括无线接口216和有线接口218的网络接口214。在一种情况下,回放设备200可以不包括扬声器212,而是包括用于将回放设备200连接到外部扬声器的扬声器接口。在另一种情况下,回放设备200可以既不包括扬声器212也不包括音频放大器210,而是包括用于将回放设备200连接到外部音频放大器或视听接收器的音频接口。
在一个示例中,处理器202是时钟驱动计算组件,其被配置为根据存储器206中存储的指令处理输入数据。存储器206可以是有形计算机可读介质,其被配置为存储可由处理器202执行的指令。例如,存储器206可以是数据存储设备,其可以加载有可由处理器202执行以实现某些功能的一个或多个软件组件204。在一个示例中,所述功能可以包括回放设备200从音频源或另一回放设备获取音频数据。在另一示例中,所述功能可以包括回放设备200向网络上的另一设备或回放设备发送音频数据。在又一示例中,所述功能可以包括将回放设备200与一个或多个回放设备配对以创建多通道音频环境。
某些功能可以包括回放设备200与一个或多个其他回放设备同步对音频内容的回放。在同步回放期间,收听者将优选地不能够感知到回放设备200和一个或多个其他回放设备对音频内容的回放之间的时间延迟差异。通过引用将其内容全部合并于此的题目为“System and method for synchronizing operations among a plurality ofindependently clocked digital data processing devices(用于同步多个独立时钟控制的数字数据处理设备之间的操作的系统和方法)”的美国专利No.8,234,395更详细地提供了回放设备之间的音频回放同步的一些示例。
存储器206还可以被配置为存储与回放设备200相关联的数据,例如,回放设备200是其一部分的一个或多个区域和/或区域组、回放设备200可访问的音频源、或回放设备200(或某个其他回放设备)可以与之相关联的回放队列。数据可以被存储为一个或多个状态变量,所述状态变量被周期性地更新并用于描述回放设备200的状态。存储器206还可以包括与媒体系统的其他设备的状态相关联的数据,并且间或地在设备之间共享,使得设备中的一个或多个具有与系统相关联的最新数据。其他实施例也是可能的。
音频处理组件208可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施例中,音频处理组件208中的一个或多个可以是处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地改变音频内容以产生音频信号。然后,所产生的音频信号可被提供至音频放大器210进行放大,并通过扬声器212回放。具体地,音频放大器210可以包括被配置为将音频信号放大到用于驱动扬声器212中的一个或多个的电平的设备。扬声器212可以包括单独的换能器(例如,“驱动器”)或具有一个或多个驱动器的包括外壳的完整扬声器系统。例如,扬声器212的特殊驱动器可以包括例如低音喇叭(例如,针对低频)、中频段驱动器(例如,针对中频)和/或高频扬声器(例如,针对高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的各个对应的音频放大器来驱动。除了产生用于由回放设备200回放的模拟信号之外,音频处理组件208还可以被配置为处理要向一个或多个其他回放设备发送以供回放的音频内容。
可以例如通过音频线路输入的输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由回放设备200处理和/或回放的音频内容。
网络接口214可以被配置为促进回放设备200与数据网络上的一个或多个其他设备之间的数据流。这样,回放设备200可以被配置为通过数据网络从与回放设备200通信的一个或多个其他回放设备、局域网内的网络设备、或通过诸如互联网之类的广域网从音频内容源接收音频内容。在一个示例中,回放设备200发送和接收的音频内容和其他信号可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字分组数据的形式来发送。在这种情况下,网络接口214可以被配置为解析数字分组数据,使得去往回放设备200的数据被回放设备200正确地接收和处理。
如图所示,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为回放设备200提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备200相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)无线通信。有线接口218可以为回放设备200提供网络接口功能,以根据通信协议(例如,IEEE 802.3)通过有线连接与其他设备通信。虽然图2中所示的网络接口214包括无线接口216和有线接口218,但是在一些实施例中,网络接口214可以仅包括无线接口或仅包括有线接口。
在一个示例中,回放设备200和另一回放设备可以配对,以播放音频内容的两个单独的音频分量。例如,回放设备200可以被配置为播放左通道音频分量,而另一回放设备可以被配置为播放右通道音频分量,从而产生或增强音频内容的立体声效果。配对的回放设备(也称为“绑定的回放设备”)还可以与其他回放设备同步播放音频内容。
在另一示例中,回放设备200可以与一个或多个其他回放设备声音合并以形成单个合并的回放设备。合并的回放设备可以被配置为与非合并的回放设备或配对的回放设备不同地处理和再现声音,这是因为合并的回放设备可以具有可以通过其呈现音频内容的附加的扬声器驱动器。例如,如果回放设备200是被设计为呈现低频段音频内容的回放设备(即,低音喇叭),则回放设备200可以与被设计为呈现全频段音频内容的回放设备合并。在这种情况下,当与低频回放设备200合并时,全频段回放设备可以被配置为仅呈现音频内容的中高频分量,而低频段回放设备200则呈现音频内容的低频分量。合并的回放设备还可以与单个回放设备或另一合并的回放设备配对。
举例来说,SONOS公司目前提供(或已经提供)销售某些回放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”、和“SUB”。任何其他过去、现在和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。此外,应当理解,回放设备不限于图2示出的示例或SONOS的产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括个人移动媒体回放设备的扩展基座,或与其交互。在又一示例中,回放设备可以是诸如电视、照明器材或在室内外使用的一些其他设备之类的另一设备或组件的组成部分。
b.示例回放区域配置
返回参考图1的媒体回放系统100,环境可以具有一个或多个回放区域,每个回放区域具有一个或多个回放设备。媒体回放系统100可以建立有一个或多个回放区域,之后可以添加或移除一个或多个区域,以达到图1所示的示例配置。每个区域可以根据不同的房间或空间(例如书房、浴室、主卧室、卧室、厨房、餐厅、客厅和/或阳台)被赋予名称。在一种情况下,单个回放区域可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个回放区域。
如图1所示,阳台、餐厅、厨房、浴室、书房和卧室区域均具有一个回放设备,而客厅和主卧室区域均具有多个回放设备。在客厅区域中,回放设备104、106、108和110可以被配置为作为单独的回放设备、作为一个或多个绑定的回放设备、作为一个或多个合并的回放设备或其任何组合来同步播放音频内容。类似地,在主卧室的情况下,回放设备122和124可以被配置为作为单独的回放设备、作为绑定的回放设备、或作为合并的回放设备来同步播放音频内容。
在一个示例中,图1的环境中的一个或多个回放区域可以分别播放不同的音频内容。例如,用户可以在阳台区域中烧烤并收听正由回放设备102播放的嘻哈音乐,而另一用户可以正在厨房区域中准备食物并收听正由回放设备114播放的古典音乐。在另一示例中,回放区域可以与另一回放区域同步地播放相同的音频内容。例如,用户可以在书房区域中,其中回放设备118正在播放与阳台区域中的回放设备102正在播放的摇滚音乐相同的摇滚音乐。在这种情况下,回放设备102和118可以同步播放摇滚音乐,使得用户可以在不同回放区域之间移动时无缝地(或至少基本上无缝地)享受被外放播放的音频内容。可以以类似于如先前引用的美国专利No.8,234,395中所述的回放设备之间的同步的方式来实现回放区域之间的同步。
如上文所建议的,可以动态地修改媒体回放系统100的区域配置,并且在一些实施例中,媒体回放系统100支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域中或从区域中移出,则可以重新配置媒体回放系统100以适应改变。例如,如果用户将回放设备102从阳台区域物理地移动到书房区域,则书房区域现在可以包括回放设备118和回放设备102。可以通过诸如控制设备126和128之类的控制设备,将回放设备102与书房区域配对或分组,和/或重新命名(如果需要)。另一方面,如果一个或多个回放设备被移动到家居环境中还不是回放区域的特殊区域,则可以针对该特殊区域创建新的回放区域。
此外,媒体回放系统100的不同回放区域可以被动态组合为区域组或分成单独的回放区域。例如,餐厅区域和厨房区域14可以组合为用于宴会的区域组,使得回放设备112和114可以同步呈现音频内容。另一方面,如果用户期望在客厅空间中听音乐,而另一用户期望看电视,则客厅区域可以被分成包括回放设备104的电视区域和包括回放设备106、108和110的收听区域。
c.示例控制设备
图3示出示例控制设备300的功能框图,示例控制设备300可以被配置为媒体回放系统100的控制设备126和128之一或两者。控制设备300也可以被称为控制器。如图所示,控制设备300可以包括处理器302、存储器304、网络接口306和用户界面308。在一个示例中,控制设备300可以是媒体回放系统100的专用控制器。在另一示例中,控制设备300可以是可以在其上安装媒体回放系统控制器应用软件的网络设备,例如,iPhoneTM、iPadTM或任何其他智能电话、平板计算机或网络设备(例如,联网计算机,如PC或MacTM)。
处理器302可以被配置为执行与有助于用户对媒体回放系统100进行访问、控制和配置相关的功能。存储器304可以被配置为存储可由处理器302执行的指令以执行这些功能。存储器304还可以被配置为存储媒体回放系统控制器应用软件和与媒体回放系统100和用户相关联的其他数据。
在一个示例中,网络接口306可以基于行业标准(例如,红外、无线电、包括IEEE802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准在内的无线标准等)。网络接口306可以提供用于控制设备300与媒体回放系统100中的其他设备通信的手段。在一个示例中,可以经由网络接口306在控制设备300和其他设备之间传送数据和信息(例如,状态变量)。例如,媒体回放系统100中的回放区域和区域组配置可以由控制设备300通过网络接口306从回放设备或另一网络设备接收,或者由控制设备300通过网络接口306向另一回放设备或网络设备发送。在一些情况下,该另一网络设备可以是另一控制设备。
诸如音量控制和音频回放控制之类的回放设备控制命令也可以通过网络接口306从控制设备300向回放设备传送。如上文所建议的,还可以由用户使用控制设备300来执行对媒体回放系统100的配置的改变。配置改变可以包括:向区域增加或从区域中移除一个或多个回放设备、向区域组增加或从区域组中移除一个或多个区域、形成绑定或合并的播放器、将一个或多个回放设备与绑定或合并的播放器中分离等。因此,控制设备300有时可以被称为控制器300,无论控制设备300是专用控制器还是在其上安装有媒体回放系统控制器应用软件的网络设备。
控制设备300的用户界面308可以被配置为通过提供诸如图4中所示的控制器界面400之类的控制器界面来帮助用户访问和控制媒体播放系统100。控制器界面400包括回放控制区410、回放区域区420、回放状态区430、回放队列区440和音频内容源区450。所示的用户界面400仅是可以在诸如图3的控制设备300(和/或图1的控制设备126和128)之类的网络设备上提供、并由用户访问以控制媒体回放系统(例如,媒体回放系统100)的用户界面的一个示例。备选地,可以在一个或多个网络设备上实现变化的格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的类似的控制访问。
回放控制区410可以包括可选择(例如,通过触摸或通过使用光标)图标,以使所选择的回放区域或区域组中的回放设备播放或暂停、快进、回退、跳到下一个、跳到前一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式(cross fademode)。回放控制区410还可以包括用于修改均衡设置、回放音量等的可选择图标。
回放区域区420可以包括媒体回放系统100内的回放区域的表示。在一些实施例中,回放区域的图形表示可以是可选择的,以调出附加的可选择图标来管理或配置媒体回放系统中的回放区域,例如,创建绑定的区域、创建区域组、分离区域组、重命名区域组等。
例如,如图所示,可以在播放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以便调出用于选择媒体播放系统中的、将与特定区域分在一组的一个或多个其他区域的选项。一旦被分组,已经与特殊区域分在一组的区域中的回放设备将被配置为与特殊区域中的回放设备同步地播放音频内容。类似地,可以在区域组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以调出用于取消选择区域组中的要从该区域组中移除的一个或多个区域的选项。通过诸如用户界面400之类的用户界面对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区域或区域组配置被修改时,可以动态地更新回放区域在回放区域区420中的表示。
回放状态区430可以包括在所选择的回放区域或区域组中当前正在播放、先前播放或安排为接下来播放的音频内容的图形表示。可以在用户界面上可视地区分所选择的回放区域或区域组,例如,在回放区域区420和/或回放状态区430内。图形表示可以包括曲目名称、艺术家姓名、专辑名称、专辑年份、曲目长度以及当通过用户界面400控制媒体回放系统时用户知道了会有用的其他相关信息。
回放队列区440可以包括与所选择的回放区域或区域组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区域或区域组可以与回放队列相关联,该回放队列包含与由该回放区域或区域组回放的零个或多个音频项相对应的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其可以由回放区域或区域组中的回放设备用于从本地音频内容源或联网音频内容源查找和/或获取音频项,可能供回放设备回放。
在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在另一示例中,当回放区域或区域组正在持续播放流式音频内容(例如,互联网收音机,其可以持续播放直到被停止),而不是具有回放持续时间的分立音频项时,回放队列可以是空的或被填充但是“未使用”。在备选实施例中,回放队列可以包括互联网收音机和/或其他流式音频内容项,并且当回放区域或区域组正在播放这些内容项时处于“使用中”。其他示例也是可能的。
当回放区域或区域组被“分组”或“取消分组”时,可以清除与受影响的回放区域或区域组相关联的回放队列,或者重新关联。例如,如果包括第一回放队列的第一回放区域与包括第二回放队列的第二回放区域被分在一组,则所建立的区域组可以具有相关联的回放队列,其最初是空的,包含来自第一回放队列的音频项(例如,如果第二回放区域被添加到第一回放区域),或包含来自第二回放队列的音频项(例如,如果第一回放区域被添加到第二回放区域),或包含来自第一回放队列和第二回放队列二者的音频项的组合。随后,如果所建立的区域组被取消分组,则所得到的第一回放区域可以与先前的第一回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含与来自在所建立的区域组被取消分组之前所建立的区域组相关联的回放队列的音频项。类似地,所得到的第二回放区域可以与先前的第二回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在与所建立的区域组被取消分组之前所建立的区域组相关联的回放队列的音频项。其他示例也是可能的。
返回参考图4的用户界面400,音频内容在回放队列区440中的图形表示可以包括曲目标题、艺术家姓名、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以调出附加的可选择图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以将所表示的音频内容从回放队列中移除,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以立即播放,或者在任何当前播放的音频内容之后进行播放等。与回放区域或区域组相关联的回放队列可以存储于该回放区域或区域组中的一个或多个回放设备上、不在该回放区域或区域组中的回放设备上和/或一些其他指定设备上的存储器中。这种回放队列的回放可以涉及一个或多个回放设备可能按顺序或随机顺序回放队列中的媒体项。
音频内容源区450可以包括可选择的音频内容源的图形表示,可以从音频内容源中获取音频内容,并由所选择的回放区域或区域组来播放。有关音频内容源的讨论可参见以下部分。
d.示例音频内容源
如前所述,区域或区域组中的一个或多个回放设备可以被配置为从各种可用音频内容源中获取回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,回放设备可以直接从对应的音频内容源(例如,线路输入连接)中获取音频内容。在另一示例中,可以在网络上,通过一个或多个其他回放设备或网络设备向回放设备提供音频内容。
示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制设备、支持网络的个人计算机、或者网络附接存储器(NAS)等)上的本地音乐库、通过互联网(例如,云)提供音频内容的流式音频服务、或者通过回放设备或网络设备上的线路输入连接连接至媒体回放系统的音频源等。
在一些实施例中,可以在诸如图1的媒体回放系统100之类的媒体回放系统中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描由媒体回放系统中的回放设备可访问的网络上共享的所有文件夹/目录中的可识别音频项,并且生成或更新包含元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能的。
e.示例处理系统
图5示出了示例处理系统500的功能框图,示例处理系统500包括音频输入/输出组件502、唤醒词检测组件504和通知组件506。在操作中,处理系统500检测所记录的音频内容内的唤醒词,并向NMD提供通知,以忽略或以其他方式抑制NMD对检测的唤醒词的经编程的唤醒响应。在各个实施例中,处理系统500可以在回放设备、NMD或诸如云服务器的单独的处理设备等中实现。在一些实施例中,处理系统的各种组件(和/或其功能)分布在多个设备之间。
在操作中,音频输入/输出组件502经由输入接口接收指定由回放设备进行回放的所记录的音频内容。例如,控制设备(例如,图1的控制设备126或128)可以指示回放设备(例如,图1的任何回放设备)回放某些音频内容,这可能通过将该内容放置在回放设备的回放队列中以使回放设备获取音频内容,通过将音频内容流引导到回放设备,或者通过经由模拟或数字线路输入接口将音频内容引导到回放设备等来进行。处理系统500的音频/输入组件502在回放设备回放音频内容之前接收该所记录的音频内容。
如上所述,在一些示例中,处理系统500在回放设备内实现。在这些实施例中,回放设备500已经可以访问回放必需的音频内容。例如,回放设备可以通过一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)来经由网络接口从网络源(例如,流式媒体服务或移动设备)接收音频内容。备选地,回放设备可以经由模拟(例如,RCA)或数字(例如,或/>)输入线接口接收音频内容。
在其他示例中,处理系统500在NMD或与回放设备分离的其他处理设备内实现。在这些实施例中,处理系统500可以经由网络接口从回放设备或从音频内容的源等接收音频内容。在另一示例中,输入线接口可以将音频内容直接提供给NMD,或者回放设备可以经由输入线接口接收音频内容,并且通过一个或多个网络将内容中继给处理系统500。
例如,处理系统500可以访问回放设备的回放队列。如上所述,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,它们可由回放区域或区域组中的回放设备使用以从本地音频内容源或联网的音频内容源查找和/或获取音频项,可能用于回放设备进行回放。在被回放设备回放之前,处理系统500可以类似地使用这种标识符从本地音频内容源或联网的音频内容源获取音频内容。
在一些实施方式中,回放队列被存储在回放设备的数据存储设备中。在其他实施方式中,回放队列被存储在云服务器上。存储在云服务器上的回放队列(即,云队列)可以是存储在回放设备上的回放队列的实例或表示。云队列可以包括回放指针或表示回放设备上的当前回放状态的其他状态信息。
在一些情况下,处理系统500可以将所接收的音频内容转换成适于唤醒词检测的格式。例如,如果经由模拟输入线接口将音频内容提供给音频/输入组件502,则处理系统500可以将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)。作为另一示例,如果所接收的音频内容是以不适于分析的数字形式接收到的,则处理系统500可以将该记录转码为合适的格式。
唤醒词检测组件504对所接收的音频内容进行分析,以确定记录中是否存在任何唤醒词。唤醒词检测组件504可以使用唤醒词检测算法来分析所接收的音频内容。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。
在一些实施方式中,唤醒词检测组件504可以对记录使用与如下算法相同的算法:由NMD使用以检测经由麦克风记录的音频中的唤醒词的算法。在典型操作期间,示例NMD不断记录音频并将所记录的音频流提供给唤醒词检测算法,以便确定所记录的音频是否包括唤醒词。这里,不同于将由NMD的麦克风记录的音频提供给唤醒词检测算法,唤醒词检测组件504提供指定用于回放的预先记录的音频内容。
在分析期间,唤醒词检测组件504还确定每个唤醒词出现在所接收的音频内容中的位置。例如,唤醒词检测组件504可以将所接收的音频内容划分成已知长度的片段。然后,唤醒词检测组件504可以通过识别检测到唤醒词的片段来确定唤醒词出现在记录中的位置。例如,如果每个片段长5秒,并且在第四片段中检测到唤醒词,则唤醒词必定位于记录中的15到20秒之间。唤醒词检测组件504可以记录音频内容中包含唤醒词的各部分,可能使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来记录。这些时间戳可以定义与音频记录的开始或音频记录中的另一特定位置的相应时间偏移。在一些情况下,唤醒词检测组件504可以将音频记录分为重叠的片段,以避免将唤醒词分解为不可识别的部分。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在示例内,处理系统500可以将所接收的音频内容缓冲在存储器中。例如,处理系统500可以将所接收的音频内容存储在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理以确定所接收的音频内容是否包含唤醒词时,从缓冲器中移除这些唤醒词。
在一些情况下,唤醒词检测组件504同时(或基本同时)对所接收的音频内容运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的APPLE的或MICROSOFT的/>)各自使用不同的唤醒词来调用其相应的语音服务。为了支持多种服务,唤醒词检测组件504可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法。
如果在音频内容中检测到一个或多个唤醒词,则通知组件506通知一个或多个NMD(例如,图1的NMD 132和/或134)。当在回放设备回放包含唤醒词的音频内容的过程中回放检测到的唤醒词时,该通知使NMD忽略检测到的唤醒词。例如,通知组件506可以通过网络接口向一个或多个NMD发送指令,以忽略某些唤醒词或某个数量的唤醒词。
在一些情况下,通知组件506可以防止NMD在唤醒词被回放设备回放时检测该唤醒词。例如,通知组件506可以指示NMD停止收听唤醒词(例如,停止对所记录的音频进行处理)一段时间。备选地,通知组件506可以指示NMD暂时停用其麦克风阵列(例如,在与唤醒词预期被回放设备播放的时间相对应的时间段期间)。作为又一示例,通知组件506可以指示NMD使用其麦克风阵列在回放设备的方向上创建收听无效,使得NMD不检测唤醒词。也可以使用其他示例。
备选地,NMD可以检测唤醒词,但是通知组件506指示NMD抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务。例如,通知组件506可以指示NMD在某些时间段期间忽略唤醒词或者在某些时间段期间忽略所有音频。也可以使用其他示例。
当在回放设备可听地回放音频内容之前处理音频内容时,处理设备(例如,回放设备或NMD)也可以确定所记录的音频内容的哪些部分包含唤醒词。这些部分可以由音频内容内的时间段来定义,例如唤醒词的开始和停止时间(例如,播客中的唤醒词从33:52.543开始并在33:54.013结束)。在回放音频内容时,可以指示附近的NMD在这些时间段期间忽略唤醒词。
作为另一示例,处理系统500可以对音频内容(或音频内容的一部分)中唤醒词的数量进行计数。例如,处理系统500可能在示例音频内容(例如,电视节目)中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,处理系统500可以指示附近的MD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的三个唤醒词)。
在其他示例中,处理系统500可以在所记录的音频内容中动态插入音频音调或其他标记,以指定在音频内容中检测到的唤醒词。然后,当回放设备回放音频内容时,可以指示将音频标记和唤醒词一起检测到的NMD忽略该唤醒词的实例。如果多个NMD在回放设备的可听范围内,则响应于检测到相关联的音频标记,检测到唤醒词的每个NMD可以忽略该唤醒词。在一些情况下,音频标记由人类听觉范围之外(例如,20kHz以上)的音频频率组成,使得插入的音调不会被听众察觉。
在一些实施方式中,处理系统500作为音频内容源与回放设备之间的中介进行操作。例如,在处理系统500使用音频标记通知NMD的实施方式中,处理系统修改被指定用于由回放设备回放的音频内容。在这些实施方式中,处理系统500可以(例如,经由网络或输入线接口)从音频源接收音频内容,对音频内容进行分析,并且将经修改的音频内容(可能经由网络接口)提供给回放设备以供回放。
备选地,如上所述,处理系统500被实现在回放设备本身中。在这种情况下,在对音频内容进行分析之后,回放设备可以继续回放音频内容。此外,如上所述,在一些情况下,回放设备可以被配置为与一个或多个附加回放设备同步回放音频内容(例如,在区域组、立体声对或环绕声配置中)。在这种情况下,回放设备可以将(可能经修改的)音频内容(可能经由网络接口)提供给该一个或多个附加回放设备。
在另外的示例中,处理系统500在NMD中实现。在这些情况下,处理系统500可以使NMD本身在回放音频内容时忽略音频内容中的唤醒词。此外,NMD可以指示其他NMD忽略唤醒词。例如,NMD 132可以指示NMD 134忽略唤醒词。此外,如果NMD在回放设备(例如,回放设备104)中实现,则NMD/回放设备可以指示其他NMD(其本身可以在回放设备中实现)忽略唤醒词。
f.示例多个联网设备
图6示出了示例多个设备600,其可以被配置为基于语音控制提供音频回放体验。本领域普通技术人员将理解,图6中所示的设备仅用于说明目的,并且包括不同和/或附加设备的变型是可能的。如图所示,多个设备600包括计算设备604、606和608;网络麦克风设备(NMD)612、614和616;回放设备(PBD)632、634、636和638;以及控制器设备(CR)622。
多个设备600中的每个设备可以是具有网络功能的设备,其可以根据一个或多个网络协议(例如,NFC、蓝牙、以太网和IEEE 802.11等),在一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)上与多个设备中的一个或多个其他设备建立通信。
如图所示,计算设备604、606和608可以是云网络602的一部分。云网络602可以包括附加的计算设备。在一个示例中,计算设备604、606和608可以是不同的服务器。在另一示例中,计算设备604、606和608中的两个或更多个可以是单个服务器的模块。类似地,计算设备604、606和608中的每一个可以包括一个或多个模块或服务器。本文中为了便于说明,计算设备604、606和608中的每一个可以被配置为在云网络602内执行特殊功能。例如,计算设备608可以是用于流式音乐服务的音频内容源。
如图所示,计算设备604可以被配置为经由通信路径642与NMD 612、614和616接口连接。NMD 612、614和616可以是一个或多个“智能家居”系统的组件。在一种情况下,NMD612、614和616可以物理地分布在整个家中,类似于图1所示的设备分布。在另一种情况下,NMD 612、614和616中的两个或更多个可以物理地位置彼此相对靠近。通信路径642可以包括一种或多种类型的网络,例如包括互联网的WAN、LAN和/或PAN等。
在一个示例中,NMD 612、614和616中的一个或多个可以是被配置为主要用于音频检测的设备。在另一示例中,NMD 612、614和616中的一个或多个可以是具有各种主要实用程序的设备的组件。例如,如上面结合图2和图3所讨论的,NMD 612、614和616中的一个或多个可以是回放设备200的麦克风220或网络设备300的麦克风310。此外,在一些情况下,NMD612、614和616中的一个或多个可以是回放设备200或网络设备300。在示例中,NMD 612、614和/或616中的一个或多个可以包括布置在麦克风阵列中的多个麦克风。
如图所示,计算设备606可以被配置为经由通信路径644与CR 622和PBD 632、634、636和638接口连接。在一个示例中,CR 622可以是网络设备,例如图2的网络设备200。因此,CR 622可以被配置为提供图4的控制器界面400。类似地,PBD 632、634、636和638可以是回放设备,例如图3的回放设备300。这样,PBD 632、634、636和638可以物理地分布在整个家中,如图1所示。为了说明目的,PBD 636和638可以是绑定区域630的一部分,而PBD 632和634可以是它们各自区域的一部分。如上所述,PBD 632、634、636和638可以被动态地绑定、分组、解除绑定和取消分组。通信路径644可以包括一种或多种类型的网络,例如包括互联网的WAN、LAN和/或PAN等。
在一个示例中,与NMD 612、614和616一样,CR 622和PBD 632、634、636和638也可以是一个或多个“智能家居”系统的组件。在一种情况下,PBD 632、634、636和638与NMD612、614和616分布在相同的家中。此外,如上文建议的,PBD 632、634、636和638中的一个或多个可以是NMD 612、614和616中的一个或多个。
NMD 612、614和616可以是局域网的一部分,并且通信路径642可以包括通过WAN(通信路径,未示出)将NMD 612、614和616的局域网链接到计算设备604的接入点。同样地,NMD 612、614和616中的每一个可以经由该接入点彼此通信。
类似地,CR 622和PBD 632、634、636和638可以是局域网和/或本地回放网络的一部分(如前面部分中讨论的),并且通信路径644可以包括通过WAN将CR 622和PBD 632、634、636和638的局域网和/或本地回放网络链接到计算设备606的接入点。这样,CR 622和PBD632、634、636和638中的每一个也可以通过该接入点彼此通信。
在一个示例中,通信路径642和644可以包括相同的接入点。在示例中,NMD 612、614和616、CR 622和PBD 632、634、636和638中的每一个可以通过家庭的相同接入点来访问云网络602。
如图6所示,NMD 612、614和616、CR 622和PBD 632、634、636和638中的每一个还可以通过通信方式646与一个或多个其他设备直接通信。如本文所述的通信方式646可以包括根据一个或多个网络协议通过一种或多种类型的网络在设备之间的一种或多种形式的通信,和/或可以包括通过一个或多个其他网络设备的通信。例如,通信方式646可以包括蓝牙TM(IEEE 802.15)、NFC、无线直连和/或专有无线等中的一个或多个。
在一个示例中,CR 622可以通过蓝牙TM与NMD 612通信,并且可以通过另一局域网与PBD 634通信。在另一示例中,NMD 614可以通过另一局域网与CR 622通信,并且可以通过蓝牙与PBD 636通信。在又一示例中,PBD 632、634、636和638中的每一个可以根据生成树协议通过本地回放网络彼此通信,同时分别通过不同于本地回放网络的局域网与CR 622通信。其他示例也是可能的。
在一些情况下,NMD 612、614和616、CR 622和PBD 632、634、636和638之间的通信方式可以根据设备间的通信类型、网络状况和/或时延要求而改变。例如,当NMD 616首次被引入具有PBD 632、634、636和638的家中时,可以使用通信方式646。在一种情况下,NMD 616可以通过NFC向PBD 638发送与NMD 616相对应的标识信息,并且作为响应,PBD 638可以通过NFC(或某种其他形式的通信)向NMD 616发送局域网信息。然而,一旦在家中配置了NMD616,NMD 616和PBD 638之间的通信方式可能改变。例如,NMD 616可以随后通过通信路径642、云网络602和通信路径644与PBD 638通信。在另一示例中,NMD和PBD可能从不通过本地通信方式646通信。在另一示例中,NMD和PBD可以主要通过本地通信方式646通信。其他示例也是可能的。
在说明性示例中,NMD 612、614和616可以被配置为接收用于控制PBD 632、634、636和638的语音输入。可用的控制命令可以包括先前讨论的任何媒体回放系统控制,例如回放音量控制、回放传输控制、音乐源选择和分组等。在一个实例中,NMD 612可以接收用于控制PBD 632、634、636和638中的一个或多个的语音输入。响应于接收到语音输入,NMD 612可以通过通信路径642向计算设备604发送语音输入以进行处理。在一个示例中,计算设备604可以将语音输入转换为等效的文本命令,并解析该文本命令以识别命令。然后,计算设备604可以随后向计算设备606发送文本命令。在另一示例中,计算设备604可以将语音输入转换为等效的文本命令,然后向计算设备606发送文本命令。然后,计算设备606可以解析文本命令以识别一个或多个回放命令。
例如,如果文本命令是“在区域中播放来自流式服务的艺术家的曲目”,则计算设备606可以标识(i)从流式服务1可获得的艺术家1的曲目1的URL,以及(ii)区域1中的至少一个回放设备。在该示例中,来自流式服务1的艺术家1的曲目1的URL可以是指向计算设备608的URL,并且区域1可以是绑定区域630。这样,当识别出URL以及PBD 636和638之一或两个时,计算设备606可以经由通信路径644向PBD 636和638之一或两个发送所识别的URL,用于回放。作为响应,PBD 636和638之一或两个可以根据所接收的URL从计算设备608中获取音频内容,并且开始播放来自流式服务1的艺术家1的曲目1。
在又一示例中,计算设备604可以执行一些处理以识别用户的意图或相关命令,并且向计算设备606提供与语音输入相关的媒体内容的相关信息。例如,计算设备604可以对语音输入执行话语到文本转换,并分析语音输入,以得到命令或意图(例如,播放、暂停、停止、音量增大、音量减小、跳过、下一个、分组、取消分组)以及关于如何执行命令的其他信息。计算设备604或计算设备606可以确定哪些PBD命令对应于由计算设备604确定的命令或意图。可以从计算设备604向计算设备606发送从语音输入确定的命令或意图和/或与执行命令相关的其他信息。计算设备604上的处理可以由应用、模块、附加软件、具有本地联网麦克风系统软件平台的集成件、和/或本地联网麦克风系统软件平台来执行。
本领域普通技术人员将了解,以上仅是一个说明性示例,并且其他实现也是可能的。在一种情况下,如上所述,多个设备600中的一个或多个执行的操作可以由多个设备600中的一个或多个其他设备来执行。例如,从语音输入到文本命令的转换可以替代地、部分地或完全由另一个或多个设备来执行,例如NMD 612、计算设备606、PBD 636和/或PBD 638。类似地,URL的标识可以替代地、部分地或完全由另一个或多个设备执行,例如,NMD 612、计算设备604、PBD 636和/或PBD 638。
f.示例网络麦克风设备
图7示出示例网络麦克风设备700的功能框图,示例网络麦克风设备700可以被配置为图6的NMD 612、614和616中的一个或多个。如图所示,网络麦克风设备700包括处理器702、存储器704、麦克风阵列706、网络接口708、用户界面710、软件组件712和扬声器714。本领域普通技术人员将了解,其他网络麦克风设备配置和布置也是可能的。例如,备选地,网络麦克风设备可以不包括扬声器714,或者具有单个麦克风而不是麦克风阵列706。
处理器702可以包括一个或多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,处理单元702可以包括微处理器、微控制器、专用集成电路、数字信号处理器等。存储器704可以是数据存储设备,其可以加载有可由处理器702执行以实现这些功能的一个或多个软件组件。因此,存储器704可以包括一个或多个非暂时性计算机可读存储介质,其示例可以包括:易失性存储介质(例如,随机存取存储器、寄存器、高速缓存等)、以及非易失性存储介质(例如,只读存储器、硬盘驱动器、固态驱动器、闪存和/或光储存设备等)。
麦克风阵列706可以是多个麦克风,其被布置为检测网络麦克风设备700的环境中的声音。麦克风阵列706可以包括现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风等。在一个示例中,麦克风阵列可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风阵列706可以对频段的一部分敏感。在一个示例中,麦克风阵列706的第一子集可以对第一频段敏感,而麦克风阵列的第二子集可以对第二频段敏感。麦克风阵列706还可以被布置为捕捉音频源(例如,语音、可听声音)的位置信息和/或帮助过滤背景噪声。值得注意的是,在一些实施例中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
网络接口708可以被配置为促进各种网络设备(例如,参考图6,其中的CR 622、PBD632-638、云网络602中的计算设备604-608,以及其他网络麦克风设备等)之间的无线和/或有线通信。这样,网络接口708可以采用任何合适的形式来执行这些功能,其示例可以包括:以太网接口、串行总线接口(例如,Fire Wire、USB 2.0等)、适于促进无线通信的芯片组和天线、和/或提供有线和/或无线通信的任何其他接口。在一个示例中,网络接口708可以基于行业标准(例如,红外、无线电、包括IEEE 802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准在内的无线标准等)。
网络麦克风设备700的用户界面710可以被配置为促进与网络麦克风设备的用户交互。在一个示例中,用户界面708可以包括物理按钮、设置在触敏屏幕和/或表面上的图形界面等中的一个或多个,以供用户直接向网络麦克风设备700提供输入。用户界面710还可以包括灯和扬声器714中的一个或多个,以向用户提供视觉和/或音频反馈。在一个示例中,网络麦克风设备700还可以被配置为通过扬声器714回放音频内容。
III.回放设备停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图8示出了示例实现800,通过该实现800,回放设备停用一个或多个MD的唤醒响应。
a.接收表示音频内容的数据以供回放
在框802处,实现802涉及接收表示音频内容的话数据以供回放。例如,回放设备可以接收音频内容以供回放设备进行回放。示例回放设备包括图1中所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任一个,其例如可以被实现为图2的回放设备200。在一些实施方式中,回放设备可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(例如,图5的音频输入/输出组件502)来接收表示音频内容的数据。
示例音频内容包括一个或多个音频曲目、脱口秀、电源、电视节目、播客、互联网流式视频,以及其他可能形式的音频内容。音频内容可以包括伴随视频的音频内容(例如,视频的音频曲目)或不伴随视频的音频。
回放设备可以经由输入接口来接收音频内容,该输入接口可以是有线或无线网络接口或者模拟或数字输入线接口等。例如,回放设备可以通过一种或多种网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)经由网络接口从网络源接收音频内容。
回放设备可以从本地或远程音频源接收表示音频内容的数据。例如,回放设备可以从以下接收音频内容:本地媒体服务器或局域网上的其他设备、由回放设备或与回放设备(例如,通过局域网经由网络接口)进行通信的另一设备读取的介质(例如,CD、DVD、蓝光、闪存或硬盘驱动器)、回放设备本身上的数据存储设备。回放设备可以从一个或多个云服务器接收音频内容作为音频内容流。例如,回放设备可以经由网络接口根据URL获取音频内容流。备选地,回放设备可以从回放设备上或与回放设备(例如,经由网络接口通过局域网)进行通信的另一设备上的输入线接口接收音频内容。
在一些情况下,回放设备可能经由模拟输入线接口以模拟格式接收音频内容。在这些情况下,回放设备将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)为适于处理的格式。备选地,与回放设备进行通信的设备可以接收模拟格式的音频内容,将音频内容数字化,并且将表示音频内容的数据发送给回放设备。
如上所述,所接收的音频内容被设计用于由回放设备回放。例如,控制设备(如图1的控制设备126或128)可以指示回放设备回放某些音频内容,也许通过使该音频内容放置在回放设备的回放队列中来进行。将音频曲目或其他音频内容放置在这种队列中可能使回放设备在经由控制设备或回放设备本身上的控制启动(例如,播放/暂停按钮)回放之后获取音频内容。回放设备可以通过以下方式从本地或远程音频源获取音频内容:经由网络接口将音频内容流引导到回放设备,或者经由模拟或数字输入线接口将音频内容引导到回放设备等。
在示例内,回放设备可以将所接收的音频内容的至少一部分存储在存储器中。例如,回放设备可以将所接收的音频内容缓冲在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理时从缓冲器中移除这些唤醒词,这使得回放设备能够确定所接收的音频内容是否包含唤醒词。
b.在音频内容中检测一个或多个唤醒词
返回参考图8,在框804处,实现800涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,回放设备可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,回放设备可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。
回放设备可以使用一种或多种唤醒词检测算法对所接收的音频内容进行分析。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。许多第一方和第三方唤醒词检测算法是已知的并且可商购。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在一些实施方式中,回放设备可以对所接收的表示音频内容的数据使用与以下算法相同或相似的算法:MD所使用的用于检测经由麦克风记录的音频中的唤醒词的算法。以这种方式,回放设备可以检测到音频内容中的与在NMD的可听范围内回放音频内容时NMD本会检测到的唤醒词相同或相似的唤醒词。然而,鉴于NMD通常对变化环境条件(例如,可能是吵杂的家庭环境)中各种各样的人类语音说出的由麦克风记录的音频运行唤醒词检测算法,因此,在没有这种变化性的情况下,对所接收的音频内容运行唤醒词算法对检测唤醒词甚至可能更有效。
在分析期间,回放设备可以确定每个唤醒词出现在所接收的音频内容中的位置。在识别出音频内容中确定为包括唤醒词的各部分之后,回放设备可以使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来标注音频内容的这些部分。最终,这些时间戳可用于停用一个或多个NMD对与每个时间戳相对应的唤醒词的唤醒响应。
在一个示例中,回放设备可以将所接收的音频内容划分为已知长度的片段。然后,回放设备通过识别检测到唤醒词的片段来识别音频内容中包括唤醒词的部分(即片段)。例如,如果每个片段长3秒,并且在第四片段中检测到唤醒词,则唤醒词位于记录的9到12秒之间。在一些情况下,回放设备可以将音频记录分为重叠的片段,以避免将唤醒词分解为不可识别的部分(例如,一个片段表示“Hey”,另一片段表示“Siri”)。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在一些情况下,回放设备同时(或基本同时)对所接收的音频内容运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的APPLE的/>或MICROSOFT的/>)可以各自使用不同的唤醒词来调用其相应的语音服务。此外,一些语音服务可以允许用户选择偏好的唤醒词或配置定制的唤醒词。为了支持多种服务(和/或不同的唤醒词),回放设备可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法。例如,回放设备在回放设备回放音频内容之前,向音频内容应用针对第一语音服务的第一音频检测算法,以检测至少一个针对第一语音服务的第一唤醒词,并且在回放设备回放音频内容之前,向音频内容应用针对第二语音服务的第二音频检测算法,以检测至少一个针对第二语音服务的第二唤醒词。回放设备也可以将(可能针对于相应的语音服务的)附加的音频检测算法应用于音频内容。
c.使一个或多个NMD在音频内容的回放期间停用对检测到的一个或多个唤醒词的 相应唤醒响应
在图8中,在框806处,实现800涉及在音频内容的回放期间使一个或多个联网的麦克风设备停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,回放设备可以使在回放设备的音频范围内的NMD在回放设备回放音频内容期间停用NMD对检测到的一个或多个唤醒词的相应唤醒响应。如上所述,回放设备可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且使用该通知组件,在回放设备回放音频内容期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。
如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
在一些实施方式中,回放设备本身包括NMD(例如,在回放设备内实现NMD 700)。在这些实施方式中,当回放设备正在回放音频内容时,回放设备停用其自身的NMD对检测到的一个或多个唤醒词的唤醒响应。例如,在回放设备中实现的处理系统500的实例可以将一个或多个唤醒词及其相应的回放时间通知给NMD,以便使NMD停用对检测到的一个或多个唤醒词的唤醒响应。例如,处理系统可以通过改变RAM中的标志以停用唤醒响应,或者通过使用内部通信总线向NMD传送消息等来通知NMD。然后,在回放音频内容的同时,回放设备的NMD可以经由麦克风记录正由回放设备回放的音频内容,并且停用NMD对所记录的音频内容内的一个或多个唤醒词的相应唤醒响应。
在示例实施方式中,回放设备可以使家庭内的所有联网麦克风设备停用它们相应的唤醒响应。例如,图1所示的回放设备104可以在回放设备104回放包含一个或多个唤醒词的音频内容时使NMD 132和134停用它们相应的唤醒响应。此外,如果回放设备102或106—124中的任何一个实现NMD,则当回放设备104回放包含一个或多个唤醒词的音频内容时,回放设备104可以使这些回放设备停用它们相应的唤醒响应。更进一步,如果回放设备104本身实现NMD,或者如果控制设备126或128实现NMD,则当回放设备104回放音频内容时,回放设备104可以使这些设备停用它们相应的唤醒响应。
备选地,回放设备可以使家庭内的NMD的子集停用它们相应的唤醒响应。例如,回放设备可以使回放设备的可听范围内的NMD停用它们相应的唤醒响应。备选地,回放设备可以使已经与回放设备相关联的NMD停用它们相应的唤醒响应。
可以使用任何合适的技术来确定可听范围。在一些实施方式中,基于回放设备的回放配置来建立可听范围。例如,如果回放设备与一个或多个回放设备处于同步回放配置中,则可以假定这些回放设备在回放设备的可听范围内。因此,如果这些回放设备中的任何一个实现NMD,则这些回放设备的相应唤醒响应被停用。回放设备可以通过参考回放设备的配置来确定这些NMD在回放设备的可听范围内,该配置可以存储在对家中的各回放设备而言同步的一个或多个状态变量中。
在其他示例中,在设置过程(例如,校准过程)期间建立可听范围。在这种设置过程中,可以指示家中的NMD收听由家中的回放设备回放的音频信号(例如,音调)。如果NMD可以经由其麦克风检测到音频信号,则可以认为该NMD在可听范围内。可以指示家庭内的回放设备以不同的音量循环回放音频信号,以便确定任何给定音量水平下在每个回放设备的可听范围内的NMD集合。示例校准过程可以涉及校准声音的输出,该校准声音还可以用作将由家中的NMD检测到的音频信号。
为了说明,在示例设置过程期间,图1的控制设备126可以指示主卧室区域中的回放设备(即,回放设备122和124)输出音频信号。在大多数音量水平下,该输出被NMD 134检测到。然而,随着音量水平增加,其他NMD也开始检测到该输出。例如,回放设备118和控制设备128可以各自实现NMD,并且检测相对较高的音量水平下的音频信号输出。这样,经由示例设置过程,NMD 134被建立为位于回放设备122和124在某个音量范围(例如,5%至100%)下的可听范围内,而回放设备118和控制设备128被认为是被建立在位于回放设备122和124的某些较高音量范围(例如,音量水平>80%)下的可听范围内。可以针对家庭内的其他回放设备和NMD重复该过程。
在其他示例中,NMD可以基于已知的物理接近度与一个或多个回放设备配对。例如,返回参考图1,NMD 134可以与回放设备122和/或124配对,作为用于主卧室区域的NMD。可以经由诸如控制设备126或128的控制设备上的用户界面来配置这种配对。作为另一示例,根据NMD 132与厨房区域配对且已知厨房区域物理上接近餐厅和/或客厅区域,或者根据厨房区域与餐厅或客厅区域形成在区域组中,可以将NMD 132与回放设备104、106、108、110、112和/或114配对。如果NMD与一个或多个回放设备配对,则可以假定NMD在这些回放设备的可听范围内。
在以下内容中描述了对回放设备附近存在的NMD的确定的其他示例:2016年4月14日提交的No.15/098,867题为“Default Playback Device Designation(默认回放设备指定)”的申请;2016年4月14日提交的No.15/098,892题为“Default Playback Devices(默认回放设备)”的申请;N0.15/237,133题为“Audio Response Playback(音频响应回放)”的申请;以及2016年8月5日提交的No.15/229,855题为“Determining Direction of NetworkedMicrophone Device Relative to Audio Playback Device(确定联网麦克风设备相对于音频回放设备的方向)”的申请。这些专利申请中的每一件的内容通过引用整体并入。
如上所述,在一些情况下,回放设备被配置为与一个或多个附加的回放设备同步地回放音频(可能在区域组、立体声对或环绕声配置中)。这些配置可以扩展回放设备的可听范围,因为在该回放设备或该一个或多个附加回放设备中的任一个的可听范围内的任何NMD都可能响应于由这些回放设备同步回放的音频内容中的唤醒词而错误触发。这样,如果回放设备当前处于与一个或多个附加回放设备的同步回放配置中,则回放设备可以停用在可听范围内或以其他方式与这些附加回放设备相关联的NMD的相应唤醒响应。
在一些实施方式中,回放设备通过以下方式使该一个或多个NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒:通过经由网络接口向该一个或多个NMD发送指令,该指令使该一个或多个NMD在所接收的音频内容的回放期间停用它们相应的唤醒响应。如上所述,媒体回放系统的各种设备(例如,控制设备、回放设备和NMD)可以经由局域网(例如,经由由图1的有线或无线网络路由器130形成的局域网)互连,以允许家中的设备之间指令交换和其他消息传递。可以对媒体回放系统的这些设备各自进行编程,以响应来自系统中其他设备的某些指令。
在一些示例中,这些指令可以防止该一个或多个NMD在唤醒词被回放设备回放时检测到该唤醒词。例如,回放设备可以指示一个或多个NMD在一个或多个时间段期间(即,与唤醒词将被回放设备回放的时间相对应的时间段,可能由时间戳来表示)停止收听唤醒词(例如,停止处理所记录的音频)。备选地,回放设备可以指示该一个或多个NMD暂时(例如,在上述时间段期间)停用它们各自的麦克风。作为又一示例,回放设备可以使用其麦克风阵列指示该一个或多个NMD在回放设备的方向上创建收听无效,以使NMD不检测唤醒词。也可以使用其他示例。例如,在回放设备播放音频内容的包含唤醒词的部分之前不久,回放设备可以发送第一消息,该第一消息指示该一个或多个NMD停用唤醒词检测。然后,在回放设备播放音频内容的包含唤醒词的部分之后不久,回放设备可以发送第二消息,该第二消息指示该一个或多个NMD启用唤醒词检测。
为了说明,图9描绘了示例消息900,回放设备可以将消息900发送给一个或多个NMD,以使该一个或多个NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒响应。消息900可以符合诸如IEEE 802.3规范(其指定以太网分组和帧的结构)之类的规范。如图所示,消息900包括前导码902,前导码902包括交替比特的模式,网络上的设备(例如,NMD、回放设备和/或控制设备等)可以使用该模式来同步它们的接收器时钟。消息900还包括帧开始定界符(SFD)904,其标记前导码(以太网分组的第一个字段)的结束和消息中以太网帧部分的开始。消息900还包括目的地地址906和源地址908,其指示目的地(例如,NMD)和源(例如,回放设备)。消息900还包括有效载荷910。有效负载910包括使NMD(即,由目的地地址906指示的NMD)停用其对一个或多个唤醒词的唤醒响应的指令。消息900还包括帧校验序列(FCS)912,该FCS是允许在所接收的帧中检测被损坏的数据的循环冗余校验值。
可以使用两个或更多个以太网分组(例如,消息900中的两个或更多个)来传输指令。例如,可以在消息900的两个或更多个实例的有效载荷之间划分对一个NMD的指令。此外,可以在消息900的一个或多个相应实例中分别发送对多个NMD的指令。也可以使用其他示例。
作为示例,图10A、图10B、图10C和图10D示出了示例指令1000A、1000B、1000C和1000D,其可以在一个或多个消息的有效载荷(例如,消息900的有效载荷910)中传输给NMD。如图10A所示,指令1000A包括命令1002A,以使NMD在由时间戳1004A、1006A、1008A、1010A定义的某些时间段期间停用唤醒响应。在一些示例中,时间戳1004A和1006A分别指定以下时间段的开始和结束:回放设备将回放音频内容中包含第一唤醒词的部分的时间段。类似地,时间戳1008A和1010A可以分别指定以下时间段的开始和结束:回放设备将回放音频内容中包含第二唤醒词的部分的时间段。指令1000A可以包括定义另外的时间段的其他时间戳。备选地,时间戳1004A、1006A、1008A和1010A可以与以下时间相对应:音频的特定帧的回放时间、与发送或接收设备上的系统时钟相对应的时间;或者与NMD和回放设备都已知的全局时钟相对应的时间等。
图10B示出了指令1000B,其包括命令1002B以使NMD在由坐标1004B和1006B定义的某些方向上创建收听无效。坐标1004B和1006B指示相应回放设备相对于NMD的方向。例如,返回参考图1,指令1000B的示例实例可以包括坐标1004B和1006B,以指示回放设备122和124相对于NMD 134的方向。在该示例中,坐标1004B和1006B可以向NMD 134指示回放设备122以0°相对于NMD 134(即,正好位于NMD 134的前面),而回放设备122相对于NMD 134向左偏45°。可以通过设置或配置过程来预先建立家中各设备相对于彼此的相应位置。
图10C和10D分别示出了指令1000C和1000D。指令1000C包括命令1002C,以使接收NMD停用唤醒词检测。回放设备可以在回放音频内容中包括唤醒词的部分之前不久发送这种指令。指令1000D包括命令1002D,以使接收NMD启用唤醒词检测。回放设备可以在回放音频内容中包括唤醒词的部分之后不久发送这种指令。
在另一示例中,该一个或多个NMD可以检测唤醒词,但回放设备指示该一个或多个NMD抑制其唤醒响应。例如,回放设备可以指示该一个或多个NMD在某个时间段期间忽略唤醒词或在某个时间段期间忽略所有音频。也可以使用其他示例。
作为另一示例,回放设备可以对音频内容(或音频内容的一部分)中的唤醒词的数量进行计数。例如,回放设备可能在示例音频内容中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,回放设备可以指示附近的一个或多个NMD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的三个唤醒词)。
备选地,回放设备通过动态修改音频内容以将声学标记并入音频内容的片段中,来使该一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,回放设备可以在所记录的音频内容中插入(例如,混入)音频音调或其他标记中以指定在音频内容中检测到的唤醒词。然后,如果NMD检测到与唤醒词相关联(例如,紧接在唤醒词之前或与唤醒词同时出现)的音频标记,则可以指示NMD或对NMD预编程以忽略唤醒词的实例。使用这种技术,不需要预先确定或估计回放设备的可听范围内的NMD。相反,由于与音频内容一起回放声学标记,所以在用于检测音频内容的可听范围内(因此可能被该内容错误触发)的NMD也位于用于检测声学标记的范围内,并且作为响应停用它们的唤醒响应。如果多个NMD在回放设备的可听范围内,则检测到唤醒词的每个NMD都会响应于检测到相关联的声学标记,而作为响应停用其对唤醒词的唤醒响应。
d.回放音频内容
在图8中,在框808处,实现800涉及经由一个或多个扬声器回放音频内容。回放设备通过一个或多个音频转换器(例如,扬声器)回放音频内容。在一些情况下,扬声器与回放设备位于同一外壳中。备选地,回放设备可以经由扬声器插孔向一个或多个单独的无源扬声器提供经放大的音频。作为另一示例,回放设备可以通过向放大器提供线级音频来回放音频内容,放大器随后经由扬声器插孔向一个或多个无源扬声器提供经放大的音频。
如上所述,在一些情况下,回放设备被配置到与一个或多个附加回放设备的同步回放配置中。在这种情况下,回放音频内容涉及与该一个或多个附加回放设备同步地回放音频内容。在一些回放配置(例如,立体声对或环绕声)中,处于该回放配置中的每个回放设备与该回放配置中的其他回放设备同步地回放音频内容的一部分。
在一些实施方式中,回放设备向一个或多个附加回放设备提供音频内容以供回放,来促进与回放设备同步回放该音频内容。在这些实施方式中,回放设备可以用作同步组的组协调器,该同步组包括该回放设备和该一个或多个附加回放设备。作为组协调器,回放设备可以另外向该一个或多个附加回放设备提供定时信息,以促进同步组调度同步回放。回放设备经由网络接口提供音频内容和/或定时信息。
如上所述,在一些情况下,回放设备将音频内容修改为包括声学标记。在这些实施例中,如果回放设备在同步组中,则回放设备可以将经修改的音频内容提供给同步组中的其他回放设备。然后,同步组中的每个回放设备可以与组中的其他回放设备同步地回放经修改的音频内容。
为了说明,在一个示例中,回放设备114和122和124位于区域组(即,厨房+主卧室区域组)中,该区域组被配置为同步回放音频内容。在为区域组回放指定的音频内容中检测到唤醒词之后,回放设备114可以将音频内容修改为包括声学标记,以在音频内容中指定唤醒词。然后,回放设备114可以将经修改的音频内容提供给回放设备122和/或124,以促进经修改的音频内容的同步回放。
IV.NMD停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图11示出了示例实现1100,通过该实现1100,NMD停用其对一个或多个检测到的唤醒词的唤醒响应。
a.接收表示音频内容的数据以供回放
在框1102处,实现1100涉及接收表示所记录的音频内容的数据。例如,NMD可以接收音频内容以供回放设备回放。示例NMD包括图1中所示的NMD 132和134中的任何一个,其可以被实现为例如图7的NMD 700。示例回放设备包括图1所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任何一个,其可以实现为由例如图2的回放设备200表示。其他示例NMD可以包括这些回放设备和/或控制设备126和128中的任何一个,因为这些设备除了可以作为回放或控制设备的功能之外还可以实现NMD。NMD可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(诸如图5的音频输入/输出组件502)接收表示音频内容的数据。
NMD可以经由输入接口接收音频内容,该输入接口可以是有线或无线网络接口或者模拟或数字输入线接口等。例如,NMD可以经由网络接口通过一种或多种类型的网络(例如WAN、LAN和PAN)从网络源接收音频内容等。
NMD可以从本地或远程音频源接收表示音频内容的数据。例如,NMD可以从以下接收音频内容:本地媒体服务器或局域网上的其他设备、由NMD或与NMD通信的另一设备(例如,通过局域网经由网络接口与NMD通信的回放设备)读取的介质(例如,CD、DVD、蓝光、闪存或硬盘驱动器)、或存储在NMD本身上的数据存储设备。
NMD可以从一个或多个云服务器接收音频内容作为音频内容流。例如,NMD可以经由网络接口从URL获取音频内容流。备选地,NMD可以从NMD上或与NMD通信的另一设备(例如,经由网络接口通过局域网连接到NMD的回放设备)上的输入线接口接收音频内容。
在一些情况下,NMD可能经由模拟输入线接口接收模拟格式的音频内容。在这些情况下,NMD将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)为适合于处理的格式。备选地,与NMD通信的设备(例如,回放设备)可以接收模拟格式的音频内容,将音频内容数字化,并且将表示音频内容的数据发送给回放设备。
如上所述,所接收的音频内容被设计用于由回放设备回放。例如,控制设备(如图1的控制设备126或128)可以指示回放设备回放某些音频内容,也许通过使该音频内容放置在回放设备的回放队列中来进行。将音频曲目或其他音频内容放置在这种队列中可能使回放设备在经由控制设备或回放设备本身上的控制启动(例如,播放/暂停按钮)回放之后获取音频内容。NMD可以访问该队列(例如,队列的内容可以经由LAN或其他网络与NMD共享)。在进行这种访问的情况下,NMD可以通过以下方式从本地或远程音频源获取音频内容:经由网络接口将音频内容流引导到NMD,或者经由模拟或数字输入线接口将音频内容引导到NMD等。
在一些情况下,所接收的音频内容被设计为由两个或多个回放设备回放。例如,可以将两个或更多个回放设备配置到同步组(例如,区域组、立体声对或环绕声配置)中。特定音频内容可以由该同步组指定用于回放。
在示例内,处理系统500可以将所接收的音频内容的至少一部分存储在存储器中。例如,处理系统500可以将所接收的音频内容缓冲在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理时从缓冲器中移除这些唤醒词,这使得回放设备能够确定所接收的音频内容是否包含唤醒词。
b.在音频内容中检测一个或多个唤醒词
在图11中,在框1104处,实现1100涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,NMD可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,NMD可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。
NMD可以使用一种或多种唤醒词检测算法对所接收的音频内容进行分析。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。许多第一方和第三方唤醒词检测算法是已知的并且可商购。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在常规操作中,NMD将经由麦克风收听家庭或其他环境中的声音(例如,人类语音),并且通过唤醒词检测算法运行该声音的音频记录,以检测声音是否包含唤醒词。在该过程中,NMD可以使用与NMD用来检测由人类语音发出的唤醒词的算法相同或相似的算法。然而,代替将经由麦克风记录的音频输入到算法,输入的是由回放设备回放的音频内容。以这种方式,NMD可以检测到音频内容中的与在各NMD的可听范围内回放音频内容时NMD本会检测到的唤醒词相同或相似的唤醒词。然而,鉴于NMD通常对变化环境条件(例如,可能是吵杂的家庭环境)中各种各样的人类语音说出的由麦克风记录的音频运行唤醒词检测算法,因此,在没有这种变化性的情况下,对所接收的音频内容运行唤醒词算法对检测唤醒词甚至可能更有效。
在分析期间,NMD可以确定每个唤醒词出现在所接收的音频内容中的位置。在识别出音频内容被确定为包括唤醒词的各部分之后,NMD可以使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来标注音频内容的这些部分。最后,这些时间戳可用于停用NMD对与每个时间戳相对应的唤醒词的唤醒响应。
在一个示例中,NMD可以将所接收的音频内容划分为已知长度的片段。然后,NMD可以通过识别检测到唤醒词的片段来识别音频内容中包括唤醒词的部分(即片段)。例如,如果每个片段长4秒且在第六片段中检测到唤醒词,则唤醒词位于记录的20到24秒之间。在一些情况下,NMD可以将音频记录分成重叠的片段,以避免将唤醒词分解为不可识别的部分(例如,一个片段表示“Hey”而另一片段表示“Alexa”)。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在一些情况下,NMD对所接收的音频内容同时运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的APPLE的/>或MICROSOFT的/>)可以各自使用不同的唤醒词来调用其相应的语音服务。此外,每个语音服务可以支持多个唤醒词和/或定制唤醒词。为了支持多种语音服务,NMD可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法,以便检测可能在音频内容中表示的不同唤醒词。例如,NMD可以将第一音频检测算法应用于第一语音服务以检测用于第一语音服务的至少一个第一唤醒词,并将第二音频检测算法应用于第二语音服务以检测用于第二语音服务的至少一个第二唤醒词。在回放设备回放音频内容之前,NMD可能还可以针对相应的语音服务,将附加的音频检测算法应用于音频内容。
c.在音频内容的回放期间停用对检测到的一个或多个唤醒词的唤醒响应
在图11中,在框1106处,实现1100涉及在音频内容的回放期间停用对检测到的一个或多个唤醒词的唤醒响应。例如,当音频内容被回放设备可听地回放时,NMD可以停用其对在音频内容中检测到的一个或多个唤醒词的唤醒响应。
如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
在一些实施方式中,当唤醒词被回放设备回放时,NMD通过防止NMD检测到唤醒词来停用其唤醒响应。例如,NMD可以在一个或多个时间段期间(即,与唤醒词将被回放设备回放的时间相对应的时间段,可能由时间戳来表示)停止收听唤醒词(例如,停止处理所记录的音频)。备选地,NMD可以暂时(例如,在上述时间段期间)停用其麦克风。作为又一示例,NMD可以使用其麦克风阵列在回放设备的方向上创建收听无效,使得NMD不检测唤醒词。也可以使用其他示例。
在另外的示例中,NMD在唤醒词被回放设备回放时检测到唤醒词,但是抑制其对检测到的唤醒词的唤醒响应。例如,NMD可以在多个时间段期间忽略唤醒词,或者在某些时间段期间忽略所有音频。也可以使用其他示例。
作为另一示例,NMD可以对音频内容(或音频内容的一部分)中的唤醒词的数量进行计数。例如,NMD可能在示例音频内容中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,NMD然后可以停用其唤醒响应,直到它检测到与计数相等数量的唤醒词为止(例如,通过忽略接下来的三个唤醒词)。
备选地,NMD通过修改音频内容以将声学标记并入音频内容的片段中来停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,NMD可以在所记录的音频内容中插入(例如,混入)音频音调或其他标记以指定在音频内容中检测到的唤醒词。然后,假定将NMD编程为响应于检测到这种音频标记而停用其唤醒响应,则NMD将在由回放设备回放的音频内容中检测到唤醒词时自动抑制唤醒响应。
在一些示例中,当唤醒词被回放设备回放时,NMD可以使一个或多个附加联网麦克风设备停用它们对检测到的唤醒词的相应唤醒响应。例如,参考图1,NMD 132可以使NMD134停用其唤醒响应。此外,家中的任何回放设备和/或控制设备都可以实现NMD,并且NMD132也可以停用这些回放设备中的任何一个的唤醒响应。
NMD可以停用家中的特定NMD集合。在一些情况下,其唤醒响应被停用的NMD集合基于媒体回放系统的区域或区域组配置。例如,如果NMD与特定区域相关联(例如,如果NMD132与厨房区域相关联),则NMD可以使也与该相同区域相关联的任何NMD的相应唤醒响应停用。这些NMD可以包括实现NMD的各种设备(例如,回放设备)以及专用NMD。此外,如果与NMD相关联的特定区域与区域组中的一个或多个附加区域相连,则NMD可以使也与该一个或多个附加区域相关联的任何NMD的相应唤醒响应也被停用。如上所述,可以在NMD和媒体回放系统的区域之间创建关联,可能以促进在家庭的特定房间(例如,厨房区域)中的合作。
备选地,其唤醒响应被停用的特定附加NMD基于正在回放包括唤醒词的音频内容的回放设备的可听范围。可以使用任何合适的技术来确定可听范围。在一些实施方式中,如上所述,基于NMD与一个或多个区域的关联来建立可听范围。在其他示例中,在设置过程(例如,校准过程)期间建立可听范围,如以上在第II I节中所述。可以将通过区域配置和/或设置过程建立的可听范围存储为一个或多个状态变量并且在网络(例如,由图1中所示的家中的路由器130建立的LAN)内的设备间共享。通过访问这种信息,NMD可以确定将位于将要回放音频内容的回放设备的可听范围内的NMD集合,并且使这些NMD集合的相应唤醒响应停用。
为了说明,在一个示例中,图1中的NMD 132在设计为由厨房区域中的回放设备114回放的给定音频内容中检测到一个或多个唤醒词。因此,NMD 132停用其对这些唤醒词的唤醒响应。由于回放设备114也是NMD,因此NMD 132停用回放设备114的唤醒响应。此外,由于厨房区域与餐厅区域位于区域组中,因此NMD 132还停用也是NMD的回放设备112的唤醒响应,以便在音频内容由餐厅区域和厨房区域同步回放时,回放设备112的NMD不会错误触发。
在另一示例中,图1中的NMD 134在设计为由主卧室区域中的回放设备122和124回放的给定音频内容中检测一个或多个唤醒词。因此,NMD 134停用其对这些唤醒词的唤醒响应。由于回放设备116实现了NMD,并且已被预先建立为位于回放设备122和124在其当前音量水平下的可听范围内,因此NMD 134还停用回放设备116的唤醒响应。NMD 134从经由路由器130创建的LAN与NMD 134共享的一个或多个状态变量中得知,回放设备116位于回放设备122和124在其当前音量水平下的可听范围内。这些状态变量向NMD 134指示媒体回放系统100的各个方面的状态,例如:回放设备122和124的当前回放配置(例如,立体声对)、它们当前的音量水平、以及在该回放配置和该音量水平下确定了哪些NMD在这些回放设备的可听范围内。
NMD可使用任何合适的技术使该一个或多个附加NMD停用其相应的唤醒响应。NMD可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且在回放设备回放音频内容期间,使用该通知组件使一个或多个NMD的集合停用其对检测到的一个或多个唤醒词的相应唤醒响应。
在一些实施方式中,NMD通过以下方式使该一个或多个附加NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒:通过经由网络接口向该一个或多个NMD发送指令,该指令使该一个或多个NMD在所接收的音频内容的回放期间停用它们相应的唤醒响应。如上所述,媒体回放系统的各种设备(例如,控制设备、回放设备和NMD)可以经由局域网(例如,经由由图1的有线或无线网络路由器130形成的局域网)互连,以允许家中的设备之间指令交换和其他消息传递。可以对媒体回放系统的这些设备各自进行编程,以响应来自系统中其他设备的某些指令。上面结合图9和图10A、图10B、图10C和图10D描述了示例消息和指令。
备选地,NMD通过修改音频内容以将声学标记并入音频内容的片段中,来使该一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。使用这种技术,不需要预先确定或估计回放设备的可听范围内的NMD。相反,由于与音频内容一起回放声学标记,所以在用于检测音频内容的可听范围内(因此可能被该内容错误触发)的NMD也位于用于检测声学标记的范围内,并且作为响应停用它们的唤醒响应。如果多个NMD在NMD的可听范围内,则检测到唤醒词的每个NMD都会响应于检测到相关联的声学标记,而作为响应停用其对唤醒词的唤醒响应。
在一些实施方式中,例如在NMD修改音频内容的实施方式中,NMD将音频内容提供给回放设备。在这种情况下,NMD可以作为音频内容源和回放设备之间的中介。将音频内容传输给回放设备可以使回放设备回放音频内容,因为回放设备可以被配置为回放所接收的音频内容。NMD可以经由任何适当的通信接口(例,如网络接口)将音频内容提供给回放设备。如果将多个回放设备配置为回放音频内容,则NMD可以将音频内容提供给所有回放设备,或者NMD可以将音频内容传输给回放设备的子集(例如,组协调器),然后,回放设备的子集将音频内容分发给组中的其他回放设备,可能与定时信息一起分发以调度同步回放。
为了说明,在一个示例中,回放设备112和124位于被配置为同步回放音频内容的区域组(即,厨房+餐厅区域组)中。在检测到指定由区域组回放的音频内容中的唤醒词之后,NMD 132可以将音频内容修改为包括声学标记,以在音频内容中指定唤醒词。然后,回放设备132可以将经修改的音频内容提供给回放设备112和/或114,以促进经修改的音频内容的同步回放。
d.检测所回放的音频内容
在框1108处,实现1100涉及经由麦克风检测所回放的音频内容。例如,当回放设备正在回放包括一个或多个检测到的唤醒词的音频内容时,NMD可以经由麦克风检测所回放的音频内容。在启用NMD的唤醒响应的配置中,检测所回放的音频内容中包括唤醒词的各部分将触发NMD的唤醒响应。然而,由于NMD停用了对音频内容中一个或多个唤醒词的唤醒响应,因此不会触发唤醒响应。
在一些实施方式中,回放设备实现NMD。在这些示例中,回放设备可以经由一个或多个扬声器回放所接收的音频内容。在一些情况下,扬声器与NMD位于同一外壳中。备选地,回放设备可以经由扬声器插孔向一个或多个单独的无源扬声器提供经放大的音频。作为另一示例,回放设备可以通过向放大器提供线级音频来回放音频内容,放大器随后经由扬声器插孔向一个或多个无源扬声器提供经放大的音频。
在一些情况下,NMD被配置到与一个或多个附加回放设备的同步回放配置中。在这种情况下,回放音频内容涉及与该一个或多个附加回放设备同步地回放音频内容。在一些回放配置(例如,立体声对或环绕声)中,处于该回放配置中的每个回放设备与该回放配置中的其他回放设备同步地回放音频内容的一部分。
如上所述,在一些实施方式中,NMD将音频内容提供给一个或多个回放设备以供回放。在一些示例中,NMD将音频内容提供给该一个或多个回放设备,来促进与NMD同步回放该音频内容。在这些实施方式中,NMD可以用作同步组的组协调器,该同步组包括该NMD和该一个或多个附加回放设备。作为组协调器,NMD可以另外向该一个或多个附加回放设备提供定时信息,以促进同步组调度同步回放。回放设备经由网络接口提供音频内容和/或定时信息。
V.计算系统停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图12示出了示例实现1200,通过该示例实现1200,计算系统停用一个或多个NMD对音频内容中的一个或多个唤醒词的唤醒响应。在各种实施例中,计算系统可以是云服务器。备选地,计算系统可以是本地处理设备(例如,与媒体回放系统连接到相同LAN的设备)。计算系统可以实现回放设备或NMD。
a.接收表示所记录的音频内容的数据
在框1202处,实现1200涉及接收表示所记录的音频内容的数据。例如,计算系统可以接收音频内容以供回放设备进行回放。示例回放设备包括图1中所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任一个,其例如可以被实现为图2的回放设备200。处理系统可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(诸如图5的音频输入/输出组件502)来接收表示音频内容的数据。计算系统可以使用任何合适的技术来接收音频内容,诸如以上在第II、第III和第IV部分中讨论的技术。
b.在音频内容中检测一个或多个唤醒词
在图12中,在框1204处,实现1200涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,计算系统可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,计算系统可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。计算系统可以使用任何合适的技术来检测唤醒词,诸如以上在第II、第III和第TV部分中讨论的技术。
c.使一个或多个MD在音频内容的回放期间停用对检测到的一个或多个唤醒词的 相应唤醒响应
在图12中,在框1206处,实现1200涉及在音频内容的回放期间使一个或多个联网的麦克风设备停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,计算系统可以使在回放设备的音频范围内的NMD在回放设备回放音频内容期间停用NMD对检测到的一个或多个唤醒词的相应唤醒响应。如上所述,计算系统可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且使用该通知组件,在回放设备回放音频内容期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。计算系统可以使用任何合适的技术(例如,上述在第II、第III和第IV部分中讨论的技术),在音频内容的回放期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。
VI.抑制唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及抑制唤醒响应。图13示出了示例实现1300),NMD通过该示例实现1300)停用唤醒响应。
a.接收用于停用NMD对一个或多个唤醒词的唤醒响应的指令
在框1302处,实现1300涉及接收用于停用NMD对一个或唤醒词的唤醒响应的指令。例如,NMD(例如,NMD 132)可以从另一NMD、回放设备、计算系统或任何其他设备接收指令。指令使NMD停用其对一个或多个唤醒词的唤醒响应,这些唤醒词被表示在已经指定由一个或多个回放设备回放的某些音频内容中。
在一些实施方式中,所接收的用于停用NMD对一个或多个唤醒词的唤醒响应的指令是隐式的。例如,可以指示NMD在唤醒词被回放设备回放时不检测唤醒词,这可能通过指示NMD停止收听唤醒词,通过停用NMD的麦克风阵列一段时间,或者通过在回放设备的方向创建收听无效等来进行。备选地,NMD可以检测唤醒词,但是NMD被指示抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务,这可能通过在某些时段期间忽略唤醒词,或者通过在某些时段期间忽略所有音频来进行。可以使用任何合适的指令来指示NMD,例如以上第II、第III和第IV部分中讨论的那些指令。
备选地,所接收的指令是隐式的。例如,如上所述,可以将音频内容修改为包括指定唤醒词的声学标记。在这些实施方式中,所接收的指令可以是声学标记的形式。在一些情况下,所接收的指令可以是用于在检测到声学标记时停用NMD的唤醒响应的指令。
b.检测一个或多个回放设备正在回放的音频内容
在图13中,在框1304处,实现1300涉及检测由一个或多个回放设备回放的音频内容。例如,NMD可以经由麦克风检测由单个回放设备回放的音频内容。备选地,NMD可以检测由两个或更多个设备(例如,同步地)回放的音频内容。
c.确定检测到的音频内容包括一个或多个唤醒词
在图13中,在框1306处,实现1300涉及确定检测到的音频内容包括一个或多个唤醒词。例如,NMD可以通过对检测到的音频内容运行一种或多种唤醒词检测算法,来确定检测到的音频内容包括一个或多个唤醒词。在一些情况下,NMD可以对检测到的音频内容运行多个唤醒词检测算法(例如,用于不同唤醒词(可能用于不同的语音服务)的唤醒词检测算法)。在整个本公开中描述了示例唤醒词检测算法。
D.停用NMD对检测到的音频内容中的一个或多个唤醒词的唤醒响应
在图13中,在框1308处,实现1300涉及停用NMD对检测到的音频内容中的一个或多个唤醒词的唤醒响应。如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
VII.结论
以上描述尤其公开了各种示例系统、方法、装置和尤其包括在硬件上执行的固件和/或软件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
(特征1)一种方法,包括:经由回放设备接收表示音频内容的数据,以供所述回放设备回放;在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及经由一个或多个扬声器回放所述音频内容。
(特征2)根据特征1所述的方法,其中,所述回放设备包括所述给定联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在回放所述音频内容的同时,经由所述麦克风记录正在回放的音频内容;以及停用所述给定联网麦克风设备对所记录的音频内容中的所述一个或多个唤醒词的相应唤醒响应。
(特征3)根据特征1所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征4)根据特征2所述的方法,其中,所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征5)根据特征4所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征6)根据特征4所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征7)根据特征1所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
(特征8)根据特征1所述的方法,其中,检测所述一个或多个唤醒词包括对所述音频内容应用多个唤醒词检测算法,其中,所述多个唤醒词检测算法包括用于第一语音服务的第一唤醒词检测算法和用于第二语音服务的第二唤醒词检测算法,并且其中,在所述回放设备回放所述音频内容之前对所述音频内容应用多个唤醒词检测算法包括:在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第一语音服务的第一音频检测算法,以检测用于所述第一语音服务的至少一个第一唤醒词;以及在回放设备回放音频内容之前,对所述音频内容应用用于所述第二语音服务的第二音频检测算法,以检测用于所述第二语音服务的至少一个第二唤醒词,其中,所述第二唤醒词与所述第一唤醒词不同。
(特征9)根据特征1所述的方法,其中,所述一个或多个联网麦克风设备包括第一联网麦克风设备和第二联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述第一联网麦克风设备停用所述第一联网麦克风设备对检测到的至少一个第一唤醒词的相应唤醒响应;以及使所述第二联网麦克风设备停用所述第二联网麦克风设备对检测到的至少一个第二唤醒词的相应唤醒响应。
(特征10)根据特征1所述的方法,其中,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词包括检测特定唤醒词在所述音频内容中的多个实例,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到每个联网麦克风设备已经检测到与在所述音频内容中检测到的所述特定唤醒词的所述多个实例的数量相等数量的唤醒词为止。
(特征11)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器以使设备执行根据特征1至10中任一项的方法。
(特征12)一种设备,被配置为执行根据特征1至10中任一项的方法。
(特征13)一种媒体回放系统,被配置为执行根据特征1至10中任一项的方法。
(特征14)一种方法,包括:经由联网麦克风设备接收表示音频内容的数据,以供回放设备回放;在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应,其中,在唤醒响应被启用时,所述联网麦克风设备对特定唤醒词的唤醒响应使所述联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及当所述回放设备正在回放所述音频内容时,经由所述麦克风检测所回放的音频内容。
(特征15)根据特征14所述的方法,还包括:经由网络接口将表示音频内容的数据传输给所述回放设备,以使所述回放设备回放所述音频内容。
(特征16)根据特征15所述的方法,其中,在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应包括:在将表示所述音频内容的数据传输给所述回放设备之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记使所述联网麦克风设备在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应。
(特征17)根据特征14所述的方法,还包括:使一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个附加联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
(特征18)根据特征17所述的方法,其中,使所述一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个附加联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个附加联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征19)根据特征17所述的方法,其中,所述一个或多个附加联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风在音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征20)根据特征19所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征21)根据特征14所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征22)根据特征14所述的方法,其中,检测所述一个或多个唤醒词包括对所述音频内容应用多个唤醒词检测算法,其中,所述多个唤醒词检测算法包括用于第一语音服务的第一唤醒词检测算法和用于第二语音服务的第二唤醒词检测算法,并且其中,在所述回放设备回放所述音频内容之前对所述音频内容应用多个唤醒词检测算法包括:在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第一语音服务的第一音频检测算法,以检测用于所述第一语音服务的至少一个第一唤醒词;以及在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第二语音服务的第二音频检测算法,以检测用于所述第二语音服务的至少一个第二唤醒词,其中,所述第二唤醒词与所述第一唤醒词不同。
(特征23)根据特征14所述的方法,其中,所述联网麦克风设备包括所述回放设备,并且其中,所述方法还包括经由一个或多个扬声器回放所述音频内容。
(特征24)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器以使设备执行根据特征14至23中任一项的方法。
(特征25)一种设备,被配置为执行特征14至23中任一项的方法。
(特征26)一种回放系统,被配置为执行特征14至23中任一项的方法。
(特征27)一种方法,包括:通过计算系统接收(经由所述计算系统的接口)接收音频内容,以供一个或多个回放设备回放;在回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;以及使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令。
(特征28)根据特征27所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征29)根据特征28所述的方法,其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送使所述一个或多个联网麦克风设备在一个或多个时间段期间停用所述一个或多个联网麦克风设备的相应唤醒响应的指令,所述一个或多个时间段与所述一个或多个回放设备将回放所述音频内容的表示相应唤醒词的片段的时间相对应。
(特征30)根据特征28所述的方法,其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送使所述一个或多个联网麦克风设备在一个或多个时间段期间停用所述一个或多个联网麦克风设备的相应麦克风的指令,所述一个或多个时间段与所述一个或多个回放设备将回放所述音频内容的表示相应唤醒词的片段的时间相对应。
(特征31)根据特征28所述的方法,其中,所述计算系统在所述音频内容检测到特定数量的唤醒词,并且其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送指令,所述指令使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到所述一个或多个联网麦克风设备已经检测到与在所述音频内容中检测到的唤醒词的特定数量相等数量的唤醒词为止。
(特征32)根据特征28所述的方法,其中,所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征33)根据特征32所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征34)根据特征32所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征35)根据特征27所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在所述一个或多个回放设备回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应;以及将修改后的音频内容传输给所述一个或多个回放设备中的至少一个,以供所述一个或多个回放设备回放。
(特征36)根据特征35所述的方法,其中,接收音频内容以供一个或多个回放设备回放包括以下之一:(a)经由接口的网络接口接收表示音频内容的数据,或(b)经由接口的模拟接口接收表示音频内容的模拟信号。
(特征37)根据特征27所述的方法,其中,所述计算系统包括所述一个或多个回放设备中的特定回放设备,并且其中,操作还包括回放所述音频内容。
(特征38)根据特征27所述的方法,其中,所述计算系统包括所述一个或多个联网麦克风设备中的特定联网麦克风设备,并且其中,操作还包括经由麦克风检测正由所述一个或多个回放设备回放的音频内容。
(特征39)一种有形暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器执行以使设备执行特征27至38中任一项的方法。
(特征4())一种设备,被配置为执行特征27至38中任一项的方法。
(特征41)一种媒体回放系统,被配置为执行特征27至38中任一项的方法。
(特征42)一种方法,包括:经由联网麦克风设备接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令,其中,当唤醒响应被启用时,所述联网麦克风设备对给定唤醒词的唤醒响应使所述联网麦克风设备经由麦克风收听所述给定唤醒词之后的语音命令;经由所述麦克风检测由一个或多个回放设备回放的音频内容;确定检测到的音频内容包括一个或多个唤醒词;以及响应于接收到的指令,停用所述联网麦克风设备对检测到的音频内容中的所述一个或多个唤醒词的唤醒响应。
(特征43)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收对在一个或多个时间段期间停用所述唤醒响应的指令,所述一个或多个时间段与所述一个或多个回放设备将要回放所述音频内容中与相应检测到的唤醒词相对应的片段的时间相对应。
(特征44)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收对在一个或多个时间段期间停用所述麦克风的指令,所述一个或多个时间段与所述一个或多个回放设备将要回放所述音频内容中与相应检测到的唤醒词相对应的片段的时间相对应。
(特征45)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收指令,所述指令在检测到连续唤醒词时停用所述唤醒响应,直到所述联网麦克风设备已经检测到与特定数量的唤醒词相等数量的唤醒词为止。
(特征46)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收在检测到声学标记时停用唤醒响应的指令,并且其中,停用所述联网麦克风设备对检测到的音频内容中的一个或多个唤醒词的唤醒响应包括:检测检测到的音频内容中与相应的检测到的唤醒词相对应的声学标记;以及响应于检测到每个声学标记而停用所述唤醒响应。
(特征47)根据特征42所述的方法,其中,确定检测到的音频内容包括一个或多个唤醒词包括向检测到的音频内容应用一个或多个唤醒词检测算法。
(特征48)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器执行以使设备执行根据特征42至47中任一项的方法。
(特征49)一种设备,被配置为执行根据特征42至47中任一项的方法。
(特征50)一种媒体回放设备,被配置为执行根据特征42至47中任一项的方法。
主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦接到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
当随附权利要求中的任一项权利要求被理解成涵盖纯软件和/或固件实现时,在此明确限定至少一个示例中的至少一个元素以包括存储软件和/或固件的非暂时性有形介质,如存储器、DVD、CD、蓝光等。
Claims (13)
1.一种用于回放设备的方法,包括:
经由所述回放设备的网络接口接收表示音频内容的数据,以供所述回放设备回放;以及
在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;
确定一个或多个联网麦克风设备位于所述音频内容的可听范围附近;
响应于确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近,使被确定为在所述音频内容的可听范围内的一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间,停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,所述一个或多个联网麦克风设备中的给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及
经由所述回放设备的一个或多个扬声器回放所述音频内容。
2.根据权利要求1所述的方法,其中,所述回放设备包括所述给定联网麦克风设备。
3.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容的同时,经由所述一个或多个联网麦克风设备记录正在回放的音频内容;以及
停用所述一个或多个联网麦克风设备对所记录的音频内容中的所述一个或多个唤醒词的相应唤醒响应。
4.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
经由所述回放设备的所述网络接口向所述一个或多个联网麦克风设备发送指令,所述指令使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应。
5.根据权利要求1或2所述的方法,其中,被确定为在所述音频内容的可听范围附近的所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集。
6.根据权利要求2所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
7.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
8.根据权利要求1或2所述的方法,其中,检测所述一个或多个唤醒词包括:对所述音频内容应用多个唤醒词检测算法,所述多个唤醒词检测算法各自针对与相应语音服务相关联的唤醒词。
9.根据权利要求8所述的方法,其中:
检测所述一个或多个唤醒词包括检测多个唤醒词;以及
使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
使第一联网麦克风设备停用所述第一联网麦克风设备对检测到的至少一个第一唤醒词的相应唤醒响应;以及
使第二联网麦克风设备停用所述第二联网麦克风设备对检测到的至少一个第二唤醒字的相应唤醒响应。
10.根据权利要求1所述的方法,其中,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词包括检测特定唤醒词在所述音频内容中的多个实例。
11.根据权利要求10所述的方法,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到每个联网麦克风设备已经检测到与在所述音频内容中检测到的所述特定唤醒词的所述多个实例的数量相等数量的唤醒词为止。
12.一种存储有指令的有形非暂时性计算机可读介质,所述指令能够由一个或多个处理器执行,以使回放设备执行根据前述权利要求中任一项所述的方法。
13.一种回放设备,包括:
网络接口;
一个或多个处理器;以及
根据权利要求12所述的有形非暂时性计算机可读介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310761290.0A CN116954545A (zh) | 2017-08-07 | 2018-08-06 | 处理系统及其对应方法、计算机可读介质和回放设备 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/670,361 US10475449B2 (en) | 2017-08-07 | 2017-08-07 | Wake-word detection suppression |
US15/670,361 | 2017-08-07 | ||
PCT/US2018/045397 WO2019032462A1 (en) | 2017-08-07 | 2018-08-06 | REMOVAL OF AWAKENING WORD DETECTION |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761290.0A Division CN116954545A (zh) | 2017-08-07 | 2018-08-06 | 处理系统及其对应方法、计算机可读介质和回放设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111194439A CN111194439A (zh) | 2020-05-22 |
CN111194439B true CN111194439B (zh) | 2023-07-07 |
Family
ID=63405364
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761290.0A Pending CN116954545A (zh) | 2017-08-07 | 2018-08-06 | 处理系统及其对应方法、计算机可读介质和回放设备 |
CN201880064916.XA Active CN111194439B (zh) | 2017-08-07 | 2018-08-06 | 唤醒词检测抑制 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761290.0A Pending CN116954545A (zh) | 2017-08-07 | 2018-08-06 | 处理系统及其对应方法、计算机可读介质和回放设备 |
Country Status (8)
Country | Link |
---|---|
US (4) | US10475449B2 (zh) |
EP (2) | EP4040285A1 (zh) |
JP (1) | JP6963673B2 (zh) |
KR (1) | KR102315053B1 (zh) |
CN (2) | CN116954545A (zh) |
AU (1) | AU2018312989B2 (zh) |
CA (2) | CA3140979C (zh) |
WO (1) | WO2019032462A1 (zh) |
Families Citing this family (97)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9691378B1 (en) * | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
CN107591151B (zh) * | 2017-08-22 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 远场语音唤醒方法、装置和终端设备 |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10621981B2 (en) * | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
US10733990B2 (en) * | 2017-10-18 | 2020-08-04 | Motorola Mobility Llc | Preventing initiation of a voice recognition session |
US10152966B1 (en) * | 2017-10-31 | 2018-12-11 | Comcast Cable Communications, Llc | Preventing unwanted activation of a hands free device |
US20190130898A1 (en) * | 2017-11-02 | 2019-05-02 | GM Global Technology Operations LLC | Wake-up-word detection |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
FR3075442B1 (fr) * | 2017-12-19 | 2019-11-22 | Sagemcom Broadband Sas | Dispositif et procede d'assistance vocale |
CN108039175B (zh) * | 2018-01-29 | 2021-03-26 | 北京百度网讯科技有限公司 | 语音识别方法、装置及服务器 |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
US11127405B1 (en) * | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10885910B1 (en) | 2018-03-14 | 2021-01-05 | Amazon Technologies, Inc. | Voice-forward graphical user interface mode management |
US10877637B1 (en) | 2018-03-14 | 2020-12-29 | Amazon Technologies, Inc. | Voice-based device operation mode management |
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
US10685666B2 (en) * | 2018-04-06 | 2020-06-16 | Intel Corporation | Automatic gain adjustment for improved wake word recognition in audio systems |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10649727B1 (en) * | 2018-05-14 | 2020-05-12 | Amazon Technologies, Inc. | Wake word detection configuration |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
WO2020005202A1 (en) | 2018-06-25 | 2020-01-02 | Google Llc | Hotword-aware speech synthesis |
US10929097B2 (en) * | 2018-06-26 | 2021-02-23 | ROVl GUIDES, INC. | Systems and methods for switching operational modes based on audio triggers |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
KR102580521B1 (ko) * | 2018-07-13 | 2023-09-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음량 조절 방법 |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11151994B2 (en) * | 2019-01-04 | 2021-10-19 | International Business Machines Corporation | Methods and systems for managing voice commands and the execution thereof |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
US11024290B2 (en) * | 2019-02-11 | 2021-06-01 | Amazon Technologies, Inc. | Wakeword detection using a secondary microphone |
CN110109645A (zh) * | 2019-04-30 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 一种交互式音乐试听方法、装置和终端 |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
JPWO2020235141A1 (zh) * | 2019-05-17 | 2020-11-26 | ||
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
CN112712803B (zh) * | 2019-07-15 | 2022-02-25 | 华为技术有限公司 | 一种语音唤醒的方法和电子设备 |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) * | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11521599B1 (en) * | 2019-09-20 | 2022-12-06 | Amazon Technologies, Inc. | Wakeword detection using a neural network |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
JP7483421B2 (ja) | 2020-03-12 | 2024-05-15 | キヤノン株式会社 | 撮像装置、制御方法、及びプログラム |
CN111429917B (zh) * | 2020-03-18 | 2023-09-22 | 北京声智科技有限公司 | 一种设备唤醒方法及终端设备 |
KR20210123633A (ko) * | 2020-04-03 | 2021-10-14 | 삼성전자주식회사 | 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법 |
CN111554298B (zh) * | 2020-05-18 | 2023-03-28 | 阿波罗智联(北京)科技有限公司 | 语音交互方法、语音交互设备和电子设备 |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11308962B2 (en) | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
CN111640426A (zh) * | 2020-06-10 | 2020-09-08 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
JP7491147B2 (ja) | 2020-08-31 | 2024-05-28 | セイコーエプソン株式会社 | 表示システムの制御方法、表示システム、及び、表示装置の制御方法 |
US11657814B2 (en) * | 2020-10-08 | 2023-05-23 | Harman International Industries, Incorporated | Techniques for dynamic auditory phrase completion |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US11562748B2 (en) * | 2020-12-01 | 2023-01-24 | Google Llc | Detecting and suppressing commands in media that may trigger another automated assistant |
US12001260B1 (en) * | 2020-12-11 | 2024-06-04 | Amazon Technologies, Inc. | Preventing inadvertent wake in a speech-controlled device |
US20220215835A1 (en) * | 2021-01-06 | 2022-07-07 | Comcast Cable Communications, Llc | Evaluating user device activations |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
US12057116B2 (en) * | 2021-01-29 | 2024-08-06 | Salesforce, Inc. | Intent disambiguation within a virtual agent platform |
US11557293B2 (en) * | 2021-05-17 | 2023-01-17 | Google Llc | Contextual suppression of assistant command(s) |
US20240265921A1 (en) * | 2021-09-30 | 2024-08-08 | Sonos, Inc. | Conflict management for wake-word detection processes |
US11769506B1 (en) * | 2022-05-09 | 2023-09-26 | Amazon Technologies, Inc. | Response orchestrator for natural language interface |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572009A (zh) * | 2015-01-28 | 2015-04-29 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
CN105632486A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
TW201629950A (zh) * | 2015-01-07 | 2016-08-16 | 樓氏電子有限公司 | 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 |
US9548053B1 (en) * | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
US9633661B1 (en) * | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
CN106910500A (zh) * | 2016-12-23 | 2017-06-30 | 北京第九实验室科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
Family Cites Families (1198)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US186265A (en) * | 1877-01-16 | Improvement in odorless receptacles | ||
US4941187A (en) | 1984-02-03 | 1990-07-10 | Slater Robert W | Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments |
US4741038A (en) | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPS63301998A (ja) | 1987-06-02 | 1988-12-08 | 日本電気株式会社 | 音声認識応答装置 |
US4974213A (en) | 1988-12-16 | 1990-11-27 | Siwecki Thomas L | Passive active underwater sound detection apparatus |
US5036538A (en) | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5440644A (en) | 1991-01-09 | 1995-08-08 | Square D Company | Audio distribution system having programmable zoning features |
EP0548836B1 (en) | 1991-12-20 | 1997-06-11 | Matsushita Electric Industrial Co., Ltd. | A bass reproduction speaker apparatus |
US6311157B1 (en) | 1992-12-31 | 2001-10-30 | Apple Computer, Inc. | Assigning meanings to utterances in a speech recognition system |
JPH0883091A (ja) | 1994-09-09 | 1996-03-26 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
US5740260A (en) | 1995-05-22 | 1998-04-14 | Presonus L.L.P. | Midi to analog sound processor interface |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5857172A (en) | 1995-07-31 | 1999-01-05 | Microsoft Corporation | Activation control of a speech recognizer through use of a pointing device |
US7174299B2 (en) | 1995-08-18 | 2007-02-06 | Canon Kabushiki Kaisha | Speech recognition system, speech recognition apparatus, and speech recognition method |
FR2739736B1 (fr) | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JP3094900B2 (ja) | 1996-02-20 | 2000-10-03 | ヤマハ株式会社 | ネットワーク機器およびデータ送受信方法 |
US6404811B1 (en) | 1996-05-13 | 2002-06-11 | Tektronix, Inc. | Interactive multimedia system |
JP3679526B2 (ja) | 1996-10-31 | 2005-08-03 | キヤノン株式会社 | 画像共有装置、画面制御方法及びコンピュータ可読メモリ |
US6469633B1 (en) | 1997-01-06 | 2002-10-22 | Openglobe Inc. | Remote control of electronic devices |
US6078886A (en) | 1997-04-14 | 2000-06-20 | At&T Corporation | System and method for providing remote automatic speech recognition services via a packet network |
US6611537B1 (en) | 1997-05-30 | 2003-08-26 | Centillium Communications, Inc. | Synchronous network for digital media streams |
US6408078B1 (en) | 1997-10-30 | 2002-06-18 | Maximilian Hobelsberger | Active reactive acoustical elements |
US6088459A (en) | 1997-10-30 | 2000-07-11 | Hobelsberger; Maximilian Hans | Loudspeaker system with simulated baffle for improved base reproduction |
US6032202A (en) | 1998-01-06 | 2000-02-29 | Sony Corporation Of Japan | Home audio/video network with two level device control |
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US6301603B1 (en) | 1998-02-17 | 2001-10-09 | Euphonics Incorporated | Scalable audio processing on a heterogeneous processor array |
US6953886B1 (en) | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
IL127569A0 (en) | 1998-09-16 | 1999-10-28 | Comsense Technologies Ltd | Interactive toys |
US6839410B2 (en) | 1998-09-01 | 2005-01-04 | At&T Corp. | Method and apparatus for setting user communication parameters based on voice identification of users |
IL140805A0 (en) | 1998-10-02 | 2002-02-10 | Ibm | Structure skeletons for efficient voice navigation through generic hierarchical objects |
US20020116196A1 (en) | 1998-11-12 | 2002-08-22 | Tran Bao Q. | Speech recognizer |
US6243676B1 (en) | 1998-12-23 | 2001-06-05 | Openwave Systems Inc. | Searching and retrieving multimedia information |
US7130616B2 (en) | 2000-04-25 | 2006-10-31 | Simple Devices | System and method for providing content, management, and interactivity for client devices |
US6256554B1 (en) | 1999-04-14 | 2001-07-03 | Dilorenzo Mark | Multi-room entertainment system with in-room media player/dispenser |
US6414251B1 (en) | 1999-04-19 | 2002-07-02 | Breck Colquett | Weighing apparatus and method having automatic tolerance analysis and calibration |
US7657910B1 (en) | 1999-07-26 | 2010-02-02 | E-Cast Inc. | Distributed electronic entertainment method and apparatus |
GB2352933A (en) | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6542868B1 (en) | 1999-09-23 | 2003-04-01 | International Business Machines Corporation | Audio notification management system |
US6937977B2 (en) | 1999-10-05 | 2005-08-30 | Fastmobile, Inc. | Method and apparatus for processing an input speech signal during presentation of an output audio signal |
US6611604B1 (en) | 1999-10-22 | 2003-08-26 | Stillwater Designs & Audio, Inc. | Ultra low frequency transducer and loud speaker comprising same |
US7725307B2 (en) | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US6522886B1 (en) | 1999-11-22 | 2003-02-18 | Qwest Communications International Inc. | Method and system for simultaneously sharing wireless communications among multiple wireless handsets |
US6219645B1 (en) | 1999-12-02 | 2001-04-17 | Lucent Technologies, Inc. | Enhanced automatic speech recognition using multiple directional microphones |
ES2277419T3 (es) | 1999-12-03 | 2007-07-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Un metodo para producir simultaneamente ficheros de audio en dos telefonos. |
KR20010054622A (ko) | 1999-12-07 | 2001-07-02 | 서평원 | 음성 인식 시스템의 음성 인식률 향상 방법 |
US20010042107A1 (en) | 2000-01-06 | 2001-11-15 | Palm Stephen R. | Networked audio player transport protocol and architecture |
US7661107B1 (en) | 2000-01-18 | 2010-02-09 | Advanced Micro Devices, Inc. | Method and apparatus for dynamic allocation of processing resources |
WO2001053994A2 (en) | 2000-01-24 | 2001-07-26 | Friskit, Inc. | Streaming media search and playback system |
AU2001231115A1 (en) | 2000-01-24 | 2001-07-31 | Zapmedia, Inc. | System and method for the distribution and sharing of media assets between mediaplayers devices |
EP1256207B1 (en) | 2000-02-18 | 2007-09-05 | Bridgeco AG | Multi-portal bridge for providing network connectivity |
JP2001236093A (ja) | 2000-02-24 | 2001-08-31 | Omron Corp | 電子機器制御装置および電子機器 |
US6631410B1 (en) | 2000-03-16 | 2003-10-07 | Sharp Laboratories Of America, Inc. | Multimedia wired/wireless content synchronization system and method |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
AU4219601A (en) | 2000-03-31 | 2001-10-15 | Classwave Wireless Inc. | Dynamic protocol selection and routing of content to mobile devices |
GB2363036B (en) | 2000-05-31 | 2004-05-12 | Nokia Mobile Phones Ltd | Conference call method and apparatus therefor |
US20050164664A1 (en) | 2000-07-21 | 2005-07-28 | Difonzo Daniel F. | Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks |
US20040105566A1 (en) | 2000-07-27 | 2004-06-03 | International Business Machines Corporation | Body set type speaker unit |
US8165867B1 (en) | 2000-09-15 | 2012-04-24 | Fish Robert D | Methods for translating a device command |
US6934756B2 (en) | 2000-11-01 | 2005-08-23 | International Business Machines Corporation | Conversational networking via transport, coding and control conversational protocols |
US20020054685A1 (en) | 2000-11-09 | 2002-05-09 | Carlos Avendano | System for suppressing acoustic echoes and interferences in multi-channel audio systems |
US20020072816A1 (en) | 2000-12-07 | 2002-06-13 | Yoav Shdema | Audio system |
US7016847B1 (en) | 2000-12-08 | 2006-03-21 | Ben Franklin Patent Holdings L.L.C. | Open architecture for a voice user interface |
US6778869B2 (en) | 2000-12-11 | 2004-08-17 | Sony Corporation | System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment |
US7143939B2 (en) | 2000-12-19 | 2006-12-05 | Intel Corporation | Wireless music device and method therefor |
US20020124097A1 (en) | 2000-12-29 | 2002-09-05 | Isely Larson J. | Methods, systems and computer program products for zone based distribution of audio signals |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
GB2372864B (en) | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US6885989B2 (en) | 2001-04-02 | 2005-04-26 | International Business Machines Corporation | Method and system for collaborative speech recognition for small-area network |
US6757517B2 (en) | 2001-05-10 | 2004-06-29 | Chin-Chi Chang | Apparatus and method for coordinated music playback in wireless ad-hoc networks |
US7136934B2 (en) | 2001-06-19 | 2006-11-14 | Request, Inc. | Multimedia synchronization method and device |
KR100420069B1 (ko) | 2001-08-23 | 2004-02-25 | 한국과학기술원 | 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법 |
US6892083B2 (en) | 2001-09-05 | 2005-05-10 | Vocera Communications Inc. | Voice-controlled wireless communications system and method |
US7536704B2 (en) | 2001-10-05 | 2009-05-19 | Opentv, Inc. | Method and apparatus automatic pause and resume of playback for a popup on interactive TV |
CA2408045A1 (en) | 2001-10-16 | 2003-04-16 | Audio Products International Corp. | Loudspeaker with large displacement motional feedback |
CA2407123C (en) | 2001-10-16 | 2007-12-18 | Audio Products International Corp. | Low distortion loudspeaker cone suspension |
US7006639B2 (en) | 2001-11-20 | 2006-02-28 | Maximilian Hans Hobelsberger | Active noise-attenuating duct element |
US7103542B2 (en) | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
AU2002361767A1 (en) | 2001-12-17 | 2003-07-09 | Becomm Corporation | Method and system for synchronization of content rendering |
DE10163213A1 (de) | 2001-12-21 | 2003-07-10 | Philips Intellectual Property | Verfahren zum Betrieb eines Spracherkennungssystems |
US8103009B2 (en) | 2002-01-25 | 2012-01-24 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
US7853341B2 (en) | 2002-01-25 | 2010-12-14 | Ksc Industries, Inc. | Wired, wireless, infrared, and powerline audio entertainment systems |
JP4086280B2 (ja) | 2002-01-29 | 2008-05-14 | 株式会社東芝 | 音声入力システム、音声入力方法及び音声入力プログラム |
JP2005518734A (ja) | 2002-02-20 | 2005-06-23 | メシュネットワークス、インコーポレイテッド | チャンネル間で802.11データトラフィックをルーティングしてアドホックネットワーク容量を増大するシステムおよび方法 |
JP3715584B2 (ja) | 2002-03-28 | 2005-11-09 | 富士通株式会社 | 機器制御装置および機器制御方法 |
EP1510031A4 (en) | 2002-05-06 | 2009-02-04 | Syncronation Inc | LOCALIZED AUDIO NETWORKS AND ASSOCIATED DIGITAL TOOLS |
AU2003241405B2 (en) | 2002-05-09 | 2008-06-19 | Netstreams, Llc | Audio network distribution system |
US6961423B2 (en) | 2002-06-24 | 2005-11-01 | Freescale Semiconductor, Inc. | Method and apparatus for performing adaptive filtering |
JP3815388B2 (ja) | 2002-06-25 | 2006-08-30 | 株式会社デンソー | 音声認識システムおよび端末 |
US8060225B2 (en) | 2002-07-31 | 2011-11-15 | Hewlett-Packard Development Company, L. P. | Digital audio device |
EP1389853B1 (en) | 2002-08-14 | 2006-03-29 | Sony Deutschland GmbH | Bandwidth oriented reconfiguration of wireless ad hoc networks |
JP3910898B2 (ja) | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7228275B1 (en) | 2002-10-21 | 2007-06-05 | Toyota Infotechnology Center Co., Ltd. | Speech recognition system having multiple speech recognizers |
JP2004163590A (ja) | 2002-11-12 | 2004-06-10 | Denso Corp | 再生装置及びプログラム |
KR20040042242A (ko) | 2002-11-13 | 2004-05-20 | 삼성전자주식회사 | 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템 |
US7295548B2 (en) | 2002-11-27 | 2007-11-13 | Microsoft Corporation | Method and system for disaggregating audio/visual components |
CN100392723C (zh) | 2002-12-11 | 2008-06-04 | 索夫塔马克斯公司 | 在稳定性约束下使用独立分量分析的语音处理系统和方法 |
US7076428B2 (en) | 2002-12-30 | 2006-07-11 | Motorola, Inc. | Method and apparatus for selective distributed speech recognition |
KR100668297B1 (ko) | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US6823050B2 (en) | 2003-02-13 | 2004-11-23 | International Business Machines Corporation | System and method for interfacing with a personal telephony recorder |
CA2518121A1 (en) | 2003-03-03 | 2004-09-16 | America Online, Inc. | Source audio identifiers for digital communications |
JP2004347943A (ja) | 2003-05-23 | 2004-12-09 | Clarion Co Ltd | データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム |
JP2004354721A (ja) | 2003-05-29 | 2004-12-16 | Shimizu Corp | 音声制御装置、音声制御方法および音声制御プログラム |
US7571014B1 (en) | 2004-04-01 | 2009-08-04 | Sonos, Inc. | Method and apparatus for controlling multimedia players in a multi-zone system |
US8234395B2 (en) | 2003-07-28 | 2012-07-31 | Sonos, Inc. | System and method for synchronizing operations among a plurality of independently clocked digital data processing devices |
US10613817B2 (en) | 2003-07-28 | 2020-04-07 | Sonos, Inc. | Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group |
US7961892B2 (en) | 2003-07-28 | 2011-06-14 | Texas Instruments Incorporated | Apparatus and method for monitoring speaker cone displacement in an audio speaker |
US8290603B1 (en) | 2004-06-05 | 2012-10-16 | Sonos, Inc. | User interfaces for controlling and manipulating groupings in a multi-zone media system |
US20050031133A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Process for position indication |
US20050031139A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using impedance |
US20050031140A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using a capacitance measurement |
US20060104451A1 (en) | 2003-08-07 | 2006-05-18 | Tymphany Corporation | Audio reproduction system |
US20050031134A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Position detection of an actuator using infrared light |
US20050031138A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of measuring a cant of an actuator |
US20050031131A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Method of modifying dynamics of a system |
US20050031132A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Control system |
US20050031137A1 (en) | 2003-08-07 | 2005-02-10 | Tymphany Corporation | Calibration of an actuator |
KR20050023841A (ko) | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 비선형 왜곡 저감 방법 및 장치 |
US7099821B2 (en) | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
US20050077843A1 (en) | 2003-10-11 | 2005-04-14 | Ronnie Benditt | Method and apparatus for controlling a performing arts show by an onstage performer |
CN1871874A (zh) | 2003-10-24 | 2006-11-29 | 皇家飞利浦电子股份有限公司 | 自适应声音再现 |
JP4516527B2 (ja) | 2003-11-12 | 2010-08-04 | 本田技研工業株式会社 | 音声認識装置 |
US7705565B2 (en) | 2003-12-31 | 2010-04-27 | Motorola, Inc. | Method and system for wireless charging |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
JP4269973B2 (ja) | 2004-02-27 | 2009-05-27 | 株式会社デンソー | カーオーディオシステム |
US7415117B2 (en) | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7483538B2 (en) | 2004-03-02 | 2009-01-27 | Ksc Industries, Inc. | Wireless and wired speaker hub for a home theater system |
JP4059214B2 (ja) | 2004-03-04 | 2008-03-12 | ソニー株式会社 | 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム |
US10200504B2 (en) | 2007-06-12 | 2019-02-05 | Icontrol Networks, Inc. | Communication protocols over internet protocol (IP) networks |
US7372966B2 (en) | 2004-03-19 | 2008-05-13 | Nokia Corporation | System for limiting loudspeaker displacement |
JP2005284492A (ja) | 2004-03-29 | 2005-10-13 | Mitsubishi Electric Corp | 音声利用操作装置 |
US7630501B2 (en) | 2004-05-14 | 2009-12-08 | Microsoft Corporation | System and method for calibration of an acoustic system |
US7792311B1 (en) | 2004-05-15 | 2010-09-07 | Sonos, Inc., | Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device |
US7346846B2 (en) | 2004-05-28 | 2008-03-18 | Microsoft Corporation | Strategies for providing just-in-time user assistance |
US7006938B2 (en) | 2004-06-16 | 2006-02-28 | Ami Semiconductor, Inc. | Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation |
US7672845B2 (en) | 2004-06-22 | 2010-03-02 | International Business Machines Corporation | Method and system for keyword detection using voice-recognition |
US20060004834A1 (en) | 2004-06-30 | 2006-01-05 | Nokia Corporation | Dynamic shortcuts |
JP2006092482A (ja) | 2004-09-27 | 2006-04-06 | Yamaha Corp | 音声認識通報装置 |
US7720232B2 (en) | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8386523B2 (en) | 2004-12-30 | 2013-02-26 | Texas Instruments Incorporated | Random access audio decoder |
TWI272860B (en) | 2005-01-03 | 2007-02-01 | Lite On Technology Corp | Audio receiver and volume reminder method |
US20070189544A1 (en) | 2005-01-15 | 2007-08-16 | Outland Research, Llc | Ambient sound responsive media player |
WO2006076804A1 (en) | 2005-01-21 | 2006-07-27 | Certicom Corp. | Elliptic curve random number generation |
US20060190968A1 (en) | 2005-01-31 | 2006-08-24 | Searete Llc, A Limited Corporation Of The State Of The State Of Delaware | Sharing between shared audio devices |
EP1715669A1 (en) | 2005-04-19 | 2006-10-25 | Ecole Polytechnique Federale De Lausanne (Epfl) | A method for removing echo in an audio signal |
WO2006111370A1 (en) | 2005-04-19 | 2006-10-26 | Epfl (Ecole Polytechnique Federale De Lausanne) | A method and device for removing echo in a multi-channel audio signal |
US7720684B2 (en) | 2005-04-29 | 2010-05-18 | Nuance Communications, Inc. | Method, apparatus, and computer program product for one-step correction of voice interaction |
US7991167B2 (en) | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US9300790B2 (en) | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
JP4760160B2 (ja) | 2005-06-29 | 2011-08-31 | ヤマハ株式会社 | 集音装置 |
JP4804052B2 (ja) | 2005-07-08 | 2011-10-26 | アルパイン株式会社 | 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法 |
US20070018844A1 (en) | 2005-07-19 | 2007-01-25 | Sehat Sutardja | Two way remote control |
JP4285457B2 (ja) | 2005-07-20 | 2009-06-24 | ソニー株式会社 | 音場測定装置及び音場測定方法 |
EP1912468B1 (en) | 2005-07-29 | 2013-08-14 | Panasonic Corporation | Loudspeaker device |
CN1909625A (zh) | 2005-08-05 | 2007-02-07 | 鸿富锦精密工业(深圳)有限公司 | 一种自动调整音量的电视装置及控制方法 |
JP2009505321A (ja) | 2005-08-19 | 2009-02-05 | グレースノート インコーポレイテッド | 再生装置の動作を制御する方法およびシステム |
US20070060054A1 (en) | 2005-09-15 | 2007-03-15 | Sony Ericsson Mobile Communications Ab | Wireless home communication system method and apparatus |
JP4519041B2 (ja) | 2005-09-20 | 2010-08-04 | ローランド株式会社 | 楽器用スピーカ装置 |
US20080253589A1 (en) | 2005-09-21 | 2008-10-16 | Koninklijke Philips Electronics N.V. | Ultrasound Imaging System with Voice Activated Controls Using Remotely Positioned Microphone |
EP1952619B1 (en) | 2005-11-07 | 2018-02-28 | Telecom Italia S.p.A. | Method for managing a conference call in a telephone network |
CA2629801C (en) | 2005-11-15 | 2011-02-01 | Yamaha Corporation | Remote conference apparatus and sound emitting/collecting apparatus |
JP4929685B2 (ja) | 2005-11-15 | 2012-05-09 | ヤマハ株式会社 | 遠隔会議装置 |
US20070140058A1 (en) | 2005-11-21 | 2007-06-21 | Motorola, Inc. | Method and system for correcting transducer non-linearities |
US7600194B2 (en) | 2005-12-02 | 2009-10-06 | Microsoft Corporation | Start menu operation for computer user interface |
JP4677341B2 (ja) | 2005-12-21 | 2011-04-27 | パイオニア株式会社 | スピーカー装置及び携帯電話機 |
JP2007174233A (ja) | 2005-12-21 | 2007-07-05 | Pioneer Electronic Corp | スピーカー装置及び携帯電話機 |
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
KR100762636B1 (ko) | 2006-02-14 | 2007-10-01 | 삼성전자주식회사 | 네트워크 단말의 음성 검출 제어 시스템 및 방법 |
JP4422692B2 (ja) | 2006-03-03 | 2010-02-24 | 日本電信電話株式会社 | 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体 |
WO2007103937A2 (en) | 2006-03-06 | 2007-09-13 | General Innovations, Inc. | Positionally sequenced loudspeaker system |
US9092435B2 (en) | 2006-04-04 | 2015-07-28 | Johnson Controls Technology Company | System and method for extraction of meta data from a digital media storage device for media selection in a vehicle |
EP1848243B1 (en) | 2006-04-18 | 2009-02-18 | Harman/Becker Automotive Systems GmbH | Multi-channel echo compensation system and method |
KR100786108B1 (ko) | 2006-05-01 | 2007-12-18 | 김준식 | 음파통신 네트워크 |
US9208785B2 (en) | 2006-05-10 | 2015-12-08 | Nuance Communications, Inc. | Synchronizing distributed speech recognition |
ATE436151T1 (de) | 2006-05-10 | 2009-07-15 | Harman Becker Automotive Sys | Kompensation von mehrkanalechos durch dekorrelation |
US8041057B2 (en) | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP4984683B2 (ja) | 2006-06-29 | 2012-07-25 | ヤマハ株式会社 | 放収音装置 |
US8207936B2 (en) | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
US8189765B2 (en) | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US20080037814A1 (en) | 2006-08-09 | 2008-02-14 | Jeng-Jye Shau | Precision audio speakers |
WO2008018099A1 (en) | 2006-08-10 | 2008-02-14 | Claudio Lastrucci | Improvements to systems for acoustic diffusion |
US10013381B2 (en) | 2006-08-31 | 2018-07-03 | Bose Corporation | Media playing from a docked handheld media device |
US8483853B1 (en) | 2006-09-12 | 2013-07-09 | Sonos, Inc. | Controlling and manipulating groupings in a multi-zone media system |
US8473618B2 (en) | 2006-09-19 | 2013-06-25 | Motorola Solutions, Inc. | Method and system for processing multiple communication sessions in a communication network |
JP2008079256A (ja) | 2006-09-25 | 2008-04-03 | Toshiba Corp | 音響信号処理装置、音響信号処理方法及びプログラム |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
TWI435591B (zh) | 2006-10-17 | 2014-04-21 | Marvell World Trade Ltd | 用於蜂巢電話之顯示控制 |
US7747293B2 (en) | 2006-10-17 | 2010-06-29 | Marvell Worl Trade Ltd. | Display control for cellular phone |
JP2010507294A (ja) | 2006-10-17 | 2010-03-04 | アベガ システムズ ピーティーワイ リミテッド | マルチメディアデバイスの統合 |
US8391501B2 (en) | 2006-12-13 | 2013-03-05 | Motorola Mobility Llc | Method and apparatus for mixing priority and non-priority audio signals |
US9124650B2 (en) | 2006-12-13 | 2015-09-01 | Quickplay Media Inc. | Digital rights management in a mobile environment |
US20080146289A1 (en) | 2006-12-14 | 2008-06-19 | Motorola, Inc. | Automatic audio transducer adjustments based upon orientation of a mobile communication device |
JP2008158868A (ja) | 2006-12-25 | 2008-07-10 | Toyota Motor Corp | 移動体、及びその制御方法 |
US7973857B2 (en) | 2006-12-27 | 2011-07-05 | Nokia Corporation | Teleconference group formation using context information |
US20090013255A1 (en) | 2006-12-30 | 2009-01-08 | Matthew John Yuschik | Method and System for Supporting Graphical User Interfaces |
KR101316750B1 (ko) | 2007-01-23 | 2013-10-08 | 삼성전자주식회사 | 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법 |
TW200833152A (en) | 2007-01-31 | 2008-08-01 | Bluepacket Comm Co Ltd | Multimedia switching system |
JPWO2008096414A1 (ja) | 2007-02-06 | 2010-05-20 | パイオニア株式会社 | コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体 |
US20090228919A1 (en) | 2007-11-16 | 2009-09-10 | Zott Joseph A | Media playlist management and viewing remote control |
US20080208594A1 (en) | 2007-02-27 | 2008-08-28 | Cross Charles W | Effecting Functions On A Multimodal Telephony Device |
JP4728982B2 (ja) | 2007-03-05 | 2011-07-20 | 株式会社東芝 | 利用者と対話する装置、方法およびプログラム |
US8880405B2 (en) | 2007-03-07 | 2014-11-04 | Vlingo Corporation | Application text entry in a mobile environment using a speech processing facility |
US8635243B2 (en) | 2007-03-07 | 2014-01-21 | Research In Motion Limited | Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8019076B1 (en) | 2007-03-14 | 2011-09-13 | Clearone Communications, Inc. | Portable speakerphone device and subsystem utilizing false doubletalk detection |
GB0706074D0 (en) | 2007-03-28 | 2007-05-09 | Skype Ltd | Detection of communication states |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8983051B2 (en) | 2007-04-03 | 2015-03-17 | William F. Barton | Outgoing call classification and disposition |
US8406439B1 (en) | 2007-04-04 | 2013-03-26 | At&T Intellectual Property I, L.P. | Methods and systems for synthetic audio placement |
US8848879B1 (en) | 2007-05-03 | 2014-09-30 | Avaya Inc. | Customizable notification based on recent communication history |
KR100827613B1 (ko) | 2007-05-04 | 2008-05-07 | 삼성전자주식회사 | 휴대용 단말기의 마이크 제어 장치 및 방법 |
US8041565B1 (en) | 2007-05-04 | 2011-10-18 | Foneweb, Inc. | Precision speech to text conversion |
US8032383B1 (en) | 2007-05-04 | 2011-10-04 | Foneweb, Inc. | Speech controlled services and devices using internet |
US8136040B2 (en) | 2007-05-16 | 2012-03-13 | Apple Inc. | Audio variance for multiple windows |
CN101681484B (zh) | 2007-05-18 | 2013-10-16 | 速函移动公司 | 用于通过小数据速率通信系统的增强型通信的系统和方法 |
US20080291916A1 (en) | 2007-05-22 | 2008-11-27 | Bo Xiong | Systems and methods for dynamic quality of service |
EP1998446A1 (en) | 2007-05-31 | 2008-12-03 | Alcatel Lucent | Remote control for devices with connectivity to a service delivery platform |
US8068925B2 (en) | 2007-06-28 | 2011-11-29 | Apple Inc. | Dynamic routing of audio among multiple audio devices |
JP4985151B2 (ja) | 2007-06-29 | 2012-07-25 | ヤマハ株式会社 | コンテンツ配信システム及びセンタ装置 |
JP4916394B2 (ja) | 2007-07-03 | 2012-04-11 | 富士通株式会社 | エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム |
WO2009020617A1 (en) | 2007-08-06 | 2009-02-12 | Orison Corporation | System and method for three-dimensional ultrasound imaging |
US20090046866A1 (en) | 2007-08-15 | 2009-02-19 | Fortemedia, Inc. | Apparatus capable of performing acoustic echo cancellation and a method thereof |
US8073125B2 (en) | 2007-09-25 | 2011-12-06 | Microsoft Corporation | Spatial audio conferencing |
US7844724B2 (en) | 2007-10-24 | 2010-11-30 | Social Communications Company | Automated real-time data stream switching in a shared virtual area communication environment |
US8639214B1 (en) | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
US8013720B2 (en) | 2007-11-02 | 2011-09-06 | Reverse Control, Inc. | Signal apparatus for facilitating safe backup of vehicles |
CN103648071B (zh) | 2007-11-20 | 2018-11-02 | 松下知识产权经营株式会社 | 扬声器、视频设备、以及便携式信息处理装置 |
US9247346B2 (en) | 2007-12-07 | 2016-01-26 | Northern Illinois Research Foundation | Apparatus, system and method for noise cancellation and communication for incubators and related devices |
US20090153289A1 (en) | 2007-12-12 | 2009-06-18 | Eric James Hope | Handheld electronic devices with bimodal remote control functionality |
US9386154B2 (en) | 2007-12-21 | 2016-07-05 | Nuance Communications, Inc. | System, method and software program for enabling communications between customer service agents and users of communication devices |
US8473081B2 (en) | 2007-12-25 | 2013-06-25 | Personics Holdings, Inc. | Method and system for event reminder using an earpiece |
WO2009086599A1 (en) | 2008-01-07 | 2009-07-16 | Avega Systems Pty Ltd | A user interface for managing the operation of networked media playback devices |
US9992314B2 (en) | 2008-01-24 | 2018-06-05 | Garmin Switzerland Gmbh | Automatic device mode switching |
DE102008039329A1 (de) | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
DE102008039330A1 (de) | 2008-01-31 | 2009-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung |
US8072905B2 (en) | 2008-02-04 | 2011-12-06 | Sony Ericsson Mobile Communications Ab | Intelligent interaction between devices in a local network |
US8213598B2 (en) | 2008-02-26 | 2012-07-03 | Microsoft Corporation | Harmonic distortion residual echo suppression |
US8638908B2 (en) | 2008-02-28 | 2014-01-28 | Computer Products Introductions, Corp | Contextual conversation processing in telecommunication applications |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8255224B2 (en) | 2008-03-07 | 2012-08-28 | Google Inc. | Voice recognition grammar selection based on context |
US9113240B2 (en) | 2008-03-18 | 2015-08-18 | Qualcomm Incorporated | Speech enhancement using multiple microphones on multiple devices |
WO2009120301A2 (en) | 2008-03-25 | 2009-10-01 | Square Products Corporation | System and method for simultaneous media presentation |
US20090248397A1 (en) | 2008-03-25 | 2009-10-01 | Microsoft Corporation | Service Initiation Techniques |
US7516068B1 (en) | 2008-04-07 | 2009-04-07 | International Business Machines Corporation | Optimized collection of audio for speech recognition |
CN101562671A (zh) | 2008-04-18 | 2009-10-21 | 鸿富锦精密工业(深圳)有限公司 | 音频设备的音量控制方法及通信装置 |
US8751227B2 (en) | 2008-04-30 | 2014-06-10 | Nec Corporation | Acoustic model learning device and speech recognition device |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US8831948B2 (en) | 2008-06-06 | 2014-09-09 | At&T Intellectual Property I, L.P. | System and method for synthetically generated speech describing media content |
US8385557B2 (en) | 2008-06-19 | 2013-02-26 | Microsoft Corporation | Multichannel acoustic echo reduction |
US8325909B2 (en) | 2008-06-25 | 2012-12-04 | Microsoft Corporation | Acoustic echo suppression |
US8693663B2 (en) | 2008-06-27 | 2014-04-08 | Centurylink Intellectual Property Llc | System and method for implementing do-not-disturb during playback of media content |
US8364481B2 (en) | 2008-07-02 | 2013-01-29 | Google Inc. | Speech recognition with parallel recognition tasks |
US8505056B2 (en) | 2008-07-10 | 2013-08-06 | Apple Inc. | Updating properties of remote A/V performance nodes |
EP2146519B1 (en) | 2008-07-16 | 2012-06-06 | Nuance Communications, Inc. | Beamforming pre-processing for speaker localization |
US8781833B2 (en) | 2008-07-17 | 2014-07-15 | Nuance Communications, Inc. | Speech recognition semantic classification training |
US8639830B2 (en) | 2008-07-22 | 2014-01-28 | Control4 Corporation | System and method for streaming audio |
US8325938B2 (en) | 2008-08-12 | 2012-12-04 | Sony Corporation | Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method |
JP5206234B2 (ja) | 2008-08-27 | 2013-06-12 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US8676586B2 (en) | 2008-09-16 | 2014-03-18 | Nice Systems Ltd | Method and apparatus for interaction or discourse analytics |
KR20100034229A (ko) | 2008-09-23 | 2010-04-01 | 삼성전자주식회사 | 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법 |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
EP3258468B1 (en) | 2008-11-10 | 2019-08-21 | Google LLC | Multisensory speech detection |
US8386261B2 (en) | 2008-11-14 | 2013-02-26 | Vocollect Healthcare Systems, Inc. | Training/coaching system for a voice-enabled work environment |
JP5347472B2 (ja) | 2008-12-12 | 2013-11-20 | ヤマハ株式会社 | 遠隔制御装置および遠隔制御システム |
US8548812B2 (en) | 2008-12-22 | 2013-10-01 | Avaya Inc. | Method and system for detecting a relevant utterance in a voice session |
KR101467796B1 (ko) | 2009-01-12 | 2014-12-10 | 엘지전자 주식회사 | 이동단말기 및 그 제어 방법 |
US20100179874A1 (en) | 2009-01-13 | 2010-07-15 | Yahoo! Inc. | Media object metadata engine configured to determine relationships between persons and brands |
US8351617B2 (en) | 2009-01-13 | 2013-01-08 | Fortemedia, Inc. | Method for phase mismatch calibration for an array microphone and phase calibration module for the same |
US20130283169A1 (en) | 2012-04-24 | 2013-10-24 | Social Communications Company | Voice-based virtual area navigation |
US8428758B2 (en) | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
FR2943875A1 (fr) | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
KR101064976B1 (ko) | 2009-04-06 | 2011-09-15 | 한국과학기술원 | 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇 |
US8243949B2 (en) | 2009-04-14 | 2012-08-14 | Plantronics, Inc. | Network addressible loudspeaker and audio play |
EP2420050B1 (en) | 2009-04-15 | 2013-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multichannel echo canceller |
US8483398B2 (en) | 2009-04-30 | 2013-07-09 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses |
JP5550456B2 (ja) | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
JP4820434B2 (ja) | 2009-06-08 | 2011-11-24 | レノボ・シンガポール・プライベート・リミテッド | マイクロフォンのミュート・コントロール |
US20100332236A1 (en) | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Voice-triggered operation of electronic devices |
US8625775B2 (en) | 2009-08-06 | 2014-01-07 | Hti Ip, L.L.C. | Method and system for reducing echo and noise in a vehicle passenger compartment environment |
US8478982B2 (en) | 2009-08-06 | 2013-07-02 | Broadcom Corporation | Media access control security management in physical layer |
JP5440053B2 (ja) | 2009-09-14 | 2014-03-12 | ソニー株式会社 | 情報処理装置及び情報処理方法、並びにコンピューター・プログラム |
WO2011033887A1 (ja) | 2009-09-17 | 2011-03-24 | 株式会社日立メディコ | 超音波探触子及び超音波撮像装置 |
US20110091055A1 (en) | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US8600073B2 (en) | 2009-11-04 | 2013-12-03 | Cambridge Silicon Radio Limited | Wind noise suppression |
KR101301535B1 (ko) | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US20110145581A1 (en) | 2009-12-14 | 2011-06-16 | Verizon Patent And Licensing, Inc. | Media playback across devices |
JP5641186B2 (ja) | 2010-01-13 | 2014-12-17 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
NO332437B1 (no) | 2010-01-18 | 2012-09-17 | Cisco Systems Int Sarl | Apparat og fremgangsmate for a supprimere et akustisk ekko |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011091402A1 (en) | 2010-01-25 | 2011-07-28 | Justin Mason | Voice electronic listening assistant |
US8718290B2 (en) | 2010-01-26 | 2014-05-06 | Audience, Inc. | Adaptive noise reduction using level cues |
US8713571B2 (en) | 2010-02-17 | 2014-04-29 | Microsoft Corporation | Asynchronous task execution |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9209987B2 (en) | 2010-03-02 | 2015-12-08 | Microsoft Technology Licensing, Llc | Social media playback |
EP2375779A3 (en) | 2010-03-31 | 2012-01-18 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for measuring a plurality of loudspeakers and microphone array |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9514476B2 (en) | 2010-04-14 | 2016-12-06 | Viacom International Inc. | Systems and methods for discovering artists |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8437339B2 (en) | 2010-04-28 | 2013-05-07 | Hewlett-Packard Development Company, L.P. | Techniques to provide integrated voice service management |
JP5572445B2 (ja) | 2010-04-30 | 2014-08-13 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
CA2943957C (en) | 2010-05-04 | 2017-10-03 | Avery Li-Chun Wang | Methods and systems for synchronizing media |
CN102893633B (zh) | 2010-05-06 | 2015-04-15 | 杜比实验室特许公司 | 用于便携式媒体回放装置的音频系统均衡化 |
US9307340B2 (en) | 2010-05-06 | 2016-04-05 | Dolby Laboratories Licensing Corporation | Audio system equalization for portable media playback devices |
US9736600B2 (en) | 2010-05-17 | 2017-08-15 | Iii Holdings 4, Llc | Devices and methods for collecting acoustic data |
US20110289506A1 (en) | 2010-05-18 | 2011-11-24 | Google Inc. | Management of computing resources for applications |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8831761B2 (en) | 2010-06-02 | 2014-09-09 | Sony Corporation | Method for determining a processed audio signal and a handheld device |
JP2011259097A (ja) | 2010-06-07 | 2011-12-22 | Sony Corp | 音声信号処理装置及び音声信号処理方法 |
US8588849B2 (en) | 2010-07-09 | 2013-11-19 | Blackberry Limited | System and method for resuming media |
US8699723B2 (en) | 2010-07-20 | 2014-04-15 | International Business Machines Corporation | Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device |
US8762144B2 (en) | 2010-07-21 | 2014-06-24 | Samsung Electronics Co., Ltd. | Method and apparatus for voice activity detection |
US9025782B2 (en) | 2010-07-26 | 2015-05-05 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing |
US9349368B1 (en) | 2010-08-05 | 2016-05-24 | Google Inc. | Generating an audio notification based on detection of a triggering event |
US8731939B1 (en) | 2010-08-06 | 2014-05-20 | Google Inc. | Routing queries based on carrier phrase registration |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
EP2609488A4 (en) | 2010-08-27 | 2015-03-11 | Intel Corp | APPARATUS AND METHOD FOR PRESSURE ACTIVATION |
US20120078635A1 (en) | 2010-09-24 | 2012-03-29 | Apple Inc. | Voice control system |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
JP5259020B2 (ja) | 2010-10-01 | 2013-08-07 | 三菱電機株式会社 | 音声認識装置 |
US9240111B2 (en) | 2010-10-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | Inferring building metadata from distributed sensors |
CN103222192B (zh) | 2010-10-08 | 2019-05-07 | 日本电气株式会社 | 信号处理设备和信号处理方法 |
WO2012054872A2 (en) | 2010-10-22 | 2012-04-26 | Phorus Llc | Media distribution architecture |
EP2444967A1 (en) | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
US9226069B2 (en) | 2010-10-29 | 2015-12-29 | Qualcomm Incorporated | Transitioning multiple microphones from a first mode to a second mode |
EP2456199A3 (en) | 2010-11-22 | 2014-07-16 | DDS Newco Inc. | Method and systems of dynamically managing content for use by a media playback device |
US20120148075A1 (en) | 2010-12-08 | 2012-06-14 | Creative Technology Ltd | Method for optimizing reproduction of audio signals from an apparatus for audio reproduction |
EP2652737B1 (en) | 2010-12-15 | 2014-06-04 | Koninklijke Philips N.V. | Noise reduction system with remote noise detector |
JP5771002B2 (ja) | 2010-12-22 | 2015-08-26 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機 |
US9241227B2 (en) | 2011-01-06 | 2016-01-19 | Bose Corporation | Transducer with integrated sensor |
JP2012150237A (ja) | 2011-01-18 | 2012-08-09 | Sony Corp | 音信号処理装置、および音信号処理方法、並びにプログラム |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
CN102123188A (zh) | 2011-03-03 | 2011-07-13 | 曾超宁 | 移动电话耳麦装置 |
KR20120100514A (ko) | 2011-03-04 | 2012-09-12 | 삼성전자주식회사 | 디바이스 그룹핑 방법 및 이를 적용한 서버 |
US8804977B2 (en) | 2011-03-18 | 2014-08-12 | Dolby Laboratories Licensing Corporation | Nonlinear reference signal processing for echo suppression |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8938312B2 (en) | 2011-04-18 | 2015-01-20 | Sonos, Inc. | Smart line-in processing |
US9493130B2 (en) | 2011-04-22 | 2016-11-15 | Angel A. Penilla | Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input |
KR20120128542A (ko) | 2011-05-11 | 2012-11-27 | 삼성전자주식회사 | 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치 |
US9342516B2 (en) | 2011-05-18 | 2016-05-17 | Microsoft Technology Licensing, Llc | Media presentation playback annotation |
US8320577B1 (en) | 2011-05-20 | 2012-11-27 | Google Inc. | Method and apparatus for multi-channel audio processing using single-channel components |
CN103703719B (zh) | 2011-05-31 | 2018-06-05 | 谷歌有限责任公司 | 使通信会话中的参与者静音的方法及设备 |
US8897465B2 (en) | 2011-06-01 | 2014-11-25 | Robert Bosch Gmbh | Class D micro-speaker |
US8958571B2 (en) | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US8738925B1 (en) | 2013-01-07 | 2014-05-27 | Fitbit, Inc. | Wireless portable biometric device syncing |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US9264553B2 (en) | 2011-06-11 | 2016-02-16 | Clearone Communications, Inc. | Methods and apparatuses for echo cancelation with beamforming microphone arrays |
US9762967B2 (en) | 2011-06-14 | 2017-09-12 | Comcast Cable Communications, Llc | System and method for presenting content with time based metadata |
US8731765B2 (en) | 2011-06-28 | 2014-05-20 | GM Global Technology Operations LLC | Method and apparatus for fault detection in a torque machine of a powertrain system |
US20130018659A1 (en) | 2011-07-12 | 2013-01-17 | Google Inc. | Systems and Methods for Speech Command Processing |
US9042556B2 (en) | 2011-07-19 | 2015-05-26 | Sonos, Inc | Shaping sound responsive to speaker orientation |
US20130024018A1 (en) | 2011-07-22 | 2013-01-24 | Htc Corporation | Multimedia control method and multimedia control system |
JP5289517B2 (ja) | 2011-07-28 | 2013-09-11 | 株式会社半導体理工学研究センター | センサネットワークシステムとその通信方法 |
US9148742B1 (en) | 2011-07-29 | 2015-09-29 | Google Inc. | Proximity detection via audio |
JP5640918B2 (ja) | 2011-08-05 | 2014-12-17 | ブラザー工業株式会社 | サーバ装置、対応付け方法、及び携帯機器用プログラム |
EP2555598A1 (en) | 2011-08-05 | 2013-02-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and device for generating optical radiation by means of electrically operated pulsed discharges |
US20130039527A1 (en) | 2011-08-08 | 2013-02-14 | Bang & Olufsen A/S | Modular, configurable speaker and a method of operating it |
KR101252167B1 (ko) | 2011-08-18 | 2013-04-05 | 엘지전자 주식회사 | 가전기기 진단장치 및 그 진단방법 |
US20130211826A1 (en) | 2011-08-22 | 2013-08-15 | Claes-Fredrik Urban Mannby | Audio Signals as Buffered Streams of Audio Signals and Metadata |
US8750677B2 (en) | 2011-08-23 | 2014-06-10 | Microsoft Corporation | Method for transferring media playback from a different device |
US20130073293A1 (en) | 2011-09-20 | 2013-03-21 | Lg Electronics Inc. | Electronic device and method for controlling the same |
US9094539B1 (en) | 2011-09-22 | 2015-07-28 | Amazon Technologies, Inc. | Dynamic device adjustments based on determined user sleep state |
US8996381B2 (en) | 2011-09-27 | 2015-03-31 | Sensory, Incorporated | Background speech recognition assistant |
US8768707B2 (en) | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8762156B2 (en) | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
US9729631B2 (en) | 2011-09-30 | 2017-08-08 | Apple Inc. | Asynchronous data manipulation |
US8340975B1 (en) | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US8971546B2 (en) | 2011-10-14 | 2015-03-03 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to control audio playback devices |
CN103052001B (zh) | 2011-10-17 | 2015-06-24 | 联想(北京)有限公司 | 智能设备及其控制方法 |
GB201118784D0 (en) | 2011-10-31 | 2011-12-14 | Omnifone Ltd | Djml |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
US8983089B1 (en) | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102567468B (zh) | 2011-12-06 | 2014-06-04 | 上海聚力传媒技术有限公司 | 一种用于对媒体文件的播放音量进行调节的方法与设备 |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
WO2013089675A1 (en) | 2011-12-13 | 2013-06-20 | Intel Corporation | Channel navigation in connected media devices through keyword selection |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
KR102022318B1 (ko) | 2012-01-11 | 2019-09-18 | 삼성전자 주식회사 | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 |
US8825020B2 (en) | 2012-01-12 | 2014-09-02 | Sensory, Incorporated | Information access and device control using mobile phones and audio in the home environment |
US9654817B2 (en) | 2012-01-27 | 2017-05-16 | Avaya Inc. | System and method to synchronize video playback on mobile devices |
WO2013115748A1 (en) | 2012-01-30 | 2013-08-08 | Echostar Ukraine, L.L.C. | Apparatus, systems and methods for adjusting output audio volume based on user location |
US9401058B2 (en) | 2012-01-30 | 2016-07-26 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
US9418658B1 (en) | 2012-02-08 | 2016-08-16 | Amazon Technologies, Inc. | Configuration of voice controlled assistant |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9947333B1 (en) | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US8453058B1 (en) | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
EP2632141B1 (en) | 2012-02-22 | 2014-10-15 | Dialog Semiconductor B.V. | Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components |
US9065895B2 (en) | 2012-02-22 | 2015-06-23 | Broadcom Corporation | Non-linear echo cancellation |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
US20130238326A1 (en) | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9361878B2 (en) | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US20130263237A1 (en) * | 2012-03-30 | 2013-10-03 | Ebay Inc. | User authentication and authorization using personas |
US9198204B2 (en) | 2012-04-11 | 2015-11-24 | Google Inc. | Apparatus and method for seamless commissioning of wireless devices |
EP2839391A4 (en) | 2012-04-20 | 2016-01-27 | Maluuba Inc | CONVERSATION AGENT |
US9633186B2 (en) | 2012-04-23 | 2017-04-25 | Apple Inc. | Systems and methods for controlling output of content based on human recognition data detection |
US9117449B2 (en) | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
CN104395957B (zh) | 2012-04-30 | 2018-02-13 | 创新科技有限公司 | 一种通用可重构回声消除系统 |
US8886524B1 (en) | 2012-05-01 | 2014-11-11 | Amazon Technologies, Inc. | Signal processing based on audio context |
US11452153B2 (en) | 2012-05-01 | 2022-09-20 | Lisnr, Inc. | Pairing and gateway connection using sonic tones |
US20130294611A1 (en) | 2012-05-04 | 2013-11-07 | Sony Computer Entertainment Inc. | Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation |
US9584909B2 (en) | 2012-05-10 | 2017-02-28 | Google Inc. | Distributed beamforming based on message passing |
US9768829B2 (en) | 2012-05-11 | 2017-09-19 | Intel Deutschland Gmbh | Methods for processing audio signals and circuit arrangements therefor |
US8908879B2 (en) | 2012-05-23 | 2014-12-09 | Sonos, Inc. | Audio content auditioning |
US9633368B2 (en) | 2012-05-25 | 2017-04-25 | Apple Inc. | Content ranking and serving on a multi-user device or interface |
CN103456332A (zh) | 2012-05-28 | 2013-12-18 | 富泰华工业(深圳)有限公司 | 音频播放装置及音量调节方法 |
US20130324031A1 (en) | 2012-05-31 | 2013-12-05 | Nokia Corporation | Dynamic allocation of audio channel for surround sound systems |
US9060224B1 (en) | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
EP2856690B1 (en) | 2012-06-01 | 2020-12-02 | BlackBerry Limited | Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems |
US9997069B2 (en) | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US8903526B2 (en) | 2012-06-06 | 2014-12-02 | Sonos, Inc. | Device playback failure recovery and redistribution |
US9881616B2 (en) | 2012-06-06 | 2018-01-30 | Qualcomm Incorporated | Method and systems having improved speech recognition |
US9301073B2 (en) | 2012-06-08 | 2016-03-29 | Apple Inc. | Systems and methods for determining the condition of multiple microphones |
US9142215B2 (en) | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US9031255B2 (en) | 2012-06-15 | 2015-05-12 | Sonos, Inc. | Systems, methods, apparatus, and articles of manufacture to provide low-latency audio |
US10354650B2 (en) | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US9674587B2 (en) | 2012-06-26 | 2017-06-06 | Sonos, Inc. | Systems and methods for networked music playback including remote add to queue |
US9706323B2 (en) | 2014-09-09 | 2017-07-11 | Sonos, Inc. | Playback device calibration |
US9137564B2 (en) | 2012-06-28 | 2015-09-15 | Sonos, Inc. | Shift to corresponding media in a playback queue |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9384737B2 (en) | 2012-06-29 | 2016-07-05 | Microsoft Technology Licensing, Llc | Method and device for adjusting sound levels of sources based on sound source priority |
US20140006825A1 (en) | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US20140003635A1 (en) | 2012-07-02 | 2014-01-02 | Qualcomm Incorporated | Audio signal processing device calibration |
US9497544B2 (en) | 2012-07-02 | 2016-11-15 | Qualcomm Incorporated | Systems and methods for surround sound echo reduction |
US9615171B1 (en) | 2012-07-02 | 2017-04-04 | Amazon Technologies, Inc. | Transformation inversion to reduce the effect of room acoustics |
KR101972955B1 (ko) | 2012-07-03 | 2019-04-26 | 삼성전자 주식회사 | 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치 |
US9536528B2 (en) | 2012-07-03 | 2017-01-03 | Google Inc. | Determining hotword suitability |
US8972762B2 (en) | 2012-07-11 | 2015-03-03 | Blackberry Limited | Computing devices and methods for resetting inactivity timers on computing devices |
US8983844B1 (en) | 2012-07-31 | 2015-03-17 | Amazon Technologies, Inc. | Transmission of noise parameters for improving automatic speech recognition |
US8831957B2 (en) | 2012-08-01 | 2014-09-09 | Google Inc. | Speech recognition models based on location indicia |
DE112013007782B3 (de) | 2012-08-03 | 2022-02-17 | Semiconductor Energy Laboratory Co., Ltd. | Lichtemittierende Vorrichtung |
US8930005B2 (en) | 2012-08-07 | 2015-01-06 | Sonos, Inc. | Acoustic signatures in a playback system |
EP3462452A1 (en) | 2012-08-24 | 2019-04-03 | Oticon A/s | Noise estimation for use with noise reduction and echo cancellation in personal communication |
US9532153B2 (en) | 2012-08-29 | 2016-12-27 | Bang & Olufsen A/S | Method and a system of providing information to a user |
US9088336B2 (en) | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
US20140075311A1 (en) | 2012-09-11 | 2014-03-13 | Jesse William Boettcher | Methods and apparatus for controlling audio volume on an electronic device |
US20140075306A1 (en) | 2012-09-12 | 2014-03-13 | Randy Rega | Music search and retrieval system |
US8798598B2 (en) | 2012-09-13 | 2014-08-05 | Alain Rossmann | Method and system for screencasting Smartphone video game software to online social networks |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
US8983383B1 (en) | 2012-09-25 | 2015-03-17 | Rawles Llc | Providing hands-free service to multiple devices |
US9319816B1 (en) | 2012-09-26 | 2016-04-19 | Amazon Technologies, Inc. | Characterizing environment using ultrasound pilot tones |
JP2014071138A (ja) | 2012-09-27 | 2014-04-21 | Xing Inc | カラオケ装置 |
US8725125B2 (en) | 2012-09-28 | 2014-05-13 | United Video Properties, Inc. | Systems and methods for controlling audio playback on portable devices with vehicle equipment |
KR102091236B1 (ko) | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
WO2014055312A1 (en) | 2012-10-02 | 2014-04-10 | Mh Acoustics, Llc | Earphones having configurable microphone arrays |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US8484025B1 (en) | 2012-10-04 | 2013-07-09 | Google Inc. | Mapping an audio utterance to an action using a classifier |
CN102902253B (zh) | 2012-10-09 | 2015-07-15 | 鸿富锦精密工业(深圳)有限公司 | 具有语音控制功能的智能开关及智能控制系统 |
US20140108010A1 (en) | 2012-10-11 | 2014-04-17 | Intermec Ip Corp. | Voice-enabled documents for facilitating operational procedures |
CA2888016C (en) | 2012-10-15 | 2022-05-31 | Msi Dfat Llc | Direct field acoustic testing in a semi-reverberant enclosure |
US9232310B2 (en) | 2012-10-15 | 2016-01-05 | Nokia Technologies Oy | Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones |
DE102012020271A1 (de) | 2012-10-17 | 2014-04-17 | Wolfgang Klippel | Anordnung und Verfahren zur Steuerung von Wandlern |
KR101978688B1 (ko) | 2012-10-22 | 2019-05-15 | 삼성전자주식회사 | 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법 |
US9319445B2 (en) | 2012-10-22 | 2016-04-19 | Spotify Ab | Systems and methods for pre-fetching media content |
WO2014064324A1 (en) | 2012-10-26 | 2014-05-01 | Nokia Corporation | Multi-device speech recognition |
KR20140054643A (ko) | 2012-10-29 | 2014-05-09 | 삼성전자주식회사 | 음성인식장치 및 음성인식방법 |
US9584642B2 (en) | 2013-03-12 | 2017-02-28 | Google Technology Holdings LLC | Apparatus with adaptive acoustic echo control for speakerphone mode |
US10381001B2 (en) | 2012-10-30 | 2019-08-13 | Google Technology Holdings LLC | Voice control user interface during low-power mode |
US8761349B2 (en) | 2012-10-31 | 2014-06-24 | Citrix Systems, Inc. | Systems and methods of monitoring performance of acoustic echo cancellation |
US9275637B1 (en) | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US9275642B2 (en) | 2012-11-13 | 2016-03-01 | Unified Computer Intelligence Corporation | Voice-operated internet-ready ubiquitous computing device and method thereof |
CN102999161B (zh) | 2012-11-13 | 2016-03-02 | 科大讯飞股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
US9685171B1 (en) | 2012-11-20 | 2017-06-20 | Amazon Technologies, Inc. | Multiple-stage adaptive filtering of audio signals |
US9070367B1 (en) | 2012-11-26 | 2015-06-30 | Amazon Technologies, Inc. | Local speech recognition of frequent utterances |
US20140149118A1 (en) | 2012-11-28 | 2014-05-29 | Lg Electronics Inc. | Apparatus and method for driving electric device using speech recognition |
US9131298B2 (en) | 2012-11-28 | 2015-09-08 | Qualcomm Incorporated | Constrained dynamic amplitude panning in collaborative sound systems |
WO2014142702A1 (en) | 2013-03-15 | 2014-09-18 | Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" | Selective speech recognition for chat and digital personal assistant systems |
US9203045B2 (en) | 2012-11-29 | 2015-12-01 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
WO2014088588A1 (en) | 2012-12-07 | 2014-06-12 | Empire Technology Development Llc | Personal assistant context building |
US20140161263A1 (en) | 2012-12-10 | 2014-06-12 | Microsoft Corporation | Facilitating recognition of real-time content |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9226071B2 (en) | 2012-12-13 | 2015-12-29 | Maxim Integrated Products, Inc. | Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker |
US9607046B2 (en) | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9300910B2 (en) | 2012-12-14 | 2016-03-29 | Biscotti Inc. | Video mail capture, processing and distribution |
US9271111B2 (en) | 2012-12-14 | 2016-02-23 | Amazon Technologies, Inc. | Response endpoint selection |
WO2014098477A1 (ko) | 2012-12-18 | 2014-06-26 | 삼성전자 주식회사 | 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치 |
US9047857B1 (en) | 2012-12-19 | 2015-06-02 | Rawles Llc | Voice commands for transitioning between device states |
US9098467B1 (en) | 2012-12-19 | 2015-08-04 | Rawles Llc | Accepting voice commands based on user identity |
WO2014102722A1 (en) | 2012-12-26 | 2014-07-03 | Sia Technology Ltd. | Device, system, and method of controlling electronic devices via thought |
US9620115B2 (en) | 2013-01-03 | 2017-04-11 | Telenav, Inc. | Content delivery system with barge-in mechanism and method of operation thereof |
KR102051588B1 (ko) | 2013-01-07 | 2019-12-03 | 삼성전자주식회사 | 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치 |
US9318125B2 (en) | 2013-01-15 | 2016-04-19 | Intel Deutschland Gmbh | Noise reduction devices and noise reduction methods |
JP2014137590A (ja) | 2013-01-18 | 2014-07-28 | Yoji Fukinuki | 音楽コンテンツ配信方法 |
US9646605B2 (en) | 2013-01-22 | 2017-05-09 | Interactive Intelligence Group, Inc. | False alarm reduction in speech recognition systems using contextual information |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US20140215332A1 (en) | 2013-01-31 | 2014-07-31 | Hewlett-Packard Development Company, Lp | Virtual microphone selection corresponding to a set of audio source devices |
US9818407B1 (en) | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
TWI593294B (zh) | 2013-02-07 | 2017-07-21 | 晨星半導體股份有限公司 | 收音系統與相關方法 |
DE112014000709B4 (de) | 2013-02-07 | 2021-12-30 | Apple Inc. | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten |
US9300266B2 (en) | 2013-02-12 | 2016-03-29 | Qualcomm Incorporated | Speaker equalization for mobile devices |
US9237384B2 (en) | 2013-02-14 | 2016-01-12 | Sonos, Inc. | Automatic configuration of household playback devices |
US9842489B2 (en) | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US9172747B2 (en) | 2013-02-25 | 2015-10-27 | Artificial Solutions Iberia SL | System and methods for virtual assistant networks |
CN105308681B (zh) | 2013-02-26 | 2019-02-12 | 皇家飞利浦有限公司 | 用于生成语音信号的方法和装置 |
US9195432B2 (en) | 2013-02-26 | 2015-11-24 | Sonos, Inc. | Pre-caching of audio content |
CN104010251B (zh) | 2013-02-27 | 2018-06-19 | 晨星半导体股份有限公司 | 收音系统与相关方法 |
US10395651B2 (en) | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
US9460715B2 (en) | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
US20140258292A1 (en) | 2013-03-05 | 2014-09-11 | Clip Interactive, Inc. | Apparatus, system, and method for integrating content and content services |
US9275625B2 (en) * | 2013-03-06 | 2016-03-01 | Qualcomm Incorporated | Content based noise suppression |
JP6429465B2 (ja) | 2013-03-07 | 2018-11-28 | 株式会社半導体エネルギー研究所 | 装置及びその作製方法 |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
WO2014138489A1 (en) | 2013-03-07 | 2014-09-12 | Tiskerling Dynamics Llc | Room and program responsive loudspeaker system |
US9161126B2 (en) | 2013-03-08 | 2015-10-13 | Cirrus Logic, Inc. | Systems and methods for protecting a speaker |
JP6211677B2 (ja) | 2013-03-11 | 2017-10-11 | アップル インコーポレイテッド | ラウドスピーカの指向性範囲にまたがる音色の一定性 |
CN104053088A (zh) | 2013-03-11 | 2014-09-17 | 联想(北京)有限公司 | 一种麦克风阵列调整方法、麦克风阵列及电子设备 |
TWI533686B (zh) | 2013-03-11 | 2016-05-11 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體 |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
US9173021B2 (en) | 2013-03-12 | 2015-10-27 | Google Technology Holdings LLC | Method and device for adjusting an audio beam orientation based on device location |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
WO2014165032A1 (en) | 2013-03-12 | 2014-10-09 | Aawtend, Inc. | Integrated sensor-array processor |
US11393461B2 (en) * | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
KR20140111859A (ko) | 2013-03-12 | 2014-09-22 | 삼성전자주식회사 | 콘텐트 공유 방법 및 이를 위한 디바이스 |
CN105009203A (zh) | 2013-03-12 | 2015-10-28 | 纽昂斯通讯公司 | 用于检测语音命令的方法和装置 |
KR101571338B1 (ko) | 2013-03-13 | 2015-11-24 | 삼성전자주식회사 | 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치 |
US9060052B2 (en) | 2013-03-13 | 2015-06-16 | Accusonus S.A. | Single channel, binaural and multi-channel dereverberation |
US20140274185A1 (en) | 2013-03-14 | 2014-09-18 | Aliphcom | Intelligence device connection for wireless media ecosystem |
KR102152754B1 (ko) | 2013-03-14 | 2020-09-07 | 삼성전자주식회사 | 블루루스 디바이스에서 통신 연결 방법 및 그 장치 |
JP6013951B2 (ja) | 2013-03-14 | 2016-10-25 | 本田技研工業株式会社 | 環境音検索装置、環境音検索方法 |
KR101764660B1 (ko) | 2013-03-14 | 2017-08-03 | 애플 인크. | 스피커 및 핸드헬드 청취 디바이스를 사용한 적응적 공간 등화 |
US20140278933A1 (en) | 2013-03-15 | 2014-09-18 | F. Gavin McMillan | Methods and apparatus to measure audience engagement with media |
US9854081B2 (en) | 2013-03-15 | 2017-12-26 | Apple Inc. | Volume control for mobile device using a wireless device |
US9626436B2 (en) | 2013-03-15 | 2017-04-18 | Spotify Ab | Systems, methods, and computer readable medium for generating playlists |
WO2014149050A1 (en) | 2013-03-21 | 2014-09-25 | Nuance Communications, Inc. | System and method for identifying suboptimal microphone performance |
KR102173936B1 (ko) | 2013-03-26 | 2020-11-04 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기, 및 조명 장치 |
JP6300589B2 (ja) | 2013-04-04 | 2018-03-28 | 株式会社半導体エネルギー研究所 | 半導体装置の作製方法 |
US9462115B2 (en) | 2013-04-04 | 2016-10-04 | James S. Rand | Unified communications system and method |
JP6198432B2 (ja) | 2013-04-09 | 2017-09-20 | 小島プレス工業株式会社 | 音声認識制御装置 |
WO2014172299A1 (en) | 2013-04-15 | 2014-10-23 | Chacha Search, Inc. | Method and system of increasing user interaction |
US9501533B2 (en) | 2013-04-16 | 2016-11-22 | Sonos, Inc. | Private queue for a media playback system |
US9875494B2 (en) | 2013-04-16 | 2018-01-23 | Sri International | Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant |
US9304736B1 (en) | 2013-04-18 | 2016-04-05 | Amazon Technologies, Inc. | Voice controlled assistant with non-verbal code entry |
JP6416752B2 (ja) | 2013-04-19 | 2018-10-31 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 家電機器の制御方法、家電機器制御システム、及びゲートウェイ |
US9936290B2 (en) | 2013-05-03 | 2018-04-03 | Qualcomm Incorporated | Multi-channel echo cancellation and noise suppression |
US9892729B2 (en) | 2013-05-07 | 2018-02-13 | Qualcomm Incorporated | Method and apparatus for controlling voice activation |
KR102230139B1 (ko) | 2013-05-17 | 2021-03-18 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 조명 장치, 발광 장치, 및 전자 기기 |
WO2014189486A1 (en) | 2013-05-20 | 2014-11-27 | Intel Corporation | Natural human-computer interaction for virtual personal assistant systems |
US9472201B1 (en) | 2013-05-22 | 2016-10-18 | Google Inc. | Speaker localization by means of tactile input |
US9390708B1 (en) | 2013-05-28 | 2016-07-12 | Amazon Technologies, Inc. | Low latency and memory efficient keywork spotting |
US20140358535A1 (en) | 2013-05-28 | 2014-12-04 | Samsung Electronics Co., Ltd. | Method of executing voice recognition of electronic device and electronic device using the same |
US9215545B2 (en) | 2013-05-31 | 2015-12-15 | Bose Corporation | Sound stage controller for a near-field speaker-based audio system |
US20140357248A1 (en) | 2013-06-03 | 2014-12-04 | Ford Global Technologies, Llc | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle |
US20140365225A1 (en) | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
US9438193B2 (en) | 2013-06-05 | 2016-09-06 | Sonos, Inc. | Satellite volume control |
US9654073B2 (en) | 2013-06-07 | 2017-05-16 | Sonos, Inc. | Group volume control |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
DE112014002749B4 (de) | 2013-06-09 | 2021-08-26 | Apple Inc. | Bluetooth-Alarmbenachrichtigungsdienst |
US9787273B2 (en) | 2013-06-13 | 2017-10-10 | Google Technology Holdings LLC | Smart volume control of device audio output based on received audio input |
US8953778B2 (en) | 2013-06-17 | 2015-02-10 | Avaya Inc. | Real-time intelligent mute interactive features |
US9066048B2 (en) | 2013-06-17 | 2015-06-23 | Spotify Ab | System and method for switching between audio content while navigating through video streams |
US9324322B1 (en) | 2013-06-18 | 2016-04-26 | Amazon Technologies, Inc. | Automatic volume attenuation for speech enabled devices |
US9494683B1 (en) | 2013-06-18 | 2016-11-15 | Amazon Technologies, Inc. | Audio-based gesture detection |
US9311298B2 (en) | 2013-06-21 | 2016-04-12 | Microsoft Technology Licensing, Llc | Building conversational understanding systems using a toolset |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9640179B1 (en) | 2013-06-27 | 2017-05-02 | Amazon Technologies, Inc. | Tailoring beamforming techniques to environments |
US9747899B2 (en) | 2013-06-27 | 2017-08-29 | Amazon Technologies, Inc. | Detecting self-generated wake expressions |
WO2014210429A1 (en) | 2013-06-28 | 2014-12-31 | Harman International Industries, Inc. | Wireless control of linked devices |
US9298415B2 (en) | 2013-07-09 | 2016-03-29 | Sonos, Inc. | Systems and methods to provide play/pause content |
US20150019201A1 (en) | 2013-07-09 | 2015-01-15 | Stanley F. Schoenbach | Real-time interpreting systems and methods |
US9396727B2 (en) | 2013-07-10 | 2016-07-19 | GM Global Technology Operations LLC | Systems and methods for spoken dialog service arbitration |
US9293480B2 (en) | 2013-07-10 | 2016-03-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and display device including the semiconductor device |
CN110096253B (zh) | 2013-07-11 | 2022-08-30 | 英特尔公司 | 利用相同的音频输入的设备唤醒和说话者验证 |
DE102014109122A1 (de) | 2013-07-12 | 2015-01-15 | Gm Global Technology Operations, Llc | Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen |
US9426598B2 (en) | 2013-07-15 | 2016-08-23 | Dts, Inc. | Spatial calibration of surround sound systems including listener position estimation |
US9445196B2 (en) | 2013-07-24 | 2016-09-13 | Mh Acoustics Llc | Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation |
US9431014B2 (en) | 2013-07-25 | 2016-08-30 | Haier Us Appliance Solutions, Inc. | Intelligent placement of appliance response to voice command |
US9772994B2 (en) | 2013-07-25 | 2017-09-26 | Intel Corporation | Self-learning statistical natural language processing for automatic production of virtual personal assistants |
US9666187B1 (en) | 2013-07-25 | 2017-05-30 | Google Inc. | Model for enabling service providers to address voice-activated commands |
WO2015017303A1 (en) | 2013-07-31 | 2015-02-05 | Motorola Mobility Llc | Method and apparatus for adjusting voice recognition processing based on noise characteristics |
US10186262B2 (en) | 2013-07-31 | 2019-01-22 | Microsoft Technology Licensing, Llc | System with multiple simultaneous speech recognizers |
US9418651B2 (en) | 2013-07-31 | 2016-08-16 | Google Technology Holdings LLC | Method and apparatus for mitigating false accepts of trigger phrases |
US9548047B2 (en) | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
DE102013012811B4 (de) | 2013-08-01 | 2024-02-22 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler |
US9565497B2 (en) | 2013-08-01 | 2017-02-07 | Caavo Inc. | Enhancing audio using a mobile device |
US10873997B2 (en) | 2013-08-01 | 2020-12-22 | Fong-Min Chang | Voice controlled artificial intelligent smart illumination device |
EP3036594B1 (en) | 2013-08-21 | 2021-05-26 | Ademco Inc. | Devices and methods for interacting with an hvac controller |
EP2862164B1 (en) | 2013-08-23 | 2017-05-31 | Nuance Communications, Inc. | Multiple pass automatic speech recognition |
US9190043B2 (en) | 2013-08-27 | 2015-11-17 | Bose Corporation | Assisting conversation in noisy environments |
US9514747B1 (en) | 2013-08-28 | 2016-12-06 | Amazon Technologies, Inc. | Reducing speech recognition latency |
TWI520127B (zh) | 2013-08-28 | 2016-02-01 | 晨星半導體股份有限公司 | 應用於音訊裝置的控制器與相關的操作方法 |
KR20160048960A (ko) | 2013-08-30 | 2016-05-04 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템 |
JP6037026B2 (ja) | 2013-09-11 | 2016-11-30 | 株式会社デンソー | 音声出力制御装置、プログラムおよび記録媒体 |
US9672812B1 (en) | 2013-09-18 | 2017-06-06 | Amazon Technologies, Inc. | Qualifying trigger expressions in speech-based systems |
US9516081B2 (en) | 2013-09-20 | 2016-12-06 | Amazon Technologies, Inc. | Reduced latency electronic content system |
US9848260B2 (en) | 2013-09-24 | 2017-12-19 | Nuance Communications, Inc. | Wearable communication enhancement device |
US9668052B2 (en) | 2013-09-25 | 2017-05-30 | Google Technology Holdings LLC | Audio routing system for routing audio data to and from a mobile device |
US9443527B1 (en) | 2013-09-27 | 2016-09-13 | Amazon Technologies, Inc. | Speech recognition capability generation and control |
US9355555B2 (en) | 2013-09-27 | 2016-05-31 | Sonos, Inc. | System and method for issuing commands in a media playback system |
CN103546616A (zh) | 2013-09-30 | 2014-01-29 | 深圳市同洲电子股份有限公司 | 一种调节音量的方法及装置 |
US9288596B2 (en) | 2013-09-30 | 2016-03-15 | Sonos, Inc. | Coordinator device for paired or consolidated players |
KR102114219B1 (ko) | 2013-10-10 | 2020-05-25 | 삼성전자주식회사 | 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치 |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US9633671B2 (en) | 2013-10-18 | 2017-04-25 | Apple Inc. | Voice quality enhancement techniques, speech recognition techniques, and related systems |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
TWI642170B (zh) | 2013-10-18 | 2018-11-21 | 半導體能源研究所股份有限公司 | 顯示裝置及電子裝置 |
US9818061B1 (en) | 2013-10-22 | 2017-11-14 | Lumin, LLC | Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment |
WO2015060867A1 (en) | 2013-10-25 | 2015-04-30 | Intel Corporation | Techniques for preventing voice replay attacks |
EP2869599B1 (en) | 2013-11-05 | 2020-10-21 | Oticon A/s | A binaural hearing assistance system comprising a database of head related transfer functions |
JP2015090570A (ja) | 2013-11-06 | 2015-05-11 | ソニー株式会社 | 情報処理装置および制御方法 |
US10311482B2 (en) | 2013-11-11 | 2019-06-04 | At&T Intellectual Property I, Lp | Method and apparatus for adjusting a digital assistant persona |
US8775191B1 (en) | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
JP6236303B2 (ja) | 2013-11-26 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 制御装置、制御方法およびプログラム |
US9373321B2 (en) | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US9698999B2 (en) | 2013-12-02 | 2017-07-04 | Amazon Technologies, Inc. | Natural language control of secondary device |
US9704478B1 (en) | 2013-12-02 | 2017-07-11 | Amazon Technologies, Inc. | Audio output masking for improved automatic speech recognition |
CN104143326B (zh) | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US8719039B1 (en) | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
US10720153B2 (en) * | 2013-12-13 | 2020-07-21 | Harman International Industries, Incorporated | Name-sensitive listening device |
US10055190B2 (en) | 2013-12-16 | 2018-08-21 | Amazon Technologies, Inc. | Attribute-based audio channel arbitration |
US9378651B2 (en) | 2013-12-17 | 2016-06-28 | Google Inc. | Audio book smart pause |
US10224056B1 (en) | 2013-12-17 | 2019-03-05 | Amazon Technologies, Inc. | Contingent device actions during loss of network connectivity |
US9721570B1 (en) | 2013-12-17 | 2017-08-01 | Amazon Technologies, Inc. | Outcome-oriented dialogs on a speech recognition platform |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
CN105723451B (zh) | 2013-12-20 | 2020-02-28 | 英特尔公司 | 从低功率始终侦听模式到高功率语音识别模式的转换 |
US20150179181A1 (en) | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
US9899021B1 (en) | 2013-12-20 | 2018-02-20 | Amazon Technologies, Inc. | Stochastic modeling of user interactions with a detection system |
US9099974B2 (en) | 2013-12-20 | 2015-08-04 | Vmware, Inc. | Volume redirection |
EP2890160B1 (en) | 2013-12-24 | 2019-08-14 | Nxp B.V. | Loudspeaker controller |
US9301077B2 (en) | 2014-01-02 | 2016-03-29 | Harman International Industries, Incorporated | Context-based audio tuning |
US9443516B2 (en) | 2014-01-09 | 2016-09-13 | Honeywell International Inc. | Far-field speech recognition systems and methods |
US8938394B1 (en) | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
EP3092824B1 (en) | 2014-01-10 | 2017-11-01 | Dolby Laboratories Licensing Corporation | Calibration of virtual height speakers using programmable portable devices |
US9300647B2 (en) | 2014-01-15 | 2016-03-29 | Sonos, Inc. | Software application and zones |
US9288597B2 (en) | 2014-01-20 | 2016-03-15 | Sony Corporation | Distributed wireless speaker system with automatic configuration determination when new speakers are added |
WO2015112137A1 (en) | 2014-01-22 | 2015-07-30 | Pearl Capital Developments Llc | Coordinated hand-off of audio data transmission |
US9356882B2 (en) | 2014-02-04 | 2016-05-31 | Printeron Inc. | Streamlined system for the transmission of network resource data |
US9443876B2 (en) | 2014-02-05 | 2016-09-13 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module |
US9652532B2 (en) | 2014-02-06 | 2017-05-16 | Sr Homedics, Llc | Methods for operating audio speaker systems |
US9929368B2 (en) | 2014-02-06 | 2018-03-27 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, lighting device, and electronic appliance |
TWI658597B (zh) | 2014-02-07 | 2019-05-01 | 日商半導體能源研究所股份有限公司 | 半導體裝置 |
US9318112B2 (en) | 2014-02-14 | 2016-04-19 | Google Inc. | Recognizing speech in the presence of additional audio |
JP6289936B2 (ja) | 2014-02-26 | 2018-03-07 | 株式会社東芝 | 音源方向推定装置、音源方向推定方法およびプログラム |
FR3018025B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
FR3018024B1 (fr) | 2014-02-26 | 2016-03-18 | Devialet | Dispositif de commande d'un haut-parleur |
US9408008B2 (en) | 2014-02-28 | 2016-08-02 | Sonos, Inc. | Playback zone representations |
WO2015133022A1 (ja) | 2014-03-03 | 2015-09-11 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10015593B2 (en) | 2014-03-03 | 2018-07-03 | University Of Utah | Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers |
US9489171B2 (en) | 2014-03-04 | 2016-11-08 | Microsoft Technology Licensing, Llc | Voice-command suggestions based on user identity |
US9679054B2 (en) | 2014-03-05 | 2017-06-13 | Sonos, Inc. | Webpage media playback |
US10599287B2 (en) | 2014-03-11 | 2020-03-24 | Sonos, Inc. | Group volume control |
US9640669B2 (en) | 2014-03-13 | 2017-05-02 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
US9226062B2 (en) | 2014-03-18 | 2015-12-29 | Cisco Technology, Inc. | Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device |
US10514747B2 (en) | 2014-03-24 | 2019-12-24 | Silicon Laboratories Inc. | Low-power communication apparatus with wakeup detection and associated methods |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
US9648564B1 (en) | 2014-03-26 | 2017-05-09 | Amazon Technologies, Inc. | Wake-up management for mobile devices |
US9916839B1 (en) | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
US9431021B1 (en) | 2014-03-27 | 2016-08-30 | Amazon Technologies, Inc. | Device grouping for audio based interactivity |
US9547468B2 (en) | 2014-03-31 | 2017-01-17 | Microsoft Technology Licensing, Llc | Client-side personal voice web navigation |
KR102146462B1 (ko) | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US8874448B1 (en) | 2014-04-01 | 2014-10-28 | Google Inc. | Attention-based dynamic audio level adjustment |
CN104978965B (zh) | 2014-04-07 | 2019-04-26 | 三星电子株式会社 | 电子装置及利用电子装置和服务器的语音识别执行方法 |
US9560437B2 (en) | 2014-04-08 | 2017-01-31 | Doppler Labs, Inc. | Time heuristic audio control |
US9510094B2 (en) | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
DE102014005381B3 (de) | 2014-04-11 | 2014-12-11 | Wolfgang Klippel | Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler |
US20150302856A1 (en) | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US20150334471A1 (en) | 2014-05-15 | 2015-11-19 | Echostar Technologies L.L.C. | Multiple simultaneous audio video data decoding |
WO2015178950A1 (en) | 2014-05-19 | 2015-11-26 | Tiskerling Dynamics Llc | Directivity optimized sound reproduction |
EP3146796B1 (en) | 2014-05-23 | 2021-10-27 | Samsung Electronics Co., Ltd. | Method and apparatus for providing notification |
US9860289B2 (en) | 2014-05-23 | 2018-01-02 | Radeeus, Inc. | Multimedia digital content retrieval, matching, and syncing systems and methods of using the same |
US9900723B1 (en) | 2014-05-28 | 2018-02-20 | Apple Inc. | Multi-channel loudspeaker matching using variable directivity |
TWI849490B (zh) | 2014-05-30 | 2024-07-21 | 日商半導體能源研究所股份有限公司 | 發光元件,發光裝置,電子裝置以及照明裝置 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US10318016B2 (en) | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
US9720642B2 (en) | 2014-06-04 | 2017-08-01 | Sonos, Inc. | Prioritizing media content requests |
US20150355818A1 (en) | 2014-06-04 | 2015-12-10 | Sonos, Inc. | Continuous Playback Queue |
US10624612B2 (en) | 2014-06-05 | 2020-04-21 | Chikayoshi Sumi | Beamforming method, measurement and imaging instruments, and communication instruments |
US9615170B2 (en) | 2014-06-09 | 2017-04-04 | Harman International Industries, Inc. | Approach for partially preserving music in the presence of intelligible speech |
CN104092936B (zh) | 2014-06-12 | 2017-01-04 | 小米科技有限责任公司 | 自动对焦方法及装置 |
US20150363061A1 (en) | 2014-06-13 | 2015-12-17 | Autonomic Controls, Inc. | System and method for providing related digital content |
US9767159B2 (en) | 2014-06-13 | 2017-09-19 | Google Inc. | Ranking search results |
US9589556B2 (en) | 2014-06-19 | 2017-03-07 | Yang Gao | Energy adjustment of acoustic echo replica signal for speech enhancement |
US9520139B2 (en) | 2014-06-19 | 2016-12-13 | Yang Gao | Post tone suppression for speech enhancement |
US9766702B2 (en) | 2014-06-19 | 2017-09-19 | Apple Inc. | User detection by a computing device |
US20150373100A1 (en) | 2014-06-19 | 2015-12-24 | Pavel KRAVETS | Context sharing between different clients |
US9697828B1 (en) | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
US10152987B2 (en) | 2014-06-23 | 2018-12-11 | Google Llc | Remote invocation of mobile device actions |
US9632748B2 (en) | 2014-06-24 | 2017-04-25 | Google Inc. | Device designation for audio input monitoring |
US9335819B1 (en) | 2014-06-26 | 2016-05-10 | Audible, Inc. | Automatic creation of sleep bookmarks in content items |
US9368105B1 (en) * | 2014-06-26 | 2016-06-14 | Amazon Technologies, Inc. | Preventing false wake word detections with a voice-controlled device |
US9639854B2 (en) | 2014-06-26 | 2017-05-02 | Nuance Communications, Inc. | Voice-controlled information exchange platform, such as for providing information to supplement advertising |
US9691379B1 (en) | 2014-06-26 | 2017-06-27 | Amazon Technologies, Inc. | Selecting from multiple content sources |
US9398392B2 (en) | 2014-06-30 | 2016-07-19 | Microsoft Technology Licensing, Llc | Audio calibration and adjustment |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9420331B2 (en) | 2014-07-07 | 2016-08-16 | Google Inc. | Method and system for categorizing detected motion events |
US11330100B2 (en) | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
US9374634B2 (en) | 2014-07-10 | 2016-06-21 | Nxp B.V. | System for controlling displacement of a loudspeaker |
US9467737B2 (en) | 2014-07-14 | 2016-10-11 | Sonos, Inc. | Zone group control |
JP2016024212A (ja) | 2014-07-16 | 2016-02-08 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9671997B2 (en) | 2014-07-23 | 2017-06-06 | Sonos, Inc. | Zone grouping |
US10209947B2 (en) | 2014-07-23 | 2019-02-19 | Sonos, Inc. | Device grouping |
US9263042B1 (en) | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
KR20160017253A (ko) | 2014-08-01 | 2016-02-16 | 삼성전자주식회사 | 디스플레이 구동용 집적 회로 칩 |
US9874997B2 (en) | 2014-08-08 | 2018-01-23 | Sonos, Inc. | Social playback queues |
US9548066B2 (en) | 2014-08-11 | 2017-01-17 | Amazon Technologies, Inc. | Voice application architecture |
US9769552B2 (en) | 2014-08-19 | 2017-09-19 | Apple Inc. | Method and apparatus for estimating talker distance |
US20160055847A1 (en) | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
JP6118838B2 (ja) | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质 |
KR20160026317A (ko) | 2014-08-29 | 2016-03-09 | 삼성전자주식회사 | 음성 녹음 방법 및 장치 |
US9560050B2 (en) | 2014-09-08 | 2017-01-31 | At&T Intellectual Property I, L.P | System and method to share a resource or a capability of a device |
US9910634B2 (en) | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9354687B2 (en) | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9747011B2 (en) | 2014-09-16 | 2017-08-29 | Google Inc. | Continuation of playback of media content by different output devices |
US10645130B2 (en) | 2014-09-24 | 2020-05-05 | Sonos, Inc. | Playback updates |
US9681228B2 (en) | 2014-09-30 | 2017-06-13 | Apple Inc. | Capacitive position sensing for transducers |
JP6624368B2 (ja) | 2014-09-30 | 2019-12-25 | パナソニックIpマネジメント株式会社 | 接客モニタリングシステム及び接客モニタリング方法 |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
GB2525051B (en) | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US9641919B1 (en) | 2014-09-30 | 2017-05-02 | Amazon Technologies, Inc. | Audio assemblies for electronic devices |
US10235996B2 (en) | 2014-10-01 | 2019-03-19 | XBrain, Inc. | Voice and connection platform |
US10817672B2 (en) | 2014-10-01 | 2020-10-27 | Nuance Communications, Inc. | Natural language understanding (NLU) processing based on user-specified interests |
US9318107B1 (en) | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
KR102287943B1 (ko) | 2014-10-14 | 2021-08-09 | 삼성전자주식회사 | 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법 |
EP3010251B1 (en) | 2014-10-15 | 2019-11-13 | Nxp B.V. | Audio system |
US20160162469A1 (en) | 2014-10-23 | 2016-06-09 | Audience, Inc. | Dynamic Local ASR Vocabulary |
US9788047B2 (en) | 2014-10-30 | 2017-10-10 | Verizon Patent And Licensing Inc. | Media guide user interface systems and methods |
US9530408B2 (en) | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US10368121B2 (en) | 2014-11-07 | 2019-07-30 | Roku, Inc. | System and method for collecting data |
US9699550B2 (en) | 2014-11-12 | 2017-07-04 | Qualcomm Incorporated | Reduced microphone power-up latency |
US20160134982A1 (en) | 2014-11-12 | 2016-05-12 | Harman International Industries, Inc. | System and method for estimating the displacement of a speaker cone |
JP2016095383A (ja) | 2014-11-14 | 2016-05-26 | 株式会社ATR−Trek | 音声認識クライアント装置及びサーバ型音声認識装置 |
US10116748B2 (en) | 2014-11-20 | 2018-10-30 | Microsoft Technology Licensing, Llc | Vehicle-based multi-modal interface |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
KR102299330B1 (ko) | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US10192549B2 (en) | 2014-11-28 | 2019-01-29 | Microsoft Technology Licensing, Llc | Extending digital personal assistant action providers |
US9812126B2 (en) * | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
WO2016082046A1 (en) | 2014-11-28 | 2016-06-02 | Audera Acoustics Inc. | High displacement acoustic transducer systems |
US10126406B2 (en) | 2014-12-02 | 2018-11-13 | Qualcomm Incorporated | Method and apparatus for performing ultrasonic presence detection |
US9775113B2 (en) | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
CN107209549B (zh) | 2014-12-11 | 2020-04-17 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
CN104538030A (zh) | 2014-12-11 | 2015-04-22 | 科大讯飞股份有限公司 | 一种可以通过语音控制家电的控制系统与方法 |
US9779725B2 (en) | 2014-12-11 | 2017-10-03 | Mediatek Inc. | Voice wakeup detecting device and method |
US9813812B2 (en) | 2014-12-12 | 2017-11-07 | Analog Devices Global | Method of controlling diaphragm excursion of electrodynamic loudspeakers |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
CN104575504A (zh) | 2014-12-24 | 2015-04-29 | 上海师范大学 | 采用声纹和语音识别进行个性化电视语音唤醒的方法 |
US9560441B1 (en) | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104635539A (zh) | 2014-12-26 | 2015-05-20 | 东莞市掌商信息科技有限公司 | 一种智能硬件远程语音安全控制方法及其系统 |
US10572810B2 (en) | 2015-01-07 | 2020-02-25 | Microsoft Technology Licensing, Llc | Managing user interaction for input understanding determinations |
US9934406B2 (en) | 2015-01-08 | 2018-04-03 | Microsoft Technology Licensing, Llc | Protecting private information in input understanding system |
US9584915B2 (en) | 2015-01-19 | 2017-02-28 | Microsoft Technology Licensing, Llc | Spatial audio with remote speakers |
US20160210110A1 (en) | 2015-01-21 | 2016-07-21 | Ford Global Technologies, Llc | Audio synchronization between vehicles and mobile devices |
US9947313B2 (en) | 2015-01-26 | 2018-04-17 | William Drewes | Method for substantial ongoing cumulative voice recognition error reduction |
KR102351366B1 (ko) | 2015-01-26 | 2022-01-14 | 삼성전자주식회사 | 음성 인식 방법 및 장치 |
GB201501791D0 (en) | 2015-02-03 | 2015-03-18 | Microsoft Technology Licensing Llc | Non-linear echo path detection |
US20160232451A1 (en) | 2015-02-09 | 2016-08-11 | Velocee Ltd. | Systems and methods for managing audio content |
US9521496B2 (en) | 2015-02-12 | 2016-12-13 | Harman International Industries, Inc. | Media content playback system and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US20160239255A1 (en) | 2015-02-16 | 2016-08-18 | Harman International Industries, Inc. | Mobile interface for loudspeaker optimization |
US20160253050A1 (en) | 2015-02-26 | 2016-09-01 | Fingertips Lab, Inc. | System and method for audio and tactile based browsing |
EP3264258A4 (en) | 2015-02-27 | 2018-08-15 | Sony Corporation | Information processing device, information processing method, and program |
US9721566B2 (en) * | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9697826B2 (en) | 2015-03-27 | 2017-07-04 | Google Inc. | Processing multi-channel audio waveforms |
US10762894B2 (en) | 2015-03-27 | 2020-09-01 | Google Llc | Convolutional neural networks |
US10192546B1 (en) | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10034109B2 (en) | 2015-04-09 | 2018-07-24 | Audera Acoustics Inc. | Acoustic transducer systems with position sensing |
US9678707B2 (en) | 2015-04-10 | 2017-06-13 | Sonos, Inc. | Identification of audio content facilitated by playback device |
US10198242B2 (en) | 2015-04-14 | 2019-02-05 | Motorola Solutions, Inc. | Method and apparatus for a volume of a device |
US10079012B2 (en) | 2015-04-21 | 2018-09-18 | Google Llc | Customizing speech-recognition dictionaries in a smart-home environment |
US10178474B2 (en) | 2015-04-21 | 2019-01-08 | Google Llc | Sound signature database for initialization of noise reduction in recordings |
US9472196B1 (en) | 2015-04-22 | 2016-10-18 | Google Inc. | Developer voice actions system |
CN104853405B (zh) | 2015-05-12 | 2018-11-30 | 浙江生辉照明有限公司 | 智能联网方法及智能设备 |
KR102623039B1 (ko) | 2015-05-15 | 2024-01-08 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 발광 장치, 전자 기기 및 조명 장치 |
EP3096277A1 (en) | 2015-05-19 | 2016-11-23 | ResearchGate GmbH | Enhanced online user-interaction tracking |
WO2016185321A1 (en) | 2015-05-21 | 2016-11-24 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, display device, electronic device, and lighting device |
US10070237B2 (en) | 2015-05-21 | 2018-09-04 | Analog Devices, Inc. | Optical and capacitive sensing of electroacoustic transducers |
TWI837587B (zh) | 2015-05-21 | 2024-04-01 | 日商半導體能源研究所股份有限公司 | 發光元件、顯示裝置、電子裝置、及照明裝置 |
JP2016218852A (ja) | 2015-05-22 | 2016-12-22 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
US9837547B2 (en) | 2015-05-22 | 2017-12-05 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device comprising oxide conductor and display device including the semiconductor device |
EP3099047A1 (en) | 2015-05-28 | 2016-11-30 | Nxp B.V. | Echo controller |
US9584935B2 (en) | 2015-05-29 | 2017-02-28 | Sound United, Llc. | Multi-zone media system and method for providing multi-zone media |
US10657949B2 (en) | 2015-05-29 | 2020-05-19 | Sound United, LLC | System and method for integrating a home media system and other home systems |
US9734822B1 (en) | 2015-06-01 | 2017-08-15 | Amazon Technologies, Inc. | Feedback based beamformed signal selection |
US9864571B2 (en) | 2015-06-04 | 2018-01-09 | Sonos, Inc. | Dynamic bonding of playback devices |
US9672821B2 (en) | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
US9736578B2 (en) | 2015-06-07 | 2017-08-15 | Apple Inc. | Microphone-based orientation sensors and related techniques |
US10249205B2 (en) | 2015-06-08 | 2019-04-02 | Novel Effect, Inc. | System and method for integrating special effects with a text source |
KR102444075B1 (ko) | 2015-06-09 | 2022-09-16 | 삼성전자주식회사 | 전자 장치, 주변 기기 및 그 제어 방법 |
US10248376B2 (en) | 2015-06-11 | 2019-04-02 | Sonos, Inc. | Multiple groupings in a playback system |
US20160373909A1 (en) * | 2015-06-17 | 2016-12-22 | Hive Life, LLC | Wireless audio, security communication and home automation |
DE112016002728B4 (de) | 2015-06-17 | 2024-09-12 | Semiconductor Energy Laboratory Co., Ltd. | Licht emittierendes Element, Anzeigevorrichtung, elektronisches Gerät und Beleuchtungsvorrichtung |
JP6739907B2 (ja) | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
US10025447B1 (en) | 2015-06-19 | 2018-07-17 | Amazon Technologies, Inc. | Multi-device user interface |
KR102317526B1 (ko) | 2015-06-25 | 2021-10-26 | 엘지전자 주식회사 | 헤드셋 및 그 제어 방법 |
US9554210B1 (en) | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
KR20170001173A (ko) | 2015-06-25 | 2017-01-04 | 엘지전자 주식회사 | 와치 타입 이동 단말기 및 그의 동작 방법 |
US9472203B1 (en) | 2015-06-29 | 2016-10-18 | Amazon Technologies, Inc. | Clock synchronization for multichannel system |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
EP3317879B1 (de) | 2015-06-30 | 2020-02-19 | Fraunhofer Gesellschaft zur Förderung der Angewand | Verfahren und vorrichtung zum zuordnen von geräuschen und zum analysieren |
CN113889586A (zh) | 2015-07-08 | 2022-01-04 | 株式会社半导体能源研究所 | 发光元件、显示装置、电子设备以及照明装置 |
US10304440B1 (en) | 2015-07-10 | 2019-05-28 | Amazon Technologies, Inc. | Keyword spotting using multi-task configuration |
KR102655709B1 (ko) | 2015-07-21 | 2024-04-05 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9686625B2 (en) | 2015-07-21 | 2017-06-20 | Disney Enterprises, Inc. | Systems and methods for delivery of personalized audio |
US9769563B2 (en) | 2015-07-22 | 2017-09-19 | Harman International Industries, Incorporated | Audio enhancement via opportunistic use of microphones |
KR102616411B1 (ko) | 2015-07-23 | 2023-12-26 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
WO2017015759A1 (en) | 2015-07-30 | 2017-02-02 | Amp Me Inc. | Synchronized playback of streamed audio content by multiple internet-capable portable devices |
US10529318B2 (en) | 2015-07-31 | 2020-01-07 | International Business Machines Corporation | Implementing a classification model for recognition processing |
US9691361B2 (en) | 2015-08-03 | 2017-06-27 | International Business Machines Corporation | Adjusting presentation of content on a display |
KR102402512B1 (ko) | 2015-08-04 | 2022-05-27 | 삼성전자주식회사 | 외부장치의 음량을 조정하는 전자장치 및 방법 |
CN105187907A (zh) | 2015-08-05 | 2015-12-23 | 四川长虹电器股份有限公司 | 智能电视音量控制系统及控制方法 |
US9913056B2 (en) | 2015-08-06 | 2018-03-06 | Dolby Laboratories Licensing Corporation | System and method to enhance speakers connected to devices with microphones |
US10333904B2 (en) | 2015-08-08 | 2019-06-25 | Peter J. Tormey | Voice access and control |
KR102386854B1 (ko) | 2015-08-20 | 2022-04-13 | 삼성전자주식회사 | 통합 모델 기반의 음성 인식 장치 및 방법 |
US10270041B2 (en) | 2015-08-28 | 2019-04-23 | Semiconductor Energy Laboratory Co., Ltd. | Light-emitting element, light-emitting device, electronic device, and lighting device |
US20180249267A1 (en) | 2015-08-31 | 2018-08-30 | Apple Inc. | Passive microphone array localizer |
US10031719B2 (en) | 2015-09-02 | 2018-07-24 | Harman International Industries, Incorporated | Audio system with multi-screen application |
US10339917B2 (en) | 2015-09-03 | 2019-07-02 | Google Llc | Enhanced speech endpointing |
KR102417682B1 (ko) | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
KR20170031392A (ko) | 2015-09-11 | 2017-03-21 | 삼성전자주식회사 | 전자 장치, 음향 시스템 및 오디오 출력 방법 |
CN105206281B (zh) | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
KR20170032096A (ko) | 2015-09-14 | 2017-03-22 | 삼성전자주식회사 | 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체 |
US10289734B2 (en) | 2015-09-18 | 2019-05-14 | Samsung Electronics Co., Ltd. | Entity-type search system |
US10706873B2 (en) | 2015-09-18 | 2020-07-07 | Sri International | Real-time speaker state analytics platform |
CN105204357B (zh) | 2015-09-18 | 2018-02-06 | 小米科技有限责任公司 | 智能家居设备的情景模式调整方法及装置 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
KR102420450B1 (ko) | 2015-09-23 | 2022-07-14 | 삼성전자주식회사 | 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체 |
KR102446392B1 (ko) | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10229700B2 (en) | 2015-09-24 | 2019-03-12 | Google Llc | Voice activity detection |
US9936156B2 (en) | 2015-09-24 | 2018-04-03 | Samantha WESTERN | Volume adjusting apparatus and method |
US10186276B2 (en) | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
CN105162886B (zh) | 2015-09-25 | 2019-04-12 | 北京奇艺世纪科技有限公司 | 一种声音控制方法及装置 |
WO2017058654A1 (en) | 2015-09-28 | 2017-04-06 | Google Inc. | Time-synchronized, multizone media streaming |
US9996316B2 (en) | 2015-09-28 | 2018-06-12 | Amazon Technologies, Inc. | Mediation of wakeword response for multiple devices |
JP6536320B2 (ja) | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US10241754B1 (en) | 2015-09-29 | 2019-03-26 | Amazon Technologies, Inc. | Systems and methods for providing supplemental information with a response to a command |
US20170092278A1 (en) | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
TW201721922A (zh) | 2015-09-30 | 2017-06-16 | 半導體能源研究所股份有限公司 | 發光元件,顯示裝置,電子裝置,及照明裝置 |
KR20170038681A (ko) | 2015-09-30 | 2017-04-07 | 가부시키가이샤 한도오따이 에네루기 켄큐쇼 | 발광 소자, 표시 장치, 전자 기기, 및 조명 장치 |
US9978366B2 (en) | 2015-10-09 | 2018-05-22 | Xappmedia, Inc. | Event-based speech interactive media player |
KR102429260B1 (ko) | 2015-10-12 | 2022-08-05 | 삼성전자주식회사 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
US9754580B2 (en) | 2015-10-12 | 2017-09-05 | Technologies For Voice Interface | System and method for extracting and using prosody features |
EP3311590B1 (en) | 2015-10-15 | 2019-08-14 | Huawei Technologies Co., Ltd. | A sound processing node of an arrangement of sound processing nodes |
US9747926B2 (en) * | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
JP6463710B2 (ja) | 2015-10-16 | 2019-02-06 | グーグル エルエルシー | ホットワード認識 |
US9928840B2 (en) | 2015-10-16 | 2018-03-27 | Google Llc | Hotword recognition |
US10453450B2 (en) | 2015-10-20 | 2019-10-22 | Bragi GmbH | Wearable earpiece voice command control system and method |
KR102444061B1 (ko) | 2015-11-02 | 2022-09-16 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105427861B (zh) | 2015-11-03 | 2019-02-15 | 胡旻波 | 智能家居协同麦克风语音控制的系统及其控制方法 |
US9691378B1 (en) | 2015-11-05 | 2017-06-27 | Amazon Technologies, Inc. | Methods and devices for selectively ignoring captured audio data |
US9653075B1 (en) | 2015-11-06 | 2017-05-16 | Google Inc. | Voice commands across devices |
US10863267B2 (en) | 2015-11-10 | 2020-12-08 | Savant Systems, Inc. | Volume control for audio/video devices |
US9990209B2 (en) | 2015-11-12 | 2018-06-05 | Microsoft Technology Licensing, Llc | Digital assistance device for facilitating multi-stage setup |
US10706852B2 (en) | 2015-11-13 | 2020-07-07 | Microsoft Technology Licensing, Llc | Confidence features for automated speech recognition arbitration |
US10592949B2 (en) | 2015-11-13 | 2020-03-17 | [24]7.ai, Inc. | Method and apparatus for linking customer interactions with customer messaging platforms |
US20170140750A1 (en) | 2015-11-17 | 2017-05-18 | Le Holdings (Beijing) Co., Ltd. | Method and device for speech recognition |
CN105472191B (zh) | 2015-11-18 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 一种跟踪回声时延的方法和装置 |
US11929088B2 (en) | 2015-11-20 | 2024-03-12 | Synaptics Incorporated | Input/output mode control for audio processing |
WO2017090115A1 (ja) | 2015-11-25 | 2017-06-01 | 三菱電機株式会社 | 音声対話装置および音声対話方法 |
US10040423B2 (en) | 2015-11-27 | 2018-08-07 | Bragi GmbH | Vehicle with wearable for identifying one or more vehicle occupants |
US9484030B1 (en) | 2015-12-02 | 2016-11-01 | Amazon Technologies, Inc. | Audio triggered commands |
US9699597B2 (en) | 2015-12-07 | 2017-07-04 | Google Inc. | Wireless signal forwarding |
US9747920B2 (en) | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
US10311862B2 (en) | 2015-12-23 | 2019-06-04 | Rovi Guides, Inc. | Systems and methods for conversations with devices about media using interruptions and changes of subjects |
CN105679318A (zh) | 2015-12-23 | 2016-06-15 | 珠海格力电器股份有限公司 | 一种基于语音识别的显示方法、装置、显示系统和空调 |
US10134388B1 (en) | 2015-12-23 | 2018-11-20 | Amazon Technologies, Inc. | Word generation for speech recognition |
US9826599B2 (en) | 2015-12-28 | 2017-11-21 | Amazon Technologies, Inc. | Voice-controlled light switches |
US10026401B1 (en) | 2015-12-28 | 2018-07-17 | Amazon Technologies, Inc. | Naming devices via voice commands |
US10547942B2 (en) | 2015-12-28 | 2020-01-28 | Samsung Electronics Co., Ltd. | Control of electrodynamic speaker driver using a low-order non-linear model |
US9992642B1 (en) | 2015-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated messaging |
US9820036B1 (en) | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9813810B1 (en) | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10049666B2 (en) | 2016-01-06 | 2018-08-14 | Google Llc | Voice recognition system |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
KR20170086814A (ko) | 2016-01-19 | 2017-07-27 | 삼성전자주식회사 | 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법 |
KR102392113B1 (ko) | 2016-01-20 | 2022-04-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 음성 명령 처리 방법 |
CN105741838B (zh) | 2016-01-20 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
US9997151B1 (en) | 2016-01-20 | 2018-06-12 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation for wireless applications |
US9749731B2 (en) | 2016-01-21 | 2017-08-29 | Bose Corporation | Sidetone generation using multiple microphones |
KR20170091913A (ko) | 2016-02-02 | 2017-08-10 | 삼성전자주식회사 | 영상 서비스 제공 방법 및 장치 |
US9659555B1 (en) | 2016-02-09 | 2017-05-23 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation |
US9653060B1 (en) | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
EP3414759B1 (en) | 2016-02-10 | 2020-07-01 | Cerence Operating Company | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9898250B1 (en) | 2016-02-12 | 2018-02-20 | Amazon Technologies, Inc. | Controlling distributed audio outputs to enable voice output |
US9858927B2 (en) | 2016-02-12 | 2018-01-02 | Amazon Technologies, Inc | Processing spoken commands to control distributed audio outputs |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9772817B2 (en) | 2016-02-22 | 2017-09-26 | Sonos, Inc. | Room-corrected voice detection |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10509626B2 (en) | 2016-02-22 | 2019-12-17 | Sonos, Inc | Handling of loss of pairing between networked devices |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017147936A1 (zh) | 2016-03-04 | 2017-09-08 | 茹旷 | 智能家居助手 |
US10133612B2 (en) | 2016-03-17 | 2018-11-20 | Nuance Communications, Inc. | Session processing interaction between two or more virtual assistants |
US9769420B1 (en) | 2016-03-18 | 2017-09-19 | Thomas Lawrence Moses | Portable wireless remote monitoring and control systems |
US10373612B2 (en) | 2016-03-21 | 2019-08-06 | Amazon Technologies, Inc. | Anchored speech detection and speech recognition |
US9805714B2 (en) | 2016-03-22 | 2017-10-31 | Asustek Computer Inc. | Directional keyword verification method applicable to electronic device and electronic device using the same |
US10365887B1 (en) | 2016-03-25 | 2019-07-30 | Amazon Technologies, Inc. | Generating commands based on location and wakeword |
US10332508B1 (en) | 2016-03-31 | 2019-06-25 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
US9952827B2 (en) | 2016-04-13 | 2018-04-24 | Comcast Cable Communications, Llc | Dynamic adjustment of equalization settings of audio components via a sound device profile |
CN109074292B (zh) | 2016-04-18 | 2021-12-14 | 谷歌有限责任公司 | 适当的代理的自动化助理调用 |
US10318236B1 (en) | 2016-05-05 | 2019-06-11 | Amazon Technologies, Inc. | Refining media playback |
US20170329397A1 (en) | 2016-05-12 | 2017-11-16 | Rovi Guides, Inc. | Systems and methods for navigating a media guidance application using gaze control |
US10447748B2 (en) | 2016-05-12 | 2019-10-15 | Apple Inc. | Sharing media information between applications on client devices |
US20170330564A1 (en) | 2016-05-13 | 2017-11-16 | Bose Corporation | Processing Simultaneous Speech from Distributed Microphones |
US10149049B2 (en) | 2016-05-13 | 2018-12-04 | Bose Corporation | Processing speech from distributed microphones |
US10187440B2 (en) | 2016-05-27 | 2019-01-22 | Apple Inc. | Personalization of media streams |
US10063965B2 (en) | 2016-06-01 | 2018-08-28 | Google Llc | Sound source estimation using neural networks |
US10474419B2 (en) | 2016-06-03 | 2019-11-12 | Crestron Electronics, Inc. | Audio digital signal processor utilizing a hybrid network architecture |
AU2017100581B4 (en) | 2016-06-08 | 2018-02-01 | Apple Inc. | Intelligent automated assistant for media exploration |
US10235124B2 (en) | 2016-06-08 | 2019-03-19 | Google Llc | Audio announcement prioritization system |
US9754605B1 (en) | 2016-06-09 | 2017-09-05 | Amazon Technologies, Inc. | Step-size control for multi-channel acoustic echo canceller |
AU2017100486C4 (en) | 2016-06-11 | 2019-09-05 | Apple Inc. | Intelligent device arbitration and control |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179034B1 (en) | 2016-06-12 | 2017-09-04 | Apple Inc | Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs |
ES2806204T3 (es) | 2016-06-15 | 2021-02-16 | Cerence Operating Co | Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados |
US10212029B2 (en) | 2016-06-15 | 2019-02-19 | Microsoft Technology Licensing, Llc | Service provisioning in cloud computing systems |
US20170364371A1 (en) | 2016-06-15 | 2017-12-21 | Microsoft Technology Licensing, Llc | Context-Dependent Digital Action-Assistance Tool |
KR20170142001A (ko) | 2016-06-16 | 2017-12-27 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
US9875740B1 (en) | 2016-06-20 | 2018-01-23 | A9.Com, Inc. | Using voice information to influence importance of search result categories |
US9749738B1 (en) | 2016-06-20 | 2017-08-29 | Gopro, Inc. | Synthesizing audio corresponding to a virtual microphone location |
ITUA20164622A1 (it) | 2016-06-23 | 2017-12-23 | St Microelectronics Srl | Procedimento di beamforming basato su matrici di microfoni e relativo apparato |
US10091545B1 (en) | 2016-06-27 | 2018-10-02 | Amazon Technologies, Inc. | Methods and systems for detecting audio output of associated device |
US9728188B1 (en) | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
KR102471499B1 (ko) | 2016-07-05 | 2022-11-28 | 삼성전자주식회사 | 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
EP3270377B1 (en) | 2016-07-12 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Assessment and adjustment of audio installation |
US20180018965A1 (en) | 2016-07-12 | 2018-01-18 | Bose Corporation | Combining Gesture and Voice User Interfaces |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US9860670B1 (en) | 2016-07-15 | 2018-01-02 | Sonos, Inc. | Spectral correction using spatial calibration |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US9979680B2 (en) | 2016-07-21 | 2018-05-22 | Fujitsu Limited | Smart notification scheduling and modality selection |
US10621992B2 (en) | 2016-07-22 | 2020-04-14 | Lenovo (Singapore) Pte. Ltd. | Activating voice assistant based on at least one of user proximity and context |
CN106028223A (zh) | 2016-07-26 | 2016-10-12 | 广东欧珀移动通信有限公司 | 一种智能音箱的控制方法、装置及智能音箱 |
KR102575634B1 (ko) | 2016-07-26 | 2023-09-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
US10431211B2 (en) | 2016-07-29 | 2019-10-01 | Qualcomm Incorporated | Directional processing of far-field audio |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US10026403B2 (en) | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US9691384B1 (en) | 2016-08-19 | 2017-06-27 | Google Inc. | Voice action biasing system |
US20180053504A1 (en) | 2016-08-19 | 2018-02-22 | Otis Elevator Company | Intention recognition for triggering voice recognition system |
US9967382B2 (en) | 2016-08-19 | 2018-05-08 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
CN107767863B (zh) | 2016-08-22 | 2021-05-04 | 科大讯飞股份有限公司 | 语音唤醒方法、系统及智能终端 |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
WO2018039045A1 (en) | 2016-08-24 | 2018-03-01 | Knowles Electronics, Llc | Methods and systems for keyword detection using keyword repetitions |
US10360910B2 (en) | 2016-08-29 | 2019-07-23 | Garmin Switzerland Gmbh | Automatic speech recognition (ASR) utilizing GPS and sensor data |
US10461953B2 (en) | 2016-08-29 | 2019-10-29 | Lutron Technology Company Llc | Load control system having audio control devices |
US10685656B2 (en) | 2016-08-31 | 2020-06-16 | Bose Corporation | Accessing multiple virtual personal assistants (VPA) from a single device |
US10580404B2 (en) | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10074369B2 (en) | 2016-09-01 | 2018-09-11 | Amazon Technologies, Inc. | Voice-based communications |
US10057698B2 (en) | 2016-09-02 | 2018-08-21 | Bose Corporation | Multiple room communication system and method |
CA3036067C (en) | 2016-09-06 | 2023-08-01 | Deepmind Technologies Limited | Generating audio using neural networks |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US9972318B1 (en) | 2016-09-21 | 2018-05-15 | Amazon Technologies, Inc. | Interpreting voice commands |
JP6520878B2 (ja) | 2016-09-21 | 2019-05-29 | トヨタ自動車株式会社 | 音声取得システムおよび音声取得方法 |
US10409548B2 (en) | 2016-09-27 | 2019-09-10 | Grabango Co. | System and method for differentially locating and modifying audio sources |
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US9959861B2 (en) | 2016-09-30 | 2018-05-01 | Robert Bosch Gmbh | System and method for speech recognition |
JP6683893B2 (ja) | 2016-10-03 | 2020-04-22 | グーグル エルエルシー | デバイストポロジーに基づく音声コマンドの処理 |
CN109844855B (zh) | 2016-10-03 | 2023-12-05 | 谷歌有限责任公司 | 任务的多重计算代理执行 |
US10283138B2 (en) | 2016-10-03 | 2019-05-07 | Google Llc | Noise mitigation for a voice interface device |
CN107919116B (zh) | 2016-10-11 | 2019-09-13 | 芋头科技(杭州)有限公司 | 一种语音激活检测方法及装置 |
US10712997B2 (en) | 2016-10-17 | 2020-07-14 | Sonos, Inc. | Room association based on name |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
US20180122372A1 (en) | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US10783883B2 (en) | 2016-11-03 | 2020-09-22 | Google Llc | Focus session at a voice interface device |
KR102241970B1 (ko) * | 2016-11-07 | 2021-04-20 | 구글 엘엘씨 | 기록된 미디어 핫워드 트리거 억제 |
US10154496B2 (en) | 2016-11-10 | 2018-12-11 | Futurewei Technologies, Inc. | System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems |
US10382806B2 (en) | 2016-11-14 | 2019-08-13 | DISH Technologies L.L.C. | Apparatus, systems and methods for controlling presentation of content using a multi-media table |
US10170110B2 (en) | 2016-11-17 | 2019-01-01 | Robert Bosch Gmbh | System and method for ranking of hybrid speech recognition results with neural networks |
CN106708403A (zh) | 2016-11-30 | 2017-05-24 | 努比亚技术有限公司 | 输入滑动操作时同步播放提示音的方法及装置 |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
US10186265B1 (en) | 2016-12-06 | 2019-01-22 | Amazon Technologies, Inc. | Multi-layer keyword detection to avoid detection of keywords in output audio |
US10134396B2 (en) | 2016-12-07 | 2018-11-20 | Google Llc | Preventing of audio attacks |
US10255032B2 (en) | 2016-12-13 | 2019-04-09 | EVA Automation, Inc. | Wireless coordination of audio sources |
US11184764B2 (en) | 2016-12-14 | 2021-11-23 | Amzetta Technologies, Llc | Methods and systems of establishing communication between devices |
CN106531165A (zh) | 2016-12-15 | 2017-03-22 | 北京塞宾科技有限公司 | 一种便携式智能家居语音控制系统及控制方法 |
US10339957B1 (en) | 2016-12-20 | 2019-07-02 | Amazon Technologies, Inc. | Ending communications session based on presence data |
US10068573B1 (en) | 2016-12-21 | 2018-09-04 | Amazon Technologies, Inc. | Approaches for voice-activated audio commands |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
DE112017006486T5 (de) | 2016-12-23 | 2019-09-12 | Synaptics Incorporated | Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen |
US10546578B2 (en) | 2016-12-26 | 2020-01-28 | Samsung Electronics Co., Ltd. | Method and device for transmitting and receiving audio data |
US10580405B1 (en) | 2016-12-27 | 2020-03-03 | Amazon Technologies, Inc. | Voice control of remote device |
US10276161B2 (en) | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10593328B1 (en) | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
US10186266B1 (en) | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10831366B2 (en) | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10229680B1 (en) | 2016-12-29 | 2019-03-12 | Amazon Technologies, Inc. | Contextual entity resolution |
US10224031B2 (en) | 2016-12-30 | 2019-03-05 | Google Llc | Generating and transmitting invocation request to appropriate third-party agent |
US10290302B2 (en) | 2016-12-30 | 2019-05-14 | Google Llc | Compact home assistant with combined acoustic waveguide and heat sink |
KR102412202B1 (ko) | 2017-01-03 | 2022-06-27 | 삼성전자주식회사 | 냉장고 및 이의 정보 표시 방법 |
US10248613B2 (en) | 2017-01-10 | 2019-04-02 | Qualcomm Incorporated | Data bus activation in an electronic device |
US10672387B2 (en) | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10306254B2 (en) | 2017-01-17 | 2019-05-28 | Seiko Epson Corporation | Encoding free view point data in movie data container |
KR20180084392A (ko) | 2017-01-17 | 2018-07-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR102556840B1 (ko) | 2017-01-20 | 2023-07-18 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
KR20180085931A (ko) | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
US20180218747A1 (en) | 2017-01-28 | 2018-08-02 | Bose Corporation | Audio Device Filter Modification |
KR102716757B1 (ko) | 2017-02-03 | 2024-10-15 | 삼성전자주식회사 | 알림을 제공하는 방법 및 그 전자 장치 |
CN114067794A (zh) | 2017-02-07 | 2022-02-18 | 路创技术有限责任公司 | 基于音频的负载控制系统 |
US10762891B2 (en) | 2017-02-10 | 2020-09-01 | Synaptics Incorporated | Binary and multi-class classification systems and methods using connectionist temporal classification |
CN108446281B (zh) | 2017-02-13 | 2021-03-12 | 北京嘀嘀无限科技发展有限公司 | 确定用户亲密度的方法、装置及存储介质 |
US10467509B2 (en) | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US11100384B2 (en) | 2017-02-14 | 2021-08-24 | Microsoft Technology Licensing, Llc | Intelligent device user interactions |
US20180293221A1 (en) | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10264358B2 (en) | 2017-02-15 | 2019-04-16 | Amazon Technologies, Inc. | Selection of master device for synchronized audio |
US10431217B2 (en) | 2017-02-15 | 2019-10-01 | Amazon Technologies, Inc. | Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point |
US10839795B2 (en) | 2017-02-15 | 2020-11-17 | Amazon Technologies, Inc. | Implicit target selection for multiple audio playback devices in an environment |
CN106921560B (zh) | 2017-02-28 | 2020-06-02 | 北京小米移动软件有限公司 | 语音通信方法、装置及系统 |
US20180262793A1 (en) | 2017-03-09 | 2018-09-13 | Google Inc. | Reverse Casting from a First Screen Device to a Second Screen Device |
US10706843B1 (en) | 2017-03-09 | 2020-07-07 | Amazon Technologies, Inc. | Contact resolution for communications systems |
US10089981B1 (en) | 2017-03-09 | 2018-10-02 | Amazon Technologies, Inc. | Messaging account disambiguation |
US10540961B2 (en) | 2017-03-13 | 2020-01-21 | Baidu Usa Llc | Convolutional recurrent neural networks for small-footprint keyword spotting |
US10074371B1 (en) | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10600406B1 (en) | 2017-03-20 | 2020-03-24 | Amazon Technologies, Inc. | Intent re-ranker |
US10621980B2 (en) | 2017-03-21 | 2020-04-14 | Harman International Industries, Inc. | Execution of voice commands in a multi-device system |
WO2018173293A1 (ja) | 2017-03-24 | 2018-09-27 | ヤマハ株式会社 | 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
CN107135443B (zh) | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10643609B1 (en) | 2017-03-29 | 2020-05-05 | Amazon Technologies, Inc. | Selecting speech inputs |
US10373630B2 (en) | 2017-03-31 | 2019-08-06 | Intel Corporation | Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices |
US10825471B2 (en) | 2017-04-05 | 2020-11-03 | Avago Technologies International Sales Pte. Limited | Voice energy detection |
US11188808B2 (en) | 2017-04-11 | 2021-11-30 | Lenovo (Singapore) Pte. Ltd. | Indicating a responding virtual assistant from a plurality of virtual assistants |
US10748531B2 (en) | 2017-04-13 | 2020-08-18 | Harman International Industries, Incorporated | Management layer for multiple intelligent personal assistant services |
CN107122158A (zh) | 2017-04-14 | 2017-09-01 | 北京小米移动软件有限公司 | 播放信息提示音频的方法及装置、电子设备 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102392297B1 (ko) | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
KR102298947B1 (ko) | 2017-04-28 | 2021-09-08 | 삼성전자주식회사 | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 |
US10992795B2 (en) | 2017-05-16 | 2021-04-27 | Apple Inc. | Methods and interfaces for home media control |
US10311870B2 (en) | 2017-05-10 | 2019-06-04 | Ecobee Inc. | Computerized device with voice command input capability |
US10013995B1 (en) | 2017-05-10 | 2018-07-03 | Cirrus Logic, Inc. | Combined reference signal for acoustic echo cancellation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10628484B2 (en) | 2017-05-17 | 2020-04-21 | Board Of Trustees Of The University Of Illinois | Vibrational devices as sound sensors |
US10564928B2 (en) | 2017-06-02 | 2020-02-18 | Rovi Guides, Inc. | Systems and methods for generating a volume- based response for multiple voice-operated user devices |
US10403299B2 (en) | 2017-06-02 | 2019-09-03 | Apple Inc. | Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition |
US10531196B2 (en) | 2017-06-02 | 2020-01-07 | Apple Inc. | Spatially ducking audio produced through a beamforming loudspeaker array |
US10522146B1 (en) | 2019-07-09 | 2019-12-31 | Instreamatic, Inc. | Systems and methods for recognizing and performing voice commands during advertisement |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10410635B2 (en) | 2017-06-09 | 2019-09-10 | Soundhound, Inc. | Dual mode speech recognition |
US10984329B2 (en) | 2017-06-14 | 2021-04-20 | Ademco Inc. | Voice activated virtual assistant with a fused response |
US10028069B1 (en) | 2017-06-22 | 2018-07-17 | Sonos, Inc. | Immersive audio in a media playback system |
US10950228B1 (en) | 2017-06-28 | 2021-03-16 | Amazon Technologies, Inc. | Interactive voice controlled entertainment |
US11189273B2 (en) | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
WO2019005227A1 (en) | 2017-06-30 | 2019-01-03 | Google Llc | METHODS, SYSTEMS AND MEDIA FOR VOICE CALL OPERATIONS |
US10687353B2 (en) | 2017-07-10 | 2020-06-16 | Qualcomm Incorporated | Management of conflicting scheduling commands in wireless networks |
US20190013019A1 (en) | 2017-07-10 | 2019-01-10 | Intel Corporation | Speaker command and key phrase management for muli -virtual assistant systems |
US10310082B2 (en) | 2017-07-27 | 2019-06-04 | Quantenna Communications, Inc. | Acoustic spatial diagnostics for smart home management |
US11205421B2 (en) | 2017-07-28 | 2021-12-21 | Cerence Operating Company | Selection system and method |
US11798544B2 (en) | 2017-08-07 | 2023-10-24 | Polycom, Llc | Replying to a spoken command |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
JP6513749B2 (ja) | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
US10304475B1 (en) | 2017-08-14 | 2019-05-28 | Amazon Technologies, Inc. | Trigger word based beam selection |
US20190066710A1 (en) | 2017-08-28 | 2019-02-28 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US10553235B2 (en) | 2017-08-28 | 2020-02-04 | Apple Inc. | Transparent near-end user control over far-end speech enhancement processing |
US11062702B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Media system with multiple digital assistants |
US11062710B2 (en) | 2017-08-28 | 2021-07-13 | Roku, Inc. | Local and cloud speech recognition |
US10546583B2 (en) | 2017-08-30 | 2020-01-28 | Amazon Technologies, Inc. | Context-based device arbitration |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US10366699B1 (en) | 2017-08-31 | 2019-07-30 | Amazon Technologies, Inc. | Multi-path calculations for device energy levels |
US10515625B1 (en) | 2017-08-31 | 2019-12-24 | Amazon Technologies, Inc. | Multi-modal natural language processing |
US10482895B2 (en) | 2017-09-01 | 2019-11-19 | Cirrus Logic, Inc. | Acoustic echo cancellation (AEC) rate adaptation |
US10847149B1 (en) | 2017-09-01 | 2020-11-24 | Amazon Technologies, Inc. | Speech-based attention span for voice user interface |
JP6571144B2 (ja) | 2017-09-08 | 2019-09-04 | シャープ株式会社 | 監視システム、監視機器、サーバ、および監視方法 |
US20190082255A1 (en) | 2017-09-08 | 2019-03-14 | Olympus Corporation | Information acquiring apparatus, information acquiring method, and computer readable recording medium |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10083006B1 (en) | 2017-09-12 | 2018-09-25 | Google Llc | Intercom-style communication using multiple computing devices |
KR102338376B1 (ko) | 2017-09-13 | 2021-12-13 | 삼성전자주식회사 | 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법 |
US11314215B2 (en) | 2017-09-15 | 2022-04-26 | Kohler Co. | Apparatus controlling bathroom appliance lighting based on user identity |
US9973849B1 (en) | 2017-09-20 | 2018-05-15 | Amazon Technologies, Inc. | Signal quality beam selection |
US10719507B2 (en) | 2017-09-21 | 2020-07-21 | SayMosaic Inc. | System and method for natural language processing |
US10580411B2 (en) | 2017-09-25 | 2020-03-03 | Cirrus Logic, Inc. | Talker change detection |
US10586534B1 (en) | 2017-09-27 | 2020-03-10 | Amazon Technologies, Inc. | Voice-controlled device control using acoustic echo cancellation statistics |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11233782B2 (en) | 2017-10-04 | 2022-01-25 | Resilience Magnum IP, LLC | Single node network connectivity for structure automation functionality |
US10897680B2 (en) | 2017-10-04 | 2021-01-19 | Google Llc | Orientation-based device interface |
KR102421255B1 (ko) | 2017-10-17 | 2022-07-18 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR102543693B1 (ko) | 2017-10-17 | 2023-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10403266B2 (en) | 2017-10-18 | 2019-09-03 | Intel Corporation | Detecting keywords in audio using a spiking neural network |
CN107808670B (zh) | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107832837B (zh) | 2017-11-28 | 2021-09-28 | 南京大学 | 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法 |
US20190163153A1 (en) | 2017-11-30 | 2019-05-30 | International Business Machines Corporation | Enforcing dynamic volume thresholds of an entertainment device |
US10546593B2 (en) | 2017-12-04 | 2020-01-28 | Apple Inc. | Deep learning driven multi-channel filtering for speech enhancement |
US10445365B2 (en) | 2017-12-04 | 2019-10-15 | Amazon Technologies, Inc. | Streaming radio with personalized content integration |
US10777189B1 (en) | 2017-12-05 | 2020-09-15 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US10510340B1 (en) | 2017-12-05 | 2019-12-17 | Amazon Technologies, Inc. | Dynamic wakeword detection |
US20190172452A1 (en) | 2017-12-06 | 2019-06-06 | GM Global Technology Operations LLC | External information rendering |
CN110678922A (zh) | 2017-12-06 | 2020-01-10 | 谷歌有限责任公司 | 闪避和擦除来自附近设备的音频 |
CN107919123B (zh) | 2017-12-07 | 2022-06-03 | 北京小米移动软件有限公司 | 多语音助手控制方法、装置及计算机可读存储介质 |
US11182122B2 (en) | 2017-12-08 | 2021-11-23 | Amazon Technologies, Inc. | Voice control of computing devices |
US20190179611A1 (en) | 2017-12-11 | 2019-06-13 | Sonos, Inc. | Systems and Methods of Receiving Voice Input |
US10051600B1 (en) | 2017-12-12 | 2018-08-14 | Amazon Technologies, Inc. | Selective notification delivery based on user presence detections |
US10847137B1 (en) | 2017-12-12 | 2020-11-24 | Amazon Technologies, Inc. | Trigger word detection using neural network waveform processing |
US10425247B2 (en) | 2017-12-12 | 2019-09-24 | Rovi Guides, Inc. | Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset |
US10374816B1 (en) | 2017-12-13 | 2019-08-06 | Amazon Technologies, Inc. | Network conference management and arbitration via voice-capturing devices |
US10540971B2 (en) | 2017-12-15 | 2020-01-21 | Blue Jeans Network, Inc. | System and methods for in-meeting group assistance using a virtual assistant |
US10663313B2 (en) | 2017-12-15 | 2020-05-26 | Google Llc | Providing traffic warnings to a user based on return journey |
US11409816B2 (en) | 2017-12-19 | 2022-08-09 | Motorola Solutions, Inc. | Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information |
US11295748B2 (en) | 2017-12-26 | 2022-04-05 | Robert Bosch Gmbh | Speaker identification with ultra-short speech segments for far and near field voice assistance applications |
US10504507B2 (en) | 2017-12-28 | 2019-12-10 | Syntiant | Always-on keyword detector |
US10614811B2 (en) | 2017-12-29 | 2020-04-07 | Intel Corporation | Hierarchical speech recognition resolution |
CN111357048B (zh) | 2017-12-31 | 2024-10-08 | 美的集团股份有限公司 | 用于控制家庭助手装置的方法和系统 |
CN111512365B (zh) | 2017-12-31 | 2023-06-13 | 美的集团股份有限公司 | 对多个家庭装置进行控制的方法和系统 |
US9972343B1 (en) | 2018-01-08 | 2018-05-15 | Republic Wireless, Inc. | Multi-step validation of wakeup phrase processing |
US10795332B2 (en) | 2018-01-16 | 2020-10-06 | Resilience Magnum IP, LLC | Facilitating automating home control |
CN108198548B (zh) | 2018-01-25 | 2020-11-20 | 苏州奇梦者网络科技有限公司 | 一种语音唤醒方法及其系统 |
US20190237067A1 (en) | 2018-01-31 | 2019-08-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Multi-channel voice recognition for a vehicle environment |
US10157042B1 (en) | 2018-02-06 | 2018-12-18 | Amazon Technologies, Inc. | Audio output control |
US11024307B2 (en) | 2018-02-08 | 2021-06-01 | Computime Ltd. | Method and apparatus to provide comprehensive smart assistant services |
US11145298B2 (en) | 2018-02-13 | 2021-10-12 | Roku, Inc. | Trigger word detection with multiple digital assistants |
US10425780B1 (en) | 2018-02-22 | 2019-09-24 | Amazon Technologies, Inc. | Outputting notifications using device groups |
US10749828B2 (en) | 2018-03-14 | 2020-08-18 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications |
US11127405B1 (en) | 2018-03-14 | 2021-09-21 | Amazon Technologies, Inc. | Selective requests for authentication for voice-based launching of applications |
US10491962B2 (en) | 2018-03-14 | 2019-11-26 | Rovi Guides, Inc. | Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
US10685669B1 (en) | 2018-03-20 | 2020-06-16 | Amazon Technologies, Inc. | Device selection from audio data |
US10440440B1 (en) | 2018-03-23 | 2019-10-08 | Rovi Guides, Inc. | Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device |
US10777203B1 (en) | 2018-03-23 | 2020-09-15 | Amazon Technologies, Inc. | Speech interface device with caching component |
US10446169B1 (en) | 2018-03-26 | 2019-10-15 | Motorola Mobility Llc | Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US11151991B2 (en) | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
US11217240B2 (en) | 2018-04-05 | 2022-01-04 | Synaptics Incorporated | Context-aware control for smart devices |
US20190311710A1 (en) | 2018-04-06 | 2019-10-10 | Flex Ltd. | Device and system for accessing multiple virtual assistant services |
US10720166B2 (en) | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10679629B2 (en) | 2018-04-09 | 2020-06-09 | Amazon Technologies, Inc. | Device arbitration by multiple speech processing systems |
US10928917B2 (en) | 2018-04-12 | 2021-02-23 | International Business Machines Corporation | Multiple user interaction with audio devices using speech and gestures |
CN108520741B (zh) | 2018-04-12 | 2021-05-04 | 科大讯飞股份有限公司 | 一种耳语音恢复方法、装置、设备及可读存储介质 |
US10679615B2 (en) | 2018-04-16 | 2020-06-09 | Google Llc | Adaptive interface in a voice-based networked system |
CN108538305A (zh) | 2018-04-20 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备及计算机可读存储介质 |
EP3561806B1 (en) | 2018-04-23 | 2020-04-22 | Spotify AB | Activation trigger processing |
US10803864B2 (en) | 2018-05-07 | 2020-10-13 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11308947B2 (en) | 2018-05-07 | 2022-04-19 | Spotify Ab | Voice recognition system for use with a personal media streaming appliance |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
JP2019204025A (ja) | 2018-05-24 | 2019-11-28 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、及びプログラム |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10777195B2 (en) | 2018-05-31 | 2020-09-15 | International Business Machines Corporation | Wake command nullification for digital assistance and voice recognition technologies |
US20190371324A1 (en) | 2018-06-01 | 2019-12-05 | Apple Inc. | Suppression of voice response by device rendering trigger audio |
CN112272819B (zh) | 2018-06-05 | 2024-04-26 | 三星电子株式会社 | 被动唤醒用户交互设备的方法和系统 |
US10433058B1 (en) | 2018-06-14 | 2019-10-01 | Sonos, Inc. | Content rules engines for audio playback devices |
US10762896B1 (en) | 2018-06-25 | 2020-09-01 | Amazon Technologies, Inc. | Wakeword detection |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
NL2021308B1 (en) | 2018-07-16 | 2020-01-24 | Hazelebach & Van Der Ven Holding B V | Methods for a voice processing system |
JP7000268B2 (ja) | 2018-07-18 | 2022-01-19 | 株式会社東芝 | 情報処理装置、情報処理方法、およびプログラム |
US11144596B2 (en) | 2018-07-24 | 2021-10-12 | Harman International Industries, Incorporated | Retroactive information searching enabled by neural sensing |
GB2576016B (en) | 2018-08-01 | 2021-06-23 | Arm Ip Ltd | Voice assistant devices |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
KR102225984B1 (ko) | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
US10622009B1 (en) | 2018-09-10 | 2020-04-14 | Amazon Technologies, Inc. | Methods for detecting double-talk |
US20200090647A1 (en) | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US10650807B2 (en) | 2018-09-18 | 2020-05-12 | Intel Corporation | Method and system of neural network keyphrase detection |
KR20200034430A (ko) | 2018-09-21 | 2020-03-31 | 삼성전자주식회사 | 전자 장치, 시스템 및 음성 인식 서비스 이용 방법 |
US10861444B2 (en) | 2018-09-24 | 2020-12-08 | Rovi Guides, Inc. | Systems and methods for determining whether to trigger a voice capable device based on speaking cadence |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
US10950249B2 (en) | 2018-09-25 | 2021-03-16 | Amazon Technologies, Inc. | Audio watermark encoding/decoding |
US11170758B2 (en) | 2018-09-27 | 2021-11-09 | Rovi Guides, Inc. | Systems and methods for providing notifications within a media asset without breaking immersion |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
KR102606789B1 (ko) | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
US20200110571A1 (en) | 2018-10-05 | 2020-04-09 | Sonos, Inc. | Systems and methods for media content selection |
US10971158B1 (en) | 2018-10-05 | 2021-04-06 | Facebook, Inc. | Designating assistants in multi-assistant environment based on identified wake word received from a user |
US10346122B1 (en) | 2018-10-18 | 2019-07-09 | Brent Foster Morgan | Systems and methods for a supplemental display screen |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US10943599B2 (en) | 2018-10-26 | 2021-03-09 | Spotify Ab | Audio cancellation for voice recognition |
US10573312B1 (en) | 2018-12-04 | 2020-02-25 | Sorenson Ip Holdings, Llc | Transcription generation from multiple speech recognition systems |
US10388272B1 (en) | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
KR102570384B1 (ko) | 2018-12-27 | 2023-08-25 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
US11198446B2 (en) | 2019-01-04 | 2021-12-14 | Faraday & Future Inc. | On-board vehicle query system |
JP2020112692A (ja) | 2019-01-11 | 2020-07-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 方法、制御装置、及びプログラム |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
CN109712626B (zh) | 2019-03-04 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及装置 |
US10943598B2 (en) | 2019-03-18 | 2021-03-09 | Rovi Guides, Inc. | Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands |
US10964314B2 (en) | 2019-03-22 | 2021-03-30 | Cirrus Logic, Inc. | System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array |
US10984783B2 (en) | 2019-03-27 | 2021-04-20 | Intel Corporation | Spoken keyword detection based utterance-level wake on intent system |
US20200310751A1 (en) | 2019-03-29 | 2020-10-01 | Qualcomm Incorporated | System and method of managing device sound level |
EP3726856B1 (en) | 2019-04-17 | 2022-11-16 | Oticon A/s | A hearing device comprising a keyword detector and an own voice detector |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US20200409926A1 (en) | 2019-06-28 | 2020-12-31 | Rovi Guides, Inc. | Automated contact creation based on content communications |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
JP7191793B2 (ja) | 2019-08-30 | 2022-12-19 | 株式会社東芝 | 信号処理装置、信号処理方法、及びプログラム |
US11172328B2 (en) | 2019-09-27 | 2021-11-09 | Sonos, Inc. | Systems and methods for device localization |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
KR20210066647A (ko) | 2019-11-28 | 2021-06-07 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11823659B2 (en) | 2019-12-11 | 2023-11-21 | Amazon Technologies, Inc. | Speech recognition through disambiguation feedback |
US11445301B2 (en) | 2020-02-12 | 2022-09-13 | Sonos, Inc. | Portable playback devices with network operation modes |
CN111341306B (zh) | 2020-02-14 | 2022-06-17 | 东南大学 | 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法 |
US11206052B1 (en) | 2020-06-18 | 2021-12-21 | HAJEN Co., Ltd | Smart speaker |
US20220050585A1 (en) | 2020-08-14 | 2022-02-17 | Apple Inc. | Audio media playback user interface |
-
2017
- 2017-08-07 US US15/670,361 patent/US10475449B2/en active Active
-
2018
- 2018-08-06 CA CA3140979A patent/CA3140979C/en active Active
- 2018-08-06 AU AU2018312989A patent/AU2018312989B2/en active Active
- 2018-08-06 EP EP22153523.0A patent/EP4040285A1/en active Pending
- 2018-08-06 CN CN202310761290.0A patent/CN116954545A/zh active Pending
- 2018-08-06 WO PCT/US2018/045397 patent/WO2019032462A1/en unknown
- 2018-08-06 CA CA3072492A patent/CA3072492C/en active Active
- 2018-08-06 KR KR1020207006519A patent/KR102315053B1/ko active IP Right Grant
- 2018-08-06 CN CN201880064916.XA patent/CN111194439B/zh active Active
- 2018-08-06 JP JP2020506725A patent/JP6963673B2/ja active Active
- 2018-08-06 EP EP18760101.8A patent/EP3665562B1/en active Active
-
2019
- 2019-11-11 US US16/679,538 patent/US11380322B2/en active Active
-
2022
- 2022-07-01 US US17/810,533 patent/US11900937B2/en active Active
-
2023
- 2023-12-26 US US18/396,279 patent/US20240321271A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9548053B1 (en) * | 2014-09-19 | 2017-01-17 | Amazon Technologies, Inc. | Audible command filtering |
TW201629950A (zh) * | 2015-01-07 | 2016-08-16 | 樓氏電子有限公司 | 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 |
CN104572009A (zh) * | 2015-01-28 | 2015-04-29 | 合肥联宝信息技术有限公司 | 一种自适应外界环境的音频控制方法及装置 |
US9633661B1 (en) * | 2015-02-02 | 2017-04-25 | Amazon Technologies, Inc. | Speech-responsive portable speaker |
CN105632486A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
CN106910500A (zh) * | 2016-12-23 | 2017-06-30 | 北京第九实验室科技有限公司 | 对带麦克风阵列的设备进行语音控制的方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
EP3665562A1 (en) | 2020-06-17 |
AU2023203687A1 (en) | 2023-07-06 |
AU2018312989B2 (en) | 2023-06-15 |
JP6963673B2 (ja) | 2021-11-10 |
US11380322B2 (en) | 2022-07-05 |
US20200075010A1 (en) | 2020-03-05 |
WO2019032462A1 (en) | 2019-02-14 |
US20240321271A1 (en) | 2024-09-26 |
US10475449B2 (en) | 2019-11-12 |
AU2018312989A1 (en) | 2020-03-05 |
CA3140979C (en) | 2024-02-27 |
CN111194439A (zh) | 2020-05-22 |
KR102315053B1 (ko) | 2021-10-20 |
US11900937B2 (en) | 2024-02-13 |
CA3072492C (en) | 2023-01-24 |
CA3140979A1 (en) | 2019-02-14 |
EP4040285A1 (en) | 2022-08-10 |
CN116954545A (zh) | 2023-10-27 |
JP2020530585A (ja) | 2020-10-22 |
CA3072492A1 (en) | 2019-02-14 |
US20190043492A1 (en) | 2019-02-07 |
US20230021785A1 (en) | 2023-01-26 |
EP3665562B1 (en) | 2022-06-15 |
KR20200035118A (ko) | 2020-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111194439B (zh) | 唤醒词检测抑制 | |
US12047752B2 (en) | Content mixing | |
US11947870B2 (en) | Audio response playback | |
US11184969B2 (en) | Contextualization of voice inputs | |
AU2023203687B2 (en) | Wake-word detection suppression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |