CN111194439B - 唤醒词检测抑制 - Google Patents

唤醒词检测抑制 Download PDF

Info

Publication number
CN111194439B
CN111194439B CN201880064916.XA CN201880064916A CN111194439B CN 111194439 B CN111194439 B CN 111194439B CN 201880064916 A CN201880064916 A CN 201880064916A CN 111194439 B CN111194439 B CN 111194439B
Authority
CN
China
Prior art keywords
wake
audio content
playback
playback device
networked microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880064916.XA
Other languages
English (en)
Other versions
CN111194439A (zh
Inventor
乔纳森·P·朗格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sonos Inc
Original Assignee
Sonos Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sonos Inc filed Critical Sonos Inc
Priority to CN202310761290.0A priority Critical patent/CN116954545A/zh
Publication of CN111194439A publication Critical patent/CN111194439A/zh
Application granted granted Critical
Publication of CN111194439B publication Critical patent/CN111194439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Oscillators With Electromechanical Resonators (AREA)
  • Control Of Stepping Motors (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)

Abstract

示例技术涉及确定NMD的方向。示例实现包括一种回放设备,回放设备接收表示音频内容的数据,以供回放设备进行回放。在回放设备回放音频内容之前,回放设备在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。回放设备使一个或多个联网麦克风设备在回放设备回放音频内容期间停用该一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,并且经由一个或多个扬声器回放音频内容。在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使给该定联网麦克风设备经由麦克风收听特定唤醒词之后的语音命令。

Description

唤醒词检测抑制
相关申请的交叉引用
本申请要求2017年8月7日提交的美国专利申请No.15/670,361的优先权,其全部内容通过引用并入本文。
技术领域
本公开涉及消费者产品,更具体地,涉及与媒体播放或者其某个方面有关的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices”的专利申请,并在2005年开始出售媒体播放系统为止。Sonos无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
附图说明
参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:
图1示出可以实施某些实施例的示例媒体回放系统配置;
图2示出示例回放设备的功能框图;
图3示出示例控制设备的功能框图;
图4示出示例控制器接口;
图5示出示例处理系统;
图6示出根据本文描述的方面的示例多个网络设备;
图7示出根据本文描述的方面的示例网络麦克风设备的功能框图;
图8示出停用一个或多个MD的唤醒响应的示例流程图;
图9示出使NMD忽略唤醒词的示例消息;
图10A、图10B、图10C、图10D示出了使NMD忽略唤醒词的示例指令;
图11示出停用一个或多个NMD的唤醒响应的示例流程图;
图12示出停用一个或多个NMD的唤醒响应的示例流程图;以及
图13示出抑制唤醒响应的示例流程图。
附图用于示出示例实施例的目的,但可以理解,本发明不限于附图中示出的布置和手段。
具体实施方式
I.概述
联网麦克风设备(NMD)可用于使用语音控制来控制家庭。NMD可以是例如能够经由麦克风接收语音输入的
Figure GDA0004158897650000021
回放设备、服务器或系统,或者其一部分。在一些示例中,回放设备是/>
Figure GDA0004158897650000022
回放设备。另外,NMD可以是能够经由麦克风接收语音输入的另一设备、服务器或系统(例如,/>
Figure GDA0004158897650000023
等),或者其一部分。2017年2月21日提交的题为“Voice Control of a Media Playback System”的美国申请No.15/438,749通过引用整体并入本文,其提供了启用语音的家庭架构的示例。语音控制对于“智能”家庭情况下的各种设备(例如回放设备、无线照明设备、恒温器、门锁、家庭自动化以及其他示例)可以是有益的。
在一些实施方式中,由NMD检测到的语音输入被发送给语音服务以进行处理。NMD与回放设备一起可以用作到语音服务的麦克风/扬声器接口。语音输入由NMD的麦克风检测,然后传输给特定的语音服务进行处理。然后,语音服务可以返回命令或语音输入的其他结果。
唤醒词的发音可以调用语音服务。例如,在查询
Figure GDA0004158897650000031
语音服务时,用户可以说出唤醒词“Alexa”,然后进行语音输入。其他示例包括用于查询/>
Figure GDA0004158897650000032
语音服务的“好,Google”和用于查询/>
Figure GDA0004158897650000033
语音服务的“嘿,Siri”。存在唤醒词和语音服务的其他示例。在检测到唤醒词之后,NMD可以通过经由麦克风收听唤醒词之后的语音命令来做出响应。该响应在本文中被称为NMD的“唤醒响应”。
在一些情况下,回放包括唤醒词的音频内容可能错误地触发NMD的唤醒响应。许多语音服务的唤醒词是从现有语言的词汇中选择的预先存在的词。例如,几种流行的语音服务使用给定名称作为唤醒词(例如“Alexa”和“Siri”)。因此,在一些情况下,诸如谈话节目、电影、电视节目、播客、互联网流式视频等的所记录的音频内容可能包括唤醒词或类似词。在NMD范围内回放这类音频内容可能错误地触发NMD,出于许多原因,这可能是不希望的,原因包括它可能干扰对音频内容的赏析。
例如,电视可以回放针对给定语音服务的广告。在广告期间,演员可能说出语音服务的唤醒词,也许是为了演示语音服务是如何被调用的。与电视位于同一房间的NMD可能检测到来自电视的音频输入,并且当NMD检测到广告中的唤醒词时调用语音服务。这可能是不希望的。此外,由于广告可以同时在许多电视上播放,因此广告可以同时触发许多NMD,这可能导致对语音服务的请求发生不希望的激增。
为了避免其广告引起误触发,语音服务的运营商可以标记其广告中包括唤醒词的部分,并对他们的NMD进行编程以忽视这些被标记的部分。例如,运营商可以将音调或其他音频标记混入语音服务的广告中,并对他们的NMD进行编程,以忽视与该音频标记一起检测到的唤醒词。该实现在有限的情况下(例如语音服务的广告,其中语音服务的运营商可以将该标记嵌入音频内容中)可能是有用的。然而,对于语音服务的运营商无法控制的绝大多数其他音频内容,该实现没有用。
本文描述的示例技术可以包括:在音频内容被回放设备可听地回放之前,对要被回放设备回放的音频内容进行处理,确定音频内容是否包括一个或多个唤醒词,并且通知一个或多个NMD在该一个或多个回放设备回放唤醒词时忽略这些唤醒词。以这种方式,该技术可以帮助防止NMD的错误触发。显然,这些技术可以适用于要被回放设备回放的任何所记录的音频内容。
例如,回放设备可以接收音频内容以供回放。在播放音频内容之前,回放设备将音频内容存储在存储器中(例如,在缓冲器中),并对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当回放设备最终回放音频内容时,回放设备(可以是NMD本身)使一个或多个NMD忽略这些唤醒词。
作为另一示例,NMD可以接收已经被指定由回放设备回放的音频内容。在回放设备回放音频内容之前,NMD可以对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当唤醒词最终被回放设备回放时,NMD可以使其本身(以及可能附近的其他NMD)忽略这些唤醒词。
NMD可以使用各种技术中的任一种来忽略唤醒词。在一些情况下,可以指示NMD在唤醒词被回放设备回放时不检测唤醒词,这可能通过指示NMD停止收听唤醒词,通过停用NMD的麦克风阵列一段时间,或者通过在回放设备的方向创建收听无效(NULL)等来进行。备选地,NMD可以继续最初地检测唤醒词,但是NMD被指示抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务,这可能通过在某些时段期间忽略唤醒词,或者通过在某些时段期间忽略所有所记录的音频来进行。
当在回放设备可听地回放音频内容之前处理音频内容时,处理设备(例如,回放设备或NMD)也可以确定所记录的音频内容的哪些部分包含唤醒词。这些部分可以由音频内容内的时间段来定义,例如唤醒词的开始和停止时间(例如,播客中的唤醒词从33:52.543开始并在33:54.013结束)。在回放音频内容时,可以指示附近的NMD在这些时间段期间忽略唤醒词。
作为另一示例,处理设备可以对音频内容(或音频内容的一部分)中唤醒词的数量进行计数。例如,正在处理广告的音频内容的回放设备可能在该广告中检测到唤醒词的四个实例。然后,回放设备可以指示回放设备附近的NMD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的四个唤醒词)。
在其他示例中,处理设备可以在所记录的音频内容中动态插入音频音调或其他标记,以指定在音频内容中检测到的唤醒词。然后,当回放设备回放音频内容时,可以指示将音频标记和唤醒词一起检测到的NMD忽略该唤醒词的实例。响应于检测到相关联的音频标记,在回放设备的可听范围内的多个NMD可以各自检测唤醒词并且忽略唤醒词。
示例技术可以涉及停用一个或多个NMD的唤醒响应。第一实施方式可以包括:经由网络接口接收表示音频内容的数据,以供回放设备回放,并且在回放设备回放音频内容之前,在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第一实施方式还可以包括:使一个或多个联网麦克风设备在回放设备回放音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令。第一实施方式还可以包括经由一个或多个扬声器回放所述音频内容。
第二实施方式可以包括经由网络接口接收表示音频内容的数据,以供所述回放设备回放。第二实施方式还可以包括:在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第二实施方式还可以包括:在所述回放设备回放所述音频内容期间停用联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应,并且当所述回放设备正在回放所述音频内容时,经由麦克风检测所回放的音频内容。
第三实施方式可以包括经由计算系统的接口接收述音频内容,以供一个或多个回放设备回放。第三实施方式还可以包括:在回放设备回放音频内容之前,在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。第三实施方式还可以包括:使一个或多个联网麦克风设备在回放设备回放音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
第四实施方式可以包括经由网络接口接收指令,以停用联网麦克风设备对一个或多个唤醒词的唤醒响应。第四实施方式还可以包括经由麦克风检测由一个或多个回放设备回放的音频内容。第四实施方式还可以包括:确定检测到的音频内容包括一个或多个唤醒词,并且响应于所接收的指令,停用联网麦克风设备对检测到的音频内容中的一个或多个唤醒词的唤醒响应。
这些示例实施方式中的每一个可以被体现为方法、被配置为执行该实施方式的设备、被配置为执行该实施方式的设备系统、或包含指令的非暂时性计算机可读介质等,所述指令能够由所述一个或多个处理器执行以执行该实现。本领域普通技术人员将理解,本公开包括许多其他实施例,包括本文描述的示例特征的组合。此外,描述为由给定设备执行以说明技术的任何示例操作可以由任何合适的设备执行,包括本文描述的设备。此外,任何设备可以使另一设备执行本文描述的任何操作。
尽管本文描述的一些示例可以涉及由给定行动者(例如“用户”和/或其他实体)执行的功能,但是应当理解,该描述仅出于解释的目的。除非权利要求本身的语言明确要求,否则不应将权利要求解释为要求任何此类示例行动者进行动作。
II.示例操作环境
图1示出了媒体回放系统100的示例配置,在媒体回放系统100中可以实施或实现本文公开的一个或多个实施例。如图所示的媒体回放系统100与具有若干房间和空间(例如,主卧室、书房、餐厅和客厅)的示例家居环境相关联。如图1的示例所示,媒体回放系统100包括回放设备102、104、106、108、110、112、114、116、118、120、122和124、控制设备126和128、以及有线或无线网络路由器130。图1中还示出了MD 132和134。
可以在以下部分中找到关于示例媒体回放系统100的不同组件以及不同组件可以如何交互以向用户提供媒体体验的进一步讨论。虽然本文的讨论可能总体上涉及示例媒体回放系统100,但是本文描述的技术不限于尤其如图1所示的家居环境内的应用。例如,本文描述的技术可以在可能期望多区域音频的环境中有用,例如,诸如餐馆、商场或机场之类的商业环境、诸如运动型多用途车(SUV)、公共汽车或小汽车之类的载运工具、船舶或船只、飞机等。
a.示例回放设备
图2示出示例回放设备200的功能框图,示例回放设备200可以被配置为图1的媒体回放系统100的回放设备102—124中的一个或多个。回放设备200可以包括处理器202、软件组件204、存储器206、音频处理组件208、音频放大器210、扬声器212、以及包括无线接口216和有线接口218的网络接口214。在一种情况下,回放设备200可以不包括扬声器212,而是包括用于将回放设备200连接到外部扬声器的扬声器接口。在另一种情况下,回放设备200可以既不包括扬声器212也不包括音频放大器210,而是包括用于将回放设备200连接到外部音频放大器或视听接收器的音频接口。
在一个示例中,处理器202是时钟驱动计算组件,其被配置为根据存储器206中存储的指令处理输入数据。存储器206可以是有形计算机可读介质,其被配置为存储可由处理器202执行的指令。例如,存储器206可以是数据存储设备,其可以加载有可由处理器202执行以实现某些功能的一个或多个软件组件204。在一个示例中,所述功能可以包括回放设备200从音频源或另一回放设备获取音频数据。在另一示例中,所述功能可以包括回放设备200向网络上的另一设备或回放设备发送音频数据。在又一示例中,所述功能可以包括将回放设备200与一个或多个回放设备配对以创建多通道音频环境。
某些功能可以包括回放设备200与一个或多个其他回放设备同步对音频内容的回放。在同步回放期间,收听者将优选地不能够感知到回放设备200和一个或多个其他回放设备对音频内容的回放之间的时间延迟差异。通过引用将其内容全部合并于此的题目为“System and method for synchronizing operations among a plurality ofindependently clocked digital data processing devices(用于同步多个独立时钟控制的数字数据处理设备之间的操作的系统和方法)”的美国专利No.8,234,395更详细地提供了回放设备之间的音频回放同步的一些示例。
存储器206还可以被配置为存储与回放设备200相关联的数据,例如,回放设备200是其一部分的一个或多个区域和/或区域组、回放设备200可访问的音频源、或回放设备200(或某个其他回放设备)可以与之相关联的回放队列。数据可以被存储为一个或多个状态变量,所述状态变量被周期性地更新并用于描述回放设备200的状态。存储器206还可以包括与媒体系统的其他设备的状态相关联的数据,并且间或地在设备之间共享,使得设备中的一个或多个具有与系统相关联的最新数据。其他实施例也是可能的。
音频处理组件208可以包括一个或多个数模转换器(DAC)、音频预处理组件、音频增强组件或数字信号处理器(DSP)等。在一个实施例中,音频处理组件208中的一个或多个可以是处理器202的子组件。在一个示例中,音频处理组件208可以处理和/或有意地改变音频内容以产生音频信号。然后,所产生的音频信号可被提供至音频放大器210进行放大,并通过扬声器212回放。具体地,音频放大器210可以包括被配置为将音频信号放大到用于驱动扬声器212中的一个或多个的电平的设备。扬声器212可以包括单独的换能器(例如,“驱动器”)或具有一个或多个驱动器的包括外壳的完整扬声器系统。例如,扬声器212的特殊驱动器可以包括例如低音喇叭(例如,针对低频)、中频段驱动器(例如,针对中频)和/或高频扬声器(例如,针对高频)。在一些情况下,一个或多个扬声器212中的每个换能器可以由音频放大器210的各个对应的音频放大器来驱动。除了产生用于由回放设备200回放的模拟信号之外,音频处理组件208还可以被配置为处理要向一个或多个其他回放设备发送以供回放的音频内容。
可以例如通过音频线路输入的输入连接(例如,自动检测3.5mm音频线路输入连接)或网络接口214从外部源接收要由回放设备200处理和/或回放的音频内容。
网络接口214可以被配置为促进回放设备200与数据网络上的一个或多个其他设备之间的数据流。这样,回放设备200可以被配置为通过数据网络从与回放设备200通信的一个或多个其他回放设备、局域网内的网络设备、或通过诸如互联网之类的广域网从音频内容源接收音频内容。在一个示例中,回放设备200发送和接收的音频内容和其他信号可以以包含基于互联网协议(IP)的源地址和基于IP的目的地地址的数字分组数据的形式来发送。在这种情况下,网络接口214可以被配置为解析数字分组数据,使得去往回放设备200的数据被回放设备200正确地接收和处理。
如图所示,网络接口214可以包括无线接口216和有线接口218。无线接口216可以为回放设备200提供网络接口功能,以根据通信协议(例如,任何无线标准,包括IEEE802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准等)与其他设备(例如,与回放设备200相关联的数据网络内的其他回放设备、扬声器、接收器、网络设备、控制设备)无线通信。有线接口218可以为回放设备200提供网络接口功能,以根据通信协议(例如,IEEE 802.3)通过有线连接与其他设备通信。虽然图2中所示的网络接口214包括无线接口216和有线接口218,但是在一些实施例中,网络接口214可以仅包括无线接口或仅包括有线接口。
在一个示例中,回放设备200和另一回放设备可以配对,以播放音频内容的两个单独的音频分量。例如,回放设备200可以被配置为播放左通道音频分量,而另一回放设备可以被配置为播放右通道音频分量,从而产生或增强音频内容的立体声效果。配对的回放设备(也称为“绑定的回放设备”)还可以与其他回放设备同步播放音频内容。
在另一示例中,回放设备200可以与一个或多个其他回放设备声音合并以形成单个合并的回放设备。合并的回放设备可以被配置为与非合并的回放设备或配对的回放设备不同地处理和再现声音,这是因为合并的回放设备可以具有可以通过其呈现音频内容的附加的扬声器驱动器。例如,如果回放设备200是被设计为呈现低频段音频内容的回放设备(即,低音喇叭),则回放设备200可以与被设计为呈现全频段音频内容的回放设备合并。在这种情况下,当与低频回放设备200合并时,全频段回放设备可以被配置为仅呈现音频内容的中高频分量,而低频段回放设备200则呈现音频内容的低频分量。合并的回放设备还可以与单个回放设备或另一合并的回放设备配对。
举例来说,SONOS公司目前提供(或已经提供)销售某些回放设备,包括“PLAY:1”、“PLAY:3”、“PLAY:5”、“PLAYBAR”、“CONNECT:AMP”、“CONNECT”、和“SUB”。任何其他过去、现在和/或将来的回放设备可以附加地或备选地用于实现本文公开的示例实施例的回放设备。此外,应当理解,回放设备不限于图2示出的示例或SONOS的产品供应。例如,回放设备可以包括有线或无线耳机。在另一示例中,回放设备可以包括个人移动媒体回放设备的扩展基座,或与其交互。在又一示例中,回放设备可以是诸如电视、照明器材或在室内外使用的一些其他设备之类的另一设备或组件的组成部分。
b.示例回放区域配置
返回参考图1的媒体回放系统100,环境可以具有一个或多个回放区域,每个回放区域具有一个或多个回放设备。媒体回放系统100可以建立有一个或多个回放区域,之后可以添加或移除一个或多个区域,以达到图1所示的示例配置。每个区域可以根据不同的房间或空间(例如书房、浴室、主卧室、卧室、厨房、餐厅、客厅和/或阳台)被赋予名称。在一种情况下,单个回放区域可以包括多个房间或空间。在另一种情况下,单个房间或空间可以包括多个回放区域。
如图1所示,阳台、餐厅、厨房、浴室、书房和卧室区域均具有一个回放设备,而客厅和主卧室区域均具有多个回放设备。在客厅区域中,回放设备104、106、108和110可以被配置为作为单独的回放设备、作为一个或多个绑定的回放设备、作为一个或多个合并的回放设备或其任何组合来同步播放音频内容。类似地,在主卧室的情况下,回放设备122和124可以被配置为作为单独的回放设备、作为绑定的回放设备、或作为合并的回放设备来同步播放音频内容。
在一个示例中,图1的环境中的一个或多个回放区域可以分别播放不同的音频内容。例如,用户可以在阳台区域中烧烤并收听正由回放设备102播放的嘻哈音乐,而另一用户可以正在厨房区域中准备食物并收听正由回放设备114播放的古典音乐。在另一示例中,回放区域可以与另一回放区域同步地播放相同的音频内容。例如,用户可以在书房区域中,其中回放设备118正在播放与阳台区域中的回放设备102正在播放的摇滚音乐相同的摇滚音乐。在这种情况下,回放设备102和118可以同步播放摇滚音乐,使得用户可以在不同回放区域之间移动时无缝地(或至少基本上无缝地)享受被外放播放的音频内容。可以以类似于如先前引用的美国专利No.8,234,395中所述的回放设备之间的同步的方式来实现回放区域之间的同步。
如上文所建议的,可以动态地修改媒体回放系统100的区域配置,并且在一些实施例中,媒体回放系统100支持多种配置。例如,如果用户将一个或多个回放设备物理地移动到区域中或从区域中移出,则可以重新配置媒体回放系统100以适应改变。例如,如果用户将回放设备102从阳台区域物理地移动到书房区域,则书房区域现在可以包括回放设备118和回放设备102。可以通过诸如控制设备126和128之类的控制设备,将回放设备102与书房区域配对或分组,和/或重新命名(如果需要)。另一方面,如果一个或多个回放设备被移动到家居环境中还不是回放区域的特殊区域,则可以针对该特殊区域创建新的回放区域。
此外,媒体回放系统100的不同回放区域可以被动态组合为区域组或分成单独的回放区域。例如,餐厅区域和厨房区域14可以组合为用于宴会的区域组,使得回放设备112和114可以同步呈现音频内容。另一方面,如果用户期望在客厅空间中听音乐,而另一用户期望看电视,则客厅区域可以被分成包括回放设备104的电视区域和包括回放设备106、108和110的收听区域。
c.示例控制设备
图3示出示例控制设备300的功能框图,示例控制设备300可以被配置为媒体回放系统100的控制设备126和128之一或两者。控制设备300也可以被称为控制器。如图所示,控制设备300可以包括处理器302、存储器304、网络接口306和用户界面308。在一个示例中,控制设备300可以是媒体回放系统100的专用控制器。在另一示例中,控制设备300可以是可以在其上安装媒体回放系统控制器应用软件的网络设备,例如,iPhoneTM、iPadTM或任何其他智能电话、平板计算机或网络设备(例如,联网计算机,如PC或MacTM)。
处理器302可以被配置为执行与有助于用户对媒体回放系统100进行访问、控制和配置相关的功能。存储器304可以被配置为存储可由处理器302执行的指令以执行这些功能。存储器304还可以被配置为存储媒体回放系统控制器应用软件和与媒体回放系统100和用户相关联的其他数据。
在一个示例中,网络接口306可以基于行业标准(例如,红外、无线电、包括IEEE802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准在内的无线标准等)。网络接口306可以提供用于控制设备300与媒体回放系统100中的其他设备通信的手段。在一个示例中,可以经由网络接口306在控制设备300和其他设备之间传送数据和信息(例如,状态变量)。例如,媒体回放系统100中的回放区域和区域组配置可以由控制设备300通过网络接口306从回放设备或另一网络设备接收,或者由控制设备300通过网络接口306向另一回放设备或网络设备发送。在一些情况下,该另一网络设备可以是另一控制设备。
诸如音量控制和音频回放控制之类的回放设备控制命令也可以通过网络接口306从控制设备300向回放设备传送。如上文所建议的,还可以由用户使用控制设备300来执行对媒体回放系统100的配置的改变。配置改变可以包括:向区域增加或从区域中移除一个或多个回放设备、向区域组增加或从区域组中移除一个或多个区域、形成绑定或合并的播放器、将一个或多个回放设备与绑定或合并的播放器中分离等。因此,控制设备300有时可以被称为控制器300,无论控制设备300是专用控制器还是在其上安装有媒体回放系统控制器应用软件的网络设备。
控制设备300的用户界面308可以被配置为通过提供诸如图4中所示的控制器界面400之类的控制器界面来帮助用户访问和控制媒体播放系统100。控制器界面400包括回放控制区410、回放区域区420、回放状态区430、回放队列区440和音频内容源区450。所示的用户界面400仅是可以在诸如图3的控制设备300(和/或图1的控制设备126和128)之类的网络设备上提供、并由用户访问以控制媒体回放系统(例如,媒体回放系统100)的用户界面的一个示例。备选地,可以在一个或多个网络设备上实现变化的格式、样式和交互序列的其他用户界面,以提供对媒体回放系统的类似的控制访问。
回放控制区410可以包括可选择(例如,通过触摸或通过使用光标)图标,以使所选择的回放区域或区域组中的回放设备播放或暂停、快进、回退、跳到下一个、跳到前一个、进入/退出随机播放模式、进入/退出重复模式、进入/退出交叉淡入淡出模式(cross fademode)。回放控制区410还可以包括用于修改均衡设置、回放音量等的可选择图标。
回放区域区420可以包括媒体回放系统100内的回放区域的表示。在一些实施例中,回放区域的图形表示可以是可选择的,以调出附加的可选择图标来管理或配置媒体回放系统中的回放区域,例如,创建绑定的区域、创建区域组、分离区域组、重命名区域组等。
例如,如图所示,可以在播放区域的每个图形表示内提供“分组”图标。在特定区域的图形表示内提供的“分组”图标可以是可选择的,以便调出用于选择媒体播放系统中的、将与特定区域分在一组的一个或多个其他区域的选项。一旦被分组,已经与特殊区域分在一组的区域中的回放设备将被配置为与特殊区域中的回放设备同步地播放音频内容。类似地,可以在区域组的图形表示内提供“分组”图标。在这种情况下,“分组”图标可以是可选择的,以调出用于取消选择区域组中的要从该区域组中移除的一个或多个区域的选项。通过诸如用户界面400之类的用户界面对区域进行分组和取消分组的其他交互和实现也是可能的。当回放区域或区域组配置被修改时,可以动态地更新回放区域在回放区域区420中的表示。
回放状态区430可以包括在所选择的回放区域或区域组中当前正在播放、先前播放或安排为接下来播放的音频内容的图形表示。可以在用户界面上可视地区分所选择的回放区域或区域组,例如,在回放区域区420和/或回放状态区430内。图形表示可以包括曲目名称、艺术家姓名、专辑名称、专辑年份、曲目长度以及当通过用户界面400控制媒体回放系统时用户知道了会有用的其他相关信息。
回放队列区440可以包括与所选择的回放区域或区域组相关联的回放队列中的音频内容的图形表示。在一些实施例中,每个回放区域或区域组可以与回放队列相关联,该回放队列包含与由该回放区域或区域组回放的零个或多个音频项相对应的信息。例如,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,其可以由回放区域或区域组中的回放设备用于从本地音频内容源或联网音频内容源查找和/或获取音频项,可能供回放设备回放。
在一个示例中,可以将播放列表添加到回放队列,在这种情况下,可以将与播放列表中的每个音频项对应的信息添加到回放队列。在另一示例中,回放队列中的音频项可以被保存为播放列表。在另一示例中,当回放区域或区域组正在持续播放流式音频内容(例如,互联网收音机,其可以持续播放直到被停止),而不是具有回放持续时间的分立音频项时,回放队列可以是空的或被填充但是“未使用”。在备选实施例中,回放队列可以包括互联网收音机和/或其他流式音频内容项,并且当回放区域或区域组正在播放这些内容项时处于“使用中”。其他示例也是可能的。
当回放区域或区域组被“分组”或“取消分组”时,可以清除与受影响的回放区域或区域组相关联的回放队列,或者重新关联。例如,如果包括第一回放队列的第一回放区域与包括第二回放队列的第二回放区域被分在一组,则所建立的区域组可以具有相关联的回放队列,其最初是空的,包含来自第一回放队列的音频项(例如,如果第二回放区域被添加到第一回放区域),或包含来自第二回放队列的音频项(例如,如果第一回放区域被添加到第二回放区域),或包含来自第一回放队列和第二回放队列二者的音频项的组合。随后,如果所建立的区域组被取消分组,则所得到的第一回放区域可以与先前的第一回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含与来自在所建立的区域组被取消分组之前所建立的区域组相关联的回放队列的音频项。类似地,所得到的第二回放区域可以与先前的第二回放队列重新关联,或者与新的回放队列相关联,该新的回放队列是空的,或者包含来自在与所建立的区域组被取消分组之前所建立的区域组相关联的回放队列的音频项。其他示例也是可能的。
返回参考图4的用户界面400,音频内容在回放队列区440中的图形表示可以包括曲目标题、艺术家姓名、曲目长度以及与回放队列中的音频内容相关联的其他相关信息。在一个示例中,音频内容的图形表示可以是可选择的,以调出附加的可选择图标来管理和/或操纵回放队列和/或回放队列中表示的音频内容。例如,可以将所表示的音频内容从回放队列中移除,将所表示的音频内容移动到回放队列内的不同位置,或者选择所表示的音频内容以立即播放,或者在任何当前播放的音频内容之后进行播放等。与回放区域或区域组相关联的回放队列可以存储于该回放区域或区域组中的一个或多个回放设备上、不在该回放区域或区域组中的回放设备上和/或一些其他指定设备上的存储器中。这种回放队列的回放可以涉及一个或多个回放设备可能按顺序或随机顺序回放队列中的媒体项。
音频内容源区450可以包括可选择的音频内容源的图形表示,可以从音频内容源中获取音频内容,并由所选择的回放区域或区域组来播放。有关音频内容源的讨论可参见以下部分。
d.示例音频内容源
如前所述,区域或区域组中的一个或多个回放设备可以被配置为从各种可用音频内容源中获取回放音频内容(例如,根据音频内容的对应URI或URL)。在一个示例中,回放设备可以直接从对应的音频内容源(例如,线路输入连接)中获取音频内容。在另一示例中,可以在网络上,通过一个或多个其他回放设备或网络设备向回放设备提供音频内容。
示例音频内容源可以包括:媒体回放系统(例如,图1的媒体回放系统100)中的一个或多个回放设备的存储器、一个或多个网络设备(例如,控制设备、支持网络的个人计算机、或者网络附接存储器(NAS)等)上的本地音乐库、通过互联网(例如,云)提供音频内容的流式音频服务、或者通过回放设备或网络设备上的线路输入连接连接至媒体回放系统的音频源等。
在一些实施例中,可以在诸如图1的媒体回放系统100之类的媒体回放系统中定期添加音频内容源,或从中移除音频内容源。在一个示例中,每当添加、移除或更新一个或多个音频内容源时,可以执行对音频项编索引。对音频项编索引可以包括:扫描由媒体回放系统中的回放设备可访问的网络上共享的所有文件夹/目录中的可识别音频项,并且生成或更新包含元数据(例如,标题、艺术家、专辑、曲目长度等)及其他关联信息(例如,找到的每个可识别音频项的URI或URL)的音频内容数据库。用于管理和维护音频内容源的其他示例也是可能的。
e.示例处理系统
图5示出了示例处理系统500的功能框图,示例处理系统500包括音频输入/输出组件502、唤醒词检测组件504和通知组件506。在操作中,处理系统500检测所记录的音频内容内的唤醒词,并向NMD提供通知,以忽略或以其他方式抑制NMD对检测的唤醒词的经编程的唤醒响应。在各个实施例中,处理系统500可以在回放设备、NMD或诸如云服务器的单独的处理设备等中实现。在一些实施例中,处理系统的各种组件(和/或其功能)分布在多个设备之间。
在操作中,音频输入/输出组件502经由输入接口接收指定由回放设备进行回放的所记录的音频内容。例如,控制设备(例如,图1的控制设备126或128)可以指示回放设备(例如,图1的任何回放设备)回放某些音频内容,这可能通过将该内容放置在回放设备的回放队列中以使回放设备获取音频内容,通过将音频内容流引导到回放设备,或者通过经由模拟或数字线路输入接口将音频内容引导到回放设备等来进行。处理系统500的音频/输入组件502在回放设备回放音频内容之前接收该所记录的音频内容。
如上所述,在一些示例中,处理系统500在回放设备内实现。在这些实施例中,回放设备500已经可以访问回放必需的音频内容。例如,回放设备可以通过一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)来经由网络接口从网络源(例如,流式媒体服务或移动设备)接收音频内容。备选地,回放设备可以经由模拟(例如,RCA)或数字(例如,
Figure GDA0004158897650000171
或/>
Figure GDA0004158897650000172
)输入线接口接收音频内容。
在其他示例中,处理系统500在NMD或与回放设备分离的其他处理设备内实现。在这些实施例中,处理系统500可以经由网络接口从回放设备或从音频内容的源等接收音频内容。在另一示例中,输入线接口可以将音频内容直接提供给NMD,或者回放设备可以经由输入线接口接收音频内容,并且通过一个或多个网络将内容中继给处理系统500。
例如,处理系统500可以访问回放设备的回放队列。如上所述,回放队列中的每个音频项可以包括统一资源标识符(URI)、统一资源定位符(URL)或一些其他标识符,它们可由回放区域或区域组中的回放设备使用以从本地音频内容源或联网的音频内容源查找和/或获取音频项,可能用于回放设备进行回放。在被回放设备回放之前,处理系统500可以类似地使用这种标识符从本地音频内容源或联网的音频内容源获取音频内容。
在一些实施方式中,回放队列被存储在回放设备的数据存储设备中。在其他实施方式中,回放队列被存储在云服务器上。存储在云服务器上的回放队列(即,云队列)可以是存储在回放设备上的回放队列的实例或表示。云队列可以包括回放指针或表示回放设备上的当前回放状态的其他状态信息。
在一些情况下,处理系统500可以将所接收的音频内容转换成适于唤醒词检测的格式。例如,如果经由模拟输入线接口将音频内容提供给音频/输入组件502,则处理系统500可以将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)。作为另一示例,如果所接收的音频内容是以不适于分析的数字形式接收到的,则处理系统500可以将该记录转码为合适的格式。
唤醒词检测组件504对所接收的音频内容进行分析,以确定记录中是否存在任何唤醒词。唤醒词检测组件504可以使用唤醒词检测算法来分析所接收的音频内容。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。
在一些实施方式中,唤醒词检测组件504可以对记录使用与如下算法相同的算法:由NMD使用以检测经由麦克风记录的音频中的唤醒词的算法。在典型操作期间,示例NMD不断记录音频并将所记录的音频流提供给唤醒词检测算法,以便确定所记录的音频是否包括唤醒词。这里,不同于将由NMD的麦克风记录的音频提供给唤醒词检测算法,唤醒词检测组件504提供指定用于回放的预先记录的音频内容。
在分析期间,唤醒词检测组件504还确定每个唤醒词出现在所接收的音频内容中的位置。例如,唤醒词检测组件504可以将所接收的音频内容划分成已知长度的片段。然后,唤醒词检测组件504可以通过识别检测到唤醒词的片段来确定唤醒词出现在记录中的位置。例如,如果每个片段长5秒,并且在第四片段中检测到唤醒词,则唤醒词必定位于记录中的15到20秒之间。唤醒词检测组件504可以记录音频内容中包含唤醒词的各部分,可能使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来记录。这些时间戳可以定义与音频记录的开始或音频记录中的另一特定位置的相应时间偏移。在一些情况下,唤醒词检测组件504可以将音频记录分为重叠的片段,以避免将唤醒词分解为不可识别的部分。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在示例内,处理系统500可以将所接收的音频内容缓冲在存储器中。例如,处理系统500可以将所接收的音频内容存储在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理以确定所接收的音频内容是否包含唤醒词时,从缓冲器中移除这些唤醒词。
在一些情况下,唤醒词检测组件504同时(或基本同时)对所接收的音频内容运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的
Figure GDA0004158897650000191
APPLE的
Figure GDA0004158897650000192
或MICROSOFT的/>
Figure GDA0004158897650000193
)各自使用不同的唤醒词来调用其相应的语音服务。为了支持多种服务,唤醒词检测组件504可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法。
如果在音频内容中检测到一个或多个唤醒词,则通知组件506通知一个或多个NMD(例如,图1的NMD 132和/或134)。当在回放设备回放包含唤醒词的音频内容的过程中回放检测到的唤醒词时,该通知使NMD忽略检测到的唤醒词。例如,通知组件506可以通过网络接口向一个或多个NMD发送指令,以忽略某些唤醒词或某个数量的唤醒词。
在一些情况下,通知组件506可以防止NMD在唤醒词被回放设备回放时检测该唤醒词。例如,通知组件506可以指示NMD停止收听唤醒词(例如,停止对所记录的音频进行处理)一段时间。备选地,通知组件506可以指示NMD暂时停用其麦克风阵列(例如,在与唤醒词预期被回放设备播放的时间相对应的时间段期间)。作为又一示例,通知组件506可以指示NMD使用其麦克风阵列在回放设备的方向上创建收听无效,使得NMD不检测唤醒词。也可以使用其他示例。
备选地,NMD可以检测唤醒词,但是通知组件506指示NMD抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务。例如,通知组件506可以指示NMD在某些时间段期间忽略唤醒词或者在某些时间段期间忽略所有音频。也可以使用其他示例。
当在回放设备可听地回放音频内容之前处理音频内容时,处理设备(例如,回放设备或NMD)也可以确定所记录的音频内容的哪些部分包含唤醒词。这些部分可以由音频内容内的时间段来定义,例如唤醒词的开始和停止时间(例如,播客中的唤醒词从33:52.543开始并在33:54.013结束)。在回放音频内容时,可以指示附近的NMD在这些时间段期间忽略唤醒词。
作为另一示例,处理系统500可以对音频内容(或音频内容的一部分)中唤醒词的数量进行计数。例如,处理系统500可能在示例音频内容(例如,电视节目)中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,处理系统500可以指示附近的MD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的三个唤醒词)。
在其他示例中,处理系统500可以在所记录的音频内容中动态插入音频音调或其他标记,以指定在音频内容中检测到的唤醒词。然后,当回放设备回放音频内容时,可以指示将音频标记和唤醒词一起检测到的NMD忽略该唤醒词的实例。如果多个NMD在回放设备的可听范围内,则响应于检测到相关联的音频标记,检测到唤醒词的每个NMD可以忽略该唤醒词。在一些情况下,音频标记由人类听觉范围之外(例如,20kHz以上)的音频频率组成,使得插入的音调不会被听众察觉。
在一些实施方式中,处理系统500作为音频内容源与回放设备之间的中介进行操作。例如,在处理系统500使用音频标记通知NMD的实施方式中,处理系统修改被指定用于由回放设备回放的音频内容。在这些实施方式中,处理系统500可以(例如,经由网络或输入线接口)从音频源接收音频内容,对音频内容进行分析,并且将经修改的音频内容(可能经由网络接口)提供给回放设备以供回放。
备选地,如上所述,处理系统500被实现在回放设备本身中。在这种情况下,在对音频内容进行分析之后,回放设备可以继续回放音频内容。此外,如上所述,在一些情况下,回放设备可以被配置为与一个或多个附加回放设备同步回放音频内容(例如,在区域组、立体声对或环绕声配置中)。在这种情况下,回放设备可以将(可能经修改的)音频内容(可能经由网络接口)提供给该一个或多个附加回放设备。
在另外的示例中,处理系统500在NMD中实现。在这些情况下,处理系统500可以使NMD本身在回放音频内容时忽略音频内容中的唤醒词。此外,NMD可以指示其他NMD忽略唤醒词。例如,NMD 132可以指示NMD 134忽略唤醒词。此外,如果NMD在回放设备(例如,回放设备104)中实现,则NMD/回放设备可以指示其他NMD(其本身可以在回放设备中实现)忽略唤醒词。
f.示例多个联网设备
图6示出了示例多个设备600,其可以被配置为基于语音控制提供音频回放体验。本领域普通技术人员将理解,图6中所示的设备仅用于说明目的,并且包括不同和/或附加设备的变型是可能的。如图所示,多个设备600包括计算设备604、606和608;网络麦克风设备(NMD)612、614和616;回放设备(PBD)632、634、636和638;以及控制器设备(CR)622。
多个设备600中的每个设备可以是具有网络功能的设备,其可以根据一个或多个网络协议(例如,NFC、蓝牙、以太网和IEEE 802.11等),在一种或多种类型的网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)上与多个设备中的一个或多个其他设备建立通信。
如图所示,计算设备604、606和608可以是云网络602的一部分。云网络602可以包括附加的计算设备。在一个示例中,计算设备604、606和608可以是不同的服务器。在另一示例中,计算设备604、606和608中的两个或更多个可以是单个服务器的模块。类似地,计算设备604、606和608中的每一个可以包括一个或多个模块或服务器。本文中为了便于说明,计算设备604、606和608中的每一个可以被配置为在云网络602内执行特殊功能。例如,计算设备608可以是用于流式音乐服务的音频内容源。
如图所示,计算设备604可以被配置为经由通信路径642与NMD 612、614和616接口连接。NMD 612、614和616可以是一个或多个“智能家居”系统的组件。在一种情况下,NMD612、614和616可以物理地分布在整个家中,类似于图1所示的设备分布。在另一种情况下,NMD 612、614和616中的两个或更多个可以物理地位置彼此相对靠近。通信路径642可以包括一种或多种类型的网络,例如包括互联网的WAN、LAN和/或PAN等。
在一个示例中,NMD 612、614和616中的一个或多个可以是被配置为主要用于音频检测的设备。在另一示例中,NMD 612、614和616中的一个或多个可以是具有各种主要实用程序的设备的组件。例如,如上面结合图2和图3所讨论的,NMD 612、614和616中的一个或多个可以是回放设备200的麦克风220或网络设备300的麦克风310。此外,在一些情况下,NMD612、614和616中的一个或多个可以是回放设备200或网络设备300。在示例中,NMD 612、614和/或616中的一个或多个可以包括布置在麦克风阵列中的多个麦克风。
如图所示,计算设备606可以被配置为经由通信路径644与CR 622和PBD 632、634、636和638接口连接。在一个示例中,CR 622可以是网络设备,例如图2的网络设备200。因此,CR 622可以被配置为提供图4的控制器界面400。类似地,PBD 632、634、636和638可以是回放设备,例如图3的回放设备300。这样,PBD 632、634、636和638可以物理地分布在整个家中,如图1所示。为了说明目的,PBD 636和638可以是绑定区域630的一部分,而PBD 632和634可以是它们各自区域的一部分。如上所述,PBD 632、634、636和638可以被动态地绑定、分组、解除绑定和取消分组。通信路径644可以包括一种或多种类型的网络,例如包括互联网的WAN、LAN和/或PAN等。
在一个示例中,与NMD 612、614和616一样,CR 622和PBD 632、634、636和638也可以是一个或多个“智能家居”系统的组件。在一种情况下,PBD 632、634、636和638与NMD612、614和616分布在相同的家中。此外,如上文建议的,PBD 632、634、636和638中的一个或多个可以是NMD 612、614和616中的一个或多个。
NMD 612、614和616可以是局域网的一部分,并且通信路径642可以包括通过WAN(通信路径,未示出)将NMD 612、614和616的局域网链接到计算设备604的接入点。同样地,NMD 612、614和616中的每一个可以经由该接入点彼此通信。
类似地,CR 622和PBD 632、634、636和638可以是局域网和/或本地回放网络的一部分(如前面部分中讨论的),并且通信路径644可以包括通过WAN将CR 622和PBD 632、634、636和638的局域网和/或本地回放网络链接到计算设备606的接入点。这样,CR 622和PBD632、634、636和638中的每一个也可以通过该接入点彼此通信。
在一个示例中,通信路径642和644可以包括相同的接入点。在示例中,NMD 612、614和616、CR 622和PBD 632、634、636和638中的每一个可以通过家庭的相同接入点来访问云网络602。
如图6所示,NMD 612、614和616、CR 622和PBD 632、634、636和638中的每一个还可以通过通信方式646与一个或多个其他设备直接通信。如本文所述的通信方式646可以包括根据一个或多个网络协议通过一种或多种类型的网络在设备之间的一种或多种形式的通信,和/或可以包括通过一个或多个其他网络设备的通信。例如,通信方式646可以包括蓝牙TM(IEEE 802.15)、NFC、无线直连和/或专有无线等中的一个或多个。
在一个示例中,CR 622可以通过蓝牙TM与NMD 612通信,并且可以通过另一局域网与PBD 634通信。在另一示例中,NMD 614可以通过另一局域网与CR 622通信,并且可以通过蓝牙与PBD 636通信。在又一示例中,PBD 632、634、636和638中的每一个可以根据生成树协议通过本地回放网络彼此通信,同时分别通过不同于本地回放网络的局域网与CR 622通信。其他示例也是可能的。
在一些情况下,NMD 612、614和616、CR 622和PBD 632、634、636和638之间的通信方式可以根据设备间的通信类型、网络状况和/或时延要求而改变。例如,当NMD 616首次被引入具有PBD 632、634、636和638的家中时,可以使用通信方式646。在一种情况下,NMD 616可以通过NFC向PBD 638发送与NMD 616相对应的标识信息,并且作为响应,PBD 638可以通过NFC(或某种其他形式的通信)向NMD 616发送局域网信息。然而,一旦在家中配置了NMD616,NMD 616和PBD 638之间的通信方式可能改变。例如,NMD 616可以随后通过通信路径642、云网络602和通信路径644与PBD 638通信。在另一示例中,NMD和PBD可能从不通过本地通信方式646通信。在另一示例中,NMD和PBD可以主要通过本地通信方式646通信。其他示例也是可能的。
在说明性示例中,NMD 612、614和616可以被配置为接收用于控制PBD 632、634、636和638的语音输入。可用的控制命令可以包括先前讨论的任何媒体回放系统控制,例如回放音量控制、回放传输控制、音乐源选择和分组等。在一个实例中,NMD 612可以接收用于控制PBD 632、634、636和638中的一个或多个的语音输入。响应于接收到语音输入,NMD 612可以通过通信路径642向计算设备604发送语音输入以进行处理。在一个示例中,计算设备604可以将语音输入转换为等效的文本命令,并解析该文本命令以识别命令。然后,计算设备604可以随后向计算设备606发送文本命令。在另一示例中,计算设备604可以将语音输入转换为等效的文本命令,然后向计算设备606发送文本命令。然后,计算设备606可以解析文本命令以识别一个或多个回放命令。
例如,如果文本命令是“在区域中播放来自流式服务的艺术家的曲目”,则计算设备606可以标识(i)从流式服务1可获得的艺术家1的曲目1的URL,以及(ii)区域1中的至少一个回放设备。在该示例中,来自流式服务1的艺术家1的曲目1的URL可以是指向计算设备608的URL,并且区域1可以是绑定区域630。这样,当识别出URL以及PBD 636和638之一或两个时,计算设备606可以经由通信路径644向PBD 636和638之一或两个发送所识别的URL,用于回放。作为响应,PBD 636和638之一或两个可以根据所接收的URL从计算设备608中获取音频内容,并且开始播放来自流式服务1的艺术家1的曲目1。
在又一示例中,计算设备604可以执行一些处理以识别用户的意图或相关命令,并且向计算设备606提供与语音输入相关的媒体内容的相关信息。例如,计算设备604可以对语音输入执行话语到文本转换,并分析语音输入,以得到命令或意图(例如,播放、暂停、停止、音量增大、音量减小、跳过、下一个、分组、取消分组)以及关于如何执行命令的其他信息。计算设备604或计算设备606可以确定哪些PBD命令对应于由计算设备604确定的命令或意图。可以从计算设备604向计算设备606发送从语音输入确定的命令或意图和/或与执行命令相关的其他信息。计算设备604上的处理可以由应用、模块、附加软件、具有本地联网麦克风系统软件平台的集成件、和/或本地联网麦克风系统软件平台来执行。
本领域普通技术人员将了解,以上仅是一个说明性示例,并且其他实现也是可能的。在一种情况下,如上所述,多个设备600中的一个或多个执行的操作可以由多个设备600中的一个或多个其他设备来执行。例如,从语音输入到文本命令的转换可以替代地、部分地或完全由另一个或多个设备来执行,例如NMD 612、计算设备606、PBD 636和/或PBD 638。类似地,URL的标识可以替代地、部分地或完全由另一个或多个设备执行,例如,NMD 612、计算设备604、PBD 636和/或PBD 638。
f.示例网络麦克风设备
图7示出示例网络麦克风设备700的功能框图,示例网络麦克风设备700可以被配置为图6的NMD 612、614和616中的一个或多个。如图所示,网络麦克风设备700包括处理器702、存储器704、麦克风阵列706、网络接口708、用户界面710、软件组件712和扬声器714。本领域普通技术人员将了解,其他网络麦克风设备配置和布置也是可能的。例如,备选地,网络麦克风设备可以不包括扬声器714,或者具有单个麦克风而不是麦克风阵列706。
处理器702可以包括一个或多个处理器和/或控制器,其可以采用通用或专用处理器或控制器的形式。例如,处理单元702可以包括微处理器、微控制器、专用集成电路、数字信号处理器等。存储器704可以是数据存储设备,其可以加载有可由处理器702执行以实现这些功能的一个或多个软件组件。因此,存储器704可以包括一个或多个非暂时性计算机可读存储介质,其示例可以包括:易失性存储介质(例如,随机存取存储器、寄存器、高速缓存等)、以及非易失性存储介质(例如,只读存储器、硬盘驱动器、固态驱动器、闪存和/或光储存设备等)。
麦克风阵列706可以是多个麦克风,其被布置为检测网络麦克风设备700的环境中的声音。麦克风阵列706可以包括现在已知或以后开发的任何类型的麦克风,例如,电容式麦克风、驻极体电容式麦克风或动态麦克风等。在一个示例中,麦克风阵列可以被布置为检测来自相对于网络麦克风设备的一个或多个方向的音频。麦克风阵列706可以对频段的一部分敏感。在一个示例中,麦克风阵列706的第一子集可以对第一频段敏感,而麦克风阵列的第二子集可以对第二频段敏感。麦克风阵列706还可以被布置为捕捉音频源(例如,语音、可听声音)的位置信息和/或帮助过滤背景噪声。值得注意的是,在一些实施例中,麦克风阵列可以仅由单个麦克风组成,而不是由多个麦克风组成。
网络接口708可以被配置为促进各种网络设备(例如,参考图6,其中的CR 622、PBD632-638、云网络602中的计算设备604-608,以及其他网络麦克风设备等)之间的无线和/或有线通信。这样,网络接口708可以采用任何合适的形式来执行这些功能,其示例可以包括:以太网接口、串行总线接口(例如,Fire Wire、USB 2.0等)、适于促进无线通信的芯片组和天线、和/或提供有线和/或无线通信的任何其他接口。在一个示例中,网络接口708可以基于行业标准(例如,红外、无线电、包括IEEE 802.3的有线标准、包括IEEE 802.11a、802.11b、802.11g、802.11n、802.11ac、802.15、4G移动通信标准在内的无线标准等)。
网络麦克风设备700的用户界面710可以被配置为促进与网络麦克风设备的用户交互。在一个示例中,用户界面708可以包括物理按钮、设置在触敏屏幕和/或表面上的图形界面等中的一个或多个,以供用户直接向网络麦克风设备700提供输入。用户界面710还可以包括灯和扬声器714中的一个或多个,以向用户提供视觉和/或音频反馈。在一个示例中,网络麦克风设备700还可以被配置为通过扬声器714回放音频内容。
III.回放设备停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图8示出了示例实现800,通过该实现800,回放设备停用一个或多个MD的唤醒响应。
a.接收表示音频内容的数据以供回放
在框802处,实现802涉及接收表示音频内容的话数据以供回放。例如,回放设备可以接收音频内容以供回放设备进行回放。示例回放设备包括图1中所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任一个,其例如可以被实现为图2的回放设备200。在一些实施方式中,回放设备可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(例如,图5的音频输入/输出组件502)来接收表示音频内容的数据。
示例音频内容包括一个或多个音频曲目、脱口秀、电源、电视节目、播客、互联网流式视频,以及其他可能形式的音频内容。音频内容可以包括伴随视频的音频内容(例如,视频的音频曲目)或不伴随视频的音频。
回放设备可以经由输入接口来接收音频内容,该输入接口可以是有线或无线网络接口或者模拟或数字输入线接口等。例如,回放设备可以通过一种或多种网络(例如,广域网(WAN)、局域网(LAN)和个域网(PAN)等)经由网络接口从网络源接收音频内容。
回放设备可以从本地或远程音频源接收表示音频内容的数据。例如,回放设备可以从以下接收音频内容:本地媒体服务器或局域网上的其他设备、由回放设备或与回放设备(例如,通过局域网经由网络接口)进行通信的另一设备读取的介质(例如,CD、DVD、蓝光、闪存或硬盘驱动器)、回放设备本身上的数据存储设备。回放设备可以从一个或多个云服务器接收音频内容作为音频内容流。例如,回放设备可以经由网络接口根据URL获取音频内容流。备选地,回放设备可以从回放设备上或与回放设备(例如,经由网络接口通过局域网)进行通信的另一设备上的输入线接口接收音频内容。
在一些情况下,回放设备可能经由模拟输入线接口以模拟格式接收音频内容。在这些情况下,回放设备将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)为适于处理的格式。备选地,与回放设备进行通信的设备可以接收模拟格式的音频内容,将音频内容数字化,并且将表示音频内容的数据发送给回放设备。
如上所述,所接收的音频内容被设计用于由回放设备回放。例如,控制设备(如图1的控制设备126或128)可以指示回放设备回放某些音频内容,也许通过使该音频内容放置在回放设备的回放队列中来进行。将音频曲目或其他音频内容放置在这种队列中可能使回放设备在经由控制设备或回放设备本身上的控制启动(例如,播放/暂停按钮)回放之后获取音频内容。回放设备可以通过以下方式从本地或远程音频源获取音频内容:经由网络接口将音频内容流引导到回放设备,或者经由模拟或数字输入线接口将音频内容引导到回放设备等。
在示例内,回放设备可以将所接收的音频内容的至少一部分存储在存储器中。例如,回放设备可以将所接收的音频内容缓冲在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理时从缓冲器中移除这些唤醒词,这使得回放设备能够确定所接收的音频内容是否包含唤醒词。
b.在音频内容中检测一个或多个唤醒词
返回参考图8,在框804处,实现800涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,回放设备可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,回放设备可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。
回放设备可以使用一种或多种唤醒词检测算法对所接收的音频内容进行分析。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。许多第一方和第三方唤醒词检测算法是已知的并且可商购。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在一些实施方式中,回放设备可以对所接收的表示音频内容的数据使用与以下算法相同或相似的算法:MD所使用的用于检测经由麦克风记录的音频中的唤醒词的算法。以这种方式,回放设备可以检测到音频内容中的与在NMD的可听范围内回放音频内容时NMD本会检测到的唤醒词相同或相似的唤醒词。然而,鉴于NMD通常对变化环境条件(例如,可能是吵杂的家庭环境)中各种各样的人类语音说出的由麦克风记录的音频运行唤醒词检测算法,因此,在没有这种变化性的情况下,对所接收的音频内容运行唤醒词算法对检测唤醒词甚至可能更有效。
在分析期间,回放设备可以确定每个唤醒词出现在所接收的音频内容中的位置。在识别出音频内容中确定为包括唤醒词的各部分之后,回放设备可以使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来标注音频内容的这些部分。最终,这些时间戳可用于停用一个或多个NMD对与每个时间戳相对应的唤醒词的唤醒响应。
在一个示例中,回放设备可以将所接收的音频内容划分为已知长度的片段。然后,回放设备通过识别检测到唤醒词的片段来识别音频内容中包括唤醒词的部分(即片段)。例如,如果每个片段长3秒,并且在第四片段中检测到唤醒词,则唤醒词位于记录的9到12秒之间。在一些情况下,回放设备可以将音频记录分为重叠的片段,以避免将唤醒词分解为不可识别的部分(例如,一个片段表示“Hey”,另一片段表示“Siri”)。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在一些情况下,回放设备同时(或基本同时)对所接收的音频内容运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的
Figure GDA0004158897650000291
APPLE的/>
Figure GDA0004158897650000292
或MICROSOFT的/>
Figure GDA0004158897650000293
)可以各自使用不同的唤醒词来调用其相应的语音服务。此外,一些语音服务可以允许用户选择偏好的唤醒词或配置定制的唤醒词。为了支持多种服务(和/或不同的唤醒词),回放设备可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法。例如,回放设备在回放设备回放音频内容之前,向音频内容应用针对第一语音服务的第一音频检测算法,以检测至少一个针对第一语音服务的第一唤醒词,并且在回放设备回放音频内容之前,向音频内容应用针对第二语音服务的第二音频检测算法,以检测至少一个针对第二语音服务的第二唤醒词。回放设备也可以将(可能针对于相应的语音服务的)附加的音频检测算法应用于音频内容。
c.使一个或多个NMD在音频内容的回放期间停用对检测到的一个或多个唤醒词的 相应唤醒响应
在图8中,在框806处,实现800涉及在音频内容的回放期间使一个或多个联网的麦克风设备停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,回放设备可以使在回放设备的音频范围内的NMD在回放设备回放音频内容期间停用NMD对检测到的一个或多个唤醒词的相应唤醒响应。如上所述,回放设备可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且使用该通知组件,在回放设备回放音频内容期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。
如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
在一些实施方式中,回放设备本身包括NMD(例如,在回放设备内实现NMD 700)。在这些实施方式中,当回放设备正在回放音频内容时,回放设备停用其自身的NMD对检测到的一个或多个唤醒词的唤醒响应。例如,在回放设备中实现的处理系统500的实例可以将一个或多个唤醒词及其相应的回放时间通知给NMD,以便使NMD停用对检测到的一个或多个唤醒词的唤醒响应。例如,处理系统可以通过改变RAM中的标志以停用唤醒响应,或者通过使用内部通信总线向NMD传送消息等来通知NMD。然后,在回放音频内容的同时,回放设备的NMD可以经由麦克风记录正由回放设备回放的音频内容,并且停用NMD对所记录的音频内容内的一个或多个唤醒词的相应唤醒响应。
在示例实施方式中,回放设备可以使家庭内的所有联网麦克风设备停用它们相应的唤醒响应。例如,图1所示的回放设备104可以在回放设备104回放包含一个或多个唤醒词的音频内容时使NMD 132和134停用它们相应的唤醒响应。此外,如果回放设备102或106—124中的任何一个实现NMD,则当回放设备104回放包含一个或多个唤醒词的音频内容时,回放设备104可以使这些回放设备停用它们相应的唤醒响应。更进一步,如果回放设备104本身实现NMD,或者如果控制设备126或128实现NMD,则当回放设备104回放音频内容时,回放设备104可以使这些设备停用它们相应的唤醒响应。
备选地,回放设备可以使家庭内的NMD的子集停用它们相应的唤醒响应。例如,回放设备可以使回放设备的可听范围内的NMD停用它们相应的唤醒响应。备选地,回放设备可以使已经与回放设备相关联的NMD停用它们相应的唤醒响应。
可以使用任何合适的技术来确定可听范围。在一些实施方式中,基于回放设备的回放配置来建立可听范围。例如,如果回放设备与一个或多个回放设备处于同步回放配置中,则可以假定这些回放设备在回放设备的可听范围内。因此,如果这些回放设备中的任何一个实现NMD,则这些回放设备的相应唤醒响应被停用。回放设备可以通过参考回放设备的配置来确定这些NMD在回放设备的可听范围内,该配置可以存储在对家中的各回放设备而言同步的一个或多个状态变量中。
在其他示例中,在设置过程(例如,校准过程)期间建立可听范围。在这种设置过程中,可以指示家中的NMD收听由家中的回放设备回放的音频信号(例如,音调)。如果NMD可以经由其麦克风检测到音频信号,则可以认为该NMD在可听范围内。可以指示家庭内的回放设备以不同的音量循环回放音频信号,以便确定任何给定音量水平下在每个回放设备的可听范围内的NMD集合。示例校准过程可以涉及校准声音的输出,该校准声音还可以用作将由家中的NMD检测到的音频信号。
为了说明,在示例设置过程期间,图1的控制设备126可以指示主卧室区域中的回放设备(即,回放设备122和124)输出音频信号。在大多数音量水平下,该输出被NMD 134检测到。然而,随着音量水平增加,其他NMD也开始检测到该输出。例如,回放设备118和控制设备128可以各自实现NMD,并且检测相对较高的音量水平下的音频信号输出。这样,经由示例设置过程,NMD 134被建立为位于回放设备122和124在某个音量范围(例如,5%至100%)下的可听范围内,而回放设备118和控制设备128被认为是被建立在位于回放设备122和124的某些较高音量范围(例如,音量水平>80%)下的可听范围内。可以针对家庭内的其他回放设备和NMD重复该过程。
在其他示例中,NMD可以基于已知的物理接近度与一个或多个回放设备配对。例如,返回参考图1,NMD 134可以与回放设备122和/或124配对,作为用于主卧室区域的NMD。可以经由诸如控制设备126或128的控制设备上的用户界面来配置这种配对。作为另一示例,根据NMD 132与厨房区域配对且已知厨房区域物理上接近餐厅和/或客厅区域,或者根据厨房区域与餐厅或客厅区域形成在区域组中,可以将NMD 132与回放设备104、106、108、110、112和/或114配对。如果NMD与一个或多个回放设备配对,则可以假定NMD在这些回放设备的可听范围内。
在以下内容中描述了对回放设备附近存在的NMD的确定的其他示例:2016年4月14日提交的No.15/098,867题为“Default Playback Device Designation(默认回放设备指定)”的申请;2016年4月14日提交的No.15/098,892题为“Default Playback Devices(默认回放设备)”的申请;N0.15/237,133题为“Audio Response Playback(音频响应回放)”的申请;以及2016年8月5日提交的No.15/229,855题为“Determining Direction of NetworkedMicrophone Device Relative to Audio Playback Device(确定联网麦克风设备相对于音频回放设备的方向)”的申请。这些专利申请中的每一件的内容通过引用整体并入。
如上所述,在一些情况下,回放设备被配置为与一个或多个附加的回放设备同步地回放音频(可能在区域组、立体声对或环绕声配置中)。这些配置可以扩展回放设备的可听范围,因为在该回放设备或该一个或多个附加回放设备中的任一个的可听范围内的任何NMD都可能响应于由这些回放设备同步回放的音频内容中的唤醒词而错误触发。这样,如果回放设备当前处于与一个或多个附加回放设备的同步回放配置中,则回放设备可以停用在可听范围内或以其他方式与这些附加回放设备相关联的NMD的相应唤醒响应。
在一些实施方式中,回放设备通过以下方式使该一个或多个NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒:通过经由网络接口向该一个或多个NMD发送指令,该指令使该一个或多个NMD在所接收的音频内容的回放期间停用它们相应的唤醒响应。如上所述,媒体回放系统的各种设备(例如,控制设备、回放设备和NMD)可以经由局域网(例如,经由由图1的有线或无线网络路由器130形成的局域网)互连,以允许家中的设备之间指令交换和其他消息传递。可以对媒体回放系统的这些设备各自进行编程,以响应来自系统中其他设备的某些指令。
在一些示例中,这些指令可以防止该一个或多个NMD在唤醒词被回放设备回放时检测到该唤醒词。例如,回放设备可以指示一个或多个NMD在一个或多个时间段期间(即,与唤醒词将被回放设备回放的时间相对应的时间段,可能由时间戳来表示)停止收听唤醒词(例如,停止处理所记录的音频)。备选地,回放设备可以指示该一个或多个NMD暂时(例如,在上述时间段期间)停用它们各自的麦克风。作为又一示例,回放设备可以使用其麦克风阵列指示该一个或多个NMD在回放设备的方向上创建收听无效,以使NMD不检测唤醒词。也可以使用其他示例。例如,在回放设备播放音频内容的包含唤醒词的部分之前不久,回放设备可以发送第一消息,该第一消息指示该一个或多个NMD停用唤醒词检测。然后,在回放设备播放音频内容的包含唤醒词的部分之后不久,回放设备可以发送第二消息,该第二消息指示该一个或多个NMD启用唤醒词检测。
为了说明,图9描绘了示例消息900,回放设备可以将消息900发送给一个或多个NMD,以使该一个或多个NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒响应。消息900可以符合诸如IEEE 802.3规范(其指定以太网分组和帧的结构)之类的规范。如图所示,消息900包括前导码902,前导码902包括交替比特的模式,网络上的设备(例如,NMD、回放设备和/或控制设备等)可以使用该模式来同步它们的接收器时钟。消息900还包括帧开始定界符(SFD)904,其标记前导码(以太网分组的第一个字段)的结束和消息中以太网帧部分的开始。消息900还包括目的地地址906和源地址908,其指示目的地(例如,NMD)和源(例如,回放设备)。消息900还包括有效载荷910。有效负载910包括使NMD(即,由目的地地址906指示的NMD)停用其对一个或多个唤醒词的唤醒响应的指令。消息900还包括帧校验序列(FCS)912,该FCS是允许在所接收的帧中检测被损坏的数据的循环冗余校验值。
可以使用两个或更多个以太网分组(例如,消息900中的两个或更多个)来传输指令。例如,可以在消息900的两个或更多个实例的有效载荷之间划分对一个NMD的指令。此外,可以在消息900的一个或多个相应实例中分别发送对多个NMD的指令。也可以使用其他示例。
作为示例,图10A、图10B、图10C和图10D示出了示例指令1000A、1000B、1000C和1000D,其可以在一个或多个消息的有效载荷(例如,消息900的有效载荷910)中传输给NMD。如图10A所示,指令1000A包括命令1002A,以使NMD在由时间戳1004A、1006A、1008A、1010A定义的某些时间段期间停用唤醒响应。在一些示例中,时间戳1004A和1006A分别指定以下时间段的开始和结束:回放设备将回放音频内容中包含第一唤醒词的部分的时间段。类似地,时间戳1008A和1010A可以分别指定以下时间段的开始和结束:回放设备将回放音频内容中包含第二唤醒词的部分的时间段。指令1000A可以包括定义另外的时间段的其他时间戳。备选地,时间戳1004A、1006A、1008A和1010A可以与以下时间相对应:音频的特定帧的回放时间、与发送或接收设备上的系统时钟相对应的时间;或者与NMD和回放设备都已知的全局时钟相对应的时间等。
图10B示出了指令1000B,其包括命令1002B以使NMD在由坐标1004B和1006B定义的某些方向上创建收听无效。坐标1004B和1006B指示相应回放设备相对于NMD的方向。例如,返回参考图1,指令1000B的示例实例可以包括坐标1004B和1006B,以指示回放设备122和124相对于NMD 134的方向。在该示例中,坐标1004B和1006B可以向NMD 134指示回放设备122以0°相对于NMD 134(即,正好位于NMD 134的前面),而回放设备122相对于NMD 134向左偏45°。可以通过设置或配置过程来预先建立家中各设备相对于彼此的相应位置。
图10C和10D分别示出了指令1000C和1000D。指令1000C包括命令1002C,以使接收NMD停用唤醒词检测。回放设备可以在回放音频内容中包括唤醒词的部分之前不久发送这种指令。指令1000D包括命令1002D,以使接收NMD启用唤醒词检测。回放设备可以在回放音频内容中包括唤醒词的部分之后不久发送这种指令。
在另一示例中,该一个或多个NMD可以检测唤醒词,但回放设备指示该一个或多个NMD抑制其唤醒响应。例如,回放设备可以指示该一个或多个NMD在某个时间段期间忽略唤醒词或在某个时间段期间忽略所有音频。也可以使用其他示例。
作为另一示例,回放设备可以对音频内容(或音频内容的一部分)中的唤醒词的数量进行计数。例如,回放设备可能在示例音频内容中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,回放设备可以指示附近的一个或多个NMD忽略唤醒词,直到它们已经检测到与计数相等数量的唤醒词为止(例如,忽略接下来的三个唤醒词)。
备选地,回放设备通过动态修改音频内容以将声学标记并入音频内容的片段中,来使该一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,回放设备可以在所记录的音频内容中插入(例如,混入)音频音调或其他标记中以指定在音频内容中检测到的唤醒词。然后,如果NMD检测到与唤醒词相关联(例如,紧接在唤醒词之前或与唤醒词同时出现)的音频标记,则可以指示NMD或对NMD预编程以忽略唤醒词的实例。使用这种技术,不需要预先确定或估计回放设备的可听范围内的NMD。相反,由于与音频内容一起回放声学标记,所以在用于检测音频内容的可听范围内(因此可能被该内容错误触发)的NMD也位于用于检测声学标记的范围内,并且作为响应停用它们的唤醒响应。如果多个NMD在回放设备的可听范围内,则检测到唤醒词的每个NMD都会响应于检测到相关联的声学标记,而作为响应停用其对唤醒词的唤醒响应。
d.回放音频内容
在图8中,在框808处,实现800涉及经由一个或多个扬声器回放音频内容。回放设备通过一个或多个音频转换器(例如,扬声器)回放音频内容。在一些情况下,扬声器与回放设备位于同一外壳中。备选地,回放设备可以经由扬声器插孔向一个或多个单独的无源扬声器提供经放大的音频。作为另一示例,回放设备可以通过向放大器提供线级音频来回放音频内容,放大器随后经由扬声器插孔向一个或多个无源扬声器提供经放大的音频。
如上所述,在一些情况下,回放设备被配置到与一个或多个附加回放设备的同步回放配置中。在这种情况下,回放音频内容涉及与该一个或多个附加回放设备同步地回放音频内容。在一些回放配置(例如,立体声对或环绕声)中,处于该回放配置中的每个回放设备与该回放配置中的其他回放设备同步地回放音频内容的一部分。
在一些实施方式中,回放设备向一个或多个附加回放设备提供音频内容以供回放,来促进与回放设备同步回放该音频内容。在这些实施方式中,回放设备可以用作同步组的组协调器,该同步组包括该回放设备和该一个或多个附加回放设备。作为组协调器,回放设备可以另外向该一个或多个附加回放设备提供定时信息,以促进同步组调度同步回放。回放设备经由网络接口提供音频内容和/或定时信息。
如上所述,在一些情况下,回放设备将音频内容修改为包括声学标记。在这些实施例中,如果回放设备在同步组中,则回放设备可以将经修改的音频内容提供给同步组中的其他回放设备。然后,同步组中的每个回放设备可以与组中的其他回放设备同步地回放经修改的音频内容。
为了说明,在一个示例中,回放设备114和122和124位于区域组(即,厨房+主卧室区域组)中,该区域组被配置为同步回放音频内容。在为区域组回放指定的音频内容中检测到唤醒词之后,回放设备114可以将音频内容修改为包括声学标记,以在音频内容中指定唤醒词。然后,回放设备114可以将经修改的音频内容提供给回放设备122和/或124,以促进经修改的音频内容的同步回放。
IV.NMD停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图11示出了示例实现1100,通过该实现1100,NMD停用其对一个或多个检测到的唤醒词的唤醒响应。
a.接收表示音频内容的数据以供回放
在框1102处,实现1100涉及接收表示所记录的音频内容的数据。例如,NMD可以接收音频内容以供回放设备回放。示例NMD包括图1中所示的NMD 132和134中的任何一个,其可以被实现为例如图7的NMD 700。示例回放设备包括图1所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任何一个,其可以实现为由例如图2的回放设备200表示。其他示例NMD可以包括这些回放设备和/或控制设备126和128中的任何一个,因为这些设备除了可以作为回放或控制设备的功能之外还可以实现NMD。NMD可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(诸如图5的音频输入/输出组件502)接收表示音频内容的数据。
NMD可以经由输入接口接收音频内容,该输入接口可以是有线或无线网络接口或者模拟或数字输入线接口等。例如,NMD可以经由网络接口通过一种或多种类型的网络(例如WAN、LAN和PAN)从网络源接收音频内容等。
NMD可以从本地或远程音频源接收表示音频内容的数据。例如,NMD可以从以下接收音频内容:本地媒体服务器或局域网上的其他设备、由NMD或与NMD通信的另一设备(例如,通过局域网经由网络接口与NMD通信的回放设备)读取的介质(例如,CD、DVD、蓝光、闪存或硬盘驱动器)、或存储在NMD本身上的数据存储设备。
NMD可以从一个或多个云服务器接收音频内容作为音频内容流。例如,NMD可以经由网络接口从URL获取音频内容流。备选地,NMD可以从NMD上或与NMD通信的另一设备(例如,经由网络接口通过局域网连接到NMD的回放设备)上的输入线接口接收音频内容。
在一些情况下,NMD可能经由模拟输入线接口接收模拟格式的音频内容。在这些情况下,NMD将模拟音频数字化(例如,使用基于软件或基于硬件的模数转换器)为适合于处理的格式。备选地,与NMD通信的设备(例如,回放设备)可以接收模拟格式的音频内容,将音频内容数字化,并且将表示音频内容的数据发送给回放设备。
如上所述,所接收的音频内容被设计用于由回放设备回放。例如,控制设备(如图1的控制设备126或128)可以指示回放设备回放某些音频内容,也许通过使该音频内容放置在回放设备的回放队列中来进行。将音频曲目或其他音频内容放置在这种队列中可能使回放设备在经由控制设备或回放设备本身上的控制启动(例如,播放/暂停按钮)回放之后获取音频内容。NMD可以访问该队列(例如,队列的内容可以经由LAN或其他网络与NMD共享)。在进行这种访问的情况下,NMD可以通过以下方式从本地或远程音频源获取音频内容:经由网络接口将音频内容流引导到NMD,或者经由模拟或数字输入线接口将音频内容引导到NMD等。
在一些情况下,所接收的音频内容被设计为由两个或多个回放设备回放。例如,可以将两个或更多个回放设备配置到同步组(例如,区域组、立体声对或环绕声配置)中。特定音频内容可以由该同步组指定用于回放。
在示例内,处理系统500可以将所接收的音频内容的至少一部分存储在存储器中。例如,处理系统500可以将所接收的音频内容缓冲在先进先出缓冲器(例如,循环缓冲器)中。在这些实施方式中,所接收的音频的各部分在接收时被存储在缓冲器中,并且当对这些唤醒词进行处理时从缓冲器中移除这些唤醒词,这使得回放设备能够确定所接收的音频内容是否包含唤醒词。
b.在音频内容中检测一个或多个唤醒词
在图11中,在框1104处,实现1100涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,NMD可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,NMD可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。
NMD可以使用一种或多种唤醒词检测算法对所接收的音频内容进行分析。示例唤醒词检测算法接受音频记录作为输入,并且提供对记录中是否存在唤醒词的指示作为输出。许多第一方和第三方唤醒词检测算法是已知的并且可商购。例如,语音服务的运营商可以使其算法可用于第三方设备。备选地,可以训练算法以检测某些唤醒词。
在常规操作中,NMD将经由麦克风收听家庭或其他环境中的声音(例如,人类语音),并且通过唤醒词检测算法运行该声音的音频记录,以检测声音是否包含唤醒词。在该过程中,NMD可以使用与NMD用来检测由人类语音发出的唤醒词的算法相同或相似的算法。然而,代替将经由麦克风记录的音频输入到算法,输入的是由回放设备回放的音频内容。以这种方式,NMD可以检测到音频内容中的与在各NMD的可听范围内回放音频内容时NMD本会检测到的唤醒词相同或相似的唤醒词。然而,鉴于NMD通常对变化环境条件(例如,可能是吵杂的家庭环境)中各种各样的人类语音说出的由麦克风记录的音频运行唤醒词检测算法,因此,在没有这种变化性的情况下,对所接收的音频内容运行唤醒词算法对检测唤醒词甚至可能更有效。
在分析期间,NMD可以确定每个唤醒词出现在所接收的音频内容中的位置。在识别出音频内容被确定为包括唤醒词的各部分之后,NMD可以使用一个或多个时间戳(例如,指示唤醒词开始时间的时间戳,以及可能地,指示该唤醒词的停止时间的另一时间戳)来标注音频内容的这些部分。最后,这些时间戳可用于停用NMD对与每个时间戳相对应的唤醒词的唤醒响应。
在一个示例中,NMD可以将所接收的音频内容划分为已知长度的片段。然后,NMD可以通过识别检测到唤醒词的片段来识别音频内容中包括唤醒词的部分(即片段)。例如,如果每个片段长4秒且在第六片段中检测到唤醒词,则唤醒词位于记录的20到24秒之间。在一些情况下,NMD可以将音频记录分成重叠的片段,以避免将唤醒词分解为不可识别的部分(例如,一个片段表示“Hey”而另一片段表示“Alexa”)。也可以利用其他技术来确定唤醒词在音频记录内的位置。
在一些情况下,NMD对所接收的音频内容同时运行多个唤醒词检测算法。如上所述,不同的语音服务(例如,AMAZON的
Figure GDA0004158897650000401
APPLE的/>
Figure GDA0004158897650000402
或MICROSOFT的/>
Figure GDA0004158897650000403
)可以各自使用不同的唤醒词来调用其相应的语音服务。此外,每个语音服务可以支持多个唤醒词和/或定制唤醒词。为了支持多种语音服务,NMD可以针对每种所支持的语音服务并行地对所接收的音频内容运行唤醒词检测算法,以便检测可能在音频内容中表示的不同唤醒词。例如,NMD可以将第一音频检测算法应用于第一语音服务以检测用于第一语音服务的至少一个第一唤醒词,并将第二音频检测算法应用于第二语音服务以检测用于第二语音服务的至少一个第二唤醒词。在回放设备回放音频内容之前,NMD可能还可以针对相应的语音服务,将附加的音频检测算法应用于音频内容。
c.在音频内容的回放期间停用对检测到的一个或多个唤醒词的唤醒响应
在图11中,在框1106处,实现1100涉及在音频内容的回放期间停用对检测到的一个或多个唤醒词的唤醒响应。例如,当音频内容被回放设备可听地回放时,NMD可以停用其对在音频内容中检测到的一个或多个唤醒词的唤醒响应。
如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
在一些实施方式中,当唤醒词被回放设备回放时,NMD通过防止NMD检测到唤醒词来停用其唤醒响应。例如,NMD可以在一个或多个时间段期间(即,与唤醒词将被回放设备回放的时间相对应的时间段,可能由时间戳来表示)停止收听唤醒词(例如,停止处理所记录的音频)。备选地,NMD可以暂时(例如,在上述时间段期间)停用其麦克风。作为又一示例,NMD可以使用其麦克风阵列在回放设备的方向上创建收听无效,使得NMD不检测唤醒词。也可以使用其他示例。
在另外的示例中,NMD在唤醒词被回放设备回放时检测到唤醒词,但是抑制其对检测到的唤醒词的唤醒响应。例如,NMD可以在多个时间段期间忽略唤醒词,或者在某些时间段期间忽略所有音频。也可以使用其他示例。
作为另一示例,NMD可以对音频内容(或音频内容的一部分)中的唤醒词的数量进行计数。例如,NMD可能在示例音频内容中检测到三个唤醒词。如上所述,这些实例可以包括唤醒词的任何组合,包括用于不同语音服务的不同唤醒词。然后,NMD然后可以停用其唤醒响应,直到它检测到与计数相等数量的唤醒词为止(例如,通过忽略接下来的三个唤醒词)。
备选地,NMD通过修改音频内容以将声学标记并入音频内容的片段中来停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,NMD可以在所记录的音频内容中插入(例如,混入)音频音调或其他标记以指定在音频内容中检测到的唤醒词。然后,假定将NMD编程为响应于检测到这种音频标记而停用其唤醒响应,则NMD将在由回放设备回放的音频内容中检测到唤醒词时自动抑制唤醒响应。
在一些示例中,当唤醒词被回放设备回放时,NMD可以使一个或多个附加联网麦克风设备停用它们对检测到的唤醒词的相应唤醒响应。例如,参考图1,NMD 132可以使NMD134停用其唤醒响应。此外,家中的任何回放设备和/或控制设备都可以实现NMD,并且NMD132也可以停用这些回放设备中的任何一个的唤醒响应。
NMD可以停用家中的特定NMD集合。在一些情况下,其唤醒响应被停用的NMD集合基于媒体回放系统的区域或区域组配置。例如,如果NMD与特定区域相关联(例如,如果NMD132与厨房区域相关联),则NMD可以使也与该相同区域相关联的任何NMD的相应唤醒响应停用。这些NMD可以包括实现NMD的各种设备(例如,回放设备)以及专用NMD。此外,如果与NMD相关联的特定区域与区域组中的一个或多个附加区域相连,则NMD可以使也与该一个或多个附加区域相关联的任何NMD的相应唤醒响应也被停用。如上所述,可以在NMD和媒体回放系统的区域之间创建关联,可能以促进在家庭的特定房间(例如,厨房区域)中的合作。
备选地,其唤醒响应被停用的特定附加NMD基于正在回放包括唤醒词的音频内容的回放设备的可听范围。可以使用任何合适的技术来确定可听范围。在一些实施方式中,如上所述,基于NMD与一个或多个区域的关联来建立可听范围。在其他示例中,在设置过程(例如,校准过程)期间建立可听范围,如以上在第II I节中所述。可以将通过区域配置和/或设置过程建立的可听范围存储为一个或多个状态变量并且在网络(例如,由图1中所示的家中的路由器130建立的LAN)内的设备间共享。通过访问这种信息,NMD可以确定将位于将要回放音频内容的回放设备的可听范围内的NMD集合,并且使这些NMD集合的相应唤醒响应停用。
为了说明,在一个示例中,图1中的NMD 132在设计为由厨房区域中的回放设备114回放的给定音频内容中检测到一个或多个唤醒词。因此,NMD 132停用其对这些唤醒词的唤醒响应。由于回放设备114也是NMD,因此NMD 132停用回放设备114的唤醒响应。此外,由于厨房区域与餐厅区域位于区域组中,因此NMD 132还停用也是NMD的回放设备112的唤醒响应,以便在音频内容由餐厅区域和厨房区域同步回放时,回放设备112的NMD不会错误触发。
在另一示例中,图1中的NMD 134在设计为由主卧室区域中的回放设备122和124回放的给定音频内容中检测一个或多个唤醒词。因此,NMD 134停用其对这些唤醒词的唤醒响应。由于回放设备116实现了NMD,并且已被预先建立为位于回放设备122和124在其当前音量水平下的可听范围内,因此NMD 134还停用回放设备116的唤醒响应。NMD 134从经由路由器130创建的LAN与NMD 134共享的一个或多个状态变量中得知,回放设备116位于回放设备122和124在其当前音量水平下的可听范围内。这些状态变量向NMD 134指示媒体回放系统100的各个方面的状态,例如:回放设备122和124的当前回放配置(例如,立体声对)、它们当前的音量水平、以及在该回放配置和该音量水平下确定了哪些NMD在这些回放设备的可听范围内。
NMD可使用任何合适的技术使该一个或多个附加NMD停用其相应的唤醒响应。NMD可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且在回放设备回放音频内容期间,使用该通知组件使一个或多个NMD的集合停用其对检测到的一个或多个唤醒词的相应唤醒响应。
在一些实施方式中,NMD通过以下方式使该一个或多个附加NMD响应于检测到的一个或多个唤醒词而停用其相应的唤醒:通过经由网络接口向该一个或多个NMD发送指令,该指令使该一个或多个NMD在所接收的音频内容的回放期间停用它们相应的唤醒响应。如上所述,媒体回放系统的各种设备(例如,控制设备、回放设备和NMD)可以经由局域网(例如,经由由图1的有线或无线网络路由器130形成的局域网)互连,以允许家中的设备之间指令交换和其他消息传递。可以对媒体回放系统的这些设备各自进行编程,以响应来自系统中其他设备的某些指令。上面结合图9和图10A、图10B、图10C和图10D描述了示例消息和指令。
备选地,NMD通过修改音频内容以将声学标记并入音频内容的片段中,来使该一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。使用这种技术,不需要预先确定或估计回放设备的可听范围内的NMD。相反,由于与音频内容一起回放声学标记,所以在用于检测音频内容的可听范围内(因此可能被该内容错误触发)的NMD也位于用于检测声学标记的范围内,并且作为响应停用它们的唤醒响应。如果多个NMD在NMD的可听范围内,则检测到唤醒词的每个NMD都会响应于检测到相关联的声学标记,而作为响应停用其对唤醒词的唤醒响应。
在一些实施方式中,例如在NMD修改音频内容的实施方式中,NMD将音频内容提供给回放设备。在这种情况下,NMD可以作为音频内容源和回放设备之间的中介。将音频内容传输给回放设备可以使回放设备回放音频内容,因为回放设备可以被配置为回放所接收的音频内容。NMD可以经由任何适当的通信接口(例,如网络接口)将音频内容提供给回放设备。如果将多个回放设备配置为回放音频内容,则NMD可以将音频内容提供给所有回放设备,或者NMD可以将音频内容传输给回放设备的子集(例如,组协调器),然后,回放设备的子集将音频内容分发给组中的其他回放设备,可能与定时信息一起分发以调度同步回放。
为了说明,在一个示例中,回放设备112和124位于被配置为同步回放音频内容的区域组(即,厨房+餐厅区域组)中。在检测到指定由区域组回放的音频内容中的唤醒词之后,NMD 132可以将音频内容修改为包括声学标记,以在音频内容中指定唤醒词。然后,回放设备132可以将经修改的音频内容提供给回放设备112和/或114,以促进经修改的音频内容的同步回放。
d.检测所回放的音频内容
在框1108处,实现1100涉及经由麦克风检测所回放的音频内容。例如,当回放设备正在回放包括一个或多个检测到的唤醒词的音频内容时,NMD可以经由麦克风检测所回放的音频内容。在启用NMD的唤醒响应的配置中,检测所回放的音频内容中包括唤醒词的各部分将触发NMD的唤醒响应。然而,由于NMD停用了对音频内容中一个或多个唤醒词的唤醒响应,因此不会触发唤醒响应。
在一些实施方式中,回放设备实现NMD。在这些示例中,回放设备可以经由一个或多个扬声器回放所接收的音频内容。在一些情况下,扬声器与NMD位于同一外壳中。备选地,回放设备可以经由扬声器插孔向一个或多个单独的无源扬声器提供经放大的音频。作为另一示例,回放设备可以通过向放大器提供线级音频来回放音频内容,放大器随后经由扬声器插孔向一个或多个无源扬声器提供经放大的音频。
在一些情况下,NMD被配置到与一个或多个附加回放设备的同步回放配置中。在这种情况下,回放音频内容涉及与该一个或多个附加回放设备同步地回放音频内容。在一些回放配置(例如,立体声对或环绕声)中,处于该回放配置中的每个回放设备与该回放配置中的其他回放设备同步地回放音频内容的一部分。
如上所述,在一些实施方式中,NMD将音频内容提供给一个或多个回放设备以供回放。在一些示例中,NMD将音频内容提供给该一个或多个回放设备,来促进与NMD同步回放该音频内容。在这些实施方式中,NMD可以用作同步组的组协调器,该同步组包括该NMD和该一个或多个附加回放设备。作为组协调器,NMD可以另外向该一个或多个附加回放设备提供定时信息,以促进同步组调度同步回放。回放设备经由网络接口提供音频内容和/或定时信息。
V.计算系统停用唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及停用唤醒响应。图12示出了示例实现1200,通过该示例实现1200,计算系统停用一个或多个NMD对音频内容中的一个或多个唤醒词的唤醒响应。在各种实施例中,计算系统可以是云服务器。备选地,计算系统可以是本地处理设备(例如,与媒体回放系统连接到相同LAN的设备)。计算系统可以实现回放设备或NMD。
a.接收表示所记录的音频内容的数据
在框1202处,实现1200涉及接收表示所记录的音频内容的数据。例如,计算系统可以接收音频内容以供回放设备进行回放。示例回放设备包括图1中所示的回放设备102、104、106、108、110、112、114、116、118、120、112和124中的任一个,其例如可以被实现为图2的回放设备200。处理系统可以包括处理系统(例如,处理系统500),并且使用音频输入/输出组件(诸如图5的音频输入/输出组件502)来接收表示音频内容的数据。计算系统可以使用任何合适的技术来接收音频内容,诸如以上在第II、第III和第IV部分中讨论的技术。
b.在音频内容中检测一个或多个唤醒词
在图12中,在框1204处,实现1200涉及在回放设备回放音频内容之前,在音频内容中检测一个或多个唤醒词。例如,计算系统可以对接收的表示音频内容的数据进行分析,以确定音频内容中是否表示了用于任何语音服务的唤醒词,导致当回放音频内容时将可听地播放唤醒词。如上所述,在一些实施方式中,计算系统可以包括处理系统(例如,处理系统500),并且使用唤醒词检测组件(例如,图5的唤醒词检测组件504)来检测音频内容内的唤醒词。计算系统可以使用任何合适的技术来检测唤醒词,诸如以上在第II、第III和第TV部分中讨论的技术。
c.使一个或多个MD在音频内容的回放期间停用对检测到的一个或多个唤醒词的 相应唤醒响应
在图12中,在框1206处,实现1200涉及在音频内容的回放期间使一个或多个联网的麦克风设备停用其对检测到的一个或多个唤醒词的相应唤醒响应。例如,计算系统可以使在回放设备的音频范围内的NMD在回放设备回放音频内容期间停用NMD对检测到的一个或多个唤醒词的相应唤醒响应。如上所述,计算系统可以实现包括通知组件(例如,图5的通知组件506)的处理系统500,并且使用该通知组件,在回放设备回放音频内容期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。计算系统可以使用任何合适的技术(例如,上述在第II、第III和第IV部分中讨论的技术),在音频内容的回放期间,使一个或多个NMD停用其对检测到的一个或多个唤醒词的相应唤醒响应。
VI.抑制唤醒响应的示例技术
如上所述,本文描述的实施例可以涉及抑制唤醒响应。图13示出了示例实现1300),NMD通过该示例实现1300)停用唤醒响应。
a.接收用于停用NMD对一个或多个唤醒词的唤醒响应的指令
在框1302处,实现1300涉及接收用于停用NMD对一个或唤醒词的唤醒响应的指令。例如,NMD(例如,NMD 132)可以从另一NMD、回放设备、计算系统或任何其他设备接收指令。指令使NMD停用其对一个或多个唤醒词的唤醒响应,这些唤醒词被表示在已经指定由一个或多个回放设备回放的某些音频内容中。
在一些实施方式中,所接收的用于停用NMD对一个或多个唤醒词的唤醒响应的指令是隐式的。例如,可以指示NMD在唤醒词被回放设备回放时不检测唤醒词,这可能通过指示NMD停止收听唤醒词,通过停用NMD的麦克风阵列一段时间,或者通过在回放设备的方向创建收听无效等来进行。备选地,NMD可以检测唤醒词,但是NMD被指示抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务,这可能通过在某些时段期间忽略唤醒词,或者通过在某些时段期间忽略所有音频来进行。可以使用任何合适的指令来指示NMD,例如以上第II、第III和第IV部分中讨论的那些指令。
备选地,所接收的指令是隐式的。例如,如上所述,可以将音频内容修改为包括指定唤醒词的声学标记。在这些实施方式中,所接收的指令可以是声学标记的形式。在一些情况下,所接收的指令可以是用于在检测到声学标记时停用NMD的唤醒响应的指令。
b.检测一个或多个回放设备正在回放的音频内容
在图13中,在框1304处,实现1300涉及检测由一个或多个回放设备回放的音频内容。例如,NMD可以经由麦克风检测由单个回放设备回放的音频内容。备选地,NMD可以检测由两个或更多个设备(例如,同步地)回放的音频内容。
c.确定检测到的音频内容包括一个或多个唤醒词
在图13中,在框1306处,实现1300涉及确定检测到的音频内容包括一个或多个唤醒词。例如,NMD可以通过对检测到的音频内容运行一种或多种唤醒词检测算法,来确定检测到的音频内容包括一个或多个唤醒词。在一些情况下,NMD可以对检测到的音频内容运行多个唤醒词检测算法(例如,用于不同唤醒词(可能用于不同的语音服务)的唤醒词检测算法)。在整个本公开中描述了示例唤醒词检测算法。
D.停用NMD对检测到的音频内容中的一个或多个唤醒词的唤醒响应
在图13中,在框1308处,实现1300涉及停用NMD对检测到的音频内容中的一个或多个唤醒词的唤醒响应。如上所述,NMD的唤醒响应是指其对检测到唤醒词的经编程的响应。当启用唤醒响应时,响应于检测到唤醒词,NMD的唤醒响应使该NMD经由麦克风收听特定唤醒词之后的语音命令。NMD调用语音服务以执行语音命令。然而,当停用唤醒响应时,NMD可能不收听语音命令,并且将不调用语音服务来执行语音命令。
VII.结论
以上描述尤其公开了各种示例系统、方法、装置和尤其包括在硬件上执行的固件和/或软件的制品。应当理解的是,这些示例仅是示意性的,而不应当被认为是限制性的。例如,可以想到,这些固件、硬件和/或软件方面或组件中的任意一个或全部可以专门在硬件中实现、专门在软件中实现、专门在固件中实现、或在硬件、软件和/或固件的任意组合中实现。因此,所提供的示例不是实现这些系统、方法、装置和/或制品的唯一方式。
(特征1)一种方法,包括:经由回放设备接收表示音频内容的数据,以供所述回放设备回放;在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及经由一个或多个扬声器回放所述音频内容。
(特征2)根据特征1所述的方法,其中,所述回放设备包括所述给定联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在回放所述音频内容的同时,经由所述麦克风记录正在回放的音频内容;以及停用所述给定联网麦克风设备对所记录的音频内容中的所述一个或多个唤醒词的相应唤醒响应。
(特征3)根据特征1所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征4)根据特征2所述的方法,其中,所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征5)根据特征4所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征6)根据特征4所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征7)根据特征1所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
(特征8)根据特征1所述的方法,其中,检测所述一个或多个唤醒词包括对所述音频内容应用多个唤醒词检测算法,其中,所述多个唤醒词检测算法包括用于第一语音服务的第一唤醒词检测算法和用于第二语音服务的第二唤醒词检测算法,并且其中,在所述回放设备回放所述音频内容之前对所述音频内容应用多个唤醒词检测算法包括:在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第一语音服务的第一音频检测算法,以检测用于所述第一语音服务的至少一个第一唤醒词;以及在回放设备回放音频内容之前,对所述音频内容应用用于所述第二语音服务的第二音频检测算法,以检测用于所述第二语音服务的至少一个第二唤醒词,其中,所述第二唤醒词与所述第一唤醒词不同。
(特征9)根据特征1所述的方法,其中,所述一个或多个联网麦克风设备包括第一联网麦克风设备和第二联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述第一联网麦克风设备停用所述第一联网麦克风设备对检测到的至少一个第一唤醒词的相应唤醒响应;以及使所述第二联网麦克风设备停用所述第二联网麦克风设备对检测到的至少一个第二唤醒词的相应唤醒响应。
(特征10)根据特征1所述的方法,其中,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词包括检测特定唤醒词在所述音频内容中的多个实例,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到每个联网麦克风设备已经检测到与在所述音频内容中检测到的所述特定唤醒词的所述多个实例的数量相等数量的唤醒词为止。
(特征11)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器以使设备执行根据特征1至10中任一项的方法。
(特征12)一种设备,被配置为执行根据特征1至10中任一项的方法。
(特征13)一种媒体回放系统,被配置为执行根据特征1至10中任一项的方法。
(特征14)一种方法,包括:经由联网麦克风设备接收表示音频内容的数据,以供回放设备回放;在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应,其中,在唤醒响应被启用时,所述联网麦克风设备对特定唤醒词的唤醒响应使所述联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及当所述回放设备正在回放所述音频内容时,经由所述麦克风检测所回放的音频内容。
(特征15)根据特征14所述的方法,还包括:经由网络接口将表示音频内容的数据传输给所述回放设备,以使所述回放设备回放所述音频内容。
(特征16)根据特征15所述的方法,其中,在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对检测到的一个或多个唤醒词的唤醒响应包括:在将表示所述音频内容的数据传输给所述回放设备之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记使所述联网麦克风设备在所述回放设备回放所述音频内容期间停用所述联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应。
(特征17)根据特征14所述的方法,还包括:使一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个附加联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
(特征18)根据特征17所述的方法,其中,使所述一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个附加联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个附加联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征19)根据特征17所述的方法,其中,所述一个或多个附加联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个附加联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风在音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征20)根据特征19所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征21)根据特征14所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征22)根据特征14所述的方法,其中,检测所述一个或多个唤醒词包括对所述音频内容应用多个唤醒词检测算法,其中,所述多个唤醒词检测算法包括用于第一语音服务的第一唤醒词检测算法和用于第二语音服务的第二唤醒词检测算法,并且其中,在所述回放设备回放所述音频内容之前对所述音频内容应用多个唤醒词检测算法包括:在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第一语音服务的第一音频检测算法,以检测用于所述第一语音服务的至少一个第一唤醒词;以及在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第二语音服务的第二音频检测算法,以检测用于所述第二语音服务的至少一个第二唤醒词,其中,所述第二唤醒词与所述第一唤醒词不同。
(特征23)根据特征14所述的方法,其中,所述联网麦克风设备包括所述回放设备,并且其中,所述方法还包括经由一个或多个扬声器回放所述音频内容。
(特征24)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器以使设备执行根据特征14至23中任一项的方法。
(特征25)一种设备,被配置为执行特征14至23中任一项的方法。
(特征26)一种回放系统,被配置为执行特征14至23中任一项的方法。
(特征27)一种方法,包括:通过计算系统接收(经由所述计算系统的接口)接收音频内容,以供一个或多个回放设备回放;在回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;以及使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令。
(特征28)根据特征27所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:经由所述网络接口向所述一个或多个联网麦克风设备发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征29)根据特征28所述的方法,其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送使所述一个或多个联网麦克风设备在一个或多个时间段期间停用所述一个或多个联网麦克风设备的相应唤醒响应的指令,所述一个或多个时间段与所述一个或多个回放设备将回放所述音频内容的表示相应唤醒词的片段的时间相对应。
(特征30)根据特征28所述的方法,其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送使所述一个或多个联网麦克风设备在一个或多个时间段期间停用所述一个或多个联网麦克风设备的相应麦克风的指令,所述一个或多个时间段与所述一个或多个回放设备将回放所述音频内容的表示相应唤醒词的片段的时间相对应。
(特征31)根据特征28所述的方法,其中,所述计算系统在所述音频内容检测到特定数量的唤醒词,并且其中,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令包括:发送指令,所述指令使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到所述一个或多个联网麦克风设备已经检测到与在所述音频内容中检测到的唤醒词的特定数量相等数量的唤醒词为止。
(特征32)根据特征28所述的方法,其中,所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近;以及响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。
(特征33)根据特征32所述的方法,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
(特征34)根据特征32所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。
(特征35)根据特征27所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:在所述一个或多个回放设备回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应;以及将修改后的音频内容传输给所述一个或多个回放设备中的至少一个,以供所述一个或多个回放设备回放。
(特征36)根据特征35所述的方法,其中,接收音频内容以供一个或多个回放设备回放包括以下之一:(a)经由接口的网络接口接收表示音频内容的数据,或(b)经由接口的模拟接口接收表示音频内容的模拟信号。
(特征37)根据特征27所述的方法,其中,所述计算系统包括所述一个或多个回放设备中的特定回放设备,并且其中,操作还包括回放所述音频内容。
(特征38)根据特征27所述的方法,其中,所述计算系统包括所述一个或多个联网麦克风设备中的特定联网麦克风设备,并且其中,操作还包括经由麦克风检测正由所述一个或多个回放设备回放的音频内容。
(特征39)一种有形暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器执行以使设备执行特征27至38中任一项的方法。
(特征4())一种设备,被配置为执行特征27至38中任一项的方法。
(特征41)一种媒体回放系统,被配置为执行特征27至38中任一项的方法。
(特征42)一种方法,包括:经由联网麦克风设备接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令,其中,当唤醒响应被启用时,所述联网麦克风设备对给定唤醒词的唤醒响应使所述联网麦克风设备经由麦克风收听所述给定唤醒词之后的语音命令;经由所述麦克风检测由一个或多个回放设备回放的音频内容;确定检测到的音频内容包括一个或多个唤醒词;以及响应于接收到的指令,停用所述联网麦克风设备对检测到的音频内容中的所述一个或多个唤醒词的唤醒响应。
(特征43)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收对在一个或多个时间段期间停用所述唤醒响应的指令,所述一个或多个时间段与所述一个或多个回放设备将要回放所述音频内容中与相应检测到的唤醒词相对应的片段的时间相对应。
(特征44)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收对在一个或多个时间段期间停用所述麦克风的指令,所述一个或多个时间段与所述一个或多个回放设备将要回放所述音频内容中与相应检测到的唤醒词相对应的片段的时间相对应。
(特征45)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收指令,所述指令在检测到连续唤醒词时停用所述唤醒响应,直到所述联网麦克风设备已经检测到与特定数量的唤醒词相等数量的唤醒词为止。
(特征46)根据特征42所述的方法,其中,接收停用所述联网麦克风设备对一个或多个唤醒词的唤醒响应的指令包括:接收在检测到声学标记时停用唤醒响应的指令,并且其中,停用所述联网麦克风设备对检测到的音频内容中的一个或多个唤醒词的唤醒响应包括:检测检测到的音频内容中与相应的检测到的唤醒词相对应的声学标记;以及响应于检测到每个声学标记而停用所述唤醒响应。
(特征47)根据特征42所述的方法,其中,确定检测到的音频内容包括一个或多个唤醒词包括向检测到的音频内容应用一个或多个唤醒词检测算法。
(特征48)一种有形非暂时性计算机可读介质,其中存储有指令,该指令可由一个或多个处理器执行以使设备执行根据特征42至47中任一项的方法。
(特征49)一种设备,被配置为执行根据特征42至47中任一项的方法。
(特征50)一种媒体回放设备,被配置为执行根据特征42至47中任一项的方法。
主要在说明性的环境、系统、过程、步骤、逻辑块、处理以及直接或间接地与耦接到网络的数据处理设备的操作相类似的其他象征性表示的方面上,提出本说明书。本领域技术人员通常使用这些处理描述和表示,以向本领域技术人员的其他技术人员传播他们的工作内容。阐述了各种具体细节,以提供本公开的透彻理解。然而,本领域技术人员应理解,不需要特定、具体细节就可以实施本公开。在其他实例中,没有描述熟知的方法、过程、组件和电路,以避免不必要地使实施例的方面模糊不清。因此,本公开的范围由随附权利要求、而不是以上实施例的描述来界定。
当随附权利要求中的任一项权利要求被理解成涵盖纯软件和/或固件实现时,在此明确限定至少一个示例中的至少一个元素以包括存储软件和/或固件的非暂时性有形介质,如存储器、DVD、CD、蓝光等。

Claims (13)

1.一种用于回放设备的方法,包括:
经由所述回放设备的网络接口接收表示音频内容的数据,以供所述回放设备回放;以及
在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;
确定一个或多个联网麦克风设备位于所述音频内容的可听范围附近;
响应于确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近,使被确定为在所述音频内容的可听范围内的一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间,停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,所述一个或多个联网麦克风设备中的给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及
经由所述回放设备的一个或多个扬声器回放所述音频内容。
2.根据权利要求1所述的方法,其中,所述回放设备包括所述给定联网麦克风设备。
3.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容的同时,经由所述一个或多个联网麦克风设备记录正在回放的音频内容;以及
停用所述一个或多个联网麦克风设备对所记录的音频内容中的所述一个或多个唤醒词的相应唤醒响应。
4.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
经由所述回放设备的所述网络接口向所述一个或多个联网麦克风设备发送指令,所述指令使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应。
5.根据权利要求1或2所述的方法,其中,被确定为在所述音频内容的可听范围附近的所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集。
6.根据权利要求2所述的方法,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。
7.根据权利要求1或2所述的方法,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。
8.根据权利要求1或2所述的方法,其中,检测所述一个或多个唤醒词包括:对所述音频内容应用多个唤醒词检测算法,所述多个唤醒词检测算法各自针对与相应语音服务相关联的唤醒词。
9.根据权利要求8所述的方法,其中:
检测所述一个或多个唤醒词包括检测多个唤醒词;以及
使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
使第一联网麦克风设备停用所述第一联网麦克风设备对检测到的至少一个第一唤醒词的相应唤醒响应;以及
使第二联网麦克风设备停用所述第二联网麦克风设备对检测到的至少一个第二唤醒字的相应唤醒响应。
10.根据权利要求1所述的方法,其中,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词包括检测特定唤醒词在所述音频内容中的多个实例。
11.根据权利要求10所述的方法,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到每个联网麦克风设备已经检测到与在所述音频内容中检测到的所述特定唤醒词的所述多个实例的数量相等数量的唤醒词为止。
12.一种存储有指令的有形非暂时性计算机可读介质,所述指令能够由一个或多个处理器执行,以使回放设备执行根据前述权利要求中任一项所述的方法。
13.一种回放设备,包括:
网络接口;
一个或多个处理器;以及
根据权利要求12所述的有形非暂时性计算机可读介质。
CN201880064916.XA 2017-08-07 2018-08-06 唤醒词检测抑制 Active CN111194439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310761290.0A CN116954545A (zh) 2017-08-07 2018-08-06 处理系统及其对应方法、计算机可读介质和回放设备

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/670,361 US10475449B2 (en) 2017-08-07 2017-08-07 Wake-word detection suppression
US15/670,361 2017-08-07
PCT/US2018/045397 WO2019032462A1 (en) 2017-08-07 2018-08-06 REMOVAL OF AWAKENING WORD DETECTION

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310761290.0A Division CN116954545A (zh) 2017-08-07 2018-08-06 处理系统及其对应方法、计算机可读介质和回放设备

Publications (2)

Publication Number Publication Date
CN111194439A CN111194439A (zh) 2020-05-22
CN111194439B true CN111194439B (zh) 2023-07-07

Family

ID=63405364

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310761290.0A Pending CN116954545A (zh) 2017-08-07 2018-08-06 处理系统及其对应方法、计算机可读介质和回放设备
CN201880064916.XA Active CN111194439B (zh) 2017-08-07 2018-08-06 唤醒词检测抑制

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310761290.0A Pending CN116954545A (zh) 2017-08-07 2018-08-06 处理系统及其对应方法、计算机可读介质和回放设备

Country Status (8)

Country Link
US (4) US10475449B2 (zh)
EP (2) EP4040285A1 (zh)
JP (1) JP6963673B2 (zh)
KR (1) KR102315053B1 (zh)
CN (2) CN116954545A (zh)
AU (1) AU2018312989B2 (zh)
CA (2) CA3140979C (zh)
WO (1) WO2019032462A1 (zh)

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
CN107591151B (zh) * 2017-08-22 2021-03-16 百度在线网络技术(北京)有限公司 远场语音唤醒方法、装置和终端设备
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) * 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10733990B2 (en) * 2017-10-18 2020-08-04 Motorola Mobility Llc Preventing initiation of a voice recognition session
US10152966B1 (en) * 2017-10-31 2018-12-11 Comcast Cable Communications, Llc Preventing unwanted activation of a hands free device
US20190130898A1 (en) * 2017-11-02 2019-05-02 GM Global Technology Operations LLC Wake-up-word detection
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
FR3075442B1 (fr) * 2017-12-19 2019-11-22 Sagemcom Broadband Sas Dispositif et procede d'assistance vocale
CN108039175B (zh) * 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11127405B1 (en) * 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10885910B1 (en) 2018-03-14 2021-01-05 Amazon Technologies, Inc. Voice-forward graphical user interface mode management
US10877637B1 (en) 2018-03-14 2020-12-29 Amazon Technologies, Inc. Voice-based device operation mode management
JP7186375B2 (ja) * 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
US10685666B2 (en) * 2018-04-06 2020-06-16 Intel Corporation Automatic gain adjustment for improved wake word recognition in audio systems
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10649727B1 (en) * 2018-05-14 2020-05-12 Amazon Technologies, Inc. Wake word detection configuration
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
WO2020005202A1 (en) 2018-06-25 2020-01-02 Google Llc Hotword-aware speech synthesis
US10929097B2 (en) * 2018-06-26 2021-02-23 ROVl GUIDES, INC. Systems and methods for switching operational modes based on audio triggers
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
KR102580521B1 (ko) * 2018-07-13 2023-09-21 삼성전자주식회사 전자 장치 및 전자 장치의 음량 조절 방법
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US11151994B2 (en) * 2019-01-04 2021-10-19 International Business Machines Corporation Methods and systems for managing voice commands and the execution thereof
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11024290B2 (en) * 2019-02-11 2021-06-01 Amazon Technologies, Inc. Wakeword detection using a secondary microphone
CN110109645A (zh) * 2019-04-30 2019-08-09 百度在线网络技术(北京)有限公司 一种交互式音乐试听方法、装置和终端
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
JPWO2020235141A1 (zh) * 2019-05-17 2020-11-26
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
CN112712803B (zh) * 2019-07-15 2022-02-25 华为技术有限公司 一种语音唤醒的方法和电子设备
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) * 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11521599B1 (en) * 2019-09-20 2022-12-06 Amazon Technologies, Inc. Wakeword detection using a neural network
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
JP7483421B2 (ja) 2020-03-12 2024-05-15 キヤノン株式会社 撮像装置、制御方法、及びプログラム
CN111429917B (zh) * 2020-03-18 2023-09-22 北京声智科技有限公司 一种设备唤醒方法及终端设备
KR20210123633A (ko) * 2020-04-03 2021-10-14 삼성전자주식회사 음성 명령에 대응하는 태스크를 수행하는 전자 장치 및 그 동작 방법
CN111554298B (zh) * 2020-05-18 2023-03-28 阿波罗智联(北京)科技有限公司 语音交互方法、语音交互设备和电子设备
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
CN111640426A (zh) * 2020-06-10 2020-09-08 北京百度网讯科技有限公司 用于输出信息的方法和装置
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
JP7491147B2 (ja) 2020-08-31 2024-05-28 セイコーエプソン株式会社 表示システムの制御方法、表示システム、及び、表示装置の制御方法
US11657814B2 (en) * 2020-10-08 2023-05-23 Harman International Industries, Incorporated Techniques for dynamic auditory phrase completion
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11562748B2 (en) * 2020-12-01 2023-01-24 Google Llc Detecting and suppressing commands in media that may trigger another automated assistant
US12001260B1 (en) * 2020-12-11 2024-06-04 Amazon Technologies, Inc. Preventing inadvertent wake in a speech-controlled device
US20220215835A1 (en) * 2021-01-06 2022-07-07 Comcast Cable Communications, Llc Evaluating user device activations
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
US12057116B2 (en) * 2021-01-29 2024-08-06 Salesforce, Inc. Intent disambiguation within a virtual agent platform
US11557293B2 (en) * 2021-05-17 2023-01-17 Google Llc Contextual suppression of assistant command(s)
US20240265921A1 (en) * 2021-09-30 2024-08-08 Sonos, Inc. Conflict management for wake-word detection processes
US11769506B1 (en) * 2022-05-09 2023-09-26 Amazon Technologies, Inc. Response orchestrator for natural language interface

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572009A (zh) * 2015-01-28 2015-04-29 合肥联宝信息技术有限公司 一种自适应外界环境的音频控制方法及装置
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
TW201629950A (zh) * 2015-01-07 2016-08-16 樓氏電子有限公司 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風
US9548053B1 (en) * 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
US9633661B1 (en) * 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
CN106910500A (zh) * 2016-12-23 2017-06-30 北京第九实验室科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备

Family Cites Families (1198)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US186265A (en) * 1877-01-16 Improvement in odorless receptacles
US4941187A (en) 1984-02-03 1990-07-10 Slater Robert W Intercom apparatus for integrating disparate audio sources for use in light aircraft or similar high noise environments
US4741038A (en) 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPS63301998A (ja) 1987-06-02 1988-12-08 日本電気株式会社 音声認識応答装置
US4974213A (en) 1988-12-16 1990-11-27 Siwecki Thomas L Passive active underwater sound detection apparatus
US5036538A (en) 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5440644A (en) 1991-01-09 1995-08-08 Square D Company Audio distribution system having programmable zoning features
EP0548836B1 (en) 1991-12-20 1997-06-11 Matsushita Electric Industrial Co., Ltd. A bass reproduction speaker apparatus
US6311157B1 (en) 1992-12-31 2001-10-30 Apple Computer, Inc. Assigning meanings to utterances in a speech recognition system
JPH0883091A (ja) 1994-09-09 1996-03-26 Matsushita Electric Ind Co Ltd 音声認識装置
US5740260A (en) 1995-05-22 1998-04-14 Presonus L.L.P. Midi to analog sound processor interface
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5857172A (en) 1995-07-31 1999-01-05 Microsoft Corporation Activation control of a speech recognizer through use of a pointing device
US7174299B2 (en) 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
FR2739736B1 (fr) 1995-10-05 1997-12-05 Jean Laroche Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio
JP3094900B2 (ja) 1996-02-20 2000-10-03 ヤマハ株式会社 ネットワーク機器およびデータ送受信方法
US6404811B1 (en) 1996-05-13 2002-06-11 Tektronix, Inc. Interactive multimedia system
JP3679526B2 (ja) 1996-10-31 2005-08-03 キヤノン株式会社 画像共有装置、画面制御方法及びコンピュータ可読メモリ
US6469633B1 (en) 1997-01-06 2002-10-22 Openglobe Inc. Remote control of electronic devices
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6611537B1 (en) 1997-05-30 2003-08-26 Centillium Communications, Inc. Synchronous network for digital media streams
US6408078B1 (en) 1997-10-30 2002-06-18 Maximilian Hobelsberger Active reactive acoustical elements
US6088459A (en) 1997-10-30 2000-07-11 Hobelsberger; Maximilian Hans Loudspeaker system with simulated baffle for improved base reproduction
US6032202A (en) 1998-01-06 2000-02-29 Sony Corporation Of Japan Home audio/video network with two level device control
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US6301603B1 (en) 1998-02-17 2001-10-09 Euphonics Incorporated Scalable audio processing on a heterogeneous processor array
US6953886B1 (en) 1998-06-17 2005-10-11 Looney Productions, Llc Media organizer and entertainment center
IL127569A0 (en) 1998-09-16 1999-10-28 Comsense Technologies Ltd Interactive toys
US6839410B2 (en) 1998-09-01 2005-01-04 At&T Corp. Method and apparatus for setting user communication parameters based on voice identification of users
IL140805A0 (en) 1998-10-02 2002-02-10 Ibm Structure skeletons for efficient voice navigation through generic hierarchical objects
US20020116196A1 (en) 1998-11-12 2002-08-22 Tran Bao Q. Speech recognizer
US6243676B1 (en) 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US7130616B2 (en) 2000-04-25 2006-10-31 Simple Devices System and method for providing content, management, and interactivity for client devices
US6256554B1 (en) 1999-04-14 2001-07-03 Dilorenzo Mark Multi-room entertainment system with in-room media player/dispenser
US6414251B1 (en) 1999-04-19 2002-07-02 Breck Colquett Weighing apparatus and method having automatic tolerance analysis and calibration
US7657910B1 (en) 1999-07-26 2010-02-02 E-Cast Inc. Distributed electronic entertainment method and apparatus
GB2352933A (en) 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6542868B1 (en) 1999-09-23 2003-04-01 International Business Machines Corporation Audio notification management system
US6937977B2 (en) 1999-10-05 2005-08-30 Fastmobile, Inc. Method and apparatus for processing an input speech signal during presentation of an output audio signal
US6611604B1 (en) 1999-10-22 2003-08-26 Stillwater Designs & Audio, Inc. Ultra low frequency transducer and loud speaker comprising same
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
US6522886B1 (en) 1999-11-22 2003-02-18 Qwest Communications International Inc. Method and system for simultaneously sharing wireless communications among multiple wireless handsets
US6219645B1 (en) 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
ES2277419T3 (es) 1999-12-03 2007-07-01 Telefonaktiebolaget Lm Ericsson (Publ) Un metodo para producir simultaneamente ficheros de audio en dos telefonos.
KR20010054622A (ko) 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US20010042107A1 (en) 2000-01-06 2001-11-15 Palm Stephen R. Networked audio player transport protocol and architecture
US7661107B1 (en) 2000-01-18 2010-02-09 Advanced Micro Devices, Inc. Method and apparatus for dynamic allocation of processing resources
WO2001053994A2 (en) 2000-01-24 2001-07-26 Friskit, Inc. Streaming media search and playback system
AU2001231115A1 (en) 2000-01-24 2001-07-31 Zapmedia, Inc. System and method for the distribution and sharing of media assets between mediaplayers devices
EP1256207B1 (en) 2000-02-18 2007-09-05 Bridgeco AG Multi-portal bridge for providing network connectivity
JP2001236093A (ja) 2000-02-24 2001-08-31 Omron Corp 電子機器制御装置および電子機器
US6631410B1 (en) 2000-03-16 2003-10-07 Sharp Laboratories Of America, Inc. Multimedia wired/wireless content synchronization system and method
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
AU4219601A (en) 2000-03-31 2001-10-15 Classwave Wireless Inc. Dynamic protocol selection and routing of content to mobile devices
GB2363036B (en) 2000-05-31 2004-05-12 Nokia Mobile Phones Ltd Conference call method and apparatus therefor
US20050164664A1 (en) 2000-07-21 2005-07-28 Difonzo Daniel F. Dynamically reconfigurable wireless networks (DRWiN) and methods for operating such networks
US20040105566A1 (en) 2000-07-27 2004-06-03 International Business Machines Corporation Body set type speaker unit
US8165867B1 (en) 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
US6934756B2 (en) 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US20020054685A1 (en) 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US20020072816A1 (en) 2000-12-07 2002-06-13 Yoav Shdema Audio system
US7016847B1 (en) 2000-12-08 2006-03-21 Ben Franklin Patent Holdings L.L.C. Open architecture for a voice user interface
US6778869B2 (en) 2000-12-11 2004-08-17 Sony Corporation System and method for request, delivery and use of multimedia files for audiovisual entertainment in the home environment
US7143939B2 (en) 2000-12-19 2006-12-05 Intel Corporation Wireless music device and method therefor
US20020124097A1 (en) 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6885989B2 (en) 2001-04-02 2005-04-26 International Business Machines Corporation Method and system for collaborative speech recognition for small-area network
US6757517B2 (en) 2001-05-10 2004-06-29 Chin-Chi Chang Apparatus and method for coordinated music playback in wireless ad-hoc networks
US7136934B2 (en) 2001-06-19 2006-11-14 Request, Inc. Multimedia synchronization method and device
KR100420069B1 (ko) 2001-08-23 2004-02-25 한국과학기술원 인지 특성을 반영한 메뉴 설계 및 아이템 제시방법
US6892083B2 (en) 2001-09-05 2005-05-10 Vocera Communications Inc. Voice-controlled wireless communications system and method
US7536704B2 (en) 2001-10-05 2009-05-19 Opentv, Inc. Method and apparatus automatic pause and resume of playback for a popup on interactive TV
CA2408045A1 (en) 2001-10-16 2003-04-16 Audio Products International Corp. Loudspeaker with large displacement motional feedback
CA2407123C (en) 2001-10-16 2007-12-18 Audio Products International Corp. Low distortion loudspeaker cone suspension
US7006639B2 (en) 2001-11-20 2006-02-28 Maximilian Hans Hobelsberger Active noise-attenuating duct element
US7103542B2 (en) 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
AU2002361767A1 (en) 2001-12-17 2003-07-09 Becomm Corporation Method and system for synchronization of content rendering
DE10163213A1 (de) 2001-12-21 2003-07-10 Philips Intellectual Property Verfahren zum Betrieb eines Spracherkennungssystems
US8103009B2 (en) 2002-01-25 2012-01-24 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
US7853341B2 (en) 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP4086280B2 (ja) 2002-01-29 2008-05-14 株式会社東芝 音声入力システム、音声入力方法及び音声入力プログラム
JP2005518734A (ja) 2002-02-20 2005-06-23 メシュネットワークス、インコーポレイテッド チャンネル間で802.11データトラフィックをルーティングしてアドホックネットワーク容量を増大するシステムおよび方法
JP3715584B2 (ja) 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
EP1510031A4 (en) 2002-05-06 2009-02-04 Syncronation Inc LOCALIZED AUDIO NETWORKS AND ASSOCIATED DIGITAL TOOLS
AU2003241405B2 (en) 2002-05-09 2008-06-19 Netstreams, Llc Audio network distribution system
US6961423B2 (en) 2002-06-24 2005-11-01 Freescale Semiconductor, Inc. Method and apparatus for performing adaptive filtering
JP3815388B2 (ja) 2002-06-25 2006-08-30 株式会社デンソー 音声認識システムおよび端末
US8060225B2 (en) 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
EP1389853B1 (en) 2002-08-14 2006-03-29 Sony Deutschland GmbH Bandwidth oriented reconfiguration of wireless ad hoc networks
JP3910898B2 (ja) 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
US7228275B1 (en) 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
JP2004163590A (ja) 2002-11-12 2004-06-10 Denso Corp 再生装置及びプログラム
KR20040042242A (ko) 2002-11-13 2004-05-20 삼성전자주식회사 홈서버를 이용하는 홈로봇 및 이를 포함하는 홈네트워크시스템
US7295548B2 (en) 2002-11-27 2007-11-13 Microsoft Corporation Method and system for disaggregating audio/visual components
CN100392723C (zh) 2002-12-11 2008-06-04 索夫塔马克斯公司 在稳定性约束下使用独立分量分析的语音处理系统和方法
US7076428B2 (en) 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
KR100668297B1 (ko) 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US6823050B2 (en) 2003-02-13 2004-11-23 International Business Machines Corporation System and method for interfacing with a personal telephony recorder
CA2518121A1 (en) 2003-03-03 2004-09-16 America Online, Inc. Source audio identifiers for digital communications
JP2004347943A (ja) 2003-05-23 2004-12-09 Clarion Co Ltd データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2004354721A (ja) 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
US7571014B1 (en) 2004-04-01 2009-08-04 Sonos, Inc. Method and apparatus for controlling multimedia players in a multi-zone system
US8234395B2 (en) 2003-07-28 2012-07-31 Sonos, Inc. System and method for synchronizing operations among a plurality of independently clocked digital data processing devices
US10613817B2 (en) 2003-07-28 2020-04-07 Sonos, Inc. Method and apparatus for displaying a list of tracks scheduled for playback by a synchrony group
US7961892B2 (en) 2003-07-28 2011-06-14 Texas Instruments Incorporated Apparatus and method for monitoring speaker cone displacement in an audio speaker
US8290603B1 (en) 2004-06-05 2012-10-16 Sonos, Inc. User interfaces for controlling and manipulating groupings in a multi-zone media system
US20050031133A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Process for position indication
US20050031139A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using impedance
US20050031140A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using a capacitance measurement
US20060104451A1 (en) 2003-08-07 2006-05-18 Tymphany Corporation Audio reproduction system
US20050031134A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Position detection of an actuator using infrared light
US20050031138A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of measuring a cant of an actuator
US20050031131A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Method of modifying dynamics of a system
US20050031132A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Control system
US20050031137A1 (en) 2003-08-07 2005-02-10 Tymphany Corporation Calibration of an actuator
KR20050023841A (ko) 2003-09-03 2005-03-10 삼성전자주식회사 비선형 왜곡 저감 방법 및 장치
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US20050077843A1 (en) 2003-10-11 2005-04-14 Ronnie Benditt Method and apparatus for controlling a performing arts show by an onstage performer
CN1871874A (zh) 2003-10-24 2006-11-29 皇家飞利浦电子股份有限公司 自适应声音再现
JP4516527B2 (ja) 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
US7705565B2 (en) 2003-12-31 2010-04-27 Motorola, Inc. Method and system for wireless charging
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
JP4269973B2 (ja) 2004-02-27 2009-05-27 株式会社デンソー カーオーディオシステム
US7415117B2 (en) 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7483538B2 (en) 2004-03-02 2009-01-27 Ksc Industries, Inc. Wireless and wired speaker hub for a home theater system
JP4059214B2 (ja) 2004-03-04 2008-03-12 ソニー株式会社 情報再生システムの制御方法、情報再生システム、情報提供装置、および情報提供プログラム
US10200504B2 (en) 2007-06-12 2019-02-05 Icontrol Networks, Inc. Communication protocols over internet protocol (IP) networks
US7372966B2 (en) 2004-03-19 2008-05-13 Nokia Corporation System for limiting loudspeaker displacement
JP2005284492A (ja) 2004-03-29 2005-10-13 Mitsubishi Electric Corp 音声利用操作装置
US7630501B2 (en) 2004-05-14 2009-12-08 Microsoft Corporation System and method for calibration of an acoustic system
US7792311B1 (en) 2004-05-15 2010-09-07 Sonos, Inc., Method and apparatus for automatically enabling subwoofer channel audio based on detection of subwoofer device
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7006938B2 (en) 2004-06-16 2006-02-28 Ami Semiconductor, Inc. Reactive sensor modules using Pade' Approximant based compensation and providing module-sourced excitation
US7672845B2 (en) 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
US20060004834A1 (en) 2004-06-30 2006-01-05 Nokia Corporation Dynamic shortcuts
JP2006092482A (ja) 2004-09-27 2006-04-06 Yamaha Corp 音声認識通報装置
US7720232B2 (en) 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8386523B2 (en) 2004-12-30 2013-02-26 Texas Instruments Incorporated Random access audio decoder
TWI272860B (en) 2005-01-03 2007-02-01 Lite On Technology Corp Audio receiver and volume reminder method
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
WO2006076804A1 (en) 2005-01-21 2006-07-27 Certicom Corp. Elliptic curve random number generation
US20060190968A1 (en) 2005-01-31 2006-08-24 Searete Llc, A Limited Corporation Of The State Of The State Of Delaware Sharing between shared audio devices
EP1715669A1 (en) 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
WO2006111370A1 (en) 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal
US7720684B2 (en) 2005-04-29 2010-05-18 Nuance Communications, Inc. Method, apparatus, and computer program product for one-step correction of voice interaction
US7991167B2 (en) 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US9300790B2 (en) 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
JP4760160B2 (ja) 2005-06-29 2011-08-31 ヤマハ株式会社 集音装置
JP4804052B2 (ja) 2005-07-08 2011-10-26 アルパイン株式会社 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US20070018844A1 (en) 2005-07-19 2007-01-25 Sehat Sutardja Two way remote control
JP4285457B2 (ja) 2005-07-20 2009-06-24 ソニー株式会社 音場測定装置及び音場測定方法
EP1912468B1 (en) 2005-07-29 2013-08-14 Panasonic Corporation Loudspeaker device
CN1909625A (zh) 2005-08-05 2007-02-07 鸿富锦精密工业(深圳)有限公司 一种自动调整音量的电视装置及控制方法
JP2009505321A (ja) 2005-08-19 2009-02-05 グレースノート インコーポレイテッド 再生装置の動作を制御する方法およびシステム
US20070060054A1 (en) 2005-09-15 2007-03-15 Sony Ericsson Mobile Communications Ab Wireless home communication system method and apparatus
JP4519041B2 (ja) 2005-09-20 2010-08-04 ローランド株式会社 楽器用スピーカ装置
US20080253589A1 (en) 2005-09-21 2008-10-16 Koninklijke Philips Electronics N.V. Ultrasound Imaging System with Voice Activated Controls Using Remotely Positioned Microphone
EP1952619B1 (en) 2005-11-07 2018-02-28 Telecom Italia S.p.A. Method for managing a conference call in a telephone network
CA2629801C (en) 2005-11-15 2011-02-01 Yamaha Corporation Remote conference apparatus and sound emitting/collecting apparatus
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
US20070140058A1 (en) 2005-11-21 2007-06-21 Motorola, Inc. Method and system for correcting transducer non-linearities
US7600194B2 (en) 2005-12-02 2009-10-06 Microsoft Corporation Start menu operation for computer user interface
JP4677341B2 (ja) 2005-12-21 2011-04-27 パイオニア株式会社 スピーカー装置及び携帯電話機
JP2007174233A (ja) 2005-12-21 2007-07-05 Pioneer Electronic Corp スピーカー装置及び携帯電話機
US20160066087A1 (en) 2006-01-30 2016-03-03 Ludger Solbach Joint noise suppression and acoustic echo cancellation
KR100762636B1 (ko) 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
JP4422692B2 (ja) 2006-03-03 2010-02-24 日本電信電話株式会社 伝達経路推定方法、残響除去方法、音源分離方法、これらの装置、プログラム、記録媒体
WO2007103937A2 (en) 2006-03-06 2007-09-13 General Innovations, Inc. Positionally sequenced loudspeaker system
US9092435B2 (en) 2006-04-04 2015-07-28 Johnson Controls Technology Company System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
EP1848243B1 (en) 2006-04-18 2009-02-18 Harman/Becker Automotive Systems GmbH Multi-channel echo compensation system and method
KR100786108B1 (ko) 2006-05-01 2007-12-18 김준식 음파통신 네트워크
US9208785B2 (en) 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
ATE436151T1 (de) 2006-05-10 2009-07-15 Harman Becker Automotive Sys Kompensation von mehrkanalechos durch dekorrelation
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
JP4984683B2 (ja) 2006-06-29 2012-07-25 ヤマハ株式会社 放収音装置
US8207936B2 (en) 2006-06-30 2012-06-26 Sony Ericsson Mobile Communications Ab Voice remote control
US8189765B2 (en) 2006-07-06 2012-05-29 Panasonic Corporation Multichannel echo canceller
US20080037814A1 (en) 2006-08-09 2008-02-14 Jeng-Jye Shau Precision audio speakers
WO2008018099A1 (en) 2006-08-10 2008-02-14 Claudio Lastrucci Improvements to systems for acoustic diffusion
US10013381B2 (en) 2006-08-31 2018-07-03 Bose Corporation Media playing from a docked handheld media device
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8473618B2 (en) 2006-09-19 2013-06-25 Motorola Solutions, Inc. Method and system for processing multiple communication sessions in a communication network
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
TWI435591B (zh) 2006-10-17 2014-04-21 Marvell World Trade Ltd 用於蜂巢電話之顯示控制
US7747293B2 (en) 2006-10-17 2010-06-29 Marvell Worl Trade Ltd. Display control for cellular phone
JP2010507294A (ja) 2006-10-17 2010-03-04 アベガ システムズ ピーティーワイ リミテッド マルチメディアデバイスの統合
US8391501B2 (en) 2006-12-13 2013-03-05 Motorola Mobility Llc Method and apparatus for mixing priority and non-priority audio signals
US9124650B2 (en) 2006-12-13 2015-09-01 Quickplay Media Inc. Digital rights management in a mobile environment
US20080146289A1 (en) 2006-12-14 2008-06-19 Motorola, Inc. Automatic audio transducer adjustments based upon orientation of a mobile communication device
JP2008158868A (ja) 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
US7973857B2 (en) 2006-12-27 2011-07-05 Nokia Corporation Teleconference group formation using context information
US20090013255A1 (en) 2006-12-30 2009-01-08 Matthew John Yuschik Method and System for Supporting Graphical User Interfaces
KR101316750B1 (ko) 2007-01-23 2013-10-08 삼성전자주식회사 수신된 위치 정보에 따라 오디오 파일을 재생하는 장치 및그 방법
TW200833152A (en) 2007-01-31 2008-08-01 Bluepacket Comm Co Ltd Multimedia switching system
JPWO2008096414A1 (ja) 2007-02-06 2010-05-20 パイオニア株式会社 コンテンツ取得装置、コンテンツ取得方法、コンテンツ取得プログラムおよび記録媒体
US20090228919A1 (en) 2007-11-16 2009-09-10 Zott Joseph A Media playlist management and viewing remote control
US20080208594A1 (en) 2007-02-27 2008-08-28 Cross Charles W Effecting Functions On A Multimodal Telephony Device
JP4728982B2 (ja) 2007-03-05 2011-07-20 株式会社東芝 利用者と対話する装置、方法およびプログラム
US8880405B2 (en) 2007-03-07 2014-11-04 Vlingo Corporation Application text entry in a mobile environment using a speech processing facility
US8635243B2 (en) 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8019076B1 (en) 2007-03-14 2011-09-13 Clearone Communications, Inc. Portable speakerphone device and subsystem utilizing false doubletalk detection
GB0706074D0 (en) 2007-03-28 2007-05-09 Skype Ltd Detection of communication states
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8983051B2 (en) 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8406439B1 (en) 2007-04-04 2013-03-26 At&T Intellectual Property I, L.P. Methods and systems for synthetic audio placement
US8848879B1 (en) 2007-05-03 2014-09-30 Avaya Inc. Customizable notification based on recent communication history
KR100827613B1 (ko) 2007-05-04 2008-05-07 삼성전자주식회사 휴대용 단말기의 마이크 제어 장치 및 방법
US8041565B1 (en) 2007-05-04 2011-10-18 Foneweb, Inc. Precision speech to text conversion
US8032383B1 (en) 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8136040B2 (en) 2007-05-16 2012-03-13 Apple Inc. Audio variance for multiple windows
CN101681484B (zh) 2007-05-18 2013-10-16 速函移动公司 用于通过小数据速率通信系统的增强型通信的系统和方法
US20080291916A1 (en) 2007-05-22 2008-11-27 Bo Xiong Systems and methods for dynamic quality of service
EP1998446A1 (en) 2007-05-31 2008-12-03 Alcatel Lucent Remote control for devices with connectivity to a service delivery platform
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
JP4985151B2 (ja) 2007-06-29 2012-07-25 ヤマハ株式会社 コンテンツ配信システム及びセンタ装置
JP4916394B2 (ja) 2007-07-03 2012-04-11 富士通株式会社 エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
WO2009020617A1 (en) 2007-08-06 2009-02-12 Orison Corporation System and method for three-dimensional ultrasound imaging
US20090046866A1 (en) 2007-08-15 2009-02-19 Fortemedia, Inc. Apparatus capable of performing acoustic echo cancellation and a method thereof
US8073125B2 (en) 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
US7844724B2 (en) 2007-10-24 2010-11-30 Social Communications Company Automated real-time data stream switching in a shared virtual area communication environment
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8013720B2 (en) 2007-11-02 2011-09-06 Reverse Control, Inc. Signal apparatus for facilitating safe backup of vehicles
CN103648071B (zh) 2007-11-20 2018-11-02 松下知识产权经营株式会社 扬声器、视频设备、以及便携式信息处理装置
US9247346B2 (en) 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US20090153289A1 (en) 2007-12-12 2009-06-18 Eric James Hope Handheld electronic devices with bimodal remote control functionality
US9386154B2 (en) 2007-12-21 2016-07-05 Nuance Communications, Inc. System, method and software program for enabling communications between customer service agents and users of communication devices
US8473081B2 (en) 2007-12-25 2013-06-25 Personics Holdings, Inc. Method and system for event reminder using an earpiece
WO2009086599A1 (en) 2008-01-07 2009-07-16 Avega Systems Pty Ltd A user interface for managing the operation of networked media playback devices
US9992314B2 (en) 2008-01-24 2018-06-05 Garmin Switzerland Gmbh Automatic device mode switching
DE102008039329A1 (de) 2008-01-25 2009-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE102008039330A1 (de) 2008-01-31 2009-08-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
US8072905B2 (en) 2008-02-04 2011-12-06 Sony Ericsson Mobile Communications Ab Intelligent interaction between devices in a local network
US8213598B2 (en) 2008-02-26 2012-07-03 Microsoft Corporation Harmonic distortion residual echo suppression
US8638908B2 (en) 2008-02-28 2014-01-28 Computer Products Introductions, Corp Contextual conversation processing in telecommunication applications
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8255224B2 (en) 2008-03-07 2012-08-28 Google Inc. Voice recognition grammar selection based on context
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
WO2009120301A2 (en) 2008-03-25 2009-10-01 Square Products Corporation System and method for simultaneous media presentation
US20090248397A1 (en) 2008-03-25 2009-10-01 Microsoft Corporation Service Initiation Techniques
US7516068B1 (en) 2008-04-07 2009-04-07 International Business Machines Corporation Optimized collection of audio for speech recognition
CN101562671A (zh) 2008-04-18 2009-10-21 鸿富锦精密工业(深圳)有限公司 音频设备的音量控制方法及通信装置
US8751227B2 (en) 2008-04-30 2014-06-10 Nec Corporation Acoustic model learning device and speech recognition device
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8831948B2 (en) 2008-06-06 2014-09-09 At&T Intellectual Property I, L.P. System and method for synthetically generated speech describing media content
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8325909B2 (en) 2008-06-25 2012-12-04 Microsoft Corporation Acoustic echo suppression
US8693663B2 (en) 2008-06-27 2014-04-08 Centurylink Intellectual Property Llc System and method for implementing do-not-disturb during playback of media content
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
US8505056B2 (en) 2008-07-10 2013-08-06 Apple Inc. Updating properties of remote A/V performance nodes
EP2146519B1 (en) 2008-07-16 2012-06-06 Nuance Communications, Inc. Beamforming pre-processing for speaker localization
US8781833B2 (en) 2008-07-17 2014-07-15 Nuance Communications, Inc. Speech recognition semantic classification training
US8639830B2 (en) 2008-07-22 2014-01-28 Control4 Corporation System and method for streaming audio
US8325938B2 (en) 2008-08-12 2012-12-04 Sony Corporation Handsfree call apparatus, acoustic reproducing apparatus with handsfree call function, and handsfree call method
JP5206234B2 (ja) 2008-08-27 2013-06-12 富士通株式会社 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US8676586B2 (en) 2008-09-16 2014-03-18 Nice Systems Ltd Method and apparatus for interaction or discourse analytics
KR20100034229A (ko) 2008-09-23 2010-04-01 삼성전자주식회사 이어폰 회로를 포함하는 휴대 단말기 및 이의 운용방법
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
EP3258468B1 (en) 2008-11-10 2019-08-21 Google LLC Multisensory speech detection
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
JP5347472B2 (ja) 2008-12-12 2013-11-20 ヤマハ株式会社 遠隔制御装置および遠隔制御システム
US8548812B2 (en) 2008-12-22 2013-10-01 Avaya Inc. Method and system for detecting a relevant utterance in a voice session
KR101467796B1 (ko) 2009-01-12 2014-12-10 엘지전자 주식회사 이동단말기 및 그 제어 방법
US20100179874A1 (en) 2009-01-13 2010-07-15 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons and brands
US8351617B2 (en) 2009-01-13 2013-01-08 Fortemedia, Inc. Method for phase mismatch calibration for an array microphone and phase calibration module for the same
US20130283169A1 (en) 2012-04-24 2013-10-24 Social Communications Company Voice-based virtual area navigation
US8428758B2 (en) 2009-02-16 2013-04-23 Apple Inc. Dynamic audio ducking
FR2943875A1 (fr) 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
KR101064976B1 (ko) 2009-04-06 2011-09-15 한국과학기술원 음원위치추정시스템 및 이를 구비한 음원에 반응하는 로봇
US8243949B2 (en) 2009-04-14 2012-08-14 Plantronics, Inc. Network addressible loudspeaker and audio play
EP2420050B1 (en) 2009-04-15 2013-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multichannel echo canceller
US8483398B2 (en) 2009-04-30 2013-07-09 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses
JP5550456B2 (ja) 2009-06-04 2014-07-16 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
JP4820434B2 (ja) 2009-06-08 2011-11-24 レノボ・シンガポール・プライベート・リミテッド マイクロフォンのミュート・コントロール
US20100332236A1 (en) 2009-06-25 2010-12-30 Blueant Wireless Pty Limited Voice-triggered operation of electronic devices
US8625775B2 (en) 2009-08-06 2014-01-07 Hti Ip, L.L.C. Method and system for reducing echo and noise in a vehicle passenger compartment environment
US8478982B2 (en) 2009-08-06 2013-07-02 Broadcom Corporation Media access control security management in physical layer
JP5440053B2 (ja) 2009-09-14 2014-03-12 ソニー株式会社 情報処理装置及び情報処理方法、並びにコンピューター・プログラム
WO2011033887A1 (ja) 2009-09-17 2011-03-24 株式会社日立メディコ 超音波探触子及び超音波撮像装置
US20110091055A1 (en) 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
US8600073B2 (en) 2009-11-04 2013-12-03 Cambridge Silicon Radio Limited Wind noise suppression
KR101301535B1 (ko) 2009-12-02 2013-09-04 한국전자통신연구원 하이브리드 번역 장치 및 그 방법
US20110145581A1 (en) 2009-12-14 2011-06-16 Verizon Patent And Licensing, Inc. Media playback across devices
JP5641186B2 (ja) 2010-01-13 2014-12-17 ヤマハ株式会社 雑音抑圧装置およびプログラム
NO332437B1 (no) 2010-01-18 2012-09-17 Cisco Systems Int Sarl Apparat og fremgangsmate for a supprimere et akustisk ekko
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
WO2011091402A1 (en) 2010-01-25 2011-07-28 Justin Mason Voice electronic listening assistant
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8713571B2 (en) 2010-02-17 2014-04-29 Microsoft Corporation Asynchronous task execution
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9209987B2 (en) 2010-03-02 2015-12-08 Microsoft Technology Licensing, Llc Social media playback
EP2375779A3 (en) 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9514476B2 (en) 2010-04-14 2016-12-06 Viacom International Inc. Systems and methods for discovering artists
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8437339B2 (en) 2010-04-28 2013-05-07 Hewlett-Packard Development Company, L.P. Techniques to provide integrated voice service management
JP5572445B2 (ja) 2010-04-30 2014-08-13 本田技研工業株式会社 残響抑圧装置、及び残響抑圧方法
CA2943957C (en) 2010-05-04 2017-10-03 Avery Li-Chun Wang Methods and systems for synchronizing media
CN102893633B (zh) 2010-05-06 2015-04-15 杜比实验室特许公司 用于便携式媒体回放装置的音频系统均衡化
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
US9736600B2 (en) 2010-05-17 2017-08-15 Iii Holdings 4, Llc Devices and methods for collecting acoustic data
US20110289506A1 (en) 2010-05-18 2011-11-24 Google Inc. Management of computing resources for applications
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8831761B2 (en) 2010-06-02 2014-09-09 Sony Corporation Method for determining a processed audio signal and a handheld device
JP2011259097A (ja) 2010-06-07 2011-12-22 Sony Corp 音声信号処理装置及び音声信号処理方法
US8588849B2 (en) 2010-07-09 2013-11-19 Blackberry Limited System and method for resuming media
US8699723B2 (en) 2010-07-20 2014-04-15 International Business Machines Corporation Audio device volume manager using measured volume perceived at a first audio device to control volume generation by a second audio device
US8762144B2 (en) 2010-07-21 2014-06-24 Samsung Electronics Co., Ltd. Method and apparatus for voice activity detection
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9349368B1 (en) 2010-08-05 2016-05-24 Google Inc. Generating an audio notification based on detection of a triggering event
US8731939B1 (en) 2010-08-06 2014-05-20 Google Inc. Routing queries based on carrier phrase registration
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
EP2609488A4 (en) 2010-08-27 2015-03-11 Intel Corp APPARATUS AND METHOD FOR PRESSURE ACTIVATION
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
JP5259020B2 (ja) 2010-10-01 2013-08-07 三菱電機株式会社 音声認識装置
US9240111B2 (en) 2010-10-06 2016-01-19 Microsoft Technology Licensing, Llc Inferring building metadata from distributed sensors
CN103222192B (zh) 2010-10-08 2019-05-07 日本电气株式会社 信号处理设备和信号处理方法
WO2012054872A2 (en) 2010-10-22 2012-04-26 Phorus Llc Media distribution architecture
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
US9226069B2 (en) 2010-10-29 2015-12-29 Qualcomm Incorporated Transitioning multiple microphones from a first mode to a second mode
EP2456199A3 (en) 2010-11-22 2014-07-16 DDS Newco Inc. Method and systems of dynamically managing content for use by a media playback device
US20120148075A1 (en) 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
EP2652737B1 (en) 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
JP5771002B2 (ja) 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US9241227B2 (en) 2011-01-06 2016-01-19 Bose Corporation Transducer with integrated sensor
JP2012150237A (ja) 2011-01-18 2012-08-09 Sony Corp 音信号処理装置、および音信号処理方法、並びにプログラム
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
CN102123188A (zh) 2011-03-03 2011-07-13 曾超宁 移动电话耳麦装置
KR20120100514A (ko) 2011-03-04 2012-09-12 삼성전자주식회사 디바이스 그룹핑 방법 및 이를 적용한 서버
US8804977B2 (en) 2011-03-18 2014-08-12 Dolby Laboratories Licensing Corporation Nonlinear reference signal processing for echo suppression
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9493130B2 (en) 2011-04-22 2016-11-15 Angel A. Penilla Methods and systems for communicating content to connected vehicle users based detected tone/mood in voice input
KR20120128542A (ko) 2011-05-11 2012-11-27 삼성전자주식회사 멀티 채널 에코 제거를 위한 멀티 채널 비-상관 처리 방법 및 장치
US9342516B2 (en) 2011-05-18 2016-05-17 Microsoft Technology Licensing, Llc Media presentation playback annotation
US8320577B1 (en) 2011-05-20 2012-11-27 Google Inc. Method and apparatus for multi-channel audio processing using single-channel components
CN103703719B (zh) 2011-05-31 2018-06-05 谷歌有限责任公司 使通信会话中的参与者静音的方法及设备
US8897465B2 (en) 2011-06-01 2014-11-25 Robert Bosch Gmbh Class D micro-speaker
US8958571B2 (en) 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US8738925B1 (en) 2013-01-07 2014-05-27 Fitbit, Inc. Wireless portable biometric device syncing
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
US9762967B2 (en) 2011-06-14 2017-09-12 Comcast Cable Communications, Llc System and method for presenting content with time based metadata
US8731765B2 (en) 2011-06-28 2014-05-20 GM Global Technology Operations LLC Method and apparatus for fault detection in a torque machine of a powertrain system
US20130018659A1 (en) 2011-07-12 2013-01-17 Google Inc. Systems and Methods for Speech Command Processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US20130024018A1 (en) 2011-07-22 2013-01-24 Htc Corporation Multimedia control method and multimedia control system
JP5289517B2 (ja) 2011-07-28 2013-09-11 株式会社半導体理工学研究センター センサネットワークシステムとその通信方法
US9148742B1 (en) 2011-07-29 2015-09-29 Google Inc. Proximity detection via audio
JP5640918B2 (ja) 2011-08-05 2014-12-17 ブラザー工業株式会社 サーバ装置、対応付け方法、及び携帯機器用プログラム
EP2555598A1 (en) 2011-08-05 2013-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for generating optical radiation by means of electrically operated pulsed discharges
US20130039527A1 (en) 2011-08-08 2013-02-14 Bang & Olufsen A/S Modular, configurable speaker and a method of operating it
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
US20130211826A1 (en) 2011-08-22 2013-08-15 Claes-Fredrik Urban Mannby Audio Signals as Buffered Streams of Audio Signals and Metadata
US8750677B2 (en) 2011-08-23 2014-06-10 Microsoft Corporation Method for transferring media playback from a different device
US20130073293A1 (en) 2011-09-20 2013-03-21 Lg Electronics Inc. Electronic device and method for controlling the same
US9094539B1 (en) 2011-09-22 2015-07-28 Amazon Technologies, Inc. Dynamic device adjustments based on determined user sleep state
US8996381B2 (en) 2011-09-27 2015-03-31 Sensory, Incorporated Background speech recognition assistant
US8768707B2 (en) 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9729631B2 (en) 2011-09-30 2017-08-08 Apple Inc. Asynchronous data manipulation
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US8971546B2 (en) 2011-10-14 2015-03-03 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to control audio playback devices
CN103052001B (zh) 2011-10-17 2015-06-24 联想(北京)有限公司 智能设备及其控制方法
GB201118784D0 (en) 2011-10-31 2011-12-14 Omnifone Ltd Djml
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
US8983089B1 (en) 2011-11-28 2015-03-17 Rawles Llc Sound source localization using multiple microphone arrays
CN102567468B (zh) 2011-12-06 2014-06-04 上海聚力传媒技术有限公司 一种用于对媒体文件的播放音量进行调节的方法与设备
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
WO2013089675A1 (en) 2011-12-13 2013-06-20 Intel Corporation Channel navigation in connected media devices through keyword selection
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
KR102022318B1 (ko) 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9654817B2 (en) 2012-01-27 2017-05-16 Avaya Inc. System and method to synchronize video playback on mobile devices
WO2013115748A1 (en) 2012-01-30 2013-08-08 Echostar Ukraine, L.L.C. Apparatus, systems and methods for adjusting output audio volume based on user location
US9401058B2 (en) 2012-01-30 2016-07-26 International Business Machines Corporation Zone based presence determination via voiceprint location awareness
US9418658B1 (en) 2012-02-08 2016-08-16 Amazon Technologies, Inc. Configuration of voice controlled assistant
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9947333B1 (en) 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
US8453058B1 (en) 2012-02-20 2013-05-28 Google Inc. Crowd-sourced audio shortcuts
EP2632141B1 (en) 2012-02-22 2014-10-15 Dialog Semiconductor B.V. Postfilter for Spectral Domain Echo Cancellers to handle Non-linear Echo Components
US9065895B2 (en) 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
US20130238326A1 (en) 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
US9361878B2 (en) 2012-03-30 2016-06-07 Michael Boukadakis Computer-readable medium, system and method of providing domain-specific information
US20130263237A1 (en) * 2012-03-30 2013-10-03 Ebay Inc. User authentication and authorization using personas
US9198204B2 (en) 2012-04-11 2015-11-24 Google Inc. Apparatus and method for seamless commissioning of wireless devices
EP2839391A4 (en) 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9633186B2 (en) 2012-04-23 2017-04-25 Apple Inc. Systems and methods for controlling output of content based on human recognition data detection
US9117449B2 (en) 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
CN104395957B (zh) 2012-04-30 2018-02-13 创新科技有限公司 一种通用可重构回声消除系统
US8886524B1 (en) 2012-05-01 2014-11-11 Amazon Technologies, Inc. Signal processing based on audio context
US11452153B2 (en) 2012-05-01 2022-09-20 Lisnr, Inc. Pairing and gateway connection using sonic tones
US20130294611A1 (en) 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjuction with optimization of acoustic echo cancellation
US9584909B2 (en) 2012-05-10 2017-02-28 Google Inc. Distributed beamforming based on message passing
US9768829B2 (en) 2012-05-11 2017-09-19 Intel Deutschland Gmbh Methods for processing audio signals and circuit arrangements therefor
US8908879B2 (en) 2012-05-23 2014-12-09 Sonos, Inc. Audio content auditioning
US9633368B2 (en) 2012-05-25 2017-04-25 Apple Inc. Content ranking and serving on a multi-user device or interface
CN103456332A (zh) 2012-05-28 2013-12-18 富泰华工业(深圳)有限公司 音频播放装置及音量调节方法
US20130324031A1 (en) 2012-05-31 2013-12-05 Nokia Corporation Dynamic allocation of audio channel for surround sound systems
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
EP2856690B1 (en) 2012-06-01 2020-12-02 BlackBerry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US8903526B2 (en) 2012-06-06 2014-12-02 Sonos, Inc. Device playback failure recovery and redistribution
US9881616B2 (en) 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
US9301073B2 (en) 2012-06-08 2016-03-29 Apple Inc. Systems and methods for determining the condition of multiple microphones
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
US9031255B2 (en) 2012-06-15 2015-05-12 Sonos, Inc. Systems, methods, apparatus, and articles of manufacture to provide low-latency audio
US10354650B2 (en) 2012-06-26 2019-07-16 Google Llc Recognizing speech with mixed speech recognition models to generate transcriptions
US9674587B2 (en) 2012-06-26 2017-06-06 Sonos, Inc. Systems and methods for networked music playback including remote add to queue
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9137564B2 (en) 2012-06-28 2015-09-15 Sonos, Inc. Shift to corresponding media in a playback queue
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9384737B2 (en) 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US20140006825A1 (en) 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
US20140003635A1 (en) 2012-07-02 2014-01-02 Qualcomm Incorporated Audio signal processing device calibration
US9497544B2 (en) 2012-07-02 2016-11-15 Qualcomm Incorporated Systems and methods for surround sound echo reduction
US9615171B1 (en) 2012-07-02 2017-04-04 Amazon Technologies, Inc. Transformation inversion to reduce the effect of room acoustics
KR101972955B1 (ko) 2012-07-03 2019-04-26 삼성전자 주식회사 음성을 이용한 사용자 디바이스들 간 서비스 연결 방법 및 장치
US9536528B2 (en) 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US8972762B2 (en) 2012-07-11 2015-03-03 Blackberry Limited Computing devices and methods for resetting inactivity timers on computing devices
US8983844B1 (en) 2012-07-31 2015-03-17 Amazon Technologies, Inc. Transmission of noise parameters for improving automatic speech recognition
US8831957B2 (en) 2012-08-01 2014-09-09 Google Inc. Speech recognition models based on location indicia
DE112013007782B3 (de) 2012-08-03 2022-02-17 Semiconductor Energy Laboratory Co., Ltd. Lichtemittierende Vorrichtung
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
EP3462452A1 (en) 2012-08-24 2019-04-03 Oticon A/s Noise estimation for use with noise reduction and echo cancellation in personal communication
US9532153B2 (en) 2012-08-29 2016-12-27 Bang & Olufsen A/S Method and a system of providing information to a user
US9088336B2 (en) 2012-09-06 2015-07-21 Imagination Technologies Limited Systems and methods of echo and noise cancellation in voice communication
US20140075311A1 (en) 2012-09-11 2014-03-13 Jesse William Boettcher Methods and apparatus for controlling audio volume on an electronic device
US20140075306A1 (en) 2012-09-12 2014-03-13 Randy Rega Music search and retrieval system
US8798598B2 (en) 2012-09-13 2014-08-05 Alain Rossmann Method and system for screencasting Smartphone video game software to online social networks
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
US8983383B1 (en) 2012-09-25 2015-03-17 Rawles Llc Providing hands-free service to multiple devices
US9319816B1 (en) 2012-09-26 2016-04-19 Amazon Technologies, Inc. Characterizing environment using ultrasound pilot tones
JP2014071138A (ja) 2012-09-27 2014-04-21 Xing Inc カラオケ装置
US8725125B2 (en) 2012-09-28 2014-05-13 United Video Properties, Inc. Systems and methods for controlling audio playback on portable devices with vehicle equipment
KR102091236B1 (ko) 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
WO2014055312A1 (en) 2012-10-02 2014-04-10 Mh Acoustics, Llc Earphones having configurable microphone arrays
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US8484025B1 (en) 2012-10-04 2013-07-09 Google Inc. Mapping an audio utterance to an action using a classifier
CN102902253B (zh) 2012-10-09 2015-07-15 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
US20140108010A1 (en) 2012-10-11 2014-04-17 Intermec Ip Corp. Voice-enabled documents for facilitating operational procedures
CA2888016C (en) 2012-10-15 2022-05-31 Msi Dfat Llc Direct field acoustic testing in a semi-reverberant enclosure
US9232310B2 (en) 2012-10-15 2016-01-05 Nokia Technologies Oy Methods, apparatuses and computer program products for facilitating directional audio capture with multiple microphones
DE102012020271A1 (de) 2012-10-17 2014-04-17 Wolfgang Klippel Anordnung und Verfahren zur Steuerung von Wandlern
KR101978688B1 (ko) 2012-10-22 2019-05-15 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
US9319445B2 (en) 2012-10-22 2016-04-19 Spotify Ab Systems and methods for pre-fetching media content
WO2014064324A1 (en) 2012-10-26 2014-05-01 Nokia Corporation Multi-device speech recognition
KR20140054643A (ko) 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
US9584642B2 (en) 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10381001B2 (en) 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US8761349B2 (en) 2012-10-31 2014-06-24 Citrix Systems, Inc. Systems and methods of monitoring performance of acoustic echo cancellation
US9275637B1 (en) 2012-11-06 2016-03-01 Amazon Technologies, Inc. Wake word evaluation
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9275642B2 (en) 2012-11-13 2016-03-01 Unified Computer Intelligence Corporation Voice-operated internet-ready ubiquitous computing device and method thereof
CN102999161B (zh) 2012-11-13 2016-03-02 科大讯飞股份有限公司 一种语音唤醒模块的实现方法及应用
US9685171B1 (en) 2012-11-20 2017-06-20 Amazon Technologies, Inc. Multiple-stage adaptive filtering of audio signals
US9070367B1 (en) 2012-11-26 2015-06-30 Amazon Technologies, Inc. Local speech recognition of frequent utterances
US20140149118A1 (en) 2012-11-28 2014-05-29 Lg Electronics Inc. Apparatus and method for driving electric device using speech recognition
US9131298B2 (en) 2012-11-28 2015-09-08 Qualcomm Incorporated Constrained dynamic amplitude panning in collaborative sound systems
WO2014142702A1 (en) 2013-03-15 2014-09-18 Obschestvo S Ogranichennoy Otvetstvennostiyu "Speaktoit" Selective speech recognition for chat and digital personal assistant systems
US9203045B2 (en) 2012-11-29 2015-12-01 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
WO2014088588A1 (en) 2012-12-07 2014-06-12 Empire Technology Development Llc Personal assistant context building
US20140161263A1 (en) 2012-12-10 2014-06-12 Microsoft Corporation Facilitating recognition of real-time content
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
US9226071B2 (en) 2012-12-13 2015-12-29 Maxim Integrated Products, Inc. Direct measurement of an input signal to a loudspeaker to determine and limit a temperature of a voice coil of the loudspeaker
US9607046B2 (en) 2012-12-14 2017-03-28 Microsoft Technology Licensing, Llc Probability-based state modification for query dialogues
US9300910B2 (en) 2012-12-14 2016-03-29 Biscotti Inc. Video mail capture, processing and distribution
US9271111B2 (en) 2012-12-14 2016-02-23 Amazon Technologies, Inc. Response endpoint selection
WO2014098477A1 (ko) 2012-12-18 2014-06-26 삼성전자 주식회사 홈 네트워크 시스템에서 홈 디바이스를 원격으로 제어하는 방법 및 장치
US9047857B1 (en) 2012-12-19 2015-06-02 Rawles Llc Voice commands for transitioning between device states
US9098467B1 (en) 2012-12-19 2015-08-04 Rawles Llc Accepting voice commands based on user identity
WO2014102722A1 (en) 2012-12-26 2014-07-03 Sia Technology Ltd. Device, system, and method of controlling electronic devices via thought
US9620115B2 (en) 2013-01-03 2017-04-11 Telenav, Inc. Content delivery system with barge-in mechanism and method of operation thereof
KR102051588B1 (ko) 2013-01-07 2019-12-03 삼성전자주식회사 휴대 단말기의 오디오 컨텐츠 재생 방법 및 그 장치
US9318125B2 (en) 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
JP2014137590A (ja) 2013-01-18 2014-07-28 Yoji Fukinuki 音楽コンテンツ配信方法
US9646605B2 (en) 2013-01-22 2017-05-09 Interactive Intelligence Group, Inc. False alarm reduction in speech recognition systems using contextual information
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
US20140215332A1 (en) 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
US9818407B1 (en) 2013-02-07 2017-11-14 Amazon Technologies, Inc. Distributed endpointing for speech recognition
TWI593294B (zh) 2013-02-07 2017-07-21 晨星半導體股份有限公司 收音系統與相關方法
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9300266B2 (en) 2013-02-12 2016-03-29 Qualcomm Incorporated Speaker equalization for mobile devices
US9237384B2 (en) 2013-02-14 2016-01-12 Sonos, Inc. Automatic configuration of household playback devices
US9842489B2 (en) 2013-02-14 2017-12-12 Google Llc Waking other devices for additional data
US9172747B2 (en) 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
CN105308681B (zh) 2013-02-26 2019-02-12 皇家飞利浦有限公司 用于生成语音信号的方法和装置
US9195432B2 (en) 2013-02-26 2015-11-24 Sonos, Inc. Pre-caching of audio content
CN104010251B (zh) 2013-02-27 2018-06-19 晨星半导体股份有限公司 收音系统与相关方法
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9460715B2 (en) 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
US20140258292A1 (en) 2013-03-05 2014-09-11 Clip Interactive, Inc. Apparatus, system, and method for integrating content and content services
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
JP6429465B2 (ja) 2013-03-07 2018-11-28 株式会社半導体エネルギー研究所 装置及びその作製方法
US9349386B2 (en) 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
WO2014138489A1 (en) 2013-03-07 2014-09-12 Tiskerling Dynamics Llc Room and program responsive loudspeaker system
US9161126B2 (en) 2013-03-08 2015-10-13 Cirrus Logic, Inc. Systems and methods for protecting a speaker
JP6211677B2 (ja) 2013-03-11 2017-10-11 アップル インコーポレイテッド ラウドスピーカの指向性範囲にまたがる音色の一定性
CN104053088A (zh) 2013-03-11 2014-09-17 联想(北京)有限公司 一种麦克风阵列调整方法、麦克风阵列及电子设备
TWI533686B (zh) 2013-03-11 2016-05-11 緯創資通股份有限公司 虛擬頻道之管理方法、具有虛擬頻道之網路多媒體重現系統和電腦可讀取記錄媒體
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
US9173021B2 (en) 2013-03-12 2015-10-27 Google Technology Holdings LLC Method and device for adjusting an audio beam orientation based on device location
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
WO2014165032A1 (en) 2013-03-12 2014-10-09 Aawtend, Inc. Integrated sensor-array processor
US11393461B2 (en) * 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
KR20140111859A (ko) 2013-03-12 2014-09-22 삼성전자주식회사 콘텐트 공유 방법 및 이를 위한 디바이스
CN105009203A (zh) 2013-03-12 2015-10-28 纽昂斯通讯公司 用于检测语音命令的方法和装置
KR101571338B1 (ko) 2013-03-13 2015-11-24 삼성전자주식회사 복수의 재생 장치들이 스트리밍 컨텐트를 동기화하여 재생하는 방법 및 이를 위한 장치
US9060052B2 (en) 2013-03-13 2015-06-16 Accusonus S.A. Single channel, binaural and multi-channel dereverberation
US20140274185A1 (en) 2013-03-14 2014-09-18 Aliphcom Intelligence device connection for wireless media ecosystem
KR102152754B1 (ko) 2013-03-14 2020-09-07 삼성전자주식회사 블루루스 디바이스에서 통신 연결 방법 및 그 장치
JP6013951B2 (ja) 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法
KR101764660B1 (ko) 2013-03-14 2017-08-03 애플 인크. 스피커 및 핸드헬드 청취 디바이스를 사용한 적응적 공간 등화
US20140278933A1 (en) 2013-03-15 2014-09-18 F. Gavin McMillan Methods and apparatus to measure audience engagement with media
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
US9626436B2 (en) 2013-03-15 2017-04-18 Spotify Ab Systems, methods, and computer readable medium for generating playlists
WO2014149050A1 (en) 2013-03-21 2014-09-25 Nuance Communications, Inc. System and method for identifying suboptimal microphone performance
KR102173936B1 (ko) 2013-03-26 2020-11-04 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기, 및 조명 장치
JP6300589B2 (ja) 2013-04-04 2018-03-28 株式会社半導体エネルギー研究所 半導体装置の作製方法
US9462115B2 (en) 2013-04-04 2016-10-04 James S. Rand Unified communications system and method
JP6198432B2 (ja) 2013-04-09 2017-09-20 小島プレス工業株式会社 音声認識制御装置
WO2014172299A1 (en) 2013-04-15 2014-10-23 Chacha Search, Inc. Method and system of increasing user interaction
US9501533B2 (en) 2013-04-16 2016-11-22 Sonos, Inc. Private queue for a media playback system
US9875494B2 (en) 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
US9304736B1 (en) 2013-04-18 2016-04-05 Amazon Technologies, Inc. Voice controlled assistant with non-verbal code entry
JP6416752B2 (ja) 2013-04-19 2018-10-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
US9936290B2 (en) 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US9892729B2 (en) 2013-05-07 2018-02-13 Qualcomm Incorporated Method and apparatus for controlling voice activation
KR102230139B1 (ko) 2013-05-17 2021-03-18 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 조명 장치, 발광 장치, 및 전자 기기
WO2014189486A1 (en) 2013-05-20 2014-11-27 Intel Corporation Natural human-computer interaction for virtual personal assistant systems
US9472201B1 (en) 2013-05-22 2016-10-18 Google Inc. Speaker localization by means of tactile input
US9390708B1 (en) 2013-05-28 2016-07-12 Amazon Technologies, Inc. Low latency and memory efficient keywork spotting
US20140358535A1 (en) 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
US20140357248A1 (en) 2013-06-03 2014-12-04 Ford Global Technologies, Llc Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle
US20140365225A1 (en) 2013-06-05 2014-12-11 DSP Group Ultra-low-power adaptive, user independent, voice triggering schemes
US9438193B2 (en) 2013-06-05 2016-09-06 Sonos, Inc. Satellite volume control
US9654073B2 (en) 2013-06-07 2017-05-16 Sonos, Inc. Group volume control
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
DE112014002749B4 (de) 2013-06-09 2021-08-26 Apple Inc. Bluetooth-Alarmbenachrichtigungsdienst
US9787273B2 (en) 2013-06-13 2017-10-10 Google Technology Holdings LLC Smart volume control of device audio output based on received audio input
US8953778B2 (en) 2013-06-17 2015-02-10 Avaya Inc. Real-time intelligent mute interactive features
US9066048B2 (en) 2013-06-17 2015-06-23 Spotify Ab System and method for switching between audio content while navigating through video streams
US9324322B1 (en) 2013-06-18 2016-04-26 Amazon Technologies, Inc. Automatic volume attenuation for speech enabled devices
US9494683B1 (en) 2013-06-18 2016-11-15 Amazon Technologies, Inc. Audio-based gesture detection
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9697831B2 (en) 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9640179B1 (en) 2013-06-27 2017-05-02 Amazon Technologies, Inc. Tailoring beamforming techniques to environments
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
WO2014210429A1 (en) 2013-06-28 2014-12-31 Harman International Industries, Inc. Wireless control of linked devices
US9298415B2 (en) 2013-07-09 2016-03-29 Sonos, Inc. Systems and methods to provide play/pause content
US20150019201A1 (en) 2013-07-09 2015-01-15 Stanley F. Schoenbach Real-time interpreting systems and methods
US9396727B2 (en) 2013-07-10 2016-07-19 GM Global Technology Operations LLC Systems and methods for spoken dialog service arbitration
US9293480B2 (en) 2013-07-10 2016-03-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and display device including the semiconductor device
CN110096253B (zh) 2013-07-11 2022-08-30 英特尔公司 利用相同的音频输入的设备唤醒和说话者验证
DE102014109122A1 (de) 2013-07-12 2015-01-15 Gm Global Technology Operations, Llc Systeme und Verfahren für ergebnisbezogene Arbitrierung in Sprachdialogsystemen
US9426598B2 (en) 2013-07-15 2016-08-23 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
US9445196B2 (en) 2013-07-24 2016-09-13 Mh Acoustics Llc Inter-channel coherence reduction for stereophonic and multichannel acoustic echo cancellation
US9431014B2 (en) 2013-07-25 2016-08-30 Haier Us Appliance Solutions, Inc. Intelligent placement of appliance response to voice command
US9772994B2 (en) 2013-07-25 2017-09-26 Intel Corporation Self-learning statistical natural language processing for automatic production of virtual personal assistants
US9666187B1 (en) 2013-07-25 2017-05-30 Google Inc. Model for enabling service providers to address voice-activated commands
WO2015017303A1 (en) 2013-07-31 2015-02-05 Motorola Mobility Llc Method and apparatus for adjusting voice recognition processing based on noise characteristics
US10186262B2 (en) 2013-07-31 2019-01-22 Microsoft Technology Licensing, Llc System with multiple simultaneous speech recognizers
US9418651B2 (en) 2013-07-31 2016-08-16 Google Technology Holdings LLC Method and apparatus for mitigating false accepts of trigger phrases
US9548047B2 (en) 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
DE102013012811B4 (de) 2013-08-01 2024-02-22 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Korrektur der nichtlinearen Eigenschaften elektromagnetischer Wandler
US9565497B2 (en) 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
US10873997B2 (en) 2013-08-01 2020-12-22 Fong-Min Chang Voice controlled artificial intelligent smart illumination device
EP3036594B1 (en) 2013-08-21 2021-05-26 Ademco Inc. Devices and methods for interacting with an hvac controller
EP2862164B1 (en) 2013-08-23 2017-05-31 Nuance Communications, Inc. Multiple pass automatic speech recognition
US9190043B2 (en) 2013-08-27 2015-11-17 Bose Corporation Assisting conversation in noisy environments
US9514747B1 (en) 2013-08-28 2016-12-06 Amazon Technologies, Inc. Reducing speech recognition latency
TWI520127B (zh) 2013-08-28 2016-02-01 晨星半導體股份有限公司 應用於音訊裝置的控制器與相關的操作方法
KR20160048960A (ko) 2013-08-30 2016-05-04 후아웨이 테크놀러지 컴퍼니 리미티드 복수 단말의 멀티미디어 파일 협동 플레이 방법, 및 관련 장치 및 시스템
JP6037026B2 (ja) 2013-09-11 2016-11-30 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
US9672812B1 (en) 2013-09-18 2017-06-06 Amazon Technologies, Inc. Qualifying trigger expressions in speech-based systems
US9516081B2 (en) 2013-09-20 2016-12-06 Amazon Technologies, Inc. Reduced latency electronic content system
US9848260B2 (en) 2013-09-24 2017-12-19 Nuance Communications, Inc. Wearable communication enhancement device
US9668052B2 (en) 2013-09-25 2017-05-30 Google Technology Holdings LLC Audio routing system for routing audio data to and from a mobile device
US9443527B1 (en) 2013-09-27 2016-09-13 Amazon Technologies, Inc. Speech recognition capability generation and control
US9355555B2 (en) 2013-09-27 2016-05-31 Sonos, Inc. System and method for issuing commands in a media playback system
CN103546616A (zh) 2013-09-30 2014-01-29 深圳市同洲电子股份有限公司 一种调节音量的方法及装置
US9288596B2 (en) 2013-09-30 2016-03-15 Sonos, Inc. Coordinator device for paired or consolidated players
KR102114219B1 (ko) 2013-10-10 2020-05-25 삼성전자주식회사 오디오 시스템 및 오디오 출력 방법, 그리고 스피커 장치
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9633671B2 (en) 2013-10-18 2017-04-25 Apple Inc. Voice quality enhancement techniques, speech recognition techniques, and related systems
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
TWI642170B (zh) 2013-10-18 2018-11-21 半導體能源研究所股份有限公司 顯示裝置及電子裝置
US9818061B1 (en) 2013-10-22 2017-11-14 Lumin, LLC Collaboration of audio sensors for geo-location and continuous tracking of multiple users in a device-independent artificial intelligence (AI) environment
WO2015060867A1 (en) 2013-10-25 2015-04-30 Intel Corporation Techniques for preventing voice replay attacks
EP2869599B1 (en) 2013-11-05 2020-10-21 Oticon A/s A binaural hearing assistance system comprising a database of head related transfer functions
JP2015090570A (ja) 2013-11-06 2015-05-11 ソニー株式会社 情報処理装置および制御方法
US10311482B2 (en) 2013-11-11 2019-06-04 At&T Intellectual Property I, Lp Method and apparatus for adjusting a digital assistant persona
US8775191B1 (en) 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
JP6236303B2 (ja) 2013-11-26 2017-11-22 株式会社デンソーアイティーラボラトリ 制御装置、制御方法およびプログラム
US9373321B2 (en) 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
US9698999B2 (en) 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US9704478B1 (en) 2013-12-02 2017-07-11 Amazon Technologies, Inc. Audio output masking for improved automatic speech recognition
CN104143326B (zh) 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
US8719039B1 (en) 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
US10720153B2 (en) * 2013-12-13 2020-07-21 Harman International Industries, Incorporated Name-sensitive listening device
US10055190B2 (en) 2013-12-16 2018-08-21 Amazon Technologies, Inc. Attribute-based audio channel arbitration
US9378651B2 (en) 2013-12-17 2016-06-28 Google Inc. Audio book smart pause
US10224056B1 (en) 2013-12-17 2019-03-05 Amazon Technologies, Inc. Contingent device actions during loss of network connectivity
US9721570B1 (en) 2013-12-17 2017-08-01 Amazon Technologies, Inc. Outcome-oriented dialogs on a speech recognition platform
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
CN105723451B (zh) 2013-12-20 2020-02-28 英特尔公司 从低功率始终侦听模式到高功率语音识别模式的转换
US20150179181A1 (en) 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US9899021B1 (en) 2013-12-20 2018-02-20 Amazon Technologies, Inc. Stochastic modeling of user interactions with a detection system
US9099974B2 (en) 2013-12-20 2015-08-04 Vmware, Inc. Volume redirection
EP2890160B1 (en) 2013-12-24 2019-08-14 Nxp B.V. Loudspeaker controller
US9301077B2 (en) 2014-01-02 2016-03-29 Harman International Industries, Incorporated Context-based audio tuning
US9443516B2 (en) 2014-01-09 2016-09-13 Honeywell International Inc. Far-field speech recognition systems and methods
US8938394B1 (en) 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
EP3092824B1 (en) 2014-01-10 2017-11-01 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US9300647B2 (en) 2014-01-15 2016-03-29 Sonos, Inc. Software application and zones
US9288597B2 (en) 2014-01-20 2016-03-15 Sony Corporation Distributed wireless speaker system with automatic configuration determination when new speakers are added
WO2015112137A1 (en) 2014-01-22 2015-07-30 Pearl Capital Developments Llc Coordinated hand-off of audio data transmission
US9356882B2 (en) 2014-02-04 2016-05-31 Printeron Inc. Streamlined system for the transmission of network resource data
US9443876B2 (en) 2014-02-05 2016-09-13 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic device including the semiconductor device, the display device, and the display module
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
US9929368B2 (en) 2014-02-06 2018-03-27 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, lighting device, and electronic appliance
TWI658597B (zh) 2014-02-07 2019-05-01 日商半導體能源研究所股份有限公司 半導體裝置
US9318112B2 (en) 2014-02-14 2016-04-19 Google Inc. Recognizing speech in the presence of additional audio
JP6289936B2 (ja) 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
FR3018025B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
FR3018024B1 (fr) 2014-02-26 2016-03-18 Devialet Dispositif de commande d'un haut-parleur
US9408008B2 (en) 2014-02-28 2016-08-02 Sonos, Inc. Playback zone representations
WO2015133022A1 (ja) 2014-03-03 2015-09-11 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US10015593B2 (en) 2014-03-03 2018-07-03 University Of Utah Digital signal processor for audio extensions and correction of nonlinear distortions in loudspeakers
US9489171B2 (en) 2014-03-04 2016-11-08 Microsoft Technology Licensing, Llc Voice-command suggestions based on user identity
US9679054B2 (en) 2014-03-05 2017-06-13 Sonos, Inc. Webpage media playback
US10599287B2 (en) 2014-03-11 2020-03-24 Sonos, Inc. Group volume control
US9640669B2 (en) 2014-03-13 2017-05-02 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device, display device including the semiconductor device, display module including the display device, and electronic appliance including the semiconductor device, the display device, and the display module
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9226062B2 (en) 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
US10514747B2 (en) 2014-03-24 2019-12-24 Silicon Laboratories Inc. Low-power communication apparatus with wakeup detection and associated methods
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
US9648564B1 (en) 2014-03-26 2017-05-09 Amazon Technologies, Inc. Wake-up management for mobile devices
US9916839B1 (en) 2014-03-27 2018-03-13 Amazon Technologies, Inc. Shared audio functionality based on device grouping
US9431021B1 (en) 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
US9547468B2 (en) 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
KR102146462B1 (ko) 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
US8874448B1 (en) 2014-04-01 2014-10-28 Google Inc. Attention-based dynamic audio level adjustment
CN104978965B (zh) 2014-04-07 2019-04-26 三星电子株式会社 电子装置及利用电子装置和服务器的语音识别执行方法
US9560437B2 (en) 2014-04-08 2017-01-31 Doppler Labs, Inc. Time heuristic audio control
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
DE102014005381B3 (de) 2014-04-11 2014-12-11 Wolfgang Klippel Anordnung und Verfahren zur Identifikation und Kompensation nichtlinearer Partialschwingungen elektromechanischer Wandler
US20150302856A1 (en) 2014-04-17 2015-10-22 Qualcomm Incorporated Method and apparatus for performing function by speech input
US20150334471A1 (en) 2014-05-15 2015-11-19 Echostar Technologies L.L.C. Multiple simultaneous audio video data decoding
WO2015178950A1 (en) 2014-05-19 2015-11-26 Tiskerling Dynamics Llc Directivity optimized sound reproduction
EP3146796B1 (en) 2014-05-23 2021-10-27 Samsung Electronics Co., Ltd. Method and apparatus for providing notification
US9860289B2 (en) 2014-05-23 2018-01-02 Radeeus, Inc. Multimedia digital content retrieval, matching, and syncing systems and methods of using the same
US9900723B1 (en) 2014-05-28 2018-02-20 Apple Inc. Multi-channel loudspeaker matching using variable directivity
TWI849490B (zh) 2014-05-30 2024-07-21 日商半導體能源研究所股份有限公司 發光元件,發光裝置,電子裝置以及照明裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US10318016B2 (en) 2014-06-03 2019-06-11 Harman International Industries, Incorporated Hands free device with directional interface
US9720642B2 (en) 2014-06-04 2017-08-01 Sonos, Inc. Prioritizing media content requests
US20150355818A1 (en) 2014-06-04 2015-12-10 Sonos, Inc. Continuous Playback Queue
US10624612B2 (en) 2014-06-05 2020-04-21 Chikayoshi Sumi Beamforming method, measurement and imaging instruments, and communication instruments
US9615170B2 (en) 2014-06-09 2017-04-04 Harman International Industries, Inc. Approach for partially preserving music in the presence of intelligible speech
CN104092936B (zh) 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
US20150363061A1 (en) 2014-06-13 2015-12-17 Autonomic Controls, Inc. System and method for providing related digital content
US9767159B2 (en) 2014-06-13 2017-09-19 Google Inc. Ranking search results
US9589556B2 (en) 2014-06-19 2017-03-07 Yang Gao Energy adjustment of acoustic echo replica signal for speech enhancement
US9520139B2 (en) 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
US9766702B2 (en) 2014-06-19 2017-09-19 Apple Inc. User detection by a computing device
US20150373100A1 (en) 2014-06-19 2015-12-24 Pavel KRAVETS Context sharing between different clients
US9697828B1 (en) 2014-06-20 2017-07-04 Amazon Technologies, Inc. Keyword detection modeling using contextual and environmental information
US10152987B2 (en) 2014-06-23 2018-12-11 Google Llc Remote invocation of mobile device actions
US9632748B2 (en) 2014-06-24 2017-04-25 Google Inc. Device designation for audio input monitoring
US9335819B1 (en) 2014-06-26 2016-05-10 Audible, Inc. Automatic creation of sleep bookmarks in content items
US9368105B1 (en) * 2014-06-26 2016-06-14 Amazon Technologies, Inc. Preventing false wake word detections with a voice-controlled device
US9639854B2 (en) 2014-06-26 2017-05-02 Nuance Communications, Inc. Voice-controlled information exchange platform, such as for providing information to supplement advertising
US9691379B1 (en) 2014-06-26 2017-06-27 Amazon Technologies, Inc. Selecting from multiple content sources
US9398392B2 (en) 2014-06-30 2016-07-19 Microsoft Technology Licensing, Llc Audio calibration and adjustment
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9420331B2 (en) 2014-07-07 2016-08-16 Google Inc. Method and system for categorizing detected motion events
US11330100B2 (en) 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
US9374634B2 (en) 2014-07-10 2016-06-21 Nxp B.V. System for controlling displacement of a loudspeaker
US9467737B2 (en) 2014-07-14 2016-10-11 Sonos, Inc. Zone group control
JP2016024212A (ja) 2014-07-16 2016-02-08 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9671997B2 (en) 2014-07-23 2017-06-06 Sonos, Inc. Zone grouping
US10209947B2 (en) 2014-07-23 2019-02-19 Sonos, Inc. Device grouping
US9263042B1 (en) 2014-07-25 2016-02-16 Google Inc. Providing pre-computed hotword models
KR20160017253A (ko) 2014-08-01 2016-02-16 삼성전자주식회사 디스플레이 구동용 집적 회로 칩
US9874997B2 (en) 2014-08-08 2018-01-23 Sonos, Inc. Social playback queues
US9548066B2 (en) 2014-08-11 2017-01-17 Amazon Technologies, Inc. Voice application architecture
US9769552B2 (en) 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
US20160055847A1 (en) 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
JP6118838B2 (ja) 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
KR20160026317A (ko) 2014-08-29 2016-03-09 삼성전자주식회사 음성 녹음 방법 및 장치
US9560050B2 (en) 2014-09-08 2017-01-31 At&T Intellectual Property I, L.P System and method to share a resource or a capability of a device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9354687B2 (en) 2014-09-11 2016-05-31 Nuance Communications, Inc. Methods and apparatus for unsupervised wakeup with time-correlated acoustic events
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9747011B2 (en) 2014-09-16 2017-08-29 Google Inc. Continuation of playback of media content by different output devices
US10645130B2 (en) 2014-09-24 2020-05-05 Sonos, Inc. Playback updates
US9681228B2 (en) 2014-09-30 2017-06-13 Apple Inc. Capacitive position sensing for transducers
JP6624368B2 (ja) 2014-09-30 2019-12-25 パナソニックIpマネジメント株式会社 接客モニタリングシステム及び接客モニタリング方法
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
GB2525051B (en) 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
US9641919B1 (en) 2014-09-30 2017-05-02 Amazon Technologies, Inc. Audio assemblies for electronic devices
US10235996B2 (en) 2014-10-01 2019-03-19 XBrain, Inc. Voice and connection platform
US10817672B2 (en) 2014-10-01 2020-10-27 Nuance Communications, Inc. Natural language understanding (NLU) processing based on user-specified interests
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
US9812128B2 (en) 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
KR102287943B1 (ko) 2014-10-14 2021-08-09 삼성전자주식회사 전자 기기, 상기 전자 기기의 음량 조절 방법 및 상기 전자 기기의 제어 방법
EP3010251B1 (en) 2014-10-15 2019-11-13 Nxp B.V. Audio system
US20160162469A1 (en) 2014-10-23 2016-06-09 Audience, Inc. Dynamic Local ASR Vocabulary
US9788047B2 (en) 2014-10-30 2017-10-10 Verizon Patent And Licensing Inc. Media guide user interface systems and methods
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10368121B2 (en) 2014-11-07 2019-07-30 Roku, Inc. System and method for collecting data
US9699550B2 (en) 2014-11-12 2017-07-04 Qualcomm Incorporated Reduced microphone power-up latency
US20160134982A1 (en) 2014-11-12 2016-05-12 Harman International Industries, Inc. System and method for estimating the displacement of a speaker cone
JP2016095383A (ja) 2014-11-14 2016-05-26 株式会社ATR−Trek 音声認識クライアント装置及びサーバ型音声認識装置
US10116748B2 (en) 2014-11-20 2018-10-30 Microsoft Technology Licensing, Llc Vehicle-based multi-modal interface
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
KR102299330B1 (ko) 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10192549B2 (en) 2014-11-28 2019-01-29 Microsoft Technology Licensing, Llc Extending digital personal assistant action providers
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
WO2016082046A1 (en) 2014-11-28 2016-06-02 Audera Acoustics Inc. High displacement acoustic transducer systems
US10126406B2 (en) 2014-12-02 2018-11-13 Qualcomm Incorporated Method and apparatus for performing ultrasonic presence detection
US9775113B2 (en) 2014-12-11 2017-09-26 Mediatek Inc. Voice wakeup detecting device with digital microphone and associated method
CN107209549B (zh) 2014-12-11 2020-04-17 微软技术许可有限责任公司 能够实现可动作的消息传送的虚拟助理系统
CN104538030A (zh) 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US9779725B2 (en) 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method
US9813812B2 (en) 2014-12-12 2017-11-07 Analog Devices Global Method of controlling diaphragm excursion of electrodynamic loudspeakers
US9552816B2 (en) 2014-12-19 2017-01-24 Amazon Technologies, Inc. Application focus in speech-based systems
CN104575504A (zh) 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
US9560441B1 (en) 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
CN104635539A (zh) 2014-12-26 2015-05-20 东莞市掌商信息科技有限公司 一种智能硬件远程语音安全控制方法及其系统
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US9934406B2 (en) 2015-01-08 2018-04-03 Microsoft Technology Licensing, Llc Protecting private information in input understanding system
US9584915B2 (en) 2015-01-19 2017-02-28 Microsoft Technology Licensing, Llc Spatial audio with remote speakers
US20160210110A1 (en) 2015-01-21 2016-07-21 Ford Global Technologies, Llc Audio synchronization between vehicles and mobile devices
US9947313B2 (en) 2015-01-26 2018-04-17 William Drewes Method for substantial ongoing cumulative voice recognition error reduction
KR102351366B1 (ko) 2015-01-26 2022-01-14 삼성전자주식회사 음성 인식 방법 및 장치
GB201501791D0 (en) 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
US20160232451A1 (en) 2015-02-09 2016-08-11 Velocee Ltd. Systems and methods for managing audio content
US9521496B2 (en) 2015-02-12 2016-12-13 Harman International Industries, Inc. Media content playback system and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US20160239255A1 (en) 2015-02-16 2016-08-18 Harman International Industries, Inc. Mobile interface for loudspeaker optimization
US20160253050A1 (en) 2015-02-26 2016-09-01 Fingertips Lab, Inc. System and method for audio and tactile based browsing
EP3264258A4 (en) 2015-02-27 2018-08-15 Sony Corporation Information processing device, information processing method, and program
US9721566B2 (en) * 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9697826B2 (en) 2015-03-27 2017-07-04 Google Inc. Processing multi-channel audio waveforms
US10762894B2 (en) 2015-03-27 2020-09-01 Google Llc Convolutional neural networks
US10192546B1 (en) 2015-03-30 2019-01-29 Amazon Technologies, Inc. Pre-wakeword speech processing
US10034109B2 (en) 2015-04-09 2018-07-24 Audera Acoustics Inc. Acoustic transducer systems with position sensing
US9678707B2 (en) 2015-04-10 2017-06-13 Sonos, Inc. Identification of audio content facilitated by playback device
US10198242B2 (en) 2015-04-14 2019-02-05 Motorola Solutions, Inc. Method and apparatus for a volume of a device
US10079012B2 (en) 2015-04-21 2018-09-18 Google Llc Customizing speech-recognition dictionaries in a smart-home environment
US10178474B2 (en) 2015-04-21 2019-01-08 Google Llc Sound signature database for initialization of noise reduction in recordings
US9472196B1 (en) 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
CN104853405B (zh) 2015-05-12 2018-11-30 浙江生辉照明有限公司 智能联网方法及智能设备
KR102623039B1 (ko) 2015-05-15 2024-01-08 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 발광 장치, 전자 기기 및 조명 장치
EP3096277A1 (en) 2015-05-19 2016-11-23 ResearchGate GmbH Enhanced online user-interaction tracking
WO2016185321A1 (en) 2015-05-21 2016-11-24 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, display device, electronic device, and lighting device
US10070237B2 (en) 2015-05-21 2018-09-04 Analog Devices, Inc. Optical and capacitive sensing of electroacoustic transducers
TWI837587B (zh) 2015-05-21 2024-04-01 日商半導體能源研究所股份有限公司 發光元件、顯示裝置、電子裝置、及照明裝置
JP2016218852A (ja) 2015-05-22 2016-12-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
US9837547B2 (en) 2015-05-22 2017-12-05 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device comprising oxide conductor and display device including the semiconductor device
EP3099047A1 (en) 2015-05-28 2016-11-30 Nxp B.V. Echo controller
US9584935B2 (en) 2015-05-29 2017-02-28 Sound United, Llc. Multi-zone media system and method for providing multi-zone media
US10657949B2 (en) 2015-05-29 2020-05-19 Sound United, LLC System and method for integrating a home media system and other home systems
US9734822B1 (en) 2015-06-01 2017-08-15 Amazon Technologies, Inc. Feedback based beamformed signal selection
US9864571B2 (en) 2015-06-04 2018-01-09 Sonos, Inc. Dynamic bonding of playback devices
US9672821B2 (en) 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
US10249205B2 (en) 2015-06-08 2019-04-02 Novel Effect, Inc. System and method for integrating special effects with a text source
KR102444075B1 (ko) 2015-06-09 2022-09-16 삼성전자주식회사 전자 장치, 주변 기기 및 그 제어 방법
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
US20160373909A1 (en) * 2015-06-17 2016-12-22 Hive Life, LLC Wireless audio, security communication and home automation
DE112016002728B4 (de) 2015-06-17 2024-09-12 Semiconductor Energy Laboratory Co., Ltd. Licht emittierendes Element, Anzeigevorrichtung, elektronisches Gerät und Beleuchtungsvorrichtung
JP6739907B2 (ja) 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
US10025447B1 (en) 2015-06-19 2018-07-17 Amazon Technologies, Inc. Multi-device user interface
KR102317526B1 (ko) 2015-06-25 2021-10-26 엘지전자 주식회사 헤드셋 및 그 제어 방법
US9554210B1 (en) 2015-06-25 2017-01-24 Amazon Technologies, Inc. Multichannel acoustic echo cancellation with unique individual channel estimations
KR20170001173A (ko) 2015-06-25 2017-01-04 엘지전자 주식회사 와치 타입 이동 단말기 및 그의 동작 방법
US9472203B1 (en) 2015-06-29 2016-10-18 Amazon Technologies, Inc. Clock synchronization for multichannel system
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
EP3317879B1 (de) 2015-06-30 2020-02-19 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum zuordnen von geräuschen und zum analysieren
CN113889586A (zh) 2015-07-08 2022-01-04 株式会社半导体能源研究所 发光元件、显示装置、电子设备以及照明装置
US10304440B1 (en) 2015-07-10 2019-05-28 Amazon Technologies, Inc. Keyword spotting using multi-task configuration
KR102655709B1 (ko) 2015-07-21 2024-04-05 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9686625B2 (en) 2015-07-21 2017-06-20 Disney Enterprises, Inc. Systems and methods for delivery of personalized audio
US9769563B2 (en) 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
KR102616411B1 (ko) 2015-07-23 2023-12-26 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
WO2017015759A1 (en) 2015-07-30 2017-02-02 Amp Me Inc. Synchronized playback of streamed audio content by multiple internet-capable portable devices
US10529318B2 (en) 2015-07-31 2020-01-07 International Business Machines Corporation Implementing a classification model for recognition processing
US9691361B2 (en) 2015-08-03 2017-06-27 International Business Machines Corporation Adjusting presentation of content on a display
KR102402512B1 (ko) 2015-08-04 2022-05-27 삼성전자주식회사 외부장치의 음량을 조정하는 전자장치 및 방법
CN105187907A (zh) 2015-08-05 2015-12-23 四川长虹电器股份有限公司 智能电视音量控制系统及控制方法
US9913056B2 (en) 2015-08-06 2018-03-06 Dolby Laboratories Licensing Corporation System and method to enhance speakers connected to devices with microphones
US10333904B2 (en) 2015-08-08 2019-06-25 Peter J. Tormey Voice access and control
KR102386854B1 (ko) 2015-08-20 2022-04-13 삼성전자주식회사 통합 모델 기반의 음성 인식 장치 및 방법
US10270041B2 (en) 2015-08-28 2019-04-23 Semiconductor Energy Laboratory Co., Ltd. Light-emitting element, light-emitting device, electronic device, and lighting device
US20180249267A1 (en) 2015-08-31 2018-08-30 Apple Inc. Passive microphone array localizer
US10031719B2 (en) 2015-09-02 2018-07-24 Harman International Industries, Incorporated Audio system with multi-screen application
US10339917B2 (en) 2015-09-03 2019-07-02 Google Llc Enhanced speech endpointing
KR102417682B1 (ko) 2015-09-09 2022-07-07 삼성전자주식회사 음성 인식을 이용한 닉네임 관리 장치 및 방법
US10026399B2 (en) * 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
KR20170031392A (ko) 2015-09-11 2017-03-21 삼성전자주식회사 전자 장치, 음향 시스템 및 오디오 출력 방법
CN105206281B (zh) 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
KR20170032096A (ko) 2015-09-14 2017-03-22 삼성전자주식회사 전자장치, 전자장치의 구동방법, 음성인식장치, 음성인식장치의 구동 방법 및 컴퓨터 판독가능 기록매체
US10289734B2 (en) 2015-09-18 2019-05-14 Samsung Electronics Co., Ltd. Entity-type search system
US10706873B2 (en) 2015-09-18 2020-07-07 Sri International Real-time speaker state analytics platform
CN105204357B (zh) 2015-09-18 2018-02-06 小米科技有限责任公司 智能家居设备的情景模式调整方法及装置
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
KR102446392B1 (ko) 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10229700B2 (en) 2015-09-24 2019-03-12 Google Llc Voice activity detection
US9936156B2 (en) 2015-09-24 2018-04-03 Samantha WESTERN Volume adjusting apparatus and method
US10186276B2 (en) 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
CN105162886B (zh) 2015-09-25 2019-04-12 北京奇艺世纪科技有限公司 一种声音控制方法及装置
WO2017058654A1 (en) 2015-09-28 2017-04-06 Google Inc. Time-synchronized, multizone media streaming
US9996316B2 (en) 2015-09-28 2018-06-12 Amazon Technologies, Inc. Mediation of wakeword response for multiple devices
JP6536320B2 (ja) 2015-09-28 2019-07-03 富士通株式会社 音声信号処理装置、音声信号処理方法及びプログラム
US10241754B1 (en) 2015-09-29 2019-03-26 Amazon Technologies, Inc. Systems and methods for providing supplemental information with a response to a command
US20170092278A1 (en) 2015-09-30 2017-03-30 Apple Inc. Speaker recognition
TW201721922A (zh) 2015-09-30 2017-06-16 半導體能源研究所股份有限公司 發光元件,顯示裝置,電子裝置,及照明裝置
KR20170038681A (ko) 2015-09-30 2017-04-07 가부시키가이샤 한도오따이 에네루기 켄큐쇼 발광 소자, 표시 장치, 전자 기기, 및 조명 장치
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
KR102429260B1 (ko) 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
US9754580B2 (en) 2015-10-12 2017-09-05 Technologies For Voice Interface System and method for extracting and using prosody features
EP3311590B1 (en) 2015-10-15 2019-08-14 Huawei Technologies Co., Ltd. A sound processing node of an arrangement of sound processing nodes
US9747926B2 (en) * 2015-10-16 2017-08-29 Google Inc. Hotword recognition
JP6463710B2 (ja) 2015-10-16 2019-02-06 グーグル エルエルシー ホットワード認識
US9928840B2 (en) 2015-10-16 2018-03-27 Google Llc Hotword recognition
US10453450B2 (en) 2015-10-20 2019-10-22 Bragi GmbH Wearable earpiece voice command control system and method
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105427861B (zh) 2015-11-03 2019-02-15 胡旻波 智能家居协同麦克风语音控制的系统及其控制方法
US9691378B1 (en) 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10863267B2 (en) 2015-11-10 2020-12-08 Savant Systems, Inc. Volume control for audio/video devices
US9990209B2 (en) 2015-11-12 2018-06-05 Microsoft Technology Licensing, Llc Digital assistance device for facilitating multi-stage setup
US10706852B2 (en) 2015-11-13 2020-07-07 Microsoft Technology Licensing, Llc Confidence features for automated speech recognition arbitration
US10592949B2 (en) 2015-11-13 2020-03-17 [24]7.ai, Inc. Method and apparatus for linking customer interactions with customer messaging platforms
US20170140750A1 (en) 2015-11-17 2017-05-18 Le Holdings (Beijing) Co., Ltd. Method and device for speech recognition
CN105472191B (zh) 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
US11929088B2 (en) 2015-11-20 2024-03-12 Synaptics Incorporated Input/output mode control for audio processing
WO2017090115A1 (ja) 2015-11-25 2017-06-01 三菱電機株式会社 音声対話装置および音声対話方法
US10040423B2 (en) 2015-11-27 2018-08-07 Bragi GmbH Vehicle with wearable for identifying one or more vehicle occupants
US9484030B1 (en) 2015-12-02 2016-11-01 Amazon Technologies, Inc. Audio triggered commands
US9699597B2 (en) 2015-12-07 2017-07-04 Google Inc. Wireless signal forwarding
US9747920B2 (en) 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
US10311862B2 (en) 2015-12-23 2019-06-04 Rovi Guides, Inc. Systems and methods for conversations with devices about media using interruptions and changes of subjects
CN105679318A (zh) 2015-12-23 2016-06-15 珠海格力电器股份有限公司 一种基于语音识别的显示方法、装置、显示系统和空调
US10134388B1 (en) 2015-12-23 2018-11-20 Amazon Technologies, Inc. Word generation for speech recognition
US9826599B2 (en) 2015-12-28 2017-11-21 Amazon Technologies, Inc. Voice-controlled light switches
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US10547942B2 (en) 2015-12-28 2020-01-28 Samsung Electronics Co., Ltd. Control of electrodynamic speaker driver using a low-order non-linear model
US9992642B1 (en) 2015-12-29 2018-06-05 Amazon Technologies, Inc. Automated messaging
US9820036B1 (en) 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9813810B1 (en) 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10049666B2 (en) 2016-01-06 2018-08-14 Google Llc Voice recognition system
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
KR20170086814A (ko) 2016-01-19 2017-07-27 삼성전자주식회사 음성 인식 기능을 제공하는 전자 장치 및 그 동작 방법
KR102392113B1 (ko) 2016-01-20 2022-04-29 삼성전자주식회사 전자 장치 및 전자 장치의 음성 명령 처리 방법
CN105741838B (zh) 2016-01-20 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
US9997151B1 (en) 2016-01-20 2018-06-12 Amazon Technologies, Inc. Multichannel acoustic echo cancellation for wireless applications
US9749731B2 (en) 2016-01-21 2017-08-29 Bose Corporation Sidetone generation using multiple microphones
KR20170091913A (ko) 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치
US9659555B1 (en) 2016-02-09 2017-05-23 Amazon Technologies, Inc. Multichannel acoustic echo cancellation
US9653060B1 (en) 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
EP3414759B1 (en) 2016-02-10 2020-07-01 Cerence Operating Company Techniques for spatially selective wake-up word recognition and related systems and methods
US9898250B1 (en) 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US9858927B2 (en) 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9772817B2 (en) 2016-02-22 2017-09-26 Sonos, Inc. Room-corrected voice detection
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9779735B2 (en) 2016-02-24 2017-10-03 Google Inc. Methods and systems for detecting and processing speech signals
WO2017147936A1 (zh) 2016-03-04 2017-09-08 茹旷 智能家居助手
US10133612B2 (en) 2016-03-17 2018-11-20 Nuance Communications, Inc. Session processing interaction between two or more virtual assistants
US9769420B1 (en) 2016-03-18 2017-09-19 Thomas Lawrence Moses Portable wireless remote monitoring and control systems
US10373612B2 (en) 2016-03-21 2019-08-06 Amazon Technologies, Inc. Anchored speech detection and speech recognition
US9805714B2 (en) 2016-03-22 2017-10-31 Asustek Computer Inc. Directional keyword verification method applicable to electronic device and electronic device using the same
US10365887B1 (en) 2016-03-25 2019-07-30 Amazon Technologies, Inc. Generating commands based on location and wakeword
US10332508B1 (en) 2016-03-31 2019-06-25 Amazon Technologies, Inc. Confidence checking for speech processing and query answering
US9952827B2 (en) 2016-04-13 2018-04-24 Comcast Cable Communications, Llc Dynamic adjustment of equalization settings of audio components via a sound device profile
CN109074292B (zh) 2016-04-18 2021-12-14 谷歌有限责任公司 适当的代理的自动化助理调用
US10318236B1 (en) 2016-05-05 2019-06-11 Amazon Technologies, Inc. Refining media playback
US20170329397A1 (en) 2016-05-12 2017-11-16 Rovi Guides, Inc. Systems and methods for navigating a media guidance application using gaze control
US10447748B2 (en) 2016-05-12 2019-10-15 Apple Inc. Sharing media information between applications on client devices
US20170330564A1 (en) 2016-05-13 2017-11-16 Bose Corporation Processing Simultaneous Speech from Distributed Microphones
US10149049B2 (en) 2016-05-13 2018-12-04 Bose Corporation Processing speech from distributed microphones
US10187440B2 (en) 2016-05-27 2019-01-22 Apple Inc. Personalization of media streams
US10063965B2 (en) 2016-06-01 2018-08-28 Google Llc Sound source estimation using neural networks
US10474419B2 (en) 2016-06-03 2019-11-12 Crestron Electronics, Inc. Audio digital signal processor utilizing a hybrid network architecture
AU2017100581B4 (en) 2016-06-08 2018-02-01 Apple Inc. Intelligent automated assistant for media exploration
US10235124B2 (en) 2016-06-08 2019-03-19 Google Llc Audio announcement prioritization system
US9754605B1 (en) 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
AU2017100486C4 (en) 2016-06-11 2019-09-05 Apple Inc. Intelligent device arbitration and control
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179034B1 (en) 2016-06-12 2017-09-04 Apple Inc Devices, methods, and graphical user interfaces for dynamically adjusting presentation of audio outputs
ES2806204T3 (es) 2016-06-15 2021-02-16 Cerence Operating Co Técnicas para reconomiento de voz para activación y sistemas y métodos relacionados
US10212029B2 (en) 2016-06-15 2019-02-19 Microsoft Technology Licensing, Llc Service provisioning in cloud computing systems
US20170364371A1 (en) 2016-06-15 2017-12-21 Microsoft Technology Licensing, Llc Context-Dependent Digital Action-Assistance Tool
KR20170142001A (ko) 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9875740B1 (en) 2016-06-20 2018-01-23 A9.Com, Inc. Using voice information to influence importance of search result categories
US9749738B1 (en) 2016-06-20 2017-08-29 Gopro, Inc. Synthesizing audio corresponding to a virtual microphone location
ITUA20164622A1 (it) 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10091545B1 (en) 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US9728188B1 (en) 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
KR102471499B1 (ko) 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
EP3270377B1 (en) 2016-07-12 2020-02-19 Dolby Laboratories Licensing Corporation Assessment and adjustment of audio installation
US20180018965A1 (en) 2016-07-12 2018-01-18 Bose Corporation Combining Gesture and Voice User Interfaces
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US9979680B2 (en) 2016-07-21 2018-05-22 Fujitsu Limited Smart notification scheduling and modality selection
US10621992B2 (en) 2016-07-22 2020-04-14 Lenovo (Singapore) Pte. Ltd. Activating voice assistant based on at least one of user proximity and context
CN106028223A (zh) 2016-07-26 2016-10-12 广东欧珀移动通信有限公司 一种智能音箱的控制方法、装置及智能音箱
KR102575634B1 (ko) 2016-07-26 2023-09-06 삼성전자주식회사 전자 장치 및 전자 장치의 동작 방법
US10431211B2 (en) 2016-07-29 2019-10-01 Qualcomm Incorporated Directional processing of far-field audio
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US10026403B2 (en) 2016-08-12 2018-07-17 Paypal, Inc. Location based voice association system
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US20180053504A1 (en) 2016-08-19 2018-02-22 Otis Elevator Company Intention recognition for triggering voice recognition system
US9967382B2 (en) 2016-08-19 2018-05-08 Amazon Technologies, Inc. Enabling voice control of telephone device
CN107767863B (zh) 2016-08-22 2021-05-04 科大讯飞股份有限公司 语音唤醒方法、系统及智能终端
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
WO2018039045A1 (en) 2016-08-24 2018-03-01 Knowles Electronics, Llc Methods and systems for keyword detection using keyword repetitions
US10360910B2 (en) 2016-08-29 2019-07-23 Garmin Switzerland Gmbh Automatic speech recognition (ASR) utilizing GPS and sensor data
US10461953B2 (en) 2016-08-29 2019-10-29 Lutron Technology Company Llc Load control system having audio control devices
US10685656B2 (en) 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
US10580404B2 (en) 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10074369B2 (en) 2016-09-01 2018-09-11 Amazon Technologies, Inc. Voice-based communications
US10057698B2 (en) 2016-09-02 2018-08-21 Bose Corporation Multiple room communication system and method
CA3036067C (en) 2016-09-06 2023-08-01 Deepmind Technologies Limited Generating audio using neural networks
EP3297298B1 (en) 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
US9972318B1 (en) 2016-09-21 2018-05-15 Amazon Technologies, Inc. Interpreting voice commands
JP6520878B2 (ja) 2016-09-21 2019-05-29 トヨタ自動車株式会社 音声取得システムおよび音声取得方法
US10409548B2 (en) 2016-09-27 2019-09-10 Grabango Co. System and method for differentially locating and modifying audio sources
JP2018055259A (ja) 2016-09-27 2018-04-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US9959861B2 (en) 2016-09-30 2018-05-01 Robert Bosch Gmbh System and method for speech recognition
JP6683893B2 (ja) 2016-10-03 2020-04-22 グーグル エルエルシー デバイストポロジーに基づく音声コマンドの処理
CN109844855B (zh) 2016-10-03 2023-12-05 谷歌有限责任公司 任务的多重计算代理执行
US10283138B2 (en) 2016-10-03 2019-05-07 Google Llc Noise mitigation for a voice interface device
CN107919116B (zh) 2016-10-11 2019-09-13 芋头科技(杭州)有限公司 一种语音激活检测方法及装置
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180122372A1 (en) 2016-10-31 2018-05-03 Soundhound, Inc. Distinguishable open sounds
US10783883B2 (en) 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device
KR102241970B1 (ko) * 2016-11-07 2021-04-20 구글 엘엘씨 기록된 미디어 핫워드 트리거 억제
US10154496B2 (en) 2016-11-10 2018-12-11 Futurewei Technologies, Inc. System and method for beamformed reference signals in three dimensional multiple input multiple output communications systems
US10382806B2 (en) 2016-11-14 2019-08-13 DISH Technologies L.L.C. Apparatus, systems and methods for controlling presentation of content using a multi-media table
US10170110B2 (en) 2016-11-17 2019-01-01 Robert Bosch Gmbh System and method for ranking of hybrid speech recognition results with neural networks
CN106708403A (zh) 2016-11-30 2017-05-24 努比亚技术有限公司 输入滑动操作时同步播放提示音的方法及装置
US10079015B1 (en) * 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10186265B1 (en) 2016-12-06 2019-01-22 Amazon Technologies, Inc. Multi-layer keyword detection to avoid detection of keywords in output audio
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
US10255032B2 (en) 2016-12-13 2019-04-09 EVA Automation, Inc. Wireless coordination of audio sources
US11184764B2 (en) 2016-12-14 2021-11-23 Amzetta Technologies, Llc Methods and systems of establishing communication between devices
CN106531165A (zh) 2016-12-15 2017-03-22 北京塞宾科技有限公司 一种便携式智能家居语音控制系统及控制方法
US10339957B1 (en) 2016-12-20 2019-07-02 Amazon Technologies, Inc. Ending communications session based on presence data
US10068573B1 (en) 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
US10559309B2 (en) 2016-12-22 2020-02-11 Google Llc Collaborative voice controlled devices
DE112017006486T5 (de) 2016-12-23 2019-09-12 Synaptics Incorporated Online-enthallungsalgorithmus basierend auf gewichtetem vorhersagefehler für lärmbehaftete zeitvariante umgebungen
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
US10580405B1 (en) 2016-12-27 2020-03-03 Amazon Technologies, Inc. Voice control of remote device
US10276161B2 (en) 2016-12-27 2019-04-30 Google Llc Contextual hotwords
US10593328B1 (en) 2016-12-27 2020-03-17 Amazon Technologies, Inc. Voice control of remote device
US10186266B1 (en) 2016-12-28 2019-01-22 Amazon Technologies, Inc. Message playback using a shared device
US10831366B2 (en) 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US10229680B1 (en) 2016-12-29 2019-03-12 Amazon Technologies, Inc. Contextual entity resolution
US10224031B2 (en) 2016-12-30 2019-03-05 Google Llc Generating and transmitting invocation request to appropriate third-party agent
US10290302B2 (en) 2016-12-30 2019-05-14 Google Llc Compact home assistant with combined acoustic waveguide and heat sink
KR102412202B1 (ko) 2017-01-03 2022-06-27 삼성전자주식회사 냉장고 및 이의 정보 표시 방법
US10248613B2 (en) 2017-01-10 2019-04-02 Qualcomm Incorporated Data bus activation in an electronic device
US10672387B2 (en) 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US11164570B2 (en) 2017-01-17 2021-11-02 Ford Global Technologies, Llc Voice assistant tracking and activation
US10306254B2 (en) 2017-01-17 2019-05-28 Seiko Epson Corporation Encoding free view point data in movie data container
KR20180084392A (ko) 2017-01-17 2018-07-25 삼성전자주식회사 전자 장치 및 그의 동작 방법
KR102556840B1 (ko) 2017-01-20 2023-07-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
KR20180085931A (ko) 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
US20180218747A1 (en) 2017-01-28 2018-08-02 Bose Corporation Audio Device Filter Modification
KR102716757B1 (ko) 2017-02-03 2024-10-15 삼성전자주식회사 알림을 제공하는 방법 및 그 전자 장치
CN114067794A (zh) 2017-02-07 2022-02-18 路创技术有限责任公司 基于音频的负载控制系统
US10762891B2 (en) 2017-02-10 2020-09-01 Synaptics Incorporated Binary and multi-class classification systems and methods using connectionist temporal classification
CN108446281B (zh) 2017-02-13 2021-03-12 北京嘀嘀无限科技发展有限公司 确定用户亲密度的方法、装置及存储介质
US10467509B2 (en) 2017-02-14 2019-11-05 Microsoft Technology Licensing, Llc Computationally-efficient human-identifying smart assistant computer
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US11100384B2 (en) 2017-02-14 2021-08-24 Microsoft Technology Licensing, Llc Intelligent device user interactions
US20180293221A1 (en) 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
US10264358B2 (en) 2017-02-15 2019-04-16 Amazon Technologies, Inc. Selection of master device for synchronized audio
US10431217B2 (en) 2017-02-15 2019-10-01 Amazon Technologies, Inc. Audio playback device that dynamically switches between receiving audio data from a soft access point and receiving audio data from a local access point
US10839795B2 (en) 2017-02-15 2020-11-17 Amazon Technologies, Inc. Implicit target selection for multiple audio playback devices in an environment
CN106921560B (zh) 2017-02-28 2020-06-02 北京小米移动软件有限公司 语音通信方法、装置及系统
US20180262793A1 (en) 2017-03-09 2018-09-13 Google Inc. Reverse Casting from a First Screen Device to a Second Screen Device
US10706843B1 (en) 2017-03-09 2020-07-07 Amazon Technologies, Inc. Contact resolution for communications systems
US10089981B1 (en) 2017-03-09 2018-10-02 Amazon Technologies, Inc. Messaging account disambiguation
US10540961B2 (en) 2017-03-13 2020-01-21 Baidu Usa Llc Convolutional recurrent neural networks for small-footprint keyword spotting
US10074371B1 (en) 2017-03-14 2018-09-11 Amazon Technologies, Inc. Voice control of remote device by disabling wakeword detection
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10600406B1 (en) 2017-03-20 2020-03-24 Amazon Technologies, Inc. Intent re-ranker
US10621980B2 (en) 2017-03-21 2020-04-14 Harman International Industries, Inc. Execution of voice commands in a multi-device system
WO2018173293A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 音声端末、音声コマンド生成システム、及び音声コマンド生成システムの制御方法
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107135443B (zh) 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US10643609B1 (en) 2017-03-29 2020-05-05 Amazon Technologies, Inc. Selecting speech inputs
US10373630B2 (en) 2017-03-31 2019-08-06 Intel Corporation Systems and methods for energy efficient and low power distributed automatic speech recognition on wearable devices
US10825471B2 (en) 2017-04-05 2020-11-03 Avago Technologies International Sales Pte. Limited Voice energy detection
US11188808B2 (en) 2017-04-11 2021-11-30 Lenovo (Singapore) Pte. Ltd. Indicating a responding virtual assistant from a plurality of virtual assistants
US10748531B2 (en) 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
CN107122158A (zh) 2017-04-14 2017-09-01 北京小米移动软件有限公司 播放信息提示音频的方法及装置、电子设备
KR102068182B1 (ko) 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR102392297B1 (ko) 2017-04-24 2022-05-02 엘지전자 주식회사 전자기기
KR102298947B1 (ko) 2017-04-28 2021-09-08 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10311870B2 (en) 2017-05-10 2019-06-04 Ecobee Inc. Computerized device with voice command input capability
US10013995B1 (en) 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10628484B2 (en) 2017-05-17 2020-04-21 Board Of Trustees Of The University Of Illinois Vibrational devices as sound sensors
US10564928B2 (en) 2017-06-02 2020-02-18 Rovi Guides, Inc. Systems and methods for generating a volume- based response for multiple voice-operated user devices
US10403299B2 (en) 2017-06-02 2019-09-03 Apple Inc. Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US10531196B2 (en) 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
US10522146B1 (en) 2019-07-09 2019-12-31 Instreamatic, Inc. Systems and methods for recognizing and performing voice commands during advertisement
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10983753B2 (en) 2017-06-09 2021-04-20 International Business Machines Corporation Cognitive and interactive sensor based smart home solution
US10410635B2 (en) 2017-06-09 2019-09-10 Soundhound, Inc. Dual mode speech recognition
US10984329B2 (en) 2017-06-14 2021-04-20 Ademco Inc. Voice activated virtual assistant with a fused response
US10028069B1 (en) 2017-06-22 2018-07-17 Sonos, Inc. Immersive audio in a media playback system
US10950228B1 (en) 2017-06-28 2021-03-16 Amazon Technologies, Inc. Interactive voice controlled entertainment
US11189273B2 (en) 2017-06-29 2021-11-30 Amazon Technologies, Inc. Hands free always on near field wakeword solution
WO2019005227A1 (en) 2017-06-30 2019-01-03 Google Llc METHODS, SYSTEMS AND MEDIA FOR VOICE CALL OPERATIONS
US10687353B2 (en) 2017-07-10 2020-06-16 Qualcomm Incorporated Management of conflicting scheduling commands in wireless networks
US20190013019A1 (en) 2017-07-10 2019-01-10 Intel Corporation Speaker command and key phrase management for muli -virtual assistant systems
US10310082B2 (en) 2017-07-27 2019-06-04 Quantenna Communications, Inc. Acoustic spatial diagnostics for smart home management
US11205421B2 (en) 2017-07-28 2021-12-21 Cerence Operating Company Selection system and method
US11798544B2 (en) 2017-08-07 2023-10-24 Polycom, Llc Replying to a spoken command
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
JP6513749B2 (ja) 2017-08-09 2019-05-15 レノボ・シンガポール・プライベート・リミテッド 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム
KR102389041B1 (ko) 2017-08-11 2022-04-21 엘지전자 주식회사 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법
US10304475B1 (en) 2017-08-14 2019-05-28 Amazon Technologies, Inc. Trigger word based beam selection
US20190066710A1 (en) 2017-08-28 2019-02-28 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US10553235B2 (en) 2017-08-28 2020-02-04 Apple Inc. Transparent near-end user control over far-end speech enhancement processing
US11062702B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Media system with multiple digital assistants
US11062710B2 (en) 2017-08-28 2021-07-13 Roku, Inc. Local and cloud speech recognition
US10546583B2 (en) 2017-08-30 2020-01-28 Amazon Technologies, Inc. Context-based device arbitration
US10911596B1 (en) 2017-08-31 2021-02-02 Amazon Technologies, Inc. Voice user interface for wired communications system
US10366699B1 (en) 2017-08-31 2019-07-30 Amazon Technologies, Inc. Multi-path calculations for device energy levels
US10515625B1 (en) 2017-08-31 2019-12-24 Amazon Technologies, Inc. Multi-modal natural language processing
US10482895B2 (en) 2017-09-01 2019-11-19 Cirrus Logic, Inc. Acoustic echo cancellation (AEC) rate adaptation
US10847149B1 (en) 2017-09-01 2020-11-24 Amazon Technologies, Inc. Speech-based attention span for voice user interface
JP6571144B2 (ja) 2017-09-08 2019-09-04 シャープ株式会社 監視システム、監視機器、サーバ、および監視方法
US20190082255A1 (en) 2017-09-08 2019-03-14 Olympus Corporation Information acquiring apparatus, information acquiring method, and computer readable recording medium
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10083006B1 (en) 2017-09-12 2018-09-25 Google Llc Intercom-style communication using multiple computing devices
KR102338376B1 (ko) 2017-09-13 2021-12-13 삼성전자주식회사 디바이스 그룹을 지정하기 위한 전자 장치 및 이의 제어 방법
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US9973849B1 (en) 2017-09-20 2018-05-15 Amazon Technologies, Inc. Signal quality beam selection
US10719507B2 (en) 2017-09-21 2020-07-21 SayMosaic Inc. System and method for natural language processing
US10580411B2 (en) 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
US10586534B1 (en) 2017-09-27 2020-03-10 Amazon Technologies, Inc. Voice-controlled device control using acoustic echo cancellation statistics
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11233782B2 (en) 2017-10-04 2022-01-25 Resilience Magnum IP, LLC Single node network connectivity for structure automation functionality
US10897680B2 (en) 2017-10-04 2021-01-19 Google Llc Orientation-based device interface
KR102421255B1 (ko) 2017-10-17 2022-07-18 삼성전자주식회사 음성 신호를 제어하기 위한 전자 장치 및 방법
KR102543693B1 (ko) 2017-10-17 2023-06-16 삼성전자주식회사 전자 장치 및 그의 동작 방법
US10403266B2 (en) 2017-10-18 2019-09-03 Intel Corporation Detecting keywords in audio using a spiking neural network
CN107808670B (zh) 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
JP2019086903A (ja) 2017-11-02 2019-06-06 東芝映像ソリューション株式会社 音声対話端末、および音声対話端末制御方法
CN107832837B (zh) 2017-11-28 2021-09-28 南京大学 一种基于压缩感知原理的卷积神经网络压缩方法及解压缩方法
US20190163153A1 (en) 2017-11-30 2019-05-30 International Business Machines Corporation Enforcing dynamic volume thresholds of an entertainment device
US10546593B2 (en) 2017-12-04 2020-01-28 Apple Inc. Deep learning driven multi-channel filtering for speech enhancement
US10445365B2 (en) 2017-12-04 2019-10-15 Amazon Technologies, Inc. Streaming radio with personalized content integration
US10777189B1 (en) 2017-12-05 2020-09-15 Amazon Technologies, Inc. Dynamic wakeword detection
US10510340B1 (en) 2017-12-05 2019-12-17 Amazon Technologies, Inc. Dynamic wakeword detection
US20190172452A1 (en) 2017-12-06 2019-06-06 GM Global Technology Operations LLC External information rendering
CN110678922A (zh) 2017-12-06 2020-01-10 谷歌有限责任公司 闪避和擦除来自附近设备的音频
CN107919123B (zh) 2017-12-07 2022-06-03 北京小米移动软件有限公司 多语音助手控制方法、装置及计算机可读存储介质
US11182122B2 (en) 2017-12-08 2021-11-23 Amazon Technologies, Inc. Voice control of computing devices
US20190179611A1 (en) 2017-12-11 2019-06-13 Sonos, Inc. Systems and Methods of Receiving Voice Input
US10051600B1 (en) 2017-12-12 2018-08-14 Amazon Technologies, Inc. Selective notification delivery based on user presence detections
US10847137B1 (en) 2017-12-12 2020-11-24 Amazon Technologies, Inc. Trigger word detection using neural network waveform processing
US10425247B2 (en) 2017-12-12 2019-09-24 Rovi Guides, Inc. Systems and methods for modifying playback of a media asset in response to a verbal command unrelated to playback of the media asset
US10374816B1 (en) 2017-12-13 2019-08-06 Amazon Technologies, Inc. Network conference management and arbitration via voice-capturing devices
US10540971B2 (en) 2017-12-15 2020-01-21 Blue Jeans Network, Inc. System and methods for in-meeting group assistance using a virtual assistant
US10663313B2 (en) 2017-12-15 2020-05-26 Google Llc Providing traffic warnings to a user based on return journey
US11409816B2 (en) 2017-12-19 2022-08-09 Motorola Solutions, Inc. Methods and systems for determining an action to be taken in response to a user query as a function of pre-query context information
US11295748B2 (en) 2017-12-26 2022-04-05 Robert Bosch Gmbh Speaker identification with ultra-short speech segments for far and near field voice assistance applications
US10504507B2 (en) 2017-12-28 2019-12-10 Syntiant Always-on keyword detector
US10614811B2 (en) 2017-12-29 2020-04-07 Intel Corporation Hierarchical speech recognition resolution
CN111357048B (zh) 2017-12-31 2024-10-08 美的集团股份有限公司 用于控制家庭助手装置的方法和系统
CN111512365B (zh) 2017-12-31 2023-06-13 美的集团股份有限公司 对多个家庭装置进行控制的方法和系统
US9972343B1 (en) 2018-01-08 2018-05-15 Republic Wireless, Inc. Multi-step validation of wakeup phrase processing
US10795332B2 (en) 2018-01-16 2020-10-06 Resilience Magnum IP, LLC Facilitating automating home control
CN108198548B (zh) 2018-01-25 2020-11-20 苏州奇梦者网络科技有限公司 一种语音唤醒方法及其系统
US20190237067A1 (en) 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US10157042B1 (en) 2018-02-06 2018-12-18 Amazon Technologies, Inc. Audio output control
US11024307B2 (en) 2018-02-08 2021-06-01 Computime Ltd. Method and apparatus to provide comprehensive smart assistant services
US11145298B2 (en) 2018-02-13 2021-10-12 Roku, Inc. Trigger word detection with multiple digital assistants
US10425780B1 (en) 2018-02-22 2019-09-24 Amazon Technologies, Inc. Outputting notifications using device groups
US10749828B2 (en) 2018-03-14 2020-08-18 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on trending communications, on devices notwithstanding a user instruction to disable event notifications
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10491962B2 (en) 2018-03-14 2019-11-26 Rovi Guides, Inc. Systems and methods for presenting event notifications, based on active applications in a social group, on devices notwithstanding a user instruction to disable event notifications
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10685669B1 (en) 2018-03-20 2020-06-16 Amazon Technologies, Inc. Device selection from audio data
US10440440B1 (en) 2018-03-23 2019-10-08 Rovi Guides, Inc. Systems and methods for prompting a user to view an important event in a media asset presented on a first device when the user is viewing another media asset presented on a second device
US10777203B1 (en) 2018-03-23 2020-09-15 Amazon Technologies, Inc. Speech interface device with caching component
US10446169B1 (en) 2018-03-26 2019-10-15 Motorola Mobility Llc Pre-selectable and dynamic configurable multistage echo control system for large range level of acoustic echo
US10755706B2 (en) 2018-03-26 2020-08-25 Midea Group Co., Ltd. Voice-based user interface with dynamically switchable endpoints
US11151991B2 (en) 2018-03-30 2021-10-19 Verizon Media Inc. Electronic message transmission
US11217240B2 (en) 2018-04-05 2022-01-04 Synaptics Incorporated Context-aware control for smart devices
US20190311710A1 (en) 2018-04-06 2019-10-10 Flex Ltd. Device and system for accessing multiple virtual assistant services
US10720166B2 (en) 2018-04-09 2020-07-21 Synaptics Incorporated Voice biometrics systems and methods
US10679629B2 (en) 2018-04-09 2020-06-09 Amazon Technologies, Inc. Device arbitration by multiple speech processing systems
US10928917B2 (en) 2018-04-12 2021-02-23 International Business Machines Corporation Multiple user interaction with audio devices using speech and gestures
CN108520741B (zh) 2018-04-12 2021-05-04 科大讯飞股份有限公司 一种耳语音恢复方法、装置、设备及可读存储介质
US10679615B2 (en) 2018-04-16 2020-06-09 Google Llc Adaptive interface in a voice-based networked system
CN108538305A (zh) 2018-04-20 2018-09-14 百度在线网络技术(北京)有限公司 语音识别方法、装置、设备及计算机可读存储介质
EP3561806B1 (en) 2018-04-23 2020-04-22 Spotify AB Activation trigger processing
US10803864B2 (en) 2018-05-07 2020-10-13 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11308947B2 (en) 2018-05-07 2022-04-19 Spotify Ab Voice recognition system for use with a personal media streaming appliance
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
JP2019204025A (ja) 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10777195B2 (en) 2018-05-31 2020-09-15 International Business Machines Corporation Wake command nullification for digital assistance and voice recognition technologies
US20190371324A1 (en) 2018-06-01 2019-12-05 Apple Inc. Suppression of voice response by device rendering trigger audio
CN112272819B (zh) 2018-06-05 2024-04-26 三星电子株式会社 被动唤醒用户交互设备的方法和系统
US10433058B1 (en) 2018-06-14 2019-10-01 Sonos, Inc. Content rules engines for audio playback devices
US10762896B1 (en) 2018-06-25 2020-09-01 Amazon Technologies, Inc. Wakeword detection
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
NL2021308B1 (en) 2018-07-16 2020-01-24 Hazelebach & Van Der Ven Holding B V Methods for a voice processing system
JP7000268B2 (ja) 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
US11144596B2 (en) 2018-07-24 2021-10-12 Harman International Industries, Incorporated Retroactive information searching enabled by neural sensing
GB2576016B (en) 2018-08-01 2021-06-23 Arm Ip Ltd Voice assistant devices
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
KR102225984B1 (ko) 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
US10622009B1 (en) 2018-09-10 2020-04-14 Amazon Technologies, Inc. Methods for detecting double-talk
US20200090647A1 (en) 2018-09-14 2020-03-19 Comcast Cable Communications, Llc Keyword Detection In The Presence Of Media Output
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10650807B2 (en) 2018-09-18 2020-05-12 Intel Corporation Method and system of neural network keyphrase detection
KR20200034430A (ko) 2018-09-21 2020-03-31 삼성전자주식회사 전자 장치, 시스템 및 음성 인식 서비스 이용 방법
US10861444B2 (en) 2018-09-24 2020-12-08 Rovi Guides, Inc. Systems and methods for determining whether to trigger a voice capable device based on speaking cadence
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US10950249B2 (en) 2018-09-25 2021-03-16 Amazon Technologies, Inc. Audio watermark encoding/decoding
US11170758B2 (en) 2018-09-27 2021-11-09 Rovi Guides, Inc. Systems and methods for providing notifications within a media asset without breaking immersion
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
KR102606789B1 (ko) 2018-10-01 2023-11-28 삼성전자주식회사 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치
US20200110571A1 (en) 2018-10-05 2020-04-09 Sonos, Inc. Systems and methods for media content selection
US10971158B1 (en) 2018-10-05 2021-04-06 Facebook, Inc. Designating assistants in multi-assistant environment based on identified wake word received from a user
US10346122B1 (en) 2018-10-18 2019-07-09 Brent Foster Morgan Systems and methods for a supplemental display screen
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US10943599B2 (en) 2018-10-26 2021-03-09 Spotify Ab Audio cancellation for voice recognition
US10573312B1 (en) 2018-12-04 2020-02-25 Sorenson Ip Holdings, Llc Transcription generation from multiple speech recognition systems
US10388272B1 (en) 2018-12-04 2019-08-20 Sorenson Ip Holdings, Llc Training speech recognition systems using word sequences
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
KR102570384B1 (ko) 2018-12-27 2023-08-25 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11198446B2 (en) 2019-01-04 2021-12-14 Faraday & Future Inc. On-board vehicle query system
JP2020112692A (ja) 2019-01-11 2020-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 方法、制御装置、及びプログラム
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
CN109712626B (zh) 2019-03-04 2021-04-30 腾讯科技(深圳)有限公司 一种语音数据处理方法及装置
US10943598B2 (en) 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
US10964314B2 (en) 2019-03-22 2021-03-30 Cirrus Logic, Inc. System and method for optimized noise reduction in the presence of speech distortion using adaptive microphone array
US10984783B2 (en) 2019-03-27 2021-04-20 Intel Corporation Spoken keyword detection based utterance-level wake on intent system
US20200310751A1 (en) 2019-03-29 2020-10-01 Qualcomm Incorporated System and method of managing device sound level
EP3726856B1 (en) 2019-04-17 2022-11-16 Oticon A/s A hearing device comprising a keyword detector and an own voice detector
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US20200409926A1 (en) 2019-06-28 2020-12-31 Rovi Guides, Inc. Automated contact creation based on content communications
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
JP7191793B2 (ja) 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
US11172328B2 (en) 2019-09-27 2021-11-09 Sonos, Inc. Systems and methods for device localization
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11823659B2 (en) 2019-12-11 2023-11-21 Amazon Technologies, Inc. Speech recognition through disambiguation feedback
US11445301B2 (en) 2020-02-12 2022-09-13 Sonos, Inc. Portable playback devices with network operation modes
CN111341306B (zh) 2020-02-14 2022-06-17 东南大学 基于语音特征复用的关键词唤醒cnn的存储和计算压缩方法
US11206052B1 (en) 2020-06-18 2021-12-21 HAJEN Co., Ltd Smart speaker
US20220050585A1 (en) 2020-08-14 2022-02-17 Apple Inc. Audio media playback user interface

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9548053B1 (en) * 2014-09-19 2017-01-17 Amazon Technologies, Inc. Audible command filtering
TW201629950A (zh) * 2015-01-07 2016-08-16 樓氏電子有限公司 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風
CN104572009A (zh) * 2015-01-28 2015-04-29 合肥联宝信息技术有限公司 一种自适应外界环境的音频控制方法及装置
US9633661B1 (en) * 2015-02-02 2017-04-25 Amazon Technologies, Inc. Speech-responsive portable speaker
CN105632486A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN106910500A (zh) * 2016-12-23 2017-06-30 北京第九实验室科技有限公司 对带麦克风阵列的设备进行语音控制的方法及设备

Also Published As

Publication number Publication date
EP3665562A1 (en) 2020-06-17
AU2023203687A1 (en) 2023-07-06
AU2018312989B2 (en) 2023-06-15
JP6963673B2 (ja) 2021-11-10
US11380322B2 (en) 2022-07-05
US20200075010A1 (en) 2020-03-05
WO2019032462A1 (en) 2019-02-14
US20240321271A1 (en) 2024-09-26
US10475449B2 (en) 2019-11-12
AU2018312989A1 (en) 2020-03-05
CA3140979C (en) 2024-02-27
CN111194439A (zh) 2020-05-22
KR102315053B1 (ko) 2021-10-20
US11900937B2 (en) 2024-02-13
CA3072492C (en) 2023-01-24
CA3140979A1 (en) 2019-02-14
EP4040285A1 (en) 2022-08-10
CN116954545A (zh) 2023-10-27
JP2020530585A (ja) 2020-10-22
CA3072492A1 (en) 2019-02-14
US20190043492A1 (en) 2019-02-07
US20230021785A1 (en) 2023-01-26
EP3665562B1 (en) 2022-06-15
KR20200035118A (ko) 2020-04-01

Similar Documents

Publication Publication Date Title
CN111194439B (zh) 唤醒词检测抑制
US12047752B2 (en) Content mixing
US11947870B2 (en) Audio response playback
US11184969B2 (en) Contextualization of voice inputs
AU2023203687B2 (en) Wake-word detection suppression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant