CN105830015A - 用于始终在线语音激活信息辅助的隐私模式 - Google Patents

用于始终在线语音激活信息辅助的隐私模式 Download PDF

Info

Publication number
CN105830015A
CN105830015A CN201480034598.4A CN201480034598A CN105830015A CN 105830015 A CN105830015 A CN 105830015A CN 201480034598 A CN201480034598 A CN 201480034598A CN 105830015 A CN105830015 A CN 105830015A
Authority
CN
China
Prior art keywords
audible
response
subscriber equipment
build
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480034598.4A
Other languages
English (en)
Other versions
CN105830015B (zh
Inventor
罗杰·W·阿迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google Technology Holdings LLC
Original Assignee
Google Technology Holdings LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Technology Holdings LLC filed Critical Google Technology Holdings LLC
Publication of CN105830015A publication Critical patent/CN105830015A/zh
Application granted granted Critical
Publication of CN105830015B publication Critical patent/CN105830015B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

用户设备和方法有差别地提供对由支持语音激活的用户设备所接收的语音命令的可听响应。该方法包括检测激活用户设备的第一预先建立的可听激活命令。响应于检测到第一预先建立的可听激活命令,该方法包括产生在用户设备的喇叭接近度内的第一可听应答,并且然后监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测,该检测将指示所述另一用户设备也在进行响应。该方法包括响应于未检测到而处理所接收的可听命令并对其进行响应。然而,响应于该检测,该方法包括触发到可听命令输入的隐私模式的进入并经由显示器和声音产生部件中的至少一个来产生隐私模式通告。

Description

用于始终在线语音激活信息辅助的隐私模式
技术领域
本公开一般地涉及用可听命令来控制个人电子设备且特别地涉及由个人电子设备来提供针对可听响应的隐私性。
背景技术
诸如智能电话之类的个人电子设备正在变得无处不在,因为该设备提供娱乐、通信、导航以及个人助理的源。虽然这些用户设备设计有图形和触觉接口,但语音命令的使用很快变成用以与这些用户设备相交互和/或对其进行控制的常见方式。某些语音命令使得用户设备以免提方式、即在不使用诸如触摸屏或按钮控制之类的用户设备的触觉用户接口的情况下读回用户个人信息,诸如消息的内容。如果用户并未经由耳机进行收听或者并未位于私人位置上,则此信息的可听呈现可能有问题并且甚至可能令人为难。
附图说明
当结合附图来阅读时,通过参考说明性实施例的以下具体实施方式将最好地理解本公开,在所述附图中:
图1提供了根据一个实施例的配置有使得能够实现本公开的一个或多个所述特征的各种组件的示例用户设备的框图表示;
图2图示出根据一个或多个实施例的具有其功能部件的示例始终在线语音激活信息辅助环境;
图3是根据一个或多个实施例的具有使得能够在存在多个用户设备的情况下在第一用户设备上录入对挑战的确认的始终在线隐私模式工具的功能部件的示例用户接口的框图图示;
图4是根据一个或多个实施例的用于有差别地提供对由支持语音激活的用户设备所接收的语音命令的可听响应的示例方法的流程图;以及
图5A-5C是根据一个或多个实施例的包括可听和/或触觉用户响应的图4的示例方法的挑战、接收以及验证操作的示例方法的流程图。
具体实施方式
本公开的说明性实施例提供了有差别地提供对由支持语音激活的用户设备所接收的语音命令的可听响应的方法和用户设备。根据一个方面,所述用户设备包括:音频接收机制,其检测激活用户设备的第一预先建立的可听激活命令。响应于检测到该第一预先建立的可听激活命令,用户设备产生在用户设备的喇叭接近度内的第一可听应答。用户设备监视预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测。响应于在预置时间间隔内未检测到任何第二可听应答,用户设备响应于在预置时间间隔内未检测到任何第二可听应答而处理所接收的可听命令并对其进行响应。响应于在预置时间间隔内检测到至少一个第二可听应答,用户设备触发到可听命令输入的隐私模式的进入,并经由显示器和声音产生部件中的至少一个产生隐私模式通告。
在本公开的示例性实施例的以下具体实施方式中,足够详细地描述了其中可实践本公开的各种方面的特定示例性实施例以使得本领域的技术人员能够实践本发明,并且应理解的是在不脱离本公开的精神或范围的情况下,可利用其它实施例,并且可进行逻辑、架构、程序、机械、电气及其它改变。因此不应在限制性意义上理解以下具体实施方式,并且由所附权利要求及其等价物来定义本公开的范围。
在附图的不同视图的描述内,为相似元素提供与先前的图相似的名称和附图标记。分配给元素的特定标号仅仅是为了帮助描述而提供的且并不意图暗示对所述实施例的任何限制(结构或功能或其它方面)。将认识到的是为了图示的简单和明了起见,图中所示的元素不一定按比例描绘。例如,某些元素的尺寸相对于其它元素被放大。
应理解的是特定部件、设备和/或参数名的使用,诸如执行本文所述的工具、逻辑和/或固件的那些的使用,仅仅用于示例且并不意图暗示对所述实施例的任何限制。因此可在没有限制的情况下用被用来描述本文中的部件、设备、参数、方法和/或功能的不同命名法和/或术语来描述实施例。在描述实施例的一个或多个要素、特征或概念时对任何特定协议或专有名称的引用仅仅是作为一个实施方式的示例而提供,并且此类引用并不限制要求保护的实施例扩展到其中利用不同要素、特征、协议或概念名称的实施例。因此,在给定其中利用在本文中利用的每个术语的上下文的情况下,对该术语给定其最宽泛解释。
如下面进一步描述的,本文所述的公开的功能特征的实施方式是在处理设备和/或结构内提供的,并且可以涉及到使用硬件、固件以及执行以提供用于设备的特定工具或特定功能逻辑的多个软件级结构(例如,程序代码和/或程序指令和/或伪代码)的组合。提出的图图示出硬件部件和软件和/或逻辑部件两者。
本领域的技术人员将认识到图中所描绘的硬件部件和基本配置可改变。说明性部件并不意图是穷尽的,而是典型的以突出被用来实现所述实施例的各方面的主要部件。例如,除所描绘的硬件和/或固件之外或者作为其替代,可使用其它设备/部件。所描绘的示例并不意图暗示相对于当前所述的实施例和/或一般发明的架构或其它限制。
可以结合附图来阅读说明性实施例的描述。将认识到的是为了图示的简单和明了起见,图中所示的元素不一定按比例描绘。例如,某些元素的尺寸相对于其它元素被放大。相对于在本文中提出的附图示出并描述结合了本公开的教导的实施例。
现在转到图1,描绘了在其内部可以实现本公开的多个特征的示例用户设备的框图表示。根据一般图示,第一用户设备100包括语音和/或音频处理部件,并且可以是语音激活的,并且其有差别地提供对所接收的语音命令的可听响应。第一用户设备100可以是许多不同类型的设备中的一个,包括但不限于,移动蜂窝电话或智能电话、膝上型计算机、上网本、超级本和/或平板计算设备。这些不同设备全部提供和/或包括启用语音激活并有差别地提供隐私性的可听响应的所需硬件和软件。另外,第一用户设备100包括用以支持作为通信系统112的一部分的各种无线或有线通信功能的硬件和软件。
现在参考特定部件构成和所呈现部件的关联功能,第一用户设备100可以包括处理器集成电路(IC)114,其经由多个总线互连(用双向箭头图示出)连接到第一用户设备100的多个功能部件。处理器IC114可以包括一个或多个可编程微处理器,诸如数据处理器116和数字信号处理器(DSP)118,在某些实施例中,其两者都可被集成到单个处理设备中。处理器IC114控制第一用户设备100的通信、用户接口及其它功能和/或操作。这些功能和/或操作因此包括但不限于应用数据处理和信号处理。本创新可以使用硬件部件等价物来实现,诸如专用硬件、专用处理器、通用计算机、基于微处理器的计算机、微控制器、光学计算机、模拟计算机、专用处理器和/或专用硬接线逻辑。连接到处理器IC114的是存储器120,其可以包括易失性存储器和/或非易失性存储器。
可以将一个或多个可执行应用程序存储在存储器120内以便由在处理器IC114上的数据处理器116执行。例如,存储器120被示为包含始终在线隐私模式工具122,其可以包括音频查询工具124、触觉输入工具126以及音频振幅和延迟分析器工具128。在至少所示实施例中,存储器120还包含用于对语音命令进行响应的语音激活信息助理130。在随后的描述内将更详细地描述每个软件模块的关联功能和/或使用。特别地,用图2的描述和多个流程图及其它图更详细地描述与始终在线隐私模式工具122相关联和/或由其提供的功能。
在一个实施例中,存储器120可以包括由处理器IC114执行以支持用户设备100的语音激活的语音监视器工具131(用虚线描绘)。替换地,如在图1中描绘的,用户设备100可以包括由电源135独立供电的始终在线(AO)模块132。AO模块132可以包括语音监视器131和微控制器136,该微控制器136具有被优化以使用最小量的电力来检测一个或多个预定语音激活声音的始终在线(AO)响应固件138。从而,处理器IC114可以通过进入省电模式以包括来自系统时钟140的减小时钟速率或者将第一用户设备100的一个或多个部分(包括处理器IC114)关断或置于睡眠模式来节省用于第一用户设备100的电力。系统时钟140还可以充当精确时计或用于计时器的基础。
还被示为耦合到处理器IC114的是数据存储设备142,其可以是能够存储一个或多个应用软件和数据的任何类型的可用存储设备。还应认识到的是在一个或多个替换实施例中,数据存储设备142存储实际上可以是远程存储而不是设备本身的整体部分。如所提供的,数据存储设备142可以包含隐私设置144和一个或多个预先建立的确认响应146。在以下描述中更详细地描述了与这些部件相关联的特定使用和/或功能。
第一用户设备100还包括一个或多个输入/输出设备,包括一个或多个输入设备,诸如相机148、被描绘为前扩音器150和后扩音器152的声音接收部件149、触摸屏和/或触控板154、键区156,和/或一个或多个输出设备,诸如显示器158、被描绘为前扬声器160和后扬声器162的声音产生部件159等。第一用户设备100还可以包括订户信息模块(SIM)164,其可以提供拥有或利用第一用户设备100的订户的唯一标识以及与特定订户相关联的特定联系人。
为了支持无线通信,第一用户设备100包括一个或多个通信部件,包括具有连接天线166以与蜂窝式网络169的无线电接入网(RAN)168通信的无线广域网(WWAN)收发机165。RAN168一般地被表示为包括基站,其被描绘为通过基站天线172进行收发的、由无线电网络控制器(RNC)171控制的演进基节点(“eNodeB”)170。为了明了起见,描绘了一个连接天线166。然而,第一用户设备100可包含超过一个天线,每个天线具有一个或多个所选操作带宽以支持不同的通信模式或者用于以不同通信技术的同时通信。
作为WWAN收发机165的替换或除此之外,第一用户设备100可以包括用以与被描绘为无线接入点174的无线设备和网络通信的无线本地接入网(WLAN)模块173。替换地或者另外,第一用户设备100可以包括用以与被描绘为耳机178和运动/生物计量传感器180的WPAN设备通信的无线个人接入网(WPAN)收发机176。WPAN可以包括诸如IrDA、无线USB、Z-Wave、ZigBee、体域网以及ATN+之类的技术。替换地或另外,第一用户设备100可以包括诸如可以被用于与另一用户设备或支付亭(paymentkiosk)184交换文件的近场通信(NFC)收发模块182。
作为支持无线通信的设备,第一用户设备100可以是以下中的一个或者被称为:系统、设备、订户单元、订户站、移动站(MS)、移动装置、移动设备、远程站、远程终端、用户终端、终端、通信设备、用户代理、蜂窝电话、卫星电话、无绳电话、会话发起协议(SIP)电话、无线本地环路(WLL)站、个人数字助理(PDA)、具有无线连接能力的手持式设备、计算设备,诸如膝上型计算机、平板电脑、智能电话、个人数字助理或被连接到无线调制解调器的其它处理设备。
如进一步举例说明的,第一用户设备100还可以包括用于有线通信的部件,诸如用于通过普通老式电话系统(POTS)188进行通信的调制解调器186和用于连接到本地接入网(LAN)192的以太网模块190。共同地,这些无线和有线部件提供第一用户设备100可以用来与其它设备和网络通信的通信机制194。
现在转到图2,图示出示例始终在线隐私模式环境200的图。当从音频输入源210接收到语音激活信号102(即,第一预先建立的可听激活命令)时,第一用户设备100采用用以辨别第一用户设备100是否在被描绘为包含第二用户设备104的多设备环境中的机制和技术。可以通过检测从第二用户设备104对语音激活信号102的可听应答106来触发由第一用户设备100进行的此辨别。当在多设备环境中时,与第二用户设备104相关联的另一用户108可以是语音激活信号102的源而不是与第一用户设备100相关联的已授权用户110。
始终在线隐私模式环境200包括硬件、固件、软件和数据部件的组合,其通过执行在数据处理器116和/或嵌入式设备控制器上的始终在线隐私模式工具122和其它功能部件来共同地执行本公开的各种方面。如所示,始终在线隐私模式环境200包括具有微控制器136的始终在线模块132,该微控制器136具有始终在线响应固件138。始终在线模块132经由被描绘为前扩音器150和后扩音器152的至少一个声音接收部件149来从音频输入源210接收语音激活信号102。
数据处理器116执行部件或与被远程地执行的分布式部件通信,其包括响应于用户可听命令而进行响应并执行动作的语音激活信息助理130。语音合成器212可以通过可以是前扬声器160和/或后扬声器162的至少一个声音产生部件159来产生可听响应213。数据处理器116可以进一步执行文本至语音转换模块218和语音至文本转换模块220。替换地或者另外,始终在线隐私模式环境200包括被描绘为经由数据分组网络222向服务器224进行通信的第一用户设备100的分布式架构。第一用户设备100的通信机制194可以与服务器224的数据分组网络接入部件226通信。例如,可以从服务器224下载或者作为在服务器224上的远程功能提供诸如文本至语音转换模块218和语音至文本转换模块220之类的某些功能。服务器224还可以提供来自数据库228的附加用户信息和来自接收命令/查询响应引擎230的附加查询功能。
第一用户设备100可以访问被描绘为包含隐私设置144和预先建立的确认响应146的数据存储设备142内的本地或远程存储数据或程序。数据处理器116还执行始终在线隐私模式工具122,其可以包括用以选择用户查询的音频查询工具124以及用以响应于处于隐私模式而评估用户触觉输入的触觉输入工具126。始终在线隐私模式工具122包括用于计量其中在喇叭接近度内的另一用户设备可以合理地预期将检测到产生对同一可听激活的可听应答的时间长度的计时器236。数据处理器116还与具有触摸屏或触控板154、显示器158和键区156中的一个或多个的用户接口134通信。
始终在线隐私模式工具122在数据处理器116上执行并将第一用户设备100(图1)配置成经由所述至少一个声音接收部件149来检测激活第一用户设备100的第一预先建立的可听激活命令。响应于检测到该第一预先建立的可听激活命令,第一用户设备100经由所述至少一个声音产生部件159产生在第一用户设备100的喇叭接近度内的第一可听应答。第一用户设备100经由所述至少一个声音接收部件149来监视在由计时器236提供的预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测。响应于在预置时间间隔内未检测到任何第二可听应答,语音激活信息助理130响应于始终在线隐私模式工具122在预置时间间隔内未检测到任何第二可听应答而处理所接收的可听命令并对其进行响应。
响应于始终在线隐私模式工具122在计时器236的预置时间间隔内检测到至少一个第二可听应答,始终在线隐私模式工具122触发第一用户设备100进入可听命令输入的隐私模式。语音合成器212经由显示器158和所述至少一个声音产生部件159中的至少一个来产生隐私模式通告。例如,该隐私模式通告可以指示对预先建立的可听激活命令进行响应的多个设备已经被检测到,并且可以进一步指示喇叭播放被禁用。因此,在一个实施例中,第一用户设备100可以自动地恢复成手持模式以用于用户交互,其中,第一用户设备100响应于接收到向用户设备100的用户接口134的触觉控制输入而处理随后所接收的命令并对其进行响应。
作为在隐私模式的此版本期间对触觉控制输入进行响应的替换或除此之外,始终在线隐私模式工具122可以将第一用户设备100配置成对被确定为直接在手持或耳机接近度内进行的语音命令进行响应。例如,音频振幅和延迟分析器工具128可以通过测量可听命令的音量量值来对接收可听命令的所述至少一个声音接收部件149进行响应。此外,音频振幅和延迟分析器工具128可以将该音量量值与被预先选择以指示用户何时直接地向第一用户设备100中说话的响度阈值相比较。响应于音量量值超过响度阈值,允许语音激活信息助理130处理可听命令并对其进行响应。
在本公开的一个或多个实施例中,始终在线隐私模式工具122可以将第一用户设备100配置成在通过验证语音命令来自已授权用户110来保持隐私性的情况下继续对此类语音命令进行响应。为此,始终在线隐私模式工具122的音频查询工具124可以生成请求确认第一预先建立的可听激活命令源自于用户设备的已授权用户的挑战。所述至少一个声音接收部件149接收对挑战的确认响应。响应于所接收的确认响应被音频查询工具124验证为被分配给用户设备100的预先建立的确认响应,始终在线隐私模式工具122处理所接收的可听命令并对其进行响应。
隐私设置144可以指示始终在线隐私模式工具122可以以所选方式或者同时地以多个方式生成该挑战。例如,用户接口134可以将该挑战作为可听输出、视觉输出和/或触觉输出传送至已授权用户110。同样地,隐私设置144可以指示始终在线隐私模式工具122可以以一个或多个方式从已授权用户110接收确认。例如,用户接口134可以接收作为可听响应的用户输入、来自相机148的视觉确认或触觉输入。替换地或另外,对诸如与已授权用户110进行秘密通信的蓝牙耳机178之类的输入附件的手动选择可以终止对隐私模式的需要。替换地,可以对生成和接收的相应方式进行限制和预配置。
作为第一示例,始终在线隐私模式工具122可以将第一用户设备100配置成通过经由所述至少一个声音产生部件159来产生挑战查询而生成请求确认第一预先建立的可听激活命令源自于第一用户设备100的已授权用户的挑战,所述挑战查询征求预先建立的确认响应146作为在第一用户设备100的喇叭接近度内可检测的可听响应。所述至少一个声音接收部件149接收对产生的挑战查询的可听确认响应。音频查询工具124通过针对匹配将所接收的可听确认响应与预先建立的确认响应146相比较来验证第一预先建立的可听激活命令源自于第一用户设备100的已授权用户110。例如,所接收的可听确认响应146可以是分配给第一用户设备100的特定标识符和已授权用户的预先记录的名字中的预先选择的一个。多设备检测(MDD)工具232然后可以通过使得语音激活信息助理130能够对后续语音命令进行响应来进行响应。
在另一实施例中,始终在线隐私模式工具122进一步将第一用户设备100配置成通过经由所述至少一个声音产生部件159来产生在第一用户设备100的喇叭接近度内可听的挑战查询而生成请求确认第一预先建立的可听激活命令源自于第一用户设备100的已授权用户的挑战。所述至少一个声音接收部件149通过检测用户设备100的用户接口134处的触觉用户输入来接收对挑战的确认响应。从而,始终在线隐私模式工具122的触觉输入工具126可以基于用户提供触觉用户输入来验证第一预先建立的可听激活命令源自于第一用户设备100的已授权用户。对于此验证的推断可以是该预先建立的确认响应等同于在用户设备100产生可听挑战查询之后的第二预置时间内由用户对第一用户设备100的用户接口134进行的直接接触。例如,触觉用户输入可以是选自以下中的一个或多个预先建立的触觉输入:(i)对触摸屏和/或触控板154上的触摸屏控制机构的选择,(ii)键区156的按钮的致动,(iii)第一用户设备100的振动模式,以及(iv)在触摸屏和/或触控板154上跟踪至少一个符号。
在至少一个实施例中,始终在线隐私模式工具122进一步将用户设备100配置成在用户设备100的用户接口134处接收控制输入以执行以下中的一个:(a)修改,以及(b)添加分配给用户设备100和已授权用户中的一个的预先建立的确认响应146。为此,所述至少一个声音接收部件149从已授权用户110接收新确认响应。始终在线隐私模式工具更新数据存储设备142中的预先建立的确认响应146以与新确认响应匹配。
在一个或多个实施例中,可听应答从两个或更多用户设备可以是相同的,并且因此作为将源自于第一用户设备100的可听应答与另一用户设备区别开的基础的可听应答的唯一性是有问题的。然而,音频振幅和延迟分析器128可以辨别可以用来将第一用户设备100与另一用户设备区别开的声音质量。例如,由于第一用户设备100的处理延迟,另一用户设备可以首先对语音激活进行响应。因此,即使有由于声音从另一用户设备行进至第一用户设备100所需的时间而引起的延迟,在使用一个声音接收部件149时延迟也可能是不足以区别的。在这种情况下,可以使用两个源之间的音频振幅变化来确定源是第一用户设备100还是另一用户设备。在另一情况下,第一用户设备100可以非常接近于另一用户设备100,使得延迟和振幅并未明显不同。然而,音频振幅和延迟分析器工具128可以检测到前扩音器150和后扩音器152检测到的东西之间的差别,并且这些差别可以被用来区别两个音频输入源210。在另一示例中,由于第一用户设备100和另一用户设备的音量设置,检测到的振幅在所述至少一个声音接收部件149处可以是相同的。然而,该距离可以赋予可被振幅和延迟分析器工具128检测到的延迟。
因此,在一个或多个实施例中,用户设备100具有诸如前扬声器160之类的第一声音产生部件和诸如后扬声器162之类的第二声音产生部件。另外,至少一个声音接收部件149包括诸如前扩音器150之类的第一声音接收部件和诸如后扩音器152之类的第二声音接收部件,其可用于音频振幅和延迟分析器工具128。始终在线隐私模式工具122可以进一步将用户设备100配置成经由第一声音产生部件(前扬声器160)产生在用户设备100的喇叭接近度或免提接近度内的第一可听应答。第一声音接收部件(前扩音器150)监视按照计时器236在预置时间间隔内产生的所述至少一个第二可听应答的检测。同时,第二声音接收部件(后扩音器152)监视在预置时间间隔内产生的所述至少一个第二可听应答的检测。音频振幅和延迟分析器工具128检测并且始终在线隐私模式工具122确定所述至少一个第二可听应答来自另一用户设备。此确定可以是基于在两个声音接收部件149(前扩音器150和后扩音器152)处接收到第二可听应答,其具有响度变化和指示从声音产生部件159(前扬声器160)移位的源的定时延迟中的至少一个。为了明了起见,第一声音产生部件159被指示为前扬声器160;然而,第一声音产生部件159可以是后扬声器162,并且第二声音产生部件159可以是前扬声器160。在各种实施例中,可以基于在喇叭模式还是耳机模式下使用来选择声音接收部件149和/或声音产生部件159。
符合本公开的各方面可以包括通过将语音激活声音的识别转移到诸如始终在线模块132之类的语音监视器131的省电特征。始终在线隐私模式工具122因此可以进一步将用户设备100配置成在语音监视器131(始终在线模块132)保持被激活的同时将用户设备100的语音激活信息助理130的至少一部分切换至省电模式。例如,处理器116的各部分可以在较低性能水平下操作或者被关断。语音监视器131可以检测到第一预先建立的可听激活命令102。响应于语音监视器131检测到激活命令102(第一预先建立的可听激活命令),始终在线隐私模式工具122产生在用户设备100的喇叭接近度或免提接近度内的第一可听应答。
图3图示出连同第二用户设备104一起在多设备空间301内使用的示例第一用户设备100。第一用户设备100为了方便起见且为了在免提情况下可访问而采用始终在线语音命令模式。因此,已授权用户110可以与被描绘为具有在用户接口134上执行的应用程序的语音激活信息助理130相交互。特别地,已授权用户110可以在接近到足以使已授权用户110听到第一用户设备100并被第一用户设备100听到的免提接近度或喇叭接近度315内被定向或者与第一用户设备100间隔开。当选择或需要直接地与用户接口134相交互时,已授权用户110在允许直接观看或触摸用户接口134的手持接近度或耳机接近度317内。耳机接近度317还指示来自第一用户设备100的可听输出的音量被设置为适合于已授权用户110的耳朵放置于耳机扬声器,诸如前扬声器160。
在一个或多个实施例中,用户接口134如所描绘的那样显示并以可听方式对已授权用户110进行响应。例如,隐私通告320、挑战查询323和触觉输入控制325可以被显示在用户接口134上和/或与如在110'处描绘的对接。同样地,用户接口134允许或者在某些情况下要求在耳机接近度内与用户接口134的直接交互。可以预先确定或调整用于接收可听语音命令的可听音量和灵敏度的阈值以约束喇叭接近度315的大小。例如,第三用户设备305和第三用户309可以在喇叭接近度315的外面。因此,虽然第三用户设备305也可检测到语音激活信号102,但由第三用户设备305进行的可听应答106可具有不可检测的音量量值方面的变化或到达第一用户设备100时的时间延迟。
在说明性情形中,每个用户设备100、104具有与之相关联的对应的用户。具体地,第一用户设备100具有对应的第一用户110且第二用户设备104具有对应的第二用户108。在说明性情形中,第一和第二用户设备100、104两者都被配置成监视语音激活信号102并用可听应答106进行响应。如果第一用户设备100将响应于并未意图用于第一用户设备100、并非源自于已授权用户或者并未意图是语音命令的语音命令而以可听方式公开隐私信息,则可能损害第一用户110的隐私性。为了解决此问题,第一用户设备100的始终在线隐私模式工具122防止可能被第二用户108偷听的包含隐私信息的无意中的可听响应。
图4图示出用于有差别地提供对由支持语音激活的用户设备100所接收的语音命令的可听响应的方法400。根据一个或多个实施例,方法400图示出使语音激活信号102(例如,第一预先建立的可听激活命令)是用户可配置的。根据一个或多个实施例,方法400还图示出用户设备100如何可以通过将一个或多个语音监视功能转移到单独的集成电路、部件或设备,诸如始终在线模块132而不是在处理器IC114(图1)上执行的语音监视器131来支持省电。从而,可以在由可以在直到被激活之前被置于省电模式的部件来执行要求较高电力消耗的其它功能的情况下优化语音监视功能以实现低电力。另外,方法400描绘了用以当描绘多个设备时在隐私模式下操作的两个一般方法。首先,用户设备100可以至少临时地恢复到要求与用户接口的直接交互的手持模式以从而确认已授权用户110意图发起语音命令。始终在线语音模式因此被至少在功能上且临时地关断。其次,用户设备100可以通过要求已授权用户110唯一地确认他/她的身份来执行隐私模式。在根据各种实施例的图5A-5C中进一步用可听和/或触觉用户确认响应来举例说明后一种方法。在要求确认的后一种方法中,免提的益处继续为已授权用户110给出了从喇叭接近度内听到来自用户设备100的查询的机会。
继续参考图4,方法400在起始框处开始并通过始终在线隐私模式工具122访问预先建立的确认响应(如果有的话)而前进至方框401。在方框402中,已授权用户110可以输入被始终在线隐私模式工具122接收到的新预先建立的确认响应。在某些情况下,第一用户设备100在接受新的预先建立的确认响应之前针对用于唯一性和可检测性的标准表征新的预先建立的确认响应。
在某个后续时间点处,方法400在执行语音激活信息助理130的处理器IC114处于省电模式且始终在线模块132处于活动状态的情况下继续。在判定框404中重复,始终在线模块132确定是否已检测到预先建立的激活命令。如果在方框404中未检测到,则始终在线模块132在方框403中继续监视且方法400保持在此等待状态。当在方框404中检测到时,始终在线模块132在方框405中唤醒处理器IC114,使得始终在线隐私模式工具122可以检测到多个设备,并且使得语音激活信息助理130可以如始终在线隐私模式工具122允许的那样对已授权用户110进行响应。
在方框406处,所述至少一个声音产生部件159产生在用户设备100的喇叭接近度内的第一可听应答。处理器IC114在方框408中监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测。在判定框410中进行预置时间间隔是否已经期满的确定。如果计时器尚未期满,则处理器IC114继续在方框408中监视至少一个第二可听应答的检测。
如果计时器已经期满,则在方框411处,音频振幅和延迟分析器工具128比较前和后扩音器之间的响度变化和时间延迟以区别是否检测到至少一个第二可听应答。基于方框411中的比较,始终在线隐私模式工具122可以在判定框412中确定是否已检测到多个设备。特别地,始终在线隐私模式工具122可以基于在第一声音接收部件和第二声音接收部件两者处接收到第二可听应答而确定第二可听应答来自另一用户设备,其中响度变化和定时延迟中的至少一个指示来自第一声音产生部件的移位的源。
如果在判定框412中未检测到第二可听应答,则第一用户设备100并未处于多设备情况且隐私模式未被批准。同样地,语音激活信息助理130可以在方框414中接收语音激活命令。然后,语音激活信息助理130可以在方框416中执行语音激活命令,然后方法400退出。
然而如果在判定框412中检测到所述至少一个第二可听应答,则该检测指示另一用户设备也在对第一预先建立的可听激活命令进行响应。因此,响应于在方框412中检测到多个设备,始终在线隐私模式工具122在方框418中针对第一用户设备100触发隐私模式。在方框420中,始终在线隐私模式工具122访问隐私模式设置,其规定始终在线隐私模式工具122在第一用户设备100处于隐私模式时如何配置第一用户设备100。
在一个实施例中,隐私模式可以使得用户设备100恢复到手持模式,至少临时地禁用始终在线语音命令。因此,可以在判定框422中进行关于在方框420中被访问的隐私模式设置是否指示第一用户设备100应在处于隐私模式时恢复到手持模式的确定。如果方框422中的确定是恢复到手持模式,则始终在线隐私工具122在方框424中可以产生指示多个设备已进行响应并指示喇叭播放已被禁用的通告。可以经由显示器158和诸如前扬声器160和/或后扬声器162之类的声音产生部件159中的至少一个来输出该隐私模式通告。方法400然后退出。
在另一实施例中或者由于隐私设置144的不同配置,判定框422中的确定不仅仅是是否要禁用语音激活信息助理130。替代地,响应于在预置时间间隔内检测到至少一个第二可听应答,方法400提供触发进入到可听命令输入的隐私模式。在方框426中,始终在线隐私模式工具122向用户挑战以确认从用户设备100的已授权用户110(对比第二用户设备的另一用户108)接收到初始语音激活信号。始终在线隐私模式工具122在方框428中接收确认响应。在判定框430中进行确认响应是否已被验证的确定。如果在方框430中未被验证,则方法400退出。如果已授权用户在方框430中被验证,则语音激活信息助理130可以被启用以在方框414中接收语音激活命令并在方框416中执行语音激活命令或对其进行响应。
转到图5A-5C,示例方法500进一步图示出用方法400(图4)的方框426、428和430介绍的挑战、接收以及验证的操作。根据本公开的各种实施例,方法500举例说明接收可听和/或触觉确认响应。首先参考图5A,方法500在起始框处开始并前进至方框502,其中至少一个声音产生部件产生可听挑战查询以征询预先建立的确认响应。在示例性方面,以将在喇叭接近度315内被用户听到的喇叭音量产生可听挑战查询。作为在方框502中产生可听挑战查询的替换或除此之外,显示器158在方框504中可以显示挑战查询323。在方框506中,始终在线隐私模式工具122开启具有被为对挑战查询的人类响应而预置的持续时间的第二计时器。在方框508中,始终在线隐私模式工具122如由隐私设置所启用的那样在用户接口中监视可听和/或触觉确认响应。在判定框510中进行关于第二计时器是否已经期满的重复确定。在一个或多个实施例中,如果已授权用户并未开始向第一用户设备100进行输入,则第二计时器可以更快速地期满,而一旦检测到输入,则第二计时器可以更缓慢地期满,允许已授权用户完成确认响应。如果在判定框510中计时器尚未期满,则始终在线隐私模式工具122在方框508中继续监视。
如果在方框510中确定第二计时器已经期满,则始终在线隐私模式工具122在方框512中访问关于用来配置始终在线隐私模式工具122以确定已授权用户是否已被验证的一个或多个方式的隐私设置。在第一说明性确定中,始终在线隐私模式工具122基于已授权用户直接地向第一用户设备100中说话来访问关于验证的设置。在判定框514中进行关于此第一验证设置是否被启用的确定。如果在判定框514中被启用,则始终在线隐私模式工具122将如由音频振幅和延迟分析器工具128测量的接收确认的音量量值与阈值相比较。在方框515中的比较之后,始终在线隐私模式工具122在判定框516中进行关于该确认响应是否基于该比较而被验证的确定。
参考图5C,如果方框516中的确定是该确认响应根据第一验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
返回图5A,然而,如果在方框516中确认响应并未使用第一验证设置被验证或者如果在方框514中第一验证设置未被启用,则始终在线隐私模式工具122在方框520中基于已授权用户的预先记录的名字而访问关于第二验证设置的隐私设置。在判定框522中进行关于此第二验证设置是否被启用的确定。如果在判定框522中被启用,则在方框524中,始终在线隐私模式工具122将接收到的确认响应与作为预先记录的名字的预先建立的确认响应相比较。在方框524中的比较之后,始终在线隐私模式工具122在判定框526中进行关于确认响应是否基于该比较而被验证的确定。
参考图5C,如果判定框526中的确定是该确认响应根据第二验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
返回图5A,然而,如果在方框526中确认响应并未使用第二验证设置被验证或者如果在方框522中第二验证设置未被启用,则继续至图5B,始终在线隐私模式工具122在方框528中基于与第一用户设备100相关联的标识符访问关于第三验证设置的隐私设置。在判定框530中进行关于此第三验证设置是否被启用的确定。如果在判定框530中被启用,则始终在线隐私模式工具122在方框532中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是与第一用户设备100相关联的标识符。在方框532中的比较之后,始终在线隐私模式工具122在判定框534中进行关于该确认响应是否基于该比较而被验证的确定。
参考图5C,如果判定框534中的确定是该确认响应根据第三验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
返回图5B,然而,如果在判定框534中确认响应并未使用第三验证设置被验证或者如果在判定框530中第三验证设置未被启用,则始终在线隐私模式工具122在方框536中基于用户接口134接收到指示第一用户设备100的手持操作的任何输入而访问关于第四验证设置的隐私设置。在判定框538中进行关于此第四验证设置是否被启用的确定。如果在判定框538中被启用,则始终在线隐私模式工具122在框540中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是到第一用户设备100的物理或触觉输入。在方框540中的比较之后,始终在线隐私模式工具122在判定框542中进行关于该确认响应是否基于该比较而被验证的确定。
参考图5C,如果判定框542中的确定是该确认响应根据第四验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
返回图5B,然而,如果在判定框542中确认响应并未使用第四验证设置被验证或者如果在判定框538中第四验证设置未被启用,则始终在线隐私模式工具122在方框544中基于用户设备100接收到指示第一用户设备100手持操作的移动或振动的模式而访问关于第五验证设置的隐私设置。在判定框546中进行关于此第五验证设置是否被启用的确定。如果在判定框546中被启用,则始终在线隐私模式工具122在方框548中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是到第一用户设备100的移动或振动输入。在方框548中的比较之后,始终在线隐私模式工具122在判定框550中进行关于该确认响应是否基于该比较而被验证的确定。
参考图5C,如果框550中的确定是该确认响应根据第五验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
返回图5B,然而,如果在判定框550中确认响应并未使用第五验证设置被验证或者如果在判定框546中第五验证设置未被启用,则始终在线隐私模式工具122在方框552中基于用户接口134在触摸屏154上接收到跟踪一个或多个符号的模式而访问关于第六验证设置的隐私设置。在图5C中继续,在判定框554中进行关于此第六验证设置是否被启用的确定。如果在判定框554中被启用,则始终在线隐私模式工具122在方框556中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是被追踪的符号。在方框556中的比较之后,始终在线隐私模式工具122在判定框558中进行关于该确认响应是否基于该比较而被验证的确定。如果判定框558中的确定是该确认响应根据第六验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
然而,如果在判定框558中确认响应并未使用第六验证设置被验证或者如果在判定框554中第六验证设置未被启用,则始终在线隐私模式工具122在方框560中基于用户接口134接收到向触摸屏154的触觉控制输入而访问关于第七验证设置的隐私设置。例如,触摸屏控制可以是关键字、虚拟控制选择、口令录入等。在判定框562中进行关于此第七验证设置是否被启用的确定。如果在判定框562中被启用,则始终在线隐私模式工具122在方框564中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是触觉控制输入。在方框564中的比较之后,始终在线隐私模式工具122在判定框566中进行关于该确认响应是否基于该比较而被验证的确定。如果框566中的确定是该确认响应根据第七验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。
然而,如果在判定框566中确认响应并未使用第七验证设置被验证或者如果在判定框562中第七验证设置未被启用,则始终在线隐私模式工具122在方框568中基于用户接口134接收到向键区156的触觉控制输入而访问关于第八验证设置的隐私设置。例如,触控板控制输入可以是键入关键字、控制致动、口令录入等。在判定框570中进行关于此第八验证设置是否被启用的确定。如果在判定框570中被启用,则始终在线隐私模式工具122在方框572中将所接收的确认响应与预先建立的确认响应相比较,该预先建立的确认响应是到键区156的触觉控制输入。在方框572中的比较之后,始终在线隐私模式工具122在判定框574中进行关于该确认响应是否基于该比较而被验证的确定。如果判定框574中的确定是确认响应根据第八验证设置而被验证,则在方框517中,始终在线隐私模式工具122推断已授权用户被确认,并且在方框518中在始终在线语音模式下继续语音控制操作。方法500然后退出。然而,如果判定框574中的确定是确认响应并未基于第八验证设置而被验证,或者如果在判定框570中第八验证设置未被启用,则在方框576中,始终在线隐私模式工具122推断没有已授权用户被确认并在方框578中中止语音控制操作。方法500退出。
在本文中提出的图4和图5A-5C的每个流程图中,在不脱离所述创新的精神和范围的情况下,方法的某些步骤可以被组合、同时地或按照不同顺序执行或者可能省略。虽然在特定序列中描述并图示出方法步骤,但是特定步骤序列的使用并不意图暗示对创新的任何限制。在不脱离本创新的精神或范围的情况下,可进行关于步骤序列的改变。因此,不应在限制性意义上理解特定序列的使用,并且本创新的范围仅仅由所附权利要求来限定。
示例1:一种用于有差别地提供对由支持语音激活的用户设备所接收的语音命令的可听响应的方法,所述方法包括:检测激活所述用户设备的第一预先建立的可听激活命令;响应于检测到所述第一预先建立的可听激活命令,产生在所述用户设备的喇叭接近度内的第一可听应答;监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测;响应于在所述预置时间间隔内未检测到任何第二可听应答,处理所接收的可听命令并且对其进行响应;响应于在所述预置时间间隔内检测到至少一个第二可听应答:触发到可听命令输入的隐私模式的进入;以及经由显示器和声音产生部件中的至少一个来产生隐私模式通告。
示例2:根据示例1所述的方法,其中,产生所述隐私模式通告包括指示多个设备被检测到并且指示喇叭播放被禁用。
示例3:根据示例1-2中的任一项所述的方法,其中,处理所接收的可听命令并且对其进行响应包括:测量所述可听命令的音量量值;将所述音量量值与被预先选择以指示用户何时直接地向所述用户设备中说话的响度阈值相比较;以及响应于所述音量量值超过所述响度阈值,处理所接收的可听命令并且对其进行响应。
示例4:根据示例1-3中的任一项所述的方法,其中,产生隐私模式通告包括:生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;接收对所述挑战的确认响应;以及响应于所接收的确认响应被验证为被分配给所述用户设备的预先建立的确认响应,处理所接收的可听命令并且对其进行响应。
示例5:根据示例4所述的方法,其中:生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战包括:产生征询所述预先建立的确认响应作为在所述用户设备的所述喇叭接近度内可检测的可听响应的挑战查询;接收对所产生的挑战查询的可听确认响应;以及通过针对匹配将所接收的可听确认响应与所述预先建立的确认响应相比较来验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
示例6:根据示例5所述的方法,其中,所述验证包括:将所接收的可听确认响应与分配给所述用户设备的特定标识符中的预先选择的一个和已授权用户的预先记录的名字相比较。
示例7:根据示例4所述的方法,其中:生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战包括:产生在所述用户设备的喇叭接近度内可听的挑战查询;接收对所述挑战的所述确认响应包括:检测在所述用户设备的用户接口处的触觉用户输入;以及所述方法还包括:基于用户在产生所述可听挑战查询之后的第二预置时间内提供所述触觉用户输入而验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
示例8:根据示例7所述的方法,其中:所述触觉用户输入包括来自以下中的预先建立的触觉输入:(i)触摸屏控制的选择,(ii)按钮的致动,(iii)所述用户设备的振动的模式,以及(iv)在触摸屏上追踪至少一个符号。
示例9:根据示例4所述的方法,其中,在检测到所述第一预先建立的可听激活命令以前,所述方法还包括:接收在所述用户设备的用户接口处的控制输入以执行以下中的一个:(a)修改和(b)添加分配给所述用户设备和所述已授权用户中的一个的预先建立的确认响应;从所述已授权用户接收新确认响应;以及更新所述预先建立的确认响应以与所述新确认响应匹配。
示例10:根据示例4所述的方法,还包括:经由第一声音产生部件产生在所述用户设备的所述喇叭接近度内的所述第一可听应答;经由第一声音接收部件监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;经由第二声音接收部件同时地监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;以及基于在所述第一声音接收部件和所述第二声音接收部件两者处接收到所述第二可听应答而确定所述至少一个第二可听应答来自另一用户设备,其中响度变化和定时延迟中的至少一个指示来自所述第一声音产生部件的移位的源。
示例11:根据示例4所述的方法,还包括:在语音监视器仍被激活的同时将所述用户设备的语音激活信息助理的至少一部分切换至省电模式;由所述语音监视器检测所述第一预先建立的可听激活命令;以及响应于检测到所述第一预先建立的可听激活命令,所述语音监视器激活所述语音激活信息助理以产生在所述用户设备的所述喇叭接近度内的所述第一可听应答。
示例12:一种用户设备,包括:至少一个声音产生部件;至少一个声音接收部件;用户接口,所述用户接口包括显示器;至少一个处理器,所述至少一个处理器被通信耦合到所述用户接口、所述至少一个声音接收部件和所述至少一个声音产生部件;始终在线隐私模式工具,所述始终在线隐私模式工具在所述至少一个处理器上执行并且将所述用户设备配置成:经由所述至少一个声音接收部件来检测激活所述用户设备的第一预先建立的可听激活命令;响应于接收到所述第一预先建立的可听激活命令,经由所述至少一个声音产生部件产生在所述用户设备的喇叭接近度内的第一可听应答;经由所述至少一个声音接收部件监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测;响应于在所述预置时间间隔内未检测到任何第二可听应答,处理所接收的可听命令并且对其进行响应;响应于在所述预置时间间隔内检测到至少一个第二可听应答:触发到可听命令输入的隐私模式的进入;以及经由所述显示器和所述至少一个声音产生部件中的至少一个来产生隐私模式通告。
示例13:根据示例12所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:通过指示多个设备被检测到并且指示喇叭播放被禁用来产生隐私模式通告;以及响应于接收到向所述用户设备的用户接口的触觉控制输入,处理随后所接收的命令并且对其进行响应。
示例14:根据示例12-13中的任一项所述的用户设备,其中,所述始终在线隐私模式工具将所述用户设备配置成处理所接收的可听命令并且对其进行响应包括所述工具将所述用户设备配置成:测量所述可听命令的音量量值;将所述音量量值与被预先选择以指示用户何时直接地向所述用户设备中说话的响度阈值相比较;以及响应于所述音量量值超过所述响度阈值,处理所接收的可听命令并且对其进行响应。
示例15:根据示例12-14中的任一项所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;接收对所述挑战的确认响应;以及响应于所接收的确认响应被验证为被分配给所述用户设备的预先建立的确认响应,处理所接收的可听激活命令并且对其进行响应。
示例16:根据示例15所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:通过经由所述至少一个声音产生部件产生征询所述预先建立的确认响应作为在所述用户设备的所述喇叭接近度内可检测的可听响应的挑战查询来生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;经由所述至少一个声音接收部件来接收对所产生的挑战查询的可听确认响应;以及通过针对匹配将所接收的可听确认响应与所述预先建立的确认响应相比较来验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
示例17:根据示例16所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:通过将所接收的可听确认响应与分配给所述用户设备的特定标识符中的预先选择的一个和已授权用户的预先记录的名字相比较来进行验证。
示例18:根据示例15所述的用户设备,还包括:用户接口,所述用户接口与所述至少一个处理器通信;其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:通过经由所述至少一个声音产生部件产生在所述用户设备的喇叭接近度内可听的挑战查询来生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;接收对所述挑战的确认响应包括:检测在所述用户设备的所述用户接口处的触觉用户输入;以及基于用户在产生所述可听挑战查询之后的第二预置时间内提供所述触觉用户输入而验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
示例19:根据示例18所述的用户设备,其中:所述触觉用户输入包括来自以下中的预先建立的触觉输入:(i)触摸屏控制的选择,(ii)按钮的致动,(iii)所述用户设备的振动的模式,以及(iv)在触摸屏上追踪至少一个符号。
示例20:根据示例15所述的用户设备,还包括:用户接口,所述用户接口与所述至少一个处理器通信;其中,在所述至少一个声音接收部件检测到所述第一预先建立的可听激活命令以前,所述始终在线隐私模式工具进一步将所述用户设备配置成:接收在所述用户设备的用户接口处的控制输入以执行以下中的一个:(a)修改和(b)添加分配给所述用户设备和所述已授权用户中的一个的预先建立的确认响应;经由所述至少一个声音接收部件从所述已授权用户接收新确认响应;以及更新所述预先建立的确认响应以与所述新确认响应匹配。
示例21:根据示例15所述的用户设备,其中:所述至少一个声音产生部件包括第一声音产生部件和第二声音产生部件;所述至少一个声音接收部件包括第一声音接收部件和第二声音产生部件;以及所述始终在线隐私模式工具进一步将所述用户设备配置成:经由所述第一所述声音产生部件产生在所述用户设备的所述喇叭接近度内的所述第一可听应答;经由所述第一声音接收部件监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;经由第二声音接收部件同时地监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;以及基于在所述第一声音接收部件和所述第二声音接收部件两者处接收到所述第二可听应答而确定所述至少一个第二可听应答来自另一用户设备,其中响度变化和定时延迟中的至少一个指示来自所述第一声音产生部件的移位的源。
示例22:根据示例15所述的用户设备,还包括:语音激活信息助理;以及语音监视器;其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:在语音监视器仍被激活的同时将所述用户设备的所述语音激活信息助理的至少一部分切换至省电模式;由所述语音监视器检测第一预先建立的可听激活命令;以及响应于检测到所述第一预先建立的可听激活命令,经由所述语音监视器激活所述语音激活信息助理以产生在所述用户设备的所述喇叭接近度内的所述第一可听应答。
如本领域的技术人员将认识到的,本创新的实施例可被体现为系统、设备和/或方法。因此,本创新的实施例可采取完全硬件实施例的形式或将软件和硬件实施例组合的实施例的形式,其在本文中全部通称为“电路”、“模块”或“系统”。
下面参考根据本创新的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本创新的各方面。将理解的是可以由计算机程序指令来实现流程图和/或框图中的每个方框以及流程图和/或框图中的方框的组合。这些计算机程序指令可被提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器以产生机器,使得经由计算机或其它可编程数据处理装置的处理器执行的指令产生用于实现在流程图和/或框图方框中指定的功能/动作的手段。
虽然已参考示例性实施例描述了本创新,但本领域的技术人员将理解的是在不脱离本创新的范围的情况下可进行各种改变且等价物可代替其元素。另外,在不脱离本创新的本质范围的情况下,可进行许多修改以使特定系统、设备或其部件适应于本创新的教导。因此,意图在于本创新不限于用于执行本创新的公开的特定实施例,而是本创新将包括落在所附权利要求范围内的所有实施例。此外,术语第一、第二等的使用不表示任何顺序或重要性,而是术语第一、第二等被用来将一个元素与另一个区别开。
在本文中使用的术语仅仅是出于描述特定实施例的目的且并不意图限制本创新。如本文所使用的单数形式“一”、“一个”和“该”意图也包括复数形式,除非上下文另外清楚地指明。将进一步理解的是术语“包括”和/或“包含”当在本说明书中使用时指定所述特征、整体、步骤、操作、元件和/或部件的存在,但是不排除一个或多个其它特征、整体、步骤、操作、元件、部件和/或其群组的存在或添加。
权利要求中的所有手段或步骤加功能元素的对应的结构、材料、动作以及等价物意图包括用于与具体地要求保护的其它要求保护的元素相组合地执行功能的任何结构、材料或动作。本创新的描述是出于举例说明和描述的目的而提出的,但并不意图是穷尽的或局限于采取所公开的形式的创新。在不脱离本创新的范围和精神的情况下,许多修改和改变对于本领域的技术人员而言将是显而易见的。选择并描述本实施例是为了最好地解释本创新的原理和实际应用,并使得本领域的技术人员能够理解用于具有适合于所设想的特定用途的各种修改的各种实施例的创新。

Claims (22)

1.一种用于有差别地提供对由支持语音激活的用户设备所接收的语音命令的可听响应的方法,所述方法包括:
检测激活所述用户设备的第一预先建立的可听激活命令;
响应于检测到所述第一预先建立的可听激活命令,产生在所述用户设备的喇叭接近度内的第一可听应答;
监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测;
响应于在所述预置时间间隔内未检测到任何第二可听应答,处理并且响应所接收的可听命令;
响应于在所述预置时间间隔内检测到至少一个第二可听应答:
触发到可听命令输入的隐私模式的进入;以及
经由显示器和声音产生部件中的至少一个来产生隐私模式通告。
2.根据权利要求1所述的方法,其中,产生所述隐私模式通告包括指示多个设备被检测到并且指示喇叭播放被禁用。
3.根据权利要求1-2中的任一项所述的方法,其中,处理并且响应所接收的可听命令包括:
测量所述可听命令的音量量值;
将所述音量量值与被预先选择以指示用户何时直接地向所述用户设备中说话的响度阈值相比较;以及
响应于所述音量量值超过所述响度阈值,处理并且响应所接收的可听命令。
4.根据权利要求1-3中的任一项所述的方法,其中,产生隐私模式通告包括:
生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;
接收对所述挑战的确认响应;以及
响应于所接收的确认响应被验证为被分配给所述用户设备的预先建立的确认响应,处理并且响应所接收的可听命令。
5.根据权利要求4所述的方法,其中:
生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战包括:产生征询所述预先建立的确认响应作为在所述用户设备的所述喇叭接近度内可检测的可听响应的挑战查询;
接收对所产生的挑战查询的可听确认响应;以及
通过针对匹配将所接收的可听确认响应与所述预先建立的确认响应相比较来验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
6.根据权利要求5所述的方法,其中,所述验证包括:将所接收的可听确认响应与分配给所述用户设备的特定标识符中的预先选择的一个和已授权用户的预先记录的名字相比较。
7.根据权利要求4所述的方法,其中:
生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战包括产生在所述用户设备的喇叭接近度内可听的挑战查询;
接收对所述挑战的所述确认响应包括检测在所述用户设备的用户接口处的触觉用户输入;以及
所述方法还包括:基于用户在产生所述可听挑战查询之后的第二预置时间内提供所述触觉用户输入而验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
8.根据权利要求7所述的方法,其中:
所述触觉用户输入包括来自以下中的预先建立的触觉输入:(i)触摸屏控制的选择,(ii)按钮的致动,(iii)所述用户设备的振动的模式,以及(iv)在触摸屏上追踪至少一个符号。
9.根据权利要求4所述的方法,其中,在检测到所述第一预先建立的可听激活命令以前,所述方法还包括:
接收在所述用户设备的用户接口处的控制输入以执行以下中的一个:(a)修改和(b)添加分配给所述用户设备和所述已授权用户中的一个的预先建立的确认响应;
从所述已授权用户接收新确认响应;以及
更新所述预先建立的确认响应以与所述新确认响应匹配。
10.根据权利要求4所述的方法,还包括:
经由第一声音产生部件产生在所述用户设备的所述喇叭接近度内的所述第一可听应答;
经由第一声音接收部件监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;
经由第二声音接收部件同时地监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;以及
基于在所述第一声音接收部件和所述第二声音接收部件两者处接收到所述第二可听应答而确定所述至少一个第二可听应答来自另一用户设备,其中响度变化和定时延迟中的至少一个指示从所述第一声音产生部件移位的源。
11.根据权利要求4所述的方法,还包括:
在语音监视器仍被激活的同时将所述用户设备的语音激活信息助理的至少一部分切换至省电模式;
由所述语音监视器检测所述第一预先建立的可听激活命令;以及
响应于检测到所述第一预先建立的可听激活命令,所述语音监视器激活所述语音激活信息助理以产生在所述用户设备的所述喇叭接近度内的所述第一可听应答。
12.一种用户设备,包括:
至少一个声音产生部件;
至少一个声音接收部件;
用户接口,所述用户接口包括显示器;
至少一个处理器,所述至少一个处理器被通信耦合到所述用户接口、所述至少一个声音接收部件和所述至少一个声音产生部件;
始终在线隐私模式工具,所述始终在线隐私模式工具在所述至少一个处理器上执行并且将所述用户设备配置成:
经由所述至少一个声音接收部件来检测激活所述用户设备的第一预先建立的可听激活命令;
响应于检测到所述第一预先建立的可听激活命令,经由所述至少一个声音产生部件产生在所述用户设备的喇叭接近度内的第一可听应答;
经由所述至少一个声音接收部件监视在预置时间间隔内由另一用户设备产生的至少一个第二可听应答的检测;
响应于在所述预置时间间隔内未检测到任何第二可听应答,处理并且响应所接收的可听命令;
响应于在所述预置时间间隔内检测到至少一个第二可听应答:
触发到可听命令输入的隐私模式的进入;以及
经由所述显示器和所述至少一个声音产生部件中的至少一个来产生隐私模式通告。
13.根据权利要求12所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
通过指示多个设备被检测到并且指示喇叭播放被禁用来产生隐私模式通告;以及
响应于接收到向所述用户设备的用户接口的触觉控制输入,处理并且响应随后所接收的命令。
14.根据权利要求12-13中的任一项所述的用户设备,其中,所述始终在线隐私模式工具将所述用户设备配置成处理并且响应所接收的可听命令包括所述工具将所述用户设备配置成:
测量所述可听命令的音量量值;
将所述音量量值与被预先选择以指示用户何时直接地向所述用户设备中说话的响度阈值相比较;以及
响应于所述音量量值超过所述响度阈值,处理并且响应所接收的可听命令。
15.根据权利要求12-14中的任一项所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;
接收对所述挑战的确认响应;以及
响应于所接收的确认响应被验证为被分配给所述用户设备的预先建立的确认响应,处理并且响应所接收的可听激活命令。
16.根据权利要求15所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
通过经由所述至少一个声音产生部件产生征询所述预先建立的确认响应作为在所述用户设备的所述喇叭接近度内可检测的可听响应的挑战查询来生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;
经由所述至少一个声音接收部件来接收对所产生的挑战查询的可听确认响应;以及
通过针对匹配将所接收的可听确认响应与所述预先建立的确认响应相比较来验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
17.根据权利要求16所述的用户设备,其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
通过将所接收的可听确认响应与分配给所述用户设备的特定标识符中的预先选择的一个和所述已授权用户的预先记录的名字相比较来进行验证。
18.根据权利要求15所述的用户设备,还包括:
用户接口,所述用户接口与所述至少一个处理器通信;
其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
通过经由所述至少一个声音产生部件产生在所述用户设备的喇叭接近度内可听的挑战查询来生成请求确认所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户的挑战;
接收对所述挑战的确认响应包括检测在所述用户设备的所述用户接口处的触觉用户输入;以及
基于用户在产生所述可听的挑战查询之后的第二预置时间内提供所述触觉用户输入而验证所述第一预先建立的可听激活命令源自于所述用户设备的已授权用户。
19.根据权利要求18所述的用户设备,其中:
所述触觉用户输入包括来自以下中的预先建立的触觉输入:(i)触摸屏控制的选择,(ii)按钮的致动,(iii)所述用户设备的振动的模式,以及(iv)在触摸屏上追踪至少一个符号。
20.根据权利要求15所述的用户设备,还包括:
用户接口,所述用户接口与所述至少一个处理器通信;
其中,在所述至少一个声音接收部件检测到所述第一预先建立的可听激活命令以前,所述始终在线隐私模式工具进一步将所述用户设备配置成:
接收在所述用户设备的用户接口处的控制输入以执行以下中的一个:(a)修改和(b)添加分配给所述用户设备和所述已授权用户中的一个的预先建立的确认响应;
经由所述至少一个声音接收部件从所述已授权用户接收新确认响应;以及
更新所述预先建立的确认响应以与所述新确认响应匹配。
21.根据权利要求15所述的用户设备,其中:
所述至少一个声音产生部件包括第一声音产生部件和第二声音产生部件;
所述至少一个声音接收部件包括第一声音接收部件和第二声音产生部件;以及
所述始终在线隐私模式工具进一步将所述用户设备配置成:
经由所述第一声音产生部件产生在所述用户设备的所述喇叭接近度内的所述第一可听应答;
经由所述第一声音接收部件监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;
经由所述第二声音接收部件同时地监视在所述预置时间间隔内产生的所述至少一个第二可听应答的检测;以及
基于在所述第一声音接收部件和所述第二声音接收部件两者处接收到所述第二可听应答而确定所述至少一个第二可听应答来自另一用户设备,其中响度变化和定时延迟中的至少一个指示从所述第一声音产生部件移位的源。
22.根据权利要求15所述的用户设备,还包括:
语音激活信息助理;以及
语音监视器;
其中,所述始终在线隐私模式工具进一步将所述用户设备配置成:
在语音监视器仍被激活的同时将所述用户设备的语音激活信息助理的至少一部分切换至省电模式;
由所述语音监视器检测所述第一预先建立的可听激活命令;以及
响应于检测到所述第一预先建立的可听激活命令,经由所述语音监视器激活所述语音激活信息助理以产生在所述用户设备的所述喇叭接近度内的所述第一可听应答。
CN201480034598.4A 2013-06-17 2014-06-17 用于始终在线语音激活信息辅助的隐私模式 Active CN105830015B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361835677P 2013-06-17 2013-06-17
US61/835,677 2013-06-17
US14/296,545 2014-06-05
US14/296,545 US9472206B2 (en) 2013-06-17 2014-06-05 Privacy mode for always-on voice-activated information assistant
PCT/US2014/042735 WO2014204960A1 (en) 2013-06-17 2014-06-17 Privacy mode for always-on voice-activated information assistant

Publications (2)

Publication Number Publication Date
CN105830015A true CN105830015A (zh) 2016-08-03
CN105830015B CN105830015B (zh) 2019-04-05

Family

ID=52019978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480034598.4A Active CN105830015B (zh) 2013-06-17 2014-06-17 用于始终在线语音激活信息辅助的隐私模式

Country Status (5)

Country Link
US (1) US9472206B2 (zh)
EP (1) EP3011426B1 (zh)
CN (1) CN105830015B (zh)
BR (1) BR112015031706B1 (zh)
WO (1) WO2014204960A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604177A (zh) * 2016-12-30 2018-09-28 谷歌有限责任公司 在语音激活的计算机网络环境中的序列相关数据消息整合
CN110914900A (zh) * 2017-06-02 2020-03-24 乐威指南公司 用于为若干语音操作的用户设备生成基于音量的响应的系统和方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914075B2 (en) * 2010-09-17 2014-12-16 Blackberry Limited Electronic device including actuator and method of controlling same for providing tactile output
KR102223732B1 (ko) * 2014-06-26 2021-03-05 엘지전자 주식회사 이동단말기 및 그 제어방법
JP6657769B2 (ja) * 2015-10-23 2020-03-04 株式会社Jvcケンウッド 送信装置、送信方法
EP3185202A1 (en) * 2015-12-22 2017-06-28 Orange Processing of status data in an electronic device
KR102041063B1 (ko) * 2016-02-18 2019-11-05 소니 주식회사 정보 처리 장치, 정보 처리 방법 및 프로그램
US10237268B2 (en) * 2016-11-02 2019-03-19 Google Llc Secure passcode processing device
KR102591413B1 (ko) * 2016-11-16 2023-10-19 엘지전자 주식회사 이동단말기 및 그 제어방법
US10332517B1 (en) * 2017-06-02 2019-06-25 Amazon Technologies, Inc. Privacy mode based on speaker identifier
US11222060B2 (en) 2017-06-16 2022-01-11 Hewlett-Packard Development Company, L.P. Voice assistants with graphical image responses
US10636428B2 (en) 2017-06-29 2020-04-28 Microsoft Technology Licensing, Llc Determining a target device for voice command interaction
US11100913B2 (en) 2017-11-14 2021-08-24 Thomas STACHURA Information security/privacy via a decoupled security cap to an always listening assistant device
US10867623B2 (en) 2017-11-14 2020-12-15 Thomas STACHURA Secure and private processing of gestures via video input
US10872607B2 (en) 2017-11-14 2020-12-22 Thomas STACHURA Information choice and security via a decoupled router with an always listening assistant device
US10999733B2 (en) 2017-11-14 2021-05-04 Thomas STACHURA Information security/privacy via a decoupled security accessory to an always listening device
US10867054B2 (en) 2017-11-14 2020-12-15 Thomas STACHURA Information security/privacy via a decoupled security accessory to an always listening assistant device
EP3496090A1 (en) * 2017-12-07 2019-06-12 Thomson Licensing Device and method for privacy-preserving vocal interaction
KR102447381B1 (ko) * 2017-12-08 2022-09-27 삼성전자주식회사 통화 중 인공지능 서비스를 제공하기 위한 방법 및 그 전자 장치
US11490248B2 (en) * 2017-12-14 2022-11-01 Lutron Technology Company Llc Privacy mode for a wireless audio device
US11115410B1 (en) 2018-04-20 2021-09-07 Facebook, Inc. Secure authentication for assistant systems
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US10978056B1 (en) 2018-04-20 2021-04-13 Facebook, Inc. Grammaticality classification for natural language generation in assistant systems
US11010436B1 (en) 2018-04-20 2021-05-18 Facebook, Inc. Engaging users by personalized composing-content recommendation
US11152006B2 (en) * 2018-05-07 2021-10-19 Microsoft Technology Licensing, Llc Voice identification enrollment
JP2019204025A (ja) * 2018-05-24 2019-11-28 レノボ・シンガポール・プライベート・リミテッド 電子機器、制御方法、及びプログラム
US10573320B2 (en) 2018-05-30 2020-02-25 Darren Humphrey Voice recognition communication system with privacy interrupt device and related methods
US10831923B2 (en) 2018-06-08 2020-11-10 The Toronto-Dominion Bank System, device and method for enforcing privacy during a communication session with a voice assistant
US10839811B2 (en) 2018-06-08 2020-11-17 The Toronto-Dominion Bank System, device and method for enforcing privacy during a communication session with a voice assistant
US10896295B1 (en) 2018-08-21 2021-01-19 Facebook, Inc. Providing additional information for identified named-entities for assistant systems
US10949616B1 (en) 2018-08-21 2021-03-16 Facebook, Inc. Automatically detecting and storing entity information for assistant systems
US10978063B2 (en) 2018-09-27 2021-04-13 The Toronto-Dominion Bank Systems, devices and methods for delivering audible alerts
US10922433B2 (en) 2018-11-26 2021-02-16 Wells Fargo Bank, N.A. Interrupting receipt of sensitive information
EP3921830A4 (en) 2019-02-07 2022-11-02 Thomas Stachura PRIVACY DEVICE FOR SMART SPEAKERS
US10943598B2 (en) * 2019-03-18 2021-03-09 Rovi Guides, Inc. Method and apparatus for determining periods of excessive noise for receiving smart speaker voice commands
WO2020214988A1 (en) 2019-04-17 2020-10-22 Tempus Labs Collaborative artificial intelligence method and system
US11657094B2 (en) 2019-06-28 2023-05-23 Meta Platforms Technologies, Llc Memory grounded conversational reasoning and question answering for assistant systems
US11442992B1 (en) 2019-06-28 2022-09-13 Meta Platforms Technologies, Llc Conversational reasoning with knowledge graph paths for assistant systems
EP3973413A4 (en) * 2019-08-22 2022-07-06 Samsung Electronics Co., Ltd. METHOD AND SYSTEM FOR CONTEXT ASSIGNMENT AND PERSONALIZATION USING A WAKE-UP WORD IN VIRTUAL PERSONAL ASSISTANT
US11861674B1 (en) 2019-10-18 2024-01-02 Meta Platforms Technologies, Llc Method, one or more computer-readable non-transitory storage media, and a system for generating comprehensive information for products of interest by assistant systems
US11567788B1 (en) 2019-10-18 2023-01-31 Meta Platforms, Inc. Generating proactive reminders for assistant systems
US20230037085A1 (en) * 2020-01-07 2023-02-02 Google Llc Preventing non-transient storage of assistant interaction data and/or wiping of stored assistant interaction data
US11562744B1 (en) 2020-02-13 2023-01-24 Meta Platforms Technologies, Llc Stylizing text-to-speech (TTS) voice response for assistant systems
US11159767B1 (en) 2020-04-07 2021-10-26 Facebook Technologies, Llc Proactive in-call content recommendations for assistant systems
US11658835B2 (en) 2020-06-29 2023-05-23 Meta Platforms, Inc. Using a single request for multi-person calling in assistant systems
CN116508111A (zh) * 2020-12-17 2023-07-28 深圳迈瑞生物医疗电子股份有限公司 工作模式的控制方法、监护设备、监护系统及可读存储介质
US11563706B2 (en) 2020-12-29 2023-01-24 Meta Platforms, Inc. Generating context-aware rendering of media contents for assistant systems
US11809480B1 (en) 2020-12-31 2023-11-07 Meta Platforms, Inc. Generating dynamic knowledge graph of media contents for assistant systems
US12118790B2 (en) 2021-04-21 2024-10-15 Meta Platforms, Inc. Auto-capture of interesting moments by assistant systems
US11861315B2 (en) 2021-04-21 2024-01-02 Meta Platforms, Inc. Continuous learning for natural-language understanding models for assistant systems
US20230077780A1 (en) * 2021-09-16 2023-03-16 International Business Machines Corporation Audio command corroboration and approval
US12045568B1 (en) 2021-11-12 2024-07-23 Meta Platforms, Inc. Span pointer networks for non-autoregressive task-oriented semantic parsing for assistant systems
US20230276260A1 (en) * 2022-02-28 2023-08-31 Qualcomm Incorporated Dynamic adaptation of broadcast transmissions for network energy savings
US11983329B1 (en) 2022-12-05 2024-05-14 Meta Platforms, Inc. Detecting head gestures using inertial measurement unit signals
US12112001B1 (en) 2023-03-14 2024-10-08 Meta Platforms, Inc. Preventing false activations based on don/doff detection for assistant systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193989A1 (en) * 1999-05-21 2002-12-19 Michael Geilhufe Method and apparatus for identifying voice controlled devices
CN102668527A (zh) * 2009-12-23 2012-09-12 摩托罗拉移动公司 可配置用于静默模式和静默模式的例外的方法和通信设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6219745B1 (en) 1998-04-15 2001-04-17 Advanced Micro Devices, Inc. System and method for entering a stream read buffer mode to store non-cacheable or block data
EP1063636A3 (en) 1999-05-21 2001-11-14 Winbond Electronics Corporation Method and apparatus for standard voice user interface and voice controlled devices
US6219645B1 (en) 1999-12-02 2001-04-17 Lucent Technologies, Inc. Enhanced automatic speech recognition using multiple directional microphones
US6662137B2 (en) 2000-12-19 2003-12-09 Hewlett-Packard Development Company, L.P. Device location discovery by sound
US8611919B2 (en) * 2002-05-23 2013-12-17 Wounder Gmbh., Llc System, method, and computer program product for providing location based services and mobile e-commerce
NZ545093A (en) * 2003-07-14 2007-07-27 Orative Corp System and method for active mobile collaboration
US7158026B2 (en) * 2004-02-06 2007-01-02 @Security Broadband Corp. Security system configured to provide video and/or audio information to public or private safety personnel at a call center or other fixed or mobile emergency assistance unit
US20060176167A1 (en) * 2005-01-25 2006-08-10 Laser Shield Systems, Inc. Apparatus, system, and method for alarm systems
US8275404B2 (en) * 2008-10-29 2012-09-25 Google Inc. Managing and monitoring emergency services sector resources
US9953643B2 (en) * 2010-12-23 2018-04-24 Lenovo (Singapore) Pte. Ltd. Selective transmission of voice data
US8751971B2 (en) * 2011-06-05 2014-06-10 Apple Inc. Devices, methods, and graphical user interfaces for providing accessibility using a touch-sensitive surface
US8340975B1 (en) 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193989A1 (en) * 1999-05-21 2002-12-19 Michael Geilhufe Method and apparatus for identifying voice controlled devices
CN102668527A (zh) * 2009-12-23 2012-09-12 摩托罗拉移动公司 可配置用于静默模式和静默模式的例外的方法和通信设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108604177A (zh) * 2016-12-30 2018-09-28 谷歌有限责任公司 在语音激活的计算机网络环境中的序列相关数据消息整合
CN108604177B (zh) * 2016-12-30 2021-06-25 谷歌有限责任公司 用于序列相关数据消息整合的系统和方法
CN110914900A (zh) * 2017-06-02 2020-03-24 乐威指南公司 用于为若干语音操作的用户设备生成基于音量的响应的系统和方法
CN110914900B (zh) * 2017-06-02 2024-04-02 乐威指南公司 用于为若干语音操作的用户设备生成基于音量的响应的系统和方法

Also Published As

Publication number Publication date
CN105830015B (zh) 2019-04-05
US9472206B2 (en) 2016-10-18
BR112015031706A2 (pt) 2017-07-25
BR112015031706B1 (pt) 2022-05-10
US20140372126A1 (en) 2014-12-18
EP3011426A1 (en) 2016-04-27
WO2014204960A1 (en) 2014-12-24
EP3011426B1 (en) 2020-01-01

Similar Documents

Publication Publication Date Title
CN105830015A (zh) 用于始终在线语音激活信息辅助的隐私模式
US20150178878A1 (en) Information processing method, apparatus and payment system
CN104360653B (zh) 故障排除方法和装置
CN104780155B (zh) 设备绑定方法及装置
KR20190051368A (ko) 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법
CN105100484B (zh) 一种结束语音通话的方法、装置和系统
CN104580730B (zh) 闹钟提醒方法及装置
CN104144093A (zh) 一种智能设备控制方法及相关设备、系统
JP2005502246A5 (zh)
KR20110028056A (ko) 블루투스 통신 연결 방법 및 시스템
CN103748863A (zh) 用于无线网络访问的附件的配置
CN103929835A (zh) 闹钟振铃的控制方法、装置和系统
CN107222391A (zh) 群组提醒方法、装置及设备
CN103873655A (zh) 移动终端防盗系统及方法
CN109901698B (zh) 一种智能交互方法、可穿戴设备和终端以及系统
CN105357368A (zh) 提醒方法及装置
CN107592629A (zh) 设备控制方法及装置
CN111417929A (zh) 界面显示方法及控制终端
US7312701B2 (en) Method and system for environment detection
CN110970023A (zh) 语音设备的控制装置、语音交互方法、装置及电子设备
CN107846646A (zh) 智能音箱的控制方法、装置及可读存储介质
CN103402015B (zh) 一种控制用户终端应用的方法及用户终端
CN106157583B (zh) 一种建立无线连接的方法及装置
CN106292247A (zh) 用于关闭电子设备中闹钟的方法、装置、系统及其设备
JP6558912B2 (ja) 音声ペアリング

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant