CN108073275A - 信息处理方法、信息处理设备及程序产品 - Google Patents
信息处理方法、信息处理设备及程序产品 Download PDFInfo
- Publication number
- CN108073275A CN108073275A CN201710841338.3A CN201710841338A CN108073275A CN 108073275 A CN108073275 A CN 108073275A CN 201710841338 A CN201710841338 A CN 201710841338A CN 108073275 A CN108073275 A CN 108073275A
- Authority
- CN
- China
- Prior art keywords
- context
- session
- input
- duration
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000004044 response Effects 0.000 claims abstract description 15
- 230000000977 initiatory effect Effects 0.000 claims abstract description 11
- 230000009471 action Effects 0.000 claims description 19
- 230000002618 waking effect Effects 0.000 claims description 4
- 230000015654 memory Effects 0.000 description 18
- 210000004080 milk Anatomy 0.000 description 8
- 239000008267 milk Substances 0.000 description 7
- 235000013336 milk Nutrition 0.000 description 7
- 235000008429 bread Nutrition 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 231100000691 up-and-down procedure Toxicity 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/10—Small scale networks; Flat hierarchical networks
- H04W84/12—WLAN [Wireless Local Area Networks]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W88/00—Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
- H04W88/02—Terminal devices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
公开了信息处理方法、信息处理设备及程序产品。本申请的一个实施方式提供了一种方法,所述方法包括:在信息处理设备处接收用于发起与上下文相关联的上下文会话的指示;在设备处在上下文会话的持续时间期间接收至少一个上下文输入;以及响应于接收到所述至少一个上下文输入来延长上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。描述并且要求保护了其他方面。
Description
技术领域
本发明总体上涉及信息处理方法、信息处理设备及程序产品,尤其涉及发起上下文输入会话的方法、设备及程序产品。
背景技术
信息处理设备(“设备”)例如智能电话、平板设备、膝上型计算机、智能扬声器等可以使用能够处理可听命令的语音激活的数字助理(“数字助理”)。响应于识别到由用户提供的可听命令,数字助理可以执行对应的任务。
发明内容
总括地说,一方面提供了一种信息处理方法,该方法包括:在信息处理设备处接收用于发起与上下文相关联的上下文会话的指示;在该设备处在上下文会话的持续时间期间接收至少一个上下文输入;以及响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
另一方面提供了一种信息处理设备,该信息处理设备包括:处理器;存储器设备,该存储器设备存储能够由处理器执行以进行以下操作的指令:接收用于发起与上下文相关联的上下文会话的指示;在上下文会话的持续时间期间接收至少一个上下文输入;以及响应于接收到所述至少一个上下文输入来延长上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
再一方面提供了一种程序产品,该程序产品包括:存储代码的存储设备,所述代码能够由处理器执行并且所述代码包括:用于接收用于发起与上下文相关联的上下文会话的指示的代码;用于在上下文会话的持续时间期间接收至少一个上下文输入的代码;以及用于响应于接收到所述至少一个上下文输入来延长上下文会话的持续时间的代码,其中,经延长的持续时间不要求接收后续的指示。
前述是概要,并且因此可以包含简化、概括和细节省略;因此,本领域的技术人员将理解的是,该概要仅是说明性的并且不旨在以任何方式进行限制。
为了更好地理解实施方式连同实施方式的其他的以及进一步的特征和优点,参考以下结合附图的描述。将在所附权利要求中指出本发明的范围。
附图说明
图1示出了信息处理设备电路系统的示例。
图2示出了信息处理设备电路系统的另一示例。
图3示出了发起上下文输入会话的示例性方法。
具体实施方式
将容易地理解的是,除所描述的示例性实施方式以外,还可以以多种不同的配置来布置和设计如在本文附图中一般性地描述并示出的实施方式的部件。因此,以下如在附图中示出的示例性实施方式的更详细的描述不旨在限制所要求保护的实施方式的范围,而仅代表示例性实施方式。
贯穿本说明书,对“一个实施方式”或“实施方式”等的引用意味着结合实施方式所描述的特定特征、结构或特性包括在至少一个实施方式中。因此,贯穿本说明书,在各处所出现的短语“在一个实施方式中”或“在实施方式中”等未必都指同一实施方式。
此外,在一个或更多个实施方式中,所描述的特征、结构或特性可以以任何合适的方式进行组合。在下面的描述中,提供了许多具体的细节以给出对实施方式的透彻的理解。然而,相关领域的技术人员将认识到可以在没有一个或更多个具体细节的情况下或者利用其他的方法、部件、材料等,对各种实施方式进行实践。在其他实例中,不再详细地示出或描述公知的结构、材料或操作以避免模糊主题。
按照惯例,设备上所采用的数字助理软件(例如的 的的等)可以识别由用户提供的语音命令(例如通过与可访问的命令库进行比较)、将该命令与对应的任务相关联并且之后采取行动以完成任务。例如,用户可以命令数字助理创建购物清单。在识别到该命令之后,数字助理可以进入“对话模式”,在该对话模式中,数字助理等待接收之后的语音输入(例如与要放置在清单上的项目相关的语音输入),然后在接收到语音输入时就将这些输入存储在可访问的存储位置处。
数字助理可以有益于期望对设备进行免提语音控制的用户。可以采用数字助理的常见情况包括:当用户正在驾驶时;当用户在身体上预先忙于另一任务时;或者当用户确定语音命令可以是完成任务的更快且更方便的方式时。
然而,常规的数字助理包含与语音输入的接收和处理有关的若干问题。例如,一个问题是每次必须在用户希望提供语音命令之前向数字助理提供“唤醒词”。该唤醒词向数字助理指示将要接收数字助理应该处理的语音输入。例如,如果唤醒词是“助理”,则在创建购物清单时,每次用户想要向清单添加新项目时,用户都需要重复该词(例如“助理,将牛奶添加至清单”、“助理,将面包添加至清单”等)。必需重复的唤醒词可能会令用户感到恼火和繁琐。此外,如果用户在提供语音命令之前忘记传达唤醒词,则数字助理不会将该命令识别为数字助理应该处理的输入。例如,当创建购物清单时,如果用户仅说出“添加牛奶”,则数字助理无法识别其应该将牛奶项目添加至购物清单。
因此,实施方式提供了一种发起上下文输入会话的方法,其中,数字助理能够在上下文会话的持续时间期间接收和处理语音上下文输入。在实施方式中,数字助理可以接收用于发起与特定上下文(例如新闻、电子邮件、体育等)有关的上下文会话的指示(例如继之以上下文命令的唤醒动作)。上下文会话的持续时间可以无限地持续或者持续直到发生中断(例如结束当前会话的指示、进入不同会话的指示等)为止。在会话期间,与上下文相关联的语音命令可以被数字助理接收和处理。这样的方法使得用户能够将大量的命令传达给数字助理,而不必在每个命令之前重复唤醒词或唤醒姿势。
通过参考附图将最好地理解所示出的示例性实施方式。下面的描述仅旨在通过示例的方式示出,并且仅示出了某些示例性实施方式。
虽然在信息处理设备中可以利用各种其他电路、电路系统或部件,但是对于智能电话和/或平板计算机电路系统100而言,图1所示的示例包括例如在平板计算机或其他移动计算平台中发现的芯片上系统设计。在单个芯片110中组合有软件和处理器。如本领域公知的,处理器包括内部运算单元、寄存器、高速缓存存储器、总线、I/O端口等。内部总线等取决于不同的供应商,但基本上所有外围设备120可以附接至单个芯片110。电路系统100将处理器、存储器控制器以及I/O控制器集线器全部组合到单个芯片110中。此外,这种类型的系统100通常不使用SATA或PCI或LPC。公共接口例如包括SDIO和I2C。
存在电源管理芯片130例如电池管理单元BMU,该电池管理单元BMU对例如经由可充电电池140供应的电力进行管理,可以通过与电源(未示出)的连接来对可充电电池140进行再充电。在至少一种设计中,使用单个芯片例如110来提供BIOS式功能和DRAM存储器。
系统100通常包括以下中的一个或更多个:用于与各种网络例如电信网络和无线因特网设备例如接入点连接的WWAN收发器150和WLAN收发器160。此外,设备120通常包括例如诸如相机的图像传感器。系统100通常包括用于数据输入以及显示/呈现的触摸屏170。系统100通常还包括各种存储器设备,例如闪速存储器180和SDRAM 190。
图2示出了信息处理设备电路、电路系统或部件的另一示例的框图。图2所示的示例可以与例如由Morrisville,NC(北卡罗来纳州的莫里斯维尔市)的联想(美国)公司销售的THINKPAD系列个人计算机的计算系统或其他设备对应。根据本文的描述明显的是,实施方式可以包括其他特征或图2中示出的示例的仅一些特征。
图2的示例包括具有会根据制造商(例如INTEL、AMD、ARM等)而变化的架构的所谓的芯片组210(一组一起工作的集成电路或芯片,芯片组)。INTEL是英特尔公司在美国和其他国家的注册商标。AMD是超微半导体设备有限公司(Advanced Micro Device Inc.)在美国和其他国家的注册商标。ARM是ARM控股公司(ARM Holding plc)在美国和其他国家的未注册商标。芯片组210的架构包括核与存储器控制组220以及I/O控制器集线器250,所述核与存储器控制组220以及I/O控制器集线器250经由直接管理接口(DMI)242或链路控制器244交换信息(例如数据、信号、命令等)。在图2中,DMI 242是芯片到芯片接口(有时被称为是“北桥”与“南桥”之间的链路)。核与存储器控制组220包括经由前端总线(FSB)224交换信息的存储器控制器集线器226和一个或更多个处理器222(例如单核或多核);应该注意,组220的部件可以被集成到代替常规的“北桥”式架构的芯片中。如本领域公知的,一个或更多个处理器222包括内部运算单元、寄存器、高速缓存存储器、总线、I/O端口等。
在图2中,存储器控制器集线器226与存储器240对接(例如为可以被称为“系统存储器”或“存储器”的RAM类型提供支持)。存储器控制器集线器226还包括用于显示装置292(例如CRT、平板、触摸屏等)的低压差分信号发送(LVDS)接口232。块238包括可以经由LVDS接口232(例如串行数字视频、HDMI/DVI、显示端口)来支持的一些技术。存储器控制器集线器226还包括可以支持独立显卡236的PCI-express接口(PCI-E)234。
在图2中,I/O集线器控制器250包括:SATA接口251(例如,用于HDD、SDD等280)、PCI-E接口252(例如用于无线连接282)、USB接口253(例如用于设备284例如数字转换器、键盘、鼠标、相机、电话、麦克风、存储装置、其他连接设备等)、网络接口254(例如LAN)、GPIO接口255、LPC接口270(用于ASIC 271、TPM 272、超级I/O 273、固件集线器274、BIOS支持275以及各种类型的存储器276例如ROM 277、闪存278和NVRAM 279)、电源管理接口261、时钟发生器接口262、音频接口263(例如用于扬声器294)、TCO接口264、系统管理总线接口265以及可以包括BIOS 268和启动代码290的SPI闪存266。I/O集线器控制器250可以包括千兆以太网支持。
系统在通电时可以被配置成执行如在SPI闪存266内所存储的用于BIOS 268的启动代码290,并且此后在一个或更多个操作系统和应用软件(例如存储在系统存储器240中的)的控制下处理数据。操作系统可以存储在各种位置中的任意位置中并且例如根据BIOS268的指令来访问。如本文中所描述的,设备可以包括比图2的系统中所示的特征更少或更多的特征。
如例如图1或图2中所概述的,信息处理设备电路系统可以用于使得用户能够与数字助理进行通信的设备例如平板计算机、智能电话、智能扬声器、通常的个人计算机设备以及电子设备中。例如,图1中所概述的电路系统可以在平板计算机或智能电话实施方式中实现,而图2中所概述的电路系统可以在个人计算机实施方式中实现。
现在参考图3,实施方式可以发起上下文输入会话,在该上下文输入会话期间,实施方式可以接收上下文输入并且可以执行与上下文输入相关联的任务。在301处,实施方式可以接收用于发起上下文会话的指示。例如,该指示可以是继之以上下文命令的用户传达的唤醒动作例如唤醒词或唤醒姿势(例如手部挥动)。上下文命令可以触发数字助理发起上下文会话,在该上下文会话中,之后的用户输入可以与上下文命令的上下文或主题相关。例如,当实施方式接收到继之以上下文命令“读取电子邮件”的唤醒动作时,实施方式可以发起与电子邮件浏览相关的上下文会话。
实施方式可以通过将上下文命令与可识别上下文的可访问存储库进行比较来从上下文命令中识别特定上下文。在另一实施方式中,上下文可以通过用户当前从事的活动来确定。在实施方式中,数字助理可以连接至另一设备(例如电视机、收音机等)或者与另一应用同步(例如视频播放应用、音乐播放应用等)并且数字助理能够根据正在运行的应用或设备来确定上下文。例如,如果用户正在观看智能电视上的电视节目,则数字助理可以识别电视节目观看会话正在运行,并且知道接受与电视节目观看相关的上下文输入(例如“列出体育频道”)。
在302处,实施方式可以接收与上下文会话的上下文相关联的上下文输入。在实施方式中,在上下文会话的持续时间期间,用户不需要在传达上下文输入之前重复唤醒动作。例如,对于与电子邮件浏览相关的上下文会话而言,用户可以提供电子邮件相关命令,例如“帮我读这封电子邮件”、“存档这封电子邮件”、“删除该消息”等。在另一示例中,对于与创建购物清单相关的上下文会话而言,用户可以以语音的方式列出用户希望添加到清单中的项目,例如“添加牛奶”、“添加面包”、“添加奶酪”等。在又一示例中,对于与音乐相关联的上下文会话而言,用户可以以语音的方式列出用户希望收听的歌曲或艺术家。
在实施方式中,可以利用眼睛跟踪软件来确定用户是否真正意图将输入传送给数字助理。例如,如果实施方式确定(例如基于眼睛跟踪)用户在发送语音输入时正在看数字助理或与数字助理关联的特定设备,则数字助理可以确定语音通信应被视为上下文输入。
在实施方式中,可以从多个用户接收上下文输入。例如,在购物清单上下文会话期间,数字助理可以从一个用户接收向清单添加牛奶的命令并且可以从不同的用户接收向清单添加面包的另一命令。在实施方式中,多个上下文会话可以同时运行,其中,每个上下文会话与单独的上下文相关。例如,在与购物清单的创建相关联的上下文会话的持续时间期间,实施方式还可以接收与电子邮件浏览相关联的上下文会话的上下文输入。可以例如通过与会话的上下文相关联的单独的唤醒动作来发起每个上下文会话。在实施方式中,多个上下文会话可以同时运行,其中,每个上下文会话可以从特定用户接收上下文输入。例如,两个用户可以发起单独的上下文会话并且向这些会话提供上下文输入,其中,基于用户的特征来区分输入。实施方式可以基于例如用户的语音识别来区分输入。
在实施方式中,上下文输入可以由数字助理接收直到出现上下文对话的中断为止。在实施方式中,中断可以是用于结束上下文会话的命令。例如,在购物清单上下文会话期间,用户可以提供语音命令“结束购物清单”,该语音命令向数字助理提供结束会话的指示。在另一实施方式中,中断可以是用于开始另一上下文会话的命令,由此原始上下文会话被临时暂停并且在其他会话运行期间不识别与该原始会话相关联的输入。例如,在购物清单上下文会话期间,用户可以发起电子邮件浏览上下文会话,在该电子邮件浏览上下文会话期间不识别与购物清单相关联的上下文输入(例如添加牛奶、添加面包等)。在实施方式中,可以向用户提供上下文会话已经结束的通知。
响应于在303处识别到所接收到的上下文输入,实施方式可以在304处执行与该输入相关联的动作。在实施方式中,数字助理可以访问响应于特定输入指示应该执行的动作类型的指令。例如,在购物清单上下文会话中,响应于接收到输入“添加牛奶”或“牛奶”,实施方式可以将牛奶添加至购物清单上的项目清单中。在实施方式中,指令可以本地存储在设备上或者可以存储在可访问的远程存储位置(例如云)中。
在305处,响应于无法识别所接收到的上下文输入,实施方式可以忽略上下文输入。实施方式可能由于各种原因而无法识别所接收到的上下文输入。例如,所接收到的输入与当前上下文会话不相关联(例如在购物清单上下文会话期间,实施方式可能接收到与电子邮件浏览相关联的命令)。在另一示例中,在上下文会话的持续时间期间,用户可能会产生用户并非意在让数字助理处理的无法识别的语音输出(例如用户正在与另一人说话)。在306处,实施方式可以向用户提供无法识别所接收到的输入的通知。在实施方式中,通知可以是可听通知,其中,设备可以以语音的方式通知用户无法识别用户输入。在另一实施方式中,通知可以是视觉通知。例如,可以在设备的屏幕上显示文本消息以通知用户无法识别用户输入。
因此,本文中所描述的各种实施方式表示关于数字助理的常规传达的技术改进。通过使用本文中所描述的技术,用户能够使用数字助理进入上下文的“对话模式”,这使得更容易与数字助理进行对话。实施方式发起上下文会话,在该上下文会话中,用户可以向数字助理发送上下文输入,而不需要在每次发送之前重复唤醒动作。
如本领域的技术人员将理解的是,各方面可以实施为系统、方法或设备程序产品。因此,各方面可以采用完全硬件实施方式的形式或采用包括软件的实施方式的形式,以上在本文中可以全部统称为“电路”、“模块”或“系统”。此外,各方面可以采用设备程序产品的形式,该设备程序产品具体表现为包括有设备可读程序代码的一个或更多个设备可读介质。
应当注意,可以使用由处理器执行的存储在设备可读存储介质例如非信号存储设备上的指令来实施本文中所描述的各种功能。存储设备可以是例如电子系统、磁系统、光学系统、电磁系统、红外系统或半导体系统、装置或设备、或者前述的任意适当的组合。存储介质的更具体的示例可以包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式致密盘只读存储器(CD-ROM)、光存储设备、磁存储设备,或前述的任意适当的组合。在本文件的上下文中,存储设备不是信号,并且“非暂态”包括除信号介质之外的所有介质。
可以使用任何适当的介质来传输在存储介质上所包含的程序代码,所述任何适当的介质包括但不限于无线、有线、光缆、RF等或前述的任意适当的组合。
用于执行操作的程序代码可以以一种或更多种编程语言的任何组合来编写。程序代码可以完全在单个设备上执行、部分地在单个设备上执行、作为独立软件包执行、部分地在单个设备上且部分地在另一设备上执行或者完全在其他设备上执行。在一些情况下,可以通过任何类型的连接或网络(包括局域网(LAN)或广域网(WAN))来连接设备,或者可以通过其他设备(例如通过使用因特网服务提供商的因特网)、通过无线连接例如近场通信、或者通过硬线连接例如通过USB连接来进行连接。
本文中参考示出了根据各种示例性实施方式的示例性方法、设备和程序产品的附图来描述示例性实施方式。应当理解的是,动作和功能可以至少部分地由程序指令来实现。可以将这些程序指令提供给设备、专用信息处理设备或其他可编程数据处理设备的处理器以产生机器指令,使得经由设备的处理器执行的指令实现指定的功能/动作。
值得注意的是,虽然在附图中使用了特定的块,并且已经示出了块的特定顺序,但这些都是非限制性的示例。因为明确说明的示例仅用于描述的目的,而不应被视为限制,所以在某些情况下,可以组合两个或更多个块,可以将块分成两个或更多个块,或者可以按需要将某些块重新排序或重新组织。
如本文中所使用,除非另外明确指出,否则单数可以被解释为包括复数“一个或更多个”。
给出本公开内容是为了说明和描述的目的,而非旨在是穷举或限制。对本领域普通技术人员来说,许多修改和变化将是明显的。选择并描述示例性实施方式是为了说明原理和实际应用,并且使本领域其他普通技术人员能够理解本公开内容的与预期的特定使用相称的具有多种修改的多种实施方式。
因此,尽管本文参考附图已经描述了说明性的示例性实施方式,但应该理解的是,该描述不是限制性的,并且在不偏离本公开内容的范围或精神的情况下,本领域技术人员可以作出各种其他变化和修改。
本公开内容还可以通过以下方案来实现。
方案1.一种信息处理方法,包括:
在信息处理设备处接收用于发起与上下文相关联的上下文会话的指示;
在所述设备处在所述上下文会话的持续时间期间接收至少一个上下文输入;以及
响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
方案2.根据方案1所述的方法,其中,所述指示包括唤醒动作和上下文命令,其中,所述唤醒动作包括唤醒词或唤醒姿势中的至少一个。
方案3.根据方案2所述的方法,其中,基于所述上下文命令来确定所述上下文会话的上下文。
方案4.根据方案1所述的方法,其中,基于与所述信息处理设备相关联的应用的上下文来确定所述上下文会话的上下文。
方案5.根据方案1所述的方法,其中,所述至少一个上下文输入与所述上下文相关联。
方案6.根据方案1所述的方法,其中,所述持续时间持续直到检测到中断为止。
方案7.根据方案6所述的方法,其中,所述中断为选自以下中的至少一个中断:用于结束所述上下文会话的命令;以及用于开始另一上下文会话的命令。
方案8.根据方案1所述的方法,其中,所述接收还包括从多个用户接收所述至少一个上下文输入。
方案9.根据方案1所述的方法,还包括基于眼睛跟踪来确定要发送所述至少一个上下文输入的意图。
方案10.根据方案1所述的方法,还包括响应于无法识别所述至少一个上下文输入来提供通知。
方案11.根据方案1所述的方法,还包括使用处理器执行与所述上下文输入相关联的动作。
方案12.一种信息处理设备,包括:
处理器;
存储器设备,所述存储器设备存储能够由所述处理器执行以进行以下操作的指令:
接收用于发起与上下文相关联的上下文会话的指示;
在所述上下文会话的持续时间期间接收至少一个上下文输入;以及
响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
方案13.根据方案12所述的信息处理设备,其中,所述指示包括唤醒动作和上下文命令,其中,所述唤醒动作包括唤醒词或唤醒姿势中的至少一个。
方案14.根据方案13所述的信息处理设备,其中,基于所述上下文命令来确定所述上下文会话的上下文。
方案15.根据方案12所述的信息处理设备,其中,基于与所述信息处理设备相关联的应用的上下文来确定所述上下文会话的上下文。
方案16.根据方案12所述的信息处理设备,其中,所述至少一个上下文输入与所述上下文相关联。
方案17.根据方案12所述的信息处理设备,其中,所述持续时间持续直到检测到中断为止。
方案18.根据方案17所述的信息处理设备,其中,所述中断为选自以下中的至少一个中断:用于结束所述上下文会话的命令;以及用于开始另一上下文会话的命令。
方案19.根据方案12所述的信息处理设备,其中,从多个用户接收所述至少一个上下文输入。
方案20.根据方案12所述的信息处理设备,其中,所述指令能够由所述处理器执行以基于眼睛跟踪来确定要发送所述至少一个上下文输入的意图。
方案21.根据方案12所述的信息处理设备,其中,所述指令能够由所述处理器执行以执行与所述上下文输入相关联的动作。
方案22.一种程序产品,包括:
存储代码的存储设备,所述代码能够由处理器执行并且所述代码包括:
用于接收用于发起与上下文相关联的上下文会话的指示的代码;
用于在所述上下文会话的持续时间期间接收至少一个上下文输入的代码;以及
用于响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间的代码,其中,经延长的持续时间不要求接收后续的指示。
Claims (10)
1.一种信息处理方法,包括:
在信息处理设备处接收用于发起与上下文相关联的上下文会话的指示;
在所述设备处在所述上下文会话的持续时间期间接收至少一个上下文输入;以及
响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
2.根据权利要求1所述的方法,其中,所述指示包括唤醒动作和上下文命令,其中,所述唤醒动作包括唤醒词或唤醒姿势中的至少一个。
3.根据权利要求2所述的方法,其中,基于所述上下文命令来确定所述上下文会话的上下文。
4.根据权利要求1所述的方法,其中,基于与所述信息处理设备相关联的应用的上下文来确定所述上下文会话的上下文。
5.根据权利要求1所述的方法,其中,所述至少一个上下文输入与所述上下文相关联。
6.根据权利要求1所述的方法,其中,所述持续时间持续直到检测到中断为止。
7.根据权利要求1所述的方法,其中,所述接收还包括从多个用户接收所述至少一个上下文输入。
8.根据权利要求1所述的方法,还包括基于眼睛跟踪来确定要发送所述至少一个上下文输入的意图。
9.一种信息处理设备,包括:
处理器;
存储器设备,所述存储器设备存储能够由所述处理器执行以进行以下操作的指令:
接收用于发起与上下文相关联的上下文会话的指示;
在所述上下文会话的持续时间期间接收至少一个上下文输入;以及
响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间,其中,经延长的持续时间不要求接收后续的指示。
10.一种程序产品,包括:
存储代码的存储设备,所述代码能够由处理器执行并且所述代码包括:
用于接收用于发起与上下文相关联的上下文会话的指示的代码;
用于在所述上下文会话的持续时间期间接收至少一个上下文输入的代码;以及
用于响应于接收到所述至少一个上下文输入来延长所述上下文会话的持续时间的代码,其中,经延长的持续时间不要求接收后续的指示。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/355,758 | 2016-11-18 | ||
US15/355,758 US10880378B2 (en) | 2016-11-18 | 2016-11-18 | Contextual conversation mode for digital assistant |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108073275A true CN108073275A (zh) | 2018-05-25 |
CN108073275B CN108073275B (zh) | 2021-09-07 |
Family
ID=60320674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710841338.3A Active CN108073275B (zh) | 2016-11-18 | 2017-09-18 | 信息处理方法、信息处理设备及程序产品 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10880378B2 (zh) |
EP (1) | EP3324289B1 (zh) |
CN (1) | CN108073275B (zh) |
DE (1) | DE102017126306A1 (zh) |
GB (1) | GB2558397A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658925A (zh) * | 2018-11-28 | 2019-04-19 | 上海蔚来汽车有限公司 | 一种基于上下文的免唤醒车载语音对话方法及系统 |
CN112243526A (zh) * | 2018-06-05 | 2021-01-19 | 三星电子株式会社 | 语音辅助设备及其方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11250844B2 (en) * | 2017-04-12 | 2022-02-15 | Soundhound, Inc. | Managing agent engagement in a man-machine dialog |
CN110444210B (zh) * | 2018-10-25 | 2022-02-08 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法、唤醒词检测的方法及装置 |
CN112133296B (zh) * | 2020-08-27 | 2024-05-21 | 北京小米移动软件有限公司 | 全双工语音控制方法、装置、存储介质及语音设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102447786A (zh) * | 2011-11-14 | 2012-05-09 | 候万春 | 一种个人专用生活协助装置和方法 |
US20140032634A1 (en) * | 2008-11-15 | 2014-01-30 | Adobe Systems Incorporated | Session aware notifications |
EP2784774A1 (en) * | 2013-03-29 | 2014-10-01 | Orange | Telephone voice personnal assistant |
CN104335560A (zh) * | 2012-06-08 | 2015-02-04 | 苹果公司 | 将数据从自动化助理传输至附件 |
CN104505093A (zh) * | 2014-12-16 | 2015-04-08 | 佛山市顺德区美的电热电器制造有限公司 | 家用电器及其语音交互方法 |
CN104813311A (zh) * | 2012-12-11 | 2015-07-29 | 纽昂斯通讯公司 | 用于多人的虚拟代理推荐的系统和方法 |
US20150289023A1 (en) * | 2014-04-07 | 2015-10-08 | Spotify Ab | System and method for providing watch-now functionality in a media content environment |
CN105320726A (zh) * | 2014-05-30 | 2016-02-10 | 苹果公司 | 降低对手动开始/结束点和触发短语的需求 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140032483A1 (en) * | 2008-11-15 | 2014-01-30 | Adobe Systems Incorporated | Asset distribution architecture and timeline history |
US20140032627A1 (en) * | 2008-11-15 | 2014-01-30 | Adobe Systems Incorporated | Participant and proximity awareness application |
EP2379076B1 (en) * | 2008-12-23 | 2014-11-12 | The Trustees of Columbia University in the City of New York | Phosphodiesterase inhibitors and uses thereof |
US8676937B2 (en) * | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
US9423870B2 (en) | 2012-05-08 | 2016-08-23 | Google Inc. | Input determination method |
US20140122086A1 (en) | 2012-10-26 | 2014-05-01 | Microsoft Corporation | Augmenting speech recognition with depth imaging |
CN111427534B (zh) * | 2014-12-11 | 2023-07-25 | 微软技术许可有限责任公司 | 能够实现可动作的消息传送的虚拟助理系统 |
US11423420B2 (en) * | 2015-02-06 | 2022-08-23 | The Nielsen Company (Us), Llc | Methods and apparatus to credit media presentations for online media distributions |
EP3357205B1 (en) * | 2015-09-28 | 2022-01-05 | Microsoft Technology Licensing, LLC | User assistant for unified messaging platform |
US9961205B1 (en) * | 2016-06-21 | 2018-05-01 | Avaya Inc. | Mobility bonding network |
US20180122372A1 (en) * | 2016-10-31 | 2018-05-03 | Soundhound, Inc. | Distinguishable open sounds |
US20180131810A1 (en) * | 2016-11-04 | 2018-05-10 | T-Mobile, Usa, Inc. | Machine learning-based customer care routing |
-
2016
- 2016-11-18 US US15/355,758 patent/US10880378B2/en active Active
-
2017
- 2017-09-18 CN CN201710841338.3A patent/CN108073275B/zh active Active
- 2017-11-09 DE DE102017126306.3A patent/DE102017126306A1/de active Pending
- 2017-11-09 GB GB1718539.8A patent/GB2558397A/en not_active Withdrawn
- 2017-11-09 EP EP17200899.7A patent/EP3324289B1/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140032634A1 (en) * | 2008-11-15 | 2014-01-30 | Adobe Systems Incorporated | Session aware notifications |
CN102447786A (zh) * | 2011-11-14 | 2012-05-09 | 候万春 | 一种个人专用生活协助装置和方法 |
CN104335560A (zh) * | 2012-06-08 | 2015-02-04 | 苹果公司 | 将数据从自动化助理传输至附件 |
CN104813311A (zh) * | 2012-12-11 | 2015-07-29 | 纽昂斯通讯公司 | 用于多人的虚拟代理推荐的系统和方法 |
EP2784774A1 (en) * | 2013-03-29 | 2014-10-01 | Orange | Telephone voice personnal assistant |
US20150289023A1 (en) * | 2014-04-07 | 2015-10-08 | Spotify Ab | System and method for providing watch-now functionality in a media content environment |
CN105320726A (zh) * | 2014-05-30 | 2016-02-10 | 苹果公司 | 降低对手动开始/结束点和触发短语的需求 |
CN104505093A (zh) * | 2014-12-16 | 2015-04-08 | 佛山市顺德区美的电热电器制造有限公司 | 家用电器及其语音交互方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112243526A (zh) * | 2018-06-05 | 2021-01-19 | 三星电子株式会社 | 语音辅助设备及其方法 |
CN109658925A (zh) * | 2018-11-28 | 2019-04-19 | 上海蔚来汽车有限公司 | 一种基于上下文的免唤醒车载语音对话方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
EP3324289B1 (en) | 2020-01-08 |
US20180146048A1 (en) | 2018-05-24 |
DE102017126306A1 (de) | 2018-05-24 |
EP3324289A1 (en) | 2018-05-23 |
US10880378B2 (en) | 2020-12-29 |
GB201718539D0 (en) | 2017-12-27 |
CN108073275B (zh) | 2021-09-07 |
GB2558397A (en) | 2018-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10796693B2 (en) | Modifying input based on determined characteristics | |
US9940929B2 (en) | Extending the period of voice recognition | |
US10204624B1 (en) | False positive wake word | |
US10228904B2 (en) | Gaze triggered voice recognition incorporating device velocity | |
CN108073275A (zh) | 信息处理方法、信息处理设备及程序产品 | |
US11386886B2 (en) | Adjusting speech recognition using contextual information | |
US11138971B2 (en) | Using context to interpret natural language speech recognition commands | |
EP3125238B1 (en) | Insertion of characters in speech recognition | |
TWI668629B (zh) | 欄位條目的音訊輸入技術 | |
US20180364798A1 (en) | Interactive sessions | |
US20150310267A1 (en) | Automated handwriting input for entry fields | |
CN104700834A (zh) | 信息处理方法及信息处理装置 | |
CN108694941A (zh) | 用于交互式会话的方法、信息处理装置及产品 | |
CN107643909A (zh) | 用于协调多个本地设备上的输入的方法和电子设备 | |
US20160092074A1 (en) | Multi-modal fusion engine | |
US20180090126A1 (en) | Vocal output of textual communications in senders voice | |
US9513686B2 (en) | Context based power saving | |
US11238865B2 (en) | Function performance based on input intonation | |
US20190050391A1 (en) | Text suggestion based on user context | |
US20190019505A1 (en) | Sustaining conversational session | |
US9659480B2 (en) | Reminders based on virtual locations | |
US20160048581A1 (en) | Presenting context for contacts | |
US9332525B2 (en) | Intelligent repeat of notifications | |
US11741951B2 (en) | Context enabled voice commands | |
US11048782B2 (en) | User identification notification for non-personal device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220606 Address after: 23 / F, Lincoln building, 979 King's road, Quarry Bay, Hong Kong, China Patentee after: Lenovo PC International Ltd. Address before: Singapore, Singapore City Patentee before: Lenovo (Singapore) Pte. Ltd. |
|
TR01 | Transfer of patent right |