CN1776583A - 解释语音命令的集中式方法和系统 - Google Patents

解释语音命令的集中式方法和系统 Download PDF

Info

Publication number
CN1776583A
CN1776583A CNA2005101163399A CN200510116339A CN1776583A CN 1776583 A CN1776583 A CN 1776583A CN A2005101163399 A CNA2005101163399 A CN A2005101163399A CN 200510116339 A CN200510116339 A CN 200510116339A CN 1776583 A CN1776583 A CN 1776583A
Authority
CN
China
Prior art keywords
user
centralized
voice command
visually
computer implemented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005101163399A
Other languages
English (en)
Other versions
CN1776583B (zh
Inventor
D·莫厄特
R·L·钱伯斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1776583A publication Critical patent/CN1776583A/zh
Application granted granted Critical
Publication of CN1776583B publication Critical patent/CN1776583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

一种用于促进与用户集中式交互的方法和系统,包括提供经识别的语音命令给多个应用模块。语音命令的多个解释由多个应用模块的至少一个模块所产生。集中式界面模块在集中式显示屏上可视地呈现语音命令的多个解释。从用户接收解释的选择的指示。

Description

解释语音命令的集中式方法和系统
                      背景技术
本发明一般涉及与计算设备的用户交互。更加具体地,本发明涉及与在语言识别上下文中的集中式界面的用户交互。
目前,很多注意转向语言识别技术的提高。在语言识别技术内一种这样的挑战为使用语音命令使用户与计算设备交互。通常,语音命令在计算设备能执行这样的指令前需要进一步的明确化。
计算设备经常使用多种方式解释语音命令。在一方面,计算设备不理解语音命令指向哪个应用。例如,语音命令可包括在多个应用模块中使用的术语。另一方面,由于语音命令包括不明确的信息,应用可能不理解用户想要执行什么。例如,当有多个Beatles唱片可供应用播放时,语音命令可包括“播放Beatles″。在另一个例子中,语音命令可包括错误识别误差。例如,用户可叙述命令“插入冰淇淋”(insert ice cream),而语言识别系统识别该命令为“插入我尖叫声”(insert Iscream)。
在没有询问用户的情况下猜测用户的意图或采取行动可导致对于用户的不愉快。提供给用户工具以在没有导致不适当的不愉快和牺牲语言识别效率的情况下控制语音命令的解释和错误识别误差的解释是有必要的。
                     发明概要
提供一种用于促进与用户的集中式交互的方法和系统。该方法和系统包括提供识别的语音命令给多个应用模块。语音命令的多个解释由多个应用模块中的至少一个产生。集中式的界面模块在集中式的显示屏上可视地呈现语音命令的多个解释。从用户接收解释选择的指示。
一种当在语音命令中有不明确时,可视地呈现一解释列表给用户的集中式界面模块避免对用户所涉及命令的任意的猜测。此外,由集中界面模块提供的集中式显示面板可允许普通的用户交互。
                 附图简述
图1示出了一般计算环境的框图,本发明可在所述环境中实现。
图2示出了移动设备的框图,本发明可在所述设备中实现。
图3示出了用于促进集中式用户交互的系统的框图。
图4示出了集中式面板的实例屏幕输出。
图5示出了集中式面板的实例屏幕输出。
图6示出了计算设备显示屏的实例屏幕输出。
图7示出了用于促进集中式用户交互的方法的流程图。
图8示出了集中式面板的实例屏幕输出。
图9示出了集中式面板的实例屏幕输出。
图10示出了集中式面板的实例屏幕输出。
图11是一框图,示出了用于使用语言识别器操作显示在集中式屏幕上的字符的方法。
图12示出了集中式面板的实例屏幕输出。
图13示出了集中式面板的实例屏幕输出。
图14示出了集中式面板的实例屏幕输出。
图15示出了集中式面板的实例屏幕输出。
图16示出了集中式面板的实例屏幕输出。
图17示出了集中式面板的实例屏幕输出。
图18示出了集中式面板的实例屏幕输出。
图19示出了集中式面板的实例屏幕输出。
图20示出了集中式面板的实例屏幕输出。
图21示出了集中式面板的实例屏幕输出。
图22示出了集中式面板的实例屏幕输出。
图23示出了集中式面板的实例屏幕输出。
                    示意性实施例的详细描述
本发明在计算机可实现系统的上下文中被描述,所述计算机可实现系统使用语言识别以识别来自用户的语音命令。然而,在描述本发明的方面之前,描述可合作的并从这些方面受益的合适的计算环境是有用的。
图1所述了合适的计算系统环境100的实例,本发明可在该环境中实现。计算系统环境100只是一合适的计算环境的一例,而不是要提出对本发明使用或功能的范围的限制。计算环境100不能解释成对于在示例操作环境100中所示出的任一组件或其组合有任何依赖或需求。
本发明用多个其它通用或特殊用途计算系统环境或配置是可运行的。可以适用于本发明的公认的计算系统、环境、和/或配置的实例包括,但不局限于,个人计算机、服务器计算机、手持设备或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费者电器、网络PC、小型机、大型计算机、电话系统、包括任何诸如以上系统或设备的分布计算环境等。
本发明可以在诸如由计算机执行的程序模块的可实现计算机指令的一般上下文中被描述。一般地,程序模块包括完成特殊任务或执行特殊抽象数据类型的例行程序、程序、对象、组件、数据结构等。本发明也可以在分布的计算环境中实践,在此通过连接到一计算网络的远程处理设备来执行任务。在分布的计算环境中,程序模块可以定位于包括记忆体储存器设备的本地和远程计算机存储介质。由程序和模块执行的任务在以下结合附图的帮助进行描述。本领域的技术人员能实现在此提供的描述和附图作为处理器可执行指令,所述指令可写在计算机可读介质的任何形式上。
参见图1,对于实现本发明的示例的系统包括一以计算机110形式出现的通用计算设备。计算机110的组件包括,但不局限于,处理单元120、系统存储器130、以及将包括系统存储器在内的各种系统元件耦合至处理单元的系统总线121。上述系统总线121可以是多种总线体系结构类型中的任何一种,包括存储总线或存储控制器、外围总线和使用各种总线体系结构的任一种的局部总线。举例来说,而非限制,此类体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型工业标准体系结构(EISA)总线、视频电子标准技术协会(VESA)局部总线、和也被称为Mezzanine总线的外围部件互连(PCI)总线。
计算机110通常包括各种计算机可读介质。计算机可读介质可以是任何计算机110能够访问的可用介质,包括易失性的和非易失性的介质、可移动的和不可移动的介质。举例来说,而非限制,计算机可读介质可以包含计算机存储介质和通信介质。计算机存储介质包括能以任何方法或技术实现的易失性的和非易失性的、可移动的和不可移动的介质,用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。计算机存储介质包括,但不局限于,RAM,ROM,EEPROM,闪存或其它存储技术、CD-ROM、数字化多功能光盘(DVD)或其它光盘存储、盒式磁带、磁带、磁盘存储器或其它磁存储设备、或任何其它可以被用来存储想要的信息并且可以被计算机110访问的介质。通信介质通常体现出诸如载波或其它传送机制的已调制的数据信号中的计算机可读指令、数据结构、程序模块或其它数据,也包括任何信息传递介质。术语“已调制的数据信号”是指以在该信号中编码信息的方式来设置或改变其一个或多个特征的信号。举例来说,而非限制,通信介质包括诸如有线网或直接连线的有线介质,和诸如声音、射频、红外线和其它无线介质的无线介质。任何以上所述的组合也可以包括在计算机可读介质的范围之内。
系统存储器130包括以诸如只读存储器(ROM)131和随机存取存储器(RAM)132的易失和/或非易失存储器的形式的计算机存储介质。包含如在启动期间帮助在计算机110内各元素之间传送信息的基本例行程序的基本输入输出系统(BIOS)133,通常存储在ROM 131中。RAM 132通常包含可以被处理单元120立即访问和/或当前操作的数据和/或程序模块。举例来说,而非限制,图1示出了操作系统134、应用程序135、其它程序模块136和程序数据137。
计算机110还可以包括其它可移动/不可移动、易失/非易失的计算机存储介质。只作为例子,图1示出了从不可移动、非易失磁性介质读出或写入不可移动、非易失磁性介质的硬盘驱动器141、从可移动、非易失磁性磁盘152读出或写入可移动、非易失磁性磁盘152的磁盘驱动器151、以及从诸如CD ROM或其它光学介质的可移动、非易失性光盘156读出或写入可移动、非易失性光盘156的光盘驱动器155。其它可以使用在示例的操作环境中的可移动/不可移动、易失性/非易失性计算机存储介质包括,但不局限于,盒式磁带、闪存卡、数字多功能光盘、数字视频带、固态RAM、固态ROM、等。硬盘驱动141通常通过诸如接口140的不可移动存储接口连接到系统总线121。磁盘驱动151和光盘驱动155通常通过诸如接口150的可移动存储接口连接到系统总线121。
以上讨论并且在图1中示出的驱动器及它们相关的计算存储介质为计算机110提供了计算机可读指令、数据结构、程序模块和其它数据的存储。在图1,例如,示出硬盘驱动141存储操作系统144、应用程序145、其它程序模块146、和程序数据147。需要注意的是这些组件可以和操作系统134、应用程序135、其它程序模块136和程序数据137相同,也可以和它们不同。在此对操作系统144、应用程序145、其它程序模块146和程序数据147给出了不同的标号来说明至少它们是不同的拷贝。
用户可以通过诸如键盘162、麦克风163、和定位设备161把指令和信息输入到计算机110中,定位设备161通常指如鼠标、跟踪球或触摸板。其它输入设备(图中未示)可以包括操纵杆、游戏垫、圆盘式卫星天线、扫描仪等等。这些和其它输入设备通常由用户输入接口160连接到处理单元120,上述输入接口160和系统总线相连。但是上述和其它输入设备也可以由其它接口和总线结构连接到处理单元120,诸如,并行端口、游戏端口或通用串行总线(USB)。监视器191或其它类型显示设备也可以通过诸如视频接口190的接口连接到系统总线121。除了监视器之外,计算机也包括其它外围输出设备,诸如可以通过一输出外围设备接口195连接到扬声器197和打印机196。
计算机110可以在网络化的环境中运行,该环境使用逻辑连接连接到一个或多个诸如远程计算机180的远程计算机。远程计算机180可以是个人计算机、服务器、路由器、网络个人计算机、对等设备或其它共用网络节点,通常包括以上描述的和计算机110相关的多个或全部组件。在图1中描绘的逻辑连接包括局域网(LAN)171和广域网(WAN)173,但是也可以包括其它网络。这样的网络环境在办公室、企业范围的计算机网络、内联网和因特网中是普遍的。
当在LAN网络环境中使用时,计算机110通过网络接口或适配器170连接到LAN 171。当在WAN网络环境中使用时,计算机110通常包括调制解调器172或通过诸如因特网的WAN 173建立通信的其他装置。调制解调器172可以是内部的或外部的,可以通过用户输入接口160或其它适当的机制连接到系统总线121。在一网络连接的环境中,所描述的和计算机110相关的程序模块或其中的一部分可以存储在远程记忆体储存器设备内。举例说明,但非限制,图1示出了驻留在远程计算机180上的远程应用程序185。可以理解的是所示的网络连接是示例的,也可以使用在计算机间建立通信链路的其他装置。
图2是移动设备200的框图,所述设备是另一可应用的计算环境。移动设备200包括微处理器202、存储器204、输入/输出(I/O)组件206、和用于与远程计算机或其它移动设备通信的通信接口208。在一实施例中,上述组件通过合适的系统总线210耦合以相互通信。
存储器204作为诸如随机存取存储器(RAM)的具有电池供电组件(图中未示)的非易失性电子存储器实现以使存储在存储器204中的信息当用于移动设备204的总开关关闭时不丢失。存储器204的一部分更加适合作为用于程序执行的可寻址存储器被分配,而存储器204的另一部分更加适合使用于存储,诸如模拟在硬盘驱动器上的存储。
存储器204包括操作系统212、应用程序214和对象存储216。在操作期间,来自存储器204的操作系统212更适合于由处理器202执行。在一较佳的实施例中,操作系统212是来自微软公司商业上可提供的WINDOWSCE品牌操作系统。操作系统212较好地为移动设备设计,以及实现了数据库特征,所述数据库特征可以通过一组公开的应用程序接口和方法由应用程序214所使用。在对象存储216中的对象由应用程序214和操作系统212维持,至少部分地响应于对于公开的应用程序接口和方法的调用。
通信接口208代表了多个允许移动设备200发送和接收信息的设备和技术。设备包括有线的和无线的调制解调器、卫星接收器和广播调谐器等等。移动设备200也可直接与计算机相连以与之交换数据。在这种情况下,通信接口208可以是红外线接收器或串行或并行通信连接,它们全都可以发送流信息。
输入/输出组件206包括多个输入设备,所述输入设备包括触摸感应屏、按钮、滚轴和麦克风,并且多个输出设备包括音频发生器、振动装置、和显示屏。以上所列出的设备是作为例子并不需要都呈现在移动设备200上。此外,其它输入/输出设备也可在本发明的范围内附连于移动设备200或结合移动设备200使用。
图3示出了根据本发明的实施例一计算机可实现系统300的示意框图。系统300可以和任一以上所讨论的计算环境结合并包括麦克风302、音频捕获模块304、语言识别器306、多个安装的应用模块310和集中式界面模块312。麦克风302被配置以接收来自用户的语音命令。音频捕获模块304被配置以捕获由麦克风302接收的语音命令和把处理的语音命令发送给语言识别器306。
为了识别语音命令,语言识别器306访问包括多个可识别的命令的语法308。语法产生器模块309被配置以基于从安装的和操作应用模块310接收的输入产生语法。从应用模块310接收的输入增加语法308并且是可执行的命令,通过该命令应用模块能处理和执行各种动作。因此,每个位于语法308内的可识别的命令对应于一可在多个应用模块310中的一个应用模块中执行动作的命令。
语法产生器模块309也可结合各种命令的可供选择的方式增加语法308。命令的这些可供选择的方式通常从应用模块310中接收。例如,如果用户希望在计算设备上播放Beatles,用户应该发出“播放Beatles”的声音。然而,用户可指令计算设备“开始Beatles”而不是适当地指令计算设备“播放Beatles”以完成相同的任务是可能的。
在某些实施例中,语法产生器模块309被进一步配置以确定哪个应用模块310在任意给定的时间是可操作的。例如,语法产生器模块309可确定五个应用模块运行在操作系统上。可操作的应用模块包括网络浏览器的两个实例、电子邮件应用、文字处理应用和电子表格应用。当语法产生器模块309产生语法308,它压缩命令以使只有一组用于网络浏览器应用的命令增加语法308。然而,语法产生器309保留存在两个网络浏览器实例是可操作的标志。因此,语法产生器309意识到在产生语法308的时候存在不明确。
在另一实施例中,语法产生器309不保留存在两个网络浏览器实例是可操作的标志。在该实施例中,集中式界面模块312可在操作系统上执行状态检测以确定是否相同应用的不同实例是可操作的以及因此是不明确的。
在语言识别器306识别语音命令后,被识别的语音命令传送给多个应用模块310。被识别的语音命令可由集中式界面模块312或由语言识别器306传送给多个应用模块。不管传送的路径,多个应用模块310处理被识别的语音命令。
根据本发明的一实施例,某些或所有应用模块310确定它们可执行被识别的语音命令。例如,一用户发出“开始设置”。然而,安装在系统300内的应用模块310的许多模块可具有包括术语“设置”的应用方面。因此,被识别的命令310是不明确的。用户所涉及的是哪个应用是不明确的。
在这个实施例中,集中式界面模块312集中一组来自多个应用模块310的被识别的语音命令可能的解释。然后,集中式界面模块312以列表的形式可视地呈现该组解释。解释的列表由用户在显示器314的集中式面板上查看。一可视地呈现一可能的解释的列表402的实例之屏幕输出400在图4中示出。
根据本发明的另一实施例,只有多个应用模块310的一个模块确定它能执行被识别的语音命令。例如,用户发出“播放Indigo Girls”。只用一个应用模块310,诸如介质应用具有包括“播放Indigo Girls”的菜单项。然而,当介质应用设备开始执行命令时,它发现有四个可能的Indigo Girls的唱片可供播放。因此,被识别的命令是不明确的。对于介质应用而言哪个唱片是用户想播放的是不清楚的。
在该实施例中,集中式界面模块312集中一组来自多个应用模块310的被识别的语音命令可能的解释。集中式界面模块312以列表的形式可视地呈现该组解释。解释的列表由用户在显示器314的集中式面板上查看。一可视地呈现一根据描述的实例的可能解释列表的实例屏幕输出500在图5中所示。
还根据本发明的另一实施例和如以上所描述的,用户参考具体应用的哪个实例或应用模块可以是不明确的。例如,用户使用电子表格应用并且发出命令“切换到因特网浏览器”。然而,系统300除了运行电子表格应用的一个实例外,系统300也运行因特网浏览器应用的两个实例。因此,被识别的命令是不明确的。用户所指的是哪个因特网浏览器的实例是不清楚的。
在这个实施例中,语言识别器306可提供给集中式界面模块312一组基于保留存在多于一个可操作的网络浏览器实例的标志的语法产生器309的可能的语音命令的解释。在一选择中,在执行操作系统的状态检测后,集中式界面模块312可提供一组语音命令可能的解释。集中式界面模块312以列表的形式可视地呈现该组解释。该组解释由用户在位于显示器314上的集中式面板中查看。
在解释列表402和502中的每个解释由一标识符(也就是说,“1”、“2”、“3”等)注解。在图4和图5的实施例中,虽然可以使用任一形式的符号,标识符504和404是数字符号。通过查看翻译列表402和502,用户可以确定哪个解释是相应于用户所指的解释。在一实施例中,用户可通过说出相应的数字符号选择正确的命令。在另一实施例中,用户可通过使用输入设备316(在图3中所示)选择正确的命令以选择想要的解释。输入设备316可以是,但不局限于,诸如鼠标的选择装置。输入设备316也可以是键盘。不管正确的解释如何被选择,解释的选择通过转发命令到相应的应用使系统300执行相应的命令。
在另一实施例中,用户可表明,参考图5,播放所有Indigo Girls的唱片是想要的。通信线506表明用户既可从多个解释502中选择一解释也可发出“播放所有”以播放所有唱片。不管用户想要的是什么,正确解释的选择使系统300通过提供命令信息给相应的应用而采取行动。
当在语音命令中存在不明确时,使用可视地呈现一列解释给用户的集中式界面模块对于系统300提供一种方法避免任意地猜测适当的命令。一集中式界面模块也提供简单的集中式屏幕用于图形化地显现可能的用户交互,提供确定用户意思的高效的方法并且提供位于多个应用模块外的一致的界面。换句话说,图4、5、和8-10中所示的集中式面板输出的每个输出,看上去和操作是类似的,并且因此它们能显示在一致的位置。例如,图6示出了在操作系统上操作的媒体播放器的屏幕输出600。用户要求“播放Indigo Girls”。如以上所讨论的,存在多于一个的Indigo Girls的唱片可以播放。集中式界面或面板500出现在屏幕右下角并且促进用户选择他们的意思。通过这种方式,即使集中式屏幕能被一个或多个应用模块310使用,用户不会太困惑于如何操作显示屏。
图7示出了提供一促进与用户的集中式交互的计算机实现的方法的流程图700。流程图700包括需要从用户接收语音命令的步骤702。在接收语音命令后,流程图700继续到步骤704以处理语音命令以致该命令是在一适当的环境被语言识别器识别。在步骤706,诸如图3的语言识别器的语言识别器识别语音命令。语言识别器把语音命令与存储在索引中的多个命令比较。
在步骤708,被识别的命令传送给多个应用模块。在步骤710,通过多个应用模块的至少一个模块,多个解释被接收以确定识别的命令是不明确的。在步骤712,多个解释可视地呈现给用户。例如,多个解释可与相应的标识符在显示屏的集中式面板上列出。在步骤714,多个解释中一个解释的用户选择的指示被接收。例如,通过可听地表明标识符,想要的解释可被标识为正确的命令。
除了图3中的通过与集中式界面模块312交互来解释语音命令,当用户命令一诸如文字处理应用的应用模块时,用户也可以与集中式界面模块312交互以纠正识别误差。为了纠正识别误差,用户可通过使用输入设备加亮已经被不正确录制的术语。在加亮后,应用模块发送多个选择到集中式界面模块312。选择包括听上去和语音发声相似的短语。集中式界面模块312接收并在显示屏314的集中式面板上可视地呈现选择短语。每个可选择的短语包括一相应的标识符。集中式界面模块312通过语音或输入设备316接收来自用户以标识符的形式的选择的指示并传送选择给应用模块。
在某些实例中,集中式界面模块312不能可视地呈现是正确选择的选择。如果语言识别器316产生错误识别误差或如果选择不是可识别的,由于用户从未使用结合系统300的说话方式,不能呈现正确的选择会发生。结合发生的这些类别,除了以上所表现的选择外,集中式界面模块312被配置以表现进一步的选择。一种这样的选择包括提供重述原始说法的选择。另一种这样的进一步选择包括表现允许用户创建一对于系统300不熟悉的新的选择的选项。
例如,图8示出了根据本发明的实施例可视地呈现一选择列表的集中式面板的屏幕输出800。选择的列表包括由文字处理应用产生的一列可供选择短语列表804和由集中式界面模块312产生的一进一步的选择的列表806。每个进一步的选择806包括相应的标识符以使用户能以标识符的形式做出选择的指示。
如果用户选择标识符“9”,那么集中式界面模块312在集中式面板上可视地呈现屏幕输出900,如图9所示。屏幕输出900的通信行902促使用户用清晰的声音重新说出要说的话。通过重新说出要说的话,集中式界面模块312将可视地呈现更新的选择列表。如果系统300产生识别误差,选择标识符“9”是有用的。如果用户选择了在图8中的标识符“10”,那么集中式界面模块312可视地在集中式面板内呈现如图10所示的屏幕输出1000。屏幕输出1000的通信行1002促使用户大声拼出要说的言词。如用户拼出,字母将显示在框1004中。另外,用户也可以使用输入设备打出框1004中言词的正确拼读。
在本发明的另一实施例中,图11是一框图,示出了在用户可听到地拼出新的选择后,用于操作显示在集中式面板上的字符,诸如图10示出了集中式面板的屏幕输出1000上的方法1100。例如,在图12,用户拼出以下短语,“intent″。然而,语言识别器306(图3)“听”到一系列输入文本1024为“i”、“n”、“v”、“e″、“n”、“t”并且然后,显示单词“invent”在面板1200上。单词“invent”需要改正成“intent”。
参考图13,为了改正这个,用户调用拼读命令以口头地发送命令来修改“invent”。在系统300接收拼读命令时,选择的单词被识别并且附加的单词1302通过附加至少一个空格1304至选择的单词来创建,其中附加的单词1302包括至少一个要被修改的字符1306,如在操作框1102所示的(图11)。在附加的单词内的每个字符1308然后被分配和唯一的数字值1310相关联,诸如在操作框1104内所示。然后附加的单词1302通过集中式面板的屏幕输出1300显示以可视地沟通在附加的单词1302内每个字符1308与它们分配的唯一数字值1310之间的关联。该关联可通过在在屏幕输出1300的附加的单词1302周围画框1312以及显示每个唯一数字值1310可视地沟通,所述数值1310紧靠着附加的单词1302内它们被分配的字符1308。如此,每个字符1308被”分配“一唯一数字值1310,该值与每个字符1308相关联。例如,用户要更改单词″invent″1314为″intent″,将口头输入命令给语言识别器306。这将导致在屏幕输出1300上一框1312显示在单词″invent”1314的周围。这也将导致单词“invent”1314内的每个单词被分配一显示在它的相应的字符1308邻近的唯一数字值1310,两者都在图13中显示。这将允许用户更改和/或纠正单词“invent”中的任一字母。
在这点上,选择命令和修改命令可由系统300接收,其中选择命令是相应于选择的字符的唯一数字值1310,如在操作框1106中所示。这对系统表明附加的单词1302中哪个字符将被更改。一旦系统300接收修改命令,通过响应于修改命令修改选择的字符产生修改过的单词,如在操作框1108中所示。可以理解的是用户可输入多个修改命令,诸如“删除”、“添加”、或要添加的字母/字符,其中这些情况的每种情况在以下讨论。
例如,参考图14,考虑以上的情况,用户想删除显示在集中式面板的屏幕输出1400的附加的单词“invent_”1404中的字母“v”1402。如在此讨论的,用户发送响应于要更改的字符的唯一数字值给系统300。可以理解的是虽然这些唯一数字值1408开始于数字1并且以加1的方式递增,任何唯一数字值1408和增量可被分配。可以看到的是,在附加的单词“invent_”1404内的字母“v”1402被分配给唯一数字数字1408“3”。如此,用户可口头地发送数字“3”至系统300。这个方式选择相应于由插入符1410所表明的数字“3”以及与之相关联的字母,在这种情况下是字母“v″1402在附加的单词“invent”1404中。然后用户可输入想要的修改命令,诸如“删除”,可以导致字母“v″1402从附加的单词“invent”1404中删除,留下如在图15的集中式面板的屏幕输出上显示的“inent”1412。这样,修改命令“删除”可从附加的单词中移除选择的字母和其相应的空格,并且选择插入符1410将选择下一个后续的字符,也就是说,“e”。
另一方面,参考图16,考虑这种情况,用户要在在集中式面板的屏幕输出1600上显示的单词“invent”的字母“n”1604和字母“v”1606之间增加一字符,诸如字母或空格。本质上,用户要增加一字符到相应于唯一数字值“3”的点中。如在此所讨论的,用户可口头地发送一命令。这将导致单词“invent”附加一空格以产生附加的单词“invent_”1608以及显示在附加的单词“invent_”周围的框1610和分配给每个在附加的单词“invent_”的字符1608并显示在其邻近的唯一数字值1612。可以看到的是,附加的单词“invent_”1608内的字母“v”1606被分配给一“3”的唯一数字值1612。如此,用户可口头地发送“3”至系统300以“选择”相应于由插入符1614所表明的数值“3”以及与之关联的字母,在这种情况下字母“v”1606在附加的单词“invent_”1608中。然后用户可输入修改命令,使系统300以合适的方式响应。例如,如果用户发送修改命令“增加”并且然后发送单词“空格”,那么一个空格将添加在字母“n”1604和字母“v”1606之间,有效地把附加的单词“invent_”1608改变为“in_vent_”1616,如图17中在集中式面板的屏幕输出1700中所示。在这种情况下,插入符1614保留原地以表明与唯一数字数字“3”相关联的空格已经被选择。然而,如果用户发送命令“增加”然后发送字母“p”,那么字母“p”,将被添加到字母“n”1604和字母“v”1606之间,有效地把附加的单词“invent_”改变为“inpvent_”1618,如在图18的集中式面板的屏幕输出1800中所示,并且选择插入符1614将移动至下一字符以表明下一字符(也就是说,相应于唯一数字值“4”的字符)已经被选择。
类似地,参考图19,考虑这种情况,用户只要更改显示在集中式面板的屏幕输出1900的单词“invent”的一个字母。如在此讨论的,用户可口头地发送一命令。这将导致单词“invent”附加一空格以产生附加的单词“invent_”1902以及显示在附加的单词“invent_”1902周围的框1904和分配给每个在附加的单词“invent_”的字符1908并显示在其邻近的唯一数字值1906。可以看到的是,在附加的单词“invent_”1902内的字母“v”1912被分配给一“3”唯一数字数字1906。如此,用户可口头地发送数字“3”给系统300。这将导致相应于如插入符1310所表明的数字“3”和与之相关联的字母被选择,在这种情况下字母“v”1912在附加的单词“invent_”1902中。然后用户可输入修改命令(在这种情况下,命令是一简单的字母)导致系统300以合适的方式响应。例如,如果用户在发送数字“3”之后发送修改命令“t”,那么字母“v”1912将被字母“t”所替代,有效地把附加的单词“invent_”1902改变为单词“intent”1914,如图20中所示的在集中式面板的输出屏幕200上显示的。在这点上,选择插入符1910将移动至下一字符以表明下一字符(也就是说,相应于唯一数字值“4”的字符)已被选择。
可以理解的是一旦用户输入相应于要更改的字母的唯一数字值,可显示一建议的修改命令菜单,诸如下拉式菜单,其中每个建议的行动被分配给一自己的唯一数字值。例如,参考图21,这种情况,用户要更改显示在集中式面板的屏幕输出2100上的单词“invent”的一字母。用户可口头地发送一命令。这将导致单词“invent”附加一空格以产生附加的单词“invent_”2102以及显示在附加的单词“invent_”2102周围的框2104和分配给每个在附加的单词“invent_”2102的字符并显示在其邻近的唯一数字值2106。可以看到的是,在附加的单词“invent_”2102内的字母“v”2108被分配给一“3”唯一数字值2106。如此,用户可口头地发送数字“3”给系统300以“选择”相应于如插入符2110所表明的数字“3”和与之相关联的字母被选择,在这种情况下在附加的单词是“invent_”2102中的字母“v”2108。参考图22,菜单2112可显示在集中式面板输出2200以给用户多个修改命令选择,每个选择被分配给一第二唯一数字值2114。然后用户可输入修改命令,该修改命令是与想要的修改命令相关联的第二唯一数字数字2114,导致语言识别软件应用以合适的方式响应。例如,如果用户在发送数字“3”之后发送数字值“4”,那么字母“v”2108将被字母“d”代替,有效地从附加的单词“invent_”2102改变为单词“indent”2118,如图23中的集中式面板的屏幕输出2300所示。如上所述,选择插入符2110将移动至下一字符以表明下一字符(也就是说,相应于唯一数字值“4”的字符)已被选择。
可以理解的是建议的修改命令的菜单2112可包括任何合适于想要的最终目的的修改命令,诸如听上去和选择的字母或单词相似的字符/单词的菜单,举例来说,如果选择“v”,那么菜单2112将包括“d”、“t”、“e”、“g”、“3”。此外,菜单1210也可包括字符的大写形式,举例来说,“V”,以及来自拼读检查程序的自动完成列表。如此,从这个例子中,菜单1012可包括单词“indent”、“intent”、“amend”。此外,可以理解的是本发明可包括同时执行多个功能的语音命令,举例来说,“把3更改为如‘eagle’中的‘e’”、或“把t更改为g”,如果在选择的单词内只有一个字母“t”,可把字母“t”更改为字母“g”。如果在选择的单词内有两个字母“t”,反馈提供给用户要求更加精确。此外,其它命令也可被提供,诸如可使先前更改的字符返回其先前的状态的“撤销”,也就是说,如果用户说“cap that”(把选择的字母大写化),但是输入被识别为“caret”,那么用户可以说“撤销”以返回字母至先前状态。
参考图8-23,这些附图在用户对文字处理应用命令的上下文中被讨论。然而,本领域的技术人员可意识到在图8-23中所讨论的实施例也可适用于用户说出语音命令给系统300的用户。如果语音命令是不明确的,集中式界面模块312将可视地呈现解释的列表并且也可视地呈现进一步选择的列表。进一步选择的列表包括重新说命令的选择和创建新的命令的选择。例如,如果用户能可听到地发出命令“插入名字David”。然而,如果用户先前已经发送邮件给David Black和David Green,但是从没发送邮件给David White,那么存在插入哪个David的不明确。集中式界面模块312可视地呈现David解释的列表。解释的列表包括David Black和David Green。此外,集中式界面模块312可视地呈现进一步选择的列表,该列表包括重述语音命令的选择和创建新的命令的选择。在这个例子中,由于用户希望发送邮件给David White,对于系统300而言是不熟悉的,用户可选择创建一新的命令。
除了通过与集中式界面模块312交互以解释命令和纠正错误识别误差外,用户也能与集中式界面模块312交互以接收来自多个应用模块310的反馈。集中式界面模块312被配置以可视地呈现哪个系统300正在收听。例如,集中式面板可显示由于麦克风302关闭而没有内容收听的系统300。此外,集中式界面模块312也可被配置以可视地呈现系统300的状态。例如,集中式面板可显示由系统300识别的最后的命令。在另一实施例中,集中式面板可显示正开着或关闭的具体的应用模块。
虽然本发明已结合具体的实施例被描述,本领域的技术人员可意识到在不背离本发明精神和内容的情况下,在形式和细节上可做修改。

Claims (32)

1.一种促进与用户集中式交互的计算机实现的方法,所述方法包括:
提供经识别的语音命令给多个应用模块;
接收语音命令的多个解释,所述多个解释由多个应用模块的至少一个模块产生;
在集中式显示屏上可视地呈现语音命令的多个解释;和
接收来自用户的解释的选择的指示。
2.如权利要求1所述的方法,其特征在于,其中可视地呈现多个解释包括以列表的形式可视地呈现多个解释,多个解释的每个解释有相应的标识符。
3.如权利要求1所述的方法,其特征在于,其中接收解释的选择的指示包括接收表明相应于选择的解释的标识符的语言信号。
4.如权利要求1所述的方法,其特征在于,其中接收解释的选择的指示包括接收表明相应于解释的选择的标识符的输入设备信号。
5.如权利要求1所述的方法,其特征在于,进一步包括可视地呈现允许用户选择重述语音命令的方案。
6.如权利要求5所述的方法,其特征在于,进一步包括当用户选择重述语音命令时,可视地呈现多个更新的解释。
7.如权利要求1所述的方法,其特征在于,进一步包括可视地呈现允许用户选择创建新的不被包括在所述多个解释内的解释的选择方案。
8.如权利要求7所述的方法,其特征在于,其中允许用户选择创建新的解释进一步包括接收新的解释的可听的拼读。
9.如权利要求1所述的方法,其特征在于,进一步包括在接收到选择的指示后,发送选择的接收给至少一个应用模块。
10.如权利要求1所述的方法,其特征在于,其中集中式显示屏包括显示在计算设备屏幕上一致的位置内的集中式面板。
11.如权利要求1所述的方法,其特征在于,进一步包括在集中式显示屏上可视地呈现可供选择的用于错误识别的发声的拼读的列表。
12.如权利要求1所述的方法,其特征在于,进一步包括在集中式显示屏上可视地呈现来自多个应用模块的反馈。
13.一种促进与用户集中式交互的计算机实现的系统,所述系统包括:
音频捕捉模块,配置以捕捉语音命令;
语言识别器,配置以通过访问在语法内的多个命令识别语音命令;
集中式界面模块,配置以:
当识别的语音命令是不明确的时候,可视地呈现来自多个应用模块的至少一个模块的多个解释;和
接收多个解释的一个解释的选择的指示。
14.如权利要求13所述的计算机实现的系统,其特征在于,其中集中式界面适合于传送选择的指示给多个应用模块的至少一个模块。
15.如权利要求13所述的计算机实现的系统,其特征在于,进一步包括一集中式显示屏,被配置以显示一可视地呈现解释列表的集中式面板。
16.如权利要求13所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现允许用户选择重述语音命令的选择方案。
17.如权利要求16所述的计算机实现的系统,其特征在于,其中当用户选择重述语音命令时,集中式界面模块适合于更新解释的可视地呈现的列表。
18.如权利要求13所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现允许用户选择创建没有可视地呈现在所述解释列表内的语音命令的选择方案。
19.如权利要求18所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于接收以拼读的命令的形式创建的语音命令。
20.如权利要求13所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现用于包括识别误差的口述的短语的可供替代的短语的列表。
21.如权利要求20所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现允许用户选择重述口述的短语的替换方案。
22.如权利要求20所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现允许用户选择创建不在可供选择的拼读列表中所示的单词的方案。
23.如权利要求13所述的计算机实现的系统,其特征在于,其中集中式界面模块适合于可视地呈现来自多个应用模块的反馈。
24.如权利要求13所述的计算机实现的系统,其特征在于,进一步包括语法产生器模块,被配置以基于从多个应用模块中接收到的命令产生语法。
25.如权利要求13所述的计算机实现的系统,其特征在于,其中当识别的语音命令可被多个应用模块中的至少一些应用模块所处理时,识别的语音命令是不明确的。
26.如权利要求13所述的计算机实现的系统,其特征在于,其中当应用模块的一个模块确定多于一个的行动可基于识别的语音命令而被执行时,识别的语音命令是不明确的。
27.一种促进与用户集中式交互的计算机实现的方法,所述方法包括:
捕捉语音命令;
通过访问可识别的命令的语法识别语音命令;
确定识别的语音命令是不明确的;
在集中式显示屏上可视地呈现识别的语音命令的解释的列表;
接收解释中的一个解释的选择的指示。
28.如权利要求27所述的方法,其特征在于,其中解释的列表由多个应用模块产生。
29.如权利要求27所述的方法,其特征在于,其中解释的列表是基于一概念,所述概念为应用的多于一个实例在操作。
30.如权利要求27所述的方法,其特征在于,进一步包括可视地呈现允许用户选择重述语音命令的替换方案。
31.如权利要求27所述的方法,其特征在于,进一步包括可视地呈现允许用户选择创建不与解释列表中解释相应的语音命令的方案。
32.如权利要求31所述的方法,其特征在于,其中允许用户选择创建新的解释包括接收新的解释的可听的拼读。
CN2005101163399A 2004-11-16 2005-10-14 解释语音命令的集中式方法和系统 Active CN1776583B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/990,345 US8942985B2 (en) 2004-11-16 2004-11-16 Centralized method and system for clarifying voice commands
US10/990,345 2004-11-16

Publications (2)

Publication Number Publication Date
CN1776583A true CN1776583A (zh) 2006-05-24
CN1776583B CN1776583B (zh) 2013-01-02

Family

ID=35825428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005101163399A Active CN1776583B (zh) 2004-11-16 2005-10-14 解释语音命令的集中式方法和系统

Country Status (7)

Country Link
US (3) US8942985B2 (zh)
EP (1) EP1657709B1 (zh)
JP (1) JP4854259B2 (zh)
KR (1) KR101143034B1 (zh)
CN (1) CN1776583B (zh)
AT (1) ATE459076T1 (zh)
DE (1) DE602005019518D1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881276A (zh) * 2014-02-27 2015-09-02 福特全球技术公司 动态命令歧义消除
CN106471570A (zh) * 2014-05-30 2017-03-01 苹果公司 多命令单一话语输入方法

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8050918B2 (en) * 2003-12-11 2011-11-01 Nuance Communications, Inc. Quality evaluation tool for dynamic voice portals
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US7778821B2 (en) * 2004-11-24 2010-08-17 Microsoft Corporation Controlled manipulation of characters
US7424431B2 (en) * 2005-07-11 2008-09-09 Stragent, Llc System, method and computer program product for adding voice activation and voice control to a media player
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US8234120B2 (en) * 2006-07-26 2012-07-31 Nuance Communications, Inc. Performing a safety analysis for user-defined voice commands to ensure that the voice commands do not cause speech recognition ambiguities
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8099287B2 (en) * 2006-12-05 2012-01-17 Nuance Communications, Inc. Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands
US9794348B2 (en) * 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
US8019606B2 (en) * 2007-06-29 2011-09-13 Microsoft Corporation Identification and selection of a software application via speech
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
KR101462932B1 (ko) * 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
US8284909B2 (en) 2008-09-29 2012-10-09 Microsoft Corporation Offline voicemail
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8358752B2 (en) * 2009-11-19 2013-01-22 At&T Mobility Ii Llc User profile based speech to text conversion for visual voice mail
US8626511B2 (en) * 2010-01-22 2014-01-07 Google Inc. Multi-dimensional disambiguation of voice commands
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
DE102012019178A1 (de) * 2011-09-30 2013-04-04 Apple Inc. Verwendung von Kontextinformationen zum Erleichtern der Verarbeitung von Befehlen bei einem virtuellen Assistenten
US9570086B1 (en) * 2011-11-18 2017-02-14 Google Inc. Intelligently canceling user input
US9317605B1 (en) 2012-03-21 2016-04-19 Google Inc. Presenting forked auto-completions
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9734839B1 (en) * 2012-06-20 2017-08-15 Amazon Technologies, Inc. Routing natural language commands to the appropriate applications
US20140052438A1 (en) * 2012-08-20 2014-02-20 Microsoft Corporation Managing audio capture for audio applications
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR101330671B1 (ko) * 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
KR102009423B1 (ko) * 2012-10-08 2019-08-09 삼성전자주식회사 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치
KR20140060040A (ko) 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
AU2018202888B2 (en) * 2013-01-17 2020-07-02 Samsung Electronics Co., Ltd. Image processing apparatus, control method thereof, and image processing system
JP6167605B2 (ja) * 2013-03-28 2017-07-26 株式会社デンソー 音声認識システム
US9202459B2 (en) * 2013-04-19 2015-12-01 GM Global Technology Operations LLC Methods and systems for managing dialog of speech systems
KR101456974B1 (ko) 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9646606B2 (en) 2013-07-03 2017-05-09 Google Inc. Speech recognition using domain knowledge
GB2518002B (en) * 2013-09-10 2017-03-29 Jaguar Land Rover Ltd Vehicle interface system
KR102197143B1 (ko) * 2013-11-26 2020-12-31 현대모비스 주식회사 음성 인식을 이용한 명령 수행 시스템 및 그 동작 방법
CN103645876B (zh) * 2013-12-06 2017-01-18 百度在线网络技术(北京)有限公司 语音输入方法和装置
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US20160078864A1 (en) * 2014-09-15 2016-03-17 Honeywell International Inc. Identifying un-stored voice commands
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
KR102241289B1 (ko) * 2014-12-12 2021-04-16 엘지전자 주식회사 디스플레이 장치 및 그 제어 방법
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US9922648B2 (en) * 2016-03-01 2018-03-20 Google Llc Developer voice actions system
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105893345A (zh) * 2016-03-28 2016-08-24 联想(北京)有限公司 一种信息处理方法和电子设备
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US9691384B1 (en) 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
KR20180060328A (ko) 2016-11-28 2018-06-07 삼성전자주식회사 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
EP3401797A1 (en) * 2017-05-12 2018-11-14 Samsung Electronics Co., Ltd. Speech navigation for multilingual web pages
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
KR102060775B1 (ko) 2017-06-27 2019-12-30 삼성전자주식회사 음성 입력에 대응하는 동작을 수행하는 전자 장치
KR102617265B1 (ko) 2018-03-13 2023-12-26 삼성전자주식회사 사용자 음성 입력을 처리하는 장치
US11100146B1 (en) * 2018-03-23 2021-08-24 Amazon Technologies, Inc. System management using natural language statements
CN111415658A (zh) * 2019-01-07 2020-07-14 成都启英泰伦科技有限公司 一种去中心化语音控制多设备系统及其控制方法
WO2020159190A1 (en) * 2019-01-28 2020-08-06 Samsung Electronics Co., Ltd. Method and apparatus for supporting voice instructions
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner

Family Cites Families (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5041967A (en) 1987-10-13 1991-08-20 Bell Communications Research, Inc. Methods and apparatus for dynamic menu generation in a menu driven computer system
US4992972A (en) 1987-11-18 1991-02-12 International Business Machines Corporation Flexible context searchable on-line information system with help files and modules for on-line computer system documentation
JP3088739B2 (ja) 1989-10-06 2000-09-18 株式会社リコー 音声認識システム
JPH0760374B2 (ja) 1991-03-15 1995-06-28 インターナショナル・ビジネス・マシーンズ・コーポレイション 対話式コマンド構成システム
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5920836A (en) * 1992-11-13 1999-07-06 Dragon Systems, Inc. Word recognition system using language context at current cursor position to affect recognition probabilities
US5632002A (en) * 1992-12-28 1997-05-20 Kabushiki Kaisha Toshiba Speech recognition interface system suitable for window systems and speech mail systems
US5890122A (en) * 1993-02-08 1999-03-30 Microsoft Corporation Voice-controlled computer simulateously displaying application menu and list of available commands
US6125347A (en) * 1993-09-29 2000-09-26 L&H Applications Usa, Inc. System for controlling multiple user application programs by spoken input
US6014138A (en) 1994-01-21 2000-01-11 Inprise Corporation Development system with methods for improved visual programming with hierarchical object explorer
WO1995025326A1 (en) 1994-03-17 1995-09-21 Voice Powered Technology International, Inc. Voice/pointer operated system
US5748973A (en) 1994-07-15 1998-05-05 George Mason University Advanced integrated requirements engineering system for CE-based requirements assessment
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5748974A (en) 1994-12-13 1998-05-05 International Business Machines Corporation Multimodal natural language interface for cross-application tasks
WO1996037881A2 (en) * 1995-05-26 1996-11-28 Applied Language Technologies Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system
US6026388A (en) 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US6289312B1 (en) 1995-10-02 2001-09-11 Digital Equipment Corporation Speech interface for computer application programs
US5852801A (en) * 1995-10-04 1998-12-22 Apple Computer, Inc. Method and apparatus for automatically invoking a new word module for unrecognized user input
US5799276A (en) * 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
US6064959A (en) 1997-03-28 2000-05-16 Dragon Systems, Inc. Error correction in speech recognition
US6446135B1 (en) 1996-03-05 2002-09-03 Microsoft Corporation Method and system for querying and executing commands of an application program
US5825356A (en) 1996-03-18 1998-10-20 Wall Data Incorporated Help system with semitransparent window for disabling controls
DE19615693C1 (de) 1996-04-19 1997-12-11 Siemens Ag Vorrichtung und Verfahren zur Aktionsermittlung
US5995921A (en) * 1996-04-23 1999-11-30 International Business Machines Corporation Natural language help interface
US6021403A (en) 1996-07-19 2000-02-01 Microsoft Corporation Intelligent user assistance facility
US5864340A (en) 1996-08-22 1999-01-26 International Business Machines Corporation Mobile client computer programmed to predict input
US6311182B1 (en) * 1997-11-17 2001-10-30 Genuity Inc. Voice activated web browser
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US6456974B1 (en) * 1997-01-06 2002-09-24 Texas Instruments Incorporated System and method for adding speech recognition capabilities to java
US6094476A (en) 1997-03-24 2000-07-25 Octel Communications Corporation Speech-responsive voice messaging system and method
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6044347A (en) 1997-08-05 2000-03-28 Lucent Technologies Inc. Methods and apparatus object-oriented rule-based dialogue management
KR100280175B1 (ko) 1997-10-15 2001-02-01 윤종용 툴팁을이용한글꼴정보표시기및방법
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US7124129B2 (en) 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6085159A (en) * 1998-03-26 2000-07-04 International Business Machines Corporation Displaying voice commands with multiple variables
US6233559B1 (en) 1998-04-01 2001-05-15 Motorola, Inc. Speech control of multiple applications using applets
US6199061B1 (en) 1998-06-17 2001-03-06 Microsoft Corporation Method and apparatus for providing dynamic help topic titles to a user
US6192339B1 (en) * 1998-11-04 2001-02-20 Intel Corporation Mechanism for managing multiple speech applications
US6839669B1 (en) 1998-11-05 2005-01-04 Scansoft, Inc. Performing actions identified in recognized speech
US7720682B2 (en) * 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US6192343B1 (en) * 1998-12-17 2001-02-20 International Business Machines Corporation Speech command input recognition system for interactive computer display with term weighting means used in interpreting potential commands from relevant speech terms
US7206747B1 (en) * 1998-12-16 2007-04-17 International Business Machines Corporation Speech command input recognition system for interactive computer display with means for concurrent and modeless distinguishing between speech commands and speech queries for locating commands
DE69942663D1 (de) * 1999-04-13 2010-09-23 Sony Deutschland Gmbh Zusammenfügen von Sprachschnittstellen zur gleichzeitigen Benützung von Vorrichtungen und Anwendungen
US6591236B2 (en) * 1999-04-13 2003-07-08 International Business Machines Corporation Method and system for determining available and alternative speech commands
US6542163B2 (en) 1999-05-05 2003-04-01 Microsoft Corporation Method and system for providing relevant tips to a user of an application program
US6493702B1 (en) 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6340977B1 (en) 1999-05-07 2002-01-22 Philip Lui System and method for dynamic assistance in software applications using behavior and host application models
US6604075B1 (en) 1999-05-20 2003-08-05 Lucent Technologies Inc. Web-based voice dialog interface
US6308157B1 (en) * 1999-06-08 2001-10-23 International Business Machines Corp. Method and apparatus for providing an event-based “What-Can-I-Say?” window
JP3662780B2 (ja) 1999-07-16 2005-06-22 日本電気株式会社 自然言語を用いた対話システム
US7120582B1 (en) 1999-09-07 2006-10-10 Dragon Systems, Inc. Expanding an effective vocabulary of a speech recognition system
US6374226B1 (en) * 1999-08-06 2002-04-16 Sun Microsystems, Inc. System and method for interfacing speech recognition grammars to individual components of a computer program
US7069220B2 (en) * 1999-08-13 2006-06-27 International Business Machines Corporation Method for determining and maintaining dialog focus in a conversational speech system
US6442522B1 (en) * 1999-10-12 2002-08-27 International Business Machines Corporation Bi-directional natural language system for interfacing with multiple back-end applications
US7403888B1 (en) 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
US7073126B1 (en) 1999-11-18 2006-07-04 Instaknow.Com Inc. Method and system of deploying server-based applications
US6526382B1 (en) 1999-12-07 2003-02-25 Comverse, Inc. Language-oriented user interfaces for voice activated services
AU6391100A (en) 1999-12-15 2001-06-25 Microsoft Corporation Methods and systems for dynamically creating user interfaces
US6920607B1 (en) 1999-12-15 2005-07-19 Microsoft Corp. Methods and systems for dynamically creating user interfaces
US6847959B1 (en) 2000-01-05 2005-01-25 Apple Computer, Inc. Universal interface for retrieval of information in a computer system
US6434529B1 (en) * 2000-02-16 2002-08-13 Sun Microsystems, Inc. System and method for referencing object instances and invoking methods on those object instances from within a speech recognition grammar
WO2001075579A2 (en) 2000-03-31 2001-10-11 Qualcomm Incorporated Method and apparatus for electronic device feature access
US20020024539A1 (en) * 2000-05-08 2002-02-28 Columbia University System and method for content-specific graphical user interfaces
EP1158799A1 (en) * 2000-05-18 2001-11-28 Deutsche Thomson-Brandt Gmbh Method and receiver for providing subtitle data in several languages on demand
US6948135B1 (en) 2000-06-21 2005-09-20 Microsoft Corporation Method and systems of providing information to computer users
GB0015233D0 (en) * 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
US7539939B1 (en) 2000-07-25 2009-05-26 Creativepro.Com, Inc. Preview window to preview text in several different fonts simultaneously
US7027975B1 (en) 2000-08-08 2006-04-11 Object Services And Consulting, Inc. Guided natural language interface system and method
US7185001B1 (en) 2000-10-04 2007-02-27 Torch Concepts Systems and methods for document searching and organizing
US7130790B1 (en) * 2000-10-24 2006-10-31 Global Translations, Inc. System and method for closed caption data translation
US20020072914A1 (en) 2000-12-08 2002-06-13 Hiyan Alshawi Method and apparatus for creation and user-customization of speech-enabled services
JP3838029B2 (ja) 2000-12-18 2006-10-25 セイコーエプソン株式会社 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム
US7596791B2 (en) 2000-12-19 2009-09-29 Emc Corporation Methods and techniques for delivering rich Java applications over thin-wire connections with high performance and scalability
US7017123B2 (en) 2000-12-27 2006-03-21 National Instruments Corporation Graphical user interface including palette windows with an improved search function
US7085723B2 (en) * 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US6744451B1 (en) 2001-01-25 2004-06-01 Handspring, Inc. Method and apparatus for aliased item selection from a list of items
US7089237B2 (en) 2001-01-26 2006-08-08 Google, Inc. Interface and system for providing persistent contextual relevance for commerce activities in a networked environment
US6693651B2 (en) 2001-02-07 2004-02-17 International Business Machines Corporation Customer self service iconic interface for resource search results display and selection
US6778193B2 (en) 2001-02-07 2004-08-17 International Business Machines Corporation Customer self service iconic interface for portal entry and search specification
GB0103053D0 (en) 2001-02-07 2001-03-21 Nokia Mobile Phones Ltd A communication terminal having a predictive text editor application
US20020152255A1 (en) 2001-02-08 2002-10-17 International Business Machines Corporation Accessibility on demand
JPWO2002075538A1 (ja) 2001-03-19 2004-07-08 三菱電機株式会社 車載マルチメディア装置
US6948133B2 (en) 2001-03-23 2005-09-20 Siemens Medical Solutions Health Services Corporation System for dynamically configuring a user interface display
US7209912B2 (en) 2001-06-06 2007-04-24 Microsoft Corporation Wizard and help file search and management
US6983271B2 (en) 2001-06-13 2006-01-03 Microsoft Corporation Answer wizard drop-down control
US20020198714A1 (en) 2001-06-26 2002-12-26 Guojun Zhou Statistical spoken dialog system
JP3907161B2 (ja) 2001-06-29 2007-04-18 インターナショナル・ビジネス・マシーンズ・コーポレーション キーワード検索方法、キーワード検索端末、コンピュータプログラム
US6839896B2 (en) 2001-06-29 2005-01-04 International Business Machines Corporation System and method for providing dialog management and arbitration in a multi-modal environment
US6959294B2 (en) 2001-07-10 2005-10-25 Microsoft Corporation Context-based help engine and dynamic help
JP2003084794A (ja) 2001-09-07 2003-03-19 Olympus Optical Co Ltd 音声制御システム
US6985865B1 (en) 2001-09-26 2006-01-10 Sprint Spectrum L.P. Method and system for enhanced response to voice commands in a voice command platform
US7149550B2 (en) 2001-11-27 2006-12-12 Nokia Corporation Communication terminal having a text editor application with a word completion feature
US6785654B2 (en) * 2001-11-30 2004-08-31 Dictaphone Corporation Distributed speech recognition system with speech recognition engines offering multiple functionalities
US7137071B2 (en) 2001-12-12 2006-11-14 National Instruments Corporation System and method for providing suggested graphical programming operations
US7493259B2 (en) * 2002-01-04 2009-02-17 Siebel Systems, Inc. Method for accessing data via voice
US7062711B2 (en) 2002-01-30 2006-06-13 Sharp Laboratories Of America, Inc. User interface and method for providing search query syntax help
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
US7139713B2 (en) * 2002-02-04 2006-11-21 Microsoft Corporation Systems and methods for managing interactions from multiple speech-enabled applications
US7188066B2 (en) * 2002-02-04 2007-03-06 Microsoft Corporation Speech controls for use with a speech system
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US7174294B2 (en) * 2002-06-21 2007-02-06 Microsoft Corporation Speech platform architecture
US7113950B2 (en) 2002-06-27 2006-09-26 Microsoft Corporation Automated error checking system and method
AU2003262702A1 (en) 2002-08-23 2004-03-11 Jway Group, Inc. Extensible user interface (xui) framework and development environment
US7254784B2 (en) 2002-09-11 2007-08-07 Peter H. Chang User-driven menu generation system with multiple submenus
US7440941B1 (en) 2002-09-17 2008-10-21 Yahoo! Inc. Suggesting an alternative to the spelling of a search query
JP2004110613A (ja) 2002-09-20 2004-04-08 Toshiba Corp 制御装置、制御プログラム、対象装置及び制御システム
US7197494B2 (en) * 2002-10-15 2007-03-27 Microsoft Corporation Method and architecture for consolidated database search for input recognition systems
US7519534B2 (en) 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
CN100559463C (zh) * 2002-11-11 2009-11-11 松下电器产业株式会社 声音识别用辞典编制装置和声音识别装置
US6897683B2 (en) 2002-11-14 2005-05-24 Fyre Storm, Inc. Driver including first and second buffers for driving an external coil or first and second transistors
US7584102B2 (en) * 2002-11-15 2009-09-01 Scansoft, Inc. Language model for use in speech recognition
US7684985B2 (en) 2002-12-10 2010-03-23 Richard Dominach Techniques for disambiguating speech input using multimodal interfaces
JP4107093B2 (ja) 2003-01-30 2008-06-25 株式会社日立製作所 対話型端末装置及び対話アプリケーション提供方法
US20040243415A1 (en) * 2003-06-02 2004-12-02 International Business Machines Corporation Architecture for a speech input method editor for handheld portable devices
US20050027539A1 (en) * 2003-07-30 2005-02-03 Weber Dean C. Media center controller system and method
US7644065B2 (en) 2003-08-18 2010-01-05 Sap Aktiengesellschaft Process of performing an index search
US7133950B2 (en) 2003-08-19 2006-11-07 Sun Microsystems, Inc. Request arbitration in multi-core processor
US7490286B2 (en) 2003-09-25 2009-02-10 International Business Machines Corporation Help option enhancement for interactive voice response systems
US7949960B2 (en) 2003-09-30 2011-05-24 Sap Ag Predictive rendering of user interfaces
US20050075857A1 (en) * 2003-10-02 2005-04-07 Elcock Albert F. Method and system for dynamically translating closed captions
US20050108026A1 (en) * 2003-11-14 2005-05-19 Arnaud Brierre Personalized subtitle system
US20050114319A1 (en) 2003-11-21 2005-05-26 Microsoft Corporation System and method for checking a content site for efficacy
US7356472B2 (en) 2003-12-11 2008-04-08 International Business Machines Corporation Enabling speech within a multimodal program using markup
US7526735B2 (en) * 2003-12-15 2009-04-28 International Business Machines Corporation Aiding visual search in a list of learnable speech commands
US20050138559A1 (en) 2003-12-19 2005-06-23 International Business Machines Corporation Method, system and computer program for providing interactive assistance in a computer application program
US20050166148A1 (en) 2004-01-28 2005-07-28 Garding Phillip D. Interactive user message system and method
US7406696B2 (en) * 2004-02-24 2008-07-29 Dialogic Corporation System and method for providing user input information to multiple independent, concurrent applications
US8712986B2 (en) 2004-04-07 2014-04-29 Iac Search & Media, Inc. Methods and systems providing desktop search capability to software application
US20060200827A1 (en) 2005-02-18 2006-09-07 Sidlosky Jeffrey A J Methods and systems providing desktop search capability to software application
US20050240558A1 (en) 2004-04-13 2005-10-27 Reynaldo Gil Virtual server operating on one or more client devices
CN1697515A (zh) * 2004-05-14 2005-11-16 创新科技有限公司 字幕翻译引擎
US7346846B2 (en) 2004-05-28 2008-03-18 Microsoft Corporation Strategies for providing just-in-time user assistance
US7627821B2 (en) 2004-06-15 2009-12-01 Microsoft Corporation Recording/playback tools for UI-based applications
US20050283473A1 (en) 2004-06-17 2005-12-22 Armand Rousso Apparatus, method and system of artificial intelligence for data searching applications
US20060036438A1 (en) 2004-07-13 2006-02-16 Microsoft Corporation Efficient multimodal method to provide input to a computing device
US20060048060A1 (en) 2004-08-31 2006-03-02 Julia Mohr Intelligent personalization based on usage analysis
US20060053384A1 (en) 2004-09-07 2006-03-09 La Fetra Frank E Jr Customizable graphical user interface for utilizing local and network content
US8185427B2 (en) 2004-09-22 2012-05-22 Samsung Electronics Co., Ltd. Method and system for presenting user tasks for the control of electronic devices
US8677274B2 (en) 2004-11-10 2014-03-18 Apple Inc. Highlighting items for search results
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US20060136195A1 (en) * 2004-12-22 2006-06-22 International Business Machines Corporation Text grouping for disambiguation in a speech application
US8108798B2 (en) 2004-12-29 2012-01-31 Sap Ag Method and system for implementing enhanced buttons in a graphical user interface
US7523404B2 (en) 2004-12-30 2009-04-21 Sap Aktiengesellschaft System and method for generating complex character-based computing interfaces
US20060155687A1 (en) 2005-01-13 2006-07-13 Bridgewell Inc. Portable database search agent processing system
US20060168522A1 (en) 2005-01-24 2006-07-27 Microsoft Corporation Task oriented user interface model for document centric software applications
US7505965B2 (en) 2005-01-27 2009-03-17 Microsoft Corporation Systems and methods for providing a user interface with an automatic search menu
US20060184899A1 (en) 2005-02-11 2006-08-17 Research In Motion Limited System and method for context specific content handling
US7600199B2 (en) 2005-04-20 2009-10-06 Microsoft Corporation Task-based interface with underlying extensible framework
US7703037B2 (en) 2005-04-20 2010-04-20 Microsoft Corporation Searchable task-based interface to control panel functionality
US7647312B2 (en) 2005-05-12 2010-01-12 Microsoft Corporation System and method for automatic generation of suggested inline search terms
US7596754B2 (en) 2005-07-28 2009-09-29 Microsoft Corporation Application assistance
US20080065617A1 (en) 2005-08-18 2008-03-13 Yahoo! Inc. Search entry system with query log autocomplete
US7921375B2 (en) 2005-12-16 2011-04-05 Microsoft Corporation Integrating user interfaces from one application into another
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US8589374B2 (en) * 2009-03-16 2013-11-19 Apple Inc. Multifunction device with integrated search and application selection

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881276A (zh) * 2014-02-27 2015-09-02 福特全球技术公司 动态命令歧义消除
CN106471570A (zh) * 2014-05-30 2017-03-01 苹果公司 多命令单一话语输入方法
CN106471570B (zh) * 2014-05-30 2019-10-01 苹果公司 多命令单一话语输入方法
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method

Also Published As

Publication number Publication date
KR20060055313A (ko) 2006-05-23
JP2006146182A (ja) 2006-06-08
US8942985B2 (en) 2015-01-27
US10748530B2 (en) 2020-08-18
ATE459076T1 (de) 2010-03-15
US9972317B2 (en) 2018-05-15
CN1776583B (zh) 2013-01-02
KR101143034B1 (ko) 2012-05-11
JP4854259B2 (ja) 2012-01-18
US20060106614A1 (en) 2006-05-18
US20150095030A1 (en) 2015-04-02
DE602005019518D1 (de) 2010-04-08
US20170032786A1 (en) 2017-02-02
EP1657709A1 (en) 2006-05-17
EP1657709B1 (en) 2010-02-24

Similar Documents

Publication Publication Date Title
CN1776583A (zh) 解释语音命令的集中式方法和系统
CN109658932B (zh) 一种设备控制方法、装置、设备及介质
CN102469363A (zh) 带有语音评论功能的电视系统及语音评论方法
CN101501775A (zh) 媒体时间线处理基础结构
CN1680935A (zh) 通过用户建模的有效大写化
US8768744B2 (en) Method and apparatus for automated user review of media content in a mobile communication device
CN1381970A (zh) 在不同种类的网络上分配多媒体数据的方法和系统
CN1132174C (zh) 在光盘重放系统上显示选择按键的方法及其设备
CN1760974A (zh) 用于语音分类和语音识别的隐藏条件随机场模型
CN101046956A (zh) 交互式音效产生方法及系统
CN1265770A (zh) 基于av/c盘媒体播放器/记录器子单元的模型和命令集
CN1779781A (zh) 字符的受控处理
CN1735185A (zh) 对齐视频数据以创建全面的程序向导
CN1783212A (zh) 转换文本为语音的系统和方法
CN101079301A (zh) 文本映射到音频并动画文本的设备及方法
JP6850321B2 (ja) 情報を生成するための方法と装置
CN101325502A (zh) 基于文本-语音转换生成并处理数字内容的方法和系统
CN1322348A (zh) 语音识别设备和消费者电子系统
CN1189836C (zh) 使用数字音频和字幕数据的学习方法和装置
US8030563B2 (en) Electronic audio playing apparatus and method
CN1728269A (zh) 乐曲选择装置、乐曲选择系统以及乐曲选择方法
CN105654973A (zh) 一种音频文件处理方法及系统
CN108687779A (zh) 一种家用机器人的舞蹈开发方法和系统
CN109065018B (zh) 一种面向智能机器人的故事数据处理方法及系统
US20190152061A1 (en) Motion control method and device, and robot with enhanced motion control

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150429

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150429

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.