CN1938757B - 用于驱动多个应用的方法和对话管理系统 - Google Patents
用于驱动多个应用的方法和对话管理系统 Download PDFInfo
- Publication number
- CN1938757B CN1938757B CN2005800100935A CN200580010093A CN1938757B CN 1938757 B CN1938757 B CN 1938757B CN 2005800100935 A CN2005800100935 A CN 2005800100935A CN 200580010093 A CN200580010093 A CN 200580010093A CN 1938757 B CN1938757 B CN 1938757B
- Authority
- CN
- China
- Prior art keywords
- icons
- application
- management system
- user
- audible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Abstract
本发明描述一种通过公共对话管理系统(1)来驱动多个应用(A1、A2、A3...、An)的方法。其中,将唯一的听觉图标集(S1、S2、S3...、Sn)分配给每一应用(A1、A2、A3...、An)。公共对话管理系统(1)通过在对话流的特定点上重放从相应应用(A1、A2、A3...、An)的唯一的听觉图标集(S1、S2、S3...、Sn)中选择的相关听觉图标(I1、I2、I3...、In)而向用户告知应用(A1、A2、A3...、An)的状态。而且本发明描述了一种对话管理系统(1),其包括:输入检测装置(4),用于检测用户对系统的输入(5);声音输出装置(6),用于输出听得见的声音(7);核心对话引擎(8),用于通过解释用户输入(5)而调整对话流并且合成听得见的声音输出(7);应用接口(10),用于对话管理系统(1)和应用(A1、A2、A3...、An)之间的通信;被分配给应用(A1、A2、A3...、An)的唯一的听觉图标集(S1、S2、S3...、Sn)的源;以及听觉图标管理单元(11),用于选择与应用(A1、A2、A3...、An)相对应的相关听觉图标(I1、I2、I3...、In)以便在对话流中的特定点处重放。
Description
技术领域
本发明总体涉及一种用于通过公共的至少部分基于语音的对话管理系统来驱动多个应用的方法以及用于驱动多个应用的对话管理系统。
背景技术
人机接口领域的近来发展已经导致借助于应用和应用用户之间的对话来管理或驱动的技术设备或应用的广泛使用。大多数对话管理系统是基于可视信息的显示和在用户部分上的手动交互。例如,用户利用个人数字助理而能够进入对话或对话流以便计划约会或读取输入的邮件。通过对话管理系统发布提示来执行该对话,其中用户借助于笔或键盘输入来响应所述提示。用户能够请求所述应用以报告正在出现的或者在不久的将来将出现的事件。例如,个人数字助理能够向用户提示即将到来的约会或重要日子。可以在显示器上图形表示所述提示,并且该提示伴有诸如嘟嘟声、咻咻声或相似的人工声响那样听得见的提示,以便引起用户的注意并且提示他看显示器以便看见应用所传递的消息或提示。可以将同一类型的嘟嘟声或咻咻声用作为一般引起注意的设备,或者可以使用几种不同类型的声音以指示不同类型的事件。在播放术语中,所述的嘟嘟声通常被称为“耳标(earcon)”,即图标的可听到的等价物。
只要在用户和唯一一个应用之间执行所述对话,记住哪一个耳标或嘟嘟声与哪一个事件有关并不是特别困难。然而,如果对话管理系统管理用户和多个应用之间的对话,那么由于用于指示不同类型事件的声音通常被限于嘟嘟声和其他人工发生电子噪声,所以会变得相当混乱。用户会被混淆并且将一种类型的声音误认为是另一种,从而曲解该对话流。
然而,至少部分的基于语音的对话管理系统允许用户进入一种与应用的单向或双向的口头对话。用户能够发布口头命令并且从对话系统接收可视或听得见的反馈。一种所述的实例是家用电子管理系统,其中用户发布口头命令以激活例如视频记录器那样的设备。另一实例可以是车辆中导航设备或另一设备的操作,其中用户询问设备的问题或者向设备发出命令,其给出响应或反过来提出问题。更先进的对话管理系统能够发布口头提示并且解释口头用户输入。例如如果用户希望检查他的电子邮箱的状态,他可以说“检查我的邮箱”,对话管理系统在转发必要的命令给应用和解释报告回的结果之后会适当地回答“你有邮件”或者“邮箱是空的”。然而,这种口头反馈会使人愤怒,即使其被限制成简洁的短语时也能够激怒人,特别是如果对话管理系统同时驱动多个应用。例如,如果对话管理系统控制个人数字助理、个人计算机、电话、家庭娱乐系统和新闻及天气服务之间的对话,那么以类似于“来自于某某先生的呼叫”、“天气持续晴好”、“拜仁慕尼黑和皇家马德里之间的比赛5分钟后在频道XYZ上开始-我应当记录它吗?”、“在接下来的两周中检查与牙科医生的约会-你想预约吗?”以及“5分钟后与互联网连接超时”等等的语音反馈持续质问用户。用户最终会被正在输出的音量分心,即使该消息是相关的、该信息已经被专门请求的。
在Nitin Sawnhey于1998年在Massachusetts Institute ofTechnology所作的理学硕士论文“Contextual Awareness,Messaging andCommunication in Nomadic Audio Environments”中进行了一种尝试,试图提供一种经由作为语音反馈的伴随物的听觉图标而向用户告知应用的状态的对话管理系统。该草案描述了一种能够与远程服务器对接的便携设备。通过通常戴在用户翻领上的便携音频设备而能够报告服务器上激活的一个或多个程序的状态。该设备限于仅从在所述远程服务器上运行的不同程序中接收消息并且监控这些程序的活动(所有相似的属性),从而能够实际上将它们认为是单个应用。但是在该草案中并没有预见:通过其中用户既能监控又能控制这些不同应用的公共对话系统进行的多个独立应用的实际驱动,甚至是不同属性的应用的实际驱动。
发明内容
所以,本发明的一个目标是提供一种容易、廉价的方法,确保用户进行不同应用之间舒适和简单的区别,其中用户使用公共对话管理系统和不同的应用程序进行交互,该方法尤其确保了:用户将不会把预定用于一个应用的命令错误地发布到另一个应用。
为此目的,本发明提供一种用于通过公共对话管理系统来驱动多个应用的方法,其中向每一应用分配唯一的听觉图标集,并且其中公共对话管理系统通过在对话流的特定点上听得见的重放从应用唯一的听觉图标集中选择的相关听觉图标而向用户告知该应用的状态,其中所述对话管理系统通过修改应用的听觉图标集中非唯一的听觉图标和/或从听觉图标的集合中选择用于应用的唯一的听觉图标而向该应用提供唯一的听觉图标集。
“听觉图标(auditory icon)”可以是任意类型的声音或用于描述来自应用的特定类型的反馈的专用声音块,诸如人工短音块(耳标)或者类似于现实声音的声音块,诸如相关声音的录音。
根据本发明的对话管理系统包括:输入检测装置,用于检测用户对系统的输入;声音输出装置,用于输出听得见的提示;核心对话引擎,用于通过解释用户输入和产生输出提示来协调对话流;应用接口,用于对话管理系统和应用之间的通信;被分配给应用的唯一的听觉图标集;和听觉图标管理单元,用于从与应用相对应的唯一的听觉图标集中选择用于在对话流中的特定点上重放的相关听觉图标,其中所述对话管理系统通过修改应用的听觉图标集中非唯一的听觉图标和/或从听觉图标的集合中选择用于应用的唯一的听觉图标而向该应用提供唯一的听觉图标集。
使用根据本发明的对话管理系统来驱动多个应用,用户能够很容易地区分来自于不同应用的不同类型的反馈。由于应用所报告回的每一类型的反馈伴有唯一意义的听觉声音,用户很容易将其与相应的应用相关联,所以用户没有被混淆的危险,并且将不会把一种类型的反馈与另一种类型的反馈弄错。唯一的听觉图标使用户总是知晓有关他当前正在交互的应用的信息。这确保了用户不会把预定用于一个应用的命令错误地发布到另一个应用。因此,本发明特别有利于专门的语音控制的对话管理系统;或者特别有利于这样一种应用,其中对于用户而言,必须看屏幕以跟踪对话是行不通的或者危险的,所述系统诸如是用户不能转移对交通的注意力的自动导航系统,或外科医生在总是知晓该手术过程状态的同时必须保持集中精力于正在进行的手术过程的计算机辅助外科手术过程。因此,本发明允许通过公共对话系统来驱动甚至不同属性的多个独立的应用以及允许用户监控和控制该应用。
本发明特别公开了本发明的优选实施例和特征,借助于此,根据本发明的特征而能够进一步开发该系统。
可以将根据本发明的对话管理系统结合到已存在的设备中,诸如PC、电视、录像机等等,并且将家庭和/或办公室环境中运行的各种应用的状态告知用户。在优选的实施例中,将对话管理系统实施为具有诸如机器人或优选为人的物理形态的独立设备。可以将对话系统实现为例如DE10249060A1所述的以如下方式构造的专用设备:具有示意性面部特征的可移动部分能够面向用户,给出该设备正倾听用户的印象。甚至可以以如下方式构建对话管理系统:当用户从一个房间到另一房间时,其能够伴随着用户。可以借助于电缆来实现对话管理系统和个别应用之间的接口。优选的是,以无线方式来实现该接口,诸如红外线、蓝牙等等,这样对话管理系统基本上保持可移动,并且并非限制于定位在其用于驱动的应用附近。如果无线接口足够的可达到范围(reach),那么能够很容易地使用对话管理系统来为位于建筑物中不同房间的设备控制多个应用,所述建筑诸如办公大楼或私人住宅。优选地在专用应用接口单元中管理对话管理系统和个别应用之间的接口。在此,通过将根据口头用户输入而解释的任何命令或指令转发到每一应用并且通过从应用接收预定用于用户的反馈来管理应用和对话管理系统之间的通信。应用接口单元能够以并行的方式处理几个应用。
由对话管理系统所驱动的应用可以是作为软件而在个人计算机、网络,或任何由处理器或简单电路控制的电子设备(诸如家用的加热系统、微波炉等等)上运行的程序。同样,可以理解应用能够控制通常不受控于处理器的机械的或物理的设备或对象。所述设备或对象可以纯粹为一种机械设备或对象,例如信箱。所述对象可以具备适当的传感器和到对话管理系统的接口,这样例如当信投入到信箱时通知对话管理系统。然后通过适当的听觉图标而将该事件通知给用户,诸如驿车喇叭声。所以对话管理系统的用户在没有实际前往或看到的情况下能够知道是否接收到邮政投递。根据本发明的对话管理系统的所述应用对于生活在高层公寓楼中的用户或者对于身体残疾的用户来说是特别有利的。根据季节而能够由用户再编程的诸如家用类型加热系统之类的加热系统可以由根据本发明的对话管理系统控制。用户在外出休假之前借助于口头命令利用对话管理系统能够容易地再编程加热系统,从而省略了花费时间手动再编程的必要性。对话管理系统能够向用户报告加热系统的状态,从而相关的提示可以伴有适当的听觉图标。也能够将应用理解为基本的电子设备,诸如对讲机或电话。在此,对话管理系统可以通过适当的接口连接到对讲机或电话,并且在用户实际上起初没有开门或拿起电话接听器的情况下通过发送适当的听觉图标(例如来访者在门口敲击门的木头的声音)以将事件告知用户,从而能够帮助用户应付来访者或打进来的电话。
用户对对话管理系统的输入可以是有声的,这样通过输入检测装置(例如麦克风)记录用户的口头命令或注释。如果对话管理系统并非只能语音控制,那么输入检测装置或许还包括键盘、鼠标、或多个按钮,借助于它们,用户能够向系统输入命令。一种先进的输入检测装置甚至特征在于用于感测用户移动的照相机,这样用户通过手势(例如通过挥动他的手或摇动他的头)而与对话管理系统进行通信。对话管理系统解释用户输入,确定预定要使用该用户输入的应用,并且将用户输入转换成该应用能够理解的恰当形式。
分析口头用户输入的内容,借助于核心对话引擎将来自应用的反馈转换成输出提示。对话管理系统通过声音输出装置(优选为一个或多个扬声器)与用户进行通信,以输出听得见的提示,该听得见的提示是响应于来自应用的反馈而由核心对话引擎产生的。
核心对话引擎包括用于执行语音识别和语音合成的普通步骤的一些单元或模块,诸如语言理解单元,语音合成单元等等。对话控制单元解释由语言理解单元所识别的文本,识别预定使用它的应用,并且将其转换为适于由该应用处理的形式。此外,对话控制单元对从应用到来的反馈进行分析并且将从与该应用相关联的唯一的听觉图标集中选择的适当的听觉图标转发到输出声音装置。听得见的提示包括听觉图标,其被理解为用于描述来自应用的特定类型反馈的专用声音块。
应用使用听觉图标以指示对话流期间的任何事件,或者指示发生用户可能感兴趣的特定事件,诸如电子邮件的到达。此外例如如果用户无意中听到提示,可以使用听觉图标来指示该应用正等待用户响应。优选的是,使用听觉图标以指示应当告知用户的应用操作状态的任何改变。
应用特征在于:在应用能够向用户提供关于其状态或活动的反馈的任何情况下使用的完整听觉图标集。在本发明的优选实施例中,应用向对话管理系统提供其听觉图标集的副本,以及任何相关的指令或有关恰当使用或重放每一个听觉图标的附带信息。通过对话管理系统在听觉图标管理单元中管理这些图标,该单元了解哪一个听觉图标被分配给哪一个应用,以及使用每一听觉图标的反馈类型。对话管理系统在用户和应用之间对话流的开始阶段获得整个听觉图标集,或者一旦首次激活或安装该应用就获得整个听觉图标集,并且听觉图标管理单元将有关听觉图标及其相关指令的所有信息存储在本地存储器中以在随后的时间点上使用。以这种方式,对话管理系统确保:其具有不管在对话流期间会出现什么情况可以需要向用户提供适当反馈的任何听觉图标。
可替换地,对话管理系统首先请求应用为其集合中的每一听觉图标仅提供相关的识别信息,诸如唯一描述性的名称或号码,以及与不同听觉图标相关联的一些使用指令。然后,仅当必要时,对话管理系统请求每一听觉图标,以便减少存储器成本。对话管理系统基于先前的对话流同样确定在不久的将来为特定应用请求哪一种类型的听觉图标,并且其预先从应用中请求该听觉图标。
对于一种不利用预定义的听觉图标集的应用来说,对话管理系统能够提供适当的集合。为此目的,对话管理系统能够确定应用的属性并判定适当的听觉图标集,或者用户会选择自己定义听觉图标。他通过定位数字形式的声音块来实现此,例如通过从互联网上下载或者从音带或歌曲中提取适当的声音块,或者他使用记录装置来记录声音块并且将该记录传递给对话管理系统。例如,他记录或获得快速驱动的一级方程式赛车的记录,将该记录传递该对话管理系统,在该对话管理系统中通过听觉图标管理单元而将所述记录存储到本地存储器,并且指定无论何时用于提供运动新闻的应用报告一级方程式赛车的最新消息,就播放该声音块。用户也可以有利地使用对话管理系统的麦克风以记录适当的声音块。在本发明优选的实施例中,对话管理系统具有连接到诸如USB棒、存储卡之类的便携存储器或者连接到诸如互联网之类的外部网络以便定位和下载作为听觉图标使用的声音块的适当接口。
在本发明特别优选的实施例中,对话管理系统能够向应用提供具有其所需要的一些听觉图标。例如,可以是:应用仅处理一或两个听觉图标,例如来指示处理的开始,或者指示发生差错,需要引起用户的注意。然而,对于用户和应用之间直观和简单理解的对话流而言,这种少的选择不是足够的。在该情况下,对话管理系统从可用的选择中选择适当的听觉图标集,并且将它们分配给应用。而且,可以是:两个或多个应用在它们的清单中具有相似或相同的听觉图标。为了避免如果同时激活两个应用可能出现的用户部分上的任何混淆,对话管理系统以某种方式修改这些听觉图标,或者通过不同的、同样适当的听觉图标来替换这些听觉图标。例如,在载入新的应用的时候,对话管理系统检查与新的应用相关的听觉图标,并且将它们与已经分配给另一个应用的听觉图标相比较。如果任何一个新的听觉图标与任何一个现有的听觉图标相同或者非常相似,那么对话管理系统优选地告知用户,并且如果其有可用的,就建议适当的替换。如果没有适当可替换的听觉图标可使用,那么对话管理系统会提示用户输入适当的替换。
应用使用以便向用户提供听得到的反馈的听觉图标实例是:开始听觉图标,当激活或者从备用状态重新激活用户和应用之间的对话流时就开始播放;和结束听觉图标,当结束、去激活或者使用户和应用之间的对话流处于备用模式的时候播放。开始听觉图标本身应该反映应用的属性,而结束听觉图标可以仅仅是以逆顺序播放的开始图标的声音。应用也可以使用信息性听觉图标,其声音包含一些有关应用属性或者与该听觉图标相关联的实际反馈类型的线索。例如,用于提供天气预报更新的应用可以播放具有与天气相关的声音的听觉图标,诸如暴风雨天气的风、下雨天气的雨点和晴朗天气的鸟声。听觉图标的其他实例是那些在应用激活的时间期间提供状态或信息更新的听觉图标。例如,运行个人数字助理的应用具有一些听觉图标,其用于向用户提供涉及约会、到来的邮件、报告的到期日等等不同类型的状态反馈。例如,个人数字助理使用适当的听觉图标向用户重复提醒即将到来的约会,随着约会的临近,提醒变得越来月持久。
在本发明优选的实施例中,用户可以通过向用户简档(user profile)输入适当的信息来指定在对话流期间他喜欢听哪个应用的哪个听觉图标。他也可以指定听觉图标的音量,以及在对话流期间听觉图标被播放的次数。另外,他能够向不同的应用分配优先级,以便来自于对讲机的反馈获取的优先级高于诸如个人数字助理那样的应用。通过这种方法,如果在对话流中较高和较低优先级应用同时报告反馈,用户确保:他将始终被告知较高优先级的应用。规律地或在听觉图标管理单元进行的每一次修改之后,能够咨询用户简档,以确定是否应该重放听觉图标、期望的音量、以及在该对话流期间能够重放该听觉图标的次数。
在进一步优选的实施例中,对话管理系统通过解释对话流而能够推出用户偏爱。例如,如果应用借助于适当的听觉图标报告即将到来的约会的提醒,并且用户回复“我知道,我知道”,那么对话管理系统能够将其解释为这表明用户不需要再次的提醒,并且抑制下次由应用所启动的该反馈的听觉图标。在用户简档中也可以通过用户来指定对话管理系统部分上“智能”解释的水平。例如对一个以上用户所使用的对话管理系统而言,优选地配置多个用户简档,这样每一用户具有自身的私有用户简档,在该简档中,用户能够指定他自己的个人偏爱。
根据本发明的对话管理系统通过实现软件模块或计算机程序产品而能够执行上述的一些处理步骤。所述计算机程序产品可以直接载入到可编程的对话管理系统的存储器。诸如核心对话引擎、应用接口单元和听觉图标管理单元之类的一些单元或模块因此能够以计算机程序模块的形式来实现。由于可以在硬件设备的处理器上编码任一所需的软件或算法,所以现有的电子设备能够很容易地受益于本发明的特征。作为替换,以上述方式来处理用户输入和输出提示的单元或块同样能够使用硬件模块来实现。
结合附图以进行随后的详细描述,这些详细描述将使得本发明其他目的和特征变得显而易见。然而,应该理解,附图仅仅是说明性的,而非对本发明的限制。
附图说明
单个图,图1是根据本发明实施例的对话管理系统的示意性方框图。
在附图的描述中,不排除实现本发明的其他可能性,系统被示为用户设备(例如家庭对话系统)的一部分。为清楚起见,图形中不包括用户和本发明之间的接口。
图1示出了具有用于与多个外部应用A1、A2、A3...、An进行通信的多个接口的对话管理系统1。以简化方式而被示为块的应用A1、A2、A3...、An事实上能够是任一种类的用户愿意被告知或者用户愿意以某种方式控制的“应用”或“功能”。在该实施例中,除了别的以外,应用A1、A2、A3...、An可以包括个人数字助理A1、新闻和天气服务A2和电话A3。
具体实施方式
对话管理系统1的特征在于:应用接口10,用于处理对话管理系统1和应用A1、A2、A3...、An之间传递的输入和输出信息。此外,其特征在于,当将播放一些听觉图标时,对话管理系统1能够获得来自于每一应用A1、A2、A3...、An的有关任何听觉图标I1、I2、I3...、Im的信息。该信息被存储在听觉图标管理单元11中。在该实例中,例如当启动或引导其中一个应用A1时,该应用A1可以向对话管理系统1自动提供与它的听觉图标集S1、S2、S3、S4、...相关的所有相关信息。另一应用A3可以预先仅提交有关其听觉图标的描述性信息,并且一旦在对话流实际需要听觉图标的情况下请求,就提交单个听觉图标。当需要时,或者当启动应用A1、A2、A3...、An时,对话管理系统1能够请求应用A1、A2、A3...、An提供与一个或多个听觉图标I1、I2、I3...、Im相关的信息。
并非所有的应用在其处理中具有完整的适当的听觉图标集。一些应用根本就没有任何听觉图标,并且一些应用甚至具有相同的听觉图标。为处理所述情况,听觉图标管理单元11通过从预定义的听觉图标13的集合中选择适当的一些而能够将听觉图标分配给应用A2。对于所述应用而言,用户更希望让听觉图标管理单元11向应用A2分配特定的声音记录。例如,当天气服务A2报告晴朗天气时,用户喜欢听鸟鸣的声音。如果预报暴风雨的天气,那么用户喜欢听打雷的声音。用户可以经由用户接口15以适当的格式输入这些记录作为音频数据,并且让听觉图标管理单元11将它们分配到天气服务应用A2。向听觉图标管理单元11提供所述记录的另一种方式是经由适当的接口14从外部计算机或诸如互联网那样的网络12下载它们。
这些获得听觉图标信息的不同方式允许对话管理系统1收集其所需的所有信息,以便在对话流中重放所需的相关听觉图标。
在该实例中,对话流由附图中未示出的用户与对话管理系统1所驱动的各种应用A1、A2、A3...、An之间的通信组成。用户通过麦克风5向对话管理系统1发布口头命令或请求。该口头命令或请求在输入检测装置4中记录和数字化,所述输入检测装置4将已记录的语音输入传递到核心对话引擎8。该引擎8包括用于执行语音识别所包括的普通步骤的一些块-音频接口块20在将输入语音信号转发到自动语音识别器21之前对其执行一些必要的数字信号处理。其从输入音频信号中提取任何可识别的语音分量并且将这些语音分量转发到语言理解块22。在语言理解块22中,用户的口头命令或请求被分析相关性并且以适当的方式传递到对话控制器23,该对话控制器23将用户输入转换为能够被适当的应用A1、A2、A3...、An执行的命令或请求。
如果需要从用户获得一些进一步的信息,例如,如果自动语音识别器21和语言理解块22不能够分析或理解口头命令,或者如果不能够将口头命令应用到激活应用A1、A2、A3...、An中的任何一个,那么对话控制器23产生适当的请求并且将这些请求转发到语音产生器24,这些请求在语音产生器中被合成为语音。音频接口块20对输出语音信号执行必要的数字信号处理,然后在诸如扬声器之类的声音输出装置6中转换以给出听得见的声音7。
在图1的对话管理系统所控制的对话流的典型实例中,用户希望向他的个人数字助理A1的日记中输入一约会。他需要做的仅仅是说“输入在下周一上午11点预约税金顾问”。核心对话引擎8将所述命令转换成适当的形式并且将其提交到个人数字助理应用A1。如果可以在没有任何问题的情况下将约会输入到个人数字助理A1,那么向对话管理系统1报告适当的反馈,所述对话管理系统1选择适当的证实反馈输出,诸如输出口头的“OK”或者“Roger”。
如果在那天的同一时间已经排定了约会,那么个人数字助理A1向对话管理系统1(在该系统中应用接口10和/或对话控制器23解释该应用的响应)返回报告,并且选择适当的听觉图标(例如撞击钹的声音)以向用户指示:新的约会与已经输入的约会冲突。另外,对话控制器23触发产生适当的提示,例如“你已经与某某先生在上午11点有约会”。可选的是,如果用户不希望详细的反馈,那么用户可以撤消提示输出。
在该实例中,用户在用户简档中指定他的有关重放听觉图标的偏爱以制定或配置到以下程度,即他希望被告知有关他所使用的应用中出现的事件以及哪些应用被给予了对话流中较高的优先级。这些偏爱持续直到在随后的某时间上由用户改变,或者它们或许是暂时的属性。例如,用户会告诉对话管理系统在一定的时间段内如何反应。例如,当用户说“除非确实重要,在接下来的两个小时中不要打断我”的时候,对话管理系统抑制在随后的两个小时期间出现的次要事件的报告,诸如自动天气更新,并且将所有相对不重要的事件推迟两个小时,诸如即将到来的已排定约会的24小时提醒-“明天下午3点约会牙科医生”。在指定时间期间仅仅相对重要的事件诸如已经排定的约会“在15分钟内与指导者约见”或者由电话应用A3中所标记的来自客户的重要电话呼叫会打断用户。对话管理系统通过检查用户简档3中所指定的信息来判定什么是重要的以及什么是相对不重要的。
如果两个或多个应用指示:在同一时间播放听觉图标,那么其他的偏爱可以指定给予应用的优先级。在该情况中,用户在用户简档13中指定:电话A3将被分配比新闻和天气服务A2高的优先级。如果新闻和天气服务A2正打算给出其自动的新闻更新,并且呼入呼叫在同一时间到达,那么应用接口10确认电话应用A3具有较高的优先级,并且抑制新闻和天气服务A2的听觉图标,其可以被延迟到在随后的时间点上输出。
尽管以优选实施例和其变形的形式描述了本发明,但是应该理解:在不脱离发明范围的情况下能够进行另外的修改和变化,例如可以将听觉图标管理单元实现为核心对话引擎的一部分,或者结合到诸如对话控制器那样的另一模块中。在本发明的一个实施例中,对话系统在处理一些发声之后能够确定当前用户的声音质量,或者用户通过输入识别代码而可以使得自己被所述系统认出,然后可以使用识别代码以访问所存储的用户简档信息,进而又可以使用所述用户简档信息以产生用于音频接口的适当的控制参数。
为简单起见,整个申请中,应该理解的是,所使用的“一”或“一个”不排除多个,并且“包括”不排除其他的步骤或元件。所使用的“单元”或“模块”不限制以单个单元或模块来实现。
Claims (11)
1.一种用于通过公共对话管理系统来驱动多个应用的方法,其中将唯一的听觉图标集分配给每一应用,并且其中所述公共对话管理系统通过在对话流的特定点上重放从相应应用的唯一的听觉图标集中选择的相关听觉图标而向用户告知应用的状态,
其中所述对话管理系统通过修改应用的听觉图标集中非唯一的听觉图标和/或从听觉图标的集合中选择用于应用的唯一的听觉图标而向该应用提供唯一的听觉图标集。
2.根据权利要求1的方法,其中重放应用的听觉图标,以便向用户指示应用的操作状态的改变。
3.根据权利要求1或2的方法,其中应用将听觉图标集以及涉及所述听觉图标的使用的相关指令提交给所述对话管理系统。
4.根据权利要求3的方法,其中由所述对话管理系统获得应用的个别听觉图标的识别信息和相关指令,并且一旦请求,由所述对话管理系统从应用中检索听觉图标。
5.根据权利要求3的方法,其中在用户和应用之间的对话流一开始或者一旦激活或安装应用,由所述对话管理系统获取所述应用的完整的听觉图标集。
6.根据权利要求1或2的方法,其中用于在用户和应用之间在对话流中重放的听觉图标集包括用于在对话流开始时重放的至少一个唯一的开始听觉图标和/或用于在对话流结束时重放的至少一个唯一的结束听觉图标。
7.根据权利要求1或2的方法,其中用于在用户和应用之间在对话流中重放的听觉图标集包括用于在对话流期间在特定点上重放的多个唯一的提供信息的听觉图标,其中每一听觉图标描述来自所述应用的特定类型的反馈。
8.根据权利要求1或2的方法,其中为用户指定听觉图标和/或所述听觉图标的重放特性。
9.一种用于驱动多个应用的对话管理系统,包括:
输入检测装置,用于检测对该系统的用户输入;
声音输出装置,用于输出可听到的提示;
核心对话引擎,用于通过解释用户输入和产生输出提示来协调对话流;
应用接口,用于对话管理系统和应用之间的通信;
被分配给应用的唯一的听觉图标集;和
听觉图标管理单元,用于从与应用相对应的唯一的听觉图标集中选择相关的听觉图标,以便在对话流中的特定点上重放,
其中所述对话管理系统通过修改应用的听觉图标集中非唯一的听觉图标和/或从听觉图标的集合中选择用于应用的唯一的听觉图标而向该应用提供唯一的听觉图标集。
10.根据权利要求9的对话管理系统,进一步包括允许用户输入听觉图标的装置。
11.根据权利要求9或10的对话管理系统,进一步包括接口,所述接口用于从外部源中获得听觉图标集或个别的听觉图标。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04101295 | 2004-03-29 | ||
EP04101295.6 | 2004-03-29 | ||
PCT/IB2005/050956 WO2005093715A1 (en) | 2004-03-29 | 2005-03-21 | A method for driving multiple applications by a common dialog management system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1938757A CN1938757A (zh) | 2007-03-28 |
CN1938757B true CN1938757B (zh) | 2010-06-23 |
Family
ID=34961270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800100935A Expired - Fee Related CN1938757B (zh) | 2004-03-29 | 2005-03-21 | 用于驱动多个应用的方法和对话管理系统 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20080263451A1 (zh) |
EP (1) | EP1733383B1 (zh) |
JP (1) | JP2007531141A (zh) |
KR (1) | KR20060131929A (zh) |
CN (1) | CN1938757B (zh) |
AT (1) | ATE429010T1 (zh) |
DE (1) | DE602005013938D1 (zh) |
WO (1) | WO2005093715A1 (zh) |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6925357B2 (en) | 2002-07-25 | 2005-08-02 | Intouch Health, Inc. | Medical tele-robotic system |
US20040162637A1 (en) | 2002-07-25 | 2004-08-19 | Yulun Wang | Medical tele-robotic system with a master remote station with an arbitrator |
US7813836B2 (en) | 2003-12-09 | 2010-10-12 | Intouch Technologies, Inc. | Protocol for a remotely controlled videoconferencing robot |
US20050204438A1 (en) * | 2004-02-26 | 2005-09-15 | Yulun Wang | Graphical interface for a remote presence system |
US8077963B2 (en) | 2004-07-13 | 2011-12-13 | Yulun Wang | Mobile robot with a head-based movement mapping scheme |
US7689253B2 (en) | 2005-06-13 | 2010-03-30 | E-Lane Systems, Inc. | Vehicle immersive communication system |
US9198728B2 (en) | 2005-09-30 | 2015-12-01 | Intouch Technologies, Inc. | Multi-camera mobile teleconferencing platform |
SG186528A1 (en) * | 2006-02-01 | 2013-01-30 | Hr3D Pty Ltd Au | Human-like response emulator |
US8849679B2 (en) | 2006-06-15 | 2014-09-30 | Intouch Technologies, Inc. | Remote controlled robot system that provides medical images |
US9976865B2 (en) | 2006-07-28 | 2018-05-22 | Ridetones, Inc. | Vehicle communication system with navigation |
US9160783B2 (en) | 2007-05-09 | 2015-10-13 | Intouch Technologies, Inc. | Robot system that operates through a network firewall |
US10875182B2 (en) | 2008-03-20 | 2020-12-29 | Teladoc Health, Inc. | Remote presence system mounted to operating room hardware |
CA2719301C (en) * | 2008-03-25 | 2016-10-04 | E-Lane Systems Inc. | Multi-participant, mixed-initiative voice interaction system |
US8179418B2 (en) | 2008-04-14 | 2012-05-15 | Intouch Technologies, Inc. | Robotic based health care system |
US8170241B2 (en) | 2008-04-17 | 2012-05-01 | Intouch Technologies, Inc. | Mobile tele-presence system with a microphone system |
WO2009152614A1 (en) | 2008-06-19 | 2009-12-23 | E-Lane Systems Inc. | Communication system with voice mail access and call by spelling functionality |
US9193065B2 (en) | 2008-07-10 | 2015-11-24 | Intouch Technologies, Inc. | Docking system for a tele-presence robot |
US9842192B2 (en) | 2008-07-11 | 2017-12-12 | Intouch Technologies, Inc. | Tele-presence robot system with multi-cast features |
US9652023B2 (en) | 2008-07-24 | 2017-05-16 | Intelligent Mechatronic Systems Inc. | Power management system |
US8340819B2 (en) | 2008-09-18 | 2012-12-25 | Intouch Technologies, Inc. | Mobile videoconferencing robot system with network adaptive driving |
US8996165B2 (en) | 2008-10-21 | 2015-03-31 | Intouch Technologies, Inc. | Telepresence robot with a camera boom |
US8463435B2 (en) | 2008-11-25 | 2013-06-11 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US9138891B2 (en) | 2008-11-25 | 2015-09-22 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US9084551B2 (en) | 2008-12-08 | 2015-07-21 | Medtronic Xomed, Inc. | Method and system for monitoring a nerve |
US8335546B2 (en) * | 2008-12-19 | 2012-12-18 | Harris Technology, Llc | Portable telephone with connection indicator |
US8849680B2 (en) | 2009-01-29 | 2014-09-30 | Intouch Technologies, Inc. | Documentation through a remote presence robot |
US8897920B2 (en) | 2009-04-17 | 2014-11-25 | Intouch Technologies, Inc. | Tele-presence robot system with software modularity, projector and laser pointer |
EP2436224A4 (en) | 2009-05-28 | 2012-12-05 | Intelligent Mechatronic Sys | COMMUNICATION SYSTEM WITH PERSONAL INFORMATION MANAGEMENT AND REMOTE VEHICLE MONITORING AND CONTROL CHARACTERISTICS |
US9667726B2 (en) | 2009-06-27 | 2017-05-30 | Ridetones, Inc. | Vehicle internet radio interface |
US11399153B2 (en) | 2009-08-26 | 2022-07-26 | Teladoc Health, Inc. | Portable telepresence apparatus |
US8384755B2 (en) | 2009-08-26 | 2013-02-26 | Intouch Technologies, Inc. | Portable remote presence robot |
US9978272B2 (en) | 2009-11-25 | 2018-05-22 | Ridetones, Inc | Vehicle to vehicle chatting and communication system |
US11154981B2 (en) | 2010-02-04 | 2021-10-26 | Teladoc Health, Inc. | Robot user interface for telepresence robot system |
US8670017B2 (en) | 2010-03-04 | 2014-03-11 | Intouch Technologies, Inc. | Remote presence system including a cart that supports a robot face and an overhead camera |
US10343283B2 (en) | 2010-05-24 | 2019-07-09 | Intouch Technologies, Inc. | Telepresence robot system that can be accessed by a cellular phone |
US10808882B2 (en) | 2010-05-26 | 2020-10-20 | Intouch Technologies, Inc. | Tele-robotic system with a robot face placed on a chair |
US9264664B2 (en) | 2010-12-03 | 2016-02-16 | Intouch Technologies, Inc. | Systems and methods for dynamic bandwidth allocation |
EP2668008A4 (en) | 2011-01-28 | 2018-01-24 | Intouch Technologies, Inc. | Interfacing with a mobile telepresence robot |
US9323250B2 (en) | 2011-01-28 | 2016-04-26 | Intouch Technologies, Inc. | Time-dependent navigation of telepresence robots |
US10769739B2 (en) | 2011-04-25 | 2020-09-08 | Intouch Technologies, Inc. | Systems and methods for management of information among medical providers and facilities |
US9098611B2 (en) | 2012-11-26 | 2015-08-04 | Intouch Technologies, Inc. | Enhanced video interaction for a user interface of a telepresence network |
US20140139616A1 (en) | 2012-01-27 | 2014-05-22 | Intouch Technologies, Inc. | Enhanced Diagnostics for a Telepresence Robot |
US8836751B2 (en) | 2011-11-08 | 2014-09-16 | Intouch Technologies, Inc. | Tele-presence system with a user interface that displays different communication links |
US9934780B2 (en) * | 2012-01-17 | 2018-04-03 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch |
US9418674B2 (en) | 2012-01-17 | 2016-08-16 | GM Global Technology Operations LLC | Method and system for using vehicle sound information to enhance audio prompting |
US9263040B2 (en) | 2012-01-17 | 2016-02-16 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance speech recognition |
US9569594B2 (en) | 2012-03-08 | 2017-02-14 | Nuance Communications, Inc. | Methods and apparatus for generating clinical reports |
US9569593B2 (en) * | 2012-03-08 | 2017-02-14 | Nuance Communications, Inc. | Methods and apparatus for generating clinical reports |
US9251313B2 (en) | 2012-04-11 | 2016-02-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
US8902278B2 (en) | 2012-04-11 | 2014-12-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
EP2852881A4 (en) | 2012-05-22 | 2016-03-23 | Intouch Technologies Inc | GRAPHIC USER INTERFACES CONTAINING TOUCH PAD TOUCH INTERFACES FOR TELEMEDICINE DEVICES |
US9361021B2 (en) | 2012-05-22 | 2016-06-07 | Irobot Corporation | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
US9256889B1 (en) * | 2012-09-20 | 2016-02-09 | Amazon Technologies, Inc. | Automatic quote generation |
US10187520B2 (en) * | 2013-04-24 | 2019-01-22 | Samsung Electronics Co., Ltd. | Terminal device and content displaying method thereof, server and controlling method thereof |
US9853860B2 (en) * | 2015-06-29 | 2017-12-26 | International Business Machines Corporation | Application hierarchy specification with real-time functional selection |
US11862302B2 (en) | 2017-04-24 | 2024-01-02 | Teladoc Health, Inc. | Automated transcription and documentation of tele-health encounters |
US10983753B2 (en) | 2017-06-09 | 2021-04-20 | International Business Machines Corporation | Cognitive and interactive sensor based smart home solution |
US10483007B2 (en) | 2017-07-25 | 2019-11-19 | Intouch Technologies, Inc. | Modular telehealth cart with thermal imaging and touch screen user interface |
US11404148B2 (en) | 2017-08-10 | 2022-08-02 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11316865B2 (en) | 2017-08-10 | 2022-04-26 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
US11636944B2 (en) | 2017-08-25 | 2023-04-25 | Teladoc Health, Inc. | Connectivity infrastructure for a telehealth platform |
US10565312B2 (en) | 2017-10-04 | 2020-02-18 | Motorola Mobility Llc | Context-based action recommendations based on a shopping transaction correlated with a monetary deposit as incoming communications |
US20190163331A1 (en) * | 2017-11-28 | 2019-05-30 | International Business Machines Corporation | Multi-Modal Dialog Broker |
US10878124B1 (en) * | 2017-12-06 | 2020-12-29 | Dataguise, Inc. | Systems and methods for detecting sensitive information using pattern recognition |
US11515020B2 (en) | 2018-03-05 | 2022-11-29 | Nuance Communications, Inc. | Automated clinical documentation system and method |
US11250382B2 (en) | 2018-03-05 | 2022-02-15 | Nuance Communications, Inc. | Automated clinical documentation system and method |
WO2019173331A1 (en) | 2018-03-05 | 2019-09-12 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
US10617299B2 (en) | 2018-04-27 | 2020-04-14 | Intouch Technologies, Inc. | Telehealth cart that supports a removable tablet with seamless audio/video switching |
US11043207B2 (en) | 2019-06-14 | 2021-06-22 | Nuance Communications, Inc. | System and method for array data simulation and customized acoustic modeling for ambient ASR |
US11227679B2 (en) | 2019-06-14 | 2022-01-18 | Nuance Communications, Inc. | Ambient clinical intelligence system and method |
US11216480B2 (en) | 2019-06-14 | 2022-01-04 | Nuance Communications, Inc. | System and method for querying data points from graph data structures |
US11531807B2 (en) | 2019-06-28 | 2022-12-20 | Nuance Communications, Inc. | System and method for customized text macros |
US11670408B2 (en) | 2019-09-30 | 2023-06-06 | Nuance Communications, Inc. | System and method for review of automated clinical documentation |
US11222103B1 (en) | 2020-10-29 | 2022-01-11 | Nuance Communications, Inc. | Ambient cooperative intelligence system and method |
CN114765027A (zh) * | 2021-01-15 | 2022-07-19 | 沃尔沃汽车公司 | 用于车辆语音控制的控制设备、车载系统和方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5287102A (en) * | 1991-12-20 | 1994-02-15 | International Business Machines Corporation | Method and system for enabling a blind computer user to locate icons in a graphical user interface |
CN1308485A (zh) * | 2001-02-28 | 2001-08-15 | Tcl王牌电子(深圳)有限公司 | 数字电视音响装置 |
US20010047384A1 (en) * | 1999-11-29 | 2001-11-29 | John Croy | Methods and systems for providing personalized content over a network |
US6404442B1 (en) * | 1999-03-25 | 2002-06-11 | International Business Machines Corporation | Image finding enablement with projected audio |
US6513009B1 (en) * | 1999-12-14 | 2003-01-28 | International Business Machines Corporation | Scalable low resource dialog manager |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05197355A (ja) * | 1992-01-23 | 1993-08-06 | Hitachi Ltd | 音声効果定義装置 |
US6359636B1 (en) * | 1995-07-17 | 2002-03-19 | Gateway, Inc. | Graphical user interface for control of a home entertainment system |
US5767835A (en) * | 1995-09-20 | 1998-06-16 | Microsoft Corporation | Method and system for displaying buttons that transition from an active state to an inactive state |
US6184876B1 (en) * | 1996-07-10 | 2001-02-06 | Intel Corporation | Method and apparatus for audibly communicating comparison information to a user |
DE10028447A1 (de) * | 2000-06-14 | 2001-12-20 | Merck Patent Gmbh | Verfahren zur Herstellung von monolithischen Chromatographiesäulen |
US7765163B2 (en) * | 2000-12-12 | 2010-07-27 | Sony Corporation | System and method for conducting secure transactions over a network |
JP4694758B2 (ja) * | 2001-08-17 | 2011-06-08 | 株式会社リコー | 機器操作装置、プログラムおよび記録媒体並びに画像形成装置 |
JP5008234B2 (ja) * | 2001-08-27 | 2012-08-22 | 任天堂株式会社 | ゲーム装置、プログラム、ゲーム処理方法およびゲームシステム |
JP2003131785A (ja) * | 2001-10-22 | 2003-05-09 | Toshiba Corp | インタフェース装置および操作制御方法およびプログラム製品 |
JP2004051074A (ja) * | 2001-11-13 | 2004-02-19 | Equos Research Co Ltd | 車載装置、データ作成装置、及びデータ作成プログラム |
US6996777B2 (en) * | 2001-11-29 | 2006-02-07 | Nokia Corporation | Method and apparatus for presenting auditory icons in a mobile terminal |
US20030142149A1 (en) * | 2002-01-28 | 2003-07-31 | International Business Machines Corporation | Specifying audio output according to window graphical characteristics |
US7742609B2 (en) * | 2002-04-08 | 2010-06-22 | Gibson Guitar Corp. | Live performance audio mixing system with simplified user interface |
JP4010864B2 (ja) * | 2002-04-30 | 2007-11-21 | 株式会社リコー | 画像形成装置、プログラムおよび記録媒体 |
US7318198B2 (en) * | 2002-04-30 | 2008-01-08 | Ricoh Company, Ltd. | Apparatus operation device for operating an apparatus without using eyesight |
DE10249060A1 (de) | 2002-05-14 | 2003-11-27 | Philips Intellectual Property | Dialogsteuerung für elektrisches Gerät |
AU2002950336A0 (en) * | 2002-07-24 | 2002-09-12 | Telstra New Wave Pty Ltd | System and process for developing a voice application |
ATE421117T1 (de) * | 2003-04-07 | 2009-01-15 | Nokia Corp | Verfahren und vorrichtung zur bereitstellung von sprachgesteuerter eingabe für eine elektronische vorrichtung mit einer benutzerschnittstelle |
US7257769B2 (en) * | 2003-06-05 | 2007-08-14 | Siemens Communications, Inc. | System and method for indicating an annotation for a document |
US20050125235A1 (en) * | 2003-09-11 | 2005-06-09 | Voice Signal Technologies, Inc. | Method and apparatus for using earcons in mobile communication devices |
-
2005
- 2005-03-21 US US10/599,328 patent/US20080263451A1/en not_active Abandoned
- 2005-03-21 KR KR1020067020053A patent/KR20060131929A/ko not_active Application Discontinuation
- 2005-03-21 WO PCT/IB2005/050956 patent/WO2005093715A1/en active Application Filing
- 2005-03-21 JP JP2007505684A patent/JP2007531141A/ja active Pending
- 2005-03-21 EP EP05709048A patent/EP1733383B1/en not_active Not-in-force
- 2005-03-21 DE DE602005013938T patent/DE602005013938D1/de active Active
- 2005-03-21 AT AT05709048T patent/ATE429010T1/de not_active IP Right Cessation
- 2005-03-21 CN CN2005800100935A patent/CN1938757B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5287102A (en) * | 1991-12-20 | 1994-02-15 | International Business Machines Corporation | Method and system for enabling a blind computer user to locate icons in a graphical user interface |
US6404442B1 (en) * | 1999-03-25 | 2002-06-11 | International Business Machines Corporation | Image finding enablement with projected audio |
US20010047384A1 (en) * | 1999-11-29 | 2001-11-29 | John Croy | Methods and systems for providing personalized content over a network |
US6513009B1 (en) * | 1999-12-14 | 2003-01-28 | International Business Machines Corporation | Scalable low resource dialog manager |
CN1308485A (zh) * | 2001-02-28 | 2001-08-15 | Tcl王牌电子(深圳)有限公司 | 数字电视音响装置 |
Also Published As
Publication number | Publication date |
---|---|
ATE429010T1 (de) | 2009-05-15 |
EP1733383A1 (en) | 2006-12-20 |
EP1733383B1 (en) | 2009-04-15 |
JP2007531141A (ja) | 2007-11-01 |
DE602005013938D1 (de) | 2009-05-28 |
WO2005093715A1 (en) | 2005-10-06 |
US20080263451A1 (en) | 2008-10-23 |
KR20060131929A (ko) | 2006-12-20 |
CN1938757A (zh) | 2007-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1938757B (zh) | 用于驱动多个应用的方法和对话管理系统 | |
US11594211B2 (en) | Methods and systems for correcting transcribed audio files | |
US6009398A (en) | Calendar system with direct and telephony networked voice control interface | |
US6718017B1 (en) | System and method for creating and controlling interactive voice response applications | |
US10565509B2 (en) | Adaptive virtual intelligent agent | |
US7467026B2 (en) | Autonomously moving robot management system | |
Arons | The Audio-Graphical Interface to a Personal Integrated Telecommunications System | |
US6104788A (en) | Apparatus and method for using a telephone for remote scheduling | |
US8244543B2 (en) | System and method for performing speech recognition to control devices on a network | |
US20050033582A1 (en) | Spoken language interface | |
US6466654B1 (en) | Personal virtual assistant with semantic tagging | |
US20090298529A1 (en) | Audio HTML (aHTML): Audio Access to Web/Data | |
US11282519B2 (en) | Voice interaction method, device and computer readable storage medium | |
US10950220B1 (en) | User feedback for speech interactions | |
CN103959751A (zh) | 自动调整用户界面以用于免提交互 | |
US20070250190A1 (en) | System and method for controlling a remote environmental control unit | |
CN103714813A (zh) | 短语辨认系统和方法 | |
WO2002077894A1 (en) | Customer complaint alert system and method | |
JP2010541481A (ja) | モバイル機器を介したアクティブな使用中の検索 | |
WO2020105302A1 (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
JP2005518765A (ja) | 音声対話システムを動作させる方法 | |
JP6689953B2 (ja) | 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム | |
JP2023509651A (ja) | 情報処理方法、情報制御センター装置及びコンピュータ読み取り可能な記憶媒体 | |
CN108806738A (zh) | 一种智能笔控制方法、装置、设备及存储介质 | |
WO2020017165A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100623 Termination date: 20120321 |