CN1940978B - 管理使用者和机器之间的通信不确定性的方法和系统 - Google Patents

管理使用者和机器之间的通信不确定性的方法和系统 Download PDF

Info

Publication number
CN1940978B
CN1940978B CN2006101598291A CN200610159829A CN1940978B CN 1940978 B CN1940978 B CN 1940978B CN 2006101598291 A CN2006101598291 A CN 2006101598291A CN 200610159829 A CN200610159829 A CN 200610159829A CN 1940978 B CN1940978 B CN 1940978B
Authority
CN
China
Prior art keywords
user
machine
signal
uncertainty
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2006101598291A
Other languages
English (en)
Other versions
CN1940978A (zh
Inventor
E·霍维茨
T·佩埃克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1940978A publication Critical patent/CN1940978A/zh
Application granted granted Critical
Publication of CN1940978B publication Critical patent/CN1940978B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

在此揭示了一种多层决策分析方法以在人机通信中报错并修补。在一个实施例里,一种用于在人机交互环境中修补通信失误的计算机化系统,包含一个维护模块,一个意图模块,以及一个会话控制子系统。所述维护模块用于处理关于信号识别和信道保真度的不确定性。所述意图模块由所述维护模块支持,用于处理关于从信号识别使用者目标的不确定性。所述会话控制子系统包围所述维护模块和所述意图模块,用于处理人机之间的共同行为和一个或多个关于共同行为的高层事件。

Description

管理使用者和机器之间的通信不确定性的方法和系统
本申请是2000年6月2日申请的、申请号为00811246.0,发明名称为《人机交互的决策分析方法》的申请的分案申请。
技术领域
本申请一般涉及人机交互,尤其涉及用于管理使用者和机器之间的通信不确定性的方法和系统。
背景技术
一般的,计算机-使用者交互集中在使用者更多的遵守计算机的特性而不是计算机顺从使用者。例如,当使用者处于无计算机交互(例如人-人交互)中,典型的使用语言和非语言信号进行交流,这在计算机-使用者交互中一般不行。而是,用户被强迫利用计算机更容易理解的方式输入信号到计算机-例如限定的声音输入、用键盘的文本输入、指针、利用鼠标移动并点击输入等。结果,计算机-使用者界面的这个强加的不自然性阻碍了使计算机更容易使用并且更成为日常生活的直觉部分的努力。
在人-人对话中,讲话者和听者优雅地协调语言的表达和接收以达到并确认互相理解。在此过程中,他们在不肯定的情况下作出决定使误解的风险最小并且促进了接近行为目标。在对话中经常出现不确定性。例如,听者可能不确定发言的清晰度。同样地,发言者可能不确定听者的注意程度或理解程度。尽管参与者可能忍受很小程度的不确定,但是过分地超过给定的范围就可以导致误会以及所有其相关的代价,例如不想要的太早终止共同行为。
在人-机对话中,集成了部分技术(例如语音识别、文本到语音和自然语言生成)的语言交互系统的成功依靠部分技术的精度。然而,虽然人-人对话的特征是不确定性和不精确性,但几乎在所有情况下,人们很好的实现了交流。他们显示的不仅仅是考虑关键不确定性及其代价的能力,而且他们可以想出策略(例如暂停)来协同地解决它们。相反的,处理在人机对话中的不确定性的现有技术实行的远远不好。
处理在人机对话中的不确定性的现有技术,例如关于听者的注意程度和理解程度的不确定性,通常是专门的。现有技术一般不考虑不确定性的来源以及怎样解决它们。例如,他们一般不区分由于通信信道保真度不好或者由于进行发言时用户注意力不集中导致的交流失败。这使在遇到不确定时系统不强壮或不灵活,并且使使用者产生不太自然的前后关联的感受。
由于这些和其他原因,需要本发明。
发明内容
本发明涉及多层决策分析方法,用于在计算机-使用者交流中报告失败并修补。在一个实施例里,一个计算机化的系统修补在计算机-使用者交互的范围中的通信失误,并且它包含了一个维护模块,一个意图(intention)模块,和一个会话控制子系统。维护模块处理关于信号识别和信道保真度的不确定性。意图模块由维护模块支持,并且处理关于从信号中识别使用者的目标的不确定性。会话控制子系统包围以上两个模块,并且处理计算机与使用者之间的共同行为,还处理有关共同行为的一个或多个高层事件。
从而,在本发明的一个实施例里,每个模块和控制子系统处理不同层次的不确定性。所述维护模块处理信道层次和信号层次的不确定性。所述意图模块处理意图层次的不确定性。所述会话控制子系统处理会话层次的不确定性。
以此方式,本发明的实施例提供了优于现有技术的优势。通过辨认在人机对话里不确定性位于何处,该发明的系统可以更自然的从可能由不确定性导致的任何失误中恢复。例如,当不确定性位于信道层次时(例如在计算机与使用者之间的基本链接上有故障),完成修补所利用的方法与不确定性位于意图层次时(例如,使用者不理解计算机的意图,或者计算机不理解使用者的意图)的方法不同。最终结果是使用者感觉人机交互更自然。
根据本发明的一个方面,提供了一种用于管理使用者和机器之间的通信不确定性的系统,包含:一个会话控制部件,用于连续地与一个维护模块和一个意图模块交换信息,所述维护模块检测使用者和机器之间交换的信号并监控信道保真度,所述意图模块基于从维护模块接收到的信号来确定由所述信号指示的使用者目标,其中,所述维护模块和所述意图模块中的每一个包括基于决策的多节点转移网络。
根据本发明的另一方面,提供了一种用于管理机器和使用者之间的通信不确定性的方法,包含:检测使用者和机器之间交换的信号;监控所述信号的信道保真度;使用所述信号来确定与使用者和机器所采取的行为关联的使用者目标,所述行为由所述信号指示;以及使用至少一个基于决策的转移网络,来使机器和使用者之间关于所述行为的共同理解最大化。
根据本发明的再一方面,提供了一种用于管理使用者和机器之间的通信不确定性的由机器实现的系统,包含:用于检测使用者和机器之间交换的信号的装置;监控所述信号的信道保真度;用于使用所述信号来确定与使用者和机器所采取的行为关联的使用者目标的装置,所述行为由所述信号指示;以及用于使用至少一个基于决策的转移网络,来使机器和使用者之间关于所述行为的共同理解最大化的装置。
本发明的实施例包含不同实施例的计算机执行的方法,计算机可读媒体,和计算机化子系统。通过参考附图阅读以下详细说明,本发明的其他实施例、优点和方面将变得很明显。
附图说明
图1是与本发明实施的具体实施例相关的运行环境的图表;
图2是根据本发明实施例的系统的图表;
图3是根据本发明实施例的基于决策的转移网络(DTN)的图;
图4(a)是显示根据本发明实施例的在意图层次利用的阈值p*的图表;
图4(b)是显示根据本发明实施例的在维护层次利用的阈值p1*和p2*的图;
图5是根据本发明的实施例的方法的流程图。
具体实施方式
在本发明的范例性实施例的以下详细描述中,参考了形成了说明书的一部分的附图,这些附图使用图示性方法显示本发明可以实行的特定的示例性实施例。足够详细地说明这些具体实施例以使本领域技术熟练人员可以实践本发明,应该理解,也可以利用其他实施例,并且在不离开本发明的精神和范围前提下可以实行逻辑的、机械的、电学的和其他的改变。因而,以下详细的描述不应该被认为是限制性的,本发明的范围仅仅由权利要求书确定。
以下详细说明的一些部分是用对计算机存储器里的数据位的运算的算法和符号表示来表示。这些算法的说明和表示是数据处理领域技术熟练人员使用的方法,可以最有效的传递他们工作的实质内容给此领域其他技术熟练人员。这里算法被认为是导向所需结果的自相一致的步骤系列。所述步骤是需要物理地处理物理量的步骤。通常,尽管不是必需的,这些量是以电的或者磁信号的形式,可以被储存、转移、组合、比较、以及其他处理。
这里将这些信号称为比特、值、单元、符号、特性、项、数字或者诸如此类,已经多次验证是方便的,这基本是由于普遍使用这种做法。在头脑里应该记得,所有这些以及相似的术语是与合适的物理量相关,并且仅仅是给这些量应用的方便的标号。除非特别指出,否则在下面的讨论中很明显,应该认识到,在整个本发明里,利用(例如处理或计算或推算或确定或显示,或者类似的)术语表示计算机系统、或者相似的电子计算设备的动作和处理,所述动作和处理是将在计算机系统的寄存器和存储器里的被表示为物理(电子)量的数据处理并转换成在计算机系统存储器或寄存器或其他此类信息存储器、传输或显示设备里的相似的被表示为物理量的其他数据。
运行环境
参考图1,显示了本发明的实施例可以实施的硬件和运行环境的图表。图1的说明是想提供与本发明实施相关的合适的计算机硬件和合适的计算环境的一个简单的、总的说明。尽管不是必要的,在计算机可执行的指令的一般范围中说明本发明,例如计算机(例如个人电脑)执行的程序模块。一般的,程序模块包含例行程序、程序、对象、组件、数据结构等,它们实行特殊的任务或者应用特殊的抽象数据类型。
而且,本领域技术熟练人员将认识到可以在其他计算机系统配置上实践本发明,包含手持设备、多处理器系统、基于微处理器的或可编程用户电子元件、网络PC、小型计算机、大型机、以及诸如此类。也可以在分布式计算环境下实践本发明,其中通过通信网络相链接的远程处理设备实行任务。在一个分布式计算环境里,程序模块可以位于本地储存设备或者远端储存设备。
图1中用于实行本发明的范例性硬件和运行环境包含一个通用计算设备。所述设备是以计算机20的形式,包含一个处理单元21、一个系统存储器22,和一个系统总线23。所述系统总线23将各种系统元件(包含系统存储器)耦合到处理单元21。可以仅有一个处理单元21,也可以有多个处理单元21,因而计算机20的处理器包含单个的中央处理单元(CPU),或者一般称为并行处理环境的多个处理单元,。计算机20可以是通常的计算机、分布式计算机、或者任意其他类型的计算机;本发明并不受如此限制。
系统总线23可以是包含存储器总线或存储器控制器、外围总线、和使用任何总线结构的局部总线的许多总线结构类型中的任意一种。系统存储器也可以简单地称为存储器,并且包含只读存储器(ROM)24和随机存取存储器(RAM)25。在ROM24里储存了一个基本输入/输出系统(BIOS)26,BIOS包含基本例行程序,例如在开机时,所述基本例行程序帮助在计算机20里的元件之间转移信息。计算机20还包含一个硬盘驱动器27,用于从硬盘(图中没有显示)读数据和向硬盘写数据;计算机20还包含一个磁盘驱动器28,用于从可取走的磁盘29读数据和向其写数据;计算机20还包含一个光盘驱动器30,用于从可取走的光盘31(例如CD ROM或者其他光学媒体)读数据和向其写数据。
硬盘驱动器27,磁盘驱动器28和光盘驱动器30分别通过硬盘驱动器接口32,磁盘驱动器接口33和光盘驱动器接口34连接到系统总线23。驱动器和其相关的计算机可读媒体提供了用于计算机20的计算机可读指令、数据结构、程序模块和其他数据的非易失性储存。本领域技术熟练人员应该意识到,在示例性运行环境里可以使用任何类型的可以储存计算机能访问的数据的计算机可读媒体,例如磁带、闪存卡、数字化视频光盘,伯努利盒式磁带,随机存取存储器(RAM),只读存储器(ROM)和类似的。
可以将一些程序模块储存在硬盘29、光盘31、ROM24、或RAM25上,所述程序模块包含操作系统35、一个或者多个应用程序36,其他程序模块37,和程序数据38。使用者可以利用输入设备(例如键盘40和指针设备42)输入命令和信息到个人计算机20里。其他输入设备(图中没有显示)可以包含麦克风,游戏摇杆,游戏垫、辅助盘、扫描仪或者类似的。这些和其他输入设备常常通过与系统总线耦合的串行端口接口46连接到处理单元21,但也可以通过其他接口连接,例如并行端口、游戏端口、或通用串行总线(USB)。监视器47或其他类型的显示设备也可以通过一个接口(例如视频适配器48)连接到系统总线23。除了监视器,计算机典型地包含其他外围输出设备(图中没有显示),例如扩音器和打印机。
计算机20可以一个或多个远端计算机(例如远端计算机49)的逻辑连接在联网的环境下运行。这些逻辑连接可以通过耦合到计算机20的通信设备或者计算机20的一部分达到;本发明并不局限于一种特定类型的通信设备。远端计算机49可以是另一个计算机、一个服务器、一个路由器、一个网络PC、一个客户机、一个同等的设备或者其他通用网络节点,并且典型地包含许多或者所有上述的关于计算机20的单元,尽管在图1里仅仅显示了一个储存设备50。图1所示的逻辑连接包含一个局域网(LAN)51和一个广域网(WAN)52。这样的网络环境在办公网络、公司范围的计算机网络、企业内部网和国际互联网(这些是各种网络)里常见的。
当在LAN-网络环境里使用时,计算机20通过网络接口或适配器53(一种通信设备)与局部网络51相连。当在WAN网络环境里使用时,计算机20典型的包含一个调制解调器54(一种通信设备)或者其他类型的通信设备以建立在广域网52(例如国际互联网)上的通信。所述调制解调器(它可以是外置式的也可以是内置式的)通过串行端口接口46与系统总线23相连。在联网的环境下,相当于个人电脑画出的程序模块,或者部分程序模块,可以被储存于远端储存设备。应该认识到,这里显示的网络连接是范例性的并且也可以使用用于建立在计算机之间的通信链接的其他装置和通信设备。
四层表示和分析
在详细说明书的此部分,说明了根据本发明的用于修补人机对话中失误(即,在此类对话中的不确定性)的分析的四层表示。有关根据本发明实施例的系统,描述的层次,显示在图12里。
应该注意到,对话的一个重要方面是对信息的本质和交流的目的所作的正在进行的推理和决策。在不确定性下收集信息和作出决策在会话中起着核心作用。处理不确定性在形成可能有助于澄清关键不确定性以及有助于引导对话到合适详细程度的判别问题中显得很重要,而是在上述详细程度下交换信息或提问题。
所述系统及其所述四个层次至少在本发明的某些实施例中可用于计算机处理与使用者进行的会话中的不确定性,尤其是(但不局限于)在共同行为的情景中。共同行为是心理语言学家使用的术语,心理语言学家利用其描述面向任务的行为,对参与者、设置有约束的,尤其是对每个参与者认为合理的允许的作用之类有约束的社会事件。在共同行为里的参与者认为他们有共同的一套关于所述行为的想法,包含认为对其他参与者的作用和责任。例如,接待员范围就是一个这样的共同行为,其中一个接待员帮助他人处理某些事务,其他人希望在所述事务方面得到接待员的帮助。即,人们认为接待员的基本任务是以及时的合作的方式帮助他们达到行为确定的目标。
发言者和听者在四个层次上建立共同理解的基础。如图2所示,这些层次包含信道层214,信号层212,意图层210,和会话层208。信道层214是最基础的层。在此层次上,发言者企图通过实行一个行为(例如一句话或者一个动作)给听者开启一个通信信道。然而,发言者不依靠协调就不能使听者察觉到所述行为:在发言者实行所述行为时,听者必须注意并且精确的察觉所述行为。
在稍高的下一层次,信号层212,发言者将一个行为作为信号展示给听者。不是意味着所有的行为都是信号-例如,挠痒痒。从而,发言者和听者必须协调发言者所展示的与听者所识别的行为。
意图层次210是对话者解释信号的陈述内容的层次。现有技术的对话系统一般差不多完全集中在此层次。另外,下述的专利案例展示了一个有新意的此类对话系统,尽管本发明并不局限于此,本发明的具体实施例可以利用它,所述共同提交、共同待批和共同转让的专利案例题为“Computer-User Interaction via TaskAbstraction Hierarchy”[案卷1018.023US1],这里通过引用包含进来。在意图层次210里,发言者用信号给听者一些陈述。在发出的信号中被听者认为是发言者的目标的是听者怎样达到目标。应该注意到,在使用信号中,信号不同于发言者的目标-例如,此领域内已知的间接语言行为。通过集中注意发言者的目标,意图层次将发言者的含意作为最主要的来处理。听者不知道发言者企图使用所述信号,发言者就不能通过所述信号传递其目标。这再次需要协作。
最后,在会话层208,发言者提议一个听者考虑并采纳的共同行为。一个建议恳求所期望的回应。例如,在一个间接语言行为里,例如“我必须到North Campus”意味着“请叫到North Campus的班车”,发言者给听者提议了一个行为并且听者共同实行-在上例中发言者让听者去叫班车。在叫班车的事件中,没有听者的协作参与,发言者不可能让听者去从事所述行为。
分析的四个层次形成了暂时行为的阶梯,在此领域中大家知道是向上完成的。在对话的一个给定层次的动作是从下到上完成的。从而,在发言者必须使听者参与信道层214的行为,为了在信号层212使听者识别信号的表示,为了在意图层210使听者理解发言者的意思,为了在会话层208最终使听者考虑行为的建议。
一个层完成的证据也是所有在其下的层也完成的证据。证据是向下证明的。从而,当听者采纳一个动作时,这给发言者提供了证据:听者理解了信号后面的目标,这随后又提供证据:识别了信号以及打开了信道。
在所有四个层次上的行为通常在不确定性下实行。例如,在最低层214,对话在信道保真度上可以是不确定的;由此,他们可以寻找引起注意的物理信号,例如,凝视或者点头。听者接着通过返回信道表示理解的迹象,例如“啊哈”,这在此领域是众知的。
不确定性带来了代价。例如,如果听者对信道保真度不确定,要求重复的代价与继续谈论刚才所说的代价相比要小一些。考虑到有可能的必须稍后从头来过所导致的更大代价,通过确认消息(例如,“你听懂了吗?”),增加共同理解的可能性的好处可能超过了询问的代价。以后追溯的潜在需要可能包括更大的代价。
系统
在详细说明书的此部分,说明了根据本发明实施例的一个系统。而且,说明了贝叶斯网络,基于决策的转移网络,推断概率,和概率阈值。参考图2、3、4(a)和4(b)进行了说明。
贝叶斯推理和期望值决策在本发明的一个实施例里用于在对话里识别理想动作,同时考虑到关于通信保真度和意义的不确定性,以及在这些不确定性下采取的更换动作的潜在改变的代价和好处。在此实施例里计算了不能直接使用贝叶斯网络发现的利益状态可能性。
再次参考图2,显示了根据本发明的一个实施例的系统的图表。系统200包含意图模块204,维护模块206,和一个会话控制子系统202。模块204、模块206和子系统202中的每个在一个实施例里都可以作为来自计算机可读媒体(例如一个存储器)的,来自图1所示计算机的,由处理器执行的计算机程序实现。但是本发明不限于此。
维护模块206处理有关信号识别和信道保真度的不确定性。与向上完成的标记法一致,维护模块206支持意图模块204,意图模块204处理有关从信号识别使用者目标的不确定性。包围此两个模块的是会话控制子系统202,它处理有关共同行为的状态的不确定性,这在此领域已知为Gricean准则、共同基础(即,对话的一个共享知识基础),及其他有关共同行为的高层次对话事件(例如,系统到目前为止所问的问题的数目,等)。
箭头216,218和220表示在模块204和206和子系统202里的信息流向。会话控制子系统连续的与模块204和206交换信息,这分别由箭头216和218表示,并且确定在何处集中注意成为相互理解的基础。会话控制子系统202也基于记录的调整代价或可利用性,所述记录保存会话层的观察,例如系统到目前为止所提问题的数目。箭头220表示动作的向上完成;从而,当有证据表明意图层次210完成,意图模块204向下传递这个证据给信号层212和信道层214,使得维护模块206知道了信号已被识别并且信道被打开。
在一个实施例里贝叶斯网络用于获得作出决策的概率。贝叶斯网络允许系统200将不确定性之间的依赖关系模型化,使其可能以结构化方式推理误会的来源。在一个实施例里,模块204和模块206中的每个都包含至少一个基于决策的转移网络(DTN),如此领域所知的,DTN是一个有由决策理论函数设置的转移输入的有限自动装置。从而,根据本发明的一个实施例的DTN利用贝叶斯推论和期望值计算来确定什么转移导致最大限度的共同理解和最小的协作努力。在图3中显示了一个根据一个具体实施例的,可以被用于图2中意图层次210的环境中的,此类DTN示例的图表,在下一段开始特别说明它。DTN的网络结构编码了解决不确定性的会话策略。
对话的基础是在此领域所知的邻接对中实行:发言的一个有序对,其中有序对的第二部分条件相关地依赖于第一部分,即相关的并且可预料的。原型是一个提问和回答。邻接对溶入DTN的结构。从而,参考图3,DTN示成用于处理意图模块里的请求。对于请求的条件相关响应是理解状态3(表示为节点302)。然而,如果存在关于请求状态1(表示为节点300)的不确定性,则开始业内所知的嵌入侧序列是经济的,如节点304所示。所述侧序列可以是修补任何误会的问题。在一个实施例里,利用贝叶斯网络评估DTN里的不确定性。
如图3所示,在意图层次的基本不确定性是使用者目标,尽管此不确定性并不局限于此。然而,这不能被直接发现,所以一个实施例里的系统使用贝叶斯网络来提出对至今观察到所有语言和非语言证据的可能目标的分布。如在下述案例中说明的,分层将目标分解成若干贝叶斯网络可以改进引导对话的推论,所述案例是共同待批、共同转让和共同提交的专利案例,题为“Computer-Based Representationsand Reasoning Methods for Engaging Users in Goal-Oriented Conversation”[案卷1018.023US1],这里通过引用包含进来。给定证据的最可能目标的概率可以记为p(目标|E)。如图3所示,如果此概率不超过理解请求的一定阈值,此系统必须在两类会话策略中决策,它们作为转移输入编码入DTN:
1.询问目标,它明确地要求使用者确认对目标的最可能的猜测,计算式为arggmaxp(目标|E);或者
2.请求修补,它使用一侧序列来收集更多信息。
在一个实施例里,阈值确定选择哪个转移输入。现在参考图4(a),如果p(目标|E)不超过预定的阈值p*404,则此概率落在“请求修补”区域400里,从而“询问目标”区域402被排除。而且,在意图层次达到共同理解上的此类失误有时可能是由于较低层次的问题,系统在作出决策时也可以考虑在维护层次的不确定性。在一个实施例里,在所述维护模块,利用贝叶斯网络来获得对三个状态的概率分布:信道和信号、信道和无信号,以及无信道。
如果在“请求修补”区域400里,再次使用阈值来确定使用哪个“请求修补”的示例。现在参考图4(b),如果p(信道和信号|E)超过阈值p1*458,则概率处于推敲区域454,并且系统请求推敲,这一般暗示意图层次误会但不排除维护层次的原因,例如语法分析错误。如果p(信道和信号|E)小于阈值p1*458但大于阈值p1*456,则概率位于重复区域,并且使用了“请求修补”的示例:请求重复。这意味着最可能的维护层次状态是“信道和无信号”。在此情况中,系统在请求重复时将明确指出:出现了信号层问题。由于现在用户位于一个协助排除问题的较好位置,解决误会的认可是一个集体过程。
对话中此协作行为的原则在现有技术中称为“最小协作努力的原则”。例如,如果使用者要求接待员系统叫一辆车,但是语音识别系统仅仅听到一些词语,系统可以以询问的结构中响应所述词语中的一个,例如“对不起,〔车〕?你可以重复一下吗?”其中〔车〕是对该词语的一个填空。从而,此询问告诉使用者,语音识别听懂了一些词语,但是可能不足以在意图层次理解语言。
最后,如果p(信道和信号|E)小于阈值p1*456,则概率位于信息值区域450。这表示使用了最后一种“请求修补”示例,根据不同目标的推断概率利用信息值(VOI)分析以识别最好的发现信号。在一个实施例里,通过对每个信号计算与信号所取的每个值有关的最佳决策的期望效用,计算出VOI。此分析将每个值的期望效用以发现不同值的概率作权加起来。一旦发现信号是推荐的,使用了所述信号的询问结构。例如,如果VOI分析推荐发现单词“车”,系统可以询问使用者所述请求是否与一辆车相关。然而,有时候这可能不合适,所以将依赖情景的代价赋给VOI推荐,这将在下面说明。
注意到业内一般都知道VOI计算。例如,参考书目,Horvitz,E.,Breese,J.,和Henrion,M.,所著:Decision Theory in Expert Systems and Artificial Intelligence,International Journal of Approximate Reasoning,Special Issue on Uncertainty inArtificial Intelligence,2:247-30(1989),提供了VOI计算的背景和细节。而且,共同提交、共同待批和共同转让的题为“Computer-User Interaction via Task AbstractionHierarchy”[案卷1018.023US1]的专利案例,也提供了关于VOI的说明,所述案例已经通过引用包含进来。
在另一个实施例里,根据决策理论函数选择了转移输入,例如,本领域一般技术人员都可以理解决策理论函数最小化协作努力。已经说明过,此类决策理论函数可以用于代替根据超过一个阈值的推论概率选择转移输入的方法,或者作为除此之外的方法。然而,本发明并不局限于此。
回头参考图3中的DTN的图表,转移输入“请求修补”将DTN带到状态2,如节点304所示,在此,在容许条件相关联第二对部分(“容许修补”)条件下,DTN回到状态1,如节点300所示。在状态1,系统利用从侧序列获得的额外信息再次实行推断。因而,通过实行邻接对,此不断改进的过程有效的消除了误会。
现在回头参考图2里的系统200的图,会话控制子系统202便于在模块204和206之间共享证据,这已经间接提到了。从而,与向下证据的标记一致,一旦在意图模块DTN选择了转移输入,证据被向下发送以固定在维护模块DTN里的转移输入,如箭头220所示。例如,当使用者提供“容许修补”给“请求修补”时,它固定了在维护模块DTN里的转移输入,说明用户注意到所询问的问题。如果在一个实施例里,必须继续对话并且必须在维护层次贝叶斯网络上实行推断,则表示用户注意到上一句话的节点被示出。
如前述,在DTN里的转移输入是利用决策理论函数设置的。在一些实施例里,仅仅包含概率阈值,这已经结合图4(a)和4(b)予以说明。然而,本发明并不局限于此。在其他实施例里,可以计算实行指定行为的代价和利益,以效用来表示。在一个实施例里,由于会话控制子系统202跟踪较高层次事件,在两个模块里的DTN提交与会话情景和社会因素符合的效用。例如,在意图模块204,当在相同的邻接对里所提问题的数量增加时,会话控制子系统202可以扩大询问问题的代价。因而,虽然问一个问题的代价较小,它随着对同一个请求所问的问题数量快速地增加(可能是指数增加)。
在一个实施例里,会话控制子系统202也需要辨别何时共同行为终止。在一个实施例里,完成此过程是利用带有会话层次状态分布的其自己的贝叶斯网络,例如“进展行为”,“意外终止”等。然而,本发明并不局限于此。
广义方式的实行决策
在详细说明的此部分,说明了一个更一般的用于实行决策的决策分析方法。即,在以前的章节中,实行决策是与推断概率的确定有关,并根据推断概率超过或者不超过某些阈值而采取行为(实行决策)。然而,本领域一般技术人员将认识到,这是一个特定的决策分析方法,考虑到关于每个结果的效用,它可以称为在不确定性下理想动作的计算。即,在前述章节中的说明是现在说明的更一般方法的一个特定实施例。
在广义方法里,首先如利用业内所知的贝叶斯网络确定在利益的自变量上的概率分布,在此领域已知为假设变量,例如在使用者目标上的概率分布。接着,确定与概率分布有关的最大期望值的动作。优化动作A*的直接动作的值是它的期望效用,它可以写为:
eu(A*)=maxAju(Ai,Hj)p(Hj|E)
这里maxA表示选择行为A以达到最大和,u(Ai,Hj)是当使用者有目标(假设)Hj时具体动作Ai的效用,p(Hj|E)是在给定的发现集和背景的证据E的当前情况下使用者目标(假设)Hj的概率。我们使用A*表示有最大期望效用的动作A,利用上述等式的arg maxa得到。
广义方法所考虑的行为与前述的更具体的方法一样。接着是最大化与概率分布中相关的最大的期望值的动作。
方法
在详细说明书的此章节,说明了根据本发明实施例的方法。此方法适宜计算机实行,并且参考图5说明此方法。此计算机执行的方法期望至少部分地是作为运行在计算机上的一个或多个程序来实现-即,作为计算机处理器可以从计算机可读媒体(例如存储器)里执行的程序。此程序适宜储存于机器可读的媒体(例如软盘或CD-ROM)上,便于在另一个计算机上分发并且安装并且执行。然而本发明不局限于此。
现在参考图5,示出了根据一个实施例的方法的流程图。此方法显示了解决不确定性的广义方法,它可以在本发明的一个实施例中实行。从而,在不确定性事件500里,所述不确定性在它所处于的层次中被解决:在信道或者信号层次502,在意图层次504,或者在会话层次506。与其相比,现有技术没有根据不确定性所经历层次用不同方法解决不确定性。在本发明的一个实施例中,不确定性如已在本专利中描述的方法处理及解决。例如,如前述,在处理在信道和信号层次502或者在意图层次504上的不确定性的情况中,可以利用DTN。一旦有效的处理(即解决)了不确定性,则所述方法在508继续。
结论
尽管这里说明了具体实施例,本领域一般技术人员将认识到,计算以达到相同目的的任何安排可以替代特定的具体实施例。此专利申请期望覆盖本发明的任何改变和变化。从而,明确期望本发明仅仅由下面的权利要求及其等价的内容所限制。

Claims (18)

1.一种用于管理使用者和机器之间的通信不确定性的系统,其特征在于,包含:
一个会话控制部件,用于连续地与一个维护模块和一个意图模块交换信息,所述维护模块检测使用者和机器之间交换的信号并监控信道保真度,所述意图模块基于从维护模块接收到的信号来确定由所述信号指示的使用者目标,
其中,所述维护模块和所述意图模块中的每一个包括基于决策的多节点转移网络。
2.如权利要求1所述的系统,其特征在于,所述基于决策的多节点转移网络使用贝叶斯推理和期望值计算,使得共同理解最大化并使得协作努力最小化。
3.如权利要求1所述的系统,其特征在于,所述维护模块管理一个信号层次中的不确定性。
4.如权利要求1所述的系统,其特征在于,所述维护模块管理一个信道层次中的不确定性。
5.如权利要求1所述的系统,其特征在于,所述意图模块管理一个意图层次中的不确定性。
6.如权利要求1所述的系统,其特征在于,所述会话控制部件管理一个会话层次的不确定性。
7.如权利要求1所述的系统,其特征在于,所述会话控制部件用于检测并管理机器和使用者之间的共同行为。
8.如权利要求7所述的系统,其特征在于,所述会话控制部件用于检测共同行为的终止。
9.一种用于管理机器和使用者之间的通信不确定性的方法,其特征在于,包含:
检测使用者和机器之间交换的信号;
监控所述信号的信道保真度;
使用所述信号来确定与使用者和机器所采取的行为关联的使用者目标,所述行为由所述信号指示;以及
使用至少一个基于决策的转移网络,来使机器和使用者之间关于所述行为的共同理解最大化。
10.如权利要求9所述的方法,其特征在于,所述至少一个基于决策的转移网络使用贝叶斯推理和期望值计算,使得共同理解最大化。
11.如权利要求9所述的方法,其特征在于,使用至少一个基于决策的转移网络包括对一个示例节点示例。
12.如权利要求9所述的方法,其特征在于,使用至少一个基于决策的转移网络包括使用信息值分析。
13.如权利要求12所述的方法,其特征在于,所述信息值分析包括评估受到所采取的行为的影响的代价和效用。
14.如权利要求9所述的方法,其特征在于,还包括管理一个信号层次中的不确定性。
15.如权利要求9所述的方法,其特征在于,还包括管理一个信道层次中的不确定性。
16.如权利要求9所述的方法,其特征在于,还包括管理一个意图层次中的不确定性。
17.如权利要求9所述的方法,其特征在于,还包括管理一个会话层次中的不确定性。
18.一种用于管理使用者和机器之间的通信不确定性的由机器实现的系统,其特征在于,包含:
用于检测使用者和机器之间交换的信号的装置;
监控所述信号的信道保真度;用于使用所述信号来确定与使用者和机器所采取的行为关联的使用者目标的装置,所述行为由所述信号指示;以及
用于使用至少一个基于决策的转移网络,来使机器和使用者之间关于所述行为的共同理解最大化的装置。
CN2006101598291A 1999-06-04 2000-06-02 管理使用者和机器之间的通信不确定性的方法和系统 Expired - Lifetime CN1940978B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/326,043 US6490698B1 (en) 1999-06-04 1999-06-04 Multi-level decision-analytic approach to failure and repair in human-computer interactions
US09/326,043 1999-06-04

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB008112460A Division CN1291349C (zh) 1999-06-04 2000-06-02 人机交互的决策分析方法

Publications (2)

Publication Number Publication Date
CN1940978A CN1940978A (zh) 2007-04-04
CN1940978B true CN1940978B (zh) 2011-09-14

Family

ID=23270586

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2006101598291A Expired - Lifetime CN1940978B (zh) 1999-06-04 2000-06-02 管理使用者和机器之间的通信不确定性的方法和系统
CNB008112460A Expired - Fee Related CN1291349C (zh) 1999-06-04 2000-06-02 人机交互的决策分析方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB008112460A Expired - Fee Related CN1291349C (zh) 1999-06-04 2000-06-02 人机交互的决策分析方法

Country Status (5)

Country Link
US (1) US6490698B1 (zh)
EP (1) EP1190384A1 (zh)
CN (2) CN1940978B (zh)
AU (1) AU5593800A (zh)
WO (1) WO2000075864A1 (zh)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6751658B1 (en) * 1999-10-18 2004-06-15 Apple Computer, Inc. Providing a reliable operating system for clients of a net-booted environment
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
US7330895B1 (en) * 2001-03-15 2008-02-12 Microsoft Corporation Representation, decision models, and user interface for encoding managing preferences, and performing automated decision making about the timing and modalities of interpersonal communications
WO2002099361A1 (en) * 2001-06-06 2002-12-12 Industrial Research Limited Uncertainty propagation system and method
US8312117B1 (en) * 2001-11-15 2012-11-13 Unisys Corporation Dialog recovery in a distributed computer system
AU2002951244A0 (en) * 2002-09-06 2002-09-19 Telstra New Wave Pty Ltd A development system for a dialog system
US20040264677A1 (en) * 2003-06-30 2004-12-30 Horvitz Eric J. Ideal transfer of call handling from automated systems to human operators based on forecasts of automation efficacy and operator load
US7983920B2 (en) * 2003-11-18 2011-07-19 Microsoft Corporation Adaptive computing environment
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US8265939B2 (en) * 2005-08-31 2012-09-11 Nuance Communications, Inc. Hierarchical methods and apparatus for extracting user intent from spoken utterances
US9507778B2 (en) 2006-05-19 2016-11-29 Yahoo! Inc. Summarization of media object collections
US8594702B2 (en) 2006-11-06 2013-11-26 Yahoo! Inc. Context server for associating information based on context
US8402356B2 (en) 2006-11-22 2013-03-19 Yahoo! Inc. Methods, systems and apparatus for delivery of media
US9110903B2 (en) 2006-11-22 2015-08-18 Yahoo! Inc. Method, system and apparatus for using user profile electronic device data in media delivery
US8769099B2 (en) 2006-12-28 2014-07-01 Yahoo! Inc. Methods and systems for pre-caching information on a mobile computing device
US8069142B2 (en) 2007-12-06 2011-11-29 Yahoo! Inc. System and method for synchronizing data on a network
JP2010020273A (ja) * 2007-12-07 2010-01-28 Sony Corp 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
US8307029B2 (en) 2007-12-10 2012-11-06 Yahoo! Inc. System and method for conditional delivery of messages
US8671154B2 (en) 2007-12-10 2014-03-11 Yahoo! Inc. System and method for contextual addressing of communications on a network
US8166168B2 (en) 2007-12-17 2012-04-24 Yahoo! Inc. System and method for disambiguating non-unique identifiers using information obtained from disparate communication channels
US9706345B2 (en) 2008-01-04 2017-07-11 Excalibur Ip, Llc Interest mapping system
US9626685B2 (en) 2008-01-04 2017-04-18 Excalibur Ip, Llc Systems and methods of mapping attention
US8762285B2 (en) 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
US20090182618A1 (en) 2008-01-16 2009-07-16 Yahoo! Inc. System and Method for Word-of-Mouth Advertising
US20090182810A1 (en) * 2008-01-16 2009-07-16 Yahoo! Inc. System and Method for Real-Time Media Object-Specific Communications
US8554623B2 (en) * 2008-03-03 2013-10-08 Yahoo! Inc. Method and apparatus for social network marketing with consumer referral
US8538811B2 (en) 2008-03-03 2013-09-17 Yahoo! Inc. Method and apparatus for social network marketing with advocate referral
US8560390B2 (en) 2008-03-03 2013-10-15 Yahoo! Inc. Method and apparatus for social network marketing with brand referral
US8589486B2 (en) 2008-03-28 2013-11-19 Yahoo! Inc. System and method for addressing communications
US8745133B2 (en) 2008-03-28 2014-06-03 Yahoo! Inc. System and method for optimizing the storage of data
US8271506B2 (en) 2008-03-31 2012-09-18 Yahoo! Inc. System and method for modeling relationships between entities
US8452855B2 (en) * 2008-06-27 2013-05-28 Yahoo! Inc. System and method for presentation of media related to a context
US8813107B2 (en) 2008-06-27 2014-08-19 Yahoo! Inc. System and method for location based media delivery
US8706406B2 (en) 2008-06-27 2014-04-22 Yahoo! Inc. System and method for determination and display of personalized distance
US8583668B2 (en) 2008-07-30 2013-11-12 Yahoo! Inc. System and method for context enhanced mapping
US10230803B2 (en) 2008-07-30 2019-03-12 Excalibur Ip, Llc System and method for improved mapping and routing
US8386506B2 (en) 2008-08-21 2013-02-26 Yahoo! Inc. System and method for context enhanced messaging
US8281027B2 (en) 2008-09-19 2012-10-02 Yahoo! Inc. System and method for distributing media related to a location
US8108778B2 (en) 2008-09-30 2012-01-31 Yahoo! Inc. System and method for context enhanced mapping within a user interface
US20100082427A1 (en) * 2008-09-30 2010-04-01 Yahoo! Inc. System and Method for Context Enhanced Ad Creation
US9600484B2 (en) 2008-09-30 2017-03-21 Excalibur Ip, Llc System and method for reporting and analysis of media consumption data
US8326678B1 (en) * 2008-10-30 2012-12-04 Bank Of America Corporation Customer impact measuring system
US8024317B2 (en) 2008-11-18 2011-09-20 Yahoo! Inc. System and method for deriving income from URL based context queries
US8032508B2 (en) 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
US8060492B2 (en) 2008-11-18 2011-11-15 Yahoo! Inc. System and method for generation of URL based context queries
US9805123B2 (en) * 2008-11-18 2017-10-31 Excalibur Ip, Llc System and method for data privacy in URL based context queries
US9224172B2 (en) 2008-12-02 2015-12-29 Yahoo! Inc. Customizable content for distribution in social networks
US8055675B2 (en) 2008-12-05 2011-11-08 Yahoo! Inc. System and method for context based query augmentation
US8166016B2 (en) 2008-12-19 2012-04-24 Yahoo! Inc. System and method for automated service recommendations
US20100185509A1 (en) * 2009-01-21 2010-07-22 Yahoo! Inc. Interest-based ranking system for targeted marketing
US8150967B2 (en) 2009-03-24 2012-04-03 Yahoo! Inc. System and method for verified presence tracking
US8725456B1 (en) * 2009-05-05 2014-05-13 The United States of America as represented by the Administrator of the National Aeronautics & Space Administration (NASA) Decomposition technique for remaining useful life prediction
US10223701B2 (en) 2009-08-06 2019-03-05 Excalibur Ip, Llc System and method for verified monetization of commercial campaigns
US8914342B2 (en) 2009-08-12 2014-12-16 Yahoo! Inc. Personal data platform
US8364611B2 (en) 2009-08-13 2013-01-29 Yahoo! Inc. System and method for precaching information on a mobile device
US8782556B2 (en) * 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
DE112014005354T5 (de) * 2013-11-25 2016-08-04 Mitsubishi Electric Corporation Dialog-management-system und dialog-management-verfahren
US10572810B2 (en) 2015-01-07 2020-02-25 Microsoft Technology Licensing, Llc Managing user interaction for input understanding determinations
US10249297B2 (en) 2015-07-13 2019-04-02 Microsoft Technology Licensing, Llc Propagating conversational alternatives using delayed hypothesis binding
US10446137B2 (en) 2016-09-07 2019-10-15 Microsoft Technology Licensing, Llc Ambiguity resolving conversational understanding system
CN106599196B (zh) * 2016-12-14 2021-07-16 竹间智能科技(上海)有限公司 一种人工智能对话方法及系统
CN112528459B (zh) * 2020-10-20 2024-01-30 中国人民解放军63919部队 路径依赖对人机交互故障的促进/抑制度计算方法、装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5255386A (en) * 1990-02-08 1993-10-19 International Business Machines Corporation Method and apparatus for intelligent help that matches the semantic similarity of the inferred intent of query or command to a best-fit predefined command intent
US5748841A (en) 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US5864848A (en) 1997-01-31 1999-01-26 Microsoft Corporation Goal-driven information interpretation and extraction system
WO2000021074A1 (en) * 1998-10-05 2000-04-13 Lernout & Hauspie Speech Products N.V. Speech controlled computer user interface

Also Published As

Publication number Publication date
US6490698B1 (en) 2002-12-03
EP1190384A1 (en) 2002-03-27
CN1369080A (zh) 2002-09-11
CN1940978A (zh) 2007-04-04
CN1291349C (zh) 2006-12-20
WO2000075864A1 (en) 2000-12-14
AU5593800A (en) 2000-12-28

Similar Documents

Publication Publication Date Title
CN1940978B (zh) 管理使用者和机器之间的通信不确定性的方法和系统
Balogun et al. Organizational restructuring and middle manager sensemaking
Browne Adaptive user interfaces
Gray Group decision support systems
Abbasgholizadeh Rahimi et al. Using fuzzy cost‐based FMEA, GRA and profitability theory for minimizing failures at a healthcare diagnosis service
US10789564B1 (en) Timely quality improvement of an inventory of elements
Slota et al. Good systems, bad data?: Interpretations of AI hype and failures
US20110126128A1 (en) Future insight maps and associated tools
Tebenkov et al. Machine learning algorithms for teaching AI chat bots
Kitzmiller et al. Adopting best practices:" Agility" moves from software development to healthcare project management
Back et al. Resilience markers for safer systems and organisations
Dillard et al. A critique of knowledge-based systems in auditing: The systemic encroachment of technical consciousness
Frandsen et al. New theoretical directions and frameworks: In social media and crisis communication research
CN114169739A (zh) 一种课程权限控制方法、装置、电子设备及存储介质
Ivory et al. Getting caught between discourse (s): hybrid choices in technology use at work
Decman et al. Leadership through Chaos and the Demand for Resiliency.
McCrory Caseload management: a district nursing challenge
Mason et al. Future mapping: A new approach to managing strategic uncertainty
Dolan Labeling Laggards and Leaders: International Organizations and the Politics of Defining Development
Muris et al. The Consequences of Artificial Intelligence in Human Capital Management in the Next Five to Ten Years
Piwowarska Contemporary neo-luddism in the digital transformation of employment
JP6801019B2 (ja) 担当者割当装置および方法
Intelligence Technology can’t fix this
Bangeni et al. Locating academic development within the decolonial turn in higher education: The affordances of systems thinking for decolonial practice
McCleskey Leadership and Strategic Decision Making Under Exogenous Shocks Such as COVID-19

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150428

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150428

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20110914