CN101292256A - 对话创作和执行架构 - Google Patents

对话创作和执行架构 Download PDF

Info

Publication number
CN101292256A
CN101292256A CNA200680038585XA CN200680038585A CN101292256A CN 101292256 A CN101292256 A CN 101292256A CN A200680038585X A CNA200680038585X A CN A200680038585XA CN 200680038585 A CN200680038585 A CN 200680038585A CN 101292256 A CN101292256 A CN 101292256A
Authority
CN
China
Prior art keywords
communication
dialogue
dialogue state
interface
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200680038585XA
Other languages
English (en)
Inventor
A·拉玛克里什纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN101292256A publication Critical patent/CN101292256A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

在通信体系结构中使用一种用于创作和执行对话应用程序的架构。该应用程序可以与多个不同模式的通信一起使用。由对话应用程序处理的消息被用于确定对话状态并提供相关联的响应。

Description

对话创作和执行架构
背景
仅为了一般的背景信息而提供以下讨论,它并非旨在用于协助确定所要求保护的主题的范围。
可以在计算机网络上使用来自各种各样行业的远程应用。例如,应用包括诸如呼叫路由和顾客帐户/个人信息访问等联络中心自助服务应用。有可能有其它联络中心应用,包括旅行预定、金融和证券应用程序以及顾客关系管理。此外,信息技术组能够受益于在例如销售和现场服务自动化、电子商务、自动话务员、帮助台口令重置应用以及启用语音的网络管理的领域中的应用。
传统的顾客服务通常是通过接听电话和回答顾客询问的若干个人工代理操纵的呼叫中心处理的。目前,这些呼叫中心中的许多通过采用双音多频(DTMF)和自动语音识别(ASR)技术的组合的基于电话的交互式语音响应(IVR)系统来自动操作。此外,从以往的基于电话的系统将顾客服务扩展到基于即时消息传递(IM)和电子邮件的系统。这些不同的通道向最终顾客提供了额外的选择,由此增加了总体的顾客满意度。由于为每一个通道使用不同的工具,在这些各个通道上顾客服务的自动化目前是困难的。
概述
提供本概述以便用简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在确定所要求保护的主题的关键或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
在通信体系结构中使用一种用于创作和执行对话应用程序的架构。该应用程序可以与多个不同模式的通信一起使用。由对话应用程序处理的消息被用于确定对话状态并提供相关联的响应。
附图简述
图1是示例性移动设备的正视图。
图2是图1的移动设备的功能组件的框图。
图3是示例性电话的正视图。
图4是一般计算环境的框图。
图5是用于处理通信消息的通信体系结构的框图。
图6是多个对话状态的图示。
图7是用户界面中各个组件的框图。
图8是用于处理通信消息的方法的流程图。
详细描述
在描述用于处理通信消息的代理及其实现方法之前,一般地描述可以在通信体系结构中运行的计算设备会是有用的。可以在各个计算设置中使用这些设备以便在计算机网络上使用代理。例如,设备可以使用包括文本和语音的不同形式的自然语言输入来与代理交互。以下讨论的设备仅是示例性的,并不旨在限制此处所描述的主题。
在图1中示出了数据管理移动设备30的示例性形式。移动设备30包括外壳32并具有包括显示器34的用户界面,所述显示器34结合指示笔33使用触敏显示屏幕。指示笔33用于在指定的坐标处按下或接触显示器34来选择区域、选择性地移动光标的开始位置、或者诸如通过手势或手写等其他方式提供命令信息。或者或此外,可以在设备30上包括用于导航的一个或多个按钮35。此外,也可以提供诸如可旋转滚轮、滚筒或类似的其他输入机制。另一种输入形式可以包括诸如通过计算机显示的视觉输入。
现在参考图2,框图示出了包括移动设备30的功能组件。中央处理器(CPU)50实现软件控制功能。CPU 50耦合到显示器34使得依照控制软件生成的文本和图形图标出现在显示器34上。扬声器43可以耦合到CPU 50,该CPU 50通常带有数模转换器59用于提供听觉输出。
下载或由用户输入到移动设备30的数据存储在非易失性读/写随机存取存储器存储54中,该存储双向地耦合到CPU 50上。随机存取存储器(RAM)54提供对由CPU 50执行的指令的易失性存储,以及对诸如寄存器值等临时数据的存储。配置选项和其他变量的默认值存储在只读存储器(ROM)58中。ROM 58也可用于存储设备的操作系统软件,操作系统软件用于控制移动设备30的基本功能以及其他操作系统内核功能(例如将软件组件载入到RAM 54中)。
RAM 54以类似于用PC上于存储应用程序的硬盘驱动器的功能的方式用作代码的存储。应该注意虽然非易失性存储器用于存储代码,但是替换地它可以存储在并非用于代码执行的易失性存储器中。
无线信号可以由移动设备通过耦合到CPU 50的无线收发机52来发送/接收,所述无线收发机52耦合到CPU 50上。也可以提供可选的通信接口60,它用于按需从计算机(例如台式计算机)或从有线网络直接下载数据。相应地,接口60可以包括各种形式的通信设备,例如红外线链接、调制解调器、网卡等。
移动设备30包括话筒29、模数(A/D)转换器37以及存储在存储54中的可选的识别程序(语音、DTMF、手写、手势或计算机显示)。作为示例,响应来自设备30的用户的听觉信息、指令或命令,话筒29提供语音信号,它由A/D转换器37数字化。语音识别程序可以对经数字化的语音信号执行标准化和/或特征提取功能,用于获取中间的语音识别结果。
使用无线收发机52或通信接口60,语音数据或其他数据可以被远程地发送,例如发送给代理。当发送语音数据时,可以使用远程语音服务器。可以将识别结果返回给移动设备30,用于在其上呈现(例如视觉和/或听觉),并最终传送给代理,其中代理和移动设备30基于通信消息交互。
类似的处理可用于其他形式的输入。例如,手写输入可以用在设备30上的预处理来数字化或可无需设备30上的预处理即可数字化。如同语音数据,这种形式的输入可以发送给服务器以供识别,其中识别结果被返回给设备30和/或远程代理中的至少一个。同样地,DTMF数据、手势数据和视觉数据可以作类似的处理。取决于输入的形式,设备30(以及以下讨论的其他形式的客户机)将包括诸如照相机等必要的硬件用于视觉输入。
图3是便携式电话80的示例性实施例的平面图。电话80包括显示器82和键区84。一般地,图2的框图适用于图3的电话,虽然可能需要执行其他功能所必需的附加电路。例如,对于图2的实施例将需要作为电话运作所必需的收发器;然而,这种电路与本发明是无关的。
代理也可用于许多其他通用或专用计算系统、环境或配置。适用于本发明的公知的计算系统、环境和/或配置的示例包括,但不局限于,常规电话(没有任何屏幕)、个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子设备、射频标识(RFID)设备、网络PC、小型机、大型机、包括任何上述系统或设备的分布式计算环境等。
以下是对图4所示的通用计算机120的简要描述。然而,计算机120也仅是合适的计算环境的一个示例,并非旨在对本发明的使用范围和功能提出任何限制。计算机120也不应被解释为对其中所示的组件的任何一个或组合具有任何依赖或要求。
可以在由计算机执行的诸如程序模块的计算机可执行指令的一般语境中描述本发明。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。本发明也可以在分布式计算环境中实现,其中由通过通信网络链接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以同时位于包括存储器存储设备的本地和远程计算机存储介质中。借助附图,以下描述了程序和模块执行的任务。本领域的技术人员可以将描述和附图实现为处理器可执行指令,所述指令可以编写在任何形式的计算机可读介质上。
参照图4,计算机120的组件可包括,但不局限于,处理单元140、系统存储器150以及将包括系统存储器在内的各种系统组件耦合到处理单元140的系统总线141。系统总线141可能是若干类型的总线结构中的任何一种,包括存储器总线或存储器控制器、外围总线、以及使用多种总线体系结构的任一种的局部总线。作为示例,而非限制,这些体系结构包括工业标准体系结构(ISA)总线、通用串行总线(USB)、微信道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线和外围部件互连(PCI)总线(也称为Mezzanine总线)。计算机120通常包括各种计算机可读介质。计算机可读介质可以是能被计算机120访问的任何可用介质,并包括易失性和非易失性介质、可移动和不可移动介质。作为示例,而非限制,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以任何方法或技术实现、用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机存储介质包括但不局限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁性存储设备、或任何其它可用于存储所需信息并可由计算机120访问的介质。
通信介质通常在诸如载波或其它传输机制的已调制数据信号中体现为计算机可读指令、数据结构、程序模块、或其它数据,且包括任何信息输送介质。术语“已调制数据信号”意指以在信号中编码信息的方式设置或改变其一个或多个特征的信号。作为示例,而非限制,通信介质包括诸如有线网络或直线连接的有线介质,和诸如声学、射频(RF)、红外线和其它无线介质的无线介质。以上任何介质的组合也应包括在计算机可读介质的范围中。
系统存储器150包括诸如只读存储器(ROM)151和随机存取存储器(RAM)152的易失性和/或非易失性存储器形式的计算机存储介质。包含有助于如启动时在计算机120内元件间传送信息的基本例程的基本输入/输出系统(BIOS)153通常存储在ROM 151中。RAM 152通常包含处理单元140可立即访问和/或当时正在操作的数据和/或程序模块。作为示例,而非限制,图4示出了操作系统154、应用程序155、其它程序模块156、和程序数据157。
计算机120还可包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图4示出了读取和写入不可移动、非易失性磁性介质的硬盘驱动器161,读取和写入可移动、非易失性磁盘172的磁盘驱动器171,读取和写入可移动、非易失性光盘176,诸如CD-ROM或其它光学介质的光盘驱动器175。其它也在示例性操作环境中使用的可移动/不可移动、易失性/非易失性计算机存储介质包括,但不局限于磁带盒、闪存卡、数字化多功能光盘、数字化录像带、固态RAM、固态ROM等等。硬盘驱动器161通常通过诸如接口160的不可移动存储器接口连接至系统总线141,而磁盘驱动器171和光盘驱动器175通常通过诸如接口170的可移动存储器接口连接至系统总线141。
如上所述并如图4所示的驱动器及其相关联的计算机存储介质为计算机120提供了对计算机可读指令、数据结构、程序模块、和其它数据的存储。在图4中,例如,硬盘驱动器161被示为存储操作系统164、应用程序165、其它程序模块166、和程序数据167。注意这些组件可以与操作系统154、应用程序155、其它程序模块156、和程序数据157相同或不同。在此给予操作系统164、应用程序165、其它程序模块166、和程序数据167的不同编号说明至少它们是不同的副本。
用户可通过诸如键盘182、话筒183、以及诸如鼠标、跟踪球或触摸板等的定点设备181的输入设备向计算机120输入命令和信息。其它输入装置(未示出)可包括操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等等。这些和其它输入设备常常通过耦合至系统总线的用户输入接口180连接至处理单元140相连,但也可通过诸如并行端口、游戏端口或通用串行总线(USB)的其它接口和总线结构连接。监视器184或其它类型的显示设备也可通过诸如视频接口185的接口连接至系统总线141。除监视器以外,计算机还可包括诸如话筒187和打印机186的其它外围输出设备,它们通过输出外围接口188连接。
计算机120可以在使用与一台或多台远程计算机,诸如远程计算机194的逻辑连接的网络化环境中运行。远程计算机194可以是个人计算机、手持式设备、服务器、路由器、网络PC、对等设备或其它公共网络节点,而且通常包括以上相对于个人计算机120描述的许多或全部组件。图4中所描绘的逻辑连接包括局域网(LAN)191和广域网(WAN)193,但也可包括其它网络。这样的网络化环境在办公室、企业范围计算机网络、内联网和因特网上是常见的。
当用于LAN网络化环境中时,计算机120通过网络接口或适配器190连接至LAN 191。当用于WAN网络化环境中时,计算机120通常包括调制解调器192或其它用于在诸如因特网的广域网193中建立通信的装置。可以是内置式或外置式的调制解调器192可通过用户输入接口180或其它适当机制连接至系统总线141。在网络化环境中,相对于计算机120描述的程序模块或其一部分可存储在远程存储器存储设备中。作为示例,而非限制,图4示出了驻留于远程计算机194中的远程应用程序195。应当理解,所示网络连接是示例性的,且也可以使用其它用于在计算机间建立通信链接的手段。
通常,应用程序155可以通过用户输入接口180来经由命令行或图形用户界面(GUI)与用户交互。然而,为了简化和扩展计算机系统的使用,开发了能够接收来自用户的自然语言输入的输入。相比自然语言或语音,图形用户界面是精确的。设计良好的图形用户界面通常不会产生不明确的引用或需要底层应用程序确认通过界面180接收到的输入的特定解释。例如,由于界面是精确的,因此通常无需就输入进一步询问用户,例如“你是否点击了′OK′按钮?”。通常,为图形用户界面设计的对象模型在其实现上是非常机械化且严格的。
相比来自图形用户界面的输入,自然语言查询或命令经常被翻译成对输入对象模型的一系列而非仅一个函数调用。相对于传统的行输入或图形用户界面的严格的、机械化的限制,自然语言是其中人类对话者依靠彼此的智能、通常在无意中解决歧义性的通信手段。实际上,自然语言被视为“自然”,正是因为它不是机械的。人类对话者可以基于上下文信息和有关话语周围的多个范围的提示来解决歧义性。对于人类对话者,句子“Forward the minutes to those in thereview meeting on Friday(将会议记录转发给参加周五评审会议的人)”是无需任何进一步的解释可以完全理解的句子。然而,从机器的机械化角度看,必须指定诸如确切地是指哪个文档和哪个会议以及确切地应该将文档发送给哪些人的特定细节。
图5示出了具有代理202的示例性通信体系结构200。代理202从发起者接收通信请求和/或消息,并基于请求和/或消息执行任务。消息可以被路由到目的地。发起者可以包括连接到代理202的个人、设备、电话、远程个人信息管理器等。来自发起者的消息可以采用包括实时语音(例如来自简单电话或通过因特网voip源)、实时文本(诸如即时消息传递)、非实时语音(例如语音邮件消息)以及非实时文本(例如通过短消息服务(SMS)或电子邮件)的许多形式。任务可以由代理202例如响应于由发起者发送的顾客服务查询自动地执行。
在一个实施例中,代理202可以在诸如上述计算机120等通用计算机上实现。代理202表示用户对话应用程序的单个联络点。由此,如果希望与对话应用程序交互,那么通信请求和消息是通过代理202处理的。这样,无需使用特定的设备来联系代理202。仅需要通过任何期望的设备联系代理202,所述期望设备处理和路由传入的通信请求和消息。
通信请求或消息的发起者可以通过多种不同的通信模式联系代理202。一般地,可以通过以下途径访问代理202:通过诸如移动设备30(此处也表示具有基于输入形式所要求的显示屏、话筒、照相机、触敏面板等其他形式的计算设备)等客户机,或通过其中使通信可被听见的电话80,或通过响应于按下按键而由电话80生成的音调且其中可以将来自代理202的信息听觉地提供回用户。
然而更重要的是,代理202是统一的,无论信息是通过设备30还是电话80获取的,代理202均可支持任一种操作模式。代理202可以在操作上耦合到多个接口以便接收通信消息。由此,代理202可以基于设备的通信模式将响应提供给不同类型的设备。
IP接口204使用分组交换技术,例如使用TCP/IP(传输控制协议/因特网协议)来接收和发送信息。使用因特网协议的计算机设备通信由此可以与IP接口204连接。
POTS(简易老式电话系统,也称为简易老式电话服务)接口206可以与任何类型的线路交换系统连接,包括公用交换电话网(PSTN)、专用网络(例如公司专用交换机(PBX))和/或其组合。由此,POTS接口206可以包括FXO接口(外部交换局)接口和FXS(外部交换站)接口,用于使用线路交换技术接收信息。
IP接口204和POTS接口206可以体现在诸如模拟电话适配器(ATA)等单个设备中。可以使用可以在计算机和POTS之间连接并传输音频数据的其他设备,诸如使用电话应用程序接口(TAPI)将POTS连接到计算机的“语音调制解调器”。
如图5中所示,设备30和代理202通过网络208被共同连接到此处诸如因特网等广域网,并且可分别寻址。因此客户机30和代理202不必在物理上位于邻近彼此的位置。客户机30可以使用特定的协议将数据,例如语音、文本和视频数据发送给IP接口204。在一个实施例中,客户机30和IP接口204之间的通信使用标准化的协议,例如带有RTP的SIP(带有实时传输协议的会话发起者协议)、两个因特网工程工作小组(IETF)标准。
通过电话80访问代理202包括将电话80连接到有线或无线电话网络210,所述有线或无线电话网络210又通过FXO接口将电话80连接到代理202。或者,电话80可以通过FXS接口直接连接到代理202,所述FXS接口是POTS接口206的一部分。
IP接口204和POTS接口206都通过通信应用程序编程接口(API)212连接到代理202。通信API 212的一种实现是由华盛顿州雷德蒙市的微软公司开发的微软实时通信(RTC)客户机API。通信API 212的另一实现是计算机支持的电信体系结构(ECMA-269/ISO 18051)即CSTA(一种ISO/ECMA标准)。通信API 212可以有助于多模式通信应用,包括用于在两台计算机、两个电话以及一个电话和一个计算机之间的通信的应用。通信API 212也可以支持音频和视频呼叫、基于文本的消息传递以及应用程序共享。由此,代理202能够发起到客户机30和/或电话80的通信。
代理202也包括对话执行模块214、自然语言处理单元216、对话状态218和提示220。对话执行模块214包括处理来自通信API 212的通信请求和消息的逻辑并基于对话状态218来执行任务。这些任务可以包括发送来自提示220的一提示。
对话执行模块214使用自然语言处理单元216来执行各种自然语言处理任务。自然语言处理单元216包括用于标识用户输入中的特征的识别引擎。语音的识别特征通常是口语中的单词,而手写的识别特征通常对应于用户笔迹中的笔划。在一个特定的示例中,诸如文法等语言模型可用于识别语音话语中的文本。如所知的,也可以为视觉输入提供识别。
对话执行模块214可以使用由自然语言处理单元216识别出的对象来从对话状态218确定期望的对话状态。对话执行模块214也访问提示220,以便基于用户输入给人提供输出。对话状态218可以作为要由对话执行模块214访问的一个或多个文件来存储。提示220可以被集成到对话状态218中或与对话状态218分开存储和访问。提示也可以作为文本、音频和/或视频数据来存储,其基于来自用户的请求经由通信API 212发送给用户,例如,初始提示可以包括“欢迎来到Acme公司帮助中心,请问我有什么可以帮您的?”基于用户通信的模式来发送提示。如果用户使用电话连接到代理202,则可以通过电话听觉地播放提示。如果用户发送电子邮件消息,那么代理202可以使用电子邮件消息来响应。
在运作中,对话执行模块214翻译从用户处接收到的通信消息,以便遍历过包括多个对话状态,例如对话状态218的对话。在一个实施例中,对话可以被配置成具有用于回答来自用户的问题的提示的帮助中心。对话状态218可以被存储为要由对话执行模块214访问的文件。可以独立于用户用来访问代理202的特定通信模块来创作对话。由此,对话执行模块214可以包括用于访问对话状态218的应用程序编程接口(API)。
图6是包括多个对话状态的示例性对话300的图示。每个状态由圆圈表示,箭头表示两个状态之间的转移。对话300包括初始状态302和结束状态304。在由代理202接收到通信消息之后,对话300被启动并且从状态302开始。状态302可以包括要执行的一个或多个进程或任务。例如对话状态302可以包括要播放和/或发送给用户的欢迎提示。在初始状态302之后,可以接收进一步的通信消息。基于接收到的通信消息,对话300移动到下一状态。例如,对话300可以转移到状态306、状态308等。这些对话的每一个可以包括与用户进行对话的相关联的任务和提示。这些状态也包括到对话300中其他状态的转移。最终,遍历对话300直至达到结束状态304。
图7是允许人们创作对话,例如对话300的用户接口的组件的框图。接口使人能创建基于状态的对话。在一个实施例中,接口允许使用流程图编制工具来创建对话。工具使人能创建对话状态以及与对话状态相关联的各种属性。例如,人们可以指定任务320、提示322、文法324以及对话状态302的下一对话状态326。
任务320包括为对话状态302运行的一个或多个进程。提示322包括可以经由通信API 212发送的文本、音频和/或视频数据。文法324使得创作者能表达将驱使自对话状态302的状态改变的自然语言输入。例如,文法324可以是上下文无关的文法、n元文法、混合或其他。也可以指定跟随对话状态302的下一对话状态326,在该例中为对话状态306和308。对话状态306和308可以包括它们自己指定的任务、提示、文法和下一对话状态。
图8是由对话执行模块214执行的方法350的流程图。在步骤352处,接收到通信消息。接着,在步骤354处,基于接收到的消息确定通信模式。例如,模式可以是电子邮件消息、即时消息或经由电话系统的连接。在步骤356处,分析通信消息以便确定对话的下一对话状态。该步骤可以包括对话执行模块214访问自然语言处理单元216的标识消息中的语义信息。语义信息可以与文法一起使用以确定下一对话状态。在步骤358处,执行与对话状态相关联的任务。接着在步骤360处基于对话状态和通信模式来发送通信消息。例如,消息可以包括与对话状态相关联的一个或多个提示。在步骤362处,确定对话是否处于结束状态。如果对话不处于结束状态,那么方法350会进入步骤352,以便等待进一步的通信消息。如果到达了结束状态,那么方法350在步骤364处结束。
由此可以实现跨通道独立于通信模式创作对话的架构。对话执行模块可以通过各种通信通道与用户通信。对话可以由对话执行模块访问,使得对话执行模块可以发起和进行对话,而不管用户期望的通信模式为何。
虽然使用结构化特征和/或方法动作专用的语言描述了本主题,但是应该理解在所附权利要求书中定义的本主题不必限于上述特定特征和动作。相反地,上述特定特征和动作是作为实现权利要求的示例形式来公开的。

Claims (20)

1.一种在通信体系结构(200)中处理通信消息的方法(350),包括:
从源接收(352)第一通信消息;
标识(354)与所述第一通信消息相关联的通信模式;
基于所述第一通信消息确定(356)对话状态;
基于所述对话状态,使用所述通信模式将第二通信消息发送(360)给所述源。
2.如权利要求1所述的方法,其特征在于,还包括访问包含多个指定的对话状态的对话文件(218)。
3.如权利要求2所述的方法,其特征在于,所述对话状态的每一个包括相关联的属性,所述属性包括任务(320)、提示(322)和相关的对话状态(326)中的至少一个。
4.如权利要求1所述的方法,其特征在于,还包括基于所述对话状态执行任务。
5.如权利要求1所述的方法,其特征在于,还包括分析所述第一通信消息来确定其中包含的语义信息,且其中基于所述语义信息确定所述对话状态。
6.如权利要求1所述的方法,其特征在于,所述通信模式是电子邮件、即使消息传递和电话中的一个。
7.如权利要求1所述的方法,其特征在于,所述第一通信消息包括语音数据和文本数据中的一个。
8.一种适用于处理来自具有一通信模式的源的通信消息的计算机可读介质,包括:
一对话执行模块(214),适用于访问多个对话状态(218),以便基于所述通信消息确定对话状态;以及
一通信接口(212),耦合到所述对话执行模块,并且适用于基于所述对话状态和所述通信模式将响应发送给所述源。
9.如权利要求8所述的计算机可读介质,其特征在于,所述的对话执行模块还适用于分析所述通信消息,以便确定其中包含的语义信息。
10.如权利要求9所述的计算机可读介质,其特征在于,基于所述语义信息确定所述下一对话状态。
11.如权利要求10所述的计算机可读介质,其特征在于,所述对话执行模块适用于访问语言模型,以便基于所述语义信息确定所述对话状态。
12.如权利要求8所述的计算机可读介质,其特征在于,所述通信接口适用于将所述响应发送给因特网协议源和POTS源。
13.如权利要求8所述的计算机可读介质,其特征在于,所述对话执行模块适用于访问提示(220),以便确定所述响应。
14.一种系统(200),包括:
一通信接口(212),适用于从多个不同的通信模式接收通信消息,并基于所述多个不同的通信模式来发送通信消息;
一对话文件(218),包括多个对话状态,每个对话状态具有相关联的属性;以及
一对话执行模块(214),耦合到所述通信模块以从中接收通信消息,适用于访问所述对话文件以便基于特定的通信消息确定对话状态,并且将与所述对话状态相关联的响应提供给所述通信接口。
15.如权利要求14所述的系统,其特征在于,所述相关联的属性包括提示、语言模型和相关联的对话状态。
16.如权利要求14所述的系统,其特征在于,还包括耦合到所述对话执行模块的自然语言处理单元(216),用于标识所述通信消息内的语义信息。
17.如权利要求14所述的系统,其特征在于,还包括耦合到所述通信接口的因特网协议接口(204)和POTS接口(206)。
18.如权利要求14所述的系统,其特征在于,所述对话执行模块包括用于访问所述对话文件的应用程序编程接口。
19.如权利要求14所述的系统,其特征在于,所述通信消息包括至少一个语音数据和文本数据。
20.如权利要求14所述的系统,其特征在于,所述通信接口适于发送电子邮件消息和音频消息中的至少一个。
CNA200680038585XA 2005-10-18 2006-10-03 对话创作和执行架构 Pending CN101292256A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/253,047 US20070115920A1 (en) 2005-10-18 2005-10-18 Dialog authoring and execution framework
US11/253,047 2005-10-18

Publications (1)

Publication Number Publication Date
CN101292256A true CN101292256A (zh) 2008-10-22

Family

ID=37962817

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200680038585XA Pending CN101292256A (zh) 2005-10-18 2006-10-03 对话创作和执行架构

Country Status (6)

Country Link
US (1) US20070115920A1 (zh)
EP (1) EP1941435A4 (zh)
JP (1) JP2009512393A (zh)
KR (1) KR101251697B1 (zh)
CN (1) CN101292256A (zh)
WO (1) WO2007047105A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110998526A (zh) * 2017-10-04 2020-04-10 谷歌有限责任公司 用户配置的且自定义的交互式对话应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197344B2 (ja) * 2006-02-20 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声対話システム
US8943394B2 (en) * 2008-11-19 2015-01-27 Robert Bosch Gmbh System and method for interacting with live agents in an automated call center
US20140269490A1 (en) * 2013-03-12 2014-09-18 Vonage Network, Llc Systems and methods of configuring a terminal adapter for use with an ip telephony system
US10462619B2 (en) 2016-06-08 2019-10-29 Google Llc Providing a personal assistant module with a selectively-traversable state machine
KR102485253B1 (ko) * 2017-11-10 2023-01-06 현대자동차주식회사 대화 시스템 및 그 제어방법

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69232407T2 (de) * 1991-11-18 2002-09-12 Toshiba Kawasaki Kk Sprach-Dialog-System zur Erleichterung von Rechner-Mensch-Wechselwirkung
US5396536A (en) * 1992-06-23 1995-03-07 At&T Corp. Automatic processing of calls with different communication modes in a telecommunications system
US6404746B1 (en) * 1999-07-13 2002-06-11 Intervoice Limited Partnership System and method for packet network media redirection
US6389132B1 (en) * 1999-10-13 2002-05-14 Avaya Technology Corp. Multi-tasking, web-based call center
US6985576B1 (en) * 1999-12-02 2006-01-10 Worldcom, Inc. Method and apparatus for automatic call distribution
KR100314084B1 (ko) * 1999-12-07 2001-11-15 구자홍 인터넷 브라우져를 이용한 상담 장치 및 방법
JP3535068B2 (ja) * 2000-03-30 2004-06-07 富士通株式会社 マルチチャネル処理の制御装置およびマルチチャネル処理の制御方法
KR20020015908A (ko) * 2000-08-23 2002-03-02 전영 화상과 음성을 이용한 실시간 인터넷 콜시스템
US7194409B2 (en) * 2000-11-30 2007-03-20 Bruce Balentine Method and system for preventing error amplification in natural language dialogues
WO2002073331A2 (en) * 2001-02-20 2002-09-19 Semantic Edge Gmbh Natural language context-sensitive and knowledge-based interaction environment for dynamic and flexible product, service and information search and presentation applications
KR100679807B1 (ko) * 2001-09-29 2007-02-07 주식회사 케이티 유선전화망에서의 문자정보서비스 제공 시스템
US7136909B2 (en) * 2001-12-28 2006-11-14 Motorola, Inc. Multimodal communication method and apparatus with multimodal profile
US20030179876A1 (en) * 2002-01-29 2003-09-25 Fox Stephen C. Answer resource management system and method
JP3777337B2 (ja) * 2002-03-27 2006-05-24 ドコモ・モバイルメディア関西株式会社 データサーバのアクセス制御方法、そのシステム、管理装置、及びコンピュータプログラム並びに記録媒体
US7302383B2 (en) * 2002-09-12 2007-11-27 Luis Calixto Valles Apparatus and methods for developing conversational applications
US7606714B2 (en) * 2003-02-11 2009-10-20 Microsoft Corporation Natural language classification within an automated response system
JP2004289803A (ja) * 2003-03-04 2004-10-14 Omron Corp 対話システム、対話制御方法および対話制御プログラム
US7729919B2 (en) * 2003-07-03 2010-06-01 Microsoft Corporation Combining use of a stepwise markup language and an object oriented development tool
US7363027B2 (en) * 2003-11-11 2008-04-22 Microsoft Corporation Sequential multimodal input
US7546546B2 (en) * 2005-08-24 2009-06-09 International Business Machines Corporation User defined contextual desktop folders

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110998526A (zh) * 2017-10-04 2020-04-10 谷歌有限责任公司 用户配置的且自定义的交互式对话应用
US11676602B2 (en) 2017-10-04 2023-06-13 Google Llc User-configured and customized interactive dialog application
CN110998526B (zh) * 2017-10-04 2024-03-22 谷歌有限责任公司 用户配置的且自定义的交互式对话应用

Also Published As

Publication number Publication date
JP2009512393A (ja) 2009-03-19
KR101251697B1 (ko) 2013-04-05
KR20080058408A (ko) 2008-06-25
US20070115920A1 (en) 2007-05-24
WO2007047105A1 (en) 2007-04-26
EP1941435A4 (en) 2012-11-07
EP1941435A1 (en) 2008-07-09

Similar Documents

Publication Publication Date Title
US11134153B2 (en) System and method for managing a dialog between a contact center system and a user thereof
US10951554B1 (en) Systems and methods facilitating bot communications
US20210157989A1 (en) Systems and methods for dialog management
US7653547B2 (en) Method for testing a speech server
US7801968B2 (en) Delegated presence for unified messaging/unified communication
US10701206B2 (en) System and method for contact center communications
US10382475B2 (en) System and method for preventing attacks in communications
CN101536084A (zh) 对话分析
CN110300986A (zh) 与智能个人助理的辅助通信
CN101682673A (zh) 自动话务员语法调整
JP7434560B2 (ja) 双方向通信システムのためのサービスとしての機能クラウドチャットボット
WO2016054110A1 (en) Pattern-controlled automated messaging system
CN101589427A (zh) 语音应用程序装备和记入
CN101292256A (zh) 对话创作和执行架构
US20180268344A1 (en) Virtual dialogue crowdsourcing
CA3083709A1 (en) A system, device, and method of performing data analytics for advising asales representative during a voice call
US10178230B1 (en) Methods and systems for communicating supplemental data to a callee via data association with a software-as-a-service application
CN111246030B (zh) 一种号码有效性判断的方法、装置和系统
US20060019704A1 (en) Integrating wireless telephone with external call processor
CN101833952B (zh) 客户服务器系统中处理输入数据的方法
JP2022129582A (ja) 情報処理システム、オペレータ端末、及びプログラム
Machiraju et al. Skype Calling Bot
TW202123667A (zh) 網頁電話結合智能客服之應用系統

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20081022