CN1864203A - 用于对话系统的对话控制 - Google Patents

用于对话系统的对话控制 Download PDF

Info

Publication number
CN1864203A
CN1864203A CNA2004800295746A CN200480029574A CN1864203A CN 1864203 A CN1864203 A CN 1864203A CN A2004800295746 A CNA2004800295746 A CN A2004800295746A CN 200480029574 A CN200480029574 A CN 200480029574A CN 1864203 A CN1864203 A CN 1864203A
Authority
CN
China
Prior art keywords
dialog
dialogue
graphic
graphic dialog
assembly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800295746A
Other languages
English (en)
Inventor
M·奥尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1864203A publication Critical patent/CN1864203A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/0012Details of application programming interfaces [API] for telephone networks; Arrangements which combine a telephonic communication equipment and a computer, i.e. computer telephony integration [CPI] arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Stored Programmes (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明描述了一种开发用于对话系统的对话控制(DS)的方法和系统,其一方面控制与用户的对话,另一方面监测对话系统的语音用户接口(SP)和应用程序(AP)。首先,产生图形对话描述(GB),其在开发过程中由开发系统的显示装置显示。随后,图形对话描述(GB)转换成技术对话描述(TB),该技术对话描述(TB)包含面向对象翻译器语言的类并且将这些类翻译成二进制格式,其最终表示由对话系统执行的对话控制(DS)。

Description

用于对话系统的对话控制
本发明涉及一种产生用于对话系统的对话控制的方法和系统,以及具有该类型的对话控制的对话系统。
用于对话系统语音控制用户向导的对话控制对于各种类型的语音入口具有很宽的商业应用领域,例如,在诸如电话银行和家庭对话系统之类的语音控制信息和服务提供系统的情况下。这种类型的语音对话系统具有语音输入界面,通过该界面用户的语音发声被记录和评估,并且还通常具有语音产生和语音输出的设备。作为中心控制组件,该对话系统具有对话控制。该对话控制以系统和用户之间预定的、互为条件的、互相起作用的子对话形式实现所有的有效语音对话,以及可以从其得到的系统侧响应。有效对话网络和它们的条件相关性会在具有相应的复杂规范的对话系统情况下变得相对的宽泛。
原理上,这种对话控制可以以硬件的形式实现,例如ROM芯片。在执行速度方面,这样硬件解决方案优于软件解决方案,但是不提供对改变的条件适应的可能。因此,将该对话控制用软件实现是切合实际的,并且也使得执行该对话系统是可能的。
在语音控制对话系统的开发和生产中,通常的问题出现在当要被控制的对话系统是相应复杂性的情况下,一方面对话开发者很难获得对话控制的总评述。另一方面,对于对话系统的规范的每个改变,所谓的对话描述,必须发生相应的对话控制或对话描述的适应,其快速准确的可行性反过来又被对话描述的复杂性限制。根据对话系统的类型或应用,这类的改变将需要被非常频繁地执行,例如,作为来自自动销售系统提供的货物和服务或者它们的价格范围中变化的结果。
通常,具有特定开发系统的对话控制是通过对话开发者产生并且随后被加载到对话系统,在对话系统中其由它的运行系统执行。如果需要对对话描述进行改变,那么对话控制必须被读入开发系统,在那里相应地更新,并且随后被再一次加载到对话系统的运行时环境。如今,使用最专有的描述和说明语言,这些主要是具有对任务特制的指令范围的编程语言。这些语言具有这样的缺点:该对话开发者必须为了指定对话控制的目的特别地学习这些语言。同样地,对话系统的生产者的客户或者外部业务提供商仅能够在广泛训练之后对于对话描述进行适应或改变。这使得这种系统非常不易改变,并且对于一些应用程序领域不能使用。此外,要产生或改变的对话描述通常是如此复杂,以至于在专有语言的给定框架中开发过程或维护过程占用相当多的时间。
用于对话控制的对话规定语言大部分是由解释器在对话系统中执行的脚本语言。其主要的缺点在于由于需要解释使得这种对话控制的执行速度在对话系统的运行时环境中是有限的。同样地,由于它们更难构造使得达到一定复杂性水平的脚本语言的程序开发时间也更长。由于当前技术发展,甚至有必要扩大说明语言的指令或功能的范围。这导致了进一步的缺点,即开发系统的解释器和对话系统的解释器必须适应新范围的指令。
原理上,通过图形或直观编程的方式能实现对话控制的设计。然而,在控制广泛的对话描述复杂性方面可能出现相当多的困难,因为通常图形工具仅提供具有特别编制的以及由此受限制范围的命令结构和监控结构的专有方法。以这种方式开发的图形化开发对话于是可以以脚本语言程序的形式作为对话控制用于对话系统。然而,以这种方式实现的图形开发系统不具有开发任何预期复杂度对话的必要能力。
因此,本发明的一个目的是启用用于对话系统的简单、灵活、快速和经济的新产品以及对话控制的适应。
首先通过一种产生用于对话系统的对话控制的方法实现这个目的,其中应用程序开发者首先通过选择并组合合适的图形化表示对话组件产生一图形对话描述。这里,图形对话描述是通过显示装置可见的。例如,图形对话组件通常可以代表频繁出现以及可重复使用的标准子对话,例如问候和结束对话,认证对话或者信息询问。同样地,对话的结构组件,例如对话控制能够采用的状态,或者状态转换,可以图形化表示。对话开发者可以从一档案中(例如,从一对话数据库或者对话库中)将这些取出,并且在图形对话描述可视化的基础上,经由精确确定的接口,可以将它们与已经选择的组件适当地链接起来。根据该发明,该图形对话描述随后自动地转换成技术上的对话描述,其表示以面向对象的翻译器语言的程序代码形式的生成对话。由于这种通用程序语言(例如,Java,C++或者C#)在计算方面比图形描述语言更强大,因此图形对话描述的功能可以在任何情况下通过转换被变换成等价的技术对话描述。在开发者已经完全按照他愿望产生了在技术水平上的对话之后,技术对话描述利用合适的编译器被翻译成机器码,形成对话控制,并且能够安装到对话系统中立即使用。与通常使用以解释器语言或脚本语言产生的对话控制比较,其优点在于对话控制可使用机器码形式,在这方面对话控制在对话系统上运行快速并且可靠,而脚本程序必须通过较慢的解释器解释。
采用通用的而非专有程序语言的一个重要优点在于能够实现任何可以想象的对话的可能性。这产生了进一步的优点在于这种对话控制可以在任何时候不必花费进行扩展,并且能够适用于任何技术或市场经济的发展。
该技术对话描述包括采用的面向对象编程语言的类,其一方面能够从基本类中衍生并且从而继承了这些基本类的某些特性,并且在另一发明能够包括用于子对话、对话状态或者对话转换的子类。这样会出现类体系,其作为一个整体表示技术对话描述,并且最终完全规定对话控制。
以任何预期的面向对象编程语言编写的对话组件或者对话模块具有优点,由于语言结构导致的数据封装和接口的准确定义,它们在原理上是可重复使用的,并且因此还能够有效地再次用于对话控制的后续新开发。
在图形水平开发对话的开发者,通过图形选择和组合,能够优选地执行并在技术水平上通过编程更准确地改进对话。因此,例如在技术描述水平上的对话系统的标准发声能够适应于具体的对话情况,或者在一(图形)子对话中指定的对用户开放的询问选项可以通过额外的增加而扩展。
在技术描述水平上对话类的新编写对于特别有经验的对话开发者是非常合适的,如果他们能够编程对话比他们用图形化开发对话更快的话。同样地,例如如果需要特定水平抽象的对话类,其继承了一个或多个类的特点和方法,并且相似的类不能在对话类数据库中找到,则对于开发的技术编程方法是优选的。还有一种情况是通过并不具有完全计算能力的图形描述语言,不能实现特定对话的情况,或者能够实现但有困难。在这些情况下,对话开发者选择利用具有完全计算能力的编程语言进一步开发技术对话描述,并且编写实现具体子对话的新的面向对象类,从而将这些类结合到技术对话描述中。
在任何情况下,本发明的一个特殊优点在于对话控制的开发可以以一种特别灵活并且面向问题的方式进行,不仅是在图形而且在等效的编程语言水平上。
这个分布式对话开发的另一个优点在于语音控制对话系统的对话-这些对话在后续的操作中仅以声音的形式出现,并且这些对话系统现今能够达到相当大程度的复杂性-在图形描述水平上可以看到。因此,对话开发者能够对它们获得更好的观察,并更好地设计它们。转换成技术对话描述的中间步骤使得对话开发者能够将对话控制的图形设计准确地适应由对话系统设定的需求,或者适应客户的希望。
这里,采用诸如Java或者面向对象C派生(C-devivative)之类的传统编程语言,而没有采用专有对话描述语言,是特别有利的,因为不仅对话系统的生产者而且对于例如用户维护人员或者专门服务提供商都可以开发对话控制,并且如果必要的话进行修改。这里所需要的是系统的编程接口(API)中的指令。原理上,任何面向对象编程语言可以在这里选用。
为了确保图形和技术对话描述之间的一致性,在本发明的一个实施例中,还可以将技术对话描述的文本改变结合到图形对话描述中。图形和技术描述语言能力(powerfulness)上的可能差别在更新图形对话描述上不会造成问题,因为通过面向对象编程语言的严谨语法以及归因于继承和抽象机制的体系结构,每个对话类可以符号化表示为它的相关性和接口。
在本发明特别优选的例子中,图形对话描述到技术描述的转换,以及通过改变技术对话描述更新图形对话描述,在通过开发环境的背景下以自动方式发生,并且是以对于开发者透明的方式发生。通过这种方式,对话开发者同时在两个描述水平上的准并行开发甚至是可能的。
在该实施例的情况下,另外可以确信在图形对话描述到技术对话描述的用户控制转换的情况下,两种描述的一致性不会受到技术对话描述的可能改变类或者组件的简单改写的危害,而是相比较图形对话描述,技术对话描述的过剩在转换过程中被保留,并且反过来在图形对话描述中被更新。
用于产生技术对话描述的类/组件可以完整地或部分地,即还可以单独地存储在对话数据库或者库中。在一个实施例的情况下,这种存储在对话数据库中的对话或子对话的这样技术描述可以有利地从对话开发环境中读出,并且作为对于对话控制的技术以及-更新后-图形新开发的起点。这使得程序片段可以重复使用,并且因此允许高速有效开发。
完全或部分存储在数据库中的技术对话描述可以包含类体系以及类库,其表示在几个水平抽象中的特别重要的对话特征。这些类体系还可以在被以技术对话描述形式读入到开发环境中之后,表示成图形对话描述,因为类和继承方法之间的关系以及特性通过合适的图形符号被可视化。从已经以这种方式可视化的类体系,对话开发者可以通过选择相应的符号选择为其需要被足够规定的类,并且将它们与其它对话组件适当地组合。例如,这些单独的子对话以及它们之间接口的准确规范,可以通过编程出单独的类在选定并组合的组件转换为技术对话描述之后发生。这样,实现了一种有利的分布式对话开发,其中对话控制的结构实现在清晰的图形描述水平上,并且详细的工作通过编程发生在技术描述水平上。
在根据本发明方法的一个有利实施例的情况下,技术对话描述的所有技术组件/类由符号表示,或者被表示成在图形对话描述中的块状线条(block lines)或者环形线条(circle lines)。于是图形对话描述可以表示成对话的完整状态/转换图,该对话通过对话控制实现。这具有这种优点,即如果所有类或者组件已经存在,则频繁使用的用来设计对话的状态/转换图能够直接转换成图形,并且从而最终也转换成技术对话描述。
在本发明的该实施例的情况中,类的特点和方法能够有利地通过符号在图形对话描述中识别为类的元素。每个符号可以具有一标记,该标记具有额外的信息,例如输入和输出参数或者接口,或者其可能陈述了方法或者类的完整程序代码。类似地,单独对话状态之间的转换被图形化表示,其中每个转换能够被指定一标记,该标记具有系统或用户的相应陈述和对话步骤,其引起了相应的转换或者其导致了转换。利用以这种方式表示的图形对话描述,对话开发者能够通过诸如托拽,移动,拷贝,插入或者剪切等简单的鼠标操作,开发用图表表示的语言学,即实质上声学的对话,并且能够更准确地规定它。在一个特别有利的实施例中,通过双击一符号,对话开发者能够打开一文本窗,其中他可以对相应的组件做文本上的改变,或者能够对它们进行编程。通过这种图形和文本开发的结合,方便的对话开发成为可能。
为了这种用于一对话系统的对话控制开发,需要一种根据本发明的开发系统,其包含至少一图形对话编辑器,利用该编辑器图形对话描述能够被可视化并编辑。用于对话系统的这个开发环境还包含将图形对话描述转换成技术对话描述的转换器,其中技术对话描述包含面向对象编程语言的类。该源代码然后通过根据本发明的开发系统的翻译器(编译器)翻译成二进制描述格式,其最终表示可以执行在对话系统上的对话控制。
为了技术描述到等效的图形对话描述的反向转换,该开发系统优选地包含一更新器。
为了修改表示对话控制的源代码的技术对话描述,该开发系统优选地包含用于文本上编辑源代码的文本编辑器。
在一本发明特别有利的实施例中,除了文本编辑器,还存在一完整的编程环境,该编程环境具有结合调试器,编译器以及用于选择面向对象对话类的类浏览器。
该开发环境的一个优点在于,复杂多层次语音对话可以借助于通过可视编程用于编辑和可视化的适当工具通过图形水平上的对话开发者来设计,虽然他能够借助于完整的编程环境通过面向对象编程实现在技术对话描述中的细节。
作为本发明的一个有利的实施例,上述的开发系统结合到对话系统的运行时环境中,以便该对话描述能够有利地产生在硬件平台上,在该平台上其作为对话控制实现操作。
在由在此描述的开发系统开发的对话控制进行控制的对话系统的情况下,特别有利的是在操作过程翻译的对话控制能够被结合到系统中。由此,对话控制能够被更新,而无需为了安装更新的对话控制而将系统退出操作。这对于一种系统特别有利处,例如该系统由于持续的特殊提供,因此需要特别频繁地更新。
本发明将通过参考附图和下文中描述的典型实施例进行说明。图中:
图1示出了对话系统的示意图,
图2示出了根据本发明的对话控制开发的流程图,
图3a示出了对话系统的对话的图形表示,
图3b示出了对话系统的子对话的图形表示,
图4示出了技术对话控制的例子,
图5示出了图4中所示的技术对话控制的两个子对话。
图1中示出了根据本发明具有对话控制DS的对话系统的设计实例,该对话系统与应用程序AP、语音产生单元SG以及语音输入接口SP一同工作。该对话控制DS根据其执行的状态、转换以及对话控制对话系统。
输入的语音话语S首先通过语音输入接口SP的信号记录单元SA转换成数字音频语音信号AS,并传送到语音识别单元SE。语音理解过程,也就是对于语音识别单元SE已知的话语识别由对话控制DS通过启动信号ST启动。
通常,结合到语音输入接口SP的语音识别单元SE包含语法分析单元和语义合成单元(在此都未示出),其根据对话控制规定的用户语法GR检验数字化语音话语AS的有效性,并将它转化成识别结果ER,其作为对于用户话语的响应,包含编程语言或者机器码指令。该识别结果ER一方面被发送到对话控制DS以便允许其恢复对话程序的控制,并且在另一方面它被发送到应用程序AP,以便由其直接执行。可替换地,该识别结果ER能够通过语音识别单元SE仅发送到对话控制DS,以便由此传递到应用程序AP。
因此,对话控制DS是对话系统的中心转换点,因为它规定了会由语音识别单元SE认为有效所接收的对话,并且因此间接地控制应用程序AP。此外,对话控制DS还控制语音产生单元SG,其根据在对话控制DS中执行的对话启动由系统到用户的语音话语产生。
通常,语音输入接口SP的语音识别元件SE,应用程序AP以及对话控制DS均是用相同的面向对象翻译器语言编写的,或者至少以一种能够在相同平台上执行的语言编写。
图2是对话控制开发的示意顺序。其还示出了根据本发明对话开发环境的所有重要部件。它包括了表示显示器和编辑器装置的图形对话编辑器GE,利用该编辑器GE对话开发者能够可视化并设计对话。为此,各种基本组件对他是可用的,例如对话,状态和转换,其在技术上可作为类体系的基本类实现,并且他可以选择其作为在图形对话编辑器GE中的图形符号,并且通过明确定义的接口能够与其它组件适当地组合。
第一个开发循环的结果是图形对话描述GB,其最初仅实际上以编辑器的内部表示形式存在。图形对话描述GB通过转换器UM被转换为技术对话描述TB,因为图形对话描述GB的单独(图形)组件被转换成面向对象编程语言的类实例。这些类实例表示以编程语言形式的图形组件(比较图4和5),例如作为用于对话、状态和转换的基本类实例,或者换句话说用于特殊子对话的具有继承特性的衍生类。
由转换器UM产生的技术对话描述TB能够借助于文本编辑器TE由对话开发者进行编辑,其可以是用于由转换器UM产生的编程语言的理想编程环境的一部分。通过编辑技术对话描述TB的可能性,对话开发者能够编程出要被开发的对话控制DS,也就是,通过细节对它进行补充,该细节或者是他在设计图形对话描述GB时不能实现的,或者是对于他在技术编程水平上实现更容易。
对话开发者借助于技术对话编辑器TE对技术对话描述TB作出的改变能够通过更新器AK重新结合到图形对话描述中,以至于对话开发的两级抽象彼此保持一致。在此期间,新编程的技术对话描述TB的类/组件或者方法借助于相应的符号以图形对话描述GB可视化,并且根据新编程的组件的关系,它们被连接到图形对话描述GB的其它符号。
在本发明的特别有利的实施例中,执行更新的AK,以至于通过更新的图形对话描述GB的更新转换UM产生技术对话描述TB,其(在由合适的编译器翻译之后)显示出与由对话开发者改变的最初技术对话描述TB相同的运行时行为。
在对话数据库DB中,子对话以及标准化对话元件以程序码的形式存储,其能够被读入到文本对话编辑器TE中作为技术对话描述TB,并且由对话开发者改变,作为用于需被新开发的对话的基础,或者作为现存对话的扩展/改变。类似地,现存对话和对话组件可以存储在数据库DB中以备后续使用。由于面向对象编程语言被用于技术对话描述TB,所以对话数据库DB可以包含类体系,从中对话开发者可以选择适合于他的目的、用于编程的抽象级的类。从这些类体系和库开始,新对话的开发通过衍生或者继承和抽象出现在技术和图形描述水平TB,GB。
完成的技术对话描述TB由编译器UB翻译成机器码对话控制DS,其最后被结合到图1中示出的对话系统中。
该对话控制DS的(确定性)行为可以借助于完全描述系统所有状态的状态/转换图以及导致状态变化(转换)的事件正式地描述。图3通过一个例子示出了一简单对话HD的状态/转换图,其由对话控制DS实现。该对话HD可以假定一状态S1,具有一子对话SD,该子对话没有以任何进一步细节规定,其中又至少规定了另一个的状态,并且还具有四个转换T1,T2以及T3/T4,其分别由对话步骤启动。该转换T1本身映射了状态S1,而其它转换T2和T3/T4描述了状态S1和在子对话SD中规定的其中一个状态之间的改变。
状态S1是对话系统的最初状态或者起始状态,其在与用户的每次对话结束时重新假设。在该状态,系统产生一促使用户产生一话语的起始短语“我可以为你做什么”。用于启动转换T1的“时间是几点?”以及启动转换T2的“天气预报怎么说”两个语音话语现在对于用户而言是开放的。在第一种情况下,系统响应准确的时间,并且完成相应的转换T1,因为为了再次给出起始话语,它返回到起始状态S1。在后一种情况下,系统经由转换T2和输入接口IN改变到子对话SD。从子对话SD,转换T3/T4经由输出接口OUT返回到起始状态S1,其中在转换T2中提出的问题得到了回答。
图3b示出了子对话SD的相应状态/转换图。它示出了一状态S2,其经由一输入接口IN和一输出接口OUT与在图3a中示出的较高级主对话HD连接。子对话SD具有一状态S2,经由转换T2从主对话HD的状态达到该状态,以及两个转换T3和T4,它们都承担了在主对话HD中规定的状态到状态的改变。
在转换T2的对话步骤“天气预报怎么说”之后,对于用户需求的更准确规定,子对话SD通过反问题“明天还是下个星期”进行响应,并且改变到新的状态S2。在状态S2,用户仅可以利用对话步骤“明天”或“下周”回答对话控制DS的反问题。在状态S2,他不再具有询问时间的选项;为了实现这个目的,首先必须离开子对话SD并且状态S1会重新开始。在来自于用户澄清的基础上,对话控制DS根据“明天”还是“下周”的天气预报而有区分地回答,并且借助于相应的转换T3或T4,它经由输出接口OUT分支返回到主对话HD,接着返回到起始状态S1。
在图3a和3b中的图表示了图形对话描述GB的一个例子。对话开发者通过状态S1,S2,转换T1,T2,T3,T4以及子对话SD的规定图形化地设计对话HD。这里,对话步骤可以通过双击以及文本输入与相应的转换T1,T2,T3,T4相关联。在图形对话描述GB UM转换成技术对话描述中,对话HD的组件(状态,转换和子对话)被转换成以面向对象编程语言形式的编程语言版本。图4和5中示出了这种来自于图3a和3b的图形对话描述的UM转换。
为了说明,下述的示例技术对话描述TB是由面向对象编程语言C#编写的。然而从根本上任何其它面向对象编程语言对于技术对话描述TB的定义是适合的。图4示出了作为类“ExampleDialogue”的主对话HD,其从由系统规定的基本对话类“Dialogue”衍生而来,并且其继承了类“Dialogue”的特性。“ExampleDialogue”限定了两个状态“state1”和“state2”,两个转换“WeatherTrans”和“timeTrans”以及一子对话“Weather”。尽管状态“state1”和“state2”以及转换“WeatherTrans”是基本类“State”和“TPansition”对于状态和转换的实例,但是“timeTrans”和“Weather”形成了由对话开发者同样实现的两个类的实例,其又从其它基本类中衍生,并且在图5中指定。
当通过调用四个构造器实例化时,类“ExampleDialogue”的Initialize()方法产生对象“state1”,“WeatherTrans”,“timeTrans”和“Weather”。对象“state1”表示起始状态S1,其与对话系统最初与用户通信的对话步骤相关联。对象“WeatherTrans”表示转换T2,其从状态“state1”S1改变到子对话SD“Weather”的状态,并且从而作出给定阶段的输出。对象“timeTrans”映射状态“state1”到其本身,并且对象“Weather”表示子对话SD,可能从状态“State1”S1分支到其中。
为了完全规定对话HD,现在所缺少的是类“TimeTransition”和“WeatherDialogue”的规定,其在这个水平是未知的,其例子表示对象“timeTrans”和“Weather”。这些在图5中示出。
类“TimeTransition”从类“Transition”中衍生出,其中主对话HD的对象“WeatherTrans”已经表示一实例。该类仅实现了对于问题的回答,其已经在主对话HD的类“ExampleDialogue”实例化时作为参数被赋予对象“timeTrans”。
类“WeatherDialogue”从类“sub-dialogue”中衍生,其又包含一状态“state”S2和两个转换“TomorrowTrans”T3和“WeekTrans”T4。该类表示图3b中示出的子对话SD的技术程序转换UM。它在具有反问题的状态“state”S2根据状态/转换图响应关于天气预报的问题(比较在“ExamdleDialogue”中的它的实例参数),并且以具有转换“tommorowTrans”T3或“WeekTrans”不同的方式响应。到以“Exit”结束子对话时,它将控制传递回到类“ExampleDialogue”的更高级对象,其实例化类“ExampleDialogue”的对象“Weather”。
技术对话描述TB-包含上述的三个类,用来实现主和子对话HD,SD-最终通过编译器UB(对照图2)翻译成机器码,从而形成对话控制DS。为了在对话系统中对话控制DS的运行,类“ExampleDialogue”的较高级对象通过调用相应的构造器被实例化,其依次通过另一对象的实例化实现完整的对话。
最后,应再一次指出,由图和说明书表示的具体对话系统和开发系统仅是设计实例,本领域技术人员能够在不背离本发明范围的情况下进行很大程度的改变。特别是在此示出的设计实例中的程序片段是由面向对象编程语言C#编写的,其可以以任何其他面向对象编程语言编写。更应清楚的是,这里示出的对话设计实例是非常简单、短的实例,选择这样的实例是为了尽可能简单地说明本发明。现实中的对话本质上是相当复杂的。为了完整性,还应指出的是,不定冠词“a”或“an”的使用不排除在问题中特征出现多个的可能性,并且术语“包含”的使用不排除其它元件或步骤的存在。

Claims (11)

1.一种对于具有语音用户接口(SP)和应用程序(AP)的对话系统产生对话控制(DS)的方法,其中对话控制(DS)与语音输入接口(SP)和应用程序(AP)一起工作,具有以下步骤:
产生包含图形对话组件的图形对话描述(GB),其在图形对话描述(GB)产生期间借助于显示装置被显示,
将图形对话描述(GB)的图形对话组件转换成以面向对象翻译器语言的类形式的技术对话描述(TB)的技术对话组件,以及
形成对话控制(DS)的同时,将技术对话描述(TB)翻译成可以由对话系统直接使用的二进制数据。
2.如权利要求1所述的方法,其特征在于,技术对话描述(TB)可以进行文本上的改变,其中,如果必要,图形对话描述(GB)至少部分地通过技术对话描述(TB)的文本改变进行补充,并且显示补充的图形对话描述(GB),并且在图形对话描述(GB)到技术对话描述(TB)的转换中,考虑技术对话描述(TB)的文本改变。
3.如权利要求1或2所述的方法,其特征在于,现存技术对话描述(TB)至少部分地转换成图形对话描述(GB)作为产生新图形对话描述(GB)的基础。
4.如权利要求1到3中任一个所述的方法,其特征在于,给定的对话描述类体系和/或对话描述类库的面向对象类至少部分地被表示为图形对话组件,
图形对话描述(GB)通过图形选择、组合和/或图形对话组件的改变产生,
图形对话描述(GB)通过由图形对话组件表示的规定类的衍生转换成以衍生类形式的技术对话描述(TB)的技术对话组件。
5.如权利要求1到4中任一个所述的方法,其特征在于,规定的子对话描述至少部分地被图形化表示为图形对话组件,被选择以及结合到图形对话描述(GB)中。
6.如权利要求1到5中任一个所述的方法,其特征在于,在图形对话描述(GB)的情况下,所有的图形对话组件由符号表示,并且通过选择、拷贝和链接符号以及改变由符号表示的技术对话组件,产生图形对话描述(GB)。
7.一种对于具有语音输入接口(SP)和应用程序(AP)的对话系统产生对话控制(DS)的系统,其中对话控制(DS)与语音输入接口(SP)和应用程序(AP)一起工作,包含:
图像对话编辑器(GE),用于可视化并改变图形对话描述(GB)的图形对话组件,
转换器(UM),用于将图形对话组件转换成以面向对象翻译器语言的类形式的技术对话描述(TB)的技术对话组件,
以及翻译器(UB),用来在形成对话控制(DS)的同时,将技术对话描述翻译成由对话系统可以直接使用的二进制数据。
8.如权利要求7所述的系统,其特征在于,文本对话编辑器(TE),用来改变技术对话描述(TB),以及更新器(AK),用来通过技术对话描述(TB)的文本改变至少部分补充图形对话描述(GB)。
9.如权利要求7或8所述的系统,其特征在于,它在与对话控制(DS)相同的运行时环境中是可操作的。
10.一种具有对话控制(DS)、语音用户接口(SP)和应用程序(AP)的对话系统,其中对话控制(DS)与语音输入接口(SP)和应用程序(AP)一起工作,并且对话控制(DS)利用由权利要求1到6中任一个所述的方法产生。
11.如权利要求10所述的对话系统,其特征在于,在操作期间,可以结合和采用一种新的对话控制(DS)。
CNA2004800295746A 2003-10-10 2004-10-06 用于对话系统的对话控制 Pending CN1864203A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03103755 2003-10-10
EP03103755.9 2003-10-10

Publications (1)

Publication Number Publication Date
CN1864203A true CN1864203A (zh) 2006-11-15

Family

ID=34429468

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800295746A Pending CN1864203A (zh) 2003-10-10 2004-10-06 用于对话系统的对话控制

Country Status (7)

Country Link
US (1) US20070021962A1 (zh)
EP (1) EP1673763A1 (zh)
JP (1) JP2007510196A (zh)
KR (1) KR20060120004A (zh)
CN (1) CN1864203A (zh)
RU (1) RU2006111475A (zh)
WO (1) WO2005036526A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108702482A (zh) * 2016-02-16 2018-10-23 索尼公司 信息处理设备、信息处理系统、信息处理方法和程序
CN111462740A (zh) * 2019-01-18 2020-07-28 奥多比公司 非语音字母语言的话音辅助应用原型测试的话音命令匹配

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8798999B2 (en) * 2009-05-01 2014-08-05 Alpine Electronics, Inc. Dialog design tool and method
US10621984B2 (en) 2017-10-04 2020-04-14 Google Llc User-configured and customized interactive dialog application
US11430446B1 (en) * 2021-08-12 2022-08-30 PolyAI Limited Dialogue system and a dialogue method

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4688195A (en) * 1983-01-28 1987-08-18 Texas Instruments Incorporated Natural-language interface generating system
US5694558A (en) * 1994-04-22 1997-12-02 U S West Technologies, Inc. Method and system for interactive object-oriented dialogue management
EP1021804A4 (en) * 1997-05-06 2002-03-20 Speechworks Int Inc SYSTEM AND METHOD FOR DEVELOPING INTERACTIVE LANGUAGE APPLICATIONS
US5995918A (en) * 1997-09-17 1999-11-30 Unisys Corporation System and method for creating a language grammar using a spreadsheet or table interface
US7031440B1 (en) * 1999-02-01 2006-04-18 Ssimens Communications Inc. Interactive voice response systems with general-purpose blocks
US6321198B1 (en) * 1999-02-23 2001-11-20 Unisys Corporation Apparatus for design and simulation of dialogue
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6434523B1 (en) * 1999-04-23 2002-08-13 Nuance Communications Creating and editing grammars for speech recognition graphically
US6418440B1 (en) * 1999-06-15 2002-07-09 Lucent Technologies, Inc. System and method for performing automated dynamic dialogue generation
US7092370B2 (en) * 2000-08-17 2006-08-15 Roamware, Inc. Method and system for wireless voice channel/data channel integration
DE10147341B4 (de) * 2001-09-26 2005-05-19 Voiceobjects Ag Verfahren und Vorrichtung zum Aufbau einer in einem Computersystem implementierten Dialogsteuerung aus Dialogobjekten sowie zugehöriges Computersystem zur Durchführung einer Dialogsteuerung
AU2002951244A0 (en) * 2002-09-06 2002-09-19 Telstra New Wave Pty Ltd A development system for a dialog system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108702482A (zh) * 2016-02-16 2018-10-23 索尼公司 信息处理设备、信息处理系统、信息处理方法和程序
CN111462740A (zh) * 2019-01-18 2020-07-28 奥多比公司 非语音字母语言的话音辅助应用原型测试的话音命令匹配
CN111462740B (zh) * 2019-01-18 2024-05-24 奥多比公司 非语音字母语言的话音辅助应用原型测试的话音命令匹配

Also Published As

Publication number Publication date
WO2005036526A1 (en) 2005-04-21
KR20060120004A (ko) 2006-11-24
JP2007510196A (ja) 2007-04-19
US20070021962A1 (en) 2007-01-25
EP1673763A1 (en) 2006-06-28
RU2006111475A (ru) 2007-11-10

Similar Documents

Publication Publication Date Title
CN109523383B (zh) 一种智能合约转换系统及方法
US8024196B1 (en) Techniques for creating and translating voice applications
US8041570B2 (en) Dialogue management using scripts
US8355918B2 (en) Method and arrangement for managing grammar options in a graphical callflow builder
Paige et al. The design of a conceptual framework and technical infrastructure for model management language engineering
CN101185116A (zh) 在软件程序中使用强数据类型表示语音识别语法
CN101253478A (zh) 类型推理和类型导向的后期绑定
Srinivasan Design patterns in object-oriented frameworks
CN1909063A (zh) 集成语音对话系统
US20100036661A1 (en) Methods and Systems for Providing Grammar Services
CN106951305B (zh) 一种基于模型转换由QVT-R语言生成midCore脚本的方法
CN115639980A (zh) 一种低代码平台可拖拽的前端逻辑编排方法及装置
US20060241946A1 (en) Speech input interface for dialog systems
CN103077066A (zh) 一种编译时嵌入产品关键信息的方法和系统
CN102246227A (zh) 用于从数据元模型生成有声用户接口编码的方法和系统
CN1864203A (zh) 用于对话系统的对话控制
US8074200B2 (en) Method and system for providing tooling instructions through parameterization as an aid for software application development
CN114546394A (zh) 统一的物联网外设接入与控制方法
CN117348854A (zh) 基于自然语言对话生成物联网控制流程的方法及装置
US20060198501A1 (en) Method and device for constructing a voice dialog
US10157360B1 (en) Smart bricks information system
US7668720B2 (en) Methodology for voice enabling applications
Dybkjær et al. The disc approach to spoken language systems development and evaluation.
Salvador et al. Requirement engineering contributions to voice user interface
Fleischmann Model based hmi specification in an automotive context

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication