CN103534697B

CN103534697B - 用于提供统计对话管理器训练的方法和系统

Info

Publication number: CN103534697B
Application number: CN201280023617.4A
Authority: CN
Inventors: L.P.赫克; D.哈卡尼-图尔; R.叶尔; G.图尔
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2011-05-13
Filing date: 2012-05-11
Publication date: 2017-11-21
Anticipated expiration: 2032-05-11
Also published as: EP2707808A2; CN103534696A; EP2707807A2; WO2012158572A2; EP2707808A4; WO2012158572A3; CN103534696B; CN103534697A; EP2707807A4; WO2012158571A3; WO2012158571A2

Abstract

可以提供统计对话管理器的训练。可以接收与目的相关联的多个日志数据，并且可以识别出根据所述多个日志数据的与完成所述目的相关联的至少一个措施。可以创建与所述目的相关联的理解模型，其包括映射到所述目的的多个查询。响应于接收到来自用户的与所述目的相关联的自然语言查询，可以根据所述理解模型提供针对所述用户的响应。

Description

用于提供统计对话管理器训练的方法和系统

背景技术

可以挖掘web数据为口语理解(SLU)应用提供训练。限制统计对话管理器(SDM)大规模部署的重大障碍是训练SDM模型所需的带注释对话的数量。对大训练语料库的需求起因于口语理解系统的所有可能输出上的连同信念空间(belief space)的状态变量的大量组合。在常规系统中，处理成千上万的模拟对话的缩放SDM方法是一个关键字重新搜索问题，特别在已知的部分可观察马尔可夫决策过程(partially observable Markovdecision process，POMDP)方法中。例如，解决这个问题的常规方法依赖于单调的初始化；如果使用该系统，则从真实用户获得训练数据，并且对其注释以训练更好的模型。但是对于真实世界的SDM来说，这种自展统计模型不是所希望的，因为初始的用户体验是匮乏而有限的。另外，后来的学习偏向于简化的交互，因为这些是对于用户而言得到成功的仅有的对话。

发明内容

提供本发明内容以简化形式介绍概念的选择，以下在具体实施方式中将进一步描述这些概念。本发明内容并非旨在标识所要求保护主题的关键特征或必要特征。本发明内容也不旨在用于限制所要求保护主题的范围。

可以提供统计对话管理器的训练。可以接收与目的相关联的多个日志数据，并且可以识别出根据所述多个日志数据的与完成该目的相关联的至少一个措施。可以创建与该目的相关联的理解模型，其包括映射到该目的的多个查询。响应于接收到来自用户的与该目的相关联的自然语言查询，可以根据该理解模型提供针对用户的响应。

前述概括描述及以下详细描述二者提供了实例，并且仅是说明性的。因此，前述概括描述及以下详细描述不应当被认为是限制性的。此外，除了本文中所阐述的那些特征或变体之外，还可以提供特征或变体。例如，实施例可以涉及具体实施方式中描述的各种特征组合和子组合。

附图说明

合并在本公开中且构成本公开的一部分的附图图示了本发明的各种实施例。在图中：

图1是操作环境的方块图；

图2是一种用于提供统计对话管理器训练的方法的流程图；

图3是一种用于与统计对话管理器进行交互的方法的流程图；以及

图4是计算装置的方块图。

具体实施方式

以下详细描述参考附图。只要可能，就在附图及以下描述中使用相同的附图标记来指示相同或相似的元素。虽然可能描述了本发明的实施例，但是修改、改编及其它实现方式也是可能的。例如，可对附图中所图示的元素进行置换、添加或者修改，并且可以通过对所公开的方法进行置换、重新排序或添加步骤来修改本文中描述的方法。因此，以下详细描述并不限制本发明。

本发明的实施例可以提供一种使用web数据训练口述对话系统(SDS)中的统计对话管理器(SDM)的系统和/或方法。可以利用存在于中央托管的web搜索引擎和浏览器中的大量记入日志的用户交互，以为对话管理器提供训练数据。用户使用搜索和浏览的组合，在web上完成日常任务。搜索数据的数量可能超出数亿用户上的每天100M查询，而且任务的广度极大，因而造成了“长尾(long tail)”web搜索。这些任务的范围可以从简单任务(天气、找出方向、本地事件)到更复杂任务(购物、计划旅行、计划外面过夜)。在完成这些任务的过程中，用户可以参加与他们的搜索引擎和浏览器的有限的对话。例如，用户可以表达表示其打算的特定目标或目的的查询，将其输入搜索引擎，并且然后基于来自搜索引擎的结果，用重新表达的查询作出响应。对于另一实例，一系列导航选择可以用来推断用户的目的而不用接收明确的查询，比如其中，用户在购物站点上开始并且通过逐渐缩小的标准进行浏览(例如，电子设备->摄像机->数字的->SLR)。

按照本发明的实施例，可以从文本/点击搜索和浏览器交互映射口述对话。不管是采用web浏览器还是经由口述对话系统来完成，目标/任务和完成该目标/任务而采取的步骤的次序可以是相似的，尽管用户所希望的动作的表现形式是不同的。为了解决这种失配，对话建模问题可以分为两部分：(1)从web日志学习在浏览器和基于SDS的交互之间是共同的目标/任务完成的基本处理，以及(2)学习用户的web交互(搜索查询，点击)到自然口述会话的转换。

可以将任务完成的主要元素分类为理解用户如何导航任务、确定用户是否对系统交互感到满意、以及基于任务中的进展预测系统响应。可以从大规模的搜索/浏览器交互学习这些方面，并且这些方面可以被转化到SDS中。例如，大多数当前的对话系统对较简单的任务进行建模，并且没有打算任务中断或者任务间的切换。然而，在诸如计划外面过夜之类的较复杂的任务中，我们观察到用户在具有“室外的美好野餐”之后“找个电影看”的子任务之间跳转。类似地，可以基于web数据学习任务内的行为的次序和/或定序，诸如其中，核对宾馆通常跟着登记航班。

从web交互学习的任务完成的特征也可以从头到尾作为统计对话建模系统的特征而持有(port)。例如，用户在搜索结果后点击或点击持续时间上花费的时间可以被认为是用户已经找到感兴趣的结果的好信号。在口述对话或多模态系统交互中，用户花费的研究由该系统传递的饭店地图的时间可以被认为是该系统已经向用户传递了感兴趣结果的好信号。在web搜索中，重新键入或者重新表达查询典型地表示用户没有为第一查询找到满意的答案。对于对话系统，向系统重新陈述问题或者简化请求类似地可以被认为是与该系统的用户交互是不顺利的指示物。

对于口述对话系统，可以通过自动地加入可计算因素，来对统计对话管理(SDM)的用户满意度评分。在学习对话管理器的机器动作中，用户满意度分数可以用作对加强学习的奖赏。还可以通过利用来自用户web搜索和浏览活动的数据来对用户满意度评分。可以将马尔可夫模型分类方法应用于SDM，并且通过计算以下四种类型的特征对其进行扩展以确定会话成功：与转变(turn)有关的特征、与整个会话有关的特征、与查询有关的特征、以及与用户点击的统一资源定位符(URL)有关的特征。

转变可以包括用户动作，例如点击搜索结果或付费广告、点击后退按钮、输入新查询等。转变特征可能与用户已经遵循的具有相关联的时间信息的状态序列有关。例如，所采取的状态的马尔可夫模型可以包括基于使用43种可能的用户动作(状态)的第一次序的马尔可夫模型的特征。使用如以下等式1描述的最大似然估计，可以利用满意(MM_S)和不满意(MM_D)会话来训练两个MM。包括从状态S_i到S_j的转换数量，并且可以包括状态被访问的次数的数目。

等式1。

可以根据以下等式2和3计算用于确定成功会话的对数似然比分数(log-likelihood ratio score)，其中，等式3描述了根据马尔可夫模型x的转换概率的累积对数似然。

等式2

等式3。

持续时间模型(DrM)可以包括为各个用户动作(状态)对(例如，查询-点击)而建模的停留时间。伽马分布可以用于建模停留时间。给定新会话，如以下等式4所描述的，为各个状态对计算使用伽马函数的概率的似然比。

等式4。

例如，整个会话特征可以包括会话长度和/或持续时间，平均停留时间(即，总的停留时间除以状态的数量)，查询量，平均查询长度，状态之间的最小和/或最大停留时间，和/或重复查询的总数量。其它会话特征可以包括算法点击数量(即，对一个结果点击的数量)，广告点击数量，和“查询”状态和/或“其它”状态出现的总数量。

查询特征可以包括历史特征，其可以表示来自与当前用户输入相同查询的其它用户的行为。为了获得这些特征，可以从搜索日志数据库中挖掘出当前会话中的查询的先前出现。根据这些过去的查询，可以提取用户的相关联动作，并且可以计算各种导出特征的平均、最小和/或最大。例如，这样的导出特征可以包括查询频率、URL点击的数量/百分比、和/或查询点击熵。

查询频率可以包括其它用户输入查询的次数的数量/百分比。通常，通过搜索引擎简单地处理频繁的查询，因此，包括频繁的查询的会话会具有更高的成功机会。URL点击的数量可以包括在输入查询后由搜索引擎返回的链接上的用户点击的次数的数量和/或百分比。还可以考虑诸如广告链接或新查询建议之类的点击链接的类型，并且还可以计算特定类型的链接点击的数量/百分比。

查询点击熵E(q)可以包括由查询q的用户点击的URL的差异的测量，如等式5所表示的。

等式5。

U_i，i＝1，...，n可以包括由查询q的用户点击的URL，并且P(U_i)包括如根据等式6计算的URL U_i的标准化频率，其中，F(U_i)包括URL U_i被点击的次数的数量。

等式6。

与由用户点击的url有关的特征可以类似于先前的特征集合，因为可以使用键入相同查询q的先前用户的查询日志和点击来计算它们。给定当前用户按照时间次序点击的URL集合，A＝a₁，...，a_n，以及由键入相同查询的其它用户点击的、按照频率次序(frequencyorder)点击的URL集合，U＝u₁，...，u_m，可以计算二值化(binary)特征以便检查是否a₁＝u₁，u₁∈A且a₁∈U。还可以计算P(a₁|Q)和P(a₁，Q)、avg_iP(a_i|Q)和avg_iP(a_i，Q)。把不满意的会话与满意的会话分开可以被设计为二值化分类问题。为此，可以使用这些特征F来训练逻辑回归分类器，以根据等式7得到可信度分数，其中，从训练数据学习针对每个特征f_i∈F的β值。

等式7。

图1是用于提供口述对话系统(SDS)110的操作环境100的方块图。SDS 110可以包括日志数据存储装置115，口语理解部件120和统计对话管理器125。SDS 110可以操作来经由网络140与用户装置130进行交互。用户装置130可以包括电子通信装置，例如计算机、膝上型计算机、蜂窝电话、平板计算机、游戏控制台和/或其它装置。用户装置130可以耦合到捕获装置150，其可以操作来例如使用摄像机和/或麦克风记录用户并且捕获由该用户做出的口述词语、运动和/或手势。用户装置130还可以操作来例如通过键盘、触摸屏和/或鼠标(未画出)从用户捕获其它输入。按照本发明的实施例，捕获装置150可以包括能够检测用户动作的任何语音和/或运动检测装置。例如，捕获装置150可以包括运动捕获装置，运动捕获装置包括多个摄像机和多个麦克风。

图2是阐明在按照本发明实施例的用于提供统计对话管理器训练的方法200中包括的一般步骤的流程图。可以使用将在以下参考图4更加详细地描述的计算装置400来实现方法200。以下将更详细地描述实现方法200的步骤的方式。方法200可以开始于起始块205，并且继续至步骤210，在步骤210中，计算装置400可以选择多个会话日志数据。例如，SDS110可以在多个web会话日志数据内进行挖掘，以选择那些尝试完成特定目的的会话，例如登记预约饭店。可以基于诸如“饭店”、“评论”、“可用性”等之类的关键字查询术语和/或基于在诸如opentable.com之类的已知饭店预约网站的web数据中的包含物来选择日志数据。

然后，方法200可前进到步骤220，在步骤220中，计算装置400可以确定来自各个会话的日志数据是否与该目的的成功完成相关联。例如，SDS 110可以确定饭店预约目的的给定web会话是否导致做出了成功预约。SDS 110还可以分析失败的会话，以尝试识别出可能存在问题的措施，例如断开到特定饭店的网站的链接、没有可用预约等。

如果确定会话是不成功的，则方法200可以前进到步骤225，在步骤225中，计算装置400可以将针对该会话的数据标记为否定实例。这样的否定实例可以为学习导致不成功对话的动作提供有用的训练数据。然后，方法200可以继续到步骤230，以进一步处理。

可以将成功的会话添加到与所希望的目的相关联的所选择的多个会话日志数据中，并且方法200可以前进到步骤230，在步骤230中，计算装置400可以识别数据内的转换提示。例如，SDS 110可以分析所选的数据，以识别在完成该目的中使用的独立措施。关于饭店搜索，用户可以首先浏览其它被邀请者的日程来识别出在前往集合地点之前全部都可行的时间，以搜索在该时间可行的预约。可以通过位置、食物类型、价格等过滤可用饭店列表。这些措施中的几个可以跨各种web会话按照可互换的次序执行，但是其它措施通常可能按照可以用作转换提示的基础的特定次序出现。例如，一旦识别出所希望的时间，用户就可能转换来搜索在该时间可行的预约。相反，一旦在希望的饭店处识别出可行的预约时间，用户就可能转换来确定所有参加者在该时间是否可行。

还可以在目的内的领域之间和/或在所有目的之间识别出转换提示。例如，登记旅行的目的可以跨越诸如飞机票、租车、旅馆预约和娱乐计划之类的领域。可以在这些领域之间识别转换提示，比如完成票的支付和/或接收到确认数字，这暗示用户准备好继续前进到下一措施、领域和/或目的。

然后，方法200可以前进到步骤240，在步骤240中，计算装置400可以将多个查询术语映射到目的。例如，在步骤210，可以通过识别与opentable.com网站相关联的日志数据，来为饭店预约目的选择web会话数据。可以为可以用来改进饭店的整个搜索的共同关键词和/或短语扫描这个数据。

然后，方法200前进到步骤250，在步骤250中，计算装置400可以创建理解模型。例如，SDS 110可以将关键字术语、可能的网站、可能的措施和转换提示捆绑在SDM 125的理解模型中。然后，方法200可以在步骤255结束。

图3是阐明按照本发明实施例的用于与统计对话管理器进行交互的方法300中所包括的一般步骤的流程图。可以使用将在以下参考图4更加详细地描述的计算装置400来实现方法300。以下将更详细地描述实现方法300的步骤的方式。方法300可以开始于起始块305，并且继续至步骤310，在步骤310中，计算装置400可以接收来自用户的查询。例如，捕获装置150可以记录来自用户的诸如“这周围什么好吃”之类的口述自然语言短语。

然后，方法300可以前进到步骤320，在步骤320中，计算装置400可以识别与用户查询相关联的目的。例如，通过使用在方法200中创建的理解模型，可以将关键词“吃”和“这周围”识别为提供针对用户目的的提示，以定位饭店。

然后，方法300可以前进到步骤330，在步骤330中，计算装置400可以建立与用户目的相关联的信念状态(belief state)。例如，该信念状态可以包括定位附近饭店的目的的最终目标，与该目的相关联的一个或多个领域(例如，本地区域、根据菜系的饭店、评论、预约)以及可被用于改进用户查询的多个槽(slot)。可以基于该查询填充初始槽，例如基于术语“这周围”为该搜索设置中心点位置和半径。可以基于理解模型填充其它槽。例如，可以基于对先前web搜索会话的分析用默认值“现在”填充时槽，其暗示那些在他们初始查询中没有指定时间的用户通常是在搜索一些不久的将来将要去吃饭的地方。

然后，方法300可以前进到步骤340，在步骤340中，计算装置400可以向用户提供响应。例如，SDS 110可以执行web搜索，并且返回附近饭店的列表，以显示在用户装置130上。

然后，方法300可以前进到步骤350，在步骤350中，计算装置400可以确定是否完成了目的。例如，理解模型可以指示用户通常想要从初始列表改进搜索。SDS 110可以例如通过询问用户在查找什么菜系来为用户提示更多信息。然后，方法300可以返回至步骤310，以如上所述那样处理用户的响应，例如通过验证该响应与步骤320处的相同目的相关联并且根据用户响应更新步骤330处的信念状态。否则，如果用户去激活用户装置130(例如，通过关掉或者锁闭显示屏)或者开始朝着饭店之一的方向移动，或者如果理解模型指示先前提供的响应常常是完成该目的的最终措施，则可以假定完成了该目的，并且方法300可在步骤355结束。

按照本发明的实施例可以包括一种用于提供统计对话管理器训练的系统。该系统可以包括存储器存储装置，以及耦合到该存储器存储装置的处理单元。该处理单元可以操作来接收来自用户的口述查询，根据该口述查询创建信念状态，其中该信念状态包括估计的用户目的，确定多个日志数据中的至少一个是否与所估计的目的相关联，并且如果是，则根据所述多个日志数据中的所述至少一个的至少一个元素更新该信念状态，并且根据所更新的信念状态，向用户提供响应。

按照本发明的另一实施例可以包括一种用于提供统计对话管理器训练的系统。该系统可以包括存储器存储装置，以及耦合到该存储器存储装置的处理单元。该处理单元可以操作来接收与目的相关联的多个日志数据，根据所述多个日志数据识别与完成目的相关联的至少一个措施，以及创建与该目的相关联的理解模型，将多个查询映射到该目的。响应于接收到来自用户的自然语言查询，该处理单元可以操作来确定该自然语言查询是否与该目的相关联，并且如果是，则根据理解模型向用户提供响应。

按照本发明的又一实施例可以包括一种用于提供统计对话管理器训练的系统。该系统可以包括存储器存储装置，以及耦合到该存储器存储装置的处理单元。该处理单元可以操作来选择多个日志数据的与目的相关联的子集，确定所述日志数据子集中的至少一个是否与目的的成功完成相关联，并且如果不是，则丢弃所述日志数据子集中的所述至少一个。如果日志数据与目的的成功完成相关联，则该处理单元还可以操作来识别日志数据子集内的多个转换提示，根据日志数据子集将多个查询术语映射到该目的，以及根据日志数据子集创建与完成该目的相关联的理解模型。该处理单元还可以操作来接收来自用户的自然语言查询，建立与自然语言查询相关联的信念状态，填充该信念状态(例如，根据理解模型，来自先前用户输入的信念状态，先前呈现给用户的信息等)，以及根据该信念状态向用户提供响应。

图4是包括计算装置400的系统的方块图。按照本发明的实施例，上述存储器存储装置和处理单元可以在诸如图4的计算装置400之类的计算装置中实现。可以使用硬件、软件或固件的任何合适的组合来实现存储器存储装置和处理单元。例如，存储器存储装置和处理单元可以用计算装置400或结合计算装置400的其它计算装置418中的任何一个来实现。按照本发明的实施例，上述系统、装置和处理器是实例，并且其它系统、装置和处理器可以包括上述存储器存储装置和处理单元。此外，计算装置400可以包括如上所述的操作环境400。在本说明书中描述的方法可以在其它环境中操作，并且不限于计算装置400。

参考图4，按照本发明实施例的系统可以包括诸如计算装置400之类的计算装置。在基本配置中，计算装置400可以包括至少一个处理单元402和系统存储器404。根据计算装置的配置及类型，系统存储器404可以包括，但不限于，易失性的(例如，随机存取存储器(RAM))、非易失性的(例如只读存储器(ROM))、闪存或任何组合。系统存储器404可以包括操作系统405、一个或多个编程模块406，并且可以包括SDM 125。例如，操作系统405可以适合于控制计算装置400的操作。此外，本发明实施例可以结合图形库、其它操作系统或任何其它应用程序来实践，并且不限于任何特定的应用或系统。该基本配置在图4中用虚线408内的那些部件来图示出。

计算装置400可以具有附加特征或功能。例如，计算装置400还可以包括附加的数据存储装置(可移除的和/或不可移除的)，诸如例如，磁盘、光盘或带子。这种附加存储器在图4中用可移除存储装置409和不可移除存储装置410来图示出。计算装置400还可以包含通信连接416，该通信连接416允许装置400诸如经由分布式计算环境中的网络，例如内联网或因特网来与其它计算装置418进行通信。通信连接416是通信介质的一个实例。

本文使用的术语计算机可读介质可以包括计算机存储介质。计算机存储介质可以包括按照用于存储信息的任何方法或技术实现的易失性的和非易失性的、可移除的和不可移除的介质，诸如计算机可读指令、数据结构、程序模块或其它数据。系统存储器404、可移除存储装置409和不可移除存储装置410都是计算机存储介质的实例(即，存储器存储装置)。计算机存储介质可以包括，但不限于，RAM、ROM、电可擦除只读存储器(EEPROM)、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光学存储装置、磁盒、磁带、磁盘存储装置或其它磁存储装置、或可以用于存储信息并且可以由计算装置400访问的任何其它介质。任何这样的计算机存储介质都可以是装置400的一部分。计算装置400还可以具有(多个)输入装置412，比如键盘、鼠标、笔、声音输入装置、触摸输入装置等。还可以包括诸如显示器、扬声器、打印机等之类的(多个)输出装置414。上述装置是实例，并且可以使用其它装置。

本文使用的术语计算机可读介质还可以包括通信介质。通信介质可以通过诸如载波或其它传送机制之类的已调制数据信号中的计算机可读指令、数据结构、程序模块或的其它数据来体现，并且包括任何信息传送介质。术语“已调制数据信号”可以描述以对信号中的信息进行编码的方式设定或者改变一个或多个特征的信号。作为实例而非限制，通信介质可以包括诸如有线网络或直接连线连接之类的有线介质，以及诸如声学、射频(RF)、红外线及其它无线介质之类的无线介质。

如上所述，可以在系统存储器404中存储包括操作系统405的多个程序模块和数据文件。当在处理单元402上执行时，编程模块406(例如，统计对话管理器125)可以执行如上所述的处理和/或方法。上述处理是实例，并且处理单元402可以执行其它处理。根据本发明实施例可以使用的其它编程模块可以包括电子邮件及联系人应用、文字处理应用、电子表格应用、数据库应用、幻灯片演示应用、绘画或计算机辅助应用程序等。

一般而言，按照本发明的实施例，程序模块可以包括可以执行特定任务或可以实现特定抽象数据类型的例程、程序、组件、数据结构及其它类型的结构。此外，本发明实施例可以使用其它计算机系统配置来实践，包括手持装置、多处理器系统、基于微处理器或可编程的消费电子设备、小型计算机、大型计算机等。本发明的实施例还可以在分布式计算环境中实践，在该分布式计算环境中，任务由经由通信网络连接的远程处理装置执行。在分布式计算环境中，程序模块可以位于本地及远程存储器存储装置两者中。

此外，本发明的实施例可以在包括分离电子元件的电路、包含逻辑门的封装或集成电子芯片、利用微处理器的电路中或者在包含电子元件或微处理器的单个芯片上实践。本发明的实施例还可以使用能够执行诸如例如AND、OR及NOT之类的逻辑运算的其它技术(包括但不限于，机械、光学、流体及量子技术)来实践。另外，本发明的实施例可以在通用计算机或任何其它电路或系统中实践。

例如，本发明的实施例可以被实现为计算机过程(方法)、计算系统，或被实现为诸如计算机程序产品或计算机可读介质之类的制品。计算机程序产品可以是计算机系统可读且对用于执行计算机过程的指令的计算机程序进行编码的计算机存储介质。计算机程序产品还可以是计算系统可读且对用于执行计算机过程的指令的计算机程序进行编码的载体上的传播信号。因此，本发明可以以硬件和/或软件(包括固件、常驻软件、微代码等)来体现。换句话说，本发明的实施例可以采取的形式是，具有其中体现的供指令执行系统使用或结合指令执行系统的计算机可使用或计算机可读程序代码的计算机可使用或计算机可读存储介质上的计算机程序产品。计算机可使用或计算机可读介质可以是可包含、存储、通信、传播或传输供指令执行系统、设备或装置使用或结合其使用的程序的任何介质。

计算机可使用或计算机可读介质例如可以是，但不限于，电子、磁、光学、电磁、红外线或半导体系统、设备、装置或传播介质。更具体的计算机可读介质实例(非穷尽清单)，计算机可读介质可以包括以下项：具有一条或多条导线的电连接、便携式计算机磁碟、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或者闪存)、光纤以及便携式压缩盘只读存储器(CD-ROM)。应注意，计算机可使用或计算机可读介质甚至可以是其上印刷了程序的纸张或另一合适的介质，因为可以经由例如对纸张或其它介质的光学扫描而电子地捕获程序，随后如有必要，则对其进行编译、解释、或以其它合适的方式进行处理，并且随后将其存储在计算机存储器中。

本发明的实施例可以经由片上系统(SOC)来实践，在该片上系统中，图4中所图示的各个部件或大多数部件被集成到单个集成电路上。这种SOC装置可以包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元以及各种应用功能，所有的这些都可以被集成(或“烧制”)在芯片基底上作为单个集成电路。当经由SOC操作时，对于训练和/或与SDS110交互，本文描述的功能可以经由与计算装置/系统X的其它部件一起集成在单个集成电路(芯片)上的专用逻辑来进行操作。

例如，以上参考根据本发明实施例的方法、系统及计算机程序产品的方块图和/或操作说明描述了本发明的实施例。方块中所注明的功能/动作可以按不同于任何流程图所示的次序出现。例如，根据所涉及的功能/动作，连续示出的两个方块实际上可以基本同时执行，或者所述方块有时可以按相反的次序执行。

尽管已经描述了本发明的特定实施例，但是也可能存在其它实施例。此外，虽然本发明的实施例被描述为与在存储器及其它存储介质中存储的数据相关联，但是数据也可以被存储在其它类型的计算机可读介质上或从其中读取，所述其他类型的计算机可读介质例如是，像硬盘、软盘或CD-ROM一样的辅助存储装置、来自因特网的载波或其它形式的RAM或者ROM。此外，所公开的方法的步骤可以在不背离本发明的情况下按任何方式进行修改，包括通过对步骤重新排序和/或插入或者删除步骤。

本文所包括的代码中的包括版权的所有权利皆归属于申请人并且是申请人的财产。申请人保持且保留本文所包括的代码中的所有权利，并且授予仅关于所授专利的再现且未出于其它目的地再现材料的许可。

尽管已经描述了本发明的特定实施例，但是也可能存在其它实施例。尽管本说明书包括实例，但是本发明的范围由随后的权利要求来指示。此外，尽管用特定于结构特征和/或方法动作的语言描述了本说明书，但权利要求并不限于以上描述的特征或者动作。相反，以上描述的具体特征和动作是作为本发明实施例的实例来公开的。

Claims

1.一种用于提供统计对话管理器训练的方法，所述方法包括：

确定web会话是否与目的的成功完成相关联；

基于确定所述web会话与所述目的的成功完成相关联，则将所述web会话添加到多个web会话日志数据；

使用所述多个web会话日志数据创建与完成所述目的相关联的理解模型；

接收口述查询；

基于理解模型确定所述口述查询是否与所述目的相关联；

基于所述目的创建信念状态；以及

基于信念状态向用户提供响应。

2.如权利要求1所述的方法，还包括：

向用户设备查询至少一个附加提示，

从所述用户设备接收针对所述查询的响应，以及

根据所接收的响应更新所述信念状态。

3.如权利要求1所述的方法，还包括使用由用户设备提供的响应来更新所述信念状态，其中所述响应包括对所提供的结果的校正。

4.如权利要求3所述的方法，还包括：

接收第二口述查询；

确定所述第二口述查询是否与所述目的相关联；以及

基于确定所述第二口述查询与所述目的相关联：

根据所述第二口述查询更新所述信念状态，以及

基于所更新的信念状态，向所述用户设备提供第二响应。

5.如权利要求4所述的方法，还包括：

确定所述第二口述查询是否与到第二目的的转换相关联；以及

响应于确定所述第二口述查询与所述转换相关联：

根据所述第二口述查询创建第二信念状态，

根据先前创建的信念状态填充所述第二信念状态的至少一个元素，以及

基于所述第二信念状态向所述用户提供第三响应。

6.一种用于提供统计对话管理器训练的系统，所述系统包括：

存储器存储装置；以及

耦合到所述存储器存储装置的处理单元，其中，所述处理单元能够操作来：

接收与一种类型的目的相关联的多个日志数据，

确定所述多个日志数据是否与所述类型的目的的成功完成相关联，

将与所述类型的目的相关联的所述多个日志数据的多个查询术语映射到所述类型的目的，

通过至少绑定与所述类型的目的相关联的所述多个日志数据来创建理解模型，所述多个日志数据与所述类型的目的的成功完成相关联，所述多个查询术语被映射到所述类型的目的以便处理自然语言查询；

响应于接收到自然语言查询，利用所述理解模型以确定所述自然语言查询与所述类型的目的相关联，以及

响应于确定所述自然语言查询与所述类型的目的相关联，根据所述理解模型向用户设备提供响应。

7.如权利要求6所述的系统，其中，所述处理单元还操作来：

根据所述多个日志数据识别至少一个转换提示；以及

将所述至少一个转换提示并入所述理解模型。

8.如权利要求6所述的系统，其中，所述处理单元还操作来针对所述多个日志数据中的每一个，确定所述多个日志数据中的每一个是否与所述类型的目的的成功完成相关联。

9.如权利要求6所述的系统，其中，所述处理单元还操作来响应于接收到至少一个附加的自然语言查询，改进与所述类型的目的相关联的信念状态。

10.一种用于提供统计对话管理器的训练的方法，所述方法包括：

选择多个日志数据的与目的相关联的子集，其中，所述多个日志数据的所述子集中的每一个日志数据包括与以下项中的至少一个相关联的会话日志：关键词和网站；

确定所述日志数据的子集中的至少一个日志数据是否与所述目的的成功完成相关联；

响应于确定所述日志数据的子集中的所述至少一个日志数据不与所述目的的成功完成相关联，丢弃所述日志数据的子集中的所述至少一个日志数据；

识别所述日志数据的子集内的多个转换提示，其中，所述转换提示中的每一个都与以下项中的至少一个相关联：与完成所述目的相关联的新任务和第二目的；

根据所述日志数据的子集，将多个查询术语映射到所述目的；

根据所述日志数据的子集，创建与完成所述目的相关联的理解模型以处理自然语言查询；

接收自然语言查询；

利用所述理解模型以根据所映射的多个查询术语确定所述自然语言查询是否与所述目的相关联；以及

响应于确定所述自然语言查询与所述目的相关联：

建立与所述自然语言查询相关联的信念状态，

根据所述理解模型填充所述信念状态，以及

根据所述信念状态向用户设备提供响应。