CN110555095A

CN110555095A - 人机对话方法和装置

Info

Publication number: CN110555095A
Application number: CN201810553360.2A
Authority: CN
Inventors: 王颖帅; 李晓霞; 苗诗雨
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2019-12-10
Anticipated expiration: 2038-05-31
Also published as: CN110555095B

Abstract

本发明公开了一种人机对话方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：接收用户当前输入的信息；将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。该实施方式能够在不使用正则表达式模板的前提下正确理解用户意图，与用户有效沟通。

Description

人机对话方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种人机对话方法和装置。

背景技术

在人工智能技术迅速发展的今天，越来越多的用户渴望拥有个性化的智能助理，可以与其随意聊天或者通过智能助理获取某种特定信息(例如目标物品的详细数据)。在现有的智能助理实现技术中，一般预先编写大量的正则表达式模板用于匹配用户输入信息，匹配成功时将预先设置的相应反馈信息向用户返回。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：正则表达式模板对用户输入信息的覆盖度较低，且其维护成本较高，当需求改变时，需要依靠人工编写新的正则表达式模板，从而影响其开发效率。

发明内容

有鉴于此，本发明实施例提供一种人机对话方法和装置，能够在不使用正则表达式模板的前提下正确理解用户意图，与用户有效沟通。

为实现上述目的，根据本发明的一个方面，提供了一种人机对话方法。

本发明实施例的人机对话方法包括：接收用户当前输入的信息；将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

可选地，所述利用所述对话意图确定用户的当前意图具体包括：在所述对话意图属于预设的意图类型时，将所述对话意图确定为用户的当前意图；其中，预设的意图类型包括以下至少一种：推荐、比较、咨询、问答；所述推荐包括以下至少一种：基于产品词的推荐、基于过滤条件的推荐、基于否定语义的推荐、同条件持续推荐；在所述对话意图不属于所述意图类型时，将用户在上一轮次的意图确定为其当前意图。

可选地，所述方法进一步包括：如果用户在最近x个历史轮次的输入信息的对话意图不属于所述意图类型、且x大于第一阈值，则将用户的当前意图确定为非任务型聊天；如果用户在最近y个历史轮次的意图均为推荐、y大于第二阈值且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天；其中，x、y为正整数。

可选地，所述方法进一步包括：在将用户当前输入的信息输入槽值提取模型之前，对该信息进行文本转换、基于自定义词库的分词处理和词性标注；以及，用于训练槽值提取模型的任一训练数据包括：作为该训练数据标签的至少一个标注槽值；所述方法进一步包括：根据预设的标注校验规则建立针对训练数据的格式转换逻辑，将通过格式转换逻辑的训练数据输入槽值提取模型，将未通过格式转换逻辑的训练数据确定为标注错误数据。

可选地，所述利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态具体包括：将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态；以及，所述方法进一步包括：如果历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，或者用户在最近z个历史轮次的意图均为同一意图类型、且z大于第四阈值，则将用户的当前对话状态中的槽值数据清空；其中，z为正整数。

可选地，所述确定对应于用户的当前意图和当前对话状态的系统动作，具体包括：在用户的当前意图为推荐、且当前已获取到推荐所需的槽值数据时，系统动作为：利用该槽值数据确定推荐目标；在用户的当前意图为推荐、且当前未获取到推荐所需的槽值数据时，系统动作为：针对未获取到的槽值数据进行提问；在用户的当前意图为比较、咨询或问答时，系统动作为：根据预先建立的知识图谱确定最优答案。

为实现上述目的，根据本发明的另一方面，提供了一种人机对话装置。

本发明实施例的人机对话装置可包括：接收单元，可用于接收用户当前输入的信息；意图理解单元，可用于将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；状态跟踪单元，可用于将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；决策单元，可用于确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

可选地，意图理解单元可进一步用于：在所述对话意图属于预设的意图类型时，将所述对话意图确定为用户的当前意图；其中，预设的意图类型包括以下至少一种：推荐、比较、咨询、问答；所述推荐包括以下至少一种：基于产品词的推荐、基于过滤条件的推荐、基于否定语义的推荐、同条件持续推荐；在所述对话意图不属于所述意图类型时，将用户在上一轮次的意图确定为其当前意图。

可选地，意图理解单元可进一步用于：如果用户在最近x个历史轮次的输入信息的对话意图不属于所述意图类型、且x大于第一阈值，则将用户的当前意图确定为非任务型聊天；如果用户在最近y个历史轮次的意图均为推荐、y大于第二阈值且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天；其中，x、y为正整数。

可选地，用于训练槽值提取模型的任一训练数据包括：作为该训练数据标签的至少一个标注槽值；以及，所述装置可进一步包括：标注校验单元，可用于根据预设的标注校验规则建立针对训练数据的格式转换逻辑，将通过格式转换逻辑的训练数据输入槽值提取模型，将未通过格式转换逻辑的训练数据确定为标注错误数据；预处理单元，可用于在将用户当前输入的信息输入槽值提取模型之前，对该信息进行文本转换、基于自定义词库的分词处理和词性标注。

可选地，状态跟踪单元可进一步用于：将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态；以及，所述装置可进一步包括状态重置单元，可用于在历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，或者用户在最近z个历史轮次的意图均为同一意图类型、且z大于第四阈值时，将用户的当前对话状态中的槽值数据清空；其中，z为正整数。

可选地，决策单元可进一步用于：在用户的当前意图为推荐、且当前已获取到推荐所需的槽值数据时，将系统动作确定为：利用该槽值数据确定推荐目标；在用户的当前意图为推荐、且当前未获取到推荐所需的槽值数据时，将系统动作确定为：针对未获取到的槽值数据进行提问；在用户的当前意图为比较、咨询或问答时，将系统动作确定为：根据预先建立的知识图谱确定最优答案。

为实现上述目的，根据本发明的又一方面，提供了一种电子设备。

本发明的一种电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的人机对话方法。

为实现上述目的，根据本发明的再一方面，提供了一种计算机可读存储介质。

本发明的一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明所提供的人机对话方法。

根据本发明的技术方案，上述发明中的一个实施例具有如下优点或有益效果：

第一，对原始语料进行分词、词性标注、打标签(标注槽值)等处理得到训练数据，利用训练数据训练槽值提取模型；在接收到用户的输入信息之后，利用输入信息的对话意图确定用户的当前意图，利用槽值提取模型获取输入信息中的槽值信息，进而确定用户的当前对话状态，结合用户的当前意图和当前对话状态确定系统动作从而进行反馈。这样，本发明以管道(Pipeline)式的工作流程实现了与用户的任务型对话(推荐、比较、咨询、问答等)或非任务型对话(非任务型聊天)，避免了现有技术因依赖预设模板造成的缺陷。

第二，本发明增加自定义词库对原始语料进行分词，从而提高分词准确性；建立体现标注校验规则的格式转换逻辑对人工标注的训练数据标签(标注槽值)进行自动校验以减少人力消耗；此外，在现有的基于产品词的推荐意图基础上，增加了基于过滤条件的推荐意图、基于否定语义的推荐意图、同条件持续推荐意图，提升了系统实用性。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例中人机对话方法的主要步骤示意图；

图2是根据本发明实施例中人机对话装置的组成部分示意图；

图3是根据本发明实施例可以应用于其中的示例性系统架构图；

图4是用来实现本发明实施例中人机对话方法的电子设备的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要指出的是，在不冲突的情况下，本发明的实施例以及实施例中的技术特征可以相互结合。

图1是根据本发明实施例中人机对话方法的主要步骤示意图。

如图1所示，本发明实施例的人机对话方法可具体按照如下步骤执行：

步骤S101：接收用户当前输入的信息。

在本发明实施例中，执行人机对话方法的系统可与用户进行多个轮次的对话(简称为多轮对话)。其中，一次用户输入和系统反馈称为一个轮次。与单轮对话不同，在多轮对话中，不同轮次的语义存在关联，系统需要记忆历史轮次的对话内容才可作出正确决策。在本步骤中，用户的输入信息可以是各种形式的信息，例如：文本信息、语音信息、图像信息、视频信息等，系统可通过相应的接收设备接收用户的输入信息。此外，本步骤中的用户可以是与系统对话的自然人，也可以是利用人工智能技术开发的各种智能对话终端。

步骤S102：将用户当前输入的信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用对话意图确定用户的当前意图。

在本步骤中，对话意图可反映输入信息自身体现的意图，即输入信息在孤立于上下文环境时体现的意图，输入信息的对话意图未必等同于用户的当前意图(即用户当前的真实意图)。实际应用中，用户的当前意图可通过用户输入信息的对话意图确定。较佳地，在本发明实施例中，可首先利用预先训练完成的意图分类模型获取用户输入信息的对话意图。

具体应用中，意图分类模型可根据以下步骤进行训练：

1.获取原始语料并从中提取特征。具体地，原始语料可来源于存储物品详细信息的数据库、与物品相关的各种搜索问答日志以及现有智能助理中存储的用户输入信息。获取到原始语料之后，可在对其进行数据清洗、人工标注(即为每一语料增加意图标签)之后，提取每一语料的字符向量特征作为意图分类模型的输入。

2.将每一语料的字符向量特征输入意图分类模型进行训练。具体应用场景中，意图分类模型可以是卷积神经网络CNN(Convolutional Neural Network)、支持向量机、逻辑回归模型等，以下以CNN为例具体说明。

CNN结构可包括文本输入层、卷积层、池化层和语义理解层。其中：文本输入层可输入利用word-n-gram(一种特征工程算法)得到的字符向量特征(其由某一字符在滑动窗口内的所有字符特征组成)；卷积层可利用激活函数(例如双曲正切函数)处理字符向量与卷积核矩阵的乘积，得到上下文特征；池化层可采用最大池化方法，基于上下文特征得到输入数据的全局向量；语料理解层可将全局向量映射为语义向量，其用于确定输入数据的最终分数。训练完成之后，CNN可采用K折交叉验证法进行验证并得以改进。

在步骤S102中，可提取用户当前输入的信息中的字符向量特征并将其输入预先训练完成的意图分类模型，得到该信息的对话意图，并执行以下动作确定用户的当前意图：

1.如果输入信息的对话意图属于预设的意图类型，则将该对话意图确定为用户的当前意图。特别地，预设的意图类型包括：推荐(相应的输入信息如：请推荐一款手机)、比较(相应的输入信息如：型号为A的手机与型号为B的手机哪个更好)、咨询(相应的输入信息如：型号为C的手机怎么样)、问答(相应的输入信息如：型号为D的手机价格是多少)，其中，除了现有的基于产品词的推荐(相应的输入信息如：请推荐一款手机)，本发明增加以下三种推荐意图：基于过滤条件的推荐(相应的输入信息如：请推荐价格适中的手机)、基于否定语义的推荐(相应的输入信息如：请推荐一款手机，不要红色的)、同条件持续推荐(相应的输入信息如：我想看下一个，请展示)，由此可满足用户的相应需求。

2.如果输入信息的对话意图不属于上述意图类型时，则将用户在上一轮次的意图确定为其当前意图。

3.如果用户在最近x(其为正整数)个历史轮次的输入信息的对话意图不属于上述意图类型，并且x大于第一阈值，则将用户的当前意图确定为非任务型聊天。其中，最近的多个历史轮次指的是历史轮次中距当前时刻最近的多个连续轮次。例如：如果当前轮次是第五轮次，则其最近的3个历史轮次为第二轮次、第三轮次和第四轮次；第一阈值包括以下将要介绍的各阈值均为预先设置；非任务型聊天指的是没有明确目的的、不局限话题的对话。

4.如果用户在最近y(其为正整数)个历史轮次的意图均为推荐、y大于第二阈值，并且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天。

具体的，上述槽值(slot value)数据指的是人机对话过程中将用户意图转化为明确指令所需要补全的至少一种维度的数据，每一种槽值数据均对应于一个槽位(slot)。例如：在对用户进行手机推荐时，如果必须了解用户性别、手机品牌和手机价格，则推荐所需的槽值数据为：性别是男还是女(对应的槽位为性别)、具体品牌(如品牌E，其对应的槽位为品牌)、具体价格(如￥2000，其对应的槽位为价格)。

上述动作的原理是：如果输入信息的对话意图明确(即属于预设的意图类型)，则将其作为用户的当前意图；如果输入信息的对话意图不明确(即不属于预设的意图类型)，则保持原意图(上一轮次的用户意图)；如果用户在连续较多轮次均未体现明确的对话意图，说明其当前没有特定目的，则将其意图确定为非任务型聊天；如果用户在较多轮次均体现为推荐意图，但迟迟不提供所需槽值，则说明其真实意图很可能并非推荐，于是将其意图确定为非任务型聊天。通过上述设置，可正确判断用户当前的真实意图，有助于后续决策的制定。

步骤S103：将用户当前输入的信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用上述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态。

在本发明实施例中，对话状态(dialogue state)用于反映用户的即时目的，其由至少一种槽值数据组成。为了实现多轮对话的记忆机制，当前对话状态往往保留多个历史对话状态的槽值数据。

作为一个优选方案，在本步骤中，可对用户当前输入的信息进行文本转换、分词处理和词性标注之后输入预先训练完成的槽值提取模型，以获取其中的槽值数据。其中，分词处理可利用jieba(一种支持中文的分词库)等现有方法实现。在分词过程中，除使用原有词库之外，可增加自定义词库(如自定义产品词库、自定义品牌词库等)以提高分词准确率。词性标注可将词语标注为名词、动词等词性，其可采用CoreNlP(一种分词工具)等现有方法实现。

实际应用中，上述槽值提取模型可根据以下步骤进行训练：

1.获取原始语料并从中提取特征。具体地，原始语料可来源于存储物品详细信息的数据库、与物品相关的各种搜索问答日志以及现有智能助理中存储的用户输入信息。获取到原始语料之后，可在对其进行数据清洗、基于自定义词库的分词、词性标注、标签标注之后，将得到的多种特征(分词、各词语的词性)和标签作为槽值提取模型的输入。

在本发明实施例中，上述标签标注指的是以人工标注的方式为每一语料增加作为该语料标签的槽值(可称为标注槽值)、并对人工标注结果进行校验的过程。人工标注结果可如下表所示：(下表中的槽值为具体的产品词、品牌词和修饰词)

语料	产品词	品牌词	修饰词
				我要退F品牌的电扇	电扇	F
有没有价位低的G品牌书包	书包	G	价位低

特别地，在一个实施例中，可通过以下方法对人工标注结果进行校验：首先根据预设的标注校验规则建立格式转换逻辑(如格式转换软件)，之后针对每一语料和相应的人工标注结果执行格式转换逻辑，如果转换成功(说明通过格式转换逻辑)，则将转换后的数据输入槽值提取模型，如果转换失败(说明未通过格式转换逻辑)，则将该语料及其人工标注结果确定为标注错误数据，并将其交予标注人员进行重新标注。通过上述标注方法，本发明可提高标注校验效率，减少人工消耗。

2.将训练数据(包括上一步骤得到的多种特征和标签)输入槽值提取模型进行训练。其中，槽值提取模型可采用长短期记忆网络LSTM(Long Short-Term Memory)后接条件随机场CRF(Conditional Random Field)的数学模型。可以理解，槽值提取模型也可以采用其它适用的数学模型。

在步骤S103中，可利用用户当前输入信息中的槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态。实际应用中，一般将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态。当前对话状态的生成过程如以下三表所示：

用户在轮次1的对话状态

槽位	目的地	区域	价格	菜系	星级
						槽值	饭店	N/A	N/A	N/A	N/A

用户在轮次2的对话状态

槽位	目的地	区域	价格	菜系	星级
						槽值	饭店	东城	低	N/A	N/A

用户在轮次3的对话状态

槽位	目的地	区域	价格	菜系	星级
						槽值	饭店	东城	低	淮扬菜	一星

其中，三表依次表示用户在轮次1、2、3的对话状态，N/A表示槽值不存在。在轮次2中，从用户输入信息中获取的槽值数据为：东城(对应于区域槽位)、低(对应于价格槽位)，则轮次2的对话状态为轮次1的对话状态：饭店(对应于目的地槽位)与轮次2获取的上述槽值数据的结合。在轮次3中，从用户输入信息中获取的槽值数据为：淮扬菜(对应于菜系槽位)、一星(对应于星级槽位)，则轮次3的对话状态为轮次2的对话状态：饭店、东城、低与获取的淮扬菜、一星的结合。

实际应用中，随着对话轮次的增加，对话状态中的槽值数据会迅速增加。在一个实施例中，可采用以下方法清除对话状态中的无效槽值数据：

如果历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，则将用户的当前对话状态中的槽值数据清空。

如果用户在最近z(其为正整数)个历史轮次的意图均为同一意图类型(即推荐、比较、咨询或问答)，并且z大于第四阈值，则将用户的当前对话状态中的槽值数据清空。

通过以上步骤，本发明实现了用户对话状态的准确判断，由此把握用户的真实需求，有助于后续决策的制定。可以理解的是，步骤S103可以在步骤S102之前、之后或同时执行，本发明并不对此限制。

步骤S104：确定对应于用户的当前意图和当前对话状态的系统动作，根据系统动作向用户反馈。

在本步骤中，系统动作(system action)即根据用户的当前意图及其当前对话状态生成的决策操作。具体而言，在用户的当前意图为推荐，并且当前已获取到推荐所需的槽值数据时，系统动作可以是：利用获取到的槽值数据查询目标进而进行推荐；在用户的当前意图为推荐，并且当前未获取到推荐所需的槽值数据时，系统动作可以是：针对未获取到的槽值数据向用户提问；在用户的当前意图为比较、咨询或问答时，系统动作可以是：根据预先建立的知识图谱(一种包括海量数据的语义网络)确定最优答案。在确定系统动作之后，系统可采用文本、语音、图像等方式向用户反馈，从而完成本轮对话。

在本发明实施例的技术方案中，接收到用户的输入信息之后，从中获取对话意图和槽值数据，进而确定用户的当前意图和当前对话状态，最后获取相应的系统动作进行反馈。这样，本发明以管道式的工作流程实现用户意图的正确理解，从而与用户进行有效沟通。

图2是本发明实施例中人机对话装置的组成部分示意图。

如图2所示，本发明实施例的人机对话装置200可包括：接收单元201、意图理解单元202、状态跟踪单元203和决策单元204。其中：

接收单元201可用于接收用户当前输入的信息；

意图理解单元202可用于将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；

状态跟踪单元203可用于将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；

决策单元204可用于确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

在本发明实施例中，意图理解单元202可进一步用于：在所述对话意图属于预设的意图类型时，将所述对话意图确定为用户的当前意图；其中，预设的意图类型包括以下至少一种：推荐、比较、咨询、问答；所述推荐包括以下至少一种：基于产品词的推荐、基于过滤条件的推荐、基于否定语义的推荐、同条件持续推荐；在所述对话意图不属于所述意图类型时，将用户在上一轮次的意图确定为其当前意图。

具体应用中，意图理解单元202可进一步用于：如果用户在最近x个历史轮次的输入信息的对话意图不属于所述意图类型、且x大于第一阈值，则将用户的当前意图确定为非任务型聊天；如果用户在最近y个历史轮次的意图均为推荐、y大于第二阈值且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天；其中，x、y为正整数。

作为一个优选方案，用于训练槽值提取模型的任一训练数据包括：作为该训练数据标签的至少一个标注槽值；所述装置200可进一步包括：标注校验单元，其用于根据预设的标注校验规则建立针对训练数据的格式转换逻辑，将通过格式转换逻辑的训练数据输入槽值提取模型，将未通过格式转换逻辑的训练数据确定为标注错误数据；预处理单元，其用于在将用户当前输入的信息输入槽值提取模型之前，对该信息进行文本转换、基于自定义词库的分词处理和词性标注。

较佳地，状态跟踪单元203可进一步用于：将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态；所述装置200可进一步包括状态重置单元，其可用于在历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，或者用户在最近z个历史轮次的意图均为同一意图类型、且z大于第四阈值时，将用户的当前对话状态中的槽值数据清空；其中，z为正整数。

实际应用中，决策单元204可进一步用于：在用户的当前意图为推荐、且当前已获取到推荐所需的槽值数据时，将系统动作确定为：利用该槽值数据确定推荐目标；在用户的当前意图为推荐、且当前未获取到推荐所需的槽值数据时，将系统动作确定为：针对未获取到的槽值数据进行提问；在用户的当前意图为比较、咨询或问答时，将系统动作确定为：根据预先建立的知识图谱确定最优答案。

图3示出了可以应用本发明实施例的人机对话方法或人机对话装置的示例性系统架构300。

如图3所示，系统架构300可以包括终端设备301、302、303，网络304和服务器305(此架构仅仅是示例，具体架构中包含的组件可以根据申请具体情况调整)。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备301、302、303通过网络304与服务器305交互，以接收或发送消息等。终端设备301、302、303包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机，其上可以安装有用户输入信息的接收设备(例如麦克风、键盘等)。

服务器305可以是提供各种服务的服务器，例如基于终端设备301、302、303接收到的用户输入信息进行多轮对话决策的人机交互服务器(仅为示例)。人机交互服务器可以确定对应于用户输入信息的系统动作和反馈信息，并将反馈信息发送到终端设备。

需要说明的是，本发明实施例所提供的人机对话方法一般由服务器305执行，相应地，人机对话装置一般设置于服务器305中。

应该理解，图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

本发明还提供了一种电子设备。本发明实施例的电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的人机对话方法。

下面参考图4，其示出了适于用来实现本发明实施例的电子设备的计算机系统400的结构示意图。图4示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，计算机系统400包括中央处理单元(CPU)401，其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM403中，还存储有计算机系统400操作所需的各种程序和数据。CPU401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

以下部件连接至I/O接口405：包括键盘、鼠标等的输入部分406；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407；包括硬盘等的存储部分408；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器410上，以便从其上读出的计算机程序根据需要被安装入存储部分408。

特别地，根据本发明公开的实施例，上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如，本发明实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中，该计算机程序可以通过通信部分409从网络上被下载和安装，和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元401执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。在本发明中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这根据所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括接收单元、意图理解单元、状态跟踪单元和决策单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，接收单元还可以被描述为“向意图理解单元和状态跟踪单元发送用户当前输入的信息的单元”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该设备执行时，使得该设备执行的步骤包括：接收用户当前输入的信息；将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种人机对话方法，其特征在于，包括：

接收用户当前输入的信息；

将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；

将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；

确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

2.根据权利要求1所述的方法，其特征在于，所述利用所述对话意图确定用户的当前意图具体包括：

在所述对话意图属于预设的意图类型时，将所述对话意图确定为用户的当前意图；其中，预设的意图类型包括以下至少一种：推荐、比较、咨询、问答；所述推荐包括以下至少一种：基于产品词的推荐、基于过滤条件的推荐、基于否定语义的推荐、同条件持续推荐；

在所述对话意图不属于所述意图类型时，将用户在上一轮次的意图确定为其当前意图。

3.根据权利要求2所述的方法，其特征在于，所述方法进一步包括：

如果用户在最近x个历史轮次的输入信息的对话意图不属于所述意图类型、且x大于第一阈值，则将用户的当前意图确定为非任务型聊天；

如果用户在最近y个历史轮次的意图均为推荐、y大于第二阈值且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天；其中，x、y为正整数。

4.根据权利要求1所述的方法，其特征在于，

所述方法进一步包括：在将用户当前输入的信息输入槽值提取模型之前，对该信息进行文本转换、基于自定义词库的分词处理和词性标注；以及，

用于训练槽值提取模型的任一训练数据包括：作为该训练数据标签的至少一个标注槽值；所述方法进一步包括：根据预设的标注校验规则建立针对训练数据的格式转换逻辑，将通过格式转换逻辑的训练数据输入槽值提取模型，将未通过格式转换逻辑的训练数据确定为标注错误数据。

5.根据权利要求2所述的方法，其特征在于，所述利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态具体包括：将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态；以及，

所述方法进一步包括：如果历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，或者用户在最近z个历史轮次的意图均为同一意图类型、且z大于第四阈值，则将用户的当前对话状态中的槽值数据清空；其中，z为正整数。

6.根据权利要求2-5任一所述的方法，其特征在于，所述确定对应于用户的当前意图和当前对话状态的系统动作，具体包括：

在用户的当前意图为推荐、且当前已获取到推荐所需的槽值数据时，系统动作为：利用该槽值数据确定推荐目标；

在用户的当前意图为推荐、且当前未获取到推荐所需的槽值数据时，系统动作为：针对未获取到的槽值数据进行提问；

在用户的当前意图为比较、咨询或问答时，系统动作为：根据预先建立的知识图谱确定最优答案。

7.一种人机对话装置，其特征在于，包括：

接收单元，用于接收用户当前输入的信息；

意图理解单元，用于将该信息输入预先训练完成的意图分类模型，获取该信息的对话意图，利用所述对话意图确定用户的当前意图；

状态跟踪单元，用于将该信息输入预先训练完成的槽值提取模型，获取该信息中的槽值数据，利用所述槽值数据和用户在历史轮次的对话状态确定用户的当前对话状态；

决策单元，用于确定对应于用户的当前意图和当前对话状态的系统动作，根据所述系统动作向用户反馈。

8.根据权利要求7所述的装置，其特征在于，意图理解单元进一步用于：

在所述对话意图属于预设的意图类型时，将所述对话意图确定为用户的当前意图；其中，预设的意图类型包括以下至少一种：推荐、比较、咨询、问答；所述推荐包括以下至少一种：基于产品词的推荐、基于过滤条件的推荐、基于否定语义的推荐、同条件持续推荐；在所述对话意图不属于所述意图类型时，将用户在上一轮次的意图确定为其当前意图。

9.根据权利要求8所述的装置，其特征在于，意图理解单元进一步用于：

如果用户在最近x个历史轮次的输入信息的对话意图不属于所述意图类型、且x大于第一阈值，则将用户的当前意图确定为非任务型聊天；如果用户在最近y个历史轮次的意图均为推荐、y大于第二阈值且当前未获取到推荐所需的槽值数据，则将用户的当前意图确定为非任务型聊天；其中，x、y为正整数。

10.根据权利要求7所述的装置，其特征在于，用于训练槽值提取模型的任一训练数据包括：作为该训练数据标签的至少一个标注槽值；以及，所述装置进一步包括：

标注校验单元，用于根据预设的标注校验规则建立针对训练数据的格式转换逻辑，将通过格式转换逻辑的训练数据输入槽值提取模型，将未通过格式转换逻辑的训练数据确定为标注错误数据；

预处理单元，用于在将用户当前输入的信息输入槽值提取模型之前，对该信息进行文本转换、基于自定义词库的分词处理和词性标注。

11.根据权利要求8所述的装置，其特征在于，

状态跟踪单元进一步用于：将用户当前输入的信息中的槽值数据与用户在上一轮次的对话状态中的槽值数据结合，形成用户的当前对话状态；以及，

所述装置进一步包括状态重置单元，用于在历史轮次中用户意图为非任务型聊天的轮次数量大于第三阈值，或者用户在最近z个历史轮次的意图均为同一意图类型、且z大于第四阈值时，将用户的当前对话状态中的槽值数据清空；其中，z为正整数。

12.根据权利要求8-11任一所述的装置，其特征在于，决策单元进一步用于：

在用户的当前意图为推荐、且当前已获取到推荐所需的槽值数据时，将系统动作确定为：利用该槽值数据确定推荐目标；在用户的当前意图为推荐、且当前未获取到推荐所需的槽值数据时，将系统动作确定为：针对未获取到的槽值数据进行提问；在用户的当前意图为比较、咨询或问答时，将系统动作确定为：根据预先建立的知识图谱确定最优答案。

13.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。