CN113220852B

CN113220852B - 人机对话方法、装置、设备和存储介质

Info

Publication number: CN113220852B
Application number: CN202110490492.7A
Authority: CN
Inventors: 应缜哲; 王维强; 王昊天
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-05-06
Filing date: 2021-05-06
Publication date: 2023-04-25
Anticipated expiration: 2041-05-06
Also published as: CN113220852A

Abstract

本说明书一个实施例提了一种人机对话方法、装置、设备和存储介质，其中方法包括：获取人机对话过程中用户的会话数据和人机对话的场景数据，根据预先训练的待追问对象标注模型，在用户的会话数据中标注待追问对象，根据待追问对象和人机对话的场景数据，生成会话数据的回复数据，向用户推送该回复数据，以进行人机对话。

Description

人机对话方法、装置、设备和存储介质

技术领域

本文件涉及计算机技术领域，尤其涉及一种人机对话方法、装置、设备和存储介质。

背景技术

在很多场景下，都需要进行人机对话，比如，在用户购物后，通过人机对话的方式获知用户的购物相关信息，判断用户是否存在被卖家欺诈的风险，又如，在用户购买理财产品前，通过人机对话的方式提醒用户购买理财产品有一定风险，需要谨慎购买。人机对话通常由专门的对话机器人实现，然而，机器人与用户对话时，通常基于预定的模板向用户发送固定的语音内容，容易被用户识别出对话对象为机器人而非真正的人，导致用户不愿意配合完成对话，降低人机对话的成功率，降低用户的对话体验。

发明内容

本说明书一个实施例提供了一种人机对话方法，包括：获取人机对话过程中用户的会话数据和所述人机对话的场景数据。根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象。根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据。向用户推送所述回复数据，以进行人机对话。

本说明书另一个实施例提供了一种人机对话装置，包括：数据获取模块，获取人机对话过程中用户的会话数据和所述人机对话的场景数据。对象标注模块，根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象。数据生成模块，根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据。数据推送模块，向用户推送所述回复数据，以进行人机对话。

本说明书另一个实施例提供了一种人机对话设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被所述处理器执行时使所述处理器实现：获取人机对话过程中用户的会话数据和所述人机对话的场景数据。根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象。根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据。向用户推送所述回复数据，以进行人机对话。

本说明书另一个实施例提供了一种存储介质，用于存储计算机可执行指令。所述计算机可执行指令在被处理器执行时使所述处理器实现：获取人机对话过程中用户的会话数据和所述人机对话的场景数据。根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象。根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据。向用户推送所述回复数据，以进行人机对话。

附图说明

为了更清楚地说明本说明书一个或多个实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一实施例提供的人机对话的场景示意图；

图2为本说明书一实施例提供的人机对话方法的流程示意图；

图3为本说明书一实施例提供的待追问对象标注模型的结构示意图；

图4为本说明书一实施例提供的待追问对象标注模型的训练流程示意图；

图5为本说明书又一实施例提供的人机对话方法的流程示意图；

图6为本说明书一实施例提供的人机对话装置的模块组成示意图；

图7为本说明书一实施例提供的人机对话设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本文件的保护范围。

图1为本说明书一实施例提供的人机对话的场景示意图，如图1所示，该场景包括用户终端和人机对话服务器，用户终端包括但不限于手机、电脑、平板电脑等用户进行人机对话的设备，人机对话服务器可以是单独的服务器，也可以是服务器集群，人机对话服务器中运行有人机对话机器人，该人机对话机器人可以实现为计算机程序，通过人机对话机器人可以与用户进行人机对话，比如，在用户购物后，提醒用户防止电信诈骗等。本实施例提供了一种人机对话方法，能够由图1中的人机对话服务器执行，特别是由人机对话机器人执行，通过该方法，能够识别与用户对话过程中的待追问对象，围绕该待追问对象向用户推送回复数据，使得人机对话的效果类似于真人与用户进行对话，从而提高用户的配合意愿度，提升人机对话的成功率，提升用户的对话体验。

图2为本说明书一实施例提供的人机对话方法的流程示意图，该方法由图1中的人机对话服务器执行，如图2所示，该方法包括：

步骤S202，获取人机对话过程中用户的会话数据和人机对话的场景数据；

步骤S204，根据预先训练的待追问对象标注模型，在会话数据中标注待追问对象；

步骤S206，根据待追问对象和人机对话的场景数据，生成会话数据的回复数据；

步骤S208，向用户推送回复数据，以进行人机对话。

本实施例中，在人机对话过程中，可以通过待追问对象标注模型在用户的会话数据中标注待追问对象，进而，根据待追问对象和人机对话的场景，向用户推送回复数据，以完成人机对话。可见，本实施例在人机对话过程中，可以识别与用户对话过程中的待追问对象，围绕该待追问对象向用户推送回复数据，使得人机对话的效果类似于真人与用户进行对话，从而提高用户的配合意愿度，提升人机对话的成功率，提升用户的对话体验。

下面详细介绍图2中的人机对话方法。

图2中，步骤S202中，人机对话服务器(下文简称服务器)获取人机对话过程中用户的会话数据。服务器首先通过电话通信网络或者互联网给用户拨打电话，用户接听后，会与服务器进行人机对话，向服务器发送语音数据，服务器可以将该语音数据作为人机对话过程中用户的会话数据，也可以通过ASR(Automatic Speech Recognition，自动语音识别技术)将该语音数据转换为文本数据，将该文本数据作为人机对话过程中用户的会话数据。

步骤S202中，服务器还获取人机对话的场景数据。人机对话的场景数据包括场景标识和对话目的标识两部分。

一个实施例中，根据人机对话前用户的行为数据生成人机对话的场景标识，场景标识与该行为数据相对应，能够表示用户的行为。比如，用户在网络上购买了一套护肤品，则可以根据用户的购买护肤品的行为数据生成场景标识“BSC”，“B SC”为服务器内部定义的购买护肤品的缩写。其中，人机对话前用户的行为数据，即为触发该人机对话发生的行为数据。

一个实施例中，预先设置有用户的各种行为与对话目的标识之间的对应关系，从而根据人机对话前用户的行为数据，在该对应关系中查找得到对话目的标识。上个例子中，用户购买护肤品后，根据用户的购买护肤品的行为数据，查找得到相对应的对话目的标识为“P of NF”，“P of NF”表示对话目的为预防网络诈骗。

由于用户触发人机对话发生的行为数据不同，人机对话的目的也不同，因此用户触发人机对话发生的行为数据与人机对话的目的之间具有关联关系，因此，上述的场景标识与对话目的标识之间也具有关联关系，根据场景标识所确定得到的触发人机对话发生的行为数据，指向该对话目的标识所表示的对话目的。

可见，根据人机对话的场景数据中的场景标识，能够明确该人机对话的发生场景，特别明确该人机对话发生前用户的行为，根据人机对话的场景数据中的对话目的标识，能够明确该人机对话的对话目的。在其他实施例中，人机对话的场景数据还可以包括人机对话前用户的行为数据。

步骤S204中，根据预先训练的待追问对象标注模型，在用户的会话数据中标注待追问对象。

考虑到人工客服和用户对话时，会比较有针对性的提问，而机器人倾向于列举出所有可能性，比如，在用户接到办理贷款的电话后，在提示用户预防诈骗行为时，机器人倾向于将所有可能的诈骗行为都列举出来，如“如您遇到兼职刷单、办理贷款、陌生网友借钱、订单异常、资金转入安全账户等诈骗行为，请千万不要相信”，而人工客服则会有针对性的提醒用户注意风险防范，如提示用户不要办理贷款。基于此，本步骤中，利用预先训练的待追问对象标注模型，在用户的会话数据中标注待追问对象(如上例中的“贷款”)，从而使得推送给用户的回复数据可以围绕待追问对象展开，使得回复数据贴近于人工回复的效果。

一个实施例中，上述的会话数据为文本数据，步骤S204根据预先训练的待追问对象标注模型，在用户的会话数据中标注待追问对象，具体包括：

(a1)通过待追问对象标注模型，获取会话数据中的字符的待追问概率值；

(a2)根据待追问概率值，在会话数据的字符中标注待追问对象。

动作(a1)中，会话数据由多个字符组成，通过待追问对象标注模型，获取会话数据中的每个字符的待追问概率值。比如，会话数据为“我买了一件衣服”，则通过待追问对象标注模型，获取该会话数据中每个字的待追问概率值。关于待追问对象标注模型的具体处理过程，将在后文详细描述。

动作(a2)中，根据待追问概率值，在会话数据的字符中标注待追问对象。一个实施例中，根据待追问概率值，在会话数据的字符中标注待追问对象，具体为：在会话数据的字符中选取待追问概率值大于预设概率阈值的目标字符，将选取的目标字符标注为待追问对象。比如，会话数据为“我买了一件衣服”，其中每个字符的待追问概率值依次为“0.1、0.1、0.2、0.2、0.3、0.6、0.6”，预设概率阈值为0.5，则在该会话数据中，将字符“衣服”选取为目标字符并标注为待追问对象。

在另一个实施例中，上述会话数据为语音数据，则步骤S204可以为：

(b1)将会话数据转换为文本数据；

(b2)通过待追问对象标注模型，获取文本数据中的字符的待追问概率值；

(b3)根据待追问概率值，在文本数据的字符中标注待追问对象。

该过程可以参考前面针对动作(a1)和动作(a2)的解释，这里不再重复。

图3为本说明书一实施例提供的待追问对象标注模型的结构示意图，该模型可以针对文本形式的会话数据进行处理。如图3所示，该模型包括字符向量转换层、语义特征提取层和概率值输出层，字符向量转换层、语义特征提取层和概率值输出层依次连接。如图3所示，字符向量转换层可以包括一个或多个依次连通的子层，语义特征提取层也可以包括一个或多个依次连通的子层，概率值输出层也可以包括一个或多个依次连通的子层。

基于图3中的模型结构，上述动作(a1)中，通过待追问对象标注模型，获取会话数据中的字符的待追问概率值，具体包括：

(a11)通过字符向量转换层，对会话数据中的字符进行向量转换，得到会话数据中的字符对应的向量；

(a12)通过语义特征提取层，基于会话数据中的字符对应的向量，对会话数据中的字符进行语义特征提取，得到会话数据中的字符对应的语义特征；

(a13)通过概率值输出层，基于会话数据中的字符对应的语义特征，计算会话数据中的字符的待追问概率值。

动作(a11)中，字符向量转换层获取到会话数据中的每个字符，对该每个字符进行向量转换，得到每个字符对应的向量，将每个字符对应的向量传输给语义特征提取层。当字符向量转换层包括多个子层时，第一个子层获取到会话数据中的每个字符，进行第一次转换，将第一次的转换得到的向量发送给第二个子层，第二个子层获取到第一个子层传输过来的向量，继续进行转换，并将转换得到的向量发送给第三个子层，依次执行，直到最后一个子层转换得到每个字符对应的向量，最后一个子层将每个字符对应的向量传输给语义特征提取层。一个实施例中，字符向量转换层包括的多个子层均为卷积层，每个卷积层具有训练好的卷积核。

动作(a12)中，语义特征提取层接收到字符向量转换层传输过来的每个字符对应的向量，通过对每个字符对应的向量进行卷积运算的形式，对每个字符进行语义特征提取，得到每个字符对应的语义特征。当语义特征提取层包括多个子层时，第一个子层获取到会话数据中的每个字符对应的向量，进行第一次卷积运算，将第一次的运算结果发送给第二个子层，第二个子层获取到第一个子层传输过来的运算结果，继续进行卷积运算，并将运算结果发送给第三个子层，依次执行，直到最后一个子层运算得到每个字符对应的语义特征，该语义特征为向量形式，最后一个子层将每个字符对应的语义特征传输给概率值输出层。一个实施例中，语义特征提取层包括的多个子层均为卷积层，每个卷积层具有训练好的卷积核。

动作(a13)中，概率值输出层获取到会话数据中每个字符对应的语义特征，对每个字符对应的语义特征进行卷积运算，得到会话数据中每个字符的待追问概率值。待追问概率值为大于0小于1的值。当概率值输出层包括多个子层时，第一个子层获取到会话数据中的每个字符对应的向量形式的语义特征，进行第一次卷积运算，将第一次的运算结果发送给第二个子层，第二个子层获取到第一个子层传输过来的运算结果，继续进行卷积运算，并将运算结果发送给第三个子层，依次执行，直到最后一个子层运算得到每个字符的待追问概率值。一个实施例中，概率值输出层包括的多个子层均为卷积层，每个卷积层具有训练好的卷积核。

在一个具体的实施例中，待追问对象标注模型基于bert模型训练得到，是一种ner文本标注模型。待追问对象标注模型中的字符向量转换层为look-up层，用于将每个字符表示从一个one-hot向量转换为character embedding字符嵌入。语义特征提取层为Transformer encoder层，可以有效地自动提取特征。概率值输出层为CRF层或Softmax层，用于在一个句子中为每个字符标记待追问概率值。关于待追问对象标注模型的训练过程，将在后文详细描述。

在会话数据中标注待追问对象后，执行步骤S206，根据待追问对象和人机对话的场景数据，生成会话数据的回复数据。

一个实施例中，根据待追问对象和人机对话的场景数据，生成会话数据的回复数据，具体为：

(c1)根据人机对话的场景数据，获取预先为会话数据设置的初始回复语句；该语句为文本形式的数据；

(c2)判断该初始回复语句中是否存在与待追问对象相对应的内容；

(c3)根据判断结果，生成会话数据的回复数据。

本实施例中，生成的回复数据为回复语句，为文本形式的数据。

动作(c1)中，根据人机对话的场景数据，获取该人机对话的场景中，预先为会话数据设置的初始回复语句，比如，用户的会话数据为“是的，我买了一套护肤品”，其对应的初始回复语句为“请问卖家按约定发货了吗”。又如，用户的会话数据为“我刚才买的是基金”，其对应的初始回复语句为“您买的这款理财产品，我们有专门的收益保障”。

动作(c2)中，判断该初始回复语句中是否存在与待追问对象相对应的内容。与待追问对象相对应的内容，可以是语义与待追问对象之间的语义相近程度满足预设语义相近要求的字符串。比如，上面第一例子中，“护肤品”为待追问对象，则能够看出，初始回复语句中不存在与待追问对象相对应的内容。上面第二个例子中，“基金”为待追问对象，则能够看出，初始回复语句中存在与待追问对象语义相近的字符串“理财产品”，则“理财产品”为与待追问对象相对应的内容。

动作(c3)中，根据动作(c2)的判断结果，生成用户的会话数据的回复数据。该动作具体包括：

(c31)若判断结果表示初始回复语句中存在与待追问对象相对应的内容，则将该内容替换为待追问对象，根据替换后的初始回复语句生成会话数据的回复数据；

(c32)若判断结果表示初始回复语句中不存在与待追问对象相对应的内容，则基于待追问对象，生成初始回复语句的衔接语句，根据衔接语句和初始回复语句，生成会话数据的回复数据。

动作(c31)中，若判断结果表示初始回复语句中存在与待追问对象相对应的内容，则将该内容替换为待追问对象，将替换后的初始回复语句作为会话数据的回复数据。比如上面第二个例子中，将“理财产品”替换为“基金”，得到回复数据“您买的这款基金，我们有专门的收益保障”。由此可见，通过将与待追问对象相对应的内容替换为待追问对象，能够使得得到的回复数据与用户的会话数据衔接更加紧密，从而使得回复数据更接近真正的人所回答的数据，提高用户的人机对话体验。

动作(c32)中，若判断结果表示初始回复语句中不存在与待追问对象相对应的内容，则基于待追问对象，生成初始回复语句的衔接语句，将衔接语句和初始回复语句进行拼接，得到会话数据的回复数据。比如上面第一个例子中，不存在与“护肤品”相对应的内容，则本动作中，基于待追问对象“护肤品”，生成衔接语句“针对您购买的护肤品”，将衔接语句和初始回复语句“请问卖家按约定发货了吗”进行拼接，得到回复数据“针对您购买的护肤品，请问卖家按约定发货了吗”。

动作(c32)中，基于待追问对象，生成初始回复语句的衔接语句，具体包括：

(c321)基于待追问对象，获取用户在人机对话的场景中与待追问对象相关的行为数据；

(c322)根据待追问对象和该行为数据，生成初始回复语句的衔接语句。

动作(c321)中，获取用户在人机对话的场景中，与待追问对象相关的行为数据，比如，上面购买护肤品的例子中，用户购买护肤品的行为数据为人机对话场景中与“护肤品”相关的行为数据。该例子中，用户购买护肤品的行为数据同样也是触发人机对话发生的行为数据。

动作(c322)中，根据待追问对象和该行为数据，生成初始回复语句的衔接语句。一个实施例中，将待追问对象、该行为数据中的关键词和预设的连接词进行拼接，得到衔接语句。比如上例中，将“护肤品”、“购买”与预设的连接词进行拼接，得到衔接语句“针对您购买的护肤品”。这一实施例中，预设的连接词可以根据待追问对象和行为数据中的关键词自动在预设的连接词库中进行选择。

在另一个实施例中，可以通过以下方式获取用户的会话数据的初始回复语句：

(d1)根据人机对话的场景数据，获取人机对话的对话模板；

(d2)从对话模板中提取针对会话数据的初始回复语句；

动作(d1)中，根据人机对话的场景数据，获取人机对话的对话模板。根据前面的描述可知，场景数据包括场景标识和对话目的标识两部分，场景标识能够表示触发该人机对话发生的行为数据，对话目的标识能够表示人机对话的目的。本动作中，可以根据对话目的标识，获取人机对话的对话模板。比如，预设有不同对话目的对应的对话模板，从而本动作中，根据对话目的标识，查找得到相对应的对话模板。对话模板中记录有多条向用户推送的会话语句，还记录有各条会话语句之间的先后顺序，还根据各种对话可能性标记了各种对话流程。

比如对话模板为：您好，我是您的专属客服，本次来电是为了提醒您不要给陌生人汇款，以防止电信诈骗，又如，对话模板为：您好，我是您的专属客服，本次来电是为了提醒您请通过正规渠道购买理财产品，以防止电信诈骗。

动作(d2)中，从对话模板中提取针对上述的会话数据的初始回复语句。对话模板中不仅记录有多条向用户推送的会话语句，还记录有各条会话语句之间的先后顺序，还根据各种对话可能性标记了各种对话流程。比如对话模板中包括：请问您是XX先生/女士吗，若用户回答是，则对话模板中标记执行下一条语句“您好，我是您的专属客服，本次来电是为了提醒您不要给陌生人汇款，以防止电信诈骗”，若用户回答不是，则对话模板中标记执行下一条语句“不好意思打扰了，再见”。

本动作中，在对话模板中查找到用户的会话数据的位置，该位置可以表示为用户的会话数据是针对对话模板中的第几条问题回答的，并根据对话模板中标记的对话流程和该位置，在对话模板中查找到针对用户的会话数据的初始回复语句。随着会话数据的位置的变化，其对应的初始回复语句也不同。比如，用户的会话数据为：是的，我刚买了一套护肤品，是针对对话模板中的第二个问题回答的，则在对话模板中查找到相对应的初始回复语句为：请问商家是否承诺七天内免费退货呢？又如，用户的会话数据为：是的，我是XX女士，是针对对话模板中的第三个问题回答的，则在对话模板中查找到相对应的初始回复语句为：“请问您是否进行了网络购物呢”。

在一个具体的实施例中，未通过本实施例中的人机对话方法时，对话服务器与用户之间的对话如下：

对话机器人：您好，请问是刘女士吗？

用户：啊，是的。

对话机器人：刘女士，我是客服。您刚刚有一笔2010.00元的交易失败了，可能有风险，需要和您确认一下，请问可以吗？

用户：啊。

对话机器人：请问您是在购买什么商品呢？

用户：嗯，买东西。

对话机器人：那您可以告诉我是看得见摸得着的实物商品，还是虚拟物品呢？

用户：嗯，跟朋友买护肤品。

对话机器人：请问对方有没有承诺给你返利或者佣金呢？

用户：没有。

对话机器人：如遇到兼职刷单、办理贷款、陌生网友借钱、订单异常、资金转入安全账户等诈骗行为，请千万不要相信。

用户：啊，好的。

对话机器人：那就先不打扰您了，感谢您的接听，再见。

通过本实施例中的人机对话方法时，对话服务器与用户之间的对话时，对话机器人回复数据中的“请问对方有没有承诺给你返利或者佣金呢？”变更为“针对您购买的这个护肤品，请问对方有没有承诺给你返利或者佣金呢？”，从而使得回复数据与用户的会话数据衔接更加紧密，使得回复数据更贴近真正的人工客服回复的数据，避免了强硬的对话状态，提高用户的人机对话体验。

下面介绍待追问对象标注模型的训练方式。图4为本说明书一实施例提供的待追问对象标注模型的训练流程示意图，如图4所示，在一个具体的实施例中，待追问对象标注模型通过以下方式训练得到：

步骤S402，获取人工客服对话过程中用户的会话样本数据和会话样本数据对应的回复样本数据；

步骤S404，根据会话样本数据和回复样本数据，在会话样本数据中标注被追问对象；

步骤S406，利用标注有被追问对象的会话样本数据，对预设的神经网络模型进行训练；

步骤S408，将训练完成的模型作为待追问对象标注模型。

步骤S402中，获取人工客服对话过程中用户的会话样本数据和真正的客服的回复样本数据。比如，筛选得到20000条会话样本数据和20000条回复样本数据。会话样本数据和回复样本数据均为文本形式的数据。步骤S404中，根据会话样本数据和回复样本数据，在会话样本数据中标注被追问对象。步骤S406中，可以采用通用的模型训练方式，利用标注有被追问对象的会话样本数据，对预设的神经网络模型进行训练，其中，预设的神经网络模型可以为bert模型。步骤S408中，将训练完成的模型作为待追问对象标注模型。

上述步骤S404中，根据会话样本数据和回复样本数据，在会话样本数据中标注被追问对象，具体包括：

(e1)对会话样本数据和回复样本数据进行分词处理；

(e2)对分词处理后的会话样本数据和分词处理后的回复样本数据进行字符串匹配，得到会话样本数据和回复样本数据中共同出现的至少一个字符串；

(e3)在至少一个字符串中筛选长度符合预设长度要求且语义符合预设语义要求的目标字符串；

(e4)在会话样本数据中将目标字符串标注为被追问对象。

首先，通过jieba分词对会话样本数据和回复样本数据进行分词处理。其次，通过字符串匹配的方式，对分词处理后的会话样本数据和分词处理后的回复样本数据进行字符串匹配，得到会话样本数据和回复样本数据中共同出现的至少一个字符串。然后，在至少一个字符串中筛选长度符合预设长度要求且语义符合预设语义要求的目标字符串，预设长度要求可以为长度大于等于3个字符，预设语义要求可以为语义不是无意义语义，具有实际的含义，如不能是虚词“的”、“了”等。最后，在会话样本数据中将目标字符串标记为被追问对象。

一个例子中，会话样本数据为“我在买衣服”，回复样本数据为“您买的衣服收到货了吗？”，首先对会话样本数据进行分词得到“我”、“在”、“买”、“衣服”，对回复样本数据分词得到“您”、“买”、“的”、“衣服”“收到货”、“了”、“吗”。进而，对分词处理后的会话样本数据和分词处理后的回复样本数据进行字符串匹配，得到“买”、“衣服”，接着，根据预设的长度要求，将“买”删除，得到字符串“衣服”，“衣服”满足预设语义要求，“衣服”则为被追问对象。

上述步骤S208中，得到会话数据的回复数据后，将回复数据推送给用户，从而实现人机对话。比如，将文本形式的回复数据转换为语音数据推送给用户，从而进行人机对话。

综上，通过上述实施例中的人机对话方法，提供了一种无监督的待追问对象标注模型，通过该模型在用户的会话数据中标注待追问对象，围绕该待追问对象向用户推送回复数据，使得人机对话的效果类似于真人与用户进行对话，从而提高用户的配合意愿度，提升人机对话的成功率，提升用户的对话体验。

图5为本说明书又一实施例提供的人机对话方法的流程示意图，该流程由人机对话服务器执行，如图5所示，该流程包括：

步骤S502，获取人机对话过程中用户的会话数据和人机对话的场景数据；

步骤S504，通过待追问对象标注模型，获取会话数据中的每个字符的待追问概率值；

步骤S506，根据待追问概率值，在会话数据的各个字符中标注待追问对象；

步骤S508，根据人机对话的场景数据，获取预先为会话数据设置的初始回复语句；

步骤S510，判断初始回复语句中是否存在与待追问对象相对应的内容；

步骤S512，根据判断结果，生成会话数据的回复数据；

步骤S514，向用户推送回复数据，以进行人机对话。

图5中的详细过程可以参考前面的描述，这里不再重复。

基于上述的人机对话方法，本说明书还提供了一种人机对话装置，图6为本说明书一实施例提供的人机对话装置的模块组成示意图，如图6所示，该装置包括：

数据获取模块61，获取人机对话过程中用户的会话数据和所述人机对话的场景数据；

对象标注模块62，根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象；

数据生成模块63，根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据；

数据推送模块64，向用户推送所述回复数据，以进行人机对话。

可选地，所述会话数据为文本数据；所述对象标注模块，通过所述待追问对象标注模型，获取所述会话数据中的字符的待追问概率值；根据所述待追问概率值，在所述会话数据的字符中标注待追问对象。

可选地，所述待追问对象标注模型包括依次连接的字符向量转换层、语义特征提取层和概率值输出层；所述对象标注模块，通过所述字符向量转换层，对所述会话数据中的字符进行向量转换，得到所述会话数据中的字符对应的向量；通过所述语义特征提取层，基于所述会话数据中的字符对应的向量，对所述会话数据中的字符进行语义特征提取，得到所述会话数据中的字符对应的语义特征；通过所述概率值输出层，基于所述会话数据中的字符对应的语义特征，计算所述会话数据中的字符的待追问概率值。

可选地，所述对象标注模块，在所述会话数据的字符中选取所述待追问概率值大于预设概率阈值的目标字符；将选取的所述目标字符标注为所述待追问对象。

可选地，所述数据生成模块，根据所述人机对话的场景数据，获取预先为所述会话数据设置的初始回复语句；判断所述初始回复语句中是否存在与所述待追问对象相对应的内容；根据判断结果，生成所述会话数据的回复数据。

可选地，所述数据生成模块，若所述判断结果表示所述初始回复语句中存在与所述待追问对象相对应的内容，则将所述内容替换为所述待追问对象，根据替换后的初始回复语句生成所述会话数据的回复数据；若所述判断结果表示所述初始回复语句中不存在与所述待追问对象相对应的内容，则基于所述待追问对象，生成所述初始回复语句的衔接语句，根据所述衔接语句和所述初始回复语句，生成所述会话数据的回复数据。

可选地，所述数据生成模块，基于所述待追问对象，获取用户在所述人机对话的场景中与所述待追问对象相关的行为数据；根据所述待追问对象和所述行为数据，生成所述初始回复语句的衔接语句。

可选地，所述装置还包括模型训练模块，获取人工客服对话过程中用户的会话样本数据和所述会话样本数据对应的回复样本数据；根据所述会话样本数据和所述回复样本数据，在所述会话样本数据中标注被追问对象；利用标注有被追问对象的所述会话样本数据，对预设的神经网络模型进行训练；将训练完成的模型作为所述待追问对象标注模型。

可选地，所述模型训练模块，对所述会话样本数据和所述回复样本数据进行分词处理；对分词处理后的所述会话样本数据和分词处理后的所述回复样本数据进行字符串匹配，得到所述会话样本数据和所述回复样本数据中共同出现的至少一个字符串；在所述至少一个字符串中筛选长度符合预设长度要求且语义符合预设语义要求的目标字符串；在所述会话样本数据中将所述目标字符串标注为被追问对象。

本说明书实施例中的人机对话装置，能够实现前述的人机对话方法的全部过程，并具有相同的效果和功能，这里不再重复。

基于上述的人机对话方法，本说明书还提供了一种人机对话设备，图7为本说明书一实施例提供的人机对话设备的结构示意图，如图7所示，人机对话设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器1501和存储器1502，存储器1502中可以存储有一个或一个以上应用程序或数据。其中，存储器1502可以是短暂存储或持久存储。存储在存储器1502的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括人机对话设备中的一系列计算机可执行指令。更进一步地，处理器1501可以设置为与存储器1502通信，在人机对话设备上执行存储器1502中的一系列计算机可执行指令。人机对话设备还可以包括一个或一个以上电源1503，一个或一个以上有线或无线网络接口1504，一个或一个以上输入输出接口1505，一个或一个以上键盘1506等。

在一个具体的实施例中，人机对话设备包括有处理器；以及被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被所述处理器执行时使所述处理器实现：

获取人机对话过程中用户的会话数据和所述人机对话的场景数据；

根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象；

根据所述待追问对象和所述人机对话的场景数据，生成所述会话数据的回复数据；

向用户推送所述回复数据，以进行人机对话。

本说明书实施例中的人机对话设备，能够实现前述的人机对话方法的全部过程，并具有相同的效果和功能，这里不再重复。

本说明书另一实施例还提供了一种存储介质，用于存储计算机可执行指令，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令在被处理器执行时，能使所述处理器实现以下流程：

向用户推送所述回复数据，以进行人机对话。

本说明书实施例中的存储介质，能够实现前述的人机对话方法的全部过程，并具有相同的效果和功能，这里不再重复。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书的一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书的实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书的一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本文件。对于本领域技术人员来说，本说明书的实施例可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本文件的权利要求范围之内。

Claims

1.一种人机对话方法，包括：

获取人机对话过程中用户的会话数据和所述人机对话的场景数据，其中场景数据包括场景标识和对话目的标识，场景标识表示触发人机对话发生的行为数据，对话目的标识表示人机对话的目的，对话目的标识根据场景标识的行为数据确定；

根据所述人机对话的场景数据中的对话目的标识，获取预先为所述会话数据设置的初始回复语句；

判断所述初始回复语句中是否存在与所述待追问对象相对应的内容；

若所述判断结果表示所述初始回复语句中存在与所述待追问对象相对应的内容，则将所述内容替换为所述待追问对象，根据替换后的初始回复语句生成所述会话数据的回复数据；若所述判断结果表示所述初始回复语句中不存在与所述待追问对象相对应的内容，则基于所述待追问对象，生成所述初始回复语句的衔接语句，根据所述衔接语句和所述初始回复语句，生成所述会话数据的回复数据；

向用户推送所述回复数据，以进行人机对话。

2.根据权利要求1所述的方法，所述会话数据为文本数据；根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象，包括：

通过所述待追问对象标注模型，获取所述会话数据中的字符的待追问概率值；

根据所述待追问概率值，在所述会话数据的字符中标注待追问对象。

3.根据权利要求2所述的方法，所述待追问对象标注模型包括依次连接的字符向量转换层、语义特征提取层和概率值输出层；通过所述待追问对象标注模型，获取所述会话数据中的字符的待追问概率值，包括：

通过所述字符向量转换层，对所述会话数据中的字符进行向量转换，得到所述会话数据中的字符对应的向量；

通过所述语义特征提取层，基于所述会话数据中的字符对应的向量，对所述会话数据中的字符进行语义特征提取，得到所述会话数据中的字符对应的语义特征；

通过所述概率值输出层，基于所述会话数据中的字符对应的语义特征，计算所述会话数据中的字符的待追问概率值。

4.根据权利要求2所述的方法，根据所述待追问概率值，在所述会话数据的字符中标注待追问对象，包括：

在所述会话数据的字符中选取所述待追问概率值大于预设概率阈值的目标字符；

将选取的所述目标字符标注为所述待追问对象。

5.根据权利要求1所述的方法，基于所述待追问对象，生成所述初始回复语句的衔接语句，包括：

基于所述待追问对象，获取用户在所述人机对话的场景中与所述待追问对象相关的行为数据；

根据所述待追问对象和所述行为数据，生成所述初始回复语句的衔接语句。

6.根据权利要求1所述的方法，所述待追问对象标注模型通过以下方式训练：

获取人工客服对话过程中用户的会话样本数据和所述会话样本数据对应的回复样本数据；

根据所述会话样本数据和所述回复样本数据，在所述会话样本数据中标注被追问对象；

利用标注有被追问对象的所述会话样本数据，对预设的神经网络模型进行训练；

将训练完成的模型作为所述待追问对象标注模型。

7.根据权利要求6所述的方法，根据所述会话样本数据和所述回复样本数据，在所述会话样本数据中标注被追问对象，包括：

对所述会话样本数据和所述回复样本数据进行分词处理；

对分词处理后的所述会话样本数据和分词处理后的所述回复样本数据进行字符串匹配，得到所述会话样本数据和所述回复样本数据中共同出现的至少一个字符串；

在所述至少一个字符串中筛选长度符合预设长度要求且语义符合预设语义要求的目标字符串；

在所述会话样本数据中将所述目标字符串标注为被追问对象。

8.一种人机对话装置，包括：

数据获取模块，获取人机对话过程中用户的会话数据和所述人机对话的场景数据，其中场景数据包括场景标识和对话目的标识，场景标识表示触发人机对话发生的行为数据，对话目的标识表示人机对话的目的，对话目的标识根据场景标识的行为数据确定；

对象标注模块，根据预先训练的待追问对象标注模型，在所述会话数据中标注待追问对象；

数据生成模块，根据所述人机对话的场景数据中的对话目的标识，获取预先为所述会话数据设置的初始回复语句；判断所述初始回复语句中是否存在与所述待追问对象相对应的内容；若所述判断结果表示所述初始回复语句中存在与所述待追问对象相对应的内容，则将所述内容替换为所述待追问对象，根据替换后的初始回复语句生成所述会话数据的回复数据；若所述判断结果表示所述初始回复语句中不存在与所述待追问对象相对应的内容，则基于所述待追问对象，生成所述初始回复语句的衔接语句，根据所述衔接语句和所述初始回复语句，生成所述会话数据的回复数据；

数据推送模块，向用户推送所述回复数据，以进行人机对话。

9.根据权利要求8所述的装置，所述会话数据为文本数据；所述对象标注模块，

10.一种人机对话设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述计算机可执行指令在被所述处理器执行时使所述处理器实现：

向用户推送所述回复数据，以进行人机对话。

11.一种存储介质，用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时使所述处理器实现：

向用户推送所述回复数据，以进行人机对话。