CN111522937A

CN111522937A - 话术推荐方法、装置和电子设备

Info

Publication number: CN111522937A
Application number: CN202010409704.XA
Authority: CN
Inventors: 王子豪; 刘佳; 崔恒斌
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-08-11
Anticipated expiration: 2040-05-15
Also published as: CN111522937B

Abstract

本说明书实施例提出了一种话术推荐方法、装置和电子设备，其中，上述话术推荐方法中，获取当前对话中用户输入的对话上文之后，可以对上述对话上文进行词编码，获得上述对话上文对应的词向量；然后通过神经网络对上述词向量进行特征表示，获得上述词向量对应的特征向量，通过预先训练的话术推荐模型对上述特征向量进行分类，获得上述特征向量分类到每个种子话术的置信度；最后，根据上述置信度选择种子话术，并在当前对话中推荐所选择的种子话术。

Description

话术推荐方法、装置和电子设备

技术领域

本说明书涉及互联网技术领域，尤其涉及一种话术推荐方法、装置和电子设备。

背景技术

随着智能客服的日益发展，客服机器人也从被动式问题求助开始拓展到主动式服务，例如：在销售场景下，就需要客服机器人能够主动发现并了解用户意图，通过相应的话术来激励或者促使用户能够接受客服机器人的需求，从而达到相应的业务目标。

在实际使用的时候，往往是先通过挖掘或者生成的方式给出一些候选的机器人话术，或者是业务运营配置一些候选的话术，这些话术被称为种子话术。

发明内容

本说明书实施例提供了一种话术推荐方法、装置和电子设备，以实现客服机器人在给定种子话术的场景下，可以根据对话上文，选择合适的种子话术进行推荐。

第一方面，本说明书实施例提供一种话术推荐方法，包括：

获取当前对话中用户输入的对话上文；

对所述对话上文进行词编码，获得所述对话上文对应的词向量；

通过神经网络对所述词向量进行特征表示，获得所述词向量对应的特征向量；

通过预先训练的话术推荐模型对所述特征向量进行分类，获得所述特征向量分类到每个种子话术的置信度；

根据所述置信度选择种子话术，并在所述当前对话中输出所选择的种子话术。

上述话术推荐方法中，获取当前对话中用户输入的对话上文之后，可以对上述对话上文进行词编码，获得上述对话上文对应的词向量；然后通过神经网络对上述词向量进行特征表示，获得上述词向量对应的特征向量，通过预先训练的话术推荐模型对上述特征向量进行分类，获得上述特征向量分类到每个种子话术的置信度；最后，根据上述置信度选择种子话术，并在当前对话中推荐所选择的种子话术，从而可以实现在给定种子话术的场景下，客服机器人可以根据对话上文，选择合适的种子话术进行推荐，提高了客服机器人输出的种子话术与用户输入的对话上文的匹配度。

其中一种可能的实现方式中，所述通过预先训练的话术推荐模型对所述特征向量进行分类，获得所述特征向量分类到每个种子话术的置信度之前，还包括：

利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型；其中，所述训练语料包括种子话术和针对所述种子话术扩充的对话上下文，所述对话上下文从人工客服的对话日志中获取。

其中一种可能的实现方式中，所述利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型包括：

将所述训练语料划分为训练集合和验证集合；

利用所述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练；

利用训练获得的话术推荐模型对所述验证集合中的对话上文进行分类，根据分类结果和所述验证集合中的对话上文对应的种子话术，确定所述训练获得的话术推荐模型的准确率；

当所述准确率达到预定的准确率阈值时，获得训练好的话术推荐模型。

其中一种可能的实现方式中，所述利用所述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练包括：

对所述训练集合中的对话上文进行词编码，获得所述训练集合中的对话上文对应的训练词向量；

通过神经网络对所述训练词向量进行特征表示，获得所述训练词向量对应的训练特征向量；

通过待训练的话术推荐模型对所述训练特征向量进行分类，获得所述训练特征向量分类到每个种子话术的置信度。

其中一种可能的实现方式中，所述利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型之前，还包括：

对人工客服的对话日志进行归一化处理；

从所述对话日志包括的人工对话中，获取人工客服针对用户输入的对话上文答复的对话下文；

计算所述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度；

根据所述语义相似度选择目标种子话术，将所述对话上文、所述对话下文、所述目标种子话术，以及所述对话下文与所述目标种子话术的相似度进行组合，获得所述目标种子话术的扩充语料。

其中一种可能的实现方式中，所述获得所述目标种子话术的扩充语料之后，还包括：

获取所述种子话术集合中每个种子话术的扩充语料的数量；

根据所述扩充语料的数量和对话下文与种子话术的相似度，对所述种子话术的扩充语料进行筛选，获得所述训练语料。

其中一种可能的实现方式中，所述根据所述扩充语料的数量和对话下文与种子话术的相似度，对所述种子话术的扩充语料进行筛选，获得所述训练语料包括：

当所述种子话术的扩充语料的数量大于预定的第一数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第一相似度阈值的扩充语料；

当所述种子话术的扩充语料的数量小于预定的第二数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第二相似度阈值的扩充语料；其中，所述第二数量阈值小于所述第一数量阈值，所述第一相似度阈值大于所述第二相似度阈值。

其中一种可能的实现方式中，所述计算所述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度包括：

通过预先训练的语义表示模型对所述对话下文与所述种子话术分别进行编码表示，获得所述对话下文对应的词向量与所述种子话术对应的词向量；

计算所述对话下文对应的词向量与所述种子话术对应的词向量之间的距离；

根据所述距离，确定所述对话下文与所述种子话术之间的语义相似度。

第二方面，本说明书实施例提供一种话术推荐装置，包括：

获取模块，用于获取当前对话中用户输入的对话上文；

词编码模块，用于对所述获取模块获取的对话上文进行词编码，获得所述对话上文对应的词向量；

特征表示模块，用于通过神经网络对所述词编码模块获得的词向量进行特征表示，获得所述词向量对应的特征向量；

分类模块，用于通过预先训练的话术推荐模型对所述特征向量进行分类，获得所述特征向量分类到每个种子话术的置信度；

选择模块，用于根据所述置信度选择种子话术，并在所述当前对话中输出所选择的种子话术。

其中一种可能的实现方式中，所述装置还包括：

训练模块，用于在所述分类模块获得所述特征向量分类到每个种子话术的置信度之前，利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型；其中，所述训练语料包括种子话术和针对所述种子话术扩充的对话上下文，所述对话上下文从人工客服的对话日志中获取。

其中一种可能的实现方式中，所述训练模块包括：

划分子模块，用于将所述训练语料划分为训练集合和验证集合；

模型训练子模块，用于利用所述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练；

验证子模块，用于利用训练获得的话术推荐模型对所述验证集合中的对话上文进行分类，根据分类结果和所述验证集合中的对话上文对应的种子话术，确定所述训练获得的话术推荐模型的准确率；当所述准确率达到预定的准确率阈值时，获得训练好的话术推荐模型。

其中一种可能的实现方式中，所述模型训练子模块，具体用于对所述训练集合中的对话上文进行词编码，获得所述训练集合中的对话上文对应的训练词向量；通过神经网络对所述训练词向量进行特征表示，获得所述训练词向量对应的训练特征向量；以及通过待训练的话术推荐模型对所述训练特征向量进行分类，获得所述训练特征向量分类到每个种子话术的置信度。

其中一种可能的实现方式中，所述装置，还包括：

处理模块，用于在所述训练模块获得训练好的话术推荐模型之前，对人工客服的对话日志进行归一化处理；

所述获取模块，还用于从所述对话日志包括的人工对话中，获取人工客服针对用户输入的对话上文答复的对话下文；

计算模块，用于计算所述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度；

语料扩充模块，用于根据所述计算模块计算的语义相似度选择目标种子话术，将所述对话上文、所述对话下文、所述目标种子话术，以及所述对话下文与所述目标种子话术的相似度进行组合，获得所述目标种子话术的扩充语料。

其中一种可能的实现方式中，所述装置还包括：筛选模块；

所述获取模块，还用于在所述语料扩充模块获得所述目标种子话术的扩充语料之后，获取所述种子话术集合中每个种子话术的扩充语料的数量；

所述筛选模块，用于根据所述扩充语料的数量和对话下文与种子话术的相似度，对所述种子话术的扩充语料进行筛选，获得所述训练语料。

其中一种可能的实现方式中，所述筛选模块，具体用于当所述种子话术的扩充语料的数量大于预定的第一数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第一相似度阈值的扩充语料；当所述种子话术的扩充语料的数量小于预定的第二数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第二相似度阈值的扩充语料；其中，所述第二数量阈值小于所述第一数量阈值，所述第一相似度阈值大于所述第二相似度阈值。

其中一种可能的实现方式中，所述计算模块包括：

向量获得子模块，用于通过预先训练的语义表示模型对所述对话下文与所述种子话术分别进行编码表示，获得所述对话下文对应的词向量与所述种子话术对应的词向量；

距离计算子模块，用于计算所述对话下文对应的词向量与所述种子话术对应的词向量之间的距离；

相似度确定子模块，用于根据所述距离，确定所述对话下文与所述种子话术之间的语义相似度。

第三方面，本说明书实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行第一方面提供的方法。

第四方面，本说明书实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行第一方面提供的方法。

应当理解的是，本说明书的第二~第四方面与本说明书的第一方面的技术方案一致，各方面及对应的可行实施方式所取得的有益效果相似，不再赘述。

附图说明

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书话术推荐方法一个实施例的流程图；

图2为本说明书话术推荐方法另一个实施例的流程图；

图3（a）为本说明书话术推荐方法中获得训练好的话术推荐模型的训练过程一个实施例的流程图；

图3（b）为本说明书话术推荐方法中话术推荐模型的训练过程一个实施例的流程图；

图4为本说明书话术推荐方法再一个实施例的流程图；

图5为本说明书话术推荐装置一个实施例的结构示意图；

图6为本说明书话术推荐装置另一个实施例的结构示意图；

图7为本说明书电子设备一个实施例的结构示意图。

具体实施方式

为了更好的理解本说明书的技术方案，下面结合附图对本说明书实施例进行详细描述。

应当明确，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本说明书保护的范围。

在本说明书实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

现有相关技术中，不同的种子话术适用于不同的场景，例如：开场的时候说的话术，或者中途用户表达不想购买的时候说的劝导话术，但是种子话术都是只有使用场景，并无对话上文，因此，客服机器人在当前对话中回答的话术并不一定与对话上文相匹配。而另一方面，在人工客服的场景下，有非常多的人工客服的对话日志，这些对话日志中包含了对话上文和人工客服回复的对话下文，这些对话日志给客服机器人提供了极好的训练语料。

因此本说明书实施例提供一种话术推荐方法，可以在给定种子话术的场景下，通过对人工客服的对话日志进行模仿学习，从而得到给定对话上文情况下的话术推荐模型。在线使用时，上述话术推荐模型可以实时依据对话上文，从种子话术中选择合适的话术进行推荐。

图1为本说明书话术推荐方法一个实施例的流程图，如图1所示，上述话术推荐方法可以包括：

步骤102，获取当前对话中用户输入的对话上文。

步骤104，对上述对话上文进行词编码，获得上述对话上文对应的词向量。

具体地，在对上述对话上文进行词编码时，可以通过不同的编码方式实现，例如：可以通过词向量理解（Global Vectors for Word Representation；以下简称：Glove）、Word2vec和/或FastText等算法对上述对话上文进行词编码，本实施例对词编码所用的算法不作限定。

其中，Glove是一种词嵌入方法，Word2vec是一种词嵌入方法，FastText为一种文本分类算法。

步骤106，通过神经网络对上述词向量进行特征表示，获得上述词向量对应的特征向量。

具体地，上述神经网络可以为长短期记忆网络（Long Short-Term Memory；以下简称：LSTM）、门控循环单元（Gated Recurrent Unit；以下简称：GRU）、卷积神经网络（Convolutional Neural Network；以下简称：CNN）或基于变形的双向编码器表示（Bidirectional Encoder Representations from Transformers；以下简称：BERT），本实施例对上述神经网络的具体形式不作限定。

步骤108，通过预先训练的话术推荐模型对上述特征向量进行分类，获得上述特征向量分类到每个种子话术的置信度。

其中，上述话术推荐模型是利用训练语料，通过模仿学习的方式训练获得的；其中，上述训练语料包括种子话术和针对上述种子话术扩充的对话上下文，上述对话上下文从人工客服的对话日志中获取。

本实施例中，置信度是指特征向量与每个种子话术匹配的概率，置信度越高表示特征向量与种子话术的匹配度越高。

步骤110，根据上述置信度选择种子话术，并在当前对话中输出所选择的种子话术。

具体地，根据上述置信度选择种子话术可以为：根据置信度对种子话术进行排序，按照置信度从高到低的顺序，选择预定数量的种子话术。其中，预定数量可以在具体实现时自行设定，本实施例对上述预定数量的大小不作限定。

举例来说，上述预定数量可以为1，这样就可以选择置信度最高的种子话术，即选择与特征向量匹配度最高的种子话术，然后可以在当前对话中输出所选择的种子话术。

图2为本说明书话术推荐方法另一个实施例的流程图，如图2所示，本说明书图1所示实施例中，步骤108之前，还可以包括：

步骤202，利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型。其中，上述训练语料可以包括种子话术和针对上述种子话术扩充的对话上下文，上述对话上下文从人工客服的对话日志中获取。

具体地，图3（a）为本说明书话术推荐方法中获得训练好的话术推荐模型一个实施例的流程图，如图3（a）所示，利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型可以包括：

步骤2022，将上述训练语料划分为训练集合和验证集合。

在具体实现时，训练集合和验证集合的拆分比例通常为6:4或者7:3，本实施例对此不作限定。

步骤2024，利用上述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练。

步骤2026，利用训练获得的话术推荐模型对上述验证集合中的对话上文进行分类，根据分类结果和上述验证集合中的对话上文对应的种子话术，确定上述训练获得的话术推荐模型的准确率。

具体地，假设利用训练获得的话术推荐模型对上述验证集合中的对话上文进行分类，获得上述对话上文分类到验证集合中每个种子话术的置信度，如果置信度最高的种子话术与上述验证集合中上述对话上文对应的种子话术相符，则可以确定训练获得的话术推荐模型分类准确，在利用训练获得的分类模型对上述验证集合中的对话上文完毕之后，可以根据分类准确的对话上文的数量与上述验证集合中的对话上文的总数，确定上述训练获得分类模型的准确率。

步骤2028，当上述准确率达到预定的准确率阈值时，获得训练好的话术推荐模型。

其中，上述预定的准确率阈值可以在具体实现时自行设定，本实施例对上述预定的准确率阈值的大小不作限定。

图3（b）为本说明书话术推荐方法中话术推荐模型的训练过程一个实施例的流程图，如图3（b）所示，步骤2024中，利用上述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练可以包括：

步骤302，对上述训练集合中的对话上文进行词编码，获得上述训练集合中的对话上文对应的训练词向量。

同样，在对上述训练语料中的对话上文进行词编码时，可以通过Glove、Word2vec和/或FastText等算法实现，本实施例对词编码所用的算法不作限定。

步骤304，通过神经网络对上述训练词向量进行特征表示，获得上述训练词向量对应的训练特征向量。

其中，上述神经网络可以为LSTM、GRU、CNN或BERT，本实施例对上述神经网络的具体形式不作限定。

步骤306，通过待训练的话术推荐模型对上述训练特征向量进行分类，获得上述训练特征向量分类到每个种子话术的置信度。

具体地，待训练的话术推荐模型可以为一个多分类的模型，分类的类目数为种子话术的数量。

在训练阶段，就是对待训练的话术推荐模型中的参数进行调整，使得话术推荐模型获得的分类结果中置信度最高的种子话术与训练集合中对话上文对应的种子话术相符。

图4为本说明书话术推荐方法再一个实施例的流程图，如图4所示，本说明书图2所示实施例中，步骤202之前，还可以包括：

步骤402，对人工客服的对话日志进行归一化处理。

具体地，对人工客服的对话日志进行归一化处理可以为：将人工客服的对话日志进行预处理，主要是将对话日志中的人名、地名、数字、电话和/或邮箱等信息通过模型的方式做归一化处理，统一用特殊字符代替。

步骤404，从上述对话日志包括的人工对话中，获取人工客服针对用户输入的对话上文答复的对话下文；计算上述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度。

具体地，计算上述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度可以为：首先，通过预先训练的语义表示模型对上述对话下文与上述种子话术分别进行编码表示，获得上述对话下文对应的词向量与上述种子话术对应的词向量；然后，计算上述对话下文对应的词向量与上述种子话术对应的词向量之间的距离；最后，根据上述距离，确定上述对话下文与上述种子话术之间的语义相似度。

其中，上述语义表示模型可以通过神经网络预先训练，上述神经网络可以为LSTM、GRU、CNN或BERT，本实施例对上述神经网络的具体形式不作限定。

步骤406，根据上述语义相似度选择目标种子话术，将上述对话上文、对话下文、目标种子话术，以及上述对话下文与目标种子话术的相似度进行组合，获得上述目标种子话术的扩充语料。

具体地，根据上述语义相似度选择目标种子话术可以为：根据语义相似度对种子话术进行排序，按照语义相似度由高到低的顺序，选择预定数量的目标种子话术；其中，上述预定数量可以在具体实现时自行设定，本实施例对上述预定数量的大小不作限定。举例来说，当上述预定数量为1时，即为选择与上述对话上文语义相似度最高的种子话术，作为目标种子话术。

进一步地，步骤406之后，还可以包括：

步骤408，获取上述种子话术集合中每个种子话术的扩充语料的数量，根据上述扩充语料的数量和对话下文与种子话术的相似度，对上述种子话术的扩充语料进行筛选，获得上述训练语料。

具体地，根据上述扩充语料的数量和对话下文与种子话术的相似度，对上述种子话术的扩充语料进行筛选，获得上述训练语料可以为：

当种子话术的扩充语料的数量大于预定的第一数量阈值时，从上述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第一相似度阈值的扩充语料；而当种子话术的扩充语料的数量小于预定的第二数量阈值时，从上述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第二相似度阈值的扩充语料；其中，第二数量阈值小于第一数量阈值，第一相似度阈值大于第二相似度阈值。

在具体实现时，第一数量阈值和第二数量阈值的大小可以自行设定，本实施例对第一数量阈值和第二数量阈值的大小不作限定，只要满足第二数量阈值小于第一数量阈值即可；另外，第一相似度阈值和第二相似度阈值的大小也可以自行设定，本实施例对第一相似度阈值和第二相似度阈值的大小不作限定，只要满足第一相似度阈值大于第二相似度阈值即可。

也就是说，在对每个种子话术的扩充语料进行筛选时，针对得到的扩充语料比较多的种子话术，则设置较高的相似度阈值，这样保留下来的扩充语料的数量较小，从而减少这些种子话术的扩充语料的数量；而对于得到的扩充语料比较少的种子话术，则设置较低的相似度阈值，这样保留下来的扩充语料的数量较大，从而为这些种子话术保留较多的扩充语料。对于几乎没有扩充语料的种子话术，则设置相应的提醒标识，用于后续人工进行手动扩充。

进一步地，步骤408之后，还可以包括：

步骤410，对训练语料进行审核。然后执行步骤202，图4中未示出。

具体地，对训练语料进行审核，是为了检查种子话术与对话下文的具体内容，是否与语义相似度相符，避免出现语义相似度的值较高，但种子话术与对话下文的具体内容却并不相似的情况。

本实施例中，经过筛选后的训练语料都会进入到人工审核阶段，为了提高人工审核的效率，对于种子话术与对话下文的语义相似度比较高的训练语料，可以随机抽取部分训练语料让人工审核，对于与对话下文的语义相似度比较低的训练语料，则可以全部由外包进行审核，对于没有扩充到语料的种子话术，由人工补充相应的对话上下文进去，最终得到完整的训练语料，这些训练语料都包含了对话上下文和对应的种子话术。

本实施例中，针对给定的种子话术集合中的每个种子话术，从人工客服的对话日志中获得了扩充语料，进而对扩充语料进行筛选，获得了话术推荐模型的训练语料，这些训练语料都包含了对话上下文和对应的种子话术，从而利用上述训练语料训练获得的话术推荐模型，可以在获取用户输入的对话上文之后，选择合适的种子话术进行推荐，提高了客服机器人输出的种子话术与用户输入的对话上文的匹配度。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

图5为本说明书话术推荐装置一个实施例的结构示意图，如图5所示，上述话术推荐装置可以包括：获取模块51、词编码模块52、特征表示模块53、分类模块54和选择模块55；

其中，获取模块51，用于获取当前对话中用户输入的对话上文；

词编码模块52，用于对获取模块51获取的对话上文进行词编码，获得上述对话上文对应的词向量；

特征表示模块53，用于通过神经网络对词编码模块52获得的词向量进行特征表示，获得上述词向量对应的特征向量；

分类模块54，用于通过预先训练的话术推荐模型对上述特征向量进行分类，获得上述特征向量分类到每个种子话术的置信度；

选择模块55，用于根据上述置信度选择种子话术，并在当前对话中输出所选择的种子话术。

图5所示实施例提供的话术推荐装置可用于执行本说明书图1所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图6为本说明书话术推荐装置另一个实施例的结构示意图，与图5所示的话术推荐装置相比，图6所示的话术推荐装置还可以包括：训练模块56；

训练模块56，用于在分类模块54获得上述特征向量分类到每个种子话术的置信度之前，利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型；其中，上述训练语料包括种子话术和针对上述种子话术扩充的对话上下文，上述对话上下文从人工客服的对话日志中获取。

具体地，训练模块56可以包括：划分子模块561、模型训练子模块562和验证子模块563；

划分子模块561，用于将上述训练语料划分为训练集合和验证集合；

模型训练子模块562，用于利用上述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练；

验证子模块563，用于利用训练获得的话术推荐模型对上述验证集合中的对话上文进行分类，根据分类结果和上述验证集合中的对话上文对应的种子话术，确定训练获得的话术推荐模型的准确率；当上述准确率达到预定的准确率阈值时，获得训练好的话术推荐模型。

其中，模型训练子模块562，具体用于对上述训练集合中的对话上文进行词编码，获得上述训练集合中的对话上文对应的训练词向量；通过神经网络对上述训练词向量进行特征表示，获得上述训练词向量对应的训练特征向量；以及通过待训练的话术推荐模型对上述训练特征向量进行分类，获得上述训练特征向量分类到每个种子话术的置信度。

进一步地，上述话术推荐装置还可以包括：处理模块57、计算模块58和语料扩充模块59；

处理模块57，用于在训练模块56获得训练好的话术推荐模型之前，对人工客服的对话日志进行归一化处理；

获取模块51，还用于从上述对话日志包括的人工对话中，获取人工客服针对用户输入的对话上文答复的对话下文；

计算模块58，用于计算上述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度；

语料扩充模块59，用于根据计算模块58计算的语义相似度选择目标种子话术，将对话上文、对话下文、目标种子话术，以及对话下文与目标种子话术的相似度进行组合，获得上述目标种子话术的扩充语料。

进一步地，上述话术推荐装置还可以包括：筛选模块510；

获取模块51，还用于在语料扩充模块59获得上述目标种子话术的扩充语料之后，获取上述种子话术集合中每个种子话术的扩充语料的数量；

筛选模块510，用于根据上述扩充语料的数量和对话下文与种子话术的相似度，对上述种子话术的扩充语料进行筛选，获得上述训练语料。

本实施例中，筛选模块510，具体用于当上述种子话术的扩充语料的数量大于预定的第一数量阈值时，从上述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第一相似度阈值的扩充语料；当上述种子话术的扩充语料的数量小于预定的第二数量阈值时，从上述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第二相似度阈值的扩充语料；其中，第二数量阈值小于第一数量阈值，第一相似度阈值大于上述第二相似度阈值。

本实施例中，计算模块58可以包括：向量获得子模块581、距离计算子模块582和相似度确定子模块583；

向量获得子模块581，用于通过预先训练的语义表示模型对上述对话下文与上述种子话术分别进行编码表示，获得上述对话下文对应的词向量与上述种子话术对应的词向量；

距离计算子模块582，用于计算上述对话下文对应的词向量与上述种子话术对应的词向量之间的距离；

相似度确定子模块583，用于根据上述距离，确定上述对话下文与上述种子话术之间的语义相似度。

图6所示实施例提供的话术推荐装置可用于执行本申请图1~图4所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图7为本说明书电子设备一个实施例的结构示意图，如图7所示，上述电子设备可以包括至少一个处理器；以及与上述处理器通信连接的至少一个存储器，其中：存储器存储有可被处理器执行的程序指令，上述处理器调用上述程序指令能够执行本说明书图1~图4所示实施例提供的话术推荐方法。

其中，上述电子设备可以为服务器，例如：云服务器，本实施例对上述电子设备的具体形态不作限定。

图7示出了适于用来实现本说明书实施方式的示例性电子设备的框图。图7显示的电子设备仅仅是一个示例，不应对本说明书实施例的功能和使用范围带来任何限制。

如图7所示，电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于：一个或者多个处理器410，通信接口420，存储器430，连接不同系统组件（包括存储器430、通信接口420和处理单元410）的通信总线440。

通信总线440表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，或者使用多种总线结构中的任意总线结构的局域总线。举例来说，通信总线440可以包括但不限于工业标准体系结构（Industry StandardArchitecture；以下简称：ISA）总线，微通道体系结构（Micro Channel Architecture；以下简称：MAC）总线，增强型ISA总线、视频电子标准协会（Video Electronics StandardsAssociation；以下简称：VESA）局域总线以及外围组件互连（Peripheral ComponentInterconnection；以下简称：PCI）总线。

电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器430可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器（Random Access Memory；以下简称：RAM）和/或高速缓存存储器。存储器430可以包括至少一个程序产品，该程序产品具有一组（例如至少一个）程序模块，这些程序模块被配置以执行本说明书各实施例的功能。

具有一组（至少一个）程序模块的程序/实用工具，可以存储在存储器430中，这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。

处理器410通过运行存储在存储器430中的程序，从而执行各种功能应用以及数据处理，例如实现本说明书图1~图4所示实施例提供的话术推荐方法。

本说明书实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行本说明书图1~图4所示实施例提供的话术推荐方法。

上述非暂态计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（RAM）、只读存储器（Read Only Memory；以下简称：ROM）、可擦式可编程只读存储器（Erasable ProgrammableRead Only Memory；以下简称：EPROM）或闪存、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网（LocalArea Network；以下简称：LAN）或广域网（Wide Area Network；以下简称：WAN）连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本说明书的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本说明书的实施例所属技术领域的技术人员所理解。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测（陈述的条件或事件）”可以被解释成为“当确定时”或“响应于确定”或“当检测（陈述的条件或事件）时”或“响应于检测（陈述的条件或事件）”。

需要说明的是，本说明书实施例中所涉及的终端可以包括但不限于个人计算机（Personal Computer；以下简称：PC）、个人数字助理（Personal Digital Assistant；以下简称：PDA）、无线手持设备、平板电脑（Tablet Computer）、手机、MP3播放器、MP4播放器等。

在本说明书所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本说明书各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置（可以是个人计算机，服务器，或者网络装置等）或处理器（Processor）执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-Only Memory；以下简称：ROM）、随机存取存储器（Random Access Memory；以下简称：RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本说明书的较佳实施例而已，并不用以限制本说明书，凡在本说明书的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书保护的范围之内。

Claims

1.一种话术推荐方法，包括：

获取当前对话中用户输入的对话上文；

2.根据权利要求1所述的方法，其中，所述通过预先训练的话术推荐模型对所述特征向量进行分类，获得所述特征向量分类到每个种子话术的置信度之前，还包括：

3.根据权利要求2所述的方法，其中，所述利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型包括：

将所述训练语料划分为训练集合和验证集合；

4.根据权利要求3所述的方法，其中，所述利用所述训练集合中的对话上文和对应的种子话术，对待训练的话术推荐模型进行训练包括：

5.根据权利要求2-4任意一项所述的方法，其中，所述利用训练语料，通过模仿学习的方式，获得训练好的话术推荐模型之前，还包括：

对人工客服的对话日志进行归一化处理；

6.根据权利要求5所述的方法，其中，所述获得所述目标种子话术的扩充语料之后，还包括：

获取所述种子话术集合中每个种子话术的扩充语料的数量；

7.根据权利要求6所述的方法，其中，所述根据所述扩充语料的数量和对话下文与种子话术的相似度，对所述种子话术的扩充语料进行筛选，获得所述训练语料包括：

8.根据权利要求5所述的方法，其中，所述计算所述对话下文与给定的种子话术集合中的每个种子话术之间的语义相似度包括：

9.一种话术推荐装置，包括：

获取模块，用于获取当前对话中用户输入的对话上文；

10.根据权利要求9所述的装置，还包括：

11.根据权利要求10所述的装置，其中，所述训练模块包括：

12.根据权利要求11所述的装置，其中，所述模型训练子模块，具体用于对所述训练集合中的对话上文进行词编码，获得所述训练集合中的对话上文对应的训练词向量；通过神经网络对所述训练词向量进行特征表示，获得所述训练词向量对应的训练特征向量；以及通过待训练的话术推荐模型对所述训练特征向量进行分类，获得所述训练特征向量分类到每个种子话术的置信度。

13.根据权利要求10-12任意一项所述的装置，还包括：

14.根据权利要求13所述的装置，还包括：筛选模块；

15.根据权利要求14所述的装置，其中，所述筛选模块，具体用于当所述种子话术的扩充语料的数量大于预定的第一数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第一相似度阈值的扩充语料；当所述种子话术的扩充语料的数量小于预定的第二数量阈值时，从所述种子话术的扩充语料中，保留对话下文与种子话术的相似度大于预定的第二相似度阈值的扩充语料；其中，所述第二数量阈值小于所述第一数量阈值，所述第一相似度阈值大于所述第二相似度阈值。

16.根据权利要求13所述的装置，其中，所述计算模块包括：

17.一种电子设备，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。

18.一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。