CN111428023B

CN111428023B - 话术推荐方法、装置和电子设备

Info

Publication number: CN111428023B
Application number: CN202010224908.6A
Authority: CN
Inventors: 王子豪; 刘佳; 崔恒斌
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2023-07-14
Anticipated expiration: 2040-03-26
Also published as: CN111428023A

Abstract

本说明书实施例提出了一种话术推荐方法、装置和电子设备，其中，上述话术推荐方法中，获取当前对话中用户输入的对话内容之后，根据上述用户输入的对话内容，通过预先训练的话术推荐模型，生成上述对话内容对应的回答话术，然后在上述当前对话中输出上述回答话术。由于上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的，上述用户模拟内容是模拟用户说的内容，对应的回答话术是机器人针对上述用户模拟内容给出的答复。

Description

话术推荐方法、装置和电子设备

【技术领域】

本说明书涉及互联网技术领域，尤其涉及一种话术推荐方法、装置和电子设备。

【背景技术】

随着智能客服的日益发展，客服机器人也从被动式问题求助开始拓展到主动式服务，例如：在销售等场景下，就需要客服机器人能够主动发现并了解用户意图，通过相应的话术来激励或者促使用户能够接受客服机器人的需求，从而达到提升业务指标的效果。

【发明内容】

本说明书实施例提供了一种话术推荐方法、装置和电子设备，以实现提高客服机器人的话术推荐准确率。

第一方面，本说明书实施例提供一种话术推荐方法，包括：

获取当前对话中用户输入的对话内容；

根据所述用户输入的对话内容，通过预先训练的话术推荐模型，生成所述对话内容对应的回答话术，所述话术推荐模型是利用用户模拟内容和所述用户模拟内容对应的回答话术组成的对话语料训练获得的；

在所述当前对话中输出所述回答话术。

上述话术推荐方法中，获取当前对话中用户输入的对话内容之后，根据上述用户输入的对话内容，通过预先训练的话术推荐模型，生成上述对话内容对应的回答话术，然后在上述当前对话中输出上述回答话术。由于上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的，上述用户模拟内容是模拟用户说的内容，对应的回答话术是机器人针对上述用户模拟内容给出的答复，也就是说，本说明书实施例中，通过模拟用户说话的方式训练获得话术推荐模型，从而可以提高训练获得的话术推荐模型的话术推荐准确率，进而可以提高使用上述话术推荐模型的客服机器人的话术推荐准确率。

其中一种可能的实现方式中，所述根据所述用户输入的对话内容，通过预先训练的话术推荐模型，生成所述对话内容对应的回答话术之前，还包括：通过模仿学习的方式，获得训练好的话术推荐模型。

其中一种可能的实现方式中，所述通过模仿学习的方式，获得训练好的话术推荐模型包括：

获取给定上文对话的场景下人工客服的回答话术；

对所述给定上文对话的情景下人工客服的回答话术进行学习，获得待训练的话术推荐模型；

获取与给定的上文对话对应的用户模拟内容；

通过所述待训练的话术推荐模型，生成所述用户模拟内容对应的回答话术；

通过所述用户模拟内容和对应的回答话术组成的对话语料，对所述待训练的话术推荐模型进行训练；

当所述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型。

其中一种可能的实现方式中，所述通过所述待训练的话术推荐模型，生成所述用户模拟内容对应的回答话术之后，还包括：

对所述用户模拟内容对应的回答话术进行纠错，获得纠错后的回答话术；

获取与所述纠错后的回答话术对应的用户模拟内容；

所述通过所述用户模拟内容和对应的回答话术组成的对话语料，对所述待训练的话术推荐模型进行训练包括：

通过所述纠错后的回答话术和对应的用户模拟内容组成的对话语料，对所述待训练的话术推荐模型进行训练。

其中一种可能的实现方式中，所述获取与给定的上文对话对应的用户模拟内容包括：

通过预先训练的用户模拟模型，获取与所述给定的上文对话对应的用户模拟内容。

其中一种可能的实现方式中，所述通过预先训练的用户模拟模型，获取与所述给定的上文对话对应的用户模拟内容之前，还包括：

通过检索和生成的方式，训练获得所述用户模拟模型。

第二方面，本说明书实施例提供一种话术推荐装置，包括：

获取模块，用于获取当前对话中用户输入的对话内容；

生成模块，用于根据所述获取模块获取的用户输入的对话内容，通过预先训练的话术推荐模型，生成所述对话内容对应的回答话术，所述话术推荐模型是利用用户模拟内容和所述用户模拟内容对应的回答话术组成的对话语料训练获得的；

输出模块，用于在所述当前对话中输出所述回答话术。

其中一种可能的实现方式中，所述装置还包括：

模仿学习模块，用于在所述生成模块生成所述对话内容对应的回答话术之前，通过模仿学习的方式，获得训练好的话术推荐模型；

其中一种可能的实现方式中，所述模仿学习模块包括：

语料获取子模块，用于获取给定上文对话的场景下人工客服的回答话术；

学习子模块，用于对所述给定上文对话的情景下人工客服的回答话术进行学习，获得待训练的话术推荐模型；

所述语料获取子模块，还用于获取与给定的上文对话对应的用户模拟内容；

话术生成子模块，用于通过所述待训练的话术推荐模型，生成所述用户模拟内容对应的回答话术；

训练子模块，用于通过所述用户模拟内容和对应的回答话术组成的对话语料，对所述待训练的话术推荐模型进行训练；当所述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型。

其中一种可能的实现方式中，所述模仿学习模块还包括：纠错子模块；

所述纠错子模块，用于在所述话术生成子模块生成所述用户模拟内容对应的回答话术之后，对所述用户模拟内容对应的回答话术进行纠错，获得纠错后的回答话术；

所述语料获取子模块，还用于获取与所述纠错后的回答话术对应的用户模拟内容；

所述训练子模块，具体用于通过所述纠错后的回答话术和对应的用户模拟内容组成的对话语料，对所述待训练的话术推荐模型进行训练。

其中一种可能的实现方式中，所述语料获取子模块，具体用于通过预先训练的用户模拟模型，获取与所述给定的上文对话对应的用户模拟内容。

其中一种可能的实现方式中，所述训练子模块，还用于在所述语料获取子模块获取与所述给定的上文对话对应的用户模拟内容之前，通过检索和生成的方式，训练获得所述用户模拟模型。

第三方面，本说明书实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行第一方面提供的方法。

第四方面，本说明书实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行第一方面提供的方法。

应当理解的是，本说明书的第二～第四方面与本说明书的第一方面的技术方案一致，各方面及对应的可行实施方式所取得的有益效果相似，不再赘述。

【附图说明】

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书话术推荐方法一个实施例的流程图；

图2为本说明书话术推荐方法另一个实施例的流程图；

图2(a)为本说明书话术推荐方法再一个实施例的流程图；

图3为本说明书话术推荐方法再一个实施例的流程图；

图4为本说明书话术推荐方法中话术推荐模型的自我迭代流程一个实施例的示意图；

图5为本说明书话术推荐方法中人工纠错界面一个实施例的示意图；

图6为本说明书话术推荐方法中模拟对话系统一个实施例的结构示意图；

图7为本说明书话术推荐装置一个实施例的结构示意图；

图8为本说明书话术推荐装置另一个实施例的结构示意图；

图9为本说明书电子设备一个实施例的结构示意图。

【具体实施方式】

为了更好的理解本说明书的技术方案，下面结合附图对本说明书实施例进行详细描述。

应当明确，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本说明书保护的范围。

在本说明书实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

随着智能客服的日益发展，客服机器人也从被动式问题求助开始拓展到主动式服务，客服机器人可以通过相应的话术来激励或者促使用户接受客服机器人的要求，从而达到提升业务指标的效果。针对不同的话术，人工客服是能够在给定聊天场景的基础上选择合适话术进行推荐的，这就给客服机器人很多的训练数据，但是仅仅依靠这些训练数据还不足以实现客服机器人自我更新和自我迭代的目的。

本说明书实施例提供一种话术推荐方法，能够通过人工干预的方式对客服机器人进行训练，客服机器人通过模仿学习的方式学习人工对其指导的内容，从而不断提升话术推荐准确率。

图1为本说明书话术推荐方法一个实施例的流程图，如图1所示，上述话术推荐方法可以包括：

步骤102，获取当前对话中用户输入的对话内容。

步骤104，根据上述用户输入的对话内容，通过预先训练的话术推荐模型，生成上述对话内容对应的回答话术，上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的。

步骤106，在上述当前对话中输出上述回答话术。

图2为本说明书话术推荐方法另一个实施例的流程图，如图2所示，本说明书图1所示实施例中，步骤104之前，还可以包括：

步骤202，通过模仿学习的方式，获得训练好的话术推荐模型。

在具体实现时，上述模仿学习的方式可以采用长短期记忆网络(Long Short-TermMemory；以下简称：LSTM)、卷积神经网络(Convolutional Neural Network；以下简称：CNN)或基于变形的双向编码器表示(Bidirectional Encoder Representations fromTransformers；以下简称：BERT)等算法实现，本实施例对上述模仿学习的方式所采用的具体算法不作限定。

具体地，图2(a)为本说明书话术推荐方法再一个实施例的流程图，如图2(a)所示，步骤202可以包括：

步骤2022，获取给定上文对话的场景下人工客服的回答话术。

具体地，可以从人工记录中挖掘出对话内容，挖掘获得的对话内容中包括了给定上文对话的场景下人工客服的回答话术。

步骤2024，对给定上文对话的情景下人工客服的回答话术进行学习，获得待训练的话术推荐模型。

具体地，给定的上文对话与人工客服的回答话术可以组成对话语料，对上述对话语料进行学习，可以获得初始的话术推荐模型，上述初始的话术推荐模型即为待训练的话术推荐模型。

步骤2026，获取与给定的上文对话对应的用户模拟内容。

其中，上述用户模拟内容包括在给定上文对话的场景下，模拟用户说的话。

具体地，步骤2026可以为：通过预先训练的用户模拟模型，获取与给定的上文对话对应的用户模拟内容。

而通过预先训练的用户模拟模型，获取与给定的上文对话对应的用户模拟内容之前，还可以通过检索和生成的方式，训练获得上述用户模拟模型。

也就是说，可以通过检索和生成的方式，训练获得上述用户模拟模型，然后利用训练获得的用户模拟模型，获取与给定的上文对话对应的用户模拟内容。

其中，上述用户模拟模型可以采用Sequence模型或检索模型训练获得，本实施例对训练上述用户模拟模型所采用的具体算法不作限定。

步骤2028，通过上述待训练的话术推荐模型，生成上述用户模拟内容对应的回答话术。

具体地，将上述用户模拟内容输入待训练的话术推荐模型，即可生成与上述用户模拟内容对应的回答话术。

步骤2030，通过上述用户模拟内容和对应的回答话术组成的对话语料，对上述待训练的话术推荐模型进行训练。

步骤2032，当上述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型。

其中，上述预定的准确率阈值可以在具体实现时，根据系统性能和/或实现需求等自行设定，本实施例对上述预定的准确率阈值的大小不作限定，举例来说，上述预定的准确率阈值可以为85％。

图3为本说明书话术推荐方法再一个实施例的流程图，如图3所示，本说明书图2(a)所示实施例中，步骤2028之后，还可以包括：

步骤302，对上述用户模拟内容对应的回答话术进行纠错，获得纠错后的回答话术。

步骤304，获取与上述纠错后的回答话术对应的用户模拟内容。

这样，步骤2030可以为：

步骤306，通过上述纠错后的回答话术和对应的用户模拟内容组成的对话语料，对上述待训练的话术推荐模型进行训练。

本实施例对话术推荐模型的自我迭代流程进行介绍，下面结合图4，对话术推荐模型的自我迭代流程进行详细说明，图4为本说明书话术推荐方法中话术推荐模型的自我迭代流程一个实施例的示意图。

如图4所示，首先，从人工记录中挖掘对话内容，上述对话内容包含了给定上文对话的场景下人工客服的回答话术，通过模仿学习的方式来学习给定上文对话的场景下，话术推荐模型应该输出什么样的回答话术，从而获得初始的话术推荐模型，即待训练的话术推荐模型。

同时，可以结合检索和生成的方式训练用户模拟模型，在给定上文对话的场景下，由用户模拟模型给出用户说的话。用户模拟模型和话术推荐模型组合在一起，可以模拟用户说的内容和机器人回复的内容，从而可以得到尽可能多的对话语料，进而可以提高训练获得的话术推荐模型的话术推荐准确率。

当然，初始的话术推荐模型可能会存在一些错误和偏差，本实施例通过引入人工纠错的方式对机器人说的话进行纠错，如果当前轮情况下机器人输出的回答话术不准确，则可以在候选的话术列表中选择正确的回答话术，用户模拟则根据纠错后的回答话术生成相应的用户模拟内容，从而依次对话下去形成完整的对话。通过人工纠错的方式，可以得到在给定上文对话的场景下，人工认为准确的回答话术，从而形成相应的标注数据，这部分数据可以通过沉淀的方式反馈到话术推荐模型中，从而可以实现通过模仿人工说话的方式对话术推荐模型进行训练，提高了训练获得的话术推荐模型的话术推荐准确率。

模拟对话的人工纠错界面可以如图5所示，图5为本说明书话术推荐方法中人工纠错界面一个实施例的示意图。图5左侧为机器人输出的回答话术，右侧为用户模拟内容，即用户模拟模型模拟用户输出的对话内容。在刚开始的时候，整个界面是机器人和用户模拟进行对话的内容，并且是完整的一通对话。标注人员依据对话上文，对每一轮机器人输出的回答话术进行标注。如果当前轮机器人说的话是合理的，则选择“合理”，展示下一轮的对话内容。如果当前轮机器人说的话不合理，则选择“不合理”，并展开推荐话术的选项，从推荐话术的选项中选择合理的回答话术，当选择新的回答话术之后，用户模拟模型则依据机器人输出的纠错后的回答话术推出新的用户模拟内容，并将后续的对话完整进行下去，形成新的完整的一通对话。如果所有的推荐话术都不合理，则标注人员可以选择录入新的回答话术，同样，用户模拟模型依据机器人输出的纠错后的回答话术推出新的用户模拟内容，并将后续的对话完整进行下去，形成新的完整的一通对话。所有的对话内容都会记录下来，用于话术推荐模型迭代训练使用。

综上所述，话术推荐模型、用户模拟模型和人工纠错组成了本说明书实施例的模拟对话系统，图6为本说明书话术推荐方法中模拟对话系统一个实施例的结构示意图。

上述模拟对话系统中，话术推荐模型作为机器人对话的主引擎，起到对话主体作用。用户模拟系统则是根据机器人说的话，输出模拟用户说的话。人工纠错则是对机器人输出的内容进行纠错，把机器人输出的回答话术中不合理的部分纠正过来，并且用户模拟模型实时依据纠正后的回答话术生成后面的用户模拟内容，从而使整个对话连贯通顺。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

图7为本说明书话术推荐装置一个实施例的结构示意图，如图7所示，上述话术推荐装置可以包括：获取模块71、生成模块72和输出模块73；

其中，获取模块71，用于获取当前对话中用户输入的对话内容；

生成模块72，用于根据获取模块71获取的用户输入的对话内容，通过预先训练的话术推荐模型，生成上述对话内容对应的回答话术，上述话术推荐模型是利用用户模拟内容和上述用户模拟内容对应的回答话术组成的对话语料训练获得的；

输出模块73，用于在上述当前对话中输出上述回答话术。

图7所示实施例提供的话术推荐装置可用于执行本说明书图1所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图8为本说明书话术推荐装置另一个实施例的结构示意图，与图7所示的话术推荐装置相比，图8所示的话术推荐装置还可以包括：模仿学习模块74，用于在生成模块72生成上述对话内容对应的回答话术之前，通过模仿学习的方式，获得训练好的话术推荐模型；

具体地，模仿学习模块74可以包括：

语料获取子模块741，用于获取给定上文对话的场景下人工客服的回答话术；

学习子模块742，用于对给定上文对话的情景下人工客服的回答话术进行学习，获得待训练的话术推荐模型；

语料获取子模块741，还用于获取与给定的上文对话对应的用户模拟内容；

话术生成子模块743，还用于通过上述待训练的话术推荐模型，生成上述用户模拟内容对应的回答话术；

训练子模块744，用于通过上述用户模拟内容和对应的回答话术组成的对话语料，对上述待训练的话术推荐模型进行训练；当上述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型。

进一步地，上述模仿学习模块74还可以包括：纠错子模块745；

纠错子模块745，用于在话术生成子模块743生成上述用户模拟内容对应的回答话术之后，对上述用户模拟内容对应的回答话术进行纠错，获得纠错后的回答话术；

语料获取子模块741，还用于获取与上述纠错后的回答话术对应的用户模拟内容；

这时，训练子模块744，具体用于通过上述纠错后的回答话术和对应的用户模拟内容组成的对话语料，对上述待训练的话术推荐模型进行训练。

本实施例中，语料获取子模块741，具体用于通过预先训练的用户模拟模型，获取与上述给定的上文对话对应的用户模拟内容。

训练子模块744，还用于在语料获取子模块741获取与上述给定的上文对话对应的用户模拟内容之前，通过检索和生成的方式，训练获得上述用户模拟模型。

图8所示实施例提供的话术推荐装置可用于执行本申请图1～图6所示方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述。

图9为本说明书电子设备一个实施例的结构示意图，如图9所示，上述电子设备可以包括至少一个处理器；以及与上述处理器通信连接的至少一个存储器，其中：存储器存储有可被处理器执行的程序指令，上述处理器调用上述程序指令能够执行本说明书图1～图6所示实施例提供的话术推荐方法。

其中，上述电子设备可以为服务器，例如：云服务器，本实施例对上述电子设备的具体形态不作限定。

图9示出了适于用来实现本说明书实施方式的示例性电子设备的框图。图9显示的电子设备仅仅是一个示例，不应对本说明书实施例的功能和使用范围带来任何限制。

如图9所示，电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于：一个或者多个处理器410，通信接口420，存储器430，连接不同系统组件(包括存储器430、通信接口420和处理单元410)的通信总线440。

通信总线440表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，或者使用多种总线结构中的任意总线结构的局域总线。举例来说，通信总线440包括但不限于工业标准体系结构(Industry StandardArchitecture；以下简称：ISA)总线，微通道体系结构(Micro Channel Architecture；以下简称：MAC)总线，增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation；以下简称：VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection；以下简称：PCI)总线。

电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器430可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory；以下简称：RAM)和/或高速缓存存储器。存储器430可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本说明书各实施例的功能。

具有一组(至少一个)程序模块的程序/实用工具，可以存储在存储器430中，这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本说明书所描述的实施例中的功能和/或方法。

处理器410通过运行存储在存储器430中的程序，从而执行各种功能应用以及数据处理，例如实现本说明书图1～图6所示实施例提供的话术推荐方法。

本说明书实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行本说明书图1～图6所示实施例提供的话术推荐方法。

上述非暂态计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory；以下简称：ROM)、可擦式可编程只读存储器(Erasable ProgrammableRead Only Memory；以下简称：EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本说明书操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network；以下简称：LAN)或广域网(Wide Area Network；以下简称：WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本说明书的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本说明书的实施例所属技术领域的技术人员所理解。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

需要说明的是，本说明书实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer；以下简称：PC)、个人数字助理(Personal Digital Assistant；以下简称：PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。

在本说明书所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本说明书各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory；以下简称：ROM)、随机存取存储器(Random Access Memory；以下简称：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本说明书的较佳实施例而已，并不用以限制本说明书，凡在本说明书的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书保护的范围之内。

Claims

1.一种话术推荐方法，其特征在于，包括：

获取当前对话中用户输入的对话内容；

在所述当前对话中输出所述回答话术；

其中，所述根据所述用户输入的对话内容，通过预先训练的话术推荐模型，生成所述对话内容对应的回答话术之前，还包括：

获取给定上文对话的场景下人工客服的回答话术；

对所述给定上文对话的场景下人工客服的回答话术进行学习，获得待训练的话术推荐模型；

获取与给定的上文对话对应的用户模拟内容；

当所述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型；

所述通过所述待训练的话术推荐模型，生成所述用户模拟内容对应的回答话术之后，还包括：

对所述用户模拟内容对应的回答话术进行纠错，如果所述用户模拟内容对应的回答话术不准确，则在候选的话术列表中选择正确的回答话术，以获得纠错后的回答话术；

获取与所述纠错后的回答话术对应的用户模拟内容；

2.根据权利要求1所述的方法，其特征在于，所述获取与给定的上文对话对应的用户模拟内容包括：

3.根据权利要求2所述的方法，其特征在于，所述通过预先训练的用户模拟模型，获取与所述给定的上文对话对应的用户模拟内容之前，还包括：

通过检索和生成的方式，训练获得所述用户模拟模型。

4.一种话术推荐装置，其特征在于，包括：

获取模块，用于获取当前对话中用户输入的对话内容；

输出模块，用于在所述当前对话中输出所述回答话术；

其中，所述装置还包括：

所述模仿学习模块包括：

训练子模块，用于通过所述用户模拟内容和对应的回答话术组成的对话语料，对所述待训练的话术推荐模型进行训练；当所述待训练的话术推荐模型的话术推荐准确率大于或等于预定的准确率阈值时，获得训练好的话术推荐模型；

所述模仿学习模块还包括：纠错子模块；

所述纠错子模块，用于在所述话术生成子模块生成所述用户模拟内容对应的回答话术之后，对所述用户模拟内容对应的回答话术进行纠错，如果所述用户模拟内容对应的回答话术不准确，则在候选的话术列表中选择正确的回答话术，以获得纠错后的回答话术；

5.根据权利要求4所述的装置，其特征在于，

所述语料获取子模块，具体用于通过预先训练的用户模拟模型，获取与所述给定的上文对话对应的用户模拟内容。

6.根据权利要求5所述的装置，其特征在于，

所述训练子模块，还用于在所述语料获取子模块获取与所述给定的上文对话对应的用户模拟内容之前，通过检索和生成的方式，训练获得所述用户模拟模型。

7.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至3任一所述的方法。

8.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至3任一所述的方法。