CN112732911A

CN112732911A - 基于语义识别的话术推荐方法、装置、设备及存储介质

Info

Publication number: CN112732911A
Application number: CN202011607652.3A
Authority: CN
Inventors: 南海顺
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-04-30
Anticipated expiration: 2040-12-30
Also published as: CN112732911B; WO2022142006A1

Abstract

本申请公开了一种基于语义识别的话术推荐方法、装置、设备及存储介质，属于人工智能技术领域，所述方法通过对训练语料进行语义识别，并对训练语料进行分类，得到正样本和负样本，对正样本和负样本进行随机组合，得到训练样本集，通过训练样本集对预设的初始意图识别模型进行训练得到通话意图模型，通过将当前通话的通话内容导入通话意图模型，输出通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请还涉及区块链技术，当前通话内容可存储于区块链中。本申请通过识别客户意图以获得有效标签，并推荐与有效标签相对应的答复内容，以提高用户体验。

Description

基于语义识别的话术推荐方法、装置、设备及存储介质

技术领域

本申请属于人工智能技术领域，具体涉及一种基于语义识别的话术推荐方法、装置、设备及存储介质。

背景技术

人工智能(AI)语言是一类适应于人工智能和知识工程领域的、具有符号处理和逻辑推理能力的计算机程序设计语言。能够用它来编写程序求解非数值计算、知识处理、推理、规划、决策等具有智能的各种复杂问题。人工智能(AI)语言是一类适应于人工智能和知识工程领域的、具有符号处理和逻辑推理能力的计算机程序设计语言。能够用它来编写程序求解非数值计算、知识处理、推理、规划、决策等具有智能的各种复杂问题，典型的人工智能语言主要有LISP、Prolog、Smalltalk、C++等。

目前，对于人工智能(AI)语言应用最广泛的就是通话机器人了，而对于通话机器人来说，对话流程的设计是整个对话流程中的关键，一个好的对话流程可以让通话机器人在对话中从客户的回答中得到有效标签，使客户体验好，更能接近人工的表现。但是目前在业界中，对于任务型对话，往往是用对话节点，根据固定的标签进行流转，对话流程的设计不够灵活，客户体验差。

发明内容

本申请实施例的目的在于提出一种基于语义识别的话术推荐方法、装置、计算机设备及存储介质，以解决现有话术推荐方案采用固定的标签进行流转，对话流程的设计不够灵活，客户体验差的技术问题。

为了解决上述技术问题，本申请实施例提供一种基于语义识别的话术推荐方法，采用了如下所述的技术方案：

一种基于语义识别的话术推荐方法，包括：

从预设历史语料库中获取训练语料，并对训练语料进行语义识别，得到训练语料的语义识别结果，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息；

基于语义识别结果对训练语料进行分类，得到正样本和负样本；

对正样本和负样本进行随机组合，得到训练样本集和验证数据集；

通过训练样本集对预设的初始意图识别模型进行训练，并通过验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型；

接收意图识别指令，获取与意图识别指令对应的当前通话的通话内容；

将当前通话的通话内容导入验证通过的通话意图模型，输出与当前通话内容相匹配的通话意图；

将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。

进一步地，从预设历史语料库中获取训练语料，并对训练语料进行语义识别，得到训练语料的语义识别结果的步骤，具体包括：

从预设历史语料库中获取训练语料，并对训练语料进行预处理；

基于预设的词典库对预处理后的训练语料进行语义识别，得到训练语料的语义识别结果。

进一步地，对正样本和负样本进行随机组合，得到训练样本集和验证数据集的步骤，具体包括：

分别对正样本和负样本进行标注；

对标注后的正样本和负样本进行随机组合，得到训练样本集和验证数据集，并将训练样本集和验证数据集存储在预设历史语料库中。

进一步地，通过训练样本集对预设的初始意图识别模型进行训练的步骤，具体包括：

将训练样本集导入预设的初始意图识别模型，对训练样本集中的训练语料进行分词处理，并对分词后的训练语料进行向量特征转换处理，得到词向量；

对词向量进行卷积运算，提取词向量对应的特征数据；

计算特征数据与预设意图标签之间的相似度，并基于相似度计算结果对初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型。

进一步地，计算特征数据与预设意图标签之间的相似度，并基于相似度计算结果对初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型的步骤，具体包括：

计算特征数据与预设意图标签之间的相似度，输出相似度最大的识别结果作为训练语料对应的意图识别结果；

基于意图识别结果与预设标准结果，使用反向传播算法进行拟合，获取识别误差；

将识别误差与预设阈值进行比较，若识别误差大于预设阈值，则对通话意图模型进行迭代更新，直到识别误差小于或等于预设阈值为止；

将识别误差小于或等于预设阈值的通话意图模型作为训练完成的通话意图模型，输出训练完成的通话意图模型。

进一步地，在将识别误差小于或等于预设阈值的通话意图模型作为训练完成的通话意图模型，输出训练完成的通话意图模型的步骤之后，还包括：

获取验证数据集中的验证样本，并将验证样本导入训练完成的通话意图模型，获取模型验证结果；

将模型验证结果与验证样本的标签进行比对，根据比对结果对训练完成的通话意图模型进行验证。

进一步地，将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术的步骤，具体包括：

对通话意图进行标注，得到当前通话的意图标签；

确定与当前通话具有关联关系的所有历史通话，并获取所有历史通话对应的意图标签；

基于预设排序规则对当前通话的意图标签和所有历史通话对应的意图标签进行排序，得到意图标签序列；

将意图标签序列导入到预先训练好的话术推荐模型，输出与意图标签序列相匹配的的目标话术。

为了解决上述技术问题，本申请实施例还提供一种基于语义识别的话术推荐装置，采用了如下所述的技术方案：

一种基于语义识别的话术推荐装置，包括：

语义识别模块，用于从预设历史语料库中获取训练语料，并对训练语料进行语义识别，得到训练语料的语义识别结果，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息；

语料分类模块，用于基于语义识别结果对训练语料进行分类，得到正样本和负样本；

样本组合模块，用于对正样本和负样本进行随机组合，得到训练样本集和验证数据集；

模型训练模块，用于通过训练样本集对预设的初始意图识别模型进行训练，并通过验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型；

指令接收模块，用于接收意图识别指令，获取与意图识别指令对应的当前通话的通话内容；

意图识别模块，用于将当前通话的通话内容导入验证通过的通话意图模型，输出与当前通话内容相匹配的通话意图；

话术生成模块，用于将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，处理器执行计算机可读指令时实现如上述任一项的基于语义识别的话术推荐方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

一种计算机可读存储介质，计算机可读存储介质上存储有计算机可读指令，计算机可读指令被处理器执行时实现如上述任一项的基于语义识别的话术推荐方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：

本申请公开了一种基于语义识别的话术推荐方法、装置、设备及存储介质，属于人工智能技术领域，所述方法通过对训练语料进行语义识别，得到训练语料的语义识别结果，通过语义识别来判断训练样本的属性，基于语义识别结果对训练语料进行分类，得到正样本和负样本，其中，正样本为有效通话，负样本为无效通话，通过正负样本组成的训练样本集，并训练一个通话意图模型，通话意图模型可以识别通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请可以应用于其中的示例性系统架构图；

图2示出了根据本申请的基于语义识别的话术推荐方法的一个实施例的流程图；

图3示出了根据本申请的基于语义识别的话术推荐装置的一个实施例的结构示意图；

图4示出了根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(MovingPictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于语义识别的话术推荐方法一般由服务器执行，相应地，基于语义识别的话术推荐装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的基于语义识别的话术推荐的方法的一个实施例的流程图。所述的基于语义识别的话术推荐方法，包括以下步骤：

S201，从预设历史语料库中获取训练语料，并对训练语料进行语义识别，得到训练语料的语义识别结果，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息。

具体的，从预设历史语料库中获取训练语料，并通过预先构建的词典库对训练语料进行语义识别，得到训练语料的语义识别结果，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息。

S202，基于语义识别结果对训练语料进行分类，得到正样本和负样本。

具体的，基于语义识别结果对训练语料进行分类，得到正样本和负样本。其中，在本申请具体的实施例中，正样本为有效通话，负样本为无效通话。例如，在产品推荐场景中，一个训练语料的内容如下：

“-通话机器人：请问您对于这个产品有什么看法呢？

-用户：我觉得不错！”

针对于上述训练语料进行语义识别后，得到用户对于通话机器人提到的产品是存在一定的兴趣的，且从语义识别结果中可以看出用户对本次通过满意度较高，在本申请中，将满意度较高的训练语料作为正样本，即有效通话，为上述训练语料标注上正样本标签。又如，另一个训练语料的内容如下：

“-通话机器人：请问您对于这个产品有什么看法呢？

-用户：对不起，我没兴趣！别再给我推荐了。”

针对于上述训练语料进行语义识别后，得到用户对于通话机器人提到的产品是不感兴趣的，且从语义识别结果中可以看出用户对本次通过满意度很低。在本申请中，将满意度低的训练语料作为负样本，即无效通话，为上述训练语料标注上负样本标签。

在本申请中，基于语义识别结果对所有训练语料进行分类，将所有训练语料分为正样本和负样本，通过正、负样本随机组成的训练样本集用于训练通话意图模型，该通话意图模型识可以识别输入的通话内容对应的通话意图。例如，针对产品推荐场景，可以从通话内容中识别出用户对推荐的产品是否有购买意愿。

S203，对正样本和负样本进行随机组合，得到训练样本集和验证数据集。

具体的，可以将正样本和负样本进行随机组合，得到语料样本集，对语料样本集进行随机分组，得到训练样本集和验证数据集。训练样本集用于初始意图识别模型的模型训练，验证数据集用于对训练好的通话意图模型进行验证。

S204，通过训练样本集对预设的初始意图识别模型进行训练，并通过验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型。

其中，预设的初始意图识别模型可以采用CNN深度卷积神经网络模型，卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)，是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representation learning)能力，能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification)，因此也被称为“平移不变人工神经网络”。卷积神经网络仿造生物的视知觉(visual perception)机制构建，可以进行监督学习和非监督学习，其卷积层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-like topology)特征，例如像素和音频进行学习，有稳定的效果且对数据没有额外的特征工程要求。

具体的，得到训练样本集和验证数据集后，利用得到训练样本集中的训练样本对预设的初始意图识别模型进行训练，得到通话意图模型。在通话意图模型完成训练后，通过验证数据集对训练完成的通话意图模型进行验证，得到验证通过的通话意图模型。通话意图模型用于在通话机器人和用户的通话过程中识别用户的意图，如业务办理场景中，识别用户的办理业务的意愿。

S205，接收意图识别指令，获取与意图识别指令对应的当前通话的通话内容。

具体的，当存在意图识别需求时，接收意图识别指令，实时获取与意图识别指令对应的当前通话的通话录音，并对当前通话的通话录音进行音转文处理，得到当前通话的通话文本，对当前通话的通话文本进行预处理，得到当前通话的通话内容，其中，预处理包括纠错、去重、去除标点符号等等。

在本实施例中，基于语义识别的话术推荐方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收意图识别指令。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

S206，将当前通话的通话内容导入验证通过的通话意图模型，输出与当前通话内容相匹配的通话意图。

具体的，当用户拨打电话与通话机器人进行语音交流时，通话机器人实时将通话内容送入通话意图模型中进行用户意图识别，通过分析通话内容，获取通话意图识别结果。

S207，将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。

其中，话术推荐模型可以是一个针对意图标签序列进行识别并输出与意图标签序列相匹配的话术生成模型。在推荐话术时，可以将用户的历史通话的通话意图和相应人工坐席或者通话机器人的回复话术一起作为序列输入话术推荐模型，让话术生成能综合考虑到历史通话的通话意图。在本身具体的实施例中，话术推荐模型可以是RNN模型或者LSTM模型等等。

具体的，在训练话术推荐模型时，可以将客户多次来电的通话意图和人工坐席的回复话术做标注，对标注后该用户的多次来电的通话意图按照通话时间进行排序组成的意图标签序列，将意图标签序列与对应的人工坐席的回复话术进行映射，组合意图标签序列与映射成功的人工坐席的回复话术形成话术推荐模型的训练样本，将训练样本输入到初始话术推荐模型，得到训练好的话术推荐模型。使用时，将通话意图导入到预先训练好的话术推荐模型，获取得到与通话意图相匹配的目标话术。

目前，对于通话机器人来说，对话流程的设计是整个对话流程中的关键，一个好的对话流程可以让通话机器人在对话中从客户的回答中得到有效信息，并根据有效信息进行回复，使客户体验感更好。但是目前在业界中，对于任务型对话，通话机器人往往是使用对话节点，根据固定的标签进行流转，对话流程的设计不够灵活，客户体验差。

基于上述技术问题，本申请公开了一种基于语义识别的话术推荐方法，属于人工智能技术领域，所述方法通过对训练语料进行语义识别，得到训练语料的语义识别结果，通过语义识别来判断训练样本的属性，基于语义识别结果对训练语料进行分类，得到正样本和负样本，其中，正样本为有效通话，负样本为无效通话，通过正负样本组成的训练样本集，并训练一个通话意图模型，通话意图模型可以识别通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

具体的，从预设历史语料库中获取训练语料，并对训练语料进行预处理，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息。基于预设的词典库对预处理后的训练语料进行语义识别，得到训练语料的语义识别结果。

在上述实施例中，本申请通过预先建立一个词典库，该词典库中包含训练语料库的所有词语，每个词语对应一个唯一识别编号，利用one-hot文本表示，通过文本映射的方式获得训练语料的语义识别结果。

分别对正样本和负样本进行标注；

具体的，分别对正样本和负样本进行标注，将标注后的正样本和负样本进行随机组合，得到语料样本集。如将语料样本集中的训练语料随机分为10等份的样本子集，其中，随机组合9样本子集作为训练样本集，将剩余的样本子集作为验证数据集。将训练样本集导入到初始意图识别模型中进行模型训练，得到训练好的通话意图模型，通过验证数据集对训练好的通话意图模型进行验证，输出验证通过的通话意图模型。在上述实施例，通过构建训练样本集和验证数据集，并分别通过训练样本集和验证数据集对初始识别模型进行训练和验证，可以快速获得用户意图识别模型。

对词向量进行卷积运算，提取词向量对应的特征数据；

具体的，预设的初始意图识别模型包括输入层、卷积层和输出层。将训练样本集导入CNN模型后，首先在CNN的输入层对训练样本集的训练语料进行分词处理和向量特征转换处理，得到训练语料中每一个分词对应的词向量，然后将训练语料中每一个分词对应的词向量分别输入到CNN的卷积层进行特征提取，获得每一个分词的特征数据，最后在CNN的输出层计算特征数据与预设意图标签之间的相似度，并输出相似度最大的识别结果作为训练语料对应的意图识别结果，基于似度最大的识别结果对初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型。

在本申请具体的实施例中，识别结果通过softmax函数输出，以实现意图分类。在构建初始识别模型时，设置相应的损失函数，其中，损失函数为交叉熵损失函数，在通话意图模型训练时，通过训练的通话意图模型进行迭代更新，得到拟合的通话意图模型。其中，通话意图模型的建立及训练均可以在Python中的tensorflow库完成。

其中，反向传播算法，即误差反向传播算法(Backpropagation algorithm，BP算法)适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上，用于深度学习网络的误差计算。BP网络的输入、输出关系实质上是一种映射关系：一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射，这一映射具有高度非线性。BP算法的学习过程由正向传播过程和反向传播过程组成。在正向传播过程中，输入信息通过输入层经隐含层，逐层处理并传向输出层，并转入反向传播，逐层求出目标函数对各神经元权值的偏导数，构成目标函数对权值向量的梯量，以作为修改权值的依据。

具体的，从预设的数据库中获取训练样本集，将训练样本集导入到初始识别模型进行模型训练，输出训练语料对应的意图识别结果，基于意图识别结果与预设标准结果，使用反向传播算法进行拟合计算，获取识别误差，将识别误差与预设误差阈值进行比较，若识别误差大于预设误差阈值，则基于通话意图模型的损失函数对训练完成的通话意图模型进行迭代更新，直到识别误差小于或等于预设误差阈值为止，获取验证通过的通话意图模型。其中，预设标准结果和预设误差阈值可以提前设定。在上述实施例中，通过反向传播算法对训练完成的通话意图模型进行迭代，得到输出拟合的通话意图模型。

具体的，在通话意图模型完成迭代后，从预设历史语料库的验证数据集中获取验证样本，并将验证样本导入训练完成的通话意图模型，获取模型验证结果，将模型验证结果与验证样本的标签进行比对，根据比对结果对训练完成的通话意图模型进行验证，如果模型验证结果与验证样本的标签相互匹配，则通话意图模型的性能符合需求，否则，需要重新对正样本和负样本重新进行组合，形成新的训练样本集，并通过新的训练样本集对初始意图识别模型进行训练。

对通话意图进行标注，得到当前通话的意图标签；

具体的，基于通话时间对当前通话的意图标签和所有历史通话对应的意图标签进行排序，得到意图标签序列。例如，在贷款催收场景中，用户5次通话的意图标签序列为“接受还款、无法还款、接受还款、接受还款、无法还款”，按照预设编码规则对上述意图标签序列中的意图标签进行编码，如将“接收还款”编码为“1”，将“无法还款”编码为“0”，则上述意图标签序列编码后可以表示为“10110”，将意图标签序列的编码结果“10110”导入到预先训练好的话术推荐模型，输出与意图标签序列的编码结果“10110”相匹配的的目标话术。通过将用户的历史通话的通话意图和当前通话的通话意图组合形成意图标签序列作为序列输入话术推荐模型，让本次对话推荐时能考虑到历史通话的通话意图。

在本申请具体的实施例中，例如，当在催收客户还款时，客户当前通话表现为不配合还款的场景，并且客户在历史通话中未曾出现过类似情况时，根据客服的不同回答的可能会有不同的效果：

(1)基于当前通话的通话意图推荐与当前通话的通话意图相符合的回复话术：客户无意愿还款，推荐与无意愿还款相关的固定话术，如：

“-用户：我最近没钱，没法还。

-通话机器人：您抓紧时间想想办法，否则会影响您的征信。”

(2)基于意图标签序列推荐与意图标签序列相符合的回复话术：客户当前无意愿还款，但用户历史还款意愿高，信用较好，推荐与意图标签序列相匹配的组合话术，如：

“-用户：我最近没钱，没法还。

-通话机器人：我知道您之前还款的情况，您的信用一直很好。

-通话机器人：您最近是否遇到了一些困难？

-通话机器人：您是否需要申请延期还款？

-通话机器人：不要因为还款逾期影响您一直保持的良好信用呀！

……”

在上述实施例中，通过将用户的历史通话的通话意图和当前通话的通话意图组合形成意图标签序列作为序列输入话术推荐模型，让本次对话推荐时能考虑到历史通话的通话意图，能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

需要强调的是，为进一步保证上述当前通话内容的私密和安全性，上述当前通话内容还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种基于语义识别的话术推荐装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的基于语义识别的话术推荐装置包括：

语义识别模块301，用于从预设历史语料库中获取训练语料，并对训练语料进行语义识别，得到训练语料的语义识别结果，其中，训练语料为存储在历史语料库中的用户与通话机器人沟通过程中产生的语音信息；

语料分类模块302，用于基于语义识别结果对训练语料进行分类，得到正样本和负样本；

样本组合模块303，用于对正样本和负样本进行随机组合，得到训练样本集和验证数据集；

模型训练模块304，用于通过训练样本集对预设的初始意图识别模型进行训练，并通过验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型；

指令接收模块305，用于接收意图识别指令，获取与意图识别指令对应的当前通话的通话内容；

意图识别模块306，用于将当前通话的通话内容导入验证通过的通话意图模型，输出与当前通话内容相匹配的通话意图；

话术生成模块307，用于将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。

进一步地，语义识别模块301具体包括：

语料预处理单元，用于从预设历史语料库中获取训练语料，并对训练语料进行预处理；

语义识别单元，用于基于预设的词典库对预处理后的训练语料进行语义识别，得到训练语料的语义识别结果。

进一步地，样本组合模块303具体包括：

样本标注单元，用于分别对正样本和负样本进行标注；

样本组合单元，用于对标注后的正样本和负样本进行随机组合，得到训练样本集和验证数据集，并将训练样本集和验证数据集存储在预设历史语料库中。

进一步地，模型训练模块304具体包括：

特征转换单元，用于将训练样本集导入预设的初始意图识别模型，对训练样本集中的训练语料进行分词处理，并对分词后的训练语料进行向量特征转换处理，得到词向量；

卷积运算单元，用于对词向量进行卷积运算，提取词向量对应的特征数据；

相似度计算单元，用于计算特征数据与预设意图标签之间的相似度，并基于相似度计算结果对初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型。

进一步地，相似度计算单元具体包括：

相似度计算子单元，用于计算特征数据与预设意图标签之间的相似度，输出相似度最大的识别结果作为训练语料对应的意图识别结果；

拟合子单元，用于基于意图识别结果与预设标准结果，使用反向传播算法进行拟合，获取识别误差；

迭代子单元，用于将识别误差与预设阈值进行比较，若识别误差大于预设阈值，则对通话意图模型进行迭代更新，直到识别误差小于或等于预设阈值为止；

模型输出子单元，用于将识别误差小于或等于预设阈值的通话意图模型作为训练完成的通话意图模型，输出训练完成的通话意图模型。

进一步地，模型训练模块304还包括：

模型验证子单元，用于获取验证数据集中的验证样本，并将验证样本导入训练完成的通话意图模型，获取模型验证结果；

验证比对子单元，用于将模型验证结果与验证样本的标签进行比对，根据比对结果对训练完成的通话意图模型进行验证。

进一步地，话术生成模块307具体包括：

意图标注单元，用于对通话意图进行标注，得到当前通话的意图标签；

关联单元，用于确定与当前通话具有关联关系的所有历史通话，并获取所有历史通话对应的意图标签；

排序单元，用于基于预设排序规则对当前通话的意图标签和所有历史通话对应的意图标签进行排序，得到意图标签序列；

话术生成单元，用于将意图标签序列导入到预先训练好的话术推荐模型，输出与意图标签序列相匹配的的目标话术。

本申请公开了一种基于语义识别的话术推荐装置，属于人工智能技术领域，本申请通过对训练语料进行语义识别，得到训练语料的语义识别结果，通过语义识别来判断训练样本的属性，基于语义识别结果对训练语料进行分类，得到正样本和负样本，其中，正样本为有效通话，负样本为无效通话，通过正负样本组成的训练样本集，并训练一个通话意图模型，通话意图模型可以识别通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如基于语义识别的话术推荐方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述基于语义识别的话术推荐方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本申请公开了一种设备，属于人工智能技术领域，通过对训练语料进行语义识别，得到训练语料的语义识别结果，本申请通过语义识别来判断训练样本的属性，基于语义识别结果对训练语料进行分类，得到正样本和负样本，其中，正样本为有效通话，负样本为无效通话，通过正负样本组成的训练样本集，并训练一个通话意图模型，通话意图模型可以识别通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于语义识别的话术推荐方法的步骤。

本申请公开了一种存储介质，属于人工智能技术领域，本申请通过对训练语料进行语义识别，得到训练语料的语义识别结果，通过语义识别来判断训练样本的属性，基于语义识别结果对训练语料进行分类，得到正样本和负样本，其中，正样本为有效通话，负样本为无效通话，通过正负样本组成的训练样本集，并训练一个通话意图模型，通话意图模型可以识别通话意图，最后将通话意图导入到预先训练好的话术推荐模型，得到与通话意图相匹配的目标话术。本申请能够让通话机器人识别客户意图以获得有效意图标签，并推荐与有效意图标签相对应的答复内容，使通话机器人的答复内容更能接近人工客服的表现，提高用户体验。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种基于语义识别的话术推荐方法，其特征在于，包括：

从预设历史语料库中获取训练语料，并对所述训练语料进行语义识别，得到所述训练语料的语义识别结果，其中，所述训练语料为存储在所述历史语料库中的用户与通话机器人沟通过程中产生的语音信息；

基于所述语义识别结果对所述训练语料进行分类，得到正样本和负样本；

对所述正样本和所述负样本进行随机组合，得到训练样本集和验证数据集；

通过所述训练样本集对预设的初始意图识别模型进行训练，并通过所述验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型；

接收意图识别指令，获取与所述意图识别指令对应的当前通话的通话内容；

将所述当前通话的通话内容导入验证通过的所述通话意图模型，输出与当前通话内容相匹配的通话意图；

将所述通话意图导入到预先训练好的话术推荐模型，得到与所述通话意图相匹配的目标话术。

2.如权利要求1所述的基于语义识别的话术推荐方法，其特征在于，所述从预设历史语料库中获取训练语料，并对所述训练语料进行语义识别，得到所述训练语料的语义识别结果的步骤，具体包括：

从预设历史语料库中获取训练语料，并对所述训练语料进行预处理；

基于预设的词典库对预处理后的所述训练语料进行语义识别，得到所述训练语料的语义识别结果。

3.如权利要求1所述的基于语义识别的话术推荐方法，其特征在于，所述对所述正样本和所述负样本进行随机组合，得到训练样本集和验证数据集的步骤，具体包括：

分别对所述正样本和所述负样本进行标注；

对标注后的所述正样本和所述负样本进行随机组合，得到训练样本集和验证数据集，并将所述训练样本集和所述验证数据集存储在所述预设历史语料库中。

4.如权利要求1所述的基于语义识别的话术推荐方法，其特征在于，所述通过所述训练样本集对预设的初始意图识别模型进行训练的步骤，具体包括：

将所述训练样本集导入预设的初始意图识别模型，对所述训练样本集中的训练语料进行分词处理，并对分词后的训练语料进行向量特征转换处理，得到词向量；

对所述词向量进行卷积运算，提取所述词向量对应的特征数据；

计算所述特征数据与预设意图标签之间的相似度，并基于相似度计算结果对所述初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型。

5.如权利要求4所述的基于语义识别的话术推荐方法，其特征在于，所述计算所述特征数据与预设意图标签之间的相似度，并基于相似度计算结果对所述初始意图识别模型进行迭代更新，直至模型拟合，输出训练完成的通话意图模型的步骤，具体包括：

计算所述特征数据与预设意图标签之间的相似度，输出相似度最大的识别结果作为所述训练语料对应的意图识别结果；

6.如权利要求5所述的基于语义识别的话术推荐方法，其特征在于，在所述将识别误差小于或等于预设阈值的通话意图模型作为训练完成的通话意图模型，输出训练完成的通话意图模型的步骤之后，还包括：

获取所述验证数据集中的验证样本，并将所述验证样本导入训练完成的通话意图模型，获取模型验证结果；

将所述模型验证结果与所述验证样本的标签进行比对，根据比对结果对训练完成的通话意图模型进行验证。

7.如权利要求1至6任意一项所述的基于语义识别的话术推荐方法，其特征在于，所述将所述通话意图导入到预先训练好的话术推荐模型，得到与所述通话意图相匹配的目标话术的步骤，具体包括：

对所述通话意图进行标注，得到所述当前通话的意图标签；

确定与所述当前通话具有关联关系的所有历史通话，并获取所述所有历史通话对应的意图标签；

基于预设排序规则对所述当前通话的意图标签和所述所有历史通话对应的意图标签进行排序，得到意图标签序列；

将所述意图标签序列导入到所述预先训练好的话术推荐模型，输出与意图标签序列相匹配的的目标话术。

8.一种基于语义识别的话术推荐装置，其特征在于，包括：

语义识别模块，用于从预设历史语料库中获取训练语料，并对所述训练语料进行语义识别，得到所述训练语料的语义识别结果，其中，所述训练语料为存储在所述历史语料库中的用户与通话机器人沟通过程中产生的语音信息；

语料分类模块，用于基于所述语义识别结果对所述训练语料进行分类，得到正样本和负样本；

样本组合模块，用于对所述正样本和所述负样本进行随机组合，得到训练样本集和验证数据集；

模型训练模块，用于通过所述训练样本集对预设的初始意图识别模型进行训练，并通过所述验证数据集对完成训练的通话意图模型进行验证，获取验证通过的通话意图模型；

指令接收模块，用于接收意图识别指令，获取与所述意图识别指令对应的当前通话的通话内容；

意图识别模块，用于将所述当前通话的通话内容导入验证通过的所述通话意图模型，输出与当前通话内容相匹配的通话意图；

话术生成模块，用于将所述通话意图导入到预先训练好的话术推荐模型，得到与所述通话意图相匹配的目标话术。

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于语义识别的话术推荐方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于语义识别的话术推荐方法的步骤。