CN116450943A

CN116450943A - 基于人工智能的话术推荐方法、装置、设备及存储介质

Info

Publication number: CN116450943A
Application number: CN202310403559.8A
Authority: CN
Inventors: 李雨洁
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2023-04-12
Filing date: 2023-04-12
Publication date: 2023-07-18

Abstract

本申请实施例属于人工智能领域，涉及一种基于人工智能的话术推荐方法，包括：获取坐席与目标客户的通话音频数据；将通话音频数据转化为文本数据；基于意图预测模型生成与文本数据对应的意图预测结果；从通话音频数据中提取目标客户的音频图谱；基于情感分析模型生成与音频图谱对应的情感分析结果；基于文本数据、意图预测结果以及情感分析结果对话术库进行查询得到目标话术；将目标话术推送给目标客户。本申请还提供一种基于人工智能的话术推荐装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，目标话术可存储于区块链中。本申请提高了目标话术获取的效率与智能性，提升了在通话场景中话术推荐的准确性。

Description

基于人工智能的话术推荐方法、装置、设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及基于人工智能的话术推荐方法、装置、计算机设备及存储介质。

背景技术

保险“电网销”是当前以及未来很长一段时间内的行业发展趋势，也是很多保险公司进行数据化转型的主流形态。因此，在新的发展趋势下，保险公司对于坐席的沟通能力、专业能力、应变能力等方面的要求都更高了，但是，人工坐席的流动性大、培训不足也给保险公司的业绩带来了挑战，由此出现了新型电销系统。目前的新型电销系统通过为坐席提供金牌话术，方便坐席能够通过查阅金牌话术来更好地与客户进行沟通，及时处理客户请求。但是这种处理方式，需要坐席花费大量的时间从人工经验构建的金牌话术中选取所需的话术来与客户进行沟通，并且也无法保证选取的话术的准确性。因此，在坐席与客户进行通话交流时，如何向坐席准确的推荐精准的话术，成为了当前需要解决的技术问题。

发明内容

本申请实施例的目的在于提出一种基于人工智能的话术推荐方法、装置、计算机设备及存储介质，以解决现有的在坐席与客户进行通话交流时，缺乏能够向坐席准确的推荐精准的话术的手段的技术问题。

为了解决上述技术问题，本申请实施例提供一种基于人工智能的话术推荐方法，采用了如下所述的技术方案：

获取坐席与目标客户的通话音频数据；

将所述通话音频数据转化为文本数据；

基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；

从所述通话音频数据中提取所述目标客户的音频图谱；

基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；

基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术；

将所述目标话术推送给所述目标客户。

进一步的，所述基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果的步骤，具体包括：

将所述文本数据输入至所述意图预测模型内的输入层，对所述输入层内的所述文本数据进行转化处理，得到对应的转化数据；

通过所述意图预测模型内的嵌入层对所述转化数据进行向量特征转换处理，得到对应的词向量；

通过所述意图预测模型内的第一卷积层对所述词向量进行卷积运算，提取与所述词向量对应的特征数据；

通过所述意图预测模型内的第一分类层对所述特征数据进行意图分类，得到与所述文本数据对应的意图预测结果。

进一步的，所述从所述通话音频数据中提取所述目标客户的音频图谱的步骤，具体包括：

从所述通话音频数据提取与所述目标客户对应的客户音频数据；

对所述客户音频数据进行预处理，得到处理后的客户音频数据；

对所述处理后的客户音频数据进行特征提取，得到所述目标客户的音频图谱。

进一步的，所述基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果的步骤，具体包括：

将所述音频图谱输入至所述情感分析模型内的第二卷积层，通过所述第二卷积层对所述音频图谱进行卷积处理，生成与所述音频图谱对应的情感特征向量；

对所述情感特征向量进行归一化处理，得到目标情感特征向量；

将所述目标情感特征向量输入至所述情感分析模型内的长短时记忆神经网络内，通过所述长短时记忆神经网络对所述目标情感特征向量进行数据处理，生成对应的长时域情感特征；

将所述长时域情感特征输入至情感分析模型内的全连接层，通过所述全连接层对所述长时域情感特征进行处理，得到对应的目标长时域情感特征；

将所述目标长时域情感特征输入至所述情感分析模型内的第二分类层，通过所述第二分类层对所述目标长时域情感特征进行预测处理，输出与所述目标长时域情感特征对应的情感特征类别；

基于所述情感特征类别生成所述情感分析结果。

进一步的，所述基于所述情感特征类别生成所述情感分析结果的步骤，具体包括：

获取各所述情感特征类别的概率；

从所有所述情感特征类别中获取概率最大的目标情感特征类别；

将所述目标情感特征类别作为所述情感分析结果。

进一步的，所述基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术的步骤，具体包括：

从所述话术库中查找出与所述意图预测结果对应的多条第一话术，形成第一话术集合；

从所述第一话术集合中查找出与所述情感分析结果对应的多条第二话术，形成第二话术集合；

从所述第二话术集合中查找出与所述文本数据对应的第三话术；

基于所述第三话术生成所述目标话术。

进一步的，所述从所述第二话术集合中查找出与所述文本数据对应的第三话术的步骤，具体包括：

基于预设的相似度算法，计算所述文本数据与所述第二话术集合中各所述第二话术之间的相似度；

将各所述相似度与预设的相似度阈值进行比较，从所有所述第二话术中筛选出相似度大于或等于所述相似度阈值的指定话术；

将所述指定话术作为所述第三话术。

为了解决上述技术问题，本申请实施例还提供一种基于人工智能的话术推荐装置，采用了如下所述的技术方案：

获取模块，用于获取坐席与目标客户的通话音频数据；

转化模块，用于将所述通话音频数据转化为文本数据；

预测模块，用于基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；

提取模块，用于从所述通话音频数据中提取所述目标客户的音频图谱；

分析模块，用于基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；

查询模块，用于基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术；

推送模块，用于将所述目标话术推送给所述目标客户。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

获取坐席与目标客户的通话音频数据；

将所述通话音频数据转化为文本数据；

从所述通话音频数据中提取所述目标客户的音频图谱；

将所述目标话术推送给所述目标客户。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

获取坐席与目标客户的通话音频数据；

将所述通话音频数据转化为文本数据；

从所述通话音频数据中提取所述目标客户的音频图谱；

将所述目标话术推送给所述目标客户。

与现有技术相比，本申请实施例主要有以下有益效果：

本申请实施例首先获取坐席与目标客户的通话音频数据；然后将所述通话音频数据转化为文本数据；之后基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；后续从所述通话音频数据中提取所述目标客户的音频图谱，并基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；最后基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术，并将所述目标话术推送给所述目标客户。本申请实施例通过对坐席与目标客户的通话音频数据进行多个维度的信息挖掘，进而基于意图预测模型、情感分析模型以及话术库对经过挖掘得到的信息进行处理，可以实现快速准确地从话术库中查找出与通话音频数据相关的所需的目标话术，提高了目标话术获取的效率与智能性，提升了在通话场景中话术推荐的准确性。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2根据本申请的基于人工智能的话术推荐方法的一个实施例的流程图；

图3是根据本申请的基于人工智能的话术推荐装置的一个实施例的结构示意图；

图4是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于人工智能的话术推荐方法一般由服务器/终端设备执行，相应地，基于人工智能的话术推荐装置一般设置于服务器/终端设备中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的基于人工智能的话术推荐方法的一个实施例的流程图。所述的基于人工智能的话术推荐方法，包括以下步骤：

步骤S201，获取坐席与目标客户的通话音频数据。

在本实施例中，基于人工智能的话术推荐方法运行于其上的电子设备(例如图1所示的服务器/终端设备)，可以通过有线连接方式或者无线连接方式获取通话音频数据。需要指出的是，上述无线连接方式可以包括但不限于3G/4G/5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。上述通话音频数据可指坐席与目标客户在通话过程中通过录音方式采集的对话音频数据。

步骤S202，将所述通话音频数据转化为文本数据。

在本实施例中，通过ASR技术将上述通话音频数据转化为文本数据，并可分离出通话音频数据中的坐席讲话部分所对应的坐席音频和客户讲话部分所对应的客户音频。

步骤S203，基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果。

在本实施例中，上述基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

步骤S204，从所述通话音频数据中提取所述目标客户的音频图谱。

在本实施例中，上述从所述通话音频数据中提取所述目标客户的音频图谱的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

步骤S205，基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果。

在本实施例中，上述基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

步骤S206，基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术。

在本实施例中，上述基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

步骤S207，将所述目标话术推送给所述目标客户。

在本实施例中，可通过获取目标客户的客户终端信息，再基于该客户终端信息执行将所述目标话术推送给所述目标客户的处理。其中，在本次对话结束后，将文本和音频数据加入话术库，对其进行话术挖掘，同时结合行业专家经验，总结出新的坐席话术实践，帮助坐席在面对客户问题时能更好地表现出专业性，提升解决问题的效率。

本申请首先获取坐席与目标客户的通话音频数据；然后将所述通话音频数据转化为文本数据；之后基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；后续从所述通话音频数据中提取所述目标客户的音频图谱，并基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；最后基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术，并将所述目标话术推送给所述目标客户。本申请通过对坐席与目标客户的通话音频数据进行多个维度的信息挖掘，进而基于意图预测模型、情感分析模型以及话术库对经过挖掘得到的信息进行处理，可以实现快速准确地从话术库中查找出与通话音频数据相关的所需的目标话术，提高了目标话术获取的效率与智能性，提升了在通话场景中话术推荐的准确性。

在一些可选的实现方式中，步骤S203包括以下步骤：

将所述文本数据输入至所述意图预测模型内的输入层，对所述输入层内的所述文本数据进行转化处理，得到对应的转化数据。

在本实施例中，上述转化处理可指通过匹配字典的方式将文本数据转化为对应的数值数据的处理。其中，上述转化处理还可包括对文本数据的分词处理以得到对应的分词数据的处理。

通过所述意图预测模型内的嵌入层对所述转化数据进行向量特征转换处理，得到对应的词向量。

在本实施例中，上述嵌入层具体可指意图预测模型内的embedding层。

通过所述意图预测模型内的第一卷积层对所述词向量进行卷积运算，提取与所述词向量对应的特征数据。

在本实施例中，上述第一卷积层具体可指意图预测模型内的CNN层

在本实施例中，上述意图预测模型的训练过程可包括：从预设的历史通话语料库中获取训练数据；其中，所述训练数据为历史用户与坐席在通话过程中产生的语音数据所对应的文本数据；将所述训练数据进行随机分配，得到训练样本集与测试样本集；其中，预先对训练数据进行了关于意图标签的标注；基于所述训练样本集对预设的初始意图预测模型进行训练，并通过所述验证数据集对完成训练的初始意图预测模型进行验证，将验证通过的意图预测模型作为所述意图预测模型。具体地，所述初始意图预测模型具体可采用卷积神经网络，该初始意图预测模型包括输入层、嵌入层、卷积层和分类层(即输出层)。将训练样本集输入至初始意图预测模型后，首先在初始意图预测模型的输入层对训练样本集中的训练样本进行分词处理和向量特征转换处理，得到训练样本集中的训练样本内每一个分词对应的词向量，然后将训练样本内每一个分词对应的词向量分别输入到初始意图预测模型的卷积层进行特征提取，获得每一个分词的特征数据，最后在初始意图预测模型的第一分类层计算特征数据与预设意图标签之间的相似度，并输出相似度最大的识别结果作为训练样本对应的意图预测结果，进而基于意图预测结果与预设标准结果，使用反向传播算法进行拟合计算，获取识别误差，将识别误差与预设误差阈值进行比较，若识别误差大于预设误差阈值，则基于意图预测模型的损失函数对训练完成的初始意图预测模型进行迭代更新，直到识别误差小于或等于预设误差阈值为止，获取验证通过的通话预测模型。其中，意图预测结果通过softmax函数输出，以实现意图分类。在构建初始意图预测模型时，设置相应的损失函数，其中，损失函数为交叉熵损失函数，在意图预测模型训练时，通过对训练的通话意图模型进行迭代更新，得到拟合的通话意图模型。另外，。此外，意图预测模型的建立及训练均可以在Python中的tensorflow库完成。

本申请通过使用意图预测模型对所述文本数据进行预测处理，可以快速准确地生成与所述文本数据对应的意图预测结果，提高了意图预测结果的预测准确度，有利于后续可以基于得到的意图预测结果来智能地从话术库中确定出与通话音频数据相关的所需的目标话术。

在本实施例的一些可选的实现方式中，步骤S204包括以下步骤：

从所述通话音频数据提取与所述目标客户对应的客户音频数据。

在本实施例中，可冲所述通话音频数据中分离出坐席讲话部分所对应的坐席音频数据和客户讲话部分所对应的客户音频数据。

对所述客户音频数据进行预处理，得到处理后的客户音频数据。

在本实施例中，上述预处理包括预加重、分帧与加窗等处理。

在本实施例中，可通过对所述处理后的客户音频数据进行短时傅里叶变换，并按每一帧进行堆叠，得到对应的语谱图；再利用梅尔标度滤波器对所述语谱图进行滤波处理，得到与所述目标客户的音频图谱。

本申请通过从所述通话音频数据提取与所述目标客户对应的客户音频数据；然后对所述客户音频数据进行预处理，得到处理后的客户音频数据；进而对所述处理后的客户音频数据进行特征提取，得到所述目标客户的音频图谱。本申请基于梅尔标度滤波器可以实现快速准确地从通话音频数据中提取所述目标客户的音频图谱，提高了音频图谱的获取效率，有利于后续可以通过对音频图谱进行分析，以准确得到目标用户所对应的情感分析结果。

在一些可选的实现方式中，步骤S205包括以下步骤：

将所述音频图谱输入至所述情感分析模型内的第二卷积层，通过所述第二卷积层对所述音频图谱进行卷积处理，生成与所述音频图谱对应的情感特征向量。

在本实施例中，上述情感分析模型为由基于卷积神经网络(CNN)与长短时记忆神经网络(LSTM)构成的神经网络模型。通过采取了CNN和LSTM相结合的搭建的情感分析模型，能够更加充分地提取语音信号中的抽象情感特征，使得情感分类更加准确。其中，情感分析模型内至少包括卷积层、长短时记忆神经网络、全连接层以及分类层。其中，上述第二卷积层的数量包括多个。

对所述情感特征向量进行归一化处理，得到目标情感特征向量。

将所述目标情感特征向量输入至所述情感分析模型内的长短时记忆神经网络内，通过所述长短时记忆神经网络对所述目标情感特征向量进行数据处理，生成对应的长时域情感特征。

将所述长时域情感特征输入至情感分析模型内的全连接层，通过所述全连接层对所述长时域情感特征进行处理，得到对应的目标长时域情感特征。

将所述目标长时域情感特征输入至所述情感分析模型内的第二分类层，通过所述第二分类层对所述目标长时域情感特征进行预测处理，输出与所述目标长时域情感特征对应的情感特征类别。

在本实施例中，上述分类层具体可指Softmax分类层。上述情感分析模型的训练生成过程可包括：从预设的历史通话库中获取语音训练数据；对所述语音训练数据进行预处理与特征提取处理，得到对应的训练音频图谱；将所述训练音频图谱输入由CNN网络和LSTM构成的初始情感分析模型进行前向传播训练，得到预测情感特征类别y(z)；将预设的预测情感类别y’(z)作为输入对所述初始情感分析模型进行反向传播训练，得到最接近真实情感特征类别Y(z)，并根据梯度下降算法，通过调整所述初始情感分析模型的网络参数使最接近真实情感特征类别Y(z)与预测情感特征类别y(z)之间的误差小于预设值，得到训练好的初始情感分析模型，并将所述训练好的初始情感分析模型作为最终的情感分析模型。

基于所述情感特征类别生成所述情感分析结果。

在本实施例中，上述基于所述情感特征类别生成所述情感分析结果的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

本申请通过使用情感分析模型对所述音频图谱进行分析处理，以进行准确的情感识别分类，并快速准确地生成与所述音频图谱对应的情感分析结果，提高了情感分析结果的准确度，有利于后续可以基于得到的情感分析结果来智能地从话术库中确定出与通话音频数据相关的所需的目标话术。

在一些可选的实现方式中，所述基于所述情感特征类别生成所述情感分析结果，包括以下步骤：

获取各所述情感特征类别的概率。

在本实施例中，在将所述目标长时域情感特征输入至所述情感分析模型内的第二分类层后，第二分类层会输出与所述目标长时域情感特征对应的若干个概率不为零的情感特征类别。

从所有所述情感特征类别中获取概率最大的目标情感特征类别。

将所述目标情感特征类别作为所述情感分析结果。

在本实施例中，通过选择概率最大的目标情感特征类别作为情感分析结果，可以实现对目标客户的音频图谱的情感的准确识别。

本申请通过获取各所述情感特征类别的概率；进而从所有所述情感特征类别中获取概率最大的目标情感特征类别，并将所述目标情感特征类别作为所述情感分析结果。本申请通过选择概率最大的目标情感特征类别作为情感分析结果，可以实现对目标客户的音频图谱的情感的准确识别，有利于后续可以基于得到的意图预测结果来智能地从话术库中确定出与通话音频数据相关的所需的目标话术。

在本实施例的一些可选的实现方式中，步骤S206包括以下步骤：

从所述话术库中查找出与所述意图预测结果对应的多条第一话术，形成第一话术集合。

在本实施例中，上述话术库中为根据实际的使用需求创建的预设有多种话术的数据库，每一种情感状态关联有至少一条话术，且，每一种用户意图也关联有至少一条话术。当获知到客户的情感状态后，就可以根据该情感状态从话术库中查找到对应的话术；同理，当获知到客户的用户意图后，就可以根据该用户意图从话术库中查找到对应的话术。其中，上述话术库中的话术是通过经验总结而来的，举例地，当客户出现极端的负向情绪时，通过什么样的话术可以有效平复用户的情绪，是坐席以及心理学家等总结而来的。当客户具有购买保险的用户意图时，通过什么样的话术可以有效帮助用户成功购买保险，是坐席以及心理学家等总结而来的。

从所述第一话术集合中查找出与所述情感分析结果对应的多条第二话术，形成第二话术集合。

从所述第二话术集合中查找出与所述文本数据对应的第三话术。

在本实施例中，上述基于所述第三话术生成所述目标话术的具体实施过程，本申请将在后续的具体实施例中对此进行进一步的细节描述，在此不作过多阐述。

基于所述第三话术生成所述目标话术。

在本实施例中，可通过获取第三话术的数量，如果第三话术的数量小于或等于预设数量，则将该第三话术直接作为上述目标话术。如果第三话术的数量大于预设数量，则基于预设的相似度算法从所有第三话术中筛选出与文本信息的相似度最高的预设数量个的第四话术，并将所述第四话术作为所述目标话术。

本申请通过从所述话术库中查找出与所述意图预测结果对应的多条第一话术，形成第一话术集合；然后从所述第一话术集合中查找出与所述情感分析结果对应的多条第二话术，形成第二话术集合；进而从所述第二话术集合中查找出与所述文本数据对应的第三话术；最后基于所述第三话术生成所述目标话术。本申请通过从意图预测结果、情感分析结果以及文本数据对应的三个维度对话术库进行相应的查询处理，可以实现快速准确地从话术库中查找出与通话音频数据相关的所需的目标话术，提高了目标话术获取的效率与智能性。

在本实施例的一些可选的实现方式中，所述从所述第二话术集合中查找出与所述文本数据对应的第三话术，包括以下步骤：

基于预设的相似度算法，计算所述文本数据与所述第二话术集合中各所述第二话术之间的相似度。

在本实施例中，上述相似度算法可采用网上开源的相似度算法。

将各所述相似度与预设的相似度阈值进行比较，从所有所述第二话术中筛选出相似度大于或等于所述相似度阈值的指定话术。

在本实施例中，对上述相似度阈值的取值不作具体限定，可根据实际的业务使用需求进行设置，例如可设为0.88。

将所述指定话术作为所述第三话术。

本申请通过基于预设的相似度算法，计算所述文本数据与所述第二话术集合中各所述第二话术之间的相似度；然后将各所述相似度与预设的相似度阈值进行比较，从所有所述第二话术中筛选出相似度大于或等于所述相似度阈值的指定话术，并将所述指定话术作为所述第三话术。本申请在从所述第二话术集合中查找出与所述文本数据对应的第三话术后，还会进一步调用相似度算法对所述文本数据与所述第二话术集合中各所述第二话术进行相似度计算，以从语义层级判断所述文本数据与所述第二话术的相关性，并从所述第二话术中剔除掉与文本数据的关联性比较低的话术，从而得到第三话术，保证了第三话术的获取准确性与获取智能性，使得后续第三话术生成所述目标话术时，能够保证得到的目标话术的数据准确性。

需要强调的是，为进一步保证上述目标话术的私密和安全性，上述目标话术还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种基于人工智能的话术推荐装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的基于人工智能的话术推荐装置300包括：获取模块301、转化模块302、预测模块303、提取模块304、分析模块305、查询模块306以及推送模块307。其中：

获取模块301，用于获取坐席与目标客户的通话音频数据；

转化模块302，用于将所述通话音频数据转化为文本数据；

预测模块303，用于基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；

提取模块304，用于从所述通话音频数据中提取所述目标客户的音频图谱；

分析模块305，用于基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；

查询模块306，用于基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术；

推送模块307，用于将所述目标话术推送给所述目标客户。

在本实施例中，上述模块或单元分别用于执行的操作与前述实施方式的基于人工智能的话术推荐方法的步骤一一对应，在此不再赘述。

在本实施例的一些可选的实现方式中，预测模块303包括：

第一处理子模块，用于将所述文本数据输入至所述意图预测模型内的输入层，对所述输入层内的所述文本数据进行转化处理，得到对应的转化数据；

第二处理子模块，用于通过所述意图预测模型内的嵌入层对所述转化数据进行向量特征转换处理，得到对应的词向量；

运算子模块，用于通过所述意图预测模型内的第一卷积层对所述词向量进行卷积运算，提取与所述词向量对应的特征数据；

分类子模块，用于通过所述意图预测模型内的第一分类层对所述特征数据进行意图分类，得到与所述文本数据对应的意图预测结果。

在本实施例的一些可选的实现方式中,提取模块304包括：

第一提取子模块，用于从所述通话音频数据提取与所述目标客户对应的客户音频数据；

第三处理子模块，用于对所述客户音频数据进行预处理，得到处理后的客户音频数据；

第二提取子模块，用于对所述处理后的客户音频数据进行特征提取，得到所述目标客户的音频图谱。

本实施例中，上述模块或单元分别用于执行的操作与前述实施方式的基于人工智能的话术推荐方法的步骤一一对应，在此不再赘述。

在本实施例的一些可选的实现方式中，分析模块305包括：

第四处理子模块，用于将所述音频图谱输入至所述情感分析模型内的第二卷积层，通过所述第二卷积层对所述音频图谱进行卷积处理，生成与所述音频图谱对应的情感特征向量；

第五处理子模块，用于对所述情感特征向量进行归一化处理，得到目标情感特征向量；

第六处理子模块，用于将所述目标情感特征向量输入至所述情感分析模型内的长短时记忆神经网络内，通过所述长短时记忆神经网络对所述目标情感特征向量进行数据处理，生成对应的长时域情感特征；

第七处理子模块，用于将所述长时域情感特征输入至情感分析模型内的全连接层，通过所述全连接层对所述长时域情感特征进行处理，得到对应的目标长时域情感特征；

预测子模块，用于将所述目标长时域情感特征输入至所述情感分析模型内的第二分类层，通过所述第二分类层对所述目标长时域情感特征进行预测处理，输出与所述目标长时域情感特征对应的情感特征类别；

第一生成子模块，用于基于所述情感特征类别生成所述情感分析结果。

在本实施例的一些可选的实现方式中，第一生成子模块包括：

第一获取单元，用于获取各所述情感特征类别的概率；

第二获取单元，用于从所有所述情感特征类别中获取概率最大的目标情感特征类别；

第一确定单元，用于将所述目标情感特征类别作为所述情感分析结果。

在本实施例的一些可选的实现方式中，查询模块306包括：

第一查找子模块，用于从所述话术库中查找出与所述意图预测结果对应的多条第一话术，形成第一话术集合；

第二查找子模块，用于从所述第一话术集合中查找出与所述情感分析结果对应的多条第二话术，形成第二话术集合；

第三查找子模块，用于从所述第二话术集合中查找出与所述文本数据对应的第三话术；

第二生成子模块，用于基于所述第三话术生成所述目标话术。

在本实施例的一些可选的实现方式中，第三查找子模块包括：

计算单元，用于基于预设的相似度算法，计算所述文本数据与所述第二话术集合中各所述第二话术之间的相似度；

比较单元，用于将各所述相似度与预设的相似度阈值进行比较，从所有所述第二话术中筛选出相似度大于或等于所述相似度阈值的指定话术；

第二确定单元，用于将所述指定话术作为所述第三话术。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如基于人工智能的话术推荐方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述基于人工智能的话术推荐方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

与现有技术相比，本申请实施例主要有以下有益效果：

本申请实施例中，首先获取坐席与目标客户的通话音频数据；然后将所述通话音频数据转化为文本数据；之后基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果；后续从所述通话音频数据中提取所述目标客户的音频图谱，并基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果；最后基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术，并将所述目标话术推送给所述目标客户。本申请实施例通过对坐席与目标客户的通话音频数据进行多个维度的信息挖掘，进而基于意图预测模型、情感分析模型以及话术库对经过挖掘得到的信息进行处理，可以实现快速准确地从话术库中查找出与通话音频数据相关的所需的目标话术，提高了目标话术获取的效率与智能性，提升了在通话场景中话术推荐的准确性。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的基于人工智能的话术推荐方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种基于人工智能的话术推荐方法，其特征在于，包括下述步骤：

获取坐席与目标客户的通话音频数据；

将所述通话音频数据转化为文本数据；

从所述通话音频数据中提取所述目标客户的音频图谱；

将所述目标话术推送给所述目标客户。

2.根据权利要求1所述的基于人工智能的话术推荐方法，其特征在于，所述基于预设的意图预测模型对所述文本数据进行预测处理，生成与所述文本数据对应的意图预测结果的步骤，具体包括：

3.根据权利要求1所述的基于人工智能的话术推荐方法，其特征在于，所述从所述通话音频数据中提取所述目标客户的音频图谱的步骤，具体包括：

4.根据权利要求1所述的基于人工智能的话术推荐方法，其特征在于，所述基于预设的情感分析模型对所述音频图谱进行分析处理，生成与所述音频图谱对应的情感分析结果的步骤，具体包括：

基于所述情感特征类别生成所述情感分析结果。

5.根据权利要求4所述的基于人工智能的话术推荐方法，其特征在于，所述基于所述情感特征类别生成所述情感分析结果的步骤，具体包括：

获取各所述情感特征类别的概率；

将所述目标情感特征类别作为所述情感分析结果。

6.根据权利要求1所述的基于人工智能的话术推荐方法，其特征在于，所述基于所述文本数据、所述意图预测结果以及所述情感分析结果对预设的话术库进行查询处理，从所述话术库中查找出相应的目标话术的步骤，具体包括：

基于所述第三话术生成所述目标话术。

7.根据权利要求6所述的基于人工智能的话术推荐方法，其特征在于，所述从所述第二话术集合中查找出与所述文本数据对应的第三话术的步骤，具体包括：

将所述指定话术作为所述第三话术。

8.一种基于人工智能的话术推荐装置，其特征在于，包括：

获取模块，用于获取坐席与目标客户的通话音频数据；

转化模块，用于将所述通话音频数据转化为文本数据；

推送模块，用于将所述目标话术推送给所述目标客户。

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的基于人工智能的话术推荐方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于人工智能的话术推荐方法的步骤。