CN112417128A - 话术推荐方法、装置、计算机设备及存储介质 - Google Patents
话术推荐方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112417128A CN112417128A CN202110081534.1A CN202110081534A CN112417128A CN 112417128 A CN112417128 A CN 112417128A CN 202110081534 A CN202110081534 A CN 202110081534A CN 112417128 A CN112417128 A CN 112417128A
- Authority
- CN
- China
- Prior art keywords
- text
- question
- questions
- text feature
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,提供一种话术推荐方法、装置、计算机设备及存储介质,包括:将异议问与多个标准问进行匹配;当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问;通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问;根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术;识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。本发明能够解决现有话术数据库表无法匹配出标准话术的技术问题,话术推荐效率高。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种话术推荐方法、装置、计算机设备及存储介质。
背景技术
话术是保险销售过程中促进成交的关键一环,恰到好处的话术可以帮助客户挖掘需求,了解各个产品的特点,打消客户最深层的疑虑。
发明人在实现本发明的过程中发现,现有的保险公司的坐席使用一套定制好的话术数据库表进行保险销售,然而,话术数据库表中的话术数量有限,随着销售场景实时发生改变,多种新产品的快速面世等因素,坐席会遇到各种新的异议问,导致话术推荐模型无法实时的推荐出合适的话术,话术推荐效果差。
发明内容
鉴于以上内容,有必要提出一种话术推荐方法、装置、计算机设备及存储介质,能够解决现有话术数据库表无法匹配出标准话术的技术问题。
本发明的第一方面提供一种话术推荐方法,所述方法包括:
将异议问与多个标准问进行匹配;
当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问;
通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问;
根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术;
识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
在一个可选的实施例中,所述将异议问与多个标准问进行匹配包括:
提取所述异议问的第一文本特征矩阵,及提取每个所述标准问的第二文本特征矩阵;
截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量;
计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度;
判断多个所述文本匹配度中是否存在小于预设匹配度阈值的目标文本匹配度;
当多个所述文本匹配度中不存在所述目标文本匹配度时,确定所述异议问与所述多个标准问不匹配;
当多个所述文本匹配度中存在所述目标文本匹配度时,确定所述异议问与所述多个标准问匹配。
在一个可选的实施例中,所述截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量包括:
计算所述第一文本特征矩阵的每个第一文本特征向量的文本特征值;
对多个所述文本特征值进行倒序排序;
截取倒序排序后的多个所述文本特征值的前K个文本特征值;
将所述前K个文本特征值对应的第一文本特征向量确定为多个第一主文本特征向量;
确定每个所述第一主文本特征向量在所述第一文本特征矩阵中的位置;
获取每个所述第二文本特征矩阵中对应于所述位置的前K个第二文本特征向量,作为多个第二主文本特征向量。
在一个可选的实施例中,所述计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度包括:
计算所述多个第一主文本特征向量的文本特征值之和,得到第一文本特征和值;
计算每个所述第二文本特征矩阵中的多个第二主文本特征向量的文本特征值之和,得到第二文本特征和值;
计算所述第一文本特征和值与每个第二文本特征和值之间的差值,得到文本匹配度。
在一个可选的实施例中,所述通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问包括:
对于每个最近似的标准问,通过训练好的文本生成网络迭代多轮生成感兴趣文本,并在每轮迭代过程中通过所述文本判别网络判别所述感兴趣文本的真实度;
计算每相邻两轮生成的感兴趣文本的哈希差值,及计算每相邻两轮生成的感兴趣文本的真实度差值;
当确定所述哈希差值小于预设哈希差值阈值且所述真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本;
根据所述最近似的标准问的哈希值,从多个所述感兴趣文本中挑选出多个目标感兴趣文本;
确定所述多个目标感兴趣文本作为所述最近似的标准问的多个扩充问。
在一个可选的实施例中,所述对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术包括:
对每个所述文本内容进行分词处理,得到多个分词;
计算每个分词的热度,并根据所述热度从所述多个分词中提取出多个热词;
将包含同一热词的多个文本内容进行聚类,将聚类后的质心对应的文本内容确定为扩充话术。
在一个可选的实施例中,所述基于所述当前环节对所述多个扩充话术进行话术准确率预测包括:
根据所述当前环节、所述异议问及每个所述扩充话术生成三元数组;
基于多个所述三元数组更新话术推荐模型;
使用更新后的话术推荐模型对每个三元组进行话术准确率预测。
本发明的第二方面提供一种话术推荐装置,所述装置包括:
匹配模块,用于将异议问与多个标准问进行匹配;
确定模块,用于当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问;
生成模块,用于通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问;
搜索模块,用于根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术;
推荐模块,用于识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
本发明的第三方面提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述话术推荐方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述话术推荐方法。
综上所述,本发明所述的话术推荐方法、装置、计算机设备及存储介质,当接收到一个新的异议问时,可先根据话术数据库表确定出与新的异议问最近似的多个标准问;再借助于文本生成网络和文本判断网络的对抗,来模拟生成多个扩充问,以扩充最近似的多个标准问,最近似的标准问的自动化程度高且扩充效率高;以多个扩充问为搜索文本进行文本内容的搜索,从而可以从文本内容中提取出扩充话术,推荐给用户,辅助坐席远程沟通,话术推荐效率高,解决了无法从现有话术数据库表匹配出标准话术的技术缺陷。
附图说明
图1是本发明实施例一提供的话术推荐方法的流程图。
图2是本发明实施例二提供的话术推荐装置的结构图。
图3是本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的话术推荐方法由计算机设备执行,相应地,话术推荐装置运行于计算机设备中。
图1是本发明实施例一提供的话术推荐方法的流程图。所述话术推荐方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,将异议问与多个标准问进行匹配。
计算机设备可以是坐席的坐席端设备,还可以是与坐席端设备通讯连接的设备。计算机设备为坐席端设备时,可以实时获取坐席与客户之间的音频,计算机设备为与坐席端设备通讯连接的设备时,可以接收坐席端实时上报的坐席与客户之间的音频。
计算机设备可以采用语音分离技术对所述音频进行语音分离,得到坐席的第一语音片段及客户的第二语音片段,对所述第二语音片段进行语音识别,并从识别得到的语音文本中提取出客户的问题,作为异议问。
计算机设备中预先存储有话术数据库表,所述话术数据库表中记录有多个标准问及标准问对应的标准话术。可以将异议问与所述话术数据库表中的每一个标准问进行匹配。
在一个可选的实施例中,所述将异议问与多个标准问进行匹配包括:
提取所述异议问的第一文本特征矩阵,及提取每个所述标准问的第二文本特征矩阵;
截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量;
计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度;
判断多个所述文本匹配度中是否存在小于预设匹配度阈值的目标文本匹配度;
当多个所述文本匹配度中不存在所述目标文本匹配度时,确定所述异议问与所述多个标准问不匹配;
当多个所述文本匹配度中存在所述目标文本匹配度时,确定所述异议问与所述多个标准问匹配。
计算机设备可以将异议问输入自编码预训练语言模型BERT(BidirectionalEncoder Representation from Transformers,来自Transformer的双向编码器表征)中进行编码,得到异议问的每个字符的文本语句向量,异议问的所有字符的文本语句向量构成第一文本特征矩阵。同理,计算机设备可以事先将每个标准问输入自编码预训练语言模型BERT中进行编码,得到每一个标准问的每个字符的文本语句向量,将每个标准问的所有字符的文本语句向量构成该标准问的第二文本特征矩阵。
其中,第一主文本特征向量是指对整个第一文本特征矩阵起主要贡献作用的文本特征向量。计算机设备从所述第一文本特征矩阵中截取出多少个第一主文本特征向量,则从每个所述第二文本特征矩阵中截取出多少个第二主文本特征向量。截取出的多个第二主文本特征向量对对应的第二文本特征矩阵起主要贡献作用。
当多个所述文本匹配度中不存在所述目标文本匹配度时,表明所述话术数据库表中的任意一个标准问均与所述异议问不匹配,即所述话术数据库表中不存在与所述异议问相同或者相似的标准问。当多个所述文本匹配度中存在所述目标文本匹配度时,表明所述话术数据库表中有至少一个标准问与所述异议问匹配,即所述话术数据库表中存在至少一个与所述异议问相同或者相似的标准问。
该可选的实施例中,通过截取异议问的第一文本特征矩阵中的多个第一主文本特征向量,并根据多个第一主文本特征向量截取每个标准问的第二文本特征矩阵中的多个第二主文本特征向量,能够有效的保证多个第一主文本特征向量的数量与多个第二主文本特征向量的数量相同,便于后续计算文本匹配度;由于截取出的多个第一主文本特征向量对第一文本特征矩阵起主要贡献作用,截取出的多个第二主文本特征向量对对应的第二文本特征矩阵起主要贡献作用,因此,根据多个第一主文本特征向量及多个第二主文本特征向量计算得到的文本匹配度,能够最大程度的代表第一文本特征矩阵及第二文本特征矩阵之间的文本匹配度,即能够最大程度的代表异议问及标准问之间的文本匹配度,而多个第一主文本特征向量相较于第一文本特征矩阵的数据量大大降低,且多个第二主文本特征向量相较于第二文本特征矩阵的数据量大大降低,因此,计算文本匹配度的数据量大大减少,从而提高了文本匹配度的计算效率。
在一个可选的实施例中,所述截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量包括:
计算所述第一文本特征矩阵的每个第一文本特征向量的文本特征值;
对多个所述文本特征值进行倒序排序;
截取倒序排序后的多个所述文本特征值的前K个文本特征值;
将所述前K个文本特征值对应的第一文本特征向量确定为多个第一主文本特征向量;
确定每个所述第一主文本特征向量在所述第一文本特征矩阵中的位置;
获取每个所述第二文本特征矩阵中对应于所述位置的前K个第二文本特征向量,作为多个第二主文本特征向量。
示例性的,假设所述第一文本特征矩阵和每个所述第二文本特征矩阵的大小为20x512,则可以将所述第一文本特征矩阵和每个所述第二文本特征矩阵看作20个512维的文本特征向量。将所述第一文本特征矩阵中的20个512维的特征向量分别进行求和得到20个文本特征值,然后从20个文本特征值中选取最大的前K个第一文本特征向量,使得最大的前K个第一文本特征向量对第一文本特征矩阵的贡献度大于预设贡献度阈值,此时所述第一文本特征矩阵由20x512的尺寸缩减到了Kx512的尺寸。
其中,所述贡献度为所述前K个第一文本特征向量的文本特征值之和与所述第一文本特征矩阵中所有第一文本特征向量的文本特征值之和的比值。
根据提取的第一文本特征矩阵的前K个第一文本特征向量的位置坐标提取每个第二文本特征矩阵中对应所述位置坐标的K个第二文本特征向量。例如,所述K个(假设为3)第一文本特征向量的位置坐标分别是2、50及37,则对应提取所述第二文本特征矩阵中的第2、50及37个第二文本特征向量。
该可选的实施例中,通过对所述第一文本特征矩阵的每个第一文本特征向量的文本特征值进行倒序排序,能够快速的确定出起主要贡献作用的前K个文本特征值,而根据前K个文本特征值对应的第一文本特征向量在所述第一文本特征矩阵中的位置,从而能够快速的确定出每个第二文本特征矩阵中起主要贡献作用的多个第二主文本特征向量;而且避免了对每个第二文本特征矩阵的每个第二文本特征向量的文本特征值进行倒序排序,从而降低了对计算机设备的资源的消耗。
在一个可选的实施例中,所述计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度包括:
计算所述多个第一主文本特征向量的文本特征值之和,得到第一文本特征和值;
计算每个所述第二文本特征矩阵中的多个第二主文本特征向量的文本特征值之和,得到第二文本特征和值;
计算所述第一文本特征和值与每个第二文本特征和值之间的差值,得到文本匹配度。
所述差值越小,所述第一文本特征矩阵中的前K个第一文本特征向量与所述第二文本特征矩阵中的前K个第二文本特征向量之间的距离就越小,则异议问越与对应的标准问相似。所述差值越大,所述第一文本特征矩阵中的前K个第一文本特征向量与所述第二文本特征矩阵中的前K个第二文本特征向量之间的距离就越大,则异议问越与对应的标准问不相似。
S12,当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问。
当所述异议问与所述多个标准问匹配成功时,表明话术数据库表中存在与所述异议问相同的标准问,根据话术数据库表中记录的标准问与标准话术之间的对应关系,获取与匹配成功的标准问对应的标准话术,并同步前端显示所述标准话术。
当所述异议问与所述多个标准问匹配失败时,表明话术数据库表中不存在与所述异议问相同的标准问,则计算机设备根据异议问与标准问之间的文本匹配度对多个所述文本匹配度进行倒序排序,并将倒序排序后的前L个文本匹配度对应的标准问确定为所述异议问的多个最近似的标准问。
S13,通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问。
本实施例中,级联设置两个网络,一个文本生成网络,一个文本判别网络,所述文本生成网络用于接收一个随机的噪声,通过这个噪声生成文本,所述文本判别网络用于判别生产的文本是不是“真实的”,即输入参数是一个文本x,输出为D(x),D(x)代表x为真实文本的概率。
如果D(x)为1,就代表文本x是真实的文本。如果D(x)为0,就代表文本x不是真实的文本。
在训练过程中,文本生成网络的目标就是尽量生成真实的文本去欺骗文本判别网络,而文本判别网络的目标就是尽量把文本生成网络生成的文本和真实的文本分别开来。
在一个可选的实施例中,所述通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问包括:
对于每个最近似的标准问,通过训练好的文本生成网络迭代多轮生成感兴趣文本,并在每轮迭代过程中通过所述文本判别网络判别所述感兴趣文本的真实度;
计算每相邻两轮生成的感兴趣文本的哈希差值,及计算每相邻两轮生成的感兴趣文本的真实度差值;
当确定所述哈希差值小于预设哈希差值阈值且所述真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本;
根据所述最近似的标准问的哈希值,从多个所述感兴趣文本中挑选出多个目标感兴趣文本;
确定所述多个目标感兴趣文本作为所述最近似的标准问的多个扩充问。
计算机设备可以采用随机算法为每个最近似的标准问生成多个扩充问,所述多个扩充问作为所述异议问的标准问的数据来源。
下面来举例描述本实施例的过程:
第一轮,文本生成网络生成感兴趣文本A1,文本判别网络对所述感兴趣文本A1的真实度进行判别,并输出真实度F1;
第二轮,文本生成网络生成感兴趣文本A2,文本判别网络对所述感兴趣文本A2的真实度进行判别,并输出真实度F2;
计算第一轮生成的感兴趣文本A1的第一哈希值X1及第二轮生成的感兴趣文本A2的第二哈希值X2,则第一轮和第二轮生成的感兴趣文本的哈希差值为X1-X2,第一轮和第二轮的真实度差值为F1-F2;
判断所述哈希差值X1-X2是否小于预设哈希差值阈值且判断所述真实度差值F1-F2是否小于预设真实度差值阈值,当确定所述哈希差值X1-X2不小于预设哈希差值阈值且确定所述真实度F1-F2不小于预设真实度差值阈值时,执行第三轮过程;
第三轮,文本生成网络生成感兴趣文本A3,文本判别网络对所述感兴趣文本A3的真实度进行判别,并输出真实度F3;
计算第三轮生成的感兴趣文本A3的第三哈希值X3,则第二轮和第三轮生成的感兴趣文本的哈希差值为X2-X3,第二轮和第三轮的真实度差值为F2-F3;
判断所述哈希差值X2-X3是否小于预设哈希差值阈值且判断所述真实度F2-F3是否小于预设真实度差值阈值;当确定所述哈希差值X2-X3小于预设哈希差值阈值且确定所述真实度F2-F3小于预设真实度差值阈值时,停止第三轮的过程;当确定所述哈希差值X2-X3不小于预设哈希差值阈值且确定所述真实度F2-F3不小于预设真实度差值阈值时,执行第四轮过程;
以此类推;
直到当确定相邻两轮对应的哈希差值小于预设哈希差值阈值且对应的真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本。
在生成多个感兴趣文本之后,可以将每一个感兴趣文本的哈希与所述最近似的标准问的哈希进行匹配,从多个感兴趣文本中选取出与最近似的标准问的哈希差值小于所述预设哈希差值阈值的多个目标感兴趣文本,作为所述最近似的标准问的扩充问。哈希差值越小,表明对应的感兴趣文本与所述最近似的标准问之间越相似,哈希差值越大,表明对应的感兴趣文本与所述最近似的标准问之间越不相似。
该可选的实施例,借助于文本生成网络生成感兴趣文本,并借助于文本判别网络对生成的感兴趣文本的真实度进行判别,通过二者之间的对抗学习,能够自动化的为每一个最近似的标准问生成多个扩充问,扩充问的生成效率较高,且生成的扩充问尽可能的为真实文本,尽可能的与最近似的标准问相似,能够扩充与最近似的标准问的语义相近似的问题的数量,便于为后续异议问寻找推荐话术。
S14,根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术。
计算机设备以每个扩充问为搜索文本在各个搜索引擎上进行文本内容搜索,并从各个搜索引擎上搜索到的文本内容中提取出多个扩充话术。
在一个可选的实施例中,所述对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术包括:
对每个所述文本内容进行分词处理,得到多个分词;
计算每个分词的热度,并根据所述热度从所述多个分词中提取出多个热词;
将包含同一热词的多个文本内容进行聚类,将聚类后的质心对应的文本内容确定为扩充话术。
计算机设备可以使用结巴分词工具对文本内容进行分词处理,后删除多个分词之中的停用词、特殊符号、隐藏符号等无意义词。可以采用TF-IDF模型计算每一个分词的TF-IDF值,得到每一个分词的热度。按照从大到小的顺序对热度进行排序,并提取排序在前预设数量的热度对应的分词,作为热词,或者提取大于预设热度阈值的热度对应的分词,作为热词。
由于在实际搜索时,会存在大量文本不同但语义类似的文本内容,因此,需要针对每个热词,将包含同一个热词的多个文本内容认为是相类似的文本内容,将包含同一热词的多个文本内容进行聚类之后,即可将语义相同或者相近似的文本内容聚在一起,将语义不同的文本内容分离开来。聚类后的质心对应的文本内容则为扩充话术。
S15,识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
计算机设备可以预先根据话术数据库表训练话术推荐模型,具体为:确定每个话术对应的环节,根据标准问及对应的环节和标准话术生成第一三元组,根据标准问及对应的环节和非标准话术生成第二三元组;从多个第一三元组中随机选取出部分第一三元组和从多个第二三元组中随机选取出部分第二三元组,作为训练数据集;将剩余的第一三元组和剩余的第二三元组作为测试数据集;基于训练数据集迭代训练话术推荐模型,基于所述测试数据集测试所述话术推荐模型;在测试通过率大于预设通过率阈值后结束话术推荐模型的训练。
计算机设备可以对所述异议问进行语义解析,根据语义解析得到的结果确定当前环节,例如,开场白环节,销售环节,签名环节等。
在一个可选的实施例中,所述基于所述当前环节对所述多个扩充话术进行话术准确率预测包括:
根据所述当前环节、所述异议问及每个所述扩充话术生成三元数组;
基于多个所述三元数组更新话术推荐模型;
使用更新后的话术推荐模型对每个三元组进行话术准确率预测。
计算机设备为满足话术推荐模型输入的一致性要求,可以根据所述当前环节、所述异议问及每个所述扩充话术生成一个三元数组,将多个所述三元组加入所述训练数据集中,重新对话术推荐模型进行训练,并基于所述测试数据集测试重新训练得到的话术推荐模型;在测试通过率大于预设通过率阈值后结束话术推荐模型的训练。
输入每一个三元组至重新训练得到的话术推荐模型,输出为话术准确率预测值。话术准确率预测值越高,表明扩充话术作为所述异议问的标准话术的概率越大,话术准确率预测值越低,表明扩充话术作为所述异议问的标准话术的概率越小。将最大的一个或最大的两个话术准确率对应的扩充话术作为推荐话术,推荐给坐席,以辅助坐席与客户进行沟通。
计算机设备还可以将所述异议问与所述推荐话术关联存储于所述话术数据库表中,便于后续再接收到所述异议问时,直接同步前端展示所述推荐话术;且扩大了话术数据库表的数据量。
本发明提供的话术推荐方法,当接收到一个新的异议问时,可先根据话术数据库表确定出与新的异议问最近似的多个标准问;再借助于文本生成网络和文本判断网络的对抗,来模拟生成多个扩充问,以扩充最近似的多个标准问,最近似的标准问的自动化程度高且扩充效率高;以多个扩充问为搜索文本进行文本内容的搜索,从而可以从文本内容中提取出扩充话术,推荐给用户,辅助坐席远程沟通,话术推荐效率高,解决了无法从现有话术数据库表匹配出标准话术的技术缺陷。
需要强调的是,为进一步保证上述话术数据库表的私密性和安全性,上述话术数据库表可存储于区块链的节点中。
图2是本发明实施例二提供的话术推荐装置的结构图。
在一些实施例中,所述话术推荐装置20可以包括多个由计算机程序段所组成的功能模块。所述话术推荐装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)话术推荐的功能。
本实施例中,所述话术推荐装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:匹配模块201、确定模块202、生成模块203、搜索模块204、推荐模块205及训练模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述匹配模块201,用于将异议问与多个标准问进行匹配。
计算机设备可以是坐席的坐席端设备,还可以是与坐席端设备通讯连接的设备。计算机设备为坐席端设备时,可以实时获取坐席与客户之间的音频,计算机设备为与坐席端设备通讯连接的设备时,可以接收坐席端实时上报的坐席与客户之间的音频。
计算机设备可以采用语音分离技术对所述音频进行语音分离,得到坐席的第一语音片段及客户的第二语音片段,对所述第二语音片段进行语音识别,并从识别得到的语音文本中提取出客户的问题,作为异议问。
计算机设备中预先存储有话术数据库表,所述话术数据库表中记录有多个标准问及标准问对应的标准话术。可以将异议问与所述话术数据库表中的每一个标准问进行匹配。
在一个可选的实施例中,所述匹配模块201将异议问与多个标准问进行匹配包括:
提取所述异议问的第一文本特征矩阵,及提取每个所述标准问的第二文本特征矩阵;
截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量;
计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度;
判断多个所述文本匹配度中是否存在小于预设匹配度阈值的目标文本匹配度;
当多个所述文本匹配度中不存在所述目标文本匹配度时,确定所述异议问与所述多个标准问不匹配;
当多个所述文本匹配度中存在所述目标文本匹配度时,确定所述异议问与所述多个标准问匹配。
计算机设备可以将异议问输入自编码预训练语言模型BERT(BidirectionalEncoder Representation from Transformers,来自Transformer的双向编码器表征)中进行编码,得到异议问的每个字符的文本语句向量,异议问的所有字符的文本语句向量构成第一文本特征矩阵。同理,计算机设备可以事先将每个标准问输入自编码预训练语言模型BERT中进行编码,得到每一个标准问的每个字符的文本语句向量,将每个标准问的所有字符的文本语句向量构成该标准问的第二文本特征矩阵。
其中,第一主文本特征向量是指对整个第一文本特征矩阵起主要贡献作用的文本特征向量。计算机设备从所述第一文本特征矩阵中截取出多少个第一主文本特征向量,则从每个所述第二文本特征矩阵中截取出多少个第二主文本特征向量。截取出的多个第二主文本特征向量对对应的第二文本特征矩阵起主要贡献作用。
当多个所述文本匹配度中不存在所述目标文本匹配度时,表明所述话术数据库表中的任意一个标准问均与所述异议问不匹配,即所述话术数据库表中不存在与所述异议问相同或者相似的标准问。当多个所述文本匹配度中存在所述目标文本匹配度时,表明所述话术数据库表中有至少一个标准问与所述异议问匹配,即所述话术数据库表中存在至少一个与所述异议问相同或者相似的标准问。
该可选的实施例中,通过截取异议问的第一文本特征矩阵中的多个第一主文本特征向量,并根据多个第一主文本特征向量截取每个标准问的第二文本特征矩阵中的多个第二主文本特征向量,能够有效的保证多个第一主文本特征向量的数量与多个第二主文本特征向量的数量相同,便于后续计算文本匹配度;由于截取出的多个第一主文本特征向量对第一文本特征矩阵起主要贡献作用,截取出的多个第二主文本特征向量对对应的第二文本特征矩阵起主要贡献作用,因此,根据多个第一主文本特征向量及多个第二主文本特征向量计算得到的文本匹配度,能够最大程度的代表第一文本特征矩阵及第二文本特征矩阵之间的文本匹配度,即能够最大程度的代表异议问及标准问之间的文本匹配度,而多个第一主文本特征向量相较于第一文本特征矩阵的数据量大大降低,且多个第二主文本特征向量相较于第二文本特征矩阵的数据量大大降低,因此,计算文本匹配度的数据量大大减少,从而提高了文本匹配度的计算效率。
在一个可选的实施例中,所述截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量包括:
计算所述第一文本特征矩阵的每个第一文本特征向量的文本特征值;
对多个所述文本特征值进行倒序排序;
截取倒序排序后的多个所述文本特征值的前K个文本特征值;
将所述前K个文本特征值对应的第一文本特征向量确定为多个第一主文本特征向量;
确定每个所述第一主文本特征向量在所述第一文本特征矩阵中的位置;
获取每个所述第二文本特征矩阵中对应于所述位置的前K个第二文本特征向量,作为多个第二主文本特征向量。
示例性的,假设所述第一文本特征矩阵和每个所述第二文本特征矩阵的大小为20x512,则可以将所述第一文本特征矩阵和每个所述第二文本特征矩阵看作20个512维的文本特征向量。将所述第一文本特征矩阵中的20个512维的特征向量分别进行求和得到20个文本特征值,然后从20个文本特征值中选取最大的前K个第一文本特征向量,使得最大的前K个第一文本特征向量对第一文本特征矩阵的贡献度大于预设贡献度阈值,此时所述第一文本特征矩阵由20x512的尺寸缩减到了Kx512的尺寸。
其中,所述贡献度为所述前K个第一文本特征向量的文本特征值之和与所述第一文本特征矩阵中所有第一文本特征向量的文本特征值之和的比值。
根据提取的第一文本特征矩阵的前K个第一文本特征向量的位置坐标提取每个第二文本特征矩阵中对应所述位置坐标的K个第二文本特征向量。例如,所述K个(假设为3)第一文本特征向量的位置坐标分别是2、50及37,则对应提取所述第二文本特征矩阵中的第2、50及37个第二文本特征向量。
该可选的实施例中,通过对所述第一文本特征矩阵的每个第一文本特征向量的文本特征值进行倒序排序,能够快速的确定出起主要贡献作用的前K个文本特征值,而根据前K个文本特征值对应的第一文本特征向量在所述第一文本特征矩阵中的位置,从而能够快速的确定出每个第二文本特征矩阵中起主要贡献作用的多个第二主文本特征向量;而且避免了对每个第二文本特征矩阵的每个第二文本特征向量的文本特征值进行倒序排序,从而降低了对计算机设备的资源的消耗。
在一个可选的实施例中,所述计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度包括:
计算所述多个第一主文本特征向量的文本特征值之和,得到第一文本特征和值;
计算每个所述第二文本特征矩阵中的多个第二主文本特征向量的文本特征值之和,得到第二文本特征和值;
计算所述第一文本特征和值与每个第二文本特征和值之间的差值,得到文本匹配度。
所述差值越小,所述第一文本特征矩阵中的前K个第一文本特征向量与所述第二文本特征矩阵中的前K个第二文本特征向量之间的距离就越小,则异议问越与对应的标准问相似。所述差值越大,所述第一文本特征矩阵中的前K个第一文本特征向量与所述第二文本特征矩阵中的前K个第二文本特征向量之间的距离就越大,则异议问越与对应的标准问不相似。
所述确定模块202,用于当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问。
当所述异议问与所述多个标准问匹配成功时,表明话术数据库表中存在与所述异议问相同的标准问,根据话术数据库表中记录的标准问与标准话术之间的对应关系,获取与匹配成功的标准问对应的标准话术,并同步前端显示所述标准话术。
当所述异议问与所述多个标准问匹配失败时,表明话术数据库表中不存在与所述异议问相同的标准问,则计算机设备根据异议问与标准问之间的文本匹配度对多个所述文本匹配度进行倒序排序,并将倒序排序后的前L个文本匹配度对应的标准问确定为所述异议问的多个最近似的标准问。
所述生成模块203,用于通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问。
本实施例中,级联设置两个网络,一个文本生成网络,一个文本判别网络,所述文本生成网络用于接收一个随机的噪声,通过这个噪声生成文本,所述文本判别网络用于判别生产的文本是不是“真实的”,即输入参数是一个文本x,输出为D(x),D(x)代表x为真实文本的概率。
如果D(x)为1,就代表文本x是真实的文本。如果D(x)为0,就代表文本x不是真实的文本。
在训练过程中,文本生成网络的目标就是尽量生成真实的文本去欺骗文本判别网络,而文本判别网络的目标就是尽量把文本生成网络生成的文本和真实的文本分别开来。
在一个可选的实施例中,所述生成模块203通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问包括:
对于每个最近似的标准问,通过训练好的文本生成网络迭代多轮生成感兴趣文本,并在每轮迭代过程中通过所述文本判别网络判别所述感兴趣文本的真实度;
计算每相邻两轮生成的感兴趣文本的哈希差值,及计算每相邻两轮生成的感兴趣文本的真实度差值;
当确定所述哈希差值小于预设哈希差值阈值且所述真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本;
根据所述最近似的标准问的哈希值,从多个所述感兴趣文本中挑选出多个目标感兴趣文本;
确定所述多个目标感兴趣文本作为所述最近似的标准问的多个扩充问。
计算机设备可以采用随机算法为每个最近似的标准问生成多个扩充问,所述多个扩充问作为所述异议问的标准问的数据来源。
下面来举例描述本实施例的过程:
第一轮,文本生成网络生成感兴趣文本A1,文本判别网络对所述感兴趣文本A1的真实度进行判别,并输出真实度F1;
第二轮,文本生成网络生成感兴趣文本A2,文本判别网络对所述感兴趣文本A2的真实度进行判别,并输出真实度F2;
计算第一轮生成的感兴趣文本A1的第一哈希值X1及第二轮生成的感兴趣文本A2的第二哈希值X2,则第一轮和第二轮生成的感兴趣文本的哈希差值为X1-X2,第一轮和第二轮的真实度差值为F1-F2;
判断所述哈希差值X1-X2是否小于预设哈希差值阈值且判断所述真实度差值F1-F2是否小于预设真实度差值阈值,当确定所述哈希差值X1-X2不小于预设哈希差值阈值且确定所述真实度F1-F2不小于预设真实度差值阈值时,执行第三轮过程;
第三轮,文本生成网络生成感兴趣文本A3,文本判别网络对所述感兴趣文本A3的真实度进行判别,并输出真实度F3;
计算第三轮生成的感兴趣文本A3的第三哈希值X3,则第二轮和第三轮生成的感兴趣文本的哈希差值为X2-X3,第二轮和第三轮的真实度差值为F2-F3;
判断所述哈希差值X2-X3是否小于预设哈希差值阈值且判断所述真实度F2-F3是否小于预设真实度差值阈值;当确定所述哈希差值X2-X3小于预设哈希差值阈值且确定所述真实度F2-F3小于预设真实度差值阈值时,停止第三轮的过程;当确定所述哈希差值X2-X3不小于预设哈希差值阈值且确定所述真实度F2-F3不小于预设真实度差值阈值时,执行第四轮过程;
以此类推;
直到当确定相邻两轮对应的哈希差值小于预设哈希差值阈值且对应的真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本。
在生成多个感兴趣文本之后,可以将每一个感兴趣文本的哈希与所述最近似的标准问的哈希进行匹配,从多个感兴趣文本中选取出与最近似的标准问的哈希差值小于所述预设哈希差值阈值的多个目标感兴趣文本,作为所述最近似的标准问的扩充问。哈希差值越小,表明对应的感兴趣文本与所述最近似的标准问之间越相似,哈希差值越大,表明对应的感兴趣文本与所述最近似的标准问之间越不相似。
该可选的实施例,借助于文本生成网络生成感兴趣文本,并借助于文本判别网络对生成的感兴趣文本的真实度进行判别,通过二者之间的对抗学习,能够自动化的为每一个最近似的标准问生成多个扩充问,扩充问的生成效率较高,且生成的扩充问尽可能的为真实文本,尽可能的与最近似的标准问相似,能够扩充与最近似的标准问的语义相近似的问题的数量,便于为后续异议问寻找推荐话术。
所述搜索模块204,用于根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术。
计算机设备以每个扩充问为搜索文本在各个搜索引擎上进行文本内容搜索,并从各个搜索引擎上搜索到的文本内容中提取出多个扩充话术。
在一个可选的实施例中,所述搜索模块204对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术包括:
对每个所述文本内容进行分词处理,得到多个分词;
计算每个分词的热度,并根据所述热度从所述多个分词中提取出多个热词;
将包含同一热词的多个文本内容进行聚类,将聚类后的质心对应的文本内容确定为扩充话术。
计算机设备可以使用结巴分词工具对文本内容进行分词处理,后删除多个分词之中的停用词、特殊符号、隐藏符号等无意义词。可以采用TF-IDF模型计算每一个分词的TF-IDF值,得到每一个分词的热度。按照从大到小的顺序对热度进行排序,并提取排序在前预设数量的热度对应的分词,作为热词,或者提取大于预设热度阈值的热度对应的分词,作为热词。
由于在实际搜索时,会存在大量文本不同但语义类似的文本内容,因此,需要针对每个热词,将包含同一个热词的多个文本内容认为是相类似的文本内容,将包含同一热词的多个文本内容进行聚类之后,即可将语义相同或者相近似的文本内容聚在一起,将语义不同的文本内容分离开来。聚类后的质心对应的文本内容则为扩充话术。
所述推荐模块205,用于识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
所述训练模块206,用于根据话术数据库表训练话术推荐模型。
计算机设备可以预先根据话术数据库表训练话术推荐模型,具体为:确定每个话术对应的环节,根据标准问及对应的环节和标准话术生成第一三元组,根据标准问及对应的环节和非标准话术生成第二三元组;从多个第一三元组中随机选取出部分第一三元组和从多个第二三元组中随机选取出部分第二三元组,作为训练数据集;将剩余的第一三元组和剩余的第二三元组作为测试数据集;基于训练数据集迭代训练话术推荐模型,基于所述测试数据集测试所述话术推荐模型;在测试通过率大于预设通过率阈值后结束话术推荐模型的训练。
计算机设备可以对所述异议问进行语义解析,根据语义解析得到的结果确定当前环节,例如,开场白环节,销售环节,签名环节等。
在一个可选的实施例中,所述推荐模块205基于所述当前环节对所述多个扩充话术进行话术准确率预测包括:
根据所述当前环节、所述异议问及每个所述扩充话术生成三元数组;
基于多个所述三元数组更新话术推荐模型;
使用更新后的话术推荐模型对每个三元组进行话术准确率预测。
计算机设备为满足话术推荐模型输入的一致性要求,可以根据所述当前环节、所述异议问及每个所述扩充话术生成一个三元数组,将多个所述三元组加入所述训练数据集中,重新对话术推荐模型进行训练,并基于所述测试数据集测试重新训练得到的话术推荐模型;在测试通过率大于预设通过率阈值后结束话术推荐模型的训练。
输入每一个三元组至重新训练得到的话术推荐模型,输出为话术准确率预测值。话术准确率预测值越高,表明扩充话术作为所述异议问的标准话术的概率越大,话术准确率预测值越低,表明扩充话术作为所述异议问的标准话术的概率越小。将最大的一个或最大的两个话术准确率对应的扩充话术作为推荐话术,推荐给坐席,以辅助坐席与客户进行沟通。
计算机设备还可以将所述异议问与所述推荐话术关联存储于所述话术数据库表中,便于后续再接收到所述异议问时,直接同步前端展示所述推荐话术;且扩大了话术数据库表的数据量。
本发明提供的话术推荐装置,当接收到一个新的异议问时,可先根据话术数据库表确定出与新的异议问最近似的多个标准问;再借助于文本生成网络和文本判断网络的对抗,来模拟生成多个扩充问,以扩充最近似的多个标准问,最近似的标准问的自动化程度高且扩充效率高;以多个扩充问为搜索文本进行文本内容的搜索,从而可以从文本内容中提取出扩充话术,推荐给用户,辅助坐席远程沟通,话术推荐效率高,解决了无法从现有话术数据库表匹配出标准话术的技术缺陷。
需要强调的是,为进一步保证上述话术数据库表的私密性和安全性,上述话术数据库表可存储于区块链的节点中。
参阅图3所示,为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中,所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的计算机设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述计算机设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的话术推荐方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-OnlyMemory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述计算机设备3的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的话术推荐方法的全部或者部分步骤;或者实现话术推荐装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述计算机设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种话术推荐方法,其特征在于,所述方法包括:
将异议问与多个标准问进行匹配;
当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问;
通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问;
根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术;
识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
2.如权利要求1所述的话术推荐方法,其特征在于,所述将异议问与多个标准问进行匹配包括:
提取所述异议问的第一文本特征矩阵,及提取每个所述标准问的第二文本特征矩阵;
截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量;
计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度;
判断多个所述文本匹配度中是否存在小于预设匹配度阈值的目标文本匹配度;
当多个所述文本匹配度中不存在所述目标文本匹配度时,确定所述异议问与所述多个标准问不匹配;
当多个所述文本匹配度中存在所述目标文本匹配度时,确定所述异议问与所述多个标准问匹配。
3.如权利要求2所述的话术推荐方法,其特征在于,所述截取所述第一文本特征矩阵中的多个第一主文本特征向量,并根据所述多个第一主文本特征向量截取每个所述第二文本特征矩阵中的多个第二主文本特征向量包括:
计算所述第一文本特征矩阵的每个第一文本特征向量的文本特征值;
对多个所述文本特征值进行倒序排序;
截取倒序排序后的多个所述文本特征值的前K个文本特征值;
将所述前K个文本特征值对应的第一文本特征向量确定为多个第一主文本特征向量;
确定每个所述第一主文本特征向量在所述第一文本特征矩阵中的位置;
获取每个所述第二文本特征矩阵中对应于所述位置的前K个第二文本特征向量,作为多个第二主文本特征向量。
4.如权利要求2所述的话术推荐方法,其特征在于,所述计算所述多个第一主文本特征向量与每个所述第二文本特征矩阵中的多个第二主文本特征向量之间的文本匹配度包括:
计算所述多个第一主文本特征向量的文本特征值之和,得到第一文本特征和值;
计算每个所述第二文本特征矩阵中的多个第二主文本特征向量的文本特征值之和,得到第二文本特征和值;
计算所述第一文本特征和值与每个第二文本特征和值之间的差值,得到文本匹配度。
5.如权利要求1所述的话术推荐方法,其特征在于,所述通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问包括:
对于每个最近似的标准问,通过训练好的文本生成网络迭代多轮生成感兴趣文本,并在每轮迭代过程中通过所述文本判别网络判别所述感兴趣文本的真实度;
计算每相邻两轮生成的感兴趣文本的哈希差值,及计算每相邻两轮生成的感兴趣文本的真实度差值;
当确定所述哈希差值小于预设哈希差值阈值且所述真实度差值小于预设真实度差值阈值时,停止生成所述感兴趣文本;
根据所述最近似的标准问的哈希值,从多个所述感兴趣文本中挑选出多个目标感兴趣文本;
确定所述多个目标感兴趣文本作为所述最近似的标准问的多个扩充问。
6.如权利要求1至5中任意一项所述的话术推荐方法,其特征在于,所述对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术包括:
对每个所述文本内容进行分词处理,得到多个分词;
计算每个分词的热度,并根据所述热度从所述多个分词中提取出多个热词;
将包含同一热词的多个文本内容进行聚类,将聚类后的质心对应的文本内容确定为扩充话术。
7.如权利要求1至5中任意一项所述的话术推荐方法,其特征在于,所述基于所述当前环节对所述多个扩充话术进行话术准确率预测包括:
根据所述当前环节、所述异议问及每个所述扩充话术生成三元数组;
基于多个所述三元数组更新话术推荐模型;
使用更新后的话术推荐模型对每个三元组进行话术准确率预测。
8.一种话术推荐装置,其特征在于,所述装置包括:
匹配模块,用于将异议问与多个标准问进行匹配;
确定模块,用于当所述异议问与所述多个标准问匹配失败时,确定多个最近似的标准问;
生成模块,用于通过级联的文本生成网络和文本判别网络的对抗学习为每个最近似的标准问生成多个扩充问;
搜索模块,用于根据所述多个扩充问搜索多个文本内容,并对所述多个文本内容进行聚类,根据聚类后的质心确定多个扩充话术;
推荐模块,用于识别所述异议问对应的当前环节,基于所述当前环节对所述多个扩充话术进行话术准确率预测,并根据预测得到的话术准确率从所述多个扩充话术中筛选出推荐话术。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的话术推荐方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的话术推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081534.1A CN112417128B (zh) | 2021-01-21 | 2021-01-21 | 话术推荐方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081534.1A CN112417128B (zh) | 2021-01-21 | 2021-01-21 | 话术推荐方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112417128A true CN112417128A (zh) | 2021-02-26 |
CN112417128B CN112417128B (zh) | 2021-05-04 |
Family
ID=74782845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110081534.1A Active CN112417128B (zh) | 2021-01-21 | 2021-01-21 | 话术推荐方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417128B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989007A (zh) * | 2021-04-20 | 2021-06-18 | 平安科技(深圳)有限公司 | 基于对抗网络的知识库扩展方法、装置及计算机设备 |
CN112989046A (zh) * | 2021-03-18 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 实时话术预判方法、装置、计算机设备和存储介质 |
CN113626573A (zh) * | 2021-08-11 | 2021-11-09 | 北京深维智信科技有限公司 | 一种销售会话异议及应对提取方法及系统 |
CN113761913A (zh) * | 2021-08-23 | 2021-12-07 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN113792555A (zh) * | 2021-09-02 | 2021-12-14 | 阿里巴巴达摩院(杭州)科技有限公司 | 一种话术处理方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095162A (zh) * | 2014-05-19 | 2015-11-25 | 腾讯科技(深圳)有限公司 | 文本相似度确定方法、装置、电子设备及系统 |
CN105677783A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 智能问答系统的信息处理方法及装置 |
CN108170764A (zh) * | 2017-12-25 | 2018-06-15 | 上海大学 | 一种基于场景上下文的人机多轮对话模型构建方法 |
CN110765758A (zh) * | 2019-11-04 | 2020-02-07 | 北京小米智能科技有限公司 | 一种同义句生成模型的生成方法、装置及介质 |
US20200143265A1 (en) * | 2015-01-23 | 2020-05-07 | Conversica, Inc. | Systems and methods for automated conversations with feedback systems, tuning and context driven training |
CN111353028A (zh) * | 2020-02-20 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 用于确定客服话术簇的方法及装置 |
CN111767382A (zh) * | 2020-06-30 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 生成反馈信息的方法、装置及终端设备 |
-
2021
- 2021-01-21 CN CN202110081534.1A patent/CN112417128B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095162A (zh) * | 2014-05-19 | 2015-11-25 | 腾讯科技(深圳)有限公司 | 文本相似度确定方法、装置、电子设备及系统 |
US20200143265A1 (en) * | 2015-01-23 | 2020-05-07 | Conversica, Inc. | Systems and methods for automated conversations with feedback systems, tuning and context driven training |
CN105677783A (zh) * | 2015-12-31 | 2016-06-15 | 上海智臻智能网络科技股份有限公司 | 智能问答系统的信息处理方法及装置 |
CN108170764A (zh) * | 2017-12-25 | 2018-06-15 | 上海大学 | 一种基于场景上下文的人机多轮对话模型构建方法 |
CN110765758A (zh) * | 2019-11-04 | 2020-02-07 | 北京小米智能科技有限公司 | 一种同义句生成模型的生成方法、装置及介质 |
CN111353028A (zh) * | 2020-02-20 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 用于确定客服话术簇的方法及装置 |
CN111767382A (zh) * | 2020-06-30 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 生成反馈信息的方法、装置及终端设备 |
Non-Patent Citations (2)
Title |
---|
JINYIN CHEN ET AL: "Customizable text generation via conditional text generative", 《NEUROCOMPUTING》 * |
彭晏飞 等: "基于哈希算法及生成对抗网络的图像检索", 《激光与光电子学进展》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112989046A (zh) * | 2021-03-18 | 2021-06-18 | 中国平安人寿保险股份有限公司 | 实时话术预判方法、装置、计算机设备和存储介质 |
CN112989046B (zh) * | 2021-03-18 | 2023-07-21 | 中国平安人寿保险股份有限公司 | 实时话术预判方法、装置、计算机设备和存储介质 |
CN112989007A (zh) * | 2021-04-20 | 2021-06-18 | 平安科技(深圳)有限公司 | 基于对抗网络的知识库扩展方法、装置及计算机设备 |
CN113626573A (zh) * | 2021-08-11 | 2021-11-09 | 北京深维智信科技有限公司 | 一种销售会话异议及应对提取方法及系统 |
CN113626573B (zh) * | 2021-08-11 | 2022-09-27 | 北京深维智信科技有限公司 | 一种销售会话异议及应对提取方法及系统 |
CN113761913A (zh) * | 2021-08-23 | 2021-12-07 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN113761913B (zh) * | 2021-08-23 | 2024-02-23 | 南京优飞保科信息技术有限公司 | 一种话术文本的处理方法和系统 |
CN113792555A (zh) * | 2021-09-02 | 2021-12-14 | 阿里巴巴达摩院(杭州)科技有限公司 | 一种话术处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112417128B (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112417128B (zh) | 话术推荐方法、装置、计算机设备及存储介质 | |
CA3176868A1 (en) | Intent identifying method and device for application to intelligent customer service robot | |
CN112001175B (zh) | 流程自动化方法、装置、电子设备及存储介质 | |
US11164564B2 (en) | Augmented intent and entity extraction using pattern recognition interstitial regular expressions | |
CN114007131B (zh) | 视频监控方法、装置及相关设备 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN109462482A (zh) | 声纹识别方法、装置、电子设备及计算机可读存储介质 | |
CN111858834B (zh) | 基于ai的案件争议焦点确定方法、装置、设备及介质 | |
CN114387061A (zh) | 产品推送方法、装置、电子设备及可读存储介质 | |
US20200301908A1 (en) | Dynamic Document Reliability Formulation | |
WO2021063089A1 (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN113704410A (zh) | 情绪波动检测方法、装置、电子设备及存储介质 | |
CN116956896A (zh) | 基于人工智能的文本分析方法、系统、电子设备及介质 | |
CN113707157B (zh) | 基于声纹识别的身份验证方法、装置、电子设备及介质 | |
US11625630B2 (en) | Identifying intent in dialog data through variant assessment | |
CN113515593A (zh) | 基于聚类模型的话题检测方法、装置和计算机设备 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN114401346A (zh) | 基于人工智能的应答方法、装置、设备及介质 | |
CN115525750A (zh) | 机器人话术检测可视化方法、装置、电子设备及存储介质 | |
CN113870478A (zh) | 快速取号方法、装置、电子设备及存储介质 | |
KR20220024251A (ko) | 이벤트 라이브러리를 구축하는 방법 및 장치, 전자 기기, 및 컴퓨터 판독가능 매체 | |
CN113808577A (zh) | 语音摘要的智能提取方法、装置、电子设备及存储介质 | |
WO2022015404A1 (en) | Sample assessment | |
US20200302336A1 (en) | Dynamic Source Reliability Formulation | |
CN117198289B (zh) | 语音交互方法、装置、设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |