CN112597292B

CN112597292B - 问题回复推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN112597292B
Application number: CN202011607342.1A
Authority: CN
Inventors: 佘丽丽; 毛宇; 林昊; 张云云; 张文锋; 梁万山
Original assignee: Zhaolian Consumer Finance Co ltd
Current assignee: Zhaolian Consumer Finance Co ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2024-04-26
Anticipated expiration: 2040-12-29
Also published as: CN112597292A

Abstract

本申请涉及一种问题回复推荐方法、装置、计算机设备和存储介质。所述方法包括：获取待处理的目标客户问题；根据所述目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与所述目标词序列相关的多个关联问题；计算所述多个关联问题分别与所述目标客户问题之间的相似度；根据所述相似度从所述多个关联问题中筛选出满足阈值条件的候选问题；基于与各个候选问题分别对应的参考坐席回复的文本特征，对所述参考坐席回复进行聚类处理，得到多个簇；根据所述多个簇中每个簇的聚类中心点，从所述参考坐席回复中筛选出目标坐席回复进行推荐。采用本方法能够减少回复推荐的人力维护成本，并提高推荐准确性。

Description

问题回复推荐方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种问题回复推荐方法、装置、计算机设备和存储介质。

背景技术

在很多面向客户服务的行业，常常需要人工坐席或者智能客服来解决用户的问题。随着客户服务细分程度越来越高，坐席人员需要掌握的业务点多且繁杂，需要解答大量相同问题，工作量大。而且对于新手坐席，由于存在经验匮乏、业务生疏的情况，在面对客户的复杂诉求时，难使服务对象满意。

在此种场景中的困境，随着人工智能的普及，话术推荐方式被大量应用于坐席辅助领域，可以自动为人工坐席推荐回复话术，以避免新手坐席陷入上述困境。而目前的话术推荐方式，主要是基于问题识别，再通过检索相应回复话术进行推荐回复。但这种推荐方式依赖于大量的人为配置，后续一旦有新的知识出现，还需要单独配置、标注和训练，存在维护人力成本高的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够减少自动进行回复话术推荐的人力维护成本的问题回复推荐方法、装置、计算机设备和存储介质。

一种问题回复推荐方法，所述方法包括：

获取待处理的目标客户问题；

根据所述目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与所述目标词序列相关的多个关联问题；

计算所述多个关联问题分别与所述目标客户问题之间的相似度；

根据所述相似度从所述多个关联问题中筛选出满足阈值条件的候选问题；

基于与各个候选问题分别对应的参考坐席回复的文本特征，对所述参考坐席回复进行聚类处理，得到多个簇；

根据所述多个簇中每个簇的聚类中心点，从所述参考坐席回复中筛选出目标坐席回复进行推荐。

在其中一个实施例中，所述根据所述目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与所述目标词序列相关的多个关联问题，包括：

对所述目标客户问题进行分词处理，得到多个候选词；

从所述多个候选词中去除掉停用词和无实意词，得到与所述目标客户问题对应的目标词序列；

获取预先构建的问题关联模型，并根据所述目标词序列，从所述问题关联模型中查找与所述目标词序列相关联的多个关联问题。

在其中一个实施例中，所述方法还包括：

获取多个参考问答话术对，所述参考问答话术对中包括用于作为参考样例的参考问题和参考坐席回复；

对各所述参考问题分别进行分词处理，得到对应的参考词序列；

对于每组参考词序列，分别从所述参考问题中，确定与相应参考词序列具有相关性的关联问题；

基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，构建问题关联模型。

在其中一个实施例中，所述基于与各个候选问题分别对应的参考坐席回复的文本特征，对所述参考坐席回复进行聚类处理，得到多个簇，包括：

从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复；

对各所述参考坐席回复进行编码处理，得到对应的文本特征；

根据基于密度的聚类方式，对各所述参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值；

基于所述目标聚类值，对各所述参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。

在其中一个实施例中，所述对各所述参考坐席回复进行编码处理，得到对应的文本特征，包括：

对各所述参考坐席回复进行词向量编码，得到各所述参考坐席回复分别对应的词向量序列；

对各所述参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

在其中一个实施例中，所述根据所述多个簇中每个簇的聚类中心点，从所述参考坐席回复中筛选出目标坐席回复进行推荐，包括：

对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征间与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度；

对于每个簇，分别将相应簇中聚类中心点所对应的参考坐席回复，作为与相应簇对应的目标坐席回复；

按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示。

在其中一个实施例中，所述按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示，包括：

按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；

按照所述推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示。

一种问题回复推荐装置，所述装置包括：

获取模块，用于获取待处理的目标客户问题；

确定模块，用于根据所述目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与所述目标词序列相关的多个关联问题；

计算模块，用于计算所述多个关联问题分别与所述目标客户问题之间的相似度；

筛选模块，用于根据所述相似度从所述多个关联问题中筛选出满足阈值条件的候选问题；

聚类模块，用于基于与各个候选问题分别对应的参考坐席回复的文本特征，对所述参考坐席回复进行聚类处理，得到多个簇；

推荐模块，用于根据所述多个簇中每个簇的聚类中心点，从所述参考坐席回复中筛选出目标坐席回复进行推荐。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取待处理的目标客户问题；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取待处理的目标客户问题；

上述问题回复推荐方法、装置、计算机设备和存储介质，当需要对目标客户问题进行回复时，可根据该目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与该目标词序列相关的多个关联问题。进而计算多个关联问题分别与该目标客户问题之间的相似度。从而根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。对于每个候选问题，在预先收集的历史的优秀坐席话术集中存在于该候选问题相对应的参考坐席回复。从而可基于与各个候选问题分别对应的参考坐席回复的文本特征，对多个参考坐席回复进行聚类处理，得到多个簇。这样就可将每个簇的聚类中心点所对应的参考坐席回复作为该类的一个代表回复推荐给用户。这样基于历史对话记录和优秀的参考坐席回复，采用基于无监督聚类方式，召回相关历史优秀的问题回复话术以进行推荐，可以减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，在应对新问题时无需进行额外的人力维护，减少了人力成本且大大提高了话术推荐的准确性和效率。

附图说明

图1为一个实施例中问题回复推荐方法的应用环境图；

图2为一个实施例中问题回复推荐方法的流程示意图；

图3为一个具体实施例中问题回复推荐方法的流程示意图；

图4为一个实施例中问题回复推荐装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的问题回复推荐方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。终端102和服务器104可分别单独用于执行本申请提供的问题回复推荐方法；终端102和服务器104也可用于协同执行本申请提供的问题回复推荐方法。比如，人工坐席所操作的终端可接收待处理的目标客户问题，进而将该待处理的目标客户问题发送至服务器。进而服务器可根据目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与目标词序列相关的多个关联问题；计算多个关联问题分别与目标客户问题之间的相似度；根据相似度从多个关联问题中筛选出满足阈值条件的候选问题；基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇；根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐。人工坐席所操作的终端可接收服务器推荐的目标坐席回复作为参考，以对用户问题进行答复。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种问题回复推荐方法，以该方法应用于计算机设备(该计算机设备具体可以是图1中的终端102或者服务器104)为例进行说明，包括以下步骤：

步骤S202，获取待处理的目标客户问题。

其中，待处理的目标客户问题是计算机设备接收到的来自于客户发起的咨询问题。该目标客户问题具体可以是某个领域内的相关问题，比如具体可以是金融贷款领域内的业务咨询问题、关于车辆业务的咨询问题、关于电器家电类的业务咨询问题或者关于食品类的咨询问题等等，与其适用的具体应用场景相关，本申请实施例对此不作限定。

需要说明的是，对于不用的业务咨询问题，在适用本申请提供的问题回复推荐方法时，需基于该业务场景中发生的历史的优秀坐席对话等信息来进行问题关联模型的构建。

具体地，用户可通过用户终端发起业务咨询，进而计算机设备可提取到业务咨询中的目标客户问题。在其中一个实施例中，用户可通过用户账号与客服坐席所对应的客服账号进行会话，在会话的过程中，用户可基于自身的需求向客服坐席提出一些待解答的问题，具体可以是问题文本，或者是语音等。若是问题文本，计算机设备可直接将该问题文本作为待处理的目标客户问题；若是语音等，计算机设备可对该语音进行语音处理，得到对应的文本，进而将计算机设备可从得到的文本中提取出问题文本作为待处理的目标客户问题。

步骤S204，根据目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与目标词序列相关的多个关联问题。

具体地，计算机设备可预先收集多个参考问答话术对，并基于收集的参考问答话术对中的参考问题构建问题关联模型。进而，计算机设备可对目标客户问题进行分词处理，得到对应的目标词序列，从而通过预先构建的问题关联模型，召回与该目标次序列相关的多个关联问题。

在其中一个实施例中，该问题回复推荐方法还包括问题关联模型的构建步骤，该步骤具体包括：获取多个参考问答话术对，参考问答话术对中包括用于作为参考样例的参考问题和参考坐席回复；对各参考问题分别进行分词处理，得到对应的参考词序列；对于每组参考词序列，分别从参考问题中，确定与相应参考词序列具有相关性的关联问题；基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，构建问题关联模型。

具体地，在准备阶段，计算机设备可收集多个优秀客服坐席的参考问答话术对(也可称作参考QA对，其中，参考Q表示参考问题，参考A表示参考坐席回复)。进而计算机设备可对各参考问题分别进行分词处理，得到各个词，再进一步地去除掉停用词和无意义的短句、和语义助词等，得到对应的参考词序列。进而，对于每组参考词序列，计算机设备可分别从参考问题中，或者是预设的问答库中确定与各组参考词序列具有相关性的关联问题。这样，计算机设备就可基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，构建问题关联模型。

在一个实施例中，计算机设备可获取参考问答话术对中的所有参考问题所对应的参考词序列，进而将参考词序列间的语义相似度超过预设阈值的参考词序列所对应的参考问题进行关联，作为一组关联问题，进而可选取其中的一个参考词序列作为该组关联问题所对应参考词序列。这样，计算机设备可基于每个参考词序列，以及与该参考词序列相关联的多个关联问题，构建问题关联模型。在后续使用过程中，可通过该问题关联模型来查找与某一组词序列相关的多个关联问题。

在一个实施例中，计算机设备可基于BM25算法(一种基于概率检索模型的算法，是用来评价搜索词和文档之间的相关性的算法)构建问题关联模型。对于每一组参考词序列，计算机设备均可计算该组参考词序列中的每个词分别与各参考问题间的相关性。进而对于这一组参考词序列，计算机设备可累计各个词与同一个参考问题间的相关度，作为该参考词序列与该参考问题间的相关度。对于该组参考词序列，计算机设备可将相关度超过预设阈值的参考问题作为与该参考词序列相关的关联问题。

上述实施例中，通过对各参考问题进行分词处理，得到对应的参考词序列，进而对于每组参考词序列，分别从参考问题中，确定与相应参考词序列具有相关性的关联问题。这样，就可基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，迅速准确地构建问题关联模型。该问题关联模型可用于后续进行关联问题的召回。

在其中一个实施例中，步骤S204具体包括：对目标客户问题进行分词处理，得到多个候选词；从多个候选词中去除掉停用词和无实意词，得到与目标客户问题对应的目标词序列；获取预先构建的问题关联模型，并根据目标词序列，从问题关联模型中查找与目标词序列相关联的多个关联问题。

具体地，计算机设备在实际处理的过程中，可对目标客户问题进行分词处理，得到多个候选词。进而从多个候选词中去除掉停用词和无实意词，得到与目标客户问题对应的目标词序列。其中，无实意词具体可以是无意义的短句、语气助词或者连接词等。进而，计算机设备可获取预先构建的问题关联模型，并根据目标词序列，从问题关联模型中查找与目标词序列相关联的多个关联问题。

在一个实施例中，计算机设备还可基于问题关联模型召回的多个关联问题进行筛选，选择其中相关度最高的topN个关联问题。这样，可通过预先构建的问题关联模型，也可称作BM25模型，快速且准确的召回与该目标词序列相关联的多个关联问题。

步骤S206，计算多个关联问题分别与目标客户问题之间的相似度。

具体地，计算机设备可通过文本匹配模型计算各个关联问题分别与该目标客户问题之间的相似度。在一个实施例中，计算机设备可通过预训练好的孪生网络将一个待比较组中的关联问题和目标客户问题映射为对应的特征向量。进而可通过余弦相似度、欧几里得距离等算法，来计算两个特征向量之间的相似度。这两个特征之间的相似度也就是关联问题与目标客户问题之间的语义相似度。在一个实施例中，计算机设备可将关联问题所对应的特征向量，与目标客户问题所对应的特征向量间的特征向量余弦作为两个问题间的相似度。

在一个实施例中，计算机设备可将各个关联问题分别与该目标客户问题组成一个待比较组。进而可计算关联问题和目标客户问题间的词重合度，将词重合度作为该待比较组中的两个问题之间的相似度。

步骤S208，根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。

具体地，计算机设备可按照各个关联问题分别与该目标客户问题之间的相似度的大小进行从大至小的排序，选择排序在前预设名次的关联问题作为候选问题。

在另一个实施例中，计算机设备可直接将相似度大于预设相似度阈值的关联问题作为候选问题。可以理解，计算机设备筛选出的满足阈值条件的候选问题可以看作是与目标客户问题具有相同语义场景的句子。

步骤S210，基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇。

具体地，计算机设备可从预先收集的参考问答话术对中查找到与各个候选问题分别对应的参考坐席回复。进而再通过预设的编码方式或者预训练的问题特征提取模型对参考坐席回复进行处理，得到对应的文本特征。进而，计算机设备可基于各个参考坐席回复所对应的文本特征进行聚类处理，得到多个簇。

在一个实施例中，计算机设备可对各参考坐席回复进行词向量编码，得到各参考坐席回复分别对应的词向量序列，再对各参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

步骤S212，根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐。

具体地，计算机设备可确定每个簇中的聚类中心点，将各个簇中的聚类中心点所对应的参考坐席回复作为目标坐席回复，并推荐给客服坐席。

上述问题回复推荐方法，当需要对目标客户问题进行回复时，可根据该目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与该目标词序列相关的多个关联问题。进而计算多个关联问题分别与该目标客户问题之间的相似度。从而根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。对于每个候选问题，在预先收集的历史的优秀坐席话术集中存在于该候选问题相对应的参考坐席回复。从而可基于与各个候选问题分别对应的参考坐席回复的文本特征，对多个参考坐席回复进行聚类处理，得到多个簇。这样就可将每个簇的聚类中心点所对应的参考坐席回复作为该类的一个代表回复推荐给用户。这样基于历史对话记录和优秀的参考坐席回复，采用基于无监督聚类方式，召回相关历史优秀的问题回复话术以进行推荐，可以减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，在应对新问题时无需进行额外的人力维护，减少了人力成本且大大提高了话术推荐的准确性和效率。

在一个实施例中，步骤S210，也就是基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇，包括：从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复；对各参考坐席回复进行编码处理，得到对应的文本特征；根据基于密度的聚类方式，对各参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值；基于目标聚类值，对各参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。

具体地，计算机设备可从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复。进而对各参考坐席回复进行编码处理，得到对应的文本特征。计算机设备可采取多种编码方式对参考坐席回复进行编码，比如采用预训练好的神经网络模型进行编码处理，或者采用编码算法间编码处理等，本申请不作限定。

在一个实施例中，对各参考坐席回复进行编码处理，得到对应的文本特征，包括：对各参考坐席回复进行词向量编码，得到各参考坐席回复分别对应的词向量序列；对各参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

这样，计算机设备可直接对参考坐席回复进行word2vec编码+tfidf编码(词向量编码+词频编码)，提取文本特征，方便快捷。

进而，计算机设备可根据基于密度的聚类方式，对各参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值。其中，第一聚类处理具体可以是基于密度的OPTICS方式(一种基于密度的聚类算法)，得到自适应的目标聚类值，也就是k值。进而，计算机设备并可基于目标聚类值，对各参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。其中，第二聚类算法具体可以是根据得到的k值再次进行k-means聚类。

上述实施例中，对于与多个候选问题分别对应的参考坐席回复，可根据各参考坐席回复的文本特征进行两次聚类处理，以得到最终的多个聚类簇。

在一个实施例中，步骤S212，也就是根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐，包括：对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征间与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度；对于每个簇，分别将相应簇中聚类中心点所对应的参考坐席回复，作为与相应簇对应的目标坐席回复；按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示。

具体地，对于聚类得到的每个簇，计算机设备可选择每个簇中的预设数量个的句子，计算每个句子分别预聚类中心点间的距离远近，根据距离远近生成该簇的簇内紧密度。从而，计算机设备可按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示。

在一个实施例中，按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示，包括：按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；按照推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示。

具体地，计算机设备可按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级。比如，可按簇内紧密度的高低大小的顺序，设置对应的推荐优先级，也就是簇内紧密度越高，其相应的推荐优先级越靠前。进而，计算机设备可按照推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示。具体可以是先展示推荐优先级高的簇中的目标坐席回复，后展示推荐优先级低的簇中的目标坐席回复。还可以是将推荐优先级高的簇中的目标坐席回复进行加大加粗展示，而推荐优先级低的目标坐席回复正常或缩小展示等。

在一个实施例中，在对每个目标坐席回复进行展示的过程中，计算机设备可提取出各个目标坐席回复中的主题信息，并对相应的目标坐席回复中的主题信息进行高亮展示。

在一个实施例中，由于客服话术礼貌用语和安抚引导的表述较多，坐席不便看过多长回复推荐，对输出的长回复通过TextRank(一种文档排序算法)进行簇内提取主题，对主题标注高亮提醒，方便坐席抓取推荐话术的核心语义。对于每一个簇，选择聚类中心点所对应的目标坐席回复进行推荐，随后剔除用户信息。整个模型最后输出就是推荐话术和主题。

上述实施例中，通过对各个簇按照簇内紧密度的大小进行优先级设置并推荐，且在推荐时可对目标坐席回复中的主题信息进行高亮展示，便于客服坐席在非常短的时间内就可抓住目标坐席回复中的关键信息，以进行快速有效的回复，大大提高了问题回复推荐的有效性。

参考图3，图3为一个具体的实施例中问题回复推荐方法的流程示意图。如图3所示，本申请提供的问题回复推荐方法具体可以包括数据处理阶段、聚类推荐处理阶段和输出后处理阶段。

其中，在数据处理阶段：计算机设备可集成优秀坐席的参考问答话术对，对参考问答话术对进行去除自有停词、去除无意义短句，和切词。然后对参考问题进行BM25的构建，用于后续召回。

在聚类推荐处理阶段：对于待处理的目标客户问题，用BM25模型召回topN的关联问题。对每个问题，均通过提前训练好的孪生网络映射为特征向量。进而通过文本匹配模型计算目标客户问题和各关联问题之间的相似度，满足一定阈值的认为是符合该语义场景的候选问题。对候选问题所对应的参考坐席回复进行word2vec编码+tfidf编码，提取文本特征，进而将提取的文本特征输入至聚类模型中。

在聚类过程中，有以下几个步骤：1)基于密度的OPTICS方法，得到自适应的k值。2)根据得到的k值再次进行k-means聚类，选择每个簇下topN个句子，距离聚类中心的远近，根据远近距离生成簇内紧密度。3)根据紧密度排序生成推荐优先级。

在输出后处理阶段：由于客服话术礼貌用语和安抚引导的表述较多，坐席不便看过多长回复推荐，对输出的长回复通过TextRank进行簇内提取主题，对主题标注高亮提醒，方便坐席抓取推荐话术的核心语义。对于每一个簇，选择中心句进行推荐，随后剔除用户信息。整个模型最后输出就是推荐话术和主题。

本申请提出了一种基于无监督聚类的客服话术推荐算法，通过集成历史对话记录及优秀坐席话术，在对话过程中实时智能理解对话内容，召回相关历史优秀话术，并自适应生成k，通过kmeans方法聚类，自动提示不同表述方式的回复话术，减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，大大提高了回复推荐的有效性。并且，通过可以通过专业委婉的优秀话术提高客户的客服体验，改善服务水平，提高客户满意度。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种问题回复推荐装置400，包括：获取模块401、确定模块402、计算模块403、筛选模块404、聚类模块405和推荐模块406，其中：

获取模块401，用于获取待处理的目标客户问题。

确定模块402，用于根据目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与目标词序列相关的多个关联问题。

计算模块403，用于计算多个关联问题分别与目标客户问题之间的相似度。

筛选模块404，用于根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。

聚类模块405，用于基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇。

推荐模块406，用于根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐。

在其中一个实施例中，确定模块402，还用于对目标客户问题进行分词处理，得到多个候选词；从多个候选词中去除掉停用词和无实意词，得到与目标客户问题对应的目标词序列；获取预先构建的问题关联模型，并根据目标词序列，从问题关联模型中查找与目标词序列相关联的多个关联问题。

在其中一个实施例中，该问题回复推荐装置还包括构建模块，用于获取多个参考问答话术对，参考问答话术对中包括用于作为参考样例的参考问题和参考坐席回复；对各参考问题分别进行分词处理，得到对应的参考词序列；对于每组参考词序列，分别从参考问题中，确定与相应参考词序列具有相关性的关联问题；基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，构建问题关联模型。

在其中一个实施例中，聚类模块405还用于从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复；对各参考坐席回复进行编码处理，得到对应的文本特征；根据基于密度的聚类方式，对各参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值；基于目标聚类值，对各参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。

在其中一个实施例中，聚类模块405还用于对各参考坐席回复进行词向量编码，得到各参考坐席回复分别对应的词向量序列；对各参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

在其中一个实施例中，推荐模块406，还用于对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征间与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度；对于每个簇，分别将相应簇中聚类中心点所对应的参考坐席回复，作为与相应簇对应的目标坐席回复；按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示。

在其中一个实施例中，推荐模块406，按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；按照推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示。

上述问题回复推荐装置，当需要对目标客户问题进行回复时，可根据该目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与该目标词序列相关的多个关联问题。进而计算多个关联问题分别与该目标客户问题之间的相似度。从而根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。对于每个候选问题，在预先收集的历史的优秀坐席话术集中存在于该候选问题相对应的参考坐席回复。从而可基于与各个候选问题分别对应的参考坐席回复的文本特征，对多个参考坐席回复进行聚类处理，得到多个簇。这样就可将每个簇的聚类中心点所对应的参考坐席回复作为该类的一个代表回复推荐给用户。这样基于历史对话记录和优秀的参考坐席回复，采用基于无监督聚类方式，召回相关历史优秀的问题回复话术以进行推荐，可以减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，在应对新问题时无需进行额外的人力维护，减少了人力成本且大大提高了话术推荐的准确性和效率。

关于问题回复推荐装置的具体限定可以参见上文中对于问题回复推荐方法的限定，在此不再赘述。上述问题回复推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端或服务器，其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种问题回复推荐方法。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取待处理的目标客户问题；根据目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与目标词序列相关的多个关联问题；计算多个关联问题分别与目标客户问题之间的相似度；根据相似度从多个关联问题中筛选出满足阈值条件的候选问题；基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇；根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对目标客户问题进行分词处理，得到多个候选词；从多个候选词中去除掉停用词和无实意词，得到与目标客户问题对应的目标词序列；获取预先构建的问题关联模型，并根据目标词序列，从问题关联模型中查找与目标词序列相关联的多个关联问题。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取多个参考问答话术对，参考问答话术对中包括用于作为参考样例的参考问题和参考坐席回复；对各参考问题分别进行分词处理，得到对应的参考词序列；对于每组参考词序列，分别从参考问题中，确定与相应参考词序列具有相关性的关联问题；基于各组参考词序列、以及与每组参考词序列分别相关的关联问题，构建问题关联模型。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复；对各参考坐席回复进行编码处理，得到对应的文本特征；根据基于密度的聚类方式，对各参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值；基于目标聚类值，对各参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对各参考坐席回复进行词向量编码，得到各参考坐席回复分别对应的词向量序列；对各参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征间与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度；对于每个簇，分别将相应簇中聚类中心点所对应的参考坐席回复，作为与相应簇对应的目标坐席回复；按照各个簇的簇内紧密度的大小，对与各个簇分别对应的目标坐席回复进行区别展示。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；按照推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示。

上述计算机设备，当需要对目标客户问题进行回复时，可根据该目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与该目标词序列相关的多个关联问题。进而计算多个关联问题分别与该目标客户问题之间的相似度。从而根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。对于每个候选问题，在预先收集的历史的优秀坐席话术集中存在于该候选问题相对应的参考坐席回复。从而可基于与各个候选问题分别对应的参考坐席回复的文本特征，对多个参考坐席回复进行聚类处理，得到多个簇。这样就可将每个簇的聚类中心点所对应的参考坐席回复作为该类的一个代表回复推荐给用户。这样基于历史对话记录和优秀的参考坐席回复，采用基于无监督聚类方式，召回相关历史优秀的问题回复话术以进行推荐，可以减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，在应对新问题时无需进行额外的人力维护，减少了人力成本且大大提高了话术推荐的准确性和效率。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待处理的目标客户问题；根据目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与目标词序列相关的多个关联问题；计算多个关联问题分别与目标客户问题之间的相似度；根据相似度从多个关联问题中筛选出满足阈值条件的候选问题；基于与各个候选问题分别对应的参考坐席回复的文本特征，对参考坐席回复进行聚类处理，得到多个簇；根据多个簇中每个簇的聚类中心点，从参考坐席回复中筛选出目标坐席回复进行推荐。

上述存储介质，当需要对目标客户问题进行回复时，可根据该目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与该目标词序列相关的多个关联问题。进而计算多个关联问题分别与该目标客户问题之间的相似度。从而根据相似度从多个关联问题中筛选出满足阈值条件的候选问题。对于每个候选问题，在预先收集的历史的优秀坐席话术集中存在于该候选问题相对应的参考坐席回复。从而可基于与各个候选问题分别对应的参考坐席回复的文本特征，对多个参考坐席回复进行聚类处理，得到多个簇。这样就可将每个簇的聚类中心点所对应的参考坐席回复作为该类的一个代表回复推荐给用户。这样基于历史对话记录和优秀的参考坐席回复，采用基于无监督聚类方式，召回相关历史优秀的问题回复话术以进行推荐，可以减少坐席需要记忆的业务点、省去坐席手动查找的麻烦，帮助新坐席提升应答质量和服务效率，在应对新问题时无需进行额外的人力维护，减少了人力成本且大大提高了话术推荐的准确性和效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种问题回复推荐方法，其特征在于，所述方法包括：

获取待处理的目标客户问题；

对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度；

按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；簇内紧密度越大，相应的推荐优先级越靠前；

按照所述推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示；

其中，所述问题关联模型的构建步骤包括：

获取参考问答话术对中的所有参考问题所对应的参考词序列；

将参考词序列间的语义相似度超过预设阈值的参考词序列所对应的参考问题进行关联，作为一组关联问题，并选取其中的一个参考词序列作为该组关联问题所对应参考词序列；

基于每个参考词序列，以及与所述参考词序列相关联的多个关联问题，构建问题关联模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标客户问题所对应的目标词序列，从预先构建的问题关联模型中确定与所述目标词序列相关的多个关联问题，包括：

对所述目标客户问题进行分词处理，得到多个候选词；

3.根据权利要求1所述的方法，其特征在于，所述基于与各个候选问题分别对应的参考坐席回复的文本特征，对所述参考坐席回复进行聚类处理，得到多个簇，包括：

4.根据权利要求3所述的方法，其特征在于，所述对各所述参考坐席回复进行编码处理，得到对应的文本特征，包括：

5.一种问题回复推荐装置，其特征在于，所述装置包括：

获取模块，用于获取待处理的目标客户问题；

推荐模块，用于对于每个簇，分别根据各个簇所包括的参考坐席回复的文本特征与相应簇的聚类中心点间的距离，计算各个簇的簇内紧密度，对于每个簇，分别将相应簇中聚类中心点所对应的参考坐席回复，作为与相应簇对应的目标坐席回复；按照各个簇的簇内紧密度的大小，确定各个簇的推荐优先级；簇内紧密度越大，相应的推荐优先级越靠前；按照所述推荐优先级的顺序，依次对相应簇所对应的目标坐席回复进行展示，且在对每个目标坐席回复进行展示的过程中，均对相应的目标坐席回复中的主题信息进行高亮展示；

构建模块，用于获取多个参考问答话术对，所述参考问答话术对中包括用于作为参考样例的参考问题和参考坐席回复；获取参考问答话术对中的所有参考问题所对应的参考词序列；将参考词序列间的语义相似度超过预设阈值的参考词序列所对应的参考问题进行关联，作为一组关联问题，并选取其中的一个参考词序列作为该组关联问题所对应参考词序列；基于每个参考词序列，以及与所述参考词序列相关联的多个关联问题，构建问题关联模型。

6.根据权利要求5所述的装置，其特征在于，确定模块，还用于对所述目标客户问题进行分词处理，得到多个候选词；从所述多个候选词中去除掉停用词和无实意词，得到与所述目标客户问题对应的目标词序列；获取预先构建的问题关联模型，并根据所述目标词序列，从所述问题关联模型中查找与所述目标词序列相关联的多个关联问题。

7.根据权利要求5所述的装置，其特征在于，聚类模块，还用于从多个参考问答话术对中确定与各个候选问题分别对应的参考坐席回复；对各所述参考坐席回复进行编码处理，得到对应的文本特征；根据基于密度的聚类方式，对各所述参考坐席回复所对应的文本特征进行第一聚类处理，得到自适应的目标聚类值；基于所述目标聚类值，对各所述参考坐席回复所对应的文本特征进行第二聚类处理，得到多个簇。

8.根据权利要求7所述的装置，其特征在于，聚类模块，还用于对各所述参考坐席回复进行词向量编码，得到各所述参考坐席回复分别对应的词向量序列；对各所述参考坐席回复分别对应的词向量序列，分别进行词频编码，得到对应的文本特征。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。