WO2019223058A1

WO2019223058A1 - 提高智能客服应答率的方法、设备、存储介质及装置

Info

Publication number: WO2019223058A1
Application number: PCT/CN2018/092989
Authority: WO
Inventors: 于凤英; 王健宗; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-05-22
Filing date: 2018-06-27
Publication date: 2019-11-28
Also published as: CN108804567A

Abstract

本申请公开了一种提高智能客服应答率的方法、设备、存储介质及装置，该方法包括：获取智能客服的未应答问题，对未应答问题进行分类，获得知识型问题；计算各知识型问题之间的第一相似度；根据第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；将各聚类簇的聚类中心作为目标标准问题，并获取与目标标准问题对应的目标标准回复；将目标标准问题及对应的目标标准回复添加至智能客服的知识库中。

Description

提高智能客服应答率的方法、设备、存储介质及装置

本申请要求于2018年05月22日提交中国专利局、申请号为201810499843.9、发明名称为“提高智能客服应答率的方法、设备、存储介质及装置”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及智能客服技术领域，尤其涉及一种提高智能客服应答率的方法、设备、存储介质及装置。

背景技术

随着科技的发展，智能客服系统越来越得到重视，但智能客服目前仍不能完全替代人工客服，客户提出的很多问题智能客服无法回答，使得需要投入大量的人工客服对这些问题进行解答，导致人员成本高，用户在使用智能客服进行问询时，经常得不到标准回复，又转接人工服务，导致用户体验差，因此，如何提高智能客服的应答率是亟待解决的技术问题。

上述内容仅设置为辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

发明内容

本申请的主要目的在于提供一种提高智能客服应答率的方法、设备、存储介质及装置，旨在解决现有技术中智能客服的应答率低的技术问题。

为实现上述目的，本申请提供一种提高智能客服应答率的方法，所述提高智能客服应答率的方法包括以下步骤：

获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

计算各知识型问题之间的第一相似度；

根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。

此外，为实现上述目的，本申请还提出一种提高智能客服应答率的设备，所述提高智能客服应答率的设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的提高智能客服应答率的可读指令，所述提高智能客服应答率的可读指令配置为实现如上文所述的提高智能客服应答率的方法的步骤。

此外，为实现上述目的，本申请还提出一种存储介质，所述存储介质上存储有提高智能客服应答率的可读指令，所述提高智能客服应答率的可读指令被处理器执行时实现如上文所述的提高智能客服应答率的方法的步骤。

此外，为实现上述目的，本申请还提出一种提高智能客服应答率的装置，所述提高智能客服应答率的装置包括：分类模块、计算模块、聚类模块、获取模块和添加模块；

所述分类模块，设置为获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

所述计算模块，设置为计算各知识型问题之间的第一相似度；

所述聚类模块，设置为根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

所述获取模块，设置为将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

所述添加模块，设置为将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的提高智能客服应答率的设备结构示意图；

图2为本申请提高智能客服应答率的方法第一实施例的流程示意图；

图3为本申请提高智能客服应答率的方法第二实施例的流程示意图；

图4为本申请提高智能客服应答率的方法第三实施例的流程示意图；

图5为本申请提高智能客服应答率的装置第一实施例的结构框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不设置为限定本申请。

参照图1，图1为本申请实施例方案涉及的硬件运行环境的提高智能客服应答率的设备结构示意图。

如图1所示，该提高智能客服应答率的设备可以包括：处理器1001，例如中央处理器（Central Processing Unit，CPU），通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002设置为实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display），可选用户接口1003还可以包括标准的有线接口、无线接口，对于用户接口1003的有线接口在本申请中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如无线保真（WIreless-FIdelity，WI-FI）接口）。存储器1005可以是高速的随机存取存储器（Random Access Memory，RAM）存储器，也可以是稳定的存储器（Non-volatile Memory，NVM），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对提高智能客服应答率的设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及提高智能客服应答率的可读指令。

在图1所示的提高智能客服应答率的设备中，网络接口1004主要设置为连接后台服务器，与所述后台服务器进行数据通信；用户接口1003主要设置为连接智能客服设备；所述提高智能客服应答率的设备通过处理器1001调用存储器1005中存储的提高智能客服应答率的可读指令，并执行本申请实施例提供的提高智能客服应答率的方法。

基于上述硬件结构，提出本申请提高智能客服应答率的方法的实施例。

参照图2，图2为本申请提高智能客服应答率的方法第一实施例的流程示意图，提出本申请提高智能客服应答率的方法第一实施例。

在第一实施例中，所述提高智能客服应答率的方法包括以下步骤：

步骤S10：获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题。

应理解的是，本实施例的执行主体是提高智能客服应答率的设备，其中，所述提高智能客服应答率的设备可为个人电脑、服务器等电子设备。将未应答问题划分为两类，一类为知识型问题，一类为非知识型问题。知识型问题通常都能找到对应的标准答复，可将所述知识型问题补充到知识库中。非知识型问题，比如情绪、感情等感性问题，不具有标准回复，无需进行添加考虑，没有补充入知识库的必要。因此，我们经过分类处理后，保留未应答问题中的知识型问题，以对知识型问题做后续的添加处理。

需要说明的是，对所述未应答问题进行分类，可通过构建词表，所述词表可以看做是一个巨大的集合，知识型问题的训练集文本中所有词都保存在所述词表内，在构建过程中还可计算每个词的数量、索引和类型，所述类型包括语料和标签。在词向量空间中，这些知识型问题有近似的词向量，这些近似的词向量又对应相同的分类标签，在迭代训练过程中，这种相关性会不断传播，直至训练出准确的分类模型，则可通过所述分类模型对所述未应答问题进行分类，获得所述知识型问题。

步骤S20：计算各知识型问题之间的第一相似度。

在具体实现中，可对各知识型问题进行分词，计算词的TF-IDF值作为词特征，将各知识型问题表示为词向量，计算词向量间的余弦距离作为各知识型问题之间的第一相似度度量。TF-IDF实际上是：TF * IDF，TF词频(Term Frequency)，IDF逆向文件频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是：如果包含词条t的文档越少，IDF越大，则说明词条t具有很好的类别区分能力。某一特定文档内的高词语频率，以及该词语在整个文档集合中的低文档频率，可以产生出高权重的TF-IDF。因此，TF-IDF倾向于过滤掉常见的词语，保留重要的词语。本实施例中，所述计算各知识型问题之间的第一相似度，具体包括：对各知识型问题进行分词处理，以获得所述知识型问题中所有的词语，计算所述词语的TF-IDF值；将各知识型问题表示为以词语和词语的TF-IDF值组成的词向量；计算各词向量之间的余弦距离，并将所述余弦距离作为各知识型问题之间的第一相似度。

步骤S30：根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇。

可理解的是，所述亲和传播聚类（Affinity Propagation，AP）算法，是根据数据点之间的相似度来进行聚类，可以是对称的，也可以是不对称的。所述亲和传播聚类算法不需要先确定聚类的数目，而是把所有的数据点都看成潜在意义上的聚类中心。根据各第一相似度度量可构建相似度矩阵，将各知识型问题作为节点，各知识型问题之间的第一相似度度量作为矩阵的值，然后经过AP算法进行聚类，获得多个聚类簇。

步骤S40：将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复。

需要说明的是，可从所述聚类簇中获取聚类中心，所述聚类中心与对应的聚类簇中的其他问题相似性最强，最具有该聚类簇的代表性，因此，选择聚类中心作为知识型问题的目标标准问题，聚类簇中的其他问题可作为所述目标标准问题对应的扩展问题。

应理解的是，知识型问题通常都能从现有的资料库中查找到相应的目标标准回复，可根据所述目标标准问题对现有的资料库进行查询，查询到与所述目标标准问题匹配的资料，将其作为目标标准回复。查询到与所述目标标准问题匹配的资料时，可进行人工干预，通过人工客服对匹配的资料进行整理，生成目标标准回复。

步骤S50：将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。

可理解的是，将各聚类簇中最具代表性的聚类中心作为目标标准问题，将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，使得未应答问题中具有代表性的问题能够被添加至智能客服的知识库中。

在第一实施例中，获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题，从而剔除分类获得的非知识型问题，所述非知识型问题不具有标准回复的，无需进行添加考虑，从而提高后续添加的目标标准问题的质量；通过计算所述知识型问题之间的第一相似度，根据第一相似度通过亲和传播聚类算法获得多个聚类簇，将各聚类簇的聚类中心作为目标标准问题添加至智能客服的知识库中，所述聚类中心是各聚类簇中最具有代表性的问题，将其作为目标标准问题添加至智能客服中，能够有效提高智能客服的应答率，提升用户体验。

参照图3，图3为本申请提高智能客服应答率的方法第二实施例的流程示意图，基于上述图2所示的第一实施例，提出本申请提高智能客服应答率的方法的第二实施例。

在第二实施例中，所述步骤S10，包括：

步骤S101：获取智能客服的未应答问题，计算所述未应答问题的频率，将所述频率超过第一预设阈值的未应答问题作为待处理问题。

可理解的是，获取智能客服未应答问题，统计各未应答问题出现的次数，从而获得各未应答问题的频率，通常频率低的未应答问题属于长尾问题，问题质量通常偏低，不具有参考性，通常这类问题，我们不需要进行分析。所以，可预先设置所述第一预设阈值，超过所述第一预设阈值的未应答问题为客户比较关心的问题，经常问到，此类问题具有参考性，作为待处理问题，所述待处理问题若属于知识型问题，则找到对应的标准答复，可将其补充入知识库中，若下次客户再问及相关问题，则智能客服可从知识库中查找到对应的标准答复进行应答。

步骤S102：将所述待处理问题通过预设分类模型进行分类，获得知识型问题。

需要说明的是，所述预设分类模型包括快速文本（FastText）分类模型，所述FastText分类模型包含三部分：模型架构、分层分类器（Softmax）和汉语语言模型（N-gram）特征。分层分类器Softmax建立在哈弗曼编码的基础上，对标签进行编码，能够极大地缩小模型预测目标的数量，即极大缩小所述预设分类模型预测所述待处理问题中知识型问题的数量。FastText 加入了N-gram特征，来将局部词序考虑在内，从而实现对所述待处理问题更精确的分类。

在第二实施例中，所述步骤S40之后，还包括：

步骤S401：计算所述目标标准问题与所述智能客服的知识库中的原始标准问题之间的第二相似度。

应理解的是，可将知识库中各原始标准问题进行分词，计算词的TF-IDF值，将各原始标准问题表示为以词语和词语的TF-IDF值组成的词向量，计算各原始标准问题对应的词向量与所述目标标准问题对应的词向量之间的余弦距离，并将该余弦距离作为所述第二相似度。

步骤S402：获取所述第二相似度中的最大值，判断所述最大值是否超过第二预设阈值。

可理解的是，获取所述第二相似度中的最大值，该最大值对应的原始标准问题与所述目标标准问题最相近，判断所述最大值是否超过第二预设阈值，若超过所述第二预设阈值，说明所述目标标准问题与知识库中该最大值对应的原始标准问题相关性很高。

步骤S403：若所述最大值超过所述第二预设阈值，获取所述最大值对应的原始标准问题作为待补充问题。

需要说明的是，若所述最大值超过所述第二预设阈值，比如所述第二预设阈值为80%，若所述最大值为81%超过80%，则认为所述最大值对应的原始标准问题与所述目标标准问题相关性很高，甚至可能本质上是同一个问题，只是表述上存在差异，可建议将所述目标标准问题与该最大值对应的原始标准问题进行合并，将所述最大值对应的原始标准问题作为待补充问题，则将所述目标标准问题作为所述待补充问题的扩展问题补充到知识库中。

相应地，所述步骤S50，具体包括：

步骤S501：将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中。

在具体实现中，所述第二相似度中的最大值若超过所述第二预设阈值，说明所述最大值对应的原始标准问题与所述目标标准问题相关性很高，则可将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中，在用户问询到所述待补充问题或所述待补充问题的扩展问题列表中的某个问题时，智能客服可将所述待补充问题的扩展问题列表中的其他问题也进行展示，从而更全面的为用户提供想咨询问题的相关资料信息。

在第二实施例中，根据所述未应答问题的频率，将所述频率超过第一预设阈值的未应答问题作为待处理问题，从而将所述待处理问题进行分类获得知识型问题，将频率低的未应答问题进行了剔除，减少后续确定目标标准问题的工作量的同时提高知识库补充的目标标准问题的质量；计算所述目标标准问题与所述智能客服的知识库中的原始标准问题之间的第二相似度，若所述第二相似度中的最大值超过所述第二预设阈值，取所述最大值对应的原始标准问题作为待补充问题，将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中，从而更全面的为用户提供想咨询问题的相关资料信息。

参照图4，图4为本申请提高智能客服应答率的方法第三实施例的流程示意图，基于上述图3所示的第二实施例，提出本申请提高智能客服应答率的方法的第三实施例。

在第三实施例中，所述步骤S402之后，还包括：

步骤S404：若所述最大值未超过所述第二预设阈值，将各聚类簇中除了目标标准问题之外的其他知识型问题作为第一扩展问题。

应理解的是，若所述第二相似度中的最大值未超过所述第二预设阈值，说明所述最大值对应的原始标准问题与所述目标标准问题相关性不高，则可将所述目标标准问题以独立问题形式添加至所述知识库中。所述知识库中的各问题都是以原始标准问题及对应的扩展问题列表的形式存储，以便用户问询到某个原始标准问题或其扩展问题列表中的某个问题时，智能客服可将所述原始标准问题和对应的扩展问题列表中的其他问题也进行展示，从而更全面的为用户提供想咨询问题的相关资料信息。

可理解的是，所述目标标准问题可作为独立问题形式添加至所述知识库中，则所述目标标准问题对应的聚类簇中除了所述目标标准问题之外的其他知识型问题作为第一扩展问题，所述第一扩展问题可作为所述目标标准问题的扩展问题列表中的问题。

步骤S405：计算所述第一扩展问题与对应的目标标准问题之间的第三相似度。

需要说明的是，各聚类簇中的问题可能数量较多，无需将各聚类簇中的所有问题都作为所述目标标准问题的扩展问题一同添加至所述知识库中。则可计算所述第一扩展问题与对应的目标标准问题之间的第三相似度，将所述第三相似度的数值较大的第一扩展问题作为所述目标标准问题的扩展问题列表中的问题。

本实施例中，所述步骤S405，包括：计算所述第一扩展问题与对应的目标标准问题之间的统计特征、语义特征和主题特征；通过逻辑回归将所述统计特征、所述语义特征和所述主题特征进行聚合，获得所述第一扩展问题与对应的目标标准问题之间的第三相似度。其中，所述统计特征包括：词共现率、TF-IDF值、编辑距离和最长公共子串。可计算所述第一扩展问题与对应的目标标准问题之间的词共现率、TF-IDF值、编辑距离和最长公共子串作为所述统计特征。基于长短期记忆网络（Long Short-Term Memory，LSTM）构建所述第一扩展问题及所述目标标准问题的向量，计算所述向量之间的余弦相似度，将该余弦相似度作为所述语义特征。通过文档主题生成模型（Latent Dirichlet Allocation，LDA）对所述第一扩展问题和对应的目标标准问题进行对应的主题特征的生成。所述逻辑回归（Logistic Regression，LR）在线性回归的基础上，套用了一个逻辑函数，通过所述逻辑回归可将所述统计特征、所述语义特征和所述主题特征进行聚合，获得所述第一扩展问题与对应的目标标准问题之间的第三相似度。

步骤S406：按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题作为所述目标标准问题的扩展问题列表，所述N为大于或等于1的整数。

在具体实现中，为了避免添加过多质量并不高的问题在所述目标标准问题的扩展问题列表中，通常可按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题，所述N为大于或等于1的整数，也就是说，将与所述目标标准问题相似程度大的N个第一扩展问题作为所述目标标准问题的扩展问题列表。

在第三实施例中，所述步骤S50，具体包括：

步骤S502：将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中。

需要说明的是，所述第二相似度中的最大值未超过所述第二预设阈值，说明所述最大值对应的原始标准问题与所述目标标准问题相关性不高，则将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中，用户下次再问询所述目标标准问题相关的问题时，所述智能客服可从知识库中查找到所述目标标准问题及对应的扩展问题列表，从而实现应答用户。

在第三实施例中，若所述最大值未超过所述第二预设阈值，将各聚类簇中除了目标标准问题之外的其他知识型问题作为第一扩展问题，计算所述第一扩展问题与对应的目标标准问题之间的第三相似度，按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题作为所述目标标准问题的扩展问题列表，将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中，使得用户下次再问询所述目标标准问题相关的问题时，所述智能客服可从知识库中查找到所述目标标准问题及对应的扩展问题列表，从而实现应答用户，提升用户体验。

此外，本申请实施例还提出一种存储介质，所述存储介质上存储有提高智能客服应答率的可读指令，所述提高智能客服应答率的可读指令被处理器执行时实现如上文所述的提高智能客服应答率的方法的步骤。所述存储介质可以为非易失性可读存储介质。

此外，参照图5，本申请实施例还提出一种提高智能客服应答率的装置，所述提高智能客服应答率的装置包括：分类模块10、计算模块20、聚类模块30、获取模块40和添加模块50；

所述分类模块10，设置为获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

所述计算模块20，设置为计算各知识型问题之间的第一相似度；

所述聚类模块30，设置为根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

所述获取模块40，设置为将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

所述添加模块50，设置为将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。

本申请提高智能客服应答率的装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器镜像（Read Only Memory image，ROM）/随机存取存储器（Random Access Memory，RAM）、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种提高智能客服应答率的方法，其中，所述提高智能客服应答率的方法包括以下步骤：

获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

计算各知识型问题之间的第一相似度；

根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。
如权利要求1所述的提高智能客服应答率的方法，其中，所述获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题，包括：

获取智能客服的未应答问题，计算所述未应答问题的频率，将所述频率超过第一预设阈值的未应答问题作为待处理问题；

将所述待处理问题通过预设分类模型进行分类，获得知识型问题。
如权利要求2所述的提高智能客服应答率的方法，其中，所述计算各知识型问题之间的第一相似度，包括：

对各知识型问题进行分词处理，以获得所述知识型问题中所有的词语，计算所述词语的TF-IDF值；

将各知识型问题表示为以词语和词语的TF-IDF值组成的词向量；

计算各词向量之间的余弦距离，并将所述余弦距离作为各知识型问题之间的第一相似度。
如权利要求3所述的提高智能客服应答率的方法，其中，所述将所述聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复之后，所述提高智能客服应答率的方法还包括：

计算所述目标标准问题与所述智能客服的知识库中的原始标准问题之间的第二相似度；

获取所述第二相似度中的最大值，判断所述最大值是否超过第二预设阈值；

若所述最大值超过所述第二预设阈值，获取所述最大值对应的原始标准问题作为待补充问题；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中。
如权利要求4所述的提高智能客服应答率的方法，其中，所述获取所述第二相似度中的最大值，判断所述最大值是否超过第二预设阈值之后，所述提高智能客服应答率的方法还包括：

若所述最大值未超过所述第二预设阈值，将各聚类簇中除了目标标准问题之外的其他知识型问题作为第一扩展问题；

计算所述第一扩展问题与对应的目标标准问题之间的第三相似度；

按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题作为所述目标标准问题的扩展问题列表，所述N为大于或等于1的整数；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中。
如权利要求5所述的提高智能客服应答率的方法，其中，所述计算所述第一扩展问题与对应的目标标准问题之间的第三相似度，包括：

计算所述第一扩展问题与对应的目标标准问题之间的统计特征、语义特征和主题特征；

通过逻辑回归将所述统计特征、所述语义特征和所述主题特征进行聚合，获得所述第一扩展问题与对应的目标标准问题之间的第三相似度。
如权利要求6所述的提高智能客服应答率的方法，其中，所述统计特征包括：词共现率、TF-IDF值、编辑距离和最长公共子串。
一种提高智能客服应答率的设备，其中，所述提高智能客服应答率的设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的提高智能客服应答率的可读指令，所述提高智能客服应答率的可读指令配置为如下步骤：

获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

计算各知识型问题之间的第一相似度；

根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。
如权利要求8所述的提高智能客服应答率的设备，其中，所述提高智能客服应答率的可读指令配置为如下步骤：

获取智能客服的未应答问题，计算所述未应答问题的频率，将所述频率超过第一预设阈值的未应答问题作为待处理问题；

将所述待处理问题通过预设分类模型进行分类，获得知识型问题。
如权利要求9所述的提高智能客服应答率的设备，其中，所述提高智能客服应答率的可读指令配置为如下步骤：

对各知识型问题进行分词处理，以获得所述知识型问题中所有的词语，计算所述词语的TF-IDF值；

将各知识型问题表示为以词语和词语的TF-IDF值组成的词向量；

计算各词向量之间的余弦距离，并将所述余弦距离作为各知识型问题之间的第一相似度。
如权利要求10所述的提高智能客服应答率的设备，其中，所述提高智能客服应答率的可读指令配置为如下步骤：

计算所述目标标准问题与所述智能客服的知识库中的原始标准问题之间的第二相似度；

获取所述第二相似度中的最大值，判断所述最大值是否超过第二预设阈值；

若所述最大值超过所述第二预设阈值，获取所述最大值对应的原始标准问题作为待补充问题；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中。
如权利要求11所述的提高智能客服应答率的设备，其中，所述提高智能客服应答率的可读指令配置为如下步骤：

若所述最大值未超过所述第二预设阈值，将各聚类簇中除了目标标准问题之外的其他知识型问题作为第一扩展问题；

计算所述第一扩展问题与对应的目标标准问题之间的第三相似度；

按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题作为所述目标标准问题的扩展问题列表，所述N为大于或等于1的整数；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中。
如权利要求12所述的提高智能客服应答率的设备，其中，所述提高智能客服应答率的可读指令配置为如下步骤：

计算所述第一扩展问题与对应的目标标准问题之间的统计特征、语义特征和主题特征；

通过逻辑回归将所述统计特征、所述语义特征和所述主题特征进行聚合，获得所述第一扩展问题与对应的目标标准问题之间的第三相似度。
一种存储介质，其中，所述存储介质上存储有提高智能客服应答率的可读指令，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

计算各知识型问题之间的第一相似度；

根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。
如权利要求14所述的存储介质，其中，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

获取智能客服的未应答问题，计算所述未应答问题的频率，将所述频率超过第一预设阈值的未应答问题作为待处理问题；

将所述待处理问题通过预设分类模型进行分类，获得知识型问题。
如权利要求15所述的存储介质，其中，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

对各知识型问题进行分词处理，以获得所述知识型问题中所有的词语，计算所述词语的TF-IDF值；

将各知识型问题表示为以词语和词语的TF-IDF值组成的词向量；

计算各词向量之间的余弦距离，并将所述余弦距离作为各知识型问题之间的第一相似度。
如权利要求16所述的存储介质，其中，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

计算所述目标标准问题与所述智能客服的知识库中的原始标准问题之间的第二相似度；

获取所述第二相似度中的最大值，判断所述最大值是否超过第二预设阈值；

若所述最大值超过所述第二预设阈值，获取所述最大值对应的原始标准问题作为待补充问题；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中所述待补充问题的扩展问题列表中。
如权利要求17所述的存储介质，其中，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

若所述最大值未超过所述第二预设阈值，将各聚类簇中除了目标标准问题之外的其他知识型问题作为第一扩展问题；

计算所述第一扩展问题与对应的目标标准问题之间的第三相似度；

按照所述第三相似度从大到小顺序在所述第一扩展问题中选择N个第一扩展问题作为所述目标标准问题的扩展问题列表，所述N为大于或等于1的整数；

所述将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中，包括：

将所述目标标准问题的扩展问题列表、所述目标标准问题及对应的目标标准回复以独立问题形式添加至所述智能客服的知识库中。
如权利要求18所述的存储介质，其中，所述提高智能客服应答率的可读指令被处理器执行时实现如下步骤：

计算所述第一扩展问题与对应的目标标准问题之间的统计特征、语义特征和主题特征；

通过逻辑回归将所述统计特征、所述语义特征和所述主题特征进行聚合，获得所述第一扩展问题与对应的目标标准问题之间的第三相似度。
一种提高智能客服应答率的装置，其中，所述提高智能客服应答率的装置包括：分类模块、计算模块、聚类模块、获取模块和添加模块；

所述分类模块，设置为获取智能客服的未应答问题，对所述未应答问题进行分类，获得知识型问题；

所述计算模块，设置为计算各知识型问题之间的第一相似度；

所述聚类模块，设置为根据所述第一相似度通过亲和传播聚类算法将各知识型问题进行聚类，获得多个聚类簇；

所述获取模块，设置为将各聚类簇的聚类中心作为目标标准问题，并获取与所述目标标准问题对应的目标标准回复；

所述添加模块，设置为将所述目标标准问题及对应的目标标准回复添加至所述智能客服的知识库中。