CN113570380A

CN113570380A - 基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质

Info

Publication number: CN113570380A
Application number: CN202010349187.1A
Authority: CN
Inventors: 乔柏林; 叶晓龙; 胡林熙; 蒋通通; 刘苗苗
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Group Zhejiang Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Group Zhejiang Co Ltd
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-10-29

Abstract

本发明实施例涉及语义分析技术领域，公开了一种基于语义分析的业务投诉处理方法，该方法包括：获取待处理投诉文本；将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案；根据历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题；将所述同源待处理投诉文本进行合并处理，获取与所述同源待处理投诉文目标业务问题相对应的投诉预案；根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。通过上述方式，本发明实施例实现了提高投诉处理效率的有益效果。

Description

基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质

技术领域

本发明实施例涉及语义分析技术领域，具体涉及一种基于语义分析的业务投诉处理方法、装置、设备及计算机可读存储介质。

背景技术

目前，在移动通信业务运营支撑中，业务复杂性高、投诉问题的个性化强，导致投诉种类繁多，处理过程差异大。然而，对于投诉和申告工作，基本没有相应技术工具支撑。营业厅、移动通信客服、地市支撑只能依靠个人经验，或简单借助于二三线专家在投诉处理过程中沉淀下来并分享的“文本”知识对一些简单投诉进行处理，投诉处理能力不足，大部分投诉问题最终只能转派到省支撑中心，由省支撑中心各线运维专家纯手工处理方式。

由于缺乏IT手段和相关技能，无法在线直接处理投诉，大量投诉工单需要派发各维护支撑单位，甚至多次转派，处理环节多，时间周期长，严重影响处理效率与客户感知。另一方面，省支撑中心各线运维人员一般均是各业务模块、各系统的资深维护专家，人员数量非常有限，面对越来越庞大的业务系统、越来越复杂的系统架构、不断发展变化的业务流程，投诉工单巨增、投诉工作量翻番，承受着巨大的工作压力，而且一旦发生人员流动，投诉无法及时处理，就直接影响客户投诉满意度。对于单月近万件的投诉工，人均手工投诉处理效率约几十张/天，无法满足日益严苛的客户满意度的要求。

因此，如何实现投诉业务的自动化处理、提高投诉业务的处理效率，成为了亟待解决的技术问题。

发明内容

鉴于上述问题，本发明实施例提供了一种基于语义分析的业务投诉处理方法，用于解决现有技术中存在的投诉业务量大、效率不高的技术问题。

根据本发明实施例的一个方面，提供了一种基于语义分析的业务投诉处理方法方法，所述方法包括：

获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题；

将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；其中，所述同源待处理投诉文本为投诉的业务问题相同的待处理投诉文本；

获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案；

根据所述历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题；

将所述同源待处理投诉文本进行合并处理，获取与所述同源待处理投诉文目标业务问题相对应的投诉预案；

根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。

在一种可选的方式中，所述获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题之后，进一步包括：

根据关键分词模型结合预设用户词典对所述待处理投诉文本进行关键词分解及语义分析，其中，所述关键分词模型包括分词模型和关键词模型；

根据关键词分解及语义分析，在FAQ知识库中搜索与所述待处理投诉文本对应的库问题，得到对应的答案，以对所述待处理投诉文本进行应答。

在一种可选的方式中，还包括以下操作：通过数据检测分析业务问题，获取业务问题对应的投诉预案，并通过自动化任务引擎进行无感知修复。

在一种可选的方式中，还包括以下步骤：定期对处理过的投诉文本进行聚类分析，获得对应的高频投诉问题，将所述高频投诉问题更新至FAQ知识库中。

在一种可选的方式中，同源文本分析模型为对无监督K-means算法、CNN算法、LDA+MaxEnt算法、RNN算法中的一种或多种的组合进行训练得到。

根据本发明实施例的另一方面，提供了一种基于语义分析的业务投诉处理装置，包括：

投诉文本获取模块，用于获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题；

投诉文本分析模块，用于将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；其中，所述同源待处理投诉文本为投诉的业务问题相同的待处理投诉文本；

历史解决方案获取模块，用于获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案；

相似投诉文本处理模块，用于根据所述历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题；

投诉预案获取模块，用于将所述同源待处理投诉文本进行合并处理，获取与所述同源待处理投诉文目标业务问题相对应的投诉预案；

同源投诉文本处理模块，用于根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。

在一种可选的方式中，所述装置进一步包括：

应答模块，用于根据关键分词模型结合预设用户词典对所述待处理投诉文本进行关键词分解及语义分析，其中，所述关键分词模型包括分词模型和关键词模型；

还用于根据关键词分解及语义分析，在FAQ知识库中搜索历史投诉文本，得到对应的答案，以对待处理投诉文本进行应答。

在一种可选的方式中，还包括无感知修复模块，用于通过数据检测分析业务问题，获取业务问题对应的投诉预案，并通过自动化任务引擎进行无感知修复。

根据本发明实施例的另一方面，提供了一种基于语义分析的业务投诉处理设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述的基于语义分析的业务投诉处理方法的操作。

根据本发明实施例的又一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令在基于语义分析的业务投诉处理设备/装置上运行时，使得基于语义分析的业务投诉处理设备/装置执行上述的基于语义分析的业务投诉处理方法的操作。

本发明通过设置相似投诉文本分析，查找与待处理投诉文本相似的历史投诉文本，获取相似度较高的历史投诉文本，并根据历史投诉文本对应的历史解决方案对业务问题进行处理，提高了投诉的处理效率，快速应答的投诉单平均处理时长仅需几分钟。通过同源投诉文本的分析，查找待处理投诉文本中具有相同业务问题的投诉文本，将相同业务问题的投诉文本合并处理，提高了投诉的处理效率。

进一步地，通过设置投诉预案及自动化任务引擎，可以自动化的对待处理投诉文本进行处理，实现了投诉问题智能修复的效果；同时，形成投诉业务处理的全流程自动化处理。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

附图仅用于示出实施方式，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的基于语义分析的业务投诉处理方法方法的流程示意图；

图2示出了本发明实施例提供的基于语义分析的业务投诉处理装置的结构示意图；

图3示出了本发明实施例提供的基于语义分析的业务投诉处理设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。

图1示出了本发明基于语义分析的业务投诉处理方法实施例的流程图，该方法由基于语义分析的业务投诉处理设备执行。该设备包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行该基于语义分析的业务投诉处理方法的操作。

如图1所示，该方法包括以下步骤：

步骤110：获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题。

其中，在获取待处理投诉文本前，还包括以下步骤：客户在业务系统中的投诉单接口进行目标业务问题的填写或通过人工服务语音投诉。根据投诉业务问题的填写或语音投诉，生成包括有用户标识信息及目标业务问题的待处理投诉文本。该目标业务问题为通信场景下的业务问题，如“客户表示不能理解此活动不能退订，要求相关部门协助处理”。

在获取到客户的待处理投诉文本后，本发明还包括步骤：首先对待处理投诉文本进行关键词分解及语义分析。具体地，使用关键分词模型结合预设的电信行业自定义用户词典，将用户提出的问题分成若干个中文单词，并根据词性和词频，去掉问题中对语义分析没有帮助的停用词，剩余单词为目标关键词。例如助词、语气词等对语义影响很小的词，以及在全部训练语料中都高频出现的词，将这些词都作为停用词，在算法中不予考虑。其中，关键分词模型分词的模型分为分词模型和关键词模型，通过预先对多个分词模型和关键词模型进行训练得到。多个分词模型包括HMM(隐马尔科夫)模型、CRF(条件随机场)模型、MEMM(最大熵隐马)模型。关键词模型包括基于TF-IDF的关键词算法、基于TextRank的关键词算法、基于LDA主题模型的关键词算。通过对上述算法的各种组合进行训练，从而得到最优的关键分词模型。

将目标关键词根据基于统计的关键词权重分析算法进行重要程度和特异程度排序，并按重要程度和特异程度顺序与索引目录中预设的关键词进行匹配，从而得到目标关键词集合。在基于统计的关键词权重分析算法中，如果一个词在本条文本中出现频率很高，在其他语料中词频很低，那么可以认为这个词能代表这条文本的主要信息。该关键词分解及语义分析可应用在本发明中各个步骤中需进行语义分析的步骤中。

在对待处理投诉文本进行关键词分解及语义分析后，本发明还包括步骤100：对客户进行FAQ应答，通过搜索FAQ知识库中的库问题，得到对应的答案进行应答。

具体地，FAQ应答通过自动问答系统实现，自动问答系统对待处理投诉文本及FAQ知识库中的库问题进行问题对分析，抽取待处理投诉文本以及库问题的高层语义信息，比对相似性，并给出相应的目标答案。其中，问题对分析的方法是基于相似问题具有相同答案的原则，通过问题相似性计算模型评估客户的投诉业务问题(query)与FAQ知识库中库问题的相似性，找出若干个与客户的投诉业务问题(query)最接近的目标库问题(candidate_question)，将这些目标库问题对应的目标答案返回给客户。其中，问题相似性计算模型通过如下训练方式得到：将语义相似问题对标注为1，语义不相似问题对标注为0。用带有标签的问题对训练一个siamese LSTM网络，得到共享的LSTM网络，作为问题相似性计算模型。通过问题相似性计算模型分别对目标关键词集合和FAQ知识库中库问题提取高层语义特征，再经过曼哈顿距离，得出目标关键词集合与FAQ知识库中库问题的相似性得分，得到N个得分最高的库问题。从FAQ知识库中找到该N个得分最高的库问题所对应的答案，并将答案返回给客户。其中，FAQ知识库的库问题及答案可以为历史投诉文本及对应的历史解决方案。

其中，库问题为根据待处理投诉文本中的关键词，根据索引目录找到的N个匹配的投诉索引所对应的投诉业务问题。其中，索引目录为预先建立的四级FAQ投诉知识索引，各级索引是对投诉业务问题的分类，一级索引、二级索引及三级索引为根据投诉业务问题分类而预设的关键字，四级索引下是具体的FAQ投诉知识，按照投诉索引模板进行整理得到，按照知识库模板提交到FAQ知识库，并采用word或ppt文档实现投诉知识共享。如，一级索引为个人业务；二级索引则分为客户资料管理、增值策划；三级索引中，分为二级索引下的客户资料管理对应的客户实名登记、关键信息变更、人脸识别等，二级索引下的增值策划对应的预缴活动、增值策划、促销活动等；四级索引则包括对应的FAQ投诉知识，也即库问题。对于三级索引的“客户实名登记”对应的四级索引为“客户实名登记不成功”、“关键信息变更”对应的“关键信息变更不成功”，“人脸识别”对应的“人脸识别校验不通过”。其中，业务问题“关键信息变更不成功”及“人脸识别校验不通过”为库问题。

根据FAQ知识库及索引目录对待处理投诉文本所对应的库问题的搜索，采用以下多个步骤实现，处理规则如下：

步骤1001：将分词后的待处理投诉文本的目标关键词与索引目录用ES的Smart算法进行与关系搜索与匹配，得到索引结果。首先，判断待处理投诉文本中的业务问题是否为咨询问题，咨询问题也即客户对某些问题进行咨询，而非投诉。具体地，可通过界面提示客户选择投诉咨询问题或投诉问题。若是咨询问题，则提交至FAQ知识库进行关键智能分词，获取咨询问题的目标关键词，将目标关键词用ES的Smart算法进行与关系搜索匹配，得到索引结果。

其中，该FAQ知识库包括四级索引，第四级索引下是具体的FAQ投诉知识库问题。通过搜索匹配，如果返回1条4级索引，继续搜索；返回1条非4级索引，则返回显示本索引的下级索引列表；返回1条以上索引，无论是否是4级。如果索引都是同级，且都属于一个父索引，则返回全部结果索引，显示全部本级索引。

如果不是同级索引，则返回全部结果索引，并需要补齐最高级的父索引，显示最高级的索引列表。

例如，回4条索引，1条2级，1条3级，2条4级(同父)，除了返回这4条索引，还应该返回3级索引的2级父索引，以及2条4级索引的3级和2级父索引，一共7条数据，最后显示的都是2级索引。

步骤1002：在得到索引结果后，确定库问题。并将投诉咨询问题与FAQ知识库做问答语义相似性分析，得出超过相似性得分0.5以上相似库问题，然后进行TopN得分排序，然后返回TopN条相似库问题。

步骤1003：对搜索返回相似库问题的处理规则如下：

搜索结果不超过1页，返回全部明细和数量，界面没有翻页和二次搜索。

搜索结果超过1页，不超过3页，返回全部明细和数量，界面可翻页和二次搜索。

搜索结果超过3页，返回3页明细和数量，界面可翻页，推荐用户进行二次搜索。

通过上述设置，通过对客户咨询问题的关键词分解和语义分析，定位FAQ知识库中相似的库问题，实现FAQ自动问答分流20％，提升营业厅和地市支撑的投诉处理能力，实现投诉处理能力前移，降低省支撑中心投诉处理压力。此外，对于现有的索引结构进行了优化，使得能够快速准确的为客户匹配多个对应的答案。

步骤120：将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；其中，所述同源待处理投诉文本为投诉的业务问题相同的待处理投诉文本。

其中，相似文本匹配模型及同源文本分析模型均是通过语义相似度分析来实现历史相似投诉文本及同源投诉文本的分析的，其核心均是语义相似度分析模型。语义相似度分析模型首先对待处理投诉文本进行语义特征提取，采用先进的bert模型抽取待匹配语料的高维深度特征。然后使用biRNN网络，利用两段文本的特征信息，输出相似度得分。本实施中，语义相似度分析模型所使用的算法包括：N-Gram(N元模型)语义模型(Class-based、topic-based、cache-based、skipping等类型的NGram模型)、RNN语言模型、Term weighting(术语权重)语义模型：包括TF-IDF、Okapi、MI、LTU、ATC、TF-ICF等类型的TW模型中的一种或多种的组合。

具体地，相似文本匹配模型分别提取待处理投诉文本与历史投诉文本的语义特征，然后对比语义特征的相似度，并使用相似度算法得到量化的相似度数值，按照相似度数值获得相似历史投诉文本。本实施例中，相似度数值为0.5，将相似度在0.5以上的历史投诉文本按照相似度数值进行TopN的排序，推荐最相似的N张历史投诉文本给用户(在这里，用户为营业厅的营业员)，用户根据推荐对待处理投诉文本中目标业务问题进行处理。相似文本匹配模型通过训练得到。通过历史投诉文本进行标注形成样本后，通过对上述模型中的一种或两种的组合进行训练，调整参数，得到最优的模型，作为相似文本匹配模型。

具体地，同源文本分析模型将接收到的多个待处理投诉文本进行聚类分析，投诉的业务问题相同的待处理投诉文本，将投诉的业务问题相同的待处理投诉文本进行合并处理。源文本分析模型训练包含建立语料库、模型算法验证、模型算法调优、模型算法封装四个阶段。建立语料库阶段，将历史投诉文本语料库导入语料库，形成同源语料库。模型算法验证阶段，对多种同源文本分析算法进行验证训练，获取适用于投诉文本处理的最佳同源文本分析算法。该同源文本分析算法包括：无监督K-means算法、CNN算法、LDA+MaxEnt算法、RNN算法中的一种或多种的组合。模型算法调优阶段，对最终训练验证通过的同源文本分析算法进行迭代式调优训练，进行算法组合的调优训练、组合输出的调优训练、数据优选规则调优训练、迭代数据反馈优化规则调优训练、迭代对比输出调优训练，以最终得到同源文本分析模型，进行封装后成为组件供基于语义分析的业务投诉处理设备调用。

本发明旨在对海量投诉业务处理进行效率的提升，因此本发明通过将待处理投诉文本分别输入到相似文本匹配模型和同源文本分析模型中，一方面，通过判断海量的待处理投诉文本中，是否包含与已有历史投诉文本相似的待处理投诉文本，若有，则根据其对应的历史投诉文本的历史解决方案来对待处理投诉文本中的目标业务问题进行处理。另一方面，通过同源文本分析模型判断待处理投诉文本之间是否存在目标业务问题相同的待处理投诉文本。若存在，则将这些目标业务问题相同的待处理投诉文本进行合并处理。

此外，对于经过相似文本匹配模型及同源文本分析模型后，未得到对应的相似历史投诉文本及同源投诉文本的待处理投诉文本，本实施例中，可将其进行语义分析，获取该待处理投诉文本中的投诉业务问题，根据投诉业务问题与预设的投诉预案进行匹配，并发配给自动化任务引擎对目标业务问题进行自动化处理，以修复该业务问题。其中，预设的投诉预案为结合专家经验得到的多种业务问题及对应的投诉预案。可通过字段匹配，来获取对应的投诉预案。

步骤130：获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案。

本实施例中，可以通过将相似度在0.5以上的历史投诉文本按照相似度数值进行TopN的排序，推荐最相似的N张历史投诉文本给用户(在这里，用户为营业厅的营业员)，用户从中选择一个相似的历史投诉文本对应的历史解决方案。或自动化任务引擎直接获取最相似的历史投诉文本及对应的历史解决方案。

步骤140：根据所述历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题。

本实施例中，可以通过将相似度在0.5以上的历史投诉文本按照相似度数值进行TopN的排序，推荐最相似的N张历史投诉文本给用户(在这里，用户为营业厅的营业员)，用户从中选择一个相似的历史投诉文本对应的解决方案，自动化任务引擎根据用户选择的历史解决方案对待处理投诉文本中目标业务问题进行处理。也可以由自动化任务引擎获取最相似的历史投诉文本及对应的历史解决方案，直接对目标业务问题进行处理，如直接在后台对客户投诉的业务数据进行修复等操作。

步骤150：将所述同源待处理投诉文本进行合并处理，并获取与所述同源待处理投诉文目标业务问题相对应的投诉预案。

其中，获取与所述同源待处理投诉文目标业务问题相对应的投诉预案，可以是获取用户(营业员)设置的对应的投诉预案，也可以是根据待处理投诉文本中目标业务问题从预设的投诉预案中选择一个匹配的投诉预案。预设的投诉预案为预先根据各种业务问题设置的对应的业务问题解决方法，在本实施例中，预先分别将投诉预案与对应的业务问题关联存储。因此，根据目标业务问题的文本信息，查找到关联的目标投诉预案。自动化任务引擎根据预设预案对目标业务问题进行处理，如直接在后台对客户投诉的业务问题进行修复等操作。

步骤160：根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。

其中，自动化任务引擎根据预设预案对目标业务问题进行处理，如直接在后台对客户投诉的目标业务问题进行修复等操作。如，针对“用户表示不能理解此活动不能退订，要求相关部门协助处理”的投诉文本，根据获取的投诉预案为“查询用户积分，活动下月退换”，自动化任务引擎直接对此活动进行“查询用户积分，活动下月退换”的处理操作。

本实施例中，在处理完上述操作后，可再通过自动问答系统将处理结果通知客户。如针对“用户表示不能理解此活动不能退订，要求相关部门协助处理”的投诉文本，问题原因是“套餐问题导致错误”，对应的历史解决方案为“查询用户积分，活动下月退换”，则将此处理结果反馈给客户。

本实施例中，还通过后台数据检测分析，自动发现业务问题，并通过对应的投诉预案在后台修复数据，无需用户发现，即进行数据一致性修复，能够在客户感知前，提前处理异常数据，无感知自动修复客户异常数据，从而达到减少客户投诉的目的，并提供报表等展示功能，清晰、直观展现系统运行修复数据情况。具体地，可通过实时采集设备各个单元的业务数据，结合预设的标准数据进行比对分析，从而发现异常的业务问题，将异常的业务问题与历史投诉文本进行相似度比较，从而确定出相似的历史投诉文本，根据历史投诉文本所对应的历史解决方案，以对该业务问题进行自动修复。

本实施例中，在对待处理投诉文本进行处理后，还将待处理投诉文本与历史投诉文本进行聚类分析，并保存到相应索引类别的FAQ知识库中。

本实施例中，还包括以下步骤：定期对历史投诉文本及在线的待处理投诉文本进行聚类分析，从而从大量的文本中获得高频投诉业务问题，更新到FAQ知识库中。具体地，通过离线训练阶段，利用无监督的降维算法和深度学习结合的策略，抽取大量由历史投诉文本构成的语料的语义特征。然后利用k-mean聚类算法对这些语义特征进行聚类分析，输出若干个聚类中心。利用CNN深度网络，抽取用户在线的待处理投诉文本的高维深度特征D，并与聚类中心进行比较，将用户在线的待处理投诉文本量化到topN聚类中心上，将符合的topN聚类中心的在线的待处理投诉文本选取为FAQ投诉知识。

如果一类推荐的投诉文本的投诉问题被选取作为FAQ投诉知识，则对被选取的投诉文本进行标记，除非近期有新的投诉文本，否则就不会再推荐。如果分类中近期新的高频投诉较多，说明上次选取的FAQ投诉知识不完整或不正确，会再次推荐该被选取的投诉文本，重新进行聚类分析。通过定期对处理过的投诉文本进行聚类分析，从而获得高频投诉问题，从中选取更新到FAQ知识库中，实现了投诉知识共享与传承，提供了精准的信息推送渗透能力。

本发明通过设置相似投诉文本分析，查找与待处理投诉文本相似的历史投诉文本，获取相似度较高的历史投诉文本，并根据历史投诉文本对应的历史解决方案对业务问题进行处理，提高了投诉的处理效率，快速应答的投诉单平均处理时长仅需几分钟。通过设置同源投诉文本的分析，查找待处理投诉文本中具有相同业务问题的投诉文本，将相同业务问题的投诉文本合并处理，提高了投诉的处理效率。

图2示出了本发明基于语义分析的业务投诉处理装置实施例的结构示意图。如图2所示，该装置200包括：投诉文本获取模块模块210、投诉文本分析模块模块220、历史解决方案获取模块230、相似投诉文本处理模块240、投诉预案获取模块250及同源投诉文本处理模块260。

投诉文本获取模块210，用于获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题。

投诉文本分析模块220，用于将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；其中，所述同源待处理投诉文本为投诉的业务问题相同的待处理投诉文本。

历史解决方案获取模块230，用于获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案。

相似投诉文本处理模块240，用于根据所述历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题。

投诉预案获取模块250，用于将所述同源待处理投诉文本进行合并处理，并获取与所述同源待处理投诉文目标业务问题相对应的投诉预案。

同源投诉文本处理模块260，用于根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。

该装置各个模块的工作过程为：

投诉文本获取模块210获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题。

其中，该装置还包括投诉单接口模块。在获取待处理投诉文本前，客户在投诉单接口进行投诉业务问题的填写或通过人工服务语音投诉。根据投诉业务问题的填写或语音投诉，生成包括有用户标识信息及目标业务问题的待处理投诉文本。该目标业务问题为通信场景下的业务问题，如“客户表示不能理解此活动不能退订，要求相关部门协助处理”。

该实施例中，应答模块，用于根据关键分词模型结合预设用户词典对所述待处理投诉文本进行关键词分解及语义分析，其中，所述关键分词模型包括分词模型和关键词模型，还用于根据关键词分解及语义分析，在FAQ知识库中搜索历史投诉文本，得到对应的答案，以对待处理投诉文本进行应答。

应答模块在获取到客户的待处理投诉文本后，关键词分解及语义分析模块首先对待处理投诉文本进行关键词分解及语义分析。具体地，使用关键分词模型结合预设的电信行业自定义用户词典，将用户提出的问题分成若干个中文单词，并根据词性和词频，去掉问题中对语义分析没有帮助的停用词，剩余单词为目标关键词。例如助词、语气词等对语义影响很小的词，以及在全部训练语料中都高频出现的词，将这些词都作为停用词，在算法中不予考虑。其中，关键分词模型分词的模型分为分词模型和关键词模型，通过预先对多个分词模型和关键词模型进行训练得到。多个分词模型包括HMM(隐马尔科夫)模型、CRF(条件随机场)模型、MEMM(最大熵隐马)模型。关键词模型包括基于TF-IDF的关键词算法、基于TextRank的关键词算法、基于LDA主题模型的关键词算。通过对上述算法的各种组合进行训练，从而得到最优的关键分词模型。

将目标关键词根据基于统计的关键词权重分析算法进行重要程度和特异程度排序，并按重要程度和特异程度顺序与索引目录中预设的关键词进行匹配。在基于统计的关键词权重分析算法中，如果一个词在本条文本中出现频率很高，在其他语料中词频很低，那么可以认为这个词能代表这条文本的主要信息。

本实施例中，在对待处理投诉文本进行关键词分解及语义分析后，对客户进行FAQ应答，通过搜索FAQ知识库中的库问题，得到对应的答案进行应答。

具体地，FAQ应答通过自动问答系统实现，自动问答系统对待处理投诉文本及FAQ知识库中的库问题进行问题对分析，抽取目标关键词集合以及库问题的高层语义信息，比对相似性，并给出相应的目标答案。其中，问题对分析的方法是基于相似问题具有相同答案的原则，通过问题相似性计算模型评估客户的投诉业务问题(query)与FAQ知识库中库问题的相似性，找出若干个与客户的投诉业务问题(query)最接近的目标库问题(candidate_question)，将这些目标库问题对应的目标答案返回给客户。其中，问题相似性计算模型通过如下训练方式得到：将语义相似问题对标注为1，语义不相似问题对标注为0。用带有标签的问题对训练一个siamese LSTM网络，得到共享的LSTM网络，作为问题相似性计算模型。通过问题相似性计算模型分别对目标关键词集合和FAQ知识库中库问题提取高层语义特征，再经过曼哈顿距离，得出目标关键词集合与FAQ知识库中库问题的相似性得分，得到N个得分最高的库问题。从FAQ知识库中找到该N个得分最高的库问题所对应的答案，并将答案返回给客户。其中，FAQ知识库的库问题及答案可以为历史投诉文本及对应的历史解决方案。

其中，该装置还包括索引模块。库问题为根据待处理投诉文本中的关键词，根据索引目录找到的N个匹配的投诉索引所对应的投诉业务问题。其中，索引目录为预先建立的四级FAQ投诉知识索引，各级索引是对投诉业务问题的分类，一级索引、二级索引及三级索引为根据投诉业务问题分类而预设的关键字，四级索引下是具体的FAQ投诉知识，按照投诉索引模板进行整理得到，按照知识库模板提交到FAQ知识库，并采用word或ppt文档实现投诉知识共享。如，一级索引为个人业务；二级索引则分为客户资料管理、增值策划；三级索引中，分为二级索引下的客户资料管理对应的客户实名登记、关键信息变更、人脸识别等，二级索引下的增值策划对应的预缴活动、增值策划、促销活动等；四级索引则包括对应的FAQ投诉知识，也即库问题。对于三级索引的“客户实名登记”对应的四级索引为“客户实名登记不成功”、“关键信息变更”对应的“关键信息变更不成功”，“人脸识别”对应的“人脸识别校验不通过”。其中，业务问题“关键信息变更不成功”及“人脸识别校验不通过”为库问题。

索引模块根据FAQ知识库及索引目录对待处理投诉文本所对应的库问题的搜索，处理规则如下：

将分词后的待处理投诉文本的目标关键词与索引目录用ES的Smart算法进行与关系搜索与匹配，得到索引结果。首先，判断待处理投诉文本中的业务问题是否为咨询问题，咨询问题也即客户对某些问题进行咨询，而非投诉。具体地，可通过界面提示客户选择投诉咨询问题或投诉问题。若是咨询问题，则提交至FAQ知识库进行关键智能分词，获取咨询问题的目标关键词，将目标关键词用ES的Smart算法进行与关系搜索匹配，得到索引结果。

例如，返回4条索引，1条2级，1条3级，2条4级(同父)，除了返回这4条索引，还应该返回3级索引的2级父索引，以及2条4级索引的3级和2级父索引，一共7条数据，最后显示的都是2级索引。

在得到索引结果后，确定库问题。并将投诉咨询问题与FAQ知识库做问答语义相似性分析，得出超过相似性得分0.5以上相似库问题，然后进行TopN得分排序，然后返回TopN条相似库问题。

对搜索返回相似库问题的处理规则如下：

投诉文本分析模块220将待处理投诉文本分别输入相似文本匹配模型及同源文本分析模型，得到与待处理投诉文本相似的历史投诉文本相似的待处理文本以及同源待处理投诉文本；其中，所述同源待处理投诉文本为投诉的业务问题相同的待处理投诉文本。

历史解决方案获取模块230获取与待处理投诉文本相似的历史投诉文本对应的历史解决方案。

相似投诉文本处理模块240根据所述历史解决方案处理与历史投诉文本相似的待处理投诉文本中的目标业务问题。

本实施例中，可以通过将相似度在0.5以上的历史投诉文本按照相似度数值进行TopN的排序，推荐最相似的N张历史投诉文本给用户(在这里，用户为营业厅的营业员)，用户从中选择一个相似的历史投诉文本对应的解决方案，自动化任务引擎根据用户选择的解决方案对待处理投诉文本中目标业务问题进行处理。也可以由自动化任务引擎获取最相似的历史投诉文本及对应的历史解决方案，直接对目标业务问题进行处理，如直接在后台对客户投诉的业务数据进行修复等操作。

投诉预案获取模块250将所述同源待处理投诉文本进行合并处理，并获取与所述同源待处理投诉文目标业务问题相对应的投诉预案。

同源投诉文本处理模块260根据与所述投诉预案处理所述同源待处理投诉文本中的目标业务问题。

其中，自动化任务引擎根据预设预案对目标业务问题进行处理，如直接在后台对客户投诉的业务问题进行修复等操作。如，针对“用户表示不能理解此活动不能退订，要求相关部门协助处理”的投诉文本，根据获取的投诉预案为“查询用户积分，活动下月退换”，自动化任务引擎直接对此活动进行“查询用户积分，活动下月退换”的处理操作。

本实施例中，在处理完上述操作后，可再通过自动问答系统将处理结果通知客户。如针对“用户表示不能理解此活动不能退订，要求相关部门协助处理”的投诉文本，问题原因是“套餐问题导致错误”，对应的解决方案为“查询用户积分，活动下月退换”，则将此处理结果反馈给客户。

本实施例中，还包括无感知修复模块，用于通过数据检测稽核检查问题数据，获取问题数据对应的投诉预案，并通过自动化任务引擎进行无感知修复。通过后台数据检测分析，自动发现业务问题，并通过对应的投诉预案在后台修复数据，无需用户发现，即进行数据一致性修复，能够在客户感知前，提前处理异常数据，无感知自动修复客户异常数据，从而达到减少客户投诉的目的，并提供报表等展示功能，清晰、直观展现系统运行修复数据情况。具体地，可通过实时采集设备各个单元的业务数据，结合预设的标准数据进行比对分析，从而发现异常的业务问题，将异常的业务问题与历史投诉文本进行相似度比较，从而确定出相似的历史投诉文本，根据历史投诉文本所对应的历史解决方案，以对该业务问题进行自动修复。

本实施例中，还包括高频投诉聚类模块，在对待处理投诉文本进行处理后，还将待处理投诉文本与历史投诉文本进行聚类分析，并保存到相应索引类别的FAQ知识库中。具体地：通过语义相似度聚类模型定期对历史投诉文本及在线的待处理投诉文本进行聚类分析，从而从大量的文本中获得高频投诉业务问题，更新到FAQ知识库中。具体地，通过离线训练阶段，利用无监督的降维算法和深度学习结合的策略，抽取大量由历史投诉文本构成的语料的语义特征。然后利用k-mean聚类算法对这些语义特征进行聚类分析，输出若干个聚类中心。利用CNN深度网络，抽取用户在线的待处理投诉文本的高维深度特征D，并与聚类中心进行比较，将用户在线的待处理投诉文本量化到topN聚类中心上，将符合的topN聚类中心的在线的待处理投诉文本选取为FAQ投诉知识。

图3示出了本发明基于语义分析的业务投诉处理设备实施例的结构示意图，本发明具体实施例并不对基于语义分析的业务投诉处理设备的具体实现做限定。

如图3所示，该基于语义分析的业务投诉处理设备可以包括：处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中：处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304，用于与其它设备比如客户端或其它服务器等的网元通信。处理器302，用于执行程序310，具体可以执行上述用于基于语义分析的业务投诉处理方法实施例中的相关步骤。

具体地，程序310可以包括程序代码，该程序代码包括计算机可执行指令。

处理器302可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。基于语义分析的业务投诉处理设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器306，用于存放程序310。存储器306可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序310具体可以被处理器302调用使基于语义分析的业务投诉处理设备执行以下操作：

将所述同源待处理投诉文本进行合并处理，并获取与所述同源待处理投诉文目标业务问题相对应的投诉预案；

本发明实施例提供了一种计算机可读存储介质，所述存储介质存储有至少一可执行指令，该可执行指令在基于语义分析的业务投诉处理设备/装置上运行时，使得所述基于语义分析的业务投诉处理设备/装置执行上述任意方法实施例中的基于语义分析的业务投诉处理方法。

可执行指令具体可以用于使得基于语义分析的业务投诉处理设备/装置执行以下操作：

本发明实施例提供一种基于语义分析的业务投诉处理装置，用于执行上述基于语义分析的业务投诉处理方法。

本发明实施例提供了一种计算机程序，所述计算机程序可被处理器调用使基于语义分析的业务投诉处理设备执行上述任意方法实施例中的基于语义分析的业务投诉处理方法。

本发明实施例提供了一种计算机程序产品，计算机程序产品包括存储在计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令在计算机上运行时，使得所述计算机执行上述任意方法实施例中的基于语义分析的业务投诉处理方法。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤，除有特殊说明外，不应理解为对执行顺序的限定。

Claims

1.一种基于语义分析的业务投诉处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取待处理投诉文本，所述待处理投诉文本中包括目标业务问题之后，进一步包括：

3.根据权利要求1所述的方法，其特征在于，还包括以下步骤：通过数据检测分析业务问题，获取业务问题对应的投诉预案，并通过自动化任务引擎进行无感知修复。

4.根据权利要求2任一项所述的方法，其特征在于，还包括以下步骤：定期对处理过的投诉文本进行聚类分析，获得对应的高频投诉问题，将所述高频投诉问题更新至FAQ知识库中。

5.根据权利要求1任一项所述的方法，其特征在于，同源文本分析模型为对无监督K-means算法、CNN算法、LDA+MaxEnt算法、RNN算法中的一种或多种的组合进行训练得到。

6.一种基于语义分析的业务投诉处理装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述装置进一步包括：

8.根据权利要求6所述的装置，其特征在于，所述装置进一步包括：

无感知修复模块，用于通过数据检测分析业务问题，获取业务问题对应的投诉预案，并通过自动化任务引擎进行无感知修复。

9.一种基于语义分析的业务投诉处理设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-5任意一项所述的基于语义分析的业务投诉处理方法的操作。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一可执行指令，所述可执行指令在基于语义分析的业务投诉处理设备/装置上运行时，使得基于语义分析的业务投诉处理设备/装置执行如权利要求1-5任意一项所述的基于语义分析的业务投诉处理方法的操作。