CN109345263A

CN109345263A - 预测客户满意度的方法和系统

Info

Publication number: CN109345263A
Application number: CN201810872061.5A
Authority: CN
Inventors: 袁天文; 袁明明
Original assignee: Beijing Tianyuan Creative Technology Ltd
Current assignee: Beijing Tianyuan Creative Technology Ltd
Priority date: 2018-08-02
Filing date: 2018-08-02
Publication date: 2019-02-15

Abstract

本发明实施例提供预测客户满意度的方法和系统。其中，方法包括：获取客户的指标特征和主题特征，组成特征向量；将特征向量输入预设的分类器中，根据预设的分类器的输出结果，获取客户满意度的预测结果。本发明实施例提供的预测客户满意度的方法和系统，通过提取客户的指标特征和主题特征，组成特征向量，通过预设的分类器对特征向量进行分类，获取客户满意度的预测结果，能获得更准确的客户满意度的预测结果，提高预测客户满意度的准确率。

Description

预测客户满意度的方法和系统

技术领域

本发明实施例涉及计算机技术领域，尤其涉及预测客户满意度的方法和系统。

背景技术

对于电信运营商及移动互联网来说，以客户为中心，关注客户需求、客户体验，提升客户满意度是重点工作内容。而对于客户来说，个性化、差异化、定制化的服务需求使得客户感知越发难以描述，包含主观性质的客户满意度难以定义。

现有的获取客户满意度大多数采用人工调查的方式、费时费力，采用机器学习的方式进行客户满意度预测的方法较少。传统的通过人工调查获取客户满意度的方式包括市场调研、客户服务，响应周期长、服务客户范围局限，同时以“投诉”为抓手提升客户感知的传统方式，具有投诉响应时间长、投诉定位手段匮乏、投诉客户满意度低等弊端，已很难满足当前激烈的市场竞争需求和较高的业务时效性要求。

基于机器学习的算法可以减少人力投入和响应周期，因此，建立一套基于机器学习的、精准的同时适用性强的预测客户满意度的体系成为集中性能管理的重要应用之一。

常用的基于机器学习的预测客户满意度方法，是从客户通话质量以及信号强度两方面出发，用于预测的数据来源不够全面。同时，在模型选择方面，采用随机森林模型对客户满意度进行预测，但是随机森林模型对数据质量要求也相对较高，缺失值的处理成为一个问题。总体来说，直接利用机器学习方法预测客户满意度存在两大问题：

其一，以往刻画客户满意度画像的特征主要简单的从O域(运营域)或B域(业务域)选取，没有系统性的选择特征，导致预测的结果不够准确；其二，数据质量差、数据类型多成为预测客户满意度的难题，增加了模型的训练困难，也造成预测的结果不够准确。

发明内容

针对现有技术存在的预测客户满意度的准确率不足的问题，本发明实施例提供预测客户满意度的方法和系统。

根据本发明的第一方面，本发明实施例提供一种预测客户满意度的方法，包括：

获取客户的指标特征和主题特征，组成特征向量；

将所述特征向量输入预设的分类器中，根据所述预设的分类器的输出结果，获取客户满意度的预测结果；

其中，所述预设的分类器是根据样本特征向量进行训练后获得的。

根据本发明的第二方面，本发明实施例提供一种预测客户满意度的系统，包括：

特征提取模块，用于获取客户的指标特征和主题特征，组成特征向量；

满意度预测模块，用于将所述特征向量输入预设的分类器中，根据所述预设的分类器的输出结果，获取客户满意度的预测结果；

根据本发明的第三方面，本发明实施例提供一种电子设备，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行本发明实施例预测客户满意度的方法及其所有可选实施例的方法。

根据本发明的第四方面，本发明实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行本发明实施例预测客户满意度的方法及其所有可选实施例的方法。

本发明实施例提供的预测客户满意度的方法和系统，通过提取客户的指标特征和主题特征，组成特征向量，通过预设的分类器对特征向量进行分类，获取客户满意度的预测结果，能获得更准确的客户满意度的预测结果，提高预测客户满意度的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例预测客户满意度的方法的流程图；

图2为本发明实施例预测客户满意度的方法的流程图；

图3为本发明实施例预测客户满意度的系统的功能框图；

图4为本发明实施例电子设备的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例预测客户满意度的方法的流程图。如图1所示，一种预测客户满意度的方法包括：步骤S101、获取客户的指标特征和主题特征，组成特征向量。

需要说明的是，本发明实施例提供的预测客户满意度的方法，是根据采集的一段时间内与客户有关的数据，获取客户的特征，将上述一段时间作为带待预测的时间段，对该时间段的客户满意度进行预测。例如，对客户上周的满意度进行预测。该时间段可以为日、周、旬、月、季、半年、年等，本发明实施例对此不作具体限制。

客户，也称用户，指使用使用通信网络，并通过通信网络使用的通信运用商提供的业务的用户。

指标特征(index_feature)，为从待预测的时间段内的客户数据、业务数据和网络数据中提取的特征。

客户数据，指与客户本身和客户使用的终端有关的数据。例如，包括客户的性别、使用的终端、投诉次数等。

业务数据，指与客户通过通信网络使用的通信运用商提供的业务有关的数据。例如，包括通话总时长、总流量等。

网络数据，指与通信运用商提供的通信网络有关的数据。例如，通话质量、信号强度等。通信网络，可以为2G/3G/4G/5G网络等，本发明对此不作具体限制。

主题特征(topic_feature)，为从待预测的时间段内客户使用通信网络时输入的文本信息中提取的特征。

当客户对通信运营商提供的通信网络或业务不满意时，很可能通过搜索的方式寻找令其满意的其他通信运营商、寻找发生类似情形的其他客户，或者通过即时通讯、社交媒体等途径向客服、朋友表示对通信运营商提供的通信网络或业务的不满；当客户对通信运营商提供的通信网络或业务很满意时，很可能通过即时通讯、社交媒体等途径向朋友推荐。对于上述情形，客户会输入文本信息，而输入的文本信息中常常出现“不满意”、“差”、“不好”、“网速快”、“贵”、“便宜”、“划算”等词语，这些词语在一定程度上反映了客户对通信运营商提供的通信网络或业务的满意程度。因此，可以根据客户使用通信网络时输入的文本信息，提取主题特征，作为用于预测客户满意度的特征的一部分，从而更全面地表征客户满意度。

获取客户的指标特征和主题特征后，根据客户的指标特征index_feature和主题特征topic_feature，组成特征向量F。

F＝index_feature+topic_feature

步骤S102、将特征向量输入预设的分类器中，根据预设的分类器的输出结果，获取客户满意度的预测结果；其中，预设的分类器是根据样本特征向量进行训练后获得的。

具体地，获得特征向量后，将特征向量输入预设的分类器中，通过预设的分类器对特征向量进行分类，获得该特征向量对应的客户满意度的分类标签，作为预设的分类器的输出结果，从而根据预设的分类器的输出结果，获取客户满意度的预测结果。

根据需要，可以设置多类型的客户满意度的标签。例如：两个类型的标签为高满意度和低满意度，四个类型的标签为非常满意、满意、一般和不满意，五个类型的标签为非常满意、满意、一般、不满意和非常不满意。

获得客户满意度的预测结果后，可以根据客户满意度的分类标签进行单标签画像，获得客户满意度的画像结果；也可以将客户满意度的分类标签作为标签之一，结合客户的其他分类标签，获取客户画像。

预设的分类器，根据样本特征向量进行训练后获得。

样本特征向量，根据与待预测的时间段的时长相同的时间段内采集的与客户有关的数据获取。

例如，当待预测的时间段为月时，可以根据采集的当月之前每月与客户有关的历史数据，获取样本特征向量，作为训练样本，对分类器进行训练，获得训练好的分类器作为预设的分类器。

例如，当预测12月份的客户满意度时，可以分别从1至11月份每月与客户有关的数据中提取客户的指标特征和主题特征，作为样本特征向量，从而获得训练样本。

可以理解的是，获取样本特征向量时，还获取样本特征向量对应的客户满意度的标签。根据样本特征向量和样本特征向量对应的客户满意度的标签，对分类器进行训练，获得预设的分类器。

需要注意的是，在训练时，带有客户满意度标签的数据很少，大量数据定界模糊，而没有标签不代表客户满意度低。由于投诉通常会导致客户的满意度降低，根据历史数据中带有投诉信息的客户的数据，获取客户满意度低的样本特征向量，增加负标签数量。负标签，指满意度较低的标签，如两个类型的标签中的低满意度，四个类型的标签中的不满意。

本发明实施例通过提取客户的指标特征和主题特征，组成特征向量，通过预设的分类器对特征向量进行分类，获取客户满意度的预测结果，能获得更准确的客户满意度的预测结果，提高预测客户满意度的准确率。

基于上述实施例的内容，预设的分类器为预设的XGBoost分类器。

作为一个优选实施例，预设的分类器为预设的XGBoost分类器。

实际预测客户满意度的场景中，特征F由多元指标特征和主题特征构成。指标特征包括的数据类型多，即包括连续变量，如流量值、话费等，又包含离散变量，如性别、是否是重复投诉客户等。而且，为了更好地描述客户的特征，选用数量更多的指标特征，而大部分指标特征的采集比较困难，难以全部采集，导致特征向量中元素缺失严重，缺失值较多。

在机器学习领域，有很多其他缺失值处理的方式，包括通过补均值、补众数、补中位数、补0、插值等补全数据。但对于预测客户满意度而言，上述补全方式不合理、效果很差，会造成选用神经网络、支持向量机等分类器的分类误差很大。例如，指标特征中的主服务小区cellid，代表的是一个基站位置编号，采用众数补全数据显然不合理，而cellid本身的大小是没有任何意义的，采用中位数补全也没有意义。

XGBoost(eXtreme Gradient Boosting)分类器基于XGBoost算法。XGBoost算法对数据种类要求不高，对缺失值单独分类处理，对缺失值采用统一默认值填充，在训练和分类时单独对默认值的进行分析处理。由于0对于指标特征和主题特征中的各个指标几乎都有意义，为了克服缺失值造成的预测客户满意度的准确率的下降，优选地，采用-1作为缺失值的补全默认值。

XGBoost算法是对梯度提升(Gradient Boosting)算法的优化。XGBoost算法能自动利用CPU的多线程，实现并行处理，且通过正则化减少过拟合，并增加了剪枝，能控制分类模型的复杂程度，从而能达到更快的训练速度。

本发明实施例通过采用XGBoost分类器对特征向量进行分类，获取客户满意度的预测结果，能对特征向量中的缺失值进行较好的处理，较好地克服缺失值造成的预测客户满意度的准确率的下降，从而能获得更准确的客户满意度的预测结果，进一步提高预测客户满意度的准确率。

基于上述实施例的内容，获取客户的主题特征的具体步骤包括：统计客户搜索时输入的文本中预设的关键词出现的次数，获得实际词频向量。

具体地，基于预设的关键词，统计客户通过通信运营商提供的通信网络搜索时输入的文本中每一预设的关键词出现的次数(词频)，根据每一预设的关键词出现的次数，生成实际词频向量。

例如，根据预设的1000个关键词，如网速好、网速差、话费高、话费低，移动、联通等，建立字典Vocabulary，记为

Vocabulary＝{w₁,w₂,…,w_i,…,w₁₀₀₀}；

统计客户搜索时输入的文本中每一预设的关键词w_i出现的次数，获得实际词频向量vector

vector＝{c₁,c₂,…,c_i,…,c₁₀₀₀}；

其中，c_i＝num(w_i)。

将实际词频向量输入预设的隐含狄利克雷分布模型，根据预设的隐含狄利克雷分布模型的输出结果，获取客户的主题特征；其中，预设的隐含狄利克雷分布模型是根据样本文本进行训练后获得的。

获得实际词频向量vector后，将实际词频向量vector输入预设的隐含狄利克雷分布(Latent Dirichlet Allocation，简称LDA)模型，获得客户搜索时输入的文本中预设的关键词在每一主题上的分布，构成客户的主题特征topic_feature。

topic_feature＝{t₁,t₂,…,t_K}

其中，K表示主题的数量；t_i表示客户搜索时输入的文本中预设的关键词在第i个主题上的分布，1≤i≤K。

LDA(Latent Dirichlet Allocation)是一种文档主题生成模型，也称为一个三层贝叶斯概率模型，包含词、主题和文档三层结构。所谓生成模型，认为一篇文章(一段文本)中的每个词都是通过“以一定概率选择了某个主题，并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布，主题到词服从多项式分布。

LDA模型可以用于识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序。每一篇文档代表了一些主题所构成的一个概率分布，而每一个主题又代表了很多单词所构成的一个概率分布。

根据样本文本进行训练获得预设的LDA模型是一种无监督的机器学习方法，完成训练后，可以获得预设的隐含狄利克雷分布模型。

本发明实施例通过预设的隐含狄利克雷分布模型获得客户搜索时输入的文本中各主题的分布，作为主题特征，能通过主题特征表征客户对通信运营商的满意程度，从而能获得更准确的客户满意度的预测结果，提高预测客户满意度的准确率。

基于上述实施例的内容，获得的预设的隐含狄利克雷分布模型的具体步骤包括：统计样本文本中预设的关键词出现的次数，获得样本词频向量。

具体地，样本文本，为与待预测的时间段的时长相同的时间段内采集的客户通过通信运营商提供的通信网络搜索时输入的文本。样本文本，是与待预测的时间段的时长相同的时间段内采集的与客户有关的数据的一部分。而根据待预测的时间段的时长相同的时间段内采集的与客户有关的数据，可以获取样本特征向量。

基于预设的关键词，统计样本文本中每一预设的关键词出现的次数(词频)，根据每一预设的关键词出现的次数，生成样本词频向量。

根据预设的主题数量和预设的最大迭代次数，对所述样本词频向量中的元素进行分类，确定每一主题包括的所述预设的关键词，获得所述的预设的隐含狄利克雷分布模型。

具体地，根据预设的主题数量K，对样本词频向量中的元素进行分类，并对分类结果进行迭代，直至迭代次数达到预设的最大迭代次数maxiter，确定每一主题包括的预设的关键词，获得预设的隐含狄利克雷分布模型。

对分类结果进行迭代时，可以采用吉布斯采样方法、最大期望算法、最大似然估计法等，本发明对此不作具体限制。

基于上述实施例的内容，根据预设的主题数量和预设的最大迭代次数，对样本词频向量中的元素进行分类的具体步骤包括：根据预设的主题数量，对样本词频向量中的元素进行分类，并根据最大期望算法对分类结果进行迭代，直至迭代次数达到预设的最大迭代次数。

作为一个优选实施例，对分类结果进行迭代时，采用最大期望算法(ExpectationMaximization Algorithm，又称期望最大化算法)。具体过程为：根据预设的主题数量，对样本词频向量中的元素进行分类，获得分类结果；根据最大期望算法，对每一次获得的分类结果进行迭代，直至迭代次数达到预设的最大迭代次数，从而获得预设的LDA模型。

基于上述实施例的内容，指标特征至少包括以下种类的指标：上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标。

具体地，通过电话/互联网深度调查及座谈交流会等方式，结合大数据分析获知，可以从上网感知、覆盖质量、经营分析特性、行为偏好和服务质量等五个方面感知客户的满意度。上网感知、覆盖质量、经营分析特性(简称经分特性)、行为偏好和服务质量，影响客户使用移动终端(手机)通过通信网络上网满意度表现。例如，上网感知中的TAU(TrackingArea Update，跟踪区更新)请求次数、覆盖质量中的常驻小区MR(Measure Report，测量报告)覆盖率、经营分析特性中的ARPU(Average Revenue Per User，每客户平均收入)、行为偏好中的网页浏览业务流量。

因此，将上网感知、覆盖质量、经营分析特性、行为偏好和服务质量作为五个感知点，从上网感知、覆盖质量、经营分析特性、行为偏好和服务质量五个维度描述客户感知的评估体系指标列表，建立贴近客户使用体验的感知评价、问题分析定界，获得上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标。

从上网感知、覆盖质量、经营分析特性、行为偏好和服务质量等五个方面，可以获得五个种类的指标，从而获得包括至少五个种类指标的指标特征。对于每一个种类，都包括多个指标。

例如，指标特征包括但不限于：Attach成功率、附着时延、附着请求次数、附着失败次数、跟踪区更新TAU时延、TAU成功率、TAU请求次数、TAU失败次数、无线资源控制协议RRC连接建立成功率、小区无线接通率、小区无线掉线率、切换成功率、网页浏览业务流量、即时通信业务流量、应用下载业务流量、视频播放业务流量、游戏业务流量、金融支付业务流量、音乐业务流量、邮箱业务流量、导航业务流量、2G流量、3G流量、4G流量、4G驻留比、用户在网时长、用户、用户类型、NPS(Net Promoter Score，净推荐值)打分、天、月、手机通话质量满意度打分、手机上网质量满意度打分、流量套餐满意度打分、流量提醒服务满意度打分、移动4G整体表现打分、用户提交日期、用户提交时间、最大在线用户数、MR(MeasurementReport，测量报告)覆盖率、MRRIP(Measurement Report Routing Information Protocol)＞-105dbm占比、是否重复投诉用户、是否网络类升级(倾向)投诉用户、UE(UserEquipment，用户设备)请求PDN(Packet Data Network，分组数据网)连接成功率、是否视频播放控用户、是否网页浏览控用户、是否下载控用户、是否即时通信控用户、是否游戏控用户、是否金融支付控用户、是否音乐控用户、是否邮箱控用户、是否导航控用户、是否高流量用户、是否中流量用户、是否低流量用户、终端品牌、终端型号、终端类型(2/3/4G)、用户年龄。

可以理解的是，客户满意度的感知点不限于上述五个，还可以采用更多的感知点，从而获得上述五个种类之外的其他指标，也作为指标特征。

本发明实施例通过上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标五类指标构成指标特征，能从客户体验的感知评价客户的满意度，能更好地反映客户对体验感知是否满意，从而能获得更准确的客户满意度的预测结果，提高预测客户满意度的准确率。

基于上述实施例的内容，获取客户的指标特征的具体步骤包括：根据通信运营商采集的运营域数据和业务域数据，获取客户的上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标，组成客户的指标特征。

具体地，客户的指标特征，通过通信运营商采集的运营域数据和业务域数据获取。

电信行业大数据领域包括三大数据域：O域(运营域)、B域(业务域)、M域(管理域)。由于通信服务商属于电信行业，通信运营商在运行过程中都会采集上述三个数据域的数据。

M域，指management support system的数据域。管理域数据，包括位置信息，比如人群流动轨迹、地图信息等。

B域，指business support system的数据域。业务域数据，包括客户数据和业务数据，比如客户的消费习惯、终端信息、ARPU的分组、业务内容，业务受众人群等。

O域，指operation support system的数据域。运营域数据，包括网络数据，比如信令、告警、故障、网络资源等。

从三大域进行数据分析和挖掘，就是电信行业的大数据应用，从而可以根据大数据进行地理化精准营销、成本精算、客户满意度预测、客户画像等。

运营域数据和业务域数据，可以通过信令侧、经分侧、网络侧、客服侧等平台获取，从而根据运营域数据和业务域数据，获得客户的上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标，组成客户的指标特征index_feature。

index_feature＝{f₁,f₂,…,f_N}

其中，N表示指标特征的总数；f₁,f₂,…,f_N均为指标特征。

由于上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标中，每一种类的指标都包括多个，每一种类的指标的数量都可以达到几十个，为了减少数据的处理量，可以对指标进行清洗，保留质量更好的指标，获得个数更少的指标特征，从而降低特征向量的维数。

对指标进行清洗的方法可以为随机森林方法、主成分分析法，但不限于此，本发明实施例对此不作具体限制。

表1示出了清洗后获得的指标特征。

表1指标特征示例表

序号	4G手机上网满意度感知指标	影响客户满意度感知点
			1	TAU请求次数	上网感知
2	E.RAB建立请求次数	上网感知
			3	UE上下文建立成功次数	上网感知
4	使用4G后ARPU增值	经分特性
			5	ARPU	经分特性
6	客户性别	经分特性
			7	网页浏览业务流量	行为偏好
8	即时通信业务流量	行为偏好
			9	导航业务流量	行为偏好
10	4G驻留比	覆盖质量
			11	常驻小区最大在线客户数	覆盖质量
12	常驻小区MR覆盖率(>-110dB占比)	覆盖质量
			13	是否重复投诉客户	服务质量
14	是否网络类升级倾向投诉客户	服务质量

下面通过一个实例说明本发明实施例提供的预测客户满意度的方法的效果。本实例中，采用56个指标特征。分类器分别采用随机森林分类器和XGBoost分类器；客户的特征分别采用只有指标特征，以及指标特征+主题特征。

图2为本发明实施例预测客户满意度的方法的流程图。图2示出了基于XGBoost+指标特征+LDA主题特征，预测客户满意度的方法的流程。如图2所示，预测客户满意度的方法的的具体步骤包括：

从上网感知、覆盖质量、经分特性、行为偏好和服务质量等五个方面，获得五类指标特征，并根据客户搜索时输入的文本信息获得LDA主题特征，将五类指标特征和LDA主题特征组成特征向量；

将特征向量输入XGBoost分类器，XGBooST分类器在分类之前，用默认值补全特征向量中的缺失值，补全缺失值后，输出客户满意的的预测结果：该客户为低满意客户或高满意客户。

表2示出了预测客户满意度的方法的效果对比情况。

表2预测客户满意度的方法的效果对比

模型	准确率
		随机森林+指标特征	0.669
随机森林+指标特征+LDA主题特征	0.738
		XGBoost+指标特征	0.767
XGBoost+指标特征+LDA主题特征	0.801

从表2可以看出，结合指标特征和主题特征组成特征向量，相对于只根据指标特征组成特征向量，能提高预测客户满意度的准确率；采用XGBoost分类器，相对于随机森林分类器，能提高预测客户满意度的准确率；结合指标特征和主题特征组成特征向量，并采用XGBoost分类器，能将预测客户满意度的准确率提高至80％以上。

图3为本发明实施例预测客户满意度的系统的功能框图。基于上述实施例的内容，如图3所示，一种预测客户满意度的系统包括：特征提取模块301，用于获取客户的指标特征和主题特征，组成特征向量；满意度预测模块302，用于将特征向量输入预设的分类器中，根据预设的分类器的输出结果，获取客户满意度的预测结果；其中，预设的分类器是根据样本特征向量进行训练后获得的。

本发明提供的预测客户满意度的系统用于执行本发明提供的预测客户满意度的方法，预测客户满意度的系统包括的各模块实现相应功能的具体方法和流程详见上述预测客户满意度的方法的实施例，此处不再赘述。

图4为本发明实施例电子设备的结构框图。基于上述实施例的内容，如图4所示，一种电子设备包括：处理器(processor)401、存储器(memory)402和总线403；其中，处理器401和存储器402通过总线403完成相互间的通信；处理器401用于调用存储器402中的程序指令，以执行上述各方法实施例所提供的方法，例如包括：预测客户满意度的方法；获取指标特征的方法；获取主题特征的方法；获取特征向量的方法；获取预设的隐含狄利克雷分布模型的方法等。

本发明另一实施例公开一种计算机程序产品，计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：预测客户满意度的方法；获取指标特征的方法；获取主题特征的方法；获取特征向量的方法；获取预设的隐含狄利克雷分布模型的方法等。

本发明另一实施例提供一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行上述各方法实施例所提供的方法，例如包括：预测客户满意度的方法；获取指标特征的方法；获取主题特征的方法；获取特征向量的方法；获取预设的隐含狄利克雷分布模型的方法等。

以上所描述的系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种预测客户满意度的方法，其特征在于，包括：

获取客户的指标特征和主题特征，组成特征向量；

2.根据权利要求1所述的预测客户满意度的方法，其特征在于，所述预设的分类器为预设的XGBoost分类器。

3.根据权利要求1所述的预测客户满意度的方法，其特征在于，获取客户的主题特征的具体步骤包括：

统计客户搜索时输入的文本中预设的关键词出现的次数，获得实际词频向量；

将实际词频向量输入预设的隐含狄利克雷分布模型，根据所述预设的隐含狄利克雷分布模型的输出结果，获取客户的主题特征；

其中，所述预设的隐含狄利克雷分布模型是根据样本文本进行训练后获得的。

4.根据权利要求3所述的预测客户满意度的方法，其特征在于，获得所述的预设的隐含狄利克雷分布模型的具体步骤包括：

统计样本文本中预设的关键词出现的次数，获得样本词频向量；

5.根据权利要求4所述的预测客户满意度的方法，其特征在于，所述根据预设的主题数量和预设的最大迭代次数，对所述样本词频向量中的元素进行分类的具体步骤包括：

根据所述预设的主题数量，对所述样本词频向量中的元素进行分类，并根据最大期望算法对分类结果进行迭代，直至迭代次数达到所述预设的最大迭代次数。

6.根据权利要求1至5任一所述的预测客户满意度的方法，其特征在于，所述指标特征至少包括以下种类的指标：

上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标。

7.根据权利要求6所述的预测客户满意度的方法，其特征在于，获取客户的指标特征的具体步骤包括：

根据通信运营商采集的运营域数据和业务域数据，获取客户的上网感知指标、覆盖质量指标、经营分析特性指标、行为偏好指标和服务质量指标，组成所述客户的指标特征。

8.一种预测客户满意度的系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。