CN110866767A - 电信用户满意度的预测方法、装置、设备及介质 - Google Patents
电信用户满意度的预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN110866767A CN110866767A CN201810980849.8A CN201810980849A CN110866767A CN 110866767 A CN110866767 A CN 110866767A CN 201810980849 A CN201810980849 A CN 201810980849A CN 110866767 A CN110866767 A CN 110866767A
- Authority
- CN
- China
- Prior art keywords
- telecommunication
- sample
- users
- satisfaction
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000007637 random forest analysis Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种电信用户满意度的预测方法、装置、设备及介质,所述的方法包括:根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户;根据每个类别的样本电信用户的回归模型特征和每个类别的样本电信用户的满意度,训练回归模型,得到每个类别对应的回归模型;通过训练后的聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别;对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。通过本发明实施例,能够更加准确地预测出用户的满意度,从而可以及时地对不满意的用户采取应对措施来避免不满意客户的流失。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种电信用户满意度的预测方法、装置、设备及介质。
背景技术
客户满意率测评面对电信行业大样本,急需要客观有效的方法反应预测客户满意度。而简单意义上的客户满意率,只能指导测评单位了解客户满意的大概范围和现状。因此现有技术中的预测满意度的方案并不能满足准确反映用户满意度的需求。
发明内容
本发明实施例提供了一种电信用户满意度的预测方法、装置、设备及介质,能够更加准确地预测出用户的满意度。
第一方面,本发明实施例提供了一种电信用户满意度的预测方法,包括:根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户;根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型,得到所述每个类别对应的回归模型;通过训练后的所述聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别;对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
第二方面,本发明实施例提供了一种电信用户满意度的预测装置,包括:
第一训练模块,用于根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户;
第二训练模块,用于根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型,得到所述每个类别对应的回归模型;
聚类模块,用于通过训练后的所述聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别;
预测模块,用于对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
本发明实施例提供了一种计算设备,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的电信用户满意度的预测方法、装置、设备及介质,由于不同类别的电信用户对评价满意度的标准不同,通过聚类模型对待预测满意度的电信用户进行分类,以将相似的电信用户聚成一类。对不同类别的电信用户,使用不同的回归模型预测满意度,能够更加准确地预测出用户的满意度,便于深度挖掘出不满意的电信用户,从而及时采取应对措施。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例提供的一种电信用户满意度的预测方法的流程示意图;
图2示出了本发明实施例的一种电信用户满意度的预测装置的框图;
图3示出了本发明实施例的一种计算设备硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1示出了本发明实施例提供的一种电信用户满意度的预测方法的流程示意图。该方法包括:S101至S104。
S101,根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户。
作为一个示例,获取业务专家分析出的样本电信用户的聚类特征;若聚类特征的维数大于预设阈值,则对聚类特征的维数进行降维处理。
结合业务专家和技术两方面选取样本电信用户的聚类特征。业务专家通过从业务角度分析,哪些因素作为聚类指标有利于解读不同类别用户的业务,选取这些指标作为聚类特征。从技术角度,如果聚类特征的维数很高,在高维空间很难找到聚类簇,这时候先降维,减少聚类特征个数,这样可以更容易找到合适的聚类簇。
样本电信用户的满意度是样本电信用户在n个月的满意度。
S102,根据每个类别的样本电信用户的回归模型特征和每个类别的样本电信用户的满意度,训练回归模型,得到每个类别对应的回归模型。
作为一个示例,通过三种方案来选取合适的回归模型特征,一是计算特征与用户满意度的相关系数,将相关度大于预定阈值的特征作为回归模型特征;二是在模型中添加L1正则化自动选择合适的特征作为回归模型特征;三是包裹式特征选择,将特征选择当成一个搜索寻优问题,对特征进行评价,根据评价结果确定回归模型特征。
S103,通过训练后的聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别。
S104,对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
作为一个示例,聚类模型的指标包括以下之一或多种的组合:促销活动、服务表现、营业厅、资费套餐、手机上网、语言通话。
回归模型的指标包括以下之一或多种的组合:促销活动、服务表现、营业厅、资费套餐、手机上网、语言通话。
在移动互联网时代,通过研究用户习惯、行为,匹配用户需求。发现用户的需求特性主要集中以下几个方面:网络质量、业务质量和服务质量。
网络质量,即信号强度、语音通话质量、手机上网质量等,随着移动与互联网的结合,对网络质量提出了更高的要求。
业务质量,即资费套餐、价格水平、促销活动、新业务、宣传活动、终端等,移动互联网时代的到来,对终端条件的改进、价格水平的优惠、新业务的新颖性、娱乐性,宣传方式的多变性和适应性提出了更高的要求。
服务质量,如账单服务、服务人员(态度和技能)、信息安全、充值缴费服务、提醒服务、咨询投诉服务等。
结合用户的上述特点,模型的建立思路以用户习惯,用户需求特性作为指导方向,通过分析用户行为特点,构建客户满意度评价模型指标体系。其中可以构建如表1所示的指标体系。
表1
显示评价体系主要包括:1个一级指标:客户4G满意度;6个二级指标,促销活动,服务表现、营业厅、资费套餐、手机上网、语音通话;40个三级指标(客户感知要素)。
根据本发明实施例的电信用户满意度的预测方法,由于电信用户的数量庞大,个体之间差异也较大,电信用户之间对评价满意度的标准不同,通过聚类模型对待预测满意度的电信用户进行分类,以将相似的电信用户聚成一类,能够有效提高后续的分析效率,如满意度提升,营销等。对不同类别的电信用户,使用不同的回归模型预测满意度,能够更加准确地预测出用户的满意度,便于深度挖掘出不满意的电信用户,从而及时采取应对措施。优化测评对象内在关联及对整体满意度结果的影响,对服务短板的针对性提升、对后期满意度测评的改进性方向,从而实现电信用户满意度测评的良性互动。
在本发明的一个实施例中,S103之后,电信用户满意度的预测方法还包括:
针对不同类别的目标电信用户,执行对应的提升用户满意度的策略。
根据本发明实施例的电信用户满意度的预测方法,对于每个类别用户,使用对应的策略来提升用户满意度。例如,对于资费比较敏感的人群,设计合理资费策略就能够有效提高用户满意度,而对于资费不敏感而网络服务敏感的人群,需要提高网络服务质量才能提高用户满意度。如果没有分类,这两个类别的用户组合在一起,如果想提高满意度,就需要对所有用户进行资费和网络服务优化,才能提高这两个类别用户的满意度。这样不够精准,效率也不高。另一方面,分类后,每用户平均收入(Average Revenue Per User,ARPU)不同,所花费的费用不同,比如平均收入高的用户,超套餐流量多,这样的人可以营销不限量套餐。而如果对所有人都进行不限量套餐,势必不够精准,效率低下,还会骚扰到用户导致给用户带来不好的使用体验。
在本发明的一个实施例中,S101之前,电信用户满意度的预测方法还包括:
将对样本电信用户调研得到的满意度减去第一平均值得到的结果,作为用于训练聚类模型的样本电信用户的满意度和用于训练回归模型的样本电信用户的满意度;第一平均值是样本电信用户所在区县的满意度平均值。
S104包括:
将目标电信用户的类别对应的回归模型输出的数值加上第二平均值得到的结果,作为预测出的对应类别的目标电信用户的满意度;第二平均值是目标电信用户所在区县的满意度平均值。
根据本发明实施例的电信用户满意度的预测方法,由于各个区县用户的满意度相差较大,而区县本身不作为满意度的特征输入。为了考虑各个区县用户的满意度相差较大对预测结果的影响,调研的满意度需要一些处理。将对用户调研得到的满意度减去所在区县的满意度平均值,所得到的结果用于训练聚类模型和回归模型;回归模型输出的结果就是个人满意度与所在区县满意度平均值的差值。因此,回归模型输出的数值加上所在区县满意度平均值的结果就是用户的个人满意度。
在本发明的一个实施例中,S104之后,电信用户满意度的预测方法还包括:
根据市内各区县的满意度,计算市的满意度;区县的满意度是区县内目标用户的满意度平均值。
作为一个示例,一个市包括4个区县,分别是A区、B区、C县和D县;计算A区内所有目标用户的满意度平均值作为A区的满意度,以此类推,得到B区的满意度、C区的满意度和D区的满意度。
根据本发明实施例的电信用户满意度的预测方法,分别统计区县维度上的满意度和市维度上的满意度,方便工作人员从宏观上了解各个区县的用户满意情况和各个市的用户满意情况。
在本发明的一个实施例中,S101之前,电信用户满意度的预测方法还包括:
若样本电信用户的聚类特征对应的值为空,则根据值为空的聚类特征,为值为空的聚类特征设置值。
作为一个示例,在选取完成聚类特征以后,对聚类特征进行预处理。对值为空的聚类特征填充默认值,根据聚类特征的不同含义填充不同的默认值。比如“是否双卡用户”对应的值为空,可以将“是否双卡用户”对应的值设置为0。但是网络类型特征对应的值为0是有具体含义的,如果网络类型特征对应的值为空,不应该将网络类型特征对应的值设置为0,可以该将网络类型特征对应的值设置为一个负值,从而可以对聚类特征进行处理。
S102之前,电信用户满意度的预测方法还包括:
若样本电信用户的回归模型特征对应的值为空,则根据值为空的回归模型特征,为值为空的回归模型特征设置值。
类似于聚类特征的预处理,对值为空的回归模型特征填充默认值。
在本发明的一个实施例中,样本电信用户的聚类特征包括类别类型的特征和数值类型的特征;S101包括:
基于K-Prototypes算法,对样本电信用户的聚类特征和样本电信用户的满意度进行处理,以训练聚类模型。
需要说明的是,数值类型的特征指的是有具体数值的特征,比如,数值类型的特征包括但不限于以下之一或多种的组合:本月已使用的流量、剩余话费、当月消费的话费、客户投诉次数、异网通话占比、单停天数和双停天数。类别类型的特征指的是表示类别的特征,比如,类别类型的特征包括但不限于以下之一或多种的组合:是否为一证多号、是否双卡用户。
对样本电信用户进行聚类处理,得到多个类别的样本电信用户,确定每个类别的样本电信用户的数量和占比。聚类采用K-Prototypes算法,该算法是K-Means的增强版。K-Means只适用于数值类型的特征,而K-Prototypes适用于既数值类型的特征和类别类型的特征。
K-Prototypes算法通过迭代优化找到K个原型点,作为K个群组的代表点。对于数值类型的特征,原型点在这一列是群组内所有点的平均值。而对于类别类型的特征,原型点在这一列的取值是群组内所有点中出现频率最高的值。K-Prototypes算法首先选择K个原型点,遍历所有样本点,把样本点归类到离它最近的原型点,得到K个群组。然后更新原型点,取数值特征的平均值,类别特征出现频率最高的值。接着重新分配样本点到K个群组中,不断迭代,直到每次迭代都没有更新或者迭代到最大迭代次数为止。
K-Prototypes算法有三个主要参数配置,一个是K,K表示聚成多少个群组,即聚成多少个类别。K可以通过业务经验指定,也可以算法尝试多个K,找到群间聚合度低,群内聚合度高的K值。第二个参数是初始化方式,有随机初始化。第三个参数是平衡类别类型和数值类型特征在优化函数中所占的比重值,算法可以自动确定,也可以人为根据经验知识指定。
作为一个示例,S101之前,电信用户满意度的预测方法还包括:对数值类型的聚类特征进行归一化处理,对每一个聚类特征减掉聚类特征总数的平均值,并除以标准差。归一化后,聚类特征的均值为0,方差为1,方便后续聚类的时候比较距离。
回归模型特征包括:类别类型的回归模型特征和数值类型的回归模型特征;S102之前,电信用户满意度的预测方法还包括:
对类别类型的回归模型特征进行One Hot编码;对数值类型的回归模型特征进行归一化,归一化类似于聚类特征的预处理,把回归模型特征归一化成均值为0,方差为1的无量纲形式。
在本发明的一个实施例中,每个类别对应的回归模型是线性回归模型、随机森林模型或者XGBoost模型。
作为一个示例,为每个类别的样本电信用户,建立三种回归模型,根据这三个模型实际效果的对比,选取效果最优的回归模型作为该类别对应的回归模型,用以预测目标电信用户的满意度。
一、线性回归模型可以输出各个回归模型特征的系数,将系数乘以对应回归模型特征的取值可以得到回归模型特征的得分。因此,通过线性回归模型可以得到各个回归模型特征的得分,各个回归模型特征的得分能够更加细致地反映出用户对于各个回归模型特征的满意度。
下面对多元线性回归模型进行详细说明。
1、建立模型
以二元线性回归模型为例,二元线性回归模型如下:
yi=b0+b1x1+b2x2+ui。
类似的使用最小二乘法进行参数估计:
∑y=nb0+b1∑x1+b2∑x2,
∑x1y=b0∑x1+b1∑x1 2+b2∑x1x2,
∑x2y=b0∑x2+b1∑x1x2+b2∑x2 2。
2、拟合优度指标
标准误差:对y值与模型估计值之间的离差的一种度量。其计算公式为:
3、置信范围
置信区间的公式为:置信区间=y′±tpSE,其中,tp是自由度为n-k的t统计量数值表中的数值,n是观察值的个数,k是包括因变量在内的变量的个数。
二、随机森林(Random forest)是一种组成式的有监督学习方法。在随机森林中,我们同时生成多个预测模型,并将模型的结果汇总以提升预测模型的准确率。
随机森林算法(预测和回归)主要包括一下三个方面:
1、从原始数据随机有放回的抽取N个样本单元,生成决策或者回归树。
2、在每一个节点随机抽取m<M个变量,将其作为分割节点的候选变量。每一个节点处变量数应该一致。
3、最终对每一颗决策或者回归树的结果进行整合,生成预测值。
通过建立多棵决策树,最终的预测结果是多棵决策树预测结果的平均值。随机森林使用广泛,大部分情况准确率较高,而且可以直接得到每个回归模型特征的权重。
三、XGBoost(eXtreme Gradient Boosting)是工业界逐渐风靡的基于GradientBoosting(GB,损失函数)算法的一个优化的版本,可以给预测模型带来能力的提升。
回归树的分裂结点对于平方损失函数,拟合的就是残差;对于一般损失函数(梯度下降),拟合的就是残差的近似值,分裂结点划分时枚举所有特征的值,选取划分点。最后预测的结果是每棵树的预测结果相加。
XGBoost算法的步骤和GB基本相同,都是首先初始化为一个常数,GB是根据一阶导数ri,XGBoost是根据一阶导数gi和二阶导数hi,迭代生成基学习器,相加更新学习器。
XGBoost模型是梯度提升树的一种实现,准确率很高,在大部分应用中准确率比深度神经网络还好。随机森林模型和XGBoost模型的准确率比线性回归模型的准确率要高,而且不需要对数据进行归一化,但是无法计算出每项特征的得分。如果需要计算每项特征的得分,可以使用线性回归模型。
图2示出了本发明实施例的一种电信用户满意度的预测装置的框图。该装置200包括:第一训练模块201、第二训练模块202、聚类模块203和预测模块204。
第一训练模块201,用于根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户。
第二训练模块202,用于根据每个类别的样本电信用户的回归模型特征和每个类别的样本电信用户的满意度,训练回归模型,得到每个类别对应的回归模型。
聚类模块203,用于通过训练后的聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别。
预测模块204,用于对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
在本发明的一个实施例中,电信用户满意度的预测装置200还包括:设置模块。
设置模块,用于当样本电信用户的聚类特征对应的值为空时,根据值为空的聚类特征,为值为空的聚类特征设置值。
设置模块,还用于当样本电信用户的回归模型特征对应的值为空时,根据值为空的回归模型特征,为值为空的回归模型特征设置值。
在本发明的一个实施例中,样本电信用户的聚类特征包括类别类型的特征和数值类型的特征;第一训练模块201用于,
基于K-Prototypes算法,对样本电信用户的聚类特征和样本电信用户的满意度进行处理,以训练聚类模型。
在本发明的一个实施例中,每个类别对应的回归模型是线性回归模型、随机森林模型或者XGBoost模型。
在本发明的一个实施例中,电信用户满意度的预测装置200还包括:
第一计算模块,用于将对样本电信用户调研得到的满意度减去第一平均值得到的结果,作为用于训练聚类模型的样本电信用户的满意度和用于训练回归模型的样本电信用户的满意度;第一平均值是样本电信用户所在区县的满意度平均值。
预测模块204,用于将目标电信用户的类别对应的回归模型输出的数值加上第二平均值得到的结果,作为预测出的对应类别的目标电信用户的满意度;第二平均值是目标电信用户所在区县的满意度平均值。
在本发明的一个实施例中,电信用户满意度的预测装置200还包括:
第二计算模块,用于根据市内各区县的满意度,计算市的满意度;区县的满意度是区县内目标用户的满意度平均值。
在本发明的一个实施例中,电信用户满意度的预测装置200还包括:
执行模块,用于针对不同类别的目标电信用户,执行对应的提升用户满意度的策略。
图3示出了本发明实施例的一种计算设备硬件架构的结构图。如图3所示,计算设备300包括输入设备301、输入接口302、处理器303、存储器304、输出接口305、以及输出设备306。
其中,输入接口302、处理器303、存储器304、以及输出接口305通过总线310相互连接,输入设备301和输出设备306分别通过输入接口302和输出接口305与总线310连接,进而与计算设备300的其他组件连接。
具体地,输入设备301接收来自外部的输入信息,并通过输入接口302将输入信息传送到处理器303;处理器303基于存储器304中存储的计算机程序指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器304中,然后通过输出接口305将输出信息传送到输出设备306;输出设备306将输出信息输出到计算设备300的外部供电信用户使用。
当计算机程序指令被处理器303执行时实现本申请上述的方法中的各步骤。
处理器303可以是一个或多个中央处理器(英文:Central Processing Unit,CPU)。在处理器303是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器304可以是但不限于随机存储存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM),可擦除可编程只读存储器(Erasable ProgrammableRead Only Memory,EPROM)、光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、硬盘等中的一种或多种。存储器304用于存储程序代码。
可以理解的是,在本申请实施例中,图2提供的任一模块或全部模块的功能可以用图3所示的处理器303实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机程序指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字电信用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于装置和系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例部分的说明即可。
Claims (10)
1.一种电信用户满意度的预测方法,其特征在于,包括:
根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户;
根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型,得到所述每个类别对应的回归模型;
通过训练后的所述聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别;
对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
2.根据权利要求1所述的方法,其特征在于,所述将目标电信用户聚类成多个类别之后,还包括:
针对不同类别的目标电信用户,执行对应的提升用户满意度的策略。
3.根据权利要求1所述的方法,其特征在于,所述根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型之前,还包括:
将对样本电信用户调研得到的满意度减去第一平均值得到的结果,作为用于训练聚类模型的样本电信用户的满意度和用于训练回归模型的样本电信用户的满意度;所述第一平均值是样本电信用户所在区县的满意度平均值;
所述通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度,包括:
将目标电信用户的类别对应的回归模型输出的数值加上第二平均值得到的结果,作为预测出的对应类别的目标电信用户的满意度;所述第二平均值是目标电信用户所在区县的满意度平均值。
4.根据权利要求3所述的方法,其特征在于,所述通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度之后,还包括:
根据市内各区县的满意度,计算所述市的满意度;区县的满意度是区县内目标用户的满意度平均值。
5.根据权利要求1所述的方法,其特征在于,所述根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型之前,还包括:
若样本电信用户的聚类特征对应的值为空,则根据值为空的聚类特征,为所述值为空的聚类特征设置值;
所述根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型之前,还包括:
若样本电信用户的回归模型特征对应的值为空,则根据值为空的回归模型特征,为所述值为空的回归模型特征设置值。
6.根据权利要求1所述的方法,其特征在于,样本电信用户的聚类特征包括类别类型的特征和数值类型的特征;所述根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型,包括:
基于K-Prototypes算法,对样本电信用户的聚类特征和样本电信用户的满意度进行处理,以训练所述聚类模型。
7.根据权利要求1所述的方法,其特征在于,所述每个类别对应的回归模型是线性回归模型、随机森林模型或者XGBoost模型。
8.一种电信用户满意度的预测装置,其特征在于,包括:
第一训练模块,用于根据样本电信用户的聚类特征和样本电信用户的满意度,训练聚类模型;样本电信用户包括多个类别的样本电信用户;
第二训练模块,用于根据每个类别的样本电信用户的回归模型特征和所述每个类别的样本电信用户的满意度,训练回归模型,得到所述每个类别对应的回归模型;
聚类模块,用于通过训练后的所述聚类模型,对目标电信用户进行聚类,以将目标电信用户聚类成多个类别;
预测模块,用于对于每个类别的目标电信用户,通过目标电信用户的类别对应的回归模型,预测对应类别的目标电信用户的满意度。
9.一种计算设备,其特征在于,包括:处理器、存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810980849.8A CN110866767A (zh) | 2018-08-27 | 2018-08-27 | 电信用户满意度的预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810980849.8A CN110866767A (zh) | 2018-08-27 | 2018-08-27 | 电信用户满意度的预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110866767A true CN110866767A (zh) | 2020-03-06 |
Family
ID=69651288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810980849.8A Pending CN110866767A (zh) | 2018-08-27 | 2018-08-27 | 电信用户满意度的预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866767A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112153636A (zh) * | 2020-10-29 | 2020-12-29 | 浙江鸿程计算机系统有限公司 | 一种基于机器学习预测电信业用户携号转出的方法 |
CN112232945A (zh) * | 2020-10-15 | 2021-01-15 | 中国农业银行股份有限公司 | 一种确定个人客户授信的方法及装置 |
CN112905951A (zh) * | 2021-02-04 | 2021-06-04 | 广西智汇佳人力资源有限公司 | 一种客户属性分析方法 |
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
CN113554448A (zh) * | 2020-04-23 | 2021-10-26 | 支付宝实验室(新加坡)有限公司 | 一种用户流失预测方法、装置及电子设备 |
CN113837323A (zh) * | 2021-11-08 | 2021-12-24 | 中国联合网络通信集团有限公司 | 满意度预测模型的训练方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567391A (zh) * | 2010-12-20 | 2012-07-11 | 中国移动通信集团广东有限公司 | 一种分类预测混合模型的建立方法及装置 |
CN105491599A (zh) * | 2015-12-21 | 2016-04-13 | 南京华苏科技股份有限公司 | 预测lte网络性能指标的新型回归系统 |
CN105654196A (zh) * | 2015-12-29 | 2016-06-08 | 中国电力科学研究院 | 一种基于电力大数据的自适应负荷预测选择方法 |
US20170083920A1 (en) * | 2015-09-21 | 2017-03-23 | Fair Isaac Corporation | Hybrid method of decision tree and clustering technology |
CN108280652A (zh) * | 2016-12-31 | 2018-07-13 | 中国移动通信集团辽宁有限公司 | 用户满意度的分析方法及装置 |
-
2018
- 2018-08-27 CN CN201810980849.8A patent/CN110866767A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567391A (zh) * | 2010-12-20 | 2012-07-11 | 中国移动通信集团广东有限公司 | 一种分类预测混合模型的建立方法及装置 |
US20170083920A1 (en) * | 2015-09-21 | 2017-03-23 | Fair Isaac Corporation | Hybrid method of decision tree and clustering technology |
CN105491599A (zh) * | 2015-12-21 | 2016-04-13 | 南京华苏科技股份有限公司 | 预测lte网络性能指标的新型回归系统 |
CN105654196A (zh) * | 2015-12-29 | 2016-06-08 | 中国电力科学研究院 | 一种基于电力大数据的自适应负荷预测选择方法 |
CN108280652A (zh) * | 2016-12-31 | 2018-07-13 | 中国移动通信集团辽宁有限公司 | 用户满意度的分析方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554448A (zh) * | 2020-04-23 | 2021-10-26 | 支付宝实验室(新加坡)有限公司 | 一种用户流失预测方法、装置及电子设备 |
CN112232945A (zh) * | 2020-10-15 | 2021-01-15 | 中国农业银行股份有限公司 | 一种确定个人客户授信的方法及装置 |
CN112232945B (zh) * | 2020-10-15 | 2023-10-13 | 中国农业银行股份有限公司 | 一种确定个人客户授信的方法及装置 |
CN112153636A (zh) * | 2020-10-29 | 2020-12-29 | 浙江鸿程计算机系统有限公司 | 一种基于机器学习预测电信业用户携号转出的方法 |
CN112905951A (zh) * | 2021-02-04 | 2021-06-04 | 广西智汇佳人力资源有限公司 | 一种客户属性分析方法 |
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
CN113837323A (zh) * | 2021-11-08 | 2021-12-24 | 中国联合网络通信集团有限公司 | 满意度预测模型的训练方法、装置、电子设备及存储介质 |
CN113837323B (zh) * | 2021-11-08 | 2023-07-04 | 中国联合网络通信集团有限公司 | 满意度预测模型的训练方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110866767A (zh) | 电信用户满意度的预测方法、装置、设备及介质 | |
US20210224832A1 (en) | Method and apparatus for predicting customer purchase intention, electronic device and medium | |
CN107451832B (zh) | 推送信息的方法和装置 | |
CN108665148B (zh) | 一种电子资源质量评价方法、装置和存储介质 | |
CN111915156B (zh) | 基于用户价值的业务推送方法、电子设备及存储介质 | |
CN111695084A (zh) | 模型生成方法、信用评分生成方法、装置、设备及存储介质 | |
CN107247728B (zh) | 文本处理方法、装置及计算机存储介质 | |
WO2023000491A1 (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN108416684A (zh) | 一种账号主体的可信程度评估方法、装置及服务器 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN111078997B (zh) | 一种资讯推荐方法及装置 | |
CN109918678A (zh) | 一种字段含义识别方法和装置 | |
CN112380299A (zh) | 关系网络构建方法、装置及存储介质 | |
CN111538909A (zh) | 一种信息推荐方法及装置 | |
CN116739665A (zh) | 信息投放方法、装置、电子设备及存储介质 | |
CN114782123A (zh) | 一种信用评估方法及系统 | |
CN113934937A (zh) | 一种内容智能推荐方法、装置、终端和存储介质 | |
CN113656699A (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN111353793A (zh) | Crm业务推荐方法及装置 | |
GB2517358A (en) | Recommendation creation system | |
CN110717787A (zh) | 一种用户的分类方法及装置 | |
CN112287208A (zh) | 用户画像生成方法、装置、电子设备及存储介质 | |
CN110210884A (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 | |
CN115168700A (zh) | 一种基于预训练算法的信息流推荐方法、系统及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200306 |