CN109962795A - 一种基于多维组合变量的4g用户流失预警方法和系统 - Google Patents
一种基于多维组合变量的4g用户流失预警方法和系统 Download PDFInfo
- Publication number
- CN109962795A CN109962795A CN201711407973.7A CN201711407973A CN109962795A CN 109962795 A CN109962795 A CN 109962795A CN 201711407973 A CN201711407973 A CN 201711407973A CN 109962795 A CN109962795 A CN 109962795A
- Authority
- CN
- China
- Prior art keywords
- user
- index
- early warning
- indexes
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 230000010354 integration Effects 0.000 claims abstract description 5
- 230000006798 recombination Effects 0.000 claims abstract description 5
- 238000005215 recombination Methods 0.000 claims abstract description 5
- 238000004891 communication Methods 0.000 claims description 37
- 238000007477 logistic regression Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000001419 dependent effect Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000030279 gene silencing Effects 0.000 abstract description 5
- 238000000513 principal component analysis Methods 0.000 abstract description 5
- 230000008448 thought Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000013211 curve analysis Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种基于多维组合变量的4G用户流失预警方法和系统,所述方法包括:获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。归纳成消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标5个影响维度,运用主成分分析思想,对维度内的多个变量进行重组整合成信息价值最大化的建模指标,解决估算方程共线性和原始数据信息丢失问题,使得业务指标价值最大化,提升数据预测准确性。
Description
技术领域
本发明涉及通信技术领域,更具体地,涉及一种基于多维组合变量的4G用户流失预警方法和系统。
背景技术
全业务经营趋势加剧了通信运营商之间的市场竞争,为了获得更多的市场占有率,运营商想方设法降低用户流失率,减少用户离网现象的发生。研究表明,一个公司的用户流失率降低5%,利润将会增加 25%至85%,企业往往获得一位新用户的费用是比较高的,但是挽留一个用户有时仅仅只需一个电话或者一个策略。为此运营商需对用户属性进行精准定位,试图挽留存在流失倾向的用户资源。4G网络技术带来了数据的爆炸式增长,4G用户资源俨然已成为运营商核心资源,在大数据时代下,如何有效进行4G用户流失预警,对有流失倾向的用户进行精准定位,是当前重要课题。
针对用户流失预警,现有技术中通常采用的方案包括三种,方案一是采用传统的数据统计分析技术,采集用户消费、用户通话时长、用户主动通信行为等有限的指标,开展常规的指标统计、分析和监控,预测用户是否有流失倾向,以判断是否需要采取相关措施挽留客户;方案二是基于移动用户的通信记录数据,以月为单位,并按照月通话时长、月通话次数、月主被叫比例、月漫游次数、月掉话次数等8种属性类别对移动用户的通信情况进行统计,建立隐马尔可夫模型,实现移动通信用户流失预测方法;方案三是采用多种流失用户预测模型分别进行流失用户预测,选择最接近预设条件的两种或两种以上的流失用户预测模型进行预流失用户的组合预测。
但是,在针对4G通信用户开展的流失预警方法或技术,方案一常规的数据统计分析方法容易使得决策滞后,当发现用户有流失倾向时,该用户已经接近于离网状态,此时再来挽留客户已经意义不大,挽留效果较差。方案二是采用用户消费、用户通话时长、用户主动通信行为等有限的指标,统计、分析和监控,预测用户是否有流失倾向;基于基于移动用户的通信记录数据,以月为单位,并按照月通话时长、月通话次数、月主被叫比例、月漫游次数、月掉话次数等8种属性类别和指标对移动用户的通信情况进行统计,建立隐马尔可夫模型,实现移动通信用户流失预测方法。该方法缺少对移动通信业务的理解和实际市场经验的总结,因此本方法对建模指标的选取,有一定的局限性,难以实现业务指标价值最大化;方案三采用多种流失用户预测模型分别进行流失用户预测,选择最接近预设条件的两种或两种以上的流失用户预测模型进行预流失用户的组合预测,算法复杂度较高,需要执行多种模型和算法,处理效率方面会有不足。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的一种基于多维组合变量的4G用户流失预警方法和系统,解决了现有技术中用户流失挽留决策滞后、处理效率不足,且预测过程中解释变量共线性和原始变量数据信息丢失等问题。
根据本发明的一个方面,提供一种用户流失预警方法,包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
作为优选的,确定该用户为即将流失用户后,还包括:
统计出流失概率大于设定阈值的用户,建立用户流失预警表。
作为优选的,所述消费异动指标包括用户月平均收入ARPU值;所述竞争对手影响指标包括呼转竞争对手次数、网内通话次数、网外通话时长、网外主叫次数、呼叫竞争对手客服次数;所述不正常沉默指标包括平均每户每月通话时间MOU值;异地漫游指标包括异地漫游通话次数、通话总次数;所述使用时间指标为用户入网时长。
作为优选的,通过已建立的用户流失预警模型计算流失概率前,还包括:
基于历史用户数据,获取用户状态及影响用户流失的显著指标,所述用户状态包括已流失、未流失;
以所述显著指标作为自变量,以用户是否流失作为因变量,进行逻辑logistic回归训练,得到用户流失预警模型。
作为优选的,获取已流失的用户以及用户的显著指标后还包括:
通过主成分分析方法,对所述显著指标进行线性重组整合。
作为优选的,进行逻辑logistic回归训练前还包括:
筛选并剔除所述自变量中存在明显相关的显著指标,使得所有自变量都不显著相关;
对自变量进行分散分布情况分析,清除自变量中存在异常和/或奇异值的指标。
作为优选的,得到用户流失预警模型后还包括:
剔除预测P-Value值小于0.05的显著指标,并通过summary函数对用户流失预警模型结果进行验证。
一种用户流失预警系统,包括:
数据获取模块,用户获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
预警模块,用于通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
一种用户流失预警设备,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该测试设备与显示装置的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上述的用户流失预警方法。
一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如上述的用户流失预警方法。
本发明提出一种基于多维组合变量的4G用户流失预警方法和系统,基于多维组合变量Logistic回归预测的方法对潜在流失的4G用户进行更加精确的识别,主要依据历史情况总结4G流失用户的“业务征兆”,归纳成消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标5个影响维度,运用主成分分析思想,对维度内的多个变量进行重组整合成信息价值最大化的建模指标,解决估算方程共线性和原始数据信息丢失问题,使得业务指标价值最大化,提升数据预测准确性。
附图说明
图1为根据本发明实施例的用户流失预警方法流程示意图;
图2为根据本发明实施例的sigmoid函数分布图示意图;
图3为根据本发明实施例的逻辑回归建模测试过程示意图;
图4为根据本发明实施例的缺失值统计示意图;
图5为根据本发明实施例的建模分析时间窗示意图;
图6为根据本发明实施例的ROC曲线分析结果示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,图中示出了一种用户流失预警方法,包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
在本实施例中,确定该用户为即将流失用户后,还包括:
统计出流失概率大于设定阈值的用户,建立用户流失预警表。可以通过统计即将流失的用户,基于用户流失预警表建立挽留决策,对用户流失预警表中的用户进行挽留。
通过对已流失4G用户进行观察、统计、分析,发现在用户流失之前,可能会出现以下方面的业务征兆:
消费异动:与历史消费水平相比,突然出现消费异常波动,一般通信行业选取ARPU值(ARPU-Average Revenue PerUser,用户月平均收入)做为衡量用户消费水平的指标;用于衡量电信运营商和互联网公司业务收入的指标。ARPU注重的是一个时间段内运营商从每个用户所得到的收入。
竞争对手影响:用户日常联系的主要通信圈子外网占比增加,网外通话占比增加,受竞争对手客服的影响,或者有呼转到竞争对手的情况。
不正常沉默:通信行为出现突然减少乃至不正常沉默,从通话时长、通话次数和4G流量的使用情况综合考量。
长期异地漫游:近期经常在异地漫游,则有可能该用户主要生活在异地,有可能换号。
使用时间短:统计分析还发现流失用户与入网时长关系紧密,入网时长越长,流失的可能性越小,因此把入网时长也做为建模指标。
因此,在本实施例中,具体的:
消费异动指标:用户月平均收入ARPU值,可取最近三个月ARPU 值,本月ARPU值,前三个月ARPU均值。
竞争对手影响指标:本月呼转竞争对手次数、网外通话占比(本月网内通话次数、本月网外通话时长、本月网外主叫次数)、本月呼叫竞争对手客服次数。
不正常沉默指标:联系时长波动系数(本月通话时长、前三月通话时长均值、最近三个月每月通话时间(minutes of usage,MOU)值)、联系次数波动系数(本月通话次数、前三月通话次数均值、前三月通话次数、本月通话总次数、最近三个月联系次数),还包括是否属于不正常沉默(本月4G流量);异地漫游指标包括异地漫游通话次数、异地漫游通话波动系数;所述使用时间指标为用户入网时长。
在本实施例中,通过已建立的用户流失预警模型计算流失概率前,还包括:
基于历史用户数据,获取用户状态及影响用户流失的显著指标,所述用户状态包括已流失、未流失;
以所述显著指标作为自变量,以用户是否流失作为因变量,进行逻辑logistic回归训练,得到用户流失预警模型。
逻辑Logistic回归分析方法是数据挖掘技术中的分类方法,是基于统计理论的识别技术,其主要目的是进行分类,同时预估事件发生的概率,它具有很多优点:能处理二值因变量,不需满足其它多变量技术所要求的假设,可以进行模型精确度和拟合优度的检验,以便评估模型的预测力等。Logistic回归可以考察多个属性变量在识别将要流失用户方面的集成贡献,进一步深入理解用户流失的原因,分析哪些因素对于用户流失有影响,从而得到如何处理用户流失的线索。本发明采用了Logistic回归技术来搭建4G用户流失预警模型。Logistic回归模型是一个非线性模型,Logistic回归模型使用了sigmoid函数,该函数的数学公式为:
其函数分布图如图2所示,具有S型分布。可以看到sigmoid函数是一个s形曲线,它的取值在[0,1]之间,在远离0的地方函数的值会很快接近0/1,这个性质使得能够以概率的方式来预测,也可用于分类。从运营商的角度,用户状态可分为在网和离网,在网为依然使用运营商为其提供的服务,离网为不再使用,也即是流失。判断用户状态属于一个典型的二分类变量问题,Logistic回归分析适合处理这类问题, Logistic回归模型具体公式如下:
由于是非线性模型,从而就少了像线性模型那样的约束,如自变量与因变量需具有线性关系等。其实逻辑回归本质上是线性回归的一种,只是逻辑回归中的因变量是未知的类别变量取某一个值的概率。逻辑回归是一个被logistic方程归一化后的线性回归,事实上以上模型公式只需进行logit变换即可变换成线性形式即:
在大数据时代下,大数据处理技术擅长全量数据分析,R语言的优势则在样本数据分析,SparkR可以将两种技术结合在一起,刚好可以取长补短。因此,面对海量数据,本实施例中采用SparkR技术语言做为数据建模语言。
在本实施例中,获取已流失的用户以及用户的显著指标后还包括:通过主成分分析方法,对所述显著指标进行线性重组整合。
具体的,通过主成分分析的思想,对建模指标变量进行线性重组整合,使得模型具有众多解释变量的情况下,实现降维和减少原始数据中所含信息的丢失,替代原始数据的主成分之间彼此互不相干。从p 个相关的解释变量中推导出K个互不相关的主成分,每个主成分都是原始变量的线性拟合。第一个主成分最大限度的解释了原始变量数据的方差具有最大的特征值,第二个主成分与第一个主成分之间不存在线性相关关系,它最大程度解释了原始变量数据的剩余方差。以此类推,第k个主成分与其他所有主成分之间均不存在线性相关关系,它在所有主成分解释的原始变量数据的方差中排名第k。以这k个主成分作为logistic回归模型的解释变量来预测4G用户流失概率,就可以克服单纯的logistic回归存在的共线性和原始变量数据信息丢失等问题,使得业务指标价值最大化。建模指标进行主成分分析后如下表所示:
上述步骤中设计了4G用户流失模型的组合解释变量,为了能更高效进行数据运算,采用SparkR实现模型的全过程,首先需要训练logistic 回归模型预测4G用户流失概率。建模过程:该业务问题是一个二元预测问题(是否流失),并且与之相关的数据大都是数值型的数据,适合用逻辑回归的方法来建模,如图3所示。
将所有基础数据集从数据集市导出到R语言建模环境,在该建模环境对数据进行预处理,采用统计方法,计算生成数据建模指标。因变量为用户是否流失,也即该字段判断用户是在网还是已经离网,自变量为用户消费通信行为各指标字段。
在对基础数据进行数据探索的过程中,发现存在缺失值,因此利用R语言VIM包aggr函数进行缺失值分析,绘制缺失值统计图如图4 中所示。
考虑到缺失值或异常值对统计分析结果和建模结果会产生不利影响,因此直接剔除缺失的数据和消费波动很大的数据。
进行建模指标的相关性分析,部分指标的相关分析结果如下表所示:
回归分析一般假设,建模变量之间都是独立不相关的,如果有任何两个变量存在强相关性,这只需保留其中一个而删除其余变量。将建模指标中存在明显相关的指标进行筛选剔除,使得所有自变量都不显著相关,避免自变量之间存在很强的共线性导致模型效果不好。
采用箱线图、直方图、KDE曲线等统计图表技术对各建模指标数据进行分散分布情况分析,发现异常指标,寻找奇异值,并进一步进行数据清洗和数据转换,确保建模数据的有效性。
研究过程中将样本数据按0.6、0.4的比例分为训练集和测试集,进行数据建模分析的时间窗口设置如图5所示。
采用R语言glm函数对已经完成数据清洗转换的训练集数据建模指标进行Logistic回归建模,经过反复多次的建模指标分析,剔除掉 P-Value值小于0.05的指标。再用summary函数对模型结果进行初步评估,如下表所示。
从上述评估结果可以发现,所有变量的P值均小于0.05,通过了显著性检验。至此,已完成了基于SparkR语言搭建的通信运营商4G 用户流失预警模型,接下来需要对模型进行评估。
用户流失预警模型建立后,还需要进行建模评估,首先对模型进行卡方检验anova(object=fit.full,test='Chisq'),如下表所示。
随着变量从第一个到最后一个逐个加入模型,模型最终通过显著性检验,说明由上述这些变量组成的模型是有意义的,并且是正确的。
采用ROC(Receiver Operating Characteristic curve,受试者工作特征曲线)曲线分析方法,一种可视化的方法来衡量模型的优劣。该曲线的横坐标和纵坐标各表示1-反例的覆盖率和正例的覆盖率。采用R 语言pROC包的roc函数计算ROC曲线各项结果值,用ggplot2包ggplot 函数绘制图形如图6所示。
ROC分析思想来源于统计学的决策理论,ROC曲线越凸说明判断模型价值越高,并可以通过计算ROC曲线下的面积做定量分析,面积越接近1,表明模型效果越好。上述图AUC即为ROC曲线和y=x直线之间的面积,模型的优劣是通过该面积大小来判断的,而对于一般情况而言,AUC大于0.7就能够说明模型是比较合理的。上述结果中, AUC为0.86,表明本次发明中建立的模型是合理的。
使用已建好的模型计算测试数据集流失概率,取流失概率大于0.5 的用户预测其潜在流失,再与实际情况比较得到命中率pv=74%,而在随机的方式下抽取出正类的比例k=10%,从而lift=pv/k=7.4,预测效果提升了7.4倍,同时计算模型的整体准确率达到了91.4%,因此本方法搭建的模型效果是明显的,模型预测的准确率也能达到较高水平,因此从消费异动、竞争对手影响、不正常沉默和长期异地漫游等多维度组合指标建模能准确的预测用户是否潜在流失。
本实施例中还提供了一种用户流失预警系统,包括:
数据获取模块,用户获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
预警模块,用于通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。本实施例中的用户流失预警系统的处理流程与上述的用户流失预警方法相同,因此不再赘述。
本实施例中还提供了一种用户流失预警设备,包括:处理器 (processor)、存储器(memory)、通信接口(Communications Interface)和总线;
其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该测试设备与显示装置的通信设备之间的信息传输;
所述处理器用于调用所述存储器中的程序指令,以执行上述各方法实施例所提供的用户流失预警方法,例如包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
本实施例中还提供了一种用户流失预警设备,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该测试设备与显示装置的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述各方法实施例所提供的用户流失预警方法,例如包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
本实施例还公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的用户流失预警方法,例如包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
本实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的用户流失预警方法,例如包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
综上所述,本发明提出一种基于多维组合变量的4G用户流失预警方法和系统,基于多维组合变量Logistic回归预测的方法对潜在流失的 4G用户进行更加精确的识别,主要依据历史情况总结4G流失用户的“业务征兆”,归纳成消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标5个影响维度,运用主成分分析思想,对维度内的多个变量进行重组整合成信息价值最大化的建模指标,解决估算方程共线性和原始数据信息丢失问题,使得业务指标价值最大化,提升数据预测准确性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的显示装置的测试设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用户流失预警方法,其特征在于,包括:
获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
2.根据权利要求1所述的用户流失预警方法,其特征在于,确定该用户为即将流失用户后,还包括:
统计出流失概率大于设定阈值的用户,建立用户流失预警表。
3.根据权利要求1所述的用户流失预警方法,其特征在于,所述消费异动指标包括用户月平均收入ARPU值;所述竞争对手影响指标包括呼转竞争对手次数、网内通话次数、网外通话时长、网外主叫次数、呼叫竞争对手客服次数;所述不正常沉默指标包括平均每户每月通话时间MOU值;异地漫游指标包括异地漫游通话次数、通话总次数;所述使用时间指标为用户入网时长。
4.根据权利要求1所述的用户流失预警方法,其特征在于,通过已建立的用户流失预警模型计算流失概率前,还包括:
基于历史用户数据,获取用户状态及影响用户流失的显著指标,所述用户状态包括已流失、未流失;
以所述显著指标作为自变量,以用户是否流失作为因变量,进行逻辑logistic回归训练,得到用户流失预警模型。
5.根据权利要求4所述的用户流失预警方法,其特征在于,获取已流失的用户以及用户的显著指标后还包括:
通过主成分分析方法,对所述显著指标进行线性重组整合。
6.根据权利要求4所述的用户流失预警方法,其特征在于,进行逻辑logistic回归训练前还包括:
筛选并剔除所述自变量中存在明显相关的显著指标,使得所有自变量都不显著相关;
对自变量进行分散分布情况分析,清除自变量中存在异常和/或奇异值的指标。
7.根据权利要求4所述的用户流失预警方法,其特征在于,得到用户流失预警模型后还包括:
剔除预测P-Value值小于0.05的显著指标,并通过summary函数对用户流失预警模型结果进行验证。
8.一种用户流失预警系统,其特征在于,包括:
数据获取模块,用户获取影响用户流失的显著指标,所述显著指标包括消费异动指标、竞争对手影响指标、不正常沉默指标、异地漫游指标和使用时间指标;
预警模块,用于通过已训练的用户流失预警模型计算流失概率,若流失概率大于设定阈值,则确定该用户为即将流失用户。
9.一种用户流失预警设备,其特征在于,包括:
至少一个处理器、至少一个存储器、通信接口和总线;其中,
所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述通信接口用于该测试设备与显示装置的通信设备之间的信息传输;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711407973.7A CN109962795A (zh) | 2017-12-22 | 2017-12-22 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711407973.7A CN109962795A (zh) | 2017-12-22 | 2017-12-22 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109962795A true CN109962795A (zh) | 2019-07-02 |
Family
ID=67019702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711407973.7A Pending CN109962795A (zh) | 2017-12-22 | 2017-12-22 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109962795A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274791A (zh) * | 2020-01-13 | 2020-06-12 | 江苏艾佳家居用品有限公司 | 一种线上家装场景下用户流失预警模型的建模方法 |
CN111311318A (zh) * | 2020-02-12 | 2020-06-19 | 上海东普信息科技有限公司 | 用户流失预警的方法、装置、设备及存储介质 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112100067A (zh) * | 2020-09-10 | 2020-12-18 | 北京完美赤金科技有限公司 | 一种基于回归分析的测试方法、系统及存储介质 |
CN112288117A (zh) * | 2019-07-23 | 2021-01-29 | 贝壳技术有限公司 | 目标客户的成交概率预测方法、装置与电子设备 |
CN112365036A (zh) * | 2020-10-28 | 2021-02-12 | 上海东普信息科技有限公司 | 物流客户流失预警方法、装置、设备和存储介质 |
CN112671573A (zh) * | 2020-12-17 | 2021-04-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN113055208A (zh) * | 2019-12-27 | 2021-06-29 | 中移信息技术有限公司 | 基于迁移学习的信息识别模型的识别方法、装置、设备 |
CN113256044A (zh) * | 2020-02-13 | 2021-08-13 | 中国移动通信集团广东有限公司 | 一种策略的确定方法、装置及电子设备 |
CN113449593A (zh) * | 2021-05-25 | 2021-09-28 | 北京达佳互联信息技术有限公司 | 针对主播流失情况的预警方法及装置 |
CN113516398A (zh) * | 2021-07-22 | 2021-10-19 | 北京淇瑀信息科技有限公司 | 基于分层抽样的风险设备识别方法、装置及电子设备 |
CN113657635A (zh) * | 2020-05-12 | 2021-11-16 | 中国移动通信集团湖南有限公司 | 一种预测通信用户流失的方法及电子设备 |
CN113962740A (zh) * | 2021-10-27 | 2022-01-21 | 彩虹无线(北京)新技术有限公司 | 汽车4s店客户流失的预警方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102711078A (zh) * | 2012-06-06 | 2012-10-03 | 中国移动通信集团新疆有限公司 | 移动通信资费的测算方法 |
CN103164474A (zh) * | 2011-12-15 | 2013-06-19 | 中国移动通信集团贵州有限公司 | 一种对数据业务进行分析的方法 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN103905229A (zh) * | 2012-12-27 | 2014-07-02 | 中国移动通信集团四川有限公司 | 一种终端用户流失预警方法与装置 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
-
2017
- 2017-12-22 CN CN201711407973.7A patent/CN109962795A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164474A (zh) * | 2011-12-15 | 2013-06-19 | 中国移动通信集团贵州有限公司 | 一种对数据业务进行分析的方法 |
CN102711078A (zh) * | 2012-06-06 | 2012-10-03 | 中国移动通信集团新疆有限公司 | 移动通信资费的测算方法 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN103905229A (zh) * | 2012-12-27 | 2014-07-02 | 中国移动通信集团四川有限公司 | 一种终端用户流失预警方法与装置 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112288117A (zh) * | 2019-07-23 | 2021-01-29 | 贝壳技术有限公司 | 目标客户的成交概率预测方法、装置与电子设备 |
CN113055208B (zh) * | 2019-12-27 | 2023-01-13 | 中移信息技术有限公司 | 基于迁移学习的信息识别模型的识别方法、装置、设备 |
CN113055208A (zh) * | 2019-12-27 | 2021-06-29 | 中移信息技术有限公司 | 基于迁移学习的信息识别模型的识别方法、装置、设备 |
CN111274791A (zh) * | 2020-01-13 | 2020-06-12 | 江苏艾佳家居用品有限公司 | 一种线上家装场景下用户流失预警模型的建模方法 |
CN111274791B (zh) * | 2020-01-13 | 2023-08-18 | 江苏艾佳家居用品有限公司 | 一种线上家装场景下用户流失预警模型的建模方法 |
CN111311318A (zh) * | 2020-02-12 | 2020-06-19 | 上海东普信息科技有限公司 | 用户流失预警的方法、装置、设备及存储介质 |
CN113256044A (zh) * | 2020-02-13 | 2021-08-13 | 中国移动通信集团广东有限公司 | 一种策略的确定方法、装置及电子设备 |
CN113256044B (zh) * | 2020-02-13 | 2023-08-15 | 中国移动通信集团广东有限公司 | 一种策略的确定方法、装置及电子设备 |
CN113657635A (zh) * | 2020-05-12 | 2021-11-16 | 中国移动通信集团湖南有限公司 | 一种预测通信用户流失的方法及电子设备 |
CN113657635B (zh) * | 2020-05-12 | 2023-10-27 | 中国移动通信集团湖南有限公司 | 一种预测通信用户流失的方法及电子设备 |
CN111740866A (zh) * | 2020-06-24 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种离网预测方法及装置 |
CN112100067A (zh) * | 2020-09-10 | 2020-12-18 | 北京完美赤金科技有限公司 | 一种基于回归分析的测试方法、系统及存储介质 |
CN112100067B (zh) * | 2020-09-10 | 2023-08-25 | 北京完美赤金科技有限公司 | 一种基于回归分析的测试方法、系统及存储介质 |
CN112365036A (zh) * | 2020-10-28 | 2021-02-12 | 上海东普信息科技有限公司 | 物流客户流失预警方法、装置、设备和存储介质 |
CN112671573B (zh) * | 2020-12-17 | 2023-05-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN112671573A (zh) * | 2020-12-17 | 2021-04-16 | 北京神州泰岳软件股份有限公司 | 识别宽带业务中潜在离网用户的方法及装置 |
CN113449593A (zh) * | 2021-05-25 | 2021-09-28 | 北京达佳互联信息技术有限公司 | 针对主播流失情况的预警方法及装置 |
CN113449593B (zh) * | 2021-05-25 | 2024-09-20 | 北京达佳互联信息技术有限公司 | 数据识别方法及装置 |
CN113516398A (zh) * | 2021-07-22 | 2021-10-19 | 北京淇瑀信息科技有限公司 | 基于分层抽样的风险设备识别方法、装置及电子设备 |
CN113962740A (zh) * | 2021-10-27 | 2022-01-21 | 彩虹无线(北京)新技术有限公司 | 汽车4s店客户流失的预警方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109962795A (zh) | 一种基于多维组合变量的4g用户流失预警方法和系统 | |
JP5459608B2 (ja) | 通信網の障害原因分析システムと障害原因分析方法、及び障害原因分析用プログラム | |
CN112702224B (zh) | 一种针对家庭宽带用户质差的分析方法和装置 | |
CN111385420B (zh) | 用户的识别方法、装置、存储介质及电子装置 | |
CN114076841B (zh) | 基于用电信息数据的窃电行为识别方法及系统 | |
CN110119948A (zh) | 基于时变权重动态组合的电力用户信用评价方法及系统 | |
CN114841705B (zh) | 一种基于场景识别的反欺诈监测方法 | |
TWI677830B (zh) | 模型中關鍵變量的探測方法及裝置 | |
CN110782163A (zh) | 企业数据处理方法和装置 | |
CN114138601A (zh) | 一种业务告警方法、装置、设备及存储介质 | |
CN107274025B (zh) | 一种实现用电模式智能识别与管理的系统和方法 | |
CN115705282A (zh) | 小区网络异常检测方法、装置及计算机可读存储介质 | |
CN101345656A (zh) | 全局故障率测量方法 | |
CN116781431A (zh) | 一种基于流量特征的api接口异常行为监测方法 | |
CN111428963A (zh) | 一种数据处理方法及装置 | |
CN114202110B (zh) | 一种基于rf-xgboost的业务故障预测方法及装置 | |
CN115619430A (zh) | 用户价值评估方法及装置 | |
CN111327442B (zh) | 基于控制图的投诉预警阈值获取方法及装置 | |
CN113360309B (zh) | 一种用于识别服务零碎异常线索的方法 | |
CN113743532B (zh) | 异常检测方法、装置、设备及计算机存储介质 | |
CN113256044B (zh) | 一种策略的确定方法、装置及电子设备 | |
CN116934368A (zh) | 一种用户流失管理方法、装置及存储介质 | |
CN117764705A (zh) | 一种基于存量客户的风险分析方法 | |
Yaqoob et al. | An Adaptive Rule-Based Approach to Resolving Real-Time VoIP Wholesale Billing Disputes. | |
CN117057450A (zh) | 一种5g用户投诉预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190702 |