CN103905229B - 一种终端用户流失预警方法与装置 - Google Patents
一种终端用户流失预警方法与装置 Download PDFInfo
- Publication number
- CN103905229B CN103905229B CN201210578628.0A CN201210578628A CN103905229B CN 103905229 B CN103905229 B CN 103905229B CN 201210578628 A CN201210578628 A CN 201210578628A CN 103905229 B CN103905229 B CN 103905229B
- Authority
- CN
- China
- Prior art keywords
- user
- user property
- strong correlation
- property
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种终端用户流失预警方法及装置,该方法包括:获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值;若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。通过对历史流失数据进行分析,确定与用户流失强相关的用户属性,从而事先进行用户流失预警。
Description
技术领域
本发明涉及计算机领域中的数据挖掘技术,尤其涉及一种终端用户流失预警方法与装置。
背景技术
随着移动通信产品的丰富多样化,终端用户流失成为运营商面对的严峻问题,现有技术中的用户流失预警机制建设主要依靠聚到信息支撑和后台信息支撑来完成。其中渠道信息支撑是指在客户咨询过程中,根据对客户的满意度调查,实现用户流失的预警。后台信息支撑是指各类用户信息记录,记录用户在入网、缴费、投诉咨询和离网过程中的信息,提供给营业和服务前端,然后依靠熟悉业务知识、具有丰富经验和综合分析能力的人员,根据已掌握的历史资料和直观材料,运用个人的经验和分析判断能力,做出用户流失预警。
现有技术主要依靠人工经验判断,易受人的知识、经验和能力的多少大小的束缚和限制,缺乏可量化的精确描述。
发明内容
针对传统技术的上述缺陷,本发明实施例提供一种终端用户流失预警方法与装置。
本发明实施例提供一种终端用户流失预警方法,包括:
获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性 能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值;
若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
本发明实施例提供一种终端用户流失预警装置,包括:
获取模块,用于获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
第一处理模块,用于计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性;
第二处理模块,用于根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
附图说明
图1为本发明终端用户流失预警方法第一实施例的流程图;
图2为本发明终端用户流失预警方法第二实施例的流程图;
图3为本发明终端用户流失预警方法第三实施例的流程图;
图4为本发明终端用户流失预警装置第一实施例的结构示意图;
图5为本发明终端用户流失预警装置第二实施例的结构示意图;
图6为本发明终端用户流失预警装置第三实施例的结构示意图。
具体实施方式
图1为本发明终端用户流失预警方法第一实施例的流程图,如图1所示,本发明实施例提供的终端用户流失预警方法由终端用户流失预警装置执行,该终端用户流失预警装置设置于网络侧的服务器上,与GB接口通信连接。
终端用户流失预警装置可以采用软件和/或硬件的形式来实现,该方法包括:
步骤S100,获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
步骤S102,计算所述多维度用户信息中每个用户属性的信息增益;
步骤S106,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则进入步骤S108;
步骤S108,将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
具体地,终端用户流失预警装置与GB接口通信连接,通过GB接口获取多维度用户信息和采样数据。
其中多维度用户信息包括用户背景信息,如用户的性别,年龄,主资费品牌,地市,区县,网龄,VIP等级等;用户消费信息,如月份,总流量,总消费,语音消费,数据消费等;用户位置信息,如用户常驻小区,农村/城市,学校/住宅区/工业区等;用户终端信息,如终端品牌,型号,制式,操作系统等。采样数据为全网数据,包括全网每个月的离网用户数总数、在网用户总数以及具有每个用户属性的离网用户数和在网用户数。例如,全网每个月的离网用户数为988856,在网用户数为52554784,月消费200元以上的离网用户数为1256,在网用户数为456852。
计算多维度用户信息中每个用户属性的信息增益,信息增益用户表示每 个用户属性和用户流失的相关性,信息增益越大,表明该用户属性的和用户流失的相关性越高。
根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若小于预设相关性能阀值则说明该用户属性为弱相关用户属性,删除该用户属性;若高于所述预设相关性能阀值,则将用户信息作为强相关用户属性,计算每个强相关用户属性的用户流失概率。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
图2为本发明终端用户流失预警方法第二实施例的流程图,如图2所示,该方法由终端用户流失预警装置执行,终端用户流失预警装置可以采用软件和/或硬件的形式来实现,该方法包括:
步骤S200,采集GB接口信令数据、IMEI终端数据以及经分数据;
终端用户流失预警装置与GB接口通信连接,通过GB接口采集GB接口信令数据、国际移动设备身份码(International Mobile Equipment Identity,简称IMEI)终端数据以及经分数据。其中GB接口信令数据是指与用户上网行为和感知相关的GB接口信令,主要包括以下数据:1、体现客户终端感受的信令数据,例如客户终端等级、GPRS连接平均时间、GPRS连接成功率、客户接入性能(PDP激活)成功率,首页显示时间、网页登陆成功率;2、体现客户移动性能的信令数据,例如路由更新成功率、路由更新时长、小区重选时长、客户数据业务传递性能下载速率、下载成功率、数据包重传率、数据包丢包率、数据包乱序率、无线网络时延、网络侧发起的去激活数、网络侧(SGSN发起)发起的去激活数等;3、用户位置信息,例如行政区域,城镇/农村,区域属性,如学校/商业区等。
IMEI终端数据是指用户终端识别信息,通过此信息可以识别出终端的品牌型号、制式(如GSM、TD_SCDMA、WCDNMA等)、上网功能(如支持GPRS、 EDGE、HSDPA、WIFI等)、操作系统(如安卓、IOS、WP8、塞班等)等。
经分数据是指由经分系统输出的相关数据,如用户使用数据业务的流量、价值、每用户平均收入等。
步骤S202,根据所述GB接口信令数据、IMEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据;
通过对GB接口信令数据、IMEI终端数据以及经分数据进行数据归纳,提取出多维度用户信息和采样数据。其中多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性;采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数。
步骤S204,根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息;
步骤S206,根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子;
步骤S208,根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子;
根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息。例如:s1,S2…Sm为采样的样本,I(S1,S2,…,Sm)为该采样样本分类的期望信息。本次用户流失相关性分析在里,m=2,I(S1,S2,…,Sm)=I(S1,S2);S1为离网用户数;S2为在网用户数。期望信息的计算方法为:
针对每个用户属性,根据每个用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子。根据采样数据的期望信息和每个用户属性的客户流失因子,计算每个用户属性的信息增益,信息增益等于期望信息约减所述客户流失因子。信息增益越大,表明该用户属性与用户流失的相关性越高。
例如:用户属性A的客户流失因子为E(A),用户属性A的信息增益为Gain(A),因此该信息增益Gain(A)=I(s1,s2,...,sm)-E(A)。
在优选的实施例中,每个所述用户属性的客户流失因子等于每个用户属性的熵。
例如用户属性A的客户流失因子为E(A),该客户流失因子的计算公式为:
步骤S210,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则进入步骤S212,若低于所述预设相关性能阀值,则删除该用户属性;
步骤S212,将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
步骤S210和步骤S212与上述实施例中的相应步骤相同,在此不再赘述。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
图3为本发明终端用户流失预警方法第三实施例的流程图,如图3所示,该方法由终端用户流失预警装置执行,终端用户流失预警装置可以采用软件和/或硬件的形式来实现,该方法包括:
步骤S300,采集GB接口信令数据、IMEI终端数据以及经分数据;
步骤S302,根据所述GB接口信令数据、IMEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据;
通过对GB接口信令数据、IMEI终端数据以及经分数据进行数据归纳,提取出多维度用户信息和采样数据。其中多维度用户信息中包括用户背景属 性、用户消费属性、用户位置属性以及用户终端属性;采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数。
步骤S304,根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息;
步骤S306,根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子;
步骤S308,根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子;
步骤S310,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则进入步骤S312,若低于所述预设相关性能阀值,则删除该用户属性;
步骤S312,将所述用户属性作为强相关用户属性,根据所述离网用户总数计算用户离网概率;
步骤S314,根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率;
步骤S316,根据每个强相关用户属性的离网用户数计算满足所述强相关用户属性的离网用户概率;
步骤S318,根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概率。
具体地,步骤S300至步骤S308与上述实施例中相应步骤的方法流程相同,在此不再赘述。
根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将用户信息作为强相关用户属性,根据离网用户总数计算用户离网概率;根据每个强相关用户属性的离网用户数和在网用户数,计算满足强相关用户属性的用户概率;根据每个强相关用户属性的离网用户数计算满足强相关用户属性的离网 用户概率;根据用户离网概率、强相关用户属性的用户概率和强相关用户属性的离网用户概率,通过贝叶斯算法计算每个强相关属性的用户流失概率,公式如下:其中P(H)为采样数据中的用户离网概率;P(X)为采样样本中,满足强相关用户属性X的用户概率;P(X/H)为在H的条件下,X的后验概率;即满足强相关用户属性的离网用户概率;P(H/X)为在强相关用户属性X的条件下,H的后验概率,即每个强相关属性的用户流失概率。
例如:某地市,80388名流失用户中,满足用户属性X(终端制式只支持GPRS,用户消费高于200元)的离网用户数为941人,由此可得:
P(X/H)=941/80388=0.012;
全网用户总数共2473388名,满足用户属性X的在网用户数为9650名,由此可得:
P(X)=9650/2473388=0.0039;
P(H)=80388/2473388=0.0325;
因此P(H/X)=0.012*0.0325/0.0039=10%。
终端制式只支持GPRS,消费高于200元的用户的用户流失概率为10%。
在优选的实施例中,每个所述用户属性的客户流失因子等于每个用户属性的熵。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
图4为本发明终端用户流失预警装置第一实施例的结构示意图,如图4所示,该装置可以采用软件和/或硬件的形式来实现,具体包括获取模块11、第一处理模块12和第二处理模块13:
获取模块11,用于获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
第一处理模块12,用于计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性;
第二处理模块13,用于根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
具体地,获取模块11与GB接口通信连接,通过GB接口获取多维度用户信息和采样数据,并发送至第一处理模块12。其中多维度用户信息包括用户背景信息,如用户的性别,年龄,主资费品牌,地市,区县,网龄,VIP等级等;用户消费信息,如月份,总流量,总消费,语音消费,数据消费等;用户位置信息,如用户常驻小区,农村/城市,学校/住宅区/工业区等;用户终端信息,如终端品牌,型号,制式,操作系统等。采样数据为全网数据,包括全网每个月的离网用户数总数、在网用户总数以及具有每个用户属性的离网用户数和在网用户数。例如,全网每个月的离网用户数为988856,在网用户数为52554784,月消费200元以上的离网用户数为1256,在网用户数为456852。
第一处理模块12计算多维度用户信息中每个用户属性的信息增益,信息增益用户表示每个用户属性和用户流失的相关性,信息增益越大,表明该用户属性的和用户流失的相关性越高。
根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若小于预设相关性能阀值则说明该用户属性为弱相关用户属性,删除该用户属性;若高于所述预设相关性能阀值,则通知第二处理模块13将用户信息作为强相关用户属性,计算每个强相关用户属性的用 户流失概率。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
图5为本发明终端用户流失预警装置第二实施例的结构示意图,如图5所示,该装置可以采用软件和/或硬件的形式来实现,具体包括获取模块21、第一处理模块22和第二处理模块23,其中第二处理模块23的功能实现方法与上述实施例中相应功能模块相同,在此不再赘述,其中获取模块21包括采集单元211和提取单元212:
采集单元211,用于采集GB接口信令数据、IMEI终端数据以及经分数据。
提取单元212,根据所述GB接口信令数据、IMEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据。
具体地,采集单元211与GB接口通信连接,通过GB接口采集GB接口信令数据、国际移动设备身份码(International Mobile Equipment Identity,简称IMEI)终端数据以及经分数据,并发送至提取单元212。其中GB接口信令数据是指与用户上网行为和感知相关的GB接口信令,主要包括以下数据:1、体现客户终端感受的信令数据,例如客户终端等级、GPRS连接平均时间、GPRS连接成功率、客户接入性能(PDP激活)成功率,首页显示时间、网页登陆成功率;2、体现客户移动性能的信令数据,例如路由更新成功率、路由更新时长、小区重选时长、客户数据业务传递性能下载速率、下载成功率、数据包重传率、数据包丢包率、数据包乱序率、无线网络时延、网络侧发起的去激活数、网络侧(SGSN发起)发起的去激活数等;3、用户位置信息,例如行政区域,城镇/农村,区域属性,如学校/商业区等。
IMEI终端数据是指用户终端识别信息,通过此信息可以识别出终端的品牌型号、制式(如GSM、TD_SCDMA、WCDNMA等)、上网功能(如支持GPRS、 EDGE、HSDPA、WIFI等)、操作系统(如安卓、IOS、WP8、塞班等)等。
经分数据是指由经分系统输出的相关数据,如用户使用数据业务的流量、价值、每用户平均收入等。
提取单元212根据GB接口信令数据、IMEI终端数据以及经分数据提取多维度用户信息和所述采样数据,并发送至第一处理模块22。
进一步地,第一处理模块22包括期望信息计算单元221,客户流失因子计算单元222,信息增益计算单元223,和信息增益判断单元224其中:
期望信息计算单元221,用于根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息。
客户流失因子计算单元222,用于根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子。
信息增益计算单元223,用于根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子。
信息增益判断单元224,用于根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性。
具体地,根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息。例如:s1,S2…Sm为采样的样本,I(S1,S2,…,Sm)为该采样样本分类的期望信息。本次用户流失相关性分析在里,m=2,I(S1,S2,…,Sm)=I(S1,S2);S1为离网用户数;S2为在网用户数。期望信息的计算方法为:
针对每个用户属性,根据每个用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子。根据采样数据的期望信息和每个用户属性的客户流失因子,计算每个用户属性的信息增益,信息增益等于期望信息约减所述客户流失因子。信息增益越大,表明该用户属性与用户流失的相 关性越高。
例如:用户属性A的客户流失因子为E(A),用户属性A的信息增益为Gain(A),因此该信息增益Gain(A)=I(s1,s2,...,sm)-E(A)。
在优选的实施例中,每个所述用户属性的客户流失因子等于每个用户属性的熵。
例如用户属性A的客户流失因子为E(A),该客户流失因子的计算公式为:
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
图6为本发明终端用户流失预警装置第三实施例的结构示意图,如图6所示,该装置可以采用软件和/或硬件的形式来实现,具体包括获取模块31、第一处理模块32和第二处理模块33,其中获取模块31和第一处理模块32的功能实现方法与上述实施例中相应功能模块相同,在此不再赘述,其中第二处理模块33包括用户离网概率计算单元331,强相关用户属性的用户概率计算单元332,强相关用户属性的离网用户概率计算单元333,和强相关用户属性的用户流失概率计算单元334:
用户离网概率计算单元331,用于根据所述离网用户总数计算用户离网概率;
强相关用户属性的用户概率计算单元332,用于根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率;
强相关用户属性的离网用户概率计算单元333,用于根据每个强相关用 户属性的离网用户数计算满足所述强相关用户属性的离网用户概率;
强相关用户属性的用户流失概率计算单元334,用于根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概率。
具体地,第一处理模块32根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将用户信息作为强相关用户属性并通知第二处理模块33。用户离网概率计算单元331根据离网用户总数计算用户离网概率;强相关用户属性的用户概率计算单元332根据每个强相关用户属性的离网用户数和在网用户数,计算满足强相关用户属性的用户概率;强相关用户属性的离网用户概率计算单元333根据每个强相关用户属性的离网用户数计算满足强相关用户属性的离网用户概率;强相关用户属性的用户流失概率计算单元334根据用户离网概率、强相关用户属性的用户概率和强相关用户属性的离网用户概率,通过贝叶斯算法计算每个强相关属性的用户流失概率,公式如下: 其中P(H)为采样数据中的用户离网概率;P(X)为采样样本中,满足强相关用户属性X的用户概率;P(X/H)为在H的条件下,X的后验概率;即满足强相关用户属性的离网用户概率;P(H/X)为在强相关用户属性X的条件下,H的后验概率,即每个强相关属性的用户流失概率。
例如:某地市,80388名流失用户中,满足用户属性X(终端制式只支持GPRS,用户消费高于200元)的离网用户数为941人,由此可得:
P(X/H)=941/80388=0.012;
全网用户总数共2473388名,满足用户属性X的在网用户数为9650名,由此可得:
P(X)=9650/2473388=0.0039;
P(H)=80388/2473388=0.0325;
因此P(H/X)=0.012*0.0325/0.0039=10%。
终端制式只支持GPRS,消费高于200元的用户的用户流失概率为10%。
在优选的实施例中,每个所述用户属性的客户流失因子等于每个用户属性的熵。
在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
应说明的是:以上实施例仅用以说明本发明而非限制,本发明也并不仅限于上述举例,一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围中。
Claims (8)
1.一种终端用户流失预警方法,其特征在于,包括:
获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值;
若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率;
其中,根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率,包括:
根据所述离网用户总数计算用户离网概率;
根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率;
根据每个强相关用户属性的离网用户数计算满足所述强相关用户属性的离网用户概率;
根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概率。
2.根据权利要求1所述的终端用户流失预警方法,其特征在于,所述获取多维度用户信息和采样数据,包括:
采集GB接口信令数据、IMEI终端数据以及经分数据;
根据所述GB接口信令数据、IMEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据。
3.根据权利要求1所述的终端用户流失预警方法,其特征在于,所述计算所述多维度用户信息中每个用户属性的信息增益,包括:
根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息;
根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子;
根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息减所述客户流失因子。
4.根据权利要求3所述的终端用户流失预警方法,其特征在于,每个所述用户属性的客户流失因子等于每个所述用户属性的熵。
5.一种终端用户流失预警装置,其特征在于,包括:
获取模块,用于获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
第一处理模块,用于计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性;
第二处理模块,用于根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率;
其中,所述第二处理模块包括:
用户离网概率计算单元,用于根据所述离网用户总数计算用户离网概率;
强相关用户属性的用户概率计算单元,用于根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率;
强相关用户属性的离网用户概率计算单元,用于根据每个强相关用户属性的离网用户数计算满足所述强相关用户属性的离网用户概率;
强相关用户属性的用户流失概率计算单元,用于根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概率。
6.根据权利要求5所述的终端用户流失预警装置,其特征在于,所述获取模块包括:
采集单元,用于采集GB接口信令数据、IMEI终端数据以及经分数据;
提取单元,根据所述GB接口信令数据、IMEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据。
7.根据权利要求5所述的终端用户流失预警装置,其特征在于,所述第一处理模块包括:
期望信息计算单元,用于根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息;
客户流失因子计算单元,用于根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子;
信息增益计算单元,用于根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息减所述客户流失因子;
信息增益判断单元,用于根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性。
8.根据权利要求7所述的终端用户流失预警装置,其特征在于,每个所述用户属性的客户流失因子等于每个所述用户属性的熵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210578628.0A CN103905229B (zh) | 2012-12-27 | 2012-12-27 | 一种终端用户流失预警方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210578628.0A CN103905229B (zh) | 2012-12-27 | 2012-12-27 | 一种终端用户流失预警方法与装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103905229A CN103905229A (zh) | 2014-07-02 |
CN103905229B true CN103905229B (zh) | 2017-08-08 |
Family
ID=50996385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210578628.0A Active CN103905229B (zh) | 2012-12-27 | 2012-12-27 | 一种终端用户流失预警方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103905229B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447583A (zh) * | 2014-07-30 | 2016-03-30 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN104866922B (zh) * | 2015-05-22 | 2018-09-21 | 中国联合网络通信集团有限公司 | 一种用户离网的预测方法及装置 |
CN109660582B (zh) * | 2017-10-09 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 帐号信号的推送方法、装置、存储介质和电子设备 |
CN109962795A (zh) * | 2017-12-22 | 2019-07-02 | 中国移动通信集团广东有限公司 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
CN108364195B (zh) * | 2018-02-09 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 用户留存概率预测方法、装置、预测服务器及存储介质 |
CN111290903B (zh) * | 2018-11-21 | 2023-04-25 | 中国移动通信集团内蒙古有限公司 | 基于用户行为和机器学习的软件系统监控方法及装置 |
CN111242659A (zh) * | 2018-11-28 | 2020-06-05 | 顺丰科技有限公司 | 客户件量预测方法和装置、异动客户预警方法和装置 |
CN109451527B (zh) * | 2018-12-21 | 2019-09-20 | 宜通世纪科技股份有限公司 | 一种移动通信用户流失日粒度预测方法及装置 |
CN110689381B (zh) * | 2019-10-10 | 2022-03-04 | 中国联合网络通信集团有限公司 | 一种预警方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101169798A (zh) * | 2007-12-06 | 2008-04-30 | 中国电信股份有限公司 | 一种数据挖掘系统和方法 |
CN101620692A (zh) * | 2008-06-30 | 2010-01-06 | 上海全成通信技术有限公司 | 一种移动通信业务的客户流失分析方法 |
CN102567807A (zh) * | 2010-12-23 | 2012-07-11 | 上海亚太计算机信息系统有限公司 | 加油卡客户流失预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1625543A4 (en) * | 2003-05-22 | 2008-03-12 | Pershing Investments Llc | METHOD AND SYSTEM FOR PROVIDING CLIENT ATTRITION |
-
2012
- 2012-12-27 CN CN201210578628.0A patent/CN103905229B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101169798A (zh) * | 2007-12-06 | 2008-04-30 | 中国电信股份有限公司 | 一种数据挖掘系统和方法 |
CN101620692A (zh) * | 2008-06-30 | 2010-01-06 | 上海全成通信技术有限公司 | 一种移动通信业务的客户流失分析方法 |
CN102567807A (zh) * | 2010-12-23 | 2012-07-11 | 上海亚太计算机信息系统有限公司 | 加油卡客户流失预测方法 |
Non-Patent Citations (1)
Title |
---|
基于数据挖掘的电信业客户流失分析;丁红;《中国制造业信息化》;20090401;第38卷(第7期);第19-23页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103905229A (zh) | 2014-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103905229B (zh) | 一种终端用户流失预警方法与装置 | |
CN103905978B (zh) | 基于位置的信息推送方法、推送装置和网络 | |
CN104283918B (zh) | 一种无线局域网终端类型获取方法及系统 | |
CN107194807A (zh) | 一种贷款智能催收系统及方法 | |
CN105007171A (zh) | 基于通信领域大数据的用户数据分析系统及方法 | |
CN107315810A (zh) | 一种物联网设备行为画像方法 | |
CN103796183A (zh) | 一种垃圾短信识别方法及装置 | |
CN103853739B (zh) | 动态社会关系网络社区演化识别以及稳定社区提取方法 | |
CN104202457B (zh) | 手机通讯录的智能排序方法 | |
CN103209422A (zh) | 一种wlan网络精确选点的方法 | |
CN107566148A (zh) | 终端应用操作数据的分析方法、系统、装置及终端 | |
CN113824729B (zh) | 一种加密流量检测方法、系统及相关装置 | |
CN102118711A (zh) | 信息推送方法和信息推送装置 | |
CN104331502A (zh) | 针对快递员周边人群营销中快递员数据的识别方法 | |
ATE467285T1 (de) | Analyse auf grossem massstab von push-to-talk- verkehr | |
CN113641827A (zh) | 一种基于知识图谱的网络诈骗识别方法及系统 | |
CN113412607A (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN104796518A (zh) | 获取终端电池续航时间的方法和终端 | |
CN105634775A (zh) | 一种告警信息派单方法及装置 | |
CN104883705B (zh) | 一种数据业务投诉的问题定位方法及装置 | |
CN108513308A (zh) | 一种景区客流分析系统及方法 | |
CN109670998A (zh) | 基于校园大数据环境下的精准资助多级认定方法及系统 | |
CN103634470A (zh) | 一种基于终端移动数据接入网Qos的人机交互预测方法 | |
CN112884532A (zh) | 一种低功耗物联网采集系统 | |
CN112465565B (zh) | 一种基于机器学习的用户画像预测的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |