CN109451449B - 一种基于决策树算法的移动通信4g套餐降档预测方法 - Google Patents
一种基于决策树算法的移动通信4g套餐降档预测方法 Download PDFInfo
- Publication number
- CN109451449B CN109451449B CN201811039659.2A CN201811039659A CN109451449B CN 109451449 B CN109451449 B CN 109451449B CN 201811039659 A CN201811039659 A CN 201811039659A CN 109451449 B CN109451449 B CN 109451449B
- Authority
- CN
- China
- Prior art keywords
- package
- month
- downshift
- decision tree
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/24—Accounting or billing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/80—Rating or billing plans; Tariff determination aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/80—Rating or billing plans; Tariff determination aspects
- H04M15/8083—Rating or billing plans; Tariff determination aspects involving reduced rates or discounts, e.g. time-of-day reductions or volume discounts
Abstract
本发明公开了一种基于决策树算法的移动通信4G套餐降档预测方法,包括以下步骤:S1确定对办理套餐降档具有影响的变量;S2进行数据进行合并提取,并选取正负两种样本作为训练数据;S3取最新月份数据作为预测数据;S4建立决策树模型;S5把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,选出潜在套餐降档目标客户。本发明可提前预测出潜在4G套餐降档用户,支撑市场部门的精准营销,节约营销成本;同时增加4G套餐用户的粘性。
Description
技术领域
本发明涉及移动通信领域,更具体地,涉及一种基于决策树算法的移动通信4G套餐降档预测方法。
背景技术
随着移动通信技术的发展,4G套餐类型的丰富多样化,部分用户出现了出现了4G套餐降档现象,大市场客户的自然进行套餐降档概率在1.0%,导致公司收入的减少以及市场部门营销成本的增加。
发明内容
本发明的目的是解决上述一个或多个缺陷,提出一种基于决策树算法的移动通信4G套餐降档预测方法。
为实现以上发明目的,采用的技术方案是:
一种基于决策树算法的移动通信4G套餐降档预测方法,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量;
S2:剔除套餐资费以是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
优选的是,步骤S1所述确定对办理套餐降档具有影响的变量具体通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性分析后,最终保留以下特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;所述特征变量包括:品牌、终端品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额。其中ARPU指每用户平均收入,DOU指平均每户每月上网流量。
优选的是,步骤S2所述正负样本按1:1,1:2取两份训练数据;其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码。
优选的是,步骤S3所述取最新月份数据作为预测数据只取正使用号码,剔除套餐资费已是最低的4G套餐客户
优选的是,步骤S4所述决策树模型用方差衡量有序性。
与现有技术相比,本发明的有益效果是:
本发明可提前预测出潜在4G套餐降档用户,支撑市场部门的精准营销,节约营销成本;同时增加4G套餐用户的粘性。
附图说明
图1为本发明的流程图;
图2为是否合约捆绑用户图;
图3为当月APRU图;
图4为当月充值金额图;
图5为近三个月平均DOU图;
图6为模型准确率图;
图7为模型提升倍数图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
一种基于决策树算法的移动通信4G套餐降档预测方法,请参考图1,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量;
S2:剔除套餐资费以是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
本实施例中,请参考图2-5,其中非合约捆绑客户办理套餐降档的办理率要显著高于合约捆绑客户的办理率,客户办理套餐降档的办理率随着客户当月ARPU档次的提升而逐渐提升,客户办理套餐降档的办理率随着客户当月充值金额档次的提升而呈现波动上升的趋势,随着近三个月平均DOU档次的提升降档套餐的办理率在逐渐升高。
通过对初始选取的变量进行特征探索、相关性等分析后,最终保留以下特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量,包括通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性等分析后,最终保留以下特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;具体特征变量包括:品牌、终端品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额。
本实施例中,步骤S2所述正负样本按1:1,1:2取两份训练数据;剔除套餐资费已是最低的4G套餐客户。连续多个月数据合并取;在27个变量中增加一个维度:下月是否降低套餐档次,按正负样本比例1:1,1:2取两份训练数据,其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码。
本实施例中,步骤S3所述取最新月份数据作为预测数据只取正使用号码,剔除套餐资费已是最低的4G套餐客户
本实施例中,步骤S4所述决策树模型用方差衡量有序性,利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模。
具体算法模型如下:
使用模型后,预测4G套餐降档客户的准确率为未使用模型时的4.3倍。8月大市场的145.6万4G客户中,在9月有1.4万名客户办理套餐降档,大市场降档率为0.97%。而使用模型选出的概率参考值排名前5万名的客户中,在9月有2127名为办理套餐降档客户,预测降档准确率为4.12%,是自然发生概率的4.25倍。也即说明寻找潜在4G套餐降档客户精确率大大提升。
4G套餐降档模型效果分析
4G套餐降档模型效果分析参见图6-7。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (4)
1.一种基于决策树算法的移动通信4G套餐降档预测方法,其特征在于,包括以下步骤:
S1:确定对办理套餐降档具有影响的变量,步骤S1所述确定对办理套餐降档具有影响的变量具体通过是否合约捆绑用户、当月ARPU、当月充值金额、近三月平均DOU这四个相关变量进行特征探索、相关性分析后,最终保留以下特征变量作为大市场用户群潜在套餐降档客户识别模型的输入变量;所述特征变量包括:品牌、是否漫游客户、当月4G流量、是否家庭网客户、是否4G终端、在网时长、年龄、当月ARPU、当月MOU、当月DOU、当月2G流量、当月3G流量、近三个月平均ARPU、近三个月平均MOU、近三个月平均2G流量、近三个月平均3G流量、近三个月平均4G流量、是否短号、是否合约捆绑、终端合约捆绑剩余月份、剩余待返回余额、月底剩余金额、当月充值金额、基本账户余额和赠送账户余额;
S2:剔除套餐资费已是最低的4G套餐客户后对连续若干个月的数据进行合并提取,并在步骤S1中获得的变量中增加一个维度:下月是否降低套餐档次,并选取正负两种样本作为训练数据,其中正样本为下月降低套餐档次的号码,负样本为正使用状态且没降低套餐档次的号码;
S3:取最新月份数据作为预测数据;
S4:建立决策树模型,其中决策树模型利用JAVA+eclipse,使用spark的机器学习算法,将正负比例不同的四份训练数据分别进行四次建模;
S5:把最新月份数据样本作为预测数据,利用已建立的决策树模型对每个号码进行预测评分,预测出每个号码下月套餐降档的概率,分值大于等于0.5时,即为下月套餐降档的高概率客户,即为潜在套餐降档目标客户。
2.根据权利要求1所述的一种基于决策树算法的移动通信4G套餐降档预测方法,其特征在于,步骤S2所述正负样本按1:1,1:2取两份训练数据。
3.根据权利要求1所述的一种基于决策树算法的移动通信4G套餐降档预测方法,其特征在于,步骤S3所述取最新月份数据作为预测数据只取正使用号码。
4.根据权利要求1所述的一种基于决策树算法的移动通信4G套餐降档预测方法,其特征在于,步骤S4所述决策树模型用方差衡量有序性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811039659.2A CN109451449B (zh) | 2018-09-06 | 2018-09-06 | 一种基于决策树算法的移动通信4g套餐降档预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811039659.2A CN109451449B (zh) | 2018-09-06 | 2018-09-06 | 一种基于决策树算法的移动通信4g套餐降档预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109451449A CN109451449A (zh) | 2019-03-08 |
CN109451449B true CN109451449B (zh) | 2021-10-26 |
Family
ID=65530294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811039659.2A Active CN109451449B (zh) | 2018-09-06 | 2018-09-06 | 一种基于决策树算法的移动通信4g套餐降档预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109451449B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114785627B (zh) * | 2022-03-25 | 2023-05-30 | 中国联合网络通信集团有限公司 | 基于通信合约的资费处理方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN105825311A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团湖南有限公司 | 一种套餐确定方法及系统 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
-
2018
- 2018-09-06 CN CN201811039659.2A patent/CN109451449B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN105825311A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团湖南有限公司 | 一种套餐确定方法及系统 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109451449A (zh) | 2019-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105787025B (zh) | 网络平台公共账号分类方法及装置 | |
CN104182392B (zh) | 服务推荐处理的方法和装置 | |
CN111523748B (zh) | 案件分配方法、装置及系统 | |
CN102215504A (zh) | 新入网用户的类别识别方法及系统 | |
CN109767237B (zh) | 一种客服智能接入的方法及系统 | |
CN112297934B (zh) | 充电站处理方法、装置、存储介质及处理器 | |
CN109982367A (zh) | 移动终端上网用户投诉预测方法、装置、设备及存储介质 | |
CN106096854A (zh) | 一种数据处理方法和装置 | |
CN109451449B (zh) | 一种基于决策树算法的移动通信4g套餐降档预测方法 | |
CN110866767A (zh) | 电信用户满意度的预测方法、装置、设备及介质 | |
CN105741161A (zh) | 基于司机信用的识别打车业务中刷单用户的方法和系统 | |
CN113158050A (zh) | 疑似问题评论审核筛选方法、系统及存储介质 | |
CN106878031B (zh) | 加快处理电信套餐用户话单的方法及系统 | |
CN106485552B (zh) | 广告流量限制保留装置和方法 | |
CN113037510A (zh) | 计费方法、装置和计算机可读存储介质 | |
CN103634470A (zh) | 一种基于终端移动数据接入网Qos的人机交互预测方法 | |
CN110532478A (zh) | 一种基于大数据处理的新闻传播方法 | |
CN110515940A (zh) | 基于数据共享的查询方法、设备、存储介质及装置 | |
CN103678584B (zh) | 基于应用搜索的应用排序方法及装置 | |
CN111478779B (zh) | 不限量套餐的确定方法、装置及计算设备 | |
CN108632088A (zh) | 业务处理方法、装置及服务器 | |
CN115422933B (zh) | 一种成本数据提取方法、装置、电子设备及存储介质 | |
CN111124209A (zh) | 一种界面的显示调整方法及装置 | |
CN104021119B (zh) | 一种会员充值信息的查询方法及系统 | |
CN112749343B (zh) | 资源推荐方法、装置及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |