CN109636443A - 客户流失预测的深度学习方法及装置 - Google Patents
客户流失预测的深度学习方法及装置 Download PDFInfo
- Publication number
- CN109636443A CN109636443A CN201811370186.4A CN201811370186A CN109636443A CN 109636443 A CN109636443 A CN 109636443A CN 201811370186 A CN201811370186 A CN 201811370186A CN 109636443 A CN109636443 A CN 109636443A
- Authority
- CN
- China
- Prior art keywords
- data
- client
- customer
- resource
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000013135 deep learning Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000012360 testing method Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims description 23
- 230000006399 behavior Effects 0.000 claims description 18
- 238000004140 cleaning Methods 0.000 claims description 18
- 239000010410 layer Substances 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 12
- 230000009471 action Effects 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 11
- 235000012054 meals Nutrition 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 8
- 230000008520 organization Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 claims description 7
- 238000007637 random forest analysis Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000009434 installation Methods 0.000 claims description 4
- 239000002344 surface layer Substances 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 239000013256 coordination polymer Substances 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims description 2
- 230000007306 turnover Effects 0.000 claims description 2
- 235000013305 food Nutrition 0.000 claims 1
- 201000004569 Blindness Diseases 0.000 abstract description 3
- 238000012552 review Methods 0.000 description 6
- 230000032683 aging Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009415 formwork Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种客户流失预测的深度学习方法及装置。根据设定的规则对采集的存量数据标注流失和续费标签,并把已经做完流失续费标签的客户按照比例分为训练样本和测试样本,利用预测模型对训练样本中的流失和续费两种不同类型的客户学习所选取的客户的特征得到训练模型,把训练模型代入到测试样本中,根据训练模型预测结果与测试样本中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率较高的模型作为实际应用中的模型。使用本发明的方法能够准确判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。
Description
技术领域
本发明属于人工智能领域,具体地说,是一种客户流失预测的深度学习方法及装置。
背景技术
随着技术的发展,人们在享受电视节目等视频服务(产品)方面,无论从节目内容还是从接收途径上,都得到了极大的丰富,已经不仅仅局限于通过电视收看视频节目,广电系统垄断视频节目制作、传输的时代已一去不复返。近年来,电信企业等纷纷将触角伸向了这块领域,对于广电的下一代核心产品--数字电视而言将面临着来自各方面的激烈竞争,广电有线电视面临着客户流失、竞争力下降和资源未充分利用等经营危机,客户流失也成为广电管理最棘手的问题,影响广电发展及企业效益,如何进行流失预警并有针对性的对客户挽回是目前广电宽带亟需解决的问题。并伴随着信息时代的来临,企业营销焦点从以产品为中心转变为以客户为中心,客户关系管理成为企业的核心问题。客户关系管理的关键问题是客户是否流失,通过对客户的流失与否的预测,对企业流失的客户制定优化的个性化服务方案,采取不同的营销手段,实现企业利润最大化目标。
根据相关调查数据显示,“客户保有率”增加5%将有可能为运营商带来 85%的收入增长;挽留成功一位老客户的成本只占发展一位新客户成本的1/5;向老客户推荐新产品的成功率为向客户的3倍。由此可见,建立合理的客户流失预警模型,对客户进行分群,制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须和有效的。
现有对流失和续费客户的判断标准主要根据人工经验,根据客户到期是否续费来主观判断客户的流失与否进行电话回访与关注,不但需要消耗较多的人力,还会存在判断失误,有的客户还没到期就已经流失到别的运营商了,等人工发现到期未续费时客户已经在别的运营商缴费,挽留回来的困难大幅度增加。
发明内容
本发明的目的在于提供一种客户流失预测的深度学习方法及装置,根据客户的基本信息和使用行为信息等数据,判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。
实现本发明的技术解决方案为:一种客户流失预测的深度学习方法,根据设定的规则对采集的存量数据标注流失和续费标签,并把已经做完流失续费标签的客户按照比例分为训练样本和测试样本,利用预测模型对训练样本中的流失和续费两种不同类型的客户学习所选取的客户的特征得到训练模型,把测试样本代入到训练模型中,根据训练模型预测结果与测试样本中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率较高的模型作为实际应用中的模型。
其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。
客户基本特征包括客户地理位置、客户账龄、客户级别、客户年龄、客户类型、客户下的用户数和客户下的互动用户数;
客户行为特征包括最近1个月的直播观看次数、最近1个月的直播观看天数、最近1个月的直播观看时长、最近1个月回看观看次数、最近1个月回看观看天数、最近1个月的开机天数、最近1个月的开机次数、最近3个月的开机天数、最近3个月的开机次数、距离最近一次观看的天数,其中选取最近1个月和3 个月的时间段是综合计算广电流失客户观看行为统计分析和指标的时效性考虑所得;
设备信息特征主要为设备的使用年限和设备的更换频率;
消费购买特征主要为客户近一个月的订购的产品个数、客户近三个月的订购产品个数、客户近一个月的出账金额,客户近三个月出账金额;
其中,在训练模型建立的过程中使用的预测模型涉及的算法包括决策树、神经网络、随机森林。
本发明还为客户的流失续费预测提供一种装置,该装置包括标签模块,用于对已知流失续费的历史客户标注流失续费的标签;分组模块,用于把存量数据按照7:3的比例分为训练集和测试集,且保持训练集和测试集里面的流失和续费客户占比相差较小;训练建模模块,用于使用不同的预测模型对训练集建立多个预测模型;测试模块,对不同的预测模型进行准确率评估;筛选模块,用于选取准确率较高的预测模型;识别模块,用于利用选择好的模型对未知的客户进行流失续费预测。
其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。
其中,所选取客户的历史信息和学习客户的特征包括客户基本特征、客户行为特征、设备信息特征和消费购买特征。
客户基本特征包括客户地理位置、客户账龄、客户级别、客户年龄、客户类型、客户下的用户数和客户下的互动用户数;
客户行为特征包括最近1个月的直播观看次数、最近1个月的直播观看天数、最近1个月的直播观看时长、最近1个月回看观看次数、最近1个月回看观看天数、最近1个月的开机天数、最近1个月的开机次数、最近3个月的开机天数、最近3个月的开机次数、距离最近一次观看的天数,其中选取最近1个月和3 个月的时间段是综合计算广电流失客户观看行为统计分析和指标的时效性考虑所得;
设备信息特征主要为设备的使用年限和设备的更换频率;
消费购买特征主要为客户近一个月的订购的产品个数、客户近三个月的订购产品个数、客户近一个月的出账金额,客户近三个月出账金额;
其中,在训练模型建立的过程中使用的预测模型涉及的算法包括决策树、神经网络、随机森林。
本发明与现有技术相比,其显著优点为:本发明通过计算机来完成历史客户的流失续费标记、对客户流失续费特征的学习和对未知客户流失续费的预测,使用本发明能够准确判断客户流失的概率,提高流失判断精度,降低人工盲目回访成本。
附图说明
图1是本发明客户流失预测方法的数据处理实施方式流程图。
图2是本发明的数据清洗规则流程图。
图3是本发明客户流失预测方法的一种实施方式流程图。
图4是本发明客户流失预测方法的详细实施方式和应用的流程图。
图5是本发明客户流失预测装置的一种实施方式流程图。
图6是本发明客户流失预测装置的详细实施方式和应用流程图。
具体实施方式
下面结合实施例和附图对本发明作进一步说明。
图1是本发明客户流失预测方法的一种数据处理实施方式流程图,主要反映数据的采集、存储及清洗过程。数据的采集、存储及清洗过程是数据建模的基础,本发明主要清洗数据表:客户信息表、用户日全量表、设备信息表、设备编码表、设备历史订购表、产品订购历史表、出账信息表、点播记录表、开机信息表。
其中客户信息表包含字段为客户标识、客户证号、老客户编号、老客户证号、客户名称、客户名简拼、客户密码、客户类型、客户级别、客户状态、状态变化日期、客户证件类型、客户证件号、客户证件地址、证件生效日期、证件失效日期、客户职业、单位名称、单位地址、境内外标识、地市代码、归属组织、营销组织、归属分公司、建档工号、建档组织、建档日期、生效日期、失效日期、受理日期、受理编号、受理操作员、受理组织、备注、县区代码、客户属性、客户订单id、片区id、片区名称、片区经理id、片区经理名称、片区经理电话、数据来源系统编码、ETL处理周期;
用户日全量表包含字段为产品规格实例id、基本套餐实例id、基本策划编号、基本套餐品牌、产品规格id、客户编号、账户编号、付费方式、用户类别id、计费号、次计费号、主用户id、计费开始时间、用户名、用户属性、收视属性、 VIP标识、VIP属性、境内外标识、低保标识、低保属性、用户身份、首次使用时间、用户状态、用户状态时间、操作状态、停开机状态、住宅地址id、安装地址id、安装地址名称、联系人标识、邮寄方式、邮寄地址、接入方式、宽带登录名、电视号、地市代购、营销人员、营销组织、担保客户、生效日期、失效日期、创建日期、创建人编码、创建组织、受理日期、受理编号、受理操作员、受理组织、受理分公司、标准归属分公司、标准归属地区、模拟基本业务标识、数字基本业务标识、付费节目业务标识、互动基本业务标识、互动点播业务标识、宽带接入业务标识、语音业务标识、AMSP业务标识、扩展业务1标识、扩展业务2标识、云媒体标识、云媒体类型、用户类型、高清业务标识、在线标识、模拟基本业务在线标识、数字基本业务在线标识、付费节目业务在线标识、互动基本业务在线标识、互动点播业务在线标识、宽带接入业务在线标识、语音业务在线标识、AMSP业务在线标识、扩展业务1在线标识、扩展业务2在线标识、高清业务在线标识、主机标识、副机标识、自管网用户标识、直管网用户标识、整转标识、有效用户标识、有效用户标识(数字基本业务(1002)欠费停机在1年内)、有效用户标识(数字基本业务(1002)账单最早欠费月份2年内)、是否有10内到期产品、暂停用户标识、互动活跃客户标识、欠费停机用户标识、免费用户标识、缴费用户标识、新增用户标识、在线新增用户标识、流失用户标识、在线流失用户标识、电视支付状态、是否资料、是否置换、分区标识、数据来源系统编码、是否存量数据、ETL处理周期;
设备信息表包含字段为资源ID、资源型号、资源状态、生效时间、失效时间、入库日期、设备序列号、MAC地址、CMMAC、PIN、保修周期、保修周期单位、保换周期、保换周期单位、扩展字段、扩展字段2、扩展字段3、绑定设备、批次号、所在仓库、受理编号、受理日期、受理操作员、受理组织、地市代码、区县代码、扩展字段4、扩展字段5、锁定时间、资源等级、使用次数、备注、绑定状态、成本价格、入库单号、数据来源系统编码、是否存量数据、ETL 处理周期;
设备编码表包含字段为资源型号、资源大类、资源小类、资源名称、资源设备号、受理资源、受理编号、受理日期、资源状态、项目资源信号、受理组织、受理操作员、备注、ETL处理周期;
设备历史订购表包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例id、资源大类、资源小类、资源设备号、资源设备号2、资源设备号 3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;
产品订购历史表包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例编号、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息 ID;
出账信息表包含字段为帐目标识、帐目来源规则标识、用户标识、帐户、销帐流水号、账单编号、帐务周期标识、费用周期、帐目类型、原始金额、优惠金额、减免金额、调帐金额、已销账金额、已打印金额、未打印金额、欠费金额、数据生成日期、状态、状态时间、滞纳金、滞纳金减免、默认帐务、计费优惠、帐目状态、帐目状态时间、处理坏帐时间、优惠ID、补足ID、通话次数、关联流水、总使用次数、标准消费类型编号、数据来源系统编码、是否历数据、ETL 处理周期;
点播记录表包含字段为品牌、话单类型、服务标识、话单帐期月、批价使用产品、计费产品代码、主产品代码、促销产品集合、套餐计划、客户编号、账户编号、用户编号、条件代码、计费用户号码、一级归属局、二级归属局、三级归属局、开始时间、结束时间、计费资源量、批价标志、科目代码1、费用1、费用1优惠、科目代码2、费用2、费用2优惠、科目代码3、费用3、费用3优惠、科目代码4、费用4、费用4优惠、免费资源量、累计资源量值、话单序列号、记录类型、第三方号码、CP代码、内容ID、服务代码、PPV价格标签、用户计费类别、原始基本费、其他费用、标准资费批价结果基本费、标准资费批价结果其他费、批价处理日期时间、源文件、分公司组织ID、漫游类型、用户类型、备份日期、重处理标志、保留字段1、保留字段2、保留字段3、保留字段4、节目名称、计费用户属性、监控用户标示、批价重处理话单标识、账务科目代码1、账务科目代码2、账务科目代码3、账务科目代码4、迟到标志、入库时间、记录序号、标准归属分公司、数据来源系统编码、是否存量数据、ETL处理周期;
开机信息表包含字段为项目编号、区域id、系统类型、业务类型、记录时间、机顶盒id、CA卡号、用户唯一识别码、MAC地址、内网ip地址、外网ip地址;
存储和清洗主要包括内容如下:
①存量数据采集与存储。采用hadoop分布式架构、N+1台服务器对广电存量数据进行采集,并在数据仓库的几个层级中进行数据存储,数据仓库的几个层级如下:
缩写 | 英文描述 | 中文描述 |
STG | Stage | 临时存储层 |
DWD | Data Warehouse Detail | 基础数据层 |
DWA | Data Warehouse Analysis | 汇总数据层 |
ST | Summary Table | 应用数据层 |
DIM | Dimension | 维度表层 |
②存量数据的指标筛选。指标的选取是模型准确率和分类能力的关键,是模型的精髓之一,主要根据3个方面原则和专业人员的综合考虑进行指标选取,3 个方面的原则如下:
第一,系统性原则。各指标的特征必须能系统的反应客户的主要特征和行为,各指标必须具有客户某方面特征的代表性。
第二,简明科学性原则。各指标必须具有科学性,不能过细,像客户id一样,每个客户均不相同,也不能过简,90%的数据均为同一数值,没有辨别性。
第三,动态性原则。指标应能随着时间的向前发展能够持续的获得最新的数据,指标具有可更新性。
根据指标选取原则和专业人员的综合考虑最终选择的指标包括客户基本信息、消费购买特征、客户行为特征和设备信息特征几方面信息,具体指标如下:
③对筛选后的存量数据清洗。随着信息处理技术的不断发展和逐步提高,我们能收集到的数据也在不断增加,但客户为了保护自己隐私和业务员填写数据的不认真都会造成错误数据和无效数据的产生,为了使数据能够可靠、无误且能准确的反应实际的客户状况,在模型建立前需要对数据进行清洗。本发明对数据的清洗主要包括以下几个方面:
数据完整性:检查数据字段完整性、剔除字段异常数据;
数据一致性:检查数据的格式和单位是否保持一致,剔除数据格式错误,单位错误数据按照字段定义修改数据单位值;
数据合理性:计算近半年每月指标最高值的平均值近半年每月指标最低值若指标数据值或者则视为不合理数据,予以剔除;另外根据指标对字段数据进行逻辑判断,剔除有明显逻辑错误的数据;
数据缺失值处理:观看天数数据源为空时,均设置为近3个月客户收看天数的均值;距离最近一次观看的天数数据源为空时,设置最后一次收视行为距离分析时间的间隔天数为统计月份的天数;其余指标特征为空时,赋值为当月指标数据均值;
数据重复值处理:数据均以客户为维度统计,客户ID相同则视为重复值数据,对比重复数据各指标数值,保留各字段指标方差较小的数据,剔除其余重复值数据;
④对清洗之后的数据进行关联。首先,对用户日全量表中的产品规格实例id、客户编号、用户类别id字段分别与客户信息表中的客户证号关联、与产品订购历史表中的客户编号关联、与出账信息表中的用户标识关联、与点播记录表中的客户编号关联、与开机信息表中的用户唯一识别码关联;同时,对设备信息表中的设备序列号与设备编码表中的资源设备号关联、与设备历史订购表中的资源设备号、资源设备号2或资源设备号3关联;最后,根据用户日全量表中的产品规格实例id与设备历史订购表中的产品规格实例id进行关联合并,得出客户流失特征的相关指标。
⑤对最终的有效数据进行分析和挖掘。完成数据采集、存储和清洗过程,对数据进行分析和挖掘。
图2是数据清洗规则流程图,反映了原始数据变成格式化数据的步骤:
数据完整性:检查数据字段完整性、剔除字段异常数据;
数据一致性:检查数据的格式和单位是否保持一致,剔除数据格式错误,单位错误数据按照字段定义修改数据单位值;
数据合理性:计算近半年每月指标最高值的平均值近半年每月指标最低值若指标数据值或者则视为不合理数据,予以剔除;另外根据指标对字段数据进行逻辑判断,剔除有明显逻辑错误的数据;
数据缺失值处理:观看天数数据源为空时,均设置为近3个月客户收看天数的均值;距离最近一次观看的天数数据源为空时,设置最后一次收视行为距离分析时间的间隔天数为统计月份的天数;其余指标特征为空时,赋值为当月指标数据均值;
数据重复值处理:数据均以客户为维度统计,客户ID相同则视为重复值数据,对比重复数据各指标数值,保留各字段指标方差较小的数据,剔除其余重复值数据;
图3是本发明客户流失预测方法的一种实施方式流程图。该流程图反应了本发明在建模过程中的步骤,主要包括以下几个方面:
①对存量数据按照一定的规则标准流失续费标签。对存量数据根据自身制定的规则做流失客户和续费客户的标记,方便模型对不同类别客户的特征学习;
②把存量数据分为训练集和测试集。训练集是模型学习的基础,测试集则是模型预测类别和实际类别的对比,能够对模型的效果和分类能力进行评价;
③对训练集建立多个预测模型。用决策树、神经网络和随机森林对训练集分别建立模型;
④筛选出较好的预测模型做为应用模型。根据训练集产生的模型在测试集上进行测试,对分类能力和准确率较好的模型做为最终的使用模型。
图4是本发明客户流失预测方法的详细实施方式和应用的流程图。反应了流失预测方法在具体数据中的应用。
①对存量数据按照一定的规则标准流失续费标签。
存量数据包括所选取客户的历史信息和学习客户的特征包括客户基本信息、消费购买特征、客户行为特征和设备信息特征。
客户基本特征包括客户地理位置、客户账龄、客户级别、客户年龄、客户类型、客户下的用户数和客户下的互动用户数;
客户行为特征包括最近1个月的直播观看次数、最近1个月的直播观看天数、最近1个月的直播观看时长、最近1个月回看观看次数、最近1个月回看观看天数、最近1个月的开机天数、最近1个月的开机次数、最近3个月的开机天数、最近3个月的开机次数、距离最近一次观看的天数,其中选取最近1个月和3 个月的时间段是综合计算广电流失客户观看行为统计分析和指标的时效性考虑所得;
设备信息特征主要为设备的使用年限和设备的更换频率;
消费购买特征主要为客户近一个月的订购的产品个数、客户近三个月的订购产品个数、客户近一个月的出账金额,客户近三个月出账金额;
制定流失客户的规则主要包括以下几个方面:
判断流失客户是根据主用户来判断的,广电一般为办理主机的用户送副机,不根据副机用户的流失情况判定客户流失情况;而用户指的是一个个机顶盒,客户指的是订阅人。
每个客户下面只有一个主机和N个副机,所以主机标识is_main=1的用户流失才可确认为最终的客户流失,即客户流失最终转化为主机用户流失。
由于客户会到期一段时间后才会进行续费的行为,而且续费周期并不固定,因此对于客户是否流失的规则加入了续费期限(根据自身客户续费周期特点,最终定义续费周期为2个月),即:客户在3个月前套餐到期后,近2个月内均为续费行为的客户,到期2个月后仍然不续费的定为流失用户;
上一个统计周期内是有效用户,而下一个统计周期无效的用户(每天一个用户日全量表,日全量表仅记录有效的用户,所以用户全量表里面没有的就是无效用户),而主用户的无效就相当于客户的流失;
根据上面两个流失规则,满足一个即可认为客户流失,最终确定流失客户的字段定义为is_lost=1,非流失客户定义为is_lost=0。
②按照7:3把客户分为训练集和测试集。把最终的有效数据按照7:3分为训练集和测试集。
③对训练集建立多个预测模型。用决策树、神经网络和随机森林对训练集分别建立模型;
④筛选出较好的预测模型做为应用模型。根据训练集产生的模型在测试集上进行测试,对分类能力和准确率综合评估,选择决策树模型为最终的使用模型。
⑤应用模型到未知客户的预测中。使用该模型预测未来的未知的客户流失续费情况。
图5是本发明客户流失预测方装置的一种实施方式流程图。该流程图反应了本发明在装置建设过程中的步骤,主要包括以下几个方面:
①数据处理模块。对数据缺失、数据格式、数据合理性等进行检查清洗,最终通过数据关联得到有效数据。
②标签模块。根据设定的规则标注客户流失和续费标志。
③分组模块。把有效数据分为训练集和测试集数据。
④建模模块。根据最终的有效数据,建立预测模型。
⑤预测模块。把预测模型代入未来未知的流失续费客户中,提前预测客户的流失续费情况。
图6是本发明客户流失预测装置的详细实施方式和应用的流程图。反应了流失预测方法在具体数据中的应用。
①数据采集模块。采用hadoop分布式架构、N+1台服务器对广电存量数据进行采集,并在数据仓库的临时存储层、基础数据层、汇总数据层、应用数据层和维度表层中进行数据存储。
②数据选择模块。指标的选取是模型准确率和分类能力的关键,是模型的精髓之一,我们主要根据3个方面原则和专业人员的综合考虑进行指标选取,3个方面的原则如下:
第一,系统性原则。各指标的特征必须能系统的反应客户的主要特征和行为,各指标必须具有客户某方面特征的代表性。
第二,简明科学性原则。各指标必须具有科学性,不能过细,像客户id一样,每个客户均不相同,也不能过简,90%的数据均为同一数值,没有辨别性。
第三,动态性原则。指标应能随着时间的向前发展能够持续的获得最新的数据,指标具有可更新性。
根据指标选取原则和专业人员的综合考虑最终选择的指标包括客户基本信息、消费购买特征、客户行为特征和设备信息特征几方面信息,具体指标如下:
③数据清洗模块。
数据完整性:检查数据字段完整性、剔除字段异常数据;
数据一致性:检查数据的格式和单位是否保持一致,剔除数据格式错误,单位错误数据按照字段定义修改数据单位值;
数据合理性:计算近半年每月指标最高值的平均值近半年每月指标最低值若指标数据值或者则视为不合理数据,予以剔除;另外根据指标对字段数据进行逻辑判断,剔除有明显逻辑错误的数据;
数据缺失值处理:观看天数数据源为空时,均设置为近3个月客户收看天数的均值;距离最近一次观看的天数数据源为空时,设置最后一次收视行为距离分析时间的间隔天数为统计月份的天数;其余指标特征为空时,赋值为当月指标数据均值;
数据重复值处理:数据均以客户为维度统计,客户ID相同则视为重复值数据,对比重复数据各指标数值,保留各字段指标方差较小的数据,剔除其余重复值数据;
④数据集成模块。对清洗之后的数据进行关联。首先,对用户日全量表中的产品规格实例id、客户编号、用户类别id字段分别与客户信息表中的客户证号关联、与产品订购历史表中的客户编号关联、与出账信息中的用户标识关联、与点播记录表中的客户编号关联、与开机信息中的用户唯一识别码关联;同时,对设备信息表中的设备序列号与设备编码表中的资源设备号关联、与设备历史订购表中的资源设备号、资源设备号2或资源设备号3关联;最后,根据用户日全量表中的产品规格实例id与设备历史订购表中的产品规格实例id进行关联合并,得处客户流失特征的相关指标。
⑤数据标签模块。根据规则标注客户的流失续费标签,其中具体规则如下:
每个客户下面只有一个主机和N个副机,所以主机标识is_main=1的用户流失才可确认为最终的客户流失,即客户流失最终转化为主机用户流失。
由于客户会到期一段时间后才会进行续费的行为,而且续费周期并不固定,因此对于客户是否流失的规则加入了续费期限(根据自身客户续费周期特点,最终定义续费周期为2个月),即:客户在3个月前套餐到期后,近2个月内均为续费行为的客户,到期2个月后仍然不续费的定为流失用户;
上一个统计周期内是有效用户,而下一个统计周期无效的用户(每天一个用户日全量表,日全量表仅记录有效的用户,所以用户全量表里面没有的就是无效用户),而主用户的无效就相当于客户的流失;
根据上面两个流失规则,满足一个即可认为客户流失,最终确定流失客户的字段定义为is_lost=1,非流失客户定义为is_lost=0。
⑥数据分组模块。把最终的有效数据按照7:3分为训练集和测试集。
⑦训练模块。用决策树、神经网络和随机森林对训练集分别建立模型。
⑧测试模块。把模型应用在测试集上得到的测试结果如下:
⑨预测模块。最终选择决策树算法对未来未知的客户流失续费进行预测。
Claims (12)
1.一种客户流失预测的深度学习方法,其特征在于,包括如下步骤:
采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;
根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;
将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;
对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;
将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;
使用该模型预测未来的未知客户流失续费情况。
2.根据权利要求1所述的深度学习方法,其特征在于,所述客户的存量数据包括:
客户信息表,包含字段为客户标识、客户证号、老客户编号、老客户证号、客户名称、客户名简拼、客户密码、客户类型、客户级别、客户状态、状态变化日期、客户证件类型、客户证件号、客户证件地址、证件生效日期、证件失效日期、客户职业、单位名称、单位地址、境内外标识、地市代码、归属组织、营销组织、归属分公司、建档工号、建档组织、建档日期、生效日期、失效日期、受理日期、受理编号、受理操作员、受理组织、备注、县区代码、客户属性、客户订单id、片区id、片区名称、片区经理id、片区经理名称、片区经理电话、数据来源系统编码、ETL处理周期;
用户日全量表,包含字段为产品规格实例id、基本套餐实例id、基本策划编号、基本套餐品牌、产品规格id、客户编号、账户编号、付费方式、用户类别id、计费号、次计费号、主用户id、计费开始时间、用户名、用户属性、收视属性、VIP标识、VIP属性、境内外标识、低保标识、低保属性、用户身份、首次使用时间、用户状态、用户状态时间、操作状态、停开机状态、住宅地址id、安装地址id、安装地址名称、联系人标识、邮寄方式、邮寄地址、接入方式、宽带登录名、电视号、地市代购、营销人员、营销组织、担保客户、生效日期、失效日期、创建日期、创建人编码、创建组织、受理日期、受理编号、受理操作员、受理组织、受理分公司、标准归属分公司、标准归属地区、模拟基本业务标识、数字基本业务标识、付费节目业务标识、互动基本业务标识、互动点播业务标识、宽带接入业务标识、语音业务标识、AMSP业务标识、扩展业务1标识、扩展业务2标识、云媒体标识、云媒体类型、用户类型、高清业务标识、在线标识、模拟基本业务在线标识、数字基本业务在线标识、付费节目业务在线标识、互动基本业务在线标识、互动点播业务在线标识、宽带接入业务在线标识、语音业务在线标识、AMSP业务在线标识、扩展业务1在线标识、扩展业务2在线标识、高清业务在线标识、主机标识、副机标识、自管网用户标识、直管网用户标识、整转标识、有效用户标识、有效用户标识(数字基本业务(1002)欠费停机在1年内)、有效用户标识(数字基本业务(1002)账单最早欠费月份2年内)、是否有10内到期产品、暂停用户标识、互动活跃客户标识、欠费停机用户标识、免费用户标识、缴费用户标识、新增用户标识、在线新增用户标识、流失用户标识、在线流失用户标识、电视支付状态、是否资料、是否置换、分区标识、数据来源系统编码、是否存量数据、ETL处理周期;
设备信息表,包含字段为资源ID、资源型号、资源状态、生效时间、失效时间、入库日期、设备序列号、MAC地址、CMMAC、PIN、保修周期、保修周期单位、保换周期、保换周期单位、扩展字段、扩展字段2、扩展字段3、绑定设备、批次号、所在仓库、受理编号、受理日期、受理操作员、受理组织、地市代码、区县代码、扩展字段4、扩展字段5、锁定时间、资源等级、使用次数、备注、绑定状态、成本价格、入库单号、数据来源系统编码、是否存量数据、ETL处理周期;
设备编码表,包含字段为资源型号、资源大类、资源小类、资源名称、资源设备号、受理资源、受理编号、受理日期、资源状态、项目资源信号、受理组织、受理操作员、备注、ETL处理周期;
设备历史订购表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例id、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;
产品订购历史表,包含字段为历史ID、产品资源实例编号、策划实例ID、产品规格实例编号、资源大类、资源小类、资源设备号、资源设备号2、资源设备号3、资源状态、资源来源、资源用途、地市代码、受理编号、创建日期、受理日期、生效日期、失效日期、受理操作员、受理组织、客户编号、客户订单信息ID;
出账信息表,包含字段为帐目标识、帐目来源规则标识、用户标识、帐户、销帐流水号、账单编号、帐务周期标识、费用周期、帐目类型、原始金额、优惠金额、减免金额、调帐金额、已销账金额、已打印金额、未打印金额、欠费金额、数据生成日期、状态、状态时间、滞纳金、滞纳金减免、默认帐务、计费优惠、帐目状态、帐目状态时间、处理坏帐时间、优惠ID、补足ID、通话次数、关联流水、总使用次数、标准消费类型编号、数据来源系统编码、是否历数据、ETL处理周期;
点播记录表,包含字段为品牌、话单类型、服务标识、话单帐期月、批价使用产品、计费产品代码、主产品代码、促销产品集合、套餐计划、客户编号、账户编号、用户编号、条件代码、计费用户号码、一级归属局、二级归属局、三级归属局、开始时间、结束时间、计费资源量、批价标志、科目代码1、费用1、费用1优惠、科目代码2、费用2、费用2优惠、科目代码3、费用3、费用3优惠、科目代码4、费用4、费用4优惠、免费资源量、累计资源量值、话单序列号、记录类型、第三方号码、CP代码、内容ID、服务代码、PPV价格标签、用户计费类别、原始基本费、其他费用、标准资费批价结果基本费、标准资费批价结果其他费、批价处理日期时间、源文件、分公司组织ID、漫游类型、用户类型、备份日期、重处理标志、保留字段1、保留字段2、保留字段3、保留字段4、节目名称、计费用户属性、监控用户标示、批价重处理话单标识、账务科目代码1、账务科目代码2、账务科目代码3、账务科目代码4、迟到标志、入库时间、记录序号、标准归属分公司、数据来源系统编码、是否存量数据、ETL处理周期;
开机信息表,包含字段为项目编号、区域id、系统类型、业务类型、记录时间、机顶盒id、CA卡号、用户唯一识别码、MAC地址、内网ip地址、外网ip地址。
3.根据权利要求1-2任一所述的深度学习方法,其特征在于:采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据的数据缺失、数据格式、数据合理性进行检查清洗,对清洗后的数据进行关联,得到有效数据,具体为:
(1)采用hadoop分布式架构、N+1台服务器对广电存量数据进行采集,并在数据仓库的临时存储层、基础数据层、汇总数据层、应用数据层和维度表层中进行数据存储;
(2)筛选的指标包括客户基本特征、消费购买特征、客户行为特征和设备信息特征,具体指标如下:
;
(3)对筛选后的存量数据进行清洗,包括:
数据完整性:检查数据字段完整性、剔除字段异常数据;
数据一致性:检查数据的格式和单位是否保持一致,剔除数据格式错误,单位错误数据按照字段定义修改数据单位值;
数据合理性:计算近半年每月指标最高值的平均值近半年每月指标最低值若指标数据值或者则视为不合理数据,予以剔除;根据指标对字段数据进行逻辑判断,剔除有明显逻辑错误的数据;
数据缺失值处理:观看天数数据源为空时,均设置为近3个月客户收看天数的均值;距离最近一次观看的天数数据源为空时,设置最后一次收视行为距离分析时间的间隔天数为统计月份的天数;其余指标特征为空时,赋值为当月指标数据均值;
数据重复值处理:数据均以客户为维度统计,客户ID相同则视为重复值数据,对比重复数据各指标数值,保留各字段指标方差较小的数据,剔除其余重复值数据;
(4)对清洗之后的数据进行关联;首先,对用户日全量表中的产品规格实例id、客户编号、用户类别id字段分别与客户信息表中的客户证号关联、与产品订购历史表中的客户编号关联、与出账信息表中的用户标识关联、与点播记录表中的客户编号关联、与开机信息表中的用户唯一识别码关联;同时,对设备信息表中的设备序列号与设备编码表中的资源设备号关联、与设备历史订购表中的资源设备号、资源设备号2或资源设备号3关联;最后,根据用户日全量表中的产品规格实例id与设备历史订购表中的产品规格实例id进行关联合并,得出客户流失特征的相关指标。
4.根据权利要求1所述的深度学习方法,其特征在于:制定流失客户的规则为:
每个客户下面只有一个主机和N个副机,主机标识is_main=1的用户流失确认为最终的客户流失,即客户流失最终转化为主机用户流失;
(1)客户在3个月前套餐到期后,近2个月内均为续费行为的客户;
(2)上一个统计周期内是有效用户,而下一个统计周期无效的用户,主用户的无效就相当于客户的流失;
根据上述两个流失规则,满足一个即可认为客户流失,最终确定流失客户的字段定义为is_lost=1;
非流失客户为所有到期有续费行为的客户,即到期后依然为有效用户的客户,非流失客户定义为is_lost=0。
5.根据权利要求1所述的深度学习方法,其特征在于:对训练样本集建立多个预测模型具体为,采用决策树、神经网络和随机森林对训练样本集分别建立模型。
6.一种客户流失预测的深度学习装置,其特征在于,包括:
①数据处理模块;采集客户的存量数据进行存储,并对存量数据进行指标筛选,对筛选后的存量数据进行检查清洗,对清洗后的数据进行关联,得到有效数据;
②标签模块;根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;
③分组模块;将已标注过流失和续费标签的客户按照比例划分为训练样本集和测试样本集;
④建模模块;对训练样本集建立多个预测模型,利用预测模型对训练样本集中的流失客户和续费客户进行学习,得到训练模型;将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型;
⑤预测模块;将该预测模型代入未来未知的流失续费客户中,预测客户的流失续费情况。
7.根据权利要求6所述的装置,其特征在于,数据处理模块包括:
数据采集模块,采用hadoop分布式架构、N+1台服务器对广电存量数据进行采集,并在数据仓库的临时存储层、基础数据层、汇总数据层、应用数据层和维度表层中进行数据存储;
数据选择模块,筛选的指标包括客户基本特征、消费购买特征、客户行为特征和设备信息特征;
数据清洗模块,对筛选后的存量数据进行清洗;
数据集成模块,对清洗之后的数据进行关联。
8.根据权利要求7所述的装置,其特征在于:数据选择模块的具体筛选指标如下:
9.根据权利要求6或7所述的装置,其特征在于:数据清洗模块,对筛选后的存量数据进行清洗,包括:
数据完整性:检查数据字段完整性、剔除字段异常数据;
数据一致性:检查数据的格式和单位是否保持一致,剔除数据格式错误,单位错误数据按照字段定义修改数据单位值;
数据合理性:计算近半年每月指标最高值的平均值近半年每月指标最低值若指标数据值或者则视为不合理数据,予以剔除;根据指标对字段数据进行逻辑判断,剔除有明显逻辑错误的数据;
数据缺失值处理:观看天数数据源为空时,均设置为近3个月客户收看天数的均值;距离最近一次观看的天数数据源为空时,设置最后一次收视行为距离分析时间的间隔天数为统计月份的天数;其余指标特征为空时,赋值为当月指标数据均值;
数据重复值处理:数据均以客户为维度统计,客户ID相同则视为重复值数据,对比重复数据各指标数值,保留各字段指标方差较小的数据,剔除其余重复值数据。
10.根据权利要求6或7所述的装置,其特征在于:数据集成模块,对清洗之后的数据进行关联;首先,对用户日全量表中的产品规格实例id、客户编号、用户类别id、字段分别与客户信息表中的客户证号关联、与产品订购历史表中的客户编号关联、与出账信息表中的用户标识关联、与点播记录表中的客户编号关联、与开机信息表中的用户唯一识别码关联;同时,对设备信息表中的设备序列号与设备编码表中的资源设备号关联、与设备历史订购表中的资源设备号、资源设备号2或资源设备号3关联;最后,根据用户日全量表中的产品规格实例id与设备历史订购表中的产品规格实例id进行关联合并,得出客户流失特征的相关指标。
11.根据权利要求6所述的装置,其特征在于:数据标签模块,根据设定的规则对经过预处理的客户存量数据标注流失和续费标签;制定流失客户的规则为:
每个客户下面只有一个主机和N个副机,主机标识is_main=1的用户流失确认为最终的客户流失,即客户流失最终转化为主机用户流失;
(1)客户在3个月前套餐到期后,近2个月内均为续费行为的客户;
(2)上一个统计周期内是有效用户,而下一个统计周期无效的用户,主用户的无效就相当于客户的流失;
根据上面两个流失规则,满足一个即可认为客户流失,最终确定流失客户的字段定义为is_lost=1,非流失客户定义为is_lost=0。
12.根据权利要求6所述的装置,其特征在于:建模模块包括训练模块和测试模块;训练模块采用决策树、神经网络和随机森林对训练样本集分别建立模型;测试模块将测试样本集代入到训练模型中,训练模型预测结果与测试样本集中的流失续费标记作比较,评估训练模型的预测准确率,选取准确率高的模型作为实际应用中的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811370186.4A CN109636443A (zh) | 2018-11-17 | 2018-11-17 | 客户流失预测的深度学习方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811370186.4A CN109636443A (zh) | 2018-11-17 | 2018-11-17 | 客户流失预测的深度学习方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109636443A true CN109636443A (zh) | 2019-04-16 |
Family
ID=66068355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811370186.4A Pending CN109636443A (zh) | 2018-11-17 | 2018-11-17 | 客户流失预测的深度学习方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109636443A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222975A (zh) * | 2019-05-31 | 2019-09-10 | 北京奇艺世纪科技有限公司 | 一种流失用户分析方法、装置、电子设备及存储介质 |
CN110348914A (zh) * | 2019-07-19 | 2019-10-18 | 中国银行股份有限公司 | 客户流失数据分析方法及装置 |
CN111611240A (zh) * | 2020-04-17 | 2020-09-01 | 第四范式(北京)技术有限公司 | 执行自动机器学习过程的方法、装置及设备 |
CN112069325A (zh) * | 2020-09-01 | 2020-12-11 | 张富平 | 基于区块链离线支付的大数据处理方法及云服务推送平台 |
CN112767125A (zh) * | 2021-01-15 | 2021-05-07 | 上海琢学科技有限公司 | 一种客户流失的预测方法、装置及存储介质 |
CN112801709A (zh) * | 2021-02-05 | 2021-05-14 | 杭州拼便宜网络科技有限公司 | 一种用户流失预测方法、装置、设备及存储介质 |
CN112836749A (zh) * | 2021-02-03 | 2021-05-25 | 中国工商银行股份有限公司 | 一种系统资源调整方法、装置及设备 |
CN113139767A (zh) * | 2020-01-20 | 2021-07-20 | 菜鸟智能物流控股有限公司 | 物流对象分拨方法和装置、电子设备以及计算机可读存储介质 |
CN113435513A (zh) * | 2021-06-28 | 2021-09-24 | 平安科技(深圳)有限公司 | 基于深度学习的保险客户分群方法、装置、设备和介质 |
CN113658597A (zh) * | 2021-08-01 | 2021-11-16 | 杭州拼便宜网络科技有限公司 | 语音下单方法、装置、电子设备和计算机可读介质 |
CN113676606A (zh) * | 2021-08-23 | 2021-11-19 | 中国联合网络通信集团有限公司 | 停机方法及设备 |
CN113706202A (zh) * | 2021-08-31 | 2021-11-26 | 杭州群核信息技术有限公司 | 一种基于低稳态用户识别及预警的召回策略生成方法 |
CN114221877A (zh) * | 2021-12-14 | 2022-03-22 | 中国联合网络通信集团有限公司 | 负载预测方法、装置、设备和计算机可读介质 |
CN114707699A (zh) * | 2022-03-04 | 2022-07-05 | 易视腾科技股份有限公司 | 基于机器学习的网络电视订单退订预测方法 |
CN117422181A (zh) * | 2023-12-15 | 2024-01-19 | 湖南三湘银行股份有限公司 | 一种基于模糊标签的代发客户流失预警方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101620692A (zh) * | 2008-06-30 | 2010-01-06 | 上海全成通信技术有限公司 | 一种移动通信业务的客户流失分析方法 |
KR20110114181A (ko) * | 2010-04-13 | 2011-10-19 | 고려대학교 산학협력단 | 예측 정확성이 향상된 대출 심사 방법 |
CN105069534A (zh) * | 2015-08-18 | 2015-11-18 | 广州华多网络科技有限公司 | 客户流失预测方法以及装置 |
CN105760957A (zh) * | 2016-02-23 | 2016-07-13 | 国元证券股份有限公司 | 一种证券软流失客户的预测方法 |
CN105930875A (zh) * | 2016-05-05 | 2016-09-07 | 清华大学 | 用户退课行为预测方法及装置 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN106997493A (zh) * | 2017-02-14 | 2017-08-01 | 云数信息科技(深圳)有限公司 | 基于多维度数据的彩票用户流失预测方法及其系统 |
CN107609708A (zh) * | 2017-09-25 | 2018-01-19 | 广州赫炎大数据科技有限公司 | 一种基于手机游戏商店的用户流失预测方法及系统 |
CN108171553A (zh) * | 2018-01-17 | 2018-06-15 | 焦点科技股份有限公司 | 一种周期性服务或产品的潜在客户挖掘系统与方法 |
CN108665321A (zh) * | 2018-05-18 | 2018-10-16 | 广州虎牙信息科技有限公司 | 高粘性用户流失预测方法、装置及计算机可读存储介质 |
-
2018
- 2018-11-17 CN CN201811370186.4A patent/CN109636443A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101620692A (zh) * | 2008-06-30 | 2010-01-06 | 上海全成通信技术有限公司 | 一种移动通信业务的客户流失分析方法 |
KR20110114181A (ko) * | 2010-04-13 | 2011-10-19 | 고려대학교 산학협력단 | 예측 정확성이 향상된 대출 심사 방법 |
CN105069534A (zh) * | 2015-08-18 | 2015-11-18 | 广州华多网络科技有限公司 | 客户流失预测方法以及装置 |
CN105760957A (zh) * | 2016-02-23 | 2016-07-13 | 国元证券股份有限公司 | 一种证券软流失客户的预测方法 |
CN105930875A (zh) * | 2016-05-05 | 2016-09-07 | 清华大学 | 用户退课行为预测方法及装置 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及系统 |
CN106529714A (zh) * | 2016-11-03 | 2017-03-22 | 大唐融合通信股份有限公司 | 一种用户流失的预测方法及系统 |
CN106997493A (zh) * | 2017-02-14 | 2017-08-01 | 云数信息科技(深圳)有限公司 | 基于多维度数据的彩票用户流失预测方法及其系统 |
CN107609708A (zh) * | 2017-09-25 | 2018-01-19 | 广州赫炎大数据科技有限公司 | 一种基于手机游戏商店的用户流失预测方法及系统 |
CN108171553A (zh) * | 2018-01-17 | 2018-06-15 | 焦点科技股份有限公司 | 一种周期性服务或产品的潜在客户挖掘系统与方法 |
CN108665321A (zh) * | 2018-05-18 | 2018-10-16 | 广州虎牙信息科技有限公司 | 高粘性用户流失预测方法、装置及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
张婧娇: "电信社会网络离网用户预测及分析", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222975A (zh) * | 2019-05-31 | 2019-09-10 | 北京奇艺世纪科技有限公司 | 一种流失用户分析方法、装置、电子设备及存储介质 |
CN110348914A (zh) * | 2019-07-19 | 2019-10-18 | 中国银行股份有限公司 | 客户流失数据分析方法及装置 |
CN113139767A (zh) * | 2020-01-20 | 2021-07-20 | 菜鸟智能物流控股有限公司 | 物流对象分拨方法和装置、电子设备以及计算机可读存储介质 |
CN111611240A (zh) * | 2020-04-17 | 2020-09-01 | 第四范式(北京)技术有限公司 | 执行自动机器学习过程的方法、装置及设备 |
CN112069325A (zh) * | 2020-09-01 | 2020-12-11 | 张富平 | 基于区块链离线支付的大数据处理方法及云服务推送平台 |
CN112767125A (zh) * | 2021-01-15 | 2021-05-07 | 上海琢学科技有限公司 | 一种客户流失的预测方法、装置及存储介质 |
CN112836749A (zh) * | 2021-02-03 | 2021-05-25 | 中国工商银行股份有限公司 | 一种系统资源调整方法、装置及设备 |
CN112801709A (zh) * | 2021-02-05 | 2021-05-14 | 杭州拼便宜网络科技有限公司 | 一种用户流失预测方法、装置、设备及存储介质 |
CN113435513A (zh) * | 2021-06-28 | 2021-09-24 | 平安科技(深圳)有限公司 | 基于深度学习的保险客户分群方法、装置、设备和介质 |
CN113435513B (zh) * | 2021-06-28 | 2024-06-04 | 平安科技(深圳)有限公司 | 基于深度学习的保险客户分群方法、装置、设备和介质 |
CN113658597A (zh) * | 2021-08-01 | 2021-11-16 | 杭州拼便宜网络科技有限公司 | 语音下单方法、装置、电子设备和计算机可读介质 |
CN113658597B (zh) * | 2021-08-01 | 2024-04-30 | 杭州拼便宜网络科技有限公司 | 语音下单方法、装置、电子设备和计算机可读介质 |
CN113676606A (zh) * | 2021-08-23 | 2021-11-19 | 中国联合网络通信集团有限公司 | 停机方法及设备 |
CN113676606B (zh) * | 2021-08-23 | 2022-08-16 | 中国联合网络通信集团有限公司 | 停机方法及设备 |
CN113706202A (zh) * | 2021-08-31 | 2021-11-26 | 杭州群核信息技术有限公司 | 一种基于低稳态用户识别及预警的召回策略生成方法 |
CN114221877A (zh) * | 2021-12-14 | 2022-03-22 | 中国联合网络通信集团有限公司 | 负载预测方法、装置、设备和计算机可读介质 |
CN114707699A (zh) * | 2022-03-04 | 2022-07-05 | 易视腾科技股份有限公司 | 基于机器学习的网络电视订单退订预测方法 |
CN117422181A (zh) * | 2023-12-15 | 2024-01-19 | 湖南三湘银行股份有限公司 | 一种基于模糊标签的代发客户流失预警方法及系统 |
CN117422181B (zh) * | 2023-12-15 | 2024-04-02 | 湖南三湘银行股份有限公司 | 一种基于模糊标签的代发客户流失预警方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109636443A (zh) | 客户流失预测的深度学习方法及装置 | |
Jiang et al. | The sharing economy and business model design: A configurational approach | |
CN101375307A (zh) | 用于操作因特网广告媒体市场的方法 | |
CN101427281A (zh) | 基于网络的信息技术方案开发和管理系统及方法 | |
CN104424595A (zh) | 税务监控方法及其系统 | |
Morley | Modeling international tourism demand: Model specification and structure | |
CN108694649A (zh) | 一种知识产权托管服务平台 | |
CN108305152B (zh) | 一种遥控装置及集遥控功能的测绘仪器租赁管理平台 | |
Isoke et al. | Factors influencing selection of drinking water technologies for urban informal settlements in K ampala | |
CN113052705A (zh) | 一种供应链金融服务流程管理方法及装置 | |
CN111582511B (zh) | 一种新零售自动管理平台运维系统及使用方法 | |
CN115456745A (zh) | 小微企业画像构建方法及装置 | |
KR20190097349A (ko) | 사업 수행 시스템 및 그 방법 | |
CN108764673A (zh) | 一种专利托管服务平台以及基于平台的数据交互方法 | |
KR100799627B1 (ko) | 고객정보의 실시간 통합을 이용한 영업구역 내 고객분석서비스 방법 | |
Karacaoglu et al. | Disintermediation evidence from a cleaning platform | |
KR102049507B1 (ko) | 통신 상품 컨설팅 제공 시스템 및 방법 | |
Bigerna et al. | An empirical investigation of the Indian households’ willingness to pay to avoid power outages | |
CN115292613A (zh) | 线上帖评的内容滤差方法、系统和装置 | |
Lee et al. | Regional characteristics, industry agglomeration and location choice: Evidence from Japanese manufacturing investments in Korea | |
KR20230068916A (ko) | 지역 기반 여행 체험단 체험 진행 및 수익 분배 방법 | |
Moyo | Infrastructure quality and manufacturing exports in Africa: A firm‐level analysis | |
CN105912647A (zh) | 一种移动互联网服务管理系统 | |
Hanafizadeh et al. | The pros and cons of digital divide and e-readiness assessments | |
CN113678158A (zh) | 数据处理系统、数据处理方法和程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190416 |