CN109409963A - 客户生命周期的预测方法及装置、存储介质、计算机设备 - Google Patents
客户生命周期的预测方法及装置、存储介质、计算机设备 Download PDFInfo
- Publication number
- CN109409963A CN109409963A CN201811340686.3A CN201811340686A CN109409963A CN 109409963 A CN109409963 A CN 109409963A CN 201811340686 A CN201811340686 A CN 201811340686A CN 109409963 A CN109409963 A CN 109409963A
- Authority
- CN
- China
- Prior art keywords
- client
- sample
- customer
- life cycle
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004083 survival effect Effects 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 31
- 230000001788 irregular Effects 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 230000036541 health Effects 0.000 claims description 6
- 230000014759 maintenance of location Effects 0.000 claims description 5
- 230000005012 migration Effects 0.000 abstract description 9
- 238000013508 migration Methods 0.000 abstract description 9
- 238000004458 analytical method Methods 0.000 abstract description 8
- 239000000047 product Substances 0.000 description 40
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种客户生命周期的预测方法及装置、存储介质、计算机设备,预测方法包括:根据样本客户的历史交易数据,得到流失状态的样本客户;获取流失状态的样本客户对应的特征数据,利用特征数据建立流失客户样本集;利用流失客户样本集,对COX预测模型进行训练;应用训练后的COX预测模型进行待预测客户的生命周期预测。本申请根据历史交易数据对样本客户的生存状态进行分析,得到流失样本客户,根据流失样本客户的特征数据建立训练集,对COX预测模型进行训练,从而利用COX预测模型进行待预测客户的生命周期分析,确定客户的流失时间,为业务方提供调整运营策略的时间指标。
Description
技术领域
本申请涉及客户生命周期的预测技术领域,尤其是涉及到一种客户生命周期的预测方法及装置、存储介质、计算机设备。
背景技术
在商业营销领域有这样的共识:80%的收入来自于20%的客户,而将产品或服务卖给现有客户的成本比寻找一个新的用户低10倍。因此,为了使企业利益最大化,就需要了解现有客户的终生价值(Customer Lifetime Value,CLV)(从成为公司客户的那一时刻起,到从公司流失这段时间内能产生的收入总和),从而最大化地从现有客户获取足够的收入。研究客户的CLV,最重要的一步是如何考虑客户的未来价值(Customer Future Value,CFV)。为了精确得到CFV,关键就是如何预测客户未来的生命周期。
传统的基于统计的方法,只能将客户分群,计算出每一个群体唯一的流失概率,进一步根据用户所属的群体,确定客户的流失概率,或者对客户的流失情况进行0-1预测,只有客户流失或客户不流失两种结果。这样缺乏灵活性和定制化,误差偏大,而且只能预测客户流失的风险,不能精确到时间的颗粒度(比如天或者月),因此不能作为业务方参考调整运营策略的时间段指标。
发明内容
有鉴于此,本申请提供了一种客户生命周期的预测方法及装置、存储介质、计算机设备,能够确定客户的流失时间,为业务方提供调整运营策略的时间指标。
根据本申请的一个方面,提供了一种客户生命周期的预测方法,其特征在于,包括:
根据样本客户的历史交易数据,得到流失状态的样本客户;
获取所述流失状态的样本客户对应的特征数据,利用所述特征数据建立流失客户样本集;
利用所述流失客户样本集,对COX预测模型进行训练;
应用训练后的所述COX预测模型进行待预测客户的生命周期预测。
根据本申请的另一方面,提供了一种客户生命周期的预测装置,其特征在于,包括:
流失客户获取单元,用于根据样本客户的历史交易数据,得到流失状态的样本客户;
样本集建立单元,用于获取所述流失状态的样本客户对应的特征数据,利用所述特征数据建立流失客户样本集;
模型训练单元,用于利用所述流失客户样本集,对COX预测模型进行训练;
预测单元,用于应用训练后的所述COX预测模型进行待预测客户的生命周期预测。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述客户生命周期的预测方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述客户生命周期的预测方法。
借由上述技术方案,本申请提供的一种客户生命周期的预测方法及装置、存储介质、计算机设备,现有技术只能进行客户流失或不流失的0-1判断相比,通过应用本实施例的技术方案,首先根据历史交易数据对样本客户的生存状态进行分析,得到流失样本客户,然后根据流失样本客户的特征数据建立训练集,对COX预测模型进行训练,从而利用COX预测模型进行待预测客户的生命周期分析,与现有技术相比,本方案能够分析客户的生命周期,也即能够确定客户的流失时间,为业务方提供调整运营策略的时间指标。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种客户生命周期的预测方法的流程示意图;
图2示出了本申请实施例提供的另一种客户生命周期的预测方法的流程示意图;
图3示出了本申请实施例提供的一种客户生命周期的预测装置的结构示意图;
图4示出了本申请实施例提供的另一种客户生命周期的预测装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种客户生命周期的预测方法,如图1所示,该方法包括:
步骤101,根据样本客户的历史交易数据,得到流失状态的样本客户。
其中,样本客户的历史交易数据可以包括客户的车险订单数据、意外险订单数据、定期基金的订单数据、购买股票的交易数据、客户的账户资金流动数据、客户的账户资金余额数据等等。
例如,历史交易数据客户中包括车险保险订单数据,具体可以包括车险订单生效时间、车险订单到期时间、车险订单续约时间等。
再例如,历史交易数据中还包括客户的定期基金购买订单数据,具体可以包括基金的申购时间、基金的收益日起始时间、基金的收益日终止时间。
再例如,历史交易数据中还包括股票的交易数据,具体可以包括股票的申购时间、股票的抛售时间。
根据样本客户的历史交易数据,可以分析出客户的生存状态,判断客户已经流失还是仍然留存,得到流失状态样本客户以及留存状态样本客户。
步骤102,获取流失状态的样本客户对应的特征数据,利用流失状态样本客户的特征数据建立流失客户样本集。
按照样本客户的生存状态对客户进行分类后,样本客户将被分为流失状态的样本客户和留存状态的样本客户,对于流失状态的样本客户,需要获取其对应的特征数据,特征数据主要包括能够反映样本客户的自身特征以及购买行为特征的数据,利用这些流失状态样本客户的特征数据建立流失客户样本集,流失客户样本集用于训练流失预测模型。
步骤103,利用流失客户样本集,对COX预测模型进行训练。
利用包含流失样本客户特征数据的流失客户样本集对COX回归模型进行训练,得到COX客户流失预测模型。
步骤104,应用训练后的COX预测模型进行待预测客户的生命周期预测。
应用训练后的COX预测模型,根据待预测客户的特征数据输入至COX预测模型中得到输出结果,从而利用输出结果分析待预测客户的生命周期。
通过应用本实施例的技术方案,首先根据历史交易数据对样本客户的生存状态进行分析,得到流失样本客户,然后根据流失样本客户的特征数据建立训练集,对COX预测模型进行训练,从而利用COX预测模型进行待预测客户的生命周期分析,与现有技术只能判断客户会否流失相比,本方案能够分析客户的生命周期,也即能够确定客户的流失时间,为业务方提供调整运营策略的时间指标。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种客户生命周期的预测方法,如图2所示,该方法包括:
步骤201,若历史交易数据中包含不定期产品的交易数据,则当不定期产品对应的历史交易时间不在预设时间内时,将样本客户的生存状态标记为流失状态。
在上述实施例中,具体地,样本客户历史交易数据包含历史交易产品的类型以及历史交易时间,历史交易产品类型包含不定期产品类型和定期产品类型。其中,不定期产品是一种交易操作性质或不定期操作性质的产品,比如对于股票产品,由客户任意选择时间进行申购和抛售,客户申购股票后,可以选择长期持有,也可以选择短期持有,抛售时间由客户自行把控,没有固定的操作时间要求,而定期产品多为定期的合同性质的产品,比如对于车辆保险订单,客户购买车险签订合同,合同上明确规定了车险的生效时间,以及有效期限,如果客户有长期的车险需求,需要在到达有效期限后,重新签订车险合同。
对于客户生存状态的分析,也要区别不定期产品和定期产品分别进行判断,具体对于不定期产品的客户生存状态分析方式如下:
若样本客户的历史交易数据中包含不定期产品的交易数据,那么如果样本客户在连续的一段时间内(如一年内)没有产生对该产品的交易数据,也就是说连续的一段时间内没有对该产品进行操作,或者连续的一段时间内客户的账户余额为零,则认为样本客户流失,将样本客户的生存状态标记为流失状态,否则,则认为样本客户没有流失,将样本客户的生存状态标记为留存状态。划分产品种类,从而对客户生存状态分析,能够得到更加准确的客户生存状态。
步骤202,若历史交易数据中包含定期产品的交易数据,则当根据定期产品对应的历史交易时间确定样本客户在定期产品合约到期后没有进行续约时,将样本客户的生存状态标记为流失状态。
具体地,对于定期产品的客户生存状态分析如下:
若样本客户的历史交易数据中包含定期产品的交易数据,那么如果样本客户在其购买的定期产品的产品合同到期后,没有续约的交易数据产生,则认为样本客户流失,将样本客户的生存状态标记为流失状态,否则,则认为样本客户没有流失,将样本客户的生存状态标记为留存状态。由于合同到期之前的一段时间内,通常会对客户进行自动提醒,提示客户合同即将到期,督促其进行续约,因而设定若合同到期没有续约就认为客户流失。当然,客户流失的判定条件也可以设置为,合同到期后预设续约时间内没有续约操作,判定客户为流失。
对于不同类型的产品来说,若采用相同的流失定义方式对客户的生存状态进行分类,例如对于签订两年合同的定期产品,若仍认为连续一年内没有操作的客户就为流失客户,显然是不合理的,会导致客户生存状态分析的不准确。因此,本方案对于不同类型的产品设定不同的流失判定方式,对于客户流失的判定更加准确。
步骤203,获取流失状态的样本客户的基本特征数据以及交易特征数据。
客户的特征数据包括基本特征数据以及交易特征数据,其中,基本特征主要包括客户的统计学数据,例如客户的年龄、性别、居住地等等,交易特征数据主要包括客户的购买产品的行为特征,例如购买产品的数量、频次等等,将客户的基本特征以及交易特征进行数据提取与归一化等处理,形成基本特征数据以及交易特征数据,为建立COX预测模型的训练集提供基础,以便于后续对COX预测模型进行训练。
步骤204,利用基本特征数据以及交易特征数据构建流失状态的样本客户的特征向量(x1,x2,…,xp);其中,p为基本特征数据的数量与交易特征数据的数量之和。
将每一个流失样本客户的全部基本特征数据和全部交易特征数据构成特征向量X,X中的每一元素分别为某一项基本特征数据或交易特征数据,将客户的全部基本特征数据和全部交易特征数据构成特征向量,为建立COX预测模型的训练集提供基础,以便于后续对COX预测模型进行训练。
步骤205,根据流失状态的样本客户的特征向量(x1,x2,…,xp),建立流失客户样本集。
根据每一个流失状态的样本客户的特征向量,建立流失客户样本集,即将每一个流失状态的样本客户的特征向量放入流失客户样本集中,流失客户样本集作为COX预测模型的训练集,为后续训练COX预测模型提供基础,以供利用训练集对COX预测模型进行训练。
步骤206,利用流失客户样本集,对COX预测模型进行训练。
在上述实施例中,具体地,COX预测模型为:
其中,r(t)为客户在时刻t的生存概率,X=(x1,x2,…,xp)T为模型的p维协变量,x1,x2,…,xp表示客户的p个特征数据,β1、β2…βp为模型的回归系数,r0(t)为客户在时刻t的基准生存概率,即t时刻协变量X的取值为0时的客户生存概率,r0(t)根据历史交易数据确定。
协变量X是由客户的特征数据确定的,具体为客户的特征向量的转置。
基准生存概率r0(t)通过历史交易数据确定,通常r0(t)是一个关于t的多项式,多项式的具体形式以及具体确定方式,在此不做限定,r0(t)主要依据样本客户的生存时间进行确定,客户的生存时间的计算方式如下:
引入观测起始时间点t0,若客户在观测起始时间点t0到现在(观测终止时间tz)一直没有流失,可记录客户的生存时间T1=tz-t0,若客户在从观测起始时间点t0到现在已经流失,则记录客户的生存时间T2=流失日期-t0。
在上述实施例中,具体地,回归系数β1、β2…βp的计算方式包括:
采用似然函数
求出回归系数β1、β2…βp的估计值;其中,从流失客户样本集中选取任意n个流失状态的样本客户作为观测样本客户,从观测起始时间开始到时刻t,得到m个健康数据以及n-m个删失数据,健康数据为在观测时间段内没有退出的观测样本客户,删失数据为在观测时间段内退出的观测样本客户,R(ti)为在时刻t生存状态为留存状态且没有出现删失的观测样本客户。
其中,删失数据是由于客户在观测时间段突然退出数据缺失产生的,不能作为模型训练的样本数据,因此这部分数据在进行模型训练时不予考虑。
利用流失客户样本集对COX预测模型进行训练,使得训练后的COX预测模型可以对不同时间的客户生存概率进行预测,以便根据不同时间下的客户生存概率对客户的生命周期进行估计。
步骤207,将待预测客户的特征数据输入至训练后的COX预测模型中,得出不同时间点的待预测客户的生存概率。
利用训练后的COX预测模型,将待预测客户的特征数据作为输入,得到客户在不同时间点的生存概率,从而便于根据客户的生存概率分析客户的生存状态。
例如,利用COX预测模型,对客户甲的生存概率进行预测,则将客户甲的特征数据输入至COX预测模型中,分别对客户甲在某一年的1月、2月、3月……12月的生存概率进行预测,得到生存概率依次为90%、88%、80%……40%。
步骤208,根据不同时间下的待预测客户的生存概率,得到待预测客户的生命周期。
在上述实施例中,具体地,获取生存概率下降到预设概率的时间作为待预测客户的生命结束时间,客户的生命周期为生命结束时间与待预测客户的生命起始时间之差。
通过COX预测模型对不同时间的客户生存概率预测后,获取生存概率下降到预设概率的时间,将这个时间作为客户的生命结束时间,并获取客户的第一笔历史交易的交易时间作为客户的生命起始时间,则客户的生命周期为生命结束时间与生命起始时间之差,将客户的生命周期预测精确到时间的颗粒度(比如天或者月),进而可以根据客户的生命周期判断客户的等级,以及可以根据客户的等级以及生命结束时间调整对客户的运营策略。
其中,预设概率可以取50%或其他值,也可以利用COX预测模型训练的准确率和召回率求取最佳阈值作为预设概率。
例如,经过COX预测模型预测,客户乙在2025年9月时,生存概率下降到50%,并经过计算客户乙的生命周期是10年,客户乙为高级客户,并且客户乙的剩余生命时间为5年以上,可认为客户乙为“高价值客户”,那么,则为客户乙制定“高价值客户”运营策略,比如为客户乙分配高级服务人员,提供VIP服务通道等,以使客户乙得到更好的服务,进而获取客户乙的最大价值。
通过应用本实施例的技术方案,通过流失样本客户的特征数据对COX预测模型进行训练,从而利用训练后的模型,得到不同时间点的待预测客户的生存概率,以确定客户的生命周期数据,将客户的流失时间精确到时间颗粒度,为业务方调整运营策略提供坚实的基础,有助于业务方提高工作效率。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种客户生命周期的预测装置,如图3所示,该装置包括:流失客户获取单元31、样本集建立单元32、模型训练单元、预测单元34。
流失客户获取单元31,用于根据样本客户的历史交易数据,得到流失状态的样本客户;
样本集建立单元32,用于获取流失状态的样本客户对应的特征数据,利用特征数据建立流失客户样本集;
模型训练单元33,用于利用流失客户样本集,对COX预测模型进行训练;
预测单元34,用于应用训练后的COX预测模型进行待预测客户的生命周期预测。
在具体的应用场景中,样本客户历史交易数据包含历史交易产品类型以及历史交易时间,历史交易产品类型包含不定期产品类型和定期产品类型;,如图4所示,流失客户获取单元31具体包括:第一流失客户获取单元311、第二流失客户获取单元312;
第一流失客户获取单元311,用于若历史交易数据中包含不定期产品的交易数据,则当不定期产品对应的历史交易时间不在预设时间内时,将样本客户的生存状态标记为流失状态;
第二流失客户获取单元312,用于若历史交易数据中包含定期产品的交易数据,则当根据定期产品对应的历史交易时间确定样本客户在定期产品合约到期后没有进行续约时,将样本客户的生存状态标记为流失状态。
样本集建立单元32,具体包括:特征数据获取单元321、特征向量建立单元322、样本集建立子单元323;
特征数据获取单元321,用于获取流失状态客户的基本特征数据以及交易特征数据;
特征向量建立单元322,用于利用基本特征数据以及交易特征数据构建流失状态的样本客户的特征向量(x1,x2,…,xp);其中,p为基本特征数据的数量与交易特征数据的数量之和;
样本集建立子单元323,用于根据流失状态的样本客户的特征向量(x1,x2,…,xp),建立流失客户样本集。
在上述实施例中,COX预测模型为:
其中,r(t)为客户在时刻t的生存概率,X=(x1,x2,…,xp)T为所述模型的p维协变量,x1,x2,…,xp表示所述客户的p个特征数据,β1、β2…βp为模型的回归系数,r0(t)为客户在时刻t的基准生存概率,即t时刻协变量X的取值为0时的客户生存概率,r0(t)根据历史交易数据确定。
回归系数β1、β2…βp的计算方式包括:
采用似然函数
求出回归系数β的估计值,β=(β1、β2…βp);其中,从所述流失客户样本集中选取任意n个所述流失状态的样本客户作为观测样本客户,从观测起始时间开始到时刻t,得到m个健康数据以及n-m个删失数据,健康数据为在观测时间段内没有退出的观测样本客户,删失数据为在观测时间段内退出的观测样本客户,R(ti)为在时刻t生存状态为留存状态且没有出现删失的观测样本客户。
在具体的应用场景中,为了估计客户的生命周期,预测单元34,具体包括:
生存概率预测单元341,用于将待预测客户的特征数据输入至训练后的COX预测模型中,得出不同时间点的待预测客户的生存概率;
生命周期预测单元342,用于根据不同时间下的待预测客户的生存概率,得到待预测客户的生命周期;
生命周期预测单元342,具体用于获取生存概率下降到预设概率的时间作为待预测客户的生命结束时间,客户的生命周期为生命结束时间与待预测客户的生命起始时间之差。
需要说明的是,本申请实施例提供的一种客户生命周期的预测装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的客户生命周期的预测方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的客户生命周期的预测方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本实施例的技术方案,首先根据历史交易数据对样本客户的生存状态进行分析,得到流失样本客户,然后根据流失样本客户的特征数据建立训练集,对COX预测模型进行训练,从而利用COX预测模型进行待预测客户的生命周期分析,与现有技术只能判断客户会否流失相比,本方案能够分析客户的生命周期,也即能够确定客户的流失时间,为业务方提供调整运营策略的时间指标。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种客户生命周期的预测方法,其特征在于,包括:
根据样本客户的历史交易数据,得到流失状态的样本客户;
获取所述流失状态的样本客户对应的特征数据,利用所述特征数据建立流失客户样本集;
利用所述流失客户样本集,对COX预测模型进行训练;
应用训练后的所述COX预测模型进行待预测客户的生命周期预测。
2.根据权利要求1所述的方法,其特征在于,所述样本客户历史交易数据包含历史交易产品类型以及历史交易时间,所述历史交易产品类型包含不定期产品类型和定期产品类型;
所述根据样本客户的历史交易数据,得到流失状态的样本客户,具体包括:
若所述历史交易数据中包含不定期产品的交易数据,则当所述不定期产品对应的所述历史交易时间不在预设时间内时,将所述样本客户的生存状态标记为流失状态;
若所述历史交易数据中包含定期产品的交易数据,则当根据所述定期产品对应的所述历史交易时间确定所述样本客户在所述定期产品合约到期后没有进行续约时,将所述样本客户的生存状态标记为流失状态。
3.根据权利要求1所述的方法,其特征在于,所述获取所述流失状态的样本客户对应的特征数据,利用所述特征数据建立流失客户样本集,具体包括:
获取所述流失状态的样本客户的基本特征数据以及交易特征数据;
利用所述基本特征数据以及所述交易特征数据构建所述流失状态的样本客户的特征向量(x1,x2,…,xp);其中,p为所述基本特征数据的数量与所述交易特征数据的数量之和;
根据所述流失状态的样本客户的特征向量(x1,x2,…,xp),建立流失客户样本集。
4.根据权利要求3所述的方法,其特征在于,所述COX预测模型为:
其中,r(t)为客户在时刻t的生存概率,X=(x1,x2,…,xp)T为所述模型的p维协变量,x1,x2,…,xp表示所述客户的p个特征数据,β1、β2…βp为所述模型的回归系数,r0(t)为所述客户在时刻t的基准生存概率,即t时刻协变量X的取值为0时的客户生存概率,r0(t)根据所述历史交易数据确定。
5.根据权利要求4所述的方法,其特征在于,所述利用所述流失客户样本集,对COX预测模型进行训练,具体包括:
采用似然函数
求出所述回归系数β的估计值,β=(β1、β2…βp);其中,从所述流失客户样本集中选取任意n个所述流失状态的样本客户作为观测样本客户,从观测起始时间开始到时刻t,得到m个健康数据以及n-m个删失数据,所述健康数据为在所述观测时间段内没有退出的所述观测样本客户,所述删失数据为在所述观测时间段内退出的所述观测样本客户,R(ti)为在时刻t生存状态为留存状态且没有出现删失的所述观测样本客户。
6.根据权利要求1所述的方法,其特征在于,所述应用训练后的所述COX预测模型进行待预测客户的生命周期预测,具体包括:
将待预测客户的特征数据输入至训练后的所述COX预测模型中,得出不同时间点的所述待预测客户的生存概率;
根据不同时间下的所述待预测客户的生存概率,得到所述待预测客户的生命周期。
7.根据权利要求6所述的方法,其特征在于,根据不同时间下的所述待预测客户的生存概率,得到所述待预测客户的生命周期,具体包括:
获取所述生存概率下降到预设概率的时间作为所述待预测客户的生命结束时间,所述客户的生命周期为所述生命结束时间与所述待预测客户的生命起始时间之差。
8.一种客户生命周期的预测装置,其特征在于,包括:
流失客户获取单元,用于根据样本客户的历史交易数据,得到流失状态的样本客户;
样本集建立单元,用于获取所述流失状态样本客户对应的特征数据,利用所述特征数据建立流失客户样本集;
模型训练单元,用于利用所述流失客户样本集,对COX预测模型进行训练;
预测单元,用于应用训练后的所述COX预测模型进行待预测客户的生命周期预测。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的客户生命周期的预测方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的客户生命周期的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340686.3A CN109409963A (zh) | 2018-11-12 | 2018-11-12 | 客户生命周期的预测方法及装置、存储介质、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340686.3A CN109409963A (zh) | 2018-11-12 | 2018-11-12 | 客户生命周期的预测方法及装置、存储介质、计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109409963A true CN109409963A (zh) | 2019-03-01 |
Family
ID=65473097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811340686.3A Pending CN109409963A (zh) | 2018-11-12 | 2018-11-12 | 客户生命周期的预测方法及装置、存储介质、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109409963A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872003A (zh) * | 2019-03-06 | 2019-06-11 | 中国科学院软件研究所 | 对象状态预测方法、系统、计算机设备及存储介质 |
CN110348914A (zh) * | 2019-07-19 | 2019-10-18 | 中国银行股份有限公司 | 客户流失数据分析方法及装置 |
CN110826793A (zh) * | 2019-10-30 | 2020-02-21 | 京东数字科技控股有限公司 | 用于资产分配的价值评估方法、装置、电子设备和介质 |
CN111582577A (zh) * | 2020-05-07 | 2020-08-25 | 北京思特奇信息技术股份有限公司 | 一种电信用户离网预测方法、系统、介质及设备 |
CN112381258A (zh) * | 2019-11-26 | 2021-02-19 | 国家电网公司 | 表计运行生命周期预测方法及装置 |
CN112465546A (zh) * | 2020-11-26 | 2021-03-09 | 中诚信征信有限公司 | 一种用户识别方法、装置及设备 |
CN112686448A (zh) * | 2020-12-31 | 2021-04-20 | 重庆富民银行股份有限公司 | 基于属性数据的流失预警方法及系统 |
CN112884515A (zh) * | 2021-02-22 | 2021-06-01 | 上海汽车集团股份有限公司 | 用户流失的预测方法、装置及计算机存储介质 |
CN113379527A (zh) * | 2020-03-09 | 2021-09-10 | 银联数据服务有限公司 | 一种信用卡易睡眠客户的确定方法及装置 |
CN113538070A (zh) * | 2020-10-30 | 2021-10-22 | 深圳市九九互动科技有限公司 | 用户生命价值周期检测方法、装置和计算机设备 |
CN113554448A (zh) * | 2020-04-23 | 2021-10-26 | 支付宝实验室(新加坡)有限公司 | 一种用户流失预测方法、装置及电子设备 |
CN114742569A (zh) * | 2021-01-08 | 2022-07-12 | 广州视源电子科技股份有限公司 | 用户生命阶段预测方法、装置、计算机设备及存储介质 |
CN114742144A (zh) * | 2022-04-02 | 2022-07-12 | 中国建设银行股份有限公司 | 对象流失概率的确定方法、装置、计算机设备和存储介质 |
CN113656702B (zh) * | 2021-08-27 | 2023-07-14 | 建信基金管理有限责任公司 | 用户行为的预测方法及装置 |
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108428138A (zh) * | 2017-02-13 | 2018-08-21 | 北京京东尚科信息技术有限公司 | 一种基于客户分群的客户生存率分析装置及分析方法 |
-
2018
- 2018-11-12 CN CN201811340686.3A patent/CN109409963A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108428138A (zh) * | 2017-02-13 | 2018-08-21 | 北京京东尚科信息技术有限公司 | 一种基于客户分群的客户生存率分析装置及分析方法 |
Non-Patent Citations (5)
Title |
---|
张明芝等主编: "《实用医学统计学与SAS应用》", 30 September 2015, 苏州大学出版社 * |
李志祥 等编著: "《危机管理专题研究》", 31 January 2014, 国防工业出版社 * |
李莉等编著: "《管理定量分析 决策中常用的分析方法》", 31 August 2007, 上海交通大学出版社 * |
邓森文: "基于COX模型的移动通信中低端客户流失预测研究", 《中国优秀博硕士学位论文全文数据库(硕士) 经济与管理科学辑(月刊)》 * |
闫莉 等著: "《上市公司财务危机防范理论和实证研究》", 31 August 2009, 中国物资出版社 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872003A (zh) * | 2019-03-06 | 2019-06-11 | 中国科学院软件研究所 | 对象状态预测方法、系统、计算机设备及存储介质 |
CN110348914A (zh) * | 2019-07-19 | 2019-10-18 | 中国银行股份有限公司 | 客户流失数据分析方法及装置 |
CN110826793A (zh) * | 2019-10-30 | 2020-02-21 | 京东数字科技控股有限公司 | 用于资产分配的价值评估方法、装置、电子设备和介质 |
CN112381258A (zh) * | 2019-11-26 | 2021-02-19 | 国家电网公司 | 表计运行生命周期预测方法及装置 |
CN112381258B (zh) * | 2019-11-26 | 2024-03-19 | 国家电网公司 | 表计运行生命周期预测方法及装置 |
CN113379527A (zh) * | 2020-03-09 | 2021-09-10 | 银联数据服务有限公司 | 一种信用卡易睡眠客户的确定方法及装置 |
CN113554448A (zh) * | 2020-04-23 | 2021-10-26 | 支付宝实验室(新加坡)有限公司 | 一种用户流失预测方法、装置及电子设备 |
CN111582577A (zh) * | 2020-05-07 | 2020-08-25 | 北京思特奇信息技术股份有限公司 | 一种电信用户离网预测方法、系统、介质及设备 |
CN113538070B (zh) * | 2020-10-30 | 2023-12-26 | 深圳市九九互动科技有限公司 | 用户生命价值周期检测方法、装置和计算机设备 |
CN113538070A (zh) * | 2020-10-30 | 2021-10-22 | 深圳市九九互动科技有限公司 | 用户生命价值周期检测方法、装置和计算机设备 |
CN112465546A (zh) * | 2020-11-26 | 2021-03-09 | 中诚信征信有限公司 | 一种用户识别方法、装置及设备 |
CN112465546B (zh) * | 2020-11-26 | 2024-04-19 | 中诚信征信有限公司 | 一种用户识别方法、装置及设备 |
CN112686448B (zh) * | 2020-12-31 | 2024-02-13 | 重庆富民银行股份有限公司 | 基于属性数据的流失预警方法及系统 |
CN112686448A (zh) * | 2020-12-31 | 2021-04-20 | 重庆富民银行股份有限公司 | 基于属性数据的流失预警方法及系统 |
CN114742569A (zh) * | 2021-01-08 | 2022-07-12 | 广州视源电子科技股份有限公司 | 用户生命阶段预测方法、装置、计算机设备及存储介质 |
CN112884515A (zh) * | 2021-02-22 | 2021-06-01 | 上海汽车集团股份有限公司 | 用户流失的预测方法、装置及计算机存储介质 |
CN113656702B (zh) * | 2021-08-27 | 2023-07-14 | 建信基金管理有限责任公司 | 用户行为的预测方法及装置 |
CN114742144A (zh) * | 2022-04-02 | 2022-07-12 | 中国建设银行股份有限公司 | 对象流失概率的确定方法、装置、计算机设备和存储介质 |
CN117688343A (zh) * | 2024-02-04 | 2024-03-12 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
CN117688343B (zh) * | 2024-02-04 | 2024-05-03 | 成都帆点创想科技有限公司 | 一种多任务学习LSTM-Attention框架的LTV预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409963A (zh) | 客户生命周期的预测方法及装置、存储介质、计算机设备 | |
US8473328B2 (en) | System and method for strategizing interactions with a client base | |
CA2944165C (en) | Systems and methods for context-based event triggered product and/or services offerings | |
JP5108012B2 (ja) | 協調フィルタリングを用いてカードメンバーの支出を予測するための方法 | |
Chen et al. | Pricing schemes in cloud computing: Utilization‐based vs. reservation‐based | |
Min et al. | Customer acquisition and retention spending: An analytical model and empirical investigation in wireless telecommunications markets | |
CN110111139B (zh) | 行为预估模型生成方法、装置、电子设备及可读介质 | |
US20110071962A1 (en) | Method and system of using network graph properties to predict vertex behavior | |
CN110223155A (zh) | 投资推荐信息的推送方法、装置及计算机设备 | |
US10558987B2 (en) | System identification framework | |
US20170262275A1 (en) | System and method for run-time update of predictive analytics system | |
US20200234218A1 (en) | Systems and methods for entity performance and risk scoring | |
US11568343B2 (en) | Data analytics model selection through champion challenger mechanism | |
RU2649759C1 (ru) | Устройство и способ для анализа информации | |
Gaurav et al. | Value creation via accelerated digital transformation | |
US20210224351A1 (en) | Method and system for optimizing an objective having discrete constraints | |
US7966254B2 (en) | Method and system for credit decisioning using activity based costing and compartmental modeling | |
CN109685302A (zh) | 基于数据分析的业务分配方法、设备、存储介质及装置 | |
WO2020150597A1 (en) | Systems and methods for entity performance and risk scoring | |
US20240020527A1 (en) | Machine learning modeling of time series with divergent scale | |
Alfieri et al. | Usage of SoS methodologies in production system design | |
Iwata et al. | Analysis of the characteristics of customer defection on a hair salon considering individual differences | |
JP2019145007A (ja) | 案件進捗予測装置および案件進捗予測システム | |
WO2022259511A1 (ja) | 営業支援装置、営業支援方法およびプログラム | |
CN113362120B (zh) | 群体确定方法及装置、电子设备、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190301 |
|
RJ01 | Rejection of invention patent application after publication |