CN108428138B - 一种基于客户分群的客户生存率分析装置及分析方法 - Google Patents

一种基于客户分群的客户生存率分析装置及分析方法 Download PDF

Info

Publication number
CN108428138B
CN108428138B CN201710076357.1A CN201710076357A CN108428138B CN 108428138 B CN108428138 B CN 108428138B CN 201710076357 A CN201710076357 A CN 201710076357A CN 108428138 B CN108428138 B CN 108428138B
Authority
CN
China
Prior art keywords
customer
survival
transaction
time
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710076357.1A
Other languages
English (en)
Other versions
CN108428138A (zh
Inventor
刘朋飞
侯捷
李爱华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710076357.1A priority Critical patent/CN108428138B/zh
Publication of CN108428138A publication Critical patent/CN108428138A/zh
Application granted granted Critical
Publication of CN108428138B publication Critical patent/CN108428138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于客户分群的客户生存率分析装置及分析方法,其中所述装置包括:数据获取模块,用于获取客户的交易数据;客户分类模块,用于根据预设分群规则,把所述客户划分到相应的客户群体;生存分析模块,用于利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率。本发明通过从客户群体的角度对企业客户进行分类,能够有效进行精细的客户生存和流失预测以及挽留管理,利用了更多更稳定的客户群体特征数据,将随机性因素影响减少,从而计算更精准,应用的营销效果更好。

Description

一种基于客户分群的客户生存率分析装置及分析方法
技术领域
本发明涉及计算机领域,具体涉及一种基于客户分群的客户生存率分析装置及分析方法。
背景技术
客户保持是指企业通过努力来巩固及进一步发展与客户长期、稳定关系的动态过程和策略,因此对于企业提高营收、改善利润有着至关重要的作用,尤其对于拥有海量客户信息的电商企业来说更是如此。在这方面,电商企业的一个重要任务就是在资源有限的情况下,预测具有流失倾向的客户,识别并保持有价值的客户。对于客户流失预测的重点在于对客户流失预测模型精度的改进,还有对可能影响客户流失原因的分析以及后续有效挽回。
在现有技术中,对于客户流失预测是利用预测模型(例如,回归、分类等数学模型)针对单个客户进行的流失预测。由于客户行为存在随机性、异质性等特点,会使得客户特征非常不稳定和难以捕捉,造成预测诊断模型不准确。
发明内容
有鉴于此,本发明的目的是提供一种基于客户分群的客户生存率分析装置及分析方法,以避免现有技术中针对单个客户进行流失预测的预测结果不准确的问题。
本发明的技术方案是提供一种基于客户分群的客户生存率分析装置,其中所述装置包括:
数据获取模块,用于获取客户的交易数据,所述交易数据包括交易时间和交易频次;
客户分类模块,用于根据预设分群规则,把所述客户分类到相应的客户群体;
生存分析模块,用于利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率。
可选地,所述生存分析模块还用于计算每个所述客户群体的平均生存时间。
可选地,所述生存分析模块还用于对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
可选地,所述交易数据还包括交易金额和交易成本。
可选地,该装置还包括:价值评估模块,用于确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定。
可选地,该装置还包括:流失挽回输出模块,用于根据所述生存率或所述终生价值,对所述客户群体排序。
可选地,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
可选地,所述分析方法包括:根据所述交易数据,确定每个所述客户群体的生存时间,利用如下公式计算所述客户群体的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户群体中生存时间超过第t年的客户所占的比例。
本发明还提供一种基于客户分群的客户生存率分析方法,所述方法包括:
获取客户的交易数据,所述交易数据包括交易时间和交易频次;
根据预设分群规则,把所述客户划分到相应的客户群体;
利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率,所述生存率表示成时间的函数,并且为在给定时间范围内任意时刻所述客户群体生存的客户数占所述客户群体客户总数的比例。
可选地,该方法还包括:计算每个所述客户群体的平均生存时间。
可选地,该方法还包括:对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
可选地,所述交易数据还包括交易金额和交易成本。
可选地,该方法还包括:确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定。
可选地,该方法还包括:根据所述生存率或所述终生价值,对所述客户群体排序。
可选地,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
可选地,所述分析方法包括:利用如下公式计算所述客户群体的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户群体中生存时间超过第t年的客户所占的比例。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种基于客户分群的客户生存率分析电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现一种基于客户分群的客户生存率分析方法中任一所述的方法。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种基于客户分群的客户生存率分析的计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现一种基于客户分群的客户生存率分析方法中任一所述的方法。
本发明提供的基于客户分群的客户生存率分析装置及分析方法,通过从客户群体的角度对企业客户进行分类,并且能够实现直观展示、平均值计算到统计检验,较为完整客观评估不同特征的客户群生存情况和流失状态,从而便于后续进行精细的客户生存和流失预测以及挽留管理,利用了更多更稳定的客户群体特征数据,将随机性因素影响减少,从而计算更精准,应用的营销效果更好;同时结合客户群终生价值,在生存和流失预测基础上结合成本和收益进行综合排序管理,使用更科学,应用更可靠。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在附图中:
图1为本发明一实施例的基于客户分群的客户生存率分析装置的结构示意图;
图2为本发明一实施例的基于生存分析的一个客户群的生存率曲线图;
图3为本发明一实施例的基于生存分析的两个客户群的生存率曲线曲线图;
图4为本发明一实施例的基于生存分析的两个客户群的死亡率曲线图;
图5为本发明一实施例的基于生存分析的一个客户群的中位生存时间示意图;
图6为本发明一实施例的基于客户分群的客户生存率分析方法的流程示意图;
图7为本发明另一实施例的基于客户分群的客户生存率分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
在本文中,需要理解的是,所涉及的术语中:
生存分析:通过调查或实验得到的数据,对生物或人等对象的生存时间进行分析和推断,研究生存时间和众多影响生存时间的因素间的关系及其程度大小的方法。在医学方面,一个人从出生到死亡的时间叫生存时间。同样,可以将生存时间概念引入到企业的客户中,即认为生存时间为客户与企业建立业务关系从开始到终止的全过程。
中位生存期:又称半数生存期,表示总体中恰好有50%的个体尚存活的时间,对应到本发明的技术方案中,即为50%的客户未流失的时间。
完全数据:在随访期内观察到随访对象出现了预先所规定的结局,则认为该观察对象所提供的关于生存时间的数据是完整的,在本发明的技术方案中,即观察期结束到当前分析时间点前客户发生流失。
删失数据:因观测时间以及其他因素的限制,研究者可能无法掌握样本生存时间的起点,也可能丢失了生存过程中某时段的数据或缺少了终点的数据,造成数据观测的不完全。在本发明的技术方案中,即观察期结束到当前分析点前客户未发生流失。删失数据分为左删失和右删失,若进行观察或调查时,一个个体确切生存时间不知道,但只知道其生存时间大于一个确定的值H,则称该个体的生存时间是右删失。同样,如果只知道其生存时间小于一个确定的值L,则称个体的生存时间是左删失。
生存率:观察对象经历t个单位时段后仍存活的可能性,而流失率=1-生存率。
生存曲线:以观察时间为横轴,生存率为纵轴,将各个时间点所对应的生存率链接成一起的曲线图。生存曲线平缓,表示高生存率或较长生存期,生存曲线陡峭,表示低生存率或较短生存期。在本发明的技术方案中,即客户平缓的生存曲线表示低流失率,陡峭的生存曲线表示高流失率。
风险函数h(t):生存到时刻t的观察对象在时刻t的瞬时死亡率称为风险函数(hazard function),用公式表示为:
Figure GDA0003024962400000061
线性内插法:是根据一组已知的未知函数自变量的值和它相对应的函数值,利用等比关系去求一种求未知函数其他值的近似计算方法,是一种求位置函数逼近数值的求解方法。
下面参考图1对本发明示例性实施方式的基于客户分群的客户生存率分析装置的组成结构示意图进行介绍,其中,该装置1包括:
数据获取模块11,用于获取客户的交易数据;
客户分类模块12,用于根据预设分群规则,把所述客户划分到相应的客户群体;
生存分析模块13,用于利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率。
可选地,所述交易数据包括:交易时间、交易频次、交易金额以及交易成本。
可选地,所述生存分析模块13还用于计算每个客户群体的平均生存时间。
可选地,所述生存分析模块13还用于对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
可选地,该装置1还包括:价值评估模块14,用于确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定;
流失挽回输出模块15,用于根据所述生存率或所述终生价值,对客户群体排序。
可选地,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
可选地,所述分析方法包括:根据所述交易数据,确定每个所述客户群体的生存时间,利用如下公式计算所述客户群体的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户群体中生存时间超过第t年的客户所占的比例。
实施例
下面结合一个具体实施例对本发明进行具体描述,然而值得注意的是该具体实施例仅是为了更好地描述本发明,并不构成对本发明的不当限定。
首先,通过数据获取模块11获取每个客户的交易数据,其中该交易数据主要包括:交易时间(包括首次交易和末次交易时间)、交易金额、交易成本以及交易频次这四方面数据。
其次,利用客户分类模块12根据预设分群规则,把所述客户划分到相应的客户群体。
具体来说,客户分类模块12主要对客户群体进行指定,以便针对性进行生存分析模块13及终生价值评估模块14进行计算。
更具体地,该客户分类模块12可以分为两个子模块,分别为主题分类模块121和自定义分类模块122,其中主题数量均可以多选,可以对多个不同主题进行同时计算,以便比较效果,对比差异,方便多场景使用。
(1)主题分类模块121:该主题分类模块可以根据某个特定业务主题将企业总的客户群体进行分类,其中常见的业务主题有:事业部、品类(行业)、品牌、店铺等。由于各个主题之间的相关性很强,并且不同主题之间的异质性很强,因此可以很好地对客户群体进行区分,以便于对分类之后的客户群体进行后续的生存分析和终生价值等计算。
例如,以“品牌”这个业务主题可以分类出使用苹果手机和使用小米手机的客户群体,而这两类客户群体的基本属性、购买兴趣、需求及消费习惯差异性很大,因此,各个群体内的客户之间的相似性要大于彼此的差异性,这样分别对苹果品牌的客户群和小米品牌的客户群进行分别的生存函数估计和终生价值计算会比较符合实际情况,从而更有针对性对两类群体的流失进行预测及挽回。
在本发明一实施例中,通过预先将通用的业务分类主题进行默认计算,客户在实际的应用场景中是可以点击选取的方式执行上述操作。另外,如果有不在此默认列表中但是可以预先定义的主题,同样可以进行人工定制开发并且嵌入扩展至该模块中。
(2)自定义分类模块122:除了当前预设的业务主题可以对客户进行外,还有大量运营人员需要个性化自定义的业务场景,这时候可以让运营人员按自己的个性化需求自定义划分客户群体,以便于后续对这些自定义的客户群体进行计算。在本发明的一实施例中的实现方式是向客户提供API接口,以将自定义的客户名的数据包上传至本发明的计算系统,然后根据其计算结果进行后续计算。
然后,利用生存分析模块13根据所述交易数据,计算所述客户群体中每一所述客户的生存时间和生存率。
具体来说,该生存分析模块13,用于计算经分类的客户群体之后各客户群体的生存分析情况,主要对生存函数进行估计,计算生存时间、生存概率等数据。
更具体地,该生存分析模块13包含三个子模块,分别为生存时间计算模块131、生存率计算模块132以及生存过程比较模块133。
(1)生存时间计算模块131,用于根据所述客户的所述交易频次中的距离当前时间最近一次交易时间与首次交易时间之差,计算生成所述客户的生存时间。
(2)生存率计算模块132:图2为该模块以生存时间为横轴,生存率为纵轴的生存率曲线图,即生成所谓的Kaplan-Meier生存曲线,是一条阶梯状的曲线。如图3所示,通过生存分析的可视化展示,可以直观看出一个或几个特定的分类的客户群体其生存率或死亡率随时间变化的趋势、特点、分布情况,可以直观展示客户群的生存特点。
关于生存分析的方法有三种,分别为:参数法,半参数法,非参数法。由于前两种方法参数估计和半参估计都要求样本在一定程度上服务某种分布,对于实际生产中的复杂数据在多种情况下都不符合,因此使用扩展性受到很大限制。在本发明一实施例中,通过采用非参数方法进行生存分析的计算。具体来说,非参数方法为乘积极限法,也称为Kaplan-Meier法,其定义从随访开始到生存时间长于t单位时间的生存率为:
P(T>t)=S1*S2*...*St
其中,Si表示在已生存ti-1年条件下再生存一单位时间到达ti单位时间的条件概率,生存函数S(t)为:观察对象的生存时间T大于某时刻t的概率称为生存函数(survivalfunction)。
S(t)满足条件:S(0)=1,S(∞)=0,且0≤S(t)≤1。
其中,S(t)用第一公式表示为:
Figure GDA0003024962400000101
例如,假设以年为计算的单位时间,则S1表示至少存活一年的客户占所有客户的比例,S2表示在存活一年的病人中存活过第二年的客户所占所有客户的比例,St表示在存活(t-1)年的客户中存活过第t年的客户所占的比例。
该模块有两方面作用,一方面是单个客户群生存率分布图,用于如3直观展示和观察感兴趣的某个经分类的客户群体的生存率分布情况。换句话来说就是,可以观察不同时间点的生存率,是否有生存率突然变化(陡降)的点存在,曲线越陡峭说明生存率急剧下降,在营销中是非常不利的情况,需要寻找原因和对策。另一方面,如图4所示,可对比的多个客户群生存或死亡率曲线分布对比图,可以观察不同组曲线之间的距离(曲线的分叉),其距离越大说明两者生存率差别越大,两种组之间的营销效果、营销表现可能非常不同,需要更深入观察和研究。由于这两种用法可以应用于不同的应用场景,因此便于使用者方便选择。
下面通过举例对计算过程进行详细描述。
例如,某品类对20个客户的生存时间进行调查,首先计算并记录如下数据(单位:月):
11,11,11+,7+,7,4,4+,4,12+,3,13,13+,13,13,16,15,15+,15,16,13(注:带+号的为右删失数据)。
值得一提的是,该生存时间是客户的交易频次中距离当前时间最近一次交易时间与首次交易时间之差。
然后,将数据从小到大进行排列得到:(注:数据一样大时,右删失数据在右边)
3,4,4,4+,7,7+,11,11,11+,12+,13,13,13,13,13+,15,15,15+,16,16
根据上述生存函数的计算公式,在每个t取值下的生存概率为:
Figure GDA0003024962400000121
即存活3个月以上的概率为0.95;
Figure GDA0003024962400000122
即存活4个月以上的概率为0.85;
Figure GDA0003024962400000123
即存活7个月以上的概率为0.7969;
Figure GDA0003024962400000124
即存活11个月以上的概率为0.6830
Figure GDA0003024962400000125
即存活12个月以上的概率为0.6830
Figure GDA0003024962400000126
即存活13个月以上的概率为0.41;
Figure GDA0003024962400000127
即存活15个月以上的概率为0.246;
S(16)=0,即存活16个月以上的概率为0。
根据上式整理得到:
Figure GDA0003024962400000128
在本发明一实施例中,生存率计算模块132还包括:平均生存时间模块134,该模块用于估计经过分类的特定客户群体的生存时间分布,并可以通过线性内插法计算得出该客户群体的平均生存时间(即中位生存期)。
首先,利用生存率计算模块132得到该特定客户群体在每个时间点的生存概率。
然后,由于生存时间的分布总是偏态的,故平均生存时间通常用中位生存时间来计算,其意义是如图5所示的50%的个体存活且有50%个体死亡的时间。
利用上述的生存函数,可将该客户群体的中位生存期估算约为12个月至13个月之间,并且可利用线性内插法进行精确计算:
Figure GDA0003024962400000131
最后,由此可知,该客户群体的中位生存期为m=13-0.67=12.33个月。
(3)生存过程比较模块133,该模块用于在可视化和概率估计发现初步差异的基础上,进一步从统计检验的角度深入利用生存率及其标准误差对各分类的客户群体的生存率进行比较,以研究各组间的生存过程是否有差别。
例如,对比两组客户群体的营销方案,以确定哪种客户激励、保持或挽留方案更好。如果不涉及多个客户群体的对比,则此模块可以跳过。
具体方式是通过统计显著性检验,检验不同营销方案的对生存时间的差别是否统计上显著,即数据所显示的差别是显著地还是由于样本中的随机波动造成的。
在本发明一实施例中是通过非参数检验(Log-Rank)来实现的,具体实现方法如下:
步骤1:对两组或多组生存曲线比较,检验统计量在大样本时近似服从卡方(Chi-square)分布,自由度为组数-1;
步骤2:Log-Rank的零假设是两个或多个生存曲线之间没有显著的统计学差异,可以利用输出的统计检验p值确定拒绝原假设的概率,p值越小,说明两个或多个生存曲线没有显著差异的可能性越小,则原先通过可视化和生存时间估计得出的差异是显著的,而非由于样本的随机波动导致。
举例说明:甲乙两组医疗方法,为验证两种方法是否存在差异,统计了59期各组的生存和死亡数据,每组理论死亡数为:
表1
Figure GDA0003024962400000141
计算对应卡方值:
表2
Figure GDA0003024962400000142
Figure GDA0003024962400000143
查表可知自由度为1,置信度为0.05下,P<0.01,拒绝原假设,可以认为两组的生存过程有差别,甲乙两种疗法的生存率不同。
在本发明一实施例中,该装置1还包括:价值评估模块14,用于计算客户群体在其整个生存时间内的终生价值。
具体来说,客户的终生价值依赖于客户在整个生命周期的每个阶段为企业降低成本和增加收益的能力,并且通用计算公式进行计算:
Figure GDA0003024962400000151
其中,CLV为客户群体在生存时间内的所述终生价值;
i为第i交易期;
n为根据客户所处客户群的生存时间来确定生命周期中总的交易期数;
Ri为在第i交易期内的交易金额;
Ci为在第i交易期内的交易成本;
d为行业基准折现率或与第i交易期同期的银行利率。
特别地,该模块可以分为以下两个子模块:收益-成本模块141和终生价值折现模块142,两者区别在于是否对客户价值进行时间上的折现,也就是上述公式的分母部分,当客户群生存期较短时,为简便起见,只计算第一个模块即可,第二个模块可跳过,具体实施方式可由使用者自主决定。
通过上述方法可以对每个客户进行终生价值的计算,然后可以汇总到经分类的客户群体,由此计算得出每个分类的客户群体的终生价值。
在本发明一实施例中,该装置1还包括:流失挽回输出模块15:根据所述生存率或所述终生价值,对客户群体排序。
具体来说,该流失挽回输出模块15是根据生存分析模块13与终生价值评估模块14输出的客户群体的生存分布情况以及终生价值,然后按照生存时间或者生存概率的大小或者终生价值的大小两类指标进行综合排序输出。
具体实现方式分为两个子模块,分别为流失预测排序模块151和流失挽回价值排序模块152。其中,流失预测排序模块151用于将客户群体的平均生存时间或各时间段的生存概率进行排序输出,针对生存时间短或者在相同时间段上生存概率小(即死亡概率高)的客户群体进行优先排序输出,以便于企业对这类群体优先进行营销挽留。
对于流-挽回价值排序模块152来说,该模块用于将客户群体按照终生价值高低进行排序输出,以便于企业对终生价值高的客户群体优先进行营销挽回。
此外,企业还可以结合实际的营销需求,对上述两个模块进行综合排序,例如自定义加权、取top等方法,从多个维度进行综合考虑。
图6为本发明一实施例的基于客户分群的客户生存率分析方法的流程示意图,其中,该方法包括:
步骤S601:获取客户的交易数据;
步骤S602:根据预设分群规则,把所述客户划分到相应的客户群体;
步骤S603:利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率。
可选地,所述交易数据包括:交易时间、交易频次、交易金额以及交易成本。
可选地,该方法还包括:计算每个客户群体的平均生存时间。
可选地,该方法还包括:对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
可选地,该方法还包括:确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定;
根据所述生存率或所述终生价值,对客户群体排序。
可选地,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
可选地,所述分析方法包括:根据所述交易数据,确定每个所述客户群体的生存时间,利用如下公式计算所述客户群体的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户群体中生存时间超过第t年的客户所占的比例。
由于本发明提供的基于生存分析的客户群体流失分析方法是上述分析装置对应的方法,故不在此赘述。
图7为本发明另一实施例的基于客户分群的客户生存率分析装置,其中该装置7包括:存储器71和处理器72,其中,所述存储器71用于存储指令,所述处理器72用于执行所述指令时,执行本发明提供的基于客户分群的客户生存率分析方法。
本发明提供的基于客户分群的客户生存率分析装置及分析方法,通过从客户群体的角度对企业客户进行分类,并且能够实现直观展示、平均值计算到统计检验,较为完整客观评估不同特征的客户群生存情况和流失状态,从而便于后续进行精细的客户生存和流失预测以及挽留管理,利用了更多更稳定的客户群体特征数据,将随机性因素影响减少,从而计算更精准,应用的营销效果更好;同时结合客户群终生价值,在生存和流失预测基础上结合成本和收益进行综合排序管理,使用更科学,应用更可靠。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于客户分群的客户生存率分析装置,其特征在于,所述装置包括:
数据获取模块,用于获取客户的交易数据,所述交易数据包括交易时间和交易频次;
客户分类模块,用于根据预设分群规则,把所述客户分类到相应的客户群体;
生存分析模块,用于利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率;
其中,所述分析方法包括:
根据所述交易数据,确定每个所述客户群体的生存时间,利用如下公式计算所述客户群体第T年的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户群体中生存时间超过第t年的客户所占的比例;
所述生存分析模块还用于计算每个所述客户群体的平均生存时间;
所述生存分析模块还用于对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
2.根据权利要求1所述的分析装置,其特征在于,所述交易数据还包括交易金额和交易成本。
3.根据权利要求2所述的分析装置,其特征在于,还包括:
价值评估模块,用于确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定。
4.根据权利要求3所述的分析装置,其特征在于,还包括:
流失挽回输出模块,用于根据所述生存率或所述终生价值,对所述客户群体排序。
5.根据权利要求1所述的分析装置,其特征在于,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
6.一种基于客户分群的客户生存率分析方法,其特征在于,所述方法包括:
获取客户的交易数据,所述交易数据包括交易时间和交易频次;
根据预设分群规则,把所述客户划分到相应的客户群体;
利用预设的分析方法,根据所述交易数据,确定每个所述客户群体的生存率;
其中,所述分析方法包括:
根据所述交易数据,确定每个所述客户群体的生存时间,利用如下公式计算所述客户群体第T年的生存率,并且所述公式为
P(T>t)=S1*S2*...*St
其中,St表示存活(t-1)年的客户中生存时间超过第t年的客户所占的比例;
还包括:
计算每个所述客户群体的平均生存时间;
还包括:
对不同客户群体按照设定指标进行生存率对比,并输出比较结果。
7.根据权利要求6所述的分析方法,其特征在于,所述交易数据还包括交易金额和交易成本。
8.根据权利要求7所述的分析方法,其特征在于,还包括:
确定每个客户群体对应的终生价值,所述终生价值根据对应的客户群体产生的所述交易金额和所述交易成本来确定。
9.根据权利要求8所述的分析方法,其特征在于,还包括:
根据所述生存率或所述终生价值,对所述客户群体排序。
10.根据权利要求6所述的分析方法,其特征在于,所述分群规则包括:按品类分群,按品牌分群,按部门或店铺分群。
11.一种基于客户分群的客户生存率分析电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求6-10中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求6-10中任一所述的方法。
CN201710076357.1A 2017-02-13 2017-02-13 一种基于客户分群的客户生存率分析装置及分析方法 Active CN108428138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710076357.1A CN108428138B (zh) 2017-02-13 2017-02-13 一种基于客户分群的客户生存率分析装置及分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710076357.1A CN108428138B (zh) 2017-02-13 2017-02-13 一种基于客户分群的客户生存率分析装置及分析方法

Publications (2)

Publication Number Publication Date
CN108428138A CN108428138A (zh) 2018-08-21
CN108428138B true CN108428138B (zh) 2021-07-20

Family

ID=63154998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710076357.1A Active CN108428138B (zh) 2017-02-13 2017-02-13 一种基于客户分群的客户生存率分析装置及分析方法

Country Status (1)

Country Link
CN (1) CN108428138B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197317B (zh) * 2018-08-31 2022-10-28 腾讯科技(深圳)有限公司 目标用户确定方法及装置、电子设备及存储介质
CN109409963A (zh) * 2018-11-12 2019-03-01 平安科技(深圳)有限公司 客户生命周期的预测方法及装置、存储介质、计算机设备
CN110046910B (zh) * 2018-12-13 2023-04-14 蚂蚁金服(杭州)网络技术有限公司 判断客户通过电子支付平台所进行交易合法性的方法和设备
CN110826793A (zh) * 2019-10-30 2020-02-21 京东数字科技控股有限公司 用于资产分配的价值评估方法、装置、电子设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505795A (zh) * 2001-04-26 2004-06-16 ��ʽ�����ͨTec 客户资产价值评估系统
CA2767789A1 (en) * 2009-07-10 2011-01-13 Itg Software Solutions, Inc. Systems, methods and computer program products for redirecting electronic trade orders
CN102136123A (zh) * 2011-03-15 2011-07-27 中国工商银行股份有限公司 一种银行目标客户识别系统
CN105469144A (zh) * 2015-11-19 2016-04-06 东北大学 基于粒子分类与bp神经网络的移动通信用户流失预测方法
CN105976204A (zh) * 2016-05-03 2016-09-28 无锡雅座在线科技发展有限公司 从时间维度处理消费数据的方法和装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统
CN106327032A (zh) * 2015-06-15 2017-01-11 阿里巴巴集团控股有限公司 一种用于客户流失预警的数据分析方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505795A (zh) * 2001-04-26 2004-06-16 ��ʽ�����ͨTec 客户资产价值评估系统
CA2767789A1 (en) * 2009-07-10 2011-01-13 Itg Software Solutions, Inc. Systems, methods and computer program products for redirecting electronic trade orders
CN102136123A (zh) * 2011-03-15 2011-07-27 中国工商银行股份有限公司 一种银行目标客户识别系统
CN106327032A (zh) * 2015-06-15 2017-01-11 阿里巴巴集团控股有限公司 一种用于客户流失预警的数据分析方法和装置
CN105469144A (zh) * 2015-11-19 2016-04-06 东北大学 基于粒子分类与bp神经网络的移动通信用户流失预测方法
CN105976204A (zh) * 2016-05-03 2016-09-28 无锡雅座在线科技发展有限公司 从时间维度处理消费数据的方法和装置
CN106203679A (zh) * 2016-06-27 2016-12-07 武汉斗鱼网络科技有限公司 一种用户流失预测方法及系统

Also Published As

Publication number Publication date
CN108428138A (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
US10417650B1 (en) Distributed and automated system for predicting customer lifetime value
US8631040B2 (en) Computer-implemented systems and methods for flexible definition of time intervals
US20190220779A1 (en) Predicting a consumer selection preference based on estimated preference and environmental dependence
CN108428138B (zh) 一种基于客户分群的客户生存率分析装置及分析方法
US10839318B2 (en) Machine learning models for evaluating differences between groups and methods thereof
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN110009502B (zh) 理财数据分析方法、装置、计算机设备和存储介质
CN112182071B (zh) 数据关联关系挖掘方法、装置、电子设备及存储介质
EP2778979A1 (en) Search result ranking by brand
CN111861605A (zh) 业务对象推荐方法
US9928516B2 (en) System and method for automated analysis of data to populate natural language description of data relationships
US11232463B2 (en) Systems and methods for finding an interaction subset within a set of interactions
US20190205341A1 (en) Systems and methods for measuring collected content significance
CN110796379B (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN117076770A (zh) 基于图计算的数据推荐方法、装置、存储价值及电子设备
CN110717653A (zh) 风险识别方法及装置和电子设备
CN110796520A (zh) 商品推荐的方法、装置、计算设备以及介质
WO2019205381A1 (zh) 股票筛选方法、装置及计算机可读存储介质
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN109934689B (zh) 目标对象排名解释方法、装置、电子设备及可读存储介质
CN110264306B (zh) 基于大数据的产品推荐方法、装置、服务器及介质
CN114818843A (zh) 数据分析的方法、装置和计算设备
JP6287280B2 (ja) 情報処理方法、プログラム、及び情報処理装置
CN113763080A (zh) 推荐物品的确定方法、装置、电子设备和存储介质
CN111080446A (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant