CN117829908A - 分层分析方法、装置、电子设备、存储介质及程序产品 - Google Patents
分层分析方法、装置、电子设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN117829908A CN117829908A CN202410022175.6A CN202410022175A CN117829908A CN 117829908 A CN117829908 A CN 117829908A CN 202410022175 A CN202410022175 A CN 202410022175A CN 117829908 A CN117829908 A CN 117829908A
- Authority
- CN
- China
- Prior art keywords
- service
- order
- client
- index
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 115
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 56
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 76
- 238000012545 processing Methods 0.000 claims description 32
- 238000004364 calculation method Methods 0.000 claims description 28
- 230000000007 visual effect Effects 0.000 claims description 20
- 238000007621 cluster analysis Methods 0.000 claims description 17
- 238000012800 visualization Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 11
- 230000006399 behavior Effects 0.000 description 9
- 238000007794 visualization technique Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 238000012821 model calculation Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000033228 biological regulation Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 230000006855 networking Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种分层分析方法、装置、电子设备、存储介质及程序产品,包括:获取用户输入的客户分层等级、客户的订单数据,对订单数据进行预处理,得到待处理数据;针对每一客户ID,基于待处理数据确定服务购买期限、付费使用时间和服务到期时间;利用服务购买期限和服务到期时间确定第一指标,利用服务购买期限和付费使用时间确定第二指标,将指标和订单关键值输入改进的RFM模型中,得到指标数据集;利用聚类算法和客户分层等级对指标数据集进行聚类分析,得到分析结果,将其进行可视化显示,这样,本申请改进的RFM模型,适合服务使用期限长度不同的场景,通过使用聚类算法,增加数据稳定性,减少对专家建议的依赖,提高分层结果的准确性。
Description
技术领域
本申请涉及数据分析技术领域,尤其涉及一种分层分析方法、装置、电子设备、存储介质及程序产品。
背景技术
客户分析的本质是对消费者内在特征的一种量化描述,是通过对其外在行为及属性的分析进行客户类型的划分,从而实现对客户的深度洞察,而客户分层分析就是一种按照不同的分层定义对客户进行群组划分的分析方法,通过进行客户分层可以实现对客户的高效管理。
现有技术中,RFM模型是衡量客户价值的重要工具和手段,即通过客户最近购买时间(Recency)、购买频率(Frequency)和购买金额(Monetary)这三个维度来描述客户的购买行为和价值;进一步的,在计算出RFM指标数值后,根据专家经验将RFM指标数值划分到不同的象限中,并进行可视化显示,以实现客户分层的目的。
但是,由于不同服务的有效期存在差异,客户购买的同一服务的服务期不同,对应的客户价值不同,且RFM指标数值需要依靠专家经验划分到不同的象限中,如果使用RFM模型来分析客户价值,分析的准确性降低。
发明内容
本申请提供一种分层分析方法、装置、电子设备、存储介质及程序产品,用于解决现有使用RFM模型来分析客户价值,分析的准确性降低的问题。
第一方面,本申请提供一种分层分析方法,所述方法包括:
获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
可选的,对所述订单数据进行预处理,得到待处理数据,包括:
对所述订单数据进行数据清洗,得到待处理数据;所述数据清洗包括删除测试发起的订单、删除尚未生效的订单以及删除存在空值或错误数值的订单。
可选的,基于所述客户ID对应的所述订单编号确定服务购买期限,包括:
基于所述客户ID对应的所述订单编号确定是否存在服务赠送时间;
若否,则基于所述订单编号从数据表中查询所述订单编号对应的服务购买期限;
若是,则基于所述订单编号从数据表中查询所述订单编号对应的可使用期限,并计算所述可使用期限和所述服务赠送时间之差,得到服务购买期限。
可选的,利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,包括:
对所述RFM指标数据集中的订单关键值进行归一化处理,得到目标数据集;
基于经过归一化处理后的订单关键值,利用聚类算法和所述客户分层等级,计算得到每个客户归属的等级类别;
基于每个客户归属的等级类别确定目标客户,并基于所述目标客户的客户ID进行客户数量的汇总,得到至少一个等级类别的目标客户数量;
基于所述目标客户数量和目标客户对应的订单关键值,计算得到平均购买金额,并基于所述平均购买金额对所述目标数据集进行分析,得到分析结果。
可选的,所述RFM模型的改进过程包括:
设置第一指标和第二指标的计算公式,并基于所述第一指标和所述第二指标确定约束条件;所述第一指标对应的计算公式为:Ri=Ai/T;所述第二指标对应的计算公式为:Fi=Bi/T;所述约束条件的计算公式为:Ri+Fi≤1;
其中,Ai表示第i个客户的服务到期时间,Bi表示第i个客户的付费使用时间,T表示服务购买期限。
可选的,将所述分析结果进行可视化显示,包括:
基于所述约束条件确定所述分析结果分布的三角形区域;
基于订单关键值确定所述分析结果中每一数据对应的样本点大小,将所述分析结果基于所述样本点大小和所述客户分层等级进行可视化显示;其中,每一客户分层等级对应的样本点具有相应的颜色。
可选的,获取用户输入的客户分层等级,包括:
获取用户输入的产品属性、客户规模和/或应用场景,并基于所述产品属性、所述客户规模和/或所述应用场景确定客户分层等级;
或,获取用户输入的客户分层类别,基于肘部法则对所述客户分层类别进行处理,以确定客户分层等级。
第二方面,本申请提供一种分层分析方法,应用于车联网服务;所述方法包括:
获取运营人员输入的客户分层等级,以及客户购买车联网服务的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
第三方面,本申请提供一种分层分析装置,所述装置包括:
获取模块,用于获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
确定模块,用于针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
输入模块,用于利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
可视化模块,用于利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
第四方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面和第二方面中任一项所述的方法。
第五方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面和第二方面中任一项所述的方法。
第六方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面和第二方面中任一项所述的方法。
综上所述,本申请提供一种分层分析方法、装置、电子设备、存储介质及程序产品,可以针对购买场景中存在的服务有效期差异的购买模式,通过获取客户购买服务的订单数据,并对获取到的订单数据进行预处理,得到待处理数据,进一步的,基于待处理数据计算客户的服务购买期限、付费使用时间和服务到期时间,进而利用服务购买期限、付费使用时间和服务到期时间计算改进的RFM模型中各个客户的指标,进一步的,利用聚类算法和客户分层等级,对各个客户的指标进行聚类分析,得到分析结果,并将分析结果进行可视化显示;其中,服务购买期限为服务对应的可购买时间;付费使用时间与客户购买服务的期限范围相关;服务到期时间为客户购买的上一次服务距离订单结束日期的时间间隔,这样,本申请通过使用改进的RFM模型的计算方法,使其适合服务购买场景中服务使用期限长度不同的特性,可以准确地反映客户的价值,此外,本申请采用聚类算法,能够自动实现客户分层,减少对专家经验的依赖,提高了数据分析的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种使用改进RFM模型进行客户分析的流程示意图;
图2为本申请实施例提供的一种应用场景示意图;
图3为本申请实施例提供的一种分层分析方法的流程示意图;
图4为一种现有的RFM指标数值可视化显示的3D示意图;
图5为本申请实施例提供的一种可视化显示的效果示意图;
图6为本申请实施例提供的一种分层分析装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一设备和第二设备仅仅是为了区分不同的设备,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
客户分析的本质是对消费者内在特征的一种量化描述,是通过对其外在行为及属性的分析进行客户类型的划分,从而实现对客户的深度洞察,而客户分层分析就是一种按照不同的分层定义对客户进行群组划分的分析方法,通过进行客户分层可以实现对客户的高效管理。
一种可能的实现方式中,客户价值(Recency-Frequency-Monetary,RFM)模型是一种经典的客户分层分析方法,用于衡量客户的购买价值,该RFM模型通过客户最近购买时间(Recency)、购买频率(Frequency)和购买金额(Monetary)这三个维度来描述客户的购买行为和价值,并在计算出RFM指标数值后,将这些指标可视化,其中,在可视化之前,可以根据专家经验将包括RFM指标数值的数据样本划分到不同的象限中,以实现客户分层的目的。
具体的,在经典的RFM模型中,ri、fi、mi的常见的计算方式是:ri=第i个客户最近一次购买服务距离今天的天数,fi=第i个客户购买次数,mi=第i个客户订单金额总和。
但是,在上述经典的RFM模型中,购买频率的计算方法是统计客户在一段时间内的购买次数,然而在服务购买场景中,不同服务的有效期存在差异,因此,仅仅使用购买次数来计算无法准确反映客户的价值,且经典的RFM模型的结果需要依靠专家经验将数据样本划分到不同的象限中,这种人工干预可能会引入主观因素,从而降低分析结果的准确性。
举例来说,有两个客户都购买了一次服务,一个客户购买了一年的服务期,而另一个客户仅购买了一个月的服务期,两个客户购买次数相同,但是购买服务期的时限不同,显然前者的价值应该更高,这时,经典的RFM模型的计算方法难以直接应用到上述购买场景中。
针对上述问题,本申请提供一种分层分析方法,可以针对购买场景中存在的服务有效期差异的购买模式,利用改进的RFM模型的计算方法,使其适合服务购买场景中服务使用期限长度不同的特性,进一步的,通过使用聚类算法进行自动化的客户分析,以降低主观因素的影响。
具体的,图1为本申请实施例提供的一种使用改进RFM模型进行客户分析的流程示意图,如图1所示,通过获取客户购买服务的订单数据,并对获取到的订单数据进行预处理,得到待处理数据,进一步的,基于待处理数据计算客户的服务购买期限、付费使用时间和服务到期时间,进而利用服务购买期限、付费使用时间和服务到期时间计算改进的RFM模型中各个客户的指标,进一步的,利用聚类算法如Kmeans聚类算法,以及利用用户输入的客户分层等级,对各个客户的指标进行聚类分析,得到聚类结果,并将聚类结果进行可视化显示。
其中,服务购买期限为服务对应的可购买时间;付费使用时间为客户购买服务的期限范围之和;服务到期时间为客户购买的上一次服务距离订单结束日期的时间间隔,这样,本申请通过使用改进的RFM模型的计算方法,使其适合服务购买场景中服务使用期限长度不同的特性,可以准确地反映客户的价值,此外,本申请采用聚类算法,能够自动实现客户分层,减少对专家经验的依赖,提高了数据分析的准确性。
示例性的,图2为本申请实施例提供的一种应用场景示意图,如图2所示,该应用场景可以应用到车联网服务营销领域中,以应用到车联网服务购买场景为例,该应用场景包括:第一运营系统201、第二运营系统202、数据处理系统203和显示设备204;第一运营系统201和第二运营系统202用于存储不同区域或厂商的客户购买车联网服务的订单数据,不同区域或厂商的车联网服务对应的收费服务可能相同也可能不同,本申请实施例对此不作具体限定。
具体的,运营人员可以将第一运营系统201和第二运营系统202存储的至少一个客户购买服务的订单数据以及客户分层等级的类别发送到数据处理系统203进行处理,该数据处理系统203在接收到订单数据和客户分层等级后,可以对订单数据进行预处理,得到待处理数据,进一步的,基于待处理数据计算客户的服务购买期限、付费使用时间和服务到期时间,进而利用服务购买期限、付费使用时间和服务到期时间计算改进的RFM模型中各个客户的指标,进一步的,利用聚类算法和客户分层等级,对各个客户的指标进行聚类分析,得到聚类结果,并将聚类结果在显示设备204中进行可视化显示。
其中,服务购买期限为服务对应的可购买时间;付费使用时间为客户购买服务的期限范围之和;服务到期时间为客户购买的上一次服务距离订单结束日期的时间间隔。
可以理解的是,上述聚类结果可以帮助预测客户留存和流失情况,以便于车联网服务厂商采取相应的运营措施,提高客户留存率。
可选的,上述显示设备204可以指的是具有显示屏幕的电子设备,可以为平板电脑、手机、智能手表等电子设备,也可以是车载终端对应的显示设备,本申请实施例对此不作具体限定。
需要说明的是,本申请提供的分层分析方法,除了可以应用到车联网服务营销领域中,还可以应用到其他市场营销领域中,如购买视频会员、网络流量的应用场景中,本申请实施例对此不作具体限定,以上仅是示例说明。
在一些实施例中,可以对传统RFM指标代表性不足的问题进行改进,引入了代表性的指标,如引入用于评价客户价值的指标,以及通过层次分析法与熵值法确定各指标的权重,进而计算客户价值得分,使得可以利用聚类算法,对客户价值得分进行分类,得到具有不同客户价值的客户分类。
虽然上述方法是基于改进的RFM模型研究客户价值,且应用了Kmeans聚类算法,但是本申请的应用场景更多,尤其可以应用于车联网服务营销中,且本申请对RFM模型计算方法的改进点不同,本申请是基于服务购买期限、付费使用时间和服务到期时间计算改进的RFM模型中各个客户的指标,而且,本申请还提出了新的可视化方法,如三角形区域的显示方式,因此,本申请采用的技术手段,达到的技术效果与上述方法不同,详情可参照下述实施例的描述。
另一些实施例中,可以基于加权RFM模型研究客户价值,具体的,基于电商平台客户数据库中提取客户消费数据,计算每位客户最近一次消费的时间间隔R、规定时间段的消费频率F、规定时间段的消费总金额M,并进行Z分数标准化变换;将所得变换后的数据作为三个属性值,利用K-means算法进行聚类,得到电商平台客户群,进而采用层次分析法计算R、F和M各指标权重系数,以确定每个客户的综合价值的加权计算公式,根据该加权计算公式计算得到每个客户的综合价值。
虽然上述方法也是对RFM模型进行改进,用于研究客户价值,且也应用了Kmeans聚类算法,但是上述方法仅应用于电商平台客户细分中,本申请的应用场景比较广泛,尤其可以应用于车联网服务营销中,且本申请对RFM模型计算方法的改进点不同,本申请是基于服务购买期限、付费使用时间和服务到期时间计算改进的RFM模型中各个客户的指标,而且,上述方法对指标处理采用的是Z分数标准化,本申请采用的是对数据处理采用归一化处理,因此,本申请采用的技术手段,达到的技术效果与上述方法不同,详情可参照下述实施例的描述。
再一些实施例中,可以基于采集RFM指标数据和针对特定场景的附加特征数据,随机抽取预定比例的样本数据进行交叉标注,进而对标记数据进行特征处理,以及机器学习模型训练,使得可以在机器学习模型中对全量客户数据进行特定金融场所的分析处理,该机器学习模型为基于DeepForest分类算法的模型。
虽然上述方法也是基于RFM模型研究客户价值,且采用了机器学习算法,减少了对人工经验的依赖,但是,上述方法仅应用于金融客户分级中,本申请的应用场景比较广泛,尤其可以应用于车联网服务营销中,且本申请沿用了RFM模型的三个特征,上述方法却是基于应用场景,使用了泛化特征,而且,本申请应用的聚类算法属于无监督的学习方法,上述方法采用的DeepForest分类算法,属于有监督学习方法,因此,本申请采用的技术手段,达到的技术效果与上述方法不同,详情可参照下述实施例的描述。
又一些实施例中,为生成维度更为丰富的用户画像对客户行为进行分析,可以根据客户身份信息获取车联网中多个数据源的原始客户数据,每一数据源的原始客户数据包括客户的多种行为数据,进而通过对原始客户数据进行预处理以及聚类分析,得到多个客户数据集合,使得可以根据多个客户数据集合对客户进行多维度描述,以生成用户画像。
虽然上述方法应用于车联网服务领域,也都应用了聚类算法来实现对客户分层,但是,本申请可以通过客户购买车联网服务的视角,对客户的购买价值进行分层;上述方法没有聚焦于购买价值的分层;本申请应用改进的RFM模型,可以适合车联网服务购买场景,且本申请还提出了新的可视化方法;因此,本申请采用的技术手段,达到的技术效果与上述方法不同,详情可参照下述实施例的描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图3为本申请实施例提供的一种分层分析方法的流程示意图,如图3所示,所述分层分析方法的执行主体为数据处理系统,所述分层分析方法包括如下步骤:
S301、获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值。
其中,订单关键值可以指的是订单金额,也可以指的是与订单相关的付费数据等,本申请实施例对订单关键值对应的具体内容不作限定。
本申请实施例中,客户分层等级可以指的是用户用于区分客户的潜在价值以及客户类型而提前设定的客户等级,如客户分层等级为低价值组、中价值组和高价值组;该低价值组表示客户购买服务的频率低,间隔时间大;该中价值组表示客户购买服务的频率一般,间隔时间中等;该高价值组表示客户购买服务的频率高,间隔时间短;本申请实施例对客户分层等级的划分以及对应的内容不作具体限定,以上仅是示例说明。
在本步骤中,数据处理系统可以从运营系统中,获取客户购买服务的订单数据,包括:客户标识号(Identity Document,ID)、购买服务的订单编号、订单开始日期、订单结束日期以及订单金额,进而,可以形成数据集D={(IDi,codei,starti,endi),i=1,2,…,N},其中,N为客户数量,IDi表示第i个客户ID,codei表示第i个客户购买服务的订单编号,starti表示第i个客户购买服务的订单开始日期,endi表示第i个客户购买服务的订单结束日期。
相应的,还需获取用户输入的客户分层等级,以便在后续的聚类处理中设置聚类算法中类的数量。
进一步的,对订单数据进行预处理,即对形成的数据集D进行预处理,过滤掉数据集D中未生效或者存在错误的订单数据,得到待处理数据。
需要说明的是,本申请实施例中,用户指的是使用本申请提供的分层分析方法进行客户分层的使用者,如销售场景中的销售人员,车联网服务中的运营人员等,而客户指的是购买服务的用户,如购买车联网服务的用户。
S302、针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔。
其中,所述付费使用时间为客户购买服务的期限范围之和。
在一些实施例中,以购买车联网服务的场景为例,针对每一客户ID,计算客户购买的车联网服务对应的可购买的天数,即服务购买期限,该服务购买期限可以提前预存到数据库中,每一服务的订单编号对应有服务购买期限,则基于客户购买的服务的订单编号,便可以从数据库中调用对应的服务购买期限;其中,不同类型的订单对应不同的服务购买期限,故不同的订单编号对应不同的服务购买期限。
进一步的,还需计算客户的付费使用天数,即付费使用时间,该付费使用时间为客户购买所有服务期限范围的天数之和,该付费使用时间通过对所有服务的订单开始日期与订单结束日期之差进行加和计算得到;相应的,还需计算客户的服务到期时间,该服务到期时间为订单结束日期与当前日期之差。
S303、利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集。
本申请实施例中,计算改进的RFM模型中各客户的指标(Ri,Fi,Mi),i=1,2,…,N,Ri表示第一指标,Fi表示第二指标,Mi表示第三指标,该第三指标是第i个客户的订单关键值的总和,如第i个客户的订单金额总和。
需要说明的是,相较于经典的RFM模型,本申请对Recency和Frequency有所改进,即对Recency进行了标准化处理,单位不再是天数,而是可购买天数的占比,对应的为第一指标;将Frequency更改为付费使用时长,并且也转化为可购买天数的占比,对应的为第二指标;而Monetary的计算方法与经典的RFM模型保持一致。
在一些实施例中,可以是通过服务到期时间与服务购买期限之比确定第一指标,通过付费使用时间与服务购买期限之比确定第二指标,进一步的,将第一指标、第二指标和第三指标输入改进的RFM模型中,得到RFM指标数据集(Ri,Fi,Mi),这样,通过计算占比的方式可以降低各客户购买的服务有效期的差异。
在另一些实施例中,可以利用加权算法,确定服务到期时间和付费使用时间的权重系数,进一步对,利用加权算法,基于服务购买期限、服务到期时间和付费使用时间计算得到第一指标和第二指标,进一步的,将第一指标、第二指标和第三指标输入改进的RFM模型中,得到RFM指标数据集(Ri,Fi,Mi),这样,通过加权的方式可以提高确定客户分层的准确性。
可选的,本申请实施例也可以将第一指标、第二指标和客户的每个服务的订单关键值输入改进的RFM模型中,该RFM模型可以计算第i个客户的订单关键值的总和,得到第三指标,并基于第一指标、第二指标和第三指标,计算得到RFM指标数据集,可选的,第一指标和第二指标也可以进行类似的计算得到,本申请实施例对此不作具体限定。
需要说明的是,本申请实施例对确定第一指标和第二指标的方法不作具体限定,其可以基于应用场景或用户需求确定。
为了保证分层分析方法的通用性,本申请沿用RFM模型中的三个特征,可选的,在其它场景中,可以引入更多的特征,如客户的购买渠道、是否使用折扣等特征,以便于能够更全面地反映客户的行为特征,从而提高客户分层的准确性。
S304、利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
本申请实施例中,客户分层等级对应的为聚类算法中类的数量,因此,需要提前获取用户输入的客户分层等级,以确定聚类算法中类的数量,进而可以得到每个样本对应的类别名称Ci∈{1,2,3},i=1,2,…,N,例如,Ci=1,对应的是低价值组,Ci=2,对应的是中价值组,Ci=3,对应的是高价值组。
在本步骤中,以客户分层等级为3为例,数据处理系统可以应用Kmeans聚类算法,以及基于类的数量3,对RFM指标数据集(Fi,Ri,Mi,Ci)进行聚类分析,得到分析结果(聚类结果),并将分析结果在平面直角坐标系上绘制成散点图进行可视化显示,以清晰地展示给用户,便于用户理解。
可选的,本申请实施例中聚类算法还可以使用DBSCAN(Density-Based SpatialClustering of Applications with Noise)聚类算法或者层次聚类方法,该DBSCAN聚类算法或者层次聚类方法具有降噪的功能,使得聚类结果更具准确性,本申请实施例对聚类算法对应的具体算法不作限定。
因此,本申请实施例提供一种分层分析方法,没有直接使用经典的RFM模型,而是有针对性地提出改良的计算方法,即对RFM模型进行改进,使之适用于存在服务有效期差异的场景,本申请通过使用改进的RFM模型的计算方法,能够更准确描述客户的购买行为,从而更准确地将客户划分为不同的层次,且本申请采用聚类算法,可以自动地将客户分层,无需人工干预,进而可以节省人力成本,并且减少了主观因素的影响,使得分层过程更加客观和准确。
需要说明的是,本申请实施例提供的分层分析方法,除了可以应用到购买车联网服务的应用场景中,也可以应用到购买视频观看会员、音乐会员等具有购买时长要求的应用场景中,本申请实施例对分层分析方法应用的具体场景不作限定。
可选的,对所述订单数据进行预处理,得到待处理数据,包括:
对所述订单数据进行数据清洗,得到待处理数据;所述数据清洗包括删除测试发起的订单、删除尚未生效的订单以及删除存在空值或错误数值的订单。
示例性的,以车联网服务销售场景为例,数据处理系统在获取到客户的订单数据后,可以将订单数据中的测试车辆发起的订单、尚未生效的订单以及存在的空值/错误数值的订单进行过滤,以得到待处理数据。
在一些实施例中,以购买音乐会员的场景为例,数据处理系统在获取到客户的订单数据后,可以将订单数据中的待支付的订单、待退款的订单以及未支付成功的订单进行过滤,以得到待处理数据。
因此,本申请实施例可以对订单数据进行数据清洗,保证本申请处理的数据的有效性,进而提高得到待处理数据的准确性。
可选的,基于所述客户ID对应的所述订单编号确定服务购买期限,包括:
基于所述客户ID对应的所述订单编号确定是否存在服务赠送时间;
若否,则基于所述订单编号从数据表中查询所述订单编号对应的服务购买期限;
若是,则基于所述订单编号从数据表中查询所述订单编号对应的可使用期限,并计算所述可使用期限和所述服务赠送时间之差,得到服务购买期限。
本申请实施例中,对于购买的服务中存在其它的服务赠送的场景,服务购买期限=可使用期限-服务赠送时间;所述可使用期限是客户可使用服务的总时间;本申请实施例对可使用期限对应的具体时间不作限定。
在本步骤中,由于不同服务的订单编号对应的可使用期限均可以提前存储于数据库的数据表中,因此,当获取到客户的客户ID后,可以基于订单编号确定是否存在服务赠送时间,或者,也可以基于标识信息确定是否存在服务赠送时间,此时,不同服务对应有标识信息,该标识信息用于指示是否存在服务赠送时间,相应的,可以将标识信息对应的可使用期限提前存储于数据库的数据表中。
进一步的,当确定存在服务赠送时间,则计算可使用期限和服务赠送时间之差,得到服务购买期限;当确定不存在赠送时间,则直接从数据表中调用对应的服务购买期限。
需要说明的是,本申请提供的分层分析方法,可以适用于购买服务领域中服务有效期差异和“赠送后续费”的场景,且还可以降低各客户赠送服务到期时长之间的差异。
因此,针对服务购买场景中存在的服务有效期差异和“赠送后续费”的购买模式,利用本申请提出的改进的RFM模型的计算方法,可以降低各客户赠送服务到期时长之间的差异,以更准确地反映客户的价值。
可选的,利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,包括:
对所述RFM指标数据集中的订单关键值进行归一化处理,得到目标数据集;
基于经过归一化处理后的订单关键值,利用聚类算法和所述客户分层等级,计算得到每个客户归属的等级类别;
基于每个客户归属的等级类别确定目标客户,并基于所述目标客户的客户ID进行客户数量的汇总,得到至少一个等级类别的目标客户数量;
基于所述目标客户数量和目标客户对应的订单关键值,计算得到平均购买金额,并基于所述平均购买金额对所述目标数据集进行分析,得到分析结果。
本申请实施例中,为了使聚类算法的结果稳定,需要对所有客户的订单关键值的总和进行归一化处理,以第i个客户为例,对第i个客户的订单关键值的总和进行归一化处理,计算公式如下:
其中,以订单关键值为订单金额为例,Mi是第i个客户的订单金额总和,Mmin是所有客户的订单金额总和的最小值,Mmax是所有客户的订单金额总和的最大值,是归一化处理后的第i个客户的订单金额总和,这样,将订单金额进行归一化处理,可以保证了/>与Fi,Ri的数值都在[0,1]区间内,使得聚类算法稳定。
相应的,每一个客户的订单金额总和均需要经过上述计算公式进行归一化处理,具体过程本申请实施例在此不再赘述。
在本步骤中,以客户分层等级为高/中/低价值为例,数据处理系统可以基于归一化处理后的数据集应用Kmeans聚类算法,并设置聚类算法中类的数量为3,计算得到每个样本对应的等级类别名称Ci∈{1,2,3},i=1,2,…,N,进一步的,基于每个样本对应的等级类别确定该等级类别对应目标客户,即该等级类别的客户有哪些。
针对每一等级类别的目标客户,基于目标客户的客户ID进行客户数量汇总,得到目标客户数量,进而基于目标客户对应的订单金额与目标客户数量之比,计算得到平均购买金额,进一步的,将类别的平均购买金额进行排序,以实现对客户高/中/低价值的分类,得到分析结果;其中,平均购买金额=第i个等级类别中的客户的订单金额总和/第i个等级类别中的客户数量。
因此,本申请实施例从提升自动化分析的角度出发,采用了聚类算法实现客户分层,保证数据稳定性,可以有效地减少对专家经验的依赖,更加客观和准确地划分客户层次,以降低主观偏见的干扰。
可选的,所述RFM模型的改进过程包括:
设置第一指标和第二指标的计算公式,并基于所述第一指标和所述第二指标确定约束条件;所述第一指标对应的计算公式为:Ri=Ai/T;所述第二指标对应的计算公式为:Fi=Bi/T;所述约束条件的计算公式为:Ri+Fi≤1;
其中,Ai表示第i个客户的服务到期时间,Bi表示第i个客户的付费使用时间,T表示服务购买期限。
本申请实施例中,客户的付费使用时间满足以下不等式:付费使用时间+服务到期时间≤服务购买期限,以购买车联网服务场景为例,付费使用天数+最近一次服务结束距今天数≤可购买天数,不等式两边除以可购买天数,可以得到以下性质:Ri+Fi≤1。
示例性的,以购买车联网服务场景为例,Ri=第i个客户最近一次服务到期距今天数/可购买天数,Fi=第i个客户付费使用天数/可购买天数;T=可购买天数。
由于经典的RFM模型并未考虑到期时长的影响,因此,本申请实施例通过改进RFM模型的计算方法,使其可以适用于购买场景中存在的服务有效期差异的购买模式中,提高了客户分层的准确性。
可选的,将所述分析结果进行可视化显示,包括:
基于所述约束条件确定所述分析结果分布的三角形区域;
基于订单关键值确定所述分析结果中每一数据对应的样本点大小,将所述分析结果基于所述样本点大小和所述客户分层等级进行可视化显示;其中,每一客户分层等级对应的样本点具有相应的颜色。
本申请实施例中,与经典的RFM模型图像展示不同,本申请提出了一种新的可视化方法,即利用Ri+Fi≤1的性质,将样本点展示在等腰直角三角形区域内。
示例性的,经典的RFM模型在可视化方面通常采用绘制3D图或对RFM值进行分段展示的方法,图4为现有的一种RFM指标数值可视化显示的3D示意图,如图4所示,利用经典的RFM模型计算得到的RFM指标数值的3D图,会产生较多的客户分层(共8类),包括:重要保持客户、重要挽留客户、重要发展客户、重要价值客户、一般保持客户、一般挽留客户、一般发展客户和一般价值客户;然而,当分段的数量过多时,图像中的样本会分散在各个区域,难以有效地呈现分层的结果。
针对现有可视化的问题,本申请提出改进的可视化方法,并与改进后的RFM模型的计算方法结合,可以帮助使用者从庞大的数据中准确高效地挖掘其中趋势和关联,图5为本申请实施例提供的一种可视化显示的效果示意图,以客户分层等级为3类为例,如图5中A所示,为RFM指标数据集聚类前的可视化效果图,在利用聚类算法进行聚类分析后,得到如图5中B所示的进行聚类的可视化效果图。
结合图4和图5分析,可以得到:经典的RFM模型的3D图,会产生较多的客户分层,而本申请提出的可视化方案,客户分层等级分为3类,分层结果更为简明;基于本申请设计的约束条件,样本点落在{x=0,y=0,x+y=1}围成的等腰直角三角形区域内,且在本申请的可视化中,由右下至左上依次对应“高/中/低”价值,更直观和易于理解。
其中,右下(Fi高,Ri低,Mi高)对应的是高价值客户,即对应的客户的付费使用频率高,距离上次服务结束时间更短;左上(Fi低,Ri高,Mi低)对应的是低价值客户,即对应的客户的付费使用频率低,距离上次服务结束时间更长;中间部分对应的是中价值客户。
具体的,将得到的RFM指标数据集或{(Fi,Ri,Mi,Ci),i=1,2,…,N}在平面直角坐标系上绘制成散点图,其中,x轴对应Fi,y轴对应Ri,样本点位置对应(Fi,Ri),样本点大小对应为/>或Mi,样本点颜色的设置条件为:同类别点设为同一颜色,以便于进行区分。
进一步的,按照以上绘制方法,基于约束条件Ri+Fi≤1,可以将样本点均绘制在由{x=0,y=0,x+y=1}围成的等腰直角三角形区域内,这样,图形右下角的区域聚集了高价值组客户,即服务购买频率高,时间间隔小的客户;而与之对应的是图形左上角的区域聚集了低价值组客户,即服务购买频率低,时间间隔大的客户;相应的,图形中间区域聚集了中价值组客户,即服务购买频率一般,时间间隔一般的客户;这样,基于三角形区域的可视化显示方式,可以将分层聚类结果清晰地展示给使用者,便于理解。
需要说明的是,本申请实施例对每一数据对应的样本点大小以及每一客户分层等级对应的样本点的颜色不作具体限定,其可以基于应用场景或用户需求设定。
因此,本申请实施例提出了一种新的可视化方法,利用约束条件,将样本点展示在等腰直角三角形区域内,使得聚类结果清晰地展示给使用者,相比于传统的3D图或分段展示方法,这种新的可视化方法更直观和易于理解,能够帮助使用者更好地理解分层结果。
可选的,获取用户输入的客户分层等级,包括:
获取用户输入的产品属性、客户规模和/或应用场景,并基于所述产品属性、所述客户规模和/或所述应用场景确定客户分层等级;
或,获取用户输入的客户分层类别,基于肘部法则对所述客户分层类别进行处理,以确定客户分层等级。
本申请实施例中,客户分层等级可以设置为三层,即高/中/低三层,对应不同级别客户的购买价值,客户分层等级也可以设置更多层,即对应聚类算法的类别数量更多,而在实际应用中,使用者可以选择设置更多的类别,使的客户的分层更加精确,本申请实施例对客户分层等级对应的具体数值不作限定。
在一些实施例中,数据处理系统可以获取用户输入的产品属性、客户规模和/或应用场景,并基于产品属性、客户规模和/或应用场景,利用预定义算法确定客户分层等级,也可以直接获取用户设置的类别数量,该类别数量是基于产品属性,客户规模,应用场景等因素人为确定的。
在另一些实施例中,数据处理系统可以获取用户输入的客户分层类别,进而根据肘部法则,通过可视化方法将客户分层类别显示,寻找拐点,进而确定最优的类别数量。
需要说明的是,本申请实施例对确定客户分层等级的预定义算法不作具体限定,本申请还可以使用其他的算法确定客户分层等级。
因此,本申请实施例可以按照用户输入客户分层等级进行客户分层,提高了客户分层的灵活性,可以满足不同的应用场景和用户需求。
示例性的,本申请提供一种分层分析方法,应用于车联网服务;所述方法包括:
获取运营人员输入的客户分层等级,以及客户购买车联网服务的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
本申请实施例中,由于车联网各项服务产品的使用时长不一致,经典的RFM模型中计算购买次数不够具有代表性,即经典的RFM模型并未考虑到期时长的影响,导致模型结果的准确性降低。
可选的,本申请实施例提供的分层分析方法,应用在车联网服务的场景中,基于客户的分析结果可用于建立用户画像,以提升客户洞察,基于客户分层,可以给客户提供定制化服务,以满足不同的客户需求。
可选的,基于分析结果,可以预测客户留存和流失情况,以便于用户采取相应的运营措施,提高客户的留存率。
因此,本申请实施例提供的分层分析方法,可以实现对车联网服务的客户分层,并可以应用在用户画像可视化中,便于精准制定营销策略,并且通过对客户购买行为价值的分层,提升客户洞察和运营效果。
需要说明的是:本申请中针对用户画像的实际使用是在符合相关法律法规基础上的应用,并非单纯获取用户个人信息或用户画像信息的非合规使用。但由于本申请实施例需要解决的技术问题和发明关键技术点、方案创新改进点与用户画像或个人信息的使用是否合规并不相关,也并未对此做技术上的改进,因此本申请实施例中并未对此做特别技术实现方案上说明,但这并不等于本方案违法相关个人信息保护的法律法规规定。因为在实际使用中,本领域技术人员均可以知悉,本方案实施例也可以结合现有技术中普通符合相关法律法规规定的已有技术来实现。
结合上述实施例,本申请实施例提供的分层分析方法,通过改进RFM模型的计算方法、使用聚类算法和提出新的可视化方法,解决了车联网服务领域中的技术问题,进而上述实施例的改进和创新将有助于企业更好地理解用户需求,制定个性化的营销策略,并提高市场营销的效果。
在前述实施例中,对本申请实施例提供的分层分析方法进行了介绍,而为了实现上述本申请实施例提供的方法中的各功能,作为执行主体的电子设备可以包括硬件结构和/或软件模块,以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行,取决于技术方案的特定应用和设计约束条件。
例如,图6为本申请实施例提供的一种分层分析装置的结构示意图,如图6所示,所述装置600包括:获取模块601,确定模块602,输入模块603和可视化模块604;其中,所述获取模块601,用于获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
所述确定模块602,用于针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
所述输入模块603,用于利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
所述可视化模块604,用于利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
可选的,所述获取模块601包括获取单元和预处理单元;所述预处理单元,用于:
对所述订单数据进行数据清洗,得到待处理数据;所述数据清洗包括删除测试发起的订单、删除尚未生效的订单以及删除存在空值或错误数值的订单。
可选的,所述确定模块602,具体用于:
基于所述客户ID对应的所述订单编号确定是否存在服务赠送时间;
若否,则基于所述订单编号从数据表中查询所述订单编号对应的服务购买期限;
若是,则基于所述订单编号从数据表中查询所述订单编号对应的可使用期限,并计算所述可使用期限和所述服务赠送时间之差,得到服务购买期限。
可选的,所述可视化模块604包括聚类单元和可视化单元;所述聚类单元,用于:
对所述RFM指标数据集中的订单关键值进行归一化处理,得到目标数据集;
基于经过归一化处理后的订单关键值,利用聚类算法和所述客户分层等级,计算得到每个客户归属的等级类别;
基于每个客户归属的等级类别确定目标客户,并基于所述目标客户的客户ID进行客户数量的汇总,得到至少一个等级类别的目标客户数量;
基于所述目标客户数量和目标客户对应的订单关键值,计算得到平均购买金额,并基于所述平均购买金额对所述目标数据集进行分析,得到分析结果。
可选的,所述装置600还包括RFM模型的改进模块;所述改进模块,用于:
设置第一指标和第二指标的计算公式,并基于所述第一指标和所述第二指标确定约束条件;所述第一指标对应的计算公式为:Ri=Ai/T;所述第二指标对应的计算公式为:Fi=Bi/T;所述约束条件的计算公式为:Ri+Fi≤1;
其中,Ai表示第i个客户的服务到期时间,Bi表示第i个客户的付费使用时间,T表示服务购买期限。
可选的,所述可视化单元,用于:
基于所述约束条件确定所述分析结果分布的三角形区域;
基于订单关键值确定所述分析结果中每一数据对应的样本点大小,将所述分析结果基于所述样本点大小和所述客户分层等级进行可视化显示;其中,每一客户分层等级对应的样本点具有相应的颜色。
可选的,所述获取单元,用于:
获取用户输入的产品属性、客户规模和/或应用场景,并基于所述产品属性、所述客户规模和/或所述应用场景确定客户分层等级;
或,获取用户输入的客户分层类别,基于肘部法则对所述客户分层类别进行处理,以确定客户分层等级。
本申请实施例提供的一种分层分析装置的具体实现原理和效果可以参见上述实施例对应的相关描述和效果,此处不做过多赘述。
相应的,本申请实施例还提供的一种分层分析装置,应用于车联网服务,所述装置包括:获取模块,确定模块,输入模块和可视化模块;其中,所述获取模块,用于获取运营人员输入的客户分层等级,以及客户购买车联网服务的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
所述确定模块,用于针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
所述输入模块,用于利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
所述可视化模块,用于利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
需要说明的是,上述应用于车联网服务的分层分析装置的具体实现原理和效果可以参见上述实施例对应的相关描述和效果,此处不做过多赘述。
本申请实施例还提供了一种电子设备的结构示意图,图7为本申请实施例提供的一种电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器701以及与所述处理器通信连接的存储器702;该存储器702存储计算机程序;该处理器701执行该存储器702存储的计算机程序,使得该处理器701执行上述任一实施例所述的方法。
其中,存储器702和处理器701可以通过总线703连接。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序执行指令,计算机执行指令被处理器执行时用于实现如本申请前述任一实施例中的所述的方法。
本申请实施例还提供了一种运行指令的芯片,该芯片用于执行如本申请前述任一实施例中由电子设备所执行的前述任一实施例中所述的方法。
本申请实施例还提供了一种计算机程序产品,该程序产品包括计算机程序,该计算机程序被处理器执行时可实现如本申请前述任一实施例中由电子设备所执行的前述任一实施例中所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案。
可以理解的是,在实际应用中使用本专利申请中各个实施例的技术方案之前,均会通过恰当的方式对所涉及的个人信息的类型、用户画像、使用范围、使用场景等告知用户,并获得用户的授权。
例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确的提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主的选择是否向执行本申请技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
作为一种可选的但非限定的实现方式,响应于接受到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
可以理解的是,上述通知和获取用户授权过程仅是示意性的,不对本申请的实现方式构成限定,其他满足相关法律法规的方式也可应用于本申请的实现方式中。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(Central Processing Unit,简称CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速随机存取存储器(Random Access memory,简称RAM),也可能还包括非不稳定的存储器(Non-volatile Memory,简称NVM),例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外部设备互连(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random-Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
进一步需要说明的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求书指出。
以上所述,仅为本申请实施例的具体实施方式,但本申请实施例的保护范围并不局限于此,任何在本申请实施例揭露的技术范围内的变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种分层分析方法,其特征在于,所述方法包括:
获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
2.根据权利要求1所述的方法,其特征在于,利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,包括:
对所述RFM指标数据集中的订单关键值进行归一化处理,得到目标数据集;
基于经过归一化处理后的订单关键值,利用聚类算法和所述客户分层等级,计算得到每个客户归属的等级类别;
基于每个客户归属的等级类别确定目标客户,并基于所述目标客户的客户ID进行客户数量的汇总,得到至少一个等级类别的目标客户数量;
基于所述目标客户数量和目标客户对应的订单关键值,计算得到平均购买金额,并基于所述平均购买金额对所述目标数据集进行分析,得到分析结果。
3.根据权利要求1或2所述的方法,其特征在于,所述RFM模型的改进过程包括:
设置第一指标和第二指标的计算公式,并基于所述第一指标和所述第二指标确定约束条件;所述第一指标对应的计算公式为:Ri=Ai/T;所述第二指标对应的计算公式为:Fi=Bi/T;所述约束条件的计算公式为:Ri+Fi≤1;
其中,Ai表示第i个客户的服务到期时间,Bi表示第i个客户的付费使用时间,T表示服务购买期限。
4.根据权利要求3所述的方法,其特征在于,将所述分析结果进行可视化显示,包括:
基于所述约束条件确定所述分析结果分布的三角形区域;
基于订单关键值确定所述分析结果中每一数据对应的样本点大小,将所述分析结果基于所述样本点大小和所述客户分层等级进行可视化显示;其中,每一客户分层等级对应的样本点具有相应的颜色。
5.根据权利要求1所述的方法,其特征在于,对所述订单数据进行预处理,得到待处理数据,包括:
对所述订单数据进行数据清洗,得到待处理数据;所述数据清洗包括删除测试发起的订单、删除尚未生效的订单以及删除存在空值或错误数值的订单。
6.根据权利要求1所述的方法,其特征在于,基于所述客户ID对应的所述订单编号确定服务购买期限,包括:
基于所述客户ID对应的所述订单编号确定是否存在服务赠送时间;
若否,则基于所述订单编号从数据表中查询所述订单编号对应的服务购买期限;
若是,则基于所述订单编号从数据表中查询所述订单编号对应的可使用期限,并计算所述可使用期限和所述服务赠送时间之差,得到服务购买期限。
7.根据权利要求1-6任一项所述的方法,其特征在于,获取用户输入的客户分层等级,包括:
获取用户输入的产品属性、客户规模和/或应用场景,并基于所述产品属性、所述客户规模和/或所述应用场景确定客户分层等级;
或,获取用户输入的客户分层类别,基于肘部法则对所述客户分层类别进行处理,以确定客户分层等级。
8.一种分层分析方法,其特征在于,应用于车联网服务;所述方法包括:
获取运营人员输入的客户分层等级,以及客户购买车联网服务的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
9.一种分层分析装置,其特征在于,所述装置包括:
获取模块,用于获取用户输入的客户分层等级,以及客户的订单数据,并对所述订单数据进行预处理,得到待处理数据;所述待处理数据包括客户标识号ID、订单编号、订单开始日期、订单结束日期和订单关键值;
确定模块,用于针对每一客户ID,基于所述客户ID对应的所述订单编号确定服务购买期限,并基于所述订单开始日期和所述订单结束日期确定付费使用时间和服务到期时间;所述服务购买期限为服务对应的可购买时间;所述付费使用时间与客户购买服务的期限范围相关;所述服务到期时间为客户购买的上一次服务距离所述订单结束日期的时间间隔;
输入模块,用于利用所述服务购买期限和所述服务到期时间确定第一指标,并利用所述服务购买期限和所述付费使用时间确定第二指标,将所述第一指标、所述第二指标和所述订单关键值输入改进的客户价值RFM模型中,得到RFM指标数据集;
可视化模块,用于利用聚类算法和所述客户分层等级对所述RFM指标数据集进行聚类分析,得到分析结果,并将所述分析结果进行可视化显示。
10.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-8中任一项所述的方法。
12.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410022175.6A CN117829908A (zh) | 2024-01-05 | 2024-01-05 | 分层分析方法、装置、电子设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410022175.6A CN117829908A (zh) | 2024-01-05 | 2024-01-05 | 分层分析方法、装置、电子设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117829908A true CN117829908A (zh) | 2024-04-05 |
Family
ID=90505754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410022175.6A Pending CN117829908A (zh) | 2024-01-05 | 2024-01-05 | 分层分析方法、装置、电子设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117829908A (zh) |
-
2024
- 2024-01-05 CN CN202410022175.6A patent/CN117829908A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230281652A1 (en) | System, method and computer program product for geo-specific vehicle pricing | |
JP6111355B2 (ja) | 中古車両価格設定データの分析、および提示のためのシステムおよび方法 | |
US20150332414A1 (en) | System and method for predicting items purchased based on transaction data | |
Tsai et al. | Customer segmentation issues and strategies for an automobile dealership with two clustering techniques | |
US20140006109A1 (en) | System and Methods for Generating Price Sensitivity | |
US20130191262A1 (en) | Industry size of wallet | |
US20200410465A1 (en) | Payment-driven sourcing | |
US20150332292A1 (en) | System and method for monitoring market information for deregulated utilities based on transaction data | |
US20220335359A1 (en) | System and method for comparing enterprise performance using industry consumer data in a network of distributed computer systems | |
Duch-Brown et al. | Evaluating the Impact of Online Market Integration—Evidence from the EU Portable PC Market | |
US20220198556A1 (en) | Inventory affordability and policy distance calculator | |
US20150161583A1 (en) | Method and system for negotiating, generating, documenting, and fulfilling vendor financing opportunities | |
CN117273800A (zh) | 营销策略生成方法、装置、设备及存储介质 | |
Park et al. | Comparison of SML and GMM estimators for the random coefficient logit model using aggregate data | |
CN116629998A (zh) | 一种自动计息方法、装置、电子设备及可读存储介质 | |
CN106779843B (zh) | 一种基于客户群体特征的商户竞合关系分析的方法和装置 | |
CN117829908A (zh) | 分层分析方法、装置、电子设备、存储介质及程序产品 | |
JP2022161033A (ja) | 複数の重要指標に基づいてアラートチェーンを生成する方法及びシステム | |
CN114707733A (zh) | 风险指标的预测方法、装置、电子设备及存储介质 | |
CN115099986A (zh) | 车险续保的处理方法、装置及相关设备 | |
US20150332286A1 (en) | System and method identifying holders or re-sellable commodities | |
Dziechciarz et al. | Non-Metric Data in Household Durable Goods Analysis Selected | |
Cao et al. | Understanding the impact of reviews on consumer product choices under negotiated pricing | |
CN112785204A (zh) | 确定对象风险值的方法和调整业务参数的方法 | |
WO2014197518A1 (en) | System and methods for generating price sensitivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |