CN113962740A - 汽车4s店客户流失的预警方法和装置 - Google Patents
汽车4s店客户流失的预警方法和装置 Download PDFInfo
- Publication number
- CN113962740A CN113962740A CN202111255502.5A CN202111255502A CN113962740A CN 113962740 A CN113962740 A CN 113962740A CN 202111255502 A CN202111255502 A CN 202111255502A CN 113962740 A CN113962740 A CN 113962740A
- Authority
- CN
- China
- Prior art keywords
- data
- customer
- early warning
- index value
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000007477 logistic regression Methods 0.000 claims abstract description 25
- 230000001419 dependent effect Effects 0.000 claims abstract description 19
- 238000012216 screening Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000012423 maintenance Methods 0.000 claims description 72
- 230000008439 repair process Effects 0.000 claims description 13
- 238000012353 t test Methods 0.000 claims description 12
- 238000007476 Maximum Likelihood Methods 0.000 claims description 9
- 238000000692 Student's t-test Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000003908 quality control method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 abstract description 3
- 238000005065 mining Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 11
- 238000004378 air conditioning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Computational Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种汽车4S店客户流失的预警方法和装置;所述方法包括:获取客户的历史数据,生成数据集;根据所述历史数据构建初始自变量和因变量;对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;采用所述最终自变量再次建立逻辑回归模型,获得预警模型;将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。本申请的方案根据门店积累的与客户消费行为有关的大量数据,进行深入的分析和挖掘,通过模型的方法克服了传统手段分析维度单一的问题,从而有效增加了预警的准确度和及时性。
Description
技术领域
本申请涉及数据挖掘技术领域,具体涉及一种汽车4S店客户流失的预警方法和装置。
背景技术
汽车市场的激烈竞争已经转移到汽车售后市场,在此背景下,争夺客户并保持客户忠诚成了4S站的主要课题。然而面对激烈的竞争,客户关系变得愈加脆弱。因此,对客户是否即将流失进行预测,进而更准确的掌握客户的行为,提高整体客户的留存率,甚至找出影响客户流失的关键因子,对于车企来说显得极为重要了。
相关技术中,目前4S店对于客户是否即将流失的判断主要是基于客户最近一次进店的时间,此方法分析维度单一,无法有效利用车企和4S店内积累的大量数据,导致对车主的流失预警不及时、不准确。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种汽车4S店客户流失的预警方法和装置。
根据本申请实施例的第一方面,提供一种汽车4S店客户流失的预警方法,包括:
获取客户的历史数据,生成数据集;
根据所述历史数据构建初始自变量和因变量;
对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
进一步地,所述历史数据包括:预设时间范围内的基础行车数据、DMS数据,维保状态数据;
根据所述基础行车数据构建的自变量包括:每月平均里程、车型、车龄;
根据所述DMS数据构建的自变量包括:维保指标值、客户历史消费总金额、客户事故金额、客户索赔金额;
根据所述维保状态数据构建的自变量包括:维保期是否到期、到店平均时间间隔、维保期结束后月份数。
进一步地,根据所述历史数据构建的因变量Y为:客户是否流失;当客户为流失客户时,因变量Y=1;
如果当前时间距离客户上次进店的时间超过预设的时间阈值,则将用户定义为流失客户;否则将用户定义为未流失客户。
进一步地,所述生成数据集,包括:
对所述历史数据进行数据质量控制,清洗掉噪声数据;
将清洗掉噪声后的数据进行标准化处理;
将标准化处理后的数据分为训练集和测试集。
进一步地,所述对初始自变量进行逻辑回归建模,包括:
建立如下逻辑回归模型:
其中,P为客户流失的概率,即因变量Y=1的概率;X1、X2…Xn为初始自变量;β0、β1…βn为截距项及各自变量对应的回归系数,β0、β1…βn通过最大似然估计进行求解。
进一步地,所述通过最大似然估计进行求解,包括:
建立似然函数;
对似然函数取对数;
将取对数后的函数求导,令导数为0;
采用Newton-Raphson迭代获得参数βi的估计值;i取值为0至n。
进一步地,所述从所述初始自变量中筛选出若干个最终自变量,包括:
对模型中各个初始自变量的显著性进行检验,筛选出与因变量有着显著关系的自变量,获得最终自变量。
进一步地,所述对模型中各个初始自变量的显著性进行检验,包括:
获取设定的显著性水平ɑ值;
计算每个初始自变量的t检验的p值;
只保留p值小于ɑ的初始自变量,以获得最终自变量。
进一步地,所述初始自变量包括:每月平均里程、车龄、车型、客户历史消费总金额、客户事故金额、客户索赔金额、索赔服务类指标值、事故服务类指标值、小修服务类指标值、一般保养服务类指标值、免费保养服务类指标值、维保期是否到期、到店平均时间间隔、维保期结束后月份数;
所述最终自变量包括:每月平均里程、索赔服务类指标值、小修服务类指标值、一般保养服务类指标值、免费保养服务类指标值、到店平均时间间隔、维保期结束后月份数。
根据本申请实施例的第二方面,提供一种汽车4S店客户流失的预警装置,包括:
获取模块,用于获取客户的历史数据,生成数据集;
构建模块,用于根据所述历史数据构建初始自变量和因变量;
筛选模块,用于对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
模型模块,用于采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
预测模块,用于将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
本申请的实施例提供的技术方案具备以下有益效果:
本申请的方案根据门店积累的与客户消费行为有关的大量数据,进行深入的分析和挖掘,通过模型的方法克服了传统手段分析维度单一的问题,从而有效增加了预警的准确度和及时性;从大量的维保数据中,构建了可能导致客户流失的特征,并对这些特征按照影响客户满意度程度的不同,做了不同的权重处理,增加了模型的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种汽车4S店客户流失的预警方法的流程图。
图2是根据一示例性实施例示出的一种汽车4S店客户流失的预警装置的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的方法和装置的例子。
图1是根据一示例性实施例示出的一种汽车4S店客户流失的预警方法的流程图。该方法可以包括以下步骤:
步骤S1:获取客户的历史数据,生成数据集;
步骤S2:根据所述历史数据构建初始自变量和因变量;
步骤S3:对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
步骤S4:采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
步骤S5:将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
本申请的方案通过对4S店内积累的在维修保养领域影响客户满意度的大量数据进行深入的分析和挖掘,通过模型的方法,克服了传统手段分析维度单一的问题,从而有效增加了预警的准确度和及时性。从大量的维保数据中,构建了可能导致客户流失的特征,并对这些特征按照影响客户满意度程度的不同,做了不同的权重处理,增加了模型的准确性。
应当理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
下面结合具体的应用场景,对本申请的方案进行拓展说明。
1、获取用户历史数据,构建自变量和因变量,生成数据集。
历史数据包括:预设时间范围内的基础行车数据、DMS(Dealer ManagementSystem汽车经销商管理系统)数据,客户维保状态数据。
通过历史数据构建的自变量(自变量用X表示)包括以下三类:
(1)通过基础行车数据构建的自变量:每月平均里程、车型、车龄;
(2)通过DMS数据构建的自变量:M类维保指标值、客户历史消费总金额、客户事故金额、客户索赔金额。
其中,M类维保指标值里的M,针对不同车企维保数据的存储习惯,主要有两种类型:
A:依车辆部件名称划分,这里的M包括:动力系统、电子设备、空调系统、内饰、磨损、事故处理、汽车零配件更换、保养、其他。
M类维保指标值=M类维保次数×其客户满意程度影响值;为增加模型准确度,对不同的部件设定了不同的影响值,各部件客户满意程度影响值设定如下:
部件 | 影响值 |
动力系统 | 9 |
电子设备 | 8 |
空调系统 | 7 |
内饰 | 6 |
磨损 | 5 |
事故处理 | 4 |
汽车零配件更换 | 3 |
其他 | 2 |
保养 | 1 |
比如:动力系统类维保指标值=动力系统类维保次数×其客户满意程度影响值=动力系统类维保次数×9。
B:依服务类型划分,这里的M包括:小修服务、事故服务、索赔服务、一般保养服务、免费保养服务。一些实施例中,车企维保数据的存储采用的是B方法。
M类维保指标值=M类维保次数×其客户满意程度影响值,各服务类型满意程度影响值如下:
服务类型 | 影响值 |
索赔服务 | 5 |
事故服务 | 4 |
小修服务 | 3 |
一般保养服务 | 2 |
免费保养服务 | 1 |
比如:索赔服务类维保指标值=索赔服务类维保次数×其客户满意程度影响值=索赔服务类维保次数×5。
(3)通过客户维保状态数据构建的自变量:维保期是否到期、到店平均时间间隔、维保期结束后月份数。
通过历史数据构建的因变量Y为:客户是否流失。当客户为流失客户时,因变量Y=1。
如果当前时间距离客户上次进店的时间超过预设的时间阈值,则将用户定义为流失客户;否则将用户定义为未流失客户。比如超过一年未进店则定义为流失客户。
一些实施例中,构建的初始自变量(用X表示)包括:每月平均里程(X1)、车龄(X2)、车型(X3)、客户历史消费总金额(X4)、客户事故金额(X5)、客户索赔金额(X6)、索赔服务类指标值(X7)、事故服务类指标值(X8)、小修服务类指标值(X9)、一般保养服务类指标值(X10)、免费保养服务类指标值(X11)、维保期是否到期(X12)、到店平均时间间隔(X13)、维保期结束后月份数(X14)。
2、对数据集进行数据质量控制,并做标准化处理。
清洗去掉下列人群:1)非乘用车个人用户:2)没有售后服务记录或售后服务记录明显有误的个人用户。
将清洗掉噪音的数据进行z-score标准化处理。
z-score标准化(zero-mean normalization)也叫标准差标准化,经过z-score标准化处理的数据符合正态分布,即均值为0,标准差为1,其转化函数为:
将标准化后的数据分成训练集和测试集,按照随机原则,70%数据为训练集进行模型的拟合,30%数据为测试集进行验证。
3、自变量筛选和逻辑回归建模,得到客户流失预警模型。
对全部变量进行逻辑回归建模,并对回归系数进行参数估计,通过t检验对变量进行筛选。
逻辑回归模型如下:
其中,P为客户流失的概率(即Y=1的概率),将P变换为ln(P/(1-P))称为logit变换,记作logit(P),logit变换使得在[0,1]范围内的P变换到(-∞,+∞),X1、X2......Xn为自变量,β0、β1……βn为截距项及各自变量对应的回归系数,β0、β1、……βn这些参数可通过最大似然估计进行求解。
一些实施例中,将各自变量Xi代入得,ln(P/(1-P))=β0+β1×每月平均里程+β2×车龄+β3×车型+β4×客户历史消费总金额+β5×客户事故金额+β6×客户索赔金额+β7×索赔服务类指标值+β8×事故服务类指标值+β9×小修服务类指标值+β10×一般保养服务类指标值+β11×免费保养服务类指标值+β12×维保期是否到期+β13×到店平均时间间隔+β14×维保期结束后月份数。
最大似然法的基本思想是先建立似然函数和对数似然函数,再求导,令导数为0,再采用Newton-Raphson迭代便可得参数βi的估计值;i取值为0至n。
最大似然法的基本思想是先建立似然函数,如下:
其中,Pi为根据逻辑回归模型得出的第i个客户流失的概率值,Yi为第i个客户是否为流失客户。
对似然函数取对数:
再求导,令导数为0,
再采用Newton-Raphson迭代便可得参数βi的估计值。
仅仅得到这些自变量的参数估计是不够的,还需要对模型的各个自变量的显著性进行检验,也就是通过t检验,来筛选出对模型有用的变量。
对一个给定的自变量Xij,它的原假设以及对立假设给定如下:
H0:βj=0 Vs H1:βj≠0
检验统计量t为:
其中,为估计的标准差,为估计的回归系数,vj(X)是(X’X)-1的第j个对角元素。如果原假设正确,t服从自由度为(n-p-1)的t分布,因此,对于一个给定的显著性水平α,通常定为0.05,如果某自变量的t检验的p值小于该α,则说明此自变量X同因变量Y有着显著的关系。在此,我们计算每个自变量的t检验的p值,只保留p值小于0.05的自变量。
此例子全部自变量的参数估计值和t检验的p值如下:
参数估计值 | t检验p值 | |
截距项 | 1.303×10<sup>1</sup> | 0.933003 |
每月平均里程 | -1.958×10<sup>-3</sup> | 0.000734 |
车龄 | -5.285×10<sup>-4</sup> | 0.987188 |
车型 | -3.934×10<sup>-3</sup> | 0.432788 |
客户历史消费总金额 | 1.731×10<sup>-2</sup> | 0.673452 |
客户事故金额 | -6.427×10<sup>-3</sup> | 0.132212 |
客户索赔金额 | 4.353×10<sup>-3</sup> | 0.092319 |
索赔服务类指标值 | 2.148×10<sup>-2</sup> | 0.001238 |
事故服务类指标值 | -1.625×10<sup>-2</sup> | 0.140923 |
小修服务类指标值 | -1.534×10<sup>-2</sup> | 6.91×10<sup>-14</sup> |
一般保养服务类指标值 | -9.914×10<sup>-2</sup> | <2×10<sup>-16</sup> |
免费保养服务类指标值 | -5.718×10<sup>-1</sup> | <2×10<sup>-16</sup> |
维保期是否到期 | 1.766×10<sup>1</sup> | 0.909325 |
到店平均时间间隔 | 1.586×10<sup>-1</sup> | <2×10<sup>-16</sup> |
维保期结束后月份数 | 2.533×10<sup>-1</sup> | <2×10<sup>-16</sup> |
只保留t检验p值小于0.05的自变量,用筛选后的自变量建立逻辑回归模型,逻辑回归模型如下:
一些实施例中,将筛选后的最终自变量X代入得:
ln(P/(1-P))=β0+β1×每月平均里程+β2×索赔服务类指标值+β3×小修服务类指标值+β4×一般保养服务类指标值+β5×免费保养服务类指标值+β6×到店平均时间间隔+β7×维保期结束后月份数。
通过最大似然法对自变量的参数进行估计,并进行t检验,结果如下:
参数估计值 | t检验p值 | |
截距项 | 1.797×10<sup>1</sup> | 0.64813 |
每月平均里程 | -8.561×10<sup>-4</sup> | 3.11×10<sup>-12</sup> |
索赔服务类指标值 | 3.043×10<sup>-2</sup> | <2×10<sup>-16</sup> |
小修服务类指标值 | -8.534×10<sup>-2</sup> | 4.18×10<sup>-14</sup> |
一般保养服务类指标值 | -8.885×10<sup>-2</sup> | <2×10<sup>-16</sup> |
免费保养服务类指标值 | -5.905×10<sup>-1</sup> | <2×10<sup>-16</sup> |
到店平均时间间隔 | 1.668×10<sup>-1</sup> | <2×10<sup>-16</sup> |
维保期结束后月份数 | 2.662×10<sup>-1</sup> | <2×10<sup>-16</sup> |
故此客户流失预警的模型为:
-8.561×10-4×每月平均里程
+3.043×10-2×索赔服务类指标值
-8.534×10-2×小修服务类指标值
-8.885×10-2×一般保养服务类指标值
-5.905×10-1×免费保养服务类指标值
+1.668×10-1×到店平均时间间隔
+2.662×10-1×维保期结束后月份数
用筛选后的自变量再次建立逻辑回归模型。通过最大似然法对筛选后的自变量的参数进行估计,并进行t检验,方法同上,得到客户流失预警模型。
4、依据模型对需要预测的客户进行数据分析,判断其是否会流失。
将待预测的客户的数据代入模型,判断β0+β1X1+β2X2+…+βnXn的值是否大于0,若大于0,则说明客户流失的概率P大于0.5,若小于0,则说明客户流失的概率P小于0.5,对流失概率大于0.5的客户,即为模型预测出来的即将流失的客户,4S店可采取进一步的挽留措施,以避免其流失。
因此将待预测的客户的数据代入模型,判断(1.797×101-8.561×10-4×每月平均里程+3.043×10-2×索赔服务类指标值-8.534×10-2×小修服务类指标值-8.885×10-2×一般保养服务类指标值-5.905×10-1×免费保养服务类指标值+1.668×10-1×到店平均时间间隔+2.662×10-1×维保期结束后月份数)的值是否大于0。若大于0,则说明客户流失的概率P大于0.5;若小于0,则说明客户流失的概率P小于0.5。对流失概率大于0.5的客户,即为模型预测出来的即将流失的客户,4S店可采取进一步的挽留措施,以避免其流失。
图2是根据一示例性实施例示出的一种汽车4S店客户流失的预警装置的结构框图。参照图2,该装置包括:
获取模块,用于获取客户的历史数据,生成数据集;
构建模块,用于根据所述历史数据构建初始自变量和因变量;
筛选模块,用于对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
模型模块,用于采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
预测模块,用于将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
关于上述实施例中的装置,其中各个模块执行操作的具体步骤已经在有关该方法的实施例中进行了详细描述,此处不再详细阐述说明。上述预警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种汽车4S店客户流失的预警方法,其特征在于,包括:
获取客户的历史数据,生成数据集;
根据所述历史数据构建初始自变量和因变量;
对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
2.根据权利要求1所述的方法,其特征在于,所述历史数据包括:预设时间范围内的基础行车数据、DMS数据,维保状态数据;
根据所述基础行车数据构建的自变量包括:每月平均里程、车型、车龄;
根据所述DMS数据构建的自变量包括:维保指标值、客户历史消费总金额、客户事故金额、客户索赔金额;
根据所述维保状态数据构建的自变量包括:维保期是否到期、到店平均时间间隔、维保期结束后月份数。
3.根据权利要求1所述的方法,其特征在于,根据所述历史数据构建的因变量Y为:客户是否流失;当客户为流失客户时,因变量Y=1;
如果当前时间距离客户上次进店的时间超过预设的时间阈值,则将用户定义为流失客户;否则将用户定义为未流失客户。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述生成数据集,包括:
对所述历史数据进行数据质量控制,清洗掉噪声数据;
将清洗掉噪声后的数据进行标准化处理;
将标准化处理后的数据分为训练集和测试集。
6.根据权利要求5所述的方法,其特征在于,所述通过最大似然估计进行求解,包括:
建立似然函数;
对似然函数取对数;
将取对数后的函数求导,令导数为0;
采用Newton-Raphson迭代获得参数βi的估计值;i取值为0至n。
7.根据权利要求5所述的方法,其特征在于,所述从所述初始自变量中筛选出若干个最终自变量,包括:
对模型中各个初始自变量的显著性进行检验,筛选出与因变量有着显著关系的自变量,获得最终自变量。
8.根据权利要求7所述的方法,其特征在于,所述对模型中各个初始自变量的显著性进行检验,包括:
获取设定的显著性水平ɑ值;
计算每个初始自变量的t检验的p值;
只保留p值小于ɑ的初始自变量,以获得最终自变量。
9.根据权利要求7所述的方法,其特征在于,所述初始自变量包括:每月平均里程、车龄、车型、客户历史消费总金额、客户事故金额、客户索赔金额、索赔服务类指标值、事故服务类指标值、小修服务类指标值、一般保养服务类指标值、免费保养服务类指标值、维保期是否到期、到店平均时间间隔、维保期结束后月份数;
所述最终自变量包括:每月平均里程、索赔服务类指标值、小修服务类指标值、一般保养服务类指标值、免费保养服务类指标值、到店平均时间间隔、维保期结束后月份数。
10.一种汽车4S店客户流失的预警装置,其特征在于,包括:
获取模块,用于获取客户的历史数据,生成数据集;
构建模块,用于根据所述历史数据构建初始自变量和因变量;
筛选模块,用于对初始自变量进行逻辑回归建模,并从所述初始自变量中筛选出若干个最终自变量;
模型模块,用于采用所述最终自变量再次建立逻辑回归模型,获得预警模型;
预测模块,用于将待预测的客户数据输入到所述预警模型中进行处理,获得预警结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111255502.5A CN113962740A (zh) | 2021-10-27 | 2021-10-27 | 汽车4s店客户流失的预警方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111255502.5A CN113962740A (zh) | 2021-10-27 | 2021-10-27 | 汽车4s店客户流失的预警方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113962740A true CN113962740A (zh) | 2022-01-21 |
Family
ID=79467431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111255502.5A Pending CN113962740A (zh) | 2021-10-27 | 2021-10-27 | 汽车4s店客户流失的预警方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113962740A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN106875225A (zh) * | 2017-02-24 | 2017-06-20 | 泰康保险集团股份有限公司 | 用于客户服务的方法及装置 |
CN109720207A (zh) * | 2018-12-29 | 2019-05-07 | 彩虹无线(北京)新技术有限公司 | 车辆能耗分析方法、装置及计算机可读介质 |
CN109962795A (zh) * | 2017-12-22 | 2019-07-02 | 中国移动通信集团广东有限公司 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
CN110019166A (zh) * | 2017-12-25 | 2019-07-16 | 大连楼兰科技股份有限公司 | 筛选属性数据的方法及客户流失预警方法 |
CN112365036A (zh) * | 2020-10-28 | 2021-02-12 | 上海东普信息科技有限公司 | 物流客户流失预警方法、装置、设备和存储介质 |
CN112465544A (zh) * | 2020-11-25 | 2021-03-09 | 北京深演智能科技股份有限公司 | 用户流失预警的方法和装置 |
CN113139687A (zh) * | 2021-04-25 | 2021-07-20 | 中国工商银行股份有限公司 | 一种预测信用卡用户违约的方法及装置 |
-
2021
- 2021-10-27 CN CN202111255502.5A patent/CN113962740A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN106875225A (zh) * | 2017-02-24 | 2017-06-20 | 泰康保险集团股份有限公司 | 用于客户服务的方法及装置 |
CN109962795A (zh) * | 2017-12-22 | 2019-07-02 | 中国移动通信集团广东有限公司 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
CN110019166A (zh) * | 2017-12-25 | 2019-07-16 | 大连楼兰科技股份有限公司 | 筛选属性数据的方法及客户流失预警方法 |
CN109720207A (zh) * | 2018-12-29 | 2019-05-07 | 彩虹无线(北京)新技术有限公司 | 车辆能耗分析方法、装置及计算机可读介质 |
CN112365036A (zh) * | 2020-10-28 | 2021-02-12 | 上海东普信息科技有限公司 | 物流客户流失预警方法、装置、设备和存储介质 |
CN112465544A (zh) * | 2020-11-25 | 2021-03-09 | 北京深演智能科技股份有限公司 | 用户流失预警的方法和装置 |
CN113139687A (zh) * | 2021-04-25 | 2021-07-20 | 中国工商银行股份有限公司 | 一种预测信用卡用户违约的方法及装置 |
Non-Patent Citations (2)
Title |
---|
刘艳杰等: "药学数理统计方法", 30 September 2013, 中国医药科技出版社, pages: 228 * |
肖锋等: "PYTHON商业数据分析基础", 28 February 2021, 湖南大学出版社, pages: 278 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Attardi et al. | A mixed-Weibull regression model for the analysis of automotive warranty data | |
Horowitz | Semiparametric estimation of a work-trip mode choice model | |
US11836806B2 (en) | Insurance claim capitation and predictive payment modeling | |
KR20160040209A (ko) | 차량 진단 및 수리 비용 추정을 미리 평가하기 위한 방법 및 시스템 | |
US20040019516A1 (en) | Method for calculating the probability that an automobile will be sold by a future date | |
CN111284426B (zh) | 车辆故障根本原因诊断 | |
Hu et al. | Estimation of rate and mean functions from truncated recurrent event data | |
CN110634021A (zh) | 基于大数据的车辆估值方法、系统、设备及可读存储介质 | |
US11423321B2 (en) | Method and system for predicting system status | |
US20190311042A1 (en) | Intelligent incentive distribution | |
CN111091401A (zh) | 一种网约车定价方法、系统、存储介质及设备 | |
CN113052633A (zh) | 车辆残值评估方法、装置、设备及介质 | |
CN113962740A (zh) | 汽车4s店客户流失的预警方法和装置 | |
Schulz et al. | Defect cost flow model: A Bayesian network for predicting defect correction effort | |
Scarf et al. | Modelling warranty extensions: a case study in the automotive industry | |
Majeske et al. | Determining warranty benefits for automobile design changes | |
US20190378349A1 (en) | Vehicle remaining useful life prediction | |
CN115099986A (zh) | 车险续保的处理方法、装置及相关设备 | |
EP4152241A1 (en) | Method and computer programmes for the management of vehicle fleets | |
JP2000215251A (ja) | 動的リスク評価のための多重ソ―ス情報融合システム | |
CN112348584A (zh) | 一种车辆估值方法、装置及设备 | |
CN114819449A (zh) | 预测车辆除霜性能的方法、装置、设备及存储介质 | |
US20230334913A1 (en) | Vehicle fleet management | |
US20050289380A1 (en) | Method of time-in-service reliability concern resolution | |
CN112687096B (zh) | 信息处理装置和信息处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |