潜在客户信息动态分配方法
技术领域
本发明涉及一种潜在客户信息处理方法,尤其涉及一种潜在客户信息动态分配方法。
背景技术
当前,我们处在一个大数据高速发展的时代,越来越多的企业开始重视数据资产的积累、应用和变现,尝试利用大数据进行精准营销。各个品牌经销商都可以通过Web网站、手机APP、相关产品论坛等数据源获取到近期关注自身品牌或竞争品牌的潜在消费者线索,主要包含消费者咨询价格主动留下的电话号码、QQ号/微信、电子邮箱等信息。这类潜在顾客信息的一个特点是其不确定性,即在进一步确认之前,无法断定某一条信息所对应的消费者是否有真实的购买需求。一些数据供应商能够提供这类服务,即通过多种渠道获取潜在的顾客信息,并雇佣外呼人员联系消费者,确认其是否有实际的购买意愿,最终将有效的营销线索建档整合,作为产品提供给对应行业的经销商。
以汽车销售行业为例,数据供应商与一家汽车经销商签订协议,承诺在一个月内向经销商提供共计600条真实有效的销售线索,以天为单位提供,平均每天20条左右。每天数据供应商需要投入一定数目的原始信息进行确认,将确认有效的信息建档提供给经销商。这个过程的产出对于投入是不确定的,投入1000条原始信息,最终既可能只有100条线索有效,也可能有900条有效。如果仅为了满足需求而在短时间内增加大量外呼人员,则会导致成本上升。理想的状态是能够提前规划每天的投入量,并使其尽量稳定,同时满足经销商需求。此外不同的经销商会有特殊的要求,如尽量均匀提供或者尽量提前完成,这要求数据供应商能够把握产出量与投入量的关系。
上述传统方法的缺点是:根据经验主观估计的建档率与实际需要之间存在一定偏差,且根据固定的概率计算出下一个周期投入量的准确性和灵活性不足,不能及时根据反馈做出调整,投入过多会增加成本,过少则难以完成任务。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于置信区间、反馈调节原理的潜在客户信息动态分配方法。
本发明通过以下技术方案来实现上述目的:
一种潜在客户信息动态分配方法,包括以下步骤:
步骤1:确定任务要求:假定在t个周期内提供V条有效顾客信息;
步骤2:获得原始数据:每条原始顾客信息对应一名可能具有购买意向的潜在顾客;
步骤3:完成第一个周期的任务:在任务的第一个周期开始前,首先根据经验确定一个对于建档率的先验估计P0,按照理想的平均投入量算出第一周期的目标完成量v1=V/t,并由此计算出第一个周期的信息投入量n1=P0/v1;检验后得到投入的n1中的实际有效顾客信息数量即信息产出量,记为
步骤4:记录完成情况:记录当前的总共信息投入量N=Σn以及其中的实际有效顾客信息数量即总共信息产出量NS=∑nS,NS也代表成功建档的次数;
步骤5:估计建档率P:将已经验证过的信息投入量N=Σni-1与其中的信息产出量作为先验信息,在置信水平1-a(i)下进行二项分布的区间估计,并使用置信区间的下界作为建档率P的估计,1-a(i)表示第i个周期的区间估计置信度;
步骤6:计算计划完成量vi:自第一个周期过后,在周期i开始前,按以下公式计算计划完成量:
其中,T是任务再分配周期,Δ是任务整体提前期;
步骤7:计算投入量ni:根据计划完成量vi及估计的建档率,通过以下公式计算投入量ni:
其中,Pi-1是第i个周期前一个周期的建档率,
检验后得到投入的ni中的实际有效顾客信息数量即信息产出量
步骤8:每个周期循环,直至结束:重复步骤4-7,直至任务完成,有效顾客信息数量即信息产出量Ns达到目标,即Ns≥V;或任务到期未能完成,全部周期结束,即i≥t;完成潜在客户信息动态分配。
优选地,所述步骤5中,所述区间估计采用包括但不限于下面五种区间估计方法中的一种或多种:
第一种:正态近似区间估计法,其公式为:
其中,z为标准正态分布的分位点,NF为N中的实际有效顾客信息数量即不能成功建档的次数;
第二种:Wilson得分区间估计法,其公式为:
第三种:Agresti-Coull区间估计法,其公式为:
第四种:Clopper-Pearson区间估计法,其公式为:
Beta-1(p;α,β)为Beta分布的分位函数,即分布函数的逆函数;
第五种:Jeffreys区间估计法,其公式为:
本发明的有益效果在于:
本发明以估计产出量与投入量之比(即建档率)为核心,利用统计学中置信区间的方法,以已经验证过的信息数作为先验信息,不断更新对于建档率的置信区间估计,开始的先验建档率对结果的影响不大,所以并不需要额外的建档率信息;并根据每个周期的结果进行反馈调整,将未实现的数量加入后续的计划之中,通过调整不同的置信水平α及分配周期参数T、Δ可以调节任务完成节奏;本发明在设定好任务及参数后可完全自动化,无需人工额外调整,提高了数据利用效率,降低了不确定产出的影响,减少了人工参与的工作量并降低了建档率与实际需要之间存在的偏差,可应用于所有满足多重伯努利分布(二项分布)的随机产出结果的系统的投入量规划,不局限于某个特定行业。
附图说明
图1是本发明所述潜在客户信息动态分配方法的流程图;
图2是本发明实施例所述正态近似区间估计法中累计完成量趋势示意图;
图3是本发明实施例所述正态近似区间估计法中正态近似区间各周期计划投入量的趋势示意图;
图4是本发明实施例所述不同置信水平序列示意图;
图5是本发明实施例所述调整T导致完成量变化的示意图之一;
图6是本发明实施例所述调整T导致完成量变化的示意图之二;
图7是本发明实施例所述T为3时完成量变化的示意图之一;
图8是本发明实施例所述T为3时完成量变化的示意图之二;
图9是本发明实施例所述调整Δ导致完成量变化的示意图之一;
图10是本发明实施例所述调整Δ导致完成量变化的示意图之二。
具体实施方式
下面结合附图和实施例对本发明作进一步说明:
如图1所示,本发明所述潜在客户信息动态分配方法包括以下步骤:
步骤1:确定任务要求:假定在t个周期内提供V条有效顾客信息;一般具体操作方法是:数据供应商与客户签订协议,要求在t个周期内向客户提供V条有效销售线索,客户可能会有提供速度上的不同偏好,比如尽量以均匀速度提供,或者按照先快后慢的速度提供,本步骤的目的即动态地规划出每个周期需要投入系统去进行建档尝试的信息数量n;
步骤2:获得原始数据:每条原始顾客信息对应一名可能具有购买意向的潜在顾客;在工作的下一环节,需要将对每一条原始信息进行确认,即联系顾客并询问其是否有购买意向,如果是,则可将其成功建档保存,成为一条有效销售线索;
步骤3:完成第一个周期的任务:在任务的第一个周期开始前,首先根据经验确定一个对于建档率的先验估计P0,由于P0的选择只会影响第一周期的投入量,所以并不要求准确性,在合理范围内即可,按照理想的平均投入量算出第一周期的目标完成量v1=V/t,并由此计算出第一个周期的信息投入量n1=P0/v1;检验后得到投入的n1中的实际有效顾客信息数量即信息产出量,记为
步骤4:记录完成情况:记录当前的总共信息投入量N=∑n以及其中的实际有效顾客信息数量即总共信息产出量Ns=∑ns,Ns也代表成功建档的次数;为了能够作出下一周期的投入量规划ni,需要知道下一周期计划完成量vi以及建档率P*,从而根据得出投入量;
步骤5:估计建档率P:虽然P*是未知的,但是由于已经对一部分数据进行了验证,得到了投入量N和产出量Ns的信息,便可以根据这些已验证的历史信息对实际建档率进行一定置信度下的区间估计,即通过数据估计二项分布参数P的置信区间;将已经验证过的信息投入量N=∑ni-1与其中的信息产出量作为先验信息,在置信水平1-α(i)下进行二项分布的区间估计,并使用置信区间的下界作为建档率P的估计,1-α(i)表示第i个周期的区间估计置信度;
所述区间估计采用包括但不限于下面五种区间估计方法中的一种或多种:
第一种:正态近似区间估计法,其公式为:
其中,z为标准正态分布的分位点,NF为N中的实际有效顾客信息数量即不能成功建档的次数;该区间由Wald检验得到;
第二种:Wilson得分区间估计法,其公式为:
该区间由Pearsonχ2检验得到;
第三种:Agresti-Coull区间估计法,其公式为:
该区间可以看作在正态近似区间的基础上增加了次(不一定为整数)的成功结果与失败结果;
第四种:Clopper-Pearson区间估计法,其公式为:
Beta-1(p;α,β)为Beta分布的分位函数,即分布函数的逆函数;该区间由二项分布的分位点得到,也称为精确区间;
第五种:Jeffreys区间估计法,其公式为:
由Beta分布的参数含义可知,该区间可看作在的先验估计下的结果;
上述方法中,标准正态分布概率密度函数是:
Beta分布函数是:
考虑到实际的产出总是不确定的,如果按照均匀的规划投入,会有大概率出现在最后一个周期结束后依然无法完成产量的结果;为了能够使反馈系统较早的对产量不足作出应对,该方法使用了随周期递增的变化置信度序列:方案考虑了0.1i-1,0.1i-2,0.1ln-1(i),0.1e-i,0.1i-i共5种序列;从实际结果上看,在其他参数不变的情况下,更大的置信度会得出更大的置信区间,递增的置信度使得建档率的估计值更小,即更加保守,从而导致任务完成速度在一开始就变得更快;
为了使产量不少于任务目标,保守的选取当前对于建档率的置信下界LCLi-1作为建档率的估计,用于下一周期,即Pi-1=LCLi-1。直接使用置信区间的下界的原因是上述五种置信区间的上下界恰好是其置信度下的单侧置信界,且即使使用了有偏的置信区间计算方法,由区间估计结论
P(x<LCI)+P(x>UCI)≤a
经过变换可以得到
P(x<LCI)≤α-P(x>UCI)≤a
所得下界的实际置信度不会低于1-α;
步骤6:计算计划完成量vi:自第一个周期过后,在周期i开始前,按以下公式计算计划完成量:
其中,T是任务再分配周期,Δ是任务整体提前期;
该公式可理解为在周期i-1期末,计算出当前计划总量与当前已完成量的差值,即“拖欠量”,并将其再平均分配至之后T个周期,若所剩周期t-i+1已不足T个则按所剩周期分配,通常做法是设置T=t,即将“拖欠量”分配至之后所有周期中,通过减少T可以使完成速度加快且更接近匀速,不过平均超额完成量相对较高,另一种思路是将“拖延量”分配至之后t-i+1-Δ个周期,不足Δ个时按较小者计算,设置较小的Δ可以有效的提升按时完成率;
步骤7:计算投入量ni:根据计划完成量vi及估计的建档率,通过以下公式计算投入量ni:
其中,Pi-1是第i个周期前一个周期的建档率,
检验后得到投入的ni中的实际有效顾客信息数量即信息产出量
步骤8:每个周期循环,直至结束:重复步骤4-7,直至任务完成,有效顾客信息数量即信息产出量Ns达到目标,即Ns≥V;或任务到期未能完成,全部周期结束,即i≥t;完成潜在客户信息动态分配。
说明:上述各步骤的内容与图1的流程图中的各步骤相互对应,在语言描述上没有完全相同,但能够相对对照理解。
下面以变量表的方式把上述内容中涉及的字符定义进行更具体说明:
实施例:
为了验证本发明所述潜在客户信息动态分配方法的效果,下面举例说明:
通过计算机生成1000组、每组含有100000条信息的样本,每组中有10000条设置为“可成功建档”,其余为“无法成功建档”,即假定真实建档率为10%。通过从中随机抽取来模拟本方法的实际表现。设定V=600,t=30,P0=0.1。对于不同参数的方案,比较了以下9项指标:
num_600:完成量恰好为600的次数;
num_over.:完成量大于600的次数;
prob.:最终的建档率下界估计;
N:总共投入的条目数;
std(V):每个周期投入数量的标准差;
avg(over.):在超额完成的情况下,平均超额量;
finfish_time:完成任务的情况下,平均完成时间;
num_half:未完成任务,但达到了半数目标量的次数;
half_time:达到半数目标量的时间。
具体表现为:
1、根据实际情况自适应估计建档率,不需要过多依靠经验:
1.1、在的情况下比较不同区间计算方法及不使用区间估计直接利用历史数据估计的方案(记为prop.)
|
prop. |
normal |
beta |
wilson |
agresti_coull |
Jeff |
num_600 |
98.000000 |
372.000000 |
339.000000 |
323.000000 |
330.000000 |
321.000000 |
num_over. |
454.000000 |
603.000000 |
608.000000 |
605.000000 |
611.000000 |
627.000000 |
prob. |
0.100139 |
0.046223 |
0.054442 |
0.057735 |
0.056350 |
0.054561 |
N |
6001.733000 |
6012.371000 |
6013.553000 |
6014.669000 |
6014.251000 |
6013.722000 |
std(v) |
3.489803 |
6.354328 |
5.991349 |
5.830100 |
5.894911 |
6.016515 |
avg(over.) |
3.929515 |
2.067993 |
2.302632 |
2.474380 |
2.379705 |
2.256778 |
finish_time |
30.000000 |
28.924103 |
29.311510 |
29.457974 |
29.424017 |
29.332278 |
num_half |
448.000000 |
25.000000 |
53.000000 |
72.000000 |
59.000000 |
52.000000 |
half_time |
15.403000 |
11.387000 |
11.770000 |
11.960000 |
11.920000 |
11.904000 |
可以看到在上述条件下,正态近似区间的表现最好,任务完成率达到了97.5%,但对应的各周期计划投入量波动较大;而不使用区间估计的方案效果最差,完成率仅有55%。
1.2、正态近似区间累计完成量:如图2所示,可以看出上述参数下的正态近似区间完成速度具有先快后慢的特征。
1.3、正态近似区间各周期计划投入量:如图3所示,可看出其计划投入量在总完成量达到一定水平后快速下降。这也是其存在个别未完成情况的原因。
2、通过调整不同的置信水平α及分配周期参数T,Δ可以调节任务完成节奏:
2.1、不同置信水平序列的影响(T=30,Δ=0,M:“Normal”),如下表所示:
可以看出表现最好,但在周期数过大时会出现计算机的数值问题。
2.2、不同置信水平序列:如图4所示,对于其中几个减少较快的序列,在前几个周期就已经超过了99.9%的置信度,导致方案中某个区间的置信度的实际意义降低,更多的是数值上的作用。
2.3、调整T的影响如图5和图6所示,通过设置一个较小的T值,可以使完成速度趋于匀速,但超额完成次数会增加,方案变得更加保守。
2.4、T=3时的完成情况:如图7和图8所示,将T设置为3后,完成速度更接近匀速,任务完成率为97.4%。各周期计划投入量波动相对较小。
2.5、调整Δ的影响如图9和图10所示,尽管从图像上看,增加Δ降低了准确完成率,但其同时也将未完成率降至了0%,使得方案更为保守。这对于一些违约成本比较高,不允许拖欠的任务更加适用。
3、可由机器自动化完成,减少人工干预:本方法在设定好任务及参数后可完全自动化,无需人工额外调整。
上述实施例只是本发明的较佳实施例,并不是对本发明技术方案的限制,只要是不经过创造性劳动即可在上述实施例的基础上实现的技术方案,均应视为落入本发明专利的权利保护范围内。