CN104616173B - 预测用户流失的方法以及设备 - Google Patents
预测用户流失的方法以及设备 Download PDFInfo
- Publication number
- CN104616173B CN104616173B CN201510073140.6A CN201510073140A CN104616173B CN 104616173 B CN104616173 B CN 104616173B CN 201510073140 A CN201510073140 A CN 201510073140A CN 104616173 B CN104616173 B CN 104616173B
- Authority
- CN
- China
- Prior art keywords
- user
- time interval
- attrition
- prediction model
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本公开的实施例公开了一种预测用户流失的方法和设备。该方法包括:基于历史数据,针对每个用户确定对应的流失预测模型;基于所述确定的流失预测模型,确定每个用户的流失边界;以及基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。本公开的实施例能够解决相关技术中预测方法难以敏感地、准确地预测用户流失的问题。
Description
技术领域
本公开的实施例涉及一种预测用户流失的方法及设备。
背景技术
随着计算机技术的发展与大数据时代的到来,各个公司对于用户的留存情况越来越重视,希望能够对用户的流失进行预测。及早识别出其已拥有的但有可能流失的用户对于各公司来说非常重要,因为如果能及早识别出这样的用户,就可以采取一些措施来防止用户流失。
目前,用户流失预测广泛应用于各大传统公司和互联网公司。流失预测建模算法主要包括:逻辑回归、神经网络、决策树等,这些建模算法一般不会基于每个用户建模,而是用一个完备的模型以每个用户的特征作为输入,来判定该用户是否流失。
而且,由于目前的流失预测模型并不能解决以下问题:用户本身的行为具有不确定性、用户状态会发生变化、外部影响因素的影响以及算法不具有自适应性。因此需要一种新的用户流失预测模型。
发明内容
本公开的实施例旨在提供一种预测用户流失的方法及设备,能够解决相关技术中预测方法难以敏感地、准确地预测用户流失的问题。
根据本公开的一个方面,提供了一种预测用户流失的方法,包括:基于历史数据,针对每个用户确定对应的流失预测模型;基于所述确定的流失预测模型,确定每个用户的流失边界;以及基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。
在一个实施例中,在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失。
在一个实施例中,基于历史数据,针对每个用户确定对应的流失预测模型包括:确定用户发起订单的时间间隔;确定所述用户发起订单的时间间隔的时间波动值;以及基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
在一个实施例中,基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。
在一个实施例中,基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。
在一个实施例中,确定每个用户的流失边界包括:利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。
在另一方面,本公开的实施例提出一种预测用户流失的设备,包括:第一确定装置,被配置为基于历史数据,针对每个用户确定对应的流失预测模型;第二确定装置,被配置为基于所述确定的流失预测模型,确定每个用户的流失边界;以及更新装置,被配置为基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。
在一个实施例中,所述设备进一步包括:第三确定装置,被配置为在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失。
在一个实施例中,所述第一确定装置包括:第一确定模块,被配置为确定用户发起订单的时间间隔;第二确定模块,被配置为确定所述用户发起订单的时间间隔的时间波动值;以及第三确定模块,被配置为基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
在一个实施例中,所述第一确定模块被配置为基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。
在一个实施例中,所述第二确定模块被配置为基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。
在一个实施例中,第二确定装置进一步被配置为:利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。
本公开的这些和其它方面参考下文中描述的实施例是显而易见的,并且将参考下文中描述的实施例进行说明。而且,本领域的技术人员将理解,两个或多个以上的上述选项、实施方式和/或本公开的方面以认为可用的任何方式可结合。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是图示了根据本公开的实施例的基于时间序列的流失预测方法的流程图;
图2是图示了根据本公开的实施例的基于时间序列的流失预测设备的结构框图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1是图示了根据本公开的实施例的基于时间序列的流失预测方法的流程图,其中包括如下的步骤S101至步骤S103。
如图1所示,在步骤S101,基于历史数据,针对每个用户确定对应的流失预测模型。在步骤S102,基于所述确定的流失预测模型,确定每个用户的流失边界。并且在步骤S103,基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。
在一个实施例中,在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失
在一些应用中,在步骤S101和步骤S102中基于历史数据针对每个用户确定对应的流失预测模型以及基于所述确定的流失预测模型确定每个用户的流失边界可以离线进行。
在步骤S103中,可以利用在线系统加载步骤S101中所确定的流失预测模型,并且基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。
在一个实施例中,流失边界用所述用户的使用间隔值来指示。该使用间隔值可以为该用户的历史使用时间间隔的平滑值、平均值等。
在利用用户的使用间隔作为指示用户是否流失的指标时,基于历史数据,针对每个用户确定对应的流失预测模型包括:确定用户发起订单的时间间隔;确定所述用户发起订单的时间间隔的时间波动值;以及基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
在一个实施例中,用户的发起订单的时间间隔如下式所示:
SUSEL=α×SUSEL+(1-α)×USEsample (式1)
其中SUSEL表示预测该用户的使用间隔,USEsample表示用户发起新订单的时间间隔,α为固定常数。在不同应用中,α可以取不同的值,例如在一个实施例中,α为7/8,即(式1)可以表示为SUSEL=7/8×SUSEL+1/8×USEsample。
由式1可以看出,可以基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。由式1表示的迭代算法的初始值可以根据实际应用选取固定值,例如以0或1为初始值。
在一个实施例中,用户发起订单的时间间隔的时间波动值模型如下所示:
SDELTAL=β×SDELTAL+(1-β)×|USEsample-SUSEL| (式2)
其中SDELTAL表示预测的用户发起订单的时间间隔的时间波动值,β为固定常数。在不同应用中,β可以取不同的值,例如在一个实施例中,β为3/4,即(式2)可以表示为SDELTAL=3/4×SDELTAL+1/4×|USEsample-SUSEL|。
如式2所示,可以基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。由式2表示的迭代算法的初始值可以根据实际应用选取固定值,例如以0或1为初始值。
如上所示,针对每个用户确定对应的流失预测模型会,并且基于该用户的历史数据,根据(式1)和(式2)不断进行迭代计算。基于对历史数据的学习,不断更新预测的该用户的使用间隔SUSEL以及用户发起订单的时间间隔的时间波动值SDELTAL。
在一个实施例中,利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。在一个示例中,流失边界被定义为SUSEL+4×SDELTAL。即如果用户使用间隔值大于SUSEL+4×SDELTAL,则判定用户已经流失。在不同的示例中,流失边界的定义可以根据具体应用改变。
以下,在表1中示出了实施图1中的预测用户流失的方法的实际运行数据值:
表1:用户流失预测方法实际运行结果
表1中以10个不同的用户为例说明了根据本公开的实施例的流失预测方法的实施结果。其中FALSE表示该用户未流失,TURE表示该用户已流失。
如表1所示,对ID 1的用户,根据其历史数据计算出其使用间隔时间的平滑值为11.21天、其使用间隔波动值的平滑值为7.42天,进一步计算出ID 1用户的流失边界为40.91天,而该用户当前的实际使用间隔为10天,并没有超出流失边界,因此判断该用户没有流失。
从表1可以看出,对于ID 1-10的用户分别采用了不同的模型,分别针对每个用户预测出不同的流失边界,从而判断该用户是否流失。
在一些实施例中,根据本公开的实施例的流失预测方法是基于时间序列的,基于时间序列比非基于时间序列的算法更具备时间维度敏感性;由于该方法是针对每个用户的,因此可以很好地解决用户差异的问题,从而大大简化建模算法。并且该方法计算精简,在取得很好预测效果的同时,对集群资源的消耗很少,可以在不需要很多机器资源的情况下很及时产生计算结果;而且算法具备自适应性,维护成本极低。
图2是图示了根据本公开的实施例的基于时间序列的流失预测设备200的结构框图。
设备200包括:第一确定装置201,被配置为基于历史数据,针对每个用户确定对应的流失预测模型;第二确定装置202,被配置为基于所述确定的流失预测模型,确定每个用户的流失边界;以及更新装置203,被配置为基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界。
在一个实施例中,所述设备进一步包括:第三确定装置,被配置为在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失。
在一个实施例中,所述第一确定装置201包括:第一确定模块,被配置为确定用户发起订单的时间间隔;第二确定模块,被配置为确定所述用户发起订单的时间间隔的时间波动值;以及第三确定模块,被配置为基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
在一个实施例中,所述第一确定模块被配置为基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。
在一个实施例中,所述第二确定模块被配置为基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。
在一个实施例中,第二确定装置202进一步被配置为:利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。
综上所述,根据本公开上述实施例,根据历史数据以及用户发起订单的实际时间间隔针对每个用户确定对应的流失预测模型以及对应的流失边界,因此该流失边界能够根据历史数据以及新的使用间隔值来相应变化,从而能够简化建模算法、获得更好的预测效果并且使算法具有自适应性。
显然,本领域的技术人员应该明白,上述的本公开的各装置或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本公开不限制于任何特定的硬件和软件结合。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (8)
1.一种预测用户流失的方法,包括:
基于历史数据,针对每个用户确定对应的流失预测模型;
基于所述确定的流失预测模型,确定每个用户的流失边界;以及
基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界,
其中在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失;
其中针对所述每个用户,分别采用不同的所述流失预测模型和不同的所述流失边界;
其中基于历史数据,针对每个用户确定对应的流失预测模型包括:
确定用户发起订单的时间间隔;
基于所述时间间隔和针对所述用户的预测的使用间隔,确定所述用户发起订单的时间间隔的时间波动值;以及
基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
2.根据权利要求1所述的方法,其中基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。
3.根据权利要求1所述的方法,其中基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。
4.根据权利要求3所述的方法,其中确定每个用户的流失边界包括:
利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。
5.一种预测用户流失的设备,包括:
第一确定装置,被配置为基于历史数据,针对每个用户确定对应的流失预测模型;
第二确定装置,被配置为基于所述确定的流失预测模型,确定每个用户的流失边界;
更新装置,被配置为基于用户发起新订单的时间间隔,来更新对应的流失预测模型以及对应的流失边界;以及
第三确定装置,被配置为在用户发起新订单的时间间隔超过对应的流失边界时,确定所述用户流失,
其中针对所述每个用户,分别采用不同的所述流失预测模型和不同的所述流失边界;
其中所述第一确定装置包括:
第一确定模块,被配置为确定用户发起订单的时间间隔;
第二确定模块,被配置为基于所述时间间隔和针对所述用户的预测的使用间隔,确定所述用户发起订单的时间间隔的时间波动值;以及
第三确定模块,被配置为基于所述时间间隔以及所述时间间隔的时间波动值,确定所述用户的流失预测模型。
6.根据权利要求5所述的设备,其中所述第一确定模块被配置为基于所述用户新发起订单的时间间隔以及前一次预测的时间间隔,确定所述流失预测模型中的时间间隔。
7.根据权利要求5所述的设备,其中所述第二确定模块被配置为基于所述用户新发起订单的时间间隔、所述流失预测模型中的时间间隔以及前一次预测的时间间隔的波动值,确定所述流失预测模型中的时间间隔的波动值。
8.根据权利要求7所述的设备,其中第二确定装置进一步被配置为:
利用每个用户发起订单的时间间隔以及对应的时间间隔的波动值,确定每个用户的流失边界。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510073140.6A CN104616173B (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
CN202010899819.1A CN111967917A (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
US15/533,994 US20170364933A1 (en) | 2014-12-09 | 2015-12-09 | User maintenance system and method |
PCT/CN2015/096820 WO2016091173A1 (zh) | 2014-12-09 | 2015-12-09 | 一种用户维护系统及方法 |
GB1709115.8A GB2547395A (en) | 2014-12-09 | 2015-12-09 | User maintenance system and method |
SG11201704715YA SG11201704715YA (en) | 2014-12-09 | 2015-12-09 | User maintenance system and method |
PH12017501080A PH12017501080A1 (en) | 2014-12-09 | 2017-06-08 | User maintenance system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510073140.6A CN104616173B (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010899819.1A Division CN111967917A (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104616173A CN104616173A (zh) | 2015-05-13 |
CN104616173B true CN104616173B (zh) | 2020-09-29 |
Family
ID=53150607
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510073140.6A Active CN104616173B (zh) | 2014-12-09 | 2015-02-11 | 预测用户流失的方法以及设备 |
CN202010899819.1A Pending CN111967917A (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010899819.1A Pending CN111967917A (zh) | 2015-02-11 | 2015-02-11 | 预测用户流失的方法以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN104616173B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201704715YA (en) * | 2014-12-09 | 2017-07-28 | Beijing Didi Infinity Tech And Dev Co Ltd | User maintenance system and method |
CN106250999A (zh) * | 2015-06-03 | 2016-12-21 | 阿里巴巴集团控股有限公司 | 预测流失率的方法、装置和系统 |
CN106327032A (zh) * | 2015-06-15 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 一种用于客户流失预警的数据分析方法和装置 |
CN109299961A (zh) * | 2017-07-24 | 2019-02-01 | 北京嘀嘀无限科技发展有限公司 | 防止用户流失的方法及装置、设备和存储介质 |
CN109886442A (zh) * | 2017-12-05 | 2019-06-14 | 北京嘀嘀无限科技发展有限公司 | 预估接驾时长方法及预估接驾时长系统 |
CN108364195B (zh) * | 2018-02-09 | 2021-11-23 | 腾讯科技(深圳)有限公司 | 用户留存概率预测方法、装置、预测服务器及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101483531A (zh) * | 2008-10-16 | 2009-07-15 | 北京四达时代软件技术股份有限公司 | 一种预测式余额告警的方法及系统 |
CN103502899A (zh) * | 2011-01-26 | 2014-01-08 | 谷歌公司 | 动态预测建模平台 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN104182474A (zh) * | 2014-07-30 | 2014-12-03 | 北京拓明科技有限公司 | 一种预流失用户的识别方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2523547A1 (en) * | 2003-05-22 | 2004-12-09 | Pershing Investments, Llc | Activity-driven, customer profitability calculation system |
US8527324B2 (en) * | 2006-12-28 | 2013-09-03 | Oracle Otc Subsidiary Llc | Predictive and profile learning salesperson performance system and method |
US8396470B2 (en) * | 2007-04-26 | 2013-03-12 | Research In Motion Limited | Predicting user availability from aggregated signal strength data |
CN101478450B (zh) * | 2009-02-12 | 2011-09-28 | 阿里巴巴集团控股有限公司 | 一种网络用户活跃度的监控方法和服务器 |
US10528972B2 (en) * | 2009-08-27 | 2020-01-07 | Micro Focus Llc | Predicting email responses |
US20110295649A1 (en) * | 2010-05-31 | 2011-12-01 | International Business Machines Corporation | Automatic churn prediction |
US9058486B2 (en) * | 2011-10-18 | 2015-06-16 | Mcafee, Inc. | User behavioral risk assessment |
-
2015
- 2015-02-11 CN CN201510073140.6A patent/CN104616173B/zh active Active
- 2015-02-11 CN CN202010899819.1A patent/CN111967917A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101483531A (zh) * | 2008-10-16 | 2009-07-15 | 北京四达时代软件技术股份有限公司 | 一种预测式余额告警的方法及系统 |
CN103502899A (zh) * | 2011-01-26 | 2014-01-08 | 谷歌公司 | 动态预测建模平台 |
CN103854065A (zh) * | 2012-11-30 | 2014-06-11 | 西门子公司 | 一种用于客户流失预测的方法和装置 |
CN104182474A (zh) * | 2014-07-30 | 2014-12-03 | 北京拓明科技有限公司 | 一种预流失用户的识别方法 |
Non-Patent Citations (1)
Title |
---|
"MOOC课程学生流失现象分析与预警";陈云帆等;《工业和信息化教育》;20140915;第30-36页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104616173A (zh) | 2015-05-13 |
CN111967917A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104616173B (zh) | 预测用户流失的方法以及设备 | |
CN108009016B (zh) | 一种资源负载均衡控制方法及集群调度器 | |
US10789544B2 (en) | Batching inputs to a machine learning model | |
US11521067B2 (en) | Decentralized distributed deep learning | |
US10289973B2 (en) | System and method for analytics-driven SLA management and insight generation in clouds | |
US10476949B2 (en) | Predictive autoscaling in computing systems | |
CN110929799B (zh) | 用于检测异常用户的方法、电子设备和计算机可读介质 | |
CN103970587A (zh) | 一种资源调度的方法、设备和系统 | |
JP6718500B2 (ja) | 生産システムにおける出力効率の最適化 | |
CN112000457A (zh) | 管理处理系统中的任务的方法、设备和计算机程序产品 | |
US20170026305A1 (en) | System to place virtual machines onto servers based upon backup runtime constraints | |
JP2023548405A (ja) | クラスタコンピューティング環境を修正するための技術 | |
US20140244846A1 (en) | Information processing apparatus, resource control method, and program | |
CN112559125A (zh) | 容器应用迁移方法、装置、电子设备和计算机可读介质 | |
CN107608781B (zh) | 一种负载预测方法、装置以及网元 | |
CN117236805B (zh) | 电力设备控制方法、装置、电子设备和计算机可读介质 | |
US9501321B1 (en) | Weighted service requests throttling | |
CN117193980A (zh) | 任务剩余时长的计算方法和装置 | |
US11636377B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering | |
US11651271B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios | |
US11295224B1 (en) | Metrics prediction using dynamic confidence coefficients | |
US11410077B2 (en) | Implementing a computer system task involving nonstationary streaming time-series data by removing biased gradients from memory | |
CN111626401B (zh) | 运算方法及装置 | |
US20200279199A1 (en) | Generating a completion prediction of a task | |
US10929177B2 (en) | Managing resources for multiple trial distributed processing tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |