CN109840790A - 用户流失的预测方法、装置及计算机设备 - Google Patents
用户流失的预测方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN109840790A CN109840790A CN201711213745.6A CN201711213745A CN109840790A CN 109840790 A CN109840790 A CN 109840790A CN 201711213745 A CN201711213745 A CN 201711213745A CN 109840790 A CN109840790 A CN 109840790A
- Authority
- CN
- China
- Prior art keywords
- user
- current
- force parameter
- predicted
- propagation source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种用户流失的预测方法、装置、计算机可读存储介质及计算机设备,方法包括:获取待预测用户的第一兴趣梯度和第一影响力参数,待预测用户的第一兴趣梯度至少基于待预测用户在当前应用平台上的行为数据确定,待预测用户的第一影响力参数基于待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定;获取预定流失预测模型,预定流失预测模型通过对样本用户的第三兴趣梯度和第三影响力参数进行机器学习处理获得,样本用户包括流失用户和非流失用户;基于待预测用户的第一兴趣梯度、第一影响力参数以及预定流失预测模型,预测待预测用户的流失概率。本申请提供的方案能够有效地提高预测的精确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种用户流失的预测方法、装置、计算机可读存储介质及计算机设备。
背景技术
随着互联网技术的发展,实现各类功能的应用平台应运而生。对于应用平台,在其生命周期的各个阶段中,常常会出现不同程度的用户流失,这会给相应的应用平台带来不利影响。以网络游戏为例,网络游戏一般指通过计算机网络由多人共同参与的电子游戏,网络游戏的生命周期包括增长期、平稳期及衰退期等,在各个时期常常会出现不同程度的游戏用户流失,游戏用户的流失带来的不仅是消费人数的减少,还会影响到整个游戏平台的内部环境,例如导致部分服务器变成“鬼服”。因此,有必要对应用平台上的用户进行流失预测。
传统的预测方法是,获取用户在最近一段时间内的登录应用平台的次数,然后将获得的登录次数与预设数值进行比较,从而预测该用户流失的概率。然而,传统的预测方法精确性不高。
发明内容
基于此,有必要针对传统方法中的精确性不高的技术问题,提供一种用户流失的预测方法、装置、计算机可读存储介质及计算机设备。
一种用户流失的预测方法,包括:
获取待预测用户的第一兴趣梯度和第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定;
获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户;
基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
一种用户流失的预测装置,包括:
特征获取模块,用于获取待预测用户的第一兴趣梯度和所述待预测用户的第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和该各用户的第二影响力参数确定;
模型获取模块,用于获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和所述样本用户的第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户;以及,
概率预测模块,用于基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述的用户流失的预测方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述的用户流失的预测方法的步骤。
上述用户流失的预测方法、装置、计算机可读存储介质及计算机设备,获取待预测用户的第一兴趣梯度和第一影响力参数,其中,第一兴趣梯度能够表征该待预测用户自身对相应应用平台的兴趣的变化趋势。第一影响力参数基于待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定,可见,该第一影响力参数可用于表征该待预测用户与用户关系链中的其他用户之间互相影响的情况。因此,基于待预测用户的第一兴趣梯度和第一影响力参数进行流失预测,充分地考虑了用户的个人因素以及应用平台的社交属性对用户的流失行为的影响,能够有效地提高预测的精确性。
附图说明
图1为一个实施例中用户流失的预测方法的应用环境图;
图2为一个实施例中用户流失的预测方法的流程示意图;
图3为一个实施例中用户关系链的示意图;
图4为另一个实施例中用户关系链的示意图;
图5为又一个实施例中用户关系链的示意图;
图6为一个实施例中确定用户关系链中的各用户的第一影响力参数的步骤的流程示意图;
图7为再一个实施例中用户关系链的示意图;
图8为一个实施例中用户流失的预测装置的结构框图;
图9为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中用户流失的预测方法的应用环境图。参照图1,该方法的应用环境可以涉及用户终端110和服务器120,用户终端110和服务器120通过网络连接。用户终端110可以为台式终端或移动终端,移动终端具体可以为手机、平板电脑、笔记本电脑及穿戴式设备等中的至少一种。服务器120可以为独立的物理服务器,也可以为多个物理服务器组成的服务器集群。
用户终端110上可安装应用软件,相应地,服务器120可用于实现该应用软件对应的应用平台。用户可通过用户终端110在该应用平台上注册用户账号,而后,再通过该用户账号登录该应用平台,以及基于实际需求在应用平台上进行相应的行为操作。
图2为一个实施例中用户流失的预测方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。如图2所示,该方法可以包括步骤S202至S206。
S202:获取待预测用户的第一兴趣梯度和第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定。
其中,待预测用户可以指,进行流失预测的对象。可以理解,待预测用户可以基于实际需求进行确定。在一个具体的示例中,可以由服务器查找满足预定筛选条件的用户,再将查找到的用户确定为待预测用户,预定筛选条件可包括:在预定时间段内登录次数小于预设值。在另一个具体的示例中,也可以由服务器获取预先指定的用户,直接将获取到的用户确定为待预测用户。需要说明的是,待预测用户的数目可以为一,即在一次预测过程中,仅对一个用户进行流失预测;可以理解,数目也可以大于一,即在一次预测过程中,对多个用户进行流失预测。
用户关系链,可以指包含若干个用户以及该若干个用户之间的预定关系的数据结构。在一个具体的示例中,用户关系链可以为无向图,该无向图可包括若干个节点以及该若干个节点之间的连边,各连边可用于表征其所连接的两个节点之间的预定关系。可以理解,该无向图中的每一个节点均可以代表一个用户,且各节点之间的连边可以表示各用户之间的预定关系。
待预测用户的第一影响力参数,可以指在本次预测过程中,用于表征该待预测用户与其邻居用户之间互相影响的情况的特征数据,亦即可用于表征该待预测用户对其各邻居用户的影响以及该待预测用户所受到的其各邻居用户的影响。
在一个实施例中,待预测用户的第一兴趣梯度可基于待预测用户在当前应用平台上的行为数据确定。在其他可选的实施例中,也可以结合待预测用户在当前应用平台上的行为数据以及在当前应用平台以外的其他应用平台上的相关行为数据共同进行确定。
待预测用户的第一兴趣梯度,可以指在本次预测过程中,用于表征该待预测用户对相应应用平台的兴趣的变化趋势的特征数据。其中,变化趋势可呈上升趋势,下降趋势以及持平趋势。
其中,对于任一用户,其邻居用户可以指,在相应应用平台上与该用户存在预定互动行为的用户。以应用平台为网络游戏平台为例,上述预定互动行为可以包括但不限于在游戏中进行实时对战的行为和/或赠送游戏礼包的行为。例如,在游戏中,游戏用户A分别与游戏用户B和游戏用户C进行过实时对战,则游戏用户B和游戏用户C均可为游戏用户A的邻居用户。可以理解,若一个用户为另一个用户的邻居用户,则表示这两个用户互为对方的邻居用户,例如游戏用户B为游戏用户A的邻居用户,则意味着游戏用户A也为游戏用户B的邻居用户。
用户关系链中的各用户的第二兴趣梯度以及第二影响力参数,分别可以指在确定该各用户的第一影响力参数的过程中所涉及到的中间兴趣梯度和中间影响力参数。需要说明的是,在不同的时间段中,用户在相应应用平台上进行相应行为操作的情况可能不同,因而用户关系链中的各用户的第二兴趣梯度也会随之发生相应的改变。
另外,用户关系链中的各用户的第二兴趣梯度会影响其自身的第二影响力参数。并且,用户关系链中的各用户的影响力会互相传播,即用户关系链中的各用户第二影响力参数均会在影响力传播的过程中,受到各非己用户的影响而发生相应的改变。
在本实施例中,可将传播完成后获得的用户关系链中的各用户的第二兴趣梯度和第二影响力参数,确定为用户关系链中各用户的第一兴趣梯度和第一影响力参数。用户关系链中各用户的第一兴趣梯度和第一影响力参数,可用于对该用户进行流失预测。
S204:获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户。
需要说明的是,在具体对待预测的用户进行流失预测之前,需要构建流失预测模型。流失预测模型可用于表征其输入的特征数据与其输出的流失预测参数之间的映射关系。其中,输入的特征数据可以包含用户的第一兴趣梯度和第一影响力参数,输出的流失预测参数可用于表征该待用户的流失情况。
在一个实施例中,该流失预测模型的构建方式,可包括如下步骤:获取样本用户,其中,所述样本用户包括流失用户和非流失用户;分别获取各样本用户的第三兴趣梯度和第三影响力参数;对各样本用户的第三兴趣梯度和第三影响力参数进行逻辑回归学习处理,获得所述流失预测模型。
其中,样本用户可以指属性类别已知的用户,具体地,样本用户可包括流失用户和非流失用户,非流失用户可作为通常意义上的正样本,流失用户可作为通常意义上的负样本。可以理解,样本用户可基于实际需求进行选取。
样本用户的数目也可基于实际需求进行确定,一般情况下,样本用户的数目越多,进行机器学习处理后获得的预定流失预测模型的预测准确度越高。
流失用户可以指满足预设流失认定条件的用户,相应地,不满足预设流失认定条件的用户即为非流失用户。在一个具体的示例中,流失认定条件可包括连续预设时长未登录应用平台,其中,预设时长可基于业务经验确定,例如连续10天未登录过应用平台。在另一个具体示例中,预设流失认定条件可包括在预定时间段内登录应用平台的次数小于预设值,类似地,预定时间段及预设值可基于业务经验确定,例如最近三个月内登录应用平台的次数小于5次。
具体的逻辑回归学习处理方式,可以采用目前已有的以及以后可能出现的各种可能的方式进行,包括但不限于决策树、支持向量机(Support Vector Machine,SVM)、人工神经网络(Artificial Neural Network,ANN)以及梯度提升决策树(Gradient BoostingDecision Tree,GBDT)等。
需要说明的是,样本用户的第三兴趣梯度和第三影响力参数,与待预测的用户的第一兴趣梯度和第一影响力参数,其数据性质均可以是相同的,主要区别在于主体对象不同。并且,可以理解,样本用户的第三兴趣梯度和第三影响力参数的确定方式,与待预测用户的第一兴趣梯度和第一影响力参数的确定方式也可以是相同的,此处均不加赘述。
此外,在训练流失预测模型的过程中,可以设置不同的参数组合,遍历每一种参数组合,以进行网络迭代,每遍历到一组参数组合时,则获得该参数组合对应的机器学习模型评估指标,直至获得各参数组合对应的机器学习模型评估指标,再基于获得的机器学习模型评估指标中最大的机器学习模型评估指标对应的参数组合,确定流失预测模型最终的参数组合。其中,机器学习模型评估指标可以包括AUC(Area under curve,曲线面积)指标,AUC越大,表示其对应的流失预测模型的区分能力越强。
S206:基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
在本实施例中,可将待预测用户的第一兴趣梯度和第一影响力参数输入至预定流失预测模型,该流失预测模型则可以输出用于表征该待预测用户的流失情况的流失预测参数,进而可以基于该流失预测参数获得该待预测用户的流失预测结果,如流失概率。可以理解,在其他可选的实施例中,流失预测参数也可直接是该待预测用户的流失概率。
流失概率,可用于表征待预测用户流失的可能性。在一个具体的示例中,当待预测的用户的流失概率大于预设阈值时,判定该待预测用户流失的可能性大,反之,当待预测的用户的流失概率不大于该预设阈值时,判定该待预测用户流失的可能性小。
可以理解,当待预测用户的数目大于一个时,预定流失预测模型可输出与各待预测用户一一对应的流失预测参数,进而服务器可基于各流失预测参数分别获得各待预测用户的流失概率。
在一个实施例中,在执行步骤S206之前,还可以包括如下步骤:对所述待预测用户的第一影响力参数进行归一化处理,以达到将数据统一到相同的参考系、简化运算以及加快预测速度等目的。
在其他可选的实施例中,可以在获得待预测用户的第一兴趣梯度和第一影响力参数后,由服务器直接判断获得的第一兴趣梯度和第一影响力参数是否满足预定的流失判断条件,从而获得待预测用户的流失预测结果,例如,预定的流失判断条件可包括获得的第一兴趣梯度和第一影响力参数均小于预设值。也可以在获得待预测用户的第一兴趣梯度和第一影响力参数后,由服务器输出第一兴趣梯度以及第一影响力参数,再由人工完成对第一兴趣梯度以及第一影响力参数的分析,从而获得待预测用户的流失预测结果。
相较于上述两种方式,本实施例采用机器学习处理获得的流失预测模型对待识别用户的流失概率进行预测,由于机器学习模型是基于大数据训练获得,能够有效地提高预测的精确性。
此外,在实际应用中,对待预测用户的流失概率进行预测后,应用运营商可基于预测结果采取相应的措施,具体地,待预测用户流失的可能性大时,应用运营商可以对该用户进行相应的挽留措施,以实现应用平台的防流失运营。例如,对于应用运营商,可由实现相应应用平台的服务器基于获得的流失概率判断待预测用户流失的可能性,当待预测用户流失的可能性大时,由实现相应应用平台的服务器向该用户绑定的其他联系账号(如手机号、微信号或QQ号等)推送与应用平台相关的消息,如应用平台的最新活动信息(以网络游戏应用为例,可以为游戏的最新任务消息等),或者给该用户赠送礼物(以网络游戏应用为例,可以为角色皮肤及道具等)的通知消息等。相应地,对于用户,接受到相应的推送消息后,则可以登陆应用平台查看,并进行相应的行为操作,在此过程中,用户可能重新回归应用平台。
上述用户流失的预测方法,获取待预测用户的第一兴趣梯度和第一影响力参数,其中,第一兴趣梯度能够表征该待预测用户自身对相应应用平台的兴趣的变化趋势。第一影响力参数基于待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定,可见,该第一影响力参数可用于表征该待预测用户与用户关系链中的其他用户之间互相影响的情况。因此,基于待预测用户的第一兴趣梯度和第一影响力参数进行流失预测,充分地考虑了用户的个人因素以及应用平台的社交属性对用户的流失行为的影响,能够有效地提高预测的精确性。
为进一步对本申请的方案进行更详细的说明,下文对本发明的一些优选实施例进行具体描述或举例说明。
在一个实施例中,所述用户关系链的确定方式,可以包括如下步骤:
基于第一互动数据查找所述待预测用户的邻居用户,基于所述待预测用户以及该待预测用户的各邻居用户确定所述用户关系链,其中,所述待预测用户的邻居用户为:所述当前应用平台上与所述待预测用户存在预定互动行为的用户。
在本实施例中,用户关系链可包含待预测用户及其邻居用户。以应用平台为网络游戏平台为例,在一个示例a中,网络游戏平台中存在游戏用户A、游戏用户B、游戏用户C、游戏用户D以及游戏用户E,一共5个游戏用户。其中,游戏用户A分别与游戏用户B和游戏用户C存在实时对战行为;游戏用户B分别与游戏用户A、游戏用户D、以及游戏用户E存在实时对战行为;游戏用户C仅与游戏用户A存在实时对战行为。则,对于该示例a,若游戏用户A为待预测用户,则如图3所示,确定的用户关系链可以包含游戏用户A、游戏用户B以及游戏用户C;若游戏用户B为待预测用户,则如图4所示,对应的用户关系链可以包含游戏用户B、游戏用户A、游戏用户D以及游戏用户E。
在一个具体的示例中,对于相应应用平台上的任一用户,该用户可对应有第一互动数据,该第一互动数据可用于表征该用户与相应应用平台上的其他用户之间存在预定互动行为的具体情况。因此,可基于待预测用户的第一互动数据查找其在相应应用平台上的邻居用户,进而可基于该待测用户以及其邻居用户确定用户关系链。
需要说明的是,对于上述示例a,游戏用户A对应的第一互动数据,用于表征游戏用户A与游戏用户B之间存在预定互动行为、游戏用户A与游戏用户C之间存在预定互动行为、以及两两间存在预定互动行为的具体情况。具体地,游戏用户A的第一互动数据可包含:游戏用户A与游戏用户B之间存在的实时对战行为对应的时间信息、次数信息以及对战结果信息,以及游戏用户A与游戏用户C之间存在的实时对战行为对应的时间信息、次数信息以及对战结果信息等。
在另一个实施例中,所述用户关系链的确定方式,可以包括如下步骤:
基于第二互动数据查找所述当前应用平台上的各用户的邻居用户,基于所述当前应用平台上的各用户以及该各用户的邻居用户确定所述用户关系链,其中,所述当前应用平台上的任一用户的邻居用户为:所述当前应用平台上与该用户存在所述预定互动行为的用户。
需要说明的是,在一个应用平台上,各用户往往是相互影响的,两个用户之间的影响可以包括直接影响和间接影响,对于存在预定互动行为的任意两个用户,两者可以直接影响对方。然而,对于不存在预定互动行为,但具有共同邻居用户的任意两个用户,两者可以通过该共同邻居用户间接影响对方,例如,对于上述示例a,游戏用户A可以直接影响游戏用户B,且可以理解,虽然游戏用户A无法直接影响游戏用户E,但游戏用户A与游戏用户E具有共同邻居用户(即游戏用户B),因此游戏用户A也可以通过影响游戏用户B来间接影响游戏用户E。
基于此,在本实施例中,用户关系链可包含应用平台上的所有已注册的用户。例如,对于上述示例a,如图5所示,用户关系链中可包含游戏用户A、游戏用户B、游戏用户C、游戏用户D以及游戏用户E这5个游戏用户。在此情况下,基于待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定的待预测用户的第一影响力参数,则能够更准确地表征该待预测用户对其各邻居用户的影响、以及该待预测用户所受到其各邻居用户的影响,从而提高预测的精确性。
在一个具体的示例中,对于相应应用平台上的任一用户,该用户可对应有第二互动数据,与上一个实施例中的第一互动数据类似,该第二互动数据用于表征该用户与相应应用平台上的其他用户之间存在的预定互动行为的具体情况。因此,对于相应应用平台上的任一用户,均可以基于其第二互动数据查找其在相应应用平台上的邻居用户,进而可基于相应应用平台上的各用户以及该各用户的邻居用户确定用户关系链。
需要说明的是,第一互动数据与第二互动数据可以指代性质相同的内容,以“第一”和“第二”进行命名,仅仅是为了在不同的实施例中进行差异性区分。
在一个实施例中,所述待预测用户的第一兴趣梯度的确定方式,可以包括如下步骤:
获取所述待预测用户的各预定类型的历史行为数据;
基于所述待预测用户的各所述预定类型的历史行为数据、以及各所述预定类型对应的权重,计算获得所述待预测用户的兴趣度;
对所述待预测用户的兴趣度求导,获得所述待预测用户的第一兴趣梯度。
当用户在相应应用平台上进行不同类型的行为操作时,应用平台可获得对应类型的行为数据。以网络游戏平台为例,游戏用户可在该平台上领取游戏礼包、分享游戏结果、购买游戏道具、添加游戏好友、进行实时对战等。相应地,实现该平台的服务器可以获取上述各类型的行为所对应的行为数据,如领取游戏礼包的次数、分享游戏结果的次数、购买游戏道具的次数及金额、添加游戏好友的个数、以及进行实时对战的局数与时长。
用户的各类型的行为数据,可以用于衡量该用户对应用的兴趣,另外,各类型的行为数据对于衡量用户对应用的兴趣的重要程度可以有所不同。以网络游戏平台为例,相较于领取游戏礼包的次数,购买游戏道具的次数对于衡量游戏用户对游戏的兴趣的重要程度可以更高,即领取游戏礼包的次数与购买游戏道具的次数可以对应不同的权重,如购买游戏道具的次数对应的权重可以大于领取游戏礼包的次数对应的权重。
基于此,本实施例可基于待预测用户的各预定类型的历史行为数据、以及各预定类型对应的权重,计算获得待预测用户的兴趣度,即进行加权求和获得待预测用户的兴趣度。其中,各预定类型对应的权重可基于实际业务经验进行设定。
获得兴趣度后,则可以通过下述公式对获得的兴趣度进行求导:其中,Sx(t)为用户x在t时刻的兴趣梯度,φx(t)为用户x在t时刻的兴趣度,φx(t+δt)为用户x在(t+δt)时刻的兴趣度,φx(t-δt)为用户x在(t-δt)时刻的兴趣度,则φx(t+δt)-φx(t-δt)表示在(t-δt)时刻至(t+δt)时刻这一时间区间内,用户x的兴趣度的变化量。
兴趣梯度Sx(t),可以用于表征用户x在t时刻对相应应用平台的兴趣的变化趋势。具体地,当Sx(t)>0时,表示用户x在t时刻的兴趣呈上升趋势,亦即表示用户对应用平台的兴趣将增加;当Sx(t)<0时,表示用户x在t时刻的兴趣呈下降趋势,亦即表示用户对应用平台的兴趣将下降;当Sx(t)=0时,表示用户x在t时刻的兴趣呈持平趋势,亦即表示用户对应用平台的兴趣将不会发生变化。
在一个实施例中,所述待预测用户的第一影响力参数的确定方式,可以包括如下步骤:
基于所述用户关系链中的各用户的第二兴趣梯度,进行所述第二影响力参数的迭代计算;
将迭代计算完成后获得的所述待预测用户的第二影响力参数,确定为所述待预测用户的第一影响力参数。
在实际应用中,用户关系链中的各用户的第二影响力参数,一方面会因为自身的兴趣发生变化而相应变化,另一方面会因为接收到其各邻居用户传播的影响力而发生相应的改变。
基于此,在本实施例中,可以通过迭代计算,使得用户关系链中的各用户的第二影响力参数的变化逐渐趋于收敛,然后,将达到收敛状态时的用户关系链中的各用户的第二影响力参数,即迭代计算完成后获得的用户关系链中的各用户的第二影响力参数,确定为用户关系链中的各用户的第一影响力参数。
可以理解,通过迭代计算确定了各用户关系链中的各用户的第一影响力参数后,在需要对待预测用户进行流失预测时,则可以从所确定的用户关系链中的各用户的第一影响力参数中,查找该待预测用户的第一影响力参数。
需要说明的是,若在本次预测中,待预测用户的数目大于一,则执行完一次用户关系链的各用户的第一影响力的确定操作,确定了用户关系链中的各用户的第一影响力参数后,依次从所确定的用户关系链的各用户的第一影响力参数中,查找对应待预测用户的第一影响力参数即可,而无需在获取了当前待预测用户的第一影响力参数之后,获取下一个待预测用户的第一影响力参数之前,再执行一次用户关系链的各用户的第一影响力的确定操作。
如图6所示,在一个实施例中,所述基于所述用户关系链中的各用户的第二兴趣梯度,进行第二影响力参数的迭代计算,确定所述用户关系链中的各用户的第一影响力参数的步骤,可以包括如下步骤S602至S610。
S602,在当前一轮迭代过程中,从所述用户关系链中选取当前传播源用户,所述当前传播源用户为一个在当前一轮迭代过程中未被作为过传播源用户的用户;
S604,基于所述当前传播源用户当前的第二兴趣梯度,更新所述当前传播源用户及其各邻居用户当前的第二影响力参数,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数,所述当前传播源用户的邻居用户为所述当前应用平台上与所述当前传播源用户存在所述预定互动行为的用户;
S606,判断所述用户关系链中的各用户在当前一轮迭代过程中是否均被作为过传播源用户;若否,则跳转至步骤S602;若是,则跳转至步骤S608;
S608,判断是否满足预定迭代终止条件;若不满足预定迭代终止条件,执行下一轮迭代过程,直至满足所述预定迭代终止条件;若满足所述预定迭代终止条件,则跳转至步骤S610;
S610,将获得的所述用户关系链中的各用户更新后的第二影响力参数,作为所述用户关系链中的各用户的第一影响力参数。
其中,传播源用户指的是,作为影响力传播源头的用户。对于任一被作为当前传播源用户的用户,基于该用户当前的第二兴趣梯度,该用户自身的第二影响力参数会发生相应的改变,在此情况下,该用户还可以将其当前的影响力传播给其各邻居用户,即基于该用户当前的第二影响力参数,其各邻居用户当前的第二影响力参数均会发生相应的改变。
需要说明的是,在进行第一轮迭代之前,可以为用户关系链中的每一个用户配置初始影响力参数,该初始影响力参数可以基于业务经验进行设定,也可以随机设定。
相应地,在进行第一轮迭代的过程中,更新当前传播源用户及其各邻居用户当前的第二影响力参数,即为更新当前传播源用户及其各邻居用户的初始影响力参数,完成本次更新操作后,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数。随后,在进行第二轮迭代的过程中,更新当前传播源用户及其各邻居用户当前的第二影响力参数,即为更新第一轮迭代结束时,所获得的当前传播源用户及其各邻居用户更新后的第二影响力参数,以此类推,在进行第N轮迭代的过程中,更新当前传播源用户及其各邻居用户当前的第二影响力参数,即为更新第(N-1)轮迭代结束时,所获得的当前传播源用户及其各邻居用户更新后的第二影响力参数。
可以理解,在每一轮迭代过程中,用户关系链中的所有用户都会被作为一次传播源用户,并且也仅会被作为一次传播源用户。另外,在每一轮迭代过程中,用户关系链中的所有用户的第二影响力参数都会被更新。
其中,迭代终止条件可以基于实际需求进行设定,其目的是使所确定的用户关系链中的各用户的第一影响力参数达到符合要求的精度。
可以理解,随着迭代次数的增加,用户关系链中的各用户的第二影响力参数的变化逐渐趋于收敛,各第二影响力参数逐渐逼近该符合要求的精度。具体地,迭代次数较少时,各第二影响力参数往往难以达到该符合要求的精度,但迭代次数足够多时,各第二影响力参数则可以达到该符合要求的精度。
基于此,在一个具体的示例中,迭代终止条件可以包括当前的迭代次数大于预设值,预设值可为基于实际需求以及业务经验设定的数值,优选地,预设值可以设置为一个较大的数值。
此外,还可以理解,在整个迭代过程中,用户关系链中的各用户的第二影响力参数的变化逐渐趋于收敛,即用户关系链中的各用户的第二影响力参数的变化会越来越小。
基于此,在另一个具体示例中,迭代终止条件可以包括当前参数变化量小于预定阈值,亦即在用户关系链中的各用户的第二影响力参数的变动较小时,终止迭代。其中,当前参数变化量可以指当前一轮迭代过程结束时获得的用户关系链中的各用户更新后的第二影响力参数,与上一轮迭代过程结束时获得的用户关系链中的各用户更新后的第二影响力参数之间的目标差值的绝对值。
在一个具体的示例中,目标差值可以指平均差值,例如,用户关系链中包括用户H、用户I和用户J,在当前一轮迭代过程结束时,获得的用户H更新后的第二影响力参数为H1、用户I更新后的第二影响力参数为I1、用户J更新后的第二影响力参数为J1,并且,在上一轮迭代过程结束时,获得的用户H更新后的第二影响力参数为H0、用户I更新后的第二影响力参数为I0、用户J更新后的第二影响力参数为J0,则可以通过下述公式计算获得上述目标差值的绝对值△(即当前参数变化量),
在另一个具体的示例中,目标差值可以指最大差值,仍以上一个具体示例中的情况为例,用户H的差值为△H,△H=|(H1-H0)|,用户I的差值为△I,△I=|(I1-I0)|,用户J的差值为△J,△J=|(J1-J0)|,则上述目标差值的绝对值(即当前参数变化量)可以指△H、△I以及△J三者中的最大值。
以下结合图7所示的用户关系链对本实施例中通过迭代计算,确定用户关系链中的各用户的第一影响力参数的过程进行详细说明(各步骤未图示)。
S701,进行第一轮迭代,具体包括如下步骤:
S7011,选取用户V1作为当前传播源用户,基于用户V1当前的第二兴趣梯度,更新用户V1及其邻居用户V2、V3以及V4的初始影响力参数,获得用户V1、V2、V3和V4执行完步骤S7011后获得的更新后的第二影响力参数;
S7012,选取用户V2作为当前传播源用户,基于用户V2当前的第二兴趣梯度,更新用户V2及其邻居用户V1在执行完步骤S7011后获得的更新后的第二影响力参数,获得用户V1和V2在执行完步骤S7012后获得的更新后的第二影响力参数;
S7013,选取用户V3作为当前传播源用户,基于用户V3当前的第二兴趣梯度,更新用户V3及其邻居用户V1和V4在执行完步骤S7012后获得的更新后的第二影响力参数,获得用户V1、V2和V3执行完步骤S7013后获得的更新后的第二影响力参数;
S7014,选取用户V4作为当前传播源用户,基于用户V4当前的第二兴趣梯度,更新用户V4及其邻居用户V1和V3在执行完步骤S7013后获得的更新后影响力参数,获得用户V1、V2和V3执行完步骤S7014后获得的更新后的第二影响力参数;
S7015,判断是否满足预定迭代终止条件;
若满足,则将用户关系链中的各用户在执行完步骤S7014后获得的更新后的第二影响力参数作为所述用户关系链中的各用户的第一影响力参数;
若不满足,则继续执行第二轮迭代过程;
S702,进行第二轮迭代,具体包括如下步骤:
S7021,选取用户V1作为当前传播源用户,基于用户V1当前的第二兴趣梯度,更新用户V1及其邻居用户V2、V3以及V4在执行完步骤S7014后获得的更新后的第二影响力参数,获得用户V1、V2、V3和V4执行完步骤S7021后获得的更新后的第二影响力参数;
S7022,选取用户V2作为当前传播源用户,基于用户V2当前的第二兴趣梯度,更新用户V2及其邻居用户V1在执行完步骤S7021后获得的更新后影响力参数,获得用户V1和V2执行完步骤S7022后获得的更新后的第二影响力参数;
S7023,选取用户V3作为当前传播源用户,基于用户V3当前的第二兴趣梯度,更新用户V3及其邻居用户V1和V4在执行完步骤S7022后获得的更新后的第二影响力参数,获得用户V1、V2和V3执行完步骤S7023后获得的更新后的第二影响力参数;
S7024,选取用户V4作为当前传播源用户,基于用户V4当前的第二兴趣梯度,更新用户V4及其邻居用户V1和V3在执行完步骤S7023后获得的更新后的第二影响力参数,获得用户V1、V2和V3执行完步骤S7024后获得的更新后的第二影响力参数;
S7025,判断是否满足预定迭代终止条件;
若满足,则将用户关系链中的各用户在执行完步骤S7024后获得的更新后的第二影响力参数作为所述用户关系链中的各用户的第一影响力参数;
若不满足,则继续执行第三轮迭代过程,其中,第三轮迭代过程以及往后的每一轮迭代过程均可与第二轮迭代过程的步骤相同,此处不加赘述,直至满足预定迭代终止条件,终止迭代。
在一个实施例中,所述第二影响力参数包括正影响力参数和负影响力参数;此时,所述基于所述当前传播源用户当前的第二兴趣梯度,更新所述当前传播源用户及其各邻居用户当前的第二影响力参数,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数的步骤,包括:
当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,更新所述当前传播源用户当前的正影响力参数、以及其各邻居用户当前的负影响力参数,获得所述当前传播源用户更新后的正影响力参数、以及其各邻居用户更新后的负影响力参数;
当所述当前传播源用户当前的第二兴趣梯度对应上升趋势时,更新所述当前传播源用户当前的负影响力参数、以及其各邻居用户当前的正影响力参数,获得所述当前传播源用户更新后的负影响力参数、以及其各邻居用户更新后的正影响力参数。
在本实施例中,用户的第二影响力指数包括正影响力参数和负影响力参数,正影响力参数可用于表征该用户对其邻居用户的正面影响,负影响力参数可用于表征该用户对其邻居用户的负面影响。
在当前传播源用户当前的第二兴趣梯度对应下降趋势时,主要是将其负影响力传播给其邻居用户,基于此,可更新该当前传播源用户当前的正影响力参数,以及该当前传播源用户当前的负影响力参数。
在当前传播源用户当前的第二兴趣梯度对应上升趋势时,主要是将其正影响力传播给其邻居用户。基于此,可更新该当前传播源用户当前的正影响力参数,以及该当前传播源用户当前的负影响力参数。
相应地,上文所述的第一影响力参数以及第三影响力参数均可对应包括正影响力参数和负影响力参数。
此外,需要说明的是,在进行第一轮迭代之前,可以为用户关系链中的每一个用户配置初始正影响力参数和初始负影响力参数,类似地,该初始正影响力参数和初始负影响力参数均可以基于业务经验进行设定,也可以随机设定。例如,为样本用户配置初始正影响力参数和初始负影响力参数时,对于流失用户,可设定其初始负影响力参数为1,初始正影响力参数为0,对于未流失用户可设定其初始负影响力参数为s,初始正影响力参数为(1-s),s为基于实际需求进行设定的数值。
在一个实施例中,当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,所述当前传播源用户当前的正影响力参数大于所述当前传播源用户更新后的正影响力参数,所述当前传播源用户的任一邻居用户当前的负影响力参数小于该邻居用户更新后的负影响力参数;
当所述当前传播源用户的当前第二兴趣梯度对应上升趋势时,所述当前传播源用户当前的负影响力参数大于所述当前传播源用户更新后的负影响力参数,所述当前传播源用户的任一邻居用户当前的正影响力参数小于该邻居用户更新后的正影响力参数。
需要说明的是,在当前传播源用户当前的第二兴趣梯度对应下降趋势时,主要是将其负影响力传播给其邻居用户,因此,其自身的正影响力参数会减小,其邻居用户的负影响力参数会增加。
在当前传播源用户当前的第二兴趣梯度对应上升趋势时,主要是将其正影响力传播给其邻居用户,因此,其自身的负影响力参数会减小,其邻居用户的正影响力参数会增加。
在一个实施例中,所述当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,更新所述当前传播源用户当前的正影响力参数、以及其各邻居用户当前的负影响力参数,获得所述当前传播源用户更新后的正影响力参数、以及其各邻居用户更新后的负影响力参数的步骤,包括:
将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,作为当前第一调整因子;
基于所述当前第一调整因子和所述当前传播源用户当前的正影响力参数,计算所述当前传播源用户更新后的正影响力参数;
基于所述当前第一调整因子和所述当前传播源用户的各邻居用户当前的负影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
需要说明的是,将当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,作为当前第一调整因子,是为了避免计算获得的用户的正影响力参数和负影响力参数出现负值,从而导致迭代过程无法收敛。
具体地,可以通过下述方式计算当前传播源用户更新后的正影响力参数zm(x):zm(x)=zm-1(x)-α1(1-γ),其中,zm-1(x)是当前传播源用户当前的正影响力参数,α1为第一调整因子,γ为预定的传播因子,其中γ可基于实际需求进行设定。
此外,在一个实施例中,所述基于所述当前第一调整因子和所述当前传播源用户的各邻居用户当前的负影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数的步骤,包括:
基于所述当前第一调整因子,所述当前传播源用户的各邻居用户当前的负影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
对于当前传播源用户,它可以将其影响力传播给其各邻居用户,可以理解,该当前传播源用户传播给各邻居用户的影响力的“份量”可以不相同,例如,用户关系链中包括用户H、用户I和用户J,并且,用户I和用户J均是用户H的邻居用户,当用户H为当前传播源用户时,其传播给用户I的影响力的“份量”可以多于其传播给用户J的影响力的“份量”。
在本实施例中,当前传播源用户与其任一邻居用户之间的影响力传播比重,可用于表征该当前传播源用户传播给该邻居用户的影响力的“份量”。基于此,可结合当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算当前传播源用户的各邻居用户更新后的负影响力参数,以更准确地计算前传播源用户的各邻居用户的负影响力参数,从而提高预测的精确性。
具体地,对于当前传播源用户x的任一邻居用户y,可以通过下述方式计算其负影响力参数nm(y):nm(y)=nm-1(y)+α1*γ*p,其中,nm-1(y)是该邻居用户y当前的负影响力参数,α1为第一调整因子,γ为预定的传播因子,γ可基于实际需求进行设定,p为该当前传播源用户x与该邻居用户y之间的影响力传播比重。
具体地,可以采用下述方式计算该当前传播源用户x与该邻居用户y之间的影响力传播比重p:其中,exy为当前传播源用户x与该邻居用户y之间的影响力传播权重,etotal当前传播源用户x与其各邻居用户之间的影响力传播权重的总和。其中,以用户关系链为上文所述的无向图为例,exy即表示节点之间的连边的权重。
在一个实施例中,所述当所述当前传播源用户当前的第二兴趣梯度对应上升趋势时,更新所述当前传播源用户当前的负影响力参数、以及其各邻居用户当前的正影响力参数,获得所述当前传播源用户更新后的负影响力参数、以及其各邻居用户更新后的正影响力参数的步骤,包括:
将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,确定为当前第二调整因子;
基于所述当前第二调整因子和所述当前传播源用户当前的负影响力参数,计算所述当前传播源用户更新后的负影响力参数;
基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
需要说明的是,将当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,作为当前第二调整因子,是为了避免计算获得的用户的正影响力参数和负影响力参数出现负值,从而导致迭代过程无法收敛。
具体地,可以通过下述方式计算当前传播源用户更新后的负影响力参数nm(x):nm(x)=nm-1(x)-α2(1-γ),其中,nm-1(x)是当前传播源用户当前的负影响力参数,α2为第二调整因子,γ为预定的传播因子,γ可基于实际需求进行设定。
此外,在一个实施例中,所述基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数的步骤,可以包括如下步骤:
基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
与上文提及的计算当前传播源用户的各邻居用户更新后的负影响力参数的过程类似,在本实施例中,可结合当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算当前传播源用户的各邻居用户更新后的正影响力参数,以更准确地计算前传播源用户的各邻居用户的正影响力参数,从而提高预测的精确性。
具体地,对于当前传播源用户x的任一邻居用户y,可以通过下述方式计算其正影响力参数zm(y):zm(y)=zm-1(y)+α2*γ*p,其中,zm-1(y)是该邻居用户y当前的正影响力参数,α2为第二调整因子,γ为预定的传播因子,γ可基于实际需求进行设定,p为该当前传播源用户x与该邻居用户y之间的影响力传播比重。
具体地,可以采用下述方式计算该当前传播源用户x与该邻居用户y之间的影响力传播比重p:其中,exy为当前传播源用户x与该邻居用户y之间的影响力传播权重,etotal当前传播源用户x与其各邻居用户之间的影响力传播权重的总和。其中,以用户关系链的具体数据结构为上文所述的无向图为例,exy即表示节点之间的连边的权重。
需要说明的是,第一调整因子与第二调整因子可以指代性质相同的内容,以“第一”和“第二”进行命名,仅仅是为了在不同的实施例中进行差异性区分。
在一个实施例中,所述当前传播源用户分别与其各邻居用户之间的影响力传播比重的确定方式,包括:
获取所述当前传播源用户对应的第三互动数据,所述第三互动数据用于表征该当前传播源用户与其各邻居用户之间的预定互动行为;
基于所述第三互动数据,确定所述当前传播源用户分别与其各邻居用户之间的影响力传播比重。
在一个具体的示例中,当前传播源用户可对应有第三互动数据,该第三互动数据可用于表征该当前传播源用户与其邻居用户之间存在的预定互动行为的具体情况。因此,可基于该第三互动数据确定当前传播源用户分别与其各邻居用户之间的影响力传播比重。
以应用平台为网络游戏平台为例,用于表征当前传播源用户分别与其各邻居用户之间的预定互动行为的互动数据,可以包括当前传播源用户分别与其各邻居用户之间存在的预定互动行为的次数,以及各次预定互动行为持续的时长数据等。具体地,可以包括但不限于:当前传播源用户分别与其各邻居用户之间存在的实时对战的局数、各次实时对战行为的持续时长以及赠送游戏礼包的次数。
此外,需要说明的是,在本申请提供的各实施例中,可预设多个传播因子以及初始影响力参数,在上文所述的训练流失预测模型的过程中,基于上文提到的机器学习模型评估指标在各预设传播因子中选取最优的传播因子,以及在各初始影响力参数中选取最优的初始影响力参数,以优化流失预测的精确性。
应该理解的是,虽然图2和图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
基于与上述方法相同的思想,一个实施例中还提供一种用户流失的预测装置,参照图8,所述装置800包括:
特征获取模块802,用于获取待预测用户的第一兴趣梯度和第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定;
模型获取模块804,用于获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户;以及,
概率预测模块806,用于基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
上述用户流失的预测装置800,获取待预测用户的第一兴趣梯度和第一影响力参数,其中,第一兴趣梯度能够表征该待预测用户自身对相应应用平台的兴趣的变化趋势。第一影响力参数基于待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定,可见,该第一影响力参数可用于表征该待预测用户与用户关系链中的其他用户之间互相影响的情况。因此,基于待预测用户的第一兴趣梯度和第一影响力参数进行流失预测,充分地考虑了用户的个人因素以及应用平台的社交属性对用户的流失行为的影响,能够有效地提高预测的精确性。
在一个实施例中,所述装置800可以包括:
第一关系链确定模块,基于第一互动数据查找所述待预测用户的邻居用户,基于所述待预测用户以及该待预测用户的各邻居用户确定所述用户关系链,其中,所述待预测用户的邻居用户为:所述当前应用平台上与所述待预测用户存在预定互动行为的用户。
在另一个实施例中,所述装置800可以包括:
第二关系链确定模块,用于基于第二互动数据查找所述当前应用平台上的各用户的邻居用户,基于所述当前应用平台上的各用户以及该各用户的邻居用户确定所述用户关系链,其中,所述当前应用平台上的任一用户的邻居用户为:所述当前应用平台上与该用户存在所述预定互动行为的用户。
在一个实施例中,所述装置800可以包括:
历史行为数据获取模块,用于获取所述待预测用户的各预定类型的历史行为数据;
兴趣度计算模块,用于基于所述待预测用户的各所述预定类型的历史行为数据、以及各所述预定类型对应的权重,计算获得所述待预测用户的兴趣度;
兴趣梯度计算模块,用于对所述待预测用户的兴趣度求导,获得所述待预测用户的第一兴趣梯度。
在一个实施例中,所述装置800可以包括:
目标影响力参数确定模块,用于基于所述用户关系链中的各用户的第二兴趣梯度,进行所述第二影响力参数的迭代计算;
第一影响力参数确定模块,用于将迭代计算完成后获得的所述待预测用户的第二影响力参数,确定为所述待预测用户的第一影响力参数。
在一个实施例中,所述目标影响力参数确定模块,可以包括:
传播源用户确定子模块,用于在当前一轮迭代过程中,从所述用户关系链中选取当前传播源用户,所述当前传播源用户为一个在当前一轮迭代过程中未被作为过传播源用户的用户;
影响力参数更新子模块,用于基于所述当前传播源用户当前的第二兴趣梯度,更新所述当前传播源用户及其各邻居用户当前的第二影响力参数,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数,所述当前传播源用户的邻居用户为所述当前应用平台上与所述当前传播源用户存在所述预定互动行为的用户;
调用子模块,用于调用所述传播源用户确定子模块,以返回从所述用户关系链的各用户中选取当前传播源用户的步骤,直至所述用户关系链中的各用户在当前一轮迭代过程中均被作为过传播源用户;
迭代跳转子模块,用于在不满足预定迭代终止条件,执行下一轮迭代过程,直至满足所述预定迭代终止条件;
目标影响力参数确定子模块,用于若满足所述预定迭代终止条件,将获得的所述用户关系链中的各用户更新后的第二影响力参数,作为所述用户关系链中的各用户的第一影响力参数。
在一个实施例中,所述目标影响力参数包括正影响力参数和负影响力参数,此时,所述影响力参数更新子模块,可以包括:
第一影响力参数更新单元,用于当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,更新所述当前传播源用户当前的正影响力参数、以及其各邻居用户当前的负影响力参数,获得所述当前传播源用户更新后的正影响力参数、以及其各邻居用户更新后的负影响力参数;
第二影响力参数更新单元,用于当所述当前传播源用户当前的第二兴趣梯度对应上升趋势时,更新所述当前传播源用户当前的负影响力参数、以及其各邻居用户当前的正影响力参数,获得所述当前传播源用户更新后的负影响力参数、以及其各邻居用户更新后的正影响力参数。
在一个实施例中,当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,所述当前传播源用户当前的正影响力参数大于所述当前传播源用户更新后的正影响力参数,所述当前传播源用户的任一邻居用户当前的负影响力参数小于该邻居用户更新后的负影响力参数;
当所述当前传播源用户的当前第二兴趣梯度对应上升趋势时,所述当前传播源用户当前的负影响力参数大于所述当前传播源用户更新后的负影响力参数,所述当前传播源用户的任一邻居用户当前的正影响力参数小于该邻居用户更新后的正影响力参数。
在一个实施例中,所述第一影响力参数更新单元,包括:
第一调整因子确定子单元,用于将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,作为当前第一调整因子;
第一正参数计算子单元,用于基于所述当前第一调整因子和所述当前传播源用户当前的正影响力参数,计算所述当前传播源用户更新后的正影响力参数;
第一负参数计算子单元,基于所述当前第一调整因子和所述当前传播源用户的各邻居用户当前的负影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
在一个实施例中,所述第一负参数计算子单元,具体可以用于:
基于所述当前第一调整因子,所述当前传播源用户的各邻居用户当前的负影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
在一个实施例中,所述第二影响力参数更新单元,可以包括:
第二调整因子确定子单元,用于将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,确定为当前第二调整因子;
第二负参数计算子单元,基于所述当前第二调整因子和所述当前传播源用户当前的负影响力参数,计算所述当前传播源用户更新后的负影响力参数;
第二正参数计算子单元,基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
在一个实施例中,所述第二正参数计算子单元,具体可以用于:
基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
在一个实施例中,所述装置800可以包括:
互动数据获取模块,用于获取所述当前传播源用户对应的第三互动数据,所述第三互动数据用于表征该当前传播源用户与其各邻居用户之间的预定互动行为;
传播比重确定模块,用于基于所述第三互动数据,确定所述当前传播源用户分别与其各邻居用户之间的影响力传播比重。
此外,图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器、以及网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现用户流失的预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行用户流失的预测方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的用户流失的预测装置可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该用户流失的预测装置的各个程序模块,比如,图8所示的特征获取模块802、模型获取模块804和概率预测模块806。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的用户流失的预测方法中的步骤。
例如,图9示的计算机设备可以通过如图8所示的用户流失的预测装置中的特征获取模块802执行步骤S202。计算机设备可通过模型获取模块804执行步骤S204。计算机设备可通过概率预测模块806执行步骤S206。
为此,一个实施例中还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行本申请提供的任一实施例中的用户流失的预测方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
为此,一个实施例中还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行本申请提供的任一实施例中的用户流失的预测方法的步骤。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种用户流失的预测方法,其特征在于,包括:
获取待预测用户的第一兴趣梯度和第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和第二影响力参数确定;
获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户;
基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
2.根据权利要求1所述的方法,其特征在于,所述用户关系链的确定方式,包括下述两项中的任意一项:
基于第一互动数据查找所述待预测用户的邻居用户,基于所述待预测用户以及该待预测用户的各邻居用户确定所述用户关系链,其中,所述待预测用户的邻居用户为:所述当前应用平台上与所述待预测用户存在预定互动行为的用户;
基于第二互动数据查找所述当前应用平台上的各用户的邻居用户,基于所述当前应用平台上的各用户以及该各用户的邻居用户确定所述用户关系链,其中,所述当前应用平台上的任一用户的邻居用户为:所述当前应用平台上与该用户存在所述预定互动行为的用户。
3.根据权利要求1所述的方法,其特征在于,所述待预测用户的第一兴趣梯度的确定方式,包括:
获取所述待预测用户的各预定类型的历史行为数据;
基于所述待预测用户的各所述预定类型的历史行为数据、以及各所述预定类型对应的权重,计算获得所述待预测用户的兴趣度;
对所述待预测用户的兴趣度求导,获得所述待预测用户的第一兴趣梯度。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述待预测用户的第一影响力参数的确定方式,包括:
基于所述用户关系链中的各用户的第二兴趣梯度,进行所述第二影响力参数的迭代计算;
将迭代计算完成后获得的所述待预测用户的第二影响力参数,确定为所述待预测用户的第一影响力参数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述用户关系链中的各用户的第二兴趣梯度,进行第二影响力参数的迭代计算的步骤,包括:
在当前一轮迭代过程中,从所述用户关系链中选取当前传播源用户,所述当前传播源用户为一个在当前一轮迭代过程中未被作为过传播源用户的用户;
基于所述当前传播源用户当前的第二兴趣梯度,更新所述当前传播源用户及其各邻居用户当前的第二影响力参数,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数,所述当前传播源用户的邻居用户为所述当前应用平台上与所述当前传播源用户存在所述预定互动行为的用户;
返回从所述用户关系链的各用户中选取当前传播源用户的步骤,直至所述用户关系链中的各用户在当前一轮迭代过程中均被作为过传播源用户;
若不满足预定迭代终止条件,执行下一轮迭代过程,直至满足所述预定迭代终止条件;
若满足所述预定迭代终止条件,将获得的所述用户关系链中的各用户更新后的第二影响力参数,作为所述用户关系链中的各用户的第一影响力参数。
6.根据权利要求5所述的方法,其特征在于,所述第二影响力参数包括正影响力参数和负影响力参数;
所述基于所述当前传播源用户当前的第二兴趣梯度,更新所述当前传播源用户及其各邻居用户当前的第二影响力参数,获得所述当前传播源用户及其各邻居用户更新后的第二影响力参数的步骤,包括:
当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,更新所述当前传播源用户当前的正影响力参数、以及其各邻居用户当前的负影响力参数,获得所述当前传播源用户更新后的正影响力参数、以及其各邻居用户更新后的负影响力参数;
当所述当前传播源用户当前的第二兴趣梯度对应上升趋势时,更新所述当前传播源用户当前的负影响力参数、以及其各邻居用户当前的正影响力参数,获得所述当前传播源用户更新后的负影响力参数、以及其各邻居用户更新后的正影响力参数。
7.根据权利要求6所述的方法,其特征在于,当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,所述当前传播源用户当前的正影响力参数大于所述当前传播源用户更新后的正影响力参数,所述当前传播源用户的任一邻居用户当前的负影响力参数小于该邻居用户更新后的负影响力参数;
当所述当前传播源用户的当前第二兴趣梯度对应上升趋势时,所述当前传播源用户当前的负影响力参数大于所述当前传播源用户更新后的负影响力参数,所述当前传播源用户的任一邻居用户当前的正影响力参数小于该邻居用户更新后的正影响力参数。
8.根据权利要求7所述的方法,其特征在于,所述当所述当前传播源用户当前的第二兴趣梯度对应下降趋势时,更新所述当前传播源用户当前的正影响力参数、以及其各邻居用户当前的负影响力参数,获得所述当前传播源用户更新后的正影响力参数、以及其各邻居用户更新后的负影响力参数的步骤,包括:
将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,作为当前第一调整因子;
基于所述当前第一调整因子和所述当前传播源用户当前的正影响力参数,计算所述当前传播源用户更新后的正影响力参数;
基于所述当前第一调整因子和所述当前传播源用户的各邻居用户当前的负影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
9.根据权利要求8所述的方法,其特征在于,所述基于所述当前第一调整因子和所述当前传播源用户的各邻居用户当前的负影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数的步骤,包括:
基于所述当前第一调整因子,所述当前传播源用户的各邻居用户当前的负影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的负影响力参数。
10.根据权利要求7所述的方法,其特征在于,所述当所述当前传播源用户当前的第二兴趣梯度对应上升趋势时,更新所述当前传播源用户当前的负影响力参数、以及其各邻居用户当前的正影响力参数,获得所述当前传播源用户更新后的负影响力参数、以及其各邻居用户更新后的正影响力参数的步骤,包括:
将所述当前传播源用户当前的正影响力参数和当前的负影响力参数中的较小值,确定为当前第二调整因子;
基于所述当前第二调整因子和所述当前传播源用户当前的负影响力参数,计算所述当前传播源用户更新后的负影响力参数;
基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
11.根据权利要求10所述的方法,其特征在于,所述基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数的步骤,包括:
基于所述当前第二调整因子和所述当前传播源用户的各邻居用户当前的正影响力参数,以及所述当前传播源用户分别与其各邻居用户之间的影响力传播比重,分别计算所述当前传播源用户的各邻居用户更新后的正影响力参数。
12.根据权利要求9或11所述的方法,其特征在于,所述当前传播源用户分别与其各邻居用户之间的影响力传播比重的确定方式,包括:
获取所述当前传播源用户对应的第三互动数据,所述第三互动数据用于表征该当前传播源用户与其各邻居用户之间的预定互动行为;
基于所述第三互动数据,确定所述当前传播源用户分别与其各邻居用户之间的影响力传播比重。
13.一种用户流失的预测装置,其特征在于,包括:
特征获取模块,用于获取待预测用户的第一兴趣梯度和所述待预测用户的第一影响力参数,所述待预测用户的第一兴趣梯度至少基于所述待预测用户在当前应用平台上的行为数据确定,所述待预测用户的第一影响力参数基于所述待预测用户所在用户关系链中的各用户的第二兴趣梯度和该各用户的第二影响力参数确定;
模型获取模块,用于获取预定流失预测模型,所述预定流失预测模型通过对样本用户的第三兴趣梯度和所述样本用户的第三影响力参数进行机器学习处理获得,所述样本用户包括流失用户和非流失用户;以及,
概率预测模块,用于基于所述待预测用户的第一兴趣梯度、第一影响力参数以及所述预定流失预测模型,预测所述待预测用户的流失概率。
14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711213745.6A CN109840790B (zh) | 2017-11-28 | 2017-11-28 | 用户流失的预测方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711213745.6A CN109840790B (zh) | 2017-11-28 | 2017-11-28 | 用户流失的预测方法、装置及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840790A true CN109840790A (zh) | 2019-06-04 |
CN109840790B CN109840790B (zh) | 2023-04-28 |
Family
ID=66880918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711213745.6A Active CN109840790B (zh) | 2017-11-28 | 2017-11-28 | 用户流失的预测方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109840790B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114430489A (zh) * | 2020-10-29 | 2022-05-03 | 武汉斗鱼网络科技有限公司 | 一种虚拟道具的补偿方法以及相关设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104813353A (zh) * | 2012-10-30 | 2015-07-29 | 阿尔卡特朗讯 | 用于生成用户流失预测的系统和方法 |
CN105069534A (zh) * | 2015-08-18 | 2015-11-18 | 广州华多网络科技有限公司 | 客户流失预测方法以及装置 |
CN105260474A (zh) * | 2015-10-29 | 2016-01-20 | 俞定国 | 一种基于信息交互网络的微博用户影响力计算方法 |
CN105574147A (zh) * | 2015-12-15 | 2016-05-11 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN106250999A (zh) * | 2015-06-03 | 2016-12-21 | 阿里巴巴集团控股有限公司 | 预测流失率的方法、装置和系统 |
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN106682770A (zh) * | 2016-12-14 | 2017-05-17 | 重庆邮电大学 | 一种基于好友圈子的动态微博转发行为预测系统及方法 |
-
2017
- 2017-11-28 CN CN201711213745.6A patent/CN109840790B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104813353A (zh) * | 2012-10-30 | 2015-07-29 | 阿尔卡特朗讯 | 用于生成用户流失预测的系统和方法 |
CN106250999A (zh) * | 2015-06-03 | 2016-12-21 | 阿里巴巴集团控股有限公司 | 预测流失率的方法、装置和系统 |
CN105069534A (zh) * | 2015-08-18 | 2015-11-18 | 广州华多网络科技有限公司 | 客户流失预测方法以及装置 |
CN105260474A (zh) * | 2015-10-29 | 2016-01-20 | 俞定国 | 一种基于信息交互网络的微博用户影响力计算方法 |
CN105574147A (zh) * | 2015-12-15 | 2016-05-11 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器 |
CN106022505A (zh) * | 2016-04-28 | 2016-10-12 | 华为技术有限公司 | 一种预测用户离网的方法及装置 |
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN106682770A (zh) * | 2016-12-14 | 2017-05-17 | 重庆邮电大学 | 一种基于好友圈子的动态微博转发行为预测系统及方法 |
Non-Patent Citations (1)
Title |
---|
刘亚: "社交网络节点流失模型与应用研究", 《中国优秀硕士学位论文全文数据库(基础科学辑)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114430489A (zh) * | 2020-10-29 | 2022-05-03 | 武汉斗鱼网络科技有限公司 | 一种虚拟道具的补偿方法以及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109840790B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490717B (zh) | 基于用户会话及图卷积神经网络的商品推荐方法及系统 | |
Pham et al. | A general graph-based model for recommendation in event-based social networks | |
Marden et al. | Game theory and distributed control | |
US8788439B2 (en) | Instance weighted learning machine learning model | |
US20210365782A1 (en) | Method and apparatus for generating neural network model, and computer-readable storage medium | |
CN110458663A (zh) | 一种车辆推荐方法、装置、设备及存储介质 | |
CN108363745A (zh) | 机器人客服转人工客服的方法和装置 | |
CN108052979A (zh) | 对模型预测值进行融合的方法、装置和设备 | |
EP3852014A1 (en) | Method and apparatus for training learning model, and computing device | |
CN110118566B (zh) | 机器人运行路径生成方法及装置 | |
CN108122127A (zh) | 预测在线游戏服务的运行结果的方法及装置 | |
CN108090788A (zh) | 基于时间信息集成模型的广告转化率预估方法 | |
CN114896899B (zh) | 一种基于信息交互的多智能体分散式决策方法及系统 | |
Knott et al. | Evaluating the robustness of collaborative agents | |
Jawarneh et al. | Sequential insertion heuristic with adaptive bee colony optimisation algorithm for vehicle routing problem with time windows | |
CN109460613A (zh) | 模型裁剪方法及装置 | |
Abdullah et al. | Integrated MOPSO algorithms for task scheduling in cloud computing | |
Yin et al. | Enhanced salp swarm algorithm based on random walk and its application to training feedforward neural networks | |
CN109925718A (zh) | 一种分发游戏微端地图的系统及方法 | |
CN109829578A (zh) | 一种售电商与多元用户需求响应博弈方法及设备 | |
CN106407379A (zh) | 一种基于Hadoop平台的电影推荐方法 | |
Xu et al. | Intelligent task allocation for mobile crowdsensing with graph attention network and deep reinforcement learning | |
Asperti et al. | Crawling in rogue’s dungeons with (partitioned) a3c | |
CN107527110A (zh) | 基于布谷鸟搜索优化mgm(1,n)的年用电量预测方法 | |
CN109840790A (zh) | 用户流失的预测方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |