CN108765010B - 用户留存概率预测方法、装置、预测服务器及存储介质 - Google Patents

用户留存概率预测方法、装置、预测服务器及存储介质 Download PDF

Info

Publication number
CN108765010B
CN108765010B CN201810532960.0A CN201810532960A CN108765010B CN 108765010 B CN108765010 B CN 108765010B CN 201810532960 A CN201810532960 A CN 201810532960A CN 108765010 B CN108765010 B CN 108765010B
Authority
CN
China
Prior art keywords
user
target
retention
probability
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810532960.0A
Other languages
English (en)
Other versions
CN108765010A (zh
Inventor
钟子宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810532960.0A priority Critical patent/CN108765010B/zh
Publication of CN108765010A publication Critical patent/CN108765010A/zh
Application granted granted Critical
Publication of CN108765010B publication Critical patent/CN108765010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户留存概率预测方法、装置、预测服务器及存储介质,根据目标业务在历史周期的用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率,根据目标业务在所述历史周期的用户留存数据,预估所述目标业务在所述目标周期的用户基准留存概率;根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;获取目标用户在所述目标周期的留存概率调整参数;根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。本实施例考虑用户回流对预测的用户留存概率的影响且可以进行多个未来的目标周期预测,显著提高了用户留存概率的预测准确性,提高了预测效果。

Description

用户留存概率预测方法、装置、预测服务器及存储介质
技术领域
本发明涉及信息处理技术领域,更具体的说,是涉及一种用户留存概率预测方法、装置、预测服务器及存储介质。
背景技术
用户留存概率是针对业务(业务如游戏、社交软件等应用程序,又如提供服务的网站等)的具体注册用户而言,指的是业务的某一注册用户在未来留存下来的概率;为指导业务运营策略的制定、调整,对业务的具体注册用户在未来的留存概率进行预测(即进行用户留存概率预测),显得尤为必要。
在进行用户在业务的未来的留存概率预测时,传统的用户留存概率预测方式主要是基于用户在业务中的静态指标特征,通过使用线性回归、逻辑回归等传统的机器学习模型,建立未来单个周期的用户特征与用户留存概率之间的关联关系,并对业务的具体注册用户在未来周期的留存概率进行预测。但是,对于很多业务(如游戏业务)的用户,往往涉及到流失用户回流的情况,而传统的用户留存概率预测方式并未考虑用户回流对业务的具体注册用户在未来周期的留存概率的影响,导致所得到的留存概率预测的结果较为片面,预测结果的准确率并不高,并无法为业务的运营策略的制定、调整提供有效指导。
因此,目前迫切需要一种能够有效提高预测准确率的用户留存概率预测方法。
发明内容
有鉴于此,本发明提供了一种用户留存概率预测方法、装置、预测服务器及存储介质,以解决预测准确率较低的问题。
为实现上述目的,本发明提供如下技术方案:
一种用户留存概率预测方法,包括:
获取目标业务在历史周期的用户回流数据;
根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率;
获取目标业务在所述历史周期的用户留存数据;
根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率;
根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;
获取目标用户在所述目标周期的留存概率调整参数;
根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。
本发明实施例还提供一种用户留存概率预测装置,包括:
用户回流数据获取模块,用于获取目标业务在历史周期的用户回流数据;
用户回流概率预估模块,用于根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率;
用户留存数据获取模块,用于获取目标业务在所述历史周期的用户留存数据;
用户留存基准概率预估模块,用于根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率;
用户留存基准概率调整模块,用于根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;
留存概率调整参数确定模块,用于获取目标用户在所述目标周期的留存概率调整参数;
留存概率预测模块,用于根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。
本发明实施例还提供一种预测服务器,包括:至少一个存储器和至少一个处理器;所述存储器存储有适于所述处理器执行的程序,以实现上述所述的用户留存概率预测方法的步骤。
本发明实施例还提一种存储介质,所述存储介质存储有适于所述处理器执行的程序,以实现上述所述的用户留存概率预测方法的步骤。
经由上述的技术方案可知,与现有技术相比,本发明公开了一种用户留存概率预测方法、装置、预测服务器及存储介质,根据目标业务在历史周期的用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率,根据目标业务在所述历史周期的用户留存数据,预估所述目标业务在所述目标周期的用户基准留存概率;根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;获取目标用户在所述目标周期的留存概率调整参数;根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。本实施例考虑用户回流对预测的用户留存概率的影响且可以进行多个未来的目标周期预测,显著提高了用户留存概率的预测准确性,提高了预测效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的用户留存概率预测系统的架构示意图;
图2为本发明实施例提供的用户留存概率预测方法的流程图;
图3为本发明实施例提供的用户留存概率预测方法的流程过程示例图;
图4为本发明实施例提供的用户留存概率预测装置的结构框图;
图5为本发明实施例提供的用户留存概率预测装置的另一结构框图;
图6为本发明实施例提供的预测服务器的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的用户留存概率预测方法可针对游戏、社交、电子商务等类型的业务,进行具体用户在业务的未来周期的留存概率的预测;作为一种可选示例,本发明实施例提供的用户留存概率预测方法可针对游戏业务,进行具体用户在游戏业务的未来周期的留存概率的预测,图1示出了本发明实施例提供的用户留存概率预测系统的架构示意图,参照图1,该系统可以包括:游戏数据库10和预测服务器11。
其中,游戏数据库10是存储游戏业务的用户游戏数据的数据库,游戏数据可存储游戏业务中与用户相关的各类数据;具体的,作为一种示例,游戏数据库可针对每一用户存储如下数据:
用户基础数据:性别、年龄、职业、学历等;
用户登录数据:登录时长、登录次数、登录天数、登录频率等;
用户充值数据:充值金额、账户金额、充值次数、ARPU等;
用户表现数据:角色等级、装备信息、组队频次、杀怪数量等。
在本发明实施例中,游戏数据库10还可用于记录游戏在各历史周期的用户流失数据与各历史周期的活跃用户数据。其中,一个周期可以是指一天、一周、一个月、一个季度等,也可以是指预设的其他时间范围,如五天、十天、两个月等。
预测服务器11为用于本发明实施例预测用户在游戏业务的未来周期的留存概率的服务设备,其功能可以由游戏服务器来实现,也可以由单独设置的服务器来实现。其中,游戏服务器是为用户提供游戏服务的服务设备,能够与用户在游戏终端进行交互,实现游戏的登录、退出、游戏逻辑处理等功能。
在本发明实施例中,预测服务器11可与游戏数据库10相配合,对游戏业务的任一具体用户在未来周期的留存概率进行预测。其中,游戏数据库10可为用户在未来周期的留存概率的预测提供数据支持,预测服务器11可根据游戏数据库10中的用户数据来预测用户在游戏业务未来周期的留存概率。
需要说明的是,图1所示游戏数据库和预测服务器仅为业务在游戏类型下的一种系统架构示例;在任一类型的业务下,本发明实施例可提供业务数据库和预测服务器的系统架构来实现用户留存概率预测,业务数据库可以是存储用户业务数据的数据库(图1所示游戏数据库仅是业务数据库在游戏业务情境下的一种表现形式);预测服务器可以是提供业务服务的业务服务器(如图1所示预测服务器可以由游戏服务器实现),也可以是专门设置的用于进行用户留存概率预测的服务设备。
显然,图1所示的游戏数据库也可以是设置于游戏服务器中的数据存储单元,即业务数据库可以是业务服务器中的数据存储单元。
作为用户留存概率预测的可选实现,结合图1所示系统,图2示出了本发明实施例提供的用户留存概率预测方法的一种可选流程,该方法流程可应用于预测服务器,参照图2,该方法流程可以包括:
步骤S100:获取目标业务在历史周期的用户回流数据。
本发明实施例以业务的类型为游戏,进行用户留存概率预测的实现说明,目标游戏可以是需预测具体用户在未来周期的留存概率的游戏,可以是目标业务(需预测具体用户在未来周期的留存概率的业务)在游戏情境下的一种表现形式,下文针对目标游戏所展开的说明可通用至针对目标业务的描述。当然,本发明实施例所描述的用户留存概率预测方案,还可适用于其他类型的业务,比如,社交网络类型业务、电子商务网站类型业务等。
可选的,历史周期可以是相对于当前周期已发生的周期,其中,周期可以采用星期、月度、季度等时间周期,也可以采用预设的时间周期,如,5天、10天、2个月等。每个历史周期都有一个对应的基准历史周期,多个历史周期可能对应同一个基准历史周期,从时序上来说,一历史周期对应的基准历史周期位于该历史周期之前。
可选的,回流用户是指曾经使用过业务,并由于对该业务失去兴趣等种种原因,有一段时间不使用该业务,但是后来又重新使用该业务的用户。相应的,目标游戏一历史周期的回流用户可以是上一历史周期不使用目标游戏,而在本历史周期使用目标游戏的用户。
可选的,在目标游戏的运营过程中,本发明实施例可通过不断统计目标游戏在每一历史周期的用户回流数据,并从中采集至少两个历史周期的用户回流数据;可选的,该至少两个历史周期可以是时序上连续的历史周期。
可选的,一历史周期的用户回流数据可以至少包括该历史周期对应的基准历史周期内的流失用户总数以及该历史周期对应的基准历史周期内的流失用户在该历史周期回流的用户数(该历史周期对应的基准历史周期内的流失用户在该历史周期回流的用户可以认为是在该历史周期对应的基准历史周期不使用目标游戏但是在该历史周期又使用目标游戏的用户)。
步骤S110:根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率。
可选的,目标业务在一历史周期的用户回流概率=该历史周期对应的基准历史周期内的流失用户在该历史周期回流的用户数/该历史周期对应的基准历史周期内的流失用户总数。
可选的,未来周期可以是相对于当前周期未发生的周期,其中,周期可以采用星期、月度、季度等时间周期,也可以采用预设的时间周期,如,5天、10天、2个月等。在本实施例中,历史周期与未来周期所采用的时间周期是一致的,比如,都以1天作为一个周期。
可选的,作为一种示例,本发明实施例可根据至少两个历史周期的用户回流数据,预估目标游戏在未来的至少两个目标周期的用户回流概率。比如,本发明实施例根据5个历史周期的用户回流数据,可以预估目标游戏在T+1、T+2、T+3、T+4、T+5的用户回流概率。
步骤S120:获取目标业务在所述历史周期的用户留存数据。
可选的,在目标游戏的运营过程中,本发明实施例可通过不断统计目标游戏在每一历史周期的用户留存数据,并从中采集至少两个历史周期的用户留存数据,需要说明的是,本步骤中,获取目标业务的用户留存数据时采集的历史周期与之前在获取目标业务的用户回流数据时采集的历史周期相同。
可选的,一历史周期的用户留存数据可以至少包括该历史周期对应的基准历史周期的活跃用户总数以及该历史周期对应的基准历史周期的活跃用户在该历史周期留存的用户数量(该历史周期对应的基准历史周期的活跃用户在该历史周期留存的用户可以认为是在该历史周期对应的基准历史周期以及该历史周期都使用目标游戏的用户)。
步骤S130:根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率。
目标游戏在一周期的用户留存基准概率,可以是反映目标游戏在一周期下,整体用户的留存情况。其中,留存用户是指在某段时间内开始使用业务,经过一段时间后,仍然继续使用该业务的用户;示例的,目标游戏在一周期的留存用户可以是上一周期使用目标游戏,且本周期仍使用目标游戏的用户。
可选的,目标业务在一历史周期的用户留存概率=该历史周期对应的基准历史周期内的活跃用户在该历史周期对应的基准历史周期后的第一个历史周期至该历史周期中留存的用户总数/该历史周期对应的基准历史周期内的活跃用户数。
可选的,作为一种示例,本发明实施例可根据至少两个历史周期的用户留存数据,预估目标游戏在未来的至少两个目标周期的用户留存基准概率。比如,本发明实施例根据5个历史周期的用户留存数据,可以预估目标游戏在T+1、T+2、T+3、T+4、T+5的用户留存基准概率。
步骤S140:根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率。
可选的,作为一种示例,本发明实施例可根据当前周期T的流失用户在所述T之后的至少两个目标周期的用户回流概率调整当前周期T的活跃用户在所述T之后的至少两个目标周期的用户留存基准概率,得到当前周期T的活跃用户在所述T之后的至少两个目标周期的调整后的用户留存基准概率。
步骤S150:获取目标用户在所述目标周期的留存概率调整参数;
目标用户是指待预测留存概率的用户,可以是目标游戏的任一注册用户。目标用户的留存概率调整参数,可根据目标用户的各标准化用户特征,及各标准化用户特征相应的特征权重来确定,能够从一定程度上影响目标用户在未来的目标周期的留存概率预测结果。
可选的,目标用户的留存概率调整参数可以预先确定,并在进行用户留存概率预测时调用。
可选的,标准化用户特征可以是原始用户特征的标准化处理结果;原始用户特征可以如目标游戏中,与用户相关的且会影响用户在未来周期的留存概率的影响因素,例如,用户的年龄、用户的性别、用户的职业、用户的兴趣爱好、用户的登录时长,用户账户余额等。标准化处理方式可以采用本领域可用的标准化方法任一种或多种来进行,本实施例不进行任何限定。
在得到各用户的各标准化用户特征后,本发明实施例可结合目标用户在当前周期T之前的n个历史周期的留存标签(比如,留存标记为1,流失标记为0),运用COX回归方法确定出各标准化用户特征在当前周期T之后的n个目标周期的特征权重,以表示出各标准化用户特征对用户的留存概率的影响程度,即,一标准化用户特征的特征权重表示该标准化用户特征对用户的留存概率的影响程度。
步骤S160:根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述未来的目标周期的留存概率。
可选的,本发明实施例可采用目标用户的留存概率调整参数,对所述调整后的用户留存基准概率进行调整,从而得到所述目标用户在所述目标周期的留存概率,得到预测结果。
其中,所述目标用户的留存概率调整参数,能够使所预测的目标用户在目标周期的留存概率,以所述调整后的用户留存基准概率为基准,上下浮动。
本实施例提供的用户留存概率预测方法,根据目标业务在历史周期的用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率,根据目标业务在所述历史周期的用户留存数据,预估所述目标业务在所述目标周期的用户基准留存概率;根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;获取目标用户在所述目标周期的留存概率调整参数;根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。本实施例考虑用户回流对预测的用户留存概率的影响且可以进行多个未来的目标周期预测,显著提高了用户留存概率的预测准确性,提高了预测效果。
进一步的,本发明实施例还可根据所预测的目标用户在所述目标周期的留存概率进行目标用户的分类;具体的,若所预测的目标用户在所述目标周期的留存概率不低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的非流失用户,若所预测的目标用户在所述目标周期的留存概率低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的流失用户。
可选的,本发明可以同时预测多个目标用户在多个目标周期的留存概率,结合上述实施例提供的用户留存概率预测方法,图3示出了一种用户留存概率预测的较优的实现方式,具体如下:
本发明实施例可从目标游戏的运营过程中统计的目标游戏在每一历史周期的用户回流数据中,采集K个批次的n个历史周期的用户回流数据,每个批次的n个历史周期对应一个该批次的基准历史周期T(h),h=1,2,…,K-1,K;,本实施例中,获取目标业务在历史周期的用户回流数据,即获取目标业务K个批次的基准历史周期之后的n个历史周期的用户回流数据,其中,K为大于等于1的整数,n为大于等于2的整数,具体取值可以根据实际情况确定,本实施例不进行任何限定;可选的,当n大于等于2时,该n个历史周期可以是时序上连续的历史周期。
在获取目标游戏K个批次的n个历史周期的用户回流数据之后,对于一个批次h(h=1,2,…,K-1,K;)来说,基准历史周期为T(h),基准历史周期T(h)之后的第i(i=1,2,…,n-1,n;)个历史周期为T(h)+i,则T(h)期流失用户在所述T(h)之后的i个历史周期的用户回流概率表示为rih(i=1,2,…,n-1,n;h=1,2,…,K-1,K;):
针对每个批次h,可以根据该批次的n个历史周期的用户回流数据,获取该批次h的基准历史周期T(h)内的流失用户在所述T(h)之后的n个历史周期[即,T(h)+1、T(h)+2、…、T(h)+n]的用户回流概率;
其中,T(h)期流失用户在T(h)+1期用户回流概率r1h=T(h)期流失用户在T(h)+1期回流的用户数/T期流失用户总数;
T(h)期流失用户在T(h)+2期用户回流概率r2h=T(h)期流失用户在T(h)+2期回流的用户数/T期流失用户总数;
……;
T(h)期流失用户在T(h)+n-1期用户回流概率r(n-1)h=T(h)期流失用户在T(h)+n-1期回流的用户数/T期流失用户总数;
T(h)期流失用户在T(h)+n期用户回流概率rnh=T期流失用户在T(h)+n期回流的用户数/T期流失用户总数。
在获取所有批次中T(h)期流失用户在所述T(h)之后的n个历史周期的用户回流概率[共计n×K个,即,r11、r21、……、rn1;…;r1K、r2K、……、rnK]之后,根据所有批次中T(h)期流失用户在所述T(h)之后的n个历史周期的用户回流概率共计n×K个,即,r11、r21、……、rn1;…;r1K、r2K、……、rnK,使用点估计方法估计得到当前周期T的流失用户在所述T之后的n个目标周期的用户回流概率。
在一种可选示例中,可利用以下公式确定当前周期T的流失用户在所述T之后的第i个目标周期的用户回流概率:
Figure BDA0001677023220000101
可选的,本发明实施例可从目标游戏的运营过程中统计的目标游戏在每一历史周期的用户留存数据中,采集K个批次的n个历史周期的用户留存数据,每个批次的n个历史周期对应一个该批次的基准历史周期T(h),h=1,2,…,K-1,K;,本实施例中,获取目标业务在历史周期的用户留存数据,即获取目标业务K个批次的基准历史周期之后的n个历史周期的用户留存数据,其中,K为大于等于1的整数,n为大于等于2的整数,具体取值可以根据实际情况确定,本实施例不进行任何限定;可选的,当n大于等于2时,该n个历史周期可以是时序上连续的历史周期。
可选的,本实施例中,在获取目标游戏K个批次的n个历史周期的用户留存数据之后,对于一个批次h(h=1,2,…,K-1,K;)来说,基准历史周期为T(h),基准历史周期T(h)之后的第i(i=1,2,…,n-1,n;)个历史周期为T(h)+i,则T(h)期活跃用户在所述T(h)之后的i个历史周期的用户留存概率表示为Sih(i=1,2,…,n-1,n;h=1,2,…,K-1,K;):
针对每个批次h,可以根据该批次的n个历史周期的用户留存数据,获取该批次h的基准历史周期T(h)内的活跃用户在所述T(h)之后的n个历史周期[即,T(h)+1、T(h)+2、…、T(h)+n]的用户留存概率;
其中,T(h)期活跃用户在T(h)+1期的用户留存概率=T(h)期活跃用户在T(h)+1期留存的用户数/T(h)期活跃用户数;
T(h)期活跃用户在T(h)+2期的用户留存概率=T(h)期活跃用户在T(h)+1、T(h)+2期留存的用户数/T(h)期活跃用户数;
…;
T(h)期活跃用户在T(h)+n期的用户留存概率=T(h)期活跃用户在T(h)+1、T(h)+2,…,T(h)+n期留存的用户数/T(h)期活跃用户数。
在获取所有批次中T(h)期活跃用户在所述T(h)之后的n个历史周期的用户留存概率(共计n×K个,即,r11、r21、……、rn1;…;r1K、r2K、……、rnK)之后,根据所有批次中T(h)期活跃用户在所述T(h)之后的n个历史周期的用户留存概率共计n×K个,即,r11、r21、……、rn1;…;r1K、r2K、……、rnK,使用点估计方法估计得到当前周期T的活跃用户在所述T之后的n个目标周期的用户留存基准概率。
在一种可选示例中,可利用以下公式确定当前周期T的活跃用户在所述T之后的第i个未来的目标周期的用户留存基准概率:
Figure BDA0001677023220000111
在一种可选示例中,可基于以下模型,根据当前周期T的流失用户在所述T之后的第i个目标周期的用户回流概率调整当前周期T的活跃用户在所述T之后的第i个目标周期的用户留存基准概率,得到当前周期T的活跃用户在所述T之后的第i个目标周期的调整后的用户留存基准概率。
Figure BDA0001677023220000112
(i=1,2,…,n-1,n,n为大于等于2的整数)。
其中,所述
Figure BDA0001677023220000113
为当前周期T的活跃用户在所述T之后的第i个目标周期的调整后的用户留存基准概率,所述
Figure BDA0001677023220000114
为当前周期T的活跃用户在所述T之后的第i个目标周期的用户留存基准概率,所述
Figure BDA0001677023220000115
为当前周期T的流失用户在所述T之后的第i个目标周期的用户回流概率。
在一种可选示例中,可利用以下公式确定目标用户m在当前周期T之后的第i个未来的目标周期的留存概率调整参数:
Figure BDA0001677023220000116
其中,所述Ymj为第m个目标用户的第j个标准化用户特征;所述
Figure BDA0001677023220000121
为第m个目标用户的第j个标准化用户特征在当前周期T之后的第i个目标周期内的特征权重;i=1,2,…,n;m=1,2,…,N;j=1,2,…,M,其中,n为待预测的周期数量,N为目标用户的数量,M为标准化用户特征数量;
在一种可选示例中,可利用以下公式确定目标用户m在当前周期之后的第i个未来的目标周期的留存概率:
Figure BDA0001677023220000122
进一步的,本发明实施例还可根据所预测的目标用户在所述目标周期的留存概率进行目标用户的分类,具体的,若所预测的目标用户在目标周期的留存概率不低于所述调整后的用户留存基准概率,即,
Figure BDA0001677023220000123
标记所述目标用户为在所述目标周期的非流失用户(可选的,可具体标记为1;显然具体标记的数值可根据实际情况设定);若所预测的目标用户在目标周期的留存概率低于所述目标周期的留存概率,即,
Figure BDA0001677023220000124
标记所述目标用户为在所述目标周期的流失用户(可选的,可具体标记为0;显然具体标记的数值可根据实际情况设定)。
在传统的技术方案中,通常是利用机器学习模型来获取目标用户的各标准化用户特征收敛时相应的特征权重,据此获取目标用户的留存概率调整因子,并从时间序列的角度考虑时间因素对目标用户在所述目标周期的留存概率的影响,融合了在时间上会对预测结果产生影响的用户流失速率,确定了目标游戏在所述目标周期的用户留存基准概率,最后将目标用户的留存概率调整因子与目标游戏在所述目标周期的用户留存基准概率相结合,共同预测出目标用户在所述目标周期的留存概率。但是,基于上述传统技术方案,只能预测目标用户在目标业务的当前周期的下一个未来的目标周期的用户留存概率,无法进行多个未来的目标周期预测,在用户生命周期中无法进行长期管理,而且没有考虑用户回流对预测的用户留存概率的影响,导致查全率与查准率较低。
本发明基于用户回流率与COX回归方法相结合来实现的用户留存概率预测方案,相较于基于机器学习模型与生存分析方法相结合来实现的用户留存概率预测方案,具有更高的查全率与查准率。
将本发明实施例提供的用户留存概率预测方法与传统技术方案进行效果对比;以同一游戏应用场景为例,分别采用基于机器学习模型与生存分析方法相结合来预测用户留存概率的技术方案,与本发明基于用户回流率与COX回归方法相结合来实现的用户留存概率预测方案,来对目标用户在目标周期的留存概率的预测,预测效果如下:
Figure BDA0001677023220000131
仍以游戏应用场景为例,根据预测得到的目标用户在所述目标周期的留存概率,可以适当调整游戏的运营策略,以提高目标用户在所述目标周期的留存概率。
以游戏运营初期为例,当目标用户在所述目标周期的留存概率小于所述调整后的用户留存基准概率时,可以采取为目标用户增发一些新手大礼包、增设连续登陆奖励、登陆时长奖励等措施,以提高目标用户对游戏的喜好程度与依赖程度,提高目标用户在所述目标周期的留存概率,改善游戏运营效果。
以游戏运营中后期为例,目标用户大多数为老用户,更偏重的游戏的深度体验,当目标用户在所述目标周期的留存概率小于所述调整后的用户留存基准概率时,可以采取更新游戏关卡、增加游戏副本、开发新的游戏功能等措施,以提高游戏的新鲜感与趣味性,避免老用户对游戏感到乏味,提高老用户在目标周期的留存概率,改善游戏运营效果;在游戏运营中后期,也会不断增加一些新用户,当新用户在目标周期的留存概率小于所述调整后的用户留存基准概率时,可以采取类似于游戏运营初期采取的措施,提高新用户对游戏的喜好程度与依赖程度,进而提高新用户在目标周期的留存概率,改善游戏运营效果。
本发明实施例提供的用户留存概率预测方法及装置,不仅可以用于游戏业务场景中的用户留存概率预测,还可以用于多媒体资源业务、社交网络业务、咨询服务业务等各种业务场景中的用户留存概率预测。在其他业务场景中,预测服务器为用于根据业务在历史周期的用户数据来预测用户在未来的目标周期的留存概率的服务器,具体可以由已有的业务服务器(如游戏场景下的游戏服务器)来实现,也可以由单独设置的服务器来实现。
下面对本发明实施例提供的用户留存概率预测装置进行介绍,下文描述的用户留存概率预测装置可以认为是预测服务器,为实现本发明实施例提供的用户留存概率预测方法,所需设置的程序模块。下文描述的用户留存概率预测装置内容,可与上文描述的用户留存概率预测方法内容相互对应参照。
图4为本发明实施例提供的用户留存概率预测装置的结构框图,该用户留存概率预测装置可应用于预测服务器,参照图4,该用户留存概率预测装置可以包括:
用户回流数据获取模块100,用于获取目标业务在历史周期的用户回流数据;
用户回流概率预估模块110,用于根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率;
用户留存数据获取模块120,用于获取目标业务在所述历史周期的用户留存数据;
用户留存基准概率预估模块130,用于根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率;
用户留存基准概率调整模块140,用于根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;
留存概率调整参数确定模块150,用于获取目标用户在所述目标周期的留存概率调整参数;
留存概率预测模块160,用于根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。
可选的,所述用户回流数据获取模块具体用于:
从目标业务在相对于当前周期已发生的各历史周期的用户回流数据中确定至少两组用户回流数据;每组用户回流数据中包括至少两个历史周期的用户回流数据;
所述用户回流概率预估模块具体用于:
根据所述至少两组用户回流数据,确定所述目标业务在所述至少两个历史周期的用户回流概率;
根据所述目标业务在所述至少两个历史周期的用户回流概率,预估所述目标业务在所述目标周期的用户留存概率。
可选的,所述用户留存数据获取模块具体用于:
从目标业务在相对于当前周期已发生的各历史周期的用户留存数据中确定至少两组用户留存数据;每组用户留存数据中包括至少两个历史周期的用户留存数据;
所述用户留存基准概率预估模块具体用于:
根据所述至少两组用户留存数据,确定所述目标业务在所述至少两个历史周期的用户留存基准概率;
根据所述目标业务在所述至少两个历史周期的用户留存基准概率,预估所述目标业务在所述目标周期的用户留存基准概率。
可选的,所述留存概率调整参数确定模块具体用于:
获取目标用户的各标准化用户特征;
结合所述目标用户在当前周期之前的至少两个历史周期的留存标签,运用COX回归方法确定所述目标用户在当前周期之后的至少两个目标周期的特征权重;
根据所述目标用户的各标准化用户特征与所述目标用户在当前周期之后的至少两个目标周期的特征权重确定所述目标用户在当前周期之后的至少两个目标周期的留存概率调整参数。
可选的,图5示出了本发明实施例提供的用户留存概率预测装置的另一结构框图,该用户留存概率预测装置还可以包括:
标记模块170,用于若所预测的目标用户在所述目标周期的留存概率低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的流失用户;若所预测的目标用户在所述目标周期的留存概率不低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的非流失用户。
本发明公开了一种用户留存概率预测装置,根据目标业务在历史周期的用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率,根据目标业务在所述历史周期的用户留存数据,预估所述目标业务在所述目标周期的用户基准留存概率;根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;获取目标用户在所述目标周期的留存概率调整参数;根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率。本实施例考虑用户回流对预测的用户留存概率的影响且可以进行多个未来的目标周期预测,显著提高了用户留存概率的预测准确性,提高了预测效果。
本发明实施例提供的用户留存概率预测方法可应用于预测服务器,预测服务器的一种可选硬件结构框图可如图6所示,包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本发明实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,存储器3存储有程序,处理器1调用存储3所存储的程序,以实现本发明前述实施例中所述的用户留存概率预测方法的步骤。
本发明实施例还提供了一种存储介质,所述存储介质存储有适于所述处理器执行的程序,以实现本发明前述实施例中所述的用户留存概率预测方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种用户留存概率预测方法,其特征在于,包括:
获取目标业务在历史周期的用户回流数据;
根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率;
获取目标业务在所述历史周期的用户留存数据;
根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率;
根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;
获取目标用户在所述目标周期的留存概率调整参数;
根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率;
其中,所述获取目标用户在所述目标周期的留存概率调整参数包括:
获取目标用户的各标准化用户特征;
结合所述目标用户在当前周期之前的至少两个历史周期的留存标签,运用COX回归方法确定所述目标用户在当前周期之后的至少两个目标周期的特征权重,所述特征权重表示标准化用户特征对用户的留存概率的影响程度;
根据所述目标用户的各标准化用户特征与所述目标用户在当前周期之后的至少两个目标周期的特征权重确定所述目标用户在当前周期之后的至少两个目标周期的留存概率调整参数。
2.根据权利要求1所述的用户留存概率预测方法,其特征在于,所述获取目标业务在历史周期的用户回流数据包括:
从目标业务在相对于当前周期已发生的各历史周期的用户回流数据中确定至少两组用户回流数据;每组用户回流数据中包括至少两个历史周期的用户回流数据;
所述根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率包括:
根据所述至少两组用户回流数据,确定所述目标业务在所述至少两个历史周期的用户回流概率;
根据所述目标业务在所述至少两个历史周期的用户回流概率,预估所述目标业务在所述目标周期的用户留存概率。
3.根据权利要求1所述的用户留存概率预测方法,其特征在于,所述获取目标业务在所述历史周期的用户留存数据包括:
从目标业务在相对于当前周期已发生的各历史周期的用户留存数据中确定至少两组用户留存数据;每组用户留存数据中包括至少两个历史周期的用户留存数据;
根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率包括:
根据所述至少两组用户留存数据,确定所述目标业务在所述至少两个历史周期的用户留存基准概率;
根据所述目标业务在所述至少两个历史周期的用户留存基准概率,预估所述目标业务在所述目标周期的用户留存基准概率。
4.根据权利要求1所述的用户留存概率预测方法,其特征在于,还包括:
若所预测的目标用户在所述目标周期的留存概率低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的流失用户;
若所预测的目标用户在所述目标周期的留存概率不低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的非流失用户。
5.一种用户留存概率预测装置,其特征在于,包括:
用户回流数据获取模块,用于获取目标业务在历史周期的用户回流数据;
用户回流概率预估模块,用于根据所述用户回流数据,预估所述目标业务在未来的目标周期的用户回流概率;
用户留存数据获取模块,用于获取目标业务在所述历史周期的用户留存数据;
用户留存基准概率预估模块,用于根据所述用户留存数据,预估所述目标业务在所述目标周期的用户留存基准概率;
用户留存基准概率调整模块,用于根据所述用户回流概率调整所述用户留存基准概率,得到调整后的用户留存基准概率;
留存概率调整参数确定模块,用于获取目标用户在所述目标周期的留存概率调整参数;
留存概率预测模块,用于根据所述留存概率调整参数,以及所述调整后的用户留存基准概率,预测所述目标用户在所述目标周期的留存概率;
其中,所述留存概率调整参数确定模块具体用于:
获取目标用户的各标准化用户特征;
结合所述目标用户在当前周期之前的至少两个历史周期的留存标签,运用COX回归方法确定所述目标用户在当前周期之后的至少两个目标周期的特征权重,所述特征权重表示标准化用户特征对用户的留存概率的影响程度;
根据所述目标用户的各标准化用户特征与所述目标用户在当前周期之后的至少两个目标周期的特征权重确定所述目标用户在当前周期之后的至少两个目标周期的留存概率调整参数。
6.根据权利要求5所述的用户留存概率预测装置,其特征在于,所述用户回流数据获取模块具体用于:
从目标业务在相对于当前周期已发生的各历史周期的用户回流数据中确定至少两组用户回流数据;每组用户回流数据中包括至少两个历史周期的用户回流数据;
所述用户回流概率预估模块具体用于:
根据所述至少两组用户回流数据,确定所述目标业务在所述至少两个历史周期的用户回流概率;
根据所述目标业务在所述至少两个历史周期的用户回流概率,预估所述目标业务在所述目标周期的用户留存概率。
7.根据权利要求5所述的用户留存概率预测装置,其特征在于,所述用户留存数据获取模块具体用于:
从目标业务在相对于当前周期已发生的各历史周期的用户留存数据中确定至少两组用户留存数据;每组用户留存数据中包括至少两个历史周期的用户留存数据;
所述用户留存基准概率预估模块具体用于:
根据所述至少两组用户留存数据,确定所述目标业务在所述至少两个历史周期的用户留存基准概率;
根据所述目标业务在所述至少两个历史周期的用户留存基准概率,预估所述目标业务在所述目标周期的用户留存基准概率。
8.根据权利要求5所述的用户留存概率预测装置,其特征在于,还包括:
标记模块,用于若所预测的目标用户在所述目标周期的留存概率低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的流失用户;若所预测的目标用户在所述目标周期的留存概率不低于所述目标用户在所述目标周期的调整后的用户留存基准概率,标记所述目标用户为在所述目标周期的非流失用户。
9.一种预测服务器,其特征在于,包括:至少一个存储器和至少一个处理器;所述存储器存储有适于所述处理器执行的程序,以实现权利要求1-4任一项所述的用户留存概率预测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有适于处理器执行的程序,以实现权利要求1-4任一项所述的用户留存概率预测方法的步骤。
CN201810532960.0A 2018-05-29 2018-05-29 用户留存概率预测方法、装置、预测服务器及存储介质 Active CN108765010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810532960.0A CN108765010B (zh) 2018-05-29 2018-05-29 用户留存概率预测方法、装置、预测服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810532960.0A CN108765010B (zh) 2018-05-29 2018-05-29 用户留存概率预测方法、装置、预测服务器及存储介质

Publications (2)

Publication Number Publication Date
CN108765010A CN108765010A (zh) 2018-11-06
CN108765010B true CN108765010B (zh) 2021-11-23

Family

ID=64003815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810532960.0A Active CN108765010B (zh) 2018-05-29 2018-05-29 用户留存概率预测方法、装置、预测服务器及存储介质

Country Status (1)

Country Link
CN (1) CN108765010B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461188B (zh) * 2020-03-20 2023-09-12 腾讯科技(深圳)有限公司 一种目标业务控制方法、装置、计算设备及存储介质
CN111709785B (zh) * 2020-06-18 2023-08-22 抖音视界有限公司 用于确定用户留存时间的方法、装置、设备和介质
CN114430489A (zh) * 2020-10-29 2022-05-03 武汉斗鱼网络科技有限公司 一种虚拟道具的补偿方法以及相关设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844497A (zh) * 2016-03-31 2016-08-10 北京奇虎科技有限公司 用户数据的预测的方法及预测装置
CN106845722A (zh) * 2017-02-06 2017-06-13 腾讯科技(深圳)有限公司 一种预测用户量的方法和装置
CN107229995A (zh) * 2017-05-24 2017-10-03 腾讯科技(深圳)有限公司 实现游戏业务量预估的方法、装置和计算机可读存储介质
CN107832866A (zh) * 2017-09-26 2018-03-23 晶赞广告(上海)有限公司 一种流量预测方法及装置、存储介质、终端

Also Published As

Publication number Publication date
CN108765010A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN108364195B (zh) 用户留存概率预测方法、装置、预测服务器及存储介质
CN105678587B (zh) 一种推荐特征确定方法、信息推荐方法及装置
CN108765010B (zh) 用户留存概率预测方法、装置、预测服务器及存储介质
Enders Dealing with missing data in developmental research
CN112381428B (zh) 基于强化学习的业务分配方法、装置、设备及存储介质
CN109784959B (zh) 一种目标用户预测方法、装置、后台服务器及存储介质
CN107451199A (zh) 问题推荐方法及装置、设备
US10535041B2 (en) System and method of predicting community member responsiveness
US20130254294A1 (en) Method and Arrangement For Ranking Users
CN111639687B (zh) 一种模型训练以及异常账号识别方法及装置
US9864951B1 (en) Randomized latent feature learning
WO2015088504A1 (en) Result aggregation
CN111061948B (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN108074158A (zh) 共享租赁平台的用户推荐页面展示方法、装置及服务器
CN107784511A (zh) 一种用户流失预测方法及装置
CN110166498B (zh) 用户类别确定方法及装置、计算机设备及存储介质
CN107547626B (zh) 用户画像的共享方法和装置
CN112669091B (zh) 数据处理方法、装置及存储介质
CN111784173A (zh) Ab实验数据处理方法、装置、服务器及介质
CN113934920B (zh) 目标信息的推送方法、设备及存储介质
CN112767028A (zh) 一种活跃用户数量的预测方法、计算机设备及存储介质
CN111988642B (zh) 推荐视频的方法、装置、服务器和存储介质
CN111686451A (zh) 一种业务处理方法、装置、设备及计算机存储介质
CN117952122A (zh) 用户画像模型的训练方法、对话处理方法及相关设备
CN111461188A (zh) 一种目标业务控制方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant