CN116050578A - 活跃用户数预测的方法、装置、电子设备及存储介质 - Google Patents
活跃用户数预测的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116050578A CN116050578A CN202211574738.XA CN202211574738A CN116050578A CN 116050578 A CN116050578 A CN 116050578A CN 202211574738 A CN202211574738 A CN 202211574738A CN 116050578 A CN116050578 A CN 116050578A
- Authority
- CN
- China
- Prior art keywords
- target
- newly
- increased
- historical
- active
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
本发明提供了活跃用户数预测的方法、装置、电子设备及存储介质。本申请提供的技术方案,可以通过将目标新增数、目标新增留存率和目标历史活跃数输入使用历史数据建立的模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比,再根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数,从而保证更加方便地、更加高效地和更加准确地预测得到活跃数。
Description
技术领域
本申请涉及计算机科学技术领域,具体而言,涉及活跃用户数预测的方法、装置、电子设备及存储介质。
背景技术
DAU(全称为Daily Active User),日活跃用户数量。其作为反映网站、互联网应用或网络游戏的运营情况的重要指标数据,能够为渠道推广、成本预估提供一些数据支持和帮助。
现有技术中,通常要先将DAU拆分成历史老用户、当日新增用户、预测期的新增留存用户和历史回流用户等群体,再分别统计出各个群体的历史留存率并拟合出各个群体的未来留存率,然后对各个群体未来的量级做出预估并应用各个群体的未来留存率计算出未来每日的留存数据,最后汇总得出未来的DAU。现有技术方案存在老用户的量级和留存难以预估、跨周期导致准确度低和预测效率低的问题。
发明内容
本申请的目的在于提出一种活跃用户数预测的方法、装置、电子设备及存储介质,可以通过将目标新增数、目标新增留存率和目标历史活跃数输入使用历史数据建立的模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比,再根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数,从而保证更加方便地、更加高效地和更加准确地预测得到活跃数。
根据本申请实施例的一方面,公开了一种活跃用户数预测的方法,包括:
根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比;
建立用于将所述历史活跃数、所述历史新增数和所述历史新增留存率,映射为所述历史占比的模型;
预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数;
将所述目标新增数、所述目标新增留存率和所述目标历史活跃数输入所述模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比;
根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数。
在本申请的一种示例性实施例中,所述周期包括:日、周、月和季度中的任意一种。
在本申请的一种示例性实施例中,所述后一周期内新增用户的历史新增数包括:后一周期内新增用户的历史日均新增数,所述方法还包括:
获取后一周期内新增用户在对应周期内的第一日均新增活跃数;
计算所述第一日均新增活跃数除以所述历史日均新增数得到的比值,计算得到所述历史新增留存率。
在本申请的一种示例性实施例中,所述方法还包括:
获取后一周期内新增用户在对应周期内的第一新增活跃数;
计算所述第一新增活跃数除以所述历史新增数得到的比值,计算得到所述历史新增留存率。
在本申请的一种示例性实施例中,所述后一周期内新增用户的历史新增数包括:后一周期内每日新增用户的每日新增数,所述方法还包括:
获取所述每日新增数和后一周期内每日新增用户在对应周期末日的第二新增活跃数;
计算所述第二新增活跃数除以所述每日新增数得到的比值,将所有所述比值的平均值作为所述历史新增留存率。
在本申请的一种示例性实施例中,所述模型包括:线性模型、XGBoost模型和lightGBM模型中的至少一种。
在本申请的一种示例性实施例中,所述根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数,包括:
使用随机函数获取随机衰减数值,根据目标占比和所述随机衰减数值得到更新后目标占比,其中,所述随机衰减数值的取值范围为0.98至1.01;
根据所述目标新增数和所述更新后目标占比,计算得到所述目标活跃数。
根据本申请实施例的一方面,公开了一种活跃用户数预测的装置,包括:
获取模块,用于根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比;
构建模块,用于建立用于将所述历史活跃数、所述历史新增数和所述历史新增留存率,映射为所述历史占比的模型;
采集模块,用于预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数;
运算模块,用于将所述目标新增数、所述目标新增留存率和所述目标历史活跃数输入所述模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比;以及
解析模块,用于根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数。
根据本申请实施例的一方面,公开了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现上述各种可选实现方式中提供的方法。
根据本申请实施例的一方面,公开了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行上述各种可选实现方式中提供的方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
在本申请实施例所提供的技术方案中,可以通过将目标新增数、目标新增留存率和目标历史活跃数输入使用历史数据建立的模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比,再根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数,从而保证更加方便地、更加高效地和更加准确地预测得到活跃数。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
通过参考附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。
图1示出了根据本申请一个实施例的一种活跃用户数预测的方法的流程图。
图2示出了根据本申请一个实施例的一种计算历史新增留存率的方法的流程图。
图3示出了根据本申请一个实施例的一种计算历史新增留存率的方法的流程图。
图4示出了根据本申请一个实施例的一种计算历史新增留存率的方法的流程图。
图5示出了根据本申请一个实施例的根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数的流程图。
图6示出了根据本申请一个实施例的一种使用数学模型实现上述活跃用户数预测的方法的流程图。
图7示出了根据本申请一个实施例的一种使用机器模型实现上述活跃用户数预测的方法的流程图。
图8示出了根据本申请一个实施例的一种活跃用户数预测的装置。
图9示出了根据本申请一个实施例的一种用于实现上述活跃用户数预测的方法的电子设备。
图10示出了根据本申请一个实施例的一种用于实现上述活跃用户数预测的方法的计算机可读存储介质。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本申请的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本申请的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本申请提供了一种活跃用户数预测的方法,该方法可以应用于生命周期处于成熟期的平台或应用。通过应用该方法,可以通过将目标新增数、目标新增留存率和目标历史活跃数输入使用历史数据建立的模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比,再根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数,从而保证更加方便地、更加高效地和更加准确地预测得到活跃数。
参考图1所示,该活跃用户数预测的方法的步骤包括:
步骤S110:根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比。
在一具体的实施例中,历史数据存储于服务器中,同时服务器存储有历史数据所存储时的日期信息和时间信息。当确定周期的日数后,可以确定周期内的活跃用户,并可以统计出周期内活跃用户的历史活跃数、后一周期内的新增用户的历史新增数和后一周期内新增用户在对应周期内的第一新增活跃数。然后可以计算出后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比。
在本实施例中,例如周期为5月,后一周期为6月。5月内活跃用户的历史活跃数指的是5月内活跃用户的活跃数据,6月内新增用户的历史新增数指的是6月内新增用户的新增数据,6月内新增用户在6月内的历史新增留存率指的是6月内新增用户在6月活跃用户中的比例,6月内新增用户在6月内活跃用户中的历史占比指的是6月内新增用户在6月内活跃用户中的比例。
步骤S120:建立用于将历史活跃数、历史新增数和历史新增留存率,映射为历史占比的模型。
在一具体的实施例中,根据历史数据,可以得到活跃用户的留存和新增用户的留存之间存在比较高的相关性。在建立模型时,只考虑新增用户的留存(也就是历史新增留存率),就可以得到比较准确的结果。
在一具体的实施例中,在获得历史活跃数、历史新增数、历史新增留存率和历史占比后,可以使用Python中的第三方库对以上数据进行拟合得到模型。
步骤S130:预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数。
在一具体的实施例中,目标新增数和目标新增留存率可以是业务根据服务器所存储的历史数据推测得到的;目标历史活跃数可以是从服务器所存储的历史数据中得到的历史活跃数。
在本实施例中,例如目标周期为10月,目标周期前一周期为9月。10月内新增用户的目标新增数指的是10月内新增用户的新增数据,10月内新增用户在10月的目标新增留存率指的是10月内新增用户在10月活跃的比例,9月内活跃用户的目标历史活跃数指的是9月内活跃用户的活跃数据。
步骤S140:将目标新增数、目标新增留存率和目标历史活跃数输入模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比。
在一具体的实施例中,根据历史数据,可以得到活跃用户的留存和新增用户的留存之间存在比较高的相关性。在使用模型时,只考虑新增用户的留存(也就是目标新增留存率),就可以得到比较准确的结果。
在一具体的实施例中,目标新增数对应于模型建立时的历史新增数,目标新增留存率对应于模型建立时的历史新增留存率,目标历史活跃数对应于模型建立时的历史活跃数,将以上数据输入模型,可以得到对应于模型建立时的目标占比。
在本实施例中,例如目标周期为10月,10月内新增用户在10月内活跃用户中的目标占比指的是10月内新增用户在10月内活跃用户中的占比。
步骤S150:根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数。
在一具体的实施例中,计算目标新增数除以目标占比得到的结果,计算得到目标活跃数。例如,目标新增数为2000,目标占比为20%,计算得到的目标活跃数为10000。
在本实施例中,例如目标周期为10月,10月内活跃用户的目标活跃数指的是10月内活跃用户的活跃数据。
在本实施例中,在目标周期内,活跃用户中一定存在新增用户。通过对历史数据的分析,可以发现新增用户在活跃用户的占比中存在稳定性。在比较成熟的业务体系和比较大的量级情况下,新增用户的占比一般比较稳定。同时,一款产品在一般情况下对于新老用户的留存吸引力是产生同向作用的,新增用户的占比会在一定范围内波动而不会随着留存的变化而发生大幅变化。
在本实施例中,当新增用户成倍变化时或新老用户留存变化不同时,新增用户的占比会发生较大变化。以上情况的发生属于小概率事件,难以用任何模型进行准确的预估,所以不需要特别考虑。
在一具体的实施例中,该周期包括:日、周、月和季度中的任意一种。在本实施例中,周期根据需要还可以为年,此处不进行具体限制。同时,以上的周、月、季度和年,根据需要可以是自然周、自然月、自然季度和自然年,还可以非自然周、非自然月、非自然季度和非自然年。以月为例,自然月是2022年11月1日至2022年11月30日;非自然月是2022年10月15日至2022年11月14日。
在一具体的实施例中,后一周期内新增用户的历史新增数包括:后一周期内新增用户的历史日均新增数。在本实施例中,计算历史新增数除以周期的日数得到的结果,可以得到历史日均新增数。例如,历史新增数为21000,周期为7,历史日均新增数为3000。
在本实施例中,例如后一周期为7月,7月内新增用户的历史日均新增数指的是7月内新增用户在7月内新增的新增数据的平均值。
参考图2所示,该活跃用户数预测的方法的步骤还包括:
步骤S210:获取后一周期内新增用户在对应周期内的第一日均新增活跃数。
在一具体的实施例中,可以统计后一周期内新增用户在对应周期内的第一新增活跃数。计算该第一新增活跃数除以周期的日数得到的结果,可以得到第一日均新增活跃数。例如,第一新增活跃数为7000,周期为7,第一日均新增活跃数为1000。
在本实施例中,例如后一周期为7月,对应周期也为7月。7月内新增用户在7月内的第一日均新增活跃数指的是7月内新增用户在7月内活跃的活跃数据的平均值。
步骤S220:计算第一日均新增活跃数除以历史日均新增数得到的比值,计算得到历史新增留存率。
在一具体的实施例中,历史日均新增数为2000,第一日均新增活跃数为1600,计算得到的历史新增留存率为80%。
参考图3所示,该活跃用户数预测的方法的步骤还包括:
步骤S310:获取后一周期内新增用户在对应周期内的第一新增活跃数。
在一具体的实施例中,可以在周期(例如7天)确定后,通过服务器所存储的历史数据,统计得到后一周期内新增用户在对应周期内的第一新增活跃数。
在本实施例中,例如后一周期为7月,对应周期也为7月。7月内新增用户在7月内的第一新增活跃数指的是7月内新增用户在7月内活跃的活跃数据。
步骤S320:计算第一新增活跃数除以历史新增数得到的比值,计算得到历史新增留存率。
在一具体的实施例中,第一新增活跃数为20000,历史新增数为25000,计算得到的历史新增留存率为80%。
在一具体的实施例中,后一周期内新增用户的历史新增数包括:后一周期内每日新增用户的每日新增数。在本实施例中,周期内每日都存在新增用户,可以得到每日新增用户的每日新增数。例如,周期的日数为7,该周期每日新增用户的第二新增数依次为1000、900、800、1100、1200、1000、800。
在本实施例中,例如后一周期为2022年第16周。2022年第16周内每日新增用户的每日新增数指的是2022年第16周每日新增用户在2022年第16周每日新增的新增数据。
参考图4所示,该活跃用户数预测的方法的步骤还包括:
步骤S410:获取每日新增数和后一周期内每日新增用户在对应周期末日的第二新增活跃数。
在一具体的实施例中,每日新增数和第二新增活跃数可以从服务器所存储的历史数据中统计得到。
在本实施例中,例如后一周期为2022年第16周,对应周期为2022年第16周。2022年第16周内每日新增用户在2022年第16周末日的第二新增活跃数指的是2022年第16周内每日新增用户在2022年第16周的周六活跃的活跃数据。
步骤S420:计算第二新增活跃数除以每日新增数得到的比值,将所有比值的平均值作为历史新增留存率。
在一具体的实施例中,每日新增数依次为1000、1000、1200,第二新增活跃数依次为800、700、900,比值依次为80%、70%、75%,则历史新增留存率为75%。
在一具体的实施例中,该模型包括:线性模型、XGBoost模型和lightGBM模型中的至少一种。在本实施例中,除了以上模型,模型也可以是其他的数学模型或机器模型,此处不进行具体限制。
参考图5所示,根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数的步骤,包括:
步骤S510:使用随机函数获取随机衰减数值,根据目标占比和随机衰减数值得到更新后目标占比,其中,随机衰减数值的取值范围为0.98至1.01。
在一具体的实施例中,实际的目标占比通常不是某一定值,而是在不断波动。例如,目标占比为80%,实际的目标占比可以为81%。
步骤S520:根据目标新增数和更新后目标占比,计算得到目标活跃数。
在一具体的实施例中,通过随机函数获取随机衰减数值再根据目标占比和随机衰减数值得到更新后目标占比在一定程度上更加能够反映出实际的目标占比,同时所计算得到的目标活跃数也在一定程度上更加准确。例如,更新后目标占比为75%,目标新增数为3000,计算得到的目标活跃数为4000。
在一具体的实施例中,参考图6所示,本申请所提供的活跃用户数预测的方案,可以使用数学模型实现。其中,该方案具体如下:
步骤S610:根据历史数据,获取历史活跃数、历史新增数、历史新增留存率和历史占比。
在本实施例中,可以对所存储的历史数据进行统计或运算,以供后续建立数学模型所使用。
步骤S620:通过数学模型,将历史活跃数、历史新增数和历史新增留存率映射为历史占比。
在本实施例中,数学模型的构建,可以使用数据分析工具实现。
步骤S630:将预测的目标新增数、目标新增留存率和所获取的目标历史活跃数输入数学模型,得到目标占比。
在本实施例中,目标新增数和目标新增留存率可以是根据历史数据所推测得到的,目标历史活跃数可以根据历史数据统计或计算得到。
步骤S640:根据目标占比和随机函数所获取的随机衰减数值得到更新后目标占比,根据目标新增数和更新后目标占比,计算得到目标活跃数。
在本实施例中,通过随机函数获取随机衰减数值以得到更新后目标占比,可以让预测更加接近真实情况,进而提高准确度。
步骤S650:使用更新后目标占比和目标新增数,计算出目标活跃数。
在本实施例中,使用更新后目标占比和目标新增数计算出目标活跃数的方式,相对于直接计算目标活跃数的方式更加准确。
在本实施例中,根据实际需要,可以使用其他特征计算目标活跃数。
在一具体的实施例中,参考图7所示,本申请所提供的活跃用户数预测的方案,可以使用机器模型实现。其中,该方案包括:步骤S710:数据准备;步骤S720:模型训练;步骤S730:模型预测;步骤S740:计算结果。
在本实施例中,步骤S710:数据准备,具体如下:
获取模型训练时所要用到的数据,可以包括周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比。
在本实施例中,步骤S720:模型训练,具体如下:
使用数据进行模型的训练。通过模型的不断迭代,寻找最优参数。当最优参数确定后,模型训练完成。
在本实施例中,步骤S730:模型预测,具体如下:
使用目标周期的预测参数,并使用训练完成的模型预测得到目标占比。
在本实施例中,步骤S740:计算结果,具体如下:
根据得到的目标占比和预测参数中的目标新增数,得到目标活跃数。
在本实施例中,根据实际需要,可以使用的机器模型包括但不限于XGBoost模型和lightGBM模型。根据实际需要,可以使用PCA降维或随机森林剪枝选择其他特征进行模型的训练。同时通过机器模型的准确度优于数学模型。
本申请所提供的的技术方案,可以通过将目标新增数、目标新增留存率和目标历史活跃数输入使用历史数据建立的模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比,再根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数,从而保证更加方便地、更加高效地和更加准确地预测得到活跃数。
本申请提供了一种活跃用户数预测的装置,参考图8所示,该装置可以包括:获取模块810,构建模块820,采集模块830,运算模块840和解析模块850,其中:
获取模块810,用于根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比;
构建模块820,用于建立用于将历史活跃数、历史新增数和历史新增留存率,映射为历史占比的模型;
采集模块830,用于预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数;
运算模块840,用于将目标新增数、目标新增留存率和目标历史活跃数输入模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比;以及
解析模块850,用于根据目标新增数和目标占比,计算得到目标周期内活跃用户的目标活跃数。
在一具体的实施例中,该装置还用于:
获取后一周期内新增用户在对应周期内的第一日均新增活跃数;
计算第一日均新增活跃数除以历史日均新增数得到的比值,计算得到历史新增留存率。
在一具体的实施例中,该装置还用于:
获取后一周期内新增用户在对应周期内的第一新增活跃数;
计算第一新增活跃数除以历史新增数得到的比值,计算得到历史新增留存率。
在一具体的实施例中,该装置还用于:
获取每日新增数和后一周期内每日新增用户在对应周期末日的第二新增活跃数;
计算第二新增活跃数除以每日新增数得到的比值,将所有比值的平均值作为历史新增留存率。
在一具体的实施例中,解析模块850还用于:
使用随机函数获取随机衰减数值,根据目标占比和随机衰减数值得到更新后目标占比,其中,随机衰减数值的取值范围为0.98至1.01;
根据目标新增数和更新后目标占比,计算得到目标活跃数。
下面参考图9来描述根据本申请实施例的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930。
其中,存储单元存储有程序代码,程序代码可以被处理单元910执行,使得处理单元910执行本说明书上述示例性方法的描述部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元910可以执行如图1中所示的各个步骤。
存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(ROM)9203。
存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备900也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。输入/输出(I/O)接口950与显示单元940相连。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
在本申请的示例性实施例中,还提供了一种计算机可读存储介质,参考图10所示,其上存储有计算机可读指令,当计算机可读指令被计算机的处理器执行时,使计算机执行上述方法实施例部分描述的方法。
根据本申请的一个实施例,参考图10所示,还提供了一种用于实现上述方法实施例中的方法的程序产品1000,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如JAVA、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由所附的权利要求指出。
Claims (10)
1.一种活跃用户数预测的方法,其特征在于,包括:
根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比;
建立用于将所述历史活跃数、所述历史新增数和所述历史新增留存率,映射为所述历史占比的模型;
预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数;
将所述目标新增数、所述目标新增留存率和所述目标历史活跃数输入所述模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比;
根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数。
2.根据权利要求1所述的方法,其特征在于,所述周期包括:日、周、月和季度中的任意一种。
3.根据权利要求1所述的方法,其特征在于,所述后一周期内新增用户的历史新增数包括:后一周期内新增用户的历史日均新增数,所述方法还包括:
获取后一周期内新增用户在对应周期内的第一日均新增活跃数;
计算所述第一日均新增活跃数除以所述历史日均新增数得到的比值,计算得到所述历史新增留存率。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取后一周期内新增用户在对应周期内的第一新增活跃数;
计算所述第一新增活跃数除以所述历史新增数得到的比值,计算得到所述历史新增留存率。
5.根据权利要求1所述的方法,其特征在于,所述后一周期内新增用户的历史新增数包括:后一周期内每日新增用户的每日新增数,所述方法还包括:
获取所述每日新增数和后一周期内每日新增用户在对应周期末日的第二新增活跃数;
计算所述第二新增活跃数除以所述每日新增数得到的比值,将所有所述比值的平均值作为所述历史新增留存率。
6.根据权利要求1所述的方法,其特征在于,所述模型包括:线性模型、XGBoost模型和lightGBM模型中的至少一种。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数,包括:
使用随机函数获取随机衰减数值,根据目标占比和所述随机衰减数值得到更新后目标占比,其中,所述随机衰减数值的取值范围为0.98至1.01;
根据所述目标新增数和所述更新后目标占比,计算得到所述目标活跃数。
8.一种活跃用户数预测的装置,其特征在于,包括:
获取模块,用于根据历史数据,获取周期内活跃用户的历史活跃数、后一周期内新增用户的历史新增数、后一周期内新增用户在对应周期内的历史新增留存率和后一周期内新增用户在对应周期内活跃用户中的历史占比;
构建模块,用于建立用于将所述历史活跃数、所述历史新增数和所述历史新增留存率,映射为所述历史占比的模型;
采集模块,用于预测目标周期内新增用户的目标新增数和目标周期内新增用户在目标周期的目标新增留存率,并获取目标周期前一周期内活跃用户的目标历史活跃数;
运算模块,用于将所述目标新增数、所述目标新增留存率和所述目标历史活跃数输入所述模型,得到目标周期内新增用户在目标周期内活跃用户中的目标占比;以及
解析模块,用于根据所述目标新增数和所述目标占比,计算得到目标周期内活跃用户的目标活跃数。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211574738.XA CN116050578A (zh) | 2022-12-08 | 2022-12-08 | 活跃用户数预测的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211574738.XA CN116050578A (zh) | 2022-12-08 | 2022-12-08 | 活跃用户数预测的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116050578A true CN116050578A (zh) | 2023-05-02 |
Family
ID=86119054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211574738.XA Pending CN116050578A (zh) | 2022-12-08 | 2022-12-08 | 活跃用户数预测的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116050578A (zh) |
-
2022
- 2022-12-08 CN CN202211574738.XA patent/CN116050578A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360012B (zh) | 广告投放渠道的选择方法及装置、存储介质、电子设备 | |
CN109272348B (zh) | 活跃用户数量确定方法及装置、存储介质和电子设备 | |
CN110362761B (zh) | 一种基于网页地址监听的网页跳转方法、装置和电子设备 | |
US11645122B2 (en) | Method, device, and computer program product for managing jobs in processing system | |
US11468349B2 (en) | POI valuation method, apparatus, device and computer storage medium | |
US11580957B1 (en) | Method for training speech recognition model, method and system for speech recognition | |
CN111372130B (zh) | 一种用户在线时长统计方法、装置、电子设备及存储介质 | |
CN112348592A (zh) | 广告推荐方法、装置、电子设备及介质 | |
CN115730755A (zh) | 一种双碳目标实现路径规划方法、装置、终端设备及介质 | |
CN113015010B (zh) | 推送参数确定方法、装置、设备及计算机可读存储介质 | |
CN110889725A (zh) | 在线广告ctr预估方法、装置、设备及存储介质 | |
CN116756522B (zh) | 概率预报方法、装置、存储介质及电子设备 | |
CN111582649B (zh) | 基于用户app独热编码的风险评估方法、装置和电子设备 | |
CN110363583B (zh) | 一种基于位置信息创建用户消费行为标签的方法、装置和电子设备 | |
CN117273376A (zh) | 一种电量预测方法、系统、计算机设备和存储介质 | |
CN116050578A (zh) | 活跃用户数预测的方法、装置、电子设备及存储介质 | |
CN112686705B (zh) | 一种预测销售效果数据的方法、装置和电子设备 | |
CN104731788A (zh) | 推广信息的处理方法及设备 | |
CN113094602B (zh) | 酒店推荐方法、系统、设备及介质 | |
US20220043732A1 (en) | Method, device, and program product for managing computing resource in storage system | |
CN113592263A (zh) | 基于动态资源归还增比的资源归还增量预测方法和装置 | |
CN113780703A (zh) | 一种指标调整方法和装置 | |
CN111680858B (zh) | 一种管理业务推广策略的方法、装置和电子设备 | |
CN111131354A (zh) | 用于生成信息的方法和装置 | |
CN112036607B (zh) | 基于出力水平的风电出力波动预测方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |