CN112767056B - 业务数据预测方法、装置、计算机设备和存储介质 - Google Patents

业务数据预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112767056B
CN112767056B CN202110154853.0A CN202110154853A CN112767056B CN 112767056 B CN112767056 B CN 112767056B CN 202110154853 A CN202110154853 A CN 202110154853A CN 112767056 B CN112767056 B CN 112767056B
Authority
CN
China
Prior art keywords
data
service
predicted
dimension
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110154853.0A
Other languages
English (en)
Other versions
CN112767056A (zh
Inventor
丁冲
陈龙
王憧生
高岩
李庆敏
侯燕华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110154853.0A priority Critical patent/CN112767056B/zh
Publication of CN112767056A publication Critical patent/CN112767056A/zh
Application granted granted Critical
Publication of CN112767056B publication Critical patent/CN112767056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种业务数据预测方法、装置、计算机设备和存储介质。方法包括:获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;查找数据维度对应的预测模型,基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。通过上述方法能够针对上线阶段,得到准确性高的业务数据预测结果。

Description

业务数据预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据预测技术领域,特别是涉及一种业务数据预测方法、装置、计算机设备和存储介质。
背景技术
随着信息技术的发展,在越来越多的场景中涉及到数据预测,数据预测是指通过既往数据推测未来时间内出现的数据。通过数据预测,能够为制定未来目标提供信息指导,传统的数据预测一般是基于预测模型来实现的。
常规的预测模型需要积累足够的历史数据,越复杂的模型,参数越多,越是依赖充足的数据。这种基于预测模型和历史数据进行预测的方式只适用于上线时间较长的业务,例如一般游戏业务上线初期的数据很少,对于不同的上线阶段,通过上述方式无法得到准确的数据预测结果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在不同上线阶段都具有良好准确性的业务数据预测方法、装置、计算机设备和存储介质。
一种业务数据预测方法,方法包括:
获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;
根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;
查找数据维度对应的预测模型;
基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
一种业务数据预测装置,装置包括:
信息获取模块,获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;
目标业务数据确定模块,用于根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;
预测模型查找模块,用于查找数据维度对应的预测模型;
预测模块,用于基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;
根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;
查找数据维度对应的预测模型;
基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;
根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;
查找数据维度对应的预测模型;
基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
上述业务数据预测方法、装置、计算机设备和存储介质,通过获取待预测业务数据对应的上线阶段信息,基于上线阶段信息对应的业务数据需求以及待预测业务数据的数据维度,待预测业务数据在数据维度下对应的目标业务数据,基于数据维度对应的预测模型,对数据维度对应目标业务的目标业务数据进行预测处理,得到待预测业务数据的数据预测结果,能够在针对上线阶段和数据维度,有针对性地进行预测处理,有利于避免维度之间的数据干扰,能够针对上线阶段,够得到准确性高的数据预测结果。
附图说明
图1为一个实施例中业务数据预测方法的应用环境图;
图2为一个实施例中业务数据预测方法的流程示意图;
图3为另一个实施例中业务数据预测方法的流程示意图;
图4为一个实施例中业务数据预测方法的数据交互示意图;
图5为另一个实施例中业务数据预测方法的任务配置界面示意图;
图6为一个实施例中业务数据预测方法的API服务的架构示意图;
图7为另一个实施例中业务数据预测方法的不同上线阶段和数据维度预测模型对应业务数据的示意图;
图8为一个实施例中业务数据预测方法的日留存预测数据的曲线图;
图9为一个实施例中业务数据预测方法的KPI对应预测数据的曲线示意图;
图10为另一个实施例中业务数据预测方法的日留存预测数据的数据列表示意图;
图11为一个实施例中业务数据预测方法的日留存预测数据修改后的曲线图;
图12为一个实施例中业务数据预测装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的业务数据预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104获取终端102上传的待预测业务的待预测数据的维度和上线阶段信息,根据上线阶段信息对应的业务数据需求,确定每一数据维度对应的目标业务,目标业务包括对标业务和待预测业务中的至少一个;服务器104从数据库中获取目标业务的目标业务数据,针对每一数据维度,基于数据维度对应的预测模型,对数据维度对应目标业务的目标业务数据进行预测处理,得到每一数据维度的预测数据;根据每一数据维度的预测数据,得到待预测业务的数据预测结果,并将预测结果反馈至终端102。其中,终端102可以是安装有BI(Business Intelligence,商业智能)工具的终端,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种业务数据预测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤202至步骤208。
步骤202,获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度。
待预测业务数据是指需要对未来的数据趋势和水平进行预测的业务对应的预测数据。待预测业务可以是已经上线的业务,也可以是未上线的业务,待预测业务的已有数据和预测数据都可以以时序数据的方式呈现。对于已经上线的业务,其上线时段的数据可以构成该业务的时序数据,同理,预测得到的数据也是时序数据,时序数据可以通过序列矩阵的方式来记录。
上线阶段信息是指待预测业务当前所处的上线阶段的描述信息,上线阶段用来表征该待预测业务是否具有在预测过程中可供参考的数据。上线阶段包括上线前、上线初期(例如上线时长不大于2天)、上线中期(例如上线时长大于2天且小于14天)以及上线后期(例如上线14天以后)。
对于每一个待测试业务,可以通过的不同的数据维度来进行数据预测。在实施例中,待测试业务的数据维度可以是一个,也可以是两个或两个以上。以游戏业务为例,游戏业务的数据维度可以包括每日新增的用户、用户的留存率以及用户的平均消费金额等。
步骤204,根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据。
对于不同的上线阶段具有不同的业务数据需求,业务数据需求是指用于进行数据预测所需数据的数据来源,需要说明的是,不同维度的业务数据需求可能存在差异。因此待预测业务的每一数据维度对应的目标业务可能相同也可能不同。具体需要基于有业务数据需求来确定。
业务数据需求可以预先设定。在一个实施例中,以包括新增用户维度和用户留存率维度的游戏业务为例,上线前的新增用户维度和用户留存率维度的业务数据需求均为对标业务的数据;上线初期的新增用户维度的业务数据需求为对标业务和待预测业务的数据,用户留存率维度的业务数据需求为对标业务的数据;上线中期的新增用户维度的业务数据需求为对标业务和待预测业务的数据,用户留存率维度的业务数据需求为待预测业务的数据;上线后期的新增用户维度和用户留存率维度的业务数据需求均为待预测业务的数据。
在一个实施例中,如图3所示,根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据包括步骤302至步骤304。
步骤302,根据上线阶段信息对应的业务数据需求,确定目标业务,目标业务包括待预测业务的对标业务和待预测业务中的至少一个;
步骤304,从目标业务的业务数据中,获取数据维度对应的目标业务数据。
待预测业务的对标业务是指与待测试业务在某些数据维度上具有相同或相似的数据表现的业务。以游戏业务为例,对应的对标业务可以是相同品类、相同玩法题材、或是相同风格的游戏。例如,动作角色扮演类游戏ARPG、大型多人在线游戏MMO、卡牌游戏、枪战游戏、塔防游戏以及休闲益智游戏等。
若上线阶段信息对应的业务数据需求包括待预测业务数据需求,则将待预测业务作为目标业务。
若上线阶段信息对应的业务数据需求包括待预测业务需求和对标业务数据需求,则将对标业务以及待预测业务作为目标业务。
若上线阶段信息对应的业务数据需求中不包括对标业务数据需求,则将与待预测业务作为目标业务。
业务数据需求用于表征进行数据预测所需数据的数据来源,不同的上线阶段可以对应不同的业务数据需求,从而对应不同的目标业务。在一个实施例中,业务数据需求还可以包括每一维度所需的对标业务数据。
在实施例中,可以在业务数据需求中预先声明上线阶段信息是否需要对标业务数据,如果不需要,即业务数据需求中不包括对标业务数据需求,则将待预测业务作为目标业务。如果需要,即业务数据需求包括对标业务数据需求,则将对标业务以及待预测业务作为目标业务或者将对标业务作为目标业务。需要说明的是,对于上线前的业务数据需求,由于待预测业务没有对应的业务数据,一般只需要对标业务数据即可,但在需要对标业务数据的情况下,将对标业务以及待预测业务作为目标业务不影响方案的执行。
步骤206,查找数据维度对应的预测模型。
预测模型需要根据数据维度的不同来进行选择,不同的预测模型具有不同的数据处理逻辑。例如新增用户维度和用户留存率维度分别使用不同的预测模型。
步骤208,基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
在一个实施例中,同一维度的不同上线阶段也可以采用不同的预测模型进行预测处理。例如,对于新增用户维度,上线前、上线初期、上线中期以及上线后期这四个上线阶段,可以分别使用不同的预测模型进行预测处理,对于用户留存率维度,上线前和上线初期可以使用同一个预测模型进行预测处理,上线中期和上线后期可以使用同一个预测模型进行预测处理。
针对每一个数据维度,均使用该维度对应的预测模型对该维度对应的目标业务数据进行预测处理,实现每一维度的数据预测,一方面可以实现数据解耦,简化单一维度的数据预测处理过程。另一方面,避免不同数据维度之间的数据干扰,得到每一数据维度的准确预测数据。
通过归集各个数据维度的预测数据,可以实现各个维度的数据融合,得到待预测业务的整体预测结果。例如,基于新增用户维度和用户留存率维度的预测结果,以新增用户维度对应每日新增用户的数量为例,可以得到每日活跃用户的数量。更进一步的,基于每日活跃用户的平均付费金额,可以更进一步得到每日预估收益等。
上述业务数据预测方法,通过获取待预测业务数据对应的上线阶段信息,基于上线阶段信息对应的业务数据需求以及待预测业务数据的数据维度,待预测业务数据在数据维度下对应的目标业务数据,基于数据维度对应的预测模型,对数据维度对应目标业务的目标业务数据进行预测处理,得到待预测业务数据的数据预测结果,能够在针对上线阶段和数据维度,有针对性地进行预测处理,有利于避免维度之间的数据干扰,针对不同的上线阶段,都能够得到准确性高的数据预测结果。
在一个实施例中,方法还包括:调用API(Application Programming Interface,应用程序接口)服务的接口,获取待预测业务数据在数据维度下对应的目标业务数据;基于封装于API服务的预测模型,按数据维度对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
基于API服务的接口,可以从对应的业务数据库(如记录业务指标的指标数据库)中获取与待预测业务数据在数据维度下对应的目标业务数据,通过将预测模型封装至API服务,可以在API服务中实现数据预测。
在一个实施例中,如图4所示,用户可以通过安装有BI工具的BI终端发起任务,发起的任务可以是待预测业务的数据预测任务,数据预测任务的数据输入界面如图5所示,可以包括待预测业务的名称及其相关描述信息、预测开始日期、各个维度的对标业务、对标业务的类型以及期望值等,BI终端基于数据预测任务向API服务传递参数,API服务基于接口向指标数据库查询数据,得到所需的目标业务数据,基于API服务的接口,可以实现对指标数据库的数据的读写,然后API服务基于封装的预测模型,按预测模型对应数据维度对该数据维度对应的目标业务数据进行预测处理,从而得到每一维度的预测数据,API服务还可以将每一维度的预测数据进行整合,将整合的预测结果反馈至BI终端,以便用户进行理解和调整。
在其中一个实施例中,BI终端和API服务之间通过统一协议交互,实现了API服务的插拔式接入,从而把前端展示和预测模型解耦合。通过这样的处理,有两个优点,第一是预测模型可以随时更新而不影响前端的功能,给算法的扩展带来极大的便利;第二是通过API服务进行数据处理,由于API服务可以封装复杂的运算逻辑,因此可以实现远超一般BI工具的功能,如调用复杂的预测模型进行预测、处理复杂的分支逻辑等。此外,API服务可以通过使用R-plumber,部署在独立服务器上。R-plumber中的R是指计算机语言,plumber是一个基于HTTP(Hypertext Transfer Protocol,超文本传输协议)协议的REST(Representational State Transfer,表现层状态转化)API服务框架,可以将离线开发的预测模型函数直接封装为线上API服务。采取前端+API服务+数据库的增强分析模式,达到交互式分析功能,从而为运营决策提供高效、高质量的数据参考。
在一个实施例中,数据维度包括新增用户维度。如图5所示,基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果包括:基于与新增用户维度对应的预测模型,对新增用户维度对应的目标业务数据进行数据拟合,得到拟合参数;根据拟合参数,得到新增用户维度的预测序列,预测序列包括每一时间点对应的新增用户预测数据。
预测序列包括每一时间点对应的新增用户预测数据。预测序列的时间点是指时序数据的排列间隔点,具体可以每个小时或是每一天等,具体可以根据实际需要进行设定。以新增用户维度对应每日的新增用户量为例,新增用户维度对应的目标业务数据可以包括ind-上线天数,ivalue-新增参考值构成的列表。基于数模型formula(ivalue=a*ind-b),基于列表中上线天数和新增参考值的实际数据,估计得到参数a和b的取值,参数a和b即为拟合参数,基于确定了拟合参数a和b的指数模型,通过Levenberg-Marquardt(一种寻找使得函数值最小的参数向量的最优化算法)算法,得到预测序列。在上述实施例中,通过数据拟合得到拟合参数,能够得到准确的预测序列。
在其中一个实施例中,可以先对获取的目标业务数据进行过滤和处理,例如对波动过大(超出允许波动范围)的游戏数据进行剔除或数据修正,以便提高目标业务数据的准确性。
在其中一个实施例中,还是以数据维度包括新增用户维度为例,若目标业务包括待预测业务的对标业务,则用于数据拟合的目标业务数据为对标业务在新增用户维度的历史业务数据。具体可以对应待预测业务的上线阶段为上线后期的情况。
在此情况下,根据拟合参数,得到新增用户维度的预测序列包括:根据拟合参数,得到初步预测序列。基于待预测业务的实际业务数据或输入的新增用户期望数据,对初步预测序列进行等比例调整,得到更新预测序列。
对于待预测业务的上线阶段为上线前的情况,可以基于输入的新增用户期望数据对初步预测序列进行等比例调整,得到更新预测序列。在实施例中,可以获取用户输入的30天累积新增用户总量,等比例调整初步预测序列,保证累积30天用户总量符合预测序列,得到更新预测序列。
对于待预测业务的上线阶段为上线初期(以上线时长不大于2天为例)的情况,可以基于待预测业务的实际业务数据对初步预测序列进行等比例调整,得到更新预测序列。在实施例中,可以获取待预测业务前2天累计的实际新增用户总量,等比例调整初步预测序列,保证前2天累计的实际新增用户总量符合预测序列,得到更新预测序列。
在一个实施例中,对于待预测业务的上线阶段为上线中期(以上线时长大于2天小于14天为例)的情况,初步预测序列的更新还包括:
计算初步预测序列中每一预测值占初步预测序列的累加值的比例。获取待预测业务每一时间点对应的新增用户量。针对每一时间点的新增用户量,确定与新增用户量具有相同时间点的目标预测值,得到新增用户量与目标预测值对应比例的比值结果。根据每一新增用户量对应的比值结果,确定基准比值。根据基准比值,对初步预测序列进行调整,得到更新预测序列。
举例来说,以初步预测序列包括第1天到第90天的预测数据为例,可以获取待预测业务上线前i天数据ua(day1),ua(day2),…ua(dayi)计算初步预测序列每日预测值占90天累积预测值的总和的比例pct(day1),pct(day2)...pct(day90),然后计算ua(day1)/pct(day1),…,ua(dayi)/pct(dayi)得到多个比值,通过取中位数或平均数,得到基准比值sum_ua,通过基准比值sum_ua计算得到的预测序列sum_ua*pct(day1)、…、sum_ua*pct(day90)即为更新预测序列。
在一个实施例中,数据维度包括用户留存率维度。基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果包括:
当目标业务为对标业务时,通过用户留存率维度对应的预测模型对对标业务的历史用户留存率进行预测处理,得到用户留存率维度的初始预测结果。
根据输入的用户留存率数据,对用户留存率维度的初始预测结果进行更新,得到用户留存率维度的更新预测数据。
具体来说,针对用户留存率维度,目标业务为对标业务表征待预测业务的上线阶段为上线前或是上线初期。
获取对标业务的历史用户留存率,通过对对标业务的历史用户留存率进行过滤和修正处理,得到准确的数据。例如某对标业务的数据列表包括如下信息:iregday-对标业务上线后第i天注册(同一天注册的用户是为同一群用户),idaynum-该群用户处于第j天,ivalue-群体留存率。基于数据列表通过数据拟合处理可以得到待预测业务的用户留存率维度的初始预测结果,用户留存率维度的初始预测结果可以用cohort矩阵(cohort矩阵是指某日注册的用户群体,以注册当日及其后1-n天的留存率为一行,记录多个注册日的数据而成的矩阵)来表示,通过获取用户对待预测业务留存水平的期望值,基于期望值,计算输出对标业务cohort矩阵分布的相应分位数作为待预测业务用户留存率的更新预测数据。
在一个实施例中,数据维度包括用户留存率维度。基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果包括:
当目标业务为待测试业务时,通过用户留存率维度对应的预测模型对待预测业务的实际用户留存率进行预测处理,得到用户留存率维度的预测数据。
具体来说,针对用户留存率维度,目标业务为待预测业务表征待预测业务的上线阶段为上线中期或是上线后期。在实施例中,可以将注册日期iregday作为不同分组水平,使用Hierarchical Linear Model(等级线性模型)外推得到完整的留存矩阵,即为用户留存率维度的预测数据。
本申请还提供一种应用场景,该应用场景应用上述的业务数据预测方法。
具体地,该业务数据预测方法在该应用场景的应用如下:
用户可以通过安装有BI工具的BI终端发起待预测业务的数据预测任务,BI终端基于数据预测任务向API服务传递参数,API服务基于接口向指标数据库查询数据,得到所需的目标业务数据,然后基于封装的预测模型,按预测模型对应数据维度对该数据维度对应的目标业务数据进行预测处理。
其中,API服务基于封装的预测模型的内部架构如图6所示,API服务的任务模块分为三类:第一类是输入输出模块:负责与API外部交互,传递参数、整合结果、数据格式转换等;第二类是逻辑判断模块:负责判断不同场景下采用用户输入参数或是目标业务数据等;第三类是数据处理模块:数据处理模块包括两个小类,第一小类是预测模型模块(编号1-6)负责在给定参数时读取数据,预测处理和数据输出;第二小类是数据更新模块,负责支持用户手工调节各项指标具体每日数据,然后更新预测值。
以游戏业务为例,API服务将指标拆解为新增用户、留存率和arpu(付费水平)三个数据维度的基础指标,通过不同方式得到三个数据维度的预测值,合并计算可以得到游戏上线后n天(当前设定为90天)的收益单日及累积数据:
其中,日收益=DAU*日活跃用户arpu,其中:DAU=∑n新增*Cohort留存,所以日收益=∑n新增*Cohort留存*日活跃用户arpu。
对于arpu值,采用用户输入数据直接计算,不做修正。而新增和留存cohort预估,基于不同的上线阶段分成多种场景,基于历史数据实验得到最优方案。比如,上线前,更多依赖业务经验和历史数据;上线前期,业务数据不稳定,依然以历史数据为主;上线足够久后,则以本业务数据为主。
如图7所示,所有场景涉及的6类模型,以下分别进行说明:
模型1,用于新增用户维度上线前阶段对应的场景,对应的目标业务数据为对标游戏的业务数据和用户输入的调整数据。数据处理过程如下:
获取用户输入对标游戏的品类或具体游戏,对对标游戏的业务数据进行数据过滤和修正处理,从数据库拉取对标游戏90天新增的拟合结果数据,取平均值,生成包括ind-上线天数,ivalue-新增参考值的数据列表,采用指数模型ivalue=a*ind-b,基于数据列表中的实际数据估计参数a和b;然后采用Levenberg-Marquardt算法,得到初步预测序列(初步预测序列可以表示数据变化趋势),获取用户输入的30天累积新增用户量,等比例调整初步预测序列,保证累积30天用户量符合用户预测序列,得到更新预测序列(更新预测序列可以表示数据变化趋势和数据量)
模型2,用于新增用户维度上线前期阶段对应的场景,对应的目标业务数据为对标游戏的业务数据和待预测游戏的实际业务数据。数据处理过程如下:
其中,模型2中用于得到初步预测序列的方式与模型1相同,不再赘述。在得到初步预测序列之后,获取待预测游戏前2天的实际新增用户量,等比例调整初步预测序列,保证调整后的累积2天用户量符合预测序列,得到更新预测序列。
模型3,用于新增用户维度上线中期阶段对应的场景,对应的目标业务数据为对标游戏的业务数据和待预测游戏的实际业务数据。数据处理过程如下:
获取业务上线前i天数据ua(day1),ua(day2)…ua(dayi),得到初步预测序列,模型3中用于得到初步预测序列的方式与模型1相同,不再赘述,计算初步预测序列中每日预测值占90天累积预测值的总和的比例pct(day1),pct(day2)...pct(day90),然后计算ua(day1)/pct(day1),…,ua(dayi)/pct(dayi)得到多个比值,通过取中位数或平均数,得到基准比值sum_ua,通过基准比值sum_ua计算得到的预测序列sum_ua*pct(day1)、…、sum_ua*pct(day90)即为更新预测序列。
模型4,用于新增用户维度上线后期阶段对应的场景,对应的目标业务数据为对待预测游戏的实际业务数据。数据处理过程如下:
获取待预测游戏的实际每日新增用户数据,对数据进行数据过滤和修正处理,生成包括ind-上线天数,ivalue-新增参考值的数据列表,采用指数模型ivalue=a*ind-b,基于数据列表中的实际数据估计参数a和b;采用Levenberg-Marquardt算法,得到预测序列,然后外推90天数据并输出。
模型5,用于用户留存率维度上线前和上线初期阶段对应的场景,对应的目标业务数据为对标游戏的业务数据。数据处理过程如下:
获取用户输入对标游戏的品类或具体游戏,对波动过大的游戏数据做剔除或处理,例如某对标游戏的数据列表包括iregday-游戏上线后第i天注册,idaynum-该群用户处于第j天,ivalue-群体留存率,基于数据列表的得到初步预测数据,获取用户对待预测游戏的留存水平的期望(在对标游戏分布中的位置,当前提供3档:50%,80%,95%)计算输出对标游戏cohort矩阵分布的相应分位数作为待预测游戏留存的预测数据。
模型6,用于用户留存率维度上线中期和上线后期阶段对应的场景,对应的目标业务数据为待预测游戏的实际业务数据。数据处理过程如下:
获取待预测游戏的实际用户留存率,将注册日期iregday作为不同分组水平,使用Hierarchical Linear Model外推得到完整的留存矩阵,从而得到待预测游戏留存的预测数据。
基于上述6种模型,可以分别得到四种不同上线阶段对应的用户留存率和新增用户的预测数据。基于用户输入的每日活跃用户的平均付费金额,可以计算得到每一天的预测收益以及累积收益数据。
在BI终端输入相关信息后,基于API服务的处理,返回相关结果至BI终端,如图8-图11所示,BI终端的显示数据支持图表切换、数据导出和数据微调。切换为交互式表格后,通过修改具体数据,改变预估结果,如修改留存矩阵某些位置的值,通过触发执行操作,API服务中的数据更新模型对输入的修改值进行处理,使得预估结果随之变化。
上述实施例可以应用在游戏筹备阶段,制定合理的KPI(Key PerformanceIndicator,关键绩效指标)非常重要,包括核心的收益指标,并将其拆解为新增、留存和付费水平,以便筹备相应的市场资源和版本内容。如果目标收益太高,过度投入运营资源,过度压榨游戏潜力,会提前透支游戏内容,不利于用户体验和长线运营;如果目标太低,则显然浪费了研发资源和相关投入。而上线后,运营需要依据实际数据以及相应的预测来调整决策,越是上线早期的精确预测越重要,因为越早决策和行动的效果越大。基于历史数据模拟,对于每个游戏,将其所属二级品类的其他游戏作为对标游戏进行数据参考,可以将90天累积收益的预测误差在10%以内。
应该理解的是,虽然上述各实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各实施例中的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图12所示,提供了一种业务数据预测装置1200,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:信息获取模块1202、目标业务数据确定模块1204、预测模型查找模块1206和预测模块1208,其中:
信息获取模块1202,获取待预测业务数据对应的上线阶段信息,识别待预测业务数据的数据维度;
目标业务数据确定模块1204,用于根据上线阶段信息对应的业务数据需求,确定待预测业务数据在数据维度下对应的目标业务数据;
预测模型查找模块1206,用于查找数据维度对应的预测模型;
预测模块1208,用于基于预测模型对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
在其中一个实施例中,业务数据预测装置还用于调用API服务的接口,获取待预测业务数据在数据维度下对应的目标业务数据;基于封装于API服务的预测模型,按数据维度对目标业务数据进行预测处理,得到待预测业务数据的数据预测结果。
在其中一个实施例中,目标业务数据确定模块还用于根据上线阶段信息对应的业务数据需求,确定目标业务,目标业务包括待预测业务的对标业务和待预测业务中的至少一个;从目标业务的业务数据中,获取数据维度对应的目标业务数据。
在其中一个实施例中,数据维度包括新增用户维度;预测模块还用于基于与新增用户维度对应的预测模型,对新增用户维度对应的目标业务数据进行数据拟合,得到拟合参数;根据拟合参数,得到新增用户维度的预测序列,预测序列包括每一时间点对应的新增用户预测数据。
在其中一个实施例中,目标业务包括对标业务时,用于数据拟合的目标业务数据为对标业务的历史业务数据;预测模块还用于,根据拟合参数,得到初步预测序列;基于待预测业务的实际业务数据或输入的新增用户期望数据,对初步预测序列进行等比例调整,得到更新预测序列。
在其中一个实施例中,预测模块还用于,计算初步预测序列中每一预测值占初步预测序列的累加值的比例;获取待预测业务每一时间点对应的新增用户量;针对每一时间点的新增用户量,确定与新增用户量具有相同时间点的目标预测值,得到新增用户量与目标预测值对应比例的比值结果;根据每一新增用户量对应的比值结果,确定基准比值;根据基准比值,对初步预测序列进行调整,得到更新预测序列。
在其中一个实施例中,数据维度包括用户留存率维度;预测模块还用于,当目标业务为对标业务时,通过用户留存率维度对应的预测模型对对标业务的历史用户留存率进行预测处理,得到用户留存率维度的初始预测结果;根据输入的用户留存率数据,对用户留存率维度的初始预测结果进行更新,得到用户留存率维度的更新预测数据。
在其中一个实施例中,数据维度包括用户留存率维度;预测模块还用于,当目标业务为待测试业务时,通过用户留存率维度对应的预测模型对待预测业务的实际用户留存率进行预测处理,得到用户留存率维度的预测数据。
关于业务数据预测装置的具体限定可以参见上文中对于业务数据预测方法的限定,在此不再赘述。上述业务数据预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对标业务的业务数据以及待预测业务的业务数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务数据预测方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种业务数据预测方法,其特征在于,所述方法包括:
获取待预测业务数据对应的上线阶段信息,识别所述待预测业务数据的数据维度;
根据所述上线阶段信息对应的业务数据需求,确定所述待预测业务数据在所述数据维度下对应的目标业务数据;
查找所述数据维度对应的预测模型;
基于所述预测模型对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果;
其中,在所述数据维度包括新增用户维度,且所述目标业务数据为所述待预测业务数据的对标业务在新增用户维度的历史业务数据的情况下,所述基于所述预测模型对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果,包括:
对所述目标业务数据进行数据拟合,得到拟合参数,根据所述拟合参数,得到初步预测序列;
计算所述初步预测序列中每一目标预测值占所述初步预测序列的累加值的比例;获取所述待预测业务每一时间点对应的新增用户量,针对每一时间点的新增用户量,确定与所述新增用户量具有相同时间点的目标预测值,得到所述新增用户量与所述目标预测值对应比例的比值结果,根据所述每一时间点的新增用户量对应的比值结果,确定基准比值;
根据所述基准比值,对所述初步预测序列进行调整,得到更新预测序列。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
调用API服务的接口,获取所述待预测业务数据在所述数据维度下对应的目标业务数据;
基于封装于所述API服务的预测模型,按数据维度对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述上线阶段信息对应的业务数据需求,确定所述待预测业务数据在所述数据维度下对应的目标业务数据包括:
根据所述上线阶段信息对应的业务数据需求,确定目标业务,所述目标业务包括待预测业务的对标业务和所述待预测业务中的至少一个;
从所述目标业务的业务数据中,获取所述数据维度下对应的目标业务数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述拟合参数,得到初步预测序列之后,还包括:
基于所述待预测业务新增用户维度的实际业务数据或输入的新增用户期望数据,对所述初步预测序列进行等比例调整,得到更新预测序列。
5.根据权利要求3所述的方法,其特征在于,所述数据维度包括用户留存率维度;
所述基于所述预测模型对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果包括:
当所述目标业务为所述对标业务时,通过所述用户留存率维度对应的预测模型对所述对标业务的历史用户留存率进行预测处理,得到所述用户留存率维度的初始预测结果;
根据输入的用户留存率数据,对所述用户留存率维度的初始预测结果进行更新,得到所述用户留存率维度的数据预测结果;
当所述目标业务为所述待预测业务时,通过所述用户留存率维度对应的预测模型对所述待预测业务的实际用户留存率进行预测处理,得到所述用户留存率维度的数据预测结果。
6.一种业务数据预测装置,其特征在于,所述装置包括:
信息获取模块,获取待预测业务数据对应的上线阶段信息,识别所述待预测业务数据的数据维度;
目标业务数据确定模块,用于根据所述上线阶段信息对应的业务数据需求,确定所述待预测业务数据在所述数据维度下对应的目标业务数据;
预测模型查找模块,用于查找所述数据维度对应的预测模型;
预测模块,用于基于所述预测模型对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果;
其中,在所述数据维度包括新增用户维度,且所述目标业务数据为所述待预测业务数据的对标业务在新增用户维度的历史业务数据的情况下,所述预测模块,还用于对所述目标业务数据进行数据拟合,得到拟合参数;根据所述拟合参数,得到初步预测序列;计算所述初步预测序列中每一目标预测值占所述初步预测序列的累加值的比例;获取所述待预测业务每一时间点对应的新增用户量,针对每一时间点的新增用户量,确定与所述新增用户量具有相同时间点的目标预测值,得到所述新增用户量与所述目标预测值对应比例的比值结果,根据所述每一时间点的新增用户量对应的比值结果,确定基准比值;根据所述基准比值,对所述初步预测序列进行调整,得到更新预测序列。
7.根据权利要求6所述的装置,其特征在于,所述业务数据预测装置还用于调用API服务的接口,获取所述待预测业务数据在所述数据维度下对应的目标业务数据;基于封装于所述API服务的预测模型,按数据维度对所述目标业务数据进行预测处理,得到所述待预测业务数据的数据预测结果。
8.根据权利要求6所述的装置,其特征在于,所述目标业务数据确定模块还用于根据所述上线阶段信息对应的业务数据需求,确定目标业务;从所述目标业务的业务数据中,获取所述数据维度下对应的目标业务数据;所述目标业务包括待预测业务的对标业务和所述待预测业务中的至少一个。
9.根据权利要求6所述的装置,其特征在于,所述预测模块还用于,基于所述待预测业务新增用户维度的实际业务数据或输入的新增用户期望数据,对所述初步预测序列进行等比例调整,得到更新预测序列。
10.根据权利要求8所述的装置,其特征在于,所述数据维度包括用户留存率维度;所述预测模块还用于,当所述目标业务为所述对标业务时,通过所述用户留存率维度对应的预测模型对所述对标业务的历史用户留存率进行预测处理,得到所述用户留存率维度的初始预测结果;根据输入的用户留存率数据,对所述用户留存率维度的初始预测结果进行更新,得到所述用户留存率维度的数据预测结果;
所述预测模块还用于,当所述目标业务为所述待预测业务时,通过所述用户留存率维度对应的预测模型对所述待预测业务的实际用户留存率进行预测处理,得到所述用户留存率维度的数据预测结果。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
12.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202110154853.0A 2021-02-04 2021-02-04 业务数据预测方法、装置、计算机设备和存储介质 Active CN112767056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110154853.0A CN112767056B (zh) 2021-02-04 2021-02-04 业务数据预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110154853.0A CN112767056B (zh) 2021-02-04 2021-02-04 业务数据预测方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112767056A CN112767056A (zh) 2021-05-07
CN112767056B true CN112767056B (zh) 2023-07-25

Family

ID=75704951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110154853.0A Active CN112767056B (zh) 2021-02-04 2021-02-04 业务数据预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112767056B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269370B (zh) * 2021-06-18 2023-12-12 腾讯科技(成都)有限公司 一种活跃用户预测方法、装置、电子设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608781A (zh) * 2016-07-11 2018-01-19 华为软件技术有限公司 一种负载预测方法、装置以及网元
CN109284920A (zh) * 2018-09-13 2019-01-29 广州帷策智能科技有限公司 基于大数据的用户信息风险评定的方法及系统
CN111582565A (zh) * 2020-04-26 2020-08-25 支付宝(杭州)信息技术有限公司 数据融合方法、装置和电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751635A (en) * 1986-04-16 1988-06-14 Bell Communications Research, Inc. Distributed management support system for software managers
CN107016573B (zh) * 2017-04-06 2022-09-09 腾讯科技(深圳)有限公司 一种应用的评测方法和评测系统
WO2019051615A1 (en) * 2017-09-18 2019-03-21 Rubikloud Technologies Inc. METHOD AND SYSTEM FOR HIERARCHICAL PREDICTION
CN108011366B (zh) * 2017-11-30 2023-10-20 中国电力科学研究院有限公司 一种配电网可控资源协调优化控制方法和装置
CN110162556A (zh) * 2018-02-11 2019-08-23 陕西爱尚物联科技有限公司 一种有效发挥数据价值的方法
KR102559568B1 (ko) * 2019-03-11 2023-07-26 한국전자통신연구원 사물인터넷 인프라 환경에서의 보안통제 장치 및 방법
CN110738855B (zh) * 2019-10-29 2020-10-23 王程 一种数据稀疏时间段的道路交通流状况预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608781A (zh) * 2016-07-11 2018-01-19 华为软件技术有限公司 一种负载预测方法、装置以及网元
CN109284920A (zh) * 2018-09-13 2019-01-29 广州帷策智能科技有限公司 基于大数据的用户信息风险评定的方法及系统
CN111582565A (zh) * 2020-04-26 2020-08-25 支付宝(杭州)信息技术有限公司 数据融合方法、装置和电子设备

Also Published As

Publication number Publication date
CN112767056A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN110134516B (zh) 金融数据处理方法、装置、设备及计算机可读存储介质
US10565525B2 (en) Collaborative filtering method, apparatus, server and storage medium in combination with time factor
CN111222553B (zh) 机器学习模型的训练数据处理方法、装置和计算机设备
CN112669091B (zh) 数据处理方法、装置及存储介质
CN112767056B (zh) 业务数据预测方法、装置、计算机设备和存储介质
CN116167581A (zh) 电池需求量预估方法、装置、调度方法和计算机设备
CN108416619A (zh) 一种消费间隔时间预测方法、装置及可读存储介质
CN112418341A (zh) 模型融合方法、预测方法、装置、设备及存储介质
CN114021861A (zh) 一种电力负荷预测方法、装置、终端及存储介质
CN115809569A (zh) 基于耦合竞争失效模型的可靠性评价方法和装置
CN113850416A (zh) 广告推广合作对象确定方法和装置
CN110266770B (zh) 基于博弈论的闲置云资源调度方法和装置
CN112711739A (zh) 一种数据处理方法、装置及服务器、存储介质
CN110717653A (zh) 风险识别方法及装置和电子设备
CN114925919A (zh) 业务资源处理方法、装置、计算机设备和存储介质
CN110210885A (zh) 挖掘潜在客户的方法、装置、设备及可读存储介质
CN115222123A (zh) 客户数量预测方法、装置、设备、介质和程序产品
CN114691630A (zh) 一种智慧供应链大数据共享方法及系统
CN110245070B (zh) 测试用户筛选方法、装置、计算机设备及存储介质
CN110688373A (zh) 一种基于逻辑回归的offset方法
CN111612419A (zh) 电力申报数据的处理方法、装置和计算机设备
CN112862527B (zh) 用户类型确定方法、装置、设备及存储介质
CN116703175A (zh) 项目方案确定方法、装置、计算机设备和存储介质
US20230088429A1 (en) Processing device, processing method, and program
CN117033591A (zh) 问题解答方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant