CN108022007B - 目标应用的日活跃用户数量预测方法、装置和终端设备 - Google Patents

目标应用的日活跃用户数量预测方法、装置和终端设备 Download PDF

Info

Publication number
CN108022007B
CN108022007B CN201711208599.8A CN201711208599A CN108022007B CN 108022007 B CN108022007 B CN 108022007B CN 201711208599 A CN201711208599 A CN 201711208599A CN 108022007 B CN108022007 B CN 108022007B
Authority
CN
China
Prior art keywords
users
installation
application
target application
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711208599.8A
Other languages
English (en)
Other versions
CN108022007A (zh
Inventor
葛莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201711208599.8A priority Critical patent/CN108022007B/zh
Publication of CN108022007A publication Critical patent/CN108022007A/zh
Application granted granted Critical
Publication of CN108022007B publication Critical patent/CN108022007B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Stored Programmes (AREA)

Abstract

本发明提供了一种目标应用的日活跃用户数量预测方法、装置和终端设备,所述目标应用的日活跃用户数量预测方法包括:获取参照应用的安装用户数量、安装指数、月活跃用户数量、日活跃用户数量;获取目标应用的安装用户数量、安装指数;根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。根据该日活跃用户数量,可确定是否将该其它应用推送给用户,或用于实时监控竞争产品。

Description

目标应用的日活跃用户数量预测方法、装置和终端设备
技术领域
本发明涉及信息处理技术,尤其是一种目标应用的日活跃用户数量预测方法、装置和终端设备。
背景技术
目前的行业研究,大多参考第三方监控数据或者报告,分析第三方平台监控的竞争产品数据和自有产品数据,然后将自有产品的内部数据作为参考,推算竞争产品的总用户规模和/或活跃用户规模。这种方法存在以下弊端:1、第三方平台难以保证能够监控到自有产品和自有产品的主要竞争产品;2、第三方平台采集的数据参数与预测模型需要的参数不能较好的配合,致使第三方平台采集的数据难以满足建模需求,或导致建模过程繁琐以及预测结果失真;3、预测模型中的数据参数需要更新维护,以应对外部数据的变化,但第三方平台监控的产品数据存在不确定的变化,例如:统计口径、覆盖的竞品名单、平台收费改版等变化引起产品数据变化,导致预测结果失真;4、第三方平台一般不会提供详细的用户数据信息,例如用户的日活跃人数、收费信息等,不能做深入的行业分析,致使第三方监控数据或者报告的参考价值有限。
因此,如何充分利用用户数据,挖掘用户数据的价值、以分析行业发展趋势和用户行为趋势,敏锐把握市场动向,具有很大的商业价值。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一,特别是针对第三方报告中预测模型参数的不确定性可能引起的预测失真和参考价值有限的问题。
本发明提供了一种目标应用的日活跃用户数量预测方法,包括:
获取参照应用的安装用户数量、安装指数、月活跃用户数量、日活跃用户数量;
获取目标应用的安装用户数量、安装指数;
根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;
将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
优选地,所述根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量,包括:
将目标应用的安装用户数量除以参照应用的安装用户数量,得到安装比例installRatioi,j,其中:i为多个目标应用中的第i个目标应用,i∈[1,n],n为目标应用的总数量;j为数据统计周期中的第j个月,j∈[1,m],m为统计周期的总月数;
根据该安装比例installRatioi,j与所述月活跃用户数量mauinner,j,计算目标应用的月活跃用户数量maui,j=mauinner,j*installRatioi,j
优选地,获取参照应用的安装指数,获取目标应用的安装指数,包括:
获取渠道中m个月的每个用户第j个月的活跃天数;
确认所述活跃天数中满足预设活跃天数k的活跃用户的数量,获取该活跃用户安装参照应用的天数和用户数,获取该活跃用户安装第i个目标应用的天数和用户数;
根据该安装参照应用的天数和用户数,计算参照应用的平均安装天数dinner,j,k,其中:inner为参照应用;根据安装的第i个目标应用的天数和用户数,计算第i个目标应用的平均安装天数di,j,k
计算参照应用的安装指数installDayIndexinner,j和目标应用的安装指数installDayIndexi,j
Figure BDA0001484163780000031
Figure BDA0001484163780000032
其中:dayOfMonth为当月总天数,k∈{T1,dayOfMonth},T1为预设的不超过dayOfMonth的预设活跃天数值的集合。
进一步地,所述集合T1中的天数值包括1、2、4、7、14、21中的一个或多个。
优选地,所述推算出目标应用的月活跃用户数量之后,还包括:
将参照应用的安装用户数量和目标应用的安装用户数量相加,并减去重合的用户数量,得到去重总安装用户数量installUserCountOverallj
根据该去重总安装用户数量installUserCountOverallj、参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j,计算安装重合度overlapRatioj
overlapRatioj=installUserCountOverallji(uinner,j+ui,j);
根据该安装重合度overlapRatioj和参照应用的月活跃用户数量mauinner,j、目标应用的月活跃用户数量maui,j,计算参照应用和目标应用所在行业的整体用户数量mauOverrallj
mauOverrallj=Σi(mauinner,j+maui,j)*overlapRatioj
进一步地,所述计算参照应用和目标应用所在行业的整体用户数量之后,还包括:
监控该参照应用和目标应用所在行业的整体用户数量。
优选地,所述得到目标应用的日活跃用户数量之后,还包括:
将日活跃用户数量排名前预设位数的目标应用作为推荐应用推送给用户;或
监控该目标应用的安装用户总数量。
优选地,所述参照应用的安装用户数量、月活跃用户数量、日活跃用户数量、目标应用的安装用户数量分别为去重的参照应用安装用户数量、去重的参照应用月活跃用户数量、去重的参照应用日活跃用户数量、去重的目标应用安装用户数量。
本发明还提出一种目标应用的日活跃用户数量预测装置,包括:
参照应用获取模块,用于获取参照应用的安装用户数量、月活跃用户数量、日活跃用户数量、安装指数;
目标应用获取模块,用于目标应用的安装用户数量、安装指数;
月活跃用户推算模块,用于根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;
日活跃用户推算模块,用于将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
本发明还提出一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;所述处理器执行所述计算机程序时,实现前述任意一项所述的预测方法。
本发明的有益效果如下:
1、本发明根据获取的具有较多运营数据的应用产品作为参照应用,将具有较少运营数据的其它产品作为目标应用,根据应用产品的运营数据推算其它产品的日活跃用户数量等运营参数;可根据该日活跃用户数量确定是否将该其它应用推送给用户,或确定是否将该其它应用置于预设的推广位置上;当其它产品为竞争对手的竞争产品时,本发明还可用来实时监控竞争产品。
2、本发明的预测模型科学合理,可实时更新数据,预测结果与目标应用的实际运营结果差别小,可应用于游戏、直播、视频桌面等行业,以监控竞争产品的运营情况和研究自有产品和竞争产品所在行业的发展趋势,为定量刻画行业及与竞争产品的发展状况提供可靠参考。
3、本发明不仅可推算目标应用的日活跃用户数量,还可推算参照应用和目标应用所在行业的整体用户数量,为预测目标应用在行业内的发展提供可靠依据。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明方法实施例的流程示意图;
图2为本发明方法优选实施例的流程示意图;
图3为本发明所述终端设备的实施例示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提出一种目标应用的日活跃用户数量预测方法,其第一实施例如图1所示,包括如下步骤:
步骤S10:获取参照应用的安装用户数量、月活跃用户数量、日活跃用户数量、安装指数;
上述各数量的统计周期可为预设的时间段,例如可获取当前月份之前的六个月内所有渠道用户的活跃数据,包括所有渠道用户中安装和使用参照应用和目标应用的数据,构成用户数据集;该用户数据集内的数据可实时更新为最近六个月的数据,包括最近的参照应用的安装用户数量uinner,j、月活跃用户数量mauinner,j、日活跃用户数量dauinner,j、安装指数installDayIndexinner,j,其中:j为数据统计周期中的第j个月,j∈[1,m],m为统计周期的总月数。当m=6时,j∈[1,6],uinner,j为6个月内的第j个月中参照应用的安装用户数量,每个月的所述安装用户数量uinner,j亦可分别表述为:六个月内的第1个月中参照应用的安装用户数量uinner,1、第2个月中参照应用的安装用户数量uinner,2、第3个月中参照应用的安装用户数量uinner,3、第4个月中参照应用的安装用户数量uinner,4、第5个月中参照应用的安装用户数量uinner,5、第6个月中参照应用的安装用户数量uinner,6。本实施例可应用于1个月、1个目标应用的场景,也可以应用于多个月、多个目标应用的场景。
同理,以m=6为例,j∈[1,6],mauinner,j为6个月内第j个月的参照应用的月活跃用户数量,dauinner,j为6个月内第j个月的参照应用的日活跃用户数量、installDayIndexinner,j为6个月内第j个月的参照应用的安装指数。
为方便计算,所述参照应用的日活跃用户数量dauinner,j可以为m个月内第j个月平均的日活跃用户数量,亦可进一步将dauinner,j定义为dauinner,d,j,其中:d为一个月中的天数顺序数,dauinner,d,j为m个月内第j个月中第d天的日活跃用户数量;当d=1时,表示第j个月中的第1天,dauinner,1,j为第j个月中的第1天参照应用的日活跃用户数量;当d=dayOfMonth,dayOfMonth为当月总天数时,dauinner,dayOfMonth,j为第j个月中的最后1天参照应用的日活跃用户数量。故dauinner,d,j本身可构成一个m×dayOfMonth的矩阵数据集,通过该矩阵数据集可分别得到参照应用每一天的日活跃用户数量。
所述参照应用的安装指数installDayIndexinner,j为渠道中的活跃用户安装参照应用的参考天数值,反映渠道活跃的用户安装参照应用的周期长短。其取值可为参照应用的平均安装天数dinner,j,亦可与参照应用的平均安装天数dinner,j呈一定比例。所述目标应用的安装指数installDayIndexi,j与之类似。
所述目标应用的安装指数installDayIndexi,j为渠道中的活跃用户安装目标应用的参考天数值,反映渠道活跃的用户安装目标应用的周期长短。其取值可为目标应用的平均安装天数,亦可与目标应用的平均安装天数呈一定比例。
为使安装指数覆盖不同活跃程度的用户群体,本发明实施例中的参照应用的安装指数installDayIndexinner,j和目标应用的安装指数installDayIndexi,j的计算过程可进一步如下述又一实施例所述:
步骤S11:获取渠道中m个月的每个用户第j个月的活跃天数;
步骤S12:确认所述活跃天数中满足预设活跃天数k的活跃用户的数量,获取该活跃用户安装参照应用的天数和用户数,获取该活跃用户安装第i个目标应用的天数和用户数;
步骤S13:根据该安装参照应用的天数和用户数,计算参照应用的平均安装天数dinner,j,k,其中:inner为参照应用;还根据安装的第i个目标应用的天数和用户数,计算第i个目标应用的平均安装天数di,j,k
步骤S14:计算参照应用的安装指数installDayIndexinner,j和目标应用的安装指数installDayIndexi,j
Figure BDA0001484163780000081
Figure BDA0001484163780000082
其中:dayOfMonth为当月总天数,k∈{T1,dayOfMonth},T1为预设的不超过dayOfMonth的预设活跃天数值的集合,installDayIndexinner,j为参照应用第j个月中活跃天数为k的用户的安装指数,installDayIndexi,j为第i个目标应用在第j个月中活跃天数为k的用户的安装指数。
所述预设活跃天数k可预先取一系列数值,以覆盖不同活跃天数的用户特征;例如,天数k可分别取值1,2,4,7,14,21,dayOfMonth中的一个或多个或全部数值,即:集合T1中的天数值包括1、2、4、7、14、21中的一个或多个,以分别统计活跃天数为1、2、4、7、14、21、dayOfMonth的用户数量等数据;此时,集合T1可为{1,2,4,7,14,21},即:k∈{1,2,4,7,14,21,dayOfMonth}。集合T1还可为其它数值的集合,例如,每月约有8天为周末,可取k=8,以及其它小于dayOfMonth的8的倍数数值,例如16或24,则集合T1为{8,16,24},即:k∈{8,16,24,dayOfMonth}。以m=6,k=4、i=2,j=3为例,则是统计近6个月内在渠道中的活跃用户在每个月的活跃天数,installDayIndexinner,3为取6个月中的第3个月在渠道中活跃4天的用户安装参照应用的安装指数,installDayIndex2,3为取其中第3个月在渠道中活跃4天的用户安装第2个目标应用的安装指数。
在步骤S11中,获取渠道中m个月的每个用户第j个月中的活跃天数后,可根据活跃天数对用户进行分类,然后根据步骤S12确认所述活跃天数中满足预设活跃天数k的活跃用户的数量;若继续以k∈{4,7,14,21,dayOfMonth}的数值为例,则分别确认活跃天数为4、7、14、21、dayOfMonth的用户数量,并获取该活跃用户中安装了参照应用的天数、安装了第i个目标应用的天数。所述该活跃用户中可能一些活跃用户没有安装参照应用或目标应用,或仅安装了参照应用或目标应用中一个,或同时均安装。
在步骤S13中,根据该安装参照应用的天数和用户数,计算参照应用的平均安装天数dinner,j,k;所述平均安装天数dinner,j,k可为安装了参照应用的用户安装参照应用的总天数除以安装了参照应用的用户数;继续以m=6,k=4、i=2,j=3为例,则平均安装天数dinner,3的计算过程为:获取渠道6个月中的所有活跃用户;确认其中第3个月的活跃天数为4的每个活跃用户安装参考应用的天数以及总的用户数,将每个活跃用户安装参考应用的天数相加,再除以总的用户数,得到参照应用的平均安装天数dinner,j,k。同理,确认其中第3个月的活跃天数为4的活跃用户安装第i个目标应用的天数以及总的用户数;将每个活跃用户安装第i个目标应用的天数相加,再除以总的用户数,得到第i个目标应用的平均安装天数di,j,k
在步骤S14中,以预设活跃天数k∈{4,7,14,21,dayOfMonth}、i=2,j=3,dayOfMonth=30为例,说明参照应用的安装指数installDayIndexinner,j和目标应用的安装指数installDayIndexi,j的计算过程:
参照应用的安装指数
Figure BDA0001484163780000101
Figure BDA0001484163780000102
即:在统计周期的总月数m的第3个月中,参照应用的安装指数installDayIndexinner,3为活跃天数为4,7,14,21,30的用户安装参照应用的平均安装天数乘以系数
Figure BDA0001484163780000103
之后的数值之和。
目标应用的安装指数
Figure BDA0001484163780000104
Figure BDA0001484163780000105
即:在统计周期的总月数m的第3个月中,第2个目标应用的安装指数installDayIndex2,3为活跃天数为4,7,14,21,30的用户安装第2个目标应用的平均安装天数乘以系数
Figure BDA0001484163780000106
之后的数值之和。
同理,若需要计算统计周期的总月数m中的第i'个目标应用的安装指数,仅需将第2个目标应用对应的数值替换为该第i'个目标应用对应的数值即可。
所述渠道可以为第三方数据平台、各应用商店平台、自有应用软件所建立的产品数据采集平台等。为避免获取的渠道用户集中于某一特定行业,采集数据时,可不通过该行业的自有产品进行采集,亦不通过与该行业自有产品具有直接导量关系的上下游产品进行采集;例如:为预测直播行业的竞争产品(即目标应用)的日活跃用户数量daui,j,可通过其它产品的数据采集平台获取用户数据,但不利用在直播行业的自有产品获取用户数据,否则,采集的用户数据中可能包括自有直播产品的全部用户,但仅包括了竞争产品的部分用户,从而导致采集的数据具有特定的指向性,进而使预测模型的结果偏差较大。
为方便后续计算的调用,所述渠道用户的数据还可包含:所有应用安装列表(即用户安装的所有应用程序名称)、每个应用的活跃日期、每个应用的安装日期等。所述每个应用的活跃日期可包括用户最近一次的使用日期、用户在第一预设时间段内的使用次数、用户在指定的另一时间段或多个时间段的使用次数等;每个应用的安装日期为用户初次安装参考应用或目标应用的安装日期,若用户在一段时间内有卸载应用和再次安装应用,可将该段时间内的第一次安装日期作为所述的应用的安装日期。
步骤S20:获取目标应用的安装用户数量ui,j、安装指数installRatioi,j
如前所述,所述统计周期为预设的时间段,例如可获取当前月份之前的六个月内所有渠道用户的活跃数据,包括所有渠道用户中安装和使用参照应用和目标应用的数据,构成用户数据集;该用户数据集内的数据可实时更新为最近六个月的数据;该数据还包括最近的目标应用的安装用户数量ui,j和安装指数installDayIndexi,j
所述目标应用的安装用户数量ui,j为统计周期为m个月之内的第j个月中第i个目标应用的安装用户数量,一般可从渠道数据中直接获得;例如:当m=6,j=2,i=1时,ui,j=u1,2,为6个月内的第2个月中,第1个目标应用的安装用户数量;当目标应用为n个时,ui,j可形成一个m×n的矩阵数据集。
为方便获取渠道月活跃k天的活跃用户安装参考应用的平均安装天数dinner,j,k和安装目标应用的平均安装天数di,j,k,优选地,可先从所述用户数据集中查询每个月的活跃老用户信息,所述老用户为该用户的新增月份大于Monthj的用户,即在第j个月之前注册的用户,以避免参照应用或目标应用由于短期推广而引起的数据波动影响;再统计每个月老用户的活跃天数k;例如,可按k∈{4,7,14,21,dayOfMonth}进行统计,并划分为群组,组成活跃老用户数据集ActiveUserGroup={gj,k},j∈[1,m],其中gj,k为第j个月内活跃天数为k的用户数量;该老用户数据集可覆盖不同活跃程度的用户群体,以便后续计算的调用和查询,加快推算速度。所述k的取值可根据具体情况定制,并不限于上述的4,7,14,21,dayOfMonth等取值;最后,统计ActiveUserGroup中安装了参照应用和目标应用的每个老用户的安装天数,计算出老用户的平均安装天数di,j,k,得到老用户的平均安装天数数据集InstallDayCount:
InstallDayCount={dinner,j,k,d1,j,k...,di,j,k,...},其中i∈[1,n],j∈[1,m],所述k为预设活跃天数,可参考前述取值:k∈{4,7,14,21,dayOfMonth}。
当参照应用为自有产品时,可获取到包括月活跃用户数量、日活跃用户数量等详尽用户数据,以及用户详尽登录信息、费用信息等数据;当目标应用为非自有产品,例如为竞争对手与自有产品属于同一行业或类别的竞争产品时,则一般无法获取到目标应用的月活跃用户数量、日活跃用户数量等信息,需要采用数据分析的方式推算其数量。
步骤S30:根据参照应用的安装用户数量uinner,j、月活跃用户数量mauinner,j和目标应用的安装用户数量ui,j,推算出目标应用的月活跃用户数量maui,j
可假设参照应用的安装用户数量uinner,j与月活跃用户数量mauinner,j之间的比值,与第i个目标应用的安装用户数量ui,j与月活跃用户数量maui,j之间的比值相等;则本发明还提出推算出目标应用的月活跃用户数量maui,j的具体实施例:
将目标应用的安装用户数量ui,j除以参照应用的安装用户数量uinner,j,得到安装比例installRatioi,j,其中:i为多个目标应用中的第i个目标应用,i∈[1,n],n为目标应用的总数量;j为数据统计周期中的第j个月,j∈[1,m],m为统计周期的总月数;
根据该安装比例installRatioi,j与所述月活跃用户数量mauinner,j,计算目标应用的月活跃用户数量maui,j=mauinner,j*installRatioi,j
即:先计算第i个目标应用相对参照应用的安装比例installRatioi,j
installRatioi,j=ui,j/uinner,j
再计算第i个目标应用的月活跃用户规模maui,j
maui,j=mauinner,j*installRatioi,j
步骤S40:将参照应用的日活跃用户数量除以月活跃用户数量maui,j,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
由于应用的日活跃用户数量一般与日活跃程度和安装指数呈较为明显的数学关系,为计算目标应用的日活跃用户数量daui,j,可假设参考应用的日活跃程度activeRateinner,j与参考应用的安装指数installDayIndexinner,j的比值relationActiveInstallinner,j,与第i个目标应用的日活跃程度activeRatei,j与第i个目标应用的安装指数installDayIndexi,j的比值relationActiveInstalli,j相等,即:
relationActiveInstallinner,j=activeRateinner,j/installDayIndexinner,j
=relationActiveInstalli,j=activeRatei,j/installDayIndexi,j
又由于:activeRatei,j=daui,j/maui,j,则:
daui,j=maui,j*activeRatei,j=maui,j*installDayIndexi,j*relationActiveInstallinner,j,其中,i∈[1,n],j∈[1,m]。
本发明可将具有较多运营数据的应用产品作为参照应用,将具有较少运营数据的其它产品作为目标应用,根据应用产品的运营数据推算其它产品的日活跃用户数量等运营参数;当其它产品为自有产品的竞争产品时,可用于预测竞争产品的日活跃用户数据,为自有产品提供运营参考,亦可为自有产品和竞争产品所在行业的发展趋势提供参考;还可根据该日活跃用户数量确定是否将该目标应用推送给用户,或确定是否将该应用置于预设的推广位置上;本发明的模型科学合理,准确度高。
本发明除可推算目标应用的日活跃用户数量外,还可推算参照应用和目标应用所在行业的整体用户数量mauOverrallj,如图2所示,故本发明还提出另一实施例:
所述推算出目标应用的月活跃用户数量maui,j之后,还包括:
步骤S50:将参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j相加,并减去重合的用户数量,得到去重总安装用户数量installUserCountOverallj;根据该去重总安装用户数量installUserCountOverallj、参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j,计算安装重合度overlapRatioj
overlapRatioj=installUserCountOverallj/∑i(uinner,j+ui,j);
根据该安装重合度overlapRatioj和参照应用的月活跃用户数量mauinner,j、目标应用的月活跃用户数量maui,j,计算参照应用和目标应用所在行业的整体用户数量mauOverrallj
mauOverrallj=∑i(mauinner,j+maui,j)*overlapRatioj
其中,i∈[1,n],j∈[1,m],n为目标应用的总数量,m为统计周期的总月数。
所述整体用户数量mauOverrallj可用于预估行业的整体用户规模,以充分挖掘参考应用或目标应用的市场空间,为市场决策提供参考,或作为市场推广的重要参照之一。
基于以上实施例,本发明还提出另一种实施例:
所述计算参照应用和目标应用所在行业的整体用户数量mauOverrallj之后,还包括:
监控该参照应用和目标应用所在行业的整体用户数量mauOverallj
本发明可实时更新步骤S10和步骤S20中的数据,以保持预测模型的即时性,故本发明计算的整体用户数量mauOverrallj亦可保持实时更新,以监控参照应用和目标应用所在行业的整体用户数量mauOverallj;还可根据后续更新的实时数据检验计算模型的准确性,以对预测模型进行调整,其实预测精度更高。
所述得到目标应用的日活跃用户数量之后,本发明还提出另一实施例,包括:
将日活跃用户数量排名前预设位数的目标应用作为推荐应用推送给用户;或
监控该目标应用的安装用户总数量。
本发明可预测多个目标应用的日活跃用户数量daui,j,并根据得到目标应用的日活跃用户数量daui,j对多个目标应用进行排序;可取排名前预设位数的目标应用作为推荐应用推送给用户,例如将排名前3位的目标应用作为推荐应用,通过广告推广位置或内嵌推荐应用推送给用户;或监控排名前十位的目标应用,以作为商业参考。
为提高模型的准确性,所述参照应用的安装用户数量uinner,j、月活跃用户数量mauinner,j、日活跃用户数量dauinner,j、目标应用的安装用户数量ui,j可分别为去重的参照应用安装用户数量uinner,j、去重的参照应用月活跃用户数量mauinner,j、去重的参照应用日活跃用户数量dauinner,j、去重的目标应用安装用户数量ui,j
以下为本发明的又一实施例,其分别建立用户数据集与目标应用集,以便后续调用用户数据与应用数据,其具体实施方式如下:
步骤S01:建立用户数据集;
根据数据采集平台或采集渠道,抽取m个月的活跃用户数据,每条用户数据包括:用户的应用安装列表(即用户安装的应用程序名称)、用户的活跃日期、用户的新增日期等信息。
步骤S02:确定应用集;
根据获取的各应用的安装量和主流应用商店的下载量、排名等,筛选出该行业内的主要应用,形成包括n+1个应用的应用集,记为TargetAPP={tinner,t1,...,ti,...},i∈[1,n],n为目标应用的总数量,tinner为参照应用,可为自有产品,ti为所述第i个目标应用。
步骤S03:推测应用集中多个目标应用的月活跃用户数量集MAU;
首先,从用户数据集中查询应用集TargetAPP中每个应用每个月的去重安装用户数量,包括所述参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j,形成安装用户规模集InstallUserCount={uinner,j,u1,j,...,ui,j,...},i∈[1,n],j∈[1,m],m为统计周期的总月数;
计算目标应用相对参考应用的安装比例:installRatioi,j=ui,j/uinner,j
其次,统计参考应用的去重月活跃用户规模mauinner,j,j∈[1,m],推算目标应用的去重月活跃用户规模maui,j=mauinner,j*installRatioi,j,i∈[1,n],j∈[1,m],得到TargetAPP的MAU={mauinner,j,mau1,j,...,maui,j,...},i∈[1,n],j∈[1,m]。
最后,统计TargetAPP整体的去重安装用户规模installUserCountOverallj,计算整体安装重合度overlapRatioj=installUserCountOverallj/∑i(uinner,j+ui,j),再计算行业整体的用户规模:mauOverrallj=∑i(mauinner,j+maui,j)*overlapRatioj,i∈[1,n],j∈[1,m]。
步骤S04:推测应用集中多个目标应用的日活跃用户数量集DAU;
首先,从用户数据集中查询每个月的活跃老用户,(即新增月份大于Monthj的用户,以避免TargetAPP中部分应用的推广活动带来的影响),统计每个月老用户的活跃天数,按k∈{4,7,14,21,dayOfMonth}(dayOfMonth为当月天数,分组天数亦可根据具体情况定制)划分用户群组,即ActiveUserGroup={gj,k},j∈[1,m];
其次,统计ActiveUserGroup中TargetAPP的每个安装用户的安装天数,计算用户的平均安装天数集,得到:InstallDayCount={dinner,j,k,d1,j,k...,di,j,k,...},i∈[1,n],j∈[1,m],k∈{4,7,14,21,dayOfMonth};
然后,计算参照应用每个月的安装指数(即加权安装天数):
Figure BDA0001484163780000171
k∈{4,7,14,21,dayOfMonth},j∈[1,m];计算参照应用的日活跃程度activeRateinner,j=dauinner,j/mauinner,j,j∈[1,m];进而计算日活跃程度相对安装指数的比例:relationActiveInstallinner,j=activeRateinner,j/installDayIndexinner,j
最后,计算目标应用的安装指数
Figure BDA0001484163780000172
根据参照应用的比例relationActiveInstallinner,j以及目标应用日活跃程度相对安装指数比例的一致性,计算得到目标应用的日活跃程度:activeRatei,j=installDayIndexi,j*relationActiveInstallinner,j=daui,j/maui,j,进而计算得到目标应用的日活跃用户数量daui,j=maui,j*installIndexi,j*relationActiveInstallinner,j,则TargetAPP的日活跃用户数量集DAU={dauinner,j,dau1,j,...,daui,j,...},i∈[1,n],j∈[1,m]。
本实施例将采集的数据分为用户数据集和应用集,可方便统计与调用用户数据,并可通过多维矩阵的运算,加快预测模型的运算速度。
本发明还提出一种目标应用的日活跃用户数量预测装置,包括:
参照应用获取模块,用于获取参照应用的安装用户数量、安装指数、月活跃用户数量、日活跃用户数量;
目标应用获取模块,用于目标应用的安装用户数量、安装指数;
月活跃用户推算模块,用于根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;
日活跃用户推算模块,用于将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
本发明可对获取的参照应用和目标应用的用户数据进行分析,以根据目标应用的日活跃用户数量和/或参照应用和目标应用所在行业的整体用户数量,判断参照应用和目标应用所在行业的发展趋势和用户行为的趋势,调整目标应用或参考应用的推广策略或研发方向,具有极大的商业价值。
本发明还提出一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时,实现前述任意一项所述的预测方法。
如图3所示为本发明所述终端设备的部分结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。所述终端设备可以为包括手机、平板电脑、笔记本电脑、台式电脑等可观看直播节目的终端设备。下面以台式电脑为例说明本发明终端设备的工作方式。
参考图3,台式电脑包括处理器、存储器、输入单元、显示单元等部件。本领域技术人员可以理解,图3中示出的台式电脑结构并不构成对所有台式电脑的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器可用于存储计算机程序以及各功能模块,处理器通过运行存储在存储器的计算机程序,从而执行台式电脑的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如收看直播节目的功能)等;存储数据区可存储根据台式电脑的使用所创建的数据(比如直播数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件。
输入单元可用于接收用户输入的搜索关键字,以及产生与台式电脑的用户设置以及功能控制有关的信号输入。具体地,输入单元可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元可用于显示用户输入的信息或提供给用户的信息以及台式电脑的各种菜单。显示单元可采用液晶显示器、有机发光二极管等形式。处理器是台式电脑的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
此外,在本发明各个实施例中的各模块可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种目标应用的日活跃用户数量预测方法,其特征在于,包括:
获取参照应用的安装用户数量、安装指数、月活跃用户数量、日活跃用户数量;其中,所述参照应用的安装指数为渠道中的活跃用户安装参照应用的参考天数值,反映渠道活跃的用户安装参照应用的周期长短;
获取目标应用的安装用户数量、安装指数;其中,所述目标应用的安装指数为渠道中的活跃用户安装目标应用的参考天数值,反映渠道活跃的用户安装目标应用的周期长短;
根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;包括:将目标应用的安装用户数量除以参照应用的安装用户数量得到安装比例,根据该安装比例与所述月活跃用户数量计算目标应用的月活跃用户数量;
将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
2.根据权利要求1所述的预测方法,其特征在于,
所述安装比例为installRatioi,j,其中:i为多个目标应用中的第i个目标应用,i∈[1,n],n为目标应用的总数量;j为数据统计周期中的第j个月,j∈[1,m],m为统计周期的总月数;
所述根据该安装比例与所述月活跃用户数量计算目标应用的月活跃用户数量,包括:根据所述安装比例installRatioi,j与所述月活跃用户数量mauinner,j,计算目标应用的月活跃用户数量maui,j=mauinner,j*installRatioi,j
3.根据权利要求1所述的预测方法,其特征在于,获取参照应用的安装指数,获取目标应用的安装指数,包括:
获取渠道中m个月的每个用户第j个月的活跃天数;
确认所述活跃天数中满足预设活跃天数k的活跃用户的数量,获取该活跃用户安装参照应用的天数和用户数,获取该活跃用户安装第i个目标应用的天数和用户数;
根据该安装参照应用的天数和用户数,计算参照应用的平均安装天数dinner,j,k,其中:inner为参照应用;根据安装的第i个目标应用的天数和用户数,计算第i个目标应用的平均安装天数di,j,k
计算参照应用的安装指数installDayIndexinner,j和目标应用的安装指数installDayIndexi,j
Figure FDA0002699577120000022
Figure FDA0002699577120000021
其中:dayOfMonth为当月总天数,k∈{T1,dayOfMonth},T1为预设的不超过dayOfMonth的预设活跃天数值的集合。
4.根据权利要求3所述的预测方法,其特征在于,所述集合T1中的天数值包括1、2、4、7、14、21中的一个或多个。
5.根据权利要求1所述的预测方法,其特征在于,所述推算出目标应用的月活跃用户数量之后,还包括:
将参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j相加,并减去重合的用户数量,得到去重总安装用户数量installUserCountOverallj
根据该去重总安装用户数量installUserCountOverallj、参照应用的安装用户数量uinner,j和目标应用的安装用户数量ui,j,计算安装重合度overlapRatioj
overlapRatioj=installUserCountOverallj/∑i(uinner,j+ui,j);
根据该安装重合度overlapRatioj和参照应用的月活跃用户数量mauinner,j、目标应用的月活跃用户数量maui,j,计算参照应用和目标应用所在行业的整体用户数量mauOverrallj
mauOverrallj=∑i(mauinner,j+maui,j)*overlapRatioj
6.根据权利要求5所述的预测方法,其特征在于,所述计算参照应用和目标应用所在行业的整体用户数量之后,还包括:
监控该参照应用和目标应用所在行业的整体用户数量。
7.根据权利要求1所述的预测方法,其特征在于,所述得到目标应用的日活跃用户数量之后,还包括:
将日活跃用户数量排名前预设位数的目标应用作为推荐应用推送给用户;或
监控该目标应用的安装用户总数量。
8.根据权利要求1所述的预测方法,其特征在于,所述参照应用的安装用户数量、月活跃用户数量日活跃用户数量目标应用的安装用户数量分别为去重的参照应用安装用户数量、去重的参照应用月活跃用户数量、去重的参照应用日活跃用户数量、去重的目标应用安装用户数量。
9.一种目标应用的日活跃用户数量预测装置,其特征在于,包括:
参照应用获取模块,用于获取参照应用的安装用户数量、月活跃用户数量、日活跃用户数量、安装指数;其中,所述参照应用的安装指数为渠道中的活跃用户安装参照应用的参考天数值,反映渠道活跃的用户安装参照应用的周期长短;
目标应用获取模块,用于目标应用的安装用户数量、安装指数其中,所述目标应用的安装指数为渠道中的活跃用户安装目标应用的参考天数值,反映渠道活跃的用户安装目标应用的周期长短;
月活跃用户推算模块,用于根据参照应用的安装用户数量、月活跃用户数量和目标应用的安装用户数量,推算出目标应用的月活跃用户数量;包括:将目标应用的安装用户数量除以参照应用的安装用户数量得到安装比例,根据该安装比例与所述月活跃用户数量计算目标应用的月活跃用户数量;
日活跃用户推算模块,用于将参照应用的日活跃用户数量除以月活跃用户数量,得到日活跃用户程度;计算参照应用的日活跃用户程度与安装指数的比值;将目标应用的安装指数乘以该比值乘以目标应用的月活跃用户数量,得到目标应用的日活跃用户数量。
10.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至8任意一项所述的预测方法。
CN201711208599.8A 2017-11-27 2017-11-27 目标应用的日活跃用户数量预测方法、装置和终端设备 Active CN108022007B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711208599.8A CN108022007B (zh) 2017-11-27 2017-11-27 目标应用的日活跃用户数量预测方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711208599.8A CN108022007B (zh) 2017-11-27 2017-11-27 目标应用的日活跃用户数量预测方法、装置和终端设备

Publications (2)

Publication Number Publication Date
CN108022007A CN108022007A (zh) 2018-05-11
CN108022007B true CN108022007B (zh) 2020-12-22

Family

ID=62077398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711208599.8A Active CN108022007B (zh) 2017-11-27 2017-11-27 目标应用的日活跃用户数量预测方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN108022007B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110830820A (zh) * 2018-08-08 2020-02-21 北京国双科技有限公司 应急数据的处理方法及装置
CN109272348B (zh) * 2018-08-22 2023-06-20 中国平安人寿保险股份有限公司 活跃用户数量确定方法及装置、存储介质和电子设备
CN109299832A (zh) * 2018-11-16 2019-02-01 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN109360031A (zh) * 2018-11-16 2019-02-19 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN109902093B (zh) * 2018-12-14 2021-06-22 柚子(北京)移动技术有限公司 一种移动应用的快速统计方法
CN110262959B (zh) * 2019-05-09 2022-11-11 五八有限公司 底层服务压力测试方法、装置、电子设备及存储介质
CN110535943B (zh) * 2019-08-29 2022-04-26 广州方硅信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN110798511B (zh) * 2019-10-14 2022-10-04 每日互动股份有限公司 目标app的日活跃用户数量预测方法及计算机设备
CN111698287B (zh) * 2020-05-08 2023-06-27 广州微算互联信息技术有限公司 一种云手机活跃应用采集方法、系统及存储介质
CN113256342B (zh) * 2021-06-09 2024-04-30 广州虎牙科技有限公司 直播目标用户预估方法、装置、电子设备和计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140067500A1 (en) * 2012-08-28 2014-03-06 Christopher Robb Heineman Event outcomes prediction systems and methods
CN105787039A (zh) * 2016-02-25 2016-07-20 四川长虹电器股份有限公司 多时段计算并展示用户留存率的方法
CN106600344B (zh) * 2016-12-30 2020-07-07 广州虎牙信息科技有限公司 目标产品活跃用户数据获取方法和装置

Also Published As

Publication number Publication date
CN108022007A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108022007B (zh) 目标应用的日活跃用户数量预测方法、装置和终端设备
CN107613022B (zh) 内容推送方法、装置及计算机设备
CN109657138B (zh) 一种视频推荐方法、装置、电子设备及存储介质
CN109858740B (zh) 企业风险的评估方法、装置、计算机设备及存储介质
CN113220724B (zh) 用于处理数据流的方法、系统和计算机可读存储介质
US8631040B2 (en) Computer-implemented systems and methods for flexible definition of time intervals
CN105074724B (zh) 使用列式数据库中的直方图进行有效查询处理
CN107862551B (zh) 网络应用推广效果的预测方法、装置和终端设备
CN109840782B (zh) 点击率预测方法、装置、服务器以及存储介质
CN107851106A (zh) 用于关系数据库即服务的自动需求驱动的资源缩放
US7184935B1 (en) Determining and annotating a signature of a computer resource
CN107862022A (zh) 文化资源推荐系统
US10394772B2 (en) Database capacity estimation for database sizing
CN112086203A (zh) 一种疫情预测方法、装置及终端设备
CN109376873B (zh) 运维方法、装置、电子设备及计算机可读存储介质
CN112534456A (zh) 一种保护计划及保修数据分析的系统及方法
CN112052394A (zh) 专业内容信息的推荐方法、系统、终端设备和存储介质
CN107948752A (zh) 订阅主播排序方法、装置和终端
CN110782291A (zh) 广告投放用户确定方法及装置、存储介质及电子装置
CN110599240A (zh) 应用的偏好值确定方法、装置和设备及存储介质
CN108921587B (zh) 一种数据处理方法、装置及服务器
CN112882906A (zh) 用于基于软件的仪器化的实时报告的方法、系统以及计算机可读介质
CN111414410A (zh) 数据处理方法、装置、设备和存储介质
CN115659411A (zh) 数据分析的方法和装置
CN110766184A (zh) 订单量预测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant