CN106600344B - 目标产品活跃用户数据获取方法和装置 - Google Patents
目标产品活跃用户数据获取方法和装置 Download PDFInfo
- Publication number
- CN106600344B CN106600344B CN201611265007.1A CN201611265007A CN106600344B CN 106600344 B CN106600344 B CN 106600344B CN 201611265007 A CN201611265007 A CN 201611265007A CN 106600344 B CN106600344 B CN 106600344B
- Authority
- CN
- China
- Prior art keywords
- data
- target product
- product
- active user
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000014759 maintenance of location Effects 0.000 claims abstract description 85
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 230000000717 retained effect Effects 0.000 claims description 19
- 238000012544 monitoring process Methods 0.000 claims description 17
- 238000013178 mathematical model Methods 0.000 claims description 8
- 230000036961 partial effect Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000011155 quantitative monitoring Methods 0.000 abstract description 2
- 238000011161 development Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000002860 competitive effect Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种目标产品活跃用户数据获取方法和装置,包括:获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,以确定所述目标产品相应期的可预测新增用户量;根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线及所述观测期的新增用户量获得所述目标产品在观测期的可预测活跃用户量;结合预设的算法获取目标产品在所述观测期的活跃用户量;根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合目标产品已知的相对应数据,输出目标产品的日活跃用户量。根据本发明提出的方法,实现对日活跃用户量的可量化监测。
Description
技术领域
本发明涉及互联网技术领域,更具体地,涉及一种目标产品活跃用户数据获取方法和装置。
背景技术
随着互联网技术的不断发展,同类应用程序产品越来越多,同一个市场中竞争压力同步增长。如果能够获取竞争产品的活跃用户数据及其构成情况,作为制定投放战略的依据,将获取的竞品活跃用户特征整合到有效的产品战略制定、实施、监控和调整中,从而提高拓展市场的效率,在竞争中胜出,实现收益最大化。但是任何同类产品的用户活跃数据均属于公司的机密数据,外部人员无法获取该产品详细的活跃用户数据。
现有技术,依靠内部产品的活跃用户数据和有限的外部数据进行数据处理,获取同类产品部分时段的活跃用户数据,无法获取同类产品每日的活跃用户数据。
发明内容
鉴于上述问题,本发明提出了目标产品活跃用户数据获取方法和相应的装置,实现目标产品活跃用户量的可量化监测。
为实现上述目标,本发明采用了如下技术方案:
一种目标产品活跃用户数据获取方法,包括如下步骤:
获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量;
根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标产品在所述观测期的活跃用户量;
根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合所述目标产品已知的相对应数据,输出目标产品的日活跃用户量。
具体地,所述若干期搜索数据包括自该目标产品上线至观测期的各期搜索数据或部分期搜索数据,其中部分期搜索数据为连续期搜索数据或离散期搜索数据。
具体地,所述第三方数据平台中关于目标产品每期的搜索数据包括谷歌市场中的下载数据及下载排名数据、产品关键词的谷歌趋势、百度指数及访问流量中的任意一种或任意几种。
进一步地,当所述搜索数据是目标产品在多个市场中若干期的搜索数据时,根据各个市场及内部市场新增用户量之间的相关性,结合已知的内部市场每期的新增用户量,确定各个市场对应期的新增用户量。
进一步地,所述目标产品为一个或多个,当所述目标产品为多个时,根据各个目标产品之间的相关性,计算不同目标产品的可预测新增用户量,以便同时进行目标产品的活跃用户量。
进一步地,采集所述基础产品已知的往期用户留存率时,对比不同的渠道使用该产品的用户留存率,以便制定更加有效的拓展客户的方法及宣传策略。
进一步地,当能够获取与目标产品日活跃用户数据相关性较大的第三方数据时,利用该数据按照预设的运算规则或算法获取所述目标产品的日活跃用户数据。
具体地,所述建立日活跃用户量预测模型的过程具体为,采集所述基础产品的新增用户量、留存用户量、每期新增用户量排名,将采集到的数据作为模型训练样本,将产品上线时间作为加权系数,建立日活跃用户量预测模型。
相应地,本发明还提供了一种目标产品活跃用户数据获取装置,包括第一获取模块、第二获取模块、第三获取模块、输出模块:
第一获取模块,用于获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量;
第二获取模块,用于根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
第三获取模块,用于获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标应用程序在所述观测期的活跃用户量;
输出模块,用于根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合所述目标产品已知的相对应数据,输出目标产品的日活跃用户量。
优选地,所述第一获取模块中还包括数据监控模块,用于监控第三方数据平台中关于目标产品的搜索数据。该监控模块通过符合预设条件的数据进行筛选并抓取,缩短数据搜索时间,提高了计算效率。
与现有技术相比,本发明至少具有如下有益效果:
本发明提供的目标产品活跃用户数据获取方法,根据基础产品已知的用户数据和有限的目标产品的搜索数据确定目标产品的新增用户量和活跃用户量,实现目标产品活跃用户量的可预测化,实现对目标产品在市场中的可量化监测,对于基础产品在同一市场的投放规模和投放策略的制定有指导意义。
本发明提供的数据监控模块,实现对关于目标产品有效数据的自动抓取,缩短数据采集和计算时间,提高了计算效率。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一个实施例的目标产品活跃用户数据获取的方法流程图。
图2是利用本发明的另一实施例的目标产品活跃用户数据获取装置的框架示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如10、11等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
盒子是游戏辅助工具类产品的一种命名方式。
日活跃用于,简称日活,是在一个自然天内使用了应用产品的用户。
月活跃用户,简称月活,是在一个自然月内使用了应用产品的用户。
历史留存用户是在往期新增用户在当前期处于活跃状态的用户。
月活跃用户量由当月新增用户量与历史留存用户量组成。
本发明所述目标产品及基础产品均为应用程序产品,其中基础产品为已知用户新增数据及留存数据的内部应用程序产品,目标产品为与之产生竞争的应用程序产品。本发明所述活跃用户数据包含每期活跃用户量与每日活跃用户量。
以下实施例所揭示的目标产品活跃用户数据获取方法,详细实现过程请参阅图1,包括:
S10,获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量;
具体地,所述目标产品与基础产品属于同一类型产品,且两种产品的用户数据存在一定的相关性。
具体地,利用编写的数据采集模块采集目标产品在第三方数据平台上的搜索数据,如目标产品在谷歌应用市场的下载数据、下载排名数据、产品关键词的谷歌趋势、百度指数、网站排名、访问流量及用户评论量等数据。
本领域技术人员可以理解,利用获取的搜索数据进行统计分析获取与目标产品新增用户相关的数据。
其中,谷歌趋势通过分析谷歌全球数以十亿计的搜索结果,获取搜索关键词在谷歌中被搜索的频率和相关统计数据。百度指数跟百度风云榜和风向标等产品类似,让用户了解到各个关键词被搜索的次数。
优选地,利用第三方监测工具,如安卓系统使用酷传应用监控平台,监测上述免费数据。选择市场上成熟的监控系统,减少预测活跃用户量的周期,降低时间和人工成本,提高采集数据效率。
利用数据监控模块或监控工具实现对目标产品有效数据的筛选和抓取,缩短了数据采集时间、便于后续计算的流畅性,提高了计算效率。
具体地,采集到的若干期搜索数据包括自该目标上线至观测期的全部期数据或部分期数据,其中,部分期数据包括连续期数据和离散期数据。其中,所述一期数据可以是一个月、一个周、一个季度、一天的数据。实际情况中,外部人员很难获取到目标产品全部期的搜索数据,往往只能获取该目标产品上线后部分期的用户搜索数据。为了更加贴近实际情况,实施例中的周期选择为一个月进行说明。
具体地,根据采集到的免费数据和基础产品已知的每期新增用户数据,计算第三方数据与内部数据的相关性,建立数学回归模型,推测竞品的可预测新增用户数据。
例如,一款游戏的辅助工具,A游戏盒子和B游戏盒子,假设A游戏盒子是基础产品,B游戏盒子是目标产品,在谷歌游戏市场中获取到游戏盒子在7月至12月份的下载数据。假设市场中的游戏盒子只有这两种,则根据整个市场中游戏盒子的下载量减去其中A游戏盒子的下载量,获得B游戏盒子在7月份至12月份的下载量,该下载量为所述可预测下载量。
S11,根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
具体地,根据所述基础产品的往期新增用户的留存率及留存衰减速度,拟合衰减幂函数留存曲线,形如:f(x)=axb,a∈(0,1),b<0,其中a是次月留存率,b是留存衰减速度,x是留存月次即新增后的月数,所述次月留存率是指当月新增的用户中在次月还登录的用户数量与当月新增的用户数量之比。
结合上一示例,基础产品A游戏盒子在观测月及观测月的前5个月的月留存率如表一,已知次月留存率,根据表中数据拟合A游戏盒子的留存曲线为:0.5992x-0.369。月留存率能够反映出一个产品的用户留存情况,或者产品不同版本之间更新对用户的影响。
表一是新增用户在不同月份的留存率数据示例,详情如下:
月份 | 当月 | 1月后 | 2月后 | 3月后 | 4月后 | 5月后 |
留存率 | 100% | 59.92% | 48.15% | 41.69% | 37.31% | 33.09% |
优选地,采集基础产品的期留存率时,对比通过不同的渠道吸引过来的用户的留存率,以便制定更加有效地拓展客户的方法及宣传策略,从而形成良性反馈循环,进一步提高产品的留存率。
结合表一留存率数据及留存率的公式可知,随着留存期次的增加,留存率下降,下降的幅度随着期次的增加逐渐减小,当到达某一时间长度后留存率趋于稳定。留存率较高反映产品的质量和保留用户的能力越强。
具体地,当目标产品与基础产品的发展轨迹相似时,根据获取的基础产品的留存率函数近似计算目标产品的可预测新增用户量在观测期的留存量。
例如,目标产品获取的可预测新增用户数据如表二所示。
月份 | 5月份 | 6月份 | 7月份 | 8月份 |
新增 | 8 | 7 | 10 | 7 |
根据表一中的留存率和表二中的每月新增用户量,获得历史月份在8月份的留存量是14。
具体地,观测期活跃用户量是观测期之前期新增用户在观测期的留存量与观测期新增用户量的累加。
具体地,所述可预测用户量为可预测新增用户在预设观测期的留存量与观测期新增用户量的累加结果。
结合上述示例,获取的可预测历史月份新增用户在当前月的留存量为14,当前月的新增用户量为7,则可预测用户量为21。
S12,获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标产品在所述观测期的活跃用户量;
具体地,根据基础产品每期新增用户量与留存率,获取往期新增用户在观测期的留存量,该留存量与观测期活跃用户的比值是留存用户量在观测期活跃用户量中的占比数据。
具体地,采集基础产品发布后至观测月的月数,若研究观测月前n月用户数据,观测月至前n月累计包含的月数是(n+1)个月,观测月至前n月新增用户在观测月的留存用户量在观测月活跃用户中的占比为:观测月前i月新增用户在观测月的留存量/观测月活跃用户量。
具体地,根据观测月活跃用户中每期新增用户的实际占比,建立多层感知器网络模型进行函数逼近,获取不同期新增用户在观测期留存量的累计占比。进而获取目标产品可预测活跃用户在观测期活跃用户中的占比。
结合上一示例,已获取目标产品在5月至8月份的新增用户量,由于基础产品A与目标产品B的发展轨迹相似,由于两种产品上线时间不同,计算出目标产品B在5至8月份的发展情况与A的当前月及该月的前三个月相对应,将已获取的这四个月在当前月活跃用户量的占比数据进行累加逼近,得出该累加占比数据。目标产品可预测活跃用户量在观测月活跃用户量的占比,由所得占比数据与观测月新增用户数据在观测月活跃用户量的占比数据累加而得。
利用已知的基础产品历史留存量在活跃用户中的占比,推测发展轨迹相似的目标产品的占比数据,能够快速准确地获取可预测新增用户在观测期留存量的占比。为该推测过程建立数学模型,实现计算过程的自动化,提高获取目标产品活跃用户数据的效率。
留存用户数据及留存率反映了不同时期获得的用户流失情况,分析这个数据能够为分析用户流失提供分析依据,从而针对分析结果完善产品,从而形成良性循环,保持活跃用户的稳定增长,延长产品寿命。
S13,根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户预测模型,结合所述目标产品一直的相对应数据,输出目标产品的日活跃用户量。
具体地,结合上一示例,采集内部产品A的每月新增用户量、每月新增用户的留存量、不同时间段新增用户的留存量、产品的上线时间,,以所述各项数据作为自变量,以观测月每日活跃用户数据作为因变量,建立表征该相关性的数学回归与神经网络混合模型,将获取的上述数据作为训练样本数据,获取各项自变量的加权系数,该模型中的加权系数的大小代表了预测变量对日活跃用户量影响的大小。
具体地,利用所建立的模型预测基础产品A的日均活跃用户量与采集到的实际日均活跃用户量,将模型输出数据和对应的实际数据在分布图中显示,分别将离散的数据进行拟合,两条曲线几乎重合,通过计算两种曲线的偏差,得到该模型的准确率达到99.2%。
具体地,当所述搜索数据是目标产品在多个市场中若干期的搜索数据时,根据各个市场及内部市场新增用户量之间的相关性,结合已知的内部市场每期的新增用户量,确定各个市场对应期的新增用户量。
结合上一示例,所述搜索数据是B游戏盒子在一个市场中的搜索数据,该目标产品的分布范围是两个市场,这两个市场的用户新增量及活跃用户量的关系是1:1.5,根据该相关性及两个市场全部的搜索数据确定每个市场中该目标产品的可预测新增用户量。
具体地,当所述目标产品为一个或多个,当所述目标产品为多个时,根据各个目标产品之间的相关性,计算不同目标产品的可预测新增用户量,以便同时进行目标产品的活跃用户量。
结合上一示例,所述目标产品包括B游戏盒子、C游戏盒子,若已知两种游戏盒子的用户数据关系是,B游戏盒子的新增用户量是C游戏盒子的两倍,则根据两者新增用户量的关系及全部目标产品的搜索量,可以分别确定B游戏盒子和C游戏盒子的新增用户数据。
具体地,当能够获取与目标产品日活跃用户数据相关性较大的第三方数据时,利用该数据按照预设的运算规则或算法获取所述目标产品的日活跃用户数据。
具体地,所述相关性较大的第三方数据包括,每期中新增用户量最多的前若干天用户数据、用户日均活跃用户数据、产品上线天数等数据。
本发明还提供了一种目标产品活跃用户数据获取装置,如图2所示,包括:第一获取模块20、第二获取模块21、第三获取模块22、输出模块23。
第一获取模块20,用于获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量;
该获取模块中包含数据监控模块,用于监控第三方数据中与目标产品相关的搜索数据。通过数据监控模块,将有效数据从大数据中筛选出来,使后续计算更加便捷及流畅。
具体地,利用编写数据采集模块采集目标产品在第三方数据平台上的免费数据,如目标产品在谷歌应用市场的下载数据、下载排名数据、产品关键词的谷歌趋势、百度指数、网站排名、访问流量及用户评论量等数据。
优选地,借助第三方监控工具,如安卓系统使用酷传应用监控平台,监测上述免费数据。选择市场上成熟的监控系统,减少预测活跃用户量的周期,降低时间和人工成本,提高采集数据效率。
具体地,采集到的若干期搜索数据包括自该目标上线至观测期的全部期数据或部分期数据,其中,部分期数据包括连续期数据和离散期数据。其中,所述一期数据可以是一个月、一个周、一个季度、一天的数据。
具体地,根据采集到的搜索数据和基础产品已知的每期新增用户数据,计算第三方数据与内部数据的相关性,建立数学回归模型,推测竞品的可预测新增用户数据。
例如,一款游戏的辅助工具,A游戏盒子和B游戏盒子,假设A游戏盒子是基础产品,B游戏盒子是目标产品,在谷歌游戏市场中获取到游戏盒子在7月至12月份的下载数据。假设市场中的游戏盒子只有这两种,则根据整个市场中游戏盒子的下载量减去其中A游戏盒子的下载量,获得B游戏盒子在7月份至12月份的下载量,该下载量为所述可预测下载量。
第二获取模块21,用于根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
具体地,根据已知的基础产品的往期新增用户的留存率及留存衰减速度,拟合衰减幂函数留存曲线,形如:f(x)=axb,a∈(0,1),b<0,其中a是次月留存率,b是留存衰减速度,x是留存月次即新增后的月数,所述次月留存率是指当月新增的用户中在次月还登录的用户数量与当月新增的用户数量之比。
结合上一示例,基础产品A游戏盒子在观测月及观测月的前5个月的月留存率如表三所示,已知次月留存率,根据表中数据拟合A游戏盒子的留存曲线为:0.5992x-0.369。
表三是新增用户在不同月份的留存率数据示例,详情如下:
月份 | 当月 | 1月后 | 2月后 | 3月后 | 4月后 | 5月后 |
留存率 | 100% | 59.92% | 48.15% | 41.69% | 37.31% | 33.09% |
月留存率能够反映出一个产品的用户留存情况,或者产品不同版本之间更新对用户的影响。
结合表三留存率数据及留存率的公式可知,随着留存期次的增加,留存率下降,下降的幅度随着期次的增加逐渐减小,当到达某一时间长度后留存率趋于稳定。留存率较高反映产品的质量和保留用户的能力越强。
具体地,当目标产品与基础产品的发展轨迹相似时,根据获取的基础产品的留存率函数近似计算目标产品的可预测新增用户量在观测期的留存量。
例如,目标产品获取的可预测新增用户数据如表四所示。
月份 | 5月份 | 6月份 | 7月份 | 8月份 |
新增 | 8 | 7 | 10 | 7 |
根据表三中的留存率和表四中的每月新增用户量,获得历史月份在8月份的留存量是14。
具体地,观测期活跃用户量是观测期之前期新增用户在观测期的留存量与观测期新增用户量的累加。
具体地,所述可预测用户量为可预测新增用户在预设观测期的留存量与观测期新增用户量的累加结果。
结合上述示例,获取的可预测历史月份新增用户在当前月的留存量为14,当前月的新增用户量为7,则可预测用户量为21。
第三获取模块22,用于获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标应用程序在所述观测期的活跃用户量;
具体地,采集基础产品发布后至观测月的月数,若研究观测月前n月用户数据,观测月至前n月累计包含的月数是(n+1)个月,观测月至前n月新增用户在观测月的留存用户量在观测月活跃用户中的占比为:观测月前i月新增用户在观测月的留存量/观测月活跃用户量。
具体地,根据观测月活跃用户中每期新增用户的实际占比,建立多层感知器网络模型进行函数逼近,获取不同期新增用户在观测期留存量的累计占比。进而获取目标产品可预测活跃用户在观测期活跃用户中的占比。
结合上一示例,已获取目标产品在5月至8月份的新增用户量,由于基础产品A与目标产品B的发展轨迹相似,由于两种产品上线时间不同,计算出目标产品B在5至8月份的发展情况与A的当前月及该月的前三个月相对应,将已获取的这四个月在当前月活跃用户量的占比数据进行累加逼近,得出该累加占比数据。目标产品可预测活跃用户量在观测月活跃用户量的占比,由所得占比数据与观测月新增用户数据在观测月活跃用户量的占比数据累加而得。
根据已知的确切留存用户在活跃用户中的占比,推测发展轨迹相似产品的占比数据,能够快速准确地获取可预测新增用户在观测期留存量的占比。为该推测过程建立数学模型,实现计算过程的自动化,提高获取目标产品活跃用户数据的效率。
输出模块23,用于根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合所述目标产品已知的相对应数据,输出目标产品的日活跃用户量。
具体地,结合上一示例,采集内部产品A的每月新增用户量、每月新增用户的留存量、不同时间段新增用户的留存量、产品的上线时间,将所获取的数据作为训练样本数据,计算所获取的数据与该观测月日均活跃用户量的相关性,建立表征该相关性的数学回归与神经网络混合模型,该模型中的加权系数的大小代表了预测变量对日活跃用户量影响的大小。
具体地,利用所建立的模型预测基础产品A的日均活跃用户量与采集到的实际日均活跃用户量,将模型输出数据和对应的实际数据在分布图中显示,分别将离散的数据进行拟合,两条曲线几乎重合,通过计算两种曲线的偏差,得到该模型的准确率达到99.2%。
本技术领域技术人员可以理解,计算过程中可以同时获取多个目标产品在多个市场中的搜索数据,本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。该处理器可以执行任一本实施例的操作指令。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种目标产品活跃用户数据获取方法,其特征在于,包括:
获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量,所述目标产品和所述基础产品属于同一类型产品;
根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标产品在所述观测期的活跃用户量;其中,基础产品的在观测期的活跃用户量中留存用户量是根据所述基础产品每期新增用户量与留存率,获取往期新增用户在观测期的留存量所得到;
根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合所述目标产品已知的相对应数据,输出目标产品的日活跃用户量。
2.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,所述若干期搜索数据包括自该目标产品上线至观测期的各期的搜索数据或部分期搜索数据,其中部分期搜索数据为连续期搜索数据或离散期搜索数据。
3.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,所述第三方数据平台中关于目标产品每期的搜索数据包括谷歌市场中的下载数据及下载排名数据、产品关键词的谷歌趋势、百度指数及访问流量中的任意一种或任意几种。
4.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,当所述搜索数据是目标产品在多个市场中若干期的搜索数据时,根据各个市场及内部市场新增用户量之间的相关性,结合已知的内部市场每期的新增用户量,确定各个市场对应期的新增用户量。
5.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,所述目标产品为一个或多个,当所述目标产品为多个时,根据各个目标产品之间的相关性,计算不同目标产品的可预测新增用户量,以便同时进行目标产品的活跃用户量。
6.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,采集所述基础产品已知的往期用户留存率时,对比不同的渠道使用该产品的用户留存率,以便制定更加有效的拓展客户的方法及宣传策略。
7.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,当能够获取与目标产品日活跃用户数据相关性较大的第三方数据时,利用该数据按照预设的运算规则或算法获取所述目标产品的日活跃用户数据。
8.根据权利要求1所述的目标产品活跃用户数据获取方法,其特征在于,所述建立日活跃用户量预测模型的过程具体为:采集所述基础产品的新增用户量、留存用户量、每期新增用户量排名,将采集到的数据作为模型训练样本,将产品上线时间作为加权系数,建立日活跃用户量预测模型。
9.一种目标产品活跃用户数据获取装置,其特征在于,包括:
第一获取模块,用于获取第三方数据平台中关于目标产品若干期的搜索数据,确定该搜索数据与基础产品同期新增用户量的相关性,建立表述该相关性的数学模型,以确定所述目标产品相应期的可预测新增用户量,所述目标产品和所述基础产品属于同一类型产品;
第二获取模块,用于根据所述基础产品的往期用户留存率拟合留存曲线,依据该留存曲线的留存率获取所述目标产品的可预测新增用户量在预设观测期的留存用户量,将该留存用户量与所述观测期的新增用户量进行累加,获得所述目标产品在观测期的可预测活跃用户量;
第三获取模块,用于获取所述基础产品在观测期的活跃用户量中留存用户量的占比数据,对该占比数据进行累加获取所述目标产品的可预测活跃用户量在该观测期活跃用户中的占比数据,结合预设的算法获取所述目标应用程序在所述观测期的活跃用户量;其中,基础产品的在观测期的活跃用户量中留存用户量是根据所述基础产品每期新增用户量与留存率,获取往期新增用户在观测期的留存量所得到;
输出模块,用于根据基础产品每期所述留存用户量、新增用户量、活跃用户量与日活跃用户量的相关性建立日活跃用户量预测模型,结合所述目标产品已知的相对应数据,输出目标产品的日活跃用户量。
10.根据权利要求9所述的目标产品活跃用户数据获取装置,其特征在于,所述第一获取模块中还包括数据监控模块,用于监控第三方数据平台中关于目标产品的搜索数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611265007.1A CN106600344B (zh) | 2016-12-30 | 2016-12-30 | 目标产品活跃用户数据获取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611265007.1A CN106600344B (zh) | 2016-12-30 | 2016-12-30 | 目标产品活跃用户数据获取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106600344A CN106600344A (zh) | 2017-04-26 |
CN106600344B true CN106600344B (zh) | 2020-07-07 |
Family
ID=58581779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611265007.1A Active CN106600344B (zh) | 2016-12-30 | 2016-12-30 | 目标产品活跃用户数据获取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106600344B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108881333A (zh) * | 2017-05-09 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种预测日活跃对象数量的方法及设备 |
CN107463660B (zh) * | 2017-07-31 | 2020-10-16 | 广州虎牙信息科技有限公司 | 产品活跃用户数据测算方法及计算机设备 |
CN107742261A (zh) * | 2017-11-01 | 2018-02-27 | 赛尔网络有限公司 | 获取集团用户接入覆盖率提升权重的方法 |
CN108022007B (zh) * | 2017-11-27 | 2020-12-22 | 广州虎牙信息科技有限公司 | 目标应用的日活跃用户数量预测方法、装置和终端设备 |
CN108322783B (zh) * | 2018-01-25 | 2021-08-17 | 广州虎牙信息科技有限公司 | 视频网站用户规模推测方法、存储介质和终端 |
CN108364197A (zh) * | 2018-02-12 | 2018-08-03 | 广州虎牙信息科技有限公司 | 确定应用的用户留存率的方法、应用推广方法及电子设备 |
CN109117462A (zh) * | 2018-06-29 | 2019-01-01 | 武汉掌游科技有限公司 | 一种游戏活跃玩家人数的预测方法 |
CN110766185A (zh) * | 2018-07-25 | 2020-02-07 | 北京京东尚科信息技术有限公司 | 用户量的确定方法和系统、计算机系统 |
CN109272348B (zh) * | 2018-08-22 | 2023-06-20 | 中国平安人寿保险股份有限公司 | 活跃用户数量确定方法及装置、存储介质和电子设备 |
CN109242557A (zh) * | 2018-08-28 | 2019-01-18 | 北京小米移动软件有限公司 | 用户留存率的确定方法、装置及设备 |
CN109509017B (zh) * | 2018-09-27 | 2024-04-05 | 中国平安人寿保险股份有限公司 | 基于大数据分析的用户留存率预测方法及装置 |
CN109711897A (zh) * | 2018-12-29 | 2019-05-03 | 贵州创鑫旅程网络技术有限公司 | 日活跃用户数量预测方法及装置 |
CN109740822A (zh) * | 2019-01-22 | 2019-05-10 | 深圳市酷开网络科技有限公司 | 一种ott设备活跃量的预测处理方法、系统及存储介质 |
CN109858694A (zh) * | 2019-01-28 | 2019-06-07 | 上海连尚网络科技有限公司 | 一种日活跃用户数预测的方法及设备 |
CN110060091B (zh) * | 2019-03-18 | 2023-06-30 | 平安科技(深圳)有限公司 | 激励因子的留存分析方法、装置、计算机设备及存储介质 |
CN110245993A (zh) * | 2019-06-20 | 2019-09-17 | 山东乐格信息科技有限公司 | 一种基于大数据分析的数据处理方法和系统 |
CN110740193A (zh) * | 2019-10-30 | 2020-01-31 | 江苏满运软件科技有限公司 | 一种平台活跃度的预测方法、装置、存储介质及电子设备 |
CN112116381B (zh) * | 2020-08-31 | 2021-05-07 | 北京基调网络股份有限公司 | 基于lstm神经网络的月活预测方法、存储介质和计算机设备 |
CN113269370B (zh) * | 2021-06-18 | 2023-12-12 | 腾讯科技(成都)有限公司 | 一种活跃用户预测方法、装置、电子设备及可读存储介质 |
CN113610555A (zh) * | 2021-07-02 | 2021-11-05 | 北京达佳互联信息技术有限公司 | 目标应用的投放方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021433A (zh) * | 2014-06-18 | 2014-09-03 | 上海美琦浦悦通讯科技有限公司 | 数据信息通信网络中实现用户流失预测的系统及方法 |
CN104504084A (zh) * | 2014-12-24 | 2015-04-08 | 小米科技有限责任公司 | 确定用户留存率的方法及装置 |
CN105787039A (zh) * | 2016-02-25 | 2016-07-20 | 四川长虹电器股份有限公司 | 多时段计算并展示用户留存率的方法 |
CN106056400A (zh) * | 2016-05-19 | 2016-10-26 | 政和科技股份有限公司 | 预测新增用户数的方法、装置及系统 |
-
2016
- 2016-12-30 CN CN201611265007.1A patent/CN106600344B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021433A (zh) * | 2014-06-18 | 2014-09-03 | 上海美琦浦悦通讯科技有限公司 | 数据信息通信网络中实现用户流失预测的系统及方法 |
CN104504084A (zh) * | 2014-12-24 | 2015-04-08 | 小米科技有限责任公司 | 确定用户留存率的方法及装置 |
CN105787039A (zh) * | 2016-02-25 | 2016-07-20 | 四川长虹电器股份有限公司 | 多时段计算并展示用户留存率的方法 |
CN106056400A (zh) * | 2016-05-19 | 2016-10-26 | 政和科技股份有限公司 | 预测新增用户数的方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106600344A (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106600344B (zh) | 目标产品活跃用户数据获取方法和装置 | |
CN104254848B (zh) | 动态离群值偏倚减少系统和方法 | |
CN104298679B (zh) | 应用业务推荐方法及装置 | |
Wang et al. | Diffusive logistic model towards predicting information diffusion in online social networks | |
MacEachern et al. | A new ranked set sample estimator of variance | |
Cusimano et al. | A new method for handling missing species in diversification analysis applicable to randomly or nonrandomly sampled phylogenies | |
MX2015007248A (es) | Metodo y dispositivo para visualizar software de aplicacion. | |
CN105989074A (zh) | 一种通过移动设备信息进行推荐冷启动的方法和装置 | |
CN107862022A (zh) | 文化资源推荐系统 | |
CN103902566A (zh) | 一种基于微博用户行为的人格预测方法 | |
Ye et al. | Big data processing framework for manufacturing | |
CN106991039A (zh) | 用于平台自适应引擎系统的测试方法及装置 | |
CN110020152A (zh) | 应用推荐方法及装置 | |
CN117148169B (zh) | 基于大数据的电池使用时间预测方法、系统、设备及介质 | |
CN106156123B (zh) | 活跃值计算方法及装置 | |
CN113806073A (zh) | 一种边缘计算平台算力分配调度方法及系统 | |
Piña-García et al. | Spiraling Facebook: an alternative Metropolis–Hastings random walk using a spiral proposal distribution | |
CN116316635B (zh) | 基于量测信息的电力协同控制方法及系统 | |
CN117035872A (zh) | 一种基于大数据的数据处理管理方法 | |
CN109086341B (zh) | 应用群体智能的热点事件热度度量方法 | |
CN111080089A (zh) | 一种基于随机矩阵理论的线损率关键因子确定方法和装置 | |
CN113010536B (zh) | 基于流式数据处理的用户标签获取方法及装置 | |
Ourbih-Tari et al. | Survival function estimation with non parametric adaptive refined descriptive sampling algorithm: A case study | |
EP3493082A1 (en) | A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends | |
AU2020335019B2 (en) | Evaluation method based on mobile news client and system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |