CN106682027A - 一种应用软件的玩家数据估算方法 - Google Patents

一种应用软件的玩家数据估算方法 Download PDF

Info

Publication number
CN106682027A
CN106682027A CN201510761683.7A CN201510761683A CN106682027A CN 106682027 A CN106682027 A CN 106682027A CN 201510761683 A CN201510761683 A CN 201510761683A CN 106682027 A CN106682027 A CN 106682027A
Authority
CN
China
Prior art keywords
application software
data
ranking
function
estimation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510761683.7A
Other languages
English (en)
Inventor
黄育钊
杨威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN201510761683.7A priority Critical patent/CN106682027A/zh
Publication of CN106682027A publication Critical patent/CN106682027A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种应用软件的玩家数据估算方法,包括以下步骤:1)获取应用排行榜中相关应用软件的排名名次;所述相关应用软件包括待分析的应用软件以及多个参考应用软件;2)收集上榜的参考应用软件的玩家数据,建立排名名次和玩家数据之间的对应关系表;3)根据对应关系表,确定出关于名次和数据之间关系的函数;4)将待分析的应用软件的名次代入步骤3)中确定的函数,得到所述待分析的应用软件的数据信息。本发明的应用软件的玩家数据估算方法,建立名次和数据之间的函数关系。当待分析的感兴趣的应用软件的名次已知后,即可代入建模确定的函数式中,获取感兴趣的应用软件的数据,从而更加准确、及时地了解和掌握应用软件的运营走势。

Description

一种应用软件的玩家数据估算方法
【技术领域】
本发明涉及对应用软件的数据分析,特别是涉及一种应用软件的数据获取方法。
【背景技术】
随着移动终端越来越广泛地应用,针对移动终端开发的应用也层出不穷,数量庞大。虽然各手机应用排行榜,会按照一定规则对应用软件进行评分,提供一些应用软件排名的榜单。但此类榜单,仅能获取应用软件的排名名次信息,很难获取这些上榜应用软件的一些深层次的反应成功与否的信息,例如用户数据量、运营收入情况等。因此,寻找一种能获取应用软件的反应成功与否方面的数据的方法显得非常有必要。
【发明内容】
本发明所要解决的技术问题是:弥补上述现有技术的不足,提出一种应用软件的玩家数据估算方法,可获取有关应用软件成功与否方面的数据,以便对应用软件的开发提供参考。
本发明的技术问题通过以下的技术方案予以解决:
一种应用软件的玩家数据估算方法,包括以下步骤:1)获取应用排行榜中相关应用软件的排名名次;所述相关应用软件包括待分析的应用软件以及多个参考应用软件;2)收集上榜的参考应用软件的玩家数据,建立排名名次和玩家数据之间的对应关系表;3)根据所述对应关系表,确定出关于名次和数据之间关系的函数;4)将待分析的应用软件的名次代入步骤3)中确定的函数,得到所述待分析的应用软件的数据信息。
本发明与现有技术对比的有益效果是:
本发明的应用软件的玩家数据估算方法,根据应用排行榜的名次信息,利用上榜的参考应用软件的数据,建立名次和数据之间的函数关系,从而根据其它应用软件的名次信息来估算该应用软件的数据情况,从而直观、及时地考察感兴趣的应用软件的数据表现,为公司决策、产品研发及竞争对手的产品分析提供数据参考。
【附图说明】
图1是本发明具体实施方式的应用软件的玩家数据估算方法的流程图。
【具体实施方式】
下面结合具体实施方式并对照附图对本发明做进一步详细说明。
本发明的构思是:排行榜,例如应用商店提供的排行榜、权威机构发布的排行榜(如app annie排行榜)等,是根据一定的算法和规则,对应用市场内的应用软件,根据表现按由好到差进行排序的榜单。排行榜内的名次高低,能较好的反映出一款应用软件的成功与否,是对感兴趣的应用软件进行了解和分析的重要途径。但是,排行榜仅给出名次信息,而上榜产品的每日营收数值及每日产品新增用户数量等数据却难以获取。而自家公司上榜应用软件的名次以及相关数据是可以收集到的,这样,利用自家公司的上榜应用软件的名次,相关数据信息建立一种排名名次与产品营收或者新增用户量数值等数据的估算模型,即可由想分析的感兴趣的应用软件的名次信息获得相关数据信息,以便提供后续开发时决策参考。
如图1所示,为本具体实施方式的应用软件的玩家数据估算方法的流程图,包括以下步骤:
1)获取应用排行榜中相关应用软件的排名名次;所述相关应用软件包括待分析的应用软件以及多个参考应用软件。
该步骤中,参考应用软件可选择自家公司上榜的应用软件,这样,后续步骤2)要收集的玩家数据也比较方便获取。当然,参考应用软件还可选择其它可方便获取数据的上榜的应用软件,只要某些应用软件已上榜,且其相关数据可便捷获取到,这类应用软件均可作为此处的参考应用软件。
应用排行榜可为应用市场公司提供的排行榜,或者为权威数据分析机构发布的排行榜。为便于说明,如下以应用商店的排行榜的名次为例进行说明,利用排行榜上的参考应用软件的数据来估算感兴趣的应用软件的数据情况。其它可获取到的应用排行榜,如较为中立、客观、权威,则同样可作为分析的基础以获取相关数据,如下不一一罗列。
获取名次的方式有多种。由于排行榜每天都是动态变化的,所以每天均需收集榜单的最新信息。可获取设定时间段内的名次信息,以确保后续建立的名次和数据的样本组数较多。优选地,可通过网络爬虫技术获取应用软件的排名名次。利用网络爬虫技术,每天对排行榜(如免费榜或畅销榜)的应用软件名称与名次自动获取并保存,以供后续使用。
2)收集上榜的参考应用软件的玩家数据,建立排名名次和玩家数据之间的对应关系表。
如步骤1)中参考应用软件选择自家公司上榜的应用软件,而自家公司这几款应用软件的玩家数据是已知且较为容易获取到的,则该步骤可较为便捷地收集到玩家数据。玩家数据为反映应用软件在玩家中受欢迎的程度的数据,例如应用软件的日新增玩家数量、玩家付费总额、玩家评价数量等等。收集的玩家数据类型与排行榜的性质有关联,例如排行榜为免费榜,相应地,玩家数据为应用软件的日新增用户量。如排行榜为畅销榜,相应地,玩家数据为应用软件的日收入数据。
由于应用商店的排行榜的排序规则会不定期地发生变动,其在一段时间内会保持不变,同时为估算感兴趣的应用软件的最新数据情况,公司上榜的参考应用软件的玩家数据也选用最近一段设定时间段内的玩家数据。
具体地,首先,将最近一段设定时间内的公司上榜应用软件的名次和玩家数据收集起来。为保证样本数据充足,应尽量多的收集上榜应用;时间段也不宜过短,至少一周以上。如表1所示,为获取的免费榜上参考应用软件(应用A、应用B、应用C和应用D)的名次信息。如表2所示,为获取的参考应用软件的日新增用户量数据。如针对畅销榜,表格形式类似,只是获取的数据类型为应用软件的日收入数据,在此不再重复说明。
然后,按照应用软件名称,将各应用软件的数据与榜单上的名次对应起来,即得到:免费榜中各应用软件每天的名次和日新增用户数据,或者,畅销榜中各应用软件每天的名次和日收入数据。如表3所示,为针对免费榜的各应用软件每天的名次和日新增用户数据。
表3
名次 数据
2 4563
3 4060
4 3244
7 2177
7 1988
最后,以名次为基准,对各个名次下的数据求均值,得到对应各个名次的数据。即得到免费榜排名下的名次与日新增用户量均值数据的对应关系表,或者畅销榜排名下的名次与日收入均值数据的对应关系表。如表4所示,为求均值后,免费榜中名次与日新增用户量均值数据的对应关系表。
表4
名次 数据
2 4563.0
3 4060.0
4 3244.0
7 2082.5
优选地,为确保后续步骤拟合参数时的有效性,设置检测步骤,确保训练数据(名次和数据)的数据量,如果数据量太低,则发出报错提示,程序终止。该步骤中,检测所述名次和数据的数据组数是否大于设定阈值,如果是,则执行所述步骤3);如果否,则发出报错提示,结束。
3)根据步骤2)中的对应关系表,确定出关于名次和数据之间关系的函数。
该步骤中,根据前述获取的x(名次)、y(数据)的值,确定x与y的映射函数关系。确定时,可通过如下步骤得到:
31)选取多种函数,根据步骤2)中的对应关系表,拟合出各函数中的参数;
32)计算各个函数的R2值,所述R2值是度量函数对数据实际观测值拟合程度的统计量,取值范围为[0,1];
33)选择R2值最大的函数作为确定出的关于名次和数据之间关系的函数。
具体地,步骤31)中选取的多种函数包括指数函数y=a×ebx、对数函数y=a*ln x+b、一元线性函数y=a*x+b、幂函数y=a*xb和多项式函数y=a*x3+b*x2+c*x+d。根据步骤2)中的名次和数据信息,即可拟合出上述各函数中的参数。
以对幂函数参数的拟合为例,可取对数将幂函数转化为线性公式,如下所示:
ln y=ln a+b*ln x (公式1)
t=s+b*r (公式2)
其中,t=ln y,s=ln a,r=ln x。
利用最小二乘法进行线性拟合,求得a,b分别为:
(公式3)
(公式4)
其中,为t的算术平均值,为r的算术平均值。
如上,将名次的值作为x代入,数据的值作为y代入,即可确定幂函数中参数a和b的取值,从而得到参数值确定的幂函数。
其余函数中参数的拟合可参照上述过程进行,如函数是线性的,则直接通过最小二乘法进行参数的拟合;如函数不是线性的,则先转换为线性的,然后通过最小二乘法进行参数的拟合。另外,除上述列举的五种函数外,还可以选取其余函数形式。选取的函数类型越多,则选定到合适的函数关系的可能性越大,x-y之间的估算模型越精确。
各函数的参数拟合求解后,需从多个函数中选择最合适的一个。以R2为考察指标,从多个函数中挑选合适的函数。所述R2值是度量函数对数据实际观测值拟合程度的统计量。一般来说,R2的值大于0.5时,拟合才是有效的;R2的值越大,说明拟合程度越好。如果,R2值低于0.5,则需更新前述参数的拟合公式,重新确定函数参数,重新计算R2,直至R2的值大于0.5。所挑选的函数需满足:(1)R2的值较大;(2)对数据变化的适应性较好,稳定性较高。
其中,R2的值根据如下公式计算得到,其中,n表示数据的个数,以表4为例,则n=3。yi表示步骤2)中的数据的实际观测值,即y1=4563.0,y2=3244.0,y3=2082.5。表示数据的实际观测值的平均值,即 将步骤2)中的名次的值作为x代入步骤31)中拟合出参数后的函数,得到数据的拟合估计值,即为的值。将各值代入上述公式,即得到对应一个函数的R2的值。
如表5所示,为以不同设定时间段下免费榜的参考应用软件的名次与数据为例,得到的指数、对数、一元线性函数、幂函数和多项式函数五种函数类型在最近的不同设定时间段下所拟合出的函数式以及R2值。
表5
根据表5中的R2值,10天估算时,幂函数的R2值最大。多次估算,也相对较稳定,因此选择幂函数作为确定出的关于名次和数据之间关系的函数。既可以选取10天估算下的幂函数,也可以选取30天估算以及60天估算下得到的幂函数。时间段越短,则数据均较新,但由于时间短,建模的样本数据少,精确度可能稍差。用户可根据对对数据获取的精确度设定估算时选定的时间长短。
确定名次与数据的估算函数模型后,即可对感兴趣的应用软件进行分析,估算获取数据。
4)将待分析的应用软件的名次代入步骤3)中确定的函数,得到所述待分析的应用软件的数据信息。
例如,步骤3)中根据最近10天的免费榜的名次和日新增用户量均值数据,确定的函数为y=A4×xB4,而待分析的应用软件在这10天内在免费榜上的名次取均值为6,根据自变量x=6计算出的y,就是待分析的应用软件在这10天内的日新增用户量均值。同样地,如根据畅销榜的名次和日收入数据,相应地,即可估算获取到待分析的应用软件的日收入数据。
综上所述,本具体实施方式的应用软件的玩家数据估算方法,利用上榜的多个参考应用软件的名次和数据,建立名次和数据之间的函数关系。当待分析的感兴趣的应用软件的名次已知后,即可代入建模确定的函数式中,获取感兴趣的应用软件的数据,例如日新增用户量数据或者日收入数据等。通过该方法,能够直观地查看到感兴趣的应用软件的关键指标,更加准确、及时地了解和掌握应用软件的运营走势,为公司决策、产品研发及竞争对手的产品分析提供数据参考。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下做出若干替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (10)

1.一种应用软件的玩家数据估算方法,其特征在于:包括以下步骤:
1)获取应用排行榜中相关应用软件的排名名次;所述相关应用软件包括待分析的应用软件以及多个参考应用软件;
2)收集上榜的参考应用软件的玩家数据,建立排名名次和玩家数据之间的对应关系表;
3)根据所述对应关系表,确定出关于名次和数据之间关系的函数;
4)将待分析的应用软件的名次代入步骤3)中确定的函数,得到所述待分析的应用软件的数据信息。
2.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述步骤3)中,确定函数的步骤包括:31)选取多种函数,根据所述对应关系表,拟合出各函数中的参数;32)计算各个函数的R2值,所述R2值是度量函数对数据实际观测值拟合程度的统计量,取值范围为[0,1];33)选择R2值最大的函数作为确定出的关于名次和数据之间关系的函数。
3.根据权利要求2所述的应用软件的玩家数据估算方法,其特征在于:所述步骤32)中,根据如下公式计算得到函数的R2值,其中,n表示步骤2)中数据的个数;yi表示步骤2)中的数据的实际观测值;表示数据的实际观测值的平均值;将步骤2)中的名次信息代入步骤31)中拟合出参数后的函数,得到数据的拟合估计值,作为代入公式。
4.根据权利要求2所述的应用软件的玩家数据估算方法,其特征在于:所述步骤31)中,选取的多种函数包括指数函数、对数函数、一元线性函数、幂函数和多项式函数。
5.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述步骤1)中,获取设定时间段相关应用软件的排名名次;所述步骤2)中,收集所述设定时间段内上榜的参考应用的排名名次和数据,对各个排名名次下的数据求均值,得到对应各个排名名次的数据。
6.根据权利要求5所述的应用软件的玩家数据估算方法,其特征在于:所述设定时间段在一周以上。
7.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述步骤1)中,通过网络爬虫技术获取应用软件的排名名次。
8.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述步骤2)还包括检测过程:检测所述排名名次和数据组数是否大于设定阈值,如果是,则执行所述步骤3);如果否,则发出报错提示,结束。
9.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述应用排行榜为应用商店中的排行榜。
10.根据权利要求1所述的应用软件的玩家数据估算方法,其特征在于:所述应用排行榜为免费榜,相应地,所述玩家数据为应用软件的日新增用户量;或者,所述应用排行榜为畅销榜,相应地,所述玩家数据为应用软件的日收入数据。
CN201510761683.7A 2015-11-10 2015-11-10 一种应用软件的玩家数据估算方法 Pending CN106682027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510761683.7A CN106682027A (zh) 2015-11-10 2015-11-10 一种应用软件的玩家数据估算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510761683.7A CN106682027A (zh) 2015-11-10 2015-11-10 一种应用软件的玩家数据估算方法

Publications (1)

Publication Number Publication Date
CN106682027A true CN106682027A (zh) 2017-05-17

Family

ID=58864576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510761683.7A Pending CN106682027A (zh) 2015-11-10 2015-11-10 一种应用软件的玩家数据估算方法

Country Status (1)

Country Link
CN (1) CN106682027A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609527A (zh) * 2012-02-13 2012-07-25 百度在线网络技术(北京)有限公司 效果类推广信息监控方法及系统
CN102831526A (zh) * 2011-06-17 2012-12-19 苏州工业园区辰烁软件科技有限公司 一种针对在线交易应用的商品搜索排序的方法和系统
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
WO2015128536A1 (en) * 2014-02-26 2015-09-03 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831526A (zh) * 2011-06-17 2012-12-19 苏州工业园区辰烁软件科技有限公司 一种针对在线交易应用的商品搜索排序的方法和系统
CN102609527A (zh) * 2012-02-13 2012-07-25 百度在线网络技术(北京)有限公司 效果类推广信息监控方法及系统
WO2015128536A1 (en) * 2014-02-26 2015-09-03 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
CN103914743A (zh) * 2014-04-21 2014-07-09 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法

Similar Documents

Publication Publication Date Title
CN107122467B (zh) 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
CN111327377B (zh) 场强预测方法、装置、设备及存储介质
US7660792B2 (en) System and method for spam identification
US20140278738A1 (en) Systems and methods for unified scoring
US20180247212A1 (en) Method and device for evaluating cooking quality
US9224105B2 (en) Method and system of automatically downloading media content in a preferred network
CN103389974B (zh) 进行信息搜索的方法及服务器
US20140274245A1 (en) Fantasy player algorithm
US20160210293A1 (en) Systems and methods for implementing achievement guided recommendations
CN106294564A (zh) 一种视频推荐方法及装置
CN109284477A (zh) 一种水文序列的丰枯组合概率计算方法及装置
CN109657962A (zh) 一种品牌的声量资产的评估方法及系统
CN111753124A (zh) 一种音乐推荐方法及服务器
CN117331846A (zh) 一种基于互联网软件开发运行测试管理系统
CN104320704A (zh) 网络电视装机状态的检测方法和装置
CN110472659A (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
CN116701950B (zh) 一种推荐系统用点击率预测模型去偏方法、装置及介质
CN109636184A (zh) 一种品牌的账号资产的评估方法及系统
CN110309411A (zh) 一种资源推荐方法及装置
CN106682027A (zh) 一种应用软件的玩家数据估算方法
CN116974926A (zh) 测试记录生成方法、系统、终端设备及计算机存储介质
CN103593426B (zh) 一种商品搜索及提供方法及装置
CN114881677A (zh) 一种用户需求分析方法、装置及设备
CN110232517A (zh) 一种移动群智感知用户收益选取方法
CN109284320A (zh) 大数据平台上的自动回归诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170517