CN109658147A - 一种基于霍克斯过程的移动应用流行度预测方法 - Google Patents
一种基于霍克斯过程的移动应用流行度预测方法 Download PDFInfo
- Publication number
- CN109658147A CN109658147A CN201811533711.XA CN201811533711A CN109658147A CN 109658147 A CN109658147 A CN 109658147A CN 201811533711 A CN201811533711 A CN 201811533711A CN 109658147 A CN109658147 A CN 109658147A
- Authority
- CN
- China
- Prior art keywords
- mobile application
- popularity
- application
- method based
- prediction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008569 process Effects 0.000 title claims abstract description 40
- 230000008451 emotion Effects 0.000 claims description 17
- 241000414967 Colophon Species 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于霍克斯过程的移动应用流行度预测方法,首先从在线应用商店中获取移动应用的相关数据,从中提取并分析影响移动应用流行度的复杂因素;然后针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型;最后基于建立的模型,预测移动应用未来的流行度。本发明考虑了多种复杂因素对移动应用流行度的影响,并通过对复杂因素进行分析,基于霍克斯过程,建立流行度预测模型,从而准确地预测移动应用未来的流行度,为移动应用开发者提供辅助决策。
Description
技术领域
本发明涉及移动应用数据分析领域,特别是涉及一种基于霍克斯过程的移动应用流行度预测方法。
背景技术
近年来,随着移动应用的发展,移动应用的种类和数量越来越多。移动应用逐渐改变了人们的生活方式,为人们提供了许多便捷的服务。随着移动应用的流行,越来越多的应用开发者加入到移动应用市场中,导致应用之间的竞争日益激烈。每隔一段时间,都会有许多新的应用出现,同时也会有许多旧的应用消亡。因此,对于移动应用及其开发者而言,为了能在竞争激烈的应用市场中不断发展,分析影响应用流行度的相关因素,并预测应用未来的流行度是很重要的。
发明内容
本发明的目的是提供一种基于霍克斯过程的移动应用流行度预测方法,用于预测移动应用未来的流行度。
为实现上述目的,本发明提供了如下方案:
一种基于霍克斯过程的移动应用流行度预测方法,包括如下步骤:
S1、从应用商店中获取移动应用的相关数据;
S2、提取并分析影响移动应用流行度的复杂因素,用下载量来表示移动应用的流行度;
S3、基于霍克斯过程的理论,建立移动应用流行度预测的基本模型;
S4、针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型;
S5、基于建立的模型,预测移动应用未来的流行度。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述S1中相关数据包括:应用名称、应用类别、应用描述、版本记录、时间、评论、评分、下载量、排名。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述S1还包括对数据进行预处理,过滤下载量太小的移动应用。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述步骤S2提取的复杂因素包括:历史的流行度、应用的发布时长、版本更新、评论量、评分以及评论情感。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述S3中在对移动应用的流行度建模时,首先需要对下载事件的发生强度进行建模,得到由移动应用历史的流行度引起的当前时刻的流行度。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述下载事件的发生强度可以用来衡量一次下载发生的概率;所述下载事件的发生强度为:
其中:Ht为历史流行度;λ0为背景强度;为从ti时刻到t时刻之间的所λ(t|Ht)有下载事件引起的强度;ti为第i个下载事件发生的时间;φ(t-ti)表示第i个下载事件引起的强度,其中φ(τ)=(τ+c)-(1+θ),时间间隔τ=t-ti表示第i个下载事件发生时距离时刻t的时间间隔,c>0为底数;1+θ(θ>0)为指数项。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,针对复杂因素,给定移动应用a的历史流行度Ht,在t时刻,移动应用a的下载事件的发生强度λ(t|Ht)可以表示如下:
λ(t|Ht)=λS(t)+λE(t)
其中,强度λE(t)是由历史流行度引起的,表示为:
强度λS(t)是由版本更新、评论、评分、情感等因素引起的,表示为:
其中表示版本更新和应用的发布时长对流行度的影响;su(t)表示在t时刻的版本更新状态,αu为版本更新因素的权重;ea(t)表示应用在t时刻的发布时长,多项式表示随着应用发布时长的增加,流行度的演化趋势,j表示因素ea(t)的指数项,表示因素的权重;
∑m=r,r′,sαmsm(t-1)表示评论、评分以及情感对流行度的影响;其中,sm表示评论sr、评分sr′和情感ss,αr、αr′和αs分别表示评论、评分和情感因素的权重。
进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述移动应用a在t时刻的流行度为:
其中,p(t)为移动应用在t时刻的流行度,它由背景强度λ0,应用的发布时长、评论、评分、评论情感λS(t),以及历史流行度共同决定。
本发明的有益效果为:发明公开了一种基于霍克斯过程的移动应用流行度预测方法,针对应用商店中获取的移动应用相关数据,提取并分析应用移动应用流行度的复杂因素,并针对复杂因素,基于霍克斯过程,建立流行度预测模型,进而可以更准确地预测移动应用未来的流行度,为移动应用开发者提供辅助决策。
附图说明
图1为本发明实施例提供的一种基于霍克斯过程的移动应用流行度预测方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于霍克斯过程的移动应用流行度预测方法包括以下步骤:
S1、根据移动应用的名字(如:“微信”),从在线应用商店中获取该应用相关的数据,包括:应用名称、应用类别、应用描述、版本记录、时间、评论、评分、下载量、排名。对数据进行预处理,过滤下载量太小的移动应用。
S2、从移动应用相关数据中提取并分析影响移动应用流行度的复杂因素(包括:历史的流行度、应用的发布时长、版本更新、评论量、评分以及评论情感),用下载量来表示移动应用的流行度。不同因素对移动应用的流行度有不同的影响,具体表现在:
历史的流行度会影响当前的流行度,通常情况下,以前比较流行的应用,未来也会比较流行,除非有其他外部因素的影响。
应用的发布时长是指当前时刻距离应用初始发布的时间。
版本更新记录了更新发布的时间,以及更新的内容。版本更新有助于改进、添加应用的功能。
评论量能够反映移动应用的流行度,评论量较大的应用通常会比较流行。
评分能够反映用户对移动应用的满意程度,从而影响应用的流行度。
评论情感能够反映用户对移动应用的情感倾向,从而影响应用的流行度。
S3、基于霍克斯过程的理论,建立移动应用流行度预测的基本模型。移动应用的流行度演化是一个长期的过程,在此过程中会有许多确定或不确定的因素影响移动应用的流行度演化,因此,可以把移动应用的流行度演化看成是一个随机过程。把移动应用在历史上的每一次下载当作一次随机事件,该事件在时间轴上随机发生。移动应用的流行度演化过程包含了很多次随机下载事件,并且每一次下载事件都会受到历史下载事件的影响。因此,移动应用的流行度演化过程可以看作是霍克斯过程,即移动应用历史的流行度会影响当前时刻的流行度。
在利用霍克斯过程对移动应用的流行度建模时,首先需要对下载事件的发生强度进行建模。下载事件的发生强度可以用来衡量一次下载发生的概率。给定移动应用a的历史流行度Ht,在t时刻,移动应用a的下载事件的发生强度λ(t|Ht)可以表示如下:
φ(τ)=(τ+c)-(1+θ) (2)
在公式(1)中,第一部分λ0为背景强度。第二部分表示从ti时刻到t时刻之间的所有下载事件引起的强度,ti为第i个下载事件发生的时间。φ(t-ti)表示第i个下载事件引起的强度。
公式(2)对φ进行了解释。时间间隔τ=t-ti表示第i个下载事件发生时距离时刻t的时间间隔。c>0为底数。时间间隔τ越大,则φ(τ)越小,即过去发生的事件对当前时刻的影响,比最近发生的事件对当前时刻的影响要小。因此,φ(τ)可以称为衰减函数。1+θ(θ>0)为指数项,θ越大,则φ(τ)越小。
即移动应用历史的流行度会影响当前时刻的流行度,并且影响是随着时间的增加逐渐衰减的。
由此,可以建立移动应用流行度预测的基本模型,得到由移动应用历史的流行度引起的当前时刻的流行度。
S4、针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型。移动应用的流行度演化是一个复杂的过程,许多复杂因素都会影响应用的流行度。移动应用的流行度不仅会受到历史流行度的影响,同时还会受到其他外界因素的影响(如:版本更新、评论、评分、情感等)。针对提取的复杂因素,基于霍克斯过程的理论,对这些复杂因素进行分析与建模,建立移动应用流行度预测模型。
针对上述复杂因素,给定移动应用a的历史流行度Ht,在t时刻,移动应用a的下载事件的发生强度λ(t|Ht)可以表示如下:
λ(t|Ht)=λs(t)+λE(t) (3)
在公式(3)中,下载事件的发生强度λ(t|Ht)由两部分构成,强度λS(t)是由版本更新、评论、评分、情感等因素引起的,而强度λE(t)是由历史流行度引起的,λE(t)可以用公式(1)表示。λS(t)可以表示如下:
在公式(4)中,强度λS(t)是由两部分构成。第一部分表示版本更新和应用的发布时长对流行度的影响。su(t)表示在t时刻的版本更新状态,αu为版本更新因素的权重。ea(t)表示应用在t时刻的发布时长,多项式 表示随着应用发布时长的增加,流行度的演化趋势,j表示因素ea(t)的指数项,表示因素的权重。在不同时刻,版本更新对移动应用流行度的影响也是不一样的。在移动应用发布初期,由于移动应用的用户量较小,因此版本更新引起的流行度变化也会较小;随着移动应用发布时长的增加,应用的用户量也会增加,因此版本更新引起的流行度变化就会较大。因此,将版本更新su(t)与应用的发布时长ea(t)相乘来表示版本更新和应用的发布时长对流行度的影响。
第二部分表示评论、评分以及情感对流行度的影响。其中,sm表示评论sr、评分sr′和情感ss,αr、αr′和αs分别表示评论、评分和情感因素的权重。
S5、基于建立的模型,预测移动应用未来的流行度。基于上述建立的模型,对移动应用a的下载的发生强度λ(t|Ht)进行积分运算,就能得到移动应用a在t时刻的流行度:
在公式(5)中,p(t)为移动应用在t时刻的流行度,它由背景强度λ0,应用的发布时长、评论、评分、评论情感λS(t),以及历史流行度 共同决定。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:包括如下步骤:
S1、从应用商店中获取移动应用的相关数据;
S2、提取并分析影响移动应用流行度的复杂因素,用下载量来表示移动应用的流行度;
S3、基于霍克斯过程的理论,建立移动应用流行度预测的基本模型;
S4、针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型;
S5、基于建立的模型,预测移动应用未来的流行度。
2.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述S1中相关数据包括:应用名称、应用类别、应用描述、版本记录、时间、评论、评分、下载量、排名。
3.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述S1还包括对数据进行预处理,过滤下载量太小的移动应用。
4.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述步骤S2提取的复杂因素包括:历史的流行度、应用的发布时长、版本更新、评论量、评分以及评论情感。
5.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述S3中在对移动应用的流行度建模时,首先需要对下载事件的发生强度进行建模,得到由移动应用历史的流行度引起的当前时刻的流行度。
6.根据权利要求5所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述下载事件的发生强度可以用来衡量一次下载发生的概率;所述下载事件的发生强度为:
其中:Ht为历史流行度;λ0为背景强度;为从ti时刻到t时刻之间的所λ(t|Ht)有下载事件引起的强度;ti为第i个下载事件发生的时间;φ(t-ti)表示第i个下载事件引起的强度,其中φ(τ)=(τ+c)-(1+θ),时间间隔τ=t-ti表示第i个下载事件发生时距离时刻t的时间间隔,c>0为底数;1+θ(θ>0)为指数项。
7.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:针对复杂因素,给定移动应用a的历史流行度Ht,在t时刻,移动应用a的下载事件的发生强度λ(t|Ht)可以表示如下:
λ(t|Ht)=λS(t)+λE(t)
其中,强度λE(t)是由历史流行度引起的,表示为:
强度λS(t)是由版本更新、评论、评分、情感等因素引起的,表示为:
其中表示版本更新和应用的发布时长对流行度的影响;su(t)表示在t时刻的版本更新状态,αu为版本更新因素的权重;ea(t)表示应用在t时刻的发布时长,多项式表示随着应用发布时长的增加,流行度的演化趋势,j表示因素ea(t)的指数项,表示因素的权重;
∑m=r,r′,sαmsm(t-1)表示评论、评分以及情感对流行度的影响;其中,sm表示评论sr、评分sr′和情感ss,αr、αr′和αs分别表示评论、评分和情感因素的权重。
8.根据权利要求1所述的一种基于霍克斯过程的移动应用流行度预测方法,其特征在于:所述移动应用a在t时刻的流行度为:
其中,p(t)为移动应用在t时刻的流行度,它由背景强度λo,应用的发布时长、评论、评分、评论情感λS(t),以及历史流行度共同决定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811533711.XA CN109658147A (zh) | 2018-12-14 | 2018-12-14 | 一种基于霍克斯过程的移动应用流行度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811533711.XA CN109658147A (zh) | 2018-12-14 | 2018-12-14 | 一种基于霍克斯过程的移动应用流行度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109658147A true CN109658147A (zh) | 2019-04-19 |
Family
ID=66114154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811533711.XA Pending CN109658147A (zh) | 2018-12-14 | 2018-12-14 | 一种基于霍克斯过程的移动应用流行度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658147A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889063A (zh) * | 2019-11-29 | 2020-03-17 | 中山大学 | 一种基于霍克斯过程和矩阵分解的视频预缓存方法 |
CN111695625A (zh) * | 2020-06-10 | 2020-09-22 | 西北工业大学 | 一种基于多级注意力机制网络的移动应用流行度预测方法 |
CN115604130A (zh) * | 2022-12-01 | 2023-01-13 | 中南大学(Cn) | App流行度预测模型构建方法、预测方法、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049452A (zh) * | 2011-10-14 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 一种基于预估下载率进行应用排序的方法与设备 |
US20170323210A1 (en) * | 2016-05-06 | 2017-11-09 | Wp Company Llc | Techniques for prediction of popularity of media |
CN107609717A (zh) * | 2017-10-12 | 2018-01-19 | 南京航空航天大学 | 社交网络中一种基于Kalman滤波器的帖子转发量预测方法 |
-
2018
- 2018-12-14 CN CN201811533711.XA patent/CN109658147A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049452A (zh) * | 2011-10-14 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 一种基于预估下载率进行应用排序的方法与设备 |
US20170323210A1 (en) * | 2016-05-06 | 2017-11-09 | Wp Company Llc | Techniques for prediction of popularity of media |
CN107609717A (zh) * | 2017-10-12 | 2018-01-19 | 南京航空航天大学 | 社交网络中一种基于Kalman滤波器的帖子转发量预测方法 |
Non-Patent Citations (4)
Title |
---|
MARIAN-ANDREI RIZOIU等: "A Tutorial on Hawkes Processes for Events in Social Media", 《ARXIV PREPRINT ARXIV:1708.06401 (2017)》 * |
MARIAN-ANDREI RIZOIU等: "Expecting to be HIP: Hawkes Intensity Processes for Social Media Popularity", 《IN PROCEEDINGS OF THE 26TH INTERNATIONAL CONFERENCE ON WORLD WIDE WEB》 * |
朱海龙等: "基于传播加速度的微博流行度预测方法", 《计算机研究与发展》 * |
鞠天骄: "在线评论对移动应用下载影响的实证研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889063A (zh) * | 2019-11-29 | 2020-03-17 | 中山大学 | 一种基于霍克斯过程和矩阵分解的视频预缓存方法 |
CN110889063B (zh) * | 2019-11-29 | 2023-05-02 | 中山大学 | 一种基于霍克斯过程和矩阵分解的视频预缓存方法 |
CN111695625A (zh) * | 2020-06-10 | 2020-09-22 | 西北工业大学 | 一种基于多级注意力机制网络的移动应用流行度预测方法 |
CN115604130A (zh) * | 2022-12-01 | 2023-01-13 | 中南大学(Cn) | App流行度预测模型构建方法、预测方法、设备及存储介质 |
CN115604130B (zh) * | 2022-12-01 | 2023-03-14 | 中南大学 | App流行度预测模型构建方法、预测方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109344908B (zh) | 用于生成模型的方法和装置 | |
CN109271493B (zh) | 一种语言文本处理方法、装置和存储介质 | |
CN110366734B (zh) | 优化神经网络架构 | |
CN110188331A (zh) | 模型训练方法、对话系统评价方法、装置、设备及存储介质 | |
CN111081280B (zh) | 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法 | |
CN109658147A (zh) | 一种基于霍克斯过程的移动应用流行度预测方法 | |
CN110475155A (zh) | 直播视频热度状态识别方法、装置、设备及可读介质 | |
CN109509010A (zh) | 一种多媒体信息处理方法、终端及存储介质 | |
CN107526809A (zh) | 基于人工智能推送音乐的方法和装置 | |
CN112633976B (zh) | 基于大数据和云业务的数据处理方法及云业务服务器 | |
CN110335596A (zh) | 基于语音识别的产品推荐方法、装置、设备和存储介质 | |
CN112380377A (zh) | 一种音频推荐方法、装置、电子设备及计算机存储介质 | |
CN110162359A (zh) | 新手引导信息的推送方法、装置及系统 | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 | |
CN114417174B (zh) | 内容推荐方法、装置、设备及计算机存储介质 | |
CN109766855A (zh) | 一种移动智能设备传感器指纹识别方法 | |
CN113077815B (zh) | 一种音频评估方法及组件 | |
Qureshi et al. | Performance evaluation of machine learning models on large dataset of android applications reviews | |
CN110516422A (zh) | 用户身份的识别方法、装置、电子设备及存储介质 | |
CN109033241A (zh) | 新闻推荐方法、装置及电子设备 | |
CN105117468B (zh) | 一种网络数据处理方法和装置 | |
US20170116638A1 (en) | A/b experiment validation | |
CN114141271B (zh) | 心理状态检测方法及系统 | |
CN113505272B (zh) | 基于行为习惯的控制方法和装置、电子设备和存储介质 | |
CN111522747B (zh) | 一种应用程序的处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240112 |
|
AD01 | Patent right deemed abandoned |