CN105869022B - 一种应用流行度预测方法和装置 - Google Patents
一种应用流行度预测方法和装置 Download PDFInfo
- Publication number
- CN105869022B CN105869022B CN201610218863.5A CN201610218863A CN105869022B CN 105869022 B CN105869022 B CN 105869022B CN 201610218863 A CN201610218863 A CN 201610218863A CN 105869022 B CN105869022 B CN 105869022B
- Authority
- CN
- China
- Prior art keywords
- application
- user
- expert
- popularity
- applications
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种应用流行度预测方法和装置,其中的应用流行度预测方法包括:获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用;分别获取多个用户分别对所述多个应用的用户使用信息记录;根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度;根据各个用户的用户影响度,确定应用专家用户;根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。采用本发明,可有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种应用流行度预测方法和装置。
背景技术
应用流行度是反应应用本身质量和运营成功与否的一个重要指标,用于辅助应用运营进行不同应用间的运营资源调配和策略制定,也可以给应用产品和开发提供应用版本迭代更新提供思路。现有技术中,通常可以使用活跃用户数量来衡量应用流行度,现有关于应用的活跃用户数量的预测采用根据历史一段时间内的新进用户、流失用户和留存用户建立微分方程,再利用求解得到的相关参数预测未来的应用的活跃用户数量,从而对应用的流行度进行预测。
现有的应用流行度预测方式存在的缺陷在于:应用运营活动、竞品上线等外部因素会造成普通用户的活跃用户数量波动很大,造成应用流行度的预测不准确。
发明内容
有鉴于此,本发明实施例提供一种应用流行度预测方法和装置,可有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
为了解决上述技术问题,本发明实施例提供了一种应用流行度预测方法,所述方法包括:
获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用;
分别获取多个用户分别对所述多个应用的用户使用信息记录;
根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度;
根据各个用户的用户影响度,在所述多个用户中确定应用专家用户;
根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
相应地,本发明实施例还提供了一种应用流行度预测装置,所述装置包括:
流行记录获取模块,用于获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用;
用户信息获取模块,用于分别获取多个用户分别对所述多个应用的用户使用信息记录;
影响度确定模块,用于所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度;
专家用户筛选模块,用于根据各个用户的用户影响度,在所述多个用户中确定应用专家用户;
应用流行预测模块,用于根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
本实施例通过获取多个应用的流行度记录以及多个用户分别对所述多个应用的用户使用信息记录,在多个用户中筛选出应用专家用户,进而根据应用专家用户对目标应用的使用信息记录对目标应用的流行度进行预测,可以有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的一种应用流行度预测方法流程示意图;
图2是本发明另一实施例中的应用流行度预测方法流程示意图;
图3是本发明实施例中的一种应用流行度预测装置结构示意图;
图4是本发明实施例中应用流行度预测装置的专家用户筛选模块的结构示意图;
图5是本发明实施例中应用流行度预测装置的影响度确定模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例中的一种应用流行度预测方法流程示意图,如图所示本实施例中的应用流行度预测方法流程包括:
S101,获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用。
具体的,所述多个应用是可以获取到一段时间内的流行度记录和用户使用信息记录的已有应用,较优的,可以选取已经度过较完整应用生命周期的已有应用,这样的应用的流行度记录可以比较准确反映该应用的质量以及流行程度。所述流行度记录可以包括应用的最大活跃用户数量(日活跃用户数DAU,Daily Active User或月活跃用户人数MAU,Monthly Active Users等),所述根据所述流行度记录将所述多个应用划分为不流行应用和流行应用可以具体为:将最大活跃用户数量达到预设用户数量阈值的应用划分为流行应用,否则划分为不流行应用。所述应用可以包括通信应用、社交应用、游戏应用或日常工具应用。
在可选实施例中,所述多个应用可以是多个任意的应用,也可以是同属于指定应用类型的应用,所述指定的应用类型可以例如游戏应用、即时通讯应用、社交应用、多媒体播放应用、绘图应用或摄像应用,等等。在可选实施例中,如果S101步骤中获取的同属于指定类型的应用的流行度记录并进行该指定类型的应用的流行度划分,那么在该实施例后续得到的应该是针对该应用类型的专家用户,后续也应该是对针对同属于该应用类型的目标应用的流行度进行预测,这样得到的专家用户会更有针对性,对相应类型的目标应用的流行度预测结果也会更为准确。换句话说,本步骤中所述多个应用可以与目标应用属于同一应用类型,例如目标应用是一种摄像应用,那么本步骤可以获取的是多个其他的摄像应用的流行度记录,并根据各个摄像应用的流行度记录对上述多个摄像应用划分为流行应用和不流行引用。
S102,分别获取多个用户分别对所述多个应用的用户使用信息记录。
所述用户使用信息记录可以包括用户对应用的注册行为记录和留存行为记录,还可以包括使用时长记录、分享行为记录等。
S103,根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度。
具体实现中,可以根据各个用户的用户影响度和该用户对应用的用户使用信息,建立预测应用是否流行的二分类算法模型。例如所述二分类算法模型可以为:其中h(Χ)代表某个应用的流行度,θ0为预设的全局影响度,向量Χ为根据各个用户对该应用的用户使用信息得到的应用相关度,θ代表各个用户对应用的用户影响度。可以根据各个用户对某个应用的用户使用信息记录,综合注册行为记录和留存行为记录(可选的还可以结合使用时长记录、分享行为记录等)得到不同用户对该应用的应用相关度(也可以称为应用参与程度),例如x1,x2……xn分别表示不同用户对某个应用的应用相关度,然后将x1,x2……xn组成向量Χ。
进而将所述多个应用的划分结果和所述用户使用信息记录作为训练语料,对所述二分类算法模型进行参数优化,根据优化结果确定各个用户的用户影响度。根据步骤S101和S102可以得到多个应用的划分结果和多个用户对各个应用的用户使用信息,那么对于每个应用的划分结果和多个用户对该应用的用户使用信息即可作为一条训练语料,假设存在N条训练语料,那么为了得到最逼近训练语料的流行划分结果的二分类算法模型,可以转换为求上述二分类算法模型的最大化对数似然函数,经推导如下:
通过迭代上述二分类算法模型的对数似然函数中的参数θ,可以得到最大化对数似然函数,即最逼近训练语料的流行划分结果的二分类算法模型中的参数θ,即得到各个用户的用户影响度。
在另一可选实施例中,为了筛选出尽量少并且能全面所有用户的专家,可以在二分类算法模型中添加θ的L1正则化项和正交正则化项,经推导后为了得到最逼近训练语料的流行划分结果的二分类算法模型,可以转换为求上述二分类算法模型的最小目标函数:
其中lnL(θ)为所述二分类算法模型的似然函数的对数, 为Χ·θ的正交正则项,γ||θ||1为θ的L1正交正则项,其中x1,x2……xn组成向量Χ,y表示训练语料中各个应用的划分结果,若是流行应用则y=1,否则y=0,β,γ为预设参数(可以根据需要进行调整)。
通过迭代上述目标函数中的中的参数θ,可以得到最小化目标函数,即最逼近训练语料的流行划分结果的二分类算法模型中的参数θ,即得到各个用户的用户影响度。
进而在可选实施例中,还可以通过其他算法根据各个用户的用户影响度和该用户对应用的用户使用信息确定各个用户的用户影响度,例如采用求线性相关拟合参数推导,或采用其他的二分类算法模型,或采用其他的二分类模型优化方式,均是本领域技术人员通过本发明实施例的启发下可以直接实施并实现本发明的发明目的的。
进而在可选实施例中,若步骤S101中的所述多个应用与目标应用属于同一应用类型,那么本步骤得到的就是各个用户针对该应用类型的应用的用户影响度,相应地所述预测应用是否流行的二分类算法模型也可以是针对该应用类型的应用的流行预测算法模型。
S104,根据各个用户的用户影响度,确定应用专家用户。
具体的,可以将用户影响度达到预设影响度阈值的用户确定为应用专家用户,例如影响度阈值为0,则可以将根据S104得到的参数θ为负值(表示负相关,该用户的使用或参与给应用带来负面影响)的用户剔除,将参数θ为正值(表示正相关,该用户的使用或参与给应用带来正面影响)的用户确定为应用专家用户。进而,若步骤S103得到的是各个用户针对某个指定应用类型的应用的用户影响度,那么本步骤得到的也对应为针对该指定应用类型的应用的应用专家用户。
在可选实施例中,还可以结合某个用户的用户影响度与其他维度的应用使用信息,确定该用户是否为应用专家用户,例如结合用户影响度和用户同时使用的应用数量,或是结合所述用户影响度和用户同时使用某个指定的应用类型的应用数量。即若某个用户同时使用更多的应用,那么该用户有更大的概率是应用专家用户,进而若某个用户同时有使用多个指定的应用类型的应用,那么显然该用户会有较大概率是针对该应用类型的应用专家用户。
在另一可选实施例中,还可以为将用户影响度达到预设影响度阈值的用户确定为初选专家用户;进而计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,若所述相关度达到相关度阈值,则将该初选专家用户确定为应用专家用户。具体地,计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,示例性地可以采用下式计算相关度r:
其中x为初选专家用户指定周期(如3天、一周、或一个月)内的应用使用时间,y为应用生命周期内达到的最大DAU取对数,即log(DAU).下标i则表示不同的流行应用。所述相关度阈值可以例如为0.5,即求得对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度大于0.5的初选专家用户确定为应用专家用户。
S105,根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
经过S104筛选出的应用专家用户,可以认为其较大概率是能够鉴别出应用优劣的用户,此类用户的应用使用行为受外界因素影响通常较小,是否会使用一款应用与该款应用自身质量相关度更高,因此可以根据应用专家用户对目标应用的用户使用信息记录对目标应用的应用流行度进行预测。
在可选实施例中,可以根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的专家进入率和专家留存率,进而根据目标应用的专家进入率和专家留存率,计算目标应用的流行度估值。其中所述专家进入率可以为指定时间段内的专家进入率,例如首日进入应用专家率、首周进入应用专家率等,所述专家留存率为计入专家进入率中的应用专家用户在首次进入应用后,再次进入应用的比率。较优的,为了实现对目标应用的流行度进行快速预测,可以采用首日进入应用专家率以及次日专家留存率计算目标应用的流行度估值,这样在目标应用推出后的第三天即可对目标应用的流行度进行快速预测。所述流行度估值可以采用最大活跃用户数量(DAU或MAU等)。
具体可以为:根据目标应用的专家进入率和专家留存率结合所述对数线性拟合参数,计算目标应用的流行度估值。例如可以采用下式计算目标应用的日活跃用户数DAU:
其中将步骤S105得到的所有应用专家用户中首日进入目标应用的应用专家用户的比率作为专家进入率,将首日进入目标应用的应用专家用户中,次日再次进入目标应用的比率即专家次日留存率作为专家留存率,a和b为对数线性拟合参数。
在可选实施例中,其中所述对数线性拟合参数,可以通过S102中获取到的多个应用的用户使用信息记录计算所述多个应用的专家进入率和专家留存率,进而将所述多个应用的专家进入率和专家留存率与所述多个应用的流行度记录进行对数线性拟合,得到专家进入率和专家留存率与应用的流行度之间的对数线性拟合参数。结合上述例子,即将多个应用中各个应用的首日专家率和次日专家留存率综合计算后,与其最大DAU的对数值进行对数线性拟合得到对数线性拟合参数a和b。在另外的可选实施方式中,所述对数线性拟合参数还可以为预设值。
进而在其他可选实施例中,还可以通过其他计算方式,根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值,例如只根据专家进入率或只根据专家留存率,或结合专家进入率、专家留存率以及专家使用时长这三个参数计算目标应用的流行度估值,均属于本发明的可选实施范畴内。
本实施例中,通过获取多个应用的流行度记录以及多个用户分别对所述多个应用的用户使用信息记录,在多个用户中筛选出应用专家用户,进而根据应用专家用户对目标应用的使用信息记录对目标应用的流行度进行预测,可以有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
图2是本发明另一实施例中的应用流行度预测方法流程示意图,如图所示,本实施例中的应用流行度预测方法流程可以包括:
S201,获取多个应用的最大活跃用户数量,将最大活跃用户数量达到预设用户数量阈值的应用划分为流行应用,否则划分为不流行应用。
较优的,可以选取已经度过较完整应用生命周期的已有应用,这样的应用的流行度记录可以比较准确反映该应用的质量以及流行程度。所述应用的最大活跃用户数量可以为日活跃用户数DAU,Daily Active User或月活跃用户人数MAU,Monthly Active Users等。所述应用可以包括通信应用、社交应用、游戏应用或日常工具应用。
在可选实施例中,所述多个应用可以是多个任意的应用,也可以是同属于指定应用类型的应用,即与本实施例中的目标应用属于同一应用类型。
S202,分别获取多个用户分别对所述多个应用的用户使用信息记录。
所述用户使用信息记录可以包括用户对应用的注册行为记录和留存行为记录,还可以包括使用时长记录、分享行为记录等。进而,可以根据各个用户对某个应用的用户使用信息记录,综合注册行为记录和留存行为记录(可选的还可以结合使用时长记录、分享行为记录等)得到不同用户对该应用的应用相关度(也可以称为应用参与程度),例如x1,x2……xn分别表示不同用户对某个应用的应用相关度,然后将x1,x2……xn组成向量Χ。
S203,根据各个用户的用户影响度和该用户对应用的用户使用信息,建立预测应用是否流行的二分类算法模型。
S204,将所述多个应用的划分结果和所述用户使用信息记录作为训练语料,对所述二分类算法模型进行参数优化,根据优化结果确定各个用户的用户影响度。
优化方式可以参考前文实施例中的S104,本实施例中不再赘述。
在可选实施例中,若步骤S201中的所述多个应用与目标应用属于同一应用类型,那么本步骤确定得到的就是各个用户针对该应用类型的应用的用户影响度,相应地所述预测应用是否流行的二分类算法模型也可以是针对该应用类型的应用的流行预测算法模型。
S205,将用户影响度达到预设影响度阈值的用户确定为初选专家用户。
具体的,例如影响度阈值为0,则可以将用户影响度为负值(表示负相关,该用户的使用或参与给应用带来负面影响)的用户剔除,将用户影响度为正值(表示正相关,该用户的使用或参与给应用带来正面影响)的用户确定为初选专家用户。
进而,若步骤S204得到的是各个用户针对某个指定应用类型的应用的用户影响度,那么本步骤得到的也对应位针对该指定应用类型的应用的应用专家用户。
S206,计算某个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,若所述相关度达到相关度阈值,则将该初选专家用户确定为应用专家用户。
经过S206筛选出的应用专家用户,可以认为其较大概率是能够鉴别出应用优劣的用户,此类用户的应用使用行为受外界因素影响通常较小,是否会使用一款应用与该款应用自身质量相关度更高,因此可以根据应用专家用户对目标应用的用户使用信息记录对目标应用的应用流行度进行预测。
S207,根据应用专家用户对目标应用的用户使用信息记录,计算目标应用的首日进入专家率和专家留存率。
例如将步骤S206得到的所有应用专家用户中首日进入目标应用的应用专家用户的比率作为专家进入率,将首日进入目标应用的应用专家用户中,次日再次进入目标应用的比率即专家次日留存率作为专家留存率。
S208,根据目标应用的首日进入专家率和专家留存率,计算目标应用的流行度估值。
例如可以采用下式计算目标应用的日活跃用户数DAU:
a和b可以为预设的对数线性拟合参数。在可选实施例中,还可以通过将多个应用中各个应用的首日专家率和次日专家留存率综合计算后,与其最大DAU的对数值进行对数线性拟合得到对数线性拟合参数a和b。
S209,根据所述目标应用的流行度估值,向用户推送针对所述目标应用的推荐信息。
具体的,在预测得到目标应用的流行度估值后,可以根据目标应用的流行度估值指定针对该目标应用的推荐信息的推送策略,例如根据流行度估值高低设定向目标用户群推送应用的推荐信息的优先级的高低或推送频率的高低,以提高信息推送资源的更合理分配和利用。
本实施例中,通过获取多个应用的流行度记录以及多个用户分别对所述多个应用的用户使用信息记录,在多个用户中筛选出应用专家用户,进而根据应用专家用户对目标应用的使用信息记录对目标应用的流行度进行预测,可以有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
图3是本发明实施例中的一种应用流行度预测装置结构示意图,如图所示本发明实施例中的应用流行度预测装置至少可以包括以下结构:
流行记录获取模块310,用于获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用。
具体的,所述多个应用是可以获取到一段时间内的流行度记录和用户使用信息记录的已有应用,较优的,流行记录获取模块310选取已经度过较完整应用生命周期的已有应用,这样的应用的流行度记录可以比较准确反映该应用的质量以及流行程度。所述流行度记录可以包括应用的最大活跃用户数量(日活跃用户数DAU,Daily Active User或月活跃用户人数MAU,Monthly Active Users等),所述流行记录获取模块310根据所述流行度记录将所述多个应用划分为不流行应用和流行应用可以具体为:将最大活跃用户数量达到预设用户数量阈值的应用划分为流行应用,否则划分为不流行应用。所述应用可以包括通信应用、社交应用、游戏应用或日常工具应用。
在可选实施例中,所述多个应用可以是多个任意的应用,也可以是同属于指定应用类型的应用,所述指定的应用类型可以例如游戏应用、即时通讯应用、社交应用、多媒体播放应用、绘图应用或摄像应用,等等。在可选实施例中,如果流行记录获取模块310获取的同属于指定类型的应用的流行度记录并进行该指定类型的应用的流行度划分,那么在该实施例后续得到的应该是针对该应用类型的专家用户,后续也应该是对针对同属于该应用类型的目标应用的流行度进行预测,这样得到的专家用户会更有针对性,对相应类型的目标应用的流行度预测结果也会更为准确。换句话说,流行记录获取模块310获取的所述多个应用可以与目标应用属于同一应用类型,例如目标应用是一种摄像应用,那么流行记录获取模块310获取的是多个其他的摄像应用的流行度记录,并根据各个摄像应用的流行度记录对上述多个摄像应用划分为流行应用和不流行引用。
用户信息获取模块320,用于分别获取多个用户分别对所述多个应用的用户使用信息记录。
所述用户使用信息记录可以包括用户对应用的注册行为记录和留存行为记录,还可以包括使用时长记录、分享行为记录等。进而,用户信息获取模块320可以根据各个用户对某个应用的用户使用信息记录,综合注册行为记录和留存行为记录(可选的还可以结合使用时长记录、分享行为记录等)得到不同用户对该应用的应用相关度(也可以称为应用参与程度),例如x1,x2……xn分别表示不同用户对某个应用的应用相关度,然后将x1,x2……xn组成向量Χ。
影响度确定模块330,用于所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度。
进而在可选实施例中,影响度确定模块330可以如图5所示进一步包括:应用流行建模单元331和算法模型优化单元332,其中:、
应用流行建模单元331,用于根据各个用户的用户影响度和该用户对应用的用户使用信息,建立预测应用是否流行的二分类算法模型。
算法模型优化单元332,用于将所述多个应用的划分结果和所述用户使用信息记录作为训练语料,对所述二分类算法模型进行参数优化,根据优化结果确定各个用户的用户影响度。
根据流行记录获取模块310得到的多个应用的划分结果和用户信息获取模块320得到的多个用户对各个应用的用户使用信息,那么对于每个应用的划分结果和多个用户对该应用的用户使用信息即可作为一条训练语料,假设存在N条训练语料,那么为了得到最逼近训练语料的流行划分结果的二分类算法模型,可以转换为求上述二分类算法模型的最大化对数似然函数,经推导如下:
通过迭代上述二分类算法模型的对数似然函数中的参数θ,可以得到最大化对数似然函数,即最逼近训练语料的流行划分结果的二分类算法模型中的参数θ,即得到各个用户的用户影响度。
在另一可选实施例中,为了筛选出尽量少并且能全面所有用户的专家,可以在二分类算法模型中添加θ的L1正则化项和正交正则化项,经推导后为了得到最逼近训练语料的流行划分结果的二分类算法模型,可以转换为求上述二分类算法模型的最小目标函数:
其中lnL(θ)为所述二分类算法模型的似然函数的对数, 为Χ·θ的正交正则项,γ||θ||1为θ的L1正交正则项,其中x1,x2……xn组成向量Χ,y表示训练语料中各个应用的划分结果,若是流行应用则y=1,否则y=0,β,γ为预设参数(可以根据需要进行调整)。
算法模型优化单元332通过迭代上述目标函数中的中的参数θ,可以得到最小化目标函数,即最逼近训练语料的流行划分结果的二分类算法模型中的参数θ,即得到各个用户的用户影响度。
进而在可选实施例中,影响度确定模块330还可以通过其他算法根据各个用户的用户影响度和该用户对应用的用户使用信息确定各个用户的用户影响度,例如采用求线性相关拟合参数推导,或采用其他的二分类算法模型,或采用其他的二分类模型优化方式,均是本领域技术人员通过本发明实施例的启发下可以直接实施并实现本发明的发明目的的。
进而在可选实施例中,若流行记录获取模块310获取的所述多个应用与目标应用属于同一应用类型,那么影响度确定模块330得到的就是各个用户针对该应用类型的应用的用户影响度,相应地所述预测应用是否流行的二分类算法模型也可以是针对该应用类型的应用的流行预测算法模型。
专家用户筛选模块340,用于根据各个用户的用户影响度,确定应用专家用户。
具体的,可以将用户影响度达到预设影响度阈值的用户确定为应用专家用户,例如影响度阈值为0,则可以将影响度确定模块330得到的用户影响度θ为负值(表示负相关,该用户的使用或参与给应用带来负面影响)的用户剔除,将用户影响度θ为正值(表示正相关,该用户的使用或参与给应用带来正面影响)的用户确定为应用专家用户。进而,若影响度确定模块330确定得到的是各个用户针对某个指定应用类型的应用的用户影响度,那么专家用户筛选模块340筛选得到的也对应为针对该指定应用类型的应用的应用专家用户。
在可选实施例中,专家用户筛选模块340还可以结合某个用户的用户影响度与其他维度的应用使用信息,确定该用户是否为应用专家用户,例如结合用户影响度和用户同时使用的应用数量,或是结合所述用户影响度和用户同时使用某个指定的应用类型的应用数量。即若某个用户同时使用更多的应用,那么该用户有更大的概率是应用专家用户,进而若某个用户同时有使用多个指定的应用类型的应用,那么显然该用户会有较大概率是针对该应用类型的应用专家用户。
在另一可选实施例中,专家用户筛选模块340可以如图4所示进一步包括:专家用户初选单元341和专家用户确定单元342,其中:
专家用户初选单元341,将用户影响度达到预设影响度阈值的用户确定为初选专家用户;
专家用户确定单元342,计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,若所述相关度达到相关度阈值,则将该初选专家用户确定为应用专家用户。
具体地,计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,示例性地可以采用下式计算相关度r:
其中x为初选专家用户指定周期(如3天、一周、或一个月)内的应用使用时间,y为应用生命周期内达到的最大DAU取对数,即log(DAU).下标i则表示不同的流行应用。所述相关度阈值可以例如为0.5,即求得对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度大于0.5的初选专家用户确定为应用专家用户。
应用流行预测模块350,用于根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
经过专家用户筛选模块340筛选出的应用专家用户,可以认为其较大概率是能够鉴别出应用优劣的用户,此类用户的应用使用行为受外界因素影响通常较小,是否会使用一款应用与该款应用自身质量相关度更高,因此应用流行预测模块350可以根据应用专家用户对目标应用的用户使用信息记录对目标应用的应用流行度进行预测。
在可选实施例中,应用流行预测模块350可以根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的专家进入率和专家留存率,进而根据目标应用的专家进入率和专家留存率,计算目标应用的流行度估值。其中所述专家进入率可以为指定时间段内的专家进入率,例如首日进入应用专家率、首周进入应用专家率等,所述专家留存率为计入专家进入率中的应用专家用户在首次进入应用后,再次进入应用的比率。较优的,为了实现对目标应用的流行度进行快速预测,可以采用首日进入应用专家率以及次日专家留存率计算目标应用的流行度估值,这样在目标应用推出后的第三天即可对目标应用的流行度进行快速预测。所述流行度估值可以采用最大活跃用户数量(DAU或MAU等)。
具体可以为:根据目标应用的专家进入率和专家留存率结合所述对数线性拟合参数,计算目标应用的流行度估值。例如可以采用下式计算目标应用的日活跃用户数DAU:
其中将专家用户筛选模块340得到的所有应用专家用户中首日进入目标应用的应用专家用户的比率作为专家进入率,将首日进入目标应用的应用专家用户中,次日再次进入目标应用的比率即专家次日留存率作为专家留存率,a和b为对数线性拟合参数。
在可选实施例中,其中所述对数线性拟合参数,可以通过用户信息获取模块320中获取到的多个应用的用户使用信息记录计算所述多个应用的专家进入率和专家留存率,进而将所述多个应用的专家进入率和专家留存率与所述多个应用的流行度记录进行对数线性拟合,得到专家进入率和专家留存率与应用的流行度之间的对数线性拟合参数。结合上述例子,即将多个应用中各个应用的首日专家率和次日专家留存率综合计算后,与其最大DAU的对数值进行对数线性拟合得到对数线性拟合参数a和b。在另外的可选实施方式中,所述对数线性拟合参数还可以为预设值。
进而在其他可选实施例中,还可以通过其他计算方式,根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值,例如只根据专家进入率或只根据专家留存率,或结合专家进入率、专家留存率以及专家使用时长这三个参数计算目标应用的流行度估值,均属于本发明的可选实施范畴内。
在可选实施例中,应用流行度预测装置进一步还可以包括:
专家参数拟合模块360,用于根据所述应用专家用户分别对所述多个应用的用户使用信息记录,计算所述多个应用的专家进入率和专家留存率,将所述多个应用的专家进入率和专家留存率与所述多个应用的流行度记录进行对数线性拟合,得到专家进入率和专家留存率与应用的流行度之间的对数线性拟合参数。
在可选实施例中,应用流行度预测装置进一步还可以包括:
应用推荐推送模块370,用于根据所述目标应用的流行度估值,向用户推送针对所述目标应用的推荐信息。
具体的,在预测得到目标应用的流行度估值后,可以根据目标应用的流行度估值指定针对该目标应用的推荐信息的推送策略,例如根据流行度估值高低设定向目标用户群推送应用的推荐信息的优先级的高低或推送频率的高低,以提高信息推送资源的更合理分配和利用。
本实施例中的应用流行度预测装置通过获取多个应用的流行度记录以及多个用户分别对所述多个应用的用户使用信息记录,在多个用户中筛选出应用专家用户,进而根据应用专家用户对目标应用的使用信息记录对目标应用的流行度进行预测,可以有效地抵抗外界因素的干扰,对应用流行度给出准确的预测结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (24)
1.一种应用流行度预测方法,其特征在于,所述方法包括:
获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用;
分别获取多个用户分别对所述多个应用的用户使用信息记录;
根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度;
根据各个用户的用户影响度,在所述多个用户中确定应用专家用户,所述应用专家用户的用户影响度达到预设影响度阈值,并且所述应用专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度达到相关度阈值;
根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
2.如权利要求1所述的应用流行度预测方法,其特征在于,所述多个应用与目标应用属于同一应用类型。
3.如权利要求1所述的应用流行度预测方法,其特征在于,所述根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度包括:
根据各个用户的用户影响度和该用户对应用的用户使用信息,建立预测应用是否流行的二分类算法模型;
将所述多个应用的划分结果和所述用户使用信息记录作为训练语料,对所述二分类算法模型进行参数优化,根据优化结果确定各个用户的用户影响度。
4.如权利要求1所述的应用流行度预测方法,其特征在于,所述根据各个用户的用户影响度,确定应用专家用户包括:
将用户影响度达到预设影响度阈值的用户确定为初选专家用户;
计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,若所述相关度达到相关度阈值,则将该初选专家用户确定为应用专家用户。
5.如权利要求1所述的应用流行度预测方法,其特征在于,所述流行度记录包括应用的最大活跃用户数量,所述根据所述流行度记录将所述多个应用划分为不流行应用和流行应用包括:
将最大活跃用户数量达到预设用户数量阈值的应用划分为流行应用,否则划分为不流行应用。
6.如权利要求1所述的应用流行度预测方法,其特征在于,所述用户使用信息记录包括用户对应用的注册行为记录和留存行为记录;
所述根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值包括:
根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的专家进入率和专家留存率;
根据目标应用的专家进入率和专家留存率,计算目标应用的流行度估值。
7.如权利要求6所述的应用流行度预测方法,其特征在于,所述方法还包括:
根据所述应用专家用户分别对所述多个应用的用户使用信息记录,计算所述多个应用的专家进入率和专家留存率;
将所述多个应用的专家进入率和专家留存率与所述多个应用的流行度记录进行对数线性拟合,得到专家进入率和专家留存率与应用的流行度之间的对数线性拟合参数;
所述根据目标应用的专家进入率和专家留存率,计算目标应用的流行度估值包括:
根据目标应用的专家进入率和专家留存率结合所述对数线性拟合参数,计算目标应用的流行度估值。
11.如权利要求1-10中任一项所述的应用流行度预测方法,其特征在于,所述方法还包括:
根据所述目标应用的流行度估值,向用户推送针对所述目标应用的推荐信息。
12.一种应用流行度预测装置,其特征在于,所述装置包括:
流行记录获取模块,用于获取多个应用的流行度记录,根据所述流行度记录将所述多个应用划分为不流行应用和流行应用;
用户信息获取模块,用于分别获取多个用户分别对所述多个应用的用户使用信息记录;
影响度确定模块,用于根据所述多个应用的划分结果和所述用户使用信息记录,确定各个用户的用户影响度;
专家用户筛选模块,用于根据各个用户的用户影响度,在所述多个用户中确定应用专家用户,所述应用专家用户的用户影响度达到预设影响度阈值,并且所述应用专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度达到相关度阈值;
应用流行预测模块,用于根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的流行度估值。
13.如权利要求12所述的应用流行度预测装置,其特征在于,所述多个应用与目标应用属于同一应用类型。
14.如权利要求12所述的应用流行度预测装置,其特征在于,所述影响度确定模块包括:
应用流行建模单元,用于根据各个用户的用户影响度和该用户对应用的用户使用信息,建立预测应用是否流行的二分类算法模型;
算法模型优化单元,用于将所述多个应用的划分结果和所述用户使用信息记录作为训练语料,对所述二分类算法模型进行参数优化,根据优化结果确定各个用户的用户影响度。
15.如权利要求12所述的应用流行度预测装置,其特征在于,所述专家用户筛选模块包括:
专家用户初选单元,将用户影响度达到预设影响度阈值的用户确定为初选专家用户;
专家用户确定单元,计算各个初选专家用户对各个流行应用的应用使用时长与对应流行应用的最大活跃用户数量之间的相关度,若所述相关度达到相关度阈值,则将该初选专家用户确定为应用专家用户。
16.如权利要求12所述的应用流行度预测装置,其特征在于,所述流行度记录包括应用的最大活跃用户数量;
所述流行记录获取模块用于:
将最大活跃用户数量达到预设用户数量阈值的应用划分为流行应用,否则划分为不流行应用。
17.如权利要求12所述的应用流行度预测装置,其特征在于,所述用户使用信息记录包括用户对应用的注册行为记录和留存行为记录;
所述应用流行预测模块用于:
根据所述应用专家用户对目标应用的用户使用信息记录,计算目标应用的专家进入率和专家留存率,根据目标应用的专家进入率和专家留存率,计算目标应用的流行度估值。
18.如权利要求17所述的应用流行度预测装置,其特征在于,还包括:
专家参数拟合模块,用于根据所述应用专家用户分别对所述多个应用的用户使用信息记录,计算所述多个应用的专家进入率和专家留存率,将所述多个应用的专家进入率和专家留存率与所述多个应用的流行度记录进行对数线性拟合,得到专家进入率和专家留存率与应用的流行度之间的对数线性拟合参数;
所述应用流行预测模块用于:
根据目标应用的专家进入率和专家留存率结合所述对数线性拟合参数,计算目标应用的流行度估值。
22.如权利要求12-21中任一项所述的应用流行度预测装置,其特征在于,还包括:
应用推荐推送模块,用于根据所述目标应用的流行度估值,向用户推送针对所述目标应用的推荐信息。
23.一种应用流行度预测设备,其特征在于,所述应用流行度预测设备包括处理器和存储器,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1-11任一项所述的应用流行度预测方法。
24.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有计算机程序,所述计算机程序包括程序指令;所述程序指令当被处理器执行时使所述处理器执行如权利要求1-11任一项所述的应用流行度预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610218863.5A CN105869022B (zh) | 2016-04-07 | 2016-04-07 | 一种应用流行度预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610218863.5A CN105869022B (zh) | 2016-04-07 | 2016-04-07 | 一种应用流行度预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105869022A CN105869022A (zh) | 2016-08-17 |
CN105869022B true CN105869022B (zh) | 2020-10-23 |
Family
ID=56637280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610218863.5A Active CN105869022B (zh) | 2016-04-07 | 2016-04-07 | 一种应用流行度预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105869022B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106528778A (zh) * | 2016-11-04 | 2017-03-22 | 广州华多网络科技有限公司 | 用户留存类数据获取方法及装置 |
CN108881333A (zh) * | 2017-05-09 | 2018-11-23 | 腾讯科技(深圳)有限公司 | 一种预测日活跃对象数量的方法及设备 |
CN107463660B (zh) * | 2017-07-31 | 2020-10-16 | 广州虎牙信息科技有限公司 | 产品活跃用户数据测算方法及计算机设备 |
CN109784959B (zh) * | 2017-11-10 | 2023-04-18 | 广州腾讯科技有限公司 | 一种目标用户预测方法、装置、后台服务器及存储介质 |
CN110895721B (zh) * | 2018-09-12 | 2021-11-16 | 珠海格力电器股份有限公司 | 电器功能的预测方法及装置 |
CN114661549B (zh) * | 2022-03-09 | 2024-04-30 | 国网山东省电力公司信息通信公司 | 基于随机森林的系统活跃度预测方法及系统 |
CN115604130B (zh) * | 2022-12-01 | 2023-03-14 | 中南大学 | App流行度预测模型构建方法、预测方法、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559208A (zh) * | 2013-10-10 | 2014-02-05 | 北京智谷睿拓技术服务有限公司 | 应用程序的排名欺诈检测方法和排名欺诈检测系统 |
CN103984673A (zh) * | 2013-02-11 | 2014-08-13 | 谷歌股份有限公司 | 与应用程序商店有关的欺骗性评级/评论的自动检测 |
CN104281882A (zh) * | 2014-09-16 | 2015-01-14 | 中国科学院信息工程研究所 | 基于用户特征的预测社交网络信息流行度的方法及系统 |
CN105095411A (zh) * | 2015-07-09 | 2015-11-25 | 中山大学 | 一种基于app质量的app排名预测方法及系统 |
CN105432038A (zh) * | 2013-05-28 | 2016-03-23 | 汤姆逊许可公司 | 应用排名计算装置和使用信息收集装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10789594B2 (en) * | 2013-01-31 | 2020-09-29 | Moshir Vantures, Limited, LLC | Method and system to intelligently assess and mitigate security risks on a mobile device |
-
2016
- 2016-04-07 CN CN201610218863.5A patent/CN105869022B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103984673A (zh) * | 2013-02-11 | 2014-08-13 | 谷歌股份有限公司 | 与应用程序商店有关的欺骗性评级/评论的自动检测 |
CN105432038A (zh) * | 2013-05-28 | 2016-03-23 | 汤姆逊许可公司 | 应用排名计算装置和使用信息收集装置 |
CN103559208A (zh) * | 2013-10-10 | 2014-02-05 | 北京智谷睿拓技术服务有限公司 | 应用程序的排名欺诈检测方法和排名欺诈检测系统 |
CN104281882A (zh) * | 2014-09-16 | 2015-01-14 | 中国科学院信息工程研究所 | 基于用户特征的预测社交网络信息流行度的方法及系统 |
CN105095411A (zh) * | 2015-07-09 | 2015-11-25 | 中山大学 | 一种基于app质量的app排名预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105869022A (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105869022B (zh) | 一种应用流行度预测方法和装置 | |
CN108364195B (zh) | 用户留存概率预测方法、装置、预测服务器及存储介质 | |
US10324989B2 (en) | Microblog-based event context acquiring method and system | |
CN107943583B (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
WO2015103964A1 (en) | Method, apparatus, and device for determining target user | |
US11544633B2 (en) | Method for cleaning up background application, storage medium, and electronic device | |
CN106022826A (zh) | 一种网络直播平台中的作弊用户识别方法与系统 | |
CN110166344B (zh) | 一种身份标识识别方法、装置以及相关设备 | |
WO2019062405A1 (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN106776925B (zh) | 一种移动终端用户性别的预测方法、服务器和系统 | |
CN111291894A (zh) | 超参数优化过程中的资源调度方法、装置、设备及介质 | |
CN107728772B (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN112884569A (zh) | 一种信用评估模型的训练方法、装置及设备 | |
CN109978058B (zh) | 确定图像分类的方法、装置、终端及存储介质 | |
CN115203496A (zh) | 基于大数据的项目智能预测及评估方法、系统及可读存储介质 | |
CN111260419A (zh) | 获取用户属性的方法、装置、计算机设备和存储介质 | |
CN110602207A (zh) | 基于离网预测推送信息的方法、装置、服务器和存储介质 | |
CN110796591A (zh) | 一种gpu卡的使用方法及相关设备 | |
KR101028810B1 (ko) | 광고 대상 분석 장치 및 그 방법 | |
CN111309706A (zh) | 模型训练方法、装置、可读存储介质及电子设备 | |
CN113050782A (zh) | 画像构建方法、装置、终端及存储介质 | |
CN110717787A (zh) | 一种用户的分类方法及装置 | |
CN114201696A (zh) | 一种消息推送方法及装置、存储介质、计算机设备 | |
CN113822464A (zh) | 用户信息的处理方法及装置、电子设备、存储介质 | |
CN113038242A (zh) | 直播卡片展示位置的确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |