CN109087124B - 一种应用程序价值预测方法及装置 - Google Patents
一种应用程序价值预测方法及装置 Download PDFInfo
- Publication number
- CN109087124B CN109087124B CN201810709902.0A CN201810709902A CN109087124B CN 109087124 B CN109087124 B CN 109087124B CN 201810709902 A CN201810709902 A CN 201810709902A CN 109087124 B CN109087124 B CN 109087124B
- Authority
- CN
- China
- Prior art keywords
- user
- feature vector
- activated
- target time
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000013598 vector Substances 0.000 claims abstract description 262
- 238000012549 training Methods 0.000 claims description 76
- 230000004913 activation Effects 0.000 claims description 67
- 239000011159 matrix material Substances 0.000 claims description 32
- 230000003068 static effect Effects 0.000 claims description 25
- 230000006399 behavior Effects 0.000 claims description 16
- 238000010801 machine learning Methods 0.000 claims description 13
- 230000008901 benefit Effects 0.000 claims description 11
- 230000014759 maintenance of location Effects 0.000 claims description 9
- 230000001186 cumulative effect Effects 0.000 claims description 8
- 238000012827 research and development Methods 0.000 abstract description 10
- 108091006146 Channels Proteins 0.000 description 28
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种应用程序价值预测方法及装置,该方法包括:获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种应用程序价值预测方法及装置。
背景技术
目前,随着移动互联网的快速发展,同时,为用户带来便利的应用程序也给更多的应用开发者带来更多盈利的机会,各应用开发者推出各自的应用程序,用户将根据各自的实际需求在智能手机中安装相应的应用程序,例如,工具类应用、游戏类应用、视频类应用、即时通信类应用等等。
当前,由于应用开发者对应用程序的价值进行合理预估,能够有效地指导应用开发者的商业决策、研发投入和推广投入,现有技术中提供了一种应用程序价值预测方法,主要是由专业人员根据应用程序的使用需求量和应用程序运行期间获得的资源收益进行人为预测。
由此可知,基于现有技术确定出的应用程序的预估价值存在准确度低、参考性差的问题,无法实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
发明内容
本申请实施例的目的是提供一种应用程序价值预测方法及装置,以提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
为解决上述技术问题,本申请实施例是这样实现的:
本申请实施例提供了一种应用程序价值预测方法,包括:
获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
本申请实施例提供了一种应用程序价值预测装置,包括:
第一获取模块,用于获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
生命周期确定模块,用于针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
第二获取模块,用于获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
资源收益确定模块,用于针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
累计收益确定模块,用于针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
预估价值确定模块,用于根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
本申请实施例提供了一种应用程序价值预测设备,包括:处理器;以及
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现以下流程:
获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
本申请实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现以下流程:
获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
本申请实施例中的应用程序价值预测方法及装置,获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用程序价值预测方法的第一种流程示意图;
图2为本申请实施例提供的应用程序价值预测方法的第二种流程示意图;
图3为本申请实施例提供的应用程序价值预测方法的第三种流程示意图;
图4为本申请实施例提供的应用程序价值预测方法中确定激活用户使用目标应用的生命周期的实现原理示意图;
图5为本申请实施例提供的应用程序价值预测方法中确定激活用户在各目标时间内所贡献的资源收益的实现原理示意图;
图6为本申请实施例提供的确定目标应用的预估价值的实现原理示意图;
图7为本申请实施例提供的应用程序价值预测装置的第一种模块组成示意图;
图8为本申请实施例提供的应用程序价值预测装置的第二种模块组成示意图;
图9为本申请实施例提供的应用程序价值预测设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请实施例提供了一种应用程序价值预测方法及装置,先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有参考的激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
图1为本申请实施例提供的应用程序价值预测方法的第一种流程示意图,图1中的方法的执行主体可以计算机设备,也可以是移动终端设备,如图1所示,该方法至少包括以下步骤:
S101,获取目标应用的各激活用户的第一特征向量,其中,该第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
具体的,目标应用为需要进行价值预测的任一应用程序,激活用户为下载使用目标应用的用户,第一特征向量由多个与用户生命周期相关联的特征参数以及该特征参数对应的特征值表示,对于目标应用的应用开发者而言,每个下载使用自身推广的应用程序的用户均是潜在的资源收益贡献者,使用该应用程序的用户量越多,产生的资源收益越多,应用程序的价值也就越大,因此,可以以激活用户为单位分析对象,预测每个激活用户在其使用目标应用的周期内所贡献的资源收益,进而根据各可参考的激活用户所贡献的资源收益之和确定目标应用的预估价值。
其中,为了提高目标应用价值预测的准确性,需要将虚假用户排除在外,因此,上述激活用户为在用户真实性识别阶段中真实性得分大于预设得分阈值的激活用户。
S102,针对每个激活用户,利用第一预测模型基于与该激活用户对应的第一特征向量,确定激活用户使用目标应用的生命周期;
具体的,在确定每个激活用户所贡献的资源收益之前,需要先确定各激活用户的生命周期,即针对每个激活用户,确定该激活用户从下载目标应用的激活时刻到卸载目标应用的流失时刻期间的时间长度,在具体实施时,预先基于第一历史数据训练得到用于预测用户生命周期的第一预测模型,然后,将获取到的激活用户的第一特征向量输入至该第一预测模型,第一预测模型的输出结果即为该激活用户使用目标应用的生命周期。
S103,获取激活用户在生命周期内各目标时间对应的第二特征向量,其中,第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
具体的,第二特征向量由多个影响用户所贡献的资源收益大小的特征参数以及该特征参数对应的特征值表示,在具体实施时,可以将生命周期按照预设时间间隔划分为多个目标时间,例如,目标时间可以是以天为单位,即分别确定在生命周期内每天的资源收益,因此,需要分别获取激活用户在生命周期内每一天对应的第二特征向量。
S104,针对每个目标时间,利用第二预测模型基于与该目标时间对应的第二特征向量,确定激活用户在该目标时间内所贡献的资源收益;
具体的,针对某一激活用户在其生命周期内的每个目标时间,在获取到该目标时间对应的第二特征向量后,基于该第二特征向量确定激活用户在该目标时间内所贡献的资源收益。在具体实施时,预先基于第二历史数据训练得到用于预测每个目标时间的资源收益的第二预测模型,然后,将获取到的该激活用户在生命周期内每个目标时间对应的第二特征向量分别输入至该第二预测模型,第二预测模型的输出结果即为该激活用户在生命周期内某一目标时间所贡献的资源收益,其中,资源收益来源主要是用户点击广告所带来的收益。
S105,针对每个激活用户,根据该激活用户的生命周期内各目标时间对应的资源收益,确定激活用户对目标应用所贡献的资源收益累计值;
具体的,针对每个参与预测目标应用价值的激活用户,在利用第二预测模型得到其生命周期内各目标时间对应的资源收益之后,将该激活用户在其生命周期内各目标时间对应的资源收益求和,可得到激活用户完整生命周期内累积贡献的资源收益,即该激活用户从下载目标应用到卸载目标用户期间所贡献的资源收益累计值。
S106,根据各激活用户对应的资源收益累计值,确定目标应用的预估价值。
其中,在确定出各参与预测目标应用价值的激活用户对应的资源收益累计值后,根据所有资源收益累计值的求和确定目标应用的预估价值。
本申请实施例中,首先,获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;然后,获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。也就是说,先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
进一步,考虑到激活用户中可能存在一部分虚假用户,此部分虚假用户并不会产生真正的资源收益,为了提高目标应用价值预测的准确性,需要将虚假用户排除在外,因此,在预测目标应用价值的过程中,在确定每个激活用户的生命周期之前,需要分别对每个激活用户进行真实性分析,只将激活用户中的真实用户作为参考对象,并非将所有激活用户均作为参考对象,基于此,如图2所示,在S101获取目标应用的各激活用户的第一特征向量之前,还包括:
S107,获取目标应用的各激活用户的历史关联信息,其中,该历史关联信息包括:用户注册信息、历史行为数据;
S108,利用预先训练得到的用户真实性识别模型基于历史关联信息,判断激活用户是否为真实用户,具体的,可以分别计算待识别的激活用户的用户真实性得分,若该用户真实性得分大于预设得分阈值,则确定该激活用户为真实用户;
若是,则将激活用户作为参与预测目标应用价值的激活用户,并执行S101。
其中,上述用户真实性识别模型是利用机器学习方法基于真实性训练样本训练得到的,用于预测某一激活用户属于真实用户还是作弊用户(即虚假用户),以便在对应用程序的价值进行预测时,准确地将真实用户作为参考对象,将虚假用户排除在外。在具体实施时,将待识别的激活用户的历史关联信息输入至预先训练好的用户真实性识别模型后,模型的输出结果为该激活用户的真实性得分,用户表征激活用户为作弊用户的可能性大小,真实性得分越大,作弊用户的可能性越小。
其中,上述第一预测模型是基于预先选取的训练样本数据利用机器学习方法训练得到的,具体的,上述第一预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第一训练样本数据,其中,该第一训练样本数据包括:每个样本用户的第一特征向量与留存周期之间的对应关系,该预设应用与目标应用相同或不同;
将获取到的第一训练样本数据输入至Cox比例风险回归模型,基于该第一训练样本数据求解得到针对第一特征向量的权重矩阵,具体的,若用户流失为独立事件,采用对数似然函数作为目标函数进行参数求解,得到针对第一特征向量的权重矩阵,该权重矩阵中包含第一特征向量中各特征参数对应的权重系数;
根据确定出的针对第一特征向量的权重矩阵更新Cox比例风险回归模型的模型参数,得到更新后的第一预测模型。
其中,Cox比例风险回归模型为半参数模型,无需对用户生命周期的分布进行假设,且在训练该模型时,引入多个影响用户生命周期的特征参数,因此,在Cox比例风险回归模型使用阶段,能够准确地预测激活用户使用目标应用的完整生命周期。
具体的,第一特征向量中的特征参数包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;其中,用户静态属性包括:用户所属国家、用户性别,该用户静态属性可以从激活用户的用户画像数据中获得,用户行为特征包括:利用用户真实性识别模型得到的用户真实性得分,激活渠道特征包括:渠道留存、渠道内平均点击收益来源对象的次数(例如,渠道平均广告点击数),用户激活特征包括:用户激活时间、用户激活渠道,用户所使用移动终端的属性信息包括:移动终端的设备型号、出厂厂商、总内存、总存储空间、剩余内存、剩余存储空间、设备语言类型、操作系统版本。
需要说明的是,在进行第一预测模型训练时选用的样本用户的第一特征向量与在使用第一预测模型预测生命周期时输入的目标用户的第一特征向量中的各特征参数类型相同,即训练模型时选用哪些特征参数,使用模型时同样需要输入哪些特征参数。
其中,针对确定各激活用户的生命周期的过程,在训练得到用于预测用户生命周期的第一预测模型之后,将当前获取的激活用户的相关数据输入至该第一预测模型,该第一预测模型的输出即为激活用户的生命周期,具体的,如图3所示,上述S102利用第一预测模型基于与该激活用户对应的第一特征向量,确定激活用户使用目标应用的生命周期,具体包括:
S1021,针对每个激活用户,利用预先训练好的Cox比例风险回归模型根据与该激活用户对应的第一特征向量,确定激活用户的流失时刻;
S1022,根据激活用户的激活时间和流失时刻,确定激活用户使用目标应用的生命周期。
其中,如图4所示,给出了确定激活用户使用目标应用的生命周期的实现原理示意图,具体为:
获取激活用户的第一特征向量,将该第一特征向量输入至预先训练好的第一预测模型,该第一预测模型的输出结果为该激活用户的生命周期。
具体的,上述S1021利用预先训练好的Cox比例风险回归模型根据与该激活用户对应的第一特征向量,确定激活用户的流失时刻,具体包括:
其中,λ(t|Xi)表示激活用户i在激活时长为t的流失风险系数、Xi表示激活用户i对应的第一特征向量、λ0(t)表示初始流失风险系数(即Xi为0时对应的流失风险系数)、β表示第一特征向量Xi的权重矩阵;
其中,Li(β)表示激活用户i的用户流失概率、λ(Ti|Xi)表示激活用户i在激活时长为Ti的流失风险系数、表示流失时刻大于Ti的样本用户的流失风险系数之和、Ti表示Li(β)=1时激活用户i的流失时刻、Tj表示Lj(β)=1时激活用户j的流失时刻、Xj表示激活用户j对应的特征向量。
其中,上述第二预测模型同样是基于预先选取的训练样本数据利用机器学习方法训练得到的,具体的,上述第二预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第二训练样本数据,其中,该第二训练样本数据包括:每个样本用户的第二特征向量与单位时间针对预设应用所贡献的资源收益之间的对应关系,该单位时间可以是“天”,该预设应用与目标应用相同或不同;
将获取到的第二训练样本数据输入至第二预测模型,利用机器学习方法基于该第二训练样本数据,训练得到针对第二特征向量的权重矩阵,其中,该权重矩阵中包含第二特征向量中各特征参数对应的权重系数;
根据确定出的针对第二特征向量的权重矩阵更新第二预设模型的模型参数,得到更新后的第二预测模型。
其中,为了保证利用第二预测模型得到的资源收益理论值与实际值之间偏差在预设范围之内,因此,在训练第二预测模型时,引入约束条件,即利用第二预设模型确定出的资源收益满足如下约束条件:
约束条件2:其中,A表示目标国家目标时间目标广告位对应的预测资源收益,B表示目标国家目标时间目标广告位对应的真实资源收益,γ表示预测偏差阈值,该约束条件2用于限制预测值与真实值的偏差保持在预设范围内。
其中,利用机器学习方法结合大量的样本数据,拟合单位目标时间激活用户所贡献的总资源收益,训练得到第二预测模型,以目标时间为基础单位,而不是以单个广告位为基础单位,这样在无法获取广告点击单价的情况下,利用第二预测模型结合第二特征向量也能够准确地得到各目标时间对应的资源收益。
另外,上述第二预测模型可以是线性回归模型,还可以是CART决策树模型或者其他决策树模型等等。
具体的,第二特征向量中的特征参数包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;其中,用户静态属性包括:用户所属国家、用户性别,收益来源特征包括:收益来源分类(例如,广告源分类)、收益来源点击均价(例如,广告位点击均价),上下文特征包括:收益来源点击时间(例如,广告点击时间)、产品促销活动代码,激活渠道特征包括:渠道留存、渠道内平均点击收益来源对象的次数(例如,渠道平均广告点击数),用户激活特征包括:用户激活时间、用户激活渠道。
其中,在训练第二预测模型时,针对上下文特征,引入产品促销活动代码,例如,红包、安装和推荐返现等促销活动,在一定程度上可以扩大产品的推广量,从而提高用户下载转化率,进而提高单用户带来的广告收入;另外,还引入广告点击时间,即发生广告点击动作的时间,由于季节等时间因素对用户的点击行为活动会有一定的影响,因此,单用户带来的广告收入与该特征参数相关。
需要说明的是,在进行第二预测模型训练时选用的样本用户的第二特征向量与在使用第二预测模型预测各目标时间对应的资源收益时输入的目标用户的第二特征向量中的各特征参数类型相同,即训练模型时选用哪些特征参数,使用模型时同样需要输入哪些特征参数。
其中,针对确定每个激活用户在各自的生命周期内各目标时间的资源收益的过程,在训练得到用于预测单日资源收益的第二预测模型之后,需要先获取每个目标时间的第二特征向量,具体的,上述S103获取激活用户在生命周期内各目标时间对应的第二特征向量,具体包括:
针对每个目标时间,判断该目标时间是否早于当前时间,具体的,若目标时间早于当前时间,说明该目标时间属于已知时间,可以获得激活用户的实际数据,若目标时间不早于当前时间,说明该目标时间属于未知时间,无法获取激活用户的实际数据;
若是,则将该目标时间对应的实际特征向量确定为该目标时间对应的第二特征向量;
若否,则获取在该目标时间之前指定时间段内的多个参考特征向量,其中,多个参考特征向量包括:实际特征向量和/或理论特征向量;以及根据该目标时间对应的多个参考特征向量,确定激活用户在生命周期内该目标时间对应的第二特征向量。
其中,上述实际特征向量中的各特征参数的特征值是实际数据即真实数据,上述理论特征向量中各特征参数的特征值是理论数据即预测数据。
具体的,如果激活用户的生命周期内划分得到的多个目标时间是以天为单位,此时,需要分别预测激活用户在其生命周期内每一天所贡献的资源收益,因此,需要获取生命周期内每一天对应的第二特征向量。在具体实施时,若待预测的目标时间为y且当前日期为x,即目标用户已经使用目标应用x-1天,需要预测激活用户在其生命周期内第y天的单日资源收益,其中,1≤y≤生命周期天数。
针对目标时间不早于当前时间的情况,如果指定时间段为n天,则需要将依次获取的第y-1天对应的第二特征向量、第y-2天对应的第二特征向量、直到获取到第y-n天对应的第二特征向量作为用于确定目标时间对应的第二特征向量的多个参考特征向量。
例如,如果目标时间y为当前日期,则第y-1天对应的第二特征向量、第y-2天对应的第二特征向量、直到第y-n天对应的第二特征向量均为实际特征向量;
如果目标时间y为当前日期的后一天,则第y-1天对应的第二特征向量为理论特征向量,而第y-2天对应的第二特征向量、直到第y-n天对应的第二特征向量均为实际特征向量;
如果目标时间y为当前日期的后两天,则第y-1天对应的第二特征向量为理论特征向量、第y-2天对应的第二特征向量为理论特征向量,而第y-3天对应的第二特征向量、直到第y-n天对应的第二特征向量均为实际特征向量;
依次类推,目标时间越晚于当前日期的,该目标时间对应的参考特征向量中属于理论特征向量的数量越多。
其中,在获取到目标时间对应的多个参考特征向量后,计算各特征参数的特征值的平均值,将各特征参数的平均值组成激活用户在生命周期内该目标时间对应的第二特征向量。
其中,在获取到每个目标时间的第二特征向量后,根据该第二特征向量确定该目标时间对应的资源收益,具体的,针对第二预测模型为线性回归模型的情况,上述S104利用第二预测模型基于与该目标时间对应的第二特征向量,确定激活用户在该目标时间内所贡献的资源收益,具体包括:
根据与目标时间对应的第二特征向量和线性公式Y=WX+b,计算得到激活用户在该目标时间内所贡献的资源收益;
其中,Y表示激活用户在该目标时间内所贡献的资源收益,X表示与目标时间对应的第二特征向量,W表示针对第二特征向量的特征参数权重矩阵,b表示利用机器学习训练得到的偏置向量。
其中,如图5所示,给出了确定激活用户在各目标时间内所贡献的资源收益的实现原理示意图,具体为:
针对每个目标时间,获取该目标时间对应的第二特征向量,将该第二特征向量输入至预先训练好的第二预测模型,该第二预测模型的输出结果为该激活用户在该目标时间内所贡献的资源收益。
具体的,以第二特征向量中包含多个特征参数分别为用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征为例,其中,用户静态属性的特征值为x1、对应的权重系数为w1,收益来源特征的特征值为x2、对应的权重系数为w2,上下文特征的特征值为x3、对应的权重系数为w3,激活渠道特征的特征值为x4、对应的权重系数为w4,用户激活特征的特征值为x5、对应的权重系数为w5;
其中,第二特征向量中各特征参数的权重系数是基于上述训练第二预测模型的过程中确定的,即确定出了w1至w5;目标时间对应的第二特征向量中各特征参数的特征值的是通过如下方式确定的,具体为:
若目标时间早于当前时间,则将该目标时间对应的实际特征向量中各特征参数的特征值确定为该目标时间对应的第二特征向量中各特征参数的特征值,即确定出了x1至x5;
若目标时间不早于当前时间,则获取在该目标时间之前指定时间段内的多个参考特征向量;以及根据该目标时间对应的多个参考特征向量中各特征参数的特征值的平均值确定为该目标时间对应的第二特征向量中各特征参数的特征值,即确定出了x1至x5;
将目标时间对应的第二特征向量中各特征参数的特征值x1至x5以及权重系数w1至w5,代入线性公式Y=WX+b=w1×x1+w2×x2+w3×x3+w4×x4+w5×x5+b即可得到激活用户在该目标时间内所贡献的资源收益。具体的,如图6所示,给出了确定目标应用的预估价值的实现原理示意图,具体为:
预先训练得到用于识别用户真实性的用户真实性识别模型;以及,
预先基于第一训练样本数据,训练得到用于预测用户生命周期的第一预测模型;以及,
预先基于第二训练样本数据,训练得到用于预测目标时间对应的资源收益的第二预测模型;
在预先训练好用户真实性识别模型、第一预测模型、第二预测模型这三个模型后,进行目标应用价值预测,具体包括:
(1)获取目标应用的各激活用户的历史关联信息,针对每个激活用户,将该激活用户的历史关联信息输入至用户真实性识别模型中,该用户真实性识别模型的输出结果为该激活用户的真实性得分;
将真实性得分大于预设得分阈值的激活用户作为参与预测目标应用价值的可参考的激活用户;
(2)获取各可参考的激活用户的第一特征向量,针对每个可参考的激活用户,将该激活用户的第一特征向量输入至第一预测模型中,该第一预测模型的输出结果为该激活用户的生命周期;
(3)针对每个可参考的激活用户,获取该激活用户在其生命周期内各目标时间对应的第二特征向量,针对每个目标时间,将该目标时间对应的第二特征向量输入至第二预测模型中,该第二预测模型的输出结果为该激活用户在该目标时间内所贡献的资源收益;
(4)针对每个可参考的激活用户,根据该激活用户的生命周期内各目标时间对应的资源收益,确定该激活用户对目标应用所贡献的资源收益累计值;
(5)根据各可参考的激活用户对应的资源收益累计值,确定目标应用的预估价值。
本申请实施例中的应用程序价值预测方法,获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
对应上述图1至图6描述的应用程序价值预测方法,基于相同的技术构思,本申请实施例还提供了一种应用程序价值预测装置,图7为本申请实施例提供的应用程序价值预测装置的第一种模块组成示意图,该装置用于执行图1至图6描述的应用程序价值预测方法,如图7所示,该装置包括:
第一获取模块701,用于获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
生命周期确定模块702,用于针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
第二获取模块703,用于获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
资源收益确定模块704,用于针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
累计收益确定模块705,用于针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
预估价值确定模块706,用于根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
可选地,如图8所示,上述装置还包括:第一模型训练模块707;所述第一模型训练模块707,用于:
获取样本用户使用预设应用产生的第一训练样本数据,其中,所述第一训练样本数据包括:每个样本用户的第一特征向量与留存周期之间的对应关系;
将所述第一训练样本数据输入至Cox比例风险回归模型,基于所述第一训练样本数据求解得到针对第一特征向量的权重矩阵;
根据所述针对第一特征向量的权重矩阵更新所述Cox比例风险回归模型的模型参数,得到更新后的第一预测模型。
可选地,所述生命周期确定模块702,具体用于:
利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻;
根据所述激活用户的激活时间和所述流失时刻,确定所述激活用户使用所述目标应用的生命周期。
可选地,所述生命周期确定模块702,进一步具体用于:
其中,λ(t|Xi)表示激活用户i在激活时长为t的流失风险系数、Xi表示激活用户i对应的第一特征向量、λ0(t)表示初始流失风险系数、β表示第一特征向量Xi的权重矩阵;
其中,Li(β)表示激活用户i的用户流失概率、λ(Ti|Xi)表示激活用户i在激活时长为Ti的流失风险系数、表示流失时刻大于Ti的样本用户的流失风险系数之和、Ti表示Li(β)=1时激活用户i的流失时刻、Tj表示Lj(β)=1时激活用户j的流失时刻、Xj表示激活用户j对应的特征向量。
可选地,上述装置还包括:第二模型训练模块708;所述第二模型训练模块708,用于:
获取样本用户使用预设应用产生的第二训练样本数据,其中,所述第二训练样本数据包括:每个样本用户的第二特征向量与单位时间针对预设应用所贡献的资源收益之间的对应关系;
利用机器学习装置基于所述第二训练样本数据,训练得到针对第二特征向量的权重矩阵;
根据所述针对第二特征向量的权重矩阵更新第二预设模型的模型参数,得到更新后的第二预测模型。
可选地,所述第二获取模块703,具体用于:
针对每个目标时间,判断所述目标时间是否早于当前时间;
若是,则将所述目标时间对应的实际特征向量确定为该目标时间对应的第二特征向量;
若否,获取在该目标时间之前指定时间段内的多个参考特征向量,其中,所述多个参考特征向量包括:实际特征向量和/或理论特征向量;以及根据所述目标时间对应的所述多个参考特征向量,确定所述激活用户在所述生命周期内该目标时间对应的第二特征向量。
可选地,所述资源收益确定模块704,具体用于:
根据与目标时间对应的所述第二特征向量和线性公式Y=WX+b,计算得到所述激活用户在该目标时间内所贡献的资源收益;
其中,Y表示激活用户在该目标时间内所贡献的资源收益,X表示与目标时间对应的第二特征向量,W表示针对第二特征向量的特征参数权重矩阵,b表示利用机器学习训练得到的偏置向量。
可选地,上述装置还包括:可参考激活用户确定模块709;所述可参考激活用户确定模块709,用于:
在获取目标应用的各激活用户的第一特征向量之前,获取目标应用的各激活用户的历史关联信息,其中,所述历史关联信息包括:用户注册信息、历史行为数据;
利用预先训练得到的用户真实性识别模型基于所述历史关联信息,判断所述激活用户是否为真实用户;
若判断结果为是,则将所述激活用户作为参与预测目标应用价值的激活用户。
本申请实施例中的应用程序价值预测装置,获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
需要说明的是,本申请实施例提供的应用程序价值预测装置与本申请实施例提供的应用程序价值预测方法基于同一发明构思,因此该实施例的具体实施可以参见前述应用程序价值预测方法的实施,重复之处不再赘述。
进一步地,对应上述图1至图6所示的方法,基于相同的技术构思,本申请实施例还提供了一种应用程序价值预测设备,该设备用于执行上述的应用程序价值预测方法,图9为本申请实施例提供的应用程序价值预测设备的结构示意图。
如图9所示,应用程序价值预测设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对应用程序价值预测设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在应用程序价值预测设备上执行存储器902中的一系列计算机可执行指令。应用程序价值预测设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906等。
在一个具体的实施例中,应用程序价值预测设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对应用程序价值预测设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;
针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值。
可选地,计算机可执行指令在被执行时,所述第一预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第一训练样本数据,其中,所述第一训练样本数据包括:每个样本用户的第一特征向量与留存周期之间的对应关系;
将所述第一训练样本数据输入至Cox比例风险回归模型,基于所述第一训练样本数据求解得到针对第一特征向量的权重矩阵;
根据所述针对第一特征向量的权重矩阵更新所述Cox比例风险回归模型的模型参数,得到更新后的第一预测模型。
可选地,计算机可执行指令在被执行时,所述利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期,包括:
利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻;
根据所述激活用户的激活时间和所述流失时刻,确定所述激活用户使用所述目标应用的生命周期。
可选地,计算机可执行指令在被执行时,所述利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻,包括:
其中,λ(t|Xi)表示激活用户i在激活时长为t的流失风险系数、Xi表示激活用户i对应的第一特征向量、λ0(t)表示初始流失风险系数、β表示第一特征向量Xi的权重矩阵;
其中,Li(β)表示激活用户i的用户流失概率、λ(Ti|Xi)表示激活用户i在激活时长为Ti的流失风险系数、表示流失时刻大于Ti的样本用户的流失风险系数之和、Ti表示Li(β)=1时激活用户i的流失时刻、Tj表示Lj(β)=1时激活用户j的流失时刻、Xj表示激活用户j对应的特征向量。
可选地,计算机可执行指令在被执行时,所述第二预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第二训练样本数据,其中,所述第二训练样本数据包括:每个样本用户的第二特征向量与单位时间针对预设应用所贡献的资源收益之间的对应关系;
利用机器学习方法基于所述第二训练样本数据,训练得到针对第二特征向量的权重矩阵;
根据所述针对第二特征向量的权重矩阵更新第二预设模型的模型参数,得到更新后的第二预测模型。
可选地,计算机可执行指令在被执行时,所述获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,包括:
针对每个目标时间,判断所述目标时间是否早于当前时间;
若是,则将所述目标时间对应的实际特征向量确定为该目标时间对应的第二特征向量;
若否,获取在该目标时间之前指定时间段内的多个参考特征向量,其中,所述多个参考特征向量包括:实际特征向量和/或理论特征向量;以及根据所述目标时间对应的所述多个参考特征向量,确定所述激活用户在所述生命周期内该目标时间对应的第二特征向量。
可选地,计算机可执行指令在被执行时,所述利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益,包括:
根据与目标时间对应的所述第二特征向量和线性公式Y=WX+b,计算得到所述激活用户在该目标时间内所贡献的资源收益;
其中,Y表示激活用户在该目标时间内所贡献的资源收益,X表示与目标时间对应的第二特征向量,W表示针对第二特征向量的特征参数权重矩阵,b表示利用机器学习训练得到的偏置向量。
可选地,计算机可执行指令在被执行时,还包含用于进行以下计算机可执行指令:
在获取目标应用的各激活用户的第一特征向量之前,获取目标应用的各激活用户的历史关联信息,其中,所述历史关联信息包括:用户注册信息、历史行为数据;
利用预先训练得到的用户真实性识别模型基于所述历史关联信息,判断所述激活用户是否为真实用户;
若是,则将所述激活用户作为参与预测目标应用价值的激活用户。
本申请实施例中的应用程序价值预测设备,获取目标应用的各激活用户的第一特征向量;针对每个激活用户,基于对应的第一特征向量,确定该激活用户使用目标应用的生命周期;获取该激活用户在生命周期内各目标时间对应的第二特征向量;针对每个目标时间,基于对应的第二特征向量,确定该激活用户在该目标时间内所贡献的资源收益。可见,通过本申请实施例中的应用程序价值预测设备,先确定各激活用户的生命周期,再确定每个激活用户在生命周期内各目标时间所贡献的资源收益,最终根据所有激活用户在各自生命周期内所贡献的资源收益累计值确定目标应用的预估价值,从而提高应用程序价值预测的准确度,进而实现对应用程序的商业决策、研发投入和推广投入起到准确地指导作用。
优选的,本申请实施例还提供一种应用程序价值预测设备,包括处理器901,存储器902,存储在存储器902上并可在处理器901上运行的计算机程序,该计算机程序被处理器901执行时实现上述应用程序价值预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
进一步地,对应上述图1至图6所示的方法,基于相同的技术构思,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述应用程序价值预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种应用程序价值预测方法,其特征在于,包括:
获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;所述激活渠道特征包括渠道留存和渠道内平均点击收益来源对象的次数;
针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值;
所述利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期,包括:
利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻;
根据所述激活用户的激活时间和所述流失时刻,确定所述激活用户使用所述目标应用的生命周期;
所述利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻,包括:
其中,λ(t|Xi)表示激活用户i在激活时长为t的流失风险系数、Xi表示激活用户i对应的第一特征向量、λ0(t)表示初始流失风险系数、β表示第一特征向量Xi的权重矩阵;
2.根据权利要求1所述的方法,其特征在于,所述第一预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第一训练样本数据,其中,所述第一训练样本数据包括:每个样本用户的第一特征向量与留存周期之间的对应关系;
将所述第一训练样本数据输入至Cox比例风险回归模型,基于所述第一训练样本数据求解得到针对第一特征向量的权重矩阵;
根据所述针对第一特征向量的权重矩阵更新所述Cox比例风险回归模型的模型参数,得到更新后的第一预测模型。
3.根据权利要求1所述的方法,其特征在于,所述第二预测模型是通过如下方式训练得到的:
获取样本用户使用预设应用产生的第二训练样本数据,其中,所述第二训练样本数据包括:每个样本用户的第二特征向量与单位时间针对预设应用所贡献的资源收益之间的对应关系;
利用机器学习方法基于所述第二训练样本数据,训练得到针对第二特征向量的权重矩阵;
根据所述针对第二特征向量的权重矩阵更新第二预设模型的模型参数,得到更新后的第二预测模型。
4.根据权利要求1所述的方法,其特征在于,所述获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,包括:
针对每个目标时间,判断所述目标时间是否早于当前时间;
若是,则将所述目标时间对应的实际特征向量确定为该目标时间对应的第二特征向量;
若否,获取在该目标时间之前指定时间段内的多个参考特征向量,其中,所述多个参考特征向量包括:实际特征向量和/或理论特征向量;以及根据所述目标时间对应的所述多个参考特征向量,确定所述激活用户在所述生命周期内该目标时间对应的第二特征向量。
5.根据权利要求4所述的方法,其特征在于,所述利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益,包括:
根据与目标时间对应的所述第二特征向量和线性公式Y=WX+b,计算得到所述激活用户在该目标时间内所贡献的资源收益;
其中,Y表示激活用户在该目标时间内所贡献的资源收益,X表示与目标时间对应的第二特征向量,W表示针对第二特征向量的特征参数权重矩阵,b表示利用机器学习训练得到的偏置向量。
6.根据权利要求1至5任一项所述的方法,其特征在于,在获取目标应用的各激活用户的第一特征向量之前,还包括:
获取目标应用的各激活用户的历史关联信息,其中,所述历史关联信息包括:用户注册信息、历史行为数据;
利用预先训练得到的用户真实性识别模型基于所述历史关联信息,判断所述激活用户是否为真实用户;
若是,则将所述激活用户作为参与预测目标应用价值的激活用户。
7.一种应用程序价值预测装置,其特征在于,包括:
第一获取模块,用于获取目标应用的各激活用户的第一特征向量,其中,所述第一特征向量包括:用户静态属性、用户行为特征、激活渠道特征、用户激活特征、用户所使用移动终端的属性信息中至少一种;所述激活渠道特征包括渠道留存和渠道内平均点击收益来源对象的次数;
生命周期确定模块,用于针对每个所述激活用户,利用第一预测模型基于与该激活用户对应的所述第一特征向量,确定所述激活用户使用所述目标应用的生命周期;
第二获取模块,用于获取所述激活用户在所述生命周期内各目标时间对应的第二特征向量,其中,所述第二特征向量包括:用户静态属性、收益来源特征、上下文特征、激活渠道特征、用户激活特征中至少一种;
资源收益确定模块,用于针对每个所述目标时间,利用第二预测模型基于与该目标时间对应的所述第二特征向量,确定所述激活用户在该目标时间内所贡献的资源收益;
累计收益确定模块,用于针对每个所述激活用户,根据该激活用户的所述生命周期内各所述目标时间对应的所述资源收益,确定所述激活用户对所述目标应用所贡献的资源收益累计值;
预估价值确定模块,用于根据各所述激活用户对应的所述资源收益累计值,确定所述目标应用的预估价值;
所述生命周期确定模块,具体用于:
利用Cox比例风险回归模型根据与该激活用户对应的所述第一特征向量,确定所述激活用户的流失时刻;
根据所述激活用户的激活时间和所述流失时刻,确定所述激活用户使用所述目标应用的生命周期;
所述生命周期确定模块,进一步具体用于:
其中,λ(t|Xi)表示激活用户i在激活时长为t的流失风险系数、Xi表示激活用户i对应的第一特征向量、λ0(t)表示初始流失风险系数、β表示第一特征向量Xi的权重矩阵;
8.根据权利要求7所述的装置,其特征在于,还包括:第一模型训练模块;所述第一模型训练模块,用于:
获取样本用户使用预设应用产生的第一训练样本数据,其中,所述第一训练样本数据包括:每个样本用户的第一特征向量与留存周期之间的对应关系;
将所述第一训练样本数据输入至Cox比例风险回归模型,基于所述第一训练样本数据求解得到针对第一特征向量的权重矩阵;
根据所述针对第一特征向量的权重矩阵更新所述Cox比例风险回归模型的模型参数,得到更新后的第一预测模型。
9.根据权利要求7所述的装置,其特征在于,还包括:第二模型训练模块;所述第二模型训练模块,用于:
获取样本用户使用预设应用产生的第二训练样本数据,其中,所述第二训练样本数据包括:每个样本用户的第二特征向量与单位时间针对预设应用所贡献的资源收益之间的对应关系;
利用机器学习装置基于所述第二训练样本数据,训练得到针对第二特征向量的权重矩阵;
根据所述针对第二特征向量的权重矩阵更新第二预设模型的模型参数,得到更新后的第二预测模型。
10.根据权利要求7所述的装置,其特征在于,所述第二获取模块,具体用于:
针对每个目标时间,判断所述目标时间是否早于当前时间;
若是,则将所述目标时间对应的实际特征向量确定为该目标时间对应的第二特征向量;
若否,获取在该目标时间之前指定时间段内的多个参考特征向量,其中,所述多个参考特征向量包括:实际特征向量和/或理论特征向量;以及根据所述目标时间对应的所述多个参考特征向量,确定所述激活用户在所述生命周期内该目标时间对应的第二特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810709902.0A CN109087124B (zh) | 2018-07-02 | 2018-07-02 | 一种应用程序价值预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810709902.0A CN109087124B (zh) | 2018-07-02 | 2018-07-02 | 一种应用程序价值预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109087124A CN109087124A (zh) | 2018-12-25 |
CN109087124B true CN109087124B (zh) | 2022-11-18 |
Family
ID=64836898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810709902.0A Active CN109087124B (zh) | 2018-07-02 | 2018-07-02 | 一种应用程序价值预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109087124B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110968802B (zh) * | 2019-12-04 | 2023-05-05 | 上海风秩科技有限公司 | 一种用户特征的分析方法、分析装置及可读存储介质 |
CN112669091B (zh) * | 2021-01-06 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及存储介质 |
CN114742569A (zh) * | 2021-01-08 | 2022-07-12 | 广州视源电子科技股份有限公司 | 用户生命阶段预测方法、装置、计算机设备及存储介质 |
CN116703457B (zh) * | 2022-12-16 | 2024-08-27 | 荣耀终端有限公司 | 用户生命周期价值的预测方法和预测装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294410A (zh) * | 2015-05-22 | 2017-01-04 | 苏宁云商集团股份有限公司 | 一种个性化信息推送时间的确定方法及确定系统 |
CN105354725A (zh) * | 2015-11-20 | 2016-02-24 | 珠海多玩信息技术有限公司 | 一种应用推广效果的预测方法及系统 |
CN108154420A (zh) * | 2017-12-26 | 2018-06-12 | 泰康保险集团股份有限公司 | 产品推荐方法及装置、存储介质、电子设备 |
-
2018
- 2018-07-02 CN CN201810709902.0A patent/CN109087124B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109087124A (zh) | 2018-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109087124B (zh) | 一种应用程序价值预测方法及装置 | |
US10387909B2 (en) | Simulation-based evaluation of a marketing channel attribution model | |
JP2018526710A (ja) | 情報推薦方法および情報推薦装置 | |
EP3764303A1 (en) | Information processing device, etc. for calculating prediction data | |
US20200074498A1 (en) | Systems and methods for improving social media advertising efficiency | |
CN108960901B (zh) | 数据处理方法、装置、介质及电子设备 | |
US10304067B2 (en) | Model validation and bias removal in quasi-experimental testing of mobile applications | |
US20120253945A1 (en) | Bid traffic estimation | |
US10372599B2 (en) | Model-based matching for removing selection bias in quasi-experimental testing of mobile applications | |
CN109936860B (zh) | 网络信息流量分配方法、流量分配模型训练方法及装置 | |
CN110322169B (zh) | 一种任务发布的方法及装置 | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 | |
CN112884529A (zh) | 一种广告竞价方法、装置、设备及介质 | |
CN108667877B (zh) | 确定推荐信息的方法及装置、计算机设备及存储介质 | |
CN117252564A (zh) | 资源调度方法、装置、计算机设备及存储介质 | |
CN111369293A (zh) | 一种广告出价方法、装置及电子设备 | |
US11270315B2 (en) | Agent awareness modeling for agent-based modeling systems | |
CN113139826A (zh) | 广告位的分配权限确定方法、装置、计算机设备 | |
CN109523296B (zh) | 用户行为概率分析方法及装置、电子设备、存储介质 | |
CN113627979A (zh) | 资源投放数据的处理方法、装置、服务器、系统及介质 | |
CN112508692A (zh) | 基于卷积神经网络的资源回收风险预测方法、装置和电子设备 | |
KR20220082603A (ko) | 광고 전략을 생성하기 위한 광고 방법 및 장치 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
CN110020738B (zh) | 用于数据处理的方法、装置、电子设备及计算机可读介质 | |
CN113988914A (zh) | 一种用户价值预测方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |