CN107862551B - 网络应用推广效果的预测方法、装置和终端设备 - Google Patents
网络应用推广效果的预测方法、装置和终端设备 Download PDFInfo
- Publication number
- CN107862551B CN107862551B CN201711077624.3A CN201711077624A CN107862551B CN 107862551 B CN107862551 B CN 107862551B CN 201711077624 A CN201711077624 A CN 201711077624A CN 107862551 B CN107862551 B CN 107862551B
- Authority
- CN
- China
- Prior art keywords
- revenue
- accumulated
- application
- promotion
- variable characteristics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000000694 effects Effects 0.000 title claims abstract description 18
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000011497 Univariate linear regression Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000009825 accumulation Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims 1
- 230000001186 cumulative effect Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012847 principal component analysis method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0254—Targeted advertisements based on statistics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种网络应用推广效果的预测方法、装置和终端设备。该网络应用推广效果的预测方法包括:获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括历史用户的运营数据和累计营收;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收。根据该累计营收,本发明可及时获知当前应用的推广效果,并提高推广位置的利用率。
Description
技术领域
本发明涉及信息处理技术,尤其是一种网络应用推广效果的预测方法、装置和终端设备。
背景技术
当下,很多产品的推广很大程度上都依赖于互联网,尤其是互联网应用产品。以手机应用产品或电子游戏产品为例,为了优化互联网推广效率,一般采用精细化运营,以提高流量的利用率及转化率,即监控各推广渠道(例如游戏大厅、网页链接、弹窗渠道、砸蛋渠道等)每个推广位置的利用率,并及时对利用率低和转化率低的游戏,给出候选的替换游戏,以使每个推广位置在未来预设的天数内产出最高营收。
一般,页面推广位置对应投放的应用是否吸引用户,会影响到用户第一层的点击转化率,进而影响后续付费转化率,最终影响该推广位置的营收。以游戏大厅为例,游戏大厅内的每个推广位置,可安置任意游戏,如何使所有推广位置产出最高价值,对于运营数据的分析有很高的要求。人工回顾和分析运营数据以得到推广位置的利用率,这种方法的周期较长,而且对推广位置的数据统计口径或分析模型的标准不统一。因此建立一种可评价推广位置利用率的方法非常必要。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一,特别是可获得用于评价推广位置利用率重要参数之一的预测累计营收数据,以便提高推广位置的利用率。
本发明提供了一种网络应用推广效果的预测方法,包括:
获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括历史用户的运营数据和累计营收;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;
获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收。
优选地,所述得到预测累计营收之后,还包括:
根据所述预测累计营收,处理所述当前应用。
进一步地,所述根据所述预测累计营收,处理所述当前应用,包括:
确定所述预测累计营收低于预置值,替换推广位置上所述当前应用;或
确定所述预测累计营收不低于预置值、且预测累计营收不低于预置值的累积时长大于预定时长,把当前应用作为热门应用推送给用户。
进一步地,所述网络推广数据还包括所述推广位置的埋点信息;所述替换推广位置上所述当前应用,包括:
针对特定埋点信息推送候选应用列表,自所述候选应用列表中确定替补应用,将替补应用替换推广位置上所述当前应用。
进一步地,所述候选应用列表中的应用以历史运营评分从高到低排列。
优选地,所述运营数据的变量特征包括曝光量、点击量、点击转化率、注册人数、注册转化率、充值人数、充值金额、充值转化率。
优选地,所述确定所述运营数据中与累计营收最相关的预设数量的变量特征,包括:
根据单变量线性回归模型:tm=θ0+θ1xm,检验所述运营数据中每种变量特征与累计营收的显著性关系,将符合预设显著性关系的运营数据作为与累计营收相关的预设数量的变量特征;
其中,
θ0为第一预设参数,θ1为第二预设参数,tm为第m个历史应用的累计营收,xm为第m个历史应用的变量特征,m为自然数。
进一步地,所述根据所述变量特征与累计营收,构建分类器模型,包括如下步骤:
根据所述变量特征与累计营收,生成用于模型训练的变量特征与累计营收的样本集和用于验证的变量特征与累计营收的验证集;
由所述样本集中的变量特征xn1与累计营收yn1,构建预回归模型:
yn1=w'T xn1+b,获得超平面第一参数w’和超平面第二参数b的稀疏解,其中,w'T为w’的转置,xn1为样本集中第n1个历史应用的变量特征,yn1为样本集中第n1个历史应用的累计营收,n1为自然数;
根据所述预回归模型与验证集中的变量特征xn预测验证集中的累计营收,根据该预测的累计营收yn与验证集中的累计营收tn获得误差惩罚函数E∈,其中,xn为验证集中第n个历史应用的变量特征,yn为验证集中第n个历史应用预测的累计营收,tn为验证集中第n个历史应用的累计营收,n为自然数;
根据第一参数w’、第二参数b和误差惩罚函数E∈,得到分类器模型:
Yj=wTxj+b,其中,W为第三参数,wT为w的转置,
本发明还提出一种网络应用推广效果的装置,包括:
建模模块,用于获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括历史用户的运营数据和累计营收;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;
预测模块,用于获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收。
本发明还提出一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;所述处理器执行所述计算机程序时,实现前述任意一项所述的预测方法。
本发明的有益效果如下:
1、本发明通过历史应用的网络推广数据构建与累计营收相关的分类器模型,并将当前应用在推广位置的运营数据带入所述分类器模型中,即可得到当前应用的预测累计营收,根据该累计营收即可得知当前应用在该推广位置上的推广效果。本发明的分类器模型排除了应用本身的属性特征,节约了用户输入应用属性的时间,或减少了系统自动判断应用属性的时间和难度;亦避免了在部分情况下因缺乏应用的属性数据而造成样本的异常,从而增加建模难度。
2、根据该推广效果,可采取对应的处理措施;例如,若当前应用的累计营收较历史应用的累计营收低,例如低于平均数或中位数,则说明推广欠佳,可采用其它应用替换该推广位置上的当前应用;或,当前应用的累计营收明显超出历史应用的累计营收中位数,且预测累计营收不低于预置值的累计时长大于预定时长,则可将当前应用作为热门应用推送至用户;本发明可在短时间内得到当前应用在推广位置的预测累计营收,以便对利用率低的推广位置发出警报,或及时发掘热门应用,以使推广位置得到最大利用,产出最高累计营收价值。
3、本发明利用单变量线性回归模型从众多运营数据中筛选出与累计营收显著性最强的几种运营数据作为变量特征,舍弃其它变量特征,降低了系统的建模难度;可结合正则平方误差函数,对预测模型进行修正,提高了预测精度。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明方法实施例的流程示意图;
图2为本发明方法优选实施例的流程示意图;
图3为本发明所述终端设备的实施例示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本发明提出一种网络应用推广效果的预测方法,为了便于说明本发明的具体实施方式,以下实施例中均以游戏大厅中的广告位作为推广位置,以游戏应用作为历史应用和当前应用进行说明,但并不代表本发明的技术方案仅应用于游戏领域;本发明可应用于多种领域的应用推广,其推广位置亦可扩展至网页推广、内置应用推广、二维码推广等多种推广渠道。
本发明的具体实施例可如图1所示,包括如下步骤:
S10:获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括历史用户的运营数据和累计营收;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型。
所述推广位置根据网络推广渠道的不同,可以为一个或多个,例如网页广告位、游戏大厅广告位、应用软件内部推荐位等其中的一个或多个。所述第一预设时间为统计的应用样本投放的时间段,一般以最近投放的应用作为样本数据,以确保构建分类器模型的样本数据为最新的运营数据。较佳地,该样本数据可根据预设规则进行更新,避免太久之前的应用的样本数据对构建分类器模型产生负面影响;而且,太久之前的历史数据对后续数据的应用性也较弱。第一预设时间的长度可根据具体应用的产品类型或生命周期设置,例如:手机游戏等生命周期较短的应用,可设置为3-10个月;若为娱乐软件、专业软件等应用,则可设置稍长的时间。所述第二预设时间为自第一预设时间内截取的可获取到样本数据真实运营数据和累计营收的时间段,为了便于与后续步骤S20中的第三预设时间内的预测累计营收进行比对,其时间不宜过长,以避免预测推广效果的周期过长,造成推广位置资源的浪费。
以网页或手机游戏大厅为例,可统计游戏大厅某些推广位置最近6个月内投放过的所有游戏在投放后30天内的网络推广数据,则第一预设时间为6个自然月,第二预设时间为30天。所述网络推广数据包括在第二预设时间30天内的历史用户的运营数据和累计营收,以得出运营数据与累计营收之间的回归模型。
所述网络推广数据可以包括所有与用户相关的基本运营数据以及通过基本运营数据计算出的中间参数;为便于描述,本发明将所述基本运营数据与中间参数称为变量特征;所述变量特征可包括曝光量、点击量、新用户注册人数、充值率、注册用户人均充值率等。为了便于说明,以下为本发明涉及的主要术语定义:
曝光量:网页页面某位置被浏览的次数。
点击量:网页页面某位置被点击的次数。
点击转化率:点击量/曝光量。
注册人数:首次从该位置进入游戏的用户。
注册转化率:注册量/点击量。
当天充值新用户数:首次从该位置进入游戏的用户中当天充值的。
当天充值金额:首次从该位置进入游戏的用户当天的充值金额。
当天充值转化率:当天充值用户/注册用户。
两天充值新用户数:首次从该位置进入游戏的用户中两天内充值的。
两天天充值金额:首次从该位置进入游戏的用户两天内的充值金额。
两天天充值转化率:两天内充值用户/注册用户。
两天充值增值:两天内充值金额-当天充值金额。
两天充值人数增值:两天充值新用户数-当天充值新用户数。
当天注册APRU:当天充值金额/注册量。
当天点击APRU:当天充值金额/点击量。
两天注册APRU:两天充值金额/注册量。
两天点击APRU:两天充值金额/点击量。
以上变量特征均可反应网络应用的推广效果,实际应用中的运营数据还可包括其它更多的变量特征,例如进一步统计七天内的充值新用户等,而并不限于以上所列特征,或仅包括其中几种变量特征而不是全部;累计营收作为重要的可量化的推广效果之一,亦与以上各变量特征具有关联。将最近6个月在游戏大厅内投放过的所有游戏在投放后30天内的变量特征和累计营收作为样本,摒弃其中与累计营收无关联或关联关系不显著的变量特征,将剩余数量的最相关的变量特征与累计营收建立回归模型,以获得最相关的变量特征与累计营收之间的回归关系。当然,建立回归模型时,可包括以上运营数据中的所有变量特征,亦可仅包括其中部分变量特征。
在本发明的一个实施例中,所述运营数据的变量特征包括曝光量、点击量、点击转化率、注册人数、注册转化率、充值人数、充值金额、充值转化率等运营数据;所述充值人数可为所有充值总人数,充值金额可为用户累计充值金额,充值转化率可为充值用户/注册用户。为进一步细化统计上述变量特征与累计营收之间的关系,所述充值人数可进一步包括当天充值新用户数、两天充值新用户数、两天充值人数增值等变量特征,所述充值金额可进一步包括当天充值金额、两天充值金额、两天充值增值等变量特征,所述充值转化率进一步包括当天充值转化率、两天充值转化率、当天注册APRU、当天点击APRU、两天注册APRU、两天点击APRU等变量特征,以提高回归模型的精确度。
上述变量特征内部之间可能存在共线性等函数关系,为降低建模难度,本发明可根据线性回归模型进行假设,利用主成分分析方法对各变量特征进行变量组合,以去除变量特征之间的共线性关系,减少模型中的变量特征。亦可通过单变量线性回归模型,检验所述运营数据中每种变量特征与累计营收的显著性关系,将显著性关系明显的几组运营数据作为与累计营收相关的变量特征,显著性关系不明显的运营数据则不作为建模的变量特征。故本发明还提出如下实施例:
所述确定所述运营数据中与累计营收最相关的预设数量的变量特征,包括:
根据单变量线性回归模型:tm=θ0+θ1xm,检验所述运营数据中每种变量特征与累计营收的显著性关系,将符合预设显著性关系的运营数据作为与累计营收相关的预设数量的变量特征;
其中,θ0为第一预设参数,θ1为第二预设参数,tm为第m个游戏或其它应用的累计营收,xm为第m个游戏或其它应用的变量特征,m为自然数。
可预设若变量特征与累计营收之间的显著性水平P<0.05,则判断显著性关系不明显,该变量特征不作为与累计营收相关的预设数量的变量特征;若变量特征与累计营收之间的显著性水平P≥0.05,则判断显著性关系明显,该变量特征作为与累计营收相关的预设数量的变量特征;最后将所有显著性关系明显的变量特征与累计营收作为分析样本,构建分类器模型。亦可再同时结合主成分分析方法对变量特征进行变量组合,以去除变量特征之间的共线性关系,进一步降低建模难度。
若取近6个月在游戏大厅内投放过的N个游戏为统计样本,则变量特征与累计营收的样本数量为N,取n个变量特征作为最相关的变量特征,可首先求解出n个因子的协方差矩阵(n*n),根据协方差矩阵的求解特征值、特征向量,选出特征向量的最大的p个向量组成矩阵(n*p),其中p<n;再和原本的样本数据做乘法(N*n),即可得到调整后的数据(N*p)。
当所述网络推广渠道较多时,所述网络推广数据还可包括所述推广位置的埋点信息,以分别统计每个推广位置的运营数据。每个推广位置可即时或定期上报详细的运营数据,以及相关的用户行为数据,例如:某用户从哪个推广位置进入该应用;然后对每个推广位置上报的运营数据进行ETL处理,统计出每个推广位置对应的变量特征数值。根据这些变量特征数值,可推知每个具体的推广位置对整体运营数据的贡献比例,例如电脑端的网页推广运营数据与手机端的网页推广运营数据,游戏大厅的推广运营数据与视频播放的推广运营数据。
基于前述的各变量特征,本发明还提出一种构建分类器模型的具体实施例,在该实施例中,
根据所述变量特征与累计营收,构建分类器模型,包括如下步骤:
根据所述变量特征与累计营收,生成用于模型训练的变量特征与累计营收的样本集和用于验证的变量特征与累计营收的验证集;所述变量特征与累计营收为包括每个游戏或其它应用的变量特征与累计营收的集合;
由所述样本集中的变量特征xn1与累计营收yn1,构建预回归模型:
yn1=w'T xn1+b,获得超平面第一参数w’和超平面第二参数b的稀疏解,其中,w'T为w’的转置,xn1为样本集中第n1个游戏的变量特征,yn1为样本集中第n1个游戏的累计营收,n1为自然数。
根据所述预回归模型与验证集中的变量特征xn预测验证集中的累计营收,根据该预测的累计营收yn与验证集中的累计营收tn获得误差惩罚函数E∈,其中,xn为验证集中第n个历史应用的变量特征,yn为验证集中第n个历史应用预测的累计营收,tn为验证集中第n个历史应用的累计营收,n为自然数;
根据第一参数w’、第二参数b和误差惩罚函数E∈,得到分类器模型:
Yj=wTxj+b,其中,W为第三参数,wT为w的转置,
该实施例采用支持向量机(SVM)分类回归方法,在样本集(xn1,yn1)中,xn1是输入的第n1个游戏的变量特征矩阵,yn1是第n1个游戏的输出变量,即未来预设时间内的累计营收。为了获得超平面第一参数w’和超平面第二参数b的稀疏解,在本实施例中,可不依靠所有的样本集数据,而是代入部分样本集数据,再采用∈-insensitive误差函数。∈-insensitive误差函数定义为:如果预测的累计营收yn与实际的累计营收tn的差值小于阈值∈,将不对此样本点做惩罚,若超出阈值,惩罚量为|yn-tn|-∈,即:
将E∈代入正则平方误差函数,即可得到第三参数W的最小化误差函数:
将W代入Yj=wTxj+b中,即可得到分类器模型。
构建分类器模型后,将需要预测累计营收的游戏的变量特征代入所述分类器模型,即可得到预测结果,具体步骤如下:
S20:获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收。
所述当前应用对应前述实施例中的需要预测累计营收的游戏,将获取的第三预设时间内的网络推广数据中与累计营收最相关的预设数量的变量特征代入所述分类器模型,即可得到该游戏在第三预设时间内的预测累计营收,根据该累计营收即可得知当前应用在该推广位置上的推广效果。
例如第三预设时间为2天,基于前述第一预设时间为6个自然月,第二预设时间为30天的实施例,本模型可根据最近6个月内投放的所有游戏或应用在最近30天内的累计营收建立分类器模型,再将新投放2天的当前应用运营数据中的对应变量特征代入该分类器模型,即可预测出该当前应用在未来30天的预测累计营收。
得到预测累计营收之后,本发明还提出另一实施例,包括:
根据所述预测累计营收,处理所述当前应用。
当推广位置有多个时,处理所述应用可包括替换部分特定推广位置的游戏或替换所有推广位置的应用,亦或是将某游戏推送至更显著的位置进行推广。
优选地,在本发明又一实施例中,所述根据所述预测累计营收,处理所述当前应用,包括:
确定所述预测累计营收低于预置值,替换推广位置上所述当前应用;或
确定所述预测累计营收不低于预置值、且预测累计营收不低于预置值的累积时长大于预定时长,把当前应用作为热门应用推送给用户。
如图2所示,其具体过程包括如下步骤:
S30:确定所述预测累计营收是否低于预置值;若是,则执行步骤S41,若否,则执行步骤S31;
S31:预测累计营收不低于预置值的累积时长是否大于预定时长,若是,则执行步骤S42,若否,则执行步骤S43;
S41:替换推广位置上所述当前应用;
S42:把当前应用作为热门应用推送给用户;
S43:将当前应用保持在推广位置。
本实施例可根据预测累计营收自动将营收高的游戏推送至热门应用,以供更多用户使用,进一步提高累计营收;或将推广位置中累计营收低的游戏自动替换为累计营收高的游戏或新游戏,使游戏大厅中数量有限的推广位置得到更充分的利用。当然,所述推送至热门应用或替换为累计营收高的游戏或新游戏亦可为手动模式。
如前所述,所述网络推广数据还可包括所述推广位置的埋点信息;故所述替换推广位置上所述当前应用,可具体包括针对特定埋点信息推送候选应用列表,,自所述候选应用列表中确定替补应用,以将替补应用替换推广位置上所述当前应用。例如:若某游戏在电脑端推广位置的变量特征表现不佳,可针对电脑端的该游戏推广位置推送候选应用列表,而不改变手机端的推广;亦可反之,仅针对手机端的该游戏推广位置推送候选应用列表,而不改变电脑端的推广。
为实现推广位置的游戏自动替换功能,或方便后台选择候选应用,所述候选应用列表中的应用可以历史运营评分从高到低排列。所述历史运营评分可根据试运营阶段的试运营数据进行综合评分,该试运营数据亦可包括过去预设时间内各推广渠道的点击新用户数量、注册新用户数量、三天的人均价值(三天充值金额/注册量)、七天的人均价值(七天充值金额/注册量)、十五天的人均价值(十五天充值金额/注册量)、点击转化率、注册转化率、累计营收等变量特征。所述变量特征的统计口径,或变量特征的数量可与所述推广位置上报的运营数据不同。对所述试运营数据进行归一化处理,可直接通过加权求和的方式进行打分,得到历史运营评分,然后按照历史运营评分从高到低排序,得到候选替换列表。
基于上述预测方法,本发明还提出如下应用于游戏大厅的优选实施例,其具体步骤为:
第一步,对游戏大厅首页的每个推广位置进行位置埋点、数据上报处理。每个推广位置上报各自位置的具体游戏运营数据时,还带有位置信息(即用户从哪个链接进入该游戏);然后对该推广位置上报的数据进行ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)处理,统计出每个推广位置对应的游戏基础指标如:曝光量、点击量、点击转化率(点击量/曝光量)、注册人数、注册转化率(注册人数/点击人数)、当日、2日内充值人数、充值金额、充值转化率(充值人数/注册人数)、未来30天累计营收等。
第二步,统计最近3个月每个推广位置投放过的游戏未来30天的运营数据和累计营收,作为样本,并根据累计营收是否符合预设的数值,给每个投放的游戏打上标签(合格或不合格);再将样本随机打乱,选择80%的样本作为训练集和20%的样本作为测试集;再利用现有的有监督的分类算法,如人工神经网络(ANN)、支持向量机(SVM)、决策树等方法进行分类模型的训练,并用测试集进行验算,得到最优算法,建立最终的分类器模型。
第三步,对某个推广位置新投放的游戏或广告进行2天的运营数据收集,然后输入到训练好的分类器模型中,输出预测累计营收,并判断累计营收是否合格,合格则说明该投放的游戏在该推广位置的未来30天能产出足够的累计营收价值,可持续在推广位置推广,或可同时推荐至其它更多的推广位置;否则报警不合格,提示该推广位置的游戏需及时更换。
第四步,对于第三步输出的结果进一步处理,如果推广位置的游戏不合格,则推送其它游戏的候选应用列表;候选应用列表中的游戏可根据游戏本身的属性或测试数据的表现进行打分排序,以便系统或运营人员在候选应用列表中筛选候补游戏进行替换。
根据上述网络应用推广效果的预测方法,本发明还提出一种网络应用推广效果的装置,包括:
建模模块,用于获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括历史用户的运营数据和累计营收;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;
预测模块,用于获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收。
本发明还提出一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;所述处理器执行所述计算机程序时,实现前述任意一项所述的预测方法。
如图3所示为本发明所述终端设备的部分结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。所述终端设备可以为包括手机、平板电脑、笔记本电脑、台式电脑等可观看直播节目的终端设备。下面以台式电脑为例说明本发明终端设备的工作方式。
参考图3,台式电脑包括处理器、存储器、输入单元、显示单元等部件。本领域技术人员可以理解,图3中示出的台式电脑结构并不构成对所有台式电脑的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储器可用于存储计算机程序以及各功能模块,处理器通过运行存储在存储器的计算机程序,从而执行台式电脑的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如获取推广位置运营数据的功能)等;存储数据区可存储根据台式电脑的使用所创建的数据(比如运营数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件。
输入单元可用于接收用户输入的搜索关键字,以及产生与台式电脑的用户设置以及功能控制有关的信号输入。具体地,输入单元可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键、轨迹球、鼠标、操作杆等中的一种或多种。显示单元可用于显示用户输入的信息或提供给用户的信息以及台式电脑的各种菜单。显示单元可采用液晶显示器、有机发光二极管等形式。处理器是台式电脑的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行各种功能和处理数据。
此外,在本发明各个实施例中的各模块可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种网络应用推广效果的预测方法,其特征在于,包括:
获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括各个推广位置的历史用户的运营数据和累计营收以及所述推广位置的埋点信息;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;
获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收;确定所述预测累计营收低于预置值时,针对特定埋点信息推送候选应用列表,自所述候选应用列表中确定替补应用,将替补应用替换推广位置上所述当前应用。
2.根据权利要求1所述的预测方法,其特征在于,所述得到预测累计营收之后,还包括:
根据所述预测累计营收,处理所述当前应用。
3.根据权利要求2所述的预测方法,其特征在于,还包括:
确定所述预测累计营收不低于预置值、且预测累计营收不低于预置值的累积时长大于预定时长,把当前应用作为热门应用推送给用户。
4.根据权利要求1所述的预测方法,其特征在于,所述候选应用列表中的应用以历史运营评分从高到低排列。
5.根据权利要求1所述的预测方法,其特征在于,所述运营数据的变量特征包括曝光量、点击量、点击转化率、注册人数、注册转化率、充值人数、充值金额、充值转化率。
6.根据权利要求1所述的预测方法,其特征在于,所述确定所述运营数据中与累计营收最相关的预设数量的变量特征,包括:
根据单变量线性回归模型:tm=θ0+θ1xm,检验所述运营数据中每种变量特征与累计营收的显著性关系,将符合预设显著性关系的运营数据作为与累计营收最相关的预设数量的变量特征;
其中,θ0为第一预设参数,θ1为第二预设参数,tm为第m个历史应用的累计营收,xm为第m个历史应用的变量特征,m为自然数。
7.根据权利要求6所述的预测方法,其特征在于,所述根据所述变量特征与累计营收,构建分类器模型,包括如下步骤:
根据所述变量特征与累计营收,生成用于模型训练的变量特征与累计营收的样本集和用于验证的变量特征与累计营收的验证集;
由所述样本集中的变量特征xn1与累计营收yn1,构建预回归模型:
yn1=w'Txn1+b,获得超平面第一参数w’和超平面第二参数b的稀疏解,其中,w'T为w’的转置,xn1为样本集中第n1个历史应用的变量特征,yn1为样本集中第n1个历史应用的累计营收,n1为自然数;
根据所述预回归模型与验证集中的变量特征xn预测验证集中的累计营收,根据该预测的累计营收yn与验证集中的累计营收tn获得误差惩罚函数E∈,其中,xn为验证集中第n个历史应用的变量特征,yn为验证集中第n个历史应用预测的累计营收,tn为验证集中第n个历史应用的累计营收,n为自然数;
根据第一参数w’、第二参数b和误差惩罚函数E∈,得到分类器模型:
Yj=wTxj+b,其中,W为第三参数,wT为w的转置,
8.一种网络应用推广效果的装置,其特征在于,包括:
建模模块,用于获取推广位置上第一预设时间内投放的历史应用在第二预设时间内的网络推广数据,所述网络推广数据包括各个推广位置的历史用户的运营数据和累计营收以及所述推广位置的埋点信息;确定所述运营数据中与累计营收最相关的预设数量的变量特征;根据所述变量特征与累计营收,构建分类器模型;
预测模块,用于获取推广位置上投放的当前应用在第三预设时间内的网络推广数据,获取网络推广数据中运营数据的变量特征,把变量特征代入所述分类器模型,得到预测累计营收;确定所述预测累计营收低于预置值时,针对特定埋点信息推送候选应用列表,自所述候选应用列表中确定替补应用,将替补应用替换推广位置上所述当前应用。
9.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至7任意一项所述的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711077624.3A CN107862551B (zh) | 2017-11-06 | 2017-11-06 | 网络应用推广效果的预测方法、装置和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711077624.3A CN107862551B (zh) | 2017-11-06 | 2017-11-06 | 网络应用推广效果的预测方法、装置和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107862551A CN107862551A (zh) | 2018-03-30 |
CN107862551B true CN107862551B (zh) | 2021-05-11 |
Family
ID=61700976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711077624.3A Active CN107862551B (zh) | 2017-11-06 | 2017-11-06 | 网络应用推广效果的预测方法、装置和终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107862551B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196805B (zh) * | 2018-05-29 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质和电子装置 |
CN109325810B (zh) * | 2018-09-30 | 2020-08-21 | 掌阅科技股份有限公司 | 充值转化的提高方法、电子设备及计算机存储介质 |
CN110570181A (zh) * | 2019-09-18 | 2019-12-13 | 重庆欣业邦网络技术有限公司 | 一种加油站智能聚合支付系统 |
CN110610357A (zh) * | 2019-09-18 | 2019-12-24 | 重庆欣业邦网络技术有限公司 | 一种加油站智能聚合支付方法 |
CN110995532A (zh) * | 2019-11-19 | 2020-04-10 | 上海易点时空网络有限公司 | 用于资源位的数据处理方法及系统、服务器 |
CN113361834B (zh) * | 2020-03-02 | 2024-07-19 | 北京沃东天骏信息技术有限公司 | 一种确定分配量的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104778608A (zh) * | 2015-04-13 | 2015-07-15 | 合一信息技术(北京)有限公司 | 一种n+广告投放优化方法 |
CN105354725A (zh) * | 2015-11-20 | 2016-02-24 | 珠海多玩信息技术有限公司 | 一种应用推广效果的预测方法及系统 |
CN106204091A (zh) * | 2015-05-28 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
-
2017
- 2017-11-06 CN CN201711077624.3A patent/CN107862551B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104778608A (zh) * | 2015-04-13 | 2015-07-15 | 合一信息技术(北京)有限公司 | 一种n+广告投放优化方法 |
CN106204091A (zh) * | 2015-05-28 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
CN105354725A (zh) * | 2015-11-20 | 2016-02-24 | 珠海多玩信息技术有限公司 | 一种应用推广效果的预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107862551A (zh) | 2018-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862551B (zh) | 网络应用推广效果的预测方法、装置和终端设备 | |
CN107613022B (zh) | 内容推送方法、装置及计算机设备 | |
CN108427708B (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN102708131B (zh) | 将消费者自动分类到微细分中 | |
CN108022007B (zh) | 目标应用的日活跃用户数量预测方法、装置和终端设备 | |
CN101556553B (zh) | 基于需求变更的缺陷预测方法和系统 | |
CN109960761B (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN108921221A (zh) | 用户特征的生成方法、装置、设备及存储介质 | |
CN110012060B (zh) | 移动终端的信息推送方法、装置、存储介质和服务器 | |
CN109544197B (zh) | 一种用户流失预测方法和装置 | |
CN111242310B (zh) | 特征有效性评估方法、装置、电子设备及存储介质 | |
CN108322317B (zh) | 一种账号识别关联方法及服务器 | |
CN106095942B (zh) | 强变量提取方法及装置 | |
CN111143697B (zh) | 一种内容推荐的方法以及相关装置 | |
CN107862022A (zh) | 文化资源推荐系统 | |
US10083263B2 (en) | Automatic modeling farmer | |
EP4083857A1 (en) | Information prediction model training method and apparatus, information prediction method and apparatus, storage medium, and device | |
KR101505546B1 (ko) | 텍스트 마이닝을 이용한 키워드 도출 방법 | |
CN110347781B (zh) | 文章倒排方法、文章推荐方法、装置、设备及存储介质 | |
CN111460384A (zh) | 策略的评估方法、装置和设备 | |
CN111723260A (zh) | 推荐内容的获取方法、装置、电子设备及可读存储介质 | |
CN110910201A (zh) | 信息推荐的控制方法、装置、计算机设备及存储介质 | |
EP3323100A1 (en) | A method and system for analyzing mobile apps | |
CN110929169A (zh) | 基于改进Canopy聚类协同过滤算法的职位推荐方法 | |
CN113297486B (zh) | 一种点击率预测方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |