CN107527243A - 一种预测app冲榜所需广告投放量的方法 - Google Patents
一种预测app冲榜所需广告投放量的方法 Download PDFInfo
- Publication number
- CN107527243A CN107527243A CN201710755057.6A CN201710755057A CN107527243A CN 107527243 A CN107527243 A CN 107527243A CN 201710755057 A CN201710755057 A CN 201710755057A CN 107527243 A CN107527243 A CN 107527243A
- Authority
- CN
- China
- Prior art keywords
- mrow
- list
- msub
- spending
- app
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的一种预测APP冲榜所需广告投放量的方法,包含以下步骤:提取冲榜数据特征,构成冲榜数据训练集;通过获取的冲榜数据训练集,训练机器学习模型:采用Gradient Boost Regression Tree来训练模型,最终得到GBRT模型;利用训练出的GBRT模型,预测目标冲榜APP的广告投放量。本发明的预测方法,应用在广告投放预测上,经广告投放活动多次测试,相对误差小于10%,精确度比较高。
Description
技术领域
本发明涉及移动互联网广告投放领域,特别涉及一种预测APP冲榜所需广告投放量的方法。
背景技术
APP冲榜是指利用各类积分墙,或通过线上线下各类手段来推广,实现短期内大量用户下载APP,快速增加下载量,从而达到使得榜单上升的目的。DSP服务为广告主、开发者提供了广告推广投放平台,但广告主、开发者需要预估达到冲榜预期的广告投放量;目前较多冲榜预估是基于人工经验值估算,估算的准确性依赖于估算人员对市场的了解、历史冲榜投放经验值,具有主观意识,无法从历史数据中提取准确的信息进行估算.
具体来讲,现有技术中,对于APP冲榜投放广告,通常有以下三种方式:
(1)人工预估投放量:根据广告、冲榜APP历史投放经验综合考虑、评估,预测APP冲榜所需投放广告量。对于人工预估投放量,这种方法能综合各种影响因素综合考虑,但预估准确性依赖于评估者的经验值和市场了解程度,其主观因素影响比较大,往往会导致预估精确度不稳定甚至难以达到所需的精确度。
(2)定量加量投放冲榜:即先按定量投放广告,后续继续定量补充到达预定目标。定量加量增加广告投放量在实际工作中不便于操作,增大了操作难度。
(3)不限广告投放量冲榜:即无预估即投放广告,冲榜APP达到目标则停止。无限量投放冲榜导致无法预估冲榜开销,从而使得冲榜成本不合理增大,不利于营销活动的策划。
因此,有必要提供一种新的APP冲榜投放广告的预测方法来解决上述问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种预测APP冲榜所需广告投放量的方法,该方法根据冲榜应用自有属性,以历史冲榜数据为基础,利用机器学习算法拟合投放量,达到精准预测投放量的目的。
本发明的目的通过以下的技术方案实现:
一种预测APP冲榜所需广告投放量的方法,包含以下步骤:
S1、提取冲榜数据特征,构成冲榜数据训练集;
S2、通过获取的冲榜数据训练集,训练机器学习模型:采用Gradient BoostRegression Tree来训练模型,最终得到GBRT模型;
S3、利用训练出的GBRT模型,预测目标冲榜APP的广告投放量。
步骤S1中,所述冲榜数据包括冲榜APP自有属性、历史冲榜数据。
所述冲榜APP自有属性包括每个APP的类别、更新时间、APP大小、开发商信息。
所述历史冲榜数据包括从历史数据中提取每次冲榜的APP名、分榜ID、总榜开始位置、总榜结束位置、分榜开始位置、分榜结束位置、投放量、冲榜开始时间、冲榜结束时间。
所述步骤S2具体如下:
假设x、y分别为输入变量、输出变量,即x为输入特征值(长度为J的向量,即有J个特征),y为广告投放量的真实值;
给定数据量为N的训练集D:
D={(x1,y1),(x2,y2),...,(xN,yN)};
其中x1、x2、…、xN为历史冲榜特征数据,y1、y2、…、yN为历史广告投放量的真实值;
该模型的损失函数为:
L(y,f(x));
上式中,f(x)为冲榜所需广告投放量的预测模型;
初始化f(x):
依次建立M棵决策树;
上式中,L为损失函数,yi为第i个广告投放量的真实值,c为首颗树得到的常数值;
A、对N个数据分别计算:
上式中,xi为训练集中第i个广告投放的特征向量;rmi为第m棵树计算第i个广告投放记录的负梯度;m为当前建立的树序号,即正在计算的树是第m棵;f(xi)为第i个投放冲榜所需广告投放量的预测模型;fm-1(xi)为前m-1棵数得到的投放冲榜所需广告投放量的预测模型;
B、对{(xi,rmi)},i=1,2,...,N拟合回归树hm(x);
假设hm(x)得到Jm个叶子节点,则这棵树将输入空间划分为Jm个区域:Rmj,j=1,2,...,Jm,每个区域拥有一个常量预测值bmj,利用指示函数I可表示为:
C、求解最优化模型,得到算子cm:
上式中,hm(xi)为第m棵树第i个历史投放的预测结果;
D、更新:fm(x)=fm-1(x)+cmhm(x)
最终得到GBRT模型:
所述GBRT模型,若榜单排名规则没有更改,则多次重复使用;如果有更改,则需要用更改之后的冲榜数据重新训练模型。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明通过将冲榜APP自有属性与历史数据相结合,利用机器学习算法预测冲榜所需广告投放量级,从而精准预测广告投放量。
2、将本发明的方法应用在广告投放预测上,经广告投放活动多次测试,相对误差小于10%,广告投放预测的精确度较高,误差较小。
附图说明
图1为本发明所述一种预测APP冲榜所需广告投放量的方法的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1,一种预测APP冲榜所需广告投放量的方法,包含以下步骤:
S1、提取冲榜数据特征,构成冲榜数据训练集;所述冲榜数据包括冲榜APP自有属性、历史冲榜数据。所述冲榜APP自有属性包括每个APP的类别、更新时间、APP大小、开发商信息;所述历史冲榜数据包括从历史数据中提取每次冲榜的APP名、分榜ID、总榜开始位置、总榜结束位置、分榜开始位置、分榜结束位置、投放量、冲榜开始时间、冲榜结束时间;
S2、通过获取的冲榜数据训练集,训练机器学习模型:采用Gradient BoostRegression Tree来训练模型,最终得到GBRT模型;具体如下:
假设x、y分别为输入变量、输出变量,即x为输入特征值(长度为J的向量,即有J个特征),y为广告投放量的真实值;
给定数据量为N的训练集D:
D={(x1,y1),(x2,y2),...,(xN,yN)};
其中x1、x2、…、xN为历史冲榜特征数据,y1、y2、…、yN为历史广告投放量的真实值;
该模型的损失函数为:
L(y,f(x));
上式中,f(x)为冲榜所需广告投放量的预测模型;
初始化f(x):
依次建立M棵决策树;
上式中,L为损失函数,yi为第i个广告投放量的真实值,c为首颗树得到的常数值;
A、对N个数据分别计算:
上式中,xi为训练集中第i个广告投放的特征向量;rmi为第m棵树计算第i个广告投放记录的负梯度;m为当前建立的树序号,即正在计算的树是第m
棵;f(xi)为第i个投放冲榜所需广告投放量的预测模型;fm-1(xi)为前m-1棵数得到的投放冲榜所需广告投放量的预测模型;
B、对{(xi,rmi)},i=1,2,...,N拟合回归树hm(x);
假设hm(x)得到Jm个叶子节点,则这棵树将输入空间划分为Jm个区域:Rmj,j=1,2,...,Jm,每个区域拥有一个常量预测值bmj,利用指示函数I可表示为:
C、求解最优化模型,得到算子cm:
上式中,hm(xi)为第m棵树第i个历史投放的预测结果;
D、更新:fm(x)=fm-1(x)+cmhm(x)
最终得到GBRT模型:
S3、利用训练出的GBRT模型,预测目标冲榜APP的广告投放量;
S4、若榜单排名规则没有更改,所述GBRT模型则多次重复使用;如果有更改,则需要用更改之后的冲榜数据重新训练GBRT模型。
实施例2
一种预测APP冲榜所需广告投放量的方法,包含以下步骤:
S1、冲榜APP自有的属性特征;(以金融类“app-sample”为例,下同);
冲榜APP属于金融类分榜,定义为金融类;另外收集其用户量级、活跃用户占比、更新日期,开发商等信息;
S2、与冲榜广告投放历史数据中的APP做对比,筛选相似度高的APP的历史数据;
选择同为金融类、用户量级接近,活跃用户占比,更新日期、开发商等较为相似的APP历史冲榜数据;数据量应在K级别,数据量过少训练得到的模型不稳定;
S3、汇总历史数据,做特征工程;
计算各特征对“投放量”的影响,提取特征:APP名、分榜id、总榜开始位置、总榜结束位置、分榜开始位置、分榜结束位置、投放量、冲榜开始时间、冲榜结束时间作为特征;
S4、将特征工程后的数据用于GBRT模型,并保存模型;
S5、将冲榜APP目标数据以及特征工程结果所需的数据放入模型,计算投放量。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种预测APP冲榜所需广告投放量的方法,其特征在于,包含以下步骤:
S1、提取冲榜数据特征,构成冲榜数据训练集;
S2、通过获取的冲榜数据训练集,训练机器学习模型:采用Gradient BoostRegression Tree来训练模型,最终得到GBRT模型;
S3、利用训练出的GBRT模型,预测目标冲榜APP的广告投放量。
2.根据权利要求1所述预测APP冲榜所需广告投放量的方法,其特征在于,步骤S1中,所述冲榜数据包括冲榜APP自有属性、历史冲榜数据。
3.根据权利要求2所述预测APP冲榜所需广告投放量的方法,其特征在于,所述冲榜APP自有属性包括每个APP的类别、更新时间、APP大小、开发商信息。
4.根据权利要求2所述预测APP冲榜所需广告投放量的方法,其特征在于,所述历史冲榜数据包括从历史数据中提取每次冲榜的APP名、分榜ID、总榜开始位置、总榜结束位置、分榜开始位置、分榜结束位置、投放量、冲榜开始时间、冲榜结束时间。
5.根据权利要求1所述预测APP冲榜所需广告投放量的方法,其特征在于,所述步骤S2具体如下:
假设x、y分别为输入变量、输出变量,即x为输入特征值,y为广告投放量的真实值;
给定数据量为N的训练集D:
D={(x1,y1),(x2,y2),...,(xN,yN)};
其中x1、x2、…、xN为历史冲榜特征数据,y1、y2、…、yN为历史广告投放量的真实值;
该模型的损失函数为:
L(y,f(x));
上式中,f(x)为冲榜所需广告投放量的预测模型;
初始化f(x):
<mrow>
<msub>
<mi>f</mi>
<mn>0</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>c</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>c</mi>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
依次建立M棵决策树;
上式中,L为损失函数,yi为第i个广告投放量的真实值,c为首颗树得到的常数值;
A、对N个数据分别计算:
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mi>m</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>=</mo>
<mo>-</mo>
<msub>
<mrow>
<mo>&lsqb;</mo>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<mi>f</mi>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>)</mo>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>&rsqb;</mo>
</mrow>
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>f</mi>
<mrow>
<mi>m</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
</mrow>
</msub>
<mo>;</mo>
</mrow>
上式中,xi为训练集中第i个广告投放的特征向量;rmi为第m棵树计算第i个广告投放记录的负梯度;m为当前建立的树序号,即正在计算的树是第m棵;f(xi)为第i个投放冲榜所需广告投放量的预测模型;fm-1(xi)为前m-1棵数得到的投放冲榜所需广告投放量的预测模型;
B、对{(xi,rmi)},i=1,2,...,N拟合回归树hm(x);
假设hm(x)得到Jm个叶子节点,则这棵树将输入空间划分为Jm个区域:Rmj,j=1,2,...,Jm,每个区域拥有一个常量预测值bmj,利用指示函数I可表示为:
<mrow>
<msub>
<mi>h</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>J</mi>
<mi>m</mi>
</msub>
</munderover>
<msub>
<mi>b</mi>
<mrow>
<mi>m</mi>
<mi>j</mi>
</mrow>
</msub>
<mi>I</mi>
<mo>,</mo>
<mi>x</mi>
<mo>&Element;</mo>
<msub>
<mi>R</mi>
<mrow>
<mi>m</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
C、求解最优化模型,得到算子cm:
<mrow>
<msub>
<mi>c</mi>
<mi>m</mi>
</msub>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>c</mi>
</munder>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mi>L</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
<msub>
<mi>f</mi>
<mrow>
<mi>m</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>+</mo>
<mi>c</mi>
<mo>&CenterDot;</mo>
<msub>
<mi>h</mi>
<mi>m</mi>
</msub>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
上式中,hm(xi)为第m棵树第i个历史投放的预测结果;
D、更新:fm(x)=fm-1(x)+cmhm(x)
最终得到GBRT模型:
6.根据权利要求1所述预测APP冲榜所需广告投放量的方法,其特征在于,所述GBRT模型,若榜单排名规则没有更改,则多次重复使用;如果有更改,则需要用更改之后的冲榜数据重新训练模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710755057.6A CN107527243A (zh) | 2017-08-29 | 2017-08-29 | 一种预测app冲榜所需广告投放量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710755057.6A CN107527243A (zh) | 2017-08-29 | 2017-08-29 | 一种预测app冲榜所需广告投放量的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107527243A true CN107527243A (zh) | 2017-12-29 |
Family
ID=60682703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710755057.6A Pending CN107527243A (zh) | 2017-08-29 | 2017-08-29 | 一种预测app冲榜所需广告投放量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107527243A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110054999A1 (en) * | 2009-08-25 | 2011-03-03 | Yahoo! Inc. | System and method for predicting user navigation within sponsored search advertisements |
CN102110265A (zh) * | 2009-12-23 | 2011-06-29 | 深圳市腾讯计算机系统有限公司 | 一种预估网络广告效果的方法及系统 |
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN106330558A (zh) * | 2016-08-31 | 2017-01-11 | 哈尔滨工业大学(威海) | 应用于软件定义网络的控制器负载预测系统及方法 |
-
2017
- 2017-08-29 CN CN201710755057.6A patent/CN107527243A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110054999A1 (en) * | 2009-08-25 | 2011-03-03 | Yahoo! Inc. | System and method for predicting user navigation within sponsored search advertisements |
CN102110265A (zh) * | 2009-12-23 | 2011-06-29 | 深圳市腾讯计算机系统有限公司 | 一种预估网络广告效果的方法及系统 |
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN106330558A (zh) * | 2016-08-31 | 2017-01-11 | 哈尔滨工业大学(威海) | 应用于软件定义网络的控制器负载预测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846757B2 (en) | Automated system and method for creating machine-generated advertisements | |
CN105260390B (zh) | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 | |
Kahn | New product forecasting: an applied approach | |
CN105005918B (zh) | 一种基于用户行为数据和潜在用户影响力分析的在线广告推送评估方法 | |
CN108090788B (zh) | 基于时间信息集成模型的广告转化率预估方法 | |
CN108399575A (zh) | 一种基于社交媒体文本的大五人格预测方法 | |
CN105631711A (zh) | 一种广告投放方法及装置 | |
CN102073956A (zh) | 一种基于数据挖掘的定向广告投放方法、系统和设备 | |
CN105808762A (zh) | 资源排序方法和装置 | |
CN108875916A (zh) | 一种基于gru神经网络的广告点击率预测方法 | |
CN105678587A (zh) | 一种推荐特征确定方法、信息推荐方法及装置 | |
US20120253945A1 (en) | Bid traffic estimation | |
CN111727451A (zh) | 用于计算预测数据的信息处理装置等 | |
CN101770487A (zh) | 社交网络中用户影响力的计算方法和系统 | |
CN108109016A (zh) | 广告转化率预估方法和装置、计算机设备和存储介质 | |
CN108230009A (zh) | 一种用户偏好的预测方法及装置,电子设备 | |
CN103761266A (zh) | 基于多级逻辑回归的点击率预测方法和系统 | |
CN106097204A (zh) | 一种面向冷启动学生用户的工作推荐系统及推荐方法 | |
CN110321421B (zh) | 用于网站知识社区系统的专家推荐方法及计算机存储介质 | |
CN104750674A (zh) | 一种人机会话满意度预测方法及系统 | |
US20180165706A1 (en) | Systems and methods for improving social media advertising efficiency | |
CN107463580A (zh) | 训练点击率预估模型方法和装置、点击率预估方法和装置 | |
CN106997488A (zh) | 一种结合马尔科夫决策过程的动作知识提取方法 | |
CN109949089A (zh) | 一种确定展示率的方法、装置及终端 | |
CN109087124B (zh) | 一种应用程序价值预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171229 |