CN103996088A - 基于多维特征组合逻辑回归的广告点击率预测方法 - Google Patents
基于多维特征组合逻辑回归的广告点击率预测方法 Download PDFInfo
- Publication number
- CN103996088A CN103996088A CN201410256385.8A CN201410256385A CN103996088A CN 103996088 A CN103996088 A CN 103996088A CN 201410256385 A CN201410256385 A CN 201410256385A CN 103996088 A CN103996088 A CN 103996088A
- Authority
- CN
- China
- Prior art keywords
- feature information
- dimensional feature
- click
- combination
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多维特征组合逻辑回归的广告点击率预测方法,包括步骤:S1、从已获取的点击率数据中分别提取用户层次、媒体层次和广告层次的层次结构的特征信息;S2、对户层次、媒体层次和广告层次的层次结构的特征信息进行多维组合,将特征信息中的一维特征信息进行三三组合得到三维特征组合,构成由三维特征信息组合的特征向量,以表示用户聚类;S3、重复S2,得到由三维特征信息组合的特征向量的学习集;S4、将S3中得到学习集进行训练和测试逻辑回归模型,用以预测广告点击率。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种基于多维特征组合逻辑回归的广告点击率预测方法。
背景技术
计算广告是在目前需求环境下兴起的一个分支学科,是根据给定用户和网页内容通过计算得到与之最匹配的广告并进行精准定向投放的一种广告投放机制。互联网计算广告产业链中包含三类基本角色:广告主(Advertiser)、广告媒体(Publisher)、用户(User)。其中广告主希望通过向有效用户投放合适的广告来提高用户购买商品或是网站注册等行为的可能性,从而获取最优的宣传效果;用户希望看到有用的广告信息而不是骚扰信息;发布者则可通过发布广告获取应有的版面利润,因此在三方利益交互过程中,广告点击率(Click Through Rate,CTR)是三方获取利益的重要核心和平衡点,是精准投放广告、最大化广告主、用户利益的重要环节。
逻辑回归(Logistic Regression)模型是用于预测二进制分类结果的分类模型,被广泛应用在诸多领域,适用于响应变量是二分类(0/1)变量的情况,其目标是对响应变量取二值之一的概率建模,而不是直接预测其取值。逻辑回归模型能够很好地描述0/1概率问题,因此可以用于广告点击率模型。所谓点击率模型是用来量化点击事件的数据指标,点击率模型的建立包括不同的用户、广告以及网页特征信息,而这些特征信息正是造成广告点击率差异的原因,通过已有的信息数据训练出逻辑回归模型参数,去预估广告CTR。
逻辑回归模型因其能够拟合广告点击发生事件常被应用到广告点击率预测中,预测结果受到多方面因素的影响,然而传统的一维特征向量模型训练得出的预测模型有效性不佳,通过预测模型计算得到的广告点击率不可靠。
发明内容
本发明针对现有技术存在的上述不足,提供了一种基于多维特征组合逻辑回归的广告点击率预测方法,本发明通过以下技术方案实现:
一种基于多维特征组合逻辑回归的广告点击率预测方法,包括步骤:
S1、从已获取的点击率数据中分别提取用户层次、媒体层次和广告层次的层次结构的特征信息;
S2、对户层次、媒体层次和广告层次的层次结构的特征信息进行多维组合,将特征信息中的一维特征信息进行三三组合得到三维特征组合,构成包括三维特征信息组合的特征向量,以表示用户聚类;
S3、重复S2,得到包括三维特征信息组合的特征向量的学习集;
S4、将S3中得到学习集进行训练和测试逻辑回归模型,用以预测广告点击率。
较佳的,步骤S4中将学习集中的80%用以训练逻辑回归模型,20%用以测试逻辑回归模型。
较佳的,步骤S4中逻辑回归模型为:
其中g(x)=β0+β1x1+β2x2+...+βkxk,β=(β0,β1,...,βk)T是逻辑回归模型参数,定义不发生事件的条件概率为:
其中y=1|0分别表示点击与不点击,假设有N个观测值构成的总体Y1,Y2,…,YN,从中随机抽取了n个作为样本,标注为y1,y2,…,yn,假定pi=P(yi=1|xi)为给定条件下得到yi=1的条件概率,而在同样条件下yi=0的条件概率为P(yi=0|xi)=1-pi,得到一个观测值的概率为:
P(yi)=piyi(1-pi)1-yi;
各项观测值相互独立,他们的联合分布可以表示为各边际分布的乘积:
式中n即n个观测值,求出似然函数的值最大的参数估计,以求出参数β=(β0,β1,...,βk),使上式取得最大值,并对其两边取对数得到:
求解出让概率取得最大值的逻辑回归模型参数向量β,代入上式,得到广告点击率预测值:
x即由一维征、二维、三维三种特征信息组合的特征向量。
较佳的,步骤S3中还包括:对每一包括三维特征信息组合的特征向量赋予一ID,学习集内的对每一包括三维特征信息组合的特征向量的ID连续。
本发明采用多维组合特征向量能够训练出预测性较好的逻辑回归模型,能够算出更加准确的广告点击率预测值,从而最大化广告主与互联网用户的商业利益。
附图说明
图1所示的是本发明提取的层次结构的特征信息示意图;
图2所示的是本发明对层次结构的特征信息进行多维组合的一示意图;
图3所示的是本发明对层次结构的特征信息进行多维组合的另一示意图;
图4所示的是三种维度训练模型的AUC指标对比的示意图;
图5所示的是三种维度训练模型的RMSE指标对比的示意图;
图6所示的是三种维度训练模型的oe指标对比的示意图。
具体实施方式
以下将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整的描述和讨论,显然,这里所描述的仅仅是本发明的一部分实例,并不是全部的实例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
为了便于对本发明实施例的理解,下面将结合附图以具体实施例为例作进一步的解释说明,且各个实施例不构成对本发明实施例的限定。
应用逻辑回归模型进行预测主要分为两个步骤[2],首先是运用训练及构建逻辑回归模型,即通过机器学习得到逻辑回归模型中的重要特征向量参数β,然后再针对测试集套用参数模型公式对其进行预测。考虑k个独立变量的向量x=(x1,x2,…xk),假设条件概率P(Y=1|X)=p为根据观测量相对于某事件发生的概率(广告点击事件)。逻辑回归模型可表示为
其中g(x)=β0+β1x1+β2x2+...+βkxk,β=(β0,β1,...,βk)T是逻辑回归模型参数,e表示exp,即以自然常数e为底的指数函数,定义不发生事件的条件概率为
构建逻辑回归模型的目的是为了计算出逻辑回归方程中的参数。其中,y=1|0,分别表示点击与不点击,假设有N个观测值构成的总体Y1,Y2,…,YN。从中随机抽取了n个作为样本,标注为y1,y2,…,yn。假定pi=P(yi=1|xi)为给定条件下得到yi=1的条件概率,而在同样条件下yi=0的条件概率为P(yi=0|xi)=1-pi。于是得到一个观测值的概率为:
因为各项观测值相互独立,他们的联合分布可以表示为各边际分布的乘积:
上式中为n个观测的似然函数。目标是能够求出是这一似然函数的值最大的参数估计。求最大似然估计的核心就是求出参数β=(β0,β1,...,βk),使得上式取得最大值。对公式4两边取对数则得到公式5。
求解出可以让概率取得最大值的逻辑回归模型参数向量β,代入公式5计算预测CTR值。
在β的训练和CTR的预测过程中,特征向量x一直是计算的核心参数,x代表CTR预测的各项特征指标,我们可以定义x={user,page,ad}。正如背景技术中所述,在实际的逻辑模型训练过程中,采用这些信息作为特征向量存在以下问题:
1、特征向量的维素xi间耦合度比较低,不能良好的表达事件发生的上下文关系;
2、面对海量、稀疏的数据通过这些有限的特征向量来训练获得精准的值是非常困难的。
因此,本发明在后续详细阐述如何从这些信息中形成有效的特征向量。
在整个广告投放机制中,显性存在的特征信息(日志文件中获取到的属性信息)并不是很丰富,尤其是面对海量、稀疏的数据通过这些有限的特征向量来训练计算获得精准的值是非常困难的。事实上,除了显性的特征信息外,还有很多隐性存在的特征信息是无法用一维特征数据来有效表示的,例如用户在网站中的意图,动作发生的趋势,以及“相似用户”群的行为的联系等等。当用户可以按照一定的方式进行聚类时,那么对用户信息的描述可以由特定的一个人转换为一类人的信息,对于统计模型而言,个体的特征信息是没有说明价值的,而只有聚类后的特征信息才是有意义的数据。
在特征信息数据中,天然的存在着隐含的层次关系结构。例如一个网页属于一个网站(广告媒体),而这个网站属于又属于一个网站分类(如购物类、新闻类等),再如一个广告属于一次广告宣传活动,而这个活动又属于某一个广告主,对用户而言同样有这样的结构存在。那么可以将这样的层次结构用图1来表示。
特征信息的层次化结构表示可以定义显性存在的和隐形存在的用户群。显性存在的用户群可以通过一组用户特征对每一个用户进行标识性描述(例如,基本信息,地理位置,常用网站类型等等),对这些用户根据相似性度量,例如欧几里得距离进行聚类,从而获得显性的用户群。另一方面,隐形的用户群是基于层次结构的特征而不是一维的特征信息。举个例子,一组访问明确分类网站的用户,比如运动,可被视为隐形存在的用户群聚类,采用笛卡尔乘积{用户×网站类型}的形式来表示这样的分组。用一维线性的特征向量可以表示基本的数据状态,而二维、三维的特征组合可以表示具有用户聚类以及上下文关系的特征向量。
为了能够更加有效地表述特征信息并且建立合理的用户聚类,我们在进行逻辑回归模型训练时所采用的特征向量包括了一维、二维、三维的三种特征参数组合方式,也就是公式6中,x={x一维,x二维,x三维},最佳的为使用x={x三维,x三维,x三维},即只要包括有三维特征组合,且越多越好。采用层次化的多维组合特征应用到逻辑回归模型的训练中去,有效地解决了 上述的两个问题。
本文在大规模日志信息上分别用一维特征、二维、三维特征组合,用逻辑回归算法来训练广告CTR预测模型,并对结果进行对比分析。实验分为三个部分,首先从日志信息中提取有效信息形成训练集,然后是通过训练集来进行逻辑回归算法训练广告CTR预测模型,最后是对训练出的广告CTR预测模型进行测试。实验中的开发语言全部采用Java,因为涉及到大数据量的计算,使用分布式平台Hadoop,实验数据来自某互联网广告公司过去一周真实的日志数据信息。因为训练集的随机抽样,会对实验结果有一定程度的影响,所以为了使实验结果更具说服力,以下进行了五次实验进行结果对比。
第一步:特征提取。原始日志如图日志中记录了用户ID,URL,网站域名,广告位ID等等。日志中的每一条数据相当于广告的一次次点击。从日志可抽取的一维特征,由一维特征两两组合、三三组合生成二维、三维特征组合,为了方便的表示每一组特征组合,并且为了能使特征组合使用在模型训练中,需要为每一个组合特征赋予一个ID,组合特征是采用连续的ID来表示的。如图2、3所示。
第二步:生成学习集。
第三步:CTR预测过程中基于逻辑回归的模型训练。本阶段的实验中分别通过采用一维、二维、三维特征组合进行特征提取。学习集随机的按照8:2分开,80%的用于训练模型,20%的用于测试模型。
整个实验过程的伪代码如下。
实验结果:
(1)AUC指标。在计算广告学中,AUC(Area Under Curve)经常用于统计ROC(Receiver Operating Characteristics常被用于模式识别、分类器的结果展现和性能评测)曲线的面积,用来量化评估逻辑回归模型的质量。AUC在0-1之间,越大表示模型的预测性越好。训练好模型之后,用测试集代入到模型之中,计算CTR预测值并将其代入计算AUC。AUC越高,表示预测值越接近真实值。从实验得出,采用多维特征组合比用一维特征组合训练出的模型有明显的AUC指标的提升。实验结果如图4所示。
(2)RMSE指标。RMSE(root-mean-square error)表示均方根误差,表示样本离散程度。五次实验中,从结果可以看出,采用三维特征训练的模型rmse比较小而且趋于平稳,说明三维模型效果最好。实验结果如图5所示。
(3)点击数的观察值与期望值的比例。观察点击数(observation click)与期望点击数(expected click)的比例,简称oe。在广告CTR预测的实际运用中,广告点击的观察值越接近于期望值,即oe越接近于1,说明模型预测性越好。结果可得出,采用三维特征模型的oe值最接近于1,说明该模型效果最好。实验结果如图6所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (4)
1.一种基于多维特征组合逻辑回归的广告点击率预测方法,其特征在于,包括步骤:
S1、从已获取的点击率数据中分别提取用户层次、媒体层次和广告层次的层次结构的特征信息;
S2、对户层次、媒体层次和广告层次的层次结构的特征信息进行多维组合,将特征信息中的一维特征信息进行三三组合得到三维特征组合,构成包括三维特征信息组合的特征向量,以表示用户聚类;
S3、重复S2,得到包括三维特征信息组合的特征向量的学习集;
S4、将S3中得到学习集进行训练和测试逻辑回归模型,用以预测广告点击率。
2.根据权利要求1所述的基于多维特征组合逻辑回归的广告点击率预测方法,其特征在于,步骤S4中将学习集中的80%用以训练逻辑回归模型,20%用以测试逻辑回归模型。
3.根据权利要求1所述的基于多维特征组合逻辑回归的广告点击率预测方法,其特征在于,步骤S4中所述逻辑回归模型为:
其中g(x)=β0+β1x1+β2x2+...+βkxk,β=(β0,β1,...,βk)T是逻辑回归模型参数,定义不发生事件的条件概率为:
其中y=1|0分别表示点击与不点击,假设有N个观测值构成的总体Y1,Y2,…,YN,从中随机抽取了n个作为样本,标注为y1,y2,…,yn,假定pi=P(yi=1|xi)为给定条件下得到yi=1的条件概率,而在同样条件下yi=0的条件概率为P(yi=0|xi)=1-pi,得到一个观测值的概率为:
P(yi)=piyi(1-pi)1-yi;
各项观测值相互独立,他们的联合分布可以表示为各边际分布的乘积:
式中n即n个观测值,求出似然函数的值最大的参数估计,以求出参数β=(β0,β1,...,βk),使上式取得最大值,并对其两边取对数得到:
求解出让概率取得最大值的逻辑回归模型参数向量β,代入上式,得到广告点击率预测值:
x即所述由三维特征信息组合的特征向量。
4.根据权利要求1所述的基于多维特征组合逻辑回归的广告点击率预测方法,其特征在于,步骤S3中还包括:对每一包括三维特征信息组合的特征向量赋予一ID,学习集内的对每一包括三维特征信息组合的特征向量的ID连续。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410256385.8A CN103996088A (zh) | 2014-06-10 | 2014-06-10 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410256385.8A CN103996088A (zh) | 2014-06-10 | 2014-06-10 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103996088A true CN103996088A (zh) | 2014-08-20 |
Family
ID=51310248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410256385.8A Pending CN103996088A (zh) | 2014-06-10 | 2014-06-10 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103996088A (zh) |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268644A (zh) * | 2014-09-23 | 2015-01-07 | 新浪网技术(中国)有限公司 | 广告位上的广告的点击次数预估方法和装置 |
CN104536983A (zh) * | 2014-12-08 | 2015-04-22 | 北京掌阔技术有限公司 | 一种预测广告点击率的方法和装置 |
CN104751374A (zh) * | 2015-03-27 | 2015-07-01 | 深圳供电局有限公司 | 一种计量自动化系统无线通信故障预测方法 |
CN105023170A (zh) * | 2015-06-26 | 2015-11-04 | 深圳市腾讯计算机系统有限公司 | 一种点击流数据的处理方法及装置 |
CN105045819A (zh) * | 2015-06-26 | 2015-11-11 | 深圳市腾讯计算机系统有限公司 | 一种训练数据的模型训练方法及装置 |
CN105096170A (zh) * | 2015-09-18 | 2015-11-25 | 车智互联(北京)科技有限公司 | 基于bbd或/和rf模型获取潜客级别的方法和系统 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN105205098A (zh) * | 2015-08-18 | 2015-12-30 | 北京金山安全软件有限公司 | 一种点击到达率ctr的确定方法及装置 |
CN105224998A (zh) * | 2015-09-08 | 2016-01-06 | 北京金山安全软件有限公司 | 一种针对于预估模型的数据处理方法及装置 |
CN105630996A (zh) * | 2015-12-25 | 2016-06-01 | 腾讯科技(深圳)有限公司 | 一种信息处理方法和服务器 |
CN105701191A (zh) * | 2016-01-08 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种推送信息点击率估计方法和装置 |
CN105812844A (zh) * | 2014-12-29 | 2016-07-27 | 深圳市Tcl高新技术开发有限公司 | 一种电视的用户广告推送方法及系统 |
CN105808762A (zh) * | 2016-03-18 | 2016-07-27 | 北京百度网讯科技有限公司 | 资源排序方法和装置 |
CN106156878A (zh) * | 2015-04-21 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 广告点击率矫正方法及装置 |
CN106204091A (zh) * | 2015-05-28 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
CN106355449A (zh) * | 2016-08-31 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 用户选取方法和装置 |
CN106886915A (zh) * | 2017-01-17 | 2017-06-23 | 华南理工大学 | 一种基于时间衰减采样的广告点击预估方法 |
CN106982230A (zh) * | 2017-05-10 | 2017-07-25 | 深信服科技股份有限公司 | 一种流量检测方法及系统 |
CN107465754A (zh) * | 2017-08-23 | 2017-12-12 | 北京搜狐新媒体信息技术有限公司 | 一种新闻推荐方法和装置 |
CN107767174A (zh) * | 2017-10-19 | 2018-03-06 | 厦门美柚信息科技有限公司 | 一种广告点击率的预测方法及装置 |
CN108011740A (zh) * | 2016-10-28 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 一种媒体流量数据处理方法和装置 |
US20180330191A1 (en) * | 2016-01-22 | 2018-11-15 | Alibaba Group Holding Limited | Logistic regression gradient calculation method and apparatus |
CN109191191A (zh) * | 2018-08-20 | 2019-01-11 | 南京工业大学 | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 |
CN109214841A (zh) * | 2017-06-30 | 2019-01-15 | 北京金山安全软件有限公司 | 广告预测值的获得方法、装置和终端 |
CN109902849A (zh) * | 2018-06-20 | 2019-06-18 | 华为技术有限公司 | 用户行为预测方法及装置、行为预测模型训练方法及装置 |
CN109992710A (zh) * | 2019-02-13 | 2019-07-09 | 网易传媒科技(北京)有限公司 | 点击率预估方法、系统、介质和计算设备 |
CN110263982A (zh) * | 2019-05-30 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 广告点击率预估模型的优化方法和装置 |
CN110490389A (zh) * | 2019-08-27 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 点击率预测方法、装置、设备及介质 |
CN110706015A (zh) * | 2019-08-21 | 2020-01-17 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110969460A (zh) * | 2018-09-29 | 2020-04-07 | 北京国双科技有限公司 | 一种针对信息流广告的投放效果预测方法和装置 |
CN113435523A (zh) * | 2021-06-29 | 2021-09-24 | 北京百度网讯科技有限公司 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
RU2785764C1 (ru) * | 2019-10-31 | 2022-12-13 | Биго Текнолоджи Пте. Лтд. | Способ рекомендации информации, устройство, сервер рекомендаций и запоминающее устройство |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011243125A (ja) * | 2010-05-21 | 2011-12-01 | Willvii Corp | 広告配信システム |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103345512A (zh) * | 2013-07-06 | 2013-10-09 | 北京品友互动信息技术有限公司 | 一种基于用户属性的网络广告点击率预测方法和装置 |
-
2014
- 2014-06-10 CN CN201410256385.8A patent/CN103996088A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011243125A (ja) * | 2010-05-21 | 2011-12-01 | Willvii Corp | 広告配信システム |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103345512A (zh) * | 2013-07-06 | 2013-10-09 | 北京品友互动信息技术有限公司 | 一种基于用户属性的网络广告点击率预测方法和装置 |
Non-Patent Citations (2)
Title |
---|
刘亚妮: "搜索竞价广告关键词优化算法与实验", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
刘唐: "基于多类别特征的在线广告点击率预测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268644A (zh) * | 2014-09-23 | 2015-01-07 | 新浪网技术(中国)有限公司 | 广告位上的广告的点击次数预估方法和装置 |
CN104536983A (zh) * | 2014-12-08 | 2015-04-22 | 北京掌阔技术有限公司 | 一种预测广告点击率的方法和装置 |
CN105812844A (zh) * | 2014-12-29 | 2016-07-27 | 深圳市Tcl高新技术开发有限公司 | 一种电视的用户广告推送方法及系统 |
CN105812844B (zh) * | 2014-12-29 | 2019-02-26 | 深圳市Tcl高新技术开发有限公司 | 一种电视的用户广告推送方法及系统 |
CN104751374A (zh) * | 2015-03-27 | 2015-07-01 | 深圳供电局有限公司 | 一种计量自动化系统无线通信故障预测方法 |
CN106156878A (zh) * | 2015-04-21 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 广告点击率矫正方法及装置 |
CN106156878B (zh) * | 2015-04-21 | 2020-09-15 | 深圳市腾讯计算机系统有限公司 | 广告点击率矫正方法及装置 |
CN106204091A (zh) * | 2015-05-28 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
CN105023170A (zh) * | 2015-06-26 | 2015-11-04 | 深圳市腾讯计算机系统有限公司 | 一种点击流数据的处理方法及装置 |
CN105045819A (zh) * | 2015-06-26 | 2015-11-11 | 深圳市腾讯计算机系统有限公司 | 一种训练数据的模型训练方法及装置 |
CN105045819B (zh) * | 2015-06-26 | 2018-04-20 | 深圳市腾讯计算机系统有限公司 | 一种训练数据的模型训练方法及装置 |
CN105205098B (zh) * | 2015-08-18 | 2018-11-20 | 北京金山安全软件有限公司 | 一种点击到达率ctr的确定方法及装置 |
CN105205098A (zh) * | 2015-08-18 | 2015-12-30 | 北京金山安全软件有限公司 | 一种点击到达率ctr的确定方法及装置 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN105224998A (zh) * | 2015-09-08 | 2016-01-06 | 北京金山安全软件有限公司 | 一种针对于预估模型的数据处理方法及装置 |
CN105096170A (zh) * | 2015-09-18 | 2015-11-25 | 车智互联(北京)科技有限公司 | 基于bbd或/和rf模型获取潜客级别的方法和系统 |
CN105630996A (zh) * | 2015-12-25 | 2016-06-01 | 腾讯科技(深圳)有限公司 | 一种信息处理方法和服务器 |
CN105701191B (zh) * | 2016-01-08 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 一种推送信息点击率估计方法和装置 |
CN105701191A (zh) * | 2016-01-08 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种推送信息点击率估计方法和装置 |
US20180330191A1 (en) * | 2016-01-22 | 2018-11-15 | Alibaba Group Holding Limited | Logistic regression gradient calculation method and apparatus |
US10970596B2 (en) * | 2016-01-22 | 2021-04-06 | Alibaba Group Holding Limited | Logistic regression gradient calculation method and apparatus |
CN105808762A (zh) * | 2016-03-18 | 2016-07-27 | 北京百度网讯科技有限公司 | 资源排序方法和装置 |
CN106355449A (zh) * | 2016-08-31 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 用户选取方法和装置 |
CN108011740A (zh) * | 2016-10-28 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 一种媒体流量数据处理方法和装置 |
CN108011740B (zh) * | 2016-10-28 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种媒体流量数据处理方法和装置 |
CN106886915A (zh) * | 2017-01-17 | 2017-06-23 | 华南理工大学 | 一种基于时间衰减采样的广告点击预估方法 |
CN106886915B (zh) * | 2017-01-17 | 2020-07-28 | 华南理工大学 | 一种基于时间衰减采样的广告点击预估方法 |
CN106982230A (zh) * | 2017-05-10 | 2017-07-25 | 深信服科技股份有限公司 | 一种流量检测方法及系统 |
CN109214841A (zh) * | 2017-06-30 | 2019-01-15 | 北京金山安全软件有限公司 | 广告预测值的获得方法、装置和终端 |
CN107465754A (zh) * | 2017-08-23 | 2017-12-12 | 北京搜狐新媒体信息技术有限公司 | 一种新闻推荐方法和装置 |
CN107465754B (zh) * | 2017-08-23 | 2020-05-22 | 北京搜狐新媒体信息技术有限公司 | 一种新闻推荐方法和装置 |
CN107767174A (zh) * | 2017-10-19 | 2018-03-06 | 厦门美柚信息科技有限公司 | 一种广告点击率的预测方法及装置 |
CN109902849A (zh) * | 2018-06-20 | 2019-06-18 | 华为技术有限公司 | 用户行为预测方法及装置、行为预测模型训练方法及装置 |
US11531867B2 (en) | 2018-06-20 | 2022-12-20 | Huawei Technologies Co., Ltd. | User behavior prediction method and apparatus, and behavior prediction model training method and apparatus |
CN109902849B (zh) * | 2018-06-20 | 2021-11-30 | 华为技术有限公司 | 用户行为预测方法及装置、行为预测模型训练方法及装置 |
CN109191191B (zh) * | 2018-08-20 | 2022-04-26 | 南京工业大学 | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 |
CN109191191A (zh) * | 2018-08-20 | 2019-01-11 | 南京工业大学 | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 |
CN110969460A (zh) * | 2018-09-29 | 2020-04-07 | 北京国双科技有限公司 | 一种针对信息流广告的投放效果预测方法和装置 |
CN110969460B (zh) * | 2018-09-29 | 2023-10-31 | 北京国双科技有限公司 | 一种针对信息流广告的投放效果预测方法和装置 |
CN109992710A (zh) * | 2019-02-13 | 2019-07-09 | 网易传媒科技(北京)有限公司 | 点击率预估方法、系统、介质和计算设备 |
CN110263982A (zh) * | 2019-05-30 | 2019-09-20 | 百度在线网络技术(北京)有限公司 | 广告点击率预估模型的优化方法和装置 |
CN110706015A (zh) * | 2019-08-21 | 2020-01-17 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110706015B (zh) * | 2019-08-21 | 2023-06-13 | 北京大学(天津滨海)新一代信息技术研究院 | 一种面向广告点击率预测的特征选取方法 |
CN110490389A (zh) * | 2019-08-27 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 点击率预测方法、装置、设备及介质 |
RU2785764C1 (ru) * | 2019-10-31 | 2022-12-13 | Биго Текнолоджи Пте. Лтд. | Способ рекомендации информации, устройство, сервер рекомендаций и запоминающее устройство |
CN113435523A (zh) * | 2021-06-29 | 2021-09-24 | 北京百度网讯科技有限公司 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
CN113435523B (zh) * | 2021-06-29 | 2023-09-26 | 北京百度网讯科技有限公司 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103996088A (zh) | 基于多维特征组合逻辑回归的广告点击率预测方法 | |
US11301761B2 (en) | Behavioral prediction for targeted end users | |
Sudharsan et al. | A Swish RNN based customer churn prediction for the telecom industry with a novel feature selection strategy | |
US10037543B2 (en) | Estimating conversion rate in display advertising from past performance data | |
JP6435426B1 (ja) | 情報分析装置、情報分析方法および情報分析プログラム | |
Lewis et al. | Measuring the Effects of Advertising | |
CN106447066A (zh) | 一种大数据的特征提取方法和装置 | |
CA2941700A1 (en) | Clickstream purchase prediction using hidden markov models | |
CN105893406A (zh) | 群体用户画像方法及系统 | |
CN106445988A (zh) | 一种大数据的智能处理方法和系统 | |
WO2010085773A1 (en) | Hybrid contextual advertising and related content analysis and display techniques | |
Nica-Avram et al. | Identifying food insecurity in food sharing networks via machine learning | |
CN103324708A (zh) | 一种长文本到短文本的迁移学习方法 | |
Misztal-Radecka et al. | Bias-Aware Hierarchical Clustering for detecting the discriminated groups of users in recommendation systems | |
Le | A comprehensive survey of imbalanced learning methods for bankruptcy prediction | |
Raeder et al. | Scalable supervised dimensionality reduction using clustering | |
Yin et al. | A network-enhanced prediction method for automobile purchase classification using deep learning | |
She et al. | Research on advertising click-through rate prediction based on CNN-FM hybrid model | |
Butler et al. | Customer behaviour classification using simulated transactional data | |
CN111737594A (zh) | 基于无监督标签生成的虚拟网络角色行为塑造方法 | |
Zhang et al. | An Effective Approach to Promote Air Traveler Repurchasing Using the Random Forest Algorithm: Predictive Model Design and Utility Evaluation | |
Cen et al. | A map-based gender prediction model for big e-commerce data | |
Wang et al. | Meta-analyses using information reweighting: An application to online advertising | |
Wang et al. | [Retracted] A Hybrid Model for Commercial Brand Marketing Prediction Based on Multiple Features with Image Processing | |
Di | Deep interest network for taobao advertising data click-through rate prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140820 |
|
RJ01 | Rejection of invention patent application after publication |