CN105608604A - 一种品牌广告效果优化的连续计算方法 - Google Patents

一种品牌广告效果优化的连续计算方法 Download PDF

Info

Publication number
CN105608604A
CN105608604A CN201511019272.7A CN201511019272A CN105608604A CN 105608604 A CN105608604 A CN 105608604A CN 201511019272 A CN201511019272 A CN 201511019272A CN 105608604 A CN105608604 A CN 105608604A
Authority
CN
China
Prior art keywords
data
model
information
feature
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511019272.7A
Other languages
English (en)
Inventor
章岑
雷龙艳
杨田
周盛
潘柏宇
王冀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
1Verge Internet Technology Beijing Co Ltd
Original Assignee
1Verge Internet Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Verge Internet Technology Beijing Co Ltd filed Critical 1Verge Internet Technology Beijing Co Ltd
Priority to CN201511019272.7A priority Critical patent/CN105608604A/zh
Publication of CN105608604A publication Critical patent/CN105608604A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0244Optimization

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种广告效果优化的连续计算方法及装置,所述方法充分利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获取用于模型训练的特征;通过得到特征数据进行树模型训练得到优化模型并验证,利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。

Description

一种品牌广告效果优化的连续计算方法
技术领域
本申请涉及广告投放领域,具体的,涉及一种利用广告的以往投放数据建立投放模型,对品牌广告效果优化的连续计算方法。
背景技术
品牌广告主在进行广告投放往往希望投放的广告达到一定的展现量,以展现他们的产品,在这个基础上,广告主希望自己的广告在一定展现量的前提下能获取更多的点击率。
要想获取高的广告点击率,除了跟广告本身品质、吸引度相关之外,还与用户是个人的需求及喜好相关,而根据用户需求及喜好向用户投放其喜好的视频广告能够提高广告的点击率。
视频网站是指在完善的技术平台支持下,让互联网用户在线流畅发布、浏览和分享视频作品的网络媒体。由此,视频网站没有像搜索引擎那样获取用户直接需求信息的功能,现阶段的广告点击率预算模型选择不当又导致不能准确地向用户精准地投放视频广告。因此,如何向用户投放更准确的广告在提高广告点击率,进一步的,如何建立更加优化的广告点击率预算模型对广告投放进行预测以向用户精确地投放广告成为现有技术亟待解决的问题。
发明内容
本发明的目的在于提出一种广告投放的预测算法,对视频网站中被挖掘出来的大量用户信息,包括用户基本信息及用户偏好,进行整合处理,结合广告素材本身的特点,通过模型预测及验证最优广告点击率,再进行广告投放点击率优化工作,更精准地像用户投放广告,提高点击率。
为达此目的,本发明采用以下技术方案:
一种广告效果优化的连续计算方法,包括如下步骤:
数据源清洗及整合步骤S110:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
特征提取及格式化步骤S120:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
模型训练及验证步骤S130:使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值;
模型测试及投放步骤S140:使用最近的广告投放的所述四种数据,利用特征提取及格式化步骤S120的方法得到所述模型测试数据,将所述模型测试数据输入到所述树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
优选地,在数据源清洗及整合步骤S110中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
优选地,在特征提取及格式化步骤S120中,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
优选地,在特征提取及格式化步骤S120中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
优选地,在所述模型训练及验证步骤S130中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
本发明还公开了一种广告效果优化的连续计算装置,包括如下单元:
数据源清洗及整合单元S210:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
特征提取及格式化单元S220:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
模型训练及验证单元S230:使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值;
模型测试及投放单元S240:使用最近的广告投放的所述四种数据,利用特征提取及格式化单元S220得到模型测试数据,将所述模型测试数据输入到所述树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
优选地,在数据源清洗及整合单元S210中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
优选地,在特征提取及格式化单元S220中,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
优选地,在特征提取及格式化单元S220中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
优选地,在所述模型训练及验证单元S230中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
本发明充分利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获取用于模型训练的特征;通过得到特征数据进行树模型训练得到优化模型并验证,利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。
附图说明
图1是根据本发明的具体实施例的广告效果优化的连续计算方法的流程图;
图2是根据本发明的具体实施例的模型训练与测试体系的示意图;
图3是根据本发明的具体实施例的特征格式化结果的示例
图4是根据本发明的具体实施例的广告效果优化的连续计算装置的模块图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
参见附图1,公开了根据本发明的广告效果优化的连续计算方法的流程图,包括如下步骤:
数据源清洗及整合步骤S110:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据(UserProfiles):指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,进一步优选地,还可以包括用户性别、年龄等信息;该信息可以位于用户信息库中。
素材信息数据:指的是品牌广告的素材信息,示例性的包括该广告所处的行业,子行业,品类信息与广告素材Id,该信息可以位于素材信息数据库中。
广告展示日志信息:指的是广告展示时记录下的相关信息,示例性的包括时间,设备类型,操作系统和所在投放ID中的一个或多个;其中所述投放ID指的是所在的广告投放活动的ID。
广告点击日志信息:用户点击广告时记录下的相关信息,示例性的包括时间,设备类型,操作系统和所在投放ID中的一个或多个;
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息。
在一个优选的实施例中,上述四种信息以用户的cookie标识唯一表示,从而能够在数据的清洗中通过验证去除不需要的属性(或者说去除不合法的cookie),或者对一些缺失的数据进行补充,整合。例如,cookie中包含有不需要用户的登录时间,或者不需要用户的性别,则能够在整合的数据中去除上述的属性。又例如,在某个cookie中缺少用户的年龄,在利用其它包含该用户的cookie中所具有的用户的年龄进行补充、整合。
例如:某用户如果观看了某支广告,并点击了该广告,那么广告展示日志和广告点击日志将分别同时记录下日志,且两条日志的cookie、会话Id以及广告位Id是相同的。如果只观看了而没有点击该广告,则只在广告展示日志里记录有日志。对广告点击日志和广告展示日志通过cookie,会话Id,广告Id进行整合,某个用户在某次会话中既观看又点击了该广告,则把这条点击日志记为正样本。如果用户在某次会话中只观看但并无点击该广告,则把这条日志记为负样本。然后,通过日志里的广告素材Id可以与素材信息库进行连接整合得到广告素材的行业描述信息,最后通过日志里的cookie可以与用户信息库里的用户信息进行连接整合得到该用户的人口属性与偏好信息。
特征提取及格式化步骤S120:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;即模型训练数据和模型验证数据都是相同格式的数据,仅仅是分配的数量不同而已。进一步优选的,模型训练数据和模型验证数据的比例为7:3。
进一步的,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息,例如:时间、地点、广告位、频道、子频道和设备类型;
广告信息特征,即广告素材的描述信息,例如:广告行业,子行业与品类信息;
用户信息特征,即当前用户的基础信息与偏好信息,例如:性别、年龄、广告偏好和频道偏好。
进一步的,所述格式化包括将上述三种特征进行格式化,变成适合算法训练的数据格式。这里分两类特征,类别特征与连续特征,需要分别进行处理。
所述类别特征:指的是具有有限几种类别的特征,包括设备类型、性别等,需要对它进行离散化编码,使得算法计算时能够有效理解。采用普遍的独热编码(One-hotencoding)技术对类别特征进行编码。
所述连续特征,指的是具有连续范围的特征,包括素材时长,视频时长,某投放的历史CTR统计值等。连续特征是否需要进行离散化要根据选择的算法模型而定。当采用逻辑回归模型由于要对各维度数据进行线性组合,所以需要进行离散化处理,而使用树模型则不需要进行离散化。连续特征离散化一般采用分段离散的方法,比如广告素材时长,可以分5s为一段进行One-hotencoding编码。
模型训练及验证步骤S130:使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值。
GBDT:这是一个树模型,使用指定N颗树对数据进行训练。最初使用一棵树对数据进行训练,然后逐渐加入新树对模型进行增强。
优选的,在实验中,使用树数目N=10,每颗树深度Depth=4取得了良好的效果。
模型测试及投放步骤S140:使用最近的广告投放的所述四种数据,利用特征提取及格式化步骤S120的方法得到所述模型测试数据,将所述模型测试数据输入到所述树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
参见图2,进一步公开了模型训练与测试体系的示意图。利用原始数据根据步骤S110和S120得到第一份格式化数据,例如第一天的数据,并将该格式化数据分为模型训练数据和模型验证数据;通过模型训练得到所述树模型,并利用模型验证数据进行验证,从而调整得到点击率阈值。
将第一份格式化数据之后投放广告得到的数据,例如第二天的数据,也利用步骤S110和S120得到第二份格式化数据,并将该格式化数据作为测试数据通过树模型得到点击率值与预先设定的点击率阈值比较,大于等于预先设定的点击率阈值则进行投放,小于预先设定的点击率阈值则不投放。这样,能够得知是否应当继续投放广告,从而进行第三天的投放。
而在广告继续投放时,也继续利用第三天的数据通过步骤S110和S120得到格式化数据,并将该格式化数据作为测试数据通过所述树模型得到点击率值与预先设定的点击率阈值比较,从而判断是否投放数据。后续的广告投放也采用类似的方式,这样,每天投放的广告得到的数据都能为后一天广告是否投放进行参考,从而实现了广告投放的动态判断。
进一步的,在所述模型训练及验证步骤S130中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
其中,逻辑回归模型算法(LogisticRegression)的模型构建算法,采用常规算法,也可参考https://en.wikipedia.org/wiki/Logistic_regression
梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)采用常规算法,也可参考https://en.wikipedia.org/wiki/Decision_tree
实施例1:
使用视频网站里一天的广告点击日志,广告展示日志,广告素材信息,用户信息进行数据整合与清洗后对特征进行抽取与格式化。一共提取35项特征,其中上下文特征包括:时间、城市、设备类型等;广告素材特征包括:素材行业,子行业,品类;用户信息特征包括:性别,年龄,广告偏好,频道偏好;组合特征包括:时间与设备类型组合,性别与广告行业组合等。抽取后的这些特征要经过One-hotencoding编码进行离散化,因此这35项特征一共映射到5369维特征空间中。每个样本将表示为5369维的向量和自身是正样本或负样本标识的记录。由于5369维是一个很大的特征空间,而且整个数据矩阵是非常稀疏的,所以只存储有值的特征维度。如图3,第一列是正负样本的标识,1表示正样本,0表示负样本,后面的每列是以维度为key,该维度特征值为value的组合key:value数据。
经过建模后,进行验证、测试,可以使用精确率,召回率,F值与按该模型投放的新点击率四项指标来描述模型的好坏。结果如表1所示。
算法 精确率 召回率 F值 新点击率
梯度增强决策树 0.8923301 0.9021157 0.8971962 0.0981023
表1:树模型效果
本发明充分地利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获取用于模型训练的特征;通过得到特征数据进行树模型训练得到优化模型并验证,利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。
参见图4,本发明还公开了一种广告效果优化的连续计算装置,包括如下单元:
数据源清洗及整合单元S210:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关高行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
特征提取及格式化单元S220:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
模型训练及验证单元S230:使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值;
模型测试及投放单元S240:使用最近的广告投放的所述四种数据,利用特征提取及格式化单元S220得到模型测试数据,将所述模型测试数据输入到树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
优选地,在数据源清洗及整合单元S210中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
优选地,在特征提取及格式化单元S220中,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
优选地,在特征提取及格式化单元S220中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
优选地,在所述模型训练及验证单元S230中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
显然,本领域技术人员应该明白,上述的本发明的各单元或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。

Claims (10)

1.一种广告效果优化的连续计算方法,包括如下步骤:
数据源清洗及整合步骤(S110):获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
特征提取及格式化步骤(S120):对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
模型训练及验证步骤(S130):使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值;
模型测试及投放步骤(S140):使用最近的广告投放的所述四种数据,利用特征提取及格式化步骤(S120)的方法得到所述模型测试数据,将所述模型测试数据输入到所述树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
2.根据权利要求1所述的广告效果优化的连续计算方法,其特征在于:
在数据源清洗及整合步骤中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
3.根据权利要求1所述的广告效果优化的连续计算方法,其特征在于:
在特征提取及格式化步骤中,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
4.根据权利要求3所述的广告效果优化的连续计算方法,其特征在于:
在特征提取及格式化步骤中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
5.根据权利要求1-4中任意一项所述的广告效果优化的连续计算方法,其特征在于:
在所述模型训练及验证步骤中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
6.一种广告效果优化的连续计算装置,包括如下单元:
数据源清洗及整合单元(S210):获得四种数据作为点击率优化模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;
特征提取及格式化单元(S220):对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和模型验证数据;
模型训练及验证单元(S230):使用模型训练数据利用梯度增强决策树模型算法(GradientBoostingDecisionTree,简称GBDT)得到树模型,使用模型验证数据在所述树模型中进行验证,得到预测的点击率阈值;
模型测试及投放单元(S240):使用最近的广告投放的所述四种数据,利用特征提取及格式化单元得到模型测试数据,将所述模型测试数据输入到所述树模型中获得的点击率值与预先设定的点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。
7.根据权利要求6所述的广告效果优化的连续计算装置,其特征在于:
在数据源清洗及整合单元中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。
8.根据权利要求6所述的广告效果优化的连续计算装置,其特征在于:
在特征提取及格式化单元中,所述特征提取进一步包括抽取三方面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
9.根据权利要求8所述的广告效果优化的连续计算装置,其特征在于:
在特征提取及格式化单元中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。
10.根据权利要求6-9中任意一项所述的广告效果优化的连续计算装置,其特征在于:
在所述模型训练及验证单元中:将梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT)与逻辑回归模型算法(LogisticRegression)结合,得到所述树模型。
CN201511019272.7A 2015-12-30 2015-12-30 一种品牌广告效果优化的连续计算方法 Pending CN105608604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511019272.7A CN105608604A (zh) 2015-12-30 2015-12-30 一种品牌广告效果优化的连续计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511019272.7A CN105608604A (zh) 2015-12-30 2015-12-30 一种品牌广告效果优化的连续计算方法

Publications (1)

Publication Number Publication Date
CN105608604A true CN105608604A (zh) 2016-05-25

Family

ID=55988523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511019272.7A Pending CN105608604A (zh) 2015-12-30 2015-12-30 一种品牌广告效果优化的连续计算方法

Country Status (1)

Country Link
CN (1) CN105608604A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229986A (zh) * 2016-12-14 2018-06-29 腾讯科技(深圳)有限公司 信息点击预测中的特征构建方法、信息投放方法和装置
CN108280682A (zh) * 2018-01-16 2018-07-13 深圳市和讯华谷信息技术有限公司 广告投放方法、终端及计算机可读存储介质
WO2019062021A1 (zh) * 2017-09-30 2019-04-04 平安科技(深圳)有限公司 在应用程序中推送贷款广告的方法、电子装置及介质
CN110020113A (zh) * 2017-09-28 2019-07-16 南京无界家居科技有限公司 一种基于特征匹配的家居产品预测方法及装置
CN110895775A (zh) * 2019-11-29 2020-03-20 秒针信息技术有限公司 广告物料元素信息提取方法、装置、电子设备及存储介质
CN110991490A (zh) * 2019-11-11 2020-04-10 广州荔支网络技术有限公司 一种智能音频平台广告投放方法
CN111275473A (zh) * 2018-12-04 2020-06-12 北京达佳互联信息技术有限公司 内容项投放方法、装置、服务器及存储介质
CN112258214A (zh) * 2020-09-22 2021-01-22 北京达佳互联信息技术有限公司 视频投放方法、装置及服务器
CN113743981A (zh) * 2021-08-03 2021-12-03 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310003A (zh) * 2013-06-28 2013-09-18 华东师范大学 一种基于点击日志的新广告点击率预测方法及系统
CN103345512A (zh) * 2013-07-06 2013-10-09 北京品友互动信息技术有限公司 一种基于用户属性的网络广告点击率预测方法和装置
CN103761296A (zh) * 2014-01-20 2014-04-30 北京集奥聚合科技有限公司 移动终端用户网络行为分析方法及系统
CN104732279A (zh) * 2015-03-25 2015-06-24 武汉大学 基于地理信息系统的改进元胞自动机交通流模拟分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310003A (zh) * 2013-06-28 2013-09-18 华东师范大学 一种基于点击日志的新广告点击率预测方法及系统
CN103345512A (zh) * 2013-07-06 2013-10-09 北京品友互动信息技术有限公司 一种基于用户属性的网络广告点击率预测方法和装置
CN103761296A (zh) * 2014-01-20 2014-04-30 北京集奥聚合科技有限公司 移动终端用户网络行为分析方法及系统
CN104732279A (zh) * 2015-03-25 2015-06-24 武汉大学 基于地理信息系统的改进元胞自动机交通流模拟分析方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229986A (zh) * 2016-12-14 2018-06-29 腾讯科技(深圳)有限公司 信息点击预测中的特征构建方法、信息投放方法和装置
CN110020113A (zh) * 2017-09-28 2019-07-16 南京无界家居科技有限公司 一种基于特征匹配的家居产品预测方法及装置
WO2019062021A1 (zh) * 2017-09-30 2019-04-04 平安科技(深圳)有限公司 在应用程序中推送贷款广告的方法、电子装置及介质
CN108280682A (zh) * 2018-01-16 2018-07-13 深圳市和讯华谷信息技术有限公司 广告投放方法、终端及计算机可读存储介质
CN111275473A (zh) * 2018-12-04 2020-06-12 北京达佳互联信息技术有限公司 内容项投放方法、装置、服务器及存储介质
CN111275473B (zh) * 2018-12-04 2023-12-15 北京达佳互联信息技术有限公司 内容项投放方法、装置、服务器及存储介质
CN110991490A (zh) * 2019-11-11 2020-04-10 广州荔支网络技术有限公司 一种智能音频平台广告投放方法
CN110895775A (zh) * 2019-11-29 2020-03-20 秒针信息技术有限公司 广告物料元素信息提取方法、装置、电子设备及存储介质
CN112258214A (zh) * 2020-09-22 2021-01-22 北京达佳互联信息技术有限公司 视频投放方法、装置及服务器
CN113743981A (zh) * 2021-08-03 2021-12-03 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质
CN113743981B (zh) * 2021-08-03 2023-11-28 深圳市东信时代信息技术有限公司 素材投放成本预测方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN105608604A (zh) 一种品牌广告效果优化的连续计算方法
CN105590240A (zh) 一种品牌广告效果优化的离散计算方法
US11887133B2 (en) Methods and apparatus to generate electronic mobile measurement census data
US11625755B1 (en) Determining targeting information based on a predictive targeting model
CN110033314B (zh) 广告数据处理方法及装置
KR102317823B1 (ko) 데이터베이스 사업자에 의한 기인오류 및/또는 논-커버리지에 대해 노출 데이터를 보상하기 위한 방법 및 장치
TWI567674B (zh) 決定目標鎖定準則修改建議以及決定目標鎖定準則修改內容的方法
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
US20160364736A1 (en) Method and system for providing business intelligence based on user behavior
KR101812682B1 (ko) 온라인 행위가 오프라인 판매에 미치는 영향을 결정하기 위한 동적 지리 위치 파라미터
CN106803190A (zh) 一种广告个性化推送系统及方法
CN105654198B (zh) 具有最优阈值筛选的品牌广告效果优化的方法
US8732015B1 (en) Social media pricing engine
CN105631711A (zh) 一种广告投放方法及装置
CN108205766A (zh) 信息推送方法、装置及系统
CN104881803B (zh) 一种分析广告点击链接的方法及装置
CN104965890A (zh) 广告推荐的方法和装置
US20230214863A1 (en) Methods and apparatus to correct age misattribution
CN101685521A (zh) 在网页中展现广告的方法及系统
CN104516983A (zh) 数据展示方法
US20190050890A1 (en) Video dotting placement analysis system, analysis method and storage medium
CN102957949A (zh) 为用户推荐视频的装置及方法
CN103700004A (zh) 一种微博广告服务信息推送方法及装置
WO2015077253A1 (en) Methods and apparatus to measure a cross device audience
CN117745355A (zh) 基于移动端的广告发布系统及发布方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Applicant after: Youku network technology (Beijing) Co., Ltd.

Address before: 100080 Beijing Haidian District city Haidian street A Sinosteel International Plaza No. 8 block 5 layer A, C

Applicant before: 1Verge Inc.

RJ01 Rejection of invention patent application after publication

Application publication date: 20160525

RJ01 Rejection of invention patent application after publication