CN105260913A - 用于互联网广告投放的ctr预估方法、dsp服务器、系统 - Google Patents

用于互联网广告投放的ctr预估方法、dsp服务器、系统 Download PDF

Info

Publication number
CN105260913A
CN105260913A CN201510674239.1A CN201510674239A CN105260913A CN 105260913 A CN105260913 A CN 105260913A CN 201510674239 A CN201510674239 A CN 201510674239A CN 105260913 A CN105260913 A CN 105260913A
Authority
CN
China
Prior art keywords
advertising message
value
ctr
history
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510674239.1A
Other languages
English (en)
Inventor
汤奇峰
石子凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zamplus Technology Development Co Ltd
Original Assignee
Shanghai Zamplus Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zamplus Technology Development Co Ltd filed Critical Shanghai Zamplus Technology Development Co Ltd
Priority to CN201510674239.1A priority Critical patent/CN105260913A/zh
Publication of CN105260913A publication Critical patent/CN105260913A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

用于互联网广告投放的CTR预估方法、DSP服务器、系统,所述方法包括:在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;从第二数据库中获取与所述广告信息组标识对应的历史CTR值;根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系;根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。上述方案使计算得到的预估CTR值的准确性提高,从而使得用于预测CTR值的系统资源得到充分和有效的利用,提升系统的效率,节省了系统的资源。

Description

用于互联网广告投放的CTR预估方法、DSP服务器、系统
技术领域
本发明涉及互联网广告技术领域,特别是涉及一种用于互联网广告投放的CTR预估方法、DSP服务器、系统。
背景技术
在互联网广告行业中,目前投放广告的方式主要是使用在网页上提供的广告位上登载设定有URL(UniformResourceLocator,统一资源定位符)链接的互联网广告,当用户点击该互联网广告,转到该互联网广告的广告网页时,广告业主达成推送该广告的目的。
参与上述网页中的广告位竞价的DSP(Demand-SidePlatform,需求方平台)通过实时竞价的方式获取广告点击和曝光机会,而决定是否为一组广告参与竞价以及竞价的价格是多少主要取决于该组广告的点击率CTR(ClickThroughRate,网络广告的点击率),在DSP决定是否投放一组广告或者投放一组广告出价多少参与竞价时,对该广告的CTR预估值越高,则出价越高,反之出价越低。因此,对一组广告的CTR预估的准确性决定了DSP投放该组广告时的出价,从而决定了本次投放的收益。
现有技术中,往往通过记录一组广告展现中该广告是否被点击的历史数据、点击广告的用户特征以及广告投放位置的相关特征数据,来预测下一次用户打开某门户网站时点击该网站上的广告位所投放广告的可能性,然而,现有预测CTR的方法使计算出的CTR预估值不够接近于真实的CTR值,即CTR预估值与真实的CTR值偏差较大,不能很好地指导DSP以此来衡量是否参与广告的竞价,从而使系统用来存储和计算预测数据的存储资源和计算资源没有得到充分有效的利用,造成系统资源的浪费。
发明内容
本发明要解决的技术问题是提高互联网广告中CTR预估的准确性,从而使得有限的系统存储资源和计算资源得到有效的利用,提升系统效率,节省系统资源。
为解决上述技术问题,本发明实施例提供一种用于互联网广告投放的CTR预估方法,所述方法包括:
在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;其中,所述第一数据库包含用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
从第二数据库中获取与所述广告信息组标识对应的历史CTR值;其中,所述第二数据库存储多组广告信息数据,所述多组广告信息数据是在固定时间内,按照广告信息组标识统计第一数据库中的历史广告信息得到;
根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系;
根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
可选地,所述第一数据库还包括历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据;
所述广告信息数据包括广告信息组标识、所述广告信息组标识对应的广告信息展现次数总和、以及所述广告信息组标识对应的广告信息点击量总和,所述广告信息组标识对应一组广告信息数据。
可选地,所述从第二数据库中获取与所述广告信息组标识对应的历史CTR值,包括:
在所述第二数据库中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的历史CTR值并存储于所述第二数据库。
可选地,所述根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系,包括:
根据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N;
添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库;
获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值;
根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的所述历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
可选地,所述获取所述更新的第二数据库中的所有历史CTR值的K个中心值,包括:
随机选择K个初始中心值,其中,K大于且0小于1;
将与所述初始中心值差值的绝对值最小的历史CTR值归为一类;
计算已归为K类的每个类的历史CTR值的平均值,并将所述平均值覆盖更新所述K个初始中心值;
当所述k个初始中心值保持不变时,得到所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值,否则,继续进行所述获取所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值。
本发明实施例还提供了一种DSP服务器,所述DSP服务器包括:接收单元、第一获取单元、第一数据库、第二数据库、第二获取单元、第三获取单元和CTR预估值计算单元;
所述接收单元,适于接收互联网媒体服务器发送的用户标识和特征项数据;
所述第一获取单元,适于在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第一数据库,适于存储用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第二数据库,适于存储在固定时间内按照广告信息组标识统计第一数据库中的历史广告信息得到的多组广告信息数据;
所述第二获取单元,适于从第二数据库中获取与所述广告信息组标识对应的历史CTR值;其中,所述第二数据库存储多组广告信息数据,所述多组广告信息数据是在固定时间内,按照广告信息组标识统计第一数据库中的历史广告信息得到;
所述第三获取单元,适于根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系;
所述CTR预估值计算单元,适于根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
可选地,所述第一数据库还包括:历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据;所述广告信息数据包括广告信息组标识、所述广告信息组标识对应的广告信息展现次数总和、以及所述广告信息组标识对应的广告信息点击量总和,其中,所述广告信息组标识对应一组广告信息数据。
可选地,所述第二获取单元适于在所述第二数据库中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的历史CTR值并存储于所述第二数据库。
可选地,所述第三获取单元包括:添加单元、历史CTR分类单元、历史广告点击数据分类单元和第四获取单元;
所述添加单元,适于据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N,添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库;
所述历史CTR分类单元,适于获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值;
所述历史广告点击数据分类单元,适于根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
所述第四获取单元,适于根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
可选地,所述历史CTR分类单元,适于:
随机选择K个初始中心值,其中,K大于且0小于1;
将与所述初始中心值差值的绝对值最小的历史CTR值归为一类;
计算已归为K类的每个类的历史CTR值的平均值,并将所述平均值覆盖更新所述K个初始中心值;
当所述k个初始中心值保持不变时,得到所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值,否则,继续进行所述获取所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值。
本发明实施例还提供一种用于互联网广告投放的CTR预估系统,所述系统包括:互联网媒体服务器和上述的DSP服务器;
所述互联网媒体服务器,适于在用户访问时向所述DSP服务器发送用户标识和特征项数据。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例通过在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识,从第二数据库中获取与所述广告信息组标识对应的历史CTR值,根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系,根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值,由于获得的广告信息组标识对应的历史CTR值所在类别的特征项权重以及特征值与CTR预估值的关系接近于真实的特征值与CTR预估值之间的预测关系,使计算得到的预估CTR值的准确性提高,从而使得用于预测CTR值的系统资源得到充分和有效的利用,提升系统的效率,节省了系统的资源。
附图说明
图1是本发明实施例中的一种用于互联网广告投放的CTR预估系统的结构示意图;
图2是本发明实施例中的一种用于互联网广告投放的CTR预估方法的流程图;
图3是本发明实施例中的一种切分历史广告点击数据获得特征项权重以及特征值与CTR预估值的关系的方法的流程图;
图4是本发明实施例的一种DSP服务器的结构示意图。
具体实施方式
如前所述,现有技术中,现有技术中,往往通过记录一组广告展现中该广告是否被点击的历史数据、点击广告的用户特征以及广告投放位置的相关特征数据,来预测下一次用户打开某门户网站时点击该网站上的广告位所投放广告的可能性,然而,现有预测CTR的方法使计算出的CTR预估值不够接近于真实的CTR值,即CTR预估值与真实的CTR值偏差较大,不能很好地指导DSP以此来衡量是否参与广告的竞价,从而使系统用来存储和计算预测数据的存储资源和计算资源得不到有效的利用,造成系统资源的浪费。
本发明实施例通过在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识,从第二数据库中获取与所述广告信息组标识对应的历史CTR值,根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系,根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值,由于广告信息组标识对应的历史CTR值所在类别的特征项权重以及特征值与CTR预估值的关系接近于真实的特征值与CTR预估值之间的预测关系,使计算得到的预估CTR值的准确性提高,从而使得用于预测CTR值的系统资源得到充分和有效的利用,提升系统的效率,节省了系统的资源。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例中的一种用于互联网广告投放的CTR预估系统的结构示意图。如图所示的互联网广告提供系统,可以包括:互联网媒体服务器10和DSP服务器11。
在具体实施中,互联网媒体服务器10提供互联网广告的投放网页和投放位置,例如可以是视频网站等互联网媒体服务器。当用户通过用户终端12打开互联网媒体服务器10提供的网页时,互联网媒体服务器10向所述用户终端12提供包括互联网广告的网页内容,在具体呈现该网页内容之前,所述互联网媒体服务器10通过用户在用户终端12的点击获取了所述用户终端12的用户标识,并将所述用户标识和有关该网页的特征项数据传送至DSP服务器11,所述特征项数据是从互联网媒体网站提取的特征项对应的数据,所述特征项是用来辅助DSP服务器11判断是否在该互联网媒体网站投放广告的参考因素。例如,所述特征项可以包括网页网址、互联网广告投放位置和广告位可放广告的长宽等。
如图1所示,所述DSP服务器11用于需求方平台DSP参与网页中广告位竞价的预估CTR值计算,具体实施中,所述需求方平台DSP接收广告业主的委托,参与广告位的竞价为所述广告业主投放广告。
例如,需求方平台DSP接收广告业主苏宁的委托参与苏宁的一组广告G的投放,当用户通过用户终端12打开某视频网站的网页时,该视频网站的所述互联网媒体服务器10将所述用户终端12的标识传送给DSP服务器11,同时所述DSP服务器11获得来自互联网媒体服务器10发送的特征项数据,所述DSP服务器11将所述用户终端12的标识作为用户标识,参照所述用户标识和所述特征项数据,DSP服务器11通过计算预估CTR值,使得DSP可以借此判断是否参与将苏宁的广告G投放于该视频网站用户打开网页中广告位的竞价。
需要指出的是,本发明实施例中所述的特征项选取可以根据需要进行设置,而不仅限于上述三项,在此不做限制。
下面将结合实施例对如何进行计算得到预估CTR值进行说明。
图2是本发明实施例中的一种用于互联网广告投放的CTR预估方法的流程图。如图所示的用于互联网广告投放的CTR预估方法,可以包括以下步骤,参照图1说明如下:
步骤S201:在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识。
在具体实施中,当用户打开互联网媒体服务器10提供的网页时,互联网媒体服务器10获取用户标识和特征项数据并发送至DSP服务器11。所述DSP服务器11根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识。其中,所述第一数据库包含用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识。一般地,所述第一数据库中用户标识和用户标识对应的用户浏览过的广告信息组标识,通过需求方平台DSP部署在互联网媒体服务器部署的代码捕获并实时发送至所述DSP服务器11来获取。
在具体实施中,所述第一数据库还包括历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据。
在具体实施中,所述第一数据库还包括历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据。
具体实施中,所述广告信息数据包括广告信息组标识、所述广告信息组标识对应的广告信息展现次数总和、以及所述广告信息组标识对应的广告信息点击量总和,所述广告信息组标识对应一组广告信息数据。
步骤S202:从第二数据库中获取与所述广告信息组标识对应的历史CTR值。
在具体实施中,所述第二数据库中存储的数据是多组广告信息数据,通过在固定时间内按照广告信息组标识统计第一数据库中的历史广告信息得到。例如,在固定时间内,第二数据库将第一数据库中的历史广告信息按照广告信息组标识统计得到多组广告信息数据。步骤S202根据步骤S201得到用户标识对应的用户所浏览过网页对应的广告信息组标识,在本步骤S202中得到所述广告信息组标识对应的历史CTR值。
在具体实施中,在所述第二数据库中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的CTR值并存储于所述第二数据库。例如,在一定时间T内,第二数据库按所述广告信息组标识统计得到多组广告信息数据,根据所述广告信息点击量总和与广告信息展现次数得到广告信息组标识对应的历史CTR值,例如如表1所示:
表1
以表1中一组广告信息数据为例,广告信息组标识为3844的一组广告,在固定时间内得以展现的次数是267020次,而被点击次数的总和为179次,那么广告信息组标识为3844的这一组广告的所述历史CTR值为:179/267020=0.000670362,表中其他的历史CTR值计算可以此类推。
步骤S203:根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系。
在具体实施中,可以按照所述历史CTR值将第二数据库中的多组广告信息数据切分成不同的类别,并对不同类别的历史广告点击数据进行拟合,使得每一个类别中广告信息组标识对应的历史CTR值,可以依据同样的特征项权重以及特征项数据与CTR值的映射关系计算得到。例如,将第二数据库中的多组广告信息数据切分成不同的类别A、B、C和D,假设特征项分别为网站网址、广告位置和广告位长宽,分别对每一类的历史广告点击数据进行拟合后得到对应类的每个特征项的权重以及特征值与CTR值间的映射关系,因此可以得到四组特征项权重及特征项数据与CTR值间的映射关系。
需要指出的是,切分所述历史广告点击数据为多少类别可以根据需要进行调整设置,在此不做限制。
步骤S204:根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
在具体实施中,步骤S201中获得来自互联网媒体服务器10的用户标识和特征项数据。例如,可以获得来自M视频网站服务器发送的用户标识L,以及上述三个特征项对应的特征项数据x1、y1、z1,根据所述用户标识L可以获得该用户浏览过的广告组标识3844(参考表1)。而在步骤S202中,可以获得每一类广告信息数据的特征项目权重值,以及特征项数据与CTR值间的对应关系ctr(x,y,z)=a*x+b*y+c*y,假设所述历史广告点击数据被切分成A、B、C、D四类,对每一类数据模拟得到各自的权重值a、b、c,以及所述特征项数据与CTR值间的对应关系ctr(x,y,z)=a*x+b*y+c*y。在步骤203中,根据所述广告组标识3844对应的历史CTR值0.000670362所属的切分类别,找到对应的网站网址这一特征项权重为a1,广告位置这一特征项权重为b1,广告位长宽这一特征项权重为c1,那么执行本步骤S204则可以计算出预估CTR值为a1*x1+b1*y1+z1*y1。
需要指出的是,本发明实施例中所述的特征项不止三项,在此为了示意仅仅列出了三项,实际应用中根据需要设定不同的特征项以及特征项的数目。
本发明实施例通过按照历史CTR值切分广告信息数据,对切分得到的每一类广告信息数据进行拟合得到特征项的权重值以及特征值与CTR值间的映射关系,当从互联网媒体服务器获得用户标识以及用标识对应的广告组标识时,可以根据所述广告组标识对应的历史CTR值找到对应类别的一组特征项权重以及映射关系,从而可以使用来自互联网媒体服务器的特征项计算预估CTR值,进而使预测得到CTR值更接近于真实的点击率,从而使得用于预测CTR值的系统资源得到充分和有效的利用,提升系统的效率,节省了系统的资源。
下面结合实施例对步骤S203中涉及到的将多组广告信息数据切分成多个类别的方法进行说明。
图3是本发明实施例中的一种切分历史广告点击数据获得特征项权重以及特征值与CTR预估值的关系的方法的流程图。
步骤S301:根据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N。
在具体实施中,可以将第二数据库中的广告信息组标识对应的点击量总和取10为底对数后向上取整获得复制量N。例如将广告信息组标识为3844对应的这一组广告的点击量总和179取以10为底的对数并向上取整:ceil(log(179))=3,得到复制量为3。
步骤S302:添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库。
在具体实施中,结合上例,复制3组广告信息数据到多组广告信息数据中,即在原来的所述多组广告信息数据中,多了3条同样的包括广告信息组标识、点击次数总和与展现次数总和的记录,对每一组广告信息数据执行步骤S301后执行本步骤S302可得到更新的第二数据库。
步骤S303:获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值。
在具体实施中,可以通过以下方法获取K个中心值:随机选择K个初始中心值,其中,K大于且0小于1;将与所述初始中心值差值的绝对值最小的历史CTR值归为一类;计算已归为K类的每个类的历史CTR值的平均值,并将所述平均值覆盖更新所述K个初始中心值;当所述k个初始中心值保持不变时,得到所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值,否则,继续进行所述获取所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值。
步骤S304:根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的所述历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
步骤S304:根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
本发明实施例使用上述的切分方式,可以更加智能和合理地将所述历史广告点击数据切分成了K类,避免了手动划分的人工干预,也可以自适应数据的变化。
图4是本发明实施例中的一种DSP服务器的结构示意图。如图所示的DSP服务器,可以包括:接收单元401、第一获取单元402、第一数据库403、第二数据库404、第二获取单元405、第三获取单元406和CTR预估值计算单元407。参照图1进行说明:
所述接收单元401,适于接收互联网媒体服务器10发送的用户标识和特征项数据;
所述第一获取单元402,适于在接收到互联网媒体服务器10发送的用户标识和特征项数据时,根据所述用户标识从第一数据库403中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第一数据库403,适于存储用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第二数据库404,适于存储在固定时间内按照广告信息组标识统计第一数据库403中的历史广告信息得到的多组广告信息数据;
所述第二获取单元405,适于从第二数据库404中获取与所述广告信息组标识对应的历史CTR值。
在具体实施中,所述第二获取单元405适于在所述第二数据库404中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的历史CTR值并存储于所述第二数据库404。
所述第三获取单元406,适于根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系。
具体实施中,所述第三获取单元406可以包括:添加单元4061、历史CTR分类单元4062、历史广告点击数据分类单元4063和第四获取单元4064;
所述添加单元4061,适于根据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N,添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库;
所述历史CTR分类单元4062,适于获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值;
所述历史广告点击数据分类单元4063,适于根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
所述第四获取单元4064,适于根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
CTR预估值计算单元407,适于根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (11)

1.一种用于互联网广告投放的CTR预估方法,其特征在于,包括:
在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;其中,所述第一数据库包含用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
从第二数据库中获取与所述广告信息组标识对应的历史CTR值;其中,所述第二数据库存储多组广告信息数据,所述多组广告信息数据是在固定时间内,按照广告信息组标识统计第一数据库中的历史广告信息得到;
根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系;
根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
2.根据权利要求1所述的用于互联网广告投放的CTR预估方法,其特征在于,所述第一数据库还包括历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据;
所述广告信息数据包括广告信息组标识、所述广告信息组标识对应的广告信息展现次数总和、以及所述广告信息组标识对应的广告信息点击量总和,所述广告信息组标识对应一组广告信息数据。
3.根据权利要求2所述的用于互联网广告投放的CTR预估方法,其特征在于,所述从第二数据库中获取与所述广告信息组标识对应的历史CTR值,包括:在所述第二数据库中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的历史CTR值并存储于所述第二数据库。
4.根据权利要求3所述的用于互联网广告投放的CTR预估方法,其特征在于,所述根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系,包括:
根据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N;
添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库;
获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值;根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的所述历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
5.根据权利要求4所述的用于互联网广告投放的CTR预估方法,其特征在于,所述获取所述更新的第二数据库中的所有历史CTR值的K个中心值,包括:
随机选择K个初始中心值,其中,K大于0且小于1;
将与所述初始中心值差值的绝对值最小的历史CTR值归为一类;
计算已归为K类的每个类的历史CTR值的平均值,并将所述平均值覆盖更新所述K个初始中心值;
当所述k个初始中心值保持不变时,得到所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值,否则,继续进行所述获取所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值。
6.一种DSP服务器,其特征在于,包括:接收单元、第一获取单元、第一数据库、第二数据库、第二获取单元、第三获取单元和CTR预估值计算单元;所述接收单元,适于接收互联网媒体服务器发送的用户标识和特征项数据;所述第一获取单元,适于在接收到互联网媒体服务器发送的用户标识和特征项数据时,根据所述用户标识从第一数据库中获取所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第一数据库,适于存储用户标识和所述用户标识对应的用户所浏览过网页对应的广告信息组标识;
所述第二数据库,适于存储在固定时间内按照广告信息组标识统计第一数据库中的历史广告信息得到的多组广告信息数据;
所述第二获取单元,适于从第二数据库中获取与所述广告信息组标识对应的历史CTR值;其中,所述第二数据库存储多组广告信息数据,所述多组广告信息数据是在固定时间内,按照广告信息组标识统计第一数据库中的历史广告信息得到;
所述第三获取单元,适于根据所述历史CTR值获取所述历史CTR值所在类对应的特征项权重以及特征值与CTR预估值的关系;
所述CTR预估值计算单元,适于根据所述特征项数据和所述特征项权重以及特征值与CTR值的关系计算当前CTR预估值。
7.根据权利要求6所述的DSP服务器,其特征在于,所述第一数据库还包括:历史广告点击数据,所述历史广告点击数据记录了广告信息组标识对应的广告信息每次展现是否被点击的数据;所述广告信息数据包括广告信息组标识、所述广告信息组标识对应的广告信息展现次数总和、以及所述广告信息组标识对应的广告信息点击量总和,其中,所述广告信息组标识对应一组广告信息数据。
8.根据权利要求7所述的DSP服务器,其特征在于,所述第二获取单元适于在所述第二数据库中,将所述广告信息组标识对应的广告信息点击量总和与将所述广告信息组标识对应的广告信息展现次数总和作商,获得所述广告信息组标识对应的历史CTR值并存储于所述第二数据库。
9.根据权利要求8所述的DSP服务器,其特征在于,所述第三获取单元包括:添加单元、历史CTR分类单元、历史广告点击数据分类单元和第四获取单元;
所述添加单元,适于据所述广告信息数据中的每一组广告信息数据的所述广告信息点击量总和获取所述每一个广告信息组的复制量N,添加N组广告信息数据到所述多组广告信息数据中,得到更新的第二数据库;
所述历史CTR分类单元,适于获取所述更新的第二数据库中的所有历史CTR值的K个中心值,并按照所述K个中心值获得K类历史CTR值及每类历史CTR值的两个边界值;
所述历史广告点击数据分类单元,适于根据所述每类历史CTR值的两个边界值,将属于所述K类历史CTR值中一个类别的历史CTR值对应广告组标识所对应在所述第一数据库中的所述历史广告点击数据归为一类;
所述第四获取单元,适于根据每一类所述历史广告点击数据,获得特征项权重以及特征值与CTR预估值的关系。
10.根据权利要求9所述的DSP服务器,其特征在于,所述历史CTR分类单元,适于:
随机选择K个初始中心值,其中,K大于0且小于1;
将与所述初始中心值差值的绝对值最小的历史CTR值归为一类;
计算已归为K类的每个类的历史CTR值的平均值,并将所述平均值覆盖更新所述K个初始中心值;
当所述k个初始中心值保持不变时,得到所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值,否则,继续进行所述获取所述更新多组广告信息数据中的所有所述历史CTR值的K个中心值。
11.一种用于互联网广告投放的CTR预估系统,其特征在于,包括:互联网媒体服务器和权利要求6-10任一项所述的DSP服务器;
所述互联网媒体服务器,适于在用户访问时向所述DSP服务器发送用户标识和特征项数据。
CN201510674239.1A 2015-10-16 2015-10-16 用于互联网广告投放的ctr预估方法、dsp服务器、系统 Pending CN105260913A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510674239.1A CN105260913A (zh) 2015-10-16 2015-10-16 用于互联网广告投放的ctr预估方法、dsp服务器、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510674239.1A CN105260913A (zh) 2015-10-16 2015-10-16 用于互联网广告投放的ctr预估方法、dsp服务器、系统

Publications (1)

Publication Number Publication Date
CN105260913A true CN105260913A (zh) 2016-01-20

Family

ID=55100588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510674239.1A Pending CN105260913A (zh) 2015-10-16 2015-10-16 用于互联网广告投放的ctr预估方法、dsp服务器、系统

Country Status (1)

Country Link
CN (1) CN105260913A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709756A (zh) * 2016-12-08 2017-05-24 北京五八信息技术有限公司 用户需求信息获取方法和装置
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法
CN107067274A (zh) * 2016-12-27 2017-08-18 北京掌阔移动传媒科技有限公司 一个基于混合学习模型的dsp实时竞价广告系统
CN107516247A (zh) * 2017-08-28 2017-12-26 天脉聚源(北京)科技有限公司 一种预测广告播放数据的方法及装置
CN109615060A (zh) * 2018-11-27 2019-04-12 深圳前海微众银行股份有限公司 Ctr预估方法、装置及计算机可读存储介质
CN110956500A (zh) * 2019-11-28 2020-04-03 湖南快乐阳光互动娱乐传媒有限公司 一种广告实时竞价系统中降低广告请求耗时的方法及系统
CN111582899A (zh) * 2019-02-19 2020-08-25 北京沃东天骏信息技术有限公司 一种展示链接效果的量化方法、装置、系统及存储介质
CN112862544A (zh) * 2021-03-15 2021-05-28 重庆度小满优扬科技有限公司 对象信息的获取方法、装置以及存储介质
CN113222651A (zh) * 2021-04-29 2021-08-06 西安点告网络科技有限公司 广告投放模型统计类特征离散化方法、系统、设备及介质
CN113706228A (zh) * 2021-11-01 2021-11-26 腾讯科技(深圳)有限公司 多媒体信息播放控制方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440584A (zh) * 2013-07-31 2013-12-11 北京亿赞普网络技术有限公司 一种广告投放方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹守营: "基于并行K-均值算法的网络广告精确营销系统设计", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709756A (zh) * 2016-12-08 2017-05-24 北京五八信息技术有限公司 用户需求信息获取方法和装置
CN107067274A (zh) * 2016-12-27 2017-08-18 北京掌阔移动传媒科技有限公司 一个基于混合学习模型的dsp实时竞价广告系统
CN106803190A (zh) * 2017-01-03 2017-06-06 北京掌阔移动传媒科技有限公司 一种广告个性化推送系统及方法
CN107516247A (zh) * 2017-08-28 2017-12-26 天脉聚源(北京)科技有限公司 一种预测广告播放数据的方法及装置
CN109615060A (zh) * 2018-11-27 2019-04-12 深圳前海微众银行股份有限公司 Ctr预估方法、装置及计算机可读存储介质
CN109615060B (zh) * 2018-11-27 2023-06-30 深圳前海微众银行股份有限公司 Ctr预估方法、装置及计算机可读存储介质
CN111582899A (zh) * 2019-02-19 2020-08-25 北京沃东天骏信息技术有限公司 一种展示链接效果的量化方法、装置、系统及存储介质
CN110956500B (zh) * 2019-11-28 2023-04-18 湖南快乐阳光互动娱乐传媒有限公司 一种广告实时竞价系统中降低广告请求耗时的方法及系统
CN110956500A (zh) * 2019-11-28 2020-04-03 湖南快乐阳光互动娱乐传媒有限公司 一种广告实时竞价系统中降低广告请求耗时的方法及系统
CN112862544A (zh) * 2021-03-15 2021-05-28 重庆度小满优扬科技有限公司 对象信息的获取方法、装置以及存储介质
CN112862544B (zh) * 2021-03-15 2024-05-28 重庆度小满优扬科技有限公司 对象信息的获取方法、装置以及存储介质
CN113222651A (zh) * 2021-04-29 2021-08-06 西安点告网络科技有限公司 广告投放模型统计类特征离散化方法、系统、设备及介质
CN113222651B (zh) * 2021-04-29 2024-05-07 西安点告网络科技有限公司 广告投放模型统计类特征离散化方法、系统、设备及介质
CN113706228A (zh) * 2021-11-01 2021-11-26 腾讯科技(深圳)有限公司 多媒体信息播放控制方法、装置、电子设备和存储介质
CN113706228B (zh) * 2021-11-01 2022-02-08 腾讯科技(深圳)有限公司 多媒体信息播放控制方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN105260913A (zh) 用于互联网广告投放的ctr预估方法、dsp服务器、系统
US10992762B2 (en) Processing link identifiers in click records of a log file
CN106355431B (zh) 作弊流量检测方法、装置及终端
US9015128B2 (en) Method and system for measuring social influence and receptivity of users
CN103491146B (zh) 一种网络信息投放方法、装置和系统
CN105023165A (zh) 社交网络平台中投放任务的控制方法、装置及系统
CN108537289B (zh) 数据识别模型的训练方法、装置及存储介质
WO2014193399A1 (en) Influence score of a brand
US20150032504A1 (en) Influence scores for social media profiles
CN102880688A (zh) 一种用于对网页进行评估的方法、装置和设备
CN104579912A (zh) 数据推送的方法及装置
CN108614843B (zh) 网站内容的评估方法及装置
CN105160545A (zh) 投放信息样式确定方法及装置
CN111090822A (zh) 业务对象的推送方法及装置
CN104636473A (zh) 基于电子支付行为的数据处理方法和系统
CN106126519B (zh) 媒体信息的展示方法及服务器
CN103631787A (zh) 网页类型识别方法以及网页类型识别装置
CN105550275A (zh) 一种微博转发量预测方法
CN104750760A (zh) 一种推荐应用软件的实现方法及装置
CN106357789A (zh) 一种信息访问控制方法及服务器
CN103186604A (zh) 用于确定用户对搜索结果满意度的方法、装置和设备
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN111782735A (zh) 羊毛党流量识别方法及装置
CN107330709B (zh) 确定目标对象的方法及装置
CN111882349B (zh) 一种数据处理方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160120