CN103093377A - 一种广告投放方法和系统 - Google Patents
一种广告投放方法和系统 Download PDFInfo
- Publication number
- CN103093377A CN103093377A CN201310021918XA CN201310021918A CN103093377A CN 103093377 A CN103093377 A CN 103093377A CN 201310021918X A CN201310021918X A CN 201310021918XA CN 201310021918 A CN201310021918 A CN 201310021918A CN 103093377 A CN103093377 A CN 103093377A
- Authority
- CN
- China
- Prior art keywords
- information
- interest group
- terminal
- adsl
- weighted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种广告投放方法和系统,以解决背景技术广告投放的精准度低的问题。所述方法包括:对接收到的广告投放请求进行识别,得到包括IP信息和用户代理信息的终端信息;根据IP信息在ADSL_IP数据库中查询是否存在ADSL信息;当存在ADSL信息时,在ADSL兴趣组数据库中查询是否存在兴趣组信息;当不存在ADSL信息或兴趣组信息时,根据IP信息和用户代理信息在预先生成的IP_UA兴趣组数据库中查询是否存在兴趣组信息;根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的兴趣组信息进行广告投放。本发明实施例更精准地区分终端个体,提高了广告投放的精准度,并且节省线上CPU资源。
Description
技术领域
本发明实施例涉及互联网技术领域,特别是涉及一种广告投放方法和系统。
背景技术
网络广告联盟(简称网盟)是重要的广告营销平台之一,提供广告投放资源的网站等称为网盟营销平台。大型网盟营销平台,由于其自身网站访问数据量大,可以通过对网站日志的挖掘,提取终端的访问行为特征,从而在根据自身网站的cookie(指某些网站为了辨别终端身份、进行会话跟踪而储存在本地终端上的数据)识别访问网盟网站的终端后,向终端投放精准广告。而中小型网盟营销平台由于其网站访问量小,较难通过cookie累积终端的访问行为特征。
因此,网盟营销平台分为两种:一种是没有数据量的支撑,只能向网盟网站投放普通广告,广告投放无法针对特定需求的终端,精准度低。另一种是通过获取终端上下线信息识别终端,但是只能识别非对称数字用户环路(Asymmetric Digital Subscriber Line,ADSL)终端,终端的识别率不高,针对终端的广告投放的精准度低。
发明内容
本发明实施例公开一种广告投放方法和系统,以解决背景技术广告投放的精准度低的问题。
为了解决上述问题,本发明实施例公开了一种广告投放方法,包括:
接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息;
根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;
当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;
当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息;
根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
优选的,预先生成IP_UA兴趣组数据库,包括:
提取固定IP信息;
根据所述固定IP信息计算IP_UA兴趣组信息;
保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
优选的,所述提取固定IP信息,包括:
获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志;
在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间;
确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间;
对IP信息与cookie_value信息均出现过的天数进行求和;
提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之和大于第二阈值的IP信息,做为固定IP信息。
优选的,所述根据所述固定IP信息计算IP_UA兴趣组信息,包括:
提取与所述固定IP信息对应的用户代理信息和url信息;
以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息。
优选的,所述以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息,包括:
统计各url信息的权重值;
获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量;
根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量;
根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
优选的,所述当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息,包括:
当存在所述终端的ADSL信息时,根据ADSL信息和用户代理信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;
当不存在时,根据ADSL信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
本发明实施例还公开了一种广告投放系统,包括
识别模块用于接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息
查询模块,用于根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在生成模块预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息;
投放模块,用于根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
优选的,所述生成模块,包括:
提取子模块,用于提取固定IP信息;
计算子模块,用于根据所述固定IP信息计算IP_UA兴趣组信息;
保存更新子模块,用于保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
优选的,所述提取子模块获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志;在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间;确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间;对IP信息与cookie_value信息均出现过的天数进行求和;提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之和大于第二阈值的IP信息,做为固定IP信息。
优选的,所述计算子模块提取与所述固定IP信息对应的用户代理信息和url信息;
所述计算子模块以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息,包括:所述计算子模块统计各url信息的权重值;获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量;根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量;根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
与背景技术相比,本发明实施例包括以下优点:
首先,利用cookie信息的相对持久性,以cookie+ip作为关键词,通过相应算法统计得出固定IP信息,提高了对终端的识别范围,相应地也提高了广告投放的精准度。
而且,以IP+用户代理(User Agent,UA)为粒度进行终端切分,更精准地区分终端个体。
再次,计算得到固定IP_UA兴趣组信息的过程,主要集中于离线计算,节省线上CPU资源。
附图说明
图1是本发明实施例中一种广告投放方法流程图;
图2是本发明实施例中一种广告投放方法流程图;
图3是本发明实施例中一种广告投放系统结构图;
图4是本发明实施例中一种广告投放系统结构图;
图5是本发明实施例中一种广告投放系统示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
各大网站根据cookie对终端进行识别,具有准确高效的优势。终端首次访问网页站点时,网页站点向终端发送一个独有的cookie,之后当该终端访问该网页站点时,超文本传输协议(hypertext transport protocol,htp)报文中会携带该cookie信息;
本发明实施例根据cookie的工作原理,利用网络运营商服务器流量大的特点,提取出http报文中的cookie和IP信息,结合cookie长时间固定的特性,通过相应的算法得出与cookie信息相关联的固定IP信息;然后通过对网络终端访问日志进行挖掘,获取以固定IP+UA为粒度的终端兴趣组数据,从而在终端访问网盟时,通过提取报文中的IP信息和UA信息获取终端对应的兴趣组信息,提高在网盟网站上的广告投放精准度。
下面通过列举几个具体的实施例详细介绍本发明公开的一种广告投放方法和系统。
实施例一
详细介绍本发明实施例公开的一种广告投放方法。
参照图1,示出了本发明实施例中一种广告投放方法流程图。
步骤100,接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息。
例如,接收并识别某广告投放请求后,确定该广告投放请求为对终端A进行投放对应的广告。其中,该广告投放请求中还可以包括终端A的信息,具体可以为终端A的IP信息和终端A的UA信息。
所述UA信息可以为供服务器等识别终端的操作系统及版本、浏览器及版本等信息的特殊字符串头。
步骤102,根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息。
例如,在已知的ADSL_IP数据库中,根据所述步骤100中得到的终端A的IP信息,查找与终端A的IP信息对应的ADSL信息。
所述ADSL信息可以为终端上网的账号等。
步骤104,当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
当已知的ADSL_IP数据库中存在终端A的ADSL信息时,接下来在已知的ADSL兴趣组数据库中,查找终端A对应的兴趣组信息。
所述兴趣组信息可以为终端经常访问的网站的分类或属性信息,或者终端在网络上的行为信息等。
步骤106,当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息。
当已知的ADSL_IP数据库中不存在终端A的ADSL信息,或者已知的ADSL兴趣组数据库中不存在终端A的兴趣组信息时,根据终端A的IP信息和终端A的UA信息在预先生成的IP_UA兴趣组数据库中,查询终端A对应的兴趣组信息。
所述预先生成IP_UA兴趣组数据库的过程主要集中于离线计算生成。
根据终端的IP信息和UA信息查询兴趣组信息,可以更细致地针对同一IP下的不同终端或子终端的信息查询对应的兴趣组信息。
步骤108,根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
如果步骤104在ADSL兴趣组数据库中查询得到终端A对应的兴趣组信息,或者步骤106在IP_UA兴趣组数据库中查询得到终端A对应的兴趣组信息,则可以根据终端A对应的兴趣组信息进行投放广告。
综上所述,本发明实施例公开的一种广告投放方法,与背景技术相比具有以下优点:
首先,以IP+UA为粒度进行终端切分,更精准地区分终端个体。
其次,计算得到固定IP_UA兴趣组信息的过程,主要集中于离线计算,节省线上CPU资源。
再次,当在ADSL兴趣组数据库中无法查询得到对应的兴趣组信息时,可以进一步在预先生成的IP_UA兴趣组数据库中查询,弥补了仅仅查询ADSL兴趣组数据库的不足。
实施例二
详细介绍本发明实施例公开的一种广告投放方法。
参照图2,示出了本发明实施例中一种广告投放方法流程图。
步骤200,预先生成IP_UA兴趣组数据库。
所述步骤200,具体可以包括:
子步骤2001,提取固定IP信息。
具体地,可以获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志。
在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间。
确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间。
对IP信息与cookie_value信息均出现过的天数进行求和。
提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之和大于第二阈值的IP信息,做为固定IP信息。
所述子步骤2001,在hadoop(一个分布式系统基础架构)集群进行以天为单位的例行化运算,还可以通过三轮运算过程实现,具体可以为:
第一轮,运算实现数据的过滤、提取和去重合功能。具体过程为:
1)提取终端访问日志中的(domain,cookie),若domain和cookie都非空,转2),如果domain为空,或者cookie为空,则处理下一条日志。
2)从cookie中判断该domain下是否存在可以唯一标识该终端的cookie_id字段(例如:对于domain为baidu的报文,cookie_id为BAIDUID字段),若存在该cookie_id,则提取对应的cookie_value,转3),如果不存在唯一标识该终端的cookie_id,则处理下一条日志。
3)在终端访问日志中提取ip值和时间字段,输出以cookie_value+ip为关键字的出现时间和出现次数。
其中,所述时间字段为实时解析该条终端访问报文时的时间。
4)统计如表1所示结构的数据。
其中,key为cookie_value+ip,count为key出现次数,start_time为key第一次出现时间(精确至秒),end_time为key当前最后一次出现时间(精确至秒),day_count为key出现的总天数(第一轮计算时,如果该key在当天出现,则该key对应的day_count初始化为1)。
Key | count | Start_time | End_time | Day_count |
表1
第二轮,将历史数据与第一轮计算得到的数据进行融合,输出格式与第一轮计算输出的格式相同。具体流程为:
1)若历史数据与当天数据中的key相同,则转2);如果不同,并且当end_time与当前时间之差大于预定的某阀值时,过滤掉该条数据(目的是减少磁盘占用空间),当end_time与当前时间之差小于等于预定的某阀值时,保留该条数据。
其中,所述预定的某阀值可以根据实际情况具体设置。
2)数据进行合并。
具体为count相加,start_time取最小值,end_time取最大值,day_count相加。
第三轮,提取固定IP列表。
设置阀值X1和X2,从满足最大end_time与最小start_time之差大于X1且day_count大于X2的key中提取出IP值,进行去重合计算,即可得到固定IP列表。
所述阀值X1和X2可以根据实际情况具体设置。
子步骤2002,根据所述固定IP信息计算IP_UA兴趣组信息。
根据子步骤2001计算得到的固定IP列表,分析终端历史访问日志,以IP_UA为粒度划分终端;根据UA对同一IP下的终端进行切分,主要是为了区分同一IP下多个终端的情况。
具体地,可以提取与所述固定IP信息对应的用户代理信息和url信息。
以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息。兴趣组信息通过对url对应的权重值与历史兴趣组信息的权重值结合的方式动态获得。
计算得到IP_UA兴趣组信息的过程,具体可以为:统计各url信息的权重值,得到权重值表,该表为常驻内存表。
获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量。
根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量。
根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
子步骤2003,保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
根据所述子步骤2003可以得到如下所示的兴趣组信息格式:
(uid_1,【兴趣类别1,0.72】【兴趣类别8,0.24】【兴趣类别9,0.04】)
(uid_2,【兴趣类别2,0.62】【兴趣类别5,0.27】【兴趣类别6,0.14】)
其中,uid_1和uid_2为表示终端的标识。
需要强调的是,所述步骤200预先生成IP_UA兴趣组数据库的过程主要集于离线计算生成。
步骤202,接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息。
步骤204,根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息。
步骤206,当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
所述步骤206,具体可以包括:
当存在所述终端的ADSL信息时,根据ADSL信息和用户代理信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
当ADSL兴趣组数据库中不存在所述终端的兴趣组信息时,根据ADSL信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
步骤208,当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息。
步骤210,根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
例如,查询得到终端A对应的兴趣组信息为:
uid_1,【兴趣类别1,0.72】【兴趣类别8,0.24】【兴趣类别9,0.04】
其中,uid_1为终端A的标识信息,兴趣类别1可以为“购物”,兴趣类别8可以为“电影”,兴趣类别9可以为“汽车”。
可以针对终端A根据三种兴趣类别的权重值的大小关系,按不同比重投放对应的广告。
综上所述,本发明实施例公开的一种广告投放方法,与背景技术相比具有以下优点:
首先,利用cookie信息的相对持久性,以cookie+ip作为关键词,通过相应算法统计得出固定IP信息,提高了对终端的识别范围,相应地也提高了广告投放的精准度。
其次,以IP+UA为粒度进行终端切分,更精准地区分终端个体。
再次,计算得到固定IP_UA兴趣组信息的过程,主要集中于离线计算,节省线上CPU资源。
进一步,当在ADSL兴趣组数据库中无法查询得到对应的兴趣组信息时,可以进一步在预先生成的IP_UA兴趣组数据库中查询,弥补了仅仅查询ADSL兴趣组数据库的不足。
实施例三
详细介绍本发明实施例公开的一种广告投放系统。
参照图3,示出了本发明实施例中一种广告投放系统结构图。
所述一种广告投放系统,具体可以包括:
识别模块30,生成模块32,查询模块34,以及,投放模块36。
下面分别详细介绍各模块的功能以及各模块之间的关系。
识别模块30,用于接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息。
例如,所述识别模块30接收并识别某广告投放请求后,确定该广告投放请求为对终端A进行投放对应的广告。其中,该广告投放请求中还可以包括终端A的信息,具体可以为终端A的IP信息和终端A的UA信息。
所述UA信息可以为供服务器等识别终端的操作系统及版本、浏览器及版本等信息的特殊字符串头。
生成模块32,用于预先生成IP_UA兴趣组数据库。
所述生成模块32主要集中于离线计算预先生成IP_UA兴趣组数据库。
查询模块34,用于根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在生成模块预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息。
其中,根据终端的IP信息和UA信息查询兴趣组信息,可以更细致地针对同一IP下的不同终端或子终端的信息查询对应的兴趣组信息。
投放模块36,用于根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
综上所述,本发明实施例公开的一种广告投放系统,与背景技术相比具有以下优点:
首先,以IP+UA为粒度进行终端切分,更精准地区分终端个体。
其次,计算得到固定IP_UA兴趣组信息的过程,主要集中于离线计算,节省线上CPU资源。
再次,当在ADSL兴趣组数据库中无法查询得到对应的兴趣组信息时,可以进一步在预先生成的IP_UA兴趣组数据库中查询,弥补了仅仅查询ADSL兴趣组数据库的不足。
实施例四
详细介绍本发明实施例公开的一种广告投放系统。
参照图4,示出了本发明实施例中一种广告投放系统结构图。
所述一种广告投放系统,具体可以包括:
识别模块40,生成模块42,查询模块44,以及,投放模块46。
其中,所述生成模块42,具体可以包括:
提取子模块421,计算子模块422,以及,保存更新子模块423。
下面分别详细介绍各模块、各子模块的功能以及之间的关系。
识别模块40,用于接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息。
生成模块42,用于预先生成IP_UA兴趣组数据库。
所述生成模块42,具体可以包括:
提取子模块421,用于提取固定IP信息。
具体地,所述提取子模块421获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志;在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间;确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间;对IP信息与cookie_value信息均出现过的天数进行求和;提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之和大于第二阈值的IP信息,做为固定IP信息。
计算子模块422,用于根据所述固定IP信息计算IP_UA兴趣组信息。
具体地,所述计算子模块422提取与所述固定IP信息对应的用户代理信息和url信息。
并且,所述计算子模块422以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息,包括:所述计算子模块统计各url信息的权重值;获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量;根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量;根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
保存更新子模块423,用于保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
查询模块34,用于根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在生成模块预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息。
投放模块36,用于根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
参照图5,示出了本发明实施例中一种广告投放系统示意图。
优选的,所述一种广告投放系统,具体可以包括:
广告调度模块,用户识别模块,固定IP提取模块,固定IP_UA兴趣组累积模块,adsl兴趣组KV数据库,以及,IP_UA兴趣组KV数据库。
其中,所述固定IP提取模块和固定IP_UA兴趣组累积模块可以属于同一个集群环境。
固定IP提取模块提取出固定IP列表后,固定IP_UA兴趣组累积模块针对固定IP列表,生成IP_UA兴趣组数据,保存并更新至IP_UA兴趣组KV数据库中。
用户识别模块用于处理来自广告调度模块的ip和ua对应兴趣组数据的请求。用户识别模块在adsl兴趣组KV数据库中查询对应的兴趣组数据,如果查询得到,则用户识别模块将查询结果传输至广告调度模块;如果未查询到,则用户识别模块在IP_UA兴趣组KV数据库中查询对应的兴趣组数据,如果查询得到,则用户识别模块将查询结果传输至广告调度模块,如果未查询得到,则可以通过其他方式获取对应的兴趣组数据。关于获取对应兴趣组数据的其他方式,本发明实施例中不做具体描述。
综上所述,本发明实施例公开的一种广告投放系统,与背景技术相比具有以下优点:
首先,利用cookie信息的相对持久性,以cookie+ip作为关键词,通过相应算法统计得出固定IP信息,提高了对终端的识别范围,相应地也提高了广告投放的精准度。
其次,以IP+UA为粒度进行终端切分,更精准地区分终端个体。
再次,计算得到固定IP_UA兴趣组信息的过程,主要集中于离线计算,节省线上CPU资源。
进一步,当在ADSL兴趣组数据库中无法查询得到对应的兴趣组信息时,可以进一步在预先生成的IP_UA兴趣组数据库中查询,弥补了仅仅查询ADSL兴趣组数据库的不足。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明实施例所公开的一种广告投放方法和系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种广告投放方法,其特征在于,包括:
接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息;
根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;
当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;
当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息;
根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
2.根据权利要求1所述的方法,其特征在于,预先生成IP_UA兴趣组数据库,包括:
提取固定IP信息;
根据所述固定IP信息计算IP_UA兴趣组信息;
保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
3.根据权利要求2所述的方法,其特征在于,所述提取固定IP信息,包括:
获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志;
在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间;
确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间;
对IP信息与cookie_value信息均出现过的天数进行求和;
提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之和大于第二阈值的IP信息,做为固定IP信息。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述固定IP信息计算IP_UA兴趣组信息,包括:
提取与所述固定IP信息对应的用户代理信息和url信息;
以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息。
5.根据权利要求4所述的方法,其特征在于,所述以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息,包括:
统计各url信息的权重值;
获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量;
根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量;
根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
6.根据权利要求1所述的方法,其特征在于,所述当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息,包括:
当存在所述终端的ADSL信息时,根据ADSL信息和用户代理信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;
当不存在时,根据ADSL信息在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息。
7.一种广告投放系统,其特征在于,包括:
识别模块,用于接收广告投放请求后,对所述广告投放请求进行识别,得到所述广告投放请求针对的终端信息,所述终端信息包括IP信息和用户代理信息;
查询模块,用于根据所述IP信息在ADSL_IP数据库中查询是否存在所述终端的ADSL信息;当存在所述终端的ADSL信息时,在ADSL兴趣组数据库中查询是否存在所述终端的兴趣组信息;当不存在所述终端的ADSL信息或不存在所述终端的兴趣组信息时,根据所述IP信息和所述用户代理信息在生成模块预先生成的IP_UA兴趣组数据库中查询是否存在所述终端的兴趣组信息;
投放模块,用于根据在ADSL兴趣组数据库中或在IP_UA兴趣组数据库中查询到的所述终端的兴趣组信息进行广告投放。
8.根据权利要求7所述的系统,其特征在于,所述生成模块,包括:
提取子模块,用于提取固定IP信息;
计算子模块,用于根据所述固定IP信息计算IP_UA兴趣组信息;
保存更新子模块,用于保存并更新所述IP_UA兴趣组信息为IP_UA兴趣组数据库。
9.根据权利要求8所述的系统,其特征在于,
所述提取子模块获取域名信息和cookie信息均非空,且存在唯一识别cookie_id信息的终端访问日志;在所述终端访问日志中,提取具有关联关系的IP信息、cookie_value信息、IP信息与cookie_value信息均出现过的天数和对应的时间信息,所述对应的时间信息包括开始时间和结束时间;确定IP信息和cookie_value信息均相同的最小开始时间和最大结束时间;对IP信息与cookie_value信息均出现过的天数进行求和;提取满足最大结束时间减最小开始时间大于第一阈值,且IP信息与cookie_value信息均出现过的天数之
和大于第二阈值的IP信息,做为固定IP信息。
10.根据权利要求8或9所述的系统,其特征在于,
所述计算子模块提取与所述固定IP信息对应的用户代理信息和url信息;
所述计算子模块以固定IP信息和用户代理信息为粒度,根据url信息计算IP_UA兴趣组信息,包括:所述计算子模块统计各url信息的权重值;获取与每个终端对应的url信息,并根据计算得到每个终端对应的兴趣组类别k的当前权重值,其中,Vk为终端对应的兴趣组类别k的当前权重值,Uij为第j个url对应的兴趣组类别i的权重值,Ukj为第j个url对应的兴趣组类别k的权重值,m为每个终端对应的url数量,n为终端数量;根据计算得到每个终端对应的兴趣组类别k的最终权重值,其中,Rk为终端对应的兴趣组类别k的最终权重值,Vk为终端对应的兴趣组类别k的当前权重值,Hk为终端对应的兴趣组类别k的历史权重值,Hi为终端对应的兴趣组类别i的历史权重值,n为终端数量;根据所述每个终端对应的兴趣组类别k的最终权重值,确定IP_UA兴趣组信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310021918.XA CN103093377B (zh) | 2013-01-21 | 2013-01-21 | 一种广告投放方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310021918.XA CN103093377B (zh) | 2013-01-21 | 2013-01-21 | 一种广告投放方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103093377A true CN103093377A (zh) | 2013-05-08 |
CN103093377B CN103093377B (zh) | 2016-02-10 |
Family
ID=48205915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310021918.XA Active CN103093377B (zh) | 2013-01-21 | 2013-01-21 | 一种广告投放方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103093377B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103606094A (zh) * | 2013-11-06 | 2014-02-26 | 北京掌阔移动传媒科技有限公司 | 一种移动互联网广告监测方法和系统 |
CN104199849A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种广告投放的方法和装置 |
CN104199848A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种不同域下用户数据的关联方法和装置 |
CN106961492A (zh) * | 2017-04-21 | 2017-07-18 | 广东浪潮大数据研究有限公司 | 一种Linux系统下IP地址查重方法和装置 |
CN110012321A (zh) * | 2019-03-19 | 2019-07-12 | 星河视效文化传播(北京)有限公司 | 视频广告位的投放方法和装置 |
CN111861582A (zh) * | 2020-07-30 | 2020-10-30 | 成都新潮传媒集团有限公司 | 一种广告刊播拍照方案的生成方法、装置及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7376714B1 (en) * | 2003-04-02 | 2008-05-20 | Gerken David A | System and method for selectively acquiring and targeting online advertising based on user IP address |
CN102333092A (zh) * | 2011-09-30 | 2012-01-25 | 北京亿赞普网络技术有限公司 | 一种网络用户识别的方法及其应用服务器 |
CN102609862A (zh) * | 2012-02-02 | 2012-07-25 | 北京亿赞普网络技术有限公司 | 一种获取广告投放参数的方法和装置 |
-
2013
- 2013-01-21 CN CN201310021918.XA patent/CN103093377B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7376714B1 (en) * | 2003-04-02 | 2008-05-20 | Gerken David A | System and method for selectively acquiring and targeting online advertising based on user IP address |
CN102333092A (zh) * | 2011-09-30 | 2012-01-25 | 北京亿赞普网络技术有限公司 | 一种网络用户识别的方法及其应用服务器 |
CN102609862A (zh) * | 2012-02-02 | 2012-07-25 | 北京亿赞普网络技术有限公司 | 一种获取广告投放参数的方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103606094A (zh) * | 2013-11-06 | 2014-02-26 | 北京掌阔移动传媒科技有限公司 | 一种移动互联网广告监测方法和系统 |
CN104199849A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种广告投放的方法和装置 |
CN104199848A (zh) * | 2014-08-08 | 2014-12-10 | 亿赞普(北京)科技有限公司 | 一种不同域下用户数据的关联方法和装置 |
CN104199848B (zh) * | 2014-08-08 | 2017-10-24 | 亿赞普(北京)科技有限公司 | 一种不同域下用户数据的关联方法和装置 |
CN106961492A (zh) * | 2017-04-21 | 2017-07-18 | 广东浪潮大数据研究有限公司 | 一种Linux系统下IP地址查重方法和装置 |
CN110012321A (zh) * | 2019-03-19 | 2019-07-12 | 星河视效文化传播(北京)有限公司 | 视频广告位的投放方法和装置 |
CN111861582A (zh) * | 2020-07-30 | 2020-10-30 | 成都新潮传媒集团有限公司 | 一种广告刊播拍照方案的生成方法、装置及计算机设备 |
CN111861582B (zh) * | 2020-07-30 | 2022-05-06 | 成都新潮传媒集团有限公司 | 一种广告刊播拍照方案的生成方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103093377B (zh) | 2016-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789311B2 (en) | Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium | |
CN103093377B (zh) | 一种广告投放方法和系统 | |
US10664872B2 (en) | Systems and methods for generating network intelligence through real-time analytics | |
US8601004B1 (en) | System and method for targeting information items based on popularities of the information items | |
CN103886047B (zh) | 面向流式数据的分布式在线推荐方法 | |
CN111459986B (zh) | 数据计算系统及方法 | |
US20130185429A1 (en) | Processing Store Visiting Data | |
CN102957712A (zh) | 网站资源加载方法和系统 | |
CN104394118A (zh) | 一种用户身份识别方法及系统 | |
CN102426610A (zh) | 微博搜索排名方法及微博搜索引擎 | |
JP2014182437A (ja) | 広告抽出装置、広告抽出方法及び広告抽出プログラム | |
US9288617B1 (en) | Mobile media communications system | |
CN103248677B (zh) | 互联网行为分析系统及其工作方法 | |
CN107590691B (zh) | 一种信息发布方法及装置、存储介质、终端 | |
CN104298782B (zh) | 互联网用户主动访问行为轨迹的分析方法 | |
CN103338260A (zh) | 网络审计中url日志的分布式分析系统及分析方法 | |
CN103414608A (zh) | 快速的web流量采集统计系统和方法 | |
CN103729479A (zh) | 基于分布式文件存储的网站页面内容统计的方法和系统 | |
CN105871585A (zh) | 终端关联方法及装置 | |
CN106709805B (zh) | 一种用户收益数据获取方法及系统 | |
CN108322495A (zh) | 资源访问请求的处理方法、装置和系统 | |
CN105227386B (zh) | 用于分群体统计在线用户数的方法、装置及系统 | |
CN104202418B (zh) | 为内容提供商推荐商业的内容分发网络的方法和系统 | |
CN105701224A (zh) | 一种基于大数据的证券资讯个性化服务系统 | |
CN106789147B (zh) | 一种流量分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: No. a9-9010, 1st floor, No. 28, information road, Haidian District, Beijing Patentee after: Izp (China) Network Technology Co.,Ltd. Address before: 100081 1607, building 2, yard a 18, Zhongguancun South Street, Haidian District, Beijing Patentee before: BEIJING IZP NETWORK TECHNOLOGY Co.,Ltd. |