CN101383034B - 一种广告统计和投放的方法及系统 - Google Patents
一种广告统计和投放的方法及系统 Download PDFInfo
- Publication number
- CN101383034B CN101383034B CN200810166306.9A CN200810166306A CN101383034B CN 101383034 B CN101383034 B CN 101383034B CN 200810166306 A CN200810166306 A CN 200810166306A CN 101383034 B CN101383034 B CN 101383034B
- Authority
- CN
- China
- Prior art keywords
- advertisement
- user
- overlay capacity
- module
- advertistics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及基于万维网的广告统计和投放的方法及系统,尤其涉及一种采用布隆过滤器对唯一性访问用户的覆盖量进行统计的广告统计和投放的方法及系统。本发明采用布隆过滤器存储访问广告的具有唯一性的用户数据,能够获取实时的覆盖信息,使得广告主可以实时获取覆盖量的信息,实现按照覆盖量投放的目的,用最少的时间达到最佳投放效果。
Description
技术领域
本发明涉及网络广告的统计和投放技术,尤其涉及一种利用布隆过滤器对用户标识进行过滤从而得到针对所投放广告的较为精确的覆盖量,从而根据覆盖量执行相应的投放策略。
背景技术
随着Internet的发展,网络广告越来越多的被广大网民所接受,广告主在一个网站上投放广告时会根据广告的用户覆盖情况调整广告的投放策略,以获得投入与收益的最佳结合点,为了获得广告的投放覆盖量,通常做法是,将用户点击广告的数据以记录的方式存储于数据库中,需要计算覆盖数据的时候,对记录的用户标识信息进行外排序处理,统计出访问所投放广告的用户的数量,由于同一用户可能多次访问所投放的广告,所以统计的数字通常不很准确,因此,通常需要借助数据库的功能对用户数据进行过滤,,另外,随着用户数量的增加,对访问数据的统计和过滤需要耗费很大的服务器资源,因此,通常需要借助大型统计分析系统,如数据仓库系统,对用户数据进行发掘分析。但,现有的处理方式,数据的实时性较差,只有在需要计算覆盖数据的时候才进行统计分析操作,或者需等待新一轮的数据挖掘统计周期结束后才能得到结果,因此,无法做到实时的按覆盖量调整广告的投放策略。
发明内容
有鉴于此,本发明的目的在于提供一种广告统计和投放的方法及系统,能在获得广告投放覆盖量的过程中,达到实时获取覆盖量数据,并提高统计数字精度、减少资源耗费的目的。
为实现上述发明目的,本发明的主要技术方案为:
一种广告统计和投放的方法,为用户分配唯一标识,设定广告投放的覆盖量及投放策略;该方法还包括:
A、使用布隆过滤器建立用于判断用户是否已访问过广告的位示图,采用N个相互独立的哈希函数对所述用户标识进行哈希计算,将N个所得值作为所述位示图的下标;根据位示图判断用户是否已经访问过所述广告,若否,则将所述广告的覆盖量的统计值加1,执行步骤B;
B、判断是否达到所述广告投放的覆盖量,若达到则执行所述投放策略。
基于上述技术方案,进一步地,步骤A中,所述根据位示图判断用户是否访问过投放的广告为:
判断所述位示图中N个对应位的值是否都为1,若是,则用户已经访问过所述广告,所述广告的覆盖量统计值不加1,否则用户未访问过所述广告;
将所述位示图中N个对应位中值不为1的值置为1。
进一步地,所述N的值为8;所述广告的投放策略指当所述广告的覆盖量达到设定值时停止广告的投放。
本发明还提供了一种广告统计和投放的系统,包括:
广告发布系统,用于为用户提供广告的访问环境;
广告统计模块,用于对用户访问广告的覆盖量进行统计;
所述广告统计模块进一步包括:位示图,用于以位图形式记录用户访问标志;布隆过滤器,用于根据用户标识对广告访问用户进行单一性过滤;所述布隆过滤器包含N个哈希计算模块,每个哈希计算模块对所述用户标识进行计算并负责更新所述位示图中对应的用户访问标志位,N个哈希计算模块计算的结果都表示同一用户访问过广告时,所述布隆过滤器指令所述覆盖量存储单元将该广告的覆盖量值加1;
广告管理模块,用于根据广告的覆盖量执行投放策略;
所述广告发布系统为所述广告统计模块提供用户访问信息,所述广告统计模块根据所述用户访问信息计算出广告覆盖量,并将其传送给所述广告管理模块,所述广告管理模块根据投放策略对所述广告发布系统进行控制。
进一步地,所述广告发布系统包括:
广告服务器,用于为用户提供广告内容信息;
WEB服务器,用于为用户提供带有广告链接的网页;
所述广告服务器将获取的用户标识发送给所述广告统计模块,并接受所述广告管理模块的控制。
进一步地,所述广告统计模块还包括:覆盖量存储单元,用于存储广告的覆盖量统计数据;
所述广告发布系统将用户标识传送给所述布隆过滤器,所述布隆过滤器实时更新所述位示图中的用户访问标志及所述覆盖量存储单元中的覆盖量统计数据,所述广告管理模块从所述覆盖量存储单元中读取广告的覆盖量统计数据。
本发明中,广告统计模块实时的过滤和更新用户的访问记录,并实时的更新针对每一个投放广告的用户覆盖量信息,通过获取实时的覆盖量信息,使得广告主可以实现按照用户覆盖量投放广告的目的,用最少的时间达到最佳投放效果。由于投放时间和覆盖量构成的函数关系呈现为指数递减的曲线,通过设置合理的覆盖量,可以使广告在投放中获取最优的投放成本。对于广告投放时间与覆盖量的曲线如图3,横坐标表示投放时间(单位:天),纵坐标表示覆盖量(单位:千万人)。从曲线中可以看到随着投放时间的增加,覆盖量趋于稳定,最终会稳定在该媒体用户人数附近,比如下图中的5千万人。可以看出,随着投放时间的增长,曲线趋于平缓,这意味着,提高单位覆盖所需的时间变成,投放成本变高。例如从0天到1天,投放1天,达到覆盖2.5千万人,投放第2天至第3天,投放2天,覆盖至增加了500万人,越往后,提高单位覆盖所需要的成本越大。根据覆盖曲线,可以事先确定一个投放目标,比如达到3千万人的覆盖,则达到该覆盖的时候,系统自动停止投放。使得广告主的投放集中在最有效的时间段内,避免价值不高的投放,节约广告主的投放成本。
附图说明
图1为本发明方法流程图;
图2为本发明系统逻辑结构图;
图3为覆盖量与投放时间的函数曲线图。
具体实施方式
下面通过具体实施例和附图对本发明做进一步详细说明。
图1为本发明的方法流程图,各步骤的详细描述如下:
A、为用户分配唯一标识,设定广告投放的覆盖量及投放策略;
在执行本发明所述步骤之前需为每一个访问网站的用户分配一个唯一的用户标识,通常网站为了为用户提供个性化的服务都会为用户分配一个唯一性的标识用来区分不同的用户,若用户在网站没有注册,则用户可能没有唯一性的用户标识,本发明通过如下方式来区分独立的用户:
在用户访问网站的时候,通过HTTP头判定用户的COOKIE中是否存在用户唯一的用户标识,如果不存在则在COOKIE中设置一个16位的用户唯一标识,如U标识=946e50a1ab305dfc。这样保证访问网站的的每一个用户都会有一个唯一用户标识,从而区分独立用户。
B、使用布隆过滤器判断用户是否已经访问过所述广告,若否,则将所述广告的覆盖量的统计值加1,执行步骤C;
对于广告覆盖量的判定通过布隆过滤器来计算,具体步骤如下。
B1、建立用于判断用户是否已访问过广告的位示图;
在内存中建立一个针对指定广告的拥有m比特位的位图,每一比特位都作为判断某一用户是否访问过指定广告的判断标识。
B2、采用N个相互独立的哈希函数对所述用户标识进行哈希计算,并将N个所得值作为所述位示图的下标,判断所述位示图中N个对应位的值是否都为1,若是,则所述广告的覆盖量统计值不加1,若否则将所述广告的覆盖量统计值加1;
B3、将所述位示图中N个对应位中值不为1的置为1。
本发明使用N个相互独立的哈希函数对用户唯一标识进行N次哈希计算,本发明一具体实施例中N取8,设N个哈希函数为Fi,i=0,1,2,...7,每次哈希计算Fi的值为Xi(0<=Xi<=m),将哈希计算所得值Xi作为下标,判断在位示图中Xi对应的标志位是否为1。
根据步骤B2中的计数器判断,如果N次计算Xi对应位中的值不全为1,则认为该用户没有访问过指定的广告,该用户是第一次看到该广告的用户,因此将该广告的覆盖量统计值加1;如果N次计算Xi对应位中的值全为1,则判定该用户访问过指定的广告,则所述广告的覆盖量的统计值不加1。
在更新完广告的覆盖量的统计值后,还需对本轮N次计算Xi对应位中不为1的值进行置1操作,以表明此用户已经统计过,以免下次重复统计。
根据经验采用8重Hash的过滤器,在填充率80%以内可以保证冲突率小于万分之一,这样对于有一个5000万覆盖量的广告,建立位示图大约需要占用69M(I/0.8*50000000)内存空间。
下面例举一个判定唯一用户标识的例子,当前位示图如下:
1 | 1 | 0 | 1 | 0 | 0 | 0 | 1 |
进行某用户标识的第一次哈希计算的结果为2,判断位示图第2位为0则,设置该位为1并且判定该用户标识是一个新的用户标识,判定后位示图如下
1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 |
当另外一个用户标识进行了8次哈希计算,每次哈希计算的结果都在位示图中存在(为1),则说明该用户标识已经存在。
C、判断是否达到所述广告投放的覆盖量,若达到则执行所述投放策略。
此步骤中所述的投放策略可以根据实际情况设定,如当投放量达到一定数值时停止投放指定广告,或修改投放的时间和次数等。
图2为本发明的系统逻辑结构图,本发明所述系统包括广告发布系统、广告统计模块、广告管理模块三大部分。广告发布系统用于为用户提供广告的访问环境;广告统计模块用于对用户访问广告的覆盖量进行统计;广告管理模块用于根据广告的覆盖量执行投放策略。
广告发布系统进一步包括:广告服务器、WEB服务器。广告服务器用于为用户提供广告内容信息;WEB服务器用于为用户提供带有广告链接的网页。
广告统计模块进一步包括:位示图、布隆过滤器、覆盖量存储单元。位示图用于以位图形式记录用户访问标志;布隆过滤器用于根据用户标识对广告访问用户进行单一性过滤;覆盖量存储单元用于存储广告的覆盖量统计数据。布隆过滤器进一步包含N个哈希计算模块,每一哈希计算模块对所述用户标识进行计算并负责更新所述位示图中对应的用户访问标志位,当N个哈希计算模块计算的结果都表示同一用户访问过广告时,则所述布隆过滤器指令所述覆盖量存储单元将该广告的覆盖量值加1。
为了更清楚地说明系统各部分之间的协作关系,在图2中用数字对用户访问广告及系统进行判断的过程进行了标注,以下对每一步骤进行说明:
步骤1、用户通过浏览器登陆网站;
步骤2、用户点击了网站上发布的广告后,Web服务器将广告的链接地址反馈给用户浏览器;
步骤3、用户浏览器根据Web服务器反馈的广告的链接地址访问广告服务器;
对于一个广告位会固定在某一台广告服务器上,多个广告位可固定在一台服务器上。
步骤4、广告服务器将广告数据传送给客户浏览器;
步骤5、广告服务器将用户标识传送给广告统计模块;
根据情况,广告统计模块可与广告服务器部署在同一台主机上。布隆过滤器对用户标识进行过滤,实时更新位示图中的用户访问标志及覆盖量存储单元中的覆盖量统计数据。由于广告统计模块是实时的对用户的覆盖量的统计数据进行更新,因此,广告管理模块可以实时的读取最新的统计数据。
步骤6、广告管理模块从广告管理模块中的覆盖量存储单元中读取广告的覆盖量统计数据。
步骤7、广告管理模块获得覆盖量统计数据后根据事先设定的广告投放策略对广告服务器的广告投放实施控制。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种广告统计和投放的方法,其特征在于,为用户分配唯一的用户标识,并设定广告投放的覆盖量及投放策略;该方法还包括:
A、使用布隆过滤器建立用于判断用户是否已访问过广告的位示图,采用N个相互独立的哈希函数对所述用户标识进行哈希计算,将N个所得值作为所述位示图的下标,判断所述位示图中N个对应位的值是否都为1,若是,则用户已经访问过所述广告,所述广告的覆盖量统计值不加1;若否,则用户未访问过所述广告,将所述广告的覆盖量的统计值加1;
将所述位示图中N个对应位中值不为1的值置为1;
对于用户未访问过所述广告的,执行步骤B;
B、判断当前广告覆盖量的统计值是否达到所述广告投放的覆盖量的设定值,若达到则执行所述投放策略。
2.根据权利要求1所述的方法,其特征在于,所述N的值为8;所述广告的投放策略指当所述广告的覆盖量达到设定值时停止广告的投放。
3.一种广告统计和投放的系统,其特征在于,包括:
广告发布系统,用于为用户提供广告的访问环境;
广告统计模块,用于对用户访问广告的覆盖量进行统计;
所述广告统计模块进一步包括:位示图,用于以位图形式记录用户访问标志;布隆过滤器,用于根据用户标识对广告访问用户进行单一性过滤;所述布隆过滤器包含N个哈希计算模块,每个哈希计算模块对所述用户标识进行计算并负责更新所述位示图中对应的用户访问标志位,N个哈希计算模块计算的结果都表示同一用户访问过广告时,所述布隆过滤器指令所述广告统计模块中包括的覆盖量存储单元将该广告的覆盖量值加1;
广告管理模块,用于根据广告的覆盖量执行投放策略;
所述广告发布系统为所述广告统计模块提供用户访问信息,所述广告统计模块根据所述用户访问信息计算出广告覆盖量,并将其传送给所述广告管理模块,所述广告管理模块根据投放策略对所述广告发布系统进行控制。
4.根据权利要求3所述的系统,其特征在于,所述广告发布系统包括:
广告服务器,用于为用户提供广告内容信息;
WEB服务器,用于为用户提供带有广告链接的网页;
所述广告服务器将获取的用户标识发送给所述广告统计模块,并接受所述广告管理模块的控制。
5.根据权利要求4所述的系统,其特征在于,所述覆盖量存储单元,还用于存储广告的覆盖量统计数据;
所述广告发布系统将用户标识传送给所述布隆过滤器,所述布隆过滤器实时更新所述位示图中的用户访问标志及所述覆盖量存储单元中的覆盖量统计数据,所述广告管理模块从所述覆盖量存储单元中读取广告的覆盖量统计数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810166306.9A CN101383034B (zh) | 2008-09-18 | 2008-09-18 | 一种广告统计和投放的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810166306.9A CN101383034B (zh) | 2008-09-18 | 2008-09-18 | 一种广告统计和投放的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101383034A CN101383034A (zh) | 2009-03-11 |
CN101383034B true CN101383034B (zh) | 2016-05-18 |
Family
ID=40462862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810166306.9A Active CN101383034B (zh) | 2008-09-18 | 2008-09-18 | 一种广告统计和投放的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101383034B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106970930A (zh) * | 2016-10-10 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 消息发送确定方法及装置、数据表创建方法及装置 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020081B (zh) * | 2011-09-23 | 2016-03-09 | 阿里巴巴集团控股有限公司 | 站外投放关键词方法和系统 |
CN102542438B (zh) * | 2011-12-31 | 2015-01-28 | 北京亿赞普网络技术有限公司 | 网络广告投放排期系统和排期方法 |
CN102708495B (zh) * | 2012-01-06 | 2016-04-20 | 合一网络技术(北京)有限公司 | 一种广告投放频次控制方法及装置 |
CN103295150A (zh) * | 2013-05-20 | 2013-09-11 | 厦门告之告信息技术有限公司 | 一种精确量化及准确统计投放效果的广告发布系统及方法 |
CN103744963B (zh) * | 2014-01-06 | 2018-05-18 | 北京国双科技有限公司 | 目标页面转化的处理方法和装置 |
CN106296236B (zh) * | 2015-05-18 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 信息处理方法及信息投放系统 |
CN104933177B (zh) * | 2015-06-29 | 2018-04-13 | 无线生活(杭州)信息科技有限公司 | 一种信息推送方法及装置 |
CN106339897B (zh) * | 2016-08-18 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 确定投放策略的方法及装置 |
CN107870925B (zh) * | 2016-09-26 | 2021-08-20 | 华为技术有限公司 | 一种字符串过滤方法和相关装置 |
CN109472637A (zh) * | 2018-10-18 | 2019-03-15 | 微梦创科网络科技(中国)有限公司 | 一种用户定投广告优化方法与装置 |
CN110781464A (zh) * | 2019-10-18 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种唯一性校验方法、装置、设备及可读存储介质 |
CN110851758B (zh) * | 2019-10-30 | 2024-02-06 | 深圳前海微众银行股份有限公司 | 一种网页访客数量统计方法及装置 |
CN111080362A (zh) * | 2019-12-17 | 2020-04-28 | 上海新数网络科技股份有限公司 | 广告监测系统及方法 |
CN113420218A (zh) * | 2021-06-30 | 2021-09-21 | 北京百度网讯科技有限公司 | 信息匹配方法、装置、设备、存储介质及计算机程序产品 |
CN116258524B (zh) * | 2023-03-14 | 2024-02-02 | 深圳乐信软件技术有限公司 | 基于布隆过滤器的广告投放方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1737799A (zh) * | 2005-09-09 | 2006-02-22 | 湖南大学 | 一种基于分档BloomFilter结构的查询方法 |
CN101051952A (zh) * | 2007-04-18 | 2007-10-10 | 东南大学 | 高速多链路逻辑信道环境下的自适应抽样流测量方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6920477B2 (en) * | 2001-04-06 | 2005-07-19 | President And Fellows Of Harvard College | Distributed, compressed Bloom filter Web cache server |
US7602785B2 (en) * | 2004-02-09 | 2009-10-13 | Washington University | Method and system for performing longest prefix matching for network address lookup using bloom filters |
-
2008
- 2008-09-18 CN CN200810166306.9A patent/CN101383034B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1737799A (zh) * | 2005-09-09 | 2006-02-22 | 湖南大学 | 一种基于分档BloomFilter结构的查询方法 |
CN101051952A (zh) * | 2007-04-18 | 2007-10-10 | 东南大学 | 高速多链路逻辑信道环境下的自适应抽样流测量方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106970930A (zh) * | 2016-10-10 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 消息发送确定方法及装置、数据表创建方法及装置 |
CN106970930B (zh) * | 2016-10-10 | 2021-01-05 | 创新先进技术有限公司 | 消息发送确定方法及装置、数据表创建方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101383034A (zh) | 2009-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101383034B (zh) | 一种广告统计和投放的方法及系统 | |
CN103295147B (zh) | 投放广告的方法、装置和系统 | |
WO2020248508A1 (zh) | 广告渠道的评估方法、装置、设备和存储介质 | |
US9892420B2 (en) | System and method for managing message campaign data | |
CN100499512C (zh) | 互联网数据信息点击量的统计方法和装置 | |
CN104065565B (zh) | 推送消息的方法、服务器、客户端装置和系统 | |
CN102104635B (zh) | 一种更新互联网协议ip地址库的方法和装置 | |
CN106651411A (zh) | 广告推广策略的调整方法及装置 | |
CN103036977B (zh) | 基于内容分发网络的业务推送方法及推送系统 | |
CN103729778A (zh) | 全渠道广告精准投放系统及其方法 | |
Pardey et al. | Costing the conservation of genetic resources: CIMMYT's ex situ maize and wheat collection | |
CN102592235A (zh) | 一种互联网广告投放系统 | |
CN101025815A (zh) | 利用个人网站的广告系统及其获利方法 | |
CN101685521A (zh) | 在网页中展现广告的方法及系统 | |
CN102354315A (zh) | 一种网址导航页面生成方法和装置 | |
CN102800005A (zh) | 网络广告投放方法与装置 | |
CN103731284A (zh) | 关联多个网络帐号的方法和系统 | |
CN108112038B (zh) | 一种控制访问流量的方法及装置 | |
US20160357753A1 (en) | Reader application system utilizing article scoring and clustering | |
US10084854B2 (en) | Response latency reduction in fixed allocation content selection infrastructure | |
CN103207882A (zh) | 店铺访问数据处理方法及系统 | |
CN102541892A (zh) | 记录和分析用户行为特征的方法 | |
CN106777037A (zh) | 一种生成运营平台一体化报表的方法 | |
CN116342192A (zh) | 一种基于大数据的互联网汽车行业广告投放效果监控方法 | |
CN111858278A (zh) | 基于大数据处理的日志分析方法、系统及可读存储装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
DD01 | Delivery of document by public notice |
Addressee: Liu Yang Document name: Notification of Passing Examination on Formalities |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |