CN112188291A - 广告位异常的识别方法和装置 - Google Patents
广告位异常的识别方法和装置 Download PDFInfo
- Publication number
- CN112188291A CN112188291A CN202011017835.XA CN202011017835A CN112188291A CN 112188291 A CN112188291 A CN 112188291A CN 202011017835 A CN202011017835 A CN 202011017835A CN 112188291 A CN112188291 A CN 112188291A
- Authority
- CN
- China
- Prior art keywords
- advertisement
- target
- internet protocol
- abnormal
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44204—Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8352—Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Multimedia (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种广告位异常的识别方法和装置。其中,该方法包括:获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址;在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,将目标广告的异常访问次数增加1,其中,设备标识数据库中记录有真实的设备的设备标识,黑名单地址数据库中记录有异常的因特网协议地址;获取广告位的总访问次数并获取目标广告的异常访问次数;在目标广告的异常访问次数与总访问次数的比值大于第一阈值的情况下,确定目标广告所在的广告位异常。本发明解决了广告位是否异常的识别准确性较低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种广告位异常的识别方法和装置。
背景技术
互联网广告中,异常流量及数据造假是数字营销行业的顽疾,无论新旧媒体,繁荣背后均暗藏着复杂的造假链条,异常流量不仅直接损害广告主利益,还制约了行业的良性发展。
为了避免异常流量及数据造假的情况,相关技术中提出识别广告位是否异常来判断是否存在数据造假的问题。然而,相关技术中的识别广告位异常的准确性低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种广告位异常的识别方法和装置,以至少解决广告位是否异常的识别准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种广告位异常的识别方法,包括:获取访问广告位上的目标广告的目标设备的设备唯一标识与上述目标设备使用的因特网协议地址;在上述设备唯一标识不属于设备标识数据库,或者上述因特网协议地址属于黑名单地址数据库的情况下,将上述目标广告的异常访问次数增加1,其中,上述设备标识数据库中记录有真实的设备的设备标识,上述黑名单地址数据库中记录有异常的因特网协议地址;获取上述广告位的总访问次数并获取上述目标广告的异常访问次数;在上述目标广告的异常访问次数与上述总访问次数的比值大于第一阈值的情况下,确定上述目标广告所在的上述广告位异常。
根据本发明实施例的另一方面,还提供了一种广告位异常的识别装置,包括:第一获取单元,用于获取访问广告位上的目标广告的目标设备的设备唯一标识与上述目标设备使用的因特网协议地址;第一处理单元,用于在上述设备唯一标识不属于设备标识数据库,或者上述因特网协议地址属于黑名单地址数据库的情况下,将上述目标广告的异常访问次数增加1,其中,上述设备标识数据库中记录有真实的设备的设备标识,上述黑名单地址数据库中记录有异常的因特网协议地址;第二获取单元,用于获取上述广告位的总访问次数并获取上述目标广告的异常访问次数;第一确定单元,用于在上述目标广告的异常访问次数与上述总访问次数的比值大于第一阈值的情况下,确定上述目标广告所在的上述广告位异常。
在本发明实施例中,采用了获取访问广告位上的目标广告的目标设备的设备唯一标识与上述目标设备使用的因特网协议地址;在上述设备唯一标识不属于设备标识数据库,或者上述因特网协议地址属于黑名单地址数据库的情况下,将上述目标广告的异常访问次数增加1,其中,上述设备标识数据库中记录有真实的设备的设备标识,上述黑名单地址数据库中记录有异常的因特网协议地址;获取上述广告位的总访问次数并获取上述目标广告的异常访问次数;在上述目标广告的异常访问次数与上述总访问次数的比值大于第一阈值的情况下,确定上述目标广告所在的上述广告位异常的方法,从而可以根据访问广告位的目标广告的目标设备的设备唯一标识与目标设备的因特网协议地址来确定广告位是否异常,实现了提高确定广告位是否异常的准确性的效果,进而解决了广告位是否异常的识别准确性较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的广告位异常的识别方法的流程示意图;
图2是根据本发明实施例的一种可选的广告位异常的识别方法的广告显示示意图;
图3是根据本发明实施例的另一种可选的广告位异常的识别方法的广告显示示意图;
图4是根据本发明实施例的又一种可选的广告位异常的识别方法的广告显示示意图;
图5是根据本发明实施例的又一种可选的广告位异常的识别方法的广告显示示意图;
图6是根据本发明实施例的一种可选的广告位异常识别装置的示意图;
图7是根据本发明实施例的另一种可选的广告位异常识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种广告位异常的识别方法,可选地,作为一种可选的实施方式,如图1所示,上述广告位异常的识别方法包括:
S102,获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址;
S104,在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,将目标广告的异常访问次数增加1,其中,设备标识数据库中记录有真实的设备的设备标识,黑名单地址数据库中记录有异常的因特网协议地址;
S106,获取广告位的总访问次数并获取目标广告的异常访问次数;
S108,在目标广告的异常访问次数与总访问次数的比值大于第一阈值的情况下,确定目标广告所在的广告位异常。
可选地,上述广告位异常的识别方法可以应用在识别广告位是否异常,例如识别广告位的流量数据是否造假的过程中。如在广告位上发布广告后,统计访问该广告的流量数据,本申请可以识别统计的流量数据是否造假,确定出该广告位是否正常。如果该广告位上的广告的访问数据造假,则说明该广告位是异常的,不能正常投放广告。本申请通过获取访问广告位上的广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址来确定该单次访问广告是否为一次异常访问,获取广告位的总访问次数并获取目标广告的异常访问次数,从而确定出该广告位是否异常。
可选的,本申请实施例中,一个展示界面上可以展示多个广告位,每一个广告位中可以展示一条广告。多个广告位可以同时展示,也可以在不同时间段交替显示。不同的广告位可以相邻,也可以不相邻。例如,如图2所示,图2中的广告位202与广告位204相邻展示。如图3所示,图3中的广告位302与广告位304在不同时间段交替展示。在0-10s,使用广告位302展示广告1,在10-20s,使用广告位304展示广告2。
可选的,本申请中的对广告位中的目标广告的访问可以为当在终端(目标设备)的显示界面上显示一次目标广告,则认为终端访问了该目标广告。或者,如果终端在显示目标广告时,点击了目标广告,查看了目标广告的内容或者跳转了链接,则认为访问了一次目标广告。例如,如图4所示,图4中,汽车广告与洗衣粉广告在两个广告位中展示,用户查看到当前展示广告的页面则认为终端在使用过程中,显示了一次广告,则认为终端访问了一次广告。两个广告位的总展示次数分别增加1。而图5中,终端显示广告之后,需要点击广告跳转到广告界面,则认为终端访问了一次广告。当然,广告也可能是使用虚拟机进行的虚假访问,例如,一个虚拟机通过自动机刷访问量,一个广告位的广告一秒钟被自动机刷访问量,访问了1000次。本申请实施例可以通过识别广告位的广告的访问是否为异常访问,以及根据总访问次数与异常访问次数来确定一个广告位的广告的访问数据是否为自动机刷出的虚假数据,进一步确定该广告位是否异常。
可选的,本申请实施例中可以在服务器上应用上述广告位异常的识别方法。对于一个广告位,其中设置有一个或者多个广告,服务器可以检测到终端(真实的目标设备或者虚假的目标设备)是否访问服务器以及是否有访问广告位中的广告。服务器可以将终端访问一次广告位中的广告记为该广告位的一次被访问次数。当然,为了判断单次访问的终端是否为虚假终端,可以获取终端的设备唯一标识与终端使用的因特网协议地址,在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,认为该终端为虚假终端,将目标广告的异常访问次数增加1
可选的,对于一个展示区域有多个广告位轮番显示的情况下,每一个广告位显示一个广告,每一个广告对应一个广告位的标识,不同的广告对应广告位的不同的标识。也就是说,虽然一个展示区域可以轮番展示不同的广告位,进而展示不同的广告,但是,由于广告对应的广告位的标识是不同的,因此即使广告在不同的时间段在同一个展示区域展示,在被访问的情况下,仍然可以根据广告位的标识计算广告位的总访问次数。如在0-10秒,在一个展示区域中展示的广告位1,广告位1中显示有广告1,如果在0-10秒内广告1被访问,则广告位1的总访问次数加1。而10-20秒,在相同的展示区域展示的广告位2,广告位2中展示的广告2,此时,广告2被访问的情况下,将广告位2的总访问量次数加1。。而异常访问次数根据判断出的该次访问是否为异常访问来确定是否进行记录。如果本次访问为正常访问,则不增加异常访问次数,如果本次访问为异常访问,则需要增加异常访问次数。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的设备唯一标识。设备唯一标识可以唯一性的代表一个终端。在获取到设备唯一标识后,可以将设备唯一标识与设备标识数据库中的所有标识进行比对。设备标识数据库中记录有真实的设备的设备标识。如果设备唯一标识与设备标识数据库中的某一个设备标识相同,则说明该次访问中的终端是一个真实的设备。如果设备标识数据库中的任何一个设备标识都与上述设备唯一标识不同,则说明本次访问的终端为虚假设备,有可能为自动机模拟的设备。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的因特网协议地址,因特网协议地址是该终端访问广告所使用的因特网协议地址。可以将该因特网协议地址与黑名单地址数据库进行比对,黑名单地址数据库中记录有异常的因特网协议地址。如果该词访问的终端使用的因特网协议地址与黑名单地址数据库中的一个地址相同,则说明该终端使用的因特网协议地址是一个黑名单中的地址,该次访问为一次虚假访问。
可选的,本申请实施例中的设备标识数据库可以为根据一段时间的历史数据确定出的数据库。例如,获取在预定时长内访问目标广告的所有的设备的设备标识,例如一个广告在一分钟内被访问了100次,访问100次的100个终端对应100个设备标识。100个设备标识中有相同的设备标识或者不同的设备标识。如果一个设备标识在该100次访问中被使用了N次,N为1-100中的一个数,则说明一个设备标识对应的终端在一分钟内访问了N次广告。N如果大于或者等于第一数量(例如第一数量为10)则说明该终端为虚假终端的可能性很高,该终端的设备标识不能作为设备标识数据库中的标识。如果一个终端标识被使用的次数小于第一数量,则该终端为真实终端的可能性高,该终端的标识可以作为设备标识数据库中的标识。使用该方法,可以使用过去一段时间的数据来确定出设备标识数据库。即使一个终端从未被使用过,但是该终端的设备标识如果被使用后,发生刷广告次数的情况,则该终端的设备标识不会加入到设备标识数据库中。后续的判断过程仍然准确。
上述示例为本申请确定设备标识数据库的一个举例,本申请对确定设备标识数据库的方法不做限制。
可选的,本申请实施例中的黑名单地址数据库可以为根据一段时间的历史数据确定出的数据库。例如,获取在预定时长内访问目标广告的所有的设备的因特网协议地址,例如一个广告在一分钟内被访问了100次,访问100次的100个终端对应100个因特网协议地址。100个因特网协议地址中有相同的因特网协议地址或者不同的因特网协议地址。如果一个因特网协议地址在该100次访问中被使用了N次,N为1-100中的一个数,则说明一个因特网协议地址对应的终端在一分钟内访问了N次广告。N如果大于或者等于第一数量(例如第一数量为10)则说明该终端为虚假终端的可能性很高,该因特网协议地址需要加入黑名单地址数据库中。如果一个因特网协议地址被使用的次数小于第一数量,则该因特网协议地址对应的终端为真实终端的可能性高,该因特网协议地址可以作为黑名单地址数据库中的地址。使用该方法,可以使用过去一段时间的数据来确定出黑名单地址数据库。即使一个地址从未被使用过,但是该地址如果被使用后,发生刷广告次数的情况,则该地址会加入到黑名单地址数据库中。后续的判断过程仍然准确。
上述示例为本申请确定黑名单地址数据库的一个举例,本申请对确定黑名单地址数据库的方法不做限制。
而如果设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库,则可以进行进一步的判断,判断一次对广告的访问为异常访问的可能性。
本申请中如果在确定出一个广告位异常的情况下,可以统计出该广告位所投放的广告中异常的异常访问次数,然后,由系统控制该广告位补偿投放次数。例如,一个广告位投放了10000次广告,其中,3000次广告的投放是异常的投放,因此,可以由该广告位再次投放3000次广告,以完成广告的补偿投放。或者,可以由该广告位再次投放3000*(10000/(10000-3000))次(取整数)的广告,以完成广告的补偿投放。
当然,上述过程实际上是确定出了异常的广告位后,补偿投放目标广告的过程。
以下结合一个具体示例解释本申请实施例的上述广告位异常的识别方法。
建立真人设备标识(identity document,ID)库(设备标识数据库)。假设我们已经通过ID的活跃特征、行为特征等建立了准确的真人设备ID库。可以通过分析历史数据确定。
建立精准的地址(internet protocol,IP)黑名单(黑名单地址数据库)。通过IP的活跃特征、行为特征、IP类型等信息建立了IP黑名单列表。
计算媒体或点位上每条记录的异常概率。对于任意一条记录:如果记录中的ID不在真人ID库中,则不论记录中的IP是否在IP黑名单中,该条记录的异常概率都为1。如果记录中的IP在IP黑名单中,则不论记录中的ID是否在真人ID库中,该条记录的异常概率都为1。如果记录中的ID在真人ID库中,且IP不在IP黑名单中,则计算ID在一段时间内的总页面访问量(Page View,PV)、出现的地域及在各地域的PV,用各地域的PV除以总PV,计算ID在各地域出现的概率。对于大多数人,大部分时间是只出现在少数地域的,所以可以根据ID在各地域出现的概率以及记录中IP所属地域来计算记录的异常概率,记为P(ID,IP)。计算互联网广告媒体或广告位作弊概率。假设N是某互联网广告媒体或广告位的总记录数,对每条记录计算异常概率P(ID,IP),那么该互联网广告媒体或广告位的作弊概率R可表示为:
N为正整数。
更进一步,可根据每条记录中的ID和IP在真人ID库和IP黑名单库中的出现情况,做加权平均,来确认互联网广告媒体或广告位的作弊概率。
或者,建立真人设备标识与精准的地址(internet protocol,IP)黑名单(黑名单地址数据库)。之后,计算媒体或点位上每条记录的异常概率。对于任意一条记录:如果记录中的ID不在真人ID库中,则不论记录中的IP是否在IP黑名单中,该条记录的异常概率都为1。如果记录中的IP在IP黑名单中,则不论记录中的ID是否在真人ID库中,该条记录的异常概率都为1。如果记录中异常概率为1的记录数量与总数量的比值大于第一阈值,则广告位异常。
如果记录中的ID在真人ID库中,且IP不在IP黑名单中,则计算ID在一段时间内的总页面访问量(Page View,简称为PV)、出现的地域及在各地域的PV,用各地域的PV除以总PV,计算ID在各地域出现的概率。对于大多数人,大部分时间是只出现在少数地域的,所以可以根据ID在各地域出现的概率以及记录中IP所属地域来计算记录的异常概率,将每一条记录的异常概率加权求和或者求平均值,得到目标概率。如果目标概率大于第二阈值,则广告位异常。
下面举例说明具体计算方法,假设某互联网广告媒体在一天内的总记录数100,000,其中有10,000条记录的异常概率是0.8,30,000条记录的异常概率是0.95,50,000条记录的异常概率是0.99,5,000条记录的异常概率是0.01,5,000条记录的异常概率是0.75,那么该互联网广告媒体在这天的作弊概率为:
R=(10000*0.8+30000*0.95+50000*0.99+5000*0.01+5000*0.75)/100000=89.8%。
通过比对89.8%与第二阈值确定广告位是否异常。
作为一种可选的实施方案,获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址包括:
在目标设备访问多个广告位中的任意一个广告位中的目标广告的情况下,获取设备唯一标识与因特网协议地址。
也就是说,本申请中的广告位可以有多个,在设备访问任意一个广告位时,被访问的广告位的总访问次数应增加1,并获取设备的设备唯一标识与因特网协议地址。通过本方法,提高了确定广告位是否异常的准确性。
作为一种可选的实施方案,获取广告位的总访问次数并获取目标广告的异常访问次数包括:
在每检测到一个目标设备访问一次广告位中的目标广告的情况下,将广告位的总访问次数增加1。
也就是说,对于一个广告位中的广告,被任意一个设备访问,广告位的总访问量次数都应该增加。为了判断单次访问的终端是否为虚假终端,可以获取终端的设备唯一标识与终端使用的因特网协议地址,在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,认为该终端为虚假终端,将目标广告的异常访问次数增加1。通过本实施例,实现了提高识别广告位是否异常的准确度的效果。
作为一种可选的实施方案,在广告位推送目标广告时,在获取访问目标广告的目标设备的设备唯一标识与访问目标广告的设备使用的因特网协议地址之后,方法还包括:
将设备唯一标识与设备标识数据库中的每一条设备标识进行比对,在设备标识数据库的多个设备标识中不包括目标设备标识的情况下,确定设备唯一标识不属于设备标识数据库,其中,目标设备标识为与设备唯一标识相同的标识。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的设备唯一标识。设备唯一标识可以唯一性的代表一个终端。在获取到设备唯一标识后,可以将设备唯一标识与设备标识数据库中的所有标识进行比对。设备标识数据库中记录有真实的设备的设备标识。如果设备唯一标识与设备标识数据库中的某一个设备标识相同,则说明该次访问中的终端是一个真实的设备。如果设备标识数据库中的任何一个设备标识都与上述设备唯一标识不同,则说明本次访问的终端为虚假设备,有可能为自动机模拟的设备。
通过本实施例,实现了提高判断访问广告的终端是否为虚假终端的准确性的效果。
作为一种可选的实施方案,在广告位推送目标广告时,在获取访问目标广告的目标设备的设备唯一标识与访问目标广告的设备使用的因特网协议地址之后,方法还包括:
将因特网协议地址与黑名单地址数据库中的每一条地址进行比对,在黑名单地址数据库的多个地址中包括目标地址的情况下,确定因特网协议地址属于黑名单地址数据库,其中,目标地址为与因特网协议地址相同的地址。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的因特网协议地址,因特网协议地址是该终端访问广告所使用的因特网协议地址。可以将该因特网协议地址与黑名单地址数据库进行比对,黑名单地址数据库中记录有异常的因特网协议地址。如果该词访问的终端使用的因特网协议地址与黑名单地址数据库中的一个地址相同,则说明该终端使用的因特网协议地址是一个黑名单中的地址,该次访问为一次虚假访问。
通过本实施例,实现了提高判断访问广告的终端是否为虚假终端的准确性的效果。
作为一种可选的实施方案,在获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址之前,方法还包括:
获取在预定时长内访问目标广告的所有的设备的设备标识与所有设备使用的因特网协议地址;
在预定时长内,所有的设备的设备标识中相同的设备标识的数量小于第一数量的情况下,将小于第一数量的相同的设备标识作为设备标识数据库中的一个设备标识;
在预定时长内,所有的设备使用的因特网协议地址中,相同的因特网协议地址的数量大于第二数量的情况下,将大于第二数量的相同的因特网协议地址作为黑名单地址数据库中的地址。
也就是说,本申请中的设备标识数据库与黑名单地址数据库可以为根据历史数据统计与分析得到的数据库。通过本实施例,实现了提高确定的数据库的准确性的效果,进一步提高了分析广告位是否异常的准确性的效果。
作为一种可选的实施方案,上述方法还包括:
在设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库的情况下,根据设备唯一标识的位置确定设备唯一标识的异常概率;
获取所有的设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库的目标设备的异常概率的目标概率,目标概率为异常概率的均值或加权求和平均结果;
在目标概率大于第二阈值的情况下,确定目标广告所在的广告位异常。
也就是说,如果一个广告的访问记录中,设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库,并不能完全证明该次访问记录是正常的记录,还需要根据位置判断该词访问的异常概率。如果一个广告位的异常概率的均值或者加权平均结果较高,如超过了第二阈值,则该广告位异常。通过本实施例,实现了提高识别广告位异常的准确性的效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述广告位异常方法的广告位异常装置。如图6所示,该装置包括:
第一获取单元602,用于获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址;
第一处理单元604,用于在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,将目标广告的异常访问次数增加1,其中,设备标识数据库中记录有真实的设备的设备标识,黑名单地址数据库中记录有异常的因特网协议地址;
第二获取单元606,用于获取广告位的总访问次数并获取目标广告的异常访问次数;
第一确定单元608,用于在目标广告的异常访问次数与总访问次数的比值大于第一阈值的情况下,确定目标广告所在的广告位异常。
可选地,上述广告位异常的识别装置可以应用在识别广告位是否异常,例如识别广告位的流量数据是否造假的过程中。如在广告位上发布广告后,统计访问该广告的流量数据,本申请可以识别统计的流量数据是否造假,确定出该广告位是否正常。如果该广告位上的广告的访问数据造假,则说明该广告位是异常的,不能正常投放广告。本申请通过获取访问广告位上的广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址来确定该单次访问广告是否为一次异常访问,获取广告位的总访问次数并获取目标广告的异常访问次数,从而确定出该广告位是否异常。
可选的,本申请实施例中,一个展示界面上可以展示多个广告位,每一个广告位中可以展示一条广告。多个广告位可以同时展示,也可以在不同时间段交替显示。不同的广告位可以相邻,也可以不相邻。例如,如图2所示,图2中的广告位202与广告位204相邻展示。如图3所示,图3中的广告位302与广告位304在不同时间段交替展示。在0-10s,使用广告位302展示广告1,在10-20s,使用广告位304展示广告2。
可选的,本申请中的对广告位中的目标广告的访问可以为当在终端(目标设备)的显示界面上显示一次目标广告,则认为终端访问了该目标广告。或者,如果终端在显示目标广告时,点击了目标广告,查看了目标广告的内容或者跳转了链接,则认为访问了一次目标广告。例如,如图4所示,图4中,汽车广告与洗衣粉广告在两个广告位中展示,用户查看到当前展示广告的页面则认为终端在使用过程中,显示了一次广告,则认为终端访问了一次广告。两个广告位的总展示次数分别增加1。而图5中,终端显示广告之后,需要点击广告跳转到广告界面,则认为终端访问了一次广告。当然,广告也可能是使用虚拟机进行的虚假访问,例如,一个虚拟机通过自动机刷访问量,一个广告位的广告一秒钟被自动机刷访问量,访问了1000次。本申请实施例可以通过识别广告位的广告的访问是否为异常访问,以及根据总访问次数与异常访问次数来确定一个广告位的广告的访问数据是否为自动机刷出的虚假数据,进一步确定该广告位是否异常。
可选的,本申请实施例中可以在服务器上应用上述广告位异常的识别方法。对于一个广告位,其中设置有一个或者多个广告,服务器可以检测到终端(真实的目标设备或者虚假的目标设备)是否访问服务器以及是否有访问广告位中的广告。服务器可以将终端访问一次广告位中的广告记为该广告位的一次被访问次数。当然,为了判断单次访问的终端是否为虚假终端,可以获取终端的设备唯一标识与终端使用的因特网协议地址,在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,认为该终端为虚假终端,将目标广告的异常访问次数增加1
可选的,对于一个展示区域有多个广告位轮番显示的情况下,每一个广告位显示一个广告,每一个广告对应一个广告位的标识,不同的广告对应广告位的不同的标识。也就是说,虽然一个展示区域可以轮番展示不同的广告位,进而展示不同的广告,但是,由于广告对应的广告位的标识是不同的,因此即使广告在不同的时间段在同一个展示区域展示,在被访问的情况下,仍然可以根据广告位的标识计算广告位的总访问次数。如在0-10秒,在一个展示区域中展示的广告位1,广告位1中显示有广告1,如果在0-10秒内广告1被访问,则广告位1的总访问次数加1。而10-20秒,在相同的展示区域展示的广告位2,广告位2中展示的广告2,此时,广告2被访问的情况下,将广告位2的总访问量次数加1。。而异常访问次数根据判断出的该次访问是否为异常访问来确定是否进行记录。如果本次访问为正常访问,则不增加异常访问次数,如果本次访问为异常访问,则需要增加异常访问次数。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的设备唯一标识。设备唯一标识可以唯一性的代表一个终端。在获取到设备唯一标识后,可以将设备唯一标识与设备标识数据库中的所有标识进行比对。设备标识数据库中记录有真实的设备的设备标识。如果设备唯一标识与设备标识数据库中的某一个设备标识相同,则说明该次访问中的终端是一个真实的设备。如果设备标识数据库中的任何一个设备标识都与上述设备唯一标识不同,则说明本次访问的终端为虚假设备,有可能为自动机模拟的设备。
可选的。本申请中在获取到一条访问记录后,获取访问广告的终端的因特网协议地址,因特网协议地址是该终端访问广告所使用的因特网协议地址。可以将该因特网协议地址与黑名单地址数据库进行比对,黑名单地址数据库中记录有异常的因特网协议地址。如果该词访问的终端使用的因特网协议地址与黑名单地址数据库中的一个地址相同,则说明该终端使用的因特网协议地址是一个黑名单中的地址,该次访问为一次虚假访问。
可选的,本申请实施例中的设备标识数据库可以为根据一段时间的历史数据确定出的数据库。例如,获取在预定时长内访问目标广告的所有的设备的设备标识,例如一个广告在一分钟内被访问了100次,访问100次的100个终端对应100个设备标识。100个设备标识中有相同的设备标识或者不同的设备标识。如果一个设备标识在该100次访问中被使用了N次,N为1-100中的一个数,则说明一个设备标识对应的终端在一分钟内访问了N次广告。N如果大于或者等于第一数量(例如第一数量为10)则说明该终端为虚假终端的可能性很高,该终端的设备标识不能作为设备标识数据库中的标识。如果一个终端标识被使用的次数小于第一数量,则该终端为真实终端的可能性高,该终端的标识可以作为设备标识数据库中的标识。使用该方法,可以使用过去一段时间的数据来确定出设备标识数据库。即使一个终端从未被使用过,但是该终端的设备标识如果被使用后,发生刷广告次数的情况,则该终端的设备标识不会加入到设备标识数据库中。后续的判断过程仍然准确。
上述示例为本申请确定设备标识数据库的一个举例,本申请对确定设备标识数据库的方法不做限制。
可选的,本申请实施例中的黑名单地址数据库可以为根据一段时间的历史数据确定出的数据库。例如,获取在预定时长内访问目标广告的所有的设备的因特网协议地址,例如一个广告在一分钟内被访问了100次,访问100次的100个终端对应100个因特网协议地址。100个因特网协议地址中有相同的因特网协议地址或者不同的因特网协议地址。如果一个因特网协议地址在该100次访问中被使用了N次,N为1-100中的一个数,则说明一个因特网协议地址对应的终端在一分钟内访问了N次广告。N如果大于或者等于第一数量(例如第一数量为10)则说明该终端为虚假终端的可能性很高,该因特网协议地址需要加入黑名单地址数据库中。如果一个因特网协议地址被使用的次数小于第一数量,则该因特网协议地址对应的终端为真实终端的可能性高,该因特网协议地址可以作为黑名单地址数据库中的地址。使用该方法,可以使用过去一段时间的数据来确定出黑名单地址数据库。即使一个地址从未被使用过,但是该地址如果被使用后,发生刷广告次数的情况,则该地址会加入到黑名单地址数据库中。后续的判断过程仍然准确。
上述示例为本申请确定黑名单地址数据库的一个举例,本申请对确定黑名单地址数据库的方法不做限制。
而如果设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库,则可以进行进一步的判断,判断一次对广告的访问为异常访问的可能性。
本申请中如果在确定出一个广告位异常的情况下,可以统计出该广告位所投放的广告中异常的异常访问次数,然后,由系统控制该广告位补偿投放次数。例如,一个广告位投放了10000次广告,其中,3000次广告的投放是异常的投放,因此,可以由该广告位再次投放3000次广告,以完成广告的补偿投放。或者,可以由该广告位再次投放3000*(10000/(10000-3000))次(取整数)的广告,以完成广告的补偿投放。
当然,上述过程实际上是确定出了异常的广告位后,补偿投放目标广告的过程。
以下结合一个具体示例解释本申请实施例的上述广告位异常的识别方法。
建立真人设备标识(identity document,ID)库(设备标识数据库)。假设我们已经通过ID的活跃特征、行为特征等建立了准确的真人设备ID库。可以通过分析历史数据确定。
建立精准的地址(internet protocol,IP)黑名单(黑名单地址数据库)。通过IP的活跃特征、行为特征、IP类型等信息建立了IP黑名单列表。
计算媒体或点位上每条记录的异常概率。对于任意一条记录:如果记录中的ID不在真人ID库中,则不论记录中的IP是否在IP黑名单中,该条记录的异常概率都为1。如果记录中的IP在IP黑名单中,则不论记录中的ID是否在真人ID库中,该条记录的异常概率都为1。如果记录中的ID在真人ID库中,且IP不在IP黑名单中,则计算ID在一段时间内的总页面访问量(Page View,简称为PV)、出现的地域及在各地域的PV,用各地域的PV除以总PV,计算ID在各地域出现的概率。对于大多数人,大部分时间是只出现在少数地域的,所以可以根据ID在各地域出现的概率以及记录中IP所属地域来计算记录的异常概率,记为P(ID,IP)。计算互联网广告媒体或广告位作弊概率。假设N是某互联网广告媒体或广告位的总记录数,对每条记录计算异常概率P(ID,IP),那么该互联网广告媒体或广告位的作弊概率R可表示为:
N为正整数。
更进一步,可根据每条记录中的ID和IP在真人ID库和IP黑名单库中的出现情况,做加权平均,来确认互联网广告媒体或广告位的作弊概率。
或者,建立真人设备标识与精准的地址(internet protocol,IP)黑名单(黑名单地址数据库)。之后,计算媒体或点位上每条记录的异常概率。对于任意一条记录:如果记录中的ID不在真人ID库中,则不论记录中的IP是否在IP黑名单中,该条记录的异常概率都为1。如果记录中的IP在IP黑名单中,则不论记录中的ID是否在真人ID库中,该条记录的异常概率都为1。如果记录中异常概率为1的记录数量与总数量的比值大于第一阈值,则广告位异常。
如果记录中的ID在真人ID库中,且IP不在IP黑名单中,则计算ID在一段时间内的总页面访问量(Page View,简称为PV)、出现的地域及在各地域的PV,用各地域的PV除以总PV,计算ID在各地域出现的概率。对于大多数人,大部分时间是只出现在少数地域的,所以可以根据ID在各地域出现的概率以及记录中IP所属地域来计算记录的异常概率,将每一条记录的异常概率加权求和或者求平均值,得到目标概率。如果目标概率大于第二阈值,则广告位异常。
下面举例说明具体计算方法,假设某互联网广告媒体在一天内的总记录数100,000,其中有10,000条记录的异常概率是0.8,30,000条记录的异常概率是0.95,50,000条记录的异常概率是0.99,5,000条记录的异常概率是0.01,5,000条记录的异常概率是0.75,那么该互联网广告媒体在这天的作弊概率为:
R=(10000*0.8+30000*0.95+50000*0.99+5000*0.01+5000*0.75)/100000=89.8%。
通过比对89.8%与第二阈值确定广告位是否异常。
作为一种可选的实施方式,如图7所示,上述第一获取单元602包括:
获取模块702,用于在目标设备访问多个广告位中的任意一个广告位的目标广告的情况下,获取设备唯一标识与因特网协议地址。
也就是说,本申请中的多个广告位在设备访问任意一个广告位的一条广告时,被访问的广告位的总访问次数应增加1,并获取设备的设备唯一标识与因特网协议地址。通过本方法,提高了确定广告位是否异常的准确性。
作为一种可选的实施方式,上述第二获取单元包括:
处理模块,用于在每检测到一个目标设备访问一次多个广告位中的任意一个广告位中的目标广告中的情况下,将被访问的广告位的总访问次数增加1。
也就是说,对于一个广告位中的广告,被任意的一个设备访问,被访问的广告位的总访问量次数都应该增加。为了判断单次访问的终端是否为虚假终端,可以获取终端的设备唯一标识与终端使用的因特网协议地址,在设备唯一标识不属于设备标识数据库,或者因特网协议地址属于黑名单地址数据库的情况下,认为该终端为虚假终端,将目标广告的异常访问次数增加1。通过本实施例,实现了提高识别广告位是否异常的准确度的效果。
作为一种可选的实施方式,上述装置还包括:
第一比对单元,用于在广告位推送目标广告时,在获取访问目标广告的目标设备的设备唯一标识与访问目标广告的设备使用的因特网协议地址之后,将设备唯一标识与设备标识数据库中的每一条设备标识进行比对,在设备标识数据库的多个设备标识中不包括目标设备标识的情况下,确定设备唯一标识不属于设备标识数据库,其中,目标设备标识为与设备唯一标识相同的标识。
通过本实施例,实现了提高判断访问广告的终端是否为虚假终端的准确性的效果。
作为一种可选的实施方式,上述装置还包括:
第二比对单元,用于在广告位推送目标广告时,在获取访问目标广告的目标设备的设备唯一标识与访问目标广告的设备使用的因特网协议地址之后,将因特网协议地址与黑名单地址数据库中的每一条地址进行比对,在黑名单地址数据库的多个地址中包括目标地址的情况下,确定因特网协议地址属于黑名单地址数据库,其中,目标地址为与因特网协议地址相同的地址。
通过本实施例,实现了提高判断访问广告的终端是否为虚假终端的准确性的效果。
作为一种可选的实施方式,上述装置还包括:
第三获取单元,用于在获取访问广告位上的目标广告的目标设备的设备唯一标识与目标设备使用的因特网协议地址之前,获取在预定时长内访问目标广告的所有的设备的设备标识与所有设备使用的因特网协议地址;
第二确定单元,用于在预定时长内,所有的设备的设备标识中相同的设备标识的数量小于第一数量的情况下,将小于第一数量的相同的设备标识作为设备标识数据库中的一个设备标识;
第三确定单元,用于在预定时长内,所有的设备使用的因特网协议地址中,相同的因特网协议地址的数量大于第二数量的情况下,将大于第二数量的相同的因特网协议地址作为黑名单地址数据库中的地址。
也就是说,本申请中的设备标识数据库与黑名单地址数据库可以为根据历史数据统计与分析得到的数据库。通过本实施例,实现了提高确定的数据库的准确性的效果,进一步提高了分析广告位是否异常的准确性的效果。
作为一种可选的实施方式,上述装置还包括:
第四确定单元,用于在设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库的情况下,根据设备唯一标识的位置确定设备唯一标识的异常概率;
第四获取单元,用于获取所有的设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库的目标设备的异常概率的目标概率,目标概率为异常概率的均值或加权求和平均结果;
第五确定单元,用于在目标概率大于第二阈值的情况下,确定目标广告所在的广告位异常。
也就是说,如果一个广告的访问记录中,设备唯一标识属于设备标识数据库且因特网协议地址不属于黑名单地址数据库,并不能完全证明该次访问记录是正常的记录,还需要根据位置判断该词访问的异常概率。如果一个广告位的异常概率的均值或者加权平均结果较高,如超过了第二阈值,则该广告位异常。通过本实施例,实现了提高识别广告位异常的准确性的效果。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种广告位异常的识别方法,其特征在于,包括:
获取访问广告位上的目标广告的目标设备的设备唯一标识与所述目标设备使用的因特网协议地址;
在所述设备唯一标识不属于设备标识数据库,或者所述因特网协议地址属于黑名单地址数据库的情况下,将所述目标广告的异常访问次数增加1,其中,所述设备标识数据库中记录有真实的设备的设备标识,所述黑名单地址数据库中记录有异常的因特网协议地址;
获取所述广告位的总访问次数并获取所述目标广告的异常访问次数;
在所述目标广告的异常访问次数与所述总访问次数的比值大于第一阈值的情况下,确定所述目标广告所在的所述广告位异常。
2.根据权利要求1所述的方法,其特征在于,所述获取访问广告位上的目标广告的目标设备的设备唯一标识与所述目标设备使用的因特网协议地址包括:
在所述目标设备访问多个广告位中任意一个广告位的所述目标广告的情况下,获取所述设备唯一标识与所述因特网协议地址。
3.根据权利要求1所述的方法,其特征在于,所述获取所述广告位的总访问次数并获取所述目标广告的异常访问次数包括:
在每检测到一个所述目标设备访问一次所述广告位中的所述目标广告的情况下,将所述广告位的所述总访问次数增加1。
4.根据权利要求1所述的方法,其特征在于,在广告位推送目标广告时,在获取访问所述目标广告的目标设备的设备唯一标识与访问所述目标广告的设备使用的因特网协议地址之后,所述方法还包括:
将所述设备唯一标识与所述设备标识数据库中的每一条设备标识进行比对,在所述设备标识数据库的多个设备标识中不包括目标设备标识的情况下,确定所述设备唯一标识不属于所述设备标识数据库,其中,所述目标设备标识为与所述设备唯一标识相同的标识。
5.根据权利要求1所述的方法,其特征在于,在广告位推送目标广告时,在获取访问所述目标广告的目标设备的设备唯一标识与访问所述目标广告的设备使用的因特网协议地址之后,所述方法还包括:
将所述因特网协议地址与所述黑名单地址数据库中的每一条地址进行比对,在所述黑名单地址数据库的多个地址中包括目标地址的情况下,确定所述因特网协议地址属于黑名单地址数据库,其中,所述目标地址为与所述因特网协议地址相同的地址。
6.根据权利要求1所述的方法,其特征在于,在获取访问广告位上的目标广告的目标设备的设备唯一标识与所述目标设备使用的因特网协议地址之前,所述方法还包括:
获取在预定时长内访问所述目标广告的所有的设备的设备标识与所有设备使用的因特网协议地址;
在所述预定时长内,所述所有的设备的设备标识中相同的设备标识的数量小于第一数量的情况下,将小于所述第一数量的所述相同的设备标识作为所述设备标识数据库中的一个设备标识;
在所述预定时长内,所述所有的设备使用的因特网协议地址中,相同的因特网协议地址的数量大于第二数量的情况下,将大于所述第二数量的所述相同的因特网协议地址作为所述黑名单地址数据库中的地址。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述设备唯一标识属于所述设备标识数据库且所述因特网协议地址不属于所述黑名单地址数据库的情况下,根据所述设备唯一标识的位置确定所述设备唯一标识的异常概率;
获取所有的所述设备唯一标识属于所述设备标识数据库且所述因特网协议地址不属于所述黑名单地址数据库的目标设备的所述异常概率的目标概率,所述目标概率为所述异常概率的均值或加权求和平均结果;
在所述目标概率大于第二阈值的情况下,确定所述目标广告所在的所述广告位异常。
8.一种广告位异常的识别装置,其特征在于,包括:
第一获取单元,用于获取访问广告位上的目标广告的目标设备的设备唯一标识与所述目标设备使用的因特网协议地址;
第一处理单元,用于在所述设备唯一标识不属于设备标识数据库,或者所述因特网协议地址属于黑名单地址数据库的情况下,将所述目标广告的异常访问次数增加1,其中,所述设备标识数据库中记录有真实的设备的设备标识,所述黑名单地址数据库中记录有异常的因特网协议地址;
第二获取单元,用于获取所述广告位的总访问次数并获取所述目标广告的异常访问次数;
第一确定单元,用于在所述目标广告的异常访问次数与所述总访问次数的比值大于第一阈值的情况下,确定所述目标广告所在的所述广告位异常。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第四确定单元,用于在所述设备唯一标识属于所述设备标识数据库且所述因特网协议地址不属于所述黑名单地址数据库的情况下,根据所述设备唯一标识的位置确定所述设备唯一标识的异常概率;
第四获取单元,用于获取所有的所述设备唯一标识属于所述设备标识数据库且所述因特网协议地址不属于所述黑名单地址数据库的目标设备的所述异常概率的目标概率,所述目标概率为所述异常概率的均值或加权求和平均结果;
第五确定单元,用于在所述目标概率大于第二阈值的情况下,确定所述目标广告所在的所述广告位异常。
10.根据权利要求9所述的装置,其特征在于,所述第一获取单元包括:
获取模块,用于在所述目标设备访问多个广告位中的任意一个广告位的目标广告的情况下,获取所述设备唯一标识与所述因特网协议地址。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011017835.XA CN112188291B (zh) | 2020-09-24 | 2020-09-24 | 广告位异常的识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011017835.XA CN112188291B (zh) | 2020-09-24 | 2020-09-24 | 广告位异常的识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112188291A true CN112188291A (zh) | 2021-01-05 |
CN112188291B CN112188291B (zh) | 2022-11-29 |
Family
ID=73957101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011017835.XA Active CN112188291B (zh) | 2020-09-24 | 2020-09-24 | 广告位异常的识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112188291B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297435A (zh) * | 2013-06-06 | 2013-09-11 | 中国科学院信息工程研究所 | 一种基于web日志的异常访问行为检测方法与系统 |
CN103593415A (zh) * | 2013-10-29 | 2014-02-19 | 北京国双科技有限公司 | 网页访问量作弊的检测方法和装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN106612216A (zh) * | 2015-10-27 | 2017-05-03 | 北京国双科技有限公司 | 网站访问异常的检测方法及装置 |
CN106651458A (zh) * | 2016-12-29 | 2017-05-10 | 腾讯科技(深圳)有限公司 | 一种广告反作弊方法和装置 |
CN107438079A (zh) * | 2017-08-18 | 2017-12-05 | 杭州安恒信息技术有限公司 | 一种网站未知异常行为的检测方法 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
CN108109011A (zh) * | 2017-12-28 | 2018-06-01 | 北京皮尔布莱尼软件有限公司 | 一种广告反作弊方法及计算设备 |
CN108234413A (zh) * | 2016-12-15 | 2018-06-29 | 北京奇虎科技有限公司 | 广告流量质量的确定方法、装置及广告平台 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN110661794A (zh) * | 2019-09-20 | 2020-01-07 | 秒针信息技术有限公司 | 流量识别方法、装置、电子设备及可读存储介质 |
CN110827094A (zh) * | 2019-11-15 | 2020-02-21 | 湖南快乐阳光互动娱乐传媒有限公司 | 广告投放的反作弊方法及系统 |
CN111435507A (zh) * | 2019-01-11 | 2020-07-21 | 腾讯科技(北京)有限公司 | 广告反作弊方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-09-24 CN CN202011017835.XA patent/CN112188291B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297435A (zh) * | 2013-06-06 | 2013-09-11 | 中国科学院信息工程研究所 | 一种基于web日志的异常访问行为检测方法与系统 |
CN103593415A (zh) * | 2013-10-29 | 2014-02-19 | 北京国双科技有限公司 | 网页访问量作弊的检测方法和装置 |
CN106612216A (zh) * | 2015-10-27 | 2017-05-03 | 北京国双科技有限公司 | 网站访问异常的检测方法及装置 |
CN106022834A (zh) * | 2016-05-24 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 广告反作弊方法及装置 |
CN108234413A (zh) * | 2016-12-15 | 2018-06-29 | 北京奇虎科技有限公司 | 广告流量质量的确定方法、装置及广告平台 |
CN106651458A (zh) * | 2016-12-29 | 2017-05-10 | 腾讯科技(深圳)有限公司 | 一种广告反作弊方法和装置 |
CN107438079A (zh) * | 2017-08-18 | 2017-12-05 | 杭州安恒信息技术有限公司 | 一种网站未知异常行为的检测方法 |
CN108009844A (zh) * | 2017-11-20 | 2018-05-08 | 北京智钥科技有限公司 | 确定广告作弊行为的方法、装置及云服务器 |
CN108109011A (zh) * | 2017-12-28 | 2018-06-01 | 北京皮尔布莱尼软件有限公司 | 一种广告反作弊方法及计算设备 |
CN109146546A (zh) * | 2018-07-23 | 2019-01-04 | 广州至真信息科技有限公司 | 一种作弊行为检测的方法及装置 |
CN111435507A (zh) * | 2019-01-11 | 2020-07-21 | 腾讯科技(北京)有限公司 | 广告反作弊方法、装置、电子设备及可读存储介质 |
CN110661794A (zh) * | 2019-09-20 | 2020-01-07 | 秒针信息技术有限公司 | 流量识别方法、装置、电子设备及可读存储介质 |
CN110827094A (zh) * | 2019-11-15 | 2020-02-21 | 湖南快乐阳光互动娱乐传媒有限公司 | 广告投放的反作弊方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112188291B (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009844B (zh) | 确定广告作弊行为的方法、装置及云服务器 | |
JP6878450B2 (ja) | 広告に関する不正行為を防止するための方法及びデバイス並びに記憶媒体 | |
US11373205B2 (en) | Identifying and punishing cheating terminals that generate inflated hit rates | |
Stone-Gross et al. | Understanding fraudulent activities in online ad exchanges | |
US20080288303A1 (en) | Method for Detecting and Preventing Fraudulent Internet Advertising Activity | |
US20080162475A1 (en) | Click-fraud detection method | |
KR20080085100A (ko) | 부정클릭 감시 방법 및 장치 | |
Xu et al. | Click fraud detection on the advertiser side | |
US20090012853A1 (en) | Inferring legitimacy of advertisement calls | |
US20090013031A1 (en) | Inferring legitimacy of web-based resource requests | |
CN111612085B (zh) | 一种对等组中异常点的检测方法及装置 | |
CN103268562A (zh) | 一种互联网广告受众人口属性的监测方法及系统 | |
CN113837617A (zh) | 一种防刷单的风险管理方法及装置 | |
CN109495562B (zh) | 获取设备标识的方法及装置 | |
CN111723083A (zh) | 用户身份识别方法、装置、电子设备及存储介质 | |
US20140351931A1 (en) | Methods, systems and media for detecting non-intended traffic using co-visitation information | |
CN112188291B (zh) | 广告位异常的识别方法和装置 | |
US20190370856A1 (en) | Detection and estimation of fraudulent content attribution | |
CN112488754A (zh) | 一种广告点击的反作弊系统和方法 | |
KR20100057192A (ko) | Cpc 광고의 부정클릭 차단 시스템 및 그 방법 | |
CN111563765A (zh) | 一种作弊用户筛选方法、装置、设备及可读存储介质 | |
CN111259242B (zh) | 数据处理方法、装置、存储介质及设备 | |
KR20140024542A (ko) | 웹페이지의 쿠키정보 및 리퍼러 기록을 이용한 광고 서비스 시스템 및 방법 | |
CN110689373B (zh) | 检测待测设备状态的方法及装置 | |
KR20090063449A (ko) | 전환 정보를 이용한 부정 클릭 모니터 방법 및 상기 방법을수행하기 위한 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |