CN103593415A - 网页访问量作弊的检测方法和装置 - Google Patents

网页访问量作弊的检测方法和装置 Download PDF

Info

Publication number
CN103593415A
CN103593415A CN201310523151.0A CN201310523151A CN103593415A CN 103593415 A CN103593415 A CN 103593415A CN 201310523151 A CN201310523151 A CN 201310523151A CN 103593415 A CN103593415 A CN 103593415A
Authority
CN
China
Prior art keywords
visit capacity
access
target web
cheating
setting threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310523151.0A
Other languages
English (en)
Other versions
CN103593415B (zh
Inventor
祁国晟
吴充
马燕龙
杨韬
戴飞
余德乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310523151.0A priority Critical patent/CN103593415B/zh
Publication of CN103593415A publication Critical patent/CN103593415A/zh
Priority to PCT/CN2014/089724 priority patent/WO2015062485A1/zh
Priority to US15/139,096 priority patent/US20160239864A1/en
Application granted granted Critical
Publication of CN103593415B publication Critical patent/CN103593415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0248Avoiding fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/16Implementing security features at a particular protocol layer
    • H04L63/168Implementing security features at a particular protocol layer above the transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种网页访问量作弊的检测方法和装置。该网页访问量作弊的检测方法包括:获取目标网页的访问量;判断访问量是否满足预定条件;如果访问量满足预定条件,获取目标网页的访问来源信息;以及根据访问来源信息判断目标网页的访问量是否作弊,通过判断获取到的目标网页的访问量是否满足预设条件,当访问量满足预设条件时,认定为目标网页访问量作弊。通过本发明,解决了对网页访问量作弊的识别不准确的问题,进而达到了准确识别目标网页的访问量作弊的效果。

Description

网页访问量作弊的检测方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页访问量作弊的检测方法和装置。 
背景技术
随着越来越多的广告主选择互联网进行广告投放,网络广告费用支出逐年递增,对互联网广告投放效果的定量评估和第三方权威检测已经成为广告主的刚性需求。但是,与传统媒体行业不同,互联网广告行业的技术门槛更高、数据结构更为复杂、评估指标维度更多、投放技术要求更高。而这些都为互联网广告作弊提供了可操作的空间,损害了广告主的利益。 
下面对上述中一些术语进行介绍: 
互联网广告作弊:媒体为了刷广告流量而进行的作弊。 
广告主:是广告活动的发布者,是在网上销售或宣传自己产品和服务的商家,是联盟营销广告的提供者。任何推广、销售其产品或服务的商家都可以作为广告主。广告主发布广告活动,并按照网站主完成的广告活动中规定的营销效果的总数量及单位效果价格向网站主支付费用。 
目前,网络搜索服务商所经营的竞价广告业务以及搜索排名服务中很多都有点击量作弊的行为。根据业内人士估计,搜索引擎广告的总点击量中两成以上是子虚乌有的。一般地,点击量作弊的方法分“自动”和“手工”两类。前者往往是通过“机器人”(能够自动执行一系列循环点击、页面刷新操作的脚本程序)来不断点击出现在网站和搜索结果页面上的网幅图像广告Banner。后者则是采取“人海战术”,以较低的成本雇用廉价劳动力来进行人工点击各类广告链接——这种难以通过技术手段侦测的作弊方式如今正呈上升趋势,而一些闹得沸沸扬扬的网络评选作弊事件其实也都与这种作弊方式有关。 
在网页中嵌入内联框架iframe是互联网广告作弊最常用的技巧。该方法一般是在自己的网页上嵌入大小为0×0或1×1的iframe,也就是用户不可见的iframe。通过iframe打开其他页面,使得用户打开了并非自己想要进入的网页,在用户看不见的情况下刷流量。传统的反作弊方法难以有效识别这种采用“人海战术”和嵌入iframe的作弊方式,导致点击量作弊情况难以有效抑制。 
互联网广告作弊归根结底都是网站主为了刷访问量而实施的作弊行为,因此第三方权威检测机构对广告网页刷访问量的作弊行为进行检测,能有效地保护广告主的利益。但是现有技术中,很少有能够识别网页访问量作弊的方案。 
针对现有技术中对网页访问量作弊识别不准确的问题,目前尚未提出有效的解决方案。 
发明内容
本发明的主要目的在于提供一种网页访问量作弊的检测方法和装置,以解决现有技术中对网页访问量作弊识别不准确的问题。 
为了实现上述目的,根据本发明的一个方面,提供了一种网页访问量作弊的检测方法。根据本发明的网页访问量作弊的检测方法包括:获取目标网页的访问量;判断访问量是否满足预定条件;如果访问量满足预定条件,获取目标网页的访问来源信息;以及根据访问来源信息判断目标网页的访问量是否作弊。 
进一步地,获取目标网页的访问量包括获取目标网页的历史访问量和当前访问量,判断访问量是否满足预定条件包括:获取历史访问量和当前访问量的比值;判断比值是否超出第一设定阈值;如果比值超出第一设定阈值,则确定访问量满足预定条件;如果比值未超出第一设定阈值,则确定访问量不满足预定条件。 
进一步地,获取目标网页的访问量包括获取目标网页的历史访问量和当前访问量,判断访问量是否满足预定条件包括:获取历史访问量和当前访问量的差值;判断差值是否超出第二设定阈值;如果差值超出第二设定阈值,则确定访问量满足预定条件;如果差值未超出第二设定阈值,则确定访问量不满足预定条件。 
进一步地,获取目标网页的访问来源信息包括:获取目标网页的源代码;在源代码中加入检测代码以获取目标网页的访问IP地址;将访问IP地址作为访问来源信息。根据访问来源信息判断目标网页的访问量是否作弊包括:获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问目标网页最多的一个访问IP地址;计算第一访问量与访问量的比值;判断第一访问量与访问量的比值是否超出第三设定阈值;如果第一访问量与访问量的比值超出第三设定阈值,则确定目标网页的访问量作弊,如果第一访问量与访问量的比值未超出第三设定阈值,则确定目标网页的访问量未作弊。 
进一步地,确定目标网页的访问量作弊包括:获取第一访问IP的访问停留时间;判断访问停留时间是否超出第四设定阈值;如果访问停留时间未超出第四设定阈值,则确定目标网页的访问量作弊;如果访问停留时间超出第四设定阈值,则确定目标网页的访问量未作弊。 
进一步地,在获取目标网页的访问量之前,网页访问量作弊的检测方法还包括:获取目标网页的源代码;检测源代码中是否存在大小为0*0或者1*1的内联框架iframe;如果源代码中不存在iframe,则获取目标网页的访问量。 
为了实现上述目的,根据本发明的另一方面,提供了一种网页访问量作弊的检测装置。根据本发明的网页访问量作弊的检测装置包括:第一获取单元,用于获取目标网页的访问量;第一判断单元,用于判断访问量是否满足预定条件;第二获取单元,用于当访问量满足预定条件时,获取目标网页的访问来源信息;第二判断单元,用于根据访问来源信息判断目标网页的访问量是否作弊。 
进一步地,第一获取单元还用于获取目标网页的历史访问量和当前访问量,其中,第一判断单元包括:第一获取模块,用于获取历史访问量和当前访问量的比值;第一判断模块,用于判断比值是否超出第一设定阈值;第一确定模块,用于当比值超出第一设定阈值时,确定访问量满足预定条件,当比值未超出第一设定阈值时,确定访问量不满足预定条件。 
进一步地,第一获取单元还用于获取目标网页的历史访问量和当前访问量,其中:第一判断单元包括:第二获取模块,用于获取历史访问量和当前访问量的差值;第二判断模块,用于判断差值是否超出第二设定阈值;第二确定模块,用于当差值超出第二设定阈值时,确定访问量满足预定条件,当差值未超出第二设定阈值时,确定访问量不满足预定条件。 
进一步地,第二获取单元包括:第三获取模块,用于获取目标网页的源代码;第四获取模块,用于在源代码中加入检测代码以获取目标网页的访问IP地址;生成模块,用于将访问IP地址作为访问来源信息;第二判断单元包括:第五获取模块,用于获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问目标网页最多的一个访问IP地址;计算模块,用于计算第一访问量与访问量的比值;第三判断模块,用于判断第一访问量与访问量的比值是否超出第三设定阈值;第三确定模块,用于当第一访问量与访问量的比值超出第三设定阈值时,确定目标网页的访问量作弊,当第一访问量与访问量的比值未超出第三设定阈值时,确定目标网页的访问量未作弊。 
进一步地,第三确定模块包括:获取子模块,用于获取第一访问IP的访问停留时间;判断子模块,用于判断访问停留时间是否超出第四设定阈值;确定子模块,用于当访问停留时间未超出第四设定阈值时,确定目标网页的访问量作弊,当访问停留时间超出第四设定阈值时,确定目标网页的访问量未作弊。 
进一步地,网页访问量作弊的检测装置还包括:第三获取单元,用于在获取目标网页的访问量之前,获取目标网页的源代码;检测单元,用于检测源代码中是否存在大小为0*0或者1*1的内联框架iframe;确定单元,用于当源代码中不存在iframe时, 获取目标网页的访问量。 
通过本发明,采用网页访问量作弊的检测方法包括:获取目标网页的访问量;判断访问量是否满足预定条件;如果访问量满足预定条件,获取目标网页的访问来源信息;以及根据访问来源信息判断目标网页的访问量是否作弊,通过判断获取到的目标网页的访问量是否满足预设条件,当访问量满足预设条件时,认定为目标网页访问量疑似作弊,并进一步获取目标网页的访问来源信息,根据访问来源信息进一步判断目标网页的访问量的是否作弊,通过对目标网页的来源信息的分析和判定提高对目标网页的访问量作弊的检测的精度,解决了对网页访问量作弊的识别不准确的问题,进而达到了准确识别目标网页的访问量作弊的效果。 
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中: 
图1是根据本发明第一实施例的网页访问量作弊的检测装置的结构示意图; 
图2是根据本发明第二实施例的网页访问量作弊的检测装置的结构示意图; 
图3是根据本发明第三实施例的网页访问量作弊的检测装置的结构示意图; 
图4是根据本发明第四实施例的网页访问量作弊的检测装置的结构示意图; 
图5是根据本发明第五实施例的网页访问量作弊的检测装置的结构示意图; 
图6是根据本发明第六实施例的网页访问量作弊的检测装置的结构示意图; 
图7是根据本发明第一实施例的网页访问量作弊的检测方法的流程图; 
图8是根据本发明第二实施例的网页访问量作弊的检测方法的流程图; 
图9是根据本发明第三实施例的网页访问量作弊的检测方法的流程图; 
图10是根据本发明第四实施例的网页访问量作弊的检测方法的流程图; 
图11是根据本发明第五实施例的网页访问量作弊的检测方法的流程图;以及 
图12是根据本发明第六实施例的网页访问量作弊的检测方法的流程图。 
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。 
本发明实施例提供了一种网页访问量作弊的检测装置,该装置通过计算机设备实 现其功能。 
图1是根据本发明第一实施例的网页访问量作弊的检测装置的结构示意图。如图1所示,该网页访问量作弊的检测装置包括:第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40。第一获取单元10用于获取目标网页的访问量。第一获取单元10获取到的访问量为目标网页的总访问量。目标网页为需要进行访问量作弊的检测的网页,该网页可以是任意一个网站中的任意一个网页,可以是广告主投放广告的网页,也可以是广告主营销的产品网页。例如,当目标网页为广告主投放广告的网页时,获取该网页的访问量可以得知广告主投放的广告的浏览量。其中,访问量可以是访问流量,也可以是访问点击量。访问量可以是历史访问量,历史访问量表示过去的一定时间段内目标网页的访问量。访问量也可以是当前访问量,当前访问量表示当前一定时间段内的目标网页的访问量。访问量也可以是历史访问量和当前访问量。第一获取单元10获取该访问量可以是通过在目标网页中加入检测代码,用来检测目标网页的访问流量或者访问点击量等访问量信息,也可以从目标网页的日志文件中直接读取目标网页的访问流量或者访问点击量等访问量信息。 
第一判断单元20用于判断访问量是否满足预定条件。根据第一获取单元10获取的目标网页的访问量,第一判断单元20将该访问量作为判断基础,判断该访问量是否满足预定条件。该预定条件可以是访问量的变化规律,例如,该预定条件为访问量发生突变时的一个阈值,当访问量超过该阈值时,认为访问量满足预定条件,此时可以认定访问量发生突变,也即是当前访问量相比于历史访问量发生了突变,该突变可以表示当前访问量出现迅速增加的态势,也可以表示当前访问量出现迅速降低的态势。本实施例以当前访问量出现迅速增加的态势为访问量的突变状态。第一判断单元20判断出该访问量是否满足预定条件,以便于判断该访问量是否为疑似作弊。当访问量出现急速增加的态势,如当前日的访问量远远大于前一日的访问量,可以认定该目标网页的访问量有作弊嫌疑。 
第二获取单元30用于当访问量满足预定条件时,获取目标网页的访问来源信息。当目标网页的访问量满足预定条件时,则认定为该目标网页的访问量疑似作弊。当目标网页疑似作弊时,第二获取单元30获取该目标网页的访问来源信息。访问来源信息可以是访问者的IP(Internet Protocol,简称IP)地址,也可以是访问的路径信息,如针对一次访问,该次访问可以是通过其他网页的超链接访问到该目标网页。第二获取单元30通过在目标网页的源代码中加入检测代码,可以获取该次访问的访问路径信息,也可以获取访问者的IP地址。通过获取该访问来源信息,以便于判断目标网页的访问量是否作弊。 
第二判断单元40用于根据访问来源信息判断目标网页的访问量是否作弊。由于此时目标网页的访问量为疑似作弊,当获取到目标网页的访问来源信息之后,可以根据访问来源信息来判断目标网页的访问量是否出现作弊。例如,当获取到的访问来源信 息中,大部分访问来源信息的访问路径都来自一些非主流网站或者一个很少人接触的网站(即访问者通过一些非主流网站或者一个很少人接触的网站连接到目标网页),或者是来自目标网页本身,那么可以认定该目标网页的访问量很大程度上是采用一定的作弊手段,通过一些非主流网站或者一个很少人接触的网站的连接来增加目标网页的访问量,或者是通过不断刷新目标网页的方式增加该目标网页的访问量。其作弊的可能性较高,可以认定为该目标网页的访问量作弊。 
根据本发明实施例,通过判断第一获取单元10获取的目标网页的访问量是否满足预设条件,当访问量满足预设条件时,认定为目标网页访问量疑似作弊,并进一步获取目标网页的访问来源信息,根据访问来源信息进一步判断目标网页的访问量的是否作弊,通过对目标网页的来源信息的分析和判定提高对目标网页的访问量作弊的检测的精度,达到了准确识别目标网页的访问量作弊的效果。 
图2是根据本发明第二实施例的网页访问量作弊的检测装置的结构示意图。该实施例的网页访问量作弊的检测装置可以作为上述实施例的一种优选实施方式。如图2所示,该网页访问量作弊的检测装置包括第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40,其中,第一判断单元20包括第一获取模块201、第一判断模块202和第一确定模块203。第二获取单元30和第二判断单元40与图1所示的第二获取单元30和第二判断单元40功能相同,这里不做赘述。 
第一获取单元10还用于获取目标网页的历史访问量和当前访问量。历史访问量和当前访问量均为目标网页的访问量。历史访问量表示过去的一个单位间内的目标网页的访问量,当前访问量表示当前一个单位时间内目标网页的访问量。其中过去的一个单位时间与当前的一个单位时间为同一个单位时间。例如,以一天为时间单位,当前访问量可以为当前这一天的目标网页的访问量,历史访问量可以为前一天的目标网页的访问量。通过在目标网页的源代码中加入检测代码等方式可以获取目标网页的历史访问量和当前访问量。 
第一获取模块201用于获取历史访问量和当前访问量的比值。将历史访问量和当前访问量进行比较,得到一个比值,例如,目标网页的当前访问量为当天的访问量,那么历史访问量可以为前一天的访问量,其中,访问量可以是访问流量或者访问点击量,将两者的访问流量或者访问点击量进行对比,得到一个比值,该比值可以是当前访问量除以历史访问量得到的比值,也可以是历史访问量除以当前访问量得到的比值,还可以是当前访问量超出历史访问量的比例。获取该比值可以看出访问量的变化趋势,例如比值为当前访问量除以历史访问量得到的比值,当该比值大于1,表示当前访问量大于历史访问量,同时当该比值越大,则表示当前访问量出现猛增的态势。 
第一判断模块202用于判断比值是否超出第一设定阈值。第一设定阈值可以根据实际情况进行设定。例如,当比值为当前访问量除以历史访问量得到的比值时,第一设定阈值可以设定为1.5,判断比值是否超出第一设定阈值则表示判断当前访问量是否 超出历史访问量的1.5倍,第一设定阈值也可以设定为2,判断比值是否超出第一设定阈值则表示判断当前访问量是否超出历史访问量的2倍。当比值表示当前访问量超出历史访问量的比例时,第一设定阈值可以设定为30%,判断比值是否超出第一设定阈值则表示判断当前访问量相对于历史访问量的访问量的增长率是否超过30%。 
第一确定模块203用于当比值超出第一设定阈值时,确定访问量满足预定条件,当比值未超出第一设定阈值时,确定访问量不满足预定条件。当比值超出第一设定阈值则报警提示,并确定访问量满足预设条件,执行步骤S206。例如,当比值为当前访问量除以历史访问量得到的比值时,第一设定阈值可以设定为1.5,判断比值是否超出第一设定阈值表示判断当前访问量是否超出历史访问量的1.5倍,如果比值超过第一设定阈值1.5,则确定访问量满足预定条件,其当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析,即获取访问来源信息。当比值为当前访问量超出历史访问量的比例时,第一设定阈值可以设定为30%,判断比值是否超出第一设定阈值则表示判断当前访问量相对于历史访问量的访问量的增长率是否超过30%,当增长率超过30%时,则确定访问量满足预定条件,其当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析。当比值未超出第一设定阈值时,如上述举例中如果比值未超过第一设定阈值1.5,则确定访问量不满足预定条件,访问量为出现异常,可以认定目标网页的访问量未作弊。 
图3是根据本发明第三实施例的网页访问量作弊的检测装置的结构示意图。该实施例的网页访问量作弊的检测装置可以作为上述实施例的一种优选实施方式。如图3所示,该网页访问量作弊的检测装置包括第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40,其中,第一判断单元20包括第二获取模块204、第二判断模块205和第二确定模块206。第二获取单元30和第二判断单元40与图1所示的第二获取单元30和第二判断单元40功能相同,这里不做赘述。 
第一获取单元10还用于获取目标网页的历史访问量和当前访问量。历史访问量和当前访问量均为目标网页的访问量。历史访问量表示过去的一个单位间内的目标网页的访问量,当前访问量表示当前一个单位时间内目标网页的访问量。其中过去的一个单位时间与当前的一个单位时间为同一个单位时间。例如,以一天为时间单位,当前访问量可以为当前这一天的目标网页的访问量,历史访问量可以为前一天的目标网页的访问量。通过在目标网页的源代码中加入检测代码等方式可以获取目标网页的历史访问量和当前访问量。 
第二获取模块204用于获取历史访问量和当前访问量的差值。将历史访问量和当前访问量作减法处理,得到一个差值,例如,目标网页的当前访问量为当天的访问量,那么历史访问量可以为前一天的访问量,其中,访问量可以是访问流量或者访问点击量,将两者的访问流量或者访问点击量作减法处理,得到一个差值,该差值可以是当前访问量减去历史访问量得到的差值,也可以是历史访问量减去当前访问量得到的差 值。获取该差值可以看出访问量的变化趋势,例如差值为当前访问量减去历史访问量得到的差值,当该差值为正,表示当前访问量大于历史访问量,同时当该差值越大,则表示当前访问量出现猛增的态势。 
第二判断模块205,用于判断差值是否超出第二设定阈值。第二设定阈值可以根据实际情况进行设定。例如,当差值为当前访问量减去历史访问量得到的差值时,判断差值是否超出第一设定阈值则表示判断当前访问量超出历史访问量的访问量是否超出第二设定阈值。 
第二确定模块206,用于当差值超出第二设定阈值时,确定访问量满足预定条件,当差值未超出第二设定阈值时,确定访问量不满足预定条件。差值超出第二设定阈值表示当前访问量超出历史访问量的访问量是否超出第二设定阈值。当差值超出第二设定阈值则报警提示,并确定访问量满足预设条件,执行步骤S306。当差值超过第二设定阈值时,表明当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析,即获取访问来源信息。当差值未超出第二设定阈值时,则表示访问量为出现异常,可以认定目标网页的访问量未作弊。 
图4是根据本发明第四实施例的网页访问量作弊的检测装置的结构示意图。该实施例的网页访问量作弊的检测装置可以作为上述实施例的一种优选实施方式。如图4所示,该网页访问量作弊的检测装置包括第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40,其中,第二获取单元30包括第三获取模块301、第四获取模块302和生成模块303,第二判断单元40包括第五获取模块401、计算模块402、第三判断模块403和第三确定模块404。第一获取单元10和第一判断单元20与图1所示的第一获取单元10和第一判断单元20功能相同,这里不做赘述。 
第三获取模块301用于获取目标网页的源代码。当访问量满足预定条件时,第二获取单元30获取目标网页的访问来源信息,其中获取目标网页的访问来源信息要先通过第三获取模块301获取目标网页的源代码,该源代码可以用于获取目标网页的访问来源信息。 
第四获取模块302用于在源代码中加入检测代码以获取目标网页的访问IP地址。检测代码用于检测目标网页的访问来源信息,该访问来源信息为访问IP地址。该访问IP地址为访问者的IP地址,在源代码中加入检测代码以获取目标网页的所有访问IP地址。例如,当有3个访问者访问目标网页时,通过在目标网页中加入检测代码,可以获取这3次访问的访问者的IP地址,这3各访问IP地址可以是相同的IP地址,也可以是不相同的IP地址。 
生成模块303,用于将访问IP地址作为访问来源信息。访问者的IP地址可以表示访问的来源信息,可以表示目标网页确实被具有该IP地址的访问者访问。将访问IP地址作为访问来源信息,以便于进一步检测目标网页的访问量的具体情况。 
第五获取模块401用于获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问目标网页最多的一个访问IP地址。由于通过检测代码获取到的访问IP地址包括多个IP地址,且每一个IP地址都会给目标网页带来一定的访问量。第一访问IP地址可以是访问IP地址中的访问所述目标网页最多的一个访问者的IP地址。例如,当检测代码检测到访问目标网页的IP地址有3个,其中一个IP地址访问目标网页的次数最多,那么该IP地址即为第一访问IP地址。第一访问量为第一访问IP地址访问目标网页的访问量,该第一访问量占总访问量的比例比其他任意一个访问IP地址的访问量都要大。 
计算模块402,用于计算第一访问量与访问量的比值。其中访问量为目标网页的总访问量,计算第一访问量占总访问量的比值,以便于判断第一访问量在总访问量中所占的比重。 
第三判断模块403,用于判断第一访问量与访问量的比值是否超出第三设定阈值。第三设定阈值可以根据需要进行设定,例如,当第三设定阈值为0.5时,则判断第一访问量与访问量的比值是否超出第三设定阈值表示判断第一访问量是否超过总访问量的一半访问量。 
第三确定模块404,用于当第一访问量与访问量的比值超出第三设定阈值时,确定目标网页的访问量作弊;当第一访问量与访问量的比值未超出第三设定阈值时,确定目标网页的访问量未作弊。如上所述,当第三设定阈值为0.5时,第一访问量与访问量的比值超出0.5,则表示第一访问量超过总访问量的一半访问量,此时可以认为目标网页的访问量是通过一定的作弊手段实现的,其访问量作弊的可能性比较大。如上所述,当第三设定阈值为0.5时,第一访问量与访问量的比值未超出0.5,则表示第一访问量未超过总访问量的一半访问量,此时可以认为目标网页的访问量正常,基本可以认定目标网页的访问量未作弊。 
图5是根据本发明第五实施例的网页访问量作弊的检测装置的结构示意图。该实施例的网页访问量作弊的检测装置可以作为上述实施例的一种优选实施方式。如图5所示,该网页访问量作弊的检测装置包括第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40,其中,第二获取单元30包括第三获取模块301、第四判断模块和生成模块303,第二判断单元40包括第五获取模块401、计算模块402、第三判断模块403和第三确定模块404,第三确定模块404包括获取子模块4041、判断子模块4042和确定子模块4043。第一获取单元10、第一判断单元20和第二获取单元30与图4所示的第一获取单元10、第一判断单元20和第二获取单元30功能相同,第二判断模块205中的第五获取模块401、计算模块402、第三判断模块403与图4所示的第五获取模块401、计算模块402、第三判断模块403功能相同,这里不做赘述。 
获取子模块4041用于获取第一访问IP的访问停留时间。访问停留时间表示访问者访问目标网页时,在目标网页的停留时间,第一访问IP地址访问过目标网页的很多 次,因此访问停留时间也包括多个访问停留时间,获取第一访问IP地址的访问停留时间即是获取第一访问IP地址的每一次访问的访问停留时间。 
判断子模块4042,用于判断访问停留时间是否超出第四设定阈值。第四设定阈值为访问时间阈值,即该阈值为时间值,可以根据需要进行设定,由于访问停留时间包括多个访问停留时间,因此,判断访问停留时间是否超出第四设定阈值表示判断每次访问停留时间是否超出第四设定阈值。例如,当第四设定阈值为3s时,判断第一访问IP地址的每一次访问停留时间是否超出3s。 
确定子模块4043,用于当访问停留时间未超出第四设定阈值时,确定目标网页的访问量作弊,当访问停留时间超出第四设定阈值时,确定目标网页的访问量未作弊。访问停留时间未超出第四设定阈值表示第一访问IP地址的多次访问的访问停留时间均未超出第四设定阈值,假如第一访问IP地址的第一访问量中大部分的访问停留时间均未超出第四设定阈值,则认为目标网页的访问量作弊。例如,当第四设定阈值为3s时,如果第一访问IP地址的第一访问量中大部分的访问停留时间均不到3s,则表明第一访问IP地址的第一访问量中大部分的访问量为非正常访问,很可能采用了一种刷网页点击量的形式,不符合常理,则认为该目标网页的访问量作弊。同理,如果第一访问IP地址的第一访问量中大部分的访问停留时间均超出第四设定阈值,则表示第一访问量为正常访问的访问量,因此可以认为目标网页的访问量未作弊。 
图6是根据本发明第五实施例的网页访问量作弊的检测装置的结构示意图。该实施例的网页访问量作弊的检测装置可以作为上述实施例的一种优选实施方式。如图6所示,该网页访问量作弊的检测装置包括第一获取单元10、第一判断单元20、第二获取单元30、第二判断单元40、第三获取单元50、检测单元60和确定单元70。第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40与图1所示的第一获取单元10、第一判断单元20、第二获取单元30和第二判断单元40功能相同,这里不做赘述。 
第三获取单元50用于在获取目标网页的访问量之前,获取目标网页的源代码。可以通过爬虫程序抓取目标网页的源代码,也可以通过其他方式,获取到源代码可以得到目标网页的组织架构,以便于对目标网页进行检测。 
检测单元60,用于检测源代码中是否存在大小为0*0或者1*1的内联框架iframe。由于大小为0×0或1×1的iframe,也就是不可见的iframe。通过iframe打开其他页面,使得用户打开了并非自己想要进入的网页,在看不见的情况下刷流量或者访问量。可以编写分析程序,从源代码中分析是否存在大小为0*0或者1*1的内联框架iframe。 
确定单元70用于当所述源代码中不存在所述iframe时,获取所述目标网页的访问量。由于该大小为0*0或者1*1的内联框架iframe是用于骗取访问量,在访问者不知情的情况下刷访问量,因此,当检测到目标网页的源代码中存在有该iframe时,可 以认定采取了作弊手段,则可以确定目标网页访问量作弊。当源代码中不存在该iframe时,则通过获取目标网页的访问量进行下一步判断。 
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。 
本发明实施例还提供了一种网页访问量作弊的检测方法。该网页访问量作弊的检测方法可以运行在计算机设备上。需要说明的是,本发明实施例的网页访问量作弊的检测方法可以通过本发明实施例的网页访问量作弊的检测装置来执行,本发明实施例的网页访问量作弊的检测装置也可以用于执行本发明实施例的网页访问量作弊的检测方法。 
图7是根据本发明第一实施例的网页访问量作弊的检测方法的流程图。如图7所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S101,获取目标网页的访问量。获取到的访问量为目标网页的总访问量。目标网页为需要进行访问量作弊的检测的网页,该网页可以是任意一个网站中的任意一个网页,可以是广告主投放广告的网页,也可以是广告主营销的产品网页。例如,当目标网页为广告主投放广告的网页时,获取该网页的访问量可以得知广告主投放的广告的浏览量。其中,访问量可以是访问流量,也可以是访问点击量。访问量可以是历史访问量,历史访问量表示过去的一定时间段内目标网页的访问量。访问量也可以是当前访问量,当前访问量表示当前一定时间段内的目标网页的访问量。访问量也可以是历史访问量和当前访问量。第一获取单元10获取该访问量可以是通过在目标网页中加入检测代码,用来检测目标网页的访问流量或者访问点击量等访问量信息,也可以从目标网页的日志文件中直接读取目标网页的访问流量或者访问点击量等访问量信息。 
步骤S102,判断访问量是否满足预定条件。根据第一获取单元10获取的目标网页的访问量,第一判断单元20将该访问量作为判断基础,判断该访问量是否满足预定条件。该预定条件可以是访问量的变化规律,例如,该预定条件为访问量发生突变时的一个阈值,当访问量超过该阈值时,认为访问量满足预定条件,此时可以认定访问量发生突变,也即是当前访问量相比于历史访问量发生了突变,该突变可以表示当前访问量出现迅速增加的态势,也可以表示当前访问量出现迅速降低的态势。本实施例以当前访问量出现迅速增加的态势为访问量的突变状态。第一判断单元20判断出该访问量是否满足预定条件,以便于判断该访问量是否为疑似作弊。当访问量出现急速增加的态势,如当前日的访问量远远大于前一日的访问量,可以认定该目标网页的访问 量有作弊嫌疑。 
步骤S103,如果访问量满足预定条件,获取目标网页的访问来源信息。当目标网页的访问量满足预定条件时,则认定为该目标网页的访问量疑似作弊。当目标网页疑似作弊时,第二获取单元30获取该目标网页的访问来源信息。访问来源信息可以是访问者的访问IP(Internet Protocol,简称IP)地址,也可以是访问者这次访问的路径信息,如针对一次访问,该次访问可以是通过其他网页的超链接访问到该目标网页。通过在目标网页的源代码中加入检测代码,可以获取该次访问的链入网页的网址,也可以获取访问者的访问IP。通过获取该访问来源信息,以便于判断目标网页的访问量是否作弊。如果访问量不满足预定条件,则可以认为目标网页到目前为止的访问量没有作弊,继续检测目标网页的访问量是否满足预设条件。 
步骤S104,根据访问来源信息判断目标网页的访问量是否作弊。由于此时目标网页的访问量为疑似作弊,当获取到目标网页的访问来源信息之后,可以根据访问来源信息来判断目标网页的访问量是否出现作弊。例如,当获取到的访问来源信息中,大部分访问来源信息都来自一个非主流网站或者一个很少人接触的网站,或者是来自目标网页本身,那么可以认定该目标网页的访问量很大程度上是采用一定的作弊手段,通过一些非主流网站或者一个很少人接触的网站的链入来增加目标网页的访问量,或者是通过不断刷新目标网页的方式增加该目标网页的访问量。其作弊的可能性较高,可以认定为该目标网页的访问量作弊。 
根据本发明实施例,通过判断第一获取单元10获取的目标网页的访问量是否满足预设条件,当访问量满足预设条件时,认定为目标网页访问量疑似作弊,并进一步获取目标网页的访问来源信息,根据访问来源信息进一步判断目标网页的访问量的是否作弊,通过对目标网页的来源信息的分析和判定提高对目标网页的访问量作弊的检测的精度,达到了准确识别目标网页的访问量作弊的效果。 
图8是根据本发明第二实施例的网页访问量作弊的检测方法的流程图。该实施例的网页访问量作弊的检测方法可以作为上述实施例的网页访问量作弊的检测方法的一种优选实施方式。如图8所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S201,获取目标网页的历史访问量和当前访问量。历史访问量和当前访问量均为目标网页的访问量。历史访问量表示过去的一个单位间内的目标网页的访问量,当前访问量表示当前一个单位时间内目标网页的访问量。其中过去的一个单位时间与当前的一个单位时间为同一个单位时间。例如,以一天为时间单位,当前访问量可以为当前这一天的目标网页的访问量,历史访问量可以为前一天的目标网页的访问量。通过在目标网页的源代码中加入检测代码等方式可以获取目标网页的历史访问量和当前访问量。 
步骤S202,获取历史访问量和当前访问量的比值。将历史访问量和当前访问量进 行比较,得到一个比值,例如,目标网页的当前访问量为当天的访问量,那么历史访问量可以为前一天的访问量,其中,访问量可以是访问流量或者访问点击量,将两者的访问流量或者访问点击量进行对比,得到一个比值,该比值可以是当前访问量除以历史访问量得到的比值,也可以是历史访问量除以当前访问量得到的比值,还可以是当前访问量超出历史访问量的比例。获取该比值可以看出访问量的变化趋势,例如比值为当前访问量除以历史访问量得到的比值,当该比值大于1,表示当前访问量大于历史访问量,同时当该比值越大,则表示当前访问量出现猛增的态势。 
步骤S203,判断比值是否超出第一设定阈值。第一设定阈值可以根据实际情况进行设定。例如,当比值为当前访问量除以历史访问量得到的比值时,第一设定阈值可以设定为1.5,判断比值是否超出第一设定阈值则表示判断当前访问量是否超出历史访问量的1.5倍,第一设定阈值也可以设定为2,判断比值是否超出第一设定阈值则表示判断当前访问量是否超出历史访问量的2倍。当比值表示当前访问量超出历史访问量的比例时,第一设定阈值可以设定为30%,判断比值是否超出第一设定阈值则表示判断当前访问量相对于历史访问量的访问量的增长率是否超过30%。 
步骤S204,如果比值超出第一设定阈值,则确定访问量满足预定条件。当比值超出第一设定阈值则报警提示,并确定访问量满足预设条件,执行步骤S206。例如,当比值为当前访问量除以历史访问量得到的比值时,第一设定阈值可以设定为1.5,判断比值是否超出第一设定阈值表示判断当前访问量是否超出历史访问量的1.5倍,如果比值超过第一设定阈值1.5,则确定访问量满足预定条件,其当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析,即获取访问来源信息。当比值为当前访问量超出历史访问量的比例时,第一设定阈值可以设定为30%,判断比值是否超出第一设定阈值则表示判断当前访问量相对于历史访问量的访问量的增长率是否超过30%,当增长率超过30%时,则确定访问量满足预定条件,其当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析。 
步骤S205,如果比值未超出第一设定阈值,则确定访问量不满足预定条件。当比值未超出第一设定阈值时,如上述举例中如果比值未超过第一设定阈值1.5,则确定访问量不满足预定条件,访问量为出现异常,可以认定目标网页的访问量未作弊。 
步骤S206,如果访问量满足预定条件,获取目标网页的访问来源信息。当目标网页的访问量满足预定条件时,则认定为该目标网页的访问量疑似作弊。当目标网页疑似作弊时,第二获取单元30获取该目标网页的访问来源信息。访问来源信息可以是访问者的访问IP地址,也可以是访问的入链的网页的网址,如针对一次访问,该次访问可以是通过其他网页的超链接访问到该目标网页,通过在目标网页的源代码中加入检测代码,可以获取该次访问的链入网页的网址,也可以获取访问者的访问IP。通过获取该访问来源信息,以便于判断目标网页的访问量是否作弊。 
步骤S207,根据访问来源信息判断目标网页的访问量是否作弊。由于此时目标网 页的访问量为疑似作弊,当获取到目标网页的访问来源信息之后,可以根据访问来源信息来判断目标网页的访问量是否出现作弊。例如,当获取到的访问来源信息中,大部分访问来源信息都来自一个非主流网站或者一个很少人接触的网站,亦或者是来自目标网页本身,那么可以认定该目标网页的访问量很大程度上是采用一定的作弊手段,通过一些非主流网站或者一个很少人接触的网站的链入来刷目标网页的访问量,或者是通过不断刷新目标网页的方式刷该目标网页的访问量。其作弊的可能性较高,可以认定为该目标网页的访问量作弊。 
图9是根据本发明第三实施例的网页访问量作弊的检测方法的流程图。该实施例的网页访问量作弊的检测方法可以作为上述实施例的网页访问量作弊的检测方法的一种优选实施方式。如图9所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S301,获取目标网页的历史访问量和当前访问量。历史访问量和当前访问量均为目标网页的访问量。历史访问量表示过去的一个单位间内的目标网页的访问量,当前访问量表示当前一个单位时间内目标网页的访问量。其中过去的一个单位时间与当前的一个单位时间为同一个单位时间。例如,以一天为时间单位,当前访问量可以为当前这一天的目标网页的访问量,历史访问量可以为前一天的目标网页的访问量。通过在目标网页的源代码中加入检测代码等方式可以获取目标网页的历史访问量和当前访问量。 
步骤S302,获取历史访问量和当前访问量的差值。将历史访问量和当前访问量作减法处理,得到一个差值,例如,目标网页的当前访问量为当天的访问量,那么历史访问量可以为前一天的访问量,其中,访问量可以是访问流量或者访问点击量,将两者的访问流量或者访问点击量作减法处理,得到一个差值,该差值可以是当前访问量减去历史访问量得到的差值,也可以是历史访问量减去当前访问量得到的差值。获取该差值可以看出访问量的变化趋势,例如差值为当前访问量减去历史访问量得到的差值,当该差值为正,表示当前访问量大于历史访问量,同时当该差值越大,则表示当前访问量出现猛增的态势。 
步骤S303,判断差值是否超出第二设定阈值。第二设定阈值可以根据实际情况进行设定。例如,当差值为当前访问量减去历史访问量得到的差值时,判断差值是否超出第一设定阈值则表示判断当前访问量超出历史访问量的访问量是否超出第二设定阈值。 
步骤S304,如果差值超出第二设定阈值,则确定访问量满足预定条件。差值超出第二设定阈值表示当前访问量超出历史访问量的访问量是否超出第二设定阈值。当差值超出第二设定阈值则报警提示,并确定访问量满足预设条件,执行步骤S306。当差值超过第二设定阈值时,表明当前访问量出现凸变或者迅速增加的趋势,可以认定有一定的作弊嫌疑,进行下一步分析,即获取访问来源信息。 
步骤S305,如果差值未超出第二设定阈值,则确定访问量不满足预定条件。当差值未超出第二设定阈值时,则表示访问量为出现异常,可以认定目标网页的访问量未作弊。 
步骤S306,如果访问量满足预定条件,获取目标网页的访问来源信息。当目标网页的访问量满足预定条件时,则认定为该目标网页的访问量疑似作弊。当目标网页疑似作弊时,第二获取单元30获取该目标网页的访问来源信息。访问来源信息可以是访问者的访问IP地址,也可以是访问的入链的网页的网址,如针对一次访问,该次访问可以是通过其他网页的超链接访问到该目标网页,通过在目标网页的源代码中加入检测代码,可以获取该次访问的链入网页的网址,也可以获取访问者的访问IP。通过获取该访问来源信息,以便于判断目标网页的访问量是否作弊。 
步骤S307,根据访问来源信息判断目标网页的访问量是否作弊。由于此时目标网页的访问量为疑似作弊,当获取到目标网页的访问来源信息之后,可以根据访问来源信息来判断目标网页的访问量是否出现作弊。例如,当获取到的访问来源信息中,大部分访问来源信息都来自一个非主流网站或者一个很少人接触的网站,亦或者是来自目标网页本身,那么可以认定该目标网页的访问量很大程度上是采用一定的作弊手段,通过一些非主流网站或者一个很少人接触的网站的链入来刷目标网页的访问量,或者是通过不断刷新目标网页的方式刷该目标网页的访问量。其作弊的可能性较高,可以认定为该目标网页的访问量作弊。 
图10是根据本发明第四实施例的网页访问量作弊的检测方法的流程图。该实施例的网页访问量作弊的检测方法可以作为上述实施例的网页访问量作弊的检测方法的一种优选实施方式。如图10所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S401,获取目标网页的访问量。目标网页为需要进行访问量作弊的检测的网页,该网页可以是任意一个网站中的任意一个网页,可以是广告主投放广告的网页,也可以是广告主营销的产品网页。例如,当目标网页为广告主投放广告的网页时,获取该网页的访问量可以得知广告主投放的广告的浏览量。其中,访问量可以是访问流量,也可以是访问点击量。访问量可以是历史访问量,历史访问量表示过去的一定时间段内目标网页的访问量。访问量也可以是当前访问量,当前访问量表示当前一定时间段内的目标网页的访问量。访问量也可以是历史访问量和当前访问量。第一获取单元10获取该访问量可以是通过在目标网页中加入检测代码,用来检测目标网页的访问流量或者访问点击量等访问量信息,也可以从目标网页的日志文件中直接读取目标网页的访问流量或者访问点击量等访问量信息。 
步骤S402,判断访问量是否满足预定条件。根据第一获取单元10获取的目标网页的访问量,第一判断单元20将该访问量作为判断基础,判断该访问量是否满足预定条件。该预定条件可以是访问量的变化规律,例如,该预定条件为访问量发生突变时的一个阈值,当访问量超过该阈值时,认为访问量满足预定条件,此时可以认定访问 量发生突变,也即是当前访问量相比于历史访问量发生了突变,该突变可以表示当前访问量出现迅速增加的态势,也可以表示当前访问量出现迅速降低的态势。本实施例以当前访问量出现迅速增加的态势为访问量的突变状态。第一判断单元20判断出该访问量是否满足预定条件,以便于判断该访问量是否为疑似作弊。当访问量出现急速增加的态势,如当前日的访问量远远大于前一日的访问量,可以认定该目标网页的访问量有作弊嫌疑,反之,则可认为目标网页的访问量没有作弊。 
步骤S403,如果访问量满足预定条件,获取目标网页的源代码。当访问量满足预定条件时,获取目标网页的访问来源信息,其中获取目标网页的访问来源信息要先获取目标网页的源代码,该源代码可以用于获取目标网页的访问来源信息。如果访问量不满足预定条件,则可以认为目标网页到目前为止的访问量没有作弊,继续检测目标网页的访问量是否满足预设条件。 
步骤S404,在源代码中加入检测代码以获取目标网页的访问IP地址。检测代码用于检测目标网页的访问来源信息,该访问来源信息为访问IP地址。该访问IP地址为访问者的IP地址,在源代码中加入检测代码以获取目标网页的所有访问IP地址。例如,当有3个访问者访问目标网页时,通过在目标网页中加入检测代码,可以获取这3次访问的访问者的IP地址,这3个访问IP地址可以是相同的IP地址,也可以是不相同的IP地址。 
步骤S405,将访问IP地址作为访问来源信息。访问者的IP地址可以表示访问的来源信息,可以表示目标网页确实被具有该IP地址的访问者访问。将访问IP地址作为访问来源信息,以便于进一步检测目标网页的访问量的具体情况。 
步骤S406,获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问所述目标网页最多的一个访问IP地址。由于通过检测代码获取到的访问IP地址包括多个IP地址,且每一个IP地址都会给目标网页带来一定的访问量。第一访问IP地址可以是访问IP地址中的访问所述目标网页最多的一个访问者的IP地址。例如,当检测代码检测到访问目标网页的IP地址有3个,其中一个IP地址访问目标网页的次数最多,那么该IP地址即为第一访问IP地址。第一访问量为第一访问IP地址访问目标网页的访问量,该第一访问量占总访问量的比例比其他任意一个访问IP地址的访问量都要大。 
步骤S407,计算第一访问量与访问量的比值。其中访问量为目标网页的总访问量,计算第一访问量占总访问量的比值,以便于判断第一访问量在总访问量中所占的比重。 
步骤S408,判断第一访问量与访问量的比值是否超出第三设定阈值。第三设定阈值可以根据需要进行设定,例如,当第三设定阈值为0.5时,则判断第一访问量与访问量的比值是否超出第三设定阈值表示判断第一访问量是否超过总访问量的一半访问量。 
步骤S409,如果第一访问量与访问量的比值超出第三设定阈值,则确定目标网页的访问量作弊。如上所述,当第三设定阈值为0.5时,第一访问量与访问量的比值超出0.5,则表示第一访问量超过总访问量的一半访问量,此时可以认为目标网页的访问量是通过一定的作弊手段实现的,其访问量作弊的可能性比较大。 
步骤S410,如果第一访问量与访问量的比值未超出第三设定阈值,则确定目标网页的访问量未作弊。如上所述,当第三设定阈值为0.5时,第一访问量与访问量的比值未超出0.5,则表示第一访问量未超过总访问量的一半访问量,此时可以认为目标网页的访问量正常,基本可以认定目标网页的访问量未作弊。 
图11是根据本发明第五实施例的网页访问量作弊的检测方法的流程图。该实施例的网页访问量作弊的检测方法可以作为上述实施例的网页访问量作弊的检测方法的一种优选实施方式。如图11所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S501,获取目标网页的访问量。目标网页为需要进行访问量作弊的检测的网页,该网页可以是任意一个网站中的任意一个网页,可以是广告主投放广告的网页,也可以是广告主营销的产品网页。例如,当目标网页为广告主投放广告的网页时,获取该网页的访问量可以得知广告主投放的广告的浏览量。其中,访问量可以是访问流量,也可以是访问点击量。访问量可以是历史访问量,历史访问量表示过去的一定时间段内目标网页的访问量。访问量也可以是当前访问量,当前访问量表示当前一定时间段内的目标网页的访问量。访问量也可以是历史访问量和当前访问量。第一获取单元10获取该访问量可以是通过在目标网页中加入检测代码,用来检测目标网页的访问流量或者访问点击量等访问量信息,也可以从目标网页的日志文件中直接读取目标网页的访问流量或者访问点击量等访问量信息。 
步骤S502,判断访问量是否满足预定条件;根据第一获取单元10获取的目标网页的访问量,第一判断单元20将该访问量作为判断基础,判断该访问量是否满足预定条件。该预定条件可以是访问量的变化规律,例如,该预定条件为访问量发生突变时的一个阈值,当访问量超过该阈值时,认为访问量满足预定条件,此时可以认定访问量发生突变,也即是当前访问量相比于历史访问量发生了突变,该突变可以表示当前访问量出现迅速增加的态势,也可以表示当前访问量出现迅速降低的态势。本实施例以当前访问量出现迅速增加的态势为访问量的突变状态。第一判断单元20判断出该访问量是否满足预定条件,以便于判断该访问量是否为疑似作弊。当访问量出现急速增加的态势,如当前日的访问量远远大于前一日的访问量,可以认定该目标网页的访问量有作弊嫌疑。 
步骤S503,如果访问量满足预定条件,获取目标网页的源代码。当访问量满足预定条件时,获取目标网页的访问来源信息,其中获取目标网页的访问来源信息要先获取目标网页的源代码,该源代码可以用于获取目标网页的访问来源信息。如果访问量不满足预定条件,则可以认为目标网页到目前为止的访问量没有作弊,继续检测目标 网页的访问量是否满足预设条件。 
步骤S504,在源代码中加入检测代码以获取目标网页的访问IP地址。检测代码用于检测目标网页的访问来源信息,该访问来源信息为访问IP地址。该访问IP地址为访问者的IP地址,在源代码中加入检测代码以获取目标网页的所有访问IP地址。例如,当有3个访问者访问目标网页时,通过在目标网页中加入检测代码,可以获取这3次访问的访问者的IP地址,这3个访问IP地址可以是相同的IP地址,也可以是不相同的IP地址,该访问IP地址即为目标网页的访问来源信息。 
步骤S505,将访问IP地址作为访问来源信息。访问者的IP地址可以表示访问的来源信息,可以表示目标网页确实被具有该IP地址的访问者访问。将访问IP地址作为访问来源信息,以便于进一步检测目标网页的访问量的具体情况。 
步骤S506,获取访问IP地址中的第一访问IP地址的第一访问量,第一访问IP地址为访问IP地址中访问所述目标网页最多的一个访问IP地址。由于通过检测代码获取到的访问IP地址包括多个IP地址,且每一个IP地址都会给目标网页带来一定的访问量。第一访问IP地址可以是访问IP地址中的访问所述目标网页最多的一个访问者的IP地址。例如,当检测代码检测到访问目标网页的IP地址有3个,其中一个IP地址访问目标网页的次数最多,那么该IP地址即为第一访问IP地址。第一访问量为第一访问IP地址访问目标网页的访问量,该第一访问量占总访问量的比例比其他任意一个访问IP地址的访问量都要大。 
步骤S507,计算第一访问量与访问量的比值。其中访问量为目标网页的总访问量,计算第一访问量占总访问量的比值,以便于判断第一访问量在总访问量中所占的比重。 
步骤S508,判断第一访问量与访问量的比值是否超出第三设定阈值。第三设定阈值可以根据需要进行设定,例如,当第三设定阈值为0.5时,则判断第一访问量与访问量的比值是否超出第三设定阈值表示判断第一访问量是否超过总访问量的一半访问量。 
步骤S509,如果第一访问量与访问量的比值超出第三设定阈值,则获取第一访问IP地址的访问停留时间。访问停留时间表示访问者访问目标网页时,在目标网页的停留时间,第一访问IP地址访问过目标网页的很多次,因此访问停留时间也包括多个访问停留时间,获取第一访问IP地址的访问停留时间即是获取第一访问IP地址的每一次访问的访问停留时间。 
步骤S510,判断访问停留时间是否超出第四设定阈值。第四设定阈值为访问时间阈值,即该阈值为时间值,可以根据需要进行设定,由于访问停留时间包括多个访问停留时间,因此,判断访问停留时间是否超出第四设定阈值表示判断每次访问停留时间是否超出第四设定阈值。例如,当第四设定阈值为3s时,判断第一访问IP地址的每一次访问停留时间是否超出3s。 
步骤S511,如果访问停留时间未超出第四设定阈值,则确定目标网页的访问量作弊。访问停留时间未超出第四设定阈值表示第一访问IP地址的多次访问的访问停留时间均未超出第四设定阈值,假如第一访问IP地址的第一访问量中大部分的访问停留时间均未超出第四设定阈值,则认为目标网页的访问量作弊。例如,当第四设定阈值为3s时,如果第一访问IP地址的第一访问量中大部分的访问停留时间均不到3s,则表明第一访问IP地址的第一访问量中大部分的访问量为非正常访问,很可能采用了一种刷网页点击量的形式,不符合常理,则认为该目标网页的访问量作弊。 
步骤S512,如果访问停留时间超出第四设定阈值,则确定目标网页的访问量未作弊。同理,如果第一访问IP地址的第一访问量中大部分的访问停留时间均超出第四设定阈值,则表示第一访问量为正常访问的访问量,因此可以认为目标网页的访问量未作弊。 
图12是根据本发明第六实施例的网页访问量作弊的检测方法的流程图。该实施例的网页访问量作弊的检测方法可以作为上述实施例的网页访问量作弊的检测方法的一种优选实施方式。如图12所示,该网页访问量作弊的检测方法包括步骤如下: 
步骤S601,获取目标网页的源代码。可以通过爬虫程序抓取目标网页的源代码,也可以通过其他方式,获取到源代码可以得到目标网页的组织架构,以便于对目标网页进行检测。 
步骤S602,检测源代码中是否存在大小为0*0或者1*1的内联框架iframe。由于大小为0×0或1×1的iframe,也就是不可见的iframe。通过iframe打开其他页面,使得用户打开了并非自己想要进入的网页,在看不见的情况下刷流量或者访问量。可以编写分析程序,从源代码中分析是否存在大小为0*0或者1*1的内联框架iframe。 
步骤S603,如果源代码中不存在iframe,则获取目标网页的访问量。当源代码中不存在该iframe时,则通过获取目标网页的访问量进行下一步判断。如果源代码中存在iframe,则确定目标网页访问量作弊。由于该大小为0*0或者1*1的内联框架iframe是用于骗取访问量,在访问者不知情的情况下刷访问量,因此,当检测到目标网页的源代码中存在有该iframe时,可以认定采取了作弊手段,则可以确定目标网页访问量作弊。 
步骤S604,判断访问量是否满足预定条件。 
步骤S605,如果访问量满足预定条件,获取目标网页的访问来源信息。 
步骤S606,根据访问来源信息判断目标网页的访问量是否作弊。 
步骤S603中获取目标网页的访问量,以及步骤S604、步骤S605和步骤S606与本发明图7所示的网页访问量作弊的检测方法的步骤S101、步骤S102、步骤S103和步骤S104相同,这里不作赘述。 
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 

Claims (12)

1.一种网页访问量作弊的检测方法,其特征在于,包括:
获取目标网页的访问量;
判断所述访问量是否满足预定条件;
如果所述访问量满足预定条件,获取所述目标网页的访问来源信息;以及
根据所述访问来源信息判断所述目标网页的访问量是否作弊。
2.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,获取目标网页的访问量包括获取所述目标网页的历史访问量和当前访问量,判断所述访问量是否满足预定条件包括:
获取所述历史访问量和所述当前访问量的比值;
判断所述比值是否超出第一设定阈值;
如果所述比值超出所述第一设定阈值,则确定所述访问量满足所述预定条件;以及
如果所述比值未超出所述第一设定阈值,则确定所述访问量不满足所述预定条件。
3.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,获取目标网页的访问量包括获取所述目标网页的历史访问量和当前访问量,判断所述访问量是否满足预定条件包括:
获取所述历史访问量和所述当前访问量的差值;
判断所述差值是否超出第二设定阈值;
如果所述差值超出所述第二设定阈值,则确定所述访问量满足所述预定条件;以及
如果所述差值未超出所述第二设定阈值,则确定所述访问量不满足所述预定条件。
4.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,
获取所述目标网页的访问来源信息包括:获取所述目标网页的源代码;在所述源代码中加入检测代码以获取所述目标网页的访问IP地址;将所述访问IP地址作为所述访问来源信息;
根据所述访问来源信息判断所述目标网页的访问量是否作弊包括:获取所述访问IP地址中的第一访问IP地址的第一访问量,所述第一访问IP地址为所述访问IP地址中访问所述目标网页最多的一个访问IP地址;
计算所述第一访问量与所述访问量的比值;
判断所述第一访问量与所述访问量的比值是否超出第三设定阈值;
如果所述第一访问量与所述访问量的比值超出所述第三设定阈值,则确定所述目标网页的访问量作弊,以及
如果所述第一访问量与所述访问量的比值未超出所述第三设定阈值,则确定所述目标网页的访问量未作弊。
5.根据权利要求4所述的网页访问量作弊的检测方法,其特征在于,确定所述目标网页的访问量作弊包括:
获取所述第一访问IP的访问停留时间;
判断所述访问停留时间是否超出第四设定阈值;
如果所述访问停留时间未超出所述第四设定阈值,则确定所述目标网页的访问量作弊;以及
如果所述访问停留时间超出所述第四设定阈值,则确定所述目标网页的访问量未作弊。
6.根据权利要求1所述的网页访问量作弊的检测方法,其特征在于,在获取目标网页的访问量之前,所述网页访问量作弊的检测方法还包括:
获取所述目标网页的源代码;
检测所述源代码中是否存在大小为0*0或者1*1的内联框架iframe;以及
如果所述源代码中不存在所述iframe,则获取所述目标网页的访问量。
7.一种网页访问量作弊的检测装置,其特征在于,包括:
第一获取单元,用于获取目标网页的访问量;
第一判断单元,用于判断所述访问量是否满足预定条件;
第二获取单元,用于当所述访问量满足预定条件时,获取所述目标网页的访问来源信息;以及
第二判断单元,用于根据所述访问来源信息判断所述目标网页的访问量是否作弊。
8.根据权利要求7所述的网页访问量作弊的检测装置,其特征在于,所述第一获取单元还用于获取所述目标网页的历史访问量和当前访问量,其中,所述第一判断单元包括:
第一获取模块,用于获取所述历史访问量和所述当前访问量的比值;
第一判断模块,用于判断所述比值是否超出第一设定阈值;以及
第一确定模块,用于当所述比值超出所述第一设定阈值时,确定所述访问量满足所述预定条件,当所述比值未超出所述第一设定阈值时,确定所述访问量不满足所述预定条件。
9.根据权利要求7所述的网页访问量作弊的检测装置,其特征在于,第一获取单元还用于获取所述目标网页的历史访问量和当前访问量,其中,所述第一判断单元包括:
第二获取模块,用于获取所述历史访问量和所述当前访问量的差值;
第二判断模块,用于判断所述差值是否超出第二设定阈值;以及
第二确定模块,用于当所述差值超出所述第二设定阈值时,确定所述访问量满足所述预定条件,当所述差值未超出所述第二设定阈值时,确定所述访问量不满足所述预定条件。
10.根据权利要求7所述的网页访问量作弊的检测装置,其特征在于,
所述第二获取单元包括:
第三获取模块,用于获取所述目标网页的源代码;
第四获取模块,用于在所述源代码中加入检测代码以获取所述目标网页的访问IP地址;
生成模块,用于将所述访问IP地址作为访问来源信息;
所述第二判断单元包括:
第五获取模块,用于获取所述访问IP地址中的第一访问IP地址的第一访问量,所述第一访问IP地址为所述访问IP地址中访问所述目标网页最多的一个访问IP地址;
计算模块,用于计算所述第一访问量与所述访问量的比值;
第三判断模块,用于判断所述第一访问量与所述访问量的比值是否超出第三设定阈值;以及
第三确定模块,用于当所述第一访问量与所述访问量的比值超出所述第三设定阈值时,确定所述目标网页的访问量作弊,当所述第一访问量与所述访问量的比值未超出所述第三设定阈值时,确定所述目标网页的访问量未作弊。
11.根据权利要求10所述的网页访问量作弊的检测装置,其特征在于,所述第三确定模块包括:
获取子模块,用于获取所述第一访问IP的访问停留时间;
判断子模块,用于判断所述访问停留时间是否超出第四设定阈值;以及
确定子模块,用于当所述访问停留时间未超出所述第四设定阈值时,确定所述目标网页的访问量作弊,当所述访问停留时间超出所述第四设定阈值时,确定所述目标网页的访问量未作弊。
12.根据权利要求7所述的网页访问量作弊的检测装置,其特征在于,所述网页访问量作弊的检测装置还包括:
第三获取单元,用于在获取目标网页的访问量之前,获取所述目标网页的源代码;
检测单元,用于检测所述源代码中是否存在大小为0*0或者1*1的内联框架iframe;以及
确定单元,用于当所述源代码中不存在所述iframe时,获取所述目标网页的访问量。
CN201310523151.0A 2013-10-29 2013-10-29 网页访问量作弊的检测方法和装置 Active CN103593415B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310523151.0A CN103593415B (zh) 2013-10-29 2013-10-29 网页访问量作弊的检测方法和装置
PCT/CN2014/089724 WO2015062485A1 (zh) 2013-10-29 2014-10-28 网页访问量作弊的检测方法和装置
US15/139,096 US20160239864A1 (en) 2013-10-29 2016-04-26 Method and apparatus for detecting cheat on page views of web page

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310523151.0A CN103593415B (zh) 2013-10-29 2013-10-29 网页访问量作弊的检测方法和装置

Publications (2)

Publication Number Publication Date
CN103593415A true CN103593415A (zh) 2014-02-19
CN103593415B CN103593415B (zh) 2017-08-01

Family

ID=50083556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310523151.0A Active CN103593415B (zh) 2013-10-29 2013-10-29 网页访问量作弊的检测方法和装置

Country Status (3)

Country Link
US (1) US20160239864A1 (zh)
CN (1) CN103593415B (zh)
WO (1) WO2015062485A1 (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062485A1 (zh) * 2013-10-29 2015-05-07 北京国双科技有限公司 网页访问量作弊的检测方法和装置
CN105279674A (zh) * 2015-10-13 2016-01-27 精硕世纪科技(北京)有限公司 移动广告投放设备作弊行为的判断方法和装置
CN105677221A (zh) * 2015-12-30 2016-06-15 广州优视网络科技有限公司 一种提高应用程序数据检测准确性的方法、装置及设备
CN105975379A (zh) * 2016-05-25 2016-09-28 北京比邻弘科科技有限公司 一种虚假移动设备的识别方法及识别系统
CN106097000A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106301980A (zh) * 2015-05-28 2017-01-04 腾讯科技(深圳)有限公司 一种刷量工具检测方法和装置
CN106355431A (zh) * 2016-08-18 2017-01-25 晶赞广告(上海)有限公司 作弊流量检测方法、装置及终端
CN106445796A (zh) * 2015-08-04 2017-02-22 腾讯科技(深圳)有限公司 作弊渠道的自动检测方法及装置
CN106469383A (zh) * 2015-08-14 2017-03-01 北京国双科技有限公司 广告投放质量的检测方法和装置
CN106603554A (zh) * 2016-12-29 2017-04-26 北京奇艺世纪科技有限公司 一种自适应实时视频数据的反作弊方法及装置
CN106611346A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 访客筛选方法和装置
CN106611348A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 异常流量的检测方法和装置
CN106651458A (zh) * 2016-12-29 2017-05-10 腾讯科技(深圳)有限公司 一种广告反作弊方法和装置
CN106934627A (zh) * 2015-12-28 2017-07-07 中国移动通信集团公司 一种电商行业作弊行为的检测方法及装置
CN106933905A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 网页访问数据的监测方法和装置
CN107169769A (zh) * 2016-03-08 2017-09-15 广州市动景计算机科技有限公司 应用程序的刷量识别方法、装置
CN107454441A (zh) * 2017-06-30 2017-12-08 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、及直播平台服务器
CN107566897A (zh) * 2017-07-19 2018-01-09 北京奇艺世纪科技有限公司 一种视频刷量的鉴别方法、装置及电子设备
CN107578263A (zh) * 2017-07-21 2018-01-12 北京奇艺世纪科技有限公司 一种广告异常访问的检测方法、装置和电子设备
CN108009844A (zh) * 2017-11-20 2018-05-08 北京智钥科技有限公司 确定广告作弊行为的方法、装置及云服务器
CN108255879A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 网页浏览流量作弊的检测方法及装置
CN108810947A (zh) * 2018-05-29 2018-11-13 浙江每日互动网络科技股份有限公司 基于ip地址的鉴别真实流量的服务器
CN109150928A (zh) * 2017-06-15 2019-01-04 北京京东尚科信息技术有限公司 用于处理请求的方法和装置
CN109586990A (zh) * 2017-09-29 2019-04-05 北京国双科技有限公司 一种识别作弊流量的方法及装置
CN109905738A (zh) * 2019-03-26 2019-06-18 湖南快乐阳光互动娱乐传媒有限公司 视频广告异常展现监测方法及装置、存储介质和电子设备
CN110097389A (zh) * 2018-01-31 2019-08-06 上海甚术网络科技有限公司 一种广告流量反作弊方法
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN110365672A (zh) * 2019-07-09 2019-10-22 葛晓滨 一种电子商务异常攻击的检测方法
CN110381375A (zh) * 2018-04-13 2019-10-25 武汉斗鱼网络科技有限公司 一种确定盗刷数据的方法、客户端及服务器
CN111222938A (zh) * 2018-11-27 2020-06-02 北京京东尚科信息技术有限公司 目标对象信息识别方法、装置、电子设备及可读存储介质
CN112188291A (zh) * 2020-09-24 2021-01-05 北京明略昭辉科技有限公司 广告位异常的识别方法和装置
CN112529605A (zh) * 2019-09-17 2021-03-19 北京奥维互娱科技有限公司 一种广告异常曝光识别系统及方法
CN117217830A (zh) * 2023-11-07 2023-12-12 深圳市豪斯莱科技有限公司 一种广告刷单监控识别方法、系统及可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547420B (zh) 2015-09-23 2020-06-02 阿里巴巴集团控股有限公司 一种页面处理方法和装置
CN111611521B (zh) * 2020-05-28 2023-11-03 北京学之途网络科技有限公司 一种流量作弊的监测方法、装置、电子设备及存储介质
CN111611520B (zh) * 2020-05-28 2024-03-08 北京明略昭辉科技有限公司 一种流量作弊的监测方法、装置、电子设备及存储介质
CN111861568A (zh) * 2020-07-23 2020-10-30 上海志窗信息科技有限公司 互联网广告监控系统及其方法
CN113657924B (zh) * 2021-07-21 2023-10-31 安徽赤兔马传媒科技有限公司 基于机器学习的线下智慧屏广告反作弊系统及报警器
CN114172725B (zh) * 2021-12-07 2023-11-14 百度在线网络技术(北京)有限公司 非法网站的处理方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及系统
US20090198673A1 (en) * 2008-02-06 2009-08-06 Microsoft Corporation Forum Mining for Suspicious Link Spam Sites Detection
CN103049456A (zh) * 2011-10-14 2013-04-17 腾讯科技(深圳)有限公司 一种筛选网页的方法及装置
CN103294686A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种网页作弊用户、作弊网页的识别方法及系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7260774B2 (en) * 2000-04-28 2007-08-21 Inceptor, Inc. Method & system for enhanced web page delivery
US6963874B2 (en) * 2002-01-09 2005-11-08 Digital River, Inc. Web-site performance analysis system and method utilizing web-site traversal counters and histograms
CN104283832B (zh) * 2002-03-08 2018-06-19 英特尔公司 用于高速率正交频分复用通信的系统和方法
US7734502B1 (en) * 2005-08-11 2010-06-08 A9.Com, Inc. Ad server system with click fraud protection
US20070129999A1 (en) * 2005-11-18 2007-06-07 Jie Zhou Fraud detection in web-based advertising
US20080288303A1 (en) * 2006-03-17 2008-11-20 Claria Corporation Method for Detecting and Preventing Fraudulent Internet Advertising Activity
US20070255821A1 (en) * 2006-05-01 2007-11-01 Li Ge Real-time click fraud detecting and blocking system
US7657626B1 (en) * 2006-09-19 2010-02-02 Enquisite, Inc. Click fraud detection
US20080114624A1 (en) * 2006-11-13 2008-05-15 Microsoft Corporation Click-fraud protector
US8880541B2 (en) * 2006-11-27 2014-11-04 Adobe Systems Incorporated Qualification of website data and analysis using anomalies relative to historic patterns
US20080281606A1 (en) * 2007-05-07 2008-11-13 Microsoft Corporation Identifying automated click fraud programs
US8311876B2 (en) * 2009-04-09 2012-11-13 Sas Institute Inc. Computer-implemented systems and methods for behavioral identification of non-human web sessions
CN102254265A (zh) * 2010-05-18 2011-11-23 北京首家通信技术有限公司 一种富媒体互联网广告内容匹配、效果评估方法
US9576303B2 (en) * 2011-06-17 2017-02-21 Google Inc. Advertisements in view
US20130110648A1 (en) * 2011-10-31 2013-05-02 Simon Raab System and method for click fraud protection
US20140278947A1 (en) * 2011-10-31 2014-09-18 Pureclick Llc System and method for click fraud protection
US20130198203A1 (en) * 2011-12-22 2013-08-01 John Bates Bot detection using profile-based filtration
CN102693501A (zh) * 2012-05-31 2012-09-26 刘志军 一种网络广告推广效果分析方法
US10043197B1 (en) * 2012-06-14 2018-08-07 Rocket Fuel Inc. Abusive user metrics
CN103200262B (zh) * 2013-04-02 2016-05-25 亿赞普(北京)科技有限公司 一种基于移动网络的广告调度方法、装置及系统
CN103593415B (zh) * 2013-10-29 2017-08-01 北京国双科技有限公司 网页访问量作弊的检测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及系统
US20090198673A1 (en) * 2008-02-06 2009-08-06 Microsoft Corporation Forum Mining for Suspicious Link Spam Sites Detection
CN103049456A (zh) * 2011-10-14 2013-04-17 腾讯科技(深圳)有限公司 一种筛选网页的方法及装置
CN103294686A (zh) * 2012-02-24 2013-09-11 腾讯科技(深圳)有限公司 一种网页作弊用户、作弊网页的识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方美琪等: "《网络营销(第2版)》", 31 July 2013 *

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015062485A1 (zh) * 2013-10-29 2015-05-07 北京国双科技有限公司 网页访问量作弊的检测方法和装置
CN106301980A (zh) * 2015-05-28 2017-01-04 腾讯科技(深圳)有限公司 一种刷量工具检测方法和装置
CN106301980B (zh) * 2015-05-28 2020-06-05 腾讯科技(深圳)有限公司 一种刷量工具检测方法和装置
CN106445796B (zh) * 2015-08-04 2021-01-19 腾讯科技(深圳)有限公司 作弊渠道的自动检测方法及装置
CN106445796A (zh) * 2015-08-04 2017-02-22 腾讯科技(深圳)有限公司 作弊渠道的自动检测方法及装置
CN106469383A (zh) * 2015-08-14 2017-03-01 北京国双科技有限公司 广告投放质量的检测方法和装置
CN105279674A (zh) * 2015-10-13 2016-01-27 精硕世纪科技(北京)有限公司 移动广告投放设备作弊行为的判断方法和装置
CN106611346A (zh) * 2015-10-22 2017-05-03 北京国双科技有限公司 访客筛选方法和装置
CN106611348A (zh) * 2015-10-23 2017-05-03 北京国双科技有限公司 异常流量的检测方法和装置
CN106934627A (zh) * 2015-12-28 2017-07-07 中国移动通信集团公司 一种电商行业作弊行为的检测方法及装置
CN105677221A (zh) * 2015-12-30 2016-06-15 广州优视网络科技有限公司 一种提高应用程序数据检测准确性的方法、装置及设备
CN106933905A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 网页访问数据的监测方法和装置
CN107169769A (zh) * 2016-03-08 2017-09-15 广州市动景计算机科技有限公司 应用程序的刷量识别方法、装置
CN105975379A (zh) * 2016-05-25 2016-09-28 北京比邻弘科科技有限公司 一种虚假移动设备的识别方法及识别系统
CN106097000B (zh) * 2016-06-02 2022-07-26 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
US11373205B2 (en) 2016-06-02 2022-06-28 Tencent Technology (Shenzhen) Company Limited Identifying and punishing cheating terminals that generate inflated hit rates
CN106097000A (zh) * 2016-06-02 2016-11-09 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106355431B (zh) * 2016-08-18 2020-01-07 晶赞广告(上海)有限公司 作弊流量检测方法、装置及终端
CN106355431A (zh) * 2016-08-18 2017-01-25 晶赞广告(上海)有限公司 作弊流量检测方法、装置及终端
CN106651458A (zh) * 2016-12-29 2017-05-10 腾讯科技(深圳)有限公司 一种广告反作弊方法和装置
CN108255879A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 网页浏览流量作弊的检测方法及装置
CN108255879B (zh) * 2016-12-29 2021-10-08 北京国双科技有限公司 网页浏览流量作弊的检测方法及装置
CN106603554B (zh) * 2016-12-29 2019-11-15 北京奇艺世纪科技有限公司 一种自适应实时视频数据的反作弊方法及装置
CN106603554A (zh) * 2016-12-29 2017-04-26 北京奇艺世纪科技有限公司 一种自适应实时视频数据的反作弊方法及装置
CN109150928A (zh) * 2017-06-15 2019-01-04 北京京东尚科信息技术有限公司 用于处理请求的方法和装置
CN107454441B (zh) * 2017-06-30 2019-12-03 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、直播平台服务器及计算机可读存储介质
CN107454441A (zh) * 2017-06-30 2017-12-08 武汉斗鱼网络科技有限公司 一种检测直播间刷人气行为的方法、及直播平台服务器
CN107566897A (zh) * 2017-07-19 2018-01-09 北京奇艺世纪科技有限公司 一种视频刷量的鉴别方法、装置及电子设备
CN107566897B (zh) * 2017-07-19 2019-10-15 北京奇艺世纪科技有限公司 一种视频刷量的鉴别方法、装置及电子设备
CN107578263A (zh) * 2017-07-21 2018-01-12 北京奇艺世纪科技有限公司 一种广告异常访问的检测方法、装置和电子设备
CN109586990A (zh) * 2017-09-29 2019-04-05 北京国双科技有限公司 一种识别作弊流量的方法及装置
CN109586990B (zh) * 2017-09-29 2021-11-02 北京国双科技有限公司 一种识别作弊流量的方法及装置
CN108009844A (zh) * 2017-11-20 2018-05-08 北京智钥科技有限公司 确定广告作弊行为的方法、装置及云服务器
CN110097389A (zh) * 2018-01-31 2019-08-06 上海甚术网络科技有限公司 一种广告流量反作弊方法
CN110381375A (zh) * 2018-04-13 2019-10-25 武汉斗鱼网络科技有限公司 一种确定盗刷数据的方法、客户端及服务器
CN108810947B (zh) * 2018-05-29 2021-05-11 每日互动股份有限公司 基于ip地址的鉴别真实流量的服务器
CN108810947A (zh) * 2018-05-29 2018-11-13 浙江每日互动网络科技股份有限公司 基于ip地址的鉴别真实流量的服务器
CN111222938A (zh) * 2018-11-27 2020-06-02 北京京东尚科信息技术有限公司 目标对象信息识别方法、装置、电子设备及可读存储介质
CN109905738A (zh) * 2019-03-26 2019-06-18 湖南快乐阳光互动娱乐传媒有限公司 视频广告异常展现监测方法及装置、存储介质和电子设备
CN110365672A (zh) * 2019-07-09 2019-10-22 葛晓滨 一种电子商务异常攻击的检测方法
CN110290400B (zh) * 2019-07-29 2022-06-03 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN110290400A (zh) * 2019-07-29 2019-09-27 北京奇艺世纪科技有限公司 可疑刷量视频的识别方法、真实播放量预估方法及装置
CN112529605A (zh) * 2019-09-17 2021-03-19 北京奥维互娱科技有限公司 一种广告异常曝光识别系统及方法
CN112529605B (zh) * 2019-09-17 2023-12-22 北京互娱数字科技有限公司 一种广告异常曝光识别系统及方法
CN112188291A (zh) * 2020-09-24 2021-01-05 北京明略昭辉科技有限公司 广告位异常的识别方法和装置
CN117217830A (zh) * 2023-11-07 2023-12-12 深圳市豪斯莱科技有限公司 一种广告刷单监控识别方法、系统及可读存储介质
CN117217830B (zh) * 2023-11-07 2024-02-27 深圳市豪斯莱科技有限公司 一种广告刷单监控识别方法、系统及可读存储介质

Also Published As

Publication number Publication date
CN103593415B (zh) 2017-08-01
US20160239864A1 (en) 2016-08-18
WO2015062485A1 (zh) 2015-05-07

Similar Documents

Publication Publication Date Title
CN103593415A (zh) 网页访问量作弊的检测方法和装置
JP5735492B2 (ja) オンライン広告キャンペーンの効果の測定
US9734508B2 (en) Click fraud monitoring based on advertising traffic
JP5592934B2 (ja) ユーザに対するネットワークオブジェクト情報の提案
US20180108029A1 (en) Detecting differing categorical features when comparing segments
US20130117103A1 (en) Universal control
WO2013112911A1 (en) Systems, methods, and articles of manufacture to measure online audiences
KR20160114724A (ko) 구매 정보 활용 시스템 및 구매 정보 활용 방법 및 프로그램
CN108876464B (zh) 一种作弊行为检测方法、装置、服务设备及存储介质
US10977670B2 (en) Method and system for determining and monitoring brand performance based on paid expenditures
Kapur et al. Software reliability growth model with change-point and effort control using a power function of the testing time
Singal et al. Web analytics: State-of-art & literature assessment
CN107135199A (zh) 网页后门的检测方法和装置
Kim et al. Adbudgetkiller: Online advertising budget draining attack
US10956920B1 (en) Methods and systems for implementing automated bidding models
Gröbel Analysis of spatial variance clustering in the hedonic modeling of housing prices
CN110990692A (zh) 基于画像分析的数据处理方法及装置
Chang et al. Is per capita real GDP stationary in African countries? Evidence from panel SURADF test
CN110895543A (zh) 人口迁徙跟踪展示方法、装置及存储介质
Clarke et al. Assessment of online self-testing and self-sampling service providers for sexually transmitted infections against national standards in the UK in 2020
Uphaus et al. Barriers seen by potential local Providers of Applications using Location-Based Services
Doganaksoy et al. Getting the right data up front: A key challenge
KR20130005597A (ko) 웹사이트 방문자의 이용 내역을 고려하여 클릭당 과금되는 인터넷 광고 부정클릭에 대응하는 시스템
JP7403735B2 (ja) ユーザ注目ワード分析装置、方法及びプログラム
Röyskö Utilizing pay-per-click search engine marketing for an SME’s B2B marketing mix

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for detecting cheating on visitor volumes of web pages

Effective date of registration: 20190531

Granted publication date: 20170801

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: Beijing Guoshuang Technology Co.,Ltd.