CN102521331A - 网页跳转作弊检测方法及装置 - Google Patents
网页跳转作弊检测方法及装置 Download PDFInfo
- Publication number
- CN102521331A CN102521331A CN201110402588XA CN201110402588A CN102521331A CN 102521331 A CN102521331 A CN 102521331A CN 201110402588X A CN201110402588X A CN 201110402588XA CN 201110402588 A CN201110402588 A CN 201110402588A CN 102521331 A CN102521331 A CN 102521331A
- Authority
- CN
- China
- Prior art keywords
- webpage
- image
- redirect
- detected
- parameter information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明提供一种网页跳转作弊检测方法及装置,该网页跳转作弊检测方法包括分别获取待检测网页的网址对应的第一网页和第二网页,其中,所述第一网页为动态脚本禁止执行状态下获取的,所述第二网页为动态脚本启动执行状态下获取的;分别抓取所述第一网页对应的第一图像和所述第二网页对应的第二图像;将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果。本发明提供的网页跳转作弊检测方法及装置,通过图像对比进行网页跳转作弊的检测,实现简单且稳定性高。避免了通过分析网页源码进行检测而忽略动态脚本的缺陷,易于进行分布式处理,提高了网页跳转作弊的检测效果。
Description
技术领域
本发明涉及网络安全技术,尤其涉及一种网页跳转作弊检测方法及装置。
背景技术
互联网技术的突飞猛进推动了信息社会的不断发展,时至今日互联网已经成为人们日常生活的一部分。随着搜索引擎用户数量的不断增长,搜索引擎的窗口作用导致了各种作弊行为的滋生和蔓延。搜索引擎作弊,又称互联网作弊,是指采用迷惑、欺骗搜索引擎的手段,使得Web页面在检索结果中的排名高于其实际应得排名的行为。互联网作弊行为的猖獗导致搜索引擎检索结果的质量不断下降,严重恶化了用户的搜索体验。
网页跳转作弊是互联网作弊中常见的一种作弊方式,通过在网页代码中设置动态脚本实现网页跳转,使得用户浏览到的内容和搜索引擎抓取的内容并不一致。动态脚本通常为JavaScript脚本,由于目前多数搜索引擎在网页抓取和程序解析过程中往往会忽略JavaScript脚本,且JavaScript自身的复杂性和多变性,导致了基于JavaScript的网页跳转作弊技术难以被认定。
发明内容
本发明提供一种网页跳转作弊检测方法及装置,以提高网页跳转作弊的检测效果。
本发明第一个方面提供一种网页跳转作弊检测方法,包括:
分别获取待检测网页的网址对应的第一网页和第二网页,其中,所述第一网页为动态脚本禁止执行状态下获取的,所述第二网页为动态脚本启动执行状态下获取的;
分别抓取所述第一网页对应的第一图像和所述第二网页对应的第二图像;
将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果。
本发明另一个方面提供一种网页跳转作弊检测装置,包括:
网页获取模块,用于分别获取待检测网页的网址对应的第一网页和第二网页,其中,所述第一网页为动态脚本禁止执行状态下获取的,所述第二网页为动态脚本启动执行状态下获取的;
图像获取模块,用于分别抓取所述第一网页对应的第一图像和所述第二网页对应的第二图像;
检测模块,用于将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果。
由上述技术方案可知,本发明第一个方面提供的网页跳转作弊检测方法,分别获取待检测网页的网址对应的第一网页和第二网页,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的,分别抓取第一网页对应的第一图像和第二网页对应的第二图像,将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。通过图像对比进行网页跳转作弊的检测,实现简单且稳定性高。避免了通过分析网页源码进行检测而忽略动态脚本的缺陷,易于进行分布式处理,提高了网页跳转作弊的检测效果。
本发明另一个方面提供的网页跳转作弊检测装置,网页获取模块分别获取待检测网页的网址对应的第一网页和第二网页,其中,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的。图像获取模块分别获取第一网页对应的第一图像和第二网页对应的第二图像。检测模块将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。通过图像对比进行网页跳转作弊的检测,实现简单且稳定性高。避免了通过分析网页源码进行检测而忽略动态脚本的缺陷,易于进行分布式处理,提高了网页跳转作弊的检测效果。
附图说明
图1为本发明实施例一提供的网页跳转作弊检测方法流程图;
图2为本发明实施例二提供的网页跳转作弊检测方法流程图;
图3为本发明实施例三提供的网页跳转作弊检测装置结构示意图;
图4为本发明实施例四提供的网页跳转作弊检测装置结构示意图。
具体实施方式
实施例一
图1为本发明实施例一提供的网页跳转作弊检测方法流程图。如图1所示,本实施例提供的网页跳转作弊检测方法具体可以应用于对网页是否存在跳转作弊的检测过程,具体可以通过网页跳转作弊检测装置来执行,该网页跳转作弊检测装置可以通过软件和/或硬件的方式来实现。
本实施例提供的网页跳转作弊检测方法具体包括:
步骤10、分别获取待检测网页的网址对应的第一网页和第二网页,其中,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的;
具体地,当需要对某个网页进行检测时,可以通过浏览器加载该待检测网页的网址对应的第一网页和第二网页。首先,可以先将浏览器设置为动态脚本禁止执行状态,即浏览器在加载网页时不执行动态脚本。在浏览器中输入待检测网页的网址,浏览器发送超文本传输协议(Hyper Text TransferProtocol,简称HTTP)请求,对该待检测网页进行加载,并保存整个网页,包括不可见部分,以获取第一网页。接下来,将浏览器设置为动态脚本启动执行状态,即浏览器在加载网页时执行动态脚本。在浏览器中输入待检测网页的网址,浏览器发送HTTP)请求,对该待检测网页进行加载,并保存整个网页,包括不可见部分,以获取第二网页。由于第一网页和第二网页分别是在动态脚本禁止执行和启动执行两种状态下获取的,若该待检测网页存在基于动态脚本的网页跳转作弊时,在上述两种状态下获取的第一网页和第二网页必然存在较大差别。
步骤20、分别抓取第一网页对应的第一图像和第二网页对应的第二图像;
可以通过浏览器来抓取第一网页对应的第一图像以及第二网页对应的第二图像,也可以通过第三方工具进行的抓取,只需要确保两副图像分别是在允许和禁止动态脚本执行的情况下抓取即可,图像的获取方式不以本实施例为限。
步骤30、将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。
将第一图像和第二图像进行对比,如果第一图像和第二图像存在较大差异,或者完全不同,则说明该网页存在网页跳转作弊,即当在允许执行动态脚本时,网页加载过程中出现跳转,则可以生成用以指示待检测网页存在恶意跳转的检测结果,即存在网页跳转作弊行为。如果第一图像和第二图像基本或完全相同,则说明该网页不存在网页跳转作弊,则可以生成用以指示待检测网页不存在恶意跳转的检测结果。可以将第一图片和第二图片的参数进行比较,参数具体可以为尺寸和颜色等,图片对比方法不以本实施例为例。
本实施例提供的网页跳转作弊检测方法,分别获取待检测网页的网址对应的第一网页和第二网页,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的,分别抓取第一网页对应的第一图像和第二网页对应的第二图像,将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。通过图像对比进行网页跳转作弊的检测,实现简单且稳定性高。避免了通过分析网页源码进行检测而忽略动态脚本的缺陷,易于进行分布式处理,提高了网页跳转作弊的检测效果。
实施例二
图2为本发明实施例二提供的网页跳转作弊检测方法流程图。如图2所示,本实施例提供的网页跳转作弊检测方法在实施例一的基础上,步骤10,分别获取待检测网页的网址对应的第一网页和第二网页,具体可以包括如下步骤:
步骤101、在动态脚本禁止执行状态下,根据待检测网页的网址发送第一网页获取请求,获取第一网页获取请求对应的第一网页,并将第一网页保存;
步骤102、在动态脚本启动执行状态下,根据待检测网页的网址发送第二网页获取请求,获取第二网页获取请求对应的第二网页,延迟预设时间后,将第二网页保存。
若待检测网页中存在恶意跳转,有可能在网页加载后几秒钟内才发生跳转行为,针对该种情况,通过延迟预设时间后再将第二网页,可以提高网页检测的准确性。
具体地,以火狐(Firefox)浏览器为例对本实施例的具体实现过程进行详细说明。可以首先安装Pearl Crescent Page Saver Basic插件,这样在火狐工具栏中就有一个抓图的小按钮,该插件同样支持命令行操作。将浏览器设置为动态脚本禁止执行状态,在浏览器中输入待检测网页的网址,浏览器发送HTTP请求,调用浏览器内核,在动态脚本禁止执行的情况下对网页进行加载,通过点击抓图按钮保存第一网页。或者通过执行命令行命令:firefox-saveimage http://www.mozilla.org/,以保存该第一网页对应的第一图像,同时可以添加制定存储位置和文件名的参数。该种方法易于针对大量网址进行批处理。接下来,将浏览器设置为动态脚本启动执行状态,在浏览器中输入待检测网页的网址,浏览器发送HTTP请求,调用浏览器内核,在动态脚本启动执行的情况下对网页进行加载,保存第二网页。或者通过执行以下命令行命令:firefox-saveimage http://www.mozilla.com/-savedelay delaytime,该命令会在delaytime时间后对网页快照进行抓取并存储。delaytime即为预设时间。优选地,delaytime的值可以设置为5000,即5秒,由于多数商用搜索引擎会将5秒钟以内的跳转视为作弊,因此,将预设时间设置为5秒可以避免时间的浪费,提高检测效率。对于大规模待检测网页,可以在多台计算机上分布式执行,设置第一部分机器的火狐禁止动态脚本执行、第二部分机器的火狐浏览器允许动态脚本执行,分别在脚本程序中多次调用“firefox-saveimage网址”,进行批量图像存取,第三部分机器负责对前两部分机器中获取的图像进行匹配、判定,具体对图像的匹配方法见本实施例步骤30。本实施例中的浏览器插件为众多浏览器抓图插件中的一个,现有的主流浏览器均有多种截图插件可以选用。
在本实施例中,步骤30,将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果,具体可以包括如下步骤:
分别获取第一图像的第一参数信息和第二图像的第二参数信息,将第一参数信息和第二参数信息进行比较,生成第一比较结果,若第一比较结果大于第一预设阈值,则生成用以指示待检测网页存在恶意跳转的检测结果。
第一参数信息和第二参数信息可以采用图像的单一参数信息,如高度、宽度等参数信息,也可以为将多个参数信息的综合处理后的信息,可以实现第一图像和第二图像的对比即可,不以本实施例为限。第一预设阈值具体可以根据实际的检测精度来设置。
在本实施例中,第一参数信息具体可以包括第一图像的高度、第一图像的宽度和第一图像占用存储空间的大小。第二参数信息具体可以包括第二图像的高度、第二图像的宽度和第二图像占用存储空间的大小。
为了更清楚地进行描述,分别用img1,img2表示第一图像和第二图像,height(img1)和height(img2)分别表示img1和img2的高度,width(img1)和width(img2)分别表示img1和img2的宽度,size(img1)和size(img2)分别表示img1和img2的占用存储空间的大小。当第一参数信息为height(img1),第二参数信息为height(img2)时,当|height(img1)-height(img2)|>H1时,即第一图像的高度和第二图像的高度差得绝对值大于第一预设阈值时,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为H1。也可以当max(height(img1),height(img2))/min(height(img1),height(img2))|>H2,即第一图像和第二图像中高度较大的值与第一图像和第二图像中高度较小的值的比值大于第一预设阈值,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为H2。
当第一参数信息为width(img1),第二参数信息为width(img2)时,当|width(img1)-width(img2)|>W1时,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为W1。也可以当max(width(img1),width(img2))/min(width(img1),width(img2))|>W2时,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为W2。
当第一参数信息为size(img1),第二参数信息为size(img2)时,当(|size(img1)-size(img2)|>S1,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为S1。也可以当max(size(img1),size(img2))/min(size(img1),size(img2))|>S2时,生成用以指示待检测网页存在恶意跳转的检测结果,第一预设阈值为S2。
通过高度、宽度和占用存储空间的大小作为比较参数,计算简单,容易实现。
在本实施例中,步骤30,将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果,还可以通过如下步骤来实现,包括:
将第一图像转换为第一灰度图像,获取第一灰度图像中灰度值小于预设灰度值的像素的数量作为第一像素数量;
将第二图像转换为第二灰度图像,获取第二灰度图像中灰度值小于预设灰度值的像素的数量作为第二像素数量;
将第一像素数量和第二像素数量进行比较,生成第二比较结果,若第二比较结果大于第二预设阈值,则生成用以指示待检测网页存在恶意跳转的检测结果。
具体地,第一图像和第二图像具体可以均为RGB图像,可以通过公式Gray=(R^2.2×0.2973+G^2.2×0.6274+B^2.2×0.0753)^(1/2.2)来将RGB图像转换为灰度图像,也可以采用其他灰度转换公式,不以本实施例为限。统计第一灰度图像和第二灰度图像中灰度值小于预设灰度值的像素个数,分别为pixel(img1)和pixel(img2),当|pixel(img1)-pixel(img2)|>P1时,生成用以指示待检测网页存在恶意跳转的检测结果,第二预设阈值为P1,也可以当max(pixel(img1),pixel(img2))/min(pixel(img1),pixel(img2))|>P2时,第二预设阈值为P2,生成用以指示待检测网页存在恶意跳转的检测结果。通过将第一图像和第二图像转换为灰度图像进行比较,可以提高检测的准确度。
值得注意的是,本发明不局限于以上实施例所述高度特征、宽度特征、图片物理大小特征和颜色特征,同时可扩展为图像纹理特征、Harr特征等图像视觉特征。
实施例三
图3为本发明实施例三提供的网页跳转作弊检测装置结构示意图。如图3所示,本实施例提供的网页跳转作弊检测装置具体可以实现本发明任意实施例提供的网页跳转作弊检测方法的各个步骤,此不再赘述。本实施例提供的网页跳转作弊检测装置具体包括网页获取模块11、图像获取模块12和检测模块13。网页获取模块11用于分别获取待检测网页的网址对应的第一网页和第二网页,其中,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的。图像获取模块12用于分别抓取第一网页对应的第一图像和第二网页对应的第二图像。检测模块13用于将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。
本实施例提供的网页跳转作弊检测装置,网页获取模块11分别获取待检测网页的网址对应的第一网页和第二网页,其中,第一网页为动态脚本禁止执行状态下获取的,第二网页为动态脚本启动执行状态下获取的。图像获取模块12分别获取第一网页对应的第一图像和第二网页对应的第二图像。检测模块13将第一图像和第二图像进行对比,生成用以指示待检测网页是否存在恶意跳转的检测结果。通过图像对比进行网页跳转作弊的检测,实现简单且稳定性高。避免了通过分析网页源码进行检测而忽略动态脚本的缺陷,易于进行分布式处理,提高了网页跳转作弊的检测效果。
实施例四
图4为本发明实施例四提供的网页跳转作弊检测装置结构示意图。如图4所示,在本实施例中,网页获取模块11具体可以包括第一网页获取单元111和第二网页获取单元112。第一网页获取单元111用于在动态脚本禁止执行状态下,根据待检测网页的网址发送第一网页获取请求,获取第一网页获取请求对应的第一网页,并将第一网页保存。第二网页获取单元112用于在动态脚本启动执行状态下,根据待检测网页的网址发送第二网页获取请求,获取第二网页获取请求对应的第二网页,延迟预设时间后,将第二网页保存。若待检测网页中存在恶意跳转,有可能在网页加载后几秒钟内才发生跳转行为,针对该种情况,通过延迟预设时间后再将第二网页,可以提高网页检测的准确性。
在本实施例中,检测模块13还可以用于分别获取第一图像的第一参数信息和第二图像的第二参数信息,将第一参数信息和第二参数信息进行比较,生成第一比较结果,若第一比较结果大于第一预设阈值,则生成用以指示待检测网页存在恶意跳转的检测结果。第一参数信息具体可以包括第一图像的高度、第一图像的宽度和第一图像占用存储空间的大小。第二参数信息具体可以包括第二图像的高度、第二图像的宽度和第二图像占用存储空间的大小。通过高度、宽度和占用存储空间的大小作为比较参数,计算简单,容易实现。
在本实施例中,检测模块13具体包括第一转换单元131、第二转换单元132和比较单元133。第一转换单元131用于将第一图像转换为第一灰度图像,获取第一灰度图像中灰度值小于预设灰度值的像素的数量作为第一像素数量。第二转换单元132用于将第二图像转换为第二灰度图像,获取第二灰度图像中灰度值小于预设灰度值的像素的数量作为第二像素数量。比较单元133用于将第一像素数量和第二像素数量进行比较,生成第二比较结果,若第二比较结果大于第二预设阈值,则生成用以指示待检测网页存在恶意跳转的检测结果。通过将第一图像和第二图像转换为灰度图像进行比较,可以提高检测的准确度。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (9)
1.一种网页跳转作弊检测方法,其特征在于,包括:
分别获取待检测网页的网址对应的第一网页和第二网页,其中,所述第一网页为动态脚本禁止执行状态下获取的,所述第二网页为动态脚本启动执行状态下获取的;
分别抓取所述第一网页对应的第一图像和所述第二网页对应的第二图像;
将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果。
2.根据权利要求1所述的网页跳转作弊检测方法,其特征在于,分别获取待检测网页的网址对应的第一网页和第二网页,包括:
在所述动态脚本禁止执行状态下,根据所述待检测网页的网址发送第一网页获取请求,获取所述第一网页获取请求对应的第一网页,并将所述第一网页保存;
在所述动态脚本启动执行状态下,根据所述待检测网页的网址发送第二网页获取请求,获取所述第二网页获取请求对应的第二网页,延迟预设时间后,将所述第二网页保存。
3.根据权利要求1所述的网页跳转作弊检测方法,其特征在于,将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果,包括:
分别获取第一图像的第一参数信息和第二图像的第二参数信息,将所述第一参数信息和所述第二参数信息进行比较,生成第一比较结果,若所述第一比较结果大于第一预设阈值,则生成用以指示所述待检测网页存在恶意跳转的检测结果。
4.根据权利要求3所述的网页跳转作弊检测方法,其特征在于:
所述第一参数信息包括所述第一图像的高度、所述第一图像的宽度和所述第一图像占用存储空间的大小;
所述第二参数信息包括所述第二图像的高度、所述第二图像的宽度和所述第二图像占用存储空间的大小。
5.根据权利要求1所述的网页跳转作弊检测方法,其特征在于,将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果,包括:
将所述第一图像转换为第一灰度图像,获取所述第一灰度图像中灰度值小于预设灰度值的像素的数量作为第一像素数量;
将所述第二图像转换为第二灰度图像,获取所述第二灰度图像中灰度值小于预设灰度值的像素的数量作为第二像素数量;
将所述第一像素数量和所述第二像素数量进行比较,生成第二比较结果,若所述第二比较结果大于第二预设阈值,则生成用以指示所述待检测网页存在恶意跳转的检测结果。
6.一种网页跳转作弊检测装置,其特征在于,包括:
网页获取模块,用于分别获取待检测网页的网址对应的第一网页和第二网页,其中,所述第一网页为动态脚本禁止执行状态下获取的,所述第二网页为动态脚本启动执行状态下获取的;
图像获取模块,用于分别抓取所述第一网页对应的第一图像和所述第二网页对应的第二图像;
检测模块,用于将所述第一图像和所述第二图像进行对比,生成用以指示所述待检测网页是否存在恶意跳转的检测结果。
7.根据权利要求6所述的网页跳转作弊检测装置,其特征在于,所述网页获取模块包括:
第一网页获取单元,用于在所述动态脚本禁止执行状态下,根据所述待检测网页的网址发送第一网页获取请求,获取所述第一网页获取请求对应的第一网页,并将所述第一网页保存;
第二网页获取单元,用于在所述动态脚本启动执行状态下,根据所述待检测网页的网址发送第二网页获取请求,获取所述第二网页获取请求对应的第二网页,延迟预设时间后,将所述第二网页保存。
8.根据权利要求6所述的网页跳转作弊检测装置,其特征在于,所述检测模块还用于分别获取第一图像的第一参数信息和第二图像的第二参数信息,将所述第一参数信息和所述第二参数信息进行比较,生成第一比较结果,若所述第一比较结果大于第一预设阈值,则生成用以指示所述待检测网页存在恶意跳转的检测结果。
9.根据权利要求6所述的网页跳转作弊检测装置,其特征在于,所述检测模块包括:
第一转换单元,用于将所述第一图像转换为第一灰度图像,获取所述第一灰度图像中灰度值小于预设灰度值的像素的数量作为第一像素数量;
第二转换单元,用于将所述第二图像转换为第二灰度图像,获取所述第二灰度图像中灰度值小于预设灰度值的像素的数量作为第二像素数量;
比较单元,用于将所述第一像素数量和所述第二像素数量进行比较,生成第二比较结果,若所述第二比较结果大于第二预设阈值,则生成用以指示所述待检测网页存在恶意跳转的检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110402588XA CN102521331A (zh) | 2011-12-06 | 2011-12-06 | 网页跳转作弊检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110402588XA CN102521331A (zh) | 2011-12-06 | 2011-12-06 | 网页跳转作弊检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102521331A true CN102521331A (zh) | 2012-06-27 |
Family
ID=46292248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110402588XA Pending CN102521331A (zh) | 2011-12-06 | 2011-12-06 | 网页跳转作弊检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521331A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103780701A (zh) * | 2014-01-26 | 2014-05-07 | 百度在线网络技术(北京)有限公司 | 浏览器监控方法及装置 |
CN104426861A (zh) * | 2013-08-27 | 2015-03-18 | 中国银联股份有限公司 | 网页检测方法及系统 |
CN104573412A (zh) * | 2013-10-16 | 2015-04-29 | 北京航天在线网络科技有限公司 | 防止拷贝网页文字内容的方法和装置 |
WO2015165245A1 (zh) * | 2014-04-30 | 2015-11-05 | 广州市动景计算机科技有限公司 | 一种网页数据处理方法及装置 |
WO2016015276A1 (en) * | 2014-07-31 | 2016-02-04 | Hewlett-Packard Development Company, L.P. | Analysis of system information |
CN108259416A (zh) * | 2016-12-28 | 2018-07-06 | 华为技术有限公司 | 检测恶意网页的方法及相关设备 |
CN111680252A (zh) * | 2020-06-05 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 外链识别方法、装置、设备及计算机可读存储介质 |
CN113791837A (zh) * | 2021-08-12 | 2021-12-14 | 百度在线网络技术(北京)有限公司 | 页面处理方法、装置、设备和存储介质 |
CN113836028A (zh) * | 2021-09-28 | 2021-12-24 | 奇安信科技集团股份有限公司 | 软件界面的测试建模方法及装置、电子设备、存储介质 |
CN116912669A (zh) * | 2023-09-11 | 2023-10-20 | 中国物品编码中心 | 一种网页劫持监测方法、系统、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101145902A (zh) * | 2007-08-17 | 2008-03-19 | 东南大学 | 基于图像处理的钓鱼网页检测方法 |
CN101350011A (zh) * | 2007-07-18 | 2009-01-21 | 中国科学院自动化研究所 | 一种基于小样本集的搜索引擎作弊检测方法 |
CN101493819A (zh) * | 2008-01-24 | 2009-07-29 | 中国科学院自动化研究所 | 一种搜索引擎作弊检测的优化方法 |
US7962510B2 (en) * | 2005-02-11 | 2011-06-14 | Microsoft Corporation | Using content analysis to detect spam web pages |
-
2011
- 2011-12-06 CN CN201110402588XA patent/CN102521331A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7962510B2 (en) * | 2005-02-11 | 2011-06-14 | Microsoft Corporation | Using content analysis to detect spam web pages |
CN101350011A (zh) * | 2007-07-18 | 2009-01-21 | 中国科学院自动化研究所 | 一种基于小样本集的搜索引擎作弊检测方法 |
CN101145902A (zh) * | 2007-08-17 | 2008-03-19 | 东南大学 | 基于图像处理的钓鱼网页检测方法 |
CN101493819A (zh) * | 2008-01-24 | 2009-07-29 | 中国科学院自动化研究所 | 一种搜索引擎作弊检测的优化方法 |
Non-Patent Citations (1)
Title |
---|
李智超等: "网页作弊与反作弊技术综述", 《山东大学学报(理学版)》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104426861A (zh) * | 2013-08-27 | 2015-03-18 | 中国银联股份有限公司 | 网页检测方法及系统 |
CN104426861B (zh) * | 2013-08-27 | 2017-12-26 | 中国银联股份有限公司 | 网页检测方法及系统 |
CN104573412B (zh) * | 2013-10-16 | 2019-04-23 | 航天信息软件技术有限公司 | 防止拷贝网页文字内容的方法和装置 |
CN104573412A (zh) * | 2013-10-16 | 2015-04-29 | 北京航天在线网络科技有限公司 | 防止拷贝网页文字内容的方法和装置 |
CN103780701A (zh) * | 2014-01-26 | 2014-05-07 | 百度在线网络技术(北京)有限公司 | 浏览器监控方法及装置 |
CN103780701B (zh) * | 2014-01-26 | 2017-07-28 | 百度在线网络技术(北京)有限公司 | 浏览器监控方法及装置 |
WO2015165245A1 (zh) * | 2014-04-30 | 2015-11-05 | 广州市动景计算机科技有限公司 | 一种网页数据处理方法及装置 |
WO2016015276A1 (en) * | 2014-07-31 | 2016-02-04 | Hewlett-Packard Development Company, L.P. | Analysis of system information |
US10474651B2 (en) | 2014-07-31 | 2019-11-12 | Hewlett-Packard Development Company, L.P. | Analysis of system information |
CN108259416A (zh) * | 2016-12-28 | 2018-07-06 | 华为技术有限公司 | 检测恶意网页的方法及相关设备 |
CN111680252A (zh) * | 2020-06-05 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 外链识别方法、装置、设备及计算机可读存储介质 |
CN113791837A (zh) * | 2021-08-12 | 2021-12-14 | 百度在线网络技术(北京)有限公司 | 页面处理方法、装置、设备和存储介质 |
CN113791837B (zh) * | 2021-08-12 | 2023-08-11 | 百度在线网络技术(北京)有限公司 | 页面处理方法、装置、设备和存储介质 |
CN113836028A (zh) * | 2021-09-28 | 2021-12-24 | 奇安信科技集团股份有限公司 | 软件界面的测试建模方法及装置、电子设备、存储介质 |
CN116912669A (zh) * | 2023-09-11 | 2023-10-20 | 中国物品编码中心 | 一种网页劫持监测方法、系统、电子设备和存储介质 |
CN116912669B (zh) * | 2023-09-11 | 2023-11-28 | 中国物品编码中心 | 一种网页劫持监测方法、系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521331A (zh) | 网页跳转作弊检测方法及装置 | |
US10915980B2 (en) | Method and apparatus for adding digital watermark to video | |
US10395120B2 (en) | Method, apparatus, and system for identifying objects in video images and displaying information of same | |
CN108595583B (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
US9055335B2 (en) | Systems and methods for addressing a media database using distance associative hashing | |
JP2023018021A (ja) | 制御されていない照明条件の画像中の肌色を識別する技術 | |
TWI598753B (zh) | Web page display method and web page display device based on graphic processing | |
US8861884B1 (en) | Training classifiers for deblurring images | |
WO2017101690A1 (zh) | 广告检测方法和装置 | |
US20150213122A1 (en) | Systems and methods for addressing a media database using distance associative hashing | |
US20140250110A1 (en) | Image attractiveness based indexing and searching | |
US10305768B2 (en) | Page phase time | |
EP4171043A1 (en) | Method and apparatus for providing multimedia content, and device | |
CA2906199A1 (en) | Systems and methods for addressing a media database using distance associative hashing | |
US20210334929A1 (en) | Detecting semi-transparent image watermarks | |
US20180107686A1 (en) | Search method and apparatus | |
EP3001871A1 (en) | Systems and methods for addressing a media database using distance associative hashing | |
CN107329976B (zh) | 网页分页方法、装置、计算机设备及计算机可读存储介质 | |
US10867119B1 (en) | Thumbnail image generation | |
CN109272526B (zh) | 图像处理方法、系统及电子设备 | |
CN103488508B (zh) | 一种浏览器的工作方法、浏览器及终端设备 | |
CN113014993B (zh) | 图片显示方法、装置、设备及存储介质 | |
JP2009277155A (ja) | 画像検索装置、画像検索方法、情報処理プログラム及び記録媒体 | |
US9229610B2 (en) | Methods and systems for visually forming relationships between electronic content | |
US11288776B2 (en) | Method and apparatus for image processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120627 |