CN103023874A - 一种钓鱼网站检测方法 - Google Patents
一种钓鱼网站检测方法 Download PDFInfo
- Publication number
- CN103023874A CN103023874A CN2012104771396A CN201210477139A CN103023874A CN 103023874 A CN103023874 A CN 103023874A CN 2012104771396 A CN2012104771396 A CN 2012104771396A CN 201210477139 A CN201210477139 A CN 201210477139A CN 103023874 A CN103023874 A CN 103023874A
- Authority
- CN
- China
- Prior art keywords
- css
- relatively
- selector
- unit
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims description 14
- 230000008878 coupling Effects 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 7
- 238000005859 coupling reaction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000008901 benefit Effects 0.000 abstract description 2
- 201000001432 Coffin-Siris syndrome Diseases 0.000 description 43
- 238000010794 Cyclic Steam Stimulation Methods 0.000 description 43
- 101100115215 Caenorhabditis elegans cul-2 gene Proteins 0.000 description 6
- 101100171060 Caenorhabditis elegans div-1 gene Proteins 0.000 description 6
- 239000007787 solid Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明一种钓鱼网站检测方法,步骤如下:1、CSS文本提取,按照不同的存在形式分别进行提取;将以上提取的所有的CSS字符串合并到同一个文件中;2、CSS文本解析,使用CSS解析器对步骤1得到的CSS文件进行自动解析,得到对应的规则对象集合;3、比较元提取,从规则集合中选择带某些特征的属性并重新整合,以便于相似度的快速计算;4、相似度计算,根据两个网页的比较元集合的匹配情况计算相似度。本发明有以下优点:1)轻量级,算法轻量级,易于使用浏览器扩展实现;2)普适性强,由于正常网站内所有网页一般采用统一的样式风格,因此只需检测可疑网页与目标网站内任一个网页是否匹配即可,而且不受网页语言种类的限制;3)低误报。
Description
【技术领域】
本发明提供一种钓鱼网站检测方法,属于计算机互联网(Web)安全领域。
【背景技术】
钓鱼网站仿冒真实网站的域名(URL)地址以及页面内容(通常伪装成银行及电子商务网站),或者利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的Javascript代码,以此来骗取用户银行或信用卡账号、密码等私人资料,使用户受到经济上的损失。目前针对网购的攻击则日益普遍,钓鱼网站取代病毒木马成为互联网第一大安全威胁,钓鱼网站的检测识别成为Web安全领域重要研究内容。
判断一个网站是否是钓鱼网站,一个重要的途径是验证该网站是否跟某个真实网站在视觉效果或内容上具有相似性。一些方案使用页面内容作为检测方法,根据页面内容关键字频度或者页脚版权声明大致确定疑似仿冒的目标网站。这种方式精确度不高,攻击者很容易使用替代的关键字躲避检测。一些方案使用网页文档对象模型(HTML Document Object Mode,DOM)结构作为相似度检测的依据,这种检测机制也很容易躲避,攻击者可以使用不同的DOM结构仿冒一个真实网站,普通用户在视觉上很难分辨。还有一些机制使用页面截图比较的方式计算相似度,该机制使用图形软件比较可疑网页的截图与目标网页截图的相似度。该方案缺点是效率不高、使用不方便,用户无法通过简单便捷的方法如浏览器扩展进行检测。
【发明内容】
(1)发明目的
本发明目的在于提供一种基于网页层叠样式表(Cascading Style Sheet,CSS)的相似度的钓鱼网站检测方法。传统方法在确定疑似网页后很难判断该网页是否仿照某个真实网页,本方案根据CSS相似度能为这种判决提供依据。
(2)技术方案
已知网页Ps以及疑似目标网页集D={P1,P2,...Pn},检测Ps与D中任一网页Pd的相似度是否超过某一门限,若超过且二者不属于同一域名,则认为网页Ps是钓鱼网页。
为了实现上述目的,本发明一种钓鱼网站检测方法,它基于CSS的相似度检测的流程,其步骤如下:
步骤一:CSS文本提取
HTML文件的CSS一般有3种存在形式:外部样式表、内部样式表和内联样式表,按照不同的存在形式分别进行提取。将以上提取的所有的CSS字符串合并到同一个文件中。
步骤二:CSS文本解析
使用CSS解析器对步骤一得到的CSS文件进行自动解析,得到对应的规则对象集合。每条规则对象为键-值结构,包含该规则的规则类型、选择器名称、声明集合。规则类型表明该条规则是否是注释或者一条有功能的CSS语句。选择器名称表明该规则应用的目标。声明集合保存对相应目标使用的样式,集合中的每个元素都是对当前选择器一条属性描述,包括属性名称和属性值等信息。对于CSS文件中复合属性的条目在解析时可自动分解为多个单属性集合。
步骤三:比较元提取
本发明从规则集合中选择带某些特征的属性并重新整合,以便于相似度的快速计算。
对于值具有数字特征的属性,进一步处理生成比较元。比较元为“键:值”对,以便于查找和比较。其中,键为属性和属性值的链接,值为拥有该属性和属性值的选择器集合。由于很多网页中包含大量值为0的属性,给相似度计算的准确性带来一定干扰,本发明不将其当作比较元
步骤四:相似度计算
可以根据两个网页的比较元集合的匹配情况计算相似度。假设有比较元集合A和B,A对B的相似度定义为:A对B的相似度等于A与B的匹配集合得分与A的比较元总分之比。即:
在计算匹配得分和总分时需经以下几个步骤:
1)权值设定。对不同的匹配元素设定不同的权值。比较元的键的权值设为s1,即当比较元集合A中某个比较元的键在比较元集合B中存在,则将匹配得分加s1。比较元的值为选择器数组,数组中的不同类型的选择器对应不同的权值。令HTML标签选择器的权值为s2,派生选择器的权值为s3,类选择器的权值为s4,ID选择器的权值为s5。
2)得分计算。
A的总分的计算方式为:
其中k2、k3、k4、k5分别为对应的比较元HTML标签选择器、派生选择器、类选择器、ID选择器的个数。
A的匹配得分的计算方式为:集合A中任一比较元的键在比较元集合B中存在,则将匹配得分加s1,若不存在则该比较元得分为0。若集合B存在该键,然后比较该键对应值中选择器的匹配数目,根据匹配类型的权值计算匹配得分总和。
3)相似度计算。A对B的相似度为A与B的匹配得分与A的比较元总分之比。
其中,步骤二中所述的CSS文本进行解析,可使用CSS解析器自动进行操作,以输出CSS对象模型。
其中,在步骤三中所述的从规则集合中选择带某些特征的属性并重新整合,其方法如下:
A.提取值以‘.’号开头的属性;
B.提取值以数字开头的属性;
C.提取属值为颜色的属性。
D.对提取的属性及对应值进行处理生成比较元。比较元为“键:值”对,以便于查找和比较。
(3)本发明有以下优点:1)轻量级。本发明算法轻量级,易于使用浏览器扩展实现。2)普适性强。由于正常网站内所有网页一般采用统一的样式风格,因此只需检测可疑网页与目标网站内任一个网页是否匹配即可,而且本发明不受网页语言种类的限制。3)低误报。
【附图说明】
图1为本发明网页相似度计算总体流程图。
【具体实施方式】
下面结合附图对本发明进行进一步详细说明。如图1所示,本发明一种钓鱼网站检测方法,它比较两个网页的页面相似度,需经过四个步骤:1)分别提取两个网页提取CSS文本信息。对于一个网页其CSS文本一般有三种存在方式,即外部样式表、内部样式表和内联样式表。2)从获得CSS文本中提取规则集合,规则集合为为JSON格式。3)从规则集合中提取相应规则,并进行重新组合作为匹配元。4)从两个网页分别得到的匹配元进行匹配计算,得到两个网页的相似度。若相似度大于门限,则认为两个网页具有高的相似性,否则不相似。
本发明一种钓鱼网站检测方法,它基于层叠样式表的网页相似度检测方法,该方法就相似度计算的整个流程给予详细说明,其具体步骤如下:
步骤一:CSS文本提取
CSS文本在网页中一般有三种存在形式,其提取方法如下:
1)外部样式表。外部样式表的加载方式有两种,一种是以link标签开头的样式表,形如:<link rel=“stylesheet”type=“text/css”href=”core1.css”/>。link是HTML标签,常放置在head标签内,href属性指向的是该外部样式表的位置,即当前域名目录下的core1.css文件为需加载的外部样式表。另一种是import开头的外部样式表,行如:<style>importurl(“core2.css”)</style>。import是CSS的一个标签,常放置于内部样式表的<style>标签内,或者放置于外部样式表CSS文件内,其中core2.css即为要加载的外部样式表。根据当前当前网页的域名和外部样式表文件名得到该样式表的完整地址,使用ajax获取该地址对应的CSS文本信息。
2)内部样式表。内部样式表为HTML内部<style></style>标签内部的样式表。可以根据正则表达式从当前网页中匹配<style>标签内的文本,也可根据DOM结构获取<style>节点的子节点,从而提取所需的CSS文本信息。
3)内联样式表。内联样式表指的是HTML标签内部的样式表,如<p style=“color:red”></p>,其中CSS文本为style的值。对于这种形式的样式表,可遍历DOM元素,获取所有元素style属性对应的CSS文本。
以上三种样式表不一定同时存在,有些网页可能只存在其中的一种或两种。将提取的CSS文本组合在一个文件中用于后续处理。
步骤二:CSS文本解析
该步骤中可使用解析器自动解析CSS字符串并输出CSS对象模型。该对象模型包括CSS文本解析后的所有规则,每条规则均包括以下信息:
1)规则类型。规则类型表明该条规则是何种类型。
2)选择器。选择器表明该条规则的应用对象,一个选择器可能包括几个应用对象,之间用逗号隔开。
3)声明集合。声明集合包含一条或多条属性值对,是对对应选择器的样式描述。对于复合属性的条目在解析时可自动分解为多个单属性集合。如“border:1px solid red”分解为“border-top:1px solid red”、“border-left:1px solid red”、“border-bottom:1pxsolid red”、“border-left:1px solid red”四条单属性规则。
步骤三:比较元提取
规则集合中包括网页元素的所有属性,绝大多数属性对网页相似度的比较意义不大且经常带来误报。本发明从规则集合中选择带数字特征的属性并重新整合。
数字特征包括以下几种情况:
1)属性值以‘.’号开头,如“font-size:.5em”。此时该属性被选中,并自动将‘.5em’填充为‘0.5em’。
2)属性值以数字开头,如“padding-top:2px”。
3)属性值为颜色值,如“color:#ff0000”。判断属性值是不是颜色值可检查其值是否为特定的颜色单词,如“red”、“green”等。也可根据属性值是否以“#”或者“RGB”开头来判断。
对于情况3),颜色表示有多种方式,如“color:red”、“color:#f00”、“RGB(255,0,0)”等。此时将不同的表示方式转换为统一的格式,即“#color:#ff0000”。
对于值具有数字特征的属性,进一步处理生成比较元。比较元为“键:值”对,以便于查找和比较。其中,键为属性和属性值的链接,值为拥有该属性和属性值的选择器集合。如对于CSS文本:“#div1,#div2:{width:300px;height:400px;background-color:red}#div3:{width:300px;}”,生成3个比较元:“width300px”:[“#div1”,“#div2”,“#div3”]、“height400px”:[“#div1”,“#div2”]、“background-color#ff0000”:[“#div1”,“#div2”]。
另外,对于值为0的属性,本发明不将其当作比较元。这是由于很多网页中包含大量值为0的属性,给相似度计算的准确性带来一定干扰。
步骤四:相似度计算;
可以根据两个网页的比较元集合的匹配情况计算相似度。本发明中网页PA对网页PB的相似度并不等同于网页PB对网页PA的相似度,若网页PA中的比较元集合是网页PB比较元集合的子集,则认为网页PA完全相似于网页PB。这是因为在真实环境下,钓鱼网站PA在模仿一个真实网站PB时可能只使用真实网站的部分CSS信息达到近似的视觉效果,此时仍认为PA相似于PB。
假设有如下两个比较元集合A和B,要计算A对B的相似度。本发明令:
A:
“color#ff0000”:[“p”,“div p”,“.main”,“#div2”,“#div3”]
B:
“color#ff0000”:[“p”,“.main”,“#div1”,“#div2”,“#div3”]
“height400px”:[“#div1”,“#div2”]
在计算匹配得分和总分时需经以下几个步骤:
4)权值设定。对不同的匹配元素设定不同的权值。比较元的键的权值设为s1,即当比较元集合A中某个比较元的键在比较元集合B中存在,则将匹配得分加s1。比较元的值为选择器数组,数组中的不同类型的选择器对应不同的权值。令HTML标签选择器的权值为s2,派生选择器的权值为s3,类选择器的权值为s4,ID选择器的权值为s5。本发明选择s1=1、s2=2,、s3=3、s4=4、s5=5。
5)得分计算。
A的总分的计算方式为:
其中k2、k3、k4、k5分别为对应的比较元HTML标签选择器、派生选择器、类选择器、ID选择器的个数。
A的匹配得分的计算方式为:集合A中任一比较元的键在比较元集合B中存在,则将匹配得分加s1,若不存在则该比较元得分为0。若集合B存在该键,然后比较该键对应值中选择器的匹配数目,根据匹配类型的权值计算匹配得分总和。
例如,A只有一个比较元,比较元的值有4个选择器“p”、“div p”、“.main”、“#div2”和”#div3”,对应的权值为s2、s3、s4、s5、s5,因此比较元总分为s1+s2+s3+s4+2*s5=20。由于A比较元“color#ff0000”中的选择器集合与B相应的选择器集合的交集为“p”、“.main”、“#div2”、“#div3”,因此匹配得分为s1+s2+s4+2*s5=17。
若待测网页和真实网页相似度大于门限,且不属于同一域,则说明待测网页是钓鱼网页,否则为真实网页。
Claims (3)
1.一种钓鱼网站检测方法,其特征在于:该方法步骤如下:
步骤一:层叠样式表CSS文本提取
超文本标记语言HTML文件的层叠样式表CSS有3种存在形式:外部样式表、内部样式表和内联样式表,按照不同的存在形式分别进行提取;将以上提取的所有的层叠样式表CSS字符串合并到同一个文件中;
步骤二:层叠样式表CSS文本解析
使用层叠样式表CSS解析器对步骤一得到的层叠样式表CSS文件进行自动解析,得到对应的规则对象集合;每条规则对象为键-值结构,包含该规则的规则类型、选择器名称及声明集合;规则类型表明该条规则是否是注释或者一条有功能的层叠样式表CSS语句;选择器名称表明该规则应用的目标;声明集合保存对相应目标使用的样式,集合中的每个元素都是对当前选择器一条属性描述,包括属性名称和属性值信息;对于层叠样式表CSS文件中复合属性的条目在解析时自动分解为多个单属性集合;
步骤三:比较元提取
从规则集合中选择带某些特征的属性并重新整合,以便于相似度的快速计算;
对于值具有数字特征的属性,进一步处理生成比较元;比较元为“键:值”对,以便于查找和比较;其中,键为属性和属性值的链接,值为拥有该属性和属性值的选择器集合;
步骤四:相似度计算
根据两个网页的比较元集合的匹配情况计算相似度;假设有比较元集合A和B,A对B的相似度定义为:A对B的相似度等于A与B的匹配集合得分与A的比较元总分之比;即:
在计算匹配得分和总分时需经以下几个步骤:
1)权值设定;对不同的匹配元素设定不同的权值;比较元的键的权值设为s1,即当比较元集合A中某个比较元的键在比较元集合B中存在,则将匹配得分加s1;比较元的值为选择器数组,数组中的不同类型的选择器对应不同的权值;令超文本标记语言HTML标签选择器的权值为s2,派生选择器的权值为s3,类选择器的权值为s4,ID选择器的权值为s5;
2)得分计算;
A的总分的计算方式为:
其中k2、k3、k4、k5分别为对应的比较元超文本标记语言HTML标签选择器、派生选择器、类选择器、ID选择器的个数;
A的匹配得分的计算方式为:集合A中任一比较元的键在比较元集合B中存在,则将匹配得分加s1,若不存在则该比较元得分为0;若集合B存在该键,然后比较该键对应值中选择器的匹配数目,根据匹配类型的权值计算匹配得分总和;
3)相似度计算;A对B的相似度为A与B的匹配得分与A的比较元总分之比。
2.根据权利要求1所述的一种钓鱼网站检测方法,其特征在于:在步骤二中所述的层叠样式表CSS文本进行解析,是使用层叠样式表CSS解析器自动进行操作,以输出层叠样式表CSS对象模型。
3.根据权利要求1所述的一种钓鱼网站检测方法,其特征在于:在步骤三中所述的从规则集合中选择带某些特征的属性并重新整合,其方法如下:
A.提取值以‘.’号开头的属性;
B.提取值以数字开头的属性;
C.提取属值为颜色的属性;
D.对提取的属性及对应值进行处理生成比较元;比较元为“键:值”对,以便于查找和比较。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210477139.6A CN103023874B (zh) | 2012-11-21 | 2012-11-21 | 一种钓鱼网站检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210477139.6A CN103023874B (zh) | 2012-11-21 | 2012-11-21 | 一种钓鱼网站检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103023874A true CN103023874A (zh) | 2013-04-03 |
CN103023874B CN103023874B (zh) | 2015-08-26 |
Family
ID=47972005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210477139.6A Expired - Fee Related CN103023874B (zh) | 2012-11-21 | 2012-11-21 | 一种钓鱼网站检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103023874B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572787A (zh) * | 2013-10-29 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 伪原创网站的识别方法及装置 |
CN104580092A (zh) * | 2013-10-21 | 2015-04-29 | 航天信息股份有限公司 | 对网络页面进行安全性检测的方法和装置 |
CN105187415A (zh) * | 2015-08-24 | 2015-12-23 | 成都秋雷科技有限责任公司 | 钓鱼网页检测方法 |
CN105763543A (zh) * | 2016-02-03 | 2016-07-13 | 百度在线网络技术(北京)有限公司 | 一种识别钓鱼网站的方法及装置 |
CN105868404A (zh) * | 2016-04-20 | 2016-08-17 | 上海斐讯数据通信技术有限公司 | 一种自动检测css表达式的方法及装置 |
CN113065337A (zh) * | 2021-02-26 | 2021-07-02 | 成都环宇知了科技有限公司 | 一种基于OpenXml的定位文档并进行评分的方法及系统 |
CN113641933A (zh) * | 2021-06-30 | 2021-11-12 | 北京百度网讯科技有限公司 | 异常网页识别方法、异常站点识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894134A (zh) * | 2010-06-21 | 2010-11-24 | 南京邮电大学 | 一种基于空间布局的钓鱼网页检测及其实现方法 |
CN102170446A (zh) * | 2011-04-29 | 2011-08-31 | 南京邮电大学 | 一种基于空间布局与视觉特征的钓鱼网页检测方法 |
US8285813B1 (en) * | 2007-12-05 | 2012-10-09 | Appcelerator, Inc. | System and method for emulating different user agents on a server |
-
2012
- 2012-11-21 CN CN201210477139.6A patent/CN103023874B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8285813B1 (en) * | 2007-12-05 | 2012-10-09 | Appcelerator, Inc. | System and method for emulating different user agents on a server |
CN101894134A (zh) * | 2010-06-21 | 2010-11-24 | 南京邮电大学 | 一种基于空间布局的钓鱼网页检测及其实现方法 |
CN102170446A (zh) * | 2011-04-29 | 2011-08-31 | 南京邮电大学 | 一种基于空间布局与视觉特征的钓鱼网页检测方法 |
Non-Patent Citations (1)
Title |
---|
毛剑等: "《云计算环境下隐私保护方案》", 《清华大学学报(自然科学版)》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104580092A (zh) * | 2013-10-21 | 2015-04-29 | 航天信息股份有限公司 | 对网络页面进行安全性检测的方法和装置 |
CN104580092B (zh) * | 2013-10-21 | 2018-01-02 | 航天信息股份有限公司 | 对网络页面进行安全性检测的方法和装置 |
CN104572787A (zh) * | 2013-10-29 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 伪原创网站的识别方法及装置 |
CN104572787B (zh) * | 2013-10-29 | 2019-03-15 | 腾讯科技(深圳)有限公司 | 伪原创网站的识别方法及装置 |
CN105187415A (zh) * | 2015-08-24 | 2015-12-23 | 成都秋雷科技有限责任公司 | 钓鱼网页检测方法 |
CN105763543A (zh) * | 2016-02-03 | 2016-07-13 | 百度在线网络技术(北京)有限公司 | 一种识别钓鱼网站的方法及装置 |
CN105763543B (zh) * | 2016-02-03 | 2019-08-30 | 百度在线网络技术(北京)有限公司 | 一种识别钓鱼网站的方法及装置 |
CN105868404A (zh) * | 2016-04-20 | 2016-08-17 | 上海斐讯数据通信技术有限公司 | 一种自动检测css表达式的方法及装置 |
CN113065337A (zh) * | 2021-02-26 | 2021-07-02 | 成都环宇知了科技有限公司 | 一种基于OpenXml的定位文档并进行评分的方法及系统 |
CN113641933A (zh) * | 2021-06-30 | 2021-11-12 | 北京百度网讯科技有限公司 | 异常网页识别方法、异常站点识别方法及装置 |
CN113641933B (zh) * | 2021-06-30 | 2023-10-20 | 北京百度网讯科技有限公司 | 异常网页识别方法、异常站点识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103023874B (zh) | 2015-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103023874B (zh) | 一种钓鱼网站检测方法 | |
CN104077396B (zh) | 一种钓鱼网站检测方法及装置 | |
CN110808968B (zh) | 网络攻击检测方法、装置、电子设备和可读存储介质 | |
Mavridis et al. | Identifying valid search engine ranking factors in a Web 2.0 and Web 3.0 context for building efficient SEO mechanisms | |
CN102096781B (zh) | 一种基于网页关联性的钓鱼检测方法 | |
CN102779249B (zh) | 恶意程序检测方法及扫描引擎 | |
US8620930B2 (en) | Method and system for determining similarity score | |
CN101894134B (zh) | 一种基于空间布局的钓鱼网页检测及其实现方法 | |
CN102436563B (zh) | 一种检测页面篡改的方法及装置 | |
CN102446255B (zh) | 一种检测页面篡改的方法及装置 | |
CN102170446A (zh) | 一种基于空间布局与视觉特征的钓鱼网页检测方法 | |
CN102004764A (zh) | 互联网不良信息检测方法以及系统 | |
US11907644B2 (en) | Detecting compatible layouts for content-based native ads | |
CN105824822A (zh) | 一种由钓鱼网页聚类定位目标网页的方法 | |
CN102591965B (zh) | 一种黑链检测的方法及装置 | |
CN107943873A (zh) | 知识图谱建立方法、装置、计算机设备及存储介质 | |
CN102170447A (zh) | 一种基于最近邻及相似度测量检测钓鱼网页的方法 | |
CN104268289B (zh) | 链接url的失效检测方法和装置 | |
CN103678528A (zh) | 基于段落抄袭检测的电子作业反抄袭系统和方法 | |
CN107437026A (zh) | 一种基于广告网络拓扑的恶意网页广告检测方法 | |
CN105975547A (zh) | 基于内容与位置特征的近似web文档检测方法 | |
CN104036190A (zh) | 一种检测页面篡改的方法及装置 | |
CN110781497B (zh) | 网页链接的检测方法及存储介质 | |
CN104036189A (zh) | 页面篡改检测方法及黑链数据库生成方法 | |
CN104092667A (zh) | 一种钓鱼网页检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150826 |