CN105704099B - 一种检测隐藏在网站脚本中非法链接的方法 - Google Patents

一种检测隐藏在网站脚本中非法链接的方法 Download PDF

Info

Publication number
CN105704099B
CN105704099B CN201410697407.4A CN201410697407A CN105704099B CN 105704099 B CN105704099 B CN 105704099B CN 201410697407 A CN201410697407 A CN 201410697407A CN 105704099 B CN105704099 B CN 105704099B
Authority
CN
China
Prior art keywords
website
data
detection
black chain
script
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410697407.4A
Other languages
English (en)
Other versions
CN105704099A (zh
Inventor
郝增帅
魏桂臣
杨成明
李凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Global Energy Interconnection Research Institute
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Global Energy Interconnection Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, Global Energy Interconnection Research Institute filed Critical State Grid Corp of China SGCC
Priority to CN201410697407.4A priority Critical patent/CN105704099B/zh
Publication of CN105704099A publication Critical patent/CN105704099A/zh
Application granted granted Critical
Publication of CN105704099B publication Critical patent/CN105704099B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种检测隐藏在网站脚本中非法链接的方法,所述非法链接是黑链;所述方法包括建立检测规则库的过程和检测黑链过程;所述建立检测规则库的过程包括以下步骤:获取网站源代码数据;对黑链进行过滤和识别;判别黑链;网站源代码提取超级连接检测和网站参数检测;将超级连接检测数据和网站参数检测数据整合并发送至数据库;所述检测黑链过程是对所述数据库中的数据进行检测。本发明通过针对黑链的特点,进行有针对性的技术检测;为了提高准确率,对目标网页的源代码进行检测,通过分析整理的代码检测规则等方式,进行混合检测,以达到最终的检测目标。同时,可以对已检测到的数据可以进行名单形式的数据整理,以提高检测效率。

Description

一种检测隐藏在网站脚本中非法链接的方法
技术领域:
本发明涉及一种网络黑链检测方法,更具体涉及一种检测隐藏在网站脚本中非法链接的方法。
背景技术:
黑链是一种在网站页面上隐藏不可见或极易被忽略的非法超链接,它们通常是黑客入侵网站后植入的(或是web应用开发商发布应用时植入的),用于欺骗搜索引擎提高所链向网站的价值,进而提高所链向网站在搜索引擎中的排名。黑链是一种黑帽SEO手段。
黑链的本质是一种超链接,它们对网站的访问者并不具有实质性的危害,所以大部分传统的安全软件不会对其做出告警提示。
但黑链的存在通常标志着一个网站存在严重的安全漏洞,并且该漏洞已经被黑客成功利用,黑客甚至可以通过搜索引擎搜索带有黑链的网站来批量入侵网站,进行其他破坏行为,如刷库、拖库、挂马、进行DDOS攻击等。
另外,一个网站存在黑链,则该网站的用户数据通常已经泄漏,网站提供下载的资源可能被绑定了木马或被植入了后门。故提出一种检测隐藏在网站脚本中非法链接的方法,以解决上述问题。
发明内容:
本发明的目的是提供一种检测隐藏在网站脚本中非法链接的方法,该方法有效的、准确的对黑链进行检测。
为实现上述目的,本发明采用以下技术方案:一种检测隐藏在网站脚本中非法链接的方法,所述非法链接是黑链;所述方法包括建立检测规则库的过程和检测黑链过程;
所述建立检测规则库的过程包括以下步骤:
(1)获取网站源代码数据;
(2)对黑链进行过滤和识别;
(3)判别黑链;
(4)网站源代码提取超级连接检测和网站参数检测;
(5)将超级连接检测数据和网站参数检测数据整合并发送至数据库;
所述检测黑链过程是对所述数据库中的数据进行检测。
本发明提供的一种检测隐藏在网站脚本中非法链接的方法,所述步骤(1)中数据通过对目标的页面元素分析处理获得。
本发明提供的一种检测隐藏在网站脚本中非法链接的方法,所述页面元素包括标签和编码。
本发明提供的另一优选的一种检测隐藏在网站脚本中非法链接的方法,所述步骤(2)中的过滤和识别过程为:
获取页面元素中URL;
过滤页面元素中域名地址数据;;
根据制定好的白名单和访问阀值进行初步黑链过滤与识别。
本发明提供的再一优选的一种检测隐藏在网站脚本中非法链接的方法,所述URL通过对网站页面元素信息进行解析获得;通过排除法对数据进行过滤。
本发明提供的又一优选的一种检测隐藏在网站脚本中非法链接的方法,所述白名单为公司正常链接地址数据或已知链接数据,其余均为非法链接。
所述访问数据阀值依据公司数据链接统计,根据时间、访问数量及数据流量设定数据阀值。
本发明提供的又一优选的一种检测隐藏在网站脚本中非法链接的方法,所述步骤(3)中判别过程为:
获取网站源代码中所有URL信息;
排除网站源代码中URL信息数据;
根据黑名单和关键字检测来判别黑链。
本发明提供的又一优选的一种检测隐藏在网站脚本中非法链接的方法,所述网站源代码中URL信息数据排除过程为:通过将解析特定网页的标签、获取的所述隐藏区域源码中URL数据和所述白名单进行比对,通过对比结果来进行数据排除;所述黑名单通过所述对比结果确定;所述特定的网页的标签包括经过编码过的URL或白名单以外的URL。
本发明提供的又一优选的一种检测隐藏在网站脚本中非法链接的方法,所述检测黑链过程是通过黑链的特征属性对所述数据库进行检测。
本发明提供的又一优选的一种检测隐藏在网站脚本中非法链接的方法,所述黑链的特征属性包括style属性控制标签隐藏、减小marquee滚动文字值、隐藏脚本控制标签、隐藏CSS样式控制标签和隐藏JS输出标签。
和最接近的现有技术比,本发明提供技术方案具有以下优异效果
1、本发明在于针对网站页面元素的分类以及相对应的检测与对应的检测方法;
2、本发明通过相对应的匹配情况,再加以辅助的例如关键字、流量分析等成熟的技术手段来实现有效的、准确的对黑链进行检测的目的;
3、本发明避免网络安全漏洞,维护网络安全;
4、本发明对已检测到的数据可以进行名单形式的数据整理,以提高检测效率;
5、本发明保护用户数据,保护用户隐私。
附图说明
图1为本发明的方法流程图;
图2为本发明的检测技术点流程图。
具体实施方式
下面结合实施例对发明作进一步的详细说明。
实施例1:
如图1-2所示,本例的发明提供的一种检测隐藏在网站脚本中非法链接的方法,所述非法链接是黑链;所述方法包括建立检测规则库的过程和检测黑链过程;
所述建立检测规则库的过程包括以下步骤:
1)通过对目标网站的页面元素如标签、编码处理获取网站源代码等数据,来进行黑链预检测;
2)获取网站元素信息,对元素进行解析,提取元素中URL,通过采用排除法进行数据过滤,根据制定好的白名单、访问阀值进行初步黑链过滤与识别;
3)从网站源码中提取所有URL信息,通过解析对特定的网页标签及获取隐藏区域源码中URL,与已有的白名单进行比对,通过对比结果来进行数据排除。同时,根据对比结果生成黑名单,再通过关键字检测来判别黑链;所述关键字为自定义数据,主要是一些广告语等关键字或域名特性关键字。
4)网站源码提取超级连接检测、网站参数检测;所述参数包括颜色设置参数、字体参数、关键字位置参数、链接展现参数等中的一种或任意组合;
5)最后,将两部分检测数据整合并保留到数据库中。
因此,如何发现黑链或检测到黑链就是一个非常关键的技术点。通过对黑链页面的长期细致的研究工作,发现了几类黑链常用的一些特征属性:
并通过上述特征属性对所述黑链进行检测:
1)style属性控制标签隐藏
2)减小marquee滚动文字值
3)隐藏脚本控制标签
4)隐藏CSS样式控制标签
5)隐藏JS输出标签
因此,可以通过建立黑链特征的方式,添加对应的检测规则来对黑链进行有效的检测。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员尽管参照上述实施例应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。

Claims (6)

1.一种检测隐藏在网站脚本中非法链接的方法,所述非法链接是黑链;其特征在于:所述方法包括建立检测规则库的过程和检测黑链过程;
所述建立检测规则库的过程包括以下步骤:
(1)获取网站源代码数据;
所述步骤(1)中数据通过对目标的页面元素分析处理获得;
(2)对黑链进行过滤和识别;
所述步骤(2)中的过滤和识别过程为:
获取页面元素中URL;
过滤页面元素中域名地址数据;
根据制定好的白名单和访问数据阀值进行初步黑链过滤与识别;
所述URL通过对网站页面元素信息进行解析获得;通过排除法对数据进行过滤;
(3)判别黑链;
所述步骤(3)中判别过程为:
获取网站源代码中所有URL信息;
排除网站源代码中URL信息数据;
根据黑名单和关键字检测来判别黑链;
(4)网站源代码提取超级连接检测和网站参数检测;
(5)将超级连接检测数据和网站参数检测数据整合并发送至数据库;
所述检测黑链过程是对所述数据库中的数据进行检测。
2.如权利要求1所述的一种检测隐藏在网站脚本中非法链接的方法,其特征在于:所述页面元素包括标签和编码。
3.如权利要求1所述的一种检测隐藏在网站脚本中非法链接的方法,其特征在于:所述白名单为公司正常链接地址数据或已知链接数据,其余均为非法链接;
所述访问数据阀值依据公司数据链接统计,根据时间、访问数量及数据流量设定数据阀值。
4.如权利要求1所述的一种检测隐藏在网站脚本中非法链接的方法,其特征在于:所述网站源代码中URL信息数据排除过程为:通过将解析特定网页的标签、获取的隐藏区域源代码中URL数据和所述白名单进行比对,通过对比结果来进行数据排除;所述黑名单通过所述对比结果确定;所述特定的网页的标签包括经过编码过的URL或白名单以外的URL。
5.如权利要求1所述的一种检测隐藏在网站脚本中非法链接的方法,其特征在于:所述检测黑链过程是通过黑链的特征属性对所述数据库进行检测。
6.如权利要求1所述的一种检测隐藏在网站脚本中非法链接的方法,其特征在于:所述黑链的特征属性包括style属性控制标签隐藏、减小marquee滚动文字值、隐藏脚本控制标签、隐藏CSS样式控制标签和隐藏JS输出标签。
CN201410697407.4A 2014-11-26 2014-11-26 一种检测隐藏在网站脚本中非法链接的方法 Active CN105704099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410697407.4A CN105704099B (zh) 2014-11-26 2014-11-26 一种检测隐藏在网站脚本中非法链接的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410697407.4A CN105704099B (zh) 2014-11-26 2014-11-26 一种检测隐藏在网站脚本中非法链接的方法

Publications (2)

Publication Number Publication Date
CN105704099A CN105704099A (zh) 2016-06-22
CN105704099B true CN105704099B (zh) 2019-03-22

Family

ID=56295389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410697407.4A Active CN105704099B (zh) 2014-11-26 2014-11-26 一种检测隐藏在网站脚本中非法链接的方法

Country Status (1)

Country Link
CN (1) CN105704099B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107957872A (zh) * 2017-10-11 2018-04-24 中国互联网络信息中心 一种完整网站源码获取方法及非法网站检测方法、系统
CN108399337B (zh) * 2018-03-16 2021-07-30 北京奇虎科技有限公司 用于识别网页挖矿脚本的方法及装置
CN109271315B (zh) * 2018-08-23 2024-05-10 中国平安财产保险股份有限公司 脚本代码检测方法、装置、计算机设备及存储介质
CN110309667B (zh) * 2019-04-16 2022-08-30 网宿科技股份有限公司 一种网站暗链检测方法和装置
CN111143722A (zh) * 2019-12-23 2020-05-12 杭州安恒信息技术股份有限公司 一种网页暗链检测方法、装置、设备及介质
CN112968875B (zh) * 2021-01-29 2022-11-01 上海安恒时代信息技术有限公司 网络关系构建方法及系统
CN117251441A (zh) * 2023-09-22 2023-12-19 江苏天好富兴数据技术有限公司 基于大数据的黑链检测系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622435A (zh) * 2012-02-29 2012-08-01 百度在线网络技术(北京)有限公司 一种检测黑链的方法和装置
CN102638448A (zh) * 2012-02-27 2012-08-15 珠海市君天电子科技有限公司 一种基于非内容分析的判断钓鱼网站的方法
CN103544436A (zh) * 2013-10-12 2014-01-29 深圳先进技术研究院 一种钓鱼网站鉴别系统和方法
CN104077396A (zh) * 2014-07-01 2014-10-01 清华大学深圳研究生院 一种钓鱼网站检测方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801574B (zh) * 2011-05-27 2016-08-31 阿里巴巴集团控股有限公司 一种网页链接的检测方法、装置和系统
CN103092832A (zh) * 2011-10-27 2013-05-08 腾讯科技(深圳)有限公司 网址风险检测的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102638448A (zh) * 2012-02-27 2012-08-15 珠海市君天电子科技有限公司 一种基于非内容分析的判断钓鱼网站的方法
CN102622435A (zh) * 2012-02-29 2012-08-01 百度在线网络技术(北京)有限公司 一种检测黑链的方法和装置
CN103544436A (zh) * 2013-10-12 2014-01-29 深圳先进技术研究院 一种钓鱼网站鉴别系统和方法
CN104077396A (zh) * 2014-07-01 2014-10-01 清华大学深圳研究生院 一种钓鱼网站检测方法及装置

Also Published As

Publication number Publication date
CN105704099A (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
CN105704099B (zh) 一种检测隐藏在网站脚本中非法链接的方法
Kim et al. Suspicious malicious web site detection with strength analysis of a javascript obfuscation
CN103559235B (zh) 一种在线社交网络恶意网页检测识别方法
CN105119909B (zh) 一种基于页面视觉相似性的仿冒网站检测方法和系统
CN102110198B (zh) 一种网页防伪的方法
US20110239294A1 (en) System and method for detecting malicious script
CN107888571A (zh) 一种基于HTTP日志的多维度webshell入侵检测方法及检测系统
US20220019658A1 (en) Systems and methods for improving accuracy in recognizing and neutralizing injection attacks in computer services
CN105357221A (zh) 识别钓鱼网站的方法及装置
CN109922065B (zh) 恶意网站快速识别方法
WO2021017318A1 (zh) 跨站攻击防护方法、装置、设备及存储介质
CN109271788A (zh) 一种基于深度学习的Android恶意软件检测方法
CN109756467B (zh) 一种钓鱼网站的识别方法及装置
CN107135212A (zh) 一种基于行为差异的Web环境下的人机识别装置及方法
CN103379111A (zh) 一种网络钓鱼智能防御系统
CN104202291A (zh) 基于多因素综合评定方法的反钓鱼方法
CN110443031A (zh) 一种二维码风险识别方法和系统
CN105975523A (zh) 一种基于栈的暗链检测方法
CN104504335A (zh) 基于页面特征和url特征的钓鱼app检测方法及系统
CN104766013A (zh) 一种基于跳表的跨站脚本攻击防御方法
CN103220277B (zh) 监控跨站脚本攻击的方法、装置及系统
CN110020532B (zh) 一种信息过滤方法、系统、设备及计算机可读存储介质
Zeydan et al. Survey of anti-phishing tools with detection capabilities
CN110245195B (zh) 基于蜜罐系统的结构化查询语言注入检测方法及装置
KR101639869B1 (ko) 악성코드 유포 네트워크 탐지 프로그램

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant after: State Grid Corporation of China

Applicant after: China Electric Power Research Institute

Applicant after: GLOBAL ENERGY INTERCONNECTION RESEARCH INSTITUTE

Address before: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant before: State Grid Corporation of China

Applicant before: China Electric Power Research Institute

Applicant before: State Grid Smart Grid Institute

COR Change of bibliographic data
GR01 Patent grant
GR01 Patent grant