CN104156665B - 一种网页篡改监测的方法 - Google Patents

一种网页篡改监测的方法 Download PDF

Info

Publication number
CN104156665B
CN104156665B CN201410350025.4A CN201410350025A CN104156665B CN 104156665 B CN104156665 B CN 104156665B CN 201410350025 A CN201410350025 A CN 201410350025A CN 104156665 B CN104156665 B CN 104156665B
Authority
CN
China
Prior art keywords
monitoring
webpage
web page
web
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410350025.4A
Other languages
English (en)
Other versions
CN104156665A (zh
Inventor
葛菲菲
范渊
杨永清
莫金友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dbappsecurity Technology Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN201410350025.4A priority Critical patent/CN104156665B/zh
Publication of CN104156665A publication Critical patent/CN104156665A/zh
Application granted granted Critical
Publication of CN104156665B publication Critical patent/CN104156665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明涉及信息安全技术领域,旨在提供一种网页篡改监测的方法。该种网页篡改监测的方法包括步骤:过滤标签项配置、敏感字项配置、定级项配置、文件变更配置、模板套用、爬取网页、形成基准、对比改动页面、网页截取、形成报告、产生告警。本发明通过策略配置进行篡改监测,可过滤了一些特殊网页标签,可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑,使得篡改监测更加精准更加灵活,让工作人员可以轻松地得到更加可信的篡改监测告警。

Description

一种网页篡改监测的方法
技术领域
本发明是关于信息安全技术领域,特别涉及一种网页篡改监测的方法。
背景技术
随着互联网的发展,各种技术架构层出不穷,极大程度地满足了用户的各种需求。但是,现有的技术架构下网站漏洞却长期存在:
1、操作系统复杂性:已经公布超过1万多个系统漏洞;
2、漏洞与补丁:系统漏洞从发现到被利用为5天,补丁发布时间为47天;
3、应用系统漏洞:各种注入式攻击,多个应用系统不同的开发者。
主观原因而言,过于苛刻的安全管理要求,通常网络管理员难以完全实现:
1、密码管理:合格密码需要8位以上复杂字符并定期改变;
2、漏洞补丁:操作系统、中间件、应用系统的定期更新;
3、上网控制:钓鱼、木马、间谍软件。
这些原因导致网站网页极容易被篡改,防不胜防。传统的篡改监测,覆盖范围不全,且容易产生误报。例如网站正常的维护,进行图片链接的修改,传统监测方法,会当作是被篡改告警给网站负责人,实际不存在篡改情况,照成网站维护人员时间和精力上的浪费。这些因素还包括:1)很多网页的动态性,造成篡改监测系统的判断错误;2)篡改监测系统本身的判断逻辑不完善;3)目前的应用环境非常复杂,篡改监测系统判断逻辑往往无法覆盖所有可能出现的情况。
发明内容
本发明的主要目的在于克服现有技术中的不足,提供一种准确率更高、灵活度更高的篡改监测方法和系统。为解决上述技术问题,本发明的解决方案是:
提供一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,具体包括下述步骤:
(1)过滤标签项配置:通过配置需要过滤的标签项,过滤网页中特定的标签,用于避免网页动态性标签所引起的篡改误报;
所述标签是指网页浏览器识别符(网页程序中不同的标签有着不同的意义,也代表不同功能和样式,如div标签定义HTML文档中的分隔(division)或部分(section)等),过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性;
(2)敏感字项配置:通过增加敏感字的字库或使用内置敏感字库,实现敏感字的监测,用于控制篡改监测范围;
所述敏感字是指系统禁止发表的词语,包括黄色、政治、暴力、辱骂方面的词汇;
(3)定级项配置:通过将篡改内容进行分级分类,用于按照所需进行分级告警,满足用户特殊需求;定级是指对篡改检测内容进行分级分类;
(4)文件变更配置:用于避免网站正常维护而产生篡改误报;文件变更包括Js文件变更、Css文件变更;
(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置任意组合形成不同的策略模板,在进行篡改监测网站时,选择相应的策略模板名称进行模板套用,形成网站对应一个策略模板的形式,进行篡改监测;
(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法,或者现有开源的网络爬虫;
(7)形成基准:将步骤(6)中抓取的网页进行保存,形成基准(通过网络爬虫抓取的网站网页会保存在指定文件夹下,形成基准文件),即为标注,用于作为下一次爬取网页结果的对比对象;
(8)对比改动页面:通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果;
(9)网页截取:根据步骤(8)中检测出的比对结果,截取篡改前和篡改后的网页,并通过界面直观展现;
(10)形成报告:根据步骤(8)中检测出的比对结果、步骤(9)中获得的截图,(通过velocity组件)形成网站安全报告;
(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。
本发明的工作原理:在对一个网站进行篡改监测之前,利用已知的策略进行配置,排除因网站正常维护或计数器类网页动态性因素产生的篡改告警,定级别定分类进行告警,能够很大程度上降低误报给工作人员带来的困惑。
与现有技术相比,本发明的有益效果是:
通过策略配置进行篡改监测,可过滤了一些特殊网页标签,可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑,使得篡改监测更加精准更加灵活,让工作人员可以轻松地得到更加可信的篡改监测告警。
附图说明
图1为本发明的网页篡改监测的方法流程图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
如图1所示,一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,采用人工干预策略配置方法,提高篡改监测的准确率,产生更加准确可信的篡改告警结果,具体包括下述步骤:
(1)过滤标签项配置:标签即为网页浏览器识别符,网页程序中不同的标签有着不同的意义,也代表不同功能和样式,如div标签定义HTML文档中的分隔(division)或部分(section)等。过滤标签项是指通过人工配置需要过滤的标签项,从而达到过滤网页中特定的标签的目的,如div标签计数器、选择器、Div名称属性、Div临时属性。进行过滤标签项配置,用于避免网页动态性标签所引起的篡改误报;
(2)敏感字项配置:敏感字是指一般系统禁止发表的词语,一般包括黄色,政治,暴力,辱骂方面的词汇。通过手工配置增加敏感字项的字库或使用内置敏感字库,达到敏感字检测的目的。通过敏感字项,控制篡改监测范围;
(3)定级特征项配置:定级是指对篡改检测内容进行分级分类,通过定级项的配置可达到篡改分级告警的目的,满足用户特殊需求;
(4)文件变更配置:文件变更包括Js文件变更、Css文件变更,通过对文件变更项的配置,可达到避免网站正常维护而产生篡改误报的目的;
(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置形成不同策略的模板。在进行下达篡改监测任务时,选择相应的模板名称进行模板套用,形成网站对应一个策略模板的形式,快速进行篡改监测。
(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法,或者现有开源的网络爬虫;
(7)形成基准:用于通过步骤(6)的抓取的网页进行保存,形成基准。基准即为标注,通过网络爬虫抓取的网站网页会保存在指定文件夹下,形成基准文件,作为下一次爬取网页结果的对比对象。
(8)对比改动页面:目的是进行与步骤(7)形成的基准进行对比。篡改监测通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果。
(9)网页截取:通过步骤(8)中的对比改动处,截取篡改前和篡改后的网页,并通过界面直观展现;
(10)形成报告:通过步骤(8)中获得的对比改动处、步骤(9)中获得的截图,通过velocity组件形成网站安全报告;
(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。
最后,需要注意的是,以上列举的仅是本发明的具体实施例。显然,本发明不限于以上实施例,还可以有很多变形。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (1)

1.一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,其特征在于,具体包括下述步骤:
(1)过滤标签项配置:通过配置需要过滤的标签项,过滤网页中特定的标签,用于避免网页动态性标签所引起的篡改误报;
所述标签是指网页浏览器识别符,过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性;
(2)敏感字项配置:通过增加敏感字的字库或使用内置敏感字库,实现敏感字的监测,用于控制篡改监测范围;
所述敏感字是指系统禁止发表的词语,包括黄色、政治、暴力、辱骂方面的词汇;
(3)定级项配置:通过将篡改内容进行分级分类,用于按照所需进行分级告警,满足用户特殊需求;定级是指对篡改检测内容进行分级分类;
(4)文件变更配置:用于避免网站正常维护而产生篡改误报;文件变更包括Js文件变更、Css文件变更;
(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置任意组合形成不同的策略模板,在进行篡改监测网站时,选择相应的策略模板名称进行模板套用,形成网站对应一个策略模板的形式,进行篡改监测;
(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法;
(7)形成基准:将步骤(6)中抓取的网页进行保存,形成基准,即为标注,用于作为下一次爬取网页结果的对比对象;
(8)对比改动页面:通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果;
(9)网页截取:根据步骤(8)中检测出的比对结果,截取篡改前和篡改后的网页,并通过界面直观展现;
(10)形成报告:根据步骤(8)中检测出的比对结果、步骤(9)中获得的截图,形成网站安全报告;
(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。
CN201410350025.4A 2014-07-22 2014-07-22 一种网页篡改监测的方法 Active CN104156665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410350025.4A CN104156665B (zh) 2014-07-22 2014-07-22 一种网页篡改监测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410350025.4A CN104156665B (zh) 2014-07-22 2014-07-22 一种网页篡改监测的方法

Publications (2)

Publication Number Publication Date
CN104156665A CN104156665A (zh) 2014-11-19
CN104156665B true CN104156665B (zh) 2017-02-01

Family

ID=51882162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410350025.4A Active CN104156665B (zh) 2014-07-22 2014-07-22 一种网页篡改监测的方法

Country Status (1)

Country Link
CN (1) CN104156665B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269116A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 一种广告安全监测方法和装置
CN106953874B (zh) * 2017-04-21 2019-11-29 深圳市科力锐科技有限公司 网站防篡改方法及装置
CN107301355B (zh) * 2017-06-20 2021-07-02 深信服科技股份有限公司 一种网页篡改监测方法及装置
CN109784960B (zh) * 2017-11-10 2024-05-14 北京奇虎科技有限公司 一种创意自动化审核方法、装置和设备
CN108427881A (zh) * 2018-03-16 2018-08-21 北京知道创宇信息技术有限公司 网页篡改监控方法、装置、监控设备及可读存储介质
CN108520185A (zh) * 2018-04-16 2018-09-11 深信服科技股份有限公司 检测网页篡改的方法、装置、设备及计算机可读存储介质
CN108920589B (zh) * 2018-06-26 2021-08-10 百度在线网络技术(北京)有限公司 浏览劫持识别方法、装置、服务器及存储介质
CN109558526B (zh) * 2018-11-09 2021-08-10 杭州安恒信息技术股份有限公司 一种基于关键字检测的网站篡改告警方法
CN109740094A (zh) * 2018-12-27 2019-05-10 上海掌门科技有限公司 页面监测方法、设备和计算机存储介质
CN110120898B (zh) * 2019-04-23 2021-03-23 杭州安恒信息技术股份有限公司 远程网页资源变更监测及有害性检测识别方法
CN110457900B (zh) * 2019-08-19 2021-05-28 杭州安恒信息技术股份有限公司 一种网站监测方法、装置、设备及可读存储介质
CN110765453B (zh) * 2019-09-27 2020-07-10 山东高速信联科技有限公司 一种针对etc在线充值业务的防篡改方法与系统
CN111783159A (zh) * 2020-07-07 2020-10-16 杭州安恒信息技术股份有限公司 网页篡改的验证方法、装置、计算机设备和存储介质
CN112100083B (zh) * 2020-11-13 2021-02-02 北京智慧星光信息技术有限公司 爬虫模板变更的监测方法、系统、电子设备及存储介质
CN113407885B (zh) * 2021-06-23 2024-04-12 中移(杭州)信息技术有限公司 XPath数据篡改告警方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510195A (zh) * 2008-02-15 2009-08-19 刘峰 基于爬虫技术的网站安全防护与测试诊断系统构造方法
CN101778137A (zh) * 2010-01-15 2010-07-14 蓝盾信息安全技术股份有限公司 一种防止网页被篡改的系统及方法
CN102938041A (zh) * 2012-10-30 2013-02-20 北京神州绿盟信息安全科技股份有限公司 一种页面篡改的综合检测方法及系统
CN103281177A (zh) * 2013-04-10 2013-09-04 广东电网公司信息中心 对Internet信息系统恶意攻击的检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012143594A1 (en) * 2011-04-21 2012-10-26 F-Secure Corporation Anti-virus scanning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510195A (zh) * 2008-02-15 2009-08-19 刘峰 基于爬虫技术的网站安全防护与测试诊断系统构造方法
CN101778137A (zh) * 2010-01-15 2010-07-14 蓝盾信息安全技术股份有限公司 一种防止网页被篡改的系统及方法
CN102938041A (zh) * 2012-10-30 2013-02-20 北京神州绿盟信息安全科技股份有限公司 一种页面篡改的综合检测方法及系统
CN103281177A (zh) * 2013-04-10 2013-09-04 广东电网公司信息中心 对Internet信息系统恶意攻击的检测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种新型网页防篡改策略的研究与部署;张鑫 等;《河南师范大学学报(自然科学版)》;20110930;第39卷(第5期);第157-160页 *

Also Published As

Publication number Publication date
CN104156665A (zh) 2014-11-19

Similar Documents

Publication Publication Date Title
CN104156665B (zh) 一种网页篡改监测的方法
AU2017200941B2 (en) Telemetry Analysis System for Physical Process Anomaly Detection
CN110233849B (zh) 网络安全态势分析的方法及系统
CN106055980B (zh) 一种基于规则的JavaScript安全性检测方法
CN106888205A (zh) 一种非侵入式基于功耗分析的plc异常检测方法
CN107360152A (zh) 一种基于语义分析的Web威胁感知系统
Kott et al. The promises and challenges of continuous monitoring and risk scoring
CN103780614B (zh) 一种基于模拟攻击扩展的sql注入漏洞挖掘方法
CN103227734A (zh) 一种OpenStack云平台异常的检测方法
CN102222194A (zh) Linux主机计算环境安全保护的模块及方法
CN107016298B (zh) 一种网页篡改监测方法及装置
CN108959071A (zh) 一种基于RASP的PHP变形webshell的检测方法及系统
CN109344661A (zh) 一种基于机器学习的微代理的网页防篡改方法
CN108234453A (zh) 一种基于规则的Java的web安全防御方法
EP3539043B1 (en) Digital auditing system and method for detecting unauthorized activities on websites
KR100918370B1 (ko) 웹관리시스템 및 그 방법
DE112011101943T5 (de) Verfahren und Einheit zum Entschärfen von seitenübergreifenden Sicherheitslücken
CN102984128A (zh) 一种基于网络的计算机信息保密检测方法
CN109981686A (zh) 一种基于循环对抗的网络安全态势感知方法及系统
CN108446555A (zh) 对硬件木马进行实时监控和检测的方法
Sudit et al. Situational awareness of a coordinated cyber attack
CN109388949B (zh) 一种数据安全集中管控方法和系统
Zhang et al. A robust cybersecurity solution platform architecture for digital instrumentation and control systems in nuclear power facilities
KR101847277B1 (ko) 효율적인 침해사고 대응을 위한 침해지표 자동 생성 방법 및 시스템
CN106507037A (zh) 人员入侵/越界的智能监控方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Zhejiang Zhongcai Building No. 68 Hangzhou 310051 Zhejiang province Binjiang District Tong Road 15

Patentee after: Hangzhou Annan information technology Limited by Share Ltd

Address before: Hangzhou City, Zhejiang province 310051 Binjiang District and Zhejiang road in the 15 storey building

Patentee before: Dbappsecurity Co.,ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Zhejiang Zhongcai Building No. 68 Binjiang District road Hangzhou City, Zhejiang Province, the 310051 and 15 layer

Patentee after: Hangzhou Annan information technology Limited by Share Ltd

Address before: Zhejiang Zhongcai Building No. 68 Hangzhou 310051 Zhejiang province Binjiang District Tong Road 15

Patentee before: Hangzhou Annan information technology Limited by Share Ltd