CN110008392A - 一种基于网络爬虫技术的网页篡改检测方法 - Google Patents

一种基于网络爬虫技术的网页篡改检测方法 Download PDF

Info

Publication number
CN110008392A
CN110008392A CN201910172605.1A CN201910172605A CN110008392A CN 110008392 A CN110008392 A CN 110008392A CN 201910172605 A CN201910172605 A CN 201910172605A CN 110008392 A CN110008392 A CN 110008392A
Authority
CN
China
Prior art keywords
webpage
management module
watermark value
event
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910172605.1A
Other languages
English (en)
Inventor
杜小芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huaan Putt Network Technology Co Ltd
Original Assignee
Beijing Huaan Putt Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huaan Putt Network Technology Co Ltd filed Critical Beijing Huaan Putt Network Technology Co Ltd
Priority to CN201910172605.1A priority Critical patent/CN110008392A/zh
Publication of CN110008392A publication Critical patent/CN110008392A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于网络爬虫技术的网页篡改检测方法,涉及网络安全领域。本发明包括如下步骤:将需要监控的网页文件上传到系统内的备份文件管理模;通过水印算法生成唯一的备份文件水印值打印至网页文件;对网页站点信息进行配置,输入需要监控的网页所在的服务器的IP地址;配置程序目录信息;当触发监控事件,则计算事件水印值,并用事件水印值与数据库中的备份文件水印值进行比对;判定发生篡改事件,生成警告记录,进行网页恢复。本发明通过水印算法对需要监控的网页进行水印打码,对站点信息进行配置,利用水印值的计算与数据库中备份文件的水印值进行比对判断网页是否被篡改,防止网页被恶意篡改、提高用户用网安全性。

Description

一种基于网络爬虫技术的网页篡改检测方法
技术领域
本发明属于网络安全领域,特别是涉及一种基于网络爬虫技术的网页篡改检测方法。
背景技术
随着网站的迅速增长,随之而来的安全问题也日益突出,针对网站主要表现手段的网页攻击也越来越多,已经成为危害最严中的网络安全问题。
黑客攻击和计算机病毒主要破坏网站的完整性和可用性,我们可以看到以下的破坏结构:
(1)网站主页被篡改,影响网站单位的形象;
(2)黑客盗取系统管理员、网络用户的身份和口令进行非法篡改网站数据库和网页;
(3)正常网络用户访问的相应缓慢或拒绝服务;
(4)网站被植入恶意代码,伺机入侵其他计算机系统,特别注意的是,由于内网非法外联,造成黑客潜伏进内网,后果极其严重;
(5)黑客利用网站控制大批“肉机”,伺机实施跳板攻击。
因此,如何防范网页被恶意篡改成为很多用户关注的问题。在已知的一种方式中,可以在WEB(互联网)服务器上部署一个防篡改软件,该防篡改软件用于对WEB服务器上配置的文件进行防篡改检查。当有用户修改WEB服务器上配置的文件时,会触发防篡改软件自动检查网页是否被恶意篡改。
但是,如果攻击者关闭WEB服务器上的防篡改软件,则无法在对WEB服务器上配置的文件进行防篡改检查,导致仍然无法防范网页被恶意篡改。
发明内容
本发明的目的在于提供一种基于网络爬虫技术的网页篡改检测方法,通过水印算法对需要监控的网页进行水印打码,对站点信息进行配置,利用水印值的计算与数据库中备份文件的水印值进行比对判断网页是否被篡改,解决了现有的网页安全性能不足、容易被恶意篡改的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于网络爬虫技术的网页篡改检测方法,由网页防篡改系统实施,所述网页防篡改系统包括备份文件管理模块、监控管理模块、告警及恢复模块和用户管理模块,所述网页篡改检测方法包括如下步骤:
步骤S1:管理员通过有效的用户账号和密码登录网页防篡改系统;
步骤S2:将需要监控的网页文件上传到系统内的备份文件管理模;
步骤S3:通过水印算法生成唯一的备份文件水印值打印至网页文件;
步骤S4:对网页站点信息进行配置,输入需要监控的网页所在的服务器的IP地址;
步骤S5:配置程序目录信息,并与配置的站点信息保持一致;
步骤S6:实时对网页文件进行监控;
步骤S7:当触发监控事件,则计算事件水印值,并用事件水印值与数据库中的备份文件水印值进行比对;
步骤S8:若比对不相同,则判定发生篡改事件,生成警告记录,进行网页恢复。
优选地,所述步骤S3中,水印算法采用MD5算法,通过将输入的文件信息以512位为单位进行组,然后再将其分为16个小组,每个小组包含32为信息,进行位运算,最后输出四个32为分组,并生成长度固定的128位数值。
优选地,所述备份文件管理模块用于为所有需要保护的静态网页提供备份所需的凭证,上传到备份中心的文件都会生成一个唯一的水印值对文件进行标识,并对网页文件进行查询、增加、删除操作。
优选地,所述监控管理模块用于对参数进行配置,锁定需要监控的网页,实现对网页的实时监控;所述监控管理模块包括监控站点模块和监控目录模块;所述监控站点模块用于对需要监控的站点进行操作;所述监控目录模块用于对需要监控的目录进行操作。
优选地,所述告警及恢复模块用于对系统实时监控到网页中出现篡改事件发生后,快速进行告警处理,并立即恢复原网页。
优选地,所述用户管理模块用于对使用系统的人员进行统一管理;所述用户管理模块包括用户管理模块和权限管理模块;所述权限管理模块用于对每一个具体的用户进行权限分配和限制。
本发明具有以下有益效果:
本发明通过水印算法对需要监控的网页进行水印打码,对站点信息进行配置,利用水印值的计算与数据库中备份文件的水印值进行比对判断网页是否被篡改,防止网页被恶意篡改、提高用户用网安全性。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于网络爬虫技术的网页篡改检测方法步骤图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于网络爬虫技术的网页篡改检测方法,由网页防篡改系统实施,网页防篡改系统包括备份文件管理模块、监控管理模块、告警及恢复模块和用户管理模块,网页篡改检测方法包括如下步骤:
步骤S1:管理员通过有效的用户账号和密码登录网页防篡改系统;
步骤S2:将需要监控的网页文件上传到系统内的备份文件管理模;
步骤S3:通过水印算法生成唯一的备份文件水印值打印至网页文件;
步骤S4:对网页站点信息进行配置,输入需要监控的网页所在的服务器的IP地址;
步骤S5:配置程序目录信息,并与配置的站点信息保持一致;
步骤S6:实时对网页文件进行监控;
步骤S7:当触发监控事件,则计算事件水印值,并用事件水印值与数据库中的备份文件水印值进行比对;
步骤S8:若比对不相同,则判定发生篡改事件,生成警告记录,进行网页恢复。
其中,步骤S3中,水印算法采用MD5算法,通过将输入的文件信息以512位为单位进行组,然后再将其分为16个小组,每个小组包含32为信息,进行位运算,最后输出四个32为分组,并生成长度固定的128位数值;本发明通过采用MD5算法对文件水印值进行确认,MD5算法是目前计算机安全领域中使用最为广泛的一种Hash函数,使得文件是否改变的判断变得异常灵敏快捷,提高了网页篡改的灵敏度。
其中,备份文件管理模块用于为所有需要保护的静态网页提供备份所需的凭证,上传到备份中心的文件都会生成一个唯一的水印值对文件进行标识,并对网页文件进行查询、增加、删除操作。
其中,监控管理模块用于对参数进行配置,锁定需要监控的网页,实现对网页的实时监控;监控管理模块包括监控站点模块和监控目录模块;监控站点模块用于对需要监控的站点进行操作,监控站点通过每个站点不同的IP地址对不同的服务器作区分,通过对每个站点不同的IPD地址对不同的服务器作区分;监控目录模块用于对需要监控的目录进行操作,监控目录模块对不同站点下所存在的相同或不相同的目录进行选择,配置选定该站点下需要监控的程序范围目录,从而达到对监控网页的准确监控。
其中,告警及恢复模块用于对系统实时监控到网页中出现篡改事件发生后,快速进行告警处理,并立即恢复原网页。
其中,用户管理模块用于对使用系统的人员进行统一管理;用户管理模块包括用户管理模块和权限管理模块;权限管理模块用于对每一个具体的用户进行权限分配和限制。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (6)

1.一种基于网络爬虫技术的网页篡改检测方法,由网页防篡改系统实施,所述网页防篡改系统包括备份文件管理模块、监控管理模块、告警及恢复模块和用户管理模块,其特征在于,所述网页篡改检测方法包括如下步骤:
步骤S1:管理员通过有效的用户账号和密码登录网页防篡改系统;
步骤S2:将需要监控的网页文件上传到系统内的备份文件管理模;
步骤S3:通过水印算法生成唯一的备份文件水印值打印至网页文件;
步骤S4:对网页站点信息进行配置,输入需要监控的网页所在的服务器的IP地址;
步骤S5:配置程序目录信息,并与配置的站点信息保持一致;
步骤S6:实时对网页文件进行监控;
步骤S7:当触发监控事件,则计算事件水印值,并用事件水印值与数据库中的备份文件水印值进行比对;
步骤S8:若比对不相同,则判定发生篡改事件,生成警告记录,进行网页恢复。
2.根据权利要求1所述的一种基于网络爬虫技术的网页篡改检测方法,其特征在于,所述步骤S3中,水印算法采用MD5算法,通过将输入的文件信息以512位为单位进行组,然后再将其分为16个小组,每个小组包含32为信息,进行位运算,最后输出四个32为分组,并生成长度固定的128位数值。
3.根据权利要求1所述的一种基于网络爬虫技术的网页篡改检测方法,其特征在于,所述备份文件管理模块用于为所有需要保护的静态网页提供备份所需的凭证,上传到备份中心的文件都会生成一个唯一的水印值对文件进行标识,并对网页文件进行查询、增加、删除操作。
4.根据权利要求1所述的一种基于网络爬虫技术的网页篡改检测方法,其特征在于,所述监控管理模块用于对参数进行配置,锁定需要监控的网页,实现对网页的实时监控;所述监控管理模块包括监控站点模块和监控目录模块;所述监控站点模块用于对需要监控的站点进行操作;所述监控目录模块用于对需要监控的目录进行操作。
5.根据权利要求1所述的一种基于网络爬虫技术的网页篡改检测方法,其特征在于,所述告警及恢复模块用于对系统实时监控到网页中出现篡改事件发生后,快速进行告警处理,并立即恢复原网页。
6.根据权利要求1所述的一种基于网络爬虫技术的网页篡改检测方法,其特征在于,所述用户管理模块用于对使用系统的人员进行统一管理;所述用户管理模块包括用户管理模块和权限管理模块;所述权限管理模块用于对每一个具体的用户进行权限分配和限制。
CN201910172605.1A 2019-03-07 2019-03-07 一种基于网络爬虫技术的网页篡改检测方法 Pending CN110008392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910172605.1A CN110008392A (zh) 2019-03-07 2019-03-07 一种基于网络爬虫技术的网页篡改检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910172605.1A CN110008392A (zh) 2019-03-07 2019-03-07 一种基于网络爬虫技术的网页篡改检测方法

Publications (1)

Publication Number Publication Date
CN110008392A true CN110008392A (zh) 2019-07-12

Family

ID=67166835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910172605.1A Pending CN110008392A (zh) 2019-03-07 2019-03-07 一种基于网络爬虫技术的网页篡改检测方法

Country Status (1)

Country Link
CN (1) CN110008392A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967059A (zh) * 2020-08-11 2020-11-20 广东堡塔安全技术有限公司 一种网站防篡改方法、系统及计算机可读存储介质
CN113032842A (zh) * 2019-12-25 2021-06-25 南通理工学院 基于云平台的网页防篡改系统及方法
CN114553452A (zh) * 2020-11-25 2022-05-27 华为技术有限公司 攻击防御方法及防护设备
CN115081028A (zh) * 2022-06-07 2022-09-20 云尖(北京)软件有限公司 一种网页防篡改安全防护系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974455A (en) * 1995-12-13 1999-10-26 Digital Equipment Corporation System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table
US20050089190A1 (en) * 2003-10-23 2005-04-28 Eyal Shavit Recording content distribution information into an adjunct to content
CN103716315A (zh) * 2013-12-24 2014-04-09 上海天存信息技术有限公司 一种网页篡改的检测方法及装置
CN107835191A (zh) * 2017-11-29 2018-03-23 中科信息安全共性技术国家工程研究中心有限公司 一种检测网页恶意篡改的方法和装置
CN108388812A (zh) * 2018-03-01 2018-08-10 西安交大捷普网络科技有限公司 一种网页篡改检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974455A (en) * 1995-12-13 1999-10-26 Digital Equipment Corporation System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table
US20050089190A1 (en) * 2003-10-23 2005-04-28 Eyal Shavit Recording content distribution information into an adjunct to content
CN103716315A (zh) * 2013-12-24 2014-04-09 上海天存信息技术有限公司 一种网页篡改的检测方法及装置
CN107835191A (zh) * 2017-11-29 2018-03-23 中科信息安全共性技术国家工程研究中心有限公司 一种检测网页恶意篡改的方法和装置
CN108388812A (zh) * 2018-03-01 2018-08-10 西安交大捷普网络科技有限公司 一种网页篡改检测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032842A (zh) * 2019-12-25 2021-06-25 南通理工学院 基于云平台的网页防篡改系统及方法
CN113032842B (zh) * 2019-12-25 2024-01-26 南通理工学院 基于云平台的网页防篡改系统及方法
CN111967059A (zh) * 2020-08-11 2020-11-20 广东堡塔安全技术有限公司 一种网站防篡改方法、系统及计算机可读存储介质
CN114553452A (zh) * 2020-11-25 2022-05-27 华为技术有限公司 攻击防御方法及防护设备
CN114553452B (zh) * 2020-11-25 2023-06-02 华为技术有限公司 攻击防御方法及防护设备
CN115081028A (zh) * 2022-06-07 2022-09-20 云尖(北京)软件有限公司 一种网页防篡改安全防护系统

Similar Documents

Publication Publication Date Title
CN110008392A (zh) 一种基于网络爬虫技术的网页篡改检测方法
US7810091B2 (en) Mechanism to check the malicious alteration of malware scanner
US8024804B2 (en) Correlation engine for detecting network attacks and detection method
US9027121B2 (en) Method and system for creating a record for one or more computer security incidents
KR101514984B1 (ko) 홈페이지 악성코드 유포 탐지 시스템 및 방법
JP2019082989A5 (zh)
US10579797B2 (en) Program integrity monitoring and contingency management system and method
CN102110198B (zh) 一种网页防伪的方法
US20050114658A1 (en) Remote web site security system
KR100912794B1 (ko) 실시간 웹 서버 해킹 분석 및 홈페이지 위변조 감시를 위한 웹 위협관리 시스템 및 그 방법
JP2015511338A (ja) サービスプロバイダによって提供されたipデータの信頼性を保証するための方法およびシステム
KR100788256B1 (ko) 네트워크를 이용한 웹서버 위변조 모니터링 시스템 및모니터링 방법
WO2014103115A1 (ja) 不正侵入検知装置、不正侵入検知方法、不正侵入検知プログラム及び記録媒体
CN103150511A (zh) 一种安全防护系统
Axelsson et al. An approach to UNIX security logging
CN107733699B (zh) 互联网资产安全管理方法、系统、设备及可读存储介质
KR100961149B1 (ko) 악성 사이트 검사 방법, 악성 사이트 정보 수집 방법,장치, 시스템 및 컴퓨터 프로그램이 기록된 기록매체
Chaudhary et al. Cross-site scripting (XSS) worms in Online Social Network (OSN): Taxonomy and defensive mechanisms
KR101372906B1 (ko) 악성코드를 차단하기 위한 방법 및 시스템
Pascariu et al. Ransomware Honeypot: Honeypot solution designed to detect a ransomware infection identify the ransomware family
Barhoom et al. A new server-side solution for detecting cross site scripting attack
CN114157504A (zh) 一种基于Servlet拦截器的安全防护方法
KR101650445B1 (ko) 커널 기반의 파일이벤트감사 기능을 이용한 실시간 웹셀 탐지 장치 및 방법
Oujezsky et al. Data Backup System with Integrated Active Protection Against Ransomware
US11457020B2 (en) Method for integrity protection in a computer network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712

RJ01 Rejection of invention patent application after publication