CN113254984A - 网页监控方法、装置、存储介质及设备 - Google Patents

网页监控方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN113254984A
CN113254984A CN202110797963.9A CN202110797963A CN113254984A CN 113254984 A CN113254984 A CN 113254984A CN 202110797963 A CN202110797963 A CN 202110797963A CN 113254984 A CN113254984 A CN 113254984A
Authority
CN
China
Prior art keywords
webpage
ciphertext
image
tampered
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110797963.9A
Other languages
English (en)
Inventor
左磊
葛春明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianju Dihe Suzhou Data Co ltd
Original Assignee
Tianju Dihe Suzhou Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianju Dihe Suzhou Data Co ltd filed Critical Tianju Dihe Suzhou Data Co ltd
Priority to CN202110797963.9A priority Critical patent/CN113254984A/zh
Publication of CN113254984A publication Critical patent/CN113254984A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种网页监控方法、装置、存储介质及设备,属于监控技术领域。所述方法包括:获取被监控的当前网页的第一代码;根据所述第一代码和加密算法计算第一密文集合;获取预存的基准网页的第二密文集合,所述基准网页是未被篡改的网页;若所述第一密文集合与所述第二密文集合不同,则确定所述当前网页是对所述基准网页进行篡改后得到的网页。本申请可以实现对网页的监控,避免由用户发现网页被篡改,可以提升用户的浏览体验。

Description

网页监控方法、装置、存储介质及设备
技术领域
本申请实施例涉及监控技术领域,特别涉及一种网页监控方法、装置、存储介质及设备。
背景技术
目前,有些网站的网页会被恶意篡改。比如,可以在流量较大的网页中恶意增加一些广告,从而达到谋取私利的目的。
相关技术中,用户在浏览网页的过程中会发现网页被篡改,从而向运维人员投诉,运维人员再对被篡改的网页进行处理。
若由用户发现网页被篡改,会影响用户的浏览体验。
发明内容
本申请实施例提供了一种网页监控方法、装置、存储介质及设备,用于解决由用户发现网页被篡改,影响用户的浏览体验的问题。所述技术方案如下:
一方面,提供了一种网页监控方法,所述方法包括:
获取被监控的当前网页的第一代码;
根据所述第一代码和加密算法计算第一密文集合;
获取预存的基准网页的第二密文集合,所述基准网页是未被篡改的网页;
若所述第一密文集合与所述第二密文集合不同,则确定所述当前网页是对所述基准网页进行篡改后得到的网页。
在一种可能的实现方式中,所述根据所述第一代码和加密算法计算第一密文集合,包括:
利用JS函数对所述第一代码进行解析,得到第一树形结构数据,所述第一树形结构数据中包括多个节点,每个节点对应于所述当前网页中的一个元素,每个节点的内容对应于所述元素的内容和/或位置,所述第一树形结构数据是树形的JSON数据;
利用所述加密算法对每个节点的内容进行加密,得到所述节点的第一密文;
将所有节点的第一密文组成所述第一密文集合。
在一种可能的实现方式中,所述方法还包括:从所述当前网页中筛选被监控的元素;
所述利用JS函数对所述第一代码进行解析,得到第一树形结构数据,包括:利用所述JS函数根据所述被监控的元素对所述第一代码进行解析,得到所述第一树形结构数据,所述第一树形结构数据中的每个节点对应于所述当前网页中的一个被监控的元素。
在一种可能的实现方式中,在所述获取预存的基准网页的第二密文集合之前,所述方法还包括:
获取所述基准网页的第二代码;
根据所述第二代码和所述加密算法计算所述第二密文集合。
在一种可能的实现方式中,所述根据所述第二代码和所述加密算法计算所述第二密文集合,包括:
利用JS函数对所述第二代码进行解析,得到第二树形结构数据,所述第二树形结构数据中包括多个节点,每个节点对应于所述基准网页中的一个元素,每个节点的内容对应于所述元素的内容,所述第二树形结构数据是树形的JSON数据;
利用所述加密算法对每个节点的内容进行加密,得到所述节点的第二密文;
将所有节点的第二密文组成所述第二密文集合。
在一种可能的实现方式中,所述方法还包括:从所述基准网页中筛选被监控的元素;
所述利用JS函数对所述第二代码进行解析,得到第二树形结构数据,包括:利用所述JS函数根据所述被监控的元素对所述第二代码进行解析,得到所述第二树形结构数据,所述第二树形结构数据中的每个节点对应于所述基准网页中的一个被监控的元素。
在一种可能的实现方式中,所述方法还包括:
对于每个节点,从所述第一密文集合中获取与所述节点对应的第一密文,并从所述第二密文集合中获取与所述节点对应的第二密文;
若所述第一密文与所述第二密文不同,则确定所述第一密文集合与所述第二密文集合不同。
在一种可能的实现方式中,所述方法还包括:
对所述基准网页进行截图,得到基准图像;
当所述第一密文集合中包括对所述当前网页中各个元素的内容和/或位置进行加密得到的第一密文,且所述第二密文集合中包括对所述基准网页中各个元素的内容和/或位置进行加密得到的第二密文时,从所述第一密文集合中获取与对应的第二密文不同的第一密文;
根据所述基准图像和所述第一密文生成篡改对比图像。
在一种可能的实现方式中,所述根据所述基准图像和所述第一密文生成篡改对比图像,包括:
对所述第一密文进行解析,得到篡改后的元素的内容和/或位置;
在所述基准图像上渲染所述篡改后的元素的内容和/或位置,得到所述当前网页的当前图像;
生成包含所述基准图像和所述当前图像的篡改对比图像。
在一种可能的实现方式中,所述生成包含所述基准图像和所述当前图像的篡改对比图像,包括:
将所述基准图像和所述当前图像并排排列,得到所述篡改对比图像。
在一种可能的实现方式中,所述方法还包括:
在所述当前图像上被篡改的元素的位置处增加具有预定显示效果的图层。
在一种可能的实现方式中,所述方法还包括:
统计所述当前网页上被篡改的元素的数量;
将所述数量渲染到所述当前图像上。
在一种可能的实现方式中,在所述根据所述基准图像和所述第一密文生成篡改对比图像之后,所述方法还包括:
将所述篡改对比图像存储到预定目录下;
当检测到所述预定目录下存在新增的篡改对比图像时,将所述篡改对比图像发送给预警系统,所述预警系统用于根据所述篡改对比图像发送预警邮件。
在一种可能的实现方式中,所述对所述基准网页进行截图,得到基准图像,包括:
获取预设的宽高信息和像素信息;
根据所述宽高信息和所述像素信息对所述基准网页进行截图,得到所述基准图像。
一方面,提供了一种网页监控装置,所述装置包括:
获取模块,用于获取被监控的当前网页的第一代码;
计算模块,用于根据所述第一代码和加密算法计算第一密文集合;
所述获取模块,还用于获取预存的基准网页的第二密文集合,所述基准网页是未被篡改的网页;
确定模块,用于若所述第一密文集合与所述第二密文集合不同,则确定所述当前网页是对所述基准网页进行篡改后得到的网页。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的网页监控方法。
一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的网页监控方法。
本申请实施例提供的技术方案的有益效果至少包括:
通过获取当前网页的第一密文集合和基准网页的第二密文集合,在确定第一密文集合与第二密文集合不同时,即可确定当前网页是对基准网页进行篡改后得到的网页,从而可以实现对网页的监控,避免由用户发现网页被篡改,可以提升用户的浏览体验。
通过根据基准图像和第一密文生成当前图像,再将基准图像和当前图像并排排列,得到篡改对比图像,从而可以以对比的形式来体现被篡改的元素,可以突出被篡改的元素。
通过在当前图像上被篡改的元素的位置处增加具有预定显示效果的图层,可以通过图层来增强被篡改的元素的显示效果。
通过将篡改对比图像发送给预警系统,这样,预警系统可以根据篡改对比图像发送预警邮件,从而通过预警邮件来提醒运维人员。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的网页监控方法的方法流程图;
图2是本申请一个实施例提供的网页监控方法的方法流程图;
图3是本申请一个实施例提供的网页监控装置的结构框图;
图4是本申请一个实施例提供的网页监控装置的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,其示出了本申请一个实施例提供的网页监控方法的方法流程图,该网页监控方法可以应用于计算机设备中。该网页监控方法,可以包括:
步骤101,获取被监控的当前网页的第一代码。
本实施例中,可以预先设置被监控的网页的URL(Uniform Resource Locator,统一资源定位符),计算机设备可以对该URL所对应的网页进行监控。通常,被监控的网页是迭代不频繁的网页。
本实施例中涉及两种网页,一种是在当前时刻获取到的网页,其被称为当前网页;另一种是在历史时刻获取到的网页,其被称为基准网页。其中,基准网页与当前网页对应于同一URL,且基准网页是默认的未被篡改的网页。即,若当前网页与基准网页相同,则确定当前网页仍然是基准网页,基准网页未被篡改;若当前网页与基准网页不同,则确认当前网页是对基准网页篡改后得到的。
相应的,为了便于区分,本实施例中将当前网页的代码称为第一代码,将基准网页的代码称为第二代码,下文中不再赘述。
在获取第一代码时,计算机设备可以通过JS脚本来获取当前网页中的HTML(HyperText Markup Language,超文本标记语言)代码,将该HTML代码称为第一代码。
步骤102,根据第一代码和加密算法计算第一密文集合。
计算机设备可以对第一代码进行处理,再利用加密算法对处理结果进行加密运算,得到第一密文集合。其中,加密算法可以有很多种,本实施例不作限定。
步骤103,获取预存的基准网页的第二密文集合,该基准网页是未被篡改的网页。
其中,第二密文集合与第一密文集合的计算方法相同。
步骤104,若第一密文集合与第二密文集合不同,则确定当前网页是对基准网页进行篡改后得到的网页。
若第一密文集合与第二密文集合不同,则确定当前网页与基准网页不同,即当前网页是对基准网页进行篡改后得到的;若第一密文集合与第二密文集合相同,则确定当前网页与基准网页相同,即,当前网页仍然是基准网页,基准网页未被篡改。
综上所述,本申请实施例提供的网页监控方法,通过获取当前网页的第一密文集合和基准网页的第二密文集合,在确定第一密文集合与第二密文集合不同时,即可确定当前网页是对基准网页进行篡改后得到的网页,从而可以实现对网页的监控,避免由用户发现网页被篡改,可以提升用户的浏览体验。
请参考图2,其示出了本申请一个实施例提供的网页监控方法的方法流程图,该网页监控方法可以应用于计算机设备中。该网页监控方法,可以包括:
步骤201,获取被监控的当前网页的第一代码。
本实施例中,可以预先设置被监控的网页的URL,计算机设备可以对该URL所对应的网页进行监控。通常,被监控的网页是迭代不频繁的网页。
本实施例中涉及两种网页,一种是在当前时刻获取到的网页,其被称为当前网页;另一种是在历史时刻获取到的网页,其被称为基准网页。其中,基准网页与当前网页对应于同一URL,且基准网页是默认的未被篡改的网页。即,若当前网页与基准网页相同,则确定当前网页仍然是基准网页,基准网页未被篡改;若当前网页与基准网页不同,则确认当前网页是对基准网页篡改后得到的。
相应的,为了便于区分,本实施例中将当前网页的代码称为第一代码,将基准网页的代码称为第二代码,下文中不再赘述。
在获取第一代码时,计算机设备可以通过JS脚本来获取当前网页中的HTML代码,将该HTML代码称为第一代码。
步骤202,根据第一代码和加密算法计算第一密文集合。
计算机设备可以对第一代码进行处理,再利用加密算法对处理结果进行加密运算,得到第一密文集合。
具体的,根据第一代码和加密算法计算第一密文集合,可以包括以下几个子步骤:
1)利用JS函数对第一代码进行解析,得到第一树形结构数据,该第一树形结构数据中包括多个节点,每个节点对应于当前网页中的一个元素,每个节点的内容对应于元素的内容和/或位置,第一树形结构数据是树形的JSON数据。
其中,计算机设备可以利用JS函数对第一代码进行解析,得到树形的JSON数据,本实施例中将该JSON数据称为第一树形结构数据。
当前网页中会包含多个元素,比如,文本、图像、动画、视频音乐、超链接、表格、表单和各类控件等。
每个元素对应于第一树形结构数据中的一个节点,且每个节点的内容对应于元素的内容和/或位置。比如,一个元素为文本,则对应的节点的内容中包含文本的文字内容和/或文本的位置。
本实施例中,可以将当前网页中的所有元素都作为被监控的元素;或者,可以将当前网页中的部分元素作为被监控的元素,即通过过滤器来筛选被监控的元素。若需要筛选被监控的元素,则计算机设备还可以从当前网页中筛选被监控的元素;对应的,计算机设备利用JS函数根据被监控的元素对第一代码进行解析,得到第一树形结构数据,该第一树形结构数据中的每个节点对应于当前网页中的一个被监控的元素。
2)利用加密算法对每个节点的内容进行加密,得到节点的第一密文。
当前网页中包括多个元素,对应的,第一树形结构数据中包括多个节点。对于每个节点,计算机设备可以利用加密算法对该节点的内容进行加密运算,得到该节点的第一密文。这样,对于每个节点都可以计算得到一个第一密文。
其中,加密算法可以有很多种。在一种可能的实现方式中,加密算法可以是MD5信息摘要算法(MD5 Message-Digest Algorithm)。
3)将所有节点的第一密文组成第一密文集合。
步骤203,获取预存的基准网页的第二密文集合,该基准网页是未被篡改的网页。
本实施例中,计算机设备可以预先获取基准网页的第二代码,再根据第二代码和加密算法计算第二密文集合。
在获取第二代码时,计算机设备可以通过JS脚本来获取基准网页中的HTML代码,将该HTML代码称为第二代码。
具体的,根据第二代码和加密算法计算第二密文集合,可以包括以下几个子步骤:
1)利用JS函数对第二代码进行解析,得到第二树形结构数据,该第二树形结构数据中包括多个节点,每个节点对应于基准网页中的一个元素,每个节点的内容对应于元素的内容,第二树形结构数据是树形的JSON数据。
其中,计算机设备可以利用JS函数对第二代码进行解析,得到树形的JSON数据,本实施例中将该JSON数据称为第二树形结构数据。
本实施例中,可以将基准网页中的所有元素都作为被监控的元素;或者,可以将基准网页中的部分元素作为被监控的元素,即通过过滤器来筛选被监控的元素。若需要筛选被监控的元素,则计算机设备还可以从基准网页中筛选被监控的元素;对应的,计算机设备利用JS函数根据被监控的元素对第二代码进行解析,得到第二树形结构数据,该第二树形结构数据中的每个节点对应于基准网页中的一个被监控的元素。其中,基准网页中被监控的元素与当前网页中被监控的元素相同。
2)利用加密算法对每个节点的内容进行加密,得到节点的第二密文。
3)将所有节点的第二密文组成第二密文集合。
其中,第二密文集合的计算方式与第一密文集合的计算方式相同,此处不作赘述。
步骤204,若第一密文集合与第二密文集合不同,则确定当前网页是对基准网页进行篡改后得到的网页。
在得到第一密文集合和第二密文集合后,计算机设备可以对第一密文集合和第二密文集合进行比较。
具体的,对于每个节点,计算机设备从第一密文集合中获取与该节点对应的第一密文,并从第二密文集合中获取与该节点对应的第二密文,若第一密文与第二密文不同,则确定第一密文集合与第二密文集合不同,结束比较流程;若第一密文与第二密文相同,则继续比较下一个节点的第一密文和第二密文,直至比较完所有节点的第一密文和第二密文后结束比较流程。若所有节点的第一密文和第二密文相同,则确定第一密文集合与第二密文集合相同。
若第一密文集合与第二密文集合不同,则确定当前网页是对基准网页进行篡改后得到的网页;若第一密文集合与第二密文集合相同,则确定当前网页与基准网页相同,即,当前网页仍然是基准网页,基准网页未被篡改。
在确定基准网页被篡改之后,计算机设备还可以生成基准网页与当前网页的对比图像,以体现被篡改的元素。
步骤205,对基准网页进行截图,得到基准图像。
具体的,计算机设备可以利用JS函数获取预设的宽高信息和像素信息,再根据宽高信息和像素信息对基准网页进行截图,得到基准图像。其中,宽高信息和像素信息可以由运维人员进行设置和修改,本实施例不作限定。
步骤206,从第一密文集合中获取与对应的第二密文不同的第一密文。
其中,第一密文集合中包括对当前网页中各个元素的内容和/或位置进行加密得到的第一密文,且第二密文集合中包括对基准网页中各个元素的内容和/或位置进行加密得到的第二密文。对于每个元素,计算机设备可以获取该元素的第一密文和第二密文,若该元素的第一密文和第二密文不同,则获取该元素的第一密文。
步骤207,根据基准图像和第一密文生成篡改对比图像。
具体的,根据基准图像和第一密文生成篡改对比图像,可以包括以下几个子步骤:
1)对第一密文进行解析,得到篡改后的元素的内容和/或位置。
对于每个第一密文,计算机设备可以利用与加密算法对应的解密算法对第一密文进行解密,得到篡改后的元素的内容和/或位置。
2)在基准图像上渲染篡改后的元素的内容和/或位置,得到当前网页的当前图像。
计算机设备可以利用渲染函数,在基准图像上渲染篡改后的元素的内容和/或位置,得到当前网页的当前图像。
比如,基准图像中元素a的文字内容为“选择的不仅是接口”,篡改后元素a的文字内容“xx产品特价”,则可以在基准图像中,利用“xx产品特价”替换 “选择的不仅是接口”。又比如,基准图像中元素b的位置为位置c,篡改后元素b的位置为位置d,则可以将基准图像中的元素b从位置c移动到位置d。
3)生成包含基准图像和当前图像的篡改对比图像。
其中,生成包含基准图像和当前图像的篡改对比图像,可以包括:将基准图像和当前图像并排排列,得到篡改对比图像。比如,可以将基准图像和当前图像排列在同一行,或者,可以将基准图像和当前图像排列在同一列,得到篡改对比图像,从而可以以对比的形式来体现被篡改的元素,可以突出被篡改的元素。
为了增强被篡改元素的显示效果,在一种可选的实现方式中,计算机设备还可以利用渲染函数,在当前图像上被篡改的元素的位置处增加具有预定显示效果的图层。比如,可以在被篡改的元素的位置处增加高亮显示的透明图层,这样,用户可以很容易地查看到被篡改的元素。
在一种可选的实现方式中,计算机设备还可以统计当前网页上被篡改的元素的数量,通过渲染函数将数量渲染到当前图像上。
步骤208,将篡改对比图像存储到预定目录下。
步骤209,当检测到预定目录下存在新增的篡改对比图像时,将篡改对比图像发送给预警系统,该预警系统用于根据篡改对比图像发送预警邮件。
计算机设备可以定时检测预定目录下是否存在新增的篡改对比图像,若存在新增的篡改对比图像,则将该篡改对比图像发送给预警系;若不存在新增的篡改对比图像,则继续检测。
预警系统在接收到篡改对比图像后,可以获取基准图像的URL,并生成包含该篡改对比图像和URL的预警邮件,将该预警邮件发送给对应的运维人员,由运维人员对当前网页进行处理。
需要说明的是,在预警后,计算机设备可以将当前网页作为下一次网页监控的基准网页。
综上所述,本申请实施例提供的网页监控方法,通过获取当前网页的第一密文集合和基准网页的第二密文集合,在确定第一密文集合与第二密文集合不同时,即可确定当前网页是对基准网页进行篡改后得到的网页,从而可以实现对网页的监控,避免由用户发现网页被篡改,可以提升用户的浏览体验。
通过根据基准图像和第一密文生成当前图像,再将基准图像和当前图像并排排列,得到篡改对比图像,从而可以以对比的形式来体现被篡改的元素,可以突出被篡改的元素。
通过在当前图像上被篡改的元素的位置处增加具有预定显示效果的图层,可以通过图层来增强被篡改的元素的显示效果。
通过将篡改对比图像发送给预警系统,这样,预警系统可以根据篡改对比图像发送预警邮件,从而通过预警邮件来提醒运维人员。
请参考图3,其示出了本申请一个实施例提供的网页监控装置的结构框图,该网页监控装置可以应用于计算机设备中。该网页监控装置,可以包括:
获取模块310,用于获取被监控的当前网页的第一代码;
计算模块320,用于根据第一代码和加密算法计算第一密文集合;
获取模块310,还用于获取预存的基准网页的第二密文集合,基准网页是未被篡改的网页;
确定模块330,用于若第一密文集合与第二密文集合不同,则确定当前网页是对基准网页进行篡改后得到的网页。
在一个可选的实施例中,计算模块320,还用于:
利用JS函数对第一代码进行解析,得到第一树形结构数据,第一树形结构数据中包括多个节点,每个节点对应于当前网页中的一个元素,每个节点的内容对应于元素的内容和/或位置,第一树形结构数据是树形的JSON数据;
利用加密算法对每个节点的内容进行加密,得到节点的第一密文;
将所有节点的第一密文组成第一密文集合。
在一个可选的实施例中,计算模块320,还用于:
从当前网页中筛选被监控的元素;
利用JS函数根据被监控的元素对第一代码进行解析,得到第一树形结构数据,第一树形结构数据中的每个节点对应于当前网页中的一个被监控的元素。
在一个可选的实施例中,获取模块310,还用于在获取预存的基准网页的第二密文集合之前,获取基准网页的第二代码;
计算模块320,还用于根据第二代码和加密算法计算第二密文集合。
在一个可选的实施例中,计算模块320,还用于:
利用JS函数对第二代码进行解析,得到第二树形结构数据,第二树形结构数据中包括多个节点,每个节点对应于基准网页中的一个元素,每个节点的内容对应于元素的内容,第二树形结构数据是树形的JSON数据;
利用加密算法对每个节点的内容进行加密,得到节点的第二密文;
将所有节点的第二密文组成第二密文集合。
在一个可选的实施例中,计算模块320,还用于:
从基准网页中筛选被监控的元素;
利用JS函数根据被监控的元素对第二代码进行解析,得到第二树形结构数据,第二树形结构数据中的每个节点对应于基准网页中的一个被监控的元素。
在一个可选的实施例中,获取模块310,还用于对于每个节点,从第一密文集合中获取与节点对应的第一密文,并从第二密文集合中获取与节点对应的第二密文;
计算模块320,还用于若第一密文与第二密文不同,则确定第一密文集合与第二密文集合不同。
请参考图4,在一个可选的实施例中,该装置还包括:
截图模块340,用于对基准网页进行截图,得到基准图像;
获取模块310,还用于当第一密文集合中包括对当前网页中各个元素的内容和/或位置进行加密得到的第一密文,且第二密文集合中包括对基准网页中各个元素的内容和/或位置进行加密得到的第二密文时,从第一密文集合中获取与对应的第二密文不同的第一密文;
生成模块350,用于根据基准图像和第一密文生成篡改对比图像。
在一个可选的实施例中,生成模块350,还用于:
对第一密文进行解析,得到篡改后的元素的内容和/或位置;
在基准图像上渲染篡改后的元素的内容和/或位置,得到当前网页的当前图像;
生成包含基准图像和当前图像的篡改对比图像。
在一个可选的实施例中,生成模块350,还用于:
将基准图像和当前图像并排排列,得到篡改对比图像。
在一个可选的实施例中,生成模块350,还用于:
在当前图像上被篡改的元素的位置处增加具有预定显示效果的图层。
在一个可选的实施例中,生成模块350,还用于:
统计当前网页上被篡改的元素的数量;
将数量渲染到当前图像上。
在一个可选的实施例中,该装置还包括:
存储模块360,用于在根据基准图像和第一密文生成篡改对比图像之后,将篡改对比图像存储到预定目录下;
发送模块370,用于当检测到预定目录下存在新增的篡改对比图像时,将篡改对比图像发送给预警系统,预警系统用于根据篡改对比图像发送预警邮件。
在一个可选的实施例中,截图模块340,还用于:
获取预设的宽高信息和像素信息;
根据宽高信息和像素信息对基准网页进行截图,得到基准图像。
综上所述,本申请实施例提供的网页监控装置,通过获取当前网页的第一密文集合和基准网页的第二密文集合,在确定第一密文集合与第二密文集合不同时,即可确定当前网页是对基准网页进行篡改后得到的网页,从而可以实现对网页的监控,避免由用户发现网页被篡改,可以提升用户的浏览体验。
通过根据基准图像和第一密文生成当前图像,再将基准图像和当前图像并排排列,得到篡改对比图像,从而可以以对比的形式来体现被篡改的元素,可以突出被篡改的元素。
通过在当前图像上被篡改的元素的位置处增加具有预定显示效果的图层,可以通过图层来增强被篡改的元素的显示效果。
通过将篡改对比图像发送给预警系统,这样,预警系统可以根据篡改对比图像发送预警邮件,从而通过预警邮件来提醒运维人员。
本申请一个实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的网页监控方法。
本申请一个实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的网页监控方法。
需要说明的是:上述实施例提供的网页监控装置在进行网页监控时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将网页监控装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的网页监控装置与网页监控方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请实施例的保护范围之内。

Claims (17)

1.一种网页监控方法,其特征在于,所述方法包括:
获取被监控的当前网页的第一代码;
根据所述第一代码和加密算法计算第一密文集合;
获取预存的基准网页的第二密文集合,所述基准网页是未被篡改的网页;
若所述第一密文集合与所述第二密文集合不同,则确定所述当前网页是对所述基准网页进行篡改后得到的网页。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一代码和加密算法计算第一密文集合,包括:
利用JS函数对所述第一代码进行解析,得到第一树形结构数据,所述第一树形结构数据中包括多个节点,每个节点对应于所述当前网页中的一个元素,每个节点的内容对应于所述元素的内容和/或位置,所述第一树形结构数据是树形的JSON数据;
利用所述加密算法对每个节点的内容进行加密,得到所述节点的第一密文;
将所有节点的第一密文组成所述第一密文集合。
3.根据权利要求2所述的方法,其特征在于,
所述方法还包括:从所述当前网页中筛选被监控的元素;
所述利用JS函数对所述第一代码进行解析,得到第一树形结构数据,包括:利用所述JS函数根据所述被监控的元素对所述第一代码进行解析,得到所述第一树形结构数据,所述第一树形结构数据中的每个节点对应于所述当前网页中的一个被监控的元素。
4.根据权利要求1所述的方法,其特征在于,在所述获取预存的基准网页的第二密文集合之前,所述方法还包括:
获取所述基准网页的第二代码;
根据所述第二代码和所述加密算法计算所述第二密文集合。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二代码和所述加密算法计算所述第二密文集合,包括:
利用JS函数对所述第二代码进行解析,得到第二树形结构数据,所述第二树形结构数据中包括多个节点,每个节点对应于所述基准网页中的一个元素,每个节点的内容对应于所述元素的内容,所述第二树形结构数据是树形的JSON数据;
利用所述加密算法对每个节点的内容进行加密,得到所述节点的第二密文;
将所有节点的第二密文组成所述第二密文集合。
6.根据权利要求5所述的方法,其特征在于,
所述方法还包括:从所述基准网页中筛选被监控的元素;
所述利用JS函数对所述第二代码进行解析,得到第二树形结构数据,包括:利用所述JS函数根据所述被监控的元素对所述第二代码进行解析,得到所述第二树形结构数据,所述第二树形结构数据中的每个节点对应于所述基准网页中的一个被监控的元素。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对于每个节点,从所述第一密文集合中获取与所述节点对应的第一密文,并从所述第二密文集合中获取与所述节点对应的第二密文;
若所述第一密文与所述第二密文不同,则确定所述第一密文集合与所述第二密文集合不同。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述基准网页进行截图,得到基准图像;
当所述第一密文集合中包括对所述当前网页中各个元素的内容和/或位置进行加密得到的第一密文,且所述第二密文集合中包括对所述基准网页中各个元素的内容和/或位置进行加密得到的第二密文时,从所述第一密文集合中获取与对应的第二密文不同的第一密文;
根据所述基准图像和所述第一密文生成篡改对比图像。
9.根据权利要求8所述的方法,其特征在于,所述根据所述基准图像和所述第一密文生成篡改对比图像,包括:
对所述第一密文进行解析,得到篡改后的元素的内容和/或位置;
在所述基准图像上渲染所述篡改后的元素的内容和/或位置,得到所述当前网页的当前图像;
生成包含所述基准图像和所述当前图像的篡改对比图像。
10.根据权利要求9所述的方法,其特征在于,所述生成包含所述基准图像和所述当前图像的篡改对比图像,包括:
将所述基准图像和所述当前图像并排排列,得到所述篡改对比图像。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
在所述当前图像上被篡改的元素的位置处增加具有预定显示效果的图层。
12.根据权利要求10所述的方法,其特征在于,所述方法还包括:
统计所述当前网页上被篡改的元素的数量;
将所述数量渲染到所述当前图像上。
13.根据权利要求9所述的方法,其特征在于,在所述根据所述基准图像和所述第一密文生成篡改对比图像之后,所述方法还包括:
将所述篡改对比图像存储到预定目录下;
当检测到所述预定目录下存在新增的篡改对比图像时,将所述篡改对比图像发送给预警系统,所述预警系统用于根据所述篡改对比图像发送预警邮件。
14.根据权利要求9所述的方法,其特征在于,所述对所述基准网页进行截图,得到基准图像,包括:
获取预设的宽高信息和像素信息;
根据所述宽高信息和所述像素信息对所述基准网页进行截图,得到所述基准图像。
15.一种网页监控装置,其特征在于,所述装置包括:
获取模块,用于获取被监控的当前网页的第一代码;
计算模块,用于根据所述第一代码和加密算法计算第一密文集合;
所述获取模块,还用于获取预存的基准网页的第二密文集合,所述基准网页是未被篡改的网页;
确定模块,用于若所述第一密文集合与所述第二密文集合不同,则确定所述当前网页是对所述基准网页进行篡改后得到的网页。
16.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至14任一所述的网页监控方法。
17.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至14任一所述的网页监控方法。
CN202110797963.9A 2021-07-15 2021-07-15 网页监控方法、装置、存储介质及设备 Pending CN113254984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110797963.9A CN113254984A (zh) 2021-07-15 2021-07-15 网页监控方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110797963.9A CN113254984A (zh) 2021-07-15 2021-07-15 网页监控方法、装置、存储介质及设备

Publications (1)

Publication Number Publication Date
CN113254984A true CN113254984A (zh) 2021-08-13

Family

ID=77191240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110797963.9A Pending CN113254984A (zh) 2021-07-15 2021-07-15 网页监控方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN113254984A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709148A (zh) * 2021-08-26 2021-11-26 天元大数据信用管理有限公司 一种网站监控方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124172A1 (en) * 2001-03-05 2002-09-05 Brian Manahan Method and apparatus for signing and validating web pages
CN102436564A (zh) * 2011-12-30 2012-05-02 奇智软件(北京)有限公司 一种识别被篡改网页的方法及装置
CN111159775A (zh) * 2019-12-11 2020-05-15 中移(杭州)信息技术有限公司 网页篡改检测方法、系统、装置及计算机可读存储介质
CN112445693A (zh) * 2019-08-28 2021-03-05 腾讯科技(深圳)有限公司 一种页面更新检测方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124172A1 (en) * 2001-03-05 2002-09-05 Brian Manahan Method and apparatus for signing and validating web pages
CN102436564A (zh) * 2011-12-30 2012-05-02 奇智软件(北京)有限公司 一种识别被篡改网页的方法及装置
CN112445693A (zh) * 2019-08-28 2021-03-05 腾讯科技(深圳)有限公司 一种页面更新检测方法、装置、设备及存储介质
CN111159775A (zh) * 2019-12-11 2020-05-15 中移(杭州)信息技术有限公司 网页篡改检测方法、系统、装置及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709148A (zh) * 2021-08-26 2021-11-26 天元大数据信用管理有限公司 一种网站监控方法、设备及介质

Similar Documents

Publication Publication Date Title
US11430102B1 (en) Automated detection of tampered images
US9553918B1 (en) Stateful and stateless cookie operations servers
US9898604B2 (en) Dynamic graph anomaly detection framework and scalable system architecture
US7584435B2 (en) Web usage overlays for third-party web plug-in content
US9219787B1 (en) Stateless cookie operations server
US8874639B2 (en) Determining advertising effectiveness outside of a social networking system
CN115997207B (zh) 使用引导信号来检测在图像中的感兴趣子图像区域
CN104484604B (zh) 一种网页篡改识别方法、扫描器、装置及系统
US8971642B2 (en) Testing the rendering of visual content
US20090085921A1 (en) Populate Web-Based Content Based on Space Availability
WO2011163655A2 (en) Systems and methods for dynamic content distribution
CN108089856A (zh) 一种页面元素的监听方法及装置
CN108366058A (zh) 防止广告运营商流量劫持的方法、装置、设备及存储介质
EP3408752B1 (en) Object management and visualization using a computing device
US11321524B1 (en) Systems and methods for testing content developed for access via a network
CN108804445A (zh) 热力图生成方法和装置
US20240119223A1 (en) Method, apparatus and electronic device for field merging
CN113448817A (zh) 一种页面录屏方法、装置以及存储介质
CN113254984A (zh) 网页监控方法、装置、存储介质及设备
CN114218052B (zh) 一种业务交互图生成方法、装置、设备及存储介质
US20130339835A1 (en) Dynamic presentation of a results set by a form-based software application
CN112953904B (zh) 异常检测方法、装置、服务器以及存储介质
US20140173086A1 (en) Method and apparatus for determining digital media visibility
CN113850065A (zh) 报告生成方法、装置、计算机设备和存储介质
CN110334301B (zh) 一种页面还原方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210813