CN101887463B - 一种基于虚拟域的http还原展示方法 - Google Patents

一种基于虚拟域的http还原展示方法 Download PDF

Info

Publication number
CN101887463B
CN101887463B CN2010102337100A CN201010233710A CN101887463B CN 101887463 B CN101887463 B CN 101887463B CN 2010102337100 A CN2010102337100 A CN 2010102337100A CN 201010233710 A CN201010233710 A CN 201010233710A CN 101887463 B CN101887463 B CN 101887463B
Authority
CN
China
Prior art keywords
virtual domain
request
reduction
browser
http
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010102337100A
Other languages
English (en)
Other versions
CN101887463A (zh
Inventor
张凤羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Topsec Technology Co Ltd
Original Assignee
Beijing Topsec Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Topsec Technology Co Ltd filed Critical Beijing Topsec Technology Co Ltd
Priority to CN2010102337100A priority Critical patent/CN101887463B/zh
Publication of CN101887463A publication Critical patent/CN101887463A/zh
Application granted granted Critical
Publication of CN101887463B publication Critical patent/CN101887463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种基于虚拟域的HTTP还原展示方法,包括:审计系统预先在HTTP服务器上建立还原用虚拟域服务器,当用户通过浏览器打开要还原的文件时,由审计系统将请求重定向到所述虚拟域;虚拟域服务器根据所述请求中包含的预定的唯一标识,在系统中查找还原文件,并将所述还原文件返回给浏览器显示;当浏览器再次向所述虚拟域服务器请求还原内容的其它片段时,所述虚拟域服务器通过所述唯一标记判断出此次请求对应的还原文件,并将所述此次请求对应的还原文件返回给浏览器。本发明能够解决在网页内容审计还原过程中,网页的完整展示问题。

Description

一种基于虚拟域的HTTP还原展示方法
技术领域
本发明涉及互联网安全技术领域,特别涉及一种基于虚拟域的HTTP还原展示方法。
背景技术
随着互联网的普及,人们在享受互联网的快捷方便的同时,也面临许多风险和挑战。诸如:大量不良无用信息充斥着网络,比如黄色、暴力与一些反动言论;利用互联网泄露企业单位的敏感与机密信息,或者在工作时间进行滥用互联网等。
公安部颁布的《互联网安全保护技术措施规定》明确规定网络使用单位要有一定的管理制度,要有记录并存储用户登录和退出时间、主叫号码、帐号、互联网地址或域名、系统维护日志的技术措施,要具有一定的安全保护技术措施。其中,包括:记录并储存用户注册信息;在公共信息服务中发现、停止传输违法信息,并保留相关记录;能够记录并储存用户使用的互联网络地址和内部网络地址对应关系。
HTTP访问与还原技术是针对以上需求提出的,可以有效记录网络中的网页访问行为,并记录与访问内容。网页还原是指当用户U在某一时间T对网站进行访问,访问的地址为www.url.com/index.html。一段时间过后,网站url的网页已发生变化,但由于审计需要,要查看用户U在T时刻访问的内容。此时可以通过网络审计系统的HTTP还原展示功能,把在T时刻记录的用户U访问的网页展示出来。
在网络上通过HTTP访问的网页通常为html文件。一个html网页除自身主体内容外还可能由图片等多个部分组成。如网页A.html中包含有图片<imgsrc=”p.jpg”/>,当浏览器取得A.html显示时,发现A.html页面代码中包含图片p.jpg,则会自动再次发起一个HTTP请求,下载并自动显示p.jpg。浏览器与网站间交互关系如图1。
如图2所示,为通过AJAX技术加载网页片段的过程示意图。AJAX技术是通过页面脚本javascript主动向服务器发送请求,刷新或更改部分页面内容,而不用通过IE更改整个页面。目前大部分网站应用都采用AJAX技术。
HTML原文还原显示不完整的原因是由于浏览器发现网页中有图片或其他网页片段时,会再次发起请求。审计系统不能处理这些请求,所以无法显示。重写方法是更改HTML还原结果内所有图片等等网页片段的URL地址,将其更改为审计系统能够理解的URL地址。当浏览器再次请求时,审计系统可以返回正确结果。
还原模块restore.jsp在找到要还原的文件A.html并不是把A.html内容直接返回给HTTP服务器,而是对A.html文件内容进行分析,并把网页中所有的网页片段链接都加上还原模块的URL前缀,以保证浏览器得到A.html后再次自动发起的请求能被还原模块收到。
如A.html
<html>
<head>
<title>A</title>
</head>
<body>
图片P<img src=”p.jpg/>
</body>
</html>
会被改写为:
<html>
<head>
<title>A</title>
</head>
<body>
图片P<img src=”http://auditor/restore.jsp?page=p.jpg/>
</body>
</html>
此时浏览器再打开还原文件时,如图3所示。
但是,基于html文件原文的展示方法存在下列缺点:
重写的还原方法,要对所有的网页内容都要进行更改,效率低,并且网页的链接格式有很多种,对改写程序的覆盖程度要求很高。另外一些经过编码的网页,如通过gzip等压缩算法编码过的HTML网页,由于不再是网页的源文,所以无法重写。另外,重写方法对还原的结果进行了编缉操作,更改了原始还原的内容,不符合审计要求。并且,对于一些AJAX类动态请求,无法重写。由于AJAX请求是由脚本生成的,重写的还原方法只能处理HTML标记语言编写的HTML文件,但对于脚本与脚本的结果无法做出判断,所以也不能重写AJAX请求的结果。这就造成AJAX的HTTP还原结果不完整。
发明内容
本发明的目的在于,提供一种基于虚拟域的HTTP还原展示方法,能够解决在网页内容审计还原过程中,网页的完整展示问题。
本发明的基于虚拟域的HTTP还原展示方法,包括下列步骤:
步骤A:审计系统预先在HTTP服务器上建立还原用虚拟域服务器,当用户通过浏览器打开要还原的文件时,由审计系统将请求重定向到所述虚拟域;
步骤B:所述虚拟域服务器根据所述请求中包含的预定的唯一标识,在系统中查找还原文件,并将所述还原文件返回给浏览器显示;
步骤C:当所述浏览器再次向所述虚拟域服务器请求还原内容的其它片段时,所述虚拟域服务器通过所述唯一标记判断出此次请求对应的还原文件,并将所述此次请求对应的还原文件返回给浏览器。
其中,在所述步骤B之前,进一步包括下列步骤:
所述虚拟域服务器判断所述请求是否包含预定的唯一标识,如果包含,则执行步骤B;否则,分析所述请求,为所述请求创建唯一标识,然后执行步骤B。
其中,所述虚拟域服务器分析所述请求,为所述请求创建唯一标识,包括下列步骤:
虚拟域服务器收到所述请求后,通过要还原的网页事件ID生成唯一标识,并把此标识写入响应头中。
其中,所述虚拟域服务器通过cookie将所述标识写入响应头中。
其中,所述唯一标识,用于标示出要查看的还原内容的唯一性。
本发明的有益效果是:依照本发明的基于虚拟域的HTTP还原展示方法,可大大提高HTTP内容审计类产品的还原准确率,防止出现还原的内容不完整,内容不正确等问题,同时,由于此还原方案与还原的内容无关性,即使是通过压缩编码的HTTP网页请求,和当下流行的动态AJAX请求都可以实现完整的还原。从而提高审计产品的审计准确度,为司法取证、控制网络滥用提供了的强有力的技术支持。
附图说明
图1为现有的浏览器与网站间交互关系示意图;
图2为现有的通过AJAX技术加载网页片段的过程示意图;
图3为现有的基于html文件原文的展示方法流程图;
图4为本发明实施例的基于虚拟域的HTTP还原展示方法流程图;
图5为本发明实施例的还原用户访问网站的虚拟域的HTTP还原展示方法流程图。
具体实施方式
以下,参考附图4~5详细描述本发明的基于虚拟域的HTTP还原展示方法。
本发明的基于虚拟域的HTTP还原展示方法,包括下列步骤:
步骤1:审计系统预先在HTTP服务器上建立还原用虚拟域服务器,当用户通过浏览器打开要还原的文件时,由审计系统将请求重定向到所述虚拟域;
步骤2:所述虚拟域服务器根据所述请求中包含的预定的唯一标识,在系统中查找还原文件,并将所述还原文件返回给浏览器显示;
步骤3:当所述浏览器再次向所述虚拟域服务器请求还原内容的其它片段时,所述虚拟域服务器通过所述唯一标记判断出此次请求对应的还原文件,并将所述此次请求对应的还原文件返回给浏览器。
如图4所示,本发明的实施例的基于虚拟域的HTTP还原展示方法,包括下列步骤:
步骤100:当用户在web界面上点击链接准备查看还原文件时,请求被发送到预先建立的虚拟域服务器中;其中,该虚拟域服务器用于实现还原功能。
步骤200:虚拟域服务器取得该请求后,判断该http请求头中是否附带请求的唯一标识,如果刚开始通过要还原的网页事件ID生成唯一的请求标识,并把此标识通过cookie写入响应头中,然后开始在系统中查找要还原的文件,并把文件原始内容返回给浏览器显示;其中,Cookies是一种能够让网站服务器把少量数据储存到客户端的硬盘或内存,或是从客户端的硬盘读取数据的一种现有技术。
步骤300:浏览器得到还原文件后开始显示还原内容,当发现还要再次请求网页片段时,浏览器会自动向虚拟域服务器发送请求,请求中包涵虚拟域服务器写入的唯一标识;
步骤400:当虚拟域服务器再次收到请求时发现http请求头中附带的唯一标识,此时只要跟据该唯一标识去寻找对应的还原文件,再发送给浏览器展示。
基于如上所述,虚拟域HTTP还原方法重点在于利用了流量器的自动携带cookie的特性,在cookie中写入唯一标识,通过该唯一标识从多次浏览器请求中识别出哪些为同一个还原操作的请求,并找到正确的文件进行展示。
如图5所示,为本发明实施例的还原用户U访问www.url.com/A.html的行为的流程图。可见,本发明中的方法明显区别于以往的HTTP还原展示方法,通过改变HTTP服务器的行为,保证把浏览器自动发起的请求通过唯一标识绑定在一起。在不改写已记录的还原文件前提下实现完整的还原展示。对于AJAX类型的网页,脚本发起的请求浏览器也会自动加上cookie中的唯一ID,HTTP服务器收到此类请求后也会找到对应的还原结果进行完整展示。
同时通过虚拟域技术,可以保证审计系统使用的常规HTTP服务器,与还原用HTTP服务器为同一进程,从而确保减少开发过程的工作量,减小系统资源占用。
综上所述,依照本发明的基于虚拟域的HTTP还原展示方法,采用以上技术方案,可大大提高HTTP内容审计类产品的还原准确率,防止出现还原的内容不完整,内容不正确等问题,同时,由于此还原方案与还原的内容无关性,即使是通过压缩编码的HTTP网页请求,和当下流行的动态AJAX请求都可以实现完整的还原。从而提高审计产品的审计准确度,为司法取证、控制网络滥用提供了的强有力的技术支持。
以上是为了使本领域普通技术人员理解本发明,而对本发明所进行的详细描述,但可以想到,在不脱离本发明的权利要求所涵盖的范围内还可以做出其它的变化和修改,这些变化和修改均在本发明的保护范围内。

Claims (2)

1.一种基于虚拟域的HTTP还原展示方法,其特征在于,包括下列步骤:
步骤A:审计系统预先在HTTP服务器上建立还原用虚拟域服务器,当用户通过浏览器打开还原文件时,由审计系统将打开还原文件的请求重定向到所述虚拟域;
步骤B:所述虚拟域服务器判断该请求是否包含预定的唯一标识,如果包含,则根据该请求中包含的预定的唯一标识,在系统中查找还原文件,并将还原文件返回给浏览器显示;否则,虚拟域服务器收到该请求后,分析该请求,通过要还原的网页事件ID生成唯一标识,并通过cookie将该标识写入响应头中,然后根据该标识,在系统中查找还原文件,并将还原文件返回给浏览器显示;
步骤C:当所述浏览器再次向所述虚拟域服务器请求还原内容的其它片段时,所述虚拟域服务器通过所述唯一标识判断出此次请求对应的还原文件,并将还原文件返回给浏览器。
2.如权利要求1所述的基于虚拟域的HTTP还原展示方法,其特征在于,所述唯一标识,用于标示出要查看的还原内容的唯一性。
CN2010102337100A 2010-07-22 2010-07-22 一种基于虚拟域的http还原展示方法 Active CN101887463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102337100A CN101887463B (zh) 2010-07-22 2010-07-22 一种基于虚拟域的http还原展示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102337100A CN101887463B (zh) 2010-07-22 2010-07-22 一种基于虚拟域的http还原展示方法

Publications (2)

Publication Number Publication Date
CN101887463A CN101887463A (zh) 2010-11-17
CN101887463B true CN101887463B (zh) 2012-05-09

Family

ID=43073385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102337100A Active CN101887463B (zh) 2010-07-22 2010-07-22 一种基于虚拟域的http还原展示方法

Country Status (1)

Country Link
CN (1) CN101887463B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105577620B (zh) * 2014-10-16 2019-12-03 中兴通讯股份有限公司 一种超文本传输协议数据还原方法及装置
CN105099909B (zh) * 2015-07-02 2018-10-26 成都亚信网络安全产业技术研究院有限公司 一种流量还原方法及装置
CN108153761A (zh) * 2016-12-05 2018-06-12 阿里巴巴集团控股有限公司 访问网络图片、以及响应网络图片访问的方法、装置
CN109428919B (zh) * 2017-08-28 2022-02-25 阿里巴巴集团控股有限公司 网页处理请求的处理方法和装置以及电子设备
CN108337322A (zh) * 2018-03-15 2018-07-27 深圳市中科新业信息科技发展有限公司 一种前置审计方法
CN113946735A (zh) * 2021-10-05 2022-01-18 广州非凡信息安全技术有限公司 一种通过流量录制实现的web网站爬取和还原的方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127500B1 (en) * 1999-11-10 2006-10-24 Oclc Online Computer Library Center, Inc. Retrieval of digital objects by redirection of controlled vocabulary searches
AU2005246320B2 (en) * 2004-05-14 2013-01-10 Mobilaps, Llc Method of providing a web page with inserted content
CN101356597B (zh) * 2005-09-26 2013-02-06 磁转换技术全球控股有限公司 磁体阵列
US8234152B2 (en) * 2007-06-12 2012-07-31 Insightexpress, Llc Online survey spawning, administration and management
CN100511239C (zh) * 2007-11-14 2009-07-08 深圳市迅雷网络技术有限公司 一种访问网络资源的方法、系统及装置
CN101626368A (zh) * 2008-07-11 2010-01-13 中联绿盟信息技术(北京)有限公司 一种防止网页被篡改的设备、方法和系统
CN101783817B (zh) * 2010-03-26 2013-01-02 西南科技大学 一种网页文本还原系统及方法

Also Published As

Publication number Publication date
CN101887463A (zh) 2010-11-17

Similar Documents

Publication Publication Date Title
Elliott Electronic Commerce: B2C strategies and models
CN102203765B (zh) 在没有明确地提供的装置或用户识别信息的情况下唯一地识别网络分布式装置
CN102594934B (zh) 一种识别被劫持网址的方法及装置
US8180376B1 (en) Mobile analytics tracking and reporting
CN101887463B (zh) 一种基于虚拟域的http还原展示方法
CN102833212B (zh) 网页访问者身份识别方法及系统
US20120102101A1 (en) Method and apparatus for monitoring and synchronizing user interface events with network data
US10007917B2 (en) Pay-per-click fraud protection
US9203905B1 (en) Sessionization of visitor activity
US8868570B1 (en) Selection and display of online content items
CN102436564A (zh) 一种识别被篡改网页的方法及装置
US9842133B2 (en) Auditing of web-based video
CN102546668B (zh) 一种独立访问者的统计方法、装置及系统
JP2000099461A (ja) ユ―ザ・セッションを形成し、該ユ―ザ・セッションに応じたインタ―ネット・デ―タを提供する方法及び装置
CN110929183B (zh) 一种数据处理方法、装置和机器可读介质
US10360133B2 (en) Analyzing analytic element network traffic
CN110245069B (zh) 页面版本的测试方法和装置、页面的展示方法和装置
CN102831114A (zh) 实现互联网用户访问情况统计分析的方法及装置
US20090198563A1 (en) Method for presenting promotional information on a web page
US20180198685A1 (en) Method and apparatus for processing delivery data, and storage medium
CN107704605B (zh) 一种基于本地存储的用户行为记录方法
WO2015074301A1 (zh) 一种通过网址记录网页内容和式样的方法
US20220053043A1 (en) Parallel Execution of Request Tracking and Resource Delivery
KR101265164B1 (ko) 브랜딩을 위한 단축 url 브라우징 제공시스템, 그 제공방법, 및 웹 클라이언트
US9384283B2 (en) System and method for deterring traversal of domains containing network resources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: BEIJING TOPSEC TECHNOLOGY CO., LTD.

Free format text: FORMER NAME: BEIJING HEAVEN MELTS LETTER SCIENCE TECHNOLOGIES CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee after: BEIJING TOPSEC TECHNOLOGY CO., LTD.

Address before: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee before: Beijing heaven melts letter Science Technologies Co., Ltd.

C56 Change in the name or address of the patentee

Owner name: BEIJING HEAVEN MELTS LETTER SCIENCE TECHNOLOGIES C

Free format text: FORMER NAME: BEIJING TOPSEC TECHNOLOGY CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee after: Beijing heaven melts letter Science Technologies Co., Ltd.

Address before: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee before: BEIJING TOPSEC TECHNOLOGY CO., LTD.

C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee after: BEIJING TOPSEC TECHNOLOGY CO., LTD.

Address before: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee before: Beijing heaven melts letter Science Technologies Co., Ltd.

C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee after: Beijing heaven melts letter Science Technologies Co., Ltd.

Address before: 100085 Beijing East Road, No. 1, building No. 301, building on the north side of the floor, room 3, room 3

Patentee before: BEIJING TOPSEC TECHNOLOGY CO., LTD.