CN103078876B - Http报文隐私保护方法和装置 - Google Patents

Http报文隐私保护方法和装置 Download PDF

Info

Publication number
CN103078876B
CN103078876B CN201310039213.0A CN201310039213A CN103078876B CN 103078876 B CN103078876 B CN 103078876B CN 201310039213 A CN201310039213 A CN 201310039213A CN 103078876 B CN103078876 B CN 103078876B
Authority
CN
China
Prior art keywords
field
http
url
cookie
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310039213.0A
Other languages
English (en)
Other versions
CN103078876A (zh
Inventor
崔晶晶
刘国清
丁立星
李春华
郑重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaoxiang Innovation Artificial Intelligence Technology Co ltd
Original Assignee
BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd filed Critical BEIJING GEO POLYMERIZATION TECHNOLOGY Co Ltd
Priority to CN201310039213.0A priority Critical patent/CN103078876B/zh
Publication of CN103078876A publication Critical patent/CN103078876A/zh
Application granted granted Critical
Publication of CN103078876B publication Critical patent/CN103078876B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种HTTP报文隐私保护方法和装置,该方法包括:S1,接收待处理的HTTP原始报文;S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文。本发明能够有效解决用户上网时隐私信息外泄的问题,保证了用户上网的安全性,提高了互联网传输的安全性。

Description

HTTP报文隐私保护方法和装置
技术领域
本发明属于网络通讯技术领域,具体涉及一种HTTP报文隐私保护方法和装置。
背景技术
随着全球信息化步伐的加快,网络传输安全性问题变得越来越重要。现有的HTTP报文在传输过程中携带大量用户隐私信息,例如:用户名信息、密码信息、邮箱地址信息等。因此,用户隐私信息在传输过程中非常容易泄漏出去,从而为用户带来重大损失。
发明内容
针对现有技术存在的缺陷,本发明提供一种HTTP报文隐私保护方法和装置,能够有效解决用户上网时隐私信息外泄的问题。
本发明采用的技术方案如下:
本发明提供一种HTTP报文隐私保护方法,包括以下步骤:
S1,接收待处理的HTTP原始报文;
S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文。
优选的,S2中,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP原始报文的URL字段和COOKIE字段具体包括以下步骤:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL关键字段;
S2-2A,采用偏移定位技术定位所述URL关键字段在所述HTTP原始报文中的偏移位置;
和/或
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE关键字段;
S2-2B,采用偏移定位技术定位所述COOKIE关键字段在所述HTTP原始报文中的偏移位置。
优选的,S3中,对S2得到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段具体为:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
S3-2,基于多模匹配技术,对S2得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
优选的,对S2得到的所述URL字段进行的过滤操作与对S2得到的所述COOKIE字段进行的过滤操作相同。
本发明还提供一种HTTP报文隐私保护装置,包括:接收模块、HTTP报文解析定位引擎、URL过滤引擎和COOKIE过滤引擎;
所述接收模块,用于接收待处理的HTTP原始报文;
所述HTTP报文解析定位引擎,用于对所述接收模块接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
所述URL过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息;
所述COOKIE过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述COOKIE字段进行过滤操作,过滤掉所述COOKIE字段中包含的隐私信息。
本发明的有益效果如下:
本发明提供的HTTP报文隐私保护方法和装置,采用策略关键字与隐私清除策略相结合的匹配方法对HTTP报文进行过滤,实现了一次遍历匹配多串的效果,从而提高了隐私信息匹配效率,缩短了隐私信息查找时间。因此,本发明能够高效、准确的屏蔽用户的各种隐私信息,解决了用户上网时大量个人隐私信息外泄的问题,保证了用户上网的安全性,提高了互联网传输的安全性。
附图说明
图1为本发明提供的HTTP报文隐私保护方法的流程示意图。
具体实施方式
以下结合附图对本发明进行详细说明:
如图1所示,本发明提供一种HTTP报文隐私保护方法,包括以下步骤:
S1,接收待处理的HTTP原始报文;
S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
本步骤中,定位到HTTP原始报文的URL字段具体方式为:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL关键字段;
例如:HTTP上行的POST和GET报文中,各个不同的字段具有不同的标识,对于URL字段,基本以GET空格字段或POST空格字段作为文件头,因此,在定位URL字段时,可以首先以GET空格字段或POST空格字段为关键字进行查找。本例中,GET空格字段或POST空格字段即为URL关键字段。
COOKIE字段以COOKIE开头,在HTTP报文中对这些字段进行查找。
S2-2A,采用偏移定位技术定位所述URL关键字段在所述HTTP原始报文中的偏移位置。
定位到所述HTTP原始报文的COOKIE字段具体方式为:
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE关键字段;
实际应用中,对于COOKIE字段,基本以COOKIE字段作为文件头,因此,在定位COOKIE字段时,可以首先以COOKIE为关键字进行查找。本例中,COOKIE字段即为COOKIE关键字段。
S2-2B,采用偏移定位技术定位所述COOKIE关键字段在所述HTTP原始报文中的偏移位置。
由于采用偏移定位技术,有效减少了因内存拷贝引起的性能低下问题,大幅提高了处理器性能,实现了快速定位URL和COOKIE的位置,最终提高了URL和COOKIE过滤的精确性、有效性和实时性。
S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文。
本步骤中,对URL字段进行的过滤操作与对COOKIE字段进行的过滤操作相同,仅以对URL字段进行的过滤操作为例进行介绍,具体包括以下步骤:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
策略关键字主要用于定位URL字段中的隐私信息。不同的网站具有不同的策略关键字,例如,A网站中有MM参数,此参数后为帐户明文信息,则该帐户明文信息即为隐私信息,该MM即是一个策略关键字。
不同的策略关键字关联不同的隐私清除策略,例如:策略关键字为邮箱地址时,其对应的隐私清除策略为邮箱地址清除策略。并且,每个隐私清除策略包含若干隐私模式,例如:需要清除的位置或长度等。例如,对于邮箱地址清除策略,可以设置以下隐私模式:需要清除内容直到字符。
S3-2,基于多模匹配技术,对S2得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
另外,由于同一URL字段可以同时匹配多个策略关键字,通过多模匹配技术,可以识别出URL字段中包含的多个策略关键字。
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
例如:预先定义MM策略关键字与邮箱屏蔽策略的对应关系;
在定位到HTTP原始报文中的URL字段后,匹配URL字段与策略关键字,当在URL字段中匹配到MM策略关键字时,则匹配成功;通过查找预先定义的MM策略关键字与邮箱屏蔽策略的对应关系,获知MM策略关键字的隐私屏蔽策略为邮箱屏蔽策略,然后采用邮箱屏蔽策略对URL字段进行隐私保护。
HTTP原始报文的URL字段中包含usemame=shuai字段,COOKIE中包含email=123xx.xx字段,通过本发明提供的HTTP报文隐私保护方法,将隐私字段转变为屏蔽符,最终得到以下字段:
username=*****;COOKIE的email=*********。
本发明还提供一种HTTP报文隐私保护装置,包括:接收模块、HTTP报文解析定位引擎、URL过滤引擎和COOKIE过滤引擎;
所述接收模块,用于接收待处理的HTTP原始报文;
所述HTTP报文解析定位引擎,用于对所述接收模块接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
所述URL过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息;
所述COOKIE过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述COOKIE字段进行过滤操作,过滤掉所述COOKIE字段中包含的隐私信息。
综上所述,本发明提供的HTTP报文隐私保护方法和装置,采用策略关键字与隐私清除策略相结合的匹配方法对HTTP报文进行过滤,实现了一次遍历匹配多串的效果,从而提高了隐私信息匹配效率,缩短了隐私信息查找时间。因此,本发明能够高效、准确的屏蔽用户的各种隐私信息,解决了用户上网时大量个人隐私信息外泄的问题,保证了用户上网的安全性,提高了互联网传输的安全性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (3)

1.一种HTTP报文隐私保护方法,其特征在于,包括以下步骤:
S1,接收待处理的HTTP原始报文;
S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文;
其中,S2中,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP原始报文的URL字段和COOKIE字段具体包括以下步骤:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL字段;
S2-2A,采用偏移定位技术定位所述URL字段在所述HTTP原始报文中的偏移位置;
和/或
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE字段;
S2-2B,采用偏移定位技术定位所述COOKIE字段在所述HTTP原始报文中的偏移位置;
其中,S3中,对S2得到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段具体为:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
S3-2,基于多模匹配技术,对S2得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
2.根据权利要求1所述的HTTP报文隐私保护方法,其特征在于,对S2得到的所述URL字段进行的过滤操作与对S2得到的所述COOKIE字段进行的过滤操作相同。
3.一种HTTP报文隐私保护装置,其特征在于,包括:接收模块、HTTP报文解析定位引擎、URL过滤引擎和COOKIE过滤引擎;
所述接收模块,用于接收待处理的HTTP原始报文;
所述HTTP报文解析定位引擎,用于对所述接收模块接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
所述URL过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息;
所述COOKIE过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述COOKIE字段进行过滤操作,过滤掉所述COOKIE字段中包含的隐私信息;
其中,所述HTTP报文解析定位引擎具体采用以下步骤进行定位:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL字段;
S2-2A,采用偏移定位技术定位所述URL字段在所述HTTP原始报文中的偏移位置;
和/或
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE字段;
S2-2B,采用偏移定位技术定位所述COOKIE字段在所述HTTP原始报文中的偏移位置;
所述URL过滤引擎具体用于:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
S3-2,基于多模匹配技术,对S2-2A得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
CN201310039213.0A 2013-01-31 2013-01-31 Http报文隐私保护方法和装置 Expired - Fee Related CN103078876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310039213.0A CN103078876B (zh) 2013-01-31 2013-01-31 Http报文隐私保护方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310039213.0A CN103078876B (zh) 2013-01-31 2013-01-31 Http报文隐私保护方法和装置

Publications (2)

Publication Number Publication Date
CN103078876A CN103078876A (zh) 2013-05-01
CN103078876B true CN103078876B (zh) 2015-07-15

Family

ID=48155280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310039213.0A Expired - Fee Related CN103078876B (zh) 2013-01-31 2013-01-31 Http报文隐私保护方法和装置

Country Status (1)

Country Link
CN (1) CN103078876B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442004A (zh) * 2013-08-27 2013-12-11 成都农业科技职业学院 一种采用cookie兼容多种身份认证方式的统一身份认证方法
CN104836793B (zh) * 2015-03-31 2018-07-27 北京奇虎科技有限公司 请求控制方法、服务器、客户端及系统
CN105100084B (zh) * 2015-07-07 2018-03-30 中国科学院计算技术研究所 一种防止跨站请求伪造攻击的方法及系统
CN107566450B (zh) * 2017-08-02 2020-08-28 北京奇艺世纪科技有限公司 一种实时用户行为的数据处理方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101909079A (zh) * 2010-07-15 2010-12-08 北京迈朗世讯科技有限公司 一种骨干网链路中用户上网行为数据采集方法和系统
CN102088465A (zh) * 2011-03-16 2011-06-08 中国科学院软件研究所 一种基于前置网关的HTTPCookie保护方法
CN102158493A (zh) * 2011-04-15 2011-08-17 奇智软件(北京)有限公司 一种Cookie解析方法、装置及一种客户端
CN102349068A (zh) * 2009-03-19 2012-02-08 微软公司 以客户端为中心的使用分类
CN102469067A (zh) * 2010-11-05 2012-05-23 中科正阳信息安全技术有限公司 一种基于前置网关的http隐藏按钮保护方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102349068A (zh) * 2009-03-19 2012-02-08 微软公司 以客户端为中心的使用分类
CN101909079A (zh) * 2010-07-15 2010-12-08 北京迈朗世讯科技有限公司 一种骨干网链路中用户上网行为数据采集方法和系统
CN102469067A (zh) * 2010-11-05 2012-05-23 中科正阳信息安全技术有限公司 一种基于前置网关的http隐藏按钮保护方法
CN102088465A (zh) * 2011-03-16 2011-06-08 中国科学院软件研究所 一种基于前置网关的HTTPCookie保护方法
CN102158493A (zh) * 2011-04-15 2011-08-17 奇智软件(北京)有限公司 一种Cookie解析方法、装置及一种客户端

Also Published As

Publication number Publication date
CN103078876A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN104202360B (zh) 访问网页的方法、装置及路由器
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
US9405910B2 (en) Automatic library detection
CN103078876B (zh) Http报文隐私保护方法和装置
CN103077254B (zh) 网页获取方法和装置
CN105812417B (zh) 远端服务器、路由器及不良网页信息过滤方法
RU2015105706A (ru) Предложения поисковых запросов, частично основанные на предшествующем поиске, и поиск, основанный на таких предложениях
WO2015021873A1 (en) Method, platform server, and system of data pushing
CN103581224A (zh) 推送信息的方法和装置
CN103812906B (zh) 一种网址推荐方法、装置和通信系统
US10491606B2 (en) Method and apparatus for providing website authentication data for search engine
CN103778156A (zh) 数据搜索的方法和装置以及用于数据搜索的服务器
CN106407362A (zh) 一种关键词信息检索的方法及装置
US20100057686A1 (en) Deep Web Search
CN104735174A (zh) 一种http透明代理的实现方法及装置
RU2014107354A (ru) Способ, система и компьютерная программа для управления информацией из социальных сетей
CN106940719B (zh) 一种页面跳转方法及装置
Alyami The development of sustainable assessment method for Saudi Arabia built environment
CN105786869A (zh) 基于搜索获取问答专题数据的方法和装置
CN102591866A (zh) 浏览器启动方法、设备及系统
CN102789460A (zh) 获取短url对应页面标题的方法及装置
US20190130036A1 (en) Identifying user intention from encrypted browsing activity
KR101746594B1 (ko) 웹 크롤러 기반 사용자 검색이력 추종 학습형 사용자 맞춤 검색정보 푸쉬 제공시스템
CN104618242A (zh) 一种报文转发方法和装置
CN104182485B (zh) 重启用站点的收录方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220419

Address after: 100000 room 116, building 3, Shuangqiao (Shuangqiao dairy factory), Chaoyang District, Beijing

Patentee after: Beijing Xiaoxiang innovation Artificial Intelligence Technology Co.,Ltd.

Address before: 901, floor 9, building 5, yard 1, Shangdi East Road, Haidian District, Beijing 100086

Patentee before: BEIJING GEO POLYMERIZATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150715

Termination date: 20220131

CF01 Termination of patent right due to non-payment of annual fee