发明内容
针对现有技术存在的缺陷,本发明提供一种HTTP报文隐私保护方法和装置,能够有效解决用户上网时隐私信息外泄的问题。
本发明采用的技术方案如下:
本发明提供一种HTTP报文隐私保护方法,包括以下步骤:
S1,接收待处理的HTTP原始报文;
S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文。
优选的,S2中,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP原始报文的URL字段和COOKIE字段具体包括以下步骤:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL关键字段;
S2-2A,采用偏移定位技术定位所述URL关键字段在所述HTTP原始报文中的偏移位置;
和/或
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE关键字段;
S2-2B,采用偏移定位技术定位所述COOKIE关键字段在所述HTTP原始报文中的偏移位置。
优选的,S3中,对S2得到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段具体为:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
S3-2,基于多模匹配技术,对S2得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
优选的,对S2得到的所述URL字段进行的过滤操作与对S2得到的所述COOKIE字段进行的过滤操作相同。
本发明还提供一种HTTP报文隐私保护装置,包括:接收模块、HTTP报文解析定位引擎、URL过滤引擎和COOKIE过滤引擎;
所述接收模块,用于接收待处理的HTTP原始报文;
所述HTTP报文解析定位引擎,用于对所述接收模块接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
所述URL过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息;
所述COOKIE过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述COOKIE字段进行过滤操作,过滤掉所述COOKIE字段中包含的隐私信息。
本发明的有益效果如下:
本发明提供的HTTP报文隐私保护方法和装置,采用策略关键字与隐私清除策略相结合的匹配方法对HTTP报文进行过滤,实现了一次遍历匹配多串的效果,从而提高了隐私信息匹配效率,缩短了隐私信息查找时间。因此,本发明能够高效、准确的屏蔽用户的各种隐私信息,解决了用户上网时大量个人隐私信息外泄的问题,保证了用户上网的安全性,提高了互联网传输的安全性。
具体实施方式
以下结合附图对本发明进行详细说明:
如图1所示,本发明提供一种HTTP报文隐私保护方法,包括以下步骤:
S1,接收待处理的HTTP原始报文;
S2,对接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
本步骤中,定位到HTTP原始报文的URL字段具体方式为:
S2-1A,采用URL关键字段查找方法查找所述HTTP原始报文,查找到所述URL关键字段;
例如:HTTP上行的POST和GET报文中,各个不同的字段具有不同的标识,对于URL字段,基本以GET空格字段或POST空格字段作为文件头,因此,在定位URL字段时,可以首先以GET空格字段或POST空格字段为关键字进行查找。本例中,GET空格字段或POST空格字段即为URL关键字段。
COOKIE字段以COOKIE开头,在HTTP报文中对这些字段进行查找。
S2-2A,采用偏移定位技术定位所述URL关键字段在所述HTTP原始报文中的偏移位置。
定位到所述HTTP原始报文的COOKIE字段具体方式为:
S2-1B,采用COOKIE关键字段查找方法查找所述HTTP原始报文,查找到所述COOKIE关键字段;
实际应用中,对于COOKIE字段,基本以COOKIE字段作为文件头,因此,在定位COOKIE字段时,可以首先以COOKIE为关键字进行查找。本例中,COOKIE字段即为COOKIE关键字段。
S2-2B,采用偏移定位技术定位所述COOKIE关键字段在所述HTTP原始报文中的偏移位置。
由于采用偏移定位技术,有效减少了因内存拷贝引起的性能低下问题,大幅提高了处理器性能,实现了快速定位URL和COOKIE的位置,最终提高了URL和COOKIE过滤的精确性、有效性和实时性。
S3,对S2得到的所述URL字段和COOKIE字段分别进行过滤操作,过滤掉所述URL字段和COOKIE字段中包含的隐私信息,得到隐私保护后的URL字段和COOKIE字段,进而得到隐私保护后的HTTP报文。
本步骤中,对URL字段进行的过滤操作与对COOKIE字段进行的过滤操作相同,仅以对URL字段进行的过滤操作为例进行介绍,具体包括以下步骤:
S3-1,预定义策略关键字与隐私清除策略的对应关系;
策略关键字主要用于定位URL字段中的隐私信息。不同的网站具有不同的策略关键字,例如,A网站中有MM参数,此参数后为帐户明文信息,则该帐户明文信息即为隐私信息,该MM即是一个策略关键字。
不同的策略关键字关联不同的隐私清除策略,例如:策略关键字为邮箱地址时,其对应的隐私清除策略为邮箱地址清除策略。并且,每个隐私清除策略包含若干隐私模式,例如:需要清除的位置或长度等。例如,对于邮箱地址清除策略,可以设置以下隐私模式:需要清除内容直到字符。
S3-2,基于多模匹配技术,对S2得到的所述URL字段进行策略关键字匹配,识别出所述URL字段中包含的指定策略关键字;
另外,由于同一URL字段可以同时匹配多个策略关键字,通过多模匹配技术,可以识别出URL字段中包含的多个策略关键字。
S3-3,根据所述指定策略关键字查找S3-1的对应关系,获得与所述指定策略关键字对应的指定隐私清除策略;
S3-4,采用所述指定隐私清除策略过滤掉所述URL字段中包含的隐私信息,得到隐私保护后的URL字段。
例如:预先定义MM策略关键字与邮箱屏蔽策略的对应关系;
在定位到HTTP原始报文中的URL字段后,匹配URL字段与策略关键字,当在URL字段中匹配到MM策略关键字时,则匹配成功;通过查找预先定义的MM策略关键字与邮箱屏蔽策略的对应关系,获知MM策略关键字的隐私屏蔽策略为邮箱屏蔽策略,然后采用邮箱屏蔽策略对URL字段进行隐私保护。
HTTP原始报文的URL字段中包含usemame=shuai字段,COOKIE中包含email=123xx.xx字段,通过本发明提供的HTTP报文隐私保护方法,将隐私字段转变为屏蔽符,最终得到以下字段:
username=*****;COOKIE的email=*********。
本发明还提供一种HTTP报文隐私保护装置,包括:接收模块、HTTP报文解析定位引擎、URL过滤引擎和COOKIE过滤引擎;
所述接收模块,用于接收待处理的HTTP原始报文;
所述HTTP报文解析定位引擎,用于对所述接收模块接收到的所述HTTP原始报文进行解析,定位到所述HTTP报文的URL字段和COOKIE字段;
所述URL过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述URL字段进行过滤操作,过滤掉所述URL字段中包含的隐私信息;
所述COOKIE过滤引擎,用于对所述HTTP报文解析定位引擎定位到的所述COOKIE字段进行过滤操作,过滤掉所述COOKIE字段中包含的隐私信息。
综上所述,本发明提供的HTTP报文隐私保护方法和装置,采用策略关键字与隐私清除策略相结合的匹配方法对HTTP报文进行过滤,实现了一次遍历匹配多串的效果,从而提高了隐私信息匹配效率,缩短了隐私信息查找时间。因此,本发明能够高效、准确的屏蔽用户的各种隐私信息,解决了用户上网时大量个人隐私信息外泄的问题,保证了用户上网的安全性,提高了互联网传输的安全性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。