CN101977235A - 一种针对https加密网站访问的网址过滤方法 - Google Patents

一种针对https加密网站访问的网址过滤方法 Download PDF

Info

Publication number
CN101977235A
CN101977235A CN2010105298714A CN201010529871A CN101977235A CN 101977235 A CN101977235 A CN 101977235A CN 2010105298714 A CN2010105298714 A CN 2010105298714A CN 201010529871 A CN201010529871 A CN 201010529871A CN 101977235 A CN101977235 A CN 101977235A
Authority
CN
China
Prior art keywords
url
https
packet
website
certificate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105298714A
Other languages
English (en)
Other versions
CN101977235B (zh
Inventor
林皓
高曦
程志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing VRV Software Corp Ltd
Original Assignee
Beijing VRV Software Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing VRV Software Corp Ltd filed Critical Beijing VRV Software Corp Ltd
Priority to CN 201010529871 priority Critical patent/CN101977235B/zh
Publication of CN101977235A publication Critical patent/CN101977235A/zh
Application granted granted Critical
Publication of CN101977235B publication Critical patent/CN101977235B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种针对HTTPS加密网站访问的网址过滤方法,HTTPS是一种基于身份认证的安全访问协议,本方法中首先通过抓取数据包进行解析的方法识别HTTPS协议流,并获取协议流中的认证报文。其次对认证报文中的网站证书进行解析,提取URL信息,即网页地址,最后对用户访问的URL进行鉴别,通过专业的URL库匹配URL所属的分类,对在访问规则允许之外的URL进行过滤与阻断。采用了本发明的技术方案对网络应用提供安全保护机制,克服了HTTPS传输加密,URL不能轻易获取的难题,能够做到对用户访问HTTPS网站的全面过滤。

Description

一种针对HTTPS加密网站访问的网址过滤方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种针对HTTPS加密网站访问的网址过滤方法。
背景技术
应用网络化是未来互联网发展的一个主要趋势,同时一些新生的互联网黑色产业,如钓鱼、挂马,涉黄、涉赌、涉毒的网站比比皆是,通过对用户访问的网址进行过滤鉴别,对访问行为进行过滤和审计,通过专业的URL库匹配URL所属的分类,对在访问规则允许之外的URL进行过滤与阻断,对网络应用提供安全保护机制。
传统的数据传输是采取明文的方式,一般通过将数据包逐层剥离的方式提取URL信息,并加以判断过滤。HTTPS是一种基于身份认证的安全访问协议,通过HTTPS安全加密传输协议传输的数据在传输层对网络连接进行加密,从而使得传输的内容不能轻易的被获取和破解。网络应用的安全问题得到了保障,但这同时也给URL的提取带来了很大的难度。
本发明方案主要解决目前对加密网站不能过滤的问题,通过本发明方案,可以有效的对HTTPS加密网站的网址进行过滤。
发明内容
本发明的目的在于提出一种针对HTTPS加密网站访问的网址过滤方法,克服了HTTPS加密传输的网址信息提取困难的缺点,不对网络造成干扰,实现对用户访问HTTPS网站过滤的效果。
为达此目的,本发明采用以下技术方案:
A、用户发起连接,并产生数据包;
B、抓取用户访问互联网数据包;
C、判断识别所抓取数据包属于某个网络连接。如果能,转至步骤E,如果不能,转至步骤D;
D、退出。
E、通过数据包所在端口,判断所抓取的数据包是否属于HTTPS协议下的数据包。如果是,转至步骤F,如果不是,转至步骤D。
F、判断数据包是否连接发起时的交互认证数据包,如果是,转至步骤G,如果不是,转至步骤D。
G、获取认证数据包中的网站证书信息。
H、解析网站证书内容。
I、获取证书中内嵌的URL域信息,如果顺利获取,转至步骤J,如果没有,转至步骤D。
J、通过比对网站证书中的URL和浏览器输入的URL,验证URL信息是否正确,如果正确,转至步骤K,如果不一致,转至步骤D。
K、提取URL条目。
L、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。
M、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
还包括以下步骤:
通过寻找对应连接、判断数据包是否属于HTTPS流、数据包是否属于认证报文等条件,过滤抓取到的数据包,提取网站证书。
通过扫描数据包的内容,如连续出现特定URL域标示字符串,提取该字节序列后的URL,然后将网站证书中的URL信息和浏览器输入的URL进行比对,从而判断URL信息的正确性。
采用了本发明的技术方案,解决目前对加密网站提取URL困难、不能过滤的问题,通过本发明的技术方案,在不对网络造成影响的前提下,可以有效的对HTTPS加密网站的网址进行过滤。
附图说明
下图是本发明具体实施方式中针对HTTPS加密网站访问的过滤方法的控制流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明技术方案的主要思想是通过抓取用户对网站访问所产生数据包,选择证书交互数据包并解析证书内容,验证后提取URL信息,并通过预定URL库对所提取的信息进行分类过滤,根据预先设定的规则进行后续处理。
下图是本发明具体实施方式中访问HTTPS加密网站过程中网址过滤的流程图。如下图所示,该过滤流程包括以下步骤:
步骤1、用户发起HTTPS连接,并产生数据包。
步骤2、抓取用户访问互联网数据包。
步骤3、判断识别所抓取数据包属于某个网络连接。
通过确认该数据包所属数据流,检查该数据包是否超过系统对数据流扫描包数目的限制,从而判断识别所抓取的数据包属于具体某个连接所产生的数据包。如果所抓取的数据包在不超过系统对数据流扫描包数目的限制之内成功识别出所属连接,转至步骤5,如果所抓取的数据包没有在系统对数据流扫描包数目的限制之内识别出所属连接,转至步骤4。
步骤4、退出。
步骤5、判断所抓取的数据包是否属于HTTPS协议下的数据包。
通过抓取的数据包所在端口,从而判断数据包是否属于HTTPS协议下的数据包。如果所抓取的数据包属于HTTPS协议,转至步骤6,如果所抓取数据包不属于HTTPS协议,转至步骤4。
步骤6、判断数据包是否属于HTTPS协议下的交互认证数据包,此数据包中包括网站证书等信息。如果该数据包是交互认证数据包,转至步骤7,如果该数据包不是交互认证数据包,转至步骤4。
步骤7、获取认证数据包中的网站证书信息。
步骤8、解析网站证书内容。扫描此数据包的内容,如果数据包里连续出现某特定URL域标示字符串,为URL域的标示,该标示后即为URL域名。
步骤9、获取证书中内嵌的URL域信息,如果顺利获取到URL信息,转至步骤10,如果没有获取到URL信息,转至步骤4。
步骤10、验证URL信息是否正确,通过比对解析出的认证报文网站证书中的URL和浏览器输入的URL是否一致,如果比对一致说明证书中的URL信息就是浏览器中的URL,在证书提取中的URL是正确的URL。如果URL信息验证一致,转至步骤11,如果URL信息不一致,转至步骤4。
步骤11、提取URL条目。
步骤12、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。
步骤13、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (3)

1.一种针对HTTPS加密网站访问的网址过滤方法,其特征在于,包括以下步骤:
A、用户发起HTTPS连接,并产生数据包;
B、抓取用户访问互联网数据包;
C、判断识别所抓取的数据包属于某个网络连接。如果能识别,转至步骤E,如果不能,转至步骤D;
D、退出。
E、通过数据包所在端口,判断所抓取的数据包是否属于HTTPS协议下的数据包。如果是,转至步骤F,如果不是,转至步骤D。
F、判断数据包是否属于HTTPS协议交互中的认证数据包,如果是,转至步骤G,如果不是,转至步骤D。
G、获取认证数据包中的网站证书信息。
H、解析网站证书内容。
I、获取证书中内嵌的URL域信息,如果顺利获取,转至步骤J,如果没有,转至步骤D。
J、通过验证解析出的认证数据包中的URL和浏览器输入的URL是否一致,如果一致,转至步骤K,如果不一致,转至步骤D。
K、提取URL条目。
L、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。
M、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
2.根据权利要求1所述的一种针对HTTPS加密网站访问的网址过滤方法,其特征在于,通过寻找对应连接、判断数据包是否属于HTTPS流、数据包是否属于认证报文等条件,过滤抓取到的数据包,提取网站证书。
3.根据权利要求1所述的一种针对HTTPS加密网站访问的网址过滤方法,其特征在于,通过扫描数据包的内容,如连续出现特定URL域标示字符串,提取该字节序列后的URL,然后将网站证书中的URL信息和浏览器输入的URL进行比对,从而判断URL信息的正确性。
CN 201010529871 2010-11-03 2010-11-03 一种针对https加密网站访问的网址过滤方法 Active CN101977235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010529871 CN101977235B (zh) 2010-11-03 2010-11-03 一种针对https加密网站访问的网址过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010529871 CN101977235B (zh) 2010-11-03 2010-11-03 一种针对https加密网站访问的网址过滤方法

Publications (2)

Publication Number Publication Date
CN101977235A true CN101977235A (zh) 2011-02-16
CN101977235B CN101977235B (zh) 2013-03-27

Family

ID=43577078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010529871 Active CN101977235B (zh) 2010-11-03 2010-11-03 一种针对https加密网站访问的网址过滤方法

Country Status (1)

Country Link
CN (1) CN101977235B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102594565A (zh) * 2012-02-23 2012-07-18 汉柏科技有限公司 利用数字证书识别加密协议的识别方法及系统
WO2012126263A1 (zh) * 2011-03-23 2012-09-27 腾讯科技(深圳)有限公司 一种访问互联网网页的装置、系统及方法
CN103229479A (zh) * 2012-12-28 2013-07-31 华为技术有限公司 一种网站识别方法、装置及网络系统
CN103825887A (zh) * 2014-02-14 2014-05-28 深信服网络科技(深圳)有限公司 基于https加密的网站过滤方法和系统
CN103873466A (zh) * 2014-03-04 2014-06-18 深信服网络科技(深圳)有限公司 Https网站过滤及阻断告警的方法和装置
CN104104686A (zh) * 2014-07-24 2014-10-15 上海斐讯数据通信技术有限公司 一种基于移动互联网的网络数据包解析取证方法
CN105119916A (zh) * 2015-08-21 2015-12-02 福建天晴数码有限公司 一种基于http的认证方法及系统
CN105516169A (zh) * 2015-12-23 2016-04-20 北京奇虎科技有限公司 检测网站安全的方法及装置
CN105721479A (zh) * 2016-03-02 2016-06-29 北京网康科技有限公司 一种网址过滤方法及装置
CN106470191A (zh) * 2015-08-19 2017-03-01 国基电子(上海)有限公司 过滤https传输内容的系统、方法及装置
CN107147622A (zh) * 2017-04-21 2017-09-08 深圳市共进电子股份有限公司 Https加密网址的过滤方法、装置及其计算机设备
CN107154917A (zh) * 2016-03-03 2017-09-12 华为技术有限公司 数据传输方法及服务器
WO2018099219A1 (zh) * 2016-11-29 2018-06-07 中国银联股份有限公司 一种钓鱼网站检测方法和装置
CN108206806A (zh) * 2016-12-16 2018-06-26 广东世纪网通信设备股份有限公司 钓鱼网站拦截方法、装置以及用于拦截钓鱼网站的服务器
CN109672650A (zh) * 2017-10-17 2019-04-23 阿里巴巴集团控股有限公司 网站分类系统、方法及数据处理方法
CN110677374A (zh) * 2018-07-02 2020-01-10 中国电信股份有限公司 防钓鱼攻击的方法、装置及计算机可读存储介质
CN113824644A (zh) * 2020-06-18 2021-12-21 中国移动通信集团陕西有限公司 Https业务内容识别方法、装置和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1357724A1 (fr) * 2002-04-23 2003-10-29 Alcatel Dispositif de gestion de filtres de données
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
US20080059804A1 (en) * 2006-08-22 2008-03-06 Interdigital Technology Corporation Method and apparatus for providing trusted single sign-on access to applications and internet-based services
CN101594261A (zh) * 2008-05-28 2009-12-02 北京百问百答网络技术有限公司 一种假冒网站监测方法及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1357724A1 (fr) * 2002-04-23 2003-10-29 Alcatel Dispositif de gestion de filtres de données
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
US20080059804A1 (en) * 2006-08-22 2008-03-06 Interdigital Technology Corporation Method and apparatus for providing trusted single sign-on access to applications and internet-based services
CN101594261A (zh) * 2008-05-28 2009-12-02 北京百问百答网络技术有限公司 一种假冒网站监测方法及其系统

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8898738B2 (en) 2011-03-23 2014-11-25 Tencent Technology (Shenzhen) Company Limited Apparatus, system and method for accessing internet webpage
WO2012126263A1 (zh) * 2011-03-23 2012-09-27 腾讯科技(深圳)有限公司 一种访问互联网网页的装置、系统及方法
CN102594565B (zh) * 2012-02-23 2015-06-03 汉柏科技有限公司 利用数字证书识别加密协议的识别方法及系统
WO2013123799A1 (zh) * 2012-02-23 2013-08-29 汉柏科技有限公司 利用数字证书识别加密协议的识别方法及系统
CN102594565A (zh) * 2012-02-23 2012-07-18 汉柏科技有限公司 利用数字证书识别加密协议的识别方法及系统
WO2014101112A1 (zh) * 2012-12-28 2014-07-03 华为技术有限公司 一种网站识别方法、装置及网络系统
CN103229479A (zh) * 2012-12-28 2013-07-31 华为技术有限公司 一种网站识别方法、装置及网络系统
CN103229479B (zh) * 2012-12-28 2016-03-09 华为技术有限公司 一种网站识别方法、装置及网络系统
CN103825887A (zh) * 2014-02-14 2014-05-28 深信服网络科技(深圳)有限公司 基于https加密的网站过滤方法和系统
CN103825887B (zh) * 2014-02-14 2017-06-16 深信服网络科技(深圳)有限公司 基于https加密的网站过滤方法和系统
CN103873466A (zh) * 2014-03-04 2014-06-18 深信服网络科技(深圳)有限公司 Https网站过滤及阻断告警的方法和装置
CN104104686A (zh) * 2014-07-24 2014-10-15 上海斐讯数据通信技术有限公司 一种基于移动互联网的网络数据包解析取证方法
CN104104686B (zh) * 2014-07-24 2017-09-29 上海斐讯数据通信技术有限公司 一种基于移动互联网的网络数据包解析取证方法
CN106470191A (zh) * 2015-08-19 2017-03-01 国基电子(上海)有限公司 过滤https传输内容的系统、方法及装置
CN106470191B (zh) * 2015-08-19 2019-12-10 国基电子(上海)有限公司 过滤https传输内容的系统、方法及装置
CN105119916A (zh) * 2015-08-21 2015-12-02 福建天晴数码有限公司 一种基于http的认证方法及系统
CN105119916B (zh) * 2015-08-21 2018-04-10 福建天晴数码有限公司 一种基于http的认证方法及系统
CN105516169A (zh) * 2015-12-23 2016-04-20 北京奇虎科技有限公司 检测网站安全的方法及装置
CN105721479B (zh) * 2016-03-02 2019-01-04 北京网康科技有限公司 一种网址过滤方法及装置
CN105721479A (zh) * 2016-03-02 2016-06-29 北京网康科技有限公司 一种网址过滤方法及装置
CN107154917B (zh) * 2016-03-03 2020-06-02 华为技术有限公司 数据传输方法及服务器
CN107154917A (zh) * 2016-03-03 2017-09-12 华为技术有限公司 数据传输方法及服务器
WO2018099219A1 (zh) * 2016-11-29 2018-06-07 中国银联股份有限公司 一种钓鱼网站检测方法和装置
CN108206806A (zh) * 2016-12-16 2018-06-26 广东世纪网通信设备股份有限公司 钓鱼网站拦截方法、装置以及用于拦截钓鱼网站的服务器
CN107147622A (zh) * 2017-04-21 2017-09-08 深圳市共进电子股份有限公司 Https加密网址的过滤方法、装置及其计算机设备
CN109672650A (zh) * 2017-10-17 2019-04-23 阿里巴巴集团控股有限公司 网站分类系统、方法及数据处理方法
CN110677374A (zh) * 2018-07-02 2020-01-10 中国电信股份有限公司 防钓鱼攻击的方法、装置及计算机可读存储介质
CN113824644A (zh) * 2020-06-18 2021-12-21 中国移动通信集团陕西有限公司 Https业务内容识别方法、装置和设备

Also Published As

Publication number Publication date
CN101977235B (zh) 2013-03-27

Similar Documents

Publication Publication Date Title
CN101977235B (zh) 一种针对https加密网站访问的网址过滤方法
CN103825887B (zh) 基于https加密的网站过滤方法和系统
CN101035128B (zh) 基于中文标点符号的三重网页文本内容识别及过滤方法
CN103607413B (zh) 一种网站后门程序检测的方法及装置
CN102467633A (zh) 一种安全浏览网页的方法及其系统
CN107992739A (zh) 用户验证方法、装置及系统
CN103902476B (zh) 一种基于非授信的网页后门检测方法及系统
CN108449319A (zh) 一种识别诈骗网站及远程木马取证的方法及装置
CN103118035B (zh) 分析网站访问请求参数合法范围的方法及装置
CN105491018B (zh) 一种基于dpi技术的网络数据安全性分析方法
CN103746982B (zh) 一种http网络特征码自动生成方法及其系统
CN102664935B (zh) 一种web类用户行为和用户信息的关联输出方法及系统
CN104199962B (zh) 一种基于三层可信网页取证模型的可信网页取证系统及其取证方法
US10972496B2 (en) Upload interface identification method, identification server and system, and storage medium
CN103699823B (zh) 基于用户行为模式的身份认证系统及其方法
CN104394531A (zh) 终端设备的无线网络连接方法
CN103279764A (zh) 基于人脸识别的网络实名认证系统
CN107454118A (zh) 验证码获取方法及装置、登录方法及系统
CN113407886A (zh) 网络犯罪平台识别方法、系统、设备和计算机存储介质
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN105138639A (zh) 网页广告筛选方法
CN102984243A (zh) 一种ssl协议中应用的自动识别方法和装置
CN103312692A (zh) 链接地址安全性检测方法及装置
CN107066854A (zh) 智能终端应用锁处理的方法及装置
CN101901307B (zh) 一种检测数据库是否遭到跨站脚本攻击的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant