CN102801634A - 一种三位一体网络流量智能识别方法 - Google Patents

一种三位一体网络流量智能识别方法 Download PDF

Info

Publication number
CN102801634A
CN102801634A CN2012103118345A CN201210311834A CN102801634A CN 102801634 A CN102801634 A CN 102801634A CN 2012103118345 A CN2012103118345 A CN 2012103118345A CN 201210311834 A CN201210311834 A CN 201210311834A CN 102801634 A CN102801634 A CN 102801634A
Authority
CN
China
Prior art keywords
protocol
identification
agreement
network
data message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103118345A
Other languages
English (en)
Other versions
CN102801634B (zh
Inventor
周华雄
陈陵
汪明珠
徐洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHUHAI NETBOX INFORMATION TECHNOLOGY Co Ltd
Original Assignee
ZHUHAI NETBOX INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHUHAI NETBOX INFORMATION TECHNOLOGY Co Ltd filed Critical ZHUHAI NETBOX INFORMATION TECHNOLOGY Co Ltd
Priority to CN201210311834.5A priority Critical patent/CN102801634B/zh
Publication of CN102801634A publication Critical patent/CN102801634A/zh
Application granted granted Critical
Publication of CN102801634B publication Critical patent/CN102801634B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种三位一体网络流量智能识别方法,其首先将离散的网络数据报文根据其所用协议分为具体协议,通用协议以及常用协议;然后,对于具体协议采用特征识别,对于通用协议采用图灵自动机识别,对于常用协议采用端口识别。本发明能够减少对网络数据包的扫描数量,提升协议识别的效率以及提高协议识别的准确率。

Description

一种三位一体网络流量智能识别方法
技术领域
本发明涉及一种高效准确的网络流量识别方法,属于网络信息安全软件系统领域。
背景技术
一般的网络流量识别采用互联网协议约束的端口或者根据协议总结的正则表达式方式识别网络流量。此类端口识别方法对于一般服务,如互联网的web服务等遵守互联网端口定义标准的服务是有效的,但是对于特意修改端口,如使用非80端口作为web服务的站点等类似情形,就出现了漏判误判,使得这类服务在网络信息安全分析时总是存在漏判的问题。
另外,根据协议总结的正则表达式,有一定的效率,但不是所有的网络协议都能很友好的总结得到满足要求的正则表达式,影响了该方法的使用,其匹配效率也不是很高。
发明内容
为了克服以上缺陷并满足市场的需要,本发明旨在解决网络流量识别时漏判,和识别过程中效率问题。
本发明采取的技术方案是:
一种三位一体网络流量智能识别方法,其首先将网络流量按照源IP地址、源端口、目的IP地址、目的端口、和传输层协议号对离散的网络数据报文进行归类实现链路管理,并将网络应用协议分为三类::具体协议,通用协议以及常用协议;其中具体协议为特定的互联网服务通讯协议,通用协议指通过RFC文档发布的协议,这些协议作为互联网服务的通许协议,满足协议的原始定义,而不属于具体协议和通用协议的归为常用协议;
其次,按照以下方法对归类的数据报文进行识别:
1)对于具体协议采用特征识别,基于特定的互联网服务通讯协议具有特有协议特征的原理,建立具体协议特征数据库,协议识别时获取数据报文的关键位特征信息并与数据库中的数据进行比较,最终识别协议;
2)对于通用协议采用图灵自动机识别,事先对于归类为通用协议的协议进行分析,总结出能精确识别的正则式,将这些正则式使用图灵机算法,转换成有穷自动机,根据输入得出输出,最终识别协议;
3)对于常用协议采用端口识别,其中对于没有明显协议特征、也不容易总结出正则式的常用协议,使用端口识别;
将以上三种协议识别方法通过策略模式,按照预设的优先级整合成一个识别模块,完成对网络流量的协议识别。
作为以上技术方案的一种改进,其中网络数据报文的归类算法为:
h = ((源端口  ^源IP)  ^(目标端口  ^目标IP)  ^传输协议);
h ^= h>>16;
h ^= h>>8;
h=h & (size - 1),
h 即最后的计算结果,
根据计算结果对其采用hash线性树表的方式管理链路,并采用LRU 算法,将最近访问的置前,实现快速查找。
本发明的有益效果是:
1.减少对网络数据包的扫描数量:通过链路管理,有效的减少了对网络数据报文的扫描数量。据经验统计,需要扫描的网络数据报文不到整个网络报文的1%。
2.提升协议识别的效率,本发明所提出的方法的时间复杂度都很低,特别是其中对正则式的改进。
3.提高协议识别的准确率,使用本发明所提出的方法能准确识别出网络流量的协议。
具体实施方式
本发明提出一种三位一体智能识别网络流量的过滤方法。具体来说,本发明通过以下方法实现问题的解决:
1、首先,本发明在对网络流量进行智能识别时,先将网络流量按照源IP地址,源端口,目的IP地址,目的端口,和传输层协议号(传输协议五元组)实现链路管理,将离散的网络数据报文实现链路的归类。
其中使用的数据报文链路归类算法,参考Linux内核算法,对算法改造,实现双向流量同一链路管理,减少一次归类运算,一条链路只需要识别前一个或几个报文。
2、  三位一体智能识别中的协议识别方法及其原理如下:
A、  具体协议特征识别。特定的互联网服务通讯协议,一般都有其特有的协议特征,比如腾讯QQ、Fetion等,对这些协议深入分析获取关键位特征信息并建立相应的数据库,协议识别时比较关键位特征。该识别时间复杂度为O(1)。
B、  通用协议使用图灵自动机识别。通用协议指通过RFC文档发布的协议,如http、ftp等协议。使用这些协议作为互联网服务的通许协议,满足协议的原始定义。对于这些协议统一分析,总结出能精确识别的正则式,将这些正则式使用图灵机算法,转换成有穷自动机,根据输入得出输出,最终识别协议。其时间复杂度O(n),相比正则式时间复杂度O(n*m)效率高。
C、  常用协议的端口识别。对于常用协议,没有明显协议特征、也不容易总结出正则式,则可以使用端口识别。一般一类协议都有固定的端口或者端口端,比如telnet、DNS协议。其时间复杂度O(1).
三位一体智能协议识别就是将上面的三种协议识别方法、通过策略模式,按照优先级(依次为A、B、C方法)整合成一个识别模块,完成对网络流量的协议识别,方法C、B、A分别是后者的补充。系统根据识别的结果选择对网络流量过滤处理。
3、A、B、C三种方法都能按需扩充。特别是对方法A的扩充,是的识别的效率和正确率能得到明显的提升。
本发明的实现的关键算法:
链路归类算法:
h = ((源端口  ^源IP)  ^(目标端口  ^目标IP)  ^传输协议);
   h ^= h>>16;
   h ^= h>>8;
  h=h & (size - 1);
h 即最后的计算结果。
根据计算结果对其采用hash线性树表的方式管理链路,并采用LRU 算法,将最近访问的置前,实现快速查找。
以上所述只是本发明优选的实施方式,其并不构成对本发明保护范围的限制,只要是以基本相同的手段实现本发明的目的都应属于本发明的保护范围。

Claims (2)

1.一种三位一体网络流量智能识别方法,其特征在于:
首先将网络流量按照源IP地址、源端口、目的IP地址、目的端口、和传输层协议号对离散的网络数据报文进行归类实现链路管理,并将网络应用协议分为三类:具体协议,通用协议以及常用协议;其中具体协议为特定的互联网服务通讯协议;通用协议指通过RFC文档发布的协议,这些协议作为互联网服务的通许协议,满足协议的原始定义;而不属于具体协议和通用协议的网络数据报文归为常用协议;
其次,按照以下方法对归类的网络数据报文进行识别:
1)对于具体协议采用特征识别,基于特定的互联网服务通讯协议具有特有协议特征的原理,建立具体协议特征数据库,协议识别时获取数据报文的关键位特征信息并与数据库中的数据进行比较,最终识别协议;
2)对于通用协议采用图灵自动机识别,事先对于归类为通用协议的协议进行分析,总结出能精确识别的正则式,将这些正则式使用图灵机算法,转换成有穷自动机,根据输入得出输出,最终识别协议;
3)对于常用协议采用端口识别,其中对于没有明显协议特征、也不容易总结出正则式的常用协议,使用端口识别;
将以上三种协议识别方法通过策略模式,按照预设的优先级整合成一个识别模块,完成对网络流量的协议识别。
2.根据权利要求1所述的三位一体网络流量智能识别方法,其特征在于:网络数据报文的归类算法为:
h = ((源端口  ^源IP)  ^(目标端口  ^目标IP)  ^传输协议);
h ^= h>>16;
h ^= h>>8;
h=h & (size - 1),
h 即最后的计算结果,
根据计算结果对其采用hash线性树表的方式管理链路,并采用LRU 算法,将最近访问的置前,实现快速查找。
CN201210311834.5A 2012-08-29 2012-08-29 一种三位一体网络流量智能识别方法 Expired - Fee Related CN102801634B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210311834.5A CN102801634B (zh) 2012-08-29 2012-08-29 一种三位一体网络流量智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210311834.5A CN102801634B (zh) 2012-08-29 2012-08-29 一种三位一体网络流量智能识别方法

Publications (2)

Publication Number Publication Date
CN102801634A true CN102801634A (zh) 2012-11-28
CN102801634B CN102801634B (zh) 2016-04-27

Family

ID=47200602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210311834.5A Expired - Fee Related CN102801634B (zh) 2012-08-29 2012-08-29 一种三位一体网络流量智能识别方法

Country Status (1)

Country Link
CN (1) CN102801634B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610763A (zh) * 2014-10-31 2016-05-25 杭州迪普科技有限公司 协议识别方法及装置
CN106789416A (zh) * 2016-12-13 2017-05-31 中兴软创科技股份有限公司 工控系统专用协议识别方法与系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262491A (zh) * 2008-04-02 2008-09-10 王京 应用层网络分析方法及系统
CN102315974A (zh) * 2011-10-17 2012-01-11 北京邮电大学 基于层次化特征分析的tcp、udp流量在线识别方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262491A (zh) * 2008-04-02 2008-09-10 王京 应用层网络分析方法及系统
CN102315974A (zh) * 2011-10-17 2012-01-11 北京邮电大学 基于层次化特征分析的tcp、udp流量在线识别方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105610763A (zh) * 2014-10-31 2016-05-25 杭州迪普科技有限公司 协议识别方法及装置
CN106789416A (zh) * 2016-12-13 2017-05-31 中兴软创科技股份有限公司 工控系统专用协议识别方法与系统

Also Published As

Publication number Publication date
CN102801634B (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
CN106815112B (zh) 一种基于深度包检测的海量数据监控系统及方法
CN104348716B (zh) 一种报文处理方法及设备
CN103312565B (zh) 一种基于自主学习的对等网络流量识别方法
US9275224B2 (en) Apparatus and method for improving detection performance of intrusion detection system
CN102315974B (zh) 基于层次化特征分析的tcp、udp流量在线识别方法和装置
CN105282169A (zh) 基于SDN控制器阈值的DDoS攻击预警方法及其系统
CN102821009B (zh) 基于链路层发现协议监控环形网络的方法和装置
US20130195457A1 (en) Method and system for performing distributed deep-packet inspection
CN109314664B (zh) 僵尸主控机发现设备和方法
CN102271090A (zh) 基于传输层特征的流量分类方法及装置
CN101321088A (zh) 一种统计ip数据流信息的方法及装置
CN103475653A (zh) 网络数据包的检测方法
CN110855493B (zh) 用于混合环境的应用拓扑图绘制装置
CN102739457A (zh) 一种基于dpi和svm技术的网络流量识别系统及方法
CN101184000A (zh) 基于报文采样和应用签名的互联网应用流量识别方法
CN110034966B (zh) 一种基于机器学习的数据流分类方法及系统
CN105162703B (zh) 基于混合协议的多级网络拓扑智能发现及生成方法和系统
CN103763198A (zh) 一种数据包分类方法
CN110266603B (zh) 基于http协议的身份认证业务网络流量分析系统及方法
Xu et al. [Retracted] DDoS Detection Using a Cloud‐Edge Collaboration Method Based on Entropy‐Measuring SOM and KD‐Tree in SDN
CN102801634A (zh) 一种三位一体网络流量智能识别方法
CN117040943B (zh) 基于IPv6地址驱动的云网络内生安全防御方法和装置
CN112073364A (zh) 一种基于DPI的DDoS攻击识别方法、系统、设备及可读存储介质
Tang et al. Intelligent awareness of delay-sensitive internet traffic in digital twin network
CN116346434A (zh) 电力系统网络攻击行为监测准确度提升方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160427

Termination date: 20190829

CF01 Termination of patent right due to non-payment of annual fee