CN100553206C - 基于报文采样和应用签名的互联网应用流量识别方法 - Google Patents

基于报文采样和应用签名的互联网应用流量识别方法 Download PDF

Info

Publication number
CN100553206C
CN100553206C CNB2007101795364A CN200710179536A CN100553206C CN 100553206 C CN100553206 C CN 100553206C CN B2007101795364 A CNB2007101795364 A CN B2007101795364A CN 200710179536 A CN200710179536 A CN 200710179536A CN 100553206 C CN100553206 C CN 100553206C
Authority
CN
China
Prior art keywords
message
application
stream
stream mode
stream information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2007101795364A
Other languages
English (en)
Other versions
CN101184000A (zh
Inventor
郭振滨
孙研彦
裘正定
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CNB2007101795364A priority Critical patent/CN100553206C/zh
Publication of CN101184000A publication Critical patent/CN101184000A/zh
Application granted granted Critical
Publication of CN100553206C publication Critical patent/CN100553206C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于报文采样和应用签名的互联网应用流量识别方法,该方法由如下步骤构成:报文采样捕捉:按照采样策略和采样率捕捉报文,解码:对报文进行解码,分析出报文的流信息和应用数据,流分类:根据报文的流信息查找和维护流状态表,流状态判别:如果流分类查找出的流状态项的应用类型为未知则进行签名匹配,签名匹配:根据应用签名库对报文的应用数据进行匹配,如果匹配成功,则更新流状态项中的应用类型,并输出该数据流的流信息和应用类型。该方法识别准确度高、处理效率高、可扩展性好,可实现性强,既能应用于报文处理,又能应用于流数据分析,既可以实现在网络设备中,也可以实现在网络分析系统中。

Description

基于报文采样和应用签名的互联网应用流量识别方法
技术领域
本发明涉及一种互联网应用流量识别方法,特别是指一种基于报文采样和应用签名的互联网应用流量识别方法。应用于高速网络中,使用应用签名对采样报文进行应用流量识别的方法。
背景技术
准确识别互联网应用流量对于接入网、企业网和网络研究者都是极其重要的。接入网和企业网都需要准确识别网络应用流量,以便进行网络操作与管理、基于应用的流量工程、容量规划、区分服务和降低运营成本等工作。一些网络设备(例如Cisco设备)已经提供了识别应用流量的能力。网络研究者也需要准确识别网络应用流量,以便进行被动网络测量、研究各网络应用和用户的行为特征等工作。
目前,现有的网络应用流量识别方法主要有三种:(1)基于端口号进行识别。在互联网发展初期,各应用软件均使用默认端口号进行通信,例如电子邮件使用25和110端口号,WWW使用80端口号。使用端口号进行应用流量识别曾经是一种快速而准确的方法,当时既适用于对报文进行处理也适用于对流数据(例如Netflow)进行分析。(2)基于流统计特征进行识别。最近几年,peer-to-peer(P2P)应用得到了广泛发展,已经成为互联网杀手级应用,其网络流量已经成为互联网的主要流量。一些学者利用P2P应用流的地址和端口号的统计特征,提出了基于流统计特征的P2P流量识别方法,对流数据进行识别。该类方法适用于从流数据中识别出P2P流量,具有很高的处理效率。(3)基于应用签名进行识别。应用签名指应用数据负载中的特定数据模式。该类识别方法很准确,但是需要捕捉和处理全部报文,无法应用于Gbps/Tbps这样的高速网络上。
以上所述的三种流量识别方法都有局限性,无法应用到高速网络上。
基于端口号进行识别已经不再准确,具有较高的漏检率和误检率。随着互联网的发展出现了大量新兴应用,很多应用(包括网络游戏、即时通信和P2P等应用)为了逃避检测不再采用默认端口号进行通信,这导致该方法已经不再准确。
基于流统计特征进行流量识别主要是针对P2P应用提出的,适用于从流数据中识别出P2P流量,无法应用于报文处理,不适合与对其它应用进行流量识别。
基于应用签名进行流量识别需要捕捉和处理全部报文,没有足够高的处理效率。在高速(Gbp和Tbps)网络上对每个报文进行分析是不可行的,因为软件的处理速度无法匹配上高速的链路速度,对每个报文进行签名匹配是非常消耗处理资源的,并且捕捉每个报文也需要大量的处理能力、内存缓存、系统IO和网络带宽。
发明内容
本发明的目的在于避免上述现有技术中的不足之处而提供一种基于报文采样和应用签名的互联网应用流量识别方法,应用于高速网络中,使用应用签名对采样报文进行应用流量识别的方法,该方法同时保证了识别准确度和处理效率,使得在高速网络上进行应用流量识别成为可能。该方法既能应用于报文处理又能应用于流数据分析,既可以实现在网络设备中也可以实现在网络分析系统中。
本发明的目的可以通过以下措施来达到:
报文采样捕捉:运用IETF的PSAMP工作组定义的一系列报文采样方法,当有网络报文到达时,根据一定的采样策略按照采样率来捕捉报文,报文采样捕捉的控制参数包括采样率和采样策略;
解码:对捕捉到的报文进行解码分析,最终分析出报文的流信息和应用数据,解码完成以下几项工作:1、从IP层头部中分析出传输层协议类型、源地址和目的地址,2、当为TCP报文时从TCP层头部中分析出源端口号和目的端口号,3、当为UDP报文时从UDP层头部中分析出源端口号和目的端口号,4、分析出应用数据;
流分类:根据解码分析出的报文的流信息对流状态表进行处理,其中流状态表存储着每个网络数据流的流信息、最后活动时间和应用类型,流分类的控制参数包括数据流不活动时间阈值,流分类主要完成以下几项功能:1、根据报文的流信息从流状态表中快速查找报文对应的流状态项,2、如果查找成功,更新流状态项中的最后活动时间,3、如果查找失败,跟据报文的流信息创建流状态项插入到表中,其中流状态项的流信息为报文的流信息、应用类型为未知、最后活动时间为报文的捕捉时间,4、对状态表进行检查,删除超过数据流不活动时间阈值而没有被更新的流状态项;
流状态判别:对流分类查找到或新创建的流状态项进行处理,当该流状态项中的应用类型为未知时则进行签名匹配,否则不进行其它处理;
签名匹配:根据应用签名库对报文的应用数据进行处理,如果应用数据中含有签名库中的签名,则更新流状态项中的应用类型,并输出该网络数据流的流信息和应用类型。
本发明相比现有技术具有如下优点:
1、识别准确度高。与基于端口号的流量识别方法相比,由于采用了应用签名进行识别,显著地提高了识别准确度。
2、处理效率高。与基于应用签名的流量识别方法相比,由于采用报文采样捕捉的方法,显著降低了捕捉报文的处理开销,同时也降低了后续工作的处理开销;另外,流状态判别使得只对尚未分析出应用类型的报文进行签名匹配,这进一步提高了处理效率。
3、由于同时保障了识别准确度和处理效率,解决了在高速网路进行流量识别的困难。
4、可扩展性强。采用应用签名库的机制,使得该流量识别方法具有良好的可扩展性。通过扩展应用签名库,能对多种应用进行识别。
5、应用范围广。该方法既能应用于报文处理,又能应用于流数据分析;既可以实现在网络设备中,也可以实现在网络分析系统中。
6、可实现性强。该方法能够利用现有网络设备提供的报文采样和流数据输出功能,实现应用流量识别。
附图说明
图1应用流量识别方法结构图;
图2TCP报文的封装格式;
图3UDP报文的封装格式;
图4流量识别方法应用于报文处理;
图5流量识别方法应用于流数据分析。
具体实施方式
本发明在保障应用流量识别准确度的条件下,采取了一系列措施来提高处理效率。下面结合图1应用流量识别方法结构图详细介绍该方法:
1、报文采样捕捉
当有网络报文到达时,根据一定的采样策略按照采样率来捕捉报文。这极大地降低了捕捉报文的处理开销,同时也降低了后续工作的处理开销。IETF的PSAMP(Packet Sampling)工作组定义了一系列报文采样方法,都可以应用到本发明中。报文采样捕捉的控制参数包括采样率和采样策略。
报文采样是一种可扩展的对高速网络进行测量的方法。已经有一些学者基于报文采样进行了网络流量测量、性能分析、计费等方面的研究。IETF的PSAMP工作组正进行报文采样方面的标准化工作。一些高速骨干路由器已经提供了报文采样功能。
下面以随机采样为例,来说明报文采样捕捉。假设报文采样率为p,满足0<p≤1。当一个报文到达时,产生服从[0,1]均匀分布的随机数n,如果n≤p则捕捉该报文,否则不进行任何处理。
如果将该方法应用于网络分析系统中,可以直接利用网络设备提供报文采样功能,从网络设备接收采样后的报文,这时可以省略报文采样捕捉。
2、解码
解码对捕捉到的报文进行解码分析,最终分析出报文的流信息和应用数据。流信息是指传输层协议类型、源地址、目的地址、源端口号和目的端口号,其中传输层协议类型包括TCP协议和UDP协议。
在不同的网络环境下,报文的协议封装格式会有较大差异。下面以常用的以太网协议封装格式为例,来说明解码。TCP报文的封装格式如图2所示,UDP报文的封装格式如图3所示。解码主要完成以下几项工作:1、从IP层头部中分析出传输层协议类型、源地址和目的地址;2、当为TCP报文时从TCP层头部中分析出源端口号和目的端口号;3、当为UDP报文时从UDP层头部中分析出源端口号和目的端口号;4、分析出应用数据。
3、流分类
流分类根据解码分析出的报文的流信息对流状态表进行处理,其中流状态表存储着每个网络数据流的流信息、最后活动时间和应用类型。流分类的控制参数包括数据流不活动时间阈值。
流分类主要完成以下几项功能:1、根据报文的流信息从流状态表中快速查找报文对应的流状态项,2、如果查找成功,更新流状态项中的最后活动时间,3、如果查找失败,跟据报文的流信息创建流状态项插入到表中,其中流状态项的流信息为报文的流信息、应用类型为未知、最后活动时间为报文的捕捉时间,4、对状态表进行检查,删除超过数据流不活动时间阈值而没有被更新的流状态项。
目前有很多成熟的流分类方法,既有硬件实现方式也有软件实现方式。本发明不对具体的流分类方法进行限制。
4、流状态判别
流状态判别对流分类查找到或新创建的流状态项进行处理,当该流状态项中的应用类型为未知时则进行签名匹配,否则不进行其它处理。
流状态判别使得只对尚未分析出应用类型的报文进行签名匹配,这进一步提高了处理效率。
5、签名匹配
签名匹配根据应用签名库对报文的应用数据进行处理,如果应用数据中含有签名库中的签名,则更新流状态项中的应用类型,并输出该网络数据流的流信息和应用类型。
应用签名库存储需要识别的网络应用的应用签名。应用签名指应用数据负载中的特定数据模式。应用签名最初用于网络入侵检测系统中,用于描述报文中的入侵行为。最近应用签名被应用到网络应用流量识别中。
可以采用多种方式来描述应用签名,本发明不对具体应用签名的描述方式进行限制。可以用以下信息来描述应用签名:1、报文的流信息,包括传输层协议类型、源地址、目的地址、源端口号和目的端口号;2、报文应用数据长度;3、报文应用数据中的特定区域包含满足某正则表达式的数据内容;4、报文应用数据的特定区域包含某字符串。
在应用签名库中,每种网络应用具有多个应用签名。对于一个报文只要有一个签名被匹配上了,则该报文对应的网络数据流就被识别为该应用签名对应的应用。
该方法应用范围广。该方法既能应用于报文处理,如图4所示,又能应用于流数据分析,如图5所示;既可以实现在网络设备中,也可以实现在网络分析系统中。
该方法可实现性强。该方法能够利用现有网络设备提供的报文采样和流数据输出功能,实现应用流量识别,如图5所示。
在不背离本发明精神及实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变及变形,但相应的改变及变形这些都应属于本发明的权利要求的保护范围内。

Claims (1)

1、一种基于报文采样和应用签名的互联网应用流量识别方法,其特征在于:
该方法由如下步骤构成:
报文采样捕捉:运用IETF的PSAMP工作组定义的一系列报文采样方法,当有网络报文到达时,根据一定的采样策略按照采样率来捕捉报文,报文采样捕捉的控制参数包括采样率和采样策略;
解码:对捕捉到的报文进行解码分析,最终分析出报文的流信息和应用数据,解码完成以下几项工作:1、从IP层头部中分析出传输层协议类型、源地址和目的地址,2、当为TCP报文时从TCP层头部中分析出源端口号和目的端口号,3、当为UDP报文时从UDP层头部中分析出源端口号和目的端口号,4、分析出应用数据;
流分类:根据解码分析出的报文的流信息对流状态表进行处理,其中流状态表存储着每个网络数据流的流信息、最后活动时间和应用类型,流分类的控制参数包括数据流不活动时间阈值,流分类主要完成以下几项功能:1、根据报文的流信息从流状态表中快速查找报文对应的流状态项,2、如果查找成功,更新流状态项中的最后活动时间,3、如果查找失败,根据报文的流信息创建流状态项插入到表中,其中流状态项的流信息为报文的流信息、应用类型为未知、最后活动时间为报文的捕捉时间,4、对流状态表进行检查,删除超过数据流不活动时间阈值而没有被更新的流状态项;
流状态判别:对流分类查找到或新创建的流状态项进行处理,当该流状态项中的应用类型为未知时则进行签名匹配,否则不进行其它处理;
签名匹配:根据应用签名库对报文的应用数据进行处理,如果应用数据中含有应用签名库中的签名,则更新流状态项中的应用类型,并输出该网络数据流的流信息和应用类型。
CNB2007101795364A 2007-12-14 2007-12-14 基于报文采样和应用签名的互联网应用流量识别方法 Expired - Fee Related CN100553206C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007101795364A CN100553206C (zh) 2007-12-14 2007-12-14 基于报文采样和应用签名的互联网应用流量识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007101795364A CN100553206C (zh) 2007-12-14 2007-12-14 基于报文采样和应用签名的互联网应用流量识别方法

Publications (2)

Publication Number Publication Date
CN101184000A CN101184000A (zh) 2008-05-21
CN100553206C true CN100553206C (zh) 2009-10-21

Family

ID=39449094

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007101795364A Expired - Fee Related CN100553206C (zh) 2007-12-14 2007-12-14 基于报文采样和应用签名的互联网应用流量识别方法

Country Status (1)

Country Link
CN (1) CN100553206C (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8681786B2 (en) * 2010-02-08 2014-03-25 Via Telecom Co., Ltd. Centralized recording and processing of received packet parameters
CN101814977B (zh) * 2010-04-22 2012-11-21 北京邮电大学 利用数据流头部特征的tcp流量在线识别方法及装置
CN102006588B (zh) * 2010-12-28 2013-03-20 北京安天电子设备有限公司 智能手机网络行为监控的方法和系统
CN102143085B (zh) * 2011-04-27 2014-07-16 北京网御星云信息技术有限公司 一种多维度网络态势感知的方法、设备及系统
CN102209032A (zh) * 2011-05-24 2011-10-05 北京网康科技有限公司 一种用户自定义的应用识别方法及其设备
CN102195816B (zh) * 2011-05-24 2014-08-20 北京网康科技有限公司 一种未识别流量信息反馈的方法及其设备
CN102387157B (zh) * 2011-12-02 2014-12-24 杭州华三通信技术有限公司 一种数据传输方法和设备
CN103618792B (zh) * 2013-11-29 2017-04-19 华为技术有限公司 数据流的识别方法及设备
CN105763390A (zh) * 2014-12-16 2016-07-13 中兴通讯股份有限公司 一种网络异常流量的检测和控制方法、装置和系统
US10250466B2 (en) * 2016-03-29 2019-04-02 Juniper Networks, Inc. Application signature generation and distribution
CN106021616A (zh) * 2016-07-12 2016-10-12 圣普络网络科技(苏州)有限公司 签名特征捕捉系统及方法
CN107787003A (zh) * 2016-08-24 2018-03-09 中兴通讯股份有限公司 一种流量检测的方法和装置
CN108282414B (zh) * 2017-12-29 2020-05-29 网宿科技股份有限公司 一种数据流的引导方法、服务器和系统

Also Published As

Publication number Publication date
CN101184000A (zh) 2008-05-21

Similar Documents

Publication Publication Date Title
CN100553206C (zh) 基于报文采样和应用签名的互联网应用流量识别方法
EP2434689B1 (en) Method and apparatus for detecting message
CN101729389B (zh) 基于流量预测和可信网络地址学习的流量控制装置和方法
US8964548B1 (en) System and method for determining network application signatures using flow payloads
CN106921637A (zh) 网络流量中的应用信息的识别方法和装置
KR100997182B1 (ko) 플로우 정보 제한장치 및 방법
CN103139315A (zh) 一种适用于家庭网关的应用层协议解析方法
CN103428224A (zh) 一种智能防御DDoS攻击的方法和装置
CN101714952A (zh) 一种接入网的流量识别方法和装置
CN102724317A (zh) 一种网络数据流量分类方法和装置
CN103997489A (zh) 一种识别DDoS僵尸网络通信协议的方法及装置
CN112019449B (zh) 流量识别抓包方法和装置
CN109587156A (zh) 异常网络访问连接识别与阻断方法、系统、介质和设备
CN104333483A (zh) 互联网应用流量识别方法、系统及识别装置
CN105359472A (zh) 一种用于OpenFlow网络的数据处理方法和装置
US9100326B1 (en) Automatic parsing of text-based application protocols using network traffic data
CN104333461A (zh) 互联网应用流量识别方法、系统及识别装置
CN100493001C (zh) G比特流率下多粒度的网络自动聚类方法
JP2020022133A (ja) 感染拡大攻撃検知装置、攻撃元特定方法及びプログラム
CN115514720B (zh) 一种面向可编程数据平面的用户活动分类方法及应用
CN116170227A (zh) 一种流量异常的检测方法、装置、电子设备及存储介质
Angevine et al. A preliminary investigation of Skype traffic classification using a minimalist feature set
Li et al. Composite lightweight traffic classification system for network management
Cao et al. Online identification of applications using statistical behavior analysis
Yang et al. DDoS attacks detection and traceback method based on flow entropy algorithm and MPLS principle

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091021

Termination date: 20121214