CN102340454B - 一种VoIP网络数据流的通用识别方法 - Google Patents

一种VoIP网络数据流的通用识别方法 Download PDF

Info

Publication number
CN102340454B
CN102340454B CN201110353267.5A CN201110353267A CN102340454B CN 102340454 B CN102340454 B CN 102340454B CN 201110353267 A CN201110353267 A CN 201110353267A CN 102340454 B CN102340454 B CN 102340454B
Authority
CN
China
Prior art keywords
std
count
packet
reference value
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110353267.5A
Other languages
English (en)
Other versions
CN102340454A (zh
Inventor
李常春
谭建明
黄鹂声
王康年
杨琳
朱行涛
蒋邦持
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Communication College of China PLA
Original Assignee
Chongqing Communication College of China PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Communication College of China PLA filed Critical Chongqing Communication College of China PLA
Priority to CN201110353267.5A priority Critical patent/CN102340454B/zh
Publication of CN102340454A publication Critical patent/CN102340454A/zh
Application granted granted Critical
Publication of CN102340454B publication Critical patent/CN102340454B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种VoIP网络数据流的通用识别技术,属于计算机网络管理领域,特别是涉及对未知流媒体协议的VoIP数据流的识别技术。主要内容包括捕获网络流量,对其中的UDP数据包进行分析,如果UDP数据在考察范围内,就对数据流进行跟踪分析,统计出特征表现分值,即数据流的匀速性特征值和有效载荷长度固定性特征值,对其进行相应的计算,判定它是否属于VoIP数据流。本发明很好的解决了VoIP数据流识别准确度低、效率不高和流媒体私有协议识别困难等问题,极大提高对VoIP数据流识别的准确性、可靠性和有效性。

Description

一种VoIP网络数据流的通用识别方法
技术领域
本发明属于计算机网络领域,特别是涉及计算机网络中未知流媒体协议的VoIP数据流的识别技术。
背景技术
网络数据流识别是网络测量的主要手段。随着网络流媒体技术发展,IP电话日益普及,互联网中出现大量携带语音数据的IP数据包(VoIP数据包),这些数据包统称为VoIP数据流。出于网络管理需要,对这部分数据包进行流量分析和处理。
VoIP(Voice over Internet Protocol)以IP为网络层协议,利用Internet为传输载体实现语音信号传送,已形成一种新型电信业务。它实现了PC对PC、PC对电话、电话对电话的连接。VoIP基本原理是对语音数据进行压缩编码处理,然后把这些语音数据按IP等相关协议进行打包,由IP网络负责把数据包传输到接收地,再经过解码解压处理后,恢复成原来的语音信号,达到由IP网络传送语音的目的。
现有VoIP网络数据流识别方法,从技术手段上可以划分为3类,第1类为传输层端口分析法,通过观察IP数据包中应用层协议端口号来识别流量类型,这种方法简单,开销很小,易实现,最大的缺点是不准确;第2类是特征流量识别法,根据不同应用表现出不同特征来识别数据包所对应的业务,存在的问题是扩展性差,它需要通过大量的事前分析来确定排它的特征;第3类是协议流程分析法,依据构成一次应用中多个会话之间的联系,从控制会话中提取动态会话信息,依据这些信息来识别该应用涉及的动态会话,此方法对流媒体协议识别困难,不能识别协议关键字。
本发明依据VoIP多媒体数据在网络传输过程中的码流大小和VoIP应用的实时性和均匀性特征,采用统计的方法,能够在不分析封装格式、不检测应用层流媒体协议的情况下,实现对VoIP数据流的识别。
发明内容
本发明的目的是为了解决现有VoIP网络数据流识别方法的准确度低、效率不高和流媒体私有协议识别困难等问题,提供一种VoIP网络数据流通用识别方法,可直接应用于VoIP网络管理,提高VoIP网络QoS要求。
VoIP应用与网络中其它应用业务相比,具有两个突出特点,一是实时性,在通话过程中,发送方必须不停地向接收方发送数据包,以保证语音信号不会中断;二是均匀性,在通话过程中,发送方向接收方发出的语音数据是基本均匀分布的,即语音数据在压缩后的封装大小、频率是基本均匀的。
VoIP应用特点使得在网络中传输的VoIP数据流表现出相应特征,一是持续匀速性,即发送方向接收方发送数据包时,持续不断发送,而且单位时间内发送方发送的数据包数量相对稳定,不会出现较大波动。这一特征为识别VoIP流提供了一个有力依据。二是长度固定性,即数据包中的有效载荷长度基本固定,不论发送方采取的是何种协议类型,对于同一次会话的数据包,采取的报文封装方法、封装大小是基本一致的,即报文中携带的有效载荷长度基本一致。对截取到的数据包进行分析,将IP包长度减去IP首部长度和UDP首部长度,得出报文的有效载荷长度。通过对网络数据流这两个特征进行识别,从网络流中有效地区分出VoIP数据流。
本发明所涉及的VoIP数据流通用识别方法,很好的解决了VoIP数据流识别准确度低、效率不高和流媒体私有协议识别困难等问题,极大提高对VoIP数据流识别的准确性、可靠性和有效性。
具体实施方式
本发明通过对监控范围的UDP数据包进行统计分析,得出以上两个特征的流量表现分值和总表现分值,判断该流量是否属于VoIP流量,具体步骤如下:
1)捕获网络流量,对其中的UDP数据包进行分析。
对收到的UDP数据包进行统计,统计在监控时间段内具有相同IP源地址、IP目的地址、源端口和目的端口的数据包,将符合这些条件的数据流列入待考察流量。
2)对已在待考察范围的网络流进行跟踪。
对捕获到的数据包以网络流为单位进行跟踪和分析。网络流定义为:在同一组特定源地址和目标地址、源端口和目的端口之间传输的有固定协议类型的数据包的集合。该步骤对每个UDP数据包进行分析,获取其如下信息:源IP地址、目的IP地址、源端口和目的端口,以及IP报文总长度、IP首部长度、UDP首部长度和接收到报文的时间。将所有源IP地址、目的IP地址、源端口和目的端口都相同的UDP数据包看做同一个网络流进行处理。如果2个UDP数据包具有相同的源IP地址、目的IP地址、源端口和目的端口,则该2个数据包属于同一网络流。将网络流定义为FLOW,将同一网络流中的数据包个数定义为N。将同一网络流中的各个数据包按照捕获的先后顺序依次定义为P1、P2、...PN,将这N个数据包的捕获时刻依次定义为TS1、TS2、...TSN,将这N个数据包的长度分别定义为L1、L2、...LN
3)对每个网络流的数据包进行分析,得出各特征参数的数值。
为每个网络流定义2个特征参数:参数1为流的匀速性特征参数SPEED,参数2为有效载荷长度固定性特征参数PAYLEN。
各个特征的分析方法和计算公式如下:
a.流的匀速性特征参数SPEED
对于一个网络流FLOW,定义任意两个数据包Pi和Pi+1之间的时间间隔为Di=TSi+1-TSi,则数据包P1、P2、...PN之间的时间间隔可分别定义为D1、D2、...DN-1,将D1、D2、...DN-1的平均值定义为Davg,以毫秒(ms)为计量单位,定义振动区间RANGE={Dmin,Dmax},其中Dmin=Davg×0.8-30ms,Dmax=Davg×1.2+30ms,然后对D1、D2、...DN-1依次进行检查,如果Dmin<Di<Dmax,则Di在振动区间RANGE内;将D1、D2、...DN-1中所有在RANGE内的Di进行统计计数,可获得计数值M,即:在D1、D2、...DN-1中存在M个成员,这M个成员均在振动区间RANGE内,则SPEED参数的计算方法为:
b.有效载荷长度固定性特征参数PAYLEN
为每个网络流定义3个有效载荷长度基准值STD1、STD2和STD3,以字节(Byte)为单位,初始值均为0;同时设置3个相应的计数器COUNT1、COUNT2和COUNT3,分别记录与上述3个基准值长度接近的数据包数量,初始值也均为0。如果某个数据包Pi的有效载荷长度Li接近于某个基准值STD1,则相应的计数器COUNT1加1。
判断数据包Pi的有效载荷长度Li是否接近于某个基准值STD1、STD2或STD3的方法为:如果STD1-10bytes<Li<STD1+10bytes,则Li接近于基准值STD1,反之,Li与基准值STD1不接近。判断Li是否接近于基准值STD2或STD3的方法与上述方法一致。
根据基准值计算PAYLEN参数的算法过程为:
<1>从L1,L2,...LN中依次取出下一个成员Li
<2>检查基准值STD1是否为0,如果为0,则STD1=Li,COUNT1=1,回到第<1>步;否则进入第<3>步。
<3>如果STD1>0,则判断Li是否接近于基准值STD1,如果接近,则COUNT1=COUNT1+1,回到第<1>步;否则进入第<4>步。
<4>如果Li与基准值STD1不接近,则检查基准值STD2是否为0,如果为0,则STD2=Li,COUNT2=1,回到第<1>步;否则进入第<5>步。
<5>如果STD2>0,则判断Li是否接近于基准值STD2,如果接近,则COUNT2=COUNT2+1,回到第<1>步;否则进入第<6>步。
<6>如果Li与基准值STD2不接近,则检查基准值STD3是否为0,如果为0,则STD3=Li,COUNT3=1,回到第<1>步;否则进入第<7>步。
<7>如果STD3>0,则判断Li是否接近于基准值STD3,如果接近,则COUNT3=COUNT3+1,回到第<1>步;否则也进入第<1>步。
经过以上步骤,确定了三个基准值STD1、STD2和STD3,并且对长度接近于上述三个基准值的数据包数量进行了统计,分别得到了COUNT1、COUNT2和COUNT3
当N个数据包的长度均被分析完成后,PAYLEN参数可通过以下公式进行计算:
4)VoIP会话判定。
针对每个网络流,均获得以上2个特征参数SPEED和PAYLEN的值,如果上述两个特征参数值均大于85,且SPEED和PAYLEN的值相加的总和大于180,则判定该网络流为VoIP数据流。

Claims (1)

1.一种VoIP网络数据流通用识别方法,其特征在于,它由以下步骤实现:
第一步:捕获网络流量,对其中的UDP数据包进行分析,提取在监控时间段内具有相同IP源地址、IP目的地址、源端口和目的端口的数据包,将符合这些条件的数据包列入待考察流量;
第二步:对捕获到的数据包以网络流为单位进行跟踪和分析,该步骤对每个UDP数据包进行分析,获取其如下信息:源IP地址、目的IP地址、源端口和目的端口,以及IP报文总长度、IP首部长度、UDP首部长度、接收到报文的时间,将所有源IP地址、目的IP地址、源端口和目的端口都相同的UDP数据包视为同一个网络流进行处理,如果2个UDP数据包具有相同的源IP地址、目的IP地址、源端口和目的端口,则这2个数据包属于同一网络流,并定义该网络流为FLOW;将同一网络流中的数据包个数定义为N,将同一网络流中的各个数据包按照捕获的先后顺序依次定义为P1、P2、...PN,将这N个数据包的捕获时刻依次定义为TS1、TS2、...TSN,将这N个数据包的长度分别定义为L1、L2、...LN
第三步:对每个网络流的数据包进行分析,得到匀速性特征参数SPEED和有效载荷长度固定性特征参数PAYLEN的数值;
特征参数SPEED和PAYLEN的分析方法和计算公式如下:
(1)流的匀速性特征参数SPEED数值
对于一个网络流FLOW,定义任意两个数据包Pi和Pi+1之间的时间间隔为Di=TSi+1-TSi,则数据包P1、P2、...PN之间的时间间隔可分别定义为D1、D2、...DN-1,将D1、D2、...DN-1的平均值定义为Davg,以毫秒(ms)为计量单位,定义振动区间RANGE={Dmin,Dmax),其中Dmin=Davg×0.8-30ms,Dmax=Davg×1.2+30ms,然后对D1、D2、...DN-1依次进行检查,如果Dmin<Di<Dmax,则Di在振动区间RANGE内;将D1、D2、...DN-1中所有在RANGE内的Di进行统计计数,可获得计数值M,即:在D1、D2、...DN-1中存在M个成员,这M个成员均在振动区间RANGE内,则SPEED参数的计算方法为:
<mrow> <mi>S</mi> <mi>P</mi> <mi>E</mi> <mi>E</mi> <mi>D</mi> <mo>=</mo> <mfrac> <mi>M</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mfrac> <mo>&amp;times;</mo> <mn>100</mn> </mrow>
(2)有效载荷长度固定性特征参数PAYLEN数值
为每个网络流定义3个有效载荷长度基准值STD1、STD2和STD3,以字节(Byte)为单位,初始值均为0;同时设置3个相应的计数器COUNT1、COUNT2和COUNT3,分别记录与上述3个基准值长度接近的数据包数量,初始值也均为0,根据基准值计算PAYLEN参数的算法过程为:
<1>从L1,L2,...LN中依次取出下一个成员Li
<2>检查基准值STD1是否为0,如果为0,则STD1=Li,COUNT1=1,回到第<1>步,否则进入第<3>步;
<3>如果STD1>0,则判断Li是否接近于基准值STD1,如果接近,则COUNT1=COUNT1+1,回到第<1>步;否则进入第<4>步;
<4>如果Li与基准值STD1不接近,则检查基准值STD2是否为0,如果为0,则STD2=Li,COUNT2=1,回到第<1>步;否则进入第<5>步;
<5>如果STD2>0,则判断Li是否接近于基准值STD2,如果接近,则COUNT2=COUNT2+1,回到第<1>步;否则进入第<6>步;
<6>如果Li与基准值STD2不接近,则检查基准值STD3是否为0,如果为0,则STD3=Li,COUNT3=1,回到第<1>步;否则进入第<7>步;
<7>如果STD3>0,则判断Li是否接近于基准值STD3,如果接近,则COUNT3=COUNT3+1,回到第<1>步;否则也进入第<1>步;
上述步骤中,判断数据包Pi的有效载荷长度Li是否接近于某个基准值STD1、STD2或STD3的方法为:如果STD1-10bytes<Li<STD1+10bytes,则Li接近于基准值STD1,反之,Li与基准值STD1不接近;判断Li是否接近于基准值STD2或STD3的方法与上述方法一致;
经过以上步骤,确定三个基准值STD1、STD2和STD3,并且对长度接近上述三个基准值的数据包数量进行统计,分别得到了COUNT1、COUNT2和COUNT3,当N个数据包的长度均被分析完成后,PAYLEN参数通过公式进行计算;
第四步:进行VoIP数据流判定;
针对每个网络流,均获得以上2个特征参数SPEED和PAYLEN的值,如果上述两个特征参数值均大于85,且SPEED和PAYLEN的值相加的总和大于180,则判定该网络流为VoIP数据流。
CN201110353267.5A 2011-11-10 2011-11-10 一种VoIP网络数据流的通用识别方法 Expired - Fee Related CN102340454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110353267.5A CN102340454B (zh) 2011-11-10 2011-11-10 一种VoIP网络数据流的通用识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110353267.5A CN102340454B (zh) 2011-11-10 2011-11-10 一种VoIP网络数据流的通用识别方法

Publications (2)

Publication Number Publication Date
CN102340454A CN102340454A (zh) 2012-02-01
CN102340454B true CN102340454B (zh) 2017-10-31

Family

ID=45515960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110353267.5A Expired - Fee Related CN102340454B (zh) 2011-11-10 2011-11-10 一种VoIP网络数据流的通用识别方法

Country Status (1)

Country Link
CN (1) CN102340454B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110990603B (zh) * 2012-08-21 2024-02-27 Emc 公司 用于分段图像数据的格式识别的方法和系统
CN102904822A (zh) * 2012-10-22 2013-01-30 西安交通大学 VoIP网络流量的层次化识别方法
CN110034976B (zh) * 2019-04-08 2021-06-15 Oppo广东移动通信有限公司 一种数据识别的方法及装置
CN110225213B (zh) * 2019-06-17 2020-08-25 华为技术有限公司 一种语音通话场景的识别方法以及音频策略服务端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838663A (zh) * 2005-03-22 2006-09-27 华为技术有限公司 在IP网络中检测VoIP应用的实现方法
CN101170460A (zh) * 2007-11-27 2008-04-30 中兴通讯股份有限公司 一种网络电话业务监控系统和方法
CN101674192A (zh) * 2009-09-22 2010-03-17 天津大学 一种基于流量统计的VoIP识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785296B1 (ko) * 2005-07-21 2007-12-12 삼성전자주식회사 Voip 게이트웨이에 있어서 데이터 전송 제어 장치 및그 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838663A (zh) * 2005-03-22 2006-09-27 华为技术有限公司 在IP网络中检测VoIP应用的实现方法
CN101170460A (zh) * 2007-11-27 2008-04-30 中兴通讯股份有限公司 一种网络电话业务监控系统和方法
CN101674192A (zh) * 2009-09-22 2010-03-17 天津大学 一种基于流量统计的VoIP识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《VoIP和P2P IPTV流量的识别与测量研究》;李冰;《中国博士学位论文全文数据库 信息科技辑》;20111015(第10期);全文 *
《一种实时检测基于UDP的Skype语音流的算法》;孙瑞锦 等;《解放军理工大学学报(自然科学版)》;20081031;第9卷(第5期);第2.1、3.1节 *
《基于对称分段流量统计特征的VoIP流量识别》;鄢汉科;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110315(第3期);第2.5.3、3.1.2、3.4、5.2.1节 *

Also Published As

Publication number Publication date
CN102340454A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
US8090820B2 (en) Distributed traffic analysis
CN101874384B (zh) 用于从在高速网际协议(ip)通信链路上传递的网络业务中收集数据的方法、系统和计算机可读介质
CN101667890A (zh) 一种网络带宽的检测方法和系统
US8102879B2 (en) Application layer metrics monitoring
CN103763154B (zh) 一种网络流量检测方法
CN102340454B (zh) 一种VoIP网络数据流的通用识别方法
CN104283699A (zh) 业务类型确定方法和装置
CN103139315A (zh) 一种适用于家庭网关的应用层协议解析方法
CN101160823A (zh) 一种网络性能的监测方法、设备及系统
CN103188119A (zh) 通信网络中关键性能指标的置信区间
CN101562534A (zh) 一种网络行为分析系统
CN102223260A (zh) 测试iptv视频数据流传输质量的方法、系统及装置
CN101150763A (zh) 一种测试WiMAX网络实时传输业务性能的终端和方法
CN100466560C (zh) 服务质量检测方法、系统、装置、及计费和故障测试系统
CN110138610A (zh) 一种业务报文的发送方法及装置
CN106713063A (zh) VoIP网络丢包故障检测的方法
CN107172662A (zh) 一种通信方法及装置
CN103973591A (zh) 一种智能网络流量拥塞解决方法
KR100936236B1 (ko) SIP/RTP를 이용하는 VoIP 음성 트래픽의 서비스품질 메트릭 모니터링 장치 및 방법
CN101447934B (zh) 一种业务流识别方法和系统以及业务流计费方法和系统
CN105657374B (zh) 一种自适应多网络链路实时视频传输控制系统
CN110248379A (zh) 无线局域网中基站的性能测试方法及装置
CN100454834C (zh) Ngn网络中媒体流的统计方法
JP3725462B2 (ja) Ipトラヒックの測定、監視、制御、管理、予測、または、設計の方法及び装置
Soos et al. Analyzing group behavior patterns in a cellular mobile network for 5G use‐cases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Chongqing Communication College of the China PLA

Document name: Notification to Pay the Fees

DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Chongqing Communication College of the China PLA

Document name: Notification of Termination of Patent Right

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171031

Termination date: 20181110