CN101465759A - 一种基于对数坐标平均筛选的网络流量参数估计方法 - Google Patents

一种基于对数坐标平均筛选的网络流量参数估计方法 Download PDF

Info

Publication number
CN101465759A
CN101465759A CNA2009100605501A CN200910060550A CN101465759A CN 101465759 A CN101465759 A CN 101465759A CN A2009100605501 A CNA2009100605501 A CN A2009100605501A CN 200910060550 A CN200910060550 A CN 200910060550A CN 101465759 A CN101465759 A CN 101465759A
Authority
CN
China
Prior art keywords
sample point
centerdot
match
data
network traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100605501A
Other languages
English (en)
Other versions
CN101465759B (zh
Inventor
喻莉
刘祖浩
赵博
赵佳
李静茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN2009100605501A priority Critical patent/CN101465759B/zh
Publication of CN101465759A publication Critical patent/CN101465759A/zh
Application granted granted Critical
Publication of CN101465759B publication Critical patent/CN101465759B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

针对传统R/S方法的计算复杂性和在对数坐标下拟合时的尾部数据对结果影响过大的特点,本发明提出了一种基于对数坐标平均筛选的网络流量参数估计方法。该方法通过使筛选的数据在对数坐标下尽量均匀的分布,削弱尾部数据的影响,并适当减少参与拟合的点的数目,从而在不影响拟合效果的前提下提高了计算效率。经过大量的实验验证,该方法不仅有效克服了原有R/S方法估计网络流量参数的精度低,稳定性差的缺点,而且降低了其计算量,能应用于实际网络流量的网络流量参数估计,对自相似网络流量模型的研究和应用有重要作用。

Description

一种基于对数坐标平均筛选的网络流量参数估计方法
技术领域
本发明属于计算机网络技术领域,涉及自相似网络流量领域中网络流量参数估计方法,能直接应用于实际网络中,实时准确估计网络流量的自相似(Hurst)参数。
背景技术
20世纪90年代初,W.E.Leland等人首次发现网络流量具有自相似特性。自相似性质是网络流量本质特性之一,它揭示了网络流量复杂的行为:网络流量在任何时间尺度下都是极度无规则的。也就是说,这种不规则性不仅表现为流量强度大幅度的波动,同时这种波动在长时间内持续相关。网络流量的自相似性质是传统网络流量分析中广泛应用的基于分析流量马尔可夫性的泊松模型无法描述的。当时间尺度增大时,泊松流量将趋于平滑,不规则性消失。将这种传统泊松模型应用于现代通信网络中,可能会从本质上对网络性能指标的估计,如延时,丢包率等,产生偏差。
自相似又称为单分形(monofractal),是Mandelbrot在上世纪60年代首先提出的。自相似过程在不同尺度下统计特性保持不变。在数学上,过程X(t)是自相似,则:
X ( t ) = d c - H X ( ct ) , ∀ t ≥ 0 , ∀ c > 0 - - - ( 1 )
其中H参数称为Hurst(自相似)参数。H参数是自相似特性的度量。H参数在自相似网络流量模型,如FBM,FARIMA,LFSN模型中起着核心作用,它体现了网络流量的自相似特性。H参数估计是网络流量自相似建模的关键步骤,如何准确、快速地从网络流量中提取H参数是网络流量自相似模型需要解决的重要问题。
在Hurst参数的估计方法中,R/S方法是最早也是最常用的方法,且具有很强的实用性和估计准确性。通过R/S方法计算序列的Hurst参数,首先要计算样本均值
Figure A200910060550D0004093704QIETU
和样本方差S2(n),并定义一个调节尺度统计量(Rescaledadjusted range statistic,or R/S statistic)为
R ( n ) / S ( n ) = max ( 0 , W 1 , W 2 , · · · W n ) - min ( 0 , W 1 , W 2 , · · · W n ) S ( n ) - - - ( 2 )
其中
Wk=(X1+X2+…+Xk)-kX(n),1≤k≤n    (3)
然后利用关系:
E[R(n)/S(n)]→cnH,n→∞           (4)
对原始数据作出log(R(n)/S(n))对log(n)的样本图,然后对样本点使用最小二乘估计,斜率即为Hurst参数H。
R/S方法虽然具有很多优点,但该算法复杂度高,缺乏稳定性,不适于对网络流量H参数进行准确,快速的估计,这便使改进R/S方法成为一种必要。
发明内容
本发明的目的是提供一种基于对数坐标平均筛选数据点的网络流量参数估计方法,该方法可以提高网络流量参数估计中R/S方法的计算效率,降低其复杂度,并使其计算结果更加稳定。
为达到以上目的,本发明提供的基于对数坐标平均筛选的网络流量参数估计方法,其步骤包括:
步骤(1)在网络路由器节点上分别采集N个测量时间单位内的网络流量数据,作为原始样本点;
步骤(2)在原始样本点中选取第一个参与拟合的拟合样本点,设该拟合样本点在原始样本点中的序号为k,k<N,则该拟合样本点在对数坐标中的横坐标为ln(k);
步骤(3)记录当前拟合样本点在原始样本点中的序号为h,即h=k;
步骤(4)令k=k+1,如果k>N,则筛选过程结束,跳至步骤(6),否则进入步骤(5);
步骤(5)判断ln(k)-ln(h)是否大于用户设定的筛选尺度值t,如果是,则将其筛选出来,并跳至步骤(3);如果不是,则将其摒弃,并跳至步骤(4);
步骤(6)利用公式(I)和(II),对筛选后的数据作出ln(R(n)/S(n))对1n(n)的样本图,其中n为各拟合样本点在原始样本点中的序号,然后对各拟合样本点进行线性拟合,拟合后直线的斜率即为Hurst参数;
R ( n ) / S ( n ) = max ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) - min ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) S ( n ) - - - ( I )
Wi=(X1+X2+…+Xi)-iX(n),i=1,…,n    (II)
公式(II)中的Xk为第k个原始样本点的数据,
Figure A200910060550D0005093440QIETU
为前n个原始样本点数据的均值。
通过深入分析R/S方法的机制原理以及计算过程,发现导致该算法在复杂度上存在瓶颈的原理,本发明提出了上述一种基于对数坐标平均筛选的改进策略。与传统的R/S方法相比,本发明方法在准确性几乎不变的情况下,很大程度的降低了计算复杂度,使复杂度从平方级优化到O(nlog(n)),另外,通过试验仿真还发现,改进后的方法比原方法更加稳定,对同一网络不同时刻的数据进行Hurst参数估计时波动更小,其原因在于降低了尾部数据对结果的影响。所以本发明能适应复杂的网络环境而应用于实际网络中对网络流量参数进行准确估计。
附图说明
图1为本发明自相似网络流量参数估计方法的流程图。
图2为网络流量示意图。
图3为参与拟合的样本点的拟合结果示意图。
具体实施方式
本发明提出一种筛选数据点的策略,即在不影响计算结果的条件下,将多余的数据点剔除,以达到提高计算速度的目的。在实现R/S方法的具体步骤中发现,由于n是线性增长的,而转化成对数坐标后后面的数据点较前面的数据点要密集很多,这样的话存在几个问题:1.使用最小二乘法拟合的话,后面的数据点较多,则n较大的数据点会对结果造成很大的影响;2.当n较大时,数据点过于密集,且相邻的点基本重合,增加了过多的不必要的计算。
由于log(R(n)/S(n))对log(n)的线性性比较好,所以适当的筛选掉一些数据对结果并不会造成明显的影响。本发明提供的基于对数坐标平均筛选的网络流量参数估计方法,在原始样本点中选取部分样本点,使最后参加拟和的点在对数坐标上尽量均匀的分布。
如图1所示,本发明方法具体包括下述步骤:
步骤(1):在网络路由器节点上分别采集N个测量时间单位(如秒,十分之一秒,百分之一秒等)内的网络流量数据,单位为byte,作为原始样本点。所采集的长度为N的网络流量序列作为进行自相似参数估计的对象。为保证能正确的估算出网络流量的自相似参数,N的取值通常不少于1万,如N=10万。
步骤(2):在原始样本点中选取第一个参与拟合的拟合样本点,设该拟合样本点在原始样本点中的序号为k,k<N,则该拟合样本点在对数坐标中的横坐标为ln(k);(为了保证R和S的有效性,最好不从第一个样本点开始拟合,通常40<k<N,如可以将k的值设为50)。
步骤(3):记录当前拟合样本点在原始样本点中的序号为h,即h=k。
步骤(4):令k=k+1,如果k>N,则筛选过程结束,跳至步骤(6),否则进入步骤(5)。
步骤(5):判断ln(k)-ln(h)是否大于筛选尺度值t,如果是,则将其筛选出来,并跳至步骤(4);如果不是,则将其摒弃,并跳至步骤(5)。
筛选尺寸t的物理含义为:对数坐标轴上两个相邻的参与拟合的拟合样本点横坐标之差的最小值。这个值由用户确定,它决定了筛选的尺度,t越小,则从原始样本点中筛选入拟合样本点的数目也就越多。t的经验取值为:0.01~0.05。
步骤(6)利用公式(I)和(II),对筛选后的数据作出ln(R(n)/S(n))对ln(n)的样本图,其中n为各拟合样本点在原始样本点中的序号,然后对各拟合样本点进行线性拟合,拟合后直线的斜率即为Hurst参数;
R ( n ) / S ( n ) = max ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) - min ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) S ( n ) - - - ( I )
Wi=(X1+X2+…+Xi)-iX(n),i=1,…,n    (II)
公式(II)中的Xk为第k个原始样本点的数据,X(n)为前n个原始样本点数据的均值。
实例:
对BC-Oct89Ext.TL网络数据进行以秒为单位的提取,结果如图2所示。
取第一个样本点的序号为50,另t=0.05,对样本点进行筛选,最后筛选出来的点的拟合结果如图3所示。求的Hurst参数值为0.7366。
使用两种R/S方法进Hurst参数估计的比较。在Oct89Ext.TL样本集中针对不同的样本点个数分别取30组数据进行了反复实验。改进前后的实验结果比较如下:
Figure A200910060550D00081
通过上述两种数据的试验,可以发现通过数据筛选后的改进方法既可以达到原R/S方法的准确率,又在计算速度上有较大的提高,而且它比上述两种方法更稳定,对同一种网络流量数据进行估计时波动更小。
本发明不仅局限于上述具体实施方式,本领域一般技术人员根据本发明公开的内容,可以采用其它多种具体实施方式实施本发明,因此,凡是采用本发明的设计结构和思路,做一些简单的变化或更改的设计,都落入本发明保护的范围。

Claims (1)

1、一种基于对数坐标平均筛选的网络流量参数估计方法,其步骤包括:
步骤(1)在网络路由器节点上分别采集N个测量时间单位内的网络流量数据,作为原始样本点;
步骤(2)在原始样本点中选取第一个参与拟合的拟合样本点,设该拟合样本点在原始样本点中的序号为k,k<N,则该拟合样本点在对数坐标中的横坐标为ln(k);
步骤(3)记录当前拟合样本点在原始样本点中的序号为h,即h=k;
步骤(4)令k=k+1,如果k>N,则筛选过程结束,跳至步骤(6),否则进入步骤(5);
步骤(5)判断ln(k)-ln(h)是否大于用户设定的筛选尺度值t,如果是,则将其筛选出来,并跳至步骤(3);如果不是,则将其摒弃,并跳至步骤(4);
步骤(6)利用公式(I)和(II),对筛选后的数据作出ln(R(n)/S(n))对ln(n)的样本图,其中n为各拟合样本点在原始样本点中的序号,然后对各拟合样本点进行线性拟合,拟合后直线的斜率即为Hurst参数;
R ( n ) / S ( n ) = max ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) - min ( 0 , W 1 , W 2 , &CenterDot; &CenterDot; &CenterDot; W n ) S ( n ) - - - ( I )
W i = ( X 1 + X 2 + &CenterDot; &CenterDot; &CenterDot; + X i ) - i X ( n ) &OverBar; , i = 1 , &CenterDot; &CenterDot; &CenterDot; n - - - ( II )
公式(II)中的Xk为第k个原始样本点的数据,为前n个原始样本点数据的均值。
CN2009100605501A 2009-01-16 2009-01-16 一种基于对数坐标平均筛选的网络流量参数估计方法 Expired - Fee Related CN101465759B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100605501A CN101465759B (zh) 2009-01-16 2009-01-16 一种基于对数坐标平均筛选的网络流量参数估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100605501A CN101465759B (zh) 2009-01-16 2009-01-16 一种基于对数坐标平均筛选的网络流量参数估计方法

Publications (2)

Publication Number Publication Date
CN101465759A true CN101465759A (zh) 2009-06-24
CN101465759B CN101465759B (zh) 2011-04-20

Family

ID=40806134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100605501A Expired - Fee Related CN101465759B (zh) 2009-01-16 2009-01-16 一种基于对数坐标平均筛选的网络流量参数估计方法

Country Status (1)

Country Link
CN (1) CN101465759B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986607A (zh) * 2010-11-30 2011-03-16 东南大学 基于随机抽样报文流长分布的流量流数推断方法
CN104469795A (zh) * 2014-11-10 2015-03-25 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986607A (zh) * 2010-11-30 2011-03-16 东南大学 基于随机抽样报文流长分布的流量流数推断方法
CN101986607B (zh) * 2010-11-30 2014-04-16 东南大学 基于随机抽样报文流长分布的流量流数推断方法
CN104469795A (zh) * 2014-11-10 2015-03-25 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法
CN104469795B (zh) * 2014-11-10 2019-07-12 上海交通大学 基于领域搜索的FARIMA模型Hurst参数估计方法

Also Published As

Publication number Publication date
CN101465759B (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN106781486B (zh) 基于浮动车数据的交通状态评价方法
CN104502905B (zh) 基于多通道顺序统计的距离扩展目标检测方法
CN108596678A (zh) 一种航空公司旅客价值计算方法
CN105717556B (zh) 一种基于大数据的自分型雷达估测降水方法
CN110137947B (zh) 一种基于itic曲线的电网电压暂降严重程度评估方法
CN101465759B (zh) 一种基于对数坐标平均筛选的网络流量参数估计方法
CN113496440B (zh) 一种用户异常用电检测方法及系统
CN101426212B (zh) 基于信道测量进行噪底和信号分量门限估计方法及其装置
CN104246713A (zh) 利用者体感品质推测装置、终端瓶颈判定装置、类似操作抽出装置及方法以及程序
CN101697172A (zh) 一种水文频率线型参数估计方法
CN103117823B (zh) 一种短波信道模型建模方法
CN105748067A (zh) 一种基于随机梯度自适应滤波的诱发脑电提取方法
CN109840311B (zh) 基于最优观测时间窗口的耦合数据同化与参数优化方法
CN101335567A (zh) 超宽带非相干系统的平均误码率在IEEE802.15.3a的S-V修正模型衰落信道下的评估方法
CN109818811B (zh) 一种识别分配类及混合类mac协议的方法
CN106443760A (zh) 一种闪烁脉冲简化模型、重建及能量获取的方法
CN108170951B (zh) 基于采样数据时空匹配示踪试验的纵向离散系数确定方法
CN104464747B (zh) 分段处理机载选择呼叫系统选呼信号的解码方法
CN101478457B (zh) 一种网络流量自相似参数估计方法
CN115471079A (zh) 一种基于数据分析的建筑工地施工人员管理系统
Fras et al. Estimating the parameters of measured self similar traffic for modeling in OPNET
CN113676272B (zh) 一种基于正向通信数据的短波干扰信号到达功率评估方法
CN110110287A (zh) 一种概率盒灵敏度分析方法
CN112328969B (zh) 基于分形理论的单点降雨数据与河道流量数据相关关系分析方法
Elwadie et al. A simplified method for field evaluation of solid set sprinkler irrigation systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110420

Termination date: 20180116