CN104469795A

CN104469795A - 基于领域搜索的FARIMA模型Hurst参数估计方法

Info

Publication number: CN104469795A
Application number: CN201410629098.7A
Authority: CN
Inventors: 李毅飞; 李悦; 丁良辉; 杨峰; 钱良; 支琤
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2014-11-10
Filing date: 2014-11-10
Publication date: 2015-03-25
Anticipated expiration: 2034-11-10
Also published as: CN104469795B

Abstract

本发明涉及一种基于领域搜索的FARIMA模型Hurst参数估计方法，通过模拟实际网络流量所具有的自相似长相关特性的FARIMA时间序列作为估计源，通过时间-方差图法和搜索法相结合的方式来进行Hurst参数的精确估计，所述的方法具体包括以下步骤：1)产生可模拟具有自相似长相关特性的网络流量的FARIMA时间序列；2)确定用于粗估计FARIMA序列的方差-时间图法的时间块的经验区间；3)用方差-时间图法在步骤2)获得的经验区间内进行FARIMA时间序列的Hurst参数估计；4)确定搜索法的步长、精度参数，在粗估计值附近进行Hurst参数的精确搜索估计。与现有技术相比，本发明具有大幅度提高了Hurst参数估计的精度。

Description

基于领域搜索的FARIMA模型Hurst参数估计方法

技术领域

本发明涉及一种无线自组织网络流量预测，尤其是涉及一种基于领域搜索的FARIMA模型Hurst参数估计方法。

背景技术

随着越来越多的研究发现，网络流量具有自相似长相关的特性，这种特性的研究对于网络流量的建模与预测有存在挑战，传统的相关模型偏差较大，寻找和研究更合适的模型具有重要的意义。从性能、复杂度和使用场合等各方面对比了几种常见的网络模型后，认为FARIMA模型同时具有描述短相关和长相关特性的特点，特别适合用作自相似网络流量的建模与预测。Hurst参数可以用于描述网络流量所具有的自相似长相关特性，在检测FARIMA模型产生的序列的参数时要用到Hurst参数估计的方法。而对于Hurst参数的估计方法也有很多，例如R/S法、小波法、方差-时间图法，实验证明这些方法普遍精确度不高，小波法中小波基的选择对于估计结果也会有较大影响。搜索法可以比较精确的得到Hurst参数的估计值，但由于其在整个Hurst的取值范围内进行搜索，因此时间复杂度较高。因此，在实际网络流量的Hurst参数估计时，更适于采用的是时间复杂度低且具有较高估计精确度的Hurst参数估计方法。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于领域搜索的FARIMA模型Hurst参数估计方法，大幅度提高了Hurst参数估计的精度，且复杂度并没有明显提升，对具有自相似长相关性的网络流量的Hurst参数估计和建模具有实际意义。

本发明的目的可以通过以下技术方案来实现：

一种基于领域搜索的FARIMA模型Hurst参数估计方法，其特征在于，通过模拟实际网络流量所具有的自相似长相关特性的FARIMA时间序列作为估计源，通过时间-方差图法和搜索法相结合的方式来进行Hurst参数的精确估计，所述的方法具体包括以下步骤：

1)产生可模拟具有自相似长相关特性的网络流量的FARIMA时间序列；

2)确定用于粗估计FARIMA序列的方差-时间图法的时间块的经验区间；

3)用方差-时间图法在步骤2)获得的经验区间内进行FARIMA时间序列的Hurst参数估计；

4)确定搜索法的步长、精度参数，在粗估计值附近进行Hurst参数的精确搜索估计。

所述的步骤1)具体为：

用FARIMA序列的定义法来产生FARIMA时间序列{X_t：t＝...，-1，0，1，...}，

Φ(z^-1)(1-z^-1)^dX_t＝Θ(z^-1)ε_t

其中d∈(-0.5，0.5)，0＜|z|＜1，{ε_t：t＝...，-1，0，1，...}是一零均值方差为σ²的白噪声序列，Φ(z^-1)和Θ(z^-1)分别是p阶自回归多项式和q阶滑动平均多项式。

所述的步骤2)中的经验区间是由经验公式计算得出的：

mMin＜m＜mMax，log(mMin)≤log(N)/2-1/2，log(mMax)≤log(N)/2+1/2

其中N为FARIMA时间序列的点数，m为序列分块的块大小。

所述的步骤3)具体为：

301)将原始时间序列X划分为每个大小为m的数据块，并计算出每个数据块的均值：

X_k ^(m)＝(X_k(m-1)+1+...+X_km)/m，k＝1，2，... m＝1，2，...

k为各个数据块的标记；

302)计算X_k ^(m)，k＝1，2，...的方差，此方差即为VarX^(m)的估计值；

303)按以下子步骤可获得β或H的估计值：

a)对于每个给定的m，将原始数据X₁，X₂，...，X_N分解为N/m的数据块，每个数据块大小为m，计算出X_k ^(m)，k＝1，2，...，N/m，其样本方差由下式可得：

Var X^{(m)} = \frac{1}{N / m} Σ_{k = 1}^{N / m} {({X_{k}}^{(m)})}^{2} - {(\frac{1}{N / m} Σ_{k = 1}^{N / m} {X_{k}}^{(m)})}^{2}

b)对不同的m值，重复a步骤；

c)以样本方差VarX^(m)的对数为纵轴，m的对数为横轴描点，切直线的斜率为β＝2H-2，-1≤β≤0。

所述的步骤4)具体为：

在从步骤3)中得到的Hurst参数的粗估计值的邻域内按照设定规律遍历，用粗估计值对序列进行分数差分得到W_t＝Δ^dX_t，计算滤波后序列的自相关函数的平方和，由于自相关函数反映了同一序列在不同时刻的取值之间的相关程度，因此自相关函数的平方和越小，滤波后序列的白化程度越高，就越容易被拟合，于是将平方和最小的估计值作为Hurst参数的估计值；

对于长度为N的序列W_t，其K点(自相关函数的最大延迟)自相关函数估计量为：

\hat{γ} (k) = \frac{1}{N} Σ_{t = 1}^{N - k} W_{t} W_{t + k}, k = 1,2, . . ., K

归一化自相关函数估计量为：

\hat{ρ} (k) = \hat{γ} (k) / \hat{γ} (1), k = 1,2, . . ., K

归一化自相关函数的平方和估计量为：

M = Σ_{j = 1}^{K} {\hat{ρ}}^{2} (j)

邻域搜索法的具体步骤如下：

1)给定分数差分参数d的邻域大小ed，自相关函数序列的平方和M的精度ef，搜索步长step的初始长度是ed/2；

2)用时间-方差图法估计出d的粗估计值指定搜索范围是则当前搜索点取为

3)计算当前搜索点d_c的自相关函数序列的平方和M₁，即对序列进行分数差分后得到W_t，再利用上述公式计算滤波后序列的M₁；

4)计算搜索点d_c+step的自相关函数序列的平方和M₂；

5)比较M₁和M₂的值，如果|M₁-M₂|＜ef，则算法结束，返回d_c作为分数差分参数d的值；如果|M₁-M₂|≥ef且M₁＞M₂，则令d_c＝d_c+step，跳到步骤3)；如果|M₁-M₂|≥ef且M₁≤M₂，则令step＝-step/2，跳到步骤3)；

对于精度K，可以根据序列的自相关函数估计量是否显著趋于0来决定，例如当k≥K₀时，则可以取K＝K₀；另外ed和ef两个精度需求可以根据当前数据量和最终精度要求在实际运用中灵活调整；通过上述邻域搜索法，快速的计算出较精确的分数差分阶数d，从而有H＝d+1/2。

与现有技术相比，本发明具有以下优点：

(1)本发明中使用确定经验区间的方法缩小了方差-时间图法的估计区间，降低了方差-时间图法得到Hurst参数粗估计的时间，且比在整个区间上得到的估计值更加精确；

(2)在搜索法估计Hurst参数的估计值之前首先用方差-时间图法得到Hurst参数的粗估计，这样相比于单纯使用搜索法降低了估计时间，且方差-时间图法为时域估计法，本身时间复杂度较低；

(3)本发明估计方法即能保证更高的估计精确度，且并没有时间复杂度的大幅提升，具有一定的现实意义和前瞻性。

附图说明

图1为本发明的流程示意图；

图2为本发明估计算法与方差-时间图法的估计效果对比图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

一种基于邻域搜索的Hurst参数估计方法，如图1所示，首先通过产生可以模拟具有自相似长相关特性的网络流量的FARIMA时间序列，在估计时先使用经验区间上的方差-时间图法得到Hurst参数的粗估计，再使用搜索法在规定的区间和精度内进行Hurst参数的精确搜索。

如图1所示，本发明估计方法具体包括以下步骤：

1)首先使用FARIMA模型定义法产生Hurst参数为0.8的数据序列，序列元素个数为N＝100000；

2)利用经验公式得到方差-时间图法得到的m的估计区间为10-1000；

3)采用方差-时间图法在m＝10-1000的估计区间内对Hurst参数进行粗估计，得到Hurst参数的粗估计值为0.876，估计误差为9.5％；

4)选定ef＝le-10，ed＝0.03，采用搜索法对步骤3)得到的Hurst参数粗估计值进行精确搜索，得到的Hurst参数的精确估计值为0.8042，估计误差为0.52％。

本实例可以应用于典型的Hurst参数估计，估计源可以取自实际的网络流量。将Hurst参数估计的各个步骤整合于一段程序中，以实现邻域搜索对Hurst参数的完整估计。

进一步地，针对邻域搜索的Hurst参数估计的仿真可以包括：依次产生Hurst参数分别为0.600，0.650，...，0.850，0.900的100,000点FARIMA时间序列，分别对它们进行基于邻域搜索的Hurst参数估计，估计结果如表1所示。仿真结果表明，利用基于邻域搜索的Hurst参数估计法相较于方差-时间图法(如表2)可以明显降低估计误差(降低为＜1.5％)。

表1

表2

方差-时间图法具有较低的时间复杂度O(N)，而邻域搜索法的时间复杂度为O(KN)，可见在时间复杂度上邻域搜索法并没有大幅度的提高。

本发明的实施例表明，本发明估计方法即能保证更高的估计精确度，且并没有时间复杂度的大幅提升，具有一定的现实意义和前瞻性。

尽管本发明的内容已经通过上述优选实施例做了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。

Claims

1.一种基于领域搜索的FARIMA模型Hurst参数估计方法，其特征在于，通过模拟实际网络流量所具有的自相似长相关特性的FARIMA时间序列作为估计源，通过时间-方差图法和搜索法相结合的方式来进行Hurst参数的精确估计，所述的方法具体包括以下步骤：

2.根据权利要求1所述的一种基于领域搜索的FARIMA模型Hurst参数估计方法，其特征在于，所述的步骤1)具体为：

Φ(z^-1)(1-z^-1)^dX_t＝Θ(z^-1)ε_t

其中d∈(-0.5，0.5)，0＜|z|＜1，{ε_t：t＝...，-1，0，1，...}是一零均值方羞为σ²的白噪声序列，Φ(z^-1)和Θ(z^-1)分别是p阶自回归多项式和q阶滑动平均多项式。

3.根据权利要求1所述的一种基于领域搜索的FARIMA模型Hurst参数估计方法，其特征在于，所述的步骤2)中的经验区间是由经验公式计算得出的：