CN114372561A

CN114372561A - 一种基于深度状态空间模型的网络流量预测方法

Info

Publication number: CN114372561A
Application number: CN202111664389.6A
Authority: CN
Inventors: 杨恺; 马慧
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-19

Abstract

本发明涉及一种基于深度状态空间模型的网络流量预测方法，包括：S1、获取网络流量数据，进行归一化处理，划分为训练数据和测试数据；S2、构建基于注意力机制的深度状态空间模型，包括空间状态提取器、外部特征提取器、卡尔曼滤波和自回归模块，其中，卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波，提取网络流量数据的高时变动态；S3、训练数据输入到深度状态空间模型中，基于TensorFlow框架，采用端到端的方式进行迭代训练，判断模型是否收敛，若是转至S4；S4、将测试数据输入已训练好的深度状态空间模型，根据评价指标对模型的性能进行评估。与现有技术相比，本发明具有提升流量预测模型的预测精度，改善模型的预测性能，具有可解释性等优点。

Description

一种基于深度状态空间模型的网络流量预测方法

技术领域

本发明涉及网络流量预测技术领域，尤其是涉及一种基于深度状态空间模型的网络流量预测方法。

背景技术

随着蜂窝移动通信技术的发展，各类移动设备和应用程序更加广泛的被大家使用。与此同时，互联网规模和复杂程度也在不断增加，给网络管理带来了严峻的挑战。如何做好网络规划和资源配置成为网络管理中面临的一个重要难题。利用人工智能算法构建网络流量预测模型，准确预估未来一段时间内网络流量的使用情况，可以有效提升用户服务质量，帮助管理人员应对网络拥堵问题，节约网络运营成本，实现网络资源的高效配置。

现有的蜂窝网络流量预测方法主要分为两类：统计学方法和机器学习方法。统计学方法的优点是结构简单，缺点是难以捕捉蜂窝网络流量的高时变动态，预测性能差。而机器学习方法可以划分为传统机器学习方法和深度学习方法。其中，传统机器学习方法的预测性能优于统计学方法，在蜂窝流量预测任务中应用广泛。但是该方法的缺点是难以实现面向百万级甚至百亿级流量数据的准确预测。深度学习方法主要是基于神经网络的方法，不仅能细致地刻画蜂窝流量的动态变化，也可以高效地处理海量数据，其预测性能优于传统的机器学习方法。然而，基于深度学习的蜂窝网络流量预测方法大都使用历史流量信息对未来时刻的流量状态进行估计，缺少整个城市的社交活动等有效信息，使得流量预测的准确率难以继续提升。此外，基于深度学习的蜂窝网络流量预测方法缺乏可解释性，使得人们难以理解产生特定决策的原因。

发明内容

本发明的目的就是为了克服上述现有技术存在的流量预测的准确率难以继续提升、缺乏可解释性的缺陷而提供一种基于深度状态空间模型的网络流量预测方法。

本发明的目的可以通过以下技术方案来实现：

一种基于深度状态空间模型的网络流量预测方法，具体包括以下步骤：

S1、获取网络流量数据，对网络流量数据中的数值型数据进行归一化处理，并将网络流量数据划分为训练数据和测试数据；

S2、构建基于注意力机制的深度状态空间模型，所述深度状态空间模型包括卡尔曼滤波，所述卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波，提取网络流量数据的高时变动态；

S3、训练数据输入到深度状态空间模型中，基于TensorFlow框架，采用端到端的方式进行迭代训练，判断深度状态空间模型是否收敛，若是则转至步骤S4；

S4、将测试数据输入已训练好的深度状态空间模型，根据预设的评价指标对深度状态空间模型的性能进行评估。

所述步骤S1中采用最大-最小归一化方法对数值型数据进行归一化处理，并对元数据进行独热编码，所述元数据包括假期和星期数。

所述基于注意力机制的深度状态空间模型的公式如下所示：

其中，

为网络流量的预测值，T为当前时刻，X_t表示历史时刻的流量矩阵，

表示t时刻维度为d_e的外部特征向量，h表示预测区间，L表示用于流量预测的近期历史数据的长度，g₀表示深度状态空间模型的公式化表达。

所述深度状态空间模型还包括空间特征提取器、外部特征提取器和自回归模块。

进一步地，所述外部特征提取器是为了获得外部因素的向量化表示，将整个城市的社会活动等外部信息以及节假日、星期数等离散信息编码成统一的外部特征向量。

进一步地，所述空间特征提取器是由卷积神经网络和注意力机制模块组成的，用以捕捉相邻小区蜂窝流量之间的空间依赖关系，具体公式如下所示：

O^cnn＝g_cnn(X₁,X₂,...,X_T)

其中，

d_c表示

的维度，g_cnn(·)表示“卷积+正则化+激活函数”的两次组合，具体采用层标准化和Relu激活函数。

进一步地，所述空间特征提取器的注意力机制模块可以自动选择在所有时间步长范围内相关的隐状态信息，进一步捕捉重要的空域特征，具体公式如下所示：

Q＝O^cnn×W^Q

K＝O^cnn×W^K

V＝O^cnn×W^V

其中，Q为注意力权重矩阵，K为注意力键矩阵，V为注意力值矩阵，W^Q、W^K和W^V为相应矩阵的权重，所述注意力机制模块的输出值如下所示：

其中，输出值

的维度为d_a，d表示权重矩阵Q的维度。

进一步地，所述基于注意力机制的卡尔曼滤波结构包括2个全连接层，所述全连接层计算观测值和观测向量，用于估计预测值的不确定程度，具体公式如下所示：

其中，

z_t为观测值，l_t为观测向量，d_k表示z_t和l_t的维度，

分别表示全连接层的学习参数。

所述卡尔曼滤波利用状态方程和估计方程联合估计未来时刻的状态值，不仅可以描绘网络流量数据的长期时间依赖关系，而且使模型具备可解释性，所述基于注意力机制的卡尔曼滤波的类型包括基于注意力机制的线性卡尔曼滤波(A-LKF)和基于注意力机制的扩展卡尔曼滤波(A-EKF)；在卡尔曼滤波中，通常假设系统噪音和观测噪音都是均值为0、方差分别为U和R_t的高斯随机变量。

所述卡尔曼滤波计算网络流量数据的状态估计的过程包括：

S201、计算当前时刻的初步估计状态；

S202、对初步估计状态进行更新，得到当前时刻的最优估计状态；

S203、根据当前时刻的最优估计状态计算卡尔曼滤波结构的输出值。

进一步地，所述线性卡尔曼滤波计算初步估计状态的公式如下所示：

P_t|t-1＝FP_t-1F^T+U

其中，F为通过神经网络学习得到的转移矩阵，

表示t-1时刻的最优状态估计，U为卡尔曼滤波的系统噪音的协方差矩阵，U＝diag(λ)，λ表示U的特征值向量；

线性卡尔曼滤波计算最优估计状态的公式如下所示：

K_t＝P_t|t-1H^T[HP_t|t-1H^T+R_t]^-1

P_t＝(I-K_tH)P_t|t-1

其中，K_t表示t时刻的卡尔曼增益，I表示单位矩阵，测量矩阵H为单位矩阵，P_t为估计状态的协方差矩阵；

所述扩展卡尔曼滤波计算初步估计状态的公式如下所示：

其中，f(·)是非线性状态方程，J_f(·)是f(·)忽略高阶项的雅可比矩阵；

扩展卡尔曼滤波计算最优估计状态的公式如下所示：

其中，h(·)表示测量方程，J_h(·)表示h(·)忽略高阶项的雅可比矩阵，R_t为卡尔曼滤波的观测噪音的协方差矩阵，R_t＝diag(l_t)；

所述卡尔曼滤波的输出值的计算公式如下所示：

其中，

为t时刻的卡尔曼滤波的输出值，w_k，b_k分别表示是可学习的模型参数。

进一步地，所述自回归模型负责捕捉蜂窝流量数据的尺度变化，相应的输出值

的计算公式如下所示：

其中，X_t表示历史时刻的流量矩阵，w_ar,b_ar分别表示自回归模型的权重和偏置；

所述深度状态空间模型的最终的网络流量的预测值如下所示：

其中，

表示t时刻维度为d_e的外部特征向量，w,b分别表示可学习的参数。

所述步骤S3中进行迭代时损失函数采用均方根误差，优化算法采用Adam。

所述步骤S4中评价指标包括均方根误差和平均绝对误差。

与现有技术相比，本发明具有以下有益效果：

1.本发明采用多源异构数据(包括来自电信的结构化数据和来自社交活动的文本数据)，构建面向蜂窝流量场景的深度学习预测模型。目前利用外部信息的蜂窝网络流量预测方法，主要探究了节假日、地理位置和单个小区的社交活动等信息，但是缺乏探究整个城市的社交活动信息对蜂窝网络流量数据的影响。相比于其他的流量预测方法，本发明充分利用发表推文的数量和地理位置、用户数量以及节假日、星期数等离散数据，可以有效提升流量预测模型的预测精度。

2.本发明利用多个组件刻画了相邻小区的蜂窝流量之间的有效特征，从而提高预测模型的性能。首先，利用空间特征捕捉器有效捕捉蜂窝流量的局部空间特征，并采用卡尔曼滤波提取蜂窝流量的长期时域特征，从而刻画了蜂窝流量的时空依赖关系。其次，利用外部特征提取器获得外部因素的向量化表达，并与蜂窝流量的时空特征进行有效融合。此外，采用自回归结构以捕捉蜂窝流量数据的尺度变化，进一步改善了模型的预测性能。

3.本发明蜂窝网络流量预测模型具有可解释性。模型的可解释性有助于人们更好的理解产生特定决策的原因，然而基于深度学习的蜂窝流量预测方法缺乏可解释性方面的研究。本发明采用卡尔曼滤波，即联合状态方程和观测方程估计未来时刻的状态，不仅捕捉流量数据的长期时域依赖，而且为蜂窝流量预测结果提供解释。

附图说明

图1为本发明的流程示意图；

图2为本发明深度状态空间模型的结构示意图；

图3为本发明所提出方法的性能与现有方法的均方根误差的对比图；

图4为本发明所提出方法的性能与现有方法的平均绝对误差的对比图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

实施例

如图1所示，一种基于深度状态空间模型的网络流量预测方法，具体包括以下步骤：

本实施例中，测试数据为数据采集时间段内最后7天的蜂窝流量。

步骤S1中采用最大-最小归一化方法对数值型数据进行归一化处理，并对元数据进行独热编码，元数据包括假期和星期数。

基于注意力机制的深度状态空间模型的公式如下所示：

其中，

如图2所示，深度状态空间模型还包括空间特征提取器、外部特征提取器和自回归模块。

外部特征提取器是为了获得外部因素的向量化表示，将整个城市的社会活动等外部信息以及节假日、星期数等离散信息编码成统一的外部特征向量。

空间特征提取器是由卷积神经网络和注意力机制模块组成的，用以捕捉相邻小区蜂窝流量之间的空间依赖关系，具体公式如下所示：

O^cnn＝g_cnn(X₁,X₂,...,X_T)

其中，

d_c表示

空间特征提取器的注意力机制模块可以自动选择在所有时间步长范围内相关的隐状态信息，进一步捕捉重要的空域特征，具体公式如下所示：

Q＝O^cnn×W^Q

K＝O^cnn×W^K

V＝O^cnn×W^V

其中，Q为注意力权重矩阵，K为注意力键矩阵，V为注意力值矩阵，W^Q、W^K和W^V为相应矩阵的权重，注意力机制模块的输出值如下所示：

其中，输出值

的维度为d_a，d表示权重矩阵Q的维度。

基于注意力机制的卡尔曼滤波结构包括2个全连接层，全连接层计算观测值和观测向量，用于估计预测值的不确定程度，具体公式如下所示：

其中，

z_t为观测值，l_t为观测向量，d_k表示z_t和l_t的维度，

分别表示全连接层的学习参数。

基于注意力机制的卡尔曼滤波利用状态方程和估计方程联合估计未来时刻的状态值，不仅可以描绘网络流量数据的长期时间依赖，而且使模型具备可解释性，基于注意力机制的卡尔曼滤波的类型包括基于注意力机制的线性卡尔曼滤波(A-LKF)和基于注意力机制的扩展卡尔曼滤波(A-EKF)；在卡尔曼滤波中，通常假设系统噪音和观测噪音都是均值为0、方差分别为U和R_t的高斯随机变量。

卡尔曼滤波计算网络流量数据的状态估计的过程包括：

S201、计算当前时刻的初步估计状态；

S203、根据当前时刻的最优估计状态计算卡尔曼滤波的输出值。

线性卡尔曼滤波计算初步估计状态的公式如下所示：

P_t|t-1＝FP_t-1F^T+U

其中，F为通过神经网络学习得到的转移矩阵，

线性卡尔曼滤波计算最优估计状态的公式如下所示：

K_t＝P_t|t-1H^T[HP_t|t-1H^T+R_t]^-1

P_t＝(I-K_tH)P_t|t-1

扩展卡尔曼滤波计算初步估计状态的公式如下所示：

扩展卡尔曼滤波计算最优估计状态的公式如下所示：

卡尔曼滤波的输出值的计算公式如下所示：

其中，

为t时刻的卡尔曼滤波结构的输出值，w_k，b_k分别表示是可学习的模型参数。

自回归模型负责捕捉蜂窝流量数据的尺度变化，相应的输出值

的计算公式如下所示：

其中，X_t表示历史时刻的流量矩阵，w_ar,b_ar分别表示自回归模型的权重和偏置；深度状态空间模型的最终的网络流量的预测值如下所示：

其中，

步骤S3中进行迭代时损失函数采用均方根误差，优化算法采用Adam，本实施例中，早停次数设置为200。

步骤S4中评价指标包括均方根误差和平均绝对误差。

如图3和图4所示，在相同数据集上比较了本专利所提出方法的性能与现有方法的性能，由此可见，本发明所提出的方法优于现有的其他蜂窝网络流量预测方法，可以说明本专利所述的蜂窝网络流量预测方法具有先进性。

此外，需要说明的是，本说明书中所描述的具体实施例，所取名称可以不同，本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化，均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法，只要不偏离本发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。