CN114372561A - 一种基于深度状态空间模型的网络流量预测方法 - Google Patents
一种基于深度状态空间模型的网络流量预测方法 Download PDFInfo
- Publication number
- CN114372561A CN114372561A CN202111664389.6A CN202111664389A CN114372561A CN 114372561 A CN114372561 A CN 114372561A CN 202111664389 A CN202111664389 A CN 202111664389A CN 114372561 A CN114372561 A CN 114372561A
- Authority
- CN
- China
- Prior art keywords
- space model
- state space
- matrix
- kalman filtering
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于深度状态空间模型的网络流量预测方法,包括:S1、获取网络流量数据,进行归一化处理,划分为训练数据和测试数据;S2、构建基于注意力机制的深度状态空间模型,包括空间状态提取器、外部特征提取器、卡尔曼滤波和自回归模块,其中,卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波,提取网络流量数据的高时变动态;S3、训练数据输入到深度状态空间模型中,基于TensorFlow框架,采用端到端的方式进行迭代训练,判断模型是否收敛,若是转至S4;S4、将测试数据输入已训练好的深度状态空间模型,根据评价指标对模型的性能进行评估。与现有技术相比,本发明具有提升流量预测模型的预测精度,改善模型的预测性能,具有可解释性等优点。
Description
技术领域
本发明涉及网络流量预测技术领域,尤其是涉及一种基于深度状态空间模型的网络流量预测方法。
背景技术
随着蜂窝移动通信技术的发展,各类移动设备和应用程序更加广泛的被大家使用。与此同时,互联网规模和复杂程度也在不断增加,给网络管理带来了严峻的挑战。如何做好网络规划和资源配置成为网络管理中面临的一个重要难题。利用人工智能算法构建网络流量预测模型,准确预估未来一段时间内网络流量的使用情况,可以有效提升用户服务质量,帮助管理人员应对网络拥堵问题,节约网络运营成本,实现网络资源的高效配置。
现有的蜂窝网络流量预测方法主要分为两类:统计学方法和机器学习方法。统计学方法的优点是结构简单,缺点是难以捕捉蜂窝网络流量的高时变动态,预测性能差。而机器学习方法可以划分为传统机器学习方法和深度学习方法。其中,传统机器学习方法的预测性能优于统计学方法,在蜂窝流量预测任务中应用广泛。但是该方法的缺点是难以实现面向百万级甚至百亿级流量数据的准确预测。深度学习方法主要是基于神经网络的方法,不仅能细致地刻画蜂窝流量的动态变化,也可以高效地处理海量数据,其预测性能优于传统的机器学习方法。然而,基于深度学习的蜂窝网络流量预测方法大都使用历史流量信息对未来时刻的流量状态进行估计,缺少整个城市的社交活动等有效信息,使得流量预测的准确率难以继续提升。此外,基于深度学习的蜂窝网络流量预测方法缺乏可解释性,使得人们难以理解产生特定决策的原因。
发明内容
本发明的目的就是为了克服上述现有技术存在的流量预测的准确率难以继续提升、缺乏可解释性的缺陷而提供一种基于深度状态空间模型的网络流量预测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于深度状态空间模型的网络流量预测方法,具体包括以下步骤:
S1、获取网络流量数据,对网络流量数据中的数值型数据进行归一化处理,并将网络流量数据划分为训练数据和测试数据;
S2、构建基于注意力机制的深度状态空间模型,所述深度状态空间模型包括卡尔曼滤波,所述卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波,提取网络流量数据的高时变动态;
S3、训练数据输入到深度状态空间模型中,基于TensorFlow框架,采用端到端的方式进行迭代训练,判断深度状态空间模型是否收敛,若是则转至步骤S4;
S4、将测试数据输入已训练好的深度状态空间模型,根据预设的评价指标对深度状态空间模型的性能进行评估。
所述步骤S1中采用最大-最小归一化方法对数值型数据进行归一化处理,并对元数据进行独热编码,所述元数据包括假期和星期数。
所述基于注意力机制的深度状态空间模型的公式如下所示:
所述深度状态空间模型还包括空间特征提取器、外部特征提取器和自回归模块。
进一步地,所述外部特征提取器是为了获得外部因素的向量化表示,将整个城市的社会活动等外部信息以及节假日、星期数等离散信息编码成统一的外部特征向量。
进一步地,所述空间特征提取器是由卷积神经网络和注意力机制模块组成的,用以捕捉相邻小区蜂窝流量之间的空间依赖关系,具体公式如下所示:
Ocnn=gcnn(X1,X2,...,XT)
进一步地,所述空间特征提取器的注意力机制模块可以自动选择在所有时间步长范围内相关的隐状态信息,进一步捕捉重要的空域特征,具体公式如下所示:
Q=Ocnn×WQ
K=Ocnn×WK
V=Ocnn×WV
其中,Q为注意力权重矩阵,K为注意力键矩阵,V为注意力值矩阵,WQ、WK和WV为相应矩阵的权重,所述注意力机制模块的输出值如下所示:
进一步地,所述基于注意力机制的卡尔曼滤波结构包括2个全连接层,所述全连接层计算观测值和观测向量,用于估计预测值的不确定程度,具体公式如下所示:
所述卡尔曼滤波利用状态方程和估计方程联合估计未来时刻的状态值,不仅可以描绘网络流量数据的长期时间依赖关系,而且使模型具备可解释性,所述基于注意力机制的卡尔曼滤波的类型包括基于注意力机制的线性卡尔曼滤波(A-LKF)和基于注意力机制的扩展卡尔曼滤波(A-EKF);在卡尔曼滤波中,通常假设系统噪音和观测噪音都是均值为0、方差分别为U和Rt的高斯随机变量。
所述卡尔曼滤波计算网络流量数据的状态估计的过程包括:
S201、计算当前时刻的初步估计状态;
S202、对初步估计状态进行更新,得到当前时刻的最优估计状态;
S203、根据当前时刻的最优估计状态计算卡尔曼滤波结构的输出值。
进一步地,所述线性卡尔曼滤波计算初步估计状态的公式如下所示:
Pt|t-1=FPt-1FT+U
线性卡尔曼滤波计算最优估计状态的公式如下所示:
Kt=Pt|t-1HT[HPt|t-1HT+Rt]-1
Pt=(I-KtH)Pt|t-1
其中,Kt表示t时刻的卡尔曼增益,I表示单位矩阵,测量矩阵H为单位矩阵,Pt为估计状态的协方差矩阵;
所述扩展卡尔曼滤波计算初步估计状态的公式如下所示:
其中,f(·)是非线性状态方程,Jf(·)是f(·)忽略高阶项的雅可比矩阵;
扩展卡尔曼滤波计算最优估计状态的公式如下所示:
其中,h(·)表示测量方程,Jh(·)表示h(·)忽略高阶项的雅可比矩阵,Rt为卡尔曼滤波的观测噪音的协方差矩阵,Rt=diag(lt);
所述卡尔曼滤波的输出值的计算公式如下所示:
其中,Xt表示历史时刻的流量矩阵,war,bar分别表示自回归模型的权重和偏置;
所述深度状态空间模型的最终的网络流量的预测值如下所示:
所述步骤S3中进行迭代时损失函数采用均方根误差,优化算法采用Adam。
所述步骤S4中评价指标包括均方根误差和平均绝对误差。
与现有技术相比,本发明具有以下有益效果:
1.本发明采用多源异构数据(包括来自电信的结构化数据和来自社交活动的文本数据),构建面向蜂窝流量场景的深度学习预测模型。目前利用外部信息的蜂窝网络流量预测方法,主要探究了节假日、地理位置和单个小区的社交活动等信息,但是缺乏探究整个城市的社交活动信息对蜂窝网络流量数据的影响。相比于其他的流量预测方法,本发明充分利用发表推文的数量和地理位置、用户数量以及节假日、星期数等离散数据,可以有效提升流量预测模型的预测精度。
2.本发明利用多个组件刻画了相邻小区的蜂窝流量之间的有效特征,从而提高预测模型的性能。首先,利用空间特征捕捉器有效捕捉蜂窝流量的局部空间特征,并采用卡尔曼滤波提取蜂窝流量的长期时域特征,从而刻画了蜂窝流量的时空依赖关系。其次,利用外部特征提取器获得外部因素的向量化表达,并与蜂窝流量的时空特征进行有效融合。此外,采用自回归结构以捕捉蜂窝流量数据的尺度变化,进一步改善了模型的预测性能。
3.本发明蜂窝网络流量预测模型具有可解释性。模型的可解释性有助于人们更好的理解产生特定决策的原因,然而基于深度学习的蜂窝流量预测方法缺乏可解释性方面的研究。本发明采用卡尔曼滤波,即联合状态方程和观测方程估计未来时刻的状态,不仅捕捉流量数据的长期时域依赖,而且为蜂窝流量预测结果提供解释。
附图说明
图1为本发明的流程示意图;
图2为本发明深度状态空间模型的结构示意图;
图3为本发明所提出方法的性能与现有方法的均方根误差的对比图;
图4为本发明所提出方法的性能与现有方法的平均绝对误差的对比图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于深度状态空间模型的网络流量预测方法,具体包括以下步骤:
S1、获取网络流量数据,对网络流量数据中的数值型数据进行归一化处理,并将网络流量数据划分为训练数据和测试数据;
S2、构建基于注意力机制的深度状态空间模型,所述深度状态空间模型包括卡尔曼滤波,所述卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波,提取网络流量数据的高时变动态;
S3、训练数据输入到深度状态空间模型中,基于TensorFlow框架,采用端到端的方式进行迭代训练,判断深度状态空间模型是否收敛,若是则转至步骤S4;
S4、将测试数据输入已训练好的深度状态空间模型,根据预设的评价指标对深度状态空间模型的性能进行评估。
本实施例中,测试数据为数据采集时间段内最后7天的蜂窝流量。
步骤S1中采用最大-最小归一化方法对数值型数据进行归一化处理,并对元数据进行独热编码,元数据包括假期和星期数。
基于注意力机制的深度状态空间模型的公式如下所示:
如图2所示,深度状态空间模型还包括空间特征提取器、外部特征提取器和自回归模块。
外部特征提取器是为了获得外部因素的向量化表示,将整个城市的社会活动等外部信息以及节假日、星期数等离散信息编码成统一的外部特征向量。
空间特征提取器是由卷积神经网络和注意力机制模块组成的,用以捕捉相邻小区蜂窝流量之间的空间依赖关系,具体公式如下所示:
Ocnn=gcnn(X1,X2,...,XT)
空间特征提取器的注意力机制模块可以自动选择在所有时间步长范围内相关的隐状态信息,进一步捕捉重要的空域特征,具体公式如下所示:
Q=Ocnn×WQ
K=Ocnn×WK
V=Ocnn×WV
其中,Q为注意力权重矩阵,K为注意力键矩阵,V为注意力值矩阵,WQ、WK和WV为相应矩阵的权重,注意力机制模块的输出值如下所示:
基于注意力机制的卡尔曼滤波结构包括2个全连接层,全连接层计算观测值和观测向量,用于估计预测值的不确定程度,具体公式如下所示:
基于注意力机制的卡尔曼滤波利用状态方程和估计方程联合估计未来时刻的状态值,不仅可以描绘网络流量数据的长期时间依赖,而且使模型具备可解释性,基于注意力机制的卡尔曼滤波的类型包括基于注意力机制的线性卡尔曼滤波(A-LKF)和基于注意力机制的扩展卡尔曼滤波(A-EKF);在卡尔曼滤波中,通常假设系统噪音和观测噪音都是均值为0、方差分别为U和Rt的高斯随机变量。
卡尔曼滤波计算网络流量数据的状态估计的过程包括:
S201、计算当前时刻的初步估计状态;
S202、对初步估计状态进行更新,得到当前时刻的最优估计状态;
S203、根据当前时刻的最优估计状态计算卡尔曼滤波的输出值。
线性卡尔曼滤波计算初步估计状态的公式如下所示:
Pt|t-1=FPt-1FT+U
线性卡尔曼滤波计算最优估计状态的公式如下所示:
Kt=Pt|t-1HT[HPt|t-1HT+Rt]-1
Pt=(I-KtH)Pt|t-1
其中,Kt表示t时刻的卡尔曼增益,I表示单位矩阵,测量矩阵H为单位矩阵,Pt为估计状态的协方差矩阵;
扩展卡尔曼滤波计算初步估计状态的公式如下所示:
其中,f(·)是非线性状态方程,Jf(·)是f(·)忽略高阶项的雅可比矩阵;
扩展卡尔曼滤波计算最优估计状态的公式如下所示:
其中,h(·)表示测量方程,Jh(·)表示h(·)忽略高阶项的雅可比矩阵,Rt为卡尔曼滤波的观测噪音的协方差矩阵,Rt=diag(lt);
卡尔曼滤波的输出值的计算公式如下所示:
其中,Xt表示历史时刻的流量矩阵,war,bar分别表示自回归模型的权重和偏置;深度状态空间模型的最终的网络流量的预测值如下所示:
步骤S3中进行迭代时损失函数采用均方根误差,优化算法采用Adam,本实施例中,早停次数设置为200。
步骤S4中评价指标包括均方根误差和平均绝对误差。
如图3和图4所示,在相同数据集上比较了本专利所提出方法的性能与现有方法的性能,由此可见,本发明所提出的方法优于现有的其他蜂窝网络流量预测方法,可以说明本专利所述的蜂窝网络流量预测方法具有先进性。
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种基于深度状态空间模型的网络流量预测方法,其特征在于,具体包括以下步骤:
S1、获取网络流量数据,对网络流量数据中的数值型数据进行归一化处理,并将网络流量数据划分为训练数据和测试数据;
S2、构建基于注意力机制的深度状态空间模型,所述深度状态空间模型包括卡尔曼滤波,所述卡尔曼滤波分别采用线性卡尔曼滤波和扩展卡尔曼滤波,提取网络流量数据的高时变动态;
S3、训练数据输入到深度状态空间模型中,基于TensorFlow框架,采用端到端的方式进行迭代训练,判断深度状态空间模型是否收敛,若是则转至步骤S4;
S4、将测试数据输入已训练好的深度状态空间模型,根据预设的评价指标对深度状态空间模型的性能进行评估。
2.根据权利要求1所述的一种基于深度状态空间模型的网络流量预测方法,其特征在于,所述步骤S1中采用最大-最小归一化方法对数值型数据进行归一化处理,并对元数据进行独热编码,所述元数据包括假期和星期数。
4.根据权利要求3所述的一种基于深度状态空间模型的网络流量预测方法,其特征在于,所述深度状态空间模型还包括空间特征提取器、外部特征提取器和自回归模块。
8.根据权利要求1所述的一种基于深度状态空间模型的网络流量预测方法,其特征在于,所述卡尔曼滤波的类型包括线性卡尔曼滤波和扩展卡尔曼滤波,所述卡尔曼滤波计算网络流量数据的状态估计的过程包括:
S201、计算当前时刻的初步估计状态;
S202、对初步估计状态进行更新,得到当前时刻的最优估计状态;
S203、根据当前时刻的最优估计状态计算卡尔曼滤波结构的输出值。
9.根据权利要求8所述的一种基于深度状态空间模型的网络流量预测方法,其特征在于,所述线性卡尔曼滤波结构计算初步估计状态的公式如下所示:
Pt|t-1=FPt-1FT+U
线性卡尔曼滤波计算最优估计状态的公式如下所示:
Kt=Pt|t-1HT[HPt|t-1HT+Rt]-1
Pt=(I-KtH)Pt|t-1
其中,Kt表示t时刻的卡尔曼增益,I表示单位矩阵,测量矩阵H为单位矩阵,Pt为估计状态协方差矩阵;
所述扩展卡尔曼滤波计算初步估计状态的公式如下所示:
其中,f(·)是非线性状态方程,Jf(·)是f(·)忽略高阶项的雅可比矩阵;
扩展卡尔曼滤波计算最优估计状态的公式如下所示:
其中,h(·)表示测量方程,Jh(·)表示h(·)忽略高阶项的雅可比矩阵,Rt为卡尔曼滤波的观测噪音的协方差矩阵;
所述卡尔曼滤波结构的输出值的计算公式如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111664389.6A CN114372561A (zh) | 2021-12-31 | 2021-12-31 | 一种基于深度状态空间模型的网络流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111664389.6A CN114372561A (zh) | 2021-12-31 | 2021-12-31 | 一种基于深度状态空间模型的网络流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114372561A true CN114372561A (zh) | 2022-04-19 |
Family
ID=81142794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111664389.6A Pending CN114372561A (zh) | 2021-12-31 | 2021-12-31 | 一种基于深度状态空间模型的网络流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114372561A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312972A (zh) * | 2023-11-30 | 2023-12-29 | 山西海诚智能制造有限公司 | 一种刮板输送机减速器健康状态识别方法 |
CN117311984A (zh) * | 2023-11-03 | 2023-12-29 | 北京创璞科技有限公司 | 基于对比服务的服务器负载均衡方法及系统 |
-
2021
- 2021-12-31 CN CN202111664389.6A patent/CN114372561A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117311984A (zh) * | 2023-11-03 | 2023-12-29 | 北京创璞科技有限公司 | 基于对比服务的服务器负载均衡方法及系统 |
CN117311984B (zh) * | 2023-11-03 | 2024-03-29 | 北京创璞科技有限公司 | 基于对比服务的服务器负载均衡方法及系统 |
CN117312972A (zh) * | 2023-11-30 | 2023-12-29 | 山西海诚智能制造有限公司 | 一种刮板输送机减速器健康状态识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647900B (zh) | 基于深度神经网络的安全态势智能预测方法、装置及系统 | |
CN108900346B (zh) | 基于lstm网络的无线网络流量预测方法 | |
CN113077097B (zh) | 一种基于深度时空相似性的空气质量预测方法 | |
CN111340288B (zh) | 一种顾及时空关联性的城市空气质量时序预测方法 | |
CN114372561A (zh) | 一种基于深度状态空间模型的网络流量预测方法 | |
CN112712209B (zh) | 水库入库流量预测方法、装置、计算机设备及存储介质 | |
CN113852492A (zh) | 基于注意力机制和图卷积神经网络的网络流量预测方法 | |
CN110267292B (zh) | 基于三维卷积神经网络的蜂窝网络流量预测方法 | |
CN109523021A (zh) | 一种基于长短时记忆网络的动态网络结构预测方法 | |
CN113240170A (zh) | 一种基于季节性循环神经网络的空气质量预测方法 | |
CN112765894B (zh) | 一种基于k-lstm的铝电解槽状态预测方法 | |
CN111767472A (zh) | 一种社交网络异常账号检测方法及系统 | |
CN116187563A (zh) | 一种融合改进变分模态分解的海表温度时空智能预测方法 | |
CN115859792A (zh) | 基于注意力机制的中期电力负荷预测方法及系统 | |
CN109903205B (zh) | 一种公开课智能推荐方法以及管理系统 | |
CN114970946A (zh) | 基于深度学习模型与经验模态分解耦合的pm2.5污染浓度长时空预测方法 | |
CN117668743A (zh) | 一种关联时空关系的时序数据预测方法 | |
CN115174263B (zh) | 攻击路径动态决策方法与装置 | |
CN114757391B (zh) | 一种面向服务质量预测的网络数据空间设计与应用方法 | |
CN110009132A (zh) | 一种基于lstm深度神经网络的短期电力负荷精细化预测方法 | |
Geng et al. | A LSTM based campus network traffic prediction system | |
CN113723707A (zh) | 一种基于深度学习模型的中长期径流趋势预测方法 | |
CN111935766A (zh) | 一种基于全局空间依赖性的无线网络流量预测方法 | |
CN117133116B (zh) | 一种基于时空关联网络的交通流预测方法及系统 | |
CN118052480B (zh) | 基于深度学习的家居工程师画像数据快速获取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |