CN112801411B

CN112801411B - 一种基于生成对抗网络的网络流量预测方法

Info

Publication number: CN112801411B
Application number: CN202110222903.4A
Authority: CN
Inventors: 高志宇; 王天荆; 唐昊; 沈航; 李玉阁
Original assignee: Nanjing Tech University
Current assignee: Nanjing Tech University
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2024-02-09
Anticipated expiration: 2041-02-26
Also published as: CN112801411A

Abstract

随着无线接入用户需求爆炸式增长，5G网络流量指数级增长且呈现出多样性、异构性趋势，使得网络流量预测面临诸多挑战。针对5G网络部署宏基站、微基站与微微基站的多层架构，本发明提出一种基于生成对抗网络的网络流量预测方法：首先，生成网络分别捕捉流量时空特征与基站类型特征，将拼接特征输入复合残差模块生成预测流量，并将生成流量输入判别网络；接着，判别网络判断生成流量是真实流量还是预测流量；最后，经过生成网络与判别网络的博弈对抗使生成网络生成高精度的预测流量。实验结果表明，GAN的二维均方根预测误差分别比2DCNN、3DCNN和ConvLSTM降低了58.64％、38.74％和34.88％，具有最优的流量预测性能。

Description

一种基于生成对抗网络的网络流量预测方法

技术领域

本发明创造属于计算机及通信技术领域，具体是一种基于生成对抗网络的5G网络流量预测方法。

背景技术

随着物联网的快速部署和发展，思科最新VNI预测2022年移动流量将接近泽字节(Zetta Byte)里程碑。4G网络正面临着1000倍移动流量的挑战，已渐渐不能满足物联网海量接入的需求^[1]，而第五代无线通信技术(5G)是满足移动通信需求爆炸式增长的新技术革命^[2-3]，大力促进了经济社会的数字化、网络化和智能化。5G网络拥有超高速、超可靠性、超短延时以及随时随地接入的优势，10到100倍的传输速率给用户带了极流畅的体验，满足了海量终端接入的网络资源需求，但带来了网络流量指数级增长以及多样性、异构性的趋势^[4]。为了解决海量异构数据对传统蜂窝网络造成的巨大流量负载，5G运营商在宏基站外围大量部署低功率的微基站、微微基站，以便为宏基站分流并实现负载均衡。同时，为了优化大规模城市的5G蜂窝网络资源部署与分配，提高流量管理的智能性和可靠性，深入了解5G网络流量模式、高精度预测流量变得至关重要^[5]。5G网络流量本质上属于时间序列数据，所以其预测问题可转化为时间序列预测建模问题，现有研究主要致力于两大类方法：参数化和非参数化模型方法。

参数化模型方法主要依据统计学和概率分布等数学理论知识对流量进行建模和预测，该类方法通过有限参数对流量建模且不依赖于数据集的大小。文献[6]分析了大量蜂窝基站的网络流量，将流量区分为可预测与不可预测两部分，证明了可预测流量具有自相关性。文献[7]提出了季节性SARIMA(Seasonal ARIMA)模型，通过分析时间序列的自相关性准确捕捉到网络流量的季节特性，进而获得了长期的流量预测结果。通过验证蜂窝基站的流量受到周边地区基站数量的影响，文献[8]从时间和空间角度提出α-stable模型来预测网络流量，实验结果显示该模型的预测精度比ARIMA、SARIMA等线性框架有明显提升。随着蜂窝网络宽度和深度的扩展，网络流量特性早已偏离了上述线性预测模型^[9]。虽然统计领域中非线性预测模型如广义多重分形小波(MWM，multifractal wavelet model)模型^[10]、自回归条件异方差(GARCH，Autoregressive conditional heteroskedasticity model)模型、FARIMA(p，d，q)模型^[11]能够描述流量的非线性特征，但是参数估计、模型拟合存在精度不高的问题。

近年来，借助于大数据采集技术和人工智能技术的快速发展，深度学习逐渐成为非参数化预测模型的热门方向^[12]，受到更多研究者的青睐。早期的浅层学习方法如支持向量回归(SVR，support vector regression)模型^[13]可以较好地解决小样本流量数据的学习问题，但无法依靠对比试验或穷举搜寻获取大样本流量数据的模型参数，严重影响了学习能力和泛化能力。另一方面，浅层学习方法容易捕捉网络流量的时间相关性，但不易捕捉空间特性。多层架构使得5G网络流量存在时空维度的依赖性、异质性，需要同时捕捉以改善流量预测性能。因此，如何借助深度学习的强大学习能力来精准预测大规模、高复杂性的5G网络流量成为运营商高效监管蜂窝网络及提高用户服务质量亟待解决的问题之一。利用卷积神经网络(CNN，convolu-tional neural networks)，文献[14]设计XGBoost模型用于流量预测，实验证明CNN能够有效提取流量的空间特征。文献[15]组合卷积网络与长短时记忆网络形成CONV-LSTM模块，该模块通过提取流量的时空相关性有效降低了预测误差。文献[16]利用皮尔逊(Pearson)相关系数量化基站之间的空间依赖关系，然后采用基于LSTM和栈式自动编码机SAE的混合深度学习模型来预测网络流量。通过准确表达流量的时空相关性，混合模型获得比ARIMA和SVR更优的预测性能。时间卷积网络(TCN，Temporalconvolutional network)^[17]可以充分利用时序数据的历史信息，所以文献[18]提出了基于TCN模型的城市网络流量预测框架，该框架准确捕捉流量的时空演变并用于全市范围内的流量预测，其预测精度分别比LSTM、GRU、SAE提高了15.14％、14.64％、12.23％。针对移动互联网流量预测问题，文献[19]通过叠加CNN与循环神经网络RNN提取的空间与时间相关特征来改善流量预测结果的可靠性。根据移动用户的位置信息，文献[20]提出了基于区域人群的深度时空网络模型，通过分析不同尺度的时空依赖关系和外部特征构建了时空残差网络(ST-ResNet)和LSTM的流量预测模型。文献[21]提出了基于生成对抗网络的流量预测方法，该方法由空间相关性对流量进行聚合，并将聚合结果加入生成器以产生高精度的预测流量。为了提取网络流量在空间维度的差异性，文献[22]提出了一种聚类的蜂窝流量预测算法。首先，聚类算法根据多个蜂窝基站的空间相关性强弱形成不同的簇；然后，对每个基站簇进行流量分析和预测以获得流量的全局时空变迁。上述基站簇的形成主要依据蜂窝基站的位置，然而5G异构网络场景下微基站、微微基站在宏基站的通信覆盖范围内，无法对不同类型基站进行聚类，因此预测流量时需要分别捕捉宏基站、微基站与微微基站的时空特性。

发明内容

针对5G网络流量的时空特性，本发明提出一种基于生成对抗网络(GenerativeAdversarial Network，GAN)的流量预测模型：

首先，生成网络分别捕捉历史流量的时空特征与基站的类型特征，将拼接特征输入复合残差模块生成预测流量，并将生成流量输入判别网络；

接着，判别网络判断生成流量是真实流量还是预测流量；(预测流量进入判别网络进行真假判断；)

最后，经过生成网络与判别网络的博弈对抗，使生成网络生成高精度的预测流量。(在生成网络与判别网络相互博弈过程中生成高精度的预测流量。)

实验结果表明，GAN的二维均方根预测误差分别比2DCNN、3DCNN和ConvLSTM降低了58.64％、38.74％和34.88％，具有最优的流量预测性能。GAN模型能有效提高5G网络流量预测的准确率，成为运营商高效分配和管理网络资源的有力工具。

附图说明

图1是5G网络系统模型图

图2(a)和图2(b)分别是小区(85，30)和(37，42)的流量动态变化曲线图；

图3是5G网络流量的3D示意图

图4是基于生成对抗网络的网络流量预测模型架构图

图5是100个小区从2013年12月17日8、9、10和11点四个时间的Pearson相关系数矩阵对比图；

图6是三维卷积捕捉流量时空特性的示意图

图7是基于GAN的网络流量预测模型图

图8是基于GAN的流量预测模型的流程图

图9是不同参数设置下GAN模型流量预测效果对比图

图10(a)～图10(c)分别是周期性参数为24、144和312时，ARIMA和GAN的流量预测性能对比图；

图11是四种方法的流量预测图

图12是四种方法的流量预测性能对比图

图12(a)～图12(c)分别是周期性参数q为24、144和312的2DCNN、3DCNN、ConvLSTM和GAN的预测性能对比图。

具体实施方式

下面结合附图与具体实施方式对本发明进一步说明。

一、5G网络流量的时空特性挖掘

1.1、系统模型

面对通信网络容量1000倍提升的需求，5G建立小区加密部署及宏微基站结合的多层网络来提升空间复用，如图1的5G网络系统模型图所示。传输功率高且覆盖范围广的宏基站主要负责基础覆盖；覆盖范围小的低功率微基站、微微基站主要部署在人口稠密的区域，比如交通枢纽、商业圈和旅游景点等，以分担宏基站的部分负载；中心处理器负责监控和管理整个网络。因此5G网络流量分布呈现出多样性、非均匀的特点，给高精度的流量预测带来了挑战。

为了深入探讨5G网络流量预测方法，不妨将城市区域划分为M×N(M＝N＝100)个网格，每个网格代表一个小区。城市区域内部署着I个宏基站，J个微基站和Q个微微基站，它们覆盖范围下的第t个时刻的网络流量可形成一个二维矩阵

其中表示小区(m，n)的流量。若已知流量序列{X_t-p，…，X_t-1，X_t}，则流量预测问题可转化为：通过提取流量序列时空特性建立预测模型，以获得第t+1个时刻的流量矩阵

1.2、网络流量的时空特性

无线业务流量的复杂性使得5G网络流量在时间和空间维度都具有非线性关系，需要充分挖掘其时空特性来提升模型的预测精度。

下面详细分析5G网络流量在时空维度的相关性和差异性。

小区流量是按照时间先后顺序排列而成的一组数据，隐含了自相关性、周期性、波动性等特点。图2(a)和(b)给出了小区(85，30)和(37，42)的流量动态变化曲线，易见2条时序曲线均具有明显的周期性且周期接近24小时，这说明流量序列存在自相关性。另一方面，流量序列也存在差异性，例如白天流量值远大于夜晚流量值；一些突发事件会使小区流量产生较大变化，如图2(b)中第100～125小时，因为小区内通信人数激增形成临时热点，引起了流量的大幅增加。

不同类型基站的广泛部署使得5G网络流量在整个城市范围内分布不均匀，如图3的5G网络流量的3D示意图所示。该3D流量图显示流量在空间维度上具有相关性和差异性共存的现象。例如，热点区域A内各小区流量值相近，具有空间相关性。同时，区域A的流量值要明显高于边缘区域C，这是因为人口稠密的城市中心区域密集部署着大量的微基站和微微基站，使得热点区域的流量呈指数级增长；而人口相对稀少的郊区大多由宏基站覆盖，相对较低的无线业务需求使得流量明显减少。另外，区域B的流量值比区域C高但比区域A低，这是因为不同类型的热点区域部署着不同数量的微基站和微微基站，以便满足不同用户服务需求。例如，白天大型商业区的流量高于周围住宅区。因此，根据区域流量大小将城市范围区分为热点区域、次热点区域和非热点区域(可用不同颜色或灰度等级表示热点、次热点以及非热点区域)，并分别用不同数量的微微基站、微基站和宏基站覆盖。

上述5G网络流量在时间和空间维度上相关性和差异性的分析结果说明，需要设计能够捕捉流量时空特性的预测模型，因此本发明建立基于生成对抗网络的流量预测模型，通过拼接城市网络流量的自相关性和周期性来提高流量预测的准确性。

二、基于生成对抗网络的网络流量预测模型

2.1、生成对抗网络原理

生成对抗网络(GAN)是深度学习中一种无监督学习模型，它采用博弈的思想建立生成网络和判别网络。通过生成网络与判别网络的对抗训练，GAN可依据真实数据的分布生成更像真实数据的人造数据。利用GAN强大的特征学习和数据生成能力，本发明构造基于生成对抗网络的流量预测模型，其架构如图4所示。

运营商在各5G基站配置不同类型的探针用于收集和监测网络流量，这些流量具有多样性、异构性、分布不均匀等特点。因此，图4中GAN将历史流量序列作为生成网络的输入，生成网络通过抓取历史流量的时空特性生成预测流量，再由判别网络来判断哪些是真实流量哪些是预测流量；接着，判别网络将学习经验反向传递给生成网络，使得生成网络可由历史流量生成更精确的预测流量。上述对抗过程中生成网络和判别网络不断优化自身能力，当达到纳什均衡时生成网络生成更真实的预测流量，判别网络更准确地区分出真实流量与预测流量。

2.2、时空特性建模

为了设计出性能优秀的生成器(生成网络)，需要利用三维CNN对网络流量的时空特性建模以提高流量生成精度。根据1.1节讨论可知流量序列形成了一个三维张量，因此可从时间维度观察小区流量的自相关性和周期性。定义参数p表示自相关依赖的大小，则流量序列表示自相关依赖数据；定义参数q表示周期依赖的大小，则流量序列/>表示周期性依赖数据，其中Λ为周期大小。上述两个序列被提取的抽象特征分别为/>和/>同时，可从空间维度观察小区流量的空间相关性和差异性。通常使用如下Pearson相关系数度量目标小区(m，n)和其邻居小区(m′，n′)之间的空间相关性

其中和/>分别为小区(m，n)和(m′，n′)的流量，u，u′分别为小区(m，n)和(m′，n′)的序号。不失一般性，图5中的(a)图～(d)图给出了随机选取的10×10个小区从2013年12月17日8点至11点的Pearson相关系数矩阵，以此反映流量的空间特性。以(a)图为例，小区2与小区3的相关系数为0.83，即具有较强相关性；而小区2与小区9的相关系数为0.15，即具有较强差异性。因此通过Pearson相关系数矩阵可清晰地观察到流量的空间特性。但是，计算大规模网络每个时刻的Pearson相关系数矩阵将导致额外的计算开销，而且不能有效捕获流量空间特性在时间维度上的变化。

相比于传统二维CNN只能在平图上提取空间特性，三维CNN通过增加时间维度来同时捕获时空特性，可应用于流量序列的特征提取。如图6所示，输入集为流量序列组成的三维张量(width×height×depth)，经过相同的三维卷积核运算输出一个高维特征。

具体地，在进行卷积操作时，三维卷积核在height、width维度滑动可捕捉抽象的空间特性，在depth维度滑动可捕捉抽象的时间特性，由此可见三维卷积能够提取到更深层的时空特征，多个三维卷积层会使提取的特征值更加深入、抽象。上述三维卷积过程可表示为

F＝S*f (3)

其中F为输出值，S为输入集，f为三维卷积核。

2.3、基站特征学习

5G网络流量特征既受内部时空因素的制约，又受外部跨域因素如基站类型和部署位置等因素的影响。通常，微微基站、微基站覆盖的热点、次热点区域流量远高于宏基站覆盖的非热点区域，因此可从小区基站类型的角度挖掘该小区流量特征，用以辅助提升流量预测精度。不妨用如下矩阵标注基站类型

其中位于(m，n)的基站类型为宏基站标注为/>微基站标注为微微基站标注为/>因为不同类型基站的流量大小有明显区别，所以可通过研究各基站的历史流量来确定式(4)，然后作为外部影响因素加入流量预测模型。

2.4、基于GAN的网络流量预测模型

本发明的基于GAN的网络流量预测模型包括生成网络与判别网络，如图7所示。

图7左边虚线框给出了生成网络的设计流程图。

1)时空特性模块针对流量的自相关性和周期性分别设计了一个L层网络，每层包括三维卷积(Conv3D)、批量正则化(Batch Normalization，BN)和激活函数ReLU。假设第t个时刻第l∈{1，…，L}层的输出为

其中或/> 表示第l-1层的输出，/>表示第l层的三维卷积核。于是，经过多层特征提取分别获得自相关性和周期性的抽象特征/>和/>并拼接成输出特征

2)基站特征学习模块设计如下：

2层卷积层来挖掘不同类型基站的分布特征，用以获得外部跨域特征输出

其中和/>均为二维卷积核。

3)拼接两个模块特征再输入一个N层的复合残差模块，以避免因网络变深而引起的梯度爆炸或梯度消失现象。该模块各层是非线性操作“Conv+BN+ReLU”，假设第n∈{1，…N}层的输出为

其中表示第n-2层的输出。复合残差模块的输出/>经过非线性激活ReLU就能生成下一时刻的预测流量/>

图7右边虚线框给出了判别网络的设计流程图。判别网络设计了一个6层网络，包含4层卷积层和2层全连接(Full Connected，FC)层。为了加强GAN网络训练的稳定性，卷积操作和正则化操作后选用LeakReLU作为激活函数，于是第m∈{1，…，4}层的输出可表示为

经过4层“Conv+BN+LeakReLU”操作所获的特征被依次输入2个全连接层，再由Sigmoid变换将输出特征映射为真实流量的分类概率。

由图7可知，GAN同时训练生成网络与判别网络。对于给定的流量样本(U_t，X_t+1)，令

其中表示所有输入样本，X_t+1表示真实流量，/>表示生成网络输出的预测流量，Loss_bce(L_D(U_t，L_G(U_t))，1)表示判别网络将预测流量L_G(U_t)判断为真的概率，λ表示学习参数。于是，生成网络的目标函数为

min Loss_G(U_t，X_t+1) (11)

式(11)中最小化||L_G(U_t)-X_t+1||₂使得预测流量更接近于真实流量，最小化Loss_bce(L_D(U_t，L_G(U_t))，1)使得判别网络不能正确区分预测流量的真假。另一方面，令

其中Loss_bce(X_t+1，1)表示输入为真实流量判别为真的概率，表示输入为预测流量值判别为假的概率。于是，判别网络的目标函数为

式(13)显示判别网络最大化将真实流量判别为真的概率，同时最大化将预测流量判别为假的概率。

综上，基于GAN的网络流量预测模型流程图如图8所示。

三、仿真实验与结果分析

下面对本发明基于GAN的网络流量预测模型进行仿真实验，首先对开放流量数据进行预处理以便于模型训练；接着对本发明流量预测模型进行性能分析和评估，对比ARIMA^[7]、2DCNN^[14]、3DCNN^[19]和ConvLSTM^[15]四种方法，以验证本发明方法的有效性和可靠性。

3.1、数据来源和预处理

本发明实验采用的数据集来源于“意大利电信大数据挑战赛”的开放数据^[23]。为了便于收集流量信息，运营商将米兰市分为M×N＝100×100个小区，每个小区实际面积为235×235平方米，小区收集的数据包括短信服务(SMS)、呼叫服务(Call)和Internet业务流量(Traffic)，本发明使用Intemet业务流量。

因为本发明主要探讨5G异构网络的流量预测问题，所以对米兰市Intemet业务流量进行了部分修改：当小区流量值时，该小区分别从属于宏基站、微基站和微微基站的覆盖范围，其三维示意图如图3所示。

3.2、参数设置对网络流量预测性能的影响

为了获取GAN模型最适合的参数，本发明进行多次实验来分析各种参数设置对流量预测性能的影响，其中自相关参数p＝3，周期性参数q＝7，自相关性与周期性的特征提取模块层数L分别为L＝4，8，12，复合残差模块层数N分别为N＝5，10。图9中的(a)图给出了2013年12月4日10点的真实流量图，(b)～(f)图分别给出了不同参数设置的预测流量图，易见(e)图的预测流量最接近真实流量。

对应(a)～(f)图结果，定义二维均方根误差(TRMSE)

为流量预测误差，其中为真实流量，/>为预测流量，/>为X_t+1的平均值。不同参数设置的TRMSE如下表所示。

表1 不同参数设置的TRMSE

表1结果表明：随着特征提取模块层数的增加，可以更好地捕捉流量的自相关性与周期性，因而降低了预测误差；相比于N＝5，复合残差模块层数N＝10可更有效地捕捉时空特征和基站特征的融合特征。过低或过高的网络层数都会影响流量预测精度，不失一般性，后面的实验均采用表1中最优参数设置L＝8，N＝10。

3.3、时间维度上流量预测性能对比

为了分析本发明在时间维度上流量预测的准确度，选取小区(85，30)从2013年12月4日8点至2013年12月17日8点的流量数据作为实验对象，使用ARIMA和GAN模型分别预测该小区24×2小时、24×7小时和24×14小时内的网络流量，即设置周期性参数为q＝24、144、312。图10(a)～图10(c)显示周期性参数为24、144和312时，GAN预测曲线均比ARIMA更接近真实流量(Truth)，特别是高峰时段，GAN通过学习历史流量的时空特性更好地提取了流量的突变规律，但ARIMA仅能提取流量的一般非线性时间特性而使得流量预测误差较大。

针对小区(m，n)从t＝1到t＝T时刻的真实流量序列和预测流量序列定义一维均方根误差(NRMSE)

为流量预测误差，其中为/>的平均值。表2给出了三种参数设置的平均NRMSE，结合图10可知：图10(a)中从第8小时到第18小时、图10(b)中从第60小时到70小时、图10(c)中从第220小时到第240小时，GAN的预测误差比ARIMA分别降低了67.6％、68.07％、71.99％。

表2 两种预测方法的平均NRMSE

3.4、时空维度上流量预测性能对比

为了验证本发明在时空维度上流量预测的准确度，仍然选取2013年12月4日10点的流量数据作为实验对象，分别使用2DCNN、3DCNN、ConvLSTM和GAN四种方法预测米兰市的Intemet业务流量。当周期性参数为24、144和312时，图11显示输入的周期性相关流量数据越多，四种方法的预测效果越好，特别是热点区域预测精度不断提升。但是，2DCNN擅长在空间维度提取流量特征，CovnLSTM擅长在时间维度提取流量特征，这两种从单维度进行建模的流量预测方法准确性不理想。3DCNN能在时空两个维度提取流量特征，其预测精度优于2DCNN和CovnLSTM。在3DCNN的基础上，GAN联合流量时空特性与基站特征学习获得了最优的流量预测结果，特别是能以高精度预测出热点区域的流量，为后续设计资源调度方案提供了可靠依据。对应图11，表3给出了四种方法的流量预测误差，易见在三种周期性参数下GAN的TRMSE分别比2DCNN、3DCNN和ConvLSTM平均降低了58.64％、38.74％和34.88％。

表3 四种方法的TRMSE

由图10(a)可见，每天8点至20点之间网络流量形成“上升-高峰-下降”的规律，其他时间段流量值较小，这与人们生活规律一致。下面实验针对2013年12月20日至2013年12月25日流量规律变化的部分，先计算第i天8点至20点的每小时TRMSE，再计算其单日平均误差(DRMSE)

其中TRMSE_i，t表示第i天第t个小时的TRMSE。图12(a)～图12(c)给出了2DCNN、3DCNN、ConvLSTM和GAN的预测性能对比图。与图11的实验结果相似，随着周期性参数q从24变化到144、312，图12(a)～图12(c)中四种方法的DRMSE均逐渐下降，例如图12(c)中2DCNN、3DCNN、ConvLSTM和GAN的DRMSE比图12(a)降低了15.4％、18.4％、14％和27.1％。GAN预测流量时充分考虑了5G网络的异构性，匹配流量特征与基站类型使得生成网络可深入学习到不同基站的流量变化规律而产生更接近于真实流量的预测流量。因此，图12(a)～图12(c)中GAN的DRMSE都远小于另三种方法，特别是图12(c)中GAN的预测精度比2DCNN、3DCNN、ConvLSTM提高了52.2％、28.6％、24.9％。

综上可见，本发明通过时空特性建模和基站特征学习，在生成网络和判别网络的博弈对抗过程中生成了更精确的预测流量，显著提升了流量预测性能。

5G网络复杂环境下高精度流量预测对网络资源规划和调度具有重要意义，有助于网络数据的可靠、高效传输。本发明提出了基于生成对抗网络的流量预测模型，首先通过生成网络捕捉历史流量的时空特征，再辅助基站类型特征生成预测流量；然后经过判别网络的识别，在生成网络与判别网络相互博弈中最终生成高精度的预测流量。仿真实验表明GAN比2DCNN、3DCNN、ConvLSTM三种方法获得更精确的预测流量，在优化5G网络资源部署与分配，提高流量管理的智能性和可靠性，尤其在大规模城市的5G蜂窝网络方面具有更好的应用前景。

参考文献：

[1]LI S C，XU L D，ZHAO S S.5G internet of things：a survey[J].Journalof Industrial Information Integration，2018，10：1-9.

[2]GHOSH A，MAEDER A，BAKER M，et al.5G evolution：a view on 5G cellulartechnology beyond 3GPP release 15[J].IEEE Access，2019，7(99)：127639-127651.

[3]杨芫，徐明伟，陈浩.5G/后5G部署对互联网主干影响的分析与建模[J].通信学报，2019，40(8)：36-44.

YANG Y，XU M W，CHEN H.Analysis and modeling of Internet backbonetraffic with 5G/B5G[J].Journal on Commumcations，2019，40(8)：36-44.

[4]ZHU C B，CHENG X Z，YE HN，et al.5G wireless networks meet big datachallenges，trends，and applications[C]//2019 IEEE SmartWorld，UbiquitousIntelligence&Computing，Advanced&Trusted Computing，Scalable Computing&Communications，Cloud&Big Data Computing，Internet of People and Smart CityInnovation.2019，1513-1516.

[5]LIU X L，NIRWAN A.Dual-battery enabled profit driven userassociation in green heterogeneous cellular networks[J].IEEE Transactions onGreen Communications&Networking，2018，1002-1011.

[6]XU F L，LIN Y Y，HUANG J X，et al.Big data driven mobile trafficunderstanding and forecasting：a time series approach[J].Services ComputingIEEE Transactions on，2016，9(5)：796-805.

[7]KUSDARWATI H，HANDOYO S.System for prediction of non stationarytime series based on the wavelet radial bases function neural network model[J].International Journal of Electrical&Computer Engineering，2018，8(4)：2327-2337.

[8]LI R P，ZHAO Z F，ZHENG J C，et al.The learning and prediction ofapplication-level traffic data in cellular networks[J].IEEE Transactions onWireless Communications，2016，16(99).

[9]高佰宏，刘朝晖，刘华.基于SCSO-GRU模型的网络流量预测[J].计算机与现代化，2020，No.296(04)：76-81+88.

GAO B H，LIU Z W，LIU H.Network traffic prediction based on SCSO-GRUmodel[J].Computer and Modernization，2020，No.296(04)：76-81+88.

[10]徐伟刚.基于网络信息流的自适应MWM模型研究[J].西南师范大学学报(自然科学版)，2015(09)：48-53.

XU W G. On adaptive MWM model based on network information flow[J].Journal of Southwest China Normal University(Natural Science Edition)，2015(09)：48-53.

[11]林志达，吕华辉.小波系数感知的网络流量预测机制[J].太赫兹科学与电子信息学报，2019，017(001)：131-135.

LING Z D，LV H H.Wavelet coefficient aware network traffic prediction[J].Journal of Terahertz Science and Electronic Information Technology，2019，017(001)：131-135.

[12]ZHANG C Y，PARTRAS P.Long-Term mobile traffic forecasting usingdeep spatio-temporal neural networks[C]//Proceedings of the Eighteentth ACMInternational Symposium on Mobile Ad Hoc Networking and Computing(Mobihoc′18).Association for Computing Machinery，2018，231-240.

[13]WANG D，WANG C C，XIAO J H，et al.Bayesian optimization of supportvector machine for regression prediction of short-term traffic flow[J].Intelligent data analysis，2019，23(2)：481-497.

[14]GAO J X，GAO X M，YANG H Y.Short-term traffic flow prediction basedon time-space characteristics[C]//2020 IEEE 5th International Conference onIntelligent Transportation Engineering(ICITE).2020，128-132.

[15]LIU Y P，ZHENG H F，FENG X X，et al.Short-term traffic flowprediction with Conv-LSTM[C]//2017 9th International Conference on WirelessCommu-nications and Signal Processing(WCSP).IEEE，2017，1-6.

[16]WANG J，TANG J，XU Z Y，et al.Spatiotemporal modeling and predictionin cellular networks：A big data enabled deep learning approach[C]//IEEEINFOCOM 2017-IEEE Conference on Computer Communications.IEEE，2017，1-9.

[17]HEWAGE P，BEHERA A，TROVATI M，et al.Temporal convolutional neural(TCN)network for an effective weather forecasting using time-series data fromthe local weather station[J].Soft Computing 24(21)，2020，16453-16482.

[18]ZHAO W T，GAO Y Y，JI T X，et al.Deep temporal convolutionalnetworks for short-term traffic flow forecasting[J].IEEE Access，2019，114496-114507.

[19]HUANG C H，CHIANG C T，LI Q H.A study of deep learning networks onmobile traffic forecasting[C]//2017 IEEE 28th Annnual International Sympo-sium on Personal，Indoor，and Mobile Radio Communications(PIMRC).IEEE，2017，1-6.

[20]胡铮，袁浩，朱新宁，倪万里.面向5G需求的人群流量预测模型研究[J].通信学报，2019，40(2)：1-10.

HU Z，YUAN H，ZHU X N，et al.Research on crowd flows prediction modelfor 5G demand[J].Journal on Communications，2019，40(2)：1-10.

[21]HAN L Y，ZHENG K，ZHAO L，et al.Content-aware traffic datacompletion in ITS based on generative adversarial nets[J].IEEE Transactionson Vehic-ular Technology，2020，11950-11962.

[22]ALDHYANI T H H，ALRASHEED M，ALQARNI A A，et al.Intelligent hybridmodel to enhance time series models for predicting network traffic[J].IEEEAccess，2020，130431-130451.

[23]BARLACCHI G，NADAI M D，LARCHER R，et al.A multi-source dataset ofurban life in the city of Milan and the Province of Trentino[J].ScientificData，2015，2(1)：150055.

Claims

1.一种基于生成对抗网络的网络流量预测方法，其特征是步骤包括：

一)收集历史流量，把这些历史流量作为生成网络的输入；生成网络生成预测流量；

二)预测流量和真实流量作为判别网络的输入，由判别网络来判断哪些是真实流量哪些是预测流量；

还包括步骤三)，判别网络将学习经验反向传递给生成网络，使得生成网络由历史流量生成更真实的预测流量；

所述流量为区域内的网络流量；

所述步骤一)中：

生成网络包括：

1)时空特性模块

针对流量的自相关性和周期性分别设计了一个L层网络，每层包括三维卷积Conv3D、批量正则化BN和激活函数ReLU；则第t个时刻第l∈{1,…,L}层的输出为

其中或/> 表示第l-1层的输出，f_t ^l表示第l层的三维卷积核；流量序列表示自相关依赖数据；流量序列/>表示周期性依赖数据；

于是，分别获得自相关性依赖的抽象特征和周期性依赖的抽象特征/>并拼接成时空特性模块的输出特征

2)基站特征学习模块

针对基站类型设计一个2层卷积层来挖掘不同类型基站的分布特征，每层包括二维卷积Conv、批量正则化BN和激活函数ReLU；通过基站类型获得外部跨域输出特征

其中和/>分别为第1、2层网络的二维卷积核；

3)复合残差模块

复合残差模块是N层卷积层的网络；每层卷积层包括二维卷积Conv、批量正则化BN和激活函数ReLU；

拼接时空特性模块和基站特征学习模块的输出特征后，输入到复合残差模块中；

设第n∈{1,…,N}层卷积层的输出为

其中表示第n-2层的输出；f_t ⁿ为第n层网络的二维卷积核；

复合残差模块的输出再经过非线性激活函数ReLU生成下一时刻的预测流量

所述步骤二)中：

判别网络是一个6层网络，包含4层卷积层和2层全连接层FC；卷积操作和正则化操作后采用LeakReLU作为激活函数，则第m∈{1,…,4}层卷积层的输出表示为

经过4层Conv+BN+LeakReLU操作所获的特征被依次输入2到个全连接层FC，再由Sigmoid变换将输出特征映射为真实流量的分类概率。

2.根据权利要求1所述的基于生成对抗网络的网络流量预测方法，其特征是所述步骤一)中：

时空特性模块中，流量序列形成了一个三维张量，从时间维度观察流量的自相关性和周期性：

定义参数p表示自相关依赖的大小，则流量序列表示自相关依赖数据；定义参数q表示周期依赖的大小，则流量序列/>表示周期性依赖数据，其中Λ为周期大小，这两个序列被提取的自相关依赖和周期性依赖的抽象特征分别为/>和/>

在生成网络中，采用三维卷积神经网络通过增加时间维度来同时捕获时空特性，用于流量序列的特征提取：生成网络的输入集为流量序列组成的三维张量width×height×depth，经过相同的三维卷积核运算输出一个高维特征；在进行卷积操作时，三维卷积核f_t ^l在height、width维度滑动来捕捉抽象的空间特性，在depth维度滑动来捕捉抽象的时间特性；

基站特征学习模块中，从小区基站类型的角度挖掘该小区流量特征，用以辅助提升流量预测精度：

用如下矩阵标注基站类型

其中位于(m,n)的基站类型为宏基站标注为/>微基站标注为微微基站标注为/>因为不同类型基站的流量大小有明显区别，则通过研究各基站的历史流量来确定式(4)，作为本网络流量预测方法的外部影响因素；

城市区域划分成M×N个网格，M和N分别表示网格总行数和总列数，m和n分别表示小区(m，n)所在网格是第m行、第n列。

3.根据权利要求1所述的基于生成对抗网络的网络流量预测方法，其特征是所述步骤三)中：生成网络和判别网络在对抗过程中不断优化自身能力，当达到纳什均衡时，生成网络生成更真实的预测流量，判别网络更准确地区分出真实流量与预测流量，具体为，对于给定的流量样本：

3.1)固定生成网络参数，把生成网络输出的预测流量和真实流量输入到判别网络进行判别训练；

3.2)根据判别网络的判别结果更新判别网络的训练参数；

3.3)比较判断预测流量与真实流量：

如果预测流量与真实流量相似，则结束训练；

如果预测流量与真实流量不相似，则：固定判别网络参数，将输入集输入到生成网络来生成预测流量，再根据判别网络的判别结果更新生成网络参数。

4.根据权利要求3所述的基于生成对抗网络的网络流量预测方法，其特征是

对于给定的流量样本(U_t,X_t+1)：

a、令Loss_G(U_t,X_t+1)＝||L_G(U_t)-X_t+1||₂+λLoss_bce(L_D(U_t,L_G(U_t)),1) (10)

其中表示所有输入样本，X_t+1表示真实流量，/>表示生成网络输出的预测流量，Loss_bce(L_D(U_t,L_G(U_t)),1)表示判别网络将预测流量L_G(U_t)判断为真的概率，λ表示学习参数；

于是，生成网络的目标函数为

minLoss_G(U_t,X_t+1) (11)

式(11)的目标函数中，最小化||L_G(U_t)-X_t+1||₂使得预测流量更接近于真实流量，最小化Loss_bce(L_D(U_t,L_G(U_t)),1)使得判别网络不能正确区分预测流量的真假；

b、令

其中Loss_bce(X_t+1,1)表示输入为真实流量判别为真的概率，表示输入为预测流量值判别为假的概率；于是，判别网络的目标函数为

式(13)的目标函数显示判别网络最大化将真实流量判别为真的概率，同时最大化将预测流量判别为假的概率。

5.根据权利要求1所述的基于生成对抗网络的网络流量预测方法，其特征是所述网络流量是由各5G基站配置的探针收集和监测的网络流量；基于生成对抗网络的网络流量预测方法适用于5G网络。