CN114880363A

CN114880363A - 一种数据中心流量预测系统及训练方法、预测方法

Info

Publication number: CN114880363A
Application number: CN202210196596.1A
Authority: CN
Inventors: 王兆华; 李振宇; 武庆华
Original assignee: Institute of Computing Technology of CAS
Current assignee: Institute of Computing Technology of CAS
Priority date: 2022-03-02
Filing date: 2022-03-02
Publication date: 2022-08-09

Abstract

本发明提供一种数据中心广域网流量预测系统，用于根据数据中心历史流量信息预测下一时刻流量信息，所述系统包括：两个或者两个以上串联的相关时间图卷积单元、输出模块，其中，所述每个相关时间图卷积单元包括：时间特征学习模块，用于提取以图数据结构表示的数据中心历史流量信息中的时间特征；以及相关依赖特征学习模块，用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征；所述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。

Description

一种数据中心流量预测系统及训练方法、预测方法

技术领域

本发明涉及网络流量工程领域，具体来说，涉及数据中心流量预测技术，更具体地说，涉及针对数据中心广域网流量预测技术，即一种数据中心流量预测系统及训练方法、预测方法。

背景技术

随着计算机互联网的发展，数据中心(Data Center，DC)已成为当今互联网信息化建设的重要基础设施，为实现海量数据的快速存储和高效处理提供了强有力的支撑。数据中心承载着种类繁多的服务与应用，为了向处于不同地域的用户提供低延迟高可靠性的服务，大型云服务提供商通常在不同地理位置部署数十个数据中心，例如Google、Microsoft、Amazon、 Facebook等服务商均在不同的地理位置部署大量的数据中心。这些数据中心通过广域网连接，构成数据中心广域网(DC-WAN)。由于DC-WAN资源昂贵，云服务提供商需要进行流量工程来平衡带宽利用率和网络可用性。近年来，基于软件定义网络和细粒度执行策略的流量工程方法实现了较好的平衡效果，这些方法通常依赖于DC-WAN流量(特别是其中满足用户交互的高优先级流量)的预测结果来执行流量调度和带宽分配策略，流量预测的好坏直接影响流量调度和带宽分配策略的优劣。

然而，DC-WAN流量预测即预测各DC之间的流量(DC之间因支持用户交互的业务通信产生流量，无业务通信不产生流量，因此流量预测的目标对象是DC对)需求面临着许多挑战：

首先，DC对间流量由种类繁多的应用产生，导致流量特征复杂多变，现有DC-WAN流量工程方案通常基于传统统计模型，例如移动平均(MA)、指数加权移动平均(EWMA)和自回归移动平均(ARIMA)等模型进行DC-WA N流量预测，这些线性模型无法刻画复杂流量的高维和非线性特征，预测准确度较低。

其次，对大型数据中心网络广域网流量的刻画分析显示，DC-WAN整体流量稳定，但对单组DC对而言，流量变化性显著，动态性更强，且不同D C对流量的动态性存在相关依赖关系，尤其是对于存在拓扑邻接关系和承载应用类型相似的DC对而言。现有技术虽然有使用神经网络模型的方案 (如人工神经网络(ANN))来刻画DC对间流量的非线性时间动态特征，但是此类模型仅仅关注DC对间流量的时间维度特征，未充分挖掘不同DC 对的流量需求之间的相关依赖特征，导致预测准确率受限。

发明内容

因此，本发明的目的在于克服上述现有技术的缺陷，提供一种能够充分挖掘不同DC对的流量需求之间的相关依赖特征使预测准确率高的数据中心广域网流量预测系统及方法。

根据本发明的第一方面，提供一种数据中心广域网流量预测系统，用于根据数据中心历史流量信息预测下一时刻流量信息，所述系统包括：两个或者两个以上串联的相关时间图卷积单元、输出模块，其中，所述每个相关时间图卷积单元包括：时间特征学习模块，用于提取以图数据结构表示的数据中心历史流量信息中的时间特征；以及相关依赖特征学习模块，用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征；所述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。

优选的，所述系统包括2个串联的相关时间图卷积单元。

优选的，所述时间特征学习模块被配置为门控卷积，其中，串联在前的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第一预设输出通道数的一维因果卷积和门控线性单元；串联在后的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第二预设输出通道数的一维因果卷积和门控线性单元。

优选的，所述相关依赖特征学习模块被配置为图卷积，其中，串联在前的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第一预设输出通道数；串联在后的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第二预设输出通道数。

在本发明的一些实施例中，所述第一预设卷积核大小为3，第二预设卷积核大小为3，第一预设输出通道数为32，第二预设输出通道数为64。

优选的，所述每个相关时间图卷积单元还包括：批量归一化层，用于对相关依赖特征学习模块的输出进行批量归一化操作。

优选的，所述输出模块包括：输出门控卷积，其包含一维因果卷积和门控线性单元，用于对相关时间图卷积单元的输出进行处理以使其在时间维度上从多步预测映射到单步预测得到单步预测的中间结果；全连接层，用于将输出门控卷积获得的单步预测中间结果进行线性变换以使其在特征维度上从多通道映射到单通道以得到流量预测结果。其中，输出门控卷积的卷积核大小即为相关时间图卷积单元的输出在时间维度上的特征数目，输出门控卷积的输出通道数即为相关时间图卷积单元的输出的通道数。

根据本发明的第二方面，提供一种用于本发明第一方面所述的数据中心广域网流量预测系统的训练方法，所述方法包括:S1、获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵，其中，所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列，所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵，以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集；S2、采用数据集将初始数据中心流量预测系统进行多轮迭代训练至收敛。

优选的，所述步骤S1中对数据中心历史流量数据进行如下预处理： S11、获取数据中心广域网若干历史流量数据，以预设的时间长度为步长，在每个时刻获取数据中心对对应的历史流量时间序列；S12、以数据中心对为节点、根据数据中心对之间的拓扑邻接关系和承载应用类型的相似性构建数据中心之间的流量需求图表示，并通过如下方式计算数据中心对流量间的相关性权重:

其中|ρ_pq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对值，e_pq为图节点p和q之间的边，e_pq∈E代表节点p和q之间存在边，E 表示图中边的集合。

优选的，通过如下方式计算皮尔逊相关系数：

其中，T_p是DC对p的流量时间序列，T_q是DC对q的流量时间序列， cov(·)为协方差运算符，σT_p为T_p的标准差，σT_q为T_q的标准差。

优选的，所述步骤S2中的训练过程中，采用均方误差作为损失函数，并使用RMSprop优化器迭代更新系统参数。

优选的，在所述步骤S2中，采用数据集将初始数据中心流量预测系统进行100轮的迭代训练，训练样本批大小设置为32，初始学习率设置为 0.001，并将学习衰减率设置为每5轮衰减0.7。

根据本发明的第三方面，提供一种数据中心流量预测方法，所述方法包括：Y1、响应于流量预测的需求，获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵，其中，所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列，所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵，以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集；Y2、将流量输入数据以及数据中心对之间的流量相关性权重矩阵输入如本发明第二方面所述方法训练的数据中心流量预测系统进行预测获得下一时刻数据中心流量预测结果。

根据本发明的第四方面，提供一种数据中心流量工程方法，所述方法包括：P1、采用如本发明第三方面所述的方法进行流量预测获得数据中心下一时刻流量预测结果；P2、根据步骤P1的数据中心流量预测结果进行流量调度和带宽分配。

与现有技术相比，本发明的优点在于：本发明通过充分刻画DC对间流量的时间动态特征和各DC对流量的相关依赖特征，实现了DC-WAN流量的准确预测。

附图说明

以下参照附图对本发明实施例作进一步说明，其中：

图1为根据本发明实施例的图结构表示DC之间的网络流量需求示意图；

图2为根据本发明实施例的门控卷积结构示意图；

图3位根据本发明实施例的数据中心流量预测系统结构示意图；

图4为根据本发明实施例的本发明与其他现有技术的预测准确率实验对比结果示意图。

具体实施方式

为了使本发明的目的，技术方案及优点更加清楚明白，以下通过具体实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

为了描述方便，下文以DC代表数据中心，DC-WAN表示数据中心广域网。

本发明的目的在于针对DC-WAN流量的复杂特征，充分利用DC对间流量的时间动态性和各DC对流量的相关依赖性，提出一种适用于数据中心广域网流量工程的准确率更高的DC-WAN流量预测方法，为后续流量工程策略提供更加可靠的策略执行依据。

本发明为了更准确的预测DC-WAN流量，从而为DC-WAN流量工程提供更可靠的策略执行依据，以提升数据中心网络的带宽利用率和网络可用性，针对DC对间流量的时间动态性和各DC对流量的相关依赖性，提出了一种基于图卷积网络的数据中心广域网流量预测系统及系统训练方法。由于系统的训练方法是现有技术，本发明仅从系统的结构、数据集的选取、损失函数的设定几个部分来详细介绍本发明。

第一部分：数据的预处理。

根据本发明的一个实施例，本发明使用图结构表示DC对之间的网络流量需求，其中，图中节点即代表各组DC对的流量需求，节点之间存在的边表示对应的两组DC对的流量动态特征存在显著的相关依赖关系(其中，需要说明的是，DC对是指DC-WAN中的任意两个DC，DC之间由于业务发生通信才会产生流量，因此，流量时间序列是以DC对为目标进行统计的)。本发明通过DC对之间的拓扑邻接关系和承载应用类型的相似性来定义DC 对流量动态特征间的相关依赖关系，以及通过计算不同DC对的流量时间序列之间的皮尔逊相关系数来衡量相关性权重值，并基于此构建图的加权邻接矩阵，此种基于图的建模方法能够联合刻画DC对间流量的时间动态特征和各DC对流量的相关依赖特征。

需要说明的是，DC-WAN流量预测是根据多组DC对(DC对的数量是由 DC-WAN中DC的数量确定，DC-WAN中的任意两个DC组成一组DC对，本发明以DC-WAN中有N组DC对来进行说明)若干个历史时间间隔(历史时间间隔可人为设定，本发明以F个时间间隔来进行说明)的流量数据来预测未来时刻DC对的流量信息，即流量预测的输入是前F个时间间隔的N组DC对的历史流量数据，本发明将其表示为

流量预测的输出为下一个时间间隔N组DC对的流量预测值，将其表示为

其中，X中的每组DC对的流量并非相互独立，而是与其他DC对流量间存在流量动态性上的相关关系，因此充分挖掘DC对流量间的相关依赖关系有助于更加准确的进行流量预测。

根据本发明的一个实施例，本发明采用余弦相似度来衡量两组DC对承载业务类型的相似程度。具体地，定义每组DC对承载的各类型业务的流量分布向量为

其中s_m代表该DC对承载的第m个类型业务的流量值。两组DC对(p和q)承载的各类型业务的流量分布向量S_p和S_q之间的余弦相似度定义为：

当余弦相似度超过0.8时认为两组DC对(p和q)承载应用类型相似，两组DC对流量间具有相关性。另外，本发明通过计算DC对的流量时间序列之间的皮尔逊相关系数ρ来衡量DC对流量间的相关性权重，定义如下：

其中，T_p是DC对p的流量时间序列，T_q是DC对q的流量时间序列， cov(·)为协方差运算符，σT_p为T_p的标准差，σT_q为T_q的标准差。需要说明的是本发明使用ρ的绝对值来反映相关性权重，即|ρ|越大，T_p和T_q之间的相关性越强，本发明设定相关性权重的阈值为0.6，当两组DC对流量之间的相关性权重大于或等于0.6时，则该两组DC对之间存在显著的相关依赖性。

如前面所述的，为了更准确的进行流量预测，需要联合捕捉DC对间流量的时间动态特性和各DC对流量的相关依赖特征，为了实现该目的，本发明使用图结构数据定义流量预测的输入X。具体地，定义一个如图1所示的无向图G_t＝(V_t,E,W)，其中，以DC对为节点，V_t为图的节点集合，对应于N组DC对的t时刻的流量值，即将X_t视作第t个时间间隔的图信号；E是图的边的集合，图中节点间存在边说明DC对之间存在拓扑邻接关系或者承载的应用类型相似；

表示图G_t的加权邻接矩阵，其中，矩阵中的权重w_pq代表图中节点p和q(DC对p和q)之间的边的权重，使用DC 对p和q的流量相关性定义如下：

其中|ρ_pq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对值，e_pq为图节点p和q之间的边，e_pq∈E代表节点p和q之间存在边。节点p和q(DC对p和q)之间的边的权重大于0表示DC对流量间存在显著的相关依赖性，即两组DC对流量时间序列之间的皮尔逊相关系数的绝对值大于或等于0.6。

通过上述预处理过程，可以获得DC-WAN历史数据中图结构对应的相关性权重，可表示为W,以DC-WAN中N组DC对历史流量时间序列和对应的加权邻接矩阵组成数据集。优选的，在本发明的实例中，DC-WAN历史数据中每个历史时刻的图结构共享相同的相关性权重，即使用同一个W，W使用过去一段较长时间的DC对的历史流量时间序列计算得到，并且W可根据实际情况按照上述处理过程进行更新。

第二部分：系统的构建。

如背景技术所述的，现有技术下的DC-WAN流量预测没有考虑到DC对流量间的相关依赖特性，导致预测不准确，本发明为了解决该问题，通过联合捕捉DC对流量的时间动态特性和DC对流量间的相关依赖特性来进行预测。为了实现该目的，本发明通过构建时间特征学习模块刻画DC对间流量的时间动态特性，构建相关依赖特征学习模块刻画各DC对流量间的相关依赖特征，在两个特征的基础上进行流量预测。

根据本发明的一个实施例，本发明采用门控卷积网络构建时间特征学习模块，以刻画DC对间流量的时间动态特征，即在前面第一部分所述的数据预处理阶段构建的DC对的流量需求对应的图结构中学习图中各节点流量的时间依赖特征。根据本发明的一个实施例，如图2所示，门控卷积由一个一维因果卷积，后跟一个用于添加非线性的门控线性单元(GLU)构成，其在输入的DC对间流量时间序列上迭代地探索捕捉流量的时间动态特征。其中，一维因果卷积和门控线性单元的原理是本领域公知，此处不做赘述，本发明从卷积核和输出通道的设置以及具体应用方面展开说明。根据本发明的一个实施例，一维因果卷积的卷积核大小为K_t，使用一维因果卷积在一维时间序列上对DC对的时间流量序列进行卷积，并与后面的门控线性单元一起补充流量的时间特征，此处需要说明的是卷积未采用填充操作。

对于所有N组DC对，门控卷积的输入为一个长度为F、维度为N且通道数为1的流量观察值时间序列

门控卷积在输入流量时间序列上以大小为K_t的视野迭代的计算流量的时间动态特征。根据本发明的一个实施例，门控卷积用卷积核定义为：

其中

为门控卷积算子，C_Γ为门控卷积的输出通道数，其实现过程是：首先由一维因果卷积将输入x(x∈X)映射到

(其中，[A,B]整体为一维因果卷积的输出，A,B为将输出按照相同的通道数一分为2得到)，A和B拥有相同的通道数C_Γ，作为GLU的输入。在 GLU中，⊙表示元素乘法的运算符，sigmoid函数门σ(B)控制当前状态的哪些输入A与发现的时间动态特征相关。最终，门控卷积网络的输出为

根据本发明的一个实施例，本发明使用图卷积网络构建相关依赖特征学习模块，以刻画各DC对流量之间的相关特征，即学习在时间特征学习模块中得到的各个图节点流量时间动态特征之间的相关依赖特征。图卷积是卷积神经网络(CNN)在图类型数据上的扩展，本发明利用基于谱的图卷积通过图上的傅里叶变换将图节点映射到频域空间，进而学习DC对流量时间动态特征之间的相关依赖特征。由于图卷积是本领域常用卷积网络，此处不对图卷积本身的网络结构做详细描述，仅从图卷积在本发明中的应用层面展开描述。

图卷积网络的输入由时间门控卷积网络的输出得到，即为

在X^(Γ)上使用基于谱的图卷积以提取各DC对的流量动态特征之间的相关特征。具体而言，图卷积可以用卷积核Θ定义如下：

其中

是图卷积算子，L是图的拉普拉斯矩阵，L＝D–W，W表示流量需求图的加权邻接矩阵，D是D_ij＝∑_jW_ij的对角矩阵，C_Θ为图卷积的输出通道数。根据本发明的一个实施例，为了减少参数数量和降低计算复杂度，本发明使用切比雪夫多项式逼近[10]来限制卷积核的大小为K_s，即图卷积通过多项式近似递归地计算图G_t中每个节点在K_s半径内的局部卷积，最终，相关图卷积网络的输出为

通过上述实施例构建的时间特征学习模块和相关依赖特征学习模块，可以联合捕捉到DC-WAN中DC对流量的时间动态特征和DC对流量间的相关依赖特征。为了更好的进行预测，本发明采用上述实施例构建的时间特征学习模块和相关依赖特征学习模块组成可扩展的相关时间卷积模块(表示为IT-Conv)，并通过串联至少两组IT-Conv来充分挖掘DC对间流量的时间动态特性和相关依赖特征。如图3所示，根据本发明的一个实施例，本发明的数据中心流量预测系统包括串联的两组IT-Conv模块和一个输出模块，其中，输出模块由门控卷积和全连接层串联构成，用于整合特征并产生最终的流量预测结果。具体地，如图3所示，将t时刻前F个时间间隔的N组DC对的历史流量数据

以及对应的加权邻接矩阵

输入到数据中心流量预测系统，由第一个IT-Conv模块的门控卷积Γ₁对输入数据的时间动态特征进行刻画得到输出

然后再由第一个IT-Conv模块的图卷积Θ₁基于

和加权邻接矩阵W对相关依赖特征进行刻画得到输出

然后再经过第二IT-Conv模块的处理继续进行时间动态特征和相关依赖特征的提取依次获得输出

和

同时为了防止过拟合，本发明在每一个IT-Conv模块中在图卷积后增加一个批量归一化层。经过串联的两个IT-Conv模块后充分挖掘了DC对间流量的时间动态特征与相关依赖特征得到输出

再由输出模块对其进行特征整合，在输出模块中，首先使用卷积核大小为F-2K_t+2的门控卷积Γ_o将两组IT-Conv模块的输出X^(O)在时间维度上从多步预测映射到单步预测得到

然后使用全连接层(FC)将

在特征维度上从多通道

映射到单通道，即在FC中对

执行一个线性变换

其中w_f为权重向量且b_f为偏移向量(权重向量和偏移向量是通过模型训练学习得到的)，最终得到t+1时间间隔的流量预测结果

根据本发明的一个实施例，本发明的数据中心流量预测系统中的门控卷积和图卷积的卷积核大小K_t＝K_s＝3；两组IT-Conv模块中门控卷积和图卷积的输出通道数分别为

第三部分：系统的训练。

如前面第二部分所述的，本发明完成了系统的构建，由于系统主要基于神经网络构建，为了获得更好的效果，需要对其进行训练，主要包括以下几个步骤：

步骤1、采用本发明第一部分介绍的方法对DC-WAN中的DC对历史流量数据进行预处理，包括：获取各DC对的历史流量时间序列；分析各DC 对历史流量时间序列之间的相关依赖关系，依据DC对的拓扑邻接关系和承载应用类型的相似性构建DC对间流量需求的图表示，并通过计算DC对的历史流量时间序列之间的皮尔逊相关系数得到DC对流量间的相关性权重矩阵，即DC对间流量需求图的加权邻接矩阵，用于后续模型执行图卷积以提取相关依赖特征；将获取的各DC对的历史流量时间序列数据按照模型的输入维度进行规整，并进行归一化操作，得到DC对流量输入数据，并将DC对流量输入数据和DC对流量间的相关性权重矩阵一起作为模型的输入，构成训练数据集。

步骤2、对采用本发明第二部分介绍的方法构建好的初始数据中心流量预测系统进行权值初始化，将流量输入数据与DC对流量间的相关性权重矩阵输入系统，并对系统输出经反归一化操作后得到流量预测输出值；使用损失函数计算预测输出值与期望值之间的误差，当误差大于预期时，根据求得的误差迭代更新模型权重，直至误差小于预期，结束训练。根据本发明的一个实施例，本发明使用流量预测值与真实观察值之间的均方误差(MSE)作为损失函数，使用RMSprop优化器来迭代更新模型权重，以最小化MSE。根据本发明的一个实施例，本发明对系统训练100个epoch，批大小设置为32，初始学习率设置为0.001且每经5个epoch即以0.7的衰减率进行学习率的衰减。

本发明的系统可以以日或周为周期在最新训练集上进行离线训练，训练好的模型可以集成到现有的DC-WAN流量工程系统中，用于对输入的DC 对间历史流量数据进行流量预测。将训练好的系统用于流量预测时，首先将DC对历史流量数据按照输入的维度进行规整并进行归一化操作，得到流量输入数据，然后将流量输入数据与DC对流量间的相关性权重矩阵输入训练好的预测系统，对系统的输出经逆归一化操作后得到流量预测输出值。

综上所述，本发明通过充分刻画DC对间流量的时间动态特征和各DC 对流量的相关依赖特征，实现对DC-WAN流量的准确预测。

为了进一步说明本发明的效果，本发明通过实验来进行验证。实验基于在实际数据中心广域网中采集的覆盖210组DC对的DC对间高优先级流量数据，对本发明的流量预测效果进行评估并与现有技术进行对比。所采集的流量数据的时间间隔为5分钟，实验对于每个DC对，使用过去的12 个历史流量观察值(即过去的60分钟)对未来5分钟的流量值进行预测。对比的现有技术有移动平均(MA)，指数加权移动平均(EWMA)，和长短期记忆网络(LSTM)。其中MA和EWMA为最常见的两种DC-WAN流量估计方法，LSTM为当前最先进的时间序列预测模型。本发明的系统用ITGCN表示，实验的准确率评估结果如图4所示，由图可以看出，对于DC对间高优先级流量的预测效果，与LSTM模型相比，本发明提出的ITGCN将平均绝对百分比误差(MAPE)减少了多达21.6％，与MA和EWMA方法相比，预测误差分别减少了多达36.6％，26.1％。此外，图4中的误差线显示，对于不同DC对的流量，本发明的ITGCN的预测误差具有最小的标准偏差。这些结果证实了ITGCN通过联合挖掘DC对间流量的时间动态特征与相关依赖特征，有效降低了DC-WAN流量的预测误差，提高了预测准确率。

需要说明的是，虽然上文按照特定顺序描述了各个步骤，但是并不意味着必须按照上述特定顺序来执行各个步骤，实际上，这些步骤中的一些可以并发执行，甚至改变顺序，只要能够实现所需要的功能即可。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种数据中心广域网流量预测系统，用于根据数据中心历史流量信息预测下一时刻流量信息，其特征在于，所述系统包括：两个或者两个以上串联的相关时间图卷积单元、输出模块，其中，

所述每个相关时间图卷积单元包括：

时间特征学习模块，用于提取以图数据结构表示的数据中心历史流量信息中的时间特征；以及

相关依赖特征学习模块，用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征；

所述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。

2.根据权利要求1所述的系统，其特征在于，所述系统包括2个串联的相关时间图卷积单元。

3.根据权利要求2所述的系统，其特征在于，

所述时间特征学习模块被配置为门控卷积，其中，串联在前的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第一预设输出通道数的一维因果卷积和门控线性单元；串联在后的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第二预设输出通道数的一维因果卷积和门控线性单元。

4.根据权利要求3所述的系统，其特征在于，

所述相关依赖特征学习模块被配置为图卷积，其中，串联在前的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第一预设输出通道数；串联在后的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第二预设输出通道数。

5.根据权利要求4所述的系统，其特征在于，所述第一预设卷积核大小为3，第二预设卷积核大小为3，第一预设输出通道数为32，第二预设输出通道数为64。

6.根据权利要求5所述的系统，其特征在于，所述每个相关时间图卷积单元还包括：

批量归一化层，用于对相关依赖特征学习模块的输出进行批量归一化操作。

7.根据权利要求6所述的系统，其特征在于，所述输出模块包括：

输出门控卷积，其包含一维因果卷积和门控线性单元，用于对相关时间图卷积单元的输出进行处理以使其在时间维度上从多步预测映射到单步预测得到单步预测的中间结果；

全连接层，用于将输出门控卷积获得的单步预测的中间结果进行线性变换以使其在特征维度上从多通道映射到单通道得到流量预测结果。

8.一种用于权利要求1-7之一的数据中心广域网流量预测系统的训练方法，其特征在于，所述方法包括:

S1、获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵，其中，所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列，所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵，以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集；

S2、采用数据集将初始数据中心流量预测系统进行多轮迭代训练至收敛。

9.根据权利要求8所述的方法，其特征在于，所述步骤S1中对数据中心历史流量数据进行如下预处理：

S11、获取数据中心广域网若干历史流量数据，以预设的时间长度为步长，在每个时刻获取数据中心对对应的历史流量时间序列；

S12、以数据中心对为节点、根据数据中心对之间的拓扑邻接关系和承载应用类型的相似性构建数据中心之间的流量需求图表示，并通过如下方式计算数据中心对流量间的相关性权重:

其中|ρ_pq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对值，e_pq为图节点p和q之间的边，e_pq∈E代表节点p和q之间存在边，E表示图中边的集合。

10.根据权利要求9所述的方法，其特征在于，通过如下方式计算皮尔逊相关系数：

其中，T_p是DC对p的流量时间序列，T_q是DC对q的流量时间序列，cov(·)为协方差运算符，σT_p为T_p的标准差，σT_q为T_q的标准差。

11.根据权利要求8所述的方法，其特征在于，所述步骤S2中的训练过程中，采用均方误差作为损失函数，并使用RMSprop优化器迭代更新系统参数。

12.根据权利要求8所述的方法，其特征在于，在所述步骤S2中，采用数据集将初始数据中心流量预测系统进行100轮的迭代训练，训练样本批大小设置为32，初始学习率设置为0.001，并将学习衰减率设置为每5轮衰减0.7。

13.一种数据中心流量预测方法，其特征在于，所述方法包括：

Y1、响应于流量预测的需求，获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵，其中，所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列，所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵，以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集；

Y2、将流量输入数据以及数据中心对之间的流量相关性权重矩阵输入如权利要求8-12任一所述方法训练的数据中心流量预测系统进行预测获得下一时刻数据中心流量预测结果。

14.一种数据中心流量工程方法，其特征在于，所述方法包括：

P1、采用如权利要求13所述的方法进行流量预测获得数据中心下一时刻流量预测结果；

P2、根据步骤P1的数据中心流量预测结果进行流量调度和带宽分配。

15.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序可被处理器执行以实现权利要求8至12任一所述方法的步骤。

16.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述电子设备实现如权利要求8至12中任一项所述方法的步骤。