CN114880363A - 一种数据中心流量预测系统及训练方法、预测方法 - Google Patents

一种数据中心流量预测系统及训练方法、预测方法 Download PDF

Info

Publication number
CN114880363A
CN114880363A CN202210196596.1A CN202210196596A CN114880363A CN 114880363 A CN114880363 A CN 114880363A CN 202210196596 A CN202210196596 A CN 202210196596A CN 114880363 A CN114880363 A CN 114880363A
Authority
CN
China
Prior art keywords
data center
flow
traffic
time
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210196596.1A
Other languages
English (en)
Inventor
王兆华
李振宇
武庆华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN202210196596.1A priority Critical patent/CN114880363A/zh
Publication of CN114880363A publication Critical patent/CN114880363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据中心广域网流量预测系统,用于根据数据中心历史流量信息预测下一时刻流量信息,所述系统包括:两个或者两个以上串联的相关时间图卷积单元、输出模块,其中,所述每个相关时间图卷积单元包括:时间特征学习模块,用于提取以图数据结构表示的数据中心历史流量信息中的时间特征;以及相关依赖特征学习模块,用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征;所述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。

Description

一种数据中心流量预测系统及训练方法、预测方法
技术领域
本发明涉及网络流量工程领域,具体来说,涉及数据中心流量预测技 术,更具体地说,涉及针对数据中心广域网流量预测技术,即一种数据中 心流量预测系统及训练方法、预测方法。
背景技术
随着计算机互联网的发展,数据中心(Data Center,DC)已成为当今 互联网信息化建设的重要基础设施,为实现海量数据的快速存储和高效处 理提供了强有力的支撑。数据中心承载着种类繁多的服务与应用,为了向 处于不同地域的用户提供低延迟高可靠性的服务,大型云服务提供商通常 在不同地理位置部署数十个数据中心,例如Google、Microsoft、Amazon、 Facebook等服务商均在不同的地理位置部署大量的数据中心。这些数据中 心通过广域网连接,构成数据中心广域网(DC-WAN)。由于DC-WAN资源昂 贵,云服务提供商需要进行流量工程来平衡带宽利用率和网络可用性。近 年来,基于软件定义网络和细粒度执行策略的流量工程方法实现了较好的 平衡效果,这些方法通常依赖于DC-WAN流量(特别是其中满足用户交互 的高优先级流量)的预测结果来执行流量调度和带宽分配策略,流量预测 的好坏直接影响流量调度和带宽分配策略的优劣。
然而,DC-WAN流量预测即预测各DC之间的流量(DC之间因支持用户 交互的业务通信产生流量,无业务通信不产生流量,因此流量预测的目标 对象是DC对)需求面临着许多挑战:
首先,DC对间流量由种类繁多的应用产生,导致流量特征复杂多变, 现有DC-WAN流量工程方案通常基于传统统计模型,例如移动平均(MA)、 指数加权移动平均(EWMA)和自回归移动平均(ARIMA)等模型进行DC-WA N流量预测,这些线性模型无法刻画复杂流量的高维和非线性特征,预测 准确度较低。
其次,对大型数据中心网络广域网流量的刻画分析显示,DC-WAN整体 流量稳定,但对单组DC对而言,流量变化性显著,动态性更强,且不同D C对流量的动态性存在相关依赖关系,尤其是对于存在拓扑邻接关系和承 载应用类型相似的DC对而言。现有技术虽然有使用神经网络模型的方案 (如人工神经网络(ANN))来刻画DC对间流量的非线性时间动态特征, 但是此类模型仅仅关注DC对间流量的时间维度特征,未充分挖掘不同DC 对的流量需求之间的相关依赖特征,导致预测准确率受限。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种能够充 分挖掘不同DC对的流量需求之间的相关依赖特征使预测准确率高的数据 中心广域网流量预测系统及方法。
根据本发明的第一方面,提供一种数据中心广域网流量预测系统,用 于根据数据中心历史流量信息预测下一时刻流量信息,所述系统包括:两 个或者两个以上串联的相关时间图卷积单元、输出模块,其中,所述每个 相关时间图卷积单元包括:时间特征学习模块,用于提取以图数据结构表 示的数据中心历史流量信息中的时间特征;以及相关依赖特征学习模块, 用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结 构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征;所 述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息 中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。
优选的,所述系统包括2个串联的相关时间图卷积单元。
优选的,所述时间特征学习模块被配置为门控卷积,其中,串联在前 的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第一预 设输出通道数的一维因果卷积和门控线性单元;串联在后的相关时间图卷 积单元中的门控卷积包括第一预设卷积核大小和第二预设输出通道数的 一维因果卷积和门控线性单元。
优选的,所述相关依赖特征学习模块被配置为图卷积,其中,串联在 前的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、 输出通道数为第一预设输出通道数;串联在后的相关时间图卷积单元中的 图卷积卷积核大小为第二预设卷积核大小、输出通道数为第二预设输出通 道数。
在本发明的一些实施例中,所述第一预设卷积核大小为3,第二预设 卷积核大小为3,第一预设输出通道数为32,第二预设输出通道数为64。
优选的,所述每个相关时间图卷积单元还包括:批量归一化层,用于 对相关依赖特征学习模块的输出进行批量归一化操作。
优选的,所述输出模块包括:输出门控卷积,其包含一维因果卷积和 门控线性单元,用于对相关时间图卷积单元的输出进行处理以使其在时间 维度上从多步预测映射到单步预测得到单步预测的中间结果;全连接层, 用于将输出门控卷积获得的单步预测中间结果进行线性变换以使其在特 征维度上从多通道映射到单通道以得到流量预测结果。其中,输出门控卷 积的卷积核大小即为相关时间图卷积单元的输出在时间维度上的特征数目,输出门控卷积的输出通道数即为相关时间图卷积单元的输出的通道数。
根据本发明的第二方面,提供一种用于本发明第一方面所述的数据中 心广域网流量预测系统的训练方法,所述方法包括:S1、获取数据中心广 域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据 中心对流量间的流量相关性权重矩阵,其中,所述流量输入数据是数据中 心对对应的预设时间长度的历史流量时间序列,所述流量相关性权重矩阵 是所有数据中心对的流量相关性组成的矩阵,以所有流量输入数据和数据 中心对之间的流量相关性权重矩阵组成数据集;S2、采用数据集将初始数 据中心流量预测系统进行多轮迭代训练至收敛。
优选的,所述步骤S1中对数据中心历史流量数据进行如下预处理: S11、获取数据中心广域网若干历史流量数据,以预设的时间长度为步长, 在每个时刻获取数据中心对对应的历史流量时间序列;S12、以数据中心对 为节点、根据数据中心对之间的拓扑邻接关系和承载应用类型的相似性构 建数据中心之间的流量需求图表示,并通过如下方式计算数据中心对流量 间的相关性权重:
Figure BDA0003527312370000031
其中|ρpq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对 值,epq为图节点p和q之间的边,epq∈E代表节点p和q之间存在边,E 表示图中边的集合。
优选的,通过如下方式计算皮尔逊相关系数:
Figure BDA0003527312370000032
其中,Tp是DC对p的流量时间序列,Tq是DC对q的流量时间序列, cov(·)为协方差运算符,σTp为Tp的标准差,σTq为Tq的标准差。
优选的,所述步骤S2中的训练过程中,采用均方误差作为损失函数, 并使用RMSprop优化器迭代更新系统参数。
优选的,在所述步骤S2中,采用数据集将初始数据中心流量预测系 统进行100轮的迭代训练,训练样本批大小设置为32,初始学习率设置为 0.001,并将学习衰减率设置为每5轮衰减0.7。
根据本发明的第三方面,提供一种数据中心流量预测方法,所述方法 包括:Y1、响应于流量预测的需求,获取数据中心广域网若干历史流量数 据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量 相关性权重矩阵,其中,所述流量输入数据是数据中心对对应的预设时间 长度的历史流量时间序列,所述流量相关性权重矩阵是所有数据中心对的 流量相关性组成的矩阵,以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集;Y2、将流量输入数据以及数据中心对之间的流 量相关性权重矩阵输入如本发明第二方面所述方法训练的数据中心流量 预测系统进行预测获得下一时刻数据中心流量预测结果。
根据本发明的第四方面,提供一种数据中心流量工程方法,所述方法 包括:P1、采用如本发明第三方面所述的方法进行流量预测获得数据中心 下一时刻流量预测结果;P2、根据步骤P1的数据中心流量预测结果进行 流量调度和带宽分配。
与现有技术相比,本发明的优点在于:本发明通过充分刻画DC对间 流量的时间动态特征和各DC对流量的相关依赖特征,实现了DC-WAN流量 的准确预测。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1为根据本发明实施例的图结构表示DC之间的网络流量需求示意 图;
图2为根据本发明实施例的门控卷积结构示意图;
图3位根据本发明实施例的数据中心流量预测系统结构示意图;
图4为根据本发明实施例的本发明与其他现有技术的预测准确率实验 对比结果示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下通过具体 实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅 用以解释本发明,并不用于限定本发明。
为了描述方便,下文以DC代表数据中心,DC-WAN表示数据中心广域 网。
本发明的目的在于针对DC-WAN流量的复杂特征,充分利用DC对间流 量的时间动态性和各DC对流量的相关依赖性,提出一种适用于数据中心 广域网流量工程的准确率更高的DC-WAN流量预测方法,为后续流量工程 策略提供更加可靠的策略执行依据。
本发明为了更准确的预测DC-WAN流量,从而为DC-WAN流量工程提供 更可靠的策略执行依据,以提升数据中心网络的带宽利用率和网络可用性, 针对DC对间流量的时间动态性和各DC对流量的相关依赖性,提出了一种 基于图卷积网络的数据中心广域网流量预测系统及系统训练方法。由于系 统的训练方法是现有技术,本发明仅从系统的结构、数据集的选取、损失 函数的设定几个部分来详细介绍本发明。
第一部分:数据的预处理。
根据本发明的一个实施例,本发明使用图结构表示DC对之间的网络 流量需求,其中,图中节点即代表各组DC对的流量需求,节点之间存在的 边表示对应的两组DC对的流量动态特征存在显著的相关依赖关系(其中, 需要说明的是,DC对是指DC-WAN中的任意两个DC,DC之间由于业务发生 通信才会产生流量,因此,流量时间序列是以DC对为目标进行统计的)。 本发明通过DC对之间的拓扑邻接关系和承载应用类型的相似性来定义DC 对流量动态特征间的相关依赖关系,以及通过计算不同DC对的流量时间 序列之间的皮尔逊相关系数来衡量相关性权重值,并基于此构建图的加权 邻接矩阵,此种基于图的建模方法能够联合刻画DC对间流量的时间动态 特征和各DC对流量的相关依赖特征。
需要说明的是,DC-WAN流量预测是根据多组DC对(DC对的数量是由 DC-WAN中DC的数量确定,DC-WAN中的任意两个DC组成一组DC对,本发 明以DC-WAN中有N组DC对来进行说明)若干个历史时间间隔(历史时间 间隔可人为设定,本发明以F个时间间隔来进行说明)的流量数据来预测 未来时刻DC对的流量信息,即流量预测的输入是前F个时间间隔的N组DC对的历史流量数据,本发明将其表示为
Figure BDA0003527312370000061
流 量预测的输出为下一个时间间隔N组DC对的流量预测值,将其表示为
Figure BDA0003527312370000062
Figure BDA0003527312370000063
其中,X中的每组DC对的流量并非相互独立,而是与其他DC对流量间 存在流量动态性上的相关关系,因此充分挖掘DC对流量间的相关依赖关系 有助于更加准确的进行流量预测。
根据本发明的一个实施例,本发明采用余弦相似度来衡量两组DC对承 载业务类型的相似程度。具体地,定义每组DC对承载的各类型业务的流量 分布向量为
Figure BDA0003527312370000064
其中sm代表该DC对承载的第m个类型业 务的流量值。两组DC对(p和q)承载的各类型业务的流量分布向量Sp和Sq之间的余弦相似度定义为:
Figure BDA0003527312370000065
当余弦相似度超过0.8时认为两组DC对(p和q)承载应用类型相似, 两组DC对流量间具有相关性。另外,本发明通过计算DC对的流量时间序列 之间的皮尔逊相关系数ρ来衡量DC对流量间的相关性权重,定义如下:
Figure BDA0003527312370000066
其中,Tp是DC对p的流量时间序列,Tq是DC对q的流量时间序列, cov(·)为协方差运算符,σTp为Tp的标准差,σTq为Tq的标准差。需要说明的 是本发明使用ρ的绝对值来反映相关性权重,即|ρ|越大,Tp和Tq之间的相关 性越强,本发明设定相关性权重的阈值为0.6,当两组DC对流量之间的相关 性权重大于或等于0.6时,则该两组DC对之间存在显著的相关依赖性。
如前面所述的,为了更准确的进行流量预测,需要联合捕捉DC对间 流量的时间动态特性和各DC对流量的相关依赖特征,为了实现该目的, 本发明使用图结构数据定义流量预测的输入X。具体地,定义一个如图1所 示的无向图Gt=(Vt,E,W),其中,以DC对为节点,Vt为图的节点集合,对 应于N组DC对的t时刻的流量值,即将Xt视作第t个时间间隔的图信号;E是图的边的集合,图中节点间存在边说明DC对之间存在拓扑邻接关系或 者承载的应用类型相似;
Figure BDA0003527312370000067
表示图Gt的加权邻接矩阵,其中,矩阵 中的权重wpq代表图中节点p和q(DC对p和q)之间的边的权重,使用DC 对p和q的流量相关性定义如下:
Figure BDA0003527312370000071
其中|ρpq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对 值,epq为图节点p和q之间的边,epq∈E代表节点p和q之间存在边。节 点p和q(DC对p和q)之间的边的权重大于0表示DC对流量间存在显著的 相关依赖性,即两组DC对流量时间序列之间的皮尔逊相关系数的绝对值大 于或等于0.6。
通过上述预处理过程,可以获得DC-WAN历史数据中图结构对应的相 关性权重,可表示为W,以DC-WAN中N组DC对历史流量时间序列和对应的 加权邻接矩阵组成数据集。优选的,在本发明的实例中,DC-WAN历史数据中 每个历史时刻的图结构共享相同的相关性权重,即使用同一个W,W使用过 去一段较长时间的DC对的历史流量时间序列计算得到,并且W可根据实际 情况按照上述处理过程进行更新。
第二部分:系统的构建。
如背景技术所述的,现有技术下的DC-WAN流量预测没有考虑到DC对 流量间的相关依赖特性,导致预测不准确,本发明为了解决该问题,通过 联合捕捉DC对流量的时间动态特性和DC对流量间的相关依赖特性来进行 预测。为了实现该目的,本发明通过构建时间特征学习模块刻画DC对间 流量的时间动态特性,构建相关依赖特征学习模块刻画各DC对流量间的 相关依赖特征,在两个特征的基础上进行流量预测。
根据本发明的一个实施例,本发明采用门控卷积网络构建时间特征学 习模块,以刻画DC对间流量的时间动态特征,即在前面第一部分所述的 数据预处理阶段构建的DC对的流量需求对应的图结构中学习图中各节点 流量的时间依赖特征。根据本发明的一个实施例,如图2所示,门控卷积 由一个一维因果卷积,后跟一个用于添加非线性的门控线性单元(GLU)构 成,其在输入的DC对间流量时间序列上迭代地探索捕捉流量的时间动态 特征。其中,一维因果卷积和门控线性单元的原理是本领域公知,此处不 做赘述,本发明从卷积核和输出通道的设置以及具体应用方面展开说明。 根据本发明的一个实施例,一维因果卷积的卷积核大小为Kt,使用一维因 果卷积在一维时间序列上对DC对的时间流量序列进行卷积,并与后面的 门控线性单元一起补充流量的时间特征,此处需要说明的是卷积未采用填 充操作。
对于所有N组DC对,门控卷积的输入为一个长度为F、维度为N且通 道数为1的流量观察值时间序列
Figure RE-GDA0003678935480000081
门控卷积在输入流量时间序 列上以大小为Kt的视野迭代的计算流量的时间动态特征。根据本发明的一 个实施例,门控卷积用卷积核定义为:
Figure BDA0003527312370000083
其中
Figure BDA0003527312370000084
为门控卷积算子,CΓ为门控卷积的输出通道数,其实现过 程是:首先由一维因果卷积将输入x(x∈X)映射到
Figure BDA0003527312370000085
(其中,[A,B]整体为一维因果卷积的输出,A,B为将输出按照相同的通 道数一分为2得到),A和B拥有相同的通道数CΓ,作为GLU的输入。在 GLU中,⊙表示元素乘法的运算符,sigmoid函数门σ(B)控制当前状态的哪 些输入A与发现的时间动态特征相关。最终,门控卷积网络的输出为
Figure BDA0003527312370000086
Figure BDA0003527312370000087
根据本发明的一个实施例,本发明使用图卷积网络构建相关依赖特征 学习模块,以刻画各DC对流量之间的相关特征,即学习在时间特征学习 模块中得到的各个图节点流量时间动态特征之间的相关依赖特征。图卷积 是卷积神经网络(CNN)在图类型数据上的扩展,本发明利用基于谱的图卷 积通过图上的傅里叶变换将图节点映射到频域空间,进而学习DC对流量 时间动态特征之间的相关依赖特征。由于图卷积是本领域常用卷积网络, 此处不对图卷积本身的网络结构做详细描述,仅从图卷积在本发明中的应 用层面展开描述。
图卷积网络的输入由时间门控卷积网络的输出得到,即为
Figure BDA0003527312370000088
Figure BDA0003527312370000089
在X(Γ)上使用基于谱的图卷积以提取各DC对的流量动态特 征之间的相关特征。具体而言,图卷积可以用卷积核Θ定义如下:
Figure BDA00035273123700000810
其中
Figure BDA00035273123700000811
是图卷积算子,L是图的拉普拉斯矩阵,L=D–W,W表 示流量需求图的加权邻接矩阵,D是Dij=∑jWij的对角矩阵,CΘ为图卷积 的输出通道数。根据本发明的一个实施例,为了减少参数数量和降低计算 复杂度,本发明使用切比雪夫多项式逼近[10]来限制卷积核的大小为Ks, 即图卷积通过多项式近似递归地计算图Gt中每个节点在Ks半径内的局部 卷积,最终,相关图卷积网络的输出为
Figure BDA0003527312370000091
通过上述实施例构建的时间特征学习模块和相关依赖特征学习模块, 可以联合捕捉到DC-WAN中DC对流量的时间动态特征和DC对流量间的相 关依赖特征。为了更好的进行预测,本发明采用上述实施例构建的时间特 征学习模块和相关依赖特征学习模块组成可扩展的相关时间卷积模块(表 示为IT-Conv),并通过串联至少两组IT-Conv来充分挖掘DC对间流量的 时间动态特性和相关依赖特征。如图3所示,根据本发明的一个实施例, 本发明的数据中心流量预测系统包括串联的两组IT-Conv模块和一个输出 模块,其中,输出模块由门控卷积和全连接层串联构成,用于整合特征并 产生最终的流量预测结果。具体地,如图3所示,将t时刻前F个时间间 隔的N组DC对的历史流量数据
Figure BDA0003527312370000092
以及对应的加权 邻接矩阵
Figure BDA0003527312370000093
输入到数据中心流量预测系统,由第一个IT-Conv模块 的门控卷积Γ1对输入数据的时间动态特征进行刻画得到输出
Figure BDA0003527312370000094
然后再 由第一个IT-Conv模块的图卷积Θ1基于
Figure BDA0003527312370000095
和加权邻接矩阵W对相关依赖 特征进行刻画得到输出
Figure BDA0003527312370000096
然后再经过第二IT-Conv模块的处理继续进 行时间动态特征和相关依赖特征的提取依次获得输出
Figure BDA0003527312370000097
Figure BDA0003527312370000098
同时为 了防止过拟合,本发明在每一个IT-Conv模块中在图卷积后增加一个批量 归一化层。经过串联的两个IT-Conv模块后充分挖掘了DC对间流量的时 间动态特征与相关依赖特征得到输出
Figure BDA0003527312370000099
再由输出模 块对其进行特征整合,在输出模块中,首先使用卷积核大小为F-2Kt+2的门 控卷积Γo将两组IT-Conv模块的输出X(O)在时间维度上从多步预测映射到 单步预测得到
Figure BDA00035273123700000910
然后使用全连接层(FC)将
Figure BDA00035273123700000911
在特征维度 上从多通道
Figure BDA00035273123700000912
映射到单通道,即在FC中对
Figure BDA00035273123700000913
执行一个线性变换
Figure BDA00035273123700000914
Figure BDA00035273123700000915
其中wf为权重向量且bf为偏移向量(权重向量和偏移向量是通过模型 训练学习得到的),最终得到t+1时间间隔的流量预测结果
Figure BDA00035273123700000916
根据本发明的一个实施例,本发明的数据中心流量预测系统中的门控 卷积和图卷积的卷积核大小Kt=Ks=3;两组IT-Conv模块中门控卷积和 图卷积的输出通道数分别为
Figure BDA00035273123700000917
第三部分:系统的训练。
如前面第二部分所述的,本发明完成了系统的构建,由于系统主要基 于神经网络构建,为了获得更好的效果,需要对其进行训练,主要包括以 下几个步骤:
步骤1、采用本发明第一部分介绍的方法对DC-WAN中的DC对历史流 量数据进行预处理,包括:获取各DC对的历史流量时间序列;分析各DC 对历史流量时间序列之间的相关依赖关系,依据DC对的拓扑邻接关系和 承载应用类型的相似性构建DC对间流量需求的图表示,并通过计算DC对 的历史流量时间序列之间的皮尔逊相关系数得到DC对流量间的相关性权 重矩阵,即DC对间流量需求图的加权邻接矩阵,用于后续模型执行图卷 积以提取相关依赖特征;将获取的各DC对的历史流量时间序列数据按照 模型的输入维度进行规整,并进行归一化操作,得到DC对流量输入数据, 并将DC对流量输入数据和DC对流量间的相关性权重矩阵一起作为模型的 输入,构成训练数据集。
步骤2、对采用本发明第二部分介绍的方法构建好的初始数据中心流 量预测系统进行权值初始化,将流量输入数据与DC对流量间的相关性权 重矩阵输入系统,并对系统输出经反归一化操作后得到流量预测输出值; 使用损失函数计算预测输出值与期望值之间的误差,当误差大于预期时, 根据求得的误差迭代更新模型权重,直至误差小于预期,结束训练。根据 本发明的一个实施例,本发明使用流量预测值与真实观察值之间的均方误 差(MSE)作为损失函数,使用RMSprop优化器来迭代更新模型权重,以最 小化MSE。根据本发明的一个实施例,本发明对系统训练100个epoch, 批大小设置为32,初始学习率设置为0.001且每经5个epoch即以0.7的 衰减率进行学习率的衰减。
本发明的系统可以以日或周为周期在最新训练集上进行离线训练,训 练好的模型可以集成到现有的DC-WAN流量工程系统中,用于对输入的DC 对间历史流量数据进行流量预测。将训练好的系统用于流量预测时,首先 将DC对历史流量数据按照输入的维度进行规整并进行归一化操作,得到 流量输入数据,然后将流量输入数据与DC对流量间的相关性权重矩阵输 入训练好的预测系统,对系统的输出经逆归一化操作后得到流量预测输出值。
综上所述,本发明通过充分刻画DC对间流量的时间动态特征和各DC 对流量的相关依赖特征,实现对DC-WAN流量的准确预测。
为了进一步说明本发明的效果,本发明通过实验来进行验证。实验基 于在实际数据中心广域网中采集的覆盖210组DC对的DC对间高优先级流 量数据,对本发明的流量预测效果进行评估并与现有技术进行对比。所采 集的流量数据的时间间隔为5分钟,实验对于每个DC对,使用过去的12 个历史流量观察值(即过去的60分钟)对未来5分钟的流量值进行预测。 对比的现有技术有移动平均(MA),指数加权移动平均(EWMA),和长短 期记忆网络(LSTM)。其中MA和EWMA为最常见的两种DC-WAN流量估计 方法,LSTM为当前最先进的时间序列预测模型。本发明的系统用ITGCN表 示,实验的准确率评估结果如图4所示,由图可以看出,对于DC对间高 优先级流量的预测效果,与LSTM模型相比,本发明提出的ITGCN将平均绝对百分比误差(MAPE)减少了多达21.6%,与MA和EWMA方法相比,预 测误差分别减少了多达36.6%,26.1%。此外,图4中的误差线显示,对于 不同DC对的流量,本发明的ITGCN的预测误差具有最小的标准偏差。这 些结果证实了ITGCN通过联合挖掘DC对间流量的时间动态特征与相关依 赖特征,有效降低了DC-WAN流量的预测误差,提高了预测准确率。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意 味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些 可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以 包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面 的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令 的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁 存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意 合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括: 便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、 可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、 便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软 盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以 及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽 性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范 围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更 都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原 理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术 人员能理解本文披露的各实施例。

Claims (16)

1.一种数据中心广域网流量预测系统,用于根据数据中心历史流量信息预测下一时刻流量信息,其特征在于,所述系统包括:两个或者两个以上串联的相关时间图卷积单元、输出模块,其中,
所述每个相关时间图卷积单元包括:
时间特征学习模块,用于提取以图数据结构表示的数据中心历史流量信息中的时间特征;以及
相关依赖特征学习模块,用于提取经所述时间特征学习模块处理后的包含时间特征的以图数据结构表示的数据中心历史流量信息中的数据中心对之间的相关依赖特征;
所述输出模块用于将相关时间图卷积单元提取到的数据中心历史流量信息中的时间特征和相关依赖特征整合后输出预测的数据中心下一时刻流量。
2.根据权利要求1所述的系统,其特征在于,所述系统包括2个串联的相关时间图卷积单元。
3.根据权利要求2所述的系统,其特征在于,
所述时间特征学习模块被配置为门控卷积,其中,串联在前的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第一预设输出通道数的一维因果卷积和门控线性单元;串联在后的相关时间图卷积单元中的门控卷积包括第一预设卷积核大小和第二预设输出通道数的一维因果卷积和门控线性单元。
4.根据权利要求3所述的系统,其特征在于,
所述相关依赖特征学习模块被配置为图卷积,其中,串联在前的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第一预设输出通道数;串联在后的相关时间图卷积单元中的图卷积卷积核大小为第二预设卷积核大小、输出通道数为第二预设输出通道数。
5.根据权利要求4所述的系统,其特征在于,所述第一预设卷积核大小为3,第二预设卷积核大小为3,第一预设输出通道数为32,第二预设输出通道数为64。
6.根据权利要求5所述的系统,其特征在于,所述每个相关时间图卷积单元还包括:
批量归一化层,用于对相关依赖特征学习模块的输出进行批量归一化操作。
7.根据权利要求6所述的系统,其特征在于,所述输出模块包括:
输出门控卷积,其包含一维因果卷积和门控线性单元,用于对相关时间图卷积单元的输出进行处理以使其在时间维度上从多步预测映射到单步预测得到单步预测的中间结果;
全连接层,用于将输出门控卷积获得的单步预测的中间结果进行线性变换以使其在特征维度上从多通道映射到单通道得到流量预测结果。
8.一种用于权利要求1-7之一的数据中心广域网流量预测系统的训练方法,其特征在于,所述方法包括:
S1、获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵,其中,所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列,所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵,以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集;
S2、采用数据集将初始数据中心流量预测系统进行多轮迭代训练至收敛。
9.根据权利要求8所述的方法,其特征在于,所述步骤S1中对数据中心历史流量数据进行如下预处理:
S11、获取数据中心广域网若干历史流量数据,以预设的时间长度为步长,在每个时刻获取数据中心对对应的历史流量时间序列;
S12、以数据中心对为节点、根据数据中心对之间的拓扑邻接关系和承载应用类型的相似性构建数据中心之间的流量需求图表示,并通过如下方式计算数据中心对流量间的相关性权重:
Figure FDA0003527312360000021
其中|ρpq|为DC对p和q的流量时间序列之间的皮尔逊相关系数的绝对值,epq为图节点p和q之间的边,epq∈E代表节点p和q之间存在边,E表示图中边的集合。
10.根据权利要求9所述的方法,其特征在于,通过如下方式计算皮尔逊相关系数:
Figure FDA0003527312360000031
其中,Tp是DC对p的流量时间序列,Tq是DC对q的流量时间序列,cov(·)为协方差运算符,σTp为Tp的标准差,σTq为Tq的标准差。
11.根据权利要求8所述的方法,其特征在于,所述步骤S2中的训练过程中,采用均方误差作为损失函数,并使用RMSprop优化器迭代更新系统参数。
12.根据权利要求8所述的方法,其特征在于,在所述步骤S2中,采用数据集将初始数据中心流量预测系统进行100轮的迭代训练,训练样本批大小设置为32,初始学习率设置为0.001,并将学习衰减率设置为每5轮衰减0.7。
13.一种数据中心流量预测方法,其特征在于,所述方法包括:
Y1、响应于流量预测的需求,获取数据中心广域网若干历史流量数据并进行预处理以获得多个流量输入数据以及数据中心对流量间的流量相关性权重矩阵,其中,所述流量输入数据是数据中心对对应的预设时间长度的历史流量时间序列,所述流量相关性权重矩阵是所有数据中心对的流量相关性组成的矩阵,以所有流量输入数据和数据中心对之间的流量相关性权重矩阵组成数据集;
Y2、将流量输入数据以及数据中心对之间的流量相关性权重矩阵输入如权利要求8-12任一所述方法训练的数据中心流量预测系统进行预测获得下一时刻数据中心流量预测结果。
14.一种数据中心流量工程方法,其特征在于,所述方法包括:
P1、采用如权利要求13所述的方法进行流量预测获得数据中心下一时刻流量预测结果;
P2、根据步骤P1的数据中心流量预测结果进行流量调度和带宽分配。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序可被处理器执行以实现权利要求8至12任一所述方法的步骤。
16.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求8至12中任一项所述方法的步骤。
CN202210196596.1A 2022-03-02 2022-03-02 一种数据中心流量预测系统及训练方法、预测方法 Pending CN114880363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210196596.1A CN114880363A (zh) 2022-03-02 2022-03-02 一种数据中心流量预测系统及训练方法、预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210196596.1A CN114880363A (zh) 2022-03-02 2022-03-02 一种数据中心流量预测系统及训练方法、预测方法

Publications (1)

Publication Number Publication Date
CN114880363A true CN114880363A (zh) 2022-08-09

Family

ID=82666761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210196596.1A Pending CN114880363A (zh) 2022-03-02 2022-03-02 一种数据中心流量预测系统及训练方法、预测方法

Country Status (1)

Country Link
CN (1) CN114880363A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225543A (zh) * 2022-07-08 2022-10-21 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225543A (zh) * 2022-07-08 2022-10-21 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质
CN115225543B (zh) * 2022-07-08 2023-10-20 北京百度网讯科技有限公司 一种流量预测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN113011581B (zh) 神经网络模型压缩方法、装置、电子设备及可读存储介质
CN111898578B (zh) 人群密度的获取方法、装置、电子设备
CN110765320B (zh) 数据处理方法、装置、存储介质和计算机设备
CN113435509B (zh) 基于元学习的小样本场景分类识别方法及系统
CN110825826A (zh) 聚类簇计算方法、装置、终端及存储介质
CN112418482A (zh) 一种基于时间序列聚类的云计算能耗预测方法
CN111340221A (zh) 神经网络结构的采样方法和装置
KR20210017342A (ko) 과거 데이터에 기초한 시계열 예측 방법 및 장치
CN111294812A (zh) 一种资源扩容规划的方法及系统
Natali et al. Online time-varying topology identification via prediction-correction algorithms
CN116489038A (zh) 网络流量的预测方法、装置、设备和介质
CN114880363A (zh) 一种数据中心流量预测系统及训练方法、预测方法
CN111783935A (zh) 卷积神经网络构建方法、装置、设备及介质
EP4365755A1 (en) Method for identifying clarity of well logging image, apparatus, medium, and electronic device
CN115225543B (zh) 一种流量预测方法、装置、电子设备和存储介质
CN116668351A (zh) 服务质量预测方法、装置、计算机设备及存储介质
CN114445692B (zh) 图像识别模型构建方法、装置、计算机设备及存储介质
CN111209105A (zh) 扩容处理方法、装置、设备及可读存储介质
CN115577797A (zh) 一种基于本地噪声感知的联邦学习优化方法及系统
CN113190429A (zh) 服务器性能预测方法、装置及终端设备
JP7047665B2 (ja) 学習装置、学習方法及び学習プログラム
Amrane et al. On the use of ensembles of metamodels for estimation of the failure probability
WO2022106863A1 (en) Method and system for accelerating the convergence of an iterative computation code of physical parameters of a multi-parameter system
EP3940601A1 (en) Information processing apparatus, information processing method, and information program
CN109831469B (zh) 网络恢复方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination