CN116233133A - 一种数字孪生辅助数据中心网络负载均衡的方法 - Google Patents
一种数字孪生辅助数据中心网络负载均衡的方法 Download PDFInfo
- Publication number
- CN116233133A CN116233133A CN202211740947.7A CN202211740947A CN116233133A CN 116233133 A CN116233133 A CN 116233133A CN 202211740947 A CN202211740947 A CN 202211740947A CN 116233133 A CN116233133 A CN 116233133A
- Authority
- CN
- China
- Prior art keywords
- network
- data center
- link
- flow
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 241000406668 Loxodonta cyclotis Species 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000013507 mapping Methods 0.000 claims description 23
- 238000007726 management method Methods 0.000 claims description 18
- 230000009471 action Effects 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000013500 data storage Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 8
- 238000004088 simulation Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000013178 mathematical model Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000013499 data model Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 230000010076 replication Effects 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0882—Utilisation of link capacity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
- H04L43/0829—Packet loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种数字孪生辅助数据中心网络负载均衡的方法,属于数字孪生领域,包括以下步骤:S1:搭建基于数字孪生的数据中心网络框架;S2:采集物理数据中心网络的数据;S3:计算链路利用率、时延、丢包率,交换机负载,流量矩阵;S4:在当前采集周期时间里,判断到达边缘交换机新流大小,若为老鼠流,则使用ECMP方式进行路由;若为大象流,则转至大象流调度模块进行调度;S5:大象流调度模块采用DDPG进行调度决策,其输出是一组链路权重,通过路径计算子模块计算最优转发路径,然后经过流量管理模块下发流表到物理数据中心网络;S6:通过南向接口协议,物理数据中心网络层收到流表,对大流选择最优路径重路由。
Description
技术领域
本发明属于数字孪生领域,涉及一种数字孪生辅助数据中心网络负载均衡的方法。
背景技术
数据中心作为下一代互联网应用服务的基础架构,已经吸引了工业界和学术界的广泛关注,成为了热点研究领域。负载均衡是数据中心网络流量工程的研究问题之一,其目的是尽可能将流量在多条等价多路径中分布,对网络资源进行充分地利用,避免高负载流量引发网络拥塞。近年来,数字孪生技术的出现,可以为物理网络构建实时的虚拟网络,增强物理网络所缺少的仿真、优化、验证能力,这弥补了基于SDN的数据中心网络流量调度的不足。因此,人工智能算法赋能数字孪生可以全局、准确地掌握数据中心网络的状态,经过虚拟网络的仿真、优化、验证和控制,可以实现数据中心网络的负载均衡。
当前,在网络领域引入数字孪生技术,主要目的是将数字孪生用作模拟器,为人工智能算法生成训练样本或者估计强化学习的奖励。然而,在基于强化学习的数据中心网络负载均衡中引入数字孪生,面临着以下问题:首先,算法模型训练完全依赖数字孪生网络模拟的数据样本,即模型数据样本缺乏真实性;其次,网络状态在一个策略被执行前已经发生改变,即没有考虑网络的动态性;最后,未训练好的策略下发到真实网络会引起网络性能恶化,即没有验证网络策略的安全性。
发明内容
有鉴于此,本发明的目的在于提供一种数字孪生辅助数据中心网路负载均衡的方法。
为达到上述目的,本发明提供如下技术方案:
一种数字孪生辅助数据中心网络负载均衡的方法,包括以下步骤:
S1:搭建基于数字孪生的数据中心网络框架,包括物理数据中心网路层、孪生网络层和网络应用层;
S2:采集物理数据中心网络的数据,包括服务器、交换机、链路的配置,服务器、交换机、链路的状态,网络拓扑数据结构,流量矩阵;
S3:计算链路利用率、时延、丢包率,交换机负载,流量矩阵;
S4:在当前采集周期时间里,判断到达边缘交换机新流大小,若为老鼠流,则使用ECMP方式进行路由;若为大象流,则转至大象流调度模块进行调度;
S5:大象流调度模块采用DDPG进行调度决策,其输出是一组链路权重,通过路径计算子模块计算最优转发路径,然后经过流量管理模块下发流表到物理数据中心网络;
S6:通过南向接口协议,物理数据中心网络层收到流表,对大流选择最优路径重路由。
进一步,步骤S1所述的搭建基于数字孪生的数据中心网络框架,具体包括以下步骤:
S11:使用Mininet仿真构建物理数据中心网路层,所述物理数据中心网络层为Fat-tree网络拓扑结构;
S12:构建孪生网络层,包括数据存储模块、模型映射模块和孪生管理模块;所述数据存储模块通过控制器把采集的各类数据存储在Redis数据库中;所述模型映射模块将采集的数据映射为功能模型和基础模型,通过孪生管理模块运作;
S13:构建网络应用层,通过北向接口协议获取孪生网络层数据库中有价值的信息,实现网络可视化、网络日志。
进一步,所述物理数据中心网络层由网元、服务器、链路组成,在数据中心网络中,网元为交换机、路由器以及配备的应用程序,用于支撑网络数据包的过滤和转发。
进一步,所述数字孪生网络层用于建立物理数据中心网络与虚拟孪生网络系统之间的实时映射模型,通过南向接口协议采集物理网络实体的各种配置和运行数据,并存储在数据库中,用于基础模型和功能模型的建立、仿真和优化;
数据存储模块从物理数据中心网络中收集数据,并将数据分为四种不同类型进行存储:服务器、交换机、链路的配置,服务器、交换机、链路的状态、网络拓扑数据结构、流量矩阵;
模型映射模块根据采集的数据提取、定义和描述物理网络各个实体的关键特征,构建数据中心网络的网元模型和拓扑模型,并为功能模型的输入提供训练数据和测试数据;
网元模型是对服务器、交换机、链路的实时精确映射,拓扑模型是根据网络拓扑数据结构,将网元模型进行连接、组合得到;
功能模型是根据数据库的网络数据,建立网络仿真、分析、优化数据模型;
孪生管理模块负责管理和更新网络孪生层中的各个映射模型,具有模型更新、状态同步、模型交互、应用关联功能。
进一步,网络应用层基于物理数据中心网络和数字孪生网络,支持以下网络应用:QoS配置、网络日志、网络可视化、策略验证;
网络应用层通过北向接口协议向孪生网络层输入QoS要求和网络策略,并通过模型实例在孪生网络层中模拟指定的网络策略;如果设计的策略能够满足QoS要求,则通过南向接口协议将策略部署到真实的网络环境中。
进一步,对于物理数据中心网络DCN<V,E>,用ei,j表示从vi到vj的链路,其最大负载为Bi,j,实际负载为bi,j;在t时刻,设网络中存在k条流,流的集合表示为F={f1,f2,…,fk},其中一条流fs在链路ei,j上的占用带宽为定义fs的四元组为(os,ds,rs,ts),s∈{1,2,…,k},其中os∈V表示源节点;ds∈V表示目的节点;rs表示流fs的需求带宽;ts表示大小流,其值等于1表示fs为大流,值等于0表示fs为小流;
s.t.
式中,表示第l条路径的链路平均负载,σ表示第l条路径的链路负载的标准差;式(4)是链路负载约束,其保证链路上分布的流量不超过该链路的最大负载;式(5)是流量守恒约束,确保从源目的节点流出的数据量等于流入目的节点的数据量,其中Γ(vi)={vj:ei,j∈E},Γ′(vi)={vj:ej,i∈E};
进一步,步骤S3中,控制器发送定向报文给指定的交换机来获取链路时延信息,计算链路ei,j的时延,具体步骤如下:
S31:控制器发送一个携带有当前时间戳的Packet_out报文给交换机vi,该报文指示交换机vi将其发送给邻接交换机vj;
S32:交换机vj收到交换机vi发过来的报文,无法匹配流表项,则将其以Packet_in报文转发给控制器,控制器收到报文后,解包得到时间戳,再用当前时间戳减去该时间戳,得到时间差ΔT1,控制器从发送报文到接收报文的时间为:
S33:控制器发送携带有时间戳的Packet_out报文给交换机vj,然后控制器从交换机vi收到Packet_in报文,记录下时间差ΔT2:
S34:控制器分别向交换机vi和交换机vj发送携带有时间戳的Echo request报文,交换机收到报文之后回复Echo reply报文,控制器收到Echo reply报文后,通过时间戳计算其分别到交换机vi和交换机vj的往返时间,从而得到和交换机vi到交换机vj的往返时间为:
S35:假设交换机vi与交换机vj的往返时间相同,同时忽略交换机的处理时间,链路ei,j的时延为:
计算链路时延时,若链路拥塞严重,步骤S32中存在的控制器收不到报文的情况,将当前计算的链路时延设为一个高值,此时链路ei,j的时延为:
综上所示,第l条路径的时延表示为:
综合考虑路径负载相对均衡度和路径的时延,建立的目标函数如下所示:
其中,α∈(0,1)。
进一步,数字孪生网络的数学模型为:
在物理数据中心网络中,设有n个网元设备,定义V={v1,v2,…,vn}为网元设备集合,设有m条链路,定义E={e1,e2,…,em}为链路集合,则网元模型和链路模型的数字孪生分别表示为:
DTv(t)=Θ(Cv,Sv(t),Mv(t)) (32)
DTe(t)=Θ(Ce,Se(t)) (33)
其中,C表示静态配置数据,对于网元设备v来说,可以是最大传输速率、背板带宽、MAC地址容量;对于链路e来说,可以是最大容量;S(t)表示随时间变化的运行状态,由多维特征决定,对于网元设备v而言,其x维状态特征定义为Mv(t)表示网元设备v的运行行为,由y维特征行为表征,定义为
拓扑模型是根据网络拓扑数据结构,将网元模型和链路模型进行连接、组合得到,拓扑模型的数字孪生表示为:
DT(t)=Θ(DTV(t),DTE(t)) (34)
物理数据中心网络和数字孪生网络的关系形式化定义为:
其中,DCN<V,E>表示物理数据中心网络,V表示所有网络节点集合,E表示网络中所有链路的的集合;SIP表示南向接口协议,通过其实现物理数据中心网络和数字孪生网络的通信。
进一步,基于DDPG算法实现数字孪生辅助数据中心网络负载均衡,DDPG算法的四个网络分别为:
Actor当前网络:负责策略网络参数θ的迭代更新,负责根据当前状态S选择当前动作A,用于和环境交互生成S′,R;
Actor目标网络:负责根据经验回放池中采样的下一状态S′选择最优下一动作A′,网络参数θ′定期从θ复制;
Critic当前网络:复制价值网络参数ω的迭代更新,负责计算当前Q值Q(S,A,ω),目标Q值yi=R+γQ′(S′,A′,ω′);
Critic目标网络:负责计算目标Q值中Q′(S′,A′,ω′)部分,网络参数ω′定期从ω复制;
步骤S4中所述大象流调度模块调度方法如下:
状态:为n×n的流量矩阵TM,其中b1,n是交换机v1与交换机vn相连的链路实际负载,其表达如下所示:
动作:动作空间是一组链路权重,链路权重表达如下所示:
W=[w1,w2,…,wm]T (37)
得到一组链路权重后,经过路径计算模块,得到新流的路由路径,再经流表管理模块得到流表项,将流表下发给孪生网络,经验证后下发送给物理网络,最终实现大流的路径选择和转发;
奖励:基于当前的状态和动作,代理从环境中获得奖励;在数据中心网络中,奖励函数如下:
R(s(t),a(t))=-(min α·CVl+(1-α)·Tl) (38)。
本发明的有益效果在于:数字孪生网络技术可以增强SDN功能,实现数据中心网络的自治,本发明完成了数据中心网络的负载均衡,帮助数据中心以更加智能和高效的流量调度方式实现网络自治。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为基于数字孪生的数据中网络框架图;
图2为数字孪生辅助数据中心网络负载均衡的流程框图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明提供一种数字孪生辅助数据中心网路负载均衡的方法,主要分为两个部分:一个部分是设计了基于数字孪生的数据中心网络框架,另一部分是在该网络框架下实现数据中心网络负载均衡。基于数字孪生的数据中网络框架如图1所示,分为三层:网络应用层、孪生网络层和物理数据中网络层。数字孪生辅助数据中心网络负载均衡的流程框图如图2所示。
一种数字孪生辅助数据中心网路负载均衡的方法主要包括以下步骤:
步骤1:构建物理数据中心网路层。物理数据中心网络层采用Fat-tree网络拓扑结构,使用Mininet进行仿真构建,让其充当真实的物理网络环境。
步骤2:构建孪生网络层。孪生网络层分为三个模块,分别是数据存储、模型映射和孪生管理。数据存储模块通过控制器把采集的各类数据存储在Redis数据库中,这为模型映射模块和孪生管理模块提供数据支撑。模型映射模块分为功能模型和基础模型两个子模块,通过孪生管理模块可以使模型运作起来。
步骤3:构建网络应用层。本发明实例在网络应用层中实现了网络可视化、网络日志等功能。通过北向接口协议获取孪生网络层数据库中有价值的信息,可以为网络管理员提供便捷的应用服务。
步骤4:通过步骤1、步骤2和步骤3,搭建基于数字孪生的数据中心网络框架,框架示意图如图1所示。
步骤5:初始时,控制器采集物理数据中心网络的数据,包括服务器、交换机、链路的配置,服务器、交换机、链路的状态、网络拓扑数据结构、流量矩阵。
步骤6:计算链路利用率、时延、丢包率,交换机负载,流量矩阵。
步骤7:在当前采集周期时间里,判断到达边缘交换机新流大小,若为老鼠流,则使用ECMP方式进行路由;若为大象流,则转至大象流调度模块进行调度。
步骤8:大象流调度模块采用DDPG进行调度决策,其输出是一组链路权重,通过路径计算子模块计算最优转发路径,然后经过流量管理模块下发流表到物理数据中心网络。
步骤9:通过南向接口协议,物理数据中心网络层收到流表,对大流选择最优路径重路由。
具体地,本方法还包括以下内容:
设计基于数字孪生的数据中心网络框架
该框架分为三层,分别是物理数据中心网络层、孪生网络层和网络应用层。物理数据中心网络层为孪生网络层提供网络设备基本配置、环境信息、运行转态、链路拓扑等信息;孪生网络层负责物理网络实体的基础模型、功能模型的构建和运行;网络应用层可以是集成服务和应用的平台,旨在实现网络智能化管理。基于数字孪生的数据中心三层网络架构的详细组件如下:
物理数据中心网络层:物理数据中心网络层由网元、服务器、链路组成。在数据中心网络中,网元可以是交换机、路由器以及配备的应用程序,这些网元设备支撑着网络数据包的过滤和转发。而网元设备和应用程序每天会产生大量的数据,这些数据可能是交换机的背板吞吐量、包缓冲区大小、MAC地址表、接口包转发速率等。那么从这些数据中提取有价值的信息,可以获得实时的物理网络状况,如网元设备的健康状态、流量矩阵、可用带宽变化等,以此检测网络的异常情况。
数字孪生网络层:数字孪生网络层负责建立物理数据中心网络与虚拟孪生网络系统之间的实时映射模型,包括三个关键子模块:数据存储、模型映射、孪生管理。数据存储模块通过南向接口协议(如NETCONF、OpenFlow、XMPP、I2RS等协议)采集物理网络实体的各种配置和运行数据,并存储在数据库中,用于基础模型和功能模型的建立、仿真和优化。具体而言,数据存储模块从物理数据中心网络中收集数据,并将数据分为四种不同类型进行存储:服务器、交换机、链路的配置,服务器、交换机、链路的状态、网络拓扑数据结构、流量矩阵。根据采集的数据,模型映射模块需要提取、定义和描述物理网络各个实体的关键特征。一方面是为了构建数据中心网络的网元模型和拓扑模型,也即基础模型,另一方面能够为功能模型的输入提供训练数据和测试数据。其中,网元模型是对服务器、交换机、链路的实时精确映射,拓扑模型是根据网络拓扑数据结构,将网元模型进行连接、组合得到。功能模型是根据数据库的网络数据,建立网络仿真、分析、优化等数据模型,数字孪生网络的一个主要特点是实现物理网络的实时镜像,那么模型映射模块还需要运作起来。为此,孪生管理模块负责管理和更新网络孪生层中的各个映射模型,具有模型更新、状态同步、模型交互、应用关联等功能,如通过状态同步功能在拓扑模型中进行流量重放,实现孪生网络对物理网络的同步映射,以便功能模型做出相应的网络优化策略。
网络应用层:基于物理数据中心网络和数字孪生网络,网络应用层可以支持各种网络应用,如QoS配置、网络日志、网络可视化、策略验证等应用。网络应用层通过北向接口协议(如RESTCONF、NETCONF、SNMP等协议)可以向孪生网络层输入QoS(时延、吞吐量等)要求和网络策略,并通过模型实例在孪生网络层中模拟指定的网络策略。在这个过程中,数字孪生网络可以模拟物理网络的行为,并预测所设计的策略效果,而无须在真实的数据中心网络上部署网络策略。如果设计的策略能够满足QoS要求,则可通过南向接口协议将策略部署到真实的网络环境中。
定义负载均衡的数学模型
对于物理数据中心网络DCN〈V,E〉,用ei,j表示从vi到vj的链路,其最大负载为Bi,j,实际负载为bi,j。在t时刻,设网络中存在k条流,流的集合表示为F={f1,f2,…,fk},其中一条流fs在链路ei,j上的占用带宽为定义fs的四元组为s∈{1,2,…,k},其中:os∈V表示源节点;ds∈V表示目的节点;rs表示流fs的需求带宽;ts表示大小流,其值等于1表示fs为大流,值等于0表示fs为小流。
初始时,由KSP算法计算所有边缘节点对之间的路径集其中第l条路径有个链路,是由源节点vo到目的节点vd的有向序列<vo→vi→vj→…→vd连接而成。为了将达到边缘节点的新流调度到合适的路径上进行转发,网络流量需要均匀地被分配到全网链路中,以实现数据中心网络的负载均衡。因此,本发明基于统计学中的变异系数概念,提出路径负载相对均衡度CVl:
s.t.
式中,表示第l条路径的链路平均负载,σ表示第l条路径的链路负载的标准差。式(4)是链路负载约束,其保证链路上分布的流量不超过该链路的最大负载。式(5)是流量守恒约束,确保从源目的节点流出的数据量等于流入目的节点的数据量,其中Γ(vi)={vj:ei,j∈E},Γ′(vi)={vj:ej,i∈E}。
路径负载相对均衡度CVl可以衡量与流fs同源目的节点的不同路径的负载均衡程度,其值越小,说明该路径包含的链路负载离散程度越小,则该路径负载就越相对均匀。在数据统计分析中,当路径负载相对均衡度大于15%时,则该路径的负载可能不正常,若将新到来的流分配至该路径,可能会导致网络资源分配不均匀,造成网络资源浪费。尽管路径负载相对均衡度一定程度上可以衡量流量在每条链路上是否分布均匀,但是不能分析出新流分配到当前路径上的传输时延情况。若全网链路流量分布相对均匀,但链路时延较大,则会影响流完成时间,对于时延敏感的流来说是不能容忍的。因此,将新流分配至当前路径,还需要考虑该路径的链路时延。
链路时延无法通过交换机端口状态信息获取,需要控制器发送定向报文给指定的交换机来获取链路时延信息,计算链路ei,j的时延,具体步骤如下:
(1)控制器发送一个携带有当前时间戳的Packet_out报文给交换机vi,该报文指示交换机vi将其发送给邻接交换机vj。
(2)交换机vj收到交换机vi发过来的报文,无法匹配流表项,则将其以Packet_in报文转发给控制器,控制器收到报文后,解包得到时间戳,再用当前时间戳减去该时间戳,即可得到时间差ΔT1。那么控制器从发送报文到接收报文的时间为:
(3)同理,控制器发送同样携带有时间戳的Packet_out报文给交换机vj,然后控制器从交换机vi收到Packet_in报文,记录下时间差ΔT2:
(4)控制器分别向交换机vi和交换机vj发送携带有时间戳的Echo request报文,交换机收到报文之后回复Echo reply报文,控制器收到Echo reply报文后,通过时间戳计算其分别到交换机vi和交换机vj的往返时间,从而得到和因此,交换机vi到交换机vj的往返时间为:
(5)假设交换机vi与交换机vj的往返时间相同,同时忽略交换机的处理时间,因为计算每个链路时延都会产生交换机开销,则链路ei,j的时延为:
计算链路时延时,若链路拥塞严重,步骤(2)中存在的控制器收不到报文的情况,那么本文将当前计算的链路时延设为一个高值,此时链路ei,j的时延为:
综上所示,第l条路径的时延可以表示为:
因此,综合考虑路径负载相对均衡度和路径的时延,建立的目标函数如下所示:
minα·CVl+(1-α)·Tl(50)
其中,α∈(0,1),本发明实施例中取α的值为0.5。
定义数字孪生网络的数学模型
在物理数据中心网络中,设有n个网元设备,定义V={v1,v2,…,vn}为网元设备集合,设有m条链路,定义E={e1,e2,…,em}为链路集合,则网元模型和链路模型的数字孪生可以分别表示为:
DTv(t)=Θ(Cv,Sv(t),Mv(t)) (51)
DTe(t)=Θ(Ce,Se(t)) (52)
其中,C表示静态配置数据,对于网元设备v来说,可以是最大传输速率、背板带宽、MAC地址容量等;对于链路e来说,可以是最大容量。S(t)表示随时间变化的运行状态,而运行状态由多维特征决定,对于网元设备v而言,其x维状态特征定义为如网元设备的CPU使用率、包缓冲区大小、端口状态信息等;同理,链路也具备多维状态特征,但是本文只考虑链路的当前负载特征。Mv(t)表示网元设备v的运行行为,由y维特征行为表征,定义为
拓扑模型是根据网络拓扑数据结构,将网元模型和链路模型进行连接、组合得到,那么拓扑模型的数字孪生可以表示为:
DT(t)=Θ(DTV(t),DTE(t)) (53)
网元模型集合和链路模型集合组合即可得到拓扑模型的数字孪生。通过孪生网络层的数据存储模块采集各类数据,以数字化的形式构建网元模型和链路模型,进而构建拓扑模型,实现对物理数据中心网络全面、精确的映射,再辅以功能模型的自适应、自学习能力,最终实现数字孪生网络对物理数据中心网络的实时控制和优化。基于以上分析,物理数据中心网络和数字孪生网络的关系可以形式化定义为:
其中,DCN<V,E>表示物理数据中心网络,V表示所有网络节点集合,E表示网络中所有链路的的集合;SIP表示南向接口协议,通过其实现物理数据中心网络和数字孪生网络的通信。
大象流调度模块算法设计
本发明实施例基于DDPG算法实现数字孪生辅助数据中心网络负载均衡,DDPG算法的四个网络分别如下所述:
Actor当前网络:负责策略网络参数θ的迭代更新,负责根据当前状态S选择当前动作A,用于和环境交互生成S′,R。
Actor目标网络:负责根据经验回放池中采样的下一状态S′选择最优下一动作A′。网络参数θ′定期从θ复制。
Critic当前网络:复制价值网络参数ω的迭代更新,负责计算当前Q值Q(S,A,ω),目标Q值yi=R+γQ′(S′,A′,ω′)。
Critic目标网络:负责计算目标Q值中Q′(S′,A′,ω′)部分。网络参数ω′定期从ω复制。
首先是对到达边缘交换机的新流进行数据采集,孪生网络层判断新流是小流还是大流,若是小流采用轮询机制路由,否则为大流采用大流调度模块决策路由。对于大流调度模块的设计如下描述:
状态(State):DDPG学习的状态是反映数据中心网络环境的空间,本发明实施例的状态是n×n的流量矩阵TM,其中b1,n是交换机v1与交换机vn相连的链路实际负载,其表达如下所示:
动作(Action):在DDPG中,代理将状态空间映射到动作空间,以学习最优策略。在本发明实施例系统中,动作空间是一组链路权重,链路权重表达如下所示:
W=[w1,w2,…,wm]T (56)
得到一组链路权重后,经过路径计算模块,可以得到新流的路由路径,再经流表管理模块就可以得到流表项,将流表下发给孪生网络,经验证后下发送给物理网络,最终实现大流的路径选择和转发。
奖励(Reward):基于当前的状态和动作,代理从环境中获得奖励。在数据中心网络中,由于奖励和网络优化的目标函数有关,则奖励函数如下:
R(s(t),a(t))=-(min α·CVl+(1-α)·Tl) (57)
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种数字孪生辅助数据中心网络负载均衡的方法,其特征在于:包括以下步骤:
S1:搭建基于数字孪生的数据中心网络框架,包括物理数据中心网路层、孪生网络层和网络应用层;
S2:采集物理数据中心网络的数据,包括服务器、交换机、链路的配置,服务器、交换机、链路的状态,网络拓扑数据结构,流量矩阵;
S3:计算链路利用率、时延、丢包率,交换机负载,流量矩阵;
S4:在当前采集周期时间里,判断到达边缘交换机新流大小,若为老鼠流,则使用ECMP方式进行路由;若为大象流,则转至大象流调度模块进行调度;
S5:大象流调度模块采用DDPG进行调度决策,其输出是一组链路权重,通过路径计算子模块计算最优转发路径,然后经过流量管理模块下发流表到物理数据中心网络;
S6:通过南向接口协议,物理数据中心网络层收到流表,对大流选择最优路径重路由。
2.根据权利要求1所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:步骤S1所述的搭建基于数字孪生的数据中心网络框架,具体包括以下步骤:
S11:使用Mininet仿真构建物理数据中心网路层,所述物理数据中心网络层为Fat-tree网络拓扑结构;
S12:构建孪生网络层,包括数据存储模块、模型映射模块和孪生管理模块;所述数据存储模块通过控制器把采集的各类数据存储在Redis数据库中;所述模型映射模块将采集的数据映射为功能模型和基础模型,通过孪生管理模块运作;
S13:构建网络应用层,通过北向接口协议获取孪生网络层数据库中有价值的信息,实现网络可视化、网络日志。
3.根据权利要求2所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:所述物理数据中心网络层由网元、服务器、链路组成,在数据中心网络中,网元为交换机、路由器以及配备的应用程序,用于支撑网络数据包的过滤和转发。
4.根据权利要求2所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:所述数字孪生网络层用于建立物理数据中心网络与虚拟孪生网络系统之间的实时映射模型,通过南向接口协议采集物理网络实体的各种配置和运行数据,并存储在数据库中,用于基础模型和功能模型的建立、仿真和优化;
数据存储模块从物理数据中心网络中收集数据,并将数据分为四种不同类型进行存储:服务器、交换机、链路的配置,服务器、交换机、链路的状态、网络拓扑数据结构、流量矩阵;
模型映射模块根据采集的数据提取、定义和描述物理网络各个实体的关键特征,构建数据中心网络的网元模型和拓扑模型,并为功能模型的输入提供训练数据和测试数据;
网元模型是对服务器、交换机、链路的实时精确映射,拓扑模型是根据网络拓扑数据结构,将网元模型进行连接、组合得到;
功能模型是根据数据库的网络数据,建立网络仿真、分析、优化数据模型;
孪生管理模块负责管理和更新网络孪生层中的各个映射模型,具有模型更新、状态同步、模型交互、应用关联功能。
5.根据权利要求2所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:网络应用层基于物理数据中心网络和数字孪生网络,支持以下网络应用:QoS配置、网络日志、网络可视化、策略验证;
网络应用层通过北向接口协议向孪生网络层输入QoS要求和网络策略,并通过模型实例在孪生网络层中模拟指定的网络策略;如果设计的策略能够满足QoS要求,则通过南向接口协议将策略部署到真实的网络环境中。
6.根据权利要求1所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:对于物理数据中心网络DCN<V,E>,用ei,j表示从vi到vj的链路,其最大负载为Bi,j,实际负载为bi,j;在t时刻,设网络中存在k条流,流的集合表示为F={f1,f2,…,fk},其中一条流fs在链路ei,j上的占用带宽为定义fs的四元组为(os,ds,rs,ts),s∈{1,2,…,k},其中os∈V表示源节点;ds∈V表示目的节点;rs表示流fs的需求带宽;ts表示大小流,其值等于1表示fs为大流,值等于0表示fs为小流;
7.根据权利要求1所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:步骤S3中,控制器发送定向报文给指定的交换机来获取链路时延信息,计算链路ei,j的时延,具体步骤如下:
S31:控制器发送一个携带有当前时间戳的Packet_out报文给交换机vi,该报文指示交换机vi将其发送给邻接交换机vj;
S32:交换机vj收到交换机vi发过来的报文,无法匹配流表项,则将其以Packet_in报文转发给控制器,控制器收到报文后,解包得到时间戳,再用当前时间戳减去该时间戳,得到时间差ΔT1,控制器从发送报文到接收报文的时间为:
S33:控制器发送携带有时间戳的Packet_out报文给交换机vj,然后控制器从交换机vi收到Packet_in报文,记录下时间差ΔT2:
S34:控制器分别向交换机vi和交换机vj发送携带有时间戳的Echo request报文,交换机收到报文之后回复Echo reply报文,控制器收到Echo reply报文后,通过时间戳计算其分别到交换机vi和交换机vj的往返时间,从而得到和交换机vi到交换机vj的往返时间为:
S35:假设交换机vi与交换机vj的往返时间相同,同时忽略交换机的处理时间,链路ei,j的时延为:
计算链路时延时,若链路拥塞严重,步骤S32中存在的控制器收不到报文的情况,将当前计算的链路时延设为一个高值,此时链路ei,j的时延为:
综上所示,第l条路径的时延表示为:
综合考虑路径负载相对均衡度和路径的时延,建立的目标函数如下所示:
minα·CVl+(1-α)·Tl(12)
其中,α∈(0,1)。
8.根据权利要求1所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:数字孪生网络的数学模型为:
在物理数据中心网络中,设有n个网元设备,定义V={v1,v2,…,vn}为网元设备集合,设有m条链路,定义E={e1,e2,…,em}为链路集合,则网元模型和链路模型的数字孪生分别表示为:
DTv(t)=Θ(Cv,Sv(t),Mv(t)) (13)
DTe(t)=Θ(Ce,Se(t)) (14)
其中,C表示静态配置数据,对于网元设备v来说,可以是最大传输速率、背板带宽、MAC地址容量;对于链路e来说,可以是最大容量;S(t)表示随时间变化的运行状态,由多维特征决定,对于网元设备v而言,其x维状态特征定义为Mv(t)表示网元设备v的运行行为,由y维特征行为表征,定义为
拓扑模型是根据网络拓扑数据结构,将网元模型和链路模型进行连接、组合得到,拓扑模型的数字孪生表示为:
DT(t)=Θ(DTV(t),DTE(t)) (15)
物理数据中心网络和数字孪生网络的关系形式化定义为:
其中,DCN<V,E>表示物理数据中心网络,V表示所有网络节点集合,E表示网络中所有链路的的集合;SIP表示南向接口协议,通过其实现物理数据中心网络和数字孪生网络的通信。
9.根据权利要求1所述的数字孪生辅助数据中心网络负载均衡的方法,其特征在于:基于DDPG算法实现数字孪生辅助数据中心网络负载均衡,DDPG算法的四个网络分别为:
Actor当前网络:负责策略网络参数θ的迭代更新,负责根据当前状态S选择当前动作A,用于和环境交互生成S′,R;
Actor目标网络:负责根据经验回放池中采样的下一状态S′选择最优下一动作A′,网络参数θ′定期从θ复制;
Critic当前网络:复制价值网络参数ω的迭代更新,负责计算当前Q值Q(S,A,ω),目标Q值yi=R+γQ′(S′,A′,ω′);
Critic目标网络:负责计算目标Q值中Q′(S′,A′,ω′)部分,网络参数ω′定期从ω复制;
步骤S4中所述大象流调度模块调度方法如下:
状态:为n×n的流量矩阵TM,其中b1,n是交换机v1与交换机vn相连的链路实际负载,其表达如下所示:
动作:动作空间是一组链路权重,链路权重表达如下所示:
得到一组链路权重后,经过路径计算模块,得到新流的路由路径,再经流表管理模块得到流表项,将流表下发给孪生网络,经验证后下发送给物理网络,最终实现大流的路径选择和转发;
奖励:基于当前的状态和动作,代理从环境中获得奖励;在数据中心网络中,奖励函数如下:
R(s(t),a(t))=-(min α·CVl+(1-α)·Tl) (19)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211740947.7A CN116233133A (zh) | 2022-12-30 | 2022-12-30 | 一种数字孪生辅助数据中心网络负载均衡的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211740947.7A CN116233133A (zh) | 2022-12-30 | 2022-12-30 | 一种数字孪生辅助数据中心网络负载均衡的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116233133A true CN116233133A (zh) | 2023-06-06 |
Family
ID=86583551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211740947.7A Pending CN116233133A (zh) | 2022-12-30 | 2022-12-30 | 一种数字孪生辅助数据中心网络负载均衡的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116233133A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116684303A (zh) * | 2023-08-01 | 2023-09-01 | 聪育智能科技(苏州)有限公司 | 一种基于数字孪生的数据中心运维方法及系统 |
CN117880206A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市艾奥科技有限公司 | 一种物联网管理设备的负载平衡方法及系统 |
-
2022
- 2022-12-30 CN CN202211740947.7A patent/CN116233133A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116684303A (zh) * | 2023-08-01 | 2023-09-01 | 聪育智能科技(苏州)有限公司 | 一种基于数字孪生的数据中心运维方法及系统 |
CN116684303B (zh) * | 2023-08-01 | 2023-10-27 | 聪育智能科技(苏州)有限公司 | 一种基于数字孪生的数据中心运维方法及系统 |
CN117880206A (zh) * | 2024-03-12 | 2024-04-12 | 深圳市艾奥科技有限公司 | 一种物联网管理设备的负载平衡方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pei et al. | Optimal VNF placement via deep reinforcement learning in SDN/NFV-enabled networks | |
CN112491714B (zh) | SDN环境下基于深度强化学习的智能QoS路由优化方法、系统 | |
CN116233133A (zh) | 一种数字孪生辅助数据中心网络负载均衡的方法 | |
CN108768685A (zh) | 大规模信息通信网络实时仿真模拟系统 | |
CN108737149A (zh) | 网络拓扑实机仿真方法与系统 | |
Calyam et al. | VDC-Analyst: Design and verification of virtual desktop cloud resource allocations | |
CN112600759B (zh) | 基于深度强化学习在Overlay网络下多路径流量调度方法及系统 | |
CN114567598B (zh) | 一种基于深度学习和跨域协作的负载均衡方法及装置 | |
Jamali et al. | On the use of the genetic programming for balanced load distribution in software-defined networks | |
CN106941456B (zh) | 一种软件定义网络中控制平面的负载均衡方法及系统 | |
CN106878420B (zh) | 一种基于sdn的服务器负载均衡方法及装置 | |
CN108234169A (zh) | 一种分布式仿真网络结构实时动态优化方法 | |
Babbar et al. | A genetic load balancing algorithm to improve the QoS metrics for software defined networking for multimedia applications | |
Alwasel et al. | Iotsim-sdwan: A simulation framework for interconnecting distributed datacenters over software-defined wide area network (sd-wan) | |
Ansell et al. | Making queueing theory more palatable to SDN/OpenFlow-based network practitioners | |
CN106302012A (zh) | 一种ptn网络优化仿真方法及系统 | |
Bhole et al. | Distributed hierarchical control plane of software defined networking | |
Jin et al. | A congestion control method of SDN data center based on reinforcement learning | |
Naseri et al. | Placement of SDN controllers based on network setup cost and latency of control packets | |
Chen et al. | A deep reinforcement learning based switch controller mapping strategy in software defined network | |
Thakur et al. | Multi-domain virtual network embedding with dynamic flow migration in software-defined networks | |
Tello et al. | SDN controllers scalability and performance study | |
Nyanteh et al. | Cloudsimhypervisor: Modeling and simulating network slicing in software-defined cloud networks | |
Liu et al. | Automated traffic engineering in SDWAN: Beyond reinforcement learning | |
Liu et al. | DCNSim: A data center network simulator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |