CN117395188A - 一种基于深度强化学习的天地一体化负载均衡路由方法 - Google Patents
一种基于深度强化学习的天地一体化负载均衡路由方法 Download PDFInfo
- Publication number
- CN117395188A CN117395188A CN202311669916.1A CN202311669916A CN117395188A CN 117395188 A CN117395188 A CN 117395188A CN 202311669916 A CN202311669916 A CN 202311669916A CN 117395188 A CN117395188 A CN 117395188A
- Authority
- CN
- China
- Prior art keywords
- state
- path
- link
- queue
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000002787 reinforcement Effects 0.000 title claims abstract description 21
- 230000006870 function Effects 0.000 claims abstract description 37
- 230000005540 biological transmission Effects 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 10
- 238000012546 transfer Methods 0.000 claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 239000000872 buffer Substances 0.000 claims description 12
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 11
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 11
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005266 casting Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
- H04L45/08—Learning-based routing, e.g. using neural networks or artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/121—Shortest path evaluation by minimising delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/14—Routing performance; Theoretical aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/38—Flow based routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于深度强化学习的天地一体化负载均衡路由方法,步骤如下:S1,将天地一体化网络转化为流量传递有向图;S2,通过软件构建需要预测得到的网络拓扑,模拟多种流量情况生成数据集;S3,对流特征数据归一化处理,并对路径、链路、队列的隐藏状态初始化;S4,对路径、链路、队列的隐藏状态进行处理;S5,重复S4至T次;S6,将T次传递后的路径、链路和队列的隐藏状态作为读出函数的输入;S7,计算流时延、抖动和每个流的丢包率;S8,通过设置强化学习参数,对网络拓扑进行训练,得到最优负载均衡路径。本发明通过对流量从源节点到目的节点的时延、抖动和丢包率的预测,实现天地一体化网络多约束条件下的负载均衡。
Description
技术领域
本发明涉及网络负载均衡,尤其涉及一种基于深度强化学习的天地一体化负载均衡路由方法。
背景技术
随着天地一体化网络的发展,关键节点具有计算和存储功能,网络呈现智能化特征,流量特性也随之改变。网络流量描述的变化,导致天地一体化网络中与时间相关和连接相关的流量特征发生了变化,传统的网络流量理论难以对动态变化、链路多样、复杂异构的流量进行负载均衡处理。当前,关于天地一体化网络负载均衡方法主要分为非人工智能方法与人工智能方法。
非人工智能方法主要包括遗传算法、启发式算法、蚁群算法。北京遥测技术研究所的李澎等人(李澎,赵祥,胡剑平等.基于区域划分的LEO卫星星座QoS(Quality ofService,服务质量)路由算法[J].遥测遥控,2022,43(2):17–24)提出了一种基于多目标遗传算法的路由策略,保障了重负载区域不同业务QoS并实现负载均衡,仿真结果表明该方法具有较低的网络平均时延和丢包率。爱尔兰都柏林圣三一学院的Sangita Dhara(S.Dhara, S. Ghose and R. Datta, "MFR—A Max-Flow-Based Routing for FutureInterplanetary Networks," in IEEE Transactions on Aerospace and ElectronicSystems. vol. 58, no. 6, pp. 5334-5350, Dec. 2022)提出了一种基于启发式算法的面向未来星际网络的最大流路由策略,该方法通过可预测性计算大型网络的最优流,仿真结果表明其有较大的网络性能提升。广州大学曾首元(曾首元.基于蚁群优化的低轨卫星网络负载均衡路由算法研究[D].广州大学,2022)提出了一种基于蚁群优化的负载均衡路由算法,该方法根据路径总长度和当前节点的缓存状态优化了信息素更新规则,仿真结果表明其能够在网络负载增加的情况下平衡流量,保持较小的平均延迟和开销。上述非人工智能方法对于简单网络具有良好的负载均衡效果,但是路由约束条件不完善,难以从全局对网络进行规划,因此并不适用于复杂网络的负载均衡。
人工智能方法主要包括机器学习、深度学习、深度强化学习相关的负载均衡路由策略。中国电子科技集团公司第五十四研究所的李新桐等人(李新桐,张亚生.一种适用于低轨卫星的SDN网络人工智能路由方法[J].电子测量技术,2020,43(22):109-114),其提出的机器学习辅助路由策略使卫星网络链路负载降低。哈尔滨工业大学的薛冠昌等人(薛冠昌,王钢,解索非,等.基于流量预测的卫星网络路由算法[J].无线电通信技术,2021,47(5):596-602)提出的基于流量预测的星上路由算法,使用深度学习能够降低数据的端到端时延,并改善丢包率。重庆邮电大学汪昊等人(汪昊.基于图神经网络的低轨卫星网络动态路由算法研究[D].重庆邮电大学,2022)提出一种基于图神经网络的低轨卫星动态路由算法,通过深度强化学习能够对拓扑动态的卫星网络有效提升时延、吞吐量和丢包率方面的性能。此类方法虽然有较高的负载优化,但是由于人工智能方法需要复杂的数学建模及大样本数据支持,这些方法决策有较高的时间成本。
上述方法虽然能较好地实现天地一体化网络的负载均衡,但是大多都只基于天基网络,而未考虑到包括天、地在内完整的复杂异构网络,且一条完整的流量传输路径由链路、队列等多种因素构成,上述方法缺少对网络特征的准确描述,所以难以形成负载均衡的路由约束。
发明内容
发明目的:本发明的目的是提供一种能够实现对天地一体化复杂网络性能高精度预测的基于深度强化学习的天地一体化负载均衡路由方法。
技术方案:本发明的天地一体化负载均衡路由方法,包括如下步骤:
S1,将天地一体化网络拓扑转化为流量传递有向图;
S2,通过OMnet软件构建需要预测得到的网络拓扑,模拟多种流量情况,生成数据集,并对数据集进行预处理;
S3,将数据集中的流特征进行归一化处理,通过特征嵌入H函数分别对路径、链路、队列的隐藏状态进行初始化;
S4,通过MPNN进行消息传递、聚合更新和生成信息,依次对路径、链路、队列的隐藏状态进行处理;在聚合过程中,采用注意力机制捕捉骨干节点的邻近图结构信息;
S5,重复步骤S4至T次;
S6,将T次传递后的路径、链路和队列的隐藏状态作为读出函数的输入,将图内所有节点的特征聚合,最终得到一个包含整个图信息的隐藏状态;
S7,计算流时延、抖动和每个流的丢包率;
S8,以平均绝对百分误差MAPE作为损失函数,对性能预测模型进行训练,迭代得到收敛值,生成源至目标节点的性能预测矩阵;
S9,根据步骤S8生成的性能矩阵参数,结合网络拓扑参数,划分为动态参数与静态参数;
S10,设置强化学习初始策略参数、/>函数参数/>和空的重放缓冲区D,以及目标参数/>、/>;
S11,根据状态执行选定的动作/>,并对新的状态给出一个奖励/>,以此来迭代代理策略;其中/>是对已预测网络性能的奖励函数,存入重放缓冲区D;
S12,从重放缓冲区D中抽取经验B进行学习,设置计算目标值;
S13,使用均方误差MSE作为损失函数更新函数/>、策略函数及目标网络;
S14,重复步骤S12的更新步骤,直至收敛,得到最优负载均衡路径结果。
进一步,步骤S1中,所述流量传递有向图为由节点/>和边/>组成的图结构:;其中/>表示网络中各个节点,/>表示节点间的连接关系;设置节点集,其中/>表示网络中第/>个节点,/>表示自然数;定义网络中从源节点发送到目的节点的所有路径集合为/>,/>由多个节点构成,在任意两个节点间通信时,节点间存在多条链路,定义链路集为,其中,/>代表节点/>与节点/>间传输路径的第/>条链路;在每一条链路上,根据队列优先级,定义队列集/>,在同一链路/>上,有不同的队列/>,/>表示在该链路上的队列顺序。
进一步,步骤S3中,对路径、链路及队列的隐藏状态进行初始化的实现步骤如下:
S31,根据步骤S2数据集中得到的流特征,按照路径特征、链路特征和队列特征进行分类;
S32,对于以数值表示的数据将其的实际值减去平均值,并除以标准差,作归一化处理;
对于以类别表示的数据将其用one_hot形式进行编码;
S33,通过路径、链路和队列的映射关系,依次将流的路径、链路和队列特征通过一个输入层、两个全连接层进行隐藏状态初始化,得到初始路径隐藏状态、初始链路隐藏状态和初始队列隐藏状态。
进一步,步骤S4中,对路径隐藏状态进行处理的步骤如下:
SB1,将链路与路径映射的隐藏状态、队列与路径映射的隐藏状态按索引进行收集,获取与路径对应的状态子集;
SB2,将路径隐藏状态通过GRU门控循环单元进行更新;
SB3,将步骤SB1中保存的先前路径隐藏状态与步骤SB2更新得到的路径隐藏状态沿着axis=1拼接,对路径状态进行更新;在骨干网节点状态的聚合过程中,采用注意力机制,输出每次迭代完整的路径状态;
对队列隐藏状态进行处理的步骤如下:
SC1,从路径状态序列中获取与队列对应的子集;
SC2,将路径状态求和,得到每个队列对应的路径状态总和;
SC3,将步骤SC1中得到的当前队列隐藏状态和步骤SC2的路径状态总和作为作为输入,经过GRU门控循环单元更新得到新的队列状态,输出每次迭代完整的队列状态;
对链路隐藏状态进行处理的步骤如下:
SD1,从队列状态中获取与链路对应的子集;
SD2,将链路状态经过GRU门控循环单元更新得到新的链路状态;
SD3,将步骤SD1中的状态作为输入传递给GRU门控循环单元,并将步骤SD2中的状态作为初始状态,输出每次迭代完整的链路状态。
进一步,步骤S6中,所述读出函数由神经网络实现,将最终的隐藏状态通过一个输入层和三个全连接层,其中最后一个全连接层的输出形状大小为1。
进一步,步骤S7中,流时延由排队时延/>和传输时延/>组成:
抖动为相对于平均时延的相对波动:/>其中,表示从隐藏状态中读出的队列占用率,/>表示对应的链路容量;表示链路平均传输数据包的大小;/>表示从隐藏状态中读出链路的时延变化率;
最后,丢包率定义为被丢弃的包相对于源传输的包的相对比率,直接通过读出函数R进行输出。
进一步,步骤S9中,所述动态参数包括时延、抖动和丢包;所述静态参数为网络的固有属性。
进一步,步骤S12中,所述经验B包括代理在环境中的状态、执行的动作/>、获取的奖励/>、新的状态/>和是否达到终止状态/>。
本发明与现有技术相比,其显著效果如下:
1、本发明采用的注意力机制能够使节点在消息传递的过程中根据邻接点对任务的重要程度自动对该邻接点的权重进行分配,并且在天地一体化网络中卫星节点与地面节点的“连-断”过程中能够迅速调整聚合权重,有效地提高了模型的预测能力。本发明的性能预测决定系数MAPE,时延预测的MAPE收敛至2.6677%,较于RouteNet-Erlang模型预测效果MAPE=14.3298%预测准确度提升了11.6621个百分点,较于RouteNet-Fermi模型预测效果MAPE=9.2740%预测准确度提升了6.6063个百分点;抖动预测的MAPE收敛至7.2822%,较于RouteNet-Erlang模型预测效果MAPE=13.334%预测准确度提升了6.0525个百分点,较于RouteNet-Fermi模型预测效果MAPE=11.8569%预测准确度提升了4.5747个百分点;
2、本发明在性能预测的基础上采用DDPG强化学习方法对预测的性能指标组合优化,能够实现对下一时间片的最佳路由决策;本发明的多QoS负载效果决定系数为源-目的地平均时延、抖动和丢包率,时延较于其他算法至少提升12.6%,抖动较于其他算法至少提升30.6%,丢包率较于其他算法至少提升19.5%,表明本发明提出的基于图注意力网络的天地一体化负载均衡路由策略,能够实现对天地一体化复杂网络性能的高精度预测,从而实施均衡的路由策略。
附图说明
图1为本发明的算法流程图;
图2为本发明与Routenet-Fermi和Routenet-Erlang时延预测的训练loss对比图;
图3为本发明与Routenet-Fermi和Routenet-Erlang抖动预测的训练loss对比图;
图4为本发明随机抽取50种路径下对时延的真实值与预测值对比的矩形图;
图5为本发明随机抽取50种路径下对时延的真实值与预测值对比的误差散点图;
图6为本发明随机抽取50种路径下对抖动的真实值与预测值对比的矩形图;
图7为本发明方法随机抽取50种路径下对抖动的真实值与预测值对比的误差散点图;
图8为本发明采用的真实网络拓扑图;
图9为本发明抽象后的网络拓扑图;
图10为神经网络隐藏状态初始化的模型图;
图11为基于MPNN和注意力机制的图神经网络模型;
图12为一种路径选择方案示意图。
实施方式
下面结合说明书附图和具体实施方式对本发明做进一步详细描述。
本发明的深度强化学习方法将图神经网络应用到天地一体化网络,图神经网络作为神经网络扩展,可以处理图结构表示的数据格式,旨在利用节点与节点之间的连接关系,通过递归聚合和转换相邻节点的表示向量来计算当前节点的表示向量,进而实现路径、链路和队列的关系约束,实现端到端流量传输时延、抖动和丢包率的准确预测,在此基础上进行组合优化达到负载均衡效果。
图1为本发明的算法流程图,具体实现步骤如下:
步骤1,将天地一体化网络拓扑转化为流量传递有向图,从而将网络性能预测转化为有监督的图学习任务。
流量传递有向图由节点/>和边/>组成的图结构:/>;其中/>表示网络中各个节点,/>表示节点间的连接关系;进一步地,设置节点集/>,其中/>表示给网络中节点标序,表示其网络中第/>个节点,/>表示自然数;定义网络中从源节点发送到目的节点的所有路径集合为/>,具体来说,/>由多个节点构成,如便是一种传输路径,代表了流量从节点/>出发,经过节点/>,最后到达节点/>,并进一步作如下定义:在任意两个节点间通信时,节点间存在多条链路,定义链路集为,其中,/>代表节点/>与节点/>间传输路径的第/>条链路;在每一条链路上,根据队列优先级,定义队列集/>,在同一链路/>上,有不同的队列/>,/>表示在该链路上的队列顺序。
步骤2,通过OMnet软件构建需要预测得到的网络拓扑,模拟100种流量情况,生成数据集,作为神经网络输入,并对数据集进行预处理。
为了验证本发明方法对真实网络有效,模拟了100种随机流量,这些随机流量有不同的流量特性,包括每个节点的队列调度策略,并依次分配权重、ToS(Type of Service,服务类型),以及流的到达时间分布和大小分布,其余如网络拓扑结构、节点间带宽大小等都是真实网络的静态属性。网络流特征如表1所示。
表1 网络流量特征表
表1中,FIFO(First in, First out)表示先入先出队列,SP(Strict Priority )表示严格优先级队列,WFQ(Weighted Fair Queuing)表示加权公平排队,DRR(DeficitRound Robin)表示差分轮询;possion表示泊松流;cbr表示恒定流;on_off表示开/关流。
生成数据集后需要对数据集进行清洗,以保证数据集的高质量和结果的有效性。本实施例中数据集验证的网络拓扑为47节点结构,通过实验证明,除了对数据集正常的处理流程外,去除源-目的节点长度小于4的路径集,能够进一步提升性能预测模型的训练效果。
步骤3,将数据集中的流特征数据进行归一化处理,通过特征嵌入H函数初始化路径、链路及队列的隐藏状态、/>和/>;
根据步骤2中迭代生成的数据集中得到的流特征,首先按照路径特征、链路特征和队列特征进行分类。其中路径特征包括源-目的节点的平均带宽traffic、单位时间数据包packets、以及生成流的数据包到达时间分布,如在on_off流的情况下,数据包的on周期平均持续时间AvgTOn的指数分布等。链路特征包括链路负载Load、调度策略SchedulingPolicy等。队列特征包括每个队列的统计信息。
其次,对于以数值表示的数据将其的实际值减去平均值,并除以标准差,作归一化处理。以平均带宽traffic为例,其归一化可表示为:
其中,/>是平均带宽traffic的归一化结果,/>是平均带宽traffic的平均值,/>是平均带宽traffic的标准差,/>表示平均带宽traffic。
对于以类别表示的数据将其用one_hot形式进行编码,例如队列调度策略共有四种,则将FIFO(First Input First Output)类型编码为[1,0,0,0],以此类推,方便后续的矩阵运算。
最后,通过路径、链路和队列的映射关系,依次将流的路径、链路和队列特征通过一个输入层、两个全连接层进行隐藏状态初始化,得到初始路径隐藏状态、初始链路隐藏状态/>和初始队列隐藏状态/>。
步骤4,通过MPNN(Message Passing Neural Network,消息传递神经网络)进行消息传递、聚合更新和生成信息依次对路径隐藏状态、链路隐藏状态/>和队列隐藏状态进行处理,在聚合过程中,采用注意力机制,以捕捉骨干节点的邻近图结构信息;该流程的伪代码如表2所示,其中/>表示路径描述,/>表示链路描述,/>表示队列描述。
表2 通过进行消息传递、聚合更新和生成信息的流程伪代码表
具体来说,首先,对路径隐藏状态进行处理:
B1)将链路与路径映射的隐藏状态、队列与路径映射的隐藏状态按索引进行收集,获取与路径对应的状态子集;
B2)将路径隐藏状态通过GRU门控循环单元进行更新,用来解决传统RNN(Recurrent Neural Network,循环神经网络)存在的梯度消失和梯度爆炸问题,以更好地捕捉序列数据中的长期依赖关系;
B3)将B1)中保存的先前路径隐藏状态与B2)更新得到的路径隐藏状态沿着axis=1拼接,对路径状态进行更新,在骨干网节点状态的聚合过程中,采用注意力机制,输出每次迭代完整的路径状态。
其次,对队列隐藏状态进行处理:
C1)从路径状态序列中获取与队列对应的子集;
C2)将路径状态求和,得到每个队列对应的路径状态总和;
C3)将C1)中得到的当前队列隐藏状态和C2)的路径状态总和作为输入,经过GRU门控循环单元更新得到新的队列状态,输出每次迭代完整的队列状态。
最后,对链路状态进行处理:
D1)从队列状态中获取与链路对应的子集;
D2)将链路状态经过GRU门控循环单元更新得到新的链路状态;
D3)将D1)中的状态作为输入传递给GRU门控循环单元,并将D2)中的状态作为初始状态,输出每次迭代完整的链路状态。
步骤5,重复步骤4至T次,以实现在更远的节点中进行消息传递,基于更广泛的图形结构进行更新;
在图神经网络中,节点需要通过其邻居节点来更新其特征,每一次迭代,每个节点都会从其邻居节点接收信息,然后更新自己的特征。传递次数T决定了信息在图结构中传递的深度,增加迭代次数,消息可以在图中流动得更远,从而使节点能够接收到更广泛的特征数据,T的具体取值由网络拓扑的深度决定。
步骤6,将T次传递后的路径、链路和队列的隐藏状态、/>和/>作为读出函数/>的输入,将图内所有节点的特征聚合,最终得到一个包含整个图信息的隐藏状态/>;
读出函数由神经网络实现,将T次传递后的路径、链路和队列的隐藏状态通过一个输入层和三个全连接层,其中最后一个全连接层的输出维度为1。
步骤7,计算流时延、抖动/>和每个流的丢包率/>;
原理基于排队理论,首先,计算流时延:
1)由排队时延和传输时延组成:
2)从链路容量列表中获取与路径对应的子集,表示每条链路的容量,神经网络可以根据读出函数输出的路径状态得到队列占有率,进而得到排队时延:
其中,/>表示从隐藏状态/>中读出的队列占用率,/>表示对应的链路容量。
3)将平均数据包大小除以链路容量得到传输时延:
其中,/>表示链路平均传输数据包的大小。
其次,计算抖动,/>结合沿着流的所有链路的抖动预测,抖动为相对于平均时延的相对波动,即时延方差除以流平均时延之间的比值:
其中,/>表示从隐藏状态/>中读出链路的时延变化率。
最后,丢包率定义为被丢弃的包相对于源传输的包的相对比率,直接通过读出函数/>进行输出。
步骤8,以平均绝对百分误差MAPE作为损失函数,对性能预测模型进行训练,迭代得到收敛值,生成源至目标节点的性能预测矩阵;
平均绝对百分误差MAPE的数学定义式为:
其中,/>表示真实值,/>表示预测值,/>为下标。
步骤9,根据步骤生成的性能矩阵参数,结合网络拓扑参数,划分为动态参数与静态参数;
动态参数包括时延、抖动和丢包等随网络情况变化的网络性能特征,静态参数为网络的固有属性,如链路容量和节点缓存区大小等。
步骤10,设置强化学习初始策略参数、/>函数参数/>和空的重放缓冲区D,以及目标参数/>、/>;
初始策略函数用于决定在给定状态下应该采取什么样的动作;/>函数,又叫动作值函数,用于评估在给定状态下采取某个动作的预期回报;重放缓冲区D用于存储和抽样经验的数据结构。
步骤11,根据状态执行选定的动作/>,并对新的状态/>给出一个奖励/>,以此来迭代代理策略,其中,/>是步骤9中对已预测网络性能的奖励函数,存入重放缓冲区D;
是对已预测网络性能的奖励函数,通过代理找到具有最大QoS奖励的路由路径,以最小化时延、抖动和丢包率,并保持较低的链路负载率。具体来说,感知奖励函数为/>,表示如下:
其中,src和dst分别表示源节点和目的节点,/>是/>在/>时刻的状态,/>是/>在/>时刻的动作,/>表示在采取动作/>的成本,/>是根据流量的QoS决定的可学习权值,其值大小由不同QoS的重要情况决定。具体来说,由于时延、抖动等性能指标在分母上,取倒数后,更小的时延和抖动会导致更高的奖励,所以根据业务需求是时延类还是抖动类等,可以决定各个性能指标的奖励程度。/>是一个非常小的数字,避免除以零的情况出现,/>是一个预定的最大阈值集。
步骤12,从重放缓冲区D中抽取经验Z进行学习,设置计算目标值;
重放缓冲区是一种数据结构,通常用于存储和抽取经验。这些经验包括代理在环境中的状态、执行的动作/>、获取的奖励/>、新的状态/>和是否达到终止状态/>等信息。通过存储这些经验,代理可以在训练过程中反复使用这些经验,以改进其策略。
步骤13,使用均方误差MES作为损失函数更新函数/>、策略函数及目标网络;
MSE的数学定义式为:
其中,/>表示真实值,/>表示预测值。
首先定义计算目标值:
其中,/>是折扣因子,用于衡量对未来奖励的重视程度,/>是/>函数网络和目标策略网/>络在状态/>下预测的/>值。
其次,更新函数:
其中,通过计算/>函数预测值/>与目标值/>的差的平方,并对所有在批次中的经验样本进行求和,并除以批次大小,已得到平均损失。/>表示对批次B中每个样本的损失进行梯度计算。
更新策略:
其中,/>表示计算该目标函数关于策略网络参数的梯度,/>表示策略网络。
更新目标网络:
其中,/>表示目标策略网络,/>表示/>函数网络,/>是一个介于0和1之间的因子,用于控制网络的更新速度。如果/>接近1,那么目标网络将主要基于自身的旧值进行更新,如果接近0,则更多地基于当前网络进行更新。
步骤14,重复步骤12的更新步骤,直至收敛,得到最优负载均衡路径结果。
根据奖励的多约束条件,在基于动态、静态参数的基础上得到最优的路由路径。
图2是本发明与Routenet-Fermi和Routenet-Erlang时延预测对比的训练loss对比图,可以看出本发明的时延预测效果相对于其他两类模型均有提升。
图3是本发明与Routenet-Fermi和Routenet-Erlang抖动预测对比的训练loss结果图,可以看出本发明的抖动预测效果相对于其他两类模型均有提升。
图4是本发明随机抽取50种路径下对时延的真实值与预测值对比的矩形图,由于不同的路径和流量配置有指数级的时延情况,因此抽取了50种时延情况作真实值与预测值对比。
图5是本发明随机抽取50种路径下对时延的真实值与预测值对比的误差散点图,由于不同的路径和流量配置有指数级的时延情况,因此抽取了50种时延情况作真实值与预测值对比。
图6是本发明随机抽取50种路径下对抖动的真实值与预测值对比的矩形图,由于不同的路径和流量配置有指数级的时延情况,因此抽取了50种抖动情况作真实值与预测值对比。
图7是本发明随机抽取50种路径下对抖动的真实值与预测值对比的误差散点图,由于不同的路径和流量配置有指数级的时延情况,因此抽取了50种抖动情况作真实值与预测值对比。
图8是本发明采用的真实网络拓扑图,是由微波、光线、区宽、U/V链和卫星组成的复杂天地一体化网络。
图9是本发明抽象后的网络拓扑图,是图神经网络抽象而成的由节点集和边(链路)/>组成的图结构/>。
图10是神经网络隐藏状态初始化的模型图,具体步骤如下:
步骤101,通过一个Input层,对于路径状态而言,输出17维,链路状态输出5维,队列状态输出5维;
步骤102,通过一个Dense层,输出均为32维,激活函数采用relu;
步骤103,重复步骤102。
图11是基于MPNN和注意力机制的图神经网络模型,同图1的步骤4、步骤5说明。
图12是一种路径选择方案,是基于当前网络内时延、抖动等多约束进行选择的一条路由方案。
Claims (8)
1.一种基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,包括如下步骤:
S1,将天地一体化网络拓扑转化为流量传递有向图;
S2,通过OMnet软件构建需要预测得到的网络拓扑,模拟多种流量情况,生成数据集,并对数据集进行预处理;
S3,将数据集中的流特征进行归一化处理,通过特征嵌入H函数分别对路径、链路、队列的隐藏状态进行初始化;
S4,通过MPNN进行消息传递、聚合更新和生成信息,依次对路径、链路、队列的隐藏状态进行处理;在聚合过程中,采用注意力机制捕捉骨干节点的邻近图结构信息;
S5,重复步骤S4至T次;
S6,将T次传递后的路径、链路和队列的隐藏状态作为读出函数的输入,将图内所有节点的特征聚合,最终得到一个包含整个图信息的隐藏状态;
S7,计算流时延、抖动和每个流的丢包率;
S8,以平均绝对百分误差MAPE作为损失函数,对性能预测模型进行训练,迭代得到收敛值,生成源至目标节点的性能预测矩阵;
S9,根据步骤S8生成的性能矩阵参数,结合网络拓扑参数,划分为动态参数与静态参数;
S10,设置强化学习初始策略参数、/>函数参数/> 和空的重放缓冲区D,以及目标参数/>、/>;
S11,根据状态执行选定的动作 ,并对新的状态/>给出一个奖励 />,以此来迭代代理策略;其中/>是对已预测网络性能的奖励函数,存入重放缓冲区D;
S12,从重放缓冲区D中抽取经验B进行学习,设置计算目标值;
S13,使用均方误差MSE作为损失函数更新函数 />、策略函数及目标网络;
S14,重复步骤S12的更新步骤,直至收敛,得到最优负载均衡路径结果。
2.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S1中,所述流量传递有向图 为由节点/>和边/>组成的图结构:/>,其中,/>表示网络中各个节点,/>表示节点间的连接关系;设置节点集,其中,/>表示网络中第/>个节点,/>表示自然数;定义网络中从源节点发送到目的节点的所有路径集合为/>,/>由多个节点构成,在任意两个节点间通信时,节点间存在多条链路,定义链路集为,其中,/>代表节点/>与节点/>间传输路径的第/>条链路;在每一条链路上,根据队列优先级,定义队列集/>,在同一链路/>上,有不同的队列/>,/>表示在该链路上的队列顺序。
3.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S3中,对路径、链路及队列的隐藏状态进行初始化的实现步骤如下:
S31,根据步骤S2数据集中得到的流特征,按照路径特征、链路特征和队列特征进行分类;
S32,对于以数值表示的数据将其的实际值减去平均值,并除以标准差,作归一化处理;
对于以类别表示的数据将其用one_hot形式进行编码;
S33,通过路径、链路和队列的映射关系,依次将流的路径、链路和队列特征通过一个输入层、两个全连接层进行隐藏状态初始化,得到初始路径隐藏状态、初始链路隐藏状态和初始队列隐藏状态。
4.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S4中,对路径隐藏状态进行处理的步骤如下:
SB1,将链路与路径映射的隐藏状态、队列与路径映射的隐藏状态按索引进行收集,获取与路径对应的状态子集;
SB2,将路径隐藏状态通过GRU门控循环单元进行更新;
SB3,将步骤SB1中保存的先前路径隐藏状态与步骤SB2更新得到的路径隐藏状态沿着axis=1拼接,对路径状态进行更新;在骨干网节点状态的聚合过程中,采用注意力机制,输出每次迭代完整的路径状态;
对队列隐藏状态进行处理的步骤如下:
SC1,从路径状态序列中获取与队列对应的子集;
SC2,将路径状态求和,得到每个队列对应的路径状态总和;
SC3,将步骤SC1中得到的当前队列隐藏状态和步骤SC2的路径状态总和作为输入,经过GRU门控循环单元更新得到新的队列状态,输出每次迭代完整的队列状态;
对链路隐藏状态进行处理的步骤如下:
SD1,从队列状态中获取与链路对应的子集;
SD2,将链路状态经过GRU门控循环单元更新得到新的链路状态;
SD3,将步骤SD1中的状态作为输入传递给GRU门控循环单元,并将步骤SD2中的状态作为初始状态,输出每次迭代完整的链路状态。
5.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S6中,所述读出函数由神经网络实现,将最终的隐藏状态通过一个输入层和三个全连接层,其中最后一个全连接层的输出形状大小为1。
6.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S7中,流时延由排队时延/> 和传输时延/>组成:抖动/>为相对于平均时延的相对波动:其中,/>表示从隐藏状态中读出的队列占用率,/>表示对应的链路容量;/>表示链路平均传输数据包的大小;/>表示从隐藏状态中读出链路的时延变化率;
最后,丢包率 定义为被丢弃的包相对于源传输的包的相对比率,直接通过读出函数 R进行输出。
7.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S9中,所述动态参数包括时延、抖动和丢包;所述静态参数为网络的固有属性。
8.根据权利要求1所述基于深度强化学习的天地一体化负载均衡路由方法,其特征在于,步骤S12中,所述经验B包括代理在环境中的状态、执行的动作/> 、获取的奖励 />、新的状态/>和是否达到终止状态/>。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311669916.1A CN117395188B (zh) | 2023-12-07 | 2023-12-07 | 一种基于深度强化学习的天地一体化负载均衡路由方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311669916.1A CN117395188B (zh) | 2023-12-07 | 2023-12-07 | 一种基于深度强化学习的天地一体化负载均衡路由方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117395188A true CN117395188A (zh) | 2024-01-12 |
CN117395188B CN117395188B (zh) | 2024-03-12 |
Family
ID=89437565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311669916.1A Active CN117395188B (zh) | 2023-12-07 | 2023-12-07 | 一种基于深度强化学习的天地一体化负载均衡路由方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117395188B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117827619A (zh) * | 2024-02-29 | 2024-04-05 | 浪潮电子信息产业股份有限公司 | 异构算力的耗时预测仿真方法、装置、设备、介质及系统 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114221691A (zh) * | 2021-12-17 | 2022-03-22 | 南京工业大学 | 一种基于深度强化学习的软件定义空天地一体化网络路由优化方法 |
US20220124543A1 (en) * | 2021-06-30 | 2022-04-21 | Oner Orhan | Graph neural network and reinforcement learning techniques for connection management |
CN114697229A (zh) * | 2022-03-11 | 2022-07-01 | 华中科技大学 | 一种分布式路由规划模型的构建方法及应用 |
CN115173923A (zh) * | 2022-07-04 | 2022-10-11 | 重庆邮电大学 | 一种低轨卫星网络能效感知路由优化方法和系统 |
CN115842768A (zh) * | 2022-11-22 | 2023-03-24 | 桂林电子科技大学 | 一种基于图神经网络的时空特征融合的sdn路由优化方法 |
CN116170370A (zh) * | 2023-02-20 | 2023-05-26 | 重庆邮电大学 | 一种基于注意力机制和深度强化学习的sdn多路径路由方法 |
CN116170853A (zh) * | 2022-12-29 | 2023-05-26 | 北京理工大学 | 基于机器学习的QoS与负载均衡协同保障卫星路由算法 |
CN116248164A (zh) * | 2022-12-16 | 2023-06-09 | 重庆邮电大学 | 基于深度强化学习的完全分布式路由方法和系统 |
US20230209437A1 (en) * | 2021-12-20 | 2023-06-29 | A10 Systems LLC | Intelligent network slicing and policy-based routing engine |
CN116390164A (zh) * | 2023-04-11 | 2023-07-04 | 西安电子科技大学 | 一种低轨卫星网络可信负载均衡路由方法、系统、设备及介质 |
CN116781139A (zh) * | 2023-06-12 | 2023-09-19 | 杭州电子科技大学 | 一种基于强化学习的流量预测卫星路径选择方法及系统 |
CN116827846A (zh) * | 2023-05-30 | 2023-09-29 | 北京邮电大学 | 路由、路由路径、多播路由路径决策方法及电子设备 |
CN116886176A (zh) * | 2023-08-23 | 2023-10-13 | 重庆邮电大学 | 一种基于链路效用函数的可预测星间路由方法 |
CN116886587A (zh) * | 2023-08-11 | 2023-10-13 | 贵州电网有限责任公司 | 一种基于知识及深度强化学习的电力通信网路由优化方法 |
CN116939761A (zh) * | 2023-07-26 | 2023-10-24 | 东北大学 | 一种基于强化学习的空地协同路由方法 |
CN117014355A (zh) * | 2022-04-28 | 2023-11-07 | 中国科学院沈阳自动化研究所 | 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法 |
US20230362095A1 (en) * | 2022-05-05 | 2023-11-09 | Zhengzhou University Of Light Industry | Method for intelligent traffic scheduling based on deep reinforcement learning |
CN117041129A (zh) * | 2023-08-24 | 2023-11-10 | 电子科技大学 | 一种基于多智能体强化学习的低轨卫星网络流路由方法 |
CN117041132A (zh) * | 2023-10-08 | 2023-11-10 | 中国人民解放军国防科技大学 | 一种基于深度强化学习的分布式负载均衡卫星路由方法 |
-
2023
- 2023-12-07 CN CN202311669916.1A patent/CN117395188B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220124543A1 (en) * | 2021-06-30 | 2022-04-21 | Oner Orhan | Graph neural network and reinforcement learning techniques for connection management |
CN114221691A (zh) * | 2021-12-17 | 2022-03-22 | 南京工业大学 | 一种基于深度强化学习的软件定义空天地一体化网络路由优化方法 |
US20230209437A1 (en) * | 2021-12-20 | 2023-06-29 | A10 Systems LLC | Intelligent network slicing and policy-based routing engine |
CN114697229A (zh) * | 2022-03-11 | 2022-07-01 | 华中科技大学 | 一种分布式路由规划模型的构建方法及应用 |
CN117014355A (zh) * | 2022-04-28 | 2023-11-07 | 中国科学院沈阳自动化研究所 | 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法 |
US20230362095A1 (en) * | 2022-05-05 | 2023-11-09 | Zhengzhou University Of Light Industry | Method for intelligent traffic scheduling based on deep reinforcement learning |
CN115173923A (zh) * | 2022-07-04 | 2022-10-11 | 重庆邮电大学 | 一种低轨卫星网络能效感知路由优化方法和系统 |
CN115842768A (zh) * | 2022-11-22 | 2023-03-24 | 桂林电子科技大学 | 一种基于图神经网络的时空特征融合的sdn路由优化方法 |
CN116248164A (zh) * | 2022-12-16 | 2023-06-09 | 重庆邮电大学 | 基于深度强化学习的完全分布式路由方法和系统 |
CN116170853A (zh) * | 2022-12-29 | 2023-05-26 | 北京理工大学 | 基于机器学习的QoS与负载均衡协同保障卫星路由算法 |
CN116170370A (zh) * | 2023-02-20 | 2023-05-26 | 重庆邮电大学 | 一种基于注意力机制和深度强化学习的sdn多路径路由方法 |
CN116390164A (zh) * | 2023-04-11 | 2023-07-04 | 西安电子科技大学 | 一种低轨卫星网络可信负载均衡路由方法、系统、设备及介质 |
CN116827846A (zh) * | 2023-05-30 | 2023-09-29 | 北京邮电大学 | 路由、路由路径、多播路由路径决策方法及电子设备 |
CN116781139A (zh) * | 2023-06-12 | 2023-09-19 | 杭州电子科技大学 | 一种基于强化学习的流量预测卫星路径选择方法及系统 |
CN116939761A (zh) * | 2023-07-26 | 2023-10-24 | 东北大学 | 一种基于强化学习的空地协同路由方法 |
CN116886587A (zh) * | 2023-08-11 | 2023-10-13 | 贵州电网有限责任公司 | 一种基于知识及深度强化学习的电力通信网路由优化方法 |
CN116886176A (zh) * | 2023-08-23 | 2023-10-13 | 重庆邮电大学 | 一种基于链路效用函数的可预测星间路由方法 |
CN117041129A (zh) * | 2023-08-24 | 2023-11-10 | 电子科技大学 | 一种基于多智能体强化学习的低轨卫星网络流路由方法 |
CN117041132A (zh) * | 2023-10-08 | 2023-11-10 | 中国人民解放军国防科技大学 | 一种基于深度强化学习的分布式负载均衡卫星路由方法 |
Non-Patent Citations (6)
Title |
---|
JIAXIN SONG ET AL.: "Trustworthy and Load-Balancing Routing Scheme for Satellite Services with Multi-Agent DRL", IEEE INFOCOM 2023 - IEEE CONFERENCE ON COMPUTER COMMUNICATIONS WORKSHOPS (INFOCOM WKSHPS) * |
KAI-CHU TSAI ET AL.: "Deep Reinforcement Learning-Based Routing for Space-Terrestrial Networks", 2022 IEEE 96TH VEHICULAR TECHNOLOGY CONFERENCE (VTC2022-FALL) * |
PEILIANG ZUO ET AL.: "Deep Reinforcement Learning Based Load Balancing Routing for LEO Satellite Network", 2022 IEEE 95TH VEHICULAR TECHNOLOGY CONFERENCE: (VTC2022-SPRING) * |
YI-HUAI HSU ET AL.: "A Deep Reinforcement Learning based Routing Scheme for LEO Satellite Networks in 6G", 2023 IEEE WIRELESS COMMUNICATIONS AND NETWORKING CONFERENCE (WCNC) * |
戴翠琴;尹小盼;: "卫星网络中基于蚁群优化的概率路由算法", 重庆邮电大学学报(自然科学版), no. 03 * |
王娟;郭俞江;孙力娟;周剑;韩崇;: "面向双层卫星网络的多业务负载均衡算法", 系统工程与电子技术, no. 09 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117827619A (zh) * | 2024-02-29 | 2024-04-05 | 浪潮电子信息产业股份有限公司 | 异构算力的耗时预测仿真方法、装置、设备、介质及系统 |
CN117827619B (zh) * | 2024-02-29 | 2024-05-24 | 浪潮电子信息产业股份有限公司 | 异构算力的耗时预测仿真方法、装置、设备、介质及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117395188B (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109818865B (zh) | 一种sdn增强路径装箱装置及方法 | |
CN113158543B (zh) | 一种软件定义网络性能智能预测方法 | |
CN117395188B (zh) | 一种基于深度强化学习的天地一体化负载均衡路由方法 | |
Du et al. | Resource allocation with video traffic prediction in cloud-based space systems | |
WO2021036414A1 (zh) | 一种低轨移动卫星星座下星地下行链路同频干扰预测方法 | |
US20080144663A1 (en) | Method and system for using bayesian network inference for selection of transport protocol algorithm | |
CN114900225B (zh) | 一种基于低轨巨星座的民航互联网业务管理与接入资源分配方法 | |
CN111988225A (zh) | 基于强化学习和迁移学习的多路径路由方法 | |
CN114143264A (zh) | 一种SRv6网络下基于强化学习的流量调度方法 | |
Tran et al. | Mabrese: A new server selection method for smart SDN-based CDN architecture | |
CN117014355A (zh) | 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法 | |
CN112788605A (zh) | 基于双延迟深度确定性策略边缘计算资源调度方法和系统 | |
CN113225370A (zh) | 一种基于物联网的区块链多目标优化方法 | |
Fan et al. | Network selection based on evolutionary game and deep reinforcement learning in space-air-ground integrated network | |
CN118214718B (zh) | 拥塞控制方法、电子设备、存储介质和程序产品 | |
Yin et al. | Predictive gan-powered multi-objective optimization for hybrid federated split learning | |
CN114629769B (zh) | 自组织网络的流量图谱生成方法 | |
CN117041129A (zh) | 一种基于多智能体强化学习的低轨卫星网络流路由方法 | |
Bie et al. | Queue management algorithm for satellite networks based on traffic prediction | |
CN115913979A (zh) | 一种全域网络拓扑处理方法和设备 | |
CN114205251B (zh) | 基于时空特征的交换机链路资源预测方法 | |
CN117714307A (zh) | 基于深度学习预测的动态网络路由优化方法与系统 | |
CN112333102B (zh) | 基于知识图谱的软件定义网络路由选择方法和系统 | |
Zhang et al. | MLP Modeling and Prediction of IP Subnet Packets Forwarding Performance | |
Qi et al. | Edge-edge Collaboration Based Micro-service Deployment in Edge Computing Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |