CN114143264B - 一种SRv6网络下基于强化学习的流量调度方法 - Google Patents

一种SRv6网络下基于强化学习的流量调度方法 Download PDF

Info

Publication number
CN114143264B
CN114143264B CN202111359486.4A CN202111359486A CN114143264B CN 114143264 B CN114143264 B CN 114143264B CN 202111359486 A CN202111359486 A CN 202111359486A CN 114143264 B CN114143264 B CN 114143264B
Authority
CN
China
Prior art keywords
network
reinforcement learning
link
srv
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111359486.4A
Other languages
English (en)
Other versions
CN114143264A (zh
Inventor
陈宁江
何子琦
刘雨晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN202111359486.4A priority Critical patent/CN114143264B/zh
Publication of CN114143264A publication Critical patent/CN114143264A/zh
Application granted granted Critical
Publication of CN114143264B publication Critical patent/CN114143264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

本发明公开了一种SRv6(Segment Routing IPv6)网络下基于强化学习的流量调度方法。所述方法包括:在完全部署的IPv6网络下,通过SDN(Software Defined Network)控制器获取SRv6链路状态信息以及历史业务流量矩阵;通过流量矩阵离线训练强化学习网络;通过SDN控制器搭载强化学习网络,以实时链路状态信息调整链路权重参数,从而实现流量负载均衡,进一步通过网络信息迭代训练强化学习网络。本发明在不需获得完整网络拓扑的情况下,能够在部分部署的SRv6网路下实现链路的负载均衡,提高网络链路的利用率。

Description

一种SRv6网络下基于强化学习的流量调度方法
技术领域
本发明属于计算机技术领域,更具体地,涉及一种SRv6网络下基于强化学习的流量调度方法。
背景技术
流量工程旨在解决流量爆炸式增长问题,是一种通过调整流量路由链路,对网络资源进行优化调度,从而实现全局或局部网络链路上的负载均衡,以避免网络拥塞,提高网络利用率的技术,其核心是网络流量的调度方法。
在传统的流量调度方案中,常采用ECMP(Equal Cost Multi-path,等价多路径路由)算法进行负载均衡,该类算法仅通过简单的数学模型将流量按比例分配到多条链路中,缺乏对网络状况的感知机制。进一步而言,通过SDN(Software Defined Network,软件定义网络)等技术刻画网络拓扑,将流量调度映射为线性规划问题,能够在多项式时间内求出实际网络下的最优解。但受限于IP(Internet Protocol,网际互连协议)网络路由逐跳查表的转发机制,流量调度的重路由具有过大的网络开销同时有导致环路的风险。
SRv6网络是一种新兴的网络技术,仅通过部署部分SRv6节点,在源端加入转发标签,就能够做到端到端的显式路径转发,流的状态仅存储在SR(Segment Routing,分段路由)域的入口,从而避免过大的重路由开销以及环路风险。但由于网络升级的困难,导致目前SRv6网络大都是部分部署在IPv6网络域中,这导致了显示路径转发的不完全,从而增加了流量调度的复杂性。
发明内容
针对现有技术的局限性,本发明主要针对SRv6网络环境下的流量调度,利用强化学习的强大表达能力构造了一套基于强化学习的流量调度方法,主要实现了在具体网络情况下,针对不同业务的链路自适应计算优先级以及权重,其目的在于提升网络的利用率以及用户的满意度。
本发明提供一种SRv6网络下基于强化学习的流量调度方法,包括如下步骤:
(1)通过SDN控制器获取链路状态信息、网络拓扑以及流量特征:所述SDN控制器所收集链路状态信息包括转发链路带宽以及时延,所述流量特征包括端到端的业务流量类型以及业务流量矩阵;
(2)预训练算路组件以进行流量调度:所述算路组件包含网络特征计算模块、强化学习网络模块以及真实环境仿真模块,网络特征计算模块通过历史业务流量矩阵计算端到端的特征业务流量矩阵;强化学习网络模块基于Actor-Critic结构在连续动作空间内进行训练;真实环境仿真模块通过所收集网络拓扑信息以及链路状态信息构建真实网络仿真环境,模拟在特征业务流量矩阵下的SRv6报文转发过程,为强化学习网络提供反馈;
(3)通过算路组件调节链路权重参数以及优先级,并通过SRv6网络转发数据包:所述算路组件输出动作构成链路权重集合以及链路优先级集合,所述权重集合通过聚合相同头结点以及目的节点链路构成多个链路聚合组,在组内相似优先级链路构成等价路径ECMP,在ECMP组内进行链路权重归一化;所述SRv6网络对业务流量通过优先级参数选择优先级最高的有效ECMP组,并通过链路权重参数分割流量,以实现非平衡链路负载均衡;
(4)通过实时数据进一步迭代强化学习网络:所述强化学习网路在真实环境中通过真实网络信息进一步进行训练迭代。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有如下有益的效果:无需获得完整网络拓扑,能够在部分部署的SRv6网路下实现链路的负载均衡,增大网络链路的利用率。
附图说明
图1是本发明实施例中一种SRv6网络下基于强化学习的流量调度方法的主要流程图;
图2是本发明实施例中一种SRv6网络下基于强化学习的流量调度方法的SDN控制器的结构图;
图3是本发明实施例中一种SRv6网络下基于强化学习的流量调度方法用于算路组件训练的强化学习网络图;
图4是本发明实施例中一种SRv6网络下基于强化学习的流量调度方法的链路优先级聚类算法示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
由于IPv6庞大地址域的支持,使得端到端的直接连接成为可能,这使得端到端的流量行为带有极为强烈的用户行为特征,通过学习该特征能够更好地进行流量负载调度。为提高SRv6网络下的链路利用率,如图1所示,本发明提供了一种SRv6(Segment RoutingIPv6)网络下基于强化学习的流量调度方法,基于SRv6 policy模型实现了结合强化学习基于业务分类进行链路负载均衡的流量调度方法,包括:
(1)通过SDN控制器获取链路状态信息、网络拓扑以及流量特征。所述SDN控制器所收集链路状态信息包括转发链路带宽以及时延,所收集流量特征包括端到端的业务流量类型以及业务流量矩阵;
如图2所示,SDN控制器包括信息采集模块、链路状态数据库、网络信息数据库以及算路组件。信息采集模块通过BGP(Border Gateway Protocol,边界网关协议)协议采集网络信息,包括网络拓扑信息以及流量矩阵;链路状态数据库存储网络拓扑信息,用于在强化学习网络训练中模拟真实网络环境反馈;网络信息数据库统计时延优先业务以及带宽优先业务的网络流量矩阵,作为强化学习状态输入。
业务流量类型为时延优先或带宽优先,业务流量矩阵包括时延优先业务流量矩阵以及带宽优先业务流量矩阵,业务流量矩阵中行数和列数代表头结点和目的节点,其数值代表一定时间内端到端的业务流量;算路组件通过强化学习网络调度网络流量。
(2)预训练算路组件以进行流量调度。
所述算路组件包含网络特征计算模块、强化学习网络模块以及真实环境仿真模块,网络特征计算模块通过历史业务流量矩阵计算端到端的特征业务流量矩阵;强化学习网络包括两个同构网络,即带宽优先业务强化学习网络以及时延优先业务强化学习网络,强化学习网络基于Actor-Critic结构在连续动作空间内进行训练;真实环境仿真模块通过所收集网络拓扑信息以及链路状态信息构建真实网络仿真环境,模拟在特征业务流量矩阵下的SRv6报文转发过程,为强化学习网络提供反馈;
具体地,网络特征计算模块通过对两种业务流量矩阵(时延优先业务流量矩阵以及带宽优先业务流量矩阵)求数学期望获得两种业务的特征流量矩阵,由于IPv6端到端的特性,特征流量矩阵能够代表端到端的历史行为特征。基于TD3(Twin Delayed DeepDeterministic policy gradient algorithm)模型构造两个强化学习网络分别用于对时延优先业务和带宽优先业务进行流量调度,对两种特征流量矩阵分别进行强化学习训练。SDN控制器通过链路状态数据库构建虚拟仿真网络,每次迭代通过仿真环境计算奖励函数反馈,参与强化学习网络训练;
算路组件强化学习网络模块针对于两种不同业务,构建两个同构网络,即带宽优先业务强化学习网络以及时延优先业务强化学习网络,强化学习网络结构如图3所示,由一个表演者(Actor)模块和两个评价者(Critic)模块构成,三个模块具有相同的DNN(DeepNeural Networks)。其强化学习网络结构中输入状态空间为St={u1,u2,...,ue},其中e为链路数,ui为链路i的使用率,输出行为空间为At={p1,p2,...,pe,w1,w2,...,we},其中pi为链路i的优先级,wi为链路i的权重,e为链路数。
在状态空间s={u1,u2,...,ue}(其中e为链路数,ui为链路i的使用率)下,Actor模块输出具体行为μ(s;θμ)={p1,p2,...,pe,w1,w2,...,we}(其中pi为链路i的优先级,wi为链路i的权重,e为链路数),Critic模块输出在当前状态下进行行为μ(s;θμ)的预期收益Q(s,a;θQ),具体而言,Actor模块具有损失函数:
Critic模块具有损失函数:
其中D为回放经验库,ε为随机噪声,为状态/>下的奖励回馈。
强化学习网络训练为保证样本独立同分布采用经验回放机制,同时为保证行为的探索能力,在表演者训练迭代以及行为输出时加入噪声,同时表演者网络更新频率慢于评价者网络更新速率,其中表演者网络采用确定性策略梯度下降进行参数更新;
进一步地,所述带宽优先强化学习网络训练目标为最大链路利用率的最小化,其奖励函数为:
时延优先业务强化学习网络训练目标为平均延迟和最大链路利用率的最小化,其奖励函数为:
其中t为迭代总轮数,e为链路数,ui(k)为第k轮迭代中链路i的链路利用率,Tk为第k轮迭代中网络环境仿真所得到的端到端最长时延,Tt为第t轮迭代中网络环境仿真所得到的端到端最长时延,其中β为相对重要程度,其值取决于先验知识。
(3)通过算路组件调节链路权重参数以及优先级,并通过SRv6网络转发数据包。
所述算路组件输出动作构成链路权重集合以及链路优先级集合,所述权重集合通过聚合相同头结点以及目的节点链路构成多个链路聚合组,在组内相似优先级链路构成等价路径ECMP,在ECMP组内进行链路权重归一化;所述SRv6网络对业务流量通过优先级参数选择优先级最高的有效ECMP组,并通过链路权重参数分割流量,以实现非平衡链路负载均衡;
在相同头结点以及目的节点的链路聚合组中依据链路优先级采用DBSCAN(Density-Based Spatial Clustering ofApplications with Noise)算法基于密度进行聚类,最终形成k条等价路径,其中最小包含点数以及扫描半径基于先验知识。
具体地,通过上述SDN算路组件求解出最优化的链路集合,依据SRv6Policy模型,将链路按照(Headend,Color,Endpoint)-Preference-Weight的三层模型划分为多个链路组,其中由于SDN算路组件优先级输出为连续值,采用DBSCAN算法进行密度聚类,将相似优先级的链路组划分为等价链路,最终生成链路信息数据库。通过BGP或PCEP等协议将SRv6Policy下发到头结点,实现控制器全局调优。SRv6网络转发数据通过SRv6 Policy引流,最终实现链路负载均衡;
其中DBSCAN算法是一种针对密度的聚类算法,具体而言,如图4所示,通过对选中点周围ε范围内进行扫描,将范围内不少于n个点聚集为一类,并对新加入的所有点继续迭代运行扫描算法,若范围内点的个数不足n,则重新选择样本点。最终形成的链路数据结构满足SRv6 Policy模型要求,数据流首先通过头尾节点以及业务类型命中一条Policy,然后选择优先级最高的可用链路组作为转发链路组,最终流量依据转发链路组中参数见负载均衡转发;
(4)通过实时数据进一步迭代强化学习网络。
所述强化学习网路在真实环境中通过真实网络信息进一步进行训练迭代;
具体地,依据真实网络反馈,微调算路组件中的强化学习网络,按照一定次数迭代后,更新SRv6 Policy,并通过控制器下发至SRv6转发节点。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种SRv6网络下基于强化学习的流量调度方法,其特征在于,包括如下步骤:
(1)通过SDN控制器获取链路状态信息、网络拓扑以及流量特征:所述SDN控制器所收集链路状态信息包括转发链路带宽以及时延,所述流量特征包括端到端的业务流量类型以及业务流量矩阵;
(2)预训练算路组件以进行流量调度:所述算路组件包含网络特征计算模块、强化学习网络模块以及真实环境仿真模块,网络特征计算模块通过历史业务流量矩阵计算端到端的特征业务流量矩阵;强化学习网络模块基于Actor-Critic结构在连续动作空间内进行训练;真实环境仿真模块通过所收集网络拓扑信息以及链路状态信息构建真实网络仿真环境,模拟在特征业务流量矩阵下的SRv6报文转发过程,为强化学习网络提供反馈;
(3)通过算路组件调节链路权重参数以及优先级,并通过SRv6网络转发数据包:所述算路组件输出动作构成链路权重集合以及链路优先级集合,所述权重集合通过聚合相同头结点以及目的节点链路构成多个链路聚合组,在组内相似优先级链路构成等价路径ECMP,在ECMP组内进行链路权重归一化;所述SRv6网络对业务流量通过优先级参数选择优先级最高的有效ECMP组,并通过链路权重参数分割流量,以实现非平衡链路负载均衡;
(4)通过实时数据进一步迭代强化学习网络:所述强化学习网路在真实环境中通过真实网络信息进一步进行训练迭代。
2.如权利要求1所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(1)中的SDN控制器包括信息采集模块、链路状态数据库、网络信息数据库以及算路组件,信息采集模块通过BGP协议采集网络信息,包括网络拓扑信息以及流量矩阵;链路状态数据库存储网络拓扑信息,用于在强化学习网络训练中模拟真实网络环境反馈;网络信息数据库统计时延优先业务以及带宽优先业务的网络流量矩阵,作为强化学习状态输入。
3.如权利要求1或2所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(1)中的业务流量类型为时延优先或带宽优先,流量矩阵包括时延优先业务流量矩阵以及带宽优先业务流量矩阵,流量矩阵中行数和列数代表头结点和目的节点,其数值代表一定时间内端到端的业务流量。
4.如权利要求1或2所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(2)中的算路组件包含网络特征计算模块、强化学习网络模块以及真实环境仿真模块,网络特征计算模块通过历史业务流量矩阵计算端到端的特征业务流量矩阵;强化学习网络包括两个同构网络,即带宽优先业务强化学习网络以及时延优先业务强化学习网络,强化学习网络基于Actor-Critic结构在连续动作空间内进行训练;真实环境仿真模块通过所收集网络拓扑信息以及链路状态信息构建真实网络仿真环境,模拟在特征业务流量矩阵下的SRv6报文转发过程,为强化学习网络提供反馈。
5.如权利要求1所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(2)中,强化学习网络由一个表演者Actor模块和两个评价者Critic模块构成,三个模块具有相同的DNN,强化学习网络结构中输入状态空间为St={u1,u2,...,ue},其中e为链路数,ui为链路i的使用率,输出行为空间为At={p1,p2,...,pe,w1,w2,...,we},其中pi为链路i的优先级,wi为链路i的权重,e为链路数。
6.如权利要求5所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,在状态空间s={u1,u2,...,ue}下,Actor模块输出具体行为μ(s;θμ)={p1,p2,...,pe,w1,w2,...,we},Critic模块输出在当前状态下进行行为μ(s;θμ)的预期收益Q(s,a;θQ),Actor模块具有损失函数:
Critic模块具有损失函数:
其中D为回放经验库,ε为随机噪声,为状态/>下的奖励回馈。
7.如权利要求6所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(2)中,带宽优先强化学习网络训练目标为最大链路利用率的最小化,其奖励函数为:
时延优先业务强化学习网络训练目标为平均延迟和最大链路利用率的最小化,其奖励函数为:
其中,t为迭代总轮数,e为链路数,ui(k)为第k轮迭代中链路i的链路利用率,Tk为第k轮迭代中网络环境仿真所得到的端到端最长时延,Tt为第t轮迭代中网络环境仿真所得到的端到端最长时延,其中β为相对重要程度,其值取决于先验知识。
8.如权利要求7所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(2)中,强化学习网络训练为保证样本独立同分布采用经验回放机制,同时为保证行为的探索能力,在表演者训练迭代以及行为输出时加入噪声,表演者网络更新频率慢于评价者网络更新速率,其中表演者网络采用确定性策略梯度下降进行参数更新。
9.如权利要求1或2所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述步骤(3)具体为:通过算路组件求解出最优化的链路集合,依据SRv6 Policy模型,将链路按照(Headend,Color,Endpoint)-Preference-Weight的三层模型划分为多个链路组,其中由于算路组件优先级输出为连续值,采用DBSCAN算法进行密度聚类,将相似优先级的链路组划分为等价链路,最终生成链路信息数据库,通过BGP或PCEP协议将SRv6 Policy下发到头结点,实现控制器全局调优,SRv6网络转发数据通过SRv6 Policy引流,最终实现链路负载均衡。
10.如权利要求9所述的一种SRv6网络下基于强化学习的流量调度方法,其特征在于,所述采用DBSCAN算法进行密度聚类,具体为:
通过对选中点周围ε范围内进行扫描,将范围内不少于n个点聚集为一类,并对新加入的所有点继续迭代运行扫描算法,若范围内点的个数不足n,则重新选择样本点,最终形成的链路数据结构满足SRv6 Policy模型要求,数据流首先通过头尾节点以及业务类型命中一条Policy,然后选择优先级最高的可用链路组作为转发链路组,最终流量依据转发链路组中参数进行负载均衡转发。
CN202111359486.4A 2021-11-17 2021-11-17 一种SRv6网络下基于强化学习的流量调度方法 Active CN114143264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111359486.4A CN114143264B (zh) 2021-11-17 2021-11-17 一种SRv6网络下基于强化学习的流量调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111359486.4A CN114143264B (zh) 2021-11-17 2021-11-17 一种SRv6网络下基于强化学习的流量调度方法

Publications (2)

Publication Number Publication Date
CN114143264A CN114143264A (zh) 2022-03-04
CN114143264B true CN114143264B (zh) 2023-08-01

Family

ID=80389807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111359486.4A Active CN114143264B (zh) 2021-11-17 2021-11-17 一种SRv6网络下基于强化学习的流量调度方法

Country Status (1)

Country Link
CN (1) CN114143264B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827272A (zh) * 2022-03-22 2022-07-29 深圳智芯微电子科技有限公司 电力业务管理方法及其装置、变电站设备和存储介质
CN114726770B (zh) * 2022-04-11 2023-03-21 中国科学院计算技术研究所 一种应用于分段路由网络环境的流量工程方法
CN115118608B (zh) * 2022-05-07 2024-05-03 清华大学 快速流量工程方法及装置
CN114884866A (zh) * 2022-06-09 2022-08-09 中国电信股份有限公司 一种路径确定方法、装置、系统、设备及存储介质
CN115150335B (zh) * 2022-06-30 2023-10-31 武汉烽火技术服务有限公司 一种基于深度强化学习的最优流量分割的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109922004A (zh) * 2019-04-24 2019-06-21 清华大学 基于部分部署分段路由的IPv6网络的流量工程方法及装置
KR20200002439A (ko) * 2018-06-29 2020-01-08 주식회사 케이티 소프트웨어 정의 네트워크 환경에서 기계 학습 기반의 경로 선택 장치 및 방법
CN113328938A (zh) * 2021-05-25 2021-08-31 电子科技大学 一种基于深度强化学习的网络自主智能管控方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765595B (zh) * 2019-10-10 2022-12-09 内蒙古农业大学 基于多层虚拟拓扑节能的sdn数据中心网络流量调度方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200002439A (ko) * 2018-06-29 2020-01-08 주식회사 케이티 소프트웨어 정의 네트워크 환경에서 기계 학습 기반의 경로 선택 장치 및 방법
CN109922004A (zh) * 2019-04-24 2019-06-21 清华大学 基于部分部署分段路由的IPv6网络的流量工程方法及装置
CN113328938A (zh) * 2021-05-25 2021-08-31 电子科技大学 一种基于深度强化学习的网络自主智能管控方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Pu,WJ,et al.SDCUP:Software-Defined-Control based erasure-coded collaborative data update mechanism.IEEE access.2020,第8卷180646-180660. *
基于深度学习的SDN虚拟蜜网路由优化;胡洋;;计算机系统应用(第10期);278-283 *

Also Published As

Publication number Publication date
CN114143264A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN114143264B (zh) 一种SRv6网络下基于强化学习的流量调度方法
CN109818865B (zh) 一种sdn增强路径装箱装置及方法
CN112437020B (zh) 一种基于深度强化学习的数据中心网络负载均衡方法
Yao et al. Machine learning aided load balance routing scheme considering queue utilization
Mao et al. A tensor based deep learning technique for intelligent packet routing
CN101447936B (zh) 基于粒子群算法的多播路由方法
CN114827021A (zh) 一种基于sdn和机器学习的多媒体业务流量加速系统
Abdel-Kader An improved discrete PSO with GA operators for efficient QoS-multicast routing
Zhou et al. Multi-task deep learning based dynamic service function chains routing in SDN/NFV-enabled networks
Barolli et al. A genetic algorithm based routing method using two QoS parameters
Meng et al. Intelligent routing orchestration for ultra-low latency transport networks
Sahoo et al. The multi-constrained multicast routing improved by hybrid bacteria foraging-particle swarm optimization
Bhavanasi et al. Dealing with changes: Resilient routing via graph neural networks and multi-agent deep reinforcement learning
An et al. Dynamically split the traffic in software defined network based on deep reinforcement learning
CN117014355A (zh) 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法
Umlauft et al. QoS-aware ant routing with colored pheromones in wireless mesh networks
Cong et al. SOHO-FL: a fast reconvergent intra-domain routing scheme using federated learning
Liang et al. Machine Learning Applications in the Routing in Computer Networks
Kojic et al. Neural network based dynamic multicast routing
Wei et al. G-Routing: Graph Neural Networks-Based Flexible Online Routing
Chen et al. An entropy-based fuzzy controllers QoS routing algorithm in MANET
CN113556287B (zh) 一种基于多智能体强化学习的软件定义网络路由方法
Sun et al. Novel dynamic ant genetic algorithm for QoS routing in wireless mesh networks
Li et al. On QOS anycast routing algorithm based on particle swarm optimization
Sonkar et al. Harmony search algorithm based buffer management in Delay Tolerant Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant