CN116132353A - 基于ddqn的tsn路由选择方法 - Google Patents

基于ddqn的tsn路由选择方法 Download PDF

Info

Publication number
CN116132353A
CN116132353A CN202211694211.0A CN202211694211A CN116132353A CN 116132353 A CN116132353 A CN 116132353A CN 202211694211 A CN202211694211 A CN 202211694211A CN 116132353 A CN116132353 A CN 116132353A
Authority
CN
China
Prior art keywords
network
routing
topology
tsn
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211694211.0A
Other languages
English (en)
Inventor
杨柳
李新月
鲁银芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202211694211.0A priority Critical patent/CN116132353A/zh
Publication of CN116132353A publication Critical patent/CN116132353A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/04Interdomain routing, e.g. hierarchical routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/121Shortest path evaluation by minimising delays

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种基于Dueling Deep Q Network(DDQN)的时间敏感网(TSN)路由选择方法,所述方法包括:基于多控制器软件定义网络(SDN),根据工业现场将路由划分为多个区域,构建TSN网络的系统模型;构建路由选择问题的马尔可夫决策模型;获取拓扑和流信息,搜索可达路径生成候选路径表;为业务流初始化路由路径形成初始网络;以平均最小端到端时延为优化目标、流的时延要求为约束,利用DDQN算法对初始网络进行优化训练;当拓扑或业务流信息改变时,重新对模型进行训练;控制器为业务流分配路由路径并下发至转发平面。这是一种被数据驱动的集中式多控制器路由方法,可部署于工业TSN网络中,能够适应动态变化的业务和跨车间信号传输需求,并确保业务传输服务质量。

Description

基于DDQN的TSN路由选择方法
技术领域
本发明涉及TSN通信技术领域,具体是一种基于DDQN的TSN路由选择方法。
背景技术
工业制造领域中柔性制造的模式普遍存在,该模式是以消费者为导向的,以需定产的方式和传统大规模量产的模式相对立,在柔性制造中,考验的是生产线和供应链的反应速度,且现场设备普遍存在于不同车间或区域,需要同时具备各业务单元互联和现场与云端数据互通的能力,而该场景下实时的设备互联和数据互通需求满足度不高。现需要将TSN网络部署于控制器与现场设备之间和控制器与控制器之间,实现控制信号的高质量确定性时延传输和协同信号的高精度同步传输,同时需合适的TSN路由算法来提高系统适应外部变化(如生产需求变化导致业务流变化)和内部变化(如设备故障)的能力。目前,工业制造领域大多路由选择方案均为传统的刚性自动化生产线定制,假设业务流信息是固定的,且未对该领域现场设备存在于不同车间的典型网络提出针对性路由方案,因而无法为业务流提供最佳路由路径,网络针对性和时延确定性低,无法保证其传输服务质量,需要一种具有网络针对性和时延确定性的自适应智能路由选择方法。
发明内容
为解决将TSN部署到工业制造领域时数据互通需求满足度低和现有路由技术存在的缺陷,提出一种对服务质量敏感的自适应智能路由选择方法,以最小化平均端到端时延为优化目标,保证柔性工业制造领域动态变化的业务流的传输服务质量,其步骤如下:
步骤1:构建基于SDN的多控制器协作TSN网络模型,将转发平面的路由根据车间情况划分为以车间为单位的多个区域,以路由器端口为节点构建转发平面网络拓扑的数学模型,跳转至步骤2;
步骤2:构建TSN网络中路由选择问题的马尔可夫决策模型,确定状态空间、动作空间和奖励函数,跳转至步骤3;
步骤3:获取业务流信息,搜索所有流的可达路径放入候选路径表中备用,跳转至步骤4;
步骤4:基于转发平面网络拓扑的数学模型,根据候选路径表,利用现有TSN路由算法为业务流初始化路由路径形成初始化网络,跳转至步骤5;
步骤5:所述控制器作为智能体,基于转发平面网络拓扑的数学模型和马尔可夫决策模型,以最小化平均端到端时延为优化目标,以各业务流时延要求为约束,利用DDQN算法对初始网络进行优化训练,得到各业务流的最佳路由选择策略,跳转至步骤6;
步骤6:控制器根据最佳路由选择策略为各业务流分配路由路径,并下发至转发平面,跳转步骤7;
步骤7:判断拓扑或业务流信息是否改变,若是则跳转至步骤8,反之则跳转至步骤10;
步骤8:判断是否拓扑改变或业务流增加,若是则跳转至步骤3,反之则跳转至步骤9;
步骤9:更新网络资源占用信息,跳转至步骤5;
步骤10:路由策略保持不变。
进一步的,所述步骤1包括如下具体步骤:
步骤1-1:所述基于SDN的多控制器协作TSN网络模型包括控制平面的多个控制器、转发平面的路由拓扑和应用平面,所述控制器分为一个集中控制器和多个子控制器,可获取所述路由拓扑信息,其中,每个子控制器对应一个车间,集中控制器与所有子控制器相连,可掌控全局信息;
步骤1-2:所述车间情况是指现场设备存在于不同车间,依据其特点对转发平面的路由进行区域划分,将一个车间划分为一个区域;
步骤1-3:所述转发平面网络拓扑的数学模型为基于区域划分的有序二元组(V,E),记为图G=(V,E),其中,V={v1,v2,...,vn}定义路由器端口的集合,E={e1,e2,...,em}定义路由器端口与端口之间的链路集合,链路是双向的,点集V中各点之间的距离用距离矩阵
Figure BDA0004022735740000021
Figure BDA0004022735740000022
表示,其中wij表示节点i和节点j之间的距离,其中,
Figure BDA0004022735740000023
Figure BDA0004022735740000024
进一步的,所述步骤2包括如下具体步骤:
步骤2-1:所述TSN网络为转发平面网络拓扑,其已进行过区域划分和数学模型构建;
步骤2-2:所述马尔可夫决策过程在每个离散的时间步长t处,智能体观察环境的状态st,并根据其策略执行一个动作,然后收到一个及时奖励,环境进入下一个状态st+1,转换过程定义为四元组<st,at,rt,st+1> (3);
步骤2-3:所述四元组中st∈S表示环境在t处的状态,该状态包括网络拓扑信息、路由器端口占用情况和当前训练的业务流信息;
步骤2-4:所述四元组中at∈A是智能体t处的动作,包括当前训练的数据包转发的路径,即它决定将数据包转发的路由路径;
步骤2-5:所述四元组中rt∈R是智能体模拟通过该路由路径发数据包收到的奖励,其定义为rt=-(pt+qt)(4),其中,pt表示该数据包执行动作at后的估计排队延迟,qt表示该路由路径的传播时延;
步骤2-6:所述四元组中st+1∈S表示在状态st执行动作at后的下一状态。
进一步的,所述步骤3包括如下具体步骤:
步骤3-1:所述业务流信息包括流周期Tk、数据包大小Mk、截止时间Dk、优先级PRk起始点PSk和终点PEk,其中下标k为流标志,表示业务流fk∈F的流信息;
步骤3-2:所述可达路径指搜索从起始点到终点的所有可达链路,并将其放入所述候选路径表中备用,其中,每个业务流均有一个对应的候选路径表;
步骤3-3:所述获取拓扑和业务流信息,需要检验拓扑是否变化,若拓扑发生变化,则重新搜索所有业务流的可达路径并生成对应的候选路径表,若拓扑未发生变化,则仅生成新增业务流的候选路径表,其他业务流仍沿用原有候选路径表。
进一步的,所述步骤4包括如下具体步骤:
步骤4-1:获取业务流信息,对所述业务流进行超周期计算,其中,所述超周期指网络中所有业务流周期的最小公倍数,定义为Tsup=LCM(T1,T2,...,T3) (5);
步骤4-2:在当前网络环境st下,利用现有TSN路由算法依次对业务流分配初始路由路径,每分配好一条流的路径便依据其路由及调度方式更新模拟网络的资源占用信息,直到为所有业务流分配得到初始路径;
进一步的,所述步骤5包括如下具体步骤:
步骤5-1:对网络中的所有业务流按照优先级降序排列,得到待训练流的顺序表;
步骤5-2:按照所述顺序表,对表内业务流依次进行优化训练得到优化路由路径,其中,优化训练当前流之前,先去除其初始路由策略对网络资源的占用,更新网络资源占用信息,其中,所述当前流指某正在训练的业务流;
步骤5-3:对所述当前流进行优化训练时,首先判断其起始点和终点是否属于同一区域,若属于同一区域,则将其初始化路由路径作为优化后路由路径;若属于不同区域,则在同一区域内使用子控制器计算路由路径,跨区域传输时集中控制器协调子控制器利用DDQN算法为当前流计算优化路由路径;
步骤5-4:所述DDQN算法,指以最小化端到端时延为目标、以流的时延要求和训练时间不小于超周期为约束,利用DDQN算法计算最优路径,在DDQN中,Q网络被建模为:Qη,α,β(s,a)=Vη,α(s)+An,β(s,a)(6),其中,Vη,α(s)为状态价值函数,Aη,β(s,a)为该状态下采取不同动作的优势函数,η是状态价值函数和优势价值函数共享的网络参数,α和β分别为状态价值函数和优势价值函数的参数;
步骤5-5:所述优化训练的停止条件是,网络中所有业务流的平均端到端时延趋于稳定,即达到最小值。
附图说明
图1为本发明实施例TSN网络路由选择算法流程图;
图2为本发明实施例多控制器SDN架构的控制平面和转发平面模型;
图3为本发明实施例以路由为节点的网络拓扑转化为以端口为节点的网络拓扑示意图(实线表示路由间端口可达,虚线表示路由内部端口可达);
图4为本发明实施例基于DDQN算法的马尔可夫决策模型示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的原件或者物件涵盖出现在该词后面列举的原件或者物件及其等同,而不排除其他原件或者物件。
如背景技术部分所述,相关技术中大多路由选择方案均假设业务流信息是固定的,且未对柔性工业制造领域的典型网络提出针对性路由方案。申请人在实现本申请的过程中发现相关技术中的技术方案存在以下问题:无法为动态变化的业务流提供最佳路由路径,网络针对性和时延确定性低,无法保证业务流传输服务质量。
鉴于此,本申请提供了一种基于DDQN的TSN路由选择方法,利用DDQN对工业制造领域TSN网络的业务流进行路由选择,能够为动态变化的业务流提供最佳路由路径,网络针对性和时延确定性高,可保证其传输服务质量。
以下,通过具体的实施例来详细说明本申请的技术方案。
参考图1,本申请一个实施例提供一种基于DDQN的TSN路由选择方法,具体包括以下步骤:
步骤1:构建基于SDN的多控制器协作TSN网络模型,根据车间情况将转发平面的路由划分为多个区域,以路由器端口为节点构建转发平面网络拓扑的数学模型,跳转至步骤2;
步骤2:构建TSN网络中路由选择问题的马尔可夫决策模型,确定状态空间、动作空间和奖励函数,跳转至步骤3;
步骤3:获取业务流信息,搜索所有可达路径放入候选路径表中备用,跳转至步骤4;
步骤4:所述控制器作为智能体,基于转发平面网络拓扑的数学模型和马尔可夫决策模型,以最小化端到端时延为优化目标,以业务流时延要求为约束,利用DDQN算法为业务流初始化路由路径形成初始化网络,跳转至步骤5;
步骤5:所述控制器作为智能体,基于转发平面网络拓扑的数学模型和马尔可夫决策模型,以最小化平均端到端时延为优化目标,以各业务流时延要求为约束,利用DDQN算法对初始网络进行优化训练,得到各业务流的最佳路由选择策略,跳转至步骤6;
步骤6:控制器根据最佳路由选择策略为各业务流分配路由路径,并下发至转发平面,跳转步骤7;
步骤7:判断拓扑或业务流信息是否改变,若是则跳转至步骤8,反之则跳转至步骤10;
步骤8:判断是否拓扑改变或业务流增加,若是则跳转至步骤3,反之则跳转至步骤9;
步骤9:更新网络资源占用信息,跳转至步骤5;
步骤10:路由策略保持不变。
进一步的,所述步骤1包括如下具体步骤:
步骤1-1:所述基于SDN的多控制器协作TSN网络模型包括转发平面、控制平面和应用平面,其中,控制平面包括一个集中控制器和多个子控制器,转发平面包括路由拓扑,结合图2,每个子控制器对应一个区域,集中控制器与所有子控制器相连,可掌握全局信息,所述控制器获取所述路由拓扑信息;
步骤1-2:所述车间情况是指现场设备存在于不同车间,依据其特点对转发平面的路由进行区域划分,结合图2,同一车间划分为一个区域;
步骤1-3:所述转发平面网络拓扑的数学模型为基于区域划分的有序二元组(V,E),记为图G=(V,E),结合图3,V={v1,v2,...,vn}定义路由器端口的集合,E={e1,e2,...,em}定义路由器端口与端口之间的链路集合,链路是双向的,点集V中各点之间的距离用距离矩阵
Figure BDA0004022735740000061
表示,其中wij表示节点i和节点j之间的距离,其中,
Figure BDA0004022735740000062
Figure BDA0004022735740000063
进一步的,所述步骤2包括如下具体步骤:
步骤2-1:所述TSN网络为转发平面网络拓扑,其已进行过区域划分和数学模型构建;
步骤2-2:结合图4,所述马尔可夫决策过程在每个离散的时间步长t处,智能体观察环境的状态st,并根据其策略执行一个动作at,然后收到一个及时奖励rt,环境进入下一个状态st+1
步骤2-3:所述st表示环境在t处的状态,该状态包括网络拓扑信息、路由器端口占用情况和当前训练的业务流信息;
步骤2-4:所述at是智能体t处的动作,包括当前训练的数据包转发路径决策,即它决定数据包转发的路由路径;
步骤2-5:所述rt是智能体模拟通过该路由路径发数据包后收到的奖励,其值为执行该动作后该路由路径的时延的相反数,其中,总时延为排队时延和传播时延总和;
步骤2-6:所述St+1表示在状态st执行动作at后的下一状态。
进一步的,所述步骤3包括如下具体步骤:
步骤3-1:所述业务流信息包括流周期、数据包大小、截止时间、优先级起始点和终点;
步骤3-2:所述可达路径指利用现有技术(例如深度优先搜索算法)搜索从起始点到终点的所有可达链路,并将其放入所述候选路径表中备用,其中,每个业务流均有一个对应的候选路径表;
步骤3-3:所述获取拓扑和业务流信息,需要检验拓扑是否发生变化,若拓扑发生变化,则重新搜索所有业务流的可达路径并生成对应的候选路径表,若拓扑未发生变化,则仅生成新增业务流的候选路径表,其他业务流仍沿用原有候选路径表。
进一步的,所述步骤4包括如下具体步骤:
步骤4-1:获取业务流信息,对所述业务流进行超周期计算,其中,所述超周期指网络中所有业务流周期的最小公倍数;
步骤4-2:在当前网络环境st下,以流的端到端时延为约束,利用现有TSN路由算法依次对业务流分配路由路径,每分配好一条流的路径便依据其路由及调度方式更新模拟网络的资源占用信息,直到为所有业务流分配得到初始路径,其中,调度策略可以是现有技术中任意业务流调度算法,如先来先服务算法(FCFS)、短作业优先算法(SJF)、高响应比优先算法、优先级调度算法等;
步骤4-3:网络初始化的停止条件是所有流得到初始化路由路径。
进一步的,所述步骤5包括如下具体步骤:
步骤5-1:对网络中的所有业务流按照优先级降序排列,得到待训练流的顺序表;
步骤5-2:按照所述顺序表,对表内业务流进行循环优化训练输出最优动作,即得到优化路由路径,其中,优化训练当前流之前,先去除其初始路由策略对网络资源的占用,更新当前网络环境st,即更新网络资源占用信息,其中,所述当前流指某正在训练的业务流,所述循环优化训练是指,若训练完顺序表中最后一条流时并未达到优化训练的停止条件,则从第一条流开始继续训练;
步骤5-3:对所述当前流进行优化训练时,首先判断其起始点和终点是否属于同一区域,若属于同一区域,则将其初始化路由路径作为优化后路由路径;若属于不同区域,则在同一区域内该区域对应的子控制器利用DDQN算法计算路由路径,跨区域传输时集中控制器协调子控制器使用DDQN算法初始化路由路径;
步骤5-4:所述DDQN算法指以最小化端到端时延为目标、以流的时延要求和训练时间不小于超周期为约束,利用DDQN算法计算最优路径,结合图4,在DDQN中,Q网络被建模为:Qη,α,β(s,a)=Vη,α(s)+Aη,β(s,a)(6),其中,Vη,α(s)为状态价值函数,Aη,β(s,a)为该状态下采取不同动作的优势函数,η是状态价值函数和优势价值函数共享的网络参数,α和β分别为状态价值函数和优势价值函数的参数;
步骤5-5:所述优化训练的停止条件是,网络中所有业务流的平均端到端时延趋于稳定,即达到最小值。

Claims (12)

1.基于DDQN的TSN路由选择方法,其特征在于,包括以下步骤:
构建基于SDN的多控制器协作TSN网络模型,将转发平面的路由根据车间情况划分为以车间为单位的多个区域,以路由器端口为节点构建转发平面网络拓扑的数学模型;
构建TSN网络中路由选择问题的马尔可夫决策模型,确定状态空间、动作空间和奖励函数;
获取业务流信息,搜索所有流的可达路径放入候选路径表中备用;
基于转发平面网络拓扑的数学模型,根据候选路径表,利用现有TSN路由算法为业务流初始化路由路径形成初始化网络;
所述控制器作为智能体,基于转发平面网络拓扑的数学模型和马尔可夫决策模型,以最小化平均端到端时延为优化目标,以各业务流时延要求为约束,利用DDQN算法对初始网络进行优化训练,得到各业务流的最佳路由选择策略;
控制器根据最佳路由选择策略为各业务流分配路由路径,并下发至转发平面;
若拓扑或业务流信息发生改变,则更新网络资源占用信息并重新优化训练。
2.根据权利要求1所述的基于SDN的多控制器协作TSN网络模型,其特征在于,包括控制平面的多个控制器、转发平面的路由拓扑和应用平面,所述控制器分为一个集中控制器和多个子控制器,可获取所述路由拓扑信息,其中,每个子控制器对应一个车间,集中控制器与所有子控制器相连,可掌控全局信息。
3.根据权利要求1所述的车间情况,其特征在于,是指现场设备存在于不同车间,依据其特点对转发平面的路由进行区域划分,将一个车间划分为一个区域。
4.根据权利要求1所述转发平面网络拓扑,其特征在于,数学模型为基于区域划分的有序二元组(V,E),记为图G=(V,E),其中,V={v1,v2,...,vn}定义路由器端口的集合,E={e1,e2,...,em}定义路由器端口与端口之间的链路集合,链路是双向的,点集V中各点之间的距离用距离矩阵
Figure FDA0004022735730000011
表示,其中wij表示节点i和节点j之间的距离,其中,
Figure FDA0004022735730000012
5.根据权利要求1所述马尔可夫决策过程,其特征在于,在每个离散的时间步长t处,智能体观察环境的状态st,并根据其策略执行一个动作,然后收到一个及时奖励,环境进入下一个状态st+1,转换过程定义为四元组<st,at,rt,st+1>(3),所述四元组中st∈S表示环境在t处的状态,该状态包括网络拓扑信息、路由器端口占用情况和当前训练的业务流信息,所述四元组中at∈A是智能体t处的动作,包括当前训练的数据包转发的路径,即它决定将数据包转发的路由路径,所述四元组中rt∈R是智能体模拟通过该路由路径发数据包收到的奖励,其定义为rt=-(pt+qt)(4),其中,pt表示该数据包执行动作at后的估计排队延迟,qt表示该路由路径的传播时延,所述四元组中st+1∈S表示在状态st执行动作at后的下一状态。
6.根据权利要求1所述业务流信息,其特征在于,包括流周期Tk、数据包大小Mk、截止时间Dk、优先级PRk起始点PSk和终点PEk,其中下标k为流标志,表示业务流fk∈F的流信息。
7.根据权利要求1所述可达路径,其特征在于搜索从起始点到终点的所有可达链路,并将其放入所述候选路径表中备用,其中,每个业务流均有一个对应的候选路径表。
8.根据权利要求1所述获取拓扑和业务流信息,其特征在于,需要检验拓扑是否变化,若拓扑发生变化,则重新搜索所有业务流的可达路径并生成对应的候选路径表,若拓扑未发生变化,则仅生成新增业务流的候选路径表,其他业务流仍沿用原有候选路径表。
9.根据权利要求1所述利用现有TSN路由算法为业务流初始化路由路径形成初始化网络,其特征在于,当前网络环境st下,利用现有TSN路由算法依次对业务流分配初始路由路径,每分配好一条流的路径便依据其路由及调度方式更新模拟网络的资源占用信息,直到为所有业务流分配得到初始路径。
10.根据权利要求1所述利用DDQN算法对初始网络进行优化训练,其特征在于,首先对网络中的所有业务流按照优先级降序排列,得到待训练流的顺序表,其次按照所述顺序表,对表内业务流依次进行优化训练得到优化路由路径,其中,优化训练当前流之前,先去除其初始路由策略对网络资源的占用,更新网络资源占用信息,其中,所述当前流指某正在训练的业务流,最后对所述当前流进行优化训练时,首先判断其起始点和终点是否属于同一区域,若属于同一区域,则将其初始化路由路径作为优化后路由路径;若属于不同区域,则在同一区域内使用子控制器计算路由路径,跨区域传输时集中控制器协调子控制器利用DDQN算法为当前流计算优化路由路径。
11.根据权利要求1所述DDQN算法,其特征在于,以最小化端到端时延为目标、以流的时延要求和训练时间不小于超周期为约束,利用DDQN算法计算最优路径,在DDQN中,Q网络被建模为:Qη,α,β(s,a)=Vη,α(s)+Aη,β(s,a)(6),其中,Vη,α(s)为状态价值函数,Aη,β(s,a)为该状态下采取不同动作的优势函数,η是状态价值函数和优势价值函数共享的网络参数,α和β分别为状态价值函数和优势价值函数的参数。
12.根据权利要求1所述优化训练,其特征在于,停止条件是,网络中所有业务流的平均端到端时延趋于稳定,即达到最小值。
CN202211694211.0A 2022-12-28 2022-12-28 基于ddqn的tsn路由选择方法 Pending CN116132353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211694211.0A CN116132353A (zh) 2022-12-28 2022-12-28 基于ddqn的tsn路由选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211694211.0A CN116132353A (zh) 2022-12-28 2022-12-28 基于ddqn的tsn路由选择方法

Publications (1)

Publication Number Publication Date
CN116132353A true CN116132353A (zh) 2023-05-16

Family

ID=86303871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211694211.0A Pending CN116132353A (zh) 2022-12-28 2022-12-28 基于ddqn的tsn路由选择方法

Country Status (1)

Country Link
CN (1) CN116132353A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117097624A (zh) * 2023-10-18 2023-11-21 浪潮(北京)电子信息产业有限公司 一种网络拓扑结构增强方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109768940A (zh) * 2018-12-12 2019-05-17 北京邮电大学 多业务sdn网络的流量分配方法及装置
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法
CN111191918A (zh) * 2019-12-27 2020-05-22 国网江苏省电力有限公司信息通信分公司 一种智能电网通信网的业务路由规划方法及装置
US20200174471A1 (en) * 2018-11-30 2020-06-04 Denso International America, Inc. Multi-Level Collaborative Control System With Dual Neural Network Planning For Autonomous Vehicle Control In A Noisy Environment
CN113098714A (zh) * 2021-03-29 2021-07-09 南京邮电大学 一种基于深度强化学习的低时延网络切片的方法
CN114025330A (zh) * 2022-01-07 2022-02-08 北京航空航天大学 一种空地协同的自组织网络数据传输方法
CN114286413A (zh) * 2021-11-02 2022-04-05 北京邮电大学 Tsn网络联合路由选择与流分配方法及相关设备
KR20220095693A (ko) * 2020-12-30 2022-07-07 이화여자대학교 산학협력단 강화학습에 기반한 gop 선택 방법 및 분석장치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200174471A1 (en) * 2018-11-30 2020-06-04 Denso International America, Inc. Multi-Level Collaborative Control System With Dual Neural Network Planning For Autonomous Vehicle Control In A Noisy Environment
CN109768940A (zh) * 2018-12-12 2019-05-17 北京邮电大学 多业务sdn网络的流量分配方法及装置
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法
CN111191918A (zh) * 2019-12-27 2020-05-22 国网江苏省电力有限公司信息通信分公司 一种智能电网通信网的业务路由规划方法及装置
KR20220095693A (ko) * 2020-12-30 2022-07-07 이화여자대학교 산학협력단 강화학습에 기반한 gop 선택 방법 및 분석장치
CN113098714A (zh) * 2021-03-29 2021-07-09 南京邮电大学 一种基于深度强化学习的低时延网络切片的方法
CN114286413A (zh) * 2021-11-02 2022-04-05 北京邮电大学 Tsn网络联合路由选择与流分配方法及相关设备
CN114025330A (zh) * 2022-01-07 2022-02-08 北京航空航天大学 一种空地协同的自组织网络数据传输方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曾洪哲;: "面向异构网络的并行传输乱序分析", 信息技术, no. 06, 25 June 2018 (2018-06-25) *
杜文峰;吴真;赖力潜;: "传输延迟感知的多路径并发差异化路径数据分配算法", 通信学报, no. 04, 15 April 2013 (2013-04-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117097624A (zh) * 2023-10-18 2023-11-21 浪潮(北京)电子信息产业有限公司 一种网络拓扑结构增强方法、装置、电子设备及存储介质
CN117097624B (zh) * 2023-10-18 2024-02-09 浪潮(北京)电子信息产业有限公司 一种网络拓扑结构增强方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109818865B (zh) 一种sdn增强路径装箱装置及方法
CN111010294B (zh) 一种基于深度强化学习的电力通信网路由方法
CN108566659B (zh) 一种基于可靠性的5g网络切片在线映射方法
CN112437020B (zh) 一种基于深度强化学习的数据中心网络负载均衡方法
US11057294B2 (en) Route control method and route setting device
US10306664B2 (en) Deterministic scheduling method oriented to industrial wireless WIA-PA network
CN111988225A (zh) 基于强化学习和迁移学习的多路径路由方法
CN101013955B (zh) 用于业务量矩阵估计的快速模拟退火
CN114827021B (zh) 一种基于sdn和机器学习的多媒体业务流量加速系统
CN110198280A (zh) 一种基于bp神经网络的sdn链路分配方法
CN115941579B (zh) 一种基于深度强化学习的混合路由方法
CN116132353A (zh) 基于ddqn的tsn路由选择方法
CN107483355B (zh) 面向数据中心的在线场景低带宽开销流量调度方案
CN101651600B (zh) 网格网络中更新链路代价的方法和装置
CN114760669A (zh) 一种基于流量预测的路由决策方法及系统
CN114024907A (zh) 一种多口字环形结构下的流量调度方法和系统
CN113676979A (zh) 基于分支定界法的端到端路由中继链路选取方法、系统及装置
CN104901892A (zh) 一种基于蚁群算法的QoS组播路由优化器及其实现方法
CN114205300B (zh) 一种能够在流量信息不完整情况下保证coflow传输截止期限的流量调度方法
CN112633563B (zh) 一种流量工程在线联合优化方法
Zhang et al. Dynamic VNF scheduling: A deep reinforcement learning approach
CN105959141B (zh) 一种虚拟网络拓扑构建方法及装置
CN115336235A (zh) 在用于工厂自动化的公共网络中提供多站点编制的方法、编制器、以及通信系统
CN106209686A (zh) 一种光突发环网动态带宽分配方法及装置
CN113778620B (zh) 基于多sdn控制器与软硬件协同的大规模集群存储系统架构

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination