CN114710410B - 基于深度强化学习的网络数据采集效率优化方法及系统 - Google Patents
基于深度强化学习的网络数据采集效率优化方法及系统 Download PDFInfo
- Publication number
- CN114710410B CN114710410B CN202210634436.0A CN202210634436A CN114710410B CN 114710410 B CN114710410 B CN 114710410B CN 202210634436 A CN202210634436 A CN 202210634436A CN 114710410 B CN114710410 B CN 114710410B
- Authority
- CN
- China
- Prior art keywords
- information
- characteristic
- feature
- state
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/083—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for increasing network speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/0833—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for reduction of network energy consumption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mobile Radio Communication Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于深度强化学习的网络数据采集效率优化方法及系统,优化方法包括:通过分析网络特征状态数据信息,建立动态多服务台队列模型和异质特征数据信息年龄模型;定义优化前后不同特征数据的信息年龄、服务器接收队列长度以及路由效果为损失函数,建立问题约束模型,通过深度强化学习求解不同特征数据更新频率间隔,改善不同特征状态数据的更新频率对路由性能的影响。网络终端采集特征状态数据并送达控制器的过程满足负指数分布,能够计算服务器接收不同类型特征数据的最佳更新频率,结果表明该优化方法能够有效提升系统时效性和路由选取有效性;能够有效应对车际移动自组网信息时效性差、队列资源受限等问题。
Description
技术领域
本发明涉及网络数据采集领域,具体涉及一种基于深度强化学习的网络数据采集效率优化方法及系统。
背景技术
车联网的应用场景常伴随着高机动性,复杂地理环境和电磁环境,造成车际移动自组网链路频繁切换,且资源受限。车辆通常搭载多类不同频段电台,在进行全局路由规划时,需实时采集各节点通信设备的工作和故障状态数据,以保证路由规划的合理性和有效性。
为了在数据采集过程中衡量信息的时效性,专家学者提出了信息年龄(AoI, Ageof Information)这一概念。信息年龄是服务器收到传感器发送信息经过的时间间隔。若间隔过大,则证明信息处于过期状态;若间隔过小,则单位时间内信息更新频率过高,易造成处理节点拥塞。为寻找合理的信息更新间隔,专家学者对此进行了大量研究。AlirezaJavani推导了任意数量信息源的AoI表达式,研究了单个源情况下每个服务器的最佳到达率。Yao Zhao解决了在主要用户的平均AoI约束下,通过可约束马尔科夫过程开发新的最优状态更新和数据包中继方案,来最小化平均AoI和能耗的问题。Xi Zhang在多媒体无线网络中验证和评价了基于AoI的统计延迟有界QoS配置方案,提高多媒体无线网络中平稳遍历优先服务M/M/1信道的去有界QoS性能。Melih Bastopcu在最小信息质量更新需求的限制下,通过求解所期望的信息失真水平,来确定接收机更新请求时间和发射机更新处理时间的信息年龄最优策略。Alkan Soysal推导了G/G/1/1系统的信息年龄模型,并利用该模型证明了到达率和服务率的关系,给出了信息年龄上界。Cheng Hu分别从信息年龄和数据率两方面调查了系统的及时性和效率,给出了最优功率分割比和最优加权系数。Yunquan Dong研究了决策时刻的年龄(AuD)来描述在决策时刻接收到信息更新的新鲜度。Vishrant Tripathi基于移动代理随机移动轨迹的最小化信息的峰值和平均信息年龄,作为衡量信息及时性的指标。
学者们的研究对各种情况下的最优信息年龄进行了讨论,能够有效的建立信息时效性模型,但是车际移动自组网呈现出高度动态性的网络状态和稀缺的网络资源需要其具备动态变化的信息感知模型。传统信息年龄模型只对传感器定时发送的网络状态信息进行描述,大多只计算峰值信息年龄和平均信息年龄,尚未能根据特征数据类型不同动态调整信息采集间隔。现有采集技术对感知网络特征状态信息的感知较少,难以根据不同传输需求配置网络资源,尚未有学者研究多特征状态类型对路由规划的影响,并建立信息年龄模型。
发明内容
本发明的目的在于提出一种基于深度强化学习的网络数据采集效率优化方法及系统,用于提升信息采集效率,提升系统时效性,降低网络丢包率。
实现本发明目的的技术解决方案为:第一方面,本发明提供一种基于深度强化学习的网络数据采集效率优化方法,包括:
将采集到的信息与路由规划影响特征参数进行对比,选择对路由规划影响权重更高的特征状态数据集;
建立动态多服务台队列模型,结合队列模型构建异质特征数据信息年龄模型;
通过深度强化学习求解不同特征数据更新频率间隔,定义优化前后各特征数据的信息年龄、服务器接收队列长度以及路由效果为损失函数,建立问题约束模型。
第二方面,本发明提供一种基于深度强化学习的网络数据采集效率优化系统,包括:
特征数据分析模块,用于将采集到的信息与路由规划影响特征参数进行对比,选择对路由规划影响权重更高的特征状态数据集;
处理队列与信息年龄构建模块,用于建立动态多服务台队列模型,结合队列模型构建异质特征数据信息年龄模型;
深度学习求解模块,通过深度强化学习求解不同特征数据更新频率间隔,定义优化前后各特征数据的信息年龄、服务器接收队列长度以及路由效果为损失函数,建立问题约束模型。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的基于深度强化学习的网络数据采集效率优化方法。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于深度强化学习的网络数据采集效率优化方法。
与现有技术相比,本发明的有益效果为:
(1)采用的深度强化学习模型,能够根据系统性能动态调整,找到最优网络信息年龄,所以能够提升系统时效性;
(2)采用的深度强化学习模型,能够在队列长度与信息年龄之间找到动态平衡点,所以能够优化队列负载,降低系统丢包率;
(3)因为采用信息熵预处理状态特征集,能够快速选择高权重特征优化,所以能够提升算法收敛速度。
附图说明
图1是状态更新频率示意图。
图2是特征数据的单链路信息年龄示意图。
图3是深度强化学习过程示意图。
图4是多算法平均信息年龄对比图。
图5是多算法平均队列长度对比图。
图6是多算法平均丢包率对比图。
图7是多算法收敛速度对比图。
具体实施方式
车际移动自组网结构复杂,网络拓扑动态变化,如何实时检测网络状态是优化远程控制的工作重点,为了保证来自传感器的信息尽可能新鲜,本发明提出一种基于深度强化学习的网络数据采集效率优化方法,将对车载移动自组网中影响路由规划的异质特征信息进行分析,建立服务器端多处理队列模型,对信息年龄进行建模并优化。
A.特征状态数据分析
车载移动自组网中产生、承载的网络业务种类繁多,不同类型业务的特征表现差异性较大,特征状态携带的信息对路由规划的影响权重不同,传感器将按照不同频率定期向服务器发送特征状态数据包。为了提高单位长度内传感器向服务器发送数据的重要度,本发明将网络连接状态、电台频率、工作模式、带宽、端到端时延等特征信息记为特征状态集,其中表示第个特征,保留与路由规划影响因子相关性较大的特征,删除相关性较小的特征,能够降低算法时间复杂度。
计算每个特征与之间的相关性,记为,用于判断一个特征是否与类别相关。通过序列浮动前向选择算法在大量候选特征中利用阈值进行初步筛选,获取与目标类别相关的特征子集,满足。将中各特征按照值的大小进行降序排列,根据的排序结果定义特征信息状态更新频率。然后取互信息集F与特征子集的交集,满足,剔除冗余特征后,使描述的相关度达到最优并按相关性从大到小排列。
B.系统队列模型
设网络中独立终端被记,终端将不断收集网络信息,定期将这些信息发送至服务器,服务器收到信息后对路由组网过程进行全局规划。不同类型的数据对路由决策的影响程度不同,在给定路由影响因子后,计算与的互信息集与对称不确定性,得到按影响路由规划权重从大到小排列的特征数据集。
现有车联网服务器具备一定的并行计算能力,假设服务器的队列单元,满足M/M/h/R多处理队列混合制模型,从独立终端发送的特征状态信息xi的到达率服从参数为的负指数分布,节点关于所有状态特征信息更新的到达率为。处理队列数量为,的处理队列服务率服从参数为的负指数分布,系统的剩余队列资源容量为。当未被完全占用且暂时无法提供服务时,特征状态信息将进入队列等待;当被完全占用后,系统将发生丢包。
其中
C.信息年龄
信息年龄是衡量系统时效性的重要指标,具体表现为不同特征信息的更新频率,相当于在服务器节点采集终端节点的状态信息。而在现有车载移动自组网中限制信息年龄的条件有两点,一是服务器端计算效率,计算效率低可直接体现在队列长度,当终端节点的信息更新频率趋近于0时,相当于泛洪信息攻击,服务器队列长度始终保持大于,系统会发生严重丢包,破坏网络连通性。二是终端节点发送速率,若将发送状态信息更新的间隔定义为一天,则实时性同样无法保障。
如图2所示,给定特征信息的信息年龄过程并假设其遍历性,可以通过收敛至其相应随机的样本均值来建立平均信息年龄模型。状态更新的平均年龄是图中阴影部分按时间间隔归一化的面积,在时间区间[0, T]内,每个特征数据的状态更新的平均信息年龄为:
为提高数据采集效率,本发明设计深度强化学习模型对多目标进行联合优化,在第次迭代时,根据不同特征数据更新频率,计算服务器状态更新队列平均长度以及特征数据的信息年龄,优化路由后网络系统平均传输时延,丢包数,建立问题约束模型,代表算法迭代次数,计算各特征数据信息年龄对路由规划的影响,根据路由决策的结果设计奖励函数,确定收敛目标,提升不同特征类型的信息新鲜度对通信系统性能的影响。优化问题可被记为以下约束:
Subject to:
当前的特征数据更新频率将会影响信息年龄,优化信息年龄和队列长度会提升数据的时效性,在链路频繁切换、业务局部突发的车载移动自组网,高时效性会优化路由效果。
D.深度强化学习求解
深度强化学习由于其黑盒特性相较于传统方法在求解多因素耦合问题的过程中精确度更高。智能体在训练过程中通过不断地随机迭代,在执行随机动作后环境满足优化约束目标将给予智能体奖励,通过大量迭代累计回报获得多目标最优化策略。
如图3所示,本发明所提的基于深度强化学习的车际移动自组网信息采集间隔优化框架将特征数据的更新频率视为一个智能体,将网络路由结果的平均时延、丢包数,服务器队列长度视为状态E。每个训练周期中共迭代次,智能体获取初始环境状态E0,之后执行动作对的更新频率进行随机加权分配;执行动作后,智能体获得环境相应的奖励值,并继续观察下一时刻状态。
环境状态可以表示为两个部分:第一部分是服务器接收特征数据时的处理队列长度记为R(t),以及当前时刻的信息年龄。系统在接收到数据之后,系统按照现有状态将做一次路由规划,规划完成后计算系统的平均传输时延,总丢包数,当前时刻t的系统状态可表示为:
算法流程
进一步的,本发明还提供一种基于深度强化学习的网络数据采集效率优化系统,包括特征数据分析模块、处理队列与信息年龄构建模块、深度学习求解模块;
特征数据分析模块用于将采集到的信息与路由规划影响特征参数进行对比,选择对路由规划影响更大的特征状态数据集,能够使得算法收敛速度更快;
处理队列与信息年龄构建模块用于建立动态多服务台队列模型,结合队列模型构建异质特征数据信息年龄模型,能够有效描述系统时效性;
深度学习求解模块通过深度强化学习求解不同特征数据更新频率间隔,定义优化前后各特征数据的信息年龄、服务器接收队列长度以及路由效果为损失函数,建立问题约束模型,能够提升不同特征类型数据的更新频率对通信系统性能的影响。
所述特征数据分析模块能够将网络连接状态、电台频率、工作模式、带宽、端到端时延等特征状态信息记为特征状态集,其中表示第个特征,保留与路由规划影响因子相关性较大的特征,删除相关性较小的特征,能够降低算法时间复杂度。特征数据分析模块能够筛选出相关性较强的特征子集,加速与影响因子强相关特征的信息更新频率,使得对路由规划影响大的特征数据的时效性更强。
上述特征数据分析模块、处理队列与信息年龄构建模块、深度学习求解模块的具体处理过程与前述的基于深度强化学习的网络数据采集效率优化方法部分相同,本发明不再赘述。
下面结合实施例和附图对本发明进行详细说明。
实施例
系统特征数据信息的更新频率将会直接影响到数据的时效性以及网络系统的资源状态,数据时效性会进一步影响路由决策后的网络性能状态。
本发明将利用数字实验结果来验证所提算法的有效性,考虑多特征数据状态的更新频率,计算不同频率下信息年龄和队列长度的变化。基于强化学习验证不同的更新频率对系统状态环境改变的影响,并基于奖励函数,学习并优化策略动作。
本发明基于TensorFlow和 Python3.7 搭建了一个四层完全连接的神经网络,其中包括两个完全连接的隐藏层,每层分别有 128和64个神经元。考虑服务器节点数量为1个,独立车载终端为5个,通信系统特征信息数量为m,算法共迭代次,第t次系统状态环境包括服务器状态更新队列平均长度以及特征数据的信息年龄,优化路由后网络系统平均传输时延,丢包数,系统仿真参数如表1所示。
表1 系统仿真参数
图4描述了状态特征信息的更新频率在不同队列调度算法下,以通过不同的发送频率计算的峰值信息年龄。业务数据的发送速率服从泊松分布,在业务到达数不断增大的条件下,系统队列长度不断累积,使得状态更新数据得不到及时处理,导致信息年龄增大。
本发明在原有基础上提升了一定的特征状态信息到达率,可以明显看到FCFS队列的信息年龄有明显增加,有优先级处理功能的队列信息年龄还处在正常范围内,能够有效的处理状态的更新信息。
如图5所示,我们不断升高特征状态信息的到达率,系统队列长度不断增长,由于系统的处理效率基本一致,各种不同算法对队列长度的优化体现基本一致,图2的仿真结果可以证明,本发明提出的算法对队列长度的优化在包到达率为趋近极限时,相较于其他算法拥有一定优势。
如图6所示,我们固定业务数据的发送频率,尝试以不同频率更新特征数据包,仿真结果表明随着状态更新间隔的不断减小,系统的业务丢包率将会以指数形式上升。验证算法的优化性能,本发明将和传统算法进行对比,可以看出本发明对路由策略执行后系统的丢包率有一定的降低。传统FCFS等算法根据系统状态直接执行路由决策,没有考虑不同特征状态更新频率对系统时效性的影响,从而导致在特定条件下的系统部分失效。
如图7所示,本发明对比了CV-woVir、CV-woMEC和CV-woC算法在服务器数量为1,传感器数为5,特征数据类型包括电台状态信息、节点拓扑状态和端到端时延的系统中的耗费。智能体在训练过程中通过不断地随机迭代,在执行随机动作后环境满足优化约束目标将给予智能体奖励,其中横坐标为迭代次数,纵坐标为累积收益。计算耗费随着时间迭代不断增加,由于本发明根据互信息和对称不确定性提取了特征状态集,使得迭代时动作更具备目的性,迭代过程的总花费更小,系统收敛速度更快。
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
Claims (8)
1.一种基于深度强化学习的网络数据采集效率优化方法,其特征在于,包括:
将采集到的信息与路由规划影响特征集进行对比,选择对路由规划影响权重更高的特征状态数据集;将包括网络连接状态、电台频率、工作模式、带宽、端到端时延的特征状态信息记为特征状态集;计算特征状态集和路由规划影响特征集两个特征集的对称不确定性,通过对称不确定性将特征状态集按照与路由规划影响特征集的相关性从大到小排序,从而获得特征集;
建立动态多服务台队列模型,结合队列模型构建异质特征数据信息年龄模型;
通过深度强化学习求解不同特征数据更新频率间隔,定义优化前后各特征数据的信息年龄、服务器接收队列长度以及路由效果为损失函数,建立问题约束模型。
3.根据权利要求2所述的基于深度强化学习的网络数据采集效率优化方法,其特征在于,所述的建立动态多服务台队列模型,具体为:
设网络中独立终端被记为,终端将不断收集网络信息,定期将这些信息发送至服务器,服务器收到信息后对路由组网过程进行全局规划;不同类型的数据对路由决策的影响程度不同,在给定路由规划影响特征集后,计算与的互信息集与对称不确定性,得到按影响路由规划权重从大到小排列的特征数据集;
假设服务器的队列单元,满足多处理队列混合制模型,从独立终端发送的特征状态信息的到达率服从参数为的负指数分布,节点关于所有状态特征信息更新的到达率为;处理队列数量为,的处理队列服务率服从参数为的负指数分布,系统的剩余队列资源容量为;当未被完全占用且暂时无法提供服务时,特征状态信息将进入队列等待;当被完全占用后,系统将发生丢包;
其中
4.根据权利要求3所述的基于深度强化学习的网络数据采集效率优化方法,其特征在于,结合队列模型构建异质特征数据信息年龄模型,具体为:
6.根据权利要求5所述的基于深度强化学习的网络数据采集效率优化方法,其特征在于,基于深度强化学习的车际移动自组网信息采集间隔优化框架将特征数据的更新频率视为一个智能体,将网络路由结果的平均时延、丢包数,服务器队列长度视为状态E;每个训练周期中共迭代次,智能体获取初始环境状态E0,之后执行动作对的更新频率进行随机加权分配;执行动作后,智能体获得环境相应的奖励值,并继续观察下一时刻状态;
环境状态表示为两个部分:服务器接收特征数据时的处理队列长度记为R(t),以及当前时刻的信息年龄;系统在接收到数据之后,系统按照现有状态将做一次路由规划,规划完成后计算系统的平均传输时延,总丢包数,当前时刻t的系统状态可表示为:
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210634436.0A CN114710410B (zh) | 2022-06-07 | 2022-06-07 | 基于深度强化学习的网络数据采集效率优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210634436.0A CN114710410B (zh) | 2022-06-07 | 2022-06-07 | 基于深度强化学习的网络数据采集效率优化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114710410A CN114710410A (zh) | 2022-07-05 |
CN114710410B true CN114710410B (zh) | 2022-08-26 |
Family
ID=82177979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210634436.0A Active CN114710410B (zh) | 2022-06-07 | 2022-06-07 | 基于深度强化学习的网络数据采集效率优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114710410B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115361734B (zh) * | 2022-07-14 | 2024-05-14 | 鹏城实验室 | 基于信息时效性的功率和irs相移联合优化方法及装置 |
CN115589380A (zh) * | 2022-09-29 | 2023-01-10 | 中国联合网络通信集团有限公司 | 电信标识网络的实时路由方法、系统、电子设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190039A (zh) * | 2021-04-27 | 2021-07-30 | 大连理工大学 | 一种基于分层深度强化学习的无人机采集路径规划方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11461145B2 (en) * | 2019-01-28 | 2022-10-04 | EMC IP Holding Company LLC | Building neural networks for resource allocation for iterative workloads using reinforcement learning |
CN112437131B (zh) * | 2020-11-10 | 2022-09-13 | 西北农林科技大学 | 物联网中考虑数据相关性的数据动态采集与传输方法 |
CN113891276B (zh) * | 2021-10-26 | 2023-05-26 | 重庆邮电大学 | 基于信息年龄的混合更新工业无线传感器网络调度方法 |
CN114422423B (zh) * | 2021-12-24 | 2024-02-20 | 大连大学 | 一种基于sdn与ndn的卫星网络多约束路由方法 |
-
2022
- 2022-06-07 CN CN202210634436.0A patent/CN114710410B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113190039A (zh) * | 2021-04-27 | 2021-07-30 | 大连理工大学 | 一种基于分层深度强化学习的无人机采集路径规划方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114710410A (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114710410B (zh) | 基于深度强化学习的网络数据采集效率优化方法及系统 | |
CN111629380B (zh) | 面向高并发多业务工业5g网络的动态资源分配方法 | |
CN107948083B (zh) | 一种基于增强学习的sdn数据中心拥塞控制方法 | |
CN114423061B (zh) | 一种基于注意力机制和深度强化学习的无线路由优化方法 | |
CN109787699B (zh) | 一种基于混合深度模型的无线传感器网络路由链路状态预测方法 | |
Cha et al. | Fuzzy logic based client selection for federated learning in vehicular networks | |
CN114205782B (zh) | 基于云边协同的时延最优缓存和路由方法、装置及系统 | |
CN114301935B (zh) | 一种基于声誉的物联网边云协同联邦学习节点选择方法 | |
CN112888004A (zh) | 一种物联网中多源节点信息更新的信息年龄优化方法 | |
CN114374949B (zh) | 一种车联网中基于信息新鲜度优化的功率控制机制 | |
Lv et al. | Edge computing task offloading for environmental perception of autonomous vehicles in 6G networks | |
CN117014355A (zh) | 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法 | |
CN117675918A (zh) | 基于多智能体深度强化学习的边缘区域协作缓存更新方法 | |
CN110417572B (zh) | 一种基于目标节点相遇概率预测消息传递节点的方法 | |
CN116959244A (zh) | 基于区域危险度的车载网信道拥塞控制方法及系统 | |
CN116501483A (zh) | 基于多智能体强化学习的车辆边缘计算任务调度方法 | |
CN115118783A (zh) | 基于异构通信技术超可靠低时延强化学习的任务卸载方法 | |
Sande et al. | A Backhaul Adaptation Scheme for IAB Networks Using Deep Reinforcement Learning With Recursive Discrete Choice Model | |
CN115086992A (zh) | 一种分布式语义通信系统以及带宽资源分配方法及装置 | |
Wu et al. | On-demand Intelligent Routing Algorithms for the Deterministic Networks | |
Andrade-Zambrano et al. | A Reinforcement Learning Congestion Control Algorithm for Smart Grid Networks | |
CN117939505B (zh) | 一种车辆边缘网络中基于激励机制的边缘协作缓存方法及系统 | |
CN110611582A (zh) | 一种基于节点社会化的机会社会网络有效数据传输方法 | |
CN116545853B (zh) | 基于量子粒子群的一体化网络多目标优化资源管理方法 | |
CN115051999B (zh) | 基于云边协同的能耗最优任务卸载方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |