CN115442812A - 一种基于深度强化学习的物联网频谱分配优化方法及系统 - Google Patents
一种基于深度强化学习的物联网频谱分配优化方法及系统 Download PDFInfo
- Publication number
- CN115442812A CN115442812A CN202211388554.4A CN202211388554A CN115442812A CN 115442812 A CN115442812 A CN 115442812A CN 202211388554 A CN202211388554 A CN 202211388554A CN 115442812 A CN115442812 A CN 115442812A
- Authority
- CN
- China
- Prior art keywords
- communication link
- device communication
- things
- sub
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/14—Spectrum sharing arrangements between different networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/391—Modelling the propagation channel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Electromagnetism (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明属于工业物联网频谱管理技术领域,具体涉及一种基于深度强化学习的物联网频谱分配优化方法及系统。考虑到全局信道信息未知的情况下,提出一种基于多智能体深度强化学习的工业物联网频谱分配优化方法。首先,构造多个设备对设备通信链路的系统模型。其次,构建优化问题,结合频谱子带和传输功率等约束条件以优化物联网网络综合效率。接着,将优化问题描述为马尔可夫决策过程。最后,针对上述优化问题具有较大的状态空间和动作空间,提出了多智能体深度Q网络算法。借助于经验回放机制和目标网络策略,以实现最优的频谱子带选择和传输功率分配策略。
Description
技术领域
本发明属于工业物联网频谱资源管理技术领域,具体涉及一种基于深度强化学习的物联网频谱分配优化方法及系统。
背景技术
随着信息时代的快速发展,工业物联网得到了蓬勃的发展。然而,随着工业物联网中无线设备的增加,加剧了对有限频谱资源和设备通信需求之间的矛盾。为了缓解这一现象,许多研究人员都提出了优化方法来应对。但是,在实际情况中,需要获取全局信道状态信息是非常困难的且计算复杂度高,现有的优化方法难以得到最优策略。因此,提出了一种多智能体深度强化学习方法来获得与蜂窝通信链路共享频谱的最优策略,并使工业物联网网络综合效率最大化。
发明内容
为了克服现有技术的存在的不足,本发明的目的旨在提出一种基于深度强化学习的频谱分配优化方法。
为了达到上述目的,本发明采用的技术方案是:
一种基于深度强化学习的物联网频谱分配优化方法,其特征在于,包括:
构造多个设备对设备通信链路的系统模型;
基于构造的系统模型采集系统相关参数,包括蜂窝通信链路的信噪比和在频谱子带上的传输速率,也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率;
构建优化目标函数以及约束条件;
将采集的相关参数输入至优化目标函数以及约束条件,基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解,输出最优的频谱子带选择和传输功率分配策略,包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。
在上述的一种基于深度强化学习的物联网频谱分配优化方法,多个设备对设备通信链路的系统模型包括:
一个基站;
定义每个设备对设备通信链路最多只能复用一个频谱子带,即:
在上述的一种基于深度强化学习的物联网频谱分配优化方法,
其中,蜂窝通信链路在频谱子带上到基站的信道增益被表示为;将表示
为频谱子带上蜂窝通信链路的传输功率;是噪声功率,为二元频谱分配向量,表示频谱子带上设备对设备通信链路的传输功率,是设备对设备通信链路
在频谱子带上到基站的干扰信道增益;为频谱子带带宽,是蜂窝通信链路在频谱子
带上信噪比;是频谱子带上的设备对设备通信链路在频谱子带的信道功率增
益,是设备对设备通信链路在频谱子带上的接收到的干扰功率;为二元频谱分
配向量,是蜂窝通信链路到设备对设备通信链路的干扰信道增益,是设备对设
备通信链路到设备对设备通信链路的干扰信道增益。
蜂窝通信链路效率表示为:
设备对设备通信链路的效率表示为:
在上述的一种基于深度强化学习的物联网频谱分配优化方法,约束条件表示为
在上述的一种基于深度强化学习的物联网频谱分配优化方法,对目标函数进行求解时:
训练开始之前对经验重放的经验回放池初始化,并随机对多个智能体的Q网络
初始化;在每个训练回合开始时,更新工业物联网中设备的位置和大规模衰落系数,同时对
设备与设备链路之间的剩余传输负载和剩余传输时间进行重置;
其中,为动作值函数,和分别
是设备对设备通信链路在时间间隙时的状态空间和动作空间,为主网络权重;表示目标网络的输出,和分别是设备对设备通信链路在下一个环
境状态时的状态空间和动作空间,为主网络权重,为
折扣贴现率;
每个训练回合在设备对设备链路做出合理的频谱子带和传输功率分配之后结束,当训练回合数达到最大时,训练停止。
在上述的一种基于深度强化学习的物联网频谱分配优化方法,环境状态包括:,,和分别是蜂窝通信链路和设备对设备通信链路的信道状态,是设备对
设备通信链路在频谱子带上的接收到的干扰功率;此外,设备对设备链路所获得的
环境状态定义为:
一种工业物联网频谱分配优化系统,其特征在于,包括:
第一模块:被配置为用于构造多个设备对设备通信链路的系统模型;
第二模块:被配置为用于基于构造的系统模型采集系统相关参数,包括蜂窝通信链路的信噪比和在频谱子带上的传输速率,也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率;
第三模块:被配置为用于构建优化目标函数以及约束条件;
第四模块:被配置为用于将采集的相关参数输入至优化目标函数以及约束条件,基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解,输出最优的频谱子带选择和传输功率分配策略,包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。
本发明的优点如下:1. 在频谱优化方面,提升了设备对设备链路的频谱资源利用率,并与蜂窝通信链路共享频谱,对工业物联网络的频谱效率有一定的提升作用。2. 通过深度强化学习算法,优化了设备对设备链路之间的传输功率分配,提升其链路的能量效率。3. 综合考虑蜂窝通信链路、设备对设备链路的频谱效率和能量效率,设立目标函数,提高工业物联网的网络效率。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
本实例是利用多智能体深度强化学习对工业物联网的频谱资源进行分配与优化。考虑到在实际情况中,需要获取全局信道状态信息是非常困难的且计算复杂度高,现有的优化方法难以得到最优策略。于是,提出多智能体深度强化学习方法来应对这一挑战。首先,构造多个设备对设备通信链路的系统模型。其次,构建优化问题,结合频谱子带和传输功率等约束条件以优化工业物联网网络综合效率。接着,将优化问题描述为马尔可夫决策过程。最后,针对上述优化问题具有较大的状态空间和动作空间,提出了多智能体深度Q网络算法。借助于经验回放机制和目标网络策略,以实现最优的频谱子带选择和传输功率分配策略。
考虑的多个设备对设备通信链路的工业物联网网络中,其主要组成部分如下:一
个基站、个蜂窝通信链路和个设备对设备通信链路,其中,蜂窝通信链路用于获取高
数据速率的服务,设备对设备通信链路用于设备之间的双向通信。假设蜂窝通信链路的频
谱被分成个正交频谱子带,且每个频谱子带带宽为。
考虑到多个设备对设备通信链路可能有不同的频谱子带选择,二元频谱分配向量
被定义为。当设备对设备通信链路复用蜂窝通信链路的频谱子带时,;当时,设备对设备通信链路未复用蜂窝通信链路的频谱子带。假设每个设备对设备
通信链路最多只能复用一个频谱子带,即:
在构建的多个设备对设备通信链路的工业物联网网络中,结合多个设备对设备通
信链路复用频谱和设备对设备通信链路传输功率等约束条件,通过多个设备对设备通信链
路与环境交互,进行频谱子带和传输功率选择。于是,优化问题就是通过优化频谱子带选择
和设备对设备通信链路传输功率,使得工业物联网网络效率最大化,可表示为:
由于优化问题具有非凸性和组合性,所以其优化问题难以解决。穷举算法可能会找到最优解,但计算复杂度高,且工业物联网内通信链路的信道状态信息很难获得,使得现有的优化方法难以获得最优近似解。因此,提出一个多智能体深度强化学习的解决方案,以找到多个设备对设备通信链路最优的频谱子带选择和传输功率分配策略。
在工业物联网网络中,假设每个设备对设备通信链路根据当前的环境状态和其它
设备对设备通信链路动作自主决定频谱子带和传输功率以最大化工业物联网网络效率
。然后,根据之前的环境状态和选择的动作,环境状态转变为新的状态。于是,优化问题被建
模为马尔可夫决策过程,其中是状态空间,代表动作空间,是奖励函
数,代表状态转移概率。设备对设备通信链路充当智能体,探索车辆环境,并指导自身的
频谱子带和传输功率选择策略。
对于每个设备对设备通信链路,状态空间由时间预算中的七个部分组成:前
四个,,和分别是蜂窝通信链路和设备对设备通信链路的信道状态,
是设备对设备通信链路在频谱子带上的接收到的干扰功率。此外,还考虑了剩余传输
负载和剩余传输时间。因此,设备对设备通信链路的状态空间定义为:
为了验证传输负载是否成功传输,在奖励功能中考虑了成功或失败两种情况。
如果传输失败,则将设备对设备通信链路在频谱子带选择有效传输速率作为奖励
系数。否则,将给出常数。因此,在时间间隙的奖励函数可以写为:
Q学习算法在求解小规模和离散空间等问题方面是有效的,但是当处理的问题具
有很大的状态空间和动作空间,将导致其Q表非常大,这将为搜索和存储带来大量的时间和
空间。因此,提出了多智能体深度Q网络算法来解决这个问题多智能体深度Q网络算法采用
深度神经网络模型实现设备对设备通信链路的状态估计。为了有效地训练和更新Q网络,多
智能体深度Q网络算法有两个重要的策略。一方面,采用经验回放的方法来保留历史经验,
保证了训练数据的相对独立性,避免发散。另一方面,多智能体深度Q网络算法由结构相同
但权重不同的主网络(权重)和目标网络(权重)组成。
经验重放将过去的经验存储到重放内存,并从池中随机抽取小批样本来训练深度
神经网络,从而避免智能体只关注当前网络正在做的事情。在每个时间间隙中,设备对设
备通信链路观察自己的状态,然后根据建立的动作值函数执行联合频谱
子带和传输功率选择。因此,动作值函数被定义为:
然后,根据设备对设备通信链路采取的动作,环境转移到一个新的状态,设备对设备通信链路从环境中获得的奖励。基于上述元素,每个设备对设备通信
链路采用相同的方式计算即时奖励。于是,得到奖励和新状态,设备对设备通信链路可以通过最小化损失函数来更新深度Q网络的权重,该函数可以表示为:
具体的算法流程如下:
随机初始化智能体Q网络;
每个回合开始:
更新车辆位置和大规模衰落系数;
更新信道小规模衰落系数;
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (9)
1.一种基于深度强化学习的物联网频谱分配优化方法,其特征在于,包括:
构造多个设备对设备通信链路的系统模型;
基于构造的系统模型采集系统相关参数,包括蜂窝通信链路的信噪比和在频谱子带上的传输速率,也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率;
构建优化目标函数以及约束条件;
将采集的相关参数输入至优化目标函数以及约束条件,基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解,输出最优的频谱子带选择和传输功率分配策略,包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。
4.根据权利要求3所述的一种基于深度强化学习的物联网频谱分配优化方法,其特征在于:
7.根据权利要求6所述的一种基于深度强化学习的物联网频谱分配优化方法,其特征在于:对目标函数进行求解时:
训练开始之前对经验重放的经验回放池初始化,并随机对多个智能体的Q网络初始
化;在每个训练回合开始时,更新工业物联网中设备的位置和大规模衰落系数,同时对设备
与设备链路之间的剩余传输负载和剩余传输时间进行重置;
其中,为动作值函数,和分
别是设备对设备通信链路在时间间隙时的状态空间和动作空间,为主网络权重;表示目标网络的输出,和分别是设备对设备通信链路在下一个环
境状态时的状态空间和动作空间,为主网络权重,为
折扣贴现率;
每个训练回合在设备对设备链路做出合理的频谱子带和传输功率分配之后结束,当训练回合数达到最大时,训练停止。
9.一种工业物联网频谱分配优化系统,其特征在于,包括:
第一模块:被配置为用于构造多个设备对设备通信链路的系统模型;
第二模块:被配置为用于基于构造的系统模型采集系统相关参数,包括蜂窝通信链路的信噪比和在频谱子带上的传输速率,也包括设备对设备通信链路的信噪比、所选择的频谱子带及其传输功率;
第三模块:被配置为用于构建优化目标函数以及约束条件;
第四模块:被配置为用于将采集的相关参数输入至优化目标函数以及约束条件,基于马尔可夫决策采用多智能体深度Q网络算法对目标函数进行求解,输出最优的频谱子带选择和传输功率分配策略,包括蜂窝通信链路效率、多个设备对设备通信链路效率以及最后所考虑的工业物联网网络效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211388554.4A CN115442812B (zh) | 2022-11-08 | 2022-11-08 | 一种基于深度强化学习的物联网频谱分配优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211388554.4A CN115442812B (zh) | 2022-11-08 | 2022-11-08 | 一种基于深度强化学习的物联网频谱分配优化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115442812A true CN115442812A (zh) | 2022-12-06 |
CN115442812B CN115442812B (zh) | 2023-04-07 |
Family
ID=84252998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211388554.4A Active CN115442812B (zh) | 2022-11-08 | 2022-11-08 | 一种基于深度强化学习的物联网频谱分配优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115442812B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176213A (zh) * | 2023-11-03 | 2023-12-05 | 中国人民解放军国防科技大学 | 基于深度预测q网络的scma码本选择和功率分配方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120213189A1 (en) * | 2009-11-04 | 2012-08-23 | Lg Electronics Inc. | method for uplink transmission control and an apparatus for the same in a wireless communications system |
CN106231620A (zh) * | 2016-07-22 | 2016-12-14 | 哈尔滨工业大学 | 一种蜂窝网络中d2d通信的联合功率控制及比例公平调度的方法 |
CN106255133A (zh) * | 2016-08-05 | 2016-12-21 | 桂林电子科技大学 | 一种基于全双工双向中继d2d网络的能量效率优化方法 |
CN109729528A (zh) * | 2018-12-21 | 2019-05-07 | 北京邮电大学 | 一种基于多智能体深度强化学习的d2d资源分配方法 |
CN110166987A (zh) * | 2019-04-29 | 2019-08-23 | 东南大学 | 一种保障蜂窝移动通信系统QoS的D2D通信能效最优化方法 |
CN111314894A (zh) * | 2020-02-28 | 2020-06-19 | 重庆邮电大学 | 一种面向noma与携能d2d融合网络的鲁棒资源分配方法 |
CN111465108A (zh) * | 2020-03-04 | 2020-07-28 | 中南林业科技大学 | 一种能量获取d2d异构网络中频效能效优化方法 |
WO2020204348A1 (ko) * | 2019-03-29 | 2020-10-08 | 엘지전자 주식회사 | 무선 통신 시스템에서 대역폭 부분 설정 및 데이터를 송수신하는 방법 및 이에 대한 장치 |
CN112702719A (zh) * | 2020-11-27 | 2021-04-23 | 北京工业大学 | 一种无人机场景下高能效d2d资源分配方法 |
-
2022
- 2022-11-08 CN CN202211388554.4A patent/CN115442812B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120213189A1 (en) * | 2009-11-04 | 2012-08-23 | Lg Electronics Inc. | method for uplink transmission control and an apparatus for the same in a wireless communications system |
CN106231620A (zh) * | 2016-07-22 | 2016-12-14 | 哈尔滨工业大学 | 一种蜂窝网络中d2d通信的联合功率控制及比例公平调度的方法 |
CN106255133A (zh) * | 2016-08-05 | 2016-12-21 | 桂林电子科技大学 | 一种基于全双工双向中继d2d网络的能量效率优化方法 |
CN109729528A (zh) * | 2018-12-21 | 2019-05-07 | 北京邮电大学 | 一种基于多智能体深度强化学习的d2d资源分配方法 |
WO2020204348A1 (ko) * | 2019-03-29 | 2020-10-08 | 엘지전자 주식회사 | 무선 통신 시스템에서 대역폭 부분 설정 및 데이터를 송수신하는 방법 및 이에 대한 장치 |
CN110166987A (zh) * | 2019-04-29 | 2019-08-23 | 东南大学 | 一种保障蜂窝移动通信系统QoS的D2D通信能效最优化方法 |
CN111314894A (zh) * | 2020-02-28 | 2020-06-19 | 重庆邮电大学 | 一种面向noma与携能d2d融合网络的鲁棒资源分配方法 |
CN111465108A (zh) * | 2020-03-04 | 2020-07-28 | 中南林业科技大学 | 一种能量获取d2d异构网络中频效能效优化方法 |
CN112702719A (zh) * | 2020-11-27 | 2021-04-23 | 北京工业大学 | 一种无人机场景下高能效d2d资源分配方法 |
Non-Patent Citations (4)
Title |
---|
RAHUL AMIN: "Balancing Spectral Efficiency, Energy Consumption, and Fairness in Future Heterogeneous Wireless Systems with Reconfigurable Devices", 《IEEE JOURNAL ON SELECTED》 * |
SAMI ALENEZI: "Energy-Efficient Power Control and Resource Allocation Based on Deep Reinforcement Learning for D2D Communications in Cellular Networks", 《2021 20TH INTERNATIONAL CONFERENCE ON UBIQUITOUS COMPUTING AND COMMUNICATIONS》 * |
周凡: "密集异构蜂窝网络中基于深度强化学习的资源分配算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
马维鑫: "D2D通信资源高效分配算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176213A (zh) * | 2023-11-03 | 2023-12-05 | 中国人民解放军国防科技大学 | 基于深度预测q网络的scma码本选择和功率分配方法 |
CN117176213B (zh) * | 2023-11-03 | 2024-01-30 | 中国人民解放军国防科技大学 | 基于深度预测q网络的scma码本选择和功率分配方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115442812B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109729528B (zh) | 一种基于多智能体深度强化学习的d2d资源分配方法 | |
Song et al. | Wireless device-to-device communications and networks | |
CN111556572B (zh) | 一种基于强化学习的频谱资源和计算资源联合分配方法 | |
CN110856268B (zh) | 一种无线网络动态多信道接入方法 | |
CN110167176B (zh) | 一种基于分布式机器学习的无线网络资源分配方法 | |
WO2023179010A1 (zh) | 一种noma-mec系统中的用户分组和资源分配方法及装置 | |
CN111526592B (zh) | 一种用于无线干扰信道中的非协作多智能体功率控制方法 | |
CN111628855A (zh) | 基于深度强化学习的工业5g动态多优先级多接入方法 | |
CN115442812B (zh) | 一种基于深度强化学习的物联网频谱分配优化方法及系统 | |
Peng et al. | Energy harvesting reconfigurable intelligent surface for UAV based on robust deep reinforcement learning | |
CN105704721A (zh) | 一种提高频谱利用率的d2d-p复用蜂窝网络通信方法 | |
CN114698128A (zh) | 一种认知星地网络的抗干扰信道选择方法和系统 | |
Jiang et al. | Dynamic user pairing and power allocation for NOMA with deep reinforcement learning | |
CN115412134A (zh) | 基于离线强化学习的以用户为中心的无蜂窝大规模mimo功率分配方法 | |
CN113923743B (zh) | 电力地下管廊的路由选择方法、装置、终端及存储介质 | |
Nguyen et al. | Short-packet communications in multi-hop WPINs: Performance analysis and deep learning design | |
Cao et al. | Interference-aware multi-user relay selection scheme in cooperative relay networks | |
CN116886154A (zh) | 一种基于流量密度的低轨卫星接入方法及系统 | |
CN116546462A (zh) | 一种基于联邦学习的多智能体空地网络资源分配方法 | |
Li et al. | Dynamic multi-channel access in wireless system with deep reinforcement learning | |
CN116233895B (zh) | 基于强化学习的5g配网节点通信优化方法、设备及介质 | |
Mary et al. | Reinforcement learning for physical layer communications | |
CN117614520B (zh) | 基于无人机-卫星协作的去蜂窝大规模mimo资源优化方法 | |
CN115665867B (zh) | 一种车联网的频谱管理方法及系统 | |
US12035380B2 (en) | Industrial 5G dynamic multi-priority multi-access method based on deep reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |