CN110958680A - 面向能量效率的无人机群多智能体深度强化学习优化方法 - Google Patents
面向能量效率的无人机群多智能体深度强化学习优化方法 Download PDFInfo
- Publication number
- CN110958680A CN110958680A CN201911252410.4A CN201911252410A CN110958680A CN 110958680 A CN110958680 A CN 110958680A CN 201911252410 A CN201911252410 A CN 201911252410A CN 110958680 A CN110958680 A CN 110958680A
- Authority
- CN
- China
- Prior art keywords
- agent
- unmanned aerial
- aerial vehicle
- vehicle cluster
- indicating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/04—TPC
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/241—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR, Eb/lo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/04—TPC
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/242—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account path loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/04—Large scale networks; Deep hierarchical networks
- H04W84/08—Trunked mobile radio systems
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Feedback Control In General (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
Description
参数 | 值 |
信道带宽 | 1Mbps |
链路数量 | 20 |
可用功率值 | (3,5,10)mw |
信道噪声 | -30dBm |
路径损失系数δ | 2 |
最大传输距离 | 300m |
可用信道数目 | 3 |
参数 | 值 |
学习策略探索值ε | 0.95-0.05 |
折扣系数γ | 0.85 |
卷积核大小 | 6*6 |
池化操作 | Max |
全连接层神经元个数 | 256 |
激励函数 | ReLU |
批训练数据大小 | 32 |
输入大小 | 120*120 |
回放空间大小 | 80000 |
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252410.4A CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252410.4A CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110958680A true CN110958680A (zh) | 2020-04-03 |
CN110958680B CN110958680B (zh) | 2022-09-13 |
Family
ID=69980469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911252410.4A Active CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110958680B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111600676A (zh) * | 2020-06-05 | 2020-08-28 | 上海特金无线技术有限公司 | Q值表确定方法、抗干扰方法、装置及设备 |
CN111683409A (zh) * | 2020-06-05 | 2020-09-18 | 上海特金无线技术有限公司 | 多无人机协同通信q值表的学习方法、调度方法及装置 |
CN111783224A (zh) * | 2020-06-22 | 2020-10-16 | 中国人民解放军军事科学院国防科技创新研究院 | 一种深度强化学习模型无人机部署试验方法和系统 |
CN111950873A (zh) * | 2020-07-30 | 2020-11-17 | 上海卫星工程研究所 | 基于深度强化学习的卫星实时引导任务规划方法及系统 |
CN112180967A (zh) * | 2020-04-26 | 2021-01-05 | 北京理工大学 | 基于评判-执行架构的多无人机协同对抗决策方法 |
CN112199154A (zh) * | 2020-09-27 | 2021-01-08 | 南京星耀智能科技有限公司 | 一种基于分布式协同采样中心式优化的强化学习训练系统及方法 |
CN112215364A (zh) * | 2020-09-17 | 2021-01-12 | 天津(滨海)人工智能军民融合创新中心 | 一种基于强化学习的敌-友深度确定性策略方法及系统 |
CN112215283A (zh) * | 2020-10-12 | 2021-01-12 | 中国人民解放军海军航空大学 | 基于有人/无人机系统的近距空战智能决策方法 |
CN112261725A (zh) * | 2020-10-23 | 2021-01-22 | 安徽理工大学 | 一种基于深度强化学习的数据包传输智能决策方法 |
CN112465664A (zh) * | 2020-11-12 | 2021-03-09 | 贵州电网有限责任公司 | 一种基于人工神经网络及深度强化学习的avc智能控制方法 |
CN112616126A (zh) * | 2020-12-10 | 2021-04-06 | 天津(滨海)人工智能军民融合创新中心 | 一种基于分布式协作的传感器信息处理方法 |
CN112818788A (zh) * | 2021-01-25 | 2021-05-18 | 电子科技大学 | 一种基于无人机集群的分布式卷积神经网络分层匹配方法 |
CN112947575A (zh) * | 2021-03-17 | 2021-06-11 | 中国人民解放军国防科技大学 | 基于深度强化学习的无人机集群多目标搜索方法及系统 |
CN113300890A (zh) * | 2021-05-24 | 2021-08-24 | 同济大学 | 一种网络化机器学习系统的自适应通信方法 |
CN113469125A (zh) * | 2021-07-20 | 2021-10-01 | 中国人民解放军国防科技大学 | 多无人机协同信号识别方法及识别系统 |
CN113568425A (zh) * | 2020-04-28 | 2021-10-29 | 北京理工大学 | 一种基于神经网络学习的集群协同制导方法 |
CN113776531A (zh) * | 2021-07-21 | 2021-12-10 | 电子科技大学长三角研究院(湖州) | 无线自供电通信网络的多无人机自主导航及任务分配算法 |
CN113840306A (zh) * | 2020-06-24 | 2021-12-24 | 中国人民解放军陆军工程大学 | 基于网络局部信息交互的分布式无线网络接入决策方法 |
CN113900445A (zh) * | 2021-10-13 | 2022-01-07 | 厦门渊亭信息科技有限公司 | 基于多智能体强化学习的无人机协同控制训练方法及系统 |
CN114142912A (zh) * | 2021-11-26 | 2022-03-04 | 西安电子科技大学 | 高动态空中网络时间覆盖连续性保障的资源管控方法 |
CN115167506A (zh) * | 2022-06-27 | 2022-10-11 | 华南师范大学 | 无人机飞行航线更新规划的方法、装置、设备及存储介质 |
CN115811788A (zh) * | 2022-11-23 | 2023-03-17 | 齐齐哈尔大学 | 一种深度强化学习联合无监督学习的d2d网络分布式资源分配方法 |
CN116156516A (zh) * | 2023-02-27 | 2023-05-23 | 北京理工大学 | 基于叠加传输的无人机蜂群神经网络传输方法 |
WO2024021281A1 (zh) * | 2022-07-25 | 2024-02-01 | 电子科技大学长三角研究院(衢州) | 一种分布式协同进化方法、uav及其智能路由方法、装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106487011A (zh) * | 2016-11-28 | 2017-03-08 | 东南大学 | 一种基于q学习的户用微电网能量优化方法 |
US9754221B1 (en) * | 2017-03-09 | 2017-09-05 | Alphaics Corporation | Processor for implementing reinforcement learning operations |
CN108833049A (zh) * | 2018-06-12 | 2018-11-16 | 北京邮电大学 | 一种无人机网络中基于认知的欺骗式抗干扰方法及装置 |
US20180359710A1 (en) * | 2017-06-07 | 2018-12-13 | Ethertronics, Inc. | Power Control Method For Systems With Altitude Changing Objects |
CN109740839A (zh) * | 2018-11-23 | 2019-05-10 | 北京交通大学 | 一种突发事件下的列车动态调整方法及系统 |
CN109992000A (zh) * | 2019-04-04 | 2019-07-09 | 北京航空航天大学 | 一种基于分层强化学习的多无人机路径协同规划方法及装置 |
US20190220737A1 (en) * | 2018-01-17 | 2019-07-18 | Hengshuai Yao | Method of generating training data for training a neural network, method of training a neural network and using neural network for autonomous operations |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
-
2019
- 2019-12-09 CN CN201911252410.4A patent/CN110958680B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106487011A (zh) * | 2016-11-28 | 2017-03-08 | 东南大学 | 一种基于q学习的户用微电网能量优化方法 |
US9754221B1 (en) * | 2017-03-09 | 2017-09-05 | Alphaics Corporation | Processor for implementing reinforcement learning operations |
US20180359710A1 (en) * | 2017-06-07 | 2018-12-13 | Ethertronics, Inc. | Power Control Method For Systems With Altitude Changing Objects |
US20190220737A1 (en) * | 2018-01-17 | 2019-07-18 | Hengshuai Yao | Method of generating training data for training a neural network, method of training a neural network and using neural network for autonomous operations |
CN108833049A (zh) * | 2018-06-12 | 2018-11-16 | 北京邮电大学 | 一种无人机网络中基于认知的欺骗式抗干扰方法及装置 |
CN109740839A (zh) * | 2018-11-23 | 2019-05-10 | 北京交通大学 | 一种突发事件下的列车动态调整方法及系统 |
CN109992000A (zh) * | 2019-04-04 | 2019-07-09 | 北京航空航天大学 | 一种基于分层强化学习的多无人机路径协同规划方法及装置 |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
Non-Patent Citations (5)
Title |
---|
《计算机工程》2009年(第35卷)总目次: "《计算机工程》2009年(第35卷)总目次", 《计算机工程》 * |
戴彦等: "新一代人工智能在智能电网中的应用研究综述", 《电力建设》 * |
杨文臣等: "多智能体强化学习在城市交通网络信号控制方法中的应用综述", 《计算机应用研究》 * |
王倩等: "D2D通信中基于Q学习的联合资源分配与功率控制算法", 《南京大学学报(自然科学)》 * |
袁月等: "基于深度增强学习的自动游戏方法", 《长江大学学报(自科版)》 * |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112180967A (zh) * | 2020-04-26 | 2021-01-05 | 北京理工大学 | 基于评判-执行架构的多无人机协同对抗决策方法 |
CN113568425A (zh) * | 2020-04-28 | 2021-10-29 | 北京理工大学 | 一种基于神经网络学习的集群协同制导方法 |
CN113568425B (zh) * | 2020-04-28 | 2024-05-14 | 北京理工大学 | 一种基于神经网络学习的集群协同制导方法 |
CN111683409A (zh) * | 2020-06-05 | 2020-09-18 | 上海特金无线技术有限公司 | 多无人机协同通信q值表的学习方法、调度方法及装置 |
CN111600676A (zh) * | 2020-06-05 | 2020-08-28 | 上海特金无线技术有限公司 | Q值表确定方法、抗干扰方法、装置及设备 |
CN111683409B (zh) * | 2020-06-05 | 2024-02-20 | 上海特金无线技术有限公司 | 多无人机协同通信q值表的学习方法、调度方法及装置 |
CN111783224B (zh) * | 2020-06-22 | 2024-01-02 | 中国人民解放军军事科学院国防科技创新研究院 | 一种深度强化学习模型无人机部署试验方法和系统 |
CN111783224A (zh) * | 2020-06-22 | 2020-10-16 | 中国人民解放军军事科学院国防科技创新研究院 | 一种深度强化学习模型无人机部署试验方法和系统 |
CN113840306A (zh) * | 2020-06-24 | 2021-12-24 | 中国人民解放军陆军工程大学 | 基于网络局部信息交互的分布式无线网络接入决策方法 |
CN113840306B (zh) * | 2020-06-24 | 2023-07-21 | 中国人民解放军陆军工程大学 | 基于网络局部信息交互的分布式无线网络接入决策方法 |
CN111950873B (zh) * | 2020-07-30 | 2022-11-15 | 上海卫星工程研究所 | 基于深度强化学习的卫星实时引导任务规划方法及系统 |
CN111950873A (zh) * | 2020-07-30 | 2020-11-17 | 上海卫星工程研究所 | 基于深度强化学习的卫星实时引导任务规划方法及系统 |
CN112215364A (zh) * | 2020-09-17 | 2021-01-12 | 天津(滨海)人工智能军民融合创新中心 | 一种基于强化学习的敌-友深度确定性策略方法及系统 |
CN112215364B (zh) * | 2020-09-17 | 2023-11-17 | 天津(滨海)人工智能军民融合创新中心 | 一种基于强化学习的敌-友深度确定性策略方法及系统 |
CN112199154A (zh) * | 2020-09-27 | 2021-01-08 | 南京星耀智能科技有限公司 | 一种基于分布式协同采样中心式优化的强化学习训练系统及方法 |
CN112199154B (zh) * | 2020-09-27 | 2024-06-11 | 南京星耀智能科技有限公司 | 一种基于分布式协同采样中心式优化的强化学习训练系统及方法 |
CN112215283A (zh) * | 2020-10-12 | 2021-01-12 | 中国人民解放军海军航空大学 | 基于有人/无人机系统的近距空战智能决策方法 |
CN112261725A (zh) * | 2020-10-23 | 2021-01-22 | 安徽理工大学 | 一种基于深度强化学习的数据包传输智能决策方法 |
CN112465664B (zh) * | 2020-11-12 | 2022-05-03 | 贵州电网有限责任公司 | 一种基于人工神经网络及深度强化学习的avc智能控制方法 |
CN112465664A (zh) * | 2020-11-12 | 2021-03-09 | 贵州电网有限责任公司 | 一种基于人工神经网络及深度强化学习的avc智能控制方法 |
CN112616126B (zh) * | 2020-12-10 | 2022-04-12 | 天津(滨海)人工智能军民融合创新中心 | 一种基于分布式协作的传感器信息处理方法 |
CN112616126A (zh) * | 2020-12-10 | 2021-04-06 | 天津(滨海)人工智能军民融合创新中心 | 一种基于分布式协作的传感器信息处理方法 |
CN112818788A (zh) * | 2021-01-25 | 2021-05-18 | 电子科技大学 | 一种基于无人机集群的分布式卷积神经网络分层匹配方法 |
CN112947575A (zh) * | 2021-03-17 | 2021-06-11 | 中国人民解放军国防科技大学 | 基于深度强化学习的无人机集群多目标搜索方法及系统 |
CN113300890B (zh) * | 2021-05-24 | 2022-06-14 | 同济大学 | 一种网络化机器学习系统的自适应通信方法 |
CN113300890A (zh) * | 2021-05-24 | 2021-08-24 | 同济大学 | 一种网络化机器学习系统的自适应通信方法 |
CN113469125A (zh) * | 2021-07-20 | 2021-10-01 | 中国人民解放军国防科技大学 | 多无人机协同信号识别方法及识别系统 |
CN113469125B (zh) * | 2021-07-20 | 2022-07-19 | 中国人民解放军国防科技大学 | 多无人机协同信号识别方法及识别系统 |
CN113776531A (zh) * | 2021-07-21 | 2021-12-10 | 电子科技大学长三角研究院(湖州) | 无线自供电通信网络的多无人机自主导航及任务分配算法 |
CN113900445A (zh) * | 2021-10-13 | 2022-01-07 | 厦门渊亭信息科技有限公司 | 基于多智能体强化学习的无人机协同控制训练方法及系统 |
CN114142912A (zh) * | 2021-11-26 | 2022-03-04 | 西安电子科技大学 | 高动态空中网络时间覆盖连续性保障的资源管控方法 |
CN115167506A (zh) * | 2022-06-27 | 2022-10-11 | 华南师范大学 | 无人机飞行航线更新规划的方法、装置、设备及存储介质 |
WO2024021281A1 (zh) * | 2022-07-25 | 2024-02-01 | 电子科技大学长三角研究院(衢州) | 一种分布式协同进化方法、uav及其智能路由方法、装置 |
CN115811788A (zh) * | 2022-11-23 | 2023-03-17 | 齐齐哈尔大学 | 一种深度强化学习联合无监督学习的d2d网络分布式资源分配方法 |
CN116156516A (zh) * | 2023-02-27 | 2023-05-23 | 北京理工大学 | 基于叠加传输的无人机蜂群神经网络传输方法 |
CN116156516B (zh) * | 2023-02-27 | 2024-07-30 | 北京理工大学 | 基于叠加传输的无人机蜂群神经网络传输方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110958680B (zh) | 2022-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110958680B (zh) | 面向能量效率的无人机群多智能体深度强化学习优化方法 | |
CN110809306B (zh) | 一种基于深度强化学习的终端接入选择方法 | |
CN109729528A (zh) | 一种基于多智能体深度强化学习的d2d资源分配方法 | |
CN112261725B (zh) | 一种基于深度强化学习的数据包传输智能决策方法 | |
CN111367657A (zh) | 一种基于深度强化学习的计算资源协同合作方法 | |
CN111628855A (zh) | 基于深度强化学习的工业5g动态多优先级多接入方法 | |
CN112492686B (zh) | 一种基于深度双q网络的蜂窝网络功率分配方法 | |
CN112929900B (zh) | 水声网络中基于深度强化学习实现时域干扰对齐的mac协议 | |
CN112738849B (zh) | 应用于多跳环境反向散射无线网络的负载均衡调控方法 | |
CN110856268A (zh) | 一种无线网络动态多信道接入方法 | |
CN112492691A (zh) | 一种深度确定性策略梯度的下行noma功率分配方法 | |
CN115065728B (zh) | 一种基于多策略强化学习的多目标内容存储方法 | |
CN115065678A (zh) | 一种基于深度强化学习的多智能设备任务卸载决策方法 | |
CN114126021B (zh) | 一种基于深度强化学习的绿色认知无线电的功率分配方法 | |
Wang et al. | Dual-attention assisted deep reinforcement learning algorithm for energy-efficient resource allocation in Industrial Internet of Things | |
CN117750509A (zh) | 一种多无人机网络下基于深度强化学习的时隙分配方法 | |
CN113902087A (zh) | 一种多Agent深度强化学习算法 | |
CN116506918A (zh) | 一种基于缓存区预测的中继选择方法 | |
CN113691334B (zh) | 一种基于次用户群体协作的认知无线电动态功率分配方法 | |
CN113890653B (zh) | 面向多用户利益的多智能体强化学习功率分配方法 | |
You et al. | On parallel immune quantum evolutionary algorithm based on learning mechanism and its convergence | |
Wang et al. | Multi-granularity fusion resource allocation algorithm based on dual-attention deep reinforcement learning and lifelong learning architecture in heterogeneous IIoT | |
Attalla et al. | A reinforcement learning approach to ARQ feedback-based multiple access for cognitive radio networks | |
Lu et al. | Wireless Power Control via Meta-Reinforcement Learning | |
Tian | An Intelligent Optimization Method for Wireless Communication Network Resources Based on Reinforcement Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Yao Changhua Inventor after: Dang Suihu Inventor after: Li Songbai Inventor before: Yao Changhua Inventor before: Wang Xiulai Inventor before: Dang Suihu Inventor before: Li Songbai Inventor before: Ruan Lang Inventor before: Tian Hui Inventor before: Fan Haoren Inventor before: Zhang Haibo |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |