CN110958680B - 面向能量效率的无人机群多智能体深度强化学习优化方法 - Google Patents
面向能量效率的无人机群多智能体深度强化学习优化方法 Download PDFInfo
- Publication number
- CN110958680B CN110958680B CN201911252410.4A CN201911252410A CN110958680B CN 110958680 B CN110958680 B CN 110958680B CN 201911252410 A CN201911252410 A CN 201911252410A CN 110958680 B CN110958680 B CN 110958680B
- Authority
- CN
- China
- Prior art keywords
- agent
- decision
- unmanned aerial
- time slot
- ith
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000002787 reinforcement Effects 0.000 title claims abstract description 29
- 238000005457 optimization Methods 0.000 title claims abstract description 22
- 238000004891 communication Methods 0.000 claims abstract description 55
- 238000013528 artificial neural network Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 9
- 230000007246 mechanism Effects 0.000 claims abstract description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 125
- 230000005540 biological transmission Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 13
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 238000001311 chemical methods and process Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. Transmission Power Control [TPC] or power classes
- H04W52/04—Transmission power control [TPC]
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/241—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account channel quality metrics, e.g. SIR, SNR, CIR or Eb/lo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. Transmission Power Control [TPC] or power classes
- H04W52/04—Transmission power control [TPC]
- H04W52/18—TPC being performed according to specific parameters
- H04W52/24—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
- H04W52/242—TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account path loss
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/04—Large scale networks; Deep hierarchical networks
- H04W84/08—Trunked mobile radio systems
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Feedback Control In General (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
Description
参数 | 值 |
信道带宽 | 1Mbps |
链路数量 | 20 |
可用功率值 | (3,5,10)mw |
信道噪声 | -30dBm |
路径损失系数δ | 2 |
最大传输距离 | 300m |
可用信道数目 | 3 |
参数 | 值 |
学习策略探索值ε | 0.95-0.05 |
折扣系数γ | 0.85 |
卷积核大小 | 6*6 |
池化操作 | Max |
全连接层神经元个数 | 256 |
激励函数 | ReLU |
批训练数据大小 | 32 |
输入大小 | 120*120 |
回放空间大小 | 80000 |
Claims (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252410.4A CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911252410.4A CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110958680A CN110958680A (zh) | 2020-04-03 |
CN110958680B true CN110958680B (zh) | 2022-09-13 |
Family
ID=69980469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911252410.4A Active CN110958680B (zh) | 2019-12-09 | 2019-12-09 | 面向能量效率的无人机群多智能体深度强化学习优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110958680B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112180967B (zh) * | 2020-04-26 | 2022-08-19 | 北京理工大学 | 基于评判-执行架构的多无人机协同对抗决策方法 |
CN113568425B (zh) * | 2020-04-28 | 2024-05-14 | 北京理工大学 | 一种基于神经网络学习的集群协同制导方法 |
CN111683409B (zh) * | 2020-06-05 | 2024-02-20 | 上海特金无线技术有限公司 | 多无人机协同通信q值表的学习方法、调度方法及装置 |
CN111600676A (zh) * | 2020-06-05 | 2020-08-28 | 上海特金无线技术有限公司 | Q值表确定方法、抗干扰方法、装置及设备 |
CN111783224B (zh) * | 2020-06-22 | 2024-01-02 | 中国人民解放军军事科学院国防科技创新研究院 | 一种深度强化学习模型无人机部署试验方法和系统 |
CN113840306B (zh) * | 2020-06-24 | 2023-07-21 | 中国人民解放军陆军工程大学 | 基于网络局部信息交互的分布式无线网络接入决策方法 |
CN111950873B (zh) * | 2020-07-30 | 2022-11-15 | 上海卫星工程研究所 | 基于深度强化学习的卫星实时引导任务规划方法及系统 |
CN112215364B (zh) * | 2020-09-17 | 2023-11-17 | 天津(滨海)人工智能军民融合创新中心 | 一种基于强化学习的敌-友深度确定性策略方法及系统 |
CN112199154B (zh) * | 2020-09-27 | 2024-06-11 | 南京星耀智能科技有限公司 | 一种基于分布式协同采样中心式优化的强化学习训练系统及方法 |
CN112215283A (zh) * | 2020-10-12 | 2021-01-12 | 中国人民解放军海军航空大学 | 基于有人/无人机系统的近距空战智能决策方法 |
CN112261725B (zh) * | 2020-10-23 | 2022-03-18 | 安徽理工大学 | 一种基于深度强化学习的数据包传输智能决策方法 |
CN112465664B (zh) * | 2020-11-12 | 2022-05-03 | 贵州电网有限责任公司 | 一种基于人工神经网络及深度强化学习的avc智能控制方法 |
CN112616126B (zh) * | 2020-12-10 | 2022-04-12 | 天津(滨海)人工智能军民融合创新中心 | 一种基于分布式协作的传感器信息处理方法 |
CN112818788B (zh) * | 2021-01-25 | 2022-05-03 | 电子科技大学 | 一种基于无人机集群的分布式卷积神经网络分层匹配方法 |
CN112947575B (zh) * | 2021-03-17 | 2023-05-16 | 中国人民解放军国防科技大学 | 基于深度强化学习的无人机集群多目标搜索方法及系统 |
CN113300890B (zh) * | 2021-05-24 | 2022-06-14 | 同济大学 | 一种网络化机器学习系统的自适应通信方法 |
CN113469125B (zh) * | 2021-07-20 | 2022-07-19 | 中国人民解放军国防科技大学 | 多无人机协同信号识别方法及识别系统 |
CN113776531B (zh) * | 2021-07-21 | 2024-07-19 | 电子科技大学长三角研究院(湖州) | 无线自供电通信网络的多无人机自主导航及任务分配算法 |
CN113900445A (zh) * | 2021-10-13 | 2022-01-07 | 厦门渊亭信息科技有限公司 | 基于多智能体强化学习的无人机协同控制训练方法及系统 |
CN114142912B (zh) * | 2021-11-26 | 2023-01-06 | 西安电子科技大学 | 高动态空中网络时间覆盖连续性保障的资源管控方法 |
CN115167506B (zh) * | 2022-06-27 | 2024-06-28 | 华南师范大学 | 无人机飞行航线更新规划的方法、装置、设备及存储介质 |
CN115412992A (zh) * | 2022-07-25 | 2022-11-29 | 电子科技大学长三角研究院(衢州) | 一种分布式协同进化方法、uav及其智能路由方法、装置 |
CN115811788B (zh) * | 2022-11-23 | 2023-07-18 | 齐齐哈尔大学 | 一种深度强化学习联合无监督学习的d2d网络分布式资源分配方法 |
CN116156516B (zh) * | 2023-02-27 | 2024-07-30 | 北京理工大学 | 基于叠加传输的无人机蜂群神经网络传输方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106487011A (zh) * | 2016-11-28 | 2017-03-08 | 东南大学 | 一种基于q学习的户用微电网能量优化方法 |
US9754221B1 (en) * | 2017-03-09 | 2017-09-05 | Alphaics Corporation | Processor for implementing reinforcement learning operations |
CN108833049A (zh) * | 2018-06-12 | 2018-11-16 | 北京邮电大学 | 一种无人机网络中基于认知的欺骗式抗干扰方法及装置 |
CN109740839A (zh) * | 2018-11-23 | 2019-05-10 | 北京交通大学 | 一种突发事件下的列车动态调整方法及系统 |
CN109992000A (zh) * | 2019-04-04 | 2019-07-09 | 北京航空航天大学 | 一种基于分层强化学习的多无人机路径协同规划方法及装置 |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10582456B2 (en) * | 2017-06-07 | 2020-03-03 | Ethertronics, Inc. | Power control method for systems with altitude changing objects |
US20190220737A1 (en) * | 2018-01-17 | 2019-07-18 | Hengshuai Yao | Method of generating training data for training a neural network, method of training a neural network and using neural network for autonomous operations |
-
2019
- 2019-12-09 CN CN201911252410.4A patent/CN110958680B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106487011A (zh) * | 2016-11-28 | 2017-03-08 | 东南大学 | 一种基于q学习的户用微电网能量优化方法 |
US9754221B1 (en) * | 2017-03-09 | 2017-09-05 | Alphaics Corporation | Processor for implementing reinforcement learning operations |
CN108833049A (zh) * | 2018-06-12 | 2018-11-16 | 北京邮电大学 | 一种无人机网络中基于认知的欺骗式抗干扰方法及装置 |
CN109740839A (zh) * | 2018-11-23 | 2019-05-10 | 北京交通大学 | 一种突发事件下的列车动态调整方法及系统 |
CN109992000A (zh) * | 2019-04-04 | 2019-07-09 | 北京航空航天大学 | 一种基于分层强化学习的多无人机路径协同规划方法及装置 |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
Non-Patent Citations (5)
Title |
---|
《计算机工程》2009年(第35卷)总目次;《计算机工程》2009年(第35卷)总目次;《计算机工程》;20091220(第24期);全文 * |
D2D通信中基于Q学习的联合资源分配与功率控制算法;王倩等;《南京大学学报(自然科学)》;20181130(第06期);全文 * |
基于深度增强学习的自动游戏方法;袁月等;《长江大学学报(自科版)》;20171110(第21期);全文 * |
多智能体强化学习在城市交通网络信号控制方法中的应用综述;杨文臣等;《计算机应用研究》;20180612(第06期);全文 * |
新一代人工智能在智能电网中的应用研究综述;戴彦等;《电力建设》;20181001(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110958680A (zh) | 2020-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110958680B (zh) | 面向能量效率的无人机群多智能体深度强化学习优化方法 | |
CN111628855B (zh) | 基于深度强化学习的工业5g动态多优先级多接入方法 | |
CN113543156B (zh) | 基于多智能体深度强化学习的工业无线网络资源分配方法 | |
CN110109358B (zh) | 一种基于反馈的混合多智能体协同控制方法 | |
CN112817327B (zh) | 一种通信约束下的多无人机协同搜索方法 | |
CN113132943A (zh) | 一种车联网中车边协同的任务卸载调度及资源分配方法 | |
CN112261725A (zh) | 一种基于深度强化学习的数据包传输智能决策方法 | |
CN117939486B (zh) | 基于d3qn的6g超大规模车联网网络资源分配方法及系统 | |
CN114374949A (zh) | 一种车联网中基于信息新鲜度优化的功率控制机制 | |
CN114839884A (zh) | 一种基于深度强化学习的水下航行器底层控制方法及系统 | |
CN116340737A (zh) | 基于多智能体强化学习的异构集群零通信目标分配方法 | |
CN116234073A (zh) | 一种基于深度强化学习的分布式无人机自组网的路由方法 | |
CN114840024A (zh) | 基于情景记忆的无人机控制决策方法 | |
Zhang et al. | Feature-option-action: a domain adaption transfer reinforcement learning framework | |
CN113191487B (zh) | 基于分布式ppo算法的自适应连续功率控制方法 | |
CN113902087A (zh) | 一种多Agent深度强化学习算法 | |
CN118612743A (zh) | 基于信誉模型的车辆边缘计算网络客户端调度方法和系统 | |
CN118012057A (zh) | 面向无人艇集群多目标追踪策略的强化学习推理方法 | |
CN117353453A (zh) | 基于资源利用率、时延和无人机轨迹的电力信息采集方法 | |
CN117750509A (zh) | 一种多无人机网络下基于深度强化学习的时隙分配方法 | |
CN116704823A (zh) | 基于强化学习的无人机智能轨迹规划和通感资源分配方法 | |
CN115150335A (zh) | 一种基于深度强化学习的最优流量分割的方法和系统 | |
CN115018042A (zh) | 基于点对点通信和时序特征提取的多智能体强化学习方法 | |
CN115187056A (zh) | 一种考虑公平性原则的多智能体协同资源分配方法 | |
CN113890653A (zh) | 面向多用户利益的多智能体强化学习功率分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Yao Changhua Inventor after: Dang Suihu Inventor after: Li Songbai Inventor before: Yao Changhua Inventor before: Wang Xiulai Inventor before: Dang Suihu Inventor before: Li Songbai Inventor before: Ruan Lang Inventor before: Tian Hui Inventor before: Fan Haoren Inventor before: Zhang Haibo |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |