CN116080407A - 一种基于无线能量传输的无人机能耗优化方法与系统 - Google Patents

一种基于无线能量传输的无人机能耗优化方法与系统 Download PDF

Info

Publication number
CN116080407A
CN116080407A CN202211555066.8A CN202211555066A CN116080407A CN 116080407 A CN116080407 A CN 116080407A CN 202211555066 A CN202211555066 A CN 202211555066A CN 116080407 A CN116080407 A CN 116080407A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
energy consumption
energy
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211555066.8A
Other languages
English (en)
Other versions
CN116080407B (zh
Inventor
庄伟�
邢发男
申义贤
纪兆辉
李之恒
樊继利
江文
邵煜文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202211555066.8A priority Critical patent/CN116080407B/zh
Publication of CN116080407A publication Critical patent/CN116080407A/zh
Application granted granted Critical
Publication of CN116080407B publication Critical patent/CN116080407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L3/00Electric devices on electrically-propelled vehicles for safety purposes; Monitoring operating variables, e.g. speed, deceleration or energy consumption
    • B60L3/12Recording operating variables ; Monitoring of operating variables
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L53/00Methods of charging batteries, specially adapted for electric vehicles; Charging stations or on-board charging equipment therefor; Exchange of energy storage elements in electric vehicles
    • B60L53/10Methods of charging batteries, specially adapted for electric vehicles; Charging stations or on-board charging equipment therefor; Exchange of energy storage elements in electric vehicles characterised by the energy transfer between the charging station and the vehicle
    • B60L53/12Inductive energy transfer
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L2200/00Type of vehicles
    • B60L2200/10Air crafts
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种基于无线能量传输的无人机能耗优化方法与系统,涉及移动边缘计算领域。该基于无线能量传输的无人机能耗优化方法,基于WPT能量发射器与无人机之间的通信方式构建应急救援系统模型;基于应急救援系统模型,计算无人机收集到的无线能量以及无人机飞行的能量消耗;计算无人机在本地计算模式下的能量消耗以及无人机剩余能量,无人机在本地计算模式下的能量消耗包括飞行能耗和计算能耗;计算无人机在卸载计算模式下的能量消耗以及无人机剩余能量,无人机在卸载计算模式下的能量消耗包括飞行能耗和通信能耗。本发明在确保完成应急救援任务的同时,使无人机能够充分利用收集到的无线能量,提高无人机剩余能量,延长无人机工作时间。

Description

一种基于无线能量传输的无人机能耗优化方法与系统
技术领域
本发明涉及移动边缘计算技术领域,具体为一种基于无线能量传输的无人机能耗优化方法与系统。
背景技术
随着无人机技术的快速发展,其凭借着便携、安全、适应性强等特点已经在全球得到了广泛的应用,包括游戏、地图绘制、矿产勘探、沿海监测、边境巡逻、火灾探测、农业成像、交通监测和应急救援等。例如,地质灾害往往具有突发性且影响范围广泛,一旦发生很难确保应急救援的效率。无人机在白天采用视频图像技术,夜间使用红外探测技术,可为救援工作提供24小时不间断的人员搜救、灾害监测等服务。与此同时借助于无人机航拍能力可以消除地形障碍,依靠遥感成像技术可以获取灾害地质信息,救援人员能够高效地开展救援行动。
考虑到无人机的电池容量、计算能力和存储资源往往是有限的,虽然WPT为无人机提供了一种有效方法,但无人机往往不能充分利用收集到无线能量,因此在借助无人机完成应急救援任务时,要合理选择任务卸载策略,尽可能减少无人机能耗,获得最大限度的剩余能量,从而延长无人机的工作时间。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于无线能量传输的无人机能耗优化方法与系统,为无人机设计一种全新的计算卸载策略,在确保完成应急救援任务的同时,通过联合优化无人机的通信时间分配和计算模式选择,使无人机能够充分利用收集到的无线能量,最大限度地提高无人机剩余能量,延长无人机的工作时间。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,提供了一种基于无线能量传输的无人机能耗优化方法,所述方法包括:
基于WPT能量发射器与无人机之间的通信方式构建应急救援系统模型;
基于应急救援系统模型,计算无人机收集到的无线能量以及无人机飞行的能量消耗;
计算无人机在本地计算模式下的能量消耗以及无人机剩余能量,无人机在本地计算模式下的能量消耗包括飞行能耗和计算能耗;
计算无人机在卸载计算模式下的能量消耗以及无人机剩余能量,无人机在卸载计算模式下的能量消耗包括飞行能耗和通信能耗;
根据所求得的无人机在本地计算模式下的能量消耗和无人机在卸载计算模式下的能量消耗,以无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大化为目标函数,构建应急救援系统中的无人机能耗模型;
求解满足目标函数的最优的无人机计算任务卸载策略、系统通信时间分配,用于使无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大。
所述基于应急救援系统模型,计算无人机收集到的无线能量以及无人机飞行的能量消耗,具体包括:
基于同一时隙内无线信道增益不变,则第k个无人机对应第t时隙收集到的无线能量为:
Etk=ηPhtkωT
其中,η∈(0,1)为能量收集效率,P为WPT能量传输功率,htk表示在第t时隙AP与第k个无人机之间的信道增益,ω∈(0,1)表示无线能量传输时间占比;
无人机在整个时间块T内都需工作,则无人机的飞行能耗为:
Ef=PfT
其中,Pf为无人机的飞行功率,设所有无人机飞行功率相等。
优选的,所述计算无人机在本地计算模式下的能量消耗以及无人机剩余能量,无人机在本地计算模式下的能量消耗包括飞行能耗和计算能耗,具体包括:
当选择任务在本地计算时,计算能耗取决于无人机的计算能力,第i个无人机需计算的任务数据量大小为Bi,无人机处理器计算一个单位数据所需的CPU周期数为α,其大小由计算任务的性质决定,所以无人机i处理器的计算速度为:
Figure BDA0003982559490000031
其中,ti∈[0,T]表示第i个无人机本地计算时间,且fi≤fmax约束无人机处理器的计算能力;则第i个无人机对应第t时隙的计算能耗为:
Figure BDA0003982559490000032
其中ci表示无人机i处理器的计算能量效率系数;
为保证无人机的持续工作,则第i个无人机对应第t时隙的剩余能量为:
Figure BDA0003982559490000033
所述计算无人机在卸载计算模式下的能量消耗以及无人机剩余能量,无人机在卸载计算模式下的能量消耗包括飞行能耗和通信能耗,具体包括:
当选择任务卸载到MEC服务器计算时,计算能耗取决于无人机的卸载传输功率;在任意时隙所有无人机与WPT能量发射器采用OFDM方式通信,第j个无人机需卸载的任务数据量大小为Bj,根据香农公式,第j个无人机对应第t时隙的卸载传输功率为:
Figure BDA0003982559490000041
其中φ>1表示任务卸载过程中通信开销系数,σ表示通信信道内的高斯白噪声,B表示通信信道带宽,τj∈(0,1)表示第j个无人机卸载传输时间占比;则第j个无人机对应第t时隙的通信能耗为:
Figure BDA0003982559490000042
为保证无人机可持续工作,则第j个无人机对应第t时隙的剩余能量为:
Figure BDA0003982559490000043
所述根据所求得的无人机在本地计算模式下的能量消耗和无人机在卸载计算模式下的能量消耗,以无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大化为目标函数,构建应急救援系统中的无人机能耗模型,具体包括:
无人机对应第t时隙的卸载决策优化和通信时间分配问题建模为:
Figure BDA0003982559490000044
Figure BDA0003982559490000045
Figure BDA0003982559490000046
Figure BDA0003982559490000047
Figure BDA0003982559490000048
Figure BDA0003982559490000049
Figure BDA0003982559490000051
其中,C1、C2为TDMA协议下系统通信时间约束,C3为本地计算任务模式下计算时间约束和处理器计算能力约束,C4是本地计算任务模式下的无人机能耗约束,C5是卸载计算任务模式下的无人机能耗约束,C6为两种计算任务模式之间的互斥约束。
求解满足目标函数的最优的无人机计算任务卸载策略、系统通信时间分配,用于使无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大,具体包括:
每个时隙开始都需初始化无线信道增益,随机初始系统第t个时隙内的无线信道增益ht={ht1,ht2,…,htN},其中hti表示第t个时隙内第i个无人机与AP之间的无线信道增益,系统第t个时隙的卸载决策动作为at=at1,at2,…,atN},其中当ati=0表示第t时隙内第i个无人机选择本地计算任务模式,当ati=1表示第t时隙内第i个无人机选择卸载计算任务模式,据此构建系统第t时隙的状态空间和动作空间;
基于构建的系统第t时隙的状态空间和动作空间,采用深度强化学习中的TD3算法,以无人机的剩余能量最大化为目标函数,求解应急救援系统中的无人机能耗模型,获得系统第t时隙最优的计算任务卸载策略和系统通信时间分配。
所述基于构建的系统第t时隙的状态空间和动作空间,采用深度强化学习中的TD3算法,以无人机的剩余能量最大化为目标函数,求解应急救援系统中的无人机能耗模型,获得系统第t时隙最优的计算任务卸载策略和系统通信时间分配,具体执行操作为:
构建六个神经网络,六个神经网络分别是参数为φ的Actor网络、参数为θ1的Critic_1网络、参数为θ2的Critic_2网络、参数为φ'的Actor目标网络、参数为θ'1的Critic_1目标网络和参数为θ'2的Critic_2目标网络,初始化网络参数φ=φ'、θ1=θ'1、θ2=θ'2以及经验缓存区;
在第t时隙内,Actor网络根据输入系统当前状态st输出策略πφ(st)附加随机噪声ε选择行动at=πφ(st)+ε,所有无人机执行动作后得到奖励rt并进入系统下一个时隙状态st+1,同时将这一状态转移记录存储到经验缓存区中;
其中,系统第t时隙状态空间st、动作空间at以及奖励函数rt分别为:
st={ht1,ht2,…,htN}
基于当前系统状态空间可选择的动作空间为:
at={at1,at2,…,atN}
基于上述系统当前状态空间及动作空间,定义奖励函数rt为:
Figure BDA0003982559490000061
从第一个时隙开始,重复完成上述操作,直至经验缓存区被存满;
从经验缓存区随机抽取BN个样本,并记其中一个样本为{si,ai,ri,si+1},作为Actor网络和Critic网络的一个小批量训练数据;
为防止Q值被过度估计,在Actor目标网络输出πφ'(si+1)后添加随机噪声ε以鼓励探索,得到更精确的Q值,目标动作为:
Figure BDA0003982559490000062
基于双重网络的思想,目标动作值应为:
Figure BDA0003982559490000063
其中γ∈[0,1]为折扣因子;
根据策略πφ(si)得到Critic_1网络和Critic_2网络的Q值分别为
Figure BDA0003982559490000071
Figure BDA0003982559490000072
通过最小化损失函数对Critic_1网络和Critic_2网络进行梯度下降来更新网络参数θi:
Figure BDA0003982559490000073
在Critic_1网络和Critic_2网络每更新d次后,使用策略梯度函数更新Actor网络的参数φ:
Figure BDA0003982559490000074
其中πφ(si)为si输入到Actor网络生成的任务卸载策略;
采用延迟软更新方法定时更新Actor目标网络参数φ'、Critic_1目标网络参数θ'1和Critic_2目标网络参数θ'2
φ'=λφ+(1-λ)φ'
θ′i=λθi+(1-λ)θ′i;i=1,2
其中λ为软更新系数。
第二方面,提供了一种基于无线能量传输的无人机能耗优化系统,所述系统包括:
应急救援车;
MEC服务器,配有高速多核CPU;
无人机,遵循二进制计算卸载策略,即一个计算任务作为一个整体在所述无人机本地计算或全部卸载到所述MEC服务器计算;
WPT能量发射器,配备有稳定电源搭载在所述应急救援车上,与所述无人机通信连接,采用能量波束成形技术将能量无线传输给无人机。
第三方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行所述的方法中的任一方法。
第四方面,提供了一种计算设备,包括:
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。
(三)有益效果
本发明一种基于无线能量传输的无人机能耗优化方法与系统,采用WPT无人机执行应急救援任务,以最大化系统无人机的剩余能量为目标,采用深度强化学习中的TD3算法求解系统任务卸载决策方案,在降低无人机自身能耗的基础上,确保无人机在完成应急救援任务时剩余能量最大,大大延长了无人机的工作时间;其中考虑到地质灾害应急救援行动中的复杂因素设计采用WPT无人机辅助行动开展进行,提高了救援效率;设计了基于双延迟深度确定性策略梯度(TD3)的最大化无人机剩余能量算法(TD3-MURE)求解系统任务卸载决策方案,该方法适用于处理可变状态空间和高维数据,具有较强的学习能力和决策能力,保证了系统决策的准确性。
附图说明
图1为本发明方法流程图;
图2为本发明实施例中基于无线能量传输的无人机应急救援系统模型图;
图3为本发明实施例中基于无线能量传输的无人机应急救援系统时隙框架图;
图4为本发明实施例中用于求解无人机计算任务卸载策略以及通信时间分配的TD3示意图;
图5为本发明实施例的TD3-MURE算法收敛情况表现图;
图6为本发明实施例中不同算法在对应不同无人机数量下的所有无人机平均能量对比图。
具体实施方式
下面将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本发明实施例提供一种基于无线能量传输的无人机能耗优化方法,该方法包括:
步骤S1.基于AP与无人机的通信工作方式,构建由应急救援车和无人机组成的应急救援系统模型,其中,WPT使用能量发射器将能量传输给无人机,无人机可以将收集到的能量用于自身动力支持、本地计算任务或卸载计算任务。
具体应用中,所述步骤S1具体包括:
步骤S1-1.基于时分多址(TDMA)协议将系统时间划分为长度为T的无线信道互不干扰的连续时隙,时隙框架如图3所示,无人机任务卸载过程和无线能量传输过程在相同的频带中执行。其中MEC服务器配有高速多核CPU,有足够的计算资源,所以我们在此忽略了服务器计算任务时间和回传结果的时间;WPT能量发射器采用能量波束成形技术将能量无线传输给无人机,其中无线信道增益在同一时隙内保持不变,在不同时隙之间可能会有所改变。
步骤S1-2.D={1…N}表示N个无人机的集合且无人机遵循二进制计算卸载策略,决定计算任务在无人机本地计算或全部卸载到MEC服务器计算,其中Di=0表示任务在本地计算,Di=1表示任务卸载到MEC服务器计算。同时使用两个互斥集D0和D1分别表示在本地计算任务模式下和卸载计算任务模式下的无人机集合,D=D0∪D1。
步骤S2.基于上述系统模型,计算无人机在第t时隙收集到的无线能量以及在时间块T内无人机用于完成救援行动的飞行能耗。
具体应用中,所述步骤S2具体包括:
步骤S2-1.基于同一时隙内无线信道增益不变,则第k个无人机对应第t时隙收集到的无线能量为:
Etk=ηPhtkωT
其中η∈(0,1)为能量收集效率,P为WPT能量传输功率,htk表示在第t时隙AP与第k个无人机之间的信道增益,ω∈(0,1)表示无线能量传输时间占比。
步骤S2-2.无人机在整个时间块T内都需工作,所以无人机的飞行能耗为:
Ef=PfT
其中Pf为无人机的飞行功率,设所有无人机飞行功率相等。
步骤S3.在本地计算任务模式下,计算无人机在第t时隙的能量消耗以及剩余能量,所述能量消耗包括飞行能耗和计算能耗。
具体应用中,所述步骤S3具体包括:
步骤S3-1.当选择任务在本地计算时,计算能耗取决于无人机的计算能力,第i个无人机需计算的任务数据量大小为Bi,无人机处理器计算一个单位数据所需的CPU周期数为α,其大小由计算任务的性质决定,所以无人机i处理器的计算速度为:
Figure BDA0003982559490000101
其中ti∈[0,T]表示第i个无人机本地计算时间,且fi≤fmax约束无人机处理器的计算能力。则第i个无人机对应第t时隙的计算能耗为:
Figure BDA0003982559490000102
其中ci表示无人机i处理器的计算能量效率系数。
步骤S3-2.为保证无人机的持续工作,由步骤S3-1可得,则第i个无人机对应第t时隙的剩余能量为:
Figure BDA0003982559490000111
步骤S4.在卸载计算任务模式下,计算在第t时隙无人机的能量消耗以及剩余能量,所述能量消耗包括飞行能耗和通信能耗。
具体应用中,所述步骤S4具体包括:
步骤S4-1.当选择任务卸载到MEC服务器计算时,计算能耗取决于无人机的卸载传输功率。在任意时隙所有无人机与AP采用OFDM方式通信,第j个无人机需卸载的任务数据量大小为Bj,根据香农公式,第j个无人机对应第t时隙的卸载传输功率为:
Figure BDA0003982559490000112
其中φ>1表示任务卸载过程中通信开销系数,σ表示通信信道内的高斯白噪声,B表示通信信道带宽,τj∈(0,1)表示第j个无人机卸载传输时间占比。则第j个无人机对应第t时隙的通信能耗为:
Figure BDA0003982559490000113
步骤S4-2.为保证无人机可持续工作,由步骤S4-1可得,则第j个无人机对应第t时隙的剩余能量为:
Figure BDA0003982559490000114
步骤S5.基于上述求得的所有无人机剩余能量,以所有所述无人机的总剩余能量最大化为目标函数,则所有无人机对应第t时隙的卸载决策优化和通信时间分配问题建模为:
Figure BDA0003982559490000121
Figure BDA0003982559490000122
Figure BDA0003982559490000123
Figure BDA0003982559490000124
Figure BDA0003982559490000125
Figure BDA0003982559490000126
Figure BDA0003982559490000127
其中C1、C2为TDMA协议下系统通信时间约束,C3为本地计算任务模式下计算时间约束和处理器计算能力约束,C4是本地计算任务模式下的无人机能耗约束,C5是卸载计算任务模式下的无人机能耗约束,C6为两种计算任务模式之间的互斥约束。
步骤S6.基于上述能耗模型,采用深度强化学习中的TD3算法,请参阅图4,求解所述目标函数的最优的无人机的计算任务卸载策略和系统通信时间分配,从而使所有所述无人机的总剩余能量最大,工作时间更长。
具体应用中,所述步骤S6具体包括:
步骤S6-1.每个时隙开始都需初始化无线信道增益,随机初始系统第t个时隙内的无线信道增益ht={ht1,ht2,…,htN},其中hti表示第t个时隙内第i个无人机与AP之间的无线信道增益,系统第t个时隙的卸载决策动作为at={at1,at2,…,atN},其中当ati=0表示第t时隙内第i个无人机选择本地计算任务模式,当ati=1表示第t时隙内第i个无人机选择卸载计算任务模式。据此构建系统第t时隙的状态空间和动作空间。
步骤S6-2.基于第t时隙的状态空间和动作空间,采用深度强化学习中的TD3算法,以所有所述无人机的总剩余能量最大化为目标函数,求解所述能耗模型,获得系统第t时隙最优的计算任务卸载策略和系统通信时间分配。
关于上述步骤S6-2,具体执行如下操作:
步骤S6-2-1.构建六个神经网络,分别是参数为φ的Actor网络、参数为θ1的Critic_1网络、参数为θ2的Critic_2网络、参数为φ'的Actor目标网络、参数为θ'1的Critic_1目标网络和参数为θ'2的Critic_2目标网络,初始化网络参数φ=φ'、θ1=θ'1、θ2=θ'2以及经验缓存区。
步骤S6-2-2.在第t时隙内,Actor网络根据输入系统当前状态st输出策略πφ(st)附加随机噪声ε选择行动at=πφ(st)+ε,所有无人机执行动作后得到奖励rt并进入系统下一个时隙状态st+1,同时将这一状态转移记录存储到经验缓存区中;
其中,系统第t时隙状态空间st、动作空间at以及奖励函数rt分别如下所示:
st={ht1,ht2,…,htN}
基于当前系统状态空间可选择的动作空间为:
at={at1,at2,…,atN}
基于上述系统当前状态空间及动作空间,定义奖励函数rt为:
Figure BDA0003982559490000131
步骤S6-2-3.从第一个时隙开始,重复完成上述操作,直至经验缓存区被存满;
步骤S6-2-4.从经验缓存区随机抽取BN个样本,并记其中一个样本为{si,ai,ri,si+1},作为Actor网络和Critic网络的一个小批量训练数据。
步骤S6-2-5.为防止Q值被过度估计,在Actor目标网络输出πφ'(si+1)后添加随机噪声ε以鼓励探索,得到更精确的Q值。目标动作如下所示:
Figure BDA0003982559490000141
基于双重网络的思想,目标动作值应为:
Figure BDA0003982559490000142
其中γ∈[0,1]为折扣因子。
根据策略πφ(si)得到Critic_1网络和Critic_2网络的Q值分别为
Figure BDA0003982559490000143
Figure BDA0003982559490000144
通过最小化损失函数对Critic_1网络和Critic_2网络进行梯度下降来更新网络参数θi:
Figure BDA0003982559490000145
步骤S6-2-6.在Critic_1网络和Critic_2网络每更新d次后,使用策略梯度函数更新Actor网络的参数φ:
Figure BDA0003982559490000146
其中πφ(si)为si输入到Actor网络生成的任务卸载策略。
步骤S6-2-7.采用延迟软更新方法定时更新Actor目标网络参数φ'、Critic_1目标网络参数θ'1和Critic_2目标网络参数θ'2
φ'=λφ+(1-λ)φ'
θ′i=λθi+(1-λ)θ′i;i=1,2
其中λ为软更新系数。
将本发明所设计基于无线能量传输的无人机能耗优化方法,应用于实际当中,如图5所示是本发明所设计的TD3-MURE算法收敛情况,由于训练前期TD3-MURE的网络参数是随机初始化的,所以此时不能对系统状态进行准确评估,奖励值也呈现下降趋势,但是随着训练次数不断增加,任务卸载决策逐渐优化,奖励回报也快速上升至最高平均值,同时奖励回报值波动平缓起伏。从图5可以看出,本发明所设计的TD3-MURE算法大约在训练240次之后趋于收敛。
如图6所示,对比了不同算法在对应不同无人机数量下所有无人机平均剩余能量变化,其中算法包括TD3-MURE、DDPG、DQN和AC算法。随着无人机数量的增加,其所需计算或卸载的系统通信时间也随之增加,而无线能量传输时间则会相应减少,所以所有无人机的平均剩余能量呈现下降的趋势。相较于其他三种算法,本发明所设计的TD3-MURE算法表现最优。当无人机数量较少时,TD3-MURE和DDPG两种算法表现差距并不明显,但随着无人机数量的增加,两者差距逐渐明显,这是因为TD3-MURE引入了双重网络的思想有效地缓解了DDPG中Q值过高估计地问题;同时AC算法和DQN算法都略有波动,这是因为当样本输入到DNN训练时,DNN往往会输出更大的Q值,而TD3-MURE的Actor网络输出多维动作,保证了其收敛性和稳定性。
请参阅图2,一种基于无线能量传输的无人机能耗优化系统,所述系统包括:
应急救援车;
MEC服务器,配有高速多核CPU;
无人机,遵循二进制计算卸载策略,即一个计算任务作为一个整体在所述无人机本地计算或全部卸载到所述MEC服务器计算;
WPT能量发射器,配备有稳定电源搭载在所述应急救援车上,与所述无人机通信连接,采用能量波束成形技术将能量无线传输给无人机。
本申请的实施例可提供为方法或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种基于无线能量传输的无人机能耗优化方法,其特征在于,所述方法包括:
基于WPT能量发射器与无人机之间的通信方式构建应急救援系统模型;
基于应急救援系统模型,计算无人机收集到的无线能量以及无人机飞行的能量消耗;
计算无人机在本地计算模式下的能量消耗以及无人机剩余能量,无人机在本地计算模式下的能量消耗包括飞行能耗和计算能耗;
计算无人机在卸载计算模式下的能量消耗以及无人机剩余能量,无人机在卸载计算模式下的能量消耗包括飞行能耗和通信能耗;
根据所求得的无人机在本地计算模式下的能量消耗和无人机在卸载计算模式下的能量消耗,以无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大化为目标函数,构建应急救援系统中的无人机能耗模型;
求解满足目标函数的最优的无人机计算任务卸载策略、系统通信时间分配,用于使无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大。
2.根据权利要求1所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:所述基于应急救援系统模型,计算无人机收集到的无线能量以及无人机飞行的能量消耗,具体包括:
基于同一时隙内无线信道增益不变,则第k个无人机对应第t时隙收集到的无线能量为:
Etk=ηPhtkωT
其中,η∈(0,1)为能量收集效率,P为WPT能量传输功率,htk表示在第t时隙AP与第k个无人机之间的信道增益,ω∈(0,1)表示无线能量传输时间占比;
无人机在整个时间块T内都需工作,则无人机的飞行能耗为:
Ef=PfT
其中,Pf为无人机的飞行功率,设所有无人机飞行功率相等。
3.根据权利要求2所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:所述计算无人机在本地计算模式下的能量消耗以及无人机剩余能量,无人机在本地计算模式下的能量消耗包括飞行能耗和计算能耗,具体包括:
当选择任务在本地计算时,计算能耗取决于无人机的计算能力,第i个无人机需计算的任务数据量大小为Bi,无人机处理器计算一个单位数据所需的CPU周期数为α,其大小由计算任务的性质决定,所以无人机i处理器的计算速度为:
Figure FDA0003982559480000021
其中,ti∈[0,T]表示第i个无人机本地计算时间,且fi≤fmax约束无人机处理器的计算能力;则第i个无人机对应第t时隙的计算能耗为:
Figure FDA0003982559480000022
其中ci表示无人机i处理器的计算能量效率系数;
为保证无人机的持续工作,则第i个无人机对应第t时隙的剩余能量为:
Figure FDA0003982559480000023
4.根据权利要求3所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:所述计算无人机在卸载计算模式下的能量消耗以及无人机剩余能量,无人机在卸载计算模式下的能量消耗包括飞行能耗和通信能耗,具体包括:
当选择任务卸载到MEC服务器计算时,计算能耗取决于无人机的卸载传输功率;在任意时隙所有无人机与WPT能量发射器采用OFDM方式通信,第j个无人机需卸载的任务数据量大小为Bj,根据香农公式,第j个无人机对应第t时隙的卸载传输功率为:
Figure FDA0003982559480000031
其中φ>1表示任务卸载过程中通信开销系数,σ表示通信信道内的高斯白噪声,B表示通信信道带宽,τj∈(0,1)表示第j个无人机卸载传输时间占比;则第j个无人机对应第t时隙的通信能耗为:
Figure FDA0003982559480000032
为保证无人机可持续工作,则第j个无人机对应第t时隙的剩余能量为:
Figure FDA0003982559480000033
5.根据权利要求4所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:所述根据所求得的无人机在本地计算模式下的能量消耗和无人机在卸载计算模式下的能量消耗,以无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大化为目标函数,构建应急救援系统中的无人机能耗模型,具体包括:
无人机对应第t时隙的卸载决策优化和通信时间分配问题建模为:
Figure FDA0003982559480000034
Figure FDA0003982559480000035
Figure FDA0003982559480000036
Figure FDA0003982559480000037
Figure FDA0003982559480000041
Figure FDA0003982559480000042
Figure FDA0003982559480000043
其中,C1、C2为TDMA协议下系统通信时间约束,C3为本地计算任务模式下计算时间约束和处理器计算能力约束,C4是本地计算任务模式下的无人机能耗约束,C5是卸载计算任务模式下的无人机能耗约束,C6为两种计算任务模式之间的互斥约束。
6.根据权利要求5所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:求解满足目标函数的最优的无人机计算任务卸载策略、系统通信时间分配,用于使无人机在本地计算模式下的无人机剩余能量和无人机在卸载计算模式下的无人机剩余能量最大,具体包括:
每个时隙开始都初始化无线信道增益,随机初始系统第t个时隙内的无线信道增益ht={ht1,ht2,…,htN},其中hti表示第t个时隙内第i个无人机与AP之间的无线信道增益,系统第t个时隙的卸载决策动作为at={at1,at2,…,atN},其中当ati=0表示第t时隙内第i个无人机选择本地计算任务模式,当ati=1表示第t时隙内第i个无人机选择卸载计算任务模式,据此构建系统第t时隙的状态空间和动作空间;
基于构建的系统第t时隙的状态空间和动作空间,采用深度强化学习中的TD3算法,以无人机的剩余能量最大化为目标函数,求解应急救援系统中的无人机能耗模型,获得系统第t时隙最优的计算任务卸载策略和系统通信时间分配。
7.根据权利要求6所述的一种基于无线能量传输的无人机能耗优化方法,其特征在于:所述基于构建的系统第t时隙的状态空间和动作空间,采用深度强化学习中的TD3算法,以无人机的剩余能量最大化为目标函数,求解应急救援系统中的无人机能耗模型,获得系统第t时隙最优的计算任务卸载策略和系统通信时间分配,具体执行操作为:
构建六个神经网络,六个神经网络分别是参数为φ的Actor网络、参数为θ1的Critic_1网络、参数为θ2的Critic_2网络、参数为φ′的Actor目标网络、参数为θ′1的Critic_1目标网络和参数为θ′2的Critic_2目标网络,初始化网络参数φ=φ′、θ1=θ′1、θ2=θ′2以及经验缓存区;
在第t时隙内,Actor网络根据输入系统当前状态st输出策略πφ(st)附加随机噪声ε选择行动at=πφ(st)+ε,所有无人机执行动作后得到奖励rt并进入系统下一个时隙状态st+1,同时将这一状态转移记录存储到经验缓存区中;
其中,系统第t时隙状态空间st、动作空间at以及奖励函数rt分别为:
st={ht1,ht2,…,htN}
基于当前系统状态空间可选择的动作空间为:
at={at1,at2,…,atN}
基于上述系统当前状态空间及动作空间,定义奖励函数rt为:
Figure FDA0003982559480000051
从第一个时隙开始,重复完成上述操作,直至经验缓存区被存满;
从经验缓存区随机抽取BN个样本,并记其中一个样本为{si,ai,ri,Si+1},作为Actor网络和Critic网络的一个小批量训练数据;
为防止Q值被过度估计,在Actor目标网络输出πφ′(si+1)后添加随机噪声ε以鼓励探索,得到更精确的Q值,目标动作为:
Figure FDA0003982559480000052
基于双重网络的思想,目标动作值应为:
Figure FDA0003982559480000061
其中,γ∈[0,1]为折扣因子;
根据策略πφ(si)得到Critic_1网络和Critic_2网络的Q值分别为
Figure FDA0003982559480000062
Figure FDA0003982559480000063
通过最小化损失函数对Critic_1网络和Critic_2网络进行梯度下降来更新网络参数θi
Figure FDA0003982559480000064
在Critic_1网络和Critic_2网络每更新d次后,使用策略梯度函数更新Actor网络的参数φ:
Figure FDA0003982559480000065
其中,πφ(si)为si输入到Actor网络生成的任务卸载策略;
采用延迟软更新方法定时更新Actor目标网络参数φ′、Critic_1目标网络参数θ′1和Critic_2目标网络参数θ′2
φ′=λφ+(1-λ)φ′
θ′i=λθi+(1-λ)θ′i;i=1,2
其中,入为软更新系数。
8.一种基于无线能量传输的无人机能耗优化系统,其特征在于,所述系统包括:
应急救援车;
MEC服务器,配有高速多核CPU;
无人机,遵循二进制计算卸载策略,即一个计算任务作为一个整体在所述无人机本地计算或全部卸载到所述MEC服务器计算;
WPT能量发射器,配备有稳定电源搭载在所述应急救援车上,与所述无人机通信连接,采用能量波束成形技术将能量无线传输给无人机。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1-7所述的方法中的任一方法。
10.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述的方法中的任一方法的指令。
CN202211555066.8A 2022-12-06 2022-12-06 一种基于无线能量传输的无人机能耗优化方法与系统 Active CN116080407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211555066.8A CN116080407B (zh) 2022-12-06 2022-12-06 一种基于无线能量传输的无人机能耗优化方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211555066.8A CN116080407B (zh) 2022-12-06 2022-12-06 一种基于无线能量传输的无人机能耗优化方法与系统

Publications (2)

Publication Number Publication Date
CN116080407A true CN116080407A (zh) 2023-05-09
CN116080407B CN116080407B (zh) 2023-07-28

Family

ID=86212754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211555066.8A Active CN116080407B (zh) 2022-12-06 2022-12-06 一种基于无线能量传输的无人机能耗优化方法与系统

Country Status (1)

Country Link
CN (1) CN116080407B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117354759A (zh) * 2023-12-06 2024-01-05 吉林大学 一种多无人机辅助mec的任务卸载与充电调度联合优化方法
CN117580105A (zh) * 2024-01-15 2024-02-20 南京信息工程大学 一种面向电网巡检的无人机任务卸载优化方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180273171A1 (en) * 2017-03-20 2018-09-27 Riedel Communications International GmbH Aircraft, radio network, and method for transmitting information
CN110958619A (zh) * 2019-11-18 2020-04-03 北京邮电大学 一种基于无线能量传输的无人机辅助网络中资源分配方法
JP2021037818A (ja) * 2019-09-02 2021-03-11 富士通株式会社 制御装置および制御方法
CN114520768A (zh) * 2022-03-11 2022-05-20 南京信息工程大学 一种用于工业物联网中随机任务的ai卸载优化方法
CN114884230A (zh) * 2022-05-23 2022-08-09 浙江大学 一种基于事件触发控制的无人机悬停式无线充电装置
CN115171433A (zh) * 2022-07-06 2022-10-11 吉林大学 一种车雾辅助无人机灾后救援任务卸载方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180273171A1 (en) * 2017-03-20 2018-09-27 Riedel Communications International GmbH Aircraft, radio network, and method for transmitting information
JP2021037818A (ja) * 2019-09-02 2021-03-11 富士通株式会社 制御装置および制御方法
CN110958619A (zh) * 2019-11-18 2020-04-03 北京邮电大学 一种基于无线能量传输的无人机辅助网络中资源分配方法
CN114520768A (zh) * 2022-03-11 2022-05-20 南京信息工程大学 一种用于工业物联网中随机任务的ai卸载优化方法
CN114884230A (zh) * 2022-05-23 2022-08-09 浙江大学 一种基于事件触发控制的无人机悬停式无线充电装置
CN115171433A (zh) * 2022-07-06 2022-10-11 吉林大学 一种车雾辅助无人机灾后救援任务卸载方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117354759A (zh) * 2023-12-06 2024-01-05 吉林大学 一种多无人机辅助mec的任务卸载与充电调度联合优化方法
CN117354759B (zh) * 2023-12-06 2024-03-19 吉林大学 一种多无人机辅助mec的任务卸载与充电调度联合优化方法
CN117580105A (zh) * 2024-01-15 2024-02-20 南京信息工程大学 一种面向电网巡检的无人机任务卸载优化方法
CN117580105B (zh) * 2024-01-15 2024-04-19 南京信息工程大学 一种面向电网巡检的无人机任务卸载优化方法

Also Published As

Publication number Publication date
CN116080407B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN116080407B (zh) 一种基于无线能量传输的无人机能耗优化方法与系统
CN113543176B (zh) 基于智能反射面辅助的移动边缘计算系统的卸载决策方法
CN111160525B (zh) 一种边缘计算环境下基于无人机群的任务卸载智能决策方法
CN112598150B (zh) 一种在智能电厂中基于联邦学习提升火灾检测效果的方法
CN113132943B (zh) 一种车联网中车边协同的任务卸载调度及资源分配方法
CN110968426B (zh) 一种基于在线学习的边云协同k均值聚类的模型优化方法
Liang et al. A deep q learning network for traffic lights’ cycle control in vehicular networks
CN114285853B (zh) 设备密集型工业物联网中基于端边云协同的任务卸载方法
Yang et al. Deep reinforcement learning based wireless network optimization: A comparative study
CN111198550A (zh) 基于案例推理的云端智能生产优化调度在线决策方法及系统
CN110531996A (zh) 一种多微云环境下基于粒子群优化的计算任务卸载方法
CN115665869A (zh) 基于边缘计算和有向无环图的多用户协作平台及其方法
Chen et al. An intelligent task offloading algorithm (iTOA) for UAV network
CN114936708A (zh) 基于边云协同任务卸载的故障诊断优化方法及电子设备
CN115408072A (zh) 基于深度强化学习的快速适应模型构建方法及相关装置
CN113516163B (zh) 基于网络剪枝的车辆分类模型压缩方法、装置及存储介质
Qu et al. Stochastic cumulative DNN inference with RL-aided adaptive IoT device-edge collaboration
CN113382066A (zh) 基于联邦边缘平台的车辆用户选择方法及系统
CN110705756B (zh) 一种基于输入凸神经网络的电力能耗优化控制方法
CN117436485A (zh) 基于权衡时延和精度的多退出点的端-边-云协同系统及方法
CN117156492A (zh) 一种基于深度强化学习的联合服务缓存、通信与计算的双时间尺度资源分配方法
CN113157344B (zh) 移动边缘计算环境下基于drl的能耗感知任务卸载方法
CN113391908B (zh) 一种车载边缘计算中针对时延优化的推理任务调度方法
CN116319959A (zh) 一种协同服务平台中的服务组合优化方法
CN114916013A (zh) 基于车辆轨迹预测的边缘任务卸载时延优化方法、系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant