CN115454527A - 一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 - Google Patents
一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 Download PDFInfo
- Publication number
- CN115454527A CN115454527A CN202211119514.XA CN202211119514A CN115454527A CN 115454527 A CN115454527 A CN 115454527A CN 202211119514 A CN202211119514 A CN 202211119514A CN 115454527 A CN115454527 A CN 115454527A
- Authority
- CN
- China
- Prior art keywords
- unmanned aerial
- aerial vehicle
- user terminal
- unloading
- calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 25
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 title claims description 18
- 238000005265 energy consumption Methods 0.000 claims abstract description 31
- 238000004088 simulation Methods 0.000 claims abstract description 17
- 238000005457 optimization Methods 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 2
- 239000000872 buffer Substances 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44594—Unloading
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45504—Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
- G06F9/45508—Runtime interpretation or emulation, e g. emulator loops, bytecode interpretation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请公开了一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统,其中多无人机移动边缘计算的飞行控制与计算卸载方法具体包括以下步骤:获取初始信息;根据获取的初始信息,进行求解模型的构建;求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例;执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。本申请提出了适合多无人机辅助MEC系统的状态空间、动作空间和奖励函数。得到了每个时隙内无人机应采取的飞行动作与计算任务的卸载决策和卸载比例,最小化了系统总代价。
Description
技术领域
本申请涉及移动通信领域,具体地,涉及一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统。
背景技术
移动通信网络和移动物联网的迅速发展促进了智能用户终端的空前增长,也为许多新型智能应用程序提供了强有力的平台。各种新型应用应运而生,例如人脸识别,虚拟现实游戏,远程医疗等。然而这些应用都是计算密集型和延迟敏感型的,通常需要较高的计算能力。用户有限的电池能源和较低的计算容量使得其很难处理这些应用。为了解决这个冲突,移动边缘计算(Mobile edge computing,MEC)逐渐被重视。相对于云计算,移动边缘计算服务器部署在基于基础设施的移动通信网络的边缘,能够为用户提供任务卸载的服务,提升用户体验。然而部署在地面移动通信网络的移动边缘计算系统受限于固定的位置部署,缺少足够的灵活性,特别是对野外环境、应急救灾、军事领域等基础设施受限的场景,无法快速灵活的部署。因此,灵活并且低成本的部署在无人机通信网络的移动边缘计算系统被提出,即无人机移动边缘计算系统,适用于多种应用场景。
关于无人机移动边缘计算系统,已有方案大多考虑单无人机部署情况。然而,在支持虚拟现实旅游的园区或者大型智慧工厂等场景中,需要部署多个无人机实现更大范围的网络覆盖与计算服务保证。在多无人机移动边缘计算系统中,较多的方案给出了最小化无人机能耗的方法。然而,在野外环境、应急救灾、军事领域等典型无人机移动边缘计算系统应用场景中,移动终端也面临供电受限的难题,移动终端的能耗也至关重要。与此同时,上述典型应用场景中对计算任务完成时间有着严格的要求。
因此,如何提供一种通过合理规划无人机轨迹、制定计算卸载决策实现大幅降低系统能耗与计算任务完成时延的方法,是本领域技术人员急需解决的问题。
发明内容
本发明给出了一种多无人机移动边缘的飞行控制与计算卸载方法,减小了系统能耗与计算任务的完成总时间。将系统能耗与计算任务完成总时间加权定义为系统总代价,通过联合优化无人机的飞行轨迹、计算任务的卸载决策以及卸载比例,最小化系统总代价。
为了达到上述目的,本申请提供了一种多无人机移动边缘计算的飞行控制与计算卸载方法,具体包括以下步骤:获取初始信息;根据获取的初始信息,进行求解模型的构建;求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例;执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。
如上的,其中,获取初始信息包括,获取服务区域内的用户终端数量与位置,获取初始化的无人机数量,以及利用前馈神经网络根据获取的用户终端数量与位置进行所有用户终端下一个飞行周期的计算任务量的预测。
如上的,其中,根据获取的初始信息,进行求解模型的构建具体包括以下子步骤:构建信道模型;响应于完成信道模型的构建,根据获取的初始信息进行求解模型的构建。
如上的,其中,定义用户终端集合为无人机集合为无人机m在第n个时隙的水平位置坐标为Lm,n=[xm,n,ym,n],则构建信道模型包括:确定路径损耗和可视为视距链路的概率根据路径损耗和可视为视距链路的概率确定无线信道增益。
其中用户终端的位置坐标表示为ws=[xs,ys]。无人机m在第n个时隙的水平位置坐标为Lm,n=[xm,n,ym,n],表示地面用户终端s与无人机m在第个n时隙之间的水平距离,fc为载波频率,do=max{294.05log10H-432.94,18},p1=233.98log10H-0.95。
如上的,其中,地面用户终端s与无人机m在第个n时隙之间的无线信道增益gs,m,n表示为:
如上的,其中,决策模型的构建包括:定义无人机与用户终端间的通信频带带宽为W,不同的无人机使用不同的频带,因此无人机之间不存在干扰。因此,在第个n时隙,地面用户终端s向无人机m卸载任务的速率rs,m,n表示为:
其中,Bs,m,n为无人机m在时隙n分配给用户终端s的带宽,Ps为用户终端s的发射功率,σ2为噪声功率。
如上的,其中,决策模型的构建还包括:定义卸载决策变量zs,m,n,利用zs,m,n=1代表第s个用户终端在时隙n选择的执行计算任务的设备m,当m=0时表示选择自身终端为计算设备,即不卸载,当m≠0时表示计算任务卸载到无人机m。计算任务卸载的设备集合定义为另外定义变量ρs,m,n∈[0,1]来表示用户终端s向无人机m卸载任务的比例;当m=0时,ρs,m,n=0。
如上的,其中,求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例,具体包括以下子步骤:初始化新演员网络、旧演员网络以及评论家网络参数;响应于初始化演员网络和评论家网络参数,判断是否达到最大循环次数;若达到最大循环次数,则直接结束,输出新演员网络、旧演员网络以及评论家网络对应的网络参数,得到最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
一种用于上述任一项所述方法的多无人机移动边缘计算的飞行控制与计算卸载系统,具体包括:信息获取模块、优化问题建模模块、仿真求解和实际执行模块;信息获取模块,用于获取初始信息;优化问题建模模块,用于根据获取的初始信息,进行求解模型的构建;仿真求解模块,用于求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例;实际执行模块,用于执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。
本申请具有以下有益效果:
本申请基于深度强化学习算法,本申请提出了适合多无人机辅助MEC系统的状态空间、动作空间和奖励函数。得到了每个时隙内无人机应采取的飞行动作(飞行速率和角度)与计算任务的卸载决策和卸载比例,最小化了系统总代价(系统能耗和时延)。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例提供的多无人机移动边缘计算的飞行控制与计算卸载系统的模型图。
图2是根据本申请实施例提供的多无人机移动边缘计算的飞行控制与计算卸载系统的内部结构图;
图3是根据本申请实施例提供的多无人机移动边缘计算的飞行控制与计算卸载的方法的流程图;
图4是根据本申请实施例提供的多无人机移动边缘计算的飞行控制与计算卸载的方法的又一流程图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在多无人机辅助边缘计算的蜂窝网络中,基站首先根据实际场景收集用户终端的数量与位置信息,并根据无人机回传的用户终端的实际计算任务量预测未来短期内的计算任务量。根据预测数据,训练算法模型。待训练完成,通过模型计算每个时隙内无人机的最优轨迹和计算卸载策略,继而得出通信带宽资源分配比例和无人机算力资源分配比例。最终基站将数据发送至无人机实际执行,为地面用户终端提供服务。
场景假设:
首先,考虑一个包含S个地面用户终端和M个无人机辅助的MEC系统,系统模型图如图1所示。用户终端集合和无人机集合分别定义为和设定每个无人机的飞行周期为T,将整个飞行周期离散化,共分为N个时隙。用户终端的位置坐标表示为ws=[xs,ys]。无人机m在第n个时隙的水平位置坐标为Lm,n=[xm,n,ym,n],则地面用户终端s与无人机m在第个n时隙之间的水平距离为将多无人机执行任务的范围表示为一个面积为xmax×ymax的服务区域,其中xmax,ymax分别代表该飞行任务区域的长和宽的大小。将无人机m和m′之间的距离定义为Rm,m′,n,并引入最小安全距离Rmin,即Rm,m′,n≥Rmin。假设无线信道为准静态信道,即信道条件在单个时隙内保持不变,并且上下行链路使用不同的频带。考虑到不同地形的限制,设定无人机与用户终端之间的路径损耗由视距(line-of-sight,LoS)链路和非视距(non-line-of-sight,NLoS)链路的概率决定。
实施例一
如图2所示,是本申请实施例提供的一种多无人机移动边缘的飞行控制与计算卸载系统,包括地面基站和无人机,以及设置在地面基站和无人机中的各模块,其中各模块具体为信息获取模块210、优化问题建模模块220、仿真求解230和实际执行模块240。
优化问题建模模块与仿真求解模块部署在地面基站中,信息获取模块与实际执行模块同时存在于地面基站和无人机中。地面基站利用获取的信息与存储的算法进行离线训练,无人机接收基站计算的结果在线执行。
在规划好服务区域后,地面基站中的信息获取模块210首先获取服务区域内的用户终端数量与位置,然后利用前馈神经网络预测所有用户终端下一个飞行周期的计算任务量,初始化无人机数量,并将上述获取到的所有信息输出至优化问题建模模块220。
优化问题建模模块220接收信息获取模块210的信息后,根据用户终端位置坐标、无人机位置坐标确定无线信道增益,根据无线信道增益构建信道模型;并根据用户终端位置坐标、无人机位置坐标、上述预测所有用户终端下一飞行周期的计算任务量,以及信道模型进行决策与计算模型的构建,将决策与计算模型作为能求解能耗时延问题的求解模型,将求解模型输出至仿真求解模块230。
在完成信道模型、决策与计算模型构造后,仿真求解模块230进行仿真,求解出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例,并将所得解输出至实际执行模块240。
地面基站的实际执行模块240将最佳飞行轨迹,用户终端的卸载决策和计算任务卸载比例等数据发送给无人机的实际执行模块240,无人机按照数据采取对应动作,为地面用户终端提供服务,并且利用无人机中的信息获取模块210收集用户终端的当前飞行周期的实际计算任务量,为地面基站中的信息获取模块210预测用户终端下一个飞行周期的计算任务量提供训练数据。
实施例二
如图3所示,是本申请实施例提供的一种多无人机移动边缘计算系统的飞行控制与计算卸载方法,具体包括以下子步骤:
步骤S310:获取初始信息。
具体地,获取初始信息包括,获取服务区域内的用户终端数量与位置,获取初始化的无人机数量,以及利用前馈神经网络根据获取的用户终端数量与位置进行所有用户终端下一个飞行周期的计算任务量的预测。
步骤S320:根据获取的初始信息,进行求解模型的构建。
其中步骤S320具体包括以下子步骤:
步骤S3201:构建信道模型。
根据用户终端位置坐标、无人机位置坐标确定无线信道增益,无线信道增益确定后即构建完成信道模型。
其中,H为无人机飞行高度,fc为载波频率,do=max{294.05log10H-432.94,18},p1=233.98log10H-0.95。
因此,地面用户终端s与无人机m在第个n时隙之间的无线信道增益表示为:
步骤S3202:响应于完成信道模型的构建,根据获取的初始信息进行求解模型的构建。
具体地,根据用户终端位置坐标、无人机位置坐标、预测所有用户终端未来短时间的计算任务量和信道模型构建决策模型与计算模型,决策模型与计算模型构成求解模型。
其中构建决策模型包括:定义卸载决策变量zs,m,n,利用zs,m,n=1代表第s个用户终端在时隙n选择的执行计算任务的设备m,当m=0时表示选择自身终端为计算设备,即不卸载,当m≠0时表示计算任务卸载到无人机m。计算任务卸载的设备集合定义为另外定义变量ρs,m,n∈[0,1]来表示用户终端s向无人机m卸载任务的比例。显然,当m=0时,ρs,m,n=0。设定每个用户终端在单个时隙内最多将任务卸载给一个无人机,因此存在如下约束,完成决策模型的构建:
响应于完成决策模型和信道模型的构建,定义无人机与用户终端间的通信频带带宽为W,不同的无人机使用不同的频带,因此无人机之间不存在干扰。因此,在第个n时隙,地面用户终端s向无人机m卸载任务的速率rs,m,n表示为:
其中,Bs,m,n为无人机m在时隙n分配给用户终端s的带宽,Ps为用户终端s的发射功率,σ2为噪声功率。
其中fs表示用户终端s的算力,单位为周期数/秒,一般为微型计算处理器频率。
卸载到一个无人机的多个地面终端的计算任务将由无人机计算处理器创建的多个虚拟机并行计算。由于在同一个物理计算处理器中共享公共计算资源而存在相互干扰,因此在多计算任务并行处理时,在时隙n用户终端s向无人机m卸载的计算任务的预期计算完成时间表示为:
每个用户终端因为计算任务量不同而导致预期计算完成时间也不同。无人机在为用户终端完成边缘计算的服务后,就会立即移除虚拟机,释放计算资源。因此,在单个时隙内,无人机m实际上存在的虚拟机数量c在不断变化,即随时间增加而减少。首先定义一个集合对其中每个元素进行升序排列,定义排序后的集合为并额外定义因此在时隙n,用户终端s向无人机m卸载的计算任务实际计算完成时间表示为:
设定在时隙n,用户终端s的计算任务必须在最大限制时间tmax内完成,则存在如下约束:
其中,φm为无人机的有效开关电容。
至此完成计算机模型的构建。
进一步地,将地面用户终端的本地计算能耗和卸载通信能耗、无人机的计算能耗、无人机的飞行能耗以及计算任务完成总时间联合考虑,定义系统总代价为其加权和。特别的,对于计算任务完成总时间,不必将其降到最低,只需保证不超过最大限制时间。通过合理规划无人机的飞行速率和飞行角度,用户终端的卸载策略(卸载决策和卸载比例),将系统总代价降到最低。
其中联合优化问题形式如下:
步骤S330:求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
基于现有技术中的近端策略优化算法,提出了一种计算任务卸载和无人机轨迹控制联合优化方法,以得到最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
其中近端策略优化算法主要由多个循环构成。首先定义演员网络(新演员网络和旧演员网络)和评论家网络,并完成初始化(两个演员网络初始化参数相同)。然后设置训练的最大回合数,并完成智能体状态和经验缓冲区的初始化。待所有初始化完成,将进入单个回合训练,以时间步长为单位,其中时间步长大小等于单个时隙长度。智能体通过新演员网络得到每个状态下应采取的动作分布,并采样得到实际动作。然后将动作输入至环境中,得到奖励并进入下一状态,将状态、动作、奖励对存入缓冲区中,循环往复。若出现违规操作,则直接进入下一回合训练。若出现违规操作,则直接进入下一回合训练。否则当时间步长达到所设批次大小或者最后一步,首先将新演员网络参数同步给旧演员网络,再利用评论家网络预测出的状态价值,回溯缓冲区内存储的状态价值:
其中,Gi为经验缓冲区内第i个状态的价值,γ为衰减因子,一般设置为0.9-1,rj+1为第j+1个时间步长获得的奖励,en+1为第n+1个状态,Q(·|θQ)为评论家网络。当n=N时,Q(en+1|θQ)=0。
其中定义无人机m与m′发生碰撞即Rm,m′,n<Rmin或者无人机m超出飞行任务区域即xm,n>xmax或者ym,n>ymax为违规操作。
其中在每个时间步长内,状态,动作和奖励定义如下:
定义动作空间为分别代表无人机m在时隙n采取的飞行角度和飞行速率(即无人机轨迹),用户终端s在时隙n选择的计算任务卸载决策和卸载比例。在处理卸载决策这一部分时,我们利用示性函数将离散的决策连续化,以便于神经网络处理,如下:
定义智能体在每个时间步长中获得的奖励rn为:
其中,ξ为防止无人机出现违规操作引入的惩罚项。当未出现违规操作时,设定每个时隙获得的近似平均奖励为即若-rn的数量级为k,则当任意无人机发生碰撞或者超出飞行任务区域时,且以此纠正其错误动作,并且结束该回合。
如图4所示,整体算法具体包括以下子步骤:
步骤S3401:初始化演员网络和评论家网络参数。
其中演员网络包括新演员网络和旧演员网络,两个演员网络初始化参数相同。
其中演员网络和评论家网络为近端策略优化算法中提供的网络,演员网络和评论家网络也是近端策略优化算法中常用的参数,具体在此不进行赘述。
步骤S3402:响应于初始化演员网络和评论家网络参数,判断是否达到最大循环次数。
其中最大循环次数为预先设置的训练的最大回合数。
若达到最大循环次数,则直接结束,输出新演员网络、旧演员网络以及评论家网络对应的网络参数,得到最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
若未达到最大循环次数,则执行步骤S1403。
步骤S3403:进行智能体状态和经验缓冲区的初始化。
其中智能体和经验缓冲区为算法中包含的,具体含义在此不进行赘述。
步骤S3404:响应于完成智能体状态和经验缓冲区的初始化,判断是否超过最大步长或者行动是否结束。
若超过最大步长或者行动结束,返回执行步骤S3402,否则执行步骤S3405。
步骤S3405:根据演员网络采样得到动作。
步骤S3406:响应于采样得到动作,执行动作,得到奖励并进入下一装状态。
步骤S3407:将得到的状态、动作以及奖励存入经验缓冲区。
步骤S3408:响应于将得到的状态、动作以及奖励存入经验缓冲区,判断是否存满一个批次大小或者是否达到最大步长。
若存满一个批次大小或者达到了最大步长,则执行步骤S3409。反之则执行步骤S3404。
步骤S3409:更新旧演员网络参数。
步骤S3410:响应于更新旧演员网络参数,指定次数的更新新演员网络参数和评论家网络参数。
其中指定次数为预先设定的次数,具体可根据实际情况调整,具体数值在此不进行限定。
其中,Bt为批次大小。
其中,ε为裁剪比例,clip表示当pi/p′i小于1-ε时输出1-ε,大于1+ε时输出1+ε,位于两者之间不做处理。
其中Gi的计算方式参考公式19。
步骤S3411:响应于更新新演员网络参数和评论家网络参数,清空经验缓冲区,并返回执行步骤S3404。
其中直至达到最大循环次数,输出演员网络采样得到的动作,即得到最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
步骤S340:执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。
将最佳飞行轨迹,用户终端的卸载决策和计算任务卸载比例等数据发送给无人机的实际执行模块,无人机按照数据采取对应动作,为地面用户终端提供服务。
进一步地,利用无人机中的信息获取单元收集用户终端的当前飞行周期的实际计算任务量,为基站中的信息获取单元预测用户终端下一个飞行周期的计算任务量提供训练数据。
本申请具有以下有益效果:
本申请基于深度强化学习算法,本申请提出了适合多无人机辅助MEC系统的状态空间、动作空间和奖励函数。得到了每个时隙内无人机应采取的飞行动作(飞行速率和角度)与计算任务的卸载决策和卸载比例,最小化了系统总代价(系统能耗和时延)。
虽然当前申请参考的示例被描述,其只是为了解释的目的而不是对本申请的限制,对实施方式的改变,增加和/或删除可以被做出而不脱离本申请的范围。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种多无人机移动边缘计算的飞行控制与计算卸载方法,其特征在于,具体包括以下步骤:
获取初始信息;
根据获取的初始信息,进行求解模型的构建;
求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例;
执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。
2.如权利要求1所述的多无人机移动边缘计算的飞行控制与计算卸载方法,其特征在于,获取初始信息包括,获取服务区域内的用户终端数量与位置,获取初始化的无人机数量,以及利用前馈神经网络根据获取的用户终端数量与位置进行所有用户终端下一个飞行周期的计算任务量的预测。
3.如权利要求2所述的多无人机移动边缘计算的飞行控制与计算卸载方法,其特征在于,根据获取的初始信息,进行求解模型的构建具体包括以下子步骤:
构建信道模型;
响应于完成信道模型的构建,根据获取的初始信息进行求解模型的构建。
9.如权利要求7所述的多无人机移动边缘计算的飞行控制与计算卸载方法,其特征在于,求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例,具体包括以下子步骤:
初始化新演员网络、旧演员网络以及评论家网络参数;
响应于初始化演员网络和评论家网络参数,判断是否达到最大循环次数;
若达到最大循环次数,则直接结束,输出新演员网络、旧演员网络以及评论家网络对应的网络参数,得到最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例。
10.一种用于执行权利要求1-9任一项所述的多无人机移动边缘计算的飞行控制与计算卸载方法的多无人机移动边缘计算的飞行控制与计算卸载系统,其特征在于,具体包括:信息获取模块、优化问题建模模块、仿真求解和实际执行模块;
信息获取模块,用于获取初始信息;
优化问题建模模块,用于根据获取的初始信息,进行求解模型的构建;
仿真求解模块,用于求解模型进行能耗时延问题的仿真求解,得出最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例;
实际执行模块,用于执行与最佳的无人机轨迹以及用户终端的卸载决策和计算任务卸载比例对应的动作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211119514.XA CN115454527A (zh) | 2022-09-14 | 2022-09-14 | 一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211119514.XA CN115454527A (zh) | 2022-09-14 | 2022-09-14 | 一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115454527A true CN115454527A (zh) | 2022-12-09 |
Family
ID=84302275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211119514.XA Pending CN115454527A (zh) | 2022-09-14 | 2022-09-14 | 一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115454527A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116546559A (zh) * | 2023-07-05 | 2023-08-04 | 南京航空航天大学 | 分布式多目标空地联合轨迹规划和卸载调度方法及系统 |
CN117220762A (zh) * | 2023-11-09 | 2023-12-12 | 天津云圣智能科技有限责任公司 | 一种多链路数据传输的方法、系统、存储介质及电子设备 |
CN117580105A (zh) * | 2024-01-15 | 2024-02-20 | 南京信息工程大学 | 一种面向电网巡检的无人机任务卸载优化方法 |
-
2022
- 2022-09-14 CN CN202211119514.XA patent/CN115454527A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116546559A (zh) * | 2023-07-05 | 2023-08-04 | 南京航空航天大学 | 分布式多目标空地联合轨迹规划和卸载调度方法及系统 |
CN116546559B (zh) * | 2023-07-05 | 2023-10-03 | 南京航空航天大学 | 分布式多目标空地联合轨迹规划和卸载调度方法及系统 |
US11961409B1 (en) | 2023-07-05 | 2024-04-16 | Nanjing University Of Aeronautics And Astronautics | Air-ground joint trajectory planning and offloading scheduling method and system for distributed multiple objectives |
CN117220762A (zh) * | 2023-11-09 | 2023-12-12 | 天津云圣智能科技有限责任公司 | 一种多链路数据传输的方法、系统、存储介质及电子设备 |
CN117220762B (zh) * | 2023-11-09 | 2024-01-26 | 天津云圣智能科技有限责任公司 | 一种多链路数据传输的方法、系统、存储介质及电子设备 |
CN117580105A (zh) * | 2024-01-15 | 2024-02-20 | 南京信息工程大学 | 一种面向电网巡检的无人机任务卸载优化方法 |
CN117580105B (zh) * | 2024-01-15 | 2024-04-19 | 南京信息工程大学 | 一种面向电网巡检的无人机任务卸载优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113709201B (zh) | 计算卸载的方法和通信装置 | |
CN112351503B (zh) | 基于任务预测的多无人机辅助边缘计算资源分配方法 | |
CN113346944B (zh) | 空天地一体化网络中时延最小化计算任务卸载方法及系统 | |
CN115454527A (zh) | 一种多无人机移动边缘计算的飞行控制与计算卸载方法及系统 | |
Faraci et al. | Fog in the clouds: UAVs to provide edge computing to IoT devices | |
CN113543074B (zh) | 一种基于车路云协同的联合计算迁移和资源分配方法 | |
CN114286413B (zh) | Tsn网络联合路由选择与流分配方法及相关设备 | |
CN113395654A (zh) | 一种边缘计算系统的多无人机任务卸载和资源分配的方法 | |
Lee et al. | Online optimization for UAV-assisted distributed fog computing in smart factories of industry 4.0 | |
CN113254188B (zh) | 调度优化方法和装置、电子设备及存储介质 | |
CN115633320B (zh) | 多无人机辅助的数据采集与回传方法、系统、设备及介质 | |
CN113391824A (zh) | 计算卸载方法、电子设备、存储介质以及计算机程序产品 | |
Shah et al. | Mobile edge computing (MEC)-enabled UAV placement and computation efficiency maximization in disaster scenario | |
Parvaresh et al. | A continuous actor–critic deep Q-learning-enabled deployment of UAV base stations: Toward 6G small cells in the skies of smart cities | |
Wang et al. | Digital twin-enabled computation offloading in UAV-assisted MEC emergency networks | |
Chen et al. | Multi-UAV cooperation based edge computing offloading in emergency communication networks | |
Wang et al. | Learning and batch-processing based coded computation with mobility awareness for networked airborne computing | |
CN116208968B (zh) | 基于联邦学习的轨迹规划方法及装置 | |
Tekin et al. | An experts learning approach to mobile service offloading | |
CN115988543A (zh) | 一种基于数字孪生的无人机数能计算联合资源分配方法 | |
Wang et al. | Multi-agent reinforcement learning based coded computation for mobile ad hoc computing | |
Xu et al. | Joint computing offloading and trajectory for multi-UAV enabled MEC systems | |
Yang et al. | Trajectory and offloading policy optimization in age-of-information-aware UAV-assisted MEC systems | |
Zhang et al. | Joint optimal placement and dynamic resource allocation for multi-uav enhanced reconfigurable intelligent surface assisted wireless network | |
CN117835418B (zh) | 基于蜂窝网联无人机的空地协同监控资源分配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |