CN114372612B - 面向无人机移动边缘计算场景的路径规划和任务卸载方法 - Google Patents
面向无人机移动边缘计算场景的路径规划和任务卸载方法 Download PDFInfo
- Publication number
- CN114372612B CN114372612B CN202111544236.8A CN202111544236A CN114372612B CN 114372612 B CN114372612 B CN 114372612B CN 202111544236 A CN202111544236 A CN 202111544236A CN 114372612 B CN114372612 B CN 114372612B
- Authority
- CN
- China
- Prior art keywords
- unmanned aerial
- aerial vehicle
- task
- network
- path planning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44594—Unloading
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了面向无人机移动边缘计算场景的路径规划和任务卸载方法,涉及移动边缘计算和深度学习领域,包括S1建立网络场景模型;S2无人机和地面终端信息导入网络场景模型;S3建立深度强化学习网络并初始化;S4求解最优飞行时隙;S5初始化无人机移动边缘计算场景状态;S6执行行为;S7判断飞行是否越界,若是则惩罚、停止飞行并更新状态;S8保存行为、奖励、当前及下一刻状态至样本;S9重复S6至S8;S10计算目标值,更新网络参数;S11重复S4至S10,获得路径规划和任务卸载方法;设计基于深度增强学习的框架,实现深度增强学习和凸优化技术在计算复杂度和计算精度上的权衡与互补,最小化无人机能耗和终端任务完成时间,提升无人机执行地面终端任务能效。
Description
技术领域
本发明涉及移动边缘计算和深度学习领域,尤其涉及面向无人机移动边缘计算场景的路径规划和任务卸载方法。
背景技术
由无人机提供支持的无线通信是近些年研究的热点,无人机的高灵活性和机动性,使得其辅助的无线网络可以被快速部署。无人机还可以部署在无线网络中作为移动边缘计算服务器,以执行从地面终端卸载的任务,从而地面终端的计算能力和电池寿命可以得到有效的提升。启用无人机的移动边缘计算实际上也可以进行缓存,即将最频繁卸载的任务预存储在本地内存中,以避免在任务卸载期间地面终端向无人机传输冗余数据。
尽管有这些优点,但有三个尚未解决的技术问题阻碍了无人机移动边缘计算有效完成地面终端任务。首先,应在三维环境中正确设计无人机的航迹,以确保每个地面终端都能通过短距离上行链路传输卸载数据。然而,由于地面终端和无人机之间的无线链路受到无人机移动的影响,其轨迹的设计很难实现。其次,应控制无人机飞行时间,使无人机的总体推进能量最小化,同时具有较高的系统能效。鉴于旋翼无人机的推进能量受到多种因素的影响,需要考虑各因素的协同与相互影响。第三,受无人机和地面终端限制链路的影响,部署任务卸载策略,以确保每个地面终端在低延迟下由无人机或地面终端完成任务是很困难的。通常,这三个问题在无人机移动边缘计算系统中相互影响,如何解决联合优化问题,以便于提升无人机执行地面终端任务能效尤为重要。
发明内容
本发明的目的在于为了解决上述问题,设计了一种最小化无人机能耗和任务完成时间的,基于深度强化学习的三维路径规划和任务卸载方法。
本发明通过以下技术方案来实现上述目的:
面向无人机移动边缘计算场景的路径规划和任务卸载方法,其特征在于,包括以下步骤:
S1、建立无人机移动边缘计算的网络场景模型;
S2、收集当前区域内的无人机和地面终端信息,并导入网络场景模型;
S3、建立深度强化学习网络,初始化初始及目标网络参数;
S4、给定无人机飞行路径和地面终端任务卸载信息,利用凸优化方法求解无人机最优飞行时隙;
S5、初始化深度强化学习网络中无人机移动边缘计算场景状态;
S6、根据状态和奖励执行行为;
S7、判断无人机飞行是否越界,若是,进行惩罚、停止飞行并更新状态;
S8、保存行为、奖励、当前及下一刻状态至样本中;
S9、将步骤S6至S8重复固定次数;
S10、在S8获得的样本中,随机选择小样本计算目标值,并通过损失函数更新网络参数;
S11、将步骤S4至S10重复固定次数,获得趋于稳定的路径规划和任务卸载方法。
本发明的有益效果在于:设计基于深度增强学习的框架,具有较低的计算复杂度,因此可以在线实时解决联合优化问题,且凸优化技术还可以使该框架收敛到更高的精度。因此,该方法可以实现深度增强学习和凸优化技术在计算复杂度和计算精度上的权衡与互补,最小化无人机能耗和终端任务完成时间。
附图说明
图1是本发明面向无人机移动边缘计算场景的路径规划和任务卸载方法的流程图;
图2是本发明面向无人机移动边缘计算场景的路径规划和任务卸载方法的场景模型图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“上”、“下”、“内”、“外”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,“设置”、“连接”等术语应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接连接,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合附图,对本发明的具体实施方式进行详细说明。
本发明提供了一种有效平衡计算复杂度和计算精度,最小化无人机能耗和终端任务完成时间的无人机三维路径规划和任务卸载方法,由系统模型建立、模型转化,求解三个部分组成,如图1所示,具体包括以下步骤:
S1、建立无人机移动边缘计算的网络场景模型,具体为:
在一个无人机被派遣来服务地面终端的三维区域内,该区域被均匀分为多个单元格,第i个单元格的中心的水平坐标为式中指所有单元格的水平中心的横坐标集合,xs和ys指两个相邻的单元格x及y方向的水平距离。指无人机在第n时隙的水平位置,式中其中N指代所有时隙。设置和为事先设定的无人机起飞和降落水平中心。指代无人机在第n时隙的垂直位置。因此空间坐标和时隙持续时长可以表征无人机的路径规划。
根据无人机水平飞行速度恒定的叶翼功率P0、悬停诱导功率P1、恒定的下降或上升功率P2、动叶叶翼速度Utip、悬停时平均旋翼诱导速度v0、机身阻力比d0、转子固体度s、空气密度ρ和转子盘面积G,计算旋翼无人机的推进能量为
建立通信模型。根据地面终端k的上传功率Pk、被分配的通信带宽B、加性高斯白噪声的功率谱密度N0,计算第k个地面终端在第n时隙的最大上行速率rkn为式中lkn指通信链路损失,由表达式确定,式中A和C为常数,dkn和pkn分别指在第n时隙第k个任务的数据处理量和视距连接概率。
建立任务卸载模型。通过地面终端的CPU处理速率fg、无人机处理速率fu、需要计算的CPU周期总数Fk、需要处理的数据总数Dk、第n个时隙中被用于做数据传输的时间窗口的比例αn及任务卸载指示akn,计算第n时隙k任务的数据处理量
S2、收集当前区域内的无人机和地面终端信息,并导入网络场景模型:
S3、建立深度强化学习网络,初始化初始及目标网络参数:
S4、给定无人机飞行路径和地面终端任务卸载信息,利用凸优化方法求解无人机最优飞行时隙:
给定上一次网络训练中获得的无人机三维空间内L、H和地面终端任务A信息,利用凸优化方法求解无人机最优飞行时隙τ,具体求解凸优化问题及约束为
S5、初始化深度强化学习网络中无人机移动边缘计算场景状态至s(1);
S6、根据状态和奖励执行行为:
随机选择概率为∈的行为a∈A(s(n))进行执行,否则按照a(n)=π(s(n))选择行为,π(s(n))指代在状态s(n)时的策略选择。为状态s(n+1)和奖励r(s(n),a(n))执行行为a(n);
S7、判断无人机飞行是否越界,若是,进行惩罚、停止飞行并更新状态:
如果无人机飞行超出边界,那么奖励r(s(n),a(n))=r(s(n),a(n))-p,式中p为惩罚,并取消无人机在水平或垂直方向上的飞行,更新至状态s(n+1);
S8、保存行为、奖励、当前及下一刻状态至样本中,即将样本(s(n),a(n),r(·),s(n+1))存储至经验重现缓存F中;
S9、将步骤S6至S8重复固定次数,以获得多个样本;
S10、在S8获得的样本中,随机选择小样本计算目标值,并通过损失函数更新网络参数:
S11、将步骤S4至S10重复固定次数,获得趋于稳定的路径规划和任务卸载方法。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (5)
1.面向无人机移动边缘计算场景的路径规划和任务卸载方法,其特征在于,包括以下步骤:
S1、建立无人机移动边缘计算的网络场景模型;具体包括:
S11、在一个无人机被派遣来服务地面终端的三维区域内,该区域被均匀分为多个单元格,第i个单元格的中心的水平坐标为式中指所有单元格的水平中心的横坐标集合,设置xs和ys指两个相邻的单元格x及y方向的水平距离;指无人机在第n时隙的水平位置,式中其中N指代所有时隙;设置和为事先设定的无人机起飞和降落水平中心;指代无人机在第n时隙的垂直位置;空间坐标和时隙持续时长表征无人机的路径规划;
S12、根据无人机水平飞行速度恒定的叶翼功率P0、悬停诱导功率P1、恒定的下降或上升功率P2、动叶叶翼速度Utip、悬停时平均旋翼诱导速度υ0、机身阻力比d0、转子固体度s、空气密度ρ和转子盘面积G,计算旋翼无人机的推进能量为
S13、根据地面终端k的上传功率Pk、被分配的通信带宽B、加性高斯白噪声的功率谱密度N0,计算第k个地面终端在第n时隙的最大上行速率rkn为式中lkn指通信链路损失,由表达式确定,式中A和C为常数,dkn和pkn分别指在第n时隙第k个任务的数据处理量和视距连接概率;
S14、通过地面终端的CPU处理速率fg、无人机处理速率fu、需要计算的CPU周期总数Fk、需要处理的数据总数Dk、第n个时隙中被用于做数据传输的时间窗口的比例αn及任务卸载指示αkn,计算第n时隙k任务的数据处理量
S2、收集当前区域内的无人机和地面终端信息,并导入网络场景模型;
S3、建立深度强化学习网络,初始化初始及目标网络参数;
S4、给定无人机飞行路径和地面终端任务卸载信息,利用凸优化方法求解无人机最优飞行时隙;
S5、初始化深度强化学习网络中无人机移动边缘计算场景状态;
S6、根据状态和奖励执行行为;
S7、判断无人机飞行是否越界,若是,进行惩罚、停止飞行并更新状态;
S8、保存行为、奖励、当前及下一刻状态至样本中;
S9、将步骤S6至S8重复固定次数;
S10、在S8获得的样本中,随机选择小样本计算目标值,并通过损失函数更新网络参数;
S11、将步骤S4至S10重复固定次数,获得趋于稳定的路径规划和任务卸载方法。
5.根据权利要求4所述的面向无人机移动边缘计算场景的路径规划和任务卸载方法,其特征在于,在S5中,初始化无人机移动边缘计算场景至状态s(1)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111544236.8A CN114372612B (zh) | 2021-12-16 | 2021-12-16 | 面向无人机移动边缘计算场景的路径规划和任务卸载方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111544236.8A CN114372612B (zh) | 2021-12-16 | 2021-12-16 | 面向无人机移动边缘计算场景的路径规划和任务卸载方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114372612A CN114372612A (zh) | 2022-04-19 |
CN114372612B true CN114372612B (zh) | 2023-04-28 |
Family
ID=81140924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111544236.8A Active CN114372612B (zh) | 2021-12-16 | 2021-12-16 | 面向无人机移动边缘计算场景的路径规划和任务卸载方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114372612B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116126428B (zh) * | 2023-04-14 | 2023-06-13 | 昆明理工大学 | 一种面向能量采集的无人机计算任务卸载方法 |
CN117553803B (zh) * | 2024-01-09 | 2024-03-19 | 大连海事大学 | 一种基于深度强化学习的多无人机智能路径规划方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428115A (zh) * | 2019-08-13 | 2019-11-08 | 南京理工大学 | 基于深度强化学习的动态环境下的最大化系统效益方法 |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
CN111786713A (zh) * | 2020-06-04 | 2020-10-16 | 大连理工大学 | 一种基于多智能体深度强化学习的无人机网络悬停位置优化方法 |
CN113190039A (zh) * | 2021-04-27 | 2021-07-30 | 大连理工大学 | 一种基于分层深度强化学习的无人机采集路径规划方法 |
US11164464B1 (en) * | 2018-10-08 | 2021-11-02 | Facebook, Inc. | Optimizing trajectory of unmanned aerial vehicles |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10698422B2 (en) * | 2017-10-04 | 2020-06-30 | Here Global B.V. | Link level wind factor computation for efficient drone routing using 3D city map data |
-
2021
- 2021-12-16 CN CN202111544236.8A patent/CN114372612B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11164464B1 (en) * | 2018-10-08 | 2021-11-02 | Facebook, Inc. | Optimizing trajectory of unmanned aerial vehicles |
CN110488861A (zh) * | 2019-07-30 | 2019-11-22 | 北京邮电大学 | 基于深度强化学习的无人机轨迹优化方法、装置和无人机 |
CN110428115A (zh) * | 2019-08-13 | 2019-11-08 | 南京理工大学 | 基于深度强化学习的动态环境下的最大化系统效益方法 |
CN111786713A (zh) * | 2020-06-04 | 2020-10-16 | 大连理工大学 | 一种基于多智能体深度强化学习的无人机网络悬停位置优化方法 |
CN113190039A (zh) * | 2021-04-27 | 2021-07-30 | 大连理工大学 | 一种基于分层深度强化学习的无人机采集路径规划方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114372612A (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114372612B (zh) | 面向无人机移动边缘计算场景的路径规划和任务卸载方法 | |
CN113194488B (zh) | 一种无人机轨迹和智能反射面相移联合优化方法及系统 | |
CN113364495B (zh) | 一种多无人机轨迹和智能反射面相移联合优化方法及系统 | |
CN113645635A (zh) | 智能反射面辅助的高能效无人机通信系统的设计方法 | |
CN111970709B (zh) | 一种基于粒子群优化算法的无人机中继部署方法及系统 | |
CN109839955B (zh) | 一种无人机与多个地面终端进行无线通信的轨迹优化方法 | |
Arani et al. | Reinforcement learning for energy-efficient trajectory design of UAVs | |
CN111381499A (zh) | 基于三维空间射频地图学习的网联飞行器自适应控制方法 | |
CN116700343A (zh) | 一种无人机路径规划方法、设备和存储介质 | |
CN112752357A (zh) | 基于能量收割技术的在线无人机辅助数据收集方法及装置 | |
Wang et al. | Learning-based UAV trajectory optimization with collision avoidance and connectivity constraints | |
Chen et al. | Energy-aware path planning for obtaining fresh updates in UAV-IoT MEC systems | |
WANG et al. | Trajectory optimization and power allocation scheme based on DRL in energy efficient UAV‐aided communication networks | |
Cui et al. | Joint trajectory and power optimization for energy efficient UAV communication using deep reinforcement learning | |
Shi et al. | Age of information optimization with heterogeneous uavs based on deep reinforcement learning | |
Bhandarkar et al. | Adversarial Sybil attacks against Deep RL based drone trajectory planning | |
CN117270559A (zh) | 一种基于强化学习的无人机集群部署与轨迹规划方法 | |
Bouhamed et al. | A DDPG-based Approach for Energy-aware UAV Navigation in Obstacle-constrained Environment | |
CN114257298A (zh) | 智能反射表面相移和无人机路径规划方法 | |
Jin et al. | Research on distributed cooperative control of swarm UAVs for persistent coverage | |
Cao et al. | Average transmission rate and energy efficiency optimization in uav-assisted IoT | |
Cui et al. | UAV-enabled MEC system: Locations and coverage optimization | |
Khodaparast et al. | Deep reinforcement learning based data collection in IoT networks | |
CN113923675B (zh) | 一种提升地面用户通信性能的空中基站部署方法 | |
Oliveira et al. | A computational tool to assess communications’ range and capacity limits of ad-hoc networks of UAVs operating in maritime scenarios |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |