CN114745666B

CN114745666B - 一种用于拥挤场馆中无人机辅助边缘计算方法

Info

Publication number: CN114745666B
Application number: CN202210644872.6A
Authority: CN
Inventors: 谈玲; 曹博源
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2022-06-09
Filing date: 2022-06-09
Publication date: 2022-08-30
Anticipated expiration: 2042-06-09
Also published as: CN114745666A

Abstract

本发明公开了一种用于拥挤场馆中无人机辅助边缘计算方法，利用无人机充当边缘服务器，建立一个无人机辅助通信的边缘计算网络，用于缓解通信网络的过载和计算量过大造成的高时延问题。针对拥挤场馆中用户任务传输以及处理延迟过高的问题提出一个双队列空闲卸载方法DQIO，在无人机辅助的边缘计算实体网络下，构建实体网络的数字孪生网络，并构建无人机轨迹和计算资源分配的优化模型，提出一种空闲卸载的卸载决策并利用机器学习等方法求解最优的无人机轨迹、卸载比例和计算资源分配方案，从而解决拥挤场馆中信道过载的问题，并降低用户的时延。

Description

一种用于拥挤场馆中无人机辅助边缘计算方法

技术领域

本发明属于无人机辅助的边缘计算领域，具体涉及一种用于拥挤场馆中无人机辅助边缘计算方法。

背景技术

随着智能移动设备和5G的普及，出现了人手一台甚至多台智能设备的情况，这带来了极大的通信需求和巨大的任务量；与此同时，许多计算密集型服务应运而生，而这些计算密集型服务发展受智能移动设备计算资源和电池容量的限制。为解决上述问题，通过将计算任务卸载给基站上的云服务器或者更近的边缘服务器，更快地完成计算任务并降低设备能耗、缩短任务处理时间。而在一些特殊情况，如大型展会或大型体育赛事中，基站除了要为场馆外的用户提供服务，还需要服务场馆内激增的用户，这很容易造成通信网络的过载，进而造成用户端时延过高、用户使用体验差的问题。为此产生了无人机搭载边缘服务器接收用户任务的方案，无人机具有灵活、低成本、易于部署等优势，在无人机辅助边缘计算上有很好的应用前景。

数字孪生，是充分利用物理模型、传感器更新、运行历史等数据，集成多学科、多物理量、多尺度、多概率的仿真过程，在虚拟空间中完成映射，从而反映相对应的实体装备的全生命周期过程。数字孪生体最大的特点在于：它是对实体对象的动态仿真。

现有关于无人机辅助边缘计算的研究，大多假设边缘服务器有足够强大的计算能力，并且卸载的计算任务在到达服务器时立即执行，但实际上，在边缘服务器需要为大量用户提供服务时，用户卸载到边缘服务器的任务数量可能非常大，任务不能在短时间内被边缘服务器计算完成，这部分时延是不可忽略的，尤其是在上述场景中，优化用户时延的问题将更难解决。除此之外，目前大多研究假定每个用户产生的每个任务所需的计算量均相同，但在现实场景中，用户所产生的任务必定是不同的，所以每个任务所需的计算量也不同。

发明内容

为了解决上述背景技术提到的技术问题，本发明提出了一种用于拥挤场馆中无人机辅助边缘计算方法，充分考虑拥挤场馆中的任务数量大且计算量不同的情况，并降低用户端的时延，以实现通信网络过载时，用户的任务仍能快速卸载并处理完成。

为了实现上述技术目的，本发明的技术方案为：

一种用于拥挤场馆中无人机辅助边缘计算方法，包括以下步骤：

S1、通过基站实时监测场馆用户数量，当场馆内用户数量超过预设的拥挤阈值，根据用户位置数据，采用改进的自然最近邻优化的密度峰值聚类方法对无人机进行部署，构建物理实体网络，随后基站停止对该场馆区域内用户的服务；

S2、在基站端构建物理实体网络的数字孪生网络，拟合用户和无人机的信息，包括用户位置、计算资源最大值、用于本地处理的计算资源、与其数字孪生体之间计算资源的估计误差以及任务信息和无人机的位置、计算资源最大值、分配给每个用户的计算资源、与其数字孪生体之间计算资源的估计误差以及分配给每个用户的信道带宽；

S3、根据S2拟合的用户位置、计算资源最大值、用于本地处理的计算资源、与其数字孪生体之间计算资源的估计误差以及任务信息和无人机的位置、计算资源最大值、分配给每个用户的计算资源、与其数字孪生体之间计算资源的估计误差以及分配给每个用户的信道带宽，构建本地计算模型、无人机计算模型以及用户和无人机的任务数据队列与计算队列；

S4、根据用户本地处理时延、用户卸载任务的传输时延以及无人机的计算时延，计算用户的总时延，并构建无人机轨迹和计算资源分配的用户时延优化模型，即系统时延最小化问题；

S5、基于李雅普诺夫优化方法将系统时延最小化问题转化为李雅普诺夫漂移加罚最小化问题；

S6、基于就近空闲卸载的卸载决策，分别通过凸优化和PPO算法得到最优方案，并检测用户数量；

S7、当基站检测到场馆用户数量减少到拥挤阈值以下时，视为一般状态，边缘计算无人机不再接收新任务，并在处理完剩余任务后进入待机状态，当基站检测到场馆用户仍处于拥挤状态时，重复步骤S1～S6直至场馆用户数量减少到拥挤阈值以下。

采用上述技术方案带来的有益效果：

1、本发明根据用户的位置，采用改进的自然最近邻优化的密度峰值聚类方法求解无人机数量以及初始位置，对用户区域进行了划分，规定了每架无人机的服务范围；设定一个类簇数据点阈值，避免当场馆内用户过于集中时，类簇中数据点过多的情况，避免一架无人机服务过多用户，更合理地分配了计算资源，同时自然最近邻优化的密度峰值聚类方法只需要类簇数据点阈值这一个参数，且自然最近邻优化的密度峰值聚类方法在该参数的选择上是鲁棒的，避免了参数敏感问题；

2、在基站端引入数字孪生网络，可以实时反馈用户和无人机的位置、计算资源、任务量等信息；

3、本发明考虑用户随机生成任务的计算量不同以及任务卸载到无人机上不能立即处理完成的情况，设定每个任务具有不同的计算量，并采用任务数据队列和计算队列的双队列数学模型，更加贴合实际；提出就近空闲卸载的卸载决策，非噪声点用户优先选择其类簇上空的无人机进行任务卸载，但该用户上空无人机双队列中，任一队列超过缓冲区阈值，或用户为噪声点用户时，则用户将根据其他无人机队列动态方程的值选择最空闲的无人机进行任务卸载，该卸载决策避免了无人机的任务过载，同时也避免了空闲计算资源的浪费；建立的数学模型通过李雅普诺夫优化方法，将随机问题转化为逐时间块问题，提高可解性；

4、本发明针对用户的总能耗，使用凸优化方法和PPO算法分别对无人机的轨迹和计算资源分配方案进行最优化并进行迭代，从而得到无人机轨迹和计算资源分配方案的最优解，使用户时延最小化。

附图说明

图1为本发明DQIO方法流程图；

图2为本发明改进的自然最近邻优化的密度峰值聚类方法流程图；

图3为本发明边缘计算网络示意图；

图4为本发明双队列运行示意图；

图5为本发明PPO算法示意图；

图6为本发明不同卸载比例方案的用户任务量与用户总时延对比图；

图7为本发明不同算法的用户任务量与用户总时延对比图。

具体实施方式

以下将结合附图，对本发明的技术方案进行详细说明。

本实施例所述的一种用于拥挤场馆中无人机辅助边缘计算方法DQIO流程图如图1所示，该方法包括以下步骤：

S1、通过基站实时监测场馆用户数量，当场馆内用户数量超过预设的拥挤阈值，根据用户位置数据，采用改进的自然最近邻优化的密度峰值聚类方法对无人机进行部署，构建物理实体网络，随后基站停止对该场馆区域内用户的服务。

场馆方面在活动开始前将通过预计观众数量NUM以及活动开始时间等信息发送给基站，以便基站进行下一步的部署。

场馆内用户不超过NUM时，视为用户数为一般状态，若超过，则视为用户为拥挤状态，基站检测到用户进入拥挤状态时，采用改进的自然最近邻优化的密度峰值聚类方法求解无人机数量以及初始位置部署，如图2所示。

首先使用自然最近邻居搜索算法获得数据集中每个数据点的自然邻居以及计算每个数据点的密度，包括：

S1-1、将场馆内所有用户的集合作为自然最近邻搜索的数据集；

S1-2、对于集合

中每一个数据点(用户)i，采用KNN搜索，得到每个数据点i的邻居集合KNN(i)，KNN(i)是

的子集，如果数据点i是集合KNN(i)中另一个数据点i′的邻居，则将这对自然邻居{i，i′}加入集合NN中，且nb(i′)＝nb(i′)+1，nb(i′)＝nb(i′)+1，其中NN的初始值为空集，表示自然最近邻居的集合，nb(i)和nb(i′)初始值为0，分别表示数据点i和数据点i′的自然最近邻居数。

S1-3、重复步骤S1-2，直到集合NN中不再加入新的自然邻居对；

S1-4、得到自然邻居特征值：

其中sup表示自然邻居对的总数。

S1-5、计算每个数据点的密度

其中N(i，nb(i))是点i的nb(i)个自然邻居，dist(i，i′)是点i和i′之间的距离。

然后根据自然最近邻居搜索算法获得的自然邻居集合NN以及每个数据点的密度，利用自然最近邻优化的密度峰值聚类方法得到无人机数量以及位置部署方案，包括：

S1-6、找到每个数据点的代表点和稀疏邻居，其中代表点的定义为Exemplar(q)＝max{Den(NN(p))&&p≠q}，

稀疏邻居的定义为

SN(p)＝{q|Den(q)＜Den(p)&&q∈NN(p)}，其中p和q均是数据点，NN(p)代表数据点p自然邻居的集合；

S1-7、找到所有的密度峰并任意访问一个密度峰，将该密度峰和该密度峰的稀疏邻居分到同一个聚类，其中如果数据点p满足

Den(p)≥Den(q)，就称数据点p为一个密度峰；

S1-8、找到一个未访问的密度峰并重复S1-7，直到所有的密度峰都被访问；生成初始类簇；

S1-9、划分好初始类簇，根据初始类簇之间的相似度关系，合并相似度高的初始类簇，其中，类间相似度为

SUP是自然邻居特征值，

是类

和类

的公共部分；设定一个类簇数据点阈值PMAX，当一个类簇的数据点数超过阈值PMAX时，该类簇不合并；

S1-10、将类簇中数据个数小于最小自然邻居数的类簇从聚类结果中去除，并将这些类簇中的数据标记为噪声点，获得最终的聚类结果，将最终类簇的数量定义为M，并将M架无人机部署在每个类簇上空。

无人机辅助的边缘计算系统由1个基站，M架无人机和N个用户组成，M架无人机的集合表示为

N个用户的集合表示为

M架无人机的初始位置为该类簇内所有数据点位置的平均值，边缘计算系统运行过程中，无人机会根据用户任务量进行移动，同时无人机由基站无线供电，因此不考虑无人机的能耗。

S2、在基站端构建物理实体网络的数字孪生网络，拟合用户和无人机的位置、资源信息，物理实体网络与数字孪生网络如图3所示。

将用户活动周期划分为T个时隙，每个时隙的时间为τ，用户位置为L_i＝(X_i，Y_i，0)，在t时隙用户设备产生的任务为Λ_i(t)＝[k，λ_i，k(t)，c_i，k]，其中k为用户i任务产生顺序的任务编号，该任务数据量为λ_i，k(t)，单位为比特，假设不同用户的任务计算量不同，c_i，k是计算用户i产生的第k个任务所需的CPU周期数。

在基站端构建物理实体网络的数字孪生网络，由用户设备和无人机两部分组成，在t时隙，用户的数字孪生体DT_i(t)构建为：

其中L_i表示用户i的位置，f_i表示用户i的最大计算资源，f_i(t)表示用户i在t时隙用于本地处理任务的计算资源，

是用户i与其数字孪生体之间计算资源的估计误差，p_i(t)表示用户i在t时隙的上行传输功率。

在t时隙，无人机j的数字孪生体DT_j(t)表示为：

其中L_j(t)是无人机j在t时隙的位置，表示为L_j(t)＝(X_j(t)，Y_j(t)，H)，X_j(t)，Y_j(t)，H分别表示无人机j在t时隙的横纵坐标和高度，

是无人机j的最大计算资源，

代表无人机j在t对隙分别分配给N个用户i的计算资源的集合，

是无人机j与其数字孪生体之间分别分配给N个用户的计算资源的估计误差，B_j(t)＝{B_1j(t)，…，B_Nj(t)}表示无人机j在t时隙分别提供给N个用户的信道带宽。

S3、根据S2获取的用户设备信息，构建本地计算模型、无人机计算模型及用户和无人机的任务数据队列与计算队列。

在t时隙，N个用户将一部分的任务进行本地处理，另一部分任务卸载到无人机上，用ρ_i(t)表示用户i本地处理任务的比例，(1-p_i(t))表示用户卸载到无人机任务的比例，ρ_i(t)∈[0，1]；

在t时隙，用户i的数字孪生体估计的在本地计算过程中计算时延

表示为：

其中，f_i(t)表示用户i在t时隙用于本地处理任务的计算资源，λ_i，k(t)为用户i产生的第k个任务的数据量，c_i，k是计算用户i产生的第k个任务所需的CPU周期数；

用户i真实计算时延与其数字孪生体估计值之间的计算延迟间隙

表示为：

其中

是用户i与其数字孪生体之间计算资源的估计误差；

在t时隙，用户i本地计算任务实际消耗时间

表示为：

S3-3、用户i的数据传输速率r_ij(t)，表达式为：

式中B_ij(t)表示无人机j在t时隙提供给用户i的信道带宽，p_i(t)表示用户i在t时隙的上行数据传输功率，h₀表示信道增益，σ²表示噪声功率，d_ij是用户i与其类簇上空无人机j的距离，表示为：

X_i，Y_i分别表示用户i的横纵坐标，X_j(t)，Y_j(t)，H分别表示t时隙无人机j的横纵坐标及高度；

用户i在t时隙将任务k卸载到无人机j的传输时延

表示为：

S3-4、在t时隙，用户i将任务卸载到无人机j后，无人机j的数字孪生体估计的处理任务k的计算时延

表示为：

其中

代表无人机j在t时隙分配给用户i的计算资源；

无人机j真实计算时延与其数字孪生体估计值之间的计算延迟间隙

表示为：

其中

是无人机j与其数字孪生体之间分配给用户i的计算资源的估计误差；

在t时隙，无人机jj完成用户i卸载的任务实际消耗时间

表示为：

如图4所示，构建用户和边缘服务器的双队列。首先构建用户本地计算队列模型，其中用户i数据队列的

动态方程为：

用户i计算队列

的动态方程为：

其中τ表示每个时隙的时间，

和

分别为用户i在t时隙的数据和任务队列，

表示计算用户i产生的第min K_i(t)个任务所需的CPU周期数，K_i(t)表示t时隙用户i缓冲区任务的集合，r_ij(t)τ表示t时隙用户i卸载到无人机j的任务量，τf_i(t)表示t时隙用户i本地处理的任务量，当用户i随机产生新任务Λ_i(t)时，将k加入K_i；队列执行任务采用先进先出的原则，min K_i(t)表示t时隙集合K_i(t)中最小的编号，即最先进入用户i队列的任务的编号；当用户i通过计算和卸载使任务k离开队列时，k将会从K_i中移除；当t＝0时，

和

均为0；为了保证队列稳定性，需满足：

其中

表示用户的集合，T表示时隙数；

构建边缘计算服务器计算队列模型，其中无人机j的数据队列

的动态方程为：

无人机j的计算队列

的动态方程为：

其中，

和

分别表示无人机j在t时隙的数据和计算队列，

表示计算用户i卸载到无人机j的第

个任务所需的CPU周期数，

表示t时隙无人机j缓冲区中来自用户i任务的集合，当无人机j接收来自用户i的新任务Λ_i(t)时，将k加入

当用户j通过计算使任务k离开队列时，k将会从

中移除，

表示t时隙集合

中最小的编号，即用户i卸载的任务中最先进入无人机j队列的编号；当用户i没有将任务卸载到无人机j时，

和r_ij(t)均为0，当t＝0时，

和

均为0；为了保证队列稳定性，需满足：

其中

表示无人机的集合；

S4、得到用户的总时延，并构建无人机轨迹和计算资源分配的用户时延优化模型。

无人机轨迹L_j(t)表示为：

L_j(t)＝L_j(t-1)+vτ

其中v是无人机的飞行速度，τ表示每个时隙的时间，L_j(t-1)是第j架无人机上一时隙的位置。

用户总时延

包括用户本地计算时延、上行传输时延和无人机计算时延三部分，表达式为：

其中，

表示用户的集合，

表示无人机的集合，

是用户i在t时隙本地计算过程中实际产生的计算时延，

表示用户i在t时隙将任务卸载到无人机j的传输时延，

表示在t时隙，无人机j完成用户i卸载的任务实际产生的计算时延；

由于任务处理完毕后返回的计算结果数据量较小，所以下行传输时延忽略不计。

构建用户时延最小化优化模型，优化问题表示为：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤ρ_i(t)≤1

C6：L_j(0)＝L_j(T)

C7：L_j(t)＝L_j(t-1)+vτ

其中，a(t)是问题P1优化变量的集合，表示为：

a(t)＝[B(t)，F(t)，F^MEC(t)，p(t)，ρ(t)，L^MEC(t)]

式中B(t)＝{[B₁₁(t)，…B_1M(t)]，…，[B_N1(t)，…，B_NM(t)]}表示第1到第M架无人机在t时隙分配给第1到第N个用户的带宽，

F(t)＝[f₁(t)，…，f_N(t)]表示t时隙第1到第N个用户分别用于本地计算的计算资源，

表示第1到第M架无人机在t时隙分别分配给N个用户的计算资源，

p(t)＝[p₁(t)，…，p_N(t)]表示t时隙第1到第N个用户的上行传输功率，ρ(t)＝[ρ₁(t)，…，ρ_N(t)]表示t时隙第1到第N个用户卸载比例的集合，L^MEC(t)＝[L₁(t)，…，L_M(t)]表示t时隙第1到第M架无人机位置的集合；

约束C1表示无人机j在t时隙提供给用户的信道带宽B_ij(t)之和不能大于无人机j拥有的总信道带宽B_j，且B_ij(t)不能为负；

约束C2表示用户i在t时隙的上行数据传输速率p_i(t)不为负且不能大于最大传输速率p_i；

约束C3表示用户i在t时隙用于本地处理的计算资源f_i(t)不为负且不能大于用户i的总计算资源f_i；

约束C4表示无人机j在t时隙分配给用户的计算资源

非负，且

之和不能大于无人机j所拥有的总计算资源

约束C5表示卸载比例ρ_i(t)不能大于1且不能小于0；

约束C6-C7是无人机的轨迹约束，C6表示无人机最后一个时隙T的位置L_j(T)与初始位置L_j(0)相同，C7是无人机j位置L_j(t)的表达式，即t时隙无人机j的位置等于上个时隙的位置L_j(t-1)加上无人机j速度v与时间τ|的乘积；

约束C8-C11是队列稳定性约束，

和

分别为用户i在t时隙的数据和任务队列，

和

分别表示无人机j在t时隙的数据和计算队列。

S5、基于李雅普诺夫优化方法将系统时延最小化问题转化为李雅普诺夫漂移加罚最小化问题。

为了满足队列稳定性约束，根据用户缓存任务队列和无人机缓存任务队列建立李雅普诺夫函数L(Θ(t))，表达式为：

其中，Θ(t)＝[Q^loc(t)，C^loc(t)，Q^MEC(t)，C^MEC(t)]，

和

分别表示t时隙第1到第N个用户本地和第1到第M架无人机的任务数据与任务队列长度的集合

则李雅普诺夫漂移Δ(Θ(t))为：

利用漂移加罚算法得到李雅普诺夫漂移加罚函数Δ_V(Θ(t))为：

其中

是非负权重参数，用来表示Δ(Θ(t))和

的重要程度；

得到李雅普诺夫漂移加罚函数的上界为：

其中

其中，

A₁₁、A₁₂、A₂₁、A₂₂、A₃₁、A₃₂、A₄₁和A₄₂分别代表

λ_i，k(t)、

r_ij(t)τ-τf_i(t)、λ_i(t)c_i，k、

r_ij(t)τ、

和

的上界，λ_i，k(t)表示用户i产生的第k个任务的数据量，r_ij(t)是用户i的数据传输速率，c_i，k表示计算用户i产生的第k个任务所需的CPU周期数，

表示计算用户i产生的第min K_i(t)个任务所需的CPU周期数，K_i(t)表示t时隙用户i缓冲区任务的集合，min K_i(t)表示t时隙集合K_i(t)中最小的编号，即最先进入用户i队列的任务的编号，

表示计算用户i卸载到无人机j的第

个任务所需的CPU周期数，

表示t时隙无人机j缓冲区中来自用户i任务的集合，

表示t时隙集合

中最小的编号，即用户i卸载的任务中最先进入无人机j队列的编号；

将问题P1转化为李雅普诺夫漂移加罚函数加罚最小化问题P2：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤ρ_i(t)≤1

C6：L_j(0)＝L_j(T)

C7：L_j(t)＝L_j(t-1)+vτ

其中

S6、基于就近空闲卸载的卸载决策及S3获得的用户设备信息，分别通过凸优化和PPO算法得到无人机轨迹及卸载比例、计算资源分配的最优方案。

对无人机j的数据队列

和计算队列

均设置一个阈值，分别表示为

和

若用户i处于任一类簇内，则用户i将任务卸载到该类簇上空的无人机j，当无人机j的数据队列

超过

或者计算队列

超过

时，用户i不会将任务卸载到无人机j，而是根据其他无人机队列的动态方程来判断其空闲程度，动态方程的值越小，代表无人机越空闲，用户i将任务卸载到最空闲的无人机上；若用户i作为噪声点被排除，则用户i将任务卸载到最空闲的无人机上；

首先通过计算无人机的最优轨迹：

S6-1、求解无人机在每个时隙的位置变化L^MEC(t)，构建的优化问题表示为：

s.t.C1：L_j(0)＝L_j(T)

C2：L_j(t)＝L_j(t-1)+vτ

其中，目标函数Z(t)中用户i的数据传输速率r_ij(t)关于无人机轨迹L_j(t)是非凸的，引入松弛变量{y(t)}，则r_ij(t)转换为：

其中y(t)≥(X_i-X_j(t))²+(Y_i-Y_j(t))²，h₀表示信道增益，σ²表示噪声功率，其中，X_i，Y_i表示用户i的横纵坐标，X_j(t)，Y_j(t)，H分别表示t时隙无人机j的横纵坐标以及高度，y(t)+H²表示用户与无人机之间的距离的平方，引入局部点{y^l(t)}，将转换后的r_ij(t)利用连续凸逼近技术进行一阶泰勒展开，则目标函数转换为：

优化问题P2重构为：

s.t.C1：L_j(0)＝L_j(T)

C2：L_j(t)＝L_j(t-1)+vτ

通过凸优化工具CVX对最优的无人机轨迹L^MEC(t)进行求解；

然后采用PPO算法，如图5所示，计算无人机的最优计算资源分配方案：

S6-2、给定无人机轨迹L^MEC(t)，求解

A(t)＝[B(t)，F(t)，F^MEC(t)，p(t)，ρ(t)]，构建的优化问题表示为：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤ρ_i(t)≤1

构建一个Critic网络和两个Actor网络，两个Actor网络结构相同，分别为Actor-old和Actor-new；

边缘计算实体网络状态表示为：

s(t)＝[r(t)，F，p_max(t)，B，Λ(t)，Θ(t)]

其中r(t)＝{[r₁₁(t)，...，r_1M(t)]，...，[r_N1(t)，...，r_NM(t)]}表示第1到第个N用户将任务卸载至第1到第M架无人机的无线传输速率；

表示第1到第N个用户和第1到第M架无人机分别拥有的计算资源；p_max(t)＝[p₁(t)，...，p_N(t)]表示t时隙第1到第N个用户的最大传输功率，B＝[B₁，...，B_M]表示第1到第M架无人机的总带宽；Λ(t)＝[Λ₁(t)，…，Λ_i(t)，…，Λ_N(t)]表示t时隙第1到第N个用户随机生成的任务；将A(t)作为t时隙的动作空间；

奖励函数R(t)表示为：

R(t)＝-Z(t)+pen

式中，pen表示惩罚项，在边缘计算实体网络运行过程中，如果约束未被满足，则会相应给出一个惩罚数值；

初始化Actor-new网络、Actor-old网络和Critic网络，设置抽取样本大小为

为正整数，奖励折扣因子为γ；

S6-2-1、将环境信息s输入到Actor-new网络，得到一个动作A，再将动作A输入到环境中，得到奖励R和下一步的状态s′，再将s′输入到Actor-new网络，循环该步骤，直到存储了

组[(s，A，R)，…]；

S6-2-2、将S6-3-1中最后一次循环得到的s′输入到Critic网络中，得到状态的折扣回报val(s′)，计算折扣奖励：

R^Dis(t)＝R(t)+γ×R(t+1)+γ²×R(t+2)+…+γ^T-t+1×R(T-1)+γ^T-t×val(s′)

得到R^Dis＝[R^Dis(1)，…，R^Dis(t)，…，R^Dis(T)]，其中T为时隙数量，R(t)，...，R(T-1)分别为t到T-1时隙的奖励值。

S6-2-3、将存储的状态s组合输入到Critic网络中，得到所有状态的val值，集合为VAL，R^Dis与VAL的差值，即优势值表示为

S6-2-4、求优势值平方的均值，表示为

S6-2-5、将存储的状态s组合输入到Actor-old和Actor-new网络中，分别得到正态分布Normall和Normal2，将存储的动作A组合输入到正态分布Normal1和Normal2，得到每个动作对应的prob1和prob2；

S6-2-6、计算

其中r_t(θ)是prob2除以prob1得到的比例，clip(r_t(θ)，1-ε，1+ε)的用途是剪裁r_t(θ)，将其保持在[1-ε，1+ε]内，ε用来确定范围大小；

S6-2-7、循环步骤S6-2-5、S6-2-6，一定次数后循环结束，用Actor-new网络权重来更新Actor-old网络；

S6-2-8、循环步骤S6-2-1到S6-2-7，得到最优的计算资源分配方案；

S6-3、循环执行步骤S6-1和步骤S6-2，直到相邻两次迭代下用户总时延差的绝对值小于预设阈值，或者达到最大预设迭代次数时，迭代结束，即获得无人机轨迹以及最优的卸载比例、计算资源分配方案。

S7、基站检测到场馆用户减少到一般状态时，边缘计算无人机不再接收新任务，并在处理完剩余任务后进入待机状态。

图6和图7是多次仿真实验后的对比图。其中图6将本发明采用的按比例部分卸载的方案与全部卸载和全部本地处理进行对比，随着任务量的增多，用户的总时延均呈上升趋势，但本发明对卸载比例进行优化后，无论是对比全部卸载还是全部本地处理，优化结果都是最好，这表明本发明采用按比例部分卸载的方案能够更加充分利用计算资源，以减少用户的时延。图7对比了贪婪算法和Q-learning等智能算法，可以看出，尽管随着任务量增多，几种算法优化后的用户总时延还是呈上升趋势，但本文所采用的DQIO算法的优化结果是最好的，这表明本发明采用的DQIO优化算法能够得到更优的计算资源分配方案，更好地对用户总时延进行优化。

实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.一种用于拥挤场馆中无人机辅助边缘计算方法，其特征在于，包括以下步骤：

S4、根据用户本地处理时延、用户卸载任务的传输时延以及无人机的计算时延，计算用户的总时延，并构建无人机轨迹和计算资源分配的用户时延优化模型，即系统时延最小化问题；所述步骤S4中无人机轨迹L_j(t)表示为：

L_j(t)＝L_j(t-1)+vτ

其中v是无人机的飞行速度，τ表示每个时隙的时间，L_j(t-1)是第j架无人机上一时隙的位置；

用户总时延

其中，

表示用户的集合，

表示无人机的集合，

是用户i在t时隙本地计算过程中实际产生的计算时延，

表示用户i在t时隙将任务卸载到无人机j的传输时延，

构建用户时延

最小化优化模型表示为：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤p_i(t)≤1

C6：L_j(0)＝L_j(T)

C7：L_j(t)＝L_j(t-1)+vτ

其中，a(t)是问题P1优化变量的集合，表示为：

a(t)＝[B(t)，F(t)，F^MEC(t)，p(t)，ρ(t)，L^MEC(t)]

式中B(t)＝{[B₁₁(t)，…B_1M(t)]，…，[B_N1(t)，…，B_NM(t)]}表示第1到第M架无人机在t时隙分配给第1到第N个用户的带宽，F(t)＝[f1(t)，…，fN(t)]表示t时隙第1到第N个用户分别用于本地计算的计算资源，

表示第1到第M架无人机在t时隙分别分配给N个用户的计算资源，p(t)＝[p₁(t)，…，p_N(t)]表示t时隙第1到第N个用户的上行传输功率，ρ(t)＝[ρ₁(t)，…，ρ_N(t)]表示t时隙第1到第N个用户卸载比例的集合，L^MEC(t)＝[L₁(t)，…，L_M(t)]表示t时隙第1到第M架无人机位置的集合；

约束C4表示无人机j在t时隙分配给用户的计算资源

非负，且

之和不能大于无人机j所拥有的总计算资源

约束C5表示卸载比例ρ_i(t)不能大于1且不能小于0；

约束C6-C7是无人机的轨迹约束，C6表示无人机最后一个时隙T的位置L_j(T)与初始位置L_j(0)相同，C7是无人机j位置L_j(t)的表达式，即t时隙无人机j的位置等于上个时隙的位置L_j(t-1)加上无人机j速度v与时间τ的乘积；

约束C8-C11是队列稳定性约束，

和

分别为用户i在t时隙的数据和任务队列，

和

分别表示无人机j在t时隙的数据和计算队列；

S5、基于李雅普诺夫优化方法将系统时延最小化问题转化为李雅普诺夫漂移加罚最小化问题；所述步骤S5中：根据用户缓存任务队列和无人机缓存任务队列建立李雅普诺夫函数L(Θ(t))，表达式为：

其中，Θ(t)＝[Q^loc(t)，C^loc(t)，Q^MEC(t)，C^MEC(t)]，

分别表示t时隙第1到第N个用户本地和第1到第M架无人机的任务数据与任务计算队列长度的集合，则李雅普诺夫漂移Δ(Θ(t))为：

即两个相邻时隙李雅普诺夫函数的差的期望，利用漂移加罚算法得到李雅普诺夫漂移加罚函数Δ_V(Θ(t))为：

其中

是非负权重参数；

得到李雅普诺夫漂移加罚函数的上界为：

其中

其中，A₁₁、A₁₂、A₂₁、A₂₂、A₃₁、A₃₂、A₄₁和A₄₂分别代表

λ_i，k(t)

λ_i(t)c_i，k、

r_ij(t)τ、

和

表示计算用户i产生的第minK_i(t)个任务所需的CPU周期数，K_i(t)表示t时隙用户i缓冲区任务的集合，minK_i(t)表示t时隙集合K_i(t)中最小的编号，即最先进入用户i队列的任务的编号，

表示计算用户i卸载到无人机j的第

个任务所需的CPU周期数，

表示t时隙无人机j缓冲区中来自用户i任务的集合，

表示t时隙集合

将问题P1转化为李雅普诺夫漂移加罚函数加罚最小化问题P2，表达式如下：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤p_i(t)≤1

C6：L_j(0)＝L_j(T)

C7：L_j(t)＝L_j(t-1)+vτ

Z(t)的表达式如下：

S6、基于就近空闲卸载的卸载决策，分别通过凸优化和PPO算法得到最优方案，并检测用户数量；所述步骤S6具体包括：

S6-1、对无人机j的数据队列

和计算队列

均设置一个阈值，分别表示为

和

超过

或者计算队列

超过

S6-2、求解无人机在每个时隙的位置变化L^MEC(t)，具体表达式如下：

s.t.C1：L_j(0)＝L_j(T)

C2：L_j(t)＝L_j(t-1)+vτ

优化问题P2重构为：

s.t.C1：L_j(0)＝L_j(T)

C2：L_j(t)＝L_j(t-1)+vτ

通过凸优化工具CVX对最优的无人机轨迹L^MEC(t)进行求解；

S6-3、给定无人机轨迹L^MEC(t)，求解A(t)＝[B(t)，F(t)，F^MEC(t)，p(t)，ρ(t)]，构建的优化问题表示为：

C2：0≤p_i(t)≤p_i

C3：0≤f_i(t)≤f_i

C5：0≤ρ_i(t)≤1

边缘计算实体网络状态表示为：

s(t)＝[r(t)，F，p_max(t)，B，Λ(t)，Θ(t)]

其中，r(t)＝{[r₁₁(t)，...，r_1M(t)]，...，[r_N1(t)，...，r_NM(t)]}表示第1到第个N用户将任务卸载至第1到第M架无人机的无线传输速率；

表示第1到第N个用户和第1到第M架无人机分别拥有的计算资源；p_max(t)＝[p₁(t)，...，p_N(t)]表示t时隙第1到第N个用户的最大传输功率，B＝[B₁，...，B_M]表示第1到第M架无人机的总带宽；Λ(t)＝[Λ₁(t)，...，Λ_i(t)，…，Λ_N(t)]表示t时隙第1到第N个用户随机生成的任务；将A(t)作为t时隙的动作空间；

奖励函数R(t)表示为：

R(t)＝-Z(t)+pen

为正整数，奖励折扣因子为γ；

S6-3-1、将环境信息s输入到Actor-new网络，得到一个动作A，再将动作A输入到环境中，得到奖励R和下一步的状态s′，再将s′输入到Actor-new网络，循环该步骤，直到存储了

组[(s，A，R)，…]；

S6-3-2、将S6-3-1中最后一次循环得到的s′输入到Critic网络中，得到状态的折扣回报val(s′)，计算折扣奖励：

得到R^Dis＝[R^Dis(1)，…，R^Dis(t)，…，R^Dis(T)]，其中T为时隙数量，R(t)，...，R(T-1)分别为t到T-1时隙的奖励值；

S6-3-3、将存储的状态s组合输入到Critic网络中，得到所有状态的val值，集合为VAL，R^Dis与VAL的差值，即优势值表示为

S6-3-4、求优势值平方的均值，表示为

S6-3-5、将存储的状态s组合输入到Actor-old和Actor-new网络中，分别得到正态分布Normal1和Normal2，将存储的动作A组合输入到正态分布Normal1和Normal2，得到每个动作对应的prob1和prob2；

S6-3-6、计算

，

其中r_t(θ)是prob2除以prob1得到的比例,clip(r_t(θ)，1-ε，1+ε)的用途是剪裁r_t(θ)，将其保持在[1-ε，1+ε]内，ε用来确定范围大小；

S6-3-7、循环步骤S6-3-5、S6-3-6，用Actor-new网络权重来更新Actor-old网络；

S6-3-8、循环步骤S6-3-1到S6-3-7，得到最优的计算资源分配方案；

S6-4、循环执行步骤S6-2和步骤S6-3，直到相邻两次迭代下用户总时延差的绝对值小于预设阈值，或者达到最大预设迭代次数时，迭代结束，即获得无人机的轨迹以及最优的卸载比例、计算资源分配方案；

2.根据权利要求1所述一种用于拥挤场馆中无人机辅助边缘计算方法，其特征在于，所述步骤S1具体包括：

S1-1、在活动开始前将预计到来的用户数量NUM以及活动开始时间信息发送给基站，将NUM设为拥挤阈值；

S1-2、当场馆内用户数量小于NUM时，视为一般状态，若超过，则视为拥挤状态，当基站检测到场馆进入拥挤状态时，将场馆中所有用户的集合视作数据集，将用户视为数据点，使用自然最近邻居搜索算法获得数据集中每个数据点的自然邻居并计算每个数据点的密度；

S1-3、获取每个数据点的代表点和稀疏邻居，代表点Exemplar(q)的公式表示如下：

Exemplar(q)＝max{Den(NN(p))&&p≠q}

稀疏邻居SN(p)的公式表示如下：

SN(p)＝{q|Den(q)＜Den(p)&&q∈NN(p)}

其中p和q均是数据点，NN(p)代表数据点p自然邻居的集合，Den表示相应数据点的密度，代表点为数据点密度最大的自然邻居；

S1-4、统计所有的密度峰并任意访问一个密度峰，将该密度峰和该密度峰的稀疏邻居分到同一个聚类，其中如果数据点p满足

则数据点p为一个密度峰；

S1-5、对所有未访问的密度峰重复步骤S1-4，直到所有的密度峰都被访问；生成初始类簇；

S1-6、根据初始类簇之间的相似度关系，合并相似度大于类间相似度阈值Sim_max的初始类簇，其中，类间相似度为

|c_α∩c_β|是类

和类

的公共部分，SUP是自然邻居特征值；设定一个类簇数据点数阈值PMAX，当一个类簇的数据点数超过数据点数阈值PMAX时，该类簇不合并；

S1-7、将类簇中数据点个数小于最小自然邻居数的类簇从合并类簇后得到的聚类结果中去除，并将这些类簇中的数据点标记为噪声点，获得最终的聚类结果，将最终类簇的数量定义为M，并在每个类簇上空部署一架无人机，其中最小自然邻居数是数值最小的NUM_NN(p)，NUM_NN(p)是数据点的自然邻居数；

S1-8、无人机辅助的边缘计算系统由1个基站、M架无人机和N个用户组成，每架无人机的初始位置为其对应的类簇内所有数据点位置的平均值，边缘计算系统运行过程中，无人机会根据用户的任务量进行移动。

3.根据权利要求1所述一种用于拥挤场馆中无人机辅助边缘计算方法，其特征在于，所述步骤S2具体包括：

S2-1、将用户活动周期划分为T个时隙，每个时隙的时间为τ，用户位置为L_i＝(X_i，Y_i，0),X_i，Y_i分别是用户i的横纵坐标，在t时隙用户设备产生的任务为Λ_i(t)＝[k，λ_i，k(t)，c_i，k]，其中k为用户i任务产生顺序的任务编号；λ_i，k(t)表示用户i产生的第k个任务的数据量，单位为比特，c_i，k是计算用户i产生的第k个任务所需的CPU周期数；

S2-2、在基站端构建物理实体网络的数字孪生网络，包括用户设备部分和无人机部分；

在t时隙，用户的数字孪生体DT_i(t)表示为：

DT_i(t)＝{L_i，f_i，f_i(t)，f_i(t)，p_i(t)，Λ_i(t)}

其中L_i表示用户i的位置，f_i表示用户i的最大计算资源，f_i(t)表示用户i在t时隙用于本地处理任务的计算资源，f_i^(t)是用户i与其数字孪生体之间计算资源的估计误差，pi(t)表示用户i在t时隙的上行传输功率；

在t时隙，无人机j的数字孪生体DT_j(t)表示为：

DT_j(t)＝{L_j(t)，f_j ^MEC，f_j ^MEC(t)，f_j^^MEC(t)，B_j(t)}

其中L_j(t)是无人机j在t时隙的位置，表示为L_j(t)＝(X_j(t)，Y_j(t)，H)，X_j(t)，Y_j(t)，H分别表示无人机j在t时隙的横纵坐标和高度，f_j ^MEC是无人机j的最大计算资源，

代表无人机j在t时隙分别分配给N个用户i的计算资源的集合，

4.根据权利要求1所述一种用于拥挤场馆中无人机辅助边缘计算方法，其特征在于，所述步骤S3具体包括：

S3-1、在t时隙，N个用户将一部分的任务进行本地处理，另一部分任务卸载到无人机上，用ρ_i(t)表示用户i本地处理任务的比例，(1-ρ_i(t))表

示用户卸载到无人机任务的比例，ρ_i(t)∈[0，1]；

S3-2、在t时隙，用户i的数字孪生体估计的在本地计算过程中计算时延

表示为：

表示为：

其中f_i^(t)是用户i与其数字孪生体之间计算资源的估计误差；

在t时隙，用户i本地计算任务实际消耗时间

表示为：

S3-3、用户i的数据传输速率r_ij(t)，表达式为：

X_i，Y_i分别表示用户i的横纵坐标，X_j(t)，Y_j(t)，H分别表示t时隙无人机j的横纵坐标及高度；用户i在t时隙将任务k卸载到无人机j的传输时延

表示为：

表示为：

其中

代表无人机j在t时隙分配给用户i的计算资源；

表示为：

其中

在t时隙，无人机j完成用户i卸载的任务实际消耗时间

表示为：

S3-5、构建用户本地计算队列模型，其中用户i数据队列

的动态方程为：

用户i计算队列

的动态方程为：

其中τ表示每个时隙的时间，

和

分别为用户i在t时隙的数据和任务队列，

表示计算用户i产生的第min K_i(t)个任务所需的CPU周期数，K_i(t)表示t时隙用户i缓冲区任务编号的集合，r_ij(t)τ表示t时隙用户i卸载到无人机j的任务量，τf_i(t)表示t时隙用户i本地处理的任务量，当用户i随机产生新任务Λ_i(t)时，将k加入K_i；队列执行任务采用先进先出的原则，minK_i(t)表示t时隙集合K_i(t)中最小的编号，即最先进入用户i队列的任务的编号；当用户i通过计算和卸载使任务k离开队列时，k将会从K_i中移除；当t＝0时，