CN111444786B

CN111444786B - 基于无人机群的人群疏散方法、装置、系统及存储介质

Info

Publication number: CN111444786B
Application number: CN202010170192.6A
Authority: CN
Inventors: 翟懿奎; 郑磊; 柯琪锐; 余翠琳; 周文略; 应自炉; 甘俊英; 王天雷; 麦超云
Original assignee: Wuyi University
Current assignee: Wuyi University
Priority date: 2020-03-12
Filing date: 2020-03-12
Publication date: 2023-04-18
Anticipated expiration: 2040-03-12
Also published as: CN111444786A

Abstract

本发明公开一种基于无人机群的人群疏散方法、装置、系统及存储介质，使用无人机协调合作进行疏散引导，引进多主体强化学习方法提出路径规划方案。其中的多主体强化学习方法，具备较强的环境适应能力和自学习能力，能够针对不同实际场景提出人群疏散路径，再结合高效便捷的无人机，使得该系统可在短时间内快速疏散人群，能为管理公共突发事件提供辅助决策支持，不仅适用于人群密集的公共活动区域，还可以应用到地震、海啸等自然灾害发生时的人群疏散。

Description

基于无人机群的人群疏散方法、装置、系统及存储介质

技术领域

本发明涉及公共安全管理领域，特别涉及一种基于无人机群的人群疏散方法、装置、系统及存储介质。

背景技术

近年来，公共场所的踩踏事故一般都出现人群密度过高的诱因。当前用于拥挤场景分析的方法是通过简单的人群计数以显示密度图。这种发展遵循了现实生活中应用程序的需求，然而相同数量的人可以人群分布完全不同，因此仅计算人数并不足够。

此外，在拥挤的区域中，一旦发生紧急情况，很容易引起恶性事件，例如人群拥挤和践踏。如果不能有效疏散人员，则很可能发生事故，例如大规模死亡。关于疏散模型的很多研究，包括基于多粒子自驱动系统框架的社会力量模型、模型构造规则构成的细胞自动机模型、流体动力学模型和混合模型，以上方法均将个人视为主体做出疏散逃生决策，没有考虑到在实际场景中，个人主体的行为会受到环境的影响，难以在真实场景中规划最佳疏散路径。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种基于无人机群的人群疏散方法、装置、系统及存储介质，能够对人群进行合理疏散引导。

根据本发明的第一方面实施例的基于无人机群的人群疏散方法，包括：

获取目标区域的人群视频，并每经过一定帧数间隔后从所述人群视频中获取一关键帧；

依据所述关键帧获取所述目标区域的人群密度；

若所述人群密度在一定时间内的波动超过预设阈值，则判断为突发事件；

依据所述人群密度和K-中心点算法对人群进行分组；

根据任务分配策略分配用于执行疏散引导的第一无人机以及用于疏散人群动态密度估计的第二无人机，设定多架所述第一无人机的位置和初始状态，以所述第一无人机的出发点为疏散目标点；

所述第一无人机运用行动更新策略，在Q价值表中选择移动方向；

所述第一无人机移动到下一个栅格，使得状态发生变化，获得环境的奖励，并对所述Q价值表进行更新；

控制多架所述第二无人机用于估计疏散人群动态密度；

所述第二无人机依据疏散人群的初始行人数量与到达出口行人数量，检查组内的行人是否全部到达出口点，若全部到达，则将当前路径序列添加到候选路径中。

根据本发明的一些实施例，所述依据所述关键帧获取所述目标区域的人群密度，包括：

对所述关键帧进行双线性插值预处理；

采用人群动态估计网络模型对所述关键帧进行预测分析，生成人群动态密度分布图，从而获取所述目标区域的人群密度。

根据本发明的一些实施例，还包括：

若两架所述第一无人机即将发生碰撞，根据优先级采用避让策略进行避让操作。

根据本发明的第二方面实施例的地面站控制装置，包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行如上所述的基于无人机群的人群疏散方法。

根据本发明的第三方面实施例的人群疏散系统，包括无人机平台、终端和如上所述的地面站控制装置，所述无人机平台包括飞行控制模块、摄像机模块和扩音模块，所述地面站控制装置与所述飞行控制模块、所述摄像机模块和所述扩音模块通信连接。

根据本发明的第四方面实施例的计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如上所述的基于无人机群的人群疏散方法。

根据本发明实施例的一种基于无人机群的人群疏散方法、装置、系统及存储介质，至少具有如下有益效果：本发明使用无人机协调合作进行疏散引导，引进多主体强化学习方法提出路径规划方案。其中的多主体强化学习方法，具备较强的环境适应能力和自学习能力，能够针对不同实际场景提出人群疏散路径，再结合高效便捷的无人机，使得该系统可在短时间内快速疏散人群，能为管理公共突发事件提供辅助决策支持，不仅适用于人群密集的公共活动区域，还可以应用到地震、海啸等自然灾害发生时的人群疏散。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请一个实施例的基于无人机群的人群疏散方法的流程图；

图2为本申请另一个实施例的基于无人机群的人群疏散方法的流程图；

图3为本申请另一个实施例的基于无人机群的人群疏散方法的流程图；

图4为本申请一个实施例的地面站控制装置的示意图；

图5为本申请一个实施例的人群疏散系统的示意图；

图6为本申请一个实施例的人群疏散系统中关于无人机平台的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本发明的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。

参照图1，本申请一个实施例提供一种基于无人机群的人群疏散方法，包括：

S110：获取目标区域的人群视频，并每经过一定帧数间隔后从人群视频中获取一关键帧；

S120：依据关键帧获取目标区域的人群密度；

S130：若人群密度在一定时间内的波动超过预设阈值，则判断为突发事件；

S140：依据人群密度和K-中心点算法对人群进行分组；

S150：根据任务分配策略分配用于执行疏散引导的第一无人机以及用于疏散人群动态密度估计的第二无人机，设定多架第一无人机的位置和初始状态，以第一无人机的出发点为疏散目标点；

S160：第一无人机运用行动更新策略，在Q价值表中选择移动方向；

S170：第一无人机移动到下一个栅格，使得状态发生变化，获得环境的奖励，并对Q价值表进行更新；

S180：控制多架第二无人机用于估计疏散人群动态密度；

S190：第二无人机依据疏散人群的初始行人数量与到达出口行人数量，检查组内的行人是否全部到达出口点，若全部到达，则将当前路径序列添加到候选路径中。

在一实施例中，本申请使用无人机协调合作进行疏散引导，引进多主体强化学习方法提出路径规划方案。其中的多主体强化学习方法，具备较强的环境适应能力和自学习能力，能够针对不同实际场景提出人群疏散路径，再结合高效便捷的无人机，使得该系统可在短时间内快速疏散人群，能为管理公共突发事件提供辅助决策支持，不仅适用于人群密集的公共活动区域，还可以应用到地震、海啸等自然灾害发生时的人群疏散。

在一实施例中，可以由执行人群密度估计的无人机搭载摄像仪，对人群进行实时视频拍摄。人群视频中每隔N帧取一关键帧(N可以取15)，经由人群密度算法得到人群动态密度分布图，实时掌握现场人群分布，合理调配密集人群疏散力量。依据人群动态密度分布数据，当区域内人群密度在一定时间内波动超过预设阈值，判断出现公共突发事件，进行疏散引导。先由K-中心点算法(K-Medoids算法)和人群密度对人群分组，基于任务分配策略调配无人机a、b、c、d……执行疏散引导，设定其位置及初始状态，各组以执行疏散引导的无人机出发点为疏散目标点。调配无人机A、B、C、D……配合执行人群密度估计。然后各组无人机基于行动更新策略选择动作，到达下一栅格，即在Q价值表中选择移动方向，使得该动作执行后预期收益最大。各组无人机移动到下一个栅格获得环境的奖励和对应的状态，更新Q价值表。

需要说明的是，关于无人机的协同疏散引导：为有效使用多个无人机进行人群疏散引导工作，无人机需要彼此共享信息，其中需要共享的信息主要包括以下三种：

无人机位置信息：GPS显示无人机的具体地理位置信息。

电池剩余量信息：根据无人机的剩余电量分配每个无人机的行动任务。

工作状态信息：主要分为“正常工作”、“停止飞行”两种状态。

根据行动任务的不同，将无人机划分为人群密度估计、人群疏散两种不同的无人机。

关于无人机之间的协同方式具体如下：

疏散指导过程中，无人机可能会因为电池没电或者意外碰撞障碍物而损坏。通过共享信息模块，如果某无人机的位置信息没有改变，则安排其他在疏散场所等待的无人机代替。

对于多无人机的协同任务分配，多无人机的实时任务分配采取以下策略：

定义疏散现场的实时任务集合T＝{T₁，T₂,T₃,T₄………}，待命执行任务的无人机集合R＝{R₁,R₂,R₃,R₄………}。无人机的电池电量有限，考虑到无人机距离疏散任务地点的距离，结合无人机的单程巡航半径r与到达疏散目标地的距离Dis(R_i)，满足Dis(R_i)≤r。

对于基于多主体强化学习算法的疏散引导计划，采用马尔科夫决策过程，具体如下：

状态表示采用栅格法。在人群待疏散区域，依据无人机、人群聚集块及场地大小利用单元格(即栅格)代替区域平面内的点。在被均匀划分为栅格的环境中，无人机与其带领的疏散人群用一个栅格表示，目标出口也用单一的栅格表示。障碍物则用不同颜色的多个连续栅格表示。处于边缘位置的栅格，无人机的动作方向将受到限制。而处于中间位置的栅格，在周边无障碍物的情况下，动作方向最多可有8个方向。

强化学习与人群疏散的基本因素之间的对应关系，参数主要包括为路径规划显式建立状态(S)，动作(A)和奖励(R)，价值函数(Q)。

状态参数可以用S表示，S_t∈S是时间t时无人机的坐标。

动作参数可以用A表示，在a_t∈A处无人机根据其当前状态选择下一个栅格的动作。无人机的动作方向包括8个方向的运动，分别是上、下、左、右、左上、左下、右上、右下。通常以S_t+1＝a(S_t)表示，S_t+1是无人机在下一时刻的状态。在无人机实际飞行中，将一个栅格设置为无人机的步长，将使得路径关键点过多，造成算法收敛速度慢。故将无人机步长设定为3个栅格。

奖励函数可以用R表示，用于描述无人机执行动作Z后环境对该动作的奖励。若无人机z引导疏散引导的人群到达目标出口点，则奖励值最大，为100。如果在疏散路径中无人机z遇到障碍或者是拥塞的路况，则奖励值最小，为-100。此外，当表征无人机z到目标出口点的距离和拥塞程度适应度函数r>0时，奖励值为1。r<0时，奖励值为-1。在此，i表示导航点的数量，j表示出口的数量。d_i表示从无人机当前位置到目标点的距离。无人机z当前位置是(x_i，y_i)，目标点是(x_n，y_n)。由p_j表示在目标出口点i记录的人数。拥塞区域的阈值b_j被设置为c₀。c_j表示出口j的拥塞程度。r是一个距离函数和拥塞函数组成的构造函数，并且R由构造函数r确定。那么无人机z到目标点的距离是：

拥塞函数定义为：

c_j＝p_j/b_j

适应度函数：

r＝w₁*(d_i-d_i+1)+w₂*(c′-c_j+1)

其中w₁和w₂是正权重值，且w₁+w₂＝1。

奖励函数设置如下：

更新策略参数为π用于描述状态，即从时间t的一组动作中选择a_t∈A的一个动作并替换无人机当前的动作，它是从状态集S的映射行动集A。考虑行人运动的不确定性。采用一种随机策略，即在特定状态下执行动作的概率π(a|s)＝P[A_t＝a|S_t＝s]。π(s_t)表示在情况s_t下的最佳策略状态。即在a_t的集合中Q(s_t,at)具有最大值。在获得最大值Q^c(s_t+1,a^*)之后，每个无人机i都会根据一定概率1-λ替换与自己的Q值表相对应的Qⁱ(s_t+1，ai)。策略更新公式如下：

对于Q学习算法：Q代表无人机状态动作的估计值。状态行为值函数的迭代计算公式使用标准Q学习算法公式。S_t表示无人机当前状态。a_t表示无人机的当前动作。s_t+1表示无人机下一个状态。a_t+1表示无人机的下一个动作。其中α表示学习率，介于0和1之间。将其设置为0.01。γ表示折扣因子，并且该值也在0和1之间，将其设置为0.9。R代表获得的奖励。Q(s_t，a_t)表示当前状态Q的值。Q(s_t+1，a_t+1)表示下一状态的最大估计值。Q(s_t,a_t)表示在无人机在状态s_t时动作a_t可获得的预期最大收益，而下一步骤的收益取决于下一阶段的动作。每个执行疏散引导任务无人机的Q表更新的公式如下：

Q(s_t,a_t)＝(1-α)Q(s_t，a_t)+a[R+γ*maxQ(s_t+1,a_t+1)]

当到达新的环境状态s_t+1时，根据分享的经验，无人机选择与该状态对应的最大值，然后进行行为选择。经验分享的公式定义如下：

Q^c(s_t+1,a)＝max{Q¹(s_t+1,a₁)Q²(s_t+1,a₂)…Qⁿ(s_t+1,a_n)}

在一定的状态s下，当无人机z选择动作时，对每一轮获得的知识和Q值进行连续优化，并经过多次训练得到最优策略。

对于基于人群密度的人群分组疏散：依据人群密度和改进的K-Medoids(K-中心点)算法以及对人群进行分组。在人群密度分布图，将与群集中心差异最小的数据点选择为新的群集核心，无人机将根据群集核心的地理位置信息，到达群集核心。由于人群疏散中的个体具有群体行为特征，因此考虑个体之间的差异程度来反映群体特征。

通常，k₁+k₂＝1。其中dif(i,j)表示相异函数。其中dist(i,j)代表个体i与个体j之间的几何距离，rel(i,j)代表个体i与个体j之间的关系，rangedist代表距离归一化因子，rangerel代表关系值归一化因子。通过不断调整两个特征的权重，可以获得用于计算相异度的不同公式。

参照图2，根据本申请的一些实施例，依据关键帧获取目标区域的人群密度，包括：

S210：对关键帧进行双线性插值预处理；

S220：采用人群动态估计网络模型对关键帧进行预测分析，生成人群动态密度分布图，从而获取目标区域的人群密度。

在一实施例中，人群动态密度估计网络模型分为前端和后端网络，采用VGG-16作为前端网络，用于提取二维平面上的特征。空洞卷积神经网络作为后端网络，在保持分辨率的同时扩大感知域，生成高质量的人群分布密度图。

对于无人机拍摄的人群视频，每隔15帧截取一个关键帧，对帧进行双线性插值处理后，由人群动态估计网络模型预测分析生成人群动态密度图。

其中双线性插值操作，是利用关键帧图像中虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值，使原图中的像素和特征图中的像素是完全对齐的，没有偏差，提高检测的精度。

对于数据预处理，包括：生成一张和原图一样大小的单通道图片，其中像素点全部取0，对于含有人头的点，label(标签)标记为1，通过高斯滤波处理该图像，形成的图即为人群密度图。

对于网络架构：

网络的前端采用VGG-16卷积部分，采用3*3的卷积核。为平衡准确性和资源开销，采用10层卷积层和3层池化层的组合，并在其中加入了BatchNormalization(批量标准化)防止梯度消失。

在后端使用空洞卷积增加感受野，空洞率相同，最后采用1*1的普通卷积层输出结果。定义一个二维的空洞卷积如下：

x(m,n)是长宽分别为M和N的输入图像信息，经过卷积核w(i,j)得到空洞卷积的输出y(m,n)，其中参数r表示空洞率。r＝1时空洞卷积是普通卷积。空洞卷积利用稀疏的卷积核，实现交替卷积和池化操作，在没有增加网络参数和计算规模的前提下增大感知域，更适合人群密度估计任务。空洞率为r的空洞卷积操作，K*K会被扩大为K+(K-1)(r-1)。

对于人群数据库，使用公开的人群图像数据集进行训练。UCF_CC_50数据集包含50个不同视角和分辨率的图像。每个图像的被标注人员数量在94到4543之间，平均数量为1280，训练时采用5倍交叉验证。UCSD数据集含有2000帧监控摄像头，这些场景中人群稀少的图片包含11到46人不等，且数据集提供感兴趣区域。2000帧视频图像选取601-1400帧作为训练集，并用双线性插值预处理，其余作为测试集。

对于训练中的Ground Truth的生成：通过使用高斯核(已归一化为1)模糊每个标注数据，生成Ground Truth。使用几何自适应内核来处理高度拥挤的场景，几何自适应内核定义为：

对于Ground Truth的δ中每个目标物体x_i，使用d_i表示K个最近邻居的平均距离。为生成密度图，将δ(x-x_i)与具有参数σ_i(标准偏差)的高斯核进行卷积，其中x是图像中像素的位置。其中β＝0.3，k＝3。对于稀疏人群的输入，将调整高斯核平均头部大小，以适应所有标注数据。

对于训练中的数据增强：使用图像裁剪、旋转、加噪等操作方式进行数据增强。

对于训练中的训练细节：在训练中，前10个卷积层是从已经训练好的VGG-16进行微调。对于其他层，初始值来自标准偏差为0.01的高斯初始化。SGD(随机梯度下降)应用1e-6的固定学习率。

选择欧式距离来测量Ground truth和生成的估计密度图之间的差异。损失函数如下：

其中N是训练批次的大小，Z(X_i；Θ)是参数为Θ时网络的输出结果，而

则是输入图像X_i的Ground Truth结果。

欧式距离如下：

对于视频处理：如果将拍摄人群视频的每一帧全部由人群密度估计模型进行预测，难以实时生成人群密度图，而且不同场景，不同的时间段，区域内人群密度变化存在较大的不确定性。视频图像中，1s包含24帧，为不减少获取视频的时间信息，又能实时动态估计人群，每隔15帧截取视频中一帧。每个关键帧的分辨率都是固定尺寸，不便频繁合并后生成高质量的密度图。这里使用双线性插值对关键帧预处理，将其调整为952×632送入模型，得到人群动态密度分布图。

参照图3，根据本申请的一些实施例，还包括：

S300：若两架第一无人机即将发生碰撞，根据优先级采用避让策略进行避让操作。

在一实施例中，多无人机在动态规划疏散路径中，可能会在疏散区域出现飞行交汇而发生碰撞。不同优先级的无人机在飞行交汇前采取避让策略，即优先级低的无人机在路径上采取避让，优先级高的无人机先通过。当优先级相同时，两个无人机都将进行避让，并随机由一个无人机先选取动作并执行，另一个无人机等待。而无人机的优先级高低，取决于其带领人群中的行人数量。

参照图4，根据本申请的一个实施例提供一种地面站控制装置100，包括至少一个控制处理器110和用于与至少一个控制处理器110通信连接的存储器120；存储器120存储有可被至少一个控制处理器110执行的指令，指令被至少一个控制处理器110执行，以使至少一个控制处理器110能够执行如上的基于无人机群的人群疏散方法。

参照图5-图6，根据本申请的一个实施例提供一种人群疏散系统，包括无人机平台200、终端300和如上的地面站控制装置100，无人机平台200包括飞行控制模块210、摄像机模块220和扩音模块230，地面站控制装置100与飞行控制模块210、摄像机模块220和扩音模块230通信连接。

在一实施例中，无人机可以选择四旋翼无人机。四旋翼无人机具有优良的操控性能，可定点盘旋，安全性高、使用成本低等优点。平台由飞行控制模块210、摄像机模块220、扩音模块230组成。飞行控制模块210包括陀螺仪212、GPS211、PID线性控制器213。陀螺仪212用于感知飞行姿态；GPS211实现水平位置高度粗略定位；PID线性控制器213，使多旋翼系统控制达到动态响应、既不过冲、也不欠缺。摄像机模块220由摄像仪与云台构成。由于无人机的快速移动，往往会存在一定程度的抖动，因此为摄像机模块220提供三轴增稳云台固定，以使得拍摄的视频图像清晰稳定。扩音模块230通过扩音，使得警务人员能够远程喊话、安抚引导群众。

需要说明的是，自动避障是使用激光传感器TFmini，用于监测无人机附近障碍物的距离和方向。使用激光传感器不会出现使用超声波传感器在测距时容易丢失信号的问题，且TFmini是低成本、小体积、低价格的功率激光传感器，适于室外应用环境。

另外，地面站控制装置100为基于apm飞控的mavlink协议的Misssion Planner地面控制系统，终端300可以为手机App端。使用Mission Planner地面控制系统观察无人机平台200的飞行状态，包括飞行距离、角度、电量等信息。同时提供基于Mission Planner地面站系统的手机端地面APP，包括飞控协议选择、界面、登录权限、自主航线、自主避障、多机连接。

本申请的一个实施例提供一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，计算机可执行指令用于使计算机执行如上的基于无人机群的人群疏散方法。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器120技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

上面结合附图对本发明实施例作了详细说明，但是本发明不限于上述实施例，在技术领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于无人机群的人群疏散方法，其特征在于，包括：

依据所述关键帧获取所述目标区域的人群密度；

依据所述人群密度和K-中心点算法对人群进行分组；

控制多架所述第二无人机用于估计疏散人群动态密度；

所述第二无人机依据疏散人群的初始行人数量与到达出口行人数量，检查组内的行人是否全部到达出口点，若全部到达，则将当前路径序列添加到候选路径中；

奖励函数用R表示，用于描述无人机执行动作Z后环境对该动作的奖励，若无人机z引导疏散引导的人群到达目标出口点，则奖励值最大，为100；如果在疏散路径中无人机z遇到障碍或者是拥塞的路况，则奖励值最小，为-100；当表征无人机z到目标出口点的距离和拥塞程度适应度函数r>0时，奖励值为1；r<0时，奖励值为-1；在此，i表示导航点的数量，j表示出口的数量，d_i表示从无人机当前位置到目标点的距离，无人机z当前位置是(x_i,y_i)，目标点是(x_n,y_n)，由p_j表示在目标出口点i记录的人数，拥塞区域的阈值b_j被设置为c₀，c_j表示出口j的拥塞程度，r是一个距离函数和拥塞函数组成的构造函数，并且R由构造函数r确定，那么无人机z到目标点的距离是：

拥塞函数定义为：

c_j＝p_j/b_j

适应度函数：

r＝w₁*(d_i-d_i+1)+w₂*(c′-c_j+1)

其中w₁和w₂是正权重值，且w₁+w₂＝1；

奖励函数设置如下：

2.根据权利要求1所述的基于无人机群的人群疏散方法，其特征在于，所述依据所述关键帧获取所述目标区域的人群密度，包括：

对所述关键帧进行双线性插值预处理；

3.根据权利要求1所述的基于无人机群的人群疏散方法，其特征在于，还包括：

4.一种地面站控制装置，其特征在于，包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行如权利要求1至3任一项所述的基于无人机群的人群疏散方法。

5.一种人群疏散系统，其特征在于，包括无人机平台、终端和如权利要求4所述的地面站控制装置，所述无人机平台包括飞行控制模块、摄像机模块和扩音模块，所述地面站控制装置与所述飞行控制模块、所述摄像机模块和所述扩音模块通信连接。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1至3任一项所述的基于无人机群的人群疏散方法。