CN114510081A

CN114510081A - 通信延迟约束下的多无人机集群导航方法

Info

Publication number: CN114510081A
Application number: CN202210218345.9A
Authority: CN
Inventors: 王光敏; 张得海; 陈宇
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-03-04
Filing date: 2022-03-04
Publication date: 2022-05-17

Abstract

本发明提出了一种通信延迟约束下的多无人机集群导航方法，解决了无人机群中无人机间的通信存在延迟条件下，集群系统难以实现稳定集群的技术问题。本发明将集群导航过程划分为准备阶段和飞行阶段，准备阶段包括对集群中无人机运动建模、对无人机飞行状态数据处理得到训练样本、构建LSTM模型并用训练样本训练LSTM模型，飞行阶段包括无人机起飞初始化、发送交互飞行信息、接收交互飞行信息，最终实现通信延迟约束下的多无人机集群导航。本发明具有通信和计算开销小和可实现通信延迟约束下多无人机稳定集群飞行的优点，应用于无人机集群导航，能够避免无人机集群飞行过程中因时间延迟导致的集群飞行抖动，降低无人机集群飞行过程中发生碰撞的概率。

Description

通信延迟约束下的多无人机集群导航方法

技术领域

本发明属于多智能体协同控制领域，主要涉及无人机集群导航，具体是一种通信延迟约束下的多无人机集群导航方法，主要应用在分布式无人机集群导航中。

背景技术

目前随着无人机智能化水平的不断提高，无人机的应用领域越来越广，单个无人机已经无法满足复杂的任务需求，无人机集群控制技术已成为无人机领域发展的重要研究方向。无人机集群系统是指由一定数量的无人机组成，利用信息交互与反馈、激励与响应实现相互间行为协同，共同完成特定任务的自主式空中智能系统。目前无人机集群控制方法主要分为两大类，一类是集中式控制方法，该方法依赖于无人机与中心节点之间的有效通信，使用一个中央控制器协调无人机的运动；另一类是分布式控制方法，该方法中没有中心控制器，无人机通过自主决策完成自组织碰撞避免。许多现有方法假定无人机通过通信可以实时获取周围无人机的飞行信息，但在实际应用中，无人机之间的通信常常存在不稳定的延迟与中断等问题，导致无人机无法实时获取到周围无人机的飞行信息，周围无人机也无法实时获取到该无人机的飞行信息，从而降低规划飞行路径的精度，影响控制系统的稳定性，导致无人机碰撞发生的概率大大增加。

自2014年已有研究团队将其设计的集群算法应用于真实的户外无人机集群中，首次实现了多达十架无人机稳定的自主户外飞行。在该团队设计的算法中，考虑了时间延迟的影响，集群中每架无人机利用周围邻居无人机的历史飞行信息规划自身的飞行路径，并通过全局参数调整让系统达到一个稳定的集群状态。这种延迟解决方案存在的问题是当集群中无人机系统处于数量较大或间距较小的情况时，无人机间容易发生碰撞，并且在比较复杂的场景下参数的调节需要花费大量计算与通信开销。此外，控制论中针对时间延迟问题也有较多研究，为了解决多无人机集群通信中信号传输的延迟问题，通常方案是设计合理的控制协议，利用矩阵论和稳定性理论，得到系统达到滞后一致的充分条件，并证明在这些条件限制下的系统最终能够达到一致状态。这些控制理论建立在控制器可以获取全局信息并为环境与无人机建立精确模型的基础上。但在实际运行环境中，由于通信条件的限制，单个无人机很难获取全局信息，此外，基于控制理论设计的模型需要满足一系列的约束才能保证模型的可用性。

现有通信延迟约束的多无人机集群导航方案主要基于控制协议的设计，通常控制协议中控制器需要获取全局信息并为环境与无人机建立精确模型，然后根据模型构建方程式推导出系统最终达到一致性需要满足的约束条件，通过证明验证当集群系统满足这些约束条件时，集群导航运动可以达到最终一致。这种技术方案存在的不足是集群在复杂环境中一致性难以保证，并且鲁棒性较低，即使环境发生细微变化，也可能会导致一致性约束条件无法满足，使得系统集群导航运动无法达到最终一致。

发明内容

本发明的目的是针对现有技术的不足，提出一种保证集群中无人机间的通信存在或大或小的通信延迟时无人机仍能保持稳定集群飞行的通信延迟下的多的多无人机集群导航方法。

本发明是一种通信延迟约束下的多无人机集群导航方法，其特征在于，将集群导航过程划分为准备阶段和飞行阶段，包括如下步骤：

准备阶段

S1、对集群中无人机运动建模：集群中邻居无人机指当前无人机一定通信范围内的其他无人机，控制函数是飞行状态到飞行速度的映射关系式，每架无人机通过控制函数计算输出下一时刻飞行速度时仅获取周围位于自身通信阈值r_c范围内邻居无人机的飞行位置和飞行速度作为输入，设定控制函数生成的速度受到自主导航力、邻居无人机产生的排斥作用力、邻居无人机产生的吸引作用力、邻居无人机产生的对齐作用力、障碍物产生的排斥作用力的影响；每一个作用力对应一个控制函数分量，邻居无人机产生的排斥、吸引、对齐作用力以及障碍物产生的排斥作用力根据邻居和障碍物的不同划分为各自的控制函数子分量；控制函数子分量累加得到控制函数分量，控制函数是所有控制函数分量之和；无人机运动模型的输出就是控制函数的输出，无人机一个飞行时刻对应一个时间步长，设步长为Δt，当前无人机通过控制函数计算自身下一时刻飞行速度，集群中每架无人机在不同时刻的飞行状态下会通过控制函数计算并输出自身飞行状态对应的飞行速度；

S2、对无人机飞行状态数据处理得到训练样本：在每个无人机控制芯片内部存储空间中划分一块Data空间，用以存储无人机飞行状态数据；每一个无人机发送自身飞行位置和飞行速度信息给邻居无人机并接收邻居无人机的飞行位置和飞行速度信息；收集真实集群环境或仿真环境中集群飞行的无人机飞行状态数据，放入Data空间；读取所有无人机飞行状态数据并将其划分为输入特征集和输出特征集，输入特征集中每条以数据记录形式保存的数据为无人机在当前时刻之前多个时刻飞行状态数据；输出特征集中每条以数据记录形式保存的数据为无人机在当前时刻之后多个时刻的飞行位置和飞行速度数据；输入特征集中一条数据对应输出特征集中一条数据，将输入特征集中每条以数据记录形式保存的数据和输出特征集中每条以数据记录形式保存的数据一一对应，形成一对训练样本，将输入特征集和输出特征集中所有数据记录汇总得到无人机飞行状态的训练样本集；

S3、构建LSTM模型，用训练样本训练LSTM模型：长短期记忆网络LSTM模型输入数据为无人机当前时刻及之前多个时刻的飞行状态数据，输出预测数据为无人机未来多个时刻的飞行位置和飞行速度；构建的LSTM模型至少包含两个隐藏层和一个attention层，采用Adam优化器；将输入数据输入到LSTM模型的第一个隐藏层，数据经过层层处理输出到attention层，经过attention层运算处理后输出预测数据；训练前初始化LSTM模型的权重，导入无人机飞行状态的训练样本集训练样本训练LSTM模型参数，得到训练好的LSTM模型；

飞行阶段

S4、无人机起飞初始化：将训练的LSTM模型应用于所有无人机，初始化无人机内部芯片中的存储空间，包括Data空间，此时刻时间戳t＝0，为每个无人机初始化飞行位置和飞行速度，无人机飞行时间步长设为Δt；

S5、发送交互飞行信息：无人机通过无线通信设备发送交互飞行信息，初始飞行阶段无人机以当前时刻真实飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行阶段无人机将当前时刻真实飞行位置和飞行速度及未来多个时刻的预测飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行位置和预测飞行速度根据训练得到的LSTM模型计算输出；

S6、接收交互飞行信息：当前无人机通信获取邻居无人机发送的交互飞行信息，当前无人机根据交互飞行信息通过控制函数计算自身下一时刻飞行速度，计算时需要读取邻居无人机当前时刻的飞行位置和飞行速度；但部分邻居无人机发送的交互飞行信息会因为通信延迟无法被当前无人机准时收到，如果某个邻居无人机在当前时刻的交互飞行信息没有被当前无人机接收到，当前无人机就读取已接收到的该邻居无人机交互飞行信息里面最新的关于当前时刻的预测飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量；如果接收到邻居无人机发送的交互飞行信息，则当前无人机直接读取该邻居无人机当前时刻的交互飞行信息，将该邻居无人机当前时刻飞行位置和飞行速度用于计算该邻居无人机对应的所有影响力产生的控制函数子分量；通过控制函数计算当前无人机下一时刻的飞行速度时，将当前无人机自身飞行位置和飞行速度和通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物的位置信息作为控制函数的输入计算当前无人机下一时刻飞行速度，实现通信延迟下的多无人机集群导航。

本发明解决了无人机群中无人机间的通信存在或大或小的不确定性通信延迟条件下无人机难以稳定集群的技术问题。

本发明与现有技术对比具有下述优点：

通信和计算开销小：本发明中无人机在规划自己下一步的运动路径时只需获取一定通信范围内距离自己最近的一定数量无人机的飞行信息，无需获取全局所有无人机信息建立精确的模型，可以大幅度降低通信开销和计算开销，无人机在复杂环境中规划路径时受到的不确定性影响更小，其相比传统控制方法而言具备更强的鲁棒性。

实现在或大或小通信延迟约束下的多无人机稳定集群飞行：本发明引入LSTM模型预测无人机在一定时间延迟后飞行速度和飞行位置发送给邻居无人机，当邻居无人机由于通信延迟无法获取该无人机实时飞行位置和飞行速度信息时，可以从该无人机历史预测信息中读取当前时刻的预测信息，该预测模型使用多个时刻历史飞行状态数据预测无人机未来多个时刻的飞行位置和飞行速度，经过训练能达到较高预测准确率，并且可以应对通信网络中或大或小的通信延迟，能够降低通信延迟给系统带来的碰撞风险。

相比于传统控制算法，本发明能更好解决通信延迟约束下的多无人机集群导航问题，降低了集群中的通信和计算开销，通过历史经验数据提高LSTM模型预测准确率，在系统存在不确定性通信延迟条件下，通过模型预测值进行补点操作，进而提高了无人机集群系统在通信延迟约束下的可靠性。

附图说明

图1为本发明的流程示意图；

图2为通信范围有限条件下无人机i所处集群环境示意图；

图3为本发明的LSTM模型框架示意图。

具体实施方式

实施例1

鉴于分布式控制方法具备更好的自主性，本发明使用分布式控制方法。系统中自主飞行的每架无人机都需要通过无线通信获取周围邻居无人机的飞行信息，包括飞行位置和飞行速度等信息，然后利用这些信息规划其飞行路径。

无人机集群系统中自主飞行的每架无人机都需要通过无线通信获取周围邻居无人机的飞行信息，然后利用这些信息规划其飞行路径，许多现有集群方法假定无人机通过通信可以实时获取周围无人机的飞行信息，但在实际应用中，无人机之间的通信常常存在不稳定的延迟与中断等问题，导致该无人机无法实时获取到周围无人机的飞行信息从而导致碰撞的发生。

现有考虑通信延迟约束的无人机集群方案主要基于控制协议的设计，通常控制协议中控制器需要获取全局信息并为环境与无人机建立精确模型，然后根据模型构建方程式推导出系统最终达到一致性需要满足的约束条件，通过证明验证当集群系统满足这些约束条件时，集群导航运动可以达到最终一致。这种技术方案存在的不足是集群在复杂环境中一致性难以保证，并且鲁棒性较低，即使环境发生细微变化，也可能会导致一致性约束条件无法满足，使得系统集群导航运动无法达到最终一致。为了克服这些缺陷，本发明提出一种通信延迟约束下的多无人机集群导航方法。

本发明是一种通信延迟约束下的多无人机集群导航方法，参见图1，图1是本发明的流程示意图，本发明将集群导航过程划分为准备阶段和飞行阶段，包括如下步骤：

准备阶段

S1、对集群中无人机运动建模：集群中邻居无人机指当前无人机一定通信范围内的其他无人机，控制函数是飞行状态到飞行速度的映射关系式，每架无人机通过控制函数计算输出下一时刻飞行速度时仅获取周围位于自身通信阈值范围内邻居无人机的飞行位置和飞行速度作为输入，通信阈值设置为r_c，即|x_i-x_j|＜r_c(x_i和x_j分别表示当前无人机i和邻居无人机j的位置)。设定控制函数生成的速度受到自主导航力、邻居无人机产生的排斥作用力、邻居无人机产生的吸引作用力、邻居无人机产生的对齐作用力、障碍物产生的排斥作用力的影响；每一个作用力对应一个控制函数分量，邻居无人机产生的排斥、吸引、对齐作用力以及障碍物产生的排斥作用力根据邻居和障碍物的不同划分为各自的控制函数子分量；控制函数子分量累加得到控制函数分量，控制函数是所有控制函数分量之和；无人机运动模型的输出就是控制函数的输出，无人机一个飞行时刻对应一个时间步长，设步长为Δt，当前无人机通过控制函数计算自身下一时刻飞行速度，集群中每架无人机在不同时刻的飞行状态下会通过控制函数计算并输出自身飞行状态对应的飞行速度。

无人机运动模型中各个控制函数分量中包含一定数量的参数，根据集群目标设定一定数量的评估指标，如速度一致性评估指标，碰撞风险评估指标，优化参数让集群能够达到比较好的评估结果，再将对应的参数应用于控制函数作用于所有无人机。

S2、对无人机飞行状态数据处理得到训练样本：在每个无人机控制芯片内部存储空间中划分一块Data空间，用以存储无人机飞行状态数据。集群中无人机之间通过无线通信设备进行通信，每一个无人机发送自身飞行位置和飞行速度信息给邻居无人机并接收邻居无人机的飞行位置和飞行速度信息。收集真实集群环境或仿真环境中集群飞行的无人机飞行状态数据放入Data空间。读取所有无人机飞行状态数据并将其划分为输入特征集和输出特征集，输入特征集中每条以数据记录形式保存的数据为无人机在当前时刻及之前多个时刻飞行状态数据；输出特征集中每条以数据记录形式保存的数据为无人机在当前时刻之后多个时刻的飞行位置和飞行速度数据；输入特征集中一条数据对应输出特征集中一条数据，将输入特征集中每条以数据记录形式保存的数据和输出特征集中每条以数据记录形式保存的数据一一对应，形成一对训练样本，将输入特征集和输出特征集中所有数据记录汇总得到无人机飞行状态的训练样本集。

S3、构建LSTM模型，用训练样本训练LSTM模型：长短期记忆网络LSTM模型输入数据为无人机当前时刻及之前多个时刻的飞行状态数据，输出预测数据为无人机未来多个时刻的飞行位置和飞行速度；构建的LSTM模型框架参见图3，该模型至少包含两个隐藏层和一个attention层，采用Adam优化器；将输入数据输入到LSTM模型的第一个隐藏层，数据经过层层处理输出到attention层，经过attention层运算处理后输出预测数据；训练前初始化LSTM模型的权重，导入无人机飞行状态的训练样本集训练样本训练LSTM模型参数，得到训练好的LSTM模型。

飞行阶段

S4、无人机起飞初始化：将步骤S3中训练的LSTM模型参数保存在所有无人机控制芯片内部，无人机可以输入历史飞行状态数据通过LSTM模型得到预测飞行位置和飞行速度信息。初始化无人机内部芯片中的存储空间，包括Data空间，初始时间戳t＝0，为每个无人机初始化飞行位置和飞行速度，无人机飞行时间步长设为Δt。

S5、发送交互飞行信息：无人机通过无线通信设备发送交互飞行信息，初始飞行阶段无人机以当前时刻真实飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行阶段无人机将当前时刻真实飞行位置和飞行速度及未来多个时刻的预测飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行位置和飞行速度根据训练得到的LSTM模型计算输出。

S6、接收交互飞行信息：当前无人机通信获取邻居无人机在步骤S5中发送的交互飞行信息，当前无人机根据交互飞行信息通过控制函数计算自身下一时刻飞行速度，计算时需要读取邻居无人机当前时刻的飞行位置和飞行速度；但部分邻居无人机发送的交互飞行信息会因为通信延迟无法被当前无人机准时收到，如果某个邻居无人机在当前时刻的交互飞行信息没有被当前无人机接收到，当前无人机就读取已接收到的该邻居无人机交互飞行信息里面最新的关于当前时刻的预测飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量，由于邻居无人机交互飞行信息中预测了未来多个时刻的飞行位置和飞行速度，在无人机间通信存在不确定通信延迟时当前无人机可以读取最新获取到的该邻居无人机未来多个时刻的预测飞行位置和飞行速度。如果接收到邻居无人机发送的交互飞行信息，则当前无人机直接读取该邻居无人机当前时刻的交互飞行信息，获取该邻居无人机当前时刻飞行位置和飞行速度用于计算该邻居无人机对应的所有影响力产生的控制函数子分量；通过控制函数计算当前无人机下一时刻的飞行速度时，将当前无人机自身飞行位置和飞行速度和通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物的位置信息作为控制函数的输入计算当前无人机下一时刻飞行速度，即当前无人机通信范围内所有邻居无人机产生的排斥、吸引、对齐作用力对应的控制函数子分量，当前无人机自驱动力对应的控制函数子分量，障碍物作用力对应的控制函数子分量累加得到当前无人机下一时刻的速度，以避免与集群中邻居无人机或障碍物的碰撞，实现通信延迟下的多无人机集群导航。

传统控制方案通常获取全局信息并为环境与无人机建立精确模型，然后根据模型构建方程式推导出系统最终达到时滞一致需要满足的约束条件。这种方案存在的问题是模型的构建需要获取全局信息并且鲁棒性较低，即使环境发生细微变化，也可能会导致系统一致性约束无法满足，使得系统不稳定。本发明提出的通信延迟约束下的多无人机集群导航方案，首先对无人机运动建模，无人机仅获取一定通信范围内邻居无人机的飞行信息，设计飞行场景及合理的评估指标，训练控制函数中的参数值，将评估效果较好的参数值应用于控制函数，然后获取真实及仿真环境中无人机的飞行状态数据，将其划分为输入特征数据和输出特征数据，作为LSTM模型的训练样本，优化模型参数，将该模型作为预测模型，使用无人机多个时刻历史飞行状态数据预测未来多个时刻的飞行位置和飞行速度信息，这样当无人机发送的实时飞行位置和飞行速度由于时间延迟未被邻居无人机接收到时，邻居无人机可以读取之前时刻该无人机发送的预测信息。

本发明的方案无需获取全局信息即可完成系统集群运动，并且通过历史经验数据提高LSTM模型预测准确率，在不确定性通信延迟条件下，通过模型预测值进行补点操作，进而提高了无人机集群系统在通信延迟约束下的可靠性；通过预测无人机未来多个时刻的飞行位置和飞行速度来应对网络中可能存在的不确定性通信延迟，更能保证集群的稳定性。

实施例2

通信延迟约束下的多无人机集群导航方法同实施例1，步骤S1所述的对集群中无人机运动建模包括有如下步骤：

S11、设定控制函数：控制函数为当前无人机在自主导航力、邻居无人机产生的排斥作用力、邻居无人机产生的吸引作用力、邻居无人机产生的对齐作用力、障碍物产生的排斥作用力对当前无人机速度影响而产生的所有飞行速度之和，运动模型控制函数关于无人机i下一时刻速度的计算公式为：

其中，

表示无人机i计算得到的下一时刻的速度；v_i表示无人机i当前时刻的速度；v^prefer表示无人机飞行过程中的期望速度值，

表示邻居无人机j对无人机i由于吸引作用力产生的速度控制子分量；

表示邻居无人机j对无人机i由于对齐作用力产生的速度控制子分量；

表示邻居无人机j对无人机i由于排斥作用力产生的速度控制子分量；

表示无人机i飞行过程中障碍物c对无人机产生的速度控制子分量。每个速度控制子分量受到邻居无人机飞行位置和飞行速度的影响，以

为例，计算该子分量时需要获取邻居无人机的位置，两架无人机距离越近，无人机j对无人机i产生排斥作用越大，具体影响作用的大小由排斥力参数决定。

每个控制函数分量中包含一定数量的参数，如排斥力对应的排斥系数，本实施案例根据集群目标设定一定数量的评估指标，如速度一致性评估指标，碰撞风险评估指标，优化参数让集群能够达到比较好的评估结果，再将对应的参数应用于控制函数作用于所有无人机。

S12、无人机获取飞行状态计算自身下一时刻飞行速度：当前无人机的飞行状态包括当前无人机自身飞行位置和飞行速度，还包括其通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物位置信息；无人机一个飞行时刻对应一个时间步长，设步长为Δt，飞行状态作为控制函数的输入用于计算当前无人机下一时刻的飞行速度，以避免和其他无人机发生碰撞并且保证无人机实现集群。

这里的控制函数是无人机运动过程中速度更新规则，本发明中无人机仅获取一定通信范围r_c内邻居无人机的飞行位置和飞行速度信息即可完成速度更新，无需获取全局信息。

实施例3

通信延迟约束下的多无人机集群导航方法同实施例1-2，本发明步骤S3所述构建LSTM模型，LSTM模型框架示意图如图3，用训练样本训练LSTM模型，包括有以下步骤：

S31、构建LSTM模型：LSTM模型是一个深度学习预测模型，本发明构建的LSTM模型框架参见图3，该模型对无人机的飞行位置和飞行速度进行预测。LSTM模型输入数据为无人机当前时刻及之前多个时刻的飞行状态数据，飞行状态数据包括当前无人机自身飞行位置和飞行速度，还包括其通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物位置信息；输出预测数据为无人机未来多个时刻的预测飞行位置和飞行速度。构建的LSTM模型采用Adam优化器，Adam优化学习率取值范围为[0.0001,0.2]，设置隐藏层为两层，单层LSTM隐藏层神经元数取值范围为[20,60]，将输入数据传输到第一个隐藏层，隐藏层对输入数据进行数学计算并传递到下一个隐藏层，最后一层隐藏层处理完成后会输出一个时序向量，该时序向量经过attention层的运算处理得到无人机未来多个时刻的预测飞行位置和飞行速度输出。

S32、用训练样本训练LSTM模型：初始化LSTM网络模型的权重，将LSTM网络模型及输入数据的参数权重设置为正态分布，用正态分布随机生成参数的初始值，导入训练样本集训练LSTM模参数，得到训练好的LSTM模型。

长短期记忆网络(long short-term memory,LSTM)是一种功能强大的深度学习预测模型，能有效应用于时间序列问题，目前该方法已经被应用于许多时空预测应用中。LSTM是一种特殊的循环神经网络，相比于普通循环神经网络更加先进。除标准神经元外，LSTM还设计了特殊的记忆单元将数据序列中的信息保存起来，因此能够有效提取序列上下文信息，并且在处理复杂时间序列问题上具有明显优势。在本发明中，引入LSTM模型，输入无人机多个时刻的历史飞行状态数据，可预测未来多个时刻该无人机的飞行位置和飞行速度信息。

实施例4

通信延迟约束下的多无人机集群导航方法同实施例1-3，本发明步骤S5所述发送交互飞行信息，包括有以下步骤：

S51、初始飞行阶段信息发送：无人机通过无线通信设备发送交互飞行信息，无人机使用连续h个时刻历史飞行状态数据进行预测，在当前时刻k＜h时无人机以当前时刻真实飞行位置和飞行速度作为交互飞行信息发送给邻居无人机。

S52、预测飞行阶段信息发送：当前时刻k≥h时无人机根据训练得到的LSTM模型输出该无人机在未来多个时刻的预测飞行位置和飞行速度，将当前时刻真实飞行位置和飞行速度及未来多个时刻的预测飞行位置和飞行速度作为交互飞行信息发送给邻居无人机。

无人机发送的交互飞行信息不仅包含自身当前时刻飞行位置和飞行速度，还包括自身未来多个时刻飞行位置和飞行速度的预测值，这样邻居无人机未获取当前时刻该无人机飞行位置和飞行速度信息时能够从历史接收信息中读取该无人机当前时刻的飞行位置和飞行速度预测值，该方法能够应对通信网络中可能存在的或大或小的通信延迟。

实施例5

通信延迟约束下的多无人机集群导航方法同实施例1-4，本发明步骤S6所述接收信息，包括有以下步骤：

S61、无人机接收邻居无人机发送的交互飞行信息：当前无人机通信获取邻居无人机在步骤S5中发送的交互飞行信息，当前无人机根据交互飞行信息通过控制函数计算自身下一时刻飞行速度，计算时需要读取邻居无人机当前时刻的飞行位置和飞行速度。

S62、邻居无人机当前时刻的交互飞行信息已经被接收到：当前无人机读取邻居无人机当前时刻真实飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量。

S63、邻居无人机当前时刻的真实飞行位置和飞行速度未被接收到：如果某个邻居无人机在当前时刻的交互飞行信息没有被当前无人机接收到，当前无人机就读取已接收到的该邻居无人机交互飞行信息里面最新的关于当前时刻的预测飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量。由于邻居无人机交互飞行信息中预测了未来多个时刻的飞行位置和飞行速度，在无人机间通信存在不确定通信延迟时当前无人机可以读取最新获取到的该邻居无人机未来多个时刻的预测飞行位置和飞行速度。

S64、拼接获取飞行状态：将当前无人机自身飞行位置和飞行速度和通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物的位置信息拼接融合得到无人机的飞行状态，将该飞行状态作为控制函数的输入计算当前无人机下一时刻飞行速度，即当前无人机通信范围内所有邻居无人机产生的排斥、吸引、对齐作用力对应的控制函数子分量，当前无人机自驱动力对应的控制函数子分量，障碍物作用力对应的控制函数子分量累加得到当前无人机下一时刻的飞行速度。

S65、判断本次飞行是否结束：无人机如果接收到飞行终止指令或者当前集群已飞行时间达到最长飞行时间，则表明本次集群飞行结束，执行步骤S66，否则，跳回步骤S5发送交互飞行信息。

S66、结束本次集群运动。

本发明的通信延迟约束下的多无人机集群导航方法，属于多智能体协同控制领域，主要应用在无人机分布式集群算法中。由于实际应用中无人机间通信存在通信延迟，导致无人机在当前时刻无法实时获取周围邻居无人机此时的飞行信息以准确规划无碰撞路径，导致系统稳定性偏低。本发明使用基于LSTM的神经网络预测无人机在一定时间延迟后的飞行信息，然后将预测信息共享给周围邻居无人机，邻居无人机可以通过该无人机的预测信息规划自己的运动路径。该方法能有效避免无人机集群飞行过程中因时间延迟导致的集群飞行抖动，显著降低无人机集群飞行过程中发生碰撞的概率。

下面给出一个更加详细的例子对本发明进一步说明。

实施例6

通信延迟约束下的多无人机集群导航方法同实施例1-5，整体流程参见图1。在本实施案例中将无人机集群问题简化，假定无人机的飞行高度相同，无人机的位置信息用p＝(α,β)表示，其中α表示无人机位置在x轴上的分量，β表示无人机位置在y轴上的分量。无人机飞行速度用v＝(v_x,v_y)表示，其中v_x表示无人机速度在x轴上的分量，v_y表示无人机速度在y轴上的分量。无人机每隔一个时间步长Δt(一个时间步长对应一个时刻)会刷新一次自身的飞行位置和飞行速度。无人机k时刻采样时间戳记为t_k，k时刻上一时刻采样时间戳为t_k-1，有Δt＝t_k-1-t_k。

S1、对集群中无人机运动建模：集群中邻居无人机指当前无人机一定感知范围内的其他无人机，通信范围有限条件下无人机所处集群环境示意图参见图2所示。本发明中无人机的飞行状态包括当前无人机自身飞行位置和飞行速度、通信范围内所有邻居无人机的飞行位置和飞行速度、障碍物的位置信息。飞行状态作为控制函数的输入用于计算无人机下一时刻的飞行速度。控制函数是飞行状态到飞行速度的映射关系式，本发明设定控制函数生成的速度受到自主导航力、邻居无人机产生的排斥作用力、邻居无人机产生的吸引作用力、邻居无人机产生的对齐作用力、障碍物产生的排斥作用力的影响；每一个作用力对应一个控制函数分量，运动模型中控制函数关于无人机i下一时刻速度的计算公式为：

本实施案例中为了简化无人机集群运动过程，不考虑障碍物对集群运动的影响。设置无人机在自主导航力作用下产生的飞行速度v^prefer为4m/s，在不受到其他作用力影响时，无人机会以4m/s速度飞行。自主导航力方向为无人机当前速度v_i的方向。

受邻居无人机j与当前无人机i的相对距离影响，计算该分量时需要获取邻居无人机的位置，两架无人机距离越近，无人机j对无人机i产生排斥作用越大。

受邻居无人机j与当前无人机i速度一致性的影响，计算该分量时需要获取邻居无人机的速度，当两架无人机速度一致性越低，无人机j对无人机i产生对齐作用越大。将当前无人机i及其所有邻居无人机的位置和速度输入控制函数进行计算可以得到当前无人机i下一时刻的速度

在下一时刻无人机以新速度飞行。

S2、对无人机飞行状态数据处理得到训练样本：在每个无人机控制芯片内部存储空间中划分一块Data空间，用以存储无人机飞行状态数据；集群中无人机之间通过无线通信设备进行通信，包括交互飞行信息的发送与接收，每一个无人机发送自身飞行位置和飞行速度信息给邻居无人机并接收邻居无人机的飞行位置和飞行速度信息；收集真实集群环境或仿真环境中集群飞行的无人机飞行状态数据，放入Data空间。

无人机i在c时刻及之前时刻飞行位置序列为：

其中

表示无人机i在k时刻的飞行位置。

无人机i在c时刻及之前时刻飞行速度序列为：

其中

表示无人机i在k时刻的飞行速度。

在c时刻，每架无人机读取自身h个历史位置和速度信息，并读取连续h个时刻自身通信感知范围内距离最近的s架无人机飞行位置和飞行速度，预测未来f个时刻当前无人机的飞行位置和飞行速度。

预测信息序列为：

其中

表示无人机i于c时刻预测的自身在c+f时刻的飞行位置和飞行速度。

读取所有无人机的飞行状态数据，并将其划分为输入特征集和输出特征集，输入特征集中每条以数据记录形式保存的数据为无人机在当前时刻之前h个时刻的飞行状态数据，输出特征集中每条以数据记录形式保存的数据为无人机在当前时刻之后h个时刻的飞行位置和飞行速度数据。输入特征集中一条数据对应输出特征集中一条数据，将输入特征集中每条以数据记录形式保存的数据和输出特征集中每条以数据记录形式保存的数据一一对应，形成一对训练样本，将输入特征集和输出特征集中所有数据记录汇总得到无人机飞行状态的训练样本集。

S3、在模型参数的设置上，设置隐藏层神经元数取值范围为[20,60]，Adam优化学习率取值范围为[0.0001,0.2]，Dropout学习率的取值范围为[0.2,0.5]，将输入数据输入到LSTM模型的第一个隐藏层，数据经过层层处理输出到attention层，经过attention层处理后输出预测数据。随后初始化网络模型的权重，将S2中的训练样本进行划分，80％的训练样本用于LSTM模型训练，20％的数据用于测试评估，适应度评价为模型在测试集上的均方根误差RMSE(Root-Mean-Square Error)

其中，y(i)表示第i个真实值，y′(i)表示第i个预测值，n是测试集标签长度。

训练完成后保存LSTM模型。

S4、无人机起飞初始化：将S3中训练的LSTM模型保存在所有无人机控制芯片内部，初始化无人机内部芯片中的存储空间，包括Data空间，每架无人机在Data空间中保存历史飞行状态数据和已接收的邻居无人机发送的未来f个时刻预测飞行位置和飞行速度，新的预测信息会覆盖旧的预测信息，每条飞行位置和飞行速度记录都有无人机ID和对应的时间标记。

初始化时间戳t＝0，为每个无人机初始化飞行位置和飞行速度，无人机飞行时间步长设为Δt。

S5、发送交互飞行信息：无人机通过无线通信设备发送交互飞行信息，在当前时刻k＜h时，无人机以当前时刻真实飞行位置

和飞行速度

作为交互飞行信息发送给邻居无人机。当前时刻k≥h时无人机根据S3中训练得到的LSTM模型输出该无人机在未来f个时刻的预测飞行位置和飞行速度，将当前时刻真实飞行位置

和飞行速度

及未来f个时刻的预测飞行位置和飞行速度

作为交互飞行信息发送给邻居无人机。

S6、无人机接收交互飞行信息：无人机i在k时刻通信获取邻居无人机在步骤S5中发送的交互飞行信息，当前无人机通过控制函数计算下一时刻速度

计算时需要读取邻居无人机当前时刻的飞行位置

和飞行速度

但部分邻居无人机发送的交互飞行信息会因为通信延迟无法被当前无人机准时收到，如果某个邻居无人机在当前k时刻的交互飞行信息没有被当前无人机接收到，当前无人机就读取已接收到的该邻居无人机交互飞行信息里面最新的关于当前k时刻的预测飞行位置和飞行速度

这个预测数据在k时刻之前由邻居无人机发送过来；如果接收到，则直接读取邻居无人机当前时刻的真实飞行位置

和飞行速度

将邻居无人机的飞行位置和飞行速度与当前无人机自身飞行位置

和飞行速度

拼接整合得到飞行状态，将飞行状态作为控制函数的输入，计算当前无人机下一时刻的飞行速度

本发明在构建及优化LSTM模型参数时，使用无人机历史多个时刻的飞行状态数据作为输入，能提高预测的准确率；无人机发送的交互飞行信息不仅包含自身当前时刻飞行位置和飞行速度，还包括自身未来多个时刻飞行位置和飞行速度的预测值，这样邻居无人机未获取当前时刻该无人机飞行位置和飞行速度时能够从历史接收信息中读取该无人机关于当前时刻的预测值，能够应对通信网络中可能存在的或大或小的通信延迟。

综上所述，本发明的通信延迟约束下的多无人机集群导航方法，属于多智能体协同控制领域，解决了无人机群中无人机间的通信存在延迟条件下，集群系统难以实现稳定集群的技术问题，主要应用在无人机分布式集群算法中。由于实际应用中无人机间通信存在通信延迟，导致无人机在当前时刻无法实时获取周围邻居无人机此时的飞行信息以准确规划无碰撞路径，使得系统稳定性偏低。本发明使用基于LSTM的神经网络预测无人机在一定时间延迟后的飞行信息，然后将预测信息共享给周围邻居无人机，邻居无人机可以通过该无人机的预测信息规划自己的运动路径。本发明将集群导航过程划分为准备阶段和飞行阶段，准备阶段包括对集群中无人机运动建模、对无人机飞行状态数据处理得到训练样本、构建LSTM模型并用训练样本训练LSTM模型，飞行阶段包括无人机起飞初始化、发送交互飞行信息、接收交互飞行信息，最终实现通信延迟约束下的多无人机集群导航。本发明具有通信和计算开销小和可实现通信延迟约束下多无人机稳定集群飞行的优点，应用于无人机集群导航，能够避免无人机集群飞行过程中因时间延迟导致的集群飞行抖动，降低无人机集群飞行过程中发生碰撞的概率。

Claims

1.一种通信延迟约束下的多无人机集群导航方法，其特征在于，将集群导航过程划分为准备阶段和飞行阶段，包括有如下步骤：

准备阶段：

S2、对无人机飞行状态数据处理得到训练样本：在每个无人机控制芯片内部存储空间中划分一块Data空间，用以存储无人机飞行状态数据；每一个无人机发送自身飞行位置和飞行速度信息给邻居无人机并接收邻居无人机的飞行位置和飞行速度信息；收集真实集群环境或仿真环境中集群飞行的无人机飞行状态数据，放入Data空间；读取所有无人机飞行状态数据并将其划分为输入特征集和输出特征集，输入特征集中每条以数据记录形式保存的数据为无人机在当前时刻及之前多个时刻飞行状态数据；输出特征集中每条以数据记录形式保存的数据为无人机在当前时刻之后多个时刻的飞行位置和飞行速度数据；输入特征集中一条数据对应输出特征集中一条数据，将输入特征集中每条以数据记录形式保存的数据和输出特征集中每条以数据记录形式保存的数据一一对应，形成一对训练样本，将输入特征集和输出特征集中所有数据记录汇总得到无人机飞行状态的训练样本集；

飞行阶段

S5、发送交互飞行信息：无人机通过无线通信设备发送交互飞行信息，初始飞行阶段无人机以当前时刻真实飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行阶段无人机将当前时刻真实飞行位置和飞行速度及未来多个时刻的预测飞行位置和飞行速度作为交互飞行信息发送给邻居无人机，预测飞行位置和飞行速度根据训练得到的LSTM模型计算输出；

2.根据权利要求1所述通信延迟约束下的多无人机集群导航方法，其特征在于，步骤S1中所述的对集群中无人机运动建模包括有如下步骤：

S11、设定控制函数：控制函数为当前无人机在自主导航力、邻居无人机产生的排斥作用力、邻居无人机产生的吸引作用力、邻居无人机产生的对齐作用力、障碍物产生的排斥作用力对当前无人机速度影响而产生的所有飞行速度之和，运动模型中控制函数关于无人机i下一时刻速度的计算公式为：

其中，

表示无人机i飞行过程中障碍物c对无人机产生的速度控制子分量；

S12、无人机获取飞行状态计算自身下一时刻飞行速度：当前无人机的飞行状态包括当前无人机自身飞行位置和飞行速度，还包括其通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物位置信息；无人机一个飞行时刻对应一个时间步长，设步长为Δt，飞行状态作为控制函数的输入用于计算当前无人机下一时刻的飞行速度，以避免当前无人机和其他无人机发生碰撞并且保证集群导航的实现。

3.根据权利要求1所述的通信延迟约束下的多无人机集群导航方法，其特征在于，步骤S3所述构建LSTM模型，用训练样本训练LSTM模型包括以下步骤：

S31、构建LSTM模型：LSTM模型是一个深度学习预测模型，用LSTM模型对无人机的飞行位置和飞行速度进行预测；LSTM模型输入数据为无人机当前时刻及之前多个时刻的飞行状态数据，飞行状态数据包括当前无人机自身飞行位置和飞行速度，还包括其通信范围内所有邻居无人机的飞行位置和飞行速度以及障碍物位置信息；输出预测数据为无人机未来多个时刻的预测飞行位置和飞行速度；构建的LSTM模型采用Adam优化器，至少包含两个隐藏层，设置Adam学习率以及LSTM各隐藏层神经元个数，将输入数据传输到第一个隐藏层，隐藏层对输入数据进行数学计算并传递到下一个隐藏层，最后一层隐藏层处理完成后会输出一个时序向量，该时序向量经过attention层的运算处理得到无人机未来多个时刻的预测飞行位置和飞行速度输出；

S32、用训练样本集训练LSTM模型：初始化LSTM网络模型的权重，将LSTM网络模型及输入数据的参数权重设置为正态分布，用正态分布随机生成参数的初始值，导入训练样本集训练LSTM模参数，得到训练好的LSTM模型。

4.根据权利要求1所述的通信延迟约束下的多无人机集群导航方法，其特征在于，步骤S5所述发送交互飞行信息包括以下步骤：

S51、初始飞行阶段信息发送：无人机通过无线通信设备发送交互飞行信息，无人机使用连续h个时刻历史飞行状态数据进行预测，在当前时刻k＜h时无人机以当前时刻真实飞行位置和飞行速度作为交互飞行信息发送给邻居无人机；

5.根据权利要求1所述的通信延迟约束下的多无人机集群导航方法，其特征在于，步骤S6所述接收信息包括以下步骤：

S61、无人机接收邻居无人机发送的交互飞行信息：当前无人机通信获取邻居无人机发送的交互飞行信息，当前无人机根据交互飞行信息通过控制函数计算自身下一时刻飞行速度，计算时需要读取邻居无人机当前时刻的飞行位置和飞行速度；

S62、邻居无人机当前时刻的交互飞行信息已经被接收到：当前无人机读取邻居无人机当前时刻真实飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量；

S63、邻居无人机当前时刻的真实飞行位置和飞行速度未被接收到：如果某个邻居无人机在当前时刻的交互飞行信息没有被当前无人机接收到，当前无人机就读取已接收到的该邻居无人机交互飞行信息里面最新的关于当前时刻的预测飞行位置和飞行速度，用于计算该邻居无人机对应的所有影响力产生的控制函数子分量；

S64、拼接获取飞行状态：将当前无人机自身飞行位置和飞行速度、通信范围内所有邻居无人机的飞行位置和飞行速度、障碍物的位置信息拼接融合得到无人机的飞行状态，将该飞行状态作为控制函数的输入计算当前无人机下一时刻飞行速度；

S65、判断本次飞行是否结束：无人机如果接收到飞行终止指令或者当前集群已飞行时间达到最长飞行时间，则表明本次集群飞行结束，执行步骤S66，否则，跳回步骤S5发送交互飞行信息；

S66、结束本次集群运动。