CN115562342A

CN115562342A - 多飞行器任务分配、航迹规划和编队控制一体化博弈方法

Info

Publication number: CN115562342A
Application number: CN202211300744.6A
Authority: CN
Inventors: 许宇航; 杨浩; 姜斌
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2022-10-24
Filing date: 2022-10-24
Publication date: 2023-01-03

Abstract

本发明公开了一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法，包括：(1)建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图；(2)建立任务分配、航迹规划和编队控制的一体化博弈框架并在该框架下为任务分配、航迹规划和编队控制三个环节设计相互耦合性能指标；(3)设计反向策略机制，遵循反向运行顺序，利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略模型，解算每个环节的最优控制策略；(4)基于三个环节的最优控制策略遵循正向顺序运行获得优化的无人机任务分配、航迹规划和编队控制。本发明能够实现飞行器每个环节策略的双向调整，达到一体化博弈的纳什均衡。

Description

多飞行器任务分配、航迹规划和编队控制一体化博弈方法

技术领域

本发明涉及多飞行器控制的技术领域，具体是涉及一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法。

背景技术

集群飞行器作为一类以通信耦合的网络系统，在军事和民用方面都发挥着重要作用，例如森林防火、敌情监测等。博弈论在集群飞行器的任务分配、航迹规划和编队控制三个核心环节中有着相当广泛地应用，以寻求更优的系统性能。例如：在任务分配环节，现有技术中通过建立匿名享乐博弈，研究具有社会性抑制特性的无人机，在尽可能减少合作成员的情况下，实施联盟切换准则，形成与任务匹配的Nash稳定的无人机分区。在航迹规划环节，现有技术基于非零和博弈，实现避障条件约束下的无人机期望飞行轨迹的规划。在编队控制环节，基于非合作博弈，可以实现领导者-跟随者模式的集群编队控制。

在现有的一些博弈框架下，针对集群飞行器的任务分配、航迹规划和编队控制三个环节的策略通常是分开独立设计的，这种独立设计主要是顺着任务分配→路径规划→编队控制的方向正向调节每个环节的性能，可称之为开环设计。然而这种开环设计忽略了各个环节之间的双向互动，无法建立反馈机制，难以根据实际情况对策略进行及时地调整。因此，亟需建立针对三个环节一体化的博弈机制，使得每个环节的性能可以双向可调。

发明内容

发明目的：针对以上缺点，本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法，通过建立一体化博弈框架并在该一体化博弈框架下关联耦合三个环节之间的指标，并结合各环节的反馈信息实现三个环节的闭环设计，实现了每个环节策略的双向调整，最终达到一体化博弈的纳什均衡。

技术方案：为解决上述问题，本发明公开一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法，具体包括以下步骤：

(1)针对多飞行器系统，建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图；

(2)建立任务分配、航迹规划和编队控制的一体化博弈框架；基于步骤(1)中建立的每架无人机模型、无人机分区、无人机个体偏好在一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节分别设计性能指标且任务分配的性能指标、航迹规划的性能指标和编队控制的性能指标相互耦合；

(3)设计反向策略机制，遵循编队控制、航迹规划、任务分配的运行顺序，利用反馈信息优化各环节的性能指标并设计每架无人机于每个环节的最优博弈控制策略模型，计算获取每架无人机于每个环节的最优控制策略；所述的反馈信息包括编队控制环节输出的状态误差量、编队控制环节的最优控制输入、航迹规划环节的最优控制输入；

(4)根据获取的每架无人机于三个环节的最优控制策略遵循无人机任务分配、航迹规划、编队控制的顺序运行获得优化的每架无人机任务分配、航迹规划和编队控制。

进一步的，步骤(1)具体包括：(1.1)构建一个S架无人机的集群，定义

为无人机的集合；即单架无人机

的动态模型为：

式中，

表示t时刻下无人机i的位置；v_i(t)表示t时刻下无人机i的速度；u_i(t)表示t时刻下无人机i的控制输入；

令：

式中，p_i为无人机位置；v_i为无人机速度；

单架无人机

的动态模型改写为：

式中，

q为正整数；x_i(t)表示t时刻下x_i；

为x_i(t)的动态表征；

(1.2)(1.2)根据实际期望位置所属的地理区域不同对任务进行分区，每个任务分区表示为：

k为任务分区编号，

为任务分区集合，

为任务分区的数量；由于无人机与任务一一匹配，故根据任务的分区获得无人机分区表示为：

且满足以下条件：

式中，D_k是执行任务d^[k]的无人机联盟；m为任务分区集合中不为k的任务分区编号；

为执行任务d^[m]的无人机联盟；

为每个任务分区d^[k]设置n_k+1个任务，即

若将任务

分配给无人机i，即无人机i重新被标记为r^[k]，无人机联盟D_k表示为：

(1.3)设计任务分配环节的无人机i的性能指标为：

式中，

表示期望的位置，

表示期望的速度；

表示任务--联盟对，即与n_k架无人机一起执行任务

建立无人机偏好，对于任意一架无人机

定义

为一个偏好选择，对于

k≠m，

表达式

表示相较于任务--联盟对

无人机i更愿意选择任务-联盟对

即无人机的个人偏好表达式为：

(1.4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图；其中，联盟D_k内信息交互拓扑图定义为：

ε_k为图中节点的连边，表征两架无人机之间的信息交互。

进一步的，步骤(2)具体包括：

(2.1)在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体，设计每一架无人机与对应的虚拟智能体具有相同的系统动态，表示为：

式中，z_r(t)表示t时刻下虚拟智能体的状态；

表示t时刻下虚拟智能体的控制输入；

(2.2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架，所述一体化博弈框架为：针对无人机与任务建立匿名享乐博弈实现任务分配，使得每一架无人机根据自我的偏好，选择不同任务，并形成对应的无人机联盟；在每个无人机联盟内部，建立斯坦伯格微分图博弈，实现航迹规划和编队控制；其中，虚拟智能体担任领导者产生期望的飞行轨迹，无人机担任跟随者实现编队飞行；

(2.3)基于一体化博弈框架为无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标，具体包括：

针对愿意选择加入的联盟D_k的无人机i定义其航迹规划的性能指标为Γ_r、编队控制环节的性能指标为J_r；其中：

式中，z_r表示智能体的状态；d_r＝d^[k]表示无人机任务分区；

G_r、F_r均表示性能指标Γ_r中的权重矩阵；

表示虚拟智能体的控制输入即航迹规划环节的策略；u_r表示无人机的控制输入即编队控制环节的策略；

式中，

Q_r、R_r、L_r均表示性能指标J_r中的权重矩阵；

设计任务分配环节的性能指标W_i为航迹规划和编队控制两个环节的性能指标相加，具体为：

进一步的，步骤(3)具体包括：

(3.1)设计编队控制环节的博弈控制策略模型，具体包括：

(3.1.1)给定任意可行的无人机分区Π、任意可行的航迹规划的策略

定义状态误差向量

根据状态误差向量优化编队控制环节的性能指标为J_r得到：

(3.1.2)针对联盟

中无人机编队控制环节的博弈控制策略模型为：基于给定Π，

和

约束条件为：

式中，u_-r表示联盟

中除了无人机r以外的其他无人机的策略集合；

为状态误差向量系统的动态表征；

(3.1.3)计算获得无人机最优编队控制策略，公式为：

式中，

为无人机最优编队控制策略；R_r为性能指标中控制输入的权重矩阵，B_r为输入矩阵，P_r为不对称黎卡提微分方程的解；

(3.2)设计航迹规划环节的博弈控制策略模型，具体包括：

(3.2.1)同一联盟中的虚拟智能体的动态表征为：

式中，

为z的动态表征；

航迹规划的性能指标为Γ_r重新表示为：

式中，

(3.2.2)无人机航迹规划环节的博弈控制策略模型为：

约束条件为：

(3.2.3)计算获得无人机最优航迹规划策略，公式为：

式中，

为斜态变量，

(3.3)设计任务分配环节的博弈控制策略模型，具体包括：

(3.3.1)任务分配环节的博弈控制策略模型为：

约束条件：

δ_ir∈{0，1}，

式中，δ_ir是任务与无人机的匹配因子；

(3.3.2)基于步骤(3.1)与步骤(3.2)获取的最优编队控制策略与最优航迹规划策略，根据切换准则搜索获取每个无人机对应的最优无人机分区Π^*；所述切换准则为：对于一个无人机的分区

无人机i选择离开其所在的联盟

加入另一个联盟

k≠m当且仅当存在一个任务d_r，

使得：

则新成立的无人机分区可以表示为

进一步的，步骤(4)具体包括：

(4.1)初始化无人机的集合、任务的集合、无人机的初始分区、初始权重；

(4.2)针对当前的无人机分区，判断当前无人机的分区是否符合该无人机个体偏好，即判断下式是否成立：

式中，

表示联盟中无人机l的最优编队控制策略；

表示联盟中无人机l的最优航迹规划策略；n_Π(i)为当前分区Π的无人机数量；

若成立，则无人机离开当前联盟加入新的联盟并更新分区，转至步骤(4.3)；若不成立，则输出无人机分区，转至步骤(4.4)；所述公式为：

(4.3)重复步骤(4.2)直至步骤(4.2)中公式成立，则输出无人机分区，该无人机分区为最优分区；

(4.4)根据输出无人机分区，采用无人机最优航迹规划策略

最小化性能指标Γ_r获得航迹规划；

(4.5)根据获取的无人机分区、航迹规划，采用无人机最优编队控制策略

最小化性能指标J_r获得编队控制。

此外，本发明还提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一方法的步骤。一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一方法的步骤。

有益效果：本发明所述一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法相对于现有技术，其显著优点是：通过建立一个一体化的博弈框架并在该框架下设计一组相互耦合的性能指标关联三个环节；再基于所设计的性能指标，设计反向策略设计的机制，即遵循编队控制→航迹规划→任务分配的顺序，根据该运行顺序下生成的反馈信息设计三个博弈策略模型，计算获取反向运行下的每个环节的最优策略；最后根据获得最优策略再调整正向运行策略。该方法克服了传统集群飞行器三个环节只能正向调整的局限性，有效实现了每个环节策略的双向调整和每个环节性能的双向调节。所设计的博弈策略不仅可以实现每个环节的稳定性和最优性能，而且可以实现一体化博弈的Gestalt Nash均衡。

附图说明

图1所示为本发明所述任务分配、航迹规划和编队控制三个环节一体化的博弈框架图；

图2所示为本发明所述一体化博弈框架中整体闭环设计框架图；

图3所示为本发明所述无人机执行不同任务的代价图；

图4所示为本发明所述参考飞行轨迹和真实飞行轨迹之间的轨迹误差曲线图；

图5所示为本发明实施例中无人机1-5的编队飞行轨迹图；

图6为本发明实施例中联盟

内无人机1-3的编队飞行轨迹图；

图7为本发明实施例中联盟

内无人机4-5的编队飞行轨迹图；

图8为本发明实施例中联盟

内无人机1-3的速度变化曲线图；

图9为本发明实施例中联盟

内无人机4-5的速度变化曲线图。

具体实施方式

下面结合附图对本发明的技术方案进一步说明。

如图1与图2所示，本发明提供一种多飞行器任务分配、航迹规划和编队控制一体化博弈方法，具体包括以下步骤：

步骤一、建立单架无人机的动态模型、无人机分区、无人机的个体偏好和整个无人机集群的信息交互拓扑图；具体为：

(1)构建一个S架无人机的集群，定义

为无人机的集合；即单架无人机

的动态模型为：

式中，

表示t时刻下无人机i的位置；

表示t时刻下无人机i的速度；

表示t时刻下无人机i的控制输入；

通过构建：

无人机的动态模型进一步的改写为如下形式：

式中，

q为正整数。

(2)根据实际期望位置所属的地理区域不同对任务进行分区，每个任务分区表示为：

k为任务分区编号，

为任务分区集合。由于无人机与任务一一匹配，故根据任务的分区无人机的分区表示为：

且满足以下条件：

式中，D_k是执行任务d^[k]的无人机联盟；

为每个任务分区d^[k]设置n_k+1个任务，即

若将任务

分配给无人机i，即无人机i重新被标记为r^[k]。通过这种方式，无人机联盟D_k表示为：

由于本发明所研究的无人机和任务之间是一一对应的关系，因此本发明将使用

同时表征任务的索引集合以及联盟中无人机的索引集合。

(3)设计任务分配环节的无人机i的性能指标为：

式中，

表示期望的位置，

表示期望的速度；

表示任务--联盟对，即与n_k架无人机一起执行任务

考虑到无人机面对不同的任务--联盟对

时，拥有个体的偏好选择，因此，建立如下无人机的偏好。对于任意一架无人机

定义

为一个完备的、自反的、可传递的二元关系的偏好选择。基于所建立的偏好选择，对于

k≠m，

表达式

表示：相较于任务-联盟对

无人机i更愿意选择任务-联盟对

即无人机的个人偏好表达式为：

根据上式可知无人机偏好的两个决定因素：所选择的任务

和合作伙伴的数量n_k。

(4)采用图论描述每个联盟内的无人机的信息交互得到整个无人机集群的信息交互拓扑图。其中，以联盟

为例，该联盟内信息交互拓扑图定义为：

其中

为图中节点的连边，表征两架无人机之间的信息交互。为了简化标记，在没有歧义的地方，采用移除上标"[·]"的方式来表征无人机和任务，即无人机r^[k]将记作无人机r，任务

将记作任务d_r。基于简化的标记，无人机0表征联盟

中选择任务d₀的领导者无人机，无人机r(r≠0)表征联盟

中选择任务d_r的跟随者无人机

r≠0。假设图

是连通的。

步骤二、建立任务分配、航迹规划和编队控制的一体化博弈框架，并基于该一体化博弈框架下为每架无人机任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标。具体为：

(1)构建完备的博弈局势：在航迹规划环节中为每一架无人机配备了一个负责产生期望的飞行轨迹的虚拟智能体，设计无人机与对应的虚拟智能体具有相同的系统动态，表示为：

式中，z_r(t)表示t时刻下虚拟智能体的状态；

表示t时刻下虚拟智能体的控制输入。

(2)建立任务分配、航迹规划和编队控制三个环节的一体化博弈框架，其中各个玩家总结如下：

a)匿名享乐博弈的玩家:无人机和任务；

b)斯坦伯格微分图博弈的玩家:虚拟智能体和无人机。

具体的，一体化博弈框架为：首先，针对无人机与任务建立匿名享乐博弈实现任务分配，使得每一架无人机根据自我的偏好，选择不同任务，并形成对应的无人机联盟。然后，在每个无人机联盟内部，建立斯坦伯格微分图博弈，实现航迹规划和编队控制。其中，虚拟智能体担任领导者产生期望的飞行轨迹，无人机担任跟随者实现编队飞行；

(3)基于一体化博弈框架为任务分配、航迹规划和编队控制三个环节设计一组耦合的性能指标，具体包括：

针对愿意选择加入的联盟D_k的无人机i定义其航迹规划的性能指标为Γ_r、编队控制环节的性能指标为J_r；设计任务分配环节的性能指标W_i为航迹规划和编队控制两个环节的性能指标相加，具体为：

式中，u_r表示无人机的控制输入，即编队控制环节的规划策略；

表示虚拟智能体的控制输入，即航迹规划环节策略；

如此设计的优点为：一方面，任务分配的性能可以通过航迹规划和编队控制环节的策略

进行调整；另一方面，航迹规划和编队控制的性能可以通过任务分配环节的策略(d_r,n_k)进行调整。因此，每个环节的策略可以双向可调，这有利于后续三个环节的闭环设计。

下述给出航迹规划环节Γ_r、编队控制环节的性能指标J_r的具体形式：

基于虚拟智能体的系统动态和任务d_r中所包含的期望目的地和期望速度的信息，设计虚拟智能体r的性能指标为

式中，z_r表示智能体的状态；

G_r、F_r均表示性能指标Γ_r中的权重矩阵，且G_r＞0、F_r＞0；该指标不仅考量了虚拟智能体自身的控制能耗，而且考量了无人机的控制能耗，使得编队控制对航迹规划的影响可以在斯坦伯格微分图博弈的框架下加以表征。

定义

领导者无人机和跟随者无人机的性能指标可以统一构造为如下形式：

式中，Q_r、R_r、L_r均表示性能指标J_r中的权重矩阵，L_r＞0；

且对于r≠0，有

为领导者无人机对应的权重矩阵；对于r≠0，有：

满足

其中每个子矩阵定义为：

式中，

表示跟随者无人机

和领导者无人机之间的权重矩阵，而

表示跟随者无人机r与其邻居无人机l之间的权重矩阵。

一体化博弈框架下的性能指标J_r中增加设计了

用于表征航迹规划对编队控制环节所施加的先行决策的影响。

步骤三、提出反向策略设计的机制，遵循编队控制→航迹规划→任务分配的顺序的运行顺序，利用反馈信息优化各环节的性能指标并设计每个环节的最优博弈控制策略，最终计算获取每架无人机于每个环节无人机的最优控制策略。具体包括：

(1)设计编队控制环节的博弈控制策略模型，具体包括：

(1.1)给定任意可行的无人机分区Π、任意可行的航迹规划的策略

将无人机作为在斯坦伯格微分图博弈中的跟随者玩家实现编队控制。定义状态误差向量

其系统动态表征为：

其中，

根据状态误差向量可得到编队控制环节的性能指标为J_r进一步表示为：

(1.2)设计联盟

中无人机编队控制环节的博弈控制策略模型。具体的，联盟

中无人机的最优编队控制的问题可以描述为:给定Π，

和

约束条件为：

式中，

表示联盟

中除了无人机r以外的其他无人机的策略集合；

(1.3)求解计算获得无人机最优编队控制策略。具体的，定义无人机r的哈密顿函数：

其中，λ_r是无人机r的协态变量；最优控制策略

满足

利用极小值原理，可得

可得无人机的最优控制策略为

其中λ_r满足：

为了得到最优控制策略

的等价状态反馈的形式，令

其中P_r满足以下不对称黎卡提微分方程：

且g_r满足伴随方程：

可得无人机r的最优控制策略的状态反馈形式可以表示为

其中，R_r为性能指标中控制输入的权重矩阵，B_r为输入矩阵，P_r为不对称黎卡提微分方程的解。

根据所设计的最优控制策略

可以实现：

即联盟

内无人机的n_k+1个最优控制策略

构成其图博弈的Nash均衡。

(2)设计航迹规划环节的博弈控制策略模型。

将虚拟智能体作为斯坦伯格微分图博弈中的领导者玩家，实现其在编队控制约束下的最优航迹规划。

(2.1)同一联盟中的虚拟智能体r的动态表征为：

航迹规划的性能指标为Γ_r重新表示为：

式中，

(2.2)设计无人机航迹规划环节的博弈控制策略模型，具体的：在斯坦伯格微分图博弈的框架下，虚拟智能体r的最优航迹规划的问题描述为：对于给定的无人机分区，

约束条件为:

在斯坦伯格微分图博弈的框架下，通过考量无人机编队控制的最佳响应策略

和

使得所设计的航迹规划的策略

具有修正编队误差的能力，有助于实现航迹规划和编队控制之间的闭环设计。

(2.3)计算获得无人机最优航迹规划策略。具体的：定义虚拟智能体r的哈密顿函数：

其中，

是斜态变量，β_r和ξ_r是两个拉格朗日乘子。最优航迹规划的控制策略

满足

利用极小值原理，可以导出

其中

和

因此，设计航迹规划的最优控制策略为

其中

β_r和ξ_r分别满足

进而得到如下三个微分方程

下面设计最优控制策略

的状态反馈表达式。为了实现这个目标，定义：

基于以上各式，建立如下微分方程

其中：

设计矩阵Φ中的子矩阵为：

其中,

设计矩阵

中的子矩阵定义为：

建立矩阵Ω和Ψ的仿射关系式：

其中

满足不对称的黎卡提微分方程：

且

满足伴随方程：

基于上式，最优控制策略

表示为状态反馈的形式：

其中，

根据所设计的最优航空规划控制策略

实现：

且虚拟智能体对应的(n_k+1)个最优控制策略

构成其图博弈的Nash均衡。

(3)设计任务分配环节的博弈控制策略模型，具体包括：

(3.1)任务分配环节的博弈控制策略模型。具体为：在航迹规划和编队控制策略的影响下，建立匿名享乐博弈实现无人机的任务分配。任务分配的问题可以描述为：

约束条件：

δ_ir∈{0，1}，

其中，δ_ir是任务与无人机的匹配因子。如果任务d_r分配给无人机i，那么δ_ir＝1；否则δ_ir＝0。

(3.2)基于所建立的无人机的个体选择偏好，建立无人机是否加入或者离开某一个联盟的切换准则。

所述切换准则为：对于一个无人机的分区

无人机i选择离开其所在的联盟

加入另一个联盟

k≠m当且仅当存在一个任务d_r，

使得：

则新成立的无人机分区可以表示为

通过使用上述切换准则，无人机自发地演化成不同的分区形态，其中一个稳定的形态定义为Nash稳定的分区。定义

为无人机i所属的分区，即

如果对于每一架无人机

都有不等式

成立，那么，分区Π是一个Nash稳定的分区。

针对任何可能执行的任务d_r，

如果无人机i，

与其对应的虚拟智能体i分别使用所设计的控制策略

和

那么在切换准则的作用下，任意初始的无人机分区Π₀可以收敛至一个最终的无人机分区Π^*。并且，这个最终的无人机分区Π^*是一个Nash稳定的分区。

步骤四、根据获取的三个环节的最优控制策略遵循任务分配、航迹规划、编队控制的顺序正向运行获得多飞行器任务分配、航迹规划和编队控制。具体步骤包括：

(1)初始化无人机的集合

任务的集合

无人机的初始分区

初始权重

G_r、F_r、Q_r、R_r、L_r；

(2)建立匿名享乐博弈，实现任务分配。针对当前的无人机分区Π(首次迭代之时，Π＝Π₀)，判断下述公式是否成立；

若成立，执行一次切换操作：具体为：

(2.1)离开当前的联盟：

(2.2)加入一个新的联盟：

(2.3)更新分区Π：分别利用联盟

和

替代联盟

和

重复步骤(2.1)-(2.3)直到分区Π收敛至最终的Nash稳定的分区Π。

(3)建立斯坦伯格微分图博弈:获取航迹规划和编队控制。

在Nash稳定的分区Π下，根据所分配的任务重新标记联盟中的无人机，并为无人机配备虚拟智能体，执行下述操作：

(3.1)根据输出无人机分区Π，采用无人机最优航迹规划策略

最小化性能指标Γ_r获得航迹规划

(3.2)根据获取的无人机分区Π、航迹规划

采用无人机最优编队控制策略

最小化性能指标J_r获得编队控制u_r。

重复步骤(2)-(3)直到策略收敛至Gestalt Nash均衡点。

本发明实施例中以一个由5架无人机构成的集群来验证所提出的一体化博弈方法有效性。

首先，初始化无人机的位置和速度。将各个无人机的初始位置分别设置为：

p₁(0)＝[0.480.62]^T,p₂(0)＝[1.520.65]^T,

p₃(0)＝[2.560.60]^T,p₄(0)＝[5.006.00]^T,

p₅(0)＝[7.009.00]^T.

各个无人机的初始速度分别设置为：

v₁(0)＝[0.550.81]^T,v₂(0)＝[0.520.86]^T,

v₃(0)＝[0.470.86]^T,v₄(0)＝[0.270.11]^T,

v₅(0)＝[0.220.26]^T.

设置虚拟智能体和无人机具有相同的初始条件。任务中的每个无人机期望位置和期望速度分别设置为：

设计性能指标中的权重矩阵，对于

通过使用本发明所设计的控制策略，分别得到无人机执行每一个任务所需要的代价，如图3所示。进一步，通过最小化全局的性能指标，得到各无人机任务分配的结果为：

结合图3所示的内容，从个体无人机的角度和整体集群的角度来分析任务分配的结果。首先，从个体无人机的角度而言：每个无人机或更倾向于选择消耗代价较小的任务。因此，自图3可以看出，无人机1-无人机3倾向于选择加入联盟

来一起完成任务d^[1]，而无人机4和无人机5倾向于加入联盟

来执行任务d^[2]。其中，无人机4执行任务

和任务

所需要的代价是相同的。但是，由于受到社会性抑制的影响，无人机4倾向于选择加入联盟

而非联盟

其次，从整体集群的角度：任务分配的总目标是最小化全局的性能指标。虽然同样分配无人机4和无人机5执行任务

无人机5所需的代价会比无人机4所需的代价高，但是从最小化全局性能指标的角度来说，任务

仍然会被分配给无人机5。同时，分配的结果符合无人机4和无人机5的个体偏好。

综合两个角度可以看出采用本发明所述方案在任务分配环节，最终的分配结果符合每个无人机个体的偏好、同时保证集群飞行器达到全局最优的性能。

基于上述任务分配的结果，建立无人机和虚拟智能体之间的斯坦伯格微分图博弈实现航迹规划和编队控制。图4展示了各无人机真实的飞行轨迹与参考的飞行轨迹之间的轨迹误差随时间变化的曲线。图中仿真结果表明，所设计的编队控制策略可以驱使无人机跟随参考的飞行轨迹，且飞行过程中，轨迹误差渐近收敛至0。图5展示了无人机1-5实时编队的情况，结果表明，所设计的编队控制策略可以使得无人机跟随参考的飞行轨迹到达目的地。图6展示了联盟

中无人机1-3的实时编队情况，图7中展示了联盟

中无人机4和5的实时编队情况。图8和图9展示了无人机1-6在编队过程中速度随时间变化的曲线。结果表明，当无人机到达最终的目的地时，无人机达到期望的速度。综上，利用本发明所获得的轨迹规划与编队控制符合期望要求。

综上，本发明所述的方法不但可以保证多飞行器在任务分配、航迹规划和编队控制中每个环节性能的双向调节，还可以同步实现集群飞行器的稳定性和最优性能。