CN116047908A

CN116047908A - 混合阶异构多智能体系统协同最优编队控制方法及设备

Info

Publication number: CN116047908A
Application number: CN202310067839.6A
Authority: CN
Inventors: 李艳东; 刘美晨; 朱玲; 刘博皓; 刘永安; 王锐
Original assignee: Qiqihar University
Current assignee: Qiqihar University
Priority date: 2023-01-16
Filing date: 2023-01-16
Publication date: 2023-05-02
Anticipated expiration: 2043-01-16
Also published as: CN116047908B

Abstract

本发明公开一种混合阶异构多智能体系统协同最优编队控制方法及设备，涉及多智能体编队控制技术领域。该混合阶异构多智能体系统协同最优编队控制方法，通过引入异构多智能体系统的通信拓扑模型以及采用构建好的协同最优编队控制协议，能够在混合阶异构多智能体系统完成协同编队的同时使性能指标最优。并且，本发明还引入了最优控制理论，能够进一步加快异构多智能体系统的状态变量随时间变化的收敛速度，极大地帮助系统快速达到期望队形状态。

Description

混合阶异构多智能体系统协同最优编队控制方法及设备

技术领域

本发明涉及多智能体编队控制技术领域，特别是涉及一种混合阶异构多智能体系统协同最优编队控制方法及设备。

背景技术

随着科技的快速发展，世界各军事大国高度重视无人作战系统协同配合能力。由于异构系统响应速度快、通信能力强及目标侦察精度高的特点，越来越受到各军事强国的青睐。在异构系统编队领域中，通常需要考虑智能体间的协同来完成任务。异构多智能体系统的协同编队问题是异构系统研究方向的一个重要分支。

在复杂多变的环境中，针对异构系统编队问题的基础上，还需要考虑如何使整个编队快速达到预期状态，即编队最优问题。此外，现有的研究对象大多基于同构智能体，即每个智能体的动力学模型是相同的。异构多智能体系统的组成可以大大提高在应用中的感知范围，在合作攻击等方面具有潜在的应用价值。但是现有技术中并没有一种能够使异构多智能体实现协同编队并可以快速地达到所期望的编队状态的控制技术。

发明内容

本发明的目的是提供一种混合阶异构多智能体系统协同最优编队控制方法及设备，能够使异构多智能体实现协同编队并快速地达到所期望的编队状态。

为实现上述目的，本发明提供了如下方案：

一种混合阶异构多智能体系统协同最优编队控制方法，包括：

构建混合阶异构多智能体系统的通信拓扑模型，并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵；

建立混合阶异构多智能体系统的动力学模型，并基于所述动力学模型构建各智能体的状态方程；

基于所述状态方程确定各智能体的状态控制参数；所述状态控制参数包括：各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入；

基于所述状态控制参数确定各智能体的最优控制律；

基于所述最优控制律构建控制参数方程；

基于所述控制参数方程确定各智能体的控制参数；

基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议；

基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。

可选的，构建混合阶异构多智能体系统的通信拓扑模型，并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵，具体包括：

确定各智能体间的联系关系，并基于所述联系关系构建系统的通信拓扑模型；

以各智能体间存在的信息交换路径为边，以各智能体为顶点，结合所述通信拓扑模型确定邻接矩阵；

基于所述联系关系确定所述通信拓扑模型中每一顶点的度；

基于所述通信拓扑模型中每一顶点的度构建度矩阵；

基于所述度矩阵和所述邻接矩阵确定所述混合阶异构多智能体系统的拉普拉斯矩阵。

可选的，基于所述状态控制参数确定各智能体的最优控制律，具体包括：

构建各智能体的性能指标；

基于各智能体的状态变量和各智能体的控制输入确定各智能体性能指标的对称非负定矩阵和各智能体性能指标的对称正定矩阵；

基于各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵、所述对称非负定矩阵和所述对称正定矩阵确定黎卡提方程的最优解；

基于所述黎卡提方程的最优解、所述对称正定矩阵、各智能体的状态变量以及各智能体的控制输入系数矩阵确定各智能体的最优控制律。

可选的，基于所述控制参数方程确定各智能体的控制参数，具体包括：

采用所述控制参数方程根据各智能体的控制输入系数矩阵、所述对称正定矩阵和黎卡提方程的解确定各智能体的控制参数。

可选的，基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议，具体包括：

获取混合阶异构多智能体系统的初始状态变量和期望状态变量；

基于所述初始状态变量和所述期望状态变量确定误差状态变量，将所述误差状态变量作为误差向量；

基于各智能体的状态变量引入转换矩阵，并基于所述控制参数和所述拉普拉斯矩阵构建以所述误差向量为变量的协同最优编队控制协议。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供的混合阶异构多智能体系统协同最优编队控制方法，通过引入异构多智能体系统的通信拓扑模型以及采用构建好的协同最优编队控制协议，能够在混合阶异构多智能体系统完成协同编队的同时使性能指标最优。并且，本发明还引入了最优控制理论，能够进一步加快异构多智能体系统的状态变量随时间变化的收敛速度，极大地帮助系统快速达到期望队形状态。

对应于上述提供的混合阶异构多智能体系统协同最优编队控制方法，本发明还提供了一种混合阶异构多智能体系统协同最优编队控制设备，该设备包括：

存储器，用于存储计算机软件程序；

处理器，与所述存储器连接，用于调取并执行所述计算机软件程序，以实施上述提供的混合阶异构多智能体系统协同最优编队控制方法。

可选的，所述处理器包括：

拉普拉斯矩阵确定模块，用于构建混合阶异构多智能体系统的通信拓扑模型，并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵；

状态方程构建模块，用于建立混合阶异构多智能体系统的动力学模型，并基于所述动力学模型构建各智能体的状态方程；

状态控制参数确定模块，用于基于所述状态方程确定各智能体的状态控制参数；所述状态控制参数包括：各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入；

最优控制律确定模块，用于基于所述状态控制参数确定各智能体的最优控制律；

控制参数方程构建模块，用于基于所述最优控制律构建控制参数方程；

控制参数确定模块，用于基于所述控制参数方程确定各智能体的控制参数；

协同最优编队控制协议构建模块，用于基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议；

编队控制模块，用于基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。

可选的，所述存储器为计算机可读存储介质。

因本发明提供的这一设备实现的技术效果与上述提供的混合阶异构多智能体系统协同最优编队控制方法实现的技术效果相同，故在此不再进行赘述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的混合阶异构多智能体系统协同最优编队控制方法的流程图；

图2为本发明实施例提供的混合阶异构多智能体系统的通信拓扑模型图；

图3为本发明实施例提供的混合阶异构多智能体系统编队仿真结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明提供的混合阶异构多智能体系统协同最优编队控制方法，包括：

步骤100：构建混合阶异构多智能体系统的通信拓扑模型，并基于通信拓扑模型确定混合阶异构多智能体系统的拉普拉斯矩阵。该步骤的实施过程可以是：

步骤100-1：确定各智能体间的联系关系，并基于联系关系构建系统的通信拓扑模型。

步骤100-2：以各智能体间存在的信息交换路径为边，以各智能体为顶点，结合通信拓扑模型确定邻接矩阵。

步骤100-3：基于联系关系确定通信拓扑模型中每一顶点的度。

步骤100-4：基于通信拓扑模型中每一顶点的度构建度矩阵。

步骤100-5：基于度矩阵和邻接矩阵确定混合阶异构多智能体系统的拉普拉斯矩阵。

步骤101：建立混合阶异构多智能体系统的动力学模型，并基于动力学模型构建各智能体的状态方程。

步骤102：基于状态方程确定各智能体的状态控制参数。状态控制参数包括：各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入。

步骤103：基于状态控制参数确定各智能体的最优控制律。该步骤的实施过程可以为：

步骤103-1：构建各智能体的性能指标。

步骤103-2：基于各智能体的状态变量和各智能体的控制输入确定各智能体性能指标的对称非负定矩阵和各智能体性能指标的对称正定矩阵。

步骤103-3：基于各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵、对称非负定矩阵和对称正定矩阵确定黎卡提方程的最优解。

步骤103-4：基于黎卡提方程的最优解、对称正定矩阵、各智能体的状态变量以及各智能体的控制输入系数矩阵确定各智能体的最优控制律。

步骤104：基于最优控制律构建控制参数方程。

步骤105：基于控制参数方程确定各智能体的控制参数。例如，采用控制参数方程根据各智能体的控制输入系数矩阵、对称正定矩阵和黎卡提方程的解确定各智能体的控制参数。

步骤106：基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。该步骤可以是基于以下步骤实现：

步骤106-1：获取混合阶异构多智能体系统的初始状态变量和期望状态变量。

步骤106-2：基于初始状态变量和期望状态变量确定误差状态变量，将误差状态变量作为误差向量。

步骤106-3：基于各智能体的状态变量引入转换矩阵，并基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。

步骤107：基于协同最优编队控制协议控制各智能体实现混合阶异构多智能体系统编队。

下面以对由3个无人机、3个水面无人器和3个水下无人器组成的混合阶异构多智能体系统进行协同最优编队控制为例，对本发明上述提供的混合阶异构多智能体系统协同最优编队控制方法的具体实施过程和优点进行说明，在实际应用过程中，混合阶异构多智能体系统的具体组成和各组成智能体的个数不限于此。

该实施例中，混合阶异构多智能体系统协同最优编队控制方法的实施过程为：

步骤S1：构建异构系统的通信拓扑，确定系统的拉普拉斯矩阵L。

在步骤S1中，构建异构系统的通信拓扑，确定系统的拉普拉斯矩阵L。混合阶异构系统的通信模型是反映系统之间的关系，知道各智能体之间有无关联，不同的拓扑结构所表示的系统关系是不一样的，通过通信拓扑可以得到拉普拉斯矩阵，拓扑结构可以用图G表示为：G＝(V，E，A)，顶点和边的集合分别常用V和E表示。其中，顶点集V和边集E又可以分别表示为顶点v_i和边e_i的集合，即：V＝{v₁,v₂,…v_n}，E＝{e₁,e₂,…e_m}。对于顶点集V中的每个元素，称其为节点，边E＝{e₁,e₂,…e_m}表示智能体间存在信息交换，当构成边e_ij的顶点(v_i,v_j)为无序二元组时，边e_ij称作无向边，顶点v_i，v_j分别称为边e_ij的端点，当边为无向边时，顶点v_i的度表示与v_i相连的边的数量，常用符号deg(v_i)表示，定义顶点的度为：

度矩阵D为对角矩阵，有：D＝diag(d₁,d₂,…d_n),A＝[a_ij]为拓扑图的邻接矩阵，表示智能体间的通信权重，邻接矩阵A是一个n×n的0-1矩阵，当v_i和v_j相邻时第(i,j项是1，当v_i和v_j不是相邻时第(i,j)项是0，a_ij表示第i个节点与第j个节点的联系关系，若第i个节点与第j个节点有联系则a_ij为1，若节点之间没有联系则a_ij为0，在本发明中第i个节点与第j个节点表示各个多智能体，以本发明为例，无人机1与无人机2是相互之间有联系，则a₁₂＝a₂₁＝1。无人机1与无人机3是相互之间有联系，则a₁₃＝a₃₁＝1。无人机2与无人机3是相互之间有联系，则a₂₃＝a₃₂＝1。无人机1与水面无人器1是相互有联系，则a₁₄＝a₄₁＝1。无人机机2与水面无人器2是相互有联系，则a₅₂＝a₂₅＝1。无人机3与水面无人器3是相互有联系，则a₃₆＝a₆₃＝1。水面无人器1向水面无人器2传递信息，则a₅₄＝1。水面无人器2向水面无人器3传递信息，则a₆₅＝1。水面无人器3向水面无人器1传递信息，则a₄₆＝1。水下无人器1与水下无人器2、水下无人器3相互之间有联系，则a₇₈＝a₈₇＝1，a₈₉＝a₉₈＝1，a₇₉＝a₉₇＝1。水下无人器1与水面无人器1、水下下无人器2与水面无人器2、水下无人器3与水面无人器3相互之间是有联系的，则a₄₇＝a₇₄＝1，a₅₈＝a₈₅＝1，a₆₉＝a₉₆＝1。其它的a_ij为0，表示智能体之间无联系关系，通过系统的通信模型自然而然的得到了拉普拉斯矩阵，系统的拉普拉斯矩阵L根据上述得到的D与A定义为：L＝D-A。根据构建的如图2所示的通信拓扑模型，本发明的邻接矩阵A为：

度矩阵D为：

相应的拉普拉斯矩阵L为：

步骤S2：建立多智能体系统的动力学模型得出状态方程(参见式(2)、式(4)及式(6))，最终，在状态方程式中得到无人机状态变量X_A1、水面无人器状态变量X_S1、水下无人器状态变量X_U1、无人机状态变量系数矩阵A_A1、水面无人器状态变量系数矩阵A_S1、水下无人器状态变量系数矩阵A_U1、无人机控制输入系数矩阵B_A1、水面无人器控制输入系数矩阵B_S1、水下无人器控制输入系数矩阵B_U1、无人机控制输入U_A1、水面无人器控制输入U_S1、水下无人器控制输入U_U1。

在步骤S2中，分别建立系统的动力学模型及状态方程如下：

其中，高阶无人机动力学模型为：

式中，g是重力加速度。x,y,z是无人机在三个坐标系中的位置，

是无人机在三个地坐标系中的加速度，φ,θ,

分别为无人机的横滚角、俯仰角和偏航角。

分别为无人机的横滚角加速度、俯仰角加速度和偏航角加速度，f_z是高度方向上的升力，M_φ，M_θ，

是在物体坐标的三个轴上的力矩。I_x，I_y，I_Z是在物体坐标的三个轴上的力矩。

根据式(1)无人的动力学模型，无人机的位置坐标是三维即有三个变量，对应的位置为x,y,z，所对应的速度变量也应为三个，分别在x,y,z上对应的速度为：

姿态角中的变量为三个分别是横滚角、俯仰角和偏航角，所对应的姿态角变化率中的变量也为三个，控制输入为三个变量，分别为

对于单个无人机的变量共为十五个变量，将其写为状态方程：

式中，

I₃为三阶单位矩阵。

二阶水面无人器的动力学模型为：

式中，

表示在水面的坐标，

表示在p_si方向上的速度，

表示位置的变化率，

表示在p_si方向上速度的变化率，u_si表示智能体i的输入。

根据式(3)水面无人器的动力学模型，水面无人器的位置坐标是二维即有两个变量，对应变量分别为

所对应的速度变量分别为在p_si方向上的，即

控制输入为

对于单个水面无人器中的变量共有六个，将其写为状态方程为：

式中，

I₂为二阶单位矩阵。

二阶水下无人器的动力学模型：

式中，

表示在水下的坐标，

表示在p_vi方向上的速度，

表示位置的变化率，

表示在p_vi方向上的速度变化率，u_vi表示智能体i的输入。

根据式(5)水下无人器的动力学模型，水下无人器的位置坐标是三维即有三个变量，对应变量分别为

所对应的速度变量分别为在p_vi方向上的，即

控制输入为

对于单个水面无人器中的变量共有九个，将其写为状态方程为：

式中，

I₃为三阶单位矩阵。

本步骤S2通过各智能体的动力学模型(式(1)、(3)和(5))构建了各智能体的状态方程(式(2)、(4)和(6))，其目的是在步骤S3中构建各智能体所对应的性能指标，进而通过黎卡提方程式得到参数，从而在步骤S4中求出控制参数。

步骤S3：确定各智能体的最优控制律及黎卡提方程。该步骤包括：

步骤S31：确定无人机、水面无人器、水下无人器的性能指标为J₁、J₂及J₃，根据上述步骤S2所得到的无人机状态变量X_A1、水面无人器状态变量X_S1、水下无人器状态变量X_U1、无人机控制输入U_A1、水面无人器控制输入U_S1、水下无人器控制输入U_U1代入到无人机、水面无人器、水下无人器的性能指标为J₁、J₂及J₃，最后，确定合适维度的第一对称非负定矩阵Q₁、第二对称非负定矩阵Q₂、第三对称非负定矩阵Q₃、第一对称正定矩阵R₁、第二对称正定矩阵R₂和第三对称正定矩阵R₃。

其中，构建无人机性能指标为：

式中，Q₁≥0，R₁>0。为了便于工程应用，性能指标中的Q₁，R₁取为对角线型矩阵。

根据上述步骤S2中可知，无人机状态变量X_A1中的变量为十二个，无人机控制输入U_A1中的变量为三个，依据式(7)本实施例取Q₁＝2*I₁₂，R₁＝5*I₃。

构建水面无人器的性能指标为：

式中，Q₂≥0，R₂>0。为了便于工程应用，性能指标中的Q₂，R₂取为对角线型矩阵。

根据上述步骤S2中可知，水面无人器状态变量X_S1中的变量为四个，水面无人器控制输入U_S1中的变量为两个，依据式(8)本实施例取Q₂＝5*I₄，R₂＝3*I₂；

构建水下无人器的性能指标为：

式中，Q₃≥0，R₃>0。为了便于工程应用，性能指标中的Q₃和R₃取为对角线型矩阵。

根据上述步骤S2中可知，水下无人器状态变量X_U1中的变量为六个，水下无人器控制输入U_U1中的变量为三个，依据式(9)本实施例取Q₃＝2*I₆，R₂＝5*i₃。

在步骤S31中，最终确定Q₁、Q₂、Q₃、R₁、R₂及R₃分别为：2*I₁₂，5*I₄，2*I₆，5*I₃，3*I₂，5*I₃。

步骤S32：通过步骤S31中的性能指标J₁、J₂及J₃，当系统的性能指标达到最优时，得到无人机、水面无人器、水下无人器的最优控制律分别为

及

同时得到黎卡提方程，根据步骤S2得到的A_A1、A_S1、A_U1、B_A1、B_S1、B_U1及步骤S31中获得的Q₁、Q₂、Q₃、R₁、R₂及R₃代入到黎卡提方程，最终获得无人机系统黎卡提方程的解P_A、水面无人器系统黎卡提方程的解P_s及水下无人器系统黎卡提方程的解P_u。

对于无人机而言，当取Q₁＝diag[q₁₁q₂₁…]时，根据步骤S31中式(7)性能指标的第一部分可以表示为

这一部分是系统在运动过程中跟踪误差的总度量。当取R₁＝diag[r₁₁r₁₂…]，式(7)性能指标的第二部分可以表示为

这一部分是系统能量消耗的总度量。通过以上的分析，无人机系统满足误差变量趋于零及能量消耗最低时，此时的最优控制律为：

P_A是黎卡提方程式的解：

对于水面无人器而言，当取Q₂＝diag[q₂₁q₂₂…]时，根据S31中式(8)性能指标的第一部分可以表示为

这一部分是系统在运动过程中跟踪误差的总度量。当取R₂＝diag[r₂₁r₂₂…]，式(8)性能指标的第二部分可以表示为

这一部分是系统能量消耗的总度量。通过以上的分析，水面无人器系统满足误差变量趋于零及能量消耗最低时，此时的最优控制律为：

P_s是黎卡提方程式的解：

对于水下无人器而言，当取Q₃＝diag[q₃₁q₃₂…]时，根据S31中式(9)性能指标的第一部分可以表示为

这一部分是系统在运动过程中跟踪误差的总度量。当取R₃＝diag[r₃₁r₃₂…]，式(9)性能指标的第二部分可以表示

这一部分是系统能量消耗的总度量。通过以上的分析，水下无人器系统满足误差变量趋于零及能量消耗最低时，此时的最优控制律为：

P_u是黎卡提方程式的解：

根据步骤S2中的系统状态方程，将A_A1和B_A1代入步骤S32式(11)中，同时将上述步骤S31中所取的Q₁和R₁代入步骤S32式(11)中，将会获得P_A。将步骤S2中的A_S1和B_S1代入步骤S32式(13)中，同时将上述步骤S31中所取的Q₂和R₂代入步骤S32式(13)中，将会获得P_S。将步骤S2中的A_u1和B_U1代入步骤S32式(15)中，同时将上述步骤S31中所取的Q₃和R₃代入步骤S32式(15)中，将会获得P_u。

步骤S4：确定控制参数，依据上述步骤S32得到的最优控制律，获得控制参数方程，通过步骤S2中的B_A1、B_S1及B_U1，步骤S31中的R₁、R₂及R₃和步骤S32中的P_A、P_s及P_u代入到控制参数方程中，最终，确定无人机系统的位置变量最优参数k_α1、速度变量最优参数k_α2、姿态角变量最优参数k_α3、姿态变化率变量最优参数k_α4、水面无人器系统的位置变量最优参数k_β1、速度变量最优参数k_β2，水下无人器系统的位置变量最优参数k_γ1和速度变量最优参数k_γ2。

具体的，在步骤S4中，基于上述步骤S32中得到的控制律分别为式(10)、(12)及(14)，分别获得无人机控制参数方程K₁、水面无人器控制参数方程K₂及水下无人器控制参数方程K₃分别为式(16)、(17)及(18)：

根据上述步骤基于步骤S2中的B_A1和步骤S3中的R₁与P_A代入式(16)中，从而得到：

根据上述步骤S2中的B_S1和步骤S3中R₂与P_S代入式(17)中，从而得到：

根据上述步骤S2中的B_U1和步骤S3中R₃与P_u代入式(18)中，从而得到：

最后，确定的参数k_α1，k_α2，k_α3，k_α4，k_β1，k_β2，k_γ1，k_γ2分别为：2.3452，6.4707，7.7541，4.5835，0.4472，1.0461，0.7746，1.466。

步骤S5：设计协同最优编队控制协议。该步骤包括：

步骤S51：定义系统中的误差向量，首先定义系统的初始状态变量，其次定义期望状态变量，最终获得误差状态变量，具体的：

定义系统中的初始状态变量为：

定义系统中的期望状态变量为：

定义误差状态变量为：

式中，P_A,V_A,Ω_A,

为无人机的位置、速度、姿态角、姿态角变化率的初始状态变量，P_S,V_S为水面无人器位置、速度的初始状态变量，P_U,V_U为水下无人器的位置、速度的初始状态变量，d(P_A)、d(V_A)、d(Ω_A)、

为无人机位置、速度、姿态角、姿态角变化率的期望状态变量，d(P_S)、d(V_S为水面无人器位置、速度的期望状态变量，d(P_U)、d(V_U)为水下无人器位置、速度的期望状态变量，

为无人机位置、速度、姿态角、姿态角变化率初始值与期望值的差值变量，

为水面无人器位置、速度初始值与期望值的差值变量，

为水下无人器位置、速度初始值与期望值的差值变量。

步骤S52：引入转换矩阵，根据步骤S2中P_A1 ^T、P_S1 ^T及P_U1 ^T的变量维度分别是三维、二维及三维，进而引入转换矩阵m_SA，m_AS及m_US使系统中的变量维度达到一致，同时也为后续设计的控制协议中的运算考虑，m_SA与P_S1 ^T相乘会变为三维变量，m_AS与P_A1 ^T相乘会变为二维变量，m_AS与P_U1 ^T相乘会变为二维变量，m_US与P_S1 ^T相乘会变为三维变量，依据步骤S1中获得的L可知，无人机与水下无人器没有通信联系，将无需考虑二者之间的转换关系，最终，无人机会转为与水面无人器相同的维度，水面无人器会转换为与无人机、水下无人器相同的维度。

在步骤S52中，基于步骤S2可知，异构系统中智能体的模型并不相同，因此协同的关键在于寻找模型之间的公共部分。无人机的飞行空间为三维空间，水面无人器为二维空间，水下无人器为三维空间。提出转换矩阵m_SA，m_AS，m_US来解决三者运动空间维度不匹配的问题。其中，

步骤S53所设计的控制协议是依据上述步骤S51的误差向量为变量，根据上述步骤S4得到的k_α1，k_α2，k_α3，k_α4，k_β1，k_β2，k_γ1，k_γ2的控制参数及步骤S1的拉普拉斯矩阵L确定协同最优编队控制协议。

在步骤S53中，设计了协同最优编队控制协议如下：

式中，k_α1，k_α2，k_α3，k_α4，k_β1，k_β2，k_γ1，k_γ2是由步骤S4所确定的参数，

是步骤S51中误差变量的位置变量，

表示第j个智能体的位置误差变量，

表示第i个智能体的位置误差变量。

通过系统中的通信拓扑关系确定系统中的变量关系，根据S1中的拉普拉斯矩阵可知，式(16)无人机1中u_ia的

表示无人机1的位置误差变量，

表示与无人机1有联系的智能体中的位置误差变量，即无人机2、无人机3及水面无人器1的位置误差变量与无人机1位置误差变量差值。式(16)无人机2中u_ia的

表示无人机2的位置误差变量，

表示与无人机2有联系的智能体中的位置误差变量，即无人机1、无人机3及水面无人器2的位置误差变量与无人机2位置误差变量差值。式(16)无人机3中u_ia的

表示无人机3的位置误差变量，

表示与无人机3有联系的智能体中的位置误差变量，即无人机1、无人机2及水面无人器3的位置误差变量与无人机3位置误差变量差值。对于水面无人器系统式(17)及水下无人器系统式(18)亦如此，

是步骤S51中第i个智能体的速度误差变量，

是步骤S51中第j个智能体的速度误差变量，

是步骤S51中误差变量的姿态角变量，

是S51中误差变量的姿态角变化率变量。

为步骤S1中的拉普拉斯矩阵元素，通过系统中的通信拓扑关系确定系统中的变量关系，根据S1中的拉普拉斯矩阵可知，式(16)、(17)及(18)中的无人机和水下无人器中的所有误差变量都没有联系，在本发明中，式(18)中水下无人器1的控制协议是水下无人器1与水面无人器1、水下无人器2和水下无人器3之间的联系。式(18)中水下无人器2的控制协议是水下无人器2与水面无人器2、水下无人器1和水下无人器3之间的联系。式(18)中水下无人器3的控制协议是水下无人器3与水面无人器3、水下无人器1和水下无人器2之间的联系。式(17)中水面无人器的控制协议与无人机和水下无人器都有联系，式(17)中水面无人器1的控制协议是水面无人器1与无人机1、水面无人器3及水下无人器1之间的联系。式(17)中水面无人器2的控制协议是水面无人器2与无人机2、水下无人器2及水面无人器1之间的联系。式(17)中水面无人器3的控制协议是水面无人器3与无人机3、水下无人器3及水面无人器2之间的联系。式(16)中的无人机只与水面无人器有联系，式(16)中无人机1与无人机2、无人机3及水面无人器1之间的联系。式(16)中无人机2与无人机1、无人机3及水面无人器2之间的联系。式(16)中无人机3与无人机1、无人机2及水面无人器之间的联系。m_SA，m_AS，m_US是步骤S52中的转换矩阵以便控制协议可以进行运算。

基于此，该实施例的混合阶异构多智能体系统编队仿真结果如图3所示，基于图3中体现的三个无人机、三个水面无人器及三个水下无人的实际轨迹曲线，能够说明，采用本发明提供的混合阶异构多智能体系统协同最优编队控制方法可以在第十秒，完成三角形编队并实现三个系统的协同控制。

此外，对应于上述提供的混合阶异构多智能体系统协同最优编队控制方法，本发明还提供了一种混合阶异构多智能体系统协同最优编队控制设备，该设备实质是一种电子设备，其主要包括：存储器和处理器。

存储器用于存储计算机软件程序。存储器可以是计算机可读存储介质。

处理器与存储器连接。处理器主要用于调取并执行计算机软件程序，以实施本发明上述提供的混合阶异构多智能体系统协同最优编队控制方法。

进一步，本发明采用的处理器包括：拉普拉斯矩阵确定模块、状态方程构建模块、状态控制参数确定模块、最优控制律确定模块、控制参数方程构建模块、控制参数确定模块、协同最优编队控制协议构建模块和编队控制模块。

其中，拉普拉斯矩阵确定模块用于构建混合阶异构多智能体系统的通信拓扑模型，并基于通信拓扑模型确定混合阶异构多智能体系统的拉普拉斯矩阵。

状态方程构建模块用于建立混合阶异构多智能体系统的动力学模型，并基于动力学模型构建各智能体的状态方程。

状态控制参数确定模块用于基于状态方程确定各智能体的状态控制参数。状态控制参数包括：各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入。

最优控制律确定模块用于基于状态控制参数确定各智能体的最优控制律。

控制参数方程构建模块用于基于最优控制律构建控制参数方程。

控制参数确定模块用于基于控制参数方程确定各智能体的控制参数。

协同最优编队控制协议构建模块用于基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。

编队控制模块用于基于协同最优编队控制协议控制各智能体实现混合阶异构多智能体系统编队。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种混合阶异构多智能体系统协同最优编队控制方法，其特征在于，包括：

基于所述状态控制参数确定各智能体的最优控制律；

基于所述最优控制律构建控制参数方程；

基于所述控制参数方程确定各智能体的控制参数；

2.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法，其特征在于，构建混合阶异构多智能体系统的通信拓扑模型，并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵，具体包括：

基于所述联系关系确定所述通信拓扑模型中每一顶点的度；

基于所述通信拓扑模型中每一顶点的度构建度矩阵；

3.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法，其特征在于，基于所述状态控制参数确定各智能体的最优控制律，具体包括：

构建各智能体的性能指标；

4.根据权利要求3所述的混合阶异构多智能体系统协同最优编队控制方法，其特征在于，基于所述控制参数方程确定各智能体的控制参数，具体包括：

5.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法，其特征在于，基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议，具体包括：

6.一种混合阶异构多智能体系统协同最优编队控制设备，其特征在于，包括：

存储器，用于存储计算机软件程序；

处理器，与所述存储器连接，用于调取并执行所述计算机软件程序，以实施如权利要求1-5任意一项所述的混合阶异构多智能体系统协同最优编队控制方法。

7.根据权利要求6所述的混合阶异构多智能体系统协同最优编队控制设备，其特征在于，所述处理器包括：

8.根据权利要求6所述的混合阶异构多智能体系统协同最优编队控制设备，其特征在于，所述存储器为计算机可读存储介质。