CN116414037A

CN116414037A - 一种用于集群系统约束控制的自适应装置

Info

Publication number: CN116414037A
Application number: CN202310678172.3A
Authority: CN
Inventors: 董希旺; 王庆; 孔祥锡; 化永朝; 于江龙; 任章; 吕金虎
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2023-06-09
Filing date: 2023-06-09
Publication date: 2023-07-11
Anticipated expiration: 2043-06-09
Also published as: CN116414037B

Abstract

本发明公开了一种用于集群系统约束控制的自适应装置，涉及集群系统协同控制领域，其中，第一自适应观测器、第二自适应观测器和自适应控制器；第一自适应观测器用于基于目标跟随者的第一运动状态向量，预测目标领导者的运动状态向量；第二自适应观测器用于基于目标跟随者的第二运动状态向量，预测目标领导者的指令信息；自适应控制器用于根据目标领导者的运动状态向量和指令信息，基于鲁棒预定义输出约束，对集群系统中的各跟随者进行约束控制。本发明通过第一、第二自适应观测器，可以预测目标领导者的状态和指令信息，并可以通过自适应控制器，使跟随者跟随领导者的状态和指令进行移动，从而实现了集群系统的约束控制。

Description

一种用于集群系统约束控制的自适应装置

技术领域

本发明涉及集群系统协同控制领域，特别是涉及一种用于集群系统约束控制的自适应装置。

背景技术

目前，包括无人车和无人机在内的集群系统协同控制技术因其在海洋测绘、搜索和救援等领域的广泛应用而受到越来越多的关注。在许多实际情况下，具有不同类型和不同动力学的多个机器人可以通过彼此协作更有效地完成一些复杂或大型任务，例如在火灾后使用无人车和无人机进行协作搜索和救援或海啸灾难，通过无人车和空中无人机的组合，空地协同控制系统可以大大提高工作效率，弥补单一机器人的局限性。因此，研制一种可用于无人车和无人机在内的集群系统约束控制的自适应观测器，对于集群系统协同控制领域的发展十分重要。

发明内容

本发明的目的是提供一种用于集群系统约束控制的自适应装置，可实现包括无人车和空中无人机的集群系统的约束控制。

本发明提供了一种用于集群系统约束控制的自适应装置，包括：第一自适应观测器、第二自适应观测器和自适应控制器；

所述第一自适应观测器，用于基于集群系统中目标跟随者的第一运动状态向量，预测目标领导者的运动状态向量；所述第一运动状态向量包括所述目标跟随者的位置状态、速度状态和加速度状态；所述运动状态向量为所述目标领导者的位置状态、速度状态和加速度状态；

所述第二自适应观测器，用于基于所述集群系统中目标跟随者的第二运动状态向量，预测所述目标领导者的指令信息；所述第二运动状态向量包括所述目标跟随者的目标救援地点、当前速度、所述目标跟随者与相邻跟随者的相对速度以及所述目标跟随者与目标领导者的距离；

所述自适应控制器，包括输出约束控制协议模型，用于根据所述目标领导者的运动状态向量和指令信息，基于鲁棒预定义输出约束，对所述集群系统中的各跟随者进行约束控制。

可选的，所述第一自适应观测器，具体如下：

；

；

其中，

，/>

，/>

为第i个跟随者在t时刻的第一运动状态向量；/>

，/>

分别为正参数，/>

为第j个状态变化量在第i个跟随者处的估计值，/>

，/>

为估计矩阵，/>

为第i个跟随者对第M个领导者状态的估计值，a为与状态向量维数相等的矩阵，/>

，

，/>

，

为第j个领导者对自身状态的估计值，/>

表示第i个跟随者对第j个领导者状态的估值与第j个领导者对自身状态的估值之间的差值。

可选的，所述第二自适应观测器，具体如下：

；

；

其中，

，/>

为跟随者i在时间/>

时对于/>

的估算输出矩阵；/>

，/>

是正实数，为跟随者i对于领导者j的观测器增益，/>

为领导者j在时间t的输出，

和/>

分别为跟随者和领导者的个数。

可选的，所述自适应控制器，具体如下：

；

其中，u_i(t)为第i个跟随者的控制输入，x_i(t)表示第i个跟随者的状态向量，X_ij(t)表示第i个跟随者对第j个领导者状态的估计误差，Q_1i和Q_ij(t)为可调参数矩阵，

为第i个跟随者与第j个领导者之间的连接权重；/>

为第i个跟随者的状态反馈增益函数；

是第i个来自跟随者的未知参数估值。

可选的，还包括：

跟随者动力模块，用于获取跟随者的运动状态信息。

可选的，所述跟随者动力模型，具体如下：

；

y_i(t)=C_ix_i(t)；

其中，

分别为跟随者/>

的状态向量、输入向量和输出向量，/>

，/>

，/>

分别为/>

的常数矩阵；

为基有界函数向量，/>

为未知常数矩阵。

可选的，还包括：

领导者动力模块，用于获取目标领导者的状态信息。

可选的，所述领导者动力模型，具体如下：

；

z_j(t)=F_js_j(t)；

其中，

和/>

分别为领导者/>

的状态向量和输出向量，

为目标领导者的系统矩阵，/>

为目标领导者的输出矩阵。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供了一种用于集群系统约束控制的自适应装置，包括：第一自适应观测器、第二自适应观测器和自适应控制器；第一自适应观测器，用于基于集群系统中目标跟随者的第一运动状态向量，预测目标领导者的运动状态向量；第一运动状态向量包括目标跟随者的位置状态、速度状态和加速度状态；运动状态向量为目标领导者的位置状态、速度状态和加速度状态；第二自适应观测器，用于基于集群系统中目标跟随者的第二运动状态向量，预测目标领导者的指令信息；第二运动状态向量包括目标跟随者的目标救援地点、当前速度、目标跟随者与相邻跟随者的相对速度以及目标跟随者与目标领导者的距离；自适应控制器，包括输出约束控制协议模型，用于根据目标领导者的运动状态向量和指令信息，基于鲁棒预定义输出约束，对集群系统中的各跟随者进行约束控制。本发明通过第一自适应观测器、第二自适应观测器，可以预测集群系统中领导者的状态信息和指令信息，并可以通过自适应控制器控制集群系统中跟随目标领导者的跟随者的运动，使其按照预设的约束条件进行移动，从而实现集群系统的约束控制。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的集群系统拓扑结构图；

图2为预定义输出约束控制观测估计误差

曲线图；

图3为自适应观测器控制协议的稳定输出约束误差

的变化曲线图；

图4为预定义输出约束控制状态估计误差

变化曲线图；

图5为估计误差

在50秒内的变化曲线图；

图6为估计误差

在50秒内的变化曲线图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明提供的一种用于集群系统约束控制的自适应装置，包括：第一自适应观测器、第二自适应观测器和自适应控制器。

所述第一自适应观测器，用于基于集群系统中目标跟随者的第一运动状态向量，预测目标领导者的运动状态向量；所述第一运动状态向量包括所述目标跟随者的位置状态、速度状态和加速度状态；所述运动状态向量为所述目标领导者的位置状态、速度状态和加速度状态。

所述第二自适应观测器，用于基于所述集群系统中目标跟随者的第二运动状态向量，预测所述目标领导者的指令信息；所述第二运动状态向量包括所述目标跟随者的目标救援地点、当前速度、所述目标跟随者与相邻跟随者的相对速度以及所述目标跟随者与目标领导者的距离。

具体的，自适应观测装置的作用是确保每个跟随者都能够收敛于领导者，从而实现集群系统的约束控制。

举例来说，假设有一个无人车和两个无人机组成的集群系统，其中无人车为领导者，两个无人机为跟随者。在执行任务时，无人车需要向两个无人机发送指令，让它们跟随无人车进行协同工作。由于无人车和无人机的动力学特性不同，因此它们的运动状态也不同，这就导致了集群系统的约束控制问题。为了解决这个问题，可以使用本发明中提出的自适应观测器来实现集群系统的约束控制。具体来说，自适应观测装置可以根据无人车和无人机的状态信息和指令信息，对两个无人机进行约束控制，确保它们能够跟随无人车进行协同工作。

以火灾救援为例，多个领导者在发现了一个位置的火情时，需要一些跟随者跟随去救援。此时，可以使用本发明中提出的自适应观测装置来实现跟随者与领导者之间的约束控制，确保跟随者能够有效地协同工作，提高救援效率。

观测器的运作流程可以分为两个部分：第一部分是第一自适应观测器，用于预测集群系统中目标领导者的运动状态向量；第二部分是第二自适应观测器，用于预测集群系统中目标领导者的指令信息。

如图1所示，无人车1、2、3为领导者，以无人车1为例，在火灾救援场景中，假设有一个无人车1为领导者，多个无人机（无人机4-9中的一部分）为跟随者。无人车需要向多个无人机发送指令，让它们跟随无人车进行协同工作。在这个过程中，第一自适应观测器可以根据跟随者的状态信息，如位置状态、速度状态和加速度状态，来预测无人车的状态信息，如位置状态、速度状态和加速度状态。同时，跟随者之间也可以通过信息交互来获得相邻跟随者的状态信息，从而更准确地预测无人车的状态信息。例如，当第一自适应观测器观测到无人机4的位置变化较为平均，速度为匀速，加速度接近于零时，说明跟随者无人机4已经成功跟随领导者无人车1进行运动，且领导者无人车1的位置状态、速度状态和加速度状态与无人机4较为接近。

第二自适应观测器则用于预测无人车的指令信息，如跟随者的目标救援位置。跟随者的状态信息包括跟随者的目标救援地点、当前速度、所述跟随者与相邻跟随者的相对速度以及所述跟随者与领导者的距离。通过这些状态信息，第二自适应观测器可以预测无人车的指令信息，从而实现跟随者与领导者之间的约束控制。

在一些实施例中，所述自适应装置还包括领导者动力模块和跟随者动力模块，具体可以如下：

其中，领导者动力模块，包括领导者动力模型，用于获取目标领导者的状态信息；对于一般的异构非线性集群系统，领导者动力模块的领导者动力模型，具体可以如下：

。

式中，

和/>

分别代表领导者/>

的状态和输出向量，其中

是有界的。/>

表示系统矩阵，/>

表示输出矩阵，对于任何跟随者/>

都是未知的。

其中，所述自适应装置中的跟随者动力模块，包括跟随者动力模型，用于获取领导者的状态信息。对于一般的异构非线性集群系统，跟随者动力模块中的跟随者动力模型，具体可以如下：

。

其中

分别表示跟随者/>

的状态、输入和输出向量，/>

，/>

，/>

表示/>

的常数矩阵。/>

是可镇定的，/>

是可检测的，/>

是基有界函数向量，/>

是未知常数矩阵。

此外，在完成领导者动力模型和跟随者动力模型之后，本发明还给出对于鲁棒预定义输出约束的定义，即如果存在多个预定义的非负常数

，满足/>

使得领导者动力模型和跟随者动力模型描述的异构非线性集群系统存在解，则认为实现了鲁棒的预定义输出约束控制，约束控制如下所示：

。

其中，y_i(t)∈R^P，表示跟随者

的输入向量，z_j领导者/>

的输出向量，M为跟随者的个数，/>

为第i个跟随者与第j个领导者之间的连接权重

在一些实施例中，建立第一自适应观测器，具体可以如下：

根据目标节点的相邻节点信息，针对跟随者

，构建如下所示的自适应观测器：

。

式中，

，/>

，/>

为第i个跟随者在t时刻的状态向量；/>

，/>

分别为正参数，/>

为第j个状态变化量在第i个跟随者处的估计值。

自适应观测器中，

具体可以如下表示：

。

式中，

为估计矩阵，/>

为第i个跟随者对第M个领导者状态的估计值，a为与状态向量维数相等的矩阵/>

具体可以如下：

。

，式中，/>

，/>

为第j个领导者对自身状态的估计值，/>

第一自适应观测器，可以如下：

。

。

式中，

。

令

，

，

，

，/>

。

由于追随者之间的通信链路是双向的，即拓扑图是无向的，那么

为正定矩阵，式中的/>

，

，/>

。

可以得出

，并且/>

，那么，根据领导者动力模型和第一自适应观测器公式/>

和/>

可以改写为：

。

。

依据上述规定，对于第

个跟随者，任意/>

，/>

，自适应观测器/>

收敛于不同领导者/>

的整个状态，即/>

。此外，/>

存在且对于所有/>

都是有界的，并且满足/>

。

因此，当输入到系统的信号

为PE信号时，则可以得到/>

，即

，实现了领导者状态的估计。

例如，在建立第一自适应观测器时，如图1所示的集群系统拓扑结构图，邻居节点的相对信息指的是跟随者节点4与其邻居节点5之间的相对信息，这些相对信息可以包括邻居节点j的状态、速度、位置等信息，以及跟随者节点4与邻居节点5之间的相对位置、速度等信息。跟随者节点通过观测邻居节点的状态、速度、位置等信息，来构建自适应观测器来估计领导者的状态。具体来说，第一自适应观测器是根据邻居节点的相对信息来构建的，这些相对信息包括邻居节点的状态、速度、位置等信息，以及跟随者节点与邻居节点之间的相对位置、速度等信息。假设在火灾救援的场景中，如果我们想估计无人机（领导者）1的状态，我们可以选择与无人机1相连的跟随者4、5、6中的一个作为观测器，假设我们选择跟随者4。跟随者4可以观测到自己与无人机1之间的相对位置和速度，同时也可以通过与邻居节点之间的信息交互，获得与跟随者5、6相连的无人机的状态信息。然后，通过第一自适应观测器来估计无人机1的状态。具体来说，第一自适应观测器，它可以根据跟随者4的观测结果和与邻居节点之间的信息交互来自适应地估计无人机（领导者）1的状态。

在一些实施例中，建立第二自适应观测器，具体可以如下：

第二自适应观测器为观测非同一不确定性领导者输出的自适应观测器。鉴于多个非同一不确定性领导者的输出对任何追随者都是未知的，并且领导者输出矩阵的信息是解决后续输出调节方程的关键，本发明提出了第二自适应观测器，基于第一自适应观测器及其与邻近从属者的交互，来估算目标领导者的输出，这些交互信息包括从属者节点的状态、输出、系统或输出矩阵以及不确定参数等信息。第二自适应观测器具体如下：

。

。

其中，

，/>

表示第/>

个从属者在时间/>

时对于/>

的估算输出矩阵；/>

的形式如下：

。

其中

是正实数，表示第/>

个跟随者对于第/>

个领导者的观测器增益，/>

表示第/>

个领导者在时间/>

的输出，/>

和/>

分别为跟随者和领导者的个数。

对于第

个跟随者，在第二自适应观测器下，估计误差趋近于零，即

，同时输出矩阵观测器/>

可以估计第/>

个领导者的输出矩阵，即/>

，实现了领导者输出信息的估计。

此外，本申请在应用构建的第一自适应观测器和第二自适应观测器研究异构非线性集群系统的鲁棒预定义输出约束问题时。解决此问题的关键步骤是得到系统输出调节方程的解，并构建相应的鲁棒预定义输出约束控制协议。但是，由于矩阵

和/>

不完全已知，因此在构建约束控制协议之前，需要重新开发一种新的方法来解决输出调节问题。方法如下：

定义对于跟随者

和领导者/>

，总是存在解/>

满足以下调节器方程：

。

当且仅当对于所有

，其中/>

表示/>

的谱，满足

时，调节方程才有解，但是/>

都是未知的，这意味着不能直接求解调节方程的解。虽然目前存在一种迭代自适应方法来解决的问题，但这种方法并没有考虑到状态和输出矩阵/>

同时都是完全未知的情况。因此，本发明在此基础上又开发了一种新的自适应方法来处理这种具有未知状态和输出矩阵的分布式控制系统的输出调节的问题。

针对任意初始值

，本发明提出了一个自适应方法，该方法通过求解以下方程来实现输出调节：

。

其中，

，/>

和/>

均为已知量，/>

为未知向量，表示系统状态和控制输入。本发明证明输出调节存在唯一有界解/>

，并且该解趋近于/>

。这种自适应方法能够解决状态和输出矩阵均为未知的情况，具有实际应用价值。

在一些实施例中，在解决系统输出调节方程解的逼近问题后，开始设计异构不确定非线性集群系统的自适应输出约束控制器（自适应控制器）。根据本发明，为了确保由领导者动力模型和跟随者动力模型中描述的异构不确定非线性集群系统实现鲁棒预定义输出约束，提出了以下自适应鲁棒预定义输出约束控制协议，该协议基于构建的第一自适应观测器和第二自适应观测器对

进行控制。

所述自适应控制器中的输出约束控制协议模型，具体可以如下：

。

式中，

，/>

，

，/>

，

，u_i(t)为第i个跟随者的控制输入，x_i(t)表示第i个跟随者的状态向量，X_ij(t)表示第i个跟随者对第j个领导者状态的估计误差，Q_1i和Q_ij(t)为可调参数矩阵，/>

为第i个跟随者与第j个领导者之间的连接权重；/>

为第i个跟随者的状态反馈增益函数；/>

是第i个来自跟随者的未知参数估值，/>

为第i个跟随者对系统参数的平均估计值；/>

第i个跟随者的自适应增益；/>

第i个跟随者的平均自适应增益。

式中，学习率

和修改增益/>

分别表示正常数，/>

构造如下：

。

在该控制协议下，系统能够实现鲁棒预定义输出约束。

令

。因此，根据领导者动力模型、跟随者动力模型和输出约束控制协议模型可以推导出/>

；

；

。

其中

。

由于

，且/>

，因此可得：

。

其中

，/>

。

仿真算例：

本发明考虑一个由三个领导者和六个跟随者组成的异构非线性集群系统。集群系统的拓扑结构如图1所示。跟随者和领导者的动态分别根据领导者动力模型和跟随者动力模型确定，其中，

，/>

，

，/>

，/>

，/>

，/>

，

，/>

，/>

，其中，/>

是跟随者的集合。

非线性项

可表示为/>

。

设

，/>

，选择/>

，其中/>

为在区间/>

内的一个随机数。在第一自适应观测器和自适应控制器中选择/>

。借助MAtLAB，可将增益矩阵

设计成/>

。

在考虑到设计的自适应控制器的情况下，针对所考虑的集群系统，图2、4、5和6显示了估计误差

和/>

的变化过程。同时，图3展示了自适应控制器的自适应观测器控制协议的稳定输出约束误差

的变化过程。

此外，如图1所示，为了预测领导者1的位置和速度，需要知道至少一个与领导者1相连的跟随者的状态，然后通过第一自适应观测器来估计领导者1的状态。如果第一观测器的输入端输入的跟随者状态信息为跟随者8的状态信息，那么需要对跟随者5的状态进行估计，然后才能估计跟随者4的状态，最终才能估计领导者1的状态。

综上所述，本发明具有以下优点：

本发明提供的集群系统约束控制的自适应装置，采用第一自适应观测器和第二自适应观测器来预测集群系统中领导者的状态信息和指令信息。此外，还通过自适应装置中的自适应控制器来控制集群系统中的跟随者，使其按照预设的约束条件进行移动。通过这种方式，可以实现集群系统的约束控制。具体来说，第一自适应观测器能够对领导者的运动状态进行实时观测和预测，包括其位置、速度和加速度等信息。第二自适应观测器则能够对领导者的指令信息进行实时观测和预测，包括其目标位置和速度等信息。在预测了领导者的状态信息和指令信息后，自适应控制器能够生成相应的控制指令，将其传递给跟随者，以实现集群系统的约束控制。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。