CN117193146A

CN117193146A - 智能体集群的控制方法及相关产品

Info

Publication number: CN117193146A
Application number: CN202311470416.5A
Authority: CN
Inventors: 高庆; 刘晨光; 吕金虎; 王振乾; 高王博
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2023-11-07
Filing date: 2023-11-07
Publication date: 2023-12-08
Anticipated expiration: 2043-11-07
Also published as: CN117193146B

Abstract

本发明公开了一种智能体集群的控制方法及相关产品。该控制方法中，对于智能体集群中的任一个智能体，按照如下公式确定控制输入，并根据计算得到的控制输入调控自身状态：，其中满足。该方法能够保证智能体系统的无源性和一致性。

Description

智能体集群的控制方法及相关产品

技术领域

本发明涉及一种智能体集群的控制方法及相关产品。

背景技术

智能体集群的协同控制问题一直是智能控制领域的研究热点。在智能体集群中，由于智能体之间存在相互影响和耦合，因此要实现协同控制是一项具有挑战性的任务。为了解决这个问题，研究人员一直在探索各种合作控制策略和技术。随着智能体集群在现实世界中的广泛应用，例如智能交通、无人机编队控制、协作式机器人、社交网络等领域，智能体集群的协同控制研究变得更加重要和紧迫。作为一种典型的智能体集群控制，多机器人系统中的一致性控制问题涉及到如何使机器人在动态环境中共同协作以实现相同的目标，比如达到相同的速度，位置和姿态等等。

中国专利CN116540781A公开一种种无人机集群的速度同步方法、装置、设备及介质，其方法包括获取无人机集群中各无人机初始的速度和位置；重复以下步骤，直至无人机集群的速度同步程度达到预设值：根据各无人机的速度和位置确定各无人机的相互作用力和相互作用合力；根据各无人机的相互作用合力更新各无人机的速度和位置。

发明内容

本发明提供一种智能体集群的控制方法及相关产品。

本发明采用如下技术方案：一种智能体集群的控制方法，包括：对于智能体集群中的任一个智能体，按照如下公式确定控制输入，并根据计算得到的控制输入调控自身状态：

；

其中，为第r个智能体的控制输入，t为时间，z是智能体集群中智能体的数量，/>是预设的智能体集群的通信拓扑矩阵/>中的元素，/>和/>为控制增益矩阵，/>为第l个智能体的状态误差，/>为第r个智能体的状态误差；其中，控制增益矩阵/>和/>满足：

；

其中，

；

I_z为z维单位矩阵，为设定的系数，/>和/>为设定的系数矩阵，/>＞0，H为设定的正定矩阵，M为设定的对角矩阵，I_n为n维单位矩阵，/>为设定的正实数，

；

其中，H、M和满足：

；

其中，智能体r的动力学模型如下：

；

σ∈(0,1)是分数阶求导的阶数，c_r(t)∈Rⁿ、w_r(t)∈Rⁿ和u_r(t)∈Rⁿ依次为第r个智能体在时间t的状态、外部输入和控制输入，g(t,c_r(t))∈Rⁿ是连续可微分的非线性向量函数，代表Caputo类型的分数阶导数，n是大于0的整数。

本发明采用如下技术方案：一种智能体的控制器，所述智能体为智能体集群中的智能体，所述控制器包括存储器和处理器，所述存储器存储程序，所述处理器运行所述程序以执行前述的方法。

本发明采用如下技术方案：一种智能体，包括前述控制器。

本发明采用如下技术方案：一种程序产品，所述程序产品在处理器上运行时执行前述的方法。

该方法使得智能体集群的工作状态能够达到无源性以及一致性。

附图说明

图1是本发明的智能体集群的控制方法的设计思路。

图2是本发明的一个实施例的智能体集群的通信拓扑图。

图3是图2所示智能体集群中各智能体的输出方程的幅度随时间的变化曲线。

图4是图2所示智能体集群中各智能体的外部输入的幅度随时间的变化曲线。

图5是图2所示智能体集群中各智能体的状态误差的幅度随时间的变化曲线。

具体实施方式

下面结合具体实施例对本发明作进一步的说明，但本发明的保护范围并不限于此。

本发明对智能体集群中智能体的种类不做限定，例如智能体为机器人、无人机、无人船等。本发明对需要达到一致的状态的具体种类不做限定，例如是编队位置、速度、姿态等。

本发明的实施例提供：一种智能体集群的控制方法，包括：对于智能体集群中的任一个智能体，按照如下公式确定控制输入，并根据计算得到的控制输入调控自身状态：

；

其中，

；

其中，H、M和满足：

；

其中，智能体r的动力学模型如下：

；

以下结合图1详细介绍该方法的设计以及论证过程。

符号说明：是n*n维矩阵的集合；集合/>代表v个智能体构成的集合，无向边集合/>表示v个智能体之间的无向通信链接；对于一个实对称矩阵/>，表示矩阵G的特征值，且满足/>，/>表示拉普拉斯变换。一个矩阵大于0表示其是正定的；矩阵小于0表示其是负定的；矩阵大于或等于0表示其是半正定的；矩阵小于或等于0表示其是半负定的。

建立非线性分数阶智能体集群模型。

首先介绍一些关于分数阶微积分的基本定义和性质。

定义一：对于任意的，其Caputo分数阶导数被定义为：

；

其中，0<<1，t≥0， />是Euler's Gamma 函数，表达式如下：

。

的拉普拉斯变换为

；

其中，，s代表拉普拉斯域中的变量。

作为指数函数的一个推广概念，Mittag-Lefler函数在分数阶系统的解中起着关键作用，我们给出Mittag-Lefler函数的定义如下。

定义二：带有两个参数的Mittag-Lefler函数和带有一个参数的Mittag-Lefler函数/> 被定义如下：

；

其中，并且/>。特别的，/> 并且/>。此外,

；

其中，t≥0 并且。

根据上述Caputo分数阶导数的定义与性质，建立由z个智能体构成的非线性分数阶多智能体集群的动力学模型，其中每个智能体的动态被建立为

（1）；

其中，代表分数阶的阶数。/>、/>和/>分别代表第r个智能体的状态、外部输入和控制输入。非线性向量函数/>是连续可微分的并且满足下面的条件

；

其中并且。

定义作为智能体集群之间的通信拓扑结构并且满足下面的扩散条件：

。

接下来，构建误差系统。定义智能体集群的误差动态方程。定义所有智能体的状态均值为

，进一步

。

定义所有智能体的状态误差，r=1,2,...,z。则误差动态方程为：

（2）。

为上述智能体集群的误差动态方程定义输出方程：

（3）；

其中和/> 是预先给定的具有合适维度的常系数矩阵。此外，为了便于陈述，预先给定如下记号：

。

无源性，作为耗散性的一种特例，是基于广义能量概念对系统输出和输入行为的表征。以下给出如下关于非线性分数阶智能体集群无源性相关定义。

定义三.如果存在一个正半定的能量存储函数 S(t) 满足

；

那么非线性分数阶智能体集群(2)和(3)具备输出严格无源性，其中。

本发明的主要目标是通过设计合适的状态反馈控制器使得非线性分数阶智能体集群通过满足系统无源性进而实现一致性，即满足下面的条件

。

设计状态反馈控制器并建立闭环控制系统。

为误差动态系统(2)设计如下状态反馈控制器：

（4）；

其中和/>为控制增益矩阵。

那么根据状态反馈控制器，我们可以得到闭环控制系统：

（5）。

给出在状态反馈控制器下保证闭环控制系统实现输出严格无源性的充分条件。

以下定理给出了闭环控制系统(5)实现输出严格无源性的充分条件。

定理一.借助状态反馈控制器,闭环控制系统(5)能够实现输出严格无源性,如果存在一个正常量满足：

（6）；

其中，，并且。

选取如下所示Lyapunov泛函：

（7）。

沿着闭环控制系统的轨迹对V₁(t)进行时间导数：

（8）。

计算出所有智能体的误差信息：

。

因此，

（9）。

对非线性项进行放缩：

（10）。

进一步，

（11）。

根据非线性分数阶智能体集群的输出严格无源性定义以及(11)可以实现：

（12）

其中，，。

结合定理条件和(12)则有：

。

因此,闭环控制系统通过状态反馈控制器可以实现输出严格无源性。上述过程保证了智能体集群通过状态反馈控制器(4)能够实现输出严格无源性。下面给出智能体集群通过无源性能够进一步实现一致性的条件。

基于得到的输出严格无源性准则，给出保证非线性分数阶智能体集群实现一致性的充分条件。

定理二.如果闭环控制系统(5)通过状态反馈控制器实现了输出严格无源性, 并且智能体集群的输出方程参数满足,那么非线性分数阶智能体集群可以实现一致性。

考虑到闭环控制系统(5)通过状态反馈控制器实现了输出严格无源性：

；其中，/>。

令分数阶智能体集群外部输入w(t)=0，

（13）

其中。

根据(7)可以得到：

（14）。

根据 (13) 和 (14)可以得到：

。

显然，存在一个非负的函数满足

（15）。

对(15)进行拉普拉斯变换

；

其中和/> 分别代表/>和/>的拉普拉斯变换后的形式。

可以得到：

（16）。

对(16)进行逆拉普拉斯变换

（17），

其中是非负的。将 (17) 带入(14) ，得到：

。

进一步，。

因此，智能体集群通过状态反馈控制器(4)能够实现一致性。上述过程保证了智能体集群通过状态反馈控制器(4)在基于输出严格无源性情况下通过调节系统输出参数可以进而实现一致性。

以下提供一个数值化的实例，以对以上方法进行验证。

参考图2，设定六个运行在沙地的地面机器人构成的非线性多地面机器人系统。构建如下分数阶动态模型:

；

其中，地面机器人的个数 r=1,2,...6。

每个地面机器人的非线性项由Chua’s电路构成

；

其中，。

显然，我们通过简单的计算并且/>, 那么非线性函数的条件能够成立。

情形一: 误差动态方程中第 r 个地面机器人的输出表示为：

；

其中，我们给定输出方程的调节系数矩阵

。

地面机器人之间的通信拓扑矩阵如下所示：

。

设定如下参数：

。

以上参数满足定理一，这表明闭环的非线性分数阶多地面机器人系统如预期的一样在状态反馈控制器下能够实现输出严格无源性。仿真结果如图3至图5所示。

情形二:如果我们选择与情形一相同的系统参数和/>。那么可以发现/>，因此定理二也同样能够被满足。仿真结果如图5所示。图5清晰的显示,当时间t增加到1s时，所有地面机器人的误差/>收敛到零，并且可以随着时间的增加而维持。这表明闭环的非线性分数阶多地面机器人系统如预期的一样在状态反馈控制器下保证输出严格无源性的同时实现一致性。

基于相同的发明构思，本发明的实施例还提供：一种智能体的控制器，所述智能体为智能体集群中的智能体，所述控制器包括存储器和处理器，所述存储器存储程序，所述处理器运行所述程序以执行前述的方法。

基于相同的发明构思，本发明的实施例还提供：一种智能体，包括前述控制器。

基于相同的发明构思，本发明的实施例还提供：一种程序产品，所述程序产品在处理器上运行时执行前述的方法。

本发明中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

本发明的保护范围不限于上述的实施例，显然，本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围，则本发明的意图也包含这些改动和变形在内。

Claims

1.一种智能体集群的控制方法，其特征在于，包括：对于智能体集群中的任一个智能体，按照如下公式确定控制输入，并根据计算得到的控制输入调控自身状态：

；

其中，

；

其中，H、M和满足：

；

其中，智能体r的动力学模型如下：

；

2.根据权利要求1所述的方法，其特征在于，对于智能体r，其状态误差定义为：

；

为智能体q的状态。

3.根据权利要求1所述的方法，其特征在于，所述智能体集群的通信拓扑表示为连通的无向图。

4.根据权利要求3所述的方法，其特征在于，

；

其中，B为智能体集群的无向边集合。

5.根据权利要求1所述的方法，其特征在于，、/>和/>满足：

；

其中，，为各智能体的外部输入构成的矩阵，下标为智能体编号；

其中，，为各个智能体的输出方程构成的矩阵，下标为智能体编号，任一个智能体r的输出方程为/>；

其中，S(t)为正半定的能量存储函数。

6.一种智能体的控制器，其特征在于，所述智能体为智能体集群中的智能体，所述控制器包括存储器和处理器，所述存储器存储程序，所述处理器运行所述程序以执行根据权利要求1至5中任一项所述的方法。

7.一种智能体，其特征在于，包括根据权利要求6所述的控制器。

8.一种程序产品，其特征在于，所述程序产品在处理器上运行时执行根据权利要求1至5中任一项所述的方法。