CN112363392B

CN112363392B - 一类模型未知的多智能体分群一致性控制方法

Info

Publication number: CN112363392B
Application number: CN202011121840.5A
Authority: CN
Inventors: 唐文妍; 莫海红; 吴佳; 李坤; 郭宇豪; 孟江南
Original assignee: Xiangtan University
Current assignee: Xiangtan University
Priority date: 2020-11-16
Filing date: 2020-11-16
Publication date: 2022-05-24
Anticipated expiration: 2040-11-16
Also published as: CN112363392A

Abstract

本发明公开了一类模型未知的多智能体分群一致性控制方法，包括以下步骤：采用基于径向基函数神经网络的自适应算法对未知项进行在线辨识，在此基础上引入事件触发的通信策略，通过智能体节点本身的信息、参考模型信息及其邻居智能体节点的信息，设计分布式控制器，使多智能体达到分群一致性。本发明实现了对一类模型未知的多智能体系统的在线辨识、分布式的事件触发通信策略、分群一致性控制，从而解决了多智能体模型未知、连续通信耗能大，运行时长短的问题。

Description

一类模型未知的多智能体分群一致性控制方法

技术领域

本发明涉及多智能体控制技术领域，特别是涉及对一类模型未知的多智能体分群一致性控制方法。

背景技术

近年来，由于多智能体系统在无人飞行器、智能电网和智能交通控制系统等领域的广泛应用，多智能体系统的协调控制引起了广泛的研究。在多智能体系统的协同控制问题中，达到预定的一致性是智能体进行协调合作的前提条件，因此一致性问题是协调控制研究的重要基础。多智能体的一致性控制在编队控制、群集控制、聚集蜂拥等控制领域都有着广泛的应用。

首先，给出智能体的定义，智能体是具有有限的传感、通信、计算、学习能力的设备或机器。而多智能体系统是由多个智能体组成的网络，各个智能体之间通过网络的拓扑规则来进行通信，从而共同协作来解决复杂化的任务。

随着研究的深入，多智能体系统的拓扑网络结构呈现越来越复杂的态势，以往系统内单一的一致性难以解决一些实际中的复杂问题。系统可能会出现多种不同的子任务需要系统的各部分协调来完成，最终会分群呈现多个不同的一致状态。群一致性是指系统中的所有个体可以被划分为若干个子群，每个子群的个体可以达到一致状态，而不同的子群的个体不一定达到一致状态即保持着各自独立的状态，这种子群体之间的差异性更具有普适性。当不同的子群中的个体都达到相同的状态时，分群一致性就削弱为完全一致性了，因此一致性可以看成是分群一致性中的一种特殊情况。

分群一致性相比于一致性更具普遍意义，但是其控制方法也更加复杂。同时，现有的大多数一致性研究成果都是假设对模型信息完全已知条件下所取得的。事实上，现实世界中的物体总存在未知的非线性特性。因此，研究模型未知的多智能体系统的分群一致性具有实际意义。

同时，由于多智能体系统通常含有数十上百个智能体，采用连续通讯方式，对能量的消耗大，造成资源的浪费。因此考虑引入事件触发机制，能够降低智能体间的通信频率，降低系统能耗，提高系统运行时长。

发明内容

本发明的目的在于提供一类模型未知的多智能体分群一致性控制方法，以解决上述背景技术中提出的问题。

为了实现上述目的，本发明采用如下的技术方案：

一类模型未知的多智能体分群一致性控制方法，包括以下步骤：

S1、明确研究问题动力学模型；

S2：针对动力学模型中的未知项，采用基于RBF人工神经网络的自适应算法来对其进行在线辨识，以满足系统实时性、快速性的要求；

S3：基于事件触发机制设计智能体间的通信策略，达到节省能耗，提高运行时长的目的；

S4：结合S2、S3，利用智能体节点本身的信息以及其邻居智能体节点的信息，在李雅普诺夫稳定性定理下，设计分布式控制器，确保具有未知模型的多智能体达到分群一致性；

S5：将上述未知模型辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。

与现有技术相比，本发明的技术亮点是：对模型未知系统设计了在线辨识算法，满足系统的实时性；同时，考虑到连续通信的不足，设计了事件触发通信方式，减少了通信能耗，提高设备运行时长；此外针对更加复杂化的问题，设了分布式控制方法，实现分群一致性。

附图说明

图1为本实施例中多智能体通信拓扑图。

图2为本实施例中多智能体在本文所提出方法下的状态响应图。

图3为本实施例中多智能体在事件触发通信方式下的事件触发时刻图。

具体实施方式

为使本发明的目的、技术方案和优点能够更加清晰、易懂，下面结合附图及实施案例对本发明进一步详细描述。

一类模型未知的多智能体分群一致性控制方法，包括：

S1、明确研究问题动力学模型；

此一类模型未知的多智能体动力学模型含有N个智能体，第i个智能体动力学模型为：

其中，x_i(t)∈Rⁿ,u_i(t)∈Rⁿ，f_i(x_i(t))∈Rⁿ分别表示智能体的状态、控制输入和未知非线性函数。

并在此定义参考模型：

其中N_i表示智能体i的邻居集合。

进一步定义跟踪误差：

e_i(t)＝x_i(t)-z_i(t),i＝1,…,N (2)

在S1中，智能体的通信网络如附图1所示。

对于有向强连通度有如下定义：

其中：

本发明中使用新型拉普拉斯矩阵

其中

此外，

S2：针对(1)中未知项f_i(x_i(t))，采用基于RBF人工神经网络的自适应算法来对其进行在线辨识，以满足系统实时性、快速性的要求。

理想情况下f_i(x_i(t))＝W_i ^*TG(x_i(t))+ε_i(x_i(t))，W_i ^*表示最优RBF人工神经网络的最优权值矩阵，G(·)表示RBF人工神经网络激活函数，ε_i表示RBF人工神经网络逼近误差。

最优权值矩阵可根据下式得到：

优选地，G(·)为高斯函数。

式(3)一般用于定性分析，实际中使用

对未知函数的逼近。

进一步优选地，结合自适应算法给出权值矩阵更新率：

其中，δ_i＞0为设计的控制参数。

首先定义第i个智能体的通信状态测量误差：

通信的事件触发控制策略如下：

其中：E_i(t)为第i个智能体的事件触发函数，其设计为

其中β₁，β₂，γ为需要设计的控制参数，

exp表示自然对数的底数。

进一步，定义一个M矩阵，

便于系统稳定性分析。

S4：综合上面所述方法，智能体i的控制器设计为：

权值更新如上式(5)所示，且设计各控制参数满足下式：

其中，

在本实施例中，优选地，x_i(t)∈R²,u_i(t)∈R²，f_i(x_i(t))∈R²。

本实施例中多智能体通信拓扑对应的新型拉普拉斯如下：

系统分为三个子群，其中，{1,2}组成一个子群、{3}组成一个子群、{4,5}组成一个子群，

系统的初始值在(0,1)随机生成，x(0)＝z(0)。

优选地，系统的控制参数设计如下：

β₁＝10^-5,β₂＝0.1,γ＝2，k_i＝20,δ_i＝2，i＝1,…,N，其余相应参数可由已知信息计算得出。

如图2可以看出各智能体的状态按设定分群趋于一致，即该算法可以实现对模型未知的多智能系统分群一致性控制。如图3可以看出各智能体各自的事件触发时刻和次数，即实现了分布式事件触发控制，降低了系统能耗，提高了系统运行时长。

以上实施例仅是本发明的优选实施方案，应当指出，对于本领域的技术人员来说，在不脱离本发明构思的前提下，还可以作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。

Claims

1.一类模型未知的多智能体分群一致性控制方法，其特征在于：包括：

S1：明确研究问题动力学模型；

其中，x_i(t)∈Rⁿ,u_i(t)∈Rⁿ，f_i(x_i(t))∈Rⁿ分别表示智能体的状态、控制输入和未知非线性函数；

S2：针对动力学模型中的未知项f_i(x_i(t))，采用基于RBF人工神经网络的自适应算法来对其进行在线辨识，以满足系统实时性、快速性的要求；

未知函数的逼近使用：

给出权值矩阵更新率：

其中，G(x_i(t))为高斯函数，e_i(t)＝x_i(t)-z_i(t)为跟踪误差，δ_i＞0为设计的控制参数；

进一步对跟踪误差中的参考模型z_i(t)进行说明：

其中N_i表示智能体i的邻居集合，此外对于一个紧集内的初值满足：

S3：基于事件触发机制设计智能体间的通信策略；

首先定义第i个智能体的通信状态测量误差：

通信的事件触发控制策略如下：

其中：E_i(t)为第i个智能体的事件触发函数，其设计为

其中β₁，β₂，γ为需要设计的控制参数，变量

exp表示自然对数的底数；

设计智能体i的控制器设计为：

且各设计控制参数满足下式：

其中α(L)为有向强连通度，

Ξ＝diag(ξ₁,…,ξ_N)为N×N的对角矩阵，|| ||表示矩阵的二范数；

S5：将上述未知模型的辨识策略、事件触发策略、控制算法通过编程灌入各个多智能体中。

2.根据权利要求1所述的一类模型未知的多智能体分群一致性控制方法，其特征在于：智能体的通信网络为有向强连通拓扑。