CN113359474B

CN113359474B - 基于梯度反馈的可扩展分布式多智能体一致性控制方法

Info

Publication number: CN113359474B
Application number: CN202110762405.9A
Authority: CN
Inventors: 刘丹复; 赵振帆; 黄娜; 张帆; 孔亚广; 陈张平; 何中杰; 张尧; 郑小青; 赵晓东; 徐川子; 陈奕
Original assignee: Hangdian Haining Information Technology Research Institute Co ltd; Hangzhou Dianzi University; Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: Hangdian Haining Information Technology Research Institute Co ltd; Hangzhou Dianzi University; Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2021-07-06
Filing date: 2021-07-06
Publication date: 2022-09-16
Anticipated expiration: 2041-07-06
Also published as: CN113359474A

Abstract

本发明公开了一种基于梯度反馈的可扩展分布式多智能体一致性控制方法。本发明首先确定多智能体系统集合，建立多智能体系统的通信网络拓扑图。其次确定一阶多智能体系统的动态响应模型，并基于多智能体系统的可测状态，给定多智能体一致性控制协议。然后确定系统的稳定性条件，根据期望的控制要求，选取适当的方向函数和属性函数；最后将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体，并通过建立的通信拓扑图实现智能体间的分布式信息交互，实现满足控制性能要求的多智能体协同一致性。本发明不需进行复杂的性能设计分析和计算，只需通过给定公式，简单地设计控制参数即可满足控制性能要求，从而降低了算法的复杂程度。

Description

基于梯度反馈的可扩展分布式多智能体一致性控制方法

技术领域

本发明属于计算机科学与控制领域，涉及一种基于梯度反馈的可扩展性全分布式一阶多智能体系统一致性控制方法。

背景技术

多智能体有着广泛的应用前景，其相关研究工作成果被大量应用于智能小车、无人机、水下机器人和移动传感器等领域。其中，多智能体系统最主要的问题之一是协同一致性问题。

早期的一阶多智能体系统控制多为传统分布式一致性算法：针对多智能体一阶积分系统，分布式算法中的传统一致性控制器协议需要已知一些全局信息(这些信息对于智能体自身是未知的)，如网络图拉普拉斯矩阵，接收其它智能体的通信信息(即邻居的状态信息)，并通过数据融合步骤访问和计算相邻多智能体发送的通信信息，以设计控制器实现多智能体的协同一致性。

实际上，上述算法除能保证多智能体系统协同一致性以外，对于系统的其它控制性能要求均无法保证，因此在实际应用领域有时并不实用。针对以上缺点，越来越多的学者以传统分布式一阶多智能体系统一致性算法为基础，开展了能保证系统其他控制性能要求的学习和研究，但尚未有统一的分布式一致性算法框架。

发明内容

针对现有技术中存在的上述问题，本发明提出了一种基于梯度反馈的可扩展性全分布式一阶多智能体系统一致性控制方法。

本发明所采用的技术方案，包括如下步骤：

步骤1)确定多智能体系统集合，建立多智能体系统的通信网络拓扑图G，智能体之间的通讯用拉普拉斯矩阵L来描述。

步骤2)确定一阶多智能体系统的动态响应模型。

步骤3)基于多智能体系统的可测状态，给定多智能体一致性控制协议。

步骤4)确定系统的稳定性条件，主要通过Lyapunov稳定性定理证明。

步骤5)根据期望的控制要求，选取适当的方向函数s(·)和属性函数φ(·)。

步骤6)将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体，并通过建立的通信拓扑图实现智能体间的分布式信息交互，实现满足控制性能要求的多智能体协同一致性。

本发明的有益效果：在一致性协议下提出了增益函数，方向函数和属性函数的概念，确立了一个统一的一致性算法框架，在保证协同一致性的情况下，通过替换以上三类函数，即可满足收敛性，鲁棒性或抗干扰性等控制性能要求，而不需进行复杂的性能设计分析和计算，只需通过给定公式，简单地设计控制参数即可满足控制性能要求，从而降低了算法的复杂程度，提高了算法的灵活性。

附图说明

图1为本发明流程图。

具体实施方式

为了方便问题的描述，这里假设期望的控制性能为控制系统的收敛速度，对应包括有限时间一致性控制与固定时间一致性控制。

所述的有限时间一致性是指：假设“0”是动态系统稳定平衡点，若

x(t，x₀)＝0；T(·)：Rⁿ→R₊，则系统有限时间稳定；进一步的，如果有限调节时间T(x₀)有界，即

则系统固定时间稳定。

针对于有限/固定时间一致性控制问题，这里给出两个定理：

定理1：假设存在一个Lyapunov函数，满足以下关系，

则可实现有限时间一致性控制，相应的控制时间：

定理2：假设存在一个Lyapunov函数，满足一下关系，

则可实现固定时间一致性控制，相应的控制时间：

依据上述定理与假设，结合图1说明本实施例的步骤：

步骤1)确定多智能体系统集合x＝{x₁，…，x_n}，n表示智能体个数。

多智能体的通讯拓扑可以被描述为一个无向连通图G(V，E)，其中V＝{v₁，...，v_n}和E分别表示智能体和智能体间的通信连接。对于无向图而言，边∈_i，j∈E表示智能体i和智能体j之间可以互相传递信息，N_i＝{j|∈_i，j∈E，j≠i}表示第i个智能体的通讯邻居集合。一般地，用邻接矩阵A＝[a_ij]∈R^n×n，度矩阵D∈R^n×n和拉普拉斯矩阵L∈R^n×n描述通讯连接关系。其中，当∈_i，j∈E时a_ij＞0，否则a_ij＝0；D＝diag{d₁，d₂，...，d_n}，

拉普拉斯矩阵L＝D-A；

步骤2)确定一阶多智能体系统的动态响应模型：

其中x_i(t)∈R^m表示第i个智能体的状态，u_i(t)∈R^m表示第i个智能体在t时刻的控制输入；令x(t)＝[x1(t)，...，x_n(t)]^T，x₀＝x(0)表示初始状态；为了方便叙述，取m＝1，本实施例所有的结论都可以推广到m＞1的情况；

步骤3)基于多智能体系统的可测状态，给定多智能体一致性控制协议

步骤3.1)定义第i个智能体在t时刻的可测量协同状态表示为：

取q(t)＝[q₁(t)，...，q_n(t)]^T，即有q(t)＝Lx(t)；

步骤3.2)给定多智能体一致性协议：

首先构造多智能体系统网络一致性控制的代价函数：

对x(t)求导，可得到J(t)关于x(t)的梯度：

需要注意的是当且仅当q(t)＝0，J(t)＝0。

则基于梯度信息，提出一种基于梯度信息q_i(t)的分布式可扩展的一致性控制协议：

u_i(t)＝-γ_i(t)s(q_i(t))φ(|q_i(t)|)

其中γ_i(t)＞0表示第i个智能体的增益函数，φ(·)＞0表示智能体i的属性函数，可以根据控制性能要求合理设计，s(·)表示智能体i的方向函数，表征系统的控制方向，满足：

这里给定一些可行的方向函数：

1)符号函数：s(z)＝sign(z)。

2)双曲正切函数：s(z)＝tanh(z)。

3)线性饱和函数：

4)边界层函数：

构造合适的Lyapunov函数：

求导可得到

显然，该控制框架能够保证多智能体系统的稳定要求。

需要指出的是Lyapunov稳定性定理主要指李雅普诺夫第二方法，又称李雅普诺夫直接法。其可用于任意阶的系统，运用这一方法可以不必求解系统状态方程而直接判定稳定性。主要是通过构造正定的Lyapunov函数并证明其导数的负定性来说明。

步骤5)根据期望的控制要求，选取适当的方向函数s(·)和属性函数φ(·)；

步骤5.1)需要注意的是，本实施例关注的控制性能是控制系统的收敛速度，不妨取γ_i(t)＝θ_i＞0，θ_i表示正常数，定义属性函数φ(·)满足如下属性：

1)φ(|z|)＞0。

2)ψ(|z|)＝|z|s(|z|)φ(|z|)单调递增且为凸函数。

此时，选取

λ₂表示拉普拉斯矩阵L的次小特征值。

θ_min＝min{θ_i}

步骤5.2)根据控制性能要求及选取的方向函数s(·)选取适当的属性函数φ(·)，可根据定理1，2得到如下表1的结论：

表1：α，β＞0，p∈(0，1)，q＞1，

步骤5.3)设置属性函数φ(·)中的控制参数α,β,p和q，检验计算的收敛时间T是否符合控制性能要求；

步骤6)将设计的多智能体一致性协议通过编程写入每一个智能体，并通过建立的通信拓扑图实现智能体间的分布式信息交互，实现满足控制性能要求的多智能体协同一致性。

综上，本发明与传统一致性控制方法相比，有如下优势：1)从梯度反馈的角度提出了一种完整的统一的控制算法框架，该控制框架由增益函数，方向函数和属性函数三部分组成，通过适当设计以上三类函数可以同时实现所要求的收敛性，鲁棒性及抗干扰性；2)该控制框架具有很好的可扩展性与灵活性，对于不同控制性能的设计和分析，无需重新设计相应控制算法。3)更加具体的，这里考虑了控制算法的收敛性问题，基于所提出的控制框架，给出了多种具体的兼容的有限/固定时间一致性控制策略。

Claims

1.基于梯度反馈的可扩展分布式多智能体一致性控制方法，其特征在于该方法包括以下步骤：

步骤1)确定多智能体系统集合，建立多智能体系统的通信网络拓扑图，智能体之间的通讯用拉普拉斯矩阵来描述；

步骤2)确定一阶多智能体系统的动态响应模型；

步骤3)基于多智能体系统的可测状态，给定多智能体一致性控制协议，所述的多智能体一致性控制协议基于梯度信息构建，包含有智能体的增益函数、属性函数和方向函数；

步骤4)确定系统的稳定性条件，通过Lyapunov函数稳定性定理证明；

步骤5)根据期望的控制要求，选取适当的方向函数和属性函数；

步骤6)将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体，并通过建立的通信拓扑图实现智能体间的分布式信息交互，实现满足控制性能要求的多智能体协同一致性；

所述的梯度信息为多智能体系统网络一致性控制的代价函数的梯度信息；

所述的多智能体一致性控制协议表示为：

u_i(t)＝-γ_i(t)s(q_i(t))φ(|q_i(t)|)

其中x_i(t)表示第i个智能体的状态，γ_i(t)表示第i个智能体的增益函数，φ(·)表示第i个智能体的属性函数，s(·)表示第i个智能体的方向函数，q_i(t)表示第i个智能体在t时刻的可测量协同状态。

2.根据权利要求1所述的基于梯度反馈的可扩展分布式多智能体一致性控制方法，其特征在于：所述的方向函数为符号函数、双曲正切函数、线性饱和函数或边界层函数。

3.根据权利要求1所述的基于梯度反馈的可扩展分布式多智能体一致性控制方法，其特征在于：所述的Lyapunov函数稳定性定理是指李雅普诺夫第二方法，即李雅普诺夫直接法。