CN113359474B - 基于梯度反馈的可扩展分布式多智能体一致性控制方法 - Google Patents
基于梯度反馈的可扩展分布式多智能体一致性控制方法 Download PDFInfo
- Publication number
- CN113359474B CN113359474B CN202110762405.9A CN202110762405A CN113359474B CN 113359474 B CN113359474 B CN 113359474B CN 202110762405 A CN202110762405 A CN 202110762405A CN 113359474 B CN113359474 B CN 113359474B
- Authority
- CN
- China
- Prior art keywords
- agent
- function
- consistency
- control
- consistency control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种基于梯度反馈的可扩展分布式多智能体一致性控制方法。本发明首先确定多智能体系统集合,建立多智能体系统的通信网络拓扑图。其次确定一阶多智能体系统的动态响应模型,并基于多智能体系统的可测状态,给定多智能体一致性控制协议。然后确定系统的稳定性条件,根据期望的控制要求,选取适当的方向函数和属性函数;最后将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体间的分布式信息交互,实现满足控制性能要求的多智能体协同一致性。本发明不需进行复杂的性能设计分析和计算,只需通过给定公式,简单地设计控制参数即可满足控制性能要求,从而降低了算法的复杂程度。
Description
技术领域
本发明属于计算机科学与控制领域,涉及一种基于梯度反馈的可扩展性全分布式一阶多智能体系统一致性控制方法。
背景技术
多智能体有着广泛的应用前景,其相关研究工作成果被大量应用于智能小车、无人机、水下机器人和移动传感器等领域。其中,多智能体系统最主要的问题之一是协同一致性问题。
早期的一阶多智能体系统控制多为传统分布式一致性算法:针对多智能体一阶积分系统,分布式算法中的传统一致性控制器协议需要已知一些全局信息(这些信息对于智能体自身是未知的),如网络图拉普拉斯矩阵,接收其它智能体的通信信息(即邻居的状态信息),并通过数据融合步骤访问和计算相邻多智能体发送的通信信息,以设计控制器实现多智能体的协同一致性。
实际上,上述算法除能保证多智能体系统协同一致性以外,对于系统的其它控制性能要求均无法保证,因此在实际应用领域有时并不实用。针对以上缺点,越来越多的学者以传统分布式一阶多智能体系统一致性算法为基础,开展了能保证系统其他控制性能要求的学习和研究,但尚未有统一的分布式一致性算法框架。
发明内容
针对现有技术中存在的上述问题,本发明提出了一种基于梯度反馈的可扩展性全分布式一阶多智能体系统一致性控制方法。
本发明所采用的技术方案,包括如下步骤:
步骤1)确定多智能体系统集合,建立多智能体系统的通信网络拓扑图G,智能体之间的通讯用拉普拉斯矩阵L来描述。
步骤2)确定一阶多智能体系统的动态响应模型。
步骤3)基于多智能体系统的可测状态,给定多智能体一致性控制协议。
步骤4)确定系统的稳定性条件,主要通过Lyapunov稳定性定理证明。
步骤5)根据期望的控制要求,选取适当的方向函数s(·)和属性函数φ(·)。
步骤6)将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体间的分布式信息交互,实现满足控制性能要求的多智能体协同一致性。
本发明的有益效果:在一致性协议下提出了增益函数,方向函数和属性函数的概念,确立了一个统一的一致性算法框架,在保证协同一致性的情况下,通过替换以上三类函数,即可满足收敛性,鲁棒性或抗干扰性等控制性能要求,而不需进行复杂的性能设计分析和计算,只需通过给定公式,简单地设计控制参数即可满足控制性能要求,从而降低了算法的复杂程度,提高了算法的灵活性。
附图说明
图1为本发明流程图。
具体实施方式
为了方便问题的描述,这里假设期望的控制性能为控制系统的收敛速度,对应包括有限时间一致性控制与固定时间一致性控制。
针对于有限/固定时间一致性控制问题,这里给出两个定理:
定理1:假设存在一个Lyapunov函数,满足以下关系,
依据上述定理与假设,结合图1说明本实施例的步骤:
步骤1)确定多智能体系统集合x={x1,…,xn},n表示智能体个数。
多智能体的通讯拓扑可以被描述为一个无向连通图G(V,E),其中V={v1,...,vn}和E分别表示智能体和智能体间的通信连接。对于无向图而言,边∈i,j∈E表示智能体i和智能体j之间可以互相传递信息,Ni={j|∈i,j∈E,j≠i}表示第i个智能体的通讯邻居集合。一般地,用邻接矩阵A=[aij]∈Rn×n,度矩阵D∈Rn×n和拉普拉斯矩阵L∈Rn×n描述通讯连接关系。其中,当∈i,j∈E时aij>0,否则aij=0;D=diag{d1,d2,...,dn},拉普拉斯矩阵L=D-A;
步骤2)确定一阶多智能体系统的动态响应模型:
其中xi(t)∈Rm表示第i个智能体的状态,ui(t)∈Rm表示第i个智能体在t时刻的控制输入;令x(t)=[x1(t),...,xn(t)]T,x0=x(0)表示初始状态;为了方便叙述,取m=1,本实施例所有的结论都可以推广到m>1的情况;
步骤3)基于多智能体系统的可测状态,给定多智能体一致性控制协议
步骤3.1)定义第i个智能体在t时刻的可测量协同状态表示为:
取q(t)=[q1(t),...,qn(t)]T,即有q(t)=Lx(t);
步骤3.2)给定多智能体一致性协议:
首先构造多智能体系统网络一致性控制的代价函数:
则基于梯度信息,提出一种基于梯度信息qi(t)的分布式可扩展的一致性控制协议:
ui(t)=-γi(t)s(qi(t))φ(|qi(t)|)
其中γi(t)>0表示第i个智能体的增益函数,φ(·)>0表示智能体i的属性函数,可以根据控制性能要求合理设计,s(·)表示智能体i的方向函数,表征系统的控制方向,满足:
这里给定一些可行的方向函数:
1)符号函数:s(z)=sign(z)。
2)双曲正切函数:s(z)=tanh(z)。
步骤4)确定系统的稳定性条件,主要通过Lyapunov稳定性定理证明。
显然,该控制框架能够保证多智能体系统的稳定要求。
需要指出的是Lyapunov稳定性定理主要指李雅普诺夫第二方法,又称李雅普诺夫直接法。其可用于任意阶的系统,运用这一方法可以不必求解系统状态方程而直接判定稳定性。主要是通过构造正定的Lyapunov函数并证明其导数的负定性来说明。
步骤5)根据期望的控制要求,选取适当的方向函数s(·)和属性函数φ(·);
步骤5.1)需要注意的是,本实施例关注的控制性能是控制系统的收敛速度,不妨取γi(t)=θi>0,θi表示正常数,定义属性函数φ(·)满足如下属性:
1)φ(|z|)>0。
2)ψ(|z|)=|z|s(|z|)φ(|z|)单调递增且为凸函数。
步骤5.2)根据控制性能要求及选取的方向函数s(·)选取适当的属性函数φ(·),可根据定理1,2得到如下表1的结论:
步骤5.3)设置属性函数φ(·)中的控制参数α,β,p和q,检验计算的收敛时间T是否符合控制性能要求;
步骤6)将设计的多智能体一致性协议通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体间的分布式信息交互,实现满足控制性能要求的多智能体协同一致性。
综上,本发明与传统一致性控制方法相比,有如下优势:1)从梯度反馈的角度提出了一种完整的统一的控制算法框架,该控制框架由增益函数,方向函数和属性函数三部分组成,通过适当设计以上三类函数可以同时实现所要求的收敛性,鲁棒性及抗干扰性;2)该控制框架具有很好的可扩展性与灵活性,对于不同控制性能的设计和分析,无需重新设计相应控制算法。3)更加具体的,这里考虑了控制算法的收敛性问题,基于所提出的控制框架,给出了多种具体的兼容的有限/固定时间一致性控制策略。
Claims (3)
1.基于梯度反馈的可扩展分布式多智能体一致性控制方法,其特征在于该方法包括以下步骤:
步骤1)确定多智能体系统集合,建立多智能体系统的通信网络拓扑图,智能体之间的通讯用拉普拉斯矩阵来描述;
步骤2)确定一阶多智能体系统的动态响应模型;
步骤3)基于多智能体系统的可测状态,给定多智能体一致性控制协议,所述的多智能体一致性控制协议基于梯度信息构建,包含有智能体的增益函数、属性函数和方向函数;
步骤4)确定系统的稳定性条件,通过Lyapunov函数稳定性定理证明;
步骤5)根据期望的控制要求,选取适当的方向函数和属性函数;
步骤6)将设计的分布式多智能体一致性控制协议通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体间的分布式信息交互,实现满足控制性能要求的多智能体协同一致性;
所述的梯度信息为多智能体系统网络一致性控制的代价函数的梯度信息;
所述的多智能体一致性控制协议表示为:
ui(t)=-γi(t)s(qi(t))φ(|qi(t)|)
其中xi(t)表示第i个智能体的状态,γi(t)表示第i个智能体的增益函数,φ(·)表示第i个智能体的属性函数,s(·)表示第i个智能体的方向函数,qi(t)表示第i个智能体在t时刻的可测量协同状态。
2.根据权利要求1所述的基于梯度反馈的可扩展分布式多智能体一致性控制方法,其特征在于:所述的方向函数为符号函数、双曲正切函数、线性饱和函数或边界层函数。
3.根据权利要求1所述的基于梯度反馈的可扩展分布式多智能体一致性控制方法,其特征在于:所述的Lyapunov函数稳定性定理是指李雅普诺夫第二方法,即李雅普诺夫直接法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110762405.9A CN113359474B (zh) | 2021-07-06 | 2021-07-06 | 基于梯度反馈的可扩展分布式多智能体一致性控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110762405.9A CN113359474B (zh) | 2021-07-06 | 2021-07-06 | 基于梯度反馈的可扩展分布式多智能体一致性控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113359474A CN113359474A (zh) | 2021-09-07 |
CN113359474B true CN113359474B (zh) | 2022-09-16 |
Family
ID=77538379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110762405.9A Active CN113359474B (zh) | 2021-07-06 | 2021-07-06 | 基于梯度反馈的可扩展分布式多智能体一致性控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113359474B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114114904B (zh) * | 2021-10-22 | 2024-04-12 | 杭州电子科技大学 | 一种有限时间和固定时间分布式事件触发一致性方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109507880B (zh) * | 2018-10-17 | 2021-10-01 | 东北大学 | 一种事件驱动策略的多智能体一致性控制方法 |
CN110609467B (zh) * | 2019-06-30 | 2022-06-21 | 南京理工大学 | 基于pid的时滞多智能体系统的一致性控制方法 |
CN110442022B (zh) * | 2019-07-19 | 2022-10-11 | 中国工程物理研究院计算机应用研究所 | 带有时滞异构多智能体系统的分组一致性控制方法 |
CN110716582B (zh) * | 2019-10-16 | 2023-01-17 | 东南大学 | 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 |
CN111259327A (zh) * | 2020-01-15 | 2020-06-09 | 桂林电子科技大学 | 基于子图处理的多智能体系统一致性问题的优化方法 |
CN111948937B (zh) * | 2020-07-20 | 2021-07-06 | 电子科技大学 | 多智能体系统的多梯度递归强化学习模糊控制方法及系统 |
CN112180734B (zh) * | 2020-10-15 | 2022-06-10 | 杭州电子科技大学 | 一种基于分布式自适应事件触发的多智能体一致性方法 |
CN112596395B (zh) * | 2020-12-24 | 2022-05-24 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
-
2021
- 2021-07-06 CN CN202110762405.9A patent/CN113359474B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113359474A (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110109351B (zh) | 一种基于指定性能的多智能体一致性控制方法 | |
CN112947084B (zh) | 一种基于强化学习的模型未知多智能体一致性控制方法 | |
CN110780668B (zh) | 一种多无人艇的分布式编队合围跟踪控制方法及系统 | |
Yan et al. | Consensus formation tracking for multiple AUV systems using distributed bioinspired sliding mode control | |
CN112698634B (zh) | 基于事件触发的交通智能体系统固定时间二分一致性方法 | |
Zou et al. | Practical predefined-time output-feedback consensus tracking control for multiagent systems | |
CN107992090A (zh) | 一种应用于网络化集群智能体系统的自适应编队方法 | |
CN114527661B (zh) | 一种用于集群智能系统的协同编队方法 | |
CN110989639A (zh) | 一种基于应力矩阵的水下航行器编队控制方法 | |
CN113359474B (zh) | 基于梯度反馈的可扩展分布式多智能体一致性控制方法 | |
CN113110039A (zh) | 一种多智能体系统的有限时间分布式聚合优化方法 | |
CN112947086B (zh) | 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法 | |
CN113625559A (zh) | 一种基于指定时间收敛的多智能体系统协同控制方法 | |
Sun et al. | Distributed time-varying optimization with state-dependent gains: Algorithms and experiments | |
Yuan et al. | Adaptive neural consensus tracking control for nonlinear multiagent systems using integral barrier Lyapunov functionals | |
CN114296342B (zh) | 一种分布式动态事件触发多智能体系统的一致性控制方法 | |
Zhi et al. | Optimal leader‐follower affine formation control of linear multi‐agent systems | |
CN111439392A (zh) | 一种航天器编队位置协同控制方法 | |
Yousuf | Robust output-feedback formation control design for nonholonomic mobile robot (nmrs) | |
CN111216146B (zh) | 一种适用于网络化机器人系统的二部一致性量化控制方法 | |
CN114609915B (zh) | 一种未知控制方向的时变多智能体协同控制方法 | |
CN110554600B (zh) | 具有非线性特性的多智能体系统分布式协同控制方法 | |
Djamari et al. | Formation control of non-identical multi-agent systems | |
Yu et al. | Enhanced affine formation maneuver control using historical velocity command (HVC) | |
CN117666360B (zh) | 高阶多自主体集群系统分布式最优一致性控制方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |