CN114637278A - 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 - Google Patents
一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 Download PDFInfo
- Publication number
- CN114637278A CN114637278A CN202210222671.7A CN202210222671A CN114637278A CN 114637278 A CN114637278 A CN 114637278A CN 202210222671 A CN202210222671 A CN 202210222671A CN 114637278 A CN114637278 A CN 114637278A
- Authority
- CN
- China
- Prior art keywords
- fault
- formation
- agent
- leader
- tolerant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 26
- 239000003795 chemical substances by application Substances 0.000 claims description 78
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 11
- 238000011160 research Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 240000006829 Ficus sundaica Species 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明涉及一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法,将故障模型加入到追随者的动态模型当中,基于智能体之间的相邻误差构造容错时变编队追踪控制协议;获得多智能体完成编队追踪所需的可行性条件;设计容错时变编队追踪的多智能体模型,并且给出自适应更新公式中所需的参数;构建智能体的控制模型,实现在多个领导者与切换拓扑下的容错时变编队追踪控制。
Description
技术领域
本发明涉及多智能体系统协同控制技术领域,具体涉及一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法。
背景技术
近年来,多智能体系统的协同控制因其在各个领域都拥有极其重要的应用从而得到了迅速发展,并引起了各个领域的关注。例如:微型卫星、车辆编队控制、飞行器编队控制、复杂网络同步、水下机器人,等方面都有极其重要的应用。协同控制可分为编队控制、一致性控制、合围控制和编队包围控制等几个分支。一致性控制是在设计的控制协议下,使得所有智能体的达到一致的状态。在过去的几十年中,机器人控制领域有三种典型的控制方法,分别是基于行为方法、领导-追随法和虚拟结构方法。
如今很多的多智能体编队研究都没有考虑执行器故障,然而随着多智能体规模的扩大后,智能体中执行器发生故障的概率也会提升,当执行器发生故障以后,会影响任务的继续执行,从而导致任务失败。
发明内容
本发明的目的是提供一种解决具有多个领导者的高阶线性多智能体系统的时变容错编队追踪控制问题,其中领导者的控制输入是未知且时变的。
本发明采用如下技术方案:
一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法,其包括如下步骤:
(1)根据智能体空间分布确定领导者与追随者;
(2)根据外部切换拓扑期间得到的故障信息,确定故障类型,将故障模型加入到追随者的动态模型当中;
(3)构造领导者与追随者之间的拓扑交互结构;
(4)基于智能体之间的相邻误差构造容错时变编队追踪控制协议;
(5)获得多智能体完成编队追踪所需的可行性条件;
(6)基于多智能体中领导与追随者模型,集合X拓扑关系,编队可行性条件,设计容错时变编队追踪的多智能体模型,并且给出自适应更新公式中所需的参数;
(7)构建智能体的控制模型,实现在多个领导者与切换拓扑下的容错时变编队追踪控制。
进一步的,步骤(1)中,所有知情追随者都是消息灵通的追随者,追随者之间的信息交互渠道是无方向的,对于每一个消息不灵通的追随者而言,至少存在一个消息灵通的追随者与它连接。
进一步的,步骤(2)中,故障类型分为四种情况:
情况1:当ρid(t)=1且ubid(t)=0系统不存在故障;
情况2:当0<ρid(t)<1且ubid(t)=0时只存在失效故障;
情况3:当ρid(t)=1且ubid(t)≠0时系统只存在偏置故障;
情况4:当0<ρid(t)<1且ubid(t)≠0时系统既存在失效故障也存在偏置故障。
进一步的,步骤(4)中,所述容错时变编队追踪控制协议为:
进一步的,其中容错控制协议的局部编队追踪误差ξi(t)i∈F通过下列公式计算:
其中,协调变量θi(t)是基于期望时变编队hi(t)来定义的,定义编队的协调变量为θi(t)=xi(t)-hi(t)i∈F;
进一步的,步骤(7)中,带有执行器故障的追随者动力学模型:
本发明的有益效果在于:
1、当多智能体系统中一个或者多个智能体发生执行器故障以后,不仅可以完成所期望的时变编队,同时还可以跟踪领导者预期的轨迹,其中领导者存在未知时变控制输入使得研究变得更为复杂,并且相比较与无领导者或者单个领导者而言,本发明研究了存在多个领导者的情况更为复杂,且鲁棒性更强,单个领导者的研究结果不能直接应用到多个领导者。
2、编队是时变的,每个多智能体都是高阶的,相比较与时不变编队而言,时变编队的研究更为实用并且研究更为复杂。
3、本发明的拓扑是切换的,相比较与固定拓扑的研究本发明研究的切换拓扑应用更加广泛且鲁棒性更强,因为障碍物阻塞或通信设备链路故障时,多智能体系统的交互拓扑可能发生切换。并且固定拓扑的处理方法不能直接适用于切换拓扑,具有切换拓扑的多智能体系统的研究相较于固定拓扑而言更加复杂并且更加具有挑战性。
本发明考虑了编队控制方法,给出了一种分布式编队控制协议用来补偿偏置故障与未知效率故障,给出了时变编队的可行性方法。对于大规模多智能体控制,由于通信的限
附图说明
图1为本发明的方法的流程示意图。
图2为计算例中,多智能体通信拓扑图集合X包含的G1生成树编队拓扑结构。
图3为为计算例中,多智能体通信拓扑图集合X包含的G2生成树编队拓扑结构。
图4为拓扑切换信号时序示意图。
图5为追随者的误差。
具体实施方式
用G={V,E,W}表示拥有M结点的加权有向图,用V={v1,v2,....,vM}来表示结点集合,为边集合,W=[wij]∈RM×M表示具有非负权重的wij的邻接矩阵。G每条边用eij=(vi,vj)来表示,vi是vj的邻居。权重wij>0当且仅当eji∈E时,且wii=0(i=1,2,.....,M)。Ni={vj∈V:eji∈E}表示所有邻居集。表示vi的入度。用D=diag{degin(vi),i=1,2,......,M}来表示图G的入度矩阵。图G的Laplacian矩阵被表示为L=D-W。
本发明由N追随者与M-N领导者,共拥有M智能体。用F=[1,2,.........,N]与E=[N+1,N+2,.........,M]分别表示追随者与领导者的集合。
(一)根据智能体空间分布确定领导者与追随者
领导者与追随者由如下描述定义,如果一个多智能体没有邻居那它被称为领导者,反之如果多智能体至少有一个邻居那么它被称为追随者。如果追随者的邻居集包含一个领导者称它为知情领导者,如果包含所有的领导者则称它为消息灵通的追随者,反之如果其邻居集不包括领导者称它为不知情追随者。
假设本发明的所有知情追随者都是消息灵通的追随者,追随者之间的信息交互渠道是无方向的,对于每一个消息不灵通的追随者而言,至少存在一个消息灵通的追随者与它连接。
(二)根据外部切换拓扑期间得到的故障信息,确定故障类型,将故障模型加入到追随者的动态模型当中
为了解决容错时变编队问题,建设执行器故障模型,对于追随者i(i∈F),执行器故障模型被定义如下:
其中,代表执行器的输出,ui∈Rm代表执行器的输入,ubi(t)∈Rm代表执行器的偏置故障,ρi(t)=diag[ρi1(t),ρi2(t),.....,ρim(t)]且0<ρid(t)≤1代表执行器通道d(d=1,2,.....,m)未知效率故障。本发明同时考虑了偏置故障与失效故障。
执行器发生故障分为下面四种情况。
情况1:当ρid(t)=1且ubid(t)=0系统不存在故障。
情况2:当0<ρid(t)<1且ubid(t)=0时只存在失效故障。
情况3:当ρid(t)=1且ubid(t)≠0时系统只存在偏置故障。
情况4:当0<ρid(t)<1且ubid(t)≠0时系统既存在失效故障也存在偏置故障。
追随者系统模型:
其中,用xi(t)∈Rn来代表追随者i的状态向量,ui(t)∈Rm代表追随者i的控制输入,ubi(t)∈Rm代表追随者i的偏置故障,ρi(t)表示追随者i的未知失效故障,A∈Rn×n与B∈Rn×m是已知的常数矩阵。
未知失效故障ρi(t)与偏置故障ubi(t)都是有界的,存在一个未知的正常数ρ id使得0<ρ id≤ρid(t)≤1,i=1,2,......,N,d=1,2,......,m,存在一个正常数mi,使得||ubi||≤mi
领导者系统模型:
其中,xk(t)∈Rn代表领导者k的状态向量,rk(t)∈Rm代表领导者k的控制输入,是未知且时变的。A∈Rn×n与B∈Rn×m是已知的常数矩阵。
(三)构造领导者与追随者之间的拓扑交互结构
本发明多智能体系统之间的信息交互使用图论描述任意通信链拓扑图Gσ(t)满足以下假设:图Gσ(t)追随者之间的信息交互是无向的,图Gσ(t)是以多个根结点为领导者,其余结点为追随者。
(四)基于智能体之间的相邻误差构造容错时变编队追踪控制协议
容错时变编队追踪控制协议:
(五)获得多智能体完成编队追踪所需的可行性条件
(六)基于多智能体中领导与追随者模型,集合X拓扑关系,编队可行性条件,设计容错时变编队追踪的多智能体模型,并且给出自适应更新公式中所需的参数
上述容错控制协议的局部编队追踪误差ξi(t)i∈F通过下列公式计算:
当ξi(t)=0说明系统完成了编队追踪。其中,协调变量θi(t)是基于期望时变编队hi(t)来定义的,定义编队的协调变量为θi(t)=xi(t)-hi(t)i∈F。
公式(8)可以改写成公式(9)
代表编队参考函数,当完成编队追踪时所有的追随者都需要注意编队参考函数同时保持时变偏移量hi(t),要想使得xi(t)-hi(t)达成一致,hi(t)与将不可避免的引入系统从而影响分析与设计,这就使得编队追踪问题变得更加复杂。
(七)构建智能体的控制模型,实现在多个领导者与切换拓扑下的容错时变编队追踪控制
多智能体直接的通信拓扑可以进行切换。集合X表示多智能体可能形成的拓扑集合,拓扑索引O∈N代表自然数集合,δ(t):[0,∞)→O为拓扑切换时刻t的通信拓扑切换信号,其取值代表了多智能体系统在t时刻所对应通信拓扑在集合X中的编号。例如,δ(t1)=1,δ(t2)=2。G1为t1时刻后期望智能体切换到的第一生成树编队拓扑,G2为t2时刻后期望智能体切换到的第二生成树编队拓扑。
集合X至少包括第一生成树编队拓扑与一个第二生成树编队拓扑,这两个拓扑拥有共同的领导者。在t时刻,多智能体系统收到拓扑切换信号δ(t),拓扑切换信号δ(t)使得多智能体系统中的智能体群从第一生成树编队拓扑向第二生成树编队拓扑图Gδ(t)进行切换,t为拓扑切换时刻,领导-追随(Leader-follower)的拓扑结构,t时刻的拓扑切换用拉普拉斯矩阵Lδ(t)描述。
L1δ(t)∈RN×N表示追随者与追随者之间的信息交互的拉普拉斯矩阵,
L2δ(t)∈RN×(M-N)表示追随者与领导者之间信息交互的拉普拉斯矩阵。
如果满足本发明对于领导者和追随者的定义与假设,那么对于每一个追随者,至少存在一个具有指向它的有向路径的领导者。因此,对于Lδ(t)有以下引理。
把容错协议(公式(4))代入到追随者动力学模型(公式(2))中可得
对追随者的局部误差(公式(8))求导可得
计算例
为了证明所设计容错控制协议的有效性,本发明利用MATLAB建立多智能体系统,多智能体系统由八个智能体组成,分为两个领导者与六个追随者,根据公式(1)与公式(2)构造每个多智能体的动力学模型xi(t)=[xi1(t),xi2(t),xi3(t)]T,其中xi1(t),xi2(t),xi3(t)智能体分别表示X轴Y轴Z轴的状态。六个追随者的控制输入用ui(t)=[ui1(t),ui2(t)]T,两个领导者的控制输入
r7=[0.1sin(t)+0.1,0.1sin(t+1)-0.1]T,r8=[0.2sin(t)+0.2,0.2sin(t+1)-0.2]T。
追随者的执行器故障参数分别设置为:
ρ1(t)=diag{1,1},ub1(t)=[-0.2sin(t),-0.2cos(t)],ub2(t)=[0,0],ρ2(t)=diag{1,1},
ub3(t)=[0,0],ρ3(t)=diag{0.8-0.2sin(t),0.5+0.2cos(t)},
ub4(t)=[0,0],ρ4(t)=diag{1,1},ρ5(t)=diag{0.5+0.2e-0.2t,0.5+0.1cos(t)},
ub5(t)=[-0.2-0.2e-0.1t,0.2cos(t)],ρ6(t)=diag{1,1},ub6(t)=[0,0]。
追随者智能体的期望状态分别为:
常数矩阵A,B分别为,
多智能体通信拓扑图集合X包含G1、G2两种生成树编队拓扑结构分别对应图2和图3。每个智能体之间的连接权重为0或1,0表示不连接,1表示连接,图4表示切换拓扑信号,切换的周期定为10s。图5表示追随者的误差可以看出最后追随者的误差趋近于0。根据编队的可行性条件可以求得补偿输入vi(t)。
通过线性不等式求得的正定矩阵P为。
本发明研究的是执行器故障下的编队追踪控制,同时考虑了执行器的偏置故障与未知失效故障使得多智能体系统在追随者执行器出现故障的情况下依然可以形成预期的编队同时跟踪领导者。
本发明考虑的是拥有多个领导者的多智能体系统相比较与单个领导者而言多个领导者具有更强的鲁邦性,并且研究更为复杂。例如,以无人车为例,如果跟踪目标是一辆给定的无人车,该无人车的故障将导致整个编队的崩溃。但是,在有多个领导者的情况下,如果某些领导者无人车出现故障,剩余领导者无人车可以视为新的跟踪目标,任务可以继续。
本发明的多智能体系统是时变的多智能体是高阶的,相比较与时不变系统,时变系统的鲁邦性更强且研究更为复杂,在容错编队追踪控制协议设计的过程中,存在编队信息极其衍生信息,因此研究时变编队具有更强的挑战性。
本发明考虑的拓扑结构是切换的,相比较与固定拓扑,切换拓扑的鲁邦性更强。因为障碍物阻塞或通信设备链路故障时,多智能体系统的交互拓扑可能发生切换。
本发明采用的方法是领导-追随法,相比较与编队控制方法,领导-追随法可以对中心进行更好的控制。
本领域技术人员应该理解,以上实施例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (9)
1.一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法,其特征在于,其包括如下步骤:
(1)根据智能体空间分布确定领导者与追随者;
(2)根据外部切换拓扑期间得到的故障信息,确定故障类型,将故障模型加入到追随者的动态模型当中;
(3)构造领导者与追随者之间的拓扑交互结构;
(4)基于智能体之间的相邻误差构造容错时变编队追踪控制协议;
(5)获得多智能体完成编队追踪所需的可行性条件;
(6)基于多智能体中领导与追随者模型,集合X拓扑关系,编队可行性条件,设计容错时变编队追踪的多智能体模型,并且给出自适应更新公式中所需的参数;
(7)构建智能体的控制模型,实现在多个领导者与切换拓扑下的容错时变编队追踪控制。
2.根据权利要求1所述的一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法,其特征在于,步骤(1)中,所有知情追随者都是消息灵通的追随者,追随者之间的信息交互渠道是无方向的,对于每一个消息不灵通的追随者而言,至少存在一个消息灵通的追随者与它连接。
3.根据权利要求1所述的一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法,其特征在于,步骤(2)中,故障类型分为四种情况:
情况1:当ρid(t)=1且ubid(t)=0系统不存在故障;
情况2:当0<ρid(t)<1且ubid(t)=0时只存在失效故障;
情况3:当ρid(t)=1且ubid(t)≠0时系统只存在偏置故障;
情况4:当0<ρid(t)<1且ubid(t)≠0时系统既存在失效故障也存在偏置故障。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222671.7A CN114637278A (zh) | 2022-03-09 | 2022-03-09 | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222671.7A CN114637278A (zh) | 2022-03-09 | 2022-03-09 | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114637278A true CN114637278A (zh) | 2022-06-17 |
Family
ID=81948450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210222671.7A Pending CN114637278A (zh) | 2022-03-09 | 2022-03-09 | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114637278A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117762151A (zh) * | 2024-02-22 | 2024-03-26 | 北京航空航天大学 | 无需标号的智能体集群分布式形状控制方法和智能体 |
-
2022
- 2022-03-09 CN CN202210222671.7A patent/CN114637278A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117762151A (zh) * | 2024-02-22 | 2024-03-26 | 北京航空航天大学 | 无需标号的智能体集群分布式形状控制方法和智能体 |
CN117762151B (zh) * | 2024-02-22 | 2024-04-26 | 北京航空航天大学 | 无需标号的智能体集群分布式形状控制方法和智能体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xiao et al. | Observer-based adaptive consensus control for nonlinear multi-agent systems with time-delay | |
Liu et al. | Quasi-synchronization of heterogeneous networks with a generalized Markovian topology and event-triggered communication | |
CN109407520A (zh) | 基于滑模控制理论的二阶多智能体系统的容错一致性控制算法 | |
Wang et al. | Bipartite consensus for a class of nonlinear multi-agent systems under switching topologies: A disturbance observer-based approach | |
Liu et al. | Distributed fault-tolerant consensus tracking of multi-agent systems under cyber-attacks | |
CN112305918A (zh) | 超螺旋观测器下的多智能体系统滑模容错一致性控制算法 | |
Xia et al. | Optimal synchronization control of heterogeneous asymmetric input-constrained unknown nonlinear MASs via reinforcement learning | |
Zuo et al. | Fixed-time consensus for multi-agent systems under directed and switching interaction topology | |
Liu et al. | Reduced-order observer-based leader-following formation control for discrete-time linear multi-agent systems | |
CN113268083A (zh) | 基于动态事件触发的多无人机系统编队跟踪控制方法 | |
Patel et al. | Discrete-time sliding mode control for leader following discrete-time multi-agent system | |
Zhu et al. | Neural-network-based predefined-time adaptive consensus in nonlinear multi-agent systems with switching topologies | |
CN114637278A (zh) | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 | |
Xiao et al. | Adaptive fixed-time consensus for stochastic multi-agent systems with uncertain actuator faults | |
Yang et al. | Predictor‐based bipartite time‐varying formation control of nonlinear multi‐agents systems via disturbance observer | |
Guo et al. | Leader-following successive lag consensus of nonlinear multi-agent systems via observer-based event-triggered control | |
Li et al. | Distributed leader-following consensus of feedforward nonlinear delayed multiagent systems via general switched compensation control | |
CN112198796A (zh) | 一种分布式前置时间状态观测器的设计方法 | |
CN115268275B (zh) | 基于状态观测器的多智能体系统一致性跟踪方法及系统 | |
CN113741192B (zh) | 基于可切换拓扑的时滞多智能体系统约束容错控制方法 | |
Bouteraa et al. | Adaptive backstepping synchronization for networked Lagrangian systems | |
Wang et al. | Suboptimal leader-to-coordination control for nonlinear systems with switching topologies: A learning-based method | |
Tian et al. | Event-triggered-based Fault-tolerant Consensus for AUVs on Heterogeneous Switch Topology | |
He et al. | Distributed Containment Control for Second-Order Multi-Agent Systems with Input Saturation | |
Habibzadeh et al. | Fault-tolerant Consensus Control for Hybrid Multi-agent Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |