CN112000108B - 一种多智能体集群分组时变编队跟踪控制方法及系统 - Google Patents

一种多智能体集群分组时变编队跟踪控制方法及系统 Download PDF

Info

Publication number
CN112000108B
CN112000108B CN202010932658.1A CN202010932658A CN112000108B CN 112000108 B CN112000108 B CN 112000108B CN 202010932658 A CN202010932658 A CN 202010932658A CN 112000108 B CN112000108 B CN 112000108B
Authority
CN
China
Prior art keywords
time
leader
varying
representing
varying formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010932658.1A
Other languages
English (en)
Other versions
CN112000108A (zh
Inventor
董希旺
卢怡舟
任章
于江龙
李清东
韩亮
吕金虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010932658.1A priority Critical patent/CN112000108B/zh
Publication of CN112000108A publication Critical patent/CN112000108A/zh
Application granted granted Critical
Publication of CN112000108B publication Critical patent/CN112000108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control
    • G05D1/0295Fleet control by at least one leading vehicle of the fleet

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种多智能体集群分组时变编队跟踪控制方法及系统,方法包括:根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差;对所述时变编队跟踪误差进行转换;基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器;基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。本发明中的上述方法及系统具有较好的自组织性与容错性,能够面对通信故障、通信能力不足的挑战应用情形。

Description

一种多智能体集群分组时变编队跟踪控制方法及系统
技术领域
本发明涉及多智能体编队控制领域,特别是涉及一种多智能体集群分组时变编队跟踪控制方法及系统。
背景技术
多智能体系统一直是一个重要的研究内容,植根于很多实际工程应用,如完成合作任务,卫星姿态同步调整,以及频谱检测等。一致性控制作为关键技术之一被广泛研究。
作为一致性协议的拓展,对于一阶和二阶的编队控制问题得到解决。但需要预知的编队移动不能满足复杂作战环境的需要。分组编队控制作为处理多个逃逸目标的方法,有研究者提出了针对二阶系统固定拓扑的分组时变编队。然而实际情形中,存在通信故障以及切换拓扑的需求,所以进一步发展出了针对切换有向拓扑和无向拓扑的控制协议。
为了控制集群系统的宏观移动,编队跟踪控制问题得到关注,即整个集群系统需要跟踪一个期望的轨迹。现有研究方法包括提供单个跟踪轨迹的控制协议,但是该控制方法需要假定跟踪轨迹是可预知的,不能满足跟踪机动未知、不配合的目标的任务要求。如若作为跟踪对象的领导者,其控制输入是不为零的,那么可以产生多种多样的轨迹以供选择。至此,有研究方法对具有未知输入的单个跟踪领导者进行处理。
通过比对现有的基于一致性的编队控制方法,可见对于多智能集群系统,分组时变编队跟踪控制,并且能够切换拓扑,跟踪参考未知的控制是有待研究的难题。当切换的拓扑是有向的,则已有的对于无向图的切换拓扑实际上是它的特例。现存研究方法对无输入的跟踪领导者进行处理,但并不能在具有多目标多机动不配合目标的作战情形下适用。而能够生成多个机动整体移动轨迹并使系统能够跟随的控制方法显然更加值得探究,并更具有实际意义。集群系统总是作为一个整体被研究,但当其处理多任务时,分组是缺乏的功能设计。已有的对单个领导者的时变编队跟随,均可以算作分组时变编队跟踪的特例。如何设计控制协议使得多智能体系统能够满足上述分析的更为复杂的应用场景,是有待突破的技术难题。
发明内容
本发明的目的是提供一种多智能体集群分组时变编队跟踪控制方法及系统,具有较好的自组织性与容错性,能够面对通信故障、通信能力不足的挑战应用情形。
为实现上述目的,本发明提供了如下方案:
一种多智能体集群分组时变编队跟踪控制方法,所述方法包括:
根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;
基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差;
对所述时变编队跟踪误差进行转换;
基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器;
基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
可选的,所述根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图具体采用以下公式:
Figure GDA0002740726890000021
其中,
Figure GDA0002740726890000022
表示跟随者动态特性状态空间模型,xi(t)∈Rn,A∈Rn×n,B∈Rn×m,且rank(B)=m,n>2,ui(t)∈Rm为第i个智能体的控制输入,N表示跟随者的个数;
Figure GDA0002740726890000031
其中,x0i(t)∈Rn,ri(t)∈Rm为第i个领导者的未知控制输入满足
Figure GDA0002740726890000032
Q表示领导者的个数;
Figure GDA0002740726890000034
其中,Lσ(t)表示有向图,
Figure GDA0002740726890000035
代表跟随者之间的影响,
Figure GDA0002740726890000036
代表领导者对跟随者的影响,
Figure GDA0002740726890000037
可选的,基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差具体采用以下公式:
Figure GDA0002740726890000038
其中,
Figure GDA0002740726890000039
为张量积运算符,
Figure GDA00027407268900000310
表示表示跟随者之间的影响,In表示阶数为n的单位矩阵,x(t)表示所有跟随者的状态变量按个体顺序排列构成的向量,
Figure GDA00027407268900000311
h(t)表示时变编队参考向量
Figure GDA00027407268900000312
x0(t)表示所有领导者的状态变量按个体顺序排列构成的向量,
Figure GDA00027407268900000313
表示领导者对跟随者的影响。
可选的,对所述时变编队跟踪误差进行转换具体采用以下公式:
Figure GDA00027407268900000314
其中,xi(t)表示单个编队领导者的状态变量,hi(t)表示单个编队领导者的时变编队向量,
Figure GDA00027407268900000315
表示单个跟踪领导者的状态变量。
可选的,基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器具体采用以下公式:
ui(t)=vi(t)+Kξi(t)-ηf(ξi(t))
其中,vi(t)的求解公式如下:
Figure GDA0002740726890000041
K的求解公式如下:
PA+ATP-PBBTP+βP<0,
Figure GDA0002740726890000042
Figure GDA0002740726890000043
其中,
Figure GDA0002740726890000044
η的求解公式如下:
η≥γ,其中,γ表示领导者的未知输入上界。
本发明另外提供一种多智能体集群分组时变编队跟踪控制系统,所述系统包括:
个体数学模型及通讯关系确定模块,用于根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;
时变编队跟踪误差确定模块,用于基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差;
转换模块,用于对所述时变编队跟踪误差进行转换;
控制器确定模块,基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器;
执行模块,用于基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
可选的,所述个体数学模型及通讯关系确定模块具体包括:
Figure GDA0002740726890000045
其中,
Figure GDA0002740726890000046
表示跟随者动态特性状态空间模型,xi(t)∈Rn,A∈Rn×n,B∈Rn×m,且rank(B)=m,n>2,ui(t)∈Rm为第i个智能体的控制输入,N表示跟随者的个数。
Figure GDA0002740726890000047
其中,x0i(t)∈Rn,ri(t)∈Rm为第i个跟踪领导者的未知控制输入满足
Figure GDA0002740726890000051
Q表示领导者的个数。
Figure GDA0002740726890000053
其中,Lσ(t)表示有向图,
Figure GDA0002740726890000054
代表跟随者之间的影响,
Figure GDA0002740726890000055
代表领导者对跟随者的影响,
Figure GDA0002740726890000056
可选的,时变编队跟踪误差确定模块具体包括:
Figure GDA0002740726890000057
其中,
Figure GDA0002740726890000058
为张量积运算符,
Figure GDA0002740726890000059
表示表示跟随者之间的影响,In表示阶数为n的单位矩阵,x(t)表示所有跟随者的状态变量按个体顺序排列构成的向量,
Figure GDA00027407268900000510
h(t)表示时变编队参考向量
Figure GDA00027407268900000511
x0(t)表示所有领导者的状态变量按个体顺序排列构成的向量,
Figure GDA00027407268900000512
表示领导者对跟随者的影响。
可选的,转换模块具体包括:
Figure GDA00027407268900000513
其中,xi(t)表示单个编队领导者的状态变量,hi(t)表示单个编队领导者的时变编队向量,
Figure GDA00027407268900000514
表示单个跟踪领导者的状态变量。
可选的,控制器确定模块具体包括:
ui(t)=vi(t)+Kξi(t)-ηf(ξi(t))
其中,vi(t)的求解公式如下:
Figure GDA00027407268900000515
K的求解公式如下:
PA+ATP-PBBTP+βP<0,
Figure GDA0002740726890000061
Figure GDA0002740726890000062
其中,
Figure GDA0002740726890000063
η的求解公式如下:
η≥γ,其中,γ表示领导者的未知输入上界。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明中的带切换拓扑的分组时变编队跟踪器,使得多智能体能够切换有向通信拓扑,同时分组完成跟踪多个不可预测的轨迹,并在每个子组形成各自期望的时变编队。主要优点如下:1)跟踪领导者具有有界未知外界输入,能够产生不可预测的运动轨迹。常见的方法仅能处理单个跟踪领导者,且往往假定其为零输入,不能有效处理需跟踪多个不配合跟踪目标的复杂作战场景。2)无论在时变编队层面、宏观移动跟踪层面,都可实现分组设计。即已有的单个宏观移动或单个编队构型完成,都是本发明法的特殊情况,本发明的灵活性更强,适用性更广。3)信息传递为有向图刻画,比无向图刻画的双向交互更加节省通信资源,其处理过程中的非对称矩阵比无向图产生的对称矩阵,挑战更大,且进一步设计了能够处理切换拓扑的控制协议,具有较好的自组织性与容错性,能够面对通信故障、通信能力不足的挑战应用情形。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例多智能体集群分组时变编队跟踪控制方法流程图;
图2为本发明实施例有向拓扑图示意图;
图3为本发明实施例在未知输入影响下的跟踪领导者不可预测的运动轨迹图;
图4(a)为本发明实施例集群系统t=0s的运动轨迹示意图;
图4(b)为本发明实施例集群系统t=20s的运动轨迹示意图;
图4(c)为本发明实施例集群系统t=40s的运动轨迹示意图;
图4(d)为本发明实施例集群系统t=60s的运动轨迹示意图;
图5为本发明实施例组别1内3个跟随者的时变编队跟踪误差收敛曲线;
图6为本发明实施例组别2内3个跟随者的时变编队跟踪误差收敛曲线;
图7为本发明实施例组别3内3个跟随者的时变编队跟踪误差收敛曲线;
图8为本发明实施例多智能体集群分组时变编队跟踪控制系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种多智能体集群分组时变编队跟踪控制方法及系统,具有较好的自组织性与容错性,能够面对通信故障、通信能力不足的挑战应用情形。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例多智能体集群分组时变编队跟踪控制方法流程图,如图1所示,所述方法包括:
步骤101:根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者。
在建立的多智能体集群系统中,包含依据任务类型分为两类的个体:领导者、跟随者。以下为其特点描述:
作为被跟踪的对象,领导者可具有未知的外部输入,能够形成不可预测的轨迹。领导者可以为一个也可以为多个,也能够存在以多个领导者共同形成的一个等效跟踪对象。跟随者跟踪领导者,同时能够形成相对于领导者的时变编队。对于一个多智能体集群系统来说,可能需要同时分散跟随多个方向运动的领导者来执行任务,因此系统还具有相应的成员分组设计,每个子组内均包含两种类型的个体,并且各自实现以小组为执行单元的时变编队跟踪控制。在编队控制过程中,通信关系可能发生变化,当对跟随者的控制允许跟随者能够切换通信拓扑,跟随者不仅可以变化与其他个体的通信关系,还可以变换自己的所属子组,以形成更适用于当前任务需求的通信拓扑关系。
对于智能体个体的动态特性,考虑一般线性系统。实际情形中,对于运动体个体的模型概括,有多种方法。实际系统多为非线性系统,但可近似看作线性系统来处理。线性系统的控制方法比较成熟,控制效果稳定,具有线性叠加性质。对于智能体个体的建模,局限为低阶模型是不够的,实际运动对象的控制量往往较多而且相互关联,所以应考虑高阶系统,更具有普遍意义价值。同时,相较于传统的传递函数模型,状态空间表示法提供一种方便简捷的方法来针对多输入、多输出的系统进行分析并建立模型。综上,为多智能体集群系统选择一般线性的动态模型,并使用状态空间法对其动态特性进行描述。
记集群系统中有N个跟随者,Q个领导者,按序排列。跟随者受到设计控制量的输入,以操控完成各自的行动任务,其动态特性状态空间描述的模型如下,为一般线性系统:
Figure GDA0002740726890000081
其中,
Figure GDA0002740726890000082
表示跟随者动态特性状态空间模型,xi(t)∈Rn,A∈Rn×n,B∈Rn×m,且rank(B)=m,n>2,ui(t)∈Rm为第i个智能体的控制输入,N表示跟随者的个数;
跟踪领导者具有未知的外界输入,能够使它的运动状态不可被编队领导者和跟随者预测,其状态空间模型如下:
Figure GDA0002740726890000083
其中,x0i(t)∈Rn,ri(t)∈Rm为第i个跟踪领导者的未知控制输入满足
Figure GDA0002740726890000084
Q表示领导者的个数;
在以上模型中,xi(t)与x0i(t)均为包含所有状态变量的向量,AB阵描述状态变量之间的关系。其中B的维度已予以限制,以保证控制输入没有冗余。
至此,对集群系统中的两种个体,均使用有效合理的方式,进行了运动动态特性的数学模型建立,以供后续的系统编队跟踪控制分析。
根据所述的集群智能体一般线性高阶状态模型,采用图论描述分组设计、切换拓扑设置。
多智能体集群系统中,个体之间存在实时交流和通信,以达到利用局部信息实现整体的时变编队跟踪。将通信线路抽象为拓扑网络,则个体对应网络图中的节点,节点间的联系对应网络图中的边。则通信关系可以用拓扑图进行概括和分析。在基于一致性的控制方法中,个体通过通信网络,能够仅利用局部的信息,就能各自获得期望的位置信息进行跟随,从而能够实现整体的编队队形,进行跟踪。进而,对集群系统个体的分组设计,实际上是通信关系的进一步设置和调整,故也能够用拓扑图进行通信关系的和分组设计的表达。个体间通信关系的取消、建立、更变,对应通信有向拓扑图的切换。以图论进行个体间通信关系及满足条件的描述,以下为实际意义与抽象拓扑表达的对应关系阐述。
多智能体集群系统中,个体对应为图中的节点。集群系统的个体被划分为多个子组,每个领导者被一个子组所跟随,故Q个领导者对应集群系统分为Q个子组。记按组划分的跟随者节点集为V1,V2,...,VQ,且同一个体必属于且仅属于一个子组,对应的数学描述为:
Figure GDA0002740726890000091
Figure GDA0002740726890000092
Figure GDA0002740726890000093
对于跟随者,接收领导者信息并传递给其它跟随者,出于节约通信资源的目的,故不存在领导者间有相互传输的通信通道存在,抽象描述即为节点集{V1,V2,...,VQ}是非循环分割,且对应的子图均有一个生成树。对每个跟随者,它受到领导者的信息的状态综合的控制,只需要与本组的领导者存在直接或者间接的通信关系即可,对应于图论描述即为,至少存在一条组内领导者通向它的有向路径。
通过以上个体对应到节点,通信关系对应为边和路径的数学对应描述,进一步采用代数图论描述智能体之间的作用拓扑关系。定义Gσ(t)为集群系统作用拓扑所对应的有向图,将跟随者记为前N个节点,领导者记为后Q个节点,它们组成图Gσ(t)中的全部节点。记wij为节点i到节点j的影响作用强度。则对应的拉普拉斯矩阵为L∈R(N+Q)×(N+Q)带切换拓扑标记且写为分块形式:
Figure GDA0002740726890000101
其中
Figure GDA0002740726890000102
代表跟随者之间的影响,与协作形成时变编队有关。
Figure GDA0002740726890000103
代表领导者对跟随者的影响,与分组领导者轨迹进行集群以组为单位的跟踪移动有关。
对第i个智能体记其所属子组为第
Figure GDA0002740726890000106
个子组。可整理为特殊形式:
Figure GDA0002740726890000104
Figure GDA0002740726890000105
非对角线上的块矩阵,基于使信息分组传达传递有效,信息不发生混杂的目的,行和需要满足等于0。
下面描述对拓扑切换的标记设置:
记长度一致有界、互不重叠的无限时间序列为[tk,tk+1)(k∈N)且t1=0,0<τ0≤tk+1-tk。N代表一系列自然数。通讯拓扑在时间间隔内保持不变,在切换时刻tk(k∈N)处变化。设拓扑切换标记为σ(t):[0,+∞]→{1,2,...,p},它的值为切换时刻的索引数字。
至此,为对多智能体集群系统中个体相互通信关系抽象为拓扑网络的描述并基于图论给出个体间数学形式的通信关系和分组设计的表达,以及对通信关系的变化,形成有向拓扑图切换的数学描述。
步骤102:基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差。
基于步骤101中的用状态空间描述的个体模型与动态状态,当个体与个体状态量的差值可以被设计和控制到特定的值,反映到个体外部表现与整体行为即为系统能遵循期望的设定。控制的基本原理是利用负反馈使被控系统达到期望的状态。
跟随者是对领导者进行轨迹的跟踪,同时还能达成期望的相对于领导者的时变编队。则同组的跟随者对于其领导者,当状态变量的动态差值恰为期望的时变编队量,则可见跟随者在跟踪领导者的基础上,还实现了时变编队控制。至此,如下首先给出时变编队参考的描述,其为依据希望达成队形反映到跟随者状态变量的部分期望值。再给出编队跟踪误差的定义。
对于第
Figure GDA0002740726890000111
个子组,记其内跟随者的数量为
Figure GDA0002740726890000112
赋值
Figure GDA0002740726890000113
为0。定义跟随者的期望参考编队为
Figure GDA0002740726890000114
其中hi(t)∈Rn(i∈{1,2,...,N})为分段连续可微。
根据负反馈控制,当期望输出与实际输出差值为零,则系统跟上了期望的状态。基于前述通信通路关系,个体之间存在直接联系和间接联系,基于一致性的控制理论,特点是利用局部信息,最终可以达成整体的编队控制效果。故想要完成使跟随者达成时变编队跟踪的目的,利用个体可以获得的局部信息作差,并结合以wij描述的相互通信连通关系与作用影响强度,进行组合,定义本地编队跟踪误差如下:
记所有跟随者状态集合为
Figure GDA0002740726890000115
记所有领导者状态集合为
Figure GDA0002740726890000116
则跟随者的编队跟踪误差定义为:
Figure GDA0002740726890000117
其中
Figure GDA0002740726890000118
为克罗内克积。
Figure GDA0002740726890000119
且ξi(t)代表第i(i=1,2,...,N)个跟随者的编队跟踪误差。公式(4)中第一部分包含个体的状态变量对描述期望时变编队的向量作差,第二部分为各组领导者对组内跟随者的影响,以状态变量的形式直接加入。这里均利用的本地误差信息及邻居能提供的误差信息,但通过前述拓扑关系的设计,当本地编队误差趋零时,可以实现分组编队跟踪控制。
至此,给出基于局部通信获得的本地信息,所构造的本地编队跟踪误差,以在后续步骤中用来达成系统控制。
步骤103:对所述时变编队跟踪误差进行转换。
对步骤102中的式(4)进行变形,因
Figure GDA00027407268900001110
存在逆矩阵
Figure GDA00027407268900001111
两边同时乘以
Figure GDA00027407268900001112
可得
Figure GDA0002740726890000121
当表示编队误差集合的ξ(t)有
Figure GDA0002740726890000122
成立,即对应每个ξi(t)都有
Figure GDA0002740726890000123
i(i=1,2,...,N)成立,则对应(5)中等式左端有如下形式成立
Figure GDA0002740726890000124
其中
Figure GDA0002740726890000125
为第i个跟随者对应的第
Figure GDA0002740726890000126
个子组所跟踪的领导者的状态变量向量形式表达。可见个体i的状态变量跟随上了该个体期望的时变编队与需要跟踪的领导者的状态变量之和。
则称跟随者均实现了期望的分组时变编队跟踪。根据公式(2)可知其具有未知的外界输入,能产生不可预测的机动轨迹。设定的依据是,当公式(6)趋零时可以分析得到,子组内对应的每个跟随者,都跟踪上了期望时变编队状态变量以及对应组内领导者的状态变量之和,外部表现即为在跟踪领导者状态的基础上,实现了期望的子组时变编队。当通信拓扑的切换满足均大于一个最小驻留时间,则在变化个体间通信联系,即切换通信拓扑后,个体仍能达成对此上两个状态量hi(t)、x0i(t)之和的跟踪。此时称系统是能够切换拓扑的。若能达成上述描述,则称对多智能体集群系统实现了期望的带切换拓扑和领导者未知输入的分组时变编队跟踪控制。
至此,给出了对于系统达成带切换拓扑,领导者具有未知输入的分组时变编队跟踪控制的状态空间形式表达的定义。
步骤104:基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器。
根据步骤101中的用状态空间描述的系统个体动态特性(1),其中ui(t)为控制输入,利用步骤102中的个体可以获得的局部状态变量信息,对ui(t)进行设计,以达到步骤103中所述的系统控制。构造第i(i=1,2,...,N)个跟随者的控制输入如下
ui(t)=vi(t)+Kξi(t)-ηf(ξi(t)) (7)
其中,vi(t)∈Rm是由编队参考决定的时变编队补偿输入,与hi(t)有关。K为待设计的增益矩阵。η为正常数。f(·)为待设计的非线性函数,用来处理跟踪领导者的未知输入的影响。其中对本地通信得来的局部信息的利用由本地编队跟踪误差ξi(t)体现。下面给出待定参数的求取步骤,以获得完整的、可使用的控制协议。
首先,源于系统个体的动态特性结构以系统矩阵A、B描述,对于期望的时变编队hi(t),应先检查系统的中个体的实际运动能力能否实现该运动。即检查编队是否可行:寻找是否存在
Figure GDA0002740726890000131
使得
Figure GDA0002740726890000132
成立,若存在,则继续。否则,该期望编队不可行,需要重新给定编队参考向量h(t)。当(8)式不能成立时,意味着
Figure GDA0002740726890000133
无法找到对应的vi(t)利用该系统的性能予以实现,所以此时应该重新规划hi(t),再继续参数的求取与控制协议的获得。
其次,对于给定β>0,解如下黎卡提代数不等式得到正定矩阵P
PA+ATP-PBBTP+βP<0 (9)
随后,因为存在实对角矩阵Δσ(t),Dσ(t)满足
Figure GDA0002740726890000134
λmax代表最大特征值,λmin代表最小特征值。则选择
Figure GDA0002740726890000135
取值η≥γ。
然后,定义非线性函数为
Figure GDA0002740726890000136
最终,计算两次切换拓扑间所需满足的最小驻留时间间隔τ0,选择τ0满足τ0>2lnμ/β。其中β为结算公式(8)时给定,
Figure GDA0002740726890000137
Figure GDA0002740726890000138
至此,将得到的控制参数及设计的非线性函数代入公式(7),即得到完整的、可使用的系统控制协议。将控制协议(7)加入个体动态模型(1),以在此协议的作用下,系统能够实现允许通信拓扑切换的分组时变编队跟踪控制。
将整个设计实现过程总结描述如下:
Step1:针对多智能体集群系统,使用状态空间法对个体进行动态特性描述和模型建立。
Step2:明确个体的通信关系、分组设计,通信关系能够变化的要求,变换抽象为数学表达:节点网络,节点间的联系与划分,有向拓扑图的切换。并以图论进行描述和分析。
Step3:将期望的跟随者的时变编队,以对应于个体动态模型变量的向量形式h(t)描述给出。利用局部网络的邻居信息,计算本地编队跟踪误差(4)。
Step4:分析系统个体任务,定义系统达成分组时变编队跟踪的标志,若能再实现切换通信拓扑后系统仍收敛,即能够达成整个一般线性多智能体集群系统带切换拓扑的分组时变编队跟踪控制。
Step5:利用本地误差信息(4),给出控制协议的形式(7),并判断编队是否可行,及用给出算法计算待定的控制参数。
Step6:将设计的控制协议(7),作为系统个体动态模型(1)的输入,且领导者的动态模型(2)具有未知输入,将产生不能预测的机动轨迹。在控制协议的作用下,多组的领导者将产生多条未能预判的轨迹,而各组组内的跟随者,能够跟踪这些轨迹,同时实现期望的时变编队。并且两次切换拓扑的时间间隔满足大于最小驻留时间,个体间的通信关系可以实现重新构造,子组的成员和数目也能重新安排,即系统能够实现通信拓扑的切换。
至此,以上给出了一种带切换拓扑的分组时变编队跟踪的系统设计以及控制方法。
步骤105:基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
实施例
以下通过一个具体的多智能体集群系统分组时变编队合围跟踪控制的实例来验证本发明所提出方法的有效性。本实例的具体实施步骤如下:
(1)多智能体集群系统设置
考虑一个三阶多智能体系统,分为3个子组,共有13个智能体。其切换的作用拓扑如图2所示。跟随者的节点集划分为V1={1,2,3},V2={4,5,6}和V3={7,8,9,10}。模型参数设置为:
Figure GDA0002740726890000151
(2)期望的时变编队设计
刻画期望的旋转圆形编队构型,设计编队参考向量如下
Figure GDA0002740726890000152
Figure GDA0002740726890000153
可以检验时变编队可行性条件满足。
(3)编队跟踪控制器参数设计
选择跟踪领导者的未知输入为
Figure GDA0002740726890000154
故对应取值η=19。图3展示了在未知输入影响下的跟踪领导者不可预测的运动轨迹,组1领导者初始位置表示为十字形,结束位置表示为菱形;组2领导者初始位置表示为圆圈,结束位置表示为五角星;组3领导者初始位置表示为方块,结束位置表示为六角星。
选择β=0.235,从而解得
Figure GDA0002740726890000155
取值K=[46.2,123.9,98.5],μ=4。因此,可以将最小时间间隔取值为τ0=12s。
(4)结果分析
应用上述的理论成果,通信拓扑可以任意切换。在仿真中,通信拓扑在t=25s时由G1切换为G2。从时间t=0s到t=60s,集群系统每二十秒的运动轨迹截图如图4所示。综合图4的运动轨迹变化以及图5的数值变化可以看出,即使中途有切换拓扑,组别2的成员数目由3变为4,组别3的成员数目由4变为3,原因是9号跟随者(圆形标记)在有向通信拓扑图切换后,所属关系由第3组变化为属于第2组。在25s为满足大于最小时间间隔τ0=12的情况下,无论是t=25s前的由G1代表的个体间通信关系,还是t=25s后由G2代表的通信联系,均能实现各组对应的期望的旋转圆周位置均匀分布的时变编队,且同时跟踪上各组领导者的不可预测的运动轨迹。图5,图6,图7表示每一子组的编队跟踪误差趋零。至此,多智能体集群系统在切换通信拓扑情况下,仍然实现了期望的分组时变编队跟踪控制,本实例验证了所提出方法的有效性。
根据本发明提供的具体实施例,本发明公开了一下技术成果:本发明设计的带切换拓扑的分组时变编队跟踪器,使得多智能体能够切换有向通信拓扑,同时分组完成跟踪多个不可预测的轨迹,并在每个子组形成各自期望的时变编队。主要优点如下:1)跟踪领导者具有有界未知外界输入,能够产生不可预测的运动轨迹。常见的方法仅能处理单个跟踪领导者,且往往假定其为零输入,不能有效处理需跟踪多个不配合跟踪目标的复杂作战场景。2)无论在时变编队层面、宏观移动跟踪层面,都可实现分组设计。即已有的单个宏观移动或单个编队构型完成,都是本方法的特殊情况,本方法的灵活性更强,适用性更广。3)信息传递为有向图刻画,比无向图刻画的双向交互更加节省通信资源,其处理过程中的非对称矩阵比无向图产生的对称矩阵,挑战更大。且进一步设计了能够处理切换拓扑的控制协议,具有较好的自组织性与容错性,能够面对通信故障、通信能力不足的挑战应用情形。
图8为本发明实施例多智能体集群分组时变编队跟踪控制系统结构示意图,如图8所示,所述系统包括:
个体数学模型及通讯关系确定模块201,用于根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;
时变编队跟踪误差确定模块202,用于基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差;
转换模块203,用于对所述时变编队跟踪误差进行转换;
控制器确定模块204,基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器;
执行模块205,用于基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种多智能体集群分组时变编队跟踪控制方法,其特征在于,所述方法包括:
根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;
基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差,具体采用以下公式:
Figure FDA0003214802550000011
其中,
Figure FDA0003214802550000012
为张量积运算符,
Figure FDA0003214802550000013
表示表示跟随者之间的影响,In表示阶数为n的单位矩阵,x(t)表示所有跟随者的状态变量按个体顺序排列构成的向量,
Figure FDA0003214802550000014
h(t)表示时变编队参考向量
Figure FDA0003214802550000015
x0(t)表示所有领导者的状态变量按个体顺序排列构成的向量,
Figure FDA0003214802550000016
表示领导者对跟随者的影响;
对所述时变编队跟踪误差进行转换,具体采用以下公式:
Figure FDA0003214802550000017
其中,xi(t)表示单个编队领导者的状态变量,hi(t)表示单个编队领导者的时变编队向量,
Figure FDA0003214802550000018
表示单个跟踪领导者的状态变量;
基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器,具体采用以下公式:
ui(t)=vi(t)+Kξi(t)-ηf(ξi(t))
其中:f(·)为待设计的非线性函数;
其中,vi(t)的求解公式如下:
Figure FDA0003214802550000019
K的求解公式如下:
PA+ATP-PBBTP+βP<0,
Figure FDA00032148025500000110
Figure FDA00032148025500000111
其中,vi(t)为由编队参考决定的时变编队补偿输入,P为正定矩阵,
Figure FDA0003214802550000021
Lσ(t)表示有向图;
η的求解公式如下:
η≥γ,其中,γ表示领导者的未知输入上界;
基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
2.根据权利要求1所述的多智能体集群分组时变编队跟踪控制方法,其特征在于,所述根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图具体采用以下公式:
Figure FDA0003214802550000022
其中,
Figure FDA0003214802550000023
表示跟随者动态特性状态空间模型,xi(t)∈Rn,ui(t)∈Rm为第i个智能体的控制输入,N表示跟随者的个数;
Figure FDA0003214802550000024
其中,
Figure FDA0003214802550000025
表示跟随领导者的状态空间模型;x0i(t)∈Rn,ri(t)∈Rm为第i个领导者的未知控制输入满足
Figure FDA0003214802550000026
Q表示领导者的个数;
Figure FDA0003214802550000027
其中,
Figure FDA0003214802550000028
代表跟随者之间的影响,
Figure FDA0003214802550000029
代表领导者对跟随者的影响,
Figure FDA00032148025500000210
3.一种多智能体集群分组时变编队跟踪控制系统,其特征在于,所述系统包括:
个体数学模型及通讯关系确定模块,用于根据多智能体集群系统个体动态特性及通信关系,得出描述运动特性的状态空间形式的个体数学模型及描述通信关系的有向拓扑图;所述多智能体集群系统包括:领导者和跟随者;
时变编队跟踪误差确定模块,用于基于所述个体数学模型及通信关系,确定期望时变编队的向量,得到时变编队跟踪误差;
时变编队跟踪误差确定模块具体包括:
Figure FDA0003214802550000031
其中,
Figure FDA0003214802550000032
为张量积运算符,
Figure FDA0003214802550000033
表示表示跟随者之间的影响,In表示阶数为n的单位矩阵,x(t)表示所有跟随者的状态变量按个体顺序排列构成的向量,
Figure FDA0003214802550000034
h(t)表示时变编队参考向量
Figure FDA0003214802550000035
x0(t)表示所有领导者的状态变量按个体顺序排列构成的向量,
Figure FDA0003214802550000036
表示领导者对跟随者的影响;
转换模块,用于对所述时变编队跟踪误差进行转换;
转换模块具体包括:
Figure FDA0003214802550000037
其中,xi(t)表示单个编队领导者的状态变量,hi(t)表示单个编队领导者的时变编队向量,
Figure FDA0003214802550000038
表示单个跟踪领导者的状态变量;
控制器确定模块,基于转换后的时变编队跟踪误差确定带拓扑切换的分组时变编队跟踪的控制器;
控制器确定模块具体包括:
ui(t)=vi(t)+Kξi(t)-ηf(ξi(t))
其中:f(·)为待设计的非线性函数;
其中,vi(t)的求解公式如下:
Figure FDA0003214802550000039
其中,A∈Rn×n,B∈Rn×m,且rank(B)=m,n>2;
K的求解公式如下:
PA+ATP-PBBTP+βP<0,
Figure FDA00032148025500000310
Figure FDA00032148025500000311
其中,vi(t)为由编队参考决定的时变编队补偿输入,P为正定矩阵,
Figure FDA00032148025500000312
Lσ(t)表示有向图;
η的求解公式如下:
η≥γ,其中,γ表示领导者的未知输入上界;
执行模块,用于基于所述带拓扑切换的分组时变编队跟踪的控制器对系统实现分组编队跟踪控制。
4.根据权利要求3所述的多智能体集群分组时变编队跟踪控制系统,其特征在于,所述个体数学模型及通讯关系确定模块具体包括:
Figure FDA0003214802550000041
其中,
Figure FDA0003214802550000042
表示跟随者动态特性状态空间模型,xi(t)∈Rn,ui(t)∈Rm为第i个智能体的控制输入,N表示跟随者的个数;
Figure FDA0003214802550000043
其中,
Figure FDA0003214802550000044
表示跟随领导者的状态空间模型;x0i(t)∈Rn,ri(t)∈Rm为第i个跟踪领导者的未知控制输入满足
Figure FDA0003214802550000045
Q表示领导者的个数;
Figure FDA0003214802550000046
其中,
Figure FDA0003214802550000047
代表跟随者之间的影响,
Figure FDA0003214802550000048
代表领导者对跟随者的影响,
Figure FDA0003214802550000049
CN202010932658.1A 2020-09-08 2020-09-08 一种多智能体集群分组时变编队跟踪控制方法及系统 Active CN112000108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010932658.1A CN112000108B (zh) 2020-09-08 2020-09-08 一种多智能体集群分组时变编队跟踪控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010932658.1A CN112000108B (zh) 2020-09-08 2020-09-08 一种多智能体集群分组时变编队跟踪控制方法及系统

Publications (2)

Publication Number Publication Date
CN112000108A CN112000108A (zh) 2020-11-27
CN112000108B true CN112000108B (zh) 2021-09-21

Family

ID=73469563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010932658.1A Active CN112000108B (zh) 2020-09-08 2020-09-08 一种多智能体集群分组时变编队跟踪控制方法及系统

Country Status (1)

Country Link
CN (1) CN112000108B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112947557B (zh) * 2021-02-07 2023-06-23 河北科技大学 一种切换拓扑下的多智能体容错跟踪控制方法
CN112987790B (zh) * 2021-03-04 2022-05-10 北京航空航天大学 一种分布式异构集群系统分组编队跟踪控制方法和系统
CN113311711B (zh) * 2021-05-28 2024-09-10 哈尔滨理工大学 一种异构多智能体系统在领导跟随下实现分组一致的方法
CN113268083B (zh) * 2021-06-07 2022-10-14 山东大学 基于动态事件触发的多无人机系统编队跟踪控制方法
CN113253764B (zh) * 2021-07-14 2021-10-01 北京大学 一种基于降维观测器的无人集群仿射编队控制方法
CN113485344B (zh) * 2021-07-15 2023-12-01 北京航空航天大学 一种多智能体输出编队跟踪控制方法及系统
CN113625747B (zh) * 2021-07-23 2023-11-17 北京航空航天大学 一种集群系统编队避障控制方法
CN113778619B (zh) * 2021-08-12 2024-05-14 鹏城实验室 多集群博弈的多智能体状态控制方法、装置及终端
CN113536699B (zh) * 2021-09-16 2021-12-03 中国人民解放军国防科技大学 基于图论算法的作战环推荐方法、系统、设备和存储介质
CN114326715B (zh) * 2021-12-09 2023-10-03 东南大学 一种变维多智能体系统的编队控制方法与装置
CN114020042A (zh) * 2021-12-14 2022-02-08 北京航空航天大学 一种异构无人集群编队合围跟踪控制方法及系统
CN114265315A (zh) * 2021-12-27 2022-04-01 北京航空航天大学 异构线性集群系统时变输出编队跟踪控制方法及系统
CN114967677B (zh) * 2022-04-15 2024-07-19 北京航空航天大学 一种非线性集群系统的时变编队跟踪优化控制方法及系统
CN114815856B (zh) * 2022-06-27 2022-09-20 中国人民解放军国防科技大学 非完整多智能体系统时变编队包含控制方法、装置和设备
CN115993844B (zh) * 2023-03-23 2023-05-30 西北工业大学深圳研究院 一种群体智能系统自适应事件触发时变分组编队控制方法
CN117311169A (zh) * 2023-11-28 2023-12-29 北京航空航天大学 一种非线性集群系统的仿射编队机动控制方法及系统
CN117891259B (zh) * 2024-03-14 2024-05-14 中国科学院数学与系统科学研究院 多图形构型的多智能体编队控制方法和相关产品

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6744396B2 (en) * 2001-07-20 2004-06-01 Aviation Communication & Surveillance Systems Llc Surveillance and collision avoidance system with compound symbols
CN101795221B (zh) * 2010-01-29 2013-06-19 中国科学院空间科学与应用研究中心 机群编队的组网拓扑结构和组合多址体制设计方法
CN103268102B (zh) * 2013-05-09 2015-03-04 清华大学 任务、通信和拓扑交织的无人机集群协同控制方法
CN105843256B (zh) * 2016-05-13 2019-03-08 中国航空工业集团公司西安飞机设计研究所 一种多机编队飞行控制方法
CN105871636B (zh) * 2016-05-27 2017-05-03 合肥工业大学 基于最小树形图的无人机编队通信拓扑的重构方法及系统
CN107422641B (zh) * 2017-08-25 2019-06-25 中国人民解放军火箭军研究院 复杂约束条件下的航天器编队姿态有限时间协同控制方法
CN108919835B (zh) * 2018-09-25 2021-02-02 北京航空航天大学 无人飞行器编队的控制方法、装置及控制器
CN109270934B (zh) * 2018-11-01 2020-05-12 中国科学技术大学 基于领航者切换的多机器人编队续航方法
US10768638B2 (en) * 2019-01-31 2020-09-08 StradVision, Inc. Method and device for switching driving modes to support subject vehicle to perform platoon driving without additional instructions from driver during driving
CN110597061B (zh) * 2019-09-18 2022-04-26 中国人民解放军火箭军工程大学 一种多智能体完全分布式自抗扰时变编队控制方法
CN110703795B (zh) * 2019-09-27 2020-09-15 南京航空航天大学 一种基于切换拓扑的无人机群协同安全控制方法
CN110658821B (zh) * 2019-10-10 2021-12-14 中国科学技术大学 一种多机器人抗干扰分组时变编队控制方法及系统
CN111435252B (zh) * 2020-01-15 2020-12-25 北京航空航天大学 异构多智能体系统分组输出时变编队跟踪控制方法及系统
CN111273685B (zh) * 2020-01-21 2023-06-20 沈阳航空航天大学 一种异构多无人机自主聚集、分离及合并集群方法

Also Published As

Publication number Publication date
CN112000108A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN112000108B (zh) 一种多智能体集群分组时变编队跟踪控制方法及系统
CN112034714A (zh) 一种分组时变编队合围跟踪控制方法及系统
Wang et al. Containment control for general second-order multiagent systems with switched dynamics
CN110376889B (zh) 具有时变时滞的异构网络化多智能体系统分组一致的方法
An et al. Group consensus control for networked multi-agent systems with communication delays
CN105095966A (zh) 人工神经网络和脉冲神经网络的混合计算系统
Gunasekaran et al. Finite-time synchronization of sampled-data T–S fuzzy complex dynamical networks subject to average dwell-time approach
Shao et al. Bipartite tracking consensus of generic linear agents with discrete-time dynamics over cooperation–competition networks
CN105095961A (zh) 一种人工神经网络和脉冲神经网络的混合系统
CN105095967A (zh) 一种多模态神经形态网络核
CN102726011B (zh) 虚拟网控制方法以及虚拟网控制装置
CN105095965A (zh) 人工神经网络和脉冲神经网络神经的混合通信方法
CN112327633A (zh) 具有时滞和干扰的领导跟随多智能体系统一致性的方法
Aouiti et al. Nonlinear Lipschitz measure and adaptive control for stability and synchronization in delayed inertial Cohen‐Grossberg–type neural networks
Huang et al. Synchronization analysis for static neural networks with hybrid couplings and time delays
Shi et al. Distributed optimization for economic power dispatch with event‐triggered communication
Rakkiyappan et al. Cluster synchronization for T–S fuzzy complex networks using pinning control with probabilistic time‐varying delays
Huang et al. Necessary and sufficient conditions for consensus in third order multi-agent systems
Zhang et al. Impulsive effects on bipartite quasi synchronization of extended Caputo fractional order coupled networks
Jiang et al. H∞ delayed tracking protocol design of nonlinear singular multi-agent systems under Markovian switching topology
CN113268083A (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
CN111814333A (zh) 奇异Lur’e网络聚类同步的牵制节点选择方法
CN113311711A (zh) 一种异构多智能体系统在领导跟随下实现分组一致的方法
Atrianfar Sampled-time containment control of high-order continuous-time MASs under heterogenuous time-varying delays and switching topologies: A scrambling matrix approach
Pei Group consensus of multi-agent systems with hybrid characteristics and directed topological networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant