CN114815856A - 非完整多智能体系统时变编队包含控制方法、装置和设备 - Google Patents
非完整多智能体系统时变编队包含控制方法、装置和设备 Download PDFInfo
- Publication number
- CN114815856A CN114815856A CN202210736026.7A CN202210736026A CN114815856A CN 114815856 A CN114815856 A CN 114815856A CN 202210736026 A CN202210736026 A CN 202210736026A CN 114815856 A CN114815856 A CN 114815856A
- Authority
- CN
- China
- Prior art keywords
- formation
- leader
- incomplete
- agent
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 222
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000003795 chemical substances by application Substances 0.000 claims description 187
- 239000011159 matrix material Substances 0.000 claims description 94
- 238000004891 communication Methods 0.000 claims description 48
- 230000014509 gene expression Effects 0.000 claims description 26
- 230000003993 interaction Effects 0.000 claims description 19
- 230000002452 interceptive effect Effects 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000003491 array Methods 0.000 claims 1
- 238000005755 formation reaction Methods 0.000 description 163
- 238000002474 experimental method Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 231100001261 hazardous Toxicity 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0287—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
- G05D1/0291—Fleet control
- G05D1/0295—Fleet control by at least one leading vehicle of the fleet
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及多智能体编队控制技术领域的一种非完整多智能体系统的时变编队包含控制方法、装置和设备。所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。
Description
技术领域
本申请涉及多智能体编队控制技术领域,特别是涉及一种非完整多智能体系统时变编队包含控制方法、装置和设备。
背景技术
近年来,多智能体系统的协同控制取得了快速进展,其中包含控制和编队控制是最基本和最复杂的问题。编队包含(FC)问题的目的是设计适当的协议,使领导者形成所需的几何结构(即所需的队形),并且跟随者的状态同时收敛到领导者跨越的凸包。FC控制为编队控制和包含控制提供了统一的框架,在无人机群系统编队控制、多卫星编队控制、多机器人协同等多个领域具有潜在应用。尽管已经对编队控制和包含控制问题进行了很多研究,但具有期望轨迹约束的非完整多智能体系统的FC控制问题仍然是开放和具有挑战性的。尽管非完整智能体的编队控制或包含控制已经取得了一些研究成果,但对非完整智能体的FC控制的研究仍然较少。
现有研究中在二阶多智能体系统的FC控制问题方面已经取得了一些成果。然而,这些FC的研究,也存在一些缺陷。一个缺点是整个系统的宏观运动无法得到有效控制,因为没有对期望轨迹的约束,这对于实践中的许多系统来说非常重要。例如,在一组移动机器人跨危险区域的协同运输应用中,除了完成给定的FC控制外,整个多机器人系统还应该跟踪期望的轨迹,使所有机器人都能避开危险区域并到达安全到达目的地。因此,出现了具有期望轨迹约束的 FC 控制。另一个缺点是大多数现有的研究工作都不是针对非完整智能体系统的。然而,现实中的许多实体,例如移动机器人和无人机,都受到非完整动力学的影响。另外需要提醒的是,上述作品中需要预先指定所需编队中各配置点的轨迹,与实际情况不符。
发明内容
基于此,有必要针对上述技术问题,提供一种非完整多智能体系统时变编队包含控制方法、装置和设备。
一种非完整多智能体系统时变编队包含控制方法,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述方法包括:
构建非完整多智能体系统中各非完整智能体的动力学方程;
根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
所述领导者获取期望轨迹。
设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者。
根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系。
根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
一种非完整多智能体系统时变编队包含控制装置,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个跟随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述装置包括:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程。
非完整多智能体系统的通信拓扑图确定模块,用于根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
获取期望轨迹和确定编队模板模块,用于所述领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者。
具有期望轨迹约束的编队包含控制协议构建模块,用于根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
具有期望轨迹约束的编队包含控制实现模块,用于根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
上述非完整多智能体系统时变编队包含控制方法、装置和设备,所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。
附图说明
图1为一个实施例中非完整多智能体系统时变编队包含控制方法的流程示意图;
图2为一个实施例中一种关于A和M=6的六边形编队模板;
图3为一个实施例中具有期望轨迹的编队包含控制问题示例;
图4为另一个实施例中实验 1~3 中所有智能体的初始分布;
图5为另一个实施例中实验1中非完整群系统的运动状态(t=0~31s);
图6为另一个实施例中实验2中非完整群系统的运动状态(t=0~44s);
图7为另一个实施例中实验3中非完整群系统的运动状态(t=0~32s);
图8为另一个实施例中编队跟踪误差与包含控制局部误差,其中(a)为编队跟踪误差,(b)为包含控制局部误差;
图9为另一个实施例中所有领导者中心与全局轨迹的误差,其中(a)为速度误差,(b)为位置错误;
图10为另一个实施例中实验1的可视化仿真结果,其中(a)为t=0.91s ,(b)为t=10.25s,(c)为t=22.93s,(d)为t=28.34s;
图11为另一个实施例中实验2的可视化仿真结果,其中,(a) 为t=2.35s, (b) 为t=15.64s,(c) 为t=30.23s,(d) 为t=41.08s;
图12为另一个实施例中实验3的可视化仿真结果,其中(a)为t=21.78s,(b)为t=31.56s;
图13为一个实施例中非完整多智能体系统时变编队包含控制装置的结构框图;
图14为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种非完整多智能体系统时变编队包含控制方法,非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;该方法包括以下步骤:
步骤100:构建非完整多智能体系统中各非完整智能体的动力学方程。
具体的,非完整多智能体系统中的非完整多智能体可以为无人机、机器人、汽车或者虚拟人类个体等。
构建每个非完整智能体的动力学模型,将非完整智能体的动力学模型线性化为二阶动力学模型,这样将非完整多智能体系统的编队包含控制问题就转化为线性时不变系统的编队包含控制问题。
步骤102:根据非完整多智能体系统中非完整智能体之间的通讯关系,构建非完整多智能体系统的通信拓扑图,并根据通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
具体的,将非完整多智能体系统中非完整智能体定义为节点,组成节点集,即节点集中的每一个节点代表一个非完整智能体;将两个非完整智能体之间的通讯关系定义为边,组成一个边集,边指节点可以从节点获取信息,被称为邻居;对边定义了一个加权邻接矩阵,表示的权重,且如果,,其它情况下。节点的邻居集可以表示为。由节点集、边集和加权邻接矩阵组成非完整多智能体系统的通信拓扑图。如果对于任意的,称为无向图,否则称为有向图。从到是一系列有序边,形式化为。如果存在一个根节点,该根节点具有到其他每个节点的路径,则图包含一棵生成树。
根据通信拓扑图,构建通信拓扑图的拉普拉斯矩阵。
步骤104:领导者获取期望轨迹。
步骤106:设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将预定编队模板的中心定位在期望轨迹,并根据预定编队模板的中心构建一个虚拟领导者。
和分别表示集群系统整个运动过程中编队模板的静态位置偏移和动态变化。特别是,意味着编队模板在蜂群的整个移动过程中不会发生变化。因此,根据预定编队模板,M个领导者的时变编队是由预定编队模板和编队参考点确定的。
对于具有期望轨迹约束的编队包含控制问题,本发明将编队模板的中心定位在期望轨迹处,即:以这种方式,创建了一个虚拟领导者,它以位置和速度沿着期望的轨迹移动。因此,虚拟领导者和编队模板决定了所有领导者最终会聚的编队。具有期望轨迹约束的编队-包含控制问题如图3所示。
步骤108:根据虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
步骤110:根据动力学方程及编队包含控制协议,构建非完整多智能体系统中编队控制以及包含控制的关系。
步骤112:根据编队控制以及包含控制的关系控制非完整多智能体系统中非完整多智能体按照期望轨迹运动和预定编队模板运动。
具体的,如果满足以下条件的完整多智能体系统,则可以说是实现了具有期望轨迹约束的编队包含系统。具体条件为:
(i) 领导智能体实现时变编队,即
(iii) 所有领导者的平均位置中心收敛到虚拟领导者的位置,即期望的轨迹。此外,所有领导者的平均速度渐近收敛到虚拟领导者的速度。
从上面3个条件我们可以得出,当非完整多智能体系统实现编队包含时,任何领导智能体的状态都会收敛到编队模板中的期望位置,即,其中。然后领导者集合形成一个给定的编队,并且每个跟随者移动到由领导者形成的凸包的位置,如图3所示。所有领导者的平均位置中心渐近收敛到虚拟领导者的位置。
上述非完整多智能体系统时变编队包含控制方法中,所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。
在其中一个实施例中,步骤100中非完整智能体的动力学方程为:
其中, i表示非完整多智能体的编号,t表示时刻,表示第i个智能体在t时刻的状态信息,表示第i个智能体在t时刻的控制输入,表示的导数,A和B分别为第i个非完整多智能体系统矩阵及输入矩阵,N为跟随者数量,M为领导者数量。
在其中一个实施例中,步骤108中具有期望轨迹约束的编队包含控制协议的表达式为:
其中,是常量矩阵,,,为第i个非完整智能体的状态,,表示领导智能体i与编队参考点之间的相对偏移向量,其中表示位置偏移,表示速度偏移,是第i个智能体和第j个智能体之间的交互权重,是虚拟领导者的速度,为虚拟领导者的状态。
具体的,拓扑通信图满足如下条件:拓扑通信图的子图有一个有向生成树;对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与他们连接的领导者的信息,而不能获得所需轨迹的信息;两个领导者之间的通信链路是双工的。对于任何给定的有界初始状态,具有期望轨迹约束的编队包含控制协议下的非完整多智能体集群系统,然后所有领导者的中心位置收敛到虚拟领域者的并且所有领导者的平均速度渐近收敛到虚拟领域者的。其推理过程为:
将 (9) 代入 (8) 得到:
由(10)式可得以下微分方程
根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,编队模板和虚拟领导者形成时变编队的表达式为:
其中,为预定编队模板,,是虚拟领导者的速度导数,,是虚拟领导者的状态,,为2阶单位矩阵,为通信拓扑图的子图的拉普拉斯矩阵,表示跟随者和领导者之间的交互关系,,为预定编队模板中第i个模板顶点的速度偏移,t为时刻,为M维所有元素都为1的列向量。
根据编队模板和虚拟领导者形成时变编队的表达式,确定常量矩阵的值;定义正定复矩阵P,并根据常量矩阵和正定复矩阵P,构建代数Riccati方程,并对代数Riccati方程进行求解,得到正定复矩阵P的值;代数Riccati方程为:
其中,、为正常数,和其中和分别为与跟随者相关的对角矩阵和与领导者相关的对角矩阵,为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、表示领导者之间的交互关系;为括号中矩阵的最大特征值,为括号中矩阵的最小特征值。
在其中一个实施例中,具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;步骤110包括:根据各非完整智能体的动力学方程及领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;根据各非完整智能体的动力学方程及跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;根据领导者子系统的动力学模型和跟随者子系统的动力学模型,构建非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
在其中一个实施例中,跟随者子系统的动力学模型的表达式为:
其中,为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、跟随者和领导者之间的交互关系;A和B分别为非完整多智能体系统矩阵及输入矩阵,是常量矩阵,是N阶单位矩阵,为领导者的状态向量,为跟随者的状态向量,N为跟随者数量,M为领导者数量。
领导者子系统的动力学模型的表达式为:
领导者的编队控制的关系为表达式(20)渐近稳定。
跟随者的包含控制的关系为:
对于领导智能体,将其时变编队跟踪误差表示为
将其相对于相邻领导智能体的编队跟踪局部误差定义为:
因此,从 (26) 和 (27) 可以得出:
在其中一个实施例中,构建的通信拓扑图的拉普拉斯矩阵为:
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个仿真验证性实施例中,考虑一个由虚拟人类个体组成的多智能体系统。每个虚拟人都被视为一个非完整智能体。根据表1中详述的不同追随者、领导者、期望轨迹和期望编队分别设计了三个实验。
表 1. 为非完整多智能体系统设计的三个实验
三个实验中所有智能体的初始分布如图4 所示,图4中带圈的1-12代表领导者,圈中的数字代表领导者的编号,例如,带圈的1表示1号领导者。
实验1 中的多智能体系统包含 53 个追随者和 8 个领导者,其中跟随者最初位于图4中的E区域,领导者最初位于图4中的G区域。所需的轨迹设置为与的一条线。所需矩形编队模板的静态位置偏移为, , , , , , ,。在实验2 中,50 个跟随者和 8 个领导者的初始位置分别在 图4中的F区域 和 G区域。期望的轨迹设置为与的一条线。所需的圆形编队模板的设置为, , , , ,, ,。在前两个实验中,被设置为八个领导者的。在实验3中的多智能体系统包含 5个跟随者和 12 个领导者,领导者初始位于图4中的H区域,采用二次曲线作为期望轨迹,即。所需不规则地编队模板的设置为(-3.8333,-4.375), (-3.8333,-1.375), (-2.8333,0.625), (-2.8333,2.625), (-0.8333,2.625), (0.1667, 2.625), (1.1667,2.625), (2.1667,1.625), (3.1667,0.625), (1.6667,-0.875), (1.6667,-2.375), (4.1667,-4.375)。不规则阵型模板按照所需的二次曲线变化,因此将设置为为十二个领导者。在实验 3 中,当实现时,12 个领导者的状态将形成不规则的编队,并随着他们沿着期望的二次曲线移动而围绕虚拟领导者旋转。
虚拟人群是一个典型的非完整多智能体群体系统。本发明以虚拟人作为智能体的实体,基于DI-Guy软件平台对人群状态进行仿真验证和3D可视化驱动。图5~7显示了实验1~3中非完整群系统的运动状态,图中(X,Y)代表智能体相对于原点的位置。领导者的编队跟踪误差和跟随者的包含局部误差如图8 所示。
所有领导者的中心位置和速度与全局轨迹之间的误差如图9所示。
3D可视化实验结果如图10-图12所示。
图5~图7表明,领导者可以在三个实验中形成给定的时变编队,并且跟随者可以同时收敛到领导者形成的凸包。图8中(a)显示了编队跟踪误差收敛,图(8)中(b)显示了包含控制局部误差收敛,表明非完整多智能体系统实现了编队-包含。从图9可以看出,在实验1至3中,所有领导者中心的位置和速度与期望轨迹的误差分别在第21秒、第 32秒和第8秒时趋于一致,表明领导者已跟踪所需的轨迹。图10至图12生动地展示了整个智能体系统如何实现编队包含并从三维角度跟踪所需轨迹。
在一个实施例中,如图13所示,提供了一种非完整多智能体系统时变编队包含控制装置,非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;包括:非完整多智能体系统模型构建模块、非完整多智能体系统的通信拓扑图确定模块、获取期望轨迹和确定编队模板模块、具有期望轨迹约束的编队包含控制协议构建模块和具有期望轨迹约束的编队包含控制实现模块,其中:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程;
非完整多智能体系统的通信拓扑图确定模块,用于根据非完整多智能体系统中非完整智能体之间的通讯关系,构建非完整多智能体系统的通信拓扑图,并根据通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
获取期望轨迹和确定编队模板模块,用于领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将预定编队模板的中心定位在期望轨迹,并根据预定编队模板的中心构建一个虚拟领导者;
具有期望轨迹约束的编队包含控制协议构建模块,用于根据虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
具有期望轨迹约束的编队包含控制实现模块,用于根据动力学方程及编队包含控制协议,构建非完整多智能体系统中编队控制以及包含控制的关系;根据编队控制以及包含控制的关系控制非完整多智能体系统中非完整多智能体按照期望轨迹运动和预定编队模板运动。
在其中一个实施例中,非完整多智能体系统模型构建模块中非完整智能体的动力学方程如式(4)所示。
在其中一个实施例中,有期望轨迹约束的编队包含控制协议构建模块中具有期望轨迹约束的编队包含控制协议的表达式如式(6)、式(7)所示。
在其中一个实施例中,有期望轨迹约束的编队包含控制协议构建模块包括:期望轨迹约束的编队包含控制协议的表达式中的常量矩阵求解模块,用于根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,编队模板和虚拟领导者形成时变编队的表达式如式(15)所示。
根据编队模板和虚拟领导者形成时变编队的表达式,确定常量矩阵的值;定义正定复矩阵P,并根据常量矩阵和正定复矩阵P,构建代数Riccati方程,并对代数Riccati方程进行求解,得到正定复矩阵P的值;代数Riccati方程如式(16)所示。
在其中一个实施例中,期望轨迹约束的编队包含控制协议的表达式中的常量矩阵求解模块中与跟随者相关的对角矩阵是通过计算得到的;其中与跟随者相关的对角矩阵,为N维所有元素都为1的列向量;与领导者相关的对角矩阵是通过计算得到的。其中与领导者相关的对角矩阵。
在其中一个实施例中,具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;具有期望轨迹约束的编队包含控制实现模块,还用于根据各非完整智能体的动力学方程及领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;根据各非完整智能体的动力学方程及跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;根据领导者子系统的动力学模型和跟随者子系统的动力学模型,构建非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
在其中一个实施例中,具有期望轨迹约束的编队包含控制实现模块中跟随者子系统的动力学模型的表达式如式(18)所示。领导者子系统的动力学模型的表达式如式(19)所示。领导者的编队控制的关系为表达式(20)渐近稳定。跟随者的包含控制的关系如式(21)所示。
在其中一个实施例中,上述任一装置中构建的通信拓扑图的拉普拉斯矩阵如式(33)所示。
关于非完整多智能体系统时变编队包含控制装置的具体限定可以参见上文中对于非完整多智能体系统时变编队包含控制方法的限定,在此不再赘述。上述非完整多智能体系统时变编队包含控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种非完整多智能体系统时变编队包含控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种非完整多智能体系统时变编队包含控制方法,其特征在于,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述方法包括:
构建非完整多智能体系统中各非完整智能体的动力学方程;
根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
所述领导者获取期望轨迹;
设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者;
根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;
根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,所述编队模板和虚拟领导者形成时变编队的表达式为:
其中,为预定编队模板,,是虚拟领导者的速度导数,,为2阶单位矩阵,为通信拓扑图的子图的拉普拉斯矩阵,表示跟随者和领导者之间的交互关系,,为预定编队模板中第i个模板顶点的速度偏移,t为时刻,为M维所有元素都为1的列向量;
6.根据权利要求1所述的方法,其特征在于,所述具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系,包括:
根据各非完整智能体的动力学方程及所述领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;
根据各非完整智能体的动力学方程及所述跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;
根据所述领导者子系统的动力学模型和所述跟随者子系统的动力学模型,构建所述非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
7.根据权利要求6所述的方法,其特征在于,所述跟随者子系统的动力学模型的表达式为:
其中,为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、跟随者和领导者之间的交互关系; A和B分别为非完整多智能体系统矩阵及输入矩阵,是常量矩阵,是N阶单位矩阵,为领导者的状态向量,为跟随者的状态向量,N为跟随者数量,M为领导者数量;
所述领导者子系统的动力学模型的表达式为:
其中,为通信拓扑图的子图的拉普拉斯矩阵,表示领导者之间的交互关系;是常量矩阵,是M阶单位矩阵,为预定编队模板,,,,表示速度偏移,是虚拟领导者的速度导数,是虚拟领导者的状态,为M维所有元素都为1的列向量;
9.一种非完整多智能体系统时变编队包含控制装置,其特征在于,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述装置包括:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程;
非完整多智能体系统的通信拓扑图确定模块,用于根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
获取期望轨迹和确定编队模板模块,用于所述领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者;
具有期望轨迹约束的编队包含控制协议构建模块,用于根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
具有期望轨迹约束的编队包含控制实现模块,用于根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736026.7A CN114815856B (zh) | 2022-06-27 | 2022-06-27 | 非完整多智能体系统时变编队包含控制方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210736026.7A CN114815856B (zh) | 2022-06-27 | 2022-06-27 | 非完整多智能体系统时变编队包含控制方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114815856A true CN114815856A (zh) | 2022-07-29 |
CN114815856B CN114815856B (zh) | 2022-09-20 |
Family
ID=82523047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210736026.7A Active CN114815856B (zh) | 2022-06-27 | 2022-06-27 | 非完整多智能体系统时变编队包含控制方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114815856B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116540736A (zh) * | 2023-06-12 | 2023-08-04 | 天津工业大学 | 基于人机交互二阶非线性多智能体系统的编队控制方法 |
CN116820100A (zh) * | 2023-06-25 | 2023-09-29 | 中国矿业大学 | 一种欺骗攻击下的无人车编队控制方法 |
CN117891259A (zh) * | 2024-03-14 | 2024-04-16 | 中国科学院数学与系统科学研究院 | 多图形构型的多智能体编队控制方法和相关产品 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170269612A1 (en) * | 2016-03-18 | 2017-09-21 | Sunlight Photonics Inc. | Flight control methods for operating close formation flight |
US20170293307A1 (en) * | 2016-04-07 | 2017-10-12 | Sunlight Photonics Inc. | Apparatus for close formation flight |
US20180074520A1 (en) * | 2016-09-13 | 2018-03-15 | Arrowonics Technologies Ltd. | Formation flight path coordination of unmanned aerial vehicles |
CN108319296A (zh) * | 2018-03-26 | 2018-07-24 | 中国人民解放军国防科技大学 | 一种融合全局信息与局部信息的编队控制方法 |
CN108646758A (zh) * | 2018-03-20 | 2018-10-12 | 南京邮电大学 | 一种多移动机器人预设性能编队控制器结构及设计方法 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN112000108A (zh) * | 2020-09-08 | 2020-11-27 | 北京航空航天大学 | 一种多智能体集群分组时变编队跟踪控制方法及系统 |
CN113485344A (zh) * | 2021-07-15 | 2021-10-08 | 北京航空航天大学 | 一种多智能体输出编队跟踪控制方法及系统 |
CN113741518A (zh) * | 2021-08-31 | 2021-12-03 | 中国人民解放军国防科技大学 | 基于领航跟随模式的固定翼无人机集群仿射编队控制方法 |
CN113900380A (zh) * | 2021-11-17 | 2022-01-07 | 北京航空航天大学 | 一种异构集群系统鲁棒输出编队跟踪控制方法及系统 |
CN114020042A (zh) * | 2021-12-14 | 2022-02-08 | 北京航空航天大学 | 一种异构无人集群编队合围跟踪控制方法及系统 |
CN114237247A (zh) * | 2021-12-17 | 2022-03-25 | 广东工业大学 | 基于预测的可变队形非完整移动机器人一致性控制方法 |
-
2022
- 2022-06-27 CN CN202210736026.7A patent/CN114815856B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170269612A1 (en) * | 2016-03-18 | 2017-09-21 | Sunlight Photonics Inc. | Flight control methods for operating close formation flight |
US20170293307A1 (en) * | 2016-04-07 | 2017-10-12 | Sunlight Photonics Inc. | Apparatus for close formation flight |
US20180074520A1 (en) * | 2016-09-13 | 2018-03-15 | Arrowonics Technologies Ltd. | Formation flight path coordination of unmanned aerial vehicles |
CN108646758A (zh) * | 2018-03-20 | 2018-10-12 | 南京邮电大学 | 一种多移动机器人预设性能编队控制器结构及设计方法 |
CN108319296A (zh) * | 2018-03-26 | 2018-07-24 | 中国人民解放军国防科技大学 | 一种融合全局信息与局部信息的编队控制方法 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN112000108A (zh) * | 2020-09-08 | 2020-11-27 | 北京航空航天大学 | 一种多智能体集群分组时变编队跟踪控制方法及系统 |
CN113485344A (zh) * | 2021-07-15 | 2021-10-08 | 北京航空航天大学 | 一种多智能体输出编队跟踪控制方法及系统 |
CN113741518A (zh) * | 2021-08-31 | 2021-12-03 | 中国人民解放军国防科技大学 | 基于领航跟随模式的固定翼无人机集群仿射编队控制方法 |
CN113900380A (zh) * | 2021-11-17 | 2022-01-07 | 北京航空航天大学 | 一种异构集群系统鲁棒输出编队跟踪控制方法及系统 |
CN114020042A (zh) * | 2021-12-14 | 2022-02-08 | 北京航空航天大学 | 一种异构无人集群编队合围跟踪控制方法及系统 |
CN114237247A (zh) * | 2021-12-17 | 2022-03-25 | 广东工业大学 | 基于预测的可变队形非完整移动机器人一致性控制方法 |
Non-Patent Citations (4)
Title |
---|
LINA RONG: "Reference model-based containment control of multi-agent systems with higher-order dynamics", 《THE INSTITUTION OF ENGINEERING AND TECHNOLOGY 2014》 * |
RUIWEN LIAO: "Finite-time formation-containment tracking for second-order multi-agent systems with a virtual leader of fully unknown input", 《NEUROCOMPUTING》 * |
XIWANG DONG: "Theory and Experiment on Formation-Containment Control of Multiple Multirotor Unmanned Aerial Vehicle Systems", 《[J] IEEE TRANSACTIONS ON AUTOMATION SCIENCE AND ENGINEERING》 * |
李猛: "障碍环境下具有多领导者的组行为生成方法", 《国防科技大学学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116540736A (zh) * | 2023-06-12 | 2023-08-04 | 天津工业大学 | 基于人机交互二阶非线性多智能体系统的编队控制方法 |
CN116540736B (zh) * | 2023-06-12 | 2024-02-23 | 天津工业大学 | 基于人机交互二阶非线性多智能体系统的编队控制方法 |
CN116820100A (zh) * | 2023-06-25 | 2023-09-29 | 中国矿业大学 | 一种欺骗攻击下的无人车编队控制方法 |
CN116820100B (zh) * | 2023-06-25 | 2024-02-27 | 中国矿业大学 | 一种欺骗攻击下的无人车编队控制方法 |
CN117891259A (zh) * | 2024-03-14 | 2024-04-16 | 中国科学院数学与系统科学研究院 | 多图形构型的多智能体编队控制方法和相关产品 |
CN117891259B (zh) * | 2024-03-14 | 2024-05-14 | 中国科学院数学与系统科学研究院 | 多图形构型的多智能体编队控制方法和相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN114815856B (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114815856B (zh) | 非完整多智能体系统时变编队包含控制方法、装置和设备 | |
CN108919835B (zh) | 无人飞行器编队的控制方法、装置及控制器 | |
Cortés et al. | Coordinated control of multi-robot systems: A survey | |
Alonso-Mora et al. | Collision avoidance for aerial vehicles in multi-agent scenarios | |
CN114661069B (zh) | 一种群体智能系统的编队控制方法 | |
CN104698854B (zh) | 网络Euler‑Lagrange系统分布式模糊协同跟踪控制方法 | |
Ebel et al. | A comparative look at two formation control approaches based on optimization and algebraic graph theory | |
Yu et al. | Practical formation‐containment tracking for multiple autonomous surface vessels system | |
Song et al. | Unmanned aerial vehicle coverage path planning algorithm based on cellular automata | |
Zaidi et al. | Distributed observer-based leader following consensus tracking protocol for a swarm of drones | |
Solana et al. | Multi-robot path planning with maintenance of generalized connectivity | |
CN114610072A (zh) | 一种无人机集群系统分布式时变编队跟踪控制方法及系统 | |
Al Hilli et al. | Optimal path finding in stochastic quasi-dynamic environments using particle swarm optimization | |
Conde et al. | Time-varying formation controllers for unmanned aerial vehicles using deep reinforcement learning | |
Su et al. | A robust adaptive formation control methodology for networked multi-UAV systems with applications to cooperative payload transportation | |
CN109491381B (zh) | 基于观测器的多移动机器人自适应编队跟踪控制方法 | |
Guo et al. | Collision-free formation tracking control for multiple quadrotors under switching directed topologies: Theory and experiment | |
Li et al. | A warm-started trajectory planner for fixed-wing unmanned aerial vehicle formation | |
Bhatt et al. | Efficient constrained multi-agent trajectory optimization using dynamic potential games | |
Bhowmick et al. | A two‐loop group formation tracking control scheme for networked tri‐rotor UAVs using an ARE‐based approach | |
Ghommam et al. | Distance‐Based Formation Control for Quadrotors with Collision Avoidance via Lyapunov Barrier Functions | |
Su et al. | Properties of interconnected negative imaginary systems and extension to formation‐containment control of networked multi‐UAV systems with experimental validation results | |
Nishikawa et al. | Coordination control design of heterogeneous swarm robots by means of task-oriented optimization | |
Song et al. | Compositionality of linearly solvable optimal control in networked multi-agent systems | |
Li et al. | Finite-time robust formation control of multiple aerial robotic vehicles with uncertainties and time-varying complex perturbations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |