CN114815856A - 非完整多智能体系统时变编队包含控制方法、装置和设备 - Google Patents

非完整多智能体系统时变编队包含控制方法、装置和设备 Download PDF

Info

Publication number
CN114815856A
CN114815856A CN202210736026.7A CN202210736026A CN114815856A CN 114815856 A CN114815856 A CN 114815856A CN 202210736026 A CN202210736026 A CN 202210736026A CN 114815856 A CN114815856 A CN 114815856A
Authority
CN
China
Prior art keywords
formation
leader
incomplete
agent
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210736026.7A
Other languages
English (en)
Other versions
CN114815856B (zh
Inventor
谷学强
李猛
陆丽娜
张万鹏
陈少飞
刘鸿福
韦占坤
刘运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202210736026.7A priority Critical patent/CN114815856B/zh
Publication of CN114815856A publication Critical patent/CN114815856A/zh
Application granted granted Critical
Publication of CN114815856B publication Critical patent/CN114815856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control
    • G05D1/0295Fleet control by at least one leading vehicle of the fleet

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及多智能体编队控制技术领域的一种非完整多智能体系统的时变编队包含控制方法、装置和设备。所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。

Description

非完整多智能体系统时变编队包含控制方法、装置和设备
技术领域
本申请涉及多智能体编队控制技术领域,特别是涉及一种非完整多智能体系统时变编队包含控制方法、装置和设备。
背景技术
近年来,多智能体系统的协同控制取得了快速进展,其中包含控制和编队控制是最基本和最复杂的问题。编队包含(FC)问题的目的是设计适当的协议,使领导者形成所需的几何结构(即所需的队形),并且跟随者的状态同时收敛到领导者跨越的凸包。FC控制为编队控制和包含控制提供了统一的框架,在无人机群系统编队控制、多卫星编队控制、多机器人协同等多个领域具有潜在应用。尽管已经对编队控制和包含控制问题进行了很多研究,但具有期望轨迹约束的非完整多智能体系统的FC控制问题仍然是开放和具有挑战性的。尽管非完整智能体的编队控制或包含控制已经取得了一些研究成果,但对非完整智能体的FC控制的研究仍然较少。
现有研究中在二阶多智能体系统的FC控制问题方面已经取得了一些成果。然而,这些FC的研究,也存在一些缺陷。一个缺点是整个系统的宏观运动无法得到有效控制,因为没有对期望轨迹的约束,这对于实践中的许多系统来说非常重要。例如,在一组移动机器人跨危险区域的协同运输应用中,除了完成给定的FC控制外,整个多机器人系统还应该跟踪期望的轨迹,使所有机器人都能避开危险区域并到达安全到达目的地。因此,出现了具有期望轨迹约束的 FC 控制。另一个缺点是大多数现有的研究工作都不是针对非完整智能体系统的。然而,现实中的许多实体,例如移动机器人和无人机,都受到非完整动力学的影响。另外需要提醒的是,上述作品中需要预先指定所需编队中各配置点的轨迹,与实际情况不符。
发明内容
基于此,有必要针对上述技术问题,提供一种非完整多智能体系统时变编队包含控制方法、装置和设备。
一种非完整多智能体系统时变编队包含控制方法,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述方法包括:
构建非完整多智能体系统中各非完整智能体的动力学方程;
根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
所述领导者获取期望轨迹。
设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者。
根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系。
根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
一种非完整多智能体系统时变编队包含控制装置,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个跟随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述装置包括:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程。
非完整多智能体系统的通信拓扑图确定模块,用于根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
获取期望轨迹和确定编队模板模块,用于所述领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者。
具有期望轨迹约束的编队包含控制协议构建模块,用于根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
具有期望轨迹约束的编队包含控制实现模块,用于根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
上述非完整多智能体系统时变编队包含控制方法、装置和设备,所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。
附图说明
图1为一个实施例中非完整多智能体系统时变编队包含控制方法的流程示意图;
图2为一个实施例中一种关于A和M=6的六边形编队模板;
图3为一个实施例中具有期望轨迹的编队包含控制问题示例;
图4为另一个实施例中实验 1~3 中所有智能体的初始分布;
图5为另一个实施例中实验1中非完整群系统的运动状态(t=0~31s);
图6为另一个实施例中实验2中非完整群系统的运动状态(t=0~44s);
图7为另一个实施例中实验3中非完整群系统的运动状态(t=0~32s);
图8为另一个实施例中编队跟踪误差与包含控制局部误差,其中(a)为编队跟踪误差,(b)为包含控制局部误差;
图9为另一个实施例中所有领导者中心与全局轨迹的误差,其中(a)为速度误差,(b)为位置错误;
图10为另一个实施例中实验1的可视化仿真结果,其中(a)为t=0.91s ,(b)为t=10.25s,(c)为t=22.93s,(d)为t=28.34s;
图11为另一个实施例中实验2的可视化仿真结果,其中,(a) 为t=2.35s, (b) 为t=15.64s,(c) 为t=30.23s,(d) 为t=41.08s;
图12为另一个实施例中实验3的可视化仿真结果,其中(a)为t=21.78s,(b)为t=31.56s;
图13为一个实施例中非完整多智能体系统时变编队包含控制装置的结构框图;
图14为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种非完整多智能体系统时变编队包含控制方法,非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;该方法包括以下步骤:
步骤100:构建非完整多智能体系统中各非完整智能体的动力学方程。
具体的,非完整多智能体系统中的非完整多智能体可以为无人机、机器人、汽车或者虚拟人类个体等。
构建每个非完整智能体的动力学模型,将非完整智能体的动力学模型线性化为二阶动力学模型,这样将非完整多智能体系统的编队包含控制问题就转化为线性时不变系统的编队包含控制问题。
步骤102:根据非完整多智能体系统中非完整智能体之间的通讯关系,构建非完整多智能体系统的通信拓扑图,并根据通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵。
具体的,将非完整多智能体系统中非完整智能体定义为节点,组成节点集
Figure 494488DEST_PATH_IMAGE001
,即节点集中的每一个节点代表一个非完整智能体;将两个非完整智能体之间的通讯关系定义为边,组成一个边集
Figure 631202DEST_PATH_IMAGE002
,边
Figure 879781DEST_PATH_IMAGE004
指节点
Figure 9411DEST_PATH_IMAGE005
可以从节点
Figure 292625DEST_PATH_IMAGE006
获取信息,
Figure 833197DEST_PATH_IMAGE006
被称为
Figure 569071DEST_PATH_IMAGE007
邻居;对边定义了一个加权邻接矩阵
Figure 502392DEST_PATH_IMAGE008
Figure 640113DEST_PATH_IMAGE009
表示
Figure 102318DEST_PATH_IMAGE010
的权重,且如果
Figure 76221DEST_PATH_IMAGE011
Figure 282075DEST_PATH_IMAGE012
,其它情况下
Figure 539881DEST_PATH_IMAGE013
。节点
Figure 438567DEST_PATH_IMAGE006
的邻居集可以表示为
Figure 414613DEST_PATH_IMAGE014
。由节点集
Figure 407845DEST_PATH_IMAGE015
、边集
Figure 785737DEST_PATH_IMAGE016
和加权邻接矩阵
Figure 589745DEST_PATH_IMAGE017
组成非完整多智能体系统的通信拓扑图
Figure 787508DEST_PATH_IMAGE018
。如果对于任意的
Figure 820318DEST_PATH_IMAGE019
Figure 787136DEST_PATH_IMAGE020
称为无向图,否则
Figure 27625DEST_PATH_IMAGE021
称为有向图。从
Figure 447105DEST_PATH_IMAGE022
Figure 47719DEST_PATH_IMAGE023
是一系列有序边,形式化为
Figure 134624DEST_PATH_IMAGE024
。如果存在一个根节点,该根节点具有到其他每个节点的路径,则图包含一棵生成树。
根据通信拓扑图,构建通信拓扑图的拉普拉斯矩阵。
步骤104:领导者获取期望轨迹。
具体的,非完整多智能体系统的期望轨迹可以表示为
Figure 546014DEST_PATH_IMAGE025
步骤106:设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将预定编队模板的中心定位在期望轨迹,并根据预定编队模板的中心构建一个虚拟领导者。
具体的,
Figure 452790DEST_PATH_IMAGE026
个领导者的预定编队模板记为:
Figure 607828DEST_PATH_IMAGE027
其中,
Figure 299972DEST_PATH_IMAGE028
是分段连续可微的,它表示领导智能体i与编队参考点之间的相对偏移向量,
Figure 147842DEST_PATH_IMAGE029
其中表示位置偏移,
Figure 541914DEST_PATH_IMAGE030
表示速度偏移。编队参考点
Figure 235064DEST_PATH_IMAGE031
选在编队模板的中心,如图2所示。从编队模板的中心,得出:
Figure 14670DEST_PATH_IMAGE032
Figure 33441DEST_PATH_IMAGE033
Figure 180389DEST_PATH_IMAGE034
分别表示集群系统整个运动过程中编队模板的静态位置偏移和动态变化。特别是,
Figure 677229DEST_PATH_IMAGE035
意味着编队模板在蜂群的整个移动过程中不会发生变化。因此,根据预定编队模板,M个领导者的时变编队是由预定编队模板
Figure 593233DEST_PATH_IMAGE037
和编队参考点
Figure 251747DEST_PATH_IMAGE038
确定的。
对于具有期望轨迹约束的编队包含控制问题,本发明将编队模板的中心定位在期望轨迹处,即:
Figure 636723DEST_PATH_IMAGE039
以这种方式,创建了一个虚拟领导者
Figure 671675DEST_PATH_IMAGE040
,它以位置
Figure 707764DEST_PATH_IMAGE041
和速度
Figure 802759DEST_PATH_IMAGE042
沿着期望的轨迹移动。因此,虚拟领导者
Figure 658720DEST_PATH_IMAGE043
和编队模板
Figure 762942DEST_PATH_IMAGE044
决定了所有领导者最终会聚的编队。具有期望轨迹约束的编队-包含控制问题如图3所示。
步骤108:根据虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议。
具体的,根据期望轨迹、预定编队模板和智能体之间的交互设计领导智能体
Figure 371647DEST_PATH_IMAGE045
和跟随智能体
Figure 903122DEST_PATH_IMAGE046
的分布式控制律,使得非完整多智能体系统实现编队包含控制。
步骤110:根据动力学方程及编队包含控制协议,构建非完整多智能体系统中编队控制以及包含控制的关系。
步骤112:根据编队控制以及包含控制的关系控制非完整多智能体系统中非完整多智能体按照期望轨迹运动和预定编队模板运动。
具体的,如果满足以下条件的完整多智能体系统,则可以说是实现了具有期望轨迹约束的编队包含系统。具体条件为:
(i) 领导智能体实现时变编队,即
Figure 246379DEST_PATH_IMAGE047
(1)
(ii) 跟随者
Figure 154292DEST_PATH_IMAGE048
收敛到由领导者形成的凸包,即对于任何给定的有限初始状态,并且任何智能体
Figure 633815DEST_PATH_IMAGE049
存在
Figure 336192DEST_PATH_IMAGE050
满足
Figure 640179DEST_PATH_IMAGE051
的非负常数,使得:
Figure 820625DEST_PATH_IMAGE052
(2)
(iii) 所有领导者的平均位置中心收敛到虚拟领导者的位置,即期望的轨迹。此外,所有领导者的平均速度渐近收敛到虚拟领导者的速度。
Figure 420233DEST_PATH_IMAGE054
(3)
从上面3个条件我们可以得出,当非完整多智能体系统实现编队包含时,任何领导智能体
Figure 293511DEST_PATH_IMAGE055
的状态都会收敛到编队模板中的期望位置,即
Figure 345781DEST_PATH_IMAGE056
,其中
Figure 579185DEST_PATH_IMAGE057
。然后领导者
Figure 33300DEST_PATH_IMAGE058
集合形成一个给定的编队
Figure 77479DEST_PATH_IMAGE059
,并且每个跟随者
Figure 617045DEST_PATH_IMAGE060
移动到由领导者形成的凸包的位置,如图3所示。所有领导者的平均位置中心渐近收敛到虚拟领导者的位置。
上述非完整多智能体系统时变编队包含控制方法中,所述方法中的非完整多智能体系统包括多个领导者和多个跟随者,其中只有领导者才能获得期望轨迹的信息。首先,将非完整系统的动力学模型线性化为二阶动力学模型;其次,基于期望的轨迹和编队模板,提出了FC控制协议,实现了非完整多智能体系统的时变编队包含控制,使领导者的平均位置和平均速度渐近收敛到期望轨迹,而跟随者收敛到领导者跨越的凸包,同时使整个系统的中心沿着所需的轨迹移动。FC控制协议仅根据期望轨迹和编队模板设计,没有指定期望编队中每个配置点的轨迹,这与现有技术相比更具适用性。
在其中一个实施例中,步骤100中非完整智能体的动力学方程为:
Figure 404873DEST_PATH_IMAGE061
(4)
其中, i表示非完整多智能体的编号,t表示时刻,
Figure 979073DEST_PATH_IMAGE062
表示第i个智能体在t时刻的状态信息,
Figure 679307DEST_PATH_IMAGE063
表示第i个智能体在t时刻的控制输入,
Figure 706169DEST_PATH_IMAGE064
表示
Figure 297688DEST_PATH_IMAGE065
的导数,A和B分别为第i个非完整多智能体系统矩阵及输入矩阵,N为跟随者数量,M为领导者数量。
具体的,考虑具有以下动力学系统描述的非完整多智能体集群系统中的
Figure 460816DEST_PATH_IMAGE066
智能体:
Figure 846798DEST_PATH_IMAGE067
(5)
其中,
Figure 610223DEST_PATH_IMAGE068
,
Figure 739853DEST_PATH_IMAGE069
,
Figure 23067DEST_PATH_IMAGE070
,
Figure 579950DEST_PATH_IMAGE071
分别表示智能体
Figure 581404DEST_PATH_IMAGE072
的位置、线性速度、航向角和角速度。描述
Figure 249146DEST_PATH_IMAGE073
,然后多智能体集群系统可以线性化为二阶动力学系统,如式(4)所示,式(4)中
Figure 137599DEST_PATH_IMAGE074
,
Figure 865383DEST_PATH_IMAGE075
,
Figure 354133DEST_PATH_IMAGE076
在其中一个实施例中,步骤108中具有期望轨迹约束的编队包含控制协议的表达式为:
Figure 825566DEST_PATH_IMAGE078
其中,
Figure 817793DEST_PATH_IMAGE079
是常量矩阵,
Figure 982058DEST_PATH_IMAGE080
Figure 941793DEST_PATH_IMAGE081
Figure 951337DEST_PATH_IMAGE082
为第i个非完整智能体的状态,
Figure 63649DEST_PATH_IMAGE083
,表示领导智能体i与编队参考点之间的相对偏移向量,
Figure 133237DEST_PATH_IMAGE084
其中表示位置偏移,
Figure 331000DEST_PATH_IMAGE085
表示速度偏移,
Figure 629388DEST_PATH_IMAGE086
是第i个智能体和第j个智能体之间的交互权重,
Figure 596207DEST_PATH_IMAGE087
是虚拟领导者的速度,
Figure 836696DEST_PATH_IMAGE088
为虚拟领导者的状态。
具体的,拓扑通信图
Figure 521755DEST_PATH_IMAGE089
满足如下条件:拓扑通信图的子图
Figure 138681DEST_PATH_IMAGE090
有一个有向生成树;对于每个跟随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与他们连接的领导者的信息,而不能获得所需轨迹的信息;两个领导者之间的通信链路是双工的。对于任何给定的有界初始状态,具有期望轨迹约束的编队包含控制协议下的非完整多智能体集群系统,然后所有领导者的中心位置收敛到虚拟领域者的
Figure 209274DEST_PATH_IMAGE091
并且所有领导者的平均速度渐近收敛到虚拟领域者的
Figure 620664DEST_PATH_IMAGE092
。其推理过程为:
将所有领导者的平均位置中心表示为
Figure 793019DEST_PATH_IMAGE093
,
Figure 682478DEST_PATH_IMAGE094
,从
Figure 889468DEST_PATH_IMAGE095
Figure 691333DEST_PATH_IMAGE096
。然后根据式(7)可以得到:
Figure 350985DEST_PATH_IMAGE097
(8)
因为
Figure 44134DEST_PATH_IMAGE098
是对称矩阵,即
Figure 105631DEST_PATH_IMAGE099
,所以得到
Figure 108091DEST_PATH_IMAGE100
(9)
将 (9) 代入 (8) 得到:
Figure 255039DEST_PATH_IMAGE101
(10)
由(10)式可得以下微分方程
Figure 486300DEST_PATH_IMAGE102
(11)
求解方程(11),如果
Figure 136724DEST_PATH_IMAGE103
, 那么
Figure 326397DEST_PATH_IMAGE104
(12)
其中,
Figure 445794DEST_PATH_IMAGE105
如果
Figure 746325DEST_PATH_IMAGE106
,那么:
Figure 251256DEST_PATH_IMAGE107
(13)
如果
Figure 611830DEST_PATH_IMAGE108
,那么
Figure 467790DEST_PATH_IMAGE109
(14)
其中,
Figure 306433DEST_PATH_IMAGE110
从式(12)~(14),可以得出
Figure 180717DEST_PATH_IMAGE111
Figure 446614DEST_PATH_IMAGE112
由以上推理过程可以推导出所有领导者的平均位置中心收敛到虚拟领导者的位置
Figure 789870DEST_PATH_IMAGE113
,所有领导者的平均速度渐近收敛到虚拟领导者的速度
Figure 697783DEST_PATH_IMAGE114
。这意味着整个多智能体群系统沿着期望轨迹移动,这表明期望轨迹的约束得到满足。
在其中一个实施例中,具有期望轨迹约束的编队包含控制协议的表达式中的常量矩阵
Figure 177306DEST_PATH_IMAGE115
的求解方法包括:
根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,编队模板和虚拟领导者形成时变编队的表达式为:
Figure 630416DEST_PATH_IMAGE116
(15)
其中,
Figure 195389DEST_PATH_IMAGE117
为预定编队模板,
Figure 375835DEST_PATH_IMAGE118
Figure 241023DEST_PATH_IMAGE119
是虚拟领导者的速度导数,
Figure 848721DEST_PATH_IMAGE120
Figure 166570DEST_PATH_IMAGE121
是虚拟领导者的状态,
Figure 134395DEST_PATH_IMAGE122
Figure 854089DEST_PATH_IMAGE123
为2阶单位矩阵,
Figure 632690DEST_PATH_IMAGE124
为通信拓扑图的子图的拉普拉斯矩阵,表示跟随者和领导者之间的交互关系,
Figure 437835DEST_PATH_IMAGE125
Figure 225662DEST_PATH_IMAGE126
为预定编队模板中第i个模板顶点的速度偏移,t为时刻,
Figure 285016DEST_PATH_IMAGE127
为M维所有元素都为1的列向量。
根据编队模板和虚拟领导者形成时变编队的表达式,确定常量矩阵
Figure 500097DEST_PATH_IMAGE128
的值;定义正定复矩阵P,并根据常量矩阵
Figure 261379DEST_PATH_IMAGE128
和正定复矩阵P,构建代数Riccati方程,并对代数Riccati方程进行求解,得到正定复矩阵P的值;代数Riccati方程为:
Figure 852898DEST_PATH_IMAGE129
(16)
其中
Figure 16026DEST_PATH_IMAGE130
根据正定复矩阵P、矩阵B以及两个预设的正常数,确定常量矩阵
Figure 402008DEST_PATH_IMAGE131
Figure 431012DEST_PATH_IMAGE132
;常量矩阵
Figure 295063DEST_PATH_IMAGE133
Figure 578277DEST_PATH_IMAGE134
的计算表达式为:
Figure 400740DEST_PATH_IMAGE135
(17)
其中,
Figure 804356DEST_PATH_IMAGE137
Figure 704528DEST_PATH_IMAGE138
为正常数,
Figure 432312DEST_PATH_IMAGE139
Figure 655483DEST_PATH_IMAGE140
其中
Figure 126916DEST_PATH_IMAGE141
Figure 384722DEST_PATH_IMAGE142
分别为与跟随者相关的对角矩阵和与领导者相关的对角矩阵,
Figure 532675DEST_PATH_IMAGE143
为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、表示领导者之间的交互关系;
Figure 508721DEST_PATH_IMAGE144
为括号中矩阵的最大特征值,
Figure 518266DEST_PATH_IMAGE145
为括号中矩阵的最小特征值。
在其中一个实施例中,与跟随者相关的对角矩阵是通过
Figure 630578DEST_PATH_IMAGE146
计算得到的;其中与跟随者相关的对角矩阵
Figure 700165DEST_PATH_IMAGE147
Figure 897929DEST_PATH_IMAGE148
为N维所有元素都为1的列向量;与领导者相关的对角矩阵是通过
Figure 727475DEST_PATH_IMAGE150
计算得到的。其中与领导者相关的对角矩阵
Figure 694294DEST_PATH_IMAGE151
在其中一个实施例中,具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;步骤110包括:根据各非完整智能体的动力学方程及领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;根据各非完整智能体的动力学方程及跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;根据领导者子系统的动力学模型和跟随者子系统的动力学模型,构建非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
在其中一个实施例中,跟随者子系统的动力学模型的表达式为:
Figure 934783DEST_PATH_IMAGE152
(18)
其中,
Figure 619842DEST_PATH_IMAGE153
为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、跟随者和领导者之间的交互关系;AB分别为非完整多智能体系统矩阵及输入矩阵,
Figure 236768DEST_PATH_IMAGE154
是常量矩阵,
Figure 307361DEST_PATH_IMAGE155
是N阶单位矩阵,
Figure 718751DEST_PATH_IMAGE156
为领导者的状态向量,
Figure 625527DEST_PATH_IMAGE157
为跟随者的状态向量,N为跟随者数量,M为领导者数量。
领导者子系统的动力学模型的表达式为:
Figure 46144DEST_PATH_IMAGE158
(19)
其中,
Figure 721976DEST_PATH_IMAGE159
为通信拓扑图的子图的拉普拉斯矩阵,表示领导者之间的交互关系;
Figure 569847DEST_PATH_IMAGE160
是常量矩阵,
Figure 714651DEST_PATH_IMAGE161
M阶单位矩阵,
Figure 407801DEST_PATH_IMAGE162
为预定编队模板,
Figure 469298DEST_PATH_IMAGE163
Figure 222490DEST_PATH_IMAGE164
Figure 87547DEST_PATH_IMAGE165
Figure 584387DEST_PATH_IMAGE166
表示速度偏移,
Figure 500390DEST_PATH_IMAGE167
是虚拟领导者的速度导数,
Figure 690063DEST_PATH_IMAGE168
是虚拟领导者的状态。
领导者的编队控制的关系为表达式(20)渐近稳定。
Figure 58728DEST_PATH_IMAGE169
(20)
其中
Figure 844412DEST_PATH_IMAGE170
为领导者的编队跟踪局部误差向量;
Figure 614922DEST_PATH_IMAGE171
为领导者的编队跟踪局部误差向量的导数
跟随者的包含控制的关系为:
Figure 709917DEST_PATH_IMAGE172
。 (21)
具体的,令
Figure 565878DEST_PATH_IMAGE173
Figure 404521DEST_PATH_IMAGE175
。通过将具有期望轨迹约束的编队包含控制协议的表达式代入用非完整多智能体群系统的二阶动力学模型中,非完整多智能体群系统可以写成紧凑的形式:
Figure 295116DEST_PATH_IMAGE176
(22)
Figure 810280DEST_PATH_IMAGE177
(23)
Figure 153537DEST_PATH_IMAGE178
Figure 530292DEST_PATH_IMAGE180
Figure 275394DEST_PATH_IMAGE181
对于追随者
Figure 712191DEST_PATH_IMAGE182
,相对于其邻居的包含局部误差定义为
Figure 293476DEST_PATH_IMAGE183
(24)
对于领导智能体,将其时变编队跟踪误差表示为
Figure 473922DEST_PATH_IMAGE184
(25)
将其相对于相邻领导智能体的编队跟踪局部误差定义为:
Figure 339110DEST_PATH_IMAGE185
(26)
Figure 212388DEST_PATH_IMAGE186
Figure 999078DEST_PATH_IMAGE187
。对于领导智能体,从 (25) 和 (23)中可以看出
Figure 248794DEST_PATH_IMAGE188
(27)
因为 0 是
Figure 952177DEST_PATH_IMAGE189
的简单特征值,则存在一个矩阵
Figure 996356DEST_PATH_IMAGE190
,使得
Figure 270343DEST_PATH_IMAGE191
和矩阵
Figure 792591DEST_PATH_IMAGE192
的特征值是
Figure 366792DEST_PATH_IMAGE193
Figure 67026DEST_PATH_IMAGE194
非零特征值,其中
Figure 359467DEST_PATH_IMAGE196
因此,从 (26) 和 (27) 可以得出:
Figure 685406DEST_PATH_IMAGE197
(28)
如果
Figure 114113DEST_PATH_IMAGE198
,得到
Figure 500095DEST_PATH_IMAGE199
,那么根据式(1),领导者形成特定的编队。
因为
Figure 997941DEST_PATH_IMAGE200
,
Figure 127571DEST_PATH_IMAGE201
,得出:
Figure 410785DEST_PATH_IMAGE202
(29)
因此,式(4)表示的非完整多智能体系统中的领导者
Figure 967668DEST_PATH_IMAGE203
形成期望编队的充要条件是式(30)是渐近稳定的。
Figure 969122DEST_PATH_IMAGE204
(30)
对于
Figure 636864DEST_PATH_IMAGE205
中的所有追随者,从式(24) 可以得到:
Figure 790896DEST_PATH_IMAGE206
(31)
如果
Figure 253101DEST_PATH_IMAGE207
,那么它遵循:
Figure 741852DEST_PATH_IMAGE208
(32)
基于
Figure 478863DEST_PATH_IMAGE209
的所有特征值都有正实部;
Figure 471090DEST_PATH_IMAGE210
的每个条目都是非负的,并且它的每一行的和等于1,表达式
Figure 369776DEST_PATH_IMAGE211
,由(32) 得到满足,即跟随者智能体
Figure 329511DEST_PATH_IMAGE212
收敛到由领导者
Figure 604634DEST_PATH_IMAGE213
形成的凸包。
因此,基于上述分析,可以得出结论,如果
Figure 451368DEST_PATH_IMAGE214
(即(30)是渐近稳定的)和
Figure 786534DEST_PATH_IMAGE215
,则式(4)表示的非完整多智能体系统实现了编队包含。
在其中一个实施例中,构建的通信拓扑图的拉普拉斯矩阵为:
Figure 718718DEST_PATH_IMAGE216
(33)
其中
Figure 548265DEST_PATH_IMAGE217
,
Figure 249505DEST_PATH_IMAGE218
,
Figure 755572DEST_PATH_IMAGE219
分别表示成通信拓扑图的子图的拉普拉斯矩阵,
Figure 440631DEST_PATH_IMAGE220
表示跟随者之间的交互关系、
Figure 791978DEST_PATH_IMAGE221
表示跟随者和领导者之间的交互关系,
Figure 878883DEST_PATH_IMAGE222
表示领导者之间的交互关系。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个仿真验证性实施例中,考虑一个由虚拟人类个体组成的多智能体系统。每个虚拟人都被视为一个非完整智能体。根据表1中详述的不同追随者、领导者、期望轨迹和期望编队分别设计了三个实验。
表 1. 为非完整多智能体系统设计的三个实验
Figure 539540DEST_PATH_IMAGE223
三个实验中所有智能体的初始分布如图4 所示,图4中带圈的1-12代表领导者,圈中的数字代表领导者的编号,例如,带圈的1表示1号领导者。
实验1 中的多智能体系统包含 53 个追随者和 8 个领导者,其中跟随者最初位于图4中的E区域,领导者最初位于图4中的G区域。所需的轨迹设置为与
Figure 711896DEST_PATH_IMAGE224
的一条线。所需矩形编队模板的静态位置偏移
Figure 132513DEST_PATH_IMAGE225
Figure 73924DEST_PATH_IMAGE226
,
Figure 656215DEST_PATH_IMAGE227
,
Figure 315867DEST_PATH_IMAGE228
,
Figure 748030DEST_PATH_IMAGE229
,
Figure 809527DEST_PATH_IMAGE230
,
Figure 297140DEST_PATH_IMAGE231
,
Figure 444087DEST_PATH_IMAGE232
,
Figure 206507DEST_PATH_IMAGE233
。在实验2 中,50 个跟随者和 8 个领导者的初始位置分别在 图4中的F区域 和 G区域。期望的轨迹设置为与
Figure 106199DEST_PATH_IMAGE234
的一条线。所需的圆形编队模板的设置为
Figure 295872DEST_PATH_IMAGE235
,
Figure 664536DEST_PATH_IMAGE236
,
Figure 699488DEST_PATH_IMAGE237
,
Figure 735577DEST_PATH_IMAGE238
,
Figure 96151DEST_PATH_IMAGE239
,
Figure 437265DEST_PATH_IMAGE240
,
Figure 541487DEST_PATH_IMAGE241
,
Figure 166504DEST_PATH_IMAGE243
。在前两个实验中,
Figure 697979DEST_PATH_IMAGE244
被设置为八个领导者的
Figure 775657DEST_PATH_IMAGE245
。在实验3中的多智能体系统包含 5个跟随者和 12 个领导者,领导者初始位于图4中的H区域,采用二次曲线作为期望轨迹,即
Figure 417991DEST_PATH_IMAGE246
。所需不规则地编队模板的
Figure 146781DEST_PATH_IMAGE247
设置为(-3.8333,-4.375), (-3.8333,-1.375), (-2.8333,0.625), (-2.8333,2.625), (-0.8333,2.625), (0.1667, 2.625), (1.1667,2.625), (2.1667,1.625), (3.1667,0.625), (1.6667,-0.875), (1.6667,-2.375), (4.1667,-4.375)。不规则阵型模板按照所需的二次曲线变化,因此将
Figure 849158DEST_PATH_IMAGE248
设置为
Figure 679711DEST_PATH_IMAGE249
为十二个领导者。在实验 3 中,当
Figure 860156DEST_PATH_IMAGE250
实现时,12 个领导者的状态将形成不规则的编队,并随着他们沿着期望的二次曲线移动而围绕虚拟领导者旋转。
按照上述方法中的步骤,参数
Figure 459765DEST_PATH_IMAGE251
在实验1中设计为
Figure 333043DEST_PATH_IMAGE252
,在实验2中设计为
Figure 136045DEST_PATH_IMAGE253
,在实验3中设计为
Figure 385761DEST_PATH_IMAGE254
。求解代数Riccati方程(16),得到实验1中的
Figure 839876DEST_PATH_IMAGE255
,实验2中的
Figure 618476DEST_PATH_IMAGE256
和实验3中的
Figure 423621DEST_PATH_IMAGE257
。根据
Figure 195137DEST_PATH_IMAGE258
Figure 769338DEST_PATH_IMAGE260
,分别构造三个实验的矩阵
Figure 718839DEST_PATH_IMAGE261
Figure 11280DEST_PATH_IMAGE262
我们可以得到
Figure 71640DEST_PATH_IMAGE263
,
Figure 500347DEST_PATH_IMAGE264
在实验 1 中,
Figure 902641DEST_PATH_IMAGE265
,
Figure 151220DEST_PATH_IMAGE266
在实验 2 中,
Figure 280850DEST_PATH_IMAGE267
,
Figure 829643DEST_PATH_IMAGE268
在实验 3 中。因此,在实验1中,选择了
Figure 120947DEST_PATH_IMAGE269
Figure 122401DEST_PATH_IMAGE270
。对应的参数是
Figure 39410DEST_PATH_IMAGE271
Figure 442710DEST_PATH_IMAGE272
。在实验2中,选择了
Figure 170494DEST_PATH_IMAGE273
Figure 393665DEST_PATH_IMAGE274
,对应的参数是
Figure 865098DEST_PATH_IMAGE275
Figure 608057DEST_PATH_IMAGE276
。在实验 3 中,选择了
Figure 772322DEST_PATH_IMAGE277
Figure 482789DEST_PATH_IMAGE278
,对应的参数是
Figure 492333DEST_PATH_IMAGE279
Figure 870225DEST_PATH_IMAGE280
虚拟人群是一个典型的非完整多智能体群体系统。本发明以虚拟人作为智能体的实体,基于DI-Guy软件平台对人群状态进行仿真验证和3D可视化驱动。图5~7显示了实验1~3中非完整群系统的运动状态,图中(X,Y)代表智能体相对于原点的位置。领导者的编队跟踪误差
Figure 674233DEST_PATH_IMAGE281
和跟随者的包含局部误差
Figure 386843DEST_PATH_IMAGE283
如图8 所示。
所有领导者的中心位置和速度与全局轨迹之间的误差如图9所示。
3D可视化实验结果如图10-图12所示。
图5~图7表明,领导者可以在三个实验中形成给定的时变编队,并且跟随者可以同时收敛到领导者形成的凸包。图8中(a)显示了编队跟踪误差收敛,图(8)中(b)显示了包含控制局部误差收敛,表明非完整多智能体系统实现了编队-包含。从图9可以看出,在实验1至3中,所有领导者中心的位置和速度与期望轨迹的误差分别在第21秒、第 32秒和第8秒时趋于一致,表明领导者已跟踪所需的轨迹。图10至图12生动地展示了整个智能体系统如何实现编队包含并从三维角度跟踪所需轨迹。
在一个实施例中,如图13所示,提供了一种非完整多智能体系统时变编队包含控制装置,非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;包括:非完整多智能体系统模型构建模块、非完整多智能体系统的通信拓扑图确定模块、获取期望轨迹和确定编队模板模块、具有期望轨迹约束的编队包含控制协议构建模块和具有期望轨迹约束的编队包含控制实现模块,其中:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程;
非完整多智能体系统的通信拓扑图确定模块,用于根据非完整多智能体系统中非完整智能体之间的通讯关系,构建非完整多智能体系统的通信拓扑图,并根据通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
获取期望轨迹和确定编队模板模块,用于领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将预定编队模板的中心定位在期望轨迹,并根据预定编队模板的中心构建一个虚拟领导者;
具有期望轨迹约束的编队包含控制协议构建模块,用于根据虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
具有期望轨迹约束的编队包含控制实现模块,用于根据动力学方程及编队包含控制协议,构建非完整多智能体系统中编队控制以及包含控制的关系;根据编队控制以及包含控制的关系控制非完整多智能体系统中非完整多智能体按照期望轨迹运动和预定编队模板运动。
在其中一个实施例中,非完整多智能体系统模型构建模块中非完整智能体的动力学方程如式(4)所示。
在其中一个实施例中,有期望轨迹约束的编队包含控制协议构建模块中具有期望轨迹约束的编队包含控制协议的表达式如式(6)、式(7)所示。
在其中一个实施例中,有期望轨迹约束的编队包含控制协议构建模块包括:期望轨迹约束的编队包含控制协议的表达式中的常量矩阵
Figure 934499DEST_PATH_IMAGE284
求解模块,用于根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,编队模板和虚拟领导者形成时变编队的表达式如式(15)所示。
根据编队模板和虚拟领导者形成时变编队的表达式,确定常量矩阵
Figure 166897DEST_PATH_IMAGE285
的值;定义正定复矩阵P,并根据常量矩阵
Figure 407386DEST_PATH_IMAGE285
和正定复矩阵P,构建代数Riccati方程,并对代数Riccati方程进行求解,得到正定复矩阵P的值;代数Riccati方程如式(16)所示。
根据正定复矩阵P、矩阵B以及两个预设的正常数,确定常量矩阵
Figure 92445DEST_PATH_IMAGE286
Figure 709371DEST_PATH_IMAGE287
;常量矩阵
Figure 281429DEST_PATH_IMAGE286
Figure 958398DEST_PATH_IMAGE287
的计算表达式如式(17)所示。
在其中一个实施例中,期望轨迹约束的编队包含控制协议的表达式中的常量矩阵
Figure 865174DEST_PATH_IMAGE288
求解模块中与跟随者相关的对角矩阵是通过
Figure 20212DEST_PATH_IMAGE289
计算得到的;其中与跟随者相关的对角矩阵
Figure 227202DEST_PATH_IMAGE290
Figure 58761DEST_PATH_IMAGE291
为N维所有元素都为1的列向量;与领导者相关的对角矩阵是通过
Figure 718412DEST_PATH_IMAGE292
计算得到的。其中与领导者相关的对角矩阵
Figure 677141DEST_PATH_IMAGE293
在其中一个实施例中,具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;具有期望轨迹约束的编队包含控制实现模块,还用于根据各非完整智能体的动力学方程及领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;根据各非完整智能体的动力学方程及跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;根据领导者子系统的动力学模型和跟随者子系统的动力学模型,构建非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
在其中一个实施例中,具有期望轨迹约束的编队包含控制实现模块中跟随者子系统的动力学模型的表达式如式(18)所示。领导者子系统的动力学模型的表达式如式(19)所示。领导者的编队控制的关系为表达式(20)渐近稳定。跟随者的包含控制的关系如式(21)所示。
在其中一个实施例中,上述任一装置中构建的通信拓扑图的拉普拉斯矩阵如式(33)所示。
关于非完整多智能体系统时变编队包含控制装置的具体限定可以参见上文中对于非完整多智能体系统时变编队包含控制方法的限定,在此不再赘述。上述非完整多智能体系统时变编队包含控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种非完整多智能体系统时变编队包含控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种非完整多智能体系统时变编队包含控制方法,其特征在于,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述方法包括:
构建非完整多智能体系统中各非完整智能体的动力学方程;
根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
所述领导者获取期望轨迹;
设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者;
根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;
根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
2.根据权利要求1所述的方法,其特征在于,构建非完整多智能体系统中各非完整智能体的动力学方程,步骤中非完整智能体的动力学方程为:
Figure 990277DEST_PATH_IMAGE001
其中,其中,i表示非完整多智能体的编号,t表示时刻,
Figure 376258DEST_PATH_IMAGE002
表示第i个智能体在t时刻的状态信息,
Figure 624837DEST_PATH_IMAGE003
表示第i个智能体在t时刻的控制输入,
Figure 285626DEST_PATH_IMAGE004
表示
Figure 818107DEST_PATH_IMAGE005
的导数,AB分别为第i个非完整多智能体系统矩阵及输入矩阵,N为跟随者数量,M为领导者数量。
3.根据权利要求1所述的方法,其特征在于,根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议,所述具有期望轨迹约束的编队包含控制协议的表达式为:
Figure 843832DEST_PATH_IMAGE006
其中,
Figure 579707DEST_PATH_IMAGE007
是常量矩阵,
Figure 247448DEST_PATH_IMAGE008
Figure 181906DEST_PATH_IMAGE009
Figure 394844DEST_PATH_IMAGE010
为第i个非完整智能体的状态,
Figure 618015DEST_PATH_IMAGE011
,表示领导智能体i与编队参考点之间的相对偏移向量,
Figure 558289DEST_PATH_IMAGE012
其中表示位置偏移,
Figure 550516DEST_PATH_IMAGE013
表示速度偏移,
Figure 698470DEST_PATH_IMAGE014
是第i个智能体和第j个智能体之间的交互权重,
Figure 205674DEST_PATH_IMAGE015
是虚拟领导者的速度,
Figure 949639DEST_PATH_IMAGE016
为虚拟领导者的状态。
4.根据权利要求3所述的方法,其特征在于,所述具有期望轨迹约束的编队包含控制协议的表达式中的常量矩阵
Figure 61952DEST_PATH_IMAGE017
的求解方法包括:
根据非完整智能体的动力学方程、非完整智能体之间的交互关系、预定编队模板以及虚拟领导者,构建编队模板和虚拟领导者形成时变编队的表达式,所述编队模板和虚拟领导者形成时变编队的表达式为:
Figure 600381DEST_PATH_IMAGE018
其中,
Figure 548876DEST_PATH_IMAGE019
为预定编队模板,
Figure 893270DEST_PATH_IMAGE020
Figure 860089DEST_PATH_IMAGE021
是虚拟领导者的速度导数,
Figure 100577DEST_PATH_IMAGE022
Figure 254478DEST_PATH_IMAGE023
为2阶单位矩阵,
Figure 855093DEST_PATH_IMAGE024
为通信拓扑图的子图的拉普拉斯矩阵,表示跟随者和领导者之间的交互关系,
Figure 676418DEST_PATH_IMAGE025
Figure 87808DEST_PATH_IMAGE026
为预定编队模板中第i个模板顶点的速度偏移,t为时刻,
Figure 791322DEST_PATH_IMAGE027
为M维所有元素都为1的列向量;
根据编队模板和虚拟领导者形成时变编队的表达式,确定常量矩阵
Figure 680780DEST_PATH_IMAGE028
的值;
定义正定复矩阵P,并根据常量矩阵
Figure 107345DEST_PATH_IMAGE029
和正定复矩阵P,构建代数Riccati方程,并对所述代数Riccati方程进行求解,得到正定复矩阵P的值;所述代数Riccati方程为:
Figure 689636DEST_PATH_IMAGE030
其中
Figure 880446DEST_PATH_IMAGE031
根据正定复矩阵P、矩阵B以及两个预设的正常数,确定常量矩阵
Figure 573595DEST_PATH_IMAGE032
Figure 838354DEST_PATH_IMAGE033
;所述常量矩阵
Figure 840814DEST_PATH_IMAGE034
Figure 722183DEST_PATH_IMAGE035
的计算表达式为;
Figure 15761DEST_PATH_IMAGE036
Figure 666185DEST_PATH_IMAGE037
其中,
Figure 59120DEST_PATH_IMAGE038
Figure 455815DEST_PATH_IMAGE039
为正常数,
Figure 225188DEST_PATH_IMAGE040
Figure 995698DEST_PATH_IMAGE041
其中
Figure 621851DEST_PATH_IMAGE042
Figure 477812DEST_PATH_IMAGE043
分别为与跟随者相关的对角矩阵和与领导者相关的对角矩阵,
Figure 565722DEST_PATH_IMAGE044
为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、表示领导者之间的交互关系;
Figure 659580DEST_PATH_IMAGE045
为括号中矩阵的最大特征值,
Figure 925476DEST_PATH_IMAGE046
为括号中矩阵的最小特征值。
5.根据权利要求4所述的方法,其特征在于,所述与跟随者相关的对角矩阵是通过
Figure 3154DEST_PATH_IMAGE047
计算得到的;其中与跟随者相关的对角矩阵
Figure 396220DEST_PATH_IMAGE048
Figure 875743DEST_PATH_IMAGE049
为N维所有元素都为1的列向量;
所述与领导者相关的对角矩阵是通过
Figure 109278DEST_PATH_IMAGE050
计算得到的;其中与领导者相关的对角矩阵
Figure 877514DEST_PATH_IMAGE051
6.根据权利要求1所述的方法,其特征在于,所述具有期望轨迹约束的编队包含控制协议包括:领导者编队控制协议和跟随者包含控制协议;
根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系,包括:
根据各非完整智能体的动力学方程及所述领导者编队控制协议;得到由所有领导者组成的领导者子系统的动力学模型;
根据各非完整智能体的动力学方程及所述跟随者包含控制协议;得到由所有跟随者组成的跟随者子系统的动力学模型;
根据所述领导者子系统的动力学模型和所述跟随者子系统的动力学模型,构建所述非完整多智能体系统中领导者的编队控制的关系以及跟随者的包含控制的关系。
7.根据权利要求6所述的方法,其特征在于,所述跟随者子系统的动力学模型的表达式为:
Figure 854697DEST_PATH_IMAGE052
其中,
Figure 437994DEST_PATH_IMAGE053
为通信拓扑图的子图的拉普拉斯矩阵,分别表示跟随者之间的交互关系、跟随者和领导者之间的交互关系; A和B分别为非完整多智能体系统矩阵及输入矩阵,
Figure 45693DEST_PATH_IMAGE054
是常量矩阵,
Figure 832384DEST_PATH_IMAGE055
是N阶单位矩阵,
Figure 550941DEST_PATH_IMAGE056
为领导者的状态向量,
Figure 755789DEST_PATH_IMAGE057
为跟随者的状态向量,N为跟随者数量,M为领导者数量;
所述领导者子系统的动力学模型的表达式为:
Figure 331126DEST_PATH_IMAGE058
其中,
Figure 870692DEST_PATH_IMAGE059
为通信拓扑图的子图的拉普拉斯矩阵,表示领导者之间的交互关系;
Figure 127361DEST_PATH_IMAGE060
是常量矩阵,
Figure 435983DEST_PATH_IMAGE061
M阶单位矩阵,
Figure 634752DEST_PATH_IMAGE062
为预定编队模板,
Figure 192772DEST_PATH_IMAGE063
Figure 518711DEST_PATH_IMAGE064
Figure 681839DEST_PATH_IMAGE065
Figure 536663DEST_PATH_IMAGE066
表示速度偏移,
Figure 801553DEST_PATH_IMAGE021
是虚拟领导者的速度导数,
Figure 665604DEST_PATH_IMAGE067
是虚拟领导者的状态,
Figure 683238DEST_PATH_IMAGE068
M维所有元素都为1的列向量;
所述领导者的编队控制的关系为表达式
Figure 36859DEST_PATH_IMAGE069
渐近稳定;其中
Figure 772734DEST_PATH_IMAGE070
为领导者的编队跟踪局部误差向量;
Figure 689744DEST_PATH_IMAGE071
为领导者的编队跟踪局部误差向量的导数;
所述跟随者的包含控制的关系为
Figure 296305DEST_PATH_IMAGE072
8.根据权利要求1-7任一项所述的方法,其特征在于,构建的所述通信拓扑图的拉普拉斯矩阵为:
Figure 24090DEST_PATH_IMAGE073
其中
Figure 247261DEST_PATH_IMAGE074
,
Figure 249852DEST_PATH_IMAGE075
,
Figure 992811DEST_PATH_IMAGE076
分别表示成通信拓扑图的子图的拉普拉斯矩阵,
Figure 891497DEST_PATH_IMAGE077
表示跟随者之间的交互关系、
Figure 70806DEST_PATH_IMAGE078
表示跟随者和领导者之间的交互关系,
Figure 80350DEST_PATH_IMAGE079
表示领导者之间的交互关系。
9.一种非完整多智能体系统时变编队包含控制装置,其特征在于,所述非完整多智能体系统包括:多个领导者和多个跟随者,其中,对于每个追随者,至少存在一个具有指向它的有向路径的领导者;每个领导者可以获得期望轨迹的信息,以及属于其邻居集的其他领导者的信息,并且每个追随者只能获得与之连接的领导者的信息,而不能获得期望轨迹的信息;所述装置包括:
非完整多智能体系统模型构建模块,用于构建非完整多智能体系统中各非完整智能体的动力学方程;
非完整多智能体系统的通信拓扑图确定模块,用于根据所述非完整多智能体系统中非完整智能体之间的通讯关系,构建所述非完整多智能体系统的通信拓扑图,并根据所述通信拓扑图得到非完整智能体之间的交互关系,并构建通信拓扑图的拉普拉斯矩阵;
获取期望轨迹和确定编队模板模块,用于所述领导者获取期望轨迹;设置领导者的预定编队模板、编队参考点为预定编队模板的中心;并将所述预定编队模板的中心定位在所述期望轨迹,并根据所述预定编队模板的中心构建一个虚拟领导者;
具有期望轨迹约束的编队包含控制协议构建模块,用于根据所述虚拟领导者、预定编队模板和非完整智能体之间的交互关系,构建具有期望轨迹约束的编队包含控制协议;
具有期望轨迹约束的编队包含控制实现模块,用于根据所述动力学方程及所述编队包含控制协议,构建所述非完整多智能体系统中编队控制以及包含控制的关系;根据所述编队控制以及包含控制的关系控制所述非完整多智能体系统中非完整多智能体按照所述期望轨迹运动和所述预定编队模板运动。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
CN202210736026.7A 2022-06-27 2022-06-27 非完整多智能体系统时变编队包含控制方法、装置和设备 Active CN114815856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210736026.7A CN114815856B (zh) 2022-06-27 2022-06-27 非完整多智能体系统时变编队包含控制方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210736026.7A CN114815856B (zh) 2022-06-27 2022-06-27 非完整多智能体系统时变编队包含控制方法、装置和设备

Publications (2)

Publication Number Publication Date
CN114815856A true CN114815856A (zh) 2022-07-29
CN114815856B CN114815856B (zh) 2022-09-20

Family

ID=82523047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210736026.7A Active CN114815856B (zh) 2022-06-27 2022-06-27 非完整多智能体系统时变编队包含控制方法、装置和设备

Country Status (1)

Country Link
CN (1) CN114815856B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116540736A (zh) * 2023-06-12 2023-08-04 天津工业大学 基于人机交互二阶非线性多智能体系统的编队控制方法
CN116820100A (zh) * 2023-06-25 2023-09-29 中国矿业大学 一种欺骗攻击下的无人车编队控制方法
CN117891259A (zh) * 2024-03-14 2024-04-16 中国科学院数学与系统科学研究院 多图形构型的多智能体编队控制方法和相关产品

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170269612A1 (en) * 2016-03-18 2017-09-21 Sunlight Photonics Inc. Flight control methods for operating close formation flight
US20170293307A1 (en) * 2016-04-07 2017-10-12 Sunlight Photonics Inc. Apparatus for close formation flight
US20180074520A1 (en) * 2016-09-13 2018-03-15 Arrowonics Technologies Ltd. Formation flight path coordination of unmanned aerial vehicles
CN108319296A (zh) * 2018-03-26 2018-07-24 中国人民解放军国防科技大学 一种融合全局信息与局部信息的编队控制方法
CN108646758A (zh) * 2018-03-20 2018-10-12 南京邮电大学 一种多移动机器人预设性能编队控制器结构及设计方法
CN111435252A (zh) * 2020-01-15 2020-07-21 北京航空航天大学 异构多智能体系统分组输出时变编队跟踪控制方法及系统
CN112000108A (zh) * 2020-09-08 2020-11-27 北京航空航天大学 一种多智能体集群分组时变编队跟踪控制方法及系统
CN113485344A (zh) * 2021-07-15 2021-10-08 北京航空航天大学 一种多智能体输出编队跟踪控制方法及系统
CN113741518A (zh) * 2021-08-31 2021-12-03 中国人民解放军国防科技大学 基于领航跟随模式的固定翼无人机集群仿射编队控制方法
CN113900380A (zh) * 2021-11-17 2022-01-07 北京航空航天大学 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN114020042A (zh) * 2021-12-14 2022-02-08 北京航空航天大学 一种异构无人集群编队合围跟踪控制方法及系统
CN114237247A (zh) * 2021-12-17 2022-03-25 广东工业大学 基于预测的可变队形非完整移动机器人一致性控制方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170269612A1 (en) * 2016-03-18 2017-09-21 Sunlight Photonics Inc. Flight control methods for operating close formation flight
US20170293307A1 (en) * 2016-04-07 2017-10-12 Sunlight Photonics Inc. Apparatus for close formation flight
US20180074520A1 (en) * 2016-09-13 2018-03-15 Arrowonics Technologies Ltd. Formation flight path coordination of unmanned aerial vehicles
CN108646758A (zh) * 2018-03-20 2018-10-12 南京邮电大学 一种多移动机器人预设性能编队控制器结构及设计方法
CN108319296A (zh) * 2018-03-26 2018-07-24 中国人民解放军国防科技大学 一种融合全局信息与局部信息的编队控制方法
CN111435252A (zh) * 2020-01-15 2020-07-21 北京航空航天大学 异构多智能体系统分组输出时变编队跟踪控制方法及系统
CN112000108A (zh) * 2020-09-08 2020-11-27 北京航空航天大学 一种多智能体集群分组时变编队跟踪控制方法及系统
CN113485344A (zh) * 2021-07-15 2021-10-08 北京航空航天大学 一种多智能体输出编队跟踪控制方法及系统
CN113741518A (zh) * 2021-08-31 2021-12-03 中国人民解放军国防科技大学 基于领航跟随模式的固定翼无人机集群仿射编队控制方法
CN113900380A (zh) * 2021-11-17 2022-01-07 北京航空航天大学 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN114020042A (zh) * 2021-12-14 2022-02-08 北京航空航天大学 一种异构无人集群编队合围跟踪控制方法及系统
CN114237247A (zh) * 2021-12-17 2022-03-25 广东工业大学 基于预测的可变队形非完整移动机器人一致性控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LINA RONG: "Reference model-based containment control of multi-agent systems with higher-order dynamics", 《THE INSTITUTION OF ENGINEERING AND TECHNOLOGY 2014》 *
RUIWEN LIAO: "Finite-time formation-containment tracking for second-order multi-agent systems with a virtual leader of fully unknown input", 《NEUROCOMPUTING》 *
XIWANG DONG: "Theory and Experiment on Formation-Containment Control of Multiple Multirotor Unmanned Aerial Vehicle Systems", 《[J] IEEE TRANSACTIONS ON AUTOMATION SCIENCE AND ENGINEERING》 *
李猛: "障碍环境下具有多领导者的组行为生成方法", 《国防科技大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116540736A (zh) * 2023-06-12 2023-08-04 天津工业大学 基于人机交互二阶非线性多智能体系统的编队控制方法
CN116540736B (zh) * 2023-06-12 2024-02-23 天津工业大学 基于人机交互二阶非线性多智能体系统的编队控制方法
CN116820100A (zh) * 2023-06-25 2023-09-29 中国矿业大学 一种欺骗攻击下的无人车编队控制方法
CN116820100B (zh) * 2023-06-25 2024-02-27 中国矿业大学 一种欺骗攻击下的无人车编队控制方法
CN117891259A (zh) * 2024-03-14 2024-04-16 中国科学院数学与系统科学研究院 多图形构型的多智能体编队控制方法和相关产品
CN117891259B (zh) * 2024-03-14 2024-05-14 中国科学院数学与系统科学研究院 多图形构型的多智能体编队控制方法和相关产品

Also Published As

Publication number Publication date
CN114815856B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN114815856B (zh) 非完整多智能体系统时变编队包含控制方法、装置和设备
CN108919835B (zh) 无人飞行器编队的控制方法、装置及控制器
Cortés et al. Coordinated control of multi-robot systems: A survey
Alonso-Mora et al. Collision avoidance for aerial vehicles in multi-agent scenarios
CN114661069B (zh) 一种群体智能系统的编队控制方法
CN104698854B (zh) 网络Euler‑Lagrange系统分布式模糊协同跟踪控制方法
Ebel et al. A comparative look at two formation control approaches based on optimization and algebraic graph theory
Yu et al. Practical formation‐containment tracking for multiple autonomous surface vessels system
Song et al. Unmanned aerial vehicle coverage path planning algorithm based on cellular automata
Zaidi et al. Distributed observer-based leader following consensus tracking protocol for a swarm of drones
Solana et al. Multi-robot path planning with maintenance of generalized connectivity
CN114610072A (zh) 一种无人机集群系统分布式时变编队跟踪控制方法及系统
Al Hilli et al. Optimal path finding in stochastic quasi-dynamic environments using particle swarm optimization
Conde et al. Time-varying formation controllers for unmanned aerial vehicles using deep reinforcement learning
Su et al. A robust adaptive formation control methodology for networked multi-UAV systems with applications to cooperative payload transportation
CN109491381B (zh) 基于观测器的多移动机器人自适应编队跟踪控制方法
Guo et al. Collision-free formation tracking control for multiple quadrotors under switching directed topologies: Theory and experiment
Li et al. A warm-started trajectory planner for fixed-wing unmanned aerial vehicle formation
Bhatt et al. Efficient constrained multi-agent trajectory optimization using dynamic potential games
Bhowmick et al. A two‐loop group formation tracking control scheme for networked tri‐rotor UAVs using an ARE‐based approach
Ghommam et al. Distance‐Based Formation Control for Quadrotors with Collision Avoidance via Lyapunov Barrier Functions
Su et al. Properties of interconnected negative imaginary systems and extension to formation‐containment control of networked multi‐UAV systems with experimental validation results
Nishikawa et al. Coordination control design of heterogeneous swarm robots by means of task-oriented optimization
Song et al. Compositionality of linearly solvable optimal control in networked multi-agent systems
Li et al. Finite-time robust formation control of multiple aerial robotic vehicles with uncertainties and time-varying complex perturbations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant