CN116047908A - 混合阶异构多智能体系统协同最优编队控制方法及设备 - Google Patents
混合阶异构多智能体系统协同最优编队控制方法及设备 Download PDFInfo
- Publication number
- CN116047908A CN116047908A CN202310067839.6A CN202310067839A CN116047908A CN 116047908 A CN116047908 A CN 116047908A CN 202310067839 A CN202310067839 A CN 202310067839A CN 116047908 A CN116047908 A CN 116047908A
- Authority
- CN
- China
- Prior art keywords
- agent
- control
- matrix
- heterogeneous multi
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开一种混合阶异构多智能体系统协同最优编队控制方法及设备,涉及多智能体编队控制技术领域。该混合阶异构多智能体系统协同最优编队控制方法,通过引入异构多智能体系统的通信拓扑模型以及采用构建好的协同最优编队控制协议,能够在混合阶异构多智能体系统完成协同编队的同时使性能指标最优。并且,本发明还引入了最优控制理论,能够进一步加快异构多智能体系统的状态变量随时间变化的收敛速度,极大地帮助系统快速达到期望队形状态。
Description
技术领域
本发明涉及多智能体编队控制技术领域,特别是涉及一种混合阶异构多智能体系统协同最优编队控制方法及设备。
背景技术
随着科技的快速发展,世界各军事大国高度重视无人作战系统协同配合能力。由于异构系统响应速度快、通信能力强及目标侦察精度高的特点,越来越受到各军事强国的青睐。在异构系统编队领域中,通常需要考虑智能体间的协同来完成任务。异构多智能体系统的协同编队问题是异构系统研究方向的一个重要分支。
在复杂多变的环境中,针对异构系统编队问题的基础上,还需要考虑如何使整个编队快速达到预期状态,即编队最优问题。此外,现有的研究对象大多基于同构智能体,即每个智能体的动力学模型是相同的。异构多智能体系统的组成可以大大提高在应用中的感知范围,在合作攻击等方面具有潜在的应用价值。但是现有技术中并没有一种能够使异构多智能体实现协同编队并可以快速地达到所期望的编队状态的控制技术。
发明内容
本发明的目的是提供一种混合阶异构多智能体系统协同最优编队控制方法及设备,能够使异构多智能体实现协同编队并快速地达到所期望的编队状态。
为实现上述目的,本发明提供了如下方案:
一种混合阶异构多智能体系统协同最优编队控制方法,包括:
构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵;
建立混合阶异构多智能体系统的动力学模型,并基于所述动力学模型构建各智能体的状态方程;
基于所述状态方程确定各智能体的状态控制参数;所述状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入;
基于所述状态控制参数确定各智能体的最优控制律;
基于所述最优控制律构建控制参数方程;
基于所述控制参数方程确定各智能体的控制参数;
基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议;
基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。
可选的,构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵,具体包括:
确定各智能体间的联系关系,并基于所述联系关系构建系统的通信拓扑模型;
以各智能体间存在的信息交换路径为边,以各智能体为顶点,结合所述通信拓扑模型确定邻接矩阵;
基于所述联系关系确定所述通信拓扑模型中每一顶点的度;
基于所述通信拓扑模型中每一顶点的度构建度矩阵;
基于所述度矩阵和所述邻接矩阵确定所述混合阶异构多智能体系统的拉普拉斯矩阵。
可选的,基于所述状态控制参数确定各智能体的最优控制律,具体包括:
构建各智能体的性能指标;
基于各智能体的状态变量和各智能体的控制输入确定各智能体性能指标的对称非负定矩阵和各智能体性能指标的对称正定矩阵;
基于各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵、所述对称非负定矩阵和所述对称正定矩阵确定黎卡提方程的最优解;
基于所述黎卡提方程的最优解、所述对称正定矩阵、各智能体的状态变量以及各智能体的控制输入系数矩阵确定各智能体的最优控制律。
可选的,基于所述控制参数方程确定各智能体的控制参数,具体包括:
采用所述控制参数方程根据各智能体的控制输入系数矩阵、所述对称正定矩阵和黎卡提方程的解确定各智能体的控制参数。
可选的,基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议,具体包括:
获取混合阶异构多智能体系统的初始状态变量和期望状态变量;
基于所述初始状态变量和所述期望状态变量确定误差状态变量,将所述误差状态变量作为误差向量;
基于各智能体的状态变量引入转换矩阵,并基于所述控制参数和所述拉普拉斯矩阵构建以所述误差向量为变量的协同最优编队控制协议。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的混合阶异构多智能体系统协同最优编队控制方法,通过引入异构多智能体系统的通信拓扑模型以及采用构建好的协同最优编队控制协议,能够在混合阶异构多智能体系统完成协同编队的同时使性能指标最优。并且,本发明还引入了最优控制理论,能够进一步加快异构多智能体系统的状态变量随时间变化的收敛速度,极大地帮助系统快速达到期望队形状态。
对应于上述提供的混合阶异构多智能体系统协同最优编队控制方法,本发明还提供了一种混合阶异构多智能体系统协同最优编队控制设备,该设备包括:
存储器,用于存储计算机软件程序;
处理器,与所述存储器连接,用于调取并执行所述计算机软件程序,以实施上述提供的混合阶异构多智能体系统协同最优编队控制方法。
可选的,所述处理器包括:
拉普拉斯矩阵确定模块,用于构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵;
状态方程构建模块,用于建立混合阶异构多智能体系统的动力学模型,并基于所述动力学模型构建各智能体的状态方程;
状态控制参数确定模块,用于基于所述状态方程确定各智能体的状态控制参数;所述状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入;
最优控制律确定模块,用于基于所述状态控制参数确定各智能体的最优控制律;
控制参数方程构建模块,用于基于所述最优控制律构建控制参数方程;
控制参数确定模块,用于基于所述控制参数方程确定各智能体的控制参数;
协同最优编队控制协议构建模块,用于基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议;
编队控制模块,用于基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。
可选的,所述存储器为计算机可读存储介质。
因本发明提供的这一设备实现的技术效果与上述提供的混合阶异构多智能体系统协同最优编队控制方法实现的技术效果相同,故在此不再进行赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的混合阶异构多智能体系统协同最优编队控制方法的流程图;
图2为本发明实施例提供的混合阶异构多智能体系统的通信拓扑模型图;
图3为本发明实施例提供的混合阶异构多智能体系统编队仿真结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种混合阶异构多智能体系统协同最优编队控制方法及设备,能够使异构多智能体实现协同编队并快速地达到所期望的编队状态。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的混合阶异构多智能体系统协同最优编队控制方法,包括:
步骤100:构建混合阶异构多智能体系统的通信拓扑模型,并基于通信拓扑模型确定混合阶异构多智能体系统的拉普拉斯矩阵。该步骤的实施过程可以是:
步骤100-1:确定各智能体间的联系关系,并基于联系关系构建系统的通信拓扑模型。
步骤100-2:以各智能体间存在的信息交换路径为边,以各智能体为顶点,结合通信拓扑模型确定邻接矩阵。
步骤100-3:基于联系关系确定通信拓扑模型中每一顶点的度。
步骤100-4:基于通信拓扑模型中每一顶点的度构建度矩阵。
步骤100-5:基于度矩阵和邻接矩阵确定混合阶异构多智能体系统的拉普拉斯矩阵。
步骤101:建立混合阶异构多智能体系统的动力学模型,并基于动力学模型构建各智能体的状态方程。
步骤102:基于状态方程确定各智能体的状态控制参数。状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入。
步骤103:基于状态控制参数确定各智能体的最优控制律。该步骤的实施过程可以为:
步骤103-1:构建各智能体的性能指标。
步骤103-2:基于各智能体的状态变量和各智能体的控制输入确定各智能体性能指标的对称非负定矩阵和各智能体性能指标的对称正定矩阵。
步骤103-3:基于各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵、对称非负定矩阵和对称正定矩阵确定黎卡提方程的最优解。
步骤103-4:基于黎卡提方程的最优解、对称正定矩阵、各智能体的状态变量以及各智能体的控制输入系数矩阵确定各智能体的最优控制律。
步骤104:基于最优控制律构建控制参数方程。
步骤105:基于控制参数方程确定各智能体的控制参数。例如,采用控制参数方程根据各智能体的控制输入系数矩阵、对称正定矩阵和黎卡提方程的解确定各智能体的控制参数。
步骤106:基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。该步骤可以是基于以下步骤实现:
步骤106-1:获取混合阶异构多智能体系统的初始状态变量和期望状态变量。
步骤106-2:基于初始状态变量和期望状态变量确定误差状态变量,将误差状态变量作为误差向量。
步骤106-3:基于各智能体的状态变量引入转换矩阵,并基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。
步骤107:基于协同最优编队控制协议控制各智能体实现混合阶异构多智能体系统编队。
下面以对由3个无人机、3个水面无人器和3个水下无人器组成的混合阶异构多智能体系统进行协同最优编队控制为例,对本发明上述提供的混合阶异构多智能体系统协同最优编队控制方法的具体实施过程和优点进行说明,在实际应用过程中,混合阶异构多智能体系统的具体组成和各组成智能体的个数不限于此。
该实施例中,混合阶异构多智能体系统协同最优编队控制方法的实施过程为:
步骤S1:构建异构系统的通信拓扑,确定系统的拉普拉斯矩阵L。
在步骤S1中,构建异构系统的通信拓扑,确定系统的拉普拉斯矩阵L。混合阶异构系统的通信模型是反映系统之间的关系,知道各智能体之间有无关联,不同的拓扑结构所表示的系统关系是不一样的,通过通信拓扑可以得到拉普拉斯矩阵,拓扑结构可以用图G表示为:G=(V,E,A),顶点和边的集合分别常用V和E表示。其中,顶点集V和边集E又可以分别表示为顶点vi和边ei的集合,即:V={v1,v2,…vn},E={e1,e2,…em}。对于顶点集V中的每个元素,称其为节点,边E={e1,e2,…em}表示智能体间存在信息交换,当构成边eij的顶点(vi,vj)为无序二元组时,边eij称作无向边,顶点vi,vj分别称为边eij的端点,当边为无向边时,顶点vi的度表示与vi相连的边的数量,常用符号deg(vi)表示,定义顶点的度为:度矩阵D为对角矩阵,有:D=diag(d1,d2,…dn),A=[aij]为拓扑图的邻接矩阵,表示智能体间的通信权重,邻接矩阵A是一个n×n的0-1矩阵,当vi和vj相邻时第(i,j项是1,当vi和vj不是相邻时第(i,j)项是0,aij表示第i个节点与第j个节点的联系关系,若第i个节点与第j个节点有联系则aij为1,若节点之间没有联系则aij为0,在本发明中第i个节点与第j个节点表示各个多智能体,以本发明为例,无人机1与无人机2是相互之间有联系,则a12=a21=1。无人机1与无人机3是相互之间有联系,则a13=a31=1。无人机2与无人机3是相互之间有联系,则a23=a32=1。无人机1与水面无人器1是相互有联系,则a14=a41=1。无人机机2与水面无人器2是相互有联系,则a52=a25=1。无人机3与水面无人器3是相互有联系,则a36=a63=1。水面无人器1向水面无人器2传递信息,则a54=1。水面无人器2向水面无人器3传递信息,则a65=1。水面无人器3向水面无人器1传递信息,则a46=1。水下无人器1与水下无人器2、水下无人器3相互之间有联系,则a78=a87=1,a89=a98=1,a79=a97=1。水下无人器1与水面无人器1、水下下无人器2与水面无人器2、水下无人器3与水面无人器3相互之间是有联系的,则a47=a74=1,a58=a85=1,a69=a96=1。其它的aij为0,表示智能体之间无联系关系,通过系统的通信模型自然而然的得到了拉普拉斯矩阵,系统的拉普拉斯矩阵L根据上述得到的D与A定义为:L=D-A。根据构建的如图2所示的通信拓扑模型,本发明的邻接矩阵A为:
度矩阵D为:
相应的拉普拉斯矩阵L为:
步骤S2:建立多智能体系统的动力学模型得出状态方程(参见式(2)、式(4)及式(6)),最终,在状态方程式中得到无人机状态变量XA1、水面无人器状态变量XS1、水下无人器状态变量XU1、无人机状态变量系数矩阵AA1、水面无人器状态变量系数矩阵AS1、水下无人器状态变量系数矩阵AU1、无人机控制输入系数矩阵BA1、水面无人器控制输入系数矩阵BS1、水下无人器控制输入系数矩阵BU1、无人机控制输入UA1、水面无人器控制输入US1、水下无人器控制输入UU1。
在步骤S2中,分别建立系统的动力学模型及状态方程如下:
其中,高阶无人机动力学模型为:
式中,g是重力加速度。x,y,z是无人机在三个坐标系中的位置,是无人机在三个地坐标系中的加速度,φ,θ,分别为无人机的横滚角、俯仰角和偏航角。分别为无人机的横滚角加速度、俯仰角加速度和偏航角加速度,fz是高度方向上的升力,Mφ,Mθ,是在物体坐标的三个轴上的力矩。Ix,Iy,IZ是在物体坐标的三个轴上的力矩。
根据式(1)无人的动力学模型,无人机的位置坐标是三维即有三个变量,对应的位置为x,y,z,所对应的速度变量也应为三个,分别在x,y,z上对应的速度为:姿态角中的变量为三个分别是横滚角、俯仰角和偏航角,所对应的姿态角变化率中的变量也为三个,控制输入为三个变量,分别为对于单个无人机的变量共为十五个变量,将其写为状态方程:
二阶水面无人器的动力学模型为:
二阶水下无人器的动力学模型:
本步骤S2通过各智能体的动力学模型(式(1)、(3)和(5))构建了各智能体的状态方程(式(2)、(4)和(6)),其目的是在步骤S3中构建各智能体所对应的性能指标,进而通过黎卡提方程式得到参数,从而在步骤S4中求出控制参数。
步骤S3:确定各智能体的最优控制律及黎卡提方程。该步骤包括:
步骤S31:确定无人机、水面无人器、水下无人器的性能指标为J1、J2及J3,根据上述步骤S2所得到的无人机状态变量XA1、水面无人器状态变量XS1、水下无人器状态变量XU1、无人机控制输入UA1、水面无人器控制输入US1、水下无人器控制输入UU1代入到无人机、水面无人器、水下无人器的性能指标为J1、J2及J3,最后,确定合适维度的第一对称非负定矩阵Q1、第二对称非负定矩阵Q2、第三对称非负定矩阵Q3、第一对称正定矩阵R1、第二对称正定矩阵R2和第三对称正定矩阵R3。
其中,构建无人机性能指标为:
式中,Q1≥0,R1>0。为了便于工程应用,性能指标中的Q1,R1取为对角线型矩阵。
根据上述步骤S2中可知,无人机状态变量XA1中的变量为十二个,无人机控制输入UA1中的变量为三个,依据式(7)本实施例取Q1=2*I12,R1=5*I3。
构建水面无人器的性能指标为:
式中,Q2≥0,R2>0。为了便于工程应用,性能指标中的Q2,R2取为对角线型矩阵。
根据上述步骤S2中可知,水面无人器状态变量XS1中的变量为四个,水面无人器控制输入US1中的变量为两个,依据式(8)本实施例取Q2=5*I4,R2=3*I2;
构建水下无人器的性能指标为:
式中,Q3≥0,R3>0。为了便于工程应用,性能指标中的Q3和R3取为对角线型矩阵。
根据上述步骤S2中可知,水下无人器状态变量XU1中的变量为六个,水下无人器控制输入UU1中的变量为三个,依据式(9)本实施例取Q3=2*I6,R2=5*i3。
在步骤S31中,最终确定Q1、Q2、Q3、R1、R2及R3分别为:2*I12,5*I4,2*I6,5*I3,3*I2,5*I3。
步骤S32:通过步骤S31中的性能指标J1、J2及J3,当系统的性能指标达到最优时,得到无人机、水面无人器、水下无人器的最优控制律分别为 及同时得到黎卡提方程,根据步骤S2得到的AA1、AS1、AU1、BA1、BS1、BU1及步骤S31中获得的Q1、Q2、Q3、R1、R2及R3代入到黎卡提方程,最终获得无人机系统黎卡提方程的解PA、水面无人器系统黎卡提方程的解Ps及水下无人器系统黎卡提方程的解Pu。
对于无人机而言,当取Q1=diag[q11q21…]时,根据步骤S31中式(7)性能指标的第一部分可以表示为这一部分是系统在运动过程中跟踪误差的总度量。当取R1=diag[r11r12…],式(7)性能指标的第二部分可以表示为 这一部分是系统能量消耗的总度量。通过以上的分析,无人机系统满足误差变量趋于零及能量消耗最低时,此时的最优控制律为:
PA是黎卡提方程式的解:
对于水面无人器而言,当取Q2=diag[q21q22…]时,根据S31中式(8)性能指标的第一部分可以表示为这一部分是系统在运动过程中跟踪误差的总度量。当取R2=diag[r21r22…],式(8)性能指标的第二部分可以表示为 这一部分是系统能量消耗的总度量。通过以上的分析,水面无人器系统满足误差变量趋于零及能量消耗最低时,此时的最优控制律为:
Ps是黎卡提方程式的解:
对于水下无人器而言,当取Q3=diag[q31q32…]时,根据S31中式(9)性能指标的第一部分可以表示为这一部分是系统在运动过程中跟踪误差的总度量。当取R3=diag[r31r32…],式(9)性能指标的第二部分可以表示这一部分是系统能量消耗的总度量。通过以上的分析,水下无人器系统满足误差变量趋于零及能量消耗最低时,此时的最优控制律为:
Pu是黎卡提方程式的解:
根据步骤S2中的系统状态方程,将AA1和BA1代入步骤S32式(11)中,同时将上述步骤S31中所取的Q1和R1代入步骤S32式(11)中,将会获得PA。将步骤S2中的AS1和BS1代入步骤S32式(13)中,同时将上述步骤S31中所取的Q2和R2代入步骤S32式(13)中,将会获得PS。将步骤S2中的Au1和BU1代入步骤S32式(15)中,同时将上述步骤S31中所取的Q3和R3代入步骤S32式(15)中,将会获得Pu。
步骤S4:确定控制参数,依据上述步骤S32得到的最优控制律,获得控制参数方程,通过步骤S2中的BA1、BS1及BU1,步骤S31中的R1、R2及R3和步骤S32中的PA、Ps及Pu代入到控制参数方程中,最终,确定无人机系统的位置变量最优参数kα1、速度变量最优参数kα2、姿态角变量最优参数kα3、姿态变化率变量最优参数kα4、水面无人器系统的位置变量最优参数kβ1、速度变量最优参数kβ2,水下无人器系统的位置变量最优参数kγ1和速度变量最优参数kγ2。
具体的,在步骤S4中,基于上述步骤S32中得到的控制律分别为式(10)、(12)及(14),分别获得无人机控制参数方程K1、水面无人器控制参数方程K2及水下无人器控制参数方程K3分别为式(16)、(17)及(18):
根据上述步骤基于步骤S2中的BA1和步骤S3中的R1与PA代入式(16)中,从而得到:
根据上述步骤S2中的BS1和步骤S3中R2与PS代入式(17)中,从而得到:
根据上述步骤S2中的BU1和步骤S3中R3与Pu代入式(18)中,从而得到:
最后,确定的参数kα1,kα2,kα3,kα4,kβ1,kβ2,kγ1,kγ2分别为:2.3452,6.4707,7.7541,4.5835,0.4472,1.0461,0.7746,1.466。
步骤S5:设计协同最优编队控制协议。该步骤包括:
步骤S51:定义系统中的误差向量,首先定义系统的初始状态变量,其次定义期望状态变量,最终获得误差状态变量,具体的:
定义系统中的期望状态变量为:
定义误差状态变量为:
式中,PA,VA,ΩA,为无人机的位置、速度、姿态角、姿态角变化率的初始状态变量,PS,VS为水面无人器位置、速度的初始状态变量,PU,VU为水下无人器的位置、速度的初始状态变量,d(PA)、d(VA)、d(ΩA)、为无人机位置、速度、姿态角、姿态角变化率的期望状态变量,d(PS)、d(VS为水面无人器位置、速度的期望状态变量,d(PU)、d(VU)为水下无人器位置、速度的期望状态变量,为无人机位置、速度、姿态角、姿态角变化率初始值与期望值的差值变量,为水面无人器位置、速度初始值与期望值的差值变量,为水下无人器位置、速度初始值与期望值的差值变量。
步骤S52:引入转换矩阵,根据步骤S2中PA1 T、PS1 T及PU1 T的变量维度分别是三维、二维及三维,进而引入转换矩阵mSA,mAS及mUS使系统中的变量维度达到一致,同时也为后续设计的控制协议中的运算考虑,mSA与PS1 T相乘会变为三维变量,mAS与PA1 T相乘会变为二维变量,mAS与PU1 T相乘会变为二维变量,mUS与PS1 T相乘会变为三维变量,依据步骤S1中获得的L可知,无人机与水下无人器没有通信联系,将无需考虑二者之间的转换关系,最终,无人机会转为与水面无人器相同的维度,水面无人器会转换为与无人机、水下无人器相同的维度。
在步骤S52中,基于步骤S2可知,异构系统中智能体的模型并不相同,因此协同的关键在于寻找模型之间的公共部分。无人机的飞行空间为三维空间,水面无人器为二维空间,水下无人器为三维空间。提出转换矩阵mSA,mAS,mUS来解决三者运动空间维度不匹配的问题。其中,
步骤S53所设计的控制协议是依据上述步骤S51的误差向量为变量,根据上述步骤S4得到的kα1,kα2,kα3,kα4,kβ1,kβ2,kγ1,kγ2的控制参数及步骤S1的拉普拉斯矩阵L确定协同最优编队控制协议。
在步骤S53中,设计了协同最优编队控制协议如下:
通过系统中的通信拓扑关系确定系统中的变量关系,根据S1中的拉普拉斯矩阵可知,式(16)无人机1中uia的表示无人机1的位置误差变量,表示与无人机1有联系的智能体中的位置误差变量,即无人机2、无人机3及水面无人器1的位置误差变量与无人机1位置误差变量差值。式(16)无人机2中uia的表示无人机2的位置误差变量,表示与无人机2有联系的智能体中的位置误差变量,即无人机1、无人机3及水面无人器2的位置误差变量与无人机2位置误差变量差值。式(16)无人机3中uia的表示无人机3的位置误差变量,表示与无人机3有联系的智能体中的位置误差变量,即无人机1、无人机2及水面无人器3的位置误差变量与无人机3位置误差变量差值。对于水面无人器系统式(17)及水下无人器系统式(18)亦如此,是步骤S51中第i个智能体的速度误差变量,是步骤S51中第j个智能体的速度误差变量,是步骤S51中误差变量的姿态角变量,是S51中误差变量的姿态角变化率变量。为步骤S1中的拉普拉斯矩阵元素,通过系统中的通信拓扑关系确定系统中的变量关系,根据S1中的拉普拉斯矩阵可知,式(16)、(17)及(18)中的无人机和水下无人器中的所有误差变量都没有联系,在本发明中,式(18)中水下无人器1的控制协议是水下无人器1与水面无人器1、水下无人器2和水下无人器3之间的联系。式(18)中水下无人器2的控制协议是水下无人器2与水面无人器2、水下无人器1和水下无人器3之间的联系。式(18)中水下无人器3的控制协议是水下无人器3与水面无人器3、水下无人器1和水下无人器2之间的联系。式(17)中水面无人器的控制协议与无人机和水下无人器都有联系,式(17)中水面无人器1的控制协议是水面无人器1与无人机1、水面无人器3及水下无人器1之间的联系。式(17)中水面无人器2的控制协议是水面无人器2与无人机2、水下无人器2及水面无人器1之间的联系。式(17)中水面无人器3的控制协议是水面无人器3与无人机3、水下无人器3及水面无人器2之间的联系。式(16)中的无人机只与水面无人器有联系,式(16)中无人机1与无人机2、无人机3及水面无人器1之间的联系。式(16)中无人机2与无人机1、无人机3及水面无人器2之间的联系。式(16)中无人机3与无人机1、无人机2及水面无人器之间的联系。mSA,mAS,mUS是步骤S52中的转换矩阵以便控制协议可以进行运算。
基于此,该实施例的混合阶异构多智能体系统编队仿真结果如图3所示,基于图3中体现的三个无人机、三个水面无人器及三个水下无人的实际轨迹曲线,能够说明,采用本发明提供的混合阶异构多智能体系统协同最优编队控制方法可以在第十秒,完成三角形编队并实现三个系统的协同控制。
此外,对应于上述提供的混合阶异构多智能体系统协同最优编队控制方法,本发明还提供了一种混合阶异构多智能体系统协同最优编队控制设备,该设备实质是一种电子设备,其主要包括:存储器和处理器。
存储器用于存储计算机软件程序。存储器可以是计算机可读存储介质。
处理器与存储器连接。处理器主要用于调取并执行计算机软件程序,以实施本发明上述提供的混合阶异构多智能体系统协同最优编队控制方法。
进一步,本发明采用的处理器包括:拉普拉斯矩阵确定模块、状态方程构建模块、状态控制参数确定模块、最优控制律确定模块、控制参数方程构建模块、控制参数确定模块、协同最优编队控制协议构建模块和编队控制模块。
其中,拉普拉斯矩阵确定模块用于构建混合阶异构多智能体系统的通信拓扑模型,并基于通信拓扑模型确定混合阶异构多智能体系统的拉普拉斯矩阵。
状态方程构建模块用于建立混合阶异构多智能体系统的动力学模型,并基于动力学模型构建各智能体的状态方程。
状态控制参数确定模块用于基于状态方程确定各智能体的状态控制参数。状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入。
最优控制律确定模块用于基于状态控制参数确定各智能体的最优控制律。
控制参数方程构建模块用于基于最优控制律构建控制参数方程。
控制参数确定模块用于基于控制参数方程确定各智能体的控制参数。
协同最优编队控制协议构建模块用于基于控制参数和拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议。
编队控制模块用于基于协同最优编队控制协议控制各智能体实现混合阶异构多智能体系统编队。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种混合阶异构多智能体系统协同最优编队控制方法,其特征在于,包括:
构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵;
建立混合阶异构多智能体系统的动力学模型,并基于所述动力学模型构建各智能体的状态方程;
基于所述状态方程确定各智能体的状态控制参数;所述状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入;
基于所述状态控制参数确定各智能体的最优控制律;
基于所述最优控制律构建控制参数方程;
基于所述控制参数方程确定各智能体的控制参数;
基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议;
基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。
2.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法,其特征在于,构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵,具体包括:
确定各智能体间的联系关系,并基于所述联系关系构建系统的通信拓扑模型;
以各智能体间存在的信息交换路径为边,以各智能体为顶点,结合所述通信拓扑模型确定邻接矩阵;
基于所述联系关系确定所述通信拓扑模型中每一顶点的度;
基于所述通信拓扑模型中每一顶点的度构建度矩阵;
基于所述度矩阵和所述邻接矩阵确定所述混合阶异构多智能体系统的拉普拉斯矩阵。
3.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法,其特征在于,基于所述状态控制参数确定各智能体的最优控制律,具体包括:
构建各智能体的性能指标;
基于各智能体的状态变量和各智能体的控制输入确定各智能体性能指标的对称非负定矩阵和各智能体性能指标的对称正定矩阵;
基于各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵、所述对称非负定矩阵和所述对称正定矩阵确定黎卡提方程的最优解;
基于所述黎卡提方程的最优解、所述对称正定矩阵、各智能体的状态变量以及各智能体的控制输入系数矩阵确定各智能体的最优控制律。
4.根据权利要求3所述的混合阶异构多智能体系统协同最优编队控制方法,其特征在于,基于所述控制参数方程确定各智能体的控制参数,具体包括:
采用所述控制参数方程根据各智能体的控制输入系数矩阵、所述对称正定矩阵和黎卡提方程的解确定各智能体的控制参数。
5.根据权利要求1所述的混合阶异构多智能体系统协同最优编队控制方法,其特征在于,基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议,具体包括:
获取混合阶异构多智能体系统的初始状态变量和期望状态变量;
基于所述初始状态变量和所述期望状态变量确定误差状态变量,将所述误差状态变量作为误差向量;
基于各智能体的状态变量引入转换矩阵,并基于所述控制参数和所述拉普拉斯矩阵构建以所述误差向量为变量的协同最优编队控制协议。
6.一种混合阶异构多智能体系统协同最优编队控制设备,其特征在于,包括:
存储器,用于存储计算机软件程序;
处理器,与所述存储器连接,用于调取并执行所述计算机软件程序,以实施如权利要求1-5任意一项所述的混合阶异构多智能体系统协同最优编队控制方法。
7.根据权利要求6所述的混合阶异构多智能体系统协同最优编队控制设备,其特征在于,所述处理器包括:
拉普拉斯矩阵确定模块,用于构建混合阶异构多智能体系统的通信拓扑模型,并基于所述通信拓扑模型确定所述混合阶异构多智能体系统的拉普拉斯矩阵;
状态方程构建模块,用于建立混合阶异构多智能体系统的动力学模型,并基于所述动力学模型构建各智能体的状态方程;
状态控制参数确定模块,用于基于所述状态方程确定各智能体的状态控制参数;所述状态控制参数包括:各智能体的状态变量、各智能体的状态变量系数矩阵、各智能体的控制输入系数矩阵和各智能体的控制输入;
最优控制律确定模块,用于基于所述状态控制参数确定各智能体的最优控制律;
控制参数方程构建模块,用于基于所述最优控制律构建控制参数方程;
控制参数确定模块,用于基于所述控制参数方程确定各智能体的控制参数;
协同最优编队控制协议构建模块,用于基于所述控制参数和所述拉普拉斯矩阵构建以误差向量为变量的协同最优编队控制协议;
编队控制模块,用于基于所述协同最优编队控制协议控制各智能体实现所述混合阶异构多智能体系统编队。
8.根据权利要求6所述的混合阶异构多智能体系统协同最优编队控制设备,其特征在于,所述存储器为计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310067839.6A CN116047908B (zh) | 2023-01-16 | 2023-01-16 | 混合阶异构多智能体系统协同最优编队控制方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310067839.6A CN116047908B (zh) | 2023-01-16 | 2023-01-16 | 混合阶异构多智能体系统协同最优编队控制方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116047908A true CN116047908A (zh) | 2023-05-02 |
CN116047908B CN116047908B (zh) | 2023-10-13 |
Family
ID=86113144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310067839.6A Active CN116047908B (zh) | 2023-01-16 | 2023-01-16 | 混合阶异构多智能体系统协同最优编队控制方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116047908B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076688A (zh) * | 2014-07-17 | 2014-10-01 | 山东省科学院海洋仪器仪表研究所 | 一种自主式水下航行器主从式协同控制方法 |
CN105629729A (zh) * | 2016-01-04 | 2016-06-01 | 浙江工业大学 | 一种基于线性自抗扰的网络化移动机器人轨迹跟踪控制方法 |
CN110286691A (zh) * | 2019-06-21 | 2019-09-27 | 东北大学秦皇岛分校 | 基于线性微分包含的多无人机编队控制方法 |
CN110673645A (zh) * | 2019-11-06 | 2020-01-10 | 中国人民解放军国防科技大学 | 一种无人机群的自动飞行控制方法、系统及存储介质 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
US20200278686A1 (en) * | 2019-02-28 | 2020-09-03 | University Of South Carolina | Iterative Feedback Motion Planning |
CN112596395A (zh) * | 2020-12-24 | 2021-04-02 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
EP3832420A1 (en) * | 2019-12-06 | 2021-06-09 | Elektrobit Automotive GmbH | Deep learning based motion control of a group of autonomous vehicles |
CN112947557A (zh) * | 2021-02-07 | 2021-06-11 | 河北科技大学 | 一种切换拓扑下的多智能体容错跟踪控制方法 |
CN113342015A (zh) * | 2021-06-15 | 2021-09-03 | 哈尔滨工程大学 | 一种分布式海域跨介质异构系统一致性编队方法 |
CN113721638A (zh) * | 2021-08-03 | 2021-11-30 | 哈尔滨工程大学 | 一种水域异构多无人器一致性编队方法 |
CN113867150A (zh) * | 2021-10-14 | 2021-12-31 | 北京工业大学 | 一种具有饱和输入的多智能体的事件驱动控制方法 |
CN114594786A (zh) * | 2022-01-25 | 2022-06-07 | 北京航空航天大学 | 基于离散系统的异构分布式集群系统编队控制算法 |
CN114721273A (zh) * | 2022-04-22 | 2022-07-08 | 湖南师范大学 | 一种固定时间收敛零化神经网络的多智能体编队控制方法 |
CN115220472A (zh) * | 2022-07-13 | 2022-10-21 | 南京航空航天大学 | 一种切换拓扑下空-地异构编队系统的容错控制方法 |
-
2023
- 2023-01-16 CN CN202310067839.6A patent/CN116047908B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104076688A (zh) * | 2014-07-17 | 2014-10-01 | 山东省科学院海洋仪器仪表研究所 | 一种自主式水下航行器主从式协同控制方法 |
CN105629729A (zh) * | 2016-01-04 | 2016-06-01 | 浙江工业大学 | 一种基于线性自抗扰的网络化移动机器人轨迹跟踪控制方法 |
US20200278686A1 (en) * | 2019-02-28 | 2020-09-03 | University Of South Carolina | Iterative Feedback Motion Planning |
CN110286691A (zh) * | 2019-06-21 | 2019-09-27 | 东北大学秦皇岛分校 | 基于线性微分包含的多无人机编队控制方法 |
CN110673645A (zh) * | 2019-11-06 | 2020-01-10 | 中国人民解放军国防科技大学 | 一种无人机群的自动飞行控制方法、系统及存储介质 |
EP3832420A1 (en) * | 2019-12-06 | 2021-06-09 | Elektrobit Automotive GmbH | Deep learning based motion control of a group of autonomous vehicles |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN112596395A (zh) * | 2020-12-24 | 2021-04-02 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
CN112947557A (zh) * | 2021-02-07 | 2021-06-11 | 河北科技大学 | 一种切换拓扑下的多智能体容错跟踪控制方法 |
CN113342015A (zh) * | 2021-06-15 | 2021-09-03 | 哈尔滨工程大学 | 一种分布式海域跨介质异构系统一致性编队方法 |
CN113721638A (zh) * | 2021-08-03 | 2021-11-30 | 哈尔滨工程大学 | 一种水域异构多无人器一致性编队方法 |
CN113867150A (zh) * | 2021-10-14 | 2021-12-31 | 北京工业大学 | 一种具有饱和输入的多智能体的事件驱动控制方法 |
CN114594786A (zh) * | 2022-01-25 | 2022-06-07 | 北京航空航天大学 | 基于离散系统的异构分布式集群系统编队控制算法 |
CN114721273A (zh) * | 2022-04-22 | 2022-07-08 | 湖南师范大学 | 一种固定时间收敛零化神经网络的多智能体编队控制方法 |
CN115220472A (zh) * | 2022-07-13 | 2022-10-21 | 南京航空航天大学 | 一种切换拓扑下空-地异构编队系统的容错控制方法 |
Non-Patent Citations (1)
Title |
---|
陈宗海: "《系统仿真技术及其应用》", 中国科学技术大学出版社, pages: 226 * |
Also Published As
Publication number | Publication date |
---|---|
CN116047908B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Adaptive formation control of networked robotic systems with bearing-only measurements | |
CN109582036B (zh) | 四旋翼无人机一致性编队控制方法 | |
CN109324636A (zh) | 基于二阶一致性和自抗扰的多四旋翼主从式协同编队控制方法 | |
CN115639841B (zh) | 一种基于鲁棒牵制的无人机集群编队控制系统及控制方法 | |
CN112947086B (zh) | 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法 | |
CN111522341A (zh) | 网络异构机器人系统的多时变编队跟踪控制方法及系统 | |
CN109254592B (zh) | 一种无人机队形变化控制方法及系统 | |
Yang et al. | Event-triggered finite-time formation control for multiple unmanned aerial vehicles with input saturation | |
CN112904723A (zh) | 非匹配干扰下的空地固定时间协同容错编队控制方法 | |
CN112859913B (zh) | 考虑输出约束的多四旋翼无人机姿态一致最优控制方法 | |
CN114237041B (zh) | 一种基于预设性能的空-地协同固定时间容错控制方法 | |
CN111208829A (zh) | 基于分布式预设时间状态观测器的多移动机器人编队方法 | |
CN113342015A (zh) | 一种分布式海域跨介质异构系统一致性编队方法 | |
CN109901394A (zh) | 基于分布式高阶滑模估计器的航天器姿态协同控制方法 | |
CN115639830A (zh) | 一种空地智能体协同编队控制系统及其编队控制方法 | |
Li et al. | Predefined-time formation control of the quadrotor-UAV cluster’position system | |
CN113268084B (zh) | 一种无人机编队智能容错控制方法 | |
CN116047908B (zh) | 混合阶异构多智能体系统协同最优编队控制方法及设备 | |
CN117452975A (zh) | 一种四旋翼无人机集群的保性能协同编队控制设计方法 | |
CN115981375B (zh) | 基于事件触发机制的多无人机时变编队控制器设计方法 | |
CN107807534B (zh) | 一种多轮式机器人自适应协同控制算法及控制系统 | |
CN115328200A (zh) | 基于状态估计的飞行器集群系统的一致性控制方法 | |
CN112327932B (zh) | 一种针对消防无人机编队的增量式pid控制方法 | |
CN111216146B (zh) | 一种适用于网络化机器人系统的二部一致性量化控制方法 | |
CN112327622B (zh) | 一种中性浮力机器人一致性容错控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |