CN115903842A - 一种多智能体编队控制方法、系统及电子设备 - Google Patents

一种多智能体编队控制方法、系统及电子设备 Download PDF

Info

Publication number
CN115903842A
CN115903842A CN202211653648.XA CN202211653648A CN115903842A CN 115903842 A CN115903842 A CN 115903842A CN 202211653648 A CN202211653648 A CN 202211653648A CN 115903842 A CN115903842 A CN 115903842A
Authority
CN
China
Prior art keywords
agent
current
formation
system model
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211653648.XA
Other languages
English (en)
Inventor
韩亮
曹慧
李晓多
任章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202211653648.XA priority Critical patent/CN115903842A/zh
Publication of CN115903842A publication Critical patent/CN115903842A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明提供的一种多智能体编队控制方法、系统及电子设备,属于多智能体编队控制技术领域。本发明构建多智能体系统模型;多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;确定多智能体系统模型的通信拓扑关系;确定多智能体系统模型的期望编队;根据多智能体系统模型、通信拓扑关系和期望编队,基于触发条件对多智能体系统进行时变控制。本发明通过设置触发条件能够使邻居智能体仅在触发条件被满足时进行通信,无需多智能体系统全局通信拓扑信息即可完成多智能体的编队控制,在保证编队控制准确性的同时,减轻了系统的通信压力。

Description

一种多智能体编队控制方法、系统及电子设备
技术领域
本发明涉及多智能体编队控制技术领域,特别是涉及一种多智能体编队控制方法、系统及电子设备。
背景技术
多智能体编队控制是当前多智能体系统研究的热点问题,多智能体编队控制指多个智能体组成的团队在向特定目标或方向运动的过程中,相互之间保持预定的几何形态的控制技术。多智能体编队控制在军事、航天和工业等多个领域具有广泛的应用,如实现移动机器人、无人机、潜艇、卫星、航天飞行器等运动载体的编队控制等。在军事领域中,多移动机器人采用合理的编队可以代替士兵执行恶劣或危险环境下的军事任务(如侦察、搜寻、排雷和巡逻等)。以侦察任务为例,单个机器人获取环境信息的能力通常有限,但如果多个机器人保持合理的队形,分工获取周围的环境信息,就有可能迅速准确地感知群体所在区域的环境信息,使群体的资源利用率比成员随机分布时更高。在航天领域,卫星编队不但可大大降低系统成本,提高系统的可靠性和生存能力,而且能够扩展和超越传统单个卫星的功能,完成许多单个航天器不可能完成的任务。在工业生产中,例如多机器人系统搬运大型物体时,对机器人的位置存在一定要求,以满足搬运过程中的稳定和负载平衡。
多智能体编队控制已有多种成熟的控制方法,与基于领导者-跟随者、基于行为以及基于虚拟结构的方法相比,基于一致性的编队控制方法具有更好的鲁棒性和扩展性,并且易于设计,因此当前受到世界研究人员的广泛关注,并取得了一些应用。在该方法中,智能体通过与邻居智能体的通信,获取其它智能体的状态信息,然后通过这些信息生成自身的控制指令,从而使得多智能体系统最后形成编队。但对该方法的现有研究中,通常认为多智能体之间的通信是连续不断的,且通常需要多智能体系统的全局通信拓扑信息,这在实际应用会受到很大的限制。首先,实际的通信设备受制于通信带宽,单位时间内发送的数据量是有上限值的,所以要求通信次数越少越好,否则容易造成通信阻塞或丢包,导致系统崩溃。此外,对于大规模编队,多智能体系统的全局通信拓扑信息较难获取且容易发生变化;全局通信拓扑信息的处理,例如通信拓扑拉普拉斯矩阵特征值的求取,需要占用大量的计算资源,而单个智能体的计算资源是有限的。因此当前基于一致性的编队控制方法并不能很好的适用于实际系统。
发明内容
本发明的目的是提供一种多智能体编队控制方法、系统及电子设备,能够使邻居智能体仅在触发条件被满足时进行通信,无需多智能体系统全局通信拓扑信息即可完成多智能体的编队控制,在保证编队控制准确性的同时,减轻了系统的通信压力。
为实现上述目的,本发明提供了如下方案:
一种多智能体编队控制方法,包括:
构建多智能体系统模型;所述多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;
确定所述多智能体系统模型的通信拓扑关系;
确定多智能体系统模型的期望编队;
根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制。
可选的,所述多智能体系统模型为:
Figure BDA0004011532200000021
其中,xi(t)表示第i个智能体的运动状态,
Figure BDA0004011532200000022
表示n维欧式空间;ui(t)表示第i个智能体的控制输入,
Figure BDA0004011532200000023
表示m维欧式空间;yi(t)表示第i个智能体的传感器输出信息,
Figure BDA0004011532200000024
表示q维欧式空间;
Figure BDA0004011532200000025
表示第i个智能体的运动状态xi(t)的导数;A表示智能体的第一系统参数矩阵;
Figure BDA0004011532200000026
表示n×n维实矩阵;B表示智能体的第二系统参数矩阵;
Figure BDA0004011532200000027
表示n×m维实矩阵;C表示智能体的第三系统参数矩阵;
Figure BDA0004011532200000028
表示q×n维实矩阵;n表示第i个智能体的运动状态xi(t)的维数;m表示第i个智能体的控制输入ui(t)的维数;q表示第i个智能体的传感器输出信息yi(t)的维数。
可选的,所述根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制,包括:
确定任一智能体为当前智能体;
确定当前智能体对应的任一邻居智能体为当前邻居智能体;邻居智能体为与当前智能体存在通信关系的智能体;
根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,确定当前智能体和当前邻居智能体的触发函数值;
判断所述触发函数值是否满足触发条件,得到判断结果;所述触发条件为所述触发函数值大于动态阈值;
若所述判断结果为是,则当前邻居智能体与当前智能体通信,并获取当当前智能体的全状态信息作为当前邻居智能体对当前智能体的状态估计值;当前智能体的全状态信息是由当前智能体确定的;
若所述判断结果为否,则获取当前邻居智能体对当前智能体的状态估计值;
根据当前智能体的状态估计值控制当前邻居智能体的运动状态。
可选的,所述根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,确定当前智能体和当前邻居智能体的触发函数值,包括:
获取当前智能体的全状态信息;
根据当前智能体的全状态信息、当前智能体的的期望编队信息和当前邻居智能体对当前智能体的状态估计值,确定当前智能体的观测误差;
获取当前智能体与当前邻居智能体的自适应耦合权重;
根据所述当前智能体的观测误差,以及当前智能体与当前邻居智能体的自适应耦合权重,利用触发函数确定当前智能体和当前邻居智能体的触发函数值。
可选的,所述触发函数为:
Figure BDA0004011532200000031
其中,
Figure BDA0004011532200000041
表示第i个智能体和第j个智能体的触发函数值;
Figure BDA0004011532200000042
表示第i个智能体的观测误差;cij(t)表示第i个智能体与第j个智能体的自适应耦合权重;
Figure BDA0004011532200000043
)表示状态观测值差值;γija表示第一可调参数;aij[表示权重矩阵
Figure BDA0004011532200000044
中第i行第j列的元素值;
Figure BDA0004011532200000045
Γ表示第i个智能体的观测误差
Figure BDA0004011532200000046
的转置;
Figure BDA0004011532200000047
示第二可调参数;
Figure BDA0004011532200000048
表示状态观测值差值
Figure BDA0004011532200000049
)的转置;
Figure BDA00040115322000000410
示反馈增益矩阵;
Figure BDA00040115322000000411
表示n×n维实矩阵;∈ij表示第三可调参数。
一种多智能体编队控制系统,包括:
多智能体系统模型构建模块,用于构建多智能体系统模型;所述多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;
通信拓扑关系确定模块,用于确定所述多智能体系统模型的通信拓扑关系;
期望编队确定模块,用于确定多智能体系统模型的期望编队;
时变控制控制模块,用于根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制。
一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行所述的一种多智能体编队控制方法。
可选的,所述存储器为可读存储介质。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明的目的是提供一种多智能体编队控制方法、系统及电子设备,构建多智能体系统模型;多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;确定多智能体系统模型的通信拓扑关系;确定多智能体系统模型的期望编队;根据多智能体系统模型、通信拓扑关系和期望编队,基于触发条件对多智能体系统进行时变控制。本发明通过设置触发条件能够使邻居智能体仅在触发条件被满足时进行通信,无需多智能体系统全局通信拓扑信息即可完成多智能体的编队控制,在保证编队控制准确性的同时,减轻了系统的通信压力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1中多智能体编队控制方法流程图;
图2为本发明实施例1中多智能体通信拓扑结构示意图;
图3为本发明实施例1中0-30s内各智能体通信触发时刻示意图;
图4为本发明实施例1中0-30s内自适应耦合权重变化曲线图;
图5为本发明实施例1中0-30s内动态阈值变化曲线图;
图6为本发明实施例1中0-30s内编队误差变化曲线图;
图7为本发明实施例1中0-30s内各智能体位置轨迹图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种多智能体编队控制方法、系统及电子设备,能够使邻居智能体仅在触发条件被满足时进行通信,无需多智能体系统全局通信拓扑信息即可完成多智能体的编队控制,在保证编队控制准确性的同时,减轻了系统的通信压力。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
如图1所示,本实施例提供了一种多智能体编队控制方法,包括:
步骤101:构建多智能体系统模型;多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出。多智能体系统由N个智能体组成,第i个智能体模型为:
Figure BDA0004011532200000051
其中,xi(t)表示第i个智能体的运动状态,
Figure BDA0004011532200000061
表示n维欧式空间;ui(t)表示第i个智能体的控制输入,
Figure BDA0004011532200000062
表示m维欧式空间;yi(t)表示第i个智能体的传感器输出信息,
Figure BDA0004011532200000063
表示q维欧式空间;
Figure BDA0004011532200000064
表示第i个智能体的运动状态xi(t)的导数;A表示智能体的第一系统参数矩阵;
Figure BDA0004011532200000065
表示n×n维实矩阵;B表示智能体的第二系统参数矩阵;
Figure BDA0004011532200000066
表示n×m维实矩阵;C表示智能体的第三系统参数矩阵;
Figure BDA0004011532200000067
表示q×n维实矩阵;n表示第i个智能体的运动状态xi(t)的维数;m表示第i个智能体的控制输入ui(t)的维数;q表示第i个智能体的传感器输出信息yi(t)的维数。A,B和C均由智能体自身决定,且满足(A,B)可稳定,(A,C)可检测。
步骤102:确定多智能体系统模型的通信拓扑关系;通信拓扑关系如图2所示。
多智能体系统通过智能体之间的互相通信来获取其它智能体的状态量,这种通信关系可以用代数图
Figure BDA0004011532200000068
来表示,通信拓扑图
Figure BDA0004011532200000069
是无向连通图。假设多智能体系统中含有N个智能体,每个智能体分别用一个节点来表示。节点间的通信关系用权重矩阵
Figure BDA00040115322000000610
来表示,如节点i能够收到节点j的信息,则称节点j为节点i的一个邻居,令aij=1,否则aij=0。节点i的入度定义为
Figure BDA00040115322000000611
其中
Figure BDA00040115322000000612
表示节点i的邻居集合。定义入度矩阵为
Figure BDA00040115322000000613
通信图
Figure BDA00040115322000000614
的拉普拉斯矩阵
Figure BDA00040115322000000615
定义为
Figure BDA00040115322000000616
的特征值表示为λi,i=1,...,N,满足0=λ1≤λ2≤…≤λN
步骤103:确定多智能体系统模型的期望编队。
步骤104:根据多智能体系统模型、通信拓扑关系和期望编队,基于触发条件对多智能体系统进行时变控制。
例如,步骤104,包括:
步骤1041:确定任一智能体为当前智能体.
步骤1042:确定当前智能体对应的任一邻居智能体为当前邻居智能体;邻居智能体为与当前智能体存在通信关系的智能体。
步骤1043:根据多智能体系统模型、通信拓扑关系和期望编队,确定当前智能体和当前邻居智能体的触发函数值。
步骤1043包括:
步骤10431:获取当前智能体的全状态信息。
步骤10432:根据当前智能体的全状态信息、当前智能体的的期望编队信息和当前邻居智能体对当前智能体的状态估计值,确定当前智能体的观测误差。
步骤10433:获取当前智能体与当前邻居智能体的自适应耦合权重。
步骤10434:根据当前智能体的观测误差,以及当前智能体与当前邻居智能体的自适应耦合权重,利用触发函数确定当前智能体和当前邻居智能体的触发函数值。触发函数为:
Figure BDA0004011532200000071
其中,
Figure BDA0004011532200000072
表示第i个智能体和第j个智能体的触发函数值;(
Figure BDA0004011532200000073
表示第i个智能体的观测误差;cij(t)表示第i个智能体与第j个智能体的自适应耦合权重;
Figure BDA0004011532200000074
)表示状态观测值差值;γija表示第一可调参数;aij[表示权重矩阵
Figure BDA0004011532200000075
中第i行第j列的元素值;
Figure BDA0004011532200000076
表示第i个智能体的观测误差
Figure BDA0004011532200000077
的转置;
Figure BDA0004011532200000078
表示第二可调参数;
Figure BDA0004011532200000079
表示状态观测值差值
Figure BDA00040115322000000710
)的转置;
Figure BDA00040115322000000711
表示反馈增益矩阵;
Figure BDA00040115322000000712
表示n×n维实矩阵;∈ij表示第三可调参数。
步骤1044:判断触发函数值是否满足触发条件,得到判断结果;触发条件为触发函数值大于动态阈值。若判断结果为是,则执行步骤1045;若判断结果为否,则执行步骤1046。
步骤1045:当前邻居智能体与当前智能体通信,并获取当当前智能体的全状态信息作为当前邻居智能体对当前智能体的状态估计值;当前智能体的全状态信息是由当前智能体确定的。
步骤1046:获取当前邻居智能体对当前智能体的状态估计值。
步骤1047:根据当前智能体的状态估计值控制当前邻居智能体的运动状态。
具体的,根据上述步骤建立的多智能体系统模型以及构建的多智能体系统通信拓扑关系,并结合多智能体编队的约束条件来实现多智能体编队的时变控制,并根据整体编队的时变控制结果,分析整体编队误差来判断当前编队是否满足控制要求。
第i个智能体的编队为
Figure BDA0004011532200000081
其中hi(t)为分段连续可微函数。
定义编队误差
Figure BDA0004011532200000082
其中
Figure BDA0004011532200000083
Figure BDA0004011532200000084
表示中间变量(传感器输出信息(yi(t))与期望输出信息(hi(t))的差值);N表示步骤102中提到的多智能体系统中含有智能体的数量。
如果对于任意的初始状态
Figure BDA0004011532200000085
的值,编队误差e能够收敛到一个集合S:S={e:‖e‖≤s},其中s是一个常数,则称多智能体系统实现了期望的编队。
定义
Figure BDA0004011532200000086
满足hi(t)=Cφi(t),
Figure BDA0004011532200000087
为φi(t)的导数。
多智能体编队需要满足如下约束:对任一智能体i,存在函数τi(t)使得公式
Figure BDA0004011532200000088
成立。
根据得到的期望智能体编队,以及相应智能体编队的约束值来设计具体的单个智能体的控制过程:
步骤1.智能体i获取自身全状态信息,并通过动态事件触发机制判断该智能体i是否触发与邻居智能体j之间的通信:若不满足触发条件,则智能体j通过
Figure BDA0004011532200000089
对智能体i进行实时状态估计,在此期间无需与智能体i进行实时通信;若满足触发条件,则产生触发时刻
Figure BDA00040115322000000810
智能体j获取智能体i的在
Figure BDA00040115322000000811
时刻的状态信息,并对智能体i的状态信息进行更新;具体的,
Figure BDA00040115322000000812
指以自然常数e为底的指数函数;
Figure BDA00040115322000000813
Figure BDA00040115322000000814
时刻的θi(t)的值。
具体的:
Figure BDA00040115322000000815
其中,vi(t)表示观测器观测到的状态值,A,B和C均为智能体系统参数矩阵,F是观测器的反馈增益矩阵,将在后文介绍F的设计方法;
Figure BDA00040115322000000816
表示观测器观测到的状态值的导数。
步骤2.根据步骤1得到的智能体i的全状态信息vi(t)以及智能体i的期望编队信息φi(t)以及智能体i状态信息估计值
Figure BDA0004011532200000091
来计算从智能体i到智能体j的观测器误差
Figure BDA0004011532200000092
Figure BDA0004011532200000093
其中,θi(t)=vi(t)-φi(t),
Figure BDA0004011532200000094
Figure BDA0004011532200000095
邻居智能体之间传递的信息类型为vi(t)和φi(t),或者是它们之间的差值θi(t)。
步骤3.通过上述步骤4.2得到的误差
Figure BDA0004011532200000096
设计事件触发函数
Figure BDA0004011532200000097
Figure BDA0004011532200000098
其中,
Figure BDA0004011532200000099
òij≥1,
Figure BDA00040115322000000910
γij>0,矩阵
Figure BDA00040115322000000911
将在下文进行设计。
对任意邻居智能体i和j,
Figure BDA00040115322000000912
中的自适应耦合权重cij(t)的更新率如下:
Figure BDA00040115322000000913
其中,πij=πij>0,βij=βji>0,cij(0)=cji(0)>0。容易得到:cij(t)=cji(t),t≥0。πij为第四可调参数;βij为第五可调参数;
Figure BDA00040115322000000914
为自适应耦合权重cij(t)的导数。
步骤4.根据上述步骤3得到的事件触发函数
Figure BDA00040115322000000915
设计动态事件触发机制如下:
Figure BDA00040115322000000916
其中,
Figure BDA00040115322000000917
δij(t)表示动态阈值,由下式决定:
Figure BDA00040115322000000918
其中,αij>0,μij∈(0,1),δij(0)>0。也就是说,一旦触发函数
Figure BDA00040115322000000919
的值超过动态阈值δij(t)的值,即产生下一个触发时刻
Figure BDA0004011532200000101
的值,智能体i向智能体j传递自身信息,智能体j更新智能体i的状态值;αij、μij和γij均表示可调参数;
Figure BDA0004011532200000102
为动态阈值δij(t)的导数。
步骤5.根据上述步骤1-步骤4设计的事件触发通信机制,设计单智能体控制协议:
Figure BDA0004011532200000103
其中,
Figure BDA0004011532200000104
是控制器的反馈增益矩阵,将在下文进行设计,τi(t)是在中定义的编队补偿输入。
步骤6为了确定矩阵F,Γ和K的值,引入两个满足以下条件的正定矩阵P>0和Q>0:
Figure BDA0004011532200000105
其中,σ1、σ2和σ3均表示可调参数
Figure BDA0004011532200000106
σ2>0,σ3>0;矩阵F,Γ和K的值分别设计为:
Figure BDA0004011532200000107
Γ=PBBTP,以及K=BTP;In为n维单位矩阵。
通过上述设计的全分布式控制协议,多智能体系统可以在不需要全局通信拓扑的情况下,利用通过动态事件触发机制获取的邻居节点信息实现期望编队,可以更好地应用于实际系统。
考虑由6个智能体组成的系统,系统的通信拓扑结构如图2所示。智能体系统矩阵如下所示:
Figure BDA0004011532200000108
I2为2维单位矩阵,选取σ1=16,σ2=2,σ3=2.5,解中方程与不等式可得矩阵F,Γ和K的值如下:
Figure BDA0004011532200000111
Figure BDA0004011532200000112
Figure BDA0004011532200000113
第i个智能体的编队φi(t)设计如下:
Figure BDA0004011532200000114
其中,r=2m和ω=0.1rad/s分别为期望的圆形编队的半径和角速度。
触发时间序列
Figure BDA0004011532200000115
由动态事件触发机制-决定,其中,γij=1,òij=1,ιij=0.24,αij=1.5,μij=0.6,πij=0.2,βij=2。仿真步长设置为T=0.005s,通过仿真得到多智能体系统30s内的运动过程。图3表示0-30s内邻居智能体之间的通信触发时刻,其中纵坐标表示触发时刻,可以看到系统的通信次数大幅降低;图4和图5分别表示0-30s内自适应耦合权重cij(t)和动态阈值δij(t)的变化曲线;图6表示0-30s内多智能体系统编队误差变化曲线,其中
Figure BDA0004011532200000116
图7表示0-30s内各智能体位置轨迹图,图7中agent表示代理;根据图3-图7可以看出多智能体系统实现了期望的时变编队构型。
本实施例提供的多智能体编队控制优点在于:全分布式的编队控制器,能够在不使用多智能体系统全局通信拓扑信息的情况下,实现对多智能体系统的编队控制,能够适应大规模编队时全局通信信息难以获取、智能体间的通信关系容易改变的问题,拓展算法的应用场景;动态事件触发通信机制的引入,使得智能体之间不需要进行连续通信,降低实际系统的通信量,减少发生通信阻塞和丢包的风险。综上,本发明技术方案适用于大规模编队系统,拓展了算法应用场景,动态事件触发机制的引入降低了智能体之间的通信需求,使得多智能体系统编队算法更加符合实际系统,具有更好的实用性。关
实施例2
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供了一种多智能体编队控制系统,包括:
多智能体系统模型构建模块,用于构建多智能体系统模型;多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出。
通信拓扑关系确定模块,用于确定多智能体系统模型的通信拓扑关系。
期望编队确定模块,用于确定多智能体系统模型的期望编队。
时变控制控制模块,用于根据多智能体系统模型、通信拓扑关系和期望编队,基于触发条件对多智能体系统进行时变控制。
实施例3
本实施例提供了一种电子设备,包括存储器及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行实施例1所述的一种多智能体编队控制方法。其中,存储器为可读存储介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种多智能体编队控制方法,其特征在于,包括:
构建多智能体系统模型;所述多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;
确定所述多智能体系统模型的通信拓扑关系;
确定多智能体系统模型的期望编队;
根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制。
2.根据权利要求1所述的一种多智能体编队控制方法,其特征在于,所述多智能体系统模型为:
Figure FDA0004011532190000011
其中,xi(t)表示第i个智能体的运动状态,
Figure FDA0004011532190000012
表示n维欧式空间;ui(t)表示第i个智能体的控制输入,
Figure FDA0004011532190000013
表示m维欧式空间;yi(t)表示第i个智能体的传感器输出信息,
Figure FDA0004011532190000014
表示q维欧式空间;
Figure FDA0004011532190000015
表示第i个智能体的运动状态xi(t)的导数;A表示智能体的第一系统参数矩阵;
Figure FDA0004011532190000016
表示n×n维实矩阵;B表示智能体的第二系统参数矩阵;
Figure FDA0004011532190000017
表示n×m维实矩阵;C表示智能体的第三系统参数矩阵;
Figure FDA0004011532190000018
表示q×n维实矩阵;n表示第i个智能体的运动状态xi(t)的维数;m表示第i个智能体的控制输入ui(t)的维数;q表示第i个智能体的传感器输出信息yi(t)的维数。
3.根据权利要求1所述的一种多智能体编队控制方法,其特征在于,所述根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制,包括:
确定任一智能体为当前智能体;
确定当前智能体对应的任一邻居智能体为当前邻居智能体;邻居智能体为与当前智能体存在通信关系的智能体;
根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,确定当前智能体和当前邻居智能体的触发函数值;
判断所述触发函数值是否满足触发条件,得到判断结果;所述触发条件为所述触发函数值大于动态阈值;
若所述判断结果为是,则当前邻居智能体与当前智能体通信,并获取当当前智能体的全状态信息作为当前邻居智能体对当前智能体的状态估计值;当前智能体的全状态信息是由当前智能体确定的;
若所述判断结果为否,则获取当前邻居智能体对当前智能体的状态估计值;
根据当前智能体的状态估计值控制当前邻居智能体的运动状态。
4.根据权利要求3所述的一种多智能体编队控制方法,其特征在于,所述根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,确定当前智能体和当前邻居智能体的触发函数值,包括:
获取当前智能体的全状态信息;
根据当前智能体的全状态信息、当前智能体的的期望编队信息和当前邻居智能体对当前智能体的状态估计值,确定当前智能体的观测误差;
获取当前智能体与当前邻居智能体的自适应耦合权重;
根据所述当前智能体的观测误差,以及当前智能体与当前邻居智能体的自适应耦合权重,利用触发函数确定当前智能体和当前邻居智能体的触发函数值。
5.根据权利要求4所述的一种多智能体编队控制方法,其特征在于,所述触发函数为:
Figure FDA0004011532190000021
其中,
Figure FDA0004011532190000022
表示第i个智能体和第j个智能体的触发函数值;
Figure FDA0004011532190000023
表示第i个智能体的观测误差;cij(t)表示第i个智能体与第j个智能体的自适应耦合权重;
Figure FDA0004011532190000024
)表示状态观测值差值;γija表示第一可调参数;aij[表示权重矩阵
Figure FDA0004011532190000025
中第i行第j列的元素值;
Figure FDA0004011532190000026
Γ表示第i个智能体的观测误差
Figure FDA0004011532190000027
的转置;-ιij表示第二可调参数;
Figure FDA0004011532190000028
Γ表示状态观测值差值
Figure FDA00040115321900000211
的转置;Γ表示反馈增益矩阵;
Figure FDA00040115321900000210
表示n×n维实矩阵;∈ij表示第三可调参数。
6.一种多智能体编队控制系统,其特征在于,包括:
多智能体系统模型构建模块,用于构建多智能体系统模型;所述多智能体系统模型用于描述多智能体系统中每个智能体的运动状态、控制输入和传感器输出;
通信拓扑关系确定模块,用于确定所述多智能体系统模型的通信拓扑关系;
期望编队确定模块,用于确定多智能体系统模型的期望编队;
时变控制控制模块,用于根据所述多智能体系统模型、所述通信拓扑关系和所述期望编队,基于触发条件对多智能体系统进行时变控制。
7.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至5中任一项所述的一种多智能体编队控制方法。
8.根据权利要求7所述的一种电子设备,其特征在于,所述存储器为可读存储介质。
CN202211653648.XA 2022-12-22 2022-12-22 一种多智能体编队控制方法、系统及电子设备 Pending CN115903842A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211653648.XA CN115903842A (zh) 2022-12-22 2022-12-22 一种多智能体编队控制方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211653648.XA CN115903842A (zh) 2022-12-22 2022-12-22 一种多智能体编队控制方法、系统及电子设备

Publications (1)

Publication Number Publication Date
CN115903842A true CN115903842A (zh) 2023-04-04

Family

ID=86474649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211653648.XA Pending CN115903842A (zh) 2022-12-22 2022-12-22 一种多智能体编队控制方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN115903842A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117850325A (zh) * 2024-03-07 2024-04-09 南京邮电大学 动态事件触发的多机器人一致性协同控制系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117850325A (zh) * 2024-03-07 2024-04-09 南京邮电大学 动态事件触发的多机器人一致性协同控制系统和方法
CN117850325B (zh) * 2024-03-07 2024-05-28 南京邮电大学 动态事件触发的多机器人一致性协同控制系统和方法

Similar Documents

Publication Publication Date Title
CN109379125B (zh) 一种多智能体编队控制方法及系统
CN113342037B (zh) 具有输入饱和的多旋翼无人机时变编队控制方法及系统
CN111638726B (zh) 基于事件触发通信的多无人机编队一致性控制方法
CN110658821B (zh) 一种多机器人抗干扰分组时变编队控制方法及系统
CN111665853B (zh) 一种面向规划控制联合优化的无人车辆运动规划方法
Yang et al. Event-triggered finite-time formation control for multiple unmanned aerial vehicles with input saturation
Yang et al. Formation control of multiple underwater vehicles subject to communication faults and uncertainties
Hameduddin et al. Nonlinear generalised dynamic inversion for aircraft manoeuvring control
CN112947086B (zh) 一种无人机和无人车组成的异构多智能体系统编队控制中执行器故障的自适应补偿方法
CN112631335A (zh) 一种基于事件触发的多四旋翼无人机固定事件编队方法
CN115903842A (zh) 一种多智能体编队控制方法、系统及电子设备
KR102578263B1 (ko) 샘플링 데이터에 기반한 농업용 멀티 에이전트 시스템 일관성 분산 제어 방법
CN111983923B (zh) 一种受限多智能体系统编队控制方法、系统及设备
Ali et al. A Leader‐Follower Formation Control of Multi‐UAVs via an Adaptive Hybrid Controller
Dou et al. Distributed finite‐time formation control for multiple quadrotors via local communications
CN111439392B (zh) 一种航天器编队位置协同控制方法
CN116794987A (zh) 基于事件触发控制的异构多智能体系统一致性控制方法
Zhao et al. A Kalman–Koopman LQR control approach to robotic systems
CN114265315A (zh) 异构线性集群系统时变输出编队跟踪控制方法及系统
CN111596688A (zh) 基于连续通信的多无人机编队一致性控制方法
CN113515066B (zh) 一种非线性多智能体系统动态事件触发控制方法
CN115047769A (zh) 一种基于约束跟随的无人作战平台避障-到达控制方法
CN111216146B (zh) 一种适用于网络化机器人系统的二部一致性量化控制方法
Chen et al. Extended‐state‐observer‐based dynamic surface control of flexible‐joint robot systems with input saturation
Dong et al. Event-based formation control of multiple quadrotors on SO (3)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination