CN114594786B - 基于离散系统的异构分布式集群系统编队控制算法 - Google Patents
基于离散系统的异构分布式集群系统编队控制算法 Download PDFInfo
- Publication number
- CN114594786B CN114594786B CN202210089495.4A CN202210089495A CN114594786B CN 114594786 B CN114594786 B CN 114594786B CN 202210089495 A CN202210089495 A CN 202210089495A CN 114594786 B CN114594786 B CN 114594786B
- Authority
- CN
- China
- Prior art keywords
- agent
- vector
- formation
- order
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 206
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 371
- 239000013598 vector Substances 0.000 claims abstract description 177
- 238000004891 communication Methods 0.000 claims abstract description 81
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000005755 formation reaction Methods 0.000 description 163
- 238000000034 method Methods 0.000 description 15
- 238000013461 design Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了基于离散系统的异构分布式集群系统编队控制算法,包括:构建多智能体系统的通信拓扑关系,多智能体系统包括多个二阶智能体和一阶智能体;分别构建二阶和一阶智能体的动力学模型和编队函数;每个智能体获取与其相邻智能体的状态向量和编队函数;获得每个二阶和一阶智能体的控制指令状态量;基于动力学模型、控制指令状态量和每个智能体k时刻的状态向量,获得每个智能体的k+1时刻的位置向量,根据每个智能体的k+1时刻的位置向量,获得智能体k+1时刻的状态向量和新的控制指令状态量,以维持编队控制。本发明利用离散时间系统,有效降低了多智能体系统间的通信量,控制两类智能体,使得多智能体系统编队算法更加符合实际系统。
Description
技术领域
本发明属于多智能体编队控制领域,更具体地,涉及一种基于离散系统的异构分布式集群系统编队控制算法及系统。
背景技术
多智能体控制是人们效仿自然界中群体现象而提出的问题。例如生物界昆虫、鸟和鱼群等协作捕食。共同抵御入侵者等行为,都显示出某种群体特质。随着嵌入式计算和通信能力的提高,以及分布式思想的发展,人们开始意识到多智能体系统的合作能够以更小的代价完成更复杂的任务。相比于单个智能体,多智能体系统,尤其是分布式多智能体系统,具有很多明显的优点。
多智能体编队控制是当前多智能体系统研究的热点问题,它指多个智能体组成的团队在向特定目标或方向运动的过程中,相互之间保持预定的几何形态。多智能体编队控制在抢险救灾、实时监控、协同运输等各个领域具有广泛的应用,如实现无人车、无人机、船只、卫星等运动载体的编队控制等。在地震、塌方、火灾搜救等难以确保救援人员安全的场景中,机器人可顺利进入,同时单个机器人获取环境信息的能力通常有限,但如果多个机器人保持合理的队形,分工获取周围的环境信息,就有可能迅速准确地感知群体所在区域的环境信息,使群体的资源利用率比成员随机分布时更高,及时感知搜救人员。同样的例子还有抢修通讯网络,无人机可以快速进入通信故障区域,通过采取合理的编队均匀分布在灾难区域中,作为用户设备和最近的地面基站连接的中转站,以更高的效率更安全的方式,代替抢修人员执行恶劣、危险环境下的抢险任务。在机场周边环境中,需要时刻保证对无证飞行器“黑飞”的监视,同时保证发现即拦截的能力,多智能体协同编队则可在保持传感器网络持续监视周边空域的前提下,以特定编队队形捕捉拦截黑飞。在工业生产中,例如多机器人系统搬运大型物体时,会对机器人的位置存在一定编队要求,以满足搬运过程中的稳定和负载平衡,在物流产业中,大仓库场景下的包裹分拣与运输对准确度和任务时间的要求更高,而多智能体编队则可通过协同运输的方式使物流过程更为标准化、有序与高效。
以上内容都是基于同构多智能体系统的研究,随着时代进一步发展,单一平台编队劣势初现,无人机负载能力低,观测精度低,无人车视觉范围小速度慢且通信能力弱,故而现今项目对多智能体系统的种类丰富度有了进一步的需求,要求多种类智能体协作,例如空地协同任务,建立无人机-无人车异构协同编队,通过空中与地面的协作和互补,这种编队方式能使多智能体系统完成单一平台无法完成的任务,如大片区域排查、地理勘测,跟踪追逃,也能取长补短,例如无人车可以作为无人机的移动加油站进而改善无人机续航能力,无人机可以共享信息增大无人车的侦测范围,但无人机和无人车的动力学结构不同,部分无人车的控制指令可以视为一阶智能体的速度,部分无人机的控制指令可以视为二阶智能体的加速度,控制指令作用的不同造成了多智能体控制协议的设计困难。
因此特别需要一种异构集群系统控制协议的设计方法。
多智能体编队控制已有多种成熟的控制方法,与基于领导者-跟随者、基于行为以及基于虚拟结构的方法相比,基于一致性的编队控制方法具有更好的鲁棒性和扩展性,并且易于设计,因此当前受到国内外研究人员的广泛关注,并取得了一些应用。在该方法中,智能体通过于邻居智能体的通信,获取其它智能体的状态信息,然后通过这些信息生成自身的控制指令,从而使得多智能体系统最后形成编队。但在对该方法的一般研究中,通常认为多智能体之间的通信是连续不断的,这在实际应用会受到很大的限制。首先,实际系统通过相关传感器采样才能获取自身的状态值,例如通过惯性测量单元、GPS等获取运动体的姿态、速度、位置等信息,而传感器都以一定的频率进行采样处理,所以实际系统一般只能获得有一定时间间隔的状态值,而不是连续任意时刻的状态值。另外,实际的通信设备受制于通信带宽,单位时间内发送的数据量是有上限值的,所以要求通信次数越少越好,否则容易造成通信阻塞或丢包,导致系统崩溃。因此连续系统的多智能体控制方法在适用于实际系统的过程中有着诸多局限。
因此,特别需要一种不是基于连续系统的异构多智能体控制方法。
发明内容
本发明的目的是提出一种不是基于连续系统的异构多智能体控制方法。
为了实现上述目的,本发明提供了基于离散系统的异构分布式集群系统编队控制算法,包括:设置离散通信周期;构建多智能体系统的通信拓扑关系,所述多智能体系统包括多个二阶智能体和多个一阶智能体;分别构建二阶智能体和一阶智能体的动力学模型;分别构建二阶智能体和一阶智能体的编队函数;基于所述通信拓扑关系,每个智能体按照所述离散通信周期获取与其相邻智能体的状态向量和编队函数;基于所述离散通信周期、状态向量和编队函数,获得每个二阶智能体和每个一阶智能体的控制指令状态量;基于所述动力学模型、所述控制指令状态量和每个智能体k 时刻的状态向量,获得每个智能体的k+1时刻的位置向量;根据每个智能体的k+1时刻的位置向量,获得所述智能体k+1时刻的状态向量,根据所述智能体k+1时刻的状态向量,获得新的控制指令状态量,以维持编队控制。
优选地,所述多智能体系统的通信拓扑关系用有向图G表示,在所述有向图G中,每个智能体用一个节点表示,所述有向图G的拉普拉斯矩阵 L为
L=Q–P,
其中,P为节点间的通信关系权重矩阵,N为节点的总个数,pij为第i个节点与第j个节点间的通信关系权重,Q为入度矩阵, Q=diag{degin(vi),i∈{1,...,N}},degin(vi)为节点i的入度,/>其中vi表示节点i能够收到来自其他节点的信息的所有节点的集合。
优选地,所述有向图G中存在多个节点形成的生成树。
优选地,有向图G中各节点所代表的智能体的动力学模型表示如下:
二阶智能体的动力学模型为:
xi(k+1)=xi(k)+vi(k)T,i∈{1,...,M}
vi(k+1)=vi(k)+ui(k)T,i∈{1,...,M}
所述一阶智能体的动力学模型为:
xi(k+1)=xi(k)+ui(k)T,i∈{M+1,...,N}
其中,T>0为离散通信周期,xi(k+1)为第i个智能体k+1时刻的位置向量,vi(k+1)为第i个智能体k+1时刻的速度向量,ui(k)为第i个智能体 k时刻的控制指令状态量, 分别为第i个智能体k时刻的位置向量,速度向量和控制指令状态量,分别为第i个智能体k 时刻的位置向量和控制指令状态量,d为向量的空间维度。
优选地,二阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
一阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
其中,为第i个智能体第1维度上k时刻的编队函数,/>为第 i个智能体第d维度上k时刻的编队函数,d为向量的空间维度,hilx(k)为第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第i个智能体第1维度上k时刻的编队函数速度向量。
优选地,所述二阶智能体k时刻的状态向量为Ψil(k)=[xil(k),vil(k)]T,l∈{1,…,d},i∈{1,…,M},所述一阶智能体k时刻的状态向量为Ψil(k)=[xil(k)]T,i∈{M+1,…,N};
其中,d为维度,xil(k)为第i个智能体k时刻的位置状态向量,vil(k)为第i个智能体k时刻的速度状态向量,N为智能体总个数,M为二阶智能体的个数。
优选地,满足下述条件时,实现编队函数期望队形:
编队函数期望队形满足下述前提:
hilx(k+1)=hilx(k)+hilv(k)T.
其中,hilx(k+1)为第i个智能体第1维度上k+1时刻的编队函数位置向量,hilx(k)第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第 i个智能体第1维度上k时刻的编队函数速度向量,T为离散通信周期,Ψi(k) 为第i个智能体k时刻的状态向量,Ψj(k)为第j个智能体k时刻的状态向量, hi(k)为第i个智能体k时刻的编队函数,hj(k)为第j个智能体k时刻的编队函数。
优选地,采用下述公式获得二阶智能体的控制指令状态量:
采用下述公式获得无一阶智能体的控制指令状态量:
其中,[Δxi(k),Δvi(k)]=[xil(k)-hilx(k),vil(k)-hilv(k)]为第i个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,Δxj(k)、Δvj(k)为第j个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,hiv(k+1)为第i个智能体k+1时刻的编队函数速度向量,hiv(k)为第i个智能体k时刻的编队函数速度向量,K1,K2,K3与K4为系数,N为智能体总个数,M为二阶智能体的个数。
优选的,采用所述系数K1,K2,K3与K4的取值满足下述条件:
其中,T为离散通信周期,pij为第i个节点与第j个节点间的通信关系权重,N为智能体总个数,M为二阶智能体的个数。
优选地,所述一阶智能体为无人车智能体,所述二阶智能体为无人机智能体。
本发明的有益效果在于:本发明的基于离散系统的异构分布式集群系统编队控制算法在多智能体编队算法基础上,利用离散时间系统,减小了对通信频率的要求,有效降低了多智能体系统间的通信量,同时系统内多智能体种类包括一阶智能体与二阶智能体机两种,控制两类智能体,使得多智能体系统编队算法更加符合实际系统,拓展了算法执行任务种类的广度,适用场景更广,具有更好的实用性。
本发明的方法具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施例中将是显而易见的,或者将在并入本文中的附图和随后的具体实施例中进行详细陈述,这些附图和具体实施例共同用于解释本发明的特定原理。
附图说明
通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。其中,在本发明示例性实施方式中,相同的附图标记通常代表相同部件。
图1示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的流程图。
图2示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的多智能体系统通信拓扑结构。
图3示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的实验开始时内各智能体初始队形。
图4示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的180s时刻多智能体系统状态。
图5示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的180s内多智能体系统运动轨迹。
具体实施方式
下面将参照附图更详细地描述本发明的优选实施例。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
根据本发明的基于离散系统的异构分布式集群系统编队控制算法,包括:设置离散通信周期;构建多智能体系统的通信拓扑关系,多智能体系统包括多个二阶机智能体和多个一阶车智能体;分别构建二阶智能体和一阶智能体的动力学模型;分别构建二阶智能体和一阶智能体的编队函数;基于所述通信拓扑关系,每个智能体按照所述离散通信周期获取与其相邻智能体的状态向量和编队函数;基于所述离散通信周期、状态向量和编队函数,获得每个二阶智能体和每个一阶智能体的控制指令状态量;基于动力学模型、控制指令状态量和每个智能体k时刻的状态向量,获得每个智能体的k+1时刻的位置向量;根据每个智能体的k+1时刻的位置向量,获得智能体k+1时刻的状态向量,根据智能体k+1时刻的状态向量,获得新的控制指令状态量,以维持编队控制。
具体的,采取分布式异构离散系统,可用于无人机(一阶智能体)-无人车(二阶智能体)异构多智能体系统,便于执行空地协同任务,同时不要求实时获取状态值,可自行设定在一定范围内的采样通信时间,以固定频率进行通信,从而降低各智能体之间的通信量,依据通信拓扑关系,间隔采样通信时间,获取其他智能体的状态参数和编队函数,基于获取的状态参数和编队函数设计控制协议中的各类参数,获得每个智能体的控制指令状态向量,建立一阶动力学模型和二阶动力学模型,在已知编队与系统通信拓扑的情况下,用一套控制协议分别给出两种不同结构智能体的控制输入(控制指令状态),控制智能体的速度与位置,使多智能体系统形成编队函数期望队形。
根据示例性的实施方式,基于离散系统的异构分布式集群系统编队控制算法在多智能体编队算法基础上,利用离散时间系统,减小了对通信频率的要求,有效降低了多智能体系统间的通信量,同时系统内多智能体种类包括一阶智能体与二阶智能体两种,控制两类智能体,使得多智能体系统编队算法更加符合实际系统,拓展了算法执行任务种类的广度,适用场景更广,具有更好的实用性。
作为优选方案,多智能体系统的通信拓扑关系用有向图G表示,在有向图G中,每个智能体用一个节点表示,有向图G的拉普拉斯矩阵L为
L=Q-P,
其中,P为节点间的通信关系权重矩阵,N为节点的总个数,pij为第i个节点与第j个节点间的通信关系权重,Q为入度矩阵, Q=diag{degin(vi),i∈{1,...,N}},degin(vi)为节点i的入度,/>其中vi表示节点i能够收到来自其他节点的信息的所有节点的集合。
具体的,多智能体系统通过智能体之间的互相通信来获取其它智能体的状态量,这种通信关系可以用代数图G来表示。假设多智能体系统中含有N个智能体,每个智能体分别用一个节点来表示,则该图总节点数为N。节点间的通信关系用权重矩阵来表示,如节点i能够收到节点j的信息,则pij=1,称节点j为节点i的一个邻居,否则pij=0。节点 i的入度定义为/>其中vi表示节点i的邻居集合。定义入度矩阵为Q=diag{degin(vi),i∈{1,...,N}}。最终通信图G的拉普拉斯矩阵L 定义为
L=Q-P
作为优选方案,有向图G中存在多个节点形成的生成树。
具体的,有向图G中的每个节点均与其他节点直接连接或间接连接,多个节点形成生成树。
作为优选方案,有向图G中各节点所代表的智能体的动力学模型表示如下:
二阶智能体的动力学模型为:
xi(k+1)=xi(k)+vi(k)T,i∈{1,...,M}
vi(k+1)=vi(k)+ui(k)T,i∈{1,...,M}
一阶智能体的动力学模型为:
xi(k+1)=xi(k)+ui(k)T,i∈{M+1,...,N}
其中,T>0为离散通信周期,xi(k+1)为第i个智能体k+1时刻的位置向量,vi(k+1)为第i个智能体k+1时刻的速度向量,ui(k)为第i个智能体k时刻的控制指令状态量, 分别为第i个智能体k时刻的位置向量,速度向量和控制指令状态量,分别为第i个智能体k 时刻的位置向量和控制指令状态量,d为向量的空间维度。
具体的,多智能体系统由N个智能体组成,其中前M个为无人机,以下使用“二阶智能体”指代,其余N-M个是无人车,以下使用“一阶智能体”指代,
二阶智能体的动力学模型为:
xi(k+1)=xi(k)+vi(k)T,i∈{1,...,M}
vi(k+1)=vi(k)+ui(k)T,i∈{1,...,M}
一阶智能体的动力学模型为:
xi(k+1)=xi(k)+ui(k)T,i∈{M+1,...,N}
其中,T>0为离散通信周期,为第i个智能体k+1时刻的位置向量,/>为第i个智能体 k+1时刻的速度向量,ui(k)为第i个智能体k时刻的控制指令状态量,分别为第i个智能体 k时刻的位置向量,速度向量和控制指令状态量,/> 分别为第i个智能体k时刻的位置向量和控制指令状态量,d为向量的空间维度。在本申请的实现过程中优选为2,即所有状态量默认为二维平面上的状态向量,但通过克罗内克积可将相应状态向量拓展到任意正整数维度。
作为优选方案,各智能体依据不同动力学模型种类,编队函数表示方式也不相同,具体表示如下:二阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
一阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
其中,为第i个智能体第1维度上k时刻的编队函数,/>为第 i个智能体第d维度上k时刻的编队函数,d为向量的空间维度,/>为第i个智能体第1维度上k时刻的编队函数位置向量,/>为第i个智能体第 1维度上k时刻的编队函数速度向量。
具体的,可定义多智能体系统总编队函数为 其中第i个智能体的编队定义存在两种情况,分别对应前M个二阶智能体的期望编队,与后N-M个一阶智能体的期望编队。
定义二阶智能体k时刻的状态向量为Ψil(k)=[xil(k),vil(k)]T,l∈{1,…,d},i∈{1,…,M},一阶智能体k时刻的状态向量为Ψil(k)=[xil(k)]T,i∈{M+1,…,N};
其中,d为维度,xil(k)为第i个智能体k时刻的位置状态向量,vil(k)为第i个智能体k时刻的速度状态向量,N为智能体总个数,M为二阶智能体的个数。
具体的,个多智能体系统的总状态向量可定义为其中每个智能体的状态向量为/>而单个智能体状态向量又由该智能体每个空间维度上的状态向量构成,每个维度上的状态向量结构由该智能体的种类决定,例如无人机(二阶智能体)为Ψil(k)=[xil(k),vil(k)]T,l∈{1,…,d},i∈{1,…,M},而无人车(一阶智能体)为Ψil(k)=[xil(k)]T,i∈{M+1,…,N}。
作为优选方案,满足下述条件时,实现编队函数期望队形:
编队函数期望队形满足下述前提:
hilx(k+1)=hilx(k)+hilv(k)T.
其中,hilx(k+1)为第i个智能体第1维度上k+1时刻的编队函数位置向量,hilx(k)第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第 i个智能体第1维度上k时刻的编队函数速度向量,T为离散通信周期,Ψi(k) 为第i个智能体k时刻的状态向量,Ψj(k)为第j个智能体k时刻的状态向量, hi(k)为第i个智能体k时刻的编队函数,hj(k)为第j个智能体k时刻的编队函数。
具体的,编队函数本身必须为分段可微函数,使得编队逻辑自洽,例如对无人机有
hilx(k+1)=hilx(k)+hilv(k)T.
多智能体系统实现编队函数队形的条件则为:对任意初始位置有界的多智能体系统,各智能体状态向量与相应编队函数的误差趋于一致,即
则称多智能体系统实现了编队函数期望的编队。
作为优选方案,采用下述公式获得二阶智能体的控制指令状态量:
采用下述公式获得无一阶智能体的控制指令状态量:
其中,[Δxi(k),Δvi(k)]=[xil(k)-hilx(k),vil(k)-hilv(k)]为第i个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,Δxj(k)、Δvj(k)为第j个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,hiv(k+1)为第i个智能体k+1时刻的编队函数速度向量,hiv(k)为第i个智能体k时刻的编队函数速度向量,K1,K2,K3与K4为系数,N为智能体总个数,M为二阶智能体的个数。
具体的,通信协议中控制指令状态量的数学表达式为两项,分别针对一阶智能体和二阶智能体,合并如下
其中[Δxi(k),Δvi(k)]=[xil(k)-hilx(k),vil(k)-hilv(k)]为二阶智能体状态向量与相应编队函数向量的差值,同样的,Δxi(k)=xil(k)-hilx(k)为一阶智能体状态向量与相应编队函数向量的差值,K1,K2,K3与K4为四个待定系数。
基于离散系统的编队控制器,能够利用周遭智能体离散通讯状态信息生成控制指令,具有实用性高,对实际系统适用性强的优点。
异构多智能体控制协议,该协议的设计使得多智能体系统可以协同控制动力学模型为一阶和二阶的智能体,例如无人车与无人机,进而使系统具备执行空地协同任务的控制基础。
作为优选方案,采用系数K1,K2,K3与K4的取值满足下述条件:
其中,T为离散通信周期,pij为第i个节点与第j个节点间的通信关系权重,N为智能体总个数,M为二阶智能体的个数。
具体的,四个系数符合上式四个条件,且多智能体系统对应的代数图G 存在生成树,即可使该多智能体系统系统实现期望编队函数的队形。
作为优选方案,一阶智能体为无人车智能体,二阶智能体为无人机智能体。
实施例一
图1示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的流程图。图2示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的多智能体系统通信拓扑结构。图3示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的实验开始时内各智能体初始队形。图4示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的180s时刻多智能体系统状态。图5示出了根据本发明的一个实施例的基于离散系统的异构分布式集群系统编队控制算法的180s内多智能体系统运动轨迹。
如图1、图2、图3、图4和图5所示,该基于离散系统的异构分布式集群系统编队控制算法,包括:
步骤1:设置离散通信周期;
步骤2:构建多智能体系统的通信拓扑关系,多智能体系统包括多个二阶智能体和多个一阶智能体;
步骤3:分别构建二阶智能体和一阶智能体的动力学模型;
步骤4:分别构建二阶智能体和一阶智能体的编队函数;
步骤5:基于通信拓扑关系,每个智能体按照离散通信周期获取与其相邻智能体的状态向量和编队函数;
步骤6:基于离散通信周期、状态向量和编队函数,获得每个二阶智能体和每个一阶智能体的控制指令状态量;
步骤7:基于动力学模型、控制指令状态量和每个智能体k时刻的状态向量,获得每个智能体的k+1时刻的位置向量;
步骤8:根据每个智能体的k+1时刻的位置向量,获得所述智能体k+1 时刻的状态向量,根据所述智能体k+1时刻的状态向量,获得新的控制指令状态量,以维持编队控制。
其中,多智能体系统的通信拓扑关系用有向图G表示,在有向图G中,每个智能体用一个节点表示,有向图G的拉普拉斯矩阵L为
L=Q-P,
其中,P为节点间的通信关系权重矩阵,N为节点的总个数,pij为第i个节点与第j个节点间的通信关系权重,Q为入度矩阵, Q=diag{degin(vi),i∈{1,...,N}},degin(vi)为节点i的入度,/>其中vi表示节点i能够收到来自其他节点的信息的所有节点的集合。
其中,有向图G中存在多个节点形成的生成树。
其中,有向图G中各节点所代表的智能体的动力学模型表示如下:二阶智能体的动力学模型为:
xi(k+1)=xi(k)+vi(k)T,i∈{1,...,M}
vi(k+1)=vi(k)+ui(k)T,i∈{1,...,M}
一阶智能体的动力学模型为:
xi(k+1)=xi(k)+ui(k)T,i∈{M+1,...,N}
其中,T>0为离散通信周期,xi(k+1)为第i个智能体k+1时刻的位置向量,vi(k+1)为第i个智能体k+1时刻的速度向量,ui(k)为第i个智能体k 时刻的控制指令状态量, 分别为第i个智能体k时刻的位置向量,速度向量和控制指令状态量,分别为第i个智能体k 时刻的位置向量和控制指令状态量,d为向量的空间维度。
其中,二阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
一阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
其中,为第i个智能体第1维度上k时刻的编队函数,/>为第 i个智能体第d维度上k时刻的编队函数,d为向量的空间维度,hilx(k)为第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第i个智能体第1维度上k时刻的编队函数速度向量。
具体的,可定义多智能体系统总编队函数为 其中第i个智能体的编队定义存在两种情况,分别对应前M个二阶智能体的期望编队,与后N-M个一阶智能体的期望编队。
其中,二阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
一阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
其中,为第i个智能体第1维度上k时刻的编队函数,/>为第 i个智能体第d维度上k时刻的编队函数,d为向量的空间维度,hilx(k)为第 i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第i个智能体第 1维度上k时刻的编队函数速度向量。
其中,二阶智能体k时刻的状态向量为Ψil(k)=[xil(k),vil(k)]T,l∈{1,…,d},i∈{1,…,M},一阶智能体k时刻的状态向量为Ψil(k)=[xil(k)]T,i∈{M+1,…,N}。
其中,d为维度,xil(k)为第i个智能体k时刻的位置状态向量,vil(k)为第i个智能体k时刻的速度状态向量,N为智能体总个数,M为二阶智能体的个数。
其中,满足下述条件时,实现编队函数期望队形:
编队函数期望队形满足下述前提:
hilx(k+1)=hilx(k)+hilv(k)T.
其中,hilx(k+1)为第i个智能体第1维度上k+1时刻的编队函数位置向量,hilx(k)第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第 i个智能体第1维度上k时刻的编队函数速度向量,T为离散通信周期,Ψi(k) 为第i个智能体k时刻的状态向量,Ψj(k)为第j个智能体k时刻的状态向量, hi(k)为第i个智能体k时刻的编队函数,hj(k)为第j个智能体k时刻的编队函数。
其中,采用下述公式获得二阶智能体的控制指令状态量:
采用下述公式获得一阶智能体的控制指令状态量:
其中,[Δxi(k),Δvi(k)]=[xil(k)-hilx(k),vil(k)-hilv(k)]为第i个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,Δxj(k)、Δvj(k)为第j个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,hiv(k+1)为第i个智能体k+1时刻的编队函数速度向量,hiv(k)为第i个智能体k时刻的编队函数速度向量,K1,K2,K3与K4为系数,N为智能体总个数,M为二阶智能体的个数。
其中,采用系数K1,K2,K3与K4的取值满足下述条件:
其中,T为离散通信周期,pij为第i个节点与第j个节点间的通信关系权重,N为智能体总个数,M为二阶智能体的个数。
其中,一阶智能体为无人车智能体,二阶智能体为无人机智能体。
通过仿真算例验证基于离散系统的异构分布式集群系统编队控制算法,由7个智能体组成的系统,系统的通信拓扑结构如图2所示,由4个无人机和3个无人车构成,在xyz三维空间中无人车在地面运动,无人机起飞后在定高5m的平面运动,期望编队控制所有智能体在xy平面的运动轨迹,其中第i个智能体的编队hi(t)设计如下:
其中各智能体旋转半径与角速度为r1=60m,r2=120m,w=0.314rad/s,系统采样周期为T=0.2s,依据基于离散系统的异构分布式集群系统编队控制算法设计标准,取一组参数K2=0.6,K1=6,K3=0.15,K4=2。
实验开始各多智能体静止在三维空间中的初始状态如图3,具体参数如下
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
X(m) | 10 | 0 | -10 | 0 | 20 | -10 | -10 |
Y(m) | 0 | 10 | 0 | -10 | 0 | 17.4 | 17.4 |
启动协议180s后,在Gazebo物理仿真平台上的各智能体实时位置如图4所示,4个无人机以正方形为队形绕圆,3个无人车以等边三角形为队形绕圆并将无人机队形囊括其中,各智能体相位与编队函数相符,180s内轨迹如图5所示,该多智能体系统实现期望编队。
以上已经描述了本发明的实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的实施例。在不偏离所说明的实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
Claims (10)
1.一种基于离散系统的异构分布式集群系统编队控制算法,其特征在于,包括:
设置离散通信周期;
构建多智能体系统的通信拓扑关系,所述多智能体系统包括多个二阶智能体和多个一阶智能体;
分别构建二阶智能体和一阶智能体的动力学模型;
分别构建二阶智能体和一阶智能体的编队函数;
基于所述通信拓扑关系,每个智能体按照所述离散通信周期获取与其相邻智能体的状态向量和编队函数;
基于所述离散通信周期、状态向量和编队函数,获得每个二阶智能体和每个一阶智能体的控制指令状态量;
基于所述动力学模型、所述控制指令状态量和每个智能体k时刻的状态向量,获得每个智能体的k+1时刻的位置向量;
根据每个智能体的k+1时刻的位置向量,获得所述智能体k+1时刻的状态向量,根据所述智能体k+1时刻的状态向量,获得新的控制指令状态量,以维持编队控制。
2.根据权利要求1所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,所述多智能体系统的通信拓扑关系用有向图G表示,在所述有向图G中,每个智能体用一个节点表示,所述有向图G的拉普拉斯矩阵L为
L=Q-P,
其中,P为节点间的通信关系权重矩阵,N为节点的总个数,pij为第i个节点与第j个节点间的通信关系权重,Q为入度矩阵,Q=diag{degin(vi),i∈{1,...,N}},degin(vi)为节点i的入度,/>其中vi表示节点i能够收到来自其他节点的信息的所有节点的集合。
3.根据权利要求2所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,所述有向图G中存在多个节点形成的生成树。
4.根据权利要求3所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,有向图G中各节点所代表的智能体的动力学模型表示如下:
二阶智能体的动力学模型为:
xi(k+1)=xi(k)+vi(k)T,i∈{1,...,M}
vi(k+1)=vi(k)+ui(k)T,i∈{1,...,M}
所述一阶智能体的动力学模型为:
xi(k+1)=xi(k)+ui(k)T,i∈{M+1,...,N}
其中,T>0为离散通信周期,xi(k+1)为第i个智能体k+1时刻的位置向量,vi(k+1)为第i个智能体k+1时刻的速度向量,ui(k)为第i个智能体k时刻的控制指令状态量, 分别为第i个智能体k时刻的位置向量,速度向量和控制指令状态量,分别为第i个智能体k时刻的位置向量和控制指令状态量,d为向量的空间维度。
5.根据权利要求4所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,
二阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为hil(k)=[hilx(k),/>
一阶智能体k时刻的编队函数为:
其中,每个空间维度上的编队函数向量为/>
其中,为第i个智能体第1维度上k时刻的编队函数,/>为第i个智能体第d维度上k时刻的编队函数,d为向量的空间维度,hilx(k)为第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第i个智能体第1维度上k时刻的编队函数速度向量。
6.根据权利要求5所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,所述二阶智能体k时刻的状态向量为Ψil(k)=[xil(k),vil(k)]T,l∈{1,...,d},i∈{1,...,M},所述一阶智能体k时刻的状态向量为Ψil(k)=[xil(k)]T,i∈{M+1,...,N};
其中,d为维度,xil(k)为第i个智能体k时刻的位置状态向量,vil(k)为第i个智能体k时刻的速度状态向量,N为智能体总个数,M为二阶智能体的个数。
7.根据权利要求6所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,满足下述条件时,实现编队函数期望队形:
所述编队函数期望队形满足下述前提:
hilx(k+1)=hilx(k)+hilv(k)T.
其中,hilx(k+1)为第i个智能体第1维度上k+1时刻的编队函数位置向量,hilx(k)第i个智能体第1维度上k时刻的编队函数位置向量,hilv(k)为第i个智能体第1维度上k时刻的编队函数速度向量,T为离散通信周期,Ψi(k)为第i个智能体k时刻的状态向量,Ψj(k)为第j个智能体k时刻的状态向量,hi(k)为第i个智能体k时刻的编队函数,hj(k)为第j个智能体k时刻的编队函数。
8.根据权利要求6所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,采用下述公式获得二阶智能体的控制指令状态量:
i∈{1,...M},j∈{1,...N}
采用下述公式获得一阶智能体的控制指令状态量:
其中,[Δxi(k),Δvi(k)]=[xil(k)-hilx(k),vil(k)-hilv(k)]为第i个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,Δxj(k)、Δvj(k)为第j个智能体k时刻的位置向量与编队函数位置向量的差值、速度向量与编队函数速度向量的差值,hiv(k+1)为第i个智能体k+1时刻的编队函数速度向量,hiv(k)为第i个智能体k时刻的编队函数速度向量,K1,K2,K3与K4为系数,N为智能体总个数,M为二阶智能体的个数。
9.根据权利要求8所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,所述系数K1,K2,K3与K4的取值满足下述条件:
其中,T为离散通信周期,pij为第i个节点与第j个节点间的通信关系权重,N为智能体总个数,M为二阶智能体的个数。
10.根据权利要求1所述的基于离散系统的异构分布式集群系统编队控制算法,其特征在于,所述一阶智能体为无人车智能体,所述二阶智能体为无人机智能体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210089495.4A CN114594786B (zh) | 2022-01-25 | 2022-01-25 | 基于离散系统的异构分布式集群系统编队控制算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210089495.4A CN114594786B (zh) | 2022-01-25 | 2022-01-25 | 基于离散系统的异构分布式集群系统编队控制算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114594786A CN114594786A (zh) | 2022-06-07 |
CN114594786B true CN114594786B (zh) | 2024-06-07 |
Family
ID=81804454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210089495.4A Active CN114594786B (zh) | 2022-01-25 | 2022-01-25 | 基于离散系统的异构分布式集群系统编队控制算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114594786B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116047908B (zh) * | 2023-01-16 | 2023-10-13 | 齐齐哈尔大学 | 混合阶异构多智能体系统协同最优编队控制方法及设备 |
CN116402316B (zh) * | 2023-06-01 | 2023-11-07 | 国网浙江宁波市鄞州区供电有限公司 | 一种基于人工智能的业务均衡分配方法及远程服务设施 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126888A (zh) * | 2016-06-16 | 2016-11-16 | 中南大学 | 一种基于自组织编队行为的集群机器人轨迹跟踪方法 |
WO2018028358A1 (zh) * | 2016-08-06 | 2018-02-15 | 亿航智能设备(广州)有限公司 | 实现编队飞行的方法、装置及系统 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
CN111651705A (zh) * | 2020-05-18 | 2020-09-11 | 北京航空航天大学 | 集群编队跟踪控制方法 |
WO2021174765A1 (zh) * | 2020-03-03 | 2021-09-10 | 中国科学院自动化研究所 | 基于多无人机协同博弈对抗的控制系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050230563A1 (en) * | 2004-02-21 | 2005-10-20 | Corcoran James J Iii | Automatic formation flight control system |
-
2022
- 2022-01-25 CN CN202210089495.4A patent/CN114594786B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126888A (zh) * | 2016-06-16 | 2016-11-16 | 中南大学 | 一种基于自组织编队行为的集群机器人轨迹跟踪方法 |
WO2018028358A1 (zh) * | 2016-08-06 | 2018-02-15 | 亿航智能设备(广州)有限公司 | 实现编队飞行的方法、装置及系统 |
CN111435252A (zh) * | 2020-01-15 | 2020-07-21 | 北京航空航天大学 | 异构多智能体系统分组输出时变编队跟踪控制方法及系统 |
WO2021174765A1 (zh) * | 2020-03-03 | 2021-09-10 | 中国科学院自动化研究所 | 基于多无人机协同博弈对抗的控制系统 |
CN111651705A (zh) * | 2020-05-18 | 2020-09-11 | 北京航空航天大学 | 集群编队跟踪控制方法 |
Non-Patent Citations (1)
Title |
---|
异构变时延多智能体系统编队控制分析;胡波;贾枭;徐君;王和;;计算机仿真;20200115(第01期);296-303 * |
Also Published As
Publication number | Publication date |
---|---|
CN114594786A (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388270B (zh) | 面向安全域的集群无人机轨迹姿态协同控制方法 | |
CN114594786B (zh) | 基于离散系统的异构分布式集群系统编队控制算法 | |
CN110162086A (zh) | 一种基于模型预测控制框架的集群无人机编队方法 | |
Alejo et al. | Particle swarm optimization for collision-free 4d trajectory planning in unmanned aerial vehicles | |
CN115033016B (zh) | 一种异构无人集群编队避障方法及系统 | |
CN106647771A (zh) | 多移动机器人的最小步编队方法 | |
Huang et al. | A novel hybrid discrete grey wolf optimizer algorithm for multi-UAV path planning | |
Lin et al. | Robust planning for persistent surveillance with energy-constrained UAVs and mobile charging stations | |
Rao et al. | Path planning for dual UAVs cooperative suspension transport based on artificial potential field-A* algorithm | |
Wakabayashi et al. | Dynamic obstacle avoidance for Multi-rotor UAV using chance-constraints based on obstacle velocity | |
CN113625747A (zh) | 一种集群系统编队避障控制方法 | |
Hu et al. | Vision-based multi-agent cooperative target search | |
Huang et al. | Decentralized flocking of multi-agent system based on MPC with obstacle/collision avoidance | |
CN113589849A (zh) | 一种无人机动态控制方法、系统、设备及存储介质 | |
Wubben et al. | Toward secure, efficient, and seamless reconfiguration of UAV swarm formations | |
Zhicai et al. | A cooperative search algorithm based on improved particle swarm optimization decision for UAV swarm | |
Zhang et al. | Research on agv navigation simulation in printing wisdom factory | |
Guo et al. | Collision-free formation tracking control for multiple quadrotors under switching directed topologies: Theory and experiment | |
Han et al. | Research on UAV indoor path planning algorithm based on global subdivision grids | |
Du | A precision spraying mission assignment and path planning performed by multi-quadcopters | |
Zhou et al. | Time-varying formation tracking for UAV swarm systems with switching interaction topologies | |
Patley et al. | Modified particle swarm optimization based path planning for multi-UAV formation | |
CN113126652B (zh) | 无人机集群协同电子侦察的调度方法及装置 | |
Pshikhopov et al. | Path planning and control of vehicles in 3D environment using unstable modes | |
Lu et al. | Time-varying formation tracking for UGV swarm systems with switching directed topologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |