CN111123971A - 一种基于多智能体在有界陌生地域编队部署的方法 - Google Patents

一种基于多智能体在有界陌生地域编队部署的方法 Download PDF

Info

Publication number
CN111123971A
CN111123971A CN201911212636.1A CN201911212636A CN111123971A CN 111123971 A CN111123971 A CN 111123971A CN 201911212636 A CN201911212636 A CN 201911212636A CN 111123971 A CN111123971 A CN 111123971A
Authority
CN
China
Prior art keywords
mirror
agent
bounded
matrix
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911212636.1A
Other languages
English (en)
Other versions
CN111123971B (zh
Inventor
朱德政
宦国杨
朱维超
于翔
房展
蔡雨琦
曲跃光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN201911212636.1A priority Critical patent/CN111123971B/zh
Publication of CN111123971A publication Critical patent/CN111123971A/zh
Application granted granted Critical
Publication of CN111123971B publication Critical patent/CN111123971B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Abstract

本发明提供了一种基于多智能体在有界陌生地域编队部署的方法,通过无线传感器网络协调控制各智能体进行编队部署,确保各智能体能够异步完成任务,大大提高了系统的工作效率。针对多智能体在有界空间中的运动,提出了二阶动态系统的一致性算法。传统的有界空间一致性算法只适合矩形有界空间,对于不规则的空间不再适用。为了将已有的一致性算法扩展到不规则的有界空间,通过引入镜像速度和镜像位置,把先前无限大空间的双积分控制算法推广到有界空间里。借助镜像矩阵将不连续的实际速度转化成连续的镜像速度,并且镜像矩阵也适合非矩形区域,更具有一般性。同时为了限制控制输入,引入了饱和控制,最终多智能体速度和位置渐进收敛到一致。

Description

一种基于多智能体在有界陌生地域编队部署的方法
技术领域
本发明属于指挥控制领域,特别涉及一种基于多智能体在有界陌生地域编队部署的方法。
背景技术
随着科学计算的快速发展,运用当今科技去处理复杂问题的需求对于人们来说越来越迫切。然而人们发现仅仅通过个体去解决一些复杂问题会越来越棘手,不但在专业技术层面上严格要求,并且很多问题需要许多个体密切协作才能解决。
在军事方面,如今的军事更加重视信息化,对于一个规模比较大的系统都可以由许多小的局部互相通信的智能体构成,如何通过智能体之间的合理协调来完成一个任务,这就成为多智能体系统协作控制的研究内容。在实际环境中,当对某个不明的区域侦查、搜索时,如果使用一个由结构单一,功能少的小型机器人构成的编队将会比一个由结构复杂,功能多的大型机器人带来更好的效果,对于一个群体来说,可以允许某些机器人发生故障,通过合理组织就可以让他们继续有效的工作,但是对于大型机器人来说,任何一个故障都是致命的,所以小型机器人组将有更佳的鲁棒性和更强的容错率。
多智能体系统的思想起源于人工智能理论,一开始是用来克服个体在解决比较困难实际问题中的不足,使得通过用简单的多智能体的共同控制替换单个个体的控制。如今它成为发展非常快的一门控制科学,涉及的领域也很广泛,比如人工智能、生物、机器人等新兴领域,并且在这些领域里面得到了广泛的应用,比如编队控制,无人驾驶飞行器的协作控制。该系统是一类开放的,复杂的分布式系统,通过个体之间相互作用和局部协作而形成的具有自主性,协调性,分布性的系统,并且具有一定的推理能力,学习能力以及组织能力。更重要的是,局部相互作用只需要每个个体获得其邻居信息,而不需要拥有整个系统的全部信息,最后通过这些局部信息来更新自己的行为。
因为广泛运用的多智能体系统和深入探讨的编队与合作控制问题,多智能体系统得到了迅速的发展和研究,因此在理论和应用上分别取得了很大的收获,可以解释日常生活中出现的蜂拥现象,例如,蚂蚁在觅食时会协同工作;鱼群在海洋里面结队巡游;大雁迁徙时会排出一致的队形,同时在遇到特殊情形时能够改变队形;细菌群落的聚集生存等。对于这些生物来说,无论在运动方面,还是在视觉能力方面,都是受限的,然而它们之间通过一些信息交流就能形成一定规模的群体,以至于克服了他们自身在这些方面的缺陷,从而有效地完成运动,迁徙等任务。
多智能体系统控制目前主要应用在多机器人协作控制、无线传感器网络协调控制以及无人飞行器编队控制领域,然而多智能体系统控制合作的一个重要的方面即为一致性问题。如今一致性问题研究的一个非常重要模型为二阶系统,二阶系统不同于一阶系统主要是因为二阶系统不仅考虑了位移方面,而且还考虑了速度方面。虽然一致性问题已经得到了广泛的研究,取得了大量的研究成果,但是很多问题都是基于无穷大区域研究的。然而,如今许多实际行为是在有界空间里发生的,比如,在有界空间的逃生,公共交通系统等。而且,许多工程应用也是在有界空间里面进行的,例如,多智能体协同在有界空间里面完成复杂任务,编队控制等。虽然先前的有些多智能体控制算法可以运用到有界空间,但只能在矩形空间里,对于非矩形区域不再适用。此外,在有界空间中,在边界的折返运动往往产生极大的控制信号,然而许多实际工程系统,由于物理上的限制,输入信号总是会面临着饱和。通过限制输入的大小,因此在实际系统中更加实用。
总之,多智能体理论在军事、社会、工业、经济等领域的进步也具有重大的意义,如今处于信息化时代,多智能体系统取得的成就可以在工业系统的发展中被广泛地应用,同时可以获得很多社会效益;对多智能体系统的探讨能够关系到社会规律和各类现象,因此会在社会生活中有着巨大的影响。而且由于多智能体在有界空间中的合作控制有着分布式特点,在单个个体层面上仅仅需要每一个智能体具备有限的计算、信息采集、通讯等功能,从而设计比较简单,而在群体层面上则能表现出复杂的协调配合和智能行为,并且能够实现单个个体不能完成的各种艰巨的或者精度高的任务,而且在实际运用中不需要设计很复杂的程序,也不用很昂贵的成本。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于多智能体在有界陌生地域编队部署的方法,包括如下步骤:
步骤1,建立多智能体二阶运动方程;
步骤2,定义镜像速度矩阵和镜像速度;
步骤3,建立有界空间中一致性控制算法;
步骤4,根据步骤3建立的算法对多智能体在有界陌生地域进行编队部署。
步骤1包括:设定一组智能体在正三角形区域中运动,建立笛卡尔坐标系,坐标原点为正三角形的左下角顶点,x轴沿着正三角形的底边方向指向右方,建立如下多智能体二阶运动方程:
Figure BDA0002298553300000031
Figure BDA0002298553300000032
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化。
Figure BDA0002298553300000033
分别表示位置的导数和速度的导数。pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合。n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示在t时刻速度的左极限和右极限,vi(t-)=lims→t-vi(s),vi(t+)=lims→t+vi(s);<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化。
步骤1中,矩阵Δi(t)被定义为:
Figure BDA0002298553300000034
其中,δ为Dirac函数,k表示第k次碰撞,τ(k)表示第k次碰撞时刻。
步骤1中,当t=τ(k)时,有:
Figure BDA0002298553300000041
其中,
Figure BDA0002298553300000042
表示在碰撞时刻t,对ui进行积分。
Figure BDA0002298553300000043
表示在碰撞时刻t,对Δi进行积分。s表示积分变量,I表示单位向量。
根据碰撞关系,有:
Figure BDA0002298553300000044
当t=τ(k)时,智能体与墙壁发生镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续;
当t≠τ(k)时,有:
Figure BDA0002298553300000045
说明当智能体与墙壁不接触时,速度连续。
步骤2包括:
步骤2-1,用w表示垂直于n的单位向量,同时(n,w)满足右手规则,使得n×w方向垂直于纸面指向外;θ表示n与x轴之间的夹角,满足右手规则,并且n×x方向垂直于纸面朝向外则角度是正,反之是负;vi(t-)表示接触之前的速度向量,vi(t+)表示接触之后的速度向量,即前面所述的左极限和右极限;定义符号变量Li(t),接触之前为1,接触之后为-1;
步骤2-2,定义镜像速度矩阵ki(t):
Figure BDA0002298553300000046
其中,法向单位向量n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1;定义ki(0)=I2×2,为单位向量;定义Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))……ki(τ(k)),其中ki(τ(1)),ki(τ(2))…,ki(τ(k))分别表示第1次、2次、…、k次碰撞后的值,即令Li(t)=-1;
步骤2-3,定义镜像速度
Figure BDA0002298553300000051
Figure BDA0002298553300000052
则当t=τ(k)时,有:
Figure BDA0002298553300000053
即当t=τ(k)时,实际速度vi(t)不是连续的,对于镜像速度
Figure BDA0002298553300000054
来说,总是连续的。
Figure BDA0002298553300000055
Figure BDA0002298553300000056
分别是
Figure BDA0002298553300000057
在s=t的左极限和右极限。
步骤2-3中,对于直线l:Ax+By+C=0,A2+B2≠0,点M(x0,y0)关于直线l的对称点的坐标是N(x1,y1),则有:
Figure BDA0002298553300000058
Figure BDA0002298553300000059
写成矩阵形式为:
Figure BDA00022985533000000510
其中,
Figure BDA0002298553300000061
即为镜像位置矩阵;
定义各个智能体镜像位置,有
Figure BDA0002298553300000062
Figure BDA0002298553300000063
其中,镜像位置
Figure BDA0002298553300000064
Figure BDA0002298553300000065
分别表示镜像位置
Figure BDA0002298553300000066
在x轴和y轴上的投影,Qi(t)=qi(0)·qi(τ(1))·qi(τ(2))……qi(τ(k)),qi(t)∈R3×3,qi(0)=I3×3,并且qi(τ(k))表示第i个智能体在第k次碰撞到墙壁所对应的镜像位置矩阵M值,Qi(t)即为所有碰撞时刻镜像位置矩阵乘积。
Figure BDA0002298553300000067
分别表示位置向量pi在x轴和y轴上的投影。
步骤3包括:建立有界空间中一致性控制算法:
Figure BDA0002298553300000068
其中,ui(t)表示控制输入,
Figure BDA0002298553300000069
表示逆矩阵,aij表示加权系数,
Figure BDA00022985533000000610
表示镜像位置。Kj(t)表示第j个智能体的镜像速度矩阵;vj(t)表示第j个智能体速度。
定义镜像加速度
Figure BDA00022985533000000611
Figure BDA00022985533000000612
根据镜像位置矩阵和镜像速度,得到:
Figure BDA00022985533000000613
Figure BDA00022985533000000614
由于
Figure BDA00022985533000000615
其中
Figure BDA00022985533000000616
表示符号函数Li(t)的导数。则当t=τ(k)时,对
Figure BDA00022985533000000617
求导,得:
Figure BDA0002298553300000071
由于a2+b2=1,则:
Figure BDA0002298553300000072
因此,
Figure BDA0002298553300000073
计算ki(t)的行列式,为:
Figure BDA0002298553300000074
因此,ki(t)可逆,而Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))…,所以Ki(t)也可逆;
Figure BDA0002298553300000075
得到:
Figure BDA0002298553300000076
通过引入势能函数H(t):
Figure BDA0002298553300000081
对其求导,得:
Figure BDA0002298553300000082
根据:
Figure BDA0002298553300000083
因此,
Figure BDA0002298553300000084
由于无向图是连通的,根据LaSalle不变性定理,得到:
Figure BDA0002298553300000091
即当t→∞时,
Figure BDA0002298553300000092
代入如下公式中:
Figure BDA0002298553300000093
则有镜像控制输入
Figure BDA0002298553300000094
Figure BDA0002298553300000095
T表示转置,
Figure BDA0002298553300000096
表示
Figure BDA0002298553300000097
转置。任意η∈Rm×1表示m×1维列向量,定义1n=[1,1,…,1]T,并且
Figure BDA0002298553300000098
表示Kronecker积,则:
Figure BDA0002298553300000099
因为
Figure BDA00022985533000000910
所以
Figure BDA00022985533000000911
Figure BDA00022985533000000912
Figure BDA00022985533000000913
正交于
Figure BDA00022985533000000914
并且由于η的任意性,因此
Figure BDA00022985533000000915
Figure BDA00022985533000000916
有:
Figure BDA00022985533000000917
因为
Figure BDA00022985533000000918
所以
Figure BDA00022985533000000919
得:
Figure BDA00022985533000000920
根据LaSalle不变性定理,当t→∞时,有:
Figure BDA0002298553300000101
因此,对于正三角形空间来说,在镜像空间里面的点在实际空间中都有唯一的点与之对应,因此当多智能体在镜像空间中一致时,此时实际空间也达到了一致。
有益效果:本发明具有以下优点:本发明基于多智能体在有界陌生地域编队部署,提出了有界空间中一致性算法。针对多智能体在非矩形有界空间中的运动,传统的有界空间一致性算法只适合矩形有界空间,对于非矩形有界空间不再适用。本发明提出二阶动态系统的一致性算法,将已有的一致性算法扩展到非矩形空间,通过引入镜像速度矩阵的概念,不仅将不连续的实际速度转化成连续的镜像速度,而且将有界空间扩展成无限大虚拟空间。运用此算法,发现多智能体在虚拟空间中镜像速度渐近一致。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是入射速度、反射速度及镜像速度之间关系图。
图2是智能体编队区域为正三角形区域。
图3是智能体编队区域为正六角形区域。
图4是正三角形区域坐标系。
图5是碰撞面入射向量和反射向量关系图。
图6是正三角形区域10个智能体初始位置及速度。
图7是正三角形区域10个智能体的轨迹图。
图8是正三角形区域10个智能体的速度。
图9是正三角形区域10个智能体的加速度。
图10是正三角形区域智能体1与其他智能体的x轴相对位置。
图11是正三角形区域智能体1与其他智能体的y轴相对位置。
图12是是椭圆区域10个智能体初始位置及速度。
图13是椭圆区域10个智能体的轨迹。
图14是椭圆区域10个智能体的速度。
图15是椭圆区域10个智能体的加速度。
图16是椭圆区域智能体1与其他智能体的x轴相对位置。
图17是椭圆区域智能体1与其他智能体的y轴相对位置。
具体实施方式
一般地,针对多智能体一致性系统的研究,通常用图的形式来描述系统的拓扑结构,即智能体与邻居之间的通信关系,接下来将主要介绍一些关于图和矩阵方面的性质。
根据代数图形理论,多智能体网络系统拓扑结构使用图G=(V,ε)来表示,其中,顶点集合用V={1,2,…,n}来表示,边的集合由ε∈V×V构成。节点编号为i∈{1,2,…,n}。如果信息交换发生在第i个节点与第j个节点之间,此时说明有相连的边在这个节点对之间。由于节点对在无向图里是无序的,所以在节点之间的边是无向的,即
Figure BDA0002298553300000111
其中vj表示第j个节点,vi表示第i个节点,但是对于有向图来说,由于边不一定完全连通,因此若在第i个节点与第j个节点之间有边指向并不能说明第j个节点与第i个节点有边指向,也就是说它们之间是有向边。如果在图G里,任何两个节点之间都有连接的边,那么图G则是完全图。在有向图中,vi的出度是指由节点vi开始的边的数目,vi的入度是指指向节点vi的边的数目。若(vi,vj)∈E,那么称节点vj为节点vi的邻居。定义Ni={vj∈V:(vi,vj)∈E}作为节点vi的邻居集合。然而,在图中可能存在节点vi到其自身的边,即(vi,vi),则称节点vi存在自环,但是在本发明中的描述中,不考虑这样的边。
智能体之间的耦合程度往往在多智能体系统中需要通过对通讯的边赋予权值来刻画,拓扑图之间的连接结构通过引入邻接矩阵A=(aij)∈Rn×n来描述,其中aij表示权值,Rn×n表示n×n矩阵。连接此时相应的图就变为加权图。如果i≠j,那么当智能体i可以接收到智能体j的通讯信号时,此时aij>0;否则aij=0。定义入度矩阵D=(dii),其中
Figure BDA0002298553300000112
如果加权矩阵A均为0或1,即:
Figure BDA0002298553300000121
因此,若图G为对称图,那么矩阵A对称。
如果加权值更为特殊,即定义为
Figure BDA0002298553300000122
其中,wij是边(vi,vj)的权值,那么指向节点vi全部边的权值相加是节点vi的入度;同理,离开节点vi全部边的权值相加是节点vi的出度。
人们在研究多智能体的一致性过程时,引入了拉普拉斯矩阵L,定义为:
Figure BDA0002298553300000123
即L=D-A。通过研究拉普拉斯矩阵的性质,可以得到图特征与多智能体系统一致性之间的关系。
有界空间中一致性问题描述:对于n个智能体,第i个智能体的值用xi表示,它可以用来表示电压,温度,高度,位置等。
定义1:称节点i与节点j在网络拓扑中达到一致,当且仅当xi=xj,i≠j;如果任何两个节点i和j都有xi=xj,i≠j,那么称该拓扑达到一致性。
定义2:称二阶多智能体系统达到一致性,当且仅当针对任意节点随着时间t→∞都有:
Figure BDA0002298553300000124
这里首先考虑一组智能体在正三角形区域中运动,如图4所示是建立的笛卡尔坐标系,坐标原点为正三角形的左下角顶点,x轴沿着底边方向指向右方。
不失一般性,设定时间序列0<τ(1)<τ(2)<…是多智能体碰撞到墙壁时刻。建立运动方程如下:
Figure BDA0002298553300000131
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化;
Figure BDA0002298553300000132
分别表示位置的导数和速度的导数;pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合;n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示在t时刻速度的左极限和右极限,vi(t-)=lims→t-vi(s),vi(t+)=lims→t+vi(s);<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化,矩阵Δi(t)被定义为:
Figure BDA0002298553300000133
其中,δ为Dirac函数。
当t=τ(k)时,有:
Figure BDA0002298553300000134
从图5可以得到如下关系:
Figure BDA0002298553300000135
这意味着,当t=τ(k)时,发生了镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续。
而当t≠τ(k)时,有
Figure BDA0002298553300000141
说明当和墙壁不接触时,速度连续。
w表示垂直于n的单位向量,同时(n,w)满足右手规则,使得n×w方向垂直于纸面指向外。θ表示n与x之间的夹角,满足右手规则,并且n×x方向垂直于纸面朝向外则角度是正,反之是负。vi(t-)表示接触之前的速度向量,vi(t+)表示接触之后的速度向量。定义符号变量Li(t),接触之前为1,接触之后为-1。具体如图1所示:
定义镜像速度矩阵:
Figure BDA0002298553300000142
其中n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1。ki(0)=I2×2,Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))……ki(τ(k)),其中ki(τ(1)),ki(τ(2))…为碰撞后的值,即令Li(t)=-1。
定义镜像速度:
Figure BDA0002298553300000143
则当t=τ(k)时,有:
Figure BDA0002298553300000144
也就是说,当t=τ(k)时,实际速度vi(t)不是连续的,然而对于镜像速度
Figure BDA0002298553300000145
来说,总是连续的。
对于直线l:Ax+By+C=0(A2+B2≠0),M(x0,y0)关于直线l的对称点的坐标是N(x1,y1),则有
Figure BDA0002298553300000151
写成矩阵形式为:
Figure BDA0002298553300000152
其中,
Figure BDA0002298553300000153
即为镜像位置矩阵。
定义各个智能体镜像位置,有
Figure BDA0002298553300000154
Figure BDA0002298553300000155
其中
Figure BDA0002298553300000156
Qi(t)=qi(0)·qi(τ(1))·qi(τ(2))·····qi(τ(k)),qi(t)∈R3×3,qi(0)=I3×3,并且qi(t)的值即为智能体i所碰撞到的某一个墙面所对应的镜像位置矩阵M值。
注意到智能体的实际位置与其镜像位置关于碰撞点所在的切线镜像对称。对于实际有界空间以及边界上的某一个边界碰撞点,定义该有界空间中所有实际点关于此碰撞点所得到的镜像位置点集合作为此碰撞点的第Ⅰ层镜像空间。显然,对于不同的碰撞点,可能得到相同或不同的镜像空间,这个依赖于有界空间的几何特性。当然,对于边界上的某些点可能存在不唯一的切线,这些边界点称作奇点,这些点不作考虑。相似地,对于第Ⅰ层镜像空间以及此镜像空间中的边界碰撞点,可以定义该实际空间的第Ⅱ层镜像空间。借助该方法,可以依次定义第Ⅲ层空间,第Ⅳ层空间,……。把所有层次的镜像空间的集合称作该实际有界空间的镜像展开。具体如图2、图3所示。
对于本发明中的有界空间,做如下条件:
条件1:在镜像展开中的镜像点能够唯一映射到实际空间中的实际点。
(3)有界空间中一致性算法
下面提出控制算法为:
Figure BDA0002298553300000161
定理1:对于满足条件1的有界空间,考虑多智能体动态系统在公式(14)的作用下,如果无向图是连通的,那么在有界空间中,最终各智能体位置和速度渐近收敛到一致。
证明过程如下:首先,定义镜像加速度:
Figure BDA0002298553300000162
镜像位置和镜像速度分别在之前已定义,为
Figure BDA0002298553300000163
显然,
Figure BDA0002298553300000164
由于
Figure BDA0002298553300000165
则当t=τ(k)时,对
Figure BDA0002298553300000166
求导,得:
Figure BDA0002298553300000167
由于a2+b2=1,则
Figure BDA0002298553300000168
因此,
Figure BDA0002298553300000171
计算ki(t)的行列式,为:
Figure BDA0002298553300000172
因此,ki(t)可逆,而Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))…,所以Ki(t)也可逆。
Figure BDA0002298553300000173
可得:
Figure BDA0002298553300000174
引入势能函数:
Figure BDA0002298553300000175
求导,得:
Figure BDA0002298553300000176
然而,
Figure BDA0002298553300000181
因此,
Figure BDA0002298553300000182
由于无向图是连通的,根据LaSalle不变性定理,有
Figure BDA0002298553300000183
即当t→∞时,
Figure BDA0002298553300000184
那么代入(21),则有
Figure BDA0002298553300000185
Figure BDA0002298553300000186
任意η∈Rm×1,1n=[1,1,…,1]T,并且
Figure BDA0002298553300000187
表示Kronecker积,则
Figure BDA0002298553300000188
因为
Figure BDA0002298553300000189
所以
Figure BDA00022985533000001810
Figure BDA00022985533000001811
Figure BDA00022985533000001812
正交于
Figure BDA00022985533000001813
并且由于η的任意性,因此
Figure BDA00022985533000001814
Figure BDA00022985533000001815
Figure BDA0002298553300000191
因为
Figure BDA0002298553300000192
所以
Figure BDA0002298553300000193
Figure BDA0002298553300000194
因此,根据LaSalle不变性定理,当t→∞时,有
Figure BDA0002298553300000195
显然,对于正三角形空间来说,在镜像空间里面的点在实际空间中都有唯一的点与之对应,因此当多智能体在镜像空间中一致时,此时实际空间也达到了一致。
实施例
本实施例中进行仿真分析,在这部分,通过数值仿真来验证提出的算法可行性,分别在正三角形和椭圆中进行了仿真。
本文中选取n=10,智能体的起始位置坐标和速度向量随机选取。对于正三角形区域,正三角形的边长L=100,顶点坐标分别为(0,0),
Figure BDA0002298553300000196
(L,0),可以求出对应的θ={-π/2,π/6,5π/6},法向量
Figure BDA0002298553300000197
切向量
Figure BDA0002298553300000198
选取邻居矩阵
Figure BDA0002298553300000199
则无向图是连通的。
在三角形区域仿真结果如图6~图11所示,图6表示智能体的初始位置和速度,射线的方向表示速度方向,长度表示速度大小。10个智能体的轨迹图如图7所示。从图8可以看出大约100s,智能体的速度趋于一致,图9表示加速度随时间的变化,由于加入了饱和控制,可以将加速度限制在适当的范围,以免加速度过大。图10与图11分别表示智能体1与其他9个智能体之间的相对位置,大约100s后各智能体之间的位置差都为0,表示所有智能体汇合到一起。
然后,在椭圆区域中进行仿真,如图12~图17所示。由于在椭圆区域里,镜像区域里的点不能唯一映射到实际区域里的点。最终得出即使镜像空间中位置收敛到一致,但是实际空间中位置却不能。然而,所有智能体的速度仍然收敛到一致。
以此类推,可以将算法推广到任意空间中,各个智能体速度最终将会保持一致,从而实现编队部署。在实际部署时,经常遇到智能体在陌生地域进行作业,可以通过建立各个智能体之间的通信,实时获取邻居信息,从而分布式计算出自身速,并且还能通过位置势能函数控制各个智能体之间距离,最终保持一定的队形。
本发明提供了一种基于多智能体在有界陌生地域编队部署的方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (7)

1.一种基于多智能体在有界陌生地域编队部署的方法,其特征在于,包括如下步骤:
步骤1,建立多智能体二阶运动方程;
步骤2,定义镜像速度矩阵和镜像速度;
步骤3,建立有界空间中一致性控制算法;
步骤4,根据步骤3建立的算法对多智能体在有界陌生地域进行编队部署。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:设定一组智能体在正三角形区域中运动,建立笛卡尔坐标系,坐标原点为正三角形的左下角顶点,x轴沿着正三角形的底边方向指向右方,建立如下多智能体二阶运动方程:
Figure FDA0002298553290000011
Figure FDA0002298553290000012
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化;
Figure FDA0002298553290000013
分别表示位置的导数和速度的导数;pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合;n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示在t时刻的左极限和右极限;<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化。
3.根据权利要求2所述的方法,其特征在于,步骤1中,矩阵Δi(t)被定义为:
Figure FDA0002298553290000014
其中,δ为Dirac函数,k表示第k次碰撞,τ(k)表示第k次碰撞时刻。
4.根据权利要求3所述的方法,其特征在于,步骤1中,当t=τ(k)时,有:
Figure FDA0002298553290000021
其中,
Figure FDA0002298553290000022
表示在碰撞时刻t,对ui进行积分;
Figure FDA0002298553290000023
表示在碰撞时刻t,对Δi进行积分;s表示积分变量,I表示单位向量;
当t=τ(k)时,智能体与墙壁发生镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续;
当t≠τ(k)时,有:
Figure FDA0002298553290000024
说明当智能体与墙壁不接触时,速度连续。
5.根据权利要求4所述的方法,其特征在于,步骤2包括:
步骤2-1,用w表示垂直于n的单位向量,同时(n,w)满足右手规则,使得n×w方向垂直于纸面指向外;θ表示n与x轴之间的夹角,满足右手规则,并且n×x方向垂直于纸面朝向外则角度是正,反之是负;vi(t-)表示接触之前的速度向量,vi(t+)表示接触之后的速度向量,即左极限和右极限;定义符号变量Li(t),接触之前为1,接触之后为-1;
步骤2-2,定义镜像速度矩阵ki(t):
Figure FDA0002298553290000025
其中,法向单位向量n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1;定义ki(0)=I2×2,为单位向量;定义Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))·····ki(τ(k)),其中ki(τ(1)),ki(τ(2))…,ki(τ(k))分别表示第1次、2次、…、k次碰撞后的值,即令Li(t)=-1;
步骤2-3,定义镜像速度
Figure FDA0002298553290000026
Figure FDA0002298553290000031
则当t=τ(k)时,有:
Figure FDA0002298553290000032
即当t=τ(k)时,实际速度vi(t)不是连续的,对于镜像速度
Figure FDA0002298553290000033
来说,总是连续的;
Figure FDA0002298553290000034
Figure FDA0002298553290000035
分别是
Figure FDA0002298553290000036
在s=t的左极限和右极限。
6.根据权利要求5所述的方法,其特征在于,步骤2-3中,对于直线l:Ax+By+C=0,A2+B2≠0,点M(x0,y0)关于直线l的对称点的坐标是N(x1,y1),则有:
Figure FDA0002298553290000037
Figure FDA0002298553290000038
写成矩阵形式为:
Figure FDA0002298553290000039
其中,
Figure FDA00022985532900000310
即为镜像位置矩阵;
定义各个智能体镜像位置,有
Figure FDA00022985532900000311
Figure FDA0002298553290000041
其中,镜像位置
Figure FDA0002298553290000042
Figure FDA0002298553290000043
分别表示镜像位置
Figure FDA0002298553290000044
在x轴和y轴上的投影,Qi(t)=qi(0)·qi(τ(1))·qi(τ(2))·····qi(τ(k)),qi(t)∈R3×3,qi(0)=I3×3,并且qi(τ(k))表示第i个智能体在第k次碰撞到墙壁所对应的镜像位置矩阵M值,Qi(t)即为所有碰撞时刻镜像位置矩阵乘积;
Figure FDA0002298553290000045
分别表示位置向量pi在x轴和y轴上的投影。
7.根据权利要求6所述的方法,其特征在于,步骤3包括:建立有界空间中一致性控制算法:
Figure FDA0002298553290000046
其中,ui(t)表示控制输入,
Figure FDA0002298553290000047
表示逆矩阵,aij表示加权系数;Kj(t)表示第j个智能体的镜像速度矩阵;vj(t)表示第j个智能体速度;
定义镜像加速度
Figure FDA0002298553290000048
Figure FDA0002298553290000049
根据镜像位置矩阵和镜像速度,得到:
Figure FDA00022985532900000410
Figure FDA00022985532900000411
由于
Figure FDA00022985532900000412
其中
Figure FDA00022985532900000413
表示符号函数Li(t)的导数;则当t=τ(k)时,对
Figure FDA00022985532900000414
求导,得:
Figure FDA0002298553290000051
由于a2+b2=1,则:
Figure FDA0002298553290000052
因此,
Figure FDA0002298553290000053
计算ki(t)的行列式,为:
Figure FDA0002298553290000054
因此,ki(t)可逆,而Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))…,所以Ki(t)也可逆;
Figure FDA0002298553290000055
得到:
Figure FDA0002298553290000056
通过引入势能函数H(t):
Figure FDA0002298553290000061
对其求导,得:
Figure FDA0002298553290000062
根据:
Figure FDA0002298553290000063
因此,
Figure FDA0002298553290000064
由于无向图是连通的,根据LaSalle不变性定理,得到:
Figure FDA0002298553290000071
即当t→∞时,
Figure FDA0002298553290000072
代入如下公式中:
Figure FDA0002298553290000073
则有镜像控制输入
Figure FDA0002298553290000074
Figure FDA0002298553290000075
T表示转置,
Figure FDA0002298553290000076
表示
Figure FDA0002298553290000077
转置;任意η∈Rm×1表示m×1维列向量,定义1n=[1,1,…,1]T,并且
Figure FDA0002298553290000078
表示Kronecker积,则:
Figure FDA0002298553290000079
因为
Figure FDA00022985532900000710
所以
Figure FDA00022985532900000711
Figure FDA00022985532900000712
Figure FDA00022985532900000713
正交于
Figure FDA00022985532900000714
并且由于η的任意性,因此
Figure FDA00022985532900000715
Figure FDA00022985532900000716
有:
Figure FDA00022985532900000717
因为
Figure FDA00022985532900000718
所以
Figure FDA00022985532900000719
得:
Figure FDA00022985532900000720
根据LaSalle不变性定理,当t→∞时,有:
Figure FDA0002298553290000081
因此,对于正三角形空间来说,在镜像空间里面的点在实际空间中都有唯一的点与之对应,因此当多智能体在镜像空间中一致时,此时实际空间也达到了一致。
CN201911212636.1A 2019-12-02 2019-12-02 一种基于多智能体在有界陌生地域编队部署的方法 Active CN111123971B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911212636.1A CN111123971B (zh) 2019-12-02 2019-12-02 一种基于多智能体在有界陌生地域编队部署的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911212636.1A CN111123971B (zh) 2019-12-02 2019-12-02 一种基于多智能体在有界陌生地域编队部署的方法

Publications (2)

Publication Number Publication Date
CN111123971A true CN111123971A (zh) 2020-05-08
CN111123971B CN111123971B (zh) 2022-08-16

Family

ID=70496643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911212636.1A Active CN111123971B (zh) 2019-12-02 2019-12-02 一种基于多智能体在有界陌生地域编队部署的方法

Country Status (1)

Country Link
CN (1) CN111123971B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104865960A (zh) * 2015-04-29 2015-08-26 山东师范大学 基于平面的一种多智能体队形控制方法
CN105116899A (zh) * 2015-08-28 2015-12-02 浙江工业大学 基于eso的分布式多移动机器人编队控制方法
CN108445768A (zh) * 2018-05-29 2018-08-24 福州大学 空间机器人操作空间轨迹跟踪的增广自适应模糊控制方法
CN109062204A (zh) * 2018-07-25 2018-12-21 南京理工大学 一种基于跟随领航者编队的多移动机器人控制系统
CN109683626A (zh) * 2018-11-08 2019-04-26 浙江工业大学 一种基于自适应rbf神经网络的四旋翼无人机编队控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104865960A (zh) * 2015-04-29 2015-08-26 山东师范大学 基于平面的一种多智能体队形控制方法
CN105116899A (zh) * 2015-08-28 2015-12-02 浙江工业大学 基于eso的分布式多移动机器人编队控制方法
CN108445768A (zh) * 2018-05-29 2018-08-24 福州大学 空间机器人操作空间轨迹跟踪的增广自适应模糊控制方法
CN109062204A (zh) * 2018-07-25 2018-12-21 南京理工大学 一种基于跟随领航者编队的多移动机器人控制系统
CN109683626A (zh) * 2018-11-08 2019-04-26 浙江工业大学 一种基于自适应rbf神经网络的四旋翼无人机编队控制方法

Also Published As

Publication number Publication date
CN111123971B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
Wang et al. A multilayer path planner for a USV under complex marine environments
CN109324636A (zh) 基于二阶一致性和自抗扰的多四旋翼主从式协同编队控制方法
Apriliani et al. Ensemble and Fuzzy Kalman Filter for position estimation of an autonomous underwater vehicle based on dynamical system of AUV motion
Alexopoulos et al. A comparative study of collision avoidance techniques for unmanned aerial vehicles
Yang et al. Target-enclosing affine formation control of two-layer networked spacecraft with collision avoidance
Tang et al. Swarm robots search for multiple targets based on an improved grouping strategy
Qian et al. Robust formation maneuvers through sliding mode for multi-agent systems with uncertainties
Imanberdiyev et al. A fast learning control strategy for unmanned aerial manipulators
Xu et al. Two-layer distributed hybrid affine formation control of networked Euler–Lagrange systems
Hassani et al. Path planning for marine vehicles using Bézier curves
Cong et al. Formation control for multiquadrotor aircraft: Connectivity preserving and collision avoidance
CN113342015A (zh) 一种分布式海域跨介质异构系统一致性编队方法
CN106406097A (zh) 多机械臂系统的分布式自适应协调控制方法
CN111007848B (zh) 一种基于有界空间的多智能体协同作业控制方法
Litimein et al. Circular formation control with collision avoidance based on probabilistic position
Chen et al. A distributed coverage algorithm for multi-UAV with average voronoi partition
Enjiao et al. Finite-time control of formation system for multiple flight vehicles subject to actuator saturation
CN111123971B (zh) 一种基于多智能体在有界陌生地域编队部署的方法
Lin et al. Adaptive neuro-fuzzy formation control for leader-follower mobile robots
Wu et al. Distance-based formation tracking control of multi-agent systems with double-integrator dynamics
Shen et al. Hierarchical formation control with applications to multi-quadrotor systems
CN114943168A (zh) 一种水上浮桥组合方法及系统
CN114265315A (zh) 异构线性集群系统时变输出编队跟踪控制方法及系统
DeVries et al. Kernel design for coordination of autonomous, time-varying multi-agent configurations
Vlahakis et al. Cooperative distributed LQR control for longitudinal flight of a formation of non-identical low-speed experimental UAV's

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 210000 No.1, Lingshan South Road, Qixia District, Nanjing City, Jiangsu Province

Applicant after: THE 28TH RESEARCH INSTITUTE OF CHINA ELECTRONICS TECHNOLOGY Group Corp.

Address before: 210007 No. 1 East Street, alfalfa garden, Jiangsu, Nanjing

Applicant before: THE 28TH RESEARCH INSTITUTE OF CHINA ELECTRONICS TECHNOLOGY Group Corp.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant