CN111007848B - 一种基于有界空间的多智能体协同作业控制方法 - Google Patents
一种基于有界空间的多智能体协同作业控制方法 Download PDFInfo
- Publication number
- CN111007848B CN111007848B CN201911240049.3A CN201911240049A CN111007848B CN 111007848 B CN111007848 B CN 111007848B CN 201911240049 A CN201911240049 A CN 201911240049A CN 111007848 B CN111007848 B CN 111007848B
- Authority
- CN
- China
- Prior art keywords
- agent
- velocity
- space
- mirror
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 239000003795 chemical substances by application Substances 0.000 claims description 182
- 239000013598 vector Substances 0.000 claims description 49
- 239000011159 matrix material Substances 0.000 claims description 42
- 238000006073 displacement reaction Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 8
- 239000002184 metal Substances 0.000 claims description 5
- 229910052751 metal Inorganic materials 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 2
- 230000006870 function Effects 0.000 abstract description 32
- 238000005381 potential energy Methods 0.000 abstract description 22
- 238000004422 calculation algorithm Methods 0.000 abstract description 21
- 238000004891 communication Methods 0.000 abstract description 7
- 238000013461 design Methods 0.000 abstract description 3
- 238000004088 simulation Methods 0.000 description 10
- 238000011160 research Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000009341 apiculture Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明提供了一种基于有界空间的多智能体协同作业控制方法,目前绝大部分多智能体一致性算法都依赖于位置和速度信息反馈。在许多生物群集运动中,通信频率通常不会太高,这意味着像速度这些反馈信息可能是多余的。从工程角度来看,作为控制器一部分的速度分量如果被淘汰的话,那么将大大降低通信代价。考虑到智能体在有界空间中运动,碰到墙壁反弹时不可避免地发生碰撞,因此之前算法不能有效地控制多智能体完成群集与避障问题。本发明分别对智能体在实际空间以及虚拟空间中建立势能函数,设计分布式控制的避障和群集策略,利用虚拟导航信息,为智能体增加目标信息导航,避免各个智能体由于避碰而导致速度下降,从而实现多智能体系统群集运动。
Description
技术领域
本发明属于指挥控制领域,尤其涉及一种基于有界空间的多智能体协同作业控制方法。
背景技术
随着科学计算的快速发展,运用当今科技去处理复杂问题的需求对于人们来说越来越迫切。然而人们发现仅仅通过个体去解决一些复杂问题会越来越棘手,不但在专业技术层面上严格要求,并且很多问题需要许多个体密切协作才能解决。
多智能体协调合作控制问题的研究近几年来深受人们的广泛关注。其中作为合作控制基础的一致性问题,已经在同步、聚集问题、蜂拥控制、编队控制等研究中被广泛应用。
蜂拥现象在自然世界中广泛存在,例如蜂群、鱼群、鸟群以及蚁群等等,它能够提高它们找到食物的概率,并且能够帮助它们避开天敌。
Reynolds研究了在生物学中的蜂拥现象,并且建立了相应的数学模型,以及提出了被以后的研究者一直遵循的蜂拥三准则。Olfati-Saber在针对蜂拥控制避障上面取得重要的成果,提出了一种人工势能函数,使得智能体在不发生碰撞时,每一个智能体的速度状态最终趋于一致。因此可以发现,一致性研究在蜂拥理论中主要是用于让每一个智能体的速度状态达到一致。除此以外,如果随机选取初始状态时,也许会出现智能体群落分裂的情形,为了避免发生该情况,文章中又研究了带有虚拟领导者的蜂拥控制算法。Tanner和Jadbabaie还研究了在Reynolds模型基础上的一致性算法,对蜂拥行为的控制以及稳定性进行了严格证明,考虑个体间的吸引力和排斥力,分别讨论了固定拓扑和切换拓扑的蜂拥控制问题。
目前,针对多智能体系统的蜂拥控制已经获得了相当多的研究成果,但是仍然还有很多问题待解决。今后,考虑到通信时延问题的多智能体系统的蜂拥控制算法是需要解决的问题。另外,多智能体系统拓扑结构为有向图的蜂拥控制也是一个新的研究内容,还有,就是要将非线性理论运用到蜂拥控制算法中,从而拓宽蜂拥控制算法的应用领域。
近年来,越来越引起人们广泛关注的编队控制问题,被广泛应用在无人飞行器系统,水下舰队,地面无人小车等系统中。编队控制需要该系统中的每一个个体能保持规定的图形。在分布式编队控制中,每一个智能体都了解最终要保持的图形,然而每个智能体的位置只能通过信息交流来协调控制。因此,编队控制问题也是特殊的一致性问题。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于有界空间的多智能体协同作业控制方法,包括如下步骤:
步骤1,建立多智能体二阶运动方程;
步骤2,定义镜像速度矩阵和镜像速度;
步骤3,建立多智能体无速度反馈的有界空间一致性控制方法;
步骤4,建立多智能体在有界空间中的群集控制方法;
步骤5,建立基于实物机器人的一致性控制方法。
本发明中,步骤1包括:
步骤1-1,设定一组智能体在正三角形区域中运动,建立如下多智能体二阶运动方程:
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化;分别表示位置的导数和速度的导数;pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合;n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示t的左极限和右极限;<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化,矩阵Δi(t)被定义为:
其中,δ为Dirac函数,k表示第k次碰撞,τ(k)表示第k次碰撞时刻;
步骤1-2,当t=τ(k)时,智能体与墙壁发生镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续;
而当t≠τ(k)时,有:
说明当智能体与墙壁不接触时,速度连续。
步骤2包括:
步骤2-1,定义如下镜像速度矩阵ki(t):
其中,法向单位向量n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1;定义ki(0)=I2×2,为单位向量;定义Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))……ki(τ(k)),其中ki(τ(1)),ki(τ(2))…,ki(τ(k))分别表示第1次、2次、…、k次碰撞后的值,即令Li(t)=-1;
步骤3包括:建立如下无速度反馈的有界空间一致性控制方程:
其中,T∈R2×2,且为Huiwitz矩阵;P∈R2×2是对称正定阵,并且满足Lyapunov方程TTP+PT=-Q,其中Q∈R2×2,也是对称正定阵。表示xi的位置估计,表示的一阶导数,yi表示中间变量,ui表示控制输入,和分别表示第i个智能体的镜像位置和第j个智能体的镜像位置,表示Ki(t)的逆矩阵。
步骤4包括:建立如下多智能体在有界空间中的群集控制方程:
ui=fi α+fi β+fi γ+fi η
其中,ui表示第i个智能体的控制量,fi α是实现多智能体在虚拟空间中形成群集的控制项,fi β是避免多智能体在实际空间中发生碰撞的控制项,fi γ是实现速度达到一致的控制项,fi η是实现目标导航反馈的控制项。
步骤4中,所述控制项的具体表达式如下:
其中,c1,c2为反馈增益调节项,c1,c2>0;Ki和Kj分别表示第i个和第j个智能体在所有碰撞时刻镜像矩阵的乘积;表示梯度函数;表示在镜像空间中第i和j智能体之间的相对位置;φ(||pij||)表示在实际空间中第i个和第j个智能体之间的相对距离函数;表示在镜像空间中目标智能体r的位置;表示在镜像空间中目标智能体r的位速度;vj表示第j个智能体的速度向量。
步骤5包括:所述实物机器人是移动小车模型,其控制量为角速度和线速度,机器人的动态系统为:
引入坐标变换,即pi=ξi+d[cosφi sinφi]T,其中,ξi表示质心位置,φi表示角位移,d表示控制点偏离质心的距离,d>0,令:
得到:
根据:vi(t+)=(I-2n·nT)vi(t-)。其中,vi(t-)和vi(t+)分别表示第i个智能体速度矢量在t时刻的左极限和右极限。和分别表示第i个智能体线速度在t时刻的左极限和右极限。φi(t-)和φi(t+)分别表示第i个智能体角位移在t时刻的左极限和右极限。ωi(t-)和ωi(t+)分别表示第i个智能体角速度在t时刻的左极限和右极限。
当t=τ(k),对于三角形底边,得出φi(t+)=-φi(t-),并且n=[01]T,I为单位矩阵,则:
得到:
因此,
和
当t=τ(k),对于三角形左斜边,有:
ωi(t+)=-ωi(t-)。
有益效果:本发明基于多智能体在有界区域内编队部署,提出了有界空间中在无速度反馈情况下的一致性算法。通过观测器的方法去除速度的反馈,大大降低通信代价。除此以外,无速度反馈控制方法对于那些没有安装传感器的多智能体系统以及速度传感器测量不够精确的情况来说将会更加有意义。接下来设计了在有界空间中多智能体能够形成群集并且能够避碰的控制算法,提升了多智能体系统控制算法在实际环境中的实用性。考虑到智能体不同的控制要求,设计了两种不一样的势能函数,分别为镜像空间中的势能函数和实际空间中的势能函数,然后在控制律中加入这两种势能函数,并且引入速度一致项,同时利用追踪目标信息引入了导航反馈项,以此来完成多智能体系统在有界空间中的群集和避碰运动。最后提出了针对实际平台的多机器人控制算法,将前面算法中的横、纵坐标控制变量的形式转换成机器人角速度和线速度的形式。然后在实物机器人平台进行实验,得到仿真结果,检验了多机器人在有界空间中一致性算法的有效性和收敛性。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是入射速度、反射速度及镜像速度之间关系图。
图2是移动机器人小车的模型。
图3是正三角形区域坐标系。
图4是碰撞面入射向量和反射向量关系图。
图6是实际空间的势能函数ψ(||pij||)。
图7是矩形区域10个智能体初始位置及速度。
图8是矩形区域10个智能体的轨迹图。
图9是矩形区域10个智能体的速度。
图10是矩形区域10个智能体的加速度。
图11是矩形区域智能体1与其他智能体的x轴相对位置。
图12是矩形区域智能体1与其他智能体的y轴相对位置。
图13是三角形区域中智能体初始位置及速度。
图14是三角形区域中智能体的轨迹图。
图15是三角形区域中智能体在400s时刻的位置与速度。
图16是三角形区域中智能体的速度。
图17是三角形区域中智能体的加速度。
图18是3个机器人在正三角形区域中的轨迹图。
具体实施方式
一般地,针对多智能体一致性系统的研究,通常用图的形式来描述系统的拓扑结构,即智能体与邻居之间的通信关系,接下来将主要介绍一些关于图和矩阵方面的性质。
(1)数学相关知识
根据代数图形理论,多智能体网络系统拓扑结构使用图G=(V,ε)来表示,其中,顶点集合用V={1,2,…,n}来表示,边的集合由ε∈V×V构成。节点编号为i∈{1,2,…,n}。如果信息交换发生在第i个节点vi与第j个节点vj之间,此时说明有相连的边在这个节点对之间。由于节点对在无向图里是无序的,所以在节点之间的边是无向的,即但是对于有向图来说,由于边不一定完全连通,因此若在第i个节点与第j个节点之间有边指向并不能说明第j个节点与第i个节点有边指向,也就是说它们之间是有向边。如果在图G里,任何两个节点之间都有连接的边,那么图G则是完全图。在有向图中,vi的出度是指由节点vi开始的边的数目,vi的入度是指指向节点vi的边的数目。若(vi,vj)∈E,那么称节点vj为节点vi的邻居。定义Ni={vj∈V:(vi,vj)∈E}作为节点vi的邻居集合。然而,在图中可能存在节点vi到其自身的边,即(vi,vi),称节点vi存在自环,但是在本发明中的多智能体系统描述中,不考虑这样的边。
智能体之间的耦合程度往往在多智能体系统中需要通过对通讯的边赋予权值来刻画,拓扑图之间的连接结构通过引入邻接矩阵A=(aij)∈Rn×n来描述,其中aij表示权值,Rn×n表示n×n矩阵。连接此时相应的图就变为加权图。如果i≠j,那么当智能体i可以接收到智能体j的通讯信号时,此时aij>0;否则aij=0。定义入度矩阵D=(dii),其中如果加权矩阵A均为0或1,即:
因此,若图G为对称图,那么矩阵A对称。
如果加权值更为特殊,即定义为:
其中,wij是边(vi,vj)的权值,那么指向节点vi全部边的权值相加是节点vi的入度;同理,离开节点vi全部边的权值相加是节点vi的出度。
人们在研究多智能体的一致性过程时,引入了拉普拉斯矩阵L,定义为:
即L=D-A。通过研究拉普拉斯矩阵的性质,可以得到图特征与多智能体系统一致性之间的关系。
(2)有界空间中一致性问题描述
对于n个智能体,第i个智能体的值用xi表示,它可以用来表示电压,温度,高度,位置等。
定义1称第i个节点与第j个节点在网络拓扑中达到一致,当且仅当xi=xj,i≠j;如果任何两个节点i和j都有xi=xj,i≠j,那么称该拓扑达到一致性。
定义2称二阶多智能体系统达到一致性,当且仅当针对任意节点随着时间t→∞都有:
本发明首先考虑一组智能体在正三角形区域中运动,如图3所示是建立的笛卡尔坐标系,坐标原点为正三角形的左下角顶点,x轴沿着底边方向指向右方。
不失一般性,设定时间序列0<τ(1)<τ(2)<…是多智能体碰撞到墙壁时刻,τ(1)表示第1次碰撞时刻,τ(2)表示第2次碰撞时刻,…。建立运动方程如下:
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化;分别表示位置的导数和速度的导数;pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合;n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示vi(s)在s=t的左极限和右极限,vi(t-)=lims→t-vi(s),vi(t+)=lims→t+vi(s);<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化,矩阵Δi(t)被定义为:
其中,δ为Dirac函数,k表示第k次碰撞,τ(k)表示第k次碰撞时刻。
当t=τ(k)时,有:
其中,I表示单位向量。
从图4可以得到如下关系:
这意味着,当t=τ(k)时,智能体与墙壁发生镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续;
而当t≠τ(k)时,有:
说明当智能体与墙壁不接触时,速度连续。
w表示垂直于n的单位向量,同时(n,w)满足右手规则,使得n×w方向垂直于纸面指向外。x表示横坐标轴,θ表示n与x之间的夹角,满足右手规则,并且n×x方向垂直于纸面朝向外则角度是正,反之是负。vi(t-)表示智能体i接触墙壁之前的速度向量,vi(t+)表示智能体i接触墙壁之后的速度向量。定义符号变量Li(t),接触之前Li(t)为1,接触之后Li(t)为-1。具体如图1所示:
定义如下镜像速度矩阵ki(t):
其中,法向单位向量n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1;定义ki(0)=I2×2,为单位向量;定义Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))……ki(τ(k)),其中ki(τ(1)),ki(τ(2))…,ki(τ(k))分别表示第1次、2次、…、k次碰撞后的值,即令Li(t)=-1;
对于直线l:Ax+By+C=0(A2+B2≠0),点M(x0,y0)关于直线l的对称点的坐标是N(x1,y1),则有:
写成矩阵形式为:
其中,镜像位置 分别表示镜像位置在x轴和y轴上的投影,Qi(t)=qi(0)·qi(τ(1))·qi(τ(2))……qi(τ(k)),qi(t)∈R3×3,qi(0)=I3×3,并且qi(τ(k))表示第i个智能体在第k次碰撞到墙壁所对应的镜像位置矩阵M值,Qi(t)即为所有碰撞时刻镜像位置矩阵乘积。分别表示位置向量pi在x轴和y轴上的投影。
(3)无速度反馈的有界空间一致性算法
下面提出控制算法为:
其中,T∈R2×2,且为Huiwitz矩阵;P∈R2×2是对称正定阵,并且满足Lyapunov方程TTP+PT=-Q,其中Q∈R2×2,也是对称正定阵。表示xi的位置估计,表示的一阶导数,yi表示中间变量,ui表示控制输入,和分别表示第i和j智能体的镜像位置,表示Ki(t)的逆矩阵。
定理1:考虑多智能体动态系统运动方程(5)在公式(14)作用下,如果无向图是连通的,那么在有界空间中,最终各个智能体的位置和速度渐近收敛到一致。
证明:令y=[y1 T,y2 T,…,yn T]T,其中,表示第n个智能体在镜像空间中位置,表示第n个智能体在镜像空间中速度,yn为中间变量,表示第n个智能体位置估计,表示第n个智能体在镜像空间中控制输入。可以得到:
并且,
则将公式(14)写成如下形式:
其中,In为n×n的单位阵,I2为2×2的单位阵,L为拉普拉斯矩阵。注意到,如果图为无向图,那么L为对称半正定矩阵。
构造如下Lyapunov函数H:
根据Kronecker乘法性质,有:
所以,
将公式(25)代入公式(17),有:
因此,
由于:
其中,η∈Rm×1,1n=[1,1,…,1]T。
所以,
则根据(27),得:
因此,
所以,根据Lasalle不变性定理,当t→∞,有:
(4)多智能体在有界空间中的群集算法
该算法通过设计输入向量ui(t),使得多智能体群在追踪虚拟运动目标的过程中逐渐形成群集,并且在这一过程中能够成功避免各个智能体之间发生碰撞,最终实现群集状态下目标跟踪。
在本发明中,每个智能体之间作用是相互的,所以通过用无向图来表示该系统的拓扑结构。无向图G是由顶点集合V={1,2,…,n}与边集合组成的,并且(i,j)=(j,i)。定义顶点i的邻接集为Ni={j∈V|(i,j)∈E}。A=(aij)表示无向图的邻接矩阵,其中,如果(i,j)∈E,则aij=1,否则aij=0。在多智能体群集系统中,如果两个智能体之间存在相互作用,则可以认为它们是相互邻接的,在拓扑结构上表现为相互连通。与图论中邻居集合的定义相似,多智能体系统中邻居集合可以定义成:
Ni={j∈E:||pj-pi||<r} (33)
其中,r代表智能体之间最大感应半径,pi和pj分别表示第i和j智能体的位置,智能体i与智能体j之间相对距离记成||pij||=||pi-pj||。
需要定义两种不一样的势能函数,使得多智能体在有界空间中不仅可以形成群集,同时能够顺利完成避障。为了实现上述目的,要求进行分别控制。首先,针对虚拟空间中多智能体群集,考虑各个智能体的感知半径,当智能体之间距离较远时相互吸引,靠的太近时则又相互排斥。如果超出智能体的感知半径的话,则智能体之间没有相互作用,从而最终使得各个智能体之间的距离大小能够趋向于稳定值。然后,针对在实际空间中的多智能体群集,由于智能体碰到墙壁后反弹时,在虚拟空间中它们即使没有相碰,但是在实际空间中它们也许已经相碰,这不符合实际情况。因此还需要针对实际空间来设计一个新的势能函数,从而达到在实际空间中避障的目的。总的来说,势能函数满足连续、可差分、非负的特性,就能满足实现控制目标的要求。由此,可以定义控制智能体实现群集的势能函数如下:
下面这个例子即满足上述势能函数的所有特性(如图5所示):
为了实现在实际空间中能够成功避障,还要求在实际空间中建立势能函数。智能体在实际空间中感知半径是r′,当智能体它们之间实际距离在感知半径r′内时,它们之间将表现为排斥。因此定义如下控制智能体在实际空间中的势能函数,从而成功完成避障:
定义4(实际空间中智能体间的势能函数):势能函数ψ(||pij||)是一个关于智能体它们之间实际距离||pij||的非负、连续可微、无界函数,并且满足:||pij||→rd时,ψ(||pij||)→∞;pij||∈(rd,r]上,ψ(||pij||)单调递减;||pij||=r时截止。pij表示在实际空间中智能体之间的相对位置。rd表示在实际空间中智能体之间最小距离。
令参数z=||pij||,可以将实际空间中的势能函数定义如下:
其中,
下面这个例子即满足上述势能函数的所有特性(如图6所示):
本发明将由定义的势能函数来设计多智能体的控制量ui,从而操控多智能体在跟踪目标的同时能够逐渐形成群集,并且能够达到有效避障效果。此系统追踪虚拟运动目标所做的是匀速直线运动,且状态用来表示。其中,表示在镜像空间中目标智能体的位置。表示在镜像空间中目标智能体的速度。
根据以下控制要求:(1)多智能体之间逐渐集合,速度一致并且不可以有碰撞发生;(2)多智能体追踪目标,最终和虚拟目标速度大小和方向均一致。因此,可以把ui分成接下来四个部分来设计:
ui=fi α+fi β+fi γ+fi η (37)
其中,fi α是实现多智能体在虚拟空间中形成群集的控制项,fi β是避免多智能体在实际空间中发生碰撞的控制项,fi γ是实现速度达到一致的控制项,fi η是实现目标导航反馈的控制项。各部分具体表达式如下:
其中,c1,c2为反馈增益调节项,c1,c2>0。Ki和Kj表示第i和j智能体在所有碰撞时刻镜像矩阵的乘积。表示梯度函数。表示在镜像空间中第i和j智能体之间的相对位置。φ(||pij||)表示在实际空间中第i和j智能体之间的相对距离函数。表示在镜像空间中目标智能体r的位置。表示在镜像空间中目标智能体r的位速度。vj表示第j个智能体的速度向量。
(5)基于实物机器人平台上的一致性算法
如图2所示,本发明中的Amigo机器人使用的是移动小车模型,其控制量只能为角速度和线速度。因此,本发明还需要将机器人的横、纵坐标控制变量的形式转换成角速度和线速度的形式,从而控制智能机器人。机器人的动态系统为:
为了避免式(39)的非线性,引入坐标变换,即pi=ξi+d[cosφi sinφi]T,其中,ξi表示质心位置,φi表示角位移,d表示控制点偏离质心的距离,d>0,令:
可以得到:
根据前面结论,有vi(t+)=(I-2n·nT)vi(t-)。其中,vi(t-)和vi(t+)分别表示第i个智能体速度矢量在t时刻的左极限和右极限。和分别表示第i个智能体线速度在t时刻的左极限和右极限。φi(t-)和φi(t+)分别表示第i个智能体角位移在t时刻的左极限和右极限。ωi(t-)和ωi(t+)分别表示第i个智能体角速度在t时刻的左极限和右极限。
当t=τ(k),对于三角形底边,得出φi(t+)=-φi(t-),并且n=[01]T,I为单位矩阵,则
因此,
和
因此,
和
同理,当t=τ(k),对于三角形左斜边来说,有同样的结论,即
实施例1
(1)无速度反馈控制算法仿真分析
本实施例通过数值仿真来验证多智能体在无速度反馈下,最终速度和位置达到一致。本实施例选择10个智能体在矩形区域中运动,智能体的起始位置坐标和速度向量随机选取。对于矩形区域,选择长和宽均为100,顶点坐标分别为(0,0),(100,0),(100,100),(0,100),求出对应的θ={-π/2,π,π/2,0},法向量n={(0,1),(-1,0),(0,-1),(1,0)},切向量w={(-1,0),(0,-1),(1,0),(0,1)}。邻居矩阵则无向图是连通的。
实验结果如图7~图12所示,图7描述了智能体初始位置和速度,射线方向代表速度方向,长度代表速度大小。图8表示10个智能体的轨迹图,从图中可以看出一开始智能体的轨迹抖动比较厉害,这是因为状态估计中有着微分环节,可以使系统收敛周期缩短。从图9可以看出大约35s左右,智能体的速度趋于一致,起初速度震荡比较明显。图10表示智能体加速度随着时间变化。图11与图12分别表示智能体1与其他9个智能体之间的相对位置,大约60s后各智能体之间的位置差都为0,表示所有智能体汇合到一起。
实施例2
(2)群集控制协同作业方法仿真分析
本实施例通过数值仿真来验证提出的方法的可行性,本实施例在正三角形区域中进行仿真试验。
首先,选择10个智能体在正三角形区域中运动,智能体的起始位置坐标和速度向量随机选取,其中第1个智能体为领导者。对于正三角形区域,正三角形的边长L=100,顶点坐标分别为(0,0),(L,0),可以求出对应的θ={-π/2,π/6,5π/6},法向量切向量邻居矩阵则无向图是连通的。具体仿真结果如图13、图14、图15、图16、图17所示。
实施例3
(3)实物机器人平台上仿真分析
通过使用实物机器人仿真环境来检验算法可行性,使用3个机器人小车,并且控制参数为n=3,d=0.02m,采样时间为T=0.015s,并且初始条件为:
p1(0)=[5 2.8]Tm,p2(0)=[5 1.8]Tm,p3(0)=[5 0.8]Tm
v1(0)=120mm/s,v2(0)=80mm/s,v3(0)=40mm/s
φ1(0)=2π/3,φ2(0)=5π/6,φ3(0)=8π/9
首先,让3个机器人小车在该区域中先自由运行一会儿,使得所有小车都获得一定的初始速度。然后,一致性算法开始作用,虽然3个机器人刚开始的速度不相同,但是经历了几次碰撞后,这些机器人的速度逐渐趋于一致。发现当机器人小车与墙壁碰撞时,发生镜面发射。同时,当增大参数d时,那么机器人小车将缓慢地转弯。相反,如果减小此参数,则机器人将做急转弯,而且变得不稳定,换句话说,即鲁棒性变差。虽然,有时候实际速度方向相互之间不平行,然而它们的镜像速度方向总是平行的。并且,经历许多次与墙壁发生碰撞后,实际速度也逐渐趋向于一致。发现最终机器人将以相同的速度运动。从图18中可以看出,最终的仿真结果和理论证明结果一致。
本发明提供了一种基于有界空间的多智能体协同作业控制方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (1)
1.一种基于有界空间的多智能体协同作业控制方法,其特征在于,包括如下步骤:
步骤1,建立多智能体二阶运动方程;
步骤2,定义镜像速度矩阵和镜像速度;
步骤3,建立多智能体无速度反馈的有界空间一致性控制方法;
步骤4,建立多智能体在有界空间中的群集控制方法;
步骤5,建立基于实物机器人的一致性控制方法;
步骤1包括:
步骤1-1,设定一组智能体在正三角形区域中运动,建立如下多智能体二阶运动方程:
其中,i∈{1,2,...,n}表示智能体编号,pi、vi、ui分别代表位置向量、速度向量和输入向量,并且随着时间t而变化;分别表示位置的导数和速度的导数;pi=[pi x,pi y]T,vi=[vi x,vi y]T,ui=[ui x,ui y]T∈R2,上标分别表示x轴和y轴,pi x,pi y分别表示位置向量pi在x轴和y轴上的投影,vi x,vi y分别表示速度向量vi在x轴和y轴上的投影,ui x,ui y分别表示输入向量ui在x轴和y轴上的投影;R表示实数集合;n表示法向单位向量,方向指向正三角形内;vi(t-)和vi(t+)分别表示在t的左极限和右极限;<vi(t-),n>表示内积;Δi(t)是碰撞矩阵,并且在碰撞瞬间发生变化,矩阵Δi(t)被定义为:
其中,δ为Dirac函数,k表示第k次碰撞,τ(k)表示第k次碰撞时刻;
步骤1-2,当t=τ(k)时,智能体与墙壁发生镜面碰撞,vi(t-)和vi(t+)分别为入射方向和反射方向,速度不再连续;
而当t≠τ(k)时,有:
说明当智能体与墙壁不接触时,速度连续;
步骤2包括:
步骤2-1,定义如下镜像速度矩阵ki(t):
其中,法向单位向量n=[a,b]T,w=[-b,a]T,并且满足a2+b2=1;定义ki(0)=I2×2,为单位向量;定义Ki(t)=ki(0)·ki(τ(1))·ki(τ(2))·····ki(τ(k)),其中ki(τ(1)),ki(τ(2))…,ki(τ(k))分别表示第1次、2次、…、k次碰撞后的值,即令Li(t)=-1;
步骤3包括:建立如下无速度反馈的有界空间一致性控制方程:
其中,T∈R2×2,且为Huiwitz矩阵;P∈R2×2是对称正定阵,并且满足Lyapunov方程TTP+PT=-Q,其中Q∈R2×2,也是对称正定阵;表示xi的位置估计,表示的一阶导数,yi表示中间变量,ui表示控制输入,和分别表示第i个智能体的镜像位置和第j个智能体的镜像位置,表示Ki(t)的逆矩阵;
步骤4包括:建立如下多智能体在有界空间中的群集控制方程:
ui=fi α+fi β+fi γ+fi η
其中,ui表示第i个智能体的控制量,fi α是实现多智能体在虚拟空间中形成群集的控制项,fi β是避免多智能体在实际空间中发生碰撞的控制项,fi γ是实现速度达到一致的控制项,fi η是实现目标导航反馈的控制项;
步骤4中,所述控制项的具体表达式如下:
其中,c1,c2为反馈增益调节项,c1,c2>0;Ki和Kj分别表示第i个和第j个智能体在所有碰撞时刻镜像矩阵的乘积;表示梯度函数;表示在镜像空间中第i和j智能体之间的相对位置;φ(||pij||)表示在实际空间中第i个和第j个智能体之间的相对距离函数;表示在镜像空间中目标智能体r的位置;表示在镜像空间中目标智能体r的位速度;vj表示第j个智能体的速度向量;
步骤5包括:所述实物机器人是移动小车模型,其控制量为角速度和线速度,机器人的动态系统为:
引入坐标变换,即pi=ξi+d[cosφi sinφi]T,d表示控制点偏离质心的距离,d>0,令:
得到:
根据:vi(t+)=(I-2n.nT)vi(t-),其中,vi(t-)和vi(t+)分别表示第i个智能体速度矢量在t时刻的左极限和右极限;和分别表示第i个智能体线速度在t时刻的左极限和右极限;φi(t-)和φi(t+)分别表示第i个智能体角位移在t时刻的左极限和右极限;ωi(t-)和ωi(t+)分别表示第i个智能体角速度在t时刻的左极限和右极限;
当t=τ(k),对于三角形底边,得出φi(t+)=-φi(t-),并且n=[01]T,I为单位矩阵,则:
得到:
因此,
和
当t=τ(k),对于三角形左斜边,有:
ωi(t+)=-ωi(t-)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911240049.3A CN111007848B (zh) | 2019-12-03 | 2019-12-03 | 一种基于有界空间的多智能体协同作业控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911240049.3A CN111007848B (zh) | 2019-12-03 | 2019-12-03 | 一种基于有界空间的多智能体协同作业控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111007848A CN111007848A (zh) | 2020-04-14 |
CN111007848B true CN111007848B (zh) | 2022-08-16 |
Family
ID=70114049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911240049.3A Active CN111007848B (zh) | 2019-12-03 | 2019-12-03 | 一种基于有界空间的多智能体协同作业控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111007848B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113778082B (zh) * | 2021-08-23 | 2023-08-22 | 北京科技大学 | 一种基于自触发机制的无人车轨迹跟踪控制方法及系统 |
CN113759973B (zh) * | 2021-09-13 | 2023-07-25 | 汕头大学 | 一种无人机集群的目标搜索控制方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107885209A (zh) * | 2017-11-13 | 2018-04-06 | 浙江工业大学 | 一种基于动态窗口与虚拟目标点的避障方法 |
CN108388270A (zh) * | 2018-03-21 | 2018-08-10 | 天津大学 | 面向安全域的集群无人机轨迹姿态协同控制方法 |
CN109358646A (zh) * | 2018-07-26 | 2019-02-19 | 北京航空航天大学 | 带有乘性噪声的导弹自主编队队形随机控制系统建模方法 |
CN109857115A (zh) * | 2019-02-27 | 2019-06-07 | 华南理工大学 | 一种基于视觉反馈的移动机器人的有限时间编队控制方法 |
CN110275527A (zh) * | 2019-05-29 | 2019-09-24 | 南京航空航天大学 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
CN110442134A (zh) * | 2019-08-01 | 2019-11-12 | 北京理工大学 | 一种基于双层网络的多智能体群集控制方法 |
-
2019
- 2019-12-03 CN CN201911240049.3A patent/CN111007848B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107885209A (zh) * | 2017-11-13 | 2018-04-06 | 浙江工业大学 | 一种基于动态窗口与虚拟目标点的避障方法 |
CN108388270A (zh) * | 2018-03-21 | 2018-08-10 | 天津大学 | 面向安全域的集群无人机轨迹姿态协同控制方法 |
CN109358646A (zh) * | 2018-07-26 | 2019-02-19 | 北京航空航天大学 | 带有乘性噪声的导弹自主编队队形随机控制系统建模方法 |
CN109857115A (zh) * | 2019-02-27 | 2019-06-07 | 华南理工大学 | 一种基于视觉反馈的移动机器人的有限时间编队控制方法 |
CN110275527A (zh) * | 2019-05-29 | 2019-09-24 | 南京航空航天大学 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
CN110442134A (zh) * | 2019-08-01 | 2019-11-12 | 北京理工大学 | 一种基于双层网络的多智能体群集控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111007848A (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Adaptive leader-following formation control with collision avoidance for a class of second-order nonlinear multi-agent systems | |
Nguyen et al. | Formation control and obstacle avoidance of multiple rectangular agents with limited communication ranges | |
WO2018176596A1 (zh) | 基于权重改进粒子群算法的无人自行车路径规划方法 | |
Gazi et al. | Aggregation, foraging, and formation control of swarms with non-holonomic agents using potential functions and sliding mode techniques | |
CN110658821B (zh) | 一种多机器人抗干扰分组时变编队控制方法及系统 | |
Tang et al. | Swarm robots search for multiple targets based on an improved grouping strategy | |
CN110554709A (zh) | 一种分布式的仿生的多智能体自主集群控制方法 | |
CN110076783B (zh) | 一种基于模糊控制和李雅普诺夫函数的平面欠驱动机械臂位置控制方法 | |
Tanaka et al. | Modeling and control of head raising snake robots by using kinematic redundancy | |
CN110262523B (zh) | 一种分布式群体机器人的自主避障蜂拥控制方法 | |
CN109732591B (zh) | 一种有障碍物环境下多机器人群集控制方法 | |
CN110554607B (zh) | 多欧拉-拉格朗日系统带有避障护航任务的协同控制方法及系统 | |
CN111007848B (zh) | 一种基于有界空间的多智能体协同作业控制方法 | |
CN115993781B (zh) | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 | |
CN115033016A (zh) | 一种异构无人集群编队避障方法及系统 | |
Kyzyrkanov et al. | Coordination of movement of multiagent robotic systems | |
CN113759935B (zh) | 基于模糊逻辑的智能群体编队移动控制方法 | |
Wei | A new formation control strategy based on the virtual-leader-follower and artificial potential field | |
CN110597067B (zh) | 一种多移动机器人的群集控制方法及系统 | |
Lei et al. | Flocking algorithm for multi-robots formation control with a target steering agent | |
CN115469548A (zh) | 具有输入饱和的未知非线性多智能体有限时间分群一致性控制方法 | |
CN111123971B (zh) | 一种基于多智能体在有界陌生地域编队部署的方法 | |
CN110703792B (zh) | 基于增强学习的水下机器人姿态控制方法 | |
Lan et al. | Intelligent guidance of autonomous mobile robots based on adaptive dynamic programming | |
Chua et al. | Moving Particle Semi-Implicit Method for Control of Swarm Robotic Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 210000 No.1, Lingshan South Road, Qixia District, Nanjing City, Jiangsu Province Applicant after: THE 28TH RESEARCH INSTITUTE OF CHINA ELECTRONICS TECHNOLOGY Group Corp. Address before: 210007 No. 1 East Street, alfalfa garden, Jiangsu, Nanjing Applicant before: THE 28TH RESEARCH INSTITUTE OF CHINA ELECTRONICS TECHNOLOGY Group Corp. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |