CN113608445A - 一种多智能体避障及避碰方法 - Google Patents

一种多智能体避障及避碰方法 Download PDF

Info

Publication number
CN113608445A
CN113608445A CN202111007920.2A CN202111007920A CN113608445A CN 113608445 A CN113608445 A CN 113608445A CN 202111007920 A CN202111007920 A CN 202111007920A CN 113608445 A CN113608445 A CN 113608445A
Authority
CN
China
Prior art keywords
agent
state
constraints
constraint
obstacle avoidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111007920.2A
Other languages
English (en)
Inventor
戴荔
郝艳也
谢华辉
周天翼
蔡普申
孙中奇
夏元清
翟弟华
张金会
崔冰
闫莉萍
邹伟东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202111007920.2A priority Critical patent/CN113608445A/zh
Publication of CN113608445A publication Critical patent/CN113608445A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种多智能体避障及避碰方法,在描述智能体状态信息的过程中,考虑外界扰动因素,使得多智能体系统具有很好地鲁棒性;考虑智能体的移动和形状,引入假定状态轨迹和假定输入轨迹,进而构造智能体的多面体外近似,解决三维和移动障碍物的避障和避碰问题,相较于传统的避障或避碰方法解决点质量模型障碍物,可以更好地获得智能体的最优路径。设计收紧的状态约束集,保证在外界扰动的条件下,系统的状态约束能够满足,引入相容性约束,用来限制实际轨迹与假定轨迹的偏差,保证避碰约束的准确性,很好地解决了全维、动态障碍物的避障和避碰问题。

Description

一种多智能体避障及避碰方法
技术领域
本发明涉及多智能体分布式控制技术领域,具体涉及一种多智能体避障及避碰方法。
背景技术
随着计算机通信能力的大幅度提高以及分布式控制理论的不断发展,越来越多的学者注意到多智能体系统之间相互合作能以更少的成本完成复杂的工作任务,例如机器人足球锦标赛RoboCup中各个机器人互助合作共同完成比赛;在工业控制领域,多个智能机器人系统可以代替人类完成高危的工作;在军事应用方面还可以利用多无人机进行巡逻、侦查等等。分布式模型预测控制(Distributed Model Predictive Control,DMPC)结合了分布式控制和模型预测控制的优点,具有较高的可靠性和可拓展性。此外,分布式模型预测控制减少了传统集中式模型预测控制的计算负担,同时各个子系统的模型预测控制器存在信息交互,保证整个系统具有更好的控制性能。
在实际应用中,一方面在分布式控制过程中外界扰动不可忽略,系统需要具备一定的鲁棒性;另一方面,为了安全考虑,应该保证智能体具有避障和避碰的功能。传统的避障方式主要解决点质量模型障碍物,忽略了障碍物的形状和体积。然而在实际避障过程中,障碍物和智能体的形状和体积均不容忽视,全维障碍物避障(避碰)的避障方法有待研究。另外,在同步采样机制下,智能体之间的通讯受到限制,智能体之间的避碰受到智能体形状和难以获知的移动轨迹的限制。
现有的分布式控制及避障或避碰方法主要存在以下问题:(一)现有的分布式控制很少考虑外部环境中扰动带来的影响,导致在实际操作中系统缺乏鲁棒性的问题;(二)传统的避障或避碰方法主要解决点质量模型障碍物的避障问题,忽略障碍物的形状和体积,难以实现全维或是移动障碍物的避障问题;(三)同步采样机制下,智能体之间的通讯受限,智能体避障同时实现智能体之间避碰的难度很大。
发明内容
有鉴于此,本发明提供了一种多智能体避障及避碰方法,能够在考虑外界加性扰动因素的情况下,很好地解决解决三维、动态障碍物的避碰问题。
本发明采用的具体技术方案如下:
一种多智能体避障及避碰方法,智能体运动过程中受到智能体约束,包括智能体之间的避碰约束和智能体与障碍物之间的避障约束,
设计多智能体系统中的每个智能体的假定状态轨迹和假定输入轨迹;根据邻居智能体的假定状态轨迹构造邻居智能体的多面体外近似,对所述避碰约束进行转化;
根据每个智能体自身的预测状态轨迹,构造每个智能体的多面体外近似,对所述避障约束进行转化;
基于转化后的避碰约束和避障约束,构建智能体的分布式模型预测控制框架,并求解得到智能体的最优控制输入,控制智能体运动。
进一步地,所述假定状态轨迹具体为:从当前时刻t向前预测的步次为0至N-1时,以上一时刻的最优状态轨迹为假定状态轨迹;从当前时刻t向前预测的步次为N时,用以末端控制器和上一时刻的最优状态轨迹为输入的非线性函数表示假定状态轨迹;
所述假定输入轨迹具体为:从当前时刻t向前预测的步次为0至N-2时,以上一时刻的最优控制输入轨迹为假定输入轨迹;从当前时刻t向前预测的步次为N-1时,以末端控制器表示假定输入轨迹;
其中,N为预测时域;t为采样时刻,t=0,1,2,…。
进一步地,引入相容性约束,限制所述假定状态轨迹和实际状态轨迹之间的偏差,所述相容性约束为:
Figure BDA0003234197170000031
其中,
Figure BDA0003234197170000032
为相容性约束上界,
Figure BDA0003234197170000033
τ为正实数;
Figure BDA0003234197170000034
为智能体i在闭环时刻t向前预测k步得到的头部位置,h表示头部;
Figure BDA0003234197170000035
为智能体i对应t时刻假定的头部位置。
进一步地,所述转化后的避碰约束表示为:
Figure BDA0003234197170000036
Figure BDA0003234197170000037
Figure BDA0003234197170000038
其中,λij(k|t)≥0、μij(k|t)≥0为相应的优化变量,‖·‖*为对偶范数,j为智能体i的邻居智能体的编号;dmin≥0为安全距离,上标T表示转置;
Figure BDA0003234197170000039
和gi(k|t)为构建智能体的多面体外近似时所需的约束矩阵;
Figure BDA00032341971700000310
Figure BDA00032341971700000311
为构建邻居智能体的多面体外近似时所需的约束矩阵;k为时间索引,t为采样时刻,t=0,1,2,…。
进一步地,所述转化后的避障约束表示为:
-gi(k|t)Tμi(k|t)-bm Tλi(k|t)≥dmin
Figure BDA00032341971700000312
‖Am Tλi(k|t)‖*≤1
其中,λi(k|t),μi(k|t)为相应的优化变量;Am和bm为障碍物多胞体内的已知矩阵,‖·‖*为对偶范数,dmin≥0为安全距离,上标T表示转置;
Figure BDA00032341971700000313
和gi(k|t)为构建智能体的多面体外近似时所需的约束矩阵;
Figure BDA00032341971700000314
Figure BDA00032341971700000315
为构建邻居智能体的多面体外近似时所需的约束矩阵;k为时间索引;t为采样时刻,t=0,1,2,…。
进一步地,所述智能体约束还包括:初始状态约束、位置和输入约束、状态方程约束和末端约束。
进一步地,设计收紧的状态约束集,保证多智能体系统满足所述智能体约束,所述收紧的状态约束集表示为:
Figure BDA0003234197170000041
其中,k为时间索引,
Figure BDA0003234197170000042
表示外界加性扰动积累量集合;Lf为轮式机器人系统的Lipschitz常数
Figure BDA0003234197170000043
a为智能体驱动轮速度最大值,Τ为采样时间,
Figure BDA0003234197170000044
为扰动约束上界,
Figure BDA0003234197170000045
为包含当前所考虑智能体位置
Figure BDA0003234197170000046
的紧集即原始位置约束集,
Figure BDA0003234197170000047
表示庞特里亚金差运算。
进一步地,所述分布式模型预测控制框架由转化后的避碰约束和避障约束、初始状态约束、位置和输入约束、状态方程约束、末端约束以及相容性约束构成;所述分布式模型预测控制框架用公式表示为:
Figure BDA0003234197170000048
Figure BDA0003234197170000049
Figure BDA00032341971700000410
Figure BDA00032341971700000411
Figure BDA00032341971700000412
Figure BDA00032341971700000413
Figure BDA00032341971700000414
Figure BDA00032341971700000415
Figure BDA00032341971700000416
Figure BDA00032341971700000417
Figure BDA00032341971700000418
Figure BDA0003234197170000051
λi(k|t)≥0,μi(k|t)≥0,λij(k|t)≥0,μij(k|t)≥0
其中,
Figure BDA0003234197170000052
为智能体控制输入的角速度和线速度的集合,Ωi为智能体头部末端位置的集合,dmin为安全距离,
Figure BDA0003234197170000053
表示智能体i的初始状态,ξh,i(t)表示智能体i的在t时刻的状态,
Figure BDA0003234197170000054
表示t时刻向前预测k步时智能体i的状态,
Figure BDA0003234197170000055
表示t时刻向前预测k+1步的智能体i的状态,Τ表示采样时间,t∈Τ;fh(·,·)为头部标称模型中的非线性函数;
Figure BDA0003234197170000056
表示t时刻向前预测N步时智能体i的头部位置;
Figure BDA0003234197170000057
表示t时刻向前预测k步时智能体i的控制输入。
有益效果:
(1)本发明在描述智能体状态信息的过程中,考虑外界扰动因素,使得多智能体系统具有很好地鲁棒性;考虑智能体的移动和形状,引入假定状态轨迹和假定输入轨迹,克服智能体之间通讯受到限制无法获知智能体移动轨迹,进而构造智能体的多面体外近似,很好地解决全维和移动障碍物的避障和避碰问题,相较于传统的避障或避碰方法解决点质量模型障碍物,可以更好地获得智能体的最优路径。
(2)设计收紧的状态约束集,保证在外界扰动的条件下,系统的状态约束能够满足,从而利于求解轨迹优化问题,同时也使得系统的鲁棒性更好。
(3)引入相容性约束以限制假定状态轨迹与实际状态轨迹的偏差,从而保证了在偏差问题存在的情况下,避障和避碰问题的求解更加精确。
附图说明
图1为轮式机器人模型图;
图2为智能体的外近似集合示意图;
图3为所有智能体的运动轨迹示意图;
图4为智能体1与其他智能体之间的相对距离示意图;
图5为智能体1与障碍物四个顶点之间的距离示意图;
图6为所有智能体的控制输入示意图;
图7为所有智能体的控制输入约束满足情况示意图;
具体实施方式
本发明提供了一种多智能体避障及避碰方法。被控对象是由多个轮式机器人系统组成的多智能体系统,设计收紧的状态约束集,保证在有界加性扰动下多智能体系统的满足约束条件。另外,为了解决同步采样机制下智能体之间的信息传递问题,引入智能体的假定状态轨迹,每个智能体利用自身的预测轨迹状态和邻居的假定轨迹状态分别构造多边形外近似,进而利用对偶优化理论对避障和避碰约束进行转化重构。然后,建立相容性约束,用来限制实际轨迹状态即预测轨迹状态与假定轨迹状态之间的误差,保证避碰约束的准确性。最后,构建分布式模型预测控制框架,求解最终得到智能体的执行轨迹,本发明可以很好地解决全维、动态障碍物的避碰问题。
为了解决现有的多智能体避障和避碰的控制算法难以处理三维障碍物的避障和避碰问题,以及在分布式模型预测控制下很难实现闭环系统鲁棒性的问题,本发明公开了一种多智能体避障及避碰方法,智能体运动过中受到包括避碰约束和避障约束的智能体约束,设计多智能体系统中的每个智能体的假定状态轨迹和假定输入轨迹,并根据邻居智能体的假定状态轨迹构造邻居智能体的多面体外近似,对避碰约束进行转化;根据每个智能体自身的预测状态轨迹,构造每个智能体的多面体外近似,对避障约束进行转化;基于智能体约束,构建智能体的分布式模型预测控制框架,并求解得到智能体的最优控制输入,智能体获得执行轨迹并由初始位置运行至目标点。为了使得本发明的技术方案更加清楚,在描述的过程中记载了具体步骤,但步骤的设置并不是为了严格限制执行的逻辑顺序,比如避障约束和避碰约束是需要同时满足的,二者没有先后顺序。
本发明的具体方案包括以下步骤:
步骤一、以包含多个智能体的多智能体系统为被控对象,建立每个智能体的头部受扰模型并进行离散化处理,得到离散化的头部受扰模型;去除离散化的头部受扰模型中的有界加性扰动因素,得到智能体的标称模型。
(1)轮式机器人系统建模。
考虑由Na个轮式机器人(如图1所示)组成的多智能体系统,系统中每个机器人(子系统)用下标
Figure BDA0003234197170000071
区分,
Figure BDA0003234197170000072
并具有如下的系统模型:
Figure BDA0003234197170000073
其中,
Figure BDA0003234197170000074
为系统的中心状态,包括机器人的中心位置pi=[xi,yi]T以及姿态角θi。控制输入为
Figure BDA0003234197170000075
包括机器人的线速度υi和角速度ωi。如图1所示,
Figure BDA0003234197170000076
Figure BDA0003234197170000077
分别为机器人左右轮的速度。机器人的线速度和角速度分别满足
Figure BDA0003234197170000078
Figure BDA0003234197170000079
其中ρ为机器人车身的半径。控制输入满足约束
Figure BDA00032341971700000710
其中,
Figure BDA00032341971700000711
b=a/ρ。
采用轮式机器人的头部姿态为被控对象,并考虑到外界扰动的影响,则关于智能体i的头部受扰模型可以表达为:
Figure BDA00032341971700000712
其中,
Figure BDA00032341971700000713
为机器人的状态信息,ph,i=[xh,i,yh,i]T为机器人的头部位置,
Figure BDA00032341971700000714
为控制输入,并满足约束条件
Figure BDA00032341971700000715
非线性函数fh(·,·)定义为fhh,i,uh,i)=[(P(θh,i)uh,i)Th,i]T,其中,
Figure BDA00032341971700000716
Figure BDA0003234197170000081
表示外部扰动,其中
Figure BDA0003234197170000082
(2)轮式机器人系统离散化。
为了减少求解优化问题带来的计算负荷,设置采样时间为T,将上述系统离散化,则智能体i离散化的受扰头部模型为:
ξh,i(t+1)=ξh,i(t)+Tfhh,i(t),uh,i(t))+Tdi(t)
标称模型中的变量用上标
Figure BDA0003234197170000083
来表示,以区分受扰模型中的变量:
Figure BDA0003234197170000084
步骤二、根据步骤一所述的离散化的头部受扰模型和标称模型,建立智能体的代价函数,并设置智能体约束;设计收紧的状态约束集,以保证多智能体系统满足所述智能体约束。
其中,智能体约束包括:初始状态约束、状态方程约束、位置和输入约束、避障约束、避碰约束和末端约束。
(1)根据控制目标初步构建每个智能体的优化问题:
S10、明确算法的控制目标是将所有智能体的头部位置ph,i镇定到各自的期望位置
Figure BDA0003234197170000085
附近(终端集Ωi内)。同时,在镇定过程中各个智能体需要满足自身的物理约束,包括状态约束和输入约束。假设智能体的邻居集合为
Figure BDA0003234197170000086
每个智能体可与其邻居进行信息交互。确定每个智能体与其邻居间的通信网络,通信网络由无向图G=(V,E)表示,其中V={1,2,...,Na}表示无向图的节点集,
Figure BDA0003234197170000087
则表示边的集合。定义相应的邻接矩阵为
Figure BDA0003234197170000088
若(i,j)∈E,则aij=1,否则aij=0。采集智能体在t时刻的状态ξh,i(t)作为起始状态。
S11、定义智能体i的代价函数为:
Figure BDA0003234197170000089
其中,包括阶段性代价
Figure BDA0003234197170000091
和末端代价
Figure BDA0003234197170000092
预测时域为N,权重矩阵Qi和Ri都是正定的对角阵。
S12、设置每个智能体所受到的约束:
初始状态约束
Figure BDA0003234197170000093
状态方程约束
Figure BDA0003234197170000094
位置和输入约束:
Figure BDA0003234197170000095
其中,
Figure BDA0003234197170000096
是一个包含目标点
Figure BDA0003234197170000097
的紧集,
Figure BDA0003234197170000098
为包含原点的闭集,本发明中
Figure BDA0003234197170000099
为包含智能体控制输入的角速度和线速度的集合。
此外,各智能体还需满足:避障约束
Figure BDA00032341971700000910
避碰约束
Figure BDA00032341971700000911
其中
Figure BDA00032341971700000912
Figure BDA00032341971700000913
分别是智能体i,智能体j和障碍物m在地面占据的面积,
Figure BDA00032341971700000914
为所有障碍物索引的指标集。
每个智能体的终端约束为
Figure BDA00032341971700000915
其中Ωi为包含
Figure BDA00032341971700000916
的终端集。
(2)为了保证系统的鲁棒性以及优化问题有解,对智能体所受的部分约束进行处理:
S20、状态约束收紧处理。在外界扰动的条件下,为了保证系统的状态约束满足,设计收紧的状态约束集:
Figure BDA00032341971700000917
其中,
Figure BDA00032341971700000918
而参数Lf则为轮式机器人系统的Lipschitz常数。
步骤三、考虑智能体的形状和移动轨迹,设计智能体的假定轨迹和假定输入,同时以相容性约束限制假定轨迹和实际轨迹的偏差;根据所述假定轨迹设计智能体的邻居智能体的多面体外近似,对步骤二中的避碰约束进行转化。
S21、非凸避碰约束转化。各智能体在达成各自的控制目标的过程中,除了需要满足避障约束,还需满足各个智能体之间的避碰约束。考虑该多智能体系统在同步采样机制下分别进行优化,那么为了实现智能体之间的避碰,在每个采样时刻需要获取邻居的位置信息。但是在同步采样机制下,智能体的真实预测状态尚未求解无法及时传输,故定义智能体的假定状态轨迹和假定输入轨迹如下:
Figure BDA0003234197170000101
Figure BDA0003234197170000102
其中,κi(·)为终端控制器。假定状态的引入保证了优化问题能够以分布式的方式求解。考虑到假定位置轨迹与实际位置轨迹之间的偏差会影响到优化问题解的精确性,需要引入相容性约束以限制假定位置轨迹与实际位置轨迹之间的偏差:
Figure BDA0003234197170000103
其中,
Figure BDA0003234197170000104
为相容性约束上界,设计为
Figure BDA0003234197170000105
其中τ为一个正实数;
Figure BDA0003234197170000106
为智能体i在闭环时刻t向前预测k步得到的头部位置,h表示头部;
Figure BDA0003234197170000107
为智能体i对应时刻假定的头部位置。
为了实现智能体间的避碰,各智能体在求解优化问题时需要得到其邻居的车体外近似。显然,邻居的车体外近似将由邻居的假定位置轨迹构造,假设邻居的外近似为
Figure BDA0003234197170000108
则其可定义为:
Figure BDA0003234197170000109
Figure BDA00032341971700001010
结合外近似集合
Figure BDA00032341971700001011
的定义,可确定
Figure BDA0003234197170000111
Figure BDA0003234197170000112
其中,
Figure BDA0003234197170000113
表示超平面
Figure BDA0003234197170000114
上的点
Figure BDA0003234197170000115
s=1,2,3,4;xi,yi表示每个点
Figure BDA00032341971700001115
的横纵坐标;
Figure BDA0003234197170000116
表示t时刻智能体i向前预测k步的假定的头部姿态角。
最后,避碰约束
Figure BDA0003234197170000117
可由下述约束进行转化:
Figure BDA0003234197170000118
Figure BDA0003234197170000119
Figure BDA00032341971700001110
其中,λij(k|t)≥0、μij(k|t)≥0为相应的优化变量‖·‖*为对偶范数,j为智能体i的邻居智能体的编号;dmin≥0为安全距离,上标T表示转置;
Figure BDA00032341971700001111
和gi(k|t)为构建智能体的多面体外近似时所需的约束矩阵;
Figure BDA00032341971700001112
Figure BDA00032341971700001113
为构建邻居智能体的多面体外近似时所需的约束矩阵;k为时间索引,
Figure BDA00032341971700001114
N为预测时域;t为采样时刻,t=0,1,2,…。
步骤四、重新设计每个智能体的多面体外近似,对步骤二中避障约束进行转化。
在避障约束中,每个智能体的多面体外近似根据自身的预测状态轨迹即预测状态进行外近似。
S22、非凸避障约束转化。在智能体朝着各自目标点移动的过程中,需要躲避环境中的障碍物。然而,直接构建的避障约束
Figure BDA0003234197170000121
显然是非凸的。这样的约束会使得优化问题难以求解,因此本发明提出一种非凸避障约束的转化方法,具体如下:
考虑具有以下多面体形式的固定障碍物:
Figure BDA0003234197170000122
其中,具有相应维度的Am和bm是已知的障碍物多胞体的约束矩阵。而每个智能体在地面所占据的空间可表示为
Figure BDA0003234197170000123
其中,pi(t)=[xi(t),yi(t)]T为智能体i在t时刻的中心位置,
Figure BDA0003234197170000124
代表智能体i的物理形状,为一个半径为ρ的圆。下面根据“距离”的概念,避障约束可表示为:
Figure BDA0003234197170000125
则下式可保证避障约束满足
Figure BDA0003234197170000126
其中,安全距离dmin≥0。为了能够进行避障约束转化以及考虑外界扰动的影响,需要为每个智能体重新设计多面体外近似集合
Figure BDA0003234197170000127
确保在外界有界加性扰动下,智能体在地面占据的实际面积不会超出该外近似集合。
如图2所示,智能体i的标称头部位置
Figure BDA0003234197170000128
受到半径为gi(k)的外部扰动,方向角为
Figure BDA0003234197170000129
由于扰动随着预测积累,因此向前预测k步时扰动的积累量为
Figure BDA00032341971700001210
机器人的车体由半径为ρ的圆表示。为了构造外近似集合
Figure BDA00032341971700001211
我们根据头部位置在扰动集合边界上的四个极限位置,确定了四个超平面
Figure BDA00032341971700001212
s=1,2,3,4。为了确定
Figure BDA00032341971700001213
s=1,2,3,4,首先分别在四个超平面上找到四个点
Figure BDA00032341971700001214
s=1,2,3,4,如下所示:
Figure BDA00032341971700001215
Figure BDA0003234197170000131
Figure BDA0003234197170000132
Figure BDA0003234197170000133
确定了超平面
Figure BDA0003234197170000134
s=1,2,3,4后,相应的半空间
Figure BDA0003234197170000135
s=1,2,3,4可表示为:
Figure BDA0003234197170000136
Figure BDA0003234197170000137
Figure BDA0003234197170000138
Figure BDA0003234197170000139
结合以上结果,智能体i的外近似集合
Figure BDA00032341971700001310
设计如下:
Figure BDA00032341971700001311
Figure BDA00032341971700001312
根据障碍物的多面体表达式,以及对偶优化原理,避障约束
Figure BDA00032341971700001313
可由以下约束进行转化:
-gi(k|t)Tμi(k|t)-bm Tλi(k|t)≥dmin
Figure BDA00032341971700001314
‖Am Tλi(k|t)‖*≤1
其中,λi(k|t),μi(k|t)为对应的优化变量,‖·‖*为对偶范数。
综上所述,本发明中对多面体外近似的求解以及表示是根据智能体的假定状态轨迹或者预测状态轨迹得到的,具体通过上述过程,可以得知,是通过状态轨迹可以获得极限位置点和超平面,进而获得多面体外近似,为了直观表示,本发明中选取了4个极限位置点和四个超平面,在具体实施过程中,计算时选取的极限位置点和超平面的数量不做限制,数量越多,结果会更加精确。同时,本发明用矩阵的形式对多面体外近似进行表达,在具体实施过程中,多面体外近似的表达形式不做限制。
本发明对于避碰约束和避障约束的转化,需要根据构造的多面体外近似进行。其中,多面体外近似包括根据智能体自身预测状态轨迹构建的智能体的多面体外近似、根据假定状态轨迹构建的邻居智能体的多面体外近似、以及障碍物的多面体外近似(即固定障碍物
Figure BDA0003234197170000141
)。避碰约束的转化需要结合自身的多面体外近似和邻居智能体的多面体外近似进行。避障约束的转化需要结合自身的多面体外近似和障碍物的多面体外近似进行。
步骤五、结合收紧的状态约束集以及转化后的避碰约束和避障约束,构建智能体分布式模型预测控制框架,并求解得到智能体的最优控制输入。
结合收紧的状态约束集、转化后的避障和避碰约束,构建每个智能体的优化问题。
S30、每个智能体的优化目标为:
Figure BDA0003234197170000142
S31、每个智能体受到的约束为:
Figure BDA0003234197170000143
Figure BDA0003234197170000144
Figure BDA0003234197170000145
Figure BDA0003234197170000146
Figure BDA0003234197170000147
Figure BDA0003234197170000148
Figure BDA0003234197170000149
Figure BDA00032341971700001410
Figure BDA0003234197170000151
Figure BDA0003234197170000152
Figure BDA0003234197170000153
Figure BDA0003234197170000154
λi(k|t)≥0,μi(k|t)≥0,λij(k|t)≥0,μij(k|t)≥0
其中,
Figure BDA0003234197170000155
为包含原点的闭集,Ωi为末端集,dmin为安全距离,
Figure BDA0003234197170000156
表示智能体i的初始状态,ξh,i(t)表示智能体i的在t时刻的状态,
Figure BDA0003234197170000157
表示t时刻向前预测k步时智能体i的状态,
Figure BDA0003234197170000158
表示t时刻向前预测k+1步即下一步的智能体i的状态,Τ表示采样时间,t∈Τ;fh(·,·)为头部标称模型中的非线性函数;
Figure BDA0003234197170000159
表示t时刻向前预测N步时智能体i的头部位置;
Figure BDA00032341971700001510
表示t时刻向前预测k步时智能体i的控制输入。
S32、通过并行求解S31中的优化问题,每个智能体可以得到自己的最优控制输入
Figure BDA00032341971700001511
和相应的最优控制状态
Figure BDA00032341971700001512
注意:为了实现分布控制的目的,在每个时刻t要求系统的通信拓扑图G=(V,E)是连通的。
步骤六、将步骤五中的最优控制输入应用于智能体,智能体获得执行轨迹并由初始位置运行至目标点附近。
将各个智能体得到的最优控制输入
Figure BDA00032341971700001513
应用在各个智能体上,并在下一时刻(t+1时刻)重复以上步骤。即重复步骤S30-S32,在每一采样时刻,对智能体进行优化求解。
为了更好的展示本发明的有效性,将本发明中的基于鲁棒分布式模型预测控制的多智能体避障及避碰方法应用到包含四个轮式机器人的多智能体系统,并考虑环境中有两个障碍物。下面给出求解优化问题需要用到的一些参数。
轮式机器人车身半径ρ=0.0267m,a=0.13m/s,b=a/ρ=4.8598rad/s,则轮式机器人的输入约束集
Figure BDA0003234197170000161
可以确定。选取采样时间T=0.6s,安全距离dmin=1×10-4m,并令
Figure BDA0003234197170000162
其中εi=0.0184。τ=1×10-4
Figure BDA0003234197170000163
预测时域设置为N=12。代价函数中的权重矩阵分别选取为:
Figure BDA0003234197170000164
Figure BDA0003234197170000165
给定关联矩阵
Figure BDA0003234197170000166
i,j=1,2,3,4,如下所示:
Figure BDA0003234197170000167
两个障碍物的初始位置可以表示为:
Figure BDA0003234197170000168
Figure BDA0003234197170000169
每个智能体的初始状态为:
Figure BDA00032341971700001610
其期望位置分别为:
Figure BDA00032341971700001611
Figure BDA00032341971700001612
四个智能体的轨迹如图3所示,图中黑色矩形代表障碍物,每个智能体的起点位置和终点位置分别用三角形、圆形、正方形和五角星来区分。从图3可以看出,在本发明所提优化算法的控制下,所有智能体最终均能到达期望位置的小邻域内。
以智能体1为例,图4表示智能体1和其他智能体中心位置之间的距离随时间的变化趋势,虚线位置标注了各个智能体之间的安全距离2ρ。显然,智能体1与其他各个智能体之间的距离始终大于安全距离。由此可见智能体1在向目标点
Figure BDA0003234197170000171
趋近的过程中完成了避碰。图5表示智能体1与障碍物
Figure BDA0003234197170000172
的四个顶点之间的距离随时间t的变化趋势,虚线位置标注了智能体1与障碍物
Figure BDA0003234197170000173
的安全距离ρ。可以看出智能体1未与障碍物
Figure BDA0003234197170000174
发生碰撞。图6和图7分别表示各个智能体的控制输入及其控制输入约束满足情况。在图6中,实线表示各个智能体的线速度,虚线表示各个智能体的角速度。可以看出每个智能体的控制输入最后都趋向于零。而图7则表明了各个智能体的控制输入在整个预测时域内都满足输入约束。
以上的具体实施例仅描述了本发明的设计原理,该描述中的部件形状,名称可以不同,不受限制。所以,本发明领域的技术人员可以对前述实施例记载的技术方案进行修改或等同替换;而这些修改和替换未脱离本发明创造宗旨和技术方案,均应属于本发明的保护范围。

Claims (8)

1.一种多智能体避障及避碰方法,智能体运动过程中受到智能体约束,包括智能体之间的避碰约束和智能体与障碍物之间的避障约束,其特征在于,
设计多智能体系统中的每个智能体的假定状态轨迹和假定输入轨迹;根据邻居智能体的假定状态轨迹构造邻居智能体的多面体外近似,对所述避碰约束进行转化;
根据每个智能体自身的预测状态轨迹,构造每个智能体的多面体外近似,对所述避障约束进行转化;
基于转化后的避碰约束和避障约束,构建智能体的分布式模型预测控制框架,并求解得到智能体的最优控制输入,控制智能体运动。
2.如权利要求1所述的避障及避碰方法,其特征在于,
所述假定状态轨迹具体为:从当前时刻t向前预测的步次为0至N-1时,以上一时刻的最优状态轨迹为假定状态轨迹;从当前时刻t向前预测的步次为N时,用以末端控制器和上一时刻的最优状态轨迹为输入的非线性函数表示假定状态轨迹;
所述假定输入轨迹具体为:从当前时刻t向前预测的步次为0至N-2时,以上一时刻的最优控制输入轨迹为假定输入轨迹;从当前时刻t向前预测的步次为N-1时,以末端控制器表示假定输入轨迹;
其中,N为预测时域;t为采样时刻,t=0,1,2,…。
3.如权利要求2所述的避障及避碰方法,其特征在于,引入相容性约束,限制所述假定状态轨迹和实际状态轨迹之间的偏差,所述相容性约束为:
Figure FDA0003234197160000011
其中,l(k)为相容性约束上界,l(k)=τln(k+2),τ为正实数;
Figure FDA0003234197160000012
为智能体i在闭环时刻t向前预测k步得到的头部位置,h表示头部;
Figure FDA0003234197160000013
为智能体i对应t时刻假定的头部位置。
4.如权利要求1所述的避障及避碰方法,其特征在于,所述转化后的避碰约束表示为:
Figure FDA0003234197160000021
Figure FDA0003234197160000022
Figure FDA0003234197160000023
其中,λij(k|t)≥0、μij(k|t)≥0为相应的优化变量,‖·‖*为对偶范数,j为智能体i的邻居智能体的编号;dmin≥0为安全距离,上标T表示转置;
Figure FDA0003234197160000024
和gi(k|t)为构建智能体的多面体外近似时所需的约束矩阵;
Figure FDA0003234197160000025
Figure FDA0003234197160000026
为构建邻居智能体的多面体外近似时所需的约束矩阵;k为时间索引,t为采样时刻,t=0,1,2,…。
5.如权利要求1所述的避障及避碰方法,其特征在于,所述转化后的避障约束表示为:
-gi(k|t)Tμi(k|t)-bm Tλi(k|t)≥dmin
Figure FDA00032341971600000210
‖Am Tλi(k|t)‖*≤1
其中,λi(k|t),μi(k|t)为相应的优化变量;Am和bm为障碍物多胞体内的已知矩阵,‖·‖*为对偶范数,dmin≥0为安全距离,上标T表示转置;
Figure FDA0003234197160000027
和gi(k|t)为构建智能体的多面体外近似时所需的约束矩阵;
Figure FDA0003234197160000028
Figure FDA0003234197160000029
为构建邻居智能体的多面体外近似时所需的约束矩阵;k为时间索引;t为采样时刻,t=0,1,2,…。
6.如权利要求1所述的避障及避碰方法,其特征在于,所述智能体约束还包括:初始状态约束、位置和输入约束、状态方程约束和末端约束。
7.如权利要求6所述的避障及避碰方法,其特征在于,设计收紧的状态约束集,保证多智能体系统满足所述智能体约束,所述收紧的状态约束集表示为:
Figure FDA0003234197160000031
其中,k为时间索引,
Figure FDA0003234197160000032
表示外界加性扰动积累量集合;Lf为轮式机器人系统的Lipschitz常数
Figure FDA0003234197160000033
a为智能体驱动轮速度最大值,Τ为采样时间,
Figure FDA0003234197160000034
为扰动约束上界,
Figure FDA0003234197160000035
为包含当前所考虑智能体位置
Figure FDA0003234197160000036
的紧集即原始位置约束集,
Figure FDA00032341971600000320
表示庞特里亚金差运算。
8.如权利要求1-7任一所述的避障及避碰方法,其特征在于,所述分布式模型预测控制框架由转化后的避碰约束和避障约束、初始状态约束、位置和输入约束、状态方程约束、末端约束以及相容性约束构成;所述分布式模型预测控制框架用公式表示为:
Figure FDA0003234197160000037
Figure FDA0003234197160000038
Figure FDA0003234197160000039
Figure FDA00032341971600000310
Figure FDA00032341971600000311
Figure FDA00032341971600000312
Figure FDA00032341971600000313
Figure FDA00032341971600000314
Figure FDA00032341971600000315
Figure FDA00032341971600000316
Figure FDA00032341971600000317
Figure FDA00032341971600000318
λi(k|t)≥0,μi(k|t)≥0,λij(k|t)≥0,μij(k|t)≥0
其中,
Figure FDA00032341971600000319
为智能体控制输入的角速度和线速度的集合,Ωi为智能体头部末端位置的集合,dmin为安全距离,
Figure FDA0003234197160000041
表示智能体i的初始状态,ξh,i(t)表示智能体i的在t时刻的状态,
Figure FDA0003234197160000042
表示t时刻向前预测k步时智能体i的状态,
Figure FDA0003234197160000043
表示t时刻向前预测k+1步的智能体i的状态,Τ表示采样时间,t∈Τ;fh(·,·)为头部标称模型中的非线性函数;
Figure FDA0003234197160000044
表示t时刻向前预测N步时智能体i的头部位置;
Figure FDA0003234197160000045
表示t时刻向前预测k步时智能体i的控制输入。
CN202111007920.2A 2021-08-27 2021-08-27 一种多智能体避障及避碰方法 Pending CN113608445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111007920.2A CN113608445A (zh) 2021-08-27 2021-08-27 一种多智能体避障及避碰方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111007920.2A CN113608445A (zh) 2021-08-27 2021-08-27 一种多智能体避障及避碰方法

Publications (1)

Publication Number Publication Date
CN113608445A true CN113608445A (zh) 2021-11-05

Family

ID=78309726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111007920.2A Pending CN113608445A (zh) 2021-08-27 2021-08-27 一种多智能体避障及避碰方法

Country Status (1)

Country Link
CN (1) CN113608445A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114296473A (zh) * 2021-11-30 2022-04-08 北京航空航天大学 一种避免碰撞和通信中断的多智能体自适应编队控制方法
CN115453872A (zh) * 2022-09-13 2022-12-09 四川大学 一种基于分布式随机模型预测的多智能体编队及避障方法
CN116700012A (zh) * 2023-07-19 2023-09-05 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325306A1 (en) * 2012-06-01 2013-12-05 Toyota Motor Eng. & Mftg. N. America, Inc. (TEMA) Cooperative driving and collision avoidance by distributed receding horizon control
CN104898659A (zh) * 2015-03-11 2015-09-09 北京理工大学 一种基于模型预测的人机协同控制方法
CN109986554A (zh) * 2019-01-21 2019-07-09 中国船舶重工集团公司第七一六研究所 一种工业机器人路径规划的几何最优控制方法
CN110320809A (zh) * 2019-08-19 2019-10-11 杭州电子科技大学 一种基于模型预测控制的agv轨迹修正方法
CN112684781A (zh) * 2020-12-21 2021-04-20 湖南大学 一种多智能体分布式模型预测控制方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130325306A1 (en) * 2012-06-01 2013-12-05 Toyota Motor Eng. & Mftg. N. America, Inc. (TEMA) Cooperative driving and collision avoidance by distributed receding horizon control
CN104898659A (zh) * 2015-03-11 2015-09-09 北京理工大学 一种基于模型预测的人机协同控制方法
CN109986554A (zh) * 2019-01-21 2019-07-09 中国船舶重工集团公司第七一六研究所 一种工业机器人路径规划的几何最优控制方法
CN110320809A (zh) * 2019-08-19 2019-10-11 杭州电子科技大学 一种基于模型预测控制的agv轨迹修正方法
CN112684781A (zh) * 2020-12-21 2021-04-20 湖南大学 一种多智能体分布式模型预测控制方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI DAI 等: "Distributed MPC for formation of multi-agent systems with collision avoidance and obstacle avoidance", JOURNAL OF THE FRANKLIN INSTITUTE, pages 1 - 10 *
YANYE HAO 等: "Robust MPC for Nonholonomic Robots with Moving Obstacle Avoidance", 2020 IEEE 16TH INTERNATIONAL CONFERENCE ON CONTROL & AUTOMATION (ICCA), pages 1494 - 1499 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114296473A (zh) * 2021-11-30 2022-04-08 北京航空航天大学 一种避免碰撞和通信中断的多智能体自适应编队控制方法
CN115453872A (zh) * 2022-09-13 2022-12-09 四川大学 一种基于分布式随机模型预测的多智能体编队及避障方法
CN116700012A (zh) * 2023-07-19 2023-09-05 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法
CN116700012B (zh) * 2023-07-19 2024-03-01 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法

Similar Documents

Publication Publication Date Title
CN113608445A (zh) 一种多智能体避障及避碰方法
Ailon et al. Control strategies for driving a group of nonholonomic kinematic mobile robots in formation along a time-parameterized path
CN110989526A (zh) 一种双agv协同运载控制系统及方法
CN110398967B (zh) 一种采用离散化方法的多机器人协同轨迹信息处理方法
CN110162046B (zh) 基于事件触发型模型预测控制的无人车路径跟随方法
Vargas et al. MPC-based distributed formation control of multiple quadcopters with obstacle avoidance and connectivity maintenance
Tanaka et al. Modeling and control of head raising snake robots by using kinematic redundancy
Tsai et al. Distributed consensus formation control with collision and obstacle avoidance for uncertain networked omnidirectional multi-robot systems using fuzzy wavelet neural networks
CN115033016B (zh) 一种异构无人集群编队避障方法及系统
CN109978272A (zh) 一种基于多个全向移动机器人的路径规划系统及方法
Lashkari et al. Development of a novel robust control method for formation of heterogeneous multiple mobile robots with autonomous docking capability
CN112947575A (zh) 基于深度强化学习的无人机集群多目标搜索方法及系统
Qijie et al. A path planning algorithm based on RRT and SARSA (λ) in unknown and complex conditions
Sun et al. A GNN for repetitive motion generation of four-wheel omnidirectional mobile manipulator with nonconvex bound constraints
Al-Kamil et al. Optimizing path planning in mobile robot systems using motion capture technology
Li et al. A model predictive obstacle avoidance method based on dynamic motion primitives and a Kalman filter
Chen et al. Maddpg algorithm for coordinated welding of multiple robots
Tiong et al. Autonomous valet parking with asynchronous advantage actor-critic proximal policy optimization
Saska et al. Roads sweeping by unmanned multi-vehicle formations
Yang et al. Novel decentralised formation control for unmanned vehicles
CN117055556A (zh) 多机器人编队路径规划方法、装置、电子设备及存储介质
CN107807534B (zh) 一种多轮式机器人自适应协同控制算法及控制系统
Kanjanawanishkul Coordinated path following for mobile robots using a virtual structure strategy with model predictive control
CN114637301A (zh) 基于最优仿射队形变换的多机器人动态避障装置及方法
Khoukhi An intelligent multi-agent system for mobile robots navigation and parking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination