CN116700012A - 一种多智能体的避撞编队合围控制器的设计方法 - Google Patents
一种多智能体的避撞编队合围控制器的设计方法 Download PDFInfo
- Publication number
- CN116700012A CN116700012A CN202310885313.9A CN202310885313A CN116700012A CN 116700012 A CN116700012 A CN 116700012A CN 202310885313 A CN202310885313 A CN 202310885313A CN 116700012 A CN116700012 A CN 116700012A
- Authority
- CN
- China
- Prior art keywords
- formation
- collision avoidance
- constraint
- agent
- surrounding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 212
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013461 design Methods 0.000 title claims abstract description 16
- 238000005755 formation reaction Methods 0.000 claims description 200
- 239000003795 chemical substances by application Substances 0.000 claims description 158
- 239000011159 matrix material Substances 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000002950 deficient Effects 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 230000002265 prevention Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000005562 fading Methods 0.000 claims description 2
- 238000011217 control strategy Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 13
- 238000004088 simulation Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明属于自动控制领域,具体涉及一种多智能体的避撞编队合围控制器的设计方法及其控制器。本发明提供的避撞编队合围控制器的设计方法首先建立智能体的动力学模型,然后根据预期的集群形态将智能体分为领航编队和跟随编队两部分,接着在所有智能体间建立避撞约束,在领航编队成员间建立用于保持队形的编队约束,最后在领航编队内部为跟随编队建立合围约束,基于构建出的三重约束,本发明最后设计出包含理想约束力、反馈部分和不确定性控制部分的避撞编队合围控制器并采用李雅普诺夫稳定性理论方法对构建的避撞编队合围控制器进行验证。本发明可以改善传统控制策略对智能体集群的编队控制精度,实现全局避撞,并提升场景适应性。
Description
技术领域
本发明属于自动控制领域,具体涉及一种多智能体的避撞编队合围控制器的设计方法,以及采用该方法设计出的避撞编队合围控制器。
背景技术
近年来,随着信息技术、计算机技术的快速发展,多智能体协同控制逐渐成为当下热点研究方向之一。当前主要研究内容集中在如何通过合理的控制算法和协作策略,使得智能体组合成一定的编队形态并遵循期望的行为模式,其中编队控制和合围控制这两种技术应用极为广泛。现有技术大多是将编队控制技术与合围控制技术分开考虑,分别侧重于编队特性或合围特性。而编队包含控制技术将编队控制和合围控制同时考虑在内,是一种更复杂且统一的控制技术。
尽管当前在编队控制和合围控制领域分别已经有很多研究成果,但对多智能体的编队合围控制问题的相关研究仍然较少。且这些研究中并没有把多智能体系统运动全过程中的成员相互避撞性以及各系统参数的不确定性等因素完全考虑在内,无法满足复杂且不确定性的实际环境应用需求。现有的大多研究都只注重于多智能体的行为模式,对成员间避撞约束考虑不充分,且大多忽视了系统参数的不确定性,这难以满足实际动态环境的控制任务需求。
此外,随着无人机、无人船和智能汽车等技术的不断进步,智能体的群体的应用范围也在不断扩展。应用场景也逐渐多样化,例如,轨道车辆进行单向或往复运动的一维运动场景;智能汽车在多车道平面内的二维运动场景,以及无人机等设备在三维空间的中的运动场景等。在不同应用场景下,不同智能体的集群控制策略也存在差异。因此,如何开发出一种通用的控制策略以使用不同应用场景下的多智能体集群控制,也是本领域技术人员亟待解决的技术难题。
发明内容
为了解决现有的多智能体集群控制策略通用性差和控制精度不足问题,本发明提供一种多智能体的避撞编队合围控制器的设计方法及其控制器。
本发明采用以下技术方案实现:
一种多智能体的避撞编队合围控制器的设计方法,该避撞编队合围控制器用于对智能体集群进行协同控制;设计方法包括如下步骤:
S1:基于牛顿-欧拉方法构建智能体集群O中每个智能体的动力学模型;
其中,i表示各个智能体对应的编号,i∈O,O={1,2,…,N};qi、分别代表智能体i的位置、速度和加速度向量;σi代表智能体i的不确定性参数项;Mi代表智能体i的惯性矩阵;/>代表智能体i对应的科氏力或离心力项;Fi代表智能体i所受的其余阻力项;τi代表智能体i对应的控制输入;t代表时间。
S2:将智能体集群O分成外围的领航编队和被领航编队包围的内部的跟随编队,定义领航编队的集合L,L={1,2,…,K};跟随编队的集合为F,F={K+1,K+2,…,N}。
S3:依据智能体集群O中任意两个智能体间i和j的空间距离与安全距离间的平方差构建任意智能体i的避撞函数并生成对应的避撞约束矩阵/>一阶避撞约束向量/>和二阶避撞约束向量/>
S4:将领航编队L中任意两个智能体i和j的空间位置与指定常向量间的平方差作为领航编队L中任意智能体i的编队误差/>并生成对应的编队约束矩阵/>一阶编队约束向量/>和二阶编队约束向量/>
S5:将跟踪编队F中任意一个智能体i的位置向量与其在领航编队L包围内的理想位置向量的偏差作为跟随编队F中任意智能体i的合围误差ei;并生成对应的合围约束矩阵一阶合围约束向量/>和二阶合围约束向量/>
S6:综合避撞、编队和合围三类约束关系,得到融合后的群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi;其满足:
S7:根据群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi,设计对应的避撞编队合围控制器。过程包括:
S71:定义智能体i的一阶约束跟随误差ηi为:
S72:对于任意智能体i,设计的避撞编队合围控制器的形式如下:
上式中;pi1是由Udwadia-Kalaba方程得到的理想约束力;pi2表示避撞编队合围控制器中的反馈部分;pi3表示避撞编队合围控制器中用于补偿系统不确定性影响的部分;分别为对应矩阵的确定性部分;“+”表示对应矩阵的广义逆;λi为一个大于0的常量参数;Pi为任意一个正定矩阵;/>表示正的调节参数;δi表示正的误差反馈参数;
Ωi为不确定性边界函数,用于估计不确定性的上界;
S73:采用渐亏型自适应律控制估计避撞编队合围控制器中的不确定性参数;
S8:基于李雅普诺夫函数方法对采用避撞编队合围控制器的控制系统进行稳定性分析,进而得到经过验证的避撞编队合围控制器。
作为本发明进一步的改进,步骤S3中,避撞函数的计算公式如下:
上式中,dij表示预设的任意两个智能体间的最小安全距离。
则避撞条件为一阶避撞约束为/>二阶避撞约束为/>
作为本发明进一步的改进,避撞约束矩阵一阶避撞约束向量/>和二阶避撞约束向量/>的计算公示如下:
上式中,A* i(i+1)表示第i个智能体和第i+1个智能体之间的避撞约束矩阵,c* i(i+1)表示第i个智能体和第i+1个智能体之间的一阶避撞约束向量,b* i(i+1)表示第i个智能体和第i+1个智能体之间的二阶避撞约束向量,它们可由一阶避撞约束和二阶避撞约束化简整理求得。
作为本发明进一步的改进,步骤S4中,编队误差的计算公式如下:
其中,为一个表征领航编队中任意两个智能体i和j间预设的空间位置的指定常向量;
则编队约束为设置一阶编队约束为/>二阶编队约束为:其中,lij为一个预设的常量,lij>0。
作为本发明进一步的改进,编队约束矩阵一阶编队约束向量/>和二阶编队约束向量/>的计算公示如下:
上式中,表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的编队约束矩阵,/>表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的一阶编队约束向量,/>表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的二阶编队约束向量,它们可由一阶编队约束和二阶编队约束化简整理求得。
作为本发明进一步的改进,步骤S5中,包含误差ei的计算公式如下:
上式中,∈ij表示领航编队中的智能体j对跟随编队中当前智能体i的空间位置影响的权重系数;且满足:∈ij≥0且
则理想合围条件为ei=0,设置一阶合围约束为二阶合围约束为:其中,li为一个预设的常量,li>0。
作为本发明进一步的改进,合围约束矩阵一阶合围约束向量/>和二阶合围约束向量/>可由一阶合围约束和二阶合围约束代入整理求得。
作为本发明进一步的改进,步骤S72中,δi和的计算公示如下:
上式中,εi为一个常量参数,εi>0;αi表示系统的不确定性参数,为αi的估计值;用于估计不确定性的上界,并基于预设的自适应律实时调节。
作为本发明进一步的改进,步骤S73中,不确定性参数αi由如下渐亏型自适应律控制估计:
其中,不确定参数估计值/>的导数;/>t0为初始时间,ki1和ki2为常量参数,ki1,ki2>0,φi为正的调节系数,μi为正的常量参数。
本发明还包括一种避撞编队合围控制器,其采用如前述的多智能体的避撞编队合围控制器的设计方法设计而成。该避撞编队合围控制器用于驱动由任意数量的智能体构成的智能体集群按照预设的行为模式运动,并实现队形保持和防止碰撞。
本发明提供的技术方案,具有如下有益效果:
本发明针对现有编队控制、合围控制以及编队合围控制技术中,较少考虑系统参数的不确定性,且对多智能体中各成员间的避撞性未充分考虑的弊端。通过设计避撞函数并利用其性质设计避撞约束,从而在满足约束的条件下可保证各成员运动过程中的全局避撞性。针对系统参数的不确定性,本发明提出的自适应鲁棒控制方法可以实时估计不确定性边界,从而补偿其带来的干扰影响,在这一控制框架下,即使存在参数不确定性的条件下对应的编队约束,合围约束和避撞约束都能有效满足,从而实现了具有全局成员避撞性的编队合围控制。
本发明设计的避撞编队合围控制器可以对不同类型智能体以及不同类型运动场景中进行适配,并根据需要对及智能体集群进行协调控制,可以快速完成队形构成和保持,并有效保证运行过程对各个智能体的控制精度。性能更强、通用性更好,因而具有更高的实用价值。
附图说明
图1为本发明实施例1中提供的一种多智能体的避撞编队合围控制器的设计方法的步骤流程图。
图2为仿真实验阶段采用的避撞编队合围控制器的控制逻辑的原理图。
图3为仿真实验中无人车在初始状态下的空间位置分布图。
图4为仿真实验中无人车在避撞编队合围控制器控制下5s后的空间位置分布图。
图5为仿真实验中无人车在避撞编队合围控制器控制下20s后的空间位置分布图。
图6为仿真实验中领航编队层各车辆之间的车辆间距的变化曲线。
图7为仿真实验中跟随合围层各车辆之间的车辆间距的变化曲线。
图8为仿真实验中领航编队层和跟随合围层之间的车辆间距的变化曲线。
图9为无人车集群中各车控制的约束跟随误差随时间的变化曲线。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步地详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种多智能体的避撞编队合围控制器的设计方法,该避撞编队合围控制器用于对智能体集群进行协同控制;如图1所示,该避撞编队合围控制器的设计方法包括如下步骤:
S1:基于牛顿-欧拉方法构建智能体集群O中每个智能体的动力学模型:
其中,i表示各个智能体对应的编号,i∈O,O={1,2,…,N};qi、分别代表智能体i的位置、速度和加速度向量;σi代表智能体i的不确定性参数项;Mi代表智能体i的惯性矩阵;/>代表智能体i的科氏力或离心力项;其中,即为对应的科氏力矩阵;Fi代表智能体i所受的其余阻力项;τi代表智能体i对应的控制输入;t代表时间。
S2:为了实现对更加科学有效的编组队形保持,本实施例将智能体集群O中的成员分为外围的领航编队,以及被领航编队完全包围的内部的跟随编队,定义领航编队的集合L,L={1,2,…,K};跟随编队的集合为F,F={K+1,K+2,…,N}。在后续的控制过程,不同的编队将采取不同的控制策略进行约束。本实施例采取的控制策略为:
(1)对于智能体集群O中的任意两个智能体i和j(即:i,j∈O且i≠j),需要控制两个智能体之间永远不会发生相互碰撞,即满足避撞约束。
(2)对于领航编队L中的任意两个智能体i和j(即:i,j∈L且i≠j),还需要控制任意两个智能体的空间位置保持不变,并与各自在编组中的初始位置一致,这样就可以实现编队的队形不发生变化;即满足编队约束。
(3)对于跟随编队F中的任意一个智能体i,(即:i∈L)其还应当一直位于所有属于L集合的智能体j围成的凸包之内;即满足合围约束。对跟随编队采用合围约束,可以在满足编组要求的同时,使得跟随编队中每个智能体的空间位置具有更大的空间调整范围;降低了智能体集群控制的难度,扩大了有效解的空间。
S3:依据智能体集群O中任意两个智能体间i和j的空间距离与安全距离间的平方差构建任意智能体i的避撞函数并生成对应的避撞约束矩阵/>一阶避撞约束向量/>和二阶避撞约束向量/>
本实施例中,避撞约束的构建过程如下:对于任意i,j∈O,且i≠j,假定智能体i与j在t时刻对应位置向量分别为qi(t)和qj(t),设置任意两智能体之间的最小安全距离为dij,t表示时间;则它们之间的相对间距Sij可表示为
则对应避撞约束条件为Sij(t)≥0恒成立。
其对应避撞函数可写为如下形式:
在此基础上,设计一阶避撞约束为即:
令:
代入整理,它们的矩阵形式可写成如下形式:
二阶避撞约束为即
令:
代入整理,它们的矩阵形式可写成如下形式:
其中,当i=1时,
当i=2,3,…,N-1时,
当i=N时,
因此,考虑所有成员的避撞关系,整理得出:对于任意i∈O,智能体i所有需要满足的避撞约束的矩阵形式如下:
S4:将领航编队L任意两个智能体i和j的空间位置与指定常向量间的平方差作为领航编队L中任意智能体i的编队误差/>并生成对应的编队约束矩阵/>一阶编队约束向量/>和二阶编队约束向量/>
本实施例中,编队约束的构建方法如下:
针对领航编队L,各智能体间需要形成一个稳定编队以包围内部成员。因此,对于任意i,j∈L且i≠j,假定在期望编队中智能体i与智能体j间的空间位置应当满足:
则定义编队误差如下:
其中,表示在期望编队中任意两领航智能体i与智能体j相对位置的常向量。
从而可设置一阶编队约束为:
其中,lij>0为常量。
令
则对应的矩阵约束形式可整理为:
对上式求导可得二阶约束形式:
其中,
令
对应矩阵形式可整理为
其中,当i=1时,
当i=2,3,…,K-1时,
当i=K时,
因此整理得到:对于任意i∈L,智能体i所有需要满足的编队约束的矩阵形式如下:
S5:将跟踪编队F中任意一个智能体i的位置向量与其在领航编队L包围内的理想位置向量的偏差作为跟随编队F中任意智能体i的合围误差ei;并生成对应的合围约束矩阵一阶合围约束向量/>和二阶合围约束向量/>
在本实施例中,合围约束的构建过程如下:当i∈F时,在智能体i与其他属于O集合中的智能体不发生碰撞基础上,还需要使得智能体i一直位于所有属于L集合的智能体围成的凸包之内。即对任意i∈F,智能体i应满足:
其中,i∈F,j∈L;qi(t)表示跟随合围层智能体i的位置向量,qj(t)表示领航编队层智能体j的位置向量;∈ij≥0且
对于任意i∈F,由上式可定义智能体i的合围误差:
则可设置一阶合围约束为:
其中,li>0为常量,
对一阶合围约束求导得:
其中,
令:
I为单位矩阵
对应矩阵形式的一阶和二阶约束分别归纳写成如下形式:
S6:在本实施例提供的避撞编队合围控制器中,对于属于不同编队的智能体,其需要满足的约束类型是不同的。例如,对于属于领航编队L中的每个智能体,其相互之间既需要满足避撞约束,又需要满足编队约束。对于属于跟随编队F中的每个智能体,其既需要在相互之间满足避撞约束,又需要与每个领航编队L中的成员满足合围约束。而对于不属于上述两种关系的其它任意两个智能体,则仅需要满足避撞约束即可,如每个领航编队成员与每个跟随编队成员间也不能发生碰撞。
综上所述,结合步骤S3-S5中建立的避撞、编队和合围三类约束关系,可以进一步得到融合后的群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi;其矩阵形式大致如下:
S7:根据群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi,设计对应的避撞编队合围控制器。过程包括:
S71:定义智能体i的一阶约束跟随误差ηi为:
S72:对于任意智能体i,设计的避撞编队合围控制器的形式如下:
上式中;pi1是由Udwadia-Kalaba方程得到的理想约束力;pi2表示避撞编队合围控制器中的反馈部分;pi3表示避撞编队合围控制器中用于补偿系统不确定性影响的部分;分别为对应矩阵的确定性部分;“+”表示对应矩阵的广义逆;λi为一个大于0的常量参数;Pi为任意一个正定矩阵;/>表示正的调节参数;δi表示正的误差反馈参数;Ωi为不确定性边界函数,用于估计不确定性的上界;
其中,δi和的计算公示如下:
上式中,εi为一个常量参数,εi>0;αi表示系统的不确定性参数,为αi的估计值;用于估计不确定性的上界,并基于预设的自适应律实时调节。
S73:采用渐亏型自适应律控制估计避撞编队合围控制器中的不确定性参数;本实施例中的不确定性参数αi的估计函数如下:
其中,表示不确定性参数估计值/>的导数;/>t0为初始时间,ki1和ki2为常量参数,ki1,ki2>0,φi为正的调节系数,μi为正的常量参数。
S8:为了验证控制系统的有效性,本实施例基于李雅普诺夫函数方法对采用避撞编队合围控制器的控制系统进行稳定性分析,选取对应智能体i的李雅普诺夫函数为:
其中,Pi为正定矩阵,为大于-1的常数。
整理计算可得
其中,
由此可见,采用本实施例设计的群体控制器的控制系统具有一致有界性和一致最终有界性;这说明本实施例设计出的群体控制器在理论上是有效的。
实施例2
在实施例1方案的基础上,本实施例进一步提供一种避撞编队合围控制器,其采用如实施例1中的多智能体的避撞编队合围控制器的设计方法设计而成。该避撞编队合围控制器用于驱动由任意数量的智能体构成的智能体集群按照预设的行为模式运动,并实现队形保持和防止碰撞。
本实施例提供一种避撞编队合围控制器本质上是一种用于实现数据处理和指令生成的计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序。处理器执行计算机程序时,创建出所需的避撞编队合围控制器。
本实施例中提供的计算机设备可以是能执行程序的智能终端、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器、处理器。
本实施例中,存储器(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。当然,存储器还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器通常用于存储安装于计算机设备的操作系统和各类应用软件等。此外,存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、图像处理器GPU(Graphics Processing Unit)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制计算机设备的总体操作。本实施例中,处理器用于运行存储器中存储的程序代码或者处理数据。
仿真实验
为了验证本实施例设计出的避撞编队合围控制器的实际应用效果,本实施例采用无人车为控制对象,利用本实施设计的避撞编队合围控制器对无人车的编队运动过程进行协同控制。
在仿真实验中,选取7辆无人车进行验证,其中4辆(车辆1、2、3、4)属于领航编队层,其余3辆(车辆5、6、7)属于跟随合围层。在避撞编队合围控制器中,不同类型的无人车的控制逻辑大致如图2所示。
本次仿真实验的控制目标是湿的领航编队层采用一个方阵的队形运动,二跟随合围层位于领航编队层构成的方阵中,并优选为构成一个三角阵列。
在避撞编队合围控制器的控制下,初始状态无人车的空间位置大致如图3所示,第5s后,集群的队形大致成形,并如图4所示。在第20s,如图5所示,无人车编队已经完全实现了理想队形。结合图3-5中无人车在0-20s内的位置变化关系可以证明:本实施例避撞编队合围控制器可以使得无人车逐步形成理想的编队合围关系,与控制目标一致。
另外,在无人车集群的后续运动过程,领航编队层车间距、跟随合围层车间距和其余各车间距随时间的变化关系大致如图6,图7和图8所示。从图6-8中可以看出,这些车辆的间距恒大于0,且在25s之后,最终都收敛于一个稳定值。这说明:在本实施例设计出的避撞编队合围控制器的控制下,各车辆之间全程完全不碰撞,严格满足避撞约束,且相互间保持稳定距离,满足编队特性。
图9为本实施例避撞编队合围控制器控制条件下,无人车集群中各车控制的约束跟随误差随时间的变化关系,从图9中可以看出,误差在15s之后都基本收敛到0,这反映了本实施例设计的避撞编队合围控制器不仅控制精度高,而且响应特极佳,可以快速形成理想对象,且在后续过程中不发生偏差。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种多智能体的避撞编队合围控制器的设计方法,其特征在于,所述避撞编队合围控制器用于对智能体集群进行协同控制;所述设计方法包括如下步骤:
S1:基于牛顿-欧拉方法构建智能体集群O中每个智能体的动力学模型;
其中,i表示各个智能体对应的编号,i∈O,O={1,2,…,N};分别代表智能体i的位置、速度和加速度向量;σi代表智能体i的不确定性参数项;Mi代表智能体i的惯性矩阵;/>代表智能体i对应的科氏力或离心力项;Fi代表智能体i所受的其余阻力项;τi代表智能体i对应的控制输入;t代表时间;
S2:将智能体集群O分成外围的领航编队和被领航编队包围的内部的跟随编队,定义领航编队的集合L,L={1,2,…,K};跟随编队的集合为F,F={K+1,K+2,…,N};
S3:依据智能体集群O中任意两个智能体间i和j的空间距离与安全距离间的平方差构建任意智能体i的避撞函数并生成对应的避撞约束矩阵/>一阶避撞约束向量/>和二阶避撞约束向量/>
S4:将领航编队L中任意两个智能体i和j的空间位置与指定常向量间的平方差作为领航编队L中任意智能体i的编队误差/>并生成对应的编队约束矩阵/>一阶编队约束向量ci f和二阶编队约束向量/>
S5:将跟踪编队F中任意一个智能体i的位置向量与其在领航编队L包围内的理想位置向量的偏差作为跟随编队F中任意智能体i的合围误差ei;并生成对应的合围约束矩阵一阶合围约束向量/>和二阶合围约束向量/>
S6:综合避撞、编队和合围三类约束关系,得到融合后的群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi,其满足:
S7:根据群体约束矩阵Ai、一阶群体约束向量ci和二阶群体约束向量bi,设计对应的避撞编队合围控制器,过程包括:
S71:定义智能体i的一阶约束跟随误差ηi为:
S72:对于任意智能体i,设计的避撞编队合围控制器的形式如下:
上式中;pi1是由Udwadia-Kalaba方程得到的理想约束力;pi2表示避撞编队合围控制器中的反馈部分;pi3表示避撞编队合围控制器中用于补偿系统不确定性影响的部分;分别为对应矩阵的确定性部分;“+”表示对应矩阵的广义逆;λi为一个大于0的常量参数;Pi为任意一个正定矩阵;/>表示正的调节参数;δi表示正的误差反馈参数;Ωi为不确定性边界函数,用于估计不确定性的上界;
S73:采用渐亏型自适应律控制估计所述避撞编队合围控制器中的不确定性参数;
S8:基于李雅普诺夫函数方法对采用所述避撞编队合围控制器的控制系统进行稳定性分析,进而得到经过验证的避撞编队合围控制器。
2.如权利要求1所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:步骤S3中,所述避撞函数的计算公式如下:
上式中,dij表示预设的任意两个智能体间的最小安全距离;
则避撞约束为一阶避撞约束为/>二阶避撞约束为/>
3.如权利要求2所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:所述避撞约束矩阵一阶避撞约束向量/>和二阶避撞约束向量/>的计算公示如下:
上式中,A* i(i+1)表示第i个智能体和第i+1个智能体之间的避撞约束矩阵,c* i(i+1)表示第i个智能体和第i+1个智能体之间的一阶避撞约束向量,b* i(i+1)表示第i个智能体和第i+1个智能体之间的二阶避撞约束向量,它们可由一阶避撞约束和二阶避撞约束化简整理求得。
4.如权利要求3所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:步骤S4中,所述编队误差的计算公式如下:
其中,为一个表征领航编队中任意两个智能体i和j间预设的空间位置的指定常向量;
则编队约束为设置一阶编队约束为/>二阶编队约束为:/>其中,lij为一个预设的常量,lij>0。
5.如权利要求4所述的多智能体的避撞编队合围控制器的设计方法,其特征在于,所述编队约束矩阵一阶编队约束向量/>和二阶编队约束向量/>的计算公示如下:
上式中,表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的编队约束矩阵,/>表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的一阶编队约束向量,/>表示领航编队中的第i个智能体和领航编队中的第i+1个智能体之间的二阶编队约束向量。
6.如权利要求5所述的多智能体的避撞编队合围控制器的设计方法,其特征在于,步骤S5中,所述合围误差ei的计算公式如下:
上式中,∈ij表示领航编队中的智能体j对跟随编队中当前智能体i的空间位置影响的权重系数;且满足:∈ij≥0且
则理想合围条件为ei=0,设置一阶合围约束为二阶合围约束为:/>其中,li为一个预设的常量,li>0。
7.如权利要求6所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:所述合围约束矩阵一阶合围约束向量/>和二阶合围约束向量/>可由一阶合围约束和二阶合围约束代入整理求得。
8.如权利要求7所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:步骤S72中,δi和的计算公示如下:
上式中,εi为一个常量参数,εi>0;αi表示系统的不确定性参数,为αi的估计值;用于估计不确定性的上界,并基于预设的自适应律实时调节。
9.如权利要求8所述的多智能体的避撞编队合围控制器的设计方法,其特征在于:步骤S73中,不确定性参数αi由如下渐亏型自适应律控制估计:
其中,表示不确定性参数估计值/>的导数;/>为初始时间,ki1和ki2为常量参数,ki1,ki2>0。
10.一种避撞编队合围控制器,其特征在于,其采用如权利要求1-9中任意一项所述的多智能体的避撞编队合围控制器的设计方法设计而成,所述避撞编队合围控制器用于驱动由任意数量的智能体构成的智能体集群按照预设的行为模式运动,并实现队形保持和防止碰撞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310885313.9A CN116700012B (zh) | 2023-07-19 | 2023-07-19 | 一种多智能体的避撞编队合围控制器的设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310885313.9A CN116700012B (zh) | 2023-07-19 | 2023-07-19 | 一种多智能体的避撞编队合围控制器的设计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116700012A true CN116700012A (zh) | 2023-09-05 |
CN116700012B CN116700012B (zh) | 2024-03-01 |
Family
ID=87831292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310885313.9A Active CN116700012B (zh) | 2023-07-19 | 2023-07-19 | 一种多智能体的避撞编队合围控制器的设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116700012B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687309A (zh) * | 2024-02-04 | 2024-03-12 | 北京航空航天大学 | 用于异构集群系统的异步约束输出编队跟踪方法及系统 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019054232A1 (ja) * | 2017-09-14 | 2019-03-21 | ソフトバンク株式会社 | 故障落下対応型haps |
CN110091868A (zh) * | 2019-05-20 | 2019-08-06 | 合肥工业大学 | 一种人机协同控制的纵向避撞方法及其系统、智能汽车 |
US20190243320A1 (en) * | 2018-02-05 | 2019-08-08 | Mitsubishi Electric Research Laboratories, Inc. | Method and Apparatus for Preconditioned Predictive Control |
CN110488845A (zh) * | 2019-09-18 | 2019-11-22 | 中国人民解放军火箭军工程大学 | 一种障碍物遮挡下多智能体自抗扰时变编队跟踪与避撞控制方法 |
CN111176327A (zh) * | 2020-01-16 | 2020-05-19 | 北京航空航天大学 | 一种多智能体系统合围控制方法及系统 |
CN112034714A (zh) * | 2020-09-08 | 2020-12-04 | 北京航空航天大学 | 一种分组时变编队合围跟踪控制方法及系统 |
CN113264067A (zh) * | 2021-06-25 | 2021-08-17 | 合肥工业大学 | 一种无人驾驶赛车制动与转向协同避撞控制方法及系统 |
CN113608445A (zh) * | 2021-08-27 | 2021-11-05 | 北京理工大学 | 一种多智能体避障及避碰方法 |
WO2021244207A1 (zh) * | 2020-06-06 | 2021-12-09 | 华为技术有限公司 | 训练驾驶行为决策模型的方法及装置 |
CN114138010A (zh) * | 2021-11-22 | 2022-03-04 | 浙江理工大学 | 一种基于加权偏差的多智能体高阶滑模编队控制方法 |
CN115033016A (zh) * | 2022-05-17 | 2022-09-09 | 浙江大学 | 一种异构无人集群编队避障方法及系统 |
WO2022205940A1 (zh) * | 2021-04-02 | 2022-10-06 | 深圳市优必选科技股份有限公司 | 机器人运动控制方法、装置和机器人 |
CN115993845A (zh) * | 2023-03-23 | 2023-04-21 | 西北工业大学深圳研究院 | 一种集群智能系统协同运动规划与编队控制方法 |
CN115993781A (zh) * | 2023-03-22 | 2023-04-21 | 合肥工业大学 | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 |
CN116300419A (zh) * | 2022-12-09 | 2023-06-23 | 清华大学 | 一种基于群函数的分布式编队控制方法 |
CN116331518A (zh) * | 2023-01-13 | 2023-06-27 | 天津大学 | 一种基于安全自适应动态规划的星群智能编队避碰控制方法 |
-
2023
- 2023-07-19 CN CN202310885313.9A patent/CN116700012B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019054232A1 (ja) * | 2017-09-14 | 2019-03-21 | ソフトバンク株式会社 | 故障落下対応型haps |
US20190243320A1 (en) * | 2018-02-05 | 2019-08-08 | Mitsubishi Electric Research Laboratories, Inc. | Method and Apparatus for Preconditioned Predictive Control |
CN110091868A (zh) * | 2019-05-20 | 2019-08-06 | 合肥工业大学 | 一种人机协同控制的纵向避撞方法及其系统、智能汽车 |
CN110488845A (zh) * | 2019-09-18 | 2019-11-22 | 中国人民解放军火箭军工程大学 | 一种障碍物遮挡下多智能体自抗扰时变编队跟踪与避撞控制方法 |
CN111176327A (zh) * | 2020-01-16 | 2020-05-19 | 北京航空航天大学 | 一种多智能体系统合围控制方法及系统 |
WO2021244207A1 (zh) * | 2020-06-06 | 2021-12-09 | 华为技术有限公司 | 训练驾驶行为决策模型的方法及装置 |
CN112034714A (zh) * | 2020-09-08 | 2020-12-04 | 北京航空航天大学 | 一种分组时变编队合围跟踪控制方法及系统 |
WO2022205940A1 (zh) * | 2021-04-02 | 2022-10-06 | 深圳市优必选科技股份有限公司 | 机器人运动控制方法、装置和机器人 |
CN113264067A (zh) * | 2021-06-25 | 2021-08-17 | 合肥工业大学 | 一种无人驾驶赛车制动与转向协同避撞控制方法及系统 |
CN113608445A (zh) * | 2021-08-27 | 2021-11-05 | 北京理工大学 | 一种多智能体避障及避碰方法 |
CN114138010A (zh) * | 2021-11-22 | 2022-03-04 | 浙江理工大学 | 一种基于加权偏差的多智能体高阶滑模编队控制方法 |
CN115033016A (zh) * | 2022-05-17 | 2022-09-09 | 浙江大学 | 一种异构无人集群编队避障方法及系统 |
CN116300419A (zh) * | 2022-12-09 | 2023-06-23 | 清华大学 | 一种基于群函数的分布式编队控制方法 |
CN116331518A (zh) * | 2023-01-13 | 2023-06-27 | 天津大学 | 一种基于安全自适应动态规划的星群智能编队避碰控制方法 |
CN115993781A (zh) * | 2023-03-22 | 2023-04-21 | 合肥工业大学 | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 |
CN115993845A (zh) * | 2023-03-23 | 2023-04-21 | 西北工业大学深圳研究院 | 一种集群智能系统协同运动规划与编队控制方法 |
Non-Patent Citations (1)
Title |
---|
韩娜妮 等: "离散异构多自主体系统时变编队-合围控制", 控制与决策, vol. 34, no. 8, pages 1803 - 1808 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687309A (zh) * | 2024-02-04 | 2024-03-12 | 北京航空航天大学 | 用于异构集群系统的异步约束输出编队跟踪方法及系统 |
CN117687309B (zh) * | 2024-02-04 | 2024-04-16 | 北京航空航天大学 | 用于异构集群系统的异步约束输出编队跟踪方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116700012B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aguiar et al. | Trajectory-tracking and path-following of underactuated autonomous vehicles with parametric modeling uncertainty | |
CN116700012B (zh) | 一种多智能体的避撞编队合围控制器的设计方法 | |
Xue et al. | Trajectory planning for autonomous mobile robot using a hybrid improved QPSO algorithm | |
CN109343549A (zh) | 一种飞行器姿态控制方法、系统、介质及设备 | |
CN115993781B (zh) | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 | |
Huang et al. | A new dynamic path planning approach for unmanned aerial vehicles | |
CN115291622A (zh) | 一种避障无人机分布式编队分数阶滑模控制方法 | |
Gao et al. | Dubins path‐based dynamic soaring trajectory planning and tracking control in a gradient wind field | |
Zhang et al. | Low-level control technology of micro autonomous underwater vehicle based on intelligent computing | |
CN111833381A (zh) | 一种无人机目标跟踪轨迹生成方法、无人机及存储介质 | |
CN115877871A (zh) | 一种基于强化学习的非零和博弈无人机编队控制方法 | |
CN113419424B (zh) | 减少过估计的模型化强化学习机器人控制方法及系统 | |
Jardine et al. | Adaptive MPC using a dual fast orthogonal Kalman filter: Application to quadcopter altitude control | |
Hu et al. | Design of active disturbance rejection controller for dynamic positioning based on improved particle swarm optimization | |
Yang et al. | Adaptive longitudinal control for multivehicle cooperative systems with actuator saturation under road bumps | |
CN114063636B (zh) | 基于干扰观测器的无人机集群密集编队控制方法及装置 | |
Jia et al. | Distributed analytical formation control and cooperative guidance for gliding vehicles | |
Jardine et al. | Leveraging data engineering to improve unmanned aerial vehicle control design | |
CN111775952B (zh) | 自动驾驶方法、装置和存储介质 | |
CN116954074B (zh) | 一种基于高速状态转换模型的agv队列的避撞控制方法 | |
CN113608541A (zh) | 一种水下航行器姿态控制方法和系统 | |
Zhou et al. | UAV based adaptive trajectory tracking control with input saturation and unknown time‐varying disturbances | |
Wang et al. | Active disturbance rejection attitude control for hypersonic vehicle based on intelligent stochastic robust optimization method | |
CN111897213A (zh) | 一种模型不确定下的汽车自适应巡航控制方法 | |
Kang et al. | Finite memory output feedback control for unmanned aerial vehicle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |