CN111103881A - 一种多智能体编队防碰撞控制方法及系统 - Google Patents
一种多智能体编队防碰撞控制方法及系统 Download PDFInfo
- Publication number
- CN111103881A CN111103881A CN201911358078.XA CN201911358078A CN111103881A CN 111103881 A CN111103881 A CN 111103881A CN 201911358078 A CN201911358078 A CN 201911358078A CN 111103881 A CN111103881 A CN 111103881A
- Authority
- CN
- China
- Prior art keywords
- agent
- formation
- collision
- controller
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000011159 matrix material Substances 0.000 claims abstract description 31
- 230000001133 acceleration Effects 0.000 claims abstract description 17
- 239000003795 chemical substances by application Substances 0.000 claims description 405
- 230000006870 function Effects 0.000 claims description 51
- 230000009471 action Effects 0.000 claims description 21
- 238000013461 design Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 25
- 230000000694 effects Effects 0.000 description 21
- 230000008859 change Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 5
- 230000002265 prevention Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0287—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
- G05D1/0289—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling with means for avoiding collisions between vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Aviation & Aerospace Engineering (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明实施例提供一种多智能体编队防碰撞控制方法及系统。该方法包括:基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由编队控制器控制若干智能体完成编队任务;基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由防碰撞控制器实现若干智能体的防碰撞任务。本发明实施例通过将碰撞锥思想和人工势场思想应用于多智能体编队防碰撞策略,同时利用智能体位置和速度信息,能够准确判断有无碰撞危险,并将速度引入势场函数进行主动补偿。
Description
技术领域
本发明涉及工程控制技术领域,尤其涉及一种多智能体编队防碰撞控制方法及系统。
背景技术
随着网络化技术和计算机技术的发展,控制理论中被控对象从传统的单个设备演变为由多个设备相互关联组成的复杂大系统,而且目标任务的复杂性和难易度,远远超出了单个设备的能力范围,往往需要多个设备协同参与完成指定任务,则以多智能体系统为对象的理论研究和技术得到了快速的发展。
多智能体编队作为多智能体领域中一个重要方向,理论研究和实际应用都取得了丰硕的成果,然而随着编队任务的复杂性和智能体数量的增多,导致碰撞的危险因素也随之增多。特别地,碰撞发生一般有以下几种情形:1)初始位置到编队形成过程中发生碰撞。2)编队形式变换的过程中发生碰撞。3)智能体突遇障碍物后为躲避障碍物而导致智能体间发生碰撞。4)智能体失去正常感知和通讯能力或者其他故障发生时导致碰撞。目前应用较为普遍的是基于人工势场法的防碰撞策略,该类策略可通过合理设计势场函数实现防碰撞功能,但其中人工势场半径的选取相对较难。选取过大时,虽然保证了安全性,但编队跟踪误差会因为虚拟排斥力的作用而增大,降低了编队跟踪性能;选取过小,就会降低系统安全性。分布式预测控制方法通过考虑智能体间距离约束也可解决防碰撞问题,但在高速或者随机干扰存在的情况下,再加上预测控制本身大量占用计算资源,系统安全性得不到保障。综上所述,目前解决多智能体编队防碰撞问题的方法主要存在以下不足:1)在传统人工势场防碰撞策略作用下,当智能体间距离小于势场半径时,智能体即受到虚拟的排斥力,而不考虑智能体的速度方向,实际情形中智能体即使在势场范围内也无碰撞危险,无须给予虚拟排斥力;2)现有的防碰撞势能函数设计仅利用了智能体的位置信息,对于碰撞危险来说相对滞后;3)在传统人工势场防碰撞策略作用下,当智能体间距离小于势场半径时,不能保持例如并行一字编队运动状态,很明显,此时无碰撞危险,如图1所示;由于上述局限,大大限制了多智能体编队形式,并且降低了编队跟踪精度,增加了控制成本。
发明内容
本发明实施例提供一种多智能体编队防碰撞控制方法及系统,用以解决现有技术中没有考虑智能体的运动方向,对危险判断不准确,并且识别危险相对滞后,或者在无碰撞危险时虚拟势场力的存在又使得编队跟踪精度下降等问题。
第一方面,本发明实施例提供一种多智能体编队防碰撞控制方法,包括:
基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;
基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;
由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
优选地,所述编队控制器,具体包括:
其中,k>0,c>0,aij为所述多智能体动态邻接矩阵元素,N为从智能体的数量,epi为所述第一智能体与期望轨迹的位置误差,epj为所述第二智能体与期望轨迹的位置误差,evi为所述第一智能体与期望轨迹的速度误差,evj为所述第二智能体与期望轨迹的速度误差,为所述虚拟主智能体的加速度。
优选地,所述多智能体动态邻接矩阵元素具体包括:
当所述第一智能体与第二智能体间距位于第一预设区间内,所述多智能体动态邻接矩阵元素取值为0;
当所述第一智能体与第二智能体间距位于第二预设区间内,所述多智能体动态邻接矩阵元素取值由所述第一智能体与第二智能体间距决定;
当所述第一智能体与第二智能体间距位于第三预设区间内,所述多智能体动态邻接矩阵元素取值为1。
优选地,所述基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务,之前包括:
定义任一智能体i的编队跟踪误差:
式中,evi(t)表示任一智能体i与期望轨迹的速度误差,epi(t)表示表示任一智能体i与期望轨迹的位置误差,δi(t)表示任一智能体i与虚拟主智能体的期望位置,pi(t)表示任一智能体i的位置,vi(t)表示任一智能体i的速度,pl(t)表示虚拟主智能体的位置,vl(t)表示虚拟主智能体的速度。
优选地,所述任一智能体i的位置和所述任一智能体i的速度由所述任一智能体i的控制输入ui(t)所得到,具体包括:
所述虚拟主智能体的位置和所述虚拟主智能体的速度由所述虚拟主智能体的控制输入ul(t)得到,具体包括:
优选地,所述基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务,具体包括:
定义所述势场函数为:
式中,ζca表示动作函数设计参数,τ表示制动能力常数,λ1和λ2分别表示公式中前后两部分权重的调节系数,表示碰撞锥角度的一半,Ψca表示危险区域角度的一半,且θ表示任一智能体的速度与智能体间距离向量的夹角;
所述防碰撞控制器具体包括:
优选地,所述由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器,具体包括:
第二方面,本发明实施例提供一种多智能体编队防碰撞控制系统,包括:
编队设计模块,用于基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;
防碰撞设计模块,用于基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;
合成模块,用于由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
第三方面,本发明实施例提供一种电子设备,包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述多智能体编队防碰撞控制方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现任一项所述多智能体编队防碰撞控制方法的步骤。
本发明实施例提供的多智能体编队防碰撞控制方法及系统,通过将碰撞锥思想和人工势场思想应用于多智能体编队防碰撞策略,同时利用智能体位置和速度信息,能够准确判断有无碰撞危险,并将速度引入势场函数进行主动补偿,增加了系统的快速性和安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中多智能体碰撞危险性分析示意图;
图2为本发明实施例提供的一种多智能体编队防碰撞控制方法流程图;
图3为本发明实施例提供的多智能体防碰撞方法原理图;
图4为本发明实施例提供的无防碰撞控制器加入时多智能体编队跟踪控制效果图;
图5为本发明实施例提供的无防碰撞控制器加入时多智能体间距离变化效果图;
图6为本发明实施例提供的有防碰撞控制器加入时多智能体编队跟踪控制效果图;
图7为本发明实施例提供的有防碰撞控制器加入时多智能体间距离变化效果图;
图8为本发明实施例提供的有防碰撞控制器加入时多智能体编队跟踪控制位置误差变化效果图;
图9为本发明实施例提供的有防碰撞控制器加入时多智能体编队跟踪控制速度误差变化效果图;
图10为本发明实施例提供的无防碰撞控制器加入时多智能体三角形编队跟踪控制效果图;
图11为本发明实施例提供的无防碰撞控制器加入时多智能体间距离变化效果图;
图12为本发明实施例提供的有防碰撞控制器加入时多智能体三角形编队跟踪控制效果图;
图13为本发明实施例提供的有防碰撞控制器加入时多智能体间距离变化效果图;
图14为本发明实施例提供的有防碰撞控制器加入时多智能体编队跟踪控制位置误差变化效果图;
图15为本发明实施例提供的有防碰撞控制器加入时多智能体编队跟踪控制速度误差变化效果图;
图16为本发明实施例提供的一种多智能体编队防碰撞控制系统结构图;
图17为本发明实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决现有技术存在的问题,本发明实施例提出了同时运用人工势场和碰撞锥思想精准判断碰撞危险的方法,也就是说,智能体速度方向信息的利用弥补了常规仅仅利用智能体间距离判断碰撞危险的不足。如图1所示,此刻智能体2,3,4均在智能体1的势场范围内,但均与智能体1无碰撞危险,如果利用常规基于人工势场的防碰撞方法,智能体1,2,3不能以并行直线编队的形式运动,限制了智能体编队形式的多样性。另外,构造了虚拟的智能体最小安全半径,可以防止随机干扰的存在对安全性的影响,在基本不影响编队跟踪性能的情况下为智能体增加了一道安全屏障,提高了系统的安全性。当智能体在势场范围内时,根据智能体速度方向和智能体间距离向量夹角大小,针对绝对危险,弱危险,不危险三种情形分段设计动作函数。特别地,在弱危险区域,根据危险程度设计了自适应的动作函数。
图2为本发明实施例提供的一种多智能体编队防碰撞控制方法流程图,如图2所示,包括:
S1,基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;
S2,基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;
S3,由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
具体地,步骤S1中,首先实现按照给定编队跟踪轨迹完成编队任务,设计编队控制器,基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素,其中一个智能体定义为第一智能体,与其不同的智能体定义为第二智能体,获取第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差,设计完整的编队控制器函数,由编队控制器控制多个智能体完成编队任务;
步骤S2中,除了步骤S1中需完成的编队任务,还需完成多个智能体之间的防碰撞任务,设计防碰撞控制器,基于智能体势场半径的势场函数,第一智能体速度,及第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由防碰撞控制器实现多个智能体的防碰撞任务;
步骤S3中,将上述步骤S1得到的编队控制器和步骤S2得到的防碰撞控制器合成为多智能体编队总体控制器,即任一智能体的控制输入函数,实现整体控制。
本发明实施例通过将碰撞锥思想和人工势场思想应用于多智能体编队防碰撞策略,同时利用智能体位置和速度信息,能够准确判断有无碰撞危险,并将速度引入势场函数进行主动补偿,提高了编队跟踪精度,也增加了系统的快速性和安全性。
基于上述实施例,所述基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务,之前包括:
定义任一智能体i的编队跟踪误差:
式中,evi(t)表示任一智能体i与期望轨迹的速度误差,epi(t)表示表示任一智能体i与期望轨迹的位置误差,δi(t)表示任一智能体i与虚拟主智能体的期望位置,pi(t)表示任一智能体i的位置,vi(t)表示任一智能体i的速度,pl(t)表示虚拟主智能体的位置,vl(t)表示虚拟主智能体的速度。
其中,所述任一智能体i的位置和所述任一智能体i的速度由所述任一智能体i的控制输入ui(t)所得到,具体包括:
所述虚拟主智能体的位置和所述虚拟主智能体的速度由所述虚拟主智能体的控制输入ul(t)得到,具体包括:
具体地,本发明实施例首先提出多智能体系统为主从模式,由N个跟随者和一个虚拟的领导者组成,其中,跟随者智能体的动态特性,即其中任一智能体i可描述为:
式中,pi(t)∈R2,vi(t)∈R2和ui(t)∈R2分别是任一智能体i的位置、速度和控制输入;其中,i为智能体编号,i∈{0,1,2,...,N}
一个虚拟的领导者,即虚拟主智能体可描述为:
式中,pl(t)∈R2,vl(t)∈R2和ul(t)∈R2分别是虚拟主智能体的位置、速度和控制输入。
进一步地,定义任一智能体i的编队跟踪误差如下:
式中,evi(t)∈R2,epi(t)∈R2和δi(t)∈R2分别表示任一智能体i与期望轨迹的速度误差、位置误差和与虚拟主智能体的期望位置。
可以理解的是,本发明实施例的任务是给定智能体任意初始状态,在本发明实施例设计的控制律作用下能够按照给定编队跟踪轨迹完成编队任务,并实现防碰撞功能。值得说明的是,本发明实施例所提出的防碰撞方法不仅仅局限于多智能体编队跟踪控制,也可以广泛应用于其他场合。
为实现上述目标,本发明实施例做出如下假设:
假设1:智能体间的通讯和感知能力正常,每个智能体都可正常获取领导者和邻居的相关信息;
假设2:智能体在二维平面内运动;
假设3:所有从智能体是同构的,具有相同的感知能力和半径等;
假设3:本发明实施例中智能体间拓扑图为无向图。
基于上述任一实施例,所述编队控制器,具体包括:
其中,k>0,c>0,aij为所述多智能体动态邻接矩阵元素,epi为所述第一智能体与期望轨迹的位置误差,epj为所述第二智能体与期望轨迹的位置误差,evi为所述第一智能体与期望轨迹的速度误差,evj为所述第二智能体与期望轨迹的速度误差,为虚拟主智能体的加速度。
具体地,在上述实施例的基础上,根据反馈控制理论设计控制器如下:
式中,k>0,c>0,aij为多智能体动态邻接矩阵元素,N为从智能体的数量,epi为第一智能体与期望轨迹的位置误差,epj为第二智能体与期望轨迹的位置误差,evi为第一智能体与期望轨迹的速度误差,evj为第二智能体与期望轨迹的速度误差,为虚拟主智能体的加速度。
基于上述任一实施例,所述多智能体动态邻接矩阵元素具体包括:
当所述第一智能体与第二智能体间距位于第一预设区间内,所述多智能体动态邻接矩阵元素取值为0;
当所述第一智能体与第二智能体间距位于第二预设区间内,所述多智能体动态邻接矩阵元素取值由所述第一智能体与第二智能体间距决定;
当所述第一智能体与第二智能体间距位于第三预设区间内,所述多智能体动态邻接矩阵元素取值为1。
具体地,aij为多智能体动态邻接矩阵元素,其值随着任一智能体i和与智能体i不同智能体j之间的距离变化而变化,即随第一智能体与第二智能体间距变化而变化,定义如下:
其中,第一预设区间可设为(50,+∞),第二预设区间可设为(10,50],第三预设区间可设为(0,10],‖pij‖表示第一智能体与第二智能体间距。
基于上述任一实施例,所述基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务,具体包括:
定义所述势场函数为:
式中,ζca表示动作函数设计参数,τ表示制动能力常数,λ1和λ2分别表示公式中前后两部分权重的调节系数,表示碰撞锥角度的一半,Ψca表示危险区域角度的一半,且θ表示任一智能体的速度与智能体间距离向量的夹角;
所述防碰撞控制器具体包括:
具体地,防碰撞控制器主要任务是,在保证安全性的前提下,尽量降低防碰撞控制器的加入对编队跟踪性能的影响。当第一智能体与第二智能体间距‖pij‖≤rout满足时,定义智能体j为智能体i的防碰撞邻居,记为其中rout为防碰撞势场半径,因此势场函数设计如下:
式中,rsafe=αr表示所述智能体虚拟的最小安全半径,其中α≥1,主要用于提高系统的安全系数,取值一般较小,否则会限制编队运动形式。
当智能体i进入智能体j的势场范围后,本发明实施例同时考虑两个智能体的距离和智能体i的速度两个信息,智能体i的速度与智能体之间距离向量夹角为θ,如图3所示,分三种情况进行分析:
3、当θ>Ψca时,没有发生碰撞的危险,不会受到虚拟排斥力,即不危险场景。
由上式可知,当处于绝对危险场景和弱危险两种场景下时,动作函数均有两部分组成,第一部分是依据智能体间距离大小设计的动作函数,ζca为动作函数设计参数;第二部分作为第一部分的补偿函数,依据动量定理设计,而λ1和λ2分别为两部分权重的调节系数,τ表示制动能力常数。表示碰撞锥角度的一半,可由智能体间距离大小和智能体最小安全半径根据三角函数关系求得,同理可得Ψca大小,则针对整个多智能体系统有:
式中,kca为调节系数,可取足够大。
本发明实施例通过设计新颖的碰撞危险判断机制,当智能体在势场范围内,根据速度方向判断危险性,分段设计势场动作函数,根据碰撞危险程度自动调节势场力大小,很好地解决了传统方法中编队跟踪性能和安全性能间的折中问题,并可以实现一字并行编队运动形式,如果以现有方法实现此编队形式,必须以减小势场半径为代价来保证并行运动时不受到势场排斥力的作用,而此会大大降低系统的安全性,另外将速度引入势场动作函数,补偿了速度转化为位置的滞后,并通过速度大小调节势场排斥力,增大了系统的安全系数。
基于上述任一实施例,所述由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器,具体包括:
具体地,综合上述编队控制器和防碰撞控制器设计结果,本发明实施例的总体控制器设计如下:
基于上述任一实施例,利用MATLAB软件对本发明实施例提出的方法进行数值仿真验证,设计了两个实例分别说明本发明实施例所提方法的创新性。
1)本实例旨在验证本发明的方法在同样势场半径下,解决了原人工势场法限制编队形式多样性的问题。
设智能体半径r=1,智能体虚拟的最小安全半径rsafe=2,防碰撞人工势场半径rout=8,λ1=0.8,λ2=0.2,τ=3,ζca=8,kca=500,五个智能体的初始位置分别为:p1(0)=[2 10]T,p2(0)=[10 -3.09]T,p3(0)=[-9 -3.5]T,p4(0)=[6 20]T,p5(0)=[-9.511 15]T,初始速度分别为:v1(0)=[0.1 0.1]T,v2(0)=[0.2 0.1]T,v3(0)=[0.1 0.1]T,v4(0)=[0.3 0.2]T,v5(0)=[0.6 0.5]T。虚拟领导者运动轨迹如下:
式中,ω=0.1,t≥0为运行时间。
各从智能体与虚拟领导者的期望位置δ(t)为分段形式,描述如下:
当t≤35,
当t>35,
图4和图6分别为有无防碰撞控制器加入时多智能体编队跟踪控制效果图,从图中可以看出,多智能体从五角星编队在35s处开始变换为一字型编队,最终趋于稳定。
图5和图7分别为有无防碰撞控制器加入时多智能体间距离变化效果图,从图中可以看出,五个智能体间有10个距离组合,在无防碰撞控制器加入时,智能体间的某些距离小于2,说明发生了碰撞,当防碰撞控制器加入时,智能体间距离均大于3(智能体安全半径+智能体半径),起到防碰撞作用,并且最终以直线编队稳定运行,此时相邻智能体间距离为7,小于防碰撞势场半径8,验证了本发明可以解决原防碰撞方法在安全情形下限制编队多样性的问题。
图8和图9分别为有防碰撞控制器加入时多智能体编队跟踪控制位置和速度误差变化效果图,从图中可以看出,五个智能体在x方向和y方向的误差分别对应图中10条曲线,最终误差都趋近于零,达到了编队跟踪控制的效果。
综上所述,本发明实施例所提方法在解决编队多样性问题上是有效的。
2)本实例旨在验证本发明所提方法在保证安全性的前提下,减小了因防碰撞控制器的作用而增加的跟踪误差,提高了系统的编队跟踪精度。原防碰撞方法仅仅根据智能体间距离与势场半径的大小关系而施加相应虚拟排斥力,为了验证实验的有效性,根据原防碰撞方法判断危险原理设计动作函数φca如下:
各智能体与虚拟领导者的期望位置为:
则针对两种不同动作函数φca设计防碰撞控制器进行实验,本实例仿真时间t=35,其它参数选取均参考实例1,实验结果为:
原防碰撞方法位置误差绝对值累计值:sum|error_p|=3.8332×104
原防碰撞方法速度误差绝对值累计值:sum|error_v|=2.5764×104
本发明实施例防碰撞方法位置误差绝对值累计值:sum|error_p|=2.9325×104
本发明实施例防碰撞方法速度误差绝对值累计值:sum|error_v|=2.1674×104
可以看出本发明实施例所提方法跟踪误差较小,大大提高了编队跟踪精度,参考原防碰撞方法原理的仿真结果图不再给出,本发明所提方法仿真结果如附图10-15所示。
图10和图12分别为有无防碰撞控制器加入时多智能体编队跟踪控制效果图。从图中可以看出,均实现了三角形编队
图11和图13分别为有无防碰撞控制器加入时五个智能体间距离变化效果图。从图11中可以看出,在无防碰撞控制器加入时某些距离小于2,说明相应智能体发生了碰撞。与图11对比,图13中所有距离均大于3,起到了防碰撞的效果。
图14和图15分别为有防碰撞控制器加入时多智能位置和速度跟踪误差变化效果图。从图中可以看出,五个智能体在x方向和y方向的误差分别对应图中10条曲线,最终误差都趋近于零,达到了编队跟踪控制的效果。
图16为本发明实施例提供的一种多智能体编队防碰撞控制系统结构图,如图16所示,包括:编队设计模块1601、防碰撞设计模块1602和合成模块1603;其中:
编队设计模块1601用于基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;防碰撞设计模块1602用于基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;合成模块1603用于基于所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
本发明实施例提供的系统用于执行上述对应的方法,其具体的实施方式与方法的实施方式一致,涉及的算法流程与对应的方法算法流程相同,此处不再赘述。
本发明实施例通过将碰撞锥思想应用于多智能体编队防碰撞策略,同时利用智能体位置和速度信息,能够准确判断有无碰撞危险,并将速度引入势场函数进行主动补偿,提高了编队跟踪精度,也增加了系统的快速性和安全性。
图17示例了一种电子设备的实体结构示意图,如图17,该电子设备可以包括:处理器(processor)1710、通信接口(Communications Interface)1720、存储器(memory)1730和通信总线1740,其中,处理器1710,通信接口1720,存储器1730通过通信总线1740完成相互间的通信。处理器1710可以调用存储器1730中的逻辑指令,以执行如下方法:基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
此外,上述的存储器1730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种多智能体编队防碰撞控制方法,其特征在于,包括:
基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;
基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;
由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
3.根据权利要求1或2所述的多智能体编队防碰撞控制方法,其特征在于,所述多智能体动态邻接矩阵元素具体包括:
当所述第一智能体与第二智能体间距位于第一预设区间内,所述多智能体动态邻接矩阵元素取值为0;
当所述第一智能体与第二智能体间距位于第二预设区间内,所述多智能体动态邻接矩阵元素取值由所述第一智能体与第二智能体间距决定;
当所述第一智能体与第二智能体间距位于第三预设区间内,所述多智能体动态邻接矩阵元素取值为1。
4.根据权利要求1所述的多智能体编队防碰撞控制方法,其特征在于,所述基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务,之前包括:
定义任一智能体i的编队跟踪误差:
式中,evi(t)表示任一智能体i与期望轨迹的速度误差,epi(t)表示任一智能体i与期望轨迹的位置误差,δi(t)表示任一智能体i与虚拟主智能体的期望位置,pi(t)表示任一智能体i的位置,vi(t)表示任一智能体i的速度,pl(t)表示虚拟主智能体的位置,vl(t)表示虚拟主智能体的速度。
6.根据权利要求1所述的多智能体编队防碰撞控制方法,其特征在于,所述基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务,具体包括:
定义所述势场函数为:
式中,ζca表示动作函数设计参数,τ表示制动能力常数,λ1和λ2分别表示公式中前后两部分权重的调节系数,表示碰撞锥角度的一半,Ψca表示危险区域角度的一半,且θ表示任一智能体的速度与智能体间距离向量的夹角;
所述防碰撞控制器具体包括:
8.一种多智能体编队防碰撞控制系统,其特征在于,包括:
编队设计模块,用于基于虚拟主智能体的加速度、多智能体动态邻接矩阵元素、第一智能体与期望轨迹的速度误差、第一智能体与期望轨迹的位置误差、第二智能体与期望轨迹的速度误差和第二智能体与期望轨迹的位置误差构建编队控制器,由所述编队控制器控制若干智能体完成编队任务;
防碰撞设计模块,用于基于势场函数、第一智能体速度、第一智能体与第二智能体间距和智能体最小安全半径构建防碰撞控制器,由所述防碰撞控制器实现若干智能体的防碰撞任务;
合成模块,用于由所述编队控制器和所述防碰撞控制器构建多智能体编队总体控制器。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述多智能体编队防碰撞控制方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述多智能体编队防碰撞控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911358078.XA CN111103881B (zh) | 2019-12-25 | 2019-12-25 | 一种多智能体编队防碰撞控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911358078.XA CN111103881B (zh) | 2019-12-25 | 2019-12-25 | 一种多智能体编队防碰撞控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111103881A true CN111103881A (zh) | 2020-05-05 |
CN111103881B CN111103881B (zh) | 2023-04-07 |
Family
ID=70425127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911358078.XA Active CN111103881B (zh) | 2019-12-25 | 2019-12-25 | 一种多智能体编队防碰撞控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111103881B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897316A (zh) * | 2020-06-22 | 2020-11-06 | 北京航空航天大学 | 一种场景快变条件下的多飞行器自主决策方法 |
CN112147892A (zh) * | 2020-09-08 | 2020-12-29 | 东南大学 | 一种针对多质量块弹簧阻尼器一致性控制的算法 |
CN112379626A (zh) * | 2020-11-23 | 2021-02-19 | 哈尔滨理工大学 | 具有外部干扰的多智能体系统分组领导跟随一致的方法 |
CN112947407A (zh) * | 2021-01-14 | 2021-06-11 | 华南理工大学 | 一种多智能体有限时间的编队路径跟踪控制方法及系统 |
CN113345267A (zh) * | 2021-06-03 | 2021-09-03 | 招商局检测车辆技术研究院有限公司 | 一种基于广义v2x的路口近信号区域预警方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108983814A (zh) * | 2018-07-30 | 2018-12-11 | 西安理工大学 | 基于无线紫外光通信的单虚拟主控多智体蜂群控制方法 |
CN110488845A (zh) * | 2019-09-18 | 2019-11-22 | 中国人民解放军火箭军工程大学 | 一种障碍物遮挡下多智能体自抗扰时变编队跟踪与避撞控制方法 |
CN110568845A (zh) * | 2019-08-26 | 2019-12-13 | 广东工业大学 | 一种协同机器人的相互碰撞规避方法 |
-
2019
- 2019-12-25 CN CN201911358078.XA patent/CN111103881B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108983814A (zh) * | 2018-07-30 | 2018-12-11 | 西安理工大学 | 基于无线紫外光通信的单虚拟主控多智体蜂群控制方法 |
CN110568845A (zh) * | 2019-08-26 | 2019-12-13 | 广东工业大学 | 一种协同机器人的相互碰撞规避方法 |
CN110488845A (zh) * | 2019-09-18 | 2019-11-22 | 中国人民解放军火箭军工程大学 | 一种障碍物遮挡下多智能体自抗扰时变编队跟踪与避撞控制方法 |
Non-Patent Citations (2)
Title |
---|
GAO LEI等: "Formation and obstacle avoidance for multi-agent networks" * |
MONDAL A等: "Trajectory Tracking by Multiple Agents in Formation with Collision Avoidance and Connectivity Assurance" * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111897316A (zh) * | 2020-06-22 | 2020-11-06 | 北京航空航天大学 | 一种场景快变条件下的多飞行器自主决策方法 |
CN111897316B (zh) * | 2020-06-22 | 2021-05-14 | 北京航空航天大学 | 一种场景快变条件下的多飞行器自主决策方法 |
CN112147892A (zh) * | 2020-09-08 | 2020-12-29 | 东南大学 | 一种针对多质量块弹簧阻尼器一致性控制的算法 |
CN112147892B (zh) * | 2020-09-08 | 2022-06-10 | 东南大学 | 一种针对多质量块弹簧阻尼器一致性控制的算法 |
CN112379626A (zh) * | 2020-11-23 | 2021-02-19 | 哈尔滨理工大学 | 具有外部干扰的多智能体系统分组领导跟随一致的方法 |
CN112947407A (zh) * | 2021-01-14 | 2021-06-11 | 华南理工大学 | 一种多智能体有限时间的编队路径跟踪控制方法及系统 |
CN113345267A (zh) * | 2021-06-03 | 2021-09-03 | 招商局检测车辆技术研究院有限公司 | 一种基于广义v2x的路口近信号区域预警方法和系统 |
CN113345267B (zh) * | 2021-06-03 | 2022-11-29 | 招商局检测车辆技术研究院有限公司 | 一种基于广义v2x的路口近信号区域预警方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111103881B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111103881B (zh) | 一种多智能体编队防碰撞控制方法及系统 | |
CN107491086B (zh) | 时变网络拓扑下的无人机编队避障方法及系统 | |
CN110673649B (zh) | 基于拓扑优化的时变信道下无人机编队一致性控制方法、系统、装置及存储介质 | |
CN111897358B (zh) | 一种基于自适应滑模的无人机编队容错控制方法 | |
CN115993781B (zh) | 抗网络攻击无人集群系统协同控制方法、终端及存储介质 | |
CN114779828B (zh) | 基于异构队形基准点无人机集群拓扑控制与智能防撞方法 | |
CN113296507A (zh) | 一种基于时空解耦的多动力定位船舶协同编队控制方法 | |
Ali et al. | Combined ANFIS method with FA, PSO, and ICA as Steering control optimization on electric car | |
CN115291622A (zh) | 一种避障无人机分布式编队分数阶滑模控制方法 | |
CN110865655B (zh) | 无人机系统中无人机的编队和避障控制方法 | |
CN116225065A (zh) | 多智能体强化学习的多自由度模型的无人机协同追捕方法 | |
CN110275549B (zh) | 一种多智能体自主式跟踪方法、装置及计算机可存储介质 | |
CN117270572A (zh) | 基于分层牵制控制理论的无人机集群蜂拥控制方法 | |
Wei | A new formation control strategy based on the virtual-leader-follower and artificial potential field | |
Lin et al. | Discretionary Lane-Change Decision and Control via Parameterized Soft Actor–Critic for Hybrid Action Space | |
CN111007848B (zh) | 一种基于有界空间的多智能体协同作业控制方法 | |
CN117250980A (zh) | 一种基于切换事件触发技术的多无人机编队控制方法 | |
CN110162084B (zh) | 基于一致性理论的飞航导弹集群系统编队控制方法 | |
CN114115341B (zh) | 一种智能体集群协同运动方法及系统 | |
Wang et al. | Finite-time leader-following consensus for multiple non-holonomic agents | |
CN115639839B (zh) | 一种无人机集群的自组织任务编队构型方法及装置 | |
CN111240365A (zh) | 带有指定性能的无人机编队自适应执行器故障补偿方法 | |
CN118502465B (zh) | 异构无人集群的牵制控制方法和相关产品 | |
CN115378648B (zh) | 多智能体系统的防网络攻击包含控制方法、装置及终端 | |
CN117193335B (zh) | 一种多智能体系统规避动态障碍物方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |