CN110561417B - 一种多智能体无碰撞轨迹规划方法 - Google Patents

一种多智能体无碰撞轨迹规划方法 Download PDF

Info

Publication number
CN110561417B
CN110561417B CN201910718263.9A CN201910718263A CN110561417B CN 110561417 B CN110561417 B CN 110561417B CN 201910718263 A CN201910718263 A CN 201910718263A CN 110561417 B CN110561417 B CN 110561417B
Authority
CN
China
Prior art keywords
collision
agent
intelligent
obstacle
objective function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910718263.9A
Other languages
English (en)
Other versions
CN110561417A (zh
Inventor
王燕舞
赵明杰
肖江文
杨武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201910718263.9A priority Critical patent/CN110561417B/zh
Publication of CN110561417A publication Critical patent/CN110561417A/zh
Application granted granted Critical
Publication of CN110561417B publication Critical patent/CN110561417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • B25J9/1666Avoiding collision or forbidden zones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem

Abstract

本发明涉及一种多智能体无碰撞轨迹规划方法,包括:分别为每个智能体和障碍物建立在智能体运动平面上的投影模型,模型为一个安全半径下的圆面,安全半径使智能体或障碍物在该面上的投影位于圆内;基于外部罚函数法,将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数,无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交;以最小化目标函数为目标,采用最优控制理论和梯度下降法得到每个智能体的无碰撞轨迹。本发明依据圆面的建模方式及基于外部罚函数法的目标函数制定,既减少了模型对各种形状的智能体和障碍物的依赖,又驱使最终优化轨迹远离碰撞现象的发生,最终获得无碰撞的最优监控轨迹。

Description

一种多智能体无碰撞轨迹规划方法
技术领域
本发明属于多智能体持续监控领域,更具体地,涉及一种多智能体无碰撞轨迹规划方法。
背景技术
近年来,由于机器人技术和传感器网络技术的快速发展,多智能体协同网络受到了广泛的关注,由于其具有自主性高、协作能力强等优良特点,研究人员将其应用在许多复杂且难度比较大的任务中,比如环境采样、目标跟踪、资源搜集以及持续监控。持续监控是通过控制多个携带具备感知功能和通信功能的传感器的智能体的移动,对任务区域中感兴趣的目标的状态进行持续性地监控,以完成多种多样的任务。有别于传统的覆盖式监控中大量的静态传感器分布在环境中,持续监控中携带传感器的智能体是通过不断的移动来执行监控任务的。因此,综合考虑智能体的体积以及环境中可能存在有障碍物等现实因素,避免智能体在执行监控任务过程与其他智能体或者障碍物发生碰撞就变得尤为重要,进一步,为智能体设计无碰撞的优化监控轨迹是十分现实且必要的。
目前为止,持续监控的研究中鲜有考虑监控环境中存在障碍物的,考虑障碍物通常会对智能体的移动造成约束,从而加大解决问题的难度。而关于解决智能体之间可能发生碰撞的问题,已经有少量学者对其进行了研究。在一维监控研究中,有学者通过不断调整已经为智能体设计好的轨迹来避免可能发生的碰撞,然而,这种做法对计算量要求比较高,而且最终得到的监控策略也不是最优的;在二维监控研究中,有学者是在已经给定的轨迹中研究避免碰撞,通过预先判断碰撞区域并强制使智能体停留最终实现了无碰撞监控。因此,研究二维持续监控中可能出现的碰撞(智能体与智能体和智能体与障碍物),并且为智能体设计最优的无碰撞监控轨迹是当前阶段一个开放而且具有难度的挑战。
以现有的持续监控领域中的研究成果和研究手段作为基础,为解决智能体与智能体和智能体与障碍物的碰撞提出合适的策略依然面临一些问题。首先是模型问题,该问题主要包括两个方面,第一是智能体的模型,在实际情况中,智能体往往具有一定的尺寸,而在现有研究中除了将智能体当作质点不考虑碰撞之外,就是考虑为其设置一个安全半径;第二是障碍物的模型,在实际情况下,障碍物往往也具有各种各样的形状,然而现有持续监控研究中并没有考虑障碍物,也就没有相应的模型。因此需要为智能体和障碍物的体积进行合适地建模。其次是避碰策略问题,现有的持续监控研究中少有研究这些碰撞问题的,因此关于实现无碰撞的策略比较匮乏,因此,探索一种计算效率高的、能够保证无碰撞的策略是十分必要的。
发明内容
本发明提供一种多智能体无碰撞轨迹规划方法,用以解决现有用于多智能体持续监控的智能体轨迹规划方法中由于智能体建模方式而忽视掉的但实际仍可能存在的智能体与智能体和智能体与障碍物碰撞的技术问题。
本发明解决上述技术问题的技术方案如下:一种多智能体无碰撞轨迹规划方法,用于二维平面持续监控,包括:
步骤1、分别为每个智能体和每个障碍物建立在智能体运动平面上的投影模型,所述模型为一个安全半径下的圆面,所述安全半径使得智能体或障碍物在该面上的投影位于圆内;
步骤2、基于外部罚函数法,将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数,所述无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交;
步骤3、以最小化所述目标函数为目标,采用最优控制理论和梯度下降法,得到每个智能体的无碰撞轨迹。
本发明的有益效果是:本发明用于对智能体进行二维平面持续监控,首先对执行任务的智能体和环境中的障碍物进行合适地建模,对于每个智能体,定义一个安全半径,要求该智能体能够完全位于该圆面内,如此便可以用圆面来代替智能体的安全位置,圆面之外对于其他智能体来说是安全的,反之,圆面之内可以默认为可能与该智能体发生碰撞的部位,障碍物的建模同理。其次,考虑监控过程的两个硬性约束(两个智能体的之间不能发生碰撞、智能体与障碍物之间不能发生碰撞),根据外部罚函数法的思路,将约束纳入目标函数中,作为惩罚项是行之有效的方法,基于新的目标函数,采用最优控制理论,分析得到智能体运动的必要条件,通过为每个智能体分配椭圆运动轨迹,将求解最优的智能体运动参数的问题转变为求解最优轨迹参数的问题,并最终能够为智能体执行监控任务设计无碰撞的运动轨迹。本发明引入安全半径下的圆面,一方面避免把智能体看作一个质点来规划轨迹因其忽视智能体与智能体碰撞而可能导致碰撞的问题,另一方面,本发明考虑障碍物与智能体的碰撞,且对障碍物形状的依赖性较小,对计算复杂度的要求不高。优化后,根据这个优化结果进行智能体控制,无需实时监控智能体并更改智能体轨迹,方便快捷且可靠性高。充分解决了智能体与智能体和智能体与障碍物的碰撞问题。
上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述目标函数为:所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分;
所述碰撞惩罚项包括:智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积,智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积。
本发明的进一步有益效果是:本发明碰撞惩罚项,考虑智能体与智能体之间可能碰撞带来的代价,并为其设置一个较大的系数,用以体现对该种代价的放大,如果优化过程中某些轨迹出现了智能体与智能体的碰撞,则该部分会变成很大的代价,作为惩罚会驱使后续的优化远离这种违背约束的现象;另外,智能体与障碍物可能碰撞带来的代价,同样地,为其设置一个较大的系数,用以体现对该种代价的放大,如果优化过程中某些轨迹出现了智能体与障碍物的碰撞,则该部分会变成很大的代价,作为惩罚会驱使后续的优化远离这种违背约束的现象。该方法可以有效避开碰撞,最终实现一个无碰撞的轨迹优化结果。
进一步,所述第一放大系数的取值使得所述第一乘积是所述加权和的数倍,所述第二放大系数的取值使得所述第二乘积是所述加权和的数倍。
本发明的进一步有益效果是:本发明的放大系数尽可能的大,使得碰撞的惩罚力度能够最终更好的规划出各智能体无碰撞的轨迹。
进一步,所述步骤3中,所述以最小化所述目标函数为目标,具体为:
优化每个时刻各智能体的加速度和运动方向,使得所述目标函数的取值最小。
进一步,所述步骤3包括:
以最小化所述目标函数为目标,采用最优控制理论,基于每个智能体以其最大加速度运动并达到预设速度阈值后保持该速度阈值运动,为每个智能体分配椭圆运动轨迹,将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题,采用梯度下降法得到最优椭圆参数,得到每个智能体的无碰撞椭圆轨迹
本发明的进一步有益效果是:轨迹本身是一个简单的参数化轨迹,因此问题就由求解最优的un(t)和θn(t)的问题转变为求解最优的轨迹参数的问题,通过目标函数对轨迹参数求导,再利用基于无穷小扰动分析的梯度下降法便可以找到最优的椭圆参数,从而可以得到最优的无碰撞的椭圆轨迹。
进一步,用于所述不确定度计算的任一时刻第n个智能体对第i个目标的感应概率:当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时,分别与所述距离以及所述速度成反比,否则,为零。
本发明的进一步有益效果是:任一时刻第n个智能体对第i个目标的感应概率表示智能体n对目标i的有效感应,只有当目标i与智能体n的距离不超过固定的有效的感应半径,以及智能体n的速度不超过给定的速度阈值时,才有感应概率,而且距离越远,速度越快,感应概率越小,与现有只考虑距离的公式不一样的是,此公式既考虑了距离也考虑了速度对感应概率的影响,提高了对目标持续监控的有效性。
进一步,所述任一时刻第n个智能体对第i个目标的感应概率,表示为:
Figure BDA0002156219610000051
其中,rn为所述预设感应半径;D(zi,sn)=||zi-sn||,表示该时刻第n个智能体和第i个目标之间的欧氏距离,zi为该时刻第i个目标的位置坐标,sn、vn分别为该时刻第n个智能体的位置坐标和速度;βn为所述预设速度,且大于智能体n的最大额定速度。
进一步,t时刻所述第一碰撞代价为:t时刻两两智能体的碰撞因子之间的加和,其中,每两个智能体的碰撞因子为:当该两个智能体的距离大于该两个智能体对应的所述安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
进一步,t时刻所述第二碰撞代价为:t时刻各智能体和各障碍物的碰撞因子之间的加和,其中,任一智能体和任一障碍物的碰撞因子为:当该智能体和该障碍物的距离大于它们对应的所述安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
本发明的进一步有益效果是:本发明属于持续监控问题,希望在监控时域[0,T]内所有目标的不确定度加权和累计最小,同时又不希望智能体在移动的过程中发生碰撞。如此设置目标函数,一旦在智能体移动过程中出现任何一种碰撞,第一碰撞代价对应的第一乘积和第二碰撞代价对应的第二乘积的值就会是很大的正数,对于该最小化问题,这是不可行,因此,目标函数的在求解un(t)和θn(t)的过程中,问题的解会尽量避开任何一种碰撞,这样M2J2(t)和M3J3(t)的值就会是0,上述设置能够驱动问题最终找到不存在任何一种碰撞的解。
本发明还提供一种存储介质,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一种多智能体无碰撞轨迹规划方法。
附图说明
图1为本发明实施例提供的一种多智能体无碰撞轨迹规划方法的流程框图;
图2为本发明实施例提供的多智能体无碰撞轨迹规划的场景示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
一种多智能体无碰撞轨迹规划方法100,如图1所示,包括:
步骤110、分别为每个智能体和每个障碍物建立在智能体运动平面上的投影模型,该模型为一个安全半径下的圆面,安全半径使得智能体或障碍物在该面上的投影位于圆内;
步骤120、基于外部罚函数法,将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数,无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交;
步骤130、以最小化目标函数为目标,采用最优控制理论和梯度下降法,得到每个智能体的无碰撞轨迹。
需要说明的是,智能体运动平面相当于为监控场景的俯视面。另外,步骤130具体可为:采用最优控制理论,分析得到每个智能体以其最大加速度运动,直到达到预设速度阈值后保持该速度阈值运动。之后在现有研究的基础上,为每个智能体分配椭圆运动轨迹,将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题,采用梯度下降法得到最优椭圆参数,从而得到每个智能体的无碰撞椭圆轨迹。
首先对执行任务的智能体和环境中的障碍物进行合适地建模,如图2所示,对于每个智能体,定义一个安全半径,要求该智能体能够完全位于该圆面内,如此便可以用圆面来代替智能体的安全位置,圆面之外对于其他智能体来说是安全的,反之,圆面之内可以默认为可能与该智能体发生碰撞的部位;对于障碍物,类似于上述处理,用一个圆面来代替障碍物,要求该圆面是能够完全覆盖障碍物的最小圆面,如此便可以用圆面来代替智障碍物的位置,同时这种操作不受限于障碍物多种多样的形状,同样地,圆面之外对于智能体来说是安全的,反之,圆面之内可以默认为与障碍物发生碰撞的部位。
其次是监控过程的两个硬性约束,第一,两个智能体的之间不能发生碰撞,按照上述为智能体设置好的圆面,若要满足这个约束,必须保证智能体在运动过程中任意两个代表智能体的圆面不能相交;第二,智能体与障碍物之间不能发生碰撞,同样地,若要满足这个约束,必须保证智能体在运动过程中任意两个分别代表智能体和障碍物的圆面不能相交。根据外部罚函数法的思路,处理这两个硬性约束,将约束纳入目标函数中,作为惩罚项是行之有效的方法。
本实施例用于二维平面的持续监控,首先对执行任务的智能体和环境中的障碍物进行合适地建模,对于每个智能体,定义一个安全半径,要求该智能体能够完全位于该圆面内,如此便可以用圆面来代替智能体的安全位置,圆面之外对于其他智能体来说是安全的,反之,圆面之内可以默认为可能与该智能体发生碰撞的部位,障碍物的建模同理。其次,考虑监控过程的两个硬性约束(两个智能体的之间不能发生碰撞、智能体与障碍物之间不能发生碰撞),根据外部罚函数法的思路,将约束纳入目标函数中,作为惩罚项是行之有效的方法,基于新的目标函数,采用最优控制理论,分析得到智能体运动的必要条件,通过为每个智能体分配椭圆运动轨迹,将求解最优的智能体运动参数的问题转变为求解最优轨迹参数的问题,并最终能够为智能体执行监控任务设计无碰撞的运动轨迹。本例引入安全半径下的圆面,一方面避免把智能体看作一个质点来规划轨迹导致的轨迹规划计算复杂度高的问题,另一方面,本例考虑障碍物与智能体的碰撞,且对障碍物形状的依赖性较小,对计算复杂度的要求不高。优化后,根据这个优化结果进行智能体控制,无需实时监控智能体并更改智能体轨迹,方便快捷且可靠性高。充分解决了智能体与智能体和智能体与障碍物的碰撞问题。
依据圆面的建模方式以及基于外部罚函数法的目标函数制定,既能够减少模型对各种形状的智能体和障碍物的依赖,简化了优化过程,又能够驱使最终优化轨迹远离碰撞现象的发生,并且最终获得一个无碰撞的最优监控轨迹。
优选的,目标函数为:所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分;碰撞惩罚项包括:智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积,智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积。
需要说明的是,上述不确定度为目标上的一个参数量,比如资源的累积量或信息的累积量。
目标函数主要包含三个部分,第一部分,待监测目标性能指标的加权和,这是最初的也是最根本的目标,另外,本例碰撞惩罚项,考虑智能体与智能体之间可能碰撞带来的代价,并为其设置一个较大的系数,用以体现对该种代价的放大,如果优化过程中某些轨迹出现了智能体与智能体的碰撞,则该部分会变成很大的代价,作为惩罚会驱使后续的优化远离这种违背约束的现象;另外,智能体与障碍物可能碰撞带来的代价,同样地,为其设置一个较大的系数,用以体现对该种代价的放大,如果优化过程中某些轨迹出现了智能体与障碍物的碰撞,则该部分会变成很大的代价,作为惩罚会驱使后续的优化远离这种违背约束的现象。该方法可以有效避开碰撞,最终实现一个无碰撞的轨迹优化结果。
优选的,第一放大系数的取值使得第一乘积是上述加权和的数倍,第二放大系数的取值使得第二乘积是上述加权和的数倍。
放大系数尽可能的大,使得碰撞的惩罚力度能够最终更好的规划出各智能体无碰撞的轨迹。
优选的,步骤130中,以最小化所述目标函数为目标,具体为:优化每个时刻各智能体的加速度和运动方向,使得目标函数的取值最小。
优选的,用于不确定度计算的任一时刻第n个智能体对第i个目标的感应概率:当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时,分别与所述距离以及所述速度成反比,否则,为零。
任一时刻第n个智能体对第i个目标的感应概率表示智能体n对目标i的有效感应,只有当目标i与智能体n的距离不超过固定的有效的感应半径,以及智能体n的速度不超过给定的速度阈值时,才有感应概率,而且距离越远,速度越快,感应概率越小,与现有只考虑距离的公式不一样的是,此公式既考虑了距离也考虑了速度对感应概率的影响,提高了持续监控的有效性。
优选的,任一时刻第n个智能体对第i个目标的感应概率,表示为:
Figure BDA0002156219610000101
其中,rn为预设感应半径;D(zi,sn)=||zi-sn||,表示该时刻第n个智能体和第i个目标之间的欧氏距离,zi为该时刻第i个目标的位置坐标,sn、vn分别为该时刻第n个智能体的位置坐标和速度;βn为预设速度,且大于智能体n的最大额定速度。
例如,通过控制多个智能体的移动,安全地(无碰撞)持续性地对二维环境中感兴趣的目标的状态进行监控。假设有一个[0,L1]×[0,L2]的二维环境,其中,存在
Figure BDA0002156219610000102
的待监控目标点,现该监控任务需要n=1,2,...,N个智能体在[0,T]完成。
智能体n的动力学方程为
Figure BDA0002156219610000103
其中,02,2是二阶零矩阵,I2是二阶单位矩阵,xn(t)=[sn(t),vn(t)]′,且
Figure BDA0002156219610000104
Figure BDA0002156219610000105
分别表示智能体n在t时刻的位置和速度,Un(t)是控制输入,且Un(t)=[un(t)cosθn(t),un(t)sinθn(t)]′,un(t)表示加速度的大小,θn(t)表示智能体的方向。关于vn(t)、un(t)和θn(t)的约束分别为
Figure BDA0002156219610000106
和0≤θn(t)<2π,n=1,2,...,N,其中
Figure BDA0002156219610000107
Figure BDA0002156219610000108
为给定常数。
进一步,由于执行监控任务的是N个智能体,也就是说N个智能体可能会同时感应到同一个目标i,把N个智能体对同一目标i的联合感应概率用
Figure BDA0002156219610000111
表示,其中,x(t)=[s(t),v(t)]′,s(t)=[s1(t),…,sN(t)],v(t)=[v1(t),…,vN(t)],该公式表示对于N个智能体来说,感应到目标i的智能体越多,Pi(x(t))越大,但最大不会超过1。对于每一个目标i,为其定义一个函数Ri,用来表示目标上的不确定度,其动力学为:
Figure BDA0002156219610000112
其中,Ai和B均为给定常数,Ai表示目标i的不确定度Ri的最大增长率,B表示智能体对不确定度Ri的最大下降能力(对于每个智能体,B值相同),BPi(x(t))表示让不确定度Ri以BPi(x(t))的速率产生下降,该公式表示目标i上的不确定度Ri的变化,当Pi(x(t))=0时,也就是所有的智能体都感应不到目标i时,不确定度Ri以速率Ai增长,当Pi(x(t))≠0时,也就是有智能体感应到目标i时,不确定度Ri以速率RiAi-BPi(x(t))进行变化,并当Ri(t)=0,Ai≤BPi(x(t))时,
Figure BDA0002156219610000113
也就是说不确定度Ri不会为负数。
优选的,t时刻第一碰撞代价为:t时刻两两智能体的碰撞因子之间的加和,其中,每两个智能体的碰撞因子为:当该两个智能体的距离大于该两个智能体对应的安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
优选的,t时刻第二碰撞代价为:t时刻各智能体和各障碍物的碰撞因子之间的加和,其中,任一智能体和任一障碍物的碰撞因子为:当该智能体和该障碍物的距离大于它们对应的安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
例如,目标函数包含三个部分。第一部分是包含所有目标在内的性能度量,即
Figure BDA0002156219610000114
其中σi是给定常数,表示目标的权重,J1(t)表示t时刻所有目标上的不确定度的加权和;第二部分是智能体之间发生碰撞的代价,对于每个智能体n,定义一个安全半径ρn,则相应的安全圆面为Qn={x|||x-sn(t)||≤ρn},因此,对于任意两个智能体p和q,若
Figure BDA0002156219610000121
则说明智能体p和q之间发生了碰撞,因此,若为了避免发生碰撞,应该确保dpq(t)=||sp(t)-sq(t)||≥ρpq,定义
Figure BDA0002156219610000122
则若没有碰撞发生,则
Figure BDA0002156219610000123
若有碰撞发生,则
Figure BDA0002156219610000124
会产生一定的代价。对于所有智能体之间可能发生的碰撞,定义
Figure BDA0002156219610000125
第三部分是智能体与障碍物之间发生碰撞的代价,对于每个障碍物,定义能够完全覆盖其的最小圆面的圆心为
Figure BDA0002156219610000126
半径为rl,l=1,2,...,L,若为了避免智能体n与与障碍物l之间发生碰撞,则应该确保dln(t)=||wl-sn(t)||≥rln,定义
Figure BDA0002156219610000127
可以看出若没有碰撞发生,则
Figure BDA0002156219610000128
若有碰撞发生,则
Figure BDA0002156219610000129
会产生一定的代价。对于所有智能体和所有障碍物之间可能发生的碰撞,定义
Figure BDA00021562196100001210
根据上述三个部分,最终的目标函数定义为
Figure BDA00021562196100001211
其中M2和M3是给定的数值很大的负数,一般来说,保证M2J2(t)和M3J3(t)的值是J1(t)的值的几倍。
利用最优控制理论,将J1(t)+M2J2(t)+M3J3(t)、
Figure BDA00021562196100001212
Figure BDA00021562196100001213
写为哈密顿方程,利用极值原理可以分析得到,要想使目标函数最小,每个智能体都需要以最大加速度
Figure BDA00021562196100001214
运动,并且当智能体加速后速度达到
Figure BDA0002156219610000131
时,智能体会一直保持
Figure BDA0002156219610000132
运动。此外,由于该两点边值问题受限于目标数量和智能体数量,而且障碍物的存在之会加剧求解的复杂性,因此在已有结论的基础上,将求解最优的un(t)和θn(t)的问题转化为寻找最优参数的问题,也就是说,分配给每个智能体一个椭圆运动的轨迹,让每个智能体沿着各自的椭圆轨迹以最大加速度
Figure BDA0002156219610000133
运动,并且当智能体加速后速度达到
Figure BDA0002156219610000134
时,智能体会一直保持
Figure BDA0002156219610000135
运动。椭圆轨迹本身是一个简单的参数化轨迹,因此问题就由求解最优的un(t)和θn(t)的问题转变为求解最优的椭圆参数的问题,通过目标函数对椭圆参数求导,再利用基于无穷小扰动分析的梯度下降法便可以找到最优的椭圆参数,从而可以画出最优的无碰撞的椭圆轨迹。
本例属于持续监控问题,希望在监控时域[0,T]内所有目标的不确定度加权和累计最小,同时又不希望智能体在移动的过程中发生碰撞。如此设置目标函数,一旦在智能体移动过程中出现任何一种碰撞,第一碰撞代价对应的第一乘积和第二碰撞代价对应的第二乘积的值就会是很大的正数,对于该最小化问题,这是不可行,因此,目标函数的在求解un(t)和θn(t)的过程中,问题的解会尽量避开任何一种碰撞,这样M2J2(t)和M3J3(t)的值就会是0,上述设置能够驱动问题最终找到不存在任何一种碰撞的解。
本例通过以圆面代替智能体和障碍物的建模方式,减少了模型对各种形状的智能体和障碍物的依赖,并简化了后续的优化过程;相比于实时应对碰撞可能发生的现象,基于外部罚函数法思想的约束处理方式更为简单也更为高效;此外,在基于外部罚函数法的基础上设计的包含违反约束的惩罚在内的目标函数,能够驱使优化轨迹远离违背硬性约束的现象发生,并且最终获得一个无碰撞的最优监控轨迹。
实施例二
一种存储介质,存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行如上述任一种多智能体无碰撞轨迹规划方法。
相关技术方案同实施例一,在此不再赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多智能体无碰撞轨迹规划方法,用于二维平面持续监控,其特征在于,包括:
步骤1、分别为每个智能体和每个障碍物建立在智能体运动平面上的投影模型,所述模型为一个安全半径下的圆面,所述安全半径使得智能体或障碍物在该面上的投影位于圆内;
步骤2、基于外部罚函数法,将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数,所述无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交;
步骤3、以最小化所述目标函数为目标,采用最优控制理论和梯度下降法,得到每个智能体的无碰撞轨迹。
2.根据权利要求1所述的一种多智能体无碰撞轨迹规划方法,其特征在于,所述目标函数为:所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分;
所述碰撞惩罚项包括:智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积,智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积;
其中,每一个待测目标的不确定度用Ri表示,其动力学为:
Figure FDA0002660350200000011
根据Ri导数
Figure FDA0002660350200000012
在时间上的积分即可得到Ri,式中,Ai和B均为给定常数,Ai表示待测目标i的不确定度Ri的最大增长率,B表示智能体对不确定度Ri的最大下降能力,每个智能体对应的B值相同,Pi(x(t))表示N个智能体对同一待测目标i的联合感应概率,x(t)=[s(t),v(t)]′,s(t)=[s1(t),…,sN(t)],v(t)=[v1(t),…,vN(t)],s(t)和v(t)分别表示智能体n在t时刻的位置和速度。
3.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法,其特征在于,所述第一放大系数的取值使得所述第一乘积是所述加权和的数倍,所述第二放大系数的取值使得所述第二乘积是所述加权和的数倍。
4.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法,其特征在于,所述步骤3中,所述以最小化所述目标函数为目标,具体为:
优化每个时刻各智能体的加速度和运动方向,使得所述目标函数的取值最小。
5.根据权利要求4所述的一种多智能体无碰撞轨迹规划方法,其特征在于,所述步骤3包括:
以最小化所述目标函数为目标,采用最优控制理论,基于每个智能体以其最大加速度运动并达到预设速度阈值后保持该速度阈值运动,为每个智能体分配椭圆运动轨迹,将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题,采用梯度下降法得到最优椭圆参数,得到每个智能体的无碰撞椭圆轨迹。
6.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法,其特征在于,用于所述不确定度计算的任一时刻第n个智能体对第i个目标的感应概率:当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时,分别与所述距离以及所述速度成反比,否则,为零。
7.根据权利要求6所述的一种多智能体无碰撞轨迹规划方法,其特征在于,所述任一时刻第n个智能体对第i个目标的感应概率,表示为:
Figure FDA0002660350200000021
其中,rn为所述预设感应半径;D(zi,sn)=||zi-sn||,表示该时刻第n个智能体和第i个目标之间的欧氏距离,zi为该时刻第i个目标的位置坐标,sn、vn分别为该时刻第n个智能体的位置坐标和速度;βn为所述预设速度,且大于智能体n的最大额定速度。
8.根据权利要求2至7任一项所述的一种多智能体无碰撞轨迹规划方法,其特征在于,t时刻所述第一碰撞代价为:t时刻两两智能体的碰撞因子之间的加和,其中,每两个智能体的碰撞因子为:当该两个智能体的距离大于该两个智能体对应的所述安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
9.根据权利要求2至7任一项所述的一种多智能体无碰撞轨迹规划方法,其特征在于,t时刻所述第二碰撞代价为:t时刻各智能体和各障碍物的碰撞因子之间的加和,其中,任一智能体和任一障碍物的碰撞因子为:当该智能体和该障碍物的距离大于它们对应的所述安全半径的加和时,取值为零,否则,取值为该距离与该加和的差值。
10.一种存储介质,其特征在于,所述存储介质中存储有指令,当计算机读取所述指令时,使所述计算机执行上述如权利要求1至9任一项所述的一种多智能体无碰撞轨迹规划方法。
CN201910718263.9A 2019-08-05 2019-08-05 一种多智能体无碰撞轨迹规划方法 Active CN110561417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910718263.9A CN110561417B (zh) 2019-08-05 2019-08-05 一种多智能体无碰撞轨迹规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910718263.9A CN110561417B (zh) 2019-08-05 2019-08-05 一种多智能体无碰撞轨迹规划方法

Publications (2)

Publication Number Publication Date
CN110561417A CN110561417A (zh) 2019-12-13
CN110561417B true CN110561417B (zh) 2021-03-26

Family

ID=68774583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910718263.9A Active CN110561417B (zh) 2019-08-05 2019-08-05 一种多智能体无碰撞轨迹规划方法

Country Status (1)

Country Link
CN (1) CN110561417B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110561417B (zh) * 2019-08-05 2021-03-26 华中科技大学 一种多智能体无碰撞轨迹规划方法
CN112882491B (zh) * 2021-01-14 2022-05-17 北京航空航天大学 一种可自主穿越二维直线管道的多智能体分布式控制方法
CN113741454B (zh) * 2021-08-31 2023-06-23 浙江大学 一种基于搜索的多智能体路径规划方法及系统
CN113884026B (zh) * 2021-09-30 2022-12-30 天津大学 一种动态环境下无人碾压模型预测轮廓控制方法
CN114537435A (zh) * 2022-03-03 2022-05-27 湖州快飞智能科技有限公司 一种自动驾驶中的实时整车轨迹规划方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004016A (en) * 1996-08-06 1999-12-21 Trw Inc. Motion planning and control for systems with multiple mobile objects
EP3225366A2 (de) * 2016-03-29 2017-10-04 Bernecker+Rainer Industrie-Elektronik Gesellschaft MbH Positionsüberwachung einer kinematik
CN108225351A (zh) * 2016-12-14 2018-06-29 高德信息技术有限公司 导航路径规划方法及装置
CN110561417A (zh) * 2019-08-05 2019-12-13 华中科技大学 一种多智能体无碰撞轨迹规划方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004067232A2 (en) * 2003-01-31 2004-08-12 Thermo Crs Ltd. Syntactic inferential motion planning method for robotic systems
CN107728608A (zh) * 2016-08-10 2018-02-23 向忠宏 一种移动机器人路径规划方法
CN108268031A (zh) * 2016-12-30 2018-07-10 深圳光启合众科技有限公司 路径规划方法、装置及机器人

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6004016A (en) * 1996-08-06 1999-12-21 Trw Inc. Motion planning and control for systems with multiple mobile objects
EP3225366A2 (de) * 2016-03-29 2017-10-04 Bernecker+Rainer Industrie-Elektronik Gesellschaft MbH Positionsüberwachung einer kinematik
CN108225351A (zh) * 2016-12-14 2018-06-29 高德信息技术有限公司 导航路径规划方法及装置
CN110561417A (zh) * 2019-08-05 2019-12-13 华中科技大学 一种多智能体无碰撞轨迹规划方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Optimal Algorithm for Shape from Shading and Path Planning;RON KIMMEL,JAMES A. SETHIAN;《Journal of Mathematical Imaging and Vision》;20010515(第14期);237-244 *

Also Published As

Publication number Publication date
CN110561417A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110561417B (zh) 一种多智能体无碰撞轨迹规划方法
Baras et al. Decentralized control of autonomous vehicles
WO2018170444A1 (en) Method and apparatus for constructing informative outcomes to guide multi-policy decision making
CN110554607B (zh) 多欧拉-拉格朗日系统带有避障护航任务的协同控制方法及系统
Botteghi et al. On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach
Wang et al. Distributed collision avoidance of multiple robots with probabilistic buffered voronoi cells
CN110262523B (zh) 一种分布式群体机器人的自主避障蜂拥控制方法
Zhao et al. A path planning method based on multi-objective cauchy mutation cat swarm optimization algorithm for navigation system of intelligent patrol car
CN113253738B (zh) 多机器人协作围捕方法、装置、电子设备及存储介质
Kumar et al. Stable switched controllers for a swarm of UGVs for hierarchal landmark navigation
Dönmez et al. Design of mobile robot control infrastructure based on decision trees and adaptive potential area methods
Huang et al. Path planning of mobile robot in unknown dynamic continuous environment using reward‐modified deep Q‐network
Zhu et al. Motion planning of autonomous mobile robot using recurrent fuzzy neural network trained by extended Kalman filter
Garg et al. AERPSO—An adaptive exploration robotic PSO based cooperative algorithm for multiple target searching
Chen et al. Real-time path planning for a robot to track a fast moving target based on improved Glasius bio-inspired neural networks
Shi et al. A bayesian deep neural network for safe visual servoing in human–robot interaction
Prasetyo et al. Spatial Based Deep Learning Autonomous Wheel Robot Using CNN
Zhai et al. Formation control of multiple robot fishes based on artificial potential field and leader-follower framework
CN111007848B (zh) 一种基于有界空间的多智能体协同作业控制方法
Kondratenko et al. Safe Navigation of an Autonomous Robot in Dynamic and Unknown Environments
CN114706384A (zh) 一种连通性保持的多机导航方法、系统及介质
CN114386556A (zh) 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法
Guo et al. Research on path planning of mobile robot with a novel improved artificial potential field algorithm
Németh et al. Hierarchical control design of automated vehicles for multi-vehicle scenarios in roundabouts
Pushp et al. Cognitive decision making for navigation assistance based on intent recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant