CN110561417B

CN110561417B - 一种多智能体无碰撞轨迹规划方法

Info

Publication number: CN110561417B
Application number: CN201910718263.9A
Authority: CN
Inventors: 王燕舞; 赵明杰; 肖江文; 杨武
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2019-08-05
Filing date: 2019-08-05
Publication date: 2021-03-26
Anticipated expiration: 2039-08-05
Also published as: CN110561417A

Abstract

本发明涉及一种多智能体无碰撞轨迹规划方法，包括：分别为每个智能体和障碍物建立在智能体运动平面上的投影模型，模型为一个安全半径下的圆面，安全半径使智能体或障碍物在该面上的投影位于圆内；基于外部罚函数法，将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数，无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交；以最小化目标函数为目标，采用最优控制理论和梯度下降法得到每个智能体的无碰撞轨迹。本发明依据圆面的建模方式及基于外部罚函数法的目标函数制定，既减少了模型对各种形状的智能体和障碍物的依赖，又驱使最终优化轨迹远离碰撞现象的发生，最终获得无碰撞的最优监控轨迹。

Description

一种多智能体无碰撞轨迹规划方法

技术领域

本发明属于多智能体持续监控领域，更具体地，涉及一种多智能体无碰撞轨迹规划方法。

背景技术

近年来，由于机器人技术和传感器网络技术的快速发展，多智能体协同网络受到了广泛的关注，由于其具有自主性高、协作能力强等优良特点，研究人员将其应用在许多复杂且难度比较大的任务中，比如环境采样、目标跟踪、资源搜集以及持续监控。持续监控是通过控制多个携带具备感知功能和通信功能的传感器的智能体的移动，对任务区域中感兴趣的目标的状态进行持续性地监控，以完成多种多样的任务。有别于传统的覆盖式监控中大量的静态传感器分布在环境中，持续监控中携带传感器的智能体是通过不断的移动来执行监控任务的。因此，综合考虑智能体的体积以及环境中可能存在有障碍物等现实因素，避免智能体在执行监控任务过程与其他智能体或者障碍物发生碰撞就变得尤为重要，进一步，为智能体设计无碰撞的优化监控轨迹是十分现实且必要的。

目前为止，持续监控的研究中鲜有考虑监控环境中存在障碍物的，考虑障碍物通常会对智能体的移动造成约束，从而加大解决问题的难度。而关于解决智能体之间可能发生碰撞的问题，已经有少量学者对其进行了研究。在一维监控研究中，有学者通过不断调整已经为智能体设计好的轨迹来避免可能发生的碰撞，然而，这种做法对计算量要求比较高，而且最终得到的监控策略也不是最优的；在二维监控研究中，有学者是在已经给定的轨迹中研究避免碰撞，通过预先判断碰撞区域并强制使智能体停留最终实现了无碰撞监控。因此，研究二维持续监控中可能出现的碰撞(智能体与智能体和智能体与障碍物)，并且为智能体设计最优的无碰撞监控轨迹是当前阶段一个开放而且具有难度的挑战。

以现有的持续监控领域中的研究成果和研究手段作为基础，为解决智能体与智能体和智能体与障碍物的碰撞提出合适的策略依然面临一些问题。首先是模型问题，该问题主要包括两个方面，第一是智能体的模型，在实际情况中，智能体往往具有一定的尺寸，而在现有研究中除了将智能体当作质点不考虑碰撞之外，就是考虑为其设置一个安全半径；第二是障碍物的模型，在实际情况下，障碍物往往也具有各种各样的形状，然而现有持续监控研究中并没有考虑障碍物，也就没有相应的模型。因此需要为智能体和障碍物的体积进行合适地建模。其次是避碰策略问题，现有的持续监控研究中少有研究这些碰撞问题的，因此关于实现无碰撞的策略比较匮乏，因此，探索一种计算效率高的、能够保证无碰撞的策略是十分必要的。

发明内容

本发明提供一种多智能体无碰撞轨迹规划方法，用以解决现有用于多智能体持续监控的智能体轨迹规划方法中由于智能体建模方式而忽视掉的但实际仍可能存在的智能体与智能体和智能体与障碍物碰撞的技术问题。

本发明解决上述技术问题的技术方案如下：一种多智能体无碰撞轨迹规划方法，用于二维平面持续监控，包括：

步骤1、分别为每个智能体和每个障碍物建立在智能体运动平面上的投影模型，所述模型为一个安全半径下的圆面，所述安全半径使得智能体或障碍物在该面上的投影位于圆内；

步骤2、基于外部罚函数法，将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数，所述无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交；

步骤3、以最小化所述目标函数为目标，采用最优控制理论和梯度下降法，得到每个智能体的无碰撞轨迹。

本发明的有益效果是：本发明用于对智能体进行二维平面持续监控，首先对执行任务的智能体和环境中的障碍物进行合适地建模，对于每个智能体，定义一个安全半径，要求该智能体能够完全位于该圆面内，如此便可以用圆面来代替智能体的安全位置，圆面之外对于其他智能体来说是安全的，反之，圆面之内可以默认为可能与该智能体发生碰撞的部位，障碍物的建模同理。其次，考虑监控过程的两个硬性约束(两个智能体的之间不能发生碰撞、智能体与障碍物之间不能发生碰撞)，根据外部罚函数法的思路，将约束纳入目标函数中，作为惩罚项是行之有效的方法，基于新的目标函数，采用最优控制理论，分析得到智能体运动的必要条件，通过为每个智能体分配椭圆运动轨迹，将求解最优的智能体运动参数的问题转变为求解最优轨迹参数的问题，并最终能够为智能体执行监控任务设计无碰撞的运动轨迹。本发明引入安全半径下的圆面，一方面避免把智能体看作一个质点来规划轨迹因其忽视智能体与智能体碰撞而可能导致碰撞的问题，另一方面，本发明考虑障碍物与智能体的碰撞，且对障碍物形状的依赖性较小，对计算复杂度的要求不高。优化后，根据这个优化结果进行智能体控制，无需实时监控智能体并更改智能体轨迹，方便快捷且可靠性高。充分解决了智能体与智能体和智能体与障碍物的碰撞问题。

上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述目标函数为：所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分；

所述碰撞惩罚项包括：智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积，智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积。

本发明的进一步有益效果是：本发明碰撞惩罚项，考虑智能体与智能体之间可能碰撞带来的代价，并为其设置一个较大的系数，用以体现对该种代价的放大，如果优化过程中某些轨迹出现了智能体与智能体的碰撞，则该部分会变成很大的代价，作为惩罚会驱使后续的优化远离这种违背约束的现象；另外，智能体与障碍物可能碰撞带来的代价，同样地，为其设置一个较大的系数，用以体现对该种代价的放大，如果优化过程中某些轨迹出现了智能体与障碍物的碰撞，则该部分会变成很大的代价，作为惩罚会驱使后续的优化远离这种违背约束的现象。该方法可以有效避开碰撞，最终实现一个无碰撞的轨迹优化结果。

进一步，所述第一放大系数的取值使得所述第一乘积是所述加权和的数倍，所述第二放大系数的取值使得所述第二乘积是所述加权和的数倍。

本发明的进一步有益效果是：本发明的放大系数尽可能的大，使得碰撞的惩罚力度能够最终更好的规划出各智能体无碰撞的轨迹。

进一步，所述步骤3中，所述以最小化所述目标函数为目标，具体为：

优化每个时刻各智能体的加速度和运动方向，使得所述目标函数的取值最小。

进一步，所述步骤3包括：

以最小化所述目标函数为目标，采用最优控制理论，基于每个智能体以其最大加速度运动并达到预设速度阈值后保持该速度阈值运动，为每个智能体分配椭圆运动轨迹，将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题，采用梯度下降法得到最优椭圆参数，得到每个智能体的无碰撞椭圆轨迹

本发明的进一步有益效果是：轨迹本身是一个简单的参数化轨迹，因此问题就由求解最优的u_n(t)和θ_n(t)的问题转变为求解最优的轨迹参数的问题，通过目标函数对轨迹参数求导，再利用基于无穷小扰动分析的梯度下降法便可以找到最优的椭圆参数，从而可以得到最优的无碰撞的椭圆轨迹。

进一步，用于所述不确定度计算的任一时刻第n个智能体对第i个目标的感应概率：当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时，分别与所述距离以及所述速度成反比，否则，为零。

本发明的进一步有益效果是：任一时刻第n个智能体对第i个目标的感应概率表示智能体n对目标i的有效感应，只有当目标i与智能体n的距离不超过固定的有效的感应半径，以及智能体n的速度不超过给定的速度阈值时，才有感应概率，而且距离越远，速度越快，感应概率越小，与现有只考虑距离的公式不一样的是，此公式既考虑了距离也考虑了速度对感应概率的影响，提高了对目标持续监控的有效性。

进一步，所述任一时刻第n个智能体对第i个目标的感应概率，表示为：

其中，r_n为所述预设感应半径；D(z_i,s_n)＝||z_i-s_n||，表示该时刻第n个智能体和第i个目标之间的欧氏距离，z_i为该时刻第i个目标的位置坐标，s_n、v_n分别为该时刻第n个智能体的位置坐标和速度；β_n为所述预设速度，且大于智能体n的最大额定速度。

进一步，t时刻所述第一碰撞代价为：t时刻两两智能体的碰撞因子之间的加和，其中，每两个智能体的碰撞因子为：当该两个智能体的距离大于该两个智能体对应的所述安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

进一步，t时刻所述第二碰撞代价为：t时刻各智能体和各障碍物的碰撞因子之间的加和，其中，任一智能体和任一障碍物的碰撞因子为：当该智能体和该障碍物的距离大于它们对应的所述安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

本发明的进一步有益效果是：本发明属于持续监控问题，希望在监控时域[0,T]内所有目标的不确定度加权和累计最小，同时又不希望智能体在移动的过程中发生碰撞。如此设置目标函数，一旦在智能体移动过程中出现任何一种碰撞，第一碰撞代价对应的第一乘积和第二碰撞代价对应的第二乘积的值就会是很大的正数，对于该最小化问题，这是不可行，因此，目标函数的在求解u_n(t)和θ_n(t)的过程中，问题的解会尽量避开任何一种碰撞，这样M₂J₂(t)和M₃J₃(t)的值就会是0，上述设置能够驱动问题最终找到不存在任何一种碰撞的解。

本发明还提供一种存储介质，所述存储介质中存储有指令，当计算机读取所述指令时，使所述计算机执行如上述任一种多智能体无碰撞轨迹规划方法。

附图说明

图1为本发明实施例提供的一种多智能体无碰撞轨迹规划方法的流程框图；

图2为本发明实施例提供的多智能体无碰撞轨迹规划的场景示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例一

一种多智能体无碰撞轨迹规划方法100，如图1所示，包括：

步骤110、分别为每个智能体和每个障碍物建立在智能体运动平面上的投影模型，该模型为一个安全半径下的圆面，安全半径使得智能体或障碍物在该面上的投影位于圆内；

步骤120、基于外部罚函数法，将无碰撞约束条件转换为碰撞惩罚项并纳入持续监控目标函数，无碰撞约束条件包括任两个代表智能体的圆面不相交以及任两个分别代表智能体和障碍物的圆面不相交；

步骤130、以最小化目标函数为目标，采用最优控制理论和梯度下降法，得到每个智能体的无碰撞轨迹。

需要说明的是，智能体运动平面相当于为监控场景的俯视面。另外，步骤130具体可为：采用最优控制理论，分析得到每个智能体以其最大加速度运动，直到达到预设速度阈值后保持该速度阈值运动。之后在现有研究的基础上，为每个智能体分配椭圆运动轨迹，将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题，采用梯度下降法得到最优椭圆参数，从而得到每个智能体的无碰撞椭圆轨迹。

首先对执行任务的智能体和环境中的障碍物进行合适地建模，如图2所示，对于每个智能体，定义一个安全半径，要求该智能体能够完全位于该圆面内，如此便可以用圆面来代替智能体的安全位置，圆面之外对于其他智能体来说是安全的，反之，圆面之内可以默认为可能与该智能体发生碰撞的部位；对于障碍物，类似于上述处理，用一个圆面来代替障碍物，要求该圆面是能够完全覆盖障碍物的最小圆面，如此便可以用圆面来代替智障碍物的位置，同时这种操作不受限于障碍物多种多样的形状，同样地，圆面之外对于智能体来说是安全的，反之，圆面之内可以默认为与障碍物发生碰撞的部位。

其次是监控过程的两个硬性约束，第一，两个智能体的之间不能发生碰撞，按照上述为智能体设置好的圆面，若要满足这个约束，必须保证智能体在运动过程中任意两个代表智能体的圆面不能相交；第二，智能体与障碍物之间不能发生碰撞，同样地，若要满足这个约束，必须保证智能体在运动过程中任意两个分别代表智能体和障碍物的圆面不能相交。根据外部罚函数法的思路，处理这两个硬性约束，将约束纳入目标函数中，作为惩罚项是行之有效的方法。

本实施例用于二维平面的持续监控，首先对执行任务的智能体和环境中的障碍物进行合适地建模，对于每个智能体，定义一个安全半径，要求该智能体能够完全位于该圆面内，如此便可以用圆面来代替智能体的安全位置，圆面之外对于其他智能体来说是安全的，反之，圆面之内可以默认为可能与该智能体发生碰撞的部位，障碍物的建模同理。其次，考虑监控过程的两个硬性约束(两个智能体的之间不能发生碰撞、智能体与障碍物之间不能发生碰撞)，根据外部罚函数法的思路，将约束纳入目标函数中，作为惩罚项是行之有效的方法，基于新的目标函数，采用最优控制理论，分析得到智能体运动的必要条件，通过为每个智能体分配椭圆运动轨迹，将求解最优的智能体运动参数的问题转变为求解最优轨迹参数的问题，并最终能够为智能体执行监控任务设计无碰撞的运动轨迹。本例引入安全半径下的圆面，一方面避免把智能体看作一个质点来规划轨迹导致的轨迹规划计算复杂度高的问题，另一方面，本例考虑障碍物与智能体的碰撞，且对障碍物形状的依赖性较小，对计算复杂度的要求不高。优化后，根据这个优化结果进行智能体控制，无需实时监控智能体并更改智能体轨迹，方便快捷且可靠性高。充分解决了智能体与智能体和智能体与障碍物的碰撞问题。

依据圆面的建模方式以及基于外部罚函数法的目标函数制定，既能够减少模型对各种形状的智能体和障碍物的依赖，简化了优化过程，又能够驱使最终优化轨迹远离碰撞现象的发生，并且最终获得一个无碰撞的最优监控轨迹。

优选的，目标函数为：所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分；碰撞惩罚项包括：智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积，智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积。

需要说明的是，上述不确定度为目标上的一个参数量，比如资源的累积量或信息的累积量。

目标函数主要包含三个部分，第一部分，待监测目标性能指标的加权和，这是最初的也是最根本的目标，另外，本例碰撞惩罚项，考虑智能体与智能体之间可能碰撞带来的代价，并为其设置一个较大的系数，用以体现对该种代价的放大，如果优化过程中某些轨迹出现了智能体与智能体的碰撞，则该部分会变成很大的代价，作为惩罚会驱使后续的优化远离这种违背约束的现象；另外，智能体与障碍物可能碰撞带来的代价，同样地，为其设置一个较大的系数，用以体现对该种代价的放大，如果优化过程中某些轨迹出现了智能体与障碍物的碰撞，则该部分会变成很大的代价，作为惩罚会驱使后续的优化远离这种违背约束的现象。该方法可以有效避开碰撞，最终实现一个无碰撞的轨迹优化结果。

优选的，第一放大系数的取值使得第一乘积是上述加权和的数倍，第二放大系数的取值使得第二乘积是上述加权和的数倍。

放大系数尽可能的大，使得碰撞的惩罚力度能够最终更好的规划出各智能体无碰撞的轨迹。

优选的，步骤130中，以最小化所述目标函数为目标，具体为：优化每个时刻各智能体的加速度和运动方向，使得目标函数的取值最小。

优选的，用于不确定度计算的任一时刻第n个智能体对第i个目标的感应概率：当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时，分别与所述距离以及所述速度成反比，否则，为零。

任一时刻第n个智能体对第i个目标的感应概率表示智能体n对目标i的有效感应，只有当目标i与智能体n的距离不超过固定的有效的感应半径，以及智能体n的速度不超过给定的速度阈值时，才有感应概率，而且距离越远，速度越快，感应概率越小，与现有只考虑距离的公式不一样的是，此公式既考虑了距离也考虑了速度对感应概率的影响，提高了持续监控的有效性。

优选的，任一时刻第n个智能体对第i个目标的感应概率，表示为：

其中，r_n为预设感应半径；D(z_i,s_n)＝||z_i-s_n||，表示该时刻第n个智能体和第i个目标之间的欧氏距离，z_i为该时刻第i个目标的位置坐标，s_n、v_n分别为该时刻第n个智能体的位置坐标和速度；β_n为预设速度，且大于智能体n的最大额定速度。

例如，通过控制多个智能体的移动，安全地(无碰撞)持续性地对二维环境中感兴趣的目标的状态进行监控。假设有一个[0,L₁]×[0,L₂]的二维环境，其中，存在

的待监控目标点，现该监控任务需要n＝1,2,...,N个智能体在[0,T]完成。

智能体n的动力学方程为

其中，0₂,₂是二阶零矩阵，I₂是二阶单位矩阵，x_n(t)＝[s_n(t),v_n(t)]′，且

分别表示智能体n在t时刻的位置和速度，U_n(t)是控制输入，且U_n(t)＝[u_n(t)cosθ_n(t),u_n(t)sinθ_n(t)]′，u_n(t)表示加速度的大小，θ_n(t)表示智能体的方向。关于v_n(t)、u_n(t)和θ_n(t)的约束分别为

和0≤θ_n(t)＜2π，n＝1,2,...,N，其中

和

为给定常数。

进一步，由于执行监控任务的是N个智能体，也就是说N个智能体可能会同时感应到同一个目标i，把N个智能体对同一目标i的联合感应概率用

表示，其中，x(t)＝[s(t),v(t)]′，s(t)＝[s₁(t),…,s_N(t)]，v(t)＝[v₁(t),…,v_N(t)]，该公式表示对于N个智能体来说，感应到目标i的智能体越多，P_i(x(t))越大，但最大不会超过1。对于每一个目标i，为其定义一个函数R_i，用来表示目标上的不确定度，其动力学为：

其中，A_i和B均为给定常数，A_i表示目标i的不确定度R_i的最大增长率，B表示智能体对不确定度R_i的最大下降能力(对于每个智能体，B值相同)，BP_i(x(t))表示让不确定度R_i以BP_i(x(t))的速率产生下降，该公式表示目标i上的不确定度R_i的变化，当P_i(x(t))＝0时，也就是所有的智能体都感应不到目标i时，不确定度R_i以速率A_i增长，当P_i(x(t))≠0时，也就是有智能体感应到目标i时，不确定度R_i以速率R_iA_i-BP_i(x(t))进行变化，并当R_i(t)＝0,A_i≤BP_i(x(t))时，

也就是说不确定度R_i不会为负数。

优选的，t时刻第一碰撞代价为：t时刻两两智能体的碰撞因子之间的加和，其中，每两个智能体的碰撞因子为：当该两个智能体的距离大于该两个智能体对应的安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

优选的，t时刻第二碰撞代价为：t时刻各智能体和各障碍物的碰撞因子之间的加和，其中，任一智能体和任一障碍物的碰撞因子为：当该智能体和该障碍物的距离大于它们对应的安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

例如，目标函数包含三个部分。第一部分是包含所有目标在内的性能度量，即

其中σ_i是给定常数，表示目标的权重，J₁(t)表示t时刻所有目标上的不确定度的加权和；第二部分是智能体之间发生碰撞的代价，对于每个智能体n，定义一个安全半径ρ_n，则相应的安全圆面为Q_n＝{x|||x-s_n(t)||≤ρ_n}，因此，对于任意两个智能体p和q，若

则说明智能体p和q之间发生了碰撞，因此，若为了避免发生碰撞，应该确保d_pq(t)＝||s_p(t)-s_q(t)||≥ρ_p+ρ_q，定义

则若没有碰撞发生，则

若有碰撞发生，则

会产生一定的代价。对于所有智能体之间可能发生的碰撞，定义

第三部分是智能体与障碍物之间发生碰撞的代价，对于每个障碍物，定义能够完全覆盖其的最小圆面的圆心为

半径为r_l，l＝1,2,...,L，若为了避免智能体n与与障碍物l之间发生碰撞，则应该确保d_ln(t)＝||w_l-s_n(t)||≥r_l+ρ_n，定义

可以看出若没有碰撞发生，则

若有碰撞发生，则

会产生一定的代价。对于所有智能体和所有障碍物之间可能发生的碰撞，定义

根据上述三个部分，最终的目标函数定义为

其中M₂和M₃是给定的数值很大的负数，一般来说，保证M₂J₂(t)和M₃J₃(t)的值是J₁(t)的值的几倍。

利用最优控制理论，将J₁(t)+M₂J₂(t)+M₃J₃(t)、

和

写为哈密顿方程，利用极值原理可以分析得到，要想使目标函数最小，每个智能体都需要以最大加速度

运动，并且当智能体加速后速度达到

时，智能体会一直保持

运动。此外，由于该两点边值问题受限于目标数量和智能体数量，而且障碍物的存在之会加剧求解的复杂性，因此在已有结论的基础上，将求解最优的u_n(t)和θ_n(t)的问题转化为寻找最优参数的问题，也就是说，分配给每个智能体一个椭圆运动的轨迹，让每个智能体沿着各自的椭圆轨迹以最大加速度

运动，并且当智能体加速后速度达到

时，智能体会一直保持

运动。椭圆轨迹本身是一个简单的参数化轨迹，因此问题就由求解最优的u_n(t)和θ_n(t)的问题转变为求解最优的椭圆参数的问题，通过目标函数对椭圆参数求导，再利用基于无穷小扰动分析的梯度下降法便可以找到最优的椭圆参数，从而可以画出最优的无碰撞的椭圆轨迹。

本例属于持续监控问题，希望在监控时域[0,T]内所有目标的不确定度加权和累计最小，同时又不希望智能体在移动的过程中发生碰撞。如此设置目标函数，一旦在智能体移动过程中出现任何一种碰撞，第一碰撞代价对应的第一乘积和第二碰撞代价对应的第二乘积的值就会是很大的正数，对于该最小化问题，这是不可行，因此，目标函数的在求解u_n(t)和θ_n(t)的过程中，问题的解会尽量避开任何一种碰撞，这样M₂J₂(t)和M₃J₃(t)的值就会是0，上述设置能够驱动问题最终找到不存在任何一种碰撞的解。

本例通过以圆面代替智能体和障碍物的建模方式，减少了模型对各种形状的智能体和障碍物的依赖，并简化了后续的优化过程；相比于实时应对碰撞可能发生的现象，基于外部罚函数法思想的约束处理方式更为简单也更为高效；此外，在基于外部罚函数法的基础上设计的包含违反约束的惩罚在内的目标函数，能够驱使优化轨迹远离违背硬性约束的现象发生，并且最终获得一个无碰撞的最优监控轨迹。

实施例二

一种存储介质，存储介质中存储有指令，当计算机读取所述指令时，使所述计算机执行如上述任一种多智能体无碰撞轨迹规划方法。

相关技术方案同实施例一，在此不再赘述。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种多智能体无碰撞轨迹规划方法，用于二维平面持续监控，其特征在于，包括：

2.根据权利要求1所述的一种多智能体无碰撞轨迹规划方法，其特征在于，所述目标函数为：所有待监测目标的不确定度的加权和与所述碰撞惩罚项的加和在监控时域上的积分；

所述碰撞惩罚项包括：智能体与智能体之间的第一碰撞代价与第一放大系数的第一乘积，智能体与障碍物之间的第二碰撞代价与第二放大系数的第二乘积；

其中，每一个待测目标的不确定度用R_i表示，其动力学为：

根据R_i导数

在时间上的积分即可得到R_i，式中，A_i和B均为给定常数，A_i表示待测目标i的不确定度R_i的最大增长率，B表示智能体对不确定度R_i的最大下降能力，每个智能体对应的B值相同，P_i(x(t))表示N个智能体对同一待测目标i的联合感应概率，x(t)＝[s(t),v(t)]′，s(t)＝[s₁(t),…,s_N(t)]，v(t)＝[v₁(t),…,v_N(t)]，s(t)和v(t)分别表示智能体n在t时刻的位置和速度。

3.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法，其特征在于，所述第一放大系数的取值使得所述第一乘积是所述加权和的数倍，所述第二放大系数的取值使得所述第二乘积是所述加权和的数倍。

4.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法，其特征在于，所述步骤3中，所述以最小化所述目标函数为目标，具体为：

5.根据权利要求4所述的一种多智能体无碰撞轨迹规划方法，其特征在于，所述步骤3包括：

以最小化所述目标函数为目标，采用最优控制理论，基于每个智能体以其最大加速度运动并达到预设速度阈值后保持该速度阈值运动，为每个智能体分配椭圆运动轨迹，将优化每个时刻智能体的加速度和运动方向的问题转变为优化椭圆轨迹参数的问题，采用梯度下降法得到最优椭圆参数，得到每个智能体的无碰撞椭圆轨迹。

6.根据权利要求2所述的一种多智能体无碰撞轨迹规划方法，其特征在于，用于所述不确定度计算的任一时刻第n个智能体对第i个目标的感应概率：当该时刻第n个智能体和第i个目标的距离小于预设感应半径且第n个智能体的速度小于预设速度时，分别与所述距离以及所述速度成反比，否则，为零。

7.根据权利要求6所述的一种多智能体无碰撞轨迹规划方法，其特征在于，所述任一时刻第n个智能体对第i个目标的感应概率，表示为：

8.根据权利要求2至7任一项所述的一种多智能体无碰撞轨迹规划方法，其特征在于，t时刻所述第一碰撞代价为：t时刻两两智能体的碰撞因子之间的加和，其中，每两个智能体的碰撞因子为：当该两个智能体的距离大于该两个智能体对应的所述安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

9.根据权利要求2至7任一项所述的一种多智能体无碰撞轨迹规划方法，其特征在于，t时刻所述第二碰撞代价为：t时刻各智能体和各障碍物的碰撞因子之间的加和，其中，任一智能体和任一障碍物的碰撞因子为：当该智能体和该障碍物的距离大于它们对应的所述安全半径的加和时，取值为零，否则，取值为该距离与该加和的差值。

10.一种存储介质，其特征在于，所述存储介质中存储有指令，当计算机读取所述指令时，使所述计算机执行上述如权利要求1至9任一项所述的一种多智能体无碰撞轨迹规划方法。