CN110275527B

CN110275527B - 一种基于改进拟态物理法的多智能体系统运动控制方法

Info

Publication number: CN110275527B
Application number: CN201910466169.9A
Authority: CN
Inventors: 丁勇; 高振龙; 何金
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2019-05-29
Filing date: 2019-05-29
Publication date: 2022-02-11
Anticipated expiration: 2039-05-29
Also published as: CN110275527A

Abstract

本发明公布了一种基于改进拟态物理法的多智能体系统运动控制方法，涉及多智能体协同运动控制领域。所述方法首先建立单个智能体的运动模型，并对多智能体个体的运动规则用拟态物理力的方法进行描述；接着，将拟态物理法与经典聚集、避碰和速度一致规则相结合，同时利用距离和相对速度来计算聚集系数与速度一致系数；然后，利用注意力参数调节调节改进拟态物理法各项的作用效果，使智能体有选择的跟随其他智能体或者目标；最后，通过使用改进拟态物理法对智能体运动进行调节，实现多智能体系统的聚集运动、速度一致和多目标环境下的分群运动。该方法主要解决了经典的多智能体系统运动控制算法在聚集运动过程中出现的边界振荡问题和多目标环境下多智能体系统的分群运动问题。

Description

一种基于改进拟态物理法的多智能体系统运动控制方法

技术领域

本发明属于多智能体系统运动控制领域，特别是考虑多个目标环境下的自主分群方法。

背景技术

多智能体系统(multi-agent systems，MAS)是由大量简单自主个体组成的自组织群体系统，虽然MAS的基本单位智能水平很低，但是整体却表现出较高的智能水平，能够完成搜索、侦查、救援等复杂的任务，多智能体系统运动控制是多智能体系统应用的基础，即通过自组织的方式实现群体的聚集运动、速度一致以及分群运动。

目前的多智能体运动控制算法主要针对聚集运动和速度一致，并以SAC原则为基础出现了大量的分布式集群运动控制算法，如Three-Circle法、人工势场法、社会力模型等。其中SAC原则是指每一个智能体遵循三条简单的规则——避撞(Separation)、对齐(Alignment)和聚集(Cohesion)。Three-Circle法简单且容易理解，但是由于智能体的感知范围被分为三个不连续的区域，因此在聚集过程中容易发生振荡现象。人工势场法通常需要建立全局势场，且存在局部极小值的问题，导致智能体间避碰失败。社会力法不需要全局控制，但由于与人工势场法在本质上是相同的，因此也存在人工势场法局部极小值问题。

拟态物理法将个体间的相互作用抽象为物理力，省去了人工势场法的求梯度过程，且不存在人工势场法局部极小值问题，因此广泛应用于多智能体编队及重构、无人机编队、智能车编队等。但是当环境中存在多个目标时，经典的拟态物理法无法实现多智能体系统的分群运动。

发明内容

本发明的目的在于提供一种基于改进拟态物理法的多智能体系统运动控制方法，能够实现多智能系统的聚集运动、速度一致和分群运动，解决了经典SAC算法边界振荡问题和实现了多目标环境下多智能体系统的分群运动。

为实现上述目的，本发明采用以下技术方案：

一种基于改进拟态物理法的多智能体系统运动控制方法，包括：

步骤一，将每个智能体抽象为质点，建立单个智能体的二阶运动模型。

步骤二，根据智能体感知范围得到智能体的邻居序号集N_i，获取感知范围内邻居智能体的状态信息

以及目标的位置信息

步骤三，根据邻居智能体的状态信息和目标的位置信息选择注意对象

并确定自身的目标感知状态

步骤四，根据智能体与邻居智能体或注意对象的距离，计算改进拟态物理法的聚集系数k_p、速度一致系数k_v和避碰系数k_r。

步骤五，利用注意力参数调节改进拟态物理法各项的作用效果，计算每个智能体的控制输入u_i。

步骤六，根据步骤五计算的控制输入与步骤一单个智能体的运动模型，对智能体进行控制。

步骤七，判断每个智能体是否都到达目标点，如果没有，则跳转步骤二进行循环，否则结束运动。

本发明具有以下优点：

1.在智能体的感知距离内，同时考虑相对速度与相对位置来计算聚集系数和速度一致系数，实现多智能体系统的聚集运动，解决了经典基于SAC原则的运动控制算法在聚集运动过程中存在的边界振荡问题。

2.将拟态物理法与SAC原则相结合，融合聚集区域与速度一致区域，在经典拟态物理法吸引力与排斥力的基础上，增加速度一致作用力，实现了多智能体系统的速度一致运动。

3.考虑到多目标情形下多智能体系统的分群运动，将注意力跟随机制与改进拟态物理法相结合，利用注意力参数调节目标点或邻居智能体的作用效果，实现了多智能体系统分群运动。

附图表说明

图1为本发明方法的流程图。

图2为多智能体系统坐标示意图。

图3为t＝3s和t＝9s时多智能体系统群体运动状态。

图4为25s内每个智能体的速度方向变化曲线。

图5为本发明算法、经典SAC算法、人工势场法、改进的SAC算法一致性指数变化曲线。

图6为基于改进拟态物理法的多智能体系统分群运动轨迹。

图7为分群运动过程中每个智能体的速度变化曲线。

具体实施方式

结合所附图表，对本发明的技术方案作具体说明。

如图1所示，本发明的一种基于改进拟态物理法的多智能体系统运动控制方法，具体包括以下步骤：

步骤1：将每个智能体抽象为质点，建立单个智能体的二阶运动模型。具体过程为：

对智能体所处环境建立笛卡尔坐标系，如图2所示，图中圆圈表示智能体，三角形表示目标，速度向量由箭头表示。设智能体Agent_i在环境中的位置为p_i＝(x_i，y_i)，速度为

目标的位置为

将单个智能体均抽象为质点，其运动模型为：

式中，p_i是智能体Agent_i的位置向量，v_i是智能体Agent_i的速度向量；u_i为Agent_i的控制输入，N为多智能体系统中智能体的总数。

步骤2：根据智能体感知范围得到智能体的邻居序号集，获取感知范围内邻居智能体的状态信息以及目标的位置信息。具体过程为：

获取编号为i的智能体Agent_i的邻居序号集N_i为：

N_i＝{j|||p_i-p_j||≤δ，j∈{1，2，…，N}，j≠i} (2)

式中，p_i为智能体Agent_i的位置向量，p_j为智能体Agent_j的位置向量，||p_i-p_j||为智能体Agent_i与智能体Agent_j的欧氏距离，δ＞0为智能体的感知距离。

获取的邻居智能体的状态信息用元组

表示，

为Agent_j(j∈N_i)的目标感知状态。当Agent_j能感知到目标时，

反之

当目标与智能体的距离

小于智能体的感知距离δ时，表示智能体能感知到目标，则获取目标的位置信息为

这里

表示编号为m的目标T_m位置向量。

步骤3：根据邻居智能体的状态信息和目标的位置信息选择注意对象

并确定自身的目标感知状态

具体过程为：

当智能体Agent_i能够感知到目标时，根据目标的位置信息

选择欧氏距离最近的目标作为注意对象

同时设置Agent_i的目标感知状态为

当智能体Agent_i没有感知到目标且邻居智能体Agent_j(j∈N_i)的目标感知状态

时，则选择最近的智能体Agent_j作为注意对象

同时设置Agent_i的目标感知状态为

当智能体Agent_i既感知不到目标，且其邻居智能体的目标感知状态

均为0时，则令Agent_i的注意对象

同时设置Agent_i的目标感知状态为

步骤4：根据智能体与邻居智能体或注意对象的距离，计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。具体为：

式中，k_p为聚集系数，k_v为速度一致系数，k_r为避碰系数；α，β和γ为增益系数，d为智能体Agent_i与邻居智能体Agent_j或注意对象

的欧氏距离；r_a为智能体的速度一致距离，r_s为智能体的避碰距离；q为指数因子。

步骤5：利用注意力参数调节改进拟态物理法各项的作用效果，计算每个智能体的控制输入。具体过程为：

(5.1)计算智能体Agent_i与邻居智能体Agent_j(j∈N_i)的位置差

和速度差

具体为：

式中，p_j表示智能体Agent_j的位置向量，p_i表示智能体Agent_i的位置向量；v_j表示智能体Agent_j的速度向量，v_i表示智能体Agent_i的速度向量。

(5.2)计算改进拟态物理法的速度一致项

和避碰项

具体为：

式中，k_p、k_v和k_r分别为位置协同系数、速度协同系数和避碰系数，r_S为智能体的避碰距离，δ为智能体的感知距离，r_a为智能体的速度一致距离。

(5.3)计算改进拟态物理法的注意力跟随项

具体为：

式中，

为注意对象

的位置，

为注意对象

的速度。显然，当注意对象

为静止目标时，

(5.4)利用注意力参数调节改进拟态物理法各项的作用效果，计算每个智能体的控制输入u_i，具体为：

式中，α_i为注意力参数，表示为：

步骤6：根据步骤5计算的控制输入与步骤1单个智能体的运动模型，对智能体进行控制。

步骤7：判断每个智能体是否都到达目标点，如果没有，则跳转步骤2进行循环，否则结束运动。

采用本发明的上述方案，多智能体系统在运动过程中能够实现多智能体的聚集运动、速度一致和多目标环境下的分群运动。

为了验证方法的可行性和有效性，下面结合实例对本发明做进一步详细的描述。

在Windows 7操作系统上，使用MATLAB 2013a进行仿真实验。设置规模为20多智能体系统，每个智能体的初始位置在半径为25米的圆形区域内随机选取，初始速度v₀设置为

单位为m/s。分别针对多智能体系统在连续环境下的聚集与速度一致以及多目标环境下自主分群两种情况进行仿真。仿真每次循环的时间步长为1s，同步更新智能体的状态。

表1所示为本发明中改进拟态物理法的参数。

表1改进拟态物理法仿真参数

图3为3s和9s时多智能体系统群体运动状态，图中虚线表示智能体连续3s的运动轨迹，“○”和“●”分别表示3s和9s时的智能体。在t＝3s时，从虚线所示轨迹可以看出，此时正在发生群体的聚集运动。在t＝9s时，虚线所示运动轨迹平稳，同时智能体间保持稳定的距离，多智能体系统完成了聚集运动。

图4所示为仿真时长25s得到的每个智能体的速度方向θ的变化曲线，其中θ＝arctan(x_i/y_i)。从图4曲线可以看出，经过大约5s的调整，各个智能体的运动速度基本达成一致，多智能体系统实现了速度一致运动。

在仿真过程中，为了定量描述MAS聚集运动和速度一致运动，定义一致性指数C描述了群体运动方向的有序性，具体如下式所示：

式中，N为多智能体系统中智能体的个数，v_i为智能体Agent_i的速度，显然，C∈[0，1]。当C→1时，表示多智能体系统运动的一致性越强，反之，则多智能体系统运动的随机性越强。

图5所示为本发明提出的改进拟态物理法与经典SAC算法、人工势场法、改进SAC算法的仿真比较。在相同的初始状态下仿真25s，得到一致性指数变化曲线，这里认为当一致性指数C＞0.95时即表示多智能体系统实现了速度一致。可以看出，本发明提出的改进拟态物理法得到的一致性指数变化曲线更为平滑，解决了经典SAC算法与基于人工势场的算法存在的振荡问题。

为验证本发明一种基于改进拟态物理法的多智能体系统运动控制方法的分群能力，当多智能体系统聚集完成并实现速度一致后，在群体运动路线上随机设置两个目标点。

图6所示为本发明提出的基于改进拟态物理法的多智能体系统分群运动轨迹。从图中可以看出，当多智能体系统附近存在多个目标时，由于目标信息迅速在集群内传播，系统中智能体根据自身状态自主地选择注意对象，实现了多智能体系统的分群运动。

图7为分群运动过程中每个智能体的速度变化曲线。从图中可以看出，本发明提出的改进拟态物理法不仅很好地实现了多智能体系统的聚集运动、速度一致，还实现了多目标环境下的分群运动，并在分群运动过程中各个子群保持速度一致运动。