CN111007848B

CN111007848B - 一种基于有界空间的多智能体协同作业控制方法

Info

Publication number: CN111007848B
Application number: CN201911240049.3A
Authority: CN
Inventors: 朱德政; 曹罡; 朱维超; 刘聪; 方磊; 冯欣欣; 鱼江海; 蔡思捷
Original assignee: CETC 28 Research Institute
Current assignee: CETC 28 Research Institute
Priority date: 2019-12-03
Filing date: 2019-12-03
Publication date: 2022-08-16
Anticipated expiration: 2039-12-03
Also published as: CN111007848A

Abstract

本发明提供了一种基于有界空间的多智能体协同作业控制方法，目前绝大部分多智能体一致性算法都依赖于位置和速度信息反馈。在许多生物群集运动中，通信频率通常不会太高，这意味着像速度这些反馈信息可能是多余的。从工程角度来看，作为控制器一部分的速度分量如果被淘汰的话，那么将大大降低通信代价。考虑到智能体在有界空间中运动，碰到墙壁反弹时不可避免地发生碰撞，因此之前算法不能有效地控制多智能体完成群集与避障问题。本发明分别对智能体在实际空间以及虚拟空间中建立势能函数，设计分布式控制的避障和群集策略，利用虚拟导航信息，为智能体增加目标信息导航，避免各个智能体由于避碰而导致速度下降，从而实现多智能体系统群集运动。

Description

一种基于有界空间的多智能体协同作业控制方法

技术领域

本发明属于指挥控制领域，尤其涉及一种基于有界空间的多智能体协同作业控制方法。

背景技术

随着科学计算的快速发展，运用当今科技去处理复杂问题的需求对于人们来说越来越迫切。然而人们发现仅仅通过个体去解决一些复杂问题会越来越棘手，不但在专业技术层面上严格要求，并且很多问题需要许多个体密切协作才能解决。

多智能体协调合作控制问题的研究近几年来深受人们的广泛关注。其中作为合作控制基础的一致性问题，已经在同步、聚集问题、蜂拥控制、编队控制等研究中被广泛应用。

蜂拥现象在自然世界中广泛存在，例如蜂群、鱼群、鸟群以及蚁群等等，它能够提高它们找到食物的概率，并且能够帮助它们避开天敌。

Reynolds研究了在生物学中的蜂拥现象，并且建立了相应的数学模型，以及提出了被以后的研究者一直遵循的蜂拥三准则。Olfati-Saber在针对蜂拥控制避障上面取得重要的成果，提出了一种人工势能函数，使得智能体在不发生碰撞时，每一个智能体的速度状态最终趋于一致。因此可以发现，一致性研究在蜂拥理论中主要是用于让每一个智能体的速度状态达到一致。除此以外，如果随机选取初始状态时，也许会出现智能体群落分裂的情形，为了避免发生该情况，文章中又研究了带有虚拟领导者的蜂拥控制算法。Tanner和Jadbabaie还研究了在Reynolds模型基础上的一致性算法，对蜂拥行为的控制以及稳定性进行了严格证明，考虑个体间的吸引力和排斥力，分别讨论了固定拓扑和切换拓扑的蜂拥控制问题。

目前，针对多智能体系统的蜂拥控制已经获得了相当多的研究成果，但是仍然还有很多问题待解决。今后，考虑到通信时延问题的多智能体系统的蜂拥控制算法是需要解决的问题。另外，多智能体系统拓扑结构为有向图的蜂拥控制也是一个新的研究内容，还有，就是要将非线性理论运用到蜂拥控制算法中，从而拓宽蜂拥控制算法的应用领域。

近年来，越来越引起人们广泛关注的编队控制问题，被广泛应用在无人飞行器系统，水下舰队，地面无人小车等系统中。编队控制需要该系统中的每一个个体能保持规定的图形。在分布式编队控制中，每一个智能体都了解最终要保持的图形，然而每个智能体的位置只能通过信息交流来协调控制。因此，编队控制问题也是特殊的一致性问题。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于有界空间的多智能体协同作业控制方法，包括如下步骤：

步骤1，建立多智能体二阶运动方程；

步骤2，定义镜像速度矩阵和镜像速度；

步骤3，建立多智能体无速度反馈的有界空间一致性控制方法；

步骤4，建立多智能体在有界空间中的群集控制方法；

步骤5，建立基于实物机器人的一致性控制方法。

本发明中，步骤1包括：

步骤1-1，设定一组智能体在正三角形区域中运动，建立如下多智能体二阶运动方程：

其中，i∈{1,2，...,n}表示智能体编号，p_i、v_i、u_i分别代表位置向量、速度向量和输入向量，并且随着时间t而变化；

分别表示位置的导数和速度的导数；p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合；n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示t的左极限和右极限；＜v_i(t-),n＞表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化，矩阵Δ_i(t)被定义为：

其中，δ为Dirac函数，k表示第k次碰撞，τ(k)表示第k次碰撞时刻；

步骤1-2，当t＝τ(k)时，智能体与墙壁发生镜面碰撞，v_i(t-)和v_i(t+)分别为入射方向和反射方向，速度不再连续；

而当t≠τ(k)时，有：

说明当智能体与墙壁不接触时，速度连续。

步骤2包括：

步骤2-1，定义如下镜像速度矩阵k_i(t)：

其中，法向单位向量n＝[a,b]^T，w＝[-b,a]^T，并且满足a²+b²＝1；定义k_i(0)＝I^2×2，为单位向量；定义K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))……k_i(τ(k))，其中k_i(τ(1))，k_i(τ(2))…，k_i(τ(k))分别表示第1次、2次、…、k次碰撞后的值，即令L_i(t)＝-1；

步骤2-2，定义镜像速度

则当t＝τ(k)时，有：

即当t＝τ(k)时，实际速度v_i(t)不是连续的，对于镜像速度

来说，总是连续的。

和

是

在s＝t的左极限和右极限；

步骤3包括：建立如下无速度反馈的有界空间一致性控制方程：

其中，T∈R^2×2，且为Huiwitz矩阵；P∈R^2×2是对称正定阵，并且满足Lyapunov方程T^TP+PT＝-Q，其中Q∈R^2×2，也是对称正定阵。

表示x_i的位置估计，

表示

的一阶导数，y_i表示中间变量，u_i表示控制输入，

和

分别表示第i个智能体的镜像位置和第j个智能体的镜像位置，

表示K_i(t)的逆矩阵。

步骤4包括：建立如下多智能体在有界空间中的群集控制方程：

u_i＝f_i ^α+f_i ^β+f_i ^γ+f_i ^η

其中，u_i表示第i个智能体的控制量，f_i ^α是实现多智能体在虚拟空间中形成群集的控制项，f_i ^β是避免多智能体在实际空间中发生碰撞的控制项，f_i ^γ是实现速度达到一致的控制项，f_i ^η是实现目标导航反馈的控制项。

步骤4中，所述控制项的具体表达式如下：

其中，c₁,c₂为反馈增益调节项，c₁,c₂＞0；K_i和K_j分别表示第i个和第j个智能体在所有碰撞时刻镜像矩阵的乘积；

表示梯度函数；

表示在镜像空间中第i和j智能体之间的相对位置；φ(||p_ij||)表示在实际空间中第i个和第j个智能体之间的相对距离函数；

表示在镜像空间中目标智能体r的位置；

表示在镜像空间中目标智能体r的位速度；v_j表示第j个智能体的速度向量。

步骤5包括：所述实物机器人是移动小车模型，其控制量为角速度和线速度，机器人的动态系统为：

其中，ξ_i(t)表示质心位置，

表示质心速度，φ_i(t)表示角位移，

表示角位移的一阶导数，ω_i(t)表示角速度。

引入坐标变换，即p_i＝ξ_i+d[cosφ_i sinφ_i]^T，其中，ξ_i表示质心位置，φ_i表示角位移，d表示控制点偏离质心的距离，d＞0，令：

其中，ω_i表示角速度，v_i表示二维速度向量，

表示线速度，为标量；

得到：

其中，

表示第i个智能体位置的一阶导数。

根据：v_i(t+)＝(I-2n·n^T)v_i(t-)。其中，v_i(t-)和v_i(t+)分别表示第i个智能体速度矢量在t时刻的左极限和右极限。

和

分别表示第i个智能体线速度在t时刻的左极限和右极限。φ_i(t-)和φ_i(t+)分别表示第i个智能体角位移在t时刻的左极限和右极限。ω_i(t-)和ω_i(t+)分别表示第i个智能体角速度在t时刻的左极限和右极限。

当t＝τ(k)，对于三角形底边，得出φ_i(t+)＝-φ_i(t-)，并且n＝[01]^T，I为单位矩阵，则：

得到：

对于三角形右斜边，有φ_i(t+)＝-120°-φ_i(t-)和

并且

因此，

和

当t＝τ(k)，对于三角形左斜边，有：

ω_i(t+)＝-ω_i(t-)。

有益效果：本发明基于多智能体在有界区域内编队部署，提出了有界空间中在无速度反馈情况下的一致性算法。通过观测器的方法去除速度的反馈，大大降低通信代价。除此以外，无速度反馈控制方法对于那些没有安装传感器的多智能体系统以及速度传感器测量不够精确的情况来说将会更加有意义。接下来设计了在有界空间中多智能体能够形成群集并且能够避碰的控制算法，提升了多智能体系统控制算法在实际环境中的实用性。考虑到智能体不同的控制要求，设计了两种不一样的势能函数，分别为镜像空间中的势能函数和实际空间中的势能函数，然后在控制律中加入这两种势能函数，并且引入速度一致项，同时利用追踪目标信息引入了导航反馈项，以此来完成多智能体系统在有界空间中的群集和避碰运动。最后提出了针对实际平台的多机器人控制算法，将前面算法中的横、纵坐标控制变量的形式转换成机器人角速度和线速度的形式。然后在实物机器人平台进行实验，得到仿真结果，检验了多机器人在有界空间中一致性算法的有效性和收敛性。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1是入射速度、反射速度及镜像速度之间关系图。

图2是移动机器人小车的模型。

图3是正三角形区域坐标系。

图4是碰撞面入射向量和反射向量关系图。

图5是虚拟空间中的势能函数

图6是实际空间的势能函数ψ(||p_ij||)。

图7是矩形区域10个智能体初始位置及速度。

图8是矩形区域10个智能体的轨迹图。

图9是矩形区域10个智能体的速度。

图10是矩形区域10个智能体的加速度。

图11是矩形区域智能体1与其他智能体的x轴相对位置。

图12是矩形区域智能体1与其他智能体的y轴相对位置。

图13是三角形区域中智能体初始位置及速度。

图14是三角形区域中智能体的轨迹图。

图15是三角形区域中智能体在400s时刻的位置与速度。

图16是三角形区域中智能体的速度。

图17是三角形区域中智能体的加速度。

图18是3个机器人在正三角形区域中的轨迹图。

具体实施方式

一般地，针对多智能体一致性系统的研究，通常用图的形式来描述系统的拓扑结构，即智能体与邻居之间的通信关系，接下来将主要介绍一些关于图和矩阵方面的性质。

(1)数学相关知识

根据代数图形理论，多智能体网络系统拓扑结构使用图G＝(V,ε)来表示，其中，顶点集合用V＝{1,2,…,n}来表示，边的集合由ε∈V×V构成。节点编号为i∈{1,2,…,n}。如果信息交换发生在第i个节点v_i与第j个节点v_j之间，此时说明有相连的边在这个节点对之间。由于节点对在无向图里是无序的，所以在节点之间的边是无向的，即

但是对于有向图来说，由于边不一定完全连通，因此若在第i个节点与第j个节点之间有边指向并不能说明第j个节点与第i个节点有边指向，也就是说它们之间是有向边。如果在图G里，任何两个节点之间都有连接的边，那么图G则是完全图。在有向图中，v_i的出度是指由节点v_i开始的边的数目，v_i的入度是指指向节点v_i的边的数目。若(v_i,v_j)∈E，那么称节点v_j为节点v_i的邻居。定义N_i＝{v_j∈V:(v_i,v_j)∈E}作为节点v_i的邻居集合。然而，在图中可能存在节点v_i到其自身的边，即(v_i,v_i)，称节点v_i存在自环，但是在本发明中的多智能体系统描述中，不考虑这样的边。

智能体之间的耦合程度往往在多智能体系统中需要通过对通讯的边赋予权值来刻画，拓扑图之间的连接结构通过引入邻接矩阵A＝(a_ij)∈R^n×n来描述，其中a_ij表示权值，R^n×n表示n×n矩阵。连接此时相应的图就变为加权图。如果i≠j，那么当智能体i可以接收到智能体j的通讯信号时，此时a_ij＞0；否则a_ij＝0。定义入度矩阵D＝(d_ii)，其中

如果加权矩阵A均为0或1，即：

因此，若图G为对称图，那么矩阵A对称。

如果加权值更为特殊，即定义为：

其中，w_ij是边(v_i,v_j)的权值，那么指向节点v_i全部边的权值相加是节点v_i的入度；同理，离开节点v_i全部边的权值相加是节点v_i的出度。

人们在研究多智能体的一致性过程时，引入了拉普拉斯矩阵L，定义为：

即L＝D-A。通过研究拉普拉斯矩阵的性质，可以得到图特征与多智能体系统一致性之间的关系。

(2)有界空间中一致性问题描述

对于n个智能体，第i个智能体的值用x_i表示，它可以用来表示电压，温度，高度，位置等。

定义1称第i个节点与第j个节点在网络拓扑中达到一致，当且仅当x_i＝x_j,i≠j；如果任何两个节点i和j都有x_i＝x_j,i≠j，那么称该拓扑达到一致性。

定义2称二阶多智能体系统达到一致性，当且仅当针对任意节点随着时间t→∞都有：

本发明首先考虑一组智能体在正三角形区域中运动，如图3所示是建立的笛卡尔坐标系，坐标原点为正三角形的左下角顶点，x轴沿着底边方向指向右方。

不失一般性，设定时间序列0＜τ(1)＜τ(2)＜…是多智能体碰撞到墙壁时刻，τ(1)表示第1次碰撞时刻，τ(2)表示第2次碰撞时刻,…。建立运动方程如下：

分别表示位置的导数和速度的导数；p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合；n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示v_i(s)在s＝t的左极限和右极限，v_i(t-)＝lim_s→t-v_i(s)，v_i(t+)＝lim_s→t+v_i(s)；＜v_i(t-),n＞表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化，矩阵Δ_i(t)被定义为：

其中，δ为Dirac函数，k表示第k次碰撞，τ(k)表示第k次碰撞时刻。

当t＝τ(k)时，有：

其中，I表示单位向量。

从图4可以得到如下关系：

这意味着，当t＝τ(k)时，智能体与墙壁发生镜面碰撞，v_i(t-)和v_i(t+)分别为入射方向和反射方向，速度不再连续；

而当t≠τ(k)时，有：

说明当智能体与墙壁不接触时，速度连续。

w表示垂直于n的单位向量，同时(n,w)满足右手规则，使得n×w方向垂直于纸面指向外。x表示横坐标轴，θ表示n与x之间的夹角，满足右手规则，并且n×x方向垂直于纸面朝向外则角度是正，反之是负。v_i(t-)表示智能体i接触墙壁之前的速度向量，v_i(t+)表示智能体i接触墙壁之后的速度向量。定义符号变量L_i(t)，接触之前L_i(t)为1，接触之后L_i(t)为-1。具体如图1所示：

定义如下镜像速度矩阵k_i(t)：

定义镜像速度

则当t＝τ(k)时，有：

即当t＝τ(k)时，实际速度v_i(t)不是连续的，对于镜像速度

来说，总是连续的。

和

是

在s＝t的左极限和右极限。K_i(t+)表示在t时刻K_i(t)的右极限。

对于直线l:Ax+By+C＝0(A²+B²≠0)，点M(x₀,y₀)关于直线l的对称点的坐标是N(x₁,y₁)，则有：

写成矩阵形式为：

其中，

即为镜像位置矩阵。

定义各个智能体镜像位置，有

其中，镜像位置

分别表示镜像位置

在x轴和y轴上的投影，Q_i(t)＝q_i(0)·q_i(τ(1))·q_i(τ(2))……q_i(τ(k))，q_i(t)∈R^3×3，q_i(0)＝I^3×3，并且q_i(τ(k))表示第i个智能体在第k次碰撞到墙壁所对应的镜像位置矩阵M值，Q_i(t)即为所有碰撞时刻镜像位置矩阵乘积。

分别表示位置向量p_i在x轴和y轴上的投影。

(3)无速度反馈的有界空间一致性算法

下面提出控制算法为：

表示x_i的位置估计，

表示

的一阶导数，y_i表示中间变量，u_i表示控制输入，

和

分别表示第i和j智能体的镜像位置，

表示K_i(t)的逆矩阵。

定理1：考虑多智能体动态系统运动方程(5)在公式(14)作用下，如果无向图是连通的，那么在有界空间中，最终各个智能体的位置和速度渐近收敛到一致。

证明：令

y＝[y₁ ^T,y₂ ^T,…,y_n ^T]^T，

其中，

表示第n个智能体在镜像空间中位置，

表示第n个智能体在镜像空间中速度，y_n为中间变量，

表示第n个智能体位置估计，

表示第n个智能体在镜像空间中控制输入。可以得到：

其中，

表示第i个智能体在镜像空间中位置的一阶导数。

表示第i个智能体在镜像空间中速度。

表示第i个智能体在镜像空间中速度的一阶导数。

表示第i个智能体在镜像空间中控制输入。

并且，

则将公式(14)写成如下形式：

其中，I_n为n×n的单位阵，I₂为2×2的单位阵，L为拉普拉斯矩阵。注意到，如果图为无向图，那么L为对称半正定矩阵。

构造如下Lyapunov函数H：

对H求导，

表示一阶导数，得：

根据Kronecker乘法性质，有：

分步合并

得到：

所以，

根据Lasalle不变性定理，当t→∞时，

则：

将公式(25)代入公式(17)，有：

因此，

由于：

其中，η∈R^m×1，1_n＝[1,1,…,1]^T。

根据无向图的性质，有1_n ^TL＝0，则

所以，

则根据(27)，得：

因此，

所以，根据Lasalle不变性定理，当t→∞，有：

(4)多智能体在有界空间中的群集算法

该算法通过设计输入向量u_i(t)，使得多智能体群在追踪虚拟运动目标的过程中逐渐形成群集，并且在这一过程中能够成功避免各个智能体之间发生碰撞，最终实现群集状态下目标跟踪。

在本发明中，每个智能体之间作用是相互的，所以通过用无向图来表示该系统的拓扑结构。无向图G是由顶点集合V＝{1,2,…,n}与边集合

组成的，并且(i,j)＝(j,i)。定义顶点i的邻接集为N_i＝{j∈V|(i,j)∈E}。A＝(a_ij)表示无向图的邻接矩阵，其中，如果(i,j)∈E，则a_ij＝1，否则a_ij＝0。在多智能体群集系统中，如果两个智能体之间存在相互作用，则可以认为它们是相互邻接的，在拓扑结构上表现为相互连通。与图论中邻居集合的定义相似，多智能体系统中邻居集合可以定义成：

N_i＝{j∈E:||p_j-p_i||＜r} (33)

其中，r代表智能体之间最大感应半径，p_i和p_j分别表示第i和j智能体的位置，智能体i与智能体j之间相对距离记成||p_ij||＝||p_i-p_j||。

需要定义两种不一样的势能函数，使得多智能体在有界空间中不仅可以形成群集，同时能够顺利完成避障。为了实现上述目的，要求进行分别控制。首先，针对虚拟空间中多智能体群集，考虑各个智能体的感知半径，当智能体之间距离较远时相互吸引，靠的太近时则又相互排斥。如果超出智能体的感知半径的话，则智能体之间没有相互作用，从而最终使得各个智能体之间的距离大小能够趋向于稳定值。然后，针对在实际空间中的多智能体群集，由于智能体碰到墙壁后反弹时，在虚拟空间中它们即使没有相碰，但是在实际空间中它们也许已经相碰，这不符合实际情况。因此还需要针对实际空间来设计一个新的势能函数，从而达到在实际空间中避障的目的。总的来说，势能函数满足连续、可差分、非负的特性，就能满足实现控制目标的要求。由此，可以定义控制智能体实现群集的势能函数如下：

定义3(虚拟空间中的势能函数)：势能函数

是一个关于多智能体系统中智能体i和智能体j之间距离

的非负、连续可微、无界的函数，并且满足：

在

上，

单调递减；在

上，

单调递增；在

上保持恒值；在

时，

取得唯一的极小值。其中，

表示在镜像空间中智能体之间最小距离。

表示在镜像空间中智能体之间的相对位置。

表示在镜像空间中智能体之间距离。

下面这个例子即满足上述势能函数的所有特性(如图5所示)：

其中，参数

参数

为了实现在实际空间中能够成功避障，还要求在实际空间中建立势能函数。智能体在实际空间中感知半径是r′，当智能体它们之间实际距离在感知半径r′内时，它们之间将表现为排斥。因此定义如下控制智能体在实际空间中的势能函数，从而成功完成避障：

定义4(实际空间中智能体间的势能函数)：势能函数ψ(||p_ij||)是一个关于智能体它们之间实际距离||p_ij||的非负、连续可微、无界函数，并且满足：||p_ij||→r_d时，ψ(||p_ij||)→∞；p_ij||∈(r_d,r]上，ψ(||p_ij||)单调递减；||p_ij||＝r时截止。pi_j表示在实际空间中智能体之间的相对位置。r_d表示在实际空间中智能体之间最小距离。

令参数z＝||p_ij||，可以将实际空间中的势能函数定义如下：

其中，

下面这个例子即满足上述势能函数的所有特性(如图6所示)：

本发明将由定义的势能函数来设计多智能体的控制量u_i，从而操控多智能体在跟踪目标的同时能够逐渐形成群集，并且能够达到有效避障效果。此系统追踪虚拟运动目标所做的是匀速直线运动，且状态用

来表示。其中，

表示在镜像空间中目标智能体的位置。

表示在镜像空间中目标智能体的速度。

根据以下控制要求：(1)多智能体之间逐渐集合，速度一致并且不可以有碰撞发生；(2)多智能体追踪目标，最终和虚拟目标速度大小和方向均一致。因此，可以把u_i分成接下来四个部分来设计：

u_i＝f_i ^α+f_i ^β+f_i ^γ+f_i ^η (37)

其中，f_i ^α是实现多智能体在虚拟空间中形成群集的控制项，f_i ^β是避免多智能体在实际空间中发生碰撞的控制项，f_i ^γ是实现速度达到一致的控制项，f_i ^η是实现目标导航反馈的控制项。各部分具体表达式如下：

其中，c₁,c₂为反馈增益调节项，c₁,c₂＞0。K_i和K_j表示第i和j智能体在所有碰撞时刻镜像矩阵的乘积。

表示梯度函数。

表示在镜像空间中第i和j智能体之间的相对位置。φ(||p_ij||)表示在实际空间中第i和j智能体之间的相对距离函数。

表示在镜像空间中目标智能体r的位置。

表示在镜像空间中目标智能体r的位速度。v_j表示第j个智能体的速度向量。

(5)基于实物机器人平台上的一致性算法

如图2所示，本发明中的Amigo机器人使用的是移动小车模型，其控制量只能为角速度和线速度。因此，本发明还需要将机器人的横、纵坐标控制变量的形式转换成角速度和线速度的形式，从而控制智能机器人。机器人的动态系统为：

其中，ξ_i(t)表示质心位置，

表示质心速度，φ_i(t)表示角位移，

表示角位移的一阶导数，ω_i(t)表示角速度。

为了避免式(39)的非线性，引入坐标变换，即pi＝ξ_i+d[cosφ_i sinφ_i]^T，其中，ξ_i表示质心位置，φ_i表示角位移，d表示控制点偏离质心的距离，d＞0，令：

注：式(40)中，ω_i表示角速度，v_i表示二维速度向量，

表示线速度，为标量；

可以得到：

其中，

表示第i个智能体位置的一阶导数。

根据前面结论，有v_i(t+)＝(I-2n·n^T)v_i(t-)。其中，v_i(t-)和v_i(t+)分别表示第i个智能体速度矢量在t时刻的左极限和右极限。

和

当t＝τ(k)，对于三角形底边，得出φ_i(t+)＝-φ_i(t-)，并且n＝[01]^T，I为单位矩阵，则

因此，

和

对于三角形右斜边，有φ_i(t+)＝-120°-φ_i(t-)和

并且

因此，

和

同理，当t＝τ(k)，对于三角形左斜边来说，有同样的结论，即

实施例1

(1)无速度反馈控制算法仿真分析

本实施例通过数值仿真来验证多智能体在无速度反馈下，最终速度和位置达到一致。本实施例选择10个智能体在矩形区域中运动，智能体的起始位置坐标和速度向量随机选取。对于矩形区域，选择长和宽均为100，顶点坐标分别为(0,0)，(100,0)，(100,100)，(0,100)，求出对应的θ＝{-π/2,π,π/2,0}，法向量n＝{(0,1),(-1,0),(0,-1),(1,0)}，切向量w＝{(-1,0),(0,-1),(1,0),(0,1)}。邻居矩阵

则无向图是连通的。

实验结果如图7～图12所示，图7描述了智能体初始位置和速度，射线方向代表速度方向，长度代表速度大小。图8表示10个智能体的轨迹图，从图中可以看出一开始智能体的轨迹抖动比较厉害，这是因为状态估计中有着微分环节，可以使系统收敛周期缩短。从图9可以看出大约35s左右，智能体的速度趋于一致，起初速度震荡比较明显。图10表示智能体加速度随着时间变化。图11与图12分别表示智能体1与其他9个智能体之间的相对位置，大约60s后各智能体之间的位置差都为0，表示所有智能体汇合到一起。

实施例2

(2)群集控制协同作业方法仿真分析

本实施例通过数值仿真来验证提出的方法的可行性，本实施例在正三角形区域中进行仿真试验。

首先，选择10个智能体在正三角形区域中运动，智能体的起始位置坐标和速度向量随机选取，其中第1个智能体为领导者。对于正三角形区域，正三角形的边长L＝100，顶点坐标分别为(0,0),

(L,0)，可以求出对应的θ＝{-π/2,π/6,5π/6}，法向量

切向量

邻居矩阵

则无向图是连通的。具体仿真结果如图13、图14、图15、图16、图17所示。

实施例3

(3)实物机器人平台上仿真分析

通过使用实物机器人仿真环境来检验算法可行性，使用3个机器人小车，并且控制参数为n＝3,d＝0.02m，采样时间为T＝0.015s，并且初始条件为：

p₁(0)＝[5 2.8]^Tm,p₂(0)＝[5 1.8]^Tm,p₃(0)＝[5 0.8]^Tm

v₁(0)＝120mm/s,v₂(0)＝80mm/s,v₃(0)＝40mm/s

φ₁(0)＝2π/3,φ₂(0)＝5π/6,φ₃(0)＝8π/9

首先，让3个机器人小车在该区域中先自由运行一会儿，使得所有小车都获得一定的初始速度。然后，一致性算法开始作用，虽然3个机器人刚开始的速度不相同，但是经历了几次碰撞后，这些机器人的速度逐渐趋于一致。发现当机器人小车与墙壁碰撞时，发生镜面发射。同时，当增大参数d时，那么机器人小车将缓慢地转弯。相反，如果减小此参数，则机器人将做急转弯，而且变得不稳定，换句话说，即鲁棒性变差。虽然，有时候实际速度方向相互之间不平行，然而它们的镜像速度方向总是平行的。并且，经历许多次与墙壁发生碰撞后，实际速度也逐渐趋向于一致。发现最终机器人将以相同的速度运动。从图18中可以看出，最终的仿真结果和理论证明结果一致。

本发明提供了一种基于有界空间的多智能体协同作业控制方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于有界空间的多智能体协同作业控制方法，其特征在于，包括如下步骤：

步骤1，建立多智能体二阶运动方程；

步骤2，定义镜像速度矩阵和镜像速度；

步骤4，建立多智能体在有界空间中的群集控制方法；

步骤5，建立基于实物机器人的一致性控制方法；

步骤1包括：

分别表示位置的导数和速度的导数；p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合；n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示在t的左极限和右极限；<v_i(t-),n>表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化，矩阵Δ_i(t)被定义为：

而当t≠τ(k)时，有：

说明当智能体与墙壁不接触时，速度连续；

步骤2包括：

步骤2-1，定义如下镜像速度矩阵k_i(t)：

其中，法向单位向量n＝[a,b]^T，w＝[-b,a]^T，并且满足a²+b²＝1；定义k_i(0)＝I^2×2，为单位向量；定义K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))·····k_i(τ(k))，其中k_i(τ(1))，k_i(τ(2))…，k_i(τ(k))分别表示第1次、2次、…、k次碰撞后的值，即令L_i(t)＝-1；

步骤2-2，定义镜像速度