CN111123971A

CN111123971A - 一种基于多智能体在有界陌生地域编队部署的方法

Info

Publication number: CN111123971A
Application number: CN201911212636.1A
Authority: CN
Inventors: 朱德政; 宦国杨; 朱维超; 于翔; 房展; 蔡雨琦; 曲跃光
Original assignee: CETC 28 Research Institute
Current assignee: CETC 28 Research Institute
Priority date: 2019-12-02
Filing date: 2019-12-02
Publication date: 2020-05-08
Anticipated expiration: 2039-12-02
Also published as: CN111123971B

Abstract

本发明提供了一种基于多智能体在有界陌生地域编队部署的方法，通过无线传感器网络协调控制各智能体进行编队部署，确保各智能体能够异步完成任务，大大提高了系统的工作效率。针对多智能体在有界空间中的运动，提出了二阶动态系统的一致性算法。传统的有界空间一致性算法只适合矩形有界空间，对于不规则的空间不再适用。为了将已有的一致性算法扩展到不规则的有界空间，通过引入镜像速度和镜像位置，把先前无限大空间的双积分控制算法推广到有界空间里。借助镜像矩阵将不连续的实际速度转化成连续的镜像速度，并且镜像矩阵也适合非矩形区域，更具有一般性。同时为了限制控制输入，引入了饱和控制，最终多智能体速度和位置渐进收敛到一致。

Description

一种基于多智能体在有界陌生地域编队部署的方法

技术领域

本发明属于指挥控制领域，特别涉及一种基于多智能体在有界陌生地域编队部署的方法。

背景技术

随着科学计算的快速发展，运用当今科技去处理复杂问题的需求对于人们来说越来越迫切。然而人们发现仅仅通过个体去解决一些复杂问题会越来越棘手，不但在专业技术层面上严格要求，并且很多问题需要许多个体密切协作才能解决。

在军事方面，如今的军事更加重视信息化，对于一个规模比较大的系统都可以由许多小的局部互相通信的智能体构成，如何通过智能体之间的合理协调来完成一个任务，这就成为多智能体系统协作控制的研究内容。在实际环境中，当对某个不明的区域侦查、搜索时，如果使用一个由结构单一，功能少的小型机器人构成的编队将会比一个由结构复杂，功能多的大型机器人带来更好的效果，对于一个群体来说，可以允许某些机器人发生故障，通过合理组织就可以让他们继续有效的工作，但是对于大型机器人来说，任何一个故障都是致命的，所以小型机器人组将有更佳的鲁棒性和更强的容错率。

多智能体系统的思想起源于人工智能理论，一开始是用来克服个体在解决比较困难实际问题中的不足，使得通过用简单的多智能体的共同控制替换单个个体的控制。如今它成为发展非常快的一门控制科学，涉及的领域也很广泛，比如人工智能、生物、机器人等新兴领域，并且在这些领域里面得到了广泛的应用，比如编队控制，无人驾驶飞行器的协作控制。该系统是一类开放的，复杂的分布式系统，通过个体之间相互作用和局部协作而形成的具有自主性，协调性，分布性的系统，并且具有一定的推理能力，学习能力以及组织能力。更重要的是，局部相互作用只需要每个个体获得其邻居信息，而不需要拥有整个系统的全部信息，最后通过这些局部信息来更新自己的行为。

因为广泛运用的多智能体系统和深入探讨的编队与合作控制问题，多智能体系统得到了迅速的发展和研究，因此在理论和应用上分别取得了很大的收获，可以解释日常生活中出现的蜂拥现象，例如，蚂蚁在觅食时会协同工作；鱼群在海洋里面结队巡游；大雁迁徙时会排出一致的队形，同时在遇到特殊情形时能够改变队形；细菌群落的聚集生存等。对于这些生物来说，无论在运动方面，还是在视觉能力方面，都是受限的，然而它们之间通过一些信息交流就能形成一定规模的群体，以至于克服了他们自身在这些方面的缺陷，从而有效地完成运动，迁徙等任务。

多智能体系统控制目前主要应用在多机器人协作控制、无线传感器网络协调控制以及无人飞行器编队控制领域，然而多智能体系统控制合作的一个重要的方面即为一致性问题。如今一致性问题研究的一个非常重要模型为二阶系统，二阶系统不同于一阶系统主要是因为二阶系统不仅考虑了位移方面，而且还考虑了速度方面。虽然一致性问题已经得到了广泛的研究，取得了大量的研究成果，但是很多问题都是基于无穷大区域研究的。然而，如今许多实际行为是在有界空间里发生的，比如，在有界空间的逃生，公共交通系统等。而且，许多工程应用也是在有界空间里面进行的，例如，多智能体协同在有界空间里面完成复杂任务，编队控制等。虽然先前的有些多智能体控制算法可以运用到有界空间，但只能在矩形空间里，对于非矩形区域不再适用。此外，在有界空间中，在边界的折返运动往往产生极大的控制信号，然而许多实际工程系统，由于物理上的限制，输入信号总是会面临着饱和。通过限制输入的大小，因此在实际系统中更加实用。

总之，多智能体理论在军事、社会、工业、经济等领域的进步也具有重大的意义，如今处于信息化时代，多智能体系统取得的成就可以在工业系统的发展中被广泛地应用，同时可以获得很多社会效益；对多智能体系统的探讨能够关系到社会规律和各类现象，因此会在社会生活中有着巨大的影响。而且由于多智能体在有界空间中的合作控制有着分布式特点，在单个个体层面上仅仅需要每一个智能体具备有限的计算、信息采集、通讯等功能，从而设计比较简单，而在群体层面上则能表现出复杂的协调配合和智能行为，并且能够实现单个个体不能完成的各种艰巨的或者精度高的任务，而且在实际运用中不需要设计很复杂的程序，也不用很昂贵的成本。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于多智能体在有界陌生地域编队部署的方法，包括如下步骤：

步骤1，建立多智能体二阶运动方程；

步骤2，定义镜像速度矩阵和镜像速度；

步骤3，建立有界空间中一致性控制算法；

步骤4，根据步骤3建立的算法对多智能体在有界陌生地域进行编队部署。

步骤1包括：设定一组智能体在正三角形区域中运动，建立笛卡尔坐标系，坐标原点为正三角形的左下角顶点，x轴沿着正三角形的底边方向指向右方，建立如下多智能体二阶运动方程：

其中，i∈{1,2，...,n}表示智能体编号，p_i、v_i、u_i分别代表位置向量、速度向量和输入向量，并且随着时间t而变化。

分别表示位置的导数和速度的导数。p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合。n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示在t时刻速度的左极限和右极限，v_i(t-)＝lim_s→t-v_i(s)，v_i(t+)＝lim_s→t+v_i(s)；＜v_i(t-),n＞表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化。

步骤1中，矩阵Δ_i(t)被定义为：

其中，δ为Dirac函数，k表示第k次碰撞，τ(k)表示第k次碰撞时刻。

步骤1中，当t＝τ(k)时，有：

其中，

表示在碰撞时刻t，对u_i进行积分。

表示在碰撞时刻t，对Δ_i进行积分。s表示积分变量，I表示单位向量。

根据碰撞关系，有：

当t＝τ(k)时，智能体与墙壁发生镜面碰撞，v_i(t-)和v_i(t+)分别为入射方向和反射方向，速度不再连续；

当t≠τ(k)时，有：

说明当智能体与墙壁不接触时，速度连续。

步骤2包括：

步骤2-1，用w表示垂直于n的单位向量，同时(n,w)满足右手规则，使得n×w方向垂直于纸面指向外；θ表示n与x轴之间的夹角，满足右手规则，并且n×x方向垂直于纸面朝向外则角度是正，反之是负；v_i(t-)表示接触之前的速度向量，v_i(t+)表示接触之后的速度向量，即前面所述的左极限和右极限；定义符号变量L_i(t)，接触之前为1，接触之后为-1；

步骤2-2，定义镜像速度矩阵k_i(t)：

其中，法向单位向量n＝[a,b]^T，w＝[-b,a]^T，并且满足a²+b²＝1；定义k_i(0)＝I^2×2，为单位向量；定义K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))……k_i(τ(k))，其中k_i(τ(1))，k_i(τ(2))…，k_i(τ(k))分别表示第1次、2次、…、k次碰撞后的值，即令L_i(t)＝-1；

步骤2-3，定义镜像速度

则当t＝τ(k)时，有：

即当t＝τ(k)时，实际速度v_i(t)不是连续的，对于镜像速度

来说，总是连续的。

和

分别是

在s＝t的左极限和右极限。

步骤2-3中，对于直线l:Ax+By+C＝0，A²+B²≠0，点M(x₀,y₀)关于直线l的对称点的坐标是N(x₁,y₁)，则有：

写成矩阵形式为：

其中，

即为镜像位置矩阵；

定义各个智能体镜像位置，有

其中，镜像位置

分别表示镜像位置

在x轴和y轴上的投影，Q_i(t)＝q_i(0)·q_i(τ(1))·q_i(τ(2))……q_i(τ(k))，q_i(t)∈R^3×3，q_i(0)＝I^3×3，并且q_i(τ(k))表示第i个智能体在第k次碰撞到墙壁所对应的镜像位置矩阵M值，Q_i(t)即为所有碰撞时刻镜像位置矩阵乘积。

分别表示位置向量p_i在x轴和y轴上的投影。

步骤3包括：建立有界空间中一致性控制算法：

其中，u_i(t)表示控制输入，

表示逆矩阵，a_ij表示加权系数，

表示镜像位置。K_j(t)表示第j个智能体的镜像速度矩阵；v_j(t)表示第j个智能体速度。

定义镜像加速度

根据镜像位置矩阵和镜像速度，得到：

由于

其中

表示符号函数L_i(t)的导数。则当t＝τ(k)时，对

求导，得：

由于a²+b²＝1，则：

因此，

计算k_i(t)的行列式，为：

因此，k_i(t)可逆，而K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))…，所以K_i(t)也可逆；

由

得到：

通过引入势能函数H(t)：

对其求导，得：

根据：

因此，

由于无向图是连通的，根据LaSalle不变性定理，得到：

即当t→∞时，

代入如下公式中：

则有镜像控制输入

令

T表示转置，

表示

转置。任意η∈R^m×1表示m×1维列向量，定义1_n＝[1,1,…,1]^T，并且

表示Kronecker积，则：

因为

所以

则

正交于

并且由于η的任意性，因此

则

有：

因为

所以

得：

根据LaSalle不变性定理，当t→∞时，有：

因此，对于正三角形空间来说，在镜像空间里面的点在实际空间中都有唯一的点与之对应，因此当多智能体在镜像空间中一致时，此时实际空间也达到了一致。

有益效果：本发明具有以下优点：本发明基于多智能体在有界陌生地域编队部署，提出了有界空间中一致性算法。针对多智能体在非矩形有界空间中的运动，传统的有界空间一致性算法只适合矩形有界空间，对于非矩形有界空间不再适用。本发明提出二阶动态系统的一致性算法，将已有的一致性算法扩展到非矩形空间，通过引入镜像速度矩阵的概念，不仅将不连续的实际速度转化成连续的镜像速度，而且将有界空间扩展成无限大虚拟空间。运用此算法，发现多智能体在虚拟空间中镜像速度渐近一致。

附图说明

下面结合附图和具体实施方式对本发明做更进一步的具体说明，本发明的上述和/或其他方面的优点将会变得更加清楚。

图1是入射速度、反射速度及镜像速度之间关系图。

图2是智能体编队区域为正三角形区域。

图3是智能体编队区域为正六角形区域。

图4是正三角形区域坐标系。

图5是碰撞面入射向量和反射向量关系图。

图6是正三角形区域10个智能体初始位置及速度。

图7是正三角形区域10个智能体的轨迹图。

图8是正三角形区域10个智能体的速度。

图9是正三角形区域10个智能体的加速度。

图10是正三角形区域智能体1与其他智能体的x轴相对位置。

图11是正三角形区域智能体1与其他智能体的y轴相对位置。

图12是是椭圆区域10个智能体初始位置及速度。

图13是椭圆区域10个智能体的轨迹。

图14是椭圆区域10个智能体的速度。

图15是椭圆区域10个智能体的加速度。

图16是椭圆区域智能体1与其他智能体的x轴相对位置。

图17是椭圆区域智能体1与其他智能体的y轴相对位置。

具体实施方式

一般地，针对多智能体一致性系统的研究，通常用图的形式来描述系统的拓扑结构，即智能体与邻居之间的通信关系，接下来将主要介绍一些关于图和矩阵方面的性质。

根据代数图形理论，多智能体网络系统拓扑结构使用图G＝(V,ε)来表示，其中，顶点集合用V＝{1,2,…,n}来表示，边的集合由ε∈V×V构成。节点编号为i∈{1,2,…,n}。如果信息交换发生在第i个节点与第j个节点之间，此时说明有相连的边在这个节点对之间。由于节点对在无向图里是无序的，所以在节点之间的边是无向的，即

其中v_j表示第j个节点，v_i表示第i个节点，但是对于有向图来说，由于边不一定完全连通，因此若在第i个节点与第j个节点之间有边指向并不能说明第j个节点与第i个节点有边指向，也就是说它们之间是有向边。如果在图G里，任何两个节点之间都有连接的边，那么图G则是完全图。在有向图中，v_i的出度是指由节点v_i开始的边的数目，v_i的入度是指指向节点v_i的边的数目。若(v_i,v_j)∈E，那么称节点v_j为节点v_i的邻居。定义N_i＝{v_j∈V:(v_i,v_j)∈E}作为节点v_i的邻居集合。然而，在图中可能存在节点v_i到其自身的边，即(v_i,v_i)，则称节点v_i存在自环，但是在本发明中的描述中，不考虑这样的边。

智能体之间的耦合程度往往在多智能体系统中需要通过对通讯的边赋予权值来刻画，拓扑图之间的连接结构通过引入邻接矩阵A＝(a_ij)∈R^n×n来描述，其中a_ij表示权值，R^n×n表示n×n矩阵。连接此时相应的图就变为加权图。如果i≠j，那么当智能体i可以接收到智能体j的通讯信号时，此时a_ij＞0；否则a_ij＝0。定义入度矩阵D＝(d_ii)，其中

如果加权矩阵A均为0或1，即：

因此，若图G为对称图，那么矩阵A对称。

如果加权值更为特殊，即定义为

其中，w_ij是边(v_i,v_j)的权值，那么指向节点v_i全部边的权值相加是节点v_i的入度；同理，离开节点v_i全部边的权值相加是节点v_i的出度。

人们在研究多智能体的一致性过程时，引入了拉普拉斯矩阵L，定义为：

即L＝D-A。通过研究拉普拉斯矩阵的性质，可以得到图特征与多智能体系统一致性之间的关系。

有界空间中一致性问题描述：对于n个智能体，第i个智能体的值用x_i表示，它可以用来表示电压，温度，高度，位置等。

定义1：称节点i与节点j在网络拓扑中达到一致，当且仅当x_i＝x_j,i≠j；如果任何两个节点i和j都有x_i＝x_j,i≠j，那么称该拓扑达到一致性。

定义2：称二阶多智能体系统达到一致性，当且仅当针对任意节点随着时间t→∞都有：

这里首先考虑一组智能体在正三角形区域中运动，如图4所示是建立的笛卡尔坐标系，坐标原点为正三角形的左下角顶点，x轴沿着底边方向指向右方。

不失一般性，设定时间序列0＜τ(1)＜τ(2)＜…是多智能体碰撞到墙壁时刻。建立运动方程如下：

其中，i∈{1,2，...,n}表示智能体编号，p_i、v_i、u_i分别代表位置向量、速度向量和输入向量，并且随着时间t而变化；

分别表示位置的导数和速度的导数；p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合；n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示在t时刻速度的左极限和右极限，v_i(t-)＝lim_s→t-v_i(s)，v_i(t+)＝lim_s→t+v_i(s)；＜v_i(t-),n＞表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化，矩阵Δ_i(t)被定义为：

其中，δ为Dirac函数。

当t＝τ(k)时，有：

从图5可以得到如下关系：

这意味着，当t＝τ(k)时，发生了镜面碰撞，v_i(t-)和v_i(t+)分别为入射方向和反射方向，速度不再连续。

而当t≠τ(k)时，有

说明当和墙壁不接触时，速度连续。

w表示垂直于n的单位向量，同时(n,w)满足右手规则，使得n×w方向垂直于纸面指向外。θ表示n与x之间的夹角，满足右手规则，并且n×x方向垂直于纸面朝向外则角度是正，反之是负。v_i(t-)表示接触之前的速度向量，v_i(t+)表示接触之后的速度向量。定义符号变量L_i(t)，接触之前为1，接触之后为-1。具体如图1所示：

定义镜像速度矩阵：

其中n＝[a,b]^T,w＝[-b,a]^T，并且满足a²+b²＝1。k_i(0)＝I^2×2，K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))……k_i(τ(k))，其中k_i(τ(1))，k_i(τ(2))…为碰撞后的值，即令L_i(t)＝-1。

定义镜像速度：

则当t＝τ(k)时，有：

也就是说，当t＝τ(k)时，实际速度v_i(t)不是连续的，然而对于镜像速度

来说，总是连续的。

对于直线l:Ax+By+C＝0(A²+B²≠0)，M(x₀,y₀)关于直线l的对称点的坐标是N(x₁,y₁)，则有

写成矩阵形式为：

其中，

即为镜像位置矩阵。

定义各个智能体镜像位置，有

其中

Q_i(t)＝q_i(0)·q_i(τ(1))·q_i(τ(2))·····q_i(τ(k))，q_i(t)∈R^3×3，q_i(0)＝I^3×3，并且q_i(t)的值即为智能体i所碰撞到的某一个墙面所对应的镜像位置矩阵M值。

注意到智能体的实际位置与其镜像位置关于碰撞点所在的切线镜像对称。对于实际有界空间以及边界上的某一个边界碰撞点，定义该有界空间中所有实际点关于此碰撞点所得到的镜像位置点集合作为此碰撞点的第Ⅰ层镜像空间。显然，对于不同的碰撞点，可能得到相同或不同的镜像空间，这个依赖于有界空间的几何特性。当然，对于边界上的某些点可能存在不唯一的切线，这些边界点称作奇点，这些点不作考虑。相似地，对于第Ⅰ层镜像空间以及此镜像空间中的边界碰撞点，可以定义该实际空间的第Ⅱ层镜像空间。借助该方法，可以依次定义第Ⅲ层空间，第Ⅳ层空间，……。把所有层次的镜像空间的集合称作该实际有界空间的镜像展开。具体如图2、图3所示。

对于本发明中的有界空间，做如下条件：

条件1：在镜像展开中的镜像点能够唯一映射到实际空间中的实际点。

(3)有界空间中一致性算法

下面提出控制算法为：

定理1：对于满足条件1的有界空间，考虑多智能体动态系统在公式(14)的作用下，如果无向图是连通的，那么在有界空间中，最终各智能体位置和速度渐近收敛到一致。

证明过程如下：首先，定义镜像加速度：

镜像位置和镜像速度分别在之前已定义，为

显然，

由于

则当t＝τ(k)时，对

求导，得：

由于a²+b²＝1，则

因此，

计算k_i(t)的行列式，为：

因此，k_i(t)可逆，而K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))…，所以K_i(t)也可逆。

由

可得：

引入势能函数：

求导，得：

然而，

因此，

由于无向图是连通的，根据LaSalle不变性定理，有

即当t→∞时，

那么代入(21)，则有

令

任意η∈R^m×1，1_n＝[1,1,…,1]^T，并且

表示Kronecker积，则

因为

所以

则

正交于

并且由于η的任意性，因此

则

有

因为

所以

得

因此，根据LaSalle不变性定理，当t→∞时，有

显然，对于正三角形空间来说，在镜像空间里面的点在实际空间中都有唯一的点与之对应，因此当多智能体在镜像空间中一致时，此时实际空间也达到了一致。

实施例

本实施例中进行仿真分析，在这部分，通过数值仿真来验证提出的算法可行性，分别在正三角形和椭圆中进行了仿真。

本文中选取n＝10，智能体的起始位置坐标和速度向量随机选取。对于正三角形区域，正三角形的边长L＝100，顶点坐标分别为(0,0),

(L,0)，可以求出对应的θ＝{-π/2,π/6,5π/6}，法向量

切向量

选取邻居矩阵

则无向图是连通的。

在三角形区域仿真结果如图6～图11所示，图6表示智能体的初始位置和速度，射线的方向表示速度方向，长度表示速度大小。10个智能体的轨迹图如图7所示。从图8可以看出大约100s，智能体的速度趋于一致，图9表示加速度随时间的变化，由于加入了饱和控制，可以将加速度限制在适当的范围，以免加速度过大。图10与图11分别表示智能体1与其他9个智能体之间的相对位置，大约100s后各智能体之间的位置差都为0，表示所有智能体汇合到一起。

然后，在椭圆区域中进行仿真，如图12～图17所示。由于在椭圆区域里，镜像区域里的点不能唯一映射到实际区域里的点。最终得出即使镜像空间中位置收敛到一致，但是实际空间中位置却不能。然而，所有智能体的速度仍然收敛到一致。

以此类推，可以将算法推广到任意空间中，各个智能体速度最终将会保持一致，从而实现编队部署。在实际部署时，经常遇到智能体在陌生地域进行作业，可以通过建立各个智能体之间的通信，实时获取邻居信息，从而分布式计算出自身速，并且还能通过位置势能函数控制各个智能体之间距离，最终保持一定的队形。

本发明提供了一种基于多智能体在有界陌生地域编队部署的方法，具体实现该技术方案的方法和途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

1.一种基于多智能体在有界陌生地域编队部署的方法，其特征在于，包括如下步骤：

步骤1，建立多智能体二阶运动方程；

步骤2，定义镜像速度矩阵和镜像速度；

步骤3，建立有界空间中一致性控制算法；

2.根据权利要求1所述的方法，其特征在于，步骤1包括：设定一组智能体在正三角形区域中运动，建立笛卡尔坐标系，坐标原点为正三角形的左下角顶点，x轴沿着正三角形的底边方向指向右方，建立如下多智能体二阶运动方程：

分别表示位置的导数和速度的导数；p_i＝[p_i ^x,p_i ^y]^T,v_i＝[v_i ^x,v_i ^y]^T,u_i＝[u_i ^x,u_i ^y]^T∈R²，上标分别表示x轴和y轴，p_i ^x,p_i ^y分别表示位置向量p_i在x轴和y轴上的投影，v_i ^x,v_i ^y分别表示速度向量v_i在x轴和y轴上的投影，u_i ^x,u_i ^y分别表示输入向量u_i在x轴和y轴上的投影；R表示实数集合；n表示法向单位向量，方向指向正三角形内；v_i(t-)和v_i(t+)分别表示在t时刻的左极限和右极限；＜v_i(t-),n＞表示内积；Δ_i(t)是碰撞矩阵，并且在碰撞瞬间发生变化。

3.根据权利要求2所述的方法，其特征在于，步骤1中，矩阵Δ_i(t)被定义为：

4.根据权利要求3所述的方法，其特征在于，步骤1中，当t＝τ(k)时，有：

其中，

表示在碰撞时刻t，对u_i进行积分；

表示在碰撞时刻t，对Δ_i进行积分；s表示积分变量，I表示单位向量；

当t≠τ(k)时，有：

说明当智能体与墙壁不接触时，速度连续。

5.根据权利要求4所述的方法，其特征在于，步骤2包括：

步骤2-1，用w表示垂直于n的单位向量，同时(n,w)满足右手规则，使得n×w方向垂直于纸面指向外；θ表示n与x轴之间的夹角，满足右手规则，并且n×x方向垂直于纸面朝向外则角度是正，反之是负；v_i(t-)表示接触之前的速度向量，v_i(t+)表示接触之后的速度向量，即左极限和右极限；定义符号变量L_i(t)，接触之前为1，接触之后为-1；

步骤2-2，定义镜像速度矩阵k_i(t)：

其中，法向单位向量n＝[a,b]^T，w＝[-b,a]^T，并且满足a²+b²＝1；定义k_i(0)＝I^2×2，为单位向量；定义K_i(t)＝k_i(0)·k_i(τ(1))·k_i(τ(2))·····k_i(τ(k))，其中k_i(τ(1))，k_i(τ(2))…，k_i(τ(k))分别表示第1次、2次、…、k次碰撞后的值，即令L_i(t)＝-1；

步骤2-3，定义镜像速度