CN113580129B

CN113580129B - 一种基于机器人的多目标协同围捕方法、装置及介质

Info

Publication number: CN113580129B
Application number: CN202110810906.XA
Authority: CN
Inventors: 谭宁; 胡锐坤
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-07-19
Filing date: 2021-07-19
Publication date: 2024-01-16
Anticipated expiration: 2041-07-19
Also published as: CN113580129A

Abstract

本发明公开了一种基于机器人的多目标协同围捕方法、装置及介质，方法包括：构建环境模型以及机器人运动模型；获取所有待围捕目标的位置信息和所有机器人的位置信息；将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟；获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型；根据所述狼群围捕模型控制机器人协同围捕动态的多个目标。本发明能够提高闲置机器人的资源利用率高和效率，可广泛应用于机器人控制技术领域。

Description

一种基于机器人的多目标协同围捕方法、装置及介质

技术领域

本发明涉及机器人控制技术领域，尤其是一种基于机器人的多目标协同围捕方法、装置及介质。

背景技术

相比于单机器人，群机器人系统具有高效率、鲁棒性、可扩展性等优点。多目标协同围捕方法的研究具有实际意义，可以应用到军事目标打击、灾害现场营救等任务上。由于目标会动态躲避，以及环境中存在静态和动态障碍物，多目标协同围捕任务具有复杂性。在多目标协同围捕任务中，有任务分配、群机器人的协同策略、包围猎物等重点子任务。任务分配所需的时间和分配结果，直接影响围捕任务的成功率和效率。好的协同策略可以提高围捕的效率，达到“1+1>2”的效果。

现有的技术方案只能解决单目标任务分配，无法解决更具实际意义的多目标协同围捕问题；然后，现有方案需要大量冗余捕猎机器人，在同一时刻只有部分捕猎机器人移动，其他保持不动，造成资源浪费；最后，该方案只有追击目标行为，没有捕猎机器人之间的协同合作，没有对目标形成包围圈，效率较低。

发明内容

有鉴于此，本发明实施例提供一种基于机器人的多目标协同围捕方法、装置及介质，以提高闲置机器人的资源利用率高和效率。

本发明的一方面提供了一种基于机器人的多目标协同围捕方法，包括：

构建环境模型以及机器人运动模型；

获取所有待围捕目标的位置信息和所有机器人的位置信息；

将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟；

获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型；

根据所述狼群围捕模型控制机器人协同围捕动态的多个目标。

可选地，所述构建环境模型以及机器人运动模型，包括：

获取空间内的所有机器人信息、所有待围捕目标信息以及障碍物信息；

根据所述机器人信息、所述待围捕目标信息以及所述障碍物信息，构建空间集合；

根据所述空间集合构建机器人运动模型；

其中，所述机器人的运动模型的表达式为：

其中，和/>分别是机器人r_i在二维空间R²中x轴和y轴上的位移量；α_i是机器人r_i相对于x轴的角度，/>是α_i的变化量；v_il和v_ir分别是机器人r_i的左轮和右轮线速度；v_ix和v_iy分别是机器人r_i在二维空间R²中x轴和y轴上的速度分量；l是二轮差速机器人的两个车轮之间的长度。

可选地，所述将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟，包括：

根据所述待围捕目标的位置信息和机器人的位置信息，分别计算各个机器人与各个待围捕目标之间的欧式距离；

根据计算得到的所述欧式距离，构建一个输入值矩阵；

将所述输入值矩阵输入至多目标胜者通吃网络中，找出每个目标周围距离最近的捕猎机器人，以确定每个机器人的围捕目标；

将围捕目标相同的机器人组成联盟。

可选地，所述将所述输入值矩阵输入至多目标胜者通吃网络中，找出每个目标周围距离最近的捕猎机器人，以确定每个机器人的围捕目标，包括：

对每个目标使用单目标胜者通吃网络，确定每个目标的优选机器人；

将所有目标的优选机器人组成联盟；

当所述优选机器人同属于多个不同目标时，将该优选机器人分配去围捕最近的目标，并将剩下的优选机器人和其他目标再次构建信息的单目标胜者通吃网络，直至确定所有目标对应的优选机器人。

可选地，所述获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型，包括：

获取每个机器人受到其他目标的第一作用力、受到其他机器人的第二作用力以及受到障碍物的第三作用力；

根据所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息、探测到的障碍物位置信息、所述第一作用力、所述第二作用力以及所述第三作用力，计算每个机器人受到的第一合作用力；

计算每个目标受到的第二合作用力；

根据所述第一合作用力和所述第二合作用力，计算目标和机器人在空间中的移动信息。

可选地，所述第一作用力的表达式为：

所述第二作用力的表达式为：

所述第三作用力的表达式为：

所述第一合作用力的表达式为：

其中，表示第一作用力；/>表示目标对机器人的作用力系数；g(·)表示机器人和目标的交互作用函数；u_i表示机器人在二维空间中的位置；/>表示目标p_j在二维空间中的位置；u_k表示其他机器人在二维空间中的位置；F_i,k表示第二作用力；/>表示机器人之间的作用力系数；g_a(·)表示机器人和其他机器人以及障碍物的交互作用函数；φ_ik表示控制机器人之间交互作用变化的高斯函数；F_i,o表示第三作用力；/>表示障碍物对捕猎机器人的作用力系数；u_o表示障碍物的在二维空间中的位置；φ_io表示控制机器人和障碍物之间交互作用变化的高斯函数；F_i(t)表示第一合作用力；ω_ij表示多目标胜者通吃网络的输出值；/>表示机器人r_i和r_k追捕的目标。

可选地，所述根据所述第一合作用力和所述第二合作用力，计算目标和机器人在空间中的移动信息，包括：

根据所述第一合作用力和所述第二合作用力，计算机器人在运动中的第一加速度和目标在运动中的第二加速度；

根据所述第一加速度计算所述机器人的第一速度，根据所述第二加速度计算所述目标的第二速度；

根据所述第一速度和所述第二速度，确定目标和机器人在空间中的移动信息。

本发明实施例还提供了一种基于机器人的多目标协同围捕装置，包括：

第一模块，用于构建环境模型以及机器人运动模型；

第二模块，用于获取所有待围捕目标的位置信息和所有机器人的位置信息；

第三模块，用于将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟；

第四模块，用于获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型；

第五模块，用于根据所述狼群围捕模型控制机器人协同围捕动态的多个目标。

本发明实施例还提供了一种电子设备，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如前面所述的方法。

本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前面的方法。

本发明的实施例构建环境模型以及机器人运动模型；获取所有待围捕目标的位置信息和所有机器人的位置信息；将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟；获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型；根据所述狼群围捕模型控制机器人协同围捕动态的多个目标。本发明能够提高闲置机器人的资源利用率高和效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的二轮差速机器人模型示意图；

图2为本发明实施例提供的整体步骤流程图；

图3为本发明实施例提供的围捕过程示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

首先，介绍二轮差速机器人的运动学模型，即根据车轮的转动来计算机器人在空间中的位置坐标，如图1所示是二轮差速机器人模型示意图。二轮差速机器人的运动学方程如下所示：

其中，和/>分别是机器人在二维空间R²中x轴和y轴上的位移变化量；α_i是机器人本体相对于x轴的角度，/>是α_i的变化量；v_il和v_ir分别是机器人的左轮和右轮线速度；v_ix和v_iy分别是机器人在二维空间R²中x轴和y轴上的速度分量；l是二轮差速机器人的两个车轮之间的长度。

在建立运动学模型后，使用胜者通吃策略来决定环境中哪些捕猎机器人追捕目标，并控制捕猎机器人的运动。详细过程如下：首先定义一个决策指标

其中，u_i＝(x_i,y_i)和u_p＝(x_p,y_p)分别是捕猎机器人和目标在二维空间的位置坐标。然后使用以下控制公式和胜者通吃策略

其中，是群机器人的位移变化量；z是一个辅助变量，可以随机初始化；v_i是机器人的速度；λ>0是比例因子；/>控制胜者通吃网络的输出值的范围；k是胜者通吃网络的胜者数量，即同一时刻环境中有k个捕猎机器人追捕目标；小于等于第k个决策指标与第k+1个决策指标的差值，用于增强网络中不同个体的决策指标之间的差异性。

在围捕过程中，不断根据胜者通吃策略动态调整群机器人的行为，如静止和追捕等等。在同一时刻，由决策指标较大的k个捕猎机器人追捕目标，从而高效完成协同围捕任务。

本发明提供的面向二轮差速机器人的多目标协同围捕方法的流程图如图2所示。方法包含如下步骤：

1.步骤一：构建未知环境模型、二轮差速机器人运动模型；

2.步骤二：捕猎机器人获取所有目标和其他捕猎机器人的位置信息，将围捕某个目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个捕猎机器人追捕的目标。完成同一任务的多个捕猎机器人组成联盟；

3.步骤三：根据联盟中的捕猎机器人、目标以及探测到的障碍物的位置信息，构建狼群围捕模型；

4.步骤四：基于狼群围捕模型，在未知动态障碍物环境下，群机器人协同围捕动态多目标。步骤一中，构建未知环境模型的过程为：在一个有限的二维空间R²中，存在一个集合T＝{R,P,O}，其中群机器人R＝{r_i|i＝1,2,…,N}包含多个捕猎机器人，r_i为第i个捕猎机器人，N为群机器人总数；目标P＝{p_j|j＝1,2,…,M}，p_j为第i个目标，M为目标总数；障碍物Ω_o＝{o_s|s＝1,2,…,S}，o_s为第s个障碍物，S为障碍物总数；捕猎机器人r_i的位置表示为u_i(t)＝{x_i(t),y_i(t)}，目标p_j的位置表示为障碍物o_s的位置表示为在此环境中，目标动态躲避群机器人的追捕，群机器人的目的是围捕所有目标，即群机器人的多个子联盟包围在所有目标的四周，使得目标没有可逃脱的空间，同时群机器人避免与障碍物及其他捕猎机器人发生碰撞。

步骤一中，二轮差速机器人的运动模型如下所示：

其中，和/>分别是机器人r_i在二维空间R²中x轴和y轴上的位移量；α_i是机器人r_i本体相对于x轴的角度，/>是α_i的变化量；v_il和v_ir分别是机器人r_i的左轮和右轮线速度，且是机器人r_i的最大线速度；v_ix和v_iy分别是机器人r_i在二维空间R²中x轴和y轴上的速度分量；l是二轮差速机器人的两个车轮之间的长度。

步骤二中，使用多目标胜者通吃网络进行任务分配的过程如下：

群机器人获取所有目标和其他群机器人的位置信息，计算出群机器人与不同目标之间的欧式距离，构建一个输入值矩阵

j＝1,…,N

i＝1,…,M

其中，d_i＝[d_i1,d_i2,…,d_iN]是群机器人与目标p_j的欧氏距离向量，d_ij是捕猎机器人r_i与目标p_i之间的欧式距离。

将群机器人和目标的距离输入多目标胜者通吃网络中，找出每个目标周围距离最近的捕猎机器人，以此确定每个捕猎机器人所追捕的目标，完成任务分配，围捕一个目标视为一个任务。完成同一个任务的捕猎机器人组成一个联盟。

对于单个目标的胜者通吃网络如下所示：

其中，t表示时间；z_j是对于目标p_j的胜者通吃网络中中的辅助变量，可以初始化为随机值；λ>0是比例因子；k_j表示围捕目标p_j所需的捕猎机器人的数量；ω_ij是胜者通吃网络的输出值，标识“胜者”和“输者”；当ω_ij＝1，捕猎机器人r_i是“胜者”，捕猎机器人r_i被分配去追捕目标p_j；当ω_ij＝0，捕猎机器人r_i是“输者”。严格小于等于第k个最小距离值与第k+1个最小距离值的差值，用于增强网络中不同距离值之间的差异性。

多目标胜者通吃网络的具体过程为：首先，对每个目标使用单目标胜者通吃网络，得到追捕每个目标的“胜者”。“胜者”组成联盟，协同围捕该目标。然后检查是否某个捕猎机器人同时是多个网络的“胜者”，若是，将此捕猎机器人分配去追捕最近的目标。将输者和目标构建新的胜者通吃网络，再次迭代。最后，确保分配去追捕目标p_j的捕猎机器人的数量满足k_j，以及每个捕猎机器人追捕单一目标。

步骤三中，构建狼群围捕模型的过程如下：

捕猎机器人r_i受到的目标、其他捕猎机器人和障碍物的作用力，如下所示

g(x)＝g_a(x)-g_r(x)

其中，F_i(t)是捕猎机器人r_i在时刻t受到的合作用力；是捕猎机器人r_i在时刻t受到目标p_j的作用力；F_i,k(t)是捕猎机器人r_i在时刻t受到其他捕猎机器人r_k的作用力；F_i,o(t)是捕猎机器人r_i在时刻t受到障碍物o_s的作用力；ω_ij是多目标胜者通吃网络的输出值；/>表示捕猎机器人r_i和r_k追捕同一个目标，/>表示捕猎机器人r_i和r_k追捕不同目标；/>是目标对捕猎机器人的作用力系数；/>是捕猎机器人之间的作用力系数；/>是障碍物对捕猎机器人的作用力系数；g(·)表示机器人和目标的交互作用函数；g_a(·)表示机器人和其他机器人以及障碍物的交互作用函数；u_i、u_k、/>和u_o分别表示捕猎机器人r_i、捕猎机器人r_j、目标p_j和障碍物o_s的在二维空间中的位置；φ_ik表示控制机器人之间交互作用变化的高斯函数；φ_io表示控制机器人和障碍物之间交互作用变化的高斯函数；d_c表示机器人和目标的安全距离；当两个捕猎机器人和目标的距离均为d_a时，它们之间的作用力达到最大值，以驱使捕猎机器人形成包围圈；R_i表示捕猎机器人r_i和目标的距离；R_k表示捕猎机器人r_k和目标的距离；R_o表示障碍物和目标的距离。

目标受到群机器人和障碍物的作用力，如下所示

其中，是目标p_j在时刻t受到的合作用力；/>是目标p_j在时刻t受到的合作用力；/>是目标p_j在时刻t受到障碍物o_s的作用力；当捕猎机器人r_i在目标p_j的感知范围内时，/>否则/>是群机器人对目标的作用力系数；/>是障碍物对群机器人的作用力系数；u_i、/>和u_o分别表示捕猎机器人r_i、目标p_j和障碍物o_s的在二维空间中的位置。

计算得到捕猎机器人和目标所受到的合作用力F_i(t)，基于牛顿第二定律的思想计算出群机器人和目标的加速度进而得到速度v_i(t)。速度v_i(t)分解为分别沿x轴和y轴的速度分量v_ix和v_iy，根据步骤一的运动模型驱动群机器人和目标在二维空间中移动。公式如下所示

其中，表示群机器人和目标在时刻t的位置变化量；v_i(t)和/>表示在时刻t的速度和加速度；m_i表示群机器人和目标的质量。

图3为本发明实施例的围捕过程示意图。图中描绘了围捕过程中捕猎机器人和目标的运动轨迹，圆圈表示个体的初始位置，星型表示个体的最终位置，黑色矩形表示障碍物。红色实线为目标的运动轨迹，蓝色虚线为捕猎机器人的运动轨迹。环境中有2个目标和若干障碍物，由8个捕猎机器人完成协同围捕任务，分配4个捕猎机器人围捕每个目标。

初始时，8个捕猎机器人分为2组，分布在环境的左下方和右上方，2个目标在环境中央区域。随着捕猎机器人靠近目标，捕猎机器人根据多目标任务分配网络进行任务分配，重新组成围捕联盟，每个捕猎机器人追捕最近的目标，以达到围捕效率最大化。在追捕过程中，狼群围捕模型控制捕猎机器人有效躲避障碍物，以及避免捕猎机器人之间的碰撞。在最后的包围阶段，一个联盟中的4个捕猎机器人能够均匀分布在目标周围，使目标无法逃跑。

综上所述，本发明提出的多目标协同围捕方法，可以解决在动态变化环境下多目标围捕问题。本发明使用的多目标胜者通吃网络可快速高效完成多目标的任务分配，根据决策指标实时调整任务分配结果，提高围捕效率。本发明使用的狼群围捕模型的规则简单，同时可以完成复杂的围捕任务，自发形成追捕、协同包围目标等行为。通过替换决策指标和机器人的运动学模型，本发明可以快速迁移到不同场景和机器人上。

本发明根据决策指标，使用多目标胜者通吃网络完成多目标任务分配。群机器人组成动态调整的子联盟，分别围捕不同目标，提高围捕效率。本发明还基于简单的规则构造狼群围捕模型。根据临近物体和目标的位置信息，狼群围捕模型控制群机器人协同围捕多个目标，以及在未知的动态的环境中躲避障碍物。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种基于机器人的多目标协同围捕方法，其特征在于，包括：

构建环境模型以及机器人运动模型；

获取所有待围捕目标的位置信息和所有机器人的位置信息；

根据所述狼群围捕模型控制机器人协同围捕动态的多个目标；

所述获取所述联盟中对应的围捕目标的位置信息、每个机器人的位置信息以及探测到的障碍物位置信息，构建狼群围捕模型，包括：

计算每个目标受到的第二合作用力；

2.根据权利要求1所述的一种基于机器人的多目标协同围捕方法，其特征在于，所述构建环境模型以及机器人运动模型，包括：

根据所述空间集合构建机器人运动模型；

其中，所述机器人的运动模型的表达式为：

3.根据权利要求1所述的一种基于机器人的多目标协同围捕方法，其特征在于，所述将围捕某个待围捕目标视为一个任务，通过多目标胜者通吃网络进行任务分配，以确定每个机器人的围捕目标，并将围捕目标相同的机器人组成联盟，包括：

根据计算得到的所述欧式距离，构建一个输入值矩阵；

将围捕目标相同的机器人组成联盟。

4.根据权利要求3所述的一种基于机器人的多目标协同围捕方法，其特征在于，所述将所述输入值矩阵输入至多目标胜者通吃网络中，找出每个目标周围距离最近的捕猎机器人，以确定每个机器人的围捕目标，包括：

将所有目标的优选机器人组成联盟；

5.根据权利要求1所述的一种基于机器人的多目标协同围捕方法，其特征在于，

所述第一作用力的表达式为：

所述第二作用力的表达式为：

所述第三作用力的表达式为：

所述第一合作用力的表达式为：

其中，表示第一作用力；/>表示目标对机器人的作用力系数；g(·)表示机器人和目标的交互作用函数；u_i表示机器人在二维空间中的位置；/>表示目标p_j在二维空间中的位置；u_k表示其他机器人在二维空间中的位置；F_i,k表示第二作用力；/>表示机器人之间的作用力系数；g_a(·)表示机器人和其他机器人以及障碍物的交互作用函数；φ_ik表示控制机器人之间交互作用变化的高斯函数；F_i,o表示第三作用力；/>表示障碍物对捕猎机器人的作用力系数；u_o表示障碍物的在二维空间中的位置；φ_io表示控制机器人和障碍物之间交互作用变化的高斯函数；F_i(t)表示第一合作用力；ω_ij表示多目标胜者通吃网络的输出值；表示机器人r_i和r_k追捕的目标；N表示群机器人总数；M表示目标总数；Ωo＝{o_s|s＝1,2,…,S}，其中，Ωo表示障碍物的集合，o_s表示第s个障碍物，S表示障碍物总数。

6.根据权利要求1所述的一种基于机器人的多目标协同围捕方法，其特征在于，所述根据所述第一合作用力和所述第二合作用力，计算目标和机器人在空间中的移动信息，包括：

7.一种基于机器人的多目标协同围捕装置，其特征在于，包括：

第一模块，用于构建环境模型以及机器人运动模型；

第五模块，用于根据所述狼群围捕模型控制机器人协同围捕动态的多个目标；

所述第四模块，具体用于获取每个机器人受到其他目标的第一作用力、受到其他机器人的第二作用力以及受到障碍物的第三作用力；

计算每个目标受到的第二合作用力；

8.一种电子设备，其特征在于，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如权利要求1-6中任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有程序，所述程序被处理器执行实现如权利要求1-6中任一项所述的方法。