CN113268893A

CN113268893A - 基于连通保持约束的群体围捕方法及装置

Info

Publication number: CN113268893A
Application number: CN202110811042.3A
Authority: CN
Inventors: 丘腾海; 王乐乐; 蒲志强; 刘振; 易建强; 常红星
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2021-07-19
Filing date: 2021-07-19
Publication date: 2021-08-17
Anticipated expiration: 2041-07-19
Also published as: CN113268893B

Abstract

本发明提供一种基于连通保持约束的群体围捕方法及装置，方法包括：基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；执行搜索指令以对区域进行目标搜索，若发现目标，则根据目标计算个体收益，并在个体收益小于或等于预设阈值时，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。本发明在通信保持约束条件下，同时考虑群体间各智能体与探测目标的作用，建立群体分布式协商机制，以实现群体无冲突的任务分配，进而快速围捕目标。

Description

基于连通保持约束的群体围捕方法及装置

技术领域

本发明涉及任务分配技术领域，尤其涉及一种基于连通保持约束的群体围捕方法及装置。

背景技术

无人群体围捕是指无人车、无人机和机器人等无人群体系统通过相互协同，共同完成对单目标或多目标的围捕，相较于单体系统，无人群体系统具有更强的鲁棒性、扩展性和灵活性，能够更加快速完成大规模复杂任务。无人群体围捕可用于军事作战、城市反恐、安防警戒，其对于群体对抗、队形保持、协同搬运等具有很大影响，在军事和民用等领域具有重要的研究价值和意义深远。

实现无人群体围捕的挑战在于在考虑智能体探测范围和通信范围有限条件下如何分配目标，不但需要保障群体间的通信连通，还需要考虑群体如何在避碰的情况下围捕目标，另外还涉及群体间的协商问题，在遇到多个目标或者智能体自身能力不足的情况下，如何判断是否发出或者响应邻居智能体的支援请求，而且要求围捕算法响应时间短，否则群体尚未开始围捕，目标已经逃离等问题。

目前存在不少群体任务分配、任务规划等相关工作，然而现有算法存在一些明显不足，比如围捕场景考虑的条件较为简单且理想，一般默认群体中个体通信均为连通，局部邻居数量无法扩展，扩展性较弱，群体采用集中式规划，由一个Leader进行统一分配，算法复杂且响应时间较长，对于大规模群体的围捕适应性弱等等，不能满足实际应用的需要，群体系统围捕理论有待完善。

发明内容

本发明提供一种基于连通保持约束的群体围捕方法及装置，用以解决现有技术中无人群体系统协同响应时间较长且对于大规模群体的围捕适应性较弱的缺陷，实现快速完成对目标的围捕，确保目标围捕的准确性。

第一方面，本发明提供一种基于连通保持约束的群体围捕方法，包括：基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；执行所述搜索指令以对区域进行目标搜索，若发现目标，则根据所述目标计算个体收益，并在所述个体收益小于或等于预设阈值时，独立围捕使所述个体收益最大的目标；否则，通过群体分布式通信机制将所述目标信息传送至其他临近智能体，接收所述其他临近智能体返回的任务分配方案，根据所述任务分配方案，基于选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对所述目标进行围捕。

根据本发明提供的一种基于连通保持约束的群体围捕方法，所述通过群体分布式通信机制将所述目标信息传送至其他智能体，包括：基于信息传播能量，通过保持通信的其他智能体链路向所述其他智能体传播所述目标信息；所述信息传播能量表示为：E=(γ)^k-1，其中，k表示为信息传播链路的跳数，γ表示为折扣因子，γ∈(0,1)。

根据本发明提供的一种基于连通保持约束的群体围捕方法，所述选择性交互方法，包括：基于所述虚拟力场模型，根据所述任务分配方案中各智能体间相互引斥力作用，选择性忽略任务分配方案以外的所有智能体引斥力作用，计算围捕指令。

根据本发明提供的一种基于连通保持约束的群体围捕方法，所述虚拟力场模型u_i，表示为：

所述群体中各智能体的运动学模型表示为：

其中，u_i1表示群体中智能体i与其他智能体的交互作用项，u_i2表示群体中智能体i与目标g的作用项，c₁、c₂表示权重系数，p_i (t)、q_i (t)表示智能体i的速度、位置信息，p_g(t),q_g (t)表示目标g的速度、位置信息，ψ_i(z)表示势函数，V_i(z)表示智能体i周围所有其他智能体的势函数之和，∇V_i (z)表示总势函数的导数，k₁、k₂表示势函数系数，z表示智能体i与其他智能体的距离，d表示为引斥力范围的度量值，为常量，并且3d≤R_c，R_c为智能体之间的通信半径；

所述个体收益S_ij，表示为：

其中，

为角度优势函数，

为距离优势函数，

为任务驱动因子，该项与捕获目标所获得收益有关，

为加权系数，并且

；

分别表示为：

其中，

为优势角，

为智能体

与目标

之间的距离，

表示智能体的通信距离，

表示信息传播链路的跳数，

为折扣因子，

为目标

的预期收益值，

为智能体接收到追捕任务中最大的目标收益值。

根据本发明提供的一种基于连通保持约束的群体围捕方法，方法还包括：执行所述搜索指令以对区域进行目标搜索，若未发现目标，且其他临近智能体发现目标，则接收所述其他临近智能体发送的目标信息；根据接收的目标信息计算个体收益，并利用协商机制形成任务分配方案，以及将所述任务分配方案返回至所述其他临近智能体；根据所述任务分配方案，基于所述选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对目标进行围捕。

根据本发明提供的一种基于连通保持约束的群体围捕方法，所述利用协商机制形成任务分配方案，包括：当接收的至少两个所述其他临近智能体发送的目标信息来源于同一目标时，则以整体收益为目标，形成使所述整体收益最大的智能体联盟以围捕相应目标的任务分配方案；其中，所述整体收益表示为形成的智能体联盟中所有智能体的个体收益之和；当接收的至少两个所述其他临近智能体发送的目标信息来源于至少两个目标时，则以自身个体收益为指标，形成使自身个体收益最大的目标的任务分配方案；当与至少一个其他智能体接收来源于同一其他临近智能体发送的至少两个目标信息时，则以所述整体收益为指标，形成使所述其他临近智能体个体收益最大的目标的任务分配方案。

所述根据接收的其他临近智能体发送的目标信息，在所述执行所述围捕指令以对所述目标进行围捕之后，还包括：基于参加围捕的所有智能体均匀分布于以围捕目标为中心、半径为R_d的圆上，则围捕成功；其中，R_d表示为围捕半径。

第二方面，本发明还提供一种基于连通保持约束的群体围捕装置，包括：计算模块，基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；第一执行模块，执行所述搜索指令以对区域进行目标搜索，若发现目标，则根据所述目标计算个体收益，并在所述个体收益小于或等于预设阈值时，独立围捕使所述个体收益最大的目标；否则，通过群体分布式通信机制将所述目标信息传送至其他临近智能体，接收所述其他临近智能体返回的任务分配方案，根据所述任务分配方案，基于选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对所述目标进行围捕。

第三方面，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述基于连通保持约束的群体围捕方法的步骤。

第四方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述所述基于连通保持约束的群体围捕方法的步骤。

本发明提供的基于连通保持约束的群体围捕方法及装置，通过基于虚拟力模型，在通信保持约束条件下，同时考虑群体间各智能体与探测目标的作用，建立群体分布式协商机制，通过计算个体收益函数，判断联盟整体收益和个体收益的大小，实现群体无冲突的任务分配，并利用选择性交互方法，计算联盟各智能体的围捕指令，以实现快速完成对目标的围捕。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于连通保持约束的群体围捕方法的流程示意图之一；

图2是本发明提供的各智能体漫游状态时的仿真效果图；

图3是本发明提供的各智能体围捕过程中的仿真效果图；

图4是本发明提供的基于连通保持约束的群体围捕方法的代数连通变化曲线图；

图5是本发明提供的基于连通保持约束的群体围捕装置的结构示意图；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示出了本发明一种基于连通保持约束的群体围捕方法的流程示意图，该方法，包括：

S11，基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；

S12，执行搜索指令以对区域进行目标搜索，若发现目标，则根据目标计算个体收益，并基于个体收益小于或等于预设阈值，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

需要说明的是，本发明提供的基于连通保持约束的群体围捕方法的执行主体可以为群体中的任一智能体。本说明书中的S0N不代表基于连通保持约束的群体围捕的先后顺序，下面结合图2-图4具体描述本发明的基于连通保持约束的群体围捕方法。

步骤S11，基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态。

本实施例中，虚拟力场模型u_i，表示为：

群体中各智能体的运动学模型表示为：

其中，u_i1表示群体中智能体i与其他智能体的交互作用项，u_i2表示群体中智能体i与目标g的作用项，c₁、c₂表示权重系数，p_i (t)、q_i (t)表示智能体i的速度、位置信息，p_g(t),q_g (t)表示目标g的速度、位置信息，ψ_i(z)表示势函数，V_i(z)表示智能体i周围所有其他智能体的势函数之和，∇V_i (z)表示总势函数的导数，k₁、k₂表示势函数系数，z表示智能体i与其他智能体的距离，d表示为引斥力范围的度量值，为常量，并且3d≤R_c，R_c为智能体之间的通信半径。

另外，在初始状态，群体中的各智能体未发现目标时，任一智能体受其他临近智能体的引斥力，为使群体中的各智能体形成连通保持的漫游状态，需要使该智能体与其他智能体之间的距离z∈(d,2d)，ψ_i(z)=0，搜索指令为0，从而确保群体进入漫游状态。

步骤S12，执行搜索指令以对区域进行目标搜索，若发现目标，则根据目标计算个体收益，并基于个体收益小于或等于预设阈值，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

本实施例中，执行搜索指令以对区域进行目标搜索，若发现目标，则：

首先，根据发现目标，计算个体收益，个体收益S_ij，表示为：

其中，

为角度优势函数，

为距离优势函数，

为任务驱动因子，该项与捕获目标所获得收益有关，

为加权系数，并且

；

分别表示为：

其中，

为优势角，

为智能体

与目标

之间的距离，

表示智能体的通信距离，

表示信息传播链路的跳数，

为折扣因子，

为目标

的预期收益值，

为智能体接收到追捕任务中最大的目标收益值。

在一个可选实施例中，R_c=30，γ=0.5，假设存在三个目标，则相应目标属性，即个体收益S设置为S₁=4，S₂=3，S₃=3，其中，S₁表示为目标一的个体收益，S₂表示为目标二的个体收益，S₃表示为目标三的个体收益。应当注意，当发现的目标为多个时，需要分别针对各目标进行个体收益计算。

其次，判断个体收益是否不大于预设阈值，若是，则独立围捕使个体收益最大的目标。需要说明的是，当不大于预设阈值的个体收益为一个时，独立围捕相应目标；当不大于预设阈值的个体收益为至少两个时，独立围捕使个体收益最大的目标。

若个体收益大于预设阈值，则通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案。

具体而言，通过群体分布式通信机制将目标信息传送至其他临近智能体，包括：通过保持通信的其他临近智能体链路向其他临近智能体传播目标信息。更进一步地说，通过保持通信的其他临近智能体链路向其他临近智能体传播目标信息，包括：基于信息传播能量，将目标信息通过保持通信的其他临近智能体链路传播；信息传播能量表示为：E=(γ)^k-1，其中，k表示为信息传播链路的跳数，γ表示为折扣因子，γ∈(0,1)。

需要说明的是，预设阈值可以为1，具体可根据实际设计需求设定，此处不作进一步限定；在将目标信息传播至其他临近智能体之后，其他临近智能体基于接收的目标信息，计算个体收益，并利用协商机制形成任务分配方案，以及将任务分配方案返回至控制中心，具体可参考下文方法实施例。另外，目标信息包括目标位置、威胁程度、目标收益和完成任务所需数量等。

最后，接收其他临近智能体返回的任务分配方案，并根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

本实施例中，选择性交互方法，包括：基于虚拟力场模型，根据任务分配方案中各智能体间相互引斥力作用，选择性忽略任务分配方案以外的所有智能体引斥力作用，计算围捕指令。需要说明的是，计算的围捕指令为任务分配方案中该智能体围捕对应目标的指令。

在一个可选实施例中，该基于连通保持约束的群体围捕方法，还包括：

S13，执行搜索指令以对区域进行目标搜索，若未发现目标，且其他临近智能体发现目标，则接收其他临近智能体发送的目标信息；

S14，根据接收的目标信息计算个体收益，并利用协商机制形成任务分配方案，以及将任务分配方案返回至其他临近智能体；

S15，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

需要说明的是，本发明提供的基于连通保持约束的群体围捕方法的执行主体可以为群体中的任一智能体。本说明书中的S0N不代表基于连通保持约束的群体围捕的先后顺序，下面具体描述本发明的基于连通保持约束的群体围捕方法。

步骤S13，执行搜索指令以对区域进行目标搜索，若未发现目标，且其他临近智能体发现目标，则接收其他临近智能体发送的目标信息。

需要说明的是，由于其他智能体在对区域进行搜索时，仅会在发现目标的情形下向其临近智能体发送目标信息，因此，当该智能体执行搜索指令以对区域进行目标搜索时，若其未发现目标，则仅在其临近的其他智能体发现目标的情形下，接收相应其他临近智能体发送的目标信息。

S14，根据接收的目标信息计算个体收益，并利用协商机制形成任务分配方案，以及将任务分配方案返回至其他临近智能体。

本实施例中，根据接收的其他临近智能体发送的目标信息，计算个体收益，包括：根据接收的每个目标信息，分别计算其对应的个体收益。

利用协商机制形成任务分配方案，包括：当接收的至少两个其他临近智能体发送的目标信息来源于同一目标时，则以整体收益为目标，形成使整体收益最大的智能体联盟以围捕相应目标的任务分配方案；其中，整体收益表示为形成的智能体联盟中所有智能体的个体收益之和；当接收的至少两个其他临近智能体发送的目标信息来源于至少两个目标时，则以自身个体收益为指标，形成使自身个体收益最大的目标的任务分配方案；当与至少一个其他智能体接收来源于同一其他临近智能体发送的至少两个目标信息时，则以整体收益为指标，形成使其他临近智能体个体收益最大的目标的任务分配方案。

在一个可选实施例中，当该智能体接收至少两个其他临近智能体发送的目标信息来源于同一目标时，根据该目标信息对应的个体收益，选择至少部分其他临近智能体的个体收益组成整体收益，并使形成的任务分配方案中所有智能体的个体收益之和最大，即整体收益最大，任务分配方案中的所有智能体构成智能体联盟，智能体联盟中智能体的个数可以根据实际围捕需求设定，此处不作限定。

应当注意，在对目标进行围捕时，优先组成整体收益值最大的智能体联盟。整体收益与个体收益产生冲突时，整体收益优先级大于个体收益。

在一个可选实施例中，当接收的至少两个其他临近智能体发送的目标信息来源于至少两个目标时，则以该智能体的个体收益为指标，围捕使其自身个体收益最大的目标，并使形成的任务分配方案中的智能体联盟为该智能体以及发送该目标信息的其他临近智能体。比如，该智能体接收的目标信息为i个，其中i=1,2,…,n，该智能体对应该目标信息i的个体收益为S_pi，则选择对应个体收益S_pi最大的目标，并与发送该目标信息的其他临近智能体组成智能体联盟。

在一个可选实施例中，当与至少一个其他智能体接收来源于同一其他临近智能体发送的至少两个目标信息时，则形成的任务分配方案以其他临近智能体的个体收益最大为指标，选择对应目标，并基于该目标组成整体收益最大的智能体联盟，以围捕该目标。需要说明的是，智能体联盟包括发送目标信息的其他临近智能体，该智能体联盟该包括该智能体和至少一个其他智能体中的至少一个。

步骤S15，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

在一个可选实施例中，在任务分配方案中的所有围捕目标之后，控制中心，基于参加围捕任务的所有智能体均匀分布在以目标为中心，半径为R_d的圆上，判断围捕成功；其中，R_d表示为围捕半径。

在一个可选实施例中，R_d=5。

在一个可选实施例中，如图2和图3所示，为本发明一种连通保持约束下的群体围捕方法一种实施例的仿真效果图，其中圆点表示群体中的智能体，正方形表示目标。从图2和图3中可以看出，本实施例可以通过极少的步数实现群体对目标的围捕，并且能够保证群体间各智能体的连通关系；如图4所示，横轴表示方法执行的步数，纵轴表示代数连通度，随着步数的增加，代数连通度先增加，后减小，再逐步收敛至20，保证群体中各智能体基本连通。

在一个可选实施例中，在将相应围捕指令输出至相应智能体之后，还包括：基于参加围捕的所有智能体均匀分布于以围捕目标为中心、半径为R_d的圆上，则围捕成功；其中，R_d表示为围捕半径。

在一个可选实施例中，该基于连通保持约束的群体围捕方法，包括：

S21，基于各智能体的虚拟力场模型，计算对应智能体的搜索指令，并使群体中的所有智能体形成保持通信的漫游状态；

S22，群体执行搜索指令以对区域进行目标搜索，若某智能体发现目标，则根据目标计算个体收益，并在个体收益小于或等于预设阈值时，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将所述目标信息传送至其他临近智能体；

S23，其他临近智能体接收目标信息，并根据目标信息计算个人收益，利用协商机制形成任务分配方案，以及将任务分配方案返回至发送目标信息的智能体；

S24，其他临近智能体以及接收任务分配方案的智能体，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行所述围捕指令以对目标进行围捕。

需要说明的是，在其他临近智能体接收目标信息，并根据目标信息计算个人收益之后，利用协商机制形成任务分配方案。具体而言，利用协商机制形成任务分配方案，包括：当接收的至少两个智能体发送的目标信息来源于同一目标时，则以整体收益为目标，形成使整体收益最大的智能体联盟以围捕相应目标的任务分配方案；其中，整体收益表示为形成的智能体联盟中所有智能体的个体收益之和；当接收的至少两个智能体发送的目标信息来源于至少两个目标时，则以自身个体收益为指标，形成使自身个体收益最大的目标的任务分配方案；当与至少一个其他智能体接收来源于同一智能体发送的至少两个目标信息时，则以整体收益为指标，形成使发送目标信息的智能体个体收益最大的目标的任务分配方案。

在一个可选实施例中，在任务分配方案中的智能体执行围捕指令以对目标进行围捕之后，还包括：基于参加围捕的所有智能体均匀分布于以围捕目标为中心、半径为R_d的圆上，则围捕成功；其中，R_d表示为围捕半径。

综上所述，本发明通过基于虚拟力模型，在通信保持约束条件下，同时考虑群体间各智能体与探测目标的作用，建立群体分布式协商机制，通过计算个体收益，判断联盟整体收益和个体收益的大小，实现群体无冲突的任务分配，并利用选择性交互方法，计算联盟各智能体的围捕指令，以实现快速完成对目标的围捕。

下面对本发明提供的基于连通保持约束的群体围捕装置进行描述，下文描述的基于连通保持约束的群体围捕装置与上文描述的基于连通保持约束的群体围捕方法可相互对应参照。

图5示出了本发明一种基于连通保持约束的群体围捕装置的结构示意图，该装置，包括：

计算模块51，基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；

第一执行模块52，执行搜索指令以对区域进行目标搜索，若发现目标，则根据目标计算个体收益，并在个体收益小于或等于预设阈值时，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

具体而言，计算模块51，包括：指令计算单元，基于虚拟力场模型计算搜索指令；状态调整单元，与其他智能体形成保持通信的漫游状态。

虚拟力场模型可参考前文方法实施例所述，此处不做赘述。需要说明的是，在与其他智能体保持通信的漫游状态时，状态调整单元需要将势函数调整为0。

若发现目标，则第一执行模块52，包括：第一执行单元，执行搜索指令以对区域进行目标搜索；第一计算单元，根据发现的目标计算个体收益；判断单元，判断个体收益是否不大于预设阈值，并基于个体收益小于或等于预设阈值，独立围捕使个体收益最大的目标，否则，通过群体分布式通信机制将目标信息传送至其他临近智能体；第一接收单元，接收其他临近智能体返回的任务分配方案或发送的目标信息；第二计算单元，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令；第二执行单元，执行围捕指令以对目标进行围捕。需要说明的是，第一执行单元和第二执行单元可以为同一执行单元。

若未发现目标，且该智能体的其他临近智能体发现目标，则该装置还包括第二执行模块，第二执行模块包括第二接收单元、任务分配单元和发送单元，其中：第二接收单元，接收其他临近智能体发出的目标信息；任务分配单元，根据第一计算单元计算得到的个体收益以及其他临近智能体的个体收益，利用协商机制形成任务分配方案；发送单元，将任务分配方案返回至其他临近智能体。

需要说明的是，在第二接收单元接收其他临近智能体发出的目标信息之后，第一计算单元，根据接收的目标信息计算个体收益；另外，在任务分配单元形成任务分配方案之后，第二计算单元，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令；第二执行单元，执行围捕指令以对目标进行围捕。

具体而言，利用协商机制形成任务分配方案，包括：当接收的至少两个其他临近智能体发送的目标信息来源于同一目标时，则以整体收益为目标，形成使整体收益最大的智能体联盟以围捕相应目标的任务分配方案；其中，整体收益表示为形成的智能体联盟中所有智能体的个体收益之和；当接收的至少两个其他临近智能体发送的目标信息来源于至少两个目标时，则以自身个体收益为指标，形成使自身个体收益最大的目标的任务分配方案；当与至少一个其他智能体接收来源于同一其他临近智能体发送的至少两个目标信息时，则以整体收益为指标，形成使其他临近智能体个体收益最大的目标的任务分配方案。

在一个可选实施例中，该基于连通保持约束的群体围捕装置，还包括：

群体模块，群体模块包含多个智能体，各智能体基于其内部的虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；

若智能体发现目标，则根据目标计算个体收益，并判断个体收益是否不大于预设阈值，若是，则独立围捕使该智能体个体收益最大的目标；否则，根据个体收益通过群体分布式通信机制将目标信息传送至其他临近智能体；并接收其他临近智能体返回的任务分配方法，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕

若智能体未发现目标，且其他临近智能体发现目标，则接收其他临近智能体发送的目标信息；根据接收的目标信息计算个体收益，并利用协商机制形成任务分配方案，以及将任务分配方案返回至其他临近智能体；根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

图6示例了一种电子设备的实体结构示意图，如图6所示，该电子设备可以包括：处理器（processor）61、通信接口（Communication Interface）62、存储器（memory）63和通信总线64，其中，处理器61，通信接口62，存储器63通过通信总线64完成相互间的通信。处理器61可以调用存储器63中的计算机程序，以执行基于连通保持约束的群体围捕方法的步骤，例如包括：

基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；执行搜索指令以对区域进行目标搜索，若发现目标，则根据目标计算个体收益，并在个体收益小于或等于预设阈值时，独立围捕使个体收益最大的目标；否则，通过群体分布式通信机制将目标信息传送至其他临近智能体，接收其他临近智能体返回的任务分配方案，根据任务分配方案，基于选择性交互方法和虚拟力场模型计算围捕指令，并执行围捕指令以对目标进行围捕。

此外，上述的存储器63中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的基于连通保持约束的群体围捕方法的步骤，例如包括：

另一方面，本申请实施例还提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使所述处理器执行上述各实施例提供的基于连通保持约束的群体围捕方法的步骤，例如包括：

所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器（例如软盘、硬盘、磁带、磁光盘（MO）等）、光学存储器（例如CD、DVD、BD、HVD等）、以及半导体存储器（例如ROM、EPROM、EEPROM、非易失性存储器（NANDFLASH）、固态硬盘（SSD））等。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于连通保持约束的群体围捕方法，其特征在于，包括：

基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；

执行所述搜索指令以对区域进行目标搜索，若发现目标，则根据所述目标计算个体收益，并在所述个体收益小于或等于预设阈值时，独立围捕使所述个体收益最大的目标；否则，通过群体分布式通信机制将所述目标信息传送至其他临近智能体，接收所述其他临近智能体返回的任务分配方案，根据所述任务分配方案，基于选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对所述目标进行围捕。

2.根据权利要求1所述的基于连通保持约束的群体围捕方法，其特征在于，所述通过群体分布式通信机制将所述目标信息传送至其他智能体，包括：

基于信息传播能量，通过保持通信的其他智能体链路向所述其他智能体传播所述目标信息；

所述信息传播能量表示为：E=(γ)^k-1，其中，k表示为信息传播链路的跳数，γ表示为折扣因子，γ∈(0,1)。

3.根据权利要求1所述的基于连通保持约束的群体围捕方法，其特征在于，所述选择性交互方法，包括：

基于所述虚拟力场模型，根据所述任务分配方案中各智能体间相互引斥力作用，选择性忽略任务分配方案以外的所有智能体引斥力作用，计算围捕指令。

4.根据权利要求1所述的基于连通保持约束的群体围捕方法，其特征在于，所述虚拟力场模型u_i，表示为：

所述群体中各智能体的运动学模型表示为：

其中，u_i1表示群体中智能体i与其他智能体的交互作用项，u_i2表示群体中智能体i与目标g的作用项，c₁、c₂表示权重系数，p_i (t)、q_i (t)表示智能体i的速度、位置信息，p_g (t),q_g(t)表示目标g的速度、位置信息，ψ_i(z)表示势函数，V_i(z)表示智能体i周围所有其他智能体的势函数之和，∇V_i (z)表示总势函数的导数，k₁、k₂表示势函数系数，z表示智能体i与其他智能体的距离，d表示为引斥力范围的度量值，为常量，并且3d≤R_c，R_c为智能体之间的通信半径；

所述个体收益S_ij，表示为：

其中，

为角度优势函数，

为距离优势函数，

为任务驱动因子，该项与捕获目标所获得收益有关，

为加权系数，并且

；

分别表示为：

其中，

为优势角，

为智能体

与目标

之间的距离，

表示智能体的通信距离，

表示信息传播链路的跳数，

为折扣因子，

为目标

的预期收益值，

为智能体接收到追捕任务中最大的目标收益值。

5.根据权利要求1所述的基于连通保持约束的群体围捕方法，其特征在于，方法还包括：

执行所述搜索指令以对区域进行目标搜索，若未发现目标，且其他临近智能体发现目标，则接收所述其他临近智能体发送的目标信息；

根据接收的目标信息计算个体收益，并利用协商机制形成任务分配方案，以及将所述任务分配方案返回至所述其他临近智能体；根据所述任务分配方案，基于所述选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对目标进行围捕。

6.根据权利要求5所述的基于连通保持约束的群体围捕方法，其特征在于，所述利用协商机制形成任务分配方案，包括：

当接收的至少两个所述其他临近智能体发送的目标信息来源于同一目标时，则以整体收益为目标，形成使所述整体收益最大的智能体联盟以围捕相应目标的任务分配方案；其中，所述整体收益表示为形成的智能体联盟中所有智能体的个体收益之和；

当接收的至少两个所述其他临近智能体发送的目标信息来源于至少两个目标时，则以自身个体收益为指标，形成使自身个体收益最大的目标的任务分配方案；

当与至少一个其他智能体接收来源于同一其他临近智能体发送的至少两个目标信息时，则以所述整体收益为指标，形成使所述其他临近智能体个体收益最大的目标的任务分配方案。

7.根据权利要求1所述的基于连通保持约束的群体围捕方法，其特征在于，在所述执行所述围捕指令以对所述目标进行围捕之后，还包括：

基于参加围捕的所有智能体均匀分布于以围捕目标为中心、半径为R_d的圆上，则围捕成功；其中，R_d表示为围捕半径。

8.一种基于连通保持约束的群体围捕装置，其特征在于，包括：

计算模块，基于虚拟力场模型计算搜索指令，并与其他智能体形成保持通信的漫游状态；

第一执行模块，执行所述搜索指令以对区域进行目标搜索，若发现目标，则根据所述目标计算个体收益，并在所述个体收益小于或等于预设阈值时，独立围捕使所述个体收益最大的目标；否则，通过群体分布式通信机制将所述目标信息传送至其他临近智能体，接收所述其他临近智能体返回的任务分配方案，根据所述任务分配方案，基于选择性交互方法和所述虚拟力场模型计算围捕指令，并执行所述围捕指令以对所述目标进行围捕。

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述基于连通保持约束的群体围捕方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于连通保持约束的群体围捕方法的步骤。