CN112235808A

CN112235808A - 一种多智能体分布式协同动态覆盖方法及系统

Info

Publication number: CN112235808A
Application number: CN202011083838.3A
Authority: CN
Inventors: 刘瑜; 李刚; 丁自然; 王学谦; 谭大宁; 董博远
Original assignee: Tsinghua University; Naval Aeronautical University
Current assignee: Tsinghua University; Naval Aeronautical University
Priority date: 2020-10-12
Filing date: 2020-10-12
Publication date: 2021-01-15
Anticipated expiration: 2040-10-12
Also published as: CN112235808B

Abstract

本发明公开了一种多智能体分布式协同动态覆盖方法及系统。所述方法包括：更新目标智能体上一时刻的覆盖信息素图得到本地更新信息素图；判断邻居节点集是否为空；若否，则接收邻居节点集发送的消息包，并采用消息包更新目标智能体当前时刻的本地更新信息素图得到融合更新信息素图；基于目标智能体当前时刻的位置、速度和融合更新信息素图，计算目标智能体当前时刻的综合控制项；若是，则基于目标智能体当前时刻的位置、速度和本地更新信息素图计算目标智能体当前时刻的综合控制项；由目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度。本发明能实现未知环境条件下基于多智能体协同的快速完全覆盖。

Description

一种多智能体分布式协同动态覆盖方法及系统

技术领域

本发明涉及多智能体协同覆盖领域，特别是涉及一种多智能体分布式协同动态覆盖方法及系统。

背景技术

基于多智能体的态势感知技术可被广泛应用于搜索营救、区域侦察观测、火力打击、信息采集、巡逻、地形测绘、交通要道态势监控等任务。覆盖任务区域是执行上述任务的基础和前提。由于单个智能体的覆盖能力受限，通常需要多个智能体组网协作执行覆盖任务。

多智能体协同动态覆盖系统要求单个节点具有自主感知、分布式信息处理、决策和行为的能力，并且多节点之间能够实施高效协同合作，以实时获取有效的、优化的覆盖路径，引导多智能体协同动态覆盖系统在给定的时间内快速搜索感兴趣的目标，尽可能多地获取任务区域的信息，从而降低任务区域信息的不确定性，获取最大感知收益。然而，在未知环境下的态势感知过程中，智能体的移动受限于自身探测方式、观测区域及运动模式，且与环境中的未知障碍物密切关联，需要实现多智能体对任务区域的全局最优覆盖且运动控制条件是简易可行的。此外，由于智能体通常能力有限，单个节点需要在无法预知全局信息的情况下，通过局部通信和交互合作完成复杂覆盖任务。因而，多智能体协同动态覆盖系统需要采用基于局部信息的分布式合作机制，且由于个体能力的限制，要尽量减少覆盖过程中各智能体节点的通信量和计算量。

目前，为避免局部最优、降低优化或控制难度，已有大多数多智能体协同覆盖方法大致可分为三类。第一类方法基于区域划分的思路，首先采用多边形分割、质心Voronoi图划分、模糊C均值聚类等方法把任务区域分割为与智能体等数量的子区域，然后再进行规划分配以完成覆盖侦察任务。这种思路是预知任务区域情况下的集中式控制策略，若有智能体出现失效问题，则需立即重新进行区域划分和任务分配。第二类方法采用编队协同的思路：多智能体协同动态覆盖系统中所有个体保持相对于领导者的期望距离和方向，通过控制领导者的运动并同时保持编队结构来简化多智能体协同动态覆盖系统的覆盖问题。第三类方法是完全随机覆盖策略，是未知环境下执行覆盖的一种简单方法，多智能体协同动态覆盖系统中的每个智能体节点在保持自身避障的基础上采用完全随机访问的控制策略实现区域覆盖。

对于区域覆盖能力和目标搜索有效性而言，区域划分及编队协同这两类方法在已知确定环境下被认为是一种高效可行的方式。但是，该类方法的优势主要来自于预先的任务分配，因其不具备节点故障的鲁棒性及不具备扩展性，故难以运用于高度动态变化的复杂实际环境。此外，与区域分区及编队协同这两类方法相比，完全随机覆盖方法可以运用于未知环境。然而，随机覆盖并不是实际有效的策略，因为多智能体协同动态覆盖系统中单个智能体很可能会重复访问相同的区域，而不是探索未访问的其他区域，进而造成全局覆盖效率较低。

未知环境下的多智能体分布式协同动态覆盖系统需要兼顾到五个主要方面需求：第一是所有智能体相互之间以及智能体与障碍物之间能够在未知环境中避免碰撞，即多智能体协同动态覆盖系统中每个智能体具有实时避障能力；第二是多智能体协同动态覆盖系统的组织方式是分布式无中心控制，支持部分节点的随时加入或退出，即多智能体协同动态覆盖系统的可扩展性；第三是多智能体协同动态覆盖系统需要实现全局最优覆盖，不能陷入局部最优；第四是每个智能体仅需与附近的邻居节点进行信息交互，尽可能降低覆盖过程中各智能体节点的通信和计算需求，以延长多智能体协同动态覆盖系统寿命，即多智能体协同动态覆盖系统的节能策略；第五是多智能体协同动态覆盖系统中个别节点的失效不能严重影响区域覆盖任务的执行，即多智能体协同动态覆盖系统的运行稳定性。

目前，尚未发现已有研究可以完全解决未知环境下多智能体分布式动态覆盖问题。由于任务区域内可能存在未知障碍物且智能体的有效运动控制必须满足一定条件，加之需要尽可能节省每个智能体的通信和计算开销以延长多智能体协同动态覆盖系统生存周期，导致环境不确定条件下基于多智能体协同的快速完全覆盖难题更加具有挑战性。

发明内容

基于此，有必要提供一种多智能体分布式协同动态覆盖方法及系统，以实现未知环境条件下基于多智能体协同的快速完全覆盖。

为实现上述目的，本发明提供了如下方案：

一种多智能体分布式协同动态覆盖方法，包括：

获取目标智能体当前时刻的位置和当前时刻的速度；

更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图；

判断邻居节点集是否为空，得到第一判断结果；所述邻居节点集为目标智能体通信范围内的所有智能体的集合；

若所述第一判断结果为否，则接收所述邻居节点集发送的消息包，并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图；所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图；

基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项；所述综合控制项为斥力控制项和效益控制项加权求和而成，或为斥力控制项、效益控制项和避障控制项加权求和而成；

若所述第一判断结果为是，则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项；所述综合控制项为效益控制项加权而成，或为避障控制项和效益控制项加权求和而成；

由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度，并将下一时刻作为当前时刻再返回更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图的步骤。

可选的，所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项，具体包括：

计算斥力控制项；

判断目标智能体当前时刻是否存在障碍物，得到第二判断结果；

若所述第二判断结果为是，则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项，根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项，并将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项；

若所述第二判断结果为否，则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项，并将所述斥力控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。

可选的，所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项，具体包括：

判断目标智能体当前时刻是否存在障碍物，得到第三判断结果；

若所述第三判断结果为是，则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项，根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算效益控制项，并将所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项；

若所述第三判断结果为否，则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算效益控制项，并将所述效益控制项加权得到目标智能体当前时刻的综合控制项。

可选的，在所述计算斥力控制项之前还包括：

判断区域是否完全覆盖，得到第四判断结果；

若所述第四判断结果为否，则执行计算斥力控制项的步骤。

可选的，所述根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项，具体包括：

由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置；

由所述目标智能体当前时刻最大化收益的目标位置、所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算效益控制项。

可选的，所述更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图，具体为：

其中，M_i(x,t)为目标智能体i当前时刻t的本地更新信息素图，M_i(x,t-1)为目标智能体i上一时刻t-1的覆盖信息素图，

为信息素衰减因子，τ为信息素增益值，x_i(t)为目标智能体i当前时刻t的位置，x为目标智能体i所处的正方形小单元格的中心坐标，r_s为目标智能体i配备的圆盘型探测模式的传感器的感知半径。

可选的，所述采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图，具体为：

其中，M_i(x)为目标智能体i当前时刻的融合更新信息素图，M_i(x,t)为目标智能体i当前时刻t的本地更新信息素图，

为邻居节点集

中的智能体j当前时刻t的本地更新信息素图。

可选的，所述由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置，具体包括：

由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置构建目标智能体当前时刻的效益函数

其中，M_i(x)为目标智能体i当前时刻的融合更新信息素图，x为目标智能体i所处的正方形小单元格的中心坐标，X为所有的正方形小单元格的中心坐标构成的集合，δ为取值为正的常数，η_i(x)表示函数，

σ₁和σ₂均为取值为正的常数，

为目标智能体i获得最大化收益f_i(x,t)时的理想目标位置，x_i为目标智能体i的位置；

由所述效益函数计算目标智能体当前时刻最大化收益的目标位置

其中，

x_j为邻居节点集

中的智能体j的位置，r_s为目标智能体i配备的圆盘型探测模式的传感器的感知半径，

为邻居节点集。

可选的，所述将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项，具体为：

其中，u_i为目标智能体i当前时刻的综合控制项，

为效益控制项，

为斥力控制项，

为避障控制项，ω_a为效益权重，ω_b为斥力权重，ω_c为避障权重。

本发明还提供了一种多智能体分布式协同动态覆盖系统，包括：

数据获取模块，用于获取目标智能体当前时刻的位置和当前时刻的速度；

本地更新模块，用于更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图；

判断模块，用于判断邻居节点集是否为空，得到第一判断结果；所述邻居节点集为目标智能体通信范围内的所有智能体的集合；

融合更新模块，用于若所述第一判断结果为否，则接收所述邻居节点集发送的消息包，并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图；所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图；

第一综合控制项计算模块，用于基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项；所述综合控制项为斥力控制项和效益控制项加权求和而成，或为斥力控制项、效益控制项和避障控制项加权求和而成；

第二综合控制项计算模块，用于若所述第一判断结果为是，则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项；所述综合控制项为效益控制项加权而成，或为避障控制项和效益控制项加权求和而成；

数据更新模块，用于由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度，并将下一时刻作为当前时刻再返回所述本地更新模块。

与现有技术相比，本发明的有益效果是：

本发明提出了一种多智能体分布式协同动态覆盖方法及系统，通过节点通信范围内邻居之间局部交互的自组织行为，执行各自覆盖历史信息的迭代和融合处理，实现了局部信息素图快速向全局信息素图的一致性逼近，使得每个智能体能够最大化累计覆盖面积及最小化多智能体覆盖区域的重叠部分，实现了未知环境条件下基于多智能体协同的快速完全覆盖；并且仅需邻居智能体节点之间进行简单通信，通过加权综合智能体避障控制、效益控制以及斥力控制这三项约束条件，实现了障碍物环境下多智能体协同覆盖系统的分布式智能化控制，提高了覆盖率及覆盖速度，且具有可扩展性、自适应性及鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为多智能体分布式协同动态覆盖概念示意图；

图2为本发明实施例提供的多智能体分布式协同动态覆盖方法的流程图；

图3为本发明实施例提供的多智能体分布式协同动态覆盖方法的具体实现过程图；

图4为本发明实施例提供的多智能体分布式协同动态覆盖系统的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明针对背景技术中提到的五个方面，提出了一个合适的方法。该方法通过邻居智能体之间的有效信息交互来最大限度地扩大搜索范围，并最大限度地减少重叠访问。具体思路是，每个智能体独立地存储一个本地覆盖信息图，每个时刻仅利用自身传感器采集到的信息和与邻居智能体进行局部通信，以获得的邻居智能体的位置信息来更新本地覆盖信息图，并基于本地信息图及感知的障碍物位置信息进行在线覆盖决策。其中，智能体的运动控制由避障、去中心化、自私这三项功能约束进行实时优化决策，使得每个智能体能够最大化累计覆盖面积及最小化个体之间的重叠覆盖部分。该方法仅需邻居智能体节点之间进行简单通信，运动控制不仅满足智能体动力学约束，且对智能体的前进航向没有数量约束，适用范围更广

本实施例涉及的多智能体分布式协同动态覆盖方法，为了便于阐述，做以下约定：

设定二维矩形任务区域内存在n个可移动的智能体，其组成的覆盖系统定义为S＝{1,2,...i,...n,n≥2}。所有智能体都配备圆盘型探测模式且感知半径为r_s(r_s＞0)的传感器，且智能体几何中心与传感器中心重叠。也就是说，只要目标区域在传感器探测范围之内就可以被覆盖。此外，各智能体具有相同的全向无线通信能力，通信半径为r_c(r_c＞2r_s)，使得智能体两两之间能够在感知区域不重叠的情况下互相通信。智能体i的通信范围内所有其他智能体的集合称为通信邻居节点集

设置x_i(t)、v_i(t)、u_i(t)分别表示智能体i在时刻t的位置、速度及运动控制输入，则可以用如下双积分动态模型描述各智能体在二维空间中的运动学模型：

对于网络中的某个智能体i，其任务是在仅仅预先已知目标区域的地理位置和边界信息情况下，通过自身不断感知以及与邻居节点的通信交互，能够在避免碰撞的前提下尽可能短的时间内实现区域完全覆盖。多智能体分布式协同动态覆盖概念示意图如图1所示。

在本实施例中，不失一般性，设定目标智能体i的运动控制输入u_i(t)由三部分组成，分别是效益控制项

斥力控制项

及避障控制项

为描述方便，以下阐述中省略时间标注t。

以目标智能体i为例，以下介绍实施例中每个智能体在覆盖任务中的信息交互与处理过程，最终得到运动控制输入u_i的求解方式。

图2为本发明实施例提供的多智能体分布式协同动态覆盖方法的流程图。参见图2，本实施例的多智能体分布式协同动态覆盖方法，包括：

步骤101：获取目标智能体当前时刻的位置和当前时刻的速度。

步骤102：更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图。具体为：

为信息素衰减因子，可以设置成取值为正的常数；τ为信息素增益值，也是可以设置成取值为正的常数；x_i(t)为目标智能体i当前时刻t的位置，x为目标智能体i所处的正方形小单元格的中心坐标，r_s为目标智能体i配备的圆盘型探测模式的传感器的感知半径。

该步骤中，若当前时刻为初始时刻，则初始化的过程为：

将任务区域离散化为一组面积相同的正方形小单元格，其中x是正方形小单元格的中心坐标，其构成的集合为X。设置M_i(x,t)为目标智能体i的本地历史覆盖信息素图(或称信息素矩阵)，记录着目标智能体i最近一次覆盖位置x的信息素。对于所有的x(x∈X)，将要进入任务区域的目标智能体i的信息图初始化为M_i(x,t)＝0。

步骤103：判断邻居节点集是否为空，得到第一判断结果；所述邻居节点集为目标智能体通信范围内的所有智能体的集合。

若所述第一判断结果为否，则执行步骤104-105；若所述第一判断结果为是，则执行步骤106。

步骤104：接收所述邻居节点集发送的消息包，并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图。所述消息包包括所述邻居节点集中各智能体的身份标识号(ID)、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图。具体的：

目标智能体i广播消息包，智能体i的消息包包括目标智能体i的身份标识号(ID)、目标智能体i当前时刻的坐标x_i、本地更新信息素图M_i(x,t)等信息。若通信范围内存在邻居智能体

则目标智能体i接收邻居节点集中的智能体j发送的消息包。

若目标智能体i接收到邻居节点集中的智能体

的消息包，则通过下式融合更新信息素图，具体为：

为邻居节点集

中的智能体j当前时刻t的本地更新信息素图。max(·)函数功能是取最大值，即通过比较(·)中两个元素的大小来确定M_i(x)的赋值。于是，智能体s_i能够记录自身及邻居的最新覆盖信息。由于覆盖系统中的智能体节点之间存在直接或间接连通关系，因而随着覆盖过程的持续推进，单个智能体能够逐渐获知任务区域的全局覆盖信息。

步骤105：基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项。所述综合控制项为斥力控制项和效益控制项加权求和而成，或为斥力控制项、效益控制项和避障控制项加权求和而成。

步骤106：基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项。所述综合控制项为效益控制项加权而成，或为避障控制项和效益控制项加权求和而成。

步骤107：由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度，并将下一时刻作为当前时刻再返回步骤102。

该步骤，具体为：

覆盖系统中每个智能体都可以分别得到当前时刻各自最终的控制输入u_i。在此基础上，可通过

及

解算出下一时刻各自新的位置和速度。

其中，步骤105，具体包括：

1)计算斥力控制项。

若智能体周边存在邻居节点，则必须考虑节点之间的相互避撞问题。斥力控制项的功能是使得智能体之间保持一定距离，避免相互碰撞的同时引导各自向着覆盖目标运动。定义智能体i的斥力控制项为

其中，

为矢量微分算符；d_b是智能体相互之间的最小期望距离，可以设置成0＜d_b≤2r_s；l_ij是节点i与节点j之间的直线距离，即

函数φ(l_ij,d_b)用来辅助衡量节点间距离与最小期望距离之间的关系，定义为

其中，参数κ_b是取值为正的常数。

2)判断目标智能体当前时刻是否存在障碍物，得到第二判断结果。

①若所述第二判断结果为是，则执行：i)根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项；ii)根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项；iii)将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。

步骤i)具体为：

若任务区域内存在障碍物，则必须考虑智能体与障碍物之间的避撞问题。避障控制项的功能是使得智能体与障碍物之间保持一定的安全距离。设定通过事先预知或智能体实时感知，获知智能体i周边存在障碍物，其所占区域同样可以离散化为一组正方形小单元格，且与任务区域划分后的对应小单元格位置重叠。不妨设置

表示智能体i在当前时刻的障碍物邻居集，

为智能体i在当前时刻第k个障碍物的坐标。定义避障控制项为

函数θ_i定义为

此外，函数

定义为

为矢量微分算符；d_c是智能体与障碍物之间的最小期望距离，可以设置为(0＜d_c＜r_s)；l_ik是节点i与障碍物k之间的直线距离，即

函数φ(l_ik,d_c)定义为

参数κ_c是取值为正的常数。

其中，步骤ii)具体为：由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置；由所述目标智能体当前时刻最大化收益的目标位置、所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算效益控制项。

该步骤中，由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置，具体为：

σ₁和σ₂均为取值为正的常数，

为目标智能体i获得最大化收益f_i(x,t)时的理想目标位置，x_i为目标智能体i的位置。

其中，

x_j为邻居节点集

为邻居节点集。

该步骤中，由所述目标智能体当前时刻最大化收益的目标位置、所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算效益控制项，具体为：

每个智能体的覆盖任务都是在尽可能短的时间内覆盖尽可能大的区域。效益控制项的功能是负责最大化每个智能体的区域覆盖范围。定义智能体i的效益控制项为

其中，参数κ_a1和κ_a2都是取值为正的常数。

其中，步骤iii)，具体为：

u_i为目标智能体i当前时刻的综合控制项，

为效益控制项，

为斥力控制项，

②若所述第二判断结果为否，则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项，并将所述斥力控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。

其中，步骤106，具体包括：

判断目标智能体当前时刻是否存在障碍物，得到第三判断结果。

若所述第三判断结果为是，则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项，根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算效益控制项，并将所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。

步骤105中，在执行所述计算斥力控制项之前还包括：判断区域是否完全覆盖，得到第四判断结果；若所述第四判断结果为否，则执行计算斥力控制项的步骤。

在实际应用中，上述实施例的一个具体实现流程如图3所示。

本实施例中的多智能体分布式协同动态覆盖方法，涉及智能体覆盖历史信息素图的本地更新及融合更新，设置了覆盖区域信息素的增益和衰减机制，并通过节点通信范围内邻居之间局部交互的自组织行为，执行各自覆盖历史信息的迭代和融合处理，可实现局部信息素图快速向全局信息素图的一致性逼近，使得每个智能体能够最大化累计覆盖面积及最小化多智能体覆盖区域的重叠部分。

本实施例中的多智能体分布式协同动态覆盖方法，涉及面向全局最优覆盖的多智能体分布式运动控制，构建了智能体每一时刻最大化收益方向的目标位置计算模型，并通过加权综合智能体避障控制、效益控制以及斥力控制这三项约束条件，实现了障碍物环境下多智能体协同覆盖系统的分布式智能化控制，在覆盖率及覆盖速度方面均具有显著优势，且具有可扩展性、自适应性及鲁棒性。

本实施例中的多智能体分布式协同动态覆盖方法实现了对动态目标区域的快速完全覆盖。与现有技术相比，该方法具有以下优点：

(1)该方法不需要预知先验知识，无需智能体事先进行路径规划。

(2)该方法无需进行全局通信，只需要智能体邻居之间进行局部感知和信息交互，通信次数少，算法简单，具有良好的节能性，且可实现在线实时决策。

(3)该方法是分布式无中心的，智能体节点可以自由地加入或退出覆盖任务而不影响整个系统的运行，可实现全局最优动态覆盖，并且支持异构智能体之间的协作，能有效协同大规模智能体进行按需动态覆盖，因而具有良好的可扩展性和灵活性。

(4)该方法支持存在障碍物的情况下实现快速完全覆盖，并且在智能体数量固定的条件下，可以将任务区域内每个小单元格的未覆盖时长控制在一定的范围内，从而使得任务区域中不存在长期未被覆盖的盲点。

本发明还提供了一种多智能体分布式协同动态覆盖系统，图4为本发明实施例提供的多智能体分布式协同动态覆盖系统的结构图。

参见图4，本实施例的多智能体分布式协同动态覆盖系统包括：

数据获取模块201，用于获取目标智能体当前时刻的位置和当前时刻的速度；

本地更新模块202，用于更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图；

判断模块203，用于判断邻居节点集是否为空，得到第一判断结果；所述邻居节点集为目标智能体通信范围内的所有智能体的集合；

融合更新模块204，用于若所述第一判断结果为否，则接收所述邻居节点集发送的消息包，并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图；所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图；

第一综合控制项计算模块205，用于基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项；所述综合控制项为斥力控制项和效益控制项加权求和而成，或为斥力控制项、效益控制项和避障控制项加权求和而成；

第二综合控制项计算模块206，用于若所述第一判断结果为是，则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项；所述综合控制项为效益控制项加权而成，或为避障控制项和效益控制项加权求和而成；

数据更新模块207，用于由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度，并将下一时刻作为当前时刻再返回所述本地更新模块202。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种多智能体分布式协同动态覆盖方法，其特征在于，包括：

获取目标智能体当前时刻的位置和当前时刻的速度；

2.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图，计算目标智能体当前时刻的综合控制项，具体包括：

计算斥力控制项；

3.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项，具体包括：

4.根据权利要求2所述的一种多智能体分布式协同动态覆盖方法，其特征在于，在所述计算斥力控制项之前还包括：

判断区域是否完全覆盖，得到第四判断结果；

若所述第四判断结果为否，则执行计算斥力控制项的步骤。

5.根据权利要求2所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项，具体包括：

6.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述更新目标智能体上一时刻的覆盖信息素图，得到目标智能体当前时刻的本地更新信息素图，具体为：

7.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图，得到目标智能体当前时刻的融合更新信息素图，具体为：

为邻居节点集

中的智能体j当前时刻t的本地更新信息素图。

8.根据权利要求5所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置，具体包括：

σ₁和σ₂均为取值为正的常数，

其中，

x_j为邻居节点集

为邻居节点集。

9.根据权利要求5所述的一种多智能体分布式协同动态覆盖方法，其特征在于，所述将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项，具体为：

其中，u_i为目标智能体i当前时刻的综合控制项，

为效益控制项，

为斥力控制项，

10.一种多智能体分布式协同动态覆盖系统，其特征在于，包括：