CN112862251B

CN112862251B - 一种基于改进pi算法的分布式多auv任务分配方法

Info

Publication number: CN112862251B
Application number: CN202110038319.3A
Authority: CN
Inventors: 杨惠珍; 王强
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2024-02-09
Anticipated expiration: 2041-01-12
Also published as: CN112862251A

Abstract

本发明涉及一种基于改进PI算法的分布式多AUV任务分配方法，属于多AUV任务分配领域。采用动态分组分配策略来加速任务分配方案的收敛，提出一种新的任务交换方法并将其加入到经典PI算法的三阶段体系中来解决局部最优问题。仿真结果表明，与经典PI算法相比，改进PI算法可以在不需要更多迭代次数的前提下很好地解决局部最优问题并能保证产生的任务分配方案是无冲突的。

Description

一种基于改进PI算法的分布式多AUV任务分配方法

技术领域

本发明属于多AUV任务分配技术领域，具体涉及一种基于改进PI算法的分布式多AUV任务分配方法。

背景技术

AUV的任务分配是多自主水下机器人研究领域的根本问题，体现了多AUV系统高层自组织形式与运行机制，是多AUV系统目标实现的基础。具体来说，它解决的是多个AUV在协同执行多个任务时哪个AUV执行哪些任务，同时还需要确定每个AUV执行任务的先后顺序。任务分配的结果会影响整个多AUV系统效能，而且还会关系到每艘AUV能否最大限度地使用自身资源。因此，多AUV任务分配方法的研究具有重要的意义。

当前，多AUV任务分配问题已显示为NP难题，获得全局最优解的计算量很大。早期的研究使用集中式方法来生成任务分配结果，以通过使用能够收集整个系统信息的中央服务器来协作所有AUV。通过这种方法，可以基于中央服务器上所有AUV信息的完整收集，显著地最小化或最大化所关注问题的总体目标函数。

但是，集中式任务分配方法有着显著的缺点，特别是对于大型系统而言。第一，集中式任务分配方法要求中央服务器和每个智能体之间保持一致和完整的通信，这就使得服务器增加了沉重的通信负担，并且还缩小了任务覆盖范围。第二，因为所有计算操作都放在中央服务器上，在任务执行的过程中，中央服务器必须跟踪每个智能体的基本内部知识的变化，导致该方法的计算需求很高，第三，集中式任务分配方法容易遭受单点故障。

在实际应用中，由于每个AUV不能知晓全局信息且只能与相邻的AUV进行通信，因此研究分布式的多AUV任务分配方法显然是更有意义的。现有技术中，捆绑算法(CBBA)和性能影响算法(PI算法)是对分布式的多AUV任务分配方法进行研究的主要方法。

捆绑算法(CBBA)在一个捆绑包构建阶段和冲突解决阶段之间进行迭代，从而在所有智能体中实现无冲突的解决方案。同时CBBA也被证明了可以在所有智能体情境意识不一致和通信网络拓扑变化的情况下收敛到无冲突的分配方案上。

性能影响算法(PI算法)能够用于解决多智能体和多任务分配问题，并引入了重要性的新概念来衡量任务对每辆车产生的本地成本的贡献。在优化总体目标时，该算法考虑了任务之间的协同作用，因此，可以通过在不同智能体之间切换任务以满足特定标准来降低执行任务的总体成本。已被证明了该方法的有效性及其与CBBA相比的出色性能。

PI算法作为最新的分布式任务分配算法已被广大学者用于救援任务的研究中。但是，由于PI算法旨在将每个任务的重要性往小的方向进行共识，因此容易陷入局部最优，因为在特定情况下，小的重要性并不能代表最优的任务分配方案。因此，设计一种新的方法来解决局部最优问题显得尤为重要。

发明内容

本发明解决的技术问题是：为了解决最新的分布式任务分配算法(PI算法)容易陷入局部最优的问题，本发明提供一种基于改进PI算法的分布式多AUV任务分配方法。

本发明的技术方案是：一种基于改进PI算法的分布式多AUV任务分配方法，包括以下步骤：

步骤1：定义有n个AUV(v₁,v₂,...,v_n)，需要执行m个任务(t₁,t₂,...,t_m)；采用集中式的方法对需要执行的任务进行预分配，预分配结果使得对应位置的AUV执行对应位置的任务，得出的分配结果作为分布式任务分配的迭代初值，并开始迭代过程；

步骤2：对步骤1中AUV进行分区块配置，其中每个块中的AUV的数量大于等于2，且要求所有块的并集包含通信图的所有边缘；每个AUV根据块配置确定本次迭代自身所属的块，并计算块内总任务其中，T′表示块内总任务，T^j表示块内成员的执行任务集合，B表示当前块；

步骤3：基于性能影响算法(PI算法)，得到共识后的任务分配结果；

步骤4：判断步骤3中的分配任务结果和上次的迭代一样，则进入任务交换阶段；否则，跳至步骤5；其中进入任务交换阶段包括以下子步骤：

子步骤4.1：AUV将对自身所在块内的所有任务执行步骤4.2至步骤4.12以其中的某一任务Task_p为例；

子步骤4.2：由任务分配列表β找出Task_p所属的AUV，记为v_i；

子步骤4.3：找出块内除了v_i的所有AUV所包含的任务集合T^*＝T′\a_i；

子步骤4.4：对T^*内的所有任务，循环执行步骤4.5至步骤4.9；

子步骤4.5：将当前所要交换的任务记为Task_q；

子步骤4.6：由任务分配列表β找出Task_q所属的AUV，记为v_j；

子步骤4.7：找出当v_i放弃执行Task_p转而去执行Task_q的收益，记为

子步骤4.8：找出当v_j放弃执行Task_q转而去执行Task_p的收益，记为

子步骤4.9：如果则将profit及Task_p、Task_q作为一组数据记录在表Data中；

子步骤4.10：找出表Data中profit最大的数据所对应的Task_p、Task_q；

子步骤4.11：更新任务分配列表β，β_p＝j,β_q＝i；

子步骤4.12：更新RPI列表γ_p，其中找出v_i放弃执行Task_p转而去执行Task_q则所执行的所有任务的RPI变化情况，并在对应任务位置更新γ_p；v_j同上；

步骤5：若更新结果已经收敛，则结束；否则，跳至步骤2，进行新一轮任务分配。

本发明进一步的技术方案是：所述步骤3中的PI算法采用A HeuristicDistributed Task Allocation Method for Multivehicle Multitask Problems andIts Application to Search and Rescue Scenario及A novel distributed schedulingalgorithm for time-critical multi-agent systems文中的描述。

本发明进一步的技术方案是：所述步骤2中的分区块配置采用The block-information-sharing strategy for task allocation:A case study for structureassembly with aerial robots文中的块配置。

本发明进一步的技术方案是：所述m的取值范围为m∈[10,100]。

本发明进一步的技术方案是：所述n的取值范围为n∈[10,100]。

发明效果

本发明的技术效果在于：本发明所提出的一种基于改进PI算法的分布式多AUV任务分配方法，采用动态分组分配(BIS)策略来加速任务分配方案的收敛，提出了新的任务交换方法并将其加入到原算法的三阶段体系中来解决局部最优问题。仿真结果表明，与经典的PI算法相比，改进PI算法可以在不需要更多迭代次数的前提下很好地解决局部最优问题并能保证产生的任务分配方案是无冲突的。

附图说明

图1为算法流程图

图2为AUV通信拓扑图

图3为BIS策略下的两种块配置

图4为冲突解决方案

图5为可能出现的局部最优现象

图6为初始时刻的任务分配结果图

图7为基于PI算法的分布式任务分配结果

图8为基于改进PI算法的分布式任务分配结果

图9为两种算法的任务执行代价变化图

具体实施方式

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

参见图1-图9，为了使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

一种基于改进PI算法的分布式多AUV任务分配方法，算法同时在每个AUV上运行，步骤如下：

步骤1：采用集中式的方法对任务进行预分配，得出的分配结果作为分布式任务分配的迭代初值；

预分配包括任务聚类和任务排序两个阶段，任务聚类用来确定哪个AUV来执行哪些个任务，任务排序用来求得AUV执行其对应任务的最佳任务执行序列。

步骤2：确定本次迭代的块配置，计算块内总任务

Caraballo证明了块信息共享策略(BIS策略)可以加快收敛至最佳解决方案的速度。本方法采用BIS策略来实现AUV间的动态分组分配。

步骤3：任务包含阶段t_j∈T′\a_i；

步骤4：冲突解决阶段；

步骤5：任务移除阶段；

步骤6：如果共识后的任务分配结果和上次的一样(有可能陷入局部最优)，则进入任务交换阶段。否则，跳至步骤7；

提出一种新的任务交换方法来解决局部最优现象，同时必须保证任务分配的共识。

步骤7：如果结果已经收敛或者足够好，则结束。否则，跳至步骤2；

这里评判任务分配方案的指标设计为执行所有任务的航程总和。

本方法所考虑的多AUV系统分布式任务分配问题是指在一定区域内，由n个异构AUV(v₁,v₂,...,v_n)执行m个任务(t₁,t₂,...,t_m)且m>n，每个AUV只能根据收到的邻居AUV的信息和任务信息进行任务分配，最终形成的任务分配方案需使得异构多AUV系统的任务执行代价全局最优且每个AUV执行的任务序列是无冲突的。

AUV的异构性体现在每个AUV携带的资源数量不同(资源数量设定为整数，反映AUV能执行多少个任务)以及航行速度不同。v_i的有序任务列表描述为其中|a_i|是分配给v_i的任务数量。令d(a_i)表示a_i的总行驶距离，则：

任务分配的目标可以描述为：

图1为本发明实施例的流程图。如图1所示，本发明所提出的一种基于改进PI算法的分布式多AUV任务分配方法，包括以下步骤：

步骤1：采用集中式的方法对任务进行聚类并对任务进行排序，得出的分配结果作为分布式任务分配的迭代初值；

用Tⁱ表示分配给v_i的任务集。值得注意的是，如果AUV的信息不一致，则不同的AUV将获得不同的聚类结果，那么某些任务可能属于两个或多个不同的AUV的优先级任务集。由于此处产生的任务冲突将会在之后的冲突解决阶段与其余AUV进行交流后被消除，因此允许存在此类冲突。

步骤2：确定本次迭代的块配置，计算块内总任务

由于AUV的通信范围有限，因此假设AUV只能与邻居共享信息。AUV之间的关系可以描述为一个通信图，其中每个节点都对应一个AUV，并且两个节点之间的连接表示两个AUV之间可以相互通信并共享信息。图2显示了一个实际的AUV通信拓扑图。

将一个块定义为通信图的连接子图，该子图用该块内AUV的索引表示。一个块配置是将通信图划分为多个块。BIS策略支持两个或多个块配置，但必须要求它们的并集包含通信图的所有边缘。图3显示了两个这样的块配置，由于它们的并集包含所有边缘，因此可以在策略中使用它们。

假设所有AUV都具有相同的迭代周期，即每个AUV同时开始新的迭代，则可以在分配开始之前确定算法中所使用的块配置并确定自己当前所在的块B，多AUV系统通过循环使用图3中的两种块配置来完成任务的重新分配，同时分配结果将收敛于最优分配。值得注意的是，在每次使用一种块配置以后，必须保证该种块配置下的每个块的分配结果是无冲突且局部最优的。

步骤3：任务包含阶段t_j∈T′\a_i

PI算法引入了两种新颖的概念来描述任务删除和任务加入对本地的任务执行序列所产生的影响，分别为移除性能影响(RPI)以及包容性能影响(IPI)：

任务t_k相对于其分配的v_i的RPI定义为：

其中，表示从任务序列a_i中移除任务t_k，c_i表示v_i执行相应的任务序列所花费的代价。PI算法中每个v_i都有自己的RPI列表γ_i＝[w_1,i,...,w_m,i]^T，i＝1,...,n用来存储所有任务的RPI。除了自己所要执行的任务被计算并存储在表中之外，其余任务相对于其对应AUV的RPI也被存储在表中。

任务t_k相对于其分配的v_i的IPI定义为：

其中表示将任务t_k插入到任务序列a_i中的第l个位置。同样地，PI算法为每个v_i编制了IPI列表/>i＝1,...,n用来存储所有任务的IPI。当任务已包含在AUV的任务列表中时，/>为无穷大值。

如果满足下式，则表明从v_i的任务列表a_i中删除任务t_k并将其添加到v_j的任务列表a_j中是可以降低总体成本的：

需要注意的是，将某一任务t_k从v_i的任务列表a_i中删除所得的RPI与再次将其添加到相同位置所得到的IPI具有相同的值。

为了促进共识，每个v_i还编制了任务分配列表β_i＝[β_i,1,...,β_i,m]^T，i＝1,...,n。该列表记录了将哪个任务分配给哪个AUV的分配情况。

通过比较全局任务的RPI列表γ_i和任务IPI列表(其中γ_i,k和/>分别是它们中的对应条目)，将最大目标减少对应的任务(即/>)添加到有序任务列表a_i的位置/>中。添加完成后，需要更新有序任务列表a_i中所有任务的RPI同时任务分配列表β_i的第/>个元素被更新为v_i，即/>循环执行上述操作，当不再满足条件或|a_i|已满足所能执行任务的最大数量时，该过程将停止。

步骤4：冲突解决阶段

v_i在执行冲突解决阶段之前，需要将其RPI列表γ_i进行备份得到列表副本在这个阶段，对/>以及β_i进行更新而不更新γ_i。v_i与块内的AUV成员交换RPI列表γ_i，任务分配列表β_i以及时间戳列表s_i。当收到所有成员的列表后，将根据图4中的冲突解决方案来更新RPI列表和任务分配列表，并执行三种行动(更新(γ_ij＝γ_kj,β_ij＝β_kj)、离开(γ_ij＝γ_ij,β_ij＝β_ij)以及重置/>)中的一种。该冲突解决方案已被证明对于整个智能体集合的情境意识不一致和通信网络拓扑变化均具有鲁棒性。

图4中的表为Consensus-Based Decentralized Auctions for Robust TaskAllocation一文中所述，在此基础上进行适当修改：

1)原文中的标价列表y在此对应文中的RPI列表γ；

2)原文中的获胜待代理列表z_i在此对应文中的AUV列表β；

3)文中的RPI列表γ_i是向下进行共识的，而原文中的标价列表y_i是向上进行共识的。

步骤5：任务删除阶段

v_i首先通过d_i＝a_i[β_i[a_i]≠v_i]找到打算从任务列表a_i中删除的一组任务，它表示a_i中的任务在共识以后的β_i中被标识为已分配给其他AUV，并将这组任务记为d_i。接下来逐一地删除任务，通过计算找出使得任务的RPI减小最大的任务来进行删除并更新a_i及d_i。由于d_i中的任务之间有很强的关联性，因此在每删除一个任务后，需重新计算任务列表a_i中剩余任务的RPI即γ_i[a_i]。重复执行上述删除任务的操作，直到d_i为空或不在满足上述条件为止。完成上述过程后需更新当前所在块B的其余AUV成员所执行任务的RPI，即/>

值得注意的是，由于v_i可能因为不再满足而退出任务删除阶段，即v_i随着任务的删除和其余任务的RPI更新到一定阶段后，并不认为自己应继续删除任务了，但当前所在块B的其余AUV成员仍以为v_i会删除掉所有的d_i，由于每次迭代必须保证块内是没有冲突的，故在这种情况下应重新回到步骤4冲突解决阶段继续发起共识。

下面对局部最优进行解释：PI算法中提到，当v_i所执行的任务达到其所能执行的最大任务个数时，便不会在任务包含阶段再去包含其他的任务，而当遇到这种情况时，v_i再想包含其余任务只能是等某次迭代的冲突解决阶段自己的任务被分配给其余的v_j后，才能在下次任务包含阶段再次包含任务，这时就很容易出现局部最优。

图5显示了可能出现的局部最优现象。图中的任务分配结果可以表示为a₁＝[12],a₂＝[34]，显然a₁＝[32],a₂＝[14]的任务代价更小，即AUV₁与AUV₂交换Task₁与Task₃的任务分配结果更优。这是由于AUV₂在达到其最大任务执行数后(假定为2个)，不再对其任务进行更新。由公式3可知，由于AUV₂执行Task₄的缘故，Task₃对于AUV₂来说具有较小的RPI。AUV₁在每次迭代的任务包含阶段仍会包含Task₃，但由于Task₃对于AUV₁的RPI较大且原则上是将任务的RPI向下共识，故在每次的冲突解决阶段，AUV₁都会被迫放弃对Task₃的争夺，而AUV₂继续保持执行Task₃。

假定v_i执行Task_p，v_j执行Task_q，则v_i放弃执行Task_p转而去执行Task_q的收益(即执行任务的代价的减少量)可被定义为：

若为正值，表明v_i放弃执行Task_p转而去执行Task_q会使得执行任务的代价减少，相反则表明放弃执行转而去执行会使得执行任务的代价增加。

v_j会存在一个来表明v_j放弃执行Task_q转而去执行Task_p的收益，如果满足下式，则表明v_i与v_j交换Task_p与Task_q会使得全局任务分配效果更优：

由于不仅需要实现块内成员对任务分配列表的共识，还应实现块内成员对RPI列表的共识。因此，不仅需要向块内成员发送自己放弃执行Task_p转而去执行Task_q的收益还应向块内成员发送若执行上述操作则所执行的所有任务的RPI变化情况。

本方法中，定义了任务交换阶段来允许实现上述的操作，在这个阶段，每个v_i都将计算自己的任务与当前块内其他成员的任务进行交换所产生的收益以及执行此操作所导致的所执行所有任务的RPI变化情况，并将其发送给当前块内其他成员，同时也将接收当前块内其他成员所发送的有关信息。当v_i接收到当前块内所有其他成员所发送的信息后，将对所有任务进行交换判断，看它与别的任务进行交换是否会使得全局更优。

值得注意的是，最终将只选择使得全局优化力度最大的一组任务交换操作来执行，而不是所有满足公式7的交换操作。这是由于每次的交换操作都将影响其余任务的RPI，故其余任务的任务交换收益将不再有效。这样的约定也使得任务交换的共识得以实现。

当AUV向块内成员发送并接收任务交换信息后，依次讨论块内总任务T′中的每个任务的归属情况并更新该任务的RPI值，具体的操作步骤如下所示：

步骤6.1：将当前所讨论的任务记为Task_p；

步骤6.2：由任务分配列表β找出Task_p所属的AUV，记为v_i；

步骤6.3：找出块内除了v_i的所有AUV所包含的任务集合T^*＝T′\a_i；

步骤6.4：对T^*内的所有任务，循环执行步骤6.5至步骤6.9；

步骤6.5：将当前所要交换的任务记为Task_q；

步骤6.6：由任务分配列表β找出Task_q所属的AUV，记为v_j；

步骤6.7：找出当v_i放弃执行Task_p转而去执行Task_q的收益，记为

步骤6.8：找出当v_j放弃执行Task_q转而去执行Task_p的收益，记为

步骤6.9：如果则将profit及Task_p、Task_q作为一组数据记录在表Data中；

步骤6.10：找出表Data中profit最大的数据所对应的Task_p、Task_q；

步骤6.11：更新任务分配列表β(β_p＝j,β_q＝i)；

步骤6.12：更新RPI列表γ_p(找出v_i放弃执行Task_p转而去执行Task_q则所执行的所有任务的RPI变化情况，并在对应任务位置更新γ_p。v_j同上。)

具体实施例：

步骤1：考虑由10个AUV去执行30个任务的情况，AUV采用的通信拓扑图及块配置如图3所示，AUV所携带的资源数量分别为{5465355354}。对于所提出方法的收敛准则，确定5次连续迭代无法获得更好的解决方案。

通过与基于PI算法的分布式任务分配方法的结果进行对比，分析本发明所提方法的优越性。

步骤2：初始时刻的任务分配结果图如图6所示，采用集中式的方法对任务进行聚类并对任务进行排序，得出的分配结果作为分布式任务分配的迭代初值。如AUV₂初始时刻的任务执行序列为a₂＝[1212529]，AUV₉初始时刻的任务执行序列为a₂＝[2220523]；

步骤3：图7显示了基于PI算法的分布式任务分配优化过程。由图可知，PI算法最终迭代出一个相对较为合理的任务分配结果。可以看出：

1)由于AUV₄、AUV₅、AUV₈及AUV₁₀距任务的距离较远，且其余AUV有足够的资源去执行全部的任务，故不再参与任务的执行，这是合理的；

2)每个被分配执行任务的AUV对于其所执行的任务均有合理的路线规划。

3)在AUV₆与AUV₉的任务分配中，出现了很明显的局部最优现象，显然AUV₆用Task₁₁去交换AUV₉的Task₂₄是更合理的。通过分析可以看出，AUV₉在达到其最大任务执行数后，不再对其任务进行更新，又由于Task₂₄对AUV₉来说具有很小的RPI，故很难在冲突解决阶段被重新分配给其余的AUV，因而造成了局部最优现象。

步骤4：图8显示了基于改进PI算法的分布式任务分配优化过程。图9显示了两种算法的任务执行代价变化图。由图可知：

1)改进的PI算法能有效解决了基本PI算法所出现的局部最优问题。AUV₆与AUV₉实现了任务的交换，处于多AUV右侧的AUV₉执行任务群的最右侧5个任务。此外，AUV₆与AUV₇也实现了任务的交换，使得任务分配结果更优。

2)基本PI算法收敛时的任务执行代价为109.3，而改进的PI算法收敛时的任务执行代价为102.6，显著降低了任务分配结果的任务执行代价。

3)改进的PI算法与基本PI算法都在迭代次数达到7时开始收敛，改进的PI算法并不需要更多的迭代次数。

Claims

1.一种基于改进PI算法的分布式多AUV任务分配方法，其特征在于，包括以下步骤：

步骤1：定义有n个AUVv₁,v₂,…,v_n，需要执行m个任务t₁,t₂,…,t_m；采用集中式的方法对需要执行的任务进行预分配，预分配结果使得对应位置的AUV执行对应位置的任务，得出的分配结果作为分布式任务分配的迭代初值，并开始迭代过程；

步骤3：基于PI算法，得到共识后的任务分配结果；

任务包含阶段t_j∈T′\a_i

PI算法引入了两种概念来描述任务删除和任务加入对本地的任务执行序列所产生的影响，分别为移除性能影响RPI以及包容性能影响IPI：

任务t_k相对于其分配的v_i的RPI定义为：

w_k,i(a_iΘt_k)＝c_i(a_i)-c_i(a_iΘt_k) (1)

其中，a_iΘt_k表示从任务序列a_i中移除任务t_k，c_i表示v_i执行相应的任务序列所花费的代价；PI算法中每个v_i都有自己的RPI列表γ_i＝[w_1,i,…,w_m,i]^T，i＝1,…,n用来存储所有任务的RPI；除了自己所要执行的任务被计算并存储在表中之外，其余任务相对于其对应AUV的RPI也被存储在表中；

任务t_k相对于其分配的v_i的IPI定义为：

其中表示将任务t_k插入到任务序列a_i中的第l个位置；同样地，PI算法为每个v_i编制了IPI列表/>用来存储所有任务的IPI；当任务已包含在AUV的任务列表中时，/>为无穷大值；

需要注意的是，将某一任务t_k从v_i的任务列表a_i中删除所得的RPI与再次将其添加到相同位置所得到的IPI具有相同的值；

为了促进共识，每个v_i还编制了任务分配列表β_i＝[β_i,1,...,β_i,m]^T，i＝1,...,n；该列表记录了将哪个任务分配给哪个AUV的分配情况；

通过比较全局任务的RPI列表γ_i和任务IPI列表其中γ_i,k和/>分别是它们中的对应条目，将最大目标减少对应的任务即/>添加到有序任务列表a_i的位置/>中；添加完成后，需要更新有序任务列表a_i中所有任务的RPI同时任务分配列表β_i的第/>个元素被更新为v_i，即/>循环执行上述操作，当不再满足条件或|a_i|已满足所能执行任务的最大数量时，该过程将停止；

冲突解决阶段中，

v_i在执行冲突解决阶段之前，需要将其RPI列表γ_i进行备份得到列表副本在这个阶段，对/>以及β_i进行更新而不更新γ_i；v_i与块内的AUV成员交换RPI列表γ_i，任务分配列表β_i以及时间戳列表s_i；当收到所有成员的列表后，将根据图4中的冲突解决方案来更新RPI列表和任务分配列表，并执行三种行动更新γ_ij＝γ_kj,β_ij＝β_kj、离开γ_ij＝γ_ij,β_ij＝β_ij以及重置γ_ij＝∞,/>)中的一种；该冲突解决方案已被证明对于整个智能体集合的情境意识不一致和通信网络拓扑变化均具有鲁棒性；

任务删除阶段中，v_i首先通过d_i＝a_i[β_i[a_i]≠v_i]找到打算从任务列表a_i中删除的一组任务，它表示a_i中的任务在共识以后的β_i中被标识为已分配给其他AUV，并将这组任务记为d_i；接下来逐一地删除任务，通过计算找出使得任务的RPI减小最大的任务来进行删除并更新a_i及d_i；由于d_i中的任务之间有很强的关联性，因此在每删除一个任务后，需重新计算任务列表a_i中剩余任务的RPI即γ_i[a_i]；重复执行上述删除任务的操作，直到d_i为空或不在满足上述条件为止；完成上述过程后需更新当前所在块B的其余AUV成员所执行任务的RPI，即/>

由于v_i可能因为不再满足而退出任务删除阶段，即v_i随着任务的删除和其余任务的RPI更新到一定阶段后，并不认为自己应继续删除任务了，但当前所在块B的其余AUV成员仍以为v_i会删除掉所有的d_i，由于每次迭代必须保证块内是没有冲突的，故在这种情况下应重新回到步骤4冲突解决阶段继续发起共识；

子步骤4.2：由任务分配列表β找出Task_p所属的AUV，记为v_i；

子步骤4.4：对T^*内的所有任务，循环执行步骤4.5至步骤4.9；

子步骤4.5：将当前所要交换的任务记为Task_q；

子步骤4.6：由任务分配列表β找出Task_q所属的AUV，记为v_j；

子步骤4.11：更新任务分配列表β，β_p＝j,β_q＝i；

2.如权利要求1所述的一种基于改进PI算法的分布式多AUV任务分配方法，其特征在于，所述m的取值范围为m∈[10,100]。

3.如权利要求1所述的一种基于改进PI算法的分布式多AUV任务分配方法，其特征在于，所述n的取值范围为n∈[10,100]。