CN110618690A

CN110618690A - 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法

Info

Publication number: CN110618690A
Application number: CN201810634753.6A
Authority: CN
Inventors: 梁洪涛
Original assignee: Shaanxi Normal University
Current assignee: Shaanxi Normal University
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2019-12-27
Anticipated expiration: 2038-06-20
Also published as: CN110618690B

Abstract

本发明涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，属于水下无人系统建模与仿真领域。首先，在设计UUV巡逻、探测和趋向目标的基本行为动作的基础上，利用改进的免疫网络实现基本行为动作浓度的变化，以此形成分布式结构的全局网络；其次，利用扩展合同网协议形成分布式结构局部网络，设计约束条件下递阶控制模型和基本行为动作浓度变化决策模型，实现对入侵目标的局部围捕。本发明从全局网络和局部网络的交互通信角度出发，融合免疫网络与市场机制建模优势，不仅可以实现通信量和计算规模的同步减少，而且可以保障协商模型的鲁棒性和健壮性。

Description

一种基于免疫网络与市场机制的多UUV系统动态协商建模方法

技术领域

本发明属于水下无人系统建模与仿真技术领域，具体涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法。

背景技术

多UUV系统是由多个无人水下航行器(Unmanned underwater vehicle，UUV)构成，可形成一个具有探测、通信、作战等功能的水下作战信息网络。相比较于单UUV，其具有三个明显的优势：(1)分布性，多UUV可以通过在水下空间、时间、资源和功能上分布性，实现UUV在更深、更广的复杂环境条件下执行各类作业任务；(2)协同性，通过协同化信息共享，实现控制、通讯、信号采集等过程的无缝协作，发挥“狼群”式协同作业，可以提高水下无人系统的作战效能；(3)容错性，多UUV系统中的单个UUV出现故障或失效时，通过多UUV系统内部的协作与协调，形成互补，保证整个系统的可靠性与鲁棒性，正是由于上述3优势，多UUV系统成为水下无人系统研究的重点。

如何实现多UUV之间的协商建模成为决定多UUV系统作战效能的关键问题，一个动态、高效的协商方法对于任务分配、路径规划、规避障碍、协同搜索等所有群体决策的实现具有决定性作用。目前，多UUV系统的协商建模方法主要分为集中式和分布式两类，由于集中式协商方法难以适应动态的水下环境和繁杂的作战使命，分布式方法成为实现多UUV系统协商建模的主流，主要包括行为建模、自组织建模和市场理论建模等，这些方法虽然在具体应用场景中取得了比较丰富的成果，但是一些问题同样不能忽视，例如基于行为建模方法虽然在约束条件下考虑环境信息感知映射到具体行为模式，但是只能应用于UUV规模较小的应用场景，而且无法实现全局最优；基于自组织建模方法可以实现多UUV系统的动态协商与合作，特别是在围捕目标和避障等应用过程中，但是其不具备UUV的退出/加入机制，缺乏容错性；基于市场理论方法主要通过模拟市场经济行为通过拍卖算法和合同网协议实现个体之间的协商，但是由于采用广播通信方式随着规模增大，通信量剧增，影响协商合作的实时性。为了克服以上缺点，因此希望开发出复杂约束条件下具有动态协商效率高的协商建模方法，实现多UUV系统自组织完成对敌方目标的围捕。

发明内容

为了克服现有技术中存在的已有分布式协调模型在多UUV系统围捕敌方目标应用中出现的问题，本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，实现对敌方入侵目标的围捕作业。

本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，设计UUV巡逻、探测和趋向目标的基本行为动作，利用改进的免疫网络实现基本行为动作浓度的变化，以此形成分布式结构的全局网络；利用扩展合同网协议及其通信动作形成分布式结构的局部网络，根据约束条件下递阶控制模型和基本行为动作浓度变化决策模型，实现多UUV系统对入侵目标的局部围捕。

本发明要解决的技术问题通过以下技术方案实现：一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，包括以下步骤：

步骤1：定义UUV基本行为动作A_i，包括：航行巡逻A₁、感知探测A₂和趋向目标A₃，其中A_i∈[A_1,A₂,A₃],i＝1,2,3；

步骤2：由N个UUV节点x_k∈[x₁,x₂,···,x_N]构成多UUV系统的分布式全局网络GN，初始化所有UUV节点x_k采取所述航行巡逻A₁动作；

步骤3：当M个敌方入侵移动目标y_h∈[y₁,y₂,···,y_M]入侵多UUV系统的全局网络GN时，所述UUV节点x_k感知探测到入侵移动目标y_h，形成M个集中式结构的局部网络LN_i(i＝1,2…M)，Ω＝R_c∪R_d定义为局部网络LN_i的大小，Ω_s＝R_d-R_c定义为局部网络LN_i的边缘，其中R_d为探测范围，R_c为通信范围；

在所述局部网络LN_i中UUV节点x_k角色划分为虚拟中央节点、激活节点和半激活节点；

步骤4：若所述UUV节点x_k通过执行所述感知探测A₂首先探测到入侵移动目标y_h，则其自动成为虚拟中央节点，再从感知探测A₂转向趋向目标A₃，并采用广播模式以通信动作Sending-Information向所述局部网络LN_i内的其他UUV节点发送围捕请求和目标信息；

步骤5：若UUV节点x_l(k≠l)在虚拟中央节点x_k的通信范围R_c内，则其作为激活节点通过通信动作Confirm向虚拟中央节点x_k发送确认信息，同时，激活节点x_l执行约束条件下的递阶决策控制模型；

步骤6：若UUV节点x_l(k≠l)位于局部网络LN_i的边缘Ω_s＝R_d-R_c，则其作为半激活节点通过通信动作Confirm向虚拟中央节点x_k发送确认信息，同时，半激活节点x_l执行所述步骤5的约束条件下的递阶决策控制模型；若满足约束条件的决策判断，则根据其基本行为动作的交互强度水平C进行决策选择；

步骤7：当UUV节点x_l作为激活节点，虚拟中央节点x_k以通信动作Accept发送接受激活节点x_l投标以作为对其通信动作Propose的回应，或者虚拟中央节点x_k以通信动作Reject发送拒绝激活节点x_l投标以作为对其通信动作Refuse的回应；

步骤8：当UUV节点x_l作为半激活节点，中央虚拟节点x_k以通信动作Accept发送接受半激活节点x_l投标以作为对其通信动作Propose的回应，此时x_l的角色由半激活节点变成激活节点；或者中央虚拟节点x_k以通信动作Reject发送拒绝半激活节点x_l投标以作为对其通信动作Refuse的回应；

步骤9：中央虚拟节点x_k与所有激活节点x_l共同以基本行为动作A₃趋向目标实现对入侵移动目标y_h的围捕。

进一步的，所述步骤5中激活节点x_l执行约束条件下的递阶决策控制模型的具体步骤为：

步骤5.1：判断围捕任务时间窗口约束

围捕任务执行窗口时间为T＝T_s-T_e，且满足公式(1)：

T_min≤T≤T_max (1)

其中，T_s和T_e为任务执行的最佳起始时间和结束时间，T_min和T_max为任务执行窗口的最小时间和最大时间；

如所述激活节点x_l参与完成围捕任务的时间T满足T_min≤T≤T_max，则执行步骤5.2，否则，以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k；

骤5.2：判断UUV自身健康状态约束

UUV自身健康状态集为SS＝{SS1,SS2,SS3,SS4,SS5,SS6}，SS1表示健康，SS2表示机械故障，SS3表示电子故障，SS4表示机体损伤，SS5表示全部故障，SS6表示敌方击毁；

其中健康SS1，全部故障SS5和敌方击毁SS6的状态可靠度分别表示为f_SS1(x)＝1.0、f_SS5(x)＝0和f_SS6(x)＝0，机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算；

步骤5.3：判断电池能源状态约束

定义激活节点x_l电池能源状态约束如下：

式中，表示UUV完成任务所需能源的最低阈值，P(t)表示当前UUV的能源状态；如激活节点x_l电池能源状态约束大于最低阈值则以通信动作Propose发送投标意愿信息B_D给虚拟中央节点x_k，否则，以通信动作Refuse发送投标拒绝信息R_D给虚拟中央节点x_k。

进一步的，所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为：

步骤5.2.1：电子故障SS3的失效概率f_S3(x)的分布函数用正态分布表示：

则电子故障SS3可靠度f_SS3(x)表示为

f_SS3(x)＝1-f_S3(x) (3)

其中，μ和σ是正态分布参数；

步骤5.2.2：机械故障SS2和机体损伤SS4的失效概率f_S2(x)和f_S4(x)的分布函数用指数分布表示：

则机械故障SS2和机体损伤SS4的可靠度f_SS2(x)和f_SS4(x)分别表示为

f_SS2(x)＝1-f_S2(x) (6)

f_SS4(x)＝1-f_S4(x) (7)

其中，λ是指数分布参数；

如激活节点x_l自身状态可靠度f_SSi(x)大于其对应的状态预设阈值f_min，即则执行步骤5.3，否则，以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k。

进一步的，所述步骤6中半激活节点x_l基本行为动作的交互强度水平C定义为：

式中，表示半激活节点x_l采取基本行为动作A_i在t时刻的交互强度水平；C₁表示多UUV系统中个体之间基本行为动作的交互强度水平，C₂表示半激活节点x_l与入侵移动目标y_h的交互强度水平，C₃表示环境误差模型引起的随机误差干扰水平，C₄表示半激活节点x_l采取UUV基本行为动作A_i行为策略没有发生交互关系而引起的非交互强度水平。

进一步的，所述步骤6中半激活节点x_l执行所述步骤5.1～步骤5.3的约束条件下的递阶决策控制模型。

进一步的，所述多UUV系统中个体之间基本行为动作的交互强度水平C₁、半激活节点x_l与入侵移动目标y_h之间的交互强度水平C₂、环境误差模型引起的随机误差干扰水平C₃和半激活节点x_l采取UUV基本行为动作A_i行为策略没有发生交互关系而引起的非交互强度水平C₄的具体计算步骤为：

步骤6.1：计算多UUV系统中个体之间基本行为动作的交互强度水平C₁：

式中，c_i(t)和c_j(t)分别表示t时刻半激活节点x_l采取A_i基本行为动作的浓度和虚拟中央节点x_k采取A_j基本行为动作的浓度，i,j＝1,2,3；C_d表示通信范围R_c内的UUV数量集合cr∈C_d；U_ij表示虚拟中央节点x_k基本行为动作A_i与半激活节点x_l基本行为动作A_j之间的交互系数；

步骤6.2：计算半激活节点x_l与入侵移动目标y_h之间的交互强度水平C₂：

式中：c_i(t)表示t时刻半激活节点x_l采取A_i基本行为动作的浓度和第h个敌方入侵移动目标的浓度y_h(t)，i＝1,2,3，h＝1,2,…,M；D_d表示探测范围R_d内的入侵移动目标数量集合h∈R_d，W_lh表示半激活节点x_l基本行为动作A_i与入侵移动目标y_h之间的交互系数；

步骤6.3：计算环境误差模型引起的随机误差干扰水平C₃：

C₃环境误差模型引起的随机误差干扰水平采用分数布朗运动来描述误差的随机性，具体定义为：

式中，定数b＞1，c_i是服从均值为0方差为1的正态分布变量，d_i是在区间0≤d_i≤2π服从均匀分布的变量，H∈(0,1)表示粗糙度指数；

步骤6.4：计算半激活节点x_l采取基本行为动作A_i行为策略没有发生交互关系而引起的非交互强度水平C₄：

式中，λ表示自然死亡率，τ表示压缩常数；

步骤6.5：根据步骤6.1～6.4计算半激活节点x_l每个基本行为动作A_i(i＝1,2,3)的交互强度水平，采取如下基本行为动作浓度变化决策模型进行决策：

IFC(A₁)＜C(A₃),THEN A₃ (14)

IFC(A₁)＞C(A₃),THEN A₁ (15)

对于半激活节点x_l，如基本行为动作A₁的交互强度水平小于基本行为动作A₃的交互强度水平，则根据公式(14)选择基本行为动作交互强度水平最高的A₃，同时以通信动作Propose发送投标意愿信息R_D给虚拟中央节点x_k；否则，根据公式(15)选择基本行为动作交互强度水平最高的A₁，则其继续保持水下航行巡逻，以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k。

与现有技术相比，本发明的有益效果：在定义基本行为动作的基础上，利用合同网协议通信动作实现UUV双方之间的招标－投标－中标通信交互，在此基础上设计约束条件下的UUV投标控制与决策模型，实现了通信量和计算规模递阶式减少，进而提高了交互过程的实时性，又利用免疫网络的动力学模型实现了不同角色UUV基本行为动作的快速决策，而且不会因为UUV模型功能缺失而导致围捕任务的失败，具有很强的鲁棒性和健壮性，进而大大提高了多UUV系统围捕敌方入侵目标的效率和质量。

附图说明

图1是基于免疫网络与市场机制的多UUV系统动态协商建模方法示意图；

图2是面向约束条件的递阶决策控制模型原理图；

图3初始化多UUV节点分布；

图4迭代次数k＝50(发现敌方潜艇入侵)；

图5迭代次数k＝100(围攻敌方潜艇目标)；

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

如图1所示，本实施例提供一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，设计UUV巡逻、探测和趋向目标的基本行为动作，利用改进的免疫网络实现基本行为动作浓度的变化，以此形成分布式结构的全局网络；利用扩展合同网协议形成分布式结构局部网络，根据基本行为动作浓度的变化的决策模型，设计通信动作模型实现对入侵目标的局部围攻。具体步骤如下：

步骤1：定义UUV基本行为动作主要包括：航行巡逻A₁、感知探测A₂和趋向目标A₃，即A_i∈[A₁,A₂,A₃],i＝1,2,3。

步骤2：由N个UUV节点x_k∈[x₁,x₂,···,x_N]构成多UUV系统形成分布式全局网络(Global Network,GN)，初始化所有UUV节点采取基本行为动作A₁。

步骤3：由M个敌方入侵移动目标y_h∈[y₁,y₂,···,y_M]入侵多UUV系统的全局网络GN，UUV节点x_k感知探测到入侵移动目标y_h，形成M个集中式结构的局部网络(LocalNetwork,LN)LN_i(i＝1,2…M)，Ω＝R_c∪R_d定义为LN_i的大小，Ω_s＝R_d-R_c定义为LN_i的边缘，其中R_d为探测范围，R_c为通信范围。在LN_i中x_k角色划分为虚拟中央节点、激活节点和半激活节点。

步骤4：如果UUV节点x_k通过执行基本行为动作感知探测A₂首先探测到入侵移动目标y_h，则其自动成为虚拟中央节点，从基本行为动作A₂转向基本行为动作A₃，并采用广播模式以通信动作Sending-Information向LN_i内的其他UUV节点发送围捕请求和目标信息。

步骤5：如果UUV节点x_l(k≠l)在x_k的通信范围R_c内，则其作为激活节点通过通信动作Confirm向虚拟中央节点x_k发送确认信息，确保双方双向交互行为的联通。同时，激活节点x_l执行约束条件下的递阶决策控制模型，如图2所示，具体步骤如下：

步骤5.1：判断围捕任务时间窗口约束

由于作业环境具有复杂性和动态性、敌方目标具有隐蔽性和欺骗性、突发事件具有随机性和实效性等特点，因此激活节点x_l在参与任务动态规划与协调过程中，会存在一个最佳时间阶段T_f＝[T_s,T_e]，其中T_s和T_e为任务执行的最佳起始时间和结束时间，则任务执行窗口时间T＝T_s-T_e需要满足：

T_min≤T≤T_max (1)

其中,T_min和T_max为任务执行窗口的最小时间和最大时间。如果激活节点x_l参与完成围捕任务的时间T满足T_min≤T≤T_max，执行步骤5.2，反之，以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k。

步骤5.2：判断UUV自身健康状态约束

UUV自身健康状态集SS＝{SS1,SS2,SS3,SS4,SS5,SS6}描述和刻画UUV自身健康状态的各个方面，如表1所示。

表1UUV自身健康状态

具体的自身健康状态通过可靠性理论相关的数学概率进行表示，其中SS1,SS5和SS6的状态可靠度分别表示f_SS1(x)＝1.0、f_SS5(x)＝0和f_SS6(x)＝0，而SS2、SS3和SS4需要首先计算其失效概率，再由其失效概率计算状态可靠度。SS2、SS3和SS4的状态可靠度分别计算为：

步骤5.2.1：电子故障SS3失效概率f_S3(x)的分布函数用正态分布表示：

则电子故障SS3可靠度f_SS3(x)表示为

f_SS3(x)＝1-f_S3(x) (3)

其中，μ和σ是正态分布参数。

f_SS2(x)＝1-f_S2(x) (6)

f_SS4(x)＝1-f_S4(x) (7)

其中，λ是指数分布参数。

如果激活节点x_l自身状态可靠度f_SSi(x)大于其对应的状态预设阈值f_min，即执行步骤5.3，反之,以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k。

步骤5.3：判断电池能源状态约束

由于UUV的水下作战作任务复杂、潜航时间长、航程距离远等原因，对能源状态的要求一般较高，特别是目前UUV使用的电池提供能源方式，这是因为电池可以不受水下环境、下潜深度等因素，同时具有高隐蔽性和低噪音的优势。因此，定义激活节点x_l电池能源状态约束如下：

式中，表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态。如果激活节点x_l电池能源状态约束大于最低阈值，以通信动作Propose发送投标意愿信息B_D给虚拟中央节点x_k，反之，以通信动作Refuse发送投标拒绝信息R_D给虚拟中央节点x_k。

步骤6：如果UUV节点x_l(k≠l)位于局部网络LN_i的边缘Ω_s＝R_d-R_c，则其作为半激活节点通过通信动作Confirm向虚拟中央节点x_k发送确认信息，确保双方双向交互行为的联通。同时，x_l立刻执行步骤5.1～5.3的约束条件下递阶决策控制模型，与激活节点的判断流程一致。如果满足约束条件的决策判断，由于其接受其他x_N∩l节点的多个基本行为动作交互请求，则需要根据其基本行为动作的交互强度水平C来进行决策选择。其中，交互强度水平C定义为：

式中，表示半激活节点x_l采取A_i基本行为动作在t时刻的交互强度水平。交互强度水平C主要由C₁、C₂、C₃和C₄四项组成，C₁表示多UUV系统中个体之间基本行为动作的交互强度水平；C₂表示半激活节点x_l与入侵移动目标y_h的交互强度水平；C₃作为环境误差模型引起的随机误差干扰水平，用来保证在建模过程中的交互行为等信息的相对真实性；C₄表示半激活节点x_l采取A_i行为策略没有发生交互关系而引起的非交互强度水平。具体的C₁、C₂、C₃和C₄计算步骤如下：

式中，c_i(t)和c_j(t)分别表示t时刻半激活节点x_l采取A_i基本行为动作的浓度和虚拟中央节点x_k采取A_j基本行为动作的浓度，i,j＝1,2,3；C_d表示通信范围R_c内的UUV数量集合cr∈C_d；U_ij表示x_k基本行为动作A_i与x_l基本行为动作A_j之间的交互系数。

步骤6.2：计算敌方入侵目标y_h与x_l之间的交互强度水平C₂：

式中：c_i(t)表示t时刻半激活节点x_l采取A_i基本行为动作的浓度和第h个敌方入侵移动目标的浓度y_h(t)，i＝1,2,3，h＝1,2,…,M；D_d表示探测范围R_d内的入侵移动目标数量集合h∈R_d，W_lh表示半激活节点x_l基本行为动作A_i与入侵移动目标y_h之间的交互系数。

步骤6.3：计算环境误差模型引起的随机误差干扰水平C₃：

C₃环境误差模型引起的随机误差干扰水平采用分数布朗运动FBM(FractionalBrownian Motion)来描述误差的随机性，具体定义为：

式中，定数b＞1，c_i是服从均值为0方差为1的正态分布变量，d_i是在区间0≤d_i≤2π服从均匀分布的变量，H∈(0,1)粗糙度指数是为了保证随机误差的合理性，消除变量的大幅度波动。

式中，λ表示自然死亡率，τ表示压缩常数。

步骤6.5：根据步骤6.1～6.4计算半激活节点x_l每个基本行为动作A_i(i＝1,2,3)的交互强度水平，具体采取如下基本行为动作浓度变化决策模型来进行决策：

IF C(A₁)＜C(A₃),THEN A₃ (14)

IF C(A₁)＞C(A₃),THEN A₁ (15)

对于半激活节点x_l，如果基本行为动作A₁的交互强度水平小于基本行为动作A₃的交互强度水平，根据公式(14)选择基本行为动作交互强度水平最高的A₃，则说明需要更多UUV模型趋向目标参与围捕任务，同时以通信动作Propose发送投标意愿信息R_D给虚拟中央节点x_k；反之，根据公式(15)选择基本行为动作交互强度水平最高的A₁，则其继续保持水下航行巡逻，以通信动作Refuse发送拒绝投标信息R_D给虚拟中央节点x_k。

步骤7：当UUV节点x_l作为激活节点，中央虚拟节点x_k以通信动作Accept发送接受激活节点x_l投标以作为对其通信动作Propose的回应，或者以通信动作Reject发送拒绝激活节点x_l投标以作为对其通信动作Refuse的回应；

步骤8：当UUV节点x_l作为半激活节点，中央虚拟节点x_k以通信动作Accept发送接受半激活节点x_l投标以作为对其通信动作Propose的回应，此时x_l的角色由半激活节点变成激活节点；或者以通信动作Reject发送拒绝半激活节点x_l投标以作为对其通信动作Refuse的回应；

步骤9：中央虚拟节点x_k与所有激活节点x_l共同以基本行为动作A₃趋向目标实现对入侵目标y_h的围捕。

根据上述发明的多UUV系统动态协商建模方法，假设在10000×10000单位范围的海域，20个UUV抽象为二维Agent运动质点执行基本行为动作A₁，形成全局网络搜索潜艇，如图3所示。当迭代次数k＝50，敌方潜艇(Enemy Target)出现在位置(2000,5000)，Agent8经基本行为动作A₂首先探测到目标，如图4所示，其基本行为动作立刻变为A₃，并作为局部网络的虚拟中央节点。利用局部网络的合同网通信协议及其通信动作，Agent8立刻向通信范围和探测范围内的其他Agent发送目标入侵信息。其他Agent(激活节点和半激活节点)进行约束条件下递阶决策控制和基本行为动作浓度决策判断。最后，即使Agent17发生故障失效的情况下，所有激活节点Agent也可以形成对入侵目标的围捕，如图5所示。

总的来说，本发明提出的一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，不仅可以实现通信量和计算规模的同步减少，而且可以保障协商模型的鲁棒性和健壮性，具有重要的理论研究和工程应用价值。以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于免疫网络与市场机制的多UUV系统动态协商建模方法，其特征在于：包括以下步骤：

步骤1：定义UUV基本行为动作A_i，包括：航行巡逻A₁、感知探测A₂和趋向目标A₃，其中A_i∈[A₁,A₂,A₃],i＝1,2,3；

步骤2：由N个UUV节点x_k∈[x₁,x₂,…,x_N]构成多UUV系统的分布式全局网络GN，初始化所有UUV节点x_k采取所述航行巡逻A₁动作；

步骤3：当M个敌方入侵移动目标y_h∈[y₁,y₂,…,y_M]入侵多UUV系统的全局网络GN时，所述UUV节点x_k感知探测到入侵移动目标y_h，形成M个集中式结构的局部网络LN_i(i＝1,2…M)，Ω＝R_c∪R_d定义为局部网络LN_i的大小，Ω_s＝R_d-R_c定义为局部网络LN_i的边缘，其中R_d为探测范围，R_c为通信范围；

2.根据权利要求1所述的方法，其特征在于：所述步骤5中激活节点x_l执行约束条件下的递阶决策控制模型的具体步骤为：

步骤5.1：判断围捕任务时间窗口约束

围捕任务执行窗口时间为T＝T_s-T_e，且满足公式(1)：

T_min≤T≤T_max (1)

骤5.2：判断UUV自身健康状态约束

步骤5.3：判断电池能源状态约束

定义激活节点x_l电池能源状态约束如下：

3.根据权利要求2所述的方法，其特征在于：所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为：

则电子故障SS3可靠度f_SS3(x)表示为

f_SS3(x)＝1-f_S3(x) (3)

其中，μ和σ是正态分布参数；

f_SS2(x)＝1-f_S2(x) (6)

f_SS4(x)＝1-f_S4(x) (7)

其中，λ是指数分布参数；

4.根据权利要求1所述的方法，其特征在于：所述步骤6中半激活节点x_l基本行为动作的交互强度水平C定义为：

5.根据权利要求2所述的方法，其特征在于：所述步骤6中半激活节点x_l执行所述步骤5.1～步骤5.3的约束条件下的递阶决策控制模型。

6.根据权利要求4所述的方法，其特征在于：所述多UUV系统中个体之间基本行为动作的交互强度水平C₁、半激活节点x_l与入侵移动目标y_h之间的交互强度水平C₂、环境误差模型引起的随机误差干扰水平C₃和半激活节点x_l采取UUV基本行为动作A_i行为策略没有发生交互关系而引起的非交互强度水平C₄的具体计算步骤为：

步骤6.3：计算环境误差模型引起的随机误差干扰水平C₃：

式中，λ表示自然死亡率，τ表示压缩常数；

IFC(A₁)＜C(A₃),THENA₃ (14)

IFC(A₁)＞C(A₃),THEN A₁ (15)