CN110618690B - 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 - Google Patents

一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 Download PDF

Info

Publication number
CN110618690B
CN110618690B CN201810634753.6A CN201810634753A CN110618690B CN 110618690 B CN110618690 B CN 110618690B CN 201810634753 A CN201810634753 A CN 201810634753A CN 110618690 B CN110618690 B CN 110618690B
Authority
CN
China
Prior art keywords
node
action
uuv
semi
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810634753.6A
Other languages
English (en)
Other versions
CN110618690A (zh
Inventor
梁洪涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN201810634753.6A priority Critical patent/CN110618690B/zh
Publication of CN110618690A publication Critical patent/CN110618690A/zh
Application granted granted Critical
Publication of CN110618690B publication Critical patent/CN110618690B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/04Control of altitude or depth
    • G05D1/06Rate of change of altitude or depth
    • G05D1/0692Rate of change of altitude or depth specially adapted for under-water vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,属于水下无人系统建模与仿真领域。首先,在设计UUV巡逻、探测和趋向目标的基本行为动作的基础上,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;其次,利用扩展合同网协议形成分布式结构局部网络,设计约束条件下递阶控制模型和基本行为动作浓度变化决策模型,实现对入侵目标的局部围捕。本发明从全局网络和局部网络的交互通信角度出发,融合免疫网络与市场机制建模优势,不仅可以实现通信量和计算规模的同步减少,而且可以保障协商模型的鲁棒性和健壮性。

Description

一种基于免疫网络与市场机制的多UUV系统动态协商建模 方法
技术领域
本发明属于水下无人系统建模与仿真技术领域,具体涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法。
背景技术
多UUV系统是由多个无人水下航行器(Unmanned underwater vehicle,UUV)构成,可形成一个具有探测、通信、作战等功能的水下作战信息网络。相比较于单UUV,其具有三个明显的优势:(1)分布性,多UUV可以通过在水下空间、时间、资源和功能上分布性,实现UUV在更深、更广的复杂环境条件下执行各类作业任务;(2)协同性,通过协同化信息共享,实现控制、通讯、信号采集等过程的无缝协作,发挥“狼群”式协同作业,可以提高水下无人系统的作战效能;(3)容错性,多UUV系统中的单个UUV出现故障或失效时,通过多UUV系统内部的协作与协调,形成互补,保证整个系统的可靠性与鲁棒性,正是由于上述3优势,多UUV系统成为水下无人系统研究的重点。
如何实现多UUV之间的协商建模成为决定多UUV系统作战效能的关键问题,一个动态、高效的协商方法对于任务分配、路径规划、规避障碍、协同搜索等所有群体决策的实现具有决定性作用。目前,多UUV系统的协商建模方法主要分为集中式和分布式两类,由于集中式协商方法难以适应动态的水下环境和繁杂的作战使命,分布式方法成为实现多UUV系统协商建模的主流,主要包括行为建模、自组织建模和市场理论建模等,这些方法虽然在具体应用场景中取得了比较丰富的成果,但是一些问题同样不能忽视,例如基于行为建模方法虽然在约束条件下考虑环境信息感知映射到具体行为模式,但是只能应用于UUV规模较小的应用场景,而且无法实现全局最优;基于自组织建模方法可以实现多UUV系统的动态协商与合作,特别是在围捕目标和避障等应用过程中,但是其不具备UUV的退出/加入机制,缺乏容错性;基于市场理论方法主要通过模拟市场经济行为通过拍卖算法和合同网协议实现个体之间的协商,但是由于采用广播通信方式随着规模增大,通信量剧增,影响协商合作的实时性。为了克服以上缺点,因此希望开发出复杂约束条件下具有动态协商效率高的协商建模方法,实现多UUV系统自组织完成对敌方目标的围捕。
发明内容
为了克服现有技术中存在的已有分布式协调模型在多UUV系统围捕敌方目标应用中出现的问题,本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,实现对敌方入侵目标的围捕作业。
本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,设计UUV巡逻、探测和趋向目标的基本行为动作,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;利用扩展合同网协议及其通信动作形成分布式结构的局部网络,根据约束条件下递阶控制模型和基本行为动作浓度变化决策模型,实现多UUV系统对入侵目标的局部围捕。
本发明要解决的技术问题通过以下技术方案实现:一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,包括以下步骤:
步骤1:定义UUV基本行为动作Ai,包括:航行巡逻A1、感知探测A2和趋向目标A3,其中Ai∈[A1,A2,A3],i=1,2,3;
步骤2:由N个UUV节点xk∈[x1,x2,···,xN]构成多UUV系统的分布式全局网络GN,初始化所有UUV节点xk采取所述航行巡逻A1动作;
步骤3:当M个敌方入侵移动目标yh∈[y1,y2,···,yM]入侵多UUV系统的全局网络GN时,所述UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络LNp,p=1,2,3…M,Ω=Rc∪Rd定义为局部网络LNi的大小,Ωs=Rd-Rc定义为局部网络LNp的边缘,其中Rd为探测范围,Rc为通信范围;
在所述局部网络LNp中UUV节点xk角色划分为虚拟中央节点、激活节点和半激活节点;
步骤4:若所述UUV节点xk通过执行所述感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,再从感知探测A2转向趋向目标A3,并采用广播模式以通信动作中的发送信息动作向所述局部网络LNp内的其他UUV节点发送围捕请求和目标信息;
步骤5:若UUV节点xl,k≠l在虚拟中央节点的通信范围Rc内,则其作为激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,同时,激活节点xl执行约束条件下的递阶决策控制模型;
步骤6:若UUV节点xl,k≠l位于局部网络LNp的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,同时,半激活节点xl执行所述步骤5的约束条件下的递阶决策控制模型;若满足约束条件的决策判断,则根据其基本行为动作的交互强度水平C进行决策选择;
步骤7:当UUV节点xl作为激活节点,虚拟中央节点以通信动作中的接受动作发送接受激活节点xl投标以作为对其通信动作中的建议动作的回应,或者虚拟中央节点以通信动作Reject发送拒绝激活节点xl投标以作为对其通信动作Refuse的回应;
步骤8:当UUV节点xl作为半激活节点,虚拟中央节点以通信动作中的接受动作发送接受半激活节点xl投标以作为对其通信动作中的建议动作的回应,此时xl的角色由半激活节点变成激活节点;或者虚拟中央节点以通信动作Reject发送拒绝半激活节点xl投标以作为对其通信动作Refuse的回应;
步骤9:虚拟中央节点与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵移动目标yh的围捕。
进一步的,所述步骤5中激活节点xl执行约束条件下的递阶决策控制模型的具体步骤为:
步骤5.1:判断围捕任务时间窗口约束
围捕任务执行窗口时间为T=Ts-Te,且满足公式(1):
Tmin≤T≤Tmax (1)
其中,Ts和Te为任务执行的最佳起始时间和结束时间,Tmin和Tmax为任务执行窗口的最小时间和最大时间;
如所述激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,则执行步骤5.2,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点;
骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集为SS={SS1,SS2,SS3,SS4,SS5,SS6},SS1表示健康,SS2表示机械故障,SS3表示电子故障,SS4表示机体损伤,SS5表示全部故障,SS6表示敌方击毁;
其中健康SS1,全部故障SS5和敌方击毁SS6的状态可靠度分别表示为fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算;
步骤5.3:判断电池能源状态约束
定义激活节点xl电池能源状态约束如下:
Figure GDA0003562635320000051
式中,
Figure GDA0003562635320000052
表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态;如激活节点xl电池能源状态约束大于最低阈值
Figure GDA0003562635320000053
则以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
进一步的,所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为:
步骤5.2.1:电子故障SS3的失效概率fS3(x)的分布函数用正态分布表示:
Figure GDA0003562635320000054
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数;
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
Figure GDA0003562635320000055
Figure GDA0003562635320000061
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数;
如激活节点xl自身状态可靠度fssm(x)大于其对应的状态预设阈值fmin,即
Figure GDA0003562635320000064
m=1,2,3,4,5,6;则执行步骤5.3,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
进一步的,所述步骤6中半激活节点xl基本行为动作的交互强度水平C定义为:
Figure GDA0003562635320000062
式中,
Figure GDA0003562635320000063
表示半激活节点xl采取基本行为动作Ai在t时刻的交互强度水平;C1表示多UUV系统中个体之间基本行为动作的交互强度水平,C2表示半激活节点xl与入侵移动目标yh的交互强度水平,C3表示环境误差模型引起的随机误差干扰水平,C4表示半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平。
进一步的,所述步骤6中半激活节点xl执行所述步骤5.1~步骤5.3的约束条件下的递阶决策控制模型。
进一步的,所述多UUV系统中个体之间基本行为动作的交互强度水平C1、半激活节点xl与入侵移动目标yh之间的交互强度水平C2、环境误差模型引起的随机误差干扰水平C3和半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4的具体计算步骤为:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1
Figure GDA0003562635320000071
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示虚拟中央节点基本行为动作Ai与半激活节点xl基本行为动作Aj之间的交互系数;
步骤6.2:计算半激活节点xl与入侵移动目标yh之间的交互强度水平C2
Figure GDA0003562635320000072
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度,yh(t)表示第h个敌方入侵移动目标的浓度,i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数;
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3
C3环境误差模型引起的随机误差干扰水平采用分数布朗运动来描述误差的随机性,具体定义为:
C3(t)=c1b-Hsin(bt+d1)+c2b-2Hsin(b2t+d2)+c3b-3Hsin(b3t+d3)+…+cqb-qHsin(bqt+dq)(12)
式中,定数b>1,cq是服从均值为0方差为1的正态分布变量,dq是在区间0≤dq≤2π服从均匀分布的变量,H∈(0,1)表示粗糙度指数;
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4
Figure GDA0003562635320000081
式中,
Figure GDA0003562635320000082
表示自然死亡率,τ表示压缩常数;
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai的交互强度水平,采取如下基本行为动作浓度变化决策模型进行决策:
IF C(A1)<C(A3),THEN A3 (14)
IF C(A1)>C(A3),THEN A1
(15)
对于半激活节点xl,如基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,则根据公式(14)选择基本行为动作交互强度水平最高的A3,同时以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点;否则,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
与现有技术相比,本发明的有益效果:在定义基本行为动作的基础上,利用合同网协议通信动作实现UUV双方之间的招标-投标-中标通信交互,在此基础上设计约束条件下的UUV投标控制与决策模型,实现了通信量和计算规模递阶式减少,进而提高了交互过程的实时性,又利用免疫网络的动力学模型实现了不同角色UUV基本行为动作的快速决策,而且不会因为UUV模型功能缺失而导致围捕任务的失败,具有很强的鲁棒性和健壮性,进而大大提高了多UUV系统围捕敌方入侵目标的效率和质量。
附图说明
图1是基于免疫网络与市场机制的多UUV系统动态协商建模方法示意图;
图2是面向约束条件的递阶决策控制模型原理图;
图3初始化多UUV节点分布;
图4迭代次数k=50(发现敌方潜艇入侵);
图5迭代次数k=100(围攻敌方潜艇目标);
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,本实施例提供一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,设计UUV巡逻、探测和趋向目标的基本行为动作,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;利用扩展合同网协议形成分布式结构局部网络,根据基本行为动作浓度的变化的决策模型,设计通信动作模型实现对入侵目标的局部围攻。具体步骤如下:
步骤1:定义UUV基本行为动作主要包括:航行巡逻A1、感知探测A2和趋向目标A3,即Ai∈[A1,A2,A3],i=1,2,3。
步骤2:由N个UUV节点xk∈[x1,x2,···,xN]构成多UUV系统形成分布式全局网络(Global Network,GN),初始化所有UUV节点采取基本行为动作A1
步骤3:由M个敌方入侵移动目标yh∈[y1,y2,···,yM]入侵多UUV系统的全局网络GN,UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络(LocalNetwork,LN)LNp,p=1,2,3…M,Ω=Rc∪Rd定义为LNp的大小,Ωs=Rd-Rc定义为LNp的边缘,其中Rd为探测范围,Rc为通信范围。在LNi中xk角色划分为虚拟中央节点、激活节点和半激活节点。
步骤4:如果UUV节点xk通过执行基本行为动作感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,从基本行为动作A2转向基本行为动作A3,并采用广播模式以通信动作中的发送信息动作向LNi内的其他UUV节点发送围捕请求和目标信息。
步骤5:如果UUV节点xl,k≠l在虚拟中央节点的通信范围Rc内,则其作为激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,确保双方双向交互行为的联通。同时,激活节点xl执行约束条件下的递阶决策控制模型,如图2所示,具体步骤如下:
步骤5.1:判断围捕任务时间窗口约束
由于作业环境具有复杂性和动态性、敌方目标具有隐蔽性和欺骗性、突发事件具有随机性和实效性等特点,因此激活节点xl在参与任务动态规划与协调过程中,会存在一个最佳时间阶段Tf=[Ts,Te],其中Ts和Te为任务执行的最佳起始时间和结束时间,则任务执行窗口时间T=Ts-Te需要满足:
Tmin≤T≤Tmax (1)
其中,Tmin和Tmax为任务执行窗口的最小时间和最大时间。如果激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,执行步骤5.2,反之,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
步骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集SS={SS1,SS2,SS3,SS4,SS5,SS6}描述和刻画UUV自身健康状态的各个方面,如表1所示。
表1 UUV自身健康状态
Figure GDA0003562635320000111
Figure GDA0003562635320000121
具体的自身健康状态通过可靠性理论相关的数学概率进行表示,其中SS1,SS5和SS6的状态可靠度分别表示fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,而SS2、SS3和SS4需要首先计算其失效概率,再由其失效概率计算状态可靠度。SS2、SS3和SS4的状态可靠度分别计算为:
步骤5.2.1:电子故障SS3失效概率fS3(x)的分布函数用正态分布表示:
Figure GDA0003562635320000122
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数。
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
Figure GDA0003562635320000123
Figure GDA0003562635320000124
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数。
如果激活节点xl自身状态可靠度fssm(x)大于其对应的状态预设阈值fmin,即
Figure GDA0003562635320000131
m=1,2,3,4,5,6;执行步骤5.3,反之,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
步骤5.3:判断电池能源状态约束
由于UUV的水下作战作任务复杂、潜航时间长、航程距离远等原因,对能源状态的要求一般较高,特别是目前UUV使用的电池提供能源方式,这是因为电池可以不受水下环境、下潜深度等因素,同时具有高隐蔽性和低噪音的优势。因此,定义激活节点xl电池能源状态约束如下:
Figure GDA0003562635320000132
式中,
Figure GDA0003562635320000133
表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态。如果激活节点xl电池能源状态约束大于最低阈值,以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点,反之,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
步骤6:如果UUV节点xl,k≠l位于局部网络LNp的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,确保双方双向交互行为的联通。同时,xl立刻执行步骤5.1~5.3的约束条件下递阶决策控制模型,与激活节点的判断流程一致。如果满足约束条件的决策判断,由于其接受其他xN∩l节点的多个基本行为动作交互请求,则需要根据其基本行为动作的交互强度水平C来进行决策选择。其中,交互强度水平C定义为:
Figure GDA0003562635320000134
式中,
Figure GDA0003562635320000141
表示半激活节点xl采取Ai基本行为动作在t时刻的交互强度水平。交互强度水平C主要由C1、C2、C3和C4四项组成,C1表示多UUV系统中个体之间基本行为动作的交互强度水平;C2表示半激活节点xl与入侵移动目标yh的交互强度水平;C3作为环境误差模型引起的随机误差干扰水平,用来保证在建模过程中的交互行为等信息的相对真实性;C4表示半激活节点xl采取Ai行为策略没有发生交互关系而引起的非交互强度水平。具体的C1、C2、C3和C4计算步骤如下:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1
Figure GDA0003562635320000142
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示xk基本行为动作Ai与xl基本行为动作Aj之间的交互系数。
步骤6.2:计算敌方入侵目标yh与xl之间的交互强度水平C2
Figure GDA0003562635320000143
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度,yh(t)表示第h个敌方入侵移动目标的浓度,i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数。
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3
C3环境误差模型引起的随机误差干扰水平采用分数布朗运动FBM(FractionalBrownian Motion)来描述误差的随机性,具体定义为:
C3(t)=c1b-Hsin(bt+d1)+c2b-2H sin(b2t+d2)+c3b-3H sin(b3t+d3)+…+cqb-qHsin(bqt+dq)(12)
式中,定数b>1,cq是服从均值为0方差为1的正态分布变量,dq是在区间0≤dq≤2π服从均匀分布的变量,H∈(0,1)表示粗糙度指数。
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4
Figure GDA0003562635320000151
式中,
Figure GDA0003562635320000152
表示自然死亡率,τ表示压缩常数。
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai的交互强度水平,具体采取如下基本行为动作浓度变化决策模型来进行决策:
IF C(A1)<C(A3),THEN A3
(14)
IF C(A1)>C(A3),THEN A1
(15)
对于半激活节点xl,如果基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,根据公式(14)选择基本行为动作交互强度水平最高的A3,则说明需要更多UUV模型趋向目标参与围捕任务,同时以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点;反之,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点。
步骤7:当UUV节点xl作为激活节点,虚拟中央节点以通信动作中的接受动作发送接受激活节点xl投标以作为对其通信动作中的建议动作的回应,或者以通信动作Reject发送拒绝激活节点xl投标以作为对其通信动作Refuse的回应;
步骤8:当UUV节点xl作为半激活节点,虚拟中央节点以通信动作中的接受动作发送接受半激活节点xl投标以作为对其通信动作中的建议动作的回应,此时xl的角色由半激活节点变成激活节点;或者以通信动作Reject发送拒绝半激活节点xl投标以作为对其通信动作Refuse的回应;
步骤9:虚拟中央节点与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵目标yh的围捕。
根据上述发明的多UUV系统动态协商建模方法,假设在10000×10000单位范围的海域,20个UUV抽象为二维Agent运动质点执行基本行为动作A1,形成全局网络搜索潜艇,如图3所示。当迭代次数k=50,敌方潜艇(Enemy Target)出现在位置(2000,5000),Agent8经基本行为动作A2首先探测到目标,如图4所示,其基本行为动作立刻变为A3,并作为局部网络的虚拟中央节点。利用局部网络的合同网通信协议及其通信动作,Agent8立刻向通信范围和探测范围内的其他Agent发送目标入侵信息。其他Agent(激活节点和半激活节点)进行约束条件下递阶决策控制和基本行为动作浓度决策判断。最后,即使Agent17发生故障失效的情况下,所有激活节点Agent也可以形成对入侵目标的围捕,如图5所示。
总的来说,本发明提出的一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,不仅可以实现通信量和计算规模的同步减少,而且可以保障协商模型的鲁棒性和健壮性,具有重要的理论研究和工程应用价值。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (6)

1.一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,其特征在于:包括以下步骤:
步骤1:定义UUV基本行为动作Ai,包括:航行巡逻A1、感知探测A2和趋向目标A3,其中Ai∈[A1,A2,A3],i=1,2,3;
步骤2:由N个UUV节点xk∈[x1,x2,···,xN]构成多UUV系统的分布式全局网络GN,初始化所有UUV节点xk采取所述航行巡逻A1动作;
步骤3:当M个敌方入侵移动目标yh∈[y1,y2,···,yM]入侵多UUV系统的全局网络GN时,所述UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络LNp,p=1,2,3…M,Ω=Rc∪Rd定义为局部网络LNp的大小,Ωs=Rd-Rc定义为局部网络LNp的边缘,其中Rd为探测范围,Rc为通信范围;
在所述局部网络LNp中UUV节点xk角色划分为虚拟中央节点、激活节点和半激活节点;
步骤4:若所述UUV节点xk通过执行所述感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,再从感知探测A2转向趋向目标A3,并采用广播模式以通信动作中的发送信息动作向所述局部网络LNp内的其他UUV节点发送围捕请求和目标信息;
步骤5:若UUV节点xl,k≠l在虚拟中央节点的通信范围Rc内,则其作为激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,同时,激活节点xl执行约束条件下的递阶决策控制模型;
步骤6:若UUV节点xlk≠l位于局部网络LNp的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作中的确认动作向虚拟中央节点发送确认信息,同时,半激活节点xl执行所述步骤5的约束条件下的递阶决策控制模型;若满足约束条件的决策判断,则根据其基本行为动作的交互强度水平C进行决策选择;
步骤7:当UUV节点xl作为激活节点,虚拟中央节点以通信动作中的接受动作发送接受激活节点xl投标以作为对其通信动作中的建议动作的回应,或者虚拟中央节点以通信动作中的拒绝动作发送拒绝激活节点xl投标以作为对其通信动作中的拒绝动作的回应;
步骤8:当UUV节点xl作为半激活节点,虚拟中央节点以通信动作中的接受动作发送接受半激活节点xl投标以作为对其通信动作中的建议动作的回应,此时xl的角色由半激活节点变成激活节点;或者虚拟中央节点以通信动作中的拒绝动作发送拒绝半激活节点xl投标以作为对其通信动作的回应;
步骤9:虚拟中央节点与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵移动目标yh的围捕。
2.根据权利要求1所述的方法,其特征在于:所述步骤5中激活节点xl执行约束条件下的递阶决策控制模型的具体步骤为:
步骤5.1:判断围捕任务时间窗口约束
围捕任务执行窗口时间为T=Ts-Te,且满足公式(1):
Tmin≤T≤Tmax (1)
其中,Ts和Te为任务执行的最佳起始时间和结束时间,Tmin和Tmax为任务执行窗口的最小时间和最大时间;
如所述激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,则执行步骤5.2,否则,以通信动作中的拒绝动作发送拒绝投标信息RD给虚拟中央节点;
骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集为SS={SS1,SS2,SS3,SS4,SS5,SS6},SS1表示健康,SS2表示机械故障,SS3表示电子故障,SS4表示机体损伤,SS5表示全部故障,SS6表示敌方击毁;
其中健康SS1,全部故障SS5和敌方击毁SS6的状态可靠度分别表示为fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算;
步骤5.3:判断电池能源状态约束
定义激活节点xl电池能源状态约束如下:
Figure FDA0003552388380000031
式中,
Figure FDA0003552388380000032
表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态;如激活节点xl电池能源状态约束大于最低阈值
Figure FDA0003552388380000033
则以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点,否则,以通信动作中的拒绝动作发送拒绝投标信息RD给虚拟中央节点。
3.根据权利要求2所述的方法,其特征在于:所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为:
步骤5.2.1:电子故障SS3的失效概率fS3(x)的分布函数用正态分布表示:
Figure FDA0003552388380000041
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数;
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
Figure FDA0003552388380000042
Figure FDA0003552388380000043
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数;
如激活节点xl自身状态可靠度fssm(x)大于其对应的状态预设阈值fmin,即
Figure FDA0003552388380000044
m=1,2,3,4,5,6;则执行步骤5.3,否则,以通信动作中的拒绝动作发送拒绝投标信息RD给虚拟中央节点。
4.根据权利要求1所述的方法,其特征在于:所述步骤6中半激活节点xl基本行为动作的交互强度水平C定义为:
Figure FDA0003552388380000045
式中,
Figure FDA0003552388380000046
表示半激活节点xl采取基本行为动作Ai在t时刻的交互强度水平;C1表示多UUV系统中个体之间基本行为动作的交互强度水平,C2表示半激活节点xl与入侵移动目标yh的交互强度水平,C3表示环境误差模型引起的随机误差干扰水平,C4表示半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平。
5.根据权利要求2所述的方法,其特征在于:所述步骤6中半激活节点xl执行所述步骤5.1~步骤5.3的约束条件下的递阶决策控制模型。
6.根据权利要求4所述的方法,其特征在于:所述多UUV系统中个体之间基本行为动作的交互强度水平C1、半激活节点xl与入侵移动目标yh之间的交互强度水平C2、环境误差模型引起的随机误差干扰水平C3和半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4的具体计算步骤为:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1
Figure FDA0003552388380000051
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示虚拟中央节点基本行为动作Ai与半激活节点xl基本行为动作Aj之间的交互系数;
步骤6.2:计算半激活节点xl与入侵移动目标yh之间的交互强度水平C2
Figure FDA0003552388380000061
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度,yh(t)表示第h个敌方入侵移动目标的浓度,i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数;
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3
环境误差模型引起的随机误差干扰水平C3采用分数布朗运动来描述误差的随机性,具体定义为:
C3(t)=c1b-H sin(bt+d1)+c2b-2Hsin(b2t+d2)+c3b-3Hsin(b3t+d3)+…+cqb-qHsin(bqt+dq)
(12)
式中,定数b>1,cq是服从均值为0方差为1的正态分布变量,dq是在区间0≤dq≤2π服从均匀分布的变量,H∈(0,1)表示粗糙度指数,q为大于3的正整数;
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4
Figure FDA0003552388380000062
式中,
Figure FDA0003552388380000063
表示自然死亡率,τ表示压缩常数;
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai的交互强度水平,采取如下基本行为动作浓度变化决策模型进行决策:
IF C(A1)<C(A3),THEN A3
(14)
IF C(A1)>C(A3),THEN A1
(15)
对于半激活节点xl,如基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,则根据公式(14)选择基本行为动作交互强度水平最高的A3,同时以通信动作中的建议动作发送投标意愿信息BD给虚拟中央节点;否则,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作中的拒绝动作发送拒绝投标信息RD给虚拟中央节点。
CN201810634753.6A 2018-06-20 2018-06-20 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 Active CN110618690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810634753.6A CN110618690B (zh) 2018-06-20 2018-06-20 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810634753.6A CN110618690B (zh) 2018-06-20 2018-06-20 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法

Publications (2)

Publication Number Publication Date
CN110618690A CN110618690A (zh) 2019-12-27
CN110618690B true CN110618690B (zh) 2022-06-07

Family

ID=68920798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810634753.6A Active CN110618690B (zh) 2018-06-20 2018-06-20 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法

Country Status (1)

Country Link
CN (1) CN110618690B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1452935A2 (en) * 2003-02-28 2004-09-01 Fuji Jukogyo Kabushiki Kaisha Control system using immune network and control method
CN104392279A (zh) * 2014-11-19 2015-03-04 天津大学 一种多智能体结构的微电网优化运行方法
CN105843227A (zh) * 2016-04-15 2016-08-10 上海大学 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN107133416A (zh) * 2017-05-24 2017-09-05 西北工业大学 一种uuv多层次混杂式免疫智能体结构建模方法
CN107193009A (zh) * 2017-05-23 2017-09-22 西北工业大学 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1452935A2 (en) * 2003-02-28 2004-09-01 Fuji Jukogyo Kabushiki Kaisha Control system using immune network and control method
CN104392279A (zh) * 2014-11-19 2015-03-04 天津大学 一种多智能体结构的微电网优化运行方法
CN105843227A (zh) * 2016-04-15 2016-08-10 上海大学 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法
CN107193009A (zh) * 2017-05-23 2017-09-22 西北工业大学 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法
CN107133416A (zh) * 2017-05-24 2017-09-05 西北工业大学 一种uuv多层次混杂式免疫智能体结构建模方法

Also Published As

Publication number Publication date
CN110618690A (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
Alsamhi et al. Survey on artificial intelligence based techniques for emerging robotic communication
Tartakovsky et al. Change-point detection in multichannel and distributed systems with applications
US8977582B2 (en) Spiking neuron network sensory processing apparatus and methods
US9123127B2 (en) Contrast enhancement spiking neuron network sensory processing apparatus and methods
CN112433856A (zh) 无人机蜂群网去中心化自治决策方法
Goncharenko Subjective entropy maximum principle for preferences functions of alternatives given in the view of logical conditions
CN113312172B (zh) 基于适变网络的多无人机集群动态任务调度模型
CN108093213B (zh) 一种基于视频监控的目标轨迹模糊数据融合方法
US9398268B2 (en) Method and system for cooperative diversity visual cognition in wireless video sensor networks
Sardouk et al. Multi-agent system based wireless sensor network for crisis management
CN110618690B (zh) 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法
CN113743565B (zh) 一种基于群体体系结构的无人机蜂群反制方法
CN110618689B (zh) 一种约束条件下基于合同网的多uuv系统协商合作建模方法
Liu et al. Behavioral Decision-Making Approach for Vehicle Platoon Control: Two Noncooperative Game Models
CN116067232A (zh) 一种基于“引领式”群驱离的无人机群诱导反制方法与系统
CN110618607B (zh) 一种基于行为的多uuv自组织协调控制方法
Zhou et al. A task assignment strategy for multi-AUV collaborative hunting problem
Mathews et al. Scalable decentralised control for multi-platform reconnaissance and information gathering tasks
Nakamura et al. Towards a flexible event-detection model for wireless sensor networks
CN113311700B (zh) 一种非平均机制引导的uuv集群协同控制方法
Luo et al. A Fast and Robust Solution for Common Knowledge Formation in Decentralized Swarm Robots
Airlangga et al. A novel architectural design for solving lost-link problems in UAV collaboration
Schranz et al. Resource-aware dynamic clustering utilizing state estimation in visual sensor networks
Marino et al. Fuzzy behavioral control for multi-robot border patrol
Beynier Cooperative multiagent patrolling for detecting multiple illegal actions under uncertainty

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant