CN110618690A - 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 - Google Patents
一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 Download PDFInfo
- Publication number
- CN110618690A CN110618690A CN201810634753.6A CN201810634753A CN110618690A CN 110618690 A CN110618690 A CN 110618690A CN 201810634753 A CN201810634753 A CN 201810634753A CN 110618690 A CN110618690 A CN 110618690A
- Authority
- CN
- China
- Prior art keywords
- node
- uuv
- action
- semi
- active
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000007246 mechanism Effects 0.000 title claims abstract description 13
- 230000009471 action Effects 0.000 claims abstract description 110
- 238000004891 communication Methods 0.000 claims abstract description 76
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 230000002452 interceptive effect Effects 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000003993 interaction Effects 0.000 claims description 45
- 238000009826 distribution Methods 0.000 claims description 18
- 230000003542 behavioural effect Effects 0.000 claims description 16
- 230000006378 damage Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 11
- 230000003213 activating effect Effects 0.000 claims description 10
- 230000007613 environmental effect Effects 0.000 claims description 9
- 150000001875 compounds Chemical class 0.000 claims description 6
- 230000036541 health Effects 0.000 claims description 6
- 230000009545 invasion Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 230000005653 Brownian motion process Effects 0.000 claims description 4
- 238000005537 brownian motion Methods 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000003862 health status Effects 0.000 claims description 3
- 239000004576 sand Substances 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 4
- 230000009467 reduction Effects 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 abstract description 2
- 230000001360 synchronised effect Effects 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 58
- 230000008569 process Effects 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 241000282461 Canis lupus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/04—Control of altitude or depth
- G05D1/06—Rate of change of altitude or depth
- G05D1/0692—Rate of change of altitude or depth specially adapted for under-water vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Mobile Radio Communication Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,属于水下无人系统建模与仿真领域。首先,在设计UUV巡逻、探测和趋向目标的基本行为动作的基础上,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;其次,利用扩展合同网协议形成分布式结构局部网络,设计约束条件下递阶控制模型和基本行为动作浓度变化决策模型,实现对入侵目标的局部围捕。本发明从全局网络和局部网络的交互通信角度出发,融合免疫网络与市场机制建模优势,不仅可以实现通信量和计算规模的同步减少,而且可以保障协商模型的鲁棒性和健壮性。
Description
技术领域
本发明属于水下无人系统建模与仿真技术领域,具体涉及一种基于免疫网络与市场机制的多UUV系统动态协商建模方法。
背景技术
多UUV系统是由多个无人水下航行器(Unmanned underwater vehicle,UUV)构成,可形成一个具有探测、通信、作战等功能的水下作战信息网络。相比较于单UUV,其具有三个明显的优势:(1)分布性,多UUV可以通过在水下空间、时间、资源和功能上分布性,实现UUV在更深、更广的复杂环境条件下执行各类作业任务;(2)协同性,通过协同化信息共享,实现控制、通讯、信号采集等过程的无缝协作,发挥“狼群”式协同作业,可以提高水下无人系统的作战效能;(3)容错性,多UUV系统中的单个UUV出现故障或失效时,通过多UUV系统内部的协作与协调,形成互补,保证整个系统的可靠性与鲁棒性,正是由于上述3优势,多UUV系统成为水下无人系统研究的重点。
如何实现多UUV之间的协商建模成为决定多UUV系统作战效能的关键问题,一个动态、高效的协商方法对于任务分配、路径规划、规避障碍、协同搜索等所有群体决策的实现具有决定性作用。目前,多UUV系统的协商建模方法主要分为集中式和分布式两类,由于集中式协商方法难以适应动态的水下环境和繁杂的作战使命,分布式方法成为实现多UUV系统协商建模的主流,主要包括行为建模、自组织建模和市场理论建模等,这些方法虽然在具体应用场景中取得了比较丰富的成果,但是一些问题同样不能忽视,例如基于行为建模方法虽然在约束条件下考虑环境信息感知映射到具体行为模式,但是只能应用于UUV规模较小的应用场景,而且无法实现全局最优;基于自组织建模方法可以实现多UUV系统的动态协商与合作,特别是在围捕目标和避障等应用过程中,但是其不具备UUV的退出/加入机制,缺乏容错性;基于市场理论方法主要通过模拟市场经济行为通过拍卖算法和合同网协议实现个体之间的协商,但是由于采用广播通信方式随着规模增大,通信量剧增,影响协商合作的实时性。为了克服以上缺点,因此希望开发出复杂约束条件下具有动态协商效率高的协商建模方法,实现多UUV系统自组织完成对敌方目标的围捕。
发明内容
为了克服现有技术中存在的已有分布式协调模型在多UUV系统围捕敌方目标应用中出现的问题,本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,实现对敌方入侵目标的围捕作业。
本发明提出一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,设计UUV巡逻、探测和趋向目标的基本行为动作,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;利用扩展合同网协议及其通信动作形成分布式结构的局部网络,根据约束条件下递阶控制模型和基本行为动作浓度变化决策模型,实现多UUV系统对入侵目标的局部围捕。
本发明要解决的技术问题通过以下技术方案实现:一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,包括以下步骤:
步骤1:定义UUV基本行为动作Ai,包括:航行巡逻A1、感知探测A2和趋向目标A3,其中Ai∈[A1,A2,A3],i=1,2,3;
步骤2:由N个UUV节点xk∈[x1,x2,···,xN]构成多UUV系统的分布式全局网络GN,初始化所有UUV节点xk采取所述航行巡逻A1动作;
步骤3:当M个敌方入侵移动目标yh∈[y1,y2,···,yM]入侵多UUV系统的全局网络GN时,所述UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络LNi(i=1,2…M),Ω=Rc∪Rd定义为局部网络LNi的大小,Ωs=Rd-Rc定义为局部网络LNi的边缘,其中Rd为探测范围,Rc为通信范围;
在所述局部网络LNi中UUV节点xk角色划分为虚拟中央节点、激活节点和半激活节点;
步骤4:若所述UUV节点xk通过执行所述感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,再从感知探测A2转向趋向目标A3,并采用广播模式以通信动作Sending-Information向所述局部网络LNi内的其他UUV节点发送围捕请求和目标信息;
步骤5:若UUV节点xl(k≠l)在虚拟中央节点xk的通信范围Rc内,则其作为激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,同时,激活节点xl执行约束条件下的递阶决策控制模型;
步骤6:若UUV节点xl(k≠l)位于局部网络LNi的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,同时,半激活节点xl执行所述步骤5的约束条件下的递阶决策控制模型;若满足约束条件的决策判断,则根据其基本行为动作的交互强度水平C进行决策选择;
步骤7:当UUV节点xl作为激活节点,虚拟中央节点xk以通信动作Accept发送接受激活节点xl投标以作为对其通信动作Propose的回应,或者虚拟中央节点xk以通信动作Reject发送拒绝激活节点xl投标以作为对其通信动作Refuse的回应;
步骤8:当UUV节点xl作为半激活节点,中央虚拟节点xk以通信动作Accept发送接受半激活节点xl投标以作为对其通信动作Propose的回应,此时xl的角色由半激活节点变成激活节点;或者中央虚拟节点xk以通信动作Reject发送拒绝半激活节点xl投标以作为对其通信动作Refuse的回应;
步骤9:中央虚拟节点xk与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵移动目标yh的围捕。
进一步的,所述步骤5中激活节点xl执行约束条件下的递阶决策控制模型的具体步骤为:
步骤5.1:判断围捕任务时间窗口约束
围捕任务执行窗口时间为T=Ts-Te,且满足公式(1):
Tmin≤T≤Tmax (1)
其中,Ts和Te为任务执行的最佳起始时间和结束时间,Tmin和Tmax为任务执行窗口的最小时间和最大时间;
如所述激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,则执行步骤5.2,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk;
骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集为SS={SS1,SS2,SS3,SS4,SS5,SS6},SS1表示健康,SS2表示机械故障,SS3表示电子故障,SS4表示机体损伤,SS5表示全部故障,SS6表示敌方击毁;
其中健康SS1,全部故障SS5和敌方击毁SS6的状态可靠度分别表示为fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算;
步骤5.3:判断电池能源状态约束
定义激活节点xl电池能源状态约束如下:
式中,表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态;如激活节点xl电池能源状态约束大于最低阈值则以通信动作Propose发送投标意愿信息BD给虚拟中央节点xk,否则,以通信动作Refuse发送投标拒绝信息RD给虚拟中央节点xk。
进一步的,所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为:
步骤5.2.1:电子故障SS3的失效概率fS3(x)的分布函数用正态分布表示:
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数;
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数;
如激活节点xl自身状态可靠度fSSi(x)大于其对应的状态预设阈值fmin,即则执行步骤5.3,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
进一步的,所述步骤6中半激活节点xl基本行为动作的交互强度水平C定义为:
式中,表示半激活节点xl采取基本行为动作Ai在t时刻的交互强度水平;C1表示多UUV系统中个体之间基本行为动作的交互强度水平,C2表示半激活节点xl与入侵移动目标yh的交互强度水平,C3表示环境误差模型引起的随机误差干扰水平,C4表示半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平。
进一步的,所述步骤6中半激活节点xl执行所述步骤5.1~步骤5.3的约束条件下的递阶决策控制模型。
进一步的,所述多UUV系统中个体之间基本行为动作的交互强度水平C1、半激活节点xl与入侵移动目标yh之间的交互强度水平C2、环境误差模型引起的随机误差干扰水平C3和半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4的具体计算步骤为:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1:
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点xk采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示虚拟中央节点xk基本行为动作Ai与半激活节点xl基本行为动作Aj之间的交互系数;
步骤6.2:计算半激活节点xl与入侵移动目标yh之间的交互强度水平C2:
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度和第h个敌方入侵移动目标的浓度yh(t),i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数;
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3:
C3环境误差模型引起的随机误差干扰水平采用分数布朗运动来描述误差的随机性,具体定义为:
式中,定数b>1,ci是服从均值为0方差为1的正态分布变量,di是在区间0≤di≤2π服从均匀分布的变量,H∈(0,1)表示粗糙度指数;
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4:
式中,λ表示自然死亡率,τ表示压缩常数;
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai(i=1,2,3)的交互强度水平,采取如下基本行为动作浓度变化决策模型进行决策:
IFC(A1)<C(A3),THEN A3 (14)
IFC(A1)>C(A3),THEN A1 (15)
对于半激活节点xl,如基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,则根据公式(14)选择基本行为动作交互强度水平最高的A3,同时以通信动作Propose发送投标意愿信息RD给虚拟中央节点xk;否则,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
与现有技术相比,本发明的有益效果:在定义基本行为动作的基础上,利用合同网协议通信动作实现UUV双方之间的招标-投标-中标通信交互,在此基础上设计约束条件下的UUV投标控制与决策模型,实现了通信量和计算规模递阶式减少,进而提高了交互过程的实时性,又利用免疫网络的动力学模型实现了不同角色UUV基本行为动作的快速决策,而且不会因为UUV模型功能缺失而导致围捕任务的失败,具有很强的鲁棒性和健壮性,进而大大提高了多UUV系统围捕敌方入侵目标的效率和质量。
附图说明
图1是基于免疫网络与市场机制的多UUV系统动态协商建模方法示意图;
图2是面向约束条件的递阶决策控制模型原理图;
图3初始化多UUV节点分布;
图4迭代次数k=50(发现敌方潜艇入侵);
图5迭代次数k=100(围攻敌方潜艇目标);
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
如图1所示,本实施例提供一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,设计UUV巡逻、探测和趋向目标的基本行为动作,利用改进的免疫网络实现基本行为动作浓度的变化,以此形成分布式结构的全局网络;利用扩展合同网协议形成分布式结构局部网络,根据基本行为动作浓度的变化的决策模型,设计通信动作模型实现对入侵目标的局部围攻。具体步骤如下:
步骤1:定义UUV基本行为动作主要包括:航行巡逻A1、感知探测A2和趋向目标A3,即Ai∈[A1,A2,A3],i=1,2,3。
步骤2:由N个UUV节点xk∈[x1,x2,···,xN]构成多UUV系统形成分布式全局网络(Global Network,GN),初始化所有UUV节点采取基本行为动作A1。
步骤3:由M个敌方入侵移动目标yh∈[y1,y2,···,yM]入侵多UUV系统的全局网络GN,UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络(LocalNetwork,LN)LNi(i=1,2…M),Ω=Rc∪Rd定义为LNi的大小,Ωs=Rd-Rc定义为LNi的边缘,其中Rd为探测范围,Rc为通信范围。在LNi中xk角色划分为虚拟中央节点、激活节点和半激活节点。
步骤4:如果UUV节点xk通过执行基本行为动作感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,从基本行为动作A2转向基本行为动作A3,并采用广播模式以通信动作Sending-Information向LNi内的其他UUV节点发送围捕请求和目标信息。
步骤5:如果UUV节点xl(k≠l)在xk的通信范围Rc内,则其作为激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,确保双方双向交互行为的联通。同时,激活节点xl执行约束条件下的递阶决策控制模型,如图2所示,具体步骤如下:
步骤5.1:判断围捕任务时间窗口约束
由于作业环境具有复杂性和动态性、敌方目标具有隐蔽性和欺骗性、突发事件具有随机性和实效性等特点,因此激活节点xl在参与任务动态规划与协调过程中,会存在一个最佳时间阶段Tf=[Ts,Te],其中Ts和Te为任务执行的最佳起始时间和结束时间,则任务执行窗口时间T=Ts-Te需要满足:
Tmin≤T≤Tmax (1)
其中,Tmin和Tmax为任务执行窗口的最小时间和最大时间。如果激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,执行步骤5.2,反之,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
步骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集SS={SS1,SS2,SS3,SS4,SS5,SS6}描述和刻画UUV自身健康状态的各个方面,如表1所示。
表1UUV自身健康状态
具体的自身健康状态通过可靠性理论相关的数学概率进行表示,其中SS1,SS5和SS6的状态可靠度分别表示fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,而SS2、SS3和SS4需要首先计算其失效概率,再由其失效概率计算状态可靠度。SS2、SS3和SS4的状态可靠度分别计算为:
步骤5.2.1:电子故障SS3失效概率fS3(x)的分布函数用正态分布表示:
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数。
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数。
如果激活节点xl自身状态可靠度fSSi(x)大于其对应的状态预设阈值fmin,即执行步骤5.3,反之,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
步骤5.3:判断电池能源状态约束
由于UUV的水下作战作任务复杂、潜航时间长、航程距离远等原因,对能源状态的要求一般较高,特别是目前UUV使用的电池提供能源方式,这是因为电池可以不受水下环境、下潜深度等因素,同时具有高隐蔽性和低噪音的优势。因此,定义激活节点xl电池能源状态约束如下:
式中,表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态。如果激活节点xl电池能源状态约束大于最低阈值,以通信动作Propose发送投标意愿信息BD给虚拟中央节点xk,反之,以通信动作Refuse发送投标拒绝信息RD给虚拟中央节点xk。
步骤6:如果UUV节点xl(k≠l)位于局部网络LNi的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,确保双方双向交互行为的联通。同时,xl立刻执行步骤5.1~5.3的约束条件下递阶决策控制模型,与激活节点的判断流程一致。如果满足约束条件的决策判断,由于其接受其他xN∩l节点的多个基本行为动作交互请求,则需要根据其基本行为动作的交互强度水平C来进行决策选择。其中,交互强度水平C定义为:
式中,表示半激活节点xl采取Ai基本行为动作在t时刻的交互强度水平。交互强度水平C主要由C1、C2、C3和C4四项组成,C1表示多UUV系统中个体之间基本行为动作的交互强度水平;C2表示半激活节点xl与入侵移动目标yh的交互强度水平;C3作为环境误差模型引起的随机误差干扰水平,用来保证在建模过程中的交互行为等信息的相对真实性;C4表示半激活节点xl采取Ai行为策略没有发生交互关系而引起的非交互强度水平。具体的C1、C2、C3和C4计算步骤如下:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1:
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点xk采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示xk基本行为动作Ai与xl基本行为动作Aj之间的交互系数。
步骤6.2:计算敌方入侵目标yh与xl之间的交互强度水平C2:
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度和第h个敌方入侵移动目标的浓度yh(t),i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数。
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3:
C3环境误差模型引起的随机误差干扰水平采用分数布朗运动FBM(FractionalBrownian Motion)来描述误差的随机性,具体定义为:
式中,定数b>1,ci是服从均值为0方差为1的正态分布变量,di是在区间0≤di≤2π服从均匀分布的变量,H∈(0,1)粗糙度指数是为了保证随机误差的合理性,消除变量的大幅度波动。
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4:
式中,λ表示自然死亡率,τ表示压缩常数。
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai(i=1,2,3)的交互强度水平,具体采取如下基本行为动作浓度变化决策模型来进行决策:
IF C(A1)<C(A3),THEN A3 (14)
IF C(A1)>C(A3),THEN A1 (15)
对于半激活节点xl,如果基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,根据公式(14)选择基本行为动作交互强度水平最高的A3,则说明需要更多UUV模型趋向目标参与围捕任务,同时以通信动作Propose发送投标意愿信息RD给虚拟中央节点xk;反之,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
步骤7:当UUV节点xl作为激活节点,中央虚拟节点xk以通信动作Accept发送接受激活节点xl投标以作为对其通信动作Propose的回应,或者以通信动作Reject发送拒绝激活节点xl投标以作为对其通信动作Refuse的回应;
步骤8:当UUV节点xl作为半激活节点,中央虚拟节点xk以通信动作Accept发送接受半激活节点xl投标以作为对其通信动作Propose的回应,此时xl的角色由半激活节点变成激活节点;或者以通信动作Reject发送拒绝半激活节点xl投标以作为对其通信动作Refuse的回应;
步骤9:中央虚拟节点xk与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵目标yh的围捕。
根据上述发明的多UUV系统动态协商建模方法,假设在10000×10000单位范围的海域,20个UUV抽象为二维Agent运动质点执行基本行为动作A1,形成全局网络搜索潜艇,如图3所示。当迭代次数k=50,敌方潜艇(Enemy Target)出现在位置(2000,5000),Agent8经基本行为动作A2首先探测到目标,如图4所示,其基本行为动作立刻变为A3,并作为局部网络的虚拟中央节点。利用局部网络的合同网通信协议及其通信动作,Agent8立刻向通信范围和探测范围内的其他Agent发送目标入侵信息。其他Agent(激活节点和半激活节点)进行约束条件下递阶决策控制和基本行为动作浓度决策判断。最后,即使Agent17发生故障失效的情况下,所有激活节点Agent也可以形成对入侵目标的围捕,如图5所示。
总的来说,本发明提出的一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,不仅可以实现通信量和计算规模的同步减少,而且可以保障协商模型的鲁棒性和健壮性,具有重要的理论研究和工程应用价值。以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (6)
1.一种基于免疫网络与市场机制的多UUV系统动态协商建模方法,其特征在于:包括以下步骤:
步骤1:定义UUV基本行为动作Ai,包括:航行巡逻A1、感知探测A2和趋向目标A3,其中Ai∈[A1,A2,A3],i=1,2,3;
步骤2:由N个UUV节点xk∈[x1,x2,…,xN]构成多UUV系统的分布式全局网络GN,初始化所有UUV节点xk采取所述航行巡逻A1动作;
步骤3:当M个敌方入侵移动目标yh∈[y1,y2,…,yM]入侵多UUV系统的全局网络GN时,所述UUV节点xk感知探测到入侵移动目标yh,形成M个集中式结构的局部网络LNi(i=1,2…M),Ω=Rc∪Rd定义为局部网络LNi的大小,Ωs=Rd-Rc定义为局部网络LNi的边缘,其中Rd为探测范围,Rc为通信范围;
在所述局部网络LNi中UUV节点xk角色划分为虚拟中央节点、激活节点和半激活节点;
步骤4:若所述UUV节点xk通过执行所述感知探测A2首先探测到入侵移动目标yh,则其自动成为虚拟中央节点,再从感知探测A2转向趋向目标A3,并采用广播模式以通信动作Sending-Information向所述局部网络LNi内的其他UUV节点发送围捕请求和目标信息;
步骤5:若UUV节点xl(k≠l)在虚拟中央节点xk的通信范围Rc内,则其作为激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,同时,激活节点xl执行约束条件下的递阶决策控制模型;
步骤6:若UUV节点xl(k≠l)位于局部网络LNi的边缘Ωs=Rd-Rc,则其作为半激活节点通过通信动作Confirm向虚拟中央节点xk发送确认信息,同时,半激活节点xl执行所述步骤5的约束条件下的递阶决策控制模型;若满足约束条件的决策判断,则根据其基本行为动作的交互强度水平C进行决策选择;
步骤7:当UUV节点xl作为激活节点,虚拟中央节点xk以通信动作Accept发送接受激活节点xl投标以作为对其通信动作Propose的回应,或者虚拟中央节点xk以通信动作Reject发送拒绝激活节点xl投标以作为对其通信动作Refuse的回应;
步骤8:当UUV节点xl作为半激活节点,中央虚拟节点xk以通信动作Accept发送接受半激活节点xl投标以作为对其通信动作Propose的回应,此时xl的角色由半激活节点变成激活节点;或者中央虚拟节点xk以通信动作Reject发送拒绝半激活节点xl投标以作为对其通信动作Refuse的回应;
步骤9:中央虚拟节点xk与所有激活节点xl共同以基本行为动作A3趋向目标实现对入侵移动目标yh的围捕。
2.根据权利要求1所述的方法,其特征在于:所述步骤5中激活节点xl执行约束条件下的递阶决策控制模型的具体步骤为:
步骤5.1:判断围捕任务时间窗口约束
围捕任务执行窗口时间为T=Ts-Te,且满足公式(1):
Tmin≤T≤Tmax (1)
其中,Ts和Te为任务执行的最佳起始时间和结束时间,Tmin和Tmax为任务执行窗口的最小时间和最大时间;
如所述激活节点xl参与完成围捕任务的时间T满足Tmin≤T≤Tmax,则执行步骤5.2,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk;
骤5.2:判断UUV自身健康状态约束
UUV自身健康状态集为SS={SS1,SS2,SS3,SS4,SS5,SS6},SS1表示健康,SS2表示机械故障,SS3表示电子故障,SS4表示机体损伤,SS5表示全部故障,SS6表示敌方击毁;
其中健康SS1,全部故障SS5和敌方击毁SS6的状态可靠度分别表示为fSS1(x)=1.0、fSS5(x)=0和fSS6(x)=0,机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算;
步骤5.3:判断电池能源状态约束
定义激活节点xl电池能源状态约束如下:
式中,表示UUV完成任务所需能源的最低阈值,P(t)表示当前UUV的能源状态;如激活节点xl电池能源状态约束大于最低阈值则以通信动作Propose发送投标意愿信息BD给虚拟中央节点xk,否则,以通信动作Refuse发送投标拒绝信息RD给虚拟中央节点xk。
3.根据权利要求2所述的方法,其特征在于:所述步骤5.2中机械故障SS2、电子故障SS3和机体损伤SS4状态可靠度均通过各自失效概率计算的具体步骤为:
步骤5.2.1:电子故障SS3的失效概率fS3(x)的分布函数用正态分布表示:
则电子故障SS3可靠度fSS3(x)表示为
fSS3(x)=1-fS3(x) (3)
其中,μ和σ是正态分布参数;
步骤5.2.2:机械故障SS2和机体损伤SS4的失效概率fS2(x)和fS4(x)的分布函数用指数分布表示:
则机械故障SS2和机体损伤SS4的可靠度fSS2(x)和fSS4(x)分别表示为
fSS2(x)=1-fS2(x) (6)
fSS4(x)=1-fS4(x) (7)
其中,λ是指数分布参数;
如激活节点xl自身状态可靠度fSSi(x)大于其对应的状态预设阈值fmin,即则执行步骤5.3,否则,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
4.根据权利要求1所述的方法,其特征在于:所述步骤6中半激活节点xl基本行为动作的交互强度水平C定义为:
式中,表示半激活节点xl采取基本行为动作Ai在t时刻的交互强度水平;C1表示多UUV系统中个体之间基本行为动作的交互强度水平,C2表示半激活节点xl与入侵移动目标yh的交互强度水平,C3表示环境误差模型引起的随机误差干扰水平,C4表示半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平。
5.根据权利要求2所述的方法,其特征在于:所述步骤6中半激活节点xl执行所述步骤5.1~步骤5.3的约束条件下的递阶决策控制模型。
6.根据权利要求4所述的方法,其特征在于:所述多UUV系统中个体之间基本行为动作的交互强度水平C1、半激活节点xl与入侵移动目标yh之间的交互强度水平C2、环境误差模型引起的随机误差干扰水平C3和半激活节点xl采取UUV基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4的具体计算步骤为:
步骤6.1:计算多UUV系统中个体之间基本行为动作的交互强度水平C1:
式中,ci(t)和cj(t)分别表示t时刻半激活节点xl采取Ai基本行为动作的浓度和虚拟中央节点xk采取Aj基本行为动作的浓度,i,j=1,2,3;Cd表示通信范围Rc内的UUV数量集合cr∈Cd;Uij表示虚拟中央节点xk基本行为动作Ai与半激活节点xl基本行为动作Aj之间的交互系数;
步骤6.2:计算半激活节点xl与入侵移动目标yh之间的交互强度水平C2:
式中:ci(t)表示t时刻半激活节点xl采取Ai基本行为动作的浓度和第h个敌方入侵移动目标的浓度yh(t),i=1,2,3,h=1,2,…,M;Dd表示探测范围Rd内的入侵移动目标数量集合h∈Rd,Wlh表示半激活节点xl基本行为动作Ai与入侵移动目标yh之间的交互系数;
步骤6.3:计算环境误差模型引起的随机误差干扰水平C3:
C3环境误差模型引起的随机误差干扰水平采用分数布朗运动来描述误差的随机性,具体定义为:
式中,定数b>1,ci是服从均值为0方差为1的正态分布变量,di是在区间0≤di≤2π服从均匀分布的变量,H∈(0,1)表示粗糙度指数;
步骤6.4:计算半激活节点xl采取基本行为动作Ai行为策略没有发生交互关系而引起的非交互强度水平C4:
式中,λ表示自然死亡率,τ表示压缩常数;
步骤6.5:根据步骤6.1~6.4计算半激活节点xl每个基本行为动作Ai(i=1,2,3)的交互强度水平,采取如下基本行为动作浓度变化决策模型进行决策:
IFC(A1)<C(A3),THENA3 (14)
IFC(A1)>C(A3),THEN A1 (15)
对于半激活节点xl,如基本行为动作A1的交互强度水平小于基本行为动作A3的交互强度水平,则根据公式(14)选择基本行为动作交互强度水平最高的A3,同时以通信动作Propose发送投标意愿信息RD给虚拟中央节点xk;否则,根据公式(15)选择基本行为动作交互强度水平最高的A1,则其继续保持水下航行巡逻,以通信动作Refuse发送拒绝投标信息RD给虚拟中央节点xk。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810634753.6A CN110618690B (zh) | 2018-06-20 | 2018-06-20 | 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810634753.6A CN110618690B (zh) | 2018-06-20 | 2018-06-20 | 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110618690A true CN110618690A (zh) | 2019-12-27 |
CN110618690B CN110618690B (zh) | 2022-06-07 |
Family
ID=68920798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810634753.6A Expired - Fee Related CN110618690B (zh) | 2018-06-20 | 2018-06-20 | 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110618690B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1452935A2 (en) * | 2003-02-28 | 2004-09-01 | Fuji Jukogyo Kabushiki Kaisha | Control system using immune network and control method |
CN104392279A (zh) * | 2014-11-19 | 2015-03-04 | 天津大学 | 一种多智能体结构的微电网优化运行方法 |
CN105843227A (zh) * | 2016-04-15 | 2016-08-10 | 上海大学 | 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法 |
CN107133416A (zh) * | 2017-05-24 | 2017-09-05 | 西北工业大学 | 一种uuv多层次混杂式免疫智能体结构建模方法 |
CN107193009A (zh) * | 2017-05-23 | 2017-09-22 | 西北工业大学 | 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法 |
-
2018
- 2018-06-20 CN CN201810634753.6A patent/CN110618690B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1452935A2 (en) * | 2003-02-28 | 2004-09-01 | Fuji Jukogyo Kabushiki Kaisha | Control system using immune network and control method |
CN104392279A (zh) * | 2014-11-19 | 2015-03-04 | 天津大学 | 一种多智能体结构的微电网优化运行方法 |
CN105843227A (zh) * | 2016-04-15 | 2016-08-10 | 上海大学 | 一种基于任务密集度动态调整的多机器人协作围捕任务分配方法 |
CN107193009A (zh) * | 2017-05-23 | 2017-09-22 | 西北工业大学 | 一种模糊自适应多交互模型的多uuv协同系统水下目标跟踪算法 |
CN107133416A (zh) * | 2017-05-24 | 2017-09-05 | 西北工业大学 | 一种uuv多层次混杂式免疫智能体结构建模方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110618690B (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rizk et al. | Cooperative heterogeneous multi-robot systems: A survey | |
Tartakovsky et al. | Change-point detection in multichannel and distributed systems with applications | |
Yang et al. | Decentralized cooperative search by networked UAVs in an uncertain environment | |
Guo et al. | Distributed reinforcement learning for coordinate multi-robot foraging | |
CN113312172B (zh) | 基于适变网络的多无人机集群动态任务调度模型 | |
de San Bernabe et al. | Efficient cluster-based tracking mechanisms for camera-based wireless sensor networks | |
CN116187169A (zh) | 基于动态贝叶斯网络的无人机集群意图推断算法及系统 | |
Liu et al. | Multi‐USV System Cooperative Underwater Target Search Based on Reinforcement Learning and Probability Map | |
Nair et al. | Team formation for reformation in multiagent domains like RoboCupRescue | |
CN112305913A (zh) | 基于直觉模糊博弈的多uuv协同动态机动决策方法 | |
US9398268B2 (en) | Method and system for cooperative diversity visual cognition in wireless video sensor networks | |
CN110618690B (zh) | 一种基于免疫网络与市场机制的多uuv系统动态协商建模方法 | |
Li et al. | Multi-mode filter target tracking method for mobile robot using multi-agent reinforcement learning | |
CN110618689B (zh) | 一种约束条件下基于合同网的多uuv系统协商合作建模方法 | |
Zou et al. | 3D genetic algorithms for underwater sensor networks | |
CN110618607B (zh) | 一种基于行为的多uuv自组织协调控制方法 | |
CN116067232A (zh) | 一种基于“引领式”群驱离的无人机群诱导反制方法与系统 | |
Johnson et al. | Mapping artificial intelligence to the naval tactical kill chain | |
CN113311700B (zh) | 一种非平均机制引导的uuv集群协同控制方法 | |
Marino et al. | Fuzzy behavioral control for multi-robot border patrol | |
Airlangga et al. | A novel architectural design for solving lost-link problems in uav collaboration | |
Yu et al. | A cooperative mission planning method considering environmental factors for UUV swarm to search multiple underwater targets | |
CN117575220B (zh) | 一种面向异构多智能体的多任务策略博弈方法 | |
Schranz et al. | Resource-aware dynamic clustering utilizing state estimation in visual sensor networks | |
Wang et al. | Multi-AUV Cooperative Underwater Multi-Target Tracking Based on Dynamic-Switching-enabled Multi-Agent Reinforcement Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220607 |