CN112269396B - 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 - Google Patents
一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 Download PDFInfo
- Publication number
- CN112269396B CN112269396B CN202011099773.1A CN202011099773A CN112269396B CN 112269396 B CN112269396 B CN 112269396B CN 202011099773 A CN202011099773 A CN 202011099773A CN 112269396 B CN112269396 B CN 112269396B
- Authority
- CN
- China
- Prior art keywords
- unmanned aerial
- aerial vehicle
- blue
- red
- strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 241000272201 Columbiformes Species 0.000 claims abstract description 76
- 230000007123 defense Effects 0.000 claims abstract description 55
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000013461 design Methods 0.000 claims abstract description 6
- 230000001133 acceleration Effects 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 22
- 239000000126 substance Substances 0.000 claims description 18
- 238000004088 simulation Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000004888 barrier function Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 238000009827 uniform distribution Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 244000144992 flock Species 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明是一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法,包括以下实施步骤:步骤一:初始化战场环境设置;步骤二:无人机集群对抗运动控制;步骤三:基于鹰鸽智能博弈的攻防策略设计;步骤四:基于鹰鸽智能博弈的红蓝双方支付矩阵求解;步骤五:基于鹰鸽智能博弈的红蓝双方混合策略求解;步骤六:输出红蓝双方对抗结果。本发明面向复杂作战环境下的大规模无人机集群协同作战应用背景,提出了一种结合集群对抗运动控制和攻防策略选择控制的分布式无人机集群协同对抗控制架构,在降低设计成本、提高长时鲁棒对抗能力的基础上,进一步提升无人机集群协同作战效能与自主能力水平。
Description
技术领域
本发明是一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法,属于无人机自主控制领域。
背景技术
无人机(unmanned aerial vehicle,UAV)作为“平台无人,系统有人”的飞行器,能够代替有人驾驶机执行“枯燥、恶劣、危险、纵深”的作战任务,在任务复杂以及动态不确定环境下,具有显著的优势。但由于单架无人机执行任务和作战能力的局限性,空战对抗中作战效能较低。多架UAV通过局部感知和信息交互,实现机间资源共享和优势互补,可以提高无人机集群的整体作战效能,因此UAV的作战样式正在从单机作战向“集群”作战方向转变。本发明旨在利用无人机集群协同对抗模式克服单架无人机对抗的技术瓶颈,提出一种鲁棒高效的无人机集群协同对抗控制方法,实现无人机集群在未来信息化和网络化的复杂作战环境下的智能攻击和防御。
无人机集群对抗是指一群无人机对另一群无人机进行拦截而形成的空中协作式的缠斗。目前,无人机集群对抗控制方法主要分为两种,一种是根据实时态势评估结果,将多对多的空中对抗转化为一对一的对抗模型,然后进一步分析无人机集群协同空战的机动决策过程。这种方法一般适合于小规模无人机之间的作战,应用于大规模无人机集群的动态对抗时会导致计算量消耗巨大,并且不能实时考虑机间耦合对对抗态势的影响。另一种是引入多Agent理论,将个体无人机视为独立的Agent,并设计相应的行为集和决策方法,以此建立无人机对抗模型,该方法可通过个体间的交互描述无人机集群协同对抗过程,涌现出宏观的集群协同对抗效果,提升大规模无人机集群协同作战效率。
无人机集群协同对抗控制可以分解为集群对抗运动控制和攻防策略选择控制两个子过程。针对集群对抗运动控制,目前研究方法主要有集中式控制和分布式控制两类。集中式控制中常见的方法有虚拟结构法、长-僚机法,其原理是集群中所有无人机的状态信息汇总至集中控制中心统一处理,当集群规模较大时,整个系统的可靠性较低,鲁棒性、灵活性较差。分布式控制中常见的方法有人工势场法、集群控制法和α-β-γ框架法,其原理是每架无人机通过局部的信息交互,进行自主决策,具有较好的灵活性和自组织性。针对对抗双方攻防策略选择控制问题,现在大多数研究考虑的是单方优化的方法,该类方法只考虑自身策略的最优,不对对手的策略进行预测分析,显然这样的控制不具有客观性。此外,自主性较强的无人机集群在对抗过程中理应将对手策略对局势的影响纳入分析,从而在双方博弈过程中形成攻防策略的智能选择,涌现出强大的对抗能力。
鹰鸽博弈研究的是同一物种、种群内部竞争与冲突的策略和均衡问题,博弈中的每个生物都遵循以下两种策略之中的一种:鹰策略代表攻击型,像自然界的鹰一样凶猛,搏斗起来总是全力以赴,孤注一掷,除非身负重伤,否则绝不退却;鸽策略代表防御型,像自然界的鸽子一样温顺,只是以风度高雅的惯常方式进行威胁恫吓,从不伤害其他动物。如果两个鹰策略者相遇,两者之间必然会发生冲突,两者获胜的概率相同,并且冲突会导致双方均受到一定程度的损伤。如果鹰策略者与鸽策略者相遇,鸽策略者会选择退让,鹰策略者获胜,双方均不存在损伤。自然界中的生物通过鹰鸽博弈的方式进行策略交互,不断选择,逐渐实现种群在进化论意义上的稳定。本发明借鉴鹰鸽博弈中攻防策略的智能选择机制,将其映射到无人机集群协同对抗控制中的攻防策略选择控制上,结合无人机集群运动控制,旨在解决无人机集群协同对抗控制问题。
发明内容
本发明的目的是提供一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法,旨在解决无人机集群在双方对抗过程中的集群对抗运动控制和攻防策略选择控制问题,在降低设计成本、符合实际作战场景、提高系统鲁棒性的基础上,进一步提升无人机集群协同作战效能和自主能力水平。
本发明是一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法,具体实现步骤如下:
步骤一:初始化战场环境设置,具体包括:初始化对抗场景;初始化无人机运动控制模型;初始化无人机集群攻防策略选择模型;
步骤二:无人机集群对抗运动控制,具体包括:
S21、选择邻居集合;
S22、和邻居保持速度一致;
S23、机间聚集;
S24、机间避障;
S25、接近敌方;
S26、更新位置和速度;
步骤三:基于鹰鸽智能博弈的攻防策略设计,具体包括:
S31、判断红蓝双方无人机集群之间的距离;
S32、对红蓝双方的无人机进行分组;
S33、确定红蓝双方攻防纯策略集合——鹰策略或鸽策略;
步骤四:基于鹰鸽智能博弈的红蓝双方支付矩阵求解,具体包括:计算红方的损失;计算蓝方的损失;计算红蓝双方鹰、鸽混合策略下的支付矩阵;
步骤五:基于鹰鸽智能博弈的红蓝双方混合策略求解,具体包括:
S51、设计代价函数;
S52、用改进鸽群优化算法求解混合策略;
步骤六:输出红蓝双方对抗结果,具体包括:红蓝双方对抗中运动控制相关仿真结果;红蓝双方对抗中攻防策略选择控制相关仿真结果。
其中,所述步骤S23实现机间聚集的具体过程如下:
当无人机与邻居之间距离较远时,邻居会对无人机产生吸引力,使无人机机朝其邻居运动,无人机所受到邻居引力合力产生的加速度可以表示为:
其中,表示α方的第i个个体的聚集加速度,katt表示聚集加速度的控制增益,Rrep表示无人机i周围排斥环的半径,Ratt表示无人机i周围吸引环的半径,表示对α方无人机i产生吸引力的邻居集合,j表示中的个体,||·||表示对向量取2范数。
其中,所述步骤S24实现机间避障的具体过程如下:
当无人机与邻居之间距离较近时,邻居会对无人机产生排斥力,使无人机背离邻居运动,无人机所受到邻居排斥力的合力产生的加速度可以表示为:
其中,所述步骤S25实现接近敌机的具体过程如下:
对于红方无人机而言,当其探测到蓝方无人机集群后,朝着蓝方无人机集群运动并进行拦截,红方无人机受到蓝方无人机集群引力产生的加速度可以表示为:
其中,所述步骤S31判断红蓝双方无人机集群之间的距离的具体过程如下:
其中,表示红方无人机集群中心坐标,disr_b表示双方集群中心的距离,当disr_b<Ropp时,认为对抗双方在速度上均可压制住对方,双方保持相对静止,否则转到步骤二,Ropp表示双方开始进行作战策略对峙的半径。
其中,所述步骤S32对红蓝双方的无人机进行分组的具体过程如下:
设定双方无人机集群均分成numgroup个小组,M/num_group∈Z,N/num_group∈Z,Z表示整数集合;计算红方无人机到蓝方无人机集群中心的距离,按照从小到大进行排列,分成numgroup个小组,前attackr/numgroup个小组为攻击型小组,剩下的defendr/numgroup个小组为防御型小组;计算蓝方无人机到红方无人机集群中心的距离,按照从小到大进行排列,分成numgroup个小组,前attackb/numgroup个小组为攻击型小组,剩下的defendb/numgroup个小组为防御型小组。
其中,所述步骤S33确定红蓝双方攻防纯策略集合——鹰策略或鸽策略,具体过程如下:
设定α方攻击型无人机小组中,有个小组采用“鹰策略”攻击敌方攻击型,有个小组采用“鸽策略”攻击敌方防御型,所以α方的第j个策略表示为 故α方的策略总数为attackα/numgroup+1个,策略集合转到步骤四。
其中,所述步骤S51设计代价函数的具体过程如下:
Er=βr·A·(βb)′
其中,A表示红方支付矩阵,Er表示红方的期望支付值。
蓝方的期望支付值表示为:
Eb=βr·B·(βb)′
其中,B表示蓝方支付矩阵,Eb表示蓝方的期望支付值。根据纳什均衡理论,并且要保证红方大概率胜利的充分必要条件是:
其中,Ai表示矩阵A的第i个行向量,Bj表示矩阵B的第j个列向量,代价函数可以表述为:
本发明的仿鹰鸽智能博弈的无人机集群协同对抗控制方法,其优点功效在于:一、提供了一种结合集群对抗运动控制和攻防策略选择控制的无人机集群协同对抗框架,在降低计算复杂度的同时,提升了任务系统鲁棒性;二、提出了一种集群对抗运动控制方法,支持红蓝双方在对抗过程中的自由运动,具有一定环境适应性;三、提出了一种基于鹰鸽博弈的攻防策略选择控制方法,通过改进鸽群优化算法对混合策略进行求解,符合实际作战要求,可支持无人机集群连续长时间对抗。
附图说明
图1无人机集群协同对抗场景示意图
图2仿鹰鸽智能博弈的无人机集群协同对抗控制方法流程图
图3红蓝双方对抗运动轨迹图
图4红蓝双方对抗运动终止时刻无人机集群位置分布图
图5a、b对抗运动过程红方无人机x、y轴方向速度变化曲线图
图6a、b对抗运动过程蓝方无人机x、y轴方向速度变化曲线图
图7对抗运动过程红、蓝双方无人机序参量变化对比图
图8代价函数变化曲线图
图9红蓝双方混合攻防策略结果展示图
图10红蓝双方混合攻防策略的分布图(情况一)
图11红蓝双方混合攻防策略的分布图(情况二)
具体实施方式
下面通过具体的实例来验证本发明所提无人机集群协同对抗的有效性。在本实例中,给定红、蓝双方无人机集群各有50架,红方基地1个,蓝方对红方基地进行搜索打击,红方为保护基地对蓝方实施拦截,双方进入对抗状态。本实例的仿真环境配置为intel i7-9750处理器,2.60GHz主频,8G内存,软件为MATLAB 2019b版本。
仿鹰鸽智能博弈的无人机集群协同对抗控制方法,其实现流程如图2所示,该实例的具体实践步骤如下:
步骤一:初始化战场环境设置
(1)初始化对抗场景
设定如图1所示的无人机集群协同对抗场景,作战区域不考虑外界环境(地形、障碍物等)。红蓝作战双方各自拥有一定数量的无人机,红方拥有一个需要无人机集群保护的基地,但基地本身不具备攻击和防御的能力。红蓝双方的无人机集群均由攻击型无人机和防御型无人机组成,且均为同一型号的固定翼无人机。防御型无人机均配备雷达干扰设备,可对敌方通信系统和攻击系统实施干扰。攻击型无人机均配备一定数量的导弹,既可以选择攻击对方的攻击型无人机,直接削弱对方的攻击能力,也可以选择攻击对方的防御型无人机,以消除对方对己方发射的雷达干扰。红蓝双方具备相同的战场态势感知能力,双方均知道彼此的无人机数量以及防御型和攻击型的比例,但不清楚具体的攻击策略。蓝方无人机集群的作战目标是形成一个有序的整体,并朝着红方基地进攻;红方无人机集群的作战目标是发现蓝方无人机集群的进攻,聚集形成一个有序的整体对蓝方无人机集群进行拦截。
在本实施例中,红方基地位于(0,0)m,红方无人机集群的初始位置在红方基地附近随机生成,服从在[0,1000]m上的均匀分布。对于蓝方无人机集群而言,它们在空中搜索红方基地,设定仿真开始时刻,蓝方无人机随机生成初始位置,服从在[4000,5000]m上的均匀分布。设定双方无人机的探测半径Rdetect=5000m,所以在仿真开始时,蓝方无人机集群已经搜索到红方基地,红方无人机集群也已经发现蓝方无人机集群的攻击。红蓝双方的所有无人机上均配有导弹和雷达干扰设备,即每架无人机可以根据战场态势确定自己选择成为攻击型,还是防御型。
(2)初始化无人机运动控制模型
设定红方由M架无人机组成,蓝方由N架无人机组成,无人机的状态包括速度、位置,无人机的运动学模型可以描述为:
其中,α表示对抗方,α={r,b},r表示红方,b表示蓝方,i表示α方的第i架无人机,当α=r时,i=1,2…M,当α=b时,i=1,2...N。表示α方的第i架无人机的位置,表示α方的第i架无人机的速度,表示α方的第i架无人机的加速度。因为无人机集群协同对抗主要发生在水平面上,所以运动学模型不考虑对高度的控制,设定对抗双方的无人机均处于同一额定高度。
本实施例中,因为在对抗环境中设定双方已经发现了对方的存在,根据双方初始位置的分布,红方的速度随机生成,服从在[50,100]m/s上均匀分布,蓝方的速度随机生成,服从在[-60,-30]m/s上均匀分布,双方无人机x、y轴上的速度限制均为250m/s,仿真间隔Δt=0.1s。
(3)初始化无人机集群攻防策略选择模型
无人机集群协同对抗中的红蓝双方就是战场博弈中的两个局中人,无人机集群协同对抗可以看成两个局中人同时采取策略进行博弈,无人机集群策略选择模型可以表示为:
Game<UAVs,{sr,sb},{fr,fb}〉 (2)
其中,UAVs表示博弈双方集合,UAVs={r,b},{sr,sb}分别表示红、蓝双方的纯策略集,{fr,fb}分别表示红、蓝双方的支付函数,自变量为双方采取的策略集合。
设定红方无人机的组成为M=attackr+defendr,attackr表示红方攻击型无人机的数量,defendr表示红方防御型无人机的数量;蓝方无人机的组成为N=attackb+defendb,attackb表示蓝方攻击型无人机的数量,defendb表示蓝方防御型无人机的数量。对于防御型无人机而言,其产生的雷达干扰信号对敌方的无人机均能产生影响,不存在策略的选择。对于攻击型无人机而言,可以选择攻击敌方的攻击型无人机或者是防御型无人机,按攻击对象的不同,可以将攻击型无人机所能选择的策略分为“鹰策略”(攻击对象为攻击型)和“鸽策略”(攻击对象为防御型)两种情况,后转步骤二。
本实施例中,设定红方的攻击型无人机数量attackr为20架,防御型无人机defendr为30架,蓝方的攻击型无人机数量attackb为30架,防御型无人机defendb为20架,后转步骤二。
步骤二:无人机集群对抗运动控制
在集群对抗运动控制中,无人机运动的策略集可以表示为:move_strategy={聚集、避障、速度一致、攻击},对抗双方的无人机均通过和邻居进行信息交互,来决定下一步的运动。
(1)选择邻居集合
红蓝双方均采用基于距离的邻居选择机制,邻居集合表示为:
(2)和邻居保持速度一致
红蓝双方均采用速度平均机制来使无人机的速度和所有邻居的平均速度趋于一致,按下式计算相对应的加速度:
求解完邻居集合后,双方中的每架无人机采用速度平均机制来使无人机的速度和所有邻居的平均速度趋于一致,按式(4)求解相对应的加速度,设定速度协同加速度的控制增益kv为1。
(3)机间聚集
当无人机与邻居之间距离较远时,邻居会对无人机产生吸引力,使无人机机朝邻居运动。无人机所受到邻居引力合力产生的加速度可以表示为:
其中,表示α方的第i个个体的聚集加速度,katt表示聚集加速度的控制增益,Rrep表示无人机i周围排斥环的半径,Ratt表示无人机i周围吸引环的半径,表示对α方无人机i产生吸引力的邻居集合,j表示中的个体,||·||表示对向量取2范数。
本实施例中,双方无人机均和自己邻居内的无人机进行位置信息交互,设定双方每架无人机周围的排斥环半径Rrep为200m,无人机周围吸引环的半径Ratt为500m。无人机判断自己邻居集合中位于排斥环半径和吸引环半径中间的个体有哪些,这些个体构成集合对该无人机产生吸引力,吸引力的合力产生的加速度用式(5)计算,设定聚集加速度的控制增益katt为5。
(4)机间避障
当无人机与邻居之间距离较近时,邻居会对无人机产生排斥力,使无人机背离邻居运动,无人机所受到邻居排斥力的合力产生的加速度可以表示为:
(5)接近敌方
对于蓝方无人机而言,设定其速度方向是朝着红方无人机基地运动的,不需要施加接近敌方的外力,对于红方无人机而言,当其探测到蓝方无人机集群后,朝着蓝方无人机集群运动并进行拦截,红方无人机受到蓝方无人机集群引力产生的加速度可以表示为:
其中,表示红方的第i个个体的接近蓝方无人机集群的加速度,kb_r表示接近蓝方无人机集群的加速度的控制增益,表示蓝方无人机集群中心坐标。此部分只针对红方无人机,首先对所有蓝方无人机的位置加和求平均,计算出蓝方无人机集群的中心坐标进而用式(7)计算红方的第i个个体的接近蓝方的加速度设定接近敌机加速度的控制增益kb_r为10。
(6)更新位置和速度
对于红方无人机集群中的无人机来说,每架无人机所受合外力产生的加速度表示为:
其中,α=r。对于蓝方无人机集群中的无人机来说,每架无人机所受合外力产生的加速度表示为:
步骤三:基于鹰鸽智能博弈的攻防策略设计
(1)判断红蓝双方无人机集群之间的距离
其中,表示红方无人机集群中心坐标,disr_b表示双方集群中心的距离,当disr_b<Ropp时,认为对抗双方在速度上均可压制住对方,双方保持相对静止,否则转到步骤二,Ropp表示双方开始进行作战策略对峙的半径。
本实施中,首先对所有红方无人机的位置加和求平均,计算出红方无人机集群的中心坐标然后对所有蓝方无人机的位置加和求平均,计算出蓝方无人机集群的中心坐标进而求得双方无人机集群中心间的距离disr_b。设定双方开始对峙的半径Ropp为500m,如果双方集群中心距离小于Ropp,则表示对抗双方在速度上均可压制住对方,双方保持相对静止,否则转到步骤二继续进行对抗运动控制。
(2)对红蓝双方的无人机进行分组
设定双方无人机集群均分成numgroup个小组,M/num_group∈Z,N/num_group∈Z,Z表示整数集合。计算红方无人机到蓝方无人机集群中心的距离,按照从小到大进行排列,分成numgroup个小组,前attackr/numgroup个小组为攻击型小组,剩下的defendr/numgroup个小组为防御型小组。计算蓝方无人机到红方无人机集群中心的距离,按照从小到大进行排列,分成numgroup个小组,前attackb/numgroup个小组为攻击型小组,剩下的defendb/numgroup个小组为防御型小组。
本实施例中,设定双方的无人机集群均分成numgroup=5个作战小组,所以每个作战小组均有10架无人机。按红方无人机集群中设定的攻击型和防御型的无人机数量,红方有2个攻击型小组,3个防御型小组。按蓝方无人机集群中设定的攻击型和防御型的无人机数量,蓝方有3个攻击型小组,2个防御型小组。分组采用距离敌方无人机集群中心坐标的远近进行划分,距离敌方近的无人机构成攻击型小组,剩下的构成防御型小组。
(3)确定红蓝双方攻防纯策略集合——鹰策略或鸽策略
设定α方攻击型无人机小组中,有个小组采用“鹰策略”攻击敌方攻击型,有个小组采用“鸽策略”攻击敌方防御型,所以α方的第j个策略表示为个攻击型小组攻击攻击型,用个小组攻击敌方防御型},故α方的策略总数为attackα/numgroup+1个,后转步骤四。
综上所述,红蓝双方对抗采取攻防纯策略共有3×4=12种情况,后转步骤四
步骤四:基于鹰鸽智能博弈的红蓝双方支付矩阵求解
(1)计算红方的损失
其中,表示红方攻击型小组被攻击后的损失,表示红方防御型小组被攻击后的损失,表示红方总的损失。pattack表示双方攻击型小组被攻击的概率,pdefend表示双方防御型小组被攻击的概率,a表示双方攻击型小组被击落后的损失,b表示双方防御型小组被击落后的损失。
本实施例中,针对步骤三中设计的12种双方攻防纯策略,按式(11)计算每种情况下红方被蓝方攻击后的损失设定攻击型小组被攻击的概率pattack=0.6,防御型小组被攻击的概率pdefend=0.5,攻击型小组被击落后的损失a=1,防御型小组被击落后的损失b=1.5。
(2)计算蓝方的损失
本实施例中,针对步骤三中设计的12种双方攻防策略,按式(12)计算每种情况下的蓝方被红方攻击后的损失设定攻击型小组被攻击的概率pattack=0.6,防御型小组被攻击的概率pdefend=0.5,攻击型小组被击落后的损失a=1,防御型小组被击落后的损失b=1.5。
(3)计算红蓝双方鹰、鸽混合策略下的支付矩阵
其中,表示红方的收益,定义蓝方的损失为红方的收益;表示蓝方的收益,定义红方的损失为蓝方的收益。用收益和损失的比值定义本方的支付值,表示红方采用第i个策略,蓝方采用时第j个策略时红方的支付值,表示红方采用第i个策略,蓝方采用第j个策略时蓝方的支付值,红方支付矩阵蓝方的
本实施例中,前两条求出了双方在各种纯策略情况下的损失,定义敌方的损失定义为我方的收益,并用收益和损失的比值定义本方的支付函数,按式(13)可以得到红方的支付矩阵A:
蓝方的支付矩阵B:
矩阵A、B的行表示红方的3种策略,列表示蓝方的4种情况,后转步骤五。
步骤五:基于鹰鸽智能博弈的红蓝双方混合策略求解
(1)设计代价函数
Er=βr·A·(βb)′ (14)
其中,A表示红方支付矩阵,Er表示红方的期望支付值。
蓝方的期望支付值表示为:
Eb=βr·B·(βb)′ (15)
其中,B表示蓝方支付矩阵,Eb表示蓝方的期望支付值。根据纳什均衡理论,并且要保证红方大概率胜利的充分必要条件是:
其中,Ai表示矩阵A的第i个行向量,Bj表示矩阵B的第j个列向量,代价函数可以表述为:
本实施例中,将步骤四中求得的红蓝双方的支付矩阵A、B代入式(14)、(15)求得在混合策略下,红方的期望支付值和蓝方的期望支付值,然后综合考虑式(16)中纳什均衡解的求解条件,计算出用于双方对抗时混合策略求取的代价函数。
(2)用改进鸽群优化算法求解混合策略
在D维搜索空间随机初始化L只鸽子,第i只鸽子的位置表示为Pi=[pi1,pi2,...piD],速度表示为Vi=[vi1,vi2,...viD],其中i=1,2,...,L,用鸽子的位置表示要求解代价函数的自变量,即混合策略中各个纯策略被选择的概率。改进鸽群优化算法分成两个独立的环节,首先每只鸽子按照下式更新位置Pi和速度Vi:
其中,k表示当前的迭代次数,Pi k表示鸽子i在k时刻的位置,Pi k-1表示鸽子i在k-1时刻的位置,Vi k表示鸽子i在k时刻的速度,Vi k-1表示鸽子i在k-1时刻的速度,R表示地图和指南针因子,Pgbest表示在k-1次迭代循环后通过比较所有鸽子的位置而得到的全局最好的位置,表示在k-1次迭代循环后通过比较第i只鸽子的位置而得到的个体最好的位置,rand表示0-1之间的均匀随机数,当k>nc1,进入下一环节进行更新,nc1表示第一个环节的最大迭代次数。
其中,表示在k-1时刻鸽群的中心位置坐标,Lk表示k时刻鸽子的数量,Lk-1表示k-1时刻鸽子的数量,在求解最小化问题时,ε表示很小的数,当k>nc1+nc2时,结束循环,得到最优解Pgbest,nc2表示第二个环节的最大迭代次数。
Pgbest即为所求混合策略中各纯策略被选择的概率,将Pgbest代入式(14)、(15)中计算红方、蓝方的期望支付值,如果红方的期望支付值大于蓝方的期望支付值,转到步骤六,否则回到步骤五中的第(2)部分,重新求解。
本实施例中,用鸽子的位置表示要求解代价函数的自变量Π={βr,βb},所以搜索空间的维数D=3+4=7,设定鸽子数L=50,鸽子的初始位置Pi随机生成,服从[0,1]之间的正态分布,鸽子的初始速度Vi随机生成,服从[-0.2,0.2]之间的正态分布,将初始位置代入式(17)中可以得到每只鸽子所对应的代价函数,从中选出代价函数值最小的鸽子,作为初始全局最优的解,每只鸽子的初始位置则为它们的初始个体最优位置,然后按式(18)进行每只鸽子位置和速度的更新,然后更新全局最优和个体最优位置,再进行循环迭代,一直到迭代次数到达第一个环节的最大迭代次数,设定第一个环节的最大迭代次数nc1为40次,地图和指南针因子R=0.2。
接下来进入改进优化算法的第二个环节,首先按式(19)计算第一环节结束时刻的鸽群的中心坐标,然后更新每只鸽子的位置,在每次循环的最后将鸽子数量减半,即淘汰距离目标点远的鸽子,按上述过程进行迭代,一直到迭代次数到达第二个环节的最大迭代次数,设定第二个环节的最大迭代次数nc2为10次。结束两次循环后,可以得到代价函数最小的混合策略Pgbest。
将求得的混合策略代入式(14)、(15),求得该混合策略对应下红方的期望支付值Er,蓝方的期望支付值Eb,如果红方的期望支付值大于蓝方的期望支付值,转到步骤六,否则回到步骤五中的第(2)部分,重新求解。
步骤六:输出红蓝双方对抗结果
(1)红蓝双方对抗中运动控制相关仿真结果
输出双方无人机集群从初始散乱状态到实现聚集再到形成对峙的运动轨迹,并且输出整个对抗运动过程中双方各自的速度变化曲线。进一步用序参量表示群集运动的一致性,对于红方,序参量对于蓝方,序参量φ值越大,表示集群的有序程度越高。
本实施例中,图3至图7给出了红蓝双方对抗中运动控制相关仿真结果,其中图3给出了红蓝双方对抗运动轨迹图,可以看出双方无人机集群在对抗运动过程中,从散乱状态逐渐形成一个有序的整体,朝着敌方运动,并且在双方集群中心距离小于对峙距离时,对抗运动控制停止,双方保持相对静止状态。图4是双方对抗运动终止时刻无人机集群位置分布,可以看出双方形成的有序整体是一个圆形,机间距离均匀稳定,这样的形状可以增强无人机集群的态势感知能力和攻击能力。图5a、b分别表示红方无人机集群x、y轴方向速度变化曲线,可以看出在对抗运动过程中,红方无人机集群可以快速的实现速度一致性。图6a、b分别表示蓝方无人机集群x、y轴方向速度变化曲线,可以看出在对抗运动过程中,蓝方无人机集群可以快速的实现速度一致性。图7以序参量的变化曲线来表示双方在对抗运动过程中运动方向趋于一致的程度,可以看出双方经过短时间相互作用后,运动方向均达成一致。
(2)红蓝双方对抗中攻防策略选择控制相关仿真结果
输出混合策略求解过程中代价函数的变化曲线,观察是否满足求解精度,然后输出混合策略中以较大概率出现的双方攻防策略分布图。
本实施例中,图8至图11给出了红蓝双方对抗中攻防策略选择控制相关仿真结果,图8为在混合策略求解过程中代价函数的变化曲线,为了方便观察下降的程度,对式(17)中计算的代价函数取对数,可以看出代价函数在迭代30次的时候保持不变,值大概在10-0.5左右,满足精度要求。图9给出了混合策略的求解结果,在混合策略中,红方选择己方策略集合中第2种策略的概率是0.85671,选择第3种策略的概率是0.14329,选择第1种策略的概率是0,蓝方选择己方策略集合中的第1种策略的概率是0.29481,选择第3种策略的概率是0.70519,选择第2种和第四种策略的概率是0。如果红蓝双方进行一次对抗,概率表示的是双方对纯策略的偏好程度,如果红蓝双方进行重复对抗,概率表示双方选择各个纯策略被选择的频率。此外图中给出了双方在该种混合策略下的期望支付值,红方的期望支付值为1.2528,大于蓝方的期望支付值0.84385,表明在实际作战过程中,红方的获胜概率大于蓝方。图10、图11给出了在本次求解的混合策略中,出现次数较高的两种情况,图10表示红方采取第2种策略,蓝方采取第3种策略的双方对抗策略布局图,图11表示红方采取第2种策略,蓝方采取第2种策略的双方对抗策略布局图。
Claims (8)
1.一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法,其特征在于:该方法实现步骤如下:
步骤一:初始化战场环境设置,具体包括:初始化对抗场景;初始化无人机运动控制模型;初始化无人机集群攻防策略选择模型;
步骤二:无人机集群对抗运动控制,具体包括:
S21、选择邻居集合;
S22、和邻居保持速度一致;
S23、机间聚集;
S24、机间避障;
S25、接近敌方;
S26、更新位置和速度;
步骤三:基于鹰鸽智能博弈的攻防策略设计,具体包括:
S31、判断红蓝双方无人机集群之间的距离;
S32、对红蓝双方的无人机进行分组;
S33、确定红蓝双方攻防纯策略集合——鹰策略或鸽策略;
步骤四:基于鹰鸽智能博弈的红蓝双方支付矩阵求解,具体包括:计算红方的损失;计算蓝方的损失;计算红蓝双方鹰、鸽混合策略下的支付矩阵;
步骤五:基于鹰鸽智能博弈的红蓝双方混合策略求解,具体包括:
S51、设计代价函数;
S52、用改进鸽群优化算法求解混合策略;
步骤六:输出红蓝双方对抗结果,具体包括:红蓝双方对抗中运动控制相关仿真结果;红蓝双方对抗中攻防策略选择控制相关仿真结果。
6.根据权利要求1所述的仿鹰鸽智能博弈的无人机集群协同对抗控制方法,其特征在于:所述步骤S32对红蓝双方的无人机进行分组的具体过程如下:
8.根据权利要求1所述的仿鹰鸽智能博弈的无人机集群协同对抗控制方法,其特征在于:所述步骤S51设计代价函数的具体过程如下:
Er=βr·A·(βb)′
其中,A表示红方支付矩阵,Er表示红方的期望支付值;
蓝方的期望支付值表示为:
Eb=βr·B·(βb)′
其中,B表示蓝方支付矩阵,Eb表示蓝方的期望支付值;根据纳什均衡理论,并且要保证红方大概率胜利的充分必要条件是:
其中,Ai表示矩阵A的第i个行向量,Bj表示矩阵B的第j个列向量,代价函数可以表述为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011099773.1A CN112269396B (zh) | 2020-10-14 | 2020-10-14 | 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011099773.1A CN112269396B (zh) | 2020-10-14 | 2020-10-14 | 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112269396A CN112269396A (zh) | 2021-01-26 |
CN112269396B true CN112269396B (zh) | 2021-09-28 |
Family
ID=74337961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011099773.1A Active CN112269396B (zh) | 2020-10-14 | 2020-10-14 | 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112269396B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112987784B (zh) * | 2021-02-26 | 2024-03-26 | 辽宁工程技术大学 | 一种针对无人机集群协同对抗的决策方法 |
CN113095465B (zh) * | 2021-04-01 | 2023-10-17 | 哈尔滨工程大学 | 量子大马哈鱼洄游机制演化博弈的水下无人集群任务分配方法 |
CN113095481B (zh) * | 2021-04-03 | 2024-02-02 | 西北工业大学 | 一种基于并行自我博弈的空战机动方法 |
CN113627081B (zh) * | 2021-08-03 | 2024-02-20 | 北京航空航天大学 | 一种基于鹰群狩猎行为仿生的无人智能集群对抗控制方法 |
CN113835446B (zh) * | 2021-10-14 | 2023-06-16 | 中国人民解放军空军预警学院 | 预警机与无人机协同探测空域配置方法及设备 |
CN113645317B (zh) * | 2021-10-15 | 2022-01-18 | 中国科学院自动化研究所 | 一种松散的集群控制方法、装置、设备、介质和产品 |
CN114063644B (zh) * | 2021-11-09 | 2023-06-02 | 北京航空航天大学 | 基于鸽群反向对抗学习的无人作战飞机空战自主决策方法 |
CN114148520A (zh) * | 2021-11-26 | 2022-03-08 | 航空工业信息中心 | 低成本折叠翼拦截机、机群和拦截来袭无人机群的方法 |
CN115061495B (zh) * | 2022-06-30 | 2024-04-30 | 北京航空航天大学 | 一种基于鹰鸽博弈的无人机群组对抗自主控制方法 |
CN116300985B (zh) * | 2023-05-24 | 2023-09-05 | 清华大学 | 控制方法、装置、计算机设备和存储介质 |
CN116360503B (zh) * | 2023-05-31 | 2023-10-13 | 北京航空航天大学 | 一种无人机博弈对抗策略生成方法、系统及电子设备 |
CN116956758B (zh) * | 2023-09-21 | 2024-02-02 | 北京航天晨信科技有限责任公司 | 基于对抗过程仿真模型的策略收益预测方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549233A (zh) * | 2018-05-04 | 2018-09-18 | 南京航空航天大学 | 一种带有直觉模糊信息的无人机空战机动博弈方法 |
CN109254588A (zh) * | 2018-10-17 | 2019-01-22 | 北京航空航天大学 | 一种基于交叉变异鸽群优化的无人机集群协同侦察方法 |
CN110069076A (zh) * | 2019-04-23 | 2019-07-30 | 北京航空航天大学 | 一种基于猛狼围捕行为的无人机集群空战方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7044854B2 (en) * | 2001-07-09 | 2006-05-16 | Abecassis David H | Area-based resource collection in a real-time strategy game |
CN104850009A (zh) * | 2015-03-17 | 2015-08-19 | 北京航空航天大学 | 一种基于捕食逃逸鸽群优化的多无人飞行器编队协调控制方法 |
CN107479380A (zh) * | 2017-08-25 | 2017-12-15 | 东北大学 | 基于演化博弈理论的多智能体协调控制方法 |
CN108827312B (zh) * | 2018-08-08 | 2021-10-08 | 清华大学 | 一种基于神经网络和人工势场的协同博弈路径规划方法 |
CN110275549B (zh) * | 2019-06-11 | 2022-03-11 | 深圳大学 | 一种多智能体自主式跟踪方法、装置及计算机可存储介质 |
CN110377059A (zh) * | 2019-08-29 | 2019-10-25 | 哈尔滨工程大学 | 一种基于狮群算法的多auv围捕者协同控制方法 |
-
2020
- 2020-10-14 CN CN202011099773.1A patent/CN112269396B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108549233A (zh) * | 2018-05-04 | 2018-09-18 | 南京航空航天大学 | 一种带有直觉模糊信息的无人机空战机动博弈方法 |
CN109254588A (zh) * | 2018-10-17 | 2019-01-22 | 北京航空航天大学 | 一种基于交叉变异鸽群优化的无人机集群协同侦察方法 |
CN110069076A (zh) * | 2019-04-23 | 2019-07-30 | 北京航空航天大学 | 一种基于猛狼围捕行为的无人机集群空战方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112269396A (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112269396B (zh) | 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法 | |
CN108680063B (zh) | 一种针对大规模无人机集群动态对抗的决策方法 | |
CN113589842B (zh) | 一种基于多智能体强化学习的无人集群任务协同方法 | |
CN112783209B (zh) | 一种基于鸽群智能竞争学习的无人机集群对抗控制方法 | |
CN108827312B (zh) | 一种基于神经网络和人工势场的协同博弈路径规划方法 | |
Jiandong et al. | UAV cooperative air combat maneuver decision based on multi-agent reinforcement learning | |
CN110083971B (zh) | 一种基于作战推演的自爆式无人机集群作战兵力分配方法 | |
CN109460056A (zh) | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 | |
Wang et al. | Improving maneuver strategy in air combat by alternate freeze games with a deep reinforcement learning algorithm | |
CN114460959A (zh) | 一种基于多体博弈的无人机群协同自主决策方法及装置 | |
CN113741525B (zh) | 基于策略集合maddpg多无人机协同攻防对抗方法 | |
CN114063644B (zh) | 基于鸽群反向对抗学习的无人作战飞机空战自主决策方法 | |
CN112284188A (zh) | 一种基于自适应步长离散狼群算法的无人机攻防决策方法 | |
CN114397911A (zh) | 一种基于多智能体的无人机集群对抗决策方法 | |
CN112016660A (zh) | 一种物理力和数据联合驱动的三维集群行为模拟方法 | |
Zha et al. | Dynamic multi-team antagonistic games model with incomplete information and its application to multi-UAV | |
CN116225049A (zh) | 一种多无人机狼群协同作战攻防决策算法 | |
Yuan et al. | Research on UCAV maneuvering decision method based on heuristic reinforcement learning | |
CN112000070B (zh) | 一种异构集群协同运动规划方法 | |
Price et al. | GA directed self-organized search and attack UAV swarms | |
CN115061495B (zh) | 一种基于鹰鸽博弈的无人机群组对抗自主控制方法 | |
CN115454136B (zh) | 一种无人机集群协同攻防对抗决策方法 | |
CN111273697B (zh) | 一种无人机群冲突解脱方法 | |
He et al. | Harris' Hawk and Pigeon Inspired Attack-Defense Decision Making in Unmanned Combat Aerial Vehicles | |
CN116229766B (zh) | 博弈对抗下基于效能的目标分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |