CN114167899A - 一种无人机蜂群协同对抗决策方法及系统 - Google Patents

一种无人机蜂群协同对抗决策方法及系统 Download PDF

Info

Publication number
CN114167899A
CN114167899A CN202111607271.XA CN202111607271A CN114167899A CN 114167899 A CN114167899 A CN 114167899A CN 202111607271 A CN202111607271 A CN 202111607271A CN 114167899 A CN114167899 A CN 114167899A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
enemy
drone
numbered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111607271.XA
Other languages
English (en)
Other versions
CN114167899B (zh
Inventor
宏晨
陈艾东
肖明明
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Union University
Original Assignee
Beijing Union University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Union University filed Critical Beijing Union University
Priority to CN202111607271.XA priority Critical patent/CN114167899B/zh
Publication of CN114167899A publication Critical patent/CN114167899A/zh
Application granted granted Critical
Publication of CN114167899B publication Critical patent/CN114167899B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供一种无人机蜂群协同对抗决策方法及系统,所述方法包括步骤1:建立包含地面高价值目标的三维战场环境;步骤2:建立无人机的运动模型;步骤3:建立无人机的攻击模型;步骤4:求出每架无人机的最优策略集合;步骤5:建立动态博弈模型;步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定无人机的最佳响应策略。本发明综合考虑HVT,建立了基于权重的综合考虑双方无人机之间的夹角、HVT暴露面积和攻击距离的攻击模型,求解无人机的最佳策略集,建立三种无人机蜂群协同对抗博弈模型,求解无人机的最佳响应策略,以有效提高进攻敌方HVT时无人机蜂群的协同对抗水平,从而大幅度提高无人机蜂群的攻击效能。

Description

一种无人机蜂群协同对抗决策方法及系统
技术领域
本发明涉及无人机技术领域,具体涉及一种无人机蜂群协同对抗决策方法及系统。
背景技术
21世纪以来,小型无人机在有效载荷小型化、续航时间、超视距通信、低成本化等方面持续取得进展,集群技术、自主技术、协同技术等智能化技术正推动着小型无人机战斗力的提升,可以预见,未来无人机蜂群作战将会成为战场重要的作战方式。无人机蜂群由若干配备多种任务载荷的低成本小型无人机组成,它们参照蜜蜂等生物的集体行动模式,通过无人机之间的协同来达到高效率完成特定作战任务的目标。
申请号为202110810542.5的中国发明专利公开了一种微型无人机蜂群作战系统,包括:数架微型无人机、任务处理终端、手持控制终端。微型无人机整机重量小于100克,内部包括:飞行控制模块、飞行动力系统、GPS定位模块、图像识别模块、链路模块。该发明的技术方案,具有便携性和隐秘性的优势,在有限的作战能力和续航条件下,为单兵作战提供有效的侦察打击手段,保证人员避免直接与敌方迎面对战,降低伤亡风险,有效实现了微型无人机蜂群在单兵作战中的应用。但是该发明中的无人机蜂群仅辅助单兵作战,无人机蜂群自身没有参与对抗,因此其不具备协同对抗决策能力。
申请号为202011412454.1的中国发明专利公开了一种无人机蜂群网去中心化自治决策方法,该方法提供单体无人机的决策和协同决策机制,提高了决策的效率;使用针对无人机任务的智能合约,提高无人机蜂群执行攻击的速度,可以保证无人机蜂群获取其他节点信息与攻击目标信息的准确性,该机制利用区块一致蜂群共识算法和智能行为合约协同进行无人机自治决策。其中区块一致蜂群共识算法基于区块链技术的几大优势,能够较好的处理数据管理和无人机之间的信息沟通与作战的问题;基于智能合约的自治决策能够使得无人机单独执行任务且并不需要太多协同需求,无人机蜂群无需等待所有人的确认,即可使用针对任务的智能合约判断是否通过请求,最大程度的提高无人机蜂群任务执行的效率。但是该发明中的单体无人机的决策和协同决策机制未考虑地面高价值目标。
发明内容
为解决以上技术问题中的至少一个,本发明提供了一种无人机蜂群协同对抗决策方法及系统,其可以综合考虑地面高价值目标(HVT,High Value Targets)求解无人机的最佳响应策略。
本发明的第一方面提供一种无人机蜂群协同对抗决策方法,包括:
步骤1:建立包含地面高价值目标的三维战场环境;
步骤2:建立无人机的运动模型;
步骤3:建立无人机的攻击模型;
步骤4:求出每架无人机(UAV,Unmanned Aerial Vehicle)的最优策略集合;
步骤5:建立动态博弈模型;
步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定无人机的最佳响应策略。
优选的是,步骤1:建立包含地面高价值目标的三维战场环境,包括:设置三维战场的空间坐标系、战场的空间范围、无人机数量、HVT相关信息、无人机的最小及最大速度、最大航向角、风向及风速、最大协同数量等参数。
上述任一方案优选的是,步骤2:建立无人机的运动模型,包括:设置无人机的运动坐标系、噪声干扰、无人机位置和速度的更新规则、无人机蜂群的集群行为模式。
上述任一方案优选的是,步骤2:建立无人机的运动模型包括:建立单架无人机理想条件下的运动模型、建立单架无人机含噪声的运动模型、建立无人机蜂群的运动模型。
上述任一方案优选的是,单架无人机在当前时刻的运动状态为:
Figure BDA0003434365760000021
其中
Figure BDA0003434365760000022
表示该单架无人机在当前时刻的位置向量,
Figure BDA0003434365760000023
表示该单架无人机在当前时刻的速度向量,
Figure BDA0003434365760000024
分别表示该单架无人机在当前时刻的三个维度的坐标。
上述任一方案优选的是,所述单架无人机理想条件下的运动模型为:
单架无人机在下一时刻的运动状态为:
Figure BDA0003434365760000025
其中
Figure BDA0003434365760000026
Figure BDA0003434365760000031
表示该单架无人机在下一时刻的位置向量,
Figure BDA0003434365760000032
表示该单架无人机在下一时刻的速度向量,
Figure BDA0003434365760000033
分别表示归一化的
Figure BDA0003434365760000034
αT表示该单架无人机的转向角,
Figure BDA0003434365760000035
表示该单架无人机的垂直速度向量。
上述任一方案优选的是,所述单架无人机含噪声的运动模型为:
单架无人机在下一时刻的位置向量
Figure BDA0003434365760000036
其中dW表示噪声强度,其满足均匀分布
Figure BDA0003434365760000037
Figure BDA0003434365760000038
表示下一时刻噪声方向,
Figure BDA0003434365760000039
θ~U(0,π),
Figure BDA00034343657600000310
表示初始噪声强度。
上述任一方案优选的是,所述无人机蜂群的运动模型为:
非战斗模式下,所述无人机蜂群具有聚集、分散、编队三种行为模式,定义编号为i的无人机的友机蜂群的质心(COM,center of mass)的三维坐标为:
Figure BDA00034343657600000311
其中
Figure BDA00034343657600000312
为编号为j的无人机的三维坐标,n为己方无人机蜂群的无人机总数;
(1)对于所述聚集行为
无人机在下一时刻的目标点位置坐标为
Figure BDA00034343657600000313
其中pH为当前时刻无人机目标点位置坐标;
速度大小更新规则为:
如果编号为i的无人机在质心c之前,
Figure BDA00034343657600000314
b<1,直到
Figure BDA00034343657600000315
如果编号为i的无人机在质心c之后,
Figure BDA00034343657600000316
a>1,直到
Figure BDA00034343657600000317
其中a、b为常数,Vmin和Vmax分别表示设定的无人机的最小速度和最大速度;
(2)对于所述分散行为
当编号为i的无人机与友机的距离小于设定的最小距离dmin,更新目标指向向量:
Figure BDA00034343657600000318
其中βT为更新目标指向向量需要偏转的角度,
Figure BDA00034343657600000319
表示归一化的目标指向向量
Figure BDA00034343657600000320
(3)对于所述编队行为
每架无人机在未进入攻击态时,不调整速度大小及方向,保持队形。
上述任一方案优选的是,步骤3:建立无人机的攻击模型包括:设定无人机的友机协同目标分配策略、杀伤率。
上述任一方案优选的是,步骤3中,不存在敌方HVT时:对于编号为i的无人机,其目标期望函数为
Figure BDA0003434365760000041
其中mk表示攻击编号为k的敌方无人机的协同友机数量,αmax是无人机的最大转向角,
Figure BDA0003434365760000042
表示编号为i的无人机与编号为k的敌方无人机之间的距离,
Figure BDA0003434365760000043
为编号为i的无人机的速度大小,ωik表示
Figure BDA0003434365760000044
Figure BDA0003434365760000045
之间的夹角,τ为权重系数,τ∈[0,1],ρik
Figure BDA0003434365760000046
Figure BDA0003434365760000047
的夹角,
Figure BDA0003434365760000048
为编号为i的无人机的速度向量,
Figure BDA0003434365760000049
为编号为k的敌方无人机的速度向量,
Figure BDA00034343657600000410
为编号为i的无人机指向编号为k的敌方无人机的向量;编号为i的无人机的攻击策略为
Figure BDA00034343657600000411
Figure BDA00034343657600000412
且mk<mmax时,编号为i的无人机加入对编号为k的敌方无人机的攻击组中,编号为i的无人机进入攻击模式,不再坚持无人机蜂群的聚集行为、分散行为和编队行为,其中K表示编号为i的无人机可以感知到的(即临近的)敌方无人机数量,mmax表示最大协同友机数量。
上述任一方案优选的是,步骤3中,存在敌方HVT时:对于编号为i的无人机,其目标期望函数为
Figure BDA00034343657600000413
其中mk表示攻击编号为k的敌方无人机的协同友机数量,αmax是无人机的最大转向角,
Figure BDA00034343657600000414
表示编号为i的无人机与编号为k的敌方无人机之间的距离,
Figure BDA00034343657600000415
为编号为i的无人机的速度大小,ωik表示
Figure BDA00034343657600000416
Figure BDA00034343657600000417
之间的夹角,f为权重因子,表示首要目标(破坏敌方HVT)与其他目标(击落敌方无人机)的偏好程度,f越大,越倾向于攻击敌方HVT,当f→0时,越倾向于与敌机缠斗,τ为权重系数,τ∈[0,1],ρik
Figure BDA00034343657600000418
Figure BDA00034343657600000419
的夹角,
Figure BDA00034343657600000420
为编号为i的无人机的速度向量,
Figure BDA00034343657600000421
为编号为k的敌方无人机的速度向量,
Figure BDA00034343657600000422
为编号为i的无人机指向编号为k的敌方无人机的向量;编号为i的无人机的攻击策略为
Figure BDA00034343657600000423
Figure BDA00034343657600000424
Figure BDA00034343657600000425
时,则编号为i的无人机与敌机缠斗,否则攻击敌方HVT,其中K表示编号为i的无人机可以感知到的敌方无人机数量,
Figure BDA00034343657600000426
表示编号为i的无人机与敌方HVT的距离;如果mk=mmax
Figure BDA00034343657600000427
则编号为i的无人机不再攻击编号为k的敌方无人机,换成编号为l的友机攻击编号为k的敌方无人机,
Figure BDA00034343657600000428
表示编号为l的无人机与编号为k的敌方无人机之间的距离,
Figure BDA00034343657600000429
为编号为l的无人机的速度大小,ωlk表示
Figure BDA0003434365760000051
Figure BDA0003434365760000052
之间的夹角,ρlk
Figure BDA0003434365760000053
Figure BDA0003434365760000054
的夹角,
Figure BDA0003434365760000055
表示编号为l的无人机的速度向量,
Figure BDA0003434365760000056
表示编号为l的无人机指向编号为k的敌方无人机的向量。
上述任一方案优选的是,步骤3中,编号为i的无人机对编号为k的敌方无人机的杀伤率
Figure BDA0003434365760000057
其中γ表示距离因子,
Figure BDA0003434365760000058
γ∈[0,1],w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标(编号为k的敌方无人机)的概率,λ为另一权重系数,λ∈[0,1],ρik
Figure BDA0003434365760000059
Figure BDA00034343657600000510
的夹角。
上述任一方案优选的是,步骤3中,编号为i的无人机对敌方HVT的杀伤率
Figure BDA00034343657600000511
其中,
Figure BDA00034343657600000512
为编号为i的无人机与敌方HVT的距离,Ae表示攻击目标敌方HVT暴露给编号为i的无人机的攻击面积,
Figure BDA00034343657600000513
表示攻击目标敌方HVT可暴露的最大面积,w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标(敌方HVT)的概率,λ为另一权重系数,λ∈[0,1]。
上述任一方案优选的是,步骤4:求出每架无人机的最优策略集合包括利用粒子群优化(PSO,Particle swarm optimization)算法、遗传算法(GA,Genetic Algorithm)、差分进化(DE,Differential Evolution)算法中的一种求出每架无人机的最优策略集合。
上述任一方案优选的是,步骤4中,利用PSO算法求出每架无人机的最优策略集合为针对无人机蜂群中的每一架无人机均执行PSO算法以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),具体包括:
步骤411:初始化无人机蜂群,包括初始化所述己方无人机蜂群的无人机总数n、该无人机的速度Vi、位置坐标
Figure BDA00034343657600000514
以及最优位置坐标
Figure BDA00034343657600000515
步骤412:初始化该无人机的全局最优位置坐标
Figure BDA00034343657600000516
步骤413:更新该无人机的速度Vi及位置坐标
Figure BDA00034343657600000517
步骤414:计算该无人机的适应度
Figure BDA00034343657600000518
步骤415:更新该无人机的历史最优位置;
步骤416:存储历史最优位置及其对应的速度;
步骤417:更新全局最优位置gbest
步骤418:达到最大迭代次数则终止迭代,否则转到步骤413;
步骤419:返回该无人机的最优策略集合
Figure BDA0003434365760000061
结束算法。
上述任一方案优选的是,步骤413中,对于编号为i的无人机,其速度更新规则为:
Figure BDA0003434365760000062
其中c1和c2是学习因子,r是介于[0,1]之间的随机数,ε(0≤ε≤1)是惯性因子,ε越大,全局寻优能力越强,局部寻优能力越弱,其中Vi表示编号为i的无人机的速度。
上述任一方案优选的是,步骤413中,对于编号为i的无人机,其位置坐标更新规则为:
Figure BDA0003434365760000063
其中Vi表示编号为i的无人机的速度大小。
上述任一方案优选的是,步骤414中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000064
其中K为当前时刻临近编号为i的无人机的敌机数量。
上述任一方案优选的是,步骤414中,存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000065
其中K为当前时刻临近编号为i的无人机的敌机数量。
上述任一方案优选的是,步骤4中,利用遗传算法(GA,Genetic Algorithm)求出每架无人机的最优策略集合为针对无人机蜂群中的每一架无人机均执行GA以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),具体包括:
步骤421:获取战场态势信息;
步骤422:生成初始化种群;
步骤423:计算适应度;
步骤424:依据适应度,采用轮盘赌规则选择双亲;
步骤425:双亲通过交叉和变异生成后代;
步骤426:计算后代的适应度;
步骤427:用后代替换适应度低的个体,形成新种群;
步骤428:演化的次数超过预先设定的次数或适应度连续几次提升的不明显,则终止迭代,否则转到步骤424;
步骤429:返回最后一代中适应度最大的个体即最优策略集
Figure BDA0003434365760000071
结束算法。
上述任一方案优选的是,步骤421:获取战场态势信息包括获取临近的敌机的位置,求出与临近的敌机的距离
Figure BDA0003434365760000072
以及通过友机共享获得mk
上述任一方案优选的是,步骤422:生成初始化种群包括在参数ωik
Figure BDA0003434365760000073
的约束范围内,随机生成两个参数的值,生成初始化种群,种群内的个体数量为N,每个染色体是一个策略集。
上述任一方案优选的是,步骤423和步骤426中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000074
其中K为当前时刻临近编号为i的无人机的敌机数量;存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000075
其中K为当前时刻临近编号为i的无人机的敌机数量。
上述任一方案优选的是,步骤4中,利用差分进化(DE,Differential Evolution)算法求出每架无人机的最优策略集合为针对无人机蜂群中的每一架无人机均执行DE算法以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),具体包括:
步骤431:初始化,包括初始化种群规模、个体维度、最大迭代次数;
步骤432:计算每个个体的适应度
Figure BDA0003434365760000076
步骤433:变异操作;
步骤434:交叉操作;
步骤435:选择操作;
步骤436:迭代次数达到最大迭代次数后终止迭代,否则迭代次数加一后,转到步骤432;
步骤437:种群中个体按照适应度降序排序;
步骤438:返回最优策略集
Figure BDA0003434365760000077
结束算法。
上述任一方案优选的是,步骤432中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000078
其中K为当前时刻临近编号为i的无人机的敌机数量;存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000079
其中K为当前时刻临近编号为i的无人机的敌机数量。
上述任一方案优选的是,步骤5中建立动态博弈模型为建立基于非完全信息的动态博弈模型,所述动态博弈模型包括合作博弈模型、对抗博弈模型和混合关系博弈模型中的至少一种。
上述任一方案优选的是,对于编号为i的无人机,所述合作博弈模型的博弈方为编号为i的无人机和其临近的友机,策略集S为步骤4中确定的最优策略集合
Figure BDA0003434365760000081
收益
Figure BDA0003434365760000082
为步骤4中确定的适应度函数
Figure BDA0003434365760000083
所述合作博弈模型表示为
Figure BDA0003434365760000084
其中P+表示合作博弈的参与者,
Figure BDA00034343657600000828
表示编号为i的无人机的临近的友机集合,收益函数
Figure BDA0003434365760000085
表示编号为i的无人机在执行策略
Figure BDA0003434365760000086
时的收益,
Figure BDA0003434365760000087
其中,
Figure BDA0003434365760000088
是编号为i的无人机的最优博弈策略,
Figure BDA0003434365760000089
表示编号为i的无人机的临近友机采取的策略。
上述任一方案优选的是,对于编号为i的无人机,所述对抗博弈模型的博弈方为编号为i的无人机和其临近的敌机,策略集S为步骤4中确定的最优策略集合
Figure BDA00034343657600000810
收益函数
Figure BDA00034343657600000811
为步骤4中确定的适应度函数
Figure BDA00034343657600000812
所述对抗博弈模型表示为
Figure BDA00034343657600000813
其中P-表示对抗博弈的参与者,
Figure BDA00034343657600000829
表示编号为i的无人机的临近的敌机集合,收益函数
Figure BDA00034343657600000814
表示编号为i的无人机在执行策略
Figure BDA00034343657600000815
时的收益,
Figure BDA00034343657600000816
其中
Figure BDA00034343657600000817
是编号为i的无人机的最优博弈策略,
Figure BDA00034343657600000818
表示编号为i的无人机的临近敌机采取的策略。
上述任一方案优选的是,对于编号为i的无人机,所述混合关系博弈模型的博弈方为编号为i的无人机和其临近的所有无人机,策略集S为步骤4中确定的最优策略集合
Figure BDA00034343657600000819
收益
Figure BDA00034343657600000820
为步骤4中确定的适应度函数
Figure BDA00034343657600000821
所述合作博弈模型表示为
Figure BDA00034343657600000822
其中P表示混合关系博弈的参与者,P={i∪Γi},Γi表示临近的无人机集合,即
Figure BDA00034343657600000830
表示编号为i的无人机的临近的友机集合,
Figure BDA00034343657600000831
表示编号为i的无人机的临近的敌机集合,收益函数
Figure BDA00034343657600000823
表示编号为i的无人机在执行策略
Figure BDA00034343657600000824
时的收益,
Figure BDA00034343657600000825
其中,
Figure BDA00034343657600000826
是编号为i的无人机的最优博弈策略,
Figure BDA00034343657600000827
表示编号为i的无人机临近的所有无人机采取的策略。
上述任一方案优选的是,步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定UAV的最佳响应策略包括:设置最佳响应策略的计算方式、求解最佳响应策略。
上述任一方案优选的是,步骤6中,对于所述合作博弈模型,基于临近友机总适应度最大的博弈策略来求取编号为i的无人机的最佳响应,编号为i的无人机在当前时刻t的最佳响应为:
Figure BDA0003434365760000091
编号为i的无人机求得自己的最佳响应,使得临近友机总适应度最大,即
Figure BDA00034343657600000916
表示编号为j的无人机属于集合
Figure BDA0003434365760000093
上述任一方案优选的是,步骤6中,对于所述对抗博弈模型,基于临近敌机总适应度最小的博弈策略来求取取编号为i的无人机的最佳响应,取编号为i的无人机在当前时刻t的最佳响应为:
Figure BDA0003434365760000094
取编号为i的无人机求得自己的最佳响应,使得临近敌机的总适应度最小,即
Figure BDA0003434365760000095
Figure BDA0003434365760000096
表示编号为k的无人机属于集合
Figure BDA0003434365760000097
上述任一方案优选的是,步骤6中,对于所述混合关系博弈模型,综合考虑友机和敌机的收益,基于合作博弈与非合作博弈收益之差最大化来求取编号为i的无人机在当前时刻t的最佳响应:
Figure BDA0003434365760000098
Figure BDA0003434365760000099
编号为i的无人机求得自己在当前时刻t的最佳响应,使得临近友机总适应度减去临近敌机总适应度的差最大,即
Figure BDA00034343657600000910
Figure BDA00034343657600000911
表示编号为j的无人机属于集合
Figure BDA00034343657600000912
表示编号为k的无人机属于集合
Figure BDA00034343657600000913
上述任一方案优选的是,根据所述最佳响应
Figure BDA00034343657600000914
获取
Figure BDA00034343657600000915
从而得到编号为i的无人机的最佳行动参数,包括:协同攻击数量、偏转角和飞行速度。
本发明的第二方面提供一种无人机蜂群协同对抗决策系统,所述系统包括无人机蜂群,所述无人机蜂群采用所述无人机蜂群协同对抗决策方法确定其最佳响应策略。
本发明的无人机蜂群协同对抗决策方法及系统综合考虑HVT,建立了基于权重的综合考虑暴露面积和攻击距离的攻击模型,利用粒子群算法在多群体自主寻优方面的优势,求解无人机的最佳策略集,基于无人机间的距离和敌友关系,建立三种基于临近无人机的非完全信息下无人机蜂群协同对抗博弈模型,求解无人机的最佳响应策略,以有效提高进攻敌方地面高价值目标时无人机蜂群的协同对抗水平,从而大幅度提高无人机蜂群的攻击效能。
附图说明
图1为按照本发明的无人机蜂群协同对抗决策方法的一优选实施例的流程示意图。
图2为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的无人机运动坐标系示意图。
图3为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的投影向量示意图。
图4为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的无人机的位置及速度示意图。
图5为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的我方无人机与敌方无人机的夹角示意图。
图6为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的利用PSO算法求出每架无人机的最优策略集合流程示意图。
图7为按照本发明的无人机蜂群协同对抗决策方法的如图1所示实施例的基于动态博弈确定无人机的最佳响应策略流程示意图。
图8为按照本发明的无人机蜂群协同对抗决策方法的另一实施例的利用GA求出每架无人机的最优策略集合流程示意图。
图9为按照本发明的无人机蜂群协同对抗决策方法的再一实施例的利用DE算法求出每架无人机的最优策略集合流程示意图。
图10为按照本发明的无人机蜂群协同对抗决策方法的第四实施例的一对一作战状态转移示意图。
图11为按照本发明的无人机蜂群协同对抗决策方法的如图8所示实施例的多对多作战状态转移示意图。
具体实施方式
为了更好地理解本发明,下面结合具体实施例对本发明作详细说明。
进行详细说明之前首先进行一些基本约定和说明。
在本申请中,涉及到英文或者希腊符号时,若符号上方带有“→”,表示的是带有方向的量;如符号上方带有“^”,表示的是不带有“^”的相同的符号表示的量的下一时刻;若符号左右带有“||”,表示的是“||”中符号表示的量的大小,对于仅下标不同的符号,其具体含义没有明确说明的情况下,可以从已说明的符号的含义类推得出,如pp表示无人机的位置,
Figure BDA0003434365760000111
表示编号为i的无人机的位置,可以类推出
Figure BDA0003434365760000112
表示编号为j的无人机的位置。
粒子群优化算法(PSO,Particle swarm optimization)是一种群智能优化算法,源于对鸟群捕食的行为研究,基本思想是通过群体中个体之间的协作和信息共享来寻找最优解。遗传算法(GA,Genetic Algorithm)是一种受自然选择过程启发的元启发式算法,属于进化算法大类,遗传算法通常依赖于生物启发的算子,如变异、交叉和选择,来生成高质量的优化和搜索问题的解决方案。差分进化(DE,Differential Evolution)算法是一种高效的全局优化算法,它也是基于群体的启发式搜索算法,群中的每个个体对应一个解向量;可以利用PSO算法、GA、DE算法寻找无人机蜂群空地协同对抗中的最优行动策略集。
博弈论研究多个相互关联、相互竞争决策者的理性决策,并对决策结果进行均衡求解的理论。无人机蜂群空地协同对抗涉及蜂群内部的协同,以及双方无人机蜂群的对抗。可以利用合作博弈、非合作博弈、混合关系博弈理论来解决上述的无人机蜂群协同对抗问题,求解每架无人机的最优行动策略,从而提高整个无人机蜂群的作战效能。
因此基于博弈理论,提出了一种无人机蜂群协同对抗决策方法。
实施例1
如图1所示,一种无人机蜂群协同对抗决策方法,包括:
步骤1:建立包含地面高价值目标的三维战场环境;
步骤2:建立无人机的运动模型;
步骤3:建立无人机的攻击模型;
步骤4:求出每架无人机(UAV,Unmanned Aerial Vehicle)的最优策略集合;
步骤5:建立动态博弈模型;
步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定无人机的最佳响应策略。
在本实施例中优选的是,步骤1:建立包含地面高价值目标的三维战场环境,包括:设置三维战场的空间坐标系、战场的空间范围、无人机数量、HVT相关信息、无人机的最小及最大速度、最大航向角、风向及风速、最大协同数量等参数。
在本实施例中优选的是,步骤2:建立无人机的运动模型,包括:设置无人机的运动坐标系、噪声干扰、无人机位置和速度的更新规则、无人机蜂群的集群行为模式,进一步包括:建立单架无人机理想条件下的运动模型、建立单架无人机含噪声的运动模型、建立无人机蜂群的运动模型。
图2所示为设置的无人机的运动坐标系,所述运动坐标系为三维坐标系,具有X轴、Y轴、Z轴和坐标原点O,坐标系中的一个点P的坐标表示为(x,y,z),点P与坐标原点O的连线与Z轴的夹角为θ,0<θ<π;所述点P在XOY平面的投影为点P’,其坐标为(x,y,0),点P’与坐标原点O的连线与X轴的夹角为
Figure BDA0003434365760000121
Figure BDA0003434365760000122
无人机在所述运动坐标系内可以将无人机看成所述运动坐标系内的点。
如图3所示,对于某一无人机,在当前时刻,其速度向量为
Figure BDA0003434365760000123
图中pp表示该无人机的位置坐标,pH表示该无人机的目标点位置坐标,
Figure BDA0003434365760000124
为该无人机的目标指向向量,
Figure BDA0003434365760000125
则该无人机的运动平面法向量
Figure BDA0003434365760000126
垂直速度向量
Figure BDA0003434365760000127
对于某一无人机,在当前时刻,该无人机的位置向量为
Figure BDA0003434365760000128
其中
Figure BDA0003434365760000129
分别表示该单架无人机在当前时刻的三个维度的坐标,即可以表示为
Figure BDA00034343657600001210
该无人机的运动状态表示为
Figure BDA00034343657600001211
为了降低复杂度,将
Figure BDA00034343657600001212
投影到以
Figure BDA00034343657600001213
Figure BDA00034343657600001214
为坐标轴的2D(二维)平面内,则
Figure BDA00034343657600001215
在所述2D平面内的投影向量
Figure BDA00034343657600001216
其中
Figure BDA00034343657600001217
为投影向量
Figure BDA00034343657600001218
Figure BDA00034343657600001219
轴坐标,
Figure BDA00034343657600001220
为投影向量
Figure BDA00034343657600001221
Figure BDA00034343657600001222
轴坐标;将
Figure BDA00034343657600001223
投影到以
Figure BDA00034343657600001224
Figure BDA00034343657600001225
为坐标轴的2D(二维)平面内,则
Figure BDA00034343657600001226
其中
Figure BDA00034343657600001227
为投影向量
Figure BDA00034343657600001228
Figure BDA00034343657600001229
轴坐标,
Figure BDA00034343657600001230
为投影向量
Figure BDA00034343657600001231
Figure BDA00034343657600001232
轴坐标。
如图4所示,
Figure BDA00034343657600001233
Figure BDA00034343657600001234
的夹角
Figure BDA00034343657600001235
无人机的转向角αT=sgn(α)min(|α|,αmax),其中αmax是无人机的最大转向角,αT≤αmax
因此,步骤2中:
(1)建立单架无人机理想条件下的运动模型为:
单架无人机在下一时刻的位置向量:
Figure BDA00034343657600001236
该单架无人机在下一时刻的速度向量:
Figure BDA0003434365760000131
该单架无人机在下一时刻的运动状态:
Figure BDA0003434365760000132
其中,
Figure BDA0003434365760000133
分别表示归一化的
Figure BDA0003434365760000134
(2)建立单架无人机含噪声的运动模型为:
单架无人机在下一时刻的位置向量:
Figure BDA0003434365760000135
其中dW表示噪声强度,其满足均匀分布
Figure BDA0003434365760000136
Figure BDA0003434365760000137
表示下一时刻噪声方向,
Figure BDA0003434365760000138
θ~U(0,π),
Figure BDA0003434365760000139
表示初始噪声强度。
(3)建立无人机蜂群的运动模型:
非战斗模式下,所述无人机蜂群具有聚集、分散、编队三种行为模式,定义编号为i的无人机的友机蜂群的质心(COM,center of mass)的三维坐标为:
Figure BDA00034343657600001310
其中
Figure BDA00034343657600001311
为编号为j的无人机的三维坐标,n为无人机蜂群的无人机总数;则:
①对于所述聚集行为:
无人机在下一时刻的目标点位置坐标为
Figure BDA00034343657600001312
其中pH为当前时刻无人机目标点位置坐标;
速度大小更新规则为:
如果编号为i的无人机在质心c之前,
Figure BDA00034343657600001313
b<1,直到
Figure BDA00034343657600001315
如果编号为i的无人机在质心c之后,
Figure BDA00034343657600001316
a>1,直到
Figure BDA00034343657600001317
其中a、b为常数,Vmin和Vmax分别表示设定的无人机的最小速度和最大速度;
②对于所述分散行为:
当编号为i的无人机与友机的距离小于设定的最小距离dmin,更新目标指向向量:
Figure BDA00034343657600001318
其中βT为更新目标指向向量需要偏转的角度,
Figure BDA00034343657600001319
表示归一化的目标指向向量
Figure BDA00034343657600001320
③对于所述编队行为:
每架无人机在未进入攻击态时,不调整速度大小及方向,保持队形。
当无人机携带的武器的攻击范围内存在敌机,且分配到攻击的敌机时,进入攻击态。
在本实施例中优选的是,步骤3:建立无人机的攻击模型包括:设定无人机的友机协同目标分配策略、杀伤率。具体地说,步骤3中:
(1)不存在敌方HVT时,无人机的攻击目标为敌方无人机,因此,对于编号为i的无人机:
其目标期望函数为:
Figure BDA0003434365760000141
其中mk表示攻击编号为k的敌方无人机的协同友机数量,可以通过友机之间信息共享获取mk的值,αmax是无人机的最大转向角,
Figure BDA0003434365760000142
表示编号为i的无人机与编号为k的敌方无人机之间的距离,可以通过编号为i的无人机上的传感器探测得到,
Figure BDA0003434365760000143
为编号为i的无人机的速度大小,
Figure BDA0003434365760000144
为编号为i的无人机指向编号为k的敌方无人机的向量,
Figure BDA0003434365760000145
为编号为i的无人机的速度向量,ωik表示
Figure BDA0003434365760000146
Figure BDA0003434365760000147
之间的夹角,ρik
Figure BDA0003434365760000148
Figure BDA0003434365760000149
的夹角,具体参见图5,τ为权重系数,τ∈[0,1],ωik越小,编号为i的无人机越容易攻击编号为k的敌方无人机,所以编号为i的无人机尽可能减小ωik来获得较优的gik
其攻击策略为
Figure BDA00034343657600001410
Figure BDA00034343657600001411
且mk<mmax时,编号为i的无人机加入对编号为k的敌方无人机的攻击组中,编号为i的无人机被分配攻击目标(编号为k的敌方无人机)后,进入攻击模式,不再坚持无人机蜂群的聚集行为、分散行为和编队行为,其中K表示编号为i的无人机可以感知到的敌方无人机数量,mmax表示最大协同数量(即最多允许mmax个无人机同时攻击一个敌机)。
(2)存在敌方HVT时,无人机需要在攻击敌方HVT和攻击敌方无人机之间做出最佳选择,因此,对于编号为i的无人机:
其目标期望函数为:
Figure BDA00034343657600001412
其中mk表示攻击编号为k的敌方无人机的协同友机数量,αmax是无人机的最大转向角,
Figure BDA00034343657600001413
表示编号为i的无人机与编号为k的敌方无人机之间的距离,可以通过编号为i的无人机上的传感器探测得到,
Figure BDA00034343657600001414
为编号为i的无人机的速度大小,
Figure BDA00034343657600001415
为编号为i的无人机指向编号为k的敌方无人机的向量,
Figure BDA00034343657600001416
为编号为i的无人机的速度向量,ωik表示
Figure BDA00034343657600001417
Figure BDA00034343657600001418
之间的夹角,ρik
Figure BDA00034343657600001419
Figure BDA00034343657600001420
的夹角,具体参见图5,f为权重因子,表示首要目标(破坏敌方HVT)与其他目标(攻击敌方无人机)的偏好程度,f越大,越倾向于攻击敌方HVT,当f→0时,越倾向于与敌机缠斗,τ为权重系数,τ∈[0,1];
其攻击策略为:
Figure BDA0003434365760000151
Figure BDA0003434365760000152
Figure BDA0003434365760000153
时,则编号为i的无人机攻击敌方无人机,否则攻击敌方HVT,其中K表示编号为i的无人机可以感知到的敌方无人机数量,
Figure BDA0003434365760000154
表示编号为i的无人机与敌方HVT的距离;编号为i的无人机攻击敌方无人机时,存在一种极端情况,即如果mk=mmax
Figure BDA0003434365760000155
Figure BDA0003434365760000156
则编号为i的无人机不再攻击编号为k的敌方无人机,换成编号为l的友机攻击编号为k的敌方无人机,即当mk达到最大数量时,在两个友机之间进行取舍,选择最适合(处于最佳攻击角度和距离)的己方无人机去攻击敌方无人机,
Figure BDA0003434365760000157
表示编号为l的无人机与编号为k的敌方无人机之间的距离,
Figure BDA0003434365760000158
为编号为l的无人机的速度大小,
Figure BDA0003434365760000159
为编号为l的无人机指向编号为k的敌方无人机的向量,
Figure BDA00034343657600001510
为编号为l的无人机的速度向量,ωlk表示
Figure BDA00034343657600001511
Figure BDA00034343657600001512
之间的夹角,ρlk
Figure BDA00034343657600001513
Figure BDA00034343657600001514
的夹角。
(3)
Figure BDA00034343657600001515
Figure BDA00034343657600001516
时,编号为i的无人机对编号为k的敌方无人机的杀伤率
Figure BDA00034343657600001517
其中γ表示距离因子,
Figure BDA00034343657600001518
γ∈[0,1],w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标(编号为k的敌方无人机)的概率,λ为另一权重系数,λ∈[0,1],ρik
Figure BDA00034343657600001519
Figure BDA00034343657600001520
的夹角(参见图5),ρik越小,杀伤率越大;否则,编号为i的无人机对编号为k的敌方无人机的杀伤率为0。
(4)编号为i的无人机对敌方HVT的杀伤率
Figure BDA00034343657600001521
Figure BDA00034343657600001522
其中,
Figure BDA00034343657600001523
为编号为i的无人机与敌方HVT的距离,Ae表示攻击目标敌方HVT暴露给编号为i的无人机的攻击面积,
Figure BDA00034343657600001524
表示攻击目标敌方HVT可暴露的最大面积,w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标(敌方HVT)的概率,λ为另一权重系数,λ∈[0,1]。
在本实施例中优选的是,步骤4中利用粒子群优化算法(PSO,Particle swarmoptimization)求出每架无人机的最优策略集合,即针对无人机蜂群中的每一架无人机均执行PSO算法以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),如图6所示,具体包括:
步骤411:初始化无人机蜂群,包括初始化所述己方无人机蜂群的无人机总数n、该无人机的速度Vi、位置坐标
Figure BDA0003434365760000161
以及最优位置坐标
Figure BDA0003434365760000162
步骤412:初始化该无人机的全局最优位置坐标
Figure BDA0003434365760000163
步骤413:更新该无人机的速度Vi及位置坐标
Figure BDA0003434365760000164
步骤414:计算该无人机的适应度
Figure BDA0003434365760000165
步骤415:更新该无人机的历史最优位置;
步骤416:存储历史最优位置及其对应的速度;
步骤417:更新全局最优位置gbest
步骤418:达到最大迭代次数则终止迭代,否则转到步骤413;
步骤419:返回该无人机的最优策略集合
Figure BDA0003434365760000166
(包含t1个最优策略),结束算法。
步骤413中,对于编号为i的无人机,其速度更新规则为:
Figure BDA0003434365760000167
Figure BDA0003434365760000168
其中c1和c2是学习因子,通常c1=c2=2,也可以根据需要取其他的值,r是介于[0,1]之间的随机数,ε(0≤ε≤1)是惯性因子,ε越大,全局寻优能力越强,局部寻优能力越弱;其位置更新规则为:
Figure BDA0003434365760000169
其中Vi表示编号为i的无人机的速度。
步骤414中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA00034343657600001610
存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA00034343657600001611
其中K为当前时刻临近编号为i的无人机的敌机数量。当不存在敌方HVT时,编号为i的无人机通过调节自身速度
Figure BDA00034343657600001612
和与敌机的夹角ωik,使得与敌机的距离
Figure BDA00034343657600001613
减小,提高对敌机的杀伤率,同时使得mk大小合适,以保证每架敌机都被同时攻击,避免所有友机都同时攻击同一架敌机而有遗漏的敌机突破己方防线;当存在敌方HVT时,通过设置合适的f值,使得无人机在优先攻击敌方HVT还是敌机间进行调节,f越大,越倾向于攻击敌方的HVT,适应度越大,无人机越处于有利的状态。
基于PSO算法求解最优策略集的伪代码可以参考如下:
Figure BDA0003434365760000171
在本实施例中优选的是,步骤4中返回的最优策略集合通过博弈模型进行进一步挑选,从而选出无人机的最佳响应策略,即获得协同攻击数量、偏转角、飞行速度等的最佳值,进而指导无人机的具体行动。
鉴于敌方无人机的相关信息对我方是不完全已知的,因此步骤5中建立基于非完全信息的动态博弈模型,所述动态博弈模型包括合作博弈模型、对抗博弈模型和混合关系博弈模型中的至少一种。根据实际需要选择其中的一种模型进行使用。
(1)合作博弈模型:
仅考虑友机之间的合作博弈。对于编号为i的无人机,博弈方为编号为i的无人机和其临近的(即编号为i的无人机的探测范围内的)友机,策略集S为步骤4中确定的最优策略集合
Figure BDA0003434365760000181
收益
Figure BDA0003434365760000182
为步骤4中确定的适应度函数
Figure BDA0003434365760000183
所述合作博弈模型表示为
Figure BDA0003434365760000184
其中P+表示合作博弈的参与者,
Figure BDA0003434365760000185
Figure BDA0003434365760000186
表示编号为i的无人机的临近的友机集合,收益函数
Figure BDA0003434365760000187
表示编号为i的无人机在执行策略
Figure BDA0003434365760000188
时的收益,
Figure BDA0003434365760000189
其中,
Figure BDA00034343657600001810
是编号为i的无人机的最优博弈策略,
Figure BDA00034343657600001811
表示编号为i的无人机的临近友机采取的策略。
(2)对抗博弈模型:
不考虑与友机的合作博弈,只考虑与敌机之间的纯对抗博弈场景。对于编号为i的无人机,所述对抗博弈模型的博弈方为编号为i的无人机和其临近的敌机,策略集S为步骤4中确定的最优策略集合
Figure BDA00034343657600001812
收益函数
Figure BDA00034343657600001813
为步骤4中确定的适应度函数
Figure BDA00034343657600001814
所述对抗博弈模型表示为
Figure BDA00034343657600001815
其中P-表示对抗博弈的参与者,
Figure BDA00034343657600001816
表示编号为i的无人机的临近的敌机集合,收益函数
Figure BDA00034343657600001817
表示编号为i的无人机在执行策略
Figure BDA00034343657600001818
时的收益,
Figure BDA00034343657600001819
Figure BDA00034343657600001820
其中
Figure BDA00034343657600001821
是编号为i的无人机的最优博弈策略,
Figure BDA00034343657600001822
表示编号为i的无人机的临近敌机采取的策略。
(3)混合关系博弈模型:
同时存在友机间合作、敌机间对抗的混合关系博弈场景。对于编号为i的无人机,所述混合关系博弈模型的博弈方为编号为i的无人机和其临近的所有无人机,策略集S为步骤4中确定的最优策略集合
Figure BDA00034343657600001823
收益
Figure BDA00034343657600001824
为步骤4中确定的适应度函数
Figure BDA00034343657600001825
所述合作博弈模型表示为
Figure BDA00034343657600001826
其中P表示混合关系博弈的参与者,P={i∪Γi},Γi表示临近的无人机集合,即
Figure BDA00034343657600001827
表示编号为i的无人机的临近的友机集合,
Figure BDA00034343657600001828
表示编号为i的无人机的临近的敌机集合,收益函数
Figure BDA0003434365760000191
表示编号为i的无人机在执行策略
Figure BDA0003434365760000192
时的收益,
Figure BDA0003434365760000193
其中,
Figure BDA0003434365760000194
是编号为i的无人机的最优博弈策略,
Figure BDA0003434365760000195
表示编号为i的无人机临近的所有无人机采取的策略。
在本实施例中优选的是,步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定UAV的最佳响应策略包括:设置最佳响应策略的计算方式、求解最佳响应策略。
(1)对于所述合作博弈模型:
基于临近友机总适应度最大的博弈策略来求取编号为i的无人机的最佳响应,编号为i的无人机在当前时刻t的最佳响应为:
Figure BDA0003434365760000196
编号为i的无人机求得自己的最佳响应,使得临近友机总适应度最大,即
Figure BDA0003434365760000197
表示编号为j的无人机属于集合
Figure BDA0003434365760000198
(2)对于所述对抗博弈模型:
基于临近敌机总适应度最小的博弈策略来求取取编号为i的无人机的最佳响应,取编号为i的无人机在当前时刻t的最佳响应为:
Figure BDA0003434365760000199
取编号为i的无人机求得自己的最佳响应,使得临近敌机的总适应度最小,即
Figure BDA00034343657600001910
表示编号为k的无人机属于集合
Figure BDA00034343657600001911
(3)对于所述混合关系博弈模型:
综合考虑友机和敌机的收益,基于合作博弈与非合作博弈收益之差最大化来求取编号为i的无人机在当前时刻t的最佳响应:
Figure BDA00034343657600001912
编号为i的无人机求得自己在当前时刻t的最佳响应,使得临近友机总适应度减去临近敌机总适应度的差最大,即
Figure BDA00034343657600001913
表示编号为j的无人机属于集合
Figure BDA00034343657600001914
Figure BDA00034343657600001915
表示编号为k的无人机属于集合
Figure BDA00034343657600001916
通过无人机的动态博弈,计算无人机的所述最佳响应
Figure BDA00034343657600001917
获取
Figure BDA00034343657600001918
从而得到编号为i的无人机的最佳行动参数,包括:协同攻击数量mk、偏转角(即与敌机的夹角ωik)和飞行速度大小
Figure BDA00034343657600001919
具体流程如图7所示,最终使得己方无人机蜂群的整体作战效能达到最优。
实施例2
与实施例1所不同的是,如图8所示,在本实施例中优选的是,步骤4中,利用遗传算法(GA,Genetic Algorithm)求出每架无人机的最优策略集合,即针对无人机蜂群中的每一架无人机均执行GA以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),具体包括:
步骤421:获取战场态势信息;
步骤422:生成初始化种群;
步骤423:计算适应度;
步骤424:依据适应度,采用轮盘赌规则选择双亲;
步骤425:双亲通过交叉和变异生成后代;
步骤426:计算后代的适应度;
步骤427:用后代替换适应度低的个体,形成新种群;
步骤428:演化的次数超过预先设定的次数或适应度连续几次提升的不明显,则终止迭代,否则转到步骤424;
步骤429:返回最后一代中适应度最大的个体即最优策略集
Figure BDA0003434365760000201
(包含t个最优策略),结束算法。
步骤421:获取战场态势信息包括获取临近的敌机的位置,求出与临近的敌机的距离
Figure BDA0003434365760000202
步骤422:生成初始化种群包括在参数ωik
Figure BDA0003434365760000203
的约束范围内,随机生成两个参数的值,生成初始化种群,种群内的个体数量为N,每个染色体是一个策略集。
需优化的参数包括:夹角ωik和飞行速度大小
Figure BDA0003434365760000204
在本实施例中优选的是,每个染色体的编码长度为12位,其中角度参数ωik占八位,速度大小
Figure BDA0003434365760000205
占四位。速度大小
Figure BDA0003434365760000206
用二进制表示为0000至1111,十进制为0-15,即将无人机的速度大小
Figure BDA0003434365760000207
设置为16档;偏转角ωik用二进制表示为00000000至11111111,十进制为0-255,将360度切分为256个级别,每次转动的角度为
Figure BDA0003434365760000208
如果需要更精确地优化上述两个参数,可以相应改变其二进制编码长度。
步骤423和步骤426中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000209
其中K为当前时刻临近编号为i的无人机的敌机数量;存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000211
其中K为当前时刻临近编号为i的无人机的敌机数量。
实施例3
与实施例1所不同的是,如图9所示,在本实施例中优选的是,步骤4中,利用差分进化(DE,Differential Evolution)算法求出每架无人机的最优策略集合,即针对无人机蜂群中的每一架无人机均执行DE算法以获取每一架无人机自身的最优策略集合,针对编号为i的无人机(i=1、2、3、…、n,n为己方无人机蜂群的无人机总数),如图9所示,具体包括:
步骤431:初始化,包括初始化种群规模、个体维度、最大迭代次数;
步骤432:计算每个个体的适应度
Figure BDA00034343657600002110
步骤433:变异操作;
步骤434:交叉操作;
步骤435:选择操作;
步骤436:迭代次数达到最大迭代次数后终止迭代,否则迭代次数加一后,转到步骤432;
步骤437:种群中个体按照适应度降序排序;
步骤438:返回最优策略集
Figure BDA0003434365760000212
(包含t1个最优策略),结束算法。
上述任一方案优选的是,步骤432中,不存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000213
其中K为当前时刻临近编号为i的无人机的敌机数量;存在敌方HVT时,对于编号为i的无人机,其适应度函数为
Figure BDA0003434365760000214
其中K为当前时刻临近编号为i的无人机的敌机数量。
基于DE算法求解最优策略集的伪代码可以参考如下:
//N种群规模,即共有N个策略
//D每个个体的维度,不存在敌方HVT时,D=2,适应度函数中的每个变量占一个维度,共有ωik
Figure BDA0003434365760000215
两个变量,变量确定则适应度
Figure BDA0003434365760000216
的值确定;存在敌方HVT时,D=2,适应度函数中的每个变量占一个维度,共有ωih
Figure BDA0003434365760000217
两个变量,变量确定则适应度
Figure BDA0003434365760000218
的值确定,ωih为编号为i的无人机的
Figure BDA0003434365760000219
与编号为i的无人机指向HVT的向量的夹角。
Figure BDA0003434365760000221
实施例4
一种无人机蜂群协同对抗决策系统,所述系统包括无人机蜂群,所述无人机蜂群采用所述无人机蜂群协同对抗决策方法确定其最佳响应策略。
实施例5
根据所述无人机蜂群协同对抗决策方法,无人机蜂群协同对抗过程中作战状态会产生转移,作战状态转移包括一对一作战状态转移以及多对多作战状态转移。
为描述方便,将对抗的双方分别以红方和蓝方进行代替,其中红方具有HVT。
图10所示为一对一作战状态转移示意图,其中0表示初始状态,B表示蓝方最终获胜,R表示红方最终获胜,B>R表示蓝方占优,R>B表示红方占优,HVT-R表示蓝方摧毁红方HVT后获胜。弧线上为从一个状态到另一个状态的转移概率,如:p0,B表示从状态0到状态B>R的转移概率。
图11所述为多对多作战状态转移示意图,其中,50/50表示初始时红蓝双方各50架无人机,50/49表示蓝方50架无人机,红方49架无人机,
Figure BDA0003434365760000231
表示蓝方击落红方一架无人机的概率,其他以此类推。HVT-R表示蓝方摧毁红方HVT后获胜。
需要说明的是,以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管前述实施例对本发明进行了详细的说明,本领域的技术人员应该理解:其可以对前述实施例记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换,而这些替换,并不使相应技术方案的本质脱离本发明技术方案的范围。

Claims (9)

1.一种无人机蜂群协同对抗决策方法,其特征在于:包括:
步骤1:建立包含地面高价值目标的三维战场环境;
步骤2:建立无人机的运动模型;
步骤3:建立无人机的攻击模型;
步骤4:求出每架无人机的最优策略集合;
步骤5:建立动态博弈模型;
步骤6:在所述最优策略集集合中,根据所述动态博弈模型确定无人机的最佳响应策略。
2.如权利要求1所述的无人机蜂群协同对抗决策方法,其特征在于:步骤3:建立无人机的攻击模型包括:设定无人机的友机协同目标分配策略;
不存在敌方HVT时:对于编号为i的无人机,其目标期望函数为
Figure FDA0003434365750000011
其中mk表示攻击编号为k的敌方无人机的协同友机数量,αmax是无人机的最大转向角,
Figure FDA0003434365750000012
表示编号为i的无人机与编号为k的敌方无人机之间的距离,
Figure FDA0003434365750000013
为编号为i的无人机的速度大小,ωik表示
Figure FDA0003434365750000014
Figure FDA0003434365750000015
之间的夹角,τ为权重系数,τ∈[0,1],ρik
Figure FDA0003434365750000016
Figure FDA0003434365750000017
的夹角,
Figure FDA0003434365750000018
为编号为i的无人机的速度向量,
Figure FDA0003434365750000019
为编号为k的敌方无人机的速度向量,
Figure FDA00034343657500000110
为编号为i的无人机指向编号为k的敌方无人机的向量;编号为i的无人机的攻击策略为
Figure FDA00034343657500000111
Figure FDA00034343657500000112
且mk<mmax时,编号为i的无人机加入对编号为k的敌方无人机的攻击组中,编号为i的无人机进入攻击模式,不再坚持无人机蜂群的聚集行为、分散行为和编队行为,其中K表示编号为i的无人机可以感知到的敌方无人机数量,mmax表示最大协同友机数量;
存在敌方HVT时:对于编号为i的无人机,其目标期望函数为
Figure FDA00034343657500000113
Figure FDA00034343657500000114
其中mk表示攻击编号为k的敌方无人机的协同友机数量,αmax是无人机的最大转向角,
Figure FDA00034343657500000115
表示编号为i的无人机与编号为k的敌方无人机之间的距离,
Figure FDA00034343657500000116
为编号为i的无人机的速度大小,ωik表示
Figure FDA00034343657500000117
Figure FDA00034343657500000118
之间的夹角,f为权重因子,表示首要目标即破坏敌方HVT与其他目标即击落敌方无人机的偏好程度,f越大,越倾向于攻击敌方HVT,当f→0时,越倾向于与敌机缠斗,τ为权重系数,τ∈[0,1],ρik
Figure FDA00034343657500000119
Figure FDA00034343657500000120
的夹角,
Figure FDA00034343657500000121
为编号为i的无人机的速度向量,
Figure FDA00034343657500000122
为编号为k的敌方无人机的速度向量,
Figure FDA00034343657500000123
为编号为i 的无人机指向编号为k的敌方无人机的向量;编号为i的无人机的攻击策略为
Figure FDA0003434365750000021
Figure FDA0003434365750000022
Figure FDA0003434365750000023
时,则编号为i的无人机与敌机缠斗,否则攻击敌方HVT,其中K表示编号为i的无人机可以感知到的敌方无人机数量,
Figure FDA0003434365750000024
表示编号为i的无人机与敌方HVT的距离;如果mk=mmax
Figure FDA0003434365750000025
Figure FDA0003434365750000026
则编号为i的无人机不再攻击编号为k的敌方无人机,换成编号为l的友机攻击编号为k的敌方无人机,
Figure FDA0003434365750000027
表示编号为l的无人机与编号为k的敌方无人机之间的距离,
Figure FDA0003434365750000028
为编号为l的无人机的速度大小,ωlk表示
Figure FDA0003434365750000029
Figure FDA00034343657500000210
之间的夹角,ρlk
Figure FDA00034343657500000211
Figure FDA00034343657500000212
的夹角,
Figure FDA00034343657500000213
表示编号为l的无人机的速度向量,
Figure FDA00034343657500000214
表示编号为l的无人机指向编号为k的敌方无人机的向量。
3.如权利要求2所述的无人机蜂群协同对抗决策方法,其特征在于:步骤3:建立无人机的攻击模型还包括:设定无人机的杀伤率;
编号为i的无人机对编号为k的敌方无人机的杀伤率
Figure FDA00034343657500000215
Figure FDA00034343657500000216
其中γ表示距离因子,
Figure FDA00034343657500000217
γ∈[0,1],w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标即编号为k的敌方无人机的概率,λ为另一权重系数,λ∈[0,1],ρik
Figure FDA00034343657500000218
Figure FDA00034343657500000219
的夹角;
编号为i的无人机对敌方HVT的杀伤率
Figure FDA00034343657500000220
Figure FDA00034343657500000221
其中,
Figure FDA00034343657500000222
为编号为i的无人机与敌方HVT的距离,Ae表示攻击目标敌方HVT暴露给编号为i的无人机的攻击面积,
Figure FDA00034343657500000223
表示攻击目标敌方HVT可暴露的最大面积,w为编号为i的无人机携带的武器的最大攻击范围,δ表示编号为i的无人机击中攻击目标即敌方HVT的概率,λ为另一权重系数,λ∈[0,1]。
4.如权利要求3所述的无人机蜂群协同对抗决策方法,其特征在于:步骤4:求出每架无人机的最优策略集合为利用PSO算法求出每架无人机的最优策略集合,即针对无人机蜂群中的每一架无人机均执行PSO算法以获取每一架无人机自身的最优策略集合,针对编号为i的无人机,i=1、2、3、…、n,n为己方无人机蜂群的无人机总数,具体包括:
步骤411:初始化无人机蜂群,包括初始化所述己方无人机蜂群的无人机总数n、该无人机的速度Vi、位置坐标
Figure FDA0003434365750000031
以及最优位置坐标
Figure FDA0003434365750000032
步骤412:初始化该无人机的全局最优位置坐标
Figure FDA0003434365750000033
步骤413:更新该无人机的速度Vi及位置坐标
Figure FDA0003434365750000034
步骤414:计算该无人机的适应度
Figure FDA0003434365750000035
步骤415:更新该无人机的历史最优位置;
步骤416:存储历史最优位置及其对应的速度;
步骤417:更新全局最优位置gbest
步骤418:达到最大迭代次数则终止迭代,否则转到步骤413;
步骤419:返回该无人机的最优策略集合
Figure FDA0003434365750000036
结束算法。
5.如权利要求4所述的无人机蜂群协同对抗决策方法,其特征在于:步骤413中,对于编号为i的无人机,其速度更新规则为:
Figure FDA0003434365750000037
Figure FDA0003434365750000038
其中c1和c2是学习因子,r是介于[0,1]之间的随机数,ε是惯性因子,取值介于[0,1],ε越大,全局寻优能力越强,局部寻优能力越弱;其位置坐标更新规则为:
Figure FDA0003434365750000039
其中Vi表示编号为i的无人机的速度。
6.如权利要求5所述的无人机蜂群协同对抗决策方法,其特征在于:步骤414中,对于编号为i的无人机,不存在敌方HVT时,其适应度函数为
Figure FDA00034343657500000310
存在敌方HVT时,其适应度函数为
Figure FDA00034343657500000311
其中K为当前时刻临近编号为i的无人机的敌机数量。
7.如权利要求6所述的无人机蜂群协同对抗决策方法,其特征在于:步骤5中建立动态博弈模型为建立基于非完全信息的动态博弈模型,所述动态博弈模型包括合作博弈模型、对抗博弈模型和混合关系博弈模型中的至少一种;
对于编号为i的无人机,所述合作博弈模型的博弈方为编号为i的无人机和其临近的友机,策略集S为步骤4中确定的最优策略集合
Figure FDA00034343657500000312
收益
Figure FDA00034343657500000313
为步骤4中确定的适应度函数
Figure FDA00034343657500000314
所述合作博弈模型表示为
Figure FDA00034343657500000315
其中P+表示合作博弈的参与者,
Figure FDA00034343657500000316
Figure FDA00034343657500000317
表示编号为i的无人机的临近的友机集合,收益函数
Figure FDA0003434365750000041
表示编号为i的无人机在执行策略
Figure FDA0003434365750000042
时的收益,
Figure FDA0003434365750000043
其中,
Figure FDA0003434365750000044
是编号为i的无人机的最优博弈策略,
Figure FDA0003434365750000045
表示编号为i的无人机的临近友机采取的策略;
对于编号为i的无人机,所述对抗博弈模型的博弈方为编号为i的无人机和其临近的敌机,策略集S为步骤4中确定的最优策略集合
Figure FDA0003434365750000046
收益函数
Figure FDA0003434365750000047
为步骤4中确定的适应度函数
Figure FDA0003434365750000048
所述对抗博弈模型表示为
Figure FDA0003434365750000049
其中P-表示对抗博弈的参与者,
Figure FDA00034343657500000410
Figure FDA00034343657500000411
表示编号为i的无人机的临近的敌机集合,收益函数
Figure FDA00034343657500000412
表示编号为i的无人机在执行策略
Figure FDA00034343657500000413
时的收益,
Figure FDA00034343657500000414
其中
Figure FDA00034343657500000415
是编号为i的无人机的最优博弈策略,
Figure FDA00034343657500000416
表示编号为i的无人机的临近敌机采取的策略;
对于编号为i的无人机,所述混合关系博弈模型的博弈方为编号为i的无人机和其临近的所有无人机,策略集S为步骤4中确定的最优策略集合
Figure FDA00034343657500000417
收益
Figure FDA00034343657500000418
为步骤4中确定的适应度函数
Figure FDA00034343657500000419
所述合作博弈模型表示为
Figure FDA00034343657500000420
其中P表示混合关系博弈的参与者,P={i∪Γi},Γi表示临近的无人机集合,即
Figure FDA00034343657500000421
Figure FDA00034343657500000422
表示编号为i的无人机的临近的友机集合,
Figure FDA00034343657500000423
表示编号为i的无人机的临近的敌机集合,收益函数
Figure FDA00034343657500000424
表示编号为i的无人机在执行策略
Figure FDA00034343657500000425
时的收益,
Figure FDA00034343657500000426
其中,
Figure FDA00034343657500000427
是编号为i的无人机的最优博弈策略,
Figure FDA00034343657500000428
表示编号为i的无人机临近的所有无人机采取的策略。
8.如权利要求7所述的无人机蜂群协同对抗决策方法,其特征在于:步骤6中,对于所述合作博弈模型,基于临近友机总适应度最大的博弈策略来求取编号为i的无人机的最佳响应,编号为i的无人机在当前时刻t的最佳响应为:
Figure FDA00034343657500000429
编号为i的无人机求得自己的最佳响应,使得临近友机总适应度最大,即
Figure FDA00034343657500000430
表示编号为j的无人机属于集合
Figure FDA00034343657500000431
对于所述对抗博弈模型,基于临近敌机总适应度最小的博弈策略来求取编号为i的无人机的最佳响应,取编号为i的无人机在当前时刻t的最佳响应为:
Figure FDA00034343657500000432
取编号为i的无人机求得自己的最佳响应,使得临近敌机的总适应度最小,即
Figure FDA00034343657500000433
表示编号为k的无人机属于集合
Figure FDA00034343657500000434
对于所述混合关系博弈模型,综合考虑友机和敌机的收益,基于合作博弈与非合作博弈收益之差最大化来求取编号为i的无人机在当前时刻t的最佳响应:
Figure FDA0003434365750000051
编号为i的无人机求得自己在当前时刻t的最佳响应,使得临近友机总适应度减去临近敌机总适应度的差最大,即
Figure FDA0003434365750000052
表示编号为j的无人机属于集合
Figure FDA0003434365750000053
Figure FDA0003434365750000054
表示编号为k的无人机属于集合
Figure FDA0003434365750000055
根据所述最佳响应
Figure FDA0003434365750000056
获取
Figure FDA0003434365750000057
从而得到编号为i的无人机的最佳行动参数,包括:协同攻击数量、偏转角和飞行速度。
9.一种无人机蜂群协同对抗决策系统,所述系统包括无人机蜂群,其特征在于:所述无人机蜂群采用如权利要求1-8任一项所述的无人机蜂群协同对抗决策方法确定其最佳响应策略。
CN202111607271.XA 2021-12-27 2021-12-27 一种无人机蜂群协同对抗决策方法及系统 Active CN114167899B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111607271.XA CN114167899B (zh) 2021-12-27 2021-12-27 一种无人机蜂群协同对抗决策方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111607271.XA CN114167899B (zh) 2021-12-27 2021-12-27 一种无人机蜂群协同对抗决策方法及系统

Publications (2)

Publication Number Publication Date
CN114167899A true CN114167899A (zh) 2022-03-11
CN114167899B CN114167899B (zh) 2023-05-26

Family

ID=80488399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111607271.XA Active CN114167899B (zh) 2021-12-27 2021-12-27 一种无人机蜂群协同对抗决策方法及系统

Country Status (1)

Country Link
CN (1) CN114167899B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313972A (zh) * 2023-09-28 2023-12-29 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011149558A2 (en) * 2010-05-28 2011-12-01 Abelow Daniel H Reality alternate
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
CN110826192A (zh) * 2019-10-15 2020-02-21 南京航空航天大学 一种基于纳什谈判准则的人-车合作型博弈控制方法
WO2020106169A2 (pt) * 2018-11-25 2020-05-28 Sanchez Paulo Conjunto integrado de produtos para a movimentação de itens
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN112180967A (zh) * 2020-04-26 2021-01-05 北京理工大学 基于评判-执行架构的多无人机协同对抗决策方法
CN112307613A (zh) * 2020-10-26 2021-02-02 沈阳航空航天大学 基于自适应权重的无人机集群空-地对抗博弈仿真方法
CN112817330A (zh) * 2021-01-05 2021-05-18 北京联合大学 一种多无人机四维航迹协同规划方法及系统
CN112947581A (zh) * 2021-03-25 2021-06-11 西北工业大学 基于多智能体强化学习的多无人机协同空战机动决策方法
CN113052289A (zh) * 2021-03-16 2021-06-29 东南大学 一种基于博弈论的无人艇集群打击位置的选取方法
CN113282061A (zh) * 2021-04-25 2021-08-20 南京大学 一种基于课程学习的无人机空中博弈对抗的解决方法
CN115061495A (zh) * 2022-06-30 2022-09-16 北京航空航天大学 一种基于鹰鸽博弈的无人机群组对抗自主控制方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011149558A2 (en) * 2010-05-28 2011-12-01 Abelow Daniel H Reality alternate
WO2020106169A2 (pt) * 2018-11-25 2020-05-28 Sanchez Paulo Conjunto integrado de produtos para a movimentação de itens
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
CN110826192A (zh) * 2019-10-15 2020-02-21 南京航空航天大学 一种基于纳什谈判准则的人-车合作型博弈控制方法
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN112180967A (zh) * 2020-04-26 2021-01-05 北京理工大学 基于评判-执行架构的多无人机协同对抗决策方法
CN112307613A (zh) * 2020-10-26 2021-02-02 沈阳航空航天大学 基于自适应权重的无人机集群空-地对抗博弈仿真方法
CN112817330A (zh) * 2021-01-05 2021-05-18 北京联合大学 一种多无人机四维航迹协同规划方法及系统
CN113052289A (zh) * 2021-03-16 2021-06-29 东南大学 一种基于博弈论的无人艇集群打击位置的选取方法
CN112947581A (zh) * 2021-03-25 2021-06-11 西北工业大学 基于多智能体强化学习的多无人机协同空战机动决策方法
CN113282061A (zh) * 2021-04-25 2021-08-20 南京大学 一种基于课程学习的无人机空中博弈对抗的解决方法
CN115061495A (zh) * 2022-06-30 2022-09-16 北京航空航天大学 一种基于鹰鸽博弈的无人机群组对抗自主控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEI XIANG: "Research on UAV Swarm Confrontation Task Based on MADDPG Algorithm", IEEE *
卿利: "无人机蜂群网络非合作博弈的功率控制", 电讯技术 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313972A (zh) * 2023-09-28 2023-12-29 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质
CN117313972B (zh) * 2023-09-28 2024-04-12 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN114167899B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN108680063B (zh) 一种针对大规模无人机集群动态对抗的决策方法
CN112783209B (zh) 一种基于鸽群智能竞争学习的无人机集群对抗控制方法
CN112269396B (zh) 一种仿鹰鸽智能博弈的无人机集群协同对抗控制方法
CN105892480B (zh) 异构多无人机系统协同察打任务自组织方法
CN113741508B (zh) 基于改进狼群算法的无人机任务分配方法
CN114460959A (zh) 一种基于多体博弈的无人机群协同自主决策方法及装置
CN111240353A (zh) 基于遗传模糊树的无人机协同空战决策方法
CN109460056A (zh) 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN109709981B (zh) 一种无人机群竞技对抗方法
CN112284188A (zh) 一种基于自适应步长离散狼群算法的无人机攻防决策方法
Yu et al. Hawk and pigeon’s intelligence for UAV swarm dynamic combat game via competitive learning pigeon-inspired optimization
Yan et al. Multi-UAV objective assignment using Hungarian fusion genetic algorithm
CN113324545A (zh) 一种基于混合增强智能的多无人机协同任务规划方法
CN116225049A (zh) 一种多无人机狼群协同作战攻防决策算法
CN114167899A (zh) 一种无人机蜂群协同对抗决策方法及系统
CN111773722A (zh) 一种模拟环境中的战斗机规避机动策略集生成方法
Li et al. Multi-uav air combat weapon-target assignment based on genetic algorithm and deep learning
Liu et al. Comparing heuristic search methods for finding effective group behaviors in RTS game
CN112494949B (zh) 智能体行动策略制定方法、服务器及存储介质
CN117291254A (zh) 基于模仿学习和安全强化学习的智能体任务分配训练方法
Ruan et al. Multiplayer reach–avoid differential games in 3D space inspired by Harris’ Hawks’ cooperative hunting tactics
Avery et al. Evolving coordinated spatial tactics for autonomous entities using influence maps
CN116661496A (zh) 一种基于智能算法的多巡飞弹协同航迹规划方法
Song et al. Multi-uav cooperative multi-target allocation method based on differential evolutionary algorithm
CN113962013B (zh) 飞行器对抗决策方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant