CN115328189A - 多无人机协同博弈决策方法和系统 - Google Patents

多无人机协同博弈决策方法和系统 Download PDF

Info

Publication number
CN115328189A
CN115328189A CN202210782058.0A CN202210782058A CN115328189A CN 115328189 A CN115328189 A CN 115328189A CN 202210782058 A CN202210782058 A CN 202210782058A CN 115328189 A CN115328189 A CN 115328189A
Authority
CN
China
Prior art keywords
strategy
initial
game
neighbor
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210782058.0A
Other languages
English (en)
Other versions
CN115328189B (zh
Inventor
罗贺
王浩丞
王国强
马滢滢
胡笑旋
蒋儒浩
陈宇轩
王菲菲
台建玮
马华伟
夏维
唐奕城
靳鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210782058.0A priority Critical patent/CN115328189B/zh
Publication of CN115328189A publication Critical patent/CN115328189A/zh
Application granted granted Critical
Publication of CN115328189B publication Critical patent/CN115328189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种多无人机协同博弈决策方法和系统。通过生成多无人机的零和矩阵博弈模型,包括博弈双方信息、博弈策略集合和收益矩阵;博弈策略集合包括攻击方编队的第一策略集合和防御方编队的第二策略集合。基于第一策略集合和第二策略集合获取严格博弈矩阵,并根据严格博弈矩阵获取初始混合策略纳什均衡。通过确定使攻击方编队和防御方编队的收益值最大的策略,获取到目标混合策略纳什均衡,从而获取最佳第一策略,并控制攻击方编队执行最佳第一策略。通过零和矩阵博弈模型获取混合策略纳什均衡,并利用收益矩阵确定出最佳策略,从而提高了获取多无人机的博弈决策的效率。

Description

多无人机协同博弈决策方法和系统
技术领域
本发明涉及安保技术领域,具体涉及一种多无人机协同博弈决策方法和系统。
背景技术
无人机能够在多种环境下自主的完成给定任务,有效降低人力成本。相较于有人机,无人机具有无人员伤亡、机动性强、重量较轻、成本较低等特点,已经成为现代空战武器装备的重要成员之一。由于单个无人机所携带武器和传感器数量及性能有限,其执行空战任务的能力受到相应的限制,而多个无人机进行有效协同可以更好的完成空战任务,因此,多无人机组成编队协同执行任务已受到了越来越多的关注,如何对无人机编队设置协同作战的博弈决策是当前一大难题。
在对无人机编队设置协同作战的博弈决策时,一般需要为每个无人机分配所要对抗的目标。现有技术中,通过构建零和矩阵博弈模型,并对零和矩阵博弈模型进行求解,从而确定出最优解,并作为决策结果。主流的求解算法有Lemke-Howson(LH)算法、混合整数规划(MIP)算法和Double Oracle(DO)算法。
然而,本申请的发明人发现现有技术在求解过程中,现有的算法不适用对较大规模的博弈矩阵进行求解,需要消耗大量的时间,导致效率较低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种多无人机协同博弈决策方法和系统,解决了现有技术获取多无人机的博弈决策时效率较低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明解决其技术问题所提供的一种多无人机协同博弈决策方法,所述博弈决策方法由计算机执行,包括以下步骤:
生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
优选的,所述攻击方编队的信息包括无人机信息;所述防御方编队的信息包括防御目标信息和拦截导弹信息;
所述收益矩阵包括:
Figure BDA0003728798060000031
其中,
Figure BDA0003728798060000032
为攻击方编队在策略对
Figure BDA0003728798060000033
下的收益值;
Figure BDA0003728798060000034
为第一策略集合中的第t个策略,
Figure BDA0003728798060000035
为第二策略集合中的第l个策略;T为攻击方编队,L为防御方编队;ST为第一策略集合,SL为第二策略集合;
Figure BDA0003728798060000036
其中,
Figure BDA0003728798060000037
表示拦截导弹n对无人机m的拦截概率、Pmk表示无人机m对防御目标k的毁伤概率、vk表示防御目标k的价值;
Figure BDA0003728798060000038
表示无人机m未被拦截的概率;
Figure BDA0003728798060000039
表示无人机m对防御目标k的有效毁伤概率;
Figure BDA00037287980600000310
表示防御目标k未被无人机m毁伤的概率;
Figure BDA00037287980600000311
表示防御目标k实际未被毁伤的概率;
Figure BDA0003728798060000041
表示防御目标k实际被毁伤的概率;
Figure BDA0003728798060000042
表示攻击方编队对防御目标的总期望毁伤值。
优选的,所述基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵,包括:
在所述第一策略集合中选取p个策略,以及在所述第二策略集合中选取q个策略;其中,p和q为正整数,且p≥2,q≥2;
根据所述p个策略和所述q个策略生成严格博弈矩阵,所述严格博弈矩阵中包括p×q个策略对。
优选的,所述基于所述严格博弈矩阵获取初始混合策略纳什均衡,包括:
基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡,所述初始混合策略纳什均衡中包括所述p个策略的第一概率分布和所述q个策略的第二概率分布;
所述根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略,包括:
遍历所述初始混合策略纳什均衡,根据所述第一概率分布获取概率最大的第一策略,并确定为初始第一策略;根据所述第二概率分布获取概率最大的第二策略,并确定为初始第二策略。
优选的,所述根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断的步骤,包括:
获取所述初始第一策略的第一邻居策略集合,所述第一邻居策略集合中包括多个第一邻居策略;
基于所述收益矩阵获取所述多个第一邻居策略中,使所述攻击方编队的收益值最大的第一目标邻居策略,并判断所述第一目标邻居策略是否为所述初始第一策略;
若否,则将所述第一目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;
若是,则获取所述初始第二策略的第二邻居策略集合,所述第二邻居策略集合中包括多个第二邻居策略;基于所述收益矩阵获取所述多个第二邻居策略中,使所述防御方编队的收益值最大的第二目标邻居策略,并判断所述第二目标邻居策略是否为所述初始第二策略;
若否,则将所述第二目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡。
优选的,所述获取所述初始第一策略的第一邻居策略集合,包括:
确定所述初始第一策略中的多个对应关系,所述对应关系指的是所述攻击方编队中的无人机和所述防御方编队中的防御目标的攻防对应关系;
将所述初始第一策略中,任意一个对应关系中的所述防御目标变更为所述防御目标的邻居防御目标,得到第一调节策略,并将所述第一调节策略确定为第一邻居策略;
分别将所述初始第一策略和每个所述第一调节策略中,任意两个对应关系中的所述防御目标进行调换,得到第二调节策略,并将所述第二调节策略确定为第一邻居策略;
将所述初始第一策略和所有的第一邻居策略确定为第一邻居策略集合。
优选的,所述基于所述目标混合策略纳什均衡获取最佳第一策略,包括:
获取所述目标混合策略纳什均衡中概率最大的第一策略,并确定为最佳第一策略。
本发明解决其技术问题所提供的一种多无人机协同博弈决策系统,包括:
生成模块,被配置为生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
严格博弈矩阵获取模块,被配置为基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
初始策略获取模块,被配置为基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
目标混合策略纳什均衡获取模块,被配置为根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
最佳策略模块,被配置为基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
本发明解决其技术问题所提供的一种计算机可读存储介质,其存储用于多无人机协同博弈决策生成的计算机程序,其中,所述计算机程序使得计算机执行如上述的多无人机协同博弈决策方法。
本发明解决其技术问题所提供的一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述的多无人机协同博弈决策方法。
(三)有益效果
本发明提供了一种多无人机协同博弈决策方法和系统。与现有技术相比,具备以下有益效果:
本发明通过生成多无人机的零和矩阵博弈模型,其中,零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;博弈策略集合包括攻击方编队的第一策略集合和防御方编队的第二策略集合。基于第一策略集合和第二策略集合获取严格博弈矩阵,并根据严格博弈矩阵获取初始混合策略纳什均衡。通过确定使攻击方编队和防御方编队的收益值最大的策略,从而获取到目标混合策略纳什均衡。基于目标混合策略纳什均衡和收益矩阵获取攻击方编队的最佳第一策略,并控制攻击方编队执行最佳第一策略。通过零和矩阵博弈模型获取混合策略纳什均衡,并利用收益矩阵确定出最佳策略,利用收益对策略进行筛选,从而提高了获取多无人机的博弈决策的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的多无人机协同博弈决策方法的场景示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种多无人机协同博弈决策方法和系统,解决了现有技术获取多无人机的博弈决策的效率低的问题,提高了获取博弈决策的效率。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例通过生成多无人机的零和矩阵博弈模型,其中,零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;博弈策略集合包括攻击方编队的第一策略集合和防御方编队的第二策略集合。基于第一策略集合和第二策略集合获取严格博弈矩阵,并根据严格博弈矩阵获取初始混合策略纳什均衡。通过确定使攻击方编队和防御方编队的收益值最大的策略,从而获取到目标混合策略纳什均衡。基于目标混合策略纳什均衡和收益矩阵获取攻击方编队的最佳第一策略,并控制攻击方编队执行最佳第一策略。通过将零和矩阵博弈模型转换为混合策略纳什均衡,并利用收益矩阵确定出最佳策略,利用收益对策略进行筛选,从而提高了获取多无人机的博弈决策的效率。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供了一种多无人机协同博弈决策方法,该方法由计算机执行,该方法包括以下步骤:
S1、生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
S2、基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
S3、基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
S4、根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
S5、基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
本发明实施例通过通过对不同的数据匹配各自的生成对抗网络,进而可以对所有的多源异构数据进行处理,从而建立起统一的博弈决策方法,提高了多源异构数据的处理效率。
下面对各步骤进行具体分析。
在步骤S1中,生成多无人机的零和矩阵博弈模型。其中,零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵。博弈双方信息包括攻击方编队的信息和防御方编队的信息,博弈策略集合包括攻击方编队的第一策略集合和防御方编队的第二策略集合。
具体的,针对多无人机协同对地攻击决策问题,由于防御方的拦截策略会对攻击方攻击策略的收益产生影响,于是将其建模为一个零和矩阵博弈模型G=(P,S,U)。该博弈模型包含无人机部分、策略部分和收益部分。
其中,P={T,L}为博弈的参与方,博弈双方包括:T表示攻击方,L表示防御方。攻击方包括多架无人机,防御方包括多个高价值目标和防御系统,防御系统能够发射多个拦截导弹。高价值目标指的是防御方需要防御的单位,可以是机场、公路、桥梁、房屋和雷达等单位,本申请实施例中将高价值目标称为防御目标。攻击方有M架无人机。防御方有K个高价值目标,防御系统共有N枚拦截导弹。图1为本发明实施例所提供的多无人机协同博弈决策方法的场景示意图。
双方在进行博弈时,攻击方通过无人机对防御方的高价值目标进行打击,防御方为保护己方的高价值目标,通过防御系统发射拦截导弹对来袭的无人机进行拦截。
本申请实施例中,将攻击方称为攻击方编队,攻击方编队中包括多个无人机。将防御方称为防御方编队,防御方编队中包括多个防御目标。即T为攻击方编队,L为防御方编队。
博弈双方信息包括攻击方编队的信息和防御方编队的信息,其中,攻击方编队的信息包括无人机信息,防御方编队的信息包括防御目标信息和拦截导弹信息。
博弈策略可以分为攻击方的攻击策略和防御方的防御策略。本申请实施例中将攻击策略称为第一策略,将防御策略称为第二策略。
第一策略指的是博弈时攻击方无人机和防御方防御目标的对应关系。例如,当T方有3架无人机,L方有5个防御目标时,第一策略[1,3,5]表示T方的第1,2,3架无人机分别攻击L方的第1,3,5个防御目标。
第二策略指的是博弈时防御方拦截导弹拦截攻击方无人机的对应关系。例如,当T方有4架无人机,L方有3枚拦截导弹时,第二策略[1,3,4]表示L方的第1,2,3枚拦截导弹分别拦截T方的第1,3,4架无人机。
记S≡ST×SL为博弈的策略空间。
Figure BDA0003728798060000121
表示攻击方的策略集合,其中τT为ST中的策略总数,
Figure BDA0003728798060000122
为ST中的第t个策略,对应T方的第t种攻击策略
Figure BDA0003728798060000123
表示防御方的策略集合,其中τL为SL中的策略总数,
Figure BDA0003728798060000124
为SL中的第l个策略,对应L方的第l种拦截策略
Figure BDA0003728798060000125
由于T方一共有M架无人机,每架无人机可以攻击L方的任何一个防御目标,而L方一共有K个防御目标,则T方策略数量τT为KM。L方一共有N枚拦截导弹,每枚拦截导弹可以拦截T方的任何一架无人机,则L方策略数量τL为MN,即博弈的策略空间规模为|S|=τT·τL=KM·MN
收益矩阵包括:
Figure BDA0003728798060000131
其中,
Figure BDA0003728798060000132
为攻击方编队在策略对
Figure BDA0003728798060000133
下的收益值,即T方在L方执行
Figure BDA0003728798060000134
策略的情况下执行
Figure BDA0003728798060000135
策略对L方防御目标的总期望毁伤值。
Figure BDA0003728798060000136
为第一策略集合中的第t个策略,
Figure BDA0003728798060000137
为第二策略集合中的第l个策略;ST为第一策略集合,SL为第二策略集合。
Figure BDA0003728798060000138
其中,
Figure BDA0003728798060000139
表示拦截导弹n对无人机m的拦截概率、Pmk表示无人机m对防御目标k的毁伤概率、vk表示防御目标k的价值;
Figure BDA00037287980600001310
表示无人机m未被拦截的概率;
Figure BDA00037287980600001311
表示无人机m对防御目标k的有效毁伤概率;
Figure BDA00037287980600001312
表示防御目标k未被无人机m毁伤的概率;
Figure BDA00037287980600001313
表示防御目标k实际未被毁伤的概率;
Figure BDA00037287980600001314
表示防御目标k实际被毁伤的概率;
Figure BDA00037287980600001315
表示攻击方编队对防御目标的总期望毁伤值。
需要说明的是,对于同一个策略对
Figure BDA00037287980600001316
可以得到一个固定的收益值,该收益值为攻击方编队的收益值。对于防御方编队来说,其收益值为攻击方编队的收益值的负数。
在一些实施例中,攻击方决策无人机的目标分配方案,为每个无人机分配所打击的高价值目标,以最大化高价值目标的期望毁伤价值;防御方决策防御系统的拦截导弹分配方案,确定每枚拦截导弹所拦截的无人机,以最小化高价值目标的期望毁伤价值。
在步骤S2中,基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵。具体的,包括以下步骤:
S201:在所述第一策略集合中选取p个策略,以及在所述第二策略集合中选取q个策略;其中,p和q为正整数,且p≥2,q≥2。
具体的,在选取时可以在T方的纯策略集合ST随机选取2个第一策略,并在L方的纯策略集合ST随机选取2个第二策略。
S202:根据所述p个策略和所述q个策略生成严格博弈矩阵,所述严格博弈矩阵中包括p×q个策略对。
其中,p个第一策略和所述q个第二策略可以构成一个p列q行的博弈矩阵,称为严格博弈矩阵。以p=q=3为例,严格博弈矩阵如下所示:
Figure BDA0003728798060000141
其中,三个第一策略为
Figure BDA0003728798060000142
三个第二处理为
Figure BDA0003728798060000143
从而得到3×3的严格博弈矩阵,其中具有9个策略对。每个策略对会对应一个收益值,该收益值为攻击方编队的收益值。该收益值的负数为防御方编队的收益值。
在步骤S3中,基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略。具体的,包括以下步骤:
S301:基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡,所述初始混合策略纳什均衡中包括所述p个策略的第一概率分布和所述q个策略的第二概率分布。
预设算法可以是概率分布算法,例如Lemke–Howson(LH)算法,LH算法首先将博弈矩阵转化为线性不等式,然后通过坐标系将线性规划不等式表示出来,转化成对应的多面体,最后通过在均衡路径迭代规则来寻找纳什均衡。本申请实施例中也可以采用其他的概率分布算法,只要能获取每个策略的概率即可。
需要说明的是,获取到的概率分布有两个:p个策略的第一概率分布和q个策略的第二概率分布。其中,p个策略中,每个第一策略会对应一个概率,并且p个第一策略的概率的和为1。同理,q个策略中,每个第二策略会对应一个概率,并且q个第二策略的概率的和为1。
S302:遍历所述初始混合策略纳什均衡,根据所述第一概率分布获取概率最大的第一策略,并将其确定为初始第一策略;根据所述第二概率分布获取概率最大的第二策略,并将其确定为初始第二策略。
具体的,在初始混合策略纳什均衡中,所有的第一策略对应第一概率分布,因此根据第一概率分布可以确定所有的第一策略中概率最大的策略,本申请实施例中称为初始第一策略。
同理根据第二概率分布可以确定所有的第二策略中概率最大的策略,本申请实施例中称为初始第二策略。
在步骤S4中,根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡。
具体的,本申请实施例通过预设的可扩展博弈算法,可以对初始混合策略纳什均衡进行迭代处理,从而获取符合条件的目标混合策略纳什均衡。
预设的可扩展博弈算法可以包括以下步骤:
S401:获取所述初始第一策略的第一邻居策略集合,所述第一邻居策略集合中包括多个第一邻居策略。
获取第一邻居策略集合的步骤如下:
S4011、确定所述初始第一策略中的多个对应关系,所述对应关系指的是所述攻击方编队中的无人机和所述防御方编队中的防御目标的攻防对应关系。
以初始第一策略为[1,3,5]为例,表示:当T方有3架无人机,L方有5个防御目标时,策略[1,3,5]表示T方的第1,2,3架无人机分别攻击L方的第1,3,5个防御目标。
因此,对应关系有三个:T方1号攻击L方1号,T方2号攻击L方3号,T方3号攻击L方5号。可以确定出初始第一策略中的全部的对应关系。
S4012、将所述初始第一策略中,任意一个对应关系中的所述防御目标变更为所述防御目标的邻居防御目标,得到第一调节策略,并将所述第一调节策略确定为第一邻居策略。
具体的,对于初始第一策略[1,3,5],可以将每个对应关系依次进行调节,得到若干个新的策略,本申请实施例中称为第一调节策略。每个第一调节策略和初始第一策略相比,仅有一条对应关系发生了变化。
可以将对应关系中的防御目标变为其邻居防御目标,以对应关系为T方2号攻击L方3号为例,L方3号的邻居防御目标为L方2号和L方4号,因此对应关系可以转换为T方2号攻击L方2号,以及,T方2号攻击L方4号,从而得到两个第一调节策略。
初始第一策略[1,3,5]得到的所有第一调节策略以及初始第一策略如下:
Figure BDA0003728798060000171
S4013、分别将所述初始第一策略和每个所述第一调节策略中,任意两个对应关系中的所述防御目标进行调换,得到第二调节策略,并将所述第二调节策略确定为第一邻居策略。
对于得到的所有第一调节策略以及初始第一策略来说,可以将每个策略中任意两个元素调换顺序,即任意两个对应关系中的防御目标进行调换,得到多个第二调节策略。例如,将初始第一策略[1,3,5]中的3和5调换,得到第二调节策略[1,5,3],此时对应关系有三个:T方1号攻击L方1号,T方2号攻击L方5号,T方3号攻击L方3号。
S4014、将所述初始第一策略和所有的第一邻居策略确定为第一邻居策略集合。初始第一策略[1,3,5]得到的第一邻居策略集合为:
Figure BDA0003728798060000181
S4015、基于所述收益矩阵获取所述多个第一邻居策略中,使所述攻击方编队的收益值最大的第一目标邻居策略,并判断所述第一目标邻居策略是否为所述初始第一策略。
在多个第一邻居策略中,每个第一邻居策略都可以和任意一个第二策略形成一个策略对,因此每一个第一邻居策略会对应多个策略对。根据收益矩阵,可以计算每个策略对下攻击方编队的收益值。因此,在所有的第一邻居策略对应的所有策略对中,可以确定出使攻击方编队收益值最大的策略对,该策略对所对应的第一邻居策略确定为第一目标邻居策略。进一步的,可以判断该第一目标邻居策略是否为初始第一策略。若否,则执行步骤S4016,若是,则执行步骤S4017。
S4016、第一目标邻居策略不是初始第一策略。此时,则将所述第一目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设的概率分布算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤。
具体的,在将第一目标邻居策略添加到严格博弈矩阵中后,可以跳转到步骤S301中,开始下一轮迭代处理。
S4017、第一目标邻居策略是初始第一策略,此时说明第一策略方面满足条件,已经为最佳,还需要要判断第二策略方面,确定出最佳的第二策略。
获取所述初始第二策略的第二邻居策略集合,所述第二邻居策略集合中包括多个第二邻居策略;基于所述收益矩阵获取所述多个第二邻居策略中,使所述防御方编队的收益值最大的第二目标邻居策略,并判断所述第二目标邻居策略是否为所述初始第二策略。其中,第二邻居策略集合的获取方法可以参照第一邻居策略集合,此处不再赘述。
具体的,第二策略和第一策略的处理方法类似,均为先获取概率最大的策略的邻居策略集合,并判断时无人机编队收益最大的策略是否为该概率最大的策略。
若否,则执行步骤S4018,若是,则执行步骤S4019。
S4018、若第二目标邻居策略不是初始第二策略,则将所述第二目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设的概率分布算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤。
具体的,在将第二目标邻居策略添加到严格博弈矩阵中后,可以跳转到步骤S301中,开始下一轮迭代处理。
S4019、若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡。
此时,第一策略和第二策略均已满足条件,迭代结束,将最后一轮中的初始混合策略纳什均衡输出,得到目标混合策略纳什均衡。
上述步骤中,为先判断第一策略,在判断第二策略的顺序。在一些实施例中,也可以先判断第二策略,再判断第一策略。
在步骤S5中,基于所述目标混合策略纳什均衡和所述收益矩阵获取最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。具体包括以下步骤:
在目标混合策略纳什均衡中,包括多个第一策略和多个第二策略。根据所有的第一策略可以进行筛选,得到最佳的第一策略。
在筛选时,可以获取目标混合策略纳什均衡中概率最大的第一策略,并直接将目标混合策略纳什均衡中概率最大的第一策略确定为最佳第一策略。
在获取到最佳第一策略后,可以控制所述攻击方编队执行所述最佳第一策略。
本发明实施例还提供了一种多无人机协同博弈决策系统,上述系统包括:
生成模块,被配置为生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
严格博弈矩阵获取模块,被配置为基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
初始策略获取模块,被配置为基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
目标混合策略纳什均衡获取模块,被配置为根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
最佳策略模块,被配置为基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
可理解的是,本发明实施例提供的上述博弈决策系统与上述博弈决策方法相对应,其有关内容的解释、举例、有益效果等部分可以参考多无人机协同博弈决策方法中的相应内容,此处不再赘述。
本发明实施例还提供了一种计算机可读存储介质,该介质上存储有至少一条指令,至少所述一条指令由处理器加载并执行以实现如上述的多无人机协同博弈决策方法。
本发明实施例还提供了一种电子设备,电子设备包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述的多无人机协同博弈决策方法。
综上所述,与现有技术相比,具备以下有益效果:
本发明实施例通过生成多无人机的零和矩阵博弈模型,其中,零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;博弈策略集合包括攻击方编队的第一策略集合和防御方编队的第二策略集合。基于第一策略集合和第二策略集合获取严格博弈矩阵,并根据严格博弈矩阵获取初始混合策略纳什均衡。通过确定使攻击方编队和防御方编队的收益值最大的策略,从而获取到目标混合策略纳什均衡。基于目标混合策略纳什均衡和收益矩阵获取攻击方编队的最佳第一策略,并控制攻击方编队执行最佳第一策略。通过将零和矩阵博弈模型转换为混合策略纳什均衡,并利用收益矩阵确定出最佳策略,利用收益对策略进行筛选,从而提高了获取多无人机的博弈决策的效率。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种多无人机协同博弈决策方法,所述博弈决策方法由计算机执行,其特征在于,包括以下步骤:
生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
2.根据权利要求1所述的博弈决策方法,其特征在于,所述攻击方编队的信息包括无人机信息;所述防御方编队的信息包括防御目标信息和拦截导弹信息;
所述收益矩阵包括:
Figure FDA0003728798050000021
其中,
Figure FDA0003728798050000022
为攻击方编队在策略对
Figure FDA0003728798050000023
下的收益值;
Figure FDA0003728798050000024
为第一策略集合中的第t个策略,
Figure FDA0003728798050000025
为第二策略集合中的第l个策略;T为攻击方编队,L为防御方编队;ST为第一策略集合,SL为第二策略集合;
Figure FDA0003728798050000026
其中,
Figure FDA0003728798050000027
表示拦截导弹n对无人机m的拦截概率、Pmk表示无人机m对防御目标k的毁伤概率、vk表示防御目标k的价值;
Figure FDA0003728798050000028
表示无人机m未被拦截的概率;
Figure FDA0003728798050000029
表示无人机m对防御目标k的有效毁伤概率;
Figure FDA00037287980500000210
表示防御目标k未被无人机m毁伤的概率;
Figure FDA00037287980500000211
表示防御目标k实际未被毁伤的概率;
Figure FDA00037287980500000212
表示防御目标k实际被毁伤的概率;
Figure FDA00037287980500000213
表示攻击方编队对防御目标的总期望毁伤值。
3.根据权利要求1所述的博弈决策方法,其特征在于,所述基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵,包括:
在所述第一策略集合中选取p个策略,以及在所述第二策略集合中选取q个策略;其中,p和q为正整数,且p≥2,q≥2;
根据所述p个策略和所述q个策略生成严格博弈矩阵,所述严格博弈矩阵中包括p×q个策略对。
4.根据权利要求3所述的博弈决策方法,其特征在于,所述基于所述严格博弈矩阵获取初始混合策略纳什均衡,包括:
基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡,所述初始混合策略纳什均衡中包括所述p个策略的第一概率分布和所述q个策略的第二概率分布;
所述根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略,包括:
遍历所述初始混合策略纳什均衡,根据所述第一概率分布获取概率最大的第一策略,并确定为初始第一策略;根据所述第二概率分布获取概率最大的第二策略,并确定为初始第二策略。
5.根据权利要求4所述的博弈决策方法,其特征在于,所述根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断的步骤,包括:
获取所述初始第一策略的第一邻居策略集合,所述第一邻居策略集合中包括多个第一邻居策略;
基于所述收益矩阵获取所述多个第一邻居策略中,使所述攻击方编队的收益值最大的第一目标邻居策略,并判断所述第一目标邻居策略是否为所述初始第一策略;
若否,则将所述第一目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;
若是,则获取所述初始第二策略的第二邻居策略集合,所述第二邻居策略集合中包括多个第二邻居策略;基于所述收益矩阵获取所述多个第二邻居策略中,使所述防御方编队的收益值最大的第二目标邻居策略,并判断所述第二目标邻居策略是否为所述初始第二策略;
若否,则将所述第二目标邻居策略添加到所述严格博弈矩阵中,并重新执行基于预设算法对所述严格博弈矩阵进行处理,得到初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡。
6.根据权利要求5所述的博弈决策方法,其特征在于,所述获取所述初始第一策略的第一邻居策略集合,包括:
确定所述初始第一策略中的多个对应关系,所述对应关系指的是所述攻击方编队中的无人机和所述防御方编队中的防御目标的攻防对应关系;
将所述初始第一策略中,任意一个对应关系中的所述防御目标变更为所述防御目标的邻居防御目标,得到第一调节策略,并将所述第一调节策略确定为第一邻居策略;
分别将所述初始第一策略和每个所述第一调节策略中,任意两个对应关系中的所述防御目标进行调换,得到第二调节策略,并将所述第二调节策略确定为第一邻居策略;
将所述初始第一策略和所有的第一邻居策略确定为第一邻居策略集合。
7.根据权利要求6所述的博弈决策方法,其特征在于,所述基于所述目标混合策略纳什均衡获取最佳第一策略,包括:
获取所述目标混合策略纳什均衡中概率最大的第一策略,并确定为最佳第一策略。
8.一种多无人机协同博弈决策系统,其特征在于,所述系统包括:
生成模块,被配置为生成多无人机的零和矩阵博弈模型,所述零和矩阵博弈模型中包括博弈双方信息、博弈策略集合和收益矩阵;所述博弈双方信息包括攻击方编队的信息和防御方编队的信息,所述博弈策略集合包括所述攻击方编队的第一策略集合和所述防御方编队的第二策略集合;
严格博弈矩阵获取模块,被配置为基于所述第一策略集合和所述第二策略集合获取严格博弈矩阵;
初始策略获取模块,被配置为基于所述严格博弈矩阵获取初始混合策略纳什均衡,并根据所述初始混合策略纳什均衡选取初始第一策略和初始第二策略;
目标混合策略纳什均衡获取模块,被配置为根据所述初始第一策略的第一邻居策略集合和所述初始第二策略的第二邻居策略集合判断:使所述攻击方编队的收益值最大的第一目标邻居策略为所述初始第一策略,以及使所述防御方编队的收益值最大的第二目标邻居策略为所述初始第二策略,是否同时满足;若否,则根据所述第一目标邻居策略和所述第二目标邻居策略更新所述严格博弈矩阵,并重新执行基于所述严格博弈矩阵获取初始混合策略纳什均衡的步骤;若是,则将所述初始混合策略纳什均衡确定为目标混合策略纳什均衡;
最佳策略模块,被配置为基于所述目标混合策略纳什均衡和所述收益矩阵获取所述攻击方编队的最佳第一策略,并控制所述攻击方编队执行所述最佳第一策略。
9.一种计算机可读存储介质,其特征在于,其存储用于多无人机协同博弈决策生成的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~7任一项所述的多无人机协同博弈决策方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1~7任一项所述的多无人机协同博弈决策方法。
CN202210782058.0A 2022-07-04 2022-07-04 多无人机协同博弈决策方法和系统 Active CN115328189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210782058.0A CN115328189B (zh) 2022-07-04 2022-07-04 多无人机协同博弈决策方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210782058.0A CN115328189B (zh) 2022-07-04 2022-07-04 多无人机协同博弈决策方法和系统

Publications (2)

Publication Number Publication Date
CN115328189A true CN115328189A (zh) 2022-11-11
CN115328189B CN115328189B (zh) 2024-04-19

Family

ID=83917322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210782058.0A Active CN115328189B (zh) 2022-07-04 2022-07-04 多无人机协同博弈决策方法和系统

Country Status (1)

Country Link
CN (1) CN115328189B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313972A (zh) * 2023-09-28 2023-12-29 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质
CN117788164A (zh) * 2024-01-26 2024-03-29 国金证券股份有限公司 证券期货行业大语言模型多Agent协同控制算法与系统
CN117852168A (zh) * 2023-12-19 2024-04-09 哈尔滨工业大学 基于哈里斯鹰粒子群的三维多导弹协同博弈制导律方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3370219A1 (fr) * 2017-03-03 2018-09-05 MBDA France Procédé et dispositif de prédiction de solutions d'attaque et de défense optimales dans un scénario de conflit militaire
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
US20200169317A1 (en) * 2018-11-26 2020-05-28 Eagle Technology, Llc Radio frequency (rf) communication system providing enhanced mobile vehicle positioning based upon reward matrices and related methods
CN114326822A (zh) * 2022-03-09 2022-04-12 中国人民解放军66136部队 一种基于演化博弈的无人机集群信息共享方法
CN116774721A (zh) * 2023-03-14 2023-09-19 合肥工业大学 多无人机博弈对抗的目标分配方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3370219A1 (fr) * 2017-03-03 2018-09-05 MBDA France Procédé et dispositif de prédiction de solutions d'attaque et de défense optimales dans un scénario de conflit militaire
CN110574091A (zh) * 2017-03-03 2019-12-13 Mbda法国公司 在军事冲突场景中预测最佳攻击和防御解决方案的方法和设备
US20200169317A1 (en) * 2018-11-26 2020-05-28 Eagle Technology, Llc Radio frequency (rf) communication system providing enhanced mobile vehicle positioning based upon reward matrices and related methods
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
CN114326822A (zh) * 2022-03-09 2022-04-12 中国人民解放军66136部队 一种基于演化博弈的无人机集群信息共享方法
CN116774721A (zh) * 2023-03-14 2023-09-19 合肥工业大学 多无人机博弈对抗的目标分配方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIANG RUHAO 等: "Multicriteria game approach to air-to-air combat tactical decisions for multiple UAVs", JOURNAL OF SYSTEMS ENGINEERING AND ELECTRONICS, vol. 34, no. 6, 31 December 2023 (2023-12-31), pages 1447 *
罗贺 等: "多无人机协同目标分配仿真系统设计与实现", 系统仿真学报, vol. 21, no. 11, 30 June 2009 (2009-06-30), pages 3246 - 3250 *
陈侠;李光耀;赵谅;: "多无人机协同打击任务的攻防博弈策略研究", 火力与指挥控制, no. 11, 15 November 2018 (2018-11-15), pages 19 - 25 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313972A (zh) * 2023-09-28 2023-12-29 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质
CN117313972B (zh) * 2023-09-28 2024-04-12 烟台大学 一种无人艇集群的攻击方法、系统、装置及存储介质
CN117852168A (zh) * 2023-12-19 2024-04-09 哈尔滨工业大学 基于哈里斯鹰粒子群的三维多导弹协同博弈制导律方法
CN117852168B (zh) * 2023-12-19 2024-09-20 哈尔滨工业大学 基于哈里斯鹰粒子群的三维多导弹协同博弈制导律方法
CN117788164A (zh) * 2024-01-26 2024-03-29 国金证券股份有限公司 证券期货行业大语言模型多Agent协同控制算法与系统

Also Published As

Publication number Publication date
CN115328189B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
CN115328189B (zh) 多无人机协同博弈决策方法和系统
CN107135224B (zh) 基于Markov演化博弈的网络防御策略选取方法及其装置
Xin et al. An efficient rule-based constructive heuristic to solve dynamic weapon-target assignment problem
CN107886184B (zh) 一种多型防空武器混编火力群目标分配优化方法
CN110300106B (zh) 基于Markov时间博弈的移动目标防御决策选取方法、装置及系统
CN112099522B (zh) 多无人机协同对地攻击任务规划方法及终端设备
CN113109770B (zh) 一种干扰资源分配方法及系统
CN116702633B (zh) 一种基于多目标动态优化的异构弹群任务可靠性规划方法
CN115580430A (zh) 一种基于深度强化学习的攻击树蜜罐部署防御方法与装置
CN114722998B (zh) 一种基于cnn-ppo的兵棋推演智能体构建方法
CN115034067A (zh) 基于链路的作战网络攻防策略的博弈优化方法及装置
Zhao et al. Shuffled frog leaping algorithm with non-dominated sorting for dynamic weapon-target assignment
CN113792985B (zh) 一种传感器-武器动态联合任务多目标分配方法
Meng et al. A cluster UAV inspired honeycomb defense system to confront military IoT: A dynamic game approach
Liu et al. A Time-Driven Dynamic Weapon Target Assignment Method
CN113132398A (zh) 一种基于q学习的阵列蜜罐系统防御策略预测方法
CN116088586B (zh) 一种无人机作战过程中的临机任务规划的方法
CN115619607B (zh) 基于强化学习的多阶段资源攻防分配方法及系统
CN116579430A (zh) 一种求解网络攻防博弈精炼bne的方法及系统
CN116090356B (zh) 基于任务可靠性约束的异构弹群多目标任务规划方法
CN117155594A (zh) 面向女巫攻击的区块链自适应检测方法、终端及存储介质
Bian et al. Cooperative strike target assignment algorithm based on deep reinforcement learning
Li et al. Double Deep Q-learning for Anti-saturation Attack Problem of Warship Group
Fu et al. Air defense intelligent weapon target assignment method based on deep reinforcement learning
Guo Research on target assignment of soft and hard weapons under fire compatibility constraints

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant