CN110377052B - 无人机编队协同目标分配的矩阵博弈方法及系统 - Google Patents

无人机编队协同目标分配的矩阵博弈方法及系统 Download PDF

Info

Publication number
CN110377052B
CN110377052B CN201910661623.6A CN201910661623A CN110377052B CN 110377052 B CN110377052 B CN 110377052B CN 201910661623 A CN201910661623 A CN 201910661623A CN 110377052 B CN110377052 B CN 110377052B
Authority
CN
China
Prior art keywords
unmanned aerial
formation
aerial vehicle
strategy
game
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910661623.6A
Other languages
English (en)
Other versions
CN110377052A (zh
Inventor
罗贺
马滢滢
胡笑旋
王国强
雷星
夏维
靳鹏
马华伟
张鹏
王菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910661623.6A priority Critical patent/CN110377052B/zh
Publication of CN110377052A publication Critical patent/CN110377052A/zh
Application granted granted Critical
Publication of CN110377052B publication Critical patent/CN110377052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种无人机编队协同目标分配的矩阵博弈方法及系统。本申请建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决考虑无人机占位的无人机编队协同目标分配问题,具体地,首先确定对抗双方可能的占位策略,之后对抗双方基于双方无人机的占位策略决策己方每个无人机所对抗的目标,从而使己方协同目标分配时的期望优势值尽可能的大,期望劣势尽可能的小。即本申请能够为对抗中的某一方确定最有优势的博弈策略,解决了现有技术中的缺陷。

Description

无人机编队协同目标分配的矩阵博弈方法及系统
技术领域
本申请涉及安保领域,具体涉及一种无人机编队协同目标分配的矩阵博弈方法及系统。
背景技术
无人机能够在多种环境下自主的完成给定任务,有效降低人力成本。相较于有人机,无人机具有无人员伤亡、机动性强、重量较轻、成本较低等特点,已经成为现代空战武器装备的重要成员之一。由于单个无人机所携带武器和传感器数量及性能有限,其执行空战任务的能力受到相应的限制,而多个无人机进行有效协同可以更好的完成空战任务,因此,多无人机超视距协同空战决策技术已受到了越来越多的关注。
针对多无人机超视距协同空战决策问题,目前大多研究的是多无人机协同目标分配问题,类似于多机协同目标分配问题,即在满足约束的前提下,最有效的为每个飞机分配所要对抗的目标。现有技术中,多无人机协同目标分配是在双方无人机位置已知的前提下进行的。双方无人机的位置是影响无人机对目标优势的关键因素,进而会对协同目标分配的效果产生巨大的影响,因此,在协同目标分配之前决策一个有效的无人机占位策略可以进一步提高多无人机协同目标分配取得的期望优势值。而现有技术中并没有考虑无人机的占位对目标分配的影响。
发明内容
(一)解决的技术问题
针对现有技术的不足,本申请提供了一种无人机编队协同目标分配的矩阵博弈方法及系统,解决了现有技术中没有考虑无人机的占位对目标分配影响的技术问题。
(二)技术方案
为实现以上目的,本申请通过以下技术方案予以实现:
第一方面,本申请实施例提供了一种无人机编队协同目标分配的矩阵博弈方法,包括:
基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;
确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;
基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;
针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;
基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;
从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;
基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略;
基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
在一种可能的实施方式中,基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,包括:
获取第一无人机编队中的无人机的数量和第一无人机编队的占位区域;
将所述第一无人机编队的占位区域分割为多个第一子区域;
基于第一无人机编队中无人机的数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域;
获取第二无人机编队中无人机的数量和第二无人机编队的占位区域;
将所述第二无人机编队的占位区域分割为多个第二子区域;
基于第二无人机编队中无人机的数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
在一种可能的实施方式中,基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
在一种可能的实施方式中,基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:
Figure GDA0002442487860000041
其中,
Figure GDA0002442487860000042
为第一无人机编队的最大期望优势值,
Figure GDA0002442487860000043
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为- u(sR,sB)。
在一种可能的实施方式中,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最大期望优势值,包括:
建立第一无人机编队的目标分配模型,如公式(2)-(6):
Figure GDA0002442487860000051
Figure GDA0002442487860000052
Figure GDA0002442487860000053
Figure GDA00024424878600000510
满足
Figure GDA0002442487860000054
则对于r≠i,ar,j=0 (5)
Figure GDA0002442487860000055
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure GDA0002442487860000056
表示无人机 i相对于无人机j的优势值;
公式(2)表示第一无人机编队目标分配模型的目标函数;公式(3) 表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(4)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(5)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j 的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000057
在一种可能的实施方式中,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第二无人机编队的最大期望优势值,包括:
建立第二无人机编队的目标分配模型,如公式(7)-(11):
Figure GDA0002442487860000058
Figure GDA0002442487860000059
Figure GDA0002442487860000061
Figure GDA0002442487860000062
满足
Figure GDA0002442487860000063
则对于- r≠j, br,i=0 (10)
Figure GDA0002442487860000064
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure GDA0002442487860000065
表示无人机 j相对于无人机i的优势值;
公式(7)表示第二无人机编队目标分配模型的目标函数;公式(8) 表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(9)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(10)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0;
对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000066
在一种可能的实施方式中,生成矩阵博弈的博弈矩阵,包括:
遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:
Figure GDA0002442487860000067
其中,U为博弈矩阵,
Figure GDA0002442487860000071
为第一无人机编队的第i个博弈策略,
Figure GDA0002442487860000072
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
第二方面,本申请提供了一种无人机编队协同目标分配的矩阵博弈系统,包括:
占位策略确定模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
目标分配策略确定模块,用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
博弈策略确定模块,用于将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;
矩阵生成模块,用于基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;并基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;
纳什均衡求解模块,用于从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;
策略筛选模块,用于基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略,并基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
在一种可能的实施方式中,所述矩阵生成模块在基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值时,包括:
在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:
Figure GDA0002442487860000081
其中,
Figure GDA0002442487860000082
为第一无人机编队的最大期望优势值,
Figure GDA0002442487860000083
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为- u(sR,sB)。
在一种可能的实施方式中,所述矩阵生成模块在生成矩阵博弈的博弈矩阵时,具体包括:
遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:
Figure GDA0002442487860000091
其中,U为博弈矩阵,
Figure GDA0002442487860000092
为第一无人机编队的第i个博弈策略,
Figure GDA0002442487860000093
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
(三)有益效果
本申请实施例提供了一种无人机编队协同目标分配的矩阵博弈方法及系统。具备以下有益效果:
本申请实施例建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决多无人机协同占位决策问题,具体地,首先确定对抗双方可能的占位策略,之后对抗双方基于双方无人机的占位策略决策己方每个无人机所对抗的目标,从而使己方协同目标分配时的期望优势值尽可能的大,期望劣势尽可能的小,即本申请能够为对抗中的某一方确定最有优势的占位策略和目标分配策略,解决了现有技术中的缺陷。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性的示出了本申请一实施例的无人机编队协同目标分配的矩阵博弈方法的流程图;
图2a示意性的示出了本申请再一实施例的无人机编队协同目标分配的矩阵博弈方法中的占位区域示意图;
图2b示意性的示出了本申请再一实施例的无人机编队协同目标分配的矩阵博弈方法中的占位区域分割示意图;
图3示意性的示出了本申请再一实施例的无人机编队协同目标分配的矩阵博弈方法中的零和矩阵博弈模型示意图;
图4示意性的示出了本申请再一实施例的无人机编队协同目标分配的矩阵博弈方法中的对抗双方无人机位置示意图;
图5示意性的示出了本申请一实施例的无人机编队协同目标分配的矩阵博弈系统的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提出了一种无人机编队协同目标分配的矩阵博弈方法及系统,该方法或系统解决了考虑无人机占位的无人机编队协同目标分配问题,具体地,对抗双方首先决策己方每个无人机的占位位置,再基于双方无人机的占位位置决策己方每个无人机对抗的目标,从而使己方占据尽可能大的优势、尽可能小的劣势。本申请通过分析双方无人机所在的位置对双方优势与劣势的影响,将该问题建模为零和矩阵博弈模型。下面,对本申请的种无人机编队协同目标分配的矩阵博弈方法进行详细说明。
如图1所示,本申请的无人机编队协同目标分配的矩阵博弈方法,包括:
S110、分别确定每个无人机编队的占位策略,以及每个无人机编队的目标分配策略,具体地:基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略。
本步骤中,基于第一无人机编队中的无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,具体可以利用如下步骤实现:
步骤一、获取第一无人机编队中的无人机数量和第一无人机编队的占位区域。
步骤二、将所述第一无人机编队的占位区域分割为多个第一子区域。
步骤三、基于第一无人机编队中的无人机数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域。
本步骤中,基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,具体可以如下步骤实现:
步骤一、获取第二无人机编队中的无人机数量和第二无人机编队的占位区域。
步骤二、将所述第二无人机编队的占位区域分割为多个第二子区域。
步骤三、基于第二无人机编队中的无人机数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
基于第一无人机编队中第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
第一无人机编队R和第二无人机编队B在一个三维区域
Figure GDA0002442487860000127
中进行对抗,其中,Ω为一个由三部分组成的立方体区域,R和B分别位于Ω的两侧,如图2a所示,
Figure GDA0002442487860000125
为R的占位区域,
Figure GDA0002442487860000126
为B的占位区域,
Figure GDA0002442487860000124
为双方的间隔区域。由于ΩR和ΩB是三维且连续的,R和B无人机将有无数个占位位置,为使多个无人机的协同占位决策变成可处理的问题,按空间维度将占位区域离散为大小均匀的立方体(后续立方体统指离散后的),如图2b所示。此时,每个无人机的占位即为占据的立方体,且每个立方体最多只能作为一个无人机的占位位置。当无人机占据立方体时,无人机的位置为立方体的中心位置。
记R的同质无人机集合为M,B的同质无人机集合为N,ΩR离散的立方体集合为
Figure GDA0002442487860000121
ΩB离散的立方体集合为
Figure GDA0002442487860000122
R选择CR、B选择CB中的一些立方体作为己方无人机的占位位置,即占位策略。用
Figure GDA0002442487860000123
表示R的占位策略,
Figure GDA0002442487860000131
其中,当选择立方体
Figure GDA0002442487860000132
为R无人机的占位位置时,
Figure GDA0002442487860000133
否则,
Figure GDA0002442487860000134
决策后,M中的无人机按照其占据的立方体位置从小到大进行排序。同理,我们用
Figure GDA0002442487860000135
表示B的占位策略,
Figure GDA0002442487860000136
R和B分别基于双方的占位策略dR、dB决策己方每个无人机对抗的目标。用a=(ai,j)i∈M,j∈N表示R的协同目标分配策略,ai,j∈{0,1},其中,当R的无人机i对抗B的无人机j时,ai,j=1,否则,ai,j=0。同理,用 b=(bj,i)j∈N,i∈M表示B的协同目标分配策略,bj,i∈{0,1}。
S120、分别确定每个无人机编队的博弈策略集,具体地:将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应。
S130、生成矩阵博弈的博弈矩阵,具体地:基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵。
本步骤中,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最大期望优势值,具体可以利用如下步骤实现:
步骤一、建立第一无人机编队的目标分配模型,如公式(2)-(6):
Figure GDA0002442487860000141
Figure GDA0002442487860000142
Figure GDA0002442487860000143
Figure GDA0002442487860000144
满足
Figure GDA0002442487860000145
则对于r≠i,ar,j=0 (5)
Figure GDA0002442487860000146
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure GDA0002442487860000147
表示无人机 i相对于无人机j的优势值;
公式(2)表示第一无人机编队目标分配模型的目标函数;公式(3) 表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(4)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(5)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j 的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
步骤二、对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000148
本步骤中,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第二无人机编队的最大期望优势值,可以利用如下步骤实现:
步骤一、建立第二无人机编队的目标分配模型,如公式(7)-(11):
Figure GDA0002442487860000149
Figure GDA0002442487860000151
Figure GDA0002442487860000152
Figure GDA0002442487860000153
满足
Figure GDA0002442487860000154
则对于- r≠j , br,i=0 (10)
Figure GDA0002442487860000155
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合, j表示N中的第j个无人机;
Figure GDA0002442487860000156
表示无人机j相对于无人机i的优势值;
公式(7)表示第二无人机编队目标分配模型的目标函数;公式(8) 表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(9)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(10)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0;
步骤二、对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000157
上述步骤中在求解R的多机协同目标分配模型时,需要首先计算i 对j的优势值
Figure GDA0002442487860000158
这里主要考虑超视距空战中影响优势的距离因素和高度因素,其中,i与j的相对位置如图4所示。
1)距离优势函数
i相对于j的距离优势由如下距离优势函数计算得到:
Figure GDA0002442487860000159
其中
Figure GDA0002442487860000161
Figure GDA0002442487860000162
(xi,yi,zi)、(xj,yj,zj)分别为i与j在占位区域中的三维坐标,ri,j表示 i与j之间的相对距离,
Figure GDA0002442487860000163
分别表示i所携带的导弹的最小和最大发射距离。
2)高度优势函数
i相对于j的高度优势由如下高度优势函数计算得到:
Figure GDA0002442487860000164
其中,hi和hj为i和j的高度,hibest为i的最佳飞行高度。
综合上述两个优势函数得到i相对于j的优势函数为:
Figure GDA0002442487860000165
其中,w1+w2=1。
由(15)可计算得到M中每个无人机对N中每个无人机的优势值,并根据MR求解得到(sR,sB)下R的最大预期优势值
Figure GDA0002442487860000166
同理可得到
Figure GDA0002442487860000167
本步骤中,基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈中博弈策略对对应的第一无人机编队的支付值,可以利用如下步骤实现:
在博弈策略对(sR,sB)下第一无人机编队的支付值由公式(1)计算可得:
Figure GDA0002442487860000171
其中,
Figure GDA0002442487860000172
为第一无人机编队的最大期望优势值,
Figure GDA0002442487860000173
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为- u(sR,sB)。
本步骤中,利用如下步骤生成矩阵博弈的博弈矩阵:
遍历所有的博弈策略对,并利用第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:
Figure GDA0002442487860000174
其中,U为博弈矩阵,
Figure GDA0002442487860000175
为第一无人机编队的第i个博弈策略,
Figure GDA0002442487860000176
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
上述超视距空战中多无人机协同占位决策问题被建模为零和矩阵博弈模型,其中,R和B的占位策略作为博弈策略,R的优势与劣势的差值作为博弈策略组合下的效用值,该模型的框架如图3所示,R希望最大化效用值,B希望最小化效用值。
将上述零和矩阵博弈模型描述为G=(N,S,U),具体如下:N={R,B} 为博弈的参与人;S=SR×SB为紧凑的战略行动空间,其中,SR、SB分别为R和B的可行策略集。记
Figure GDA0002442487860000177
(sR对应为R在第一阶段决策中的占位策略dR),sR∈SR为R的一个策略,
Figure GDA0002442487860000178
(sB对应为B在第一阶段决策中的占位策略dB),sB∈SB为B的一个策略,用τR、τB分别表示R和B所有可能策略的数量,则
Figure GDA0002442487860000181
其中,τR、τB分别为从CR、CB的立方体集合中选择|M|、|N|个立方体的所有可能情况数量,即
Figure GDA0002442487860000182
Figure GDA0002442487860000183
Figure GDA0002442487860000184
为博弈的效用矩阵,其中,u(sR,sB)为R在策略对(sR,sB)下的效用值,由R与B第二阶段决策优势的差值计算得到,即
Figure GDA0002442487860000185
Figure GDA0002442487860000186
分别为R和B协同目标分配取得的最大期望优势值。
S140、求解博弈矩阵,用于从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略,具体地:生成所述博弈矩阵对应的对偶线性规划模型,并计算所述对偶线性规划模型的最优解,得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率。
纳什均衡是最有效的解决方案,根据零和博弈的性质,上述博弈模型G至少存在一个混合策略纳什均衡。记
Figure GDA00024424878600001812
x∈X为R的一个混合策略,其中xi为R选择第i个纯策略
Figure GDA0002442487860000187
的概率,且0≤xi≤1,
Figure GDA0002442487860000188
Figure GDA00024424878600001813
y∈Y为B的一个混合策略,yj为B选择第j个纯策略
Figure GDA0002442487860000189
的概率,且0≤yj≤1,
Figure GDA00024424878600001810
在混合策略对(x,y)下,R的期望收益为
Figure GDA00024424878600001811
B的期望收益为-F(x,y)。若存在混合策略对(x*,y*),使得F(x*,y*)满足:
F(x,y*)≤F(x*,y*)≤F(x*,y) (17)
则称(x*,y*)为该博弈的混合策略纳什均衡,即最优解。
根据混合策略纳什均衡的性质,公式(17)可转化为最小最大问题与最大最小问题,如下公式(18)和(19)。公式(18)和公式(19) 所对应的最优解即为G的混合策略纳什均衡。
Figure GDA0002442487860000191
Figure GDA0002442487860000192
S150、确定第一无人机编队的最优目标分配策略,具体地:基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略;
基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
上述技术方案中,当双方无人机的占位位置确定后,双方分别进行协同目标分配,双方的最大期望优势值以及相应的协同目标分配方案均可通过计算得到。此时,每方的优势为协同目标分配取得的最大期望优势值,且一方的优势为另一方的劣势,而对抗双方均希望通过决策己方无人机的占位策略使己方的优势最大、劣势最小。因此,双方在决策时需要考虑对方所有可能的占位策略,从而找到一个均衡的占位策略。本申请使用零和矩阵博弈模型对其进行建模并寻找该博弈的混合策略纳什均衡,为对抗中的某一方确定最有优势的博弈策略,解决了现有技术中的缺陷。
对应于上述方法,本申请还提供了一种无人机编队协同目标分配的矩阵博弈系统,如图5所示,包括:
占位策略确定模块500,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
目标分配策略确定模块510,用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
博弈策略确定模块520,用于将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;
矩阵生成模块530,用于基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;并基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;
纳什均衡求解模块540,用于从算法库中选择一种纳什均衡的求解算法计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;
策略筛选模块550,用于基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略,并基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
在一些实施例中,所述矩阵生成模块在基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最大期望优势值时,具体用于:
建立第一无人机编队的目标分配模型,如公式(2)-(6):
Figure GDA0002442487860000211
Figure GDA0002442487860000212
Figure GDA0002442487860000213
Figure GDA0002442487860000214
满足
Figure GDA0002442487860000215
则对于r≠i,ar,j=0 (5)
Figure GDA0002442487860000216
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure GDA0002442487860000217
表示无人机 i相对于无人机j的优势值;
公式(2)表示第一无人机编队目标分配模型的目标函数;公式(3) 表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(4)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(5)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j 的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000221
在一些实施例中,所述矩阵生成模块在基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第二无人机编队的最大期望优势值时,具体用于:
建立第二无人机编队的目标分配模型,如公式(7)-(11):
Figure GDA0002442487860000222
Figure GDA0002442487860000223
Figure GDA0002442487860000224
Figure GDA0002442487860000225
满足
Figure GDA0002442487860000226
则对于r≠j, br,i=0 (10)
Figure GDA0002442487860000227
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合, j表示N中的第j个无人机;
Figure GDA0002442487860000228
表示无人机j相对于无人机i的优势值;
公式(7)表示第二无人机编队目标分配模型的目标函数;公式(8) 表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(9)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(10)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0;
对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure GDA0002442487860000231
本申请实施例的方法中的每个步骤是于本申请实施例的系统在确定博弈策略过程中的步骤一一对应的,本申请实施例的系统在确定博弈策略过程中每个步骤均包含在本申请实施例的方法中,因此,对于重复的部分,这里不再进行赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种无人机编队协同目标分配的矩阵博弈方法,其特征在于,包括:
基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;
确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;
基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;
针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;
基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;
从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;
基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略;
基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
2.根据权利要求1所述的方法,其特征在于,基于第一无人机编队中无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,基于第二无人机编队中无人机的数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,包括:
获取第一无人机编队中的无人机的数量和第一无人机编队的占位区域;
将所述第一无人机编队的占位区域分割为多个第一子区域;
基于第一无人机编队中无人机的数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域;
获取第二无人机编队中无人机的数量和第二无人机编队的占位区域;
将所述第二无人机编队的占位区域分割为多个第二子区域;
基于第二无人机编队中无人机的数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
3.根据权利要求1所述的方法,其特征在于,基于第一无人机编队的第一占位策略、第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
4.根据权利要求1所述的方法,其特征在于,基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:
Figure FDA0002442487850000031
其中,
Figure FDA0002442487850000032
为第一无人机编队的最大期望优势值,
Figure FDA0002442487850000033
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为-u(sR,sB)。
5.根据权利要求4所述的方法,其特征在于,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最大期望优势值,包括:
建立第一无人机编队的目标分配模型,如公式(2)-(6):
Figure FDA0002442487850000041
j∈Nai,j=1,
Figure FDA0002442487850000042
i∈Mai,j≤Cj
Figure FDA0002442487850000043
Figure FDA0002442487850000048
满足
Figure FDA0002442487850000044
则对于r≠i,ar,j=0 (5)
ai,j∈{0,1},
Figure FDA0002442487850000045
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure FDA0002442487850000046
表示无人机i相对于无人机j的优势值;
公式(2)表示第一无人机编队目标分配模型的目标函数;公式(3)表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(4)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(5)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure FDA0002442487850000047
6.根据权利要求4所述的方法,其特征在于,基于博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第二无人机编队的最大期望优势值,包括:
建立第二无人机编队的目标分配模型,如公式(7)-(11):
Figure FDA0002442487850000051
i∈Mbj,i=1,
Figure FDA0002442487850000052
j∈Nbj,i≤Ci
Figure FDA0002442487850000053
Figure FDA0002442487850000054
满足
Figure FDA0002442487850000055
则对于r≠j , br,i=0 (10)
bj,i∈{0,1},
Figure FDA0002442487850000056
其中,(sR,sB)表示博弈策略对,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;
Figure FDA0002442487850000057
表示无人机j相对于无人机i的优势值;
公式(7)表示第二无人机编队目标分配模型的目标函数;公式(8)表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(9)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(10)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0;
对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最大期望优势值
Figure FDA0002442487850000058
7.根据权利要求4所述的方法,其特征在于,生成矩阵博弈的博弈矩阵,包括:
遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:
Figure FDA0002442487850000061
其中,U为博弈矩阵,
Figure FDA0002442487850000062
为第一无人机编队的第i个博弈策略,
Figure FDA0002442487850000063
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
8.一种无人机编队协同目标分配的矩阵博弈系统,其特征在于,包括:
占位策略确定模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
目标分配策略确定模块,用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
博弈策略确定模块,用于将第一无人机编队作为矩阵博弈的第一参与人,将第二无人机编队作为矩阵博弈的第二参与人;确定矩阵博弈中第一无人机编队的第一博弈策略集、第二无人机编队的第二博弈策略集,其中,第一博弈策略集包括所有的第一博弈策略,第二博弈策略集包括所有的第二博弈策略;第一博弈策略与第一占位策略一一对应,第二博弈策略与第二占位策略一一对应;
矩阵生成模块,用于基于多个第一博弈策略和多个第二博弈策略,确定多个博弈策略对;针对每个博弈策略对,基于该博弈策略对中的第一博弈策略和第二博弈策略,确定该博弈策略对对应的第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并基于第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该矩阵博弈的博弈策略对对应的第一无人机编队的支付值;并基于所有博弈策略对对应的第一无人机编队的支付值,生成矩阵博弈的博弈矩阵;其中,每个博弈策略对包括一个第一博弈策略和一个第二博弈策略;
纳什均衡求解模块,用于从算法库中选择一种纳什均衡求解算法并计算得到第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行每个第二博弈策略的概率;
策略筛选模块,用于基于所述矩阵博弈的第一均衡混合策略和第二均衡混合策略,按照第一无人机编队执行每个第一博弈策略的概率,从多个第一博弈策略中选取第一无人机编队执行的博弈策略,按照第二无人机编队执行每个第二博弈策略的概率,从多个第二博弈策略中选取第二无人机编队执行的博弈策略,并基于第一无人机编队执行的博弈策略、第二无人机编队执行的博弈策略,确定第一无人机编队的最优目标分配策略。
9.根据权利要求8所述的系统,其特征在于,所述矩阵生成模块在基于矩阵博弈中博弈策略对下第一无人机编队的最大期望优势值和第二无人机编队的最大期望优势值,确定该博弈策略对对应的第一无人机编队的支付值时,包括:
在博弈策略对(sR,sB)下,第一无人机编队的支付值由公式(1)计算可得:
Figure FDA0002442487850000071
其中,
Figure FDA0002442487850000072
为第一无人机编队的最大期望优势值,
Figure FDA0002442487850000073
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为-u(sR,sB)。
10.根据权利要求9所述的系统,其特征在于,所述矩阵生成模块在生成矩阵博弈的博弈矩阵时,具体包括:
遍历所有的博弈策略对,并计算第一无人机编队在每个博弈策略对下的支付值,生成矩阵博弈的博弈矩阵,如公式(12)所示:
Figure FDA0002442487850000081
其中,U为博弈矩阵,
Figure FDA0002442487850000082
为第一无人机编队的第i个博弈策略,
Figure FDA0002442487850000083
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
CN201910661623.6A 2019-07-22 2019-07-22 无人机编队协同目标分配的矩阵博弈方法及系统 Active CN110377052B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910661623.6A CN110377052B (zh) 2019-07-22 2019-07-22 无人机编队协同目标分配的矩阵博弈方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910661623.6A CN110377052B (zh) 2019-07-22 2019-07-22 无人机编队协同目标分配的矩阵博弈方法及系统

Publications (2)

Publication Number Publication Date
CN110377052A CN110377052A (zh) 2019-10-25
CN110377052B true CN110377052B (zh) 2020-07-03

Family

ID=68254696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910661623.6A Active CN110377052B (zh) 2019-07-22 2019-07-22 无人机编队协同目标分配的矩阵博弈方法及系统

Country Status (1)

Country Link
CN (1) CN110377052B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612300B (zh) * 2020-11-27 2023-06-09 合肥工业大学 多平台智能决策的多目标博弈方法及装置
CN112612298B (zh) * 2020-11-27 2023-06-09 合肥工业大学 对抗环境下多无人机战术决策的多目标博弈方法及装置
CN112595174B (zh) * 2020-11-27 2022-09-13 合肥工业大学 动态环境下多无人机战术决策方法及装置
CN114167899B (zh) * 2021-12-27 2023-05-26 北京联合大学 一种无人机蜂群协同对抗决策方法及系统
CN115328189B (zh) * 2022-07-04 2024-04-19 合肥工业大学 多无人机协同博弈决策方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN108170158B (zh) * 2017-12-05 2020-02-28 中国科学院自动化研究所 基于数据驱动的无人机智能对抗控制方法
CN109508042B (zh) * 2019-01-30 2022-05-31 合肥工业大学 用于无人机编队智能决策的控制方法、系统及存储介质

Also Published As

Publication number Publication date
CN110377052A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN110377052B (zh) 无人机编队协同目标分配的矩阵博弈方法及系统
CN107515618B (zh) 一种考虑时间窗口的异构无人机协同任务分配方法
CN110442146B (zh) 无人机编队目标分配与空间占位联合决策方法及系统
CN108764453B (zh) 面向多智能体同步博弈的建模方法及动作预测系统
US20060003823A1 (en) Dynamic player groups for interest management in multi-character virtual environments
CN108594645B (zh) 单场站多无人机分配与飞行路线的规划方法及系统
CN110443473B (zh) 对抗环境下多无人机协同目标分配方法及系统
CN111313957B (zh) 基于分类多目标优化的混合卫星通信系统资源分配方法
CN115630711B (zh) 一种训练XGBoost模型的方法和多方安全计算平台
CN116225049A (zh) 一种多无人机狼群协同作战攻防决策算法
CN115903896A (zh) 一种基于代理模型优化的多无人机路径规划方法
CN108211363A (zh) 一种信息处理方法及装置
CN109544082B (zh) 一种用于数字化战场对抗的系统和方法
CN113625767A (zh) 一种基于优选信息素灰狼算法的固定翼无人机集群协同路径规划方法
CN116088586A (zh) 一种无人机作战过程中的临机任务规划的方法
CN113919425B (zh) 一种空中目标自主分配方法及系统
CN116774721A (zh) 多无人机博弈对抗的目标分配方法和系统
CN116255986A (zh) 一种基于决策者偏好的多无人机协同侦察航迹规划方法
CN112966741B (zh) 一种可防御拜占庭攻击的联邦学习图像分类方法
CN112612300A (zh) 多平台智能决策的多目标博弈方法及装置
CN115328189A (zh) 多无人机协同博弈决策方法和系统
CN114756049A (zh) 无人机集群对抗中的目标分配方法、系统、设备及介质
CN114167899A (zh) 一种无人机蜂群协同对抗决策方法及系统
CN111861034A (zh) 一种装备体系结构编组能力优化方法及装置
CN114625943A (zh) 一种群组关系识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant