CN110442146B - 无人机编队目标分配与空间占位联合决策方法及系统 - Google Patents

无人机编队目标分配与空间占位联合决策方法及系统 Download PDF

Info

Publication number
CN110442146B
CN110442146B CN201910662544.7A CN201910662544A CN110442146B CN 110442146 B CN110442146 B CN 110442146B CN 201910662544 A CN201910662544 A CN 201910662544A CN 110442146 B CN110442146 B CN 110442146B
Authority
CN
China
Prior art keywords
game
strategy
unmanned aerial
aerial vehicle
vehicle formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910662544.7A
Other languages
English (en)
Other versions
CN110442146A (zh
Inventor
胡笑旋
马滢滢
罗贺
王国强
雷星
靳鹏
马华伟
夏维
王菊
李晓多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910662544.7A priority Critical patent/CN110442146B/zh
Publication of CN110442146A publication Critical patent/CN110442146A/zh
Application granted granted Critical
Publication of CN110442146B publication Critical patent/CN110442146B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Pinball Game Machines (AREA)

Abstract

本申请提供了一种无人机编队目标分配与空间占位联合决策方法及系统,其中,建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决多无人机目标分配与空间占位联合决策问题,即为对抗中的某一方确定最有优势的占位策略和目标分配策略。进一步地,使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。

Description

无人机编队目标分配与空间占位联合决策方法及系统
技术领域
本申请涉及安保领域,具体涉及一种无人机编队目标分配与空间占位联合决策方法及系统。
背景技术
无人机能够在多种环境下自主的完成给定任务,有效降低人力成本。相较于有人机,无人机具有无人员伤亡、机动性强、重量较轻、成本较低等特点,已经成为现代空战武器装备的重要成员之一。由于单个无人机所携带武器和传感器数量及性能有限,其执行空战任务的能力受到相应的限制,而多个无人机进行有效协同可以更好的完成空战任务,因此,多无人机超视距协同空战决策技术已受到了越来越多的关注。
针对多无人机超视距协同空战决策问题,目前大多研究的是多无人机协同目标分配问题,类似于多机协同目标分配问题,即在满足约束的前提下,最有效的为每个飞机分配所要对抗的目标。现有技术中,多无人机协同目标分配是在双方无人机位置已知的前提下进行的。双方无人机的位置是影响无人机对目标优势的关键因素,进而会对协同目标分配的效果产生巨大的影响,因此,在协同目标分配之前决策一个有效的无人机占位策略可以进一步提高多无人机协同目标分配取得的期望优势值。而现有技术中在目标分配时并没有考虑多无人机的占位。
另外,现有技术中在求解对抗中的某一方的最有优势的博弈策略时,随着无人机数量或占位位置的增加,博弈的策略急剧增加,给求解带来了很大的难度,严重降低了求解效率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本申请提供了一种无人机编队目标分配与空间占位联合决策方法,解决了现有技术中无法为对抗中的某一方确定最有优势的博弈策略以及在最有优势的博弈策略过程中由于博弈策略数量大带来的求解效率低的技术问题。
(二)技术方案
为实现以上目的,本申请通过以下技术方案予以实现:
第一方面,本申请实施例提供了一种无人机编队目标分配与空间占位联合决策方法,包括:
基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;
遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
在一种可能的实施方式中,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合。
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一无人机编队的m个第一博弈策略对应的占位策略按如下方式进行选取:
Figure GDA0003826482150000041
其中,i∈{1,2,...,m},
Figure GDA0003826482150000042
为向上取整;
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二无人机编队的n个第二博弈策略对应的占位策略按如下方式进行选取:
Figure GDA0003826482150000051
其中,j∈{1,2,...,n}。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈集中的博弈策略对(sR,sB),计算相应的第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由如下公式计算可得:
Figure GDA0003826482150000052
其中,
Figure GDA0003826482150000053
为第一无人机编队目标分配的最大期望优势值,
Figure GDA0003826482150000054
为第二无人机编队目标分配的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;
在一种可能的实施方式中,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
Figure GDA0003826482150000055
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,
Figure GDA0003826482150000056
为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,
Figure GDA0003826482150000057
为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,
Figure GDA0003826482150000058
为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,
Figure GDA0003826482150000061
为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,生成第k次迭代时可扩展博弈的线性互补规划模型,并使用线性规划算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
第二方面,本申请实施例提供了一种无人机编队目标分配与空间占位联合决策系统,包括:
矩阵博弈模型建立模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈生成模块,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
(三)有益效果
本申请实施例提供了一种无人机编队目标分配与空间占位联合决策方法及系统。具备以下有益效果:
本申请实施例中,建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决多无人机目标分配与空间占位联合决策问题,具体地,首先确定对抗双方可能的占位策略,之后基于双方无人机的占位策略决策己方每个无人机所对抗的目标,从而使己方协同目标分配时的期望优势值尽可能的大,期望劣势尽可能的小,即为对抗中的某一方确定最有优势的占位策略和目标分配策略。进一步地,本申请使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性的示出了本申请一实施例的无人机编队目标分配与空间占位联合决策方法的流程图;
图2示意性的示出了本申请一实施例的无人机编队目标分配与空间占位联合决策系统的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提出了一种无人机编队目标分配与空间占位联合决策方法及系统,该方法或系统解决了超视距空战中多无人机目标分配与空间占位联合决策问题,具体地,对抗双方首先决策己方每个无人机的占位位置,再基于双方无人机的占位位置决策己方每个无人机对抗的目标,从而使己方占据尽可能大的优势、尽可能小的劣势。本申请通过分析双方无人机所在的位置对双方优势与劣势的影响,将该问题建模为零和矩阵博弈模型。同时,本申请使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。
下面,对本申请的无人机编队目标分配与空间占位联合决策方法进行详细说明。
本申请的无人机编队目标分配与空间占位联合决策方法将第一无人机编队和第二无人机编队的目标分配与空间占位联合决策划分为两阶段决策,首先第一无人机编队和第二无人机编队在对抗区域中进行占位决策,再基于双方的占位策略进行目标分配。具体地,如图1所示,无人机编队目标分配与空间占位联合决策方法包括如下步骤:
S110、分别确定两个无人机编队的占位策略,具体地:基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略。
本步骤中,基于第一无人机编队中的无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,具体可以利用如下步骤实现:
步骤一、获取第一无人机编队中的无人机数量和第一无人机编队的占位区域。
步骤二、将所述第一无人机编队的占位区域分割为多个第一子区域。
步骤三、基于第一无人机编队中的无人机数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域。
本步骤中,基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,具体可以如下步骤实现:
步骤一、获取第二无人机编队中的无人机数量和第二无人机编队的占位区域。
步骤二、将所述第二无人机编队的占位区域分割为多个第二子区域。
步骤三、基于第二无人机编队中的无人机数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
S120、建模零和矩阵博弈,求解零和矩阵博弈,具体地:基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
本步骤中,基于第一无人机编队中占位策略、第二无人机编队的占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
S130、生成第k次迭代时可扩展博弈的博弈矩阵,具体地:在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第一无人机编队的最优目标分配策略以及相应的最大期望优势值:
步骤一、建立第一无人机编队的目标分配模型,如公式(5)-(9):
Figure GDA0003826482150000131
Figure GDA0003826482150000132
Figure GDA0003826482150000133
Figure GDA0003826482150000134
Figure GDA0003826482150000135
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pi,j R表示无人机i相对于无人机j的优势值;
公式(5)表示第一无人机编队目标分配模型的目标函数;公式(6)表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(7)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(8)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
步骤二、对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的最优目标分配策略a*以及相应的期望优势值
Figure GDA0003826482150000136
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第二无人机编队的最优目标分配策略以及相应的最大期望优势值:
步骤一、建立第二无人机编队的目标分配模型,如公式(10)-(14):
Figure GDA0003826482150000141
Figure GDA0003826482150000142
Figure GDA0003826482150000143
Figure GDA0003826482150000144
Figure GDA0003826482150000145
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pj,i B表示无人机j相对于无人机i的优势值;
公式(10)为第二无人机编队目标分配模型的目标函数;公式(11)表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(12)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(13)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0。
步骤二、对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的最优目标分配策略以及相应的最大期望优势值,分别记为b*
Figure GDA0003826482150000146
上述步骤中在求解R的多机协同目标分配模型时,需要首先计算i对j的优势值
Figure GDA0003826482150000147
这里主要考虑超视距空战中影响优势的距离因素和高度因素。
1)距离优势函数
i相对于j的距离优势由如下距离优势函数计算得到:
Figure GDA0003826482150000151
其中
Figure GDA0003826482150000152
Figure GDA0003826482150000153
(xi,yi,zi)、(xj,yj,zj)分别为i与j在占位区域中的三维坐标,ri,j表示i与j之间的相对距离,ri min、ri max分别表示i所携带的导弹的最小和最大发射距离。
2)高度优势函数
i相对于j的高度优势由如下高度优势函数计算得到:
Figure GDA0003826482150000154
其中,hi和hj为i和j的高度,hibest为i的最佳飞行高度。
综合上述两个优势函数得到i相对于j的优势函数为:
Figure GDA0003826482150000155
其中,w1+w2=1。
由(17)可计算得到M中每个无人机对N中每个无人机的优势值,并根据MR求解得到(sR,sB)下R的最大预期优势值
Figure GDA0003826482150000156
同理可得到
Figure GDA0003826482150000157
本步骤中,计算可扩展博弈的博弈策略集中每个博弈策略对下第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由公式(3)计算可得:
Figure GDA0003826482150000161
其中,
Figure GDA0003826482150000162
为第一无人机编队的最大期望优势值,
Figure GDA0003826482150000163
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为-u(sR,sB)。
本步骤中,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合。
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一博弈策略对应的占位策略按如下方式进行选取:
Figure GDA0003826482150000164
其中,i∈{1,2,...,m},
Figure GDA0003826482150000165
为向上取整;
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二博弈策略对应的占位策略按如下方式进行选取:
Figure GDA0003826482150000166
其中,j∈{1,2,...,n}。
本步骤中,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵,包括:
遍历第k次迭代的可扩展博弈的博弈矩阵的所有的博弈策略对,并计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
Figure GDA0003826482150000171
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,
Figure GDA0003826482150000172
为第一无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第i个博弈策略,
Figure GDA0003826482150000173
为第二无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第j个博弈策略,
Figure GDA0003826482150000174
为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,
Figure GDA0003826482150000175
为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量。
S140、对可扩展博弈的博弈矩阵求解,具体地:对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
本步骤中,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
Figure GDA0003826482150000181
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,
Figure GDA0003826482150000182
为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,
Figure GDA0003826482150000183
为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,
Figure GDA0003826482150000184
为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,
Figure GDA0003826482150000185
为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,生成第k次迭代时可扩展博弈的线性互补规划模型,并使用线性规划算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
S150、确定第三博弈策略和第四博弈策略,具体地:确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
本步骤中,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
本步骤中,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
S160、从多个第一博弈策略中选取第一无人机编队执行的第一博弈策略,具体地:若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
S170、确定优占位策略和最优目标分配策略,具体地:基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
上述实施中,超视距空战中多无人机协同占位决策问题被建模为零和矩阵博弈模型,其中,R和B的占位策略作为博弈策略,R的优势与劣势的差值作为博弈策略组合下的效用值。
将上述零和矩阵博弈模型描述为G=(N,S,U),具体如下:N={R,B}为博弈的参与人;S=SR×SB为紧凑的战略行动空间,其中,SR、SB分别为R和B的可行策略集。记sR a dR(sR对应为R在第一阶段决策中的占位策略dR),sR∈SR为R的一个策略,sB a dB(sB对应为B在第一阶段决策中的占位策略dB),sB∈SB为B的一个策略,用τR、τB分别表示R和B所有可能策略的数量,则
Figure GDA0003826482150000201
其中,τR、τB分别为从CR、CB的立方体集合中选择|M|、|N|个立方体的所有可能情况数量,即
Figure GDA0003826482150000202
Figure GDA0003826482150000203
Figure GDA0003826482150000204
为博弈的效用矩阵,其中,u(sR,sB)为R在策略对(sR,sB)下的效用值,由R与B第二阶段决策优势的差值计算得到,即
Figure GDA0003826482150000205
Figure GDA0003826482150000206
Figure GDA0003826482150000207
分别为R和B协同目标分配取得的最大期望优势值。
对应于上述方法,本申请还提供了一种无人机编队目标分配与空间占位联合决策系统,如图2所示,包括:
矩阵博弈模型建立模块210,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈策略生成模块220,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块230,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块240,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块250,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块260,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块270,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块280,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
本申请实施例的方法中的每个步骤是于本申请实施例的系统在确定最优占位策略和最优目标分配策略过程中的步骤一一对应的,本申请实施例的系统在确定最优占位策略和最优目标分配策略过程中每个步骤均包含在本申请实施例的方法中,因此,对于重复的部分,这里不再进行赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (7)

1.一种无人机编队目标分配与空间占位联合决策方法,其特征在于,包括:
基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;
遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
2.根据权利要求1所述的方法,其特征在于,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合;
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一无人机编队的m个第一博弈策略对应的占位策略按如下方式进行选取:
Figure FDA0003826482140000031
其中,i∈{1,2,...,m},
Figure FDA0003826482140000032
为向上取整;
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二无人机编队的n个第二博弈策略对应的占位策略按如下方式进行选取:
Figure FDA0003826482140000033
其中,j∈{1,2,...,n}。
3.根据权利要求1所述的方法,其特征在于,基于第k次迭代时可扩展博弈策略集中的博弈策略对(sR,sB),计算相应的第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由如下公式计算可得:
Figure FDA0003826482140000041
其中,
Figure FDA0003826482140000042
为第一无人机编队目标分配的最大期望优势值,
Figure FDA0003826482140000043
为第二无人机编队目标分配的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值,sR表示第一博弈策略,sB表示第二博弈策略。
4.根据权利要求3所述的方法,其特征在于,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
Figure FDA0003826482140000044
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,
Figure FDA0003826482140000045
为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,
Figure FDA0003826482140000046
为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,
Figure FDA0003826482140000047
为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,
Figure FDA0003826482140000048
为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,从算法库中选择一种纳什均衡求解算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
5.根据权利要求1所述的方法,其特征在于,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
6.根据权利要求1所述的方法,其特征在于,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
7.一种无人机编队目标分配与空间占位联合决策系统,其特征在于,包括:
矩阵博弈模型建立模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈生成模块,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
CN201910662544.7A 2019-07-22 2019-07-22 无人机编队目标分配与空间占位联合决策方法及系统 Active CN110442146B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910662544.7A CN110442146B (zh) 2019-07-22 2019-07-22 无人机编队目标分配与空间占位联合决策方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910662544.7A CN110442146B (zh) 2019-07-22 2019-07-22 无人机编队目标分配与空间占位联合决策方法及系统

Publications (2)

Publication Number Publication Date
CN110442146A CN110442146A (zh) 2019-11-12
CN110442146B true CN110442146B (zh) 2022-10-25

Family

ID=68431039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910662544.7A Active CN110442146B (zh) 2019-07-22 2019-07-22 无人机编队目标分配与空间占位联合决策方法及系统

Country Status (1)

Country Link
CN (1) CN110442146B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612300B (zh) * 2020-11-27 2023-06-09 合肥工业大学 多平台智能决策的多目标博弈方法及装置
CN112742028B (zh) * 2021-01-22 2024-05-21 中国人民解放军国防科技大学 一种对抗博弈的编队决策方法、系统、介质及设备
CN114267168B (zh) * 2021-12-24 2023-03-21 北京航空航天大学 一种应用于城市快速路环境下的编队资源分配方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080584A2 (en) * 2006-01-11 2007-07-19 Carmel-Haifa University Economic Corp. Ltd. Uav decision and control system
CN103472850A (zh) * 2013-09-29 2013-12-25 合肥工业大学 一种基于高斯分布预测的多无人机协同搜索方法
CN104898689A (zh) * 2015-03-27 2015-09-09 合肥工业大学 一种区间信息条件下的多无人机目标分配决策方法
CN105739303A (zh) * 2015-12-29 2016-07-06 沈阳航空航天大学 基于滚动时域法的多无人机协同打击任务分配方法
CN106529674A (zh) * 2016-11-03 2017-03-22 中国人民解放军信息工程大学 多无人机协同多目标分配方法
WO2017079623A1 (en) * 2015-11-06 2017-05-11 Massachusetts Institute Of Technology Dynamic task allocation in an autonomous multi-uav mission
CN106681358A (zh) * 2017-03-03 2017-05-17 合肥工业大学 集中式无人机编队任务分配方法和装置
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN108873936A (zh) * 2018-07-09 2018-11-23 北京电子工程总体研究所 一种基于势博弈的飞行器自主编队方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN109508042A (zh) * 2019-01-30 2019-03-22 合肥工业大学 用于无人机编队智能决策的控制方法、系统及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10114384B2 (en) * 2016-09-13 2018-10-30 Arrowonics Technologies Ltd. Formation flight path coordination of unmanned aerial vehicles

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080584A2 (en) * 2006-01-11 2007-07-19 Carmel-Haifa University Economic Corp. Ltd. Uav decision and control system
CN103472850A (zh) * 2013-09-29 2013-12-25 合肥工业大学 一种基于高斯分布预测的多无人机协同搜索方法
CN104898689A (zh) * 2015-03-27 2015-09-09 合肥工业大学 一种区间信息条件下的多无人机目标分配决策方法
WO2017079623A1 (en) * 2015-11-06 2017-05-11 Massachusetts Institute Of Technology Dynamic task allocation in an autonomous multi-uav mission
CN105739303A (zh) * 2015-12-29 2016-07-06 沈阳航空航天大学 基于滚动时域法的多无人机协同打击任务分配方法
CN106529674A (zh) * 2016-11-03 2017-03-22 中国人民解放军信息工程大学 多无人机协同多目标分配方法
CN106681358A (zh) * 2017-03-03 2017-05-17 合肥工业大学 集中式无人机编队任务分配方法和装置
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN108873936A (zh) * 2018-07-09 2018-11-23 北京电子工程总体研究所 一种基于势博弈的飞行器自主编队方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN109508042A (zh) * 2019-01-30 2019-03-22 合肥工业大学 用于无人机编队智能决策的控制方法、系统及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multiple UAV Engagement Decision by Game Theory;Atilla Özpala;《International Journal of Computer Electrical Engineering》;20170630;第9卷(第1期);第384-392页 *
多无人机编队协同目标分配的两阶段求解方法;叶青松;《合肥工业大学学报(自然科学版)》;20151031;第38卷(第10期);第1431-1436页 *
无人机多机协同对抗决策研究;邵将;《信息与控制》;20180630;第47卷(第3期);第347-354页 *

Also Published As

Publication number Publication date
CN110442146A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
CN110442146B (zh) 无人机编队目标分配与空间占位联合决策方法及系统
CN110377052B (zh) 无人机编队协同目标分配的矩阵博弈方法及系统
CN107515618B (zh) 一种考虑时间窗口的异构无人机协同任务分配方法
CN108632831B (zh) 一种基于动态航迹的无人机群频谱资源分配方法
CN112329348A (zh) 一种面向非完全信息条件下军事对抗博弈的智能决策方法
CN110460600A (zh) 可抵御生成对抗网络攻击的联合深度学习方法
CN110929394A (zh) 基于超网络理论的联合作战体系建模方法以及存储介质
CN110109358B (zh) 一种基于反馈的混合多智能体协同控制方法
CN108594645B (zh) 单场站多无人机分配与飞行路线的规划方法及系统
CN113159266B (zh) 基于麻雀搜索神经网络的空战机动决策方法
CN110443473B (zh) 对抗环境下多无人机协同目标分配方法及系统
CN116225049A (zh) 一种多无人机狼群协同作战攻防决策算法
CN111797966B (zh) 一种基于改进羊群算法的多机协同全局目标分配方法
CN114417735A (zh) 一种跨区域联合作战中的多无人机协同任务规划方法
Gao et al. Multi-objective weapon target assignment based on D-NSGA-III-A
Wang et al. An efficient clonal selection algorithm to solve dynamicweapon-target assignment game model in UAV cooperative aerial combat
CN112702208B (zh) 一种基于关系的异质多层作战体系打击链路生成方法
CN113919425B (zh) 一种空中目标自主分配方法及系统
Zhou et al. Multiobjective weapon-target assignment problem by two-stage evolutionary multiobjective particle swarm optimization
Lara-Cabrera et al. A self-adaptive evolutionary approach to the evolution of aesthetic maps for a RTS game
CN115204524A (zh) 指挥决策突击方案的生成方法及电子设备
CN114861417A (zh) 基于变邻域搜索的多阶段武器目标分配方法
CN115964640A (zh) 一种改进的基于模板匹配的二次目标分群方法
CN114358127A (zh) 一种空中任务群组识别方法
CN112612300A (zh) 多平台智能决策的多目标博弈方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant