CN110442146B - 无人机编队目标分配与空间占位联合决策方法及系统 - Google Patents
无人机编队目标分配与空间占位联合决策方法及系统 Download PDFInfo
- Publication number
- CN110442146B CN110442146B CN201910662544.7A CN201910662544A CN110442146B CN 110442146 B CN110442146 B CN 110442146B CN 201910662544 A CN201910662544 A CN 201910662544A CN 110442146 B CN110442146 B CN 110442146B
- Authority
- CN
- China
- Prior art keywords
- game
- strategy
- unmanned aerial
- aerial vehicle
- vehicle formation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 419
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000011159 matrix material Substances 0.000 claims abstract description 74
- 230000008901 benefit Effects 0.000 claims abstract description 46
- 238000009826 distribution Methods 0.000 claims description 30
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000005755 formation reaction Methods 0.000 description 303
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 208000001613 Gambling Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Pinball Game Machines (AREA)
Abstract
本申请提供了一种无人机编队目标分配与空间占位联合决策方法及系统,其中,建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决多无人机目标分配与空间占位联合决策问题,即为对抗中的某一方确定最有优势的占位策略和目标分配策略。进一步地,使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。
Description
技术领域
本申请涉及安保领域,具体涉及一种无人机编队目标分配与空间占位联合决策方法及系统。
背景技术
无人机能够在多种环境下自主的完成给定任务,有效降低人力成本。相较于有人机,无人机具有无人员伤亡、机动性强、重量较轻、成本较低等特点,已经成为现代空战武器装备的重要成员之一。由于单个无人机所携带武器和传感器数量及性能有限,其执行空战任务的能力受到相应的限制,而多个无人机进行有效协同可以更好的完成空战任务,因此,多无人机超视距协同空战决策技术已受到了越来越多的关注。
针对多无人机超视距协同空战决策问题,目前大多研究的是多无人机协同目标分配问题,类似于多机协同目标分配问题,即在满足约束的前提下,最有效的为每个飞机分配所要对抗的目标。现有技术中,多无人机协同目标分配是在双方无人机位置已知的前提下进行的。双方无人机的位置是影响无人机对目标优势的关键因素,进而会对协同目标分配的效果产生巨大的影响,因此,在协同目标分配之前决策一个有效的无人机占位策略可以进一步提高多无人机协同目标分配取得的期望优势值。而现有技术中在目标分配时并没有考虑多无人机的占位。
另外,现有技术中在求解对抗中的某一方的最有优势的博弈策略时,随着无人机数量或占位位置的增加,博弈的策略急剧增加,给求解带来了很大的难度,严重降低了求解效率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本申请提供了一种无人机编队目标分配与空间占位联合决策方法,解决了现有技术中无法为对抗中的某一方确定最有优势的博弈策略以及在最有优势的博弈策略过程中由于博弈策略数量大带来的求解效率低的技术问题。
(二)技术方案
为实现以上目的,本申请通过以下技术方案予以实现:
第一方面,本申请实施例提供了一种无人机编队目标分配与空间占位联合决策方法,包括:
基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;
遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
在一种可能的实施方式中,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合。
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一无人机编队的m个第一博弈策略对应的占位策略按如下方式进行选取:
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二无人机编队的n个第二博弈策略对应的占位策略按如下方式进行选取:
其中,j∈{1,2,...,n}。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈集中的博弈策略对(sR,sB),计算相应的第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由如下公式计算可得:
在一种可能的实施方式中,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,生成第k次迭代时可扩展博弈的线性互补规划模型,并使用线性规划算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
在一种可能的实施方式中,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
第二方面,本申请实施例提供了一种无人机编队目标分配与空间占位联合决策系统,包括:
矩阵博弈模型建立模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈生成模块,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
(三)有益效果
本申请实施例提供了一种无人机编队目标分配与空间占位联合决策方法及系统。具备以下有益效果:
本申请实施例中,建立零和矩阵博弈模型,并通过求解模型的混合策略纳什均衡解来解决多无人机目标分配与空间占位联合决策问题,具体地,首先确定对抗双方可能的占位策略,之后基于双方无人机的占位策略决策己方每个无人机所对抗的目标,从而使己方协同目标分配时的期望优势值尽可能的大,期望劣势尽可能的小,即为对抗中的某一方确定最有优势的占位策略和目标分配策略。进一步地,本申请使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性的示出了本申请一实施例的无人机编队目标分配与空间占位联合决策方法的流程图;
图2示意性的示出了本申请一实施例的无人机编队目标分配与空间占位联合决策系统的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提出了一种无人机编队目标分配与空间占位联合决策方法及系统,该方法或系统解决了超视距空战中多无人机目标分配与空间占位联合决策问题,具体地,对抗双方首先决策己方每个无人机的占位位置,再基于双方无人机的占位位置决策己方每个无人机对抗的目标,从而使己方占据尽可能大的优势、尽可能小的劣势。本申请通过分析双方无人机所在的位置对双方优势与劣势的影响,将该问题建模为零和矩阵博弈模型。同时,本申请使用迭代求解的方法对零和矩阵博弈模型进行求解,首先建立可扩展博弈,求解可扩展博弈得到当前混合策略纳什均衡,求解对抗中某一方最有优势的博弈策略并更新可扩展博弈,再对可扩展博弈进行求解,直到更新后的可扩展博弈与更新前的可扩展博弈相同,该方法能够有效降低计算量,提高计算效率。
下面,对本申请的无人机编队目标分配与空间占位联合决策方法进行详细说明。
本申请的无人机编队目标分配与空间占位联合决策方法将第一无人机编队和第二无人机编队的目标分配与空间占位联合决策划分为两阶段决策,首先第一无人机编队和第二无人机编队在对抗区域中进行占位决策,再基于双方的占位策略进行目标分配。具体地,如图1所示,无人机编队目标分配与空间占位联合决策方法包括如下步骤:
S110、分别确定两个无人机编队的占位策略,具体地:基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略。
本步骤中,基于第一无人机编队中的无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,具体可以利用如下步骤实现:
步骤一、获取第一无人机编队中的无人机数量和第一无人机编队的占位区域。
步骤二、将所述第一无人机编队的占位区域分割为多个第一子区域。
步骤三、基于第一无人机编队中的无人机数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域。
本步骤中,基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,具体可以如下步骤实现:
步骤一、获取第二无人机编队中的无人机数量和第二无人机编队的占位区域。
步骤二、将所述第二无人机编队的占位区域分割为多个第二子区域。
步骤三、基于第二无人机编队中的无人机数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
S120、建模零和矩阵博弈,求解零和矩阵博弈,具体地:基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
本步骤中,基于第一无人机编队中占位策略、第二无人机编队的占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
S130、生成第k次迭代时可扩展博弈的博弈矩阵,具体地:在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第一无人机编队的最优目标分配策略以及相应的最大期望优势值:
步骤一、建立第一无人机编队的目标分配模型,如公式(5)-(9):
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pi,j R表示无人机i相对于无人机j的优势值;
公式(5)表示第一无人机编队目标分配模型的目标函数;公式(6)表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(7)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(8)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第二无人机编队的最优目标分配策略以及相应的最大期望优势值:
步骤一、建立第二无人机编队的目标分配模型,如公式(10)-(14):
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pj,i B表示无人机j相对于无人机i的优势值;
公式(10)为第二无人机编队目标分配模型的目标函数;公式(11)表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(12)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(13)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0。
1)距离优势函数
i相对于j的距离优势由如下距离优势函数计算得到:
其中
(xi,yi,zi)、(xj,yj,zj)分别为i与j在占位区域中的三维坐标,ri,j表示i与j之间的相对距离,ri min、ri max分别表示i所携带的导弹的最小和最大发射距离。
2)高度优势函数
i相对于j的高度优势由如下高度优势函数计算得到:
其中,hi和hj为i和j的高度,hibest为i的最佳飞行高度。
综合上述两个优势函数得到i相对于j的优势函数为:
其中,w1+w2=1。
本步骤中,计算可扩展博弈的博弈策略集中每个博弈策略对下第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由公式(3)计算可得:
本步骤中,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合。
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一博弈策略对应的占位策略按如下方式进行选取:
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二博弈策略对应的占位策略按如下方式进行选取:
其中,j∈{1,2,...,n}。
本步骤中,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵,包括:
遍历第k次迭代的可扩展博弈的博弈矩阵的所有的博弈策略对,并计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,为第一无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第i个博弈策略,为第二无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第j个博弈策略,为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量。
S140、对可扩展博弈的博弈矩阵求解,具体地:对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
本步骤中,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,生成第k次迭代时可扩展博弈的线性互补规划模型,并使用线性规划算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
S150、确定第三博弈策略和第四博弈策略,具体地:确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
本步骤中,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
本步骤中,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
S160、从多个第一博弈策略中选取第一无人机编队执行的第一博弈策略,具体地:若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
S170、确定优占位策略和最优目标分配策略,具体地:基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
上述实施中,超视距空战中多无人机协同占位决策问题被建模为零和矩阵博弈模型,其中,R和B的占位策略作为博弈策略,R的优势与劣势的差值作为博弈策略组合下的效用值。
将上述零和矩阵博弈模型描述为G=(N,S,U),具体如下:N={R,B}为博弈的参与人;S=SR×SB为紧凑的战略行动空间,其中,SR、SB分别为R和B的可行策略集。记sR a dR(sR对应为R在第一阶段决策中的占位策略dR),sR∈SR为R的一个策略,sB a dB(sB对应为B在第一阶段决策中的占位策略dB),sB∈SB为B的一个策略,用τR、τB分别表示R和B所有可能策略的数量,则其中,τR、τB分别为从CR、CB的立方体集合中选择|M|、|N|个立方体的所有可能情况数量,即则
对应于上述方法,本申请还提供了一种无人机编队目标分配与空间占位联合决策系统,如图2所示,包括:
矩阵博弈模型建立模块210,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈策略生成模块220,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块230,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块240,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块250,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块260,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块270,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块280,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
本申请实施例的方法中的每个步骤是于本申请实施例的系统在确定最优占位策略和最优目标分配策略过程中的步骤一一对应的,本申请实施例的系统在确定最优占位策略和最优目标分配策略过程中每个步骤均包含在本申请实施例的方法中,因此,对于重复的部分,这里不再进行赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (7)
1.一种无人机编队目标分配与空间占位联合决策方法,其特征在于,包括:
基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;
基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;
基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;
将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;
遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
确定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
2.根据权利要求1所述的方法,其特征在于,在第零次迭代时,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第零次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;包括:
使用均匀分布机制选择第一无人机编队的第一博弈策略、第二无人机编队的第二博弈策略作为第零次迭代时可扩展博弈的博弈策略集合;
获取第一无人机编队的无人机数量|M|、第一无人机编队对抗区域的划分的子区域数量g;
第一无人机编队的m个第一博弈策略对应的占位策略按如下方式进行选取:
获取第二无人机编队的无人机数量|N|、第二无人机编队对抗区域的划分的子区域数量g;
第二无人机编队的n个第二博弈策略对应的占位策略按如下方式进行选取:
其中,j∈{1,2,...,n}。
4.根据权利要求3所述的方法,其特征在于,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
遍历第k次迭代的可扩展博弈的所有的博弈策略对,并基于第一无人机编队和第二无人机编队在每个博弈策略对下的协同目标分配模型,计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(4)所示:
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,为第一无人机编队在第k次迭代时可扩展博弈的第i个博弈策略,为第二无人机编队在第k次迭代时可扩展博弈的第j个博弈策略,为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量;
基于第k次迭代时可扩展博弈的博弈矩阵,从算法库中选择一种纳什均衡求解算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
5.根据权利要求1所述的方法,其特征在于,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,得到第一无人机编队的第三博弈策略,包括:
针对矩阵博弈中每个第一博弈策略,基于第k次迭代时可扩展博弈下第二无人机编队的第二均衡混合策略,计算第一无人机编队在所述第一博弈策略下的期望支付值;
使用枚举方法找到在所有的第一博弈策略中使第一无人机编队期望支付值最大第一博弈策略,将该第一博弈策略作为第一无人机编队在第k次迭代时的第三博弈策略。
6.根据权利要求1所述的方法,其特征在于,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,得到第二无人机编队的第四博弈策略,包括:
针对矩阵博弈中每个第二博弈策略,基于第k次迭代时可扩展博弈下第一无人机编队的第一均衡混合策略,计算第二无人机编队在所述第二博弈策略下的期望支付值;
使用枚举方法找到在所有的第二博弈策略中使第二无人机编队期望支付值最大的第二博弈策略,将该第二博弈策略作为第二无人机编队在第k次迭代时的第四博弈策略。
7.一种无人机编队目标分配与空间占位联合决策系统,其特征在于,包括:
矩阵博弈模型建立模块,用于基于第一无人机编队中的无人机数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略;用于基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;用于将第一无人机编队的每个第一占位策略分别作为一个第一博弈策略,第二无人机编队的每个第二占位策略分别作为一个第二博弈策略,并将博弈策略对下的第一无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将无人机编队目标分配与空间占位联合决策建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略;
初始可扩展博弈生成模块,用于在第零次迭代时,记k=0,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时可扩展博弈的博弈策略集合;其中,m和n为正整数;遍历第k次迭代时可扩展博弈的博弈策略集合中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队的最优目标分配策略以及相应的最大期望优势值和第二无人机编队的最优目标分配策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的第k次迭代时可扩展博弈的博弈矩阵;
可扩展博弈求解模块,用于对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行第k次迭代时可扩展博弈的博弈策略集合中的每个第二博弈策略的概率;
第三博弈策略生成模块,用于定第一无人机编队对第k次迭代时第二均衡混合策略的第三博弈策略;
第四博弈策略生成模块,用于确定第二无人机编队对第k次迭代时第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于判断第一无人机编队的第三博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第一无人机编队的第三博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;判断第二无人机编队的第四博弈策略是否已存在于第k次迭代时可扩展博弈的博弈策略集合中,若不存在,则将第二无人机编队的第四博弈策略添加到第k次迭代时可扩展博弈的博弈策略集合中;
计算添加到第k次迭代时可扩展博弈的博弈策略集合中的第三博弈策略与其他第二博弈策略对对应的支付值,计算添加到第k次迭代时可扩展博弈集中的第四博弈策略与其他第一博弈策略对对应的支付值,生成第k+1次迭代时的可扩展博弈的博弈矩阵,且k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于在第k-1次迭代时第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略均存在于第k-1次迭代时可扩展博弈的博弈策略集合中时,基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定第一无人机编队目标分配与空间占位联合决策的最优占位策略和最优目标分配策略。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910662544.7A CN110442146B (zh) | 2019-07-22 | 2019-07-22 | 无人机编队目标分配与空间占位联合决策方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910662544.7A CN110442146B (zh) | 2019-07-22 | 2019-07-22 | 无人机编队目标分配与空间占位联合决策方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110442146A CN110442146A (zh) | 2019-11-12 |
CN110442146B true CN110442146B (zh) | 2022-10-25 |
Family
ID=68431039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910662544.7A Active CN110442146B (zh) | 2019-07-22 | 2019-07-22 | 无人机编队目标分配与空间占位联合决策方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110442146B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612300B (zh) * | 2020-11-27 | 2023-06-09 | 合肥工业大学 | 多平台智能决策的多目标博弈方法及装置 |
CN112742028B (zh) * | 2021-01-22 | 2024-05-21 | 中国人民解放军国防科技大学 | 一种对抗博弈的编队决策方法、系统、介质及设备 |
CN114267168B (zh) * | 2021-12-24 | 2023-03-21 | 北京航空航天大学 | 一种应用于城市快速路环境下的编队资源分配方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007080584A2 (en) * | 2006-01-11 | 2007-07-19 | Carmel-Haifa University Economic Corp. Ltd. | Uav decision and control system |
CN103472850A (zh) * | 2013-09-29 | 2013-12-25 | 合肥工业大学 | 一种基于高斯分布预测的多无人机协同搜索方法 |
CN104898689A (zh) * | 2015-03-27 | 2015-09-09 | 合肥工业大学 | 一种区间信息条件下的多无人机目标分配决策方法 |
CN105739303A (zh) * | 2015-12-29 | 2016-07-06 | 沈阳航空航天大学 | 基于滚动时域法的多无人机协同打击任务分配方法 |
CN106529674A (zh) * | 2016-11-03 | 2017-03-22 | 中国人民解放军信息工程大学 | 多无人机协同多目标分配方法 |
WO2017079623A1 (en) * | 2015-11-06 | 2017-05-11 | Massachusetts Institute Of Technology | Dynamic task allocation in an autonomous multi-uav mission |
CN106681358A (zh) * | 2017-03-03 | 2017-05-17 | 合肥工业大学 | 集中式无人机编队任务分配方法和装置 |
CN107832850A (zh) * | 2017-10-27 | 2018-03-23 | 合肥工业大学 | 对抗环境下无人机占位决策的矩阵博弈方法及装置 |
CN108873936A (zh) * | 2018-07-09 | 2018-11-23 | 北京电子工程总体研究所 | 一种基于势博弈的飞行器自主编队方法 |
CN109460056A (zh) * | 2018-11-06 | 2019-03-12 | 哈尔滨工程大学 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
CN109508042A (zh) * | 2019-01-30 | 2019-03-22 | 合肥工业大学 | 用于无人机编队智能决策的控制方法、系统及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10114384B2 (en) * | 2016-09-13 | 2018-10-30 | Arrowonics Technologies Ltd. | Formation flight path coordination of unmanned aerial vehicles |
-
2019
- 2019-07-22 CN CN201910662544.7A patent/CN110442146B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007080584A2 (en) * | 2006-01-11 | 2007-07-19 | Carmel-Haifa University Economic Corp. Ltd. | Uav decision and control system |
CN103472850A (zh) * | 2013-09-29 | 2013-12-25 | 合肥工业大学 | 一种基于高斯分布预测的多无人机协同搜索方法 |
CN104898689A (zh) * | 2015-03-27 | 2015-09-09 | 合肥工业大学 | 一种区间信息条件下的多无人机目标分配决策方法 |
WO2017079623A1 (en) * | 2015-11-06 | 2017-05-11 | Massachusetts Institute Of Technology | Dynamic task allocation in an autonomous multi-uav mission |
CN105739303A (zh) * | 2015-12-29 | 2016-07-06 | 沈阳航空航天大学 | 基于滚动时域法的多无人机协同打击任务分配方法 |
CN106529674A (zh) * | 2016-11-03 | 2017-03-22 | 中国人民解放军信息工程大学 | 多无人机协同多目标分配方法 |
CN106681358A (zh) * | 2017-03-03 | 2017-05-17 | 合肥工业大学 | 集中式无人机编队任务分配方法和装置 |
CN107832850A (zh) * | 2017-10-27 | 2018-03-23 | 合肥工业大学 | 对抗环境下无人机占位决策的矩阵博弈方法及装置 |
CN108873936A (zh) * | 2018-07-09 | 2018-11-23 | 北京电子工程总体研究所 | 一种基于势博弈的飞行器自主编队方法 |
CN109460056A (zh) * | 2018-11-06 | 2019-03-12 | 哈尔滨工程大学 | 基于量子磷虾群演化机制的无人机集群作战博弈决策方法 |
CN109508042A (zh) * | 2019-01-30 | 2019-03-22 | 合肥工业大学 | 用于无人机编队智能决策的控制方法、系统及存储介质 |
Non-Patent Citations (3)
Title |
---|
Multiple UAV Engagement Decision by Game Theory;Atilla Özpala;《International Journal of Computer Electrical Engineering》;20170630;第9卷(第1期);第384-392页 * |
多无人机编队协同目标分配的两阶段求解方法;叶青松;《合肥工业大学学报(自然科学版)》;20151031;第38卷(第10期);第1431-1436页 * |
无人机多机协同对抗决策研究;邵将;《信息与控制》;20180630;第47卷(第3期);第347-354页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110442146A (zh) | 2019-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377052B (zh) | 无人机编队协同目标分配的矩阵博弈方法及系统 | |
CN110442146B (zh) | 无人机编队目标分配与空间占位联合决策方法及系统 | |
CN107515618B (zh) | 一种考虑时间窗口的异构无人机协同任务分配方法 | |
CN108632831B (zh) | 一种基于动态航迹的无人机群频谱资源分配方法 | |
CN110460600A (zh) | 可抵御生成对抗网络攻击的联合深度学习方法 | |
CN110109358B (zh) | 一种基于反馈的混合多智能体协同控制方法 | |
CN110929394A (zh) | 基于超网络理论的联合作战体系建模方法以及存储介质 | |
CN108594645B (zh) | 单场站多无人机分配与飞行路线的规划方法及系统 | |
CN109327427A (zh) | 一种面对未知威胁的动态网络变化决策方法及其系统 | |
CN105278542A (zh) | 多无人机协同打击任务的攻防对策最优策略方法 | |
CN108548538B (zh) | 多场站多无人机任务分配与飞行路径的规划方法及系统 | |
CN110986960B (zh) | 一种基于改进聚类算法的无人机航迹规划方法 | |
CN112702208B (zh) | 一种基于关系的异质多层作战体系打击链路生成方法 | |
CN113159266B (zh) | 基于麻雀搜索神经网络的空战机动决策方法 | |
CN110443473B (zh) | 对抗环境下多无人机协同目标分配方法及系统 | |
CN112742028A (zh) | 一种对抗博弈的编队决策方法、系统、介质及设备 | |
CN116225049A (zh) | 一种多无人机狼群协同作战攻防决策算法 | |
Gao et al. | Multi-objective weapon target assignment based on D-NSGA-III-A | |
CN113625767A (zh) | 一种基于优选信息素灰狼算法的固定翼无人机集群协同路径规划方法 | |
CN108211363A (zh) | 一种信息处理方法及装置 | |
CN113919425B (zh) | 一种空中目标自主分配方法及系统 | |
CN115047906B (zh) | 基于优化粒子群算法的多无人机协同攻击移动目标任务分配方法 | |
Zhou et al. | Multiobjective weapon-target assignment problem by two-stage evolutionary multiobjective particle swarm optimization | |
Lara-Cabrera et al. | A self-adaptive evolutionary approach to the evolution of aesthetic maps for a RTS game | |
CN113095465B (zh) | 量子大马哈鱼洄游机制演化博弈的水下无人集群任务分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |