CN110443473B - 对抗环境下多无人机协同目标分配方法及系统 - Google Patents

对抗环境下多无人机协同目标分配方法及系统 Download PDF

Info

Publication number
CN110443473B
CN110443473B CN201910661663.0A CN201910661663A CN110443473B CN 110443473 B CN110443473 B CN 110443473B CN 201910661663 A CN201910661663 A CN 201910661663A CN 110443473 B CN110443473 B CN 110443473B
Authority
CN
China
Prior art keywords
strategy
formation
game
unmanned aerial
aerial vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910661663.0A
Other languages
English (en)
Other versions
CN110443473A (zh
Inventor
王国强
马滢滢
胡笑旋
罗贺
雷星
马华伟
夏维
靳鹏
张鹏
李晓多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910661663.0A priority Critical patent/CN110443473B/zh
Publication of CN110443473A publication Critical patent/CN110443473A/zh
Application granted granted Critical
Publication of CN110443473B publication Critical patent/CN110443473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种对抗环境下多无人机协同目标分配方法及系统,其中,基于对抗双方可能的占位策略和目标分配策略,决策己方每个无人机所对抗的目标,建立零和矩阵博弈模型,通过求解模型的混合策略纳什均衡解来解决对抗环境下多无人机协同目标分配问题。进一步地,对零和矩阵博弈模型进行求解时,建立可扩展博弈的博弈矩阵并求解得到当前混合策略纳什均衡,再以变占位迭代搜索的方式,求解博弈双方对对方执行可扩展矩阵博弈均衡解的第三博弈策略和第四博弈策略,并利用迭代的方法确定用于求解的对抗中的某一方确定最有优势的博弈策略的可扩展博弈的博弈矩阵,求解确定的可扩展博弈的博弈矩阵,能够有效降低计算量,提高计算效率。

Description

对抗环境下多无人机协同目标分配方法及系统
技术领域
本发明涉及安保领域,具体涉及一种对抗环境下多无人机协同目标分配方法及系统。
背景技术
无人机能够在多种环境下自主的完成给定任务,有效降低人力成本。相较于有人机,无人机具有无人员伤亡、机动性强、重量较轻、成本较低等特点,已经成为现代空战武器装备的重要成员之一。由于单个无人机所携带武器和传感器数量及性能有限,其执行空战任务的能力受到相应的限制,而多个无人机进行有效协同可以更好的完成空战任务,因此,多无人机超视距协同空战决策技术已受到了越来越多的关注。
针对多无人机超视距协同空战决策问题,目前大多研究的是多无人机协同目标分配问题,类似于多机协同目标分配问题,即在满足约束的前提下,最有效的为每个飞机分配所要对抗的目标。现有技术中,多无人机协同目标分配是在双方无人机位置已知的前提下进行的。双方无人机的位置是影响无人机对目标优势的关键因素,进而会对协同目标分配的效果产生巨大的影响,因此,在协同目标分配之前决策一个有效的无人机占位策略可以进一步提高多无人机协同目标分配取得的期望优势值。但是实际中,对抗双方在决策时无法获得对方的占位策略,双方的决策可视为同时决策,因此,现有技术中无法为对抗中的某一方确定最有优势的目标分配策略。
另外,现有技术中在求解对抗中的某一方的最有优势的博弈策略时,随着无人机数量或占位位置的增加,博弈的策略急剧增加,给求解带来了很大的难度,严重降低了求解效率。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种对抗环境下多无人机协同目标分配方法及系统,解决了现有技术中无法为对抗中的某一方确定最有优势的博弈策略以及在最有优势的博弈策略过程中由于博弈策略数量大带来的求解效率低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本申请实施例提供了一种对抗环境下多无人机协同目标分配方法,包括:
获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;
确定第一无人机编队的多个第一占位策略;确定第二无人机编队的多个第二占位策略;
确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;
基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略对与第一占位策略一一对应,第二无人机编队的博弈策略与第二占位策略一一对应;
从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k此迭代时的可扩展博弈的博弈策略集,此时k=0;其中,m和n为正整数;
生成第k次迭代时m行n列的可扩展博弈的博弈矩阵;
对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率;
从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;并基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;
从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略,并基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;
对第k次迭代时可扩展博弈进行更新,并令k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
在一种可能的实施方式中,所述基于第一无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
在一种可能的实施方式中,所述基于第二无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第二均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
在一种可能的实施方式中,所述第一无人机编队的邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合。
在一种可能的实施方式中,所述第二无人机编队邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
第二方面,本申请提供了一种对抗环境下多无人机协同目标分配系统,包括:
矩阵博弈模型建立模块,用于获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;确定第一无人机编队的多个第一占位策略;确定第二无人机编队的多个第二占位策略;确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略对应为一个占位策略,第二无人机编队的博弈策略对应为一个占位策略;
可扩展博弈生成求解模块,用于从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k此迭代时的可扩展博弈的博弈策略集,此时k=0;其中,m和n为正整数;生成第k次迭代时m行n列的可扩展博弈的博弈矩阵;对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率;
邻居占位策略集合生成模块,用于用于从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略;基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
变占位迭代搜索模块,基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;
基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于对第k次迭代时可扩展博弈进行更新,并令k=k+1;若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于所述第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
在一种可能的实施方式中,所述变占位迭代搜索模块在基于第一无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略时,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
在一种可能的实施方式中,所述变占位迭代搜索模块在基于第二无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略时,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第二均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
在一种可能的实施方式中,所述第一无人机编队的邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合;
所述第二无人机编队邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
(三)有益效果
本发明实施例提供了一种对抗环境下多无人机协同目标分配方法及系统。具备以下有益效果:
本发明实施例基于对抗双方可能的占位策略和目标分配策略,决策己方每个无人机所对抗的目标,建立零和矩阵博弈模型,通过求解模型的混合策略纳什均衡解来解决对抗环境下多无人机协同目标分配问题。进一步地,对零和矩阵博弈模型进行求解时,建立可扩展博弈的博弈矩阵并求解得到当前混合策略纳什均衡,再以变占位迭代搜索的方式,求解博弈双方对对方执行可扩展矩阵博弈均衡解的第三博弈策略和第四博弈策略,并利用迭代的方法确定用于求解的对抗中的某一方确定最有优势的博弈策略的可扩展博弈的博弈矩阵,求解确定的可扩展博弈的博弈矩阵,能够有效降低计算量,提高计算效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性的示出了本申请一实施例的对抗环境下多无人机协同目标分配方法的流程图;
图2示意性的示出了本申请一实施例的对抗环境下多无人机协同目标分配系统的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提出了一种对抗环境下多无人机协同目标分配方法及系统,该方法或系统解决了对抗环境下多无人机协同目标分配方法问题,具体地,基于对抗双方可能的占位策略和目标分配策略,决策己方每个无人机所对抗的目标,建立零和矩阵博弈模型,通过求解模型的混合策略纳什均衡解来解决对抗环境下多无人机协同目标分配问题。进一步地,对零和矩阵博弈模型进行求解时,建立可扩展博弈的博弈矩阵并求解得到当前混合策略纳什均衡,再以变占位迭代搜索的方式,求解博弈双方对对方执行可扩展矩阵博弈均衡解的第三博弈策略和第四博弈策略,并利用迭代的方法确定用于求解的对抗中的某一方确定最有优势的博弈策略的可扩展博弈的博弈矩阵,求解确定的可扩展博弈的博弈矩阵,能够有效降低计算量,提高计算效率。
下面,对本申请的对抗环境下多无人机协同目标分配方法进行详细说明。
具体地,如图1所示,对抗环境下多无人机协同目标分配方法包括如下步骤:
S110、确定对抗双方的多个占位策略,具体地:获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;基于第一无人机编队中的无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略;基于第二无人机编队中的无人机的数量和第二无人机编队的占位区域,确定第二无人机编队的多个第二占位策略。
本步骤中,基于第一无人机编队中的无人机的数量和第一无人机编队的占位区域,确定第一无人机编队的多个第一占位策略,具体可以利用如下步骤实现:
步骤一、获取第一无人机编队中的无人机的数量和第一无人机编队的占位区域。
步骤二、将所述第一无人机编队的占位区域分割为多个第一子区域。
步骤三、基于第一无人机编队中的无人机的数量和所述多个第一子区域,确定第一无人机编队的多个第一占位策略;其中所述第一占位策略包括第一无人机编队中的每个无人机所占据的第一子区域。
本步骤中,基于第二无人机编队中的无人机的数量和第二无人机编队的占位区域,确定第二无人机队的多个第二占位策略,具体可以如下步骤实现:
步骤一、获取第二无人机编队中的无人机的数量和第二无人机编队的占位区域。
步骤二、将所述第二无人机编队的占位区域分割为多个第二子区域。
步骤三、基于第二无人机编队中的无人机的数量和所述多个第二子区域,确定第二无人机编队的多个第二占位策略;其中所述第二占位策略包括第二无人机编队中的每个无人机所占据的第二子区域。
第一无人机编队R和第二无人机编队B在一个三维区域
Figure BDA0002138744680000101
中进行对抗,其中,Ω为一个由三部分组成的立方体区域,R和B分别位于Ω的两侧,
Figure BDA00021387446800001111
为R的占位区域,
Figure BDA00021387446800001112
为B的占位区域,
Figure BDA00021387446800001113
为双方的间隔区域。按空间维度将占位区域离散为大小均匀的立方体。
记R的同质无人机集合为M,B的同质无人机集合为N,ΩR离散的立方体集合为
Figure BDA0002138744680000111
ΩB离散的立方体集合为
Figure BDA0002138744680000112
R选择CR、B选择CB中的一些立方体作为己方无人机的占位位置,即占位策略。用
Figure BDA0002138744680000113
表示R的占位策略,
Figure BDA0002138744680000114
Figure BDA0002138744680000115
其中,当选择立方体
Figure BDA00021387446800001114
为R无人机的占位位置时,
Figure BDA0002138744680000116
否则,
Figure BDA0002138744680000117
决策后,M中的无人机按照其占据的立方体位置从小到大进行排序。同理,我们用
Figure BDA0002138744680000118
表示B的占位策略,
Figure BDA0002138744680000119
Figure BDA00021387446800001110
S120、基于对抗双方的占位策略,确定目标分配策略,建立博弈策略集,并基于每个博弈策略对的支付值,建立零和矩阵博弈,具体地:确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略对应为一个占位策略,第二无人机编队的博弈策略对应为一个占位策略。
进一步地,基于第一无人机编队的第一占位策略和第二无人机编队的第二占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;确定每个第一博弈策略对应的第一占位策略,得到第一无人机编队与第二无人机编队对抗时的博弈策略集,确定每个第二博弈策略对应的第二占位策略,得到第二无人机编队与第一无人机编队对抗时博弈策略集;基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,确定多个博弈策略对,并将博弈策略对下的第一无人机编队对抗第二无人机编队的最优目标分配策略对应的期望优势值减去第二无人机编队对抗第一无人机编队的最优目标分配策略对应的期望优势值作为该博弈策略对的支付值,将其建模为零和矩阵博弈;其中,博弈策略对包括一个第一博弈策略和一个第二博弈策略。
本步骤中,基于第一无人机编队中占位策略、第二无人机编队的占位策略、第一无人机编队的无人机数量和第二无人机编队的无人机数量,确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略,包括:
获取第一无人机编队中的无人机数量和第一无人机编队的第一占位策略、获取第二无人机编队中的无人机数量和第二无人机编队的第二占位策略;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第一无人机编队的多个目标分配策略;其中所述第一无人机编队的目标分配策略包括第一无人机编队中的每个无人机所对抗的第二无人机编队中的无人机;
基于第一无人机编队中的无人机数量和第一占位策略、第二无人机编队中的无人机数量和第二占位策略,确定第二无人机编队的多个目标分配策略;其中所述第二无人机编队的目标分配策略包括第二无人机编队中的每个无人机所对抗的第一无人机编队中的无人机。
S130、筛选对抗的双方的博弈策略,并基于筛选得到的博弈策略,继而生成m行n列的可扩展博弈的博弈矩阵。具体地,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k此迭代时的可扩展博弈的博弈策略集,此时k=0;其中,m和n为正整数;生成第k次迭代时m行n列的可扩展博弈的博弈矩阵。
进一步地,从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到可扩展博弈的博弈策略集;其中,m和n为正整数;遍历博弈策略集中每个博弈策略对,基于每个博弈策略对、每个博弈策略对下第一无人机编队的目标分配策略集合和每个博弈策略对下第二无人机编队的目标分配策略集合,计算第一无人机编队与第二无人机编队对抗时,第一无人机编队的第三博弈策略以及相应的最大期望优势值和第二无人机编队与第一无人机编队对抗时,第二无人机编队的第四博弈策略以及相应的最大期望优势值,并计算第一无人机编队的支付值,生成m行n列的可扩展博弈的博弈矩阵。
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第一无人机编队的最第三博弈策略以及相应的最大期望优势值:
步骤一、建立第一无人机编队的目标分配模型,如公式(1)-(5):
Figure BDA0002138744680000131
Figure BDA0002138744680000132
Figure BDA0002138744680000133
Figure BDA0002138744680000136
满足
Figure BDA0002138744680000134
则对于r≠i,ar,j=0 (4)
Figure BDA0002138744680000135
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pi,j R表示无人机i相对于无人机j的优势值;
公式(1)表示第一无人机编队目标分配模型的目标函数;公式(2)表示第一无人机编队中的每个无人机i只能对抗第二无人机编队中的一个无人机;公式(3)表示对抗无人机j的第一无人机编队的无人机数量不能大于第一预定数量Cj;公式(4)表示当无人机i相对于无人机j的优势值大于第一预定优势值SFR时,不再增加分配对抗无人机j的第一无人机编队的无人机;ai,j为二元决策变量,无人机i对抗无人机j时,ai,j取值为1,否则取值为0;
步骤二、对第一无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第一无人机编队在博弈策略对(sR,sB)下的第三博弈策略a*以及相应的期望优势值
Figure BDA0002138744680000141
本步骤中,针对任一博弈策略对,可以利用如下步骤确定该博弈策略对下第二无人机编队的第四博弈策略以及相应的最大期望优势值:
步骤一、建立第二无人机编队的目标分配模型,如公式(6)-(10):
Figure BDA0002138744680000142
Figure BDA0002138744680000143
Figure BDA0002138744680000144
Figure BDA0002138744680000147
满足
Figure BDA0002138744680000145
则对于,r≠j br,i=0 (9)
Figure BDA0002138744680000146
其中,sR表示第一博弈策略,sB表示第二博弈策略;R表示第一无人机编队,B表示第二无人机编队;M表示第一无人机编队的无人机集合,i表示M中的第i个无人机,N表示第二无人机编队的无人机集合,j表示N中的第j个无人机;pj,i B表示无人机j相对于无人机i的优势值;
公式(6)为第二无人机编队目标分配模型的目标函数;公式(7)表示第二无人机编队中的每个无人机j只能对抗第一无人机编队中的一个无人机;公式(8)表示对抗i的第二无人机编队的无人机数量不能大于第二预定数量Ci;公式(9)表示当无人机j相对于无人机i的优势值大于第二预定优势值时,不再增加分配对抗无人机i的第二无人机编队的无人机;bj,i为二元决策变量,无人机j对抗无人机i时,bj,i取值为1,否则取值为0。
步骤二、对第二无人机编队在博弈策略对(sR,sB)下的目标分配模型进行求解,得到第二无人机编队在博弈策略对(sR,sB)下的第四博弈策略以及相应的最大期望优势值,分别记为b*
Figure BDA0002138744680000151
上述步骤中在求解R的多机协同目标分配模型时,需要首先计算i对j的优势值
Figure BDA0002138744680000152
这里主要考虑超视距空战中影响优势的距离因素和高度因素。
1)距离优势函数
i相对于j的距离优势由如下距离优势函数计算得到:
Figure BDA0002138744680000153
其中
Figure BDA0002138744680000154
Figure BDA0002138744680000155
(xi,yi,zi)、(xj,yj,zj)分别为i与j在占位区域中的三维坐标,ri,j表示i与j之间的相对距离,
Figure BDA0002138744680000156
分别表示i所携带的导弹的最小和最大发射距离。
2)高度优势函数
i相对于j的高度优势由如下高度优势函数计算得到:
Figure BDA0002138744680000161
其中,hi和hj为i和j的高度,hibest为i的最佳飞行高度。
综合上述两个优势函数得到i相对于j的优势函数为:
Figure BDA0002138744680000162
其中,w1+w2=1。
由(13)可计算得到M中每个无人机对N中每个无人机的优势值,并根据MR求解得到(sR,sB)下R的最大预期优势值
Figure BDA0002138744680000163
同理可得到
Figure BDA0002138744680000164
本步骤中,计算可扩展博弈策略集中每个博弈策略对下第一无人机编队的支付值,包括:
在博弈策略对(sR,sB)下第一无人机编队的支付值由公式(15)计算可得:
Figure BDA0002138744680000165
其中,
Figure BDA0002138744680000166
为第一无人机编队的最大期望优势值,
Figure BDA0002138744680000167
为第二无人机编队的最大期望优势值,u(sR,sB)为该博弈策略对对应的第一无人机编队的支付值;第二无人机编队在(sR,sB)下的支付值为_u(sR,sB)。
本步骤中,生成可扩展博弈的博弈矩阵,包括:
遍历第k次迭代的可扩展矩阵博弈的所有的博弈策略对,并计算相应的第一无人机编队在每个博弈策略对下的支付值,生成第k次迭代的可扩展博弈的博弈矩阵,如公式(16)所示:
Figure BDA0002138744680000171
其中,Uk为第k次迭代的可扩展博弈的博弈矩阵,
Figure BDA0002138744680000172
为第一无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第i个博弈策略,
Figure BDA0002138744680000173
为第二无人机编队在第k次迭代时可扩展博弈的博弈矩阵的第j个博弈策略,
Figure BDA0002138744680000174
为第一无人机编队在第k次迭代时可扩展博弈的博弈策略数量,
Figure BDA0002138744680000175
为第二无人机编队在第k次迭代时可扩展博弈的博弈策略数量。
S140、对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率。
本步骤中,基于第k次迭代时可扩展博弈的博弈矩阵,对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解,包括:
基于第k次迭代时可扩展博弈的博弈矩阵,从算法库中选择一种纳什均衡的求解算法对其进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解。
S150、利用变占位迭代搜索,确定第一无人机编队的第三博弈策略和第二无人机编队的第四博弈策略,具体地:从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;并基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略,并基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;对第k次迭代时可扩展博弈进行更新,并令k=k+1。
本步骤中,基于第一无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
本步骤中,所述基于第二无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第二均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
本步骤中,所述第一无人机编队的邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合。
本步骤中,所述第二无人机编队邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
S160、迭代更新求解扩展博弈的博弈矩阵,若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤。
S170、筛选第一无人机编队执行的第一博弈策略,具体地:若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于第k-1次迭代时的所述第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略。
S180、基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
上述实施中,对抗环境下多无人机协同目标分配问题被建模为零和矩阵博弈模型,其中,R和B的占位策略作为博弈策略,R的优势与劣势的差值作为博弈策略组合下的效用值。
将上述零和矩阵博弈模型描述为G=(N,S,U),具体如下:N={R,B}为博弈的参与人;S=SR×SB为紧凑的战略行动空间,其中,SR、SB分别为R和B的可行策略集。记
Figure BDA00021387446800002012
(sR对应为R在第一阶段决策中的占位策略dR),sR∈SR为R的一个策略,
Figure BDA00021387446800002013
(sB对应为B在第一阶段决策中的占位策略dB),sB∈SB为B的一个策略,用τR、τB分别表示R和B所有可能策略的数量,则
Figure BDA0002138744680000201
Figure BDA0002138744680000202
其中,τR、τB分别为从CR、CB的立方体集合中选择|M|、|N|个立方体的所有可能情况数量,即
Figure BDA0002138744680000203
Figure BDA0002138744680000204
Figure BDA0002138744680000205
Figure BDA0002138744680000206
为博弈的效用矩阵,其中,u(sR,sB)为R在策略对(sR,sB)下的效用值,由R与B第二阶段决策优势的差值计算得到,即
Figure BDA0002138744680000207
Figure BDA0002138744680000208
分别为R和B协同目标分配取得的最大期望优势值。
上述U如公式(17)所示:
Figure BDA0002138744680000209
其中,U为博弈矩阵,
Figure BDA00021387446800002010
为第一无人机编队的第i个博弈策略,
Figure BDA00021387446800002011
为第二无人机编队的第j个博弈策略,τR为第一无人机编队的博弈策略数量,τB为第二无人机编队的博弈策略数量。
在第0次迭代时,使用均匀分布机制选择博弈双方的纯策略作为可扩展博弈的策略集,即|M|个无人机在g个立方体中选择第
Figure BDA0002138744680000211
Figure BDA0002138744680000212
个立方体作为无人机的占位位置。如|M|=4,g=8时,其初始占位策略为(0,1,0,1,0,1,0,1)。
在第k次迭代时,使用2-opt生成当前最优策略的邻居占位策略。2-opt变换是指
Figure BDA0002138744680000213
中有一个无人机从其占据的立方体
Figure BDA0002138744680000214
移向其他未被无人机占据的立方体
Figure BDA0002138744680000215
例如,在一个划分成4个立方体的占位区域
Figure BDA0002138744680000216
中,R方4个无人机的一个占位策略为[0,1,0,1],即2个无人机分别占据立方体2和4,通过2-opt变换来生成的这个占位策略的邻居策略集合为
Figure BDA0002138744680000217
其中,每一行代表一个输入策略的邻居策略。
对应于上述方法,本申请还提供了一种对抗环境下多无人机协同目标分配系统,如图2所示,包括:
矩阵博弈模型建立模块210,用于获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;确定第一无人机编队的多个第一占位策略;确定第二无人机编队的多个第二占位策略;确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略对应为一个占位策略,第二无人机编队的博弈策略对应为一个占位策略;
可扩展博弈生成求解模块220,用于从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k此迭代时的可扩展博弈的博弈策略集,此时k=0;其中,m和n为正整数;生成第k次迭代时m行n列的可扩展博弈的博弈矩阵;对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率;
邻居占位策略集合生成模块230,用于用于从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略;基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
变占位迭代搜索模块240,基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;
基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块250,用于对第k次迭代时可扩展博弈进行更新,并令k=k+1;若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时可扩展博弈的博弈矩阵进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块260,用于若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于所述第k-1次迭代时第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块270,用于基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
在一些实施中,所述变占位迭代搜索模块在基于第一无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略时,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
在一些实施中,所述变占位迭代搜索模块在基于第二无人机编队的当前最优策略进行变占位迭代搜索,并基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略时,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第二均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
在一些实施中,所述第一无人机编队的邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合;
所述第二无人机编队邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
本发明实施例的方法中的每个步骤是于本发明实施例的系统在确定最优占位策略以及协同目标分配策略过程中的步骤一一对应的,本发明实施例的系统在确定最优占位策略以及协同目标分配策略过程中每个步骤均包含在本发明实施例的方法中,因此,对于重复的部分,这里不再进行赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种对抗环境下多无人机协同目标分配方法,其特征在于,包括:
获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;
确定第一无人机编队的多个第一占位策略;确定第二无人机编队的多个第二占位策略;
确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;
基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略与第一占位策略一一对应,第二无人机编队的博弈策略与第二占位策略一一对应;
从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时的可扩展博弈的博弈策略集,此时k=0;其中,mn为正整数;
生成第k次迭代时mn列的可扩展博弈的博弈矩阵;
对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率;
从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;并基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;
从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略,并基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;
对第k次迭代时可扩展博弈进行更新,并令k=k+1;
若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
2.根据权利要求1所述的方法,其特征在于,所述基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
3.根据权利要求1所述的方法,其特征在于,所述基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第一均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
4.根据权利要求2所述的方法,其特征在于,所述第一无人机编队的当前邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合。
5.根据权利要求3所述的方法,其特征在于,所述第二无人机编队的当前邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
6.一种对抗环境下多无人机协同目标分配系统,其特征在于,包括:
矩阵博弈模型建立模块,用于获取第一无人机编队与第二无人机编队进行对抗时各自的占位区域;确定第一无人机编队的多个第一占位策略;确定第二无人机编队的多个第二占位策略;确定第一无人机编队的多个目标分配策略和第二无人机编队的多个目标分配策略;目标分配策略包括第一无人机编队的每个无人机对抗的第二无人机编队的无人机或第二无人机编队的每个无人机对抗的第一无人机编队的无人机;基于第一无人机编队的博弈策略集和第二无人机编队的博弈策略集,建立零和矩阵博弈模型;其中,第一无人机编队的博弈策略对应为一个占位策略,第二无人机编队的博弈策略对应为一个占位策略;
可扩展博弈生成求解模块,用于从第一无人机编队的博弈策略集中选取m个第一博弈策略、第二无人机编队的博弈策略集中选取n个第二博弈策略,得到第k次迭代时的可扩展博弈的博弈策略集,此时k=0;其中,mn为正整数;生成第k次迭代时mn列的可扩展博弈的博弈矩阵;对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时的可扩展博弈的混合策略纳什均衡解;所述混合策略纳什均衡解包括第一无人机编队对应的第一均衡混合策略和第二无人机编队对应的第二均衡混合策略;其中,所述第一均衡混合策略包括所述第一无人机编队执行可扩展博弈策略集中的每个第一博弈策略的概率,所述第二均衡混合策略包括所述第二无人机编队执行可扩展博弈策略集中的每个第二博弈策略的概率;
邻居占位策略集合生成模块,用于从第一无人机编队对应的第一均衡混合策略中筛选概率最大的第一博弈策略,将其对应的第一占位策略作为第一无人机编队的当前最优策略;基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
从第二无人机编队对应的第二均衡混合策略中筛选概率最大的第二博弈策略,将其对应的第二占位策略作为第二无人机编队的当前最优策略;基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
变占位迭代搜索模块,基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略;
基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略;
可扩展博弈更新模块,用于对第k次迭代时可扩展博弈进行更新,并令k=k+1;若第k-1次迭代时第一无人机编队的第三博弈策略或/和第二无人机编队的第四博弈策略不存在于第k-1次迭代时可扩展博弈的策略集中,则,返回所述对第k次迭代时的可扩展博弈进行求解,得到第k次迭代时可扩展博弈的混合策略纳什均衡解的步骤;
策略筛选模块,用于若第k-1次迭代时第一无人机编队的最优策略和第二无人机编队的最优策略均存在于第k-1次迭代时可扩展博弈策略集中,则基于第k-1次迭代时的第一均衡混合策略,按照博弈策略的概率从第k-1次迭代时可扩展博弈的多个第一博弈策略中选取第一无人机编队执行的第一博弈策略;
目标策略确定模块,用于基于第一无人机编队执行的博弈策略,确定对抗环境下第一无人机编队的最优占位策略以及协同目标分配策略。
7.根据权利要求6所述的系统,其特征在于,所述变占位迭代搜索模块在基于第一无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第一无人机编队对第二均衡混合策略的第三博弈策略时,包括:
基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合;
计算第二无人机编队执行第k次迭代时的第二均衡混合策略,第一无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成第一无人机编队的当前邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第一无人机编队对第二均衡混合策略的第三博弈策略。
8.根据权利要求6所述的系统,其特征在于,所述变占位迭代搜索模块在基于第二无人机编队的当前最优策略进行变占位迭代搜索,再基于变占位迭代搜索得到的最优策略,确定第二无人机编队对第一均衡混合策略的第四博弈策略时,包括:
基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合;
计算第一无人机编队执行第k次迭代时的第一均衡混合策略,第二无人机编队执行所述邻居占位策略集合中的每一个策略时的支付值,并找到支付值最大的邻居占位策略;
判断支付值最大的邻居占位策略是否是当前最优策略,若不是,则将该邻居占位策略作为新的当前最优策略,并返回所述基于当前最优策略,生成第二无人机编队的当前邻居占位策略集合的步骤;若是,则将当前最优策略对应的博弈策略作为第k次迭代时第二无人机编队对第一均衡混合策略的第四博弈策略。
9.根据权利要求6所述的系统,其特征在于,所述第一无人机编队的邻居占位策略集合包括第一无人机编队的当前最优策略中有一个无人机从它所占的第一子区域移向其他未被占据的第一子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第一无人机编队当前最优策略的邻居占位策略集合;
所述第二无人机编队邻居占位策略集合包括第二无人机编队的当前最优策略中有一个无人机从它所占的第二子区域移向其他未被占据的第二子区域生成的新的占位策略,所有生成的新的占位策略以及当前最优策略形成第二无人机编队当前最优策略的邻居占位策略集合。
CN201910661663.0A 2019-07-22 2019-07-22 对抗环境下多无人机协同目标分配方法及系统 Active CN110443473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910661663.0A CN110443473B (zh) 2019-07-22 2019-07-22 对抗环境下多无人机协同目标分配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910661663.0A CN110443473B (zh) 2019-07-22 2019-07-22 对抗环境下多无人机协同目标分配方法及系统

Publications (2)

Publication Number Publication Date
CN110443473A CN110443473A (zh) 2019-11-12
CN110443473B true CN110443473B (zh) 2021-10-26

Family

ID=68431056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910661663.0A Active CN110443473B (zh) 2019-07-22 2019-07-22 对抗环境下多无人机协同目标分配方法及系统

Country Status (1)

Country Link
CN (1) CN110443473B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612300B (zh) * 2020-11-27 2023-06-09 合肥工业大学 多平台智能决策的多目标博弈方法及装置
CN114548409B (zh) * 2022-01-30 2023-01-10 清华大学 基于态势场的无人车任务分配博弈方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN109508042A (zh) * 2019-01-30 2019-03-22 合肥工业大学 用于无人机编队智能决策的控制方法、系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN107832850A (zh) * 2017-10-27 2018-03-23 合肥工业大学 对抗环境下无人机占位决策的矩阵博弈方法及装置
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN109508042A (zh) * 2019-01-30 2019-03-22 合肥工业大学 用于无人机编队智能决策的控制方法、系统及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An Efficient Clonal Selection Algorithm to Solve DynamicWeapon-target Assignment Game Model in UAV Cooperative Aerial Combat;WANG Yu.etc;《Proceedings of the 35th Chinese Control Conference》;20160729;全文 *
多无人机协同目标分配仿真系统设计与实现;罗贺,等;《系统仿真学报》;20090630;第21卷(第11期);全文 *

Also Published As

Publication number Publication date
CN110443473A (zh) 2019-11-12

Similar Documents

Publication Publication Date Title
CN110377052B (zh) 无人机编队协同目标分配的矩阵博弈方法及系统
CN108632831B (zh) 一种基于动态航迹的无人机群频谱资源分配方法
CN110442146B (zh) 无人机编队目标分配与空间占位联合决策方法及系统
CN110443473B (zh) 对抗环境下多无人机协同目标分配方法及系统
CN107515618B (zh) 一种考虑时间窗口的异构无人机协同任务分配方法
Alighanbari et al. Cooperative task assignment of unmanned aerial vehicles in adversarial environments
CN108594645B (zh) 单场站多无人机分配与飞行路线的规划方法及系统
CN116307535B (zh) 一种基于改进差分进化算法的多星协作成像任务规划方法
CN108548538B (zh) 多场站多无人机任务分配与飞行路径的规划方法及系统
CN110986960B (zh) 一种基于改进聚类算法的无人机航迹规划方法
CN107330560A (zh) 一种考虑时序约束的异构飞行器多任务协同分配方法
CN106779210A (zh) 基于蚁群算法的火力分配方法
CN112560332A (zh) 一种基于全局态势信息的航空兵体系智能行为建模方法
CN112702208A (zh) 一种基于关系的异质多层作战体系打击链路生成方法
Mozaffari et al. Frl: Federated rank learning
CN116088586A (zh) 一种无人机作战过程中的临机任务规划的方法
CN113919425B (zh) 一种空中目标自主分配方法及系统
Purmonen Predicting game level difficulty using deep neural networks
CN109993338B (zh) 一种链路预测方法及装置
CN115204524A (zh) 指挥决策突击方案的生成方法及电子设备
Zhao et al. Shuffled frog leaping algorithm with non-dominated sorting for dynamic weapon-target assignment
CN115964640A (zh) 一种改进的基于模板匹配的二次目标分群方法
CN111861034A (zh) 一种装备体系结构编组能力优化方法及装置
CN109523838B (zh) 基于演化博弈的异质化协同飞行冲突解决方法
CN111082983A (zh) 一种网络模拟演化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant