CN112612298A - 对抗环境下多无人机战术决策的多目标博弈方法及装置 - Google Patents

对抗环境下多无人机战术决策的多目标博弈方法及装置 Download PDF

Info

Publication number
CN112612298A
CN112612298A CN202011362555.2A CN202011362555A CN112612298A CN 112612298 A CN112612298 A CN 112612298A CN 202011362555 A CN202011362555 A CN 202011362555A CN 112612298 A CN112612298 A CN 112612298A
Authority
CN
China
Prior art keywords
advantage
situation
sub
matrix
constructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011362555.2A
Other languages
English (en)
Other versions
CN112612298B (zh
Inventor
罗贺
蒋儒浩
王国强
陈宇轩
马滢滢
胡笑旋
唐奕城
靳鹏
马华伟
夏维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202011362555.2A priority Critical patent/CN112612298B/zh
Publication of CN112612298A publication Critical patent/CN112612298A/zh
Application granted granted Critical
Publication of CN112612298B publication Critical patent/CN112612298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种对抗环境下多无人机战术决策的多目标博弈方法及装置,涉及战术决策技术领域。本发明将相对态势优势进行多目标表征(即把态势优势分解为多个子态势优势),相比于传统的评价方法将多个子态势优势聚合为一个综合态势优势处理,本发明把四个子态势优势分别考虑为四个子优化目标,并据此设计支付函数,构建高维矩阵,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形。

Description

对抗环境下多无人机战术决策的多目标博弈方法及装置
技术领域
本发明涉及战术决策技术领域,具体涉及一种对抗环境下多无人机战术决策的多目标博弈方法及装置。
背景技术
在进行多无人机的战术决策时,构建态势优势矩阵是整个战术决策中重要的一步,会影响到后面的支付函数设计,进而影响战术决策的效果。
传统的态势优势计算方法是把我方无人机和敌方无人机之间的速度优势、高度优势、角度优势和距离优势线性加权求和得到。
但在构建态势优势矩阵的过程中,空间态势优势不确定性存在两个方面的影响因素。一方面,是风险偏好和安全偏好对空间态势优势的影响;另一方面,是双机协同对态势优势的影响。采用传统态势优势计算方法很难反映风险偏好和安全偏好对态势优势建模的影响,难以处理态势优势的不确定性,另外通过线性加权求和会产生一定的数据损失,对有效数据的利用也不够充分。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种对抗环境下多无人机战术决策的多目标博弈方法及装置,解决了战术决策过程中,风险偏好和安全偏好对态势优势建模的影响。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种对抗环境多无人机战术决策的多目标博弈方法,该方法包括:
获取对抗双方的可选策略对集合;
基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重;
基于空间态势优势的影响因素,构建优化目标对应的子优化目标;
基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵;
基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵;
基于空间态势优势矩阵,构建各个优化目标的支付函数;
基于支付函数,分别构建对抗双方用于评估所选策略对的高维矩阵;
基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
进一步的,获取对抗双方的可选策略对集合,包括:
S101、获取对抗双方的可选策略,并基于双方的无人机数量,获取可选目标分配方案;
S102、计算对抗双方各自所有的可选策略-可选目标分配方案组合,每个可选策略-可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间;
S103、基于对抗双方的策略空间,获取对抗双方所有策略的组合,构建策略对集合。
进一步的,所述基于空间态势优势的影响因素,构建优化目标对应的子优化目标,包括:
将空间态势优势划分为高度优势、速度优势、角度优势、距离优势这四个子态势优势,每个优化目标均拆分为与四个子态势优势一一对应的子优化目标。
进一步的,所述基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵,包括如下步骤:
S401、获取四个子优化目标的权重;
S402、基于对抗双方的状态信息,分别构建对抗双方的四个子态势优势矩阵,组合得到对抗双方的相对态势优势矩阵;
所述状态信息包括:三维坐标,速度矢量、俯仰角、航偏角、滚转角。
进一步的,所述基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵,包括:
基于证据理论融合算子,将相对态势优势转变为整体的态势优势矩阵,作为空间态势优势矩阵。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于速度优势和高度优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000031
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000032
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000033
敌方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000034
其中,
Figure BDA0002804416840000035
表示我方安全偏好对应的的支付函数,
Figure BDA0002804416840000036
表示对抗双方策略对分别为p和q时的子态势优势,K为归一化系数,使矩阵中所有的元素均为正数。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于角度优势和距离优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000041
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000042
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000043
敌方安全偏好对应构建的支付函数:
Figure BDA0002804416840000044
在我方无人机数量为一,敌方无人机数量为二时,我方的高维矩阵为:
Figure BDA0002804416840000045
敌方的高维矩阵为:
Figure BDA0002804416840000051
其中,B1~B4和R1~R4均分别对应速度优势、高度优势、角度优势、距离优势,
Figure BDA0002804416840000052
表示对抗双方策略对分别为p和q时的我方无人机1相对敌方无人机2的速度优势对应的子态势优势。
第二方面,提供了一种对抗环境下多无人机战术决策的多目标博弈装置,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执如下方法:
获取对抗双方的可选策略对集合;
基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重;
基于空间态势优势的影响因素,构建优化目标对应的子优化目标;
基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵;
基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵;
基于空间态势优势矩阵,构建各个优化目标的支付函数;
基于支付函数,分别构建对抗双方用于评估所选策略对的高维矩阵;
基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
进一步的,获取对抗双方的可选策略对集合,包括:
S101、获取对抗双方的可选策略,并基于双方的无人机数量,获取可选目标分配方案;
S102、计算对抗双方各自所有的可选策略-可选目标分配方案组合,每个可选策略-可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间;
S103、基于对抗双方的策略空间,获取对抗双方所有策略的组合,构建策略对集合。
进一步的,所述基于空间态势优势的影响因素,构建优化目标对应的子优化目标,包括:
将空间态势优势划分为高度优势、速度优势、角度优势、距离优势这四个子态势优势,每个优化目标均拆分为与四个子态势优势一一对应的子优化目标。
进一步的,所述基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵,包括如下步骤:
S401、获取四个子优化目标的权重;
S402、基于对抗双方的状态信息,分别构建对抗双方的四个子态势优势矩阵,组合得到对抗双方的相对态势优势矩阵;
所述状态信息包括:三维坐标,速度矢量、俯仰角、航偏角、滚转角。
进一步的,所述基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵,包括:
基于证据理论融合算子,将相对态势优势转变为整体的态势优势矩阵,作为空间态势优势矩阵。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于速度优势和高度优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000071
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000072
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000073
敌方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000074
其中,
Figure BDA0002804416840000075
表示我方安全偏好对应的的支付函数,
Figure BDA0002804416840000076
表示对抗双方策略对分别为p和q时的子态势优势,K为归一化系数,使矩阵中所有的元素均为正数。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于角度优势和距离优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000077
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000078
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000079
敌方安全偏好对应构建的支付函数:
Figure BDA0002804416840000081
在我方无人机数量为一,敌方无人机数量为二时,
我方的高维矩阵为:
Figure BDA0002804416840000082
敌方的高维矩阵为:
Figure BDA0002804416840000083
其中,B1~B4和R1~R4均分别对应速度优势、高度优势、角度优势、距离优势,
Figure BDA0002804416840000084
表示对抗双方策略对分别为p和q时的我方无人机1相对敌方无人机2的速度优势对应的子态势优势。
(三)有益效果
本发明提供了一种对抗环境下多无人机战术决策的多目标博弈方法及装置。与现有技术相比,具备以下有益效果:
本发明将相对态势优势进行多目标表征(即把态势优势分解为多个子态势优势),相比于传统的评价方法将多个子态势优势聚合为一个综合态势优势处理,本发明把四个子态势优势分别考虑为四个子优化目标,并据此设计支付函数,构建高维矩阵,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种对抗环境下多无人机战术决策的多目标博弈方法及装置,解决了战术决策过程中,风险偏好和安全偏好对态势优势建模的影响,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
把多个子态势优势分别考虑为多个子优化目标,并据此设计支付函数,构建高维矩阵,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例1:
如图1所示,本发明提供了一种对抗环境多无人机战术决策的多目标博弈方法,该方法由计算机执行,该方法包括:
获取对抗双方的可选策略对集合;
基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重;
基于空间态势优势的影响因素,构建优化目标对应的子优化目标;
基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵;
基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵;
基于空间态势优势矩阵,构建各个优化目标的支付函数;
基于支付函数,分别构建对抗双方用于评估所选策略对的高维矩阵;
基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
本实施例的有益效果为:
本发明实施例提供了一种相对态势优势的多目标表示方法(把态势优势分解为多个子态势优势),相比于传统的评价方法将多个子态势优势聚合为一个综合态势优势处理,本发明实施例把多个子态势优势分别考虑为多个子优化目标,并据此设计支付函数,构建高维矩阵,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形。
下面对本发明实施例的实现过程进行详细说明:
S1、获取对抗双方的可选策略对集合;
为了使战术决策和目标分配方案配合度更高,可将目标分配方案融入战术决策的过程中:
S101、获取对抗双方的可选策略,并基于双方的无人机数量,获取可选目标分配方案;
S102、计算对抗双方各自所有的可选策略-可选目标分配方案组合,每个可选策略-可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间;我方的策略空间记为X={x1,...,xi,...,xm},敌方的策略空间记为Y={y1,...,yj,…,yn}。
S103、基于对抗双方的策略空间,获取对抗双方所有策略的组合,构建策略对集合。
举例说明:我方为红方记为R,敌方为蓝方记为B。
例如,我方可选策略有4个,例如进攻型、攻守兼备型、佯攻型和逃跑型等,无人机数量1v2的场景下,目标分配方案为2个,则我方的策略空间可表示为:X={x1,x2,…,x10},其中,我方的策略-目标分配方案组合的数量m=10;敌方的策略有3个,目标分配方案只有1个,则敌方的策略空间可表示为:Y={y1,y2,y3},其中,敌方的策略-目标分配方案组合的数量n=3。则策略对集合可表示为O=X×Y,共具有30种策略对。每个策略对为对抗双方的策略组合,记为(xi,yj)。
S2、基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重。
战术决策的多目标考量因素是战术偏好的集中体现,战术偏好主要包括无人机效能偏好、风险偏好、安全偏好、其他偏好等,其中风险偏好和安全偏好是最重要的考量因素;而往往安全偏好和风险偏好的权重并不一致,因此,安全偏好和风险偏好分别对应一个优化目标。
S3、基于空间态势优势的影响因素,构建优化目标对应的子优化目标。
空间态势优势是风险偏好和安全偏好的具体体现,而对抗双方的空间态势优势的影响因素包括高度优势、速度优势、角度优势、距离优势,考虑这些影响因素,将空间态势优势划分为高度优势、速度优势、角度优势、距离优势这四个子态势优势,每个优化目标均拆分为与四个子态势优势一一对应的子优化目标。
S4、基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵。
S401、人工设定对四个子优化目标的权重β1、β2、β3、β4依次赋值,可依据经验设定;态势优势矩阵的权重=偏好权重*子优化目标。
S402、基于对抗双方的状态信息,分别构建对抗双方的四个子态势优势矩阵,组合得到对抗双方的相对态势优势矩阵。
举例说明,设
Figure BDA0002804416840000121
表示我方无人机i当前的状态信息,其中
Figure BDA0002804416840000122
表示我方无人机i的三维坐标,
Figure BDA0002804416840000123
表示速度矢量,
Figure BDA0002804416840000124
分别表示俯仰角、航偏角、滚转角,
Figure BDA0002804416840000125
表示敌方无人机j当前的状态信息,同理
Figure BDA0002804416840000126
表示敌方无人机j的三维坐标,
Figure BDA0002804416840000127
表示速度矢量,
Figure BDA0002804416840000128
分别表示俯仰角、航偏角、滚转角。
举例说明,为表示方便,我方四种子态势优势矩阵分别采用数字角标表示,即:
速度优势矩阵:
Figure BDA0002804416840000129
高度优势矩阵:
Figure BDA00028044168400001210
角度优势矩阵:
Figure BDA00028044168400001211
距离优势矩阵:
Figure BDA00028044168400001212
以速度优势为例,其中,
Figure BDA00028044168400001213
表示我方所选策略对为(xp,yq)时,我方无人机i相对于敌方无人机j的第一个子优化目标对应的子态势优势;
Figure BDA00028044168400001214
表示我方所选策略对为(xp,yq)时,我方无人机i相对于敌方无人机j的第一个子优化目标对应的子态势优势矩阵;
分别构建四组我方无人机i相对于敌方无人机j的相对态势优势矩阵,由四个子态势优势矩阵组成:
Figure BDA0002804416840000131
Figure BDA0002804416840000132
Figure BDA0002804416840000133
Figure BDA0002804416840000134
同样的,敌方四种子态势优势矩阵分别表示为
Figure BDA0002804416840000135
Figure BDA0002804416840000136
分别构建四组敌方无人机j相对于我方无人机i的相对态势优势矩阵:
Figure BDA0002804416840000137
Figure BDA0002804416840000138
Figure BDA0002804416840000139
Figure BDA0002804416840000141
S5、基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵。
双机协同对态势优势的综合评估也会带来影响,需要计算对抗双方整体的态势优势才能构建完整的空间态势优势矩阵。
为了消除对抗双方多个无人机协同下态势优势的不确定性,采用证据理论分别从四个子态势优势方面进行融合,通过该方法计算得到单-多对抗战术决策下双方整体的四个方面的空间态势优势矩阵。
根据已知的无人机识别框架和基本可信数,由D-S证据理论的规则实现敌方多无人机协同对抗态势优势值的定量分析,把单无人机对单无人机的相对态势优势转变为敌方对我方整体的态势优势矩阵,即空间态势优势矩阵。
举例说明:以我方一对二情形为例:
敌方对我方整体的态势优势矩阵为:
Figure BDA0002804416840000142
其中
Figure BDA0002804416840000143
为证据理论融合算子,n为敌方无人机总数量。
据此,构建我方目标分配方案下的空间态势优势矩阵:
Figure BDA0002804416840000144
Figure BDA0002804416840000151
Figure BDA0002804416840000152
Figure BDA0002804416840000153
构建敌方目标分配方案下的空间态势优势矩阵:
Figure BDA0002804416840000154
Figure BDA0002804416840000155
Figure BDA0002804416840000161
Figure BDA0002804416840000162
S6、基于空间态势优势矩阵,构建各个优化目标的支付函数;
采用无人机的空间态势优势矩阵反应风险偏好和安全偏好,风险偏好与安全偏好存在一定的矛盾性,大多数情况下如果己方风险越大则己方安全性越低。
从风险偏好角度考虑的支付函数的数量和从安全偏好角度考虑的支付函数的数量各为四个,均采用四个子态势优势矩阵分别设计支付函数。风险偏好和安全偏好的支付函数的构建方式均为两种。
举例说明:以我方一对二情形为例:下面以速度优势为例作具体说明,高度优势、角度优势、距离优势的支付函数构建以此类推。
①基于风险偏好的支付函数设计方法
第一种支付函数构建方法:
我方:
Figure BDA0002804416840000163
敌方:
Figure BDA0002804416840000164
第二种支付函数构建方法:
我方:
Figure BDA0002804416840000165
敌方:
Figure BDA0002804416840000171
②基于安全偏好的支付函数设计方法
第一种支付函数构建方法:
我方:
Figure BDA0002804416840000172
敌方:
Figure BDA0002804416840000173
第二种支付函数构建方法:
我方:
Figure BDA0002804416840000174
敌方:
Figure BDA0002804416840000175
风险偏好支付函数和安全偏好支付函数之间存在一定的矛盾关系,组合方式共有四种,组合分析如下:
①第一种组合方式
我方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000176
Figure BDA0002804416840000177
敌方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000178
Figure BDA0002804416840000179
针对我方支付函数的组合,直接采用我方相对于敌方的空间态势优势作为我方风险偏好的衡量,我方相对于敌方的态势优势越大则风险越大、攻击性越强、命中目标的概率越大,但是根据态势优势计算公式敌方相对于我方的攻击性也越大。我方的安全偏好用敌方对我方的态势优势的相反数计算,敌方对我方的态势优势越小则我方的安全性越高。敌方支付函数构建原理同上。这种构建方法清晰明了,计算简单,但是没有考虑双方空间态势优势的相对变化,所以在我方决策时对敌方策略评估不足。(其中K为归一化系数,使矩阵中所有的元素均为正数,K取值一般为空间态势优势矩阵中最大的元素加1)
②第二种组合方式
我方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000181
Figure BDA0002804416840000182
敌方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000183
Figure BDA0002804416840000184
针对我方支付函数的组合,采用我方相对于敌方的空间态势优势与敌方对我方的空间态势优势的比值作为我方风险偏好的衡量;采用敌方对我方的空间态势优势的相反数与我方对敌方的空间态势优势的相反数的比值作为我方的安全偏好的衡量。敌方支付函数构建原理同上。这种构建方法充分考虑双方空间态势优势的相对变化,在我方决策时均以敌方策略评估作为举出,但是采用这种方法不但计算复杂,而且两个目标间的相关程度高,多个优化目标间冲突性表现不强。
③第三种组合方式
我方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000185
Figure BDA0002804416840000186
敌方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000191
Figure BDA0002804416840000192
针对我方的支付函数组合,采用我方相对于敌方的空间态势优势与敌方对我方的空间态势优势的比值作为我方风险偏好的衡量;直接采用敌方对我方的态势优势的相反数作为我方的安全偏好的衡量。敌方支付函数构建原理同上。这种构建方法不但考虑双方空间态势优势的相对变化,而且计算简单、两个目标间的冲突性表现较强,一般情况下这种组合方式适用于对风险偏好要求较高的场景。
④第四种组合方式
我方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000193
Figure BDA0002804416840000194
敌方风险偏好支付函数和安全偏好支付函数组合为:
Figure BDA0002804416840000195
Figure BDA0002804416840000196
针对我方支付函数的组合,直接采用我方相对于敌方的空间态势优势作为我方风险偏好的衡量;采用敌方对我方的空间态势优势的相反数与我方对敌方的空间态势优势的相反数的比值作为我方的安全偏好的衡量。敌方支付函数构建原理同上。这种构建方法计算比较简单,着重强调安全偏好的相对性,一般情况下这种组合方式适用于对安全偏好要求较高的场景。
S6、基于各优化目标的支付函数,构建用于评估对抗双方策略的高维矩阵;
高维矩阵表现形式如下:
Figure BDA0002804416840000201
Figure BDA0002804416840000202
以我方一对二情形为例,在衡量风险偏好和安全偏好方面,对于速度优势和高度优势的子优化目标采用第一种支付函数组合方法;对于角度优势和距离优势的子优化目标采用第三种支付函数组合方法。则,高维矩阵具体为:
我方的高维矩阵为:
Figure BDA0002804416840000203
敌方的高维矩阵为:
Figure BDA0002804416840000204
S8、基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
实施例2
本发明还提供了一种对抗环境下多无人机战术决策的多目标博弈装置,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如下方法:
获取对抗双方的可选策略对集合;
基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重;
基于空间态势优势的影响因素,构建优化目标对应的子优化目标;
基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵;
基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵;
基于空间态势优势矩阵,构建各个优化目标的支付函数;
基于支付函数,分别构建对抗双方用于评估所选策略对的高维矩阵;
基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
进一步的,获取对抗双方的可选策略对集合,包括:
S101、获取对抗双方的可选策略,并基于双方的无人机数量,获取可选目标分配方案;
S102、计算对抗双方各自所有的可选策略-可选目标分配方案组合,每个可选策略-可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间;
S103、基于对抗双方的策略空间,获取对抗双方所有策略的组合,构建策略对集合。
进一步的,所述基于空间态势优势的影响因素,构建优化目标对应的子优化目标,包括:
将空间态势优势划分为高度优势、速度优势、角度优势、距离优势这四个子态势优势,每个优化目标均拆分为与四个子态势优势一一对应的子优化目标。
进一步的,所述基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵,包括如下步骤:
S401、获取四个子优化目标的权重;
S402、基于对抗双方的状态信息,分别构建对抗双方的四个子态势优势矩阵,组合得到对抗双方的相对态势优势矩阵;
所述状态信息包括:三维坐标,速度矢量、俯仰角、航偏角、滚转角。
进一步的,所述基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵,包括:
基于证据理论融合算子,将相对态势优势转变为整体的态势优势矩阵,作为空间态势优势矩阵。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于速度优势和高度优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000221
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000222
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000223
敌方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000231
其中,
Figure BDA0002804416840000232
表示我方安全偏好对应的的支付函数,
Figure BDA0002804416840000233
表示对抗双方策略对分别为p和q时的子态势优势,K为归一化系数,使矩阵中所有的元素均为正数。
进一步的,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于角度优势和距离优势:
我方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000234
我方安全偏好对应构建的支付函数为:
Figure BDA0002804416840000235
敌方风险偏好对应构建的支付函数为:
Figure BDA0002804416840000236
敌方安全偏好对应构建的支付函数:
Figure BDA0002804416840000237
在我方无人机数量为一,敌方无人机数量为二时,
我方的高维矩阵为:
Figure BDA0002804416840000241
敌方的高维矩阵为:
Figure BDA0002804416840000242
其中,B1~B4和R1~R4均分别对应速度优势、高度优势、角度优势、距离优势,
Figure BDA0002804416840000243
表示对抗双方策略对分别为p和q时的我方无人机1相对敌方无人机2的速度优势对应的子态势优势。
可理解的是,本发明实施例提供的对抗环境下多无人机战术决策的多目标博弈装置与上述对抗环境多无人机战术决策的多目标博弈方法相对应,其有关内容的解释、举例、有益效果等部分可以参考对抗环境多无人机战术决策的多目标博弈方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,本发明具备以下有益效果:
①本发明将相对态势优势进行多目标表征(即把态势优势分解为多个子态势优势),相比于传统的评价方法将多个子态势优势聚合为一个综合态势优势处理,本发明把四个子态势优势分别考虑为四个子优化目标,并据此设计支付函数,构建高维矩阵,全面反映态势优势中各个子态势优势的信息。使客观评价更加准确,且不会出现信息缺失的情形。
②把态势优势考虑为风险偏好和安全偏好两个大目标,然后把两个大目标分别按照四个子态势优势分解为四个子目标。采用把子态势优势构建成细粒度子矩阵,融入到高维矩阵的构建中。把子态势优势按照权重分配,分别转换为对应高维矩阵中对应的权重,很好的解决了态势优势的不确定性的问题。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,该方法包括:
获取对抗双方的可选策略对集合;
基于对抗双方的安全偏好和风险偏好构建对应的优化目标,并设定各个偏好的权重;
基于空间态势优势的影响因素,构建优化目标对应的子优化目标;
基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵;
基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵;
基于空间态势优势矩阵,构建各个优化目标的支付函数;
基于支付函数,分别构建对抗双方用于评估所选策略对的高维矩阵;
基于对抗双方的高维矩阵,利用帕累托纳什均衡求解算法,输出纳什均衡解。
2.如权利要求1所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,获取对抗双方的可选策略对集合,包括:
S101、获取对抗双方的可选策略,并基于双方的无人机数量,获取可选目标分配方案;
S102、计算对抗双方各自所有的可选策略-可选目标分配方案组合,每个可选策略-可选目标分配方案组合作为一个策略,得到对抗双方各自的策略空间;
S103、基于对抗双方的策略空间,获取对抗双方所有策略的组合,构建策略对集合。
3.如权利要求1所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,所述基于空间态势优势的影响因素,构建优化目标对应的子优化目标,包括:
将空间态势优势划分为高度优势、速度优势、角度优势、距离优势这四个子态势优势,每个优化目标均拆分为与四个子态势优势一一对应的子优化目标。
4.如权利要求3所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,所述基于子优化目标,构建子优化目标对应的子态势优势矩阵,得到对抗双方的相对态势优势矩阵,包括如下步骤:
S401、获取四个子优化目标的权重;
S402、基于对抗双方的状态信息,分别构建对抗双方的四个子态势优势矩阵,组合得到对抗双方的相对态势优势矩阵;
所述状态信息包括:三维坐标,速度矢量、俯仰角、航偏角、滚转角。
5.如权利要求4所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,所述基于相对态势优势矩阵,构建对抗双方的空间态势优势矩阵,包括:
基于证据理论融合算子,将相对态势优势转变为整体的态势优势矩阵,作为空间态势优势矩阵。
6.如权利要求5所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于速度优势和高度优势:
我方风险偏好对应构建的支付函数为:
Figure FDA0002804416830000021
我方安全偏好对应构建的支付函数为:
Figure FDA0002804416830000022
敌方风险偏好对应构建的支付函数为:
Figure FDA0002804416830000023
敌方安全偏好对应构建的支付函数为:
Figure FDA0002804416830000031
其中,
Figure FDA0002804416830000032
表示我方安全偏好对应的的支付函数,
Figure FDA0002804416830000033
表示对抗双方策略对分别为p和q时的子态势优势,K为归一化系数,使矩阵中所有的元素均为正数。
7.如权利要求6所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,所述基于空间态势优势矩阵,构建各个优化目标的支付函数,包括:
对于角度优势和距离优势:
我方风险偏好对应构建的支付函数为:
Figure FDA0002804416830000034
我方安全偏好对应构建的支付函数为:
Figure FDA0002804416830000035
敌方风险偏好对应构建的支付函数为:
Figure FDA0002804416830000036
敌方安全偏好对应构建的支付函数:
Figure FDA0002804416830000037
8.如权利要求7所述的一种对抗环境多无人机战术决策的多目标博弈方法,其特征在于,在我方无人机数量为一,敌方无人机数量为二时,
我方的高维矩阵为:
Figure FDA0002804416830000041
敌方的高维矩阵为:
Figure FDA0002804416830000042
其中,B1~B4和R1~R4均分别对应速度优势、高度优势、角度优势、距离优势,
Figure FDA0002804416830000043
表示对抗双方策略对分别为p和q时的我方无人机1相对敌方无人机2的速度优势对应的子态势优势,K为归一化系数,使矩阵中所有的元素均为正数。
9.一种对抗环境下多无人机战术决策的多目标博弈装置,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1-8任一项所述的对抗环境多无人机战术决策的多目标博弈方法。
CN202011362555.2A 2020-11-27 2020-11-27 对抗环境下多无人机战术决策的多目标博弈方法及装置 Active CN112612298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011362555.2A CN112612298B (zh) 2020-11-27 2020-11-27 对抗环境下多无人机战术决策的多目标博弈方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011362555.2A CN112612298B (zh) 2020-11-27 2020-11-27 对抗环境下多无人机战术决策的多目标博弈方法及装置

Publications (2)

Publication Number Publication Date
CN112612298A true CN112612298A (zh) 2021-04-06
CN112612298B CN112612298B (zh) 2023-06-09

Family

ID=75228560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011362555.2A Active CN112612298B (zh) 2020-11-27 2020-11-27 对抗环境下多无人机战术决策的多目标博弈方法及装置

Country Status (1)

Country Link
CN (1) CN112612298B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114217638A (zh) * 2021-12-15 2022-03-22 中国人民解放军66389部队88分队 一种任务驱动下的移动台站信息采集动态部署方法
CN115310257A (zh) * 2022-06-23 2022-11-08 中国人民解放军军事科学院国防科技创新研究院 基于人工势场的态势估计方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1821246A2 (en) * 2006-02-16 2007-08-22 Saab Ab Controlling of an autonomous platform
CN104898689A (zh) * 2015-03-27 2015-09-09 合肥工业大学 一种区间信息条件下的多无人机目标分配决策方法
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN108170158A (zh) * 2017-12-05 2018-06-15 中国科学院自动化研究所 基于数据驱动的无人机智能对抗控制方法
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108680063A (zh) * 2018-05-23 2018-10-19 南京航空航天大学 一种针对大规模无人机集群动态对抗的决策方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN110134138A (zh) * 2019-04-08 2019-08-16 合肥工业大学 对抗环境下无人机智能决策的纳什均衡博弈方法及系统
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
CN111047053A (zh) * 2019-11-20 2020-04-21 清华大学 面向未知策略对手的蒙特卡洛搜索博弈决策方法及系统
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1821246A2 (en) * 2006-02-16 2007-08-22 Saab Ab Controlling of an autonomous platform
CN104898689A (zh) * 2015-03-27 2015-09-09 合肥工业大学 一种区间信息条件下的多无人机目标分配决策方法
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN108170158A (zh) * 2017-12-05 2018-06-15 中国科学院自动化研究所 基于数据驱动的无人机智能对抗控制方法
CN108549233A (zh) * 2018-05-04 2018-09-18 南京航空航天大学 一种带有直觉模糊信息的无人机空战机动博弈方法
CN108680063A (zh) * 2018-05-23 2018-10-19 南京航空航天大学 一种针对大规模无人机集群动态对抗的决策方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN110134138A (zh) * 2019-04-08 2019-08-16 合肥工业大学 对抗环境下无人机智能决策的纳什均衡博弈方法及系统
CN110377052A (zh) * 2019-07-22 2019-10-25 合肥工业大学 无人机编队协同目标分配的矩阵博弈方法及系统
CN111047053A (zh) * 2019-11-20 2020-04-21 清华大学 面向未知策略对手的蒙特卡洛搜索博弈决策方法及系统
CN111221352A (zh) * 2020-03-03 2020-06-02 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HU XIAO-XUAN ET AL.: "Robust decision making for UAV air-to-ground attack under severe uncertainty", 《SPRINGER》, 31 December 2015 (2015-12-31), pages 4263 - 4273 *
朱晓建: "基于信息熵的博弈支付及纳什均衡选择研究", 《信息科技辑》, 15 May 2009 (2009-05-15), pages 34 - 39 *
赵明明等: "多无人机超视距空战博弈策略研究", 《电光与控制》, vol. 22, no. 4, 30 April 2015 (2015-04-30), pages 42 - 44 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114217638A (zh) * 2021-12-15 2022-03-22 中国人民解放军66389部队88分队 一种任务驱动下的移动台站信息采集动态部署方法
CN115310257A (zh) * 2022-06-23 2022-11-08 中国人民解放军军事科学院国防科技创新研究院 基于人工势场的态势估计方法及装置

Also Published As

Publication number Publication date
CN112612298B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
CN112949837B (zh) 一种基于可信网络的目标识别联邦深度学习方法
Li et al. A systematic approach to heterogeneous multiattribute group decision making
Dillon et al. Risk‐based decision making for terrorism applications
CN112612298A (zh) 对抗环境下多无人机战术决策的多目标博弈方法及装置
CN110138627B (zh) 一种基于安全风险量化的边缘侧终端安全接入策略选择方法
CN110490422B (zh) 一种基于博弈云模型的目标作战效能态势评估方法
Rajbhandari et al. Mapping between classical risk management and game theoretical approaches
Kim et al. Determining asset criticality for cyber defense
Hu et al. Task Assignment for Multi‐UAV under Severe Uncertainty by Using Stochastic Multicriteria Acceptability Analysis
CN117272306A (zh) 基于交替最小化的联邦学习半目标投毒攻击方法及系统
Zhou et al. A new matrix game with payoffs of generalized Dempster‐Shafer structures
Kittur Using the PROMETHEE and TOPSIS multi-criteria decision making methods to evaluate optimal generation
Ardil Hospital Facility Location Selection Using Permanent Analytics Process
CN112612300B (zh) 多平台智能决策的多目标博弈方法及装置
CN112612207B (zh) 不确定环境下多目标博弈求解方法及系统
Fehlmann New Lanchester theory for requirements prioritization
CN116774721A (zh) 多无人机博弈对抗的目标分配方法和系统
Azimirad et al. A new model for threat assessment in data fusion based on fuzzy evidence theory
Ardil Modeling Uncertainty in Multiple Criteria Decision Making Using the Technique for Order Preference by Similarity to Ideal Solution for the Selection of Stealth Combat Aircraft
Gaspars-Wieloch On some analogies between one-criterion decision making under uncertainty and multi-criteria decision making under certainty
ХОРОШКО et al. MULTI-CRITERIA ASSESSMENT OF THE CORRECTNESS OF DECISION-MAKING IN INFORMATION SECURITY TASKS
Yan et al. The impact of capital market opening on stock market stability: Based on D-MST method complex network perspective
Bigdeli et al. Solving defender-attacker game with multiple decision makers using expected-value Model
Oletsky et al. Some Ways of Counteracting Possible Manipulations Within the AHP on The Base of Weighted Linear Equations.
CN113793036A (zh) 联合作战的方案评估方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant