CN112307613A - 基于自适应权重的无人机集群空-地对抗博弈仿真方法 - Google Patents

基于自适应权重的无人机集群空-地对抗博弈仿真方法 Download PDF

Info

Publication number
CN112307613A
CN112307613A CN202011154243.2A CN202011154243A CN112307613A CN 112307613 A CN112307613 A CN 112307613A CN 202011154243 A CN202011154243 A CN 202011154243A CN 112307613 A CN112307613 A CN 112307613A
Authority
CN
China
Prior art keywords
participant
blue
red
aerial vehicle
unmanned aerial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011154243.2A
Other languages
English (en)
Other versions
CN112307613B (zh
Inventor
王尔申
宏晨
郭靖
佟刚
郭婧
肖明明
房启志
王传云
王宝广
黄煜峰
曲萍萍
徐嵩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Aerospace University
Original Assignee
Shenyang Aerospace University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Aerospace University filed Critical Shenyang Aerospace University
Priority to CN202011154243.2A priority Critical patent/CN112307613B/zh
Publication of CN112307613A publication Critical patent/CN112307613A/zh
Application granted granted Critical
Publication of CN112307613B publication Critical patent/CN112307613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于自适应权重的无人机集群空‑地对抗博弈仿真方法,涉及无人机群技术领域。该方法首先初始化无人机集群空‑地对抗模型,并依据参与者初始作战态势及博弈决策信息,为每个参与者的作战单位设置具有自适应效果的收益权重系数;再基于参与者的状态和决策信息的自适应权重方法为参与者动态更新收益权重系数,并利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益;最后得到整个对抗过程中各参与者的总收益,完成对抗博弈过程的仿真模拟。本发明方法基于非完全信息下的动态博弈论,通过引入自适应权重,建立非完全信息条件下的无人机集群对抗动态博弈模型,从而提高了无人机集群作战模型的准确性。

Description

基于自适应权重的无人机集群空-地对抗博弈仿真方法
技术领域
本发明涉及无人机群技术领域,尤其涉及一种基于自适应权重的无人机集群空-地对抗博弈仿真方法。
背景技术
无人机集群通过感知环境,对周围态势进行判断,依据一定的行为规则,采取攻击、避让、分散、集中、协作、援助等有利策略,使得在整体上涌现出集群对抗系统的动态特性。目前,针对无人机集群对抗的仿真模型,常用微分对策,生物智能,非线性状态空间等方法建立对抗模型。而在建立的数学模型中处理动态特性时,模型仿真对抗过程不能准确反映实战过程。因此,如何在不完全信息环境下,有效反映无人机集群对抗过程已成为研究无人机作战的一个重要研究课题。
近年来,非完全信息动态博弈在经济、网络安全以及无人机协同作战等应用领域有很大的发展,针对人类经济活动、人机对抗等非完全信息条件下的动态博弈逐渐成为研究热点。在随着无人机智能化水平的提高和集群控制技术的发展,无人机集群对抗将成为未来无人机空战的关键技术。由于无人机集群对抗的复杂性,简单的仿真模型并不能有效反映出复杂的实战对抗过程。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于自适应权重的无人机集群空-地对抗博弈仿真方法,实现对无人机集群空-地对抗博弈过程的仿真模拟。
为解决上述技术问题,本发明所采取的技术方案是:基于自适应权重的无人机集群空-地对抗动态博弈仿真方法,包括以下步骤:
步骤1、初始化无人机集群空-地对抗模型,具体为:
设置对抗博弈双方的对抗作战参数,对抗规则及作战约束条件;设置作为对抗博弈参与者的无人机集群与地面防空阵地的策略集合空间;设置对抗博弈双方的博弈收益函数;设置对抗作战的获胜条件;确立无人机集群对抗博弈效果的度量指标;
步骤2、根据无人机集群空-地对抗博弈模型,依据参与者初始作战态势及博弈决策信息,为每个参与者的作战单位设置具有自适应效果的收益权重系数;
步骤3、基于参与者的状态和决策信息的自适应权重方法为参与者动态更新收益权重系数,利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,具体方法为:
步骤3.1、设置参与者的状态矩阵
Figure BDA0002742230380000021
其中,X=[red,blue]为参与者,red表示地面防空阵地,blue表示无人机集群,NX为参与者X的单位数量,
Figure BDA0002742230380000022
表示在k时刻参与者X的第i个作战单位的状态矩阵,
Figure BDA0002742230380000023
为k时刻参与者X所在位置的二维坐标,Pi X(k)为在k时刻参与者X的第i个作战单位的数量,Wi X(k)为在k时刻参与者X的第i个作战单位的武器载荷;参与者的作战单位分别为:参与者red=[RER,RAD]和参与者blue=[BR,BC],其中,RER为电子雷达,RAD为防空系统,BR为侦察无人机,BC为战斗无人机;
步骤3.2、设置参与者的控制矩阵
Figure BDA0002742230380000024
其中,
Figure BDA0002742230380000025
Figure BDA0002742230380000026
分别是k时刻参与者X在x轴和y轴方向的二维位移变量,
Figure BDA0002742230380000027
为k时刻参与者X的火力值,
Figure BDA0002742230380000028
为k时刻参与者X选择攻击目标进行攻击的概率,针对不同策略参与者X有不同的选择概率;
步骤3.3、设置策略空间S(k)={sred,k(pred,k),sblue,k(pblue,k)},从sred,k(pred,k),sblue,k(pblue,k)中给出对抗过程中参与者的决策信息;其中,pred,k,pblue,k分别为k时刻非完全信息下的参与者red和blue的策略选择概率,sred,k(pred,k),sblue,k(pblue,k)分别参与者red和blue在k时刻依概率pred,k,pblue,k给出的策略集合;
步骤3.4、迭代更新每个参与者的作战单位的收益权重系数
Figure BDA0002742230380000029
如果k时刻策略S(k)对参与者X有影响,则按如下公式更新收益权重系数
Figure BDA00027422303800000210
Figure BDA00027422303800000211
否则,
Figure BDA00027422303800000212
即保持收益权重系数不变;
其中,
Figure BDA00027422303800000213
表征参与者双方的收益权重系数,
Figure BDA00027422303800000214
为参与者blue方的收益权重系数,
Figure BDA00027422303800000215
为参与者red方的收益权重系数;
Figure BDA00027422303800000216
分别为以初始状态为基准的归一化的参战数量、武器载荷量,
Figure BDA00027422303800000217
为指数均衡因子,
Figure BDA00027422303800000218
为幂均衡因子,
Figure BDA00027422303800000219
为火力均衡因子;
Figure BDA00027422303800000220
Figure BDA00027422303800000221
的归一化值,
Figure BDA00027422303800000222
为参与者blue的第i个作战单位攻击参与者red的第j个作战单位时的命中概率;
根据参与者双方的参战对象不同,参与者blue的命中概率的迭代更新方程如下公式所示:
Figure BDA0002742230380000031
其中,
Figure BDA0002742230380000032
为在k+1时刻参与者blue的第i个作战单位攻击red的第j个单位的命中概率,
Figure BDA0002742230380000033
为参与者blue命中率的衰减函数,
Figure BDA0002742230380000034
为k时刻电子雷达的火力值;
步骤3.5、根据
Figure BDA0002742230380000035
保存的收益权重系数信息,利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,如下公式所示:
Figure BDA0002742230380000036
其中,Jblue(k)和Jred(k)分别表示在k时刻参与者blue和red的目标收益,
Figure BDA0002742230380000037
Figure BDA0002742230380000038
分别为参与者X分别在目标收益Jblue(k)和Jred(k)里的子收益函数,
Figure BDA0002742230380000039
Figure BDA00027422303800000310
分别表示参与者blue和red的子收益函数系数;
步骤4、根据无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,得到整个对抗过程中各参与者的总收益,完成对抗博弈过程的仿真模拟;
根据无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,得到整个对抗过程中各参与者的总收益如下公式所示:
Figure BDA00027422303800000311
其中,JX为整个对抗过程中参与者X的总收益,JX(k)为k时刻参与者X的目标收益,K是对抗结束的时刻。
采用上述技术方案所产生的有益效果在于:本发明提供的基于自适应权重的无人机集群空-地对抗博弈仿真方法,基于非完全信息下的动态博弈论,通过引入自适应权重,建立非完全信息条件下的无人机集群对抗动态博弈模型,从而提高了无人机集群作战模型的准确性;自适应权重利用了对抗过程中的参与者信息以及动态决策信息进行动态更新的方法,可以使得对抗过程中的收益函数更准确反映整个战场态势,使得仿真对抗更符合实战,从而有效提高仿真模型的准确性和有效性。自适应权重利用了对抗过程中的参与者信息以及动态决策信息进行动态更新的方法,可以使得对抗过程中的收益函数更准确反映整个战场态势,使得仿真对抗更符合实战,从而有效提高仿真模型的准确性和有效性。
附图说明
图1为本发明实施例提供的基于自适应权重的无人机集群空-地对抗动态博弈仿真方法的流程图;
图2为本发明实施例提供的静态权重和自适应权重下无人机集群与地面防空阵地对抗过程中目标收益的变化曲线图,其中,(a)为静态权重下目标收益的变化曲线,(b)为自适应权重下目标收益的变化曲线;
图3为本发明实施例提供的无人机集群与地面防空阵地对抗结束时对抗双方的作战单位数量直方图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例中,基于自适应权重的无人机集群空-地对抗动态博弈仿真方法,如图1所示,包括以下步骤:
步骤1、初始化无人机集群空-地对抗模型,具体为:
设置对抗博弈双方的对抗作战参数,对抗规则及作战约束条件;设置作为对抗博弈参与者的无人机集群与地面防空阵地的策略集合空间;设置对抗博弈双方的博弈收益函数;设置对抗作战的获胜条件;确立无人机集群对抗博弈效果的度量指标;本实施例设置无人机集群空-地对抗模型中的参与者分别为代表地面防空阵地的红方(red)和代表无人机集群的蓝方(blue),红方的作战单位为1个单位的电子侦察雷达(RER1)和1个单位的电子干扰雷达(RER2)和2个单位的防空系统(RAD1,RAD2),蓝方的作战单位为2个单位的侦察无人机(BR1,BR2)和2个单位的战斗无人机(BC1,BC2)。同时,本实施例中,设定对抗博弈双方的博弈收益函数为对抗博弈双方对每个作战单位的收益之和;设置对抗作战的获胜条件为任意一方在对抗过程中的作战单位数量损失超过了既定的阈值;确立无人机集群对抗博弈效果的度量指标,包括:自适应权重下有无电子干扰策略的收益差比。
步骤2、根据无人机集群空-地对抗博弈模型,依据参与者初始作战态势及博弈决策信息,为每个参与者的作战单位设置具有自适应效果的收益权重系数;
步骤3、基于参与者的状态和决策信息的自适应权重方法为参与者动态更新收益权重系数,利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,具体方法为:
步骤3.1、设置参与者的状态矩阵
Figure BDA0002742230380000051
其中,X=[red,blue]为参与者,red表示地面防空阵地,blue表示无人机集群,NX为参与者X的单位数量,
Figure BDA0002742230380000052
表示在k时刻参与者X的第i个作战单位的状态矩阵,
Figure BDA0002742230380000053
为k时刻参与者X所在位置的二维坐标,Pi X(k)为在k时刻参与者X的第i个作战单位的数量,Wi X(k)为在k时刻参与者X的第i个作战单位的武器载荷;参与者的作战单位分别为:参与者red=[RER,RAD]和参与者blue=[BR,BC],其中,RER为电子雷达,RAD为防空系统,BR为侦察无人机,BC为战斗无人机;
步骤3.2、设置参与者的控制矩阵
Figure BDA0002742230380000054
其中,
Figure BDA0002742230380000055
Figure BDA0002742230380000056
分别是k时刻参与者X在x轴和y轴方向的二维位移变量,
Figure BDA0002742230380000057
为k时刻参与者X的火力值,
Figure BDA0002742230380000058
为k时刻参与者X选择攻击目标进行攻击的概率,针对不同策略参与者X有不同的选择概率,本实施例中,参与者red的第i个作战单位选择参与者blue的第j个作战单位进行攻击的概率为
Figure BDA0002742230380000059
参与者的不同作战单位的攻击目标选择概率,具体如表1所示;
表1参与者的不同作战单位的攻击目标选择概率
Figure BDA00027422303800000510
表中,RER2=0表示对蓝方不施加电子干扰,RER2=1表示施加电子干扰。0.6(0.8)表示不加电子干扰时,战斗无人机BC1选择防空系统RAD1进行攻击的概率为0.6,施加电子干扰时,战斗无人机BC1选择防空系统RAD1进行攻击的概率为0.8;
步骤3.3、设置策略空间S(k)={sred,k(pred,k),sblue,k(pblue,k)},从sred,k(pred,k),sblue,k(pblue,k)中给出对抗过程中参与者的决策信息;其中,pred,k,pblue,k分别为k时刻非完全信息下的参与者red和blue的策略选择概率,sred,k(pred,k),sblue,k(pblue,k)分别参与者red和blue在k时刻依概率pred,k,pblue,k给出的策略集合;
步骤3.4、迭代更新每个参与者的作战单位的收益权重系数
Figure BDA0002742230380000061
如果k时刻策略S(k)对参与者X有影响,则按如下公式更新收益权重系数
Figure BDA0002742230380000062
Figure BDA0002742230380000063
否则,
Figure BDA0002742230380000064
即保持收益权重系数不变;
其中,
Figure BDA0002742230380000065
表征参与者双方的收益权重系数,
Figure BDA0002742230380000066
为参与者blue方的收益权重系数,
Figure BDA0002742230380000067
为参与者red方的收益权重系数;
Figure BDA0002742230380000068
Figure BDA0002742230380000069
分别为以初始状态(即k=0时)为基准的归一化的参战数量、武器载荷量,
Figure BDA00027422303800000610
为指数均衡因子,
Figure BDA00027422303800000611
为幂均衡因子,
Figure BDA00027422303800000612
为火力均衡因子;
Figure BDA00027422303800000613
Figure BDA00027422303800000614
的归一化值,
Figure BDA00027422303800000615
是参与者blue的第i个作战单位攻击参与者red的第j个作战单位时的命中概率;
收益权重系数
Figure BDA00027422303800000616
的更新公式中,
Figure BDA00027422303800000617
作为指数均衡因子是为了均衡指数函数对收益权重的影响,
Figure BDA00027422303800000618
作为幂均衡因子是为了均衡参战数量和武器载荷量对收益权重的影响,
Figure BDA00027422303800000619
作为火力均衡因子是为了平衡火力值
Figure BDA00027422303800000620
对收益权重的影响;
根据参与者双方的参战对象不同,参与者blue的命中概率的迭代更新方程如下公式所示:
Figure BDA00027422303800000621
其中,
Figure BDA00027422303800000622
为在k+1时刻参与者blue的第i个作战单位攻击red的第j个单位的命中概率,
Figure BDA00027422303800000623
为参与者blue命中率的衰减函数,
Figure BDA00027422303800000624
为k时刻电子雷达的火力值;
参与者blue的命中概率的迭代更新方程表示参与者blue的第i个作战单位对参与者red的第j个作战单位的命中率是随着电子雷达的火力值动态衰减;
本实施例中,为无人机集群中两参与者的各作战单位设置的初始收益权重系数如表2所示,两参与者的各作战单位的命中概率如表3所示,参与者蓝方的收益权重系数中各均衡因子如表4所示,参与者红方的收益权重系数中各均衡因子如表5所示;
表2参与者的各作战单位的初始收益权重系数
Figure BDA0002742230380000071
表3参与者的各作战单位的命中概率
Figure BDA0002742230380000072
表4参与者蓝方的收益权重系数中各均衡因子
Figure BDA0002742230380000073
表5参与者红方的收益权重系数中各均衡因子
Figure BDA0002742230380000074
步骤3.5、根据
Figure BDA0002742230380000075
保存的收益权重系数信息,利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,如下公式所示:
Figure BDA0002742230380000076
其中,Jblue(k)和Jred(k)分别表示在k时刻参与者blue和red的目标收益,
Figure BDA0002742230380000077
Figure BDA0002742230380000081
分别为参与者X分别在目标收益Jblue(k)和Jred(k)里的子收益函数,
Figure BDA0002742230380000082
Figure BDA0002742230380000083
分别表示参与者blue和red的子收益函数系数;
步骤4、根据无人机集群与地面防空阵地对抗过程中作战单位的目标收益,得到整个对抗过程中各参与者的总收益,完成对抗博弈过程的仿真模拟;
根据无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,得到整个对抗过程中各参与者的总收益如下公式所示:
Figure BDA0002742230380000084
其中,JX为整个对抗过程中参与者X的总收益,JX(k)为k时刻参与者X的目标收益,K是对抗结束的时刻。
本实施例中,设置对抗实验的对抗结束时刻K=16,对抗开始和结束时参与者的收益如表6所示。
表6参与者的收益
Figure BDA0002742230380000085
本实施例还给出静态权重和自适应权重下无人机集群与地面防空阵地对抗过程中目标收益的变化曲线图,如图2所示,图中,矩形表示蓝方无人机集群,圆圈表示红方地面部队,三角表示双方的收益和,实心表示有电子干扰EI(Electromagnetic Interference),空心表示无电子干扰NEI(Non-electromagnetic Interference)。纵坐标为目标收益J,横坐标为对抗时间步k,施加电子干扰EI的对抗区间为[7,15]。图2(a)表示静态权重下无人机集群与地面防空阵地对抗过程中参与者的目标收益变化情况,从图中可以看出,在无电子干扰NEI情况下,红方的目标收益NEI-JR减小,蓝方的目标收益NEI-JB增大,蓝方在对抗中更占优势;在施加电子干扰EI情况下,红方的目标收益EI-JR增大,蓝方的目标收益EI-JB减小,红方在对抗中更占优势。无论有无电子干扰,收益和EI+与NEI+均减小。
图2(b)表示自适应权重下无人机集群与地面防空阵地对抗过程中参与者的目标收益变化情况,从图中可以看出,在无电子干扰NEI情况下,红方的目标收益NEI-JR减小,蓝方的目标收益NEI-JB增大。蓝方在对抗中更占优势;在施加电子干扰EI情况下,红方的目标收益EI-JR增大,蓝方的目标收益EI-JB减小,红方在对抗中更占优势。施加电子干扰EI情况下的收益和EI+增大,无电子干扰NEI情况下收益和NEI+减小。
无人机集群对抗过程是一种高度复杂的非线性动态过程。对比施加电子干扰EI和无电子干扰NEI条件下的目标收益函数,发现静态权重下,无人机集群与地面防空阵地对抗过程中参与者的目标收益随着对抗演化,呈现了单调下降趋势,而自适应权重下,参与者的目标收益随着对抗演化,呈现非单调性。说明静态权重下的目标收益曲线对复杂对抗过程的适应性不足,自适应权重下的目标收益曲线可以更加合理地表征对抗过程,使得改进的目标收益函数具有一定的动态适应性。
本实施例还用静态权重下和动态权重下的博弈收益差之比作为无人机集群对抗博弈的度量指标来评估对抗博弈过程中目标收益的调控效果,如下公式所示:
Figure BDA0002742230380000091
Figure BDA0002742230380000092
其中,δX(k)为k时刻施加电子干扰策略的收益差值与未施加电子干扰策略的收益差值的比值,
Figure BDA0002742230380000093
为k时刻静态权重下施加电子干扰策略时参与者的收益,
Figure BDA0002742230380000094
为k时刻动态权重下施加电子干扰策略时参与者的收益,
Figure BDA0002742230380000095
为k时刻静态权重和动态权重下施加电子干扰策略时参与者的收益差值;
Figure BDA0002742230380000096
为k时刻静态权重下未施加电子干扰策略时参与者的收益,
Figure BDA0002742230380000097
为k时刻动态权重下未施加电子干扰策略时参与者的收益,
Figure BDA0002742230380000098
为k时刻静态权重和动态权重下未施加电子干扰策略时参与者的收益差值;δX(k)的值越大,则施加电子干扰策略时参与者的收益变化越大,说明了自适应权重调控收益函数的能力越强,灵敏度越高。
本实施例中,无人机集群与地面防空阵地对抗结束时,对抗双方的作战单位数量直方图如图3所示,NEI是未施加电子干扰时双方作战单位的剩余数量,EI是施加电子干扰时双方作战单位的剩余数量。本实施例中,双方获胜的条件是可攻击单位总数量的损失超过80%。图3中,在未施加电子干扰NEI情况下,蓝方作战单位BC0+BC1的损失未超过80%,红方作战单位RAD0+RAD1的损失超过80%,因此在未施加电子干扰NEI情况下,蓝方较易获胜;而在施加电子干扰EI情况下,蓝方作战单位BC0+BC1的损失超过80%,而红方作战单位RAD0+RAD1的损失未超过80%,因此在施加电子干扰EI情况下,红方较易获胜。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种基于自适应权重的无人机集群空-地对抗动态博弈仿真方法,其特征在于:包括以下步骤:
步骤1、初始化无人机集群空-地对抗模型,具体为:
设置对抗博弈双方的对抗作战参数,对抗规则及作战约束条件;设置作为对抗博弈参与者的无人机集群与地面防空阵地的策略集合空间;设置对抗博弈双方的博弈收益函数;设置对抗作战的获胜条件;确立无人机集群对抗博弈效果的度量指标;
步骤2、根据无人机集群空-地对抗博弈模型,依据参与者初始作战态势及博弈决策信息,为每个参与者的作战单位设置具有自适应效果的收益权重系数;
步骤3、基于参与者的状态和决策信息的自适应权重方法为参与者动态更新收益权重系数,并利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益;
步骤4、根据无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,得到整个对抗过程中各参与者的总收益,完成对抗博弈过程的仿真模拟。
2.根据权利要求1所述的基于自适应权重的无人机集群空-地对抗动态博弈仿真方法,其特征在于:所述步骤3的具体方法为:
步骤3.1、设置参与者的状态矩阵
Figure FDA0002742230370000011
其中,X=[red,blue]为参与者,red表示地面防空阵地,blue表示无人机集群,NX为参与者X的单位数量,
Figure FDA0002742230370000012
表示在k时刻参与者X的第i个作战单位的状态矩阵,
Figure FDA0002742230370000013
为k时刻参与者X所在位置的二维坐标,Pi X(k)为在k时刻参与者X的第i个作战单位的数量,Wi X(k)为在k时刻参与者X的第i个作战单位的武器载荷;参与者的作战单位分别为:参与者red=[RER,RAD]和参与者blue=[BR,BC],其中RER为电子雷达,RAD为防空系统,BR为侦察无人机,BC为战斗无人机;
步骤3.2、设置参与者的控制矩阵
Figure FDA0002742230370000014
其中,
Figure FDA0002742230370000015
Figure FDA0002742230370000016
分别是k时刻参与者X在x轴和y轴方向的二维位移变量,
Figure FDA0002742230370000017
为k时刻参与者X的火力值,
Figure FDA0002742230370000018
为k时刻参与者X选择攻击目标进行攻击的概率,针对不同策略参与者X有不同的选择概率;
步骤3.3、设置策略空间S(k)={sred,k(pred,k),sblue,k(pblue,k)},从sred,k(pred,k),sblue,k(pblue,k)中给出对抗过程中参与者的决策信息;其中,pred,k,pblue,k分别为k时刻非完全信息下的参与者red和blue的策略选择概率,sred,k(pred,k),sblue,k(pblue,k)分别参与者red和blue在k时刻依概率pred,k,pblue,k给出的策略集合;
步骤3.4、迭代更新每个参与者的作战单位的收益权重系数
Figure FDA0002742230370000021
如果k时刻策略S(k)对参与者X有影响,则按如下公式更新收益权重系数
Figure FDA0002742230370000022
Figure FDA0002742230370000023
否则,
Figure FDA0002742230370000024
即保持收益权重系数不变;
其中,
Figure FDA0002742230370000025
表征参与者双方的收益权重系数,
Figure FDA0002742230370000026
为参与者blue方的收益权重系数,
Figure FDA0002742230370000027
为参与者red方的收益权重系数;
Figure FDA0002742230370000028
分别为以初始状态为基准的归一化的参战数量、武器载荷量,
Figure FDA0002742230370000029
为指数均衡因子,
Figure FDA00027422303700000210
为幂均衡因子,
Figure FDA00027422303700000211
为火力均衡因子;
Figure FDA00027422303700000212
Figure FDA00027422303700000213
的归一化值,
Figure FDA00027422303700000214
为参与者blue的第i个作战单位攻击参与者red的第j个作战单位时的命中概率;
根据参与者双方的参战对象不同,参与者blue的命中概率的迭代更新方程如下公式所示:
Figure FDA00027422303700000215
其中,
Figure FDA00027422303700000216
为在k+1时刻参与者blue的第i个作战单位攻击red的第j个单位的命中概率,
Figure FDA00027422303700000217
为参与者blue命中率的衰减函数,
Figure FDA00027422303700000218
为k时刻电子雷达的火力值;
步骤3.5、根据
Figure FDA00027422303700000219
保存的收益权重系数信息,利用迭代法求出无人机集群与地面防空阵地对抗过程中各作战单位的目标收益,如下公式所示:
Figure FDA00027422303700000220
其中,Jblue(k)和Jred(k)分别表示在k时刻参与者blue和red的目标收益,
Figure FDA00027422303700000221
Figure FDA00027422303700000222
分别为参与者X分别在目标收益Jblue(k)和Jred(k)里的子收益函数,
Figure FDA00027422303700000223
Figure FDA0002742230370000031
分别表示参与者blue和red的子收益函数系数。
3.根据权利要求2所述的基于自适应权重的无人机集群空-地对抗动态博弈仿真方法,其特征在于:所述步骤4得到的整个对抗过程中各参与者的总收益如下公式所示:
Figure FDA0002742230370000032
其中,JX为整个对抗过程中参与者X的总收益,JX(k)为k时刻参与者X的目标收益,K是对抗结束的时刻。
CN202011154243.2A 2020-10-26 2020-10-26 基于自适应权重的无人机集群空-地对抗博弈仿真方法 Active CN112307613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011154243.2A CN112307613B (zh) 2020-10-26 2020-10-26 基于自适应权重的无人机集群空-地对抗博弈仿真方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011154243.2A CN112307613B (zh) 2020-10-26 2020-10-26 基于自适应权重的无人机集群空-地对抗博弈仿真方法

Publications (2)

Publication Number Publication Date
CN112307613A true CN112307613A (zh) 2021-02-02
CN112307613B CN112307613B (zh) 2023-07-18

Family

ID=74331014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011154243.2A Active CN112307613B (zh) 2020-10-26 2020-10-26 基于自适应权重的无人机集群空-地对抗博弈仿真方法

Country Status (1)

Country Link
CN (1) CN112307613B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505538A (zh) * 2021-07-28 2021-10-15 哈尔滨工业大学 一种基于计算机生成兵力的无人机自主作战系统
CN113867418A (zh) * 2021-09-17 2021-12-31 南京信息工程大学 一种无人机集群自主协同侦察任务调度方法
CN114167899A (zh) * 2021-12-27 2022-03-11 北京联合大学 一种无人机蜂群协同对抗决策方法及系统
CN115051744A (zh) * 2022-04-26 2022-09-13 北京理工大学 一种基于轨迹和功率联合优化的无人机辅助星地通信方法
CN116627179A (zh) * 2023-07-19 2023-08-22 陕西德鑫智能科技有限公司 无人机编队控制方法及装置
CN116956758A (zh) * 2023-09-21 2023-10-27 北京航天晨信科技有限责任公司 基于对抗过程仿真模型的策略收益预测方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110271822A1 (en) * 2010-05-04 2011-11-10 Makor Issues And Rights Ltd. Automatic Real Time Command and Control System
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN108680063A (zh) * 2018-05-23 2018-10-19 南京航空航天大学 一种针对大规模无人机集群动态对抗的决策方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110271822A1 (en) * 2010-05-04 2011-11-10 Makor Issues And Rights Ltd. Automatic Real Time Command and Control System
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN108680063A (zh) * 2018-05-23 2018-10-19 南京航空航天大学 一种针对大规模无人机集群动态对抗的决策方法
CN109460056A (zh) * 2018-11-06 2019-03-12 哈尔滨工程大学 基于量子磷虾群演化机制的无人机集群作战博弈决策方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
惠一楠 等: "无人机攻防对抗不完全信息动态博弈方法研究", 兵工自动化, vol. 28, no. 1, pages 7 - 10 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505538A (zh) * 2021-07-28 2021-10-15 哈尔滨工业大学 一种基于计算机生成兵力的无人机自主作战系统
CN113505538B (zh) * 2021-07-28 2022-04-12 哈尔滨工业大学 一种基于计算机生成兵力的无人机自主作战系统
CN113867418A (zh) * 2021-09-17 2021-12-31 南京信息工程大学 一种无人机集群自主协同侦察任务调度方法
CN114167899A (zh) * 2021-12-27 2022-03-11 北京联合大学 一种无人机蜂群协同对抗决策方法及系统
CN115051744A (zh) * 2022-04-26 2022-09-13 北京理工大学 一种基于轨迹和功率联合优化的无人机辅助星地通信方法
CN115051744B (zh) * 2022-04-26 2023-08-08 北京理工大学 一种基于轨迹和功率联合优化的无人机辅助星地通信方法
CN116627179A (zh) * 2023-07-19 2023-08-22 陕西德鑫智能科技有限公司 无人机编队控制方法及装置
CN116627179B (zh) * 2023-07-19 2023-10-31 陕西德鑫智能科技有限公司 无人机编队控制方法及装置
CN116956758A (zh) * 2023-09-21 2023-10-27 北京航天晨信科技有限责任公司 基于对抗过程仿真模型的策略收益预测方法和装置
CN116956758B (zh) * 2023-09-21 2024-02-02 北京航天晨信科技有限责任公司 基于对抗过程仿真模型的策略收益预测方法和装置

Also Published As

Publication number Publication date
CN112307613B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN112307613A (zh) 基于自适应权重的无人机集群空-地对抗博弈仿真方法
US9248372B2 (en) Using and exporting experience gained in a video game
CN110138627B (zh) 一种基于安全风险量化的边缘侧终端安全接入策略选择方法
CN114358141A (zh) 一种面向多作战单元协同决策的多智能体增强学习方法
CN109460056A (zh) 基于量子磷虾群演化机制的无人机集群作战博弈决策方法
CN115222271A (zh) 基于神经网络的武器目标分配方法
CN116185059A (zh) 基于深度强化学习的无人机空战自主规避机动决策方法
CN113222106A (zh) 一种基于分布式强化学习的智能兵棋推演方法
CN115759754A (zh) 基于动态博弈变权的超视距空战模拟目标威胁评估方法
CN117272306A (zh) 基于交替最小化的联邦学习半目标投毒攻击方法及系统
CN115328189B (zh) 多无人机协同博弈决策方法和系统
CN114662655A (zh) 一种基于注意力机制的兵棋推演ai分层决策方法及装置
CN113988301B (zh) 战术策略生成方法、装置、电子设备及存储介质
CN113705828B (zh) 一种基于集群影响度的战场博弈策略强化学习训练方法
CN112612300B (zh) 多平台智能决策的多目标博弈方法及装置
CN114202185A (zh) 一种高功率微波武器协同防空的体系贡献率评估方法
CN114666107B (zh) 移动雾计算中一种高级持续性威胁防御方法
CN117556718B (zh) 基于神经网络和多策略组合灰狼优化算法的火力分配方法
CN116229766B (zh) 博弈对抗下基于效能的目标分配方法
CN114428999B (zh) 基于演化博弈模型的无人飞行器对地攻防策略选择方法
CN114666107A (zh) 移动雾计算中一种高级持续性威胁防御方法
CN115314316A (zh) 基于攻防博弈的复杂网络动态防御决策方法及系统
CN113822409B (zh) 一种基于异构多智能体强化学习的多无人机协同突防方法
CN116975773A (zh) 一种基于多属性决策的空中目标威胁估计方法
CN116579430A (zh) 一种求解网络攻防博弈精炼bne的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant