CN113283111B - 一种用于模型推演到智能推演的转化方法 - Google Patents

一种用于模型推演到智能推演的转化方法 Download PDF

Info

Publication number
CN113283111B
CN113283111B CN202110656539.2A CN202110656539A CN113283111B CN 113283111 B CN113283111 B CN 113283111B CN 202110656539 A CN202110656539 A CN 202110656539A CN 113283111 B CN113283111 B CN 113283111B
Authority
CN
China
Prior art keywords
model
unit
deduction
image
countermeasure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110656539.2A
Other languages
English (en)
Other versions
CN113283111A (zh
Inventor
曾向荣
钟志伟
刘衍
张政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110656539.2A priority Critical patent/CN113283111B/zh
Publication of CN113283111A publication Critical patent/CN113283111A/zh
Application granted granted Critical
Publication of CN113283111B publication Critical patent/CN113283111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于模型推演到智能推演的转化方法,将模型推演中对抗单元的模型数字化输入、规则行为的数字化输入和对抗单元行为决策数字化输出转化为智能推演中图像模型的输入和输出;将虚拟环境推演中对抗单元的移动过程、编组分队过程在智能推演中进行离散化采样,转化为图模型的序列图像;将虚拟环境推演的损伤评估转化为智能推演中图像模型的各个单元的损伤和整体的损伤评估;将智能推演中图像模型的输入作为深度强化学习的训练测试模型的输入,深度强化学习的训练测试模型输出动作、策略值向量。本发明将单元行为决策输出转化为可用于深度强化学习的输出,以适应深度强化学习的需求,为智能化推演提供依据。

Description

一种用于模型推演到智能推演的转化方法
技术领域
本发明属于对抗推演技术领域,尤其涉及一种用于模型推演到智能推演的转化方法。
背景技术
智能对抗是指在信息对抗的基础上运用智能武器和手段实现以高效指挥化、打击精确化、操作自动化、行为智能化为主旨的高技术对抗形式。从本质上讲,智能对抗是人的智能向信息对抗场地和对抗装备的辐射和延伸。从对抗程序和手段看,智能对抗包括智能化的指挥控制和智能化装备的攻防对抗。智能对抗的主要标志是智能化对抗装备群及智能化对抗手段的出现。
对抗推演由最初的采用单元缩小的模型推演到以计算机为主体的模型数字化虚拟环境推演到智能化推演,智能化推演是在虚拟环境推演的基础上增加智能化部分。针对智能化对抗在虚拟训练推演的研究中,国内常常采用的是模块化设计、功能齐全,然后没有详细的介绍深度学习在智能化推演中的使用。专利号:201811075660.0提出了一种面向多领域可扩展兵棋推演平台,该平台为提高通用性和扩展性,引入兵棋二次开发的设计。专利号:201811313124.X 提出了一种基于深度强化学习的无监督智能对抗推演系统,该方法没有详细的介绍深度强化学习如何在对抗推演系统中使用。
强化学习是人工智能机器学习领域里的一个分支,用于控制一只能够在某个环境下自主行动的智能体,通过和环境之间的互动,包括感知与得到奖励,而不断改进它的行为,而强化学习的目的,就是选择一系列行动来最大化未来的奖励。深度强化学习把神经网络提取复杂高维数据特征的能力融入强化学习,将数据转化到低维特征,便于强化学习处理。众所周知,对抗决策是对抗领域中最复杂、最具挑战的活动,并由此促进了对抗辅助决策支持技术的产生和发展。可以预见,深度强化学习技术的不断进步必将对对抗智能辅助决策领域产生深刻而重大的影响。
发明内容
有鉴于此,本发明的目的是通过把对抗双方的装备单元模型数据、单元行为模型数据输入建模转化为可用于深度强化学习的图像模型,单元行为决策输出转化为可用于深度强化学习的输出,对虚拟环境推演进行图像模型转化,以适应深度强化学习的需求,为智能化对抗单元推演提供依据。
本发明提供一种用于模型推演到智能推演的转化方法,该方法是把模型推演的过程首先转化虚拟环境推演的过程,然后转化为智能推演的过程。虚拟环境推演中的对抗单元的模型数字化输入、规则行为的数字化输入和对抗单元行为决策数字化输出转化为智能推演中图像模型的输入和输出,虚拟环境推演中的对抗单元移动过程、编组分队过程在智能推演中对其进行离散化采样转化为图模型的序列图像,虚拟环境推演的损伤评估转化为图像模型中的各个单元的损伤和整体的损伤评估。
本发明公开的一种用于模型推演到智能推演的转化方法,该方法包括以下步骤:
将模型推演中对抗单元的模型数字化输入、规则行为的数字化输入和对抗单元行为决策数字化输出转化为智能推演中图像模型的输入和输出;
将虚拟环境推演中对抗单元的移动过程、编组分队过程在智能推演中进行离散化采样,转化为图模型的序列图像;
将虚拟环境推演的损伤评估转化为智能推演中图像模型的对抗单元的损伤和整体的损伤评估;
将所述智能推演中图像模型的输入作为深度强化学习的训练测试模型的输入,深度强化学习的训练测试模型输出动作、策略值向量。
进一步的,所述模型推演中对抗单元的模型数字化输入、规则行为的数字化输入转化为智能推演中图像模型的输入的步骤,包括:
构建对抗单元状态模型属性图像,所述对抗单元状态模型属性图像中某点像素(Ra,Ga,Ba)代表对抗单元状态模型属性,其中Ra代表对抗方,Ga为对抗单元类型,Ba为生命值,对抗单元为以像素点(Ra,Ga,Ba)为中心的圆,探测范围为对抗单元外围预设值大小的圆环;
构建对抗单元攻击、防御模型属性图像,所述对抗单元攻击、防御模型属性图像中某点像素(Rb,Gb,Bb)代表对抗单元攻击、防御模型属性,其中Rb为攻击值,Gb为防御值,Bb为耦合度,Bb为调度员对对抗单元的熟悉程度或多对抗单元类型协同程度,攻击范围是像素点(Rb,Gb,Bb)为中心的圆;
构建对抗单元规则行为模型,所述对抗单元规则行为模型在所述对抗单元状态模型属性图像和所述对抗单元攻击、防御模型属性图像中运动;
构建地图模型属性图像,图像中某点像素(Rm,0,0)代表地图模型属性,其中 Rm代表高度的像素值,当图像中任意点的位置(xi,yi)的像素值相等时,说明处于相同的高度;当相邻点的像素值距离
Figure BDA0003113102170000031
小于设定值时,说明地面的对抗单元可在相邻点之间移动。
进一步的,对抗单元状态、行为决策数字化输出转化为图像模型的输出,当对抗单元状态模型属性(Ra,Ga,Ba)中的生命值Ba<T时认为不可以对抗,把该对抗单元从所述状态模型属性图像中删除,其中T指对抗中装备损坏或者损失情况说明;
对对抗单元行为决策进行数字化量化,以决策向量α=[αik]作为行为决策输出,其中αi代表是否攻击,αk代表是否聚集。
进一步的,所述将虚拟环境推演中对抗单元的移动过程、编组分队过程在智能推演中进行离散化采样,转化为图模型的序列图像的方法如下:
图像的像素大小按照对抗单元的对抗区域进行设置,特定大小范围的虚拟环境推演,选用预设大小的像素图像,对抗单元的移动过程分别在所述对抗单元状态模型属性图像和所述对抗单元攻击、防御模型属性图像中运动,每次运动的步长由每个像素对应的距离决定。
进一步的,所述将虚拟环境推演的损伤评估转化为图像模型中的各个单元的损伤和整体的损伤评估的步骤包括,对每次对抗单元状态、行为改变的输出在图像模型下评估各个单元的损伤和整体损伤,根据对抗单元的状态模型属性图像中的Ba值判断,并对下次的所述决策向量α做损伤评估,以估计所述决策向量α的优劣。
进一步的,所述深度强化学习的训练测试模型以所述攻击、防御模型属性图像和所述对抗单元状态模型属性图像为输入,回报值函数为
Figure BDA0003113102170000041
其中f为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数,奖励值rk=f{(Rbk,Gbk,Bbk),(Rak,Gak,Bak)}为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数;
深度强化学习的训练测试模型输出所述决策向量α。
本发明对虚拟环境推演进行图像模型转化,适应了深度强化学习的需求,为智能化对抗单元推演提供量化依据。
附图说明
图1一种用于模型推演到智能推演的转化方法示意图;
图2对抗单元状态模型属性图像及时序变化;
图3地图模型属性图像;
图4基于深度强化学习的对抗仿真推演网络结构图。
具体实施方式
下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
本发明的目的是通过把对抗双方的装备单元模型数据、单元行为模型数据输入建模转化为可用于深度强化学习的图像模型,单元行为决策输出转化为可用于深度强化学习的输出,对虚拟环境推演进行图像模型转化,以适应深度强化学习的需求,为智能化对抗单元推演提供依据。本发明中的对抗单元包括地面对抗单元,空中对抗单元和水面对抗单元。
如图1所示,本发明公开的可用于模型推演到智能推演的转化方法示意图,该方法是把模型推演的过程首先转化虚拟环境推演的过程,然后转化为智能推演的过程。模型推演中的对抗单元的模型数字化输入、规则行为的数字化输入和对抗单元行为决策数字化输出转化为智能推演中图像模型的输入和输出,模型推演中的对抗单元移动过程、编组分队过程在智能推演中对其进行离散化采样转化为图模型的序列图像,模型推演的损伤评估转化为图像模型中的各个单元的损伤和整体的损伤评估。
模型推演中的对抗单元的模型数字化输入、规则行为的数字化输入转化为智能推演中图像模型的输入,以图像(R,G,B)像素为基础进行转化,其具体步骤为:
1)构建对抗单元状态模型属性图像,图像中某点像素(Ra,Ga,Ba)代表对抗单元状态模型属性,Ra=125为蓝方,Ra=255为红方;Ga为对抗单元类型,Ga的值为0-255可选择256种类型;Ba为生命值,不同的对抗单元类型被同样装备击中时,损伤程度会不一样,根据Ba可以区分。对抗单元的体积以像素点(Ra,Ga,Ba) 为中心的圆,探测范围为以在兵棋单元的外围画以(50,50,50)像素值圆环。
如图2所示为对抗单元状态模型属性图像及时序变化,101为虚拟步兵、102 为虚拟导弹车、103为虚拟坦克车、104为探测范围。各对抗单元的时序变化如图1从左边图到最右边图的变化,单元在相对运动。本发明以圆形替代对抗单元,以简化对抗单元的复杂度,提高对抗仿真的速度。
2)构建对抗单元攻击、防御模型属性图像,图像中某点像素(Rb,Gb,Bb)代表对抗单元攻击、防御模型属性,Rb为攻击值,Gb为防御值,Bb为耦合度, Bb为调度员对对抗单元的熟悉程度或者多对抗单元类型协同可以为其提高攻击值。攻击范围用以像素点(Rb,Gb,Bb)为中心的圆。
3)构建对抗单元规则行为模型,对抗单元规则行为模型在对抗单元状态模型属性图像和兵棋攻击、防御模型属性图像中运动。
4)构建地图模型属性图像,图像中某点像素(Rm,0,0)代表地图模型属性,当图像中任意点的位置(xi,yi)的像素值相等时,说明处于相同的高度,若相邻点的像素值
Figure BDA0003113102170000061
时,说明地面的对抗单元可以在相邻点之间移动,空中的对抗单元不受地形限制。如图3所述为地图模型属性图像,105为河流、106为高原、107为从陆地到高原的区域、其它区域为陆地。地图属性图像限制着对抗单元的移动。
对虚拟环境推演中的移动过程、编组分队过程进行离散化采样转化为图像模型的序列图像。图像的像素大小按照对抗单元的对抗区域进行选择,如 100km×100km范围的虚拟环境推演,选用1000×1000的像素图像,对抗单元的移动过程分别在对抗单元状态模型属性图像和对抗单元攻击、防御模型属性图像中运动,每次运动的步长由每个像素对应的距离决定。
对抗单元状态、行为决策数字化输出转化为图像模型的输出,当某对抗单元状态模型属性(Ra,Ga,Ba)中的生命值Ba<T时认为不可以对抗,把该对抗单元从状态模型属性图中删除。T指的是对抗中装备损坏或者损失情况说明,T值根据不同的装备指不同,采用归一化之后,本实施例中T设定为51~76,即20~30%。在其它实施例中T值也可以设为77~85,或其它值,本发明对此不作限定。对对抗单元行为进行数字化量化,以向量α=[αik]作为行为决策输出,向量α中的αi代表是否攻击,αk代表是否聚集。
虚拟环境推演的损伤评估转化为图像模型中的各个单元的损伤和整体的损伤,对每次对抗单元状态、行为改变的输出做在图像模型下的各个单元的损伤和整体损伤,根据对抗单元状态模型属性图像中的Ba值判断,对下次的决策向量α也做损伤评估,以估计该决策向量α的优劣。
如图4所示,本发明的基于深度强化学习的对抗仿真推演网络结构图,深度卷积神经网络可以选择为VGG(Oxford Visual Geometry Group)网络结构、 googLeNet网络结构或ResNet(残差)网络结构等,网络结构包括DCNN网络结构,全连接层等。
深度强化学习的训练测试模型以兵棋状态模型属性图像为输入,回报值函数为:
Figure BDA0003113102170000071
其中f为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数,奖励值rk=f1{(Rbk,Gbk,Bbk),(Rak,Gak,Bak)}为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数。
深度强化学习的训练测试模型通过大量训练后,输出决策向量α。
本发明对虚拟环境推演进行图像模型转化,适应了深度强化学习的需求,为智能化对抗单元推演提供量化依据。
上述实施例为本发明的一种实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何背离本发明的精神实质与原理下所做的改变、修饰、代替、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种用于模型推演到智能推演的转化方法,其特征在于,该方法包括以下步骤:
将模型推演中对抗单元的模型数字化输入、规则行为的数字化输入和对抗单元行为决策数字化输出转化为智能推演中图像模型的输入和输出;
将虚拟环境推演中对抗单元的移动过程、编组分队过程在智能推演中进行离散化采样,转化为图模型的序列图像;
将虚拟环境推演的损伤评估转化为智能推演中图像模型的对抗单元的损伤和整体的损伤评估;
将所述智能推演中图像模型的输入作为深度强化学习的训练测试模型的输入,深度强化学习的训练测试模型输出动作、策略值向量;
其中,所述模型推演中对抗单元的模型数字化输入、规则行为的数字化输入转化为智能推演中图像模型的输入的步骤,包括:
构建对抗单元状态模型属性图像,所述对抗单元状态模型属性图像中某点像素(Ra,Ga,Ba)代表对抗单元状态模型属性,其中Ra代表对抗方,Ga为对抗单元类型,Ba为生命值,对抗单元为以像素点(Ra,Ga,Ba)为中心的圆,探测范围为对抗单元外围预设值大小的圆环;
构建对抗单元攻击、防御模型属性图像,所述对抗单元攻击、防御模型属性图像中某点像素(Rb,Gb,Bb)代表对抗单元攻击、防御模型属性,其中Rb为攻击值,Gb为防御值,Bb为耦合度,Bb为调度员对对抗单元的熟悉程度或多对抗单元类型协同程度,攻击范围是像素点(Rb,Gb,Bb)为中心的圆;
构建对抗单元规则行为模型,所述对抗单元规则行为模型在所述对抗单元状态模型属性图像和所述对抗单元攻击、防御模型属性图像中运动;
构建地图模型属性图像,图像中某点像素(Rm,0,0)代表地图模型属性,其中Rm代表高度的像素值,当图像中任意点的位置(xi,yi)的像素值相等时,说明处于相同的高度;当相邻点的像素值距离
Figure FDA0003565469700000021
小于设定值时,说明地面的对抗单元可在相邻点之间移动;
对抗单元状态、行为决策数字化输出转化为图像模型的输出,当对抗单元状态模型属性(Ra,Ga,Ba)中的生命值Ba<T时认为不可以对抗,把该对抗单元从所述状态模型属性图像中删除,其中T指对抗中装备损坏或损失情况说明;
对对抗单元行为决策进行数字化量化,以决策向量α=[αik]作为行为决策输出,其中αi代表是否攻击,αk代表是否聚集。
2.根据权利要求1所述的用于模型推演到智能推演的转化方法,其特征在于,所述将虚拟环境推演中对抗单元的移动过程、编组分队过程在智能推演中进行离散化采样,转化为图模型的序列图像的方法如下:
图像的像素大小按照对抗单元的对抗区域进行设置,特定大小范围的虚拟环境推演,选用预设大小的像素图像,对抗单元的移动过程分别在所述对抗单元状态模型属性图像和所述对抗单元攻击、防御模型属性图像中运动,每次运动的步长由每个像素对应的距离决定。
3.根据权利要求1所述的用于模型推演到智能推演的转化方法,其特征在于,所述将虚拟环境推演的损伤评估转化为图像模型中的各个单元的损伤和整体的损伤评估的步骤包括,对每次对抗单元状态、行为改变的输出在图像模型下评估各个单元的损伤和整体损伤,根据对抗单元的状态模型属性图像中的Ba值判断,并对下次的所述决策向量α做损伤评估,以估计所述决策向量α的优劣。
4.根据权利要求1所述的用于模型推演到智能推演的转化方法,其特征在于,所述深度强化学习的训练测试模型以所述攻击、防御模型属性图像和所述对抗单元状态模型属性图像为输入,回报值函数为
Figure FDA0003565469700000022
其中f为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数,奖励值rk=f{(Rbk,Gbk,Bbk),(Rak,Gak,Bak)}为以攻击、防御模型属性图像、对抗单元状态模型属性图像构成的函数;
深度强化学习的训练测试模型输出所述决策向量α。
5.根据权利要求4所述的用于模型推演到智能推演的转化方法,其特征在于,所述深度强化学习使用VGG、GoogLeNet或ResNet网络进行。
CN202110656539.2A 2021-06-11 2021-06-11 一种用于模型推演到智能推演的转化方法 Active CN113283111B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110656539.2A CN113283111B (zh) 2021-06-11 2021-06-11 一种用于模型推演到智能推演的转化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110656539.2A CN113283111B (zh) 2021-06-11 2021-06-11 一种用于模型推演到智能推演的转化方法

Publications (2)

Publication Number Publication Date
CN113283111A CN113283111A (zh) 2021-08-20
CN113283111B true CN113283111B (zh) 2022-05-27

Family

ID=77284625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110656539.2A Active CN113283111B (zh) 2021-06-11 2021-06-11 一种用于模型推演到智能推演的转化方法

Country Status (1)

Country Link
CN (1) CN113283111B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636699A (zh) * 2018-11-06 2019-04-16 中国电子科技集团公司第五十二研究所 一种基于深度强化学习的无监督智能作战推演系统
CN110807291A (zh) * 2019-10-10 2020-02-18 南京摄星智能科技有限公司 一种基于拟态对抗学习机制的现场态势未来引导技术
CN112304960A (zh) * 2020-12-30 2021-02-02 中国人民解放军国防科技大学 一种基于深度学习的高分辨率图像物体表面缺陷检测方法
CN112364500A (zh) * 2020-11-09 2021-02-12 中国科学院自动化研究所 面向强化学习训练与评估的多并发实时对抗系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11120303B2 (en) * 2018-12-17 2021-09-14 King Fahd University Of Petroleum And Minerals Enhanced deep reinforcement learning deep q-network models
US11314984B2 (en) * 2019-08-20 2022-04-26 International Business Machines Corporation Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636699A (zh) * 2018-11-06 2019-04-16 中国电子科技集团公司第五十二研究所 一种基于深度强化学习的无监督智能作战推演系统
CN110807291A (zh) * 2019-10-10 2020-02-18 南京摄星智能科技有限公司 一种基于拟态对抗学习机制的现场态势未来引导技术
CN112364500A (zh) * 2020-11-09 2021-02-12 中国科学院自动化研究所 面向强化学习训练与评估的多并发实时对抗系统
CN112304960A (zh) * 2020-12-30 2021-02-02 中国人民解放军国防科技大学 一种基于深度学习的高分辨率图像物体表面缺陷检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于深度强化学习的兵棋推演决策方法框架;崔文华等;《国防科技》;20200420(第02期);118-126 *
战斗机嵌入式训练系统中的智能虚拟陪练;陈斌等;《航空学报》;20201231(第06期);366-380 *

Also Published As

Publication number Publication date
CN113283111A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN113222106B (zh) 一种基于分布式强化学习的智能兵棋推演方法
CN113625569B (zh) 一种基于混合决策模型的小型无人机防控决策方法及系统
CN113723013B (zh) 一种用于连续空间兵棋推演的多智能体决策方法
CN105678030B (zh) 基于专家系统和战术战法分形化的空战战术团队仿真方法
CN113298260B (zh) 一种基于深度强化学习的对抗仿真推演方法
CN114358141A (zh) 一种面向多作战单元协同决策的多智能体增强学习方法
CN113282061A (zh) 一种基于课程学习的无人机空中博弈对抗的解决方法
CN116661503B (zh) 一种基于多智能体安全强化学习的集群航迹自动规划方法
CN113159266B (zh) 基于麻雀搜索神经网络的空战机动决策方法
CN114722998B (zh) 一种基于cnn-ppo的兵棋推演智能体构建方法
CN111523177B (zh) 一种基于智能学习的空战对抗自主决策方法及系统
CN114841068A (zh) 一种三维高仿真兵棋推演平台与方法
CN114330093A (zh) 基于dqn的航空兵多平台协同智能对抗决策方法
CN113283111B (zh) 一种用于模型推演到智能推演的转化方法
CN118416460A (zh) 一种基于异构图神经网络的可解释兵棋预测方法及系统
CN115293022A (zh) 基于OptiGAN和时空注意力的航空兵智能体对抗行为建模方法
Wang et al. Learning embedding features based on multisense-scaled attention architecture to improve the predictive performance of air combat intention recognition
CN116036613A (zh) 一种实现兵棋推演智能决策的系统和方法
CN116360483A (zh) 基于局部观测信息的多无人机协同攻防对抗方法及系统
Zhang et al. Intelligent battlefield situation comprehension method based on deep learning in wargame
CN116644649A (zh) 一种面向海空对抗的多智能体分布式协同决策方法
CN110751869B (zh) 一种基于对抗鉴别式迁移法的拟态环境与战场态势策略转移技术
CN114254722B (zh) 一种面向博弈对抗的多智能模型融合方法
CN114611669B (zh) 一种基于双经验池ddpg网络的兵棋推演智能决策方法
Hu et al. The research of ASW helicopter ACGF construction based on CXBR

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant