CN114897267A - 面向多对多智能体协同作战场景的火力分配方法及系统 - Google Patents
面向多对多智能体协同作战场景的火力分配方法及系统 Download PDFInfo
- Publication number
- CN114897267A CN114897267A CN202210665590.4A CN202210665590A CN114897267A CN 114897267 A CN114897267 A CN 114897267A CN 202210665590 A CN202210665590 A CN 202210665590A CN 114897267 A CN114897267 A CN 114897267A
- Authority
- CN
- China
- Prior art keywords
- enemy
- many
- fire
- army
- red
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000019771 cognition Effects 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010304 firing Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 125000004836 hexamethylene group Chemical group [H]C([H])([*:2])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[*:1] 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 description 54
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了面向多对多智能体协同作战场景的火力分配方法及系统,所述方法包括:确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。
Description
技术领域
本发明涉及人工智能中的博弈决策技术领域,尤其涉及一种面向多对多智能体协同作战场景的火力分配方法、系统、终端及计算机可读存储介质。
背景技术
随着卫星遥感、雷达、技侦等侦测手段的发展,出现了包含图像、文本等多种形式的态势描述数据,其中图像数据是一种常见的态势信息传递及决策指挥的处理输入,但图像传输具有高带宽、高通信要求,导致指挥者不能做出较优的态势认知及指挥决策,因此语义态势的处理及认知将会成为未来的研究趋势。以语义态势为背景的多对多的智能体协同作战中,会出现多个已方智能体与多个敌方智能体可以相互攻击,需要在最大程度上选择合适的火力分配方案,使武器系统对敌方的多批目标尽可能地分配给它们射击最有利的火力单元,以达到最优的整体抗击效果,发挥最大的作战效能和防御效能。
在火力分配问题上,每一个智能体都有至少一个可攻击对象,即每一个智能体都可能有多种攻击选择。火力分配的目的,就是对每一个智能体找到一种攻击选择,使得在协同作战的情况下,对敌方造成最大的损伤。当己方和敌方智能体的数量较少时,可以使用穷举法,穷举各种可能的火力分配策略,然后根据火力分配策略可以计算出在一定的攻击命中率下对敌方的期望损伤,然后找到最优的火力分配算法。当智能体的数量较多时,则需要寻找一个更优的算法进行求解。火力分配问题实质上是一种整数型非线性组合优化决策问题,在计算机的复杂性理论上,属于NP难问题,即需要超多项式时间才能求解的问题。
在作战环境中,需要快速地对火力分配问题作出决策。穷举法在最坏情况下复杂度是指数时间级别,耗时可能会极端漫长,计算代价过大,而模拟退火法、禁忌搜索算法、遗传算法和群智能算法等算法的实时性和动态性较差,无法应用于复杂多变的作战环境。另外,任务分配过程中不确定性事件是不可避免的,追求全局最优的方法势必很难满足任务分配实时性的要求。因此,次优、快速的任务分配方法在解决任务规划问题时的实时性优势会更加明显。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种面向多对多智能体协同作战场景的火力分配方法、系统、终端及计算机可读存储介质,旨在解决现有技术中活力分配方法无法满足任务分配实时性要求的问题。
为实现上述目的,本发明提供一种面向多对多智能体协同作战场景的火力分配方法,所述面向多对多智能体协同作战场景的火力分配方法包括如下步骤:
确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;
基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;
基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;
构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则,之后还包括:
搭建红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息,具体包括:
构建语义态势认知模块,针对红蓝双方态势语义信息进行语义态势的解析和语义认知得到向量化的敌我位置、敌方对我方的威胁度的态势信息;
初始化交战字典A,记录每一个我方单位可以攻击到的敌方单位;其中,关键字:己方单位army,值:可攻击的敌方列表;初始值为空,表示目前每一个我方单位都没有可攻击的敌方单位;
A[army]={};
其中,army表示我方单元的集合;A[army]表示用于存储我方单位可攻击到的敌人的集合信息;
初始化瞄准字典B,记录每一个敌方单位已经被瞄准攻击的火力的命中率列表;其中,关键字:敌方单位enemy,值:已经被瞄准攻击的单位列表的命中概率;在算法初期,所有值都为空,表示目前敌方单位都没有被我方单位瞄准攻击,此时尚未分配火力攻击的目标;
B[enemy]=[];
其中,enemy表示敌方单元的集合;B[enemy]表示用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息;
基于所述语义态势认知模块解析后的向量化态势信息计算交战字典A,保存每个己方单位army可攻击到的敌方列表:遍历自己的所有单位,计算每个单位可攻击的敌方单位,并加入到A[army]中;此时,每个A[army]中的元素是army单位能够攻击的enemy单位的集合。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象,具体包括:
循环遍历army,找到只可攻击一个敌方单位的己方进行先分配;若存在某个armyi,A[armyi]的元素数等于1,则确定该armyi攻击A[armyi]的唯一元素;
取出敌方单位:enemyj=A[armyi];
更新攻击关系:P[armyi]=enemyj;
army的火力命中概率加入到B[enemy]:B[enemyj]=p;
其中,P[army]用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素;p表示环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率;
循环遍历enemy,找到当前被已分配的火力击毙概率最小的敌方,每一次只分配一个火力;根据瞄准字典B计算被摧毁概率,从小到大排序,寻找一个能攻击此敌方的己方单位,分配并更新;
若当前enemyi是被摧毁概率最小的敌人,如果enemyi∈A[armyj]且P[armyi]为空,则存在一个armyj尚未被指定打击对象,则制定armyj的打击对象为enemyi;
再次进入遍历,直到所有我方单位都被指定了打击对象为止。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,通过语义矩阵对所述红蓝对抗问题想定进行表达,以将博弈对抗问题的图像信息转化为语义信息。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,所述语义矩阵包括:攻击矩阵、火力命中概率集合矩阵和对敌攻击关系矩阵。
所述的面向多对多智能体协同作战场景的火力分配方法,其中,基于向量化火力打击结果生成火力打击对象决策语义的目标为寻找火力分配策略使得敌方的期望损伤最大。
此外,为实现上述目的,本发明还提供一种面向多对多智能体协同作战场景的火力分配系统,其中,所述面向多对多智能体协同作战场景的火力分配系统包括:
想定确认模块,用于确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;
建模转化模块,用于基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;
火力计算模块,用于基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;
生成执行模块,用于构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
此外,为实现上述目的,本发明还提供一种终端,其中,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被所述处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。
本发明中,确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。本发明在多对多的智能体协同作战中针对智能体火力分配的方法,形成了有效的博弈策略求解方法,为智能体有效掌握战场态势、合理分配侦测资源、为作战单元提供信息支持,尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。
附图说明
图1是本发明面向多对多智能体协同作战场景的火力分配方法的较佳实施例的流程图;
图2是本发明面向多对多智能体协同作战场景的火力分配方法的较佳实施例中火力分配问题求解过程的示意图;
图3是本发明面向多对多智能体协同作战场景的火力分配系统的较佳实施例的原理示意图;
图4为本发明终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的目的在于提供一种火力分配问题的求解方法,主要针对多智能体实时对战过程中如何正确地对每一个智能体选择攻击对象,从而得到一个好的协同攻击策略。
其中,火力分配问题可以进行如下描述:假设我方单位的单位数为M,敌方单位数量为N,我方单位i在一个时刻可利用的火力数量为1(若我方单位I在同一时刻可使用多个火力,则单位i可以抽象成多个单位,每个单位携带1个火力),第i个我方单位的单发命中概率为Pi(其中i=1,2,...,M),则火力分配决策矩阵为:
矩阵中,xi,j∈{0,1}表示我方单位i是否攻击敌方单位j。火力分配的目标为使得敌方受到的期望损伤最大。于是火力分配模型可描述为,寻找问题的一组解X,满足以下目标函数与约束条件:
目标函数:
约束条件:
xij∈{0,1};
此多单位协同火力分配的数学模型是一个0-1规划问题。
本发明不对原始问题求得全局最优解,而是基于贪心算法的思想,建立了一个以最大化期望损伤为目标的多单位协同火力分配算法,求解得到次优解。
本发明较佳实施例所述的面向多对多智能体协同作战场景的火力分配方法,如图1所示,所述面向多对多智能体协同作战场景的火力分配方法包括以下步骤:
步骤S1、确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则。
具体地,先确定红蓝对抗问题想定,包含红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则,并搭建红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息。
步骤S2、基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息。
具体地,基于语义的想定建模,对红蓝双方对抗的环境进行抽象,忽略掉通过图像形式表达的具体地理位置信息,通过语义矩阵(例如可以是攻击矩阵、火力命中概率集合矩阵、对敌攻击关系矩阵)对想定进行表达,从而实现将博弈对抗问题的图像信息转化为语义信息。相较于传统的图像输入模式,该方法可以极大减小系统输入输出的数据规模,提升运行效率。
本发明主要用到的数据结构如下:
army:我方单元的集合;
enemy:敌方单元的集合;
A[army]:用于存储我方单位可以攻击到的敌人的集合信息;
B[enemy]:用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息;
P[army]:用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素,也就是算法的最终计算结果;
p:环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率。
所述步骤S2具体包括如下步骤:
步骤201:构建语义态势认知模块,针对红蓝双方态势语义信息进行语义态势的解析和语义认知得到向量化的敌我位置、敌方对我方的威胁度的态势信息,支持上述数据结构的初始化及计算。
步骤202:初始化交战字典A,记录每一个我方单位可以攻击到的敌方单位;其中,关键字:己方单位army,值:可攻击的敌方列表;初始值为空,表示目前每一个我方单位都没有可攻击的敌方单位,后续将计算进行填充;
A[army]={}; (2-1)
其中,army表示我方单元的集合;A[army]表示用于存储我方单位可攻击到的敌人的集合信息。
步骤203:初始化瞄准字典B,记录每一个敌方单位已经被瞄准攻击的火力的命中率列表;其中,关键字:敌方单位enemy,值:已经被瞄准攻击的单位列表的命中概率;在算法初期,所有值都为空,表示目前敌方单位都没有被我方单位瞄准攻击,因为此时尚未分配火力攻击的目标;
B[enemy]=[]; (2-2)
其中,enemy表示敌方单元的集合;B[enemy]表示用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息。
步骤204:基于步骤201的所述语义态势认知模块解析后的向量化态势信息计算交战字典A,保存每个己方单位army可攻击到的敌方列表:遍历自己的所有单位,计算每个单位可攻击的敌方单位,并加入到A[army]中;此时,每个A[army]中的元素是army单位能够攻击的enemy单位的集合。
例如,army1可以攻击到enemy2和enemy5,则:
A[army1]={enemy2,enemy5}; (2-3)
步骤S3、基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象。
具体地,所述步骤S3具体包括如下步骤:
步骤301:循环遍历army,找到只可攻击一个敌方单位的己方,先分配,即如果存在某个armyi,A[armyi]的元素数等于1,则确定该armyi攻击A[armyi]的唯一元素。
取出敌方单位:
enemyj=A[armyi];
更新攻击关系:
P[armyi]=enemyj; (3-1)
army的火力命中概率加入到B[enemy];
即:B[enemyj]=p; (3-2)
其中,P[army]用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素;p表示环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率。
步骤302:循环遍历enemy,找到当前被已分配的火力击毙概率最小的敌方,每一次只分配一个火力。
根据瞄准字典B计算被摧毁概率,从小到大排序,然后寻找一个能攻击此敌方的己方单位,分配并更新。假设当前enemyi是被摧毁概率最小的敌人,如果enemyi∈A[armyj]且P[armyi]为空。即存在一个armyj尚未被指定打击对象,则制定armyj的打击对象为enemyi。
步骤303:再次进入遍历,直到所有我方单位都被指定了打击对象为止。
步骤S4、构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
其中,基于向量化火力打击结果生成火力打击对象决策语义的目标为寻找火力分配策略使得敌方的期望损伤最大。
本发明算法的伪代码如下:
进一步地,为了说明本发明的技术方案,举例如图2所示,图2中黑色圆圈表示蓝方,白色圆圈表示红方:
步骤1:假设红蓝对抗问题为陆军枪战,己方为蓝方,敌方为红方,红蓝双方各有5个小兵,每一个小兵的射击命中概率都为0.5;对每一个蓝方小兵,其可攻击对象如图2所示。
步骤2:初始化数据结构的值;
army:{1,2,3,4,5};
enemy:{1,2,3,4,5};
A:{1:[2],2:[2,4],3:[1,3],4:[3,4,5],5:[4,5]};
B:{1:[],2:[],3:[],4:[],5:[]};
P:{1:[],2:[],3:[],4:[],5:[]};
p:0.5;
步骤3:计算火力分配的方案;
步骤3.1:蓝方小兵1只有1个攻击对象,该对象为红方小兵2,故该小兵的策略可确定;
P[1]=A[1]=[2];
B[2]=[0.5];
A[1]=[];
数据结构A、B、P的取值更新为如下:
A:{1:[],2:[2,4],3:[1,3],4:[3,4,5],5:[4,5]};
B:{1:[],2:[0.5],3:[],4:[],5:[]};
P:{1:[2],2:[],3:[],4:[],5:[]};
步骤3.2:
(1)B中红方小兵1被击毙的概率最小,概率为0,故对红方小兵1分火力,蓝方小兵3可以攻击红方小兵1,故将蓝方小兵3的火力分配到红方小兵1上,A、B、P的取值更新为如下:
A:{1:[],2:[2,4],3:[],4:[3,4,5],5:[4,5]};
B:{1:[0.5],2:[0.5],3:[],4:[],5:[]};
P:{1:[2],2:[],3:[1],4:[],5:[]};
(2)B中红方小兵3被击毙的概率最小,概率为0,故对红方小兵3分火力,蓝方小兵4可以攻击红方小兵3,故将蓝方小兵4的火力分配到红方小兵3上,A、B、P的取值更新为如下:
A:{1:[],2:[2,4],3:[],4:[],5:[4,5]};
B:{1:[0.5],2:[0.5],3:[0.5],4:[],5:[]};
P:{1:[2],2:[],3:[1],4:[3],5:[]};
(3)B中红方小兵4被击毙的概率最小,概率为0,故对红方小兵4分火力,蓝方小兵2可以攻击红方小兵4,故将蓝方小兵2的火力分配到红方小兵4上,A、B、P的取值更新为如下:
A:{1:[],2:[],3:[],4:[],5:[4,5]};
B:{1:[0.5],2:[0.5],3:[0.5],4:[0.5],5:[]};
P:{1:[2],2:[4],3:[1],4:[3],5:[]};
(4)B中红方小兵5被击毙的概率最小,概率为0,故对红方小兵5分火力,蓝方小兵5可以攻击红方小兵5,故将蓝方小兵5的火力分配到红方小兵5上,A、B、P的取值更新为如下:
A:{1:[],2:[],3:[],4:[],5:[]};
B:{1:[0.5],2:[0.5],3:[0.5],4:[0.5],5:[0.5]};
P:{1:[2],2:[4],3:[1],4:[3],5:[5]};
(5)蓝方的火力全部被分配完毕,P即为蓝方的火力分配策略。
本发明属于人工智能中的博弈决策领域,具体为在多对多的智能体协同作战中针对智能体火力分配的问题进行求解的方法,最终形成有效的博弈策略求解方法,为智能体有效掌握战场态势、合理分配侦测资源、为作战单元提供信息支持。
进一步地,如图3所示,基于上述面向多对多智能体协同作战场景的火力分配方法,本发明还相应提供了一种面向多对多智能体协同作战场景的火力分配系统,其中,所述面向多对多智能体协同作战场景的火力分配系统包括:
想定确认模块51,用于确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;
建模转化模块52,用于基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;
火力计算模块53,用于基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;
生成执行模块54,用于构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
进一步地,如图4所示,基于上述面向多对多智能体协同作战场景的火力分配方法和系统,本发明还相应提供了一种终端,所述终端包括处理器10、存储器20及显示器30。图4仅示出了终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述终端的内部存储单元,例如终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述终端的应用软件及各类数据,例如所述安装终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有面向多对多智能体协同作战场景的火力分配程序40,该面向多对多智能体协同作战场景的火力分配程序40可被处理器10所执行,从而实现本申请中面向多对多智能体协同作战场景的火力分配方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述面向多对多智能体协同作战场景的火力分配方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述终端的信息以及用于显示可视化的用户界面。所述终端的部件10-30通过系统总线相互通信。
在一实施例中,当处理器10执行所述存储器20中面向多对多智能体协同作战场景的火力分配程序40时实现面向多对多智能体协同作战场景的火力分配方法的步骤。
本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被处理器执行时实现如上所述的面向多对多智能体协同作战场景的火力分配方法的步骤。
有益效果:
(1)本发明提出了面向多智能体群体对抗的概率攻击火力分配方法,可以解决此类问题的一般性求解。
(2)本发明基于语义的想定建模,将想定进行结构化抽象,将博弈对抗问题的图像信息转化为语义信息,通过语义矩阵进行表达;相较于传统的图像输入模式,该方法可以极大减小系统输入输出的数据规模,提升运行效率。
(3)应用本发明方法可以解决复杂环境下多智能体对抗中的算法复杂度与智能体数量指数型关联的问题,提出了一种线性时间关联的火力分配求解算法,用于求解时间受限的博弈决策问题。
(4)本发明寻找到了一种火力分配策略,使得敌方的期望损伤最大,尽可能地将火力均匀分配到各个敌方上,使得每一个火力都最大化地得到利用。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的计算机可读存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的计算机可读存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种面向多对多智能体协同作战场景的火力分配方法,其特征在于,所述面向多对多智能体协同作战场景的火力分配方法包括:
确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;
基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;
基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;
构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
2.根据权利要求1所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,所述确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则,之后还包括:
搭建红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息。
3.根据权利要求1所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,所述基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息,具体包括:
构建语义态势认知模块,针对红蓝双方态势语义信息进行语义态势的解析和语义认知得到向量化的敌我位置、敌方对我方的威胁度的态势信息;
初始化交战字典A,记录每一个我方单位可以攻击到的敌方单位;其中,关键字:己方单位army,值:可攻击的敌方列表;初始值为空,表示目前每一个我方单位都没有可攻击的敌方单位;
A[army]={};
其中,army表示我方单元的集合;A[army]表示用于存储我方单位可攻击到的敌人的集合信息;
初始化瞄准字典B,记录每一个敌方单位已经被瞄准攻击的火力的命中率列表;其中,关键字:敌方单位enemy,值:已经被瞄准攻击的单位列表的命中概率;在算法初期,所有值都为空,表示目前敌方单位都没有被我方单位瞄准攻击,此时尚未分配火力攻击的目标;
B[enemy]=[];
其中,enemy表示敌方单元的集合;B[enemy]表示用于存储已经分配的敌方单位受到我方哪些单位攻击的火力命中概率集合信息;
基于所述语义态势认知模块解析后的向量化态势信息计算交战字典A,保存每个己方单位army可攻击到的敌方列表:遍历自己的所有单位,计算每个单位可攻击的敌方单位,并加入到A[army]中;此时,每个A[army]中的元素是army单位能够攻击的enemy单位的集合。
4.根据权利要求3所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,所述基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象,具体包括:
循环遍历army,找到只可攻击一个敌方单位的己方进行先分配;若存在某个armyi,A[armyi]的元素数等于1,则确定该armyi攻击A[armyi]的唯一元素;
取出敌方单位:enemyj=A[armyi];
更新攻击关系:P[armyi]=enemyj;
army的火力命中概率加入到B[enemy]:B[enemyj]=p;
其中,P[army]用于存储我方对敌方的攻击关系,每个位置仅仅保存一个元素;p表示环境提前设定的火力命中概率,是一个0~1之间的概率值,代表了单位一次开火可能击毙对方的概率;
循环遍历enemy,找到当前被已分配的火力击毙概率最小的敌方,每一次只分配一个火力;根据瞄准字典B计算被摧毁概率,从小到大排序,寻找一个能攻击此敌方的己方单位,分配并更新;
若当前enemyi是被摧毁概率最小的敌人,如果enemyi∈A[armyj]且P[armyi]为空,则存在一个armyj尚未被指定打击对象,则制定armyj的打击对象为enemyi;
再次进入遍历,直到所有我方单位都被指定了打击对象为止。
5.根据权利要求1所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,通过语义矩阵对所述红蓝对抗问题想定进行表达,以将博弈对抗问题的图像信息转化为语义信息。
6.根据权利要求5所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,所述语义矩阵包括:攻击矩阵、火力命中概率集合矩阵和对敌攻击关系矩阵。
7.根据权利要求1所述的面向多对多智能体协同作战场景的火力分配方法,其特征在于,基于向量化火力打击结果生成火力打击对象决策语义的目标为寻找火力分配策略使得敌方的期望损伤最大。
8.一种面向多对多智能体协同作战场景的火力分配系统,其特征在于,所述面向多对多智能体协同作战场景的火力分配系统包括:
想定确认模块,用于确定红蓝对抗问题想定,所述红蓝对抗问题想定包括红蓝对抗单元的种类、数量、射击间隔及对抗问题、红蓝双方的目标任务和胜负判断准则;
建模转化模块,用于基于语义的想定建模,将所述红蓝对抗问题想定进行结构化抽象,并将博弈对抗问题的图像信息转化为语义信息;
火力计算模块,用于基于语义态势认知模块计算火力分配方案,并将所有我方单位指定打击对象;
生成执行模块,用于构建语义体系,基于向量化火力打击结果生成火力打击对象决策语义,并执行当前决策指令。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被所述处理器执行时实现如权利要求1-7任一项所述的面向多对多智能体协同作战场景的火力分配方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有面向多对多智能体协同作战场景的火力分配程序,所述面向多对多智能体协同作战场景的火力分配程序被处理器执行时实现如权利要求1-7任一项所述的面向多对多智能体协同作战场景的火力分配方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665590.4A CN114897267B (zh) | 2022-06-14 | 2022-06-14 | 面向多对多智能体协同作战场景的火力分配方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665590.4A CN114897267B (zh) | 2022-06-14 | 2022-06-14 | 面向多对多智能体协同作战场景的火力分配方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114897267A true CN114897267A (zh) | 2022-08-12 |
CN114897267B CN114897267B (zh) | 2024-02-27 |
Family
ID=82728340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210665590.4A Active CN114897267B (zh) | 2022-06-14 | 2022-06-14 | 面向多对多智能体协同作战场景的火力分配方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114897267B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452011A (zh) * | 2023-03-14 | 2023-07-18 | 中国人民解放军32370部队 | 一种用于智能体决策的数据处理方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2271047A1 (en) * | 2009-06-22 | 2011-01-05 | Deutsche Telekom AG | Game theoretic recommendation system and method for security alert dissemination |
CN112364972A (zh) * | 2020-07-23 | 2021-02-12 | 北方自动控制技术研究所 | 基于深度强化学习的无人战车分队火力分配方法 |
CN113435598A (zh) * | 2021-07-08 | 2021-09-24 | 中国人民解放军国防科技大学 | 知识驱动下的兵棋推演智能决策方法 |
CN113656962A (zh) * | 2021-08-16 | 2021-11-16 | 中国电子科技集团公司第五十四研究所 | 一种基于信息流的战略层博弈推演方法 |
CN114139550A (zh) * | 2022-02-08 | 2022-03-04 | 中国电子科技集团公司第五十四研究所 | 一种基于活动语义文本消息的态势智能认知方法 |
CN114282833A (zh) * | 2021-12-28 | 2022-04-05 | 航天科工智能运筹与信息安全研究院(武汉)有限公司 | 一种基于规则的海空联合作战行动分层任务规划方法 |
CN114358141A (zh) * | 2021-12-14 | 2022-04-15 | 中国运载火箭技术研究院 | 一种面向多作战单元协同决策的多智能体增强学习方法 |
CN114492749A (zh) * | 2022-01-24 | 2022-05-13 | 中国电子科技集团公司第五十四研究所 | 面向限时红蓝对抗问题动作空间解耦的博弈决策方法 |
-
2022
- 2022-06-14 CN CN202210665590.4A patent/CN114897267B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2271047A1 (en) * | 2009-06-22 | 2011-01-05 | Deutsche Telekom AG | Game theoretic recommendation system and method for security alert dissemination |
CN112364972A (zh) * | 2020-07-23 | 2021-02-12 | 北方自动控制技术研究所 | 基于深度强化学习的无人战车分队火力分配方法 |
CN113435598A (zh) * | 2021-07-08 | 2021-09-24 | 中国人民解放军国防科技大学 | 知识驱动下的兵棋推演智能决策方法 |
CN113656962A (zh) * | 2021-08-16 | 2021-11-16 | 中国电子科技集团公司第五十四研究所 | 一种基于信息流的战略层博弈推演方法 |
CN114358141A (zh) * | 2021-12-14 | 2022-04-15 | 中国运载火箭技术研究院 | 一种面向多作战单元协同决策的多智能体增强学习方法 |
CN114282833A (zh) * | 2021-12-28 | 2022-04-05 | 航天科工智能运筹与信息安全研究院(武汉)有限公司 | 一种基于规则的海空联合作战行动分层任务规划方法 |
CN114492749A (zh) * | 2022-01-24 | 2022-05-13 | 中国电子科技集团公司第五十四研究所 | 面向限时红蓝对抗问题动作空间解耦的博弈决策方法 |
CN114139550A (zh) * | 2022-02-08 | 2022-03-04 | 中国电子科技集团公司第五十四研究所 | 一种基于活动语义文本消息的态势智能认知方法 |
Non-Patent Citations (1)
Title |
---|
姚宗信;李明;陈宗基;: "基于博弈论模型的多机协同对抗多目标任务决策方法", 航空计算技术, no. 03, pages 11 - 15 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452011A (zh) * | 2023-03-14 | 2023-07-18 | 中国人民解放军32370部队 | 一种用于智能体决策的数据处理方法及装置 |
CN116452011B (zh) * | 2023-03-14 | 2023-10-24 | 中国人民解放军32370部队 | 一种用于智能体决策的数据处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114897267B (zh) | 2024-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107886184B (zh) | 一种多型防空武器混编火力群目标分配优化方法 | |
Xin et al. | An efficient rule-based constructive heuristic to solve dynamic weapon-target assignment problem | |
Bogdanowicz et al. | Optimization of weapon–target pairings based on kill probabilities | |
Li et al. | Modified particle swarm optimization for BMDS interceptor resource planning | |
Chen et al. | Evolutionary decision-makings for the dynamic weapon-target assignment problem | |
CN112221149B (zh) | 一种基于深度强化学习的炮兵连智能作战演练系统 | |
CN113705102A (zh) | 海空集群对抗的推演仿真系统及方法、设备、存储介质 | |
CN114897267B (zh) | 面向多对多智能体协同作战场景的火力分配方法及系统 | |
CN116681223A (zh) | 一种基于增强moea/d的多阶段作战资源协同分配方法 | |
CN117077428A (zh) | 一种针对战场多维需求的火力规划目标函数的构造方法 | |
CN115328189B (zh) | 多无人机协同博弈决策方法和系统 | |
CN116151492B (zh) | 一种联合作战体系辅助决策分析系统 | |
CN113324545A (zh) | 一种基于混合增强智能的多无人机协同任务规划方法 | |
Zhao et al. | Shuffled frog leaping algorithm with non-dominated sorting for dynamic weapon-target assignment | |
Kwon et al. | A branch‐and‐price algorithm for a targeting problem | |
Song et al. | Multi-uav cooperative multi-target allocation method based on differential evolutionary algorithm | |
Xu et al. | MOQPSO‐D/S for Air and Missile Defense WTA Problem under Uncertainty | |
CN110826877B (zh) | 一种针对多个点目标的火力分配方法 | |
CN111382896B (zh) | 一种自适应混沌并行克隆选择算法的wta目标优化方法 | |
Bian et al. | Cooperative strike target assignment algorithm based on deep reinforcement learning | |
Lele | Defence applications of artificial intelligence | |
Collins et al. | Introduction: Reflecting on the Global Impact of the RMA | |
Zhao et al. | Deep Reinforcement Learning‐Based Air Defense Decision‐Making Using Potential Games | |
Akbel et al. | A performance comparison of utility functions for game theory based weapon-target assignment | |
Önel et al. | An evaluation on weapon target assignment problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |