CN114492059A - 基于场能的多智能体对抗场景态势评估方法及装置 - Google Patents

基于场能的多智能体对抗场景态势评估方法及装置 Download PDF

Info

Publication number
CN114492059A
CN114492059A CN202210115962.6A CN202210115962A CN114492059A CN 114492059 A CN114492059 A CN 114492059A CN 202210115962 A CN202210115962 A CN 202210115962A CN 114492059 A CN114492059 A CN 114492059A
Authority
CN
China
Prior art keywords
threat
unit
agent
situation
confrontation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210115962.6A
Other languages
English (en)
Other versions
CN114492059B (zh
Inventor
王建强
姜竣凯
王裕宁
黄荷叶
王嘉昊
刘艺璁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210115962.6A priority Critical patent/CN114492059B/zh
Publication of CN114492059A publication Critical patent/CN114492059A/zh
Application granted granted Critical
Publication of CN114492059B publication Critical patent/CN114492059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于场能的多智能体对抗场景态势评估方法及装置,其中,方法包括:在多智能体对抗场景下,判断多智能体对抗是否开始;如果开始多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果;基于威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束多智能体对抗,得到多智能体对抗场景的态势评估结果。由此,解决了相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。

Description

基于场能的多智能体对抗场景态势评估方法及装置
技术领域
本申请涉及对抗环境态势理解技术领域,特别涉及一种基于场能的多智能体对抗场景态势评估方法及装置。
背景技术
现代信息化条件下,对抗环境中可探测范围日益扩展,信息来源愈益广泛,这使得获取的信息数量大,含义杂,变化快,已经大大超出了人脑的信息综合能力,极易造成指控人员的认知过载现象。因此,基于多源信息融合的对抗环境态势理解判断,已经成为对抗信息系统的核心技术之一。然而,目前已有的态势评估方法难以实现现代对抗环境下的综合态势评估,其原因在于没有成熟的模型对场景中的多源信息进行统一量化和理解,导致难以对当前态势做出准确快速的判断。对抗环境态势场将对抗环境态势分为威胁态势与安全态势两类,为态势分析提供了新的研究思路。然而,如何根据威胁态势与安全态势,输出更深层次的语义级对抗环境态势理解信息,成为了新的关键难题。
相关技术主要有两种:
第一种:基于对抗信息,将对抗环境态势进行分类,主要分为能力势、效能势、综合势等。这种方法虽然实现了不同“势”的统一梳理,但是各种“势”边界模糊,并且难以实现具体量化;
第二种:基于对抗场景,针对某一种具体的场景,提出采用基于粗糙集理论、基于信息熵、基于动态贝叶斯网络等方法的态势量化模型。这种方法虽然实现了态势的量化评估,但是对抗场景无穷无尽,各种模型之间存在无法统一的问题。
综上,现有的模型大多只是提出了一些模糊的整体态势感知方法,而并未区分对抗环境中态势信息的量化评估与分析理解。
通过对现有研究的分析,可以发现当前的对抗环境态势分析理解方法主要存在以下问题:
1)尚未提出基于态势量化结果的态势分析与理解模型;
2)研究手段多为专家经验的应用,而非客观物理规律的建模,因此模型的主观性太强,可解释性不足;
3)态势评估方法缺乏实时性,无法为后续智能体决策服务;
4)态势量化结果实用性较低,无法直接反映对抗场景所处局势,因而无法支撑对抗场景的决策控制;
综上,为弥补上述不足,相关技术亟需改善。
申请内容
本申请提供一种基于场能的多智能体对抗场景态势评估方法及装置,以解决相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。
本申请第一方面实施例提供一种基于场能的多智能体对抗场景态势评估方法,包括以下步骤:在多智能体对抗场景下,判断多智能体对抗是否开始;如果开始所述多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果;以及基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据所述抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束所述多智能体对抗,得到所述多智能体对抗场景的态势评估结果。
可选地,在本申请的一个实施例中,所述利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,包括:采集多智能体的感知信息;将所述感知信息和所述多智能体的智能体数据代入预先训练的所述威胁能量场与安全能量场模型,得到所述威胁态势与安全态势量化结果。
可选地,在本申请的一个实施例中,所述基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,包括:分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;由所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成所述抗场景关键信息。
可选地,在本申请的一个实施例中,所述分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,包括:基于所述多智能体的实际对抗任务匹配权重因子;利用所述权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到所述单元威胁成功率;根据所述单元威胁成功率计算所述单元防护成功率。
可选地,在本申请的一个实施例中,所述单元相对威胁度的计算公式为:
Figure BDA0003496391480000021
其中,
Figure BDA0003496391480000031
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure BDA0003496391480000032
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
可选地,在本申请的一个实施例中,所述分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,还包括:获取各智能体单元的重要程度;根据所述各智能体单元的重要程度、所述单元威胁成功率得到所述单元威胁性价比;根据威胁能量场识别我方所掌控和对方所掌控的区域;根据所述我方所掌控和对方所掌控的区域的正负值得到所述阵地归属判定信息;将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到所述关键争夺区域判定信息。
可选地,在本申请的一个实施例中,所述最终胜率预测信息中的胜率计算公式为:
Figure BDA0003496391480000033
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000034
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000035
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
本申请第二方面实施例提供一种基于场能的多智能体对抗场景态势评估装置,包括:判断模块,用于在多智能体对抗场景下,判断多智能体对抗是否开始;计算模块,用于如果开始所述多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果;以及评估模块,用于基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据所述抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束所述多智能体对抗,得到所述多智能体对抗场景的态势评估结果。
可选地,在本申请的一个实施例中,所述计算模块,包括:采集单元,用于采集多智能体的感知信息;第一计算单元,用于将所述感知信息和所述多智能体的智能体数据代入预先训练的所述威胁能量场与安全能量场模型,得到所述威胁态势与安全态势量化结果。
可选地,在本申请的一个实施例中,所述评估模块,包括:第二计算单元,用于分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;生成单元,用于由所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成所述抗场景关键信息。
可选地,在本申请的一个实施例中,所述生成单元,包括:匹配子单元,用于基于所述多智能体的实际对抗任务匹配权重因子;第一计算子单元,用于利用所述权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到所述单元威胁成功率;第二计算子单元,用于根据所述单元威胁成功率计算所述单元防护成功率。
可选地,在本申请的一个实施例中,所述单元相对威胁度的计算公式为:
Figure BDA0003496391480000041
其中,
Figure BDA0003496391480000042
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure BDA0003496391480000043
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
可选地,在本申请的一个实施例中,所述生成单元,进一步用于:获取各智能体单元的重要程度;根据所述各智能体单元的重要程度、所述单元威胁成功率得到所述单元威胁性价比;根据威胁能量场识别我方所掌控和对方所掌控的区域;根据所述我方所掌控和对方所掌控的区域的正负值得到所述阵地归属判定信息;将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到所述关键争夺区域判定信息。
可选地,在本申请的一个实施例中,所述最终胜率预测信息中的胜率计算公式为:
Figure BDA0003496391480000044
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000045
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000046
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的基于场能的多智能体对抗场景态势评估方法。
本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于场能的多智能体对抗场景态势评估方法。
本申请实施例可以通过建立威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,得到对抗场景关键信息,并对各类态势理解信息的数值进行更新,同时在结束更新后,结束多智能体对抗,进而得到多智能体对抗场景的态势评估结果,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。由此,解决了相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种基于场能的多智能体对抗场景态势评估方法的流程图;
图2为根据本申请一个具体实施例提供的单元重要程度评价模型示意图;
图3为根据本申请一个具体实施例提供的基于场能的多智能体对抗场景态势评估方法的流程图;
图4为根据本申请一个具体实施例提供的对抗场景态势分析应用样例图;
图5为根据本申请一个具体实施例提供的阵地归属与前线判定示意图;
图6为根据本申请一个具体实施例提供的关键争夺区域示意图;
图7为根据本申请实施例提供的一种基于场能的多智能体对抗场景态势评估装置的结构示意图;
图8为根据本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的基于场能的多智能体对抗场景态势评估方法及装置。针对上述背景技术中心提到的相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制的问题,本申请提供了一种基于场能的多智能体对抗场景态势评估方法,在该方法中,可以通过建立威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,得到对抗场景关键信息,并对各类态势理解信息的数值进行更新,同时在结束更新后,结束多智能体对抗,进而得到多智能体对抗场景的态势评估结果,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。由此,解决了相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。
具体而言,图1为本申请实施例所提供的一种基于场能的多智能体对抗场景态势评估方法的流程示意图。
如图1所示,该基于场能的多智能体对抗场景态势评估方法包括以下步骤:
在步骤S101中,在多智能体对抗场景下,判断多智能体对抗是否开始。
在实际执行过程中,本申请实施例可以通过自身配置的传感器实时监测周边环境情况,确定当前多智能体对抗场景下,多智能体对抗是否开始。
在步骤S102中,如果开始多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果。
具体地,若判断多智能体对抗开始,对抗双方的智能体不断移动并采取不同行动,本申请实施例可以通过自身配置的传感器实时监测周边环境情况,并调用图像传感器、激光雷达、GPS等传感器数据,以便于对威胁态势与安全态势的获取。进一步地,本申请实施例可以利用预先建立的威胁能量场与安全能量场模型中,进而得到威胁态势与安全态势的量化结果,以便于后续进行态势分析。
可选地,在本申请的一个实施例中,利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,包括:采集多智能体的感知信息;将感知信息和多智能体的智能体数据代入预先训练的威胁能量场与安全能量场模型,得到威胁态势与安全态势量化结果。
作为一种可能实现的方式,本申请实施例可以将感知结果与从智能体数据库中提取的信息输入预先建立的威胁能量场与安全能量场模型中,进而得到威胁态势与安全态势的量化结果,以便于后续进行态势分析。本申请是实力可以通过建立威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,为后续得到多智能体对抗场景的态势评估结果奠定基础,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。
在步骤S103中,基于威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束多智能体对抗,得到多智能体对抗场景的态势评估结果。
具体地,本申请实施例可以根据上述步骤中获取的威胁态势与安全态势量化结果,进行态势分析,得到各类态势理解信息的计算结果,进而对各项数值进行更新。计算完成后判断多智能体对抗是否结束,若是则结束态势分析流程,若否则返回至步骤S102,进行态势理解信息的实时滚动更新。本申请实施例可以根据威胁态势与安全态势量化结果,得到对抗场景关键信息,进而对各类态势理解信息的数值进行更新,同时在结束更新后,结束多智能体对抗,最终得到多智能体对抗场景的态势评估结果,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。
可选地,在本申请的一个实施例中,基于威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,包括:分别利用一个或多个预设的信息计算模型计算多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;由多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成抗场景关键信息。
可以理解的是,本申请实施例根据威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息地具体步骤在于:首先,分别利用一个或多个预设的信息计算模型计算多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;其次,由多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成抗场景关键信息。其中,预设的信息计算模型会在下文进行详细阐述。本申请实施例可以根据威胁态势与安全态势量化结果,得到对抗场景关键信息,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。
可选地,在本申请的一个实施例中,分别利用一个或多个预设的信息计算模型计算多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,包括:基于多智能体的实际对抗任务匹配权重因子;利用权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到单元威胁成功率;根据单元威胁成功率计算单元防护成功率。
在此,对智能体单元威胁成功率的计算方法进行详细阐述。
可以理解的是,威胁单个智能体单元的成功率取决于其真实受到的威胁能量与自身安全能量的比值。
在对抗环境中,计算具体某两个或多个智能体单元之间的威胁能量时,本申请实施例需要考虑对抗任务特点、智能体单元之间的相互针对性对原始威胁能量进行修正,这一修正系数被称为权重因子。本申请实施例中可以用agij表示权重因子,其含义为在特定对抗任务场景下,智能体单元i对智能体单元j的威胁能量的修正。权重因子agij是一个无量纲数,其通常取值在0.2~1之间。
当分析我方智能体单元对目标智能体单元j的威胁行为时,假设我方一共有n个智能体单元,定义对目标智能体单元j的权重因子向量与威胁能量矩阵如下:
AGj=[ag1j,ag2j,…,agnj],
Figure BDA0003496391480000081
因此,在某一点(x,y)目标j受到的总威胁能量为:
Figure BDA0003496391480000082
则在目标智能体单元j的毁伤幅员内,其受到的威胁场能如下:
Figure BDA0003496391480000083
其中,Sdam代表目标智能体单元j的毁伤幅员面积。
而在目标智能体单元j自身毁伤幅员内的总防御安全能量,即为智能体单元j的安全场能
Figure BDA0003496391480000084
即:
Figure BDA0003496391480000085
最终,若指控人员决定对目标智能体单元j进行威胁,则威胁成功率
Figure BDA0003496391480000086
为:
Figure BDA0003496391480000087
在实际对抗行动中,本申请实施例需要对“单元——目标”进行分配。事实上,出于对对抗环境全局的战术考虑,一般极少出现我方全部智能体单元对对方某一智能体单元进行威胁行动的情况,更多的是“一对一威胁”或者“多对一威胁”。此种情况下,本申请实施例只需要根据“单元——目标”分配关系,调整权重因子向量与威胁能量矩阵即可。例如,在我方的n个智能体单元中,共有ns个对目标智能体单元j进行威胁,则权重因子向量与威胁能量矩阵为:
Figure BDA0003496391480000091
Figure BDA0003496391480000092
此时,相应的威胁场能与对抗成功率为:
Figure BDA0003496391480000093
Figure BDA0003496391480000094
在此,对智能体单元防护成功率计算方法进行详细阐述。
可以理解的是,当对对方某智能体单元的威胁成功率确定之后,即可相应计算出对方智能体单元的防御成功率,即:
Figure BDA0003496391480000095
单元防护成功率表征的是智能体单元的绝对被威胁程度,防御成功率越低,表示单元的绝对被威胁程度越高。
可选地,在本申请的一个实施例中,单元相对威胁度的计算公式为:
Figure BDA0003496391480000096
其中,
Figure BDA0003496391480000097
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure BDA0003496391480000098
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
可以理解的是,单元防护成功率可以表征绝对被威胁程度,但却无法直接体现出对方智能体单元的威胁力量分配。这可用智能体单元相对威胁度来表征,其计算方法如下:
Figure BDA0003496391480000099
其中,
Figure BDA00034963914800000910
表示某一方全部智能体单元对目标智能体单元i的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。Srj越大,代表对目标智能体单元j的相对威胁度越大,单元相对被威胁度越高,相对越不安全。
可选地,在本申请的一个实施例中,分别利用一个或多个预设的信息计算模型计算多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,还包括:获取各智能体单元的重要程度;根据各智能体单元的重要程度、单元威胁成功率得到单元威胁性价比;根据威胁能量场识别我方所掌控和对方所掌控的区域;根据我方所掌控和对方所掌控的区域的正负值得到阵地归属判定信息;将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到关键争夺区域判定信息。
在实际执行过程中,本申请实施例预设的信息计算模型还可以通过计算,获取各智能体单元的重要程度,并根据各智能体单元的重要程度、单元威胁成功率得到单元威胁性价比,根据威胁能量场识别我方所掌控和对方所掌控的区域,根据我方所掌控和对方所掌控的区域的正负值得到阵地归属判定信息,将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到关键争夺区域判定信息。
在此,对智能体单元威胁性价比的计算方法进行详细阐述。
可以理解的是,本申请实施例计算智能体单元威胁性价比时,首先需要定各智能体单元的重要程度,这可以由专家经验结合层次分析法、优劣解距离法来实现,具体过程如图2所示。
首先,需要根据专家经验确定决策层次。确定决策层次可以把复杂问题分解为不同的层次,同一层次的元素对下一层次的部分元素起到支配与准则作用,同时又受到上一层次元素的支配。
随后,通过层次分析法确定各层次中准则的权重。在评价智能体单元的重要程度时,不同评价准则的地位不同,因而需要赋予不同的权重系数。
最后,通过优劣解距离法最终确定单元的重要程度。其中,针对智能体单元各准则的判断结果往往并不是量化值,而是一个模糊的语义信息,比如某智能体单元的定位精度“非常好”,某智能体单元的防御能力“一般”。因此,可由三角模糊数给出单元在各准则下的表现得分,从而将语义值转化为量化值。
经过以上三步,最终得到了对抗环境中各智能体单元的重要程度。
本申请实施例根据上述步骤,得到对了各个智能体单元的威胁成功率
Figure BDA0003496391480000101
与单元重要程度
Figure BDA0003496391480000102
综合考虑二者,可输出单元威胁性价比信息。定义对目标智能体单元j进行威胁的性价比为
Figure BDA0003496391480000103
其计算如下:
Figure BDA0003496391480000104
由上式不难推断,当单元威胁成功率
Figure BDA0003496391480000105
为0时,威胁性价比为0;当
Figure BDA0003496391480000106
不为0时,威胁性价比则由将其毁伤的概率与其重要程度的乘积所表征。
在此,对阵地归属判定进行详细阐述。
可以理解的是,在对抗场景中,指控人员需要判断哪些区域为我方所掌控,哪些区域为对方所掌控,即“阵地”的概念。得益于威胁能量场的建立,可以直接使用我方威胁能量场与对方威胁能量场相减,通过其值正负来判断阵地归属。具体计算公式为:
Figure BDA0003496391480000111
Figure BDA0003496391480000112
其中,CF(x,y)为威胁力差判定符,
Figure BDA0003496391480000113
为我方阵地区域,是一系列点的集合。特别地,在我方与对方阵地之间,存在一条边界线,称之为“前线”Lfro,对其定义如下:
Lfro={(x,y)|CF(x,y)=0}。
在此,对关键争夺区域判定进行详细阐述。
可以理解的是,在对抗环境中,有一部分区域的威胁力量十分集中,这部分区域往往是双方争夺的重点。可以使用我方威胁能量场与对方威胁能量场在对抗环境中相加,并设定阈值作为关键区域的判断标准。具体计算公式如下:
Figure BDA0003496391480000114
Rkey={(x,y)|KR(x,y)>threshold},
其中,KR(x,y)为威胁力和判定符,Rkey为关键争夺区域。在实际对抗环境中,关键争夺区域往往出现在前线区域附近,因此关键争夺区域的判定一般与前线判定同时进行,指控人员综合考虑两项结果之后,做出最终决策方案。
可选地,在本申请的一个实施例中,最终胜率预测信息中的胜率计算公式为:
Figure BDA0003496391480000115
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000116
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000117
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
具体地,对现代对抗环境的研究中,实时胜率预测是关键问题之一,通常采用以下公式进行胜率计算:
Figure BDA0003496391480000121
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000122
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000123
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0。同理,yji为对方分配策略中的相应指标。
上述公式得到的结果是无范围限制的实数,实际应用中,还需要进行归一化处理,以更加符合“胜率”的概念。可以看到,上述公式中的智能体单元重要程度,智能体单元威胁成功率的计算方法已经在本发明中作了详细介绍,因此只需要了解我方与对方的实时目标分配结果,即可完成胜率预测的计算。
综上所述,本申请实施例可以在获取对抗环境的威胁态势与安全态势量化结果之后,聚焦于态势分析方法,进而对模型结果进行综合分析计算,输出支撑对抗环境决策控制的语义信息,具有可解释性强、实时性和实用性高的特性,有利于辅助后续的决策与控制。
下面结合图2至图6,以一个具体实施例对本申请实施例的评估方法的工作原理进行详细阐述。
如图3所示,本申请实施例的评估方法包括以下步骤:
步骤S301:多智能体对抗开始。当对抗双方的智能体不断移动并采取不同行动时,本申请实施例通过自身配置的传感器实时监测周边环境情况,并调用图像传感器、激光雷达、GPS等传感器数据,以便于后续步骤中威胁态势与安全态势的获取。
步骤S302:获取威胁态势与安全态势量化结果。本申请实施例可以将感知结果与从智能体数据库中提取的信息输入建立的威胁能量场与安全能量场模型中,得到威胁态势与安全态势的量化结果,以便于后续步骤中进行态势分析。
步骤S303:根据场能计算进行态势分析。具体地,该步骤中包括智能体单元威胁成功率计算、智能体单元防护成功率计算、智能体单元相对威胁度计算、智能体单元威胁性价比计算、阵地归属判定、关键争夺区域判定、最终胜率预测等环节,其各自计算方法如下:
智能体单元威胁成功率计算:
可以理解的是,威胁单个智能体单元的成功率取决于其真实受到的威胁能量与自身安全能量的比值。
在对抗环境中,计算具体某两个或多个智能体单元之间的威胁能量时,本申请实施例需要考虑对抗任务特点、智能体单元之间的相互针对性对原始威胁能量进行修正,这一修正系数被称为权重因子。本申请实施例中可以用agij表示权重因子,其含义为在特定对抗任务场景下,智能体单元i对智能体单元j的威胁能量的修正。权重因子agij是一个无量纲数,其通常取值在0.2~1之间。
当分析我方智能体单元对目标智能体单元j的威胁行为时,假设我方一共有n个智能体单元,定义对目标智能体单元j的权重因子向量与威胁能量矩阵如下:
AGj=[ag1j,ag2j,…,agnj],
Figure BDA0003496391480000131
因此,在某一点(x,y)目标j受到的总威胁能量为:
Figure BDA0003496391480000132
则在目标智能体单元j的毁伤幅员内,其受到的威胁场能如下:
Figure BDA0003496391480000133
其中,Sdam代表目标智能体单元j的毁伤幅员面积。
而在目标智能体单元j自身毁伤幅员内的总防御安全能量,即为智能体单元j的安全场能
Figure BDA0003496391480000134
即:
Figure BDA0003496391480000135
最终,若指控人员决定对目标智能体单元j进行威胁,则威胁成功率
Figure BDA0003496391480000136
为:
Figure BDA0003496391480000137
在实际对抗行动中,需要对“单元——目标”进行分配。事实上,出于对对抗环境全局的战术考虑,一般极少出现我方全部智能体单元对对方某一智能体单元进行威胁行动的情况,更多的是“一对一威胁”或者“多对一威胁”。此种情况下,只需要根据“单元——目标”分配关系,调整权重因子向量与威胁能量矩阵即可。例如,在我方的n个智能体单元中,共有ns个对目标智能体单元j进行威胁,则权重因子向量与威胁能量矩阵为:
Figure BDA0003496391480000138
Figure BDA0003496391480000139
此时,相应的威胁场能与对抗成功率为:
Figure BDA0003496391480000141
Figure BDA0003496391480000142
智能体单元防护成功率计算:
可以理解的是,当对对方某智能体单元的威胁成功率确定之后,即可相应计算出对方智能体单元的防御成功率,即:
Figure BDA0003496391480000143
单元防护成功率表征的是智能体单元的绝对被威胁程度,防御成功率越低,表示单元的绝对被威胁程度越高。
智能体单元相对威胁度计算:
可以理解的是,单元防护成功率可以表征绝对被威胁程度,但却无法直接体现出对方智能体单元的威胁力量分配。这可用智能体单元相对威胁度来表征,其计算方法如下:
Figure BDA0003496391480000144
其中,
Figure BDA0003496391480000145
表示某一方全部智能体单元对目标智能体单元i的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。Srj越大,代表对目标智能体单元j的相对威胁度越大,单元相对被威胁度越高,相对越不安全。
智能体单元威胁性价比计算:
可以理解的是,本申请实施例计算智能体单元威胁性价比时,首先需要定各智能体单元的重要程度,这可由专家经验结合层次分析法、优劣解距离法来实现,具体过程如图2所示。
首先,需要根据专家经验确定决策层次。确定决策层次可以把复杂问题分解为不同的层次,同一层次的元素对下一层次的部分元素起到支配与准则作用,同时又受到上一层次元素的支配。
随后,通过层次分析法确定各层次中准则的权重。在评价智能体单元的重要程度时,不同评价准则的地位不同,因而需要赋予不同的权重系数。
最后,通过优劣解距离法最终确定单元的重要程度。其中,针对智能体单元各准则的判断结果往往并不是量化值,而是一个模糊的语义信息,比如某智能体单元的定位精度“非常好”,某智能体单元的防御能力“一般”。因此,可由三角模糊数给出单元在各准则下的表现得分,从而将语义值转化为量化值。
经过以上三步,最终得到了对抗环境中各智能体单元的重要程度。
本申请实施例根据上述步骤,得到对了各个智能体单元的威胁成功率
Figure BDA00034963914800001510
与单元重要程度
Figure BDA0003496391480000158
综合考虑二者,可输出单元威胁性价比信息。定义对目标智能体单元j进行威胁的性价比为
Figure BDA0003496391480000159
其计算如下:
Figure BDA0003496391480000151
由上式不难推断,当单元威胁成功率
Figure BDA0003496391480000152
为0时,威胁性价比为0;当
Figure BDA0003496391480000153
不为0时,威胁性价比则由将其毁伤的概率与其重要程度的乘积所表征。
阵地归属判定:
可以理解的是,在对抗场景中,指控人员需要判断哪些区域为我方所掌控,哪些区域为对方所掌控,即“阵地”的概念。得益于威胁能量场的建立,可以直接使用我方威胁能量场与对方威胁能量场相减,通过其值正负来判断阵地归属。具体计算公式为:
Figure BDA0003496391480000154
Figure BDA0003496391480000155
其中,CF(x,y)为威胁力差判定符,
Figure BDA0003496391480000156
为我方阵地区域,是一系列点的集合。特别地,在我方与对方阵地之间,存在一条边界线,称之为“前线”Lfro,对其定义如下:
Lfro={(x,y)|CF(x,y)=0}。
关键争夺区域判定:
可以理解的是,在对抗环境中,有一部分区域的威胁力量十分集中,这部分区域往往是双方争夺的重点。可以使用我方威胁能量场与对方威胁能量场在对抗环境中相加,并设定阈值作为关键区域的判断标准。具体计算公式如下:
Figure BDA0003496391480000157
Rkey={(x,y)|KR(x,y)>threshold},
其中,KR(x,y)为威胁力和判定符,Rkey为关键争夺区域。在实际对抗环境中,关键争夺区域往往出现在前线区域附近,因此关键争夺区域的判定一般与前线判定同时进行。指控人员综合考虑两项结果之后,做出最终决策方案。
最终胜率预测:
对现代对抗环境的研究中,实时胜率预测是关键问题之一,通常采用以下公式进行胜率计算:
Figure BDA0003496391480000161
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000162
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000163
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0。同理,yji为对方分配策略中的相应指标。
上述公式得到的结果是无范围限制的实数,实际应用中,还需要进行归一化处理,以更加符合“胜率”的概念。可以看到,上述公式中的智能体单元重要程度,智能体单元威胁成功率的计算方法已经在本发明中作了详细介绍,因此只需要了解我方与对方的实时目标分配结果,即可完成胜率预测的计算。
步骤S304:更新各类量化态势数值。通过步骤S303的分析计算,本申请实施例得到了各类态势理解信息的计算结果,可以对各项数值进行更新。计算完成后判断多智能体对抗是否结束,若是则结束态势分析流程,若否则返回步骤S302,进行态势理解信息的实时滚动更新。
下面给出一个基于场能分析进行对抗场景态势分析的应用样例。样例场景可以如图4所示。
样例图为一块100×50的区域。其中,蓝色为我方智能体单元,红色为对方智能体单元。“D/d”代表直瞄智能体单元,“I/i”代表间瞄智能体单元,“C/c”代表指控单元。各单元坐标位置如表1所示,表1为测试样例各智能体单元坐标位置。
表1
Figure BDA0003496391480000164
直瞄智能体单元(D1、D2、d1、d2),间瞄智能体单元(I1、I2、i1、i2),指控单元(C1、c1)样例参数分别如表2、表3和表4所示,其中,表2为:直瞄智能体单元样例参数、表3为间瞄单元样例参数、表4为指控单元样例参数。
表2
Figure BDA0003496391480000171
表3
Figure BDA0003496391480000181
表4
Figure BDA0003496391480000182
本申请实施例可以将以上参数输入威胁能量场与安全能量场模型中,得到我方和对方的威胁态势和安全态势,将量化结果输入本发明中介绍的态势理解模块中,得到结果如下:
当我方采用不同的“单元——目标”分配策略(即采取不同的威胁智能体单元组合)对对方智能体单元d1进行威胁时,其威胁成功率如表5所示,表5为不同“单元——目标”分配策略下的威胁成功率。
表5
Figure BDA0003496391480000191
我方智能体单元的相对威胁度如表所示,表6为我方智能体单元防护成功率与相对威胁度所示。其中我方智能体单元I2的相对威胁度最大,这代表I2相对最不安全,最可能受到毁伤。
表6
Figure BDA0003496391480000192
我方智能体单元威胁对方各个智能体单元的性价比如表7所示,表7为目标(对方智能体单元)威胁性价比。
表7
Figure BDA0003496391480000193
从表7中可以得出,虽然对智能体单元c1的威胁成功率最低,但是由于其重要程度最高,因此威胁性价比最高,应优先威胁。
其中,阵地归属与前线判定如图5所示。图5中,左边与右边的深色部分分别代表我方与对方所属阵地区域,中央曲线即为阵地前线。关键争夺区域如图6所示,图中白色区域(圆圈标注)即为关键争夺区域。
根据本申请实施例提出的基于场能的多智能体对抗场景态势评估方法,可以通过建立威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,得到对抗场景关键信息,并对各类态势理解信息的数值进行更新,同时在结束更新后,结束多智能体对抗,进而得到多智能体对抗场景的态势评估结果,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。由此,解决了相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。
其次参照附图描述根据本申请实施例提出的基于场能的多智能体对抗场景态势评估装置。
图7是本申请实施例的基于场能的多智能体对抗场景态势评估装置的方框示意图。
如图7所示,该基于场能的多智能体对抗场景态势评估装置10包括:判断模块100、计算模块200和评估模块300。
具体地,判断模块100,用于在多智能体对抗场景下,判断多智能体对抗是否开始。
计算模块200,用于如果开始多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果。
评估模块300,用于基于威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束多智能体对抗,得到多智能体对抗场景的态势评估结果。
可选地,在本申请的一个实施例中,计算模块200包括:采集单元和第一计算单元。
其中,采集单元,用于采集多智能体的感知信息。
第一计算单元,用于将感知信息和多智能体的智能体数据代入预先训练的威胁能量场与安全能量场模型,得到威胁态势与安全态势量化结果。
可选地,在本申请的一个实施例中,评估模块300包括:第二计算单元和生成单元。
其中,第二计算单元,用于分别利用一个或多个预设的信息计算模型计算多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息。
生成单元,用于由多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成抗场景关键信息。
可选地,在本申请的一个实施例中,生成单元包括:匹配子单元、第一计算子单元和第二计算子单元。
匹配子单元,用于基于多智能体的实际对抗任务匹配权重因子。
第一计算子单元,用于利用权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到单元威胁成功率。
第二计算子单元,用于根据单元威胁成功率计算单元防护成功率。
可选地,在本申请的一个实施例中,单元相对威胁度的计算公式为:
Figure BDA0003496391480000211
其中,
Figure BDA0003496391480000212
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure BDA0003496391480000213
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
可选地,在本申请的一个实施例中,生成单元进一步用于:获取各智能体单元的重要程度;根据各智能体单元的重要程度、单元威胁成功率得到单元威胁性价比;根据威胁能量场识别我方所掌控和对方所掌控的区域;根据我方所掌控和对方所掌控的区域的正负值得到阵地归属判定信息;将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到关键争夺区域判定信息。
可选地,在本申请的一个实施例中,最终胜率预测信息中的胜率计算公式为:
Figure BDA0003496391480000214
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure BDA0003496391480000215
为我方第i个智能体单元的重要程度,
Figure BDA0003496391480000216
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
需要说明的是,前述对基于场能的多智能体对抗场景态势评估方法实施例的解释说明也适用于该实施例的基于场能的多智能体对抗场景态势评估装置,此处不再赘述。
根据本申请实施例提出的基于场能的多智能体对抗场景态势评估装置,可以通过建立威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,得到对抗场景关键信息,并对各类态势理解信息的数值进行更新,同时在结束更新后,结束多智能体对抗,进而得到多智能体对抗场景的态势评估结果,通过客观物理规律的建模,使对抗场景的态势评估结果具有可解释性,且实时性和实用性高,能深入反映当前对抗环境所处局势,以便辅助后续的决策与控制。由此,解决了相关技术多为经验应用,缺乏客观物理规律建模,主观性较强,缺乏可解释性,且实时性和实用性较低,无法直接反映对抗场景所处局势,导致无法支撑后续对抗场景的决策控制等问题。
图8为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序。
处理器802执行程序时实现上述实施例中提供的基于场能的多智能体对抗场景态势评估方法。
进一步地,电子设备还包括:
通信接口803,用于存储器801和处理器802之间的通信。
存储器801,用于存放可在处理器802上运行的计算机程序。
存储器801可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器801、处理器802和通信接口803独立实现,则通信接口803、存储器801和处理器802可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器801、处理器802及通信接口803,集成在一块芯片上实现,则存储器801、处理器802及通信接口803可以通过内部接口完成相互间的通信。
处理器802可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的基于场能的多智能体对抗场景态势评估方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (16)

1.一种基于场能的多智能体对抗场景态势评估方法,其特征在于,包括以下步骤:
在多智能体对抗场景下,判断多智能体对抗是否开始;
如果开始所述多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果;以及
基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据所述抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束所述多智能体对抗,得到所述多智能体对抗场景的态势评估结果。
2.根据权利要求1所述的方法,其特征在于,所述利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果,包括:
采集多智能体的感知信息;
将所述感知信息和所述多智能体的智能体数据代入预先训练的所述威胁能量场与安全能量场模型,得到所述威胁态势与安全态势量化结果。
3.根据权利要求1所述的方法,其特征在于,所述基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,包括:
分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;
由所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成所述抗场景关键信息。
4.根据权利要求3所述的方法,其特征在于,所述分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,包括:
基于所述多智能体的实际对抗任务匹配权重因子;
利用所述权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到所述单元威胁成功率;
根据所述单元威胁成功率计算所述单元防护成功率。
5.根据权利要求4所述的方法,其特征在于,所述单元相对威胁度的计算公式为:
Figure FDA0003496391470000011
其中,
Figure FDA0003496391470000012
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure FDA0003496391470000013
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
6.根据权利要求4所述的方法,其特征在于,所述分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息,还包括:
获取各智能体单元的重要程度;
根据所述各智能体单元的重要程度、所述单元威胁成功率得到所述单元威胁性价比;
根据威胁能量场识别我方所掌控和对方所掌控的区域;
根据所述我方所掌控和对方所掌控的区域的正负值得到所述阵地归属判定信息;
将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到所述关键争夺区域判定信息。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述最终胜率预测信息中的胜率计算公式为:
Figure FDA0003496391470000021
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure FDA0003496391470000022
为我方第i个智能体单元的重要程度,
Figure FDA0003496391470000023
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
8.一种装置基于场能的多智能体对抗场景态势评估装置,其特征在于,包括:
判断模块,用于在多智能体对抗场景下,判断多智能体对抗是否开始;
计算模块,用于如果开始所述多智能体对抗,则利用预设的威胁能量场与安全能量场模型,获取威胁态势与安全态势量化结果;以及
评估模块,用于基于所述威胁态势与安全态势量化结果进行态势分析,得到对抗场景关键信息,并根据所述抗场景关键信息获取更新各类态势理解信息的数值,并在结束更新后,结束所述多智能体对抗,得到所述多智能体对抗场景的态势评估结果。
9.根据权利要求8所述的装置,其特征在于,所述计算模块,包括:
采集单元,用于采集多智能体的感知信息;
第一计算单元,用于将所述感知信息和所述多智能体的智能体数据代入预先训练的所述威胁能量场与安全能量场模型,得到所述威胁态势与安全态势量化结果。
10.根据权利要求8所述的装置,其特征在于,所述评估模块,包括:
第二计算单元,用于分别利用一个或多个预设的信息计算模型计算所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息;
生成单元,用于由所述多智能体对抗的单元威胁成功率、单元防护成功率、单元相对威胁度、单元威胁性价比、阵地归属判定信息、关键争夺区域判定信息和/或最终胜率预测信息生成所述抗场景关键信息。
11.根据权利要求10所述的装置,其特征在于,所述生成单元,包括:
匹配子单元,用于基于所述多智能体的实际对抗任务匹配权重因子;
第一计算子单元,用于利用所述权重因子修正威胁能量,并根据修正后的威胁能量与自身安全能量的比值得到所述单元威胁成功率;
第二计算子单元,用于根据所述单元威胁成功率计算所述单元防护成功率。
12.根据权利要求11所述的装置,其特征在于,所述单元相对威胁度的计算公式为:
Figure FDA0003496391470000031
其中,
Figure FDA0003496391470000033
表示某一方全部智能体单元对目标智能体单元i的威胁场能,
Figure FDA0003496391470000034
表示某一方全部智能体单元对目标智能体单元j的威胁场能,n为被威胁方智能体单元总数,Srj表示目标智能体单元j的相对威胁度。
13.根据权利要求11所述的装置,其特征在于,所述生成单元,进一步用于:
获取各智能体单元的重要程度;根据所述各智能体单元的重要程度、所述单元威胁成功率得到所述单元威胁性价比;根据威胁能量场识别我方所掌控和对方所掌控的区域;根据所述我方所掌控和对方所掌控的区域的正负值得到所述阵地归属判定信息;将我方威胁能量场与对方威胁能量场在对抗环境中相加值与预设阈值对比,得到所述关键争夺区域判定信息。
14.根据权利要求10-13任一项所述的装置,其特征在于,所述最终胜率预测信息中的胜率计算公式为:
Figure FDA0003496391470000032
PB=-PA
其中,PA代表我方胜率,PB代表对方胜率,sij为我方第i个智能体单元对对方第j个智能体单元的威胁成功率,tji为对方第j个智能体单元对我方第i个智能体单元的威胁成功率,
Figure FDA0003496391470000041
为我方第i个智能体单元的重要程度,
Figure FDA0003496391470000042
为对方第j个智能体单元的重要程度,xij与yji为0-1变量,当我方第i个智能体单元对对方第j个智能体单元进行威胁行为时,xij=1,反之xij=0,yji为对方分配策略中的相应指标。
15.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的基于场能的多智能体对抗场景态势评估方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的基于场能的多智能体对抗场景态势评估方法。
CN202210115962.6A 2022-02-07 2022-02-07 基于场能的多智能体对抗场景态势评估方法及装置 Active CN114492059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210115962.6A CN114492059B (zh) 2022-02-07 2022-02-07 基于场能的多智能体对抗场景态势评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210115962.6A CN114492059B (zh) 2022-02-07 2022-02-07 基于场能的多智能体对抗场景态势评估方法及装置

Publications (2)

Publication Number Publication Date
CN114492059A true CN114492059A (zh) 2022-05-13
CN114492059B CN114492059B (zh) 2023-02-28

Family

ID=81477560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210115962.6A Active CN114492059B (zh) 2022-02-07 2022-02-07 基于场能的多智能体对抗场景态势评估方法及装置

Country Status (1)

Country Link
CN (1) CN114492059B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310345A (zh) * 2022-06-23 2022-11-08 中国人民解放军军事科学院国防科技创新研究院 基于人工势场的智能算法评估方法及装置
CN117670095A (zh) * 2024-01-30 2024-03-08 中国人民解放军军事科学院国防科技创新研究院 多智能体自主对抗驱动的行动计划生成方法和装置

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070255117A1 (en) * 2001-01-30 2007-11-01 Barnes-Jewish Hospital Enhanced ultrasound detection with temperature-dependent contrast agents
AU2006347212A1 (en) * 2005-07-21 2008-03-27 Respiratory Management Technology A particle counting and DNA uptake system and method for detection, assessment and further analysis of threats due to nebulized biological agents
CN102185735A (zh) * 2011-04-26 2011-09-14 华北电力大学 一种网络安全态势预测方法
CN107623697A (zh) * 2017-10-11 2018-01-23 北京邮电大学 一种基于攻防随机博弈模型的网络安全态势评估方法
CN109709981A (zh) * 2018-12-27 2019-05-03 西安工业大学 一种无人机群竞技对抗方法
CN110119773A (zh) * 2019-05-07 2019-08-13 中国科学院自动化研究所 战略博弈系统的全局态势评估方方法、系统、装置
CN110458060A (zh) * 2019-07-30 2019-11-15 暨南大学 一种基于对抗学习的车辆图像优化方法及系统
CN110688287A (zh) * 2019-05-13 2020-01-14 中国石油大学(华东) 一种基于改进概率神经网络的工控网络态势评估方法
CN110866887A (zh) * 2019-11-04 2020-03-06 深圳市唯特视科技有限公司 一种基于多传感器的目标态势融合感知方法和系统
CN110898428A (zh) * 2019-11-12 2020-03-24 腾讯科技(深圳)有限公司 多虚拟对象交互的方法、装置、服务器及存储介质
CN111050302A (zh) * 2019-12-23 2020-04-21 中国电子科技集团公司第二十九研究所 一种适用于小型无人机集群的群体智能系统威胁监测方法
CN111767786A (zh) * 2020-05-11 2020-10-13 北京航空航天大学 基于三维动态交互场景的对抗攻击方法和装置
CN111841018A (zh) * 2020-06-03 2020-10-30 超参数科技(深圳)有限公司 模型训练方法、模型使用方法、计算机设备及存储介质
CN112115607A (zh) * 2020-09-16 2020-12-22 同济大学 一种基于多维赛博空间的移动智能体数字孪生系统
CN112742028A (zh) * 2021-01-22 2021-05-04 中国人民解放军国防科技大学 一种对抗博弈的编队决策方法、系统、介质及设备
US20210303922A1 (en) * 2019-11-16 2021-09-30 Uatc, Llc Systems and Methods for Training Object Detection Models Using Adversarial Examples
CN113741444A (zh) * 2021-08-26 2021-12-03 北京理工大学 一种基于多智能体邻近交互与轨迹预测的路径规划方法
CN113791634A (zh) * 2021-08-22 2021-12-14 西北工业大学 一种基于多智能体强化学习的多机空战决策方法
CN113805569A (zh) * 2021-09-23 2021-12-17 北京理工大学 基于多智能体技术的对抗系统、方法、终端及存储介质

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070255117A1 (en) * 2001-01-30 2007-11-01 Barnes-Jewish Hospital Enhanced ultrasound detection with temperature-dependent contrast agents
AU2006347212A1 (en) * 2005-07-21 2008-03-27 Respiratory Management Technology A particle counting and DNA uptake system and method for detection, assessment and further analysis of threats due to nebulized biological agents
CN102185735A (zh) * 2011-04-26 2011-09-14 华北电力大学 一种网络安全态势预测方法
CN107623697A (zh) * 2017-10-11 2018-01-23 北京邮电大学 一种基于攻防随机博弈模型的网络安全态势评估方法
CN109709981A (zh) * 2018-12-27 2019-05-03 西安工业大学 一种无人机群竞技对抗方法
CN110119773A (zh) * 2019-05-07 2019-08-13 中国科学院自动化研究所 战略博弈系统的全局态势评估方方法、系统、装置
CN110688287A (zh) * 2019-05-13 2020-01-14 中国石油大学(华东) 一种基于改进概率神经网络的工控网络态势评估方法
CN110458060A (zh) * 2019-07-30 2019-11-15 暨南大学 一种基于对抗学习的车辆图像优化方法及系统
CN110866887A (zh) * 2019-11-04 2020-03-06 深圳市唯特视科技有限公司 一种基于多传感器的目标态势融合感知方法和系统
CN110898428A (zh) * 2019-11-12 2020-03-24 腾讯科技(深圳)有限公司 多虚拟对象交互的方法、装置、服务器及存储介质
US20210303922A1 (en) * 2019-11-16 2021-09-30 Uatc, Llc Systems and Methods for Training Object Detection Models Using Adversarial Examples
CN111050302A (zh) * 2019-12-23 2020-04-21 中国电子科技集团公司第二十九研究所 一种适用于小型无人机集群的群体智能系统威胁监测方法
CN111767786A (zh) * 2020-05-11 2020-10-13 北京航空航天大学 基于三维动态交互场景的对抗攻击方法和装置
CN111841018A (zh) * 2020-06-03 2020-10-30 超参数科技(深圳)有限公司 模型训练方法、模型使用方法、计算机设备及存储介质
CN112115607A (zh) * 2020-09-16 2020-12-22 同济大学 一种基于多维赛博空间的移动智能体数字孪生系统
CN112742028A (zh) * 2021-01-22 2021-05-04 中国人民解放军国防科技大学 一种对抗博弈的编队决策方法、系统、介质及设备
CN113791634A (zh) * 2021-08-22 2021-12-14 西北工业大学 一种基于多智能体强化学习的多机空战决策方法
CN113741444A (zh) * 2021-08-26 2021-12-03 北京理工大学 一种基于多智能体邻近交互与轨迹预测的路径规划方法
CN113805569A (zh) * 2021-09-23 2021-12-17 北京理工大学 基于多智能体技术的对抗系统、方法、终端及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HEYE HUANG 等: "An integrated architecture for intelligence evaluation of automated vehicles", 《ACCIDENT ANALYSIS AND PREVENTION》 *
曹嘉 等: "基于对抗的智能态势感知预警模型与实践", 《保密科学技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310345A (zh) * 2022-06-23 2022-11-08 中国人民解放军军事科学院国防科技创新研究院 基于人工势场的智能算法评估方法及装置
CN115310345B (zh) * 2022-06-23 2023-10-03 中国人民解放军军事科学院国防科技创新研究院 基于人工势场的智能算法评估方法及装置
CN117670095A (zh) * 2024-01-30 2024-03-08 中国人民解放军军事科学院国防科技创新研究院 多智能体自主对抗驱动的行动计划生成方法和装置
CN117670095B (zh) * 2024-01-30 2024-05-10 中国人民解放军军事科学院国防科技创新研究院 多智能体自主对抗驱动的行动计划生成方法和装置

Also Published As

Publication number Publication date
CN114492059B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
CN114492059B (zh) 基于场能的多智能体对抗场景态势评估方法及装置
CN108615071B (zh) 模型测试的方法及装置
CN110490422B (zh) 一种基于博弈云模型的目标作战效能态势评估方法
CN110287250B (zh) 用户等级量化方法和装置
CN111860568B (zh) 数据样本的均衡分布方法、装置及存储介质
CN112884016A (zh) 云平台可信评估模型训练方法和云平台可信评估方法
CN113537622A (zh) 基于动态信任感知的服务偏好预测方法及系统
CN114626744B (zh) 一种基于科技创新能力的评估方法、系统和可读存储介质
CN112949519A (zh) 目标检测方法、装置、设备及存储介质
CN109190757B (zh) 任务处理方法、装置、设备及计算机可读存储介质
US11537090B2 (en) Model calculating unit and control unit for selectively calculating an RBF model, a gaussian process model and an MLP model
CN117035482A (zh) 一种土地利用综合整治绩效评估方法及系统
CN114492058B (zh) 面向多智能体对抗场景的防御态势评估方法及装置
CN115953668A (zh) 一种基于YOLOv5算法的迷彩伪装目标检测方法及系统
Azimirad et al. A new model for threat assessment in data fusion based on fuzzy evidence theory
CN110889635B (zh) 一种用于对食品安全事件的处理进行应急演练的方法
CN109359395B (zh) 基于Petri网的红外制导导弹效能评价方法及系统
CN112529845A (zh) 图像质量值确定方法、装置、存储介质及电子装置
CN112732519A (zh) 一种事件监控方法及装置
Wang et al. Intuitionistic fuzzy perceiving methods for situation and threat assessment
CN111775952A (zh) 自动驾驶方法、装置和存储介质
Brosnan Sensitivity analysis of a Bayesian belief network in a tactical intelligence application
CN116681304A (zh) 面向博弈推演的关键冲突矛盾点评估方法、装置和设备
CN112766490B (zh) 特征变量学习方法、装置、设备及计算机可读存储介质
CN110111310B (zh) 一种评估标签图片的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant