CN113805569B - 基于多智能体技术的对抗系统、方法、终端及存储介质 - Google Patents

基于多智能体技术的对抗系统、方法、终端及存储介质 Download PDF

Info

Publication number
CN113805569B
CN113805569B CN202111115509.7A CN202111115509A CN113805569B CN 113805569 B CN113805569 B CN 113805569B CN 202111115509 A CN202111115509 A CN 202111115509A CN 113805569 B CN113805569 B CN 113805569B
Authority
CN
China
Prior art keywords
information
agent
situation
attack
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111115509.7A
Other languages
English (en)
Other versions
CN113805569A (zh
Inventor
尹旭峰
李伟铭
李雪原
苑士华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202111115509.7A priority Critical patent/CN113805569B/zh
Publication of CN113805569A publication Critical patent/CN113805569A/zh
Application granted granted Critical
Publication of CN113805569B publication Critical patent/CN113805569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Business, Economics & Management (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于多智能体技术领域,公开了一种基于多智能体技术的对抗系统、方法、终端及存储介质,感知模块利用各种传感器感知智能体周围环境信息;同时将感知信息、通信信息以及智能体自身信息传递给信息处理模块;信息处理模块将感知信息、通信信息及智能体自身信息进行汇总;态势评估模块根据所述汇总信息计算自身周围不同位置处的态势,评估我方对敌方的态势;决策选择模块基于态势评估结果选择合适的策略;控制模块基于选择的策略控制智能体;攻击模块执行控制指令进行机动或攻击;本发明具有更好的普适性;将态势统一表示为时间的函数,为综合各种要素对态势的影响提供了解决方案,有利于下一步根据态势进行决策与规划。

Description

基于多智能体技术的对抗系统、方法、终端及存储介质
技术领域
本发明属于多智能体技术领域,尤其涉及一种基于多智能体技术的对抗系统、方法、终端及存储介质。
背景技术
目前,智能体具有自主性、反应性、社会性等特点,基于多智能体理论进行对抗,能够将对抗个体的主动适应性和整个对抗体系的宏观涌现性相结合,是一种重要而有效的对抗方法。
现有的智能体对抗系统大多只针对某一类智能体,如地面无人平台、无人飞行器等,对于智能体的类型限制比较大,缺乏普适性;此外,目前关于态势评估有很多方法如攻击区法、贝叶斯法、专家系统等,虽然考虑了对抗中影响态势的各种要素,如环境、智能体强度、感知能力、通信能力、攻击能力等,但在进行态势评估时,往往对不同的要素采用不同形式的量化方法,如有的要素取对抗双方的比值,有的要素分别取双方要素参数的对数,这样的结果仅仅只是得到一个数字,但不仅缺乏物理意义,更很难使这些要素关联起来。
通过上述分析,现有技术存在的问题及缺陷为:现有的智能体对抗系统只针对某一类智能体,缺乏普适性;缺少一个统一的物理变量将孤立的量化结果关联在一起。
解决以上问题及缺陷的难度为:若要解决以上问题及缺陷,首先应该提取不同类型智能体的不同特性,将其进行参数化,通过修改参数来实现不同类型的智能体;其次需要将态势要素的量化形式进行统一,赋予它们一个物理意义。这两点在当前比较难以解决,首先是不同类型智能体的不同特性虽然能够提取出来,但很难通过参数化的形式使其满足不同的特性;其次即使将态势要素的量化形式进行统一,也难以找到一个合适的物理意义赋予给它们。
解决以上问题及缺陷的意义为:若能解决上述两个问题,那么在进行智能体对抗研究时,可以通过修改参数的方式,比较容易地实现不同类型智能体,而不需要对它们分别建模,在研究时可以节省很多工作;同时将不同态势要素统一量化,赋予其物理意义,在态势理解时可以更加直观,不会产生不同态势要素的混乱感。
发明内容
针对现有技术存在的问题,本发明提供了一种基于多智能体技术的对抗系统、方法、终端及存储介质。
本发明是这样实现的,一种基于多智能体技术的对抗系统,所述基于多智能体技术的对抗系统包括:
感知模块、通信模块、信息处理模块、态势评估模块、决策选择模块、控制模块、攻击模块;
感知模块,用于利用各种传感器感知智能体周围环境信息;
通信模块,用于获取通信范围内的通信信息;同时用于将感知信息、通信信息以及智能体自身信息传递给信息处理模块;
信息处理模块,用于将感知信息、通信信息及智能体自身信息进行汇总;
态势评估模块,用于根据所述汇总信息计算自身周围不同位置处的态势,评估我方对敌方的态势;
决策选择模块,用于基于态势评估结果选择合适的策略;
控制模块,用于基于选择的策略控制智能体;
攻击模块,用于执行控制指令进行机动或攻击;
所述感知模块和通信模块分别以感知半径和通信半径进行定义,攻击模块以攻击半径和攻击角度进行定义。
进一步,所述环境信息包括己方智能体、敌方智能体、障碍物及其他物体的信息;
所述通信信息包括通信对象的自身信息、感知信息、通信信息;
所述智能体自身信息即智能体的各种属性信息,所述属性信息包括运动速度、当前位姿、攻防能力、感知范围、通信范围。
进一步,所述态势包括:运动态势和攻击态势;
所述运动态势即智能体运动到攻击位置所用时间的倒数;所述攻击态势即智能体消灭敌方所用时间的倒数。
本发明的另一目的在于提供一种应用于所述基于多智能体技术的对抗系统的基于多智能体技术的对抗方法,所述基于多智能体技术的对抗方法包括:
步骤一,智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息;
步骤二,将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估;
步骤三,基于态势评估结果确定控制策略,基于所述控制策略控制智能体进行机动或攻击。
进一步,步骤一中,所述智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息包括:
对于智能体感知域内的环境信息,利用各种传感器进行感知获取;对于智能体感知域外的信息,通过通信手段从其他己方智能体进行获取。
进一步,步骤二中,所述将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估包括:
首先,基于汇总的信息确定单个智能体对敌方的威胁态势;
其次,根据智能体的分布关系,将单个智能体的态势进行叠加得到群体态势。
进一步,所述确定单个智能体对敌方的威胁态势包括:
(1)判断敌方所处位置为感知域内或感知域外,基于所述所处位置计算智能体达到相应位置的时间,并基于计算的运动时间确定运动时间的倒数即智能体对敌方的运动态势;
(2)计算智能体攻击时间的倒数确定攻击态势:根据敌方状态预估敌方寿命,根据预估寿命和智能体攻击力计算消灭敌方的攻击时间,基于所述攻击时间得到攻击时间的倒数即攻击态势;
(3)将所述运动态势与攻击态势加和即为智能体对敌方的威胁态势;并计算已方智能体对敌方的威胁态势与敌方对己方智能体的威胁态势之差,得到智能体的个体攻防态势。
进一步,所述基于所述所处位置计算智能体达到相应位置的时间包括:
当敌方处于感知域内时,根据传感器感知的环境信息以及障碍物信息,进行最优路径规划,计算智能体到达所述位置的确切运动时间;
当敌方处于感知域外时,其他己方智能体获取障碍物信息,计算确切的运动时间;当无法获取障碍物信息,则对感知域外的部分按直线距离最短路径计算运动时间。
进一步,步骤三中,所述基于态势评估结果确定控制策略包括:
若己方态势对敌方具有优势,且敌方不在己方攻击域内时,选择前进策略;若己方态势对敌方具有优势,且敌方在己方攻击域内时,选择作战策略;若己方态势对敌方具有劣势,则选择撤退策略,待态势变化后再重新选择策略。
进一步,所述基于所述控制策略控制智能体进行机动或攻击包括:
若选择前进策略,则智能体先确定攻击对象,计算最佳的攻击位置,规划到达该位置的最佳路径,再以一定速度运动到该位置,进而攻击敌方;
若选择作战策略,则智能体微调位置或保持不动;
若选择撤退策略,智能体以最快的速度向出发点运动。
本发明另一目的在于提供一种信息数据处理终端,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于多智能体技术的对抗方法。
本发明另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于多智能体技术的对抗方法
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明将智能体进行模块化和参数化,可以通过对它们进行简单的修改,适应不同的实体如无人车、无人机等。本发明将智能体态势表示为运动时间和攻击时间的函数,能够很直观地理解态势的大小,运动时间和攻击时间越大,说明智能体对敌方的威胁越小。
本发明提供了一种普适的智能体建模方法,以及一种定量而统一的多智能体对抗态势评估方法,从而可以更加容易地进行多智能体对抗研究。
本发明将智能体模型进行模块化和参数化,可以用于多种实体,具有更好的普适性;将态势统一表示为时间的函数,为综合各种要素对态势的影响提供了解决方案,有利于下一步根据态势进行决策与规划。
附图说明
图1是本发明实施例提供的基于多智能体技术的对抗系统结构示意图。
图2是本发明实施例提供的基于多智能体技术的对抗方法原理图。
图3是本发明实施例提供的基于多智能体技术的对抗方法流程图。
图4是本发明实施例提供的决策流程示意图。
图5为仿真过程中,一方智能体个体态势的评估结果,智能体自身所处位置态势最大,向外递减,其中有两个明显的圆形台阶,分别为智能体感知范围和通信范围的突变,感知范围内还有几个凹下去的区域,为智能体感知到的障碍物。
图6为一方智能体对另一方智能体个体态势的估计。
图7是另一方智能体的实际态势,可以看到,虽然估计值与实际值存在一些误差,但误差基本在可接受范围内。
图8为一方智能体叠加之后的群体态势,四个峰代表一方的四个智能体,两个谷代表另一方的两个智能体。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于多智能体技术的对抗系统,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于多智能体技术的对抗系统包括:
感知模块、通信模块、信息处理模块、态势评估模块、决策选择模块、控制模块、攻击模块;
感知模块,用于利用各种传感器感知智能体周围环境信息;
通信模块,用于获取通信范围内的通信信息;同时用于将感知信息、通信信息以及智能体自身信息传递给信息处理模块;
信息处理模块,用于将感知信息、通信信息及智能体自身信息进行汇总;
态势评估模块,用于根据所述汇总信息计算自身周围不同位置处的态势,评估我方对敌方的态势;
决策选择模块,用于基于态势评估结果选择合适的策略;
控制模块,用于基于选择的策略控制智能体;
攻击模块,用于执行控制指令进行机动或攻击。
本发明实施例提供的感知模块和通信模块分别以感知半径和通信半径进行定义,攻击模块以攻击半径和攻击角度进行定义。
本发明实施例提供的环境信息包括己方智能体、敌方智能体、障碍物及其他物体的信息;本发明实施例提供的通信信息包括通信对象的自身信息、感知信息、通信信息;本发明实施例提供的智能体自身信息即智能体的各种属性信息,所述属性信息包括运动速度、当前位姿、攻防能力、感知范围、通信范围。
本发明实施例提供的态势包括:运动态势和攻击态势;
运动态势即智能体运动到攻击位置所用时间的倒数;攻击态势即智能体消灭敌方所用时间的倒数。
如图2-图3所示,本发明实施例提供的基于多智能体技术的对抗方法包括:
S101,智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息;
S102,将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估;
S103,基于态势评估结果确定控制策略,基于所述控制策略控制智能体进行机动或攻击。
本发明实施例提供的智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息包括:
对于智能体感知域内的环境信息,利用各种传感器进行感知获取;对于智能体感知域外的信息,通过通信手段从其他己方智能体进行获取。
本发明实施例提供的将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估包括:
首先,基于汇总的信息确定单个智能体对敌方的威胁态势;
其次,根据智能体的分布关系,将单个智能体的态势进行叠加得到群体态势。
本发明实施例提供的确定单个智能体对敌方的威胁态势包括:
(1)判断敌方所处位置为感知域内或感知域外,基于所述所处位置计算智能体达到相应位置的时间,并基于计算的运动时间确定运动时间的倒数即智能体对敌方的运动态势;
(2)计算智能体攻击时间的倒数确定攻击态势:根据敌方状态预估敌方寿命,根据预估寿命和智能体攻击力计算消灭敌方的攻击时间,基于所述攻击时间得到攻击时间的倒数即攻击态势;
(3)将所述运动态势与攻击态势加和即为智能体对敌方的威胁态势;并计算已方智能体对敌方的威胁态势与敌方对己方智能体的威胁态势之差,得到智能体的个体攻防态势。
本发明实施例提供的基于所述所处位置计算智能体达到相应位置的时间包括:
当敌方处于感知域内时,根据传感器感知的环境信息以及障碍物信息,进行最优路径规划,计算智能体到达所述位置的确切运动时间;
当敌方处于感知域外时,其他己方智能体获取障碍物信息,计算确切的运动时间;当无法获取障碍物信息,则对感知域外的部分按直线距离最短路径计算运动时间。
本发明实施例提供的基于态势评估结果确定控制策略包括:
若己方态势对敌方具有优势,且敌方不在己方攻击域内时,选择前进策略;若己方态势对敌方具有优势,且敌方在己方攻击域内时,选择作战策略;若己方态势对敌方具有劣势,则选择撤退策略,待态势变化后再重新选择策略。
本发明实施例提供的基于所述控制策略控制智能体进行机动或攻击包括:
若选择前进策略,则智能体先确定攻击对象,计算最佳的攻击位置,规划到达该位置的最佳路径,再以一定速度运动到该位置,进而攻击敌方;
若选择作战策略,则智能体微调位置或保持不动;
若选择撤退策略,智能体以最快的速度向出发点运动。
下面结合具体实施例对本发明的技术方案做进一步说明。
实施例1:
本发明提出一种基于多智能体技术的对抗系统,如图1所示,所述的对抗系统包括感知模块、通信模块、信息处理模块、态势评估模块、决策选择模块、控制模块、攻击模块等。
所述的感知模块感知到智能体周围环境信息后,将其传递给信息处理模块,同时,通信模块也将通信获取到的己方智能体信息传递给信息处理模块。信息处理模块将这些信息及智能体自身信息进行汇总后,由态势评估模块根据这些信息来评估我方对敌方的态势。待评估出态势结果后,决策选择模块根据态势来选择合适的策略,智能体根据该策略及自身状态进行机动或攻击。
所述的感知模块和通信模块分别以感知半径和通信半径来定义,攻击模块以攻击半径和攻击角度来定义,这几个模块为智能体的固定属性,在使用时基本只是用来判断其他对象在不在范围内,以便进行后续处理,不涉及到太复杂的过程。
所述的态势评估模块是比较关键的一个部分,态势评估的结果直接影响到决策的选择,对最终的对抗结果会产生重要的影响,态势评估的过程如图二所示。
影响态势的因素主要包含以下几个部分:
智能体自身属性,例如运动能力、感知能力、通信能力、攻防能力等;
群体分布关系;
环境信息。
其中,群体分布关系和环境信息可由智能体的感知和通信获取。
在进行对抗时,统合智能体自身信息、感知信息和通信信息,其中自身信息包括其速度、位姿、攻击力、感知范围、通信范围等,感知信息为感知范围内的环境信息包括友方与敌方智能体的速度和位姿等信息,通信信息为通信范围内友方智能体发送过来的全部信息。
所述的态势评估过程如图2所示,根据我方智能体的位置()和敌方智能体位置()以及我方智能体的功能域,计算敌我双方的相对位置关系。若敌方处于我方攻击域内,则根据我方攻击力和预估的敌方生命值来计算消灭敌方所需的时间,取该时间的倒数作为我方的攻击态势。
若敌方在我方感知域内,或者敌方虽然不在感知域内,但其周围环境信息可以通过通信手段获知,则我方可规划出一条到攻击位置的最优路径,根据该路径和我方智能体的运动能力,即可计算出到达目标位置的时间,取该时间的倒数作为我方的运动态势。
若敌方既不在我方感知域内,我方也不能通过通信手段获取到敌方周围的环境信息,则不能规划出最优路径,只能在已知信息里逐渐靠近敌方,路径搜索消耗更多时间,因此此时可设置一个路径搜索系数,我方与目标位置的距离和路径搜索系数的乘积作为预估路径长度,由预估路径长度和我方运动能力来估计我方到达目标位置的时间,将其倒数作为我方的运动态势。将上述运动态势与攻击态势之和作为我方对敌方的威胁态势。
同时,根据智能体获取到的敌方智能体信息,估计敌方智能体的各项属性和能力,这里假定双方的各项能力呈正比,由于敌方的运动能力是可以通过感知准确计算的,因此通过双方智能体运动能力的比值,以及智能体的各项能力来估计敌方智能体的各项能力,并以此估计敌方对我方的威胁态势。由敌我双方的威胁态势,可以计算出智能体的个体态势。根据智能体群体分布关系,对智能体个体态势进行叠加,即为智能体群体态势。
所述的决策选择过程如图4所示,智能体根据态势的评估结果,选择合适的决策规则,并在该规则下执行相应的控制指令。若己方态势对敌方具有优势,且敌方不在己方攻击域内时,选择前进策略;若己方态势对敌方具有优势,且敌方在己方攻击域内时,选择作战策略;若己方态势对敌方具有劣势,则选择撤退策略,待态势变化后再重新选择策略。
根据上述策略和自身状态,智能体执行相应的机动动作。若选择前进策略,智能体先确定攻击对象,计算最佳的攻击位置,再通过A星等算法规划出到达该位置的最佳路径,再以一定速度运动到该位置,进而攻击敌方;若选择作战策略,智能体微调位置或保持不动,直接攻击敌方;若选择撤退策略,智能体以最快的速度向出发点撤退。
下面结合具体实验数据对本发明的技术方案作进一步描述。
对于上述发明,进行如下实验:双方智能体进行4对2的对抗,两组智能体的参数如表1。
表1第一组实验双方能力值
图5为仿真过程中,一方智能体个体态势的评估结果,智能体自身所处位置态势最大,向外递减,其中有两个明显的圆形台阶,分别为智能体感知范围和通信范围的突变,感知范围内还有几个凹下去的区域,为智能体感知到的障碍物。图6为一方智能体对另一方智能体个体态势的估计,图7是另一方智能体的实际态势,可以看到,虽然估计值与实际值存在一些误差,但误差基本在可接受范围内。图8为一方智能体叠加之后的群体态势,四个峰代表一方的四个智能体,两个谷代表另一方的两个智能体。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上;术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于多智能体技术的对抗系统,其特征在于,所述基于多智能体技术的对抗系统包括:
感知模块,用于利用各种传感器感知智能体周围环境信息;
通信模块,用于获取通信范围内的通信信息;同时用于将感知信息、通信信息以及智能体自身信息传递给信息处理模块;
信息处理模块,用于将感知信息、通信信息及智能体自身信息进行汇总;
态势评估模块,用于根据所述汇总信息计算自身周围不同位置处的态势,评估我方对敌方的态势;
决策选择模块,用于基于态势评估结果选择合适的策略;
控制模块,用于基于选择的策略控制智能体;
攻击模块,用于执行控制指令进行机动或攻击;
所述感知模块和通信模块分别以感知半径和通信半径进行定义,攻击模块以攻击半径和攻击角度进行定义;
所述环境信息包括己方智能体、敌方智能体、障碍物及其他物体的信息;
所述通信信息包括通信对象的自身信息、感知信息、通信信息;
所述智能体自身信息即智能体的各种属性信息,所述属性信息包括运动速度、当前位姿、攻防能力、感知范围、通信范围;
所述态势包括:运动态势和攻击态势;
所述运动态势即智能体运动到攻击位置所用时间的倒数;所述攻击态势即智能体消灭敌方所用时间的倒数。
2.一种应用于如权利要求1所述基于多智能体技术的对抗系统的基于多智能体技术的对抗方法,其特征在于,所述基于多智能体技术的对抗方法包括:
步骤一,智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息;
步骤二,将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估;
步骤三,基于态势评估结果确定控制策略,基于所述控制策略控制智能体进行机动或攻击。
3.如权利要求2所述基于多智能体技术的对抗方法,其特征在于,步骤一中,所述智能体通过各种传感器感知周围环境信息,同时获取通信范围内其他己方智能体掌握的信息包括:
对于智能体感知域内的环境信息,利用各种传感器进行感知获取;对于智能体感知域外的信息,通过通信手段从其他己方智能体进行获取;
步骤二中,所述将感知以及通信获取的信息与智能体自身信息进行汇总,并基于汇总信息进行态势评估包括:
首先,基于汇总的信息确定单个智能体对敌方的威胁态势;
其次,根据智能体的分布关系,将单个智能体的态势进行叠加得到群体态势。
4.如权利要求3所述基于多智能体技术的对抗方法,其特征在于,所述确定单个智能体对敌方的威胁态势包括:
(1)判断敌方所处位置为感知域内或感知域外,基于所述所处位置计算智能体达到相应位置的时间,并基于计算的运动时间确定运动时间的倒数即智能体对敌方的运动态势;
(2)计算智能体攻击时间的倒数确定攻击态势:根据敌方状态预估敌方寿命,根据预估寿命和智能体攻击力计算消灭敌方的攻击时间,基于所述攻击时间得到攻击时间的倒数即攻击态势;
(3)将所述运动态势与攻击态势加和即为智能体对敌方的威胁态势;并计算已方智能体对敌方的威胁态势与敌方对己方智能体的威胁态势之差,得到智能体的个体攻防态势;
所述基于所述所处位置计算智能体达到相应位置的时间包括:
当敌方处于感知域内时,根据传感器感知的环境信息以及障碍物信息,进行最优路径规划,计算智能体到达所述位置的确切运动时间;
当敌方处于感知域外时,其他己方智能体获取障碍物信息,计算确切的运动时间;当无法获取障碍物信息,则对感知域外的部分按直线距离最短路径计算运动时间。
5.如权利要求2所述基于多智能体技术的对抗方法,其特征在于,步骤三中,所述基于态势评估结果确定控制策略包括:
若己方态势对敌方具有优势,且敌方不在己方攻击域内时,选择前进策略;若己方态势对敌方具有优势,且敌方在己方攻击域内时,选择作战策略;若己方态势对敌方具有劣势,则选择撤退策略,待态势变化后再重新选择策略。
6.如权利要求2所述基于多智能体技术的对抗方法,其特征在于,所述基于所述控制策略控制智能体进行机动或攻击包括:
若选择前进策略,则智能体先确定攻击对象,计算最佳的攻击位置,规划到达该位置的最佳路径,再以一定速度运动到该位置,进而攻击敌方;
若选择作战策略,则智能体微调位置或保持不动;
若选择撤退策略,智能体以最快的速度向出发点运动。
7.一种信息数据处理终端,其特征在于,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求2~6任意一项所述基于多智能体技术的对抗方法。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求2~6任意一项所述基于多智能体技术的对抗方法。
CN202111115509.7A 2021-09-23 2021-09-23 基于多智能体技术的对抗系统、方法、终端及存储介质 Active CN113805569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111115509.7A CN113805569B (zh) 2021-09-23 2021-09-23 基于多智能体技术的对抗系统、方法、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111115509.7A CN113805569B (zh) 2021-09-23 2021-09-23 基于多智能体技术的对抗系统、方法、终端及存储介质

Publications (2)

Publication Number Publication Date
CN113805569A CN113805569A (zh) 2021-12-17
CN113805569B true CN113805569B (zh) 2024-03-26

Family

ID=78940360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111115509.7A Active CN113805569B (zh) 2021-09-23 2021-09-23 基于多智能体技术的对抗系统、方法、终端及存储介质

Country Status (1)

Country Link
CN (1) CN113805569B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548674B (zh) * 2022-01-17 2022-12-30 清华大学 面向多智能体对抗场景的威胁态势评估方法、装置及设备
CN114492059B (zh) * 2022-02-07 2023-02-28 清华大学 基于场能的多智能体对抗场景态势评估方法及装置
CN114492058B (zh) * 2022-02-07 2023-02-03 清华大学 面向多智能体对抗场景的防御态势评估方法及装置
CN114578710B (zh) * 2022-02-25 2022-09-06 军事科学院系统工程研究院网络信息研究所 基于多智能体的有无人协同体系的作战仿真系统及方法
CN115268481B (zh) * 2022-07-06 2023-06-20 中国航空工业集团公司沈阳飞机设计研究所 一种无人机对抗策略决策方法及其系统
CN115617534B (zh) * 2022-12-20 2023-03-10 中国电子科技集团公司信息科学研究院 一种基于认知协同的分布式自主对抗系统及实现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964019A (zh) * 2010-09-10 2011-02-02 北京航空航天大学 基于Agent技术的对抗行为建模仿真平台及仿真方法
CN103413186A (zh) * 2013-08-19 2013-11-27 中国电子科技集团公司第二十八研究所 一种基于混合优化算法的多飞行器协同目标分配方法
CN112580221A (zh) * 2020-12-28 2021-03-30 北京航空航天大学 一种攻防对抗仿真系统
CN112947581A (zh) * 2021-03-25 2021-06-11 西北工业大学 基于多智能体强化学习的多无人机协同空战机动决策方法
WO2021174765A1 (zh) * 2020-03-03 2021-09-10 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150199623A1 (en) * 2012-05-11 2015-07-16 Saab Ab Method for resource allocation in mission planning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964019A (zh) * 2010-09-10 2011-02-02 北京航空航天大学 基于Agent技术的对抗行为建模仿真平台及仿真方法
CN103413186A (zh) * 2013-08-19 2013-11-27 中国电子科技集团公司第二十八研究所 一种基于混合优化算法的多飞行器协同目标分配方法
WO2021174765A1 (zh) * 2020-03-03 2021-09-10 中国科学院自动化研究所 基于多无人机协同博弈对抗的控制系统
CN112580221A (zh) * 2020-12-28 2021-03-30 北京航空航天大学 一种攻防对抗仿真系统
CN112947581A (zh) * 2021-03-25 2021-06-11 西北工业大学 基于多智能体强化学习的多无人机协同空战机动决策方法

Also Published As

Publication number Publication date
CN113805569A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
CN113805569B (zh) 基于多智能体技术的对抗系统、方法、终端及存储介质
CN107943025B (zh) 机器人脱困的处理方法
Zengin et al. Real-time target tracking for autonomous UAVs in adversarial environments: A gradient search algorithm
EP3746855A1 (en) Path planning in mobile robots
KR20190029524A (ko) 경로를 자율주행하도록 로봇을 훈련시키기 위한 시스템 및 방법
CN110488843A (zh) 避障方法、移动机器人及计算机可读存储介质
US11887485B2 (en) Control method and system for collaborative interception by multiple unmanned surface vessels
CN104180801B (zh) 基于ads‑b系统航迹点的预测方法和系统
CN110471412A (zh) 一种评估路径跟踪算法性能的方法及评估系统
CN111752294A (zh) 一种飞行控制方法及相关装置
CN116931583B (zh) 移动对象的确定方法和避让方法、装置、设备及存储介质
CN111390909B (zh) 工业机器人的避障方法和系统
CN105538309B (zh) 一种有限传感能力的机器人障碍物动态识别算法
CN112753000A (zh) 避障方法、可移动平台、控制设备和存储介质
KR102412066B1 (ko) 상태 결정 방법 및 장치, 로봇, 저장 매체 및 컴퓨터 프로그램
CN115639769A (zh) 一种安全智能控制方法及系统
CN114721435A (zh) 一种基于软约束的针对无人机群的防御方法及相关设备
CN113325415A (zh) 车辆雷达数据和相机数据的融合方法及系统
CN114012725B (zh) 机器人重定位方法、系统、机器人及存储介质
Wang et al. An autonomous navigation method for mobile robot based on ROS
CN113158779B (zh) 一种行走方法、装置和计算机存储介质
CN116954265B (zh) 局部运动轨迹的重规划方法、装置和电子设备
Zhang et al. Situation cognitive in adjustable autonomy system theory and application
CN107885194B (zh) 一种无人探索装置及其控制方法、系统
Ollington et al. Learning place cells from sonar data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant