CN101908085B - 一种基于多Agent的分布式推演仿真系统与方法 - Google Patents

一种基于多Agent的分布式推演仿真系统与方法 Download PDF

Info

Publication number
CN101908085B
CN101908085B CN201010220225XA CN201010220225A CN101908085B CN 101908085 B CN101908085 B CN 101908085B CN 201010220225X A CN201010220225X A CN 201010220225XA CN 201010220225 A CN201010220225 A CN 201010220225A CN 101908085 B CN101908085 B CN 101908085B
Authority
CN
China
Prior art keywords
agent
computing machine
information
module
deduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010220225XA
Other languages
English (en)
Other versions
CN101908085A (zh
Inventor
王青
解志君
杨飞
董朝阳
吴振东
邓晓帆
陈威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201010220225XA priority Critical patent/CN101908085B/zh
Publication of CN101908085A publication Critical patent/CN101908085A/zh
Application granted granted Critical
Publication of CN101908085B publication Critical patent/CN101908085B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提出了一种基于多Agent的分布式推演仿真系统与方法,所述的基于多Agent的分布式推演仿真系统包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机。该基于多Agent的分布式推演仿真系统可以实现自主感知战场环境状态、自主决策和行为输出,可以选择不同的推演Agent模型,对于某些新型作战武器或装备,只需模块化更改相应作战武器库,或者将全新的装备信息以固定格式加载到作战武器库中,即具备可扩充特性并具有通用性的作战仿真系统,用以验证多种、新型的作战武器性能。

Description

一种基于多Agent的分布式推演仿真系统与方法
技术领域
本发明属于计算机仿真技术领域,具体涉及一种基于多Agent的分布式推演仿真系统与方法。
背景技术
现代战场仿真系统对于新武器装备性能测试、战争舆情推演、作战人员军事训练等起着至关重要的作用。现代战场是高度复杂的非线性系统,具有可变的战场环境、过多的动态因素干扰、多样的作战任务的,差异性的个体行为模型及复杂的人在系统决策。国外对作战仿真系统的研究时间较早,最具代表性的就是美军联合建模与仿真系统JMASS、联合仿真系统JSMIS和联合作战系统JWARS。
多Agent技术是一种非线性系统建模方法,利用具备约束关系的多Agent系统建立战场群体模型,是当前作战仿真系统的最新研究方向。近年来引入到作战系统建模中,并很快成为研究热点,国外近些年来进行了大量研究工作,例如美国海军分析中心提出了ISAAC系统模型;此外一些独立研究机构也提出了多Agent仿真系统的构建模型,如UTSAF等。国外军事仿真系统的建立,具备复杂的通信协议和固定的模型,构造困难,且不具备通用性。北京航空航天大学、国防科技大学等也都在致力于相关领域的研究,但总的来说,国内对基于多Agent技术的作战仿真系统的研究尚处于初级阶段,无论是在理论上还是在实践上同国外相比都有不小的差距,目前尚无一种通用的仿真系统与方法。
发明内容
本发明提出了一种基于多Agent的分布式推演仿真系统及仿真方法,所述的基于多Agent的分布式推演仿真系统(以下简称仿真系统)包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机。
所述的数据通信链路采用以太网通信方式,实现推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机之间的数据传输;数据通信采用基于TCP/IP协议的服务器一客户端形式,推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机有不同的IP地址,通过点对点进行信息收发。
所述的推演配置与统计分析计算机用于配置作战任务、战场环境以及推演Agent模型及数量,生成配置信息并将配置信息下发到环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机来对其进行初始化,并发布“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的运行;同时推演配置与统计分析计算机接收环境信息管理计算机发送的的数据分析与统计请求信息,进行解析得到全局情势,判断仿真全过程是否结束;
所述的环境主控系统计算机主要功能为控制仿真系统的仿真时序和完成Agent行为信息的解析和输出,具体为接收分布式推演Agent计算机发送的Agent感知请求信息,并将多条Agent感知请求信息组合为Agent感知请求信息列表发送给环境信息管理计算机,经过环境信息管理计算机匹配后生成Agent感知信息,再经由环境主控系统计算机转发到分布式推演Agent计算机;环境主控系统计算接收到分布式推演Agent计算机向其发送的Agent行为信息,进行解析和效果判定后输出Agent属性更新信息、环境更新信息和Agent任务信息;将上述三种信息发送到环境信息管理计算机供其更新和存储;同时将Agent属性更新信息发送到分布式推演Agent计算机;
所述的环境信息管理计算机接收来自环境主控系统计算机发送的Agent感知请求信息列表,进行匹配生成的Agent感知信息,并将该Agent感知信息通过环境主控系统计算机发送到分布式推演Agent计算机进行感知;环境信息管理计算机接收环境主控系统计算机发送的Agent属性更新信息、环境更新信息和Agent任务信息,接收到的Agent属性更新信息和环境更新信息用于更新全局映像库和环境信息库;接收的Agent任务信息进行存储后发送到分布式推演Agent计算机;
所述的分布式推演Agent计算机在仿真全过程中模拟独立的推演Agent实体,向环境主控计算机发送Agent感知请求信息,该信息经过匹配后生成固定格式的Agent感知信息并经由环境主控计算机再发回该分布式推演Agent计算机进行感知;分布式推演Agent计算机接收环境主控系统计算机发送的Agent属性更新信息,接收环境信息管理计算机发送的Agent任务信息,执行自主行为或外部控制的行为输出,并经解析后输出Agent行为信息到环境主控系统计算机。
本发明的推演配置与统计分析计算机组成包括配置文件生成模块、配属Agent模型库、传感器库、武器装备库、战场环境信息库、全局仿真步骤控制模块、通信模块A、战局显示模块和数据解析模块。推演配置与统计分析计算机的可以实现以下三种功能:
(1)仿真全过程开始前管理员查询和设置配属Agent模型库、传感器库和武器装备库和战场环境信息库后确定参演的战场环境模型;设置单步仿真运行的单步步长,通过配置文件生成模块生成配置信息;并通过通信模块A下发到环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机;
(2)仿真全过程的步骤控制:仿真全过程开始后,管理员通过全局仿真步骤控制模块完成对仿真全过程的监控,并通过下发“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的各个单步仿真运行的暂停、继续和开始;
(3)全局战局显示和数据解析:仿真全过程开始后管理员通过战局显示模块对仿真全过程进行的实时监视和战况分析;通信模块A接收环境信息管理计算机发送的数据分析与统计请求信息后经数据解析模块解析并计算战况,判断仿真全过程是否完成。
本发明的环境信息管理计算机结构包括通信模块B、Agent感知请求解析模块、全局映像信息库、环境信息库、信息匹配模块及Agent感知限定条件数据库,所述的Agent感知限定条件数据库包括Agent注册信息库、地形环境信息库和传感器信息库。
该环境信息管理计算机的实现流程为:(1)通信模块B接收环境主控系统计算机发送的Agent感知请求信息列表,再由通信模块B到达Agent感知请求解析模块中进行解析,得到Agent感知请求信息类型、信息参数及发送请求的Agent ID;其中Agent感知请求信息列表是由多个Agent感知请求信息构成的;(2)Agent感知请求信息经Agent感知请求解析模块解析后,到达信息匹配模块,信息匹配模块根据Agent感知请求信息类型、信息参数和Agent ID分别查询Agent感知限定条件数据库、环境信息库和全局映像信息库,开始对Agent感知请求信息进行信息匹配;并且全局映像信息库存储当前分布式推演Agent计算机状态,环境信息库存储当前战场环境信息;信息匹配后生成固定格式的Agent感知信息;经由通信模块B发送到环境主控系统计算机;(3)通信模块B接收环境主控系统计算机发送的Agent任务信息后进行存储,该Agent任务信息存储后经由通信模块B发送到到分布式推演Agent计算机;再经由通信模块B接收环境主控系统计算机发送的Agent属性更新信息和环境更新信息,实时更新其全局映像信息库和环境信息库;(4)通信模块B接收环境主控系统计算机发送的数据分析与统计请求,查询全局映像信息库和环境信息库,获得到数据分析与统计请求信息,并将该信息经由通信模块B发送到推演配置与统计分析计算机。
所述的地形环境信息库、Agent注册信息库和传感器信息库均为模块化数据库,根据不同的作战需求可以扩充其数据内容,具备仿真平台的通用性特征。
本发明的环境主控系统计算机包括Agent行为效果判定模块和系统通信控制模块;所述的Agent行为效果判定模块结构包括词义语法分析器、注册Agent信息库、行为效果函数规则库、机动性能库、武器性能库及计时器,效果寄存器、效果执行器、通信模块D、效果判定模块及自动演化环境库。
所述的Agent行为效果判定模块的实现流程为:
(1)通信模块D接收分布式推演Agent计算机发出的Agent行为信息,,到达词义语法分析器解析后,到达效果判定模块
(2)效果判定模块查询自动演化环境库,得到行为输出标准信息对应的具体环境信息;查询注册Agent信息库,得到行为输出标准信息里的Agent ID对应所需Agent信息;效果判定模块查询武器性能库,得到Agent配备武器信息、火力强度函数、克制装甲列表、对环境影响函数列表和武器攻击频率;效果判定模块查询机动性能库,得到Agent机动行为输出参数;效果判定模块查询行为效果函数规则库,得到Agent攻击行为效果信息或Agent通信行为效果信息;效果判定模块查询计时器,得到当前时间,计算行为效果预计发生时间;效果判定模块经过上述查询后生成效果判定标准信息;
(3)效果判定标准信息存储于效果寄存器中;效果执行器轮询效果寄存器,效果执行器查询计时器,得到当前时间,对比效果判定标准信息中预计发生时间,预计时间到达的效果信息将被调出并转化为效果执行标准信息,根据效果执行标准信息模式的不同分为Agent属性更新信息、环境更新信息和Agent任务信息,并将这三种信息通过通信模块D发送到环境信息管理计算机中;同时将Agent属性更新信息经通信模块D发送到分布式推演Agent计算机。
所述的系统通信控制模块是数据通信链路的主控节点,其实现过程包括单步仿真运行前的初始化控制和单步仿真运行的控制;仿真全过程是由多步单步仿真运行来完成的;
所述的单步仿真运行前的初始化控制是指环境主控系统计算机读取和解析配置信息,初始化单步仿真运行单步步长和应答消息列表。所述的应答消息列表是指单步仿真运行过程中各台计算机点对点IP收发信息的顺序逻辑列表。
单步仿真运行的控制包括以下三个步骤:
(1)控制单步仿真运行的标准时间对齐:
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机;
推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机,接收到时间对齐信号之后,统一将各自的计算机的单步仿真运行的时间统一初始化为接收到的单步仿真运行的标准时间;
(2)单步仿真运行的仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机向系统通信控制模块回馈控制触发信号信息;若系统通信控制模块接收的所有回馈控制触发信号信息正常,则单步仿真运行开始,若系统通信控制模块接收的任一回馈控制触发信号信息有误,排查错误,重新发送控制触发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
(3)控制单步仿真运行时序:
单步仿真运行开始后,控制以下四个时序:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并将得到多条Agent感知请求信息组合为Agent感知请求信息列表;并将该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机中存储,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息;分布式推演Agent计算机不执行Agent任务信息,环境主控系统计算机的Agent行为效果判定模块相应也不执行判定分布式推演Agent计算机仅发送Agent行为信息供下一步单步仿真运行时进行判定及执行。
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。
本发明的分布式推演Agent计算机包括通信模块C、固定属性库、可变属性库、感知模块、视景数据解析模块、视景显示模块、人机交互接口模块、操作数据解析模块、规则库、决策模块、任务选择模块和行为解析输出模块。
所述的分布式推演Agent计算机的实现流程为:经通信模块C发出Agent感知请求信息,经由环境信息管理计算机的匹配和环境主控系统计算机的转发之后,再经由通信模块C获得Agent感知信息,Agent感知信息到达感知模块进行感知;
经由通信模块C接收环境主控计算机发送的Agent属性更新信息用于更新可变属性库,并结合可变属性库与固有属性库,在感知模块内解析Agent感知信息得到综合数据信息;
经由通信模块C接收环境信息管理计算机发送的Agent任务信息,用于多级任务选择;决策模块根据综合数据信息,查询规则库,得到自主决策任务信息;综合数据信息通过视景数据解析模块,到达人机交互接口,得到Agent视角的环境视景,引出视频信号供操作员监视局部战场情势;操作员采取键盘或者鼠标输入操作信息控制Agent行为,操作信息经由操作数据解析模块,得到控制决策任务信息;任务选择模块结合Agent任务信息、自主决策任务信息和控制决策任务信息选择最终任务,所选任务经由行为解析模块解析后得到Agent行为信息,由通信模块C通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;第一步单步仿真运行时没有Agent行为信息,环境主控系统计算机的Agent行为效果判定模块相应不执行Agent行为信息判定。
一种基于多Agent的分布式推演仿真方法,主要包括以下几个步骤:
步骤一:仿真全过程开始前的测试、连接工作:
(a)管理员通过推演配置与统计分析计算机制定战场战术目标,从战场环境库中选择战场环境,从推演Agent模型库中选择作战推演Agent类型与数量,设置单步仿真运行步长,
(b)激活各台分布式推演Agent计算机的外部接口属性,定义各Agent映射的分布式推演Agent计算机的网络IP地址,并生成配置信息,开启数据通信链路;
(c)测试数据通信链路是否畅通:如果数据通信链路不通畅,检查网络配置,返回步骤(b);
如果数据通信链路畅通,则将配置信息经由数据通信链路发送到各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机;各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机根据配置信息进行初始化;
各台分布式推演Agent计算机需要初始化本机对应的推演Agent模型属性,包括固有属性、可变属性和决策库以及本机对应的网络地址;
环境主控系统计算机需要初始化系统通信控制模块,通过读取配置信息,初始化单步仿真运行步长,设置应答消息列表;
环境信息管理计算机需要初始化全局Agent映像信息库、环境信息库、Agent感知判定模块、地形环境信息库、Agent注册信息库和传感器信息库;所述的测试数据通信链路是指测试整个分布式推演仿真系统各种时序的数据通道是否畅通;
(d)整个分布式推演仿真系统配置回馈验证:推演配置与统计分析计算机接收各台分布式推演Agent计算机、环境信息管理计算机和环境主控系统计算机的配置回馈信息,进行匹配配置信息;若配置回馈信息匹配,等待管理员发布开始仿真全过程的运行触发指令;否则排查错误配置回馈信息,推演配置与统计分析计算机重新发送配置信息并接收配置回馈信息,直到全部配置回馈信息匹配;
所述的仿真全过程是由多步单步仿真运行过程完成的;
步骤二:管理员发布仿真全过程运行触发指令;
步骤三:单步仿真运行标准时间对齐
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机后,将各台计算机的单步仿真运行时间统一初始化为接收到的单步仿真标准时间,开始运行单步仿真;
步骤四:单步仿真运行前仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,收到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机回馈的控制触发信号信息;若回馈控制触发信号信息正常,则开始单步仿真运行,若回馈控制触发信号信息有误,排查错误,重新发送控制出发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
步骤五:单步仿真运行:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并通过系统通信控制模块将多个Agent感知信息请求信息构成的Agent感知信息请求信息该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息,分布式推演Agent计算机不执行Agent任务信息,仅发送Agent行为信息供下一步单步仿真运行时执行;
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。
步骤六:判断仿真全过程是否结束:
推演配置与统计分析计算机判断仿真全过程是否结束,如果是,结束仿真全过程;如果否,推演配置与统计分析计算机发布继续运行下一步单步仿真命令到环境主控系统计算机,环境主控系统计算机接收到下一步单步仿真运行命令信号后,返回步骤三。
本发明的优点在于:
(1)本发明中的分布式推演Agent计算机可以实现自主感知战场环境状态、自主决策和行为输出。并且分布式推演Agent计算机具备人机交互接口模块,可以让操作人员以推演Agent视角感知战场态势,并控制该对应推演Agent采取对应决策行为。
(2)本发明具备多台分布式推演Agent计算机,可以实现战场集群作战仿真。推演配置与统计分析计算机可以全局监控战场情势;并通过内置分析规则解析战场情势。在仿真过程中,操作员可以采取暂停、停止、继续等指令,控制整个分布式推演仿真系统仿真运行。
(3)本发明中采用以太网通信实施方式的数据通信链路;可以方便的扩充网络节点,扩充分布式推演Agent群体作战数目,同时还可以实现跨地域的分布式仿真。
(4)本发明中分布式推演Agent运行步骤包含环境感知、自主决策和行为输出三个步骤,并且各台分布式推演Agent计算机的并行时序由环境主控系统计算机的系统通信控制模块控制,即以环境主控系统计算机的系统通信控制模块作为通信总控制器,分时序收发全局信息、控制各台分布式推演Agent计算机从先“感知”到“行为输出”的逻辑顺序,简化了战场信息流,减轻网络的信息负载。
(5)在推演配置与统计分析计算机上,可以设置仿真步长,并从战场环境库中选择加载不同的战场环境,也可以选择不同的推演Agent模型,对于某些新型作战武器或装备,只需模块化更改相应作战武器库,或者将全新的装备信息以固定格式加载到作战武器库中,即具备可扩充特性并具有通用性的作战仿真系统,用以验证多种、新型的作战武器性能。
(6)本发明采用推演配置与统计分析计算机的总控特性可以实现战场仿真过程的全局控制,方便管理;同时具有分析规则库解析全局战场情势,方便分析判定。
附图说明
图1:基于多Agent的分布式推演仿真系统结构图;
图2:环境信息管理计算机结构及实现流程图;
图3:Agent行为效果判定模块结构及实现流程图;
图4-A:单步仿真运行控制A图;
图4-B:单步仿真运行控制B图;
图5:分布式推演Agent计算机结构及实现流程图;
图6:基于多Agent的分布式推演仿真方法流程图。
具体实施方式
下面将结合附图对本发明作进一步详细说明。
本发明提出了一种基于多Agent的分布式推演仿真系统(以下简称为仿真系统),如图1所示,包括数据通信链路、推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机。
所述的数据通信链路采用以太网通信方式,实现推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机之间的数据传输;数据通信采用基于TCP/IP协议的服务器-客户端形式,推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和若干台分布式推演Agent计算机有不同的IP地址,通过点对点进行信息收发。
所述的推演配置与统计分析计算机用于配置作战任务、战场环境以及推演Agent模型及数量,生成配置信息并将配置信息下发到环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机来对其进行初始化,并发布“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的运行;同时推演配置与统计分析计算机接收环境信息管理计算机发送的的数据分析与统计请求信息,进行解析得到全局情势,判断仿真全过程是否结束;
所述的环境主控系统计算机主要功能为控制仿真系统的仿真时序和完成Agent行为信息的解析和输出,具体为接收分布式推演Agent计算机发送的Agent感知请求信息,并将多条Agent感知请求信息组合为Agent感知请求信息列表发送给环境信息管理计算机,经过环境信息管理计算机匹配后生成Agent感知信息,再经由环境主控系统计算机转发到分布式推演Agent计算机;环境主控系统计算接收到分布式推演Agent计算机向其发送的Agent行为信息,进行解析和效果判定后输出Agent属性更新信息、环境更新信息和Agent任务信息;将上述三种信息发送到环境信息管理计算机供其更新和存储;同时将Agent属性更新信息发送到分布式推演Agent计算机;
所述的环境信息管理计算机接收来自环境主控系统计算机发送的Agent感知请求信息列表,进行匹配生成的Agent感知信息,并将该Agent感知信息通过环境主控系统计算机发送到分布式推演Agent计算机进行感知;环境信息管理计算机接收环境主控系统计算机发送的Agent属性更新信息、环境更新信息和Agent任务信息,接收到的Agent属性更新信息和环境更新信息用于更新全局映像库和环境信息库;接收的Agent任务信息进行存储后发送到分布式推演Agent计算机;
所述的分布式推演Agent计算机在仿真全过程中模拟独立的推演Agent实体,向环境主控计算机发送Agent感知请求信息,该信息经过匹配后生成固定格式的Agent感知信息并经由环境主控计算机再发回该分布式推演Agent计算机进行感知;分布式推演Agent计算机接收环境主控系统计算机发送的Agent属性更新信息,接收环境信息管理计算机发送的Agent任务信息,执行自主行为或外部控制的行为输出,并经解析后输出Agent行为信息到环境主控系统计算机。
本发明的推演配置与统计分析计算机组成包括配置文件生成模块、配属Agent模型库、传感器库、武器装备库、战场环境信息库、全局仿真步骤控制模块、通信模块A、战局显示模块和数据解析模块。推演配置与统计分析计算机的可以实现以下三种功能:
(1)仿真全过程开始前管理员查询和设置配属Agent模型库、传感器库和武器装备库和战场环境信息库后确定参演的战场环境模型;管理员设置单步仿真运行的单步步长,通过配置文件生成模块生成配置信息;并通过通信模块A下发到环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机;
(2)仿真全过程的步骤控制:仿真全过程开始后,管理员通过全局仿真步骤控制模块完成对仿真全过程各个单步仿真运行的监控,管理员并通过通信模块A下发“暂停、继续、开始”命令到环境主控系统计算机,控制仿真系统的各个单步仿真运行的暂停、继续和开始;
(3)全局战局显示和数据解析:仿真全过程开始后管理员对仿真全过程的监视和战况分析,仿真全过程通过战局显示模块完成实时显示;通信模块A接收环境信息管理计算机发送的数据分析与统计请求信息后经数据解析模块解析并计算战况,判断仿真全过程是否完成。
本发明的环境信息管理计算机结构和实现流程如图2所示,包括通信模块B、Agent感知请求解析模块、全局映像信息库、环境信息库、信息匹配模块及Agent感知限定条件数据库,所述的Agent感知限定条件数据库包括Agent注册信息库、地形环境信息库和传感器信息库。该环境信息管理计算机的实现流程为:(1)通信模块B接收环境主控系统计算机发送的Agent感知请求信息列表,再由通信模块B到达Agent感知请求解析模块中进行解析,得到Agent感知请求信息类型、信息参数及发送请求的Agent ID;其中Agent感知请求信息列表是由多个Agent感知请求信息构成的;(2)Agent感知请求信息经Agent感知请求解析模块解析后,到达信息匹配模块,信息匹配模块根据Agent感知请求信息类型、信息参数和Agent ID分别查询Agent感知限定条件数据库、环境信息库和全局映像信息库,开始对Agent感知请求信息进行信息匹配;并且全局映像信息库存储当前分布式推演Agent计算机状态,环境信息库存储当前战场环境信息;信息匹配后生成固定格式的Agent感知信息;经由通信模块B发送到环境主控系统计算机;(3)通信模块B接收环境主控系统计算机发送的Agent任务信息后进行存储,该Agent任务信息存储后经由通信模块B发送到到分布式推演Agent计算机;再经由通信模块B接收环境主控系统计算机发送的Agent属性更新信息和环境更新信息,实时更新其全局映像信息库和环境信息库;(4)通信模块B接收环境主控系统计算机发送的数据分析与统计请求,查询全局映像信息库和环境信息库,获得到数据分析与统计请求信息,并将该信息经由通信模块B发送到推演配置与统计分析计算机。
所述的地形环境信息库、Agent注册信息库和传感器信息库均为模块化数据库,根据不同的作战需求可以扩充其数据内容,具备仿真平台的通用性特征。
本发明的环境主控系统计算机包括Agent行为效果判定模块和系统通信控制模块;所述的Agent行为效果判定模块结构及实现流程如图3所示,包括词义语法分析器、注册Agent信息库、行为效果函数规则库、机动性能库、武器性能库及计时器,效果寄存器、效果执行器、通信模块D、效果判定模块及自动演化环境库。
Agent行为效果判定模块的实现流程为:
(1)通信模块D接收分布式推演Agent计算机发出的Agent行为信息,,到达词义语法分析器解析后,到达效果判定模块
(2)效果判定模块查询自动演化环境库,得到行为输出标准信息对应的具体环境信息;查询注册Agent信息库,得到行为输出标准信息里的Agent ID对应所需Agent信息;效果判定模块查询武器性能库,得到Agent配备武器信息、火力强度函数、克制装甲列表、对环境影响函数列表和武器攻击频率;效果判定模块查询机动性能库,得到Agent机动行为输出参数;效果判定模块查询行为效果函数规则库,得到Agent攻击行为效果信息或Agent通信行为效果信息;效果判定模块查询计时器,得到当前时间,计算行为效果预计发生时间;效果判定模块经过上述查询后生成效果判定标准信息;
(3)效果判定标准信息存储于效果寄存器中;效果执行器轮询效果寄存器,效果执行器查询计时器,得到当前时间,对比效果判定标准信息中预计发生时间,预计时间到达的效果信息将被调出并转化为效果执行标准信息,根据效果执行标准信息模式的不同分为Agent属性更新信息、环境更新信息和Agent任务信息,并将这三种信息通过通信模块D发送到环境信息管理计算机中;同时将Agent属性更新信息经通信模块D发送到分布式推演Agent计算机。
效果执行标准信息划分为三种效果执行信息模式,如下表1所示:
表1  效果执行标准信息模式
 效果属性
 Agent任务信息
 环境更新信息
 Agent属性更新信息
效果执行标准信息有三种效果类型:分别是“Agent任务信息”、“环境更新信息”和“Agent属性更新信息”。“环境更新信息”:是指将Agent对战场环境的破坏等作用输出于环境信息管理计算机的环境信息库更新环境信息;“Agent属性更新信息”将发送到目标分布式推演Agent计算机,更改其可变属性,“Agent属性更新信息”同时发送到环境信息管理计算机,更新Agent全局映像信息库;“Agent任务信息”是指Agent向目标Agent发送的任务信息指令,Agent任务信息将发送到环境信息管理计算机中存储,在下一步单步仿真运行时执行本步存储的Agent任务信息。
根据Agent行为模式分类不同,效果判定标准信息计算分为以下三种:
(1)机动行为
需要判定的是下一个时间点(更新周期ΔT)所在位置,计算公式如下:
P ( t + ΔT ) = f ( ΔT , v ‾ , P ( t ) , dir , others ) - - - ( 1 )
如公式(1)所示,下一步位置P(t+ΔT)由当前位置P(t)、Agent移动速度运动方向dir、环境地形等其余因素others决定,该行为的实现具有即时性,并属于不可打断类型,具体计算方法在武器性能库内存储。
(2)攻击行为
攻击行为主要解决的是目标更新效果和目标更新时间问题。对于目标更新效果,即被损伤的程度。目标损伤计算函数如下:
D=g(d,p,style,others)    (2)
如式(2),目标的损伤判定涉及目标Agent位置(距离,d),所处地形p、攻击Agent火力类型style,其余因素others包含攻击武器射击精度、攻击武器的发射频率、被攻击对象的装甲类型等。对于大多数攻击来讲,行为输出的作用时间极短,可做立即生效处理;但对于某些攻击,如手雷、低速导弹等,其效果产生有较大时滞,且有可能被打断,这需要相关计算处理。具体计算方法与武器装备对应,以可扩充数据库的形式存储。
例如:反坦克导弹攻击到达时间:
t = f ( p ( Agent ) , p ( T arg et ) , v ‾ , other ) - - - ( 3 )
由公式(3),t由目标距离(p(Agent)、p(T arg et))、导弹速度
Figure BSA00000178882800124
和其他因素other决定,具体计算参数在武器性能库内存储。。
(3)通信行为
通信行为指Agent之间的信息交互,包含上级Agent与下级Agent的命令指令以及平级Agent之间的任务协作指令。所有Agent之间的(包括上级Agent、下级Agent和平级Agent)通信交互行为以环境信息管理计算机为中介,即将通信信息发送到环境信息管理计算机,在推演Agent计算机向环境信息管理计算机提出感知请求并获得感知信息、同时接收到任务信息。通信内容根据实际战场形式确定。
经过效果判定系统后,Agent的三种行为信息均转化为“效果判定标准”形式(见表2),存储到效果寄存器中。
表2  效果判定标准表
  模式   发生时间   更新内容   更新效果   可打断
表2中“模式”是指机动行为、攻击行为或通信行为中的一种,见表2所示;“发生时间”是指计算得到的该行为预计发生时间,“更新内容”表示行为效果的作用对象(具体环境、具体Agent、弹药等);“更新效果”是指行为效果的作用形式(环境破坏程度、Agent生命损失程度、弹药消耗等),“可打断”是指该行为效果是否可以被中间过程打断。
所述的系统通信控制模块是数据通信链路的主控节点,其实现过程包括单步仿真运行前的初始化控制和单步仿真运行的控制;仿真全过程是由多步单步仿真运行来完成的;
所述的单步仿真运行前的初始化控制是指环境主控系统计算机读取和解析配置信息,初始化单步仿真运行单步步长和应答消息列表。所述的应答消息列表是指单步仿真运行过程中各台计算机点对点IP收发信息的顺序逻辑列表。
单步仿真运行的控制包括以下三个步骤:
(1)控制单步仿真运行的标准时间对齐:
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机;
推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机,接收到时间对齐信号之后,统一将各自的计算机的单步仿真运行的时间统一初始化为接收到的单步仿真运行的标准时间;
(2)单步仿真运行的仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机向系统通信控制模块回馈控制触发信号信息;若系统通信控制模块接收的所有回馈控制触发信号信息正常,则单步仿真运行开始,若系统通信控制模块接收的任一回馈控制触发信号信息有误,排查错误,重新发送控制触发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
(3)控制单步仿真运行时序:
单步仿真运行开始后,控制以下四个时序,如图4-A和图4-B所示:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并将得到多条Agent感知请求信息组合为Agent感知请求信息列表;并将该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机中存储,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息;分布式推演Agent计算机不执行Agent任务信息,环境主控系统计算机的Agent行为效果判定模块相应也不执行判定;分布式推演Agent计算机仅发送Agent行为信息,供下一步单步仿真运行时进行判定及执行。
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。
本发明的分布式推演Agent计算机结构和实现流程如图5所示,包含通信模块C、固定属性库、可变属性库、感知模块、视景数据解析模块、视景显示模块、人机交互接口模块、操作数据解析模块、规则库、决策模块、任务选择模块和行为解析输出模块。
所述的分布式推演Agent计算机的实现流程为:经通信模块C发出Agent感知请求信息,经由环境信息管理计算机的匹配和环境主控系统计算机的转发之后,再经由通信模块C获得Agent感知信息,Agent感知信息到达感知模块进行感知;
经由通信模块C接收环境主控计算机发送的Agent属性更新信息用于更新可变属性库,并结合可变属性库与固有属性库,在感知模块内解析Agent感知信息得到综合数据信息;
经由通信模块C接收环境信息管理计算机发送的Agent任务信息,用于多级任务选择;决策模块根据综合数据信息,查询规则库,得到自主决策任务信息;综合数据信息通过视景数据解析模块,到达人机交互接口,得到Agent视角的环境视景,引出视频信号供操作员监视局部战场情势;操作员采取键盘或者鼠标输入操作信息控制Agent行为,操作信息经由操作数据解析模块,得到控制决策任务信息;任务选择模块结合Agent任务信息、自主决策任务信息和控制决策任务信息选择最终任务,所选任务经由行为解析模块解析后得到Agent行为信息,由通信模块C通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;第一步单步仿真运行时没有Agent行为信息,环境主控系统计算机的Agent行为效果判定模块相应不执行Agent行为信息判定。
一种基于多Agent的分布式推演仿真方法如图6所示,该方法基于上述的基于多Agent的分布式推演仿真平台,主要包括以下几个步骤:
步骤一:仿真全过程开始前的测试、连接工作:
(a)管理员通过推演配置与统计分析计算机制定战场战术目标,从战场环境库中选择战场环境,从推演Agent模型库中选择作战推演Agent类型与数量,设置单步仿真运行步长,
(b)激活各台分布式推演Agent计算机的外部接口属性,定义各Agent映射的分布式推演Agent计算机的网络IP地址,并生成配置信息,开启数据通信链路;
(c)测试数据通信链路是否畅通:如果数据通信链路不通畅,检查网络配置,返回步骤(b);
如果数据通信链路畅通,则将配置信息经由数据通信链路发送到各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机;各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机根据配置信息进行初始化;
各台分布式推演Agent计算机需要初始化本机对应的推演Agent模型属性,包括固有属性、可变属性和决策库以及本机对应的网络地址;
环境主控系统计算机需要初始化系统通信控制模块,通过读取配置信息,初始化单步仿真运行步长,设置应答消息列表;
环境信息管理计算机需要初始化全局Agent映像信息库、环境信息库、Agent感知判定模块、地形环境信息库、Agent注册信息库和传感器信息库;所述的测试数据通信链路是指测试整个分布式推演仿真系统各种时序的数据通道是否畅通;
(d)整个分布式推演仿真系统配置回馈验证:推演配置与统计分析计算机接收各台分布式推演Agent计算机、环境信息管理计算机和环境主控系统计算机的配置回馈信息,进行匹配配置信息;若配置回馈信息匹配,等待管理员发布开始仿真全过程的运行触发指令;否则排查错误配置回馈信息,推演配置与统计分析计算机重新发送配置信息并接收配置回馈信息,直到全部配置回馈信息匹配;
所述的仿真全过程是由多步单步仿真运行过程完成的;
步骤二:管理员发布仿真全过程运行触发指令;
步骤三:单步仿真运行标准时间对齐
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机后,将各台计算机的单步仿真运行时间统一初始化为接收到的单步仿真标准时间,开始运行单步仿真;
步骤四:单步仿真运行前仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,收到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机回馈的控制触发信号信息;若回馈控制触发信号信息正常,则开始单步仿真运行,若回馈控制触发信号信息有误,排查错误,重新发送控制出发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
步骤五:单步仿真运行:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并通过系统通信控制模块将多个Agent感知信息请求信息构成的Agent感知信息请求信息该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息,分布式推演Agent计算机不执行Agent任务信息,仅发送Agent行为信息供下一步单步仿真运行时执行;
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机。
步骤六:判断仿真全过程是否结束:
推演配置与统计分析计算机判断仿真全过程是否结束,如果是,结束仿真全过程;如果否,推演配置与统计分析计算机发布继续运行下一步单步仿真命令到环境主控系统计算机,环境主控系统计算机接收到下一步单步仿真运行命令信号后,返回步骤三。

Claims (5)

1.一种基于多Agent的分布式推演仿真系统,其特征在于:包括推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机,各部分之间通过数据通信链路实现数据传输;
所述的数据通信链路采用以太网通信方式,数据传输采用基于TCP/IP协议的服务器-客户端形式,推演配置与统计分析计算机、环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机有不同的IP地址,数据通信链路通过点对点进行各种信息收发;
所述的推演配置与统计分析计算机用于配置作战任务、战场环境以及推演Agent模型及数量,生成配置信息并将配置信息下发到环境信息管理计算机、环境主控系统计算机和分布式推演Agent计算机,完成各自的初始化过程,同时推演配置与统计分析计算机发布“暂停”、“继续”或“开始”命令到环境主控系统计算机,控制仿真系统的运行;推演配置与统计分析计算机接收环境信息管理计算机发送的数据分析与统计请求信息,进行解析得到全局情势,判断仿真全过程是否结束;
所述的环境主控系统计算机用于控制仿真系统的仿真时序和完成Agent行为信息的解析和输出,具体为:接收分布式推演Agent计算机发送的Agent感知请求信息,并将多条Agent感知请求信息组合为Agent感知请求信息列表发送给环境信息管理计算机,经过环境信息管理计算机匹配后生成Agent感知信息,再经由环境主控系统计算机转发到分布式推演Agent计算机;环境主控系统计算接收到分布式推演Agent计算机向其发送的Agent行为信息,进行解析和效果判定后输出Agent属性更新信息、环境更新信息和Agent任务信息,上述三种信息输出给环境信息管理计算机,在环境信息管理计算机中进行更新和存储;同时将Agent属性更新信息输出给分布式推演Agent计算机;
所述的环境信息管理计算机接收来自环境主控系统计算机发送的Agent感知请求信息列表,进行匹配生成的Agent感知信息,并将该Agent感知信息通过环境主控系统计算机发送到分布式推演Agent计算机进行感知;环境信息管理计算机接收环境主控系统计算机发送的Agent属性更新信息、环境更新信息和Agent任务信息,接收到的Agent属性更新信息和环境更新信息用于更新全局映像库和环境信息库;接收的Agent任务信息进行存储后直接发送到分布式推演Agent计算机;
所述的分布式推演Agent计算机在仿真全过程中模拟独立的推演Agent实体,向环境主控计算机发送Agent感知请求信息,该信息经过匹配后生成固定格式的Agent感知信息并经由环境主控计算机再发回该分布式推演Agent计算机进行感知;分布式推演Agent计算机接收环境主控系统计算机发送的Agent属性更新信息,接收环境信息管理计算机发送的Agent任务信息,执行自主行为或外部控制的行为输出,并经解析后输出Agent行为信息到环境主控系统计算机;
所述的推演配置与统计分析计算机用于全局监控战场情势,包括配置文件生成模块、配属Agent模型库、传感器库、武器装备库、战场环境信息库、全局仿真步骤控制模块、通信模块A、战局显示模块和数据解析模块,具体实现以下三种功能:
(1)仿真全过程开始前管理员分别查询和设置配属Agent模型库、传感器库和武器装备库和战场环境信息库,确定参演的战场环境模型;管理员设置单步仿真运行的单步步长,配置文件生成模块生成配置信息;该配置信息通过通信模块A下发到环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机,并通过通信模块A接收环境信息管理计算机、环境主控系统计算机和各台分布式推演Agent计算机发送的配置回馈信息;
(2)仿真全过程的步骤控制:仿真全过程开始后,管理员通过全局仿真步骤控制模块完成对仿真全过程中各个单步仿真运行过程的监控,并通过通信模块A下发“暂停”、“继续”或“开始”命令到环境主控系统计算机,控制仿真系统在仿真全过程的暂停、继续或开始;
(3)全局战局显示和数据解析:仿真全过程开始后管理员通过战局显示模块对仿真全过程进行的实时监视和战况分析;通信模块A接收环境信息管理计算机发送的数据分析与统计请求信息,该信息经数据解析模块解析并计算战况后,判断仿真全过程是否完成;所述的分布式推演Agent计算机实现战场集群作战仿真,包含通信模块C、固定属性库、可变属性库、感知模块、视景数据解析模块、视景显示模块、人机交互接口模块、操作数据解析模块、规则库、决策模块、任务选择模块和行为解析输出模块;
所述的分布式推演Agent计算机的实现流程为:经通信模块C发出Agent感知请求信息,经由环境信息管理计算机的匹配和环境主控系统计算机的转发之后,再经由通信模块C获得Agent感知信息,Agent感知信息到达感知模块进行感知;
经由通信模块C接收环境主控计算机发送的Agent属性更新信息用于更新可变属性库,并结合可变属性库与固有属性库,在感知模块内解析Agent感知信息得到综合数据信息;
经由通信模块C接收环境信息管理计算机发送的Agent任务信息,用于多级任务选择;决策模块根据综合数据信息,查询规则库,得到自主决策任务信息;综合数据信息通过视景数据解析模块,到达人机交互接口,得到Agent视角的环境视景,引出视频信号供操作员监视局部战场情势;操作员采取键盘或者鼠标输入操作信息控制Agent行为,操作信息经由操作数据解析模块,得到控制决策任务信息;任务选择模块结合Agent任务信息、自主决策任务信息和控制决策任务信息选择最终任务,所选任务经由行为解析模块解析后得到Agent行为信息,由通信模块C通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;第一步单步仿真运行时没有Agent行为信息,相应不执行Agent任务信息和Agent属性更新信息;人机交互接口模块让操作人员以推演Agent视角感知战场态势,并控制该对应推演Agent采取对应决策行为。
2.根据权利要求1所述的基于多Agent的分布式推演仿真系统,其特征在于:所述的环境信息管理计算机包括通信模块B、Agent感知请求解析模块、全局映像信息库、环境信息库、信息匹配模块和Agent感知限定条件数据库,所述的Agent感知限定条件数据库包括Agent注册信息库、地形环境信息库和传感器信息库;
该环境信息管理计算机的实现流程为:
(1)通信模块B接收环境主控系统计算机发送的Agent感知请求信息列表,再由通信模块B到达Agent感知请求解析模块中进行解析,得到Agent感知请求信息类型、信息参数及发送请求的Agent ID;其中Agent感知请求信息列表是由多个Agent感知请求信息构成的;
(2)Agent感知请求信息经Agent感知请求解析模块解析后,到达信息匹配模块,信息匹配模块根据Agent感知请求信息类型、信息参数和Agent ID分别查询Agent感知限定条件数据库、环境信息库和全局映像信息库,开始对Agent感知请求信息进行信息匹配;信息匹配后生成固定格式的Agent感知信息;该Agent感知信息经由通信模块B发送到环境主控系统计算机;
(3)通信模块B接收环境主控系统计算机发送的Agent任务信息后进行存储,该Agent任务信息存储后经由通信模块B发送到分布式推演Agent计算机;再经由通信模块B接收环境主控系统计算机发送的Agent属性更新信息和环境更新信息,实时更新其全局映像信息库和环境信息库;
(4)通信模块B接收环境主控系统计算机发送的数据分析与统计请求,查询全局映像信息库和环境信息库,获得到数据分析与统计请求信息,并将该信息经由通信模块B发送到推演配置与统计分析计算机;
所述的地形环境信息库、Agent注册信息库和传感器信息库均为模块化数据库,根据不同的作战需求进行数据内容的扩充,具备仿真平台的通用性特征。
3.根据权利要求1所述的基于多Agent的分布式推演仿真系统,其特征在于:所述的环境主控系统计算机包括Agent行为效果判定模块;
所述的Agent行为效果判定模块包括词义语法分析器、注册Agent信息库、行为效果函数规则库、机动性能库、武器性能库及计时器、效果寄存器、效果执行器、通信模块D、效果判定模块及自动演化环境库;
所述的Agent行为效果判定模块的实现流程为:
(1)通信模块D接收分布式推演Agent计算机发出的Agent行为信息,到达词义语法分析器进行解析,解析后到达效果判定模块;
(2)效果判定模块查询自动演化环境库,得到行为输出标准信息对应的具体环境信息;效果判定模块查询注册Agent信息库,得到行为输出标准信息里的Agent ID对应所需Agent信息;效果判定模块查询武器性能库,得到Agent配备武器信息、火力强度函数、克制装甲列表、对环境影响函数列表和武器攻击频率;效果判定模块查询机动性能库,得到Agent机动行为输出参数;效果判定模块查询行为效果函数规则库,得到Agent攻击行为效果信息或Agent通信行为效果信息;效果判定模块查询计时器,得到当前时间,计算行为效果预计发生时间;效果判定模块经过上述查询后最后生成效果判定标准信息;
(3)效果判定模块将得到的效果判定标准信息,存储于效果寄存器中;效果执行器轮询效果寄存器,效果执行器查询计时器,得到当前时间,对比效果判定标准信息中预计发生时间,预计发生时间到达的效果信息将被调出并转化为效果执行标准信息,根据效果执行标准信息模式不同分为Agent属性更新信息、环境更新信息和Agent任务信息,通信模块D将所述的Agent属性更新信息、环境更新信息和Agent任务信息发送到环境信息管理计算机中;同时,通信模块D将Agent属性更新信息发送到分布式推演Agent计算机。
4.根据权利要求1所述的基于多Agent的分布式推演仿真系统,其特征在于:所述的环境主控系统计算机还包括系统通信控制模块,所述的系统通信控制模块是数据通信链路的主控节点,实现过程包括单步仿真运行前的初始化控制和单步仿真运行的控制;
所述的单步仿真运行前的初始化控制是指环境主控系统计算机读取和解析配置信息,初始化单步仿真运行的单步步长,设置应答消息列表;
单步仿真运行的控制包括以下三个步骤:
(1)控制单步仿真运行的标准时间对齐:
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机;
推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机,接收到时间对齐信号之后,统一将各自的计算机的单步仿真运行的时间统一初始化为接收到的单步仿真运行的标准时间;
(2)单步仿真运行的仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机发送控制触发信号后,推演配置与统计分析计算机、环境信息管理计算机和分布式推演Agent计算机向系统通信控制模块回馈控制触发信号信息;若系统通信控制模块接收的所有回馈控制触发信号信息正常,则单步仿真运行开始,若系统通信控制模块接收的任一回馈控制触发信号信息有误,排查错误,重新发送控制触发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
(3)控制单步仿真运行时序:
单步仿真运行开始后,控制以下四个时序:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并将得到多条Agent感知请求信息组合为Agent感知请求信息列表;并将该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,该Agent感知信息经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机中存储,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息,环境主控系统计算机的Agent行为效果判定模块相应不执行;
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该数据分析与统计请求信息发送到推演配置与统计分析计算机。
5.一种基于多Agent的分布式推演仿真方法,其特征在于包括以下步骤:
步骤一:仿真全过程开始前的测试、连接工作:
(a)管理员通过推演配置与统计分析计算机制定战场战术目标,从战场环境库中选择战场环境,从推演Agent模型库中选择作战推演Agent类型与数量,设置单步仿真运行步长,
(b)激活各台分布式推演Agent计算机的外部接口属性,定义各Agent映射的分布式推演Agent计算机的网络IP地址,并生成配置信息,开启数据通信链路;
(c)测试数据通信链路是否畅通:如果数据通信链路不通畅,检查网络配置,返回步骤(b);
如果数据通信链路畅通,则将配置信息经由数据通信链路发送到各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机;各台分布式推演Agent计算机、环境主控系统计算机和环境信息管理计算机根据配置信息进行初始化;
各台分布式推演Agent计算机需要初始化本机对应的推演Agent模型属性,包括固有属性、可变属性和决策库以及本机对应的网络地址;
环境主控系统计算机需要初始化系统通信控制模块,通过读取配置信息,初始化单步仿真运行步长,设置应答消息列表;
环境信息管理计算机需要初始化全局Agent映像信息库、环境信息库、Agent感知判定模块、地形环境信息库、Agent注册信息库和传感器信息库;所述的测试数据通信链路是指测试整个分布式推演仿真系统各种时序的数据通道是否畅通;
(d)整个分布式推演仿真系统配置回馈验证:推演配置与统计分析计算机接收各台分布式推演Agent计算机、环境信息管理计算机和环境主控系统计算机的配置回馈信息,进行匹配配置信息;若配置回馈信息匹配,等待管理员发布开始仿真全过程的运行触发指令;否则排查错误配置回馈信息,推演配置与统计分析计算机重新发送配置信息并接收配置回馈信息,直到全部配置回馈信息匹配;
步骤二:管理员发布仿真全过程运行触发指令;
步骤三:单步仿真运行标准时间对齐:
系统通信控制模块通过TCP/IP协议,点对点的发送单步仿真运行的标准时间到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机后,系统通信控制模块将各台计算机的单步仿真运行时间统一初始化为接收到的单步仿真标准时间,开始运行单步仿真;
步骤四:单步仿真运行前仿真系统通信测试:
系统通信控制模块向推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机发送控制触发信号后,收到推演配置与统计分析计算机、环境信息管理计算机和若干台分布式推演Agent计算机回馈的控制触发信号信息;若回馈控制触发信号信息正常,则开始单步仿真运行,若回馈控制触发信号信息有误,排查错误,重新发送控制出发信号,直至系统通信控制模块接收到所有回馈控制触发信号无误;
步骤五:单步仿真运行:
(A)提出感知要求运行子时序:系统通信控制模块接收分布式推演Agent计算机发送的Agent感知信息请求信息,并通过系统通信控制模块将多个Agent感知信息请求信息构成的Agent感知信息请求信息该列表发送到环境信息管理计算机;
(B)获得Agent感知信息子时序:环境信息管理计算机将得到的Agent感知请求信息列表中的Agent感知请求信息进行匹配,并将匹配后生成的固定格式的Agent感知信息,经由系统通信控制模块发送到需求感知的分布式推演Agent计算机中;
(C)行为输出运行子时序:Agent行为信息经由Agent行为效果判定模块判定后得到Agent属性更新信息、环境更新信息及Agent任务信息;系统通信控制模块将Agent属性更新信息发送到需要更新属性的分布式推演Agent计算机中,执行相应更新;系统通信控制模块将Agent属性更新信息、环境更新信息及Agent任务信息发送到环境信息管理计算机中,更新其环境信息库和全局映像信息库,存储Agent任务信息,并将Agent任务信息发送到分布式推演Agent计算机中,Agent任务信息经由行为解析模块解析后得到Agent行为信息,通过数据通信链路发往环境主控系统计算机,供下一步单步仿真运行时执行;
当仿真系统执行第一步单步仿真运行时,无Agent行为信息,分布式推演Agent计算机不执行Agent任务信息,仅发送Agent行为信息供下一步单步仿真运行时执行;
(D)战况统计分析子时序:系统通信控制模块得到数据分析与统计请求,并将其发送到环境信息管理计算机,经查询处理后获得数据分析与统计请求信息,并将该信息发送到推演配置与统计分析计算机;
步骤六:判断仿真全过程是否结束:
推演配置与统计分析计算机判断仿真全过程是否结束,如果是,结束仿真全过程;如果否,推演配置与统计分析计算机发布继续运行下一步单步仿真命令到环境主控系统计算机,环境主控系统计算机接收到下一步单步仿真运行命令信号后,返回步骤三。
CN201010220225XA 2010-06-28 2010-06-28 一种基于多Agent的分布式推演仿真系统与方法 Expired - Fee Related CN101908085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010220225XA CN101908085B (zh) 2010-06-28 2010-06-28 一种基于多Agent的分布式推演仿真系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010220225XA CN101908085B (zh) 2010-06-28 2010-06-28 一种基于多Agent的分布式推演仿真系统与方法

Publications (2)

Publication Number Publication Date
CN101908085A CN101908085A (zh) 2010-12-08
CN101908085B true CN101908085B (zh) 2012-09-05

Family

ID=43263544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010220225XA Expired - Fee Related CN101908085B (zh) 2010-06-28 2010-06-28 一种基于多Agent的分布式推演仿真系统与方法

Country Status (1)

Country Link
CN (1) CN101908085B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402564A (zh) * 2011-07-05 2012-04-04 华北电力大学 一种基于多Agent的分布异构信息资源集成方法
CN102799709B (zh) * 2012-06-19 2015-04-01 中国电子科技集团公司第二十八研究所 基于xml的系统仿真试验环境构建与配置系统及方法
CN103309658B (zh) * 2013-05-13 2016-01-13 西安电子科技大学 基于Agent的动态演化系统及方法
CN103593516B (zh) * 2013-10-30 2016-09-21 中国运载火箭技术研究院 一种作战体系建模与仿真系统
CN103926841A (zh) * 2014-03-27 2014-07-16 中国科学院长春光学精密机械与物理研究所 基于rtx+rfm的实时半实物仿真计算机控制系统
CN104122799B (zh) * 2014-07-22 2016-08-31 中国人民解放军军械工程学院 基于嵌套式状态机的推演过程控制系统和方法
CN104765644B (zh) * 2015-04-02 2018-05-04 西安电子科技大学 基于智能体Agent的资源协作演化系统及方法
CN104866371B (zh) * 2015-05-12 2018-09-04 中国人民解放军装甲兵工程学院 一种基于Agent行动图的作战建模方法与仿真系统
CN105677443B (zh) * 2015-12-29 2019-05-03 中国人民解放军空军指挥学院 一种异构仿真系统
CN105653789B (zh) * 2015-12-29 2019-06-25 中国人民解放军空军指挥学院 一种异构仿真方法
CN105893656A (zh) * 2016-03-24 2016-08-24 中国人民解放军装甲兵工程学院 一种面向平台级Agent交互仿真的陆军分队作战实验方法
CN105930905A (zh) * 2016-04-15 2016-09-07 广州慧睿思通信息科技有限公司 一种基于指标指向的逻辑推演方法及系统
CN108089456B (zh) * 2016-11-22 2021-01-08 江西洪都航空工业集团有限责任公司 一种基于攻防对抗的飞行器信息化体系数学仿真系统
CN108597288A (zh) * 2017-09-15 2018-09-28 夏文祥 一种作战后勤仿真实验平台的实现方法
CN108563525B (zh) * 2018-04-13 2021-04-20 中国人民解放军陆军装甲兵学院 复杂系统可靠性仿真中智能体环境任务干涉方法及系统
CN108614938B (zh) * 2018-04-28 2019-06-18 西北工业大学 一种考虑作战过程的飞机生存力提升方法
CN109687997A (zh) * 2018-12-06 2019-04-26 上海机电工程研究所 一种基于通信效果的通信网络建模方法
CN110362258B (zh) * 2019-07-19 2021-05-25 航天科工网络信息发展有限公司 一种交互式协同想定系统实现方法
CN111832294B (zh) * 2020-06-24 2022-08-16 平安科技(深圳)有限公司 标注数据的选择方法、装置、计算机设备和存储介质
CN112131730B (zh) * 2020-09-14 2024-04-30 中国人民解放军军事科学院评估论证研究中心 群体智能无人系统的定格分析方法及装置
CN112295229B (zh) * 2020-10-28 2023-04-07 中国电子科技集团公司第二十八研究所 一种智能博弈对抗平台

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075226A (zh) * 2007-06-28 2007-11-21 上海交通大学 分布式多角色协同仿真系统
CN101739483A (zh) * 2008-11-27 2010-06-16 同济大学 基于移动agent的分布交互式供应链仿真系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075226A (zh) * 2007-06-28 2007-11-21 上海交通大学 分布式多角色协同仿真系统
CN101739483A (zh) * 2008-11-27 2010-06-16 同济大学 基于移动agent的分布交互式供应链仿真系统

Also Published As

Publication number Publication date
CN101908085A (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
CN101908085B (zh) 一种基于多Agent的分布式推演仿真系统与方法
AU2019204748B2 (en) Firearm electronic system
CN105677443B (zh) 一种异构仿真系统
CN107832551B (zh) 一种面向航天装备的组件化体系仿真系统及方法
CN112668175B (zh) 基于动态情况驱动的军事仿真方法及系统
CN109300354A (zh) 一种武器装备体系对抗仿真系统
CN112308422A (zh) 面向远程空中支援载机的任务规划与解算仿真系统及方法
US8336775B2 (en) Aerospace-ground integration testbed
US20110271822A1 (en) Automatic Real Time Command and Control System
CN105630578A (zh) 一种基于分布式多Agent系统的作战仿真引擎
CN112883586B (zh) 一种基于双逻辑层Agent的模拟仿真系统及方法
CN108734408A (zh) 一种用于电子对抗试验训练任务裁决快评的系统及方法
RU200988U1 (ru) Устройство формирования значимых входных параметров программного средства моделирования
RU2391619C2 (ru) Комплекс средств автоматизации системы управления боевыми средствами
CN116070922A (zh) 对空作战指挥决策智能体训练平台及方法
KR102436765B1 (ko) 근접방어무기체계를 위한 통합시험시스템 및 제어방법
Hall et al. Joint MEASURE: Distributed simulation issues in a mission effectiveness analytic simulator
CN109299858A (zh) 一种基于实装战技指标特征的相似度计算方法
CN114444289A (zh) 基于模型的可定义式空战仿真平台及空战仿真场景构建方法
CN110930797A (zh) 一种分布式模块化虚实可重构战术训练系统
RU2191340C1 (ru) Комплекс автоматизированного управления зенитным ракетным огнем
CN114077476B (zh) 多平台弹性航空电子体系云系统及方法
Chenyan et al. Research on multi-resolution modeling of command and control simulation system based on components
Lu et al. Research on User-oriented Product Development Mode of Systematic Weapon and Equipment
Feng et al. Dynamic virtual prototype of soldier system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20180628

CF01 Termination of patent right due to non-payment of annual fee