CN104239594A

CN104239594A - 人工环境模型、Agent模型及其建模方法

Info

Publication number: CN104239594A
Application number: CN201410263616.8A
Authority: CN
Inventors: 杨雪榕; 王兆魁; 范丽; 张学阳; 胡敏; 肖龙龙; 夏鲁瑞; 程子龙
Original assignee: PLA Equipment College
Current assignee: PLA Equipment College
Priority date: 2014-06-13
Filing date: 2014-06-13
Publication date: 2014-12-24

Abstract

本发明提供一种人工环境模型、Agent模型及其建模方法，人工环境模型包括数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块；数据存储空间逼真再现真实环境的动态变化；环境数据查询服务模块用于接收来自于Agent感知器的感知消息查询指令，将查询得到的数据反馈给Agent感知器；环境数据更新服务模块用于接收来自于Agent效应器的Agent属性和行为更新指令，然后更新到数据存储空间；环境数据空间存取服务模块用于维护数据存储空间，为人工环境提供数据的基础服务。人工环境模型具备配置灵活、通用性强和可扩展性好的优点；还支持多终端并发访问，可为大规模计算实验提供支持。

Description

人工环境模型、Agent模型及其建模方法

技术领域

本发明属于信息处理技术领域，具体涉及一种人工环境模型、Agent模型及其建模方法。

背景技术

基于Agent的建模理论和仿真技术是目前进行复杂系统仿真最具活力、最有影响的方法之一，其基本思想是通过模拟现实世界，将复杂系统划分为与之相应的Agent，以自底向上的方式，从研究个体微观行为入手，进而获得系统宏观行为。人工环境是Agent仿真系统中与实际系统中真实环境平行的虚拟环境，主要用于为Agent提供各种所需的自然环境数据和信息，是各种物理和行为模型的基础支撑。

目前，复杂系统和智能科学领域的人工环境还比较简单，多为静态的环境参数存储器，或为简单的环境演化模型，无法逼真再现真实环境的动态变化，进而降低了Agent仿真系统的逼真度；另外，现有的人工环境对来自于Agent的数据响应速度有限，尤其在大规模计算实验环境下，当出现多Agent并发的交互请求时，人工环境难以及时响应不同Agent的需求，进而降低了整个Agent仿真系统的仿真真实度。

发明内容

针对现有技术存在的缺陷，本发明提供一种人工环境模型、Agent模型及其建模方法，用以解决上述问题。

本发明采用的技术方案如下：

本发明提供一种人工环境模型，包括：数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块；

所述数据存储空间用于逼真再现真实环境的动态变化，按照空间类型、时间序列和空间范围分块分层地存储环境信息；还用于各个时刻接收并存储来自于Agent的各种属性和信息；

所述环境数据查询服务模块用于接收来自于Agent感知器的感知消息查询指令，通过查询所述数据存储空间，获得所需的数据；然后将查询得到的数据反馈给Agent感知器；

所述环境数据更新服务模块用于接收来自于Agent效应器的Agent属性和行为更新指令，然后将Agent属性和行为更新到所述数据存储空间；

所述环境数据空间存取服务模块用于维护所述数据存储空间，为人工环境提供数据的基础服务。

优选的，所述数据存储空间包括：地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间；

所述地理信息存储子空间用于模拟地理环境的作用机理，所述气象数据存储子空间用于模拟气象环境的作用机理，所述电磁环境存储子空间用于模拟电磁环境的作用机理，所述信息网络存储子空间用于模拟信息网络环境的作用机理。

优选的，所述数据存储空间按照时间和数据维度进行索引存储数据。

优选的，所述环境数据查询服务模块具体用于：

(1)接收来自于Agent感知器的感知消息查询指令，启动独立的数据查询线程；

(2)所述数据查询线程对所述感知消息查询指令进行解码与分析，根据感知内容和范畴，生成查询变量和查询规则；

(3)所述数据查询线程基于所述查询变量和查询规则，查询所述数据存储空间，获得所需的数据；

(4)所述数据查询线程将查询得到的数据编制成XML文件，反馈给Agent感知器；

(5)注销所述数据查询线程。

优选的，所述环境数据更新服务模块具体用于：

(1)接收来自于Agent效应器的Agent属性和行为更新指令，启动独立的数据更新线程；

(2)所述数据更新线程对所述Agent属性和行为更新指令进行解码与分析，根据Agent的属性和行为数据，生成分类的更新数据；

(3)所述数据更新线程将Agent属性和行为更新到所述数据存储空间中对应类别的子空间中；其中，Agent的属性更新数据按照时间和状态的数值进行存储，Agent的行为消息按照时间列表顺序存储；

(4)注销所述数据更新线程。

优选的，所述环境数据空间存取服务模块具体用于：

数据存储空间申请：根据Agent提出的数据存储类别和存储需求，动态向所述数据存储空间申请存储空间，并建立索引；

数据查询：根据Agent的数据感知需求，利用数据索引，获得Agent的感知数据；

数据存储：根据Agent的属性和行为数据更新操作，在相应类别的存储空间上更新数据；

数据存储空间维护：根据时间推进动态维护数据存储空间，将过期的数据转存至数据文件，并将内存空间释放。

本发明提供一种Agent模型，所述Agent模型为信息知识层外挂的Agent模型，包括：感知效应层、行为推理层和信息知识层；其中，所述感知效应层和所述行为推理层置于多Agent仿真环境之中；所述信息知识层作为外部资源，置于所述多Agent仿真环境之外，用于被所述行为推理层调用；权利要求1-6任一项所述的人工环境模型为所述Agent模型提供交互媒介、感知信息的来源，以及，所述人工环境模型保存Agent模型演化过程中的Agent全部状态。

优选的，所述感知效应层包括感知器和效应器；

所述行为推理层包括信息理解/事件处理模块、行为决策/状态更新模块和智能学习模块；

所述信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块；

优选的，所述感知器用于被所述信息理解/事件处理模块调用，接收所述信息理解/事件处理模块发送的感知内容和感知范围，将该感知内容和感知范围进行处理，形成感知消息；将所述感知消息发送给所述人工环境模型的环境数据查询服务模块；然后等待所述环境数据查询服务模块的反馈，如果未接收到来自环境数据查询服务模块的感知反馈，则结束服务；随着仿真过程的进行，如果接收到来自环境数据查询服务模块的感知反馈，则将所述感知反馈进行协议解码，得到有用感知信息，并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块；

所述信息理解/事件处理模块用于查询所述知识储备/离散事件列表服务模块，载入特定的离散事件；对所述特定的离散事件进行需求分析，形成感知内容和感知范围的指令，并调用感知器，将该指令发送给所述感知器；然后等待所述感知器的反馈，如果接收到来自所述感知器的感知信息的反馈，则根据该感知信息的反馈，调用所述知识储备/离散事件列表服务模块，接收来自所述知识储备/离散事件列表服务模块的感知知识或感知事件；并将该感知知识或感知事件发送给所述行为决策/状态更新模块；

所述行为决策/状态更新模块用于：

1)所述行为决策/状态更新模块根据接收到的来自所述信息理解/事件处理模块的感知知识或感知事件，调用所述行为规则/计算模型服务模块，判断是否具有对Agent的行为/状态的更新，如果没有，则执行2)；如果有，则接收来自所述行为规则/计算模型服务模块的行为/状态的更新内容，并更新本Agent的行为/状态；然后执行2)；

2)所述行为决策/状态更新模块调用数据接口服务模块，判断接口是否有输入消息；如果没有，则执行3)；如果有，则接收来自所述数据接口服务模块的人机操作信息或自然系统数据，对本Agent的行为/状态进行修正和更新；然后执行3)；

3)所述行为决策/状态更新模块调用智能学习模块进行自学习；然后调用所述效应器，所述效应器将本Agent的属性和行为更新指令发送给所述环境数据更新服务模块，所述环境数据更新服务模块将Agent属性和行为更新到数据存储空间，供其他Agent查询；

所述智能学习模块用于：接收所述行为决策/状态更新模块发送的对本Agent的行为/状态的修正，调用算法对行为/状态的修正措施进行迭代分析，得到知识和规则的修正，将知识的修正输出至所述知识储备/离散事件列表服务模块，将规则的修正输出至所述行为规则/计算模型服务模块；

所述知识储备/离散事件列表服务模块包括感知信息知识列表、离散事件列表、知识查询服务子模块和事件查询服务子模块；所述知识查询服务子模块用于接受所述信息理解/事件处理模块的调用，从所述感知信息知识列表中查询相关知识，然后反馈给所述信息理解/事件处理模块；所述事件查询服务子模块用于接受所述信息理解/事件处理模块的调用，从所述离散事件列表中查询相关离散事件，然后反馈给所述信息理解/事件处理模块；

所述行为规则/计算模型服务模块包括规则/模型数据库、规则查询服务子模块和模型调用服务子模块；所述规则/模型数据库中存储事件处理规则和状态更新计算模型；所述规则查询服务子模块用于接受所述行为决策/状态更新模块的调用，从所述事件处理规则中查询相关的行为决策规则，并反馈给所述行为决策/状态更新模块；所述模型调用服务子模块用于接受所述行为决策/状态更新模块的调用，从所述状态更新计算模型中查询相关的状态更新模型，并反馈给所述行为决策/状态更新模块；

所述数据接口服务模块用于将自然系统中各个对象的真实测控数据、状态数据、信号数据接入本Agent；然后对接收到的各数据进行解码和解释，然后将解码和解释后的数据进行暂存；随着仿真过程的进行，当所述数据接口服务模块被所述行为决策/状态更新模块调用时，从所述暂存中查询所需数据，并将查询到的数据反馈给所述行为决策/状态更新模块；

所述人机接口服务模块用于在本Agent启动前对本Agent进行相应配置，在Agent运行过程中响应人员操作；具体用于：在本Agent启动前，接收配置脚本进行系统配置；通过界面监控是否有人员操作事件，当有时，则进行界面响应，并对操作参数编码，将编码得到的操作事件暂存；随着仿真过程的进行，当所述人机接口服务模块被所述行为决策/状态更新模块调用时，从所述暂存中查询所述操作事件，并执行该操作事件，并将操作结果反馈给所述行为决策/状态更新模块；

所述效应器用于接收来自所述行为决策/状态更新模块的属性更新数据和行为事件，并将属性更新数据和行为事件整理为XML数据文件格式的效应更新消息，然后将效应更新消息发送给环境，使属性更新数据和行为事件影响环境。

本发明还提供一种Agent模型的建模方法，包括以下步骤：

S1，通过数据接口服务模块和人机接口服务模块定义Agent对象的属性和规则；其中，所述属性用于描述Agent对象的性质，包括Agent对象的身份代码、Agent对象的状态集合；所述规则包括内部规则和外部规则两大类；所述内部规则用于描述Agent所指代的具体对象的内部状态修改的基本规则，所述外部规则用于描述各Agent之间以及Agent与环境之间交互的规则；

S2，将所定义的Agent对象的属性和规则存储到行为规则/计算模型服务模块和知识储备/离散事件列表服务模块中；

S3，制定标准的输入输出接口，将感知效应层和行为推理层中各功能模块固化；在信息知识层中，根据Agent对象的个性，按照接口协议进行服务模块定制，使Agent对象具体化；

S4，建立三个线程，分别为：行为推理层线程、感知效应层线程和信息知识层线程；其中，行为推理层线程为独立运行线程，当Agent启动后，以系统时间为自变量进行逐步推进，行为推理层线程按照时间推进过程自动反复调用信息理解/事件处理模块和行为决策/状态更新模块，所述信息理解/事件处理模块和所述行为决策/状态更新模块依次按照需求调用感知效应层线程和信息知识层线程，使Agent进行自运行和自更新过程。

本发明的有益效果如下：

(1)人工环境模型既具备配置灵活、通用性强和可扩展性好的优点；同时，通过模拟地理、气象、电磁、信息网络等环境的作用机理，逼真再现真实环境的动态变化，为各种Agent提供交互媒介；

(2)人工环境模型作为Agent感知信息的来源，支持多终端并发访问，可为大规模计算实验提供支持；

(3)人工环境模型独有的数据存储机制，保存Agent仿真系统演化过程中的Agent全部状态，为进一步研讨分析创造了条件；

(4)Agent模型将信息知识层作为外部资源，置于多Agent仿真环境之外，用于被行为推理层调用；即：通过外部资源进行计算，以服务的形式返回结果，从而实现了要素微观属性和系统宏观属性的统一；

(5)Agent模型既具备配置灵活、通用性强和可扩展性好的优点，同时，在不影响考察系统宏观行为的前提下，可充分检验要素的微观属性。

附图说明

图1为本发明提供的信息知识层外挂的Agent模型的构成示意图；

图2为本发明提供的感知器工作过程示意图；

图3为本发明提供的效应器工作过程示意图；

图4为本发明提供的信息理解/事件处理模块工作过程示意图；

图5为本发明提供的行为决策/状态更新模块工作过程示意图；

图6为本发明提供的智能学习模块工作过程示意图；

图7为本发明提供的知识储备/离散事件列表服务模块工作过程示意图；

图8为本发明提供的行为规则/计算模型服务模块工作过程示意图；

图9为本发明提供的数据接口服务模块工作过程示意图；

图10为本发明提供的人机接口服务模块工作过程示意图；

图11为本发明实施方式提供的信息知识层外挂的Agent模型运行示意图；

图12为本发明提供的人工环境模型的整体结构示意图；

图13为环境数据查询服务模块的工作过程示意图；

图14为环境数据更新服务模块的工作过程示意图；

图15为人工环境模块的工作原理示意图；

图16为人工环境模块的具体功能结构图。

具体实施方式

以下结合附图对本发明进行详细说明：

如图12所示，本发明提供一种人工环境模型，该人工环境模型支持并行计算服务，包括：数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块。以下分别介绍各模块详细功能：

(一)数据存储空间

数据存储空间用于逼真再现真实环境的动态变化，为各种Agent提供交互媒介，作为Agent感知信息的来源，还按照空间类型(地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间)、时间序列和空间范围分块分层地存储环境信息；还用于各个时刻接收并存储来自于Agent的各种属性和信息；数据存储空间按照时间和数据维度进行索引存储数据，便于查询与更新服务的快速检索。

数据存储空间具体包括：地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间；其中，地理信息存储子空间用于模拟地理环境的作用机理，气象数据存储子空间用于模拟气象环境的作用机理，所述电磁环境存储子空间用于模拟电磁环境的作用机理，所述信息网络存储子空间用于模拟信息网络环境的作用机理。

(二)环境数据查询服务模块

环境数据查询服务模块是进行Agent数据查询响应的模块，用于接收来自于Agent感知器的感知消息查询指令，通过查询所述数据存储空间，获得所需的数据；然后将查询得到的数据反馈给Agent感知器；

参考图15，为人工环境模块的工作原理示意图；环境数据查询服务模块由人工环境模块根据Agent注册的服务请求，启动独立线程进行运行。当线程达到一定数量时，环境服务器也自动生成新的进程，进而减少单进程服务的CPU计算载荷。其中需要线程、进程间的通信，数据访问地址共享等，可应用MPI提供的并行计算服务解决这一问题。

如图13所示，为环境数据查询服务模块的工作过程示意图，包括以下步骤：

(1)响应查询请求：接收来自于Agent感知器的感知消息查询指令，启动独立的数据查询线程；

(2)查询请求解码与分析：所述数据查询线程对所述感知消息查询指令进行解码与分析，根据感知内容和范畴，生成查询变量和查询规则；

(3)调用数据查询：数据查询线程基于所述查询变量和查询规则，查询所述数据存储空间，获得所需的数据；

(4)查询数据反馈：数据查询线程将查询得到的数据编制成XML文件，反馈给Agent感知器；

(5)注销所述数据查询线程。

(三)环境数据更新服务模块

环境数据更新服务模块是进行Agent数据更新的模块，用于接收来自于Agent效应器的Agent属性和行为更新指令，然后将Agent属性和行为更新到所述数据存储空间；其中，Agent的状态更新数据按照时间和状态的数值进行存储，Agent的事件消息按照时间列表顺序存储在信息网络子空间中，由信息网络子空间存取服务模拟消息传递过程。

与数据查询服务模块相同，环境数据更新服务模块也是由人工环境模型根据Agent注册的服务请求，启动独立线程进行运行。当线程达到一定数量时，环境服务器也自动生成新的进程，进而减少单进程服务的CPU计算载荷。其中的线程、进程间的通信，数据访问地址共享等，由MPI提供的并行计算服务解决。

如图14所示，为环境数据更新服务模块的工作过程示意图，具体包括以下步骤：：

(1)响应更新请求：接收来自于Agent效应器的Agent属性和行为更新指令，启动独立的数据更新线程；

(2)更新请求解码与分析：数据更新线程对所述Agent属性和行为更新指令进行解码与分析，根据Agent的属性和行为数据，生成分类的更新数据；

(3)调用数据更新：数据更新线程将Agent属性和行为更新到所述数据存储空间中对应类别的子空间中；其中，Agent的属性更新数据按照时间和状态的数值进行存储，Agent的行为消息按照时间列表顺序存储；

(4)注销所述数据更新线程。

(四)环境数据空间存取服务模块

环境数据空间存取服务模块用于维护数据存储空间，为人工环境提供数据的基础服务。

环境数据空间存取服务模块具体用于：

如图15所示，本发明中，人工环境模块按照服务器模式运行，在运行过程中按照Agent的请求启动服务线程，专门负责一个Agent的交互请求，从而能够及时响应不同Agent的需求。

如图16所示，为人工环境模块的具体功能结构图，数据查询服务和数据更新服务根据Agent的服务请求，调用具体的数据空间存取服务，由数据空间存取服务进行数据格式转换、数据传输的环境效应模拟等功能。

因此，本发明提供的人工环境模型，数据存储空间通过模拟地理、气象、电磁、信息网络等环境的作用机理，逼真再现真实环境的动态变化，为各种Agent提供交互媒介，作为Agent感知信息的来源；环境数据查询服务模块、环境数据更新服务模块支持多终端并发访问，可为大规模计算实验提供支持；环境数据空间存取服务模块保存Agent仿真系统演化过程中的Agent全部状态，为进一步研讨分析创造了条件。

基于上述的人工环境模型，如图1所示，本发明还提供一种Agent模型，所述Agent模型为信息知识层外挂的Agent模型，包括：感知效应层、行为推理层和信息知识层；其中，所述感知效应层和所述行为推理层置于多Agent仿真环境之中；所述信息知识层作为外部资源，置于所述多Agent仿真环境之外，用于被所述行为推理层调用。人工环境模型为所述Agent模型提供交互媒介、感知信息的来源，以及，所述人工环境模型保存Agent模型演化过程中的Agent全部状态。

以下对各功能模块分别详细介绍：

(一)感知效应层

感知效应层包括感知器和效应器。

(1)感知器

感知器用于向环境发起查询，并接收环境反馈信息。其具体工作流程如图2所示：在Agent运行开始，感知器处于等待调用状态，一旦感知器被所述信息理解/事件处理模块调用，接收所述信息理解/事件处理模块发送的感知内容和感知范围，该感知内容和感知范围以带参数的线程间消息形式接收；感知器将该感知内容和感知范围进行处理，形成感知消息，感知消息为XML数据文件形式；将所述感知消息发送给人工环境模型的环境数据查询服务模块；然后等待环境数据查询服务模块的反馈，随着仿真过程的进行，如果未接收到来自环境数据查询服务模块的感知反馈，则结束服务；如果接收到来自环境数据查询服务模块的感知反馈，则将所述感知反馈进行协议解码，得到有用感知信息，并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块。

(2)效应器

效应器用于将Agent的属性和行为更新至环境，影响环境。其具体工作流程如图3所示：在Agent运行起始，效应器处于等待调用状态；一旦被行为决策/状态更新模块调用，即：接收到来自所述行为决策/状态更新模块的以带参数的线程间消息形式发送的属性更新数据和行为事件；所述效应器将属性更新数据和行为事件整理为XML数据文件格式的效应更新消息，并将效应更新消息发送给环境，使属性更新数据和行为事件影响环境。

(二)行为推理层

行为推理层包括信息理解/事件处理模块、行为决策/状态更新模块和智能学习模块。

(1)信息理解/事件处理模块

信息理解/事件处理模块用于进行行为准备、处理环境感知的所有具体逻辑以及查询知识储备/离散事件列表服务模块，进行信息效应模拟和事件响应的初步处理。其具体工作流程如图4所示：查询所述知识储备/离散事件列表服务模块，以带参数的线程间消息的形式载入特定的离散事件；对所述特定的离散事件进行需求分析，形成感知内容和感知范围的指令，并调用感知器，将该指令发送给所述感知器；然后等待所述感知器的反馈，如果接收到来自所述感知器的感知信息的反馈，则根据该感知信息的反馈，调用所述知识储备/离散事件列表服务模块，接收来自所述知识储备/离散事件列表服务模块的感知知识或感知事件；并将该感知知识或感知事件发送给所述行为决策/状态更新模块。例如，对于一个人的Agent，当载入的离散事件为“早上起来穿衣服”时，那么通过对该离散事件进行分析，得到需要获取环境温度的结论；则调用感知器感知环境温度，收到感知器反馈后，再查询知识储备，得到温度与穿衣种类的感知知识，然后将该感知知识发送给行为决策/状态更新模块。

(2)行为决策/状态更新模块

行为决策/状态更新模块用于更新Agent的状态，决定Agent的行为。其具体工作流程如图5所示，包括以下步骤：

3)所述行为决策/状态更新模块调用智能学习模块进行自学习；然后调用所述效应器，效应器将本Agent的属性和行为更新指令发送给所述环境数据更新服务模块，所述环境数据更新服务模块将Agent属性和行为更新到数据存储空间，供其他Agent查询。

(3)智能学习模块

智能学习模块，是某些具备自成长、自适应能力的Agent进行自我改进的一个模块，能够调用算法，通过加入已有知识规则和更新的数据输入，迭代得到知识、规则的修正，输出至知识储备/离散事件列表服务模块。

其具体工作流程如图6所示：用于接收所述行为决策/状态更新模块发送的对本Agent的行为/状态的修正，调用算法对行为/状态的修正措施进行迭代分析，得到知识和规则的修正，将知识的修正输出至所述知识储备/离散事件列表服务模块，将规则的修正输出至所述行为规则/计算模型服务模块。

例如：对于指挥人员Agent，在某种环境下，知识储备里存储以下知识：以概率p执行战术A，以概率q执行战术B，p>>q；随着仿真的进行，智能学习模块根据执行战术的结果调整战术A与B执行的权重。

(三)信息知识层

信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块。

(1)知识储备/离散事件列表服务模块

知识储备/离散事件列表服务模块位于多Agent仿真环境外部，用于加载Agent认知环境的知识和感知环境的预定行为模型，解释环境感知参数，初步筛选环境反馈事件等，完成信息理解/事件处理的知识准备。

其具体工作流程如图7所示：包括感知信息知识列表、离散事件列表、知识查询服务子模块和事件查询服务子模块；所述知识查询服务子模块用于接受所述信息理解/事件处理模块的调用，从所述感知信息知识列表中查询相关知识，然后反馈给所述信息理解/事件处理模块；所述事件查询服务子模块用于接受所述信息理解/事件处理模块的调用，从所述离散事件列表中查询相关离散事件，然后反馈给所述信息理解/事件处理模块。

(2)行为规则/计算模型服务模块

行为规则/计算模型服务模块位于多Agent仿真环境外部，用于查询行为决策的规则，调用状态更新的模型。

其具体工作流程如图8所示：包括规则/模型数据库、规则查询服务子模块和模型调用服务子模块；所述规则/模型数据库中存储事件处理规则和状态更新计算模型；所述规则查询服务子模块用于接受所述行为决策/状态更新模块的调用，从所述事件处理规则中查询相关的行为决策规则，并反馈给所述行为决策/状态更新模块；所述模型调用服务子模块用于接受所述行为决策/状态更新模块的调用，从所述状态更新计算模型中查询相关的状态更新模型，并反馈给所述行为决策/状态更新模块。

对于一些Agent，计算模型非常复杂，例如指控中心Agent基于雷达测控数据预测弹道的计算模型，计算消耗非常大，如果将计算模型置于Agent内部，将破坏整个系统的平衡性，而在本发明中，通过外部资源进行计算，以服务的形式返回结果，实现了要素微观属性和系统宏观属性的统一。

(3)数据接口服务模块

数据接口服务模块其具体工作流程如图9所示：用于将自然系统中各个对象的UDP格式的真实测控数据、状态数据、信号数据接入本Agent；然后对接收到的各数据进行解码和解释，然后将解码和解释后的数据进行暂存；随着仿真过程的进行，当所述数据接口服务模块被所述行为决策/状态更新模块调用时，从所述暂存中查询所需数据，并将查询到的数据反馈给所述行为决策/状态更新模块。

(4)人机接口服务模块

人机接口服务模块用于在本Agent启动前对本Agent进行相应配置，在Agent运行过程中响应人员操作；具体工作流程如图10所示：在本Agent启动前，接收配置脚本进行系统配置；通过界面监控是否有人员操作事件，当有时，则进行界面响应，并对操作参数编码，将编码得到的操作事件暂存；随着仿真过程的进行，当所述人机接口服务模块被所述行为决策/状态更新模块调用时，从所述暂存中查询所述操作事件，并执行该操作事件，并将操作结果反馈给所述行为决策/状态更新模块。

需要说明的是，在本发明附图1-10中，From Agent表示来自自身的调用，From服务表示来自信息知识层模块的信息，To服务表示对信息知识层模块的调用，由于信息知识层是外挂的，所以如此表示。

本发明还提供一种信息知识层外挂的Agent模型的建模方法，如图11所示，包括以下步骤：

S1，通过数据接口服务模块和人机接口服务模块定义Agent对象的属性和规则；其中，所述属性用于描述Agent对象的性质，包括Agent对象的身份代码、Agent对象的状态集合；所述规则包括内部规则和外部规则两大类；所述内部规则用于描述Agent所指代的具体对象的内部状态修改的基本规则，所述外部规则用于描述各Agent之间以及Agent与环境之间交互的规则；在图1中，人工环境为Agent A和Agent B之间进行交互的仿真环境。

Agent A通过感知器、效应器的调用，与人工环境进行信息和行为的交互，从而实现与其它Agent的交互。通过信息知识层服务的调用，实现Agent个性化的模拟和反应。智能学习模块使Agent具有智能属性，可根据Agent对象的具体情况进行裁剪和定制。

综上所述，本发明提供的信息知识层外挂的Agent模型及其建模方法，具有以下优点：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种人工环境模型，其特征在于，包括：数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块；

2.根据权利要求1所述的人工环境模型，其特征在于，所述数据存储空间包括：地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间；

3.根据权利要求1所述的人工环境模型，其特征在于，所述数据存储空间按照时间和数据维度进行索引存储数据。

4.根据权利要求1所述的人工环境模型，其特征在于，所述环境数据查询服务模块具体用于：

(5)注销所述数据查询线程。

5.根据权利要求1所述的人工环境模型，其特征在于，所述环境数据更新服务模块具体用于：

(4)注销所述数据更新线程。

6.根据权利要求1所述的人工环境模型，其特征在于，所述环境数据空间存取服务模块具体用于：

7.一种Agent模型，其特征在于，所述Agent模型为信息知识层外挂的Agent模型，包括：感知效应层、行为推理层和信息知识层；其中，所述感知效应层和所述行为推理层置于多Agent仿真环境之中；所述信息知识层作为外部资源，置于所述多Agent仿真环境之外，用于被所述行为推理层调用；权利要求1-6任一项所述的人工环境模型为所述Agent模型提供交互媒介、感知信息的来源，以及，所述人工环境模型保存Agent模型演化过程中的Agent全部状态。

8.根据权利要求1所述的Agent模型，其特征在于，所述感知效应层包括感知器和效应器；

所述信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块。

9.根据权利要求8所述的Agent模型，其特征在于，所述感知器用于被所述信息理解/事件处理模块调用，接收所述信息理解/事件处理模块发送的感知内容和感知范围，将该感知内容和感知范围进行处理，形成感知消息；将所述感知消息发送给所述人工环境模型的环境数据查询服务模块；然后等待所述环境数据查询服务模块的反馈，如果未接收到来自环境数据查询服务模块的感知反馈，则结束服务；随着仿真过程的进行，如果接收到来自环境数据查询服务模块的感知反馈，则将所述感知反馈进行协议解码，得到有用感知信息，并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块；

所述行为决策/状态更新模块用于：

10.一种Agent模型的建模方法，其特征在于，包括以下步骤：