CN104239594A - 人工环境模型、Agent模型及其建模方法 - Google Patents

人工环境模型、Agent模型及其建模方法 Download PDF

Info

Publication number
CN104239594A
CN104239594A CN201410263616.8A CN201410263616A CN104239594A CN 104239594 A CN104239594 A CN 104239594A CN 201410263616 A CN201410263616 A CN 201410263616A CN 104239594 A CN104239594 A CN 104239594A
Authority
CN
China
Prior art keywords
agent
data
module
service module
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410263616.8A
Other languages
English (en)
Inventor
杨雪榕
王兆魁
范丽
张学阳
胡敏
肖龙龙
夏鲁瑞
程子龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Equipment College
Original Assignee
PLA Equipment College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Equipment College filed Critical PLA Equipment College
Priority to CN201410263616.8A priority Critical patent/CN104239594A/zh
Publication of CN104239594A publication Critical patent/CN104239594A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供一种人工环境模型、Agent模型及其建模方法,人工环境模型包括数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块;数据存储空间逼真再现真实环境的动态变化;环境数据查询服务模块用于接收来自于Agent感知器的感知消息查询指令,将查询得到的数据反馈给Agent感知器;环境数据更新服务模块用于接收来自于Agent效应器的Agent属性和行为更新指令,然后更新到数据存储空间;环境数据空间存取服务模块用于维护数据存储空间,为人工环境提供数据的基础服务。人工环境模型具备配置灵活、通用性强和可扩展性好的优点;还支持多终端并发访问,可为大规模计算实验提供支持。

Description

人工环境模型、Agent模型及其建模方法
技术领域
本发明属于信息处理技术领域,具体涉及一种人工环境模型、Agent模型及其建模方法。
背景技术
基于Agent的建模理论和仿真技术是目前进行复杂系统仿真最具活力、最有影响的方法之一,其基本思想是通过模拟现实世界,将复杂系统划分为与之相应的Agent,以自底向上的方式,从研究个体微观行为入手,进而获得系统宏观行为。人工环境是Agent仿真系统中与实际系统中真实环境平行的虚拟环境,主要用于为Agent提供各种所需的自然环境数据和信息,是各种物理和行为模型的基础支撑。
目前,复杂系统和智能科学领域的人工环境还比较简单,多为静态的环境参数存储器,或为简单的环境演化模型,无法逼真再现真实环境的动态变化,进而降低了Agent仿真系统的逼真度;另外,现有的人工环境对来自于Agent的数据响应速度有限,尤其在大规模计算实验环境下,当出现多Agent并发的交互请求时,人工环境难以及时响应不同Agent的需求,进而降低了整个Agent仿真系统的仿真真实度。
发明内容
针对现有技术存在的缺陷,本发明提供一种人工环境模型、Agent模型及其建模方法,用以解决上述问题。
本发明采用的技术方案如下:
本发明提供一种人工环境模型,包括:数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块;
所述数据存储空间用于逼真再现真实环境的动态变化,按照空间类型、时间序列和空间范围分块分层地存储环境信息;还用于各个时刻接收并存储来自于Agent的各种属性和信息;
所述环境数据查询服务模块用于接收来自于Agent感知器的感知消息查询指令,通过查询所述数据存储空间,获得所需的数据;然后将查询得到的数据反馈给Agent感知器;
所述环境数据更新服务模块用于接收来自于Agent效应器的Agent属性和行为更新指令,然后将Agent属性和行为更新到所述数据存储空间;
所述环境数据空间存取服务模块用于维护所述数据存储空间,为人工环境提供数据的基础服务。
优选的,所述数据存储空间包括:地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间;
所述地理信息存储子空间用于模拟地理环境的作用机理,所述气象数据存储子空间用于模拟气象环境的作用机理,所述电磁环境存储子空间用于模拟电磁环境的作用机理,所述信息网络存储子空间用于模拟信息网络环境的作用机理。
优选的,所述数据存储空间按照时间和数据维度进行索引存储数据。
优选的,所述环境数据查询服务模块具体用于:
(1)接收来自于Agent感知器的感知消息查询指令,启动独立的数据查询线程;
(2)所述数据查询线程对所述感知消息查询指令进行解码与分析,根据感知内容和范畴,生成查询变量和查询规则;
(3)所述数据查询线程基于所述查询变量和查询规则,查询所述数据存储空间,获得所需的数据;
(4)所述数据查询线程将查询得到的数据编制成XML文件,反馈给Agent感知器;
(5)注销所述数据查询线程。
优选的,所述环境数据更新服务模块具体用于:
(1)接收来自于Agent效应器的Agent属性和行为更新指令,启动独立的数据更新线程;
(2)所述数据更新线程对所述Agent属性和行为更新指令进行解码与分析,根据Agent的属性和行为数据,生成分类的更新数据;
(3)所述数据更新线程将Agent属性和行为更新到所述数据存储空间中对应类别的子空间中;其中,Agent的属性更新数据按照时间和状态的数值进行存储,Agent的行为消息按照时间列表顺序存储;
(4)注销所述数据更新线程。
优选的,所述环境数据空间存取服务模块具体用于:
数据存储空间申请:根据Agent提出的数据存储类别和存储需求,动态向所述数据存储空间申请存储空间,并建立索引;
数据查询:根据Agent的数据感知需求,利用数据索引,获得Agent的感知数据;
数据存储:根据Agent的属性和行为数据更新操作,在相应类别的存储空间上更新数据;
数据存储空间维护:根据时间推进动态维护数据存储空间,将过期的数据转存至数据文件,并将内存空间释放。
本发明提供一种Agent模型,所述Agent模型为信息知识层外挂的Agent模型,包括:感知效应层、行为推理层和信息知识层;其中,所述感知效应层和所述行为推理层置于多Agent仿真环境之中;所述信息知识层作为外部资源,置于所述多Agent仿真环境之外,用于被所述行为推理层调用;权利要求1-6任一项所述的人工环境模型为所述Agent模型提供交互媒介、感知信息的来源,以及,所述人工环境模型保存Agent模型演化过程中的Agent全部状态。
优选的,所述感知效应层包括感知器和效应器;
所述行为推理层包括信息理解/事件处理模块、行为决策/状态更新模块和智能学习模块;
所述信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块;
优选的,所述感知器用于被所述信息理解/事件处理模块调用,接收所述信息理解/事件处理模块发送的感知内容和感知范围,将该感知内容和感知范围进行处理,形成感知消息;将所述感知消息发送给所述人工环境模型的环境数据查询服务模块;然后等待所述环境数据查询服务模块的反馈,如果未接收到来自环境数据查询服务模块的感知反馈,则结束服务;随着仿真过程的进行,如果接收到来自环境数据查询服务模块的感知反馈,则将所述感知反馈进行协议解码,得到有用感知信息,并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块;
所述信息理解/事件处理模块用于查询所述知识储备/离散事件列表服务模块,载入特定的离散事件;对所述特定的离散事件进行需求分析,形成感知内容和感知范围的指令,并调用感知器,将该指令发送给所述感知器;然后等待所述感知器的反馈,如果接收到来自所述感知器的感知信息的反馈,则根据该感知信息的反馈,调用所述知识储备/离散事件列表服务模块,接收来自所述知识储备/离散事件列表服务模块的感知知识或感知事件;并将该感知知识或感知事件发送给所述行为决策/状态更新模块;
所述行为决策/状态更新模块用于:
1)所述行为决策/状态更新模块根据接收到的来自所述信息理解/事件处理模块的感知知识或感知事件,调用所述行为规则/计算模型服务模块,判断是否具有对Agent的行为/状态的更新,如果没有,则执行2);如果有,则接收来自所述行为规则/计算模型服务模块的行为/状态的更新内容,并更新本Agent的行为/状态;然后执行2);
2)所述行为决策/状态更新模块调用数据接口服务模块,判断接口是否有输入消息;如果没有,则执行3);如果有,则接收来自所述数据接口服务模块的人机操作信息或自然系统数据,对本Agent的行为/状态进行修正和更新;然后执行3);
3)所述行为决策/状态更新模块调用智能学习模块进行自学习;然后调用所述效应器,所述效应器将本Agent的属性和行为更新指令发送给所述环境数据更新服务模块,所述环境数据更新服务模块将Agent属性和行为更新到数据存储空间,供其他Agent查询;
所述智能学习模块用于:接收所述行为决策/状态更新模块发送的对本Agent的行为/状态的修正,调用算法对行为/状态的修正措施进行迭代分析,得到知识和规则的修正,将知识的修正输出至所述知识储备/离散事件列表服务模块,将规则的修正输出至所述行为规则/计算模型服务模块;
所述知识储备/离散事件列表服务模块包括感知信息知识列表、离散事件列表、知识查询服务子模块和事件查询服务子模块;所述知识查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述感知信息知识列表中查询相关知识,然后反馈给所述信息理解/事件处理模块;所述事件查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述离散事件列表中查询相关离散事件,然后反馈给所述信息理解/事件处理模块;
所述行为规则/计算模型服务模块包括规则/模型数据库、规则查询服务子模块和模型调用服务子模块;所述规则/模型数据库中存储事件处理规则和状态更新计算模型;所述规则查询服务子模块用于接受所述行为决策/状态更新模块的调用,从所述事件处理规则中查询相关的行为决策规则,并反馈给所述行为决策/状态更新模块;所述模型调用服务子模块用于接受所述行为决策/状态更新模块的调用,从所述状态更新计算模型中查询相关的状态更新模型,并反馈给所述行为决策/状态更新模块;
所述数据接口服务模块用于将自然系统中各个对象的真实测控数据、状态数据、信号数据接入本Agent;然后对接收到的各数据进行解码和解释,然后将解码和解释后的数据进行暂存;随着仿真过程的进行,当所述数据接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所需数据,并将查询到的数据反馈给所述行为决策/状态更新模块;
所述人机接口服务模块用于在本Agent启动前对本Agent进行相应配置,在Agent运行过程中响应人员操作;具体用于:在本Agent启动前,接收配置脚本进行系统配置;通过界面监控是否有人员操作事件,当有时,则进行界面响应,并对操作参数编码,将编码得到的操作事件暂存;随着仿真过程的进行,当所述人机接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所述操作事件,并执行该操作事件,并将操作结果反馈给所述行为决策/状态更新模块;
所述效应器用于接收来自所述行为决策/状态更新模块的属性更新数据和行为事件,并将属性更新数据和行为事件整理为XML数据文件格式的效应更新消息,然后将效应更新消息发送给环境,使属性更新数据和行为事件影响环境。
本发明还提供一种Agent模型的建模方法,包括以下步骤:
S1,通过数据接口服务模块和人机接口服务模块定义Agent对象的属性和规则;其中,所述属性用于描述Agent对象的性质,包括Agent对象的身份代码、Agent对象的状态集合;所述规则包括内部规则和外部规则两大类;所述内部规则用于描述Agent所指代的具体对象的内部状态修改的基本规则,所述外部规则用于描述各Agent之间以及Agent与环境之间交互的规则;
S2,将所定义的Agent对象的属性和规则存储到行为规则/计算模型服务模块和知识储备/离散事件列表服务模块中;
S3,制定标准的输入输出接口,将感知效应层和行为推理层中各功能模块固化;在信息知识层中,根据Agent对象的个性,按照接口协议进行服务模块定制,使Agent对象具体化;
S4,建立三个线程,分别为:行为推理层线程、感知效应层线程和信息知识层线程;其中,行为推理层线程为独立运行线程,当Agent启动后,以系统时间为自变量进行逐步推进,行为推理层线程按照时间推进过程自动反复调用信息理解/事件处理模块和行为决策/状态更新模块,所述信息理解/事件处理模块和所述行为决策/状态更新模块依次按照需求调用感知效应层线程和信息知识层线程,使Agent进行自运行和自更新过程。
本发明的有益效果如下:
(1)人工环境模型既具备配置灵活、通用性强和可扩展性好的优点;同时,通过模拟地理、气象、电磁、信息网络等环境的作用机理,逼真再现真实环境的动态变化,为各种Agent提供交互媒介;
(2)人工环境模型作为Agent感知信息的来源,支持多终端并发访问,可为大规模计算实验提供支持;
(3)人工环境模型独有的数据存储机制,保存Agent仿真系统演化过程中的Agent全部状态,为进一步研讨分析创造了条件;
(4)Agent模型将信息知识层作为外部资源,置于多Agent仿真环境之外,用于被行为推理层调用;即:通过外部资源进行计算,以服务的形式返回结果,从而实现了要素微观属性和系统宏观属性的统一;
(5)Agent模型既具备配置灵活、通用性强和可扩展性好的优点,同时,在不影响考察系统宏观行为的前提下,可充分检验要素的微观属性。
附图说明
图1为本发明提供的信息知识层外挂的Agent模型的构成示意图;
图2为本发明提供的感知器工作过程示意图;
图3为本发明提供的效应器工作过程示意图;
图4为本发明提供的信息理解/事件处理模块工作过程示意图;
图5为本发明提供的行为决策/状态更新模块工作过程示意图;
图6为本发明提供的智能学习模块工作过程示意图;
图7为本发明提供的知识储备/离散事件列表服务模块工作过程示意图;
图8为本发明提供的行为规则/计算模型服务模块工作过程示意图;
图9为本发明提供的数据接口服务模块工作过程示意图;
图10为本发明提供的人机接口服务模块工作过程示意图;
图11为本发明实施方式提供的信息知识层外挂的Agent模型运行示意图;
图12为本发明提供的人工环境模型的整体结构示意图;
图13为环境数据查询服务模块的工作过程示意图;
图14为环境数据更新服务模块的工作过程示意图;
图15为人工环境模块的工作原理示意图;
图16为人工环境模块的具体功能结构图。
具体实施方式
以下结合附图对本发明进行详细说明:
如图12所示,本发明提供一种人工环境模型,该人工环境模型支持并行计算服务,包括:数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块。以下分别介绍各模块详细功能:
(一)数据存储空间
数据存储空间用于逼真再现真实环境的动态变化,为各种Agent提供交互媒介,作为Agent感知信息的来源,还按照空间类型(地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间)、时间序列和空间范围分块分层地存储环境信息;还用于各个时刻接收并存储来自于Agent的各种属性和信息;数据存储空间按照时间和数据维度进行索引存储数据,便于查询与更新服务的快速检索。
数据存储空间具体包括:地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间;其中,地理信息存储子空间用于模拟地理环境的作用机理,气象数据存储子空间用于模拟气象环境的作用机理,所述电磁环境存储子空间用于模拟电磁环境的作用机理,所述信息网络存储子空间用于模拟信息网络环境的作用机理。
(二)环境数据查询服务模块
环境数据查询服务模块是进行Agent数据查询响应的模块,用于接收来自于Agent感知器的感知消息查询指令,通过查询所述数据存储空间,获得所需的数据;然后将查询得到的数据反馈给Agent感知器;
参考图15,为人工环境模块的工作原理示意图;环境数据查询服务模块由人工环境模块根据Agent注册的服务请求,启动独立线程进行运行。当线程达到一定数量时,环境服务器也自动生成新的进程,进而减少单进程服务的CPU计算载荷。其中需要线程、进程间的通信,数据访问地址共享等,可应用MPI提供的并行计算服务解决这一问题。
如图13所示,为环境数据查询服务模块的工作过程示意图,包括以下步骤:
(1)响应查询请求:接收来自于Agent感知器的感知消息查询指令,启动独立的数据查询线程;
(2)查询请求解码与分析:所述数据查询线程对所述感知消息查询指令进行解码与分析,根据感知内容和范畴,生成查询变量和查询规则;
(3)调用数据查询:数据查询线程基于所述查询变量和查询规则,查询所述数据存储空间,获得所需的数据;
(4)查询数据反馈:数据查询线程将查询得到的数据编制成XML文件,反馈给Agent感知器;
(5)注销所述数据查询线程。
(三)环境数据更新服务模块
环境数据更新服务模块是进行Agent数据更新的模块,用于接收来自于Agent效应器的Agent属性和行为更新指令,然后将Agent属性和行为更新到所述数据存储空间;其中,Agent的状态更新数据按照时间和状态的数值进行存储,Agent的事件消息按照时间列表顺序存储在信息网络子空间中,由信息网络子空间存取服务模拟消息传递过程。
与数据查询服务模块相同,环境数据更新服务模块也是由人工环境模型根据Agent注册的服务请求,启动独立线程进行运行。当线程达到一定数量时,环境服务器也自动生成新的进程,进而减少单进程服务的CPU计算载荷。其中的线程、进程间的通信,数据访问地址共享等,由MPI提供的并行计算服务解决。
如图14所示,为环境数据更新服务模块的工作过程示意图,具体包括以下步骤::
(1)响应更新请求:接收来自于Agent效应器的Agent属性和行为更新指令,启动独立的数据更新线程;
(2)更新请求解码与分析:数据更新线程对所述Agent属性和行为更新指令进行解码与分析,根据Agent的属性和行为数据,生成分类的更新数据;
(3)调用数据更新:数据更新线程将Agent属性和行为更新到所述数据存储空间中对应类别的子空间中;其中,Agent的属性更新数据按照时间和状态的数值进行存储,Agent的行为消息按照时间列表顺序存储;
(4)注销所述数据更新线程。
(四)环境数据空间存取服务模块
环境数据空间存取服务模块用于维护数据存储空间,为人工环境提供数据的基础服务。
环境数据空间存取服务模块具体用于:
数据存储空间申请:根据Agent提出的数据存储类别和存储需求,动态向所述数据存储空间申请存储空间,并建立索引;
数据查询:根据Agent的数据感知需求,利用数据索引,获得Agent的感知数据;
数据存储:根据Agent的属性和行为数据更新操作,在相应类别的存储空间上更新数据;
数据存储空间维护:根据时间推进动态维护数据存储空间,将过期的数据转存至数据文件,并将内存空间释放。
如图15所示,本发明中,人工环境模块按照服务器模式运行,在运行过程中按照Agent的请求启动服务线程,专门负责一个Agent的交互请求,从而能够及时响应不同Agent的需求。
如图16所示,为人工环境模块的具体功能结构图,数据查询服务和数据更新服务根据Agent的服务请求,调用具体的数据空间存取服务,由数据空间存取服务进行数据格式转换、数据传输的环境效应模拟等功能。
因此,本发明提供的人工环境模型,数据存储空间通过模拟地理、气象、电磁、信息网络等环境的作用机理,逼真再现真实环境的动态变化,为各种Agent提供交互媒介,作为Agent感知信息的来源;环境数据查询服务模块、环境数据更新服务模块支持多终端并发访问,可为大规模计算实验提供支持;环境数据空间存取服务模块保存Agent仿真系统演化过程中的Agent全部状态,为进一步研讨分析创造了条件。
基于上述的人工环境模型,如图1所示,本发明还提供一种Agent模型,所述Agent模型为信息知识层外挂的Agent模型,包括:感知效应层、行为推理层和信息知识层;其中,所述感知效应层和所述行为推理层置于多Agent仿真环境之中;所述信息知识层作为外部资源,置于所述多Agent仿真环境之外,用于被所述行为推理层调用。人工环境模型为所述Agent模型提供交互媒介、感知信息的来源,以及,所述人工环境模型保存Agent模型演化过程中的Agent全部状态。
以下对各功能模块分别详细介绍:
(一)感知效应层
感知效应层包括感知器和效应器。
(1)感知器
感知器用于向环境发起查询,并接收环境反馈信息。其具体工作流程如图2所示:在Agent运行开始,感知器处于等待调用状态,一旦感知器被所述信息理解/事件处理模块调用,接收所述信息理解/事件处理模块发送的感知内容和感知范围,该感知内容和感知范围以带参数的线程间消息形式接收;感知器将该感知内容和感知范围进行处理,形成感知消息,感知消息为XML数据文件形式;将所述感知消息发送给人工环境模型的环境数据查询服务模块;然后等待环境数据查询服务模块的反馈,随着仿真过程的进行,如果未接收到来自环境数据查询服务模块的感知反馈,则结束服务;如果接收到来自环境数据查询服务模块的感知反馈,则将所述感知反馈进行协议解码,得到有用感知信息,并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块。
(2)效应器
效应器用于将Agent的属性和行为更新至环境,影响环境。其具体工作流程如图3所示:在Agent运行起始,效应器处于等待调用状态;一旦被行为决策/状态更新模块调用,即:接收到来自所述行为决策/状态更新模块的以带参数的线程间消息形式发送的属性更新数据和行为事件;所述效应器将属性更新数据和行为事件整理为XML数据文件格式的效应更新消息,并将效应更新消息发送给环境,使属性更新数据和行为事件影响环境。
(二)行为推理层
行为推理层包括信息理解/事件处理模块、行为决策/状态更新模块和智能学习模块。
(1)信息理解/事件处理模块
信息理解/事件处理模块用于进行行为准备、处理环境感知的所有具体逻辑以及查询知识储备/离散事件列表服务模块,进行信息效应模拟和事件响应的初步处理。其具体工作流程如图4所示:查询所述知识储备/离散事件列表服务模块,以带参数的线程间消息的形式载入特定的离散事件;对所述特定的离散事件进行需求分析,形成感知内容和感知范围的指令,并调用感知器,将该指令发送给所述感知器;然后等待所述感知器的反馈,如果接收到来自所述感知器的感知信息的反馈,则根据该感知信息的反馈,调用所述知识储备/离散事件列表服务模块,接收来自所述知识储备/离散事件列表服务模块的感知知识或感知事件;并将该感知知识或感知事件发送给所述行为决策/状态更新模块。例如,对于一个人的Agent,当载入的离散事件为“早上起来穿衣服”时,那么通过对该离散事件进行分析,得到需要获取环境温度的结论;则调用感知器感知环境温度,收到感知器反馈后,再查询知识储备,得到温度与穿衣种类的感知知识,然后将该感知知识发送给行为决策/状态更新模块。
(2)行为决策/状态更新模块
行为决策/状态更新模块用于更新Agent的状态,决定Agent的行为。其具体工作流程如图5所示,包括以下步骤:
1)所述行为决策/状态更新模块根据接收到的来自所述信息理解/事件处理模块的感知知识或感知事件,调用所述行为规则/计算模型服务模块,判断是否具有对Agent的行为/状态的更新,如果没有,则执行2);如果有,则接收来自所述行为规则/计算模型服务模块的行为/状态的更新内容,并更新本Agent的行为/状态;然后执行2);
2)所述行为决策/状态更新模块调用数据接口服务模块,判断接口是否有输入消息;如果没有,则执行3);如果有,则接收来自所述数据接口服务模块的人机操作信息或自然系统数据,对本Agent的行为/状态进行修正和更新;然后执行3);
3)所述行为决策/状态更新模块调用智能学习模块进行自学习;然后调用所述效应器,效应器将本Agent的属性和行为更新指令发送给所述环境数据更新服务模块,所述环境数据更新服务模块将Agent属性和行为更新到数据存储空间,供其他Agent查询。
(3)智能学习模块
智能学习模块,是某些具备自成长、自适应能力的Agent进行自我改进的一个模块,能够调用算法,通过加入已有知识规则和更新的数据输入,迭代得到知识、规则的修正,输出至知识储备/离散事件列表服务模块。
其具体工作流程如图6所示:用于接收所述行为决策/状态更新模块发送的对本Agent的行为/状态的修正,调用算法对行为/状态的修正措施进行迭代分析,得到知识和规则的修正,将知识的修正输出至所述知识储备/离散事件列表服务模块,将规则的修正输出至所述行为规则/计算模型服务模块。
例如:对于指挥人员Agent,在某种环境下,知识储备里存储以下知识:以概率p执行战术A,以概率q执行战术B,p>>q;随着仿真的进行,智能学习模块根据执行战术的结果调整战术A与B执行的权重。
(三)信息知识层
信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块。
(1)知识储备/离散事件列表服务模块
知识储备/离散事件列表服务模块位于多Agent仿真环境外部,用于加载Agent认知环境的知识和感知环境的预定行为模型,解释环境感知参数,初步筛选环境反馈事件等,完成信息理解/事件处理的知识准备。
其具体工作流程如图7所示:包括感知信息知识列表、离散事件列表、知识查询服务子模块和事件查询服务子模块;所述知识查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述感知信息知识列表中查询相关知识,然后反馈给所述信息理解/事件处理模块;所述事件查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述离散事件列表中查询相关离散事件,然后反馈给所述信息理解/事件处理模块。
(2)行为规则/计算模型服务模块
行为规则/计算模型服务模块位于多Agent仿真环境外部,用于查询行为决策的规则,调用状态更新的模型。
其具体工作流程如图8所示:包括规则/模型数据库、规则查询服务子模块和模型调用服务子模块;所述规则/模型数据库中存储事件处理规则和状态更新计算模型;所述规则查询服务子模块用于接受所述行为决策/状态更新模块的调用,从所述事件处理规则中查询相关的行为决策规则,并反馈给所述行为决策/状态更新模块;所述模型调用服务子模块用于接受所述行为决策/状态更新模块的调用,从所述状态更新计算模型中查询相关的状态更新模型,并反馈给所述行为决策/状态更新模块。
对于一些Agent,计算模型非常复杂,例如指控中心Agent基于雷达测控数据预测弹道的计算模型,计算消耗非常大,如果将计算模型置于Agent内部,将破坏整个系统的平衡性,而在本发明中,通过外部资源进行计算,以服务的形式返回结果,实现了要素微观属性和系统宏观属性的统一。
(3)数据接口服务模块
数据接口服务模块其具体工作流程如图9所示:用于将自然系统中各个对象的UDP格式的真实测控数据、状态数据、信号数据接入本Agent;然后对接收到的各数据进行解码和解释,然后将解码和解释后的数据进行暂存;随着仿真过程的进行,当所述数据接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所需数据,并将查询到的数据反馈给所述行为决策/状态更新模块。
(4)人机接口服务模块
人机接口服务模块用于在本Agent启动前对本Agent进行相应配置,在Agent运行过程中响应人员操作;具体工作流程如图10所示:在本Agent启动前,接收配置脚本进行系统配置;通过界面监控是否有人员操作事件,当有时,则进行界面响应,并对操作参数编码,将编码得到的操作事件暂存;随着仿真过程的进行,当所述人机接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所述操作事件,并执行该操作事件,并将操作结果反馈给所述行为决策/状态更新模块。
需要说明的是,在本发明附图1-10中,From Agent表示来自自身的调用,From服务表示来自信息知识层模块的信息,To服务表示对信息知识层模块的调用,由于信息知识层是外挂的,所以如此表示。
本发明还提供一种信息知识层外挂的Agent模型的建模方法,如图11所示,包括以下步骤:
S1,通过数据接口服务模块和人机接口服务模块定义Agent对象的属性和规则;其中,所述属性用于描述Agent对象的性质,包括Agent对象的身份代码、Agent对象的状态集合;所述规则包括内部规则和外部规则两大类;所述内部规则用于描述Agent所指代的具体对象的内部状态修改的基本规则,所述外部规则用于描述各Agent之间以及Agent与环境之间交互的规则;在图1中,人工环境为Agent A和Agent B之间进行交互的仿真环境。
S2,将所定义的Agent对象的属性和规则存储到行为规则/计算模型服务模块和知识储备/离散事件列表服务模块中;
S3,制定标准的输入输出接口,将感知效应层和行为推理层中各功能模块固化;在信息知识层中,根据Agent对象的个性,按照接口协议进行服务模块定制,使Agent对象具体化;
S4,建立三个线程,分别为:行为推理层线程、感知效应层线程和信息知识层线程;其中,行为推理层线程为独立运行线程,当Agent启动后,以系统时间为自变量进行逐步推进,行为推理层线程按照时间推进过程自动反复调用信息理解/事件处理模块和行为决策/状态更新模块,所述信息理解/事件处理模块和所述行为决策/状态更新模块依次按照需求调用感知效应层线程和信息知识层线程,使Agent进行自运行和自更新过程。
Agent A通过感知器、效应器的调用,与人工环境进行信息和行为的交互,从而实现与其它Agent的交互。通过信息知识层服务的调用,实现Agent个性化的模拟和反应。智能学习模块使Agent具有智能属性,可根据Agent对象的具体情况进行裁剪和定制。
综上所述,本发明提供的信息知识层外挂的Agent模型及其建模方法,具有以下优点:
(1)人工环境模型既具备配置灵活、通用性强和可扩展性好的优点;同时,通过模拟地理、气象、电磁、信息网络等环境的作用机理,逼真再现真实环境的动态变化,为各种Agent提供交互媒介;
(2)人工环境模型作为Agent感知信息的来源,支持多终端并发访问,可为大规模计算实验提供支持;
(3)人工环境模型独有的数据存储机制,保存Agent仿真系统演化过程中的Agent全部状态,为进一步研讨分析创造了条件;
(4)Agent模型将信息知识层作为外部资源,置于多Agent仿真环境之外,用于被行为推理层调用;即:通过外部资源进行计算,以服务的形式返回结果,从而实现了要素微观属性和系统宏观属性的统一;
(5)Agent模型既具备配置灵活、通用性强和可扩展性好的优点,同时,在不影响考察系统宏观行为的前提下,可充分检验要素的微观属性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (10)

1.一种人工环境模型,其特征在于,包括:数据存储空间、环境数据查询服务模块、环境数据更新服务模块和环境数据空间存取服务模块; 
所述数据存储空间用于逼真再现真实环境的动态变化,按照空间类型、时间序列和空间范围分块分层地存储环境信息;还用于各个时刻接收并存储来自于Agent的各种属性和信息; 
所述环境数据查询服务模块用于接收来自于Agent感知器的感知消息查询指令,通过查询所述数据存储空间,获得所需的数据;然后将查询得到的数据反馈给Agent感知器; 
所述环境数据更新服务模块用于接收来自于Agent效应器的Agent属性和行为更新指令,然后将Agent属性和行为更新到所述数据存储空间; 
所述环境数据空间存取服务模块用于维护所述数据存储空间,为人工环境提供数据的基础服务。 
2.根据权利要求1所述的人工环境模型,其特征在于,所述数据存储空间包括:地理信息存储子空间、气象数据存储子空间、电磁环境存储子空间和信息网络存储子空间; 
所述地理信息存储子空间用于模拟地理环境的作用机理,所述气象数据存储子空间用于模拟气象环境的作用机理,所述电磁环境存储子空间用于模拟电磁环境的作用机理,所述信息网络存储子空间用于模拟信息网络环境的作用机理。 
3.根据权利要求1所述的人工环境模型,其特征在于,所述数据存储空间按照时间和数据维度进行索引存储数据。 
4.根据权利要求1所述的人工环境模型,其特征在于,所述环境数据查询服务模块具体用于: 
(1)接收来自于Agent感知器的感知消息查询指令,启动独立的数据查询线程; 
(2)所述数据查询线程对所述感知消息查询指令进行解码与分析,根据感知内容和范畴,生成查询变量和查询规则; 
(3)所述数据查询线程基于所述查询变量和查询规则,查询所述数据存储 空间,获得所需的数据; 
(4)所述数据查询线程将查询得到的数据编制成XML文件,反馈给Agent感知器; 
(5)注销所述数据查询线程。 
5.根据权利要求1所述的人工环境模型,其特征在于,所述环境数据更新服务模块具体用于: 
(1)接收来自于Agent效应器的Agent属性和行为更新指令,启动独立的数据更新线程; 
(2)所述数据更新线程对所述Agent属性和行为更新指令进行解码与分析,根据Agent的属性和行为数据,生成分类的更新数据; 
(3)所述数据更新线程将Agent属性和行为更新到所述数据存储空间中对应类别的子空间中;其中,Agent的属性更新数据按照时间和状态的数值进行存储,Agent的行为消息按照时间列表顺序存储; 
(4)注销所述数据更新线程。 
6.根据权利要求1所述的人工环境模型,其特征在于,所述环境数据空间存取服务模块具体用于: 
数据存储空间申请:根据Agent提出的数据存储类别和存储需求,动态向所述数据存储空间申请存储空间,并建立索引; 
数据查询:根据Agent的数据感知需求,利用数据索引,获得Agent的感知数据; 
数据存储:根据Agent的属性和行为数据更新操作,在相应类别的存储空间上更新数据; 
数据存储空间维护:根据时间推进动态维护数据存储空间,将过期的数据转存至数据文件,并将内存空间释放。 
7.一种Agent模型,其特征在于,所述Agent模型为信息知识层外挂的Agent模型,包括:感知效应层、行为推理层和信息知识层;其中,所述感知效应层和所述行为推理层置于多Agent仿真环境之中;所述信息知识层作为外部资源,置于所述多Agent仿真环境之外,用于被所述行为推理层调用;权利要求1-6任 一项所述的人工环境模型为所述Agent模型提供交互媒介、感知信息的来源,以及,所述人工环境模型保存Agent模型演化过程中的Agent全部状态。 
8.根据权利要求1所述的Agent模型,其特征在于,所述感知效应层包括感知器和效应器; 
所述行为推理层包括信息理解/事件处理模块、行为决策/状态更新模块和智能学习模块; 
所述信息知识层包括知识储备/离散事件列表服务模块、行为规则/计算模型服务模块、数据接口服务模块和人机接口服务模块。 
9.根据权利要求8所述的Agent模型,其特征在于,所述感知器用于被所述信息理解/事件处理模块调用,接收所述信息理解/事件处理模块发送的感知内容和感知范围,将该感知内容和感知范围进行处理,形成感知消息;将所述感知消息发送给所述人工环境模型的环境数据查询服务模块;然后等待所述环境数据查询服务模块的反馈,如果未接收到来自环境数据查询服务模块的感知反馈,则结束服务;随着仿真过程的进行,如果接收到来自环境数据查询服务模块的感知反馈,则将所述感知反馈进行协议解码,得到有用感知信息,并将所述有用感知信息以带参数的线程间消息的形式回传给所述信息理解/事件处理模块; 
所述信息理解/事件处理模块用于查询所述知识储备/离散事件列表服务模块,载入特定的离散事件;对所述特定的离散事件进行需求分析,形成感知内容和感知范围的指令,并调用感知器,将该指令发送给所述感知器;然后等待所述感知器的反馈,如果接收到来自所述感知器的感知信息的反馈,则根据该感知信息的反馈,调用所述知识储备/离散事件列表服务模块,接收来自所述知识储备/离散事件列表服务模块的感知知识或感知事件;并将该感知知识或感知事件发送给所述行为决策/状态更新模块; 
所述行为决策/状态更新模块用于: 
1)所述行为决策/状态更新模块根据接收到的来自所述信息理解/事件处理模块的感知知识或感知事件,调用所述行为规则/计算模型服务模块,判断是否具有对Agent的行为/状态的更新,如果没有,则执行2);如果有,则接收来自 所述行为规则/计算模型服务模块的行为/状态的更新内容,并更新本Agent的行为/状态;然后执行2); 
2)所述行为决策/状态更新模块调用数据接口服务模块,判断接口是否有输入消息;如果没有,则执行3);如果有,则接收来自所述数据接口服务模块的人机操作信息或自然系统数据,对本Agent的行为/状态进行修正和更新;然后执行3); 
3)所述行为决策/状态更新模块调用智能学习模块进行自学习;然后调用所述效应器,所述效应器将本Agent的属性和行为更新指令发送给所述环境数据更新服务模块,所述环境数据更新服务模块将Agent属性和行为更新到数据存储空间,供其他Agent查询; 
所述智能学习模块用于:接收所述行为决策/状态更新模块发送的对本Agent的行为/状态的修正,调用算法对行为/状态的修正措施进行迭代分析,得到知识和规则的修正,将知识的修正输出至所述知识储备/离散事件列表服务模块,将规则的修正输出至所述行为规则/计算模型服务模块; 
所述知识储备/离散事件列表服务模块包括感知信息知识列表、离散事件列表、知识查询服务子模块和事件查询服务子模块;所述知识查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述感知信息知识列表中查询相关知识,然后反馈给所述信息理解/事件处理模块;所述事件查询服务子模块用于接受所述信息理解/事件处理模块的调用,从所述离散事件列表中查询相关离散事件,然后反馈给所述信息理解/事件处理模块; 
所述行为规则/计算模型服务模块包括规则/模型数据库、规则查询服务子模块和模型调用服务子模块;所述规则/模型数据库中存储事件处理规则和状态更新计算模型;所述规则查询服务子模块用于接受所述行为决策/状态更新模块的调用,从所述事件处理规则中查询相关的行为决策规则,并反馈给所述行为决策/状态更新模块;所述模型调用服务子模块用于接受所述行为决策/状态更新模块的调用,从所述状态更新计算模型中查询相关的状态更新模型,并反馈给所述行为决策/状态更新模块; 
所述数据接口服务模块用于将自然系统中各个对象的真实测控数据、状态 数据、信号数据接入本Agent;然后对接收到的各数据进行解码和解释,然后将解码和解释后的数据进行暂存;随着仿真过程的进行,当所述数据接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所需数据,并将查询到的数据反馈给所述行为决策/状态更新模块; 
所述人机接口服务模块用于在本Agent启动前对本Agent进行相应配置,在Agent运行过程中响应人员操作;具体用于:在本Agent启动前,接收配置脚本进行系统配置;通过界面监控是否有人员操作事件,当有时,则进行界面响应,并对操作参数编码,将编码得到的操作事件暂存;随着仿真过程的进行,当所述人机接口服务模块被所述行为决策/状态更新模块调用时,从所述暂存中查询所述操作事件,并执行该操作事件,并将操作结果反馈给所述行为决策/状态更新模块; 
所述效应器用于接收来自所述行为决策/状态更新模块的属性更新数据和行为事件,并将属性更新数据和行为事件整理为XML数据文件格式的效应更新消息,然后将效应更新消息发送给环境,使属性更新数据和行为事件影响环境。 
10.一种Agent模型的建模方法,其特征在于,包括以下步骤: 
S1,通过数据接口服务模块和人机接口服务模块定义Agent对象的属性和规则;其中,所述属性用于描述Agent对象的性质,包括Agent对象的身份代码、Agent对象的状态集合;所述规则包括内部规则和外部规则两大类;所述内部规则用于描述Agent所指代的具体对象的内部状态修改的基本规则,所述外部规则用于描述各Agent之间以及Agent与环境之间交互的规则; 
S2,将所定义的Agent对象的属性和规则存储到行为规则/计算模型服务模块和知识储备/离散事件列表服务模块中; 
S3,制定标准的输入输出接口,将感知效应层和行为推理层中各功能模块固化;在信息知识层中,根据Agent对象的个性,按照接口协议进行服务模块定制,使Agent对象具体化; 
S4,建立三个线程,分别为:行为推理层线程、感知效应层线程和信息知识层线程;其中,行为推理层线程为独立运行线程,当Agent启动后,以系统时间为自变量进行逐步推进,行为推理层线程按照时间推进过程自动反复调用 信息理解/事件处理模块和行为决策/状态更新模块,所述信息理解/事件处理模块和所述行为决策/状态更新模块依次按照需求调用感知效应层线程和信息知识层线程,使Agent进行自运行和自更新过程。 
CN201410263616.8A 2014-06-13 2014-06-13 人工环境模型、Agent模型及其建模方法 Pending CN104239594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410263616.8A CN104239594A (zh) 2014-06-13 2014-06-13 人工环境模型、Agent模型及其建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410263616.8A CN104239594A (zh) 2014-06-13 2014-06-13 人工环境模型、Agent模型及其建模方法

Publications (1)

Publication Number Publication Date
CN104239594A true CN104239594A (zh) 2014-12-24

Family

ID=52227652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410263616.8A Pending CN104239594A (zh) 2014-06-13 2014-06-13 人工环境模型、Agent模型及其建模方法

Country Status (1)

Country Link
CN (1) CN104239594A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224658A (zh) * 2015-09-30 2016-01-06 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和系统
CN106096013A (zh) * 2016-06-24 2016-11-09 中国人民解放军63888部队 基于电磁环境数据库的频率查询及规划方法
CN106126245A (zh) * 2016-06-28 2016-11-16 武汉工程大学 一种动态环境下的多Agent协作方法及系统
CN107748502A (zh) * 2017-11-02 2018-03-02 北京华如科技股份有限公司 基于离散事件的作战仿真中实体的被动空间感知交互方法
CN111144578A (zh) * 2019-12-27 2020-05-12 创新奇智(重庆)科技有限公司 一种分布式环境下的人工智能模型管理系统及管理方法
CN111813056B (zh) * 2020-06-02 2023-05-23 深圳全景空间工业有限公司 一种调节室内环境的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008142502A2 (en) * 2007-05-19 2008-11-27 Videotec S.P.A. Method for coordinating a plurality of sensors
CN101515309A (zh) * 2009-04-07 2009-08-26 华中科技大学 基于多智能体的城市应急疏散仿真系统
CN101964545A (zh) * 2010-10-19 2011-02-02 天津理工大学 基于广域网和多Agent的电网自适应智能协调保护控制系统
CN102244679A (zh) * 2011-06-30 2011-11-16 南京邮电大学 一种环境感知模型中的环境信息更新方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008142502A2 (en) * 2007-05-19 2008-11-27 Videotec S.P.A. Method for coordinating a plurality of sensors
CN101515309A (zh) * 2009-04-07 2009-08-26 华中科技大学 基于多智能体的城市应急疏散仿真系统
CN101964545A (zh) * 2010-10-19 2011-02-02 天津理工大学 基于广域网和多Agent的电网自适应智能协调保护控制系统
CN102244679A (zh) * 2011-06-30 2011-11-16 南京邮电大学 一种环境感知模型中的环境信息更新方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224658A (zh) * 2015-09-30 2016-01-06 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和系统
CN105224658B (zh) * 2015-09-30 2018-11-30 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和系统
CN106096013A (zh) * 2016-06-24 2016-11-09 中国人民解放军63888部队 基于电磁环境数据库的频率查询及规划方法
CN106126245A (zh) * 2016-06-28 2016-11-16 武汉工程大学 一种动态环境下的多Agent协作方法及系统
CN107748502A (zh) * 2017-11-02 2018-03-02 北京华如科技股份有限公司 基于离散事件的作战仿真中实体的被动空间感知交互方法
CN107748502B (zh) * 2017-11-02 2020-11-03 北京华如科技股份有限公司 基于离散事件的作战仿真中实体的被动空间感知交互方法
CN111144578A (zh) * 2019-12-27 2020-05-12 创新奇智(重庆)科技有限公司 一种分布式环境下的人工智能模型管理系统及管理方法
CN111144578B (zh) * 2019-12-27 2023-07-28 创新奇智(重庆)科技有限公司 一种分布式环境下的人工智能模型管理系统及管理方法
CN111813056B (zh) * 2020-06-02 2023-05-23 深圳全景空间工业有限公司 一种调节室内环境的方法

Similar Documents

Publication Publication Date Title
CN104239594A (zh) 人工环境模型、Agent模型及其建模方法
CN111708641B (zh) 一种内存管理方法、装置、设备及计算机可读存储介质
Yang A novel cloud information agent system with Web service techniques: Example of an energy-saving multi-agent system
CN108369404A (zh) 集成plc历史记录的分布式嵌入式数据和知识管理系统
CN112182359B (zh) 推荐模型的特征管理方法及系统
CN104202373A (zh) 移动云计算迁移方法及系统
CN113179190B (zh) 边缘控制器、边缘计算系统及其配置方法
CN112329948A (zh) 一种多智能体策略预测方法及装置
Ralha et al. Multiagent system for dynamic resource provisioning in cloud computing platforms
CN106921702A (zh) 一种基于面向服务的配电网信息物理系统
CN110458351A (zh) 基于人流量的区域管理方法、装置、设备及可读存储介质
CN113176948A (zh) 边缘网关、边缘计算系统及其配置方法
CN109684046A (zh) 事件自助处理方法、装置、设备和计算机存储介质
CN110489093A (zh) 一种面向ai应用的持续构造方法、装置、终端及存储介质
CN113971455A (zh) 一种分布式模型训练方法、装置、存储介质及计算机设备
WO2021138939A1 (zh) 一种云脑机器人系统
CN112270083A (zh) 一种多分辨建模与仿真方法及系统
CN105207215B (zh) 一种电力负荷调度控制方法
CN104239593A (zh) 信息知识层外挂的Agent模型及其建模方法
CN114580794B (zh) 数据处理方法、装置、程序产品、计算机设备和介质
CN111368998A (zh) 基于Spark集群的模型训练方法、装置、设备及存储介质
CN106447526A (zh) 一种电网负荷的智能调控方法
CN113703808B (zh) 组件化的灰度发布方法、装置、设备及存储介质
CN111353674A (zh) 企业智能体系统
CN103905543A (zh) 云资源情境感知体系结构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20141224

RJ01 Rejection of invention patent application after publication