CN121457504A - 支持多仿真引擎的智能体构建与调度方法 - Google Patents

支持多仿真引擎的智能体构建与调度方法

Info

Publication number
CN121457504A
CN121457504A CN202511634677.5A CN202511634677A CN121457504A CN 121457504 A CN121457504 A CN 121457504A CN 202511634677 A CN202511634677 A CN 202511634677A CN 121457504 A CN121457504 A CN 121457504A
Authority
CN
China
Prior art keywords
simulation
engine
intelligent
state
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202511634677.5A
Other languages
English (en)
Other versions
CN121457504B (zh
Inventor
王春田
齐高俊
闫俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guang Wuji Technology Co ltd
Original Assignee
Beijing Guang Wuji Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guang Wuji Technology Co ltd filed Critical Beijing Guang Wuji Technology Co ltd
Priority to CN202511634677.5A priority Critical patent/CN121457504B/zh
Publication of CN121457504A publication Critical patent/CN121457504A/zh
Application granted granted Critical
Publication of CN121457504B publication Critical patent/CN121457504B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及智能体构建技术领域,公开了支持多仿真引擎的智能体构建与调度方法,包括:获取智能机器人在仿真过程中的主流引擎模式,并对主流引擎模式进行状态优化处理,输出仿真引擎集合;以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑,并优化仿真智能体的构建过程,在行为逻辑满足需求后停止优化,输出包含若干仿真智能体的智能机器人用智能体集合;通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理。本发明通过目标保真度驱动的智能体调度机制,确保仿真智能体在面对不同任务时响应便捷性。

Description

支持多仿真引擎的智能体构建与调度方法
技术领域
本发明涉及智能体构建技术领域,具体来说,涉及支持多仿真引擎的智能体构建与调度方法。
背景技术
智能机器人是指具备感知、决策、学习、执行等多种功能的自主设备,它能够在一定程度上模拟人类的行为与决策过程,并在复杂环境中进行任务执行,智能机器人仿真智能体是指通过计算机仿真技术构建的、在虚拟环境中模拟智能机器人行为的智能体,其通常用于测试和优化机器人在实际环境中可能遇到的各种情况和任务,目的是通过虚拟环境中的仿真试验,预测和改进机器人的性能,降低在现实中进行实验的风险和成本。
但是现有技术中的智能机器人仿真智能体构建方法通常未充分利用历史数据来精确识别关键行为模式,也缺乏通过自趋优化运行技术提升仿真智能体的自适应性能,多引擎仿真和并行处理的能力较为有限,使得仿真智能体在复杂任务中容易出现性能瓶颈,且现有的仿真智能体在多引擎协同工作和任务调度方面,无法实现精确的目标保真度驱动调度机制,导致资源调度效率较低,无法按需精确匹配仿真智能体的能力和任务要求。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出支持多仿真引擎的智能体构建与调度方法,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
支持多仿真引擎的智能体构建与调度方法,该方法包括:
利用历史仿真过程数据量化智能机器人的仿真服务需求与仿真环境间的匹配度,并根据量化结果划分用于描述智能机器人仿真过程的行为状态;
基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合;
基于孪生仿真与分布式理论,以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑;
根据行为逻辑验证结果优化仿真智能体的构建过程,并在行为逻辑满足需求后停止优化,输出包含若干仿真智能体的智能机器人用智能体集合;
通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理。
优选的,基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合包括:
对行为状态进行挖掘处理输出反复出现且具有信息增益的模体集合,并选取使用频率、应用过程可迁移性与业务关键性作为引擎模式筛选条件;
将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树;
基于代价复杂度后剪枝技术,采用交叉验证法对引擎筛选决策树进行优化,并利用优化后的引擎筛选决策树从模体集合内筛选出主流引擎模式;
对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合。
优选的,引擎模式筛选条件中使用频率表示任意仿真引擎模式在执行智能机器人仿真任务过程中的出现频次,或仿真过程中被使用的次数或比例;
应用过程可迁移性表示任意仿真引擎模式从一个智能机器人仿真任务迁移至另一个智能机器人仿真任务时的效率与效果;
业务关键性表示任意仿真引擎模式在执行智能机器人仿真任务时的重要性或优先级。
优选的,将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树包括:
针对使用频率、应用过程可迁移性与业务关键性将引擎模式样本按各属性数值升序排列,根据排列结果寻找相邻异类引擎模式样本间的分界点;
计算分界点的平均类熵,选取最小平均类熵对应的分界点作为属性阈值点,并将属性阈值点作为决策树的根节点,以根节点划分引擎模式样本;
根据划分结果生成样本子集,并分别计算样本子集中引擎模式筛选条件的最优阈值,利用最优阈值递归划分样本子集直至引擎模式属性相同;
基于样本子集构建决策树的剪枝子树序列,并通过调整剪枝阈值变量筛选满足代价复杂度函数要求的节点生成子树序列,得到引擎筛选决策树。
优选的,对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合包括:
基于各主流引擎模式的状态变量引入执行成功率与延迟分布,生成对应的行为特征,并将各行为特征通过图神经网络进行关联,输出建模结果;
根据各主流引擎模式的建模结果分析引擎模式的启停状态与通断状态,并基于分析结果推算各主流引擎模式,在运行仿真任务时的同步交替状态;
基于同步交替状态确定决策变量,并利用决策变量与约束条件生成目标函数构建多目标优化模型,对主流引擎模式建模结果的状态进行优化;
利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合。
优选的,利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合包括:
分析优化后主流引擎模式建模结果的高维状态空间,并在高维状态空间内提取主流引擎模式的核心特征向量,利用局部线性嵌入技术在保留主流引擎模式的内在关联的前提下将核心特征向量映射至低维流形空间;
在低维流行空间内按照核心特征向量的分布状态确定主流引擎模式的状态最优解,并基于状态最优解对主流引擎模式进行调整;
根据调整结果优化低维流形空间内远离状态最优解区域的主流引擎模式的状态,以保证各主流引擎模式的状态趋向于状态最优解,根据调整结果得到仿真引擎集合。
本发明的有益效果为:
1、本发明通过历史数据驱动建立行为状态与仿真服务之间的适配关系,实现了仿真建模与环境动态的精细对齐,增强了智能体构建的针对性,并结合主流引擎模式识别与自趋优化运行技术,确保每个仿真智能体都具备可适配的执行能力,有效提升了仿真的自适应性能,同时利用孪生仿真与分布式计算架构构建多引擎仿真智能体,使其具备多维并行处理能力和复杂行为的动态演化能力,显著增强仿真过程的真实性与时效性,且通过目标保真度驱动的智能体调度机制,实现了按需调用、精度匹配和性能最优的动态调度,确保仿真智能体在面对不同任务时响应便捷性。
2、本发明通过挖掘具有信息增益的模体集合,可识别出仿真过程中反复出现的关键行为模式,为后续的引擎模式筛选提供了高质量的支持,且结合流形学习和局部线性嵌入技术对引擎模式进行建模和空间调整,不仅增强了仿真引擎模式的适应性,还能在复杂环境中动态调整,使得整个仿真过程的精度和效率得以提升。
3、本发明通过孪生仿真技术与仿真引擎集合的集成,构建生成可扩展、可并行运行的仿真智能体架构,使仿真过程能够适配复杂多变的现实任务场景,并形成虚拟环境与现实环境间的动态映射,且在运行过程中获取的数据又可通过分布式理论进行行为逻辑验证,从而实现仿真智能体性能的系统化评估和逻辑闭环验证,提升了仿真智能体在任务适应性、实时响应能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的支持多仿真引擎的智能体构建与调度方法的流程图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
根据本发明的实施例,提供了支持多仿真引擎的智能体构建与调度方法。
现结合附图和具体实施方式对本发明进一步说明,如图1所示,根据本发明实施例的支持多仿真引擎的智能体构建与调度方法,包括:
步骤S1,利用历史仿真过程数据量化智能机器人的仿真服务需求与仿真环境间的匹配度,并根据量化结果划分用于描述智能机器人仿真过程的行为状态。
在一个实施例中,在实现描述智能机器人仿真过程的行为状态的过程中通过历史仿真过程数据的收集,可获得机器人在不同环境下执行任务时的关键性能指标、传感器数据、执行轨迹等信息,将历史仿真过程中的服务需求(如机器人任务目标、性能要求、资源需求等)与仿真环境(如机器人所处的物理环境、操作条件、交互需求等)进行对比,量化两者之间的匹配度;具体来说,需定义需求和环境的特征向量,如需求可能包括速度要求、精度要求、任务复杂度等,而环境则包含障碍物分布、环境光照、温湿度等信息,通过特征向量计算需求与环境之间的匹配度,如果需求与环境的特征高度一致,则说明机器人能够较好地在该环境中执行任务;反之,则表明环境或需求有不匹配的地方,需要进行调整或优化。
根据需求与环境的匹配度量化结果,对智能机器人仿真过程中的行为状态进行划分,行为状态是指机器人在仿真过程中所处的不同操作模式或状态,例如待命状态、执行任务状态、执行失败状态、恢复状态等,每种状态下机器人所采取的决策策略、任务执行方式和响应环境的方式会有所不同,为实现量化划分需对历史仿真数据进行聚类或分类分析,如K均值聚类或决策树等方法,通过分析数据中机器人行为的规律,将不同的仿真过程划分成若干个离散的状态类别。
步骤S2,基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合。
在一个实施例中,基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合包括:
对行为状态进行挖掘处理输出反复出现且具有信息增益的模体集合,并选取使用频率、应用过程可迁移性与业务关键性作为引擎模式筛选条件;
将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树;
基于代价复杂度后剪枝技术,采用交叉验证法对引擎筛选决策树进行优化,并利用优化后的引擎筛选决策树从模体集合内筛选出主流引擎模式;
对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合。
在一个实施例中,将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树包括:
针对使用频率、应用过程可迁移性与业务关键性将引擎模式样本按各属性数值升序排列,根据排列结果寻找相邻异类引擎模式样本间的分界点;
计算分界点的平均类熵,选取最小平均类熵对应的分界点作为属性阈值点,并将属性阈值点作为决策树的根节点,以根节点划分引擎模式样本;
根据划分结果生成样本子集,并分别计算样本子集中引擎模式筛选条件的最优阈值,利用最优阈值递归划分样本子集直至引擎模式属性相同;
基于样本子集构建决策树的剪枝子树序列,并通过调整剪枝阈值变量筛选满足代价复杂度函数要求的节点生成子树序列,得到引擎筛选决策树。
需要解释说明的是,在获取主流引擎模式时通过对智能机器人历史仿真任务的行为状态数据进行挖掘,识别出在多个仿真过程中反复出现且对任务有显著影响的模式,称之为模体,这些模体具有较高的信息增益,即其在仿真过程中能够显著提高仿真结果的准确性或效率,行为状态包括路径规划、任务执行的不同阶段、机器人与环境的交互方式等,而模体则是指这些行为状态中反复出现并影响任务结果的关键模式。
具体筛选条件包括三个方面:使用频率、应用过程可迁移性和业务关键性,使用频率是衡量某个引擎模式在任务中出现的次数,反映了其在实际仿真中的重要性;应用过程可迁移性则考察该模式从一个任务迁移到另一个任务时的效果和效率,若一个引擎模式在多个任务中表现良好,则迁移性高;业务关键性衡量该引擎模式在完成任务中所起的关键作用,比如是否直接影响任务的成功或精度。
进而根据筛选条件(使用频率、应用过程可迁移性、业务关键性)将样本引擎模式按属性数值升序排列,执行决策树的递归划分生成引擎筛选决策树进行优化,在得到引擎筛选决策树时对生成的决策树进行优化,剪枝技术的目标是去除决策树中过度拟合的部分,减少模型的复杂度,提高其泛化能力,交叉验证法用于评估剪枝过程中不同子树的性能,通过不断调整剪枝阈值,最终选出最优的决策树模型。
在一个实施例中,对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合包括:
基于各主流引擎模式的状态变量引入执行成功率与延迟分布,生成对应的行为特征,并将各行为特征通过图神经网络进行关联,输出建模结果;
根据各主流引擎模式的建模结果分析引擎模式的启停状态与通断状态,并基于分析结果推算各主流引擎模式,在运行仿真任务时的同步交替状态;
基于同步交替状态确定决策变量,并利用决策变量与约束条件生成目标函数构建多目标优化模型,对主流引擎模式建模结果的状态进行优化;
利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合。
在一个实施例中,利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合包括:
分析优化后主流引擎模式建模结果的高维状态空间,并在高维状态空间内提取主流引擎模式的核心特征向量,利用局部线性嵌入技术在保留主流引擎模式的内在关联的前提下将核心特征向量映射至低维流形空间;
在低维流行空间内按照核心特征向量的分布状态确定主流引擎模式的状态最优解,并基于状态最优解对主流引擎模式进行调整;
根据调整结果优化低维流形空间内远离状态最优解区域的主流引擎模式的状态,以保证各主流引擎模式的状态趋向于状态最优解,根据调整结果得到仿真引擎集合。
需要解释说明的是,针对已筛选出的主流仿真引擎模式,如路径规划、目标跟踪、传感器融合等,收集其运行过程中的关键状态变量,包括运行时的输入维度、CPU/GPU资源占用、平均执行时间(延迟)、成功率(是否稳定输出目标行为)等,并在此基础上引入执行成功率与延迟分布作为衡量行为特征表现的核心参数,例如路径规划引擎的成功率为92%,延迟分布的均值为120ms、方差为25ms2,同时将上述特征作为每个引擎模式的行为向量,构建引擎间的关系图并通过图神经网络(Graph Neural Network)对行为向量进行结构学习和特征融合,输出每个引擎在群体关系下的动态建模结果。
基于GNN输出的建模结果分析各主流引擎模式在仿真执行中的启停状态(是否处于激活)和通断状态(是否有依赖其他方面的输入/输出),例如路径规划引擎在整个仿真周期中启用率为80%,但其依赖的地图更新引擎仅在初始阶段激活,导致两者之间存在时间通断问题,通过分析每个引擎在仿真任务中是否与其他引擎存在同步或异步交替的行为,推演出同步交替状态矩阵,该矩阵量化了各引擎在仿真流程中可能的运行阶段冲突或配合关系,例如路径规划与避障引擎在大多数任务段内是交替激活,而路径规划与目标识别通常是同步激活。
基于上述同步交替状态构建多目标优化模型,并从中提取若干决策变量,如是否启用某个引擎、引擎的最大延迟允许范围、并行运行资源限制等,同时设定一组约束条件,如资源消耗不超过80%、成功率不低于90%、延迟不超过150ms,并设定优化目标函数,例如最小化延迟与最大化成功率的组合函数,并使用粒子群优化(PSO)或NSGA-II等方法对各主流引擎的状态变量进行优化搜索,得到优化后的高维状态空间表示,例如路径规划引擎优化后状态为(启用=1,延迟=110ms,成功率=94%),避障引擎状态为(启用=1,延迟=95ms,成功率=91%)。
为降低高维状态建模在调度时的计算成本,采用局部线性嵌入方法LLE对优化结果进行流形学习处理,LLE在保留主流引擎模式之间的局部邻域结构的同时,将高维状态空间映射到低维的流形空间(如2维或3维),便于后续的状态聚类与最优状态识别,在低维空间中识别每个引擎模式的核心特征向量分布,并根据密度聚类或最大值分析方法确定最优状态中心,例如在二维LLE嵌入图中,路径规划引擎的最优状态中心对应坐标(0.3,0.7),而当前映射状态为(0.5,0.9),表明偏离了最优状态中心。
基于最优状态中心对所有映射结果进行引擎状态调整,使得每个引擎向其最优状态靠近,在此过程中,若某个引擎距离最优区域过远(如超过设定阈值δ=0.25),将触发自动参数再调整机制,例如缩短该引擎的资源分配窗口或降低非关键行为执行频率,来使状态回落到可接受范围,最终通过一系列映射与调整,得到的仿真引擎集合不仅能满足性能约束,还能确保引擎之间的协同效率最大化。
假设当前智能机器人仿真任务需要三个引擎:路径规划(PP)、障碍物避让(AO)、环境建图(SLAM),通过历史数据显示其初始成功率分别为PP=91%、AO=88%、SLAM=85%,延迟均值分别为PP=130ms、AO=140ms、SLAM=160ms。在图神经网络建模后表明PP与AO高度协同,SLAM与PP有部分冲突(在更新周期中重叠),经过同步交替分析与目标函数优化后,三者成功率分别提升到PP=94%、AO=91%、SLAM=87%,延迟分别降低至PP=110ms、AO=100ms、SLAM=135ms,并通过LLE将三维状态向量压缩到二维流形空间,映射结果聚集在状态最优解附近,通过调优策略最终得到满足精度约束且资源分配最优的仿真引擎集合。
步骤S3,基于孪生仿真与分布式理论,以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑。
在一个实施例中,基于孪生仿真与分布式理论,以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑包括:
解析智能机器人结构状态构建数字三维模型,并在数字三维模型内验证智能机器人的实际结构信息以保证虚拟布局与实际应用运行状态一致;
为验证后的数字三维模型配置智能机器人的参数属性与物理行为,并利用传感器与信号实现自动化控制,以确保智能机器人虚实的实时同步;
基于配置完成的数字三维模型利用孪生仿真技术与仿真引擎集合建立虚拟环境与现实环境的映射关系,生成支持多仿真引擎运行的仿真智能体;
随机设定智能机器人仿真任务应用至仿真智能体捏,执行多仿真引擎运行处理,获取运行过程数据利用分布式理论验证仿真智能体的行为逻辑。
在一个实施例中,基于配置完成的数字三维模型利用孪生仿真技术与仿真引擎集合建立虚拟环境与现实环境的映射关系,生成支持多仿真引擎运行的仿真智能体包括:
基于配置完成的数字三维模型利用运动控制驱动设计并建立智能机器人仿真数字化工作站,同时根据全集成自动化平台进行运行对象组态设计;
集成建立与设计结果生成仿真集成测试平台,并利用工程建模与自动化测试结合的编程方式,调用脚本节点对仿真集成测试平台进行内核优化;
将内核优化后的仿真集成测试平台与数字三维模型结合发送至工程建模主面板,并通过以太网形式实现虚拟环境与现实环境的映射关系的建立;
基于工程建模的虚拟开发技术与自动化测试的并行计算能力,配置多仿真引擎集合条件下的仿真集成测试平台,得到支持多仿真引擎运行的仿真智能体。
需要解释说明的是,在构建仿真智能体的过程中,通过计算机辅助设计(CAD)等工具生成机器人完整的数字三维模型,该模型不仅包括机器人的外观、尺寸等几何信息,还涉及到各个部件之间的连接关系与工作原理,例如六个自由度的机械臂,传动系统、传感器和执行器等,通过三维模型能够对机器人的实际结构进行仿真和验证,确保数字模型与实际机器人应用场景中的物理布局和行为一致,验证后的数字三维模型能够为后续的控制与仿真工作奠定基础。
同时为机器人配置各类属性,如速度、加速度、质量、摩擦系数等定义机器人的物理行为,确保其在仿真环境中的表现能够真实地反映现实情况,基于配置完成的数字三维模型利用孪生仿真技术与仿真引擎集合建立虚拟环境与现实环境的映射关系,生成支持多仿真引擎运行的仿真智能体,孪生仿真技术通过创建一个数字孪生来同步虚拟与现实世界,建立虚拟环境与现实环境之间的动态映射关系。通过引入多个仿真引擎,可以模拟不同的物理现象或行为,并利用引擎来执行任务,对于机器人而言虚拟环境中的仿真引擎可模拟其路径规划、动作执行、碰撞检测等,而现实环境中的仿真引擎则通过硬件接口将这些行为映射到真实世界,这种虚拟与现实的同步为复杂仿真提供了可靠的支持,确保机器人能够在两者之间顺畅过渡。
例如让机器人执行一个避障任务或物体抓取任,仿真智能体在多个仿真引擎的支持下,可同时模拟多个任务场景,处理不同的物理交互和任务要求,任务执行过程中会通过传感器和信号反馈来实时调整机器人的运动轨迹和行,而分布式理论的应用旨在将机器人任务分解成多个子任务并通过多个仿真引擎并行处理,并行处理能够大大提高仿真任务的效率,同时避免单一引擎负载过高导致性能瓶颈,分布式理论的核心思想是通过任务的合理分配和并行计算,确保每个引擎在处理各自任务时能够独立运行,并通过同步机制与其他引擎协调,从而保持仿真过程的稳定性和高效性。
基于配置完成的数字三维模型利用运动控制驱动设计并建立智能机器人仿真数字化工作站,这一阶段将数字三维模型转化为仿真工作站,仿真工作站集成了控制系统、传感器模块和计算平台,能够支持机器人在数字化环境中的全方位仿真,运动控制驱动设计使得机器人在仿真过程中能够根据实时输入数据调整运动轨迹,确保仿真任务的顺利完成。
步骤S4,根据行为逻辑验证结果优化仿真智能体的构建过程,并在行为逻辑满足需求后停止优化,输出包含若干仿真智能体的智能机器人用智能体集合。
在一个实施例中,在初步构建的仿真智能体完成一轮或多轮仿真任务之后对其行为逻辑执行结果进行行为逻辑验证,验证维度主要包括任务完成率、行为稳定性、策略响应时延、行为链完整性等核心指标,并基于行为逻辑验证中的偏差反馈,自动调整智能体构建参数,如任务调度顺序、仿真引擎优先级、资源分配策略、感知更新频率、动作执行粒度等。
完成优化后将新的仿真智能体重新运行仿真任务,并再次执行行为逻辑验证,这一过程构成验证优化的闭环循环机制,在每一轮迭代中记录仿真智能体在任务中的表现,并与预设行为逻辑阈值进行比较。若连续N轮(如3轮)验证均满足所有逻辑要求,或平均评分高于设定上限(如95分),则视为满足任务需求,则触发自动停止优化机制,防止过拟合或资源浪费。
假设设定初始构建三个仿真智能体A1、A2、A3,用于完成任务在模拟厂房环境中避开随机障碍并搬运物体至目标点,行为逻辑设定包括:
任意时刻避障响应时延≤200ms;全任务完成时间≤12秒;操作行为顺序严格遵循感知、定位、避障、搬运;全流程不得出现中断或逻辑逆转,第一次仿真运行后系统记录如下验证结果:
A1:完成时间10.5秒,避障响应180ms,行为逻辑完整;
A2:完成时间13.2秒,避障响应240ms,行为逻辑缺失一阶段;
A3:完成时间11.8秒,避障响应310ms,存在路径逻辑逆转;
对A2和A3进行优化处理,A2增加动作执行粒度、降低感知更新周期(由200ms降至100ms),A3提升避障引擎优先级(从默认0.5提升到0.8),并修改路径规划模型为轻量级路径图,而第二轮验证后:
A2:完成时间11.0秒,避障响应190ms,行为逻辑完整;
A3:完成时间10.8秒,避障响应180ms,行为逻辑完整。
记录连续两轮评分A1、A2、A3均达到逻辑完整且满足性能要求,平均评分分别为97、94、95(评分维度含行为完整性40%、时效性30%、资源利用效率30%),符合终止优化的设定条件,自动将A1、A2、A3纳入输出集合,最终输出的智能体集合(A1、A2、A3),可部署于不同机器人任务环境中使用,进而可形成闭环、可控、可自动迭代优化的仿真智能体构建机制,确保输出智能体具备高鲁棒性和逻辑可靠性。
步骤S5,通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理。
在一个实施例中,通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理包括:
获取智能机器人的实时仿真任务,并分析实时仿真任务在运行过程中对应的环境动态变化、执行时间限制及资源消耗要求作为任务需求信息;
基于任务需求信息评估实时仿真任务在仿真过程中需保证的精确度,作为目标保真度,并根据目标保真度从智能体集合内调度仿真智能体;
在满足要求的仿真智能体被调动后启动仿真智能体,按照实时仿真任务要求执行相应的智能机器人仿真处理操作,并记录仿真处理过程。
在一个实施例中,基于任务需求信息评估实时仿真任务在仿真过程中需保证的精确度,作为目标保真度,并根据目标保真度从智能体集合内调度仿真智能体包括:
根据任务需求信息预测实时仿真任务在执行仿真过程中的动态变化趋势,基于动态变化趋势评估实时仿真任务的精确度需求,并将精确度需求转化为目标保真度值;
利用模糊推理算法根据目标保真度值确定最佳的精度提升路径,以精度提升路径为基础设定调度机制,从智能体集合内调度满足需求的仿真智能体。
需要解释说明的是,获取智能机器人的实时仿真任务,并分析实时仿真任务在运行过程中对应的环境动态变化、执行时间限制及资源消耗要求作为任务需求信息的目标是了解实时仿真任务的运行环境及其所需的资源,通过传感器数据、环境监测信息以及任务需求的输入(如目标定位、避障、抓取任务等),能够精确识别任务的动态特征,如果任务要求机器人从一个起始点移动到目标点,并且途中有动态障碍物,则分析动态变化的时间窗口、障碍物的相对速度、机器人的速度和计算资源等因素,从而获取详细的任务需求信息,任务需求信息可能包括但不限于:仿真过程中的执行时间限制(如需要在15秒内完成任务)、资源消耗要求(如每个引擎的计算负载不能超过70%)、实时任务的精度需求(如路径规划的误差小于10cm)。
对于一个目标任务,如果任务要求机器人定位一个物体并将其拾取,则目标保真度将包括定位精度、抓取精度、物体跟踪精度等,将任务的精确度需求转化为目标保真度指标,如路径规划精度需保持在5cm以内、目标识别精度需达到90%以上;根据这一目标保真度,从已经优化过的智能体集合中选择出能够满足这些精度需求的仿真智能体,如果任务精度要求较高则选择资源消耗较大、计算能力较强的智能体;而如果精度要求适中,则选择计算负载较轻的智能体。
具体的精度需求是由动态变化趋势预测来驱动的。通过对实时仿真任务执行过程的历史数据和环境信息进行分析,预测任务中可能出现的变化趋势,例如任务涉及到动态避障,机器人将面临不同速度和方向的障碍物,而这些障碍物的运动轨迹和速度是不确定的,则需要通过历史数据进行趋势预测,如障碍物的平均速度、加速度等,进一步推算出任务中的精度需求。
通过模糊推理算法根据目标保真度值确定最佳的精度提升路径。模糊推理算法基于目标保真度的精度需求,如路径规划误差、避障响应时间等,推导出一个合理的精度提升路径。例如推断出对于某个任务,提升避障精度应优先增加传感器更新频率,而对路径规划精度的提升则需要增加计算资源的调度,基于分析结果设定调度机制,调度适合的仿真智能体进行任务处理。
一旦从智能体集合中调度出合适的智能体,将根据实时仿真任务的要求启动仿真智能体,此时仿真智能体将开始执行任务,如路径规划、避障、抓取等,并实时监控仿真过程,记录智能体在执行任务中的表现,例如任务完成时间、资源消耗、精度误差等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.支持多仿真引擎的智能体构建与调度方法,其特征在于,该方法包括:
利用历史仿真过程数据量化智能机器人的仿真服务需求与仿真环境间的匹配度,并根据量化结果划分用于描述智能机器人仿真过程的行为状态;
基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合;
基于孪生仿真与分布式理论,以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑;
根据行为逻辑验证结果优化仿真智能体的构建过程,并在行为逻辑满足需求后停止优化,输出包含若干仿真智能体的智能机器人用智能体集合;
通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理。
2.根据权利要求1所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述基于行为状态获取智能机器人在仿真过程中的主流引擎模式,并通过自趋优化运行技术对主流引擎模式进行状态优化处理,输出仿真引擎集合包括:
对行为状态进行挖掘处理输出反复出现且具有信息增益的模体集合,并选取使用频率、应用过程可迁移性与业务关键性作为引擎模式筛选条件;
将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树;
基于代价复杂度后剪枝技术,采用交叉验证法对引擎筛选决策树进行优化,并利用优化后的引擎筛选决策树从模体集合内筛选出主流引擎模式;
对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合。
3.根据权利要求2所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述引擎模式筛选条件中使用频率表示任意仿真引擎模式在执行智能机器人仿真任务过程中的出现频次,或仿真过程中被使用的次数或比例;
所述应用过程可迁移性表示任意仿真引擎模式从一个智能机器人仿真任务迁移至另一个智能机器人仿真任务时的效率与效果;
所述业务关键性表示任意仿真引擎模式在执行智能机器人仿真任务时的重要性或优先级。
4.根据权利要求3所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述将属性阈值点作为决策树的根节点划分引擎模式筛选条件生成两组子集,并对两组子集进行递归,生成智能机器人在仿真时的引擎筛选决策树包括:
针对使用频率、应用过程可迁移性与业务关键性将引擎模式样本按各属性数值升序排列,根据排列结果寻找相邻异类引擎模式样本间的分界点;
计算分界点的平均类熵,选取最小平均类熵对应的分界点作为属性阈值点,并将属性阈值点作为决策树的根节点,以根节点划分引擎模式样本;
根据划分结果生成样本子集,并分别计算样本子集中引擎模式筛选条件的最优阈值,利用最优阈值递归划分样本子集直至引擎模式属性相同;
基于样本子集构建决策树的剪枝子树序列,并通过调整剪枝阈值变量筛选满足代价复杂度函数要求的节点生成子树序列,得到引擎筛选决策树。
5.根据权利要求2所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述对主流引擎模式进行建模,结合流形学习和局部线性嵌入技术,将建模结果的状态空间映射至流形空间进行引擎模式调整,得到仿真引擎集合包括:
基于各主流引擎模式的状态变量引入执行成功率与延迟分布,生成对应的行为特征,并将各行为特征通过图神经网络进行关联,输出建模结果;
根据各主流引擎模式的建模结果分析引擎模式的启停状态与通断状态,并基于分析结果推算各主流引擎模式,在运行仿真任务时的同步交替状态;
基于同步交替状态确定决策变量,并利用决策变量与约束条件生成目标函数构建多目标优化模型,对主流引擎模式建模结果的状态进行优化;
利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合。
6.根据权利要求5所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述利用局部线性嵌入技术,对优化后的主流引擎模式建模结果的高维状态空间进行流形映射,并调整主流引擎模式的状态得到仿真引擎集合包括:
分析优化后主流引擎模式建模结果的高维状态空间,并在高维状态空间内提取主流引擎模式的核心特征向量,利用局部线性嵌入技术在保留主流引擎模式的内在关联的前提下将核心特征向量映射至低维流形空间;
在低维流行空间内按照核心特征向量的分布状态确定主流引擎模式的状态最优解,并基于状态最优解对主流引擎模式进行调整;
根据调整结果优化低维流形空间内远离状态最优解区域的主流引擎模式的状态,以保证各主流引擎模式的状态趋向于状态最优解,根据调整结果得到仿真引擎集合。
7.根据权利要求1所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述基于孪生仿真与分布式理论,以仿真引擎集合为基础构建支持多仿真引擎运行的仿真智能体,并运行仿真引擎集合验证仿真智能体的行为逻辑包括:
解析智能机器人结构状态构建数字三维模型,并在数字三维模型内验证智能机器人的实际结构信息以保证虚拟布局与实际应用运行状态一致;
为验证后的数字三维模型配置智能机器人的参数属性与物理行为,并利用传感器与信号实现自动化控制,以确保智能机器人虚实的实时同步;
基于配置完成的数字三维模型利用孪生仿真技术与仿真引擎集合建立虚拟环境与现实环境的映射关系,生成支持多仿真引擎运行的仿真智能体;
随机设定智能机器人仿真任务应用至仿真智能体捏,执行多仿真引擎运行处理,获取运行过程数据利用分布式理论验证仿真智能体的行为逻辑。
8.根据权利要求7所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述基于配置完成的数字三维模型利用孪生仿真技术与仿真引擎集合建立虚拟环境与现实环境的映射关系,生成支持多仿真引擎运行的仿真智能体包括:
基于配置完成的数字三维模型利用运动控制驱动设计并建立智能机器人仿真数字化工作站,同时根据全集成自动化平台进行运行对象组态设计;
集成建立与设计结果生成仿真集成测试平台,并利用工程建模与自动化测试结合的编程方式,调用脚本节点对仿真集成测试平台进行内核优化;
将内核优化后的仿真集成测试平台与数字三维模型结合发送至工程建模主面板,并通过以太网形式实现虚拟环境与现实环境的映射关系的建立;
基于工程建模的虚拟开发技术与自动化测试的并行计算能力,配置多仿真引擎集合条件下的仿真集成测试平台,得到支持多仿真引擎运行的仿真智能体。
9.根据权利要求1所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述通过智能机器人实时仿真任务评估仿真过程中所需的目标保真度,基于目标保真度从智能体集合内调度仿真智能体,执行智能机器人仿真处理包括:
获取智能机器人的实时仿真任务,并分析实时仿真任务在运行过程中对应的环境动态变化、执行时间限制及资源消耗要求作为任务需求信息;
基于任务需求信息评估实时仿真任务在仿真过程中需保证的精确度,作为目标保真度,并根据目标保真度从智能体集合内调度仿真智能体;
在满足要求的仿真智能体被调动后启动仿真智能体,按照实时仿真任务要求执行相应的智能机器人仿真处理操作,并记录仿真处理过程。
10.根据权利要求9所述的支持多仿真引擎的智能体构建与调度方法,其特征在于,所述基于任务需求信息评估实时仿真任务在仿真过程中需保证的精确度,作为目标保真度,并根据目标保真度从智能体集合内调度仿真智能体包括:
根据任务需求信息预测实时仿真任务在执行仿真过程中的动态变化趋势,基于动态变化趋势评估实时仿真任务的精确度需求,并将精确度需求转化为目标保真度值;
利用模糊推理算法根据目标保真度值确定最佳的精度提升路径,以精度提升路径为基础设定调度机制,从智能体集合内调度满足需求的仿真智能体。
CN202511634677.5A 2025-11-10 2025-11-10 支持多仿真引擎的智能体构建与调度方法 Active CN121457504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202511634677.5A CN121457504B (zh) 2025-11-10 2025-11-10 支持多仿真引擎的智能体构建与调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202511634677.5A CN121457504B (zh) 2025-11-10 2025-11-10 支持多仿真引擎的智能体构建与调度方法

Publications (2)

Publication Number Publication Date
CN121457504A true CN121457504A (zh) 2026-02-03
CN121457504B CN121457504B (zh) 2026-04-17

Family

ID=98572659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202511634677.5A Active CN121457504B (zh) 2025-11-10 2025-11-10 支持多仿真引擎的智能体构建与调度方法

Country Status (1)

Country Link
CN (1) CN121457504B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004068318A2 (en) * 2003-01-29 2004-08-12 Indasea Inc. Cultural simulation model for modeling of agent behavioral expression and simulation data visualization methods
CN117787416A (zh) * 2023-12-29 2024-03-29 南栖仙策(南京)科技有限公司 目标博弈决策模型的构建方法、装置、电子设备及介质
CN117901099A (zh) * 2024-01-18 2024-04-19 陕西捷泰智能传动有限公司 一种人形机器人的姿态智能控制方法及系统
WO2024159821A1 (zh) * 2023-02-03 2024-08-08 华为云计算技术有限公司 决策方法及相关设备
CN120821809A (zh) * 2025-07-24 2025-10-21 天津大学 一种面向多智能体计算实验系统的领域模型与平台引擎对接系统及方法
CN120893309A (zh) * 2025-07-29 2025-11-04 北京光无际科技有限公司 基于多智能体强化学习的分布式联合作战推演引擎架构

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004068318A2 (en) * 2003-01-29 2004-08-12 Indasea Inc. Cultural simulation model for modeling of agent behavioral expression and simulation data visualization methods
WO2024159821A1 (zh) * 2023-02-03 2024-08-08 华为云计算技术有限公司 决策方法及相关设备
CN117787416A (zh) * 2023-12-29 2024-03-29 南栖仙策(南京)科技有限公司 目标博弈决策模型的构建方法、装置、电子设备及介质
CN117901099A (zh) * 2024-01-18 2024-04-19 陕西捷泰智能传动有限公司 一种人形机器人的姿态智能控制方法及系统
CN120821809A (zh) * 2025-07-24 2025-10-21 天津大学 一种面向多智能体计算实验系统的领域模型与平台引擎对接系统及方法
CN120893309A (zh) * 2025-07-29 2025-11-04 北京光无际科技有限公司 基于多智能体强化学习的分布式联合作战推演引擎架构

Also Published As

Publication number Publication date
CN121457504B (zh) 2026-04-17

Similar Documents

Publication Publication Date Title
CN112668235B (zh) 基于离线模型预训练学习的ddpg算法的机器人控制方法
Du et al. A survey on multi-agent deep reinforcement learning: from the perspective of challenges and applications
Lin et al. An efficient deep reinforcement learning model for urban traffic control
CN114442510A (zh) 数字孪生闭环控制方法、系统、计算机设备及存储介质
CN114510012B (zh) 一种基于元动作序列强化学习的无人集群演进系统及方法
CN119647604B (zh) 一种决策模型的训练推理方法、产品、电子设备及介质
CN113538162A (zh) 一种种植策略生成方法、装置、电子设备及存储介质
CN115081585A (zh) 一种强化异构图神经网络的人机物协同异常状态检测方法
CN119623911B (zh) 基于知识图谱与大语言模型的柔性生产计划预测系统和方法
CN118158858A (zh) 基于深度学习的灯具分组控制方法及系统
Khan et al. Spiking neural networks: a comprehensive survey of training methodologies, hardware implementations and applications
US20070179917A1 (en) Intelligent design optimization method and system
CN100578538C (zh) 基于层次图组织与变换的虚拟环境群体对象行为演化方法
CN121457504B (zh) 支持多仿真引擎的智能体构建与调度方法
McGovern et al. Hierarchical optimal control of MDPs
CN118710786B (zh) 一种数字人动作生成方法及生成系统
CN120297361A (zh) 一种异构智能体动作策略博弈方法及系统
CN120068987A (zh) 一种基于数字孪生的集群智能决策模型训练方法
Pax et al. A cloud based simulation service for 3d crowd simulations
CN116611498B (zh) 一种基于Spark的并行强化学习方法
Guo et al. Cooperative pursuit of UAV cluster based on graph embedding reinforcement learning
CN120766368B (zh) 基于神经网络架构搜索的步态情感识别方法
CN120755892B (zh) 组装机器人的部件组装控制方法、电子设备及存储介质
CN115993779B (zh) 一种基于值强化学习的连续控制方法
Zhang et al. A deep reinforcement learning model based on deterministic policy gradient for collective neural crest cell migration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant