CN113568324B - 一种基于仿真演绎的知识图谱修正方法 - Google Patents
一种基于仿真演绎的知识图谱修正方法 Download PDFInfo
- Publication number
- CN113568324B CN113568324B CN202110729002.4A CN202110729002A CN113568324B CN 113568324 B CN113568324 B CN 113568324B CN 202110729002 A CN202110729002 A CN 202110729002A CN 113568324 B CN113568324 B CN 113568324B
- Authority
- CN
- China
- Prior art keywords
- task
- robot
- knowledge graph
- simulation
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Manipulator (AREA)
- Numerical Control (AREA)
Abstract
本发明公开了一种基于仿真演绎的知识图谱修正方法,该方法通过在仿真环境中大量重复相似的机器人行为,实现对机器人知识图谱的修正。其中知识图谱是一种能够表达机器人行为、环境、硬件关联的数据结构,用于机器人行为决策并执行任务。本发明基于仿真环境,所使用的仿真环境使用不限于现有的机器人仿真引擎,如unity3D、unreal4、gazebo,使用与机器人相似的仿真模型和环境,通过实时上传机器人与操作物件的信息,来修正知识图谱中机器人行为逻辑节点之间的关联。
Description
技术领域
本发明涉及人工智能机器人任务行为规划、知识图谱领域技术、机器人虚拟仿真引擎技术,尤其是涉及一种基于仿真演绎的知识图谱修正方法。
背景技术
早先机器人作业使用示教或者完备的程序控制,无法完成自主的行为作业。目前常用的机器人自主作业主要由知识图谱提供信息支撑,使用动态的任务规划替代先前硬编码式的任务规划,机器人能在一定程度上实现自主作业。但是,使用动态规划任务会造成规划结果混乱;在知识图谱缺失关键知识节点的前提下,任务规划将会失败。
发明内容
为解决现有技术的不足,实现提升机器人任务规划效率和成功率的目的,本发明采用如下的技术方案:
一种基于仿真演绎的知识图谱修正方法,包括如下步骤:
S1,构建仿真环境、仿真机器人,定义完成任务的子任务及一系列子行为集合;
S2,构建机器人知识图谱,知识图谱包括构成任务的各节点和表示节点间权值的边;
S3,构建机器人仿真任务集合,进行仿真推导,得出能够完成任务的行为路径;
S4,展开机器人仿真,根据能够完成任务的行为路径,修正知识图谱的权值。
进一步地,所述S1包括如下步骤:
S11,基于机器人环境,建立周边场景的数字仿真环境,其环境受到现实世界物理定律约束,记作Env;
S12,基于机器人物理和模型特征,在机器人仿真环境中构建出对应的仿真机器人,包括机器人的运动行走部件,机器人抓取关节等,记作Sim-Robot;
S13,机器人作业任务记作Task,包括一组子任务Task-c;
S14,机器人运行时,执行的各个子任务记作Task-c,完成任务Task的一系列子任务,即一系列行为,记作{Task-c}集合;
S15,子任务Task-c,包括一组行为,且Task-c对应操作物件记作obj。
进一步地,所述S2包括如下步骤:
S21,定义任务Task为{robo,obj,{Task-c}},robo表示真实机器人Real-robot,obj表示真实机器人操作的物件,{Task-c}表示完成任务Task的行为队列;
S22,实现Task的行为队列不是唯一的,知识图谱根据子任务Task-c与操作物件obj的对应关系{obj,Task-c},生成所有可能操作物件obj的行为,得到实现任务Task的全部行为路径;
S23,使用全部子任务Task-c构建任务知识图谱,其中任务知识图谱的每个子任务记为一个Task-c节点,节点之间的边,表示Task-c节点之间构成任务Task的任务权值;
S24,根据行为构建行为知识图谱,其中行为知识图谱的每个子行为记为一个子行为节点,节点之间的边,表示子行为构成任务Task的行为的行为权值,子任务Task-c中被分解出的一组行为分别指向该行为对应的知识图谱;
S25,在知识图谱中,定义操作物件obj,在环境中全部可以操作的物件构成集合{obj}。
进一步地,所述S3包括如下步骤:
S31,在仿真环境Env中,仿真机器人Sim-Robot,具备刚体物理特征、多自由度机械臂、运动导航能力;
S32,设计仿真机器人Sim-Robot的各个运动关节,捕捉运动轨迹,作为机器人基准轨迹trail;
S33,获取仿真机器人Sim-Robot的行径轨迹route;
S34,获取完成任务Task中,仿真机器人Sim-Robot执行的每个动作motion;
S35,定义仿真机器人Sim-Robot的任意一次子任务Task-c{trail,route,motion};
S36,知识图谱中,对于执行Task的trail、route、motion,是未知的,我们要通过仿真进行推导,得出能够实现任务Task的行为路径,包括如下步骤:
S361,知识库中,定义已有全部可执行的行为集合,包括动作集合{motion}-all,具有全部可规划的路径集合{route}-all,现有规划出的全部轨迹路径为{trail}-all;
S362,根据知识图谱,完成任务Task所需的行为组合,动作motion、轨迹trail、路径route的组合,即行为集合{motion}-all、{route}-all、{trail}-all的子集,由该子集形成能够实现各子任务Task-c的组合,记作{Task-c-r};
S363,对任何一个任务组合{Task-c-r},不能保证Task-c-r一定能在真实机器人实体上完成子任务Task-c,因此,对仿真环境Env下发{Task-c-r}数据集合,使其使用该集合中所有的Task-c-r任务组合进行尝试,观测是否能够完成任务Task。
进一步地,所述S4包括如下步骤:
S41,在仿真器中,同时运行多个仿真实例,其中每一个实例使用{Task-c-r}集合中的一个任务规划Task-c-r;
S42,对于每一个任务规划Task-c-r,在仿真实例中运行,观察仿真机器人Sim-Robot在仿真环境Env中的运行结果;
S43,对于运行结果,获取两个事实:仿真机器人Sim-Robot是否能成功完成任务Task,以及机器人在完成任务Task的前提下需要的时间均值;
S44,对于能够完成任务Task的任务规划Task-c-r,获取其对应的行为路径{motion,trail,route},及时间均值delta-time,通过时间均值delta-time更新任务知识图谱中Task-c节点间的边;设计算法,更新实现该任务规划中的行为在行为知识图谱中子行为节点间的边;
S45,对于不能完成任务Task的规划Task-c-r,将其对应的行为路径{motion,trail,route},在知识图谱中,删除节点间的边关联;
S46,通过S44、S45,我们得到更新后的知识图谱,包含更新后的动作motion图谱、轨迹trail图谱、实现路径route图谱,使用更新后的知识图谱,按仿真环境Env下的规划方案,获得最佳机器人任务规划,并下发至真实机器人Real-robot进行任务作业。
进一步地,所述S44中,当有多种任务规划Task-c-r都能完成任务Task时,取时间均值delta-time最小的任务规划Task-c-r,增加任务规划Task-c-r对应的各Task-c节点间的任务权值。
进一步地,所述行为包括动作motion、轨迹trail和路径route。
最终得到{Task-c}、{motion}、{trail}、{route}、{obj}五个知识图谱。
进一步地,所述S44中行为知识图谱的权值更新如下:
对于动作motion:
初始权值设置为1,每个边的权值范围为[0.1,10],其中,Tmotion表示完成动作motion所需的时间总和,这意味着执行时间越长,该任务的权值就会越低;
对于轨迹trail:
其中,Ttrail表示当前任务完成轨迹trail所需的时间总和;
对于路径route:
主要为路径是否能够连通,以及作为Task-c串联时,对route权值进行更新,所以对于不能形成连通链路的路径route,权值为0,能够连通的路径route,权值为连通所有Task-c的权值总和,L表示连通节点数。
进一步地,所述S44中任务知识图谱的权值更新包括如下步骤:
S441,将各个子节点的边的权值设置为初始值:
Tmax=∑Troute+∑Tmotion+∑Ttrail
其中,Tmax表示最大行为执行时间,T包括Troute、Tmotion和Ttrail中的一个或多个,Troute表示完成动作路径route所需要的时间总和,Tmotion表示完成动作motion所需的时间总和,Ttrail表示完成轨迹trail所需的时间总和,
S442,对于能够构成子任务task-c的(motion trail route),一定在对应的{motion}{route}{trail}构成链路,对于所有可能的链路,取最大时延作为基准:
Ave=Max(Delayi)
一个节点i需要的时延就为:
其中,Ni表示节点i被连接的次数,按照统计次数进行均值求解,然后将这个结果与初始权值相加,Weight表示任务节点的边的权值;
当由仿真确定一条链路不能执行时,删除对应节点之间的边,对应链路上所有节点增加基于丢失节点的权值Weight:
当仿真发生时,T、Delayi、Ni会根据仿真结果不断修正,例如某些任务的链路不通,Ni总数就会下降,Weight是根据仿真计算出的新值,与原来Ni、T、Tmax不再相同,均需重新按公式计算;
当一条仿真链路能够确定时,更新权值对应路径的权值:
Nn=∑(frequency*Ni)
Weightnew=Weightold+Nn*Ave
其中,Nn表示统计计数因子,frequency表示该节点(motion、trail、route)被不同子任务Task-c走过的频率,Ni表示该节点i被连接的次数。
如图6所示,对于节点5,分别连接下个节点3和7,节点3和7连接次数为2和1,走过次数f为3、7,频率为0.3、0.7,此时Nn=2*0.3+1*0.7=1.3。
最终完成仿真后,所有motion、trail、route的权值将被更新,故而完成任务的各个子任务链路的总权值也会不同。
进一步地,所述动作motion,每个动作motion按顺序构成动作链路[motion],动作链路是机器人完成任务Task的动作序列,例如:打开柜子-拿出杯子-倒上水-离开,机器人完成任务需要执行一系列动作,每一个motion为一个机器人动作指令,且是最小单元,例如:抓、握、行动、停止等动作,每一个动作由唯一id作为标识,所有motion构成集合{motion},记录这些motion上下文数据库称为动作知识图谱。
本发明的优势和有益效果在于:
本发明基于知识图谱技术、机器人虚拟环境仿真技术、机器人控制论规划技术,通过使用虚拟仿真环境仿真演绎,修正经过计算知识图谱得出的错误的任务规划,让实体机器人在真实环境中获得正确的任务规划,解决了单一使用知识图谱进行机器人任务规划的不足,在机器人执行错误规划之前,先行将知识图谱进行修复。
附图说明
图1是本发明的方法原理图。
图2是本发明中任务构成示意图。
图3是本发明中知识图谱结构示意图。
图4是本发明中知识图谱进行机器人作业任务划分流程图。
图5是本发明中知识图谱修正的流程图。
图6是本发明中仿真链路示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
基于仿真演绎修正知识图谱的方法,包括如下步骤:
如图1所示,首先我们建立机器人仿真环境,建立周边场景的数字仿真环境,其环境受到现实世界物理定律约束,记作Env,机器人仿真将在Env中进行。基于机器人物理和模型特征,在仿真环境中同样构建出对应的机器人模型,包括机器人的运动行走部件,机器人抓取关节等,记作Sim-Robot。与此对应的真实机器人记作Real_Robot。
机器人进行任务作业时会依次执行各个子任务,执行的各个子任务记作Task-c,机器人完成一个任务的一系列行为记作{Task-c}集合。每一个子任务Task-c,都可以被分解为动作motion,轨迹trail和路径route,且每一个Task-c都可以操作一个物件记作obj。机器人作业任务记作Task,由若干的子任务Task-c组成。该过程如图2所示。
如图3所示,对于一个任务Task,主体机器人记为real-robot,完成任务的行为队列记作{Task-c},操作的物件为obj,那么一个任务被定义为{robo,obj,Task-c},因为实现task的行为队列不是唯一的,知识图谱根据Task-c与obj的对应关系,生成所有可能操作物件obj的行为,这种一一对应的关系记作{obj,Task-c},该组合由知识图谱生成,并将推理出实现该任务task的全部行为路径。使用全部Task-c构建知识图谱,其中图谱的每个节点记为一个Task-c,节点之间的边表示子任务之间构成主任务Task的权重,分别构建motion、trail、route知识图谱,Task-c中被分解出的motion、trail、route分别指向对应的图谱。在知识图谱中,定义可操作性的物件为obj,在环境中全部可以操作的物件构成集合,记作{obj}。因此,我们有{Task-c}{motion}{trail}{route}{obj}五个知识图谱,其中{obj}图谱不需要更新。
在仿真环境中,模拟机器人,记作Sim-Robot,机器人具备刚体物理特征,具备多自由度机械臂,运动导航能力。设计Robot-sim虚拟机器人的各个运动关节,捕捉机器人运动轨迹,作为机器人基准轨迹trail;记录虚拟机器人Sim-Robot的行径轨迹,轨迹记作route;机器人执行一个动作,记作motion,完成任务中,执行的每个动作按照顺序用作链路,记作[motion]。
对于机器人的任意一次子任务Task-c,是trail、route、motion的组合,我们记作任务Task-c{trail,route,motion};知识图谱中,对于执行task的trail、route、motion,是未知的,我们要通过仿真进行推导,得出能够实现任务的路径方法。
知识库中,已有全部可执行的动作集合{motion}-all,具有全部可规划的路径集合{route}-all,现有规划出的全部轨迹路径为{trail}-all。由此,根据知识图谱,完成任务Task所需的动作、轨迹、规划有多种组合类型,其中每一种组合类型都是{motion}-all、{route}-all、{trail}-all中的一个子集,由该子集形成能够实现Task-c任务的组合,记作{Task-c-r},如图4所示。
针对{Task-c-r}中的任何一个任务组合,不能保证Task-c-r一定能在真实机器人实体上完成任务Task-c。因此,对仿真环境下发{Task-c-r}数据集合,使其使用该集合中所有的Task-c-r任务组合来尝试,观测是否能够完成任务。
如图5所示,在仿真器中,同时运行多个仿真实例,其中每一个实例使用{Task-c-r}集合中的一个任务规划Task-c-r。对于每一个任务规划Task-c-r,在仿真实例中运行,观察模拟机器人在仿真环境中的运行结果。对于运行结果,记录两个事实:机器人是否能成功完成任务,机器人在完成任务的前提下,需要的时间均值。对于能够完成任务的规划Task-c-r,有与之对应的{motion,trail,route},并附加完成任务规划的均值时间delta-time;设计算法更新{motion,trail,route},更新实现该任务规划中motion、trail、route知识图谱中节点的边的权值;对于不能完成任务的规划Task-c-r,有与之对应的{motion,trail,route},在知识图谱中去除节点间的边关联。
通过上述步骤,我们得到更新后的知识图谱,包含更新后的动作图谱motion、轨迹图谱trail、实现路径图谱route、更新后的子任务图谱task-c。使用更新后的知识图谱,按照在仿真环境下的规划方案,获得最佳机器人任务规划,并下发到现实场景中的机器人进行任务作业。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (4)
1.一种基于仿真演绎的知识图谱修正方法,其特征在于包括如下步骤:
S1,构建仿真环境、仿真机器人,包括如下步骤:
S11,基于机器人环境,建立周边场景的仿真环境Env;
S12,基于机器人物理和模型特征,在机器人仿真环境中构建出对应的仿真机器人Sim-Robot;
S13,机器人作业任务记作Task;
S14,机器人运行时,执行的各个子任务记作Task-c,完成任务Task的一系列子任务,记作{Task-c}集合;
S15,子任务Task-c,包括一组行为,行为包括动作motion、轨迹trail和路径route,且Task-c对应操作物件记作obj;
S2,构建机器人知识图谱,知识图谱包括构成任务的各节点和表示节点间权值的边,包括如下步骤:
S21,定义任务Task为{robo,obj,{Task-c}},robo表示真实机器人Real-robot,obj表示真实机器人操作的物件,{Task-c}表示完成任务Task的行为队列;
S22,根据子任务Task-c与操作物件obj的对应关系{obj,Task-c},生成所有操作物件obj的行为,得到实现任务Task的全部行为路径;
S23,使用子任务Task-c构建任务知识图谱,其中任务知识图谱的每个子任务记为一个Task-c节点,节点之间的边,表示Task-c节点之间构成任务Task的任务权值;
S24,根据行为构建行为知识图谱,其中行为知识图谱的每个子行为记为一个子行为节点,节点之间的边,表示子行为构成任务Task的行为的行为权值,子任务Task-c中被分解出的一组行为分别指向该行为对应的知识图谱;
S25,在知识图谱中,定义操作物件obj,全部可以操作的物件构成集合{obj};
S3,构建机器人仿真任务集合,进行仿真推导,得出能够完成任务的行为路径,知识图谱中,通过仿真进行推导,得出能够实现任务Task的行为路径,包括如下步骤:
S361,定义全部可执行的行为集合;
S362,根据知识图谱,完成任务Task所需的行为组合,即行为集合的子集,由该子集形成能够实现各子任务Task-c的组合,记作{Task-c-r};
S363,对仿真环境Env下发{Task-c-r}数据集合,使其使用该集合中所有的Task-c-r任务组合进行尝试,观测是否能够完成任务Task;
S4,展开机器人仿真,根据能够完成任务的行为路径,修正知识图谱的权值,包括如下步骤:
S41,运行仿真实例,使用{Task-c-r}集合中的任务规划Task-c-r;
S42,观察仿真机器人Sim-Robot在仿真环境Env中的运行结果;
S43,获取仿真机器人Sim-Robot是否能成功完成任务Task,以及机器人在完成任务Task的前提下需要的时间均值;
S44,对于能够完成任务Task的任务规划Task-c-r,获取其对应的行为路径,及时间均值delta-time,通过时间均值delta-time更新任务知识图谱中Task-c节点间的边;设计算法,更新该行为在行为知识图谱中子行为节点间的边;任务知识图谱的权值更新包括如下步骤:
S441,将各个子节点的边的权值设置为初始值:
Tmax=∑Troute+∑Tmotion+∑Ttrail
其中,Tmax表示最大行为执行时间,T包括Troute、Tmotion和Ttrail中的一个或多个,∑Troute表示完成动作路径route所需要的时间Troute的总和,∑Tmotion表示完成动作motion所需的时间Tmotion的总和,∑Ttrail表示完成轨迹trail所需的时间Ttrail的总和;
S442,对于所有可能的链路,取最大时延作为基准:
Delayi=Ti trail+Ti route+Ti motion
Ave=Max(Delayi)
一个节点i需要的时延就为:
其中,Ni表示节点i被连接的次数,Weight表示任务节点的边的权值;
当链路不能执行时,删除对应节点之间的边,对应链路上所有节点增加基于丢失节点的权值Weight:
当链路能够确定时,更新权值:
Nn=∑(frequency*Ni)
Weightnew=Weightold+Nn*Ave
其中,Nn表示统计计数因子,frequency表示该节点被不同子任务Task-c走过的频率,Ni表示该节点i被连接的次数;
S45,对于不能完成任务Task的规划Task-c-r,将其对应的行为路径,在知识图谱中,删除节点间的边关联;
S46,使用更新后的知识图谱,按仿真环境Env下的规划方案,获得最佳机器人任务规划,并下发至真实机器人Real-robot进行任务作业。
2.根据权利要求1所述的一种基于仿真演绎的知识图谱修正方法,其特征在于所述S44中,当有多种任务规划Task-c-r都能完成任务Task时,取时间均值delta-time最小的任务规划Task-c-r,增加任务规划Task-c-r对应的各Task-c节点间的任务权值。
3.根据权利要求1所述的一种基于仿真演绎的知识图谱修正方法,其特征在于所述S44中行为知识图谱的权值更新如下:
对于动作motion:
其中,Tmotion表示完成动作motion所需的时间总和;
对于轨迹trail:
其中,Ttrail表示完成轨迹trail所需的时间总和;
对于路径route:
对于不能形成连通链路的路径route,权值为0,能够连通的路径route,权值为连通所有Task-c的权值总和,L表示连通节点数。
4.根据权利要求1所述的一种基于仿真演绎的知识图谱修正方法,其特征在于所述动作motion,每个动作motion按顺序构成动作链路[motion],动作链路是机器人完成任务Task的动作序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110729002.4A CN113568324B (zh) | 2021-06-29 | 2021-06-29 | 一种基于仿真演绎的知识图谱修正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110729002.4A CN113568324B (zh) | 2021-06-29 | 2021-06-29 | 一种基于仿真演绎的知识图谱修正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113568324A CN113568324A (zh) | 2021-10-29 |
CN113568324B true CN113568324B (zh) | 2023-10-20 |
Family
ID=78163047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110729002.4A Active CN113568324B (zh) | 2021-06-29 | 2021-06-29 | 一种基于仿真演绎的知识图谱修正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113568324B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114055451B (zh) * | 2021-11-24 | 2023-07-07 | 深圳大学 | 基于知识图谱的机器人操作技能表达方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3407151A1 (en) * | 2017-05-24 | 2018-11-28 | Tata Consultancy Services Limited | Systems and methods for cognitive control of data acquisition for efficient fault diagnosis |
WO2019134110A1 (en) * | 2018-01-05 | 2019-07-11 | Driving Brain International Ltd. | Autonomous driving methods and systems |
CN110288160A (zh) * | 2019-06-27 | 2019-09-27 | 北京华如科技股份有限公司 | 一种基于平行仿真的态势动态预测方法 |
WO2020056984A1 (zh) * | 2018-09-19 | 2020-03-26 | 平安科技(深圳)有限公司 | 最短路径查询方法、系统、计算机设备和存储介质 |
CN111737492A (zh) * | 2020-06-23 | 2020-10-02 | 安徽大学 | 一种基于知识图谱技术的自主机器人任务规划方法 |
CN112231489A (zh) * | 2020-10-19 | 2021-01-15 | 中国科学技术大学 | 防疫机器人知识学习与迁移方法和系统 |
CN112356027A (zh) * | 2020-10-29 | 2021-02-12 | 久瓴(上海)智能科技有限公司 | 农林机器人避障方法、装置、计算机设备和存储介质 |
CN112462756A (zh) * | 2020-10-29 | 2021-03-09 | 久瓴(上海)智能科技有限公司 | 农林作业任务生成方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020055910A1 (en) * | 2018-09-10 | 2020-03-19 | Drisk, Inc. | Systems and methods for graph-based ai training |
-
2021
- 2021-06-29 CN CN202110729002.4A patent/CN113568324B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3407151A1 (en) * | 2017-05-24 | 2018-11-28 | Tata Consultancy Services Limited | Systems and methods for cognitive control of data acquisition for efficient fault diagnosis |
WO2019134110A1 (en) * | 2018-01-05 | 2019-07-11 | Driving Brain International Ltd. | Autonomous driving methods and systems |
WO2020056984A1 (zh) * | 2018-09-19 | 2020-03-26 | 平安科技(深圳)有限公司 | 最短路径查询方法、系统、计算机设备和存储介质 |
CN110288160A (zh) * | 2019-06-27 | 2019-09-27 | 北京华如科技股份有限公司 | 一种基于平行仿真的态势动态预测方法 |
CN111737492A (zh) * | 2020-06-23 | 2020-10-02 | 安徽大学 | 一种基于知识图谱技术的自主机器人任务规划方法 |
CN112231489A (zh) * | 2020-10-19 | 2021-01-15 | 中国科学技术大学 | 防疫机器人知识学习与迁移方法和系统 |
CN112356027A (zh) * | 2020-10-29 | 2021-02-12 | 久瓴(上海)智能科技有限公司 | 农林机器人避障方法、装置、计算机设备和存储介质 |
CN112462756A (zh) * | 2020-10-29 | 2021-03-09 | 久瓴(上海)智能科技有限公司 | 农林作业任务生成方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
人工智能和知识图谱在无人机智能作战中的应用;石文君;刘万锁;;红外(08);第46-50页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113568324A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109039942B (zh) | 一种基于深度强化学习的网络负载均衡系统及均衡方法 | |
CN112615379B (zh) | 基于分布式多智能体强化学习的电网多断面功率控制方法 | |
Gangwani et al. | State-only imitation with transition dynamics mismatch | |
CN111856925B (zh) | 基于状态轨迹的对抗式模仿学习方法及装置 | |
CN111898728A (zh) | 一种基于多Agent强化学习的团队机器人决策方法 | |
CN113568324B (zh) | 一种基于仿真演绎的知识图谱修正方法 | |
WO2022028926A1 (en) | Offline simulation-to-reality transfer for reinforcement learning | |
CN111324358B (zh) | 一种用于信息系统自动运维策略的训练方法 | |
WO2018143019A1 (ja) | 情報処理装置、情報処理方法およびプログラム記録媒体 | |
CN108255059B (zh) | 一种基于模拟器训练的机器人控制方法 | |
CN115793657B (zh) | 基于时态逻辑控制策略的配送机器人路径规划方法 | |
CN110175942B (zh) | 一种基于学习依赖关系的学习序列生成方法 | |
CN114492052A (zh) | 一种全局流级别网络仿真方法、系统及装置 | |
CN114201885A (zh) | 基于改进行为树的兵力实体行为仿真元建模方法及系统 | |
CN109472342B (zh) | 一种自优化的仿生自修复硬件故障重构机制设计 | |
CN116663637A (zh) | 一种多层级智能体同步嵌套训练方法 | |
Losch et al. | Visual programming and development of manufacturing processes based on hierarchical Petri nets | |
Nguyen et al. | Apprenticeship bootstrapping | |
Vale et al. | A machine learning-based approach to accelerating computational design synthesis | |
CN114036835A (zh) | 一种在轨加注操作技能训练虚拟仿真方法及系统 | |
CN115225465B (zh) | 一种基于改进鸽群算法的网络恢复方法 | |
CN111950691A (zh) | 一种基于潜在动作表示空间的强化学习策略学习方法 | |
Maheswaran et al. | Human-agent collaborative optimization of real-time distributed dynamic multi-agent coordination | |
Bischoff et al. | Towards interactive coordination of heterogeneous robotic teams–Introduction of a reoptimization framework | |
CN109472363B (zh) | 可解释性竞争对手建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |