CN116079745A - 基于几何感知与节律动态运动基元的人机技能迁移方法 - Google Patents

基于几何感知与节律动态运动基元的人机技能迁移方法 Download PDF

Info

Publication number
CN116079745A
CN116079745A CN202310309634.4A CN202310309634A CN116079745A CN 116079745 A CN116079745 A CN 116079745A CN 202310309634 A CN202310309634 A CN 202310309634A CN 116079745 A CN116079745 A CN 116079745A
Authority
CN
China
Prior art keywords
matrix
robot
skill
stiffness
dynamic motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310309634.4A
Other languages
English (en)
Inventor
李俊阳
刘程果
宋延奎
曾振威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202310309634.4A priority Critical patent/CN116079745A/zh
Publication of CN116079745A publication Critical patent/CN116079745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control

Abstract

本发明公开了一种基于几何感知与节律动态运动基元的人机技能迁移方法,包括:S1.构建机器人期望行为模型;S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。本发明能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。

Description

基于几何感知与节律动态运动基元的人机技能迁移方法
技术领域
本发明涉及共融机器人领域,具体涉及一种基于几何感知与节律动态运动基元的人机技能迁移方法。
背景技术
具备在高度非结构化的动态环境中,可靠执行指定任务的能力是将机器人带入人类日常生活的基础。此时,机器人需要准确地控制其在自由空间及物理交互过程中的运动,这就要求其能产生和适应运动、阻抗和/或力。因此,可利用人类的专业知识,通过将人类的技能传授给机器人来学会如何执行这样的任务。从人类演示中学习(LfD)作为一种将人的技能传授给机器人的便捷方式,得到了广泛的研究。该学习方法旨在从人类演示中提取相关的运动模式,并随后将这些模式应用于不同的情况。
动态运动基元(DMPs)作为一种广泛使用的LfD方法具有诸多有益的特性,如抗扰动的鲁棒性和适应新需求的能力。在这些动态环境中的许多任务需要可变阻抗,尤其在一些节律的操作任务中,如黑板擦拭、拉锯子和泵水等。然而,阻抗参数被封装在对称正定(SPD)矩阵中,由于传统的节律DMPs(Dynamic Movement Primitives)依赖于空间的欧几里德参数化,所以针对这些具有SPD矩阵流形结构的变阻抗技能参数不能直接使用,导致机器人无法稳定且平滑地学习到具备对称正定(SPD)矩阵流形结构的运动技能,因此,需要一种基于几何感知与节律动态运动基元的人机技能迁移方法,能够解决以上问题。
发明内容
有鉴于此,本发明的目的是克服现有技术中的缺陷,提供基于几何感知与节律动态运动基元的人机技能迁移方法,能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。
本发明的基于几何感知与节律动态运动基元的人机技能迁移方法,包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
进一步,根据如下公式确定机器人期望行为模型:
Figure BDA0004147962260000021
其中,M为质量矩阵,B为阻尼矩阵,K为刚度矩阵,Xd为机器人的期望位置,X为机器人的当前位置,
Figure BDA0004147962260000022
为机器人的当前速度,
Figure BDA0004147962260000023
为机器人的当前加速度,Fe为机器人外界的交互力。
进一步,所述步骤S2,具体包括:
S21.对机器人期望行为模型进行线性化处理,得到线性化模型:
Figure BDA0004147962260000024
其中,
Figure BDA0004147962260000025
S22.利用最小二乘法对线性化模型进行求解,得到每个时刻的刚度矩阵估计;
S23.引入优化模型对求解后的线性化模型进行优化处理,得到满足对称正定矩阵约束的刚度矩阵;所述优化模型为:
Figure BDA0004147962260000026
其中,
Figure BDA0004147962260000027
为估计后的刚度矩阵,
Figure BDA0004147962260000028
H是P的奇异值分解P=USVT的对称极性因子,U与V为酉矩阵,S为含奇异值的对角矩阵。
进一步,根据如下公式确定机器人技能学习模型:
Figure BDA0004147962260000031
其中,τ为运行频率Ω的倒数,
Figure BDA0004147962260000032
为刚度矩阵K的二阶导数,αy以及βy均为系统增益参数;Kg为目标对称正定矩阵,Kj为时刻tj对应的刚度矩阵,K1为初始刚度矩阵,
Figure BDA0004147962260000033
Figure BDA0004147962260000034
z为刚度矩阵K的一阶导数,vec(·)为一个使用Mandel符号将对称矩阵变换成向量的函数;
Figure BDA0004147962260000035
Ψi(φ)=exp(h(cos(Ψi(φ)-ci)-1));
其中,N为数据点总数,φ为相位;
Figure BDA0004147962260000036
为权重,r为调制周期信号,ci和h分别为基函数Ψi(φ)的中心与宽度。
进一步,根据如下式子对相位与频率τ进行估计:
Figure BDA0004147962260000037
Figure BDA0004147962260000038
其中,
Figure BDA0004147962260000039
为相位φ的一阶导数,
Figure BDA00041479622600000310
为频率Ω的一阶导数,Ω=1/τ,P是一个正定耦合常数,
Figure BDA00041479622600000311
是外部信号U和内部估计
Figure BDA00041479622600000312
之间的差异;
Figure BDA00041479622600000313
其中,M是傅里叶级数的个数,c为傅里叶级数的序列编号,
Figure BDA00041479622600000314
A以及B均为常数,η是学习率;
Figure BDA00041479622600000315
进一步,根据如下公式使得机器人对刚度轨迹进行模仿:
Figure BDA00041479622600000316
其中,
Figure BDA00041479622600000318
为机器人模仿的刚度矩阵,t表示当前时刻,δt为时间间隔,ExpK(t)(·)表示指数映射函数,K(t)为当前时刻的刚度矩阵,z(t)为当前时刻刚度矩阵的向量表示,
Figure BDA00041479622600000317
表示并行传输函数,K1为初始刚度矩阵,mat(·)为使用Mandel符号将向量变换成对称矩阵的函数,τ为运行频率Ω的倒数。
本发明的有益效果是:本发明公开的一种基于几何感知与节律动态运动基元的人机技能迁移方法,首先通过人类动觉教学时采集的力位特征参数,使用最小二乘算法辨识出示教阻抗模型,并通过SPD矩阵化处理将其标准化;其次考虑阻抗技能对称正定(SPD)矩阵流形结构的特殊性,基于黎曼流形测地线、对数/指数映射以及并行传输等方法将其融入到节律DMPs控制框架中,从而使得机器人能够简单、稳定、准确且平滑地学习变阻抗技能,实现人机技能的高效迁移。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的技能迁移方法原理示意图;
图2为本发明的两个SPD矩阵之间的测地线和欧氏路径之间的差异示意图;
图3为本发明的SPD流形
Figure BDA0004147962260000041
上的指数、对数映射和平行传输示意图;
图4为本发明的技能迁移方法得到的刚度轮廓与真实值之间的距离示意图;
图5为本发明提出的几何感知节律DMPs生成的一次与二次导数用于学习刚度椭球示意图;
图6为本发明的示教与再现的SPD刚度矩阵在嵌入圆锥切空间的表示示意图。
具体实施方式
以下结合说明书附图对本发明做出进一步的说明,如图所示:
本发明的基于几何感知与节律动态运动基元的人机技能迁移方法,包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
本发明针对阻抗等对称正定(SPD)矩阵流形结构的特殊性以及日常生活中节律运动技能(如黑板擦拭、拉锯子与泵水等)对特征参数学习的必要性,同时注意到传统节律动态运动基元对欧几里德空间参数的依赖性,形成了结合几何感知与节律动态运动基元的人机技能传递分析方法,使得机器人能更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能,对机器人技能学习方面的研究具有技术指导意义。
本实施例中,步骤S1中,操作人员进行动觉示教时,通过机器人阻抗控制对机器人末端执行器的期望行为进行建模,得到机器人期望行为模型:
Figure BDA0004147962260000051
其中,M,B和K分别是质量矩阵、阻尼矩阵与刚度矩阵,属于动力学参数;Xd是机器人的期望位置,
Figure BDA0004147962260000052
X分别是机器人的当前加速度、速度与位置,Fe为机器人外界的交互力。
本实施例中,步骤S2中,采用滑动窗口技术来实现每个时间步长满足上式(1)的局部刚度估计,长度为L的窗口沿着演示数据
Figure BDA0004147962260000053
X与Fe移动。定义窗口内的所有数据为
Figure BDA0004147962260000054
M与B均为预先定义的值,可得如下线性化模型:
Figure BDA0004147962260000055
利用最小二乘法求解上述线性化模型,在每个时刻进行刚度矩阵估计。但由于刚度矩阵
Figure BDA0004147962260000056
是对称正定(SPD)矩阵,这就意味着由最小二乘法求解后得出的只是一个不满足SPD约束的粗略估计。
因此,引入以下优化模型将上述计算出的近似结果转换为就近的SPD矩阵。所述优化模型为:
Figure BDA0004147962260000057
其中,
Figure BDA0004147962260000058
为估计后的刚度矩阵,
Figure BDA0004147962260000059
H是P的奇异值分解P=USVT的对称极性因子,U与V为酉矩阵,S为含奇异值的对角矩阵。
同时,由于一些近似矩阵可能在SPD矩阵空间的边界上,从而得到对称的半正定矩阵。在这种情况下,刚度矩阵估计
Figure BDA0004147962260000061
的每个特征值λi≈0被最小值下界约束,然后使用其特征值分解
Figure BDA0004147962260000062
来重构
Figure BDA0004147962260000063
其中,阻抗方程的阻尼项可通过实验或使用
Figure BDA0004147962260000064
的本征分解来选择,以保持系统的临界阻尼,如
Figure BDA0004147962260000065
其中,Q和Δ分别是
Figure BDA0004147962260000066
的本征向量和本征值,
Figure BDA0004147962260000067
是阻尼比。
本实施例中,步骤S3中,由于刚度矩阵
Figure BDA0004147962260000068
在加法和标量积下不是封闭的,所以不能被看作是向量空间,因此用经典的欧几里得空间方法来处理和分析这些矩阵是不够的。
构建基于几何感知与节律动态运动基元的机器人技能学习模型,具体包括:
将SPD矩阵与黎曼度量结合起来,使其形成黎曼流形,并定义了测地线度量,即流形上两点之间的最小长度曲线,如图2所示。
黎曼流形
Figure BDA0004147962260000069
是一个拓扑空间,它的每个点局部类似于欧氏空间。对于每个点
Figure BDA00041479622600000610
存在一个切空间
Figure BDA00041479622600000611
切空间中的度量是平坦的,允许使用经典算术工具,如图3所示。
对于SPD流形,任意点
Figure BDA00041479622600000612
处的切空间由对称矩阵空间SymD(D表示维度)来识别。SPD矩阵的空间可以表示为嵌入在切空间SymD中凸锥的内部。
指数映射ExpΣ
Figure BDA00041479622600000613
表示将切空间上的点L映射到流形上的点Λ。
对数映射LogΣ
Figure BDA00041479622600000614
表示将流形上的点Λ映射到切空间上的点L。且有如下式子:
Figure BDA00041479622600000615
Figure BDA00041479622600000616
并行传输ΓΣ→Λ
Figure BDA00041479622600000617
用于在切空间中移动元素使得两者之间夹角保持不变。且有如下式子:
Figure BDA00041479622600000618
其中,
Figure BDA00041479622600000619
Figure BDA00041479622600000620
Figure BDA00041479622600000621
定义
Figure BDA0004147962260000071
作为SPD矩阵的一个演示集。其中,j表示时刻,T表示总时刻。
其次,求解刚度矩阵K的一阶与二阶导数以代入节律动态运动基元模型。
一阶求导如下:
Figure BDA0004147962260000072
为避免对称性而造成的信息复制占用计算资源,采用Mandel表示法将数据降维为m=D+D(D-1)/2。
引入如下式子:
Figure BDA0004147962260000073
其中,vec(·)是一个使用Mandel符号将对称矩阵变换成向量的函数;
Figure BDA0004147962260000074
使用标准欧几里得工具直接计算二阶导数,其向量化表示为
Figure BDA0004147962260000075
进而得到数据集:
Figure BDA0004147962260000076
该数据集包括:每个时刻tj,tj对应的刚度矩阵Kj,以及刚度矩阵Kj的一阶与二阶导数zj
Figure BDA0004147962260000077
因此,结合几何感知与节律动态运动基元的机器人技能学习模型,表示如下所示:
Figure BDA0004147962260000078
其中,τ为运行频率Ω的倒数,
Figure BDA0004147962260000079
为刚度矩阵K的二阶导数,αy以及βy均为系统增益参数;
Figure BDA00041479622600000710
为目标对称正定矩阵,它通过数据集(所有矩阵K)的平均值获取;Kj为时刻tj对应的刚度矩阵,K1为初始刚度矩阵,
Figure BDA00041479622600000711
Figure BDA00041479622600000712
z为刚度矩阵K的一阶导数,vec(·)为一个使用Mandel符号将对称矩阵变换成向量的函数;
Figure BDA00041479622600000713
是强迫项,表示如下:
Figure BDA0004147962260000081
Ψi(φ)=exp(h(cos(Ψi(φ)-ci)-1))
其中,N为数据点总数,也即是数据集中数据总数,φ为相位;r用于调制周期信号(r=1时不对节律运动进行缩放)。ci和h为基函数Ψi(φ)的中心与宽度。其中,ci在[0,2π]中均匀分布,h设置为2.5倍基函数数量。权重
Figure BDA00041479622600000813
采用局部加权回归学习可得。
相位φ与频率Ω被自适应振荡器估计,具体表达如下所示:
Figure BDA0004147962260000082
Figure BDA0004147962260000083
其中,
Figure BDA0004147962260000084
为相位φ的一阶导数,
Figure BDA0004147962260000085
为频率Ω的一阶导数,Ω=1/τ,P是一个正定耦合常数,
Figure BDA0004147962260000086
是外部信号U和其内部估计
Figure BDA0004147962260000087
之间的差异,由傅里叶级数构建。本实施例中,所述U为输入的刚度矩阵K。
Figure BDA0004147962260000088
其中,M是傅里叶级数的个数,c为傅里叶级数的序列编号,
Figure BDA0004147962260000089
A以及B均为常数,具体地:
Figure BDA00041479622600000810
傅里叶数列参数的学习方法如下:
Figure BDA00041479622600000811
Figure BDA00041479622600000812
其中,η是学习率。自适应振荡器是实时推断周期性状态(相位和频率)的最有用方法。然而,当记录的信号频率是可变的,它们对于离线学习也是有用的。如图6所示,虚线表示再现的SPD刚度矩阵在嵌入圆锥切空间的表示,实线表示示教的SPD刚度矩阵在嵌入圆锥切空间的表示。
本实施例中,步骤S4中,利用构建的机器人技能学习模型,使得机器人对估计后的刚度矩阵进行学习,实现对刚度轨迹的复现。
在复现阶段,根据如下公式使得机器人对刚度轨迹进行模仿,从而获得模仿的刚度轨迹:
Figure BDA0004147962260000091
其中,mat(·)是vec(·)的逆,也即是使用Mandel符号将向量变换成对称矩阵的函数,表示使用Mandel符号的矩阵化。
Figure BDA0004147962260000092
为机器人模仿的刚度矩阵,t表示当前时刻,δt为时间间隔,ExpK(t)(·)表示指数映射函数,K(t)为当前时刻的刚度矩阵,z(t)为当前时刻刚度矩阵的向量表示,
Figure BDA0004147962260000093
表示并行传输函数,K1为初始刚度矩阵,
Figure BDA0004147962260000094
代表了新的基于SPD矩阵的机器人阻抗技能。
本发明针对日常生活中变阻抗技能学习的必要性,首先通过最小二乘算法设计具备对称正定(SPD)矩阵流形结构的阻抗模型辨识策略;然后结合黎曼流形与节律动态运动基元形成几何感知的人机技能传递方法,填补了目前机器人在对称正定(SPD)矩阵流形结构的变阻抗技能学习方面的空白,同时基于动态运动基元算法,能够与传统位置、姿态动态运动基元融合形成统一技能表达,也可推广到可操作性等技能学习方面,在实际工作及未来发展中具有重要的技术指导意义。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
2.根据权利要求1所述的基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:根据如下公式确定机器人期望行为模型:
Figure FDA0004147962230000011
其中,M为质量矩阵,B为阻尼矩阵,K为刚度矩阵,Xd为机器人的期望位置,X为机器人的当前位置,
Figure FDA0004147962230000012
为机器人的当前速度,
Figure FDA0004147962230000013
为机器人的当前加速度,Fe为机器人外界的交互力。
3.根据权利要求2所述的基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:所述步骤S2,具体包括:
S21.对机器人期望行为模型进行线性化处理,得到线性化模型:
Figure FDA0004147962230000014
其中,
Figure FDA0004147962230000015
S22.利用最小二乘法对线性化模型进行求解,得到每个时刻的刚度矩阵估计;
S23.引入优化模型对求解后的线性化模型进行优化处理,得到满足对称正定矩阵约束的刚度矩阵;所述优化模型为:
Figure FDA0004147962230000016
其中,
Figure FDA0004147962230000017
为估计后的刚度矩阵,
Figure FDA0004147962230000018
H是P的奇异值分解P=USVT的对称极性因子,U与V为酉矩阵,S为含奇异值的对角矩阵。
4.根据权利要求1所述的基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:根据如下公式确定机器人技能学习模型:
Figure FDA0004147962230000021
其中,τ为运行频率Ω的倒数,
Figure FDA0004147962230000022
为刚度矩阵K的二阶导数,αy以及βy均为系统增益参数;Kg为目标对称正定矩阵,Kj为时刻tj对应的刚度矩阵,K1为初始刚度矩阵,
Figure FDA0004147962230000023
Figure FDA0004147962230000024
z为刚度矩阵K的一阶导数,vec(·)为一个使用Mandel符号将对称矩阵变换成向量的函数;
Figure FDA0004147962230000025
Ψi(φ)=exp(h(cos(Ψi(φ)-ci)-1));
其中,N为数据点总数,φ为相位;
Figure FDA00041479622300000215
为权重,r为调制周期信号,ci和h分别为基函数Ψi(φ)的中心与宽度。
5.根据权利要求4所述的基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:根据如下式子对相位与频率τ进行估计:
Figure FDA0004147962230000026
Figure FDA0004147962230000027
其中,
Figure FDA0004147962230000028
为相位φ的一阶导数,
Figure FDA0004147962230000029
为频率Ω的一阶导数,Ω=1/τ,P是一个正定耦合常数,
Figure FDA00041479622300000210
是外部信号U和内部估计
Figure FDA00041479622300000211
之间的差异;
Figure FDA00041479622300000212
其中,M是傅里叶级数的个数,c为傅里叶级数的序列编号,
Figure FDA00041479622300000213
A以及B均为常数,η是学习率;
Figure FDA00041479622300000214
6.根据权利要求1所述的基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:根据如下公式使得机器人对刚度轨迹进行模仿:
Figure FDA0004147962230000031
其中,
Figure FDA0004147962230000032
为机器人模仿的刚度矩阵,t表示当前时刻,δt为时间间隔,ExpK(t)(·)表示指数映射函数,K(t)为当前时刻的刚度矩阵,z(t)为当前时刻刚度矩阵的向量表示,
Figure FDA0004147962230000033
表示并行传输函数,K1为初始刚度矩阵,mat(·)为使用Mandel符号将向量变换成对称矩阵的函数,τ为运行频率Ω的倒数。
CN202310309634.4A 2023-03-27 2023-03-27 基于几何感知与节律动态运动基元的人机技能迁移方法 Pending CN116079745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310309634.4A CN116079745A (zh) 2023-03-27 2023-03-27 基于几何感知与节律动态运动基元的人机技能迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310309634.4A CN116079745A (zh) 2023-03-27 2023-03-27 基于几何感知与节律动态运动基元的人机技能迁移方法

Publications (1)

Publication Number Publication Date
CN116079745A true CN116079745A (zh) 2023-05-09

Family

ID=86206747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310309634.4A Pending CN116079745A (zh) 2023-03-27 2023-03-27 基于几何感知与节律动态运动基元的人机技能迁移方法

Country Status (1)

Country Link
CN (1) CN116079745A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116476081A (zh) * 2023-06-21 2023-07-25 广东省科学院智能制造研究所 一种机器人节律性技能学习方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116476081A (zh) * 2023-06-21 2023-07-25 广东省科学院智能制造研究所 一种机器人节律性技能学习方法及系统
CN116476081B (zh) * 2023-06-21 2023-09-15 广东省科学院智能制造研究所 一种机器人节律性技能学习方法及系统

Similar Documents

Publication Publication Date Title
Yang et al. Robot learning system based on adaptive neural control and dynamic movement primitives
Levine et al. Variational policy search via trajectory optimization
Sun et al. Adaptive tracking control of wheeled inverted pendulums with periodic disturbances
Mahadevan Proto-value functions: Developmental reinforcement learning
Hsu et al. Intelligent robot deburring using adaptive fuzzy hybrid position/force control
Vincent et al. Reachable polyhedral marching (rpm): A safety verification algorithm for robotic systems with deep neural network components
CN110561421B (zh) 机械臂间接拖动示教方法及装置
CN116079745A (zh) 基于几何感知与节律动态运动基元的人机技能迁移方法
JP7058202B2 (ja) 情報処理方法及び情報処理システム
Fan et al. Real-time grasp planning for multi-fingered hands by finger splitting
Fanger et al. Gaussian processes for dynamic movement primitives with application in knowledge-based cooperation
Shetab-Bushehri et al. Lattice-based shape tracking and servoing of elastic objects
Che et al. Multi-fidelity modeling in sequential design for stability identification in dynamic time-delay systems
Pan et al. Data-driven differential dynamic programming using gaussian processes
Li et al. Enhanced task parameterized dynamic movement primitives by GMM to solve manipulation tasks
Yashchuk Bringing PDEs to JAX with forward and reverse modes automatic differentiation
Vincent et al. Reachable polyhedral marching (rpm): An exact analysis tool for deep-learned control systems
Precup et al. A survey on fuzzy control for mechatronics applications
Heiden et al. Inferring articulated rigid body dynamics from rgbd video
Ramadorai et al. On modeling and adaptive control of underwater robots
WO2022257185A1 (zh) 一种基于人工神经网络的机器人外界接触力估计方法
Jurado et al. Continuous-time neural identification for a 2 DOF vertical robot manipulator
Cheah et al. Convergence and robustness of a discrete‐time learning control scheme for constrained manipulators
Wu et al. Infer and adapt: Bipedal locomotion reward learning from demonstrations via inverse reinforcement learning
Völlinger et al. Evolutionary optimization of mass-spring models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination