CN116079745A - 基于几何感知与节律动态运动基元的人机技能迁移方法 - Google Patents
基于几何感知与节律动态运动基元的人机技能迁移方法 Download PDFInfo
- Publication number
- CN116079745A CN116079745A CN202310309634.4A CN202310309634A CN116079745A CN 116079745 A CN116079745 A CN 116079745A CN 202310309634 A CN202310309634 A CN 202310309634A CN 116079745 A CN116079745 A CN 116079745A
- Authority
- CN
- China
- Prior art keywords
- matrix
- robot
- skill
- stiffness
- dynamic motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000033001 locomotion Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000001020 rhythmical effect Effects 0.000 title claims abstract description 21
- 230000005012 migration Effects 0.000 title claims abstract description 17
- 238000013508 migration Methods 0.000 title claims abstract description 17
- 230000008447 perception Effects 0.000 title claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 99
- 230000006399 behavior Effects 0.000 claims abstract description 14
- 230000033764 rhythmic process Effects 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 11
- 244000144725 Amygdalus communis Species 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 9
- 238000013016 damping Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 230000003278 mimic effect Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000024159 perception of rate of movement Effects 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
Abstract
本发明公开了一种基于几何感知与节律动态运动基元的人机技能迁移方法,包括:S1.构建机器人期望行为模型;S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。本发明能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。
Description
技术领域
本发明涉及共融机器人领域,具体涉及一种基于几何感知与节律动态运动基元的人机技能迁移方法。
背景技术
具备在高度非结构化的动态环境中,可靠执行指定任务的能力是将机器人带入人类日常生活的基础。此时,机器人需要准确地控制其在自由空间及物理交互过程中的运动,这就要求其能产生和适应运动、阻抗和/或力。因此,可利用人类的专业知识,通过将人类的技能传授给机器人来学会如何执行这样的任务。从人类演示中学习(LfD)作为一种将人的技能传授给机器人的便捷方式,得到了广泛的研究。该学习方法旨在从人类演示中提取相关的运动模式,并随后将这些模式应用于不同的情况。
动态运动基元(DMPs)作为一种广泛使用的LfD方法具有诸多有益的特性,如抗扰动的鲁棒性和适应新需求的能力。在这些动态环境中的许多任务需要可变阻抗,尤其在一些节律的操作任务中,如黑板擦拭、拉锯子和泵水等。然而,阻抗参数被封装在对称正定(SPD)矩阵中,由于传统的节律DMPs(Dynamic Movement Primitives)依赖于空间的欧几里德参数化,所以针对这些具有SPD矩阵流形结构的变阻抗技能参数不能直接使用,导致机器人无法稳定且平滑地学习到具备对称正定(SPD)矩阵流形结构的运动技能,因此,需要一种基于几何感知与节律动态运动基元的人机技能迁移方法,能够解决以上问题。
发明内容
有鉴于此,本发明的目的是克服现有技术中的缺陷,提供基于几何感知与节律动态运动基元的人机技能迁移方法,能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。
本发明的基于几何感知与节律动态运动基元的人机技能迁移方法,包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
进一步,根据如下公式确定机器人期望行为模型:
进一步,所述步骤S2,具体包括:
S21.对机器人期望行为模型进行线性化处理,得到线性化模型:
S22.利用最小二乘法对线性化模型进行求解,得到每个时刻的刚度矩阵估计;
S23.引入优化模型对求解后的线性化模型进行优化处理,得到满足对称正定矩阵约束的刚度矩阵;所述优化模型为:
进一步,根据如下公式确定机器人技能学习模型:
Ψi(φ)=exp(h(cos(Ψi(φ)-ci)-1));
进一步,根据如下式子对相位与频率τ进行估计:
其中,M是傅里叶级数的个数,c为傅里叶级数的序列编号,
进一步,根据如下公式使得机器人对刚度轨迹进行模仿:
其中,为机器人模仿的刚度矩阵,t表示当前时刻,δt为时间间隔,ExpK(t)(·)表示指数映射函数,K(t)为当前时刻的刚度矩阵,z(t)为当前时刻刚度矩阵的向量表示,表示并行传输函数,K1为初始刚度矩阵,mat(·)为使用Mandel符号将向量变换成对称矩阵的函数,τ为运行频率Ω的倒数。
本发明的有益效果是:本发明公开的一种基于几何感知与节律动态运动基元的人机技能迁移方法,首先通过人类动觉教学时采集的力位特征参数,使用最小二乘算法辨识出示教阻抗模型,并通过SPD矩阵化处理将其标准化;其次考虑阻抗技能对称正定(SPD)矩阵流形结构的特殊性,基于黎曼流形测地线、对数/指数映射以及并行传输等方法将其融入到节律DMPs控制框架中,从而使得机器人能够简单、稳定、准确且平滑地学习变阻抗技能,实现人机技能的高效迁移。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的技能迁移方法原理示意图;
图2为本发明的两个SPD矩阵之间的测地线和欧氏路径之间的差异示意图;
图4为本发明的技能迁移方法得到的刚度轮廓与真实值之间的距离示意图;
图5为本发明提出的几何感知节律DMPs生成的一次与二次导数用于学习刚度椭球示意图;
图6为本发明的示教与再现的SPD刚度矩阵在嵌入圆锥切空间的表示示意图。
具体实施方式
以下结合说明书附图对本发明做出进一步的说明,如图所示:
本发明的基于几何感知与节律动态运动基元的人机技能迁移方法,包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
本发明针对阻抗等对称正定(SPD)矩阵流形结构的特殊性以及日常生活中节律运动技能(如黑板擦拭、拉锯子与泵水等)对特征参数学习的必要性,同时注意到传统节律动态运动基元对欧几里德空间参数的依赖性,形成了结合几何感知与节律动态运动基元的人机技能传递分析方法,使得机器人能更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能,对机器人技能学习方面的研究具有技术指导意义。
本实施例中,步骤S1中,操作人员进行动觉示教时,通过机器人阻抗控制对机器人末端执行器的期望行为进行建模,得到机器人期望行为模型:
因此,引入以下优化模型将上述计算出的近似结果转换为就近的SPD矩阵。所述优化模型为:
同时,由于一些近似矩阵可能在SPD矩阵空间的边界上,从而得到对称的半正定矩阵。在这种情况下,刚度矩阵估计的每个特征值λi≈0被最小值下界约束,然后使用其特征值分解来重构其中,阻抗方程的阻尼项可通过实验或使用的本征分解来选择,以保持系统的临界阻尼,如其中,Q和Δ分别是的本征向量和本征值,是阻尼比。
构建基于几何感知与节律动态运动基元的机器人技能学习模型,具体包括:
将SPD矩阵与黎曼度量结合起来,使其形成黎曼流形,并定义了测地线度量,即流形上两点之间的最小长度曲线,如图2所示。
其次,求解刚度矩阵K的一阶与二阶导数以代入节律动态运动基元模型。
一阶求导如下:
为避免对称性而造成的信息复制占用计算资源,采用Mandel表示法将数据降维为m=D+D(D-1)/2。
引入如下式子:
其中,vec(·)是一个使用Mandel符号将对称矩阵变换成向量的函数;
因此,结合几何感知与节律动态运动基元的机器人技能学习模型,表示如下所示:
Ψi(φ)=exp(h(cos(Ψi(φ)-ci)-1))
其中,N为数据点总数,也即是数据集中数据总数,φ为相位;r用于调制周期信号(r=1时不对节律运动进行缩放)。ci和h为基函数Ψi(φ)的中心与宽度。其中,ci在[0,2π]中均匀分布,h设置为2.5倍基函数数量。权重采用局部加权回归学习可得。
相位φ与频率Ω被自适应振荡器估计,具体表达如下所示:
其中,M是傅里叶级数的个数,c为傅里叶级数的序列编号,
傅里叶数列参数的学习方法如下:
其中,η是学习率。自适应振荡器是实时推断周期性状态(相位和频率)的最有用方法。然而,当记录的信号频率是可变的,它们对于离线学习也是有用的。如图6所示,虚线表示再现的SPD刚度矩阵在嵌入圆锥切空间的表示,实线表示示教的SPD刚度矩阵在嵌入圆锥切空间的表示。
本实施例中,步骤S4中,利用构建的机器人技能学习模型,使得机器人对估计后的刚度矩阵进行学习,实现对刚度轨迹的复现。
在复现阶段,根据如下公式使得机器人对刚度轨迹进行模仿,从而获得模仿的刚度轨迹:
其中,mat(·)是vec(·)的逆,也即是使用Mandel符号将向量变换成对称矩阵的函数,表示使用Mandel符号的矩阵化。为机器人模仿的刚度矩阵,t表示当前时刻,δt为时间间隔,ExpK(t)(·)表示指数映射函数,K(t)为当前时刻的刚度矩阵,z(t)为当前时刻刚度矩阵的向量表示,表示并行传输函数,K1为初始刚度矩阵,代表了新的基于SPD矩阵的机器人阻抗技能。
本发明针对日常生活中变阻抗技能学习的必要性,首先通过最小二乘算法设计具备对称正定(SPD)矩阵流形结构的阻抗模型辨识策略;然后结合黎曼流形与节律动态运动基元形成几何感知的人机技能传递方法,填补了目前机器人在对称正定(SPD)矩阵流形结构的变阻抗技能学习方面的空白,同时基于动态运动基元算法,能够与传统位置、姿态动态运动基元融合形成统一技能表达,也可推广到可操作性等技能学习方面,在实际工作及未来发展中具有重要的技术指导意义。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于几何感知与节律动态运动基元的人机技能迁移方法,其特征在于:包括如下步骤:
S1.构建机器人期望行为模型;
S2.基于机器人期望行为模型进行刚度矩阵估计,得到估计后的刚度矩阵;
S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型;
S4.将估计后的刚度矩阵输入到机器人技能学习模型,使得机器人对刚度轨迹进行模仿,实现刚度轨迹的复现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310309634.4A CN116079745A (zh) | 2023-03-27 | 2023-03-27 | 基于几何感知与节律动态运动基元的人机技能迁移方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310309634.4A CN116079745A (zh) | 2023-03-27 | 2023-03-27 | 基于几何感知与节律动态运动基元的人机技能迁移方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116079745A true CN116079745A (zh) | 2023-05-09 |
Family
ID=86206747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310309634.4A Pending CN116079745A (zh) | 2023-03-27 | 2023-03-27 | 基于几何感知与节律动态运动基元的人机技能迁移方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116079745A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116476081A (zh) * | 2023-06-21 | 2023-07-25 | 广东省科学院智能制造研究所 | 一种机器人节律性技能学习方法及系统 |
-
2023
- 2023-03-27 CN CN202310309634.4A patent/CN116079745A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116476081A (zh) * | 2023-06-21 | 2023-07-25 | 广东省科学院智能制造研究所 | 一种机器人节律性技能学习方法及系统 |
CN116476081B (zh) * | 2023-06-21 | 2023-09-15 | 广东省科学院智能制造研究所 | 一种机器人节律性技能学习方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Robot learning system based on adaptive neural control and dynamic movement primitives | |
Levine et al. | Variational policy search via trajectory optimization | |
Sun et al. | Adaptive tracking control of wheeled inverted pendulums with periodic disturbances | |
Mahadevan | Proto-value functions: Developmental reinforcement learning | |
Hsu et al. | Intelligent robot deburring using adaptive fuzzy hybrid position/force control | |
Vincent et al. | Reachable polyhedral marching (rpm): A safety verification algorithm for robotic systems with deep neural network components | |
CN110561421B (zh) | 机械臂间接拖动示教方法及装置 | |
CN116079745A (zh) | 基于几何感知与节律动态运动基元的人机技能迁移方法 | |
JP7058202B2 (ja) | 情報処理方法及び情報処理システム | |
Fan et al. | Real-time grasp planning for multi-fingered hands by finger splitting | |
Fanger et al. | Gaussian processes for dynamic movement primitives with application in knowledge-based cooperation | |
Shetab-Bushehri et al. | Lattice-based shape tracking and servoing of elastic objects | |
Che et al. | Multi-fidelity modeling in sequential design for stability identification in dynamic time-delay systems | |
Pan et al. | Data-driven differential dynamic programming using gaussian processes | |
Li et al. | Enhanced task parameterized dynamic movement primitives by GMM to solve manipulation tasks | |
Yashchuk | Bringing PDEs to JAX with forward and reverse modes automatic differentiation | |
Vincent et al. | Reachable polyhedral marching (rpm): An exact analysis tool for deep-learned control systems | |
Precup et al. | A survey on fuzzy control for mechatronics applications | |
Heiden et al. | Inferring articulated rigid body dynamics from rgbd video | |
Ramadorai et al. | On modeling and adaptive control of underwater robots | |
WO2022257185A1 (zh) | 一种基于人工神经网络的机器人外界接触力估计方法 | |
Jurado et al. | Continuous-time neural identification for a 2 DOF vertical robot manipulator | |
Cheah et al. | Convergence and robustness of a discrete‐time learning control scheme for constrained manipulators | |
Wu et al. | Infer and adapt: Bipedal locomotion reward learning from demonstrations via inverse reinforcement learning | |
Völlinger et al. | Evolutionary optimization of mass-spring models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |