CN116079745A

CN116079745A - 基于几何感知与节律动态运动基元的人机技能迁移方法

Info

Publication number: CN116079745A
Application number: CN202310309634.4A
Authority: CN
Inventors: 李俊阳; 刘程果; 宋延奎; 曾振威
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2023-03-27
Filing date: 2023-03-27
Publication date: 2023-05-09

Abstract

本发明公开了一种基于几何感知与节律动态运动基元的人机技能迁移方法，包括：S1.构建机器人期望行为模型；S2.基于机器人期望行为模型进行刚度矩阵估计，得到估计后的刚度矩阵；S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型；S4.将估计后的刚度矩阵输入到机器人技能学习模型，使得机器人对刚度轨迹进行模仿，实现刚度轨迹的复现。本发明能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。

Description

基于几何感知与节律动态运动基元的人机技能迁移方法

技术领域

本发明涉及共融机器人领域，具体涉及一种基于几何感知与节律动态运动基元的人机技能迁移方法。

背景技术

具备在高度非结构化的动态环境中，可靠执行指定任务的能力是将机器人带入人类日常生活的基础。此时，机器人需要准确地控制其在自由空间及物理交互过程中的运动，这就要求其能产生和适应运动、阻抗和/或力。因此，可利用人类的专业知识，通过将人类的技能传授给机器人来学会如何执行这样的任务。从人类演示中学习(LfD)作为一种将人的技能传授给机器人的便捷方式，得到了广泛的研究。该学习方法旨在从人类演示中提取相关的运动模式，并随后将这些模式应用于不同的情况。

动态运动基元(DMPs)作为一种广泛使用的LfD方法具有诸多有益的特性，如抗扰动的鲁棒性和适应新需求的能力。在这些动态环境中的许多任务需要可变阻抗，尤其在一些节律的操作任务中，如黑板擦拭、拉锯子和泵水等。然而，阻抗参数被封装在对称正定(SPD)矩阵中，由于传统的节律DMPs(Dynamic Movement Primitives)依赖于空间的欧几里德参数化，所以针对这些具有SPD矩阵流形结构的变阻抗技能参数不能直接使用，导致机器人无法稳定且平滑地学习到具备对称正定(SPD)矩阵流形结构的运动技能，因此，需要一种基于几何感知与节律动态运动基元的人机技能迁移方法，能够解决以上问题。

发明内容

有鉴于此，本发明的目的是克服现有技术中的缺陷，提供基于几何感知与节律动态运动基元的人机技能迁移方法，能够使得机器人更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能。

本发明的基于几何感知与节律动态运动基元的人机技能迁移方法，包括如下步骤：

S1.构建机器人期望行为模型；

S2.基于机器人期望行为模型进行刚度矩阵估计，得到估计后的刚度矩阵；

S3.构建基于几何感知与节律动态运动基元的机器人技能学习模型；

S4.将估计后的刚度矩阵输入到机器人技能学习模型，使得机器人对刚度轨迹进行模仿，实现刚度轨迹的复现。

进一步，根据如下公式确定机器人期望行为模型：

其中，M为质量矩阵，B为阻尼矩阵，K为刚度矩阵，X_d为机器人的期望位置，X为机器人的当前位置，

为机器人的当前速度，

为机器人的当前加速度，F_e为机器人外界的交互力。

进一步，所述步骤S2，具体包括：

S21.对机器人期望行为模型进行线性化处理，得到线性化模型：

其中，

S22.利用最小二乘法对线性化模型进行求解，得到每个时刻的刚度矩阵估计；

S23.引入优化模型对求解后的线性化模型进行优化处理，得到满足对称正定矩阵约束的刚度矩阵；所述优化模型为：

其中，

为估计后的刚度矩阵，

H是P的奇异值分解P＝USV^T的对称极性因子，U与V为酉矩阵，S为含奇异值的对角矩阵。

进一步，根据如下公式确定机器人技能学习模型：

其中，τ为运行频率Ω的倒数，

为刚度矩阵K的二阶导数，α_y以及β_y均为系统增益参数；K_g为目标对称正定矩阵，K_j为时刻t_j对应的刚度矩阵，K₁为初始刚度矩阵，

z为刚度矩阵K的一阶导数，vec(·)为一个使用Mandel符号将对称矩阵变换成向量的函数；

Ψ_i(φ)＝exp(h(cos(Ψ_i(φ)-c_i)-1))；

其中，N为数据点总数，φ为相位；

为权重，r为调制周期信号，c_i和h分别为基函数Ψ_i(φ)的中心与宽度。

进一步，根据如下式子对相位与频率τ进行估计：

其中，

为相位φ的一阶导数，

为频率Ω的一阶导数，Ω＝1/τ，P是一个正定耦合常数，

是外部信号U和内部估计

之间的差异；

其中，M是傅里叶级数的个数，c为傅里叶级数的序列编号，

A以及B均为常数，η是学习率；

进一步，根据如下公式使得机器人对刚度轨迹进行模仿：

其中，

为机器人模仿的刚度矩阵，t表示当前时刻，δt为时间间隔，Exp_K(t)(·)表示指数映射函数，K(t)为当前时刻的刚度矩阵，z(t)为当前时刻刚度矩阵的向量表示，

表示并行传输函数，K₁为初始刚度矩阵，mat(·)为使用Mandel符号将向量变换成对称矩阵的函数，τ为运行频率Ω的倒数。

本发明的有益效果是：本发明公开的一种基于几何感知与节律动态运动基元的人机技能迁移方法，首先通过人类动觉教学时采集的力位特征参数，使用最小二乘算法辨识出示教阻抗模型，并通过SPD矩阵化处理将其标准化；其次考虑阻抗技能对称正定(SPD)矩阵流形结构的特殊性，基于黎曼流形测地线、对数/指数映射以及并行传输等方法将其融入到节律DMPs控制框架中，从而使得机器人能够简单、稳定、准确且平滑地学习变阻抗技能，实现人机技能的高效迁移。

附图说明

下面结合附图和实施例对本发明作进一步描述：

图1为本发明的技能迁移方法原理示意图；

图2为本发明的两个SPD矩阵之间的测地线和欧氏路径之间的差异示意图；

图3为本发明的SPD流形

上的指数、对数映射和平行传输示意图；

图4为本发明的技能迁移方法得到的刚度轮廓与真实值之间的距离示意图；

图5为本发明提出的几何感知节律DMPs生成的一次与二次导数用于学习刚度椭球示意图；

图6为本发明的示教与再现的SPD刚度矩阵在嵌入圆锥切空间的表示示意图。

具体实施方式

以下结合说明书附图对本发明做出进一步的说明，如图所示：

S1.构建机器人期望行为模型；

本发明针对阻抗等对称正定(SPD)矩阵流形结构的特殊性以及日常生活中节律运动技能(如黑板擦拭、拉锯子与泵水等)对特征参数学习的必要性，同时注意到传统节律动态运动基元对欧几里德空间参数的依赖性，形成了结合几何感知与节律动态运动基元的人机技能传递分析方法，使得机器人能更简单、稳定、准确且平滑地学习到诸如阻抗等具备对称正定(SPD)矩阵流形结构的运动技能，对机器人技能学习方面的研究具有技术指导意义。

本实施例中，步骤S1中，操作人员进行动觉示教时，通过机器人阻抗控制对机器人末端执行器的期望行为进行建模，得到机器人期望行为模型：

其中，M，B和K分别是质量矩阵、阻尼矩阵与刚度矩阵，属于动力学参数；X_d是机器人的期望位置，

X分别是机器人的当前加速度、速度与位置，F_e为机器人外界的交互力。

本实施例中，步骤S2中，采用滑动窗口技术来实现每个时间步长满足上式(1)的局部刚度估计，长度为L的窗口沿着演示数据

X与F_e移动。定义窗口内的所有数据为

M与B均为预先定义的值，可得如下线性化模型：

利用最小二乘法求解上述线性化模型，在每个时刻进行刚度矩阵估计。但由于刚度矩阵

是对称正定(SPD)矩阵，这就意味着由最小二乘法求解后得出的只是一个不满足SPD约束的粗略估计。

因此，引入以下优化模型将上述计算出的近似结果转换为就近的SPD矩阵。所述优化模型为：

其中，

为估计后的刚度矩阵，

同时，由于一些近似矩阵可能在SPD矩阵空间的边界上，从而得到对称的半正定矩阵。在这种情况下，刚度矩阵估计

的每个特征值λ_i≈0被最小值下界约束，然后使用其特征值分解

来重构

其中，阻抗方程的阻尼项可通过实验或使用

的本征分解来选择，以保持系统的临界阻尼，如

其中，Q和Δ分别是

的本征向量和本征值，

是阻尼比。

本实施例中，步骤S3中，由于刚度矩阵

在加法和标量积下不是封闭的，所以不能被看作是向量空间，因此用经典的欧几里得空间方法来处理和分析这些矩阵是不够的。

构建基于几何感知与节律动态运动基元的机器人技能学习模型，具体包括：

将SPD矩阵与黎曼度量结合起来，使其形成黎曼流形，并定义了测地线度量，即流形上两点之间的最小长度曲线，如图2所示。

黎曼流形

是一个拓扑空间，它的每个点局部类似于欧氏空间。对于每个点

存在一个切空间

切空间中的度量是平坦的，允许使用经典算术工具，如图3所示。

对于SPD流形，任意点

处的切空间由对称矩阵空间Sym^D(D表示维度)来识别。SPD矩阵的空间可以表示为嵌入在切空间Sym^D中凸锥的内部。

指数映射Exp_Σ：

表示将切空间上的点L映射到流形上的点Λ。

对数映射Log_Σ：

表示将流形上的点Λ映射到切空间上的点L。且有如下式子：

并行传输Γ_Σ→Λ：

用于在切空间中移动元素使得两者之间夹角保持不变。且有如下式子：

其中，

到

定义

作为SPD矩阵的一个演示集。其中，j表示时刻，T表示总时刻。

其次，求解刚度矩阵K的一阶与二阶导数以代入节律动态运动基元模型。

一阶求导如下：

为避免对称性而造成的信息复制占用计算资源，采用Mandel表示法将数据降维为m＝D+D(D-1)/2。

引入如下式子：

其中，vec(·)是一个使用Mandel符号将对称矩阵变换成向量的函数；

使用标准欧几里得工具直接计算二阶导数，其向量化表示为

进而得到数据集：

该数据集包括：每个时刻t_j，t_j对应的刚度矩阵K_j，以及刚度矩阵K_j的一阶与二阶导数z_j与

因此，结合几何感知与节律动态运动基元的机器人技能学习模型，表示如下所示：

其中，τ为运行频率Ω的倒数，

为刚度矩阵K的二阶导数，α_y以及β_y均为系统增益参数；

为目标对称正定矩阵，它通过数据集(所有矩阵K)的平均值获取；K_j为时刻t_j对应的刚度矩阵，K₁为初始刚度矩阵，

是强迫项，表示如下：

Ψ_i(φ)＝exp(h(cos(Ψ_i(φ)-c_i)-1))

其中，N为数据点总数，也即是数据集中数据总数，φ为相位；r用于调制周期信号(r＝1时不对节律运动进行缩放)。c_i和h为基函数Ψ_i(φ)的中心与宽度。其中，c_i在[0,2π]中均匀分布，h设置为2.5倍基函数数量。权重

采用局部加权回归学习可得。

相位φ与频率Ω被自适应振荡器估计，具体表达如下所示：

其中，

为相位φ的一阶导数，

为频率Ω的一阶导数，Ω＝1/τ，P是一个正定耦合常数，

是外部信号U和其内部估计

之间的差异，由傅里叶级数构建。本实施例中，所述U为输入的刚度矩阵K。

其中，M是傅里叶级数的个数，c为傅里叶级数的序列编号，

A以及B均为常数，具体地：

傅里叶数列参数的学习方法如下：

其中，η是学习率。自适应振荡器是实时推断周期性状态(相位和频率)的最有用方法。然而，当记录的信号频率是可变的，它们对于离线学习也是有用的。如图6所示，虚线表示再现的SPD刚度矩阵在嵌入圆锥切空间的表示，实线表示示教的SPD刚度矩阵在嵌入圆锥切空间的表示。

本实施例中，步骤S4中，利用构建的机器人技能学习模型，使得机器人对估计后的刚度矩阵进行学习，实现对刚度轨迹的复现。

在复现阶段，根据如下公式使得机器人对刚度轨迹进行模仿，从而获得模仿的刚度轨迹：

其中，mat(·)是vec(·)的逆，也即是使用Mandel符号将向量变换成对称矩阵的函数，表示使用Mandel符号的矩阵化。

表示并行传输函数，K₁为初始刚度矩阵，

代表了新的基于SPD矩阵的机器人阻抗技能。

本发明针对日常生活中变阻抗技能学习的必要性，首先通过最小二乘算法设计具备对称正定(SPD)矩阵流形结构的阻抗模型辨识策略；然后结合黎曼流形与节律动态运动基元形成几何感知的人机技能传递方法，填补了目前机器人在对称正定(SPD)矩阵流形结构的变阻抗技能学习方面的空白，同时基于动态运动基元算法，能够与传统位置、姿态动态运动基元融合形成统一技能表达，也可推广到可操作性等技能学习方面，在实际工作及未来发展中具有重要的技术指导意义。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。