CN114227688B

CN114227688B - 一种基于曲线配准的示教轨迹学习方法

Info

Publication number: CN114227688B
Application number: CN202111638864.2A
Authority: CN
Inventors: 刘成菊; 肖宏远; 陈启军
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2021-12-29
Filing date: 2021-12-29
Publication date: 2023-08-04
Anticipated expiration: 2041-12-29
Also published as: CN114227688A

Abstract

本发明涉及一种基于曲线配准的示教轨迹学习方法，包括以下步骤：S1、通过动觉示教获取原始示教轨迹；S2、对动觉示教所记录的原始示教轨迹进行曲线配准；S3、经过曲线配准，将原始示教轨迹分解为时域特征和空域特征，由原始示教轨迹的空域特征构成规整示教轨迹；S4、使用规整示教轨迹作为示教学习算法的输入；S5、使用习得的模型对示教轨迹进行重现。与现有技术相比，本发明明确指出示教轨迹所具有的时‑空耦合数据特性，并使用曲线配准方法替代现有的示教轨迹规整方法，使得后续的示教学习算法能够从规整的示教轨迹中进行学习，提升了一类示教轨迹学习方法的性能。

Description

一种基于曲线配准的示教轨迹学习方法

技术领域

本发明涉及机器人轨迹规划领域，尤其是涉及一种基于曲线配准的示教轨迹学习方法。

背景技术

基于示教学习的轨迹学习方法能够使机器人能够利用施教者的先验知识快速学习较为复杂的轨迹，是实现机器人灵活运动的关键技术，对于推动机器人在动态环境下的快速轨迹规划应用有重要意义，现有示教轨迹学习方法主要有以下两种：

一是基于动态动作基元(DMP)的方法：该方法是一种单示教轨迹-单模型的示教轨迹学习方法，从单一示教轨迹中学习一个二阶非线性微分方程从而实现示教轨迹的学习，通过实时迭代上述微分方程对学习的示教轨迹进行重现，该类方法存在以下问题：

仅依赖于单一示教轨迹，不能学习一组示教轨迹的共通特征；所依赖的示教轨迹质量如果较低，将显著影响示教轨迹的学习效果。

二是基于高斯混合模型-高斯混合回归(GMM-GMR)的方法，该方法是一种多示教轨迹-单模型的示教轨迹学习方法，从多个示教轨迹中学习时间-状态的联合分布并使用高斯混合模型进行表示，在新时间输入下通过高斯混合回归对示教轨迹进行重现，但该类方法存在以下问题：

当依赖的一组示教轨迹具有非共通的时间特征时，将影响示教轨迹的学习效果；现有的预处理方法依赖于动态时间规整或其变种，是一种非对称的轨迹规整方法，不能正确地分离示教轨迹的时域、空域特征。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于曲线配准的示教轨迹学习方法。

本发明的目的可以通过以下技术方案来实现：

一种基于曲线配准的示教轨迹学习方法，包括以下步骤：

S1、通过动觉示教获取原始示教轨迹；

S2、对动觉示教所记录的原始示教轨迹进行曲线配准；

S3、经过曲线配准，将原始示教轨迹分解为时域特征和空域特征，由原始示教轨迹的空域特征构成规整示教轨迹；

S4、使用规整示教轨迹作为示教学习算法的输入；

S5、使用习得的模型对示教轨迹进行重现。

所述的步骤S1中，机器人通过各关节电流检测力矩并采用动力学模型获取工作空间所受外力并进行补偿，从而使自身处于零力拖动状态，由施教者自由拖动机器人运动，同时，机器人的关节空间轨迹由各关节的位置传感器获取并记录，机器人的工作空间轨迹由关节空间轨迹经过正运动学计算获得，则记录下来的轨迹即为示教轨迹。

步骤S2中，曲线配准采用规整函数描述示教轨迹的时域特征，并使用Fisher-Rao度量计算两个曲线之间的距离，所述的Fisher-Rao度量在规整函数的规整作用下保持不变，并且在平方根速度表示下成为标准的L2度量。

曲线配准具体过程为：

首先将原始示教轨迹的曲线f_i变换至平方根速度空间的对应曲线并计算关于规整函数作用下各轨道空间[q_i]的均值[μ]，然后使用轨道空间[μ]的中心μ作为曲线规整的模板，对于每一个平方根速度空间曲线q_i求取最优规整函数/>得到一系列最优规整函数/>

所述的步骤S3中，示教轨迹的时域特征具体为各最优规整函数示教轨迹的空域特征具体为示教轨迹在最优规整函数作用下的结果，即规整示教轨迹/>其中，代表规整函数对f_i施加的右结合作用。

所述的步骤S4中，将规整示教轨迹的均值作为单示教轨迹-单模型算法的输入，将规整示教轨迹作为多示教轨迹-单模型算法的输入。

所述的规整示教轨迹的逐点均值/>直接作为单示教轨迹-单模型示教学习方法的输入，全体规整示教轨迹/>直接作为多示教轨迹-单模型示教学习方法的输入，其中，N为规整示教轨迹总数。

采用动态动作基元作为单示教轨迹-单模型示教学习方法。

采用高斯混合模型-高斯混合回归方法作为多示教轨迹-单模型示教学习方法。

所述的步骤S5中，通过动态动作基元或高斯混合模型-高斯混合回归方法进行轨迹重现。

与现有技术相比，本发明具有以下优点：

一、本发明利用了函数型数据分析中的曲线配准方法，能够对一组示教轨迹的时域、空域特征进行分离，得到规整示教轨迹，这一过程有效地克服了现有动态时间规整方法存在的非对称性问题，能够提升后续的示教轨迹学习方法对示教轨迹的刻画程度。

二、本发明基于一组示教轨迹得到一组规整示教轨迹，规整示教轨迹排除了不同示教轨迹之间不一致的时域特征，既能够进行空间上的平均后应用于基于单示教轨迹的示教学习方法，也能够直接应用于基于多示教轨迹的示教学习方法，能够有效提升一类示教学习方法的性能。

附图说明

图1为本发明方法的流程图。

图2为经过曲线配准后，规整示教轨迹的时域特征示意图，其中，图(2a)为x轴上的规整函数图(2b)为y轴上的规整函数/>

图3为原始示教轨迹及其逐时间均值的示意图，其中，图(3a)为全维度表示的示教轨迹，图(3b)为逐维度表示的示教轨迹。

图4为动态时间规整后的示教轨迹及其逐时间均值的示意图，其中，图(4a)为全维度表示的动态时间规整轨迹，图(4b)为逐维度表示的动态时间规整轨迹。

图5为本发明采用的曲线配准方法得到的规整示教轨迹及其逐时间均值的示意图，其中，图(5a)为全维度表示的曲线配准后的规整示教轨迹，图(5b)为逐维度表示的曲线配准后的规整示教轨迹。

图6为使用规整示教轨迹(或其逐时间均值)进行示教学习并利用学习结果进行示教轨迹再现的示意图，其中，图(6a)为全维度表示的再现轨迹，图(6b)为逐维度表示的再现轨迹。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

本实施例提供了一种基于曲线配准的示教轨迹学习方法，该方法的框架示意图如图1所示，具体包括以下步骤：

S1、通过动觉示教，获取示教轨迹；

S2、对于动觉示教所记录的示教轨迹，进行曲线配准；

S3、经过曲线配准，原始示教轨迹被分解为时域特征和空域特征，原始示教轨迹的空域特征构成规整示教轨迹；

S4、使用规整示教轨迹作为示教学习算法的输入，具体地：使用规整示教轨迹的均值作为单示教轨迹-单模型算法的输入，使用规整示教轨迹作为多示教轨迹-单模型算法的输入；

S5、使用习得的模型对示教轨迹进行重现。

在步骤S1实施过程中，机器人通过各关节电流检测其力矩并利用动力学模型推算工作空间所受外力并进行补偿，从而使自身处于零力拖动状态，由施教者自由拖动机器人运动。同时，机器人的关节空间轨迹由各关节的位置传感器记录，机器人的工作空间轨迹由关节空间轨迹经过正运动学推算获得，所记录下来的轨迹是示教轨迹。

在步骤S2实施过程中，曲线配准算法使用规整函数描述示教轨迹的时域特征，并使用Fisher-Rao度量计算两个曲线之间的距离。Fisher-Rao度量在规整函数的规整作用下保持不变，并且在平方根速度表示下成为标准的L2度量。曲线配准算法首先将曲线f_i变换至平方根速度空间的对应曲线并计算关于规整函数作用下各轨道空间[q_i]的均值[μ]。进一步地，使用轨道空间[μ]的中心μ作为曲线规整的模板，对于每一个平方根速度空间曲线q_i求取最优规整函数/>得到一系列最优规整函数/>

在步骤S3实施过程中，各最优规整函数是示教轨迹的时域特征，示教轨迹在最优规整函数作用下的结果/>是示教轨迹的空域特征。

在步骤S4实施过程中，规整示教轨迹的逐点均值/>直接作为单示教轨迹-单模型示教学习方法的输入；全体规整示教轨迹/>直接作为多示教轨迹-单模型示教学习方法的输入。具体地，采用动态动作基元作为单示教轨迹-单模型示教学习方法，采用高斯混合模型-高斯混合回归方法作为多示教轨迹-单模型示教学习方法。

在步骤S5实施过程中，通过动态动作基元或者高斯混合模型-高斯混合回归方法，重现步骤S4所习得的示教轨迹。

本发明提供的示教轨迹学习方法，与现有技术中的位姿估计方法相比，最大的创新点有两点：一个是利用了函数型数据分析中的曲线配准方法，对一组示教轨迹的时域、空域特征进行分离；二是利用规整示教轨迹作为不同示教学习方法的输入，能够提升一类示教学习算法的性能。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种基于曲线配准的示教轨迹学习方法，其特征在于，包括以下步骤：

S1、通过动觉示教获取原始示教轨迹；

S2、对动觉示教所记录的原始示教轨迹进行曲线配准；

S4、使用规整示教轨迹作为示教学习算法的输入；

S5、使用习得的模型对示教轨迹进行重现；

所述的步骤S2中，曲线配准采用规整函数描述示教轨迹的时域特征，并使用Fisher-Rao度量计算两个曲线之间的距离，所述的Fisher-Rao度量在规整函数的规整作用下保持不变，并且在平方根速度表示下成为标准的L2度量；

曲线配准具体过程为：

首先将原始示教轨迹的曲线变换至平方根速度空间的对应曲线，并计算关于规整函数作用下各轨道空间的均值，然后使用轨道空间的中心作为曲线规整的模板，对于每一个平方根速度空间曲线求取最优规整函数得到一系列最优规整函数；

所述的步骤S3中，示教轨迹的时域特征具体为各最优规整函数，示教轨迹的空域特征具体为示教轨迹在最优规整函数作用下的结果，即规整示教轨迹，其中，代表规整函数对施加的右结合作用。

2.根据权利要求1所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，所述的步骤S1中，机器人通过各关节电流检测力矩并采用动力学模型获取工作空间所受外力并进行补偿，从而使自身处于零力拖动状态，由施教者自由拖动机器人运动，同时，机器人的关节空间轨迹由各关节的位置传感器获取并记录，机器人的工作空间轨迹由关节空间轨迹经过正运动学计算获得，则记录下来的轨迹即为示教轨迹。

3.根据权利要求1所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，所述的步骤S4中，将规整示教轨迹的均值作为单示教轨迹-单模型算法的输入，将规整示教轨迹作为多示教轨迹-单模型算法的输入。

4.根据权利要求3所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，所述的规整示教轨迹的逐点均值/>直接作为单示教轨迹-单模型示教学习方法的输入，全体规整示教轨迹/>直接作为多示教轨迹-单模型示教学习方法的输入，其中，N为规整示教轨迹总数。

5.根据权利要求4所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，采用动态动作基元作为单示教轨迹-单模型示教学习方法。

6.根据权利要求4所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，采用高斯混合模型-高斯混合回归方法作为多示教轨迹-单模型示教学习方法。

7.根据权利要求1所述的一种基于曲线配准的示教轨迹学习方法，其特征在于，所述的步骤S5中，通过动态动作基元或高斯混合模型-高斯混合回归方法进行轨迹重现。