WO2023124346A1

WO2023124346A1 - 一种协作机器人可变刚度运动技能学习与调控方法及系统

Info

Publication number: WO2023124346A1
Application number: PCT/CN2022/123754
Authority: WO
Inventors: 吴鸿敏; 徐智浩; 周学峰; 廖昭洋; 瞿弘毅
Original assignee: 广东省科学院智能制造研究所
Priority date: 2021-12-28
Filing date: 2022-10-08
Publication date: 2023-07-06
Also published as: CN114310888A; CN114310888B

Abstract

一种协作机器人可变刚度运动技能学习与调控方法及系统，其中，协作机器人可变刚度运动技能学习与调控方法包括：基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，形成数据集(S11)；基于数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系(S12)；进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集(S13)；基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集(S14)；进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果(S15)；将条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理(S16)。协作机器人可变刚度运动技能学习与调控系统包括：获得模块(21)、构建模块(22)、估计模块(23)、向量化模块(24)、在线学习模块(25)、调制控制模块(26)。该方法及系统实现接触力发生变化时协作机器人末端刚度的自适应调制与控制。

Description

一种协作机器人可变刚度运动技能学习与调控方法及系统

技术领域

本发明涉及自动化控制技术领域，尤其涉及一种协作机器人可变刚度运动技能学习与调控方法及系统。

背景技术

随着制造业的智能化和柔性化发展，机器人编程技术也面临着较大的挑战。传统依赖于人为干预与反复调试的工业机器人编程技术，只适用于特定任务，当遇到相近任务或不同环境时，需要重新进行编程，无法汲取过往的操作经验，存在效率低、适应性差、灵巧性不足等问题。当前，新一代人工智能技术研发取得了重大进步，协作机器人应用广度与深度也日益提升，探索如何利用人工智能技术让协作机器人系统具备一定的自主决策和学习能力，进而使协作机器人能够学习到适应于不同任务和环境的运动技能，避免对每个任务的繁琐编程，是当今协作机器人领域前沿研究热点与难点。

协作机器人运动技能模仿学习能够通过协作机器人与人类交互的方式获得运动技能，将人类运动技能传递给协作机器人，充分利用人类的操作经验，使协作机器人获得高度类人化操作能力，是目前业界与学界公认能实现协作机器人快速编程、高效适应和灵巧操作最为有效的解决方案之一。然而，已有运动技能模仿学习方法侧重于协作机器人欧几里得空间的运动特征模仿(如：位置、速度等)，缺乏考虑特殊正交群和黎曼空间中具有严格几何约束的运动特征(如：姿态、刚度、可操作性等)，并且依赖于时间驱动的运动轨迹，无法满足高维输入的技能学习，在任务泛化性和环境适应性两个方面存在较大的不足。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种协作机器人可变刚度运动技能学习与调控方法及系统，实现接触力发生变化时协作机器人末端刚度的自适应调整与控制，满足精密装配、康复训练等复杂任务对协作机器人的技术需求。

为了解决上述技术问题，本发明实施例提供了一种协作机器人可变刚度运动技能学习与调控方法，所述方法包括：

基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。

可选的，所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集，包括：

在所述协作机器人末端安装六维力传感器，并通过交互技能数据采集与标注系统在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示，获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹，形成数据集；

所述数据集表示形式

其中，x _t,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置；

表示协作机器人在样本长度为t和训练样本数量为m时的末端速度；

表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度；

表示协作机器人在样本长度为t和训练样本数量为m时的末端的力；T表示样本的长度；M表示训练样本的数量。

可选的，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系，包括：

在所述数据集合的基础上，假设所述协作机器人末端为受到控制力f ^c和外界力f ^e影响的单位质量体I _M，其动力学模型简化为：

在所述协作机器人末端的控制力由虚拟弹簧-阻尼系统产生，从而得到每一时刻所述协作机器人动力学等价于：

在此基础上，假定通过技能学习得到所述协作机器人末端理想运动力轨迹为F _d，从而可以由虚拟弹簧-阻尼系统将F _d表达为：

其中，

表示协作机器人的末端加速度；

表示协作机器人末端在样本长度为t时的末端加速度；

表示协作机器人末端在样本长度为t时的刚度矩阵；

表示协作机器人的末端期望位置；x _t表示协作机器人的末端位置；

表示协作机器人末端在样本长度为t时的阻尼矩阵；

表示协作机器人的末端速度；

表示在协作机器人末端在样本长度为t时的外界力；

表示未知刚度矩阵；Δx表示已知未知变化量；

表示未知阻尼矩阵；J表示已知雅克比矩阵；

表示已知关节速度。

可选的，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系之后，还包括：

使所述协作机器人不作周期性振动而又能快速地回到平衡位置，将设定未知阻尼矩阵

为临界阻尼值，即：

其中，Q和Λ分别为对称正定的未知刚度矩阵

的特征向量和特征值；η表示调节系数，

在所述协作机器人力矩控制模式下，设笛卡尔阻尼控制器实现末端理想力的执行如下：

其中，τ _d表示笛卡尔阻尼控制器实现末端理想力的执行；J′表示已知雅克比矩阵的转置；F _d表示协作机器人末端理想运动力轨迹；

表示机器人运动学模型，其中，θ表示已知关节角度，

表示已知关节速度，

表示已知关节加速度；

由协作机器人末端理想运动力轨迹F _d和笛卡尔阻尼控制器实现末端理想力的执行τ _d可知，所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵

决定，其中，

表示对称正定流形；

通过构建所述协作机器人末端力-刚度矩阵的技能模型f(K ^P|F)实现可调控刚度的运动技能学习。

可选的，所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集，包括：

通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计，形成末端力-刚度矩阵数据集

其中，

表示协作机器人在样本长度为t和训练样本数量为m时的末端的力；T表示样本的长度；M表示训练样本的数量；

表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。

可选的，所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集，包括：

根据刚度矩阵的对称性与正定性的几何约束，采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化

并转换到欧几里得到空间表征的刚度向量，形成末端力-刚度向量数据集

其中，

表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵；

表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述，长度为m(m+1)/2；A _t,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵；A′ _t,m为A _t,m的转置。

可选的，所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括：

采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模，获得建模结果如下：

其中，C表示高斯混合模型中的高斯分布的数量；π _c表示第c个高斯模型的先验概率，并且

μ _c和∑ _c分布表示第c个高斯模型的均值及协方差；F表示末端力；

表示高斯分布；V ^P协作机器人的上三角矩阵元素的向量化描述；

在给定训练样本和高斯模型数量C的前提下，高斯混合模型的参数通过期望最大化算法进行迭代优化获得；

在获得高斯混合模型的参数后，对于任意未知末端力F ^*输入时，均利用高斯混合回归估计得到对应刚度向量V ^P*的条件概率分布f(V ^P|F ^*)。

可选的，所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理，包括：

将所述条件概率分布作为高斯过程的均值函数，即有：

μ(F)＝p(V ^P|F)；

其中，V ^P协作机器人的上三角矩阵元素的向量化描述；F表示协作机器人末端的输入力；

将通过高斯过程协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹；

假设末端力-刚度向量数据集中含有N样本

潜在的函数关系V ^P＝f(F)+ε，其中，ε～N(0,σ ²)是方差为未知σ ²的噪声；

当给定新的测试输入F ^*后，其对应的函数值为f(F ^*)和已有输出样本

之间存在以下联合分布关系：

式中，I表示N维单位矩阵；k ^*＝[k(F ^*,F ₁),k(F ^*,F ₂),…,k(F ^*,F _N)]，K表示由核函数定义的协方差矩阵；

由联合分布得到多变量高斯的条件概率分布P(f(F ^*)|V ^P)，其均值μ(F ^*)＝p(V ^P*|F ^*)由高斯混合模型-高斯回归获得，方差表示如下：

D(f(F ^*))＝k(F ^*,F ^*)-k ^*(K+σ ²I) ^-1k ^*′；

其中，k ^*′表示k ^*的转置。

可选的，述由核函数定义的协方差矩阵描述如下：

其中，k(.,.)表示核函数运算。

另外，本发明实施例还提供了一种协作机器人可变刚度运动技能学习与调控系统，所述系统包括：

获得模块：用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

构建模块：用于基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

估计模块：用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

向量化模块：用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

在线学习模块：用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

调制控制模块：用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。

在本发明实施例中，从协作机器人末端运动位置、速度、加速度、外界接触力的高维运动数据中估计出满足对称性和正定性的刚度矩阵；对协作机器人末端力-刚度向量进行运动技能模仿，实现在任意未知外界接触力作为输入时估计出末端刚度向量，并在此基础上，通过三角分解逆变换与协作机器人阻抗控制器，实现接触力发生变化时协作机器人末端刚度的自适应调整与控制，满足精密装配、康复训练等复杂任务对协作机器人的技术需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中的协作机器人可变刚度运动技能学习与调控方法的流程示意图；

图2是本发明实施例中的协作机器人可变刚度运动技能学习与调控系统的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一

本发明提出了一种协作机器人可变刚度运动技能学习与调控方法，让协作机器人能够从人类多次演示的位置-外界力的运动轨迹中学习基于外界力的变刚度运动技能，当外界接触力发生变化时协作机器人末端刚度进行自适应调整与控制，实现对人类进行精密装配、康复训练等复杂任务的操作技能模仿，将有效提升协作机器人环境适应性和操作灵巧性。具体表现包括：(1)从模仿学习的角度出发，本发明提出适用于高动态非结构化、不确定性环境下协作机器人外界力-末端刚度相关联的运动技能学习方法，通过学习的方式构建数据驱动的变阻抗运动模型，有望解决现有固定阻抗建模及参数辨识两大难题；(2)通过假设协作机器人末端为受到控制力和外界力影响的单位质量体以简化协作机器人末端动力学模型。其中，协作机器人末端控制力可由虚拟弹簧阻尼系统产生，进而构建协作机器人末端刚度矩阵与末端位置、速度、加速度、外界力之间的等价关系。在此基础上，本发明通过最小二乘法从人类演示的运动轨迹(末端位置、速度、加速度、外界力)中进行刚度矩阵的粗估计，再通过刚度矩阵逼近方法进行精估计以确保刚度矩阵的对称性与正定性，有效解决传统采用凸优化方法进行刚度矩阵估计存在计算效率低的问题；(3)考虑到对称正定的刚度矩阵位于黎曼空间，而非常规的欧氏空间，无法进行直接的运算，并且外界力作为输入时属于高变量输入，无法采用传统的动态运动基元模型进行建模。针对此问题，本发明首先将刚度矩阵进行三角分解得到刚度向量，再提出一种基于均值先验的高斯过程建模方法，构建外界力-刚度向量的技能模型，借助先验设置与高效的核函数运算，所提方法能够同时满足从多次演示轨迹中进行多样性和轨迹不确定性的建模与学习，使所习得技能能够保持演示运动特性的前提下快速适应外界环境的变化，提升环境适应性。

首先，在协作机器人末端安装六维力传感器，通过交互式技能数据采集与标注系统在零力拖动模式下牵引协作机器人进行外界力-刚度相关联的操作任务开展多次运动演示，并获取每次演示过程中协作机器人末端运动位置、速度、加速度、外界接触力的高维运动轨迹，形成数据集。然后，在刚度矩阵对称性和正定性的几何条件下，构建“粗计算-精逼近”两阶段相结合的刚度矩阵估计方法，获得每一时刻不同外界接触力情况下协作机器人末端刚度矩阵的映射关系；再次，采用刚度矩阵三角分解方法将黎曼空间中刚度矩阵间距离度量转化到欧几里得空间，进行矩阵向量化描述，形成刚度向量；最后，在欧几里得空间下提出一种基于均值先验的高斯过程建模方法，构建协作机器人末端外力接触力-刚度相关联的运动技能模仿学习方法，在获得任意未知外界接触力作为输入时估计出末端刚度矩阵，并通过协作机器人阻抗控制器实现接触力发生变化时协作机器人末端刚度进行自适应调整与控制，满足精密装配、康复训练等复杂任务对协作机器人的技术需求。

具体的，请参阅图1，图1是本发明实施例中的协作机器人可变刚度运动技能学习与调控方法的流程示意图。

如图1所示，一种协作机器人可变刚度运动技能学习与调控方法，所述方法包括：

S11：基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

在本发明具体实施过程中，所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集，包括：在所述协作机器人末端安装六维力传感器，并通过交互技能数据采集与标注系统在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示，获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹，形成数据集；

所述数据集表示形式

S12：基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

在本发明具体实施过程中，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系，包括：在所述数据集合的基础上，假设所述协作机器人末端为受到控制力f ^c和外界力f ^e影响的单位质量体I _M，其动力学模型简化为：

其中，

表示协作机器人的末端加速度；

表示协作机器人末端在样本长度为t时的末端加速度；

表示协作机器人末端在样本长度为t时的刚度矩阵；

表示协作机器人末端在样本长度为t时的阻尼矩阵；

表示协作机器人的末端速度；

表示在协作机器人末端在样本长度为t时的外界力；

表示未知刚度矩阵；Δx表示已知未知变化量；

表示未知阻尼矩阵；J表示已知雅克比矩阵；

表示已知关节速度。

进一步的，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系之后，还包括：使所述协作机器人不作周期性振动而又能快速地回到平衡位置，将设定未知阻尼矩阵

为临界阻尼值，即：

其中，Q和Λ分别为对称正定的未知刚度矩阵

的特征向量和特征值；η表示调节系数，

表示机器人运动学模型，其中，θ表示已知关节角度，

表示已知关节速度，

表示已知关节加速度；由协作机器人末端理想运动力轨迹F _d和笛卡尔阻尼控制器实现末端理想力的执行τ _d可知，所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵

决定，其中，

表示对称正定流形(Symmetric Positive Definite Manifold，简称SPD流形)；通过构建所述协作机器人末端力-刚度矩阵的技能模型f(K ^P|F)实现可调控刚度的运动技能学习。

S13：基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

在本发明具体实施过程中，所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集，包括：

其中，

S14：基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

在本发明具体实施过程中，所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集，包括：

其中，

S15：基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

在本发明具体实施过程中，所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括：采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模，获得建模结果如下：

其中，C表示高斯混合模型(Gaussian Mixture Model,GMM)中的高斯分布的数量；π _c表示第c个高斯模型的先验概率，并且

表示高斯分布；V ^P协作机器人的上三角矩阵元素的向量化描述；在给定训练样本和高斯模型数量C的前提下，高斯混合模型的参数通过期望最大化算法进行迭代优化获得；在获得高斯混合模型的参数后，对于任意未知末端力F ^*输入时，利用高斯混合回归(Gaussian Mixture Regression,GMR)估计得到对应刚度向量V ^P*的条件概率分布f(V ^P|F ^*)，即：

上述同属于高斯分布，由相应的均值

和方差

进行描述，简化为：

从而，利用GMM能够从多次演示运动轨迹中学习运动的多样性与概率特性，满足于对外界未知干扰的建模。但是，GMM的参数更新需要进行重新迭代优化，难以将学习到的技能应用于与演示状态差异较大的情况。为此，本发明将在传统技能学习方法GMM-GMR的基础上，引入多输出高斯过程对未知环境或新的任务约束进行建模，实现技能的在线学习。

S16：将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。

在本发明具体实施过程中，所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理，包括：针对末端力-刚度运动技能的在线控制与调整，将GMM-GMR得到的条件概率分布作为高斯过程的均值函数，即有：

μ(F)＝p(V ^P|F)；

它封装了多次演示运动轨迹的概率特性(如形状等)。下面将通过GP协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹，以适应环境的变化等；其中，V ^P协作机器人的上三角矩阵元素的向量化描述；F表示协作机器人末端的输入力；将通过高斯过程协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹；假设末端力-刚度向量数据集中含有N样本

潜在的函数关系V ^P＝f(F)+ε，其中，

是方差为未知σ ²的噪声；当给定新的测试输入F ^*后，其对应的函数值为f(F ^*)和已有输出样本

之间存在以下联合分布关系：

式中，I表示N维单位矩阵；k ^*＝[k(F ^*,F ₁),k(F ^*,F ₂),…,k(F ^*, _N)]，K表示由核函数定义的协方差矩阵；由联合分布得到多变量高斯的条件概率分布P(f(F ^*)|V ^P)，其均值μ(F ^*)＝p(V ^P*|F ^*)由高斯混合模型-高斯回归获得，方差表示如下：

D(f(F ^*))＝k(F ^*,F ^*)-k ^*(K+σ ²I) ^-1k ^*′；

其中，k ^*′表示k ^*的转置。

所述由核函数定义的协方差矩阵描述如下：

其中，k(.,.)表示核函数运算。

从而，在传统GMM-GMR基础上联合高斯过程实现末端力-刚度的自动调整，以高效适应环境的变化。最后，采用矩阵三角分解的逆变换将得到的刚度向量f(V ^P|F ^*)从欧几里得空间恢复为黎曼空间的刚度矩阵f(K ^P|F ^*)，将协作机器人末端刚度矩阵转换到末端力，并设计阻抗控制器，实现协作机器人末端力-刚度的自适应控制与调整。

实施例二

请参阅图2，图2是本发明实施例中的协作机器人可变刚度运动技能学习与调控系统的结构组成示意图。

如图2所示，一种协作机器人可变刚度运动技能学习与调控系统，所述系统包括：

获得模块21：用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

所述数据集表示形式

构建模块22：用于基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

其中，

表示协作机器人的末端加速度；

表示协作机器人末端在样本长度为t时的末端加速度；

表示协作机器人末端在样本长度为t时的刚度矩阵；

表示协作机器人末端在样本长度为t时的阻尼矩阵；

表示协作机器人的末端速度；

表示在协作机器人末端在样本长度为t时的外界力；

表示未知刚度矩阵；Δx表示已知未知变化量；

表示未知阻尼矩阵；J表示已知雅克比矩阵；

表示已知关节速度。

为临界阻尼值，即：

其中，Q和Λ分别为对称正定的未知刚度矩阵

的特征向量和特征值；η表示调节系数，

表示机器人运动学模型，其中，θ表示已知关节角度，

表示已知关节速度，

决定，其中，

表示对称正定流形；通过构建所述协作机器人末端力-刚度矩阵的技能模型f(K ^P|F)实现可调控刚度的运动技能学习。

估计模块23：用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

其中，

向量化模块24：用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

其中，

在线学习模块25：用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

上述同属于高斯分布，由相应的均值

和方差

进行描述，简化为：

调制控制模块26：用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。

μ(F)＝p(V ^P|F)；

它封装了多次演示运动轨迹的概率特性(如形状等)。下面将通过GP 协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹，以适应环境的变化等；其中，V ^P协作机器人的上三角矩阵元素的向量化描述；F表示协作机器人末端的输入力；将通过高斯过程协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹；假设末端力-刚度向量数据集中含有N样本

潜在的函数关系V ^P＝f(F)+ε，其中，

之间存在以下联合分布关系：

式中，I表示N维单位矩阵；k ^*＝[k(F ^*,F ₁),k(F ^*,F ₂),…,k(F ^*,F _N)]，K表示由核函数定义的协方差矩阵；由联合分布得到多变量高斯的条件概率分布P(f(F ^*)|V ^P)，其均值μ(F ^*)＝p(V ^P*|F ^*)由高斯混合模型-高斯回归获得，方差表示如下：

D(f(F ^*))＝k(F ^*,F ^*)-k ^*(K+σ ²I) ^-1k ^*′；

其中，k ^*′表示k ^*的转置。

所述由核函数定义的协方差矩阵描述如下：

其中，k(.,.)表示核函数运算。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，ReadOnly Memory)、随机存取存储器(RAM，Random Access Memory)、磁盘或光盘等。

另外，以上对本发明实施例所提供的一种协作机器人可变刚度运动技能学习与调控方法及系统进行了详细介绍，本文中应采用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种协作机器人可变刚度运动技能学习与调控方法，其特征在于，所述方法包括：

基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。
根据权利要求1所述的方法，其特征在于，所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集，包括：

在所述协作机器人末端安装六维力传感器，并通过交互技能数据采集与标注系统在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示，获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹，形成数据集；

所述数据集表示形式
其中，x _t,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置；
表示协作机器人在样本长度为t和训练样本数量为m时的末端速度；
表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度；
表示协作机器人在样本长度为t和训练样本数量为m时的末端的力；T表示样本的长度；M表示训练样本的数量。
根据权利要求1所述的方法，其特征在于，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系，包括：

在所述数据集合的基础上，假设所述协作机器人末端为受到控制力f ^c和外界力f ^e影响的单位质量体I _M，其动力学模型简化为：

在所述协作机器人末端的控制力由虚拟弹簧-阻尼系统产生，从而得到每一时刻所述协作机器人动力学等价于：

在此基础上，假定通过技能学习得到所述协作机器人末端理想运动力轨迹为F _d，从而可以由虚拟弹簧-阻尼系统将F _d表达为：

其中，
表示协作机器人的末端加速度；
表示协作机器人末端在样本长度为t时的末端加速度；
表示协作机器人末端在样本长度为t时的刚度矩阵；
表示协作机器人的末端期望位置；x _t表示协作机器人的末端位置；
表示协作机器人末端在样本长度为t时的阻尼矩阵；
表示协作机器人的末端速度；
表示在协作机器人末端在样本长度为t时的外界力；
表示未知刚度矩阵；Δx表示已知未知变化量；
表示未知阻尼矩阵；J表示已知雅克比矩阵；
表示已知关节速度。
根据权利要求1所述的方法，其特征在于，所述基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系之后，还包括：

使所述协作机器人不作周期性振动而又能快速地回到平衡位置，将设定未知阻尼矩阵
为临界阻尼值，即：

其中，Q和Λ分别为对称正定的未知刚度矩阵
的特征向量和特征值；η表示调节系数，

在所述协作机器人力矩控制模式下，设笛卡尔阻尼控制器实现末端理想力的执行如下：

其中，τ _d表示笛卡尔阻尼控制器实现末端理想力的执行；J′表示已知雅克比矩阵的转置；F _d表示协作机器人末端理想运动力轨迹；
表示机器人运动学模型，其中，θ表示已知关节角度，
表示已知关节速度，
表示已知关节加速度；

由协作机器人末端理想运动力轨迹F _d和笛卡尔阻尼控制器实现末端理想力的执行τ _d可知，所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵
决定，其中，
表示对称正定流形；

通过构建所述协作机器人末端力-刚度矩阵的技能模型f(K ^P|F)实现可调控刚度的运动技能学习。
根据权利要求1所述的方法，其特征在于，所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集，包括：

通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计，形成末端力-刚度矩阵数据集

其中，
表示协作机器人在样本长度为t和训练样本数量为m时的末端的力；T表示样本的长度；M表示训练样本的数量；
表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。
根据权利要求1所述的方法，其特征在于，所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集，包括：

根据刚度矩阵的对称性与正定性的几何约束，采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化
并转换到欧几里得到空间表征的刚度向量，形成末端力-刚度向量数据集

其中，
表示协作机器人在样本长度为t和训练样本数量为m时的末端的力；T表示样本的长度；M表示训练样本的数量；
表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵；
表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述，长度为m(m+1)/2；A _t,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵；A′ _t,m为A _t,m的转置。
根据权利要求1所述的方法，其特征在于，所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括：

采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模，获得建模结果如下：

其中，C表示高斯混合模型中的高斯分布的数量；π _c表示第c个高斯模型的先验概率，并且
μ _c和∑ _c分布表示第c个高斯模型的均值及协方差；F表示末端力；
表示高斯分布；V ^P协作机器人的上三角矩阵元素的向量化描述；

在给定训练样本和高斯模型数量C的前提下，高斯混合模型的参数通过期望最大化算法进行迭代优化获得；

在获得高斯混合模型的参数后，对于任意未知末端力F ^*输入时，利用高斯混合回归估计得到对应刚度向量V ^P*的条件概率分布f(V ^P|F ^*)。
根据权利要求1所述的方法，其特征在于，所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理，包括：

将所述条件概率分布作为高斯过程的均值函数，即有：

μ(F)＝p(V ^P|F)；

其中，V ^P协作机器人的上三角矩阵元素的向量化描述；F表示协作机器人末端的输入力；

将通过高斯过程协方差函数来应对外界给定刚度的约束情况，自动调整刚度轨迹；

假设末端力-刚度向量数据集中含有N样本
潜在的函数关系V ^P＝f(F)+ε，其中，ε～N(0,σ ²)是方差为未知σ ²的噪声；

当给定新的测试输入F ^*后，其对应的函数值为f(F ^*)和已有输出样本
之间存在以下联合分布关系：

式中，I表示N维单位矩阵；k ^*＝[k(F ^*,F ₁),k(F ^*,F ₂),…,k(F ^*,F _N)]，K表示由核函数定义的协方差矩阵；

由联合分布得到多变量高斯的条件概率分布P(f(F ^*)|V ^P)，其均值μ(F ^*)＝p(V ^P*|F ^*)由高斯混合模型-高斯回归获得，方差表示如下：

D(f(F ^*))＝k(F ^*,F ^*)-k ^*(K+σ ²I) ^-1k ^*′；

其中，k ^*′表示k ^*的转置。
根据权利要求8所述的方法，其特征在于，所述由核函数定义的协方差矩阵描述如下：

其中，k(.,.)表示核函数运算。
一种协作机器人可变刚度运动技能学习与调控系统，其特征在于，所述系统包括：

获得模块：用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理，获得协作机器人的末端位置、速度、加速度、外界接触力，形成数据集；

构建模块：用于基于所述数据集构建协作机器人与环境交互模型，获得协作机器人末端力-刚度矩阵关联关系；

估计模块：用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理，形成末端力-刚度矩阵数据集；

向量化模块：用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理，获得末端力-刚度向量数据集；

在线学习模块：用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习，获得学习结果，所述学习结果为条件概率分布；

调制控制模块：用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。