CN112947093B

CN112947093B - 一种机器人分散鲁棒跟踪控制方法、系统及存储介质

Info

Publication number: CN112947093B
Application number: CN202110372906.6A
Authority: CN
Inventors: 董博; 王悦西; 安天骄; 刘克平; 李洪文; 李元春
Original assignee: Changchun University of Technology
Current assignee: Changchun University of Technology
Priority date: 2021-04-07
Filing date: 2021-04-07
Publication date: 2023-05-05
Anticipated expiration: 2041-04-07
Also published as: CN112947093A

Abstract

本发明涉及一种本发明提供的机器人分散鲁棒跟踪控制方法、系统及存储介质。该机器人分散鲁棒跟踪控制方法通过采用RBF神经网络辨识笛卡尔空间的人类运动意图，然后依据获取的动力学模型和确定的人类运动意图构建分散鲁棒控制器，最后，利用模块化机器人关节空间与笛卡尔空间的映射关系，采用构建的这一分散鲁棒控制器根据所述人类运动意图控制模块化机器人关节的运动，以达到辨识人类运动意图的目的，实现人类和模块化机器人的实时交互控制，进而在提高模块化机器人运动轨迹控制效率和精确性的同时，使模块化机器人能够完全“顺应”人类的控制意图。

Description

一种机器人分散鲁棒跟踪控制方法、系统及存储介质

技术领域

本发明涉及机器人控制领域，特别是涉及一种机器人分散鲁棒跟踪控制方法、系统及存储介质。

背景技术

模块化机器人由电源、减速器、执行器、传感器和计算机系统组成。这些模块可以被组装成具有标准机械接口的预定参数，以满足各种任务的需求。从这一优势出发，模块化机器人经常被用于复杂危险的工作环境中代替人类进行工作，如救灾、勘探、高温作业等。

模块化机器人的重要特性就是机器人的模块可以添加/删除与替换，而不需要调整其他模块的控制参数。进而，对于模块化机器人系统，在子系统和控制器之间存在信息交换限制，所以对于模块化机器人系统来说，集中控制是不可靠的。

随着世界老龄化的趋势，人类与机器人的协作互动越来越密切，其中包括工业化生产和日常生活。传统机器人技术已经远远不能满足当前社会人类的需求。为了解决这些问题，与机器人进行物理交互协作就变成了重中之重。机器人在与人类进行物理人机交互的过程中，机器人的末端或者机器人关节连杆会与未知环境产生频繁的相互作用，如果不能实时的对当前环境任务做出正确的措施，轻则损坏机器人部分零部件，破坏机器人的性能，重则对于机器人交互的人体产生危害。为了解决以上问题，营造良好的人机交互环境是非常有必要的，避免机器人运动过程中对外部环境的冲击，保持其交互力的稳定性，也就是令机器人表现出柔顺性，可以提升物理人机交互的安全性与舒适性。

对于传统的机器人控制，预定义的任务会有人类预设的机器人预定轨迹即期望轨迹，但是在与人交互的作业中，机器人的轨迹是无法确定的，需要机器人表现出“顺应”人类进行运动的特性。因此，本领域亟需提供一种能够对人类运动意图进行辨识，进而对机器人进行有效控制的方法或系统。

发明内容

本发明的目的是提供一种能够对人类运动意图进行辨识，进而对机器人进行有效控制的机器人分散鲁棒跟踪控制方法、系统及存储介质。

为实现上述目的，本发明提供了如下方案：

一种机器人分散鲁棒跟踪控制方法，包括：

获取模块化机器人的动力学模型；

采用RBF神经网络辨识笛卡尔空间的人类运动意图；所述笛卡尔空间为与人类交互的工作空间；

利用模块化机器人的关节空间与笛卡尔空间的映射关系，得到关节空间的人类运动意图；

根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器；所述分散鲁棒控制器包括：自适应补偿器和鲁棒控制器；

采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。

优选地，所述模块化机器人的动力学模型为：

式中，i为模块化机器人的第i个关节子系统，I_mi为模块化机器人第i个转动轴的转动惯量，γ_i为模块化机器人第i个关节的齿轮传动比，q_i为第i关节子系统的关节位置，

为第i关节子系统的关节速度，

为第i关节子系统的关节加速度，q为关节子系统的关节位置，

为关节子系统的速度，

为关节子系统的加速度，

是第i个关节子系统的关节摩擦项，

是关节子系统间的耦合力矩交联项，τ_si是第i个关节子系统的关节耦合力矩，f_ext是人与模块化机器人交互产生的交互力，J_i是雅可比矩阵，τ_i是第i个关节子系统的电机输出转矩。

优选地，所述采用RBF神经网络辨识笛卡尔空间的人类运动意图，具体包括：

获取所述RBF神经网络结构；

基于所述RBF神经网络结构确定初始人类运动意图；

获取能量函数；

采用所述能量函数在线调整所述初始人类运动意图的权值，得到调整后的权值；

采用所述调整后的权值调整所述初始人类运动意图，得到最终的笛卡尔空间的人类运动意图。

优选地，所述采用所述能量函数在线调整所述初始人类运动意图的权值，得到调整后的权值，具体包括：

采用梯度下降法根据所述能量函数确定权值更新律；

根据所述权值更新率确定所述调整后的权值。

优选地，所述根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器，具体包括：

获取第一补偿控制律；所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律；所述建模确定项基于所述模块化机器人的动力学模型确定；

获取自适应补偿器的控制律和鲁棒控制器的控制律；

根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律；

根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律；所述第三补偿控制律即为所述分散鲁棒控制器的控制律。

根据本发明提供的具体实施例，本发明公开了以下技术效果：

本发明提供的机器人分散鲁棒跟踪控制方法，先采用RBF神经网络确定笛卡尔空间的人类运动意图，然后通过关节空间与笛卡尔空间的映射关系，确定关节空间下的控制变量，最后才设计的鲁棒控制器，实现对模块化机器人关节的控制，以达到辨识人类运动意图的目的，实现人类和模块化机器人的实时交互控制，进而在提高模块化机器人运动轨迹控制效率和精确性的同时，使模块化机器人能够完全“顺应”人类的控制意图。

对应于上述提供的机器人分散鲁棒跟踪控制方法，本发明还提供了以下虚拟系统：

一种机器人分散鲁棒跟踪控制系统，包括：

动力学模型获取模块，用于获取模块化机器人的动力学模型；

人类运动意图辨识模块，用于采用RBF神经网络辨识笛卡尔空间的人类运动意图；所述笛卡尔空间为与人类交互的工作空间；

人类运动意图确定模块，用于利用模块化机器人的关节空间与笛卡尔空间的映射关系，得到关节空间的人类运动意图；

分散鲁棒控制器构建模块，用于根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器；所述分散鲁棒控制器包括：自适应补偿器和鲁棒控制器；

运动控制模块，用于采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。

优选地，所述人类运动意图辨识模块具体包括：

网络结构获取单元，用于获取所述RBF神经网络结构；

初始人类运动意图确定单元，用于基于所述RBF神经网络结构确定初始人类运动意图；

能量函数获取单元，用于获取能量函数；

权值调整单元，用于采用所述能量函数在线调整所述初始人类运动意图的权值，得到调整后的权值；

最终的人类运动意图确定单元，用于采用所述调整后的权值调整所述初始人类运动意图，得到最终的笛卡尔空间的人类运动意图；所述最终的人类运动意图即为采用RBF神经网络辨识笛卡尔空间的人类运动意图。

优选地，所述权值调整单元具体包括：

权值更新律确定子单元，用于采用梯度下降法根据所述能量函数确定权值更新律；

权值调整子单元，用于根据所述权值更新率确定所述调整后的权值。

优选地，所述分散鲁棒控制器构建模块具体包括：

第一控制律获取单元，用于获取第一补偿控制律；所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律；所述建模确定项基于所述模块化机器人的动力学模型确定；

第二控制律获取单元，用于获取自适应补偿器的控制律和鲁棒控制器的控制律；

第一补偿控制律确定单元，用于根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律；

第二补偿控制律确定单元，用于根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律；所述第三补偿控制律即为所述分散鲁棒控制器的控制律。

此外，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令；所述计算机可执行指令设置为执行上述的机器人分散鲁棒跟踪控制方法。

因本发明提供的机器人分散鲁棒跟踪控制系统及存储介质所实现的技术效果与上述本发明提供的机器人分散鲁棒跟踪控制方法相同，因此，在此不再进行赘述。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的机器人分散鲁棒跟踪控制方法的流程图；

图2为本发明实施例提供的基于机器人分散鲁棒跟踪控制方法的控制原理图；

图3为本发明实施例提供的实施机器人分散鲁棒跟踪控制方法的流程图；

图4为本发明实施例提供的采用RBF神经网络进行人类运动意图辨识的流程图；

图5为采用本发明提供的机器人分散鲁棒跟踪控制方法进行实验时模块化机器人的关节位置跟踪曲线图；其中，图5(a)为模块化机器人关节1的位置跟踪曲线图；图5(b)为模块化机器人关节2的位置跟踪曲线图；

图6为采用本发明提供的机器人分散鲁棒跟踪控制方法进行实验时估计得到的人类运动意图曲线图；图6(a)为对应模块化机器人关节1的人类运动意图曲线图；图6(b)为对应模块化机器人关节2的人类运动意图曲线图；

图7为实验过程中采用本发明提供的机器人分散鲁棒跟踪控制方法使模块化机器人跟随人类运动意图时的关节位置跟踪误差曲线图；其中，图7(a)为对应模块化机器人关节1跟随人类运动意图时的关节位置跟踪误差曲线图；

图7(b)为对应模块化机器人关节2跟随人类运动意图时的关节位置跟踪误差曲线图；

图8为实验过程中采用本发明提供的机器人分散鲁棒跟踪控制方法使模块化机器人跟随人类意图的控制力矩曲线图；图8(a)为模块化机器人关节1跟随人类意图的控制力矩曲线图；图8(b)为模块化机器人关节2跟随人类意图的控制力矩曲线图；

图9为本发明提供的机器人分散鲁棒跟踪控制系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明提供的机器人分散鲁棒跟踪控制方法，包括：

步骤100：获取模块化机器人的动力学模型。其中，模块化机器人的动力学模型为：

式中，i为模块化机器人的第i个关节子系统，I_mi为模块化机器人第i个转动轴的转动惯量，γ_i为模块化机器人第i关节的齿轮传动比，q_i为第i关节子系统的关节位置，

为第i关节子系统的速度，

为第i关节子系统的加速度，q为关节子系统的关节位置，

为关节子系统的速度，

为关节子系统的加速度，

是第i个关节子系统的关节摩擦项，

是关节子系统间的耦合力矩交联项，τ_si是第i关节的耦合力矩，f_ext是人与模块化机器人交互产生的交互力，J_i是雅可比矩阵，τ_i是第i个关节子系统的电机输出转矩。

步骤101：采用RBF神经网络辨识笛卡尔空间的人类运动意图。笛卡尔空间为与人类交互的工作空间。

步骤102：利用模块化机器人关节空间与笛卡尔空间的映射关系，得到关节空间的人类运动意图。

步骤103：根据关节空间的人类运动意图和模块化机器人的动力学模型构建分散鲁棒控制器。分散鲁棒控制器包括：自适应补偿器和鲁棒控制器。

步骤104：采用分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。

根据步骤100中获取模块化机器人的动力学模型进一步可以推得：

关节摩擦项

表示为关于关节位置和速度的函数：

其中，b_fi是粘性摩擦系数，f_ci是库伦摩擦相关系数，f_si是静态相关系数，f_τi是关于Stribeck效应的位置参数，

是位置误差和其他摩擦模型误差。假设f_si和f_τi的标称值和它们的实际值是相接近的，可以通过标称参数值

和

来线性化

忽略高阶项后可以得到：

结合式(2)和式(3)，关节摩擦项

可以近似等于：

其中，

表示摩擦参数不确定项，

分别为给定的摩擦参数的估计值，且与

有关的矩阵

表示为：

此外，式(1)中的关节子系统间的耦合力矩交联项

可以表示为：

其中，z_mi是第i个转子旋转轴上的单位矢量，z_lj是第j个关节旋转轴上的单位矢量，z_lk是第k个关节旋转轴上的单位矢量。

便于分析关节子系统间的耦合力矩交联项，将

与

表示为：

通过重写(7)(8)式得到：

其中，

i,j,k分别代表第i,j,k个关节。

是单位向量z_mi与z_lj的点积，

是校正误差。

是单位向量z_mi与z_lk×z_lj的点积，

是校正误差。同时，将U_zi与V_zi考虑为各关节子系统相互耦合的模型不确定性。

重新改写式(1)中第i个子系统的动力学模型可以得到：

其中，与转动惯量I_mi和传动比γ_i有关的量表示为B_i＝(I_miγ_i)^-1∈R⁺。用第i关节子系统的关节位置与速度定义第i子系统的状态向量

同时给定新的控制力矩输入u_i＝τ_i。

第i个子系统的状态空间S_i的形式可以表示为：

其中

表示动力学模型中已建模部分，h_i(x)＝B_i(U_zi+V_zi)表示耦合力矩交联项，

是模型不确定项，包括摩擦模型误差和外界扰动。

性质1：根据摩擦力模型(4)，如果参数b_fi，f_ci，f_si和f_τi都是有界的，可以得出

是有界的，且

ρ_Fil＝[ρ_Fi1,ρ_Fi2,ρ_Fi3,ρ_Fi4]^T是一个已知的常数向量，ρ_Fi1,ρ_Fi2,ρ_Fi3,ρ_Fi4为已知的正常数上界。因此，摩擦力模型的上界可以定义为

性质2：摩擦力项

有界，且

ρ_fpi对于任意的位置q_i与速度

是一个已知的有界常数。

性质3：z_mi，z_lk与z_lj是沿着相应关节旋转方向的单位矢量，

与

得到的向量乘积是有界的。此外，当关节稳定时，它的加速度与速度一定是有界的，因此，根据在(7)与(8)中交联项的形式，可以得出这样的结论：如果关节j和关节k是稳定的(j,k＜i)，那么

与

是有界的，且满足

ρ_Ui与ρ_Vi是已知正常数上界。由此可知，性质3说明了如果关节j和关节k是稳定的(j,k＜i)，那么

与

是有界的，这意味着当设计第i个关节的控制器时，低阶关节i-1也已经是稳定的。

在传统的机器人轨迹跟踪任务中，往往是通过人为给出预定的期望轨迹，直接用于控制系统设计。然而，在物理人机交互的背景下，模块化机器人的期望轨迹是不确定的，是与机器人所交互的人类决定的。因此，在本发明中优选通过使用弹簧质量阻尼模型来近似人类肢体模型，进而通过RBF神经网络来近似估计人类的运动意图，描述人类肢体动力学模型如下：

其中M_H,C_H与G_H分别代表人类肢体质量、阻尼与弹簧矩阵，并且都是对角矩阵。同时，z代表笛卡尔空间下的模块化机器人运动的实时轨迹，即模块化机器人在笛卡尔空间下的实际位置，z_Hd作为交互期间人类伙伴所规划的笛卡尔空间的模块化机器人运动轨迹，并且在本发明中称为人类运动意图。由于在此模型中，阻尼项与弹簧项通常占主导地位，可以得到如下的近似模型：

然而，C_H和G_H都是与z和

相关的位置方程，所以可以将其写成

和G_H(z)。同时，考虑人类运动意图z_Hd是由交互力f_ext、实际位置z与速度

所估计的，如下式所示：

其中，F(·)代表位置方程。同时可以提出下列假设：

假设1：在物理人机交互背景下的模块化机器人跟踪控制任务中，人类运动意图是由人与模块化机器人的交互点处的交互力f_ext、实际位置z与速度

所决定的。假设1是本发明所开发的估计方法的基础。在本发明的最后，将通过实验验证该方法的有效性。

在同时考虑人体肢体参数的时变与不确定性下，F(·)是与C_HG_H有关的非线性函数。在人与模块化机器人交互作业过程中，人会改变其肢体参数，这使得估计人类运动意图z_Hd变得非常困难。由于机器学习具有可以发现内在信息、映射位置关系与近似函数的特性，所以提出采用机器学习的方法来解决此问题。基本的估计思想就是通过使用与

z有关的线性参数化函数来近似z_Hd，同时为此估计方法设计权值自适应更新律。

那么，上述步骤101采用RBF神经网络辨识笛卡尔空间的人类运动意图的过程具体包括：

步骤1011：获取RBF神经网络结构。RBF神经网络结构如下所示：

其中，

表示为l的连续函数，l∈Ω_l∈R^m是RBF神经网络的输入，p为神经网络的节点数，μ_k＝[μ_k,1,μ_k,2,...,μ_k,m]^T为径向基函数的中心值，η_k为高斯函数的带宽，W为神经网络的权值向量。

步骤1012：基于RBF神经网络结构确定初始人类运动意图。通过使用RBF神经网络，人类运动意图与其估计量给出如下式：

其中

为RBF神经网络的输入，ε_i为估计误差，

为理想权值W_xi的估计量，同时可以看出，当p足够大的时候，ε_i会足够小。

步骤1013：获取能量函数。能量函数为：

步骤1014：采用能量函数在线调整初始人类运动意图的权值，得到调整后的权值。由于S_i(l_i)是l_i的函数，所以可以通过(16)式采用梯度搜索技术，以期使网络的实际输出值与期望输出值的误差均方值最小，反向传播得到

本发明的控制目标是使模块化机器人“主动”跟随人类移动到人所期望模块化机器人移动的位置，同时控制交互力f_ext最小。因此，根据如下的能量函数进行在线调整权值

权值的调整过程具体包括：

步骤1014-1：采用梯度下降法根据能量函数确定权值更新律。具体的，

根据式(17)，采用梯度下降法求取权值更新律：

其中，α_i′是一个正常数，式(18)中

可以根据式(13)求取，如下所示：

同时，

可以根据式(16)求取，如下所示：

将式(19)、式(20)代入式(18)中，可以得到权值更新律为：

其中，α_i＝α_i′G_H,i和G_H,i是人类肢体动力学参数且未知，所以可以直接由α_i表示。进而，可以得到

的更新律如下所示：

根据(22)式可知，

可以在线获得。由于人可以任意时刻随时改变他的运动意图，所以这是一个有利的特性。

步骤1014-2：根据权值更新率确定调整后的权值。

步骤1015：采用调整后的权值调整初始人类运动意图，得到最终的人类运动意图。最终的人类运动意图即为采用RBF神经网络确定的人类运动意图。具体的，由(22)式带入(16)式可以得到估计的人类运动意图。

那么，基于以上步骤101中已经确定的人类运动意图，可以通过模块化机器人关节空间与笛卡尔空间的映射关系得到关节空间内的人类运动意图，所述关节空间内的人类运动意图直接作用到模块化机器人控制系统当中，通过结合模块化机器人的动力学模型(即公式(1))与所估计出的关节空间内的人类运动意图，给出作用到模块化机器人系统中的分散鲁棒控制器，其具体过程为：

利用模块化机器人关节空间与笛卡尔空间的映射关系，可以根据估计出的笛卡尔空间的人类运动意图映射到关节空间进行控制，关节空间内的人类运动意图

定义如下：

其中，笛卡尔空间对关节空间的映射矩阵为ξ^-1(·)，

代表在第i个子系统的所估计的人类运动意图。

基于给出的状态空间式(11)与模块化机器人动力学模型式(1)，基于人类运动意图辨识的分散鲁棒控制器。

在物理人机交互的背景下，模块化机器人需要跟踪所估计出的人类运动意图。进而，本发明定义以下与关节位置和速度有关的控制变量：

其中，λ_i是任意正常数。

上述步骤103具体包括：

步骤1031：获取第一补偿控制律。第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律。建模确定项基于模块化机器人的动力学模型确定。

步骤1032：获取自适应补偿器的控制律和鲁棒控制器的控制律。

步骤1033：根据自适应补偿器的控制律和鲁棒控制器的控制律确定第二补偿控制律。

步骤1034：根据第一补偿控制律和第二补偿控制律确定第三补偿控制律。第三补偿控制律即为分散鲁棒控制器的控制律。

基于此，步骤104实质是将第三补偿控制律直接作用到模块化机器人系统，根据辨识出的人类运动意图控制模块化机器人关节的运动。

进一步，上述步骤1031-1034的具体过程为：

控制律的设计采用了分解控制设计的思想，将控制律设计成如下所示：

u_i＝u_i1+u_i2 (25)

其中u_i1用来补偿被传感器测得的交互力与精确建模确定项，其中包括电机转动惯量与电机摩擦项，而u_i2则被用来补偿各种不确定项，例如摩擦不确定性项与各子系统之间的耦合交联项。

对于第i关节子系统的精确建模确定项与交互力的补偿控制律u_i1(即第一补偿控制律)如下所示：

对于第i关节子系统的摩擦非参数不确定项

如果参数不确定性被认为是不确定的常数，那么不确定性可以被积分补偿器所补偿。然而在现实中，模型参数的不确定性总是随着温度、润滑度等原因而并非为恒定常熟。所以，将其与可变参数模型不确定性补偿器结合，摩擦参数不确定性

被分解为如下所示：

其中

为一个未知的常向量称为常参数不确定性，

是一个变量且有上界，称之为变量不确定性，如下所示：

与分散控制律的设计理念相同，基于分解控制设计方法，设计一个自适应补偿器来补偿常参数不确定性

同时设计一个鲁棒控制律用来补偿变量不确定性

其控制器形式如下所示：

其中，

是被设计用来补偿摩擦非线性不确定项

和

则是被分别设计用来补偿摩擦参数不确定

和

由于对每个关节子系统的摩擦项的补偿都是相同的，所以定义以下控制律为：

其中

都是正的控制变量。

模块化机器人系统被分为相互耦合且关联的子系统，且各个子系统之间有强耦合性，称其为耦合交联项，如式(9)所示。对其耦合交联不确定进行分析，采用与摩擦分析相同的分解控制策略，将其耦合交联不确定性分成一个未知定常数与一个有上界的未知变量，如下所示：

U_zi＝U_zic+U_ziv, (32)

V_zi＝V_zic+V_ziv, (33)

其中U_ziv与V_ziv是有上界的变量，如下所示：

|U_ziv|≤ρ_Uiv,|V_ziv|≤ρ_Viv, (34)

对于耦合交联项之一的U_zi项，与设计摩擦不确定性补偿控制律相同，设计一个自适应补偿器

来补偿常数不确定性部分U_zic，同时设计一个鲁棒控制器

来补偿变量不确定性部分U_ziv。且具体控制律如下所示：

其中υ_ivn＝k_icnr_i与

都是一个正的控制变量。

与U_zi项相同，耦合交联项的另一部分V_zi也采用同样的思想来设计控制律，如下所示：

其中自适应补偿器u_vicn是被设计用来补偿常数不确定性部分V_zic，鲁棒控制器uvivn是被设计用来补偿变量不确定部分V_ziv。且

与

是一个正的控制变量。

将式(29)(30)(31)(35)(36)联立，得到不确定性补偿控制律u_i2(即第二补偿控制律)如下所示：

将式(37)与式(26)联立，得到模块化机器人系统的分散鲁棒控制律(即第三补偿控制律)如下所示：

将分散鲁棒控制律式(37)带入模块化机器人系统模型式(1)中得到第i关节子系统的闭环表达式如下所示：

基于公式(39)即可完成模块模块化机器人依据人类意图进行运动的控制，其整个控制流程如图4所示。

综上，如图2所示，物理人机交互情形下与传统模块化机器人跟踪控制问题并不相同：传统模块化机器人跟踪控制问题有人类预设的期望轨迹，模块化机器人跟随期望轨迹运行。而物理人机交互下的跟踪问题则没有预设的期望轨迹，模块化机器人跟踪人类的运动意图进行“柔顺”运动。根据末端的力传感器与关节位置来判断是否有交互行为，并由RBF神经网络来近似估计人类运动意图，使模块化机器人进行跟踪。根据人类运动意图信息，与关节输出力矩/摩擦参数估计值与控制器参数相结合得到基于局部动力学信息的模型确定第一补偿控制律u_i1。同时设计各关节子系统的第二补偿控制律u_i2。把u_i1与u_i2相加，得到分散鲁棒控制律(即第三补偿控制律)，运用到动力学模型，获得关节位置变量，与估计出的人类运动意图做差得到位置误差，进而作用到控制器当中。

如图3所示，本发明提供的基于人类运动意图辨识的模块化机器人分散鲁棒跟踪控制在具体实施过程中，主要包括以下步骤：首先初始化系统并建立模块化机器人系统的动力学模型，同时判断人是否与模块化机器人交互，若不是，则进一步初始化并判断是否有交互行为，若是，则通过RBF神经网络辨识笛卡尔空间的人类运动意图，同时判断模型确定项是否得到补偿，若没有，则得到基于局部动力学信息的模型确定项补偿，若是，则判断是否模型不确定项是否得到补偿，若没有，则得到分散鲁棒控制律u_i2，若是，则得到分散跟踪控制器。然后存储数据，最后输出结果。

下面以实验方式验证本发明上述提供的机器人分散鲁棒跟踪控制方法的有效性。

为了研究所提出的鲁棒神经网络分散控制方法的有效性，建立一个2自由度的模块化机器人实验平台，该2自由度模块化机器人由两组关节模块和连杆组成，其中每个关节模块包含一个由Maxon公司生产的直流有刷电动机，型号为218014，最大输出扭矩为190Nm，转动惯量为118g/cm2。一个谐波传动装置与电动机输出相连用于减速器，减速比为101:1。在电机端安装了一个Maxon公司生产的增量式编码器，型号为：HEDL-5540-A11，它的精度为500count/rev，用来测量电机端的位移。在连杆端安装了一个由Netzer公司生产的绝对式编码器，型号为DS-70-64-3SH-S0，它拥有19位精度，用来采集连杆端的绝对位置数据。采用Quanser公司生产的线性功率放大器驱动关节模块的电动机和QPIDe数据采集卡采集各传感器的数据，用于模块化机器人控制。

实验用到的模块化机器人的各项参数如下表给出：

表1控制器参数设置

在人机交互开始阶段，模块化机器人改变静止状态与人接触，所以会有轻微的抖振现象。

如图5所示，高性能的跟踪是基于RBF神经网络对人类运动意图辨识来实现的。所估计的运动意图可以在很短时间内被模块化机器人跟踪。

如图6所示，在第8秒时，人与模块化机器人开始物理交互，可以看到模块化机器人表现出“主动”移动行为去跟踪所估计的人类运动意图。

图7中可以看出，在人机物理交互过程中，关节位置的稳态误差减小，由于动态补偿是通过模型补偿器与鲁棒控制器来实现的，所以可以控制关节位置误差控制在很小的数量级。

在图8所示的曲线中，控制力矩是连续、平滑的电机输出力矩，可以在实际的模块化机器人系统上实施的。本发明提出的基于人类运动意图辨识的鲁棒控制方法可以保证系统闭环渐进稳定，而且优化保持在适当范围内的功率消耗，以匹配每个连接模块中电机的输出功率。

以上实验结果表明，本发明所提出的机器人分散鲁棒跟踪控制方法能为模块化机器人提供稳定性和精确性，以满足人机交互任务的要求。

如图9所示，本发明提供的机器人分散鲁棒跟踪控制系统，包括：动力学模型获取模块1、人类运动意图辨识模块2、人类运动意图确定模块3、分散鲁棒控制器构建模块4和运动控制模块5。

其中，动力学模型获取模块1用于获取模块化机器人的动力学模型。

人类运动意图辨识模块2用于采用RBF神经网络辨识笛卡尔空间的人类运动意图。笛卡尔空间为模块化机器人与人交互的工作空间。

人类运动意图确定模块3，用于利用模块化机器人关节空间与笛卡尔空间的映射关系，得到关节空间内的人类运动意图。

分散鲁棒控制器构建模块4用于根据人类运动意图和模块化机器人的动力学模型构建分散鲁棒控制器。分散鲁棒控制器包括：自适应补偿器和鲁棒控制器。

运动控制模块5用于分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。

进一步，上述人类运动意图辨识模块2优选包括：网络结构获取单元、初始人类运动意图确定单元、能量函数获取单元、权值调整单元和最终的人类运动意图确定单元。

其中，网络结构获取单元用于获取RBF神经网络结构。

初始人类运动意图确定单元用于基于RBF神经网络结构确定初始人类运动意图。

能量函数获取单元用于获取能量函数。

权值调整单元用于采用能量函数在线调整初始人类运动意图的权值，得到调整后的权值。

最终的人类运动意图确定单元用于采用调整后的权值调整初始人类运动意图，得到最终的人类运动意图。最终的人类运动意图即为采用RBF神经网络确定的人类运动意图。

进一步，上述权值调整单元优选包括：权值更新律确定子单元和权值调整子单元。

其中，权值更新律确定子单元用于采用梯度下降法根据能量函数确定权值更新律。

权值调整子单元用于根据权值更新率确定调整后的权值。

进一步，上述分散鲁棒控制器构建模块4优选包括：第一控制律获取单元、第二控制律获取单元、第一补偿控制律确定单元和第二补偿控制律确定单元。

其中，第一控制律获取单元用于获取第一补偿控制律。第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律。建模确定项基于模块化机器人的动力学模型确定。

第二控制律获取单元用于获取自适应补偿器的控制律和鲁棒控制器的控制律。

第一补偿控制律确定单元用于根据自适应补偿器的控制律和鲁棒控制器的控制律确定第二补偿控制律。

第二补偿控制律确定单元用于根据第一补偿控制律和第二补偿控制律确定第三补偿控制律。第三补偿控制律即为分散鲁棒控制器的控制律。

基于此，运动控制模块5将第三补偿控制律直接作用到模块化机器人系统，根据人类运动意图控制模块化机器人关节的运动。

此外，本发明还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令。计算机可执行指令设置为执行上述的机器人分散鲁棒跟踪控制方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种机器人分散鲁棒跟踪控制方法，其特征在于，包括：

获取模块化机器人的动力学模型；所述模块化机器人的动力学模型为：

式中，i为模块化机器人的第i个关节子系统，I_mi为模块化机器人转动轴的转动惯量，γ_i为模块化机器人的齿轮传动比，q_i为第i关节子系统的关节位置，

为第i关节子系统的速度，

为第i关节子系统的加速度，q为关节子系统的关节位置，

为关节子系统的速度，

为关节子系统的加速度，

是关节摩擦项，

是关节子系统间的耦合力矩交联项，τ_si是关节耦合力矩，f_ext是人与模块化机器人交互产生的交互力，J_i是雅可比矩阵，τ_i是电机输出转矩；

根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器；所述分散鲁棒控制器包括：自适应补偿器和鲁棒控制器；

采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动；

所述根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器，具体包括：

获取第一补偿控制律；所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律；所述建模确定项基于所述模块化机器人的动力学模型确定；其中，第一补偿控制律为：

获取自适应补偿器的控制律和鲁棒控制器的控制律；

根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律；其中，第二补偿控制律为：

根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律；所述第三补偿控制律即为所述分散鲁棒控制器的控制律；其中，第三补偿控制律为：

将第三补偿控制律带入模块化机器人的动力学模型中得到第i关节子系统的闭环表达式；其中，第i关节子系统的闭环表达式为：

基于第i关节子系统的闭环表达式完成模块化机器人依据人类意图进行运动的控制；

式中，u_i1为第一补偿控制律，

为给定的摩擦参数的估计值，

为，a_i为人类肢体动力学参数，u_i2为第二补偿控制律，

为被设计用来补偿摩擦非线性不确定项

的控制律，

为与关节子系统的速度

有关的矩阵，

为用来补偿常参数不确定

的控制律，

为用来补偿变量不确定

的控制律，u_uicn和u_vicn均为自适应补偿器，u_uivn和u_vivn均为鲁棒控制器，u_i为第三补偿控制律，λ为控制器参数，r_i为控制变量，

为控制变量r_i的估计值，U_zi和V_zi为各关节子系统相互耦合的模型不确定性。

2.根据权利要求1所述的机器人分散鲁棒跟踪控制方法，其特征在于，所述采用RBF神经网络辨识笛卡尔空间的人类运动意图，具体包括：

获取所述RBF神经网络结构；

基于所述RBF神经网络结构确定初始人类运动意图；

获取能量函数；

采用所述调整后的权值调整所述初始人类运动意图，得到最终的笛卡尔空间的人类运动意图；所述最终的人类运动意图即为采用RBF神经网络辨识笛卡尔空间的人类运动意图。

3.根据权利要求2所述的机器人分散鲁棒跟踪控制方法，其特征在于，所述采用所述能量函数在线调整所述初始人类运动意图的权值，得到调整后的权值，具体包括：

采用梯度下降法根据所述能量函数确定权值更新律；

根据所述权值更新率确定所述调整后的权值。

4.一种机器人分散鲁棒跟踪控制系统，其特征在于，包括：

动力学模型获取模块，用于获取模块化机器人的动力学模型；所述模块化机器人的动力学模型为：

为第i关节子系统的速度，

为第i关节子系统的加速度，q为关节子系统的关节位置，

为关节子系统的速度，

为关节子系统的加速度，

是关节摩擦项，

分散鲁棒控制器构建模块，用于根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器；所述分散鲁棒控制器包括：自适应补偿器和鲁棒控制器；

运动控制模块，用于采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动；

所述分散鲁棒控制器构建模块具体包括：

第一控制律获取单元，用于获取第一补偿控制律；所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律；所述建模确定项基于所述模块化机器人的动力学模型确定；其中，第一补偿控制律为：

第一补偿控制律确定单元，用于根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律；其中，第二补偿控制律为：

第二补偿控制律确定单元，用于根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律；所述第三补偿控制律即为所述分散鲁棒控制器的控制律；其中，第三补偿控制律为：

式中，u_i1为第一补偿控制律，

为给定的摩擦参数的估计值，

为，a_i为人类肢体动力学参数，u_i2为第二补偿控制律，

为被设计用来补偿摩擦非线性不确定项

的控制律，

为与关节子系统的速度

有关的矩阵，

为用来补偿常参数不确定

的控制律，

为用来补偿变量不确定

5.根据权利要求4所述的机器人分散鲁棒跟踪控制系统，其特征在于，所述人类运动意图辨识模块具体包括：

网络结构获取单元，用于获取所述RBF神经网络结构；

能量函数获取单元，用于获取能量函数；

6.根据权利要求5所述的机器人分散鲁棒跟踪控制系统，其特征在于，所述权值调整单元具体包括：

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令；所述计算机可执行指令设置为执行如权利要求1-3任意一项所述的机器人分散鲁棒跟踪控制方法。