CN112947093B - 一种机器人分散鲁棒跟踪控制方法、系统及存储介质 - Google Patents
一种机器人分散鲁棒跟踪控制方法、系统及存储介质 Download PDFInfo
- Publication number
- CN112947093B CN112947093B CN202110372906.6A CN202110372906A CN112947093B CN 112947093 B CN112947093 B CN 112947093B CN 202110372906 A CN202110372906 A CN 202110372906A CN 112947093 B CN112947093 B CN 112947093B
- Authority
- CN
- China
- Prior art keywords
- control law
- robot
- joint
- human
- compensation control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 241000282414 Homo sapiens Species 0.000 claims abstract description 164
- 238000013528 artificial neural network Methods 0.000 claims abstract description 40
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 230000003993 interaction Effects 0.000 claims description 35
- 230000003044 adaptive effect Effects 0.000 claims description 21
- 230000008878 coupling Effects 0.000 claims description 18
- 238000010168 coupling process Methods 0.000 claims description 18
- 238000005859 coupling reaction Methods 0.000 claims description 18
- 230000001133 acceleration Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 24
- 238000013461 design Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000004132 cross linking Methods 0.000 description 3
- 238000013016 damping Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- MFRCZYUUKMFJQJ-UHFFFAOYSA-N 1,4-dioxane-2,5-dione;1,3-dioxan-2-one Chemical compound O=C1OCCCO1.O=C1COC(=O)CO1 MFRCZYUUKMFJQJ-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241000364483 Lipeurus epsilon Species 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000009133 cooperative interaction Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000005461 lubrication Methods 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本发明涉及一种本发明提供的机器人分散鲁棒跟踪控制方法、系统及存储介质。该机器人分散鲁棒跟踪控制方法通过采用RBF神经网络辨识笛卡尔空间的人类运动意图,然后依据获取的动力学模型和确定的人类运动意图构建分散鲁棒控制器,最后,利用模块化机器人关节空间与笛卡尔空间的映射关系,采用构建的这一分散鲁棒控制器根据所述人类运动意图控制模块化机器人关节的运动,以达到辨识人类运动意图的目的,实现人类和模块化机器人的实时交互控制,进而在提高模块化机器人运动轨迹控制效率和精确性的同时,使模块化机器人能够完全“顺应”人类的控制意图。
Description
技术领域
本发明涉及机器人控制领域,特别是涉及一种机器人分散鲁棒跟踪控制方法、系统及存储介质。
背景技术
模块化机器人由电源、减速器、执行器、传感器和计算机系统组成。这些模块可以被组装成具有标准机械接口的预定参数,以满足各种任务的需求。从这一优势出发,模块化机器人经常被用于复杂危险的工作环境中代替人类进行工作,如救灾、勘探、高温作业等。
模块化机器人的重要特性就是机器人的模块可以添加/删除与替换,而不需要调整其他模块的控制参数。进而,对于模块化机器人系统,在子系统和控制器之间存在信息交换限制,所以对于模块化机器人系统来说,集中控制是不可靠的。
随着世界老龄化的趋势,人类与机器人的协作互动越来越密切,其中包括工业化生产和日常生活。传统机器人技术已经远远不能满足当前社会人类的需求。为了解决这些问题,与机器人进行物理交互协作就变成了重中之重。机器人在与人类进行物理人机交互的过程中,机器人的末端或者机器人关节连杆会与未知环境产生频繁的相互作用,如果不能实时的对当前环境任务做出正确的措施,轻则损坏机器人部分零部件,破坏机器人的性能,重则对于机器人交互的人体产生危害。为了解决以上问题,营造良好的人机交互环境是非常有必要的,避免机器人运动过程中对外部环境的冲击,保持其交互力的稳定性,也就是令机器人表现出柔顺性,可以提升物理人机交互的安全性与舒适性。
对于传统的机器人控制,预定义的任务会有人类预设的机器人预定轨迹即期望轨迹,但是在与人交互的作业中,机器人的轨迹是无法确定的,需要机器人表现出“顺应”人类进行运动的特性。因此,本领域亟需提供一种能够对人类运动意图进行辨识,进而对机器人进行有效控制的方法或系统。
发明内容
本发明的目的是提供一种能够对人类运动意图进行辨识,进而对机器人进行有效控制的机器人分散鲁棒跟踪控制方法、系统及存储介质。
为实现上述目的,本发明提供了如下方案:
一种机器人分散鲁棒跟踪控制方法,包括:
获取模块化机器人的动力学模型;
采用RBF神经网络辨识笛卡尔空间的人类运动意图;所述笛卡尔空间为与人类交互的工作空间;
利用模块化机器人的关节空间与笛卡尔空间的映射关系,得到关节空间的人类运动意图;
根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器;所述分散鲁棒控制器包括:自适应补偿器和鲁棒控制器;
采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。
优选地,所述模块化机器人的动力学模型为:
式中,i为模块化机器人的第i个关节子系统,Imi为模块化机器人第i个转动轴的转动惯量,γi为模块化机器人第i个关节的齿轮传动比,qi为第i关节子系统的关节位置,为第i关节子系统的关节速度,为第i关节子系统的关节加速度,q为关节子系统的关节位置,为关节子系统的速度,为关节子系统的加速度,是第i个关节子系统的关节摩擦项,是关节子系统间的耦合力矩交联项,τsi是第i个关节子系统的关节耦合力矩,fext是人与模块化机器人交互产生的交互力,Ji是雅可比矩阵,τi是第i个关节子系统的电机输出转矩。
优选地,所述采用RBF神经网络辨识笛卡尔空间的人类运动意图,具体包括:
获取所述RBF神经网络结构;
基于所述RBF神经网络结构确定初始人类运动意图;
获取能量函数;
采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值;
采用所述调整后的权值调整所述初始人类运动意图,得到最终的笛卡尔空间的人类运动意图。
优选地,所述采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值,具体包括:
采用梯度下降法根据所述能量函数确定权值更新律;
根据所述权值更新率确定所述调整后的权值。
优选地,所述根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器,具体包括:
获取第一补偿控制律;所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律;所述建模确定项基于所述模块化机器人的动力学模型确定;
获取自适应补偿器的控制律和鲁棒控制器的控制律;
根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律;
根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律;所述第三补偿控制律即为所述分散鲁棒控制器的控制律。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的机器人分散鲁棒跟踪控制方法,先采用RBF神经网络确定笛卡尔空间的人类运动意图,然后通过关节空间与笛卡尔空间的映射关系,确定关节空间下的控制变量,最后才设计的鲁棒控制器,实现对模块化机器人关节的控制,以达到辨识人类运动意图的目的,实现人类和模块化机器人的实时交互控制,进而在提高模块化机器人运动轨迹控制效率和精确性的同时,使模块化机器人能够完全“顺应”人类的控制意图。
对应于上述提供的机器人分散鲁棒跟踪控制方法,本发明还提供了以下虚拟系统:
一种机器人分散鲁棒跟踪控制系统,包括:
动力学模型获取模块,用于获取模块化机器人的动力学模型;
人类运动意图辨识模块,用于采用RBF神经网络辨识笛卡尔空间的人类运动意图;所述笛卡尔空间为与人类交互的工作空间;
人类运动意图确定模块,用于利用模块化机器人的关节空间与笛卡尔空间的映射关系,得到关节空间的人类运动意图;
分散鲁棒控制器构建模块,用于根据所述关节空间的人类运动意图和所述块模化机器人的动力学模型构建分散鲁棒控制器;所述分散鲁棒控制器包括:自适应补偿器和鲁棒控制器;
运动控制模块,用于采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。
优选地,所述人类运动意图辨识模块具体包括:
网络结构获取单元,用于获取所述RBF神经网络结构;
初始人类运动意图确定单元,用于基于所述RBF神经网络结构确定初始人类运动意图;
能量函数获取单元,用于获取能量函数;
权值调整单元,用于采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值;
最终的人类运动意图确定单元,用于采用所述调整后的权值调整所述初始人类运动意图,得到最终的笛卡尔空间的人类运动意图;所述最终的人类运动意图即为采用RBF神经网络辨识笛卡尔空间的人类运动意图。
优选地,所述权值调整单元具体包括:
权值更新律确定子单元,用于采用梯度下降法根据所述能量函数确定权值更新律;
权值调整子单元,用于根据所述权值更新率确定所述调整后的权值。
优选地,所述分散鲁棒控制器构建模块具体包括:
第一控制律获取单元,用于获取第一补偿控制律;所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律;所述建模确定项基于所述模块化机器人的动力学模型确定;
第二控制律获取单元,用于获取自适应补偿器的控制律和鲁棒控制器的控制律;
第一补偿控制律确定单元,用于根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律;
第二补偿控制律确定单元,用于根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律;所述第三补偿控制律即为所述分散鲁棒控制器的控制律。
此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令;所述计算机可执行指令设置为执行上述的机器人分散鲁棒跟踪控制方法。
因本发明提供的机器人分散鲁棒跟踪控制系统及存储介质所实现的技术效果与上述本发明提供的机器人分散鲁棒跟踪控制方法相同,因此,在此不再进行赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的机器人分散鲁棒跟踪控制方法的流程图;
图2为本发明实施例提供的基于机器人分散鲁棒跟踪控制方法的控制原理图;
图3为本发明实施例提供的实施机器人分散鲁棒跟踪控制方法的流程图;
图4为本发明实施例提供的采用RBF神经网络进行人类运动意图辨识的流程图;
图5为采用本发明提供的机器人分散鲁棒跟踪控制方法进行实验时模块化机器人的关节位置跟踪曲线图;其中,图5(a)为模块化机器人关节1的位置跟踪曲线图;图5(b)为模块化机器人关节2的位置跟踪曲线图;
图6为采用本发明提供的机器人分散鲁棒跟踪控制方法进行实验时估计得到的人类运动意图曲线图;图6(a)为对应模块化机器人关节1的人类运动意图曲线图;图6(b)为对应模块化机器人关节2的人类运动意图曲线图;
图7为实验过程中采用本发明提供的机器人分散鲁棒跟踪控制方法使模块化机器人跟随人类运动意图时的关节位置跟踪误差曲线图;其中,图7(a)为对应模块化机器人关节1跟随人类运动意图时的关节位置跟踪误差曲线图;
图7(b)为对应模块化机器人关节2跟随人类运动意图时的关节位置跟踪误差曲线图;
图8为实验过程中采用本发明提供的机器人分散鲁棒跟踪控制方法使模块化机器人跟随人类意图的控制力矩曲线图;图8(a)为模块化机器人关节1跟随人类意图的控制力矩曲线图;图8(b)为模块化机器人关节2跟随人类意图的控制力矩曲线图;
图9为本发明提供的机器人分散鲁棒跟踪控制系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种能够对人类运动意图进行辨识,进而对机器人进行有效控制的机器人分散鲁棒跟踪控制方法、系统及存储介质。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供的机器人分散鲁棒跟踪控制方法,包括:
步骤100:获取模块化机器人的动力学模型。其中,模块化机器人的动力学模型为:
式中,i为模块化机器人的第i个关节子系统,Imi为模块化机器人第i个转动轴的转动惯量,γi为模块化机器人第i关节的齿轮传动比,qi为第i关节子系统的关节位置,为第i关节子系统的速度,为第i关节子系统的加速度,q为关节子系统的关节位置,为关节子系统的速度,为关节子系统的加速度,是第i个关节子系统的关节摩擦项,是关节子系统间的耦合力矩交联项,τsi是第i关节的耦合力矩,fext是人与模块化机器人交互产生的交互力,Ji是雅可比矩阵,τi是第i个关节子系统的电机输出转矩。
步骤101:采用RBF神经网络辨识笛卡尔空间的人类运动意图。笛卡尔空间为与人类交互的工作空间。
步骤102:利用模块化机器人关节空间与笛卡尔空间的映射关系,得到关节空间的人类运动意图。
步骤103:根据关节空间的人类运动意图和模块化机器人的动力学模型构建分散鲁棒控制器。分散鲁棒控制器包括:自适应补偿器和鲁棒控制器。
步骤104:采用分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。
根据步骤100中获取模块化机器人的动力学模型进一步可以推得:
其中,bfi是粘性摩擦系数,fci是库伦摩擦相关系数,fsi是静态相关系数,fτi是关于Stribeck效应的位置参数,是位置误差和其他摩擦模型误差。假设fsi和fτi的标称值和它们的实际值是相接近的,可以通过标称参数值和来线性化忽略高阶项后可以得到:
其中,zmi是第i个转子旋转轴上的单位矢量,zlj是第j个关节旋转轴上的单位矢量,zlk是第k个关节旋转轴上的单位矢量。
通过重写(7)(8)式得到:
其中,i,j,k分别代表第i,j,k个关节。 是单位向量zmi与zlj的点积,是校正误差。是单位向量zmi与zlk×zlj的点积,是校正误差。同时,将Uzi与Vzi考虑为各关节子系统相互耦合的模型不确定性。
重新改写式(1)中第i个子系统的动力学模型可以得到:
第i个子系统的状态空间Si的形式可以表示为:
性质1:根据摩擦力模型(4),如果参数bfi,fci,fsi和fτi都是有界的,可以得出是有界的,且ρFil=[ρFi1,ρFi2,ρFi3,ρFi4]T是一个已知的常数向量,ρFi1,ρFi2,ρFi3,ρFi4为已知的正常数上界。因此,摩擦力模型的上界可以定义为
性质3:zmi,zlk与zlj是沿着相应关节旋转方向的单位矢量,与得到的向量乘积是有界的。此外,当关节稳定时,它的加速度与速度一定是有界的,因此,根据在(7)与(8)中交联项的形式,可以得出这样的结论:如果关节j和关节k是稳定的(j,k<i),那么与是有界的,且满足ρUi与ρVi是已知正常数上界。由此可知,性质3说明了如果关节j和关节k是稳定的(j,k<i),那么与是有界的,这意味着当设计第i个关节的控制器时,低阶关节i-1也已经是稳定的。
在传统的机器人轨迹跟踪任务中,往往是通过人为给出预定的期望轨迹,直接用于控制系统设计。然而,在物理人机交互的背景下,模块化机器人的期望轨迹是不确定的,是与机器人所交互的人类决定的。因此,在本发明中优选通过使用弹簧质量阻尼模型来近似人类肢体模型,进而通过RBF神经网络来近似估计人类的运动意图,描述人类肢体动力学模型如下:
其中MH,CH与GH分别代表人类肢体质量、阻尼与弹簧矩阵,并且都是对角矩阵。同时,z代表笛卡尔空间下的模块化机器人运动的实时轨迹,即模块化机器人在笛卡尔空间下的实际位置,zHd作为交互期间人类伙伴所规划的笛卡尔空间的模块化机器人运动轨迹,并且在本发明中称为人类运动意图。由于在此模型中,阻尼项与弹簧项通常占主导地位,可以得到如下的近似模型:
其中,F(·)代表位置方程。同时可以提出下列假设:
假设1:在物理人机交互背景下的模块化机器人跟踪控制任务中,人类运动意图是由人与模块化机器人的交互点处的交互力fext、实际位置z与速度所决定的。假设1是本发明所开发的估计方法的基础。在本发明的最后,将通过实验验证该方法的有效性。
在同时考虑人体肢体参数的时变与不确定性下,F(·)是与CHGH有关的非线性函数。在人与模块化机器人交互作业过程中,人会改变其肢体参数,这使得估计人类运动意图zHd变得非常困难。由于机器学习具有可以发现内在信息、映射位置关系与近似函数的特性,所以提出采用机器学习的方法来解决此问题。基本的估计思想就是通过使用与z有关的线性参数化函数来近似zHd,同时为此估计方法设计权值自适应更新律。
那么,上述步骤101采用RBF神经网络辨识笛卡尔空间的人类运动意图的过程具体包括:
步骤1011:获取RBF神经网络结构。RBF神经网络结构如下所示:
其中,表示为l的连续函数,l∈Ωl∈Rm是RBF神经网络的输入,p为神经网络的节点数,μk=[μk,1,μk,2,...,μk,m]T为径向基函数的中心值,ηk为高斯函数的带宽,W为神经网络的权值向量。
步骤1012:基于RBF神经网络结构确定初始人类运动意图。通过使用RBF神经网络,人类运动意图与其估计量给出如下式:
步骤1013:获取能量函数。能量函数为:
步骤1014:采用能量函数在线调整初始人类运动意图的权值,得到调整后的权值。由于Si(li)是li的函数,所以可以通过(16)式采用梯度搜索技术,以期使网络的实际输出值与期望输出值的误差均方值最小,反向传播得到本发明的控制目标是使模块化机器人“主动”跟随人类移动到人所期望模块化机器人移动的位置,同时控制交互力fext最小。因此,根据如下的能量函数进行在线调整权值
权值的调整过程具体包括:
步骤1014-1:采用梯度下降法根据能量函数确定权值更新律。具体的,
根据式(17),采用梯度下降法求取权值更新律:
将式(19)、式(20)代入式(18)中,可以得到权值更新律为:
步骤1014-2:根据权值更新率确定调整后的权值。
步骤1015:采用调整后的权值调整初始人类运动意图,得到最终的人类运动意图。最终的人类运动意图即为采用RBF神经网络确定的人类运动意图。具体的,由(22)式带入(16)式可以得到估计的人类运动意图。
那么,基于以上步骤101中已经确定的人类运动意图,可以通过模块化机器人关节空间与笛卡尔空间的映射关系得到关节空间内的人类运动意图,所述关节空间内的人类运动意图直接作用到模块化机器人控制系统当中,通过结合模块化机器人的动力学模型(即公式(1))与所估计出的关节空间内的人类运动意图,给出作用到模块化机器人系统中的分散鲁棒控制器,其具体过程为:
基于给出的状态空间式(11)与模块化机器人动力学模型式(1),基于人类运动意图辨识的分散鲁棒控制器。
在物理人机交互的背景下,模块化机器人需要跟踪所估计出的人类运动意图。进而,本发明定义以下与关节位置和速度有关的控制变量:
其中,λi是任意正常数。
上述步骤103具体包括:
步骤1031:获取第一补偿控制律。第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律。建模确定项基于模块化机器人的动力学模型确定。
步骤1032:获取自适应补偿器的控制律和鲁棒控制器的控制律。
步骤1033:根据自适应补偿器的控制律和鲁棒控制器的控制律确定第二补偿控制律。
步骤1034:根据第一补偿控制律和第二补偿控制律确定第三补偿控制律。第三补偿控制律即为分散鲁棒控制器的控制律。
基于此,步骤104实质是将第三补偿控制律直接作用到模块化机器人系统,根据辨识出的人类运动意图控制模块化机器人关节的运动。
进一步,上述步骤1031-1034的具体过程为:
控制律的设计采用了分解控制设计的思想,将控制律设计成如下所示:
ui=ui1+ui2 (25)
其中ui1用来补偿被传感器测得的交互力与精确建模确定项,其中包括电机转动惯量与电机摩擦项,而ui2则被用来补偿各种不确定项,例如摩擦不确定性项与各子系统之间的耦合交联项。
对于第i关节子系统的精确建模确定项与交互力的补偿控制律ui1(即第一补偿控制律)如下所示:
对于第i关节子系统的摩擦非参数不确定项如果参数不确定性被认为是不确定的常数,那么不确定性可以被积分补偿器所补偿。然而在现实中,模型参数的不确定性总是随着温度、润滑度等原因而并非为恒定常熟。所以,将其与可变参数模型不确定性补偿器结合,摩擦参数不确定性被分解为如下所示:
模块化机器人系统被分为相互耦合且关联的子系统,且各个子系统之间有强耦合性,称其为耦合交联项,如式(9)所示。对其耦合交联不确定进行分析,采用与摩擦分析相同的分解控制策略,将其耦合交联不确定性分成一个未知定常数与一个有上界的未知变量,如下所示:
Uzi=Uzic+Uziv, (32)
Vzi=Vzic+Vziv, (33)
其中Uziv与Vziv是有上界的变量,如下所示:
|Uziv|≤ρUiv,|Vziv|≤ρViv, (34)
与Uzi项相同,耦合交联项的另一部分Vzi也采用同样的思想来设计控制律,如下所示:
将式(29)(30)(31)(35)(36)联立,得到不确定性补偿控制律ui2(即第二补偿控制律)如下所示:
将式(37)与式(26)联立,得到模块化机器人系统的分散鲁棒控制律(即第三补偿控制律)如下所示:
将分散鲁棒控制律式(37)带入模块化机器人系统模型式(1)中得到第i关节子系统的闭环表达式如下所示:
基于公式(39)即可完成模块模块化机器人依据人类意图进行运动的控制,其整个控制流程如图4所示。
综上,如图2所示,物理人机交互情形下与传统模块化机器人跟踪控制问题并不相同:传统模块化机器人跟踪控制问题有人类预设的期望轨迹,模块化机器人跟随期望轨迹运行。而物理人机交互下的跟踪问题则没有预设的期望轨迹,模块化机器人跟踪人类的运动意图进行“柔顺”运动。根据末端的力传感器与关节位置来判断是否有交互行为,并由RBF神经网络来近似估计人类运动意图,使模块化机器人进行跟踪。根据人类运动意图信息,与关节输出力矩/摩擦参数估计值与控制器参数相结合得到基于局部动力学信息的模型确定第一补偿控制律ui1。同时设计各关节子系统的第二补偿控制律ui2。把ui1与ui2相加,得到分散鲁棒控制律(即第三补偿控制律),运用到动力学模型,获得关节位置变量,与估计出的人类运动意图做差得到位置误差,进而作用到控制器当中。
如图3所示,本发明提供的基于人类运动意图辨识的模块化机器人分散鲁棒跟踪控制在具体实施过程中,主要包括以下步骤:首先初始化系统并建立模块化机器人系统的动力学模型,同时判断人是否与模块化机器人交互,若不是,则进一步初始化并判断是否有交互行为,若是,则通过RBF神经网络辨识笛卡尔空间的人类运动意图,同时判断模型确定项是否得到补偿,若没有,则得到基于局部动力学信息的模型确定项补偿,若是,则判断是否模型不确定项是否得到补偿,若没有,则得到分散鲁棒控制律ui2,若是,则得到分散跟踪控制器。然后存储数据,最后输出结果。
下面以实验方式验证本发明上述提供的机器人分散鲁棒跟踪控制方法的有效性。
为了研究所提出的鲁棒神经网络分散控制方法的有效性,建立一个2自由度的模块化机器人实验平台,该2自由度模块化机器人由两组关节模块和连杆组成,其中每个关节模块包含一个由Maxon公司生产的直流有刷电动机,型号为218014,最大输出扭矩为190Nm,转动惯量为118g/cm2。一个谐波传动装置与电动机输出相连用于减速器,减速比为101:1。在电机端安装了一个Maxon公司生产的增量式编码器,型号为:HEDL-5540-A11,它的精度为500count/rev,用来测量电机端的位移。在连杆端安装了一个由Netzer公司生产的绝对式编码器,型号为DS-70-64-3SH-S0,它拥有19位精度,用来采集连杆端的绝对位置数据。采用Quanser公司生产的线性功率放大器驱动关节模块的电动机和QPIDe数据采集卡采集各传感器的数据,用于模块化机器人控制。
实验用到的模块化机器人的各项参数如下表给出:
表1控制器参数设置
在人机交互开始阶段,模块化机器人改变静止状态与人接触,所以会有轻微的抖振现象。
如图5所示,高性能的跟踪是基于RBF神经网络对人类运动意图辨识来实现的。所估计的运动意图可以在很短时间内被模块化机器人跟踪。
如图6所示,在第8秒时,人与模块化机器人开始物理交互,可以看到模块化机器人表现出“主动”移动行为去跟踪所估计的人类运动意图。
图7中可以看出,在人机物理交互过程中,关节位置的稳态误差减小,由于动态补偿是通过模型补偿器与鲁棒控制器来实现的,所以可以控制关节位置误差控制在很小的数量级。
在图8所示的曲线中,控制力矩是连续、平滑的电机输出力矩,可以在实际的模块化机器人系统上实施的。本发明提出的基于人类运动意图辨识的鲁棒控制方法可以保证系统闭环渐进稳定,而且优化保持在适当范围内的功率消耗,以匹配每个连接模块中电机的输出功率。
以上实验结果表明,本发明所提出的机器人分散鲁棒跟踪控制方法能为模块化机器人提供稳定性和精确性,以满足人机交互任务的要求。
对应于上述提供的机器人分散鲁棒跟踪控制方法,本发明还提供了以下虚拟系统:
如图9所示,本发明提供的机器人分散鲁棒跟踪控制系统,包括:动力学模型获取模块1、人类运动意图辨识模块2、人类运动意图确定模块3、分散鲁棒控制器构建模块4和运动控制模块5。
其中,动力学模型获取模块1用于获取模块化机器人的动力学模型。
人类运动意图辨识模块2用于采用RBF神经网络辨识笛卡尔空间的人类运动意图。笛卡尔空间为模块化机器人与人交互的工作空间。
人类运动意图确定模块3,用于利用模块化机器人关节空间与笛卡尔空间的映射关系,得到关节空间内的人类运动意图。
分散鲁棒控制器构建模块4用于根据人类运动意图和模块化机器人的动力学模型构建分散鲁棒控制器。分散鲁棒控制器包括:自适应补偿器和鲁棒控制器。
运动控制模块5用于分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动。
进一步,上述人类运动意图辨识模块2优选包括:网络结构获取单元、初始人类运动意图确定单元、能量函数获取单元、权值调整单元和最终的人类运动意图确定单元。
其中,网络结构获取单元用于获取RBF神经网络结构。
初始人类运动意图确定单元用于基于RBF神经网络结构确定初始人类运动意图。
能量函数获取单元用于获取能量函数。
权值调整单元用于采用能量函数在线调整初始人类运动意图的权值,得到调整后的权值。
最终的人类运动意图确定单元用于采用调整后的权值调整初始人类运动意图,得到最终的人类运动意图。最终的人类运动意图即为采用RBF神经网络确定的人类运动意图。
进一步,上述权值调整单元优选包括:权值更新律确定子单元和权值调整子单元。
其中,权值更新律确定子单元用于采用梯度下降法根据能量函数确定权值更新律。
权值调整子单元用于根据权值更新率确定调整后的权值。
进一步,上述分散鲁棒控制器构建模块4优选包括:第一控制律获取单元、第二控制律获取单元、第一补偿控制律确定单元和第二补偿控制律确定单元。
其中,第一控制律获取单元用于获取第一补偿控制律。第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律。建模确定项基于模块化机器人的动力学模型确定。
第二控制律获取单元用于获取自适应补偿器的控制律和鲁棒控制器的控制律。
第一补偿控制律确定单元用于根据自适应补偿器的控制律和鲁棒控制器的控制律确定第二补偿控制律。
第二补偿控制律确定单元用于根据第一补偿控制律和第二补偿控制律确定第三补偿控制律。第三补偿控制律即为分散鲁棒控制器的控制律。
基于此,运动控制模块5将第三补偿控制律直接作用到模块化机器人系统,根据人类运动意图控制模块化机器人关节的运动。
此外,本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令。计算机可执行指令设置为执行上述的机器人分散鲁棒跟踪控制方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种机器人分散鲁棒跟踪控制方法,其特征在于,包括:
获取模块化机器人的动力学模型;所述模块化机器人的动力学模型为:
式中,i为模块化机器人的第i个关节子系统,Imi为模块化机器人转动轴的转动惯量,γi为模块化机器人的齿轮传动比,qi为第i关节子系统的关节位置,为第i关节子系统的速度,为第i关节子系统的加速度,q为关节子系统的关节位置,为关节子系统的速度,为关节子系统的加速度,是关节摩擦项,是关节子系统间的耦合力矩交联项,τsi是关节耦合力矩,fext是人与模块化机器人交互产生的交互力,Ji是雅可比矩阵,τi是电机输出转矩;
采用RBF神经网络辨识笛卡尔空间的人类运动意图;所述笛卡尔空间为与人类交互的工作空间;
利用模块化机器人的关节空间与笛卡尔空间的映射关系,得到关节空间的人类运动意图;
根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器;所述分散鲁棒控制器包括:自适应补偿器和鲁棒控制器;
采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动;
所述根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器,具体包括:
获取第一补偿控制律;所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律;所述建模确定项基于所述模块化机器人的动力学模型确定;其中,第一补偿控制律为:
获取自适应补偿器的控制律和鲁棒控制器的控制律;
根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律;其中,第二补偿控制律为:
根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律;所述第三补偿控制律即为所述分散鲁棒控制器的控制律;其中,第三补偿控制律为:
将第三补偿控制律带入模块化机器人的动力学模型中得到第i关节子系统的闭环表达式;其中,第i关节子系统的闭环表达式为:
基于第i关节子系统的闭环表达式完成模块化机器人依据人类意图进行运动的控制;
2.根据权利要求1所述的机器人分散鲁棒跟踪控制方法,其特征在于,所述采用RBF神经网络辨识笛卡尔空间的人类运动意图,具体包括:
获取所述RBF神经网络结构;
基于所述RBF神经网络结构确定初始人类运动意图;
获取能量函数;
采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值;
采用所述调整后的权值调整所述初始人类运动意图,得到最终的笛卡尔空间的人类运动意图;所述最终的人类运动意图即为采用RBF神经网络辨识笛卡尔空间的人类运动意图。
3.根据权利要求2所述的机器人分散鲁棒跟踪控制方法,其特征在于,所述采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值,具体包括:
采用梯度下降法根据所述能量函数确定权值更新律;
根据所述权值更新率确定所述调整后的权值。
4.一种机器人分散鲁棒跟踪控制系统,其特征在于,包括:
动力学模型获取模块,用于获取模块化机器人的动力学模型;所述模块化机器人的动力学模型为:
式中,i为模块化机器人的第i个关节子系统,Imi为模块化机器人转动轴的转动惯量,γi为模块化机器人的齿轮传动比,qi为第i关节子系统的关节位置,为第i关节子系统的速度,为第i关节子系统的加速度,q为关节子系统的关节位置,为关节子系统的速度,为关节子系统的加速度,是关节摩擦项,是关节子系统间的耦合力矩交联项,τsi是关节耦合力矩,fext是人与模块化机器人交互产生的交互力,Ji是雅可比矩阵,τi是电机输出转矩;
人类运动意图辨识模块,用于采用RBF神经网络辨识笛卡尔空间的人类运动意图;所述笛卡尔空间为与人类交互的工作空间;
人类运动意图确定模块,用于利用模块化机器人的关节空间与笛卡尔空间的映射关系,得到关节空间的人类运动意图;
分散鲁棒控制器构建模块,用于根据所述关节空间的人类运动意图和所述模块化机器人的动力学模型构建分散鲁棒控制器;所述分散鲁棒控制器包括:自适应补偿器和鲁棒控制器;
运动控制模块,用于采用所述分散鲁棒控制器根据人类运动意图控制模块化机器人关节的运动;
所述分散鲁棒控制器构建模块具体包括:
第一控制律获取单元,用于获取第一补偿控制律;所述第一补偿控制律为模块化机器人的关节子系统的建模确定项与交互力的补偿控制律;所述建模确定项基于所述模块化机器人的动力学模型确定;其中,第一补偿控制律为:
第二控制律获取单元,用于获取自适应补偿器的控制律和鲁棒控制器的控制律;
第一补偿控制律确定单元,用于根据所述自适应补偿器的控制律和所述鲁棒控制器的控制律确定第二补偿控制律;其中,第二补偿控制律为:
第二补偿控制律确定单元,用于根据所述第一补偿控制律和所述第二补偿控制律确定第三补偿控制律;所述第三补偿控制律即为所述分散鲁棒控制器的控制律;其中,第三补偿控制律为:
将第三补偿控制律带入模块化机器人的动力学模型中得到第i关节子系统的闭环表达式;其中,第i关节子系统的闭环表达式为:
基于第i关节子系统的闭环表达式完成模块化机器人依据人类意图进行运动的控制;
5.根据权利要求4所述的机器人分散鲁棒跟踪控制系统,其特征在于,所述人类运动意图辨识模块具体包括:
网络结构获取单元,用于获取所述RBF神经网络结构;
初始人类运动意图确定单元,用于基于所述RBF神经网络结构确定初始人类运动意图;
能量函数获取单元,用于获取能量函数;
权值调整单元,用于采用所述能量函数在线调整所述初始人类运动意图的权值,得到调整后的权值;
最终的人类运动意图确定单元,用于采用所述调整后的权值调整所述初始人类运动意图,得到最终的笛卡尔空间的人类运动意图;所述最终的人类运动意图即为采用RBF神经网络辨识笛卡尔空间的人类运动意图。
6.根据权利要求5所述的机器人分散鲁棒跟踪控制系统,其特征在于,所述权值调整单元具体包括:
权值更新律确定子单元,用于采用梯度下降法根据所述能量函数确定权值更新律;
权值调整子单元,用于根据所述权值更新率确定所述调整后的权值。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令;所述计算机可执行指令设置为执行如权利要求1-3任意一项所述的机器人分散鲁棒跟踪控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110372906.6A CN112947093B (zh) | 2021-04-07 | 2021-04-07 | 一种机器人分散鲁棒跟踪控制方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110372906.6A CN112947093B (zh) | 2021-04-07 | 2021-04-07 | 一种机器人分散鲁棒跟踪控制方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112947093A CN112947093A (zh) | 2021-06-11 |
CN112947093B true CN112947093B (zh) | 2023-05-05 |
Family
ID=76230836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110372906.6A Active CN112947093B (zh) | 2021-04-07 | 2021-04-07 | 一种机器人分散鲁棒跟踪控制方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112947093B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109227543A (zh) * | 2018-10-19 | 2019-01-18 | 华南理工大学 | 一种位置受限柔性关节机器人基于模式的智能控制方法 |
CN111631923A (zh) * | 2020-06-02 | 2020-09-08 | 中国科学技术大学先进技术研究院 | 基于意图识别的外骨骼机器人的神经网络控制系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107397649B (zh) * | 2017-08-10 | 2020-08-14 | 燕山大学 | 一种基于径向基神经网络上肢外骨骼运动意图识别方法 |
IT201700114973A1 (it) * | 2017-10-12 | 2019-04-12 | Scuola Superiore Di Studi Univ E Di Perfezionamento Santanna | Metodo per il controllo adattivo di un robot indossabile, quale una ortesi o una protesi, e robot indossabile operante secondo tale metodo |
CN109240086B (zh) * | 2018-10-16 | 2020-02-28 | 浙江大学 | 一种非线性双边遥操作系统的自适应鲁棒控制方法 |
CN110967972A (zh) * | 2019-12-13 | 2020-04-07 | 中国科学院自动化研究所 | 基于径向基函数神经网络的康复机器人自适应控制方法 |
CN111258267B (zh) * | 2020-01-17 | 2021-07-16 | 北京科技大学 | 一种人机协作搬运系统及其混合视触控制方法 |
CN111730594A (zh) * | 2020-06-11 | 2020-10-02 | 长春工业大学 | 一种模块化机器人面向外部碰撞的分散控制方法及系统 |
CN112180719A (zh) * | 2020-09-01 | 2021-01-05 | 上海大学 | 基于人机协作系统的新型鲁棒有限时间轨迹控制方法 |
CN112276944A (zh) * | 2020-10-19 | 2021-01-29 | 哈尔滨理工大学 | 一种基于意图识别的人机协作系统控制方法 |
-
2021
- 2021-04-07 CN CN202110372906.6A patent/CN112947093B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109227543A (zh) * | 2018-10-19 | 2019-01-18 | 华南理工大学 | 一种位置受限柔性关节机器人基于模式的智能控制方法 |
CN111631923A (zh) * | 2020-06-02 | 2020-09-08 | 中国科学技术大学先进技术研究院 | 基于意图识别的外骨骼机器人的神经网络控制系统 |
Non-Patent Citations (2)
Title |
---|
Adaptive trajectory neural network tracking control for industrial robot manipulators with deadzone robust compensator;La Van Truong,等;《international journal of control automation and systems》;20200930;全文 * |
拟人机器人交互作用力的研究;刘英卓等;《南通工学院学报(自然科学版)》;20030330(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112947093A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110065070B (zh) | 一种基于动力学模型的机器人自适应阻抗控制系统 | |
Sirouspour et al. | Nonlinear control of hydraulic robots | |
Slotine et al. | Adaptive manipulator control: A case study | |
CN109581868B (zh) | 基于评判辨识结构的可重构机器人分散神经最优控制方法 | |
Zhong et al. | Inverse robot calibration using artificial neural networks | |
Jamone et al. | Incremental learning of context-dependent dynamic internal models for robot control | |
Shan et al. | Structural error and friction compensation control of a 2 (3PUS+ S) parallel manipulator | |
CN111730594A (zh) | 一种模块化机器人面向外部碰撞的分散控制方法及系统 | |
You et al. | Control system design for heavy duty industrial robot | |
Rocco et al. | Implicit force control for industrial robots in contact with stiff surfaces | |
CN113733117B (zh) | 一种可重构机器人人类意图辨识控制方法及装置 | |
Mohamed et al. | Simulating LQR and PID controllers to stabilise a three-link robotic system | |
CN112947093B (zh) | 一种机器人分散鲁棒跟踪控制方法、系统及存储介质 | |
Silvério et al. | An uncertainty-aware minimal intervention control strategy learned from demonstrations | |
Stulp et al. | Reinforcement learning of impedance control in stochastic force fields | |
Cruz et al. | Application of robust discontinuous control algorithm for a 5-DOF industrial robotic manipulator in real-time | |
Karkkainen | Compensation manipulator flexibility effects by modal space techniques | |
CN115366132A (zh) | 一种基于关节外力矩估计的机器臂事件触发式控制方法 | |
CN114211478A (zh) | 一种模块化机械臂协调操作最优控制方法及系统 | |
Moolam | Dynamic modeling and control of flexible manipulators | |
Wang et al. | Output regulation of the ball and plate system with a nonlinear velocity observer | |
Panwar et al. | Design of optimal hybrid position/force controller for a robot manipulator using neural networks | |
Safeena et al. | Adaptive super twisting control of Stewart platform based on super twisting observer | |
Fukushima et al. | Online compensation of gravity and friction for haptics with incremental position sensors | |
Flash et al. | Communication: Discrete trajectory planning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |