CN113219825B - 一种四足机器人单腿轨迹跟踪控制方法及系统 - Google Patents

一种四足机器人单腿轨迹跟踪控制方法及系统 Download PDF

Info

Publication number
CN113219825B
CN113219825B CN202110324222.9A CN202110324222A CN113219825B CN 113219825 B CN113219825 B CN 113219825B CN 202110324222 A CN202110324222 A CN 202110324222A CN 113219825 B CN113219825 B CN 113219825B
Authority
CN
China
Prior art keywords
leg
robot
neural network
disturbance
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110324222.9A
Other languages
English (en)
Other versions
CN113219825A (zh
Inventor
梁启星
李彬
刘伟龙
侯兰东
李志�
杨雪
李江娇
高梦奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202110324222.9A priority Critical patent/CN113219825B/zh
Publication of CN113219825A publication Critical patent/CN113219825A/zh
Application granted granted Critical
Publication of CN113219825B publication Critical patent/CN113219825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

本公开提供了一种四足机器人单腿轨迹跟踪控制方法及系统,包括:获取四足机器人的关节参数;根据关节参数建立单腿动力学模型;基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;基于最优控制率以实现四足机器人单腿轨迹跟踪控制;解决了如何补偿非线性和误差的影响问题,改善了四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制。

Description

一种四足机器人单腿轨迹跟踪控制方法及系统
技术领域
本公开属于机器人控制技术领域,具体涉及一种四足机器人单腿轨迹跟踪控制方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成现有技术。
自上世纪末以来,关于机器人技术的研究一直是国内外科研机构和科技企业的研究热点,足式仿生机器人是机器人学中最具挑战性的主题之一,其中四足机器人是仿生机器人领域发展最迅速的机器人类型之一,四足机器人具有动态性能高、复杂地形适应能力强、抗干扰能力强的特点,相比于轮式机器人更加灵活,在复杂地形和环境中拥有更强大的通过性和适应性,仿生四足机器人的开发和研究备受仿生机器人行业的青睐。目前国际和国内比较有代表性的四足机器人有美国波士顿动力公司的spot mini四足机器人、瑞士苏黎世联邦理工学院研制的ANYmal四足机器人以及杭州宇树科技公司开发的Laikago四足机器人等。
机器人系统是一个复杂的多输入多输出非线性系统,具有时变、强耦合和非线性动力学特性,在机器人的控制中,部分动力学参数具有不确定性,四足机器人更是如此。另外,四足机器人与复杂环境动态交互时,存在大量的扰动,导致机器人较难实现稳定运动控制。针对目前实际应用中存在的大量扰动和参数不确定性,如何实现四足机器人快速高精度的轨迹跟踪控制是需要解决的一个技术问题。
发明内容
为了解决上述问题,本公开针对四足机器人的单腿,利用神经网络优秀的非线性逼近能力,提出一种基于RBF(Radial Basis Function)神经网络(NN,Neural Networks)补偿控制的四足机器人单腿轨迹跟踪控制方法,用于补偿非线性和误差的影响,改善四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制;针对四足机器人的单腿进行神经网络补偿的轨迹跟踪控制是可行的,基于神经网络控制技术可以解决很多复杂系统的控制问题,这些复杂的系统控制问题就包括机器人和机械臂系统。
第一方面,本公开提供了一种四足机器人单腿轨迹跟踪控制方法,包括:
获取四足机器人的关节参数;
根据关节参数建立单腿动力学模型;
基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
第二方面,本公开提供了一种四足机器人单腿轨迹跟踪控制器,包括:
数据获取模块,被配置为获取四足机器人的关节参数;
单腿动力学模型建立模块,被配置为根据关节参数建立单腿动力学模型;
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
跟踪控制模块,被配置为基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
第三方面,本公开提供了一种四足机器人单腿轨迹跟踪控制系统,其包括如上述所述的四足机器人单腿轨迹跟踪控制器。
与现有技术对比,本公开具备以下有益效果:
1、本公开为了实现四足机器人高精度的轨迹跟踪控制问题,通过建立四足机器人单腿的动力学模型,使用RBF神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值,考虑存在扰动情况下的四足机器人单腿动力学模型,假设出参考轨迹,考虑当状态信息完全已知的情况下,定义出一个广义的跟踪误差,通过引入一个虚拟控制和第二个错误变量定义。基于模型设计控制率,利用RBF神经网络估计器来逼近机器人参数的不确定性,设计控制率,提高四足机器人单腿的轨迹跟踪性能。
2、本公开针对外界扰动参数为未知量,其需要根据实际影响场景来实时获取,本申请采用基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法来获取准确的外界扰动参数,从而获取最优控制率,进而对四足机器人单腿轨迹跟踪控制,解决了如何补偿非线性和误差的影响问题,改善了四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本公开的四足机器人单腿3自由度简化示意图(3自由度机械臂);
图2是本公开的RBF神经网络基本结构;
图3是本公开的关节2基于NN控制的位置轨迹跟踪曲线和误差;
图4是本公开的关节2基于NN控制的速度轨迹跟踪曲线和误差;
图5是本公开的关节3基于NN控制的位置轨迹跟踪曲线和误差;
图6是本公开的关节3基于NN控制的速度轨迹跟踪曲线和误差;
图7是本公开的位置与速度的误差和;
图8为本公开的四足机器人单腿轨迹跟踪控制方法流程图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
如图1所示,一种四足机器人单腿轨迹跟踪控制方法,包括:
获取四足机器人的关节参数;
根据关节参数建立单腿动力学模型;
基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
进一步的,所述关节参数包括关节位置、速度和加速度矢量。
进一步的,所述根据关节参数建立单腿动力学模型包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量。
具体的,1.1四足机器人单腿3自由的简化动力学模型表示为:
Figure GDA0003152635990000051
其中
Figure GDA0003152635990000052
分别为关节位置、速度和加速度矢量,M(θ)为对称正定惯性矩阵,
Figure GDA0003152635990000053
为科氏力和离心力矩阵,
Figure GDA0003152635990000054
为重力矢量,U(θ)为重力引起的势能,τ=Rn×n为控制力矩矢量。
1.2根据实际的四足机器人关节参数,四足机器人3自由度单腿的动力学方程的具体参数如下为
Figure GDA0003152635990000057
其中,
Figure GDA0003152635990000055
Figure GDA0003152635990000056
Figure GDA0003152635990000061
Figure GDA0003152635990000062
其中,
Figure GDA0003152635990000063
Figure GDA0003152635990000064
Figure GDA0003152635990000065
Figure GDA0003152635990000066
Figure GDA0003152635990000067
Figure GDA0003152635990000068
Figure GDA00031526359900000613
进一步的,所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值。其过程如下:
2.1RBF神经网络用于近似连续函数h(X):Rn→R
Figure GDA0003152635990000069
其中X是输入变量,
Figure GDA00031526359900000610
是隐层和输出层之间的连接权重,
Figure GDA00031526359900000611
是基函数。
RBF神经网络可以将连续函数h(X)在一个紧集ΩZ内近似到任意期望的精度,如下所示:
Figure GDA00031526359900000612
其中W*是理想权重,且||δ||≤ε是逼近误差,其中ε>0是一个常数。
进一步的,所述基于神经网络建立考虑扰动情况下的单腿动力学模型包括,
根据机器人收到的外界扰动参数,重新定义机器人的关节参数;
根据重新定义的关节参数设置参考轨迹,定义广义的跟踪误差;
引入虚拟控制和第二个误差变量并得到增益矩阵;
对增益矩阵进行时间求导,基于李亚普诺夫候选函数获得考虑扰动情况下的单腿动力学模型。
外界扰动参数为实际应用中存在的大量扰动和参数不确定性,扰动表现形式主要由机器人与复杂地形环境交互时,受到的侧向扰动或打滑等不确定性因素,参数不确定性主要表现为部分动力学参数,如转动惯量等是估计值;由于外界扰动参数为未知量,其需要根据实际影响场景来实时获取,本申请采用基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法来获取准确的外界扰动参数,从而获取最优控制率,进而对四足机器人单腿轨迹跟踪控制。
具体的,3.1四足机器人的单腿动力学方程考虑外界时变扰动,则可以写成如下的形式
Figure GDA0003152635990000071
其中,f为机器人受到的外界扰动。重新定义参数,令x1=θ,
Figure GDA0003152635990000072
可得到:
Figure GDA0003152635990000073
Figure GDA0003152635990000074
3.2为了设计控制力矩使得系统能够实现较好的目标跟踪,设参考轨迹xr(t)可以表示为xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T。当状态信息x1和x2完全已知的情况下,定义一个广义的跟踪误差z1(t)=x1(t)-xr(t),且
Figure GDA0003152635990000088
3.3引入一个虚拟控制α1(t)和第二个误差变量定义为z2(t)=x2(t)-α1(t)。选择
Figure GDA0003152635990000081
这里的增益矩阵K1=K1 T>0,于是有
Figure GDA0003152635990000083
对时间进行求导得
Figure GDA0003152635990000084
3.4考虑一个李亚普诺夫候选函数:
Figure GDA0003152635990000085
结合式(9)对V1求时间导数:
Figure GDA0003152635990000086
之后考虑李亚普诺夫候选函数:
Figure GDA0003152635990000087
上式对时间求导得
Figure GDA0003152635990000091
3.5从而基于模型的控制率可以设计如下:
Figure GDA0003152635990000092
这里的增益矩阵K2=K2 T>0,将式(14)带入李亚普诺夫候选函数可得:
Figure GDA0003152635990000094
进一步的,利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率包括,
设定外界扰动参数的正常数向量
Figure GDA0003152635990000095
定义算子并建立模型,依据模型建立控制器;
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,获得最优控制率,以最优控制率确定所述控制器。
即利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率设计为:
Figure GDA0003152635990000096
这里的
Figure GDA0003152635990000097
是神经网络的权值,
Figure GDA0003152635990000098
是基函数,此神经网络
Figure GDA0003152635990000099
近似为
Figure GDA00031526359900000910
具体的,f为未知量,即存在一个正常数向量
Figure GDA0003152635990000101
Figure GDA0003152635990000102
Figure GDA0003152635990000103
因为时变扰动f(t)具有有限的能量,因此是有界的,即f(t)∈L
定义算子“⊙”
Figure GDA0003152635990000104
Figure GDA0003152635990000105
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量。
基于上述模型建立控制器为:
Figure GDA0003152635990000106
这里的增益矩阵K2=K2 T>0,从而
Figure GDA0003152635990000108
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Figure GDA0003152635990000109
这里的
Figure GDA00031526359900001010
是神经网络的权值,
Figure GDA00031526359900001011
是基函数,此神经网络
Figure GDA00031526359900001012
近似为
Figure GDA00031526359900001013
即:
Figure GDA00031526359900001014
这里的
Figure GDA00031526359900001015
是神经网络的输入变量,
Figure GDA00031526359900001016
是近似误差,自适应率设计为:
Figure GDA00031526359900001017
这里的Γi是常数增益矩阵,且φi>0,i=1,2,...n,是小值常数。
实施例2
本公开提供了一种四足机器人单腿轨迹跟踪控制器,包括:
数据获取模块,被配置为获取四足机器人的关节参数;
单腿动力学模型建立模块,被配置为根据关节参数建立单腿动力学模型;
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
跟踪控制模块,被配置为基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
进一步的,所述数据获取模块、单腿动力学模型建立模块、参考轨迹建立模块、控制率获取模块和跟踪控制模块所被配置的具体方式分别对应上述实施例中所述的四足机器人单腿轨迹跟踪控制方法的具体步骤。
实施例3
本公开提供了一种四足机器人单腿轨迹跟踪控制系统,其包括如上述所述的四足机器人单腿轨迹跟踪控制器。
实施例4
本公开还提供了一种基于神经网络补偿控制的四足机器人单腿轨迹跟踪控制方法,具体步骤为:
步骤1,建立四足机器人单腿3自由度的动力学方程;
四足机器人在实际构造中,单腿的髋关节外摆自由度一般和髋关节横滚自由度在同一个轴上,因此外摆自由度的长度可以简化为0,从而四足机器人的单腿可以用3自由度机械臂表示。机器人的3个自由度分别用θ1,θ2和θ3表示,2个连杆的长度用l1和l2表示,坐标系定义如图1四足机器人单腿3自由度简化示意图(3自由度机械臂)所示,单腿包括依次连接设置的旋转基座、连杆1和连杆2。
由相关参数定义和坐标系的定义可知,四足机器人单腿末端位置坐标位置P=[pxpy pz]可表示为:
Figure GDA0003152635990000122
其中,si=sinθi,ci=cosθi,sij=sin(θij),cij=cos(θij)。
四足机器人关节参数如表1所示:
表1
Figure GDA0003152635990000121
Figure GDA0003152635990000131
四足机器人单腿对应的雅克比矩阵为:
Figure GDA00031526359900001313
机器人单腿3自由的简化动力学模型表示为:
Figure GDA0003152635990000132
其中
Figure GDA0003152635990000133
分别为关节位置、速度和加速度矢量,M(θ)为对称正定惯性矩阵,
Figure GDA0003152635990000134
为科氏力和离心力矩阵,
Figure GDA0003152635990000135
为重力矢量,U(θ)为重力引起的势能,τ=Rn×n为控制力矩矢量。
机器人单腿3自由度简化示意图(3自由度机械臂)的动力学方程具体参数为:
Figure GDA00031526359900001314
其中,
Figure GDA0003152635990000136
Figure GDA0003152635990000137
Figure GDA0003152635990000138
Figure GDA0003152635990000139
其中,
Figure GDA00031526359900001310
Figure GDA00031526359900001311
Figure GDA00031526359900001312
Figure GDA0003152635990000141
Figure GDA0003152635990000142
Figure GDA0003152635990000143
Figure GDA0003152635990000144
Figure GDA0003152635990000145
Figure GDA00031526359900001419
Figure GDA0003152635990000146
动力学方程关于常数参数向量θ可以进行参数线性化,表示为
Figure GDA0003152635990000147
其中
Figure GDA0003152635990000148
是回归矩阵,方程可以线性化得到如下方程:
Figure GDA0003152635990000149
其中,回归矩阵
Figure GDA00031526359900001410
可表示为
Figure GDA00031526359900001411
其中,
Figure GDA00031526359900001412
Figure GDA00031526359900001413
Figure GDA00031526359900001414
Figure GDA00031526359900001415
Figure GDA00031526359900001416
Figure GDA00031526359900001417
Figure GDA00031526359900001418
步骤2,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值,其过程如下:
在控制工程中,径向基函数(RBF,Radial Basis Function)神经网络由于具有良好的函数逼近能力,常被用作系统建模的工具。该神经网络由三层组成,输入层节点的作用是传递信号到隐层;隐层节点由径向基函数构成;输出层节点通常是简单的线性函数。在径向基函数神经网络中,从输入层到隐层的变换是非线性的,隐层的作用是对输入向量进行非线性变换,而从隐层到输出层的变换是线性的,也就是网络的输出是隐节点输出的线性加权和。RBF神经网络的结构如图2所示。
具有N个样本(Xi,Yi)的径向基函数神经网络模型,其中Xi=[xi1,xi2,…,xin]T∈Rn,Yi=[yi1,yi2,…,yim]T∈Rm,隐层神经元个数为l。本文的RBF神经网络用于近似连续函数h(X):Rn→R
Figure GDA0003152635990000151
其中X是输入变量,
Figure GDA0003152635990000152
是隐层和输出层之间的连接权重,
Figure GDA0003152635990000153
是基函数,选取常用的高斯函数形式为:
Figure GDA0003152635990000154
其中μi=[μi1i2,...,μin]T是感受野的中心,σi是高斯函数的宽度。
RBF神经网络可以将一个连续函数在一个紧集ΩZ内近似到任意期望的精度,如下所示:
Figure GDA0003152635990000155
其中W*是理想权重,且||δ||≤ε是逼近误差,其中ε>0是一个常数。
事实上,理想的神经网络权值矩阵W*需要根据输入和期望输出之间的误差进行反馈求解,可被定义为:
Figure GDA0003152635990000161
步骤3,考虑存在扰动情况下的四足机器人单腿动力学模型,假设出参考轨迹,考虑当状态信息x1和x2完全已知的情况下,定义出一个广义的跟踪误差,通过引入一个虚拟控制和第二个误差变量。考虑李雅普诺夫函数,基于模型设计控制率,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,重新设计控制率。
当机器人的动力学方程考虑外界时变扰动时,则可以写成如下的形式
Figure GDA0003152635990000162
其中,f为机器人受到的外界扰动。重新定义参数,令x1=θ,
Figure GDA0003152635990000163
可得到:
Figure GDA0003152635990000164
Figure GDA0003152635990000165
为了设计控制力矩使得系统能够实现较好的目标跟踪,设参考轨迹xr(t)可以表示为xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T。当状态信息x1和x2完全已知的情况下,定义一个广义的跟踪误差z1(t)=x1(t)-xr(t),且
Figure GDA0003152635990000166
通过引入一个虚拟控制α1(t)和第二个误差变量定义为z2(t)=x2(t)-α1(t)。选择
Figure GDA0003152635990000167
这里的增益矩阵K1=K1 T>0,于是有
Figure GDA0003152635990000169
z2对时间进行求导得
Figure GDA0003152635990000171
考虑一个李亚普诺夫候选函数:
Figure GDA0003152635990000172
结合式(9)对V1求时间导数:
Figure GDA0003152635990000173
之后考虑李亚普诺夫候选函数:
Figure GDA0003152635990000174
上式对时间求导得
Figure GDA0003152635990000175
从而基于模型的控制率可以设计如下:
Figure GDA0003152635990000176
这里的增益矩阵K2=K2 T>0,将式(14)带入李亚普诺夫候选函数可得:
Figure GDA0003152635990000178
具体的,f为未知量,即存在一个正常数向量
Figure GDA0003152635990000179
Figure GDA00031526359900001710
Figure GDA00031526359900001711
因为时变扰动f(t)具有有限的能量,因此是有界的,即f(t)∈L
定义算子“⊙”:
Figure GDA0003152635990000181
Figure GDA0003152635990000182
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量。
基于上述模型建立控制器为:
Figure GDA00031526359900001815
这里的增益矩阵K2=K2 T>0,从而
Figure GDA0003152635990000184
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Figure GDA0003152635990000185
这里的
Figure GDA0003152635990000186
是神经网络的权值,
Figure GDA0003152635990000187
是基函数,此神经网络
Figure GDA0003152635990000188
近似为
Figure GDA0003152635990000189
即:
Figure GDA00031526359900001810
这里的
Figure GDA00031526359900001811
是神经网络的输入变量,
Figure GDA00031526359900001812
是近似误差,自适应率设计为:
Figure GDA00031526359900001813
这里的Γi是常数增益矩阵,且
Figure GDA00031526359900001814
是小值常数。
为了验证所提方法的有效性,针对四足机器人3自由度单腿进行仿真验证。仿真实现中,RBF神经网络的隐层神经元设为256个,中心取值为1,宽度取值为0.02,Γ取值为10,神经网络的初始权值为较小的随机数,初始位置为0,K1=K2=20,期望轨迹xr=[0.2+2sin(2t);-1.7+1.8cos(2t);-1.5+0.8sin(4t)]。外界扰动为f=sin(πt)+2sin(2πt)+3sin(3πt)。
图3至图6分别展示了仿真中四足机器人单腿关节2和关节3的位置轨迹、轨迹跟踪误差,速度状态与速度误差。图7是三个关节的控制输入,图8表示三个关节位置与速度的误差和。由仿真结果可以看出,基于RBF神经网络设计的控制率(NN控制)对实现四足机器人单腿轨迹追踪行为是有效的,三个关节均能准确地追踪到预先给定的期望轨迹与期望速度。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (3)

1.一种四足机器人单腿轨迹跟踪控制方法,其特征在于,包括:
步骤一,获取四足机器人的关节参数;所述关节参数包括关节位置、速度和加速度矢量;四足机器人单腿髋关节外摆自由度和髋关节横滚自由度在同一个轴上,外摆自由度的长度简化为0,单腿包括依次连接设置的旋转基座、第一连杆和第二连杆,2个连杆的长度用l1和l2表示;
步骤二,根据关节参数建立四足机器人3自由度单腿动力学模型,包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量;对称正定惯性矩阵为:
Figure FDA0004057507370000011
其中,
Figure FDA0004057507370000012
Figure FDA0004057507370000013
Figure FDA0004057507370000014
θ1,θ2和θ3表示机器人的3个自由度;m1、m2分别为两个连杆的质量;I1、I2、I3分别表示三个连杆的惯量;
科氏力和离心力矩阵为:
Figure FDA0004057507370000015
其中,
Figure FDA0004057507370000016
Figure FDA0004057507370000017
Figure FDA0004057507370000018
Figure FDA0004057507370000021
Figure FDA0004057507370000022
Figure FDA0004057507370000023
Figure FDA0004057507370000024
Figure FDA0004057507370000025
si=sinθi,ci=cosθi,sij=sin(θij),cij=cos(θij);
重力矢量为:
Figure FDA0004057507370000026
步骤三,基于扰动及神经网络修正单腿动力学模型,建立考虑扰动情况的单腿动力学模型,并假设参考轨迹;所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值;所述考虑扰动情况的单腿动力学模型为:
Figure FDA0004057507370000027
其中,τ=Rn×n为控制力矩矢量,J(θ)为单腿对应的雅克比矩阵,f为机器人受到的外界扰动;重新定义参数,令
Figure FDA0004057507370000028
得到:
Figure FDA0004057507370000029
Figure FDA00040575073700000210
设参考轨迹xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T
步骤四,利用基于神经网络学习的值函数逼近方法,设计控制率与自适应率;
定义广义跟踪误差z1(t)=x1(t)-xr(t),且
Figure FDA0004057507370000031
引入虚拟控制α1(t)和第二个误差变量z2(t)=x2(t)-α1(t),选择
Figure FDA0004057507370000032
其中增益矩阵K1=K1 T>0,有
Figure FDA0004057507370000033
考虑李亚普诺夫候选函数
Figure FDA0004057507370000034
基于扰动情况的单腿动力学模型的控制率设计为:
Figure FDA0004057507370000035
其中增益矩阵K2=K2 T>0;
定义算子⊙:
Figure FDA0004057507370000036
Figure FDA0004057507370000037
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量;
建立控制器:
Figure FDA0004057507370000038
其中,
Figure FDA0004057507370000039
为正常数向量,当
Figure FDA00040575073700000310
Figure FDA00040575073700000311
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Figure FDA00040575073700000312
其中
Figure FDA00040575073700000313
是神经网络的权值,
Figure FDA00040575073700000314
是基函数,神经网络
Figure FDA00040575073700000315
近似为
Figure FDA00040575073700000316
Figure FDA0004057507370000041
其中
Figure FDA0004057507370000042
是神经网络的输入变量,
Figure FDA0004057507370000043
是近似误差,自适应率设计为:
Figure FDA0004057507370000044
Γi是常数增益矩阵,且φi>0,i=1,2,...n是小值常数;
步骤五,基于设计的控制率与自适应率实现四足机器人单腿轨迹跟踪控制。
2.一种四足机器人单腿轨迹跟踪控制器,其特征在于,包括:
数据获取模块,被配置为获取四足机器人的关节参数;所述关节参数包括关节位置、速度和加速度矢量;四足机器人单腿髋关节外摆自由度和髋关节横滚自由度在同一个轴上,外摆自由度的长度简化为0,单腿包括依次连接设置的旋转基座、第一连杆和第二连杆,2个连杆的长度用l1和l2表示;
单腿动力学模型建立模块,被配置为根据关节参数建立四足机器人3自由度单腿动力学模型;包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量;
对称正定惯性矩阵为:
Figure FDA0004057507370000045
其中,
Figure FDA0004057507370000046
Figure FDA0004057507370000047
Figure FDA0004057507370000048
θ1,θ2和θ3表示机器人的3个自由度;2个连杆的长度用l1和l2表示;m1、m2分别为两个连杆的质量;I1、I2、I3分别表示三个连杆的惯量;
科氏力和离心力矩阵为:
Figure FDA0004057507370000051
其中,
Figure FDA0004057507370000052
Figure FDA0004057507370000053
Figure FDA0004057507370000054
Figure FDA0004057507370000055
Figure FDA0004057507370000056
Figure FDA0004057507370000057
Figure FDA0004057507370000058
Figure FDA0004057507370000059
si=sinθi,ci=cosθi,sij=sin(θij),cij=cos(θij);
重力矢量为:
Figure FDA00040575073700000510
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,建立考虑扰动情况下的单腿动力学模型,并假设参考轨迹;所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值;所述考虑扰动情况的单腿动力学模型为:
Figure FDA00040575073700000511
其中,τ=Rn×n为控制力矩矢量,J(θ)为单腿对应的雅克比矩阵,f为机器人受到的外界扰动;重新定义参数,令x1=θ,
Figure FDA0004057507370000061
得到:
Figure FDA0004057507370000062
Figure FDA0004057507370000063
设参考轨迹xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,设计控制率与自适应率;
定义广义跟踪误差z1(t)=x1(t)-xr(t),且
Figure FDA0004057507370000064
引入虚拟控制α1(t)和第二个误差变量z2(t)=x2(t)-α1(t),选择
Figure FDA0004057507370000065
其中增益矩阵K1=K1 T>0,有
Figure FDA0004057507370000066
考虑李亚普诺夫候选函数
Figure FDA0004057507370000067
基于扰动情况的单腿动力学模型的控制率设计为:
Figure FDA0004057507370000068
其中增益矩阵K2=K2 T>0;
定义算子⊙:
Figure FDA0004057507370000069
Figure FDA00040575073700000610
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量;
建立控制器:
Figure FDA00040575073700000611
其中,
Figure FDA0004057507370000071
为正常数向量,当
Figure FDA0004057507370000072
Figure FDA0004057507370000073
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Figure FDA0004057507370000074
其中
Figure FDA0004057507370000075
是神经网络的权值,
Figure FDA0004057507370000076
是基函数,神经网络
Figure FDA0004057507370000077
近似为
Figure FDA0004057507370000078
Figure FDA0004057507370000079
其中
Figure FDA00040575073700000710
是神经网络的输入变量,
Figure FDA00040575073700000711
是近似误差,自适应率设计为:
Figure FDA00040575073700000712
Γi是常数增益矩阵,且φi>0,i=1,2,...n是小值常数;
跟踪控制模块,被配置为基于设计的控制率与自适应率实现四足机器人单腿轨迹跟踪控制。
3.一种四足机器人单腿轨迹跟踪控制系统,其特征在于,包括如权利要求2所述的四足机器人单腿轨迹跟踪控制器。
CN202110324222.9A 2021-03-26 2021-03-26 一种四足机器人单腿轨迹跟踪控制方法及系统 Active CN113219825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110324222.9A CN113219825B (zh) 2021-03-26 2021-03-26 一种四足机器人单腿轨迹跟踪控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110324222.9A CN113219825B (zh) 2021-03-26 2021-03-26 一种四足机器人单腿轨迹跟踪控制方法及系统

Publications (2)

Publication Number Publication Date
CN113219825A CN113219825A (zh) 2021-08-06
CN113219825B true CN113219825B (zh) 2023-04-25

Family

ID=77084174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110324222.9A Active CN113219825B (zh) 2021-03-26 2021-03-26 一种四足机器人单腿轨迹跟踪控制方法及系统

Country Status (1)

Country Link
CN (1) CN113219825B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115494751A (zh) * 2022-05-09 2022-12-20 深圳先进技术研究院 控制器训练方法、轨迹跟踪方法、终端设备以及存储介质
CN115128960B (zh) * 2022-08-30 2022-12-16 齐鲁工业大学 一种基于深度强化学习双足机器人运动控制方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103941582B (zh) * 2014-03-25 2016-08-17 中国人民解放军国防科学技术大学 液压驱动型仿生单腿双环控制方法
CN106406085B (zh) * 2016-03-15 2019-02-01 吉林大学 基于跨尺度模型的空间机械臂轨迹跟踪控制方法
CN108942924B (zh) * 2018-06-25 2021-07-13 南京理工大学 基于多层神经网络的模型不确定性机械臂运动控制方法
CN109465825B (zh) * 2018-11-09 2021-12-10 广东工业大学 机械臂柔性关节的rbf神经网络自适应动态面控制方法
CN112077839B (zh) * 2020-08-06 2022-03-22 中科云谷科技有限公司 一种机械臂的运动控制方法及装置
CN112192573A (zh) * 2020-10-14 2021-01-08 南京邮电大学 基于反演法的不确定性机器人自适应神经网络控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ChengxiangLiu.daptive neural network control with optimal number of hidden nodes for trajectory tracking of robot manipulators .Neurocomputing.2019,第350卷全文. *
于浩.Guidance angle based trajectory tracking for wheeled mobile robots.控制与决策.2015,第30卷(第4期),全文. *
刘金琨.柔性关节机器人自适应神经网络动态面控制.Proceedings of the 33rd Chinese Control Conference.2014,全文. *
辛亚先.腿-轮复合机器人全方位运动控制器的设计与仿真.无人系统技术.2018,全文. *

Also Published As

Publication number Publication date
CN113219825A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN110977988B (zh) 基于有限时间命令滤波的多关节机械臂阻抗控制方法
CN110202574B (zh) 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法
CN112904728B (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
CN111496792A (zh) 一种机械臂输入饱和固定时间轨迹跟踪控制方法及系统
CN107505947B (zh) 一种空间机器人捕获目标后消旋及协调控制方法
CN107942670B (zh) 一种双柔性空间机械臂模糊鲁棒滑模削抖运动控制方法
CN113219825B (zh) 一种四足机器人单腿轨迹跟踪控制方法及系统
CN112207834B (zh) 一种基于干扰观测器的机器人关节系统控制方法及系统
CN114367980B (zh) 基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人
CN114750137A (zh) 一种基于rbf网络的上肢外骨骼机器人运动控制方法
CN115990888A (zh) 一种具有死区和时变约束功能的机械臂控制方法
Jun-Pei et al. Neural network control of space manipulator based on dynamic model and disturbance observer
CN115256401A (zh) 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法
Atashzar et al. Tracking control of flexible-link manipulators based on environmental force disturbance observer
CN114310914A (zh) 多自由度机械臂模糊自适应迭代轨迹跟踪控制方法及系统
CN112008728B (zh) 基于选择性扰动补偿的全向移动机器人轨迹跟踪控制方法
Thai et al. Trajectory tracking control design for dual-arm robots using dynamic surface controller
CN116068901A (zh) 一种基于自适应有限时间扰动观测器的柔性连杆机械臂控制方法
CN111590561A (zh) 一种分布式机械臂系统鲁棒预设性能控制方法
CN112987770B (zh) 两栖仿蟹多足机器人步行足抗饱和有限时间运动控制方法
CN114859725A (zh) 一种非线性系统自适应事件触发控制方法及系统
CN114851193A (zh) 一种空间机械臂与未知环境接触过程的智能柔顺操控方法
CN114355771A (zh) 协作机器人力位混合控制方法及系统
Atashzar et al. A robust feedback linearization approach for tracking control of flexible-link manipulators using an EKF disturbance estimator
CN113296398A (zh) 一种柔性单链机械臂基于事件触发的命令滤波控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant