CN113219825B - 一种四足机器人单腿轨迹跟踪控制方法及系统 - Google Patents
一种四足机器人单腿轨迹跟踪控制方法及系统 Download PDFInfo
- Publication number
- CN113219825B CN113219825B CN202110324222.9A CN202110324222A CN113219825B CN 113219825 B CN113219825 B CN 113219825B CN 202110324222 A CN202110324222 A CN 202110324222A CN 113219825 B CN113219825 B CN 113219825B
- Authority
- CN
- China
- Prior art keywords
- leg
- robot
- neural network
- disturbance
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 77
- 230000006870 function Effects 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 33
- 210000002414 leg Anatomy 0.000 claims description 21
- 230000001133 acceleration Effects 0.000 claims description 8
- 238000013461 design Methods 0.000 claims description 7
- 210000004394 hip joint Anatomy 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000005484 gravity Effects 0.000 claims description 5
- 230000001537 neural effect Effects 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000005096 rolling process Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- WNRQPCUGRUFHED-DETKDSODSA-N humalog Chemical compound C([C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CO)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](NC(=O)CN)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O)C1=CC=C(O)C=C1.C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C=CC=CC=1)C(C)C)C1=CN=CN1 WNRQPCUGRUFHED-DETKDSODSA-N 0.000 description 4
- 229960002068 insulin lispro Drugs 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 210000001503 joint Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000011664 nicotinic acid Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 2
- 238000005381 potential energy Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本公开提供了一种四足机器人单腿轨迹跟踪控制方法及系统,包括:获取四足机器人的关节参数;根据关节参数建立单腿动力学模型;基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;基于最优控制率以实现四足机器人单腿轨迹跟踪控制;解决了如何补偿非线性和误差的影响问题,改善了四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制。
Description
技术领域
本公开属于机器人控制技术领域,具体涉及一种四足机器人单腿轨迹跟踪控制方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成现有技术。
自上世纪末以来,关于机器人技术的研究一直是国内外科研机构和科技企业的研究热点,足式仿生机器人是机器人学中最具挑战性的主题之一,其中四足机器人是仿生机器人领域发展最迅速的机器人类型之一,四足机器人具有动态性能高、复杂地形适应能力强、抗干扰能力强的特点,相比于轮式机器人更加灵活,在复杂地形和环境中拥有更强大的通过性和适应性,仿生四足机器人的开发和研究备受仿生机器人行业的青睐。目前国际和国内比较有代表性的四足机器人有美国波士顿动力公司的spot mini四足机器人、瑞士苏黎世联邦理工学院研制的ANYmal四足机器人以及杭州宇树科技公司开发的Laikago四足机器人等。
机器人系统是一个复杂的多输入多输出非线性系统,具有时变、强耦合和非线性动力学特性,在机器人的控制中,部分动力学参数具有不确定性,四足机器人更是如此。另外,四足机器人与复杂环境动态交互时,存在大量的扰动,导致机器人较难实现稳定运动控制。针对目前实际应用中存在的大量扰动和参数不确定性,如何实现四足机器人快速高精度的轨迹跟踪控制是需要解决的一个技术问题。
发明内容
为了解决上述问题,本公开针对四足机器人的单腿,利用神经网络优秀的非线性逼近能力,提出一种基于RBF(Radial Basis Function)神经网络(NN,Neural Networks)补偿控制的四足机器人单腿轨迹跟踪控制方法,用于补偿非线性和误差的影响,改善四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制;针对四足机器人的单腿进行神经网络补偿的轨迹跟踪控制是可行的,基于神经网络控制技术可以解决很多复杂系统的控制问题,这些复杂的系统控制问题就包括机器人和机械臂系统。
第一方面,本公开提供了一种四足机器人单腿轨迹跟踪控制方法,包括:
获取四足机器人的关节参数;
根据关节参数建立单腿动力学模型;
基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
第二方面,本公开提供了一种四足机器人单腿轨迹跟踪控制器,包括:
数据获取模块,被配置为获取四足机器人的关节参数;
单腿动力学模型建立模块,被配置为根据关节参数建立单腿动力学模型;
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
跟踪控制模块,被配置为基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
第三方面,本公开提供了一种四足机器人单腿轨迹跟踪控制系统,其包括如上述所述的四足机器人单腿轨迹跟踪控制器。
与现有技术对比,本公开具备以下有益效果:
1、本公开为了实现四足机器人高精度的轨迹跟踪控制问题,通过建立四足机器人单腿的动力学模型,使用RBF神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值,考虑存在扰动情况下的四足机器人单腿动力学模型,假设出参考轨迹,考虑当状态信息完全已知的情况下,定义出一个广义的跟踪误差,通过引入一个虚拟控制和第二个错误变量定义。基于模型设计控制率,利用RBF神经网络估计器来逼近机器人参数的不确定性,设计控制率,提高四足机器人单腿的轨迹跟踪性能。
2、本公开针对外界扰动参数为未知量,其需要根据实际影响场景来实时获取,本申请采用基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法来获取准确的外界扰动参数,从而获取最优控制率,进而对四足机器人单腿轨迹跟踪控制,解决了如何补偿非线性和误差的影响问题,改善了四足机器人非线性控制系统的性能,保证四足机器人的轨迹跟踪误差渐进收敛于零,实现四足机器人的高精度轨迹跟踪控制。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本公开的四足机器人单腿3自由度简化示意图(3自由度机械臂);
图2是本公开的RBF神经网络基本结构;
图3是本公开的关节2基于NN控制的位置轨迹跟踪曲线和误差;
图4是本公开的关节2基于NN控制的速度轨迹跟踪曲线和误差;
图5是本公开的关节3基于NN控制的位置轨迹跟踪曲线和误差;
图6是本公开的关节3基于NN控制的速度轨迹跟踪曲线和误差;
图7是本公开的位置与速度的误差和;
图8为本公开的四足机器人单腿轨迹跟踪控制方法流程图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
如图1所示,一种四足机器人单腿轨迹跟踪控制方法,包括:
获取四足机器人的关节参数;
根据关节参数建立单腿动力学模型;
基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
进一步的,所述关节参数包括关节位置、速度和加速度矢量。
进一步的,所述根据关节参数建立单腿动力学模型包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量。
具体的,1.1四足机器人单腿3自由的简化动力学模型表示为:
1.2根据实际的四足机器人关节参数,四足机器人3自由度单腿的动力学方程的具体参数如下为
进一步的,所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值。其过程如下:
2.1RBF神经网络用于近似连续函数h(X):Rn→R
RBF神经网络可以将连续函数h(X)在一个紧集ΩZ内近似到任意期望的精度,如下所示:
其中W*是理想权重,且||δ||≤ε是逼近误差,其中ε>0是一个常数。
进一步的,所述基于神经网络建立考虑扰动情况下的单腿动力学模型包括,
根据机器人收到的外界扰动参数,重新定义机器人的关节参数;
根据重新定义的关节参数设置参考轨迹,定义广义的跟踪误差;
引入虚拟控制和第二个误差变量并得到增益矩阵;
对增益矩阵进行时间求导,基于李亚普诺夫候选函数获得考虑扰动情况下的单腿动力学模型。
外界扰动参数为实际应用中存在的大量扰动和参数不确定性,扰动表现形式主要由机器人与复杂地形环境交互时,受到的侧向扰动或打滑等不确定性因素,参数不确定性主要表现为部分动力学参数,如转动惯量等是估计值;由于外界扰动参数为未知量,其需要根据实际影响场景来实时获取,本申请采用基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;利用基于神经网络学习的值函数逼近方法来获取准确的外界扰动参数,从而获取最优控制率,进而对四足机器人单腿轨迹跟踪控制。
具体的,3.1四足机器人的单腿动力学方程考虑外界时变扰动,则可以写成如下的形式
3.2为了设计控制力矩使得系统能够实现较好的目标跟踪,设参考轨迹xr(t)可以表示为xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T。当状态信息x1和x2完全已知的情况下,定义一个广义的跟踪误差z1(t)=x1(t)-xr(t),且
3.3引入一个虚拟控制α1(t)和第二个误差变量定义为z2(t)=x2(t)-α1(t)。选择
这里的增益矩阵K1=K1 T>0,于是有
对时间进行求导得
3.4考虑一个李亚普诺夫候选函数:
结合式(9)对V1求时间导数:
之后考虑李亚普诺夫候选函数:
上式对时间求导得
3.5从而基于模型的控制率可以设计如下:
这里的增益矩阵K2=K2 T>0,将式(14)带入李亚普诺夫候选函数可得:
进一步的,利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率包括,
利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,获得最优控制率,以最优控制率确定所述控制器。
即利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率设计为:
定义算子“⊙”
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量。
基于上述模型建立控制器为:
这里的增益矩阵K2=K2 T>0,从而
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
这里的Γi是常数增益矩阵,且φi>0,i=1,2,...n,是小值常数。
实施例2
本公开提供了一种四足机器人单腿轨迹跟踪控制器,包括:
数据获取模块,被配置为获取四足机器人的关节参数;
单腿动力学模型建立模块,被配置为根据关节参数建立单腿动力学模型;
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,构建出考虑扰动情况下的单腿动力学模型,并假设参考轨迹;
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,获取参考轨迹的最优参数,并获得最优控制率;
跟踪控制模块,被配置为基于最优控制率以实现四足机器人单腿轨迹跟踪控制。
进一步的,所述数据获取模块、单腿动力学模型建立模块、参考轨迹建立模块、控制率获取模块和跟踪控制模块所被配置的具体方式分别对应上述实施例中所述的四足机器人单腿轨迹跟踪控制方法的具体步骤。
实施例3
本公开提供了一种四足机器人单腿轨迹跟踪控制系统,其包括如上述所述的四足机器人单腿轨迹跟踪控制器。
实施例4
本公开还提供了一种基于神经网络补偿控制的四足机器人单腿轨迹跟踪控制方法,具体步骤为:
步骤1,建立四足机器人单腿3自由度的动力学方程;
四足机器人在实际构造中,单腿的髋关节外摆自由度一般和髋关节横滚自由度在同一个轴上,因此外摆自由度的长度可以简化为0,从而四足机器人的单腿可以用3自由度机械臂表示。机器人的3个自由度分别用θ1,θ2和θ3表示,2个连杆的长度用l1和l2表示,坐标系定义如图1四足机器人单腿3自由度简化示意图(3自由度机械臂)所示,单腿包括依次连接设置的旋转基座、连杆1和连杆2。
由相关参数定义和坐标系的定义可知,四足机器人单腿末端位置坐标位置P=[pxpy pz]可表示为:
其中,si=sinθi,ci=cosθi,sij=sin(θi+θj),cij=cos(θi+θj)。
四足机器人关节参数如表1所示:
表1
四足机器人单腿对应的雅克比矩阵为:
机器人单腿3自由的简化动力学模型表示为:
机器人单腿3自由度简化示意图(3自由度机械臂)的动力学方程具体参数为:
步骤2,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值,其过程如下:
在控制工程中,径向基函数(RBF,Radial Basis Function)神经网络由于具有良好的函数逼近能力,常被用作系统建模的工具。该神经网络由三层组成,输入层节点的作用是传递信号到隐层;隐层节点由径向基函数构成;输出层节点通常是简单的线性函数。在径向基函数神经网络中,从输入层到隐层的变换是非线性的,隐层的作用是对输入向量进行非线性变换,而从隐层到输出层的变换是线性的,也就是网络的输出是隐节点输出的线性加权和。RBF神经网络的结构如图2所示。
具有N个样本(Xi,Yi)的径向基函数神经网络模型,其中Xi=[xi1,xi2,…,xin]T∈Rn,Yi=[yi1,yi2,…,yim]T∈Rm,隐层神经元个数为l。本文的RBF神经网络用于近似连续函数h(X):Rn→R
其中μi=[μi1,μi2,...,μin]T是感受野的中心,σi是高斯函数的宽度。
RBF神经网络可以将一个连续函数在一个紧集ΩZ内近似到任意期望的精度,如下所示:
其中W*是理想权重,且||δ||≤ε是逼近误差,其中ε>0是一个常数。
事实上,理想的神经网络权值矩阵W*需要根据输入和期望输出之间的误差进行反馈求解,可被定义为:
步骤3,考虑存在扰动情况下的四足机器人单腿动力学模型,假设出参考轨迹,考虑当状态信息x1和x2完全已知的情况下,定义出一个广义的跟踪误差,通过引入一个虚拟控制和第二个误差变量。考虑李雅普诺夫函数,基于模型设计控制率,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,重新设计控制率。
当机器人的动力学方程考虑外界时变扰动时,则可以写成如下的形式
为了设计控制力矩使得系统能够实现较好的目标跟踪,设参考轨迹xr(t)可以表示为xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T。当状态信息x1和x2完全已知的情况下,定义一个广义的跟踪误差z1(t)=x1(t)-xr(t),且通过引入一个虚拟控制α1(t)和第二个误差变量定义为z2(t)=x2(t)-α1(t)。选择
这里的增益矩阵K1=K1 T>0,于是有
z2对时间进行求导得
考虑一个李亚普诺夫候选函数:
结合式(9)对V1求时间导数:
之后考虑李亚普诺夫候选函数:
上式对时间求导得
从而基于模型的控制率可以设计如下:
这里的增益矩阵K2=K2 T>0,将式(14)带入李亚普诺夫候选函数可得:
定义算子“⊙”:
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量。
基于上述模型建立控制器为:
这里的增益矩阵K2=K2 T>0,从而
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
为了验证所提方法的有效性,针对四足机器人3自由度单腿进行仿真验证。仿真实现中,RBF神经网络的隐层神经元设为256个,中心取值为1,宽度取值为0.02,Γ取值为10,神经网络的初始权值为较小的随机数,初始位置为0,K1=K2=20,期望轨迹xr=[0.2+2sin(2t);-1.7+1.8cos(2t);-1.5+0.8sin(4t)]。外界扰动为f=sin(πt)+2sin(2πt)+3sin(3πt)。
图3至图6分别展示了仿真中四足机器人单腿关节2和关节3的位置轨迹、轨迹跟踪误差,速度状态与速度误差。图7是三个关节的控制输入,图8表示三个关节位置与速度的误差和。由仿真结果可以看出,基于RBF神经网络设计的控制率(NN控制)对实现四足机器人单腿轨迹追踪行为是有效的,三个关节均能准确地追踪到预先给定的期望轨迹与期望速度。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (3)
1.一种四足机器人单腿轨迹跟踪控制方法,其特征在于,包括:
步骤一,获取四足机器人的关节参数;所述关节参数包括关节位置、速度和加速度矢量;四足机器人单腿髋关节外摆自由度和髋关节横滚自由度在同一个轴上,外摆自由度的长度简化为0,单腿包括依次连接设置的旋转基座、第一连杆和第二连杆,2个连杆的长度用l1和l2表示;
步骤二,根据关节参数建立四足机器人3自由度单腿动力学模型,包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量;对称正定惯性矩阵为:
科氏力和离心力矩阵为:
si=sinθi,ci=cosθi,sij=sin(θi+θj),cij=cos(θi+θj);
重力矢量为:
步骤三,基于扰动及神经网络修正单腿动力学模型,建立考虑扰动情况的单腿动力学模型,并假设参考轨迹;所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值;所述考虑扰动情况的单腿动力学模型为:
设参考轨迹xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T;
步骤四,利用基于神经网络学习的值函数逼近方法,设计控制率与自适应率;
其中增益矩阵K2=K2 T>0;
定义算子⊙:
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量;
建立控制器:
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Γi是常数增益矩阵,且φi>0,i=1,2,...n是小值常数;
步骤五,基于设计的控制率与自适应率实现四足机器人单腿轨迹跟踪控制。
2.一种四足机器人单腿轨迹跟踪控制器,其特征在于,包括:
数据获取模块,被配置为获取四足机器人的关节参数;所述关节参数包括关节位置、速度和加速度矢量;四足机器人单腿髋关节外摆自由度和髋关节横滚自由度在同一个轴上,外摆自由度的长度简化为0,单腿包括依次连接设置的旋转基座、第一连杆和第二连杆,2个连杆的长度用l1和l2表示;
单腿动力学模型建立模块,被配置为根据关节参数建立四足机器人3自由度单腿动力学模型;包括,根据关节位置、速度、加速度矢量的对称正定惯性矩阵、科氏力和离心力矩阵以及重力矢量得到控制力矩矢量;
对称正定惯性矩阵为:
科氏力和离心力矩阵为:
si=sinθi,ci=cosθi,sij=sin(θi+θj),cij=cos(θi+θj);
重力矢量为:
参考轨迹建立模块,被配置为基于扰动及神经网络修正单腿动力学模型,建立考虑扰动情况下的单腿动力学模型,并假设参考轨迹;所述神经网络为RBF神经网络,使用神经网络近似连续函数,由输入和期望输出之间的误差定义神经网络的权值;所述考虑扰动情况的单腿动力学模型为:
设参考轨迹xr(t)=[θ1r(t),θ2r(t),θ3r(t)]T;
控制率获取模块,被配置为利用基于神经网络学习的值函数逼近方法,设计控制率与自适应率;
其中增益矩阵K2=K2 T>0;
定义算子⊙:
这里的a=[a1,a2]T和b=[b1,b2]T是两个二维向量;
建立控制器:
由于在参数M(x1),C(x1,x2),G(x1),f中存在不确定性,利用RBF神经网络估计器来逼近机器人参数的不确定性,提高机器人的跟踪性能,控制率重新设计为:
Γi是常数增益矩阵,且φi>0,i=1,2,...n是小值常数;
跟踪控制模块,被配置为基于设计的控制率与自适应率实现四足机器人单腿轨迹跟踪控制。
3.一种四足机器人单腿轨迹跟踪控制系统,其特征在于,包括如权利要求2所述的四足机器人单腿轨迹跟踪控制器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110324222.9A CN113219825B (zh) | 2021-03-26 | 2021-03-26 | 一种四足机器人单腿轨迹跟踪控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110324222.9A CN113219825B (zh) | 2021-03-26 | 2021-03-26 | 一种四足机器人单腿轨迹跟踪控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113219825A CN113219825A (zh) | 2021-08-06 |
CN113219825B true CN113219825B (zh) | 2023-04-25 |
Family
ID=77084174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110324222.9A Active CN113219825B (zh) | 2021-03-26 | 2021-03-26 | 一种四足机器人单腿轨迹跟踪控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113219825B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115494751A (zh) * | 2022-05-09 | 2022-12-20 | 深圳先进技术研究院 | 控制器训练方法、轨迹跟踪方法、终端设备以及存储介质 |
CN115128960B (zh) * | 2022-08-30 | 2022-12-16 | 齐鲁工业大学 | 一种基于深度强化学习双足机器人运动控制方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103941582B (zh) * | 2014-03-25 | 2016-08-17 | 中国人民解放军国防科学技术大学 | 液压驱动型仿生单腿双环控制方法 |
CN106406085B (zh) * | 2016-03-15 | 2019-02-01 | 吉林大学 | 基于跨尺度模型的空间机械臂轨迹跟踪控制方法 |
CN108942924B (zh) * | 2018-06-25 | 2021-07-13 | 南京理工大学 | 基于多层神经网络的模型不确定性机械臂运动控制方法 |
CN109465825B (zh) * | 2018-11-09 | 2021-12-10 | 广东工业大学 | 机械臂柔性关节的rbf神经网络自适应动态面控制方法 |
CN112077839B (zh) * | 2020-08-06 | 2022-03-22 | 中科云谷科技有限公司 | 一种机械臂的运动控制方法及装置 |
CN112192573A (zh) * | 2020-10-14 | 2021-01-08 | 南京邮电大学 | 基于反演法的不确定性机器人自适应神经网络控制方法 |
-
2021
- 2021-03-26 CN CN202110324222.9A patent/CN113219825B/zh active Active
Non-Patent Citations (4)
Title |
---|
ChengxiangLiu.daptive neural network control with optimal number of hidden nodes for trajectory tracking of robot manipulators .Neurocomputing.2019,第350卷全文. * |
于浩.Guidance angle based trajectory tracking for wheeled mobile robots.控制与决策.2015,第30卷(第4期),全文. * |
刘金琨.柔性关节机器人自适应神经网络动态面控制.Proceedings of the 33rd Chinese Control Conference.2014,全文. * |
辛亚先.腿-轮复合机器人全方位运动控制器的设计与仿真.无人系统技术.2018,全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113219825A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110977988B (zh) | 基于有限时间命令滤波的多关节机械臂阻抗控制方法 | |
CN110202574B (zh) | 基于环境刚度估计的机器人自适应混合阻抗/导纳控制方法 | |
CN112904728B (zh) | 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法 | |
CN111496792A (zh) | 一种机械臂输入饱和固定时间轨迹跟踪控制方法及系统 | |
CN107505947B (zh) | 一种空间机器人捕获目标后消旋及协调控制方法 | |
CN107942670B (zh) | 一种双柔性空间机械臂模糊鲁棒滑模削抖运动控制方法 | |
CN113219825B (zh) | 一种四足机器人单腿轨迹跟踪控制方法及系统 | |
CN112207834B (zh) | 一种基于干扰观测器的机器人关节系统控制方法及系统 | |
CN114367980B (zh) | 基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人 | |
CN114750137A (zh) | 一种基于rbf网络的上肢外骨骼机器人运动控制方法 | |
CN115990888A (zh) | 一种具有死区和时变约束功能的机械臂控制方法 | |
Jun-Pei et al. | Neural network control of space manipulator based on dynamic model and disturbance observer | |
CN115256401A (zh) | 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法 | |
Atashzar et al. | Tracking control of flexible-link manipulators based on environmental force disturbance observer | |
CN114310914A (zh) | 多自由度机械臂模糊自适应迭代轨迹跟踪控制方法及系统 | |
CN112008728B (zh) | 基于选择性扰动补偿的全向移动机器人轨迹跟踪控制方法 | |
Thai et al. | Trajectory tracking control design for dual-arm robots using dynamic surface controller | |
CN116068901A (zh) | 一种基于自适应有限时间扰动观测器的柔性连杆机械臂控制方法 | |
CN111590561A (zh) | 一种分布式机械臂系统鲁棒预设性能控制方法 | |
CN112987770B (zh) | 两栖仿蟹多足机器人步行足抗饱和有限时间运动控制方法 | |
CN114859725A (zh) | 一种非线性系统自适应事件触发控制方法及系统 | |
CN114851193A (zh) | 一种空间机械臂与未知环境接触过程的智能柔顺操控方法 | |
CN114355771A (zh) | 协作机器人力位混合控制方法及系统 | |
Atashzar et al. | A robust feedback linearization approach for tracking control of flexible-link manipulators using an EKF disturbance estimator | |
CN113296398A (zh) | 一种柔性单链机械臂基于事件触发的命令滤波控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |