CN110456641B - 一种固定时预定性能循环神经网络机械臂控制方法 - Google Patents

一种固定时预定性能循环神经网络机械臂控制方法 Download PDF

Info

Publication number
CN110456641B
CN110456641B CN201910664075.2A CN201910664075A CN110456641B CN 110456641 B CN110456641 B CN 110456641B CN 201910664075 A CN201910664075 A CN 201910664075A CN 110456641 B CN110456641 B CN 110456641B
Authority
CN
China
Prior art keywords
neural network
formula
control
performance
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910664075.2A
Other languages
English (en)
Other versions
CN110456641A (zh
Inventor
倪骏康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201910664075.2A priority Critical patent/CN110456641B/zh
Publication of CN110456641A publication Critical patent/CN110456641A/zh
Application granted granted Critical
Publication of CN110456641B publication Critical patent/CN110456641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种固定时预定性能循环神经网络机械臂控制方法,包括:(1)建立直流电机驱动机械臂的数学模型,建立带有未知非线性死区的执行器模型;(2)系统参考输出,设计跟踪误差需要满足的性能函数;(3)设计固定时预定性能循环神经网络控制器、神经网络权值更新律和固定时微分器,使系统输出能够在固定时间内跟踪上参考输出轨迹,同时将系统跟踪误差限制在预先指定的性能边界范围内;(4)对控制系统进行稳定性分析,根据稳定性分析结果确定控制器参数。本发明所提出的方法能够实现固定时间预定性能轨迹跟踪,从而降低了跟踪时间,提升了控制精度,保证了控制过程中系统的暂态和稳态性能。

Description

一种固定时预定性能循环神经网络机械臂控制方法
技术领域
本发明涉及工业控制领域,特别涉及一种固定时预定性能循环神经网络机械臂控制方法。
背景技术
高性能运动控制对于许多工业应用至关重要。高性能运动控制要求电机能够驱动负载(机械臂)沿着预定轨迹运动,对跟踪时间、跟踪精度以及系统暂态和稳态跟踪 性能提出了很高的要求。传统的控制方法基于前馈神经网络。然而,前馈神经网络是 一个静态映射,无法在没有延时的情况下表达动态映射。此外,前馈神经网络的函数 逼近性能对训练数据敏感,当其输入受到大扰动时,其函数逼近性能将变差。而运动 控制系统是一个动态系统,并且受到各种外部干扰的影响。因此,将传统基于前馈神 经网络的控制方法用于运动控制中将难以获得良好的控制性能。与前馈神经网络不同, 循环神经网络具有前馈连接和内部信息的反馈环,可以捕捉系统动态响应和存储信息 供以后使用。此外,循环神经网络具有良好的处理时变输入的能力。因此,循环神经 网络是一个动态映射,更适合于处理动态系统,特别是在系统出现参数变化,参考轨 迹突变,噪声和外部干扰情况下能显示出卓越的性能。然而,既有基于循环神经网络 的控制方案没有考虑控制输入死区。
在实际系统中,死区广泛存在于机械连接、液压系统和运动控制系统的其他组成部分中,当执行器输入落在死区范围内时,执行器将不产生控制信号,这将降低系统 控制性能,导致控制不精确,甚至造成系统失稳。许多方法被提出用于解决死区问题。 神经网络和模糊逻辑被用于估计和补偿死区非线性。然而,由于死区函数的非光滑特 性,需要使用更多的节点、训练次数和模糊规则来逼近死区非线性,这增加了计算负 担。自适应死区逆方法被用于解决死区问题。然而,未知死区参数的自适应律包含执 行器输入u,而执行器输入u仅能在确定待估计的死区参数后才能获得,这使得该方 法难以实际实施。另一种处理死区的方法是将死区建模为线性项和干扰项的组合形式, 使用自适应方法或鲁棒方法来估计和补偿干扰。然而,这些结果仅能保证闭环系统稳 定,跟踪误差收敛到小的残差集合内,但无法保证预定性能。
对于运动控制系统,通常要求跟踪误差需要满足一些性能指标,诸如超调、稳态误差、收敛速度等。预定性能控制可以保证跟踪误差以充分快的收敛速度,充分小的 超调和稳态误差收敛到小的残差集合。既有的预定性能控制方法可以分为三类:基于 壁垒李雅普诺夫函数的预定性能控制,基于funnel控制的预定性能控制和基于坐标变 换的预定性能控制。然而,当李雅普诺夫函数变化时,基于壁垒李雅普诺夫函数的预 定性能控制需要重新设计。此外,对于不对称的预定性能限制,壁垒李雅普诺夫函数 是一个分段光滑函数,需要保证稳定函数的可微性和连续性。基于funnel控制的预定 性能控制要求受控系统必须是S型线性或非线性系统,系统相对阶数为1或2,并且高 频增益符号是已知的,这限制了基于funnel控制的预定性能控制的应用。基于坐标变 换的预定性能控制在进行坐标变换及其逆变换时引入复杂函数及其导数项,这将增加 计算负担。此外,基于坐标变换的预定性能控制还存在奇异性问题,将导致过大的控 制输入,造成执行器饱和甚至造成系统不可控。而且,坐标变换在原点处不可微。既 有的预定性能控制无法保证跟踪误差有限时间收敛到零,无法满足许多实际应用对控 制精度和收敛时间的要求。
固定时控制可以保证误差在有限时间内收敛到零,并且收敛时间的上界是一个常数,该常数与初值无关而仅由设计参数决定。这有利于稳定时间估计和控制器设计以 满足实际应用对收敛时间的要求。既有的固定时控制实现了一阶、二阶和高阶系统固 定时稳定。但是,这些控制方法未能考虑暂态和稳态性能,无法保证跟踪误差沿着预 先指定的性能函数收敛。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种固定时预定性能循环神经网络机械臂控制方法,以满足实际运动控制系统对跟踪时间、跟踪精度以及系统暂态和稳态 跟踪性能的高要求,并考虑实际系统中普遍存在的控制死区,使得直流电机驱动的机 械手能够在固定时间内跟踪上理想轨迹,并保证跟踪误差不超过预定性能边界。
技术方案
一种固定时预定性能循环神经网络机械臂控制方法,其特征在于步骤如下:
步骤1:建立直流电机驱动机械臂的数学模型,直流电机驱动机械臂的数学模型包括机械子系统和电气子系统,其中机械子系统的数学模型为:
Figure BDA0002139497620000031
式中,q,
Figure BDA0002139497620000032
分别表示角位置、角速度和角加速度,I是电机电枢电流,ΔI为 电流干扰,J为电机转子转动惯量,m为连接质量,M为负载质量,d为连接长度,δ 为负载半径,g为重力加速度,B为连接的粘滞摩擦系数,Kr是机电转矩耦合系数;
电气子系统的数学模型为:
Figure BDA0002139497620000033
式中,L为电枢电感,R为电枢电阻,KB为反电动势系数,V为输入控制电压;
令x1=q,
Figure BDA0002139497620000034
x3=I,u=V,
Figure BDA0002139497620000035
则由机械子系统(1)和电气子系统(2)组成的直流电机驱动机械臂可以表示为:
Figure BDA0002139497620000036
式中,
Figure BDA0002139497620000041
其中i=1,2,3,f1(x1)=0,
Figure BDA0002139497620000042
d1=0,
Figure BDA0002139497620000043
由于实际系统中存在不确定参数,因此
Figure BDA0002139497620000044
Figure BDA0002139497620000045
其中i=1,2,3是未知函数;
建立带有未知非线性死区的执行器模型:
Figure BDA0002139497620000046
式中,v为实际控制输入,Dr(v)和Dl(v)是连续光滑非线性函数,br>0和bl>0是 确定死区大小的未知参数;
考虑到Dl(-bl)=0,Dr(br)=0,根据均值定理有:
Figure BDA0002139497620000047
Figure BDA0002139497620000048
执行器模型(4)可以重新写为
Figure BDA0002139497620000049
进一步,(7)可以写为:
u=ωT(t)η(t)v+du (8)
式中:
ω(t)=[ωr(t),ωl(t)]T,η(t)=[ηr(t),ηl(t)]
Figure BDA00021394976200000410
Figure BDA00021394976200000411
Figure BDA0002139497620000051
这里假设存在常数
Figure BDA0002139497620000052
使得
Figure BDA0002139497620000053
Figure BDA0002139497620000054
由该假设可得,执行器模型表达式(8)中 干扰项du和线性项系数ωT(t)η(t)是有界的,即存在
Figure BDA0002139497620000055
Figure BDA0002139497620000056
使得|du|≤ρ,ωT(t)η(t)≥ν;
步骤2:确定的系统参考输出为
Figure BDA0002139497620000057
预定性能函数为
Figure BDA0002139497620000058
式中k,l,ρ为正实数;该预定性能函数具有三个性质:1)
Figure BDA0002139497620000059
2)
Figure BDA00021394976200000510
3)
Figure BDA00021394976200000511
跟踪误差e1=y-yd被限制在如下范围内:
Figure BDA00021394976200000512
式中
Figure BDA00021394976200000513
Figure BDA00021394976200000514
式中δ10,δ20,ψ1,ψ2,λ1,λ2为正常数;
步骤3:设计固定时预定性能循环神经网络控制器、神经网络权值更新律和固定时微分器,使系统输出能够在固定时间内跟踪上参考输出轨迹,同时将系统跟踪误差 限制在预先指定的性能边界范围内,具体如下:
设计实际控制输入为:
Figure BDA0002139497620000061
式中u*具有如下的表述形式:
Figure BDA0002139497620000062
式中,β33>0,τ3是待设计的正常数,
Figure BDA0002139497620000063
为神经网络最优权值
Figure BDA0002139497620000064
的估计值,其值由更新律(42)-(43)确定,
Figure BDA0002139497620000065
为固定时微分器状态变量,其值由(36) 确定,Θ3(·)为sigmoid函数,sig(·)α=|·|αsign(·),H3为隐层神经元输入,e3=x32,α2为虚拟控制,其值由(31)确定,e2=x21,α1为虚拟控制,其值由(16)确定;
神经网络权值估计值
Figure BDA0002139497620000066
的更新律为
Figure BDA0002139497620000067
Figure BDA0002139497620000068
式中,
Figure BDA0002139497620000069
Figure BDA00021394976200000610
是正常数,表示神经网络学习速率;
固定时微分器设计为:
Figure BDA00021394976200000611
式中,
Figure BDA00021394976200000612
为微分器状态变量,L,M>0,μi=iμ-(i-1),μ∈(1,1+κ),κ为充 分小的正常数,k1,k2,σ1,σ2为微分器增益,其值选择应使得矩阵A1和A为Hurwitz 矩阵;
Figure BDA00021394976200000613
Figure BDA00021394976200000614
虚拟控制α2设计为:
Figure BDA0002139497620000071
式中β22>0,τ2是待设计的正常数,
Figure BDA0002139497620000072
为神经网络最优权值
Figure BDA0002139497620000073
的估计值,其值由更新律(34)-(35)确定,
Figure BDA0002139497620000074
为固定时微分器状态变量,其值由(23) 确定,Θ2(·)为sigmoid函数,H2为隐层神经元输入,e2=x21,α1为虚拟控制,其 值由(16)确定,z1=ξ/(1-ξ),
Figure BDA0002139497620000075
Figure BDA0002139497620000076
为充分小的正常数,
Figure BDA0002139497620000077
神经网络权值估计值
Figure BDA0002139497620000078
的更新律为
Figure BDA0002139497620000079
Figure BDA00021394976200000710
式中,
Figure BDA00021394976200000711
Figure BDA00021394976200000712
是正常数,表示神经网络学习速率;
固定时微分器设计为:
Figure BDA00021394976200000713
式中,
Figure BDA00021394976200000714
为微分器状态变量,其他变量的物理意义与(36)相同;
虚拟控制α1设计为:
Figure BDA00021394976200000715
式中,β11>0,τ1是待设计的正常数,
Figure BDA00021394976200000716
为神经网络最优权值
Figure BDA00021394976200000717
V1 *的估 计值,其值由更新律(21)-(22)确定,Θ1(·)为sigmoid函数,H1为隐层神经元输入, 其他变量的物理意义与(31)相同;
神经网络权值估计
Figure BDA0002139497620000081
的更新律为
Figure BDA0002139497620000082
Figure BDA0002139497620000083
式中
Figure BDA0002139497620000084
Figure BDA0002139497620000085
为表示神经网络学习速率的正常数;
步骤4:对控制系统进行稳定性分析,根据稳定性分析结果确定控制器参数,所 述的控制参数选择应满足以下条件:β33>0,β22>0,β11>0,切换增益τi满足:
Figure BDA0002139497620000086
Figure BDA0002139497620000087
Figure BDA0002139497620000088
式中
Figure BDA0002139497620000089
表示神经网络权值估计误差,w1,w2,w3具有如下形式:
Figure BDA00021394976200000810
Figure BDA00021394976200000811
Figure BDA00021394976200000812
式中,
Figure BDA00021394976200000813
表示二阶及以上阶次的无穷小量,
Figure BDA00021394976200000814
和Vi *表示理想的神经网络权值,εi表示神经网络逼近误差;
步骤5:采用步骤4确定的控制参数对直流电机驱动机械臂实施控制,使系统输 出能够在固定时间内跟踪上参考输出轨迹,同时将系统跟踪误差限制在预先指定的性 能边界范围内。
κ=0.2。
Figure BDA00021394976200000815
有益效果
本发明提出的一种固定时预定性能循环神经网络机械臂控制方法,相对于现有技术,本发明的创新性体现在以下四个方面:
(a)、本发明提出了新颖的预定性能函数,与既有的预定性能函数相比,本发明所提出的预定性能函数无需精确的跟踪误差初值信息。
(b)、本发明提出了新颖的坐标变换,克服了既有坐标变换存在的不可微问题,简化了控制器设计,克服了奇异性问题。
(c)、本发明为直流电机驱动机械臂提出了新颖的固定时预定性能控制。同既有的预定性能控制方法相比,所提出的控制方法具有更快的收敛速度和更高的收敛精度。 同既有的固定时控制方法相比,所提出的控制方案具有更好的稳态和暂态性能。
(d)、本发明考虑了更为普遍的未知非线性死区并且消除了既有方法对控制增益做 出的限定性假设,因而所设计的控制器能够更好的应用于实际直流电机驱动机械臂系统。
相对于现有技术,本发明具有以下有益效果:
(a)、本发明所提出的固定时预定性能循环神经网络控制方法,充分考虑了实际系统中存在的死区、系统不确定和外部干扰等限制因素,消除了既有方法对控制增益 做出的限定性假设,因而能够更好地应用于实际系统中。
(b)、所提出的控制方案能够实现固定时间预定性能轨迹跟踪,从而降低了跟踪时间,提升了控制精度,保证了控制过程中系统的暂态和稳态性能。
(c)、所提出的控制方案简化了控制器设计,克服了奇异性问题,增强了系统的 鲁棒性。
附图说明
图1是本发明提供的一种固定时预定性能神经网络控制方法的控制流程图
图2是本发明的实施例中系统状态的时间响应图
图3是本发明的实施例中误差的时间响应图
图4是本发明的实施例中虚拟控制和真实控制的时间响应图
图5是本发明的实施例中不同初始跟踪误差下的收敛时间曲线图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
高性能运动控制对于许多工业应用至关重要。高性能运动控制要求电机能够驱动负载(机械臂)沿着预定轨迹运动,对跟踪时间、跟踪精度以及系统暂态和稳态跟踪 性能提出了很高的要求。直流电机驱动的机械臂系统是一个动态系统,运行参数不断 变化,而且容易受到外部干扰的影响。此外,死区广泛存在于机械连接、液压系统和 运动控制系统的其他组成部分中,当执行器输入落在死区范围内时,执行器将不产生 控制信号,这将降低系统控制性能,导致控制不精确,甚至造成系统失稳。因此,在 控制设计中需要考虑系统不确定、外部干扰、死区等限制因素,同时也需要考虑实际 系统对跟踪时间、跟踪精度以及系统暂态和稳态跟踪性能的高要求。
请参阅图1至图5所示,本发明提供一种固定时预定性能神经网络控制方法,包 括以下步骤:
(1)建立直流电机驱动机械臂的数学模型。直流电机驱动机械臂可以分为机械子系统和电气子系统,其中机械子系统的数学模型为:
Figure BDA0002139497620000101
式中,q,
Figure BDA0002139497620000102
分别表示角位置、角速度和角加速度,I是电机电枢电流,ΔI为 电流干扰,J为电机转子转动惯量,m为连接质量,M为负载质量,d为连接长度,δ 为负载半径,g为重力加速度,B为连接的粘滞摩擦系数,Kr是机电转矩耦合系数。
电气子系统的数学模型为:
Figure BDA0002139497620000111
式中,L为电枢电感,R为电枢电阻,KB为反电动势系数,V为输入控制电压。
建立带有未知非线性死区的执行器模型:
Figure BDA0002139497620000112
式中,v为实际控制输入,Dr(v)和Dl(v)是连续光滑非线性函数,br>0和bl>0是 确定死区大小的未知参数。
考虑到Dl(-bl)=0,Dr(br)=0,根据均值定理有:
Figure BDA0002139497620000113
Figure BDA0002139497620000114
执行器模型(4)可以重新写为
Figure BDA0002139497620000115
进一步,(6)可以写为:
u=ωT(t)η(t)v+du (7)
式中:
ω(t)=[ωr(t),ωl(t)]T,η(t)=[ηr(t),ηl(t)]
Figure BDA0002139497620000116
Figure BDA0002139497620000117
Figure BDA0002139497620000118
(2)确定系统的参考输出为
Figure BDA0002139497620000121
预定性能函数为
Figure BDA0002139497620000122
式中k,l,ρ为正实数。该预定性能函数具有三个性质:1)
Figure BDA0002139497620000123
2)
Figure BDA0002139497620000124
3)
Figure BDA0002139497620000125
跟踪误差e1=y-yd被限制在如下范围内:
Figure BDA0002139497620000126
式中
Figure BDA0002139497620000127
Figure BDA0002139497620000128
式中δ10,δ20,ψ1,ψ2,λ1,λ2为正常数。
(3)设计固定时预定性能循环神经网络控制律,实现控制目标。首先,将系统(1)写为控制系统的标准形式。令x1=q,
Figure BDA0002139497620000129
x3=I,u=V,
Figure BDA00021394976200001210
Figure BDA00021394976200001211
则由机械子系统(1)和电气子系统(2)组成的直流电机 驱动机械臂可以表示为:
Figure BDA00021394976200001212
式中
Figure BDA00021394976200001213
f1(x1)=0,
Figure BDA00021394976200001214
d1=0,
Figure BDA00021394976200001215
Figure BDA0002139497620000131
d3=0。由于实际系统中存在 不确定参数,因此
Figure BDA0002139497620000132
Figure BDA0002139497620000133
是未知函数。
接下来,对于控制系统(12)设计固定时预定性能循环神经网络控制律:
在控制器设计之前,对控制参数,控制增益和参考输出信号做如下假设:
假设1:死区(6)中的参数是未知的,但是其断点bl,br和斜率D′l(v),D′r(v)是有界的,即存在常数
Figure BDA0002139497620000134
使得
Figure BDA0002139497620000135
Figure BDA0002139497620000136
假设2:理想输出yd及其导数是有界的。
假设3:外部干扰di是有界的。
第一步:将虚拟误差定义为
Figure BDA0002139497620000137
式中z1=ξ/(1-ξ),
Figure BDA0002139497620000138
e1=y-yd
Figure BDA0002139497620000139
Figure BDA00021394976200001310
为 充分小的正常数,例如
Figure BDA00021394976200001311
求取虚拟误差的导数可得:
Figure BDA00021394976200001312
由于非线性函数f1(x1)和g1(x1)是未知的,循环神经网络用于逼近F1(x1):
Figure BDA00021394976200001313
式中H1为隐层神经元输入,
Figure BDA00021394976200001314
为隐层到输出层最优权值向量,V1 *为隐层和输入层之 间最优权值向量,Θ1(·)为sigmoid函数,ε1为神经网络逼近误差。
虚拟控制选择为:
Figure BDA0002139497620000141
式中β11>0,τ1是待设计的正常数,
Figure BDA0002139497620000142
为神经网络最优权值
Figure BDA0002139497620000143
V1 *的估计值, 其值由更新律(20)-(21)确定,Θ1(·)为sigmoid函数。
定义
Figure BDA0002139497620000144
神经网络逼近误差表示为:
Figure BDA0002139497620000145
式中
Figure BDA0002139497620000146
Θ1(V1 *H1)在
Figure BDA0002139497620000147
附近的Taylor展开为:
Figure BDA0002139497620000148
式中
Figure BDA0002139497620000149
Figure BDA00021394976200001410
为Taylor展开的高阶项,
Figure BDA00021394976200001411
将(18)代入到(17)中则有
Figure BDA00021394976200001412
式中
Figure BDA00021394976200001413
神经网络权值更新律设计为:
Figure BDA00021394976200001414
Figure BDA00021394976200001415
式中
Figure BDA00021394976200001416
Figure BDA00021394976200001417
为表示神经网络学习速率的正常数。
第二步:为了克服复杂性爆炸问题,构造如下固定时微分器获得虚拟控制的导数:
Figure BDA0002139497620000151
式中
Figure BDA0002139497620000152
Figure BDA0002139497620000153
表示微分器状态,L,M>0,微分器增益k1,k212应选择使得式(26)和(28)定义的矩阵A1和A为Hurwitz矩阵。μi=iμ-(i-1),式中μ∈(1,1+ι),ι为充分小 的正数,sig(·)α=|·|αsign(·)。
引理1:微分器(23)将在有限时间内给出虚拟控制α1的时间导数,该收敛时间的上界为:
Figure BDA0002139497620000154
式中
Figure BDA0002139497620000155
P1和Q1为满足如下条件的对称正定矩阵:
Figure BDA0002139497620000156
式中
Figure BDA0002139497620000157
P和Q为满足如下条件的对称正定矩阵
PA+ATP=-Q (27)
式中
Figure BDA0002139497620000158
定义误差变量为e2=x21,取e2的时间导数为:
Figure BDA0002139497620000159
类似于第一步,使用循环神经网络逼近未知非线性函数
Figure BDA00021394976200001510
Figure BDA00021394976200001511
式中H2是隐层输入,
Figure BDA00021394976200001512
为隐层到输出层最优权值向量,
Figure BDA00021394976200001513
为隐层和输入层之间最优权 值向量,Θ2(·)为sigmoid函数,ε2为神经网络逼近误差。
虚拟控制设计为:
Figure BDA0002139497620000161
式中,
Figure BDA0002139497620000162
Figure BDA0002139497620000163
Figure BDA0002139497620000164
Figure BDA0002139497620000165
的估计,β22>0,τ2是待确定的正常数。
定义
Figure BDA0002139497620000166
循环神经网络逼近误差为:
Figure BDA0002139497620000167
式中
Figure BDA0002139497620000168
循环神经网络权值更新律为:
Figure BDA0002139497620000169
Figure BDA00021394976200001610
式中,
Figure BDA00021394976200001611
Figure BDA00021394976200001612
是表示神经网络学习速率的正常数。
第三步:在这一步,虚拟控制α2的导数由如下固定时微分器获得:
Figure BDA00021394976200001613
Figure BDA00021394976200001614
为固定时微分器状态变量,(36)中其他参数与(23)具有相同的物理意义。
将误差变量定义为e3=x32,e3的时间导数为:
Figure BDA00021394976200001615
式中未知的非线性函数
Figure BDA00021394976200001616
使用循环神经网络逼近为:
Figure BDA00021394976200001617
式中H3为隐层神经元输入,
Figure BDA00021394976200001618
为输出层和隐层间最优权值向量,
Figure BDA00021394976200001619
为隐层和输入层之 间最优权值向量,Θ3(·)为sigmoid函数,ε3为神经网络逼近误差。
进一步,
Figure BDA0002139497620000171
可以写为
Figure BDA0002139497620000172
式中
Figure BDA0002139497620000173
虚拟控制输入设计为:
Figure BDA0002139497620000174
式中,β33>0,τ3是待设计的正常数,
Figure BDA0002139497620000175
为神经网络理想权值系数
Figure BDA0002139497620000176
Figure BDA0002139497620000177
的估 计值,Θ3(·)为sigmoid函数,H3为隐层神经元输入。
权值更新律设计为
Figure BDA0002139497620000178
Figure BDA0002139497620000179
式中
Figure BDA00021394976200001710
Figure BDA00021394976200001711
是表示神经网络学习速率的正常数。
所设计的实际控制输入为:
Figure BDA00021394976200001712
式中,
Figure BDA00021394976200001713
(4)对控制系统进行稳定性分析,根据稳定性分析结果确定控制器参数。首先,引入 如下引理:
引理1:对于任意正实数x1,...,xn和0<b<1,如下不等式成立:
Figure BDA00021394976200001714
引理2:对于任意正实数x1,...,xn和0<p<1,如下不等式成立:
Figure BDA0002139497620000181
接下来,在第一步,考虑如下的李雅普诺夫函数:
Figure BDA0002139497620000182
W1的时间导数为:
Figure BDA0002139497620000183
在第二步,选择李雅普诺夫函数为:
Figure BDA0002139497620000184
沿着(29),(34),(35)微分W2可得:
Figure BDA0002139497620000185
在t≥T1后,我们有
Figure BDA0002139497620000191
且(50)变为:
Figure BDA0002139497620000192
在第3步,考虑如下的李雅普诺夫函数:
Figure BDA0002139497620000193
对W3求取时间导数则有:
Figure BDA0002139497620000194
在t≥(n-1)T1后,则有
Figure BDA0002139497620000195
(53)变为:
Figure BDA0002139497620000196
这说明
Figure BDA0002139497620000197
z1,e1
Figure BDA0002139497620000198
是一致最终有界的。由于
Figure BDA0002139497620000199
Vi *是常值向量,则有
Figure BDA00021394976200001910
Figure BDA00021394976200001911
有界。由于z1有界,ξ是有界的。ξ和
Figure BDA00021394976200001912
的有界性导致e1有界。由于
Figure BDA00021394976200001913
Θ1(·),
Figure BDA00021394976200001914
Figure BDA00021394976200001915
e1,ξ是有界的,β1,γ1,τ1为常数,则α1是有界的。
Figure BDA00021394976200001916
Figure BDA00021394976200001917
都是带有有界论域的连续函数,
Figure BDA00021394976200001918
Figure BDA00021394976200001919
是有界的。由于z1,ξ,e2
Figure BDA00021394976200001920
Figure BDA0002139497620000201
Θ2(·),
Figure BDA0002139497620000202
是有界的,β2,γ2,τ2是常数,α2是有界的。由于
Figure BDA0002139497620000203
Figure BDA0002139497620000204
均为含有有界论域的连续函数,
Figure BDA0002139497620000205
Figure BDA0002139497620000206
是有界的。类 似的,α3
Figure BDA0002139497620000207
ζ22和u是有界的。由于
Figure BDA0002139497620000208
Θi(·),Θ′i(·),εi
Figure BDA0002139497620000209
是有界的,
Figure BDA00021394976200002010
是常值向量,wi是有界的。因此,所有的闭环信号是有界的。
选择如下的李雅普诺夫函数:
Figure BDA00021394976200002011
Figure BDA00021394976200002012
后,微分器可以给出虚拟控制精确的微分,即,
Figure BDA00021394976200002013
W4的时间导数为:
Figure BDA00021394976200002014
当切换增益τi满足:
Figure BDA0002139497620000211
Figure BDA0002139497620000212
Figure BDA0002139497620000213
(52)变为:
Figure BDA0002139497620000214
式中:β=min{β12,...,βn},γ=min{γ12,...,γn}
根据引理2-3,则有
Figure BDA0002139497620000215
Figure BDA0002139497620000216
(61)和(62)代入(60)可得:
Figure BDA0002139497620000217
Figure BDA0002139497620000218
则(63)成为:
Figure BDA0002139497620000219
收敛时间的上界可以估计为:
Figure BDA00021394976200002110
因此,误差变量将在固定时间T内收敛到0,:
Figure BDA00021394976200002111
由上述分析可以看出,所设计控制律的控制参数选择应满足以下条件:β33>0,β22>0,β11>0,切换增益τi满足:
Figure BDA0002139497620000221
Figure BDA0002139497620000222
Figure BDA0002139497620000223
(5)采用步骤(4)确定的控制参数对直流电机驱动的机械手实施控制,使得所 驱动的单连杆机械手能够跟踪上理想的运动轨迹,并且保证系统输出不违反限制。
实施例:直流电机驱动的机械臂
以直流电机驱动的机械臂为例说明上述固定时预定性能循环神经网络控制方法在 实现所驱动机械臂跟踪理想轨迹上的有效性。由机械子系统(1)和电气子系统(2) 组成的机械臂数学模型可以表示为:
Figure BDA0002139497620000224
系统参数选取为
Figure BDA0002139497620000225
L=0.05,KB=0.5,R=0.5,ΔI=0.1cos(t)。 死区模型可以写为:
Figure BDA0002139497620000226
本实施例的一种直流电机驱动机械臂的固定时预定性能神经网络控制方法,包括以下步骤:
(1)确定控制目标:参考输出信号选择为
Figure BDA0002139497620000227
预定性能函数选择为
Figure BDA0002139497620000228
控制目标确定为系统输出可以在固定时间内跟踪上系统的参 考输出,同时使得跟踪误差e1=y-yd满足-(0.2exp(-5t)+0.3)ρ(t)<e1(t)<(0.2exp(-5t)+0.3)ρ(t)。
(2)为实现控制目标,设计控制输入为:
Figure BDA0002139497620000231
式中u*具有如下的表述形式:
Figure BDA0002139497620000232
(3)根据李雅普诺夫函数稳定性分析,控制器,微分器和循环神经网络学习速率参数 选为βi=γi=0.5,τ2=4,τ3=5,p=5,q=9,μ=1.2,L=M=10,k1=5,k2=10, σ1=5,σ2=10,
Figure BDA0002139497620000233
sigmoid函数选择为Θ(x)=1/(1+exp(-5x))。可以证明, 这组控制参数满足李雅普诺夫稳定性。
(4)采用步骤(3)确定的控制参数对直流电机驱动机械臂实施控制,使得所驱动的机械臂能够跟踪上理想的运动轨迹,同时使得跟踪误差e1=y-yd满足 -(0.2exp(-5t)+0.3)ρ(t)<e1(t)<(0.2exp(-5t)+0.3)ρ(t)。
所提供的一种固定时预定性能神经网络控制方法的流程图示于图1。角位置q,角速度
Figure BDA0002139497620000234
和电枢电流I的时间响应如图2所示。误差的时间响应如图3所示。图4示出了 虚拟控制和真实控制的时间响应。图5展示了不同初始跟踪误差下的收敛时间曲线。 从这些图中可以看出,系统轨迹在固定时间内跟踪上参考输出轨迹,跟踪误差没有出 现超过预定性能函数的情况,控制输入、误差变量和系统状态有界,随着初值的变化, 收敛时间趋向于一个常数。

Claims (3)

1.一种固定时预定性能循环神经网络机械臂控制方法,其特征在于步骤如下:
步骤1:建立直流电机驱动机械臂的数学模型,直流电机驱动机械臂的数学模型包括机械子系统和电气子系统,其中机械子系统的数学模型为:
Figure FDA0003456682130000011
式中,q,
Figure FDA0003456682130000012
分别表示角位置、角速度和角加速度,I是电机电枢电流,ΔI为电流干扰,J为电机转子转动惯量,m为连接质量,M为负载质量,d为连接长度,δ为负载半径,g为重力加速度,B为连接的粘滞摩擦系数,Kr是机电转矩耦合系数;
电气子系统的数学模型为:
Figure FDA0003456682130000013
式中,L为电枢电感,R为电枢电阻,KB为反电动势系数,V为输入控制电压;
令x1=q,
Figure FDA0003456682130000014
x3=I,u=V,
Figure FDA0003456682130000015
则由机械子系统(1)和电气子系统(2)组成的直流电机驱动机械臂可以表示为:
Figure FDA0003456682130000016
式中,
Figure FDA0003456682130000017
其中i=1,2,3,f1(x1)=0,
Figure FDA0003456682130000018
d1=0,
Figure FDA0003456682130000019
d3=0;由于实际系统中存在不确定参数,因此
Figure FDA00034566821300000110
Figure FDA00034566821300000111
是未知函数,其中i=1,2,3;
建立带有未知非线性死区的执行器模型:
Figure FDA00034566821300000112
式中,v为实际控制输入,Dr(v)和Dl(v)是连续光滑非线性函数,br>0和bl>0是确定死区大小的未知参数;
考虑到Dl(-bl)=0,Dr(br)=0,根据均值定理有:
Figure FDA0003456682130000021
Figure FDA0003456682130000022
执行器模型(4)可以重新写为
Figure FDA0003456682130000023
进一步,(7)可以写为:
u=ωT(t)η(t)v+du (8)
式中:
ω(t)=[ωr(t),ωl(t)]T,η(t)=[ηr(t),ηl(t)]
Figure FDA0003456682130000024
Figure FDA0003456682130000025
Figure FDA0003456682130000026
这里假设存在常数
Figure FDA0003456682130000027
dl
Figure FDA0003456682130000028
dr
Figure FDA0003456682130000029
bl
Figure FDA00034566821300000210
br 使得
Figure FDA00034566821300000211
Figure FDA00034566821300000212
由该假设可得,执行器模型表达式(8)中干扰项du和线性项系数ωT(t)η(t)是有界的,即存在
Figure FDA00034566821300000213
和v=min{dl ,dr }使得|du|≤ρ,ωT(t)η(t)≥ν;
步骤2:确定的系统参考输出为
Figure FDA0003456682130000031
预定性能函数为
Figure FDA0003456682130000032
式中k,l,ρ为正实数;该预定性能函数具有三个性质:1)
Figure FDA0003456682130000033
Figure FDA0003456682130000034
跟踪误差e1=y-yd被限制在如下范围内:
Figure FDA0003456682130000035
式中
Figure FDA0003456682130000036
Figure FDA0003456682130000037
式中δ10,δ20,ψ1,ψ2,λ1,λ2为正常数;
步骤3:设计固定时预定性能循环神经网络控制器、神经网络权值更新律和固定时微分器,使系统输出能够在固定时间内跟踪上参考输出轨迹,同时将系统跟踪误差限制在预先指定的性能边界范围内,具体如下:
设计实际控制输入为:
Figure FDA0003456682130000038
式中u*具有如下的表述形式:
Figure FDA0003456682130000039
式中,β33>0,τ3是待设计的正常数,
Figure FDA00034566821300000310
为神经网络最优权值
Figure FDA00034566821300000311
V3 *的估计值,其值由更新律(42)-(43)确定,
Figure FDA00034566821300000312
为固定时微分器状态变量,其值由(36)确定,Θ3(·)为sigmoid函数,sig(·)α=|·|αsign(·),H3为隐层神经元输入,e3=x32,α2为虚拟控制,其值由(31)确定,e2=x21,α1为虚拟控制,其值由(16)确定;
神经网络权值估计值
Figure FDA0003456682130000041
的更新律为
Figure FDA0003456682130000042
Figure FDA0003456682130000043
式中,
Figure FDA0003456682130000044
Figure FDA0003456682130000045
是正常数,表示神经网络学习速率;
固定时微分器设计为:
Figure FDA0003456682130000046
式中,
Figure FDA0003456682130000047
为微分器状态变量,L,M>0,μi=iμ-(i-1),μ∈(1,1+κ),κ为充分小的正常数,k1,k2,σ1,σ2为微分器增益,其值选择应使得矩阵A1和A为Hurwitz矩阵;
Figure FDA0003456682130000048
Figure FDA0003456682130000049
虚拟控制α2设计为:
Figure FDA00034566821300000410
式中β22>0,τ2是待设计的正常数,
Figure FDA00034566821300000411
为神经网络最优权值
Figure FDA00034566821300000412
的估计值,其值由更新律(34)-(35)确定,
Figure FDA00034566821300000413
为固定时微分器状态变量,其值由(23)确定,Θ2(·)为sigmoid函数,H2为隐层神经元输入,e2=x21,α1为虚拟控制,其值由(16)确定,z1=ξ/(1-ξ),
Figure FDA00034566821300000414
Figure FDA00034566821300000415
为充分小的正常数,
Figure FDA00034566821300000416
神经网络权值估计值
Figure FDA0003456682130000051
的更新律为
Figure FDA0003456682130000052
Figure FDA0003456682130000053
式中,
Figure FDA0003456682130000054
Figure FDA0003456682130000055
是正常数,表示神经网络学习速率;
固定时微分器设计为:
Figure FDA0003456682130000056
式中,
Figure FDA0003456682130000057
为微分器状态变量,其他变量的物理意义与(36)相同;
虚拟控制α1设计为:
Figure FDA0003456682130000058
式中,β11>0,τ1是待设计的正常数,
Figure FDA0003456682130000059
为神经网络最优权值
Figure FDA00034566821300000510
的估计值,其值由更新律(21)-(22)确定,Θ1(·)为sigmoid函数,H1为隐层神经元输入,其他变量的物理意义与(31)相同;
神经网络权值估计
Figure FDA00034566821300000511
的更新律为
Figure FDA00034566821300000512
Figure FDA00034566821300000513
式中
Figure FDA00034566821300000514
Figure FDA00034566821300000515
为表示神经网络学习速率的正常数;
步骤4:对控制系统进行稳定性分析,根据稳定性分析结果确定控制器参数,所述的控制参数选择应满足以下条件:β33>0,β22>0,β11>0,切换增益τi满足:
Figure FDA00034566821300000516
Figure FDA0003456682130000061
Figure FDA0003456682130000062
式中
Figure FDA0003456682130000063
表示神经网络权值估计误差,w1,w2,w3具有如下形式:
Figure FDA0003456682130000064
Figure FDA0003456682130000065
Figure FDA0003456682130000066
式中,
Figure FDA0003456682130000067
表示二阶及以上阶次的无穷小量,
Figure FDA0003456682130000068
和Vi *表示理想的神经网络权值,εi表示神经网络逼近误差;
步骤5:采用步骤4确定的控制参数对直流电机驱动机械臂实施控制,使系统输出能够在固定时间内跟踪上参考输出轨迹,同时将系统跟踪误差限制在预先指定的性能边界范围内。
2.根据权利要求1所述的一种固定时预定性能循环神经网络机械臂控制方法,其特征在于κ=0.2。
3.根据权利要求1所述的一种固定时预定性能循环神经网络机械臂控制方法,其特征在于
Figure FDA0003456682130000069
CN201910664075.2A 2019-07-23 2019-07-23 一种固定时预定性能循环神经网络机械臂控制方法 Active CN110456641B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910664075.2A CN110456641B (zh) 2019-07-23 2019-07-23 一种固定时预定性能循环神经网络机械臂控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910664075.2A CN110456641B (zh) 2019-07-23 2019-07-23 一种固定时预定性能循环神经网络机械臂控制方法

Publications (2)

Publication Number Publication Date
CN110456641A CN110456641A (zh) 2019-11-15
CN110456641B true CN110456641B (zh) 2022-03-11

Family

ID=68483080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910664075.2A Active CN110456641B (zh) 2019-07-23 2019-07-23 一种固定时预定性能循环神经网络机械臂控制方法

Country Status (1)

Country Link
CN (1) CN110456641B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941183B (zh) * 2019-11-30 2021-09-21 华南理工大学 一种基于神经网络的工业机器人动力学辨识方法
CN113359434A (zh) * 2021-04-15 2021-09-07 山东师范大学 针对电动平衡车的有限时间跟踪控制方法及系统
CN114700960B (zh) * 2022-03-02 2023-09-08 西北工业大学 一种阶次优化的远程操控行为轮廓规划方法
CN116382066B (zh) * 2023-03-23 2024-05-10 哈尔滨工业大学 一种基于sigmoid型积分增强微分器的信号微分估计方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105958515A (zh) * 2016-06-15 2016-09-21 西安交通大学 电力系统混沌振荡的固定时动态面高阶滑模抑制方法
CN108549235A (zh) * 2018-05-14 2018-09-18 西北工业大学 一种电机驱动单连杆机械手的有限时神经网络控制方法
CN108845493A (zh) * 2018-08-21 2018-11-20 曲阜师范大学 带有输出约束的机械臂系统的固定时间跟踪控制方法
CN109062240A (zh) * 2018-09-28 2018-12-21 浙江工业大学 一种基于神经网络估计的刚性飞行器固定时间自适应姿态跟踪控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105958515A (zh) * 2016-06-15 2016-09-21 西安交通大学 电力系统混沌振荡的固定时动态面高阶滑模抑制方法
CN108549235A (zh) * 2018-05-14 2018-09-18 西北工业大学 一种电机驱动单连杆机械手的有限时神经网络控制方法
CN108845493A (zh) * 2018-08-21 2018-11-20 曲阜师范大学 带有输出约束的机械臂系统的固定时间跟踪控制方法
CN109062240A (zh) * 2018-09-28 2018-12-21 浙江工业大学 一种基于神经网络估计的刚性飞行器固定时间自适应姿态跟踪控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Fixed-time adaptive neural network control for nonstrict-feedback nonlinear systems with deadzone and output constraint;Junkang Ni 等;《ISA Transactions》;20190718;第97卷;第458-473页 *
Fixed-Time Leader-Following Consensus for Second-Order Multiagent Systems With Input Delay;Junkang Ni等;《IEEE TRANSACTIONSON CIRCUITS AND SYSTEMS》;20171130;第64卷(第11期);第8635-8643页 *

Also Published As

Publication number Publication date
CN110456641A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN110456641B (zh) 一种固定时预定性能循环神经网络机械臂控制方法
CN112817231B (zh) 一种具有强鲁棒性的机械臂高精度跟踪控制方法
CN107561935B (zh) 基于多层神经网络的电机位置伺服系统摩擦补偿控制方法
CN111618858B (zh) 一种基于自适应模糊滑模的机械手鲁棒跟踪控制算法
CN110673472B (zh) 基于神经网络补偿死区反演误差的自适应鲁棒控制方法
CN108549235B (zh) 一种电机驱动单连杆机械手的有限时神经网络控制方法
CN108155833B (zh) 考虑电气特性的电机伺服系统渐近稳定控制方法
CN110572093B (zh) 基于电机位置伺服系统期望轨迹和干扰补偿的arc控制方法
CN110750050A (zh) 一种基于神经网络的机械臂系统预设性能控制方法
CN106113040B (zh) 基于串并联估计模型的柔性机械臂系统模糊控制方法
CN113589689B (zh) 一种基于多参数自适应神经网络的滑模控制器设计方法
Ni et al. Adaptive dynamic surface neural network control for nonstrict-feedback uncertain nonlinear systems with constraints
CN112558468B (zh) 基于双观测器的发射平台自适应鲁棒输出反馈控制方法
Xu et al. Adaptive command filtered fixed-time control of nonlinear systems with input quantization
CN107577146A (zh) 基于摩擦整体逼近的伺服系统的神经网络自适应控制方法
CN115256386B (zh) 考虑跟踪误差约束的不确定机械臂神经自适应控制方法
CN112356034A (zh) 一种基于可变增益的超螺旋滑模控制方法
Hsu et al. Intelligent nonsingular terminal sliding-mode control via perturbed fuzzy neural network
CN110842911B (zh) 考虑关节电机特性的柔性机械臂联合建模和滑模控制方法
Zou Extended state observer‐based finite time control of electro‐hydraulic system via sliding mode technique
CN109194244B (zh) 一种面向电动伺服系统的控制方法及系统
CN109995278B (zh) 一种考虑输入受限的电机伺服系统自调节控制方法
Hu et al. Observer‐based optimal adaptive control for multimotor driving servo systems
CN116175588A (zh) 一种机器人自适应神经滑模控制方法、设备及介质
Ta et al. An innovative recurrent cerebellar model articulation controller for piezo-driven micro-motion stage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant