CN112433475A - 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法 - Google Patents

基于scn系统偏移量辨识的坐垫机器人限时学习控制方法 Download PDF

Info

Publication number
CN112433475A
CN112433475A CN202011363081.3A CN202011363081A CN112433475A CN 112433475 A CN112433475 A CN 112433475A CN 202011363081 A CN202011363081 A CN 202011363081A CN 112433475 A CN112433475 A CN 112433475A
Authority
CN
China
Prior art keywords
offset
learning
time
robot
cushion robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011363081.3A
Other languages
English (en)
Other versions
CN112433475B (zh
Inventor
孙平
单芮
王殿辉
王硕玉
李树江
窦文泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Technology
Original Assignee
Shenyang University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Technology filed Critical Shenyang University of Technology
Priority to CN202011363081.3A priority Critical patent/CN112433475B/zh
Publication of CN112433475A publication Critical patent/CN112433475A/zh
Application granted granted Critical
Publication of CN112433475B publication Critical patent/CN112433475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于随机配置网络(Stochastic Configuration Networks,SCN)系统偏移量辨识的坐垫机器人限时学习控制方法,其特征为:基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型;基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量;基于迭代学习理论,设计限时学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪;基于MSP340系列单片机将输出PWM信号提供给电机驱动模块。

Description

基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法
技术领域:
本发明涉及坐垫机器人的控制领域,尤其是限时学习控制领域。
背景技术:
由于高龄人口和下肢残疾者无法完成日常独立生活,给家庭照顾人员和社会带来沉重负担,坐垫机器人可以代替下肢残疾者的步行功能,帮助残疾者完成日常生活动作,因此受到研究者的广泛关注。残疾者操作各种生活动作过程中,会使系统发生偏移,严重影响坐垫机器人的跟踪运动,甚至产生较大的跟踪误差碰撞周围物体,威胁残疾者的安全。因此,解决坐垫机器人系统偏移问题对提高跟踪精度和安全性具有重要意义。
关于坐垫机器人跟踪控制已有许多研究成果,然而这些成果都忽略了机器人跟踪运动具有重复性的特点,导致跟踪精度不理想。事实上随着重复学习次数的增加,系统跟踪精度逐渐提高,最终会使跟踪误差趋向于零。另外,机器人迭代学习控制也取得了一些研究成果,然而这些成果在考虑重复学习跟踪时,都没有考虑每次学习时间的受限问题。如果机器人每次学习时间过长,将会产生较大的暂态跟踪误差,容易发生碰撞。因此,加快系统学习过程,快速实现跟踪误差系统的稳定性对保障残疾者的安全性尤其重要。本发明提出了系统偏移量的辨识方法及限时学习控制方法,到目前为止,还没有使用SCN(StochasticConfiguration Networks,SCN)方法对坐垫机器人系统偏移量进行辨识,并对其进行限时学习控制的研究。因此,研究如何抑制系统偏移量对坐垫机器人跟踪精度的影响,并快速实现跟踪误差系统的有限时间稳定性具有重大意义。
发明内容:
发明目的:
为了解决上述问题,本发明提供了一种基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法技术方案:
本发明是通过以下技术方案来实现的:
一种基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于:
1)基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型;
2)基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量;
3)基于迭代学习理论,设计限时学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。
步骤如下:
步骤1)基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型,其特征在于:系统的动力学模型描述如下
Figure BDA0002804568860000021
其中,
Figure BDA0002804568860000022
Figure BDA0002804568860000023
其中,M表示坐垫机器人质量,m表示使用者质量,M0表示系数矩阵,X(t)表示坐垫机器人在x、y和旋转角三个方向的运动轨迹,u(t)为坐垫机器人三个轮子的控制输入力,r0表示坐垫机器人的重心到中心的距离,I0表示坐垫机器人的转动惯量,
Figure BDA0002804568860000024
表示用户的转动惯量,θ表示水平轴和机器人中心与第一个轮子中心连线间的夹角,l表示坐垫机器人的重心到每个全向轮中心的距离。
当坐垫机器人学习到第k次时,将系统模型(2)写成如下形式
Figure BDA0002804568860000025
其中k∈Z+表示学习次数,t∈[0,T]表示学习时间。分离模型(2)中由使用者引起系统偏移量,和使用者质量信息,记M0=M1+ΔM0+ΔM1,模型(2)可以化为如下形式
Figure BDA0002804568860000026
其中,
Figure BDA0002804568860000027
且ξ1(t)、ξ2(t)均有界,
Figure BDA0002804568860000028
ΔM0表示M0分离出的由使用者引起系统偏移量,ΔM1表示M0分离出的使用者质量。
令x1,k(t)=Xk(t),
Figure BDA0002804568860000029
由方程(3)得到具有系统偏移量的坐垫机器人动力学模型:
Figure BDA0002804568860000031
步骤2)基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量,其特征在于:以坐垫机器人运动轨迹和速度
Figure BDA0002804568860000032
作为SCN的网络输入层,并通过权重ω和阈值b与隐含层连接,利用高斯函数得到隐含层输出G(xk(t))。
其中,
Figure BDA0002804568860000033
b=[b1,b2,…bQ]T
G(xk(t))=[g11xk(t)+b1),...,gQQxk(t)+bQ)]T
gjjxk(t)+bj)为隐含层第j个节点的输出j=(1,2,…,Q),ωd,j为输入层第d个输入连接隐含层第j个节点的权值,d=(1,2,…,6),bj为隐含层第j个节点的阈值。
然后,SCN隐含层通过权重
Figure BDA0002804568860000034
与输出层连接,得到系统偏移量的网络输出
Figure BDA0002804568860000035
如下:
Figure BDA0002804568860000036
其中,
Figure BDA0002804568860000037
Figure BDA0002804568860000038
为第j个隐含层节点连接第个g输出的权值g=(1,2,3)。
进一步,根据隐含层节点数为Q-1时得到的系统偏移量估计误差
Figure BDA0002804568860000039
随机配置第Q个隐含层节点参数δQ,使其满足δQ>0,δQ表达形式如下:
Figure BDA00028045688600000310
其中,参数0<r<1,{μQ}为非负实数序列,μQ≤(1-r),
Figure BDA00028045688600000311
εQ-1为隐含层节点数为Q-1时的估计误差。
由于
Figure BDA0002804568860000041
其中,
Figure BDA0002804568860000042
Figure BDA0002804568860000043
当δQ>0时,εQ TεQ<(r+μQQ-1 TεQ-1,随着随机配置的隐含层节点数不断增加,便可实现
Figure BDA0002804568860000044
系统偏移量估计
Figure BDA0002804568860000045
步骤3)基于迭代学习理论,设计限时迭代学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。其特征在于:根据坐垫器人在第k次学习的运动轨迹x1,k(t)和指定轨迹xd(t),得到第k次学习的轨迹跟踪误差和速度跟踪误差分别为
Figure BDA0002804568860000046
设计辅助变量zk(t)=e2,k(t)-η(e1,k(t)),η(e1,k(t))=-H1Sig(e1,k(t))α,0<α<1,其中
H1=diag(h11,h12,h13),h1n>0,n=1,2,3
令θ=e1,k(t),定义如下公式
Figure BDA0002804568860000047
令系统偏移量估计
Figure BDA0002804568860000048
的权值矩阵
Figure BDA0002804568860000049
的最优值为β*,且
Figure BDA00028045688600000410
于是可得权值误差
Figure BDA0002804568860000051
设计权值自适应率为
Figure BDA0002804568860000052
其中Θ和H2为自适应率参数,且Θ=diag(σ1112,…,σ1Q),H2=diag(h21,h22,…,h2Q),σ1j>0,h2j>0。
由式(4)和式(7)可得跟踪误差系统为:
Figure BDA0002804568860000053
设计第k次限时学习控制器为:
Figure BDA0002804568860000054
Figure BDA0002804568860000055
其中γ为学习增益,
Figure BDA0002804568860000056
为ξ2(t)在第k次学习时的估计值,且估计误差为
Figure BDA0002804568860000057
η(zk(t))=-H3Sig(zk(t))α,H3=diag(h31,h32,h33),hν>0,ν=1,2,3,
Figure BDA0002804568860000058
建立李雅普诺夫函数如下
Figure BDA0002804568860000059
沿误差系统(9)对式(12)求导,可得
Figure BDA00028045688600000510
其中ε=ξ1(t)-β*TG(xk(t)),取参数
Figure BDA00028045688600000511
并将自适应率(8)代入式(13),得
Figure BDA00028045688600000512
Figure BDA00028045688600000513
Figure BDA00028045688600000514
Figure BDA0002804568860000061
其中
Figure BDA0002804568860000062
h1min=min{h1g},h2min=min{h2g},h3min=min{h3g},
Figure BDA0002804568860000063
Figure BDA0002804568860000064
由式(14)可以得到
Figure BDA0002804568860000065
根据有限时间稳定理论可知,坐垫机器人在第k次学习时的跟踪误差系统有限时间稳定,且有限的调整时间
Figure BDA0002804568860000066
经过第k次学习后,误差系统在有限时间可实现稳定,接下来,进一步说明随着学习次数增加,限时学习控制器能够使跟踪误差逐渐趋向于零。
建立李雅普诺夫函数
Figure BDA0002804568860000067
由式(14)可知,
Figure BDA0002804568860000068
其中,
Figure BDA0002804568860000069
将控制器(10)、(11)和式(17)代入式(16),并令Vk(0)=0可得
Figure BDA00028045688600000610
由ΔLk(t)<0可知,Lk(t)是递减函数。
根据式(18)可知
Figure BDA00028045688600000611
由上式可知,若L0(t)有界,则Lk(t)有界。
对式(15)求导,并且令k=0,可得
Figure BDA0002804568860000071
将误差系统(9)和控制器(10)、(11)代入式(20),可得
Figure BDA0002804568860000072
由式(21)可知L0(t)在t∈[0,T]上连续且有界,进而由式(19)可知Lk(t)连续且有界。
由式(16)可知,式Lk(t)可以写成如下形式
Figure BDA0002804568860000073
将式(18)代入式(21)可得,
Figure BDA0002804568860000074
由上式可推出
Figure BDA0002804568860000075
由级数的收敛性必要条件可得
Figure BDA0002804568860000076
由上述可知,经过每次限时学习,并且随着学习次数增加,限时学习控制器能够使跟踪误差趋向于零,坐垫机器人实现了安全地轨迹跟踪。
步骤4)根据权利要求1基于MSP340系列单片机将输出PWM信号提供给电机驱动单元,使机器人抑制系统偏移量并实现对参考轨迹信号的跟踪,其特征在于:以MSP430系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号xd(t)和
Figure BDA0002804568860000077
计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按指定方式运动。
优点及效果:
本发明是一种基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,具有如下优点:本发明巧妙地分离出坐垫机器人动力学模型中的系统偏移量,提高了机器人的跟踪精度,避免碰撞周围障碍物,提出了限时迭代学习跟踪控制器,缩短了学习时间。
附图说明:
图1为本发明控制器工作框图;
图2为本发明MSP430单片机最小系统;
图3为本发明主控制器外围扩展电路;
图4为本发明硬件总体原理电路。
具体实施方式:
下面结合附图对本发明做进一步的说明,但本发明保护范围不受实施例的限制。
一种基于随机配置网络SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于:
1)基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型;
2)基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量;
3)基于迭代学习理论,设计限时学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。
步骤如下:
步骤1)基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型,其特征在于:系统的动力学模型描述如下
Figure BDA0002804568860000081
其中,
Figure BDA0002804568860000082
Figure BDA0002804568860000083
其中,M表示坐垫机器人质量,m表示使用者质量,M0表示系数矩阵,X(t)表示坐垫机器人在x、y和旋转角三个方向的运动轨迹,u(t)为坐垫机器人三个轮子的控制输入力,r0表示坐垫机器人的重心到中心的距离,I0表示坐垫机器人的转动惯量,
Figure BDA0002804568860000084
表示用户的转动惯量,θ表示水平轴和机器人中心与第一个轮子中心连线间的夹角,l表示坐垫机器人的重心到每个全向轮中心的距离。
当坐垫机器人重复学习运动到k次时,将系统模型(2)写成如下形式
Figure BDA0002804568860000091
其中k∈Z+表示学习次数,t∈[0,T]表示学习时间。分离模型(2)中由使用者引起系统偏移量,和使用者质量信息,记M0=M1+ΔM0+ΔM1,模型(2)可以化为如下形式
Figure BDA0002804568860000092
其中,
Figure BDA0002804568860000093
且ξ1(t)、ξ2(t)均有界,
Figure BDA0002804568860000094
ΔM0表示M0分离出的由使用者引起系统偏移量,ΔM1表示M0分离出的使用者质量。
令x1,k(t)=Xk(t),
Figure BDA0002804568860000095
由方程(3)得到具有系统偏移量的坐垫机器人动力学模型:
Figure BDA0002804568860000096
步骤2)基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量,其特征在于:以坐垫机器人运动轨迹和速度
Figure BDA0002804568860000097
作为SCN的网络输入层,并通过权重ω和阈值b与隐含层连接,利用高斯函数得到隐含层输出G(xk(t))。
其中,
Figure BDA0002804568860000098
b=[b1,b2,…bQ]T
G(xk(t))=[g11xk(t)+b1),...,gQQxk(t)+bQ)]T
gjjxk(t)+bj)为隐含层第j个节点的输出j=(1,2,…,L),ωd,j为输入层第d个输入连接隐含层第j个节点的权值,d=(1,2,…,6),bj为隐含层第j个节点的阈值。
然后,SCN隐含层通过权重
Figure BDA0002804568860000099
与输出层连接,得到系统偏移量的网络输出
Figure BDA00028045688600000910
如下:
Figure BDA0002804568860000101
其中,
Figure BDA0002804568860000102
Figure BDA0002804568860000103
为第j个隐含层节点连接第个g输出的权值g=(1,2,3)。
进一步,根据隐含层节点数为Q-1时得到的系统偏移量误差
Figure BDA0002804568860000104
随机配置第Q个隐含层节点参数,使其满足δQ>0,δQ表达形式如下:
Figure BDA0002804568860000105
其中,参数0<r<1,{μQ}为非负实数序列,μQ≤(1-r),
Figure BDA0002804568860000106
随着随机配置的隐含层节点数不断增加,直至
Figure BDA0002804568860000107
便可实现系统的偏移量辨识
Figure BDA0002804568860000108
步骤3)基于迭代学习理论,设计限时迭代学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。其特征在于:根据坐垫器人在第k次学习的运动轨迹x1,k(t)和指定轨迹xd(t),得到第k次学习的轨迹跟踪误差和速度跟踪误差分别为
Figure BDA0002804568860000109
设计辅助变量zk(t)=e2,k(t)-η(e1,k(t)),η(e1,k(t))=-H1Sig(e1,k(t))α,0<α<1,其中
H1=diag(h11,h12,h13),h1n>0,n=1,2,3
Figure BDA00028045688600001010
定义如下公式
Figure BDA00028045688600001011
令系统偏移量估计
Figure BDA00028045688600001012
的权值矩阵
Figure BDA00028045688600001013
的最优值为β*,且
Figure BDA00028045688600001014
于是可得权值误差
Figure BDA00028045688600001015
设计权值自适应率为
Figure BDA0002804568860000111
其中Θ和H2为自适应率参数,且Θ=diag(σ1112,…,σ1Q),H2=diag(h21,h22,…,h2Q),σ1j>0,h2j>0。
由式(4)和式(7)可得跟踪误差系统为:
Figure BDA0002804568860000112
设计第k次限时学习控制器为:
Figure BDA0002804568860000113
Figure BDA0002804568860000114
其中γ为学习增益,
Figure BDA0002804568860000115
为ξ2(t)在第k次学习时的估计值,且估计误差为
Figure BDA0002804568860000116
η(zk(t))=-H3Sig(zk(t))α,H3=diag(h31,h32,h33),hν>0,ν=1,2,3,
Figure BDA0002804568860000117
建立李雅普诺夫函数如下
Figure BDA0002804568860000118
沿误差系统(9)对式(12)求导,可得
Figure BDA0002804568860000119
其中ε=ξ1(t)-β*TG(xk(t)),取参数
Figure BDA00028045688600001110
并将自适应率(8)代入式(13),得
Figure BDA00028045688600001111
Figure BDA00028045688600001112
Figure BDA00028045688600001113
Figure BDA00028045688600001114
其中
Figure BDA0002804568860000121
h1min=min{h1g},h2min=min{h2g},h3min=min{h3g},
Figure BDA0002804568860000122
Figure BDA0002804568860000123
由式(14)可以得到
Figure BDA0002804568860000124
根据有限时间稳定理论可知,坐垫机器人在第k次学习时的跟踪误差系统有限时间稳定,且有限的调整时间
Figure BDA0002804568860000125
经过第k次学习后,误差系统在有限时间可实现稳定,接下来,进一步说明随着学习次数增加,限时学习控制器能够使跟踪误差逐渐趋向于零。
建立李雅普诺夫函数
Figure BDA0002804568860000126
由式(14)可知,
Figure BDA0002804568860000127
其中,
Figure BDA0002804568860000128
将控制器(10)、(11)和式(17)代入式(16),并令Vk(0)=0可得
Figure BDA0002804568860000129
由ΔLk(t)<0可知,Lk(t)是递减函数。
根据式(18)可知
Figure BDA00028045688600001210
由上式可知,若L0(t)有界,则Lk(t)有界。
对式(15)求导,并且令k=0,可得
Figure BDA00028045688600001211
将误差系统(9)和控制器(10)、(11)代入式(20),可得
Figure BDA0002804568860000131
由式(21)可知L0(t)在t∈[0,T]上连续且有界,进而由式(19)可知Lk(t)连续且有界。
由式(16)可知,式Lk(t)可以写成如下形式
Figure BDA0002804568860000132
将式(18)代入式(21)可得,
Figure BDA0002804568860000133
由上式可推出
Figure BDA0002804568860000134
由级数的收敛性必要条件可得
Figure BDA0002804568860000135
由上述可知,经过每次限时学习,并且随着学习次数增加,限时学习控制器能够使跟踪误差趋向于零,坐垫机器人实现了安全地轨迹跟踪。
步骤4)根据权利要求1基于MSP340系列单片机将输出PWM信号提供给电机驱动单元,使机器人抑制系统偏移量并实现对参考轨迹信号的跟踪,其特征在于:以MSP430系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号xd(t)和
Figure BDA0002804568860000136
计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按指定方式运动。
本发明巧妙地将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型,基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量,基于迭代学习理论,设计限时迭代学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪,可快速提高坐垫机器人的跟踪精度和安全性。

Claims (5)

1.基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于:基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型;基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量;基于迭代学习理论,设计限时学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。步骤如下:
1)基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型;
2)基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量;
3)基于迭代学习理论,设计限时学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。
2.根据权利要求1所述基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于基于坐垫机器人的动力学模型,将使用者引起系统的偏移量从模型中分离,建立具有系统偏移量的坐垫机器人动力学模型,系统的动力学模型描述如下
Figure FDA0002804568850000011
其中,
Figure FDA0002804568850000012
Figure FDA0002804568850000013
其中,M表示坐垫机器人质量,m表示使用者质量,M0表示系数矩阵,X(t)表示坐垫机器人在x、y和旋转角三个方向的运动轨迹,u(t)为坐垫机器人三个轮子的控制输入力,r0表示坐垫机器人的重心到中心的距离I0表示坐垫机器人的转动惯量,
Figure FDA0002804568850000014
表示使用者的转动惯量,θ表示水平轴和机器人中心与第一个轮子中心连线间的夹角,l表示坐垫机器人的重心到每个全向轮中心的距离。
当坐垫机器人学习到第k次时,系统模型(2)写成如下形式
Figure FDA0002804568850000015
其中k∈Z+表示学习次数,t∈[0,T]表示学习时间。分离模型(2)中由使用者引起系统的偏移量和使用者质量信息,记M0=M1+ΔM0+ΔM1,模型(2)可以化为如下形式
Figure FDA0002804568850000021
其中,
Figure FDA0002804568850000022
且ξ1(t)、ξ2(t)均有界,
Figure FDA0002804568850000023
令x1,k(t)=Xk(t),
Figure FDA0002804568850000024
由方程(3)得到具有系统偏移量的坐垫机器人动力学模型:
Figure FDA0002804568850000025
3.根据权利要求1所述基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于基于SCN方法构建系统偏移量的网络辨识模型,以运动轨迹和速度为网络输入,通过不断随机配置隐含层节点参数,获得坐垫机器人系统的偏移量,以坐垫机器人运动轨迹和速度
Figure FDA0002804568850000026
作为SCN的网络输入层,并通过权重ω和阈值b与隐含层连接,利用高斯函数得到隐含层输出G(xk(t))。
其中,
Figure FDA0002804568850000027
b=[b1,b2,…bQ]T
G(xk(t))=[g11xk(t)+b1),...,gQQxk(t)+bQ)]T
gjjxk(t)+bj)为隐含层第j个节点的输出j=(1,2,…,Q),ωd,j为输入层第d个输入连接隐含层第j
个节点的权值,d=(1,2,…,6),bj为隐含层第j个节点的阈值。
然后,SCN隐含层通过权重
Figure FDA0002804568850000028
与输出层连接,得到系统偏移量的网络输出
Figure FDA0002804568850000029
如下:
Figure FDA00028045688500000210
其中,
Figure FDA00028045688500000211
Figure FDA0002804568850000031
为第j个隐含层节点连接第个g输出的权值g=(1,2,3)。
进一步,根据隐含层节点数为Q-1时得到的系统偏移量误差
Figure FDA0002804568850000032
随机配置第Q个隐含层节点参数,使其满足δQ>0,δQ表达形式如下:
Figure FDA0002804568850000033
其中,参数0<r<1,{μQ}为非负实数序列,μQ≤(1-r),
Figure FDA0002804568850000034
随着随机配置的隐含层节点数不断增加,直至
Figure FDA0002804568850000035
便可实现系统的偏移量辨识
Figure FDA0002804568850000036
4.根据权利要求1所述基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于基于迭代学习理论,设计限时迭代学习跟踪控制器,抑制系统偏移量对坐垫机器人跟踪精度的影响,同时在有限学习时间内实现稳定的轨迹跟踪。根据坐垫器人在第k次学习的运动轨迹x1,k(t)和指定轨迹xd(t),得到第k次学习的轨迹跟踪误差和速度跟踪误差分别为
Figure FDA0002804568850000037
设计辅助变量zk(t)=e2,k(t)-η(e1,k(t)),η(e1,k(t))=-H1Sig(e1,k(t))α,0<α<1,其中
H1=diag(h11,h12,h13),h1n>0,n=1,2,3
Figure FDA0002804568850000038
定义如下公式
Figure FDA0002804568850000039
令系统偏移量估计
Figure FDA00028045688500000310
的权值矩阵
Figure FDA00028045688500000311
的最优值为β*,且
Figure FDA00028045688500000312
于是可得权值误差
Figure FDA00028045688500000313
设计权值自适应率为
Figure FDA00028045688500000314
其中Θ和H2为自适应率参数,且Θ=diag(σ1112,…,σ1Q),H2=diag(h21,h22,…,h2Q),
σ1j>0,h2j>0。
由式(4)和式(7)可得跟踪误差系统为:
Figure FDA0002804568850000041
设计第k次限时学习控制器为:
Figure FDA0002804568850000042
Figure FDA0002804568850000043
其中γ为学习增益,
Figure FDA0002804568850000044
为ξ2(t)在第k次学习时的估计值,且估计误差为
Figure FDA0002804568850000045
η(zk(t))=-H3Sig(zk(t))α,H3=diag(h31,h32,h33),hν>0,ν=1,2,3,
Figure FDA0002804568850000046
建立李雅普诺夫函数如下
Figure FDA0002804568850000047
沿误差系统(9)对式(12)求导,可得
Figure FDA0002804568850000048
其中ε=ξ1(t)-β*TG(xk(t)),取参数
Figure FDA0002804568850000049
并将自适应率(8)代入式(13),得
Figure FDA00028045688500000410
Figure FDA00028045688500000411
Figure FDA00028045688500000412
Figure FDA00028045688500000413
其中
Figure FDA00028045688500000414
h1min=min{h1g},h2min=min{h2g},h3min=min{h3g},
Figure FDA00028045688500000415
Figure FDA00028045688500000416
由式(14)可以得到
Figure FDA00028045688500000417
根据有限时间稳定理论可知,坐垫机器人在第k次学习时的跟踪误差系统有限时间稳定,且有限的调整时间
Figure FDA0002804568850000051
经过第k次学习后,误差系统在有限时间可实现稳定,接下来,进一步说明随着学习次数增加,限时学习控制器能够使跟踪误差逐渐趋向于零。
建立李雅普诺夫函数
Figure FDA0002804568850000052
由式(14)可知,
Figure FDA0002804568850000053
其中,
Figure FDA0002804568850000054
将控制器(10)、(11)和式(17)代入式(16),并令Vk(0)=0可得
Figure FDA0002804568850000055
由ΔLk(t)<0可知,Lk(t)是递减函数。
根据式(18)可知
Figure FDA0002804568850000056
对式(15)求导,并且令k=0,可得
Figure FDA0002804568850000057
将误差系统(9)和控制器(10)、(11)代入式(20),可得
Figure FDA0002804568850000058
由式(21)可知L0(t)在t∈[0,T]上连续且有界,进而由式(19)可知Lk(t)连续且有界。
由式(16)可知,式Lk(t)可以写成如下形式
Figure FDA0002804568850000061
将式(18)代入式(21)可得,
Figure FDA0002804568850000062
由上式可推出
Figure FDA0002804568850000063
由级数的收敛性必要条件可得
Figure FDA0002804568850000064
由上述可知,经过每次限时学习,并且随着学习次数增加,限时学习控制器能够使跟踪误差趋向于零,坐垫机器人实现了安全地轨迹跟踪。
5.根据权利要求1所述基于SCN系统偏移量辨识的坐垫机器人限时学习控制方法,其特征在于基于MSP340系列单片机将输出PWM信号提供给电机驱动单元,使机器人抑制系统偏移量并实现对参考轨迹信号的跟踪,以MSP430系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号xd(t)和
Figure FDA0002804568850000065
计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按指定方式运动。
CN202011363081.3A 2020-11-27 2020-11-27 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法 Active CN112433475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011363081.3A CN112433475B (zh) 2020-11-27 2020-11-27 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011363081.3A CN112433475B (zh) 2020-11-27 2020-11-27 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法

Publications (2)

Publication Number Publication Date
CN112433475A true CN112433475A (zh) 2021-03-02
CN112433475B CN112433475B (zh) 2022-05-13

Family

ID=74697942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011363081.3A Active CN112433475B (zh) 2020-11-27 2020-11-27 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法

Country Status (1)

Country Link
CN (1) CN112433475B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377115A (zh) * 2021-07-05 2021-09-10 沈阳工业大学 服务机器人具有自主学习暂态运动时间的稳定控制方法
CN113419423A (zh) * 2021-07-05 2021-09-21 沈阳工业大学 一种服务机器人有限时间适应结构变化的跟踪控制方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103431976A (zh) * 2013-07-19 2013-12-11 燕山大学 基于肌电信号反馈的下肢康复机器人系统及其控制方法
CN104635738A (zh) * 2014-11-21 2015-05-20 沈阳工业大学 不确定康复步行训练机器人的精确轨迹跟踪最优控制方法
CN105320138A (zh) * 2015-11-28 2016-02-10 沈阳工业大学 康复训练机器人运动速度和运动轨迹同时跟踪的控制方法
CN105867130A (zh) * 2016-04-15 2016-08-17 沈阳工业大学 康复步行训练机器人的轨迹跟踪误差约束安全控制方法
CN107479381A (zh) * 2017-08-29 2017-12-15 沈阳工业大学 冗余康复步行训练机器人各轴跟踪误差最优预测控制方法
CN107703762A (zh) * 2017-11-14 2018-02-16 沈阳工业大学 康复步行训练机器人的人机互作用力辨识及控制方法
CN107831667A (zh) * 2017-11-14 2018-03-23 沈阳工业大学 康复步行训练机器人的补偿人机互作用力的跟踪控制方法
CN110412866A (zh) * 2019-05-14 2019-11-05 上海大学 基于自适应迭代学习的外骨骼单腿协同控制方法
CN110989589A (zh) * 2019-11-30 2020-04-10 沈阳工业大学 一种不同训练者质量随机变化的康复步行机器人的跟踪控制方法
CN111515938A (zh) * 2020-05-28 2020-08-11 河北工业大学 一种继承型迭代学习控制的下肢外骨骼行走轨迹跟踪方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103431976A (zh) * 2013-07-19 2013-12-11 燕山大学 基于肌电信号反馈的下肢康复机器人系统及其控制方法
CN104635738A (zh) * 2014-11-21 2015-05-20 沈阳工业大学 不确定康复步行训练机器人的精确轨迹跟踪最优控制方法
CN105320138A (zh) * 2015-11-28 2016-02-10 沈阳工业大学 康复训练机器人运动速度和运动轨迹同时跟踪的控制方法
CN105867130A (zh) * 2016-04-15 2016-08-17 沈阳工业大学 康复步行训练机器人的轨迹跟踪误差约束安全控制方法
CN107479381A (zh) * 2017-08-29 2017-12-15 沈阳工业大学 冗余康复步行训练机器人各轴跟踪误差最优预测控制方法
CN107703762A (zh) * 2017-11-14 2018-02-16 沈阳工业大学 康复步行训练机器人的人机互作用力辨识及控制方法
CN107831667A (zh) * 2017-11-14 2018-03-23 沈阳工业大学 康复步行训练机器人的补偿人机互作用力的跟踪控制方法
CN110412866A (zh) * 2019-05-14 2019-11-05 上海大学 基于自适应迭代学习的外骨骼单腿协同控制方法
CN110989589A (zh) * 2019-11-30 2020-04-10 沈阳工业大学 一种不同训练者质量随机变化的康复步行机器人的跟踪控制方法
CN111515938A (zh) * 2020-05-28 2020-08-11 河北工业大学 一种继承型迭代学习控制的下肢外骨骼行走轨迹跟踪方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PING SUN等: "Tracking Control for a Cushion Robot Based on Fuzzy Path Planning With Safe Angular Velocity", 《IEEE/CAA JOURNAL OF AUTOMATICA SINICA》 *
单芮: "全方向康复步行训练机器人的迭代学习控制研究", 《中国优秀博硕士学位论文全文数据库(硕士)·信息科技辑》 *
陈贵亮等: "下肢外骨骼康复机器人的动力学建模及神经网络辨识仿真", 《机械设计与制造》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377115A (zh) * 2021-07-05 2021-09-10 沈阳工业大学 服务机器人具有自主学习暂态运动时间的稳定控制方法
CN113419423A (zh) * 2021-07-05 2021-09-21 沈阳工业大学 一种服务机器人有限时间适应结构变化的跟踪控制方法
CN113377115B (zh) * 2021-07-05 2023-10-20 沈阳工业大学 服务机器人具有自主学习暂态运动时间的稳定控制方法
CN113419423B (zh) * 2021-07-05 2023-10-24 沈阳工业大学 一种服务机器人有限时间适应结构变化的跟踪控制方法

Also Published As

Publication number Publication date
CN112433475B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
Lin et al. Adaptive robust self-balancing and steering of a two-wheeled human transportation vehicle
CN112433475B (zh) 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法
CN111173678B (zh) 一种rbf神经网络俯仰干扰补偿的风力机舱悬浮控制方法
CN112433495B (zh) 基于scn人机不确定模型的康复机器人快速有限时间控制
US11975751B2 (en) Iterative learning control method for multi-particle vehicle platoon driving system
CN108984815B (zh) 基于工况的车载飞轮电池径向悬浮支承系统的控制方法
CN112506054B (zh) 基于scn观测主动推力的康复机器人随机有限时间稳定控制
CN106406340A (zh) 四旋翼无人飞行器及其控制方法
CN103926875A (zh) 一种滚珠丝杠进给系统摩擦补偿方法
Yoo et al. Adaptive formation tracking control of electrically driven multiple mobile robots
CN110758413B (zh) 一种基于系统参数辨识的列车速度自适应控制方法
Zhao et al. Closed-loop spiking control on a neuromorphic processor implemented on the iCub
Peng et al. ADRC trajectory tracking control based on PSO algorithm for a quad-rotor
CN107703762B (zh) 康复步行训练机器人的人机互作用力辨识及控制方法
CN112068594A (zh) 一种基于jaya算法优化的小型无人直升机航向控制方法
CN116135485A (zh) 一种二自由度机械臂的预设性能轨迹跟踪控制器设计方法
CN114676877A (zh) 基于动态滑动窗口辨识的机动目标轨迹在线预测方法
Liu et al. FPGA implementation of family service robot based on neural network PID motion control system
CN110568845A (zh) 一种协同机器人的相互碰撞规避方法
Omatu et al. PID control of speed and torque of electric vehicle
CN110991606A (zh) 基于径向基神经网络的压电陶瓷驱动器复合控制方法
CN112433474B (zh) 基于scn内干扰力估计的坐垫机器人安全触发控制方法
CN113885549B (zh) 基于维度裁剪的ppo算法的四旋翼姿态轨迹控制方法
CN112571424B (zh) 基于scn步行力估计的康复机器人各轴速度直接约束控制
CN115268629A (zh) 基于人类技能学习及模仿的人-机器人协同控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant