CN113377115A - 服务机器人具有自主学习暂态运动时间的稳定控制方法 - Google Patents

服务机器人具有自主学习暂态运动时间的稳定控制方法 Download PDF

Info

Publication number
CN113377115A
CN113377115A CN202110757231.7A CN202110757231A CN113377115A CN 113377115 A CN113377115 A CN 113377115A CN 202110757231 A CN202110757231 A CN 202110757231A CN 113377115 A CN113377115 A CN 113377115A
Authority
CN
China
Prior art keywords
robot
state
time
cushion
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110757231.7A
Other languages
English (en)
Other versions
CN113377115B (zh
Inventor
孙平
郭永吉
李树江
王硕玉
常洪彬
唐非
谢静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Technology
Original Assignee
Shenyang University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Technology filed Critical Shenyang University of Technology
Priority to CN202110757231.7A priority Critical patent/CN113377115B/zh
Publication of CN113377115A publication Critical patent/CN113377115A/zh
Application granted granted Critical
Publication of CN113377115B publication Critical patent/CN113377115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0214Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种服务机器人具有自主学习暂态运动时间的稳定控制方法。其特征为:利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统;提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;进一步,提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度;基于STM32G4系列单片机将输出PWM信号提供给电机驱动模块,使机器人可帮助使用者跟踪指定的运动轨迹。

Description

服务机器人具有自主学习暂态运动时间的稳定控制方法
技术领域:
本发明涉及坐垫服务机器人的控制领域,尤其是关于具有自主学习暂态运动时间的稳定控制方法。
背景技术:
交通事故及人口老龄化使步行障碍患者逐年增加,随着坐垫机器人在家庭、养老院等场所的应用,有效解决了护理人员短缺的问题。然而,在实际应用中,较长时间的暂态运动过程,机器人不断调整运动位姿,不仅影响跟踪精度,而且产生的过大轨迹误差会使机器人发生碰撞危险。因此,研究坐垫服务机器人指定暂态时间的稳定控制方法以及指定暂态运动时间的自主学习方法,对提高坐垫机器人的跟踪性和安全性具有重要意义。
近些年,坐垫机器人跟踪控制已有很多研究成果,然而都没有考虑指定暂态时间的稳定控制以及指定暂态时间的自主学习问题。实际上,如果暂态时间指定的不准确,将无法使暂态运动的跟踪性能达到最优,影响机器人的跟踪精度和安全性。到目前为止,还没有关于坐垫机器人具有自主学习暂态运动时间的稳定控制方法,本发明提出的指定暂态时间自主学习的稳定控制方法,对提高人机系统性能具有重要意义。
发明内容:
发明目的:
为了解决上述问题,提出了一种坐垫服务机器人具有自主学习暂态运动时间的稳定控制方法,目的是提高机器人的跟踪精度,保障使用者的安全。
技术方案:
本发明是通过以下技术方案来实现的:
一种坐垫服务机器人具有自主学习暂态运动时间的稳定控制方法,其特征在于:
1)利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统;
2)提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;
3)提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度。
步骤如下:
步骤1)利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统,其特征在于:系统的运动学方程描述如下
Figure BDA0003147585710000021
其中d表示机器人的质心与几何中心的距离;θ表示机器人运动速度与X轴之间的夹角;p=(x y θ)T表示实际位姿,q=(v ω)T表示实际速度。
设pr=(xr yr θr)T表示参考位姿,qr=(v ω)T表示参考速度,pe=(xe ye θe)T表示位姿误差。
根据坐标变换,坐垫机器人位姿误差方程为:
Figure BDA0003147585710000022
对方程(2)求导,并把(1)代入,得到坐垫机器人轨迹跟踪误差系统:
Figure BDA0003147585710000023
Figure BDA0003147585710000024
Figure BDA0003147585710000025
步骤2)提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪,其特征在于:根据轨迹跟踪误差系统,设计速度和角速度控制器分别为
Figure BDA0003147585710000026
Figure BDA0003147585710000027
其中速度控制器中的变量
Figure BDA0003147585710000028
χ1=vr cosθe-dωr sinθe
Figure BDA0003147585710000029
且α2≥1,α3≥1为控制器调节参数。tf表示指定暂态运动时间;t0表示初始时刻。
将角速度控制器代入式(5)可得:
Figure BDA0003147585710000031
设计Lyapunov函数:
V1e)=θe 2 (9)
则有
Figure BDA0003147585710000032
对式(9)求导得:
Figure BDA0003147585710000033
Figure BDA0003147585710000034
Figure BDA0003147585710000035
对式(12)积分,得:
Figure BDA0003147585710000036
其中α1≥1,常数
Figure BDA0003147585710000037
由式(13)可知,当t=tf时,
Figure BDA00031475857100000311
Figure BDA0003147585710000038
可得,
Figure BDA00031475857100000312
由此可得,V2=0,因此在指定暂态时间tf,角度跟踪误差θe达到零。
接下来,将xe视为式(4)的输入,设计xe使ye在指定暂态时间稳定。令
Figure BDA0003147585710000039
设计Lyapunov函数:
V2(ye)=ye 2 (15)
则有
Figure BDA00031475857100000310
将式(14)代入式(4)得:
Figure BDA0003147585710000041
对式(15)求导得:
Figure BDA0003147585710000042
Figure BDA0003147585710000043
Figure BDA0003147585710000044
对式(19)积分,得:
Figure BDA0003147585710000045
其中
Figure BDA0003147585710000046
由式(20)可知,当t=tf时,η≤0,由
Figure BDA0003147585710000047
可得,η=0。由此可得,V2=0,因此在指定暂态时间tf,y轴跟踪误差ye达到零。
进一步,令v=v1-v2,其中v1=yeω+vr cosθe-dωr sinθe,代入式(3)得:
Figure BDA0003147585710000048
设变量
Figure BDA0003147585710000049
代入式(3)-(4)得到误差系统如下:
Figure BDA00031475857100000410
Figure BDA00031475857100000411
Figure BDA00031475857100000412
由式(6)和v1得:
Figure BDA00031475857100000413
设计Lyapunov函数:
V3(xe,ye)=V2(ye)+z2 (26)
由式(26)得:
Figure BDA0003147585710000051
对式(26)求导得:
Figure BDA0003147585710000052
并将式(25)代入
Figure BDA0003147585710000053
得:
Figure BDA0003147585710000054
取β=α23
Figure BDA0003147585710000055
得:
Figure BDA0003147585710000056
对式(29)积分,得:
ζ≤ln(C3(tf-t)β+1) (30)
其中
Figure BDA0003147585710000057
由式(30)可知,当t=tf时,ζ≤0,由式
Figure BDA0003147585710000058
知,ζ=0。由此可得,V3=0,因此在指定暂态时间tf,x轴跟踪误差xe达到零。
进一步,当t≥tf时,由式(7)、式(5)可知,ω=ωr
Figure BDA0003147585710000059
再由式(14)可知,xe=0,进而
Figure BDA00031475857100000510
再通过式(4)可知,
Figure BDA00031475857100000511
即t≥tf时,控制器(6)(7)使跟踪误差系统趋于渐近稳定。
因此,由上述可知,坐垫机器人在运动过程中可实现稳定跟踪控制。
步骤3)提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度,其特征在于:描述坐垫机器人暂态运动时间的学习状态state1,state2,state3,state4如下:
state1:|v|>vmax and|ω|>ωmax,t0≤t<tf
state2:|v|>vmax and|ω|≤ωmax,t0≤t<tf
state3:|v|≤vmax and|ω|>ωmax,t0≤t<tf
state4:|v|≤vmax and|ω|≤ωmax,t0≤t<tf
其中,vmax表示坐垫机器人允许的最大安全速度,ωmax表示坐垫机器人允许的最大安全角速度
暂态运动时间的学习动作a1,a2描述如下:
a1:tf=t0+Δt
a2:tf=t0-Δt
其中,t0表示初始值,Δt为每次自主学习暂态运动时间的调整变化量。
设计坐垫机器人自主学习暂态运动时间的奖赏值函数R为:
Figure BDA0003147585710000061
坐垫机器人自主学习暂态运动时间的步骤如下:
1)对坐垫机器人(S,A)进行初始化,其中S为坐垫机器人当前学习状态,A为机器人当前采取的动作;设置机器人更新状态学习速率α,衰减系数γ,学习动作的选择概率ε,其中α∈[0,1],γ∈[0,1],ε∈[0,1];
2)获取坐垫机器人运动位姿误差,并判断机器人在state1,state2,state3,state4中所处的状态,将其记为S,坐垫机器人以概率ε选取a1,a2中的任意一个动作,并记为A,确定当前时刻的状态行为对(S,A);进一步,根据R获得奖惩值,使坐垫机器人进入下一个状态,记为S',再利用概率ε选择新的动作A',获得新的行为对(S',A'),利用(S',A')并根据当前时刻R的奖惩值对(S,A)的价值进行更新,更新过程为:
Q(S,A)←Q(S,A)+α[R+γQ(S',A')-Q(S,A)] (31)
其中,Q(S,A)为当前状态行为对(S,A)获得的价值;Q(S',A')为下一时刻状态行为对(S',A')的价值;这样根据式(31)的价值,可以完成一次暂态运动时间的自主学习;
3)将(S',A')作为当前新的学习状态和学习动作,重复步骤2),机器人不断进行暂态运动时间自主学习,直到完成学习次数,使指定暂态运动时间达到最优。
步骤4)基于STM32G4系列单片机将输出PWM信号提供给电机驱动模块,使机器人可帮助使用者跟踪指定的运动轨迹,其特征在于:以STM32G4系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号pr和p,计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按指定方式运动。
优点及效果:
本发明是一种坐垫服务机器人具有自主学习暂态运动时间的稳定控制方法,具有如下优点:
本发明利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立了坐垫机器人的轨迹跟踪误差系统;提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;并提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了人机系统的跟踪精度和安全性。本发明优化机器人的暂态运动时间,提高系统的暂态运动性能和跟踪精度。
附图说明:
图1为本发明控制器工作框图;
图2为本发明系统坐标图;
图3为本发明STM32G4单片机最小系统;
图4为本发明电源电路;
图5为本发明电机驱动与测速模块电路;
图6为本发明硬件总体原理电路。
具体实施方式:
下面结合附图对本发明做进一步的说明,但本发明保护范围不受实施例的限制。
本发明利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统;提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;进一步,提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度;
一种坐垫服务机器人具有自主学习暂态运动时间的稳定控制方法,其特征在于:
1)利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统;
2)提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;
3)提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度。
步骤如下:
步骤1)利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统,其特征在于:系统的运动学方程描述如下
Figure BDA0003147585710000081
其中d表示机器人的质心与几何中心的距离;θ表示机器人运动速度与X轴之间的夹角;p=(x y θ)T表示实际位姿,q=(v ω)T表示实际速度。
设pr=(xr yr θr)T表示参考位姿,qr=(v ω)T表示参考速度,pe=(xe ye θe)T表示位姿误差。
根据坐标变换,坐垫机器人位姿误差方程为:
Figure BDA0003147585710000082
对方程(2)求导,并把(1)代入,得到坐垫机器人轨迹跟踪误差系统:
Figure BDA0003147585710000083
Figure BDA0003147585710000084
Figure BDA0003147585710000085
步骤2)提出了一种指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪,其特征在于:根据轨迹跟踪误差系统,设计速度和角速度控制器分别为
Figure BDA0003147585710000086
Figure BDA0003147585710000087
其中速度控制器中的变量
Figure BDA0003147585710000088
χ1=vr cosθe-dωr sinθe
Figure BDA0003147585710000091
且α2≥1,α3≥1为控制器调节参数。tf表示指定暂态运动时间;t0表示初始时刻。
将角速度控制器代入式(5)可得:
Figure BDA0003147585710000092
设计Lyapunov函数:
V1e)=θe 2 (9)
则有
Figure BDA0003147585710000093
对式(9)求导得:
Figure BDA0003147585710000094
Figure BDA0003147585710000095
Figure BDA0003147585710000096
对式(12)积分,得:
Figure BDA0003147585710000097
其中α1≥1,常数
Figure BDA0003147585710000098
由式(13)可知,当t=tf时,
Figure BDA00031475857100000911
Figure BDA0003147585710000099
可得,
Figure BDA00031475857100000912
由此可得,V2=0,因此在指定暂态时间tf,角度跟踪误差θe达到零。
接下来,将xe视为式(4)的输入,设计xe使ye在指定暂态时间稳定。令
Figure BDA00031475857100000910
设计Lyapunov函数:
V2(ye)=ye 2 (15)
则有
Figure BDA0003147585710000101
将式(14)代入式(4)得:
Figure BDA0003147585710000102
对式(15)求导得:
Figure BDA0003147585710000103
Figure BDA0003147585710000104
Figure BDA0003147585710000105
对式(19)积分,得:
Figure BDA0003147585710000106
其中
Figure BDA0003147585710000107
由式(20)可知,当t=tf时,η≤0,由
Figure BDA0003147585710000108
可得,η=0。由此可得,V2=0,因此在指定暂态时间tf,y轴跟踪误差ye达到零。
进一步,令v=v1-v2,其中v1=yeω+vr cosθe-dωr sinθe,代入式(3)得:
Figure BDA0003147585710000109
设变量
Figure BDA00031475857100001010
代入式(3)-(4)得到误差系统如下:
Figure BDA00031475857100001011
Figure BDA00031475857100001012
Figure BDA00031475857100001013
由式(6)和v1得:
Figure BDA0003147585710000111
设计Lyapunov函数:
Figure BDA0003147585710000112
由式(26)得:
Figure BDA00031475857100001115
V3≥z2,
Figure BDA0003147585710000114
对式(26)求导得:
Figure BDA0003147585710000115
并将式(25)代入
Figure BDA0003147585710000116
得:
Figure BDA0003147585710000117
取β=α23
Figure BDA0003147585710000118
得:
Figure BDA0003147585710000119
对式(29)积分,得:
ζ≤ln(C3(tf-t)β+1) (30)
其中
Figure BDA00031475857100001110
由式(30)可知,当t=tf时,ζ≤0,由式
Figure BDA00031475857100001111
知,ζ=0。由此可得,V3=0,因此在指定暂态时间tf,x轴跟踪误差xe达到零。
进一步,当t≥tf时,由式(7)、式(5)可知,ω=ωr
Figure BDA00031475857100001112
再由式(14)可知,xe=0,进而
Figure BDA00031475857100001113
再通过式(4)可知,
Figure BDA00031475857100001114
即t≥tf时,控制器(6)(7)使跟踪误差系统趋于渐近稳定。
因此,由上述可知,坐垫机器人在运动过程中可实现稳定跟踪控制。
步骤3)提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了系统的暂态运动性能和跟踪精度,其特征在于:描述坐垫机器人暂态运动时间的学习状态state1,state2,state3,state4如下:
state1:|v|>vmax and|ω|>ωmax,t0≤t<tf
state2:|v|>vmax and|ω|≤ωmax,t0≤t<tf
state3:|v|≤vmax and|ω|>ωmax,t0≤t<tf
state4:|v|≤vmax and|ω|≤ωmax,t0≤t<tf
其中,vmax表示坐垫机器人允许的最大安全速度,ωmax表示坐垫机器人允许的最大安全角速度。
暂态运动时间的学习动作a1,a2描述如下:
a1:tf=t0+Δt
a2:tf=t0-Δt
其中,t0表示初始值,Δt为每次自主学习暂态运动时间的调整变化量。
设计坐垫机器人自主学习暂态运动时间的奖赏值函数R为:
Figure BDA0003147585710000121
坐垫机器人自主学习暂态运动时间的步骤如下:
1)对坐垫机器人(S,A)进行初始化,其中S为坐垫机器人当前学习状态,A为机器人当前采取的动作;设置机器人更新状态学习速率α,衰减系数γ,学习动作的选择概率ε,其中α∈[0,1],γ∈[0,1],ε∈[0,1];
2)获取坐垫机器人运动位姿误差,并判断机器人在state1,state2,state3,state4中所处的状态,将其记为S,坐垫机器人以概率ε选取a1,a2中的任意一个动作,并记为A,确定当前时刻的状态行为对(S,A);进一步,根据R获得奖惩值,使坐垫机器人进入下一个状态,记为S',再利用概率ε选择新的动作A',获得新的行为对(S',A'),利用(S',A')并根据当前时刻R的奖惩值对(S,A)的价值进行更新,更新过程为:
Q(S,A)←Q(S,A)+α[R+γQ(S',A')-Q(S,A)] (31)
其中,Q(S,A)为当前状态行为对(S,A)获得的价值;Q(S',A')为下一时刻状态行为对(S',A')的价值;这样根据式(31)的价值,可以完成一次暂态运动时间的自主学习;
3)将(S',A')作为当前新的学习状态和学习动作,重复步骤2),机器人不断进行暂态运动时间自主学习,直到完成学习次数,使指定暂态运动时间达到最优。
步骤4)基于STM32F411系列单片机将输出PWM信号提供给电机驱动模块,使机器人可帮助使用者跟踪指定的运动轨迹,其特征在于:以STM32F411系列单片机为主控制器,主控制器的输入接电机测速模块、输出接电机驱动模块;电机驱动模块与直流电机相连;电源系统给各个电气设备供电。主控制器控制方法为读取电机编码器的反馈信号与主控制器给定的控制命令信号pr和p,计算得出误差信号。根据误差信号,主控制器按照预定的控制算法计算出电机的控制量,送给电机驱动模块,电机转动带动轮子维持自身平衡及按指定方式运动。
本发明解决了坐垫服务机器人具有自主学习暂态运动时间的稳定控制问题。基于建立的坐垫机器人轨迹跟踪误差系统,提出了指定暂态运动时间的稳定控制方法,使运动位姿和运动速度在指定时间同时实现稳定跟踪;同时,提出了暂态运动时间的自主学习方法,有效优化了机器人的暂态运动时间,提高了人机系统的跟踪精度和安全性。
本发明通过新技术优化了暂态运动时间,使机器人在指定时间稳定跟踪运动轨迹,提高了坐垫机器人系统的跟踪精度,避免较长时间的暂态运动产生过大跟踪误差而发生碰撞危险,保障了使用者的安全。

Claims (3)

1.服务机器人具有自主学习暂态运动时间的稳定控制方法,其特征在于包括以下步骤:
1)利用坐垫机器人的运动学方程并加入质心偏移干扰量,通过坐标变换得到位姿误差方程,建立坐垫机器人的轨迹跟踪误差系统;
2)指定暂态运动时间,使运动位姿和运动速度在指定时间同时实现稳定跟踪。
系统的运动学方程描述如下
Figure FDA0003147585700000011
其中d表示机器人的质心与几何中心的距离;θ表示机器人运动速度与X轴之间的夹角;p=(x y θ)T表示实际位姿,q=(v ω)T表示实际速度;
设pr=(xr yr θr)T表示参考位姿,qr=(v ω)T表示参考速度,pe=(xe ye θe)T表示位姿误差;
根据坐标变换,坐垫机器人位姿误差方程为:
Figure FDA0003147585700000012
对方程(2)求导,并把(1)代入,得到坐垫机器人轨迹跟踪误差系统:
Figure FDA0003147585700000013
Figure FDA0003147585700000014
Figure FDA0003147585700000015
2.根据权利要求1所述服务机器人具有自主学习暂态运动时间的稳定控制方法,其特征在于根据轨迹跟踪误差系统,设计速度和角速度控制器分别为
Figure FDA0003147585700000016
Figure FDA0003147585700000017
其中速度控制器中的变量
Figure FDA0003147585700000021
χ1=vrcosθe-dωr sinθe
Figure FDA0003147585700000022
且α2≥1,α3≥1为控制器调节参数;tf表示指定暂态运动时间;t0表示初始时刻;
将角速度控制器代入式(5)可得:
Figure FDA0003147585700000023
设计Lyapunov函数:
V1e)=θe 2 (9)
则有
Figure FDA0003147585700000024
对式(9)求导得:
Figure FDA0003147585700000025
Figure FDA0003147585700000026
Figure FDA0003147585700000027
对式(12)积分,得:
Figure FDA0003147585700000028
其中α1≥1,常数
Figure FDA0003147585700000029
由式(13)可知,当t=tf时,
Figure FDA00031475857000000210
Figure FDA00031475857000000211
可得,
Figure FDA00031475857000000212
由此可得,V2=0,因此在指定暂态时间tf,角度跟踪误差θe达到零;
接下来,将xe视为式(4)的输入,设计xe使ye在指定暂态时间稳定;令
Figure FDA0003147585700000031
设计Lyapunov函数:
V2(ye)=ye 2(15)
则有
Figure FDA0003147585700000032
将式(14)代入式(4)得:
Figure FDA0003147585700000033
对式(15)求导得:
Figure FDA0003147585700000034
Figure FDA0003147585700000035
Figure FDA0003147585700000036
对式(19)积分,得:
Figure FDA0003147585700000037
其中
Figure FDA0003147585700000038
由式(20)可知,当t=tf时,η≤0,由
Figure FDA0003147585700000039
可得,η=0;由此可得,V2=0,因此在指定暂态时间tf,y轴跟踪误差ye达到零;
进一步,令v=v1-v2,其中v1=yeω+vrcosθe-dωrsinθe,代入式(3)得:
Figure FDA00031475857000000310
设变量
Figure FDA00031475857000000311
代入式(3)-(4)得到误差系统如下:
Figure FDA0003147585700000041
Figure FDA0003147585700000042
Figure FDA0003147585700000043
由式(6)和v1得:
Figure FDA0003147585700000044
设计Lyapunov函数:
V3(xe,ye)=V2(ye)+z2 (26)
由式(26)得:
Figure FDA0003147585700000045
V3≥z2,
Figure FDA0003147585700000046
对式(26)求导得:
Figure FDA0003147585700000047
并将式(25)代入
Figure FDA0003147585700000048
得:
Figure FDA0003147585700000049
取β=α23
Figure FDA00031475857000000410
得:
Figure FDA00031475857000000411
对式(29)积分,得:
ζ≤ln(C3(tf-t)β+1)(30)
其中
Figure FDA00031475857000000412
由式(30)可知,当t=tf时,ζ≤0,由式
Figure FDA00031475857000000413
知,ζ=0;由此可得,V3=0,因此在指定暂态时间tf,x轴跟踪误差xe达到零;
进一步,当t≥tf时,由式(7)、式(5)可知,ω=ωr
Figure FDA00031475857000000414
再由式(14)可知,xe=0,进而
Figure FDA00031475857000000415
再通过式(4)可知,
Figure FDA00031475857000000416
即t≥tf时,控制器(6)(7)使跟踪误差系统趋于渐近稳定;
因此,由上述可知,坐垫机器人在运动过程中可实现稳定跟踪控制。
3.根据权利要求1所述服务机器人具有自主学习暂态运动时间的稳定控制方法,其特征在于描述坐垫机器人暂态运动时间的学习状态state1,state2,state3,state4如下:
state1:|v|>vmaxand|ω|>ωmax,t0≤t<tf
state2:|v|>vmaxand|ω|≤ωmax,t0≤t<tf
state3:|v|≤vmaxand|ω|>ωmax,t0≤t<tf
state4:|v|≤vmaxand|ω|≤ωmax,t0≤t<tf
其中,vmax表示坐垫机器人允许的最大安全速度,ωmax表示坐垫机器人允许的最大安全角速度;
暂态运动时间的学习动作a1,a2描述如下:
a1:tf=t0+Δt
a2:tf=t0-Δt
其中Δt表示每次自主学习暂态运动时间的调整变化量;
设计坐垫机器人自主学习暂态运动时间的奖赏值函数R为:
Figure FDA0003147585700000051
坐垫机器人自主学习暂态运动时间的步骤如下:
1)对坐垫机器人(S,A)进行初始化,其中S为坐垫机器人当前学习状态,A为机器人当前采取的动作;设置机器人更新状态学习速率α,衰减系数γ,学习动作的选择概率ε,其中α∈[0,1],γ∈[0,1],ε∈[0,1];
2)获取坐垫机器人运动位姿误差,并判断机器人在state1,state2,state3,state4中所处的状态,将其记为S,坐垫机器人以概率ε选取a1,a2中的任意一个动作,并记为A,确定当前时刻的状态行为对(S,A);进一步,根据R获得奖惩值,使坐垫机器人进入下一个状态,记为S',再利用概率ε选择新的动作A',获得新的行为对(S',A'),利用(S',A')并根据当前时刻R的奖惩值对(S,A)的价值进行更新,更新过程为:
Q(S,A)←Q(S,A)+α[R+γQ(S',A')-Q(S,A)] (31)其中,Q(S,A)为当前状态行为对(S,A)获得的价值;Q(S',A')为下一时刻状态行为对(S',A')的价值;这样根据式(31)的价值,可以完成一次暂态运动时间的自主学习;
将(S',A')作为当前新的学习状态和学习动作,重复步骤2),机器人不断进行暂态运动时间自主学习,直到完成学习次数,使指定暂态运动时间达到最优。
CN202110757231.7A 2021-07-05 2021-07-05 服务机器人具有自主学习暂态运动时间的稳定控制方法 Active CN113377115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110757231.7A CN113377115B (zh) 2021-07-05 2021-07-05 服务机器人具有自主学习暂态运动时间的稳定控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110757231.7A CN113377115B (zh) 2021-07-05 2021-07-05 服务机器人具有自主学习暂态运动时间的稳定控制方法

Publications (2)

Publication Number Publication Date
CN113377115A true CN113377115A (zh) 2021-09-10
CN113377115B CN113377115B (zh) 2023-10-20

Family

ID=77580907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110757231.7A Active CN113377115B (zh) 2021-07-05 2021-07-05 服务机器人具有自主学习暂态运动时间的稳定控制方法

Country Status (1)

Country Link
CN (1) CN113377115B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867130A (zh) * 2016-04-15 2016-08-17 沈阳工业大学 康复步行训练机器人的轨迹跟踪误差约束安全控制方法
CN108681243A (zh) * 2018-05-03 2018-10-19 南京理工大学 一种机器人轨迹跟踪方法
CN109669479A (zh) * 2018-10-22 2019-04-23 安徽大学 一种基于事件触发的移动机器人轨迹跟踪控制方法
CN109857100A (zh) * 2019-01-09 2019-06-07 合肥工业大学 一种基于反演法和快速终端滑模的复合轨迹跟踪控制算法
CN110095983A (zh) * 2019-04-22 2019-08-06 浙江工业大学 一种基于路径参数化的移动机器人预测跟踪控制方法
CN110597268A (zh) * 2019-09-30 2019-12-20 东南大学 一种基于级联系统理论的轮式移动机器人轨迹跟踪控制方法
CN110764416A (zh) * 2019-11-11 2020-02-07 河海大学 基于深度q网络的仿人机器人步态优化控制方法
CN112034842A (zh) * 2020-01-23 2020-12-04 沈阳工业大学 适用于不同使用者的服务机器人速度约束跟踪控制方法
CN112433475A (zh) * 2020-11-27 2021-03-02 沈阳工业大学 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法
CN112433474A (zh) * 2020-11-27 2021-03-02 沈阳工业大学 基于scn内干扰力估计的坐垫机器人安全触发控制方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867130A (zh) * 2016-04-15 2016-08-17 沈阳工业大学 康复步行训练机器人的轨迹跟踪误差约束安全控制方法
CN108681243A (zh) * 2018-05-03 2018-10-19 南京理工大学 一种机器人轨迹跟踪方法
CN109669479A (zh) * 2018-10-22 2019-04-23 安徽大学 一种基于事件触发的移动机器人轨迹跟踪控制方法
CN109857100A (zh) * 2019-01-09 2019-06-07 合肥工业大学 一种基于反演法和快速终端滑模的复合轨迹跟踪控制算法
CN110095983A (zh) * 2019-04-22 2019-08-06 浙江工业大学 一种基于路径参数化的移动机器人预测跟踪控制方法
CN110597268A (zh) * 2019-09-30 2019-12-20 东南大学 一种基于级联系统理论的轮式移动机器人轨迹跟踪控制方法
CN110764416A (zh) * 2019-11-11 2020-02-07 河海大学 基于深度q网络的仿人机器人步态优化控制方法
CN112034842A (zh) * 2020-01-23 2020-12-04 沈阳工业大学 适用于不同使用者的服务机器人速度约束跟踪控制方法
CN112433475A (zh) * 2020-11-27 2021-03-02 沈阳工业大学 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法
CN112433474A (zh) * 2020-11-27 2021-03-02 沈阳工业大学 基于scn内干扰力估计的坐垫机器人安全触发控制方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HONGBIN CHANG 等: "Omniwheel Touchdown Characteristics and Adaptive Saturated Control for a Human Support Robot", 《IEEE》 *
孙平 等: "全方向康复步行训练机器人的跟踪控制", 《沈阳工业大学学报》 *
杨俊友 等: "全方位轮式下肢康复训练机器人轨迹跟踪控制", 《机器人》 *
郭永吉: "坐垫机器人的路径规划及轨迹跟踪控制研究", 《CNKI》 *

Also Published As

Publication number Publication date
CN113377115B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN107065902A (zh) 基于非线性模型的无人机姿态模糊自适应预测控制方法及系统
CN104808495A (zh) 一种基于陀螺仪反馈的机器人舵机控制系统
CN107479381B (zh) 冗余康复步行训练机器人各轴跟踪误差最优预测控制方法
CN103279039A (zh) 一种机器人神经网络式计算力矩控制器训练平台及训练方法
CN110989589B (zh) 一种不同训练者质量随机变化的康复步行机器人的跟踪控制方法
CN107831667B (zh) 康复步行训练机器人的补偿人机互作用力的跟踪控制方法
CN103926875A (zh) 一种滚珠丝杠进给系统摩擦补偿方法
CN113467470B (zh) 一种无人自主小车的轨迹跟踪控制方法
CN103618486A (zh) 一种模糊控制的直流电机调速方法
CN112433495A (zh) 基于scn人机不确定模型的康复机器人快速有限时间控制
CN107703762B (zh) 康复步行训练机器人的人机互作用力辨识及控制方法
CN115236973A (zh) 基于pso李雅普诺夫函数的agv轨迹跟踪控制方法
CN108227759A (zh) 一种基于神经网络预测技术的太阳能跟踪控制系统及方法
CN207724306U (zh) 一种机器人打磨力控制系统
CN112433475B (zh) 基于scn系统偏移量辨识的坐垫机器人限时学习控制方法
CN104200270A (zh) 一种基于差异演化算法的滚齿工艺参数自适应调整方法
CN113377115A (zh) 服务机器人具有自主学习暂态运动时间的稳定控制方法
CN112034842A (zh) 适用于不同使用者的服务机器人速度约束跟踪控制方法
CN113568422A (zh) 基于模型预测控制优化强化学习的四足机器人控制方法
CN113325720B (zh) 具有运动速度决策的康复训练机器人自适应跟踪控制方法
WO2023165174A1 (zh) 构建机器人的控制器的方法、机器人的运动控制方法、装置以及机器人
CN116872197A (zh) 单杆机械臂的自适应神经网络反演控制方法及其控制系统
Liu et al. FPGA implementation of family service robot based on neural network PID motion control system
CN113848954A (zh) 一种改进型多神经元神经网络pid算法的无人车伺服控制系统
CN113703433B (zh) 机器人运动轨迹的速度规划方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant