CN109605365A - 一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 - Google Patents
一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 Download PDFInfo
- Publication number
- CN109605365A CN109605365A CN201811333587.2A CN201811333587A CN109605365A CN 109605365 A CN109605365 A CN 109605365A CN 201811333587 A CN201811333587 A CN 201811333587A CN 109605365 A CN109605365 A CN 109605365A
- Authority
- CN
- China
- Prior art keywords
- mechanical arm
- control
- space
- robot
- base platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1605—Simulation of manipulator lay-out, design, modelling of manipulator
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种空间机器人机械臂抓捕控制系统,包括内、外两个回路;在外回路中,系统通过PD控制器实现抓捕过程中空间机器人机械臂基座平台的姿态稳定;在内回路中,系统通过基于强化学习的强化学习控制系统控制机械臂实现对非合作目标的抓捕机动。本发明还进一步的公开了一种用于控制系统内回路中机械臂强化学习控制系统的强化学习方法,以及空间机器人机械臂抓捕控制系统的空间机器人动力学建模方法。本发明相比PD控制,强化学习RL控制下的基座平台姿态扰动更小,机械臂末端运动过程更平稳,控制精度更高,且使强化学习RL控制下的机械臂运动灵活性好,更具有自主智能性。
Description
技术领域
本发明涉机器人控制领域,尤其涉及一种空间机器人机械臂抓捕控制系统及方法。
背景技术
近年来,越来越多的卫星被发射升空,尽管卫星任务失败大部分是因为运载火箭发射失败,但在轨故障也是影响卫星任务失败的重要原因,还有许多卫星因为燃料耗尽或电力供应不足而无法继续完成工作,严重影响卫星的使用寿命。由于恶劣的太空环境对于宇航员舱外作业有着较大风险,而空间机器人完全可以替代人类完成这些舱外空间作业,可广泛应用于在轨维修、燃料加注与在轨组装等多方面的在轨服务任务中,已成为多个国家的研究热点。机械臂与基座平台组成高度耦合的动力学系统,机械臂的运动会影响空间机器人基座平台的姿态稳定,这些问题都对空间机器人的在轨稳定控制提出了较大的挑战,关系到在轨服务任务的成功与否。本发明专利提出一种智能控制方法对空间机器人进行控制。
许多学者提出了针对空间机器人系统稳定控制的方法。有针对空间机器人基座平台可控的情况设计了自适应控制方法,并在关节空间中对机械臂控制进行了仿真计算。有提出了带扰动观测器的鲁棒控制策略,将模型的不确定性与外界的干扰集中在一起,在机械臂的每个关节处设计了扰动观测器,结合PD控制完成对机械臂的控制。有提出了自适应神经网络控制方法,对不确定部分用神经网络近似,并证明了系统的稳定性。有将H∞控制与神经网络结合在一起,对自由漂浮空间机器人的操作手进行了控制,并考虑了模型的不确定性与外界的扰动。有在进行空间机器人抓捕漂浮目标的研究中,引入末端装置抓取目标时的碰撞模型,提出了"动态抓取域"用于机械臂抓取目标时的控制,同时应用关节主动阻尼控制,以减小抓取碰撞激振对空间机器人冲击的影响。有针对载体位置、姿态均不受控并具有有界外部扰动的漂浮基柔性两杆空间机械臂振动进行了不主动抑制的全局鲁棒Terminal滑模控制。有在自由漂浮空间机器人系统中,考虑基座平台的反作用干扰,对机械臂运动进行了轨迹优化。有通过估计机械臂产生的角动量,然后对基座平台姿态进行补偿控制,对机械臂运动与基座平台姿态进行了协调控制。有提出在自由漂浮基下,由空间机械臂自身的控制实现机械臂与基座平台协调运动的方法。有考虑反应轮的方面来重新描述自由飞行空间机器人的动力学方程,应用一种新的自适应变结构控制方法实现了受系统不确定性影响的空间机器人鲁棒协调控制器。有针对空间机械手轨迹跟踪问题,使用分散递推控制策略,设计了分散鲁棒控制器。
空间机械臂的运动与基座平台的运动相互耦合,为提高机械臂抓捕的精度与稳定度,需要同时控制机械臂和基座平台的运动。此外,机械臂的运动导致系统的动力学参数发生变化,因此抓捕过程中的空间机器人是一个时变的非线性耦合系统。传统的控制器需要已知空间机器人系统精确的动力学模型,且并没有考虑目标的非合作特性。
发明内容
针对上述问题,本发明提出了一种基于强化学习的空间机械手臂抓捕控制系统,该控制系统包括内、外两个回路,在外回路中,通过PD控制器保证抓捕过程中空间机器人基座平台的姿态稳定;在内回路中,通过基于强化学习的机械臂运动控制器以实现对非合作目标的抓捕机动。本发明还进一步提出了一种基于强化学习空间机械臂抓捕控制方法,通过与外界环境的交互中学习得到控制律,提高空间机器人系统在轨工作的自主性。
本发明的技术方案是这样实现的:
一种空间机器人机械臂抓捕控制系统,所述控制系统包括内、外两个回路;在外回路中,系统通过PD控制器实现抓捕过程中空间机器人机械臂基座平台的姿态稳定;在内回路中,系统通过基于强化学习的机械臂运动控制器实现对非合作目标的抓捕机动。
一种用于上述控制系统内回路中,机械臂运动控制器的强化学习方法,通过将机械臂的末端位置作为操作手位置,将机械臂末端位置误差Ec、速度误差作为运动控制器的输入,并通过强化学习由运动控制器输出空间机械臂控制力矩Tq,从而实现对机械臂的运动控制,其中:
Ec=Xd-X (9)
式(9)、(10)中,Xd为机械臂末端期望位置。
进一步的,所述方法中采用模糊理论对连续变化量进行模糊化处理,将连续变化的量变为有限的状态量s,在模糊推理系统中,采用高斯隶属度函数统一对机械臂末端位置与速度进行模糊化处理,如式(11)所示:
式(11)中,l为输入变量的模糊层数,这里l=1,2,3,即将输入变量模糊处理为3层,y为输入变量,即yl为每层模糊层的中心值,yl(i)=m(i)+n(i)*(l-1),σ控制高斯隶属度函数的“宽度”,由于输入变量的模糊级别分为3级,则模糊规则L总共为9条,{a1,a2,......,aj}是与每条模糊规则所匹配的控制输出集合,控制输出划分为模糊集{NB,N,Z,P,PB},其中,NB,N,Z,P,PB分别代表负大、负、零、正、正大5个模糊级别,即j=5。
进一步的,设计其中的模糊规则如下:
如果y(1)、y(2)满足第p条模糊规则Lp,那么a=a1,Q(p,1),
或者a=a2,Q(p,2)……或者a=aj,Q(p,j),
每一条模糊规则权重υp可由输入变量机械臂末端位置误差Ec、速度误差Ec的模糊隶属度相乘得到,公式如下:
υp=Z(y(1))*Z(y(2)) (12)。
进一步的,所述强化学习的更新步骤如下:
在每一条的模糊规则中,选取Q表中所对应一行中使得Q值最小的控制输出作为最优输出,根据每一条模糊规则中的最优输出去模糊化计算,得到连续性机械臂控制力矩:
在强化学习过程中,每一次训练迭代计算中除了最优控制力矩,还可采用贪心算法选择控制力矩作为实际的输出力矩,具体步骤如式(15)、(16)所示,
同理,通过去模糊计算可得此时的Q值:
在施加机械臂控制力矩后,使机械臂末端位置由状态s到达状态s',在状态s'时,使用最优控制力矩代替实际控制力矩此时的目标Q值为:
计算成本函数r,机械臂末端X距离目标位置点Xd越远,成本越大,并考虑机械臂末端的速度与目标位置点之间的速度差,将成本函数定义为:
可得到Q值的更新公式:
经过强化学习的训练过程,使Q表中的值不断更新收敛,最后稳定到最优Q值,并进一步由运动控制器输出相应的空间机械臂控制力矩Tq,
一种用于上述控制系统的空间机器人动力学建模方法,包括以下步骤:
S1,将空间机器人的可控基座平台与机器人的机械臂看作一个多体链,由n+1个刚体和n个关节组成,n个关节从1到n分别进行编号,q=(q1,q2,...qn)T用来表示这些关节转动的角度,θB=(θx,θy,θz)T用来表示基座平台的姿态角,xB=(xBx,xBy,xBz)T用来表示基座平台的轨道位置;
S2,将轨道坐标系作为惯性坐标系∑I,以空间机器人质心为原点;定义基座平台坐标系∑B,以基座平台质心为原点;坐标系∑B的ox轴与空间机器人轴对称轴重合,稳定状态下指向前进方向,oy轴垂直于纵对称面,oz轴与其它两轴互补成右旋坐标系;所述基座平台与空间机器人固联,Ri与ri分别表示惯性坐标系∑I与基座平台坐标系∑B下第i个连杆质心的位置矢量,
Ri=ri+RB, (1)
其中,RB表示惯性空间坐标系∑I下基座平台质心的位置矢量;Vi和Ωi分别表示惯性坐标系∑I下第i个刚体的线速度与角速度,vi和ωi分别表示基座平台坐标系∑B下第i个刚体的线速度与角速度,由此可以得到:
Vi=vi+VB+ΩB×ri (2)
Ωi=ωi+ΩB (3)
上式(2)、(3)中的VB与ΩB分别表示惯性坐标系∑I下基座平台质心的线速度与角速度,同时,可将基座平台坐标系∑B下基座平台质心的线速度vi与角速度ωi表示为:
上式(4)与式(5)中,JLi与JAi分别是第i个连杆的雅克比矩阵Ji的线性部分与角度部分。
进一步的,所述建模方法中在惯性坐标系∑I下,空间机器人的动能主要由基座平台动能与机械臂动能组成,其中每部分动能又由平动动能与转动动能两部分组成,可写为:
式(6)中,为一个对称矩阵,其中,x=[xB,θB,q]T,
进一步的,所述建模方法中对空间机器人机械臂的运动控制与基座平台的姿态稳定控制不考虑基座平台的轨道运动,并忽略空间机器人的重力势能,采用拉格朗日方法得到空间机器人系统动力学方程:
式(7)中,φ=[θB q]T,T=[TB Tq]T,TB为空间机器人的姿态控制力矩,Tq为机械臂的控制力矩,τ为干扰力矩,可得机械臂末端的位置为:
X=Tran(θB)R(q) (8)
式(8)中,Tran(θB)是从基座平台坐标系∑B到惯性坐标系∑I的坐标转换矩阵,与基座平台姿态角θB有关,R(q)表示基座坐标系∑I下机械臂末端位置矢量,与机械臂各个关节处的转角、连杆尺寸大小有关。
本发明的有益效果在于:
1、如图4所示,相比PD控制,强化学习RL控制下的基座平台姿态扰动更小,机械臂末端运动过程更平稳,控制精度更高。
2、如图5所示,针对抓捕目标的非合作特性,相比PD控制,强化学习RL控制下的机械臂运动灵活性好,更具有自主智能性。
附图说明
图1为本发明空间机器人机械臂抓捕控制系统工作框图;
图2为本发明空间机器人机械臂抓捕控制系统强化学习过程图;
图3为本发明空间机器人机械臂抓捕控制系统结构示意图;
图4为PD控制与RL控制下,空间机器人基座平台z方向姿态角比较图;
图5为PD控制与RL控制下,空间机器人机械臂末端轨迹比较图。
图中包括:100外回路,101PD控制器,102基座平台,200内回路,201强化学习控制系统,202机械臂。
具体实施方式
下面结合附图详述本发明具体实施方式:
如图1所示,一种空间机器人机械臂抓捕控制系统,所述控制系统包括内、外两个回路;在外回路100中,系统通过PD控制器101实现抓捕过程中空间机器人机械臂基座平台102的姿态稳定;在内回路200中,系统通过基于强化学习的强化学习控制系统201控制机械臂202实现对非合作目标的抓捕机动。
如图2所示,一种用于上述机械臂抓捕控制系统内回路中机械臂强化学习控制系统的强化学习方法,通过将机械臂的末端位置作为操作手位置,将机械臂末端位置误差Ec、速度误差作为运动控制器的输入,并通过强化学习由运动控制器输出空间机械臂控制力矩Tq,从而实现对机械臂的运动控制,其中:
Ec=Xd-X (9)
式(9)、(10)中,Xd为机械臂末端期望位置。
进一步的,所述强化学习方法中采用模糊理论对连续变化量进行模糊化处理,将连续变化的量变为有限的状态量s,在模糊推理系统中,采用高斯隶属度函数统一对机械臂末端位置与速度进行模糊化处理,如式(11)所示:
式(11)中,l为输入变量的模糊层数,这里l=1,2,3,即将输入变量模糊处理为3层,y为输入变量,即yl为每层模糊层的中心值,yl(i)=m(i)+n(i)*(l-1),σ控制高斯隶属度函数的“宽度”,由于输入变量的模糊级别分为3级,则模糊规则L总共为9条,{a1,a2,......,aj}是与每条模糊规则所匹配的控制输出集合,控制输出划分为模糊集{NB,N,Z,P,PB},其中,NB,N,Z,P,PB分别代表负大、负、零、正、正大5个模糊级别,即j=5。
进一步的,在所述强化学习方法中设计其中的模糊规则如下:
如果y(1)、y(2)满足第p条模糊规则Lp,那么a=a1,Q(p,1),
或者a=a2,Q(p,2)……或者a=aj,Q(p,j),
每一条模糊规则权重υp可由输入变量机械臂末端位置误差Ec、速度误差Ec的模糊隶属度相乘得到,公式如下:
υp=Z(y(1))*Z(y(2)) (12)。
进一步的,所述强化学习方法中所述强化学习的更新步骤如下:
在每一条的模糊规则中,选取Q表中所对应一行中使得Q值最小的控制输出作为最优输出,根据每一条模糊规则中的最优输出去模糊化计算,得到连续性机械臂控制力矩:
在强化学习过程中,每一次训练迭代计算中除了最优控制力矩,还可采用贪心算法选择控制力矩作为实际的输出力矩,具体步骤如式(15)、(16)所示,
同理,通过去模糊计算可得此时的Q值:
在施加机械臂控制力矩后,使机械臂末端位置由状态s到达状态s',在状态s'时,使用最优控制力矩代替实际控制力矩此时的目标Q值为:
计算成本函数r,机械臂末端X距离目标位置点Xd越远,成本越大,并考虑机械臂末端的速度与目标位置点之间的速度差,将成本函数定义为:
可得到Q值的更新公式:
经过强化学习的训练过程,使Q表中的值不断更新收敛,最后稳定到最优Q值,并进一步由运动控制器输出相应的空间机械臂控制力矩Tq,
一种用于上述空间机器人机械臂抓捕控制系统的空间机器人动力学建模方法,所述空间机器人机械模型如图3所示,所述建模步骤如下:
S1,将空间机器人的可控基座平台203与机器人的机械臂202看作一个多体链,由n+1个刚体和n个关节组成,n个关节从1到n分别进行编号,q=(q1,q2,...qn)T用来表示这些关节转动的角度,θB=(θx,θy,θz)T用来表示基座平台的姿态角,xB=(xBx,xBy,xBz)T用来表示基座平台203的轨道位置;
S2,将轨道坐标系作为惯性坐标系∑I,以空间机器人质心为原点;定义基座平台坐标系∑B,以基座平台质心为原点;坐标系∑B的ox轴与空间机器人轴对称轴重合,稳定状态下指向前进方向,oy轴垂直于纵对称面,oz轴与其它两轴互补成右旋坐标系;所述基座平台与空间机器人固联,Ri与ri分别表示惯性坐标系∑I与基座平台坐标系∑B下第i个连杆质心的位置矢量,
Ri=ri+RB, (1)
其中,RB表示惯性空间坐标系∑I下基座平台质心的位置矢量;Vi和Ωi分别表示惯性坐标系∑I下第i个刚体的线速度与角速度,vi和ωi分别表示基座平台坐标系∑B下第i个刚体的线速度与角速度,由此可以得到:
Vi=vi+VB+ΩB×ri (2)
Ωi=ωi+ΩB (3)
上式(2)、(3)中的VB与ΩB分别表示惯性坐标系∑I下基座平台质心的线速度与角速度,同时,可将基座平台坐标系∑B下基座平台质心的线速度vi与角速度ωi表示为:
上式(4)与式(5)中,JLi与JAi分别是第i个连杆的雅克比矩阵Ji的线性部分与角度部分。
进一步的,所述建模方法中在惯性坐标系∑I下,空间机器人的动能主要由基座平台动能与机械臂动能组成,其中每部分动能又由平动动能与转动动能两部分组成,可写为:
式(6)中,为一个对称矩阵,其中,x=[xB,θB,q]T,
进一步的,所述建模方法中对空间机器人机械臂202的运动控制与基座平台102的姿态稳定控制不考虑基座平台的轨道运动,并忽略空间机器人的重力势能,采用拉格朗日方法得到空间机器人系统动力学方程:
式(7)中,φ=[θB q]T,T=[TB Tq]T,TB为空间机器人的姿态控制力矩,Tq为机械臂的控制力矩,τ为干扰力矩,可得机械臂末端的位置为:
X=Tran(θB)R(q) (8)
式(8)中,Tran(θB)是从基座平台坐标系∑B到惯性坐标系∑I的坐标转换矩阵,与基座平台姿态角θB有关,R(q)表示基座坐标系∑I下机械臂末端位置矢量,与机械臂各个关节处的转角、连杆尺寸大小有关。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种空间机器人机械臂抓捕控制系统,其特征在于:所述控制系统包括内、外两个回路;在外回路中,系统通过PD控制器实现抓捕过程中空间机器人机械臂基座平台的姿态稳定;在内回路中,系统通过基于强化学习的强化学习控制系统控制机械臂实现对非合作目标的抓捕机动。
2.一种用于权利要求1所述控制系统内回路中,机械臂强化学习控制系统的强化学习方法,其特征在于:通过将机械臂的末端位置作为操作手位置,将机械臂末端位置误差Ec、速度误差作为运动控制器的输入,并通过强化学习由运动控制器输出空间机械臂控制力矩Tq,从而实现对机械臂的运动控制,其中:
Ec=Xd-X (9)
式(9)、(10)中,Xd为机械臂末端期望位置。
3.根据权利要求2所述的强化学习方法,其特征在于:所述方法中采用模糊理论对连续变化量进行模糊化处理,将连续变化的量变为有限的状态量s,在模糊推理系统中,采用高斯隶属度函数统一对机械臂末端位置与速度进行模糊化处理,如式(11)所示:
式(11)中,l为输入变量的模糊层数,这里l=1,2,3,即将输入变量模糊处理为3层,y为输入变量,即yl为每层模糊层的中心值,yl(i)=m(i)+n(i)*(l-1),σ控制高斯隶属度函数的“宽度”,由于输入变量的模糊级别分为3级,则模糊规则L总共为9条,{a1,a2,......,aj}是与每条模糊规则所匹配的控制输出集合,控制输出划分为模糊集{NB,N,Z,P,PB},其中,NB,N,Z,P,PB分别代表负大、负、零、正、正大5个模糊级别,即j=5。
4.根据权利要求3所述的强化学习方法,其特征在于:设计其中的模糊规则如下:
如果y(1)、y(2)满足第p条模糊规则Lp,那么a=a1,Q(p,1),
或者a=a2,Q(p,2)……或者a=aj,Q(p,j),
每一条模糊规则权重υp可由输入变量机械臂末端位置误差Ec、速度误差Ec的模糊隶属度相乘得到,公式如下:
υp=Z(y(1))*Z(y(2)) (12)。
5.根据权利要求2、3或4所述的强化学习方法,其特征在于:所述强化学习的更新步骤如下:
在每一条的模糊规则中,选取Q表中所对应一行中使得Q值最小的控制输出作为最优输出,根据每一条模糊规则中的最优输出去模糊化计算,得到连续性机械臂控制力矩:
在强化学习过程中,每一次训练迭代计算中除了最优控制力矩,还可采用贪心算法选择控制力矩作为实际的输出力矩,具体步骤如式(15)、(16)所示,
同理,通过去模糊计算可得此时的Q值:
在施加机械臂控制力矩后,使机械臂末端位置由状态s到达状态s',在状态s'时,使用最优控制力矩代替实际控制力矩此时的目标Q值为:
计算成本函数r,机械臂末端X距离目标位置点Xd越远,成本越大,并考虑机械臂末端的速度与目标位置点之间的速度差,将成本函数定义为:
可得到Q值的更新公式:
经过强化学习的训练过程,使Q表中的值不断更新收敛,最后稳定到最优Q值,并进一步由运动控制器输出相应的空间机械臂控制力矩Tq,
6.一种用于权利要求1所述空间机器人机械臂抓捕控制系统的空间机器人动力学建模方法,其特征在于,包括以下步骤:
S1,将空间机器人的可控基座平台与机器人的机械臂看作一个多体链,由n+1个刚体和n个关节组成,n个关节从1到n分别进行编号,q=(q1,q2,...qn)T用来表示这些关节转动的角度,θB=(θx,θy,θz)T用来表示基座平台的姿态角,xB=(xBx,xBy,xBz)T用来表示基座平台的轨道位置;
S2,将轨道坐标系作为惯性坐标系∑I,以空间机器人质心为原点;定义基座平台坐标系∑B,以基座平台质心为原点;坐标系∑B的ox轴与空间机器人轴对称轴重合,稳定状态下指向前进方向,oy轴垂直于纵对称面,oz轴与其它两轴互补成右旋坐标系;所述基座平台与空间机器人固联,Ri与ri分别表示惯性坐标系∑I与基座平台坐标系∑B下第i个连杆质心的位置矢量,
Ri=ri+RB, (1)
其中,RB表示惯性空间坐标系∑I下基座平台质心的位置矢量;Vi和Ωi分别表示惯性坐标系∑I下第i个刚体的线速度与角速度,vi和ωi分别表示基座平台坐标系∑B下第i个刚体的线速度与角速度,由此可以得到:
Vi=vi+VB+ΩB×ri (2)
Ωi=ωi+ΩB (3)
上式(2)、(3)中的VB与ΩB分别表示惯性坐标系∑I下基座平台质心的线速度与角速度,同时,可将基座平台坐标系∑B下基座平台质心的线速度vi与角速度ωi表示为:
上式(4)与式(5)中,JLi与JAi分别是第i个连杆的雅克比矩阵Ji的线性部分与角度部分。
7.根据权利要求6所述的建模方法,其特征在于:在惯性坐标系∑I下,空间机器人的动能主要由基座平台动能与机械臂动能组成,其中每部分动能又由平动动能与转动动能两部分组成,可写为:
式(6)中,为一个对称矩阵,其中,x=[xB,θB,q]T,
8.根据权利要求6或7所述的建模方法,其特征在于:对空间机器人机械臂的运动控制与基座平台的姿态稳定控制不考虑基座平台的轨道运动,并忽略空间机器人的重力势能,采用拉格朗日方法得到空间机器人系统动力学方程:
式(7)中,φ=[θB q]T,T=[TB Tq]T,TB为空间机器人的姿态控制力矩,Tq为机械臂的控制力矩,τ为干扰力矩,可得机械臂末端的位置为:
X=Tran(θB)R(q) (8)
式(8)中,Tran(θB)是从基座平台坐标系∑B到惯性坐标系∑I的坐标转换矩阵,与基座平台姿态角θB有关,R(q)表示基座坐标系∑I下机械臂末端位置矢量,与机械臂各个关节处的转角、连杆尺寸大小有关。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811280808 | 2018-10-30 | ||
CN2018112808084 | 2018-10-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109605365A true CN109605365A (zh) | 2019-04-12 |
Family
ID=66004052
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811333587.2A Withdrawn CN109605365A (zh) | 2018-10-30 | 2018-11-09 | 一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 |
CN201910523238.5A Pending CN110340888A (zh) | 2018-10-30 | 2019-06-17 | 一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910523238.5A Pending CN110340888A (zh) | 2018-10-30 | 2019-06-17 | 一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN109605365A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110722557A (zh) * | 2019-10-21 | 2020-01-24 | 上海航天控制技术研究所 | 一种平台-机械臂一体化控制方法 |
CN110768594A (zh) * | 2019-08-27 | 2020-02-07 | 成都锦江电子系统工程有限公司 | 骨骼机器人负载模型建模建立方法 |
CN111890351A (zh) * | 2020-06-12 | 2020-11-06 | 深圳先进技术研究院 | 机器人及其控制方法、计算机可读存储介质 |
CN111890348A (zh) * | 2019-05-06 | 2020-11-06 | 广州中国科学院先进技术研究所 | 一种双机器人协同搬运的控制方法及装置 |
CN111890350A (zh) * | 2020-06-12 | 2020-11-06 | 深圳先进技术研究院 | 机器人及其控制方法、计算机可读存储介质 |
CN111942621A (zh) * | 2020-07-17 | 2020-11-17 | 北京控制工程研究所 | 一种基于多任务学习的在轨自主加注控制方法及系统 |
CN112506044A (zh) * | 2020-09-10 | 2021-03-16 | 上海交通大学 | 一种基于视觉反馈和强化学习的柔性臂控制与规划方法 |
CN113352320A (zh) * | 2021-05-11 | 2021-09-07 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN113715024A (zh) * | 2021-09-03 | 2021-11-30 | 上海电机学院 | 一种多自由度上肢康复机器人的位置跟踪控制方法 |
CN114055476A (zh) * | 2021-12-15 | 2022-02-18 | 中国科学院微小卫星创新研究院 | 空间机械臂抓捕力矩测试方法及系统 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111114852B (zh) * | 2019-12-09 | 2021-04-23 | 上海航天控制技术研究所 | 一种空间翻滚目标四维感知捕获装置及方法 |
CN111716361B (zh) * | 2020-07-03 | 2021-09-07 | 深圳市优必选科技股份有限公司 | 机器人控制方法、装置和面-面接触模型构建方法 |
CN112001087B (zh) * | 2020-08-27 | 2021-10-19 | 南京航空航天大学 | 一种旋转关节型工业机器人非线性动力学建模分析方法 |
CN113419549B (zh) * | 2021-06-02 | 2022-09-30 | 上海宇航系统工程研究所 | 一种空间目标抓捕试验系统的运动模拟器运动分配方法 |
CN117140527B (zh) * | 2023-09-27 | 2024-04-26 | 中山大学·深圳 | 一种基于深度强化学习算法的机械臂控制方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104796158B (zh) * | 2015-05-05 | 2018-11-06 | 大连理工大学 | 一种针对固定信息长度的ldpc编译码系统平台 |
CN107038477A (zh) * | 2016-08-10 | 2017-08-11 | 哈尔滨工业大学深圳研究生院 | 一种非完备信息下的神经网络与q学习结合的估值方法 |
CN107609222B (zh) * | 2017-08-16 | 2020-10-23 | 北京控制工程研究所 | 一种空间机器人末端接触碰撞力计算方法 |
CN107932515B (zh) * | 2017-11-16 | 2021-08-13 | 哈尔滨航士科技发展有限公司 | 一种基于机械手臂学习的电子设备与方法 |
-
2018
- 2018-11-09 CN CN201811333587.2A patent/CN109605365A/zh not_active Withdrawn
-
2019
- 2019-06-17 CN CN201910523238.5A patent/CN110340888A/zh active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111890348A (zh) * | 2019-05-06 | 2020-11-06 | 广州中国科学院先进技术研究所 | 一种双机器人协同搬运的控制方法及装置 |
CN111890348B (zh) * | 2019-05-06 | 2023-08-29 | 广州中国科学院先进技术研究所 | 一种双机器人协同搬运的控制方法及装置 |
CN110768594A (zh) * | 2019-08-27 | 2020-02-07 | 成都锦江电子系统工程有限公司 | 骨骼机器人负载模型建模建立方法 |
CN110722557A (zh) * | 2019-10-21 | 2020-01-24 | 上海航天控制技术研究所 | 一种平台-机械臂一体化控制方法 |
CN110722557B (zh) * | 2019-10-21 | 2021-11-05 | 上海航天控制技术研究所 | 一种平台-机械臂一体化控制方法 |
CN111890351A (zh) * | 2020-06-12 | 2020-11-06 | 深圳先进技术研究院 | 机器人及其控制方法、计算机可读存储介质 |
CN111890350A (zh) * | 2020-06-12 | 2020-11-06 | 深圳先进技术研究院 | 机器人及其控制方法、计算机可读存储介质 |
CN111942621B (zh) * | 2020-07-17 | 2022-03-04 | 北京控制工程研究所 | 一种基于多任务学习的在轨自主加注控制方法及系统 |
CN111942621A (zh) * | 2020-07-17 | 2020-11-17 | 北京控制工程研究所 | 一种基于多任务学习的在轨自主加注控制方法及系统 |
CN112506044A (zh) * | 2020-09-10 | 2021-03-16 | 上海交通大学 | 一种基于视觉反馈和强化学习的柔性臂控制与规划方法 |
CN113352320B (zh) * | 2021-05-11 | 2022-06-17 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN113352320A (zh) * | 2021-05-11 | 2021-09-07 | 浙江工业大学 | 一种基于Q学习的Baxter机械臂智能优化控制方法 |
CN113715024A (zh) * | 2021-09-03 | 2021-11-30 | 上海电机学院 | 一种多自由度上肢康复机器人的位置跟踪控制方法 |
CN113715024B (zh) * | 2021-09-03 | 2024-04-16 | 上海电机学院 | 一种多自由度上肢康复机器人的位置跟踪控制方法 |
CN114055476A (zh) * | 2021-12-15 | 2022-02-18 | 中国科学院微小卫星创新研究院 | 空间机械臂抓捕力矩测试方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110340888A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109605365A (zh) | 一种空间机器人抓捕控制系统、强化学习方法及动力学建模方法 | |
Ollero et al. | Past, present, and future of aerial robotic manipulators | |
Liu et al. | DDPG-based adaptive robust tracking control for aerial manipulators with decoupling approach | |
He et al. | Mechanism, actuation, perception, and control of highly dynamic multilegged robots: A review | |
CN108381553B (zh) | 一种用于空间非合作目标捕获的相对导航近距离跟踪方法及系统 | |
Lunni et al. | Nonlinear model predictive control for aerial manipulation | |
CN105353763B (zh) | 一种非合作目标航天器相对轨道姿态有限时间控制方法 | |
CN107490965A (zh) | 一种空间自由漂浮机械臂的多约束轨迹规划方法 | |
CN108919649B (zh) | 一种针对故障卫星外包络抓捕的抓捕最优路径设计方法 | |
US20060214622A1 (en) | Control system and related method for multi-limbed, multi-legged robot | |
CN105138000A (zh) | 最优化基座位姿扰动的七自由度空间机械臂轨迹规划方法 | |
CN109591018B (zh) | 一种用于目标捕获后稳定的自由漂浮空间机械臂控制方法 | |
CN109606753A (zh) | 一种空间双臂机器人协同抓捕目标的控制方法 | |
CN108393886B (zh) | 优化能量与操作度的分布式多移动机械手协同搬运方法 | |
CN113625735A (zh) | 基于腿臂复用六足机器人的控制方法和机器人 | |
Uno et al. | Gait planning for a free-climbing robot based on tumble stability | |
CN115857328A (zh) | 一种基于力矩平衡点与运动稳定性协同优化的六足机器人容错步态落足点规划方法 | |
Samy et al. | QP-based adaptive-gains compliance control in humanoid falls | |
CN113371231B (zh) | 一种带约束的航天器姿态控制方法 | |
CN108319135A (zh) | 基于神经网络鲁棒自适应的空间柔性系统展开控制方法 | |
CN109159123B (zh) | 一种基于能量最优的机器人翻身控制方法 | |
CN114700955B (zh) | 双轮腿-臂机器人全身运动规划与控制方法 | |
Zhang et al. | A multi-priority control of asymmetric coordination for redundant dual-arm robot | |
Yu et al. | Hierarchical jumping optimization for hydraulic biped wheel-legged robots | |
Zhou et al. | Motion and trajectory planning modeling for mobile landing mechanism systems based on improved genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190412 |
|
WW01 | Invention patent application withdrawn after publication |