CN113276114A - 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 - Google Patents
一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 Download PDFInfo
- Publication number
- CN113276114A CN113276114A CN202110553169.XA CN202110553169A CN113276114A CN 113276114 A CN113276114 A CN 113276114A CN 202110553169 A CN202110553169 A CN 202110553169A CN 113276114 A CN113276114 A CN 113276114A
- Authority
- CN
- China
- Prior art keywords
- subsystem
- formula
- force
- mechanical arm
- motion control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000011159 matrix material Substances 0.000 claims abstract description 49
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 239000006185 dispersion Substances 0.000 claims abstract description 12
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 24
- 238000004132 cross linking Methods 0.000 claims description 11
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 230000008878 coupling Effects 0.000 claims description 8
- 238000010168 coupling process Methods 0.000 claims description 8
- 238000005859 coupling reaction Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 7
- 230000003416 augmentation Effects 0.000 claims description 6
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 238000012886 linear function Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000006467 substitution reaction Methods 0.000 claims description 4
- 230000003190 augmentative effect Effects 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000004018 waxing Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/08—Programme-controlled manipulators characterised by modular constructions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1607—Calculation of inertia, jacobian matrixes and inverses
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Software Systems (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法,包括以下步骤:构建可重构机械臂子系统的动力学模型,从系统整体动力学模型中分离出各个关节模块的局部变量,利用雅可比矩阵映射关系将末端接触力指派给各子系统;针对子系统动力学模型,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;设计辅助系统,确定子系统的跟踪误差动力学系统;构建自适应嵌套更新律,更新评判网络权值,求解HJB方程得到运动控制子系统;利用拉格朗日乘子反馈法得到力控制子系统;将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统。
Description
技术领域
本发明涉及机器人控制与最优控制技术领域,具体为一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法。
背景技术
可重构机械臂是一类由一组标准的关节模块接口和连杆模块组合而成,并可以通过增删模块来变换其形状以自适应地完成不同任务的机械臂。由于其具有通用性、便携性、易于组装,且成本低廉等优点,可重构机械臂经常在人类无法直接参与的场景中发挥着巨大作用,如:精密制造、深空探测、灾难救援、高温高压环境等。值得指出的是,控制性能决定着生产质量,运行效率与安全性。因此,针对在此类恶劣工作环境下的可重构机械臂系统,开发一种最优化、智能化且低能耗的控制系统与方法非常迫切,为充分发挥“模块化”的特点,分散控制方法更适用于可重构机械臂。相对于集中式和分布式控制方法,分散控制方法仅利用子系统动力学信息实现,是一种具有更简单的控制结构、较少的参数调整、且子系统间没有信息交换的控制策略,通过标准关节模块协同完成复杂的工作任务。
自适应动态规划(ADP)作为解决传统动态规划算法常导致的“维数灾”困难的有效方法,其主要思想是借助函数估计器(如神经网络和模糊逻辑等)结合动态规划、强化学习等技术近似求解哈密顿-雅可比-贝尔曼方程(HJB)方程,进而实现最优控制系统。多年来,利用ADP的最优控制方法来处理可重构机械臂的位置跟踪、执行器故障等问题的研究取得了一些理论成果与进展。然而在现有的相关研究中,如公开号为CN105196294B提供的一种采用位置测量的可重构机械臂分散控制方法,公开号为CN109240092A提供的一种基于多智能体可重构模块化柔性机械臂轨迹跟踪控制方法,关注的几乎均为位置控制方法,然而,在抛光、打蜡、拧紧和装配等任务中,可重构机械臂的末端不可避免地与外部环境接触,并在作业对象表面上施加力的作用,现有的因此,开发一种面向可重构机械臂模块化特性的协同力/运动控制系统与方法成为当务之急,哈尔滨工程大学的硕士论文“手臂康复训练机器人控制及实验研究”,也是通过协同力/运动控制来控制用于康复训练的机械本体,但是该方法应用在可重构机械臂上存在着以下的不足:1、由于可重构机械臂需要根据需要拓展关节模块,现有的方法通常是为特定的系统设计的,无法进行拓展,通用性和可移植性差;2、可重构机械臂在工作时需要进行学习与进行动态规划时,现有的力/运动控制方法的快速性和稳定性难以满足需求;3、现有的协同力/运动控制的方式仍旧是单输入单输出的控制方法且可重构机械臂的控制维度大,因此若采用此方法来控制可重构机械臂,会造成控制系统的稳定性差,而且需要大量的数据进行计算,计算的负担和能耗高。
发明内容
本发明的目的在于提供一种基于终端任务指派的可重构机械臂协同力/运动控制方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于终端任务指派的可重构机械臂协同力/运动控制方法,包括:
S1:构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统;
S2:针对子系统动力学模型,用关联子系统的期望状态代替其实际状态,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;
S3:设计辅助系统,确定子系统的跟踪误差动力学系统;
S4:确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
S5:根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统;
S6:将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统。
优选的,所述步骤S1包括以下步骤:
S101:构建自由度为n的可重构机械臂的动力学模型为:
式中,是关节位移向量,qi(t)为关节i的位移,i=1,...,n,t为时间变量,为惯性矩阵,为哥氏力和离心力项,为重力项,为外部干扰,为施加的控制力拒。为m维动态约束函数,为与关节和任务空间的速度有关的雅可比矩阵,为拉格朗日乘子,表示可重构机械臂末端与动态约束面之间的相互作用力;
S102:在Φ(q,t)动态约束下,确定关节坐标q为:
从而将n-m个受约束的关节变量由n-m个线性独立的自由关节变量表示;
S103:计算出雅可比矩阵J(q)为:
式中:
式中,qi,Gi(q),τdi和τi分别为向量q,G(q),τd和τ的第i个分量,Mij(q)和分别为矩阵M(q)和的第ij个分量。为耦合的扭矩。Ji是J的第i行,Ji(qi)表示与Ji(q)的第i行中的第i个关节模块有关的信息,τi是τ的第i行。
优选的,所述步骤S2包括以下步骤:
式中:
S202:将关联子系统的期望状态代替其实际状态,将交联项改写为:
式中,xkd(k=1,2,...,i-1,i+1,...,n)表示第k个关联模块子系统的期望状态,是取代后的交联项,其中包含从提取的第i个关节模块的状态信息和第k个关节模块的期望状态信息,表示取代误差;
将式(5)进一步表示为:
将式(7)合并变换为:
S203:令非线性函数fi(xi,xkd),gi(xi)和Δhi(xi,xkd)满足Lipschitz连续条件,关节模块的动力学模型(8)是可控的,且fi(0,0)=0为系统的一个平衡点;
||Xid||≤qiM (9)
式中,交联项Δhi(xi,xkd)满足Lipschitz连续条件,即:
式中,Ek=||xk-xkd||,且dik>0是未知的Lipschitz常数;
根据式(11),将式(7)改写为:
式中,为第i个模块子系统状态xi的观测值,Lio=diag[li1o,li2o]为正定对角增益矩阵,为非线性函数Fi(xi,xkd,τi)的观测值,是WiF的估计值,是引入观测值的径向基函数σiF(xi,xkd,τi),为鲁棒项,其中,和通过下列自适应更新律更新;
式中,学习率Гiδ和ГiF均为正常数;
优选的,所述步骤S3包括以下步骤:
S301:设计辅助系统为:
式中,xid为Lipschitz连续函数;
S302:定义第i个模块子系统的跟踪误差为ei=xi-xid,确定子系统的跟踪误差动力学系统为:
式中,fia(xia)=[fi(ei+xid)-fid(xid),fid(xid)]T,gia(xia)=[gi(ei+xid),0]T,Δhia(xia)=[Δhi(x,xkd),0]T和xa=[x,xd]T;
将可重构机械臂的模块子系统的名义增广动力学表示为:
在式(20)中,将式(19)中的gia(xia)Jiλ+Δhia(xia)去掉且作为干扰动项处理,将式(20)看作为名义系统。
优选的,所述步骤S4包括以下步骤:
S401:采用单隐层神经网络构建评价网络表征最优代价函数Vi(xia)为:
将式(21)对xia求偏导数,得:
S402:将局部评价网络(21)由下式估计,得到未知权重Wic,
式中,Γiη为正常数;
定义局部Hamiltonian函数为:
将式(25)与局部最优Hamiltonian函数(27)进行比较,得到:
||δi||≤δicM (29);
式中,Γic2为正常数,局部评价网络的权值估计误差的更新律设计如下:
则得出的(30)-(31)即为所述自适应嵌套更新律;
S405:构建第i个模块子系统性能指标函数为:
确定式(33)微分形式即Lyapunov方程为:
将式(37)通过变换,得到:
优选的,所述步骤S5具体为:
考虑各模块子系统的力/运动控制任务,结合拉格朗日反馈法,将力控制子系统设计为:
优选的,所述步骤S6具体为:
将运动控制子系统(39)与力控制子系统(40)合成,设计基于终端任务指派的可重构机械臂协同力/运动控制系统为:
为实现上述目的,本发明另外还提供一种基于终端任务指派的可重构机械臂协同力/运动控制系统,包括有:
模型分解与终端任务协同指派模块,用于构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统,完成终端任务协同指派;
模型辨识模块,针对子系统动力学模型,用关联子系统的期望状态代替其实际状态,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;
运动控制子系统模块,用于设计辅助系统,确定子系统的跟踪误差动力学系统;
评价网络模块,用于确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
力控制子系统模块,用于根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统;以及;
控制系统合成模块,用于将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统,进而实现基于终端任务指派的可重构机械臂协同力/运动控制。
与现有技术相比,本发明的有益效果是:
1、本发明采用终端任务指派方式,通过雅可比矩阵函数将末端执行器的力/运动控制任务指派至各模块子系统中,实现末端任务协同指派,进而为各模块子系统并行设计力/运动控制系统,提高了本发明的通用性和可移植性;
2、本发明通过取代操作,即在被控模块子系统中,采用耦合子系统的期望状态取代相应的实际状态,有效避免了耦合交联项上界已知的强假设条件;采用径向基函数神经网络构建鲁棒分散观测器,进而获得模块子系统局部输入矩阵。此方法学习速度快,满足系统实时性及鲁棒性要求,更加利于实际系统应用;
3、本发明利用自适应嵌套更新方法构造评判网络,进而获取HJB方程的近似解,将评判网络权值误差稳定性由最终一致有界提升至大范围渐近稳定,提出了协同力/运动控制系统与方法,降低了可重构机械臂系统运行的计算负担与能耗,满足了实际应用时节约资源的要求,进一步增强了控制系统的实用性。
附图说明
图1为本发明基于终端任务指派的可重构机械臂协同力/运动控制方法流程图;
图2为可重构两自由度机械臂末端与动态约束面接触示意图;
图3为可重构机械臂模型分解与任务指派结构图;
图4为基于终端任务指派的可重构机械臂协同力/运动控制方法原理图;
图5为基于终端任务指派的可重构机械臂协同力/运动控制流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图2所示,可以看出本发明所述可重构机械臂末端与动态约束面接触示意结构图(以2自由度为例)。图中,L1,L2分别为可重构机械臂关节1与关节2的连杆长度,面A为动态约束面,点B为动态约束面的基点,L3为基点B到坐标原点O的距离,即OB的长度。点C为机械臂末端与动态约束面的接触点,θ1,θ2,θ3分别为模块1连杆、模块2连杆以及动态约束面A与水平基准线(x轴)的夹角。
实施例:
请参阅图1-4,本发明提供一种技术方案:
一种基于终端任务指派的可重构机械臂协同力/运动控制方法,包括以下步骤:
S1:构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统,将整体控制系统复杂性从系统级变为分散级,使得控制系统结构、算法大为简化,任务执行能力增强,并且提高了本发明的通用性和可移植性。
其中,步骤S1包括以下步骤:
S101:构建自由度为n的可重构机械臂的动力学模型为:
式中,是关节位移向量,qi(t)为关节i的位移,i=1,...,n,t为时间变量,为惯性矩阵,为哥氏力和离心力项,为重力项,为外部干扰,为施加的控制力拒。为m维动态约束函数,为与关节和任务空间的速度有关的雅可比矩阵,为拉格朗日乘子,表示可重构机械臂末端与动态约束面之间的相互作用力。
S102:在Φ(q,t)动态约束下,确定关节坐标q为:
其中,由于存在动态约束Φ(q,t),因此n自由度可重构机械臂在任务空间中剩下(n-m)自由度,即只有(n-m)个关节模块是自由运动的,从而将n-m个受约束的关节变量由(n-m)个线性独立的自由关节变量表示。
S103:计算出雅可比矩阵J(q)为:
式中,在计算雅可比矩阵时,首先将式(2)代入式(1)中的动态约束函数,可以将其重写为
Φ(qf,Ω(qf))=0
取动态约束函数Φ(q,t)=0的导数为:
将关节坐标代入重写后的可重构机械臂的动力学模型中,可得:
从而计算出雅可比矩阵。
式中,
式中,qi,Gi(q),τdi和τi分别为向量q,G(q),τd和τ的第i个分量,Mij(q)和分别为矩阵M(q)和的第ij个分量。为耦合的扭矩。Ji是J的第i行,Ji(qi)表示与Ji(q)的第i行中的第i个关节模块有关的信息,τi是τ的第i行。
因此,将描述力/运动任务的整个动力学系统(1)分解为一组仅通过局部变量表征其力/运动任务相互交联的子系统(4),即将可重构机械臂末端的力/运动任务协同指派给各模块子系统。
S2:将关联子系统的期望状态代替其实际状态,针对子系统动力学模型,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵。
其中,所述步骤S2包括以下步骤:
式中:
S202:将关联子系统的期望状态代替其实际状态,将交联项改写为:
式中,xkd(k=1,2,...,i-1,i+1,...,n)表示第k个关联模块子系统的期望状态,是取代后的交联项,其中包含从提取的第i个关节模块的状态信息和第k个关节模块的期望状态信息,表示取代误差。
使用期望状态代替其实际状态,能够避免交联项上界已知的强假设条件,将式(5)进一步表示为:
将式(7)合并变换为:
S203:令非线性函数fi(xi,xkd),gi(xi)和Δhi(xi,xkd)满足Lipschitz连续条件,关节模块的动力学模型(8)是可控的,且fi(0,0)=0为系统的一个平衡点。
||Xid||≤qiM (9)
式中,交联项Δhi(xi,xkd)满足Lipschitz连续条件,即:
式中,Ek=||xk-xkd||,且dik>0是未知的Lipschitz常数;
根据式(11),将式(7)改写为:
式中,为第i个模块子系统状态xi的观测值,Lio=diag[li1o,li2o]为正定对角增益矩阵,为非线性函数Fi(xi,xkd,τi)的观测值,是WiF的估计值,是引入观测值的径向基函数σiF(xi,xkd,τi),为鲁棒项。其中,和通过下列自适应更新律更新
式中,学习率Γiδ和ΓiF均为正常数。
S3:设计辅助系统,确定子系统的跟踪误差动力学系统。
其中,所述步骤S3包括以下步骤:
S301:设计辅助系统为:
式中,xid为Lipschitz连续函数;
S302:定义第i个模块子系统的跟踪误差为ei=xi-xid,确定子系统的跟踪误差动力学系统为:
式中,fia(xia)=[fi(ei+xid)-fid(xid),fid(xid)]T,gia(xia)=[gi(ei+xid),0]T,Δhia(xia)=[Δhi(x,xkd),0]T和xa=[x,xd]T;
将可重构机械臂的模块子系统的名义增广动力学表示为:
在式(20)中,将式(19)中的gia(xia)Jiλ+Δhia(xia)去掉且作为干扰动项处理,将式(20)看作为名义系统。
S4:确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
其中,所述步骤S4包括以下步骤:
S401:采用单隐层神经网络构建评价网络表征最优代价函数Vi(xia)为
将式(21)对xia求偏导数,得:
S402:将局部评价网络(21)由下式估计,得到未知权重Wic;
式中,Γiη为正常数;
定义局部Hamiltonian函数为:
将式(25)与局部最优Hamiltonian函数(27)进行比较,得到:
||δi||≤δicM (29);
式中,Γic2为正常数,局部评价网络的权值估计误差的更新律设计如下:
则得出的(30)-(31)即为所述自适应嵌套更新律;
S405:构建第i个模块子系统性能指标函数为:
确定式(33)微分形式即Lyapunov方程为:
将理想的局部最优运动控制子系统设计为:
将式(37)通过变换,得到:
式(39)即为辨识后的局部最优运动控制子系统,从而获得第i个模块子系统的期望轨迹。
S5:根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统。
其中,考虑各模块子系统的力/运动控制任务,结合拉格朗日反馈法,将力控制子系统设计为:
S6:将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统。
其中,运动控制子系统与力控制子系统合成将式(39)与式(40)进行合成,设计基于终端任务指派的可重构机械臂协同力/运动控制系统为:
使用该控制系统对可重构机械臂进行协同力/运动控制。
为实现上述目的,本发明另外还提供一种基于终端任务指派的可重构机械臂协同力/运动控制系统,包括有:
模型分解与终端任务协同指派模块,用于构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统,完成终端任务协同指派;
模型辨识模块,针对子系统动力学模型,用关联子系统的期望状态代替其实际状态,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;
运动控制子系统模块,用于设计辅助系统,确定子系统的跟踪误差动力学系统;
评价网络模块,用于确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
力控制子系统模块,用于根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统;以及;
控制系统合成模块,用于将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统,进而实现基于终端任务指派的可重构机械臂协同力/运动控制。
本发明所提供的基于终端任务指派的可重构机械臂协同力/运动控制系统与方法在进行软件实现时,软件程序设计思想及实现过程如图5所示,软件程序被处理器执行时能够实现上述的可重构机械臂协同力/运动控制方法的步骤,所述程序采用MATLAB语言编写,并生成.m文件进行软件封装,协同运动/力控制结果以Word、Excel保存或者图表的形式显示,程序运行时,通过点击“Run”按钮,控制方法即可触发。
整个软件程序采用如式(41)所示系统,其中局部运动控制子系统如式(39)所示,局部输入矩阵如式(16)所述,局部评价网络采用4-5-1的结构,即:4个输入神经元,5个隐藏神经元和1个输出神经元,激活函数为评价网络的自适应嵌套更新律如式(30)-(31),控制器及鲁棒分散观测器各参数设置如表1所示,其中为单位矩阵。
表1 控制器参数
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (8)
1.一种基于终端任务指派的可重构机械臂协同力/运动控制方法,其特征在于,包括以下步骤:
S1:构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统;
S2:针对子系统动力学模型,用关联子系统的期望状态代替其实际状态,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;
S3:设计辅助系统,确定子系统的跟踪误差动力学系统;
S4:确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
S5:根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统;
S6:将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统。
2.根据权利要求1所述的一种基于终端任务指派的可重构机械臂协同力/运动控制方法,其特征在于:所述步骤S1包括以下步骤:
S101:构建自由度为n的可重构机械臂的动力学模型为:
式中,是关节位移向量,qi(t)为关节i的位移,i=1,...,n,t为时间变量,为惯性矩阵,为哥氏力和离心力项,为重力项,为外部干扰,为施加的控制力拒。为m维动态约束函数,为与关节和任务空间的速度有关的雅可比矩阵,为拉格朗日乘子,表示可重构机械臂末端与动态约束面之间的相互作用力;
S102:在Φ(q,t)动态约束下,确定关节坐标q为:
从而将n-m个受约束的关节变量由n-m个线性独立的自由关节变量表示;
S103:计算出雅可比矩阵J(q)为:
式中:
3.根据权利要求2所述的一种基于终端任务指派的可重构机械臂协同力/运动控制方法,其特征在于:所述步骤S2包括以下步骤:
式中:
S202:将关联子系统的期望状态代替其实际状态,将交联项改写为:
式中,xkd(k=1,2,...,i-1,i+1,...,n)表示第k个关联模块子系统的期望状态,是取代后的交联项,其中包含从提取的第i个关节模块的状态信息和第k个关节模块的期望状态信息,表示取代误差;
将式(5)进一步表示为:
将式(7)合并变换为:
S203:令非线性函数fi(xi,xkd),gi(xi)和Δhi(xi,xkd)满足Lipschitz连续条件,关节模块的动力学模型(8)是可控的,且fi(0,0)=0为系统的一个平衡点;
||Xid||≤qiM (9)
式中,交联项Δhi(xi,xkd)满足Lipschitz连续条件,即:
式中,Ek=||xk-xkd||,且dik>0是未知的Lipschitz常数;
根据式(11),将式(7)改写为:
式中,为第i个模块子系统状态xi的观测值,Lio=diag[li1o,li2o]为正定对角增益矩阵,为非线性函数Fi(xi,xkd,τi)的观测值,是WiF的估计值,是引入观测值的径向基函数σiF(xi,xkd,τi),为鲁棒项,其中,和通过下列自适应更新律更新;
式中,学习率Γiδ和ΓiF均为正常数;
4.根据权利要求1所述的一种基于终端任务指派的可重构机械臂协同力/运动控制方法,其特征在于:所述步骤S3包括以下步骤:
S301:设计辅助系统为:
式中,xid为Lipschitz连续函数;
S302:定义第i个模块子系统的跟踪误差为ei=xi-xid,确定子系统的跟踪误差动力学系统为:
式中,fia(xia)=[fi(ei+xid)-fid(xid),fid(xid)]T,gio(xia)=[gi(ei+xid),0]T,
Δhia(xia)=[Δhi(x,xkd),0]T和xa=[x,xd]T;
将可重构机械臂的模块子系统的名义增广动力学表示为:
在式(20)中,将式(19)中的gia(xia)Jiλ+Δhia(xia)去掉且作为干扰动项处理,将式(20)看作为名义系统。
5.根据权利要求4所述的一种基于终端任务指派的可重构机械臂协同力/运动控制方法,其特征在于:所述步骤S4包括以下步骤:
S401:采用单隐层神经网络构建评价网络表征最优代价函数Vi(xia)为:
将式(21)对xia求偏导数,得:
S402:将局部评价网络(21)由下式估计,得到未知权重Wic,
式中,Γiη为正常数;
定义局部Hamiltonian函数为:
将式(25)与局部最优Hamiltonian函数(27)进行比较,得到:
||δi||≤δicM (29);
式中,Гic2为正常数,局部评价网络的权值估计误差的更新律设计如下:
则得出的(30)-(31)即为所述自适应嵌套更新律;
S405:构建第i个模块子系统性能指标函数为:
确定式(33)微分形式即Lyapunov方程为:
求解如下的局部HJB方程获取局部最优代价函数Vi *(xia),
且满足Vi *(0)=0,根据式(34)和式(35),式(28)可进一步表示为:
将式(37)通过变换,得到:
S406:对非线性函数gia和Vi *(xia)进行辨识,将式(37)近似为:
8.一种基于终端任务指派的可重构机械臂协同力/运动控制系统,其特征在于,包括有:
模型分解与终端任务协同指派模块,用于构建可重构机械臂子系统的动力学模型,根据可重构机械臂系统特有的模块化属性,从系统整体动力学模型中分离出各个关节模块的局部变量,将其分解为多个相互交联的子系统集合,并利用雅可比矩阵映射关系将末端接触力指派给各子系统,完成终端任务协同指派;
模型辨识模块,针对子系统动力学模型,用关联子系统的期望状态代替其实际状态,设计基于神经网络的鲁棒分散观测器,获得子系统的局部输入矩阵;
运动控制子系统模块,用于设计辅助系统,确定子系统的跟踪误差动力学系统;
评价网络模块,用于确定总体误差项和权值近似误差,构建自适应嵌套更新律,更新评判网络权值,从而确定未知权重估计值,求解HJB方程得到运动控制子系统;
力控制子系统模块,用于根据各模块子系统的力/运动控制任务,利用拉格朗日乘子反馈法得到力控制子系统;以及;
控制系统合成模块,用于将运动控制子系统与力控制子系统合成,构建基于终端任务指派的可重构机械臂协同力/运动控制系统,进而实现基于终端任务指派的可重构机械臂协同力/运动控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110553169.XA CN113276114B (zh) | 2021-05-20 | 2021-05-20 | 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110553169.XA CN113276114B (zh) | 2021-05-20 | 2021-05-20 | 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113276114A true CN113276114A (zh) | 2021-08-20 |
CN113276114B CN113276114B (zh) | 2022-09-16 |
Family
ID=77280494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110553169.XA Active CN113276114B (zh) | 2021-05-20 | 2021-05-20 | 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113276114B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114406996A (zh) * | 2021-12-30 | 2022-04-29 | 长春工业大学 | 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统 |
WO2023226070A1 (zh) * | 2022-05-26 | 2023-11-30 | 天津赛象科技股份有限公司 | 用于机械臂运动控制的非线性自适应控制方法及系统 |
CN118514085A (zh) * | 2024-07-22 | 2024-08-20 | 中国人民解放军国防科技大学 | 基于数据驱动的高维度机器人控制方法、装置及终端设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105196294A (zh) * | 2015-10-29 | 2015-12-30 | 长春工业大学 | 采用位置测量的可重构机械臂分散控制系统及控制方法 |
US20160151909A1 (en) * | 2014-12-01 | 2016-06-02 | Spin Master Inc. | Reconfigurable robotic system |
CN107309873A (zh) * | 2017-06-20 | 2017-11-03 | 广州视源电子科技股份有限公司 | 机械臂运动控制方法和系统 |
CN108789417A (zh) * | 2018-07-30 | 2018-11-13 | 长春工业大学 | 基于自适应动态规划的可重构机械臂保代价分散控制方法 |
CN111958606A (zh) * | 2020-09-10 | 2020-11-20 | 浙江协力机器人技术有限公司 | 一种应用于多自由度机械臂的分布式鲁棒跟踪控制方法 |
CN111993417A (zh) * | 2020-08-04 | 2020-11-27 | 北京航空航天大学 | 一种基于rbf神经网络的机械臂自适应阻抗控制方法 |
-
2021
- 2021-05-20 CN CN202110553169.XA patent/CN113276114B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160151909A1 (en) * | 2014-12-01 | 2016-06-02 | Spin Master Inc. | Reconfigurable robotic system |
CN105196294A (zh) * | 2015-10-29 | 2015-12-30 | 长春工业大学 | 采用位置测量的可重构机械臂分散控制系统及控制方法 |
CN107309873A (zh) * | 2017-06-20 | 2017-11-03 | 广州视源电子科技股份有限公司 | 机械臂运动控制方法和系统 |
CN108789417A (zh) * | 2018-07-30 | 2018-11-13 | 长春工业大学 | 基于自适应动态规划的可重构机械臂保代价分散控制方法 |
CN111993417A (zh) * | 2020-08-04 | 2020-11-27 | 北京航空航天大学 | 一种基于rbf神经网络的机械臂自适应阻抗控制方法 |
CN111958606A (zh) * | 2020-09-10 | 2020-11-20 | 浙江协力机器人技术有限公司 | 一种应用于多自由度机械臂的分布式鲁棒跟踪控制方法 |
Non-Patent Citations (2)
Title |
---|
朱明超等: "基于观测器的可重构机械臂分散自适应模糊控制", 《控制与决策》 * |
李元春等: "环境约束可重构机械臂模块化力/位置控制", 《上海交通大学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114406996A (zh) * | 2021-12-30 | 2022-04-29 | 长春工业大学 | 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统 |
WO2023226070A1 (zh) * | 2022-05-26 | 2023-11-30 | 天津赛象科技股份有限公司 | 用于机械臂运动控制的非线性自适应控制方法及系统 |
CN118514085A (zh) * | 2024-07-22 | 2024-08-20 | 中国人民解放军国防科技大学 | 基于数据驱动的高维度机器人控制方法、装置及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113276114B (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113276114B (zh) | 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 | |
CN108803316B (zh) | 针对多智能体系统执行器故障的主动容错控制方法 | |
CN102681489B (zh) | 多轴联动数控系统运动平稳性和轮廓加工精度控制方法 | |
CN110900598B (zh) | 机器人三维运动空间动作模仿学习方法和系统 | |
CN108255060B (zh) | 基于极限学习机的船舶动力定位自抗扰控制方法 | |
CN114047773A (zh) | 一种基于扩张状态观测器的水下集矿机器人反步滑模自适应姿态控制方法 | |
CN112527016B (zh) | 一种智能集群一体化容错时变编队控制方法及系统 | |
CN114237041B (zh) | 一种基于预设性能的空-地协同固定时间容错控制方法 | |
CN109901603B (zh) | 一种输入时延下多空间飞行器姿态协同控制方法 | |
CN110703692A (zh) | 一种基于虚拟结构法的多移动机器人分布式预测控制方法 | |
CN107065897A (zh) | 三自由度直升机显式模型预测控制方法 | |
Kosmatopoulos | Control of unknown nonlinear systems with efficient transient performance using concurrent exploitation and exploration | |
CN116661307A (zh) | 非线性系统执行器故障ppb-siadp容错控制方法 | |
CN111221311A (zh) | 基于参数变分法的复杂网络分布式脉冲同步方法及系统 | |
CN113885548B (zh) | 一种多四旋翼无人机输出约束状态一致博弈控制器 | |
CN117311147B (zh) | 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 | |
Chen et al. | Neuroadaptive tracking control of affine nonlinear systems using echo state networks embedded with multiclustered structure and intrinsic plasticity | |
Fu et al. | Adaptive optimal control of unknown nonlinear systems with different time scales | |
Wen et al. | Consensus protocol based attitudes coordination control for Underwater Glider formation | |
Anuradha et al. | Direct inverse neural network control of a continuous stirred tank reactor (CSTR) | |
CN114406996B (zh) | 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统 | |
CN116774576A (zh) | 基于神经网络间接估计的水下航行器动力学黑盒建模方法 | |
CN114012733A (zh) | 一种用于pc构件模具划线的机械臂控制方法 | |
Hirzinger et al. | Towards a new generation of multisensory light-weight robots with learning capabilities | |
CN115963859B (zh) | 基于全驱系统理论的航天器集群分簇协同控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |