CN115139301A - 基于拓扑结构自适应神经网络的机械臂运动规划方法 - Google Patents

基于拓扑结构自适应神经网络的机械臂运动规划方法 Download PDF

Info

Publication number
CN115139301A
CN115139301A CN202210795270.0A CN202210795270A CN115139301A CN 115139301 A CN115139301 A CN 115139301A CN 202210795270 A CN202210795270 A CN 202210795270A CN 115139301 A CN115139301 A CN 115139301A
Authority
CN
China
Prior art keywords
mechanical arm
time
neural network
model
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210795270.0A
Other languages
English (en)
Other versions
CN115139301B (zh
Inventor
谢吉龙
张智军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202210795270.0A priority Critical patent/CN115139301B/zh
Publication of CN115139301A publication Critical patent/CN115139301A/zh
Application granted granted Critical
Publication of CN115139301B publication Critical patent/CN115139301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1607Calculation of inertia, jacobian matrixes and inverses

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Feedback Control In General (AREA)
  • Numerical Control (AREA)

Abstract

本发明公开了基于拓扑结构自适应神经网络的机械臂运动规划方法,包括如下步骤:根据雅克比矩阵和预设的机械臂末端的目标轨迹,建立机械臂的逆运动学模型;根据机械臂实际的关节物理极限约束参数,建立机械臂的物理极限双端不等式约束;将机械臂的逆运动学模型、物理极限双端不等式约束制订为时变二次规划模型;设计带惩罚函数的拓扑结构自适应神经网络求解时变二次规划模;将求解得到的机械臂的各个角度信息传递给机械臂的下位机控制器,下位机控制器驱动机械臂运动,完成目标轨迹跟踪任务。本发明采用拓扑结构自适应神经网络对冗余度机械重复运动过程进行求解,计算精度大大提高,具有收敛速度快、实时性好、鲁棒性强的优点。

Description

基于拓扑结构自适应神经网络的机械臂运动规划方法
技术领域
本发明属于冗余度机械臂重复运动规划方法,特别涉及一种基于拓扑结构自适应神经网络的机械臂运动规划方法。
背景技术
机械臂的重复运动在工业生产中是一种及其常见的运动。重复运动要求机械臂的各个关节在完成一次末端轨迹闭合的周期运动之后都能回复到其初始状态,在这种情况下能保证机械臂每次周期运动的初始状态都是一致的。如果在完成一次周期运动之后,机械臂的关节并没有全部回到其初始状态,则视为存在关节偏移现象。如果在周期运动中发生了关节偏移现象,那么机械臂运动控制的精度将会下降,或者需要额外的复位调节过程,导致生产的效率严重下降。因此,在实际的机械臂控制中,为了实现机械臂的周期运动,必须保证机械臂在一个任务周期内不能出现关节漂移现象。同时,机械臂的实际运动中,可能会受到各种约束条件以保证机械臂在实际应用中的安全,比如:关节物理极限约束。几乎对于所有的机械臂来说都存在着关节物理极限。如果算法没有考虑到关节物理极限躲避,那么算法产生的控制量将很容易超出机械臂的实际关节极限。一般的关节物理躲避算法的思路是将机械臂的关节物理极限改写为不等式双端约束,再将它考虑到二次规划方案中。
传统的机械臂的运动学求解方法是基于伪逆的方法。然而,由于伪逆方法需要计算矩阵的逆,并且机械臂在实际应用中面临的任务越来越多样化,所以在实际应用中难以实时处理较为复杂的任务。相较于伪逆方法,基于优化问题的解决机械臂的运动规划的方法应用更为广泛。求解优化问题的方法有数值方法求解器和神经网络求解器。由于数值迭代的特征,数值方法求解器具有方便在数字计算机上控制以及便于产生驱动电机的脉冲信号的优点。例如,94LVI数值方法是一种用于求解了基于等式约束的二次规划问题,并且应用在了机械臂的运动规划上,但数值方法需要花费计算机大量的资源去进行迭代计算,增加计算时间,难以应用于机械臂的实时运动规划。相较于数值方法求解器,基于神经动力学的递归神经网络求解器具有并行计算机制,被认为是一种性能更强的实时优化问题的求解器。这种神经网络求解器由于计算的高效性以及硬件实施的便利性被广泛应用于多种实际应用场合。Zhang等人提出了一种递归神经网络求解器,称作零化神经网络,该求解器被用来求解时变的二次规划问题(Zhang Y.,Ge S..A General Recurrent Neural NetworkModel for Time-Varying Matrix Inversion[A].In:42nd IEEE InternationalConference on Decision and Control[C].Maui,HI,USA:IEEE,2003.6:6169-6174.),并用于求解冗余度机械臂运动规划问题。由于利用了参数的导数信息,零化神经网络能够成功求得时变二次规划问题的最优解。然而,这种传统的零化神经网络只能在无限时间内逼近理论最优解。为了克服机器人的关节物理约束问题,一种基于线性变分不等式的原对偶神经网络被提出求解对应的二次规划问题,并且应用于一种冗余度机器人末端轨迹跟踪的任务中。但是LVI-PDNN无法达到指数型的收敛速度,为了充分利用机器人的运动规划问题的时变特点,Zhang等人设计出了具有超指数收敛效果的变参收敛微分神经网络(Z.Zhang,Y.Lu,L.Zheng,S.Li,Z.Yu,and Y.Li,“A new varying-parameter convergent-differential neural-network for solving time-varying convex QP problemconstrained by linear-equality,”IEEE Transactions on Automatic Control,vol.63,no.12,pp.4110–4125,2018.),并且将该网络应用于冗余度机器人的重复运动规划方案中。但是变参收敛微分神经网络无法有效的求解机械臂运动规划方案中的不等式约束问题,例如:关节极限物理约束。
综上,行业内急需研发一种具有指数型收敛速度,并且有效求解受物理极限约束的机械臂运动规划问题的神经网络求解器或者求解方法。
发明内容
本发明的目的是为了克服以上现有技术存在的不足,提供了一种具有指数型收敛速度且能有效求解受物理极限约束的基于拓扑结构自适应神经网络的机械臂运动规划方法。
本发明至少通过如下技术方案之一实现。
基于拓扑结构自适应神经网络的机械臂运动规划方法,包括如下步骤:
S1、根据机械臂的结构参数,建立机械臂的模型,获得末端执行器的雅克比矩阵,根据雅克比矩阵和预设的机械臂末端的目标轨迹,建立机械臂的逆运动学模型;
S2、根据机械臂实际的关节物理极限约束参数,在速度层上建立机械臂的物理极限不等式约束;
S3、将机械臂的逆运动学模型、物理极限双端不等式约束制订为受约束的时变二次规划模型,其中将重复运动指标作为时变二次规划模型的性能指标;
S4、建立带惩罚函数的拓扑结构自适应神经网络,求解受约束的时变二次规划模型;则基于拓扑结构自适应神经网络的解的前n个元素就是最优关节角速度
Figure BDA0003735536540000031
对最优关节角速度
Figure BDA0003735536540000032
积分获得Θ*,Θ*即为机械臂的最优关节角度;
S5、将求解的机械臂的各个角度信息传递给机械臂的下位机控制器,下位机控制器驱动机械臂运动,完成目标轨迹跟踪任务。
进一步的,步骤S2中的关节物理极限约束参数包括:关节角度约束和角速度约束,在速度层上建立的机械臂的物理极限双端不等式约束为:
Figure BDA0003735536540000033
其中的ζ-∈Rn,ζ+∈Rn定义为:
Figure BDA0003735536540000034
Figure BDA0003735536540000035
其中Θ∈Rn,Θ-和Θ+分别表示机械臂的关节角度的上下物理极限;
Figure BDA0003735536540000036
表示机械臂各个关节的角速度,
Figure BDA0003735536540000037
Figure BDA0003735536540000038
分别表示机械臂关节角速度的上下物理极限;
Figure BDA0003735536540000039
Figure BDA00037355365400000310
Figure BDA00037355365400000311
Figure BDA00037355365400000312
其中β是一个在[0,1]区间的正数,ζ-∈Rn表示角速度
Figure BDA00037355365400000313
的双端约束下极限,ζ+∈Rn表示角速度
Figure BDA00037355365400000314
的双端约束上极限,
Figure BDA00037355365400000315
Figure BDA00037355365400000316
分别表示θ-和θ+的第一界线系数和第二界线系数;η1和η2分别表示的ζ-和ζ+的第一界线系数和第二界线系数,α1、α2均为常数系数,分别用于表示
Figure BDA0003735536540000041
与Θ-
Figure BDA0003735536540000042
与Θ+的倍数关系。
进一步的,将物理极限双端不等式约束
Figure BDA0003735536540000043
转化为物理极限单侧不等式约束;
将机械臂的逆运动学模型、物理极限单侧不等式约束制订为时变二次规划模型。
进一步的,物理极限单侧不等式约束为:
Figure BDA0003735536540000044
其中K=[E,-E]T∈R2n×n,e=[ζ+,-ζ-]T∈R2n,其中E代表一个n×n的单位矩阵,K表示单侧不等式约束的第一特征矩阵,R2n表示K的行数是2n,e表示单侧不等式约束的第二特征矩阵。
进一步的,物理极限单侧不等式约束使用指数型惩罚模型进行转化:
带惩罚策略的拓扑结构自适应神经网络的惩罚模型为指数型惩罚模型P(t),指数型惩罚模型P(t)的结构为:
Figure BDA0003735536540000045
其中σ>0,表示平滑约束系数,p是一个接近于0的正数,ei和Ki分别是向量e和矩阵K的第i维行向量,Θ表示机械臂各个关节的角度,n表示表达式约束项数相关常数,t表示时变系统的时间变量,
Figure BDA0003735536540000046
表示机械臂关节角速度、i表示机械臂的第i个关节角;
使用指数型惩罚模型P(t)将时变二次规划模型的控制方案中的不等式约束项转化为性能指标中的惩罚项,即:
Figure BDA0003735536540000047
Figure BDA0003735536540000048
其中,b表示机械臂各个关节角度增量,JE表示机械臂的雅可比矩阵,
Figure BDA0003735536540000049
表示机械臂末端执行器的速度向量。
进一步的,带惩罚项的时变二次规划模型将时变二次规划模型使用拉格朗日乘子法转化为矩阵等式模型:
将时变二次规划模型使用拉格朗日乘子法转化为矩阵等式模型,转化后可以得到如下时变矩阵模型:
B(t)y(t)=G(t)
其中
Figure BDA0003735536540000051
Figure BDA0003735536540000052
λ是拉格朗日算子,B(t)表示机械臂时变二次规划模型的时变矩阵的第一特征项,E表示单位矩阵,m、n分别表示矩阵的行数、列数,y(t)表示由关节角速度
Figure BDA0003735536540000053
和拉格朗日算子λ构成的向量,G(t)表示机械臂时变二次规划模型的时变矩阵的第二特征项。
进一步的,时变矩阵模型使用拓扑结构自适应神经网络来求解:
定义误差函数为:
ε(t)=B(t)y(t)-G(t)∈Rn+m
为了使误差收敛到零,采用如下的神经动力学准则:
Figure BDA0003735536540000054
其中ψ(·):Rn+m→Rn+m是激活函数,ψ(·)是单调递增的奇函数,γ为表示调节神经网络收敛速率的常数,
Figure BDA0003735536540000055
表示迭代次数,
Figure BDA0003735536540000056
Figure BDA0003735536540000057
分别表示自适应参数第一特征项、自适应参数第二特征项和自适应参数第三特征项;
根据神经动力学准则,并进行同类型合并,得到带惩罚策略的拓扑结构自适应神经网络:
Figure BDA0003735536540000058
其中,
Figure BDA0003735536540000059
Figure BDA00037355365400000510
Figure BDA0003735536540000061
其中,R(t)表示机械臂时变二次规划模型的时变矩阵的第三特征项,T(t)表示机械臂时变二次规划模型的时变矩阵的第四特征项,V(t)表示机械臂时变二次模型的时变矩阵的第五特征项;其中
Figure BDA0003735536540000062
表示与关节角相关的向量y(t)的导数,
Figure BDA0003735536540000063
表示雅克比矩阵的导数、
Figure BDA0003735536540000064
表示关节偏移的响应的导数、
Figure BDA0003735536540000065
表示关节末端执行器的加速度、
Figure BDA0003735536540000066
表示单侧不等式约束的第一特征项的转置的导数、
Figure BDA0003735536540000067
表示单侧不等式约束的第二特征项的导数。
进一步的,迭代次数
Figure BDA0003735536540000068
自适应参数第一特征项
Figure BDA0003735536540000069
自适应参数第二特征项
Figure BDA00037355365400000610
和自适应参数第三特征项
Figure BDA00037355365400000611
定义为:
Figure BDA00037355365400000612
是一个用来表示迭代次数的正整数,初始值是1;当时间变量t增量为t0时,t0是预设的常数,认为神经网络执行一次迭代运算,
Figure BDA00037355365400000613
的值自增1;
Figure BDA00037355365400000614
结构上是等差数列:
Figure BDA00037355365400000615
c是常数代表公差,A(0)=1;
Figure BDA00037355365400000616
是跟迭代次数
Figure BDA00037355365400000617
和输出误差均值相关的变量,用来表示输出误差均值对神经网络拓扑结构的修正项,N(0)=0;
Figure BDA00037355365400000618
是跟迭代次数
Figure BDA00037355365400000619
和输出误差的标准差相关的变量,用来表示输出误差的标准差对神经网络拓扑结构的修正项,M(0)=0;
Figure BDA00037355365400000620
Figure BDA00037355365400000621
进一步的表达式如下:
在第
Figure BDA00037355365400000622
次迭代结束后,在时间变量t的增量t0内选取n0个点,分别为
Figure BDA00037355365400000623
Figure BDA00037355365400000624
在每个时刻t0i,i=1,2,3,…,n0,计算误差的二范数‖ε(t0i)‖2,进一步计算第
Figure BDA00037355365400000625
次迭代过程中‖ε(t)‖2的平均值为:
Figure BDA00037355365400000626
Figure BDA00037355365400000627
次迭代过程中‖ε(t)‖2的标准差为:
Figure BDA0003735536540000071
根据实际的误差精度需求,将期望的稳态误差均值和稳态误差标准差分别设为eEA和eES;当实际误差均值
Figure BDA0003735536540000072
以及实际误差标准差
Figure BDA0003735536540000073
时,停止迭代;在每一次迭代过程中,
Figure BDA0003735536540000074
Figure BDA0003735536540000075
其中α是常数,用来表示输出误差均值与期望误差均值的差的绝对值对收敛参数
Figure BDA0003735536540000076
的影响因子;b是常数,用来表示输出误差标准差与期望误差标准差的差的绝对值对收敛参数
Figure BDA0003735536540000077
的影响因子。
进一步的,结构参数包括连杆长度和自由度个数。
进一步的,所述机械臂的逆运动学模型为:
f(θ)=rE
其中θ∈Rn表示机械臂各个关节的角速度,rE∈Rm为预设的机械臂的末端轨迹,f(·)为非线性映射模型,m表示机械臂的工作空间的维度,n为机械臂的关节个数。
本发明与现有的冗余度机械臂重复运动规划方案相比,具有如下优点:
1、与经典的递归神经网络求解器相比,本发明采用带惩罚策略的拓扑结构自适应神经网络求解时变二次规划模型,收敛速度更快,计算精度更高,可以有效解决二次规划模型中的不等式约束条件。
2、与传统的基于伪逆的方法相比,本发明通过二次规划方案解决机械臂的运动规划模型,具有实时性好的特点,能够考虑多种约束条件;
3、与数值方法求解器相比,本发明属于神经网络求解器,计算速度快,效率更高。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为实施例的基于拓扑结构自适应神经网络的机械臂运动规划方法的结构图;
图2为实施例的基于拓扑结构自适应神经网络的机械臂运动规划方法的总体示意图;
图3为实施例惩罚策略的拓扑结构自适应神经网络的电路连线图;
图4a为实施例二六连杆机械臂的模拟运动轨迹图;
图4b为机械臂的轨迹跟踪误差图;
图5a为实施例三六连杆机械臂的模拟运动轨迹图;
图5b为实施例三关节受到物理极限约束的实时状态图;
图5c为实施例三机械臂的轨迹跟踪误差图;
图6为实施例基于拓扑结构自适应神经网络的机械臂运动规划方法流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1
图1、图6所示,本发明是基于拓扑结构自适应神经网络的机械臂运动规划方法,主要由问题提出、问题转化和问题解决三个部分组成。首先根据预设的机械臂末端轨迹和雅克比矩阵建立速度层上的逆运动学模型,并将机械臂的运动规划模型设计为一个时变二次规划模型,其中机械臂重复运动设计为优化指标,逆运动学模型设计为一个等式约束条件,物理极限约束设计为双端不等式约束。使用拉格朗日方程将二次规划模型转化为一个时变矩阵模型,最后通过所设计的带惩罚策略的拓扑结构自适应神经网络对时变矩阵模型进行求解。具体如下:
首先,考虑机械臂逆运动学模型为:
f(Θ)=rE (1)
其中
Figure BDA0003735536540000081
表示机械臂各个关节的角速度,rE∈Rm为预设的机械臂的末端轨迹,f(·)为一个非线性映射模型。m表示机械臂的工作空间的维度,如果是三维空间,则m=3。n为机械臂的关节个数。方程(1)表示由已知的末端位置,求机械臂各个关节对应时刻的角度信息,由于方程中(1)的f(·)函数的非线性,很难获得方程(1)的解析解,故为了将方程(1)线性化,在速度层上考虑问题。求机械臂模型(1)两边关于时间的导数得:
Figure BDA0003735536540000082
其中JE∈Rm×n为机械臂的雅克比矩阵,
Figure BDA0003735536540000083
Figure BDA0003735536540000084
分别为机械臂关节角度和末端轨迹关于时间的导数。
几乎对于所有的机械臂来说都存在着关节物理极限。如果算法没有考虑到关节物理极限躲避,那么算法产生的控制量将很容易超出机械臂的实际关节极限。一般的关节物理躲避算法的思路是将机械臂的关节物理极限改写为双端不等式约束:
Figure BDA0003735536540000091
其中Θ∈Rn表示机械臂各个关节的角度,Θ-和Θ+分别表示机械臂的关节角度的上下物理极限。
Figure BDA0003735536540000092
Figure BDA0003735536540000093
分别表示机械臂关节角速度的上下物理极限。考虑到在本文中机器人的逆运动学问题是在速度层解决的,将上式转化为速度层上的双端约束条件:
Figure BDA0003735536540000094
其中的ζ-,ζ+定义为:
Figure BDA0003735536540000095
Figure BDA00037355365400000918
其中:
Figure BDA0003735536540000096
Figure BDA0003735536540000097
Figure BDA0003735536540000098
Figure BDA0003735536540000099
β是一个在[0,1]区间的正数,ζ-∈Rn表示角速度
Figure BDA00037355365400000910
的双端约束下极限,ζ+∈Rn表示角速度
Figure BDA00037355365400000911
的双端约束上极限,
Figure BDA00037355365400000912
Figure BDA00037355365400000913
分别表示θ-和θ+的第一界线系数和第二界线系数;η1和η2分别表示的ζ-和ζ+的第一界线系数和第二界线系数,α1、α2均为常数系数,分别用于表示
Figure BDA00037355365400000914
与Θ-
Figure BDA00037355365400000915
与Θ+的倍数关系。
为了简化运算,双侧不等式约束
Figure BDA00037355365400000916
转化为一个单侧不等式约束,即:
Figure BDA00037355365400000917
其中K=[E,-E]T∈R2n×n,e=[ζ+,-ζ-]T∈R2n,此时受物理极限约束的机械臂的二次规划模型为:
Figure BDA0003735536540000101
其中b设计为b=ω(Θ(t)-Θ(0)),其中参数ω为关节偏移的响应系数,Θ表示机械臂各个关节的角度,
Figure BDA0003735536540000102
表示机械臂关节角速度。
为了解决上述的时变二次规划模型(3)-(5),提出一种指数型惩罚模型P(t),其作用是将含有不等式约束和等式约束的时变二次规划模型其转化为只受到等式约束的时变二次规划模型,而不等式约束等价为目标优化项(性能指标,min.后面的优化项)中的惩罚项。指数型惩罚模型P(t)的结构为:
Figure BDA0003735536540000103
其中σ>0,p是一个接近于0的正数,ei和Ki分别是向量e和矩阵K的第i维行向量,Θ表示机械臂各个关节的角度,n表示表达式约束项数相关常数,t表示时变系统的时间变量。使用惩罚模型P(t)后,时变二次规划模型(3)-(5)可以转化为:
Figure BDA0003735536540000104
上述的二次规划模型可以通过拉格朗日算法转化为一个矩阵等式模型,构造拉格朗日模型如下,
Figure BDA0003735536540000105
其中λ为拉格朗日乘子。用拉格朗日算法解决(8)式得到如下模型,
Figure BDA0003735536540000106
模型(9)可以表示为时变矩阵模型:B(t)y(t)=G(t)(10),其中
Figure BDA0003735536540000107
Figure BDA0003735536540000108
Figure BDA0003735536540000111
为了求解时变矩阵模型(10),定义误差函数为:
ε(t)=B(t)y(t)-G(t) (11)
通过神经动力学的方法,设计误差以如下方式收敛于零:
Figure BDA0003735536540000112
其中γ为调节收敛速率的常参数,
Figure BDA0003735536540000113
表示迭代次数,
Figure BDA0003735536540000114
Figure BDA0003735536540000115
分别表示自适应参数第一特征项、自适应参数第二特征项和自适应参数第三特征项,Φ(·)为激活函数结构。
迭代次数
Figure BDA0003735536540000116
自适应参数第一特征项
Figure BDA0003735536540000117
自适应参数第二特征项
Figure BDA0003735536540000118
和自适应参数第三特征项
Figure BDA0003735536540000119
的具体定义为:
Figure BDA00037355365400001110
是一个正整数用来表示迭代次数,它的初始值是1;当时间常量t增量为t0时,t0是一个常数,认为神经网络执行了一次迭代运算,
Figure BDA00037355365400001111
的值自增1;
Figure BDA00037355365400001112
结构上是一个等差数列,
Figure BDA00037355365400001113
c是一个常数代表公差,A(0)=1;
Figure BDA00037355365400001114
是一个跟迭代次数
Figure BDA00037355365400001115
和输出误差均值相关的变量,用来表示输出误差均值对神经网络拓扑结构的修正项,N(0)=0;
Figure BDA00037355365400001116
是一个跟迭代次数
Figure BDA00037355365400001117
和输出误差的标准差相关的变量,用来表示输出误差的标准差对神经网络拓扑结构的修正项,M(0)=0。
Figure BDA00037355365400001118
Figure BDA00037355365400001119
进一步的表达式如下:
在第
Figure BDA00037355365400001120
次迭代结束后,在时间变量t的增量t0内选取n0个点,分别为
Figure BDA00037355365400001122
Figure BDA00037355365400001127
在每个时刻t0i,i=1,2,3,…,n0,计算误差的二范数‖ε(t0i)‖2,进一步计算第
Figure BDA00037355365400001123
次迭代过程中‖ε(t)‖2的平均值为:
Figure BDA00037355365400001124
以及第
Figure BDA00037355365400001125
次迭代过程中‖ε(t)‖2的标准差为:
Figure BDA00037355365400001126
根据实际的误差精度需求,将期望的稳态误差均值和稳态误差标准差分别设为eEA和eES。当实际误差均值
Figure BDA0003735536540000121
以及实际误差标准差
Figure BDA0003735536540000122
时,停止迭代。在每一次迭代过程中:
Figure BDA0003735536540000123
其中a是常数,用来表示输出误差均值与期望误差均值的差的绝对值对收敛参数
Figure BDA0003735536540000124
的影响因子;b是常数,用来表示输出误差标准差与期望误差标准差的差的绝对值对收敛参数
Figure BDA0003735536540000125
的影响因子。拓扑结构自适应神经网络自适应调参过程图如图2所示。
将模型(11)和模型(12)结合,可得带惩罚策略的拓扑结构自适应神经网络求解器,即:
Figure BDA0003735536540000126
其中
Figure BDA0003735536540000127
Figure BDA0003735536540000128
Figure BDA0003735536540000129
带惩罚策略的拓扑结构自适应神经网络的电路连线图如图3所示。图中的Adaptive Controller是自适应控制器,图中的y1、y2…yn+k表示电路图的输出,b1,1、b1,2…bn+k,n+k表示机械臂时变二次规划模型的时变矩阵的第一特征项的子项,g1、g2…gn+k表示机械臂时变二次规划模型的时变矩阵的第二特征项的子项,r1,1、r1,2…rn+k,n+k表示机械臂时变二次规划模型的时变矩阵的第三特征项的子项。t1,1、t1,2…tn+k,n+k表示机械臂时变二次规划模型的时变矩阵的第四特征项,v1,1、v1,2…vn+k,n+k表示机械臂时变二次模型的时变矩阵的第五特征项的子项。
由模型(13)可以求得时变矩阵模型(10)的最优解y*,其前n项即为二次规划模型(3)-(5)的最优解
Figure BDA0003735536540000131
Figure BDA0003735536540000132
积分可得到冗余度机械臂关节角度的最优解Θ*。基于拓扑结构自适应神经网络的机械臂运动规划方法的总体的技术路线图如图4所示。
实施例二
在六连杆机械臂追踪五角星轨迹的方案实施过程中,机械臂初始位置关节角度设置为[1.685;2.873;-3.266;4.107;-1.51;-2.35]弧度,角度上极限设置为θ+=[5.1;5.1;5.1;5.1:5.1;5.1]弧度,角度下极限设置为θ-=[-5.1;-5.1;-5.1;-5.1;-5.1;-5.1]弧度,速度上极限设置为
Figure BDA0003735536540000133
速度下极限设置为
Figure BDA0003735536540000134
所使用的基于拓扑结构自适应神经网络求解器同样为:
Figure BDA0003735536540000135
将计算得到的关节速度进行积分得到关节角度最优解,再传送给机械臂控制器从而控制机械臂的运动,从而跟踪五角星轨迹。
图4a为六连杆机械臂的模拟运动轨迹,黑色曲线为机械臂运动轨迹,黑色粗曲线为期望的五角星轨迹。可以发现,通过使用基于拓扑结构自适应神经网络求解器方法,该六连杆机械臂依然很好的追踪了预期的四叶草轨迹。图4b为机械臂的轨迹跟踪误差图,其误差精度达到了10的-5次方,说明本发明的跟踪精度较高。
实施例三
考虑到物理双端约束和关节极限约束,在六连杆机械臂追踪蝴蝶轨迹的方案实施过程中,机械臂初始位置关节角度设置为[1.685;2.873;-3.266;4.107;-1.51;-2.35]弧度,角度上极限设置为θ+=[5.1;5.1;5.1;5.1:5.1;5.1]弧度,角度下极限设置为θ-=[-5.1;-5.1;-5.1;-5.1;-5.1;-5.1]弧度,速度上极限设置为
Figure BDA0003735536540000136
速度下极限设置为
Figure BDA0003735536540000137
Figure BDA0003735536540000138
所使用的基于拓扑结构自适应神经网络求解器同样为:
Figure BDA0003735536540000139
同时,考虑到物理双端约束和关节极限约束,假设求解过程中存在时变噪声干扰,将计算得到的关节速度进行积分得到关节角度最优解,再传送给机械臂控制器从而控制机械臂的运动,从而跟踪蝴蝶轨迹。
图5a为六连杆机械臂的模拟运动轨迹,其中黑色曲线为机械臂运动轨迹,黑色粗曲线为期望的蝴蝶轨迹。可以发现,通过使用一种基于拓扑结构自适应神经网络求解器方法,即使在时变噪声的该六连杆机械臂依然很好的追踪了预期的蝴蝶轨迹。图5b为关节受到物理极限约束的实时状态图,关节角度被有效地限制在可行域范围内。图5c为机械臂的轨迹跟踪误差图,其误差精度达到了10的-5次方,说明在受到双端不等式约束的情况下,机械臂的控制精度依然很高。
上述具体实施方式为本发明的优选实施例,并不能对本发明进行限定,其他的任何未背离本发明的技术方案而所做的改变或其它等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,包括如下步骤:
S1、根据机械臂的结构参数,建立机械臂的模型,获得末端执行器的雅克比矩阵,根据雅克比矩阵和预设的机械臂末端的目标轨迹,建立机械臂的逆运动学模型;
S2、根据机械臂实际的关节物理极限约束参数,在速度层上建立机械臂的物理极限不等式约束;
S3、将机械臂的逆运动学模型、物理极限双端不等式约束制订为受约束的时变二次规划模型,其中将重复运动指标作为时变二次规划模型的性能指标;
S4、建立带惩罚函数的拓扑结构自适应神经网络,求解受约束的时变二次规划模型;则基于拓扑结构自适应神经网络的解的前n个元素就是最优关节角速度
Figure FDA0003735536530000011
对最优关节角速度
Figure FDA0003735536530000012
积分获得Θ*,Θ*即为机械臂的最优关节角度;
S5、将求解的机械臂的各个角度信息传递给机械臂的下位机控制器,下位机控制器驱动机械臂运动,完成目标轨迹跟踪任务。
2.根据权利要求1所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,步骤S2中的关节物理极限约束参数包括:关节角度约束和角速度约束,在速度层上建立的机械臂的物理极限双端不等式约束为:
Figure FDA0003735536530000013
其中的ζ-∈Rn,ζ+∈Rn定义为:
Figure FDA0003735536530000014
Figure FDA0003735536530000015
其中Θ∈Rn,Θ-和Θ+分别表示机械臂的关节角度的上下物理极限;
Figure FDA0003735536530000016
表示机械臂各个关节的角速度,
Figure FDA0003735536530000017
Figure FDA0003735536530000018
分别表示机械臂关节角速度的上下物理极限;
Figure FDA0003735536530000019
Figure FDA00037355365300000110
Figure FDA00037355365300000111
Figure FDA00037355365300000112
其中β是一个在[0,1]区间的正数,ζ-∈Rn表示角速度
Figure FDA0003735536530000021
的双端约束下极限,ζ+∈Rn表示角速度
Figure FDA0003735536530000022
的双端约束上极限,
Figure FDA0003735536530000023
Figure FDA0003735536530000024
分别表示θ-和θ+的第一界线系数和第二界线系数;η1和η2分别表示的ζ-和ζ+的第一界线系数和第二界线系数,α1、α2均为常数系数,分别用于表示
Figure FDA0003735536530000025
与Θ-
Figure FDA0003735536530000026
与Θ+的倍数关系。
3.根据权利要求2所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于:将物理极限双端不等式约束
Figure FDA0003735536530000027
转化为物理极限单侧不等式约束;
将机械臂的逆运动学模型、物理极限单侧不等式约束制订为时变二次规划模型。
4.根据权利要求3所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,物理极限单侧不等式约束为:
Figure FDA0003735536530000028
其中K=[E,-E]T∈R2n×n,e=[ζ+,-ζ-]T∈R2n,其中E代表一个n×n的单位矩阵,K表示单侧不等式约束的第一特征矩阵,R2n表示K的行数是2n,e表示单侧不等式约束的第二特征矩阵。
5.根据权利要求3所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于:物理极限单侧不等式约束使用指数型惩罚模型进行转化:
带惩罚策略的拓扑结构自适应神经网络的惩罚模型为指数型惩罚模型P(t),指数型惩罚模型P(t)的结构为:
Figure FDA0003735536530000029
其中σ>0,表示平滑约束系数,p是一个接近于0的正数,ei和Ki分别是向量e和矩阵K的第i维行向量,Θ表示机械臂各个关节的角度,n表示表达式约束项数相关常数,t表示时变系统的时间变量,
Figure FDA00037355365300000210
表示机械臂关节角速度、i表示机械臂的第i个关节角;
使用指数型惩罚模型P(t)将时变二次规划模型的控制方案中的不等式约束项转化为性能指标中的惩罚项,即:
Figure FDA00037355365300000211
Figure FDA00037355365300000212
其中,b表示机械臂各个关节角度增量,JE表示机械臂的雅可比矩阵,
Figure FDA0003735536530000031
表示机械臂末端执行器的速度向量。
6.根据权利要求4所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于:带惩罚项的时变二次规划模型将时变二次规划模型使用拉格朗日乘子法转化为矩阵等式模型:
将时变二次规划模型使用拉格朗日乘子法转化为矩阵等式模型,转化后可以得到如下时变矩阵模型:
B(t)y(t)=G(t)
其中
Figure FDA0003735536530000032
Figure FDA0003735536530000033
λ是拉格朗日算子,B(t)表示机械臂时变二次规划模型的时变矩阵的第一特征项,E表示单位矩阵,m、n分别表示矩阵的行数、列数,y(t)表示由关节角速度
Figure FDA0003735536530000034
和拉格朗日算子λ构成的向量,G(t)表示机械臂时变二次规划模型的时变矩阵的第二特征项。
7.根据权利要求6所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于:时变矩阵模型使用拓扑结构自适应神经网络来求解:
定义误差函数为:
ε(t)=B(t)y(t)-G(t)∈Rn+m
为了使误差收敛到零,采用如下的神经动力学准则:
Figure FDA0003735536530000035
其中ψ(·)∶Rn+m→Rn+m是激活函数,ψ(·)是单调递增的奇函数,γ为表示调节神经网络收敛速率的常数,
Figure FDA0003735536530000036
表示迭代次数,
Figure FDA0003735536530000037
Figure FDA0003735536530000038
分别表示自适应参数第一特征项、自适应参数第二特征项和自适应参数第三特征项;
根据神经动力学准则,并进行同类型合并,得到带惩罚策略的拓扑结构自适应神经网络:
Figure FDA0003735536530000039
其中,
Figure FDA0003735536530000041
Figure FDA0003735536530000042
Figure FDA0003735536530000043
其中,R(t)表示机械臂时变二次规划模型的时变矩阵的第三特征项,T(t)表示机械臂时变二次规划模型的时变矩阵的第四特征项,V(t)表示机械臂时变二次模型的时变矩阵的第五特征项;其中
Figure FDA0003735536530000044
表示与关节角相关的向量y(t)的导数,
Figure FDA0003735536530000045
表示雅克比矩阵的导数、
Figure FDA0003735536530000046
表示关节偏移的响应的导数、
Figure FDA0003735536530000047
表示关节末端执行器的加速度、
Figure FDA0003735536530000048
表示单侧不等式约束的第一特征项的转置的导数、
Figure FDA0003735536530000049
表示单侧不等式约束的第二特征项的导数。
8.根据权利要求7所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,迭代次数
Figure FDA00037355365300000410
自适应参数第一特征项
Figure FDA00037355365300000411
自适应参数第二特征项
Figure FDA00037355365300000412
和自适应参数第三特征项
Figure FDA00037355365300000413
定义为:
Figure FDA00037355365300000414
是一个用来表示迭代次数的正整数,初始值是1;当时间变量t增量为t0时,t0是预设的常数,认为神经网络执行一次迭代运算,
Figure FDA00037355365300000415
的值自增1;
Figure FDA00037355365300000416
结构上是等差数列:
Figure FDA00037355365300000417
c是常数代表公差,A(0)=1;
Figure FDA00037355365300000418
是跟迭代次数
Figure FDA00037355365300000419
和输出误差均值相关的变量,用来表示输出误差均值对神经网络拓扑结构的修正项,N(0)=0;
Figure FDA00037355365300000420
是跟迭代次数
Figure FDA00037355365300000421
和输出误差的标准差相关的变量,用来表示输出误差的标准差对神经网络拓扑结构的修正项,M(0)=0;
Figure FDA00037355365300000422
Figure FDA00037355365300000423
进一步的表达式如下:
在第
Figure FDA0003735536530000051
次迭代结束后,在时间变量t的增量t0内选取n0个点,分别为
Figure FDA0003735536530000052
Figure FDA0003735536530000053
在每个时刻t0i,i=1,2,3,…,n0,计算误差的二范数‖ε(t0i)‖2,进一步计算第
Figure FDA0003735536530000054
次迭代过程中‖ε(t)‖2的平均值为:
Figure FDA0003735536530000055
Figure FDA0003735536530000056
次迭代过程中‖ε(t)‖2的标准差为:
Figure FDA0003735536530000057
根据实际的误差精度需求,将期望的稳态误差均值和稳态误差标准差分别设为eEA和eES;当实际误差均值
Figure FDA0003735536530000058
以及实际误差标准差
Figure FDA0003735536530000059
时,停止迭代;在每一次迭代过程中,
Figure FDA00037355365300000510
Figure FDA00037355365300000511
其中α是常数,用来表示输出误差均值与期望误差均值的差的绝对值对收敛参数
Figure FDA00037355365300000512
的影响因子;b是常数,用来表示输出误差标准差与期望误差标准差的差的绝对值对收敛参数
Figure FDA00037355365300000513
的影响因子。
9.根据权利要求1所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,结构参数包括连杆长度和自由度个数。
10.根据权利要求1所述的基于拓扑结构自适应神经网络的机械臂运动规划方法,其特征在于,所述机械臂的逆运动学模型为:
f(θ)=rE
其中θ∈Rn表示机械臂各个关节的角速度,rE∈Rm为预设的机械臂的末端轨迹,f(·)为非线性映射模型,m表示机械臂的工作空间的维度,n为机械臂的关节个数。
CN202210795270.0A 2022-07-07 2022-07-07 基于拓扑结构自适应神经网络的机械臂运动规划方法 Active CN115139301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210795270.0A CN115139301B (zh) 2022-07-07 2022-07-07 基于拓扑结构自适应神经网络的机械臂运动规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210795270.0A CN115139301B (zh) 2022-07-07 2022-07-07 基于拓扑结构自适应神经网络的机械臂运动规划方法

Publications (2)

Publication Number Publication Date
CN115139301A true CN115139301A (zh) 2022-10-04
CN115139301B CN115139301B (zh) 2024-07-23

Family

ID=83413169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210795270.0A Active CN115139301B (zh) 2022-07-07 2022-07-07 基于拓扑结构自适应神经网络的机械臂运动规划方法

Country Status (1)

Country Link
CN (1) CN115139301B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115609584A (zh) * 2022-10-14 2023-01-17 华南理工大学 基于sigmoid型惩罚策略的机械臂运动规划方法
CN116117825A (zh) * 2023-04-04 2023-05-16 人工智能与数字经济广东省实验室(广州) 一种基于抗噪声模糊递归神经网络的fpga实现方法
CN117084791A (zh) * 2023-10-19 2023-11-21 苏州恒瑞宏远医疗科技有限公司 一种穿刺方位解算方法以及穿刺作业执行系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109352656A (zh) * 2018-11-29 2019-02-19 华南理工大学 一种具有时变输出约束的多关节机械臂控制方法
CN109551479A (zh) * 2018-11-30 2019-04-02 长春工业大学 基于参数优化可重构模块化柔性机械臂轨迹跟踪控制方法
US20190184561A1 (en) * 2017-12-15 2019-06-20 The Regents Of The University Of California Machine Learning based Fixed-Time Optimal Path Generation
CN114700938A (zh) * 2022-03-04 2022-07-05 华南理工大学 一种基于跳增益积分神经网络的冗余机械臂运动规划方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190184561A1 (en) * 2017-12-15 2019-06-20 The Regents Of The University Of California Machine Learning based Fixed-Time Optimal Path Generation
CN109352656A (zh) * 2018-11-29 2019-02-19 华南理工大学 一种具有时变输出约束的多关节机械臂控制方法
CN109551479A (zh) * 2018-11-30 2019-04-02 长春工业大学 基于参数优化可重构模块化柔性机械臂轨迹跟踪控制方法
CN114700938A (zh) * 2022-03-04 2022-07-05 华南理工大学 一种基于跳增益积分神经网络的冗余机械臂运动规划方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115609584A (zh) * 2022-10-14 2023-01-17 华南理工大学 基于sigmoid型惩罚策略的机械臂运动规划方法
CN116117825A (zh) * 2023-04-04 2023-05-16 人工智能与数字经济广东省实验室(广州) 一种基于抗噪声模糊递归神经网络的fpga实现方法
CN116117825B (zh) * 2023-04-04 2023-08-08 人工智能与数字经济广东省实验室(广州) 一种基于抗噪声模糊递归神经网络的fpga实现方法
CN117084791A (zh) * 2023-10-19 2023-11-21 苏州恒瑞宏远医疗科技有限公司 一种穿刺方位解算方法以及穿刺作业执行系统
CN117084791B (zh) * 2023-10-19 2023-12-22 苏州恒瑞宏远医疗科技有限公司 一种穿刺方位解算方法以及穿刺作业执行系统

Also Published As

Publication number Publication date
CN115139301B (zh) 2024-07-23

Similar Documents

Publication Publication Date Title
CN111975768B (zh) 一种基于固参神经网络的机械臂运动规划方法
CN115139301A (zh) 基于拓扑结构自适应神经网络的机械臂运动规划方法
CN112904728B (zh) 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法
WO2020207219A1 (zh) 一种利用环境预测优化非模型机器人多轴孔装配控制方法
CN111941421B (zh) 一种基于多机器人协同操作的自适应模糊力跟踪控制方法
Xu et al. Dynamic neural networks based kinematic control for redundant manipulators with model uncertainties
CN111319036B (zh) 基于自适应算法的移动机械臂位置/力自抗扰控制方法
CN111993417B (zh) 一种基于rbf神经网络的机械臂自适应阻抗控制方法
CN109343350A (zh) 一种基于模型预测控制的水下机器人路径跟踪控制方法
CN114895564B (zh) 一种电驱动柔性关节机械臂自适应神经网络控制器设计方法
CN112091976B (zh) 一种水下机械臂任务空间控制方法
CN110053044B (zh) 一种并联机器人串类水果夹取无模型自适应光滑滑模阻抗控制方法
CN105598968B (zh) 一种并联机械臂的运动规划与控制方法
CN114347018A (zh) 一种基于小波神经网络的机械臂扰动补偿方法
CN110695994B (zh) 一种面向双臂机械手协同重复运动的有限时间规划方法
Jun-Pei et al. Neural network control of space manipulator based on dynamic model and disturbance observer
CN115609584A (zh) 基于sigmoid型惩罚策略的机械臂运动规划方法
Xie et al. A fuzzy neural controller for model-free control of redundant manipulators with unknown kinematic parameters
CN109176529B (zh) 一种空间机器人协调运动的自适应模糊控制方法
Jing et al. Research on neural network PID adaptive control with industrial welding robot in multi-degree of freedom
CN110480641B (zh) 一种机械臂的递推分布式快速收敛鲁棒控制方法
Wang et al. Multi-task trajectory tracking control of manipulator based on two-layer sliding mode control
CN112621761B (zh) 一种面向通信时滞的机械臂系统多级优化协调控制方法
Liu et al. Dual Fuzzy Sliding Mode Control of Collaborative Robot Based on Adaptive Algorithm
CN118617397A (zh) 一种基于时变逆矩阵的冗余机械臂神经网络运动控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant