CN109108964A - 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 - Google Patents

一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 Download PDF

Info

Publication number
CN109108964A
CN109108964A CN201810826096.5A CN201810826096A CN109108964A CN 109108964 A CN109108964 A CN 109108964A CN 201810826096 A CN201810826096 A CN 201810826096A CN 109108964 A CN109108964 A CN 109108964A
Authority
CN
China
Prior art keywords
formula
matrix
space manipulator
joint
dynamic programming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810826096.5A
Other languages
English (en)
Other versions
CN109108964B (zh
Inventor
袁源
张鹏
孙冲
于洋
万文娅
李晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201810826096.5A priority Critical patent/CN109108964B/zh
Publication of CN109108964A publication Critical patent/CN109108964A/zh
Application granted granted Critical
Publication of CN109108964B publication Critical patent/CN109108964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,首先考虑2自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;其次,利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据系统输出信息估计系统中全部状态信息。最后,利用神经网络,设计多目标自适应动态规划近似最优控制迭代算法。本发明具有解决强非线性与耦合性,多关节协调控制等优点,设计的离散控制器便于工程实现。

Description

一种基于自适应动态规划Nash博弈的空间机械臂协调控制 方法
技术领域
本发明属于空间机械臂控制领域,涉及一种空间机械臂协调控制方法,具体涉及一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法。
背景技术
在空间任务中,如:在轨服务、主动碎片清除和星际探测任务中,空间机械臂控制系统发挥着越来越大的作用。然而,由于多自由度的机械臂具有强非线性特性以及关节之间的强耦合特性,严重阻碍了控制器设计。因此,寻求一种能够解决非线性特性以及耦合特性的控制算法显得尤为重要。此外,在多自由度的机械臂系统中,状态信息只有部分输出,这显著增加了控制器设计的难度。因此,需要设计一种非线性状态观测器来估计出系统中的全部状态信息,进而为控制器的设计奠定基础。另外,在多自由度机械臂系统中,不同关节之间需要协调控制,根据每个机械臂关节的优先级设计多目标控制策略更为合理。
针对空间机械臂的非线性控制,目前已经提出了多种控制方法。常见的非线性控制方法有滑模控制方法,自抗扰控制方法等。然而,以上控制方法没有明确的控制目标,且不能得到最优控制策略。最近,基于自适应动态规划的最优控制方法广泛应用于非线性系统中,通过求解非线性哈密尔顿-贝尔曼方程,得到近似最优控制策略。此外,龙伯格类观测器已经广泛被用于估计非线性系统中的状态信息。Nash均衡博弈理论可以用来求解多目标的优化控制问题。然而,如何把自适应动态规划算法、龙伯格类观测器以及Nash均衡理论相结合,设计一种多目标非合作自适应控制策略一直是一个难题。
发明内容
本发明的目的在于提供一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,以克服现有技术的不足,本发明既能保证多关节机械臂的稳定,又能协调多关节机械臂控制。
为达到上述目的,本发明采用如下技术方案:
一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,包括以下步骤:
步骤1:根据二自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;
步骤2:利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据空间机械臂离散非线性系统模型输出信息估计空间机械臂离散非线性系统模型中全部状态信息;
步骤3:基于估计的全部状态信息,设计Nash控制策略的自适应动态规划迭代策略,并利用神经网络近似出多目标最优控制策略。
进一步地,步骤1具体为:
建立空间机械臂动力学模型:
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
M(θ)和的具体表达式如下:
其中,
D12=D21=(m2+0.5M2)L1L2cos(θ12)
C11=C22=0,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
u=τ,D=[I 0]
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵;
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Τf(xk)+Τbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Τf(xk)+(I-A)xk,B=Τb;
利用神经网络的无限逼近性质,将式(4)近似为以下空间机械臂离散非线性系统模型:
xk+1=Axk+WFφF(xk)+Bukk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个正数;εk为神经网络的近似误差。
进一步地,步骤2具体为:
针对式(5),龙伯格观测器设计如下:
式中,分别为xk和WF的估计值;L为观测器增益,yk为系统实际输出,φF为神经元的基函数向量,权重的自适应调整率为:
式中,为可调参数,对于给定的标量ζ,观测器增益L能够根据以下优化问题得到:
min tr(P)
其中,
其中,P为待求的辅助正定矩阵变量,Π为辅助矩阵。
进一步地,步骤3具体为:
首先令B=[B1 B2],其中B1和B2分别为B中第一列和第二列的向量;分别为uk中第一行和第二行中的向量,然后利用神经网络近似出多目标最优控制策略:
步骤3.1:令迭代次数s=0,其中,为第s步估计的值函数初值;
步骤3.2:计算控制率:
式中,为正定矩阵Rii的逆矩阵,为权重矩阵,φV,i(·)为神经网络的基函数,且
其中,η为辅助变量;
步骤3.3:计算值函数:
式中,权重矩阵的调整律为
式中,为一个可调的正数,Ui(·)为辅助函数,其表达式为Qi和Rij为正定矩阵;
步骤3.4:计算并判断计算值否小于10-8,如果则迭代停止,输出控制策略否则令s=s+1,转到步骤3.2)。
与现有技术相比,本发明具有以下有益的技术效果:
本发明设计的离散自适应动态规划近似最优控制器,便于工程实现;另外本发明采用龙伯格观测器,可以有效解决非线性系统的输出反馈控制问题,利用观测器的输出信息,基于自适应动态规划的多目标Nash控制策略可以有效协调两个机械臂关节之间的控制,既能保证多关节机械臂的稳定,又能协调多关节机械臂控制。
附图说明
图1为本发明的流程图;
图2为采用本发明方法进行仿真的结果图。
具体实施方式
下面对本发明作进一步详细描述:
本发明针对空间机械臂系统中的强非线性、强耦合性以及部分状态输出特性,提出了一种基于自适应动态规划的多目标近似最优控制策略,首先,设计龙伯格类观测器估计系统中全部状态信息;其次,设计Nash控制策略的自适应动态规划迭代策略;最后,利用神经网络近似出多目标最优控制策略。
本发明解决其技术问题采用的技术方案是:基于自适应动态规划Nash博弈的空间机械臂协调控制算法,通过以下步骤实现:
1、模型建立
空间机械臂动力学模型为:
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
M(θ)和的具体表达式如下:
其中,
D12=D21=(m2+0.5M2)L1L2cos(θ12)
C11=C22=0,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
u=τ,D=[I 0]
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵。
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Τf(xk)+Τbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)可以进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Τf(xk)+(I-A)xk,B=Τb;
利用神经网络的无限逼近性质,系统(4)可以近似为以下形式:
xk+1=Axk+WFφF(xk)+Bukk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个很小的正数;εk为神经网络的近似误差。
2、龙伯格观测器设计
针对离散系统模型(5),龙伯格观测器设计如下:
式中,分别为xk和WF的估计值;L为观测器增益。yk为系统实际输出,φF为神经元的基函数向量,权重的自适应调整率为:
式中,为可调参数。对于给定的标量ζ,观测器增益L可根据以下优化问题得到:
min tr(P)
其中,
其中,P为待求的辅助正定矩阵变量,Π为辅助矩阵。
3、自适应动态规划迭代算法设计
首先,令B=[B1 B2],其中B1和B2分别为B中第一列和第二列的向量;分别为uk中第一行和第二行中的向量。下面给出基于神经网络的迭代自适应动态规划算法。
1)首先令迭代次数s=0,其中,为第s次估计的值函数初值;
2)计算控制率
式中,为正定矩阵Rii的逆矩阵,为权重矩阵,φV,i(·)为神经网络的基函数,且
其中,η为辅助变量。
在本实例中,权重矩阵的初值为基函数φV,i(·)选择为
3)计算值函数:
式中,权重矩阵的调整律为
式中,为一个可调的正数,Ui(·)为辅助函数其表达式为Qi和Rij为正定矩阵。在本实例中,Qi=diag([1 1 1 1]),Rij=1。
4)计算并判断是否小于10-8,如果则迭代停止,输出控制策略否则s=s+1,转到步骤2)。
参见图2,利用本发明方法进行仿真,ek为实际状态值xk与期望状态值xd的差。e1,k,e2,k,e3,k,e4,k为向量ek中的元素。从仿真图中可以得出,系统的误差状态最终收敛到0,也就是说机械臂的实际状态跟踪上了给定的期望值状态。因此,本仿真验证了基于自适应动态规划Nash博弈的空间机械臂算法的有效性。

Claims (4)

1.一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,包括以下步骤:
步骤1:根据二自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;
步骤2:利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据空间机械臂离散非线性系统模型输出信息估计空间机械臂离散非线性系统模型中全部状态信息;
步骤3:基于估计的全部状态信息,设计Nash控制策略的自适应动态规划迭代策略,并利用神经网络近似出多目标最优控制策略。
2.根据权利要求1所述的一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,步骤1具体为:
建立空间机械臂动力学模型:
y=θ (1)
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
M(θ)和的具体表达式如下:
其中,
D12=D21=(m2+0.5M2)L1L2cos(θ12)
C11=C22=0,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
u=τ,D=[I 0]
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵;
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Tf(xk)+Tbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Tf(xk)+(I-A)xk,B=Tb;
利用神经网络的无限逼近性质,将式(4)近似为以下空间机械臂离散非线性系统模型:
xk+1=Axk+WFφF(xk)+Bukk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个正数;εk为神经网络的近似误差。
3.根据权利要求2所述的一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,步骤2具体为:
针对式(5),龙伯格观测器设计如下:
式中,分别为xk和WF的估计值;L为观测器增益,yk为系统实际输出,φF为神经元的基函数向量,权重的自适应调整率为:
式中,为可调参数,对于给定的标量ζ,观测器增益L能够根据以下优化问题得到:
min tr(P)
其中,
其中,P为待求的辅助正定矩阵变量,Π为辅助矩阵。
4.根据权利要求2所述的一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,步骤3具体为:
首先令B=[B1 B2],其中B1和B2分别为B中第一列和第二列的向量;分别为uk中第一行和第二行中的向量,然后利用神经网络近似出多目标最优控制策略:
步骤3.1:令迭代次数s=0,i=1,2,其中,为第s步估计的值函数初值;
步骤3.2:计算控制率:
式中,为正定矩阵Rii的逆矩阵,为权重矩阵,φV,i(·)为神经网络的基函数,且
其中,η为辅助变量;
步骤3.3:计算值函数:
式中,权重矩阵的调整律为
式中,为一个可调的正数,Ui(·)为辅助函数,其表达式为Qi和Rij为正定矩阵;
步骤3.4:计算并判断计算值否小于10-8,如果则迭代停止,输出控制策略否则令s=s+1,转到步骤3.2)。
CN201810826096.5A 2018-07-25 2018-07-25 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 Active CN109108964B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810826096.5A CN109108964B (zh) 2018-07-25 2018-07-25 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810826096.5A CN109108964B (zh) 2018-07-25 2018-07-25 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法

Publications (2)

Publication Number Publication Date
CN109108964A true CN109108964A (zh) 2019-01-01
CN109108964B CN109108964B (zh) 2021-06-08

Family

ID=64863187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810826096.5A Active CN109108964B (zh) 2018-07-25 2018-07-25 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法

Country Status (1)

Country Link
CN (1) CN109108964B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647033A (zh) * 2019-09-02 2020-01-03 浙江工业大学 一种基于类龙伯格观测器的网络化运动控制系统攻击辨识方法
CN112223286A (zh) * 2020-09-30 2021-01-15 齐鲁工业大学 一种非均匀牵引力机械臂末端牵引遥操作控制方法
CN113219842A (zh) * 2021-06-10 2021-08-06 哈尔滨工业大学 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006116631A (ja) * 2004-10-20 2006-05-11 Matsushita Electric Ind Co Ltd 多関節型ロボットの制御方法
CN104216284A (zh) * 2014-08-14 2014-12-17 浙江工业大学 机械臂伺服系统的有限时间协同控制方法
CN105563489A (zh) * 2016-03-01 2016-05-11 浙江工业大学 基于非线性自抗扰控制技术的柔性机械臂控制方法
CN105798930A (zh) * 2016-04-01 2016-07-27 浙江工业大学 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法
CN107045557A (zh) * 2016-11-01 2017-08-15 长春工业大学 面向约束的可重构机械臂非奇异终端滑模力位置控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006116631A (ja) * 2004-10-20 2006-05-11 Matsushita Electric Ind Co Ltd 多関節型ロボットの制御方法
CN104216284A (zh) * 2014-08-14 2014-12-17 浙江工业大学 机械臂伺服系统的有限时间协同控制方法
CN105563489A (zh) * 2016-03-01 2016-05-11 浙江工业大学 基于非线性自抗扰控制技术的柔性机械臂控制方法
CN105798930A (zh) * 2016-04-01 2016-07-27 浙江工业大学 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法
CN107045557A (zh) * 2016-11-01 2017-08-15 长春工业大学 面向约束的可重构机械臂非奇异终端滑模力位置控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李光等: "无模型机械臂BP神经网络状态观测及反演跟踪控制", 《中国机械工程》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647033A (zh) * 2019-09-02 2020-01-03 浙江工业大学 一种基于类龙伯格观测器的网络化运动控制系统攻击辨识方法
CN112223286A (zh) * 2020-09-30 2021-01-15 齐鲁工业大学 一种非均匀牵引力机械臂末端牵引遥操作控制方法
CN112223286B (zh) * 2020-09-30 2022-08-05 齐鲁工业大学 一种非均匀牵引力机械臂末端牵引遥操作控制方法
CN113219842A (zh) * 2021-06-10 2021-08-06 哈尔滨工业大学 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质
CN113219842B (zh) * 2021-06-10 2021-12-10 哈尔滨工业大学 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质

Also Published As

Publication number Publication date
CN109108964B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN104950677A (zh) 基于反演滑模控制的机械臂系统饱和补偿控制方法
CN111596545B (zh) 一种多输入多输出机械系统自适应容错预设性能控制方法
CN112987567B (zh) 非线性系统的固定时间自适应神经网络滑模控制方法
CN106406085B (zh) 基于跨尺度模型的空间机械臂轨迹跟踪控制方法
CN104950678A (zh) 一种柔性机械臂系统的神经网络反演控制方法
CN109108964A (zh) 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法
CN104698846A (zh) 一种机械臂伺服系统的指定性能反演控制方法
CN106406098B (zh) 一种机器人系统在未知环境下的人机交互控制方法
CN111831011A (zh) 一种水下机器人平面轨迹跟踪控制的方法
CN107263483B (zh) 二自由度关节机器人轨迹的协调控制方法
CN109213175A (zh) 一种基于原对偶神经网络的移动机器人视觉伺服轨迹跟踪预测控制方法
Islam et al. New stability and tracking criteria for a class of bilateral teleoperation systems
CN108267952B (zh) 一种水下机器人自适应有限时间控制方法
CN105171758A (zh) 一种机器人的自适应有限时间收敛滑模控制方法
CN105446348A (zh) 一种提高柔性航天器控制精度的分布式控制方法
CN110744552A (zh) 一种基于奇异摄动理论的柔性机械臂运动控制方法
Hu et al. Prescribed time tracking control without velocity measurement for dual-arm robots
Hussain et al. Underactuated nonlinear adaptive control approach using U-model for multivariable underwater glider control parameters
CN116079741B (zh) 一种电机驱动单连杆机械臂的自适应控制方法
CN110095989B (zh) 一种基于反步法的分布式多拉格朗日系统跟踪控制策略
Izadbakhsh et al. Endpoint perfect tracking control of robots—a robust non inversion-based approach
CN110095985B (zh) 一种观测器设计方法和抗干扰控制系统
CN116068901A (zh) 一种基于自适应有限时间扰动观测器的柔性连杆机械臂控制方法
Zhang et al. Neuro-sliding-mode control of flexible-link manipulators based on singularly perturbed model
Bruyère et al. Robust performance study for lateral autopilot of a quasi-linear parameter-varying missile

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant