CN109108964B - 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 - Google Patents
一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 Download PDFInfo
- Publication number
- CN109108964B CN109108964B CN201810826096.5A CN201810826096A CN109108964B CN 109108964 B CN109108964 B CN 109108964B CN 201810826096 A CN201810826096 A CN 201810826096A CN 109108964 B CN109108964 B CN 109108964B
- Authority
- CN
- China
- Prior art keywords
- matrix
- space manipulator
- joint
- neural network
- dynamic programming
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,首先考虑2自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;其次,利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据系统输出信息估计系统中全部状态信息。最后,利用神经网络,设计多目标自适应动态规划近似最优控制迭代算法。本发明具有解决强非线性与耦合性,多关节协调控制等优点,设计的离散控制器便于工程实现。
Description
技术领域
本发明属于空间机械臂控制领域,涉及一种空间机械臂协调控制方法,具体涉及一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法。
背景技术
在空间任务中,如:在轨服务、主动碎片清除和星际探测任务中,空间机械臂控制系统发挥着越来越大的作用。然而,由于多自由度的机械臂具有强非线性特性以及关节之间的强耦合特性,严重阻碍了控制器设计。因此,寻求一种能够解决非线性特性以及耦合特性的控制算法显得尤为重要。此外,在多自由度的机械臂系统中,状态信息只有部分输出,这显著增加了控制器设计的难度。因此,需要设计一种非线性状态观测器来估计出系统中的全部状态信息,进而为控制器的设计奠定基础。另外,在多自由度机械臂系统中,不同关节之间需要协调控制,根据每个机械臂关节的优先级设计多目标控制策略更为合理。
针对空间机械臂的非线性控制,目前已经提出了多种控制方法。常见的非线性控制方法有滑模控制方法,自抗扰控制方法等。然而,以上控制方法没有明确的控制目标,且不能得到最优控制策略。最近,基于自适应动态规划的最优控制方法广泛应用于非线性系统中,通过求解非线性哈密尔顿-贝尔曼方程,得到近似最优控制策略。此外,龙伯格类观测器已经广泛被用于估计非线性系统中的状态信息。Nash均衡博弈理论可以用来求解多目标的优化控制问题。然而,如何把自适应动态规划算法、龙伯格类观测器以及Nash均衡理论相结合,设计一种多目标非合作自适应控制策略一直是一个难题。
发明内容
本发明的目的在于提供一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,以克服现有技术的不足,本发明既能保证多关节机械臂的稳定,又能协调多关节机械臂控制。
为达到上述目的,本发明采用如下技术方案:
一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,包括以下步骤:
步骤1:根据二自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;
步骤2:利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据空间机械臂离散非线性系统模型输出信息估计空间机械臂离散非线性系统模型中全部状态信息;
步骤3:基于估计的全部状态信息,设计Nash控制策略的自适应动态规划迭代策略,并利用神经网络近似出多目标最优控制策略。
进一步地,步骤1具体为:
建立空间机械臂动力学模型:
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
其中,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵;
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Τf(xk)+Τbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Τf(xk)+(I-A)xk,B=Τb;
利用神经网络的无限逼近性质,将式(4)近似为以下空间机械臂离散非线性系统模型:
xk+1=Axk+WFφF(xk)+Buk+εk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个正数;εk为神经网络的近似误差。
进一步地,步骤2具体为:
针对式(5),龙伯格观测器设计如下:
min tr(P)
其中,
其中,P为待求的辅助正定矩阵变量,Π为辅助矩阵。
进一步地,步骤3具体为:
步骤3.2:计算控制率:
其中,η为辅助变量;
步骤3.3:计算值函数:
与现有技术相比,本发明具有以下有益的技术效果:
本发明设计的离散自适应动态规划近似最优控制器,便于工程实现;另外本发明采用龙伯格观测器,可以有效解决非线性系统的输出反馈控制问题,利用观测器的输出信息,基于自适应动态规划的多目标Nash控制策略可以有效协调两个机械臂关节之间的控制,既能保证多关节机械臂的稳定,又能协调多关节机械臂控制。
附图说明
图1为本发明的流程图;
图2为采用本发明方法进行仿真的结果图。
具体实施方式
下面对本发明作进一步详细描述:
本发明针对空间机械臂系统中的强非线性、强耦合性以及部分状态输出特性,提出了一种基于自适应动态规划的多目标近似最优控制策略,首先,设计龙伯格类观测器估计系统中全部状态信息;其次,设计Nash控制策略的自适应动态规划迭代策略;最后,利用神经网络近似出多目标最优控制策略。
本发明解决其技术问题采用的技术方案是:基于自适应动态规划Nash博弈的空间机械臂协调控制算法,通过以下步骤实现:
1、模型建立
空间机械臂动力学模型为:
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
其中,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵。
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Τf(xk)+Τbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)可以进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Τf(xk)+(I-A)xk,B=Τb;
利用神经网络的无限逼近性质,系统(4)可以近似为以下形式:
xk+1=Axk+WFφF(xk)+Buk+εk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个很小的正数;εk为神经网络的近似误差。
2、龙伯格观测器设计
针对离散系统模型(5),龙伯格观测器设计如下:
min tr(P)
其中,
其中,P为待求的辅助正定矩阵变量,Π为辅助矩阵。
3、自适应动态规划迭代算法设计
2)计算控制率
其中,η为辅助变量。
3)计算值函数:
参见图2,利用本发明方法进行仿真,ek为实际状态值xk与期望状态值xd的差。e1,k,e2,k,e3,k,e4,k为向量ek中的元素。从仿真图中可以得出,系统的误差状态最终收敛到0,也就是说机械臂的实际状态跟踪上了给定的期望值状态。因此,本仿真验证了基于自适应动态规划Nash博弈的空间机械臂算法的有效性。
Claims (3)
1.一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,包括以下步骤:
步骤1:根据二自由度空间机械臂的强非线性和关节之间的强耦合性,建立空间机械臂离散非线性系统模型;
具体为:
建立空间机械臂动力学模型:
y=θ (1)
其中,θ=[θ1 θ2]T,θi为第i个关节的角度,i=1,2,M(θ)∈R2×2为空间机械臂的惯性矩阵,R2×2表示2×2的实数矩阵空间,为包含科里奥利力与离心力的矩阵,R2表示2维的实数向量,τ为控制输入力矩,y为系统状态输出;
其中,
在上式中,m1和m2分别为关节1末端与关节2末端的总质量;M1和M2分别为关节1和关节2的质量,L1和L2分别为关节1和关节2的长度;
将式(1)改为状态空间形式为:
y=Dx, (2)
其中,
上式中,I为单位矩阵,u为控制输入,b为控制器系数,D为系统输出系数,0表示元素为0的矩阵;
采用欧拉方法,将式(2)离散化为:
xk+1=xk+Τf(xk)+Τbuk (3)
其中,T为采样周期,xk为状态x在第k时刻的值;uk为输入u在第k时刻的值,将式(3)进一步写为:
xk+1=Axk+F(xk)+Buk (4)
其中,A∈R4×4为方阵,F(xk)=Τf(xk)+(I-A)xk,B=Τb;
利用神经网络的无限逼近性质,将式(4)近似为以下空间机械臂离散非线性系统模型:
xk+1=Axk+WFφF(xk)+Buk+εk (5)
其中,WF为神经元的权重矩阵;φF(·)为基函数向量并满足||φF(·)||≤∈φ;∈φ为一个正数;εk为神经网络的近似误差;
步骤2:利用神经网络无限逼近非线性函数特性,设计龙伯格观测器,根据空间机械臂离散非线性系统模型输出信息估计空间机械臂离散非线性系统模型中全部状态信息;
步骤3:基于估计的全部状态信息,设计Nash控制策略的自适应动态规划迭代策略,并利用神经网络近似出多目标最优控制策略。
3.根据权利要求1所述的一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法,其特征在于,步骤3具体为:
步骤3.2:计算控制率:
其中,η为辅助变量;
步骤3.3:计算值函数:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810826096.5A CN109108964B (zh) | 2018-07-25 | 2018-07-25 | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810826096.5A CN109108964B (zh) | 2018-07-25 | 2018-07-25 | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109108964A CN109108964A (zh) | 2019-01-01 |
CN109108964B true CN109108964B (zh) | 2021-06-08 |
Family
ID=64863187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810826096.5A Active CN109108964B (zh) | 2018-07-25 | 2018-07-25 | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109108964B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647033A (zh) * | 2019-09-02 | 2020-01-03 | 浙江工业大学 | 一种基于类龙伯格观测器的网络化运动控制系统攻击辨识方法 |
CN112223286B (zh) * | 2020-09-30 | 2022-08-05 | 齐鲁工业大学 | 一种非均匀牵引力机械臂末端牵引遥操作控制方法 |
CN113219842B (zh) * | 2021-06-10 | 2021-12-10 | 哈尔滨工业大学 | 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006116631A (ja) * | 2004-10-20 | 2006-05-11 | Matsushita Electric Ind Co Ltd | 多関節型ロボットの制御方法 |
CN104216284A (zh) * | 2014-08-14 | 2014-12-17 | 浙江工业大学 | 机械臂伺服系统的有限时间协同控制方法 |
CN105563489A (zh) * | 2016-03-01 | 2016-05-11 | 浙江工业大学 | 基于非线性自抗扰控制技术的柔性机械臂控制方法 |
CN105798930A (zh) * | 2016-04-01 | 2016-07-27 | 浙江工业大学 | 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法 |
CN107045557A (zh) * | 2016-11-01 | 2017-08-15 | 长春工业大学 | 面向约束的可重构机械臂非奇异终端滑模力位置控制方法 |
-
2018
- 2018-07-25 CN CN201810826096.5A patent/CN109108964B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006116631A (ja) * | 2004-10-20 | 2006-05-11 | Matsushita Electric Ind Co Ltd | 多関節型ロボットの制御方法 |
CN104216284A (zh) * | 2014-08-14 | 2014-12-17 | 浙江工业大学 | 机械臂伺服系统的有限时间协同控制方法 |
CN105563489A (zh) * | 2016-03-01 | 2016-05-11 | 浙江工业大学 | 基于非线性自抗扰控制技术的柔性机械臂控制方法 |
CN105798930A (zh) * | 2016-04-01 | 2016-07-27 | 浙江工业大学 | 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法 |
CN107045557A (zh) * | 2016-11-01 | 2017-08-15 | 长春工业大学 | 面向约束的可重构机械臂非奇异终端滑模力位置控制方法 |
Non-Patent Citations (1)
Title |
---|
无模型机械臂BP神经网络状态观测及反演跟踪控制;李光等;《中国机械工程》;20160805;第27卷(第7期);第859-864页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109108964A (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Adaptive neural control for dual-arm coordination of humanoid robot with unknown nonlinearities in output mechanism | |
Wu et al. | Adaptive fractional-order non-singular terminal sliding mode control based on fuzzy wavelet neural networks for omnidirectional mobile robot manipulator | |
CN112987567B (zh) | 非线性系统的固定时间自适应神经网络滑模控制方法 | |
CN107272677B (zh) | 一种移动机器人的变结构自适应轨迹跟踪控制方法 | |
CN106774379B (zh) | 一种智能超螺旋强鲁棒姿态控制方法 | |
Dai et al. | Design of an indirect adaptive controller for the trajectory tracking of UVMS | |
CN109108964B (zh) | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 | |
CN110877333A (zh) | 一种柔性关节机械臂控制方法 | |
CN104950677A (zh) | 基于反演滑模控制的机械臂系统饱和补偿控制方法 | |
Korayem et al. | Optimal sliding mode control design based on the state-dependent Riccati equation for cooperative manipulators to increase dynamic load carrying capacity | |
CN111650830A (zh) | 一种基于迭代学习的四旋翼飞行器鲁棒跟踪控制方法 | |
Wang et al. | Adaptive neural network-based visual servoing control for manipulator with unknown output nonlinearities | |
CN115990888B (zh) | 一种具有死区和时变约束功能的机械臂控制方法 | |
CN113589689A (zh) | 一种基于多参数自适应神经网络的滑模控制器设计方法 | |
Hu et al. | Recursive decentralized control for robotic manipulators | |
CN114815618B (zh) | 一种基于动态增益的自适应神经网络跟踪控制方法 | |
CN113219825B (zh) | 一种四足机器人单腿轨迹跟踪控制方法及系统 | |
Hussain et al. | Underactuated nonlinear adaptive control approach using U-model for multivariable underwater glider control parameters | |
Sun et al. | Adaptive tracking control of mobile manipulators with affine constraints and under-actuated joints | |
CN110703602B (zh) | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 | |
CN116068893A (zh) | 一种机械臂自适应分数阶滑模控制方法、设备及介质 | |
CN112731801B (zh) | 一种对称死区非线性的自适应动态面输出反馈控制方法 | |
CN112987770B (zh) | 两栖仿蟹多足机器人步行足抗饱和有限时间运动控制方法 | |
CN114851193A (zh) | 一种空间机械臂与未知环境接触过程的智能柔顺操控方法 | |
Chen et al. | Neural network compensator-based robust iterative learning control scheme for mobile robots nonlinear systems with disturbances and uncertain parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |