CN113146640B - 一种考虑执行器故障的机械臂分散最优容错控制方法 - Google Patents

一种考虑执行器故障的机械臂分散最优容错控制方法 Download PDF

Info

Publication number
CN113146640B
CN113146640B CN202110488652.4A CN202110488652A CN113146640B CN 113146640 B CN113146640 B CN 113146640B CN 202110488652 A CN202110488652 A CN 202110488652A CN 113146640 B CN113146640 B CN 113146640B
Authority
CN
China
Prior art keywords
fault
optimal
joint
function
mechanical arm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110488652.4A
Other languages
English (en)
Other versions
CN113146640A (zh
Inventor
马冰
张振国
董博
安天骄
卢曾鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun University of Technology
Original Assignee
Changchun University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun University of Technology filed Critical Changchun University of Technology
Priority to CN202110488652.4A priority Critical patent/CN113146640B/zh
Publication of CN113146640A publication Critical patent/CN113146640A/zh
Application granted granted Critical
Publication of CN113146640B publication Critical patent/CN113146640B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

一种考虑执行器故障的机械臂分散最优容错控制方法,该方法为:构建执行器故障下基于关节力矩传感器反馈技术的模块化机械臂系统子关节模型,设计龙博格状态观测器估计未知执行器故障,基于关节力矩传感器测得的信息建立综合近似的未知执行器故障、跟踪性能、控制器输出的改进代价函数,利用评价神经网络结构近似最优容错控制器,优化系统跟踪性能的同时减少控制力矩的输出,最终得到分散近似最优控制器。最后,在不同的执行器故障下,通过不同构形的模块化机械臂进行实验探究验证了该方法的有效性。

Description

一种考虑执行器故障的机械臂分散最优容错控制方法
技术领域
本发明涉及一种考虑未知执行器故障的模块化机械臂分散最优容错控制方法,属于机器人控制系统及控制算法领域。
背景技术
模块化机械臂是一类具有标准模块与接口,可以根据不同的任务需求对自身构形进行重新组合与配置的机械臂。根据模块化的概念,模块化机械臂的关节模块包含了通讯、驱动、控制、传感等单元,可以使机械臂在不同的外界环境与约束下根据任务需要改变自身构形,使重构后的机械臂能够对新的工作环境有更好的适应性。正是由于这样的结构特点,模块化机械臂具有融合最新的机械、传感器以及计算机控制技术,和良好的重塑、自适应的能力,能够根据环境和任务改变和优化自身的结构,快速、有效地完成任务,因此模块化机械臂在军事、航天、救援和核工业等领域具有重大意义。
针对面向复杂环境和干预受限的模块化机械臂,在具体应用和作业中其元器部件、执行器、传感器等不可避免会发生未知故障,因此针对模块化机械臂的故障诊断与容错控制研究十分迫切。所谓容错是指一种先进的设计/调节方法,当某些部件或参数发生故障时,保证系统能够在系统性能下降的情况下工作。究其根本,这种技术通过软件(信息)冗余和/或硬件冗余来增加系统的鲁棒性能。目前,针对非线性系统解决未知故障的容错控制方法主要分为被动容错控制和主动容错控制。被动容错控制只能针对已知故障进行补偿控制,无法预测和估计未知的故障发生,它以降低标称性能为代价以达到容错控制的目的。主动容错控制策略是通过故障诊断与故障检测单元实时获得系统所发生的未知故障信息,并对其控制器进行重构以实现对故障的实时补偿。对比于被动容错控制,主动容错控制不需要预知故障的形式具有较强的灵活性,它可以通过以上故障诊断与监测方法实时获得系统故障信息,依据这些信息以及控制任务需求重新调整系统控制律的结构和参数以最小的系统性能劣化来满足控制目标的容错控制方法。然而,这样的容错控制方式更多地依赖于故障诊断与检测的有效性,故障信息是否及时、准确以及能否在短时间内进行控制器的重构,都将严重影响整个系统的性能。另外,模块化机械臂因其独特的结构特性使其动力学模型往往是不完备的,传统的方法是利用神经网络来近似模型信息从而实现对模块化机械臂的容错控制目标。然而,这一方案在实际操作中突显出了存在的缺点,由于神经网络辨识器需要大量的数据进行训练,因而在刚开始执行任务时,执行器的输出波动巨大,甚至超过执行器最大输出限制,对其造成了不可弥补的伤害。因此,将每个关节模块的执行器故障的情况考虑到模块化机械臂的分散容错控制方法中是十分必要的。
为了保证面向未知执行器故障的模块化机械臂具有良好的稳定性与精确性,设计龙博格状态观测器估计未知执行器故障,基于关节力矩传感器测得的信息建立综合近似的未知执行器故障、跟踪性能、控制器输出的改进代价函数,利用评价神经网络结构近似最优容错控制器,优化系统跟踪性能的同时减少控制力矩的输出,最终得到分散近似最优控制器,使得模块化机械臂关节子系统在发生执行器故障时,实时补偿模型的不确定性保证实际位置能够跟踪得上期望轨迹的同时,减少控制力矩的输出和资源的消耗。
发明内容
为了解决传统的模块化机械臂主动容错控制系统及其方法中存在的问题,本发明提出的一种考虑执行器故障的机械臂分散最优容错控制方法。
本发明解决技术问题的方案是:
一种考虑执行器故障的机械臂分散最优容错控制方法,该方法为:构建执行器故障下基于关节力矩传感器反馈技术的模块化机械臂系统子关节模型,设计龙博格状态观测器估计未知执行器故障,基于关节力矩传感器测得的信息建立综合近似的未知执行器故障、跟踪性能、控制器输出的改进代价函数,利用评价神经网络结构近似最优容错控制器,优化系统跟踪性能的同时减少控制力矩的输出,最终得到分散近似最优控制器。最后,在不同的执行器故障下,通过不同构形的模块化机械臂进行实验探究验证了该方法的有效性。
一种考虑执行器故障的机械臂分散最优容错控制方法,该方法包括如下步骤:
1.首先建立基于关节力矩传感器的n自由度模块化机械臂系统动力学模型表示为:
Figure BDA0003040671760000021
其中,qi为第i个关节位置;
Figure BDA0003040671760000022
为关节角速度;/>
Figure BDA0003040671760000023
为关节角加速度;Imi为电机转动惯量;γi为减速器的减速比;/>
Figure BDA0003040671760000024
关节间的动力学耦合交联项,/>
Figure BDA0003040671760000025
为包括所有关节的位置、速度、加速度的信息;τfi为关节力矩传感器所测得的力矩信息;τi为电机输出力矩;
Figure BDA0003040671760000026
为第i个关节的执行器故障函数,βi(ti-TFi)=[0,ti<TFior1,ti≥TFi]为阶跃函数且βi为阶跃函数的参数,ti为模块化机械臂运行时刻;TFi为子关节系统发生执行器故障的时间,/>
Figure BDA0003040671760000031
为故障函数,0≤ρFi≤1为故障有效因子;
Figure BDA0003040671760000032
为摩擦力矩项。
通过简化,将第i个关节的动力学模型表示为以下非线性系统Ii的状态空间形式::
Figure BDA0003040671760000033
其中,
Figure BDA0003040671760000034
为模块化机械臂的状态向量表示关节运动角位置和角速度状态,/>
Figure BDA0003040671760000035
为系统状态对时间的微分形式,yi为模块化机械臂系统的输出,Di=(Imiγi)-1∈R+为转动惯量项,ui=τi为第i个关节的控制力矩及执行器输入力矩,Γfi为已知模型项和Θi为模型不确定项包括摩擦力矩模型的建模误差和近似误差,以及关节间的动力学耦合交联项,分别表示为:
Figure BDA0003040671760000036
/>
Figure BDA0003040671760000037
其中,
Figure BDA0003040671760000038
为由摩擦各项估计误差组成的近似误差向量,/>
Figure BDA0003040671760000039
分别为对应摩擦系数fbi,fci,fsi,fτi的估计值,
Figure BDA00030406717600000310
由与关节位置和关节速度有关的函数组成的向量。
2.关节模块的自适应龙博格故障观测器的设计
我们通过设计自适应龙博格故障观测器来实时近似未知的执行器故障:
Figure BDA00030406717600000311
其中,
Figure BDA00030406717600000312
为模块化机械臂关节子系统状态xi的观测值,Ki为观测器给定的正增益,/>
Figure BDA00030406717600000313
为模块化机械臂关节子系统输出yi的观测值,/>
Figure BDA00030406717600000314
为近似的执行器故障。其中,
Figure BDA00030406717600000315
其中,Bi,βi(xi),Ci,Oi为与系统跟动力学信息相关的参数矩阵。定义观测器观测误差EFi为:
Figure BDA0003040671760000041
根据观测器稳定性证明和近似未知故障的准确性,将近似的执行器故障的更新控制律设计为:
Figure BDA0003040671760000042
其中,近似故障的更新律αFi=[α1iα2i]T且α1i2i为相对应的更新律参数,矩阵Λi为控制参数矩阵,可以由求解以下Riccati方程得到:
(Bi-KiOi)TΛii(Bi-KiOi)=-XFi (13)
其中,XFi为一个给定的对称正定矩阵。
3.基于优化思想的最优容错控制器结构
首先定义关节模块位置跟踪误差和速度跟踪误差分别为:
ei=xi-xid (14)
Figure BDA0003040671760000043
其中,ei
Figure BDA0003040671760000044
为模块化机械臂的位置跟踪误差和速度跟踪误差,xid和/>
Figure BDA0003040671760000045
为期望的即任务目标的机械臂关节运动位置和运动速度。为了更好的实现跟踪目标,设计综合关节模块位置信息和速度信息的滑模函数mi(t)为:
Figure BDA0003040671760000046
其中,kei为控制器所设定的参数。
为了实现发生未知执行故障下的模块化机械臂容错控制目标,与传统的控制思想不同,本发明利用优化思想,将分散主动容错控制问题转化为相对应的最优控制问题来解决。将跟踪目标和估计的故障以控制指标的形式放入代价函数中,从而找到最优容错控制策略。因此,建立含有近似执行器故障的代价函数Ji(mi(t)):
Figure BDA0003040671760000047
其中,效应函数Ni(mi(t),ui(mi(t)))=mi(t)TQimi(t)+ui(t)TRiui(t),对于所有mi(t)和ui(t)有不等式Ni(mi(t),ui(mi(t)))≥0成立,并且初始状态Ni(0,0)=0,矩阵Qi和Ri为给定的正数,ρFi,ρyi和ρui为给定的控制器参数,
Figure BDA0003040671760000051
为由自适应龙博格观测器近似的未知执行器故障,Γfi为模块化机械臂可测的模型动力学信息,Gi为模型不确定项Θi的上界参数,且满足不等式/>
Figure BDA0003040671760000052
存在。Ψi(Ω)是由一系列可行的控制策略Ω组成的集合。
通过求解相对应的哈密尔顿-雅可比-贝尔曼方程,可以得到分散最优容错控制器的结构为:
Figure BDA0003040671760000053
4.策略迭代的学习算法
用策略迭代算法来寻找最优控制策略,具体步骤如下:
步骤1:参数初始化,选择j为迭代次数,当j=0,给定一个初始的容许控制策略
Figure BDA0003040671760000054
并选取一个正常数δi;。
步骤2:当j>0时,结合控制策略
Figure BDA0003040671760000055
通过以下的等式来更新代价函数
Figure BDA0003040671760000056
Figure BDA0003040671760000057
这里代价函数
Figure BDA0003040671760000058
步骤3:通过以下等式来更新控制策略
Figure BDA0003040671760000059
Figure BDA00030406717600000510
步骤4:如果
Figure BDA00030406717600000511
停止计算,得到最优控制策略;否则,令j=j+1,转到步骤2;
步骤5:停止。
通过该算法的迭代计算,当j→∞时可以近似计算出最优代价函数
Figure BDA00030406717600000512
和最优控制策略/>
Figure BDA00030406717600000513
5.评价神经网络的构建
建立评价神经网络结构近似相对应的最优代价函数:
Figure BDA00030406717600000514
其中,
Figure BDA00030406717600000515
是理想权值,Ni为隐含层神经元的个数,/>
Figure BDA00030406717600000516
是激活函数,εic为评价神经网络近似残差。将代价函数Ji(mi)的偏导数表示为:
Figure BDA00030406717600000517
其中,
Figure BDA0003040671760000061
和/>
Figure BDA0003040671760000062
分别为激活函数和评价神经网络近似残差的偏导数。并得到名义上的分散最优容错控制策略为:
Figure BDA0003040671760000063
根据名义上的神经网络建立,将哈密尔顿方程改写为:
Figure BDA0003040671760000064
其中,eich为由理想的评价神经网络近似哈密尔顿函数得到的残差。
由于理想的评价神经网络权值Wic我们无法直接得知,所以将评价神经网络近似为:
Figure BDA0003040671760000065
其中,
Figure BDA0003040671760000066
为神经网络权值的近似值。从而,结合最优控制策略和评价神经网络近似能力,利用策略迭代算法,最终得到近似的分散最优容错控制策略为:
Figure BDA0003040671760000067
本发明的有益效果如下:
在机械臂容错控制方面,本发明解决了面向未知执行器故障的模块化机械臂子系统的最优容错控制目标,采用自适应龙博格状态观测器近似估计不确定的子关节模块执行器故障,能够快速响应估计未知的故障信息,保证机械臂系统在发生执行器故障时快速判断并保证系统的安全稳定地运行。
在控制精度方面,本发明将机械臂的容错控制任务转化为相应的最优控制问题来解决,另外利用机械臂本身已知的模型信息,更有针对性地对如机械臂这样的强实时性系统进行补偿和控制目标的有效实现,在保持系统即使在发生故障时仍能安全操作的同时,降低执行器的输出消耗。
因此,本发明解决了现有技术中受未知执行器故障影响的模块化机械臂跟踪任务目标中出现的鲁棒能力差、控制器重构响应速度慢以及系统不稳定运行的问题,为模块化机械臂提供稳定性和精确性,并且可以适用于发生各种可控执行器故障的机械臂系统安全需求。
附图说明
图1为本发明考虑未知执行器故障的模块化机械臂近似最优分散容错控制原理图。
具体实施方式
下面结合附图对本发明做进一步详细说明。
如图1所示,本发明涉及一种考虑执行器故障的机械臂分散最优容错控制方法,具体实现方法和过程如下:
1.基于关节力矩传感器的关节模块子系统动力学模型的建立
考虑未知执行器故障下,基于关节力矩反馈技术的n自由度模块化机械臂系统动力学模型表示为:
Figure BDA0003040671760000071
其中,qi为第i个关节位置;
Figure BDA0003040671760000072
为关节角速度;/>
Figure BDA0003040671760000073
为关节角加速度;Imi为电机转动惯量;γi为减速器的减速比;/>
Figure BDA0003040671760000074
关节间的动力学耦合交联项,/>
Figure BDA0003040671760000075
为包括所有关节的位置、速度、加速度的信息;τfi为关节力矩传感器所测得的力矩信息;τi为电机输出力矩;
Figure BDA0003040671760000076
为第i个关节的执行器故障函数,βi(ti-TFi)=[0,ti<TFior1,ti≥TFi]为阶跃函数且βi为阶跃函数的参数,ti为模块化机械臂运行时刻;TFi为子关节系统发生执行器故障的时间,/>
Figure BDA0003040671760000077
为故障函数,0≤ρFi≤1为故障有效因子;
Figure BDA0003040671760000078
为摩擦力矩项,将定义为一类与关节位置和关节速度有关的函数:
Figure BDA0003040671760000079
其中,fci为库伦摩擦相关参数;fsi为静摩擦相关参数;fτi为位置依赖型摩擦及摩擦建模误差;bfi为待定常数;
Figure BDA00030406717600000713
为非参数化摩擦项。此外,符号函数/>
Figure BDA00030406717600000710
被定义为:
Figure BDA00030406717600000711
考虑到总摩擦力矩
Figure BDA00030406717600000712
主要包括谐波减速器中的柔轮之间摩擦和各关节模块执行电机中的摩擦。由大量学者现有研究可知,所建立的摩擦力矩项的模型(2)是有效且经过实验验证得到的,可将其中的名义系数fbi,fci,fsi,fτi看作与实际值十分接近。因此,根据线性化准则,将关节所受摩擦项有以下方程估计:
Figure BDA0003040671760000081
其中,
Figure BDA0003040671760000082
为由摩擦各项估计误差组成的近似误差向量,/>
Figure BDA0003040671760000083
分别为对应摩擦系数fbi,fci,fsi,fτi的估计值,
Figure BDA0003040671760000084
由与关节位置和关节速度有关的函数组成的向量。
通过上述推导简化整理得知,针对一个n-DOF模块化机械臂系统发生未知执行器故障时,将其第i个关节的动力学模型表示为以下非线性系统的状态空间形式::
Figure BDA0003040671760000085
其中,
Figure BDA0003040671760000086
为模块化机械臂的状态向量表示关节运动角位置和角速度状态,/>
Figure BDA0003040671760000087
为系统状态对时间的微分形式,yi为模块化机械臂系统的输出,Di=(Imiγi)-1∈R+为转动惯量项,ui=τi为第i个关节的控制力矩及执行器输入力矩,Γfi为已知模型项和Θi为模型不确定项包括摩擦力矩模型的建模误差和近似误差,以及关节间的动力学耦合交联项,分别表示为:
Figure BDA0003040671760000088
Figure BDA0003040671760000089
2.子关节模块的自适应龙博格故障观测器的设计
为了建立自适应龙博格故障观测器,我们将模块化机械臂关节子系统(5),表示为以下形式:
Figure BDA00030406717600000810
其中,
Figure BDA00030406717600000811
其中,Bi,βi(xi),Ci,Oi为与系统跟动力学信息相关的参数矩阵。我们通过设计自适应龙博格故障观测器来实时近似未知的执行器故障:
Figure BDA0003040671760000091
其中,
Figure BDA0003040671760000092
为模块化机械臂关节子系统状态xi的观测值,Ki为观测器给定的正增益,/>
Figure BDA0003040671760000093
为模块化机械臂关节子系统输出yi的观测值,/>
Figure BDA0003040671760000094
为近似的执行器故障。定义观测器观测误差EFi为:
Figure BDA0003040671760000095
根据观测器稳定性证明和近似未知故障的准确性,将近似的执行器故障的更新控制律设计为:
Figure BDA0003040671760000096
其中,近似故障的更新律αFi=[α1iα2i]T且α1i2i为相对应的更新律参数,矩阵Λi为控制参数矩阵,可以由求解以下Riccati方程得到:
(Bi-KiOi)TΛii(Bi-KiOi)=-XFi (13)
其中,XFi为一个给定的对称正定矩阵。
3.首先定义关节模块位置跟踪误差和速度跟踪误差分别为:
ei=xi-xid (14)
Figure BDA0003040671760000097
其中,ei
Figure BDA0003040671760000098
为模块化机械臂的位置跟踪误差和速度跟踪误差,xid和/>
Figure BDA0003040671760000099
为期望的即任务目标的机械臂关节运动位置和运动速度。为了更好的实现跟踪目标,设计综合关节模块位置信息和速度信息的滑模函数mi(t)为:
Figure BDA00030406717600000910
其中,kei为控制器所设定的参数。
为了实现发生未知执行故障下的模块化机械臂容错控制目标,与传统的控制思想不同,本发明利用优化思想,将分散主动容错控制问题转化为相对应的最优控制问题来解决。将跟踪目标和估计的故障以控制指标的形式放入代价函数中,从而找到最优容错控制策略。因此,建立含有近似执行器故障的代价函数Ji(mi(t)):
Figure BDA0003040671760000101
其中,效应函数Ni(mi(t),ui(mi(t)))=mi(t)TQimi(t)+ui(t)TRiui(t),对于所有mi(t)和ui(t)有不等式Ni(mi(t),ui(mi(t)))≥0成立,并且初始状态Ni(0,0)=0,矩阵Qi和Ri为给定的正数,ρFi,ρyi和ρui为给定的控制器参数,
Figure BDA0003040671760000102
为由自适应龙博格观测器近似的未知执行器故障,Γfi为模块化机械臂可测的模型动力学信息,Gi为模型不确定项Θi的上界参数,且满足不等式/>
Figure BDA00030406717600001015
存在。Ψi(Ω)是由一系列可行的控制策略Ω组成的集合。
为求解模块化机械臂分散最优容错控制问题,将相对应的哈密尔顿-雅可比-贝尔曼函数
Figure BDA0003040671760000103
和最优代价函数/>
Figure BDA0003040671760000104
定义如下:
Figure BDA0003040671760000105
/>
Figure BDA0003040671760000106
其中,
Figure BDA0003040671760000107
为代价函数Ji(mi)对mi的偏微分函数/>
Figure BDA0003040671760000108
Figure BDA0003040671760000109
表示与速度跟踪误差和期望角加速度相关的函数。利用上述哈密尔顿方程和最优代价函数,结合优化思想,最优代价函数/>
Figure BDA00030406717600001010
满足于哈密尔顿方程:
Figure BDA00030406717600001011
如果
Figure BDA00030406717600001012
存在且连续可微,我们可以得到考虑未知执行器故障的模块化机械臂系统分散最优容错控制策略为:
Figure BDA00030406717600001013
并通过整理和推导可以得到等式:
Figure BDA00030406717600001014
4.策略迭代的学习算法
接下来,利用策略迭代算法来寻找最优控制策略,它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优控制策略。策略迭代算法由策略评估和策略改进两部分组成。具体步骤如下:
步骤1:参数初始化,选择j为迭代次数,当j=0,给定一个初始的容许控制策略
Figure BDA0003040671760000111
并选取一个正常数δi;。
步骤2:当j>0时,结合控制策略
Figure BDA0003040671760000112
通过以下的等式来更新代价函数
Figure BDA0003040671760000113
Figure BDA0003040671760000114
这里代价函数
Figure BDA0003040671760000115
步骤3:通过以下等式来更新控制策略
Figure BDA0003040671760000116
Figure BDA0003040671760000117
步骤4:如果
Figure BDA0003040671760000118
停止计算,得到最优控制策略;否则,令j=j+1,转到步骤2;
步骤5:停止。
通过该算法的迭代计算,当j→∞时可以近似计算出最优代价函数
Figure BDA0003040671760000119
和最优控制策略/>
Figure BDA00030406717600001110
5.评价神经网络的构建
为了找到最优控制策略,需要求解哈密尔顿方程得到最优代价函数,然后将解结合策略迭代算法得到最优控制策略。对于如模块化机械臂系统这样的高度非线性系统,哈密尔顿方程是一个计算量大且求解困难的非线性偏微分方程。因此,我们需要利用神经网络的逼近能力来近似得到最优代价函数,从而才能通过策略迭代算法找到最优控制策略。
建立评价神经网络结构近似相对应的最优代价函数:
Figure BDA00030406717600001111
其中,
Figure BDA00030406717600001112
是理想权值,Ni为隐含层神经元的个数,/>
Figure BDA00030406717600001113
是激活函数,εic为评价神经网络近似残差。将代价函数Ji(mi)的偏导数表示为:
Figure BDA00030406717600001114
其中,
Figure BDA0003040671760000121
和/>
Figure BDA0003040671760000122
分别为激活函数和评价神经网络近似残差的偏导数。并得到名义上的分散最优容错控制策略为:
Figure BDA0003040671760000123
根据名义上的神经网络建立,将哈密尔顿方程改写为:
Figure BDA0003040671760000124
其中,eich为由理想的评价神经网络近似哈密尔顿函数得到的残差。
由于理想的评价神经网络权值Wic我们无法直接得知,所以将评价神经网络近似为:
Figure BDA0003040671760000125
其中,
Figure BDA0003040671760000126
为神经网络权值的近似值。从而,得到近似分散最优容错控制策略/>
Figure BDA0003040671760000127
Figure BDA0003040671760000128
进而,得到近似的哈密尔顿函数为:
Figure BDA0003040671760000129
其中,ec是估计的哈密尔顿函数的近似误差,通过采用梯度下降算法最小化目标函数
Figure BDA00030406717600001210
以调整神经网络权值向量/>
Figure BDA00030406717600001211
设计其更新策略为:/>
Figure BDA00030406717600001212
其中,αc为评价神经网络权值的更新学习律。
因此,针对发生未知执行器故障的模块化机械臂系统,结合最优控制策略和评价神经网络近似能力,利用策略迭代算法,最终得到近似的分散最优容错控制策略为:
Figure BDA00030406717600001213
6.实验验证
利用本实验室搭建的2自由度模块化机械臂实物,对所提出的分散近似最优容错控制器进行实验验证其有效性。该2自由度模块化机械臂由两组相同关节模块和连杆组成,其中每个关节模块包含一个Maxon直流有刷电动机作为各个关节模块的执行单元,一个增量式编码器来测量电机端的位移;一个绝对式编码器来采集连杆端的绝对位置,一个谐波减速器用于给电机减速并增大扭矩和一个在关节与连杆之间的力矩传感器来测量关节模块所受到的力矩,具体型号和额定参数参见表格1。接下来是数据采集和处理部分,采用Quanser公司生产的线性功率放大器驱动关节模块的电机以及QPIDe数据采集卡采集各个传感器的数据信息,将采集的实验数据送到计算机的Simulink仿真软件中进行处理和模块化机械臂控制模型的搭建,再通过QUARC软件与QPIDe数据采集卡进行通信,最终实现对该2自由度模块化机械臂的控制。
表1实验设备的型号和机械参数
Figure BDA0003040671760000131
在自由空间下,给定关节1和关节2的期望跟踪轨迹分别为:
Figure BDA0003040671760000132
Figure BDA0003040671760000133
对于评价神经网络部分,我们利用径向基函数神经网络近似最优代价函数。选取1-5-1的网络结构,即1个输入,5个隐含层和1个输出。神经网络权值定义为:
Figure BDA0003040671760000134
给定权值初始值为/>
Figure BDA0003040671760000135
激活函数为径向基函数表示为:/>
Figure BDA0003040671760000141
其中,bj=1.5,j=1,2,3,4,5,c1j=[-1,-0.5,0,0.5,1]T和c2j=[-2,-1,0,1,2]T。关于模型的参数将在表2中体现。
表2参数的设定
Figure BDA0003040671760000142
选取故障参数ρFi分别为0.7和0.5,针对不同关节的不同故障情况进行实验验证。通过实验结果证实所提出的考虑执行器故障的分散近似最优容错控制器为模块化机械臂提供稳定性和精确性,以保证各种执行器故障情况下系统的稳定运行。

Claims (1)

1.一种考虑执行器故障的机械臂分散最优容错控制方法,该方法为:构建执行器故障下基于关节力矩传感器反馈技术的模块化机械臂系统子关节模型,设计龙博格状态观测器估计未知执行器故障,基于关节力矩传感器测得的信息建立综合近似的未知执行器故障、跟踪性能、控制器输出的改进代价函数,利用评价神经网络结构近似最优容错控制器,优化系统跟踪性能的同时减少控制力矩的输出,最终得到分散近似最优控制器;最后,在不同的执行器故障下,通过不同构形的模块化机械臂进行实验探究验证了该方法的有效性;
所述方法包括以下步骤:
步骤一,考虑未知执行器故障下,基于关节力矩反馈技术的n自由度模块化机械臂系统动力学模型表示为:
Figure FDA0004166152550000011
其中,qi为第i个关节位置;
Figure FDA0004166152550000012
为关节角速度;/>
Figure FDA0004166152550000013
为关节角加速度;Imi为电机转动惯量;γi为减速器的减速比;/>
Figure FDA0004166152550000014
关节间的动力学耦合交联项,/>
Figure FDA0004166152550000015
为包括所有关节的位置、速度、加速度的信息;τfi为关节力矩传感器所测得的力矩信息;τi为电机输出力矩;
Figure FDA0004166152550000016
为第i个关节的执行器故障函数,βi(ti-TFi)=[0,ti<TFi or1,ti≥TFi]为阶跃函数且βi为阶跃函数的参数,ti为模块化机械臂运行时刻;TFi为子关节系统发生执行器故障的时间,为故障函数,0≤ρFi≤1为故障有效因子;/>
Figure FDA0004166152550000017
为摩擦力矩项,将定义为一类与关节位置和关节速度有关的函数:
Figure FDA0004166152550000018
其中,fci为库伦摩擦相关参数;fsi为静摩擦相关参数;fτi为位置依赖型摩擦及摩擦建模误差;bfi为待定常数;
Figure FDA0004166152550000019
为非参数化摩擦项;此外,符号函数/>
Figure FDA00041661525500000110
被定义为:
Figure FDA00041661525500000111
考虑到总摩擦力矩
Figure FDA00041661525500000112
主要包括谐波减速器中的柔轮之间摩擦和各关节模块执行电机中的摩擦;所建立的摩擦力矩项的模型(2)是有效且经过实验验证得到的,可将其中的名义系数fbi,fci,fsi,fτi看作与实际值十分接近;因此,根据线性化准则,将关节所受摩擦项有以下方程估计:
Figure FDA0004166152550000021
其中,
Figure FDA0004166152550000022
为由摩擦各项估计误差组成的近似误差向量,/>
Figure FDA0004166152550000023
分别为对应摩擦系数fbi,fci,fsi,fτi的估计值,/>
Figure FDA0004166152550000024
由与关节位置和关节速度有关的函数组成的向量;
通过上述推导简化整理得知,针对一个n-DOF模块化机械臂系统发生未知执行器故障时,将其第i个关节的动力学模型表示为以下非线性系统的状态空间形式:
Figure FDA0004166152550000025
其中,
Figure FDA0004166152550000026
为模块化机械臂的状态向量表示关节运动角位置和角速度状态,/>
Figure FDA0004166152550000027
为系统状态对时间的微分形式,yi为模块化机械臂系统的输出,Di=(Imiγi)-1∈R+为转动惯量项,ui=τi为第i个关节的控制力矩及执行器输入力矩,Γfi为已知模型项和Θi为模型不确定项包括摩擦力矩模型的建模误差和近似误差,以及关节间的动力学耦合交联项,分别表示为:
Figure FDA0004166152550000028
Figure FDA0004166152550000029
步骤二,为了建立自适应龙博格故障观测器,将模块化机械臂关节子系统(5),表示为以下形式:
Figure FDA00041661525500000210
其中,
Figure FDA0004166152550000031
其中,Bi,βi(xi),Ci,Oi为与系统跟动力学信息相关的参数矩阵;通过设计自适应龙博格故障观测器来实时近似未知的执行器故障:
Figure FDA0004166152550000032
其中,
Figure FDA0004166152550000033
为模块化机械臂关节子系统状态xi的观测值,Ki为观测器给定的正增益,/>
Figure FDA0004166152550000034
为模块化机械臂关节子系统输出yi的观测值,/>
Figure FDA0004166152550000035
为近似的执行器故障;定义观测器观测误差EFi为:
Figure FDA0004166152550000036
根据观测器稳定性证明和近似未知故障的准确性,将近似的执行器故障的更新控制律设计为:
Figure FDA0004166152550000037
其中,近似故障的更新律αFi=[α1i α2i]T且α1i2i为相对应的更新律参数,矩阵Λi为控制参数矩阵,可以由求解以下Riccati方程得到:
(Bi-KiOi)TΛii(Bi-KiOi)=-XFi (13)
其中,XFi为一个给定的对称正定矩阵;
步骤三,定义关节模块位置跟踪误差和速度跟踪误差分别为:
ei=xi-xid (14)
Figure FDA0004166152550000038
其中,ei和为模块化机械臂的位置跟踪误差和速度跟踪误差,xid
Figure FDA0004166152550000039
为期望的即任务目标的机械臂关节运动位置和运动速度;为了更好的实现跟踪目标,设计综合关节模块位置信息和速度信息的滑模函数mi(t)为:
Figure FDA00041661525500000310
其中,kei为控制器所设定的参数;
为了实现发生未知执行故障下的模块化机械臂容错控制目标,将跟踪目标和估计的故障以控制指标的形式放入代价函数中,从而找到最优容错控制策略;因此,建立含有近似执行器故障的代价函数Ji(mi(t)):
Figure FDA0004166152550000041
其中,效应函数Ni(mi(t),ui(mi(t)))=mi(t)TQimi(t)+ui(t)TRiui(t),对于所有mi(t)和ui(t)有不等式Ni(mi(t),ui(mi(t)))≥0成立,并且初始状态Ni(0,0)=0,矩阵Qi和Ri为给定的正数,ρFi,ρyi和ρui为给定的控制器参数,
Figure FDA0004166152550000042
为由自适应龙博格观测器近似的未知执行器故障,Γfi为模块化机械臂可测的模型动力学信息,Gi为模型不确定项Θi的上界参数,且满足不等式/>
Figure FDA0004166152550000043
存在;Ψi(Ω)是由一系列可行的控制策略Ω组成的集合;
为求解模块化机械臂分散最优容错控制问题,将相对应的哈密尔顿-雅可比-贝尔曼函数
Figure FDA0004166152550000044
和最优代价函数/>
Figure FDA0004166152550000045
定义如下:
Figure FDA0004166152550000046
Figure FDA0004166152550000047
其中,
Figure FDA0004166152550000048
为代价函数Ji(mi)对mi的偏微分函数,/>
Figure FDA0004166152550000049
表示与速度跟踪误差和期望角加速度相关的函数;利用上述哈密尔顿-雅可比-贝尔曼函数和最优代价函数,结合优化思想,最优代价函数/>
Figure FDA00041661525500000410
满足于哈密尔顿-雅可比-贝尔曼函数:
Figure FDA00041661525500000411
如果
Figure FDA00041661525500000412
存在且连续可微,可以得到考虑未知执行器故障的模块化机械臂系统分散最优容错控制策略为:
Figure FDA0004166152550000051
并通过整理和推导可以得到等式:
Figure FDA0004166152550000052
步骤四,利用策略迭代算法来寻找最优控制策略,它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优控制策略,策略迭代算法由策略评估和策略改进两部分组成,具体步骤如下:
Figure FDA0004166152550000053
步骤2:当j>0时,结合控制策略
Figure FDA0004166152550000054
通过以下的等式来更新代价函数
Figure FDA0004166152550000055
这里代价函数
Figure FDA0004166152550000056
步骤3:通过以下等式来更新控制策略
Figure FDA0004166152550000057
Figure FDA0004166152550000058
步骤4:如果
Figure FDA0004166152550000059
停止计算,得到最优控制策略;否则,令j=j+1,转到步骤2;
步骤5:停止;
通过该算法的迭代计算,当j→∞时可以近似计算出最优代价函数
Figure FDA00041661525500000510
和最优控制策略/>
Figure FDA00041661525500000511
步骤五,为了找到最优控制策略,需要求解哈密尔顿-雅可比-贝尔曼函数得到最优代价函数,然后将解结合策略迭代算法得到最优控制策略;利用神经网络的逼近能力来近似得到最优代价函数,从而才能通过策略迭代算法找到最优控制策略;
建立评价神经网络结构近似相对应的最优代价函数:
Figure FDA0004166152550000061
其中,
Figure FDA0004166152550000062
是理想权值,Ni为隐含层神经元的个数,δic(mi)∈RN是激活函数,εic为评价神经网络近似残差;将代价函数Ji(mi)的偏导数表示为:
Figure FDA0004166152550000063
其中,
Figure FDA0004166152550000064
和/>
Figure FDA0004166152550000065
分别为激活函数和评价神经网络近似残差的偏导数;并得到名义上的分散最优容错控制策略为:
Figure FDA0004166152550000066
根据名义上的神经网络建立,哈密尔顿-雅可比-贝尔曼函数改写为:
Figure FDA0004166152550000067
其中,eich为由理想的评价神经网络近似哈密尔顿-雅可比-贝尔曼函数得到的残差;
由于理想的评价神经网络权值Wic无法直接得知,所以将评价神经网络近似为:
Figure FDA0004166152550000068
其中,
Figure FDA0004166152550000069
为神经网络权值的近似值;从而,得到近似分散最优容错控制策略/>
Figure FDA00041661525500000610
为:
Figure FDA00041661525500000611
进而,得到近似的哈密尔顿-雅可比-贝尔曼函数为:
Figure FDA00041661525500000612
其中,ec是估计的哈密尔顿-雅可比-贝尔曼函数的近似误差,通过采用梯度下降算法最小化目标函数
Figure FDA0004166152550000071
以调整神经网络权值向量/>
Figure FDA0004166152550000072
设计其更新策略为:
Figure FDA0004166152550000073
其中,αc为评价神经网络权值的更新学习律;
因此,针对发生未知执行器故障的模块化机械臂系统,结合最优控制策略和评价神经网络近似能力,利用策略迭代算法,最终得到近似的分散最优容错控制策略为:
Figure FDA0004166152550000074
/>
CN202110488652.4A 2021-04-27 2021-04-27 一种考虑执行器故障的机械臂分散最优容错控制方法 Active CN113146640B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110488652.4A CN113146640B (zh) 2021-04-27 2021-04-27 一种考虑执行器故障的机械臂分散最优容错控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110488652.4A CN113146640B (zh) 2021-04-27 2021-04-27 一种考虑执行器故障的机械臂分散最优容错控制方法

Publications (2)

Publication Number Publication Date
CN113146640A CN113146640A (zh) 2021-07-23
CN113146640B true CN113146640B (zh) 2023-06-13

Family

ID=76873428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110488652.4A Active CN113146640B (zh) 2021-04-27 2021-04-27 一种考虑执行器故障的机械臂分散最优容错控制方法

Country Status (1)

Country Link
CN (1) CN113146640B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113625572B (zh) * 2021-09-08 2024-04-02 北京理工大学 基于工业互联网的机械臂复合容错控制器系统
CN113885499B (zh) * 2021-10-08 2023-06-06 四川大学 腔体内检测用机器人轨迹容错控制方法
CN113954069B (zh) * 2021-10-25 2023-01-13 清华大学深圳国际研究生院 一种基于深度强化学习的机械臂主动容错控制方法
CN114083543B (zh) * 2021-12-22 2023-04-18 清华大学深圳国际研究生院 一种空间机械臂主动故障诊断方法
CN113997317B (zh) * 2021-12-29 2023-10-13 南京邮电大学 基于事件触发机制的三连杆机械手执行器故障检测方法
CN114406996B (zh) * 2021-12-30 2023-05-26 长春工业大学 一种输入受限机械臂的合作博弈最优跟踪控制方法及系统
CN115139340B (zh) * 2022-09-01 2022-11-18 北京科技大学 一种失效故障下柔性机器人关节神经网络观测器设计方法
CN116339154A (zh) * 2023-05-30 2023-06-27 湖南工商大学 空间机器人捕获卫星操作的智能容错控制方法及设备
CN117311147B (zh) * 2023-09-25 2024-03-19 安徽大学 基于双层级观测器的模块化机器人分散最优容错控制系统与方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110170992A (zh) * 2019-04-02 2019-08-27 长春工业大学 一种基于动态规划的模块化机械臂多故障容错控制方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2716270B2 (ja) * 1990-12-27 1998-02-18 株式会社日立製作所 マニピュレ−タ
US6643569B2 (en) * 2001-03-30 2003-11-04 The Regents Of The University Of Michigan Method and system for detecting a failure or performance degradation in a dynamic system such as a flight vehicle
CN101481019B (zh) * 2009-02-20 2010-10-13 华中科技大学 一种用于卫星姿态控制系统的传感器容错观测方法
CN105196294B (zh) * 2015-10-29 2017-03-22 长春工业大学 采用位置测量的可重构机械臂分散控制系统及控制方法
DE102016005366B4 (de) * 2016-04-25 2022-05-25 Franka Emika Gmbh Roboter mit einer für einen Netzausfall abgesicherten Steuerung
CN107121977B (zh) * 2017-06-02 2019-07-16 南京邮电大学 基于双层结构的机械臂执行器故障容错控制系统及其方法
CN109986562B (zh) * 2019-04-11 2021-09-17 南京航空航天大学 一种平面机械臂系统及其分散式容错控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110170992A (zh) * 2019-04-02 2019-08-27 长春工业大学 一种基于动态规划的模块化机械臂多故障容错控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
二自由度可重构机械臂轨迹跟踪控制;张振国;《长春工业大学学报》;第41卷(第6期);第550-557页 *

Also Published As

Publication number Publication date
CN113146640A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN113146640B (zh) 一种考虑执行器故障的机械臂分散最优容错控制方法
CN108789417B (zh) 基于自适应动态规划的可重构机械臂保代价分散控制方法
CN110170992B (zh) 一种基于动态规划的模块化机械臂多故障容错控制方法
Eski et al. Fault detection on robot manipulators using artificial neural networks
CN113211446B (zh) 一种事件触发-神经动态规划的机械臂分散跟踪控制方法
Van et al. A novel neural second-order sliding mode observer for robust fault diagnosis in robot manipulators
Tian et al. Sensorless collision detection and contact force estimation for collaborative robots based on torque observer
Ge et al. Dynamic parameter identification for reconfigurable robot using adaline neural network
CN113093538A (zh) 一种模块化机器人系统的非零和博弈神经-最优控制方法
Olma et al. Observer-based nonlinear control strategies for Hardware-in-the-Loop simulations of multiaxial suspension test rigs
CN114310911A (zh) 基于神经网络的驱动关节动态误差预测与补偿系统及方法
Jiang et al. Neural network aided dynamic parameter identification of robot manipulators
Salmasi et al. A manoeuvre control strategy for flexible-joint manipulators with joint dry friction
CN115890650A (zh) 一种可重构机械臂事件触发分散最优容错控制方法及系统
CN114211478B (zh) 一种模块化机械臂协调操作最优控制方法及系统
Zhao et al. Decentralized sliding mode observer based dual closed-loop fault tolerant control for reconfigurable manipulator against actuator failure
Tinós et al. Fault tolerance in cooperative manipulators
CN111775142B (zh) 一种液压机械臂的模型辨识与自适应控制方法
Dong et al. Decentralized robust optimal control for modular robot manipulators based on zero-sum game with ADP
Khosla et al. An algorithm to estimate manipulator dynamics parameters
CN113733094A (zh) 一种高欠驱动空间机械臂可控程度表征方法
Panwar et al. Design of optimal hybrid position/force controller for a robot manipulator using neural networks
Nicosia et al. A method for the state estimation of elastic joint robots by global position measurements
Parvaresh et al. Data-Driven Model-Free Control of Torque-Applying System for a Mechanically Closed-Loop Test Rig Using Neural Networks.
Zuev et al. The Development of Fault Detection and Identification Systems for Underwater Manipulators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant