CN117311147B - 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 - Google Patents
基于双层级观测器的模块化机器人分散最优容错控制系统与方法 Download PDFInfo
- Publication number
- CN117311147B CN117311147B CN202311244051.4A CN202311244051A CN117311147B CN 117311147 B CN117311147 B CN 117311147B CN 202311244051 A CN202311244051 A CN 202311244051A CN 117311147 B CN117311147 B CN 117311147B
- Authority
- CN
- China
- Prior art keywords
- subsystem
- fault
- observer
- tolerant control
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000003416 augmentation Effects 0.000 claims abstract description 26
- 238000011217 control strategy Methods 0.000 claims abstract description 16
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 230000009466 transformation Effects 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 6
- 239000006185 dispersion Substances 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 2
- 239000010410 layer Substances 0.000 claims 3
- 239000002355 dual-layer Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 3
- 230000008878 coupling Effects 0.000 description 11
- 238000010168 coupling process Methods 0.000 description 11
- 238000005859 coupling reaction Methods 0.000 description 11
- 238000013461 design Methods 0.000 description 10
- 230000004913 activation Effects 0.000 description 4
- 238000005265 energy consumption Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了基于双层级观测器的模块化机器人分散最优容错控制系统与方法,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,构建第一层级观测器以辨识子系统动力学模型,建立增广子系统以及相应的最优代价函数,得到HJB方程,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律,在机器人系统发生执行器乘性故障时,构建第二层级观测器,以估计执行器有效因子,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。本发明能够达到满意的容错控制效果,满足应用需求。
Description
技术领域
本发明属于机器人容错控制技术领域,具体涉及基于双层级观测器的模块化机器人分散最优容错控制系统与方法。
背景技术
随着社会和工业需求的不断演变,模块化机器人在各个领域都扮演着十分重要的角色。模块化机器人可以通过利用不同关节模块的组合来变换构形以自适应地完成各种任务,具有通用性、适应性、可配置性。模块化机器人在各种高危作业以及较恶劣的环境中具有广泛的应用潜力,如:太空探索、深海勘探、智能制造、高温高压环境等。于模块化机器人的控制策略而言,主要采用集中集中控制与分散控制方式。相比于集中控制方式,分散控制仅使用子系统动力学信息来设计调控策略,可以独立部署到各子系统,能够充分体现“模块化”的特点,更加适用于模块化机器人系统。
实际应用中,长期工作在恶劣的环境下模块化机器人系统难免会发生执行器或传感器故障,任何一种故障的出现,都可能会影响整个系统的控制品质下降,甚至危及人身财产安全。因此,研究有效的容错控制方法是解决这一问题的关键。目前,学者们提出主动容错控制和被动容错控制方法,已取得一些研究成果。尽管这些方法可以使得系统控制性能恢复至良好的控制水平,但较少兼顾考虑系统性能优化问题,即在保证系统稳定性的同时,尽可能降低能耗代价,避免维持控制系统稳定的客观硬件成本投入较大。因此,研究一种具有系统优化能力的安全控制方法以平衡故障系统的稳定性和最优性至关重要。
自适应动态规划(Adaptive dynamic programming,ADP)作为一种能够解决传统动态规划算法常导致的“维数灾”问题的有效方法,利用神经网络,结合动态规划、强化学习等技术近似Hamilton-Jacobi-Bellman(HJB)方程的解,实现最优控制系统。多年来,利用ADP的最优控制方法来研究模块化机器人的轨迹跟踪、容错控制等问题取得了一些理论成果与进展。然而在现有分散最优容错方案中,更多关注的是执行器的加性故障(即偏差故障),相比而言,集成到执行器中的乘性故障(即部分失效)更难以处理。此外,在求解HJB方程所需构建的评判网络的权重向量和闭环系统只能保证收敛到一个小邻域内,而非渐近收敛至系统的平衡点。
综上所述,针对发生执行器乘性故障的模块化机器人系统,利用自适应动态规划理论,结合分散控制设计方式与观测器技术,开发一种基于双层级观测器的模块化机器人分散最优容错控制方案,以实现系统在进行有效容错控制的前提下尽可能降低能耗代价,避免维持控制系统稳定的客观硬件成本投入较大是十分必要的。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供基于双层级观测器的模块化机器人分散最优容错控制系统与方法,针对发生执行器乘性故障的模块化机器人系统,考虑模块机器人系统的强耦合、强非线性、高维度带来的控制系统复杂的问题,进行基于双层级观测器的分散最优容错控制。为了释放系统的强耦合互联项需满足上界已知的强假设条件,采用耦合关节子系统的实际状态辅助变换为参考状态,构建第一层级观测器辨识子系统动力学模型;采用跟踪误差动力学和参考轨迹动力学建立增广子系统,设计相应的改进代价函数,并构建协同调节的自适应评判结构求解HJB方程,得到无故障情形下的分散跟踪控制律;在系统发生执行器乘性故障时,构建第二层级观测器估计执行器有效因子,并将其与分散跟踪控制律合成容错控制策略,从而保证闭环系统渐近稳定。本发明仅用单个神经网络整体辨识系统动态,通过偏微分获得控制系数矩阵,简化训练并提高了执行效率。同时,所采用的控制结构设计简单,具有智能性与自适应性,评判网络的权值误差与闭环系统的稳定性均提升至大范围渐近稳定,能够达到满意的容错控制效果,满足应用需求。
为实现上述技术目的,本发明采取的技术方案为:
基于双层级观测器的模块化机器人分散最优容错控制方法,包括:
步骤1,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设;
步骤2,在步骤1基础上,构建第一层级观测器以辨识子系统动力学模型;
步骤3,建立增广子系统以及相应的最优代价函数,进而得到HJB方程;
步骤4,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;
步骤5,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;
步骤6,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。
为优化上述技术方案,采取的具体措施还包括:
上述的步骤2仅采用单个神经网络结合自适应鲁棒项,构建第一层级观测器,以整体辨识系统动态,并通过偏微分操作获得控制系数矩阵,即子系统动力学模型,进行简化训练过程。
上述的第一层级观测器如下:
式中,为是观测器的状态向量,diag[ki1o,ki2o]为正定的观测器增益矩阵,/>为模块子系统的观测误差,/>为自适应鲁棒项,xjd(j=1,2,…,i-1,i+1,…,n)表示第j个互联模块子系统的参考状态,为非线性项的神经网络形式,/> 为学习率。
上述的步骤3定义各模块子系统增广状态ei为跟踪误差,xid为期望轨迹,则建立第i个模块子系统的增广动力学,即增广子系统为:
式中, 和η=[xj,xjd]T。
上述的步骤3建立的最优代价函数为:
所述HJB方程如下:
式中,Θi表示Lipschitz常数,关于增广状态ηi的偏导数,/> 与/>为正定矩阵,0n×n表示全0的方阵;υi是υ的第i行,/>为关节控制力拒。
上述的步骤4所述自适应评判网络的权重协同调节律如式(40)-(41)所示:
式中,为理想权重,/>为权重近似误差,γic,γiφ,βi均为评判网络的学习参数,鲁棒项/>为φiM的估计值,/>为最小化目标函数。
上述的步骤5构建的第二层级观测器如下:
式中,是观测误差,/>是重构系统的状态向量,/>是观测器增益矩阵,/> 为学习率;
表示控制系数矩阵/>的估计值,/>表示有效因子的估计值,/>表示子系统的控制输入。
上述的步骤5所述有效因子的自适应更新律为:
上述的步骤6所述分散最优容错控制策略为:
式中,表示分散最优容错控制律,/>表示分散跟踪控制律。
基于双层级观测器的模块化机器人分散最优容错控制系统,包括:
模型辨识模块,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设,构建第一层级观测器以辨识子系统动力学模型;
评判网络模块,建立增广子系统以及相应的最优代价函数,进而得到HJB方程,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;
有效因子辨识模块,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;
控制系统模块,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。
本发明具有以下有益效果:
(1)本发明利用辅助变换操作,将耦合关节子系统的实际状态辅助变换为参考状态,释放耦合互联项上界已知的强假设条件,有效保证了独立模块子系统仅含自身关节信息,完成模型解耦,提升了本发明的可移植性,更加有利于实际场景应用。
(2)本发明仅采用单个神经网络结合自适应鲁棒项,构建第一层级观测器整体辨识系统动态,并通过偏微分操作获得控制系数矩阵,简化了训练过程,提高了本发明的执行效率。
(3)本发明采用协同调节权重的自适应评判机制,近似求解HJB方程的解,进而获取分散最优跟踪控制策略,保证了评判网络权重误差的渐近稳定,增强了评判网络的稳定性。
(4)本发明利用第二层级观测器估计的有效因子,结合分散跟踪控制律,得出分散最优容错控制策略,降低了模块化机器人系统运行的计算负担与能耗代价,规避了维持控制系统稳定的客观硬件成本投入较大,确保了系统稳定的前提下,实现执行器失效状态下系统的最优主动安全控制,进一步增强了控制系统的实用性。
附图说明
图1是本发明模块化机器人分散控制结构图;
图2是本发明基于双层级观测器的模块化机器人分散最优容错控制系统与方法原理图;
图3是本发明基于双层级观测器的模块化机器人分散最优容错控制系统与方法软件程序流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。
如图1所示,本发明模块化机器人分散控制结构图,基于n自由度模块化机器人特有的模块化属性,从其动力学模型中分离出关节模块的局部变量,将其分解为n个相互交联的子系统集合,然后采用子系统局部信息设计子系统控制器,并抑制子系统间的互联作用。其优点是控制系统复杂性从系统级变为分散级,使得控制系统结构、算法设计都大为简化,容错能力增强。
如图2所示,本发明基于双层级观测器的模块化机器人分散最优容错控制方法原理图,首先,通过将互联子系统的实际状态辅助变换为相应的出参考状态,释放了互联项的上界假设。其次,建立了双层级观测器结构。在第一级中,建立神经网络观测器,获得子系统的动态与控制系数矩阵。在第二级中,设计神经网络观测器估计子系统执行器的有效因子。采用跟踪误差动力学和参考轨迹动力学建立增广子系统,设计改进的局部代价函数,并构造协同调节的自适应评判结构对HJB方程进行求解得到分散最优跟踪控制律。最后,将分散最优跟踪控制律与估计的有效因子组合构成分散最优容错控制律,进而实现模块化机器人的分散最优容错控制。
具体的,本发明基于双层级观测器的模块化机器人分散最优容错控制方法,包括:
步骤1,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设;该步骤通过利用辅助变换操作,将耦合关节子系统的实际状态辅助变换为参考状态,释放耦合互联项上界已知的强假设条件,有效保证了独立模块子系统仅含自身关节信息,完成模型解耦,提升了本发明的可移植性,更加有利于实际场景应用。
步骤2,在步骤1基础上,构建第一层级观测器以辨识子系统动力学模型;该仅采用单个神经网络结合自适应鲁棒项,构建第一层级观测器,整体辨识系统动态,并通过偏微分操作获得控制系数矩阵,简化了训练过程,提高了本发明的执行效率。
步骤3,建立增广子系统以及相应的最优代价函数,进而得到HJB方程;
步骤4,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;该步骤采用协同调节权重的自适应评判机制,近似求解HJB方程的解,进而获取分散最优跟踪控制策略,保证了评判网络权重误差的渐近稳定,增强了评判网络的稳定性。
步骤5,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;
步骤6,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。该步骤利用第二层级观测器估计的有效因子,结合分散最优跟踪控制律,提出了分散最优容错控制系统与方法,降低了模块化机器人系统运行的计算负担与能耗代价,规避了维持控制系统稳定的客观硬件成本投入较大,确保了系统稳定的前提下,实现执行器失效状态下系统的最优主动安全控制,进一步增强了控制系统的实用性。
本发明基于双层级观测器的模块化机器人分散最优容错控制系统,包括:
模型辨识模块,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设,构建第一层级观测器以辨识子系统动力学模型;实施例中,其将机器人耦合关节的实际状态辅助变换为参考状态,利用模块化机器人各模块子系统输入/输出数据建立第一层级观测器,得到模块子系统局部输入矩阵;
评判网络模块,建立增广子系统以及相应的最优代价函数,进而得到HJB方程,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;实施例中,其利用协同调节权重的自适应评判结构求解HJB方程,得到分散跟踪控制律;
有效因子辨识模块,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;其基于第一层级观测器构建,可在线估计执行器有效因子;
控制系统模块,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。最后,将得到的分散最优容错控制策略应用于模块化机器人系统,可实现基于双层级观测器的模块化机器人分散最优容错控制。实施例中,采用MATLAB软件进行程序编译,并生成.m文件进行软件封装,分散最优容错控制结果以Word、Excel保存或者图表的形式显示。
其中所涉及的关键处理过程如下:
1.故障模块子系统模型与耦合互联项处理
考虑n自由度模块化机器人的动力学模型为
式中,是关节位移向量,/>为惯性矩阵,/>为哥氏力和离心力项,/>为重力项,/>为关节控制力拒。
首先将模块化机器人的每个关节模块考虑为一个模块子系统,从式(1)中分离出依赖于局部关节变量的项,则子系统的动力学模型可以表征为
式中
式中,qi,Gi(q)和υi分别为向量q,/>G(q)和υ的第i个分量,Mij(q)和分别为矩阵M(q)和/>的第ij个分量。/>为耦合的互联项,υi是υ的第i行。
令当系统(2)发生执行器乘性故障情形,可以表示为如下的状态空间方程形式
且
式中,xi=[x1,...,xn]Τ是整个系统(1)的状态,为执行器有效因子,且/>
为了释放耦合互联项需满足匹配性条件和已知上界假设,本发明将互联项中耦合子系统的实际状态辅助变换为相对应的参考状态。因此,式(3)中的互联项可变为
式中,xjd(j=1,2,...,i-1,i+1,...,n)表示第j个关联模块子系统的参考状态,是辅助变换后的互联项,其中包含从/>提取的第i个关节模块的状态信息和第j个关节模块的参考状态信息,/>表示辅助变换误差。因此,式(4)进一步表示为
式中,进一步将上式变形为
式中,
假设1:非线性函数和/>满足Lipschitz连续条件,关节模块的动力学模型(6)是可控的,且/>为系统的一个平衡点。
假设2:各模块子系统的期望轨迹xid二阶可微,且向量范数有界,即存在未知的常数/>使得
||Φid||≤ΦiK (7)
根据假设1,互联项的辅助变换误差满足整体Lipschitz条件且范数有界,即满足下列条件
式中,Θk=||xk-xkd||,且τik>0,是未知的Lipschitz常数。
2.基于双层级观测器的模块化机器人分散最优容错控制方法
2.1增广子系统与代价函数设计
第i个模块子系统的参考轨迹动力学为
式中,Kid表示一个微分函数。
针对第i个模块子系统,定义跟踪误差为ei=xi-xid。因此,得到跟踪误差动力学表示如下
为了实现轨迹跟踪控制,构建增广子系统,定义各模块子系统增广状态因此,第i个模块子系统的增广动力学可以表示为
式中, 和/>
由此,将上述分散跟踪控制问题转化为增广子系统的最优控制问题来处理。于是,定义标称增广子系统的动力学如下(即子系统(11)未发生故障情形,)
针对第i个模块子系统,定义代价函数为
式中,为δi的估计值,Θi表示与Θk相同的含义,关于ηi的偏导数,/> 与/>为正定矩阵,0n×n表示全0的方阵。
由此,最优代价函数可以表述为
如果式(14)连续可微,可以得到
因此,针对标称增广子系统(12),可以定义哈密尔顿函数如下
依据贝尔曼最优性原理,可得到HJB方程如下
如果方程(17)存在一个唯一解则满足
且
于是,可得子系统的最优控制律为
由于和/>未知,因此最优控制律(19)无法直接应用于模块化机器人。接下来将对其进行辨识。
2.2第一层级观测器的系统动态重构
为了获得模块化机器人子系统的最优控制律,需要先知道式(19)中的控制系数矩阵因此,构建第一层级神经网络观测器,重构系统动力学。考虑到实际应用情况,以及减少神经网络的训练过程,这里进行整体辨识系统(5)的非线性函数项,令并用神经网络形式表示为
式中,zi=[xi,xjd,υi]T,表示权重向量,/>表示激活函数,/>表示隐层的神经元数量,/>为神经网络近似误差。
定义为/>的估计值,故有
式中,
接下来,通过对关于υi进行偏导,获得子系统的控制系数矩阵/>为
进而得到
然后,基于式(21),建立第一层级神经网络观测器如下
式中,为是观测器的状态向量,Kio=diag[ki1o,ki2o]为正定的观测器增益矩阵,/>为模块子系统的观测误差,/>为自适应鲁棒项,且满足如下的更新条件
式中,学习率为正常数。
结合式(5)、(20)与式(23),可以得到观测误差动力学为
为了降低观测器的保守性,激活函数可以通过泰勒级数展开表示为
进而,将式(25)中的第二行改写为
式中,为/>的上界。
于是,根据式(27),则式(25)可改写为
2.3子系统评判网络设计
通过构建具有协同调节的自适应评判神经网络(评判网络)进行求解HJB方程。
于是,利用一个单隐层的神经网络将代价函数近似如下
式中,kic,/>分别表示神经网络的理想权重向量,神经元激活函数,隐层神经元数量和评判网络的近似误差。于是,将式(29)对ηi求导可得
式中,和/>分别为激活函数与评价网的近似误差的梯度。结合式(30)和(19),子系统的哈密尔顿函数(16)可以改写为
由于理想权重未知,则定义/>为/>的估计值,那么,评判网络可以表示为
于是,可以进一步表示为
基于式(33),则子系统的最优控制律(19)和哈密尔顿函数(31)可以分别近似为
与
式中,可以通过如下的更新律获得/>
式中,γiδ是一个正常数。
于是,定义权重近似误差结合式(31)和(35),可得
式中,联立式(31)与(35),可得
式中,φi=eicH-∈i。
假设3:总体误差项φi范数有界,即存在未知常数满足
||φi||≤φiM (39)
然而,为了使得则需让eic→0。因此,采用梯度下降算法最小化目标函数/>进而设计协同更新律如下
与
式中,γic,γiφ,βi均为评判网络的学习参数,鲁棒项为φiM的估计值。
联立式(38)、(40)和式(41),评判网络的协同权重近似误差与/>分别通过以下条件进行更新
和
式中,为正常数,值得指出的是,评判网络是通过式(40)与(41)两者协同更新实现的。
2.4第二层级观测器的有效因子估计
在第一层级神经网络观测器的基础上,建立第二层级神经网络观测器对发生故障时的执行器有效因子进行在线估计。
首先,基于式(22)与式(23),将具有执行器失效故障的子系统模型重构为
式中,是重构系统的状态向量。
于是,构建第二层级神经网络状态观测器如下
式中,是观测误差,/>是观测器增益矩阵。/>表示控制系数矩阵/>的估计值,/>表示有效因子的估计值,/>表示子系统的控制输入。
联立式(44)与式(45),则有效因子的观测误差动力学模型为
式中,为有效因子估计误差。
因此,设计有效因子的自适应更新律如下
式中,是一个正常数。
值得注意的是,在上述设计下,有效因子的观测误差渐近收敛至零。
2.5分散最优容错控制系统
在得到无故障情形下的模块化机器人系统的分散最优跟踪控制律,以及估计的有效因子后,将两者相结合构成如下的分散最优容错控制律
其中,表示分散最优容错控制律,/>表示分散跟踪控制律。
3.基于双层级观测器的模块化机器人分散最优容错控制系统与方法的软件实现
本发明基于双层级观测器的模块化机器人分散最优容错控制系统与方法,软件实现采用MATLAB语言编写,生成.m文件。程序设计思想及实现过程如图3所示。
分散最优容错控制采用增广子系统(11),改进的代价函数(14),双层级观测器(23)和(45),评判网络权重的协同更新律(40)-(41)以及有效因子的更新律(47),进而在容错控制律(48)的作用下,可以实现系统的分散容错控制,并保证闭环系统的状态是渐近稳定的。
软件实现的结构设计为:
第一层级神经网络观测器(23)采用的是5-14-1的神经网络结构进行重构系统的动力学,该网络的激活函数采用高斯型函数。
第二层神经网络观测器(45)相关的参数选取与第一层级的相同。
评判网络采用的是4-10-1的神经网络结构,其权重的协同调节律如式(40)-(41)。
通过点击“Run”按钮,控制方法即可触发,首先通过将互联子系统的实际状态辅助变换为相应的出参考状态,放松了互联项需已知上界的假设。其次,构建第一层级观测器,辨识子系统动力学模型;采用跟踪误差动力学和参考轨迹动力学建立增广子系统,设计相应的改进代价函数,并构建协同调节权重的自适应评判结构求解HJB方程,得到无故障情形下的分散跟踪控制律。随后,在系统发生执行器乘性故障时,构建第二层级观测器,估计执行器有效因子。最后,估计的有效因子与分散跟踪控制律合成容错控制策略,实现模块化机器人的分散最优容错控制。结果可采用Word、Excel或图表形式保存。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (6)
1.基于双层级观测器的模块化机器人分散最优容错控制方法,其特征在于,包括:
步骤1,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设;
步骤2,在步骤1基础上,构建第一层级观测器以辨识子系统动力学模型;
步骤3,建立增广子系统以及相应的最优代价函数,进而得到HJB方程;
步骤4,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;
步骤5,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;
步骤6,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制;
所述步骤2仅采用单个神经网络结合自适应鲁棒项,构建第一层级观测器,以整体辨识系统动态,并通过偏微分操作获得控制系数矩阵,即子系统动力学模型,进行简化训练过程;
所述第一层级观测器如下:
式中,为是观测器的状态向量,diag[ki1o,ki2o]为正定的观测器增益矩阵,为模块子系统的观测误差,/>为自适应鲁棒项,xjd,j=1,2,…,i-1,i+1,…,n表示第j个关联模块子系统的参考状态,为非线性项的神经网络形式;
步骤4所述自适应评判网络的权重协同调节律如式(40)-(41)所示:
式中,为理想权重,/>为权重近似误差,γic,γiφ,βi均为评判网络的学习参数,鲁棒项/>为φiM的估计值,/> 为最小化目标函数;
步骤6所述分散最优容错控制策略为:
其中,表示分散最优容错控制律,/>表示估计的有效因子,/>表示分散跟踪控制律。
2.根据权利要求1所述的基于双层级观测器的模块化机器人分散最优容错控制方法,其特征在于,所述步骤3定义各模块子系统增广状态ei为跟踪误差,xid为期望轨迹,则建立第i个模块子系统的增广动力学,即增广子系统为:
式中,
和η=[xj,xjd]T。
3.根据权利要求1所述的基于双层级观测器的模块化机器人分散最优容错控制方法,其特征在于,所述步骤3建立的最优代价函数为:
所述HJB方程如下:
式中,Θi表示Lipschitz常数,为/>关于增广状态ηi的偏导数,/>与/>为正定矩阵,0n×n表示全0的方阵;υi是υ的第i行,/>为关节控制力拒。
4.根据权利要求1所述的基于双层级观测器的模块化机器人分散最优容错控制方法,其特征在于,所述步骤5构建的第二层级观测器如下:
式中,是观测误差,/>是重构系统的状态向量,是观测器增益矩阵;/> 表示控制系数矩阵/>的估计值,/>表示有效因子的估计值,/>表示子系统的控制输入。
5.根据权利要求4所述的基于双层级观测器的模块化机器人分散最优容错控制方法,其特征在于,步骤5所述有效因子的自适应更新律为:
6.用于实现权利要求1-5任一项所述的基于双层级观测器的模块化机器人分散最优容错控制方法的系统,其特征在于,包括:
模型辨识模块,将模块化机器人子系统互联项的实际状态辅助变换为相应的参考状态,以释放互联项的上界假设,构建第一层级观测器以辨识子系统动力学模型;
评判网络模块,建立增广子系统以及相应的最优代价函数,进而得到HJB方程,构建协同调节权重的自适应评判网络以求解HJB方程,得到无故障情形下的分散跟踪控制律;
有效因子辨识模块,在机器人系统发生执行器乘性故障时,在第一层级观测器基础上,构建第二层级观测器,以估计执行器有效因子;
控制系统模块,将估计的有效因子与分散跟踪控制律结合,得到分散最优容错控制策略,实现模块化机器人的分散最优容错控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311244051.4A CN117311147B (zh) | 2023-09-25 | 2023-09-25 | 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311244051.4A CN117311147B (zh) | 2023-09-25 | 2023-09-25 | 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117311147A CN117311147A (zh) | 2023-12-29 |
CN117311147B true CN117311147B (zh) | 2024-03-19 |
Family
ID=89296510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311244051.4A Active CN117311147B (zh) | 2023-09-25 | 2023-09-25 | 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117311147B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110170992A (zh) * | 2019-04-02 | 2019-08-27 | 长春工业大学 | 一种基于动态规划的模块化机械臂多故障容错控制方法 |
CN112925204A (zh) * | 2021-01-21 | 2021-06-08 | 深圳翱诺科技有限公司 | 基于加强学习的非仿射系统最优容错控制方法 |
CN113146640A (zh) * | 2021-04-27 | 2021-07-23 | 长春工业大学 | 一种考虑执行器故障的机械臂分散最优容错控制方法 |
CN113219842A (zh) * | 2021-06-10 | 2021-08-06 | 哈尔滨工业大学 | 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质 |
CN113325717A (zh) * | 2021-06-10 | 2021-08-31 | 哈尔滨工业大学 | 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质 |
CN115890650A (zh) * | 2022-05-18 | 2023-04-04 | 长春工业大学 | 一种可重构机械臂事件触发分散最优容错控制方法及系统 |
-
2023
- 2023-09-25 CN CN202311244051.4A patent/CN117311147B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110170992A (zh) * | 2019-04-02 | 2019-08-27 | 长春工业大学 | 一种基于动态规划的模块化机械臂多故障容错控制方法 |
CN112925204A (zh) * | 2021-01-21 | 2021-06-08 | 深圳翱诺科技有限公司 | 基于加强学习的非仿射系统最优容错控制方法 |
CN113146640A (zh) * | 2021-04-27 | 2021-07-23 | 长春工业大学 | 一种考虑执行器故障的机械臂分散最优容错控制方法 |
CN113219842A (zh) * | 2021-06-10 | 2021-08-06 | 哈尔滨工业大学 | 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质 |
CN113325717A (zh) * | 2021-06-10 | 2021-08-31 | 哈尔滨工业大学 | 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质 |
CN115890650A (zh) * | 2022-05-18 | 2023-04-04 | 长春工业大学 | 一种可重构机械臂事件触发分散最优容错控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117311147A (zh) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Data-based fault tolerant control for affine nonlinear systems through particle swarm optimized neural networks | |
Rahimilarki et al. | Robust neural network fault estimation approach for nonlinear dynamic systems with applications to wind turbine systems | |
CN110170992B (zh) | 一种基于动态规划的模块化机械臂多故障容错控制方法 | |
Jiang et al. | Adaptive fault-tolerant tracking control of near-space vehicle using Takagi–Sugeno fuzzy models | |
Zhang et al. | Hybrid fuzzy adaptive fault-tolerant control for a class of uncertain nonlinear systems with unmeasured states | |
Zhao et al. | Adaptive dynamic programming-based cooperative motion/force control for modular reconfigurable manipulators: A joint task assignment approach | |
CN112305918A (zh) | 超螺旋观测器下的多智能体系统滑模容错一致性控制算法 | |
Zhao et al. | Particle swarm optimized neural networks based local tracking control scheme of unknown nonlinear interconnected systems | |
CN111190429B (zh) | 一种基于强化学习的无人机主动容错控制方法 | |
CN107272639A (zh) | 刚性航天器反作用飞轮故障的检测、估计及其调节方法 | |
CN112527016B (zh) | 一种智能集群一体化容错时变编队控制方法及系统 | |
Zahedi et al. | A review of neuro-fuzzy systems based on intelligent control | |
CN110497415A (zh) | 一种基于干扰观测器的多机械臂系统的一致控制方法 | |
CN113276114B (zh) | 一种基于终端任务指派的可重构机械臂协同力/运动控制系统与方法 | |
CN117311147B (zh) | 基于双层级观测器的模块化机器人分散最优容错控制系统与方法 | |
Kamalasadan et al. | Multiple fuzzy reference model adaptive controller design for pitch-rate tracking | |
Chen et al. | [Retracted] Model‐Free Adaptive Sliding Mode Robust Control with Neural Network Estimator for the Multi‐Degree‐of‐Freedom Robotic Exoskeleton | |
Hu et al. | Consensus sliding-mode fault-tolerant control for second-order multi-agent systems | |
Qiao et al. | Robust neuro-identification of nonlinear plants in electric power systems with missing sensor measurements | |
Le et al. | Adaptive neural network controller-based chattering-free sliding mode for 6-DOF industrial manipulators | |
CN113093771A (zh) | 基于神经网络的水下机器人-机械手系统的建模方法及系统 | |
Shan et al. | Research on fault tolerant control system based on optimized neural network algorithm | |
Chaiyaratana et al. | Hybridisation of neural networks and a genetic algorithm for friction compensation | |
Singh et al. | Degree of insecurity estimation in a power system using functional link neural network | |
Hao et al. | Fault diagnosis on satellite attitude control with dynamic neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |