CN115179295B - 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 - Google Patents
一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 Download PDFInfo
- Publication number
- CN115179295B CN115179295B CN202210931348.7A CN202210931348A CN115179295B CN 115179295 B CN115179295 B CN 115179295B CN 202210931348 A CN202210931348 A CN 202210931348A CN 115179295 B CN115179295 B CN 115179295B
- Authority
- CN
- China
- Prior art keywords
- euler
- error
- leader
- representing
- bipartite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000003044 adaptive effect Effects 0.000 claims abstract description 7
- 238000013528 artificial neural network Methods 0.000 claims description 48
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000013459 approach Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 9
- 230000005624 perturbation theories Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000002411 adverse Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
- B25J9/1682—Dual arm manipulator; Coordination of several manipulators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种多欧拉‑拉格朗日系统鲁棒二分一致性跟踪控制方法,包括以下步骤:S1、建立个体动力学模型,构建二阶模型,建立由分数阶动力学描述的领导者模型;S2、生成参数自适应性更新律;S3、设计改进的扩张高增益观测器,确定未知干扰和不可测二阶状态估计误差的收敛时间;S4、设计滑模面,设计鲁棒二分一致性跟踪控制器;S5、明确二分一致性跟踪误差上界;S6、将鲁棒二分一致跟踪控制器应用到系统中,使得多欧拉‑拉格朗日系统中的个体能够最终实现组别划分,对领导者状态实现二分一致性跟踪。本发明有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计。
Description
技术领域
本发明属于协同控制技术领域,特别涉及一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法。
背景技术
目前关于协同控制的研究大多关注的个体之间的合作协同且描述个体相互关系的多为非符号图,即个体之间只有合作关系同时拓扑结构的边权均非负。然而,在实际场景中,个体之间的不仅存在合作关系,往往还存在着竞争。例如,多媒体领域,用户对其他用户态度存在信任或不信任;生物学范畴内,神经元之间同时存在促进和抵制关系。基于此,合作与竞争的同时存在对分布式协同行为具有重要的影响。因此,研究符号网络下的多欧拉-拉格朗日系统的协同控制具有广泛的研究意义。其中的典型行为是,领导-跟随符号网络的二分一致性跟踪控制。即,在结构平衡符号网络下,考虑边权重的正负性可将跟随者群体分为两个子组,组间为竞争关系而组内为合作关系。进一步按照拓扑结构关系,可确定领导者分属于其中一个子组。此时,与领导者仍具有合作关系的子组最终能够实现对领导者状态的跟踪,而与领导者不在一个子组的跟随者们,最终趋于与领导者完全相反(状态模值相同而符号不同)的状态。
然而,在实际的系统中,一方面,领导者的状态或模型对跟随者而言是部分未知或具有不确定性的,另一方面跟随者本身也会受到不可测状态、未知干扰等不良因素影响。因此,需要综合考虑上述问题,设计鲁棒二分一致性控制器。
发明内容
本发明的目的在于克服现有技术的不足,提供一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法,有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计。
本发明的目的是通过以下技术方案来实现的:一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法,包括以下步骤:
S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型,每个机械手的动态方程由欧拉-拉格朗日方程描述;而后通过坐标转换构建二阶模型,接着建立由分数阶动力学描述的领导者模型;
S2、定义二分一致性跟踪误差,而后构建RBF神经网络,生成参数自适应性更新律,实现对领导者不确定性模型的有效逼近;
S3、针对S1建立的二阶多欧拉-拉格朗日系统,设计改进的扩张高增益观测器,实现对不可测的二阶状态以及未知干扰的有效估计,并基于有限时间理论,确定未知干扰和不可测二阶状态估计误差的收敛时间;
S4、基于滑模控制理论,设计包含一阶状态误差与二阶状态误差的滑模面,而后结合趋近律,通过代入S2中得到的未知干扰和不可测二阶状态的估计值以及S2中基于RBF神经网络构建的领导者的参数化逼近方程,设计鲁棒二分一致性跟踪控制器;
S5、将鲁棒二分一致跟踪控制器带入多欧拉-拉格朗日系统模型中,得到闭环误差系统,而后通过定义关于一阶状态和二阶状态的辅助误差变量,进而基于奇异摄动理论,通过将闭环误差系统转换为快慢动态相互耦合的动态方程,明确二分一致性跟踪误差上界;
S6、将鲁棒二分一致跟踪控制器应用到多欧拉-拉格朗日系统中,使得多欧拉-拉格朗日系统中的个体能够最终实现组别划分,对领导者状态实现二分一致性跟踪。
进一步地,所述步骤S1包括以下子步骤:
S11、多欧拉-拉格朗日系统中具有n个个体,它们之间通过无向网络G进行连接,n个个体的动力学模型如下:
其中,n为表示多欧拉-拉格朗日系统中机械手的数量;qi表示第i个机械手的关节角度向量;/>表示qi的一阶导数,即第i个机械手的关节速度向量;/>表示qi的二阶导数;M(qi)是一个表示系统惯量的一致正定和有界的对称矩阵,/>是一个与科里奥利力和离心力相关的矩阵,R是一个与粘性摩擦系数有关的对角矩阵,g(qi)表示重力项,S(qi)表示一个n×m的驱动矩阵,系统的输入力表示为τi,τdi表示输入的未知扰动;
S12、令则多欧拉-拉格朗日系统表示为:
其中,x1i,x2i分别表示系统中个体i的一阶状态和二阶状态;代表输入增益;ui=τi,代表控制输入;/>是已知结构的非线性项;/>代表集总的未知时变干扰;由于传感器的限制,个体自身的速度信息无法反馈用于设计控制协议,同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居进行交互,完成信息交换;
S13、定义由分数阶微积分描述的领导者动力学模型为:
其中,x0代表领导者的位置状态,代表分数阶微积分理论中的q阶导数符号,且0<q≤2,所代表的意思是对状态量x0求取关于时间变量t的q阶导数;光滑函数f0(x0,t)对于每个跟随者来说都是未知的。
进一步地,所述步骤S2包括以下子步骤:
S21、为实现多欧拉-拉格朗日系统的二分一致性跟踪控制,有如下定义:
即,最终多欧拉-拉格朗日系统中的个体,如果与领导者之间有合作关系,则wi=1同时其状态最终与领导者的状态趋于一致;反之,若存在的是竞争关系,则wi=-1同时其状态最终与领导者的状态模值相反数趋于一致;总的来说,当满足如(4)所示的条件时,即称多欧拉-拉格朗日系统实现了二分一致性跟踪控制;
S22、为了确保神经网络对模型不确定性进行有效地逼近,引入如下转换关系:
其中,光滑函数γ(x,t)代表对光滑函数f0(x,t)求取关于时间变量t的1-q阶导数;
S23、引入参数化神经网络,对光滑函数γ(x,t)进行逼近,即:
式中,代表径向基函数,θγ代表权值向量,eγ代表神经网络逼近误差;对每一个跟随者,设计基于神经网络的逼近器,实现对未知的领导者不确定性模型的有效估计;即:
其中,代表第i个跟随者对领导者不确定性模型分量γ(x,t)的估计值,/>则代表对权值向量θγ的估计值;
S24、为了确保对不确定性部分γ(x,t)有效逼近,需要对神经网络逼近误差做出如下假设:
其中,δγ是一个正数,代表神经网络逼近误差的上界;
S25、在S23、S24的基础上,进一步确定神经网络逼近误差为:
其中,代表神经网络逼近误差,/>代表权值向量的估计误差。
进一步地,所述步骤S3包括以下子步骤:
S31、为了确保对未知干扰和不可测状态的有效估计,需要对干扰及其导数的上界做如下假设:
其中,ρ1,ρ2均为正常数,分别代表未知干扰di及其导数的上界;
S32、定义多欧拉-拉格朗日系统中个体的一阶状态、二阶状态和未知扰动的估计值分别为则对应估计误差为:
其中为对应的估计误差;
对于多欧拉-拉格朗日系统中的i号个体,设计如下形式的改进扩张高增益观测器:
式中参数α1,α2,α3的选取需要使得特征多项式s3+α1s2+α2s+a3=0的根均具有负实部,s为复频率;
S33、设定可调参数ε为如下动态系统的输出状态:
其中,ω(0)=ω0,ω0>εf,且εf是一个小于1的常数,ω(0)代表变量ω的初值,ω0代表一个预设的正常数;此外,可调参数c1>0,c2>0,0<λ1<1以及λ2>1,其中,c1,c2分别代表动态系统的比例增益,而λ1,λ2则代表指数增益;进而,基于有限时间理论采用如(12)所示的动态系统,动态参数ε能够在固定时间内达到εf,且对应的调节时间为:
其中,TΔ,Tmax分别代表系统实际调节时间与系统调节时间的最大值;
S34、采用如(11)所示的扩张高增益观测器,能够实现同时对不可测的二阶状态和未知干扰的同时估计,且对应的估计性能能够通过动态系统(12)进行调整。
进一步地,所述步骤S4包括以下子步骤:
S41、定义二分一致性跟踪误差为:
其中aij表示多智能体网络拓扑中的邻接矩阵,bi描述了领导者与跟随者之间的相对关系,若领导者能够将自身信息传输给跟随者,则bi=1,反之则bi=0,sgn(.)代表符号函数;
S42、为实现S31中的二分一致性跟踪误差的收敛,引入如下的坐标转换关系:
其中,z1i,z2i分别代表领导者与跟随者之间一阶状态、二阶状态的跟踪误差;
S43、对z2i求导数,得到:
表示径向基函数;
S44、基于(14)中所定义的变量,构造如下形式的滑模面:
其中k1,k2均为正数;对(16)求导数,得到:
S45、基于经典滑模技术,构造如下形式的滑模面趋近律:
其中,比例增益ζ>0,ks>0并且幂指数增益α∈[0,1];
S46、结合S3中设计的扩张高增益观测器结果构造出控制输入为:
式中,代表对神经网络逼近误差的估计值;函数rem(.)和ren(.)分别为:
神经网络权值向量和逼近误差的自适应更新律为:
式中,kγ代表自适应更新律的比例增益,kδ代表逼近误差更新律的比例增益;
并且
进一步地,所述步骤S5包括以下子步骤:
S51、采用S46中所设计的控制输入,将其带入多欧拉-拉格朗日系统的动力学模型中,得到辅助变量导数为:
定义奇异扰动系统的辅助变量为得到滑模面的估计值的导数为:
S52、借助S51所得对应变量的导数信息,结合神经网络逼近器、扩张高增益观测器以及滑模控制器,基于奇异摄动理论,得到由快慢动态方程描述的闭环误差系统为:
其中,ηi=[η1iη2iη3i]T;
若干扰的导数在调节时间TΔ后趋于有界,那么快慢动态方程中对应量一直渐进有界,并且其最终界与可设计的参数εf有关,能够采用如(19)所示的控制输入,实现鲁棒二分一致性跟踪控制。
本发明提供一种首先建立多欧拉-拉格朗日系统,设计改进的高增益观测器,而后基于RBF神经网络对领导者的模型不确定性进行逼近,接着基于连续滑模控制技术,在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上,设计了鲁棒二分一致性跟踪控制器。扩展算法的应用场景,领导者模型不确定性、外部扰动以及不可测状态的不良影响。
相对于现有技术,本发明的有益效果体现在以下两个方面:
(1)针对具有领导者模型不确定性、跟随者个体受到未知干扰和不可测状态的多欧拉-拉格朗日系统,设计了一种神经网络逼近器结合扩展高增益观测器的分布式鲁棒二分一致性跟踪控制方案,有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计,能够提高多机械手系统在建模不准确、链路信息交互延迟以及老化、机械磨损等不良影响下的作业稳定性,为其实际应用提供有效解决方案。
(2)首先基于RBF神经网络对领导者的模型不确定性进行逼近,而后构建了改进的高增益观测器,接着基于连续滑模控制技术,在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上,结合滑模控制理论设计了一种基前馈反馈结构的鲁棒二分一致性跟踪控制器,有效提升了系统的鲁棒性,且此神经网络拟合方案能够有效地利用多机械手系统实际运行中产生的大量数据,较好地实现对模型不确定性的逼近以及为多机械手的实际应用提供有效的参数配置方案,简化了人工操作调参的复杂性。
附图说明
图1为本发明的一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法流程图;
图2是平面双铰链机械手的示意图;
图3为本实施例中多欧拉-拉格朗日系统的通信拓扑图;
图4为本实施例中欧拉-拉格朗日系统个体的位置状态响应;
图5为本实施例中未知干扰的估计误差;
图6为本实施例中神经网络的逼近误差;
图7为本实施例中二分一致性跟踪误差响应曲线;
图8为本实施例中控制输入的时间响应。
具体实施方式
发明研究了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制问题。已有的方法中,一方面假设了领导者的模型跟随者全员已知或部分已知,另外没有综合考虑不可测状态、未知干扰等不良因素。因此,本发明重点考虑了领导者模型不确定性、跟随者个体受到未知干扰和不可测状态的不良影响,首先构建了改进的高增益观测器,而后基于RBF神经网络对领导者的模型不确定性进行逼近,接着基于连续滑模控制技术,在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上,设计了鲁棒二分一致性跟踪控制器。该发明能够为技术人员在实际操作中同时解决领导者模型不确定性、外部扰动以及不可测状态的不良影响奠定基础,提升二分一致性跟踪控制方案的鲁棒性和有效性。下面结合附图进一步说明本发明的技术方案。
如图1所示,本发明的一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法,包括以下步骤:
S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型,每个机械手的动态方程通常可以由欧拉-拉格朗日方程(Euler-Lagrange equation)描述,图2是一个简单的平面双铰链机械手的示意图。其中,坐标系(x0,y0)、(x1,y1)为机械手两个关节的轴坐标系,坐标系(x2,y2)为机械手末端,实际应用中带负载使用,其位置可以由工作关节角度向量q来描述,执行机构输入由作用于关节的二维力矩向量组成。而后通过坐标转换构建二阶模型,接着建立由分数阶动力学描述的领导者模型。
本步骤具体包括以下子步骤:
S11、多欧拉-拉格朗日系统中具有n个个体,它们之间通过无向网络G进行连接,n个个体的动力学模型如下:
其中,n为表示多欧拉-拉格朗日系统中机械手的数量;qi表示第i个机械手的关节角度向量;/>表示qi的一阶导数,即第i个机械手的关节速度向量;/>表示qi的二阶导数;M(qi)是一个表示系统惯量的一致正定和有界的对称矩阵,/>是一个与科里奥利力和离心力相关的矩阵,R是一个与粘性摩擦系数有关的对角矩阵,g(qi)表示重力项,S(qi)表示一个n×m的驱动矩阵,系统的输入力表示为τi,τdi表示输入的未知扰动;
S12、令则多欧拉-拉格朗日系统表示为:
其中,x1i,x2i分别表示系统中个体i的一阶状态和二阶状态;代表输入增益;ui=τi,代表控制输入;/>是已知结构的非线性项;/>代表集总的未知时变干扰;由于传感器的限制,个体自身的速度信息无法反馈用于设计控制协议,同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居(即存在连接)进行交互,完成信息交换;
S13、定义由分数阶微积分描述的领导者动力学模型为:
其中,x0(t)代表领导者的位置状态,领导者可设想为需要由多个机械手搬运或者协同作业的设备;代表分数阶微积分理论中的q阶导数符号,且0<q≤2,所代表的意思是对状态量x0(t)求取关于时间变量t的q阶导数;光滑函数f0(x0,t)对于每个跟随者来说都是未知的。
S2、定义二分一致性跟踪误差,而后构建RBF神经网络,生成参数自适应性更新律,实现对领导者不确定性模型的有效逼近;包括以下子步骤:
S21、为实现多欧拉-拉格朗日系统的二分一致性跟踪控制,有如下定义:
即,最终多欧拉-拉格朗日系统中的个体,如果与领导者之间有合作关系,则wi=1,同时其状态最终与领导者的状态趋于一致;反之,若存在的是竞争关系,则wi=-1,同时其状态最终与领导者的状态模值相反数趋于一致;总的来说,当满足如(4)所示的条件时,即称多欧拉-拉格朗日系统实现了二分一致性跟踪控制;
S22、为了确保神经网络对模型不确定性进行有效地逼近,引入如下转换关系:
其中,光滑函数γ(x,t)代表对光滑函数f0(x,t)求取关于时间变量t的1-q阶导数;
S23、引入参数化神经网络,对光滑函数γ(x,t)进行逼近,即:
式中,代表径向基函数,θγ代表权值向量,eγ代表神经网络逼近误差;对每一个跟随者,设计基于神经网络的逼近器,实现对未知的领导者不确定性模型的有效估计;即:
其中,代表第i个跟随者对领导者不确定性模型分量γ(x,t)的估计值,/>则代表对权值向量θγ的估计值;
S24、为了确保对不确定性部分γ(x,t)有效逼近,需要对神经网络逼近误差做出如下假设:
其中,δγ是一个正数,代表神经网络逼近误差的上界;
S25、在S23、S24的基础上,进一步确定神经网络逼近误差为:
其中,代表神经网络逼近误差,/>代表权值向量的估计误差。
由此,基于S21-S25,即构建了参数化神经网络,实现对领导者具有的模型不确定性的有效逼近。
S3、针对S1建立的二阶多欧拉-拉格朗日系统,设计改进的扩张高增益观测器,实现对不可测的二阶状态以及未知干扰的有效估计,并基于有限时间理论,确定未知干扰和不可测二阶状态估计误差的收敛时间;包括以下子步骤:
S31、为了确保对未知干扰和不可测状态的有效估计,需要对干扰及其导数的上界做如下假设:
其中,ρ1,ρ2均为正常数,分别代表未知干扰di及其导数的上界;
S32、定义多欧拉-拉格朗日系统中个体的一阶状态、二阶状态和未知扰动的估计值分别为则对应估计误差为:
其中为对应的估计误差;
对于多欧拉-拉格朗日系统中的i号个体,设计如下形式的改进扩张高增益观测器:
式中参数α1,α2,α3的选取需要使得特征多项式s3+α1s2+α2s+a3=0的根均具有负实部,s为复频率;
S33、设定可调参数ε为如下动态系统的输出状态:
其中,ω(0)=ω0,ω0>εf,且εf是一个小于1的常数,ω(0)代表变量ω的初值,ω0代表一个预设的正常数;此外,可调参数c1>0,c2>0,0<λ1<1以及λ2>1,其中,c1,c2分别代表动态系统的比例增益,而λ1,λ2则代表指数增益;进而,基于有限时间理论采用如(12)所示的动态系统,动态参数ε能够在固定时间内达到εf,且对应的调节时间为:
其中,TΔ,Tmax分别代表系统实际调节时间与系统调节时间的最大值;
S34、采用如(11)所示的扩张高增益观测器,能够实现同时对不可测的二阶状态和未知干扰的同时估计,且对应的估计性能能够通过动态系统(12)进行调整。
S4、基于滑模控制理论,设计包含一阶状态误差与二阶状态误差的滑模面,而后结合趋近律,通过代入S2中得到的未知干扰和不可测二阶状态的估计值以及S2中基于RBF神经网络构建的领导者的参数化逼近方程,设计鲁棒二分一致性跟踪控制器;包括以下子步骤:
S41、定义二分一致性跟踪误差为:
其中aij表示多智能体网络拓扑中的邻接矩阵,bi描述了领导者与跟随者之间的相对关系,若领导者能够将自身信息传输给跟随者,则bi=1,反之则bi=0,sgn(.)代表符号函数;
S42、为实现S31中的二分一致性跟踪误差的收敛,引入如下的坐标转换关系:
其中,z1i、z2i分别代表领导者与跟随者之间一阶状态、二阶状态的跟踪误差,即公式(7)中的/>
S43、对z2i求导数,得到:
表示径向基函数;
S44、基于(14)中所定义的变量,构造如下形式的滑模面:
其中k1,k2均为正数;对(16)求导数,得到:
S45、基于经典滑模技术,构造如下形式的滑模面趋近律:
其中,比例增益ζ>0,ks>0并且幂指数增益α∈[0,1];
S46、结合S3中设计的扩张高增益观测器结果构造出控制输入为:
/>
式中,代表对神经网络逼近误差的估计值;函数rem(.)和ren(.)分别为:
神经网络权值向量和逼近误差的自适应更新律为:
式中,kγ代表自适应更新律的比例增益,kδ代表逼近误差更新律的比例增益;
并且
S5、将鲁棒二分一致跟踪控制器带入多欧拉-拉格朗日系统模型中,得到闭环误差系统,而后通过定义关于一阶状态和二阶状态的辅助误差变量,进而基于奇异摄动理论,通过将闭环误差系统转换为快慢动态相互耦合的动态方程,明确二分一致性跟踪误差上界;包括以下子步骤:
S51、采用S46中所设计的控制输入,将其带入多欧拉-拉格朗日系统的动力学模型中,得到辅助变量导数为:
定义奇异扰动系统的辅助变量为得到滑模面的估计值的导数为:
S52、借助S51所得对应变量的导数信息,结合神经网络逼近器、扩张高增益观测器以及滑模控制器,基于奇异摄动理论,得到由快慢动态方程描述的闭环误差系统为:
其中,ηi=[η1iη2iη3i]T;
若干扰的导数在调节时间TΔ后趋于有界,那么快慢动态方程中对应量一直渐进有界,并且其最终界与可设计的参数εf有关,能够采用如(19)所示的控制输入,实现鲁棒二分一致性跟踪控制。
S6、将鲁棒二分一致跟踪控制器应用到多欧拉-拉格朗日系统中,使得多欧拉-拉格朗日系统中的个体能够最终实现组别划分,对领导者状态实现二分一致性跟踪;包括以下子步骤:
S61、将S4中所设计的鲁棒二分一致性跟踪控制器应用到多欧拉拉格朗日系统的个体动态方程中,在拓扑结构连通的情况下,能够实现二分一致性跟踪,且在对领导者不确定性模型的逼近同时,能够实现对未知干扰和不可测二阶状态的有效估计;
S62、综上步骤,完成了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制方案设计。
本实施例中多欧拉-拉格朗日系统的通信拓扑图如图3所示,存在6个个体。个体动力学模型中的未知干扰和不确定性分别为:
且拉格朗日系统的一阶状态和二阶状态的初值分别为
x1i(0)=[1.6,-1,1,0.5,-1.5]T
x2i(0)=[0.5,-0.3,0.6,1.2,-0.8]T
分数阶领导者的模型设置为:
控制参数分别选取为:
k1=10,k2=2,ks=0.3,γ=0.3,α=0.3,α1=2,α2=2,α3=2
λ1=0.5,λ2=2,c1=5,c1=5,ω0=0.2,εf=0.05
图4为欧拉-拉格朗日系统的一阶状态响应图;图5为对未知干扰的估计误差;图6为神经网络的拟合误差;图7为多欧拉-拉格朗日系统的二分一致性跟踪误差响应曲线;图8为控制输入的时间响应;从仿真结果可以看出,最终本实施例中实现了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制,同时,神经网络逼近误差、未知干扰和不可测状态的估计误差最终能够趋于有界,仿真结果表明本发明提出的控制方案可以提升多欧拉-拉格朗日系统的鲁棒性。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (1)
1.一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法,其特征在于,包括以下步骤:
S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型,每个机械手的动态方程由欧拉-拉格朗日方程描述;而后通过坐标转换构建二阶模型,接着建立由分数阶动力学描述的领导者模型;包括以下子步骤:
S11、多欧拉-拉格朗日系统中具有n个个体,它们之间通过无向网络G进行连接,n个个体的动力学模型如下:
其中,n为表示多欧拉-拉格朗日系统中机械手的数量;qi表示第i个机械手的关节角度向量;/>表示qi的一阶导数,即第i个机械手的关节速度向量;/>表示qi的二阶导数;M(qi)是一个表示系统惯量的一致正定和有界的对称矩阵,/>是一个与科里奥利力和离心力相关的矩阵,R是一个与粘性摩擦系数有关的对角矩阵,g(qi)表示重力项,S(qi)表示一个n×m的驱动矩阵,系统的输入力表示为τi,τdi表示输入的未知扰动;
S12、令则多欧拉-拉格朗日系统表示为:
其中,x1i,x2i分别表示系统中个体i的一阶状态和二阶状态;代表输入增益;ui=τi,代表控制输入;/>是已知结构的非线性项;/>τdi代表集总的未知时变干扰;由于传感器的限制,个体自身的速度信息无法反馈用于设计控制协议,同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居进行交互,完成信息交换;
S13、定义由分数阶微积分描述的领导者动力学模型为:
其中,x0代表领导者的位置状态,代表分数阶微积分理论中的q阶导数符号,且0<q≤2,所代表的意思是对状态量x0求取关于时间变量t的q阶导数;光滑函数f0(x0,t)对于每个跟随者来说都是未知的;
S2、定义二分一致性跟踪误差,而后构建RBF神经网络,生成参数自适应性更新律,实现对领导者不确定性模型的有效逼近;包括以下子步骤:
S21、为实现多欧拉-拉格朗日系统的二分一致性跟踪控制,有如下定义:
即,最终多欧拉-拉格朗日系统中的个体,如果与领导者之间有合作关系,则wi=1同时其状态最终与领导者的状态趋于一致;反之,若存在的是竞争关系,则wi=-1同时其状态最终与领导者的状态模值相反数趋于一致;总的来说,当满足如(4)所示的条件时,即称多欧拉-拉格朗日系统实现了二分一致性跟踪控制;
S22、为了确保神经网络对模型不确定性进行有效地逼近,引入如下转换关系:
其中,光滑函数γ(x,t)代表对光滑函数f0(x,t)求取关于时间变量t的1-q阶导数;
S23、引入参数化神经网络,对光滑函数γ(x,t)进行逼近,即:
式中,代表径向基函数,θγ代表权值向量,eγ代表神经网络逼近误差;对每一个跟随者,设计基于神经网络的逼近器,实现对未知的领导者不确定性模型的有效估计;即:
其中,代表第i个跟随者对领导者不确定性模型分量γ(x,t)的估计值,/>则代表对权值向量θγ的估计值;
S24、为了确保对不确定性部分γ(x,t)有效逼近,需要对神经网络逼近误差做出如下假设:
其中,δγ是一个正数,代表神经网络逼近误差的上界;
S25、在S23、S24的基础上,进一步确定神经网络逼近误差为:
其中,代表神经网络逼近误差,/>代表权值向量的估计误差;
S3、设计改进的扩张高增益观测器,实现对不可测的二阶状态以及未知干扰的有效估计,并基于有限时间理论,确定未知干扰和不可测二阶状态估计误差的收敛时间;包括以下子步骤:
S31、为了确保对未知干扰和不可测状态的有效估计,需要对干扰及其导数的上界做如下假设:
其中,ρ1,ρ2均为正常数,分别代表未知干扰di及其导数的上界;
S32、定义多欧拉-拉格朗日系统中个体的一阶状态、二阶状态和未知扰动的估计值分别为则对应估计误差为:
其中为对应的估计误差;
对于多欧拉-拉格朗日系统中的i号个体,设计如下形式的改进扩张高增益观测器:
式中参数α1,α2,α3的选取需要使得特征多项式s3+α1s2+α2s+a3=0的根均具有负实部,s为复频率;
S33、设定可调参数ε为如下动态系统的输出状态:
其中,ω(0)=ω0,ω0>εf,且εf是一个小于1的常数,ω(0)代表变量ω的初值,ω0代表一个预设的正常数;此外,可调参数c1>0,c2>0,0<λ1<1以及λ2>1,其中,c1,c2分别代表动态系统的比例增益,而λ1,λ2则代表指数增益;进而,基于有限时间理论采用如(12)所示的动态系统,动态参数ε能够在固定时间内达到εf,且对应的调节时间为:
其中,TΔ,Tmax分别代表系统实际调节时间与系统调节时间的最大值;
S34、采用如(11)所示的扩张高增益观测器,能够实现同时对不可测的二阶状态和未知干扰的同时估计,且对应的估计性能能够通过动态系统(12)进行调整;
S4、基于滑模控制理论,设计包含一阶状态误差与二阶状态误差的滑模面,而后结合趋近律,通过代入S2中得到的未知干扰和不可测二阶状态的估计值以及S2中基于RBF神经网络构建的领导者的参数化逼近方程,设计鲁棒二分一致性跟踪控制器;包括以下子步骤:
S41、定义二分一致性跟踪误差为:
其中aij表示多智能体网络拓扑中的邻接矩阵,bi描述了领导者与跟随者之间的相对关系,若领导者能够将自身信息传输给跟随者,则bi=1,反之则bi=0,sgn(.)代表符号函数;
S42、为实现S31中的二分一致性跟踪误差的收敛,引入如下的坐标转换关系:
其中,z1i,z2i分别代表领导者与跟随者之间一阶状态、二阶状态的跟踪误差;
S43、对z2i求导数,得到:
表示径向基函数;
S44、基于(14)中所定义的变量,构造如下形式的滑模面:
其中k1,k2均为正数;对(16)求导数,得到:
S45、基于经典滑模技术,构造如下形式的滑模面趋近律:
其中,比例增益ζ>0,ks>0并且幂指数增益α∈[0,1];
S46、结合S3中设计的扩张高增益观测器结果构造出控制输入为:
式中,代表对神经网络逼近误差的估计值;函数rem(.)和ren(.)分别为:
神经网络权值向量和逼近误差的自适应更新律为:
式中,kγ代表自适应更新律的比例增益,kδ代表逼近误差更新律的比例增益;
并且
S5、将鲁棒二分一致跟踪控制器带入多欧拉-拉格朗日系统模型中,得到闭环误差系统,而后通过定义关于一阶状态和二阶状态的辅助误差变量,进而基于奇异摄动理论,通过将闭环误差系统转换为快慢动态相互耦合的动态方程,明确二分一致性跟踪误差上界;包括以下子步骤:
S51、采用S46中所设计的控制输入,将其带入多欧拉-拉格朗日系统的动力学模型中,得到辅助变量导数为:
定义奇异扰动系统的辅助变量为得到滑模面的估计值的导数为:
S52、借助S51所得对应变量的导数信息,结合神经网络逼近器、扩张高增益观测器以及滑模控制器,基于奇异摄动理论,得到由快慢动态方程描述的闭环误差系统为:
其中,ηi=[η1iη2iη3i]T;
若干扰的导数在调节时间TΔ后趋于有界,那么快慢动态方程中对应量一直渐进有界,并且其最终界与可设计的参数εf有关,能够采用如(19)所示的控制输入,实现鲁棒二分一致性跟踪控制;
S6、将鲁棒二分一致跟踪控制器应用到多欧拉-拉格朗日系统中,使得多欧拉-拉格朗日系统中的个体能够最终实现组别划分,对领导者状态实现二分一致性跟踪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210931348.7A CN115179295B (zh) | 2022-08-04 | 2022-08-04 | 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210931348.7A CN115179295B (zh) | 2022-08-04 | 2022-08-04 | 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115179295A CN115179295A (zh) | 2022-10-14 |
CN115179295B true CN115179295B (zh) | 2024-05-24 |
Family
ID=83521468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210931348.7A Active CN115179295B (zh) | 2022-08-04 | 2022-08-04 | 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115179295B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116627042B (zh) * | 2023-07-20 | 2023-09-29 | 南京邮电大学 | 执行器非对称饱和多自主体系统的分布式协同跟踪方法 |
CN116872221B (zh) * | 2023-09-08 | 2023-12-05 | 湖南大学 | 一种多机协同转体大型工件的数据驱动二分一致控制方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102354104A (zh) * | 2005-09-19 | 2012-02-15 | 克利夫兰州立大学 | 控制器、观测器及其应用 |
CN105068421A (zh) * | 2015-07-16 | 2015-11-18 | 浙江工业大学 | 多移动机器人的二自由度协同控制方法 |
WO2018176854A1 (zh) * | 2017-03-27 | 2018-10-04 | 华南理工大学 | 一种冗余度机械臂重复运动规划方法 |
WO2019021058A2 (en) * | 2017-07-25 | 2019-01-31 | Mbl Limited | SYSTEMS AND METHODS FOR OPERATING A ROBOTIC SYSTEM AND EXECUTING ROBOTIC INTERACTIONS |
CN110687918A (zh) * | 2019-10-17 | 2020-01-14 | 哈尔滨工程大学 | 一种基于回归型神经网络在线逼近的水下机器人轨迹跟踪控制方法 |
CN111590561A (zh) * | 2020-04-27 | 2020-08-28 | 江苏建筑职业技术学院 | 一种分布式机械臂系统鲁棒预设性能控制方法 |
CN113031446A (zh) * | 2021-03-15 | 2021-06-25 | 贵州大学 | 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法 |
CN113172627A (zh) * | 2021-04-30 | 2021-07-27 | 同济大学 | 多移动机械手协同搬运系统运动学建模与分布式控制方法 |
CN113759711A (zh) * | 2021-07-09 | 2021-12-07 | 广东华中科技大学工业技术研究院 | 多欧拉-拉格朗日系统的独立分布式包含控制器设计方法 |
CN114536334A (zh) * | 2022-02-23 | 2022-05-27 | 浙江工业大学 | 一种柔性机械臂系统高阶滑模抗干扰控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12017352B2 (en) * | 2020-10-29 | 2024-06-25 | Nvidia Corporation | Transformation of joint space coordinates using machine learning |
-
2022
- 2022-08-04 CN CN202210931348.7A patent/CN115179295B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102354104A (zh) * | 2005-09-19 | 2012-02-15 | 克利夫兰州立大学 | 控制器、观测器及其应用 |
CN105068421A (zh) * | 2015-07-16 | 2015-11-18 | 浙江工业大学 | 多移动机器人的二自由度协同控制方法 |
WO2018176854A1 (zh) * | 2017-03-27 | 2018-10-04 | 华南理工大学 | 一种冗余度机械臂重复运动规划方法 |
WO2019021058A2 (en) * | 2017-07-25 | 2019-01-31 | Mbl Limited | SYSTEMS AND METHODS FOR OPERATING A ROBOTIC SYSTEM AND EXECUTING ROBOTIC INTERACTIONS |
CN110687918A (zh) * | 2019-10-17 | 2020-01-14 | 哈尔滨工程大学 | 一种基于回归型神经网络在线逼近的水下机器人轨迹跟踪控制方法 |
CN111590561A (zh) * | 2020-04-27 | 2020-08-28 | 江苏建筑职业技术学院 | 一种分布式机械臂系统鲁棒预设性能控制方法 |
CN113031446A (zh) * | 2021-03-15 | 2021-06-25 | 贵州大学 | 不确定时滞非线性系统非奇异性神经自适应跟踪控制方法 |
CN113172627A (zh) * | 2021-04-30 | 2021-07-27 | 同济大学 | 多移动机械手协同搬运系统运动学建模与分布式控制方法 |
CN113759711A (zh) * | 2021-07-09 | 2021-12-07 | 广东华中科技大学工业技术研究院 | 多欧拉-拉格朗日系统的独立分布式包含控制器设计方法 |
CN114536334A (zh) * | 2022-02-23 | 2022-05-27 | 浙江工业大学 | 一种柔性机械臂系统高阶滑模抗干扰控制方法 |
Non-Patent Citations (5)
Title |
---|
Distributed Observer-Based Leader–Follower Consensus of Multiple Euler–Lagrange Systems;Mingkang Long; Housheng Su; Zhigang Zeng;《IEEE Transactions on Neural Networks and Learning Systems》;20220511;第35卷(第1期);全文 * |
Improved UDE and LSO for a Class of Uncertain Second-Order Nonlinear Systems Without Velocity Measurements;Xinyu Zhang; Hui Li; Bo Zhu; Yang Zhu;《IEEE Transactions on Instrumentation and Measurement》;20190926;第69卷(第7期);全文 * |
Tong Li ; Weihao Li ; Zhiqiang Li ; Mengji Shi ; Boxian Lin ; Zixuan Liu.Neural Network-Cascade UDE Based Tracking Control of Leader-Follower Agents with Compound Uncertainties.《2021 International Conference on Computers and Automation (CompAuto)》.2022,全文. * |
刚柔耦合串联机械臂末端位置误差分析与补偿研究;张彭豪;《中国优秀硕士学位论文全文数据库信息科技辑》;20210215(第2期);全文 * |
符号网络下多智能体系统几类协同控制问题研究;李维豪;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20230115(第1期) * |
Also Published As
Publication number | Publication date |
---|---|
CN115179295A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115179295B (zh) | 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 | |
CN112327633A (zh) | 具有时滞和干扰的领导跟随多智能体系统一致性的方法 | |
Chen et al. | Novel adaptive neural control design for nonlinear MIMO time-delay systems | |
CN112817231B (zh) | 一种具有强鲁棒性的机械臂高精度跟踪控制方法 | |
CN109581868B (zh) | 基于评判辨识结构的可重构机器人分散神经最优控制方法 | |
CN110877333A (zh) | 一种柔性关节机械臂控制方法 | |
CN108388114A (zh) | 一种基于输出重定义的柔性机械臂复合控制方法 | |
CN109976150B (zh) | 一类欠驱动多输入多输出系统的集中式自抗扰控制方法 | |
CN111273544B (zh) | 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法 | |
CN105469142A (zh) | 一种基于样本增量驱动的神经网络增量型前馈算法 | |
Rückert et al. | Stochastic optimal control methods for investigating the power of morphological computation | |
CN109782595A (zh) | 基于事件触发机制的球杆系统的网络预测控制方法及系统 | |
Ullah et al. | Neuro-adaptive non-singular terminal sliding mode control for distributed fixed-time synchronization of higher-order uncertain multi-agent nonlinear systems | |
Chen et al. | Recurrent wavelet neural backstepping controller design with a smooth compensator | |
He et al. | Adaptive boundary control of flexible manipulators with parameter uncertainty based on RBF neural network | |
Patel et al. | Optimized cascade fractional‐order 3DOF‐controller for frequency regulation of a hybrid power system using marine predators algorithm | |
CN113219825A (zh) | 一种四足机器人单腿轨迹跟踪控制方法及系统 | |
CN109917647B (zh) | 一种基于教学策略改进的教与学算法及充液航天器优化滑模控制方法 | |
CN109176529B (zh) | 一种空间机器人协调运动的自适应模糊控制方法 | |
Yang et al. | Adaptive neural network control for flexible telerobotic systems with communication constraints | |
Sharkawy et al. | A robust fuzzy tracking control scheme for robotic manipulators with experimental verification | |
CN110389525A (zh) | 基于极限学习机的混联机构自适应反步控制方法 | |
CN116068893A (zh) | 一种机械臂自适应分数阶滑模控制方法、设备及介质 | |
Liu et al. | Load frequency composite control for multi-region interconnected power systems | |
CN112731801B (zh) | 一种对称死区非线性的自适应动态面输出反馈控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |