CN115179295B

CN115179295B - 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法

Info

Publication number: CN115179295B
Application number: CN202210931348.7A
Authority: CN
Inventors: 李维豪; 施孟佶; 林伯先; 岳江枫; 李曈; 张新昱; 秦开宇
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-08-04
Filing date: 2022-08-04
Publication date: 2024-05-24
Anticipated expiration: 2042-08-04
Also published as: CN115179295A

Abstract

本发明公开了一种多欧拉‑拉格朗日系统鲁棒二分一致性跟踪控制方法，包括以下步骤：S1、建立个体动力学模型，构建二阶模型，建立由分数阶动力学描述的领导者模型；S2、生成参数自适应性更新律；S3、设计改进的扩张高增益观测器，确定未知干扰和不可测二阶状态估计误差的收敛时间；S4、设计滑模面，设计鲁棒二分一致性跟踪控制器；S5、明确二分一致性跟踪误差上界；S6、将鲁棒二分一致跟踪控制器应用到系统中，使得多欧拉‑拉格朗日系统中的个体能够最终实现组别划分，对领导者状态实现二分一致性跟踪。本发明有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计。

Description

一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法

技术领域

本发明属于协同控制技术领域，特别涉及一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法。

背景技术

目前关于协同控制的研究大多关注的个体之间的合作协同且描述个体相互关系的多为非符号图，即个体之间只有合作关系同时拓扑结构的边权均非负。然而，在实际场景中，个体之间的不仅存在合作关系，往往还存在着竞争。例如，多媒体领域，用户对其他用户态度存在信任或不信任；生物学范畴内，神经元之间同时存在促进和抵制关系。基于此，合作与竞争的同时存在对分布式协同行为具有重要的影响。因此，研究符号网络下的多欧拉-拉格朗日系统的协同控制具有广泛的研究意义。其中的典型行为是，领导-跟随符号网络的二分一致性跟踪控制。即，在结构平衡符号网络下，考虑边权重的正负性可将跟随者群体分为两个子组，组间为竞争关系而组内为合作关系。进一步按照拓扑结构关系，可确定领导者分属于其中一个子组。此时，与领导者仍具有合作关系的子组最终能够实现对领导者状态的跟踪，而与领导者不在一个子组的跟随者们，最终趋于与领导者完全相反(状态模值相同而符号不同)的状态。

然而，在实际的系统中，一方面，领导者的状态或模型对跟随者而言是部分未知或具有不确定性的，另一方面跟随者本身也会受到不可测状态、未知干扰等不良因素影响。因此，需要综合考虑上述问题，设计鲁棒二分一致性控制器。

发明内容

本发明的目的在于克服现有技术的不足，提供一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法，有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计。

本发明的目的是通过以下技术方案来实现的：一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法，包括以下步骤：

S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型，每个机械手的动态方程由欧拉-拉格朗日方程描述；而后通过坐标转换构建二阶模型，接着建立由分数阶动力学描述的领导者模型；

S2、定义二分一致性跟踪误差，而后构建RBF神经网络，生成参数自适应性更新律，实现对领导者不确定性模型的有效逼近；

S3、针对S1建立的二阶多欧拉-拉格朗日系统，设计改进的扩张高增益观测器，实现对不可测的二阶状态以及未知干扰的有效估计，并基于有限时间理论，确定未知干扰和不可测二阶状态估计误差的收敛时间；

S4、基于滑模控制理论，设计包含一阶状态误差与二阶状态误差的滑模面，而后结合趋近律，通过代入S2中得到的未知干扰和不可测二阶状态的估计值以及S2中基于RBF神经网络构建的领导者的参数化逼近方程，设计鲁棒二分一致性跟踪控制器；

S5、将鲁棒二分一致跟踪控制器带入多欧拉-拉格朗日系统模型中，得到闭环误差系统，而后通过定义关于一阶状态和二阶状态的辅助误差变量，进而基于奇异摄动理论，通过将闭环误差系统转换为快慢动态相互耦合的动态方程，明确二分一致性跟踪误差上界；

S6、将鲁棒二分一致跟踪控制器应用到多欧拉-拉格朗日系统中，使得多欧拉-拉格朗日系统中的个体能够最终实现组别划分，对领导者状态实现二分一致性跟踪。

进一步地，所述步骤S1包括以下子步骤：

S11、多欧拉-拉格朗日系统中具有n个个体，它们之间通过无向网络G进行连接，n个个体的动力学模型如下：

其中，n为表示多欧拉-拉格朗日系统中机械手的数量；q_i表示第i个机械手的关节角度向量；/>表示q_i的一阶导数，即第i个机械手的关节速度向量；/>表示q_i的二阶导数；M(q_i)是一个表示系统惯量的一致正定和有界的对称矩阵，/>是一个与科里奥利力和离心力相关的矩阵，R是一个与粘性摩擦系数有关的对角矩阵，g(q_i)表示重力项，S(q_i)表示一个n×m的驱动矩阵，系统的输入力表示为τ_i，τ_di表示输入的未知扰动；

S12、令则多欧拉-拉格朗日系统表示为：

其中，x_1i,x_2i分别表示系统中个体i的一阶状态和二阶状态；代表输入增益；u_i＝τ_i，代表控制输入；/>是已知结构的非线性项；/>代表集总的未知时变干扰；由于传感器的限制，个体自身的速度信息无法反馈用于设计控制协议，同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居进行交互，完成信息交换；

S13、定义由分数阶微积分描述的领导者动力学模型为：

其中，x₀代表领导者的位置状态，代表分数阶微积分理论中的q阶导数符号，且0＜q≤2，所代表的意思是对状态量x₀求取关于时间变量t的q阶导数；光滑函数f₀(x₀,t)对于每个跟随者来说都是未知的。

进一步地，所述步骤S2包括以下子步骤：

S21、为实现多欧拉-拉格朗日系统的二分一致性跟踪控制，有如下定义：

即，最终多欧拉-拉格朗日系统中的个体，如果与领导者之间有合作关系，则w_i＝1同时其状态最终与领导者的状态趋于一致；反之，若存在的是竞争关系，则w_i＝-1同时其状态最终与领导者的状态模值相反数趋于一致；总的来说，当满足如(4)所示的条件时，即称多欧拉-拉格朗日系统实现了二分一致性跟踪控制；

S22、为了确保神经网络对模型不确定性进行有效地逼近，引入如下转换关系：

其中，光滑函数γ(x,t)代表对光滑函数f₀(x,t)求取关于时间变量t的1-q阶导数；

S23、引入参数化神经网络，对光滑函数γ(x,t)进行逼近，即：

式中，代表径向基函数，θ_γ代表权值向量，e_γ代表神经网络逼近误差；对每一个跟随者，设计基于神经网络的逼近器，实现对未知的领导者不确定性模型的有效估计；即：

其中，代表第i个跟随者对领导者不确定性模型分量γ(x,t)的估计值，/>则代表对权值向量θ_γ的估计值；

S24、为了确保对不确定性部分γ(x,t)有效逼近，需要对神经网络逼近误差做出如下假设：

其中，δ_γ是一个正数，代表神经网络逼近误差的上界；

S25、在S23、S24的基础上，进一步确定神经网络逼近误差为：

其中，代表神经网络逼近误差，/>代表权值向量的估计误差。

进一步地，所述步骤S3包括以下子步骤：

S31、为了确保对未知干扰和不可测状态的有效估计，需要对干扰及其导数的上界做如下假设：

其中，ρ₁,ρ₂均为正常数，分别代表未知干扰d_i及其导数的上界；

S32、定义多欧拉-拉格朗日系统中个体的一阶状态、二阶状态和未知扰动的估计值分别为则对应估计误差为：

其中为对应的估计误差；

对于多欧拉-拉格朗日系统中的i号个体，设计如下形式的改进扩张高增益观测器：

式中参数α₁,α₂,α₃的选取需要使得特征多项式s³+α₁s²+α₂s+a₃＝0的根均具有负实部，s为复频率；

S33、设定可调参数ε为如下动态系统的输出状态：

其中，ω(0)＝ω₀,ω₀＞ε_f，且ε_f是一个小于1的常数，ω(0)代表变量ω的初值，ω₀代表一个预设的正常数；此外，可调参数c₁＞0,c₂＞0,0＜λ₁＜1以及λ₂＞1，其中，c₁,c₂分别代表动态系统的比例增益，而λ₁,λ₂则代表指数增益；进而，基于有限时间理论采用如(12)所示的动态系统，动态参数ε能够在固定时间内达到ε_f，且对应的调节时间为：

其中，T_Δ,T_max分别代表系统实际调节时间与系统调节时间的最大值；

S34、采用如(11)所示的扩张高增益观测器，能够实现同时对不可测的二阶状态和未知干扰的同时估计，且对应的估计性能能够通过动态系统(12)进行调整。

进一步地，所述步骤S4包括以下子步骤：

S41、定义二分一致性跟踪误差为：

其中a_ij表示多智能体网络拓扑中的邻接矩阵，b_i描述了领导者与跟随者之间的相对关系，若领导者能够将自身信息传输给跟随者，则b_i＝1，反之则b_i＝0，sgn(.)代表符号函数；

S42、为实现S31中的二分一致性跟踪误差的收敛，引入如下的坐标转换关系：

其中，z_1i,z_2i分别代表领导者与跟随者之间一阶状态、二阶状态的跟踪误差；

S43、对z_2i求导数，得到：

表示径向基函数；

S44、基于(14)中所定义的变量，构造如下形式的滑模面：

其中k₁,k₂均为正数；对(16)求导数，得到：

S45、基于经典滑模技术，构造如下形式的滑模面趋近律：

其中，比例增益ζ＞0,k_s＞0并且幂指数增益α∈[0,1]；

S46、结合S3中设计的扩张高增益观测器结果构造出控制输入为：

式中，代表对神经网络逼近误差的估计值；函数rem(.)和ren(.)分别为：

神经网络权值向量和逼近误差的自适应更新律为：

式中，k_γ代表自适应更新律的比例增益，k_δ代表逼近误差更新律的比例增益；

并且

进一步地，所述步骤S5包括以下子步骤：

S51、采用S46中所设计的控制输入，将其带入多欧拉-拉格朗日系统的动力学模型中，得到辅助变量导数为：

定义奇异扰动系统的辅助变量为得到滑模面的估计值的导数为：

S52、借助S51所得对应变量的导数信息，结合神经网络逼近器、扩张高增益观测器以及滑模控制器，基于奇异摄动理论，得到由快慢动态方程描述的闭环误差系统为：

其中，η_i＝[η_1iη_2iη_3i]^T；

若干扰的导数在调节时间T_Δ后趋于有界，那么快慢动态方程中对应量一直渐进有界，并且其最终界与可设计的参数ε_f有关，能够采用如(19)所示的控制输入，实现鲁棒二分一致性跟踪控制。

本发明提供一种首先建立多欧拉-拉格朗日系统，设计改进的高增益观测器，而后基于RBF神经网络对领导者的模型不确定性进行逼近，接着基于连续滑模控制技术，在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上，设计了鲁棒二分一致性跟踪控制器。扩展算法的应用场景，领导者模型不确定性、外部扰动以及不可测状态的不良影响。

相对于现有技术，本发明的有益效果体现在以下两个方面：

(1)针对具有领导者模型不确定性、跟随者个体受到未知干扰和不可测状态的多欧拉-拉格朗日系统，设计了一种神经网络逼近器结合扩展高增益观测器的分布式鲁棒二分一致性跟踪控制方案，有效实现了同时对具有模型不确定性的领导者而高阶信息、未知干扰和不可测状态的同时估计，能够提高多机械手系统在建模不准确、链路信息交互延迟以及老化、机械磨损等不良影响下的作业稳定性，为其实际应用提供有效解决方案。

(2)首先基于RBF神经网络对领导者的模型不确定性进行逼近，而后构建了改进的高增益观测器，接着基于连续滑模控制技术，在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上，结合滑模控制理论设计了一种基前馈反馈结构的鲁棒二分一致性跟踪控制器，有效提升了系统的鲁棒性，且此神经网络拟合方案能够有效地利用多机械手系统实际运行中产生的大量数据，较好地实现对模型不确定性的逼近以及为多机械手的实际应用提供有效的参数配置方案，简化了人工操作调参的复杂性。

附图说明

图1为本发明的一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法流程图；

图2是平面双铰链机械手的示意图；

图3为本实施例中多欧拉-拉格朗日系统的通信拓扑图；

图4为本实施例中欧拉-拉格朗日系统个体的位置状态响应；

图5为本实施例中未知干扰的估计误差；

图6为本实施例中神经网络的逼近误差；

图7为本实施例中二分一致性跟踪误差响应曲线；

图8为本实施例中控制输入的时间响应。

具体实施方式

发明研究了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制问题。已有的方法中，一方面假设了领导者的模型跟随者全员已知或部分已知，另外没有综合考虑不可测状态、未知干扰等不良因素。因此，本发明重点考虑了领导者模型不确定性、跟随者个体受到未知干扰和不可测状态的不良影响，首先构建了改进的高增益观测器，而后基于RBF神经网络对领导者的模型不确定性进行逼近，接着基于连续滑模控制技术，在利用奇异摄动理论分析闭环误差系统快慢变动态模型的收敛性基础上，设计了鲁棒二分一致性跟踪控制器。该发明能够为技术人员在实际操作中同时解决领导者模型不确定性、外部扰动以及不可测状态的不良影响奠定基础，提升二分一致性跟踪控制方案的鲁棒性和有效性。下面结合附图进一步说明本发明的技术方案。

如图1所示，本发明的一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法，包括以下步骤：

S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型，每个机械手的动态方程通常可以由欧拉-拉格朗日方程(Euler-Lagrange equation)描述，图2是一个简单的平面双铰链机械手的示意图。其中，坐标系(x₀,y₀)、(x₁,y₁)为机械手两个关节的轴坐标系，坐标系(x₂,y₂)为机械手末端，实际应用中带负载使用，其位置可以由工作关节角度向量q来描述，执行机构输入由作用于关节的二维力矩向量组成。而后通过坐标转换构建二阶模型，接着建立由分数阶动力学描述的领导者模型。

本步骤具体包括以下子步骤：

S12、令则多欧拉-拉格朗日系统表示为：

其中，x_1i,x_2i分别表示系统中个体i的一阶状态和二阶状态；代表输入增益；u_i＝τ_i，代表控制输入；/>是已知结构的非线性项；/>代表集总的未知时变干扰；由于传感器的限制，个体自身的速度信息无法反馈用于设计控制协议，同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居(即存在连接)进行交互，完成信息交换；

S13、定义由分数阶微积分描述的领导者动力学模型为：

其中，x₀(t)代表领导者的位置状态，领导者可设想为需要由多个机械手搬运或者协同作业的设备；代表分数阶微积分理论中的q阶导数符号，且0＜q≤2，所代表的意思是对状态量x₀(t)求取关于时间变量t的q阶导数；光滑函数f₀(x₀,t)对于每个跟随者来说都是未知的。

S2、定义二分一致性跟踪误差，而后构建RBF神经网络，生成参数自适应性更新律，实现对领导者不确定性模型的有效逼近；包括以下子步骤：

即，最终多欧拉-拉格朗日系统中的个体，如果与领导者之间有合作关系，则w_i＝1，同时其状态最终与领导者的状态趋于一致；反之，若存在的是竞争关系，则w_i＝-1，同时其状态最终与领导者的状态模值相反数趋于一致；总的来说，当满足如(4)所示的条件时，即称多欧拉-拉格朗日系统实现了二分一致性跟踪控制；

S23、引入参数化神经网络，对光滑函数γ(x,t)进行逼近，即：

其中，δ_γ是一个正数，代表神经网络逼近误差的上界；

S25、在S23、S24的基础上，进一步确定神经网络逼近误差为：

由此，基于S21-S25，即构建了参数化神经网络，实现对领导者具有的模型不确定性的有效逼近。

S3、针对S1建立的二阶多欧拉-拉格朗日系统，设计改进的扩张高增益观测器，实现对不可测的二阶状态以及未知干扰的有效估计，并基于有限时间理论，确定未知干扰和不可测二阶状态估计误差的收敛时间；包括以下子步骤：

其中为对应的估计误差；

S33、设定可调参数ε为如下动态系统的输出状态：

S4、基于滑模控制理论，设计包含一阶状态误差与二阶状态误差的滑模面，而后结合趋近律，通过代入S2中得到的未知干扰和不可测二阶状态的估计值以及S2中基于RBF神经网络构建的领导者的参数化逼近方程，设计鲁棒二分一致性跟踪控制器；包括以下子步骤：

S41、定义二分一致性跟踪误差为：

其中，z_1i、z_2i分别代表领导者与跟随者之间一阶状态、二阶状态的跟踪误差，即公式(7)中的/>

S43、对z_2i求导数，得到：

表示径向基函数；

S44、基于(14)中所定义的变量，构造如下形式的滑模面：

其中k₁,k₂均为正数；对(16)求导数，得到：

S45、基于经典滑模技术，构造如下形式的滑模面趋近律：

其中，比例增益ζ＞0,k_s＞0并且幂指数增益α∈[0,1]；

/>

神经网络权值向量和逼近误差的自适应更新律为：

并且

S5、将鲁棒二分一致跟踪控制器带入多欧拉-拉格朗日系统模型中，得到闭环误差系统，而后通过定义关于一阶状态和二阶状态的辅助误差变量，进而基于奇异摄动理论，通过将闭环误差系统转换为快慢动态相互耦合的动态方程，明确二分一致性跟踪误差上界；包括以下子步骤：

其中，η_i＝[η_1iη_2iη_3i]^T；

S6、将鲁棒二分一致跟踪控制器应用到多欧拉-拉格朗日系统中，使得多欧拉-拉格朗日系统中的个体能够最终实现组别划分，对领导者状态实现二分一致性跟踪；包括以下子步骤：

S61、将S4中所设计的鲁棒二分一致性跟踪控制器应用到多欧拉拉格朗日系统的个体动态方程中，在拓扑结构连通的情况下，能够实现二分一致性跟踪，且在对领导者不确定性模型的逼近同时，能够实现对未知干扰和不可测二阶状态的有效估计；

S62、综上步骤，完成了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制方案设计。

本实施例中多欧拉-拉格朗日系统的通信拓扑图如图3所示，存在6个个体。个体动力学模型中的未知干扰和不确定性分别为：

且拉格朗日系统的一阶状态和二阶状态的初值分别为

x_1i(0)＝[1.6,-1,1,0.5,-1.5]^T

x_2i(0)＝[0.5,-0.3,0.6,1.2,-0.8]^T

分数阶领导者的模型设置为：

控制参数分别选取为：

k₁＝10,k₂＝2,k_s＝0.3,γ＝0.3,α＝0.3,α₁＝2,α₂＝2,α₃＝2

λ₁＝0.5,λ₂＝2,c₁＝5,c₁＝5,ω₀＝0.2,ε_f＝0.05

图4为欧拉-拉格朗日系统的一阶状态响应图；图5为对未知干扰的估计误差；图6为神经网络的拟合误差；图7为多欧拉-拉格朗日系统的二分一致性跟踪误差响应曲线；图8为控制输入的时间响应；从仿真结果可以看出，最终本实施例中实现了多欧拉-拉格朗日系统的鲁棒二分一致性跟踪控制，同时，神经网络逼近误差、未知干扰和不可测状态的估计误差最终能够趋于有界，仿真结果表明本发明提出的控制方案可以提升多欧拉-拉格朗日系统的鲁棒性。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法，其特征在于，包括以下步骤：

S1、建立由多个机械手组成的多欧拉-拉格朗日系统中个体的动力学模型，每个机械手的动态方程由欧拉-拉格朗日方程描述；而后通过坐标转换构建二阶模型，接着建立由分数阶动力学描述的领导者模型；包括以下子步骤：

S12、令则多欧拉-拉格朗日系统表示为：

其中，x_1i,x_2i分别表示系统中个体i的一阶状态和二阶状态；代表输入增益；u_i＝τ_i，代表控制输入；/>是已知结构的非线性项；/>τ_di代表集总的未知时变干扰；由于传感器的限制，个体自身的速度信息无法反馈用于设计控制协议，同时多欧拉-拉格朗日系统中的一个个体仅能够与其邻居进行交互，完成信息交换；

S13、定义由分数阶微积分描述的领导者动力学模型为：

其中，x₀代表领导者的位置状态，代表分数阶微积分理论中的q阶导数符号，且0＜q≤2，所代表的意思是对状态量x₀求取关于时间变量t的q阶导数；光滑函数f₀(x₀,t)对于每个跟随者来说都是未知的；

S23、引入参数化神经网络，对光滑函数γ(x,t)进行逼近，即：

其中，δ_γ是一个正数，代表神经网络逼近误差的上界；

S25、在S23、S24的基础上，进一步确定神经网络逼近误差为：

其中，代表神经网络逼近误差，/>代表权值向量的估计误差；

S3、设计改进的扩张高增益观测器，实现对不可测的二阶状态以及未知干扰的有效估计，并基于有限时间理论，确定未知干扰和不可测二阶状态估计误差的收敛时间；包括以下子步骤：

其中为对应的估计误差；

S33、设定可调参数ε为如下动态系统的输出状态：

S34、采用如(11)所示的扩张高增益观测器，能够实现同时对不可测的二阶状态和未知干扰的同时估计，且对应的估计性能能够通过动态系统(12)进行调整；

S41、定义二分一致性跟踪误差为：

S43、对z_2i求导数，得到：

表示径向基函数；

S44、基于(14)中所定义的变量，构造如下形式的滑模面：

其中k₁,k₂均为正数；对(16)求导数，得到：

S45、基于经典滑模技术，构造如下形式的滑模面趋近律：

其中，比例增益ζ＞0,k_s＞0并且幂指数增益α∈[0,1]；

神经网络权值向量和逼近误差的自适应更新律为：

并且

其中，η_i＝[η_1iη_2iη_3i]^T；

若干扰的导数在调节时间T_Δ后趋于有界，那么快慢动态方程中对应量一直渐进有界，并且其最终界与可设计的参数ε_f有关，能够采用如(19)所示的控制输入，实现鲁棒二分一致性跟踪控制；