CN116909136B

CN116909136B - 基于确定学习的2-dof直升机滑模控制方法及系统

Info

Publication number: CN116909136B
Application number: CN202310741425.7A
Authority: CN
Inventors: 张付凯; 何伟添; 王聪
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-12-26
Anticipated expiration: 2043-06-21
Also published as: CN116909136A

Abstract

本发明提供了一种基于确定学习的2‑DOF直升机滑模控制方法及系统，包括：获取参考轨迹及直升机的实时状态信息；其中，所述状态信息包括直升机当前位置状态量及速度状态量；基于参考轨迹及直升机的实时状态信息，获得跟踪误差变量；将所述跟踪误差变量输入预先构建的滑模学习控制器中，获得相应的控制信号，并基于所述控制信号对直升机进行滑模控制；其中，所述滑模学习控制器的构建，具体为：构建直升机系统非线性动力学方程，利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。

Description

基于确定学习的2-DOF直升机滑模控制方法及系统

技术领域

本发明属于无人机控制技术领域，尤其涉及一种基于确定学习的2-DOF直升机滑模控制方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

无人机近年来引起了广泛关注，得到了迅速的发展和应用。其中,最常见的无人机类型为直升机，它广泛应用于物资运输、救援行动和探测任务等各个领域。然而，直升机的动力学建模依然存在着物理模型参数过多且不精确，耦合效应强等困难问题，这使得直升机的物理建模并不理想，从而增加了控制器设计的难度。

发明人发现，神经网络由于具有学习复杂的输入输出映射的能力而被广泛应用于非线性系统的辨识与控制。然而，绝大多数现有技术仅考虑了神经网络建模的稳定性分析，即仅保证状态跟踪误差的有界和收敛、以及神经网络权值的有界，而没有保证神经网络权值收敛到其真值或最优值，因而无法实现较好的系统动态逼近，导致其无法满足直升机的精确控制需求。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于确定学习的2-DOF直升机滑模控制方法及系统，所述方案基于径向基神经网络对2-DOF直升机系统进行局部精确建模，并以此来进行控制器设计，有效地避免该系统中过多难以精准测量的参数以及复杂的动力学分析等问题所带来的物理学建模不准确的问题；并通过确定学习的方法与滑模控制相结合，有效增强了滑模学习控制器的鲁棒性。

根据本发明实施例的第一个方面，提供了一种基于确定学习的2-DOF直升机滑模控制方法，包括：

获取参考轨迹及直升机的实时状态信息；其中，所述状态信息包括直升机当前位置状态量及速度状态量；

基于参考轨迹及直升机的实时状态信息，获得跟踪误差变量；

将所述跟踪误差变量输入预先构建的滑模学习控制器中，获得相应的控制信号，并基于所述控制信号对直升机进行滑模控制；

其中，所述滑模学习控制器的构建，具体为：构建直升机系统非线性动力学方程，利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。

进一步的，所述位置状态量包括俯仰角和偏航角，所述速度状态量包括俯仰角速度和偏航角速度。

进一步的，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建，具体为：预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络，并构建神经网络的权值更新律及学习过程控制率；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练；对于训练好的模型知识，以常值神经网络权值方式进行存储；基于存储的模型知识以及预先设计的滑模面，实现滑模学习控制器的构建。

进一步的，所述滑模学习控制器具体表示如下：

其中，C₂为控制参数，s为滑模面，为在预定时间段内对径向基神经网络的估计权重求平均值，S(Z)为高斯径向基函数，Z为神经网络的输入向量，K_g为可调参数，sign(s)为符号函数。

进一步的，所述速度状态量采用高增益观测器进行估计，所述高增益观测器具体表示如下：

其中，β为调节的参数，O₁为位置估计的中间过程变量，O₂为速度估计的中间过程变量，为变量O₁的微分，/>为变量O₂的微分，r₁为调节的参数，X₁为位置状态量，/>为速度状态量估计。

进一步的，所述速度状态量的估计具体表示如下：

进一步的，所述跟踪误差变量的获取，具体采用如下公式：

E₁＝X₁-X_d

E₂＝X₂-Λ

其中，X_d为参考跟踪轨迹，为参考跟踪轨迹的微分，X₁为位置状态量，X₂为速度状态量，Λ是辅助变量，E₁为角度误差，E₂为角速度误差，C₁为可调参数。

本发明的第二个方面提供了一种基于确定学习的2-DOF直升机滑模控制系统，包括：

数据获取单元，其用于获取参考轨迹及直升机的实时状态信息；其中，所述状态信息包括直升机当前位置状态量及速度状态量；

误差变量获取单元，其用于基于参考轨迹及直升机的实时状态信息，获得跟踪误差变量；

滑模控制单元，其用于将所述跟踪误差变量输入预先构建的滑模学习控制器中，获得相应的控制信号，并基于所述控制信号对直升机进行滑模控制；其中，所述滑模学习控制器的构建，具体为：构建直升机系统非线性动力学方程，利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。

根据本公开实施例的第三个方面，提供了一种电子设备，包括存储器、处理器及存储在存储器上运行的计算机程序，所述处理器执行所述程序时实现所述的一种基于确定学习的2-DOF直升机滑模控制方法。

根据本公开实施例的第四个方面，提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述的一种基于确定学习的2-DOF直升机滑模控制方法。

以上一个或多个技术方案存在以下有益效果：

(1)本发明提供了一种基于确定学习的2-DOF直升机滑模控制方法及系统，所述方案基于径向基神经网络对2-DOF直升机系统进行局部精确建模，并以此来进行控制器设计，有效地避免该系统中过多难以精准测量的参数以及复杂的动力学分析等问题所带来的物理学建模不准确的问题；并通过确定学习的方法与滑模控制相结合，有效增强了滑模学习控制器的鲁棒性。

(2)本发明所述方案将神经网络所拟合的系统局部模型用于2-DOF直升机的控制器设计中，有效节省了计算成本。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例中所述的控制设计流程图；

图2(a)为本发明实施例中所述的2-DOF直升机系统的自适应(学习阶段)控制过程的俯仰角跟踪性能仿真图；

图2(b)为本发明实施例中所述的2-DOF直升机系统的自适应(学习阶段)控制过程的偏航角的跟踪性能仿真图；

图3(a)和图3(b)为本发明实施例中所述的神经网络权重收敛情况仿真图；

图4(a)和图4(b)为本发明实施例中所述的使用常值神经网络与未知系统动态的逼近仿真图；

图5(a)和图5(b)为本发明实施例中所述的高增益观测器对角速度量的观测性能仿真图；

图6(a)为本发明实施例中所述的学习控制器俯仰角跟踪性能仿真图；

图6(b)为本发明实施例中所述的学习控制器偏航角跟踪性能仿真图；

图7(a)为本发明实施例中所述的滑模学习控制器的俯仰角跟踪性能仿真图。

图7(b)为本发明实施例中所述的滑模学习控制器的偏航角跟踪性能仿真图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

术语解释：

确定学习：确定学习理论主要是利用系统辨识、自适应控制和动态系统等概念和理论发展起来的。确定学习理论的要素包括：

(i)局部径向基函数网络(RBFN)的使用；

(ii)沿周期或类周期轨迹满足部分持续激励(PE)条件；

(iii)一类线性时变(LTV)自适应系统的指数稳定性；

(iv)沿周期或类周期轨迹非实现对非线性系统动态的局部准确神经网络建模。通过确定学习，系统动力学的模型知识可以被学习、存储并表示为常值神经网络。

滑模控制：滑模控制也叫变结构控制，本质上是一类特殊的非线性控制，且非线性表现为控制的不连续性。这种控制策略与其他控制的不同之处在于系统的“结构”并不固定，而是可以在动态过程中，根据系统当前的状态(如偏差及其各阶导数等)有目的地不断变化，迫使系统按照预定“滑动模态”的状态轨迹运动。

实施例一

本实施例提供了一种基于确定学习的2-DOF直升机滑模控制方法。

如图1所示，一种基于确定学习的2-DOF直升机滑模控制方法，包括：

在具体实施中，所述位置状态量包括俯仰角和偏航角，所述速度状态量包括俯仰角速度和偏航角速度。

在具体实施中，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建，具体为：预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络，并构建神经网络的权值更新律及学习过程控制率；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练；对于训练好的模型知识，以常值神经网络权值方式进行存储；基于存储的模型知识以及预先设计的滑模面，实现滑模学习控制器的构建。

具体的，为了便于理解，以下结合附图对本实施例所述方案进行说明：

一种基于确定学习的2-DOF直升机系统模型辨识及控制，其特征在于，步骤如下：

步骤1：建立系统的动力学模型

根据拉格朗日力学模型，系统的非线性动力学方程表达如下：

模型简化后得：

其中，X₁＝[θ,ψ]^T，u＝[V_p,V_y]^T。

其中，θ代表是俯仰角,为俯仰角加速度,/>为俯仰角速度，m为2-DOF直升机电机的总质量，ψ代表的是偏航角，J_p是俯仰运动的转动惯量，J_y是偏航运动的转动惯量，D_p是俯仰运动的摩擦系数，D_y是偏航运动的摩擦系数，K_pp是俯仰螺旋桨中作用于俯仰轴上的扭矩推力增益，K_py是偏航螺旋桨中作用于俯仰轴上的扭矩推力增益，K_yp是俯仰螺旋桨中作用于偏航轴上的扭矩推力增益，K_yy是偏航螺旋桨中作用于偏航轴上的扭矩推力增益，l_cm是质心到固定坐标系原点的距离，g是重力加速度，V_p是控制俯仰运动的电机电压输入，V_y是控制偏航运动的电机电压输入。

步骤2：定义跟踪误差变量

定义跟踪误差：

E₁＝X₁-X_d (10)

E₂＝X₂-Λ (11)

其中，X₁是该系统的位置状态量，X₂是该系统的速度状态量，Λ是辅助变量。C₁是根据系统的可调参数。

步骤3：设计高增益观测器

考虑实际应用中速度状态量X₂存在不可测的可能性，本次设计采用高增益观测器对速度状态量进行估计，高增益观测器的设计如下：

其中，由于高增益观测器满足赫尔维兹稳定的，那么在参数β和r₁选择合适下，高增益观测器一定能观测到对应的状态量。那么，定义速度状态量的估计量

步骤4：设计径向基神经网络：

其中，f_nn是2-DOF直升机系统中的局部非线性未知函数，是神经网络估计权重，是网络输入向量/>的高斯径向基函数。/>是对辅助变量Λ的时间导数。

设计神经网络的权值更新律：

其中，和/>分别是估计权重/>和估计误差权重/>的时间导数，Γ是权重更新增益，σ是可调正数。

步骤5：设计学习过程控制率u(t)：

其中，C₂是可调控制增益正数。

步骤6：系统稳定系分析：

根据所述系统的非线性方程，构建Lyapunov函数V(t)并分析2-DOF直升机系统的稳定性：

定义2-DOF直升机系统的Lyapunov函数V(t)为：

根据Lyapunov定理，从所定义的Lyapunov函数V(t)可知其正定性，进而验证的负定性，可以得出系统是符合渐近稳定。

定义2-DOF直升机系统的Lyapunov函数V(t)为：

最终证明系统是半全局一致稳定有界的。

步骤7：学习知识存储：

其中，是指在时间区间[t_a,t_b]内的对/>求平均值。并且0<t_a<t_b。

步骤8：设计滑模面：

s＝-C₁E₁+E₂ (22)

步骤9：滑模学习控制器的设计：

其中，K_g为可调参数。

步骤10：学习控制器的稳定性分析：

最终证明系统是半全局一致稳定有界的。

如图2(a)至图2(b)所示为本实施例所述方案2-DOF直升机系统的自适应(学习阶段)控制过程的俯仰角和偏航角的跟踪性能仿真图，其中，图2(a)展示了俯仰角跟踪性能，图2(b)展示了偏航角跟踪性能；图3(a)至图3(b)为本实施例所述方案神经网络权重收敛情况仿真图，W₁和W₂分别是神经网络的权重，由于本次要逼近的非线性函数是两维的，故需要两个神经网络，对应的是两个权重。图4(a)至图4(b)为本实施例所述方案使用常值神经网络与未知系统动态的逼近仿真图，其中，图4(a)中的fnn1对应公式(1)中的未知函数；图4(b)中的fnn2对应公式(2)中的未知函数，图5(a)至图5(b)为本实施例所述方案高增益观测器对角速度量的观测性能仿真图，其中，图5(a)为俯仰角速度的观测性能仿真图，图5(b)为偏航角速度的观测性能仿真图；如图6(a)至图6(b)和图7(a)至图7(b)所示，是在都加入相同干扰的情况下的对比图，图6是初始的学习控制器，图7是引入了滑模结构的学习控制器，主要是为了对比两种控制器的抗干扰能力，通过对比可以发现，在有干扰的情况下，滑模学习控制器具有抑制扰动的作用，跟踪性能更好。

实施例二

本实施例提供了一种基于确定学习的2-DOF直升机滑模控制系统。

一种基于确定学习的2-DOF直升机滑模控制系统，包括：

此处需要说明的是，本实施例中的各个模块与实施例一中的各个步骤一一对应，其具体实施过程相同，此处不再累述。

在更多实施例中，还提供：

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例一中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例一中所述的方法。

实施例一中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

上述实施例提供的一种基于确定学习的2-DOF直升机滑模控制方法及系统可以实现，具有广阔的应用前景。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种基于确定学习的2-DOF直升机滑模控制方法，其特征在于，包括：

其中，所述滑模学习控制器的构建，具体为：构建直升机系统非线性动力学方程，利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建；

所述滑模学习控制器具体表示如下：

其中，为控制参数，s为滑模面，/>为在预定时间段内对径向基神经网络的估计权重求平均值，S（Z）为高斯径向基函数，Z为神经网络的输入向量，/>为可调的参数，/>为符号函数；

所述跟踪误差变量的获取，具体采用如下公式：

其中，为参考跟踪轨迹，/>为参考跟踪轨迹的微分，/>为位置状态量，/>为速度状态量，/>是辅助变量，/>为角度误差，/>为角速度误差，/>为可调参数。

2.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法，其特征在于，所述位置状态量包括俯仰角和偏航角，所述速度状态量包括俯仰角速度和偏航角速度。

3.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法，其特征在于，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建，具体为：预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络，并构建神经网络的权值更新律及学习过程控制率；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练；对于训练好的模型知识，以常值神经网络权值方式进行存储；基于存储的模型知识以及预先设计的滑模面，实现滑模学习控制器的构建。

4.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法，其特征在于，所述速度状态量采用高增益观测器进行估计，所述高增益观测器具体表示如下：

其中，为调节的参数，/>为位置估计的中间过程变量，/>为速度估计的中间过程变量，/>为变量/>的微分，/>为变量/>的微分，/>为调节的参数，/>为位置状态量；定义速度状态量的估计量/>。

5.一种基于确定学习的2-DOF直升机滑模控制系统，其特征在于，包括：

滑模控制单元，其用于将所述跟踪误差变量输入预先构建的滑模学习控制器中，获得相应的控制信号，并基于所述控制信号对直升机进行滑模控制；其中，所述滑模学习控制器的构建，具体为：构建直升机系统非线性动力学方程，利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似；利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练，基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建；

所述滑模学习控制器具体表示如下：

所述跟踪误差变量的获取，具体采用如下公式：

6.一种电子设备，包括存储器、处理器及存储在存储器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-4任一项所述的一种基于确定学习的2-DOF直升机滑模控制方法。

7.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-4任一项所述的一种基于确定学习的2-DOF直升机滑模控制方法。