CN116909136B - 基于确定学习的2-dof直升机滑模控制方法及系统 - Google Patents
基于确定学习的2-dof直升机滑模控制方法及系统 Download PDFInfo
- Publication number
- CN116909136B CN116909136B CN202310741425.7A CN202310741425A CN116909136B CN 116909136 B CN116909136 B CN 116909136B CN 202310741425 A CN202310741425 A CN 202310741425A CN 116909136 B CN116909136 B CN 116909136B
- Authority
- CN
- China
- Prior art keywords
- helicopter
- sliding mode
- neural network
- radial basis
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000006870 function Effects 0.000 claims abstract description 47
- 238000003062 neural network model Methods 0.000 claims abstract description 27
- 238000010276 construction Methods 0.000 claims abstract description 12
- 230000000737 periodic effect Effects 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004886 process control Methods 0.000 claims description 4
- 230000001747 exhibiting effect Effects 0.000 claims 1
- 238000004088 simulation Methods 0.000 description 15
- 238000013461 design Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供了一种基于确定学习的2‑DOF直升机滑模控制方法及系统,包括:获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。
Description
技术领域
本发明属于无人机控制技术领域,尤其涉及一种基于确定学习的2-DOF直升机滑模控制方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
无人机近年来引起了广泛关注,得到了迅速的发展和应用。其中,最常见的无人机类型为直升机,它广泛应用于物资运输、救援行动和探测任务等各个领域。然而,直升机的动力学建模依然存在着物理模型参数过多且不精确,耦合效应强等困难问题,这使得直升机的物理建模并不理想,从而增加了控制器设计的难度。
发明人发现,神经网络由于具有学习复杂的输入输出映射的能力而被广泛应用于非线性系统的辨识与控制。然而,绝大多数现有技术仅考虑了神经网络建模的稳定性分析,即仅保证状态跟踪误差的有界和收敛、以及神经网络权值的有界,而没有保证神经网络权值收敛到其真值或最优值,因而无法实现较好的系统动态逼近,导致其无法满足直升机的精确控制需求。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于确定学习的2-DOF直升机滑模控制方法及系统,所述方案基于径向基神经网络对2-DOF直升机系统进行局部精确建模,并以此来进行控制器设计,有效地避免该系统中过多难以精准测量的参数以及复杂的动力学分析等问题所带来的物理学建模不准确的问题;并通过确定学习的方法与滑模控制相结合,有效增强了滑模学习控制器的鲁棒性。
根据本发明实施例的第一个方面,提供了一种基于确定学习的2-DOF直升机滑模控制方法,包括:
获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;
其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。
进一步的,所述位置状态量包括俯仰角和偏航角,所述速度状态量包括俯仰角速度和偏航角速度。
进一步的,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建,具体为:预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络,并构建神经网络的权值更新律及学习过程控制率;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识以及预先设计的滑模面,实现滑模学习控制器的构建。
进一步的,所述滑模学习控制器具体表示如下:
其中,C2为控制参数,s为滑模面,为在预定时间段内对径向基神经网络的估计权重求平均值,S(Z)为高斯径向基函数,Z为神经网络的输入向量,Kg为可调参数,sign(s)为符号函数。
进一步的,所述速度状态量采用高增益观测器进行估计,所述高增益观测器具体表示如下:
其中,β为调节的参数,O1为位置估计的中间过程变量,O2为速度估计的中间过程变量,为变量O1的微分,/>为变量O2的微分,r1为调节的参数,X1为位置状态量,/>为速度状态量估计。
进一步的,所述速度状态量的估计具体表示如下:
进一步的,所述跟踪误差变量的获取,具体采用如下公式:
E1=X1-Xd
E2=X2-Λ
其中,Xd为参考跟踪轨迹,为参考跟踪轨迹的微分,X1为位置状态量,X2为速度状态量,Λ是辅助变量,E1为角度误差,E2为角速度误差,C1为可调参数。
本发明的第二个方面提供了一种基于确定学习的2-DOF直升机滑模控制系统,包括:
数据获取单元,其用于获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
误差变量获取单元,其用于基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
滑模控制单元,其用于将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。
根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于确定学习的2-DOF直升机滑模控制方法。
根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种基于确定学习的2-DOF直升机滑模控制方法。
以上一个或多个技术方案存在以下有益效果:
(1)本发明提供了一种基于确定学习的2-DOF直升机滑模控制方法及系统,所述方案基于径向基神经网络对2-DOF直升机系统进行局部精确建模,并以此来进行控制器设计,有效地避免该系统中过多难以精准测量的参数以及复杂的动力学分析等问题所带来的物理学建模不准确的问题;并通过确定学习的方法与滑模控制相结合,有效增强了滑模学习控制器的鲁棒性。
(2)本发明所述方案将神经网络所拟合的系统局部模型用于2-DOF直升机的控制器设计中,有效节省了计算成本。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中所述的控制设计流程图;
图2(a)为本发明实施例中所述的2-DOF直升机系统的自适应(学习阶段)控制过程的俯仰角跟踪性能仿真图;
图2(b)为本发明实施例中所述的2-DOF直升机系统的自适应(学习阶段)控制过程的偏航角的跟踪性能仿真图;
图3(a)和图3(b)为本发明实施例中所述的神经网络权重收敛情况仿真图;
图4(a)和图4(b)为本发明实施例中所述的使用常值神经网络与未知系统动态的逼近仿真图;
图5(a)和图5(b)为本发明实施例中所述的高增益观测器对角速度量的观测性能仿真图;
图6(a)为本发明实施例中所述的学习控制器俯仰角跟踪性能仿真图;
图6(b)为本发明实施例中所述的学习控制器偏航角跟踪性能仿真图;
图7(a)为本发明实施例中所述的滑模学习控制器的俯仰角跟踪性能仿真图。
图7(b)为本发明实施例中所述的滑模学习控制器的偏航角跟踪性能仿真图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
术语解释:
确定学习:确定学习理论主要是利用系统辨识、自适应控制和动态系统等概念和理论发展起来的。确定学习理论的要素包括:
(i)局部径向基函数网络(RBFN)的使用;
(ii)沿周期或类周期轨迹满足部分持续激励(PE)条件;
(iii)一类线性时变(LTV)自适应系统的指数稳定性;
(iv)沿周期或类周期轨迹非实现对非线性系统动态的局部准确神经网络建模。通过确定学习,系统动力学的模型知识可以被学习、存储并表示为常值神经网络。
滑模控制:滑模控制也叫变结构控制,本质上是一类特殊的非线性控制,且非线性表现为控制的不连续性。这种控制策略与其他控制的不同之处在于系统的“结构”并不固定,而是可以在动态过程中,根据系统当前的状态(如偏差及其各阶导数等)有目的地不断变化,迫使系统按照预定“滑动模态”的状态轨迹运动。
实施例一
本实施例提供了一种基于确定学习的2-DOF直升机滑模控制方法。
如图1所示,一种基于确定学习的2-DOF直升机滑模控制方法,包括:
获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;
其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。
在具体实施中,所述位置状态量包括俯仰角和偏航角,所述速度状态量包括俯仰角速度和偏航角速度。
在具体实施中,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建,具体为:预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络,并构建神经网络的权值更新律及学习过程控制率;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识以及预先设计的滑模面,实现滑模学习控制器的构建。
具体的,为了便于理解,以下结合附图对本实施例所述方案进行说明:
一种基于确定学习的2-DOF直升机系统模型辨识及控制,其特征在于,步骤如下:
步骤1:建立系统的动力学模型
根据拉格朗日力学模型,系统的非线性动力学方程表达如下:
模型简化后得:
其中,X1=[θ,ψ]T,u=[Vp,Vy]T。
其中,θ代表是俯仰角,为俯仰角加速度,/>为俯仰角速度,m为2-DOF直升机电机的总质量,ψ代表的是偏航角,Jp是俯仰运动的转动惯量,Jy是偏航运动的转动惯量,Dp是俯仰运动的摩擦系数,Dy是偏航运动的摩擦系数,Kpp是俯仰螺旋桨中作用于俯仰轴上的扭矩推力增益,Kpy是偏航螺旋桨中作用于俯仰轴上的扭矩推力增益,Kyp是俯仰螺旋桨中作用于偏航轴上的扭矩推力增益,Kyy是偏航螺旋桨中作用于偏航轴上的扭矩推力增益,lcm是质心到固定坐标系原点的距离,g是重力加速度,Vp是控制俯仰运动的电机电压输入,Vy是控制偏航运动的电机电压输入。
步骤2:定义跟踪误差变量
定义跟踪误差:
E1=X1-Xd (10)
E2=X2-Λ (11)
其中,X1是该系统的位置状态量,X2是该系统的速度状态量,Λ是辅助变量。C1是根据系统的可调参数。
步骤3:设计高增益观测器
考虑实际应用中速度状态量X2存在不可测的可能性,本次设计采用高增益观测器对速度状态量进行估计,高增益观测器的设计如下:
其中,由于高增益观测器满足赫尔维兹稳定的,那么在参数β和r1选择合适下,高增益观测器一定能观测到对应的状态量。那么,定义速度状态量的估计量
步骤4:设计径向基神经网络:
其中,fnn是2-DOF直升机系统中的局部非线性未知函数,是神经网络估计权重,是网络输入向量/>的高斯径向基函数。/>是对辅助变量Λ的时间导数。
设计神经网络的权值更新律:
其中,和/>分别是估计权重/>和估计误差权重/>的时间导数,Γ是权重更新增益,σ是可调正数。
步骤5:设计学习过程控制率u(t):
其中,C2是可调控制增益正数。
步骤6:系统稳定系分析:
根据所述系统的非线性方程,构建Lyapunov函数V(t)并分析2-DOF直升机系统的稳定性:
定义2-DOF直升机系统的Lyapunov函数V(t)为:
根据Lyapunov定理,从所定义的Lyapunov函数V(t)可知其正定性,进而验证的负定性,可以得出系统是符合渐近稳定。
定义2-DOF直升机系统的Lyapunov函数V(t)为:
最终证明系统是半全局一致稳定有界的。
步骤7:学习知识存储:
其中,是指在时间区间[ta,tb]内的对/>求平均值。并且0<ta<tb。
步骤8:设计滑模面:
s=-C1E1+E2 (22)
步骤9:滑模学习控制器的设计:
其中,Kg为可调参数。
步骤10:学习控制器的稳定性分析:
最终证明系统是半全局一致稳定有界的。
如图2(a)至图2(b)所示为本实施例所述方案2-DOF直升机系统的自适应(学习阶段)控制过程的俯仰角和偏航角的跟踪性能仿真图,其中,图2(a)展示了俯仰角跟踪性能,图2(b)展示了偏航角跟踪性能;图3(a)至图3(b)为本实施例所述方案神经网络权重收敛情况仿真图,W1和W2分别是神经网络的权重,由于本次要逼近的非线性函数是两维的,故需要两个神经网络,对应的是两个权重。图4(a)至图4(b)为本实施例所述方案使用常值神经网络与未知系统动态的逼近仿真图,其中,图4(a)中的fnn1对应公式(1)中的未知函数;图4(b)中的fnn2对应公式(2)中的未知函数,图5(a)至图5(b)为本实施例所述方案高增益观测器对角速度量的观测性能仿真图,其中,图5(a)为俯仰角速度的观测性能仿真图,图5(b)为偏航角速度的观测性能仿真图;如图6(a)至图6(b)和图7(a)至图7(b)所示,是在都加入相同干扰的情况下的对比图,图6是初始的学习控制器,图7是引入了滑模结构的学习控制器,主要是为了对比两种控制器的抗干扰能力,通过对比可以发现,在有干扰的情况下,滑模学习控制器具有抑制扰动的作用,跟踪性能更好。
实施例二
本实施例提供了一种基于确定学习的2-DOF直升机滑模控制系统。
一种基于确定学习的2-DOF直升机滑模控制系统,包括:
数据获取单元,其用于获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
误差变量获取单元,其用于基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
滑模控制单元,其用于将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建。
此处需要说明的是,本实施例中的各个模块与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
上述实施例提供的一种基于确定学习的2-DOF直升机滑模控制方法及系统可以实现,具有广阔的应用前景。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (7)
1.一种基于确定学习的2-DOF直升机滑模控制方法,其特征在于,包括:
获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;
其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建;
所述滑模学习控制器具体表示如下:
其中,为控制参数,s为滑模面,/>为在预定时间段内对径向基神经网络的估计权重求平均值,S(Z)为高斯径向基函数,Z为神经网络的输入向量,/>为可调的参数,/>为符号函数;
所述跟踪误差变量的获取,具体采用如下公式:
其中,为参考跟踪轨迹,/>为参考跟踪轨迹的微分,/>为位置状态量,/>为速度状态量,/>是辅助变量,/>为角度误差,/>为角速度误差,/>为可调参数。
2.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法,其特征在于,所述位置状态量包括俯仰角和偏航角,所述速度状态量包括俯仰角速度和偏航角速度。
3.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法,其特征在于,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建,具体为:预先构建用于描述直升机系统中局部非线性未知函数的径向基神经网络,并构建神经网络的权值更新律及学习过程控制率;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识以及预先设计的滑模面,实现滑模学习控制器的构建。
4.如权利要求1所述的一种基于确定学习的2-DOF直升机滑模控制方法,其特征在于,所述速度状态量采用高增益观测器进行估计,所述高增益观测器具体表示如下:
其中,为调节的参数,/>为位置估计的中间过程变量,/>为速度估计的中间过程变量,/>为变量/>的微分,/>为变量/>的微分,/>为调节的参数,/>为位置状态量;定义速度状态量的估计量/>。
5.一种基于确定学习的2-DOF直升机滑模控制系统,其特征在于,包括:
数据获取单元,其用于获取参考轨迹及直升机的实时状态信息;其中,所述状态信息包括直升机当前位置状态量及速度状态量;
误差变量获取单元,其用于基于参考轨迹及直升机的实时状态信息,获得跟踪误差变量;
滑模控制单元,其用于将所述跟踪误差变量输入预先构建的滑模学习控制器中,获得相应的控制信号,并基于所述控制信号对直升机进行滑模控制;其中,所述滑模学习控制器的构建,具体为:构建直升机系统非线性动力学方程,利用径向基神经网络模型对直升机系统中的局部非线性未知函数进行近似;利用周期性的参考轨迹及对应的直升机状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行滑模学习控制器的构建;
所述滑模学习控制器具体表示如下:
其中,为控制参数,s为滑模面,/>为在预定时间段内对径向基神经网络的估计权重求平均值,S(Z)为高斯径向基函数,Z为神经网络的输入向量,/>为可调的参数,/>为符号函数;
所述跟踪误差变量的获取,具体采用如下公式:
其中,为参考跟踪轨迹,/>为参考跟踪轨迹的微分,/>为位置状态量,/>为速度状态量,/>是辅助变量,/>为角度误差,/>为角速度误差,/>为可调参数。
6.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4任一项所述的一种基于确定学习的2-DOF直升机滑模控制方法。
7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4任一项所述的一种基于确定学习的2-DOF直升机滑模控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310741425.7A CN116909136B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的2-dof直升机滑模控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310741425.7A CN116909136B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的2-dof直升机滑模控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116909136A CN116909136A (zh) | 2023-10-20 |
CN116909136B true CN116909136B (zh) | 2023-12-26 |
Family
ID=88363855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310741425.7A Active CN116909136B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的2-dof直升机滑模控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116909136B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2703914A1 (en) * | 2011-10-13 | 2014-03-05 | Institute of Nuclear Energy Research Atomic Energy Council | Hybrid control system and method for automatic voltage regulator |
CN106078741A (zh) * | 2016-06-21 | 2016-11-09 | 华南理工大学 | 基于确定学习理论的性能受限柔性机械臂控制方法 |
CN107608217A (zh) * | 2017-11-05 | 2018-01-19 | 西北工业大学 | 基于复合学习的mems陀螺仪模糊滑模控制方法 |
CN108445766A (zh) * | 2018-05-15 | 2018-08-24 | 山东大学 | 基于rpd-smc和rise的无模型四旋翼无人机轨迹跟踪控制器及方法 |
CN113589689A (zh) * | 2021-07-09 | 2021-11-02 | 南昌大学 | 一种基于多参数自适应神经网络的滑模控制器设计方法 |
CN114237270A (zh) * | 2021-12-08 | 2022-03-25 | 南京航空航天大学 | 一种考虑输入饱和的无人直升机跟踪控制方法 |
CN114516047A (zh) * | 2022-02-14 | 2022-05-20 | 安徽大学 | 基于径向基神经网络终端滑模控制机械臂轨迹方法及系统 |
CN114578696A (zh) * | 2022-03-03 | 2022-06-03 | 广州大学 | 2-dof直升机系统自适应神经网络量化容错控制方法 |
JP2022106261A (ja) * | 2021-01-06 | 2022-07-19 | 北京科技大学 | 二次元平面でのインテリジェント車両隊列制御方法 |
CN114839874A (zh) * | 2022-04-19 | 2022-08-02 | 广东工业大学 | 一种面向系统模型部分未知的平行控制方法及系统 |
CN116027799A (zh) * | 2023-03-30 | 2023-04-28 | 北京航空航天大学 | 一种载荷突变后的无人机姿态稳定控制方法 |
CN116088311A (zh) * | 2023-01-18 | 2023-05-09 | 南京航空航天大学 | 基于自适应神经网络扩张状态观测器的无人直升机二阶不确定滑模控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2022256517A1 (en) * | 2021-04-16 | 2023-11-09 | Strong Force Vcn Portfolio 2019, Llc | Systems, methods, kits, and apparatuses for digital product network systems and biology-based value chain networks |
-
2023
- 2023-06-21 CN CN202310741425.7A patent/CN116909136B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2703914A1 (en) * | 2011-10-13 | 2014-03-05 | Institute of Nuclear Energy Research Atomic Energy Council | Hybrid control system and method for automatic voltage regulator |
CN106078741A (zh) * | 2016-06-21 | 2016-11-09 | 华南理工大学 | 基于确定学习理论的性能受限柔性机械臂控制方法 |
CN107608217A (zh) * | 2017-11-05 | 2018-01-19 | 西北工业大学 | 基于复合学习的mems陀螺仪模糊滑模控制方法 |
CN108445766A (zh) * | 2018-05-15 | 2018-08-24 | 山东大学 | 基于rpd-smc和rise的无模型四旋翼无人机轨迹跟踪控制器及方法 |
JP2022106261A (ja) * | 2021-01-06 | 2022-07-19 | 北京科技大学 | 二次元平面でのインテリジェント車両隊列制御方法 |
CN113589689A (zh) * | 2021-07-09 | 2021-11-02 | 南昌大学 | 一种基于多参数自适应神经网络的滑模控制器设计方法 |
CN114237270A (zh) * | 2021-12-08 | 2022-03-25 | 南京航空航天大学 | 一种考虑输入饱和的无人直升机跟踪控制方法 |
CN114516047A (zh) * | 2022-02-14 | 2022-05-20 | 安徽大学 | 基于径向基神经网络终端滑模控制机械臂轨迹方法及系统 |
CN114578696A (zh) * | 2022-03-03 | 2022-06-03 | 广州大学 | 2-dof直升机系统自适应神经网络量化容错控制方法 |
CN114839874A (zh) * | 2022-04-19 | 2022-08-02 | 广东工业大学 | 一种面向系统模型部分未知的平行控制方法及系统 |
CN116088311A (zh) * | 2023-01-18 | 2023-05-09 | 南京航空航天大学 | 基于自适应神经网络扩张状态观测器的无人直升机二阶不确定滑模控制方法 |
CN116027799A (zh) * | 2023-03-30 | 2023-04-28 | 北京航空航天大学 | 一种载荷突变后的无人机姿态稳定控制方法 |
Non-Patent Citations (5)
Title |
---|
Amir Razzaghian ; Reihaneh Kardehi Moghaddam.Robust Adaptive Neural Network Control of Miniature Unmanned Helicopter.《Electrical Engineering (ICEE), Iranian Conference on》.2018,第801-805页. * |
Reinforcement Learning Control for a 2-DOF Helicopter With State Constraints: Theory and Experiments;Zhijia Zhao等;《IEEE Transactions on Automation Science and Engineering ( Early Access )》;全文 * |
六轴机械臂神经网络自适应终端滑模控制;贾华,等;《西安交通大学学报》;第56卷(第11期);全文 * |
基于改进型RBF神经网络的磁流变阻尼器动力学建模及仿真;周勇;冯志敏;刘小锋;周航;胡敏;;船舶工程(第04期) * |
欠驱动AUV 自适应神经网络反步滑模跟踪控制;王金强,等;《华中科技大学学报(自然科学版)》;第47卷(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116909136A (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pi et al. | Low-level autonomous control and tracking of quadrotor using reinforcement learning | |
CN109885883B (zh) | 一种基于gk聚类算法模型预测的无人车横向运动的控制方法 | |
CN107415939B (zh) | 一种分布式驱动电动汽车转向稳定性控制方法 | |
CN112775976A (zh) | 任务执行控制方法、装置、控制设备及可读存储介质 | |
CN105807789B (zh) | 基于t-s模糊观测器补偿的uuv控制方法 | |
Salaris et al. | Online optimal perception-aware trajectory generation | |
CN107563044B (zh) | 基于在线安全学习的四旋翼无人机路径跟踪控制方法 | |
Boukens et al. | Design of an intelligent optimal neural network-based tracking controller for nonholonomic mobile robot systems | |
CN112286218B (zh) | 基于深度确定性策略梯度的飞行器大迎角摇滚抑制方法 | |
Shin et al. | Adaptive support vector regression for UAV flight control | |
Peng | Adaptive intelligent backstepping longitudinal control of vehicleplatoons using output recurrent cerebellar model articulation controller | |
Wang et al. | Vision-based tracking control of underactuated water surface robots without direct position measurement | |
Zhou et al. | Extended incremental nonlinear dynamic inversion for optical flow control of micro air vehicles | |
CN115576341A (zh) | 基于函数微分和自适应变增益的无人机轨迹跟踪控制方法 | |
Goecks et al. | Control of morphing wing shapes with deep reinforcement learning | |
Zhang et al. | A flexible, reaction-wheel-driven fish robot: Flow sensing and flow-relative control | |
CN115480583A (zh) | 飞行作业机器人的视觉伺服跟踪与阻抗控制方法 | |
US11029709B1 (en) | Adaptive wind estimation, trajectory generation, and flight control for aerial systems using motion data | |
CN109709807B (zh) | 一种基于摩擦补偿的自适应神经网络控制方法及其装置 | |
CN116619383B (zh) | 基于确定学习的机械臂pid控制方法及系统 | |
CN116909136B (zh) | 基于确定学习的2-dof直升机滑模控制方法及系统 | |
Ge et al. | Adaptive neural network control of helicopters with unknown dynamics | |
Yuqi et al. | Time-varying parameters estimation with adaptive neural network EKF for missile-dual control system | |
Zhou et al. | An incremental approximate dynamic programming flight controller based on output feedback | |
Yang et al. | Robust adaptive three-dimensional trajectory tracking control scheme design for small fixed-wing UAVs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |