CN114114905A - 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法 - Google Patents

一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法 Download PDF

Info

Publication number
CN114114905A
CN114114905A CN202111237921.6A CN202111237921A CN114114905A CN 114114905 A CN114114905 A CN 114114905A CN 202111237921 A CN202111237921 A CN 202111237921A CN 114114905 A CN114114905 A CN 114114905A
Authority
CN
China
Prior art keywords
optimal
theta
controller
function
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111237921.6A
Other languages
English (en)
Other versions
CN114114905B (zh
Inventor
马倩
金鹏
徐胜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202111237921.6A priority Critical patent/CN114114905B/zh
Publication of CN114114905A publication Critical patent/CN114114905A/zh
Application granted granted Critical
Publication of CN114114905B publication Critical patent/CN114114905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法,将基于神经网络的非线性内模和自适应动态规划相结合,得到了近似最优的前馈‑反馈复合控制器设计方法,分为两个步骤:①利用输出调节及神经网络理论,构造非线性神经网络内模,重构输出调节方程的稳态解,并获得前馈控制器;②利用内模重构的稳态解将最优输出调节问题转换为最优镇定问题,然后引入自适应动态规划算法,通过算法迭代获得近似的最优反馈控制器。本发明仅依赖于舰载火箭炮发射装置的输入‑状态数据便可得到近似最优控制器;引入非线性内模,不仅可以处理系统内部的参数不确定,同时还可抵御外部海浪等非线性的扰动对于发射装置的影响,实用性更强、应用范围更广。

Description

一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法
技术领域
本发明涉及舰载武器控制技术领域,特别是一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法。
背景技术
随着高新技术的迅猛发展和在军事上的广泛应用,对舰载火箭炮发射装置的控制性能提出更高要求。然而如图1,由于难以获得发射装置的精确系统模型以及海浪对发射装置的扰动,降低了系统的目标打击性能。另外,海洋作战,物质补给较为麻烦,因此,如何在不依赖系统模型的基础上,克服舰体摇摆干扰,并以最小代价实现火箭炮发射装置的跟踪控制成为了舰载火箭炮急需攻克的难题之一。
根据文献检索发现,现有基于内模的火箭炮发射装置的跟踪控制方法大多是基于模型的,而且均未实现最优跟踪。例如,文献1(曾令梦,高强,侯远龙,孙战,蒋梦琴.基于自构建神经网络的舰载火箭炮内模控制,《火炮发射与控制学报》,2017年)利用神经网络建立过程模型和内模,虽能实现跟踪,但无性能函数的约束,不能实现最优跟踪。同理,文献2(庄文许,马大为,张龙,胡健,郑颖.舰载火箭炮自适应内模输出调节问题研究,《兵工学报》,2013年)也是一种渐近跟踪,而不能实现最优跟踪;此外该文献所设计的控制方法依赖系统模型,所设计的内模仅能处理线性扰动,具有一定的局限性。
发明内容
本发明解决的技术问题是:克服模型未知且外部海浪等非线性扰动对于舰载火箭炮发射装置的不利影响,提供一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法,将内模原理和自适应动态规划相结合,利用内模原理,重构外系统状态,并获得前馈控制项;利用自适应动态规划算法设计最优的反馈控制器,实现最小代价下的目标跟踪。
为了达到上述目的,本发明的技术方案如下:一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法,将基于神经网络的非线性内模和自适应动态规划相结合,得到近似最优的前馈-反馈复合控制器构建方法,具体包括以下步骤:
步骤1、建立舰载火箭炮发射装置的数学模型,用于后续系统数据收集;
步骤2、根据输出调节理论,利用调节方程的解,将最优输出调节问题转换为最优镇定问题;
步骤3、根据输出调节理论及神经网络逼近理论,设计非线性神经网络内模,获得输出调节方程的解,并设计前馈控制器;
步骤4、根据步骤1建立的模型,利用加有探索噪声的容许控制器激励系统,收集被控系统的输入数据和状态数据;
步骤5、引入自适应动态规划算法,通过算法迭代获得更优的价值函数权重系数和策略函数权重系数;
步骤6、算法迭代,重复步骤5,直至满足算法结束条件,得到近似最优权重系数;
步骤7、利用步骤6得到的近似最优权重系数,获得近似最优反馈控制策略,并与步骤3中得到的前馈控制器进行整合,得到近似最优的前馈-反馈复合控制器。
本发明与现有技术相比,其显著优点为:
(1)提出一种基于数据的最优输出调节控制方法,所提出的方法不依赖于被控系统精确数学模型,仅利用系统数据便可实现最优跟踪控制;
(2)考虑了基于数据驱动的火箭炮发射装置的最优跟踪问题,首次将自适应动态规划和神经网络内模相结合,不仅避免了求解输出调节方程,而且可以处理一类非线性外部扰动,提高了控制器的鲁棒性,具有更广阔的应用前景。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或先有技术描述中所需要使用的附图作简单地介绍。
图1是本发明舰载火箭炮发射装置的示意图。
图2是本发明舰载火箭炮发射装置的控制算法流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细说明。
本发明公开了一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法,将基于神经网络的非线性内模和自适应动态规划相结合,得到了近似最优的前馈-反馈复合控制器设计方法,分为两个步骤:①利用输出调节及神经网络理论,构造非线性神经网络内模,重构输出调节方程的稳态解,并获得前馈控制器;②利用内模重构的稳态解将最优输出调节问题转换为最优镇定问题,然后引入自适应动态规划算法,通过算法迭代获得近似的最优反馈控制器。
本发明舰载火箭炮的最优跟踪控制算法流程图如图2所示,具体步骤如下:
步骤1、建立舰载火箭炮发射装置的数学模型,用于后续系统数据收集;
步骤2、根据输出调节理论,利用调节方程的解,将最优输出调节问题转换为最优镇定问题;
步骤3、根据输出调节理论及神经网络逼近理论,设计非线性神经网络内模,获得输出调节方程的解,并设计前馈控制器;
步骤4、根据步骤1建立的模型,利用加有探索噪声的容许控制器激励系统,收集被控系统的输入数据和状态数据;
步骤5、引入自适应动态规划算法,通过算法迭代获得更优的价值函数权重系数和策略函数权重系数;
步骤6、算法迭代,重复步骤5,直至满足算法结束条件,得到近似最优权重系数;
步骤7、利用步骤6得到的近似最优权重系数,获得近似最优反馈控制策略,并与步骤3中得到的前馈控制器进行整合,得到近似最优的前馈-反馈复合控制器。
进一步地,步骤4具体为:中建立舰载火箭炮发射装置的数学模型,用于后续系统数据收集,具体如下:
Figure BDA0003318152700000031
其中,θf为发射箱中心线与舰体甲板基准平面的夹角;ωf为发射箱中心线与舰体甲板基准平面夹角的角速度,
Figure BDA0003318152700000032
为ωf的导数;σf为中间变量,
Figure BDA0003318152700000033
为σf的导数;
Figure BDA0003318152700000034
为系统扰动输入,θc代表舰体甲板基准平面与水平面的夹角,
Figure BDA0003318152700000035
代表舰体甲板基准平面与水平面的角加速度,α为控制器输入,r为被跟踪信号,y为系统输出,e为跟踪误差,J为系统负载转动惯量与电机折算至负载端等效转动惯量之和,L为电机绕组等效电感,I为传动链减速比,R为电机绕组等效电阻,Kt为电机电流转矩系数,Ke为电机反电动势系数,Fb为电机粘滞摩擦系数。
舰体的上下摇摆运动θc由如下外系统产生:
Figure BDA0003318152700000041
其中,θ为外系统的状态量,
Figure BDA0003318152700000042
为θ的导数;S(θ)为非线性函数,Γ为输出系数矩阵;θ(0)、θ0为外系统的状态量θ的初始值。
假设被跟踪信号r为常量,令r=0°,即被打击目标与舰艇处于同一水平面上,控制目标可表述为:在标准假设条件下,设计控制器,在控制器作用下调整舰载火箭炮发射装置的发射角,以最小代价将发射箱中心线与水平面夹角调整为y=θfc=0°,即表示成功打击到目标。
进一步地,步骤4具体为:中根据输出调节理论,利用调节方程的解,将最优输出调节问题转换为最优镇定问题,具体如下:
根据输出调节理论,输出调节问题能被解决当且仅当如下输出调节方程有解:
Figure BDA0003318152700000043
其中,θf、ωf、σf为系统稳定状态量,
Figure BDA0003318152700000044
为θf的导数,α为系统稳态控制输入,
Figure BDA0003318152700000045
表示ωf对变量θ的求偏导,
Figure BDA0003318152700000046
表示σf对变量θ的求偏导。
定义状态变换x1=θff,x2=ωff,x3=σff和输入变换u=α-α,则可将最优输出调节问题转换为最优镇定问题:
Figure BDA0003318152700000047
其中,x1、x2、x3为实际状态量θf、ωf、σf与稳态状态量θf、ωf、σf之间的误差;u为实际控制输入α与稳态控制输入α之间的误差。
将系统(4)写成紧凑形式,有
Figure BDA0003318152700000051
其中,各变量的含义如下:
Figure BDA0003318152700000052
为了表达的简便,后文描述中,我们用f、g代表f(x,θ)、g(x,θ)。经过上述转换,最优输出调节问题被转换为最优镇定问题,该问题的具体描述如下:
针对由公式(1)表示的系统和由公式(2)表示的外系统,设计如下形式的复合控制器
α*=u*+α(θ) (6)
其中,α*为近似最优的复合控制器,它由最优反馈控制器u*和前馈控制器α(θ)构成。
考虑如下性能指标函数J(x0,u),其表达式如下:
Figure BDA0003318152700000053
其中,x0为状态x的初始值,r(x,u)=Q(x)+uTRu,Q(x)为正定函数,R为正定对称矩阵,uT代表控制输入u的转置。上述控制器使得系统满足以下条件:①闭环系统所有状态有界;②跟踪误差一致最终有界;③代价函数(7)取最小值。
进一步地,步骤4具体为:中根据输出调节理论及神经网络逼近理论,设计非线性神经网络内模,获得输出调节方程的解,并设计前馈控制器,具体如下:
设计非线性神经网络内模之前,给出必要的假设条件1,其表述如下:
假设1:形如公式(2)的外系统能浸入到如下系统:
Figure BDA0003318152700000054
其中,
Figure BDA0003318152700000061
为稳态发生器的状态量,
Figure BDA0003318152700000062
为其导数,G,J,F,H为常系数矩阵,且(H,F)为可观矩阵对;χ(·)为非线性函数,满足如下关系式:
(s1-s2)T(χ(s1)-χ(s2))≥0 (9)
其中,s1、s2为函数χ(·)的自变量,χ(s1)、χ(s2)为函数χ(·)的因变量。
设计如下非线性内模
Figure BDA0003318152700000063
其中,η为内模状态,
Figure BDA0003318152700000064
为内模状态量的导数,K为增益矩阵,
Figure BDA0003318152700000065
为待设计函数。
为将问题转换为关于原点的镇定问题,定义如下坐标变换
Figure BDA0003318152700000066
其中,
Figure BDA0003318152700000067
为内模状态与稳定状态之间的误差。
为保证上述误差系统渐近问题,取
Figure BDA0003318152700000068
其中,
Figure BDA0003318152700000069
为函数f3(x,θ)的估计值,由神经网络逼近得到,F0=F-KH为系数矩阵。
将(12)式代入(10)式,得非线性内模方程为
Figure BDA00033181527000000610
根据式(8)和式(11),可得前馈控制项为:
Figure BDA00033181527000000611
进一步地,步骤4具体为:利用步骤1建立的模型,利用加有探索噪声的容许控制器激励系统,收集被控系统的输入数据和状态数据,具体如下:
为摆脱对于精确数学模型的依赖,设计基于数据的控制方法,为获得系统输入-状态数据,可在容许控制中加入探索噪声,即
u=u1+ζ (15)
其中,u1为初始的容许控制器,在该控制器作用下,系统能保持稳定,即系统的所有状态量都是有界的;ζ为探索噪声,一般由多个正弦或者余弦信号叠加而成,该探索噪声能充分激发系统特性,保证系统能找到更好的控制器。
进一步地,步骤5具体为:引入自适应动态规划算法,通过算法迭代获得更优的价值函数权重系数和策略函数权重系数,具体如下:
定义系统(5)的价值函数V(x,θ),形式如下:
Figure BDA0003318152700000071
后文中,为简便起见,用V代表V(x,θ),V*为V的最优值,u*为u的最优值。根据最优控制理论,最优控制器的求解可转化为哈密尔顿-雅克比-贝尔曼方程的求解问题,方程的具体表达式如下:
Figure BDA0003318152700000072
其中,
Figure BDA0003318152700000073
代表V对变量x求偏导,
Figure BDA0003318152700000074
代表V对变量θ求偏导。
又因为最优控制量u*和最优值函数V*满足如下条件:
Figure BDA0003318152700000075
其中,
Figure BDA0003318152700000076
代表V*对变量x求偏导,
Figure BDA0003318152700000077
代表V对变量θ求偏导。
且最优控制量u*同时满足如下方程
Figure BDA0003318152700000078
通过求解(19)式,可得
Figure BDA0003318152700000079
将(20)代入(18),可得
Figure BDA0003318152700000081
由于难以直接通过求解(21)式,获得最优的价值函数V*以及最优控制策略u*。因此,研究人员提出了策略迭代算法求解最优控制策略。策略迭代算法包括如下两步:
(1)策略评估
Figure BDA0003318152700000082
(2)策略改进
Figure BDA0003318152700000083
其中,Vi和ui分别为第i次的价值函数和控制策略函数,
Figure BDA0003318152700000084
Figure BDA0003318152700000085
分别代表
Figure BDA0003318152700000086
Figure BDA0003318152700000087
的转置。通过反复迭代(22)式和(23)式,当i取无限大时,便可得到最优的控制器u*
上述策略迭代算法虽然可避免哈密尔顿-雅克比-贝尔曼方程,但该求解过程仍然依赖系统信息f和g。为克服难以得到系统精确系统模型的问题,因此引入自适应动态规划算法解决这一问题,将(5)式重写为:
Figure BDA0003318152700000088
其中,
Figure BDA0003318152700000089
当i≥1,对第i次的价值函数进行求导,并将(22)式和(23)式代入,有
Figure BDA00033181527000000810
上式可进一步表示为:
Figure BDA00033181527000000811
其中,Vi(x(tk+1),θ(tk+1))、Vi(x(tk),θ(tk))为第i次迭代tk+1和tk时刻的价值函数Vi的值。
根据神经网络逼近原理,价值函数Vi(x,θ)和控制策略ui+1可以由如下神经网络近似得到
Figure BDA0003318152700000091
其中,
Figure BDA0003318152700000092
分别为价值函数Vi(x,θ)和策略函数ui+1的神经网络的基函数,N1和N2代表神经网络个数,
Figure BDA0003318152700000093
为第i次迭代时的价值函数Vi(x,θ)的估计值,
Figure BDA0003318152700000094
为第i+1次迭代时的策略函数ui+1的估计值,
Figure BDA0003318152700000095
分别为
Figure BDA0003318152700000096
Figure BDA0003318152700000097
的权重系数。
将(27)式代入(26)式,可得如下迭代公式
Figure BDA0003318152700000098
其中,
Figure BDA0003318152700000099
Figure BDA00033181527000000910
的转置,Ei,k为逼近误差,最优的权重系数
Figure BDA00033181527000000911
由最小二乘法梯度下降得到。
进一步地,步骤6具体为:算法迭代,重复步骤5,直至相邻两次的价值函数权重系数的二范数之差小于给定误差精度或者达到算法预设的最大迭代次数,则算法结束,得到近似最优权重系数;
进一步地,步骤7具体为:利用步骤6得到的近似最优权重系数,获得近似最优反馈控制策略,并与步骤3中得到的前馈控制器进行整合,得到近似最优的前馈-反馈复合控制器。
本发明整合了输出调节理论和自适应动态规划理论,首先,利用输出调节理论,得到前馈控制器,并将最优输出调节问题转换为最优镇定问题;然后,利用自适应动态规划算法得到了近似最优反馈控制器。本发明首次将自适应动态规划和基于神经网络的非线性内模型相结合,得到了一种近似最优的前馈-反馈复合控制器,实现了在不依赖精确数学模型的基础上,完成了被打击目标的近似最优跟踪和外部海浪的扰动抑制,可以应用于其他舰载武器,包括舰载垂直起降飞行器的起降控制、舰载雷达的姿态控制等,为舰载武器的最优伺服控制提供了解决方案。
本发明未详细说明部分属本领域技术人员公知常识。

Claims (7)

1.一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,将基于神经网络的非线性内模和自适应动态规划相结合,得到近似最优的前馈-反馈复合控制器构建方法,具体包括以下步骤:
步骤1、建立舰载火箭炮发射装置的数学模型,用于后续系统数据收集;
步骤2、根据输出调节理论,利用调节方程的解,将最优输出调节问题转换为最优镇定问题;
步骤3、根据输出调节理论及神经网络逼近理论,设计非线性神经网络内模,获得输出调节方程的解,并设计前馈控制器;
步骤4、根据步骤1建立的模型,利用加有探索噪声的容许控制器激励系统,收集被控系统的输入数据和状态数据;
步骤5、引入自适应动态规划算法,通过算法迭代获得更优的价值函数权重系数和策略函数权重系数;
步骤6、算法迭代,重复步骤5,直至满足算法结束条件,得到近似最优权重系数;
步骤7、利用步骤6得到的近似最优权重系数,获得近似最优反馈控制策略,并与步骤3中得到的前馈控制器进行整合,得到最终的近似最优的前馈-反馈复合控制器。
2.根据权利要求1所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤1所述的建立舰载火箭炮发射装置的数学模型,用于后续系统数据收集,具体如下:
Figure FDA0003318152690000011
其中,θf为发射箱中心线与舰体甲板基准平面的夹角;ωf为发射箱中心线与舰体甲板基准平面夹角的角速度,
Figure FDA0003318152690000012
为ωf的导数;σf为中间变量,
Figure FDA0003318152690000013
为σf的导数;
Figure FDA0003318152690000014
为系统扰动输入,θc代表舰体甲板基准平面与水平面的夹角,
Figure FDA0003318152690000015
代表舰体甲板基准平面与水平面的角加速度,α为控制器输入,r为被跟踪信号,y为系统输出,e为跟踪误差,J为系统负载转动惯量与电机折算至负载端等效转动惯量之和,L为电机绕组等效电感,I为传动链减速比,R为电机绕组等效电阻,Kt为电机电流转矩系数,Ke为电机反电动势系数,Fb为电机粘滞摩擦系数;
舰体的上下摇摆运动θc由如下外系统产生:
Figure FDA0003318152690000021
其中,θ为外系统的状态量,
Figure FDA0003318152690000022
为θ的导数;S(θ)为非线性函数,Γ为输出系数矩阵;θ(0)、θ0为外系统的状态量θ的初始值;
假设被跟踪信号r为常量,令r=0°,即被打击目标与舰艇处于同一水平面上,控制目标表述为:在标准假设条件下设计控制器,在控制器作用下调整舰载火箭炮发射装置的发射角,以最小代价将发射箱中心线与水平面夹角调整为y=θfc=0°,即表示成功打击到目标。
3.根据权利要求2所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤2所述的根据输出调节理论,利用调节方程的解,将最优输出调节问题转换为最优镇定问题,具体如下:
根据输出调节理论,输出调节问题能被解决当且仅当如下输出调节方程有解:
Figure FDA0003318152690000023
其中,θf、ωf、σf为系统稳定状态量,
Figure FDA0003318152690000024
为θf的导数,α为系统稳态控制输入,
Figure FDA0003318152690000025
表示ωf对变量θ的求偏导,
Figure FDA0003318152690000026
表示σf对变量θ的求偏导;
定义状态变换x1=θff,x2=ωff,x3=σff和输入变换u=α-α,则将最优输出调节问题转换为最优镇定问题:
Figure FDA0003318152690000031
其中,x1、x2、x3为实际状态量θf、ωf、σf与稳态状态量θf、ωf、σf之间的误差;u为实际控制输入α与稳态控制输入α之间的误差;
将系统式(4)写成紧凑形式,有
Figure FDA0003318152690000032
其中,各变量的含义如下:
Figure FDA0003318152690000033
后文描述中用f、g代表f(x,θ)、g(x,θ);
经过上述转换,最优输出调节问题被转换为最优镇定问题,该问题的具体描述如下:
针对由公式(1)表示的系统和由公式(2)表示的外系统,设计如下形式的复合控制器:
α*=u*+α(θ) (6)
其中,α*为近似最优的复合控制器,它由最优反馈控制器u*和前馈控制器α(θ)构成;
考虑如下性能指标函数J(x0,u),表达式如下:
Figure FDA0003318152690000034
其中,x0为状态x的初始值,r(x,u)=Q(x)+uTRu,Q(x)为正定函数,R为正定对称矩阵,uT代表控制输入u的转置;
上述控制器使得系统满足以下条件:①闭环系统所有状态有界;②跟踪误差一致最终有界;③代价函数(7)取最小值。
4.根据权利要求3所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤3所述的根据输出调节理论及神经网络逼近理论,设计非线性神经网络内模,获得输出调节方程的解,并设计前馈控制器,具体如下:
设计非线性神经网络内模之前,给出必要的假设条件1,表述如下:
假设1:形如公式(2)的外系统能浸入到如下系统:
Figure FDA0003318152690000041
其中,
Figure FDA0003318152690000042
为稳态发生器的状态量,
Figure FDA0003318152690000043
为其导数,G,J,F,H为常系数矩阵,且(H,F)为可观矩阵对;χ(·)为非线性函数,满足如下关系式:
(s1-s2)T(χ(s1)-χ(s2))≥0 (9)
其中,s1、s2为函数χ(·)的自变量,χ(s1)、χ(s2)为函数χ(·)的因变量;
设计如下非线性内模
Figure FDA0003318152690000044
其中,η为内模状态,
Figure FDA0003318152690000045
为内模状态量的导数,K为增益矩阵,
Figure FDA0003318152690000046
为待设计函数;
为将问题转换为关于原点的镇定问题,定义如下坐标变换
Figure FDA0003318152690000047
其中,
Figure FDA0003318152690000048
为内模状态与稳定状态之间的误差;
为保证上述误差系统渐近问题,取
Figure FDA0003318152690000049
其中,
Figure FDA00033181526900000410
为函数f3(x,θ)的估计值,由神经网络逼近得到,F0=F-KH为系数矩阵;
将(12)式代入(10)式,得非线性内模方程为
Figure FDA00033181526900000411
根据式(8)和式(11),得前馈控制项为:
Figure FDA00033181526900000412
5.根据权利要求4所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤4所述的根据步骤1建立的模型,利用加有探索噪声的容许控制器激励系统,收集被控系统的输入数据和状态数据,具体如下:
为摆脱对于精确数学模型的依赖,设计基于数据驱动的控制方法,为获得系统输入-状态数据,在容许控制中加入探索噪声,即
u=u1+ζ (15)
其中,u1为初始的容许控制器,在该控制器作用下,系统能保持稳定,即系统的所有状态量都是有界的;ζ为探索噪声,由多个正弦或者余弦信号叠加而成。
6.根据权利要求5所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤5所述的引入自适应动态规划算法,通过算法迭代获得更优的价值函数权重系数和策略函数权重系数,具体如下:
定义系统式(5)的价值函数V(x,θ),形式如下:
Figure FDA0003318152690000051
后文中用V代表V(x,θ),V*为V的最优值,u*为u的最优值;
根据最优控制理论,最优控制器的求解转化为哈密尔顿-雅克比-贝尔曼方程的求解问题,方程的具体表达式如下:
Figure FDA0003318152690000052
其中,
Figure FDA0003318152690000053
代表V对变量x求偏导,
Figure FDA0003318152690000054
代表V对变量θ求偏导;
又因为最优控制量u*和最优值函数V*满足如下条件:
Figure FDA0003318152690000055
其中,
Figure FDA0003318152690000056
代表V*对变量x求偏导,
Figure FDA0003318152690000057
代表V对变量θ求偏导;
且最优控制量u*同时满足如下方程
Figure FDA0003318152690000061
通过求解式(19),得
Figure FDA0003318152690000062
将式(20)代入式(18),得
Figure FDA0003318152690000063
由于难以直接通过求解(21)式,获得最优的价值函数V*以及最优控制策略u*,因此研究人员提出了策略迭代算法求解最优控制策略,策略迭代算法包括如下两步:
(1)策略评估
Figure FDA0003318152690000064
(2)策略改进
Figure FDA0003318152690000065
其中,Vi和ui分别为第i次的价值函数和控制策略函数,
Figure FDA0003318152690000066
Figure FDA0003318152690000067
分别代表
Figure FDA0003318152690000068
Figure FDA0003318152690000069
的转置;通过反复迭代式(22)和式(23),当i取无限大时,得到最优的控制器u*
上述策略迭代算法虽然可避免哈密尔顿-雅克比-贝尔曼方程,但该求解过程仍然依赖系统信息f和g;为克服难以得到系统精确系统模型的问题,因此引入自适应动态规划算法解决这一问题,将式(5)重写为:
Figure FDA00033181526900000610
其中,
Figure FDA00033181526900000611
当i≥1,对第i次的价值函数进行求导,并将式(22)和式(23)代入,有
Figure FDA00033181526900000612
上式进一步表示为:
Figure FDA0003318152690000071
其中,Vi(x(tk+1),θ(tk+1))、Vi(x(tk),θ(tk))为第i次迭代tk+1和tk时刻的价值函数Vi的值;
根据神经网络逼近原理,价值函数Vi(x,θ)和控制策略ui+1由如下神经网络近似得到
Figure FDA0003318152690000072
其中,
Figure FDA0003318152690000073
分别为价值函数Vi(x,θ)和策略函数ui+1的神经网络的基函数,N1和N2代表神经网络个数,
Figure FDA0003318152690000074
为第i次迭代时的价值函数Vi(x,θ)的估计值,
Figure FDA0003318152690000075
为第i+1次迭代时的策略函数ui+1的估计值,
Figure FDA0003318152690000076
分别为
Figure FDA0003318152690000077
Figure FDA0003318152690000078
的权重系数;
将式(27)代入式(26),得如下迭代公式
Figure FDA0003318152690000079
其中,
Figure FDA00033181526900000710
Figure FDA00033181526900000711
的转置,Ei,k为逼近误差,最优的权重系数
Figure FDA00033181526900000712
由最小二乘法梯度下降得到。
7.根据权利要求6所述的数据驱动的舰载火箭炮发射装置最优跟踪控制方法,其特征在于,步骤6中所述的算法结束条件为直至相邻两次的价值函数权重系数的二范数之差小于给定误差精度或者达到算法预设的最大迭代次数。
CN202111237921.6A 2021-10-25 2021-10-25 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法 Active CN114114905B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111237921.6A CN114114905B (zh) 2021-10-25 2021-10-25 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111237921.6A CN114114905B (zh) 2021-10-25 2021-10-25 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法

Publications (2)

Publication Number Publication Date
CN114114905A true CN114114905A (zh) 2022-03-01
CN114114905B CN114114905B (zh) 2023-02-28

Family

ID=80376424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111237921.6A Active CN114114905B (zh) 2021-10-25 2021-10-25 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法

Country Status (1)

Country Link
CN (1) CN114114905B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116149294A (zh) * 2022-11-22 2023-05-23 航天科工火箭技术有限公司 一种火箭舵控段姿控系统参数可设计性评估方法
CN117439193A (zh) * 2023-10-31 2024-01-23 南方电网电力科技股份有限公司 一种多源协同发电系统的最优功率控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103616818A (zh) * 2013-11-14 2014-03-05 河海大学常州校区 微陀螺仪的自适应模糊神经全局快速终端滑模控制方法
CN104238572A (zh) * 2014-07-23 2014-12-24 南京理工大学 基于扰动补偿的电机伺服系统无抖动滑模位置控制方法
US20160043526A1 (en) * 2014-08-11 2016-02-11 University Of Washington Tuning multi-input complex dynamic systems using sparse representations of performance and extremum-seeking control
CN105356793A (zh) * 2015-10-30 2016-02-24 中国兵器工业集团第二O二研究所 一种随动系统永磁同步电机匀速无静差的速度控制方法
CN109828460A (zh) * 2019-01-21 2019-05-31 南京理工大学 一种针对双向异构多智能体系统的输出一致控制方法
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110501906A (zh) * 2019-08-30 2019-11-26 贵州大学 互耦分数阶混沌机电换能器加速自适应模糊控制方法
CN112445131A (zh) * 2019-08-30 2021-03-05 天津大学 一种线性系统自适应最优跟踪控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103616818A (zh) * 2013-11-14 2014-03-05 河海大学常州校区 微陀螺仪的自适应模糊神经全局快速终端滑模控制方法
CN104238572A (zh) * 2014-07-23 2014-12-24 南京理工大学 基于扰动补偿的电机伺服系统无抖动滑模位置控制方法
US20160043526A1 (en) * 2014-08-11 2016-02-11 University Of Washington Tuning multi-input complex dynamic systems using sparse representations of performance and extremum-seeking control
CN105356793A (zh) * 2015-10-30 2016-02-24 中国兵器工业集团第二O二研究所 一种随动系统永磁同步电机匀速无静差的速度控制方法
CN109828460A (zh) * 2019-01-21 2019-05-31 南京理工大学 一种针对双向异构多智能体系统的输出一致控制方法
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110501906A (zh) * 2019-08-30 2019-11-26 贵州大学 互耦分数阶混沌机电换能器加速自适应模糊控制方法
CN112445131A (zh) * 2019-08-30 2021-03-05 天津大学 一种线性系统自适应最优跟踪控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
金鹏: "负荷扰动互联电力系统模糊自适应输出跟踪与干扰抗御", 《控制理论与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116149294A (zh) * 2022-11-22 2023-05-23 航天科工火箭技术有限公司 一种火箭舵控段姿控系统参数可设计性评估方法
CN117439193A (zh) * 2023-10-31 2024-01-23 南方电网电力科技股份有限公司 一种多源协同发电系统的最优功率控制方法

Also Published As

Publication number Publication date
CN114114905B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
CN108008628B (zh) 一种不确定欠驱动无人艇系统的预设性能控制方法
Deng et al. Event-triggered robust fuzzy path following control for underactuated ships with input saturation
Li et al. Robust adaptive neural network control for dynamic positioning of marine vessels with prescribed performance under model uncertainties and input saturation
CN114114905B (zh) 一种数据驱动的舰载火箭炮发射装置最优跟踪控制方法
Fortuna et al. A roll stabilization system for a monohull ship: modeling, identification, and adaptive control
Xia et al. Adaptive energy-efficient tracking control of a X rudder AUV with actuator dynamics and rolling restriction
Zang et al. Standoff tracking control of underwater glider to moving target
An et al. Adaptive backstepping sliding mode tracking control for autonomous underwater vehicles with input quantization
Lyu et al. An Embedded Linear Model Three‐Dimensional Fuzzy PID Control System for a Bionic AUV under Wave Disturbance
Dong et al. An improved dynamic surface sliding mode method for autonomous cooperative formation control of underactuated USVs with complex marine environment disturbances
Cheng et al. Fuzzy-reconstruction-based robust tracking control of an air-breathing hypersonic vehicle
Huang et al. SHSA-based adaptive roll-safety 3D tracking control of a X-Rudder AUV with actuator dynamics
Liang et al. Design ride control system using two stern flaps based 3 DOF motion modeling for wave piercing catamarans with beam seas
Liu et al. Synchronisation control for ships in underway replenishment based on dynamic surface control
Shen et al. Nonlinear observer-based adaptive output feedback tracking control of underactuated ships with input saturation
Sun et al. Research on stealth assistant decision system of submarine voyage stage
Zhang et al. Composite neural learning event-triggered control for dynamic positioning vehicles with the fault compensation mechanism
CN114715331B (zh) 一种浮式海洋平台动力定位控制方法及系统
CN116088309A (zh) 一种基于故障辨识的水面船复合学习容错控制方法
CN112327638B (zh) 一种具有指定性能并带有输入饱和限制的无人船轨迹跟踪最优控制方法
Yan et al. Dual-layer optimization-based control allocation for a fixed-wing UAV
CN114137826A (zh) 一种基于灰狼算法的船舶动力定位自抗扰控制方法
Huang et al. System identification and improved internal model control for yaw of unmanned helicopter
Wang et al. Design and Comparison of H∞/H 2 Controllers for Frigate Rudder Roll Stabilization
Aruna Heave and Roll control of Biomimetic AUV using Advanced control strategies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant