CN114510067A - 一种可重复使用飞行器近似最优制导方法 - Google Patents
一种可重复使用飞行器近似最优制导方法 Download PDFInfo
- Publication number
- CN114510067A CN114510067A CN202210109377.5A CN202210109377A CN114510067A CN 114510067 A CN114510067 A CN 114510067A CN 202210109377 A CN202210109377 A CN 202210109377A CN 114510067 A CN114510067 A CN 114510067A
- Authority
- CN
- China
- Prior art keywords
- optimal
- aircraft
- track
- neural network
- control quantity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013528 artificial neural network Methods 0.000 claims abstract description 44
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000001228 spectrum Methods 0.000 claims abstract description 19
- 238000005457 optimization Methods 0.000 claims abstract description 15
- 238000013461 design Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 35
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000010438 heat treatment Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 230000005484 gravity Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/08—Control of attitude, i.e. control of roll, pitch, or yaw
- G05D1/0808—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提出了一种可重复使用飞行器近似最优制导方法,包括以下步骤:步骤1、建立可重复使用升力再入飞行器模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;步骤2、考虑多种飞行约束,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计,实际轨迹与最优轨迹之差作为跟踪误差;步骤3、建立用于近似最优代价函数的评价神经网络;步骤4、将跟踪误差输送至评价神经网络及其权重更新模块,执行基于自适应动态规划的最优反馈控制算法,通过所述评价神经网络近似求解最优反馈控制量;步骤5、伪谱法参考轨迹另一输出为稳态控制量,基于所述步骤4的最优反馈控制量,以及稳态控制量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
Description
技术领域
本发明涉及可重复使用再入飞行器最优制导方法,具体涉及一种可重复使用飞行器近似最优制导方法。
背景技术
飞行器进入太空后再以重新进入地球大气层的过程称为再入。可重复使用再入飞行器升阻比大,进入大气层后可控制升力,具有速度高、航程远、机动大且落点精确的巨大优势,具有广阔的应用前景。由于可重复使用,能作为太空开发、空间科研的运输和试验平台。升力再入飞行是飞行技术和空间科学的重要发展方向。目前各大国都在加紧研制自己的升力再入飞机器,相关技术成为研究热点。升力再入飞行器涉及诸多前沿科学领域,技术重难点多,主要有:(1)热防护问题:再入过程中机体会在局部产生1600℃的高温;(2)气动问题:再入过程速度高、过载大、高攻角飞行,对气动特性以及参数的准确性要求高;(3)导航制导与控制问题:升力再入飞行轨迹复杂、经历环境多样、干扰众多、不确实性强,实现全自主、高精确、高可靠的导航、制导与控制难度大。
发明内容
本发明针对可重复使用再入飞行器的最优制导开展研究,为了解决可重复使用再入飞行器最优轨迹确定和最优制导律实现的问题,克服现有技术的不足,本发明提出了一种可重复使用飞行器近似最优制导方法,实现可重复使用再入飞行器最优轨迹设计及近似最优在线制导。本发明是通过以下方法方案实现的:
一种可重复使用飞行器近似最优制导方法,包括以下步骤:
步骤1、建立可重复使用升力再入飞行器模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;
步骤2、考虑多种飞行约束,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计,实际轨迹与最优轨迹之差作为跟踪误差;
步骤3、建立用于近似最优代价函数的评价神经网络;所述评价神经网络采用三层结构,单节点输入层、单节点输出层以及多节点隐含层,评价神经网络的输入为跟踪误差,输出为代价函数值;神经网络权重为Wc,选择Sigmoid函数作为激活函数φc;
步骤4、将跟踪误差输送至评价神经网络及其权重更新模块,执行基于自适应动态规划的最优反馈控制算法,通过所述评价神经网络近似求解最优反馈控制量;
步骤5、伪谱法参考轨迹另一输出为稳态控制量,基于所述步骤4的最优反馈控制量,以及稳态控制量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
进一步的,所述步骤3中,神经网络采用三层结构,单节点输入层、单节点输出层以及多节点隐含层,隐含层数量根据需求可进行调整,一般取10以上。评价神经网络的输入为跟踪误差,输出为代价函数值。神经网络权重为Wc,选择Sigmoid函数作为激活函数φc。神经网络权重Wc初始设置为任意值,其在线更新方法为:
Wc(k)=Wc(k-1)-ξMc(k)
其中,ξ为学习率,k表示当前时刻,Mc为辅助向量由轨迹跟踪误差、反馈控制量及最优目标参数决定。
进一步的,所述步骤4中最优反馈控制量ue *计算方法为:
本发明具有以下技术效果:
本发明的一种可重复使用飞行器近似最优制导方法,再入飞行器采用攻角和侧倾角作制导控制量,因攻角与升力和阻力系数有关,侧倾角与气动力在飞行器侧向分量有关,因此可通过攻角和侧倾角实现对再入飞行器的轨迹控制,即制导。通过基于伪谱法的最优轨迹及最优控制量的离线优化设计,确定任务轨迹及对应稳态控制量;通过神经网络近似最优代价函数,并采用基于自适应动态规划方法的近似最优制导方法,求解反馈控制量,实现可重复使用再入飞行器最优轨迹设计及近似最优在线制导,具有良好的工程应用价值。
附图说明
图1为本发明实例提供的一种可重复使用飞行器近似最优制导方法的框架图;
图2为本发明实例提供的一种评价神经网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明公开的一种可重复使用飞行器近似最优制导方法,包含以下步骤:
步骤1、建立可重复使用升力再入飞行器模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;
步骤2、考虑多种飞行约束,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计,实际轨迹与最优轨迹之差作为跟踪误差;
步骤3、建立用于近似最优代价函数的评价神经网络;所述评价神经网络采用三层结构,单节点输入层、单节点输出层以及多节点隐含层,评价神经网络的输入为跟踪误差,输出为代价函数值;神经网络权重为Wc,选择Sigmoid函数作为激活函数φc;
步骤4、将跟踪误差输送至评价神经网络及其权重更新模块,执行基于自适应动态规划的最优反馈控制算法,通过所述评价神经网络近似求解最优反馈控制量;
步骤5、伪谱法参考轨迹另一输出到稳态控制,基于所述步骤4的最优反馈控制量,以及稳态控制量的输出量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
利用本发明提供的制导方法,可重复使用飞行器能实现高精度制导控制。
图1所示,其中,“升力再入飞行器模型”采用可重复使用再入飞行器三自由度运动学模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;“基于伪谱法参考轨迹”为步骤2中根据飞行约束和优化目标,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计,实际轨迹与最优轨迹之差作为跟踪误差,输送至“评价神经网络及其权重更新”模块,用于生成最优反馈控制量,伪谱法参考轨迹另一输出为稳态控制量,基于所述步骤4的(近似)最优反馈控制量,以及稳态控制量量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
所述步骤1、建立可重复使用升力再入飞行器模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;具体如下:
选择状态量为再入飞行器的地心距、经度、纬度、速度、航迹角和航向角共6维。升力再入飞行器模型如下式:
其中,r是从地心到飞行器的径向距离;θ和分别为经度和纬度;V是相对地球速度;ψ为相对于当地北的速度航向角,γ为飞行航迹角;m和σ分别为飞行器的质量和倾侧角,地球的角速率表示为ωe,当地的重力加速度表示为g。
D和L分别为气动阻力和升力,与气动系数、攻角和速度有关:
α为攻角,ρ为空气密度,Sref为再入飞行器气动参考面积,CD0,CD1,CD2为阻力系数,CL0,CL1,CL2为升力系数,V是相对地球速度。可重复使用再入飞行器以攻角和侧倾角作为制导控制量。当飞行器攻角改变时,其升力和阻力系数会相应变化,造成飞行器所受升力和阻力变化,继而引起飞行器的高度、速度发生改变,产生制导效果;另一方面,当飞行器侧倾角发生变化时,飞行航迹角及航向角会发生变化,引起飞行器侧向速度和位置发生改变,产生制导效果。利用攻角和侧倾角可高效完成可重复使用再入飞行器的制导任务。
步骤2、考虑多种飞行约束,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计。
高斯伪谱法是一种非线性系统最优控制的数值求解方法,通过将时间离散化为一定数量的离散点(配点),未知变量就是离散点上的状态量和控制量,性能指标函数、微分方程和约束条件通过这些未知变量表示出来,从而将非线性最优控制问题转化为非线性规划问题并求解,最后再将解转化为最优控制问题的解。伪谱法采用正交多项式近似状态和控制变量,精度高且收敛速度快,但伪谱法对初值敏感,自适应性较差且计算量较大,在线执行问题较多,因此本发明采用伪谱法进行离线轨迹优化。
为实现基于高斯伪谱法的离线再入轨迹优化,需要:设计性能指标函数,即优化目标;确定状态量;建立动态模型;并建立条件约束。
性能指标函数根据不同飞行任务有所不同,如最大侧向位移、最小发热量以减轻热防护材料重量等。状态量和动态模型已在步骤1中确定,条件约束如下:
q≤qmax
式中,Q表示飞行器再入过程中与大气摩擦产生的发热量,n表示飞行器的过载,q表示动压,m为飞行器的质量,当地的重力加速度表示为g,下标max表示容许最大值,nmax表示飞行器的过载容许最大值,表示发热量的变化速率,表示发热量的最大变化速率容许值,符号上面的圆点表示一阶导数。
高斯伪谱法利用多阶拉格朗日插值多项式对状态量X(对应于步骤1中的地心距、经度、纬度、速度、航迹角和航向角的6维向量)和控制量U(对应于步骤1中的攻角和侧倾角)进行近似:
式中,N为配置点数,La为拉格朗日插值多项式,τ为当前配点,下标i和j分别代表第i和第j个配点。通过配点法将最优化问题转换为非线性规划问题,可通过求解该非线性规划问题来求解升力再入轨迹的优化问题。基于伪谱法的离线轨迹优化设计可同时得到最优控制量,作为稳态控制量。
步骤3、建立用于近似最优代价函数的评价神经网络;所述评价神经网络采用三层结构,单节点输入层、单节点输出层以及多节点隐含层,评价神经网络的输入为跟踪误差,输出为代价函数值;神经网络权重为Wc,选择Sigmoid函数作为激活函数φc;
设计代价函数及迭代方法,在线完成神经网络训练及收敛。图2为本发明实例提供的一种评价神经网络结构图,采用的评价神经网络为三层结构,单节点输入层、单节点输出层以及多节点隐含层,隐含层数量根据需求可进行调整,一般取10以上。评价神经网络的输入为跟踪误差,输出为代价函数值。神经网络权重为Wc,选择Sigmoid函数作为激活函数φc。神经网络权重Wc初始设置为任意值,其在线更新方法为:
Wc(k)=Wc(k-1)-ξMc(k)
其中,ξ为学习率,k表示当前时刻,Mc为辅助向量,由轨迹跟踪误差、反馈控制量及最优目标参数决定。
Mc(k)=Pc(k)Wc(k-1)+Qc(k)
步骤4、将跟踪误差输送至评价神经网络及其权重更新模块,执行基于自适应动态规划的最优反馈控制算法,通过所述评价神经网络近似求解最优反馈控制量;
将再入运动学表示为如下简洁形式:
其中,f(x)为再入飞行器的刚体运动学模型中与状态有关项,x代表制导状态量,即再入飞行器的地心距、经度、纬度、速度、航迹角和航向角,G(x)为控制矩阵,即攻角和侧倾角通过控制矩阵对状态量(地心距、经度、纬度、速度、航迹角和航向角)产生控制效果,可通过升力再入飞行器模型得到,d(x)为模型参数不确定和干扰项,t代表时间,为简洁起见以下说明时在不引起歧义情况下省略了字符t。
设定代价函数VJ(e(t))如下:
式中,e为跟踪误差,τ为积分变量,仅作积分运算用,ue为反馈控制器生成的控制量,r(e,ue(e))为效用函数,由与跟踪误差相关项Qc和与反馈控制相关项Rc组成。形式分别如下:
Qc(e)=eTQ0e
Rc(ue)=ue TR0ue
Q0和R0为正定权值对角阵。
最优代价函数VJ(e)*可表示为:
其中,Ψ(Ω)是ue的容许控制域。根据贝尔曼最优性原理,VJ(e)*满足:H(e,ue *,VJ(e)*)=0
可得最优控制为:
以神经网络逼近最优代价函数来求解最优反馈控制量,得到近似最优反馈控制量。由于神经网络权重为Wc,激活函数φc为Sigmoid函数,设近似误差为εc,则近似的最优代价函数及其对e的偏导数可表示为:
VJ(e)=Wc Tφc(e)+εc
则近似最优反馈控制量按下式计算:
步骤5、伪谱法参考轨迹另一输出为稳态控制量,基于所述步骤4的最优反馈控制量,以及稳态控制量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
尽管上面对本发明的具体实施方式进行了描述,但应该清楚,本发明不限于具体实施方式的范围,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (5)
1.一种可重复使用飞行器近似最优制导方法,其特征在于,包括以下步骤:
步骤1、建立可重复使用升力再入飞行器模型,以攻角和侧倾角作为制导控制量,以参考轨迹作为输出量;
步骤2、考虑多种飞行约束,基于高斯伪谱法进行最优轨迹及最优控制量的离线优化设计,实际轨迹与最优轨迹之差作为跟踪误差;
步骤3、建立用于近似最优代价函数的评价神经网络;所述评价神经网络采用三层结构,单节点输入层、单节点输出层以及多节点隐含层,评价神经网络的输入为跟踪误差,输出为代价函数值;神经网络权重为Wc,选择Sigmoid函数作为激活函数φc;
步骤4、将跟踪误差输送至评价神经网络及其权重更新模块,执行基于自适应动态规划的最优反馈控制算法,通过所述评价神经网络近似求解最优反馈控制量;
步骤5、伪谱法参考轨迹另一输出为稳态控制量,基于最优反馈控制量,以及稳态控制量,共同作用于升力再入飞行器模型,实现制导及轨迹跟踪。
4.根据权利要求3所述的一种可重复使用飞行器近似最优制导方法,其特征在于:所述步骤3中,神经网络权重Wc初始设置为任意值,其在线更新方法为:
Wc(k)=Wc(k-1)-ξMc(k)
其中,ξ为学习率,k表示当前时刻,Mc为辅助向量,由轨迹跟踪误差、反馈控制量及最优目标参数决定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210109377.5A CN114510067A (zh) | 2022-01-28 | 2022-01-28 | 一种可重复使用飞行器近似最优制导方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210109377.5A CN114510067A (zh) | 2022-01-28 | 2022-01-28 | 一种可重复使用飞行器近似最优制导方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114510067A true CN114510067A (zh) | 2022-05-17 |
Family
ID=81552371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210109377.5A Pending CN114510067A (zh) | 2022-01-28 | 2022-01-28 | 一种可重复使用飞行器近似最优制导方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114510067A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562052A (zh) * | 2023-07-05 | 2023-08-08 | 西安现代控制技术研究所 | 一种考虑可用过载约束下的侧向绕飞方法 |
CN117311390A (zh) * | 2023-11-06 | 2023-12-29 | 天津大学 | 一种空天往返飞行器闭环跟踪智能组合制导方法 |
-
2022
- 2022-01-28 CN CN202210109377.5A patent/CN114510067A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562052A (zh) * | 2023-07-05 | 2023-08-08 | 西安现代控制技术研究所 | 一种考虑可用过载约束下的侧向绕飞方法 |
CN116562052B (zh) * | 2023-07-05 | 2023-10-03 | 西安现代控制技术研究所 | 一种考虑可用过载约束下的侧向绕飞方法 |
CN117311390A (zh) * | 2023-11-06 | 2023-12-29 | 天津大学 | 一种空天往返飞行器闭环跟踪智能组合制导方法 |
CN117311390B (zh) * | 2023-11-06 | 2024-03-19 | 天津大学 | 一种空天往返飞行器闭环跟踪智能组合制导方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xiang et al. | Robust fuzzy 3D path following for autonomous underwater vehicle subject to uncertainties | |
Zheng et al. | Error-constrained LOS path following of a surface vessel with actuator saturation and faults | |
Zhang et al. | Adaptive fuzzy tracking control of autonomous underwater vehicles with output constraints | |
Zhen et al. | Automatic carrier landing control for unmanned aerial vehicles based on preview control and particle filtering | |
CN107357166B (zh) | 小型无人直升机的无模型自适应鲁棒控制方法 | |
CN105607473B (zh) | 小型无人直升机的姿态误差快速收敛自适应控制方法 | |
Karimi et al. | Optimal maneuver-based motion planning over terrain and threats using a dynamic hybrid PSO algorithm | |
CN107563044B (zh) | 基于在线安全学习的四旋翼无人机路径跟踪控制方法 | |
CN108710303A (zh) | 含有多源扰动及执行器饱和的航天器相对姿态控制方法 | |
Zhang et al. | Approach-angle-based three-dimensional indirect adaptive fuzzy path following of under-actuated AUV with input saturation | |
CN114510067A (zh) | 一种可重复使用飞行器近似最优制导方法 | |
Zhang et al. | Neural network control of underactuated surface vehicles with prescribed trajectory tracking performance | |
Yang et al. | Horizontal trajectory control of stratospheric airships in wind field using Q-learning algorithm | |
CN109683624A (zh) | 用于小型无人直升机姿态控制的非线性鲁棒控制方法 | |
CN109991992A (zh) | 基于浸入不变集的小型无人直升机无模型自适应控制方法 | |
Wu et al. | Sliding-mode control for staring-mode spacecraft using a disturbance observer | |
CN108445768A (zh) | 空间机器人操作空间轨迹跟踪的增广自适应模糊控制方法 | |
CN107817818B (zh) | 一种模型不确定飞艇航迹跟踪有限时间控制方法 | |
Wang et al. | Optimal trajectory-tracking guidance for reusable launch vehicle based on adaptive dynamic programming | |
Qiu et al. | Robust path‐following control based on trajectory linearization control for unmanned surface vehicle with uncertainty of model and actuator saturation | |
Zhou et al. | Spatial path following control of an autonomous underactuated airship | |
Kahale et al. | Autonomous path tracking of a kinematic airship in presence of unknown gust | |
CN108958278B (zh) | 一种空天飞行器巡航段快速抗干扰制导方法 | |
Chen et al. | Robust control of quadrotor MAV using self‐organizing interval type‐II fuzzy neural networks (SOIT‐IIFNNs) controller | |
Wu et al. | Neuroadaptive output-feedback trajectory tracking control for a stratospheric airship with prescribed performance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |