CN117268391A - 一种基于目标分层架构的变形飞行器智能规划方法及系统 - Google Patents
一种基于目标分层架构的变形飞行器智能规划方法及系统 Download PDFInfo
- Publication number
- CN117268391A CN117268391A CN202311163026.3A CN202311163026A CN117268391A CN 117268391 A CN117268391 A CN 117268391A CN 202311163026 A CN202311163026 A CN 202311163026A CN 117268391 A CN117268391 A CN 117268391A
- Authority
- CN
- China
- Prior art keywords
- aircraft
- deformation
- planning
- deformed
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 238000003062 neural network model Methods 0.000 claims description 43
- 238000012549 training Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000009471 action Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 10
- 230000002787 reinforcement Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 15
- 210000002569 neuron Anatomy 0.000 description 14
- 238000005457 optimization Methods 0.000 description 14
- 238000004088 simulation Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 7
- 238000004611 spectroscopical analysis Methods 0.000 description 6
- 206010048669 Terminal state Diseases 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000011438 discrete method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Radar, Positioning & Navigation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及变形飞行器控制技术领域,尤其涉及一种基于目标分层架构的变形飞行器智能规划方法及系统,包括根据变形飞行器当前时刻的飞行状态量和顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数,根据目标气动参数和底层变形决策网络模型,得到最优攻角与变形量组合,以获取飞行器真实气动参数,迭代得到下一时刻的飞行状态量,将下一时刻的飞行状态量输入顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。本发明通过设计伪控制量作为中间变量,将变形飞行器的轨迹与变形一体化规划问题解耦为顶层轨迹规划和底层变形量决策两个子问题,能够直接对轨迹与变形量进行实时规划,且显著提高了计算速度。
Description
技术领域
本发明涉及变形飞行器控制技术领域,尤其涉及一种基于目标分层架构的变形飞行器智能规划方法及系统。
背景技术
近年来,随着飞行器任务剖面日趋复杂以及智能技术的不断发展,智能变形飞行器逐渐成为航空航天领域的研究热点,其中,变形飞行器的轨迹规划与变形决策是实现飞行器智能自主飞行模式的核心问题,即在面向复杂飞行任务与飞行环境是,要求飞行器能够在线自主调整气动外形和规划飞行轨迹。
针对飞行器轨迹规划问题,国内外学者做了大量研究,主要包括间接法、直接法和遗传算法等生物智能优化算法,但是这些生物智能优化算法本质上依赖于迭代收敛的数值算法,其收敛时间和求解速度面对复杂轨迹的在线规划需求存在一定的局限性,因此,为了提高轨迹规划问题的计算速度,研究人员将智能算法、凸优化等方法与轨迹规划技术结合,但是这些方法仅针对固定外形的飞行器,而尚未考虑变形飞行器的变形决策与轨迹规划的耦合关系,同时针对变形飞行器的变形决策问题,一些研究学者探索了强化学习在变形飞行器外形优化问题上应用的可行性,比如,温暖等以一种抽象化的变体飞行器为对象,基于深度学习与确定性策略梯度强化学习方法,确定变形飞行器的变形方式,使其具有较高的自主性和环境适应性;桑晨等针对可同时变展长及后掠角的飞行器,基于DDPG算法对变形策略进行学习训练,提升了变体飞行器在不同飞行任务和飞行环境下的飞行性能;Xu等采用DDPG算法控制变形飞机模型进行变形决策训练,实现了智能变形飞机方向舵回路的自主控制,然而这些针对变形飞行器的变形决策问题的方案仅针对变形飞行器的外形优化层面,即面向某一气动指标进行优化,同样忽略了变形决策与轨迹规划的耦合关系,未根据实时的轨迹状态而自主调整外形的优化目标,未能充分利用飞行器的变形能力。
由于引入飞行器的变形维度后,变形飞行器成为更高维度的动力学耦合与更强非线性的复杂系统,其变形决策与轨迹规划二者互相影响、密不可分,理论上应在统一的框架内完成这两个问题的求解,一种可行的方式是将变形量作为轨迹控制量之一,参与到轨迹规划问题中,完成对变形量和轨迹控制量统一求解,比如:朱睿颖等针对高速无动力变构形飞行器航迹优化与飞行策略设计问题,建立可变构型气动代理模型,以一、二锥展长为变形飞行器外形参数,与攻角、倾侧角共同构成飞行器航迹优化变量,完成航迹优化的同时获取飞行器最佳飞行策略,但是这种方式增大了控制量的数量,大大降低了轨迹规划算法的求解效率,即求解效率无法达到在线应用的需求,且在变形维度增大时,存在多解问题而难以收敛,因此,在面向多维变形飞行器的在线自主变形与轨迹规划任务需求时,亟需提供一种基于目标分层架构的变形飞行器智能行为规划方法,以解决多维度变形飞行器轨迹与变形的一体化快速在线规划问题。
发明内容
本发明的目的在于提供一种基于目标分层架构的变形飞行器智能规划方法及系统,以实现轨迹与变形一体化快速在线规划,使多维变形飞行器具备根据飞行情况进行智能轨迹规划和变形决策的能力。
为解决以上技术问题,本发明提供了一种基于目标分层架构的变形飞行器智能规划方法及系统。
第一方面,本发明提供了一种基于目标分层架构的变形飞行器智能规划方法,所述方法包括以下步骤:
根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型;
确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量;
将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数;
将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度;
根据所述最优攻角与变形量组合,得到飞行器真实气动参数;
将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
第二方面,本发明提供了一种基于目标分层架构的变形飞行器智能规划系统,所述系统包括:
目标分层解耦模块,用于根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型;
顶层轨迹规划模块,用于确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量,将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数;
底层变形决策模块,用于将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度;
飞行器迭代规划模块,用于根据所述最优攻角与变形量组合,得到飞行器真实气动参数,将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
同时,第三方面,本发明还提供了一种计算机设备,包括处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述计算机设备执行实现上述方法的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供了一种基于目标分层架构的变形飞行器智能规划方法及系统,所述方法通过伪谱法和数据离散方法生成大规模的最优弹道样本,以基于反向误差传播方法,通过最优弹道样本训练得到顶层轨迹规划神经网络模型;基于深度强化学习算法对变形飞行器进行训练,建立了基于变形飞行器的变形量与气动参数的底层强化学习模型,实现面向顶层网络输出的目标气动参数的快速响应。与传统轨迹规划方法相比,该方法采用基于深度神经网络和适用于连续动作的强化学习的分层嵌套规划方法,建立了包含顶层轨迹规划与底层自主决策两个层面的智能行为规划目标分层架构,使其能够根据飞行任务快速规划出最优轨迹和变形控制量序列,规划精度较高,而且可以缩短计算时间,具备在线应用的能力。
附图说明
图1是本发明实施例提供的基于目标分层架构的变形飞行器智能规划方法流程示意图;
图2是本发明实施例提供的计算气动参数集合与真实气动参数集合对比示意图;
图3是本发明实施例提供的训练样本的高度-经度曲线示意图;
图4(a)是本发明实施例提供的泛化升力系数-时间曲线示意图;
图4(b)是本发明实施例提供的最大升阻比-时间曲线示意图;
图5是本发明实施例提供的BP神经网络拓扑结构示意图;
图6是本发明实施例提供的BP神经网络的均方值误差图;
图7是本发明实施例提供的测试集仿真误差示意图;
图8是本发明实施例提供的智能体获得奖励函数值曲线示意图;
图9是本发明实施例提供的底层变形决策网络模型仿真误差分布示意图;
图10是本发明实施例提供的变形飞行器智能规划方法实现流程示意图;
图11是本发明实施例提供的实际规划弹道与参考标准弹道的高度-经度曲线示意图;
图12是本发明实施例提供的分层网络规划气动参数对比示意图;
图13是本发明实施例提供的蒙特卡洛打靶仿真结果示意图;
图14(a)是本发明实施例提供的弹道终端纬度误差示意图;
图14(b)是本发明实施例提供的弹道终端经度误差示意图;
图15是本发明实施例提供的基于目标分层架构的变形飞行器智能规划系统框图;
图16是本发明实施例提供的计算机设备的结构示意图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
参考图1,本发明实施例提供了一种基于目标分层架构的变形飞行器智能规划方法,如图1所示,该方法包括以下步骤:
S1.根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型。
本实施例通过变形飞行器轨迹规划与变形决策协调模型的建模过程,将变形飞行器的轨迹与变形一体化规划问题解耦为规划伪控制量的顶层轨迹规划子问题和规划真实控制和变形量的底层变形决策子问题,所述变形飞行器轨迹规划与变形决策协调模型的建模过程如下:
对于高超声速飞行器,阻力系数CD可以被看作升力系数CL的函数:
式中,CD0表示零升阻力系数;K表示诱导阻力因子;
由此,可以得到升阻比E的表达式:
当飞行器升阻比达到最大时,最大升阻比对应的升力系数和阻力系数的表达式分别为:
最大升阻比E*为:
通过定义泛化升力系数λ:
由此可得,飞行器的气动系数(升力系数和阻力系数)的表达式为:
由上述可知,对于某一变形飞行器,可将泛化升力系数λ替代攻角作为决定飞行器气动性能的参数,同时当飞行器具有可变形的特征时,其最大升阻比E*的大小随着变形状态组合的不同而改变,当升阻比达到最大时,升力系数的大小与马赫数大小线性相关,因此,可以利用泛化升力系数λ和最大升阻比E*这两个伪控制量来拟合飞行器的气动模型,本实施例考虑某变形飞行器有三个变形量ξ1、ξ2、ξ3,且这三个变形量可以在以下范围内连续变形:
通过对所有变形量ξ1在其可变形范围内的遍历,获得各个变形量和控制量组合下的真实气动参数集合,对变形飞行器的气动特性进行分析,可以确定其伪控制量λ和E*的可行解:
式中,λ表示泛化升力系数;E*表示最大升阻比;λmin表示泛化升力系数的下限值;λmax表示泛化升力系数的上限值;E* min表示最大升阻比的下限值;E* max表示最大升阻比的上限值。
本实施例对范围内的λ和E*进行遍历,将利用升力系数和阻力系数表达式得到的计算气动参数集合与真实气动参数集合进行对比,如图2所示,从图2中可以看出,本实施例采用数值计算方法所获得的计算气动参数集合和飞行器真实气动模型输出的真实气动参数集合能够良好地重合,这说明上述数值方法能够较精确地拟合变形飞行器的气动模型,从而可以将λ和E*作为轨迹规划的伪控制量,而不必直接对攻角以及变形量进行规划,本实施例设计轨迹伪控制量的过程即为实现变形飞行器轨迹规划与变形决策协调建模过程,需要说明的是,传统的固定外形飞行器轨迹规划算法是根据飞行任务和约束直接规划出合适的攻角,但是当飞行器具有变化外形的能力时,控制量的维度大大增加,使得轨迹规划算法的复杂度呈指数级增长,导致样本输出时间长、解算效率低下,甚至无法收敛的问题,而本实施例通过将λ和E*作为轨迹伪控制量,可以在顶层轨迹规划时采用伪控制量,在底层变形规划时用真实变形量,实现轨迹规划问题与变形决策问题一体化规划的分层解耦。
在建立变形飞行器轨迹规划与变形决策协调模型后,本实施例利用伪谱法在轨迹伪控制量上对随机飞行任务进行最优弹道规划,产生大量的最优弹道样本,其中,本实施例优先选取Chebyshev伪谱法,然后利用最优弹道样本训练深度神经网络模型,通过深度学习方法对产生的最优弹道样本进行大规模的学习和训练,形成训练好的基于任务需求和当前飞行状态量确定轨迹伪控制量的深度神经网络模型,并将训练好的深度神经网络模型作为顶层轨迹规划神经网络模型,以通过顶层轨迹规划神经网络模型实时输出满足任务轨迹需求的目标气动参数,为变形飞行器底层行为决策提供规划目标,为了便于理解顶层轨迹规划神经网络模型的构建过程,以下将对顶层轨迹规划神经网络模型的训练建立过程进行详细说明:
在进行顶层轨迹规划网络建模与训练之前,本实施例需要生成用于顶层轨迹规划神经网络模型训练的最优弹道样本,考虑到变形飞行器在再入初始时刻和终端目标点的飞行状态均在一定范围内具有不确定性,为了使样本能够尽量覆盖实际飞行过程中的飞行状态,本实施例在利用Chebyshev伪谱法生成最优轨迹样本(最优弹道样本,即伪控制量序列)时,先设定变形飞行器的初始状态和在终端状态的范围为:
式中,t0为飞行起始时间;tf为飞行终端时间;γ为飞行路径角;ψ为速度防伪标;θ、分别为飞行器的经度和纬度;r为高度;为初始高度下限;为初始高度上限;rf为终端高度上限;为初始经度下限;为初始经度上限;为终端经度下限;为终端经度上限;为初始纬度;V0为初始速度;γ0为初始速度倾角;ψ0为初始速度偏角。
然后,本实施例利用Chebyshev伪谱法在上述初始状态和在终端状态的范围内进行最优轨迹优化,为保证再入飞行器在结构和热防护上具有可靠性,应使飞行过程严格满足热流密度、动压和过载约束,因此,设置Chebyshev伪谱法的过程约束条件如下:
式中,表示热流密度;q表示动压;n表示过载;KQ表示与飞行器头部曲率半径相关的常数,通常取KQ=1.688×10-8;ρ表示大气密度;u表示无量纲速度; 表示热流密度上限值;qmax表示动压上限值;nmax表示过载上限值;表示无量纲升力;表示无量纲阻力。
本实施例结合变形飞行器轨迹规划与变形决策协调模型的建模结果,给定伪控制量泛化升力系数和最大升阻比的可行解分别为:
为了使飞行器飞行效率最高,本实施例将优化目标设定为飞行时间最短,其目标函数J表示为:J=min tf;
基于上述条件,本实施例采用Chebyshev伪谱法进行优化轨迹求解,在Chebyshev-Gauss-Lobatto点(CGL点)上将连续时间状态变量和控制变量进行离散化处理,并将离散点作为节点,通过构造Lagrange插值多项式来逼近实际飞行的状态变量和控制变量,然后对多项式求导来逼近状态变量对时间的导数,将微分方程约束转换为代数约束,最后通过数值积分计算性能指标中的积分项,通过上述方法,将最优控制问题转化为非线性规划问题,本实施例设最优控制问题的时间区间为[t0,tf],若采用Chebyshev伪谱法需要将时间区间转换到[-1,1],因此,对时间变量t作变换:
Chebyshev伪谱法的插值点(即CGL点)的选取为:
τk=cos(πk/N),k=0,···,N
式中,τk表示第二类CGL点的计算公式,代表CGL点所在的无量纲时刻;N表示选取Chebyshev多项式的阶数,N+1即为CGL点的个数。
以N次Lagrange插值多项式作为基函数描述控制变量以及状态变量:
式中,TN(t)表示N阶Chebyshev多项式;x(τ)表示系统的真实状态变量;X(τ)表示利用N次Lagrange插值多项式作为基函数拟合的状态变量;xj表示在第j个插值点(第j个CGL点)上状态变量的真实值;u(τ)表示系统的真实控制变量;U(τ)表示利用N次Lagrange插值多项式作为基函数描述的控制变量;uj表示在第j个插值点(第j个CGL点)上控制变量的真实值;τ表示无量纲时间变量;τj表示第j个CGL点所在的时刻。
状态变量的一阶微分可以通过对公式求导来近似得到,同时将动力学微分方程约束转化为代数约束。
因此,动力学方程满足:
式中,表示系统状态量对时间的导数;表示利用N次Lagrange插值多项式作为基函数描述的控制变量的时间导数;Dnj(τn)表示标准Chebyshev伪谱法中(N+1)*(N+1)阶微分伪谱矩阵;τn表示第N个CGL点所在的无量纲时刻;n表示第n个CGL点;n=1,...,N。
终端状态Xf可通过Lagrange积分得到:
式中,表示Gauss权重;τ0表示无量纲时间的左端点。
Chebyshev伪谱法中的性能指标函数为:
式中,X0表示系统初始状态;Xf表示系统终端状态;τn表示第n个CGL点所在无量纲时刻。
由此,本实施例基于飞行环境和任务目标建立轨迹规划问题的约束方程和优化目标函数等,实现地面大规模数据样本(最优弹道样本)的生成,本实施例以某多维度变形飞行器为例,根据飞行任务设定最优轨迹样本生成的条件,其中,弹道初始条件和终端条件如表1所示,弹道过程约束,即变形飞行器的热流、动压和过载约束如表2所示,伪控制量约束如表3所示:
表1弹道初始终端条件
表2弹道过程约束
表3伪控制量过程约束
本实施例在上述条件设置的基础上,利用Chebyshev伪谱法输出4000条最优弹道样本作为训练样本,训练样本的高度-经度曲线如图3所示,轨迹伪控制量泛化升力系数和最大升阻比曲线如图4(a)、图4(b)所示,本实施例将Chebyshev伪谱法输出的4000条优化弹道的状态量和控制量按照1秒的时间间隔离散后,将每个时刻的飞行状态量、此条弹道的初始状态和终端状态、以及当前时刻的轨迹控制量记录并存储,将所有优化弹道每一时刻的弹道数据作为顶层轨迹规划的数据样本,用于神经网络模型的训练。
在获取到用于训练顶层轨迹规划神经网络模型的最优弹道样本之后,本实施例顶层轨迹规划网络进行建模和训练,由于变形飞行器顶层轨迹规划本质上是基于飞行器当前状态、初始状态和终端状态,输出当前时刻的最优轨迹控制量,因此,为了描述这种复杂非线性的映射关系,本实施例基于BP神经网络建立变形飞行器顶层轨迹规划神经网络模型,如图5所示,本实施例假设BP神经网络有L个输入节点,M个输出节点,Q个隐含节点,有N个数据样本用于网络训练,其中,本实施例优先假设输入层包含10个输入节点,输入节点分别为飞行器当前状态、初始状态和终端状态,输出层包含2个输出节点,设其中一个样本P的,设其中一个样本P的输入序列为{xp}、输出序列为{tp},则输入序列{xp}为:
其中,分别表示样本P所属弹道的初始高度和经度条件,分别表示样本P所属弹道的终端高度和经度条件,分别表示样本P所属时刻的六个飞行状态量;
输出序列{tp}为:
其中,表示样本P所属时刻的最优升力系数,表示样本P所属时刻的最优阻力系数,基于上述顶层轨迹规划神经网络模型,对于输入输出序列分别为{xp}和{tp}的样本P,隐含层的第i个神经元的输入、输出可以表示为:
式中,表示隐含层第i个神经元的输入;表示输入序列中的第j个输入量;ωij表示隐含层第i个神经元与输入层第j个神经元之间的权值;bi表示该神经元的阀值,f表示隐含层激活函数;表示隐含层第i个神经元的输出。
同理,该神经网络输出层第k神经元的输入、输出可以表示为:
式中,表示输出层第k神经元的输入;ωki表示隐含层第i神经元与输出层第k神经元之间的权值;bk表示输出层第k神经元的阀值;表示输出层第k神经元的输出。
对于N个训练样本,总均方值误差E可以表示为:
其中,Ep表示样本p的均方值误差;M表示输出层的神经元个数;表示样本P的输出序列中第k神经元的输出;在本实施例中,输出层和隐含层权值按照误差的反方向进行系数调整,其修正公式表示为:
式中,Δωki表示输出层与隐含层连接权值的修正量;Δωij表示隐含层和输入层连接权值的修正量;η表示学习率。
需要说明的是,考虑到神经网络数值计算关系的影响,本实施例需要对各个物理量进行归一化处理,即神经网络模型输入量和输出量分别为归一化后的物理量,本实施例采用的归一化方法如下:
式中,xl表示输入序列中的第l个元素,l=1,…,L;分别表示所有训练样本中xl元素的最小值和最大值;tm表示输出序列中的第m个元素,m=1,…,M;分别表示所有训练样本中tm元素的最小值和最大值;分别表示归一化后的输入、输出元素。
本实施例以利用Chebyshev伪谱法输出4000条最优弹道样本产生的4138312组数据作为训练样本,根据BP神经网络模型对应的输入输出序列,随机选取4133312组数据作为训练集,5000组数据作为测试集,利用Pytorch平台搭建BP神经网络进行训练,表4为神经网络参数设置,表4如下所示:
表4神经网络参数设置
其中,Batch-size为一个训练批次所包含的样本数,Epoch为训练的总轮数,在模型训练过程中,神经网络的均方误差值下降过程如图6所示,最终稳定在10-5水平,在训练完成后,测试集仿真误差如图7所示,其中,99.72%的测试集样本升力系数误差在±0.005之内,全部测试集样本的阻力系数误差均小于0.005。
S2.确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量。
S3.将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数。
S4.将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度。
马尔科夫决策链(MDP)是强化学习中经典的形式表达,其基本形式可以表示为(S,O,A,P,R),其中,S为状态集,O为状态集中的可观测部分,A为动作集,P为状态转移概率,R为回报函数,在本实施例中,状态集S被定义为飞行器所处的飞行高度h、飞行马赫数Ma以及飞行器顶层轨迹规划网络所规划的升力系数和阻力系数且四个状态量均可被观测,即:
动作集A为飞行器的攻角α以及三个变形量,考虑到各变形量的变形尺度不一,于是,用变形系数μ1、μ2、μ3来表征飞行器的变形量,即:
则动作集A可表示为:
A={α,μ1,μ2,μ3}
对于本实施例的变形飞行器,当飞行状态Ma、h和气动外形已知时,其气动参数CL和CD由飞行器的气动模型唯一确定,则该MDP中的状态转移概率P也是已知确定的,本实施例设计非稀疏奖励函数:
式中,为智能体执行动作A={α,μ1,μ2,μ3}后,模型观测到的飞行器升力系数与目标升力系数的差值,阻力系数差值同理,l、m、n和o为对奖励值和误差进行放缩的相关参数,可以扩大奖励函数对误差精度的敏感度并控制最大奖励值的绝对值,以提升智能体的训练效果。
考虑变体飞行器的机体形变是一个连续过程,本实施例采用具有规划连续动作能力的深度确定性策略梯度强化学习算法DDPG对变形飞行器智能体进行训练,使其能够在顶层轨迹规划网络模型输出目标气动参数规划后,自主决策出能够适应目标气动参数的最佳攻角和变形状态,从而使飞行器能够根据飞行任务,保持最佳气动外形状态,本实施例设置DDPG算法训练参数如表5所示:
表5 DDPG训练参数设置
由于本实施例提出的底层强化学习任务为对顶层网络做出的目标气动参数规划快速响应,给出契合目标气动参数的变形量和控制量,因此,本实施例设置每幕最大步数为1,即要求飞行器经过一次变形决策便实现对气动数据的跟踪,由于每回合训练不存在步数累积奖励,根据重设任务的难度不同,每回合智能体获得的奖励值也会随之波动,因此可以通过观察训练前百回合平均奖励值来观察智能体学习情况,经过仿真训练,智能体获得奖励函数值曲线如图8所示,从奖励函数曲线可以看出,在前1000个回合内,智能体还处于随机探索阶段,未开始学习,1000个回合后智能体开始学习,平均奖励值开始增大,在10000个回合左右,平均奖励函数值达到最大,最终稳定于0.98左右。
保存完成训练的智能体后,随机从顶层网络规划数据样本中采样1000组初始状态利用保存的智能体进行气动参数跟踪,其跟踪误差如图9所示,从误差图中可以看出,经过训练的智能体可以实现对目标气动参数较高精度的跟踪,99.56%的测试样本升力系数跟踪误差分布在±0.005以内,95.62%的测试样本的阻力系数跟踪误差分布在±0.005范围内。
图10为变形飞行器智能规划方法实现流程示意图,在本实施例中,变形飞行器底层决策规划网络的训练过程为:面向顶层轨迹规划网络产生的气动参数需求,通过深度强化学习方法对大量气动数据样本进行学习和训练,形成基于顶层需求气动参数确定当前变形量与飞行控制量的神经网络模型,使得变形飞行器能够基于学习训练结果,实时输出变形量与攻角组合,实现弹上自主智能变形行为规划;在得到训练好的顶层和底层两层网络后,本实施例通过两层网络的相互嵌套应用,可以实现在线的轨迹与变形一体化规划:将飞行器每个时刻的飞行状态量与当前飞行任务参数组合后输入顶层轨迹规划网络,得到此时刻飞行器所需的目标气动参数,将目标气动参数输入底层变形决策网络后得到能够实现目标气动参数的变形量与攻角的优化组合,最后基于该变形量与攻角的组合决策指令,通过弹上变形控制与姿态控制实现期望的变形量与攻角,从而实现面向任务需求的期望目标轨迹。
为了验证本实施例提出的轨迹与变形一体化规划方法的有效性,随机产生一组飞行初始状态和目标位置,基于本实施例所提出的目标分层变形与轨迹一体化规划方法进行仿真,当飞行器与目标位置的距离最小时判定为到达弹道终点并停止迭代,随机任务具体参数以及仿真结果如表6所示,本实施例对仿真结果与标准参考弹道进行了对比,对比结果如图11所示,从仿真结果中可以看出,本实施例提出的分层规划方法所规划的弹道以及各状态量与标准轨迹均基本重合,能够较高精度地完成轨迹规划任务,表6如下所示:
表6随机飞行任务参数与仿真结果
变形飞行器飞行过程分层程序规划的控制变量信息包括攻角、第一变形系数、第二变形系数和第三变形系数,本实施例将控制变量信息代入飞行器的气动模型中,得到分层程序规划得到的气动参数序列,分别输出分层程序顶层规划的目标气动序列、底层决策变形后得到的真实气动序列和参考轨迹的伪控制变量计算得到的标准气动序列进行对比,其结果如图12所示,从仿真结果可以看出,本实施例提出的分层规划程序能够在连续时间上对最优变形和控制量进行规划,所规划的变形量组合产生的气动参数序列和目标气动序列以及标准参考气动参数序列基本重合。
对于本实施例所提出的飞行任务(总航时约1063s),在(Intel(R)Core(TM)i7-10700K CPU@3.80GHz)处理器平台下利用分层规划程序进行轨迹与变形一体化规划,消耗的时间为0.734s,而在其他条件相同的情况下,利用Chebyshev伪谱法对伪控制变量进行规划所消耗的时间为14.79s,计算时间缩短了95.04%。该结果说明,相较于传统轨迹规划方法,本实施例提出的轨迹与变形一体化规划方法不仅能够直接对轨迹与变形量进行实时规划,且计算速度更快,具备实时在线应用的潜力。
为了验证本实施例提出的轨迹与变形一体化规划方法的泛化性能,在表1所设置的任务范围内随机生成1000组飞行任务,利用本实施例提出的规划方法进行轨迹与变形一体化规划方法进行规划,其仿真弹道如图13所示,统计1000条弹道的终端经度和纬度误差如图14(a)、图14(b)所示,统计结果平均高度绝对误差为0.1053km,平均经度绝对误差为0.0173°,从仿真结果可以看出,对于在训练范围内的飞行任务,本实施例提出的规划方法具有较好的泛化性能,能够根据不同飞行任务快速规划出符合精度要求的轨迹和变形量序列。
S5.根据所述最优攻角与变形量组合,得到飞行器真实气动参数。
S6.将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
本发明实施例提供了基于目标分层架构的变形飞行器智能规划方法,所述方法将轨迹与变形一体化规划问题解耦为规划伪控制量的顶层轨迹规划子问题和规划真实控制和变形量的底层变形决策子问题,然后将变形飞行器每个时刻的飞行状态量与当前飞行任务参数输入顶层轨迹规划神经网络模型,得到目标气动参数,将目标气动参数输入底层变形决策网络模型得到最优变形量与攻角组合,最后基于最优变形量与攻角组合决策指令,实现面向任务需求的期望目标轨迹。相较于传统轨迹规划方法,本实施例提出的基于目标分层架构的变形飞行器智能规划方法不仅能够直接对轨迹与变形量进行实时规划,且计算速度更快,具备实时在线应用的潜力。
需要说明的是,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在一个实施例中,如图15所示,本发明实施例提供了一种基于目标分层架构的变形飞行器智能规划系统,所述系统包括:
目标分层解耦模块101,用于根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型;
顶层轨迹规划模块102,用于确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量,将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数;
底层变形决策模块103,用于将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度;
飞行器迭代规划模块104,用于根据所述最优攻角与变形量组合,得到飞行器真实气动参数,将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
关于一种基于目标分层架构的变形飞行器智能规划系统的具体限定可以参见上述对于基于目标分层架构的变形飞行器智能规划方法的限定,此处不再赘述。本领域普通技术人员可以意识到,结合本申请所公开的实施例描述的各个模块和步骤,能够以硬件、软件或者两者结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本发明实施例提供了一种基于目标分层架构的变形飞行器智能规划系统,所述系统针对高超声速变形飞行器实时随机飞行任务轨迹规划问题,利用深度神经网络的泛化性能和适用于连续动作的强化学习的自主决策能力实现变形飞行器的轨迹与变形一体化规划,使其能够根据飞行任务快速规划出最优轨迹和变形控制量序列,提高了规划精度和计算速度,具备在线应用的能力。
图16是本发明实施例提供的一种计算机设备,包括存储器、处理器和收发器,它们之间通过总线连接;存储器用于存储一组计算机程序指令和数据,并可以将存储的数据传输给处理器,处理器可以执行存储器存储的程序指令,以执行上述方法的步骤。
本领域普通技术人员可以理解,图16中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有相同的部件布置。
在一个实施例中,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
本发明实施例提供的一种基于目标分层架构的变形飞行器智能规划方法及系统,所述方法通过设计伪控制量作为中间变量,将变形飞行器的轨迹与变形一体化规划问题解耦为顶层轨迹规划和底层控制量决策两个子问题,并针对顶层轨迹规划问题,建立由当前状态到轨迹伪控制量的深度神经网络模型;针对底层控制量决策问题,面向顶层网络输出的需求目标气动参数指令建立回报函数,并利用DDPG算法对智能体进行训练,形成由目标气动参数指令到轨迹控制量与多维变形量的底层变形决策网络模型,实现了轨迹与变形一体化快速在线规划,能够快速生成最优轨迹以及变形与控制量序列。与传统轨迹优化方法对比,该方法直接对多维控制量进行规划且将计算时间缩短95.04%,大幅度缩短了计算时间,满足在线轨迹与变形一体化智能规划的要求,且规划精度较高。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现,本领域技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上所述实施例仅表达了本申请的几种优选实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本申请的保护范围。因此,本申请专利的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,包括以下步骤:
根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型;
确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量;
将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数;
将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度;
根据所述最优攻角与变形量组合,得到飞行器真实气动参数;
将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
2.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,所述轨迹伪控制量为:
χ={λ,E*}
s.t.λmin≤λ≤λmax,E* min≤E*≤E* max
式中,χ表示轨迹伪控制量序列;λ表示泛化升力系数;E*表示最大升阻比;λmin表示泛化升力系数的下限值;λmax表示泛化升力系数的上限值;E* min表示最大升阻比的下限值;E* max表示最大升阻比的上限值。
3.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,所述构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型的步骤包括:
基于所述轨迹伪控制量,通过伪谱法对随机飞行任务进行最优弹道规划,得到最优弹道样本;
构建深度神经网络模型,并基于反向误差传播方法,利用最优弹道样本训练深度神经网络模型,将训练好的深度神经网络模型作为顶层轨迹规划神经网络模型,以通过顶层轨迹规划神经网络模型预测轨迹伪控制量。
4.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,所述基于轨迹伪控制量,通过伪谱法对随机飞行任务进行最优弹道规划,得到最优弹道样本的步骤包括:
利用伪谱法在连续时间状态变量和所述轨迹伪控制量上进行离散化,并利用Lagrange插值多项式的基函数,在离散点上近似状态变量和所述轨迹伪控制量,将最优控制问题转化为非线性规划问题,生成最优弹道样本;其中,所述伪谱法包括Chebyshev伪谱法。
5.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,所述顶层轨迹规划神经网络模型包括输入层、隐含层和输出层,所述输入层用于接收最优弹道样本的输入序列,所述输出层用于输出与最优弹道样本对应的输出序列,所述输入序列为:
其中,{xp}表示最优弹道样本P的输入序列;分别表示最优弹道样本P所属弹道的初始高度和初始经度条件,分别表示最优弹道样本P所属弹道的终端高度和终端经度条件,rt p、Vt p、均为最优弹道样本P所属时刻的飞行状态量,其中,rt p表示最优弹道样本P所属时刻的高度;表示最优弹道样本P所属时刻的经度;表示最优弹道样本P所属时刻的纬度;Vt p表示最优弹道样本P所属时刻的速度;表示最优弹道样本P所属时刻的速度倾角;表示最优弹道样本P所属时刻的速度偏向角;
所述输出序列为:
其中,{tp}表示样本P的输出序列;表示样本P所属时刻的最优升力系数,表示样本P所属时刻的最优阻力系数。
6.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,利用深度确定性策略梯度强化学习算法对变形飞行器智能体进行训练,建立基于真实变形量的底层变形决策网络模型,所述底层变形决策网络模型的构建过程具体为:
建立马尔科夫决策过程模型,其中,所述马尔科夫决策过程模型的元素包括状态集、动作集、非稀疏奖励函数和智能体;
构建变形飞行器智能体神经网络,根据建立马尔科夫决策过程,采用深度确定性策略梯度算法对变形飞行器智能体神经网络进行训练,获得底层变形决策网络模型。
7.如权利要求1所述的一种基于目标分层架构的变形飞行器智能规划方法,其特征在于,所述状态集为:
式中,S表示状态集;O表示状态集中的可观测部分;表示目标气动参数中的目标升力系数;表示目标气动参数中的目标阻力系数;Ma表示变形飞行器的飞行马赫数;h表示变形飞行器的飞行高度;
所述动作集为:
A={α,μ1,μ2,μ3}
式中,A表示动作集;α表示变形飞行器的攻角;μ1表示第一变形系数;μ2表示第二变形系数;μ3表示第三变形系数;ξ1表示变形飞行器的第一变形量;表示第一变形量下限值;表示第一变形量上限值;ξ2表示变形飞行器的第二变形量;表示第二变形量下限值;表示第二变形量上限值;ξ3表示变形飞行器的第三变形量;表示第三变形量下限值;表示第三变形量上限值;
所述非稀疏奖励函数为:
式中,R(s,a)表示非稀疏奖励函数;表示升力系数差值;表示变形飞行器的观测升力系数;表示目标升力系数;l、m、n、o表示对奖励值和误差进行放缩的参数;表示阻力系数差值;表示变形飞行器的观测阻力系数;表示目标阻力系数。
8.一种基于目标分层架构的变形飞行器智能规划系统,其特征在于,所述系统包括:
目标分层解耦模块,用于根据预先建立的变形飞行器轨迹规划与变形决策协调模型,将泛化升力系数和最大升阻比定义为轨迹伪控制量,并构建基于所述轨迹伪控制量的顶层轨迹规划神经网络模型和基于真实变形量的底层变形决策网络模型;
顶层轨迹规划模块,用于确定当前的飞行任务参数,并利用变形飞行器再入动力学模型,得到变形飞行器当前时刻的飞行状态量,将变形飞行器当前时刻的飞行状态量与飞行任务参数输入所述顶层轨迹规划神经网络模型,得到对应时刻的目标气动参数;
底层变形决策模块,用于将所述目标气动参数和飞行状态参数输入所述底层变形决策网络模型,得到最优攻角与变形量组合;所述飞行状态参数包括飞行马赫数和飞行高度;
飞行器迭代规划模块,用于根据所述最优攻角与变形量组合,得到飞行器真实气动参数,将所述飞行器真实气动参数输入变形飞行器再入动力学模型,迭代得到下一时刻的飞行状态量,并将下一时刻的飞行状态量和飞行任务参数输入所述顶层轨迹规划神经网络模型,重复多轮迭代,直至变形飞行器到达目标位置,得到期望目标轨迹。
9.一种计算机设备,其特征在于:包括处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述计算机设备执行如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被运行时,实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311163026.3A CN117268391B (zh) | 2023-09-08 | 2023-09-08 | 一种基于目标分层架构的变形飞行器智能规划方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311163026.3A CN117268391B (zh) | 2023-09-08 | 2023-09-08 | 一种基于目标分层架构的变形飞行器智能规划方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117268391A true CN117268391A (zh) | 2023-12-22 |
CN117268391B CN117268391B (zh) | 2024-04-26 |
Family
ID=89205426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311163026.3A Active CN117268391B (zh) | 2023-09-08 | 2023-09-08 | 一种基于目标分层架构的变形飞行器智能规划方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117268391B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118131649A (zh) * | 2024-05-10 | 2024-06-04 | 西北工业大学宁波研究院 | 变展长飞行器在气动不确定性下的智能变形决策方法 |
CN118410585A (zh) * | 2024-06-27 | 2024-07-30 | 西北工业大学 | 一种基于模糊威胁判定的高速飞行器博弈变形方法 |
CN118551668A (zh) * | 2024-07-29 | 2024-08-27 | 中国空气动力研究与发展中心超高速空气动力研究所 | 基于机器学习的高速飞行器特征泛化方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354152A (zh) * | 2016-08-18 | 2017-01-25 | 中国人民解放军国防科学技术大学 | 一种对辐射型禁飞区的再入轨迹优化设计方法 |
CN110320927A (zh) * | 2019-07-26 | 2019-10-11 | 中国人民解放军国防科技大学 | 智能变形飞行器的飞行控制方法及系统 |
US20200202725A1 (en) * | 2018-12-20 | 2020-06-25 | Thales | Optimizing a parametric model of aircraft performance |
US20210164783A1 (en) * | 2019-08-29 | 2021-06-03 | Dalian University Of Technology | Method for directly planning reentry trajectory in height-velocity profile |
CN114637312A (zh) * | 2022-03-18 | 2022-06-17 | 北京航空航天大学杭州创新研究院 | 一种基于智能变形决策的无人机节能飞行控制方法及系统 |
CN115356935A (zh) * | 2022-10-18 | 2022-11-18 | 北京理工大学 | 基于多阶段可变外形的大空域转换飞行策略优化方法 |
-
2023
- 2023-09-08 CN CN202311163026.3A patent/CN117268391B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106354152A (zh) * | 2016-08-18 | 2017-01-25 | 中国人民解放军国防科学技术大学 | 一种对辐射型禁飞区的再入轨迹优化设计方法 |
US20200202725A1 (en) * | 2018-12-20 | 2020-06-25 | Thales | Optimizing a parametric model of aircraft performance |
CN110320927A (zh) * | 2019-07-26 | 2019-10-11 | 中国人民解放军国防科技大学 | 智能变形飞行器的飞行控制方法及系统 |
US20210164783A1 (en) * | 2019-08-29 | 2021-06-03 | Dalian University Of Technology | Method for directly planning reentry trajectory in height-velocity profile |
CN114637312A (zh) * | 2022-03-18 | 2022-06-17 | 北京航空航天大学杭州创新研究院 | 一种基于智能变形决策的无人机节能飞行控制方法及系统 |
CN115356935A (zh) * | 2022-10-18 | 2022-11-18 | 北京理工大学 | 基于多阶段可变外形的大空域转换飞行策略优化方法 |
Non-Patent Citations (1)
Title |
---|
叶鸿凯: "多旋翼飞行器动力学运动规划", 中国博士学位论文全文数据库 工程科技Ⅱ辑, no. 2, 15 February 2023 (2023-02-15), pages 031 - 108 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118131649A (zh) * | 2024-05-10 | 2024-06-04 | 西北工业大学宁波研究院 | 变展长飞行器在气动不确定性下的智能变形决策方法 |
CN118410585A (zh) * | 2024-06-27 | 2024-07-30 | 西北工业大学 | 一种基于模糊威胁判定的高速飞行器博弈变形方法 |
CN118551668A (zh) * | 2024-07-29 | 2024-08-27 | 中国空气动力研究与发展中心超高速空气动力研究所 | 基于机器学习的高速飞行器特征泛化方法及装置 |
CN118551668B (zh) * | 2024-07-29 | 2024-09-24 | 中国空气动力研究与发展中心超高速空气动力研究所 | 基于机器学习的高速飞行器特征泛化方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117268391B (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117268391B (zh) | 一种基于目标分层架构的变形飞行器智能规划方法及系统 | |
CN111351488B (zh) | 飞行器智能轨迹重构再入制导方法 | |
Mohajerin et al. | Multistep prediction of dynamic systems with recurrent neural networks | |
CN102129259B (zh) | 用于砂尘环境试验风洞的基于神经网络pi的智能温度控制系统和方法 | |
CN110806759A (zh) | 一种基于深度强化学习的飞行器航线跟踪方法 | |
CN111813146B (zh) | 基于bp神经网络预测航程的再入预测-校正制导方法 | |
Papakostas et al. | Training fuzzy cognitive maps by using Hebbian learning algorithms: a comparative study | |
CN110703787A (zh) | 基于偏好矩阵的混合多目标pso算法的飞行器冗余控制方法 | |
CN115562345B (zh) | 一种基于深度强化学习的无人机侦测轨迹规划方法 | |
CN102645894B (zh) | 模糊自适应动态规划方法 | |
Gao et al. | Dubins path‐based dynamic soaring trajectory planning and tracking control in a gradient wind field | |
CN116700327A (zh) | 一种基于连续动作优势函数学习的无人机轨迹规划方法 | |
Zhang et al. | A safety planning and control architecture applied to a quadrotor autopilot | |
CN114083543A (zh) | 一种空间机械臂主动故障诊断方法 | |
CN114115307B (zh) | 一种基于深度学习的航天器反交会逃逸脉冲求解方法 | |
Chen et al. | Hybrid modeling for vehicle lateral dynamics via AGRU with a dual-attention mechanism under limited data | |
Lampton et al. | Reinforcement learning of morphing airfoils with aerodynamic and structural effects | |
Alhazmi et al. | Training a neural-network-based surrogate model for aerodynamic optimization using a gaussian process | |
Meng et al. | Automatic control method of automobile steering-by-wire based on fuzzy PID | |
Zang et al. | Underwater gliders linear trajectory tracking: The experience breeding actor-critic approach | |
Yongqiang et al. | Path‐Integral‐Based Reinforcement Learning Algorithm for Goal‐Directed Locomotion of Snake‐Shaped Robot | |
Xu et al. | Investigation of Deep Reinforcement Learning for Longitudinal-Axis Flight Control | |
Wang et al. | Deep Reinforcement Learning-Based Periodic Earth Observation Scheduling for Agile Satellite Constellation | |
Ruff et al. | Surrogate Neural Networks for Efficient Simulation-based Trajectory Planning Optimization | |
Rashid et al. | Knowledge-based aerodynamic estimation of airships |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |