CN111813146B

CN111813146B - 基于bp神经网络预测航程的再入预测-校正制导方法

Info

Publication number: CN111813146B
Application number: CN202010617895.9A
Authority: CN
Inventors: 章吉力; 刘凯; 王永圣; 樊雅卓; 周宁; 尹中杰; 李家鑫; 董哲; 金泽宇
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2020-07-01
Filing date: 2020-07-01
Publication date: 2021-06-08
Anticipated expiration: 2040-07-01
Also published as: CN111813146A

Abstract

本发明属于飞行器制导技术领域，涉及一种基于BP神经网络预测航程的再入预测‑校正制导方法。本发明首先通过数据需求分析，确定建立神经网络模型需要的输入输出，在此基础上对数据进行扩维，得到训练数据，使用训练数据训练剩余航程预测的神经网络模型，将模型应用于预测‑校正算法中。相比传统的数值预测‑校正算法，本发明的方法能够在基本保证原有精度的同时将算法运行效率提升十倍以上，同时还具有绝对收敛的特性，极大提升了制导算法的稳定性和在线性能，具有广阔应用前景。

Description

基于BP神经网络预测航程的再入预测-校正制导方法

技术领域

本发明属于飞行器制导技术领域，涉及一种基于BP神经网络预测航程的再入预测-校正制导方法。

背景技术

“飞行器制导”是指导引和控制飞行器按一定规律飞向目标或预定轨道的技术和方法。制导过程中，导引系统不断测定飞行器与目标或预定轨道的相对位置关系，发出制导信息传递给飞行器控制系统，以控制飞行。再入是指航天器重新进入大气层的过程，在飞行器的再入阶段，不仅需要考虑力热载荷要求带来的动压、过载和热流等约束，还应充分考虑返场需求对应的终端速度、高度及航程约束，同时覆盖姿态控制幅值和响应速度约束的要求；此外，空天飞行器离轨过程中飞行速度大，施加脉冲制动存在的微小误差将被放大，进而导致再入初始状态偏差较大，表现为再入点初始位置和能量散布大；再入过程中历经真空、临近空间及稠密大气层，复杂气动环境带来较大不确定性。综合来看，在初始散布误差和模型不确定性较大的情况下，狭窄飞行走廊中实现高精度再入制导面临挑战。

预测-校正算法是一种可以在线运行的制导方法，在发展过程中衍生出了解析法和数值法两个主要分支，解析法对计算机要求低，运行快速，但由于其理论推导复杂，泛用性弱已经渐渐不再使用；随着计算机性能的提高，数值预测-校正。该算法不需要预先存储参考轨迹，而是利用当前状态和最终目标点信息给出制导指令。由于数值预测校正制导算法使用了这种制导逻辑，即使空天飞行器在再入阶段遇到较大的扰动，偏离了预先存储的参考轨迹，制导算法也可以生成一条合适的倾侧角指令，引导空天飞行器沿着新的轨迹飞向目标点。

在已发表的研究中，预测-校正算法被应用在许多方面。其可行性已在多个环境的仿真中得到了验证，主要包括可重复使用的运载火箭再入，月球进入及探月飞行器再入返回，火星进入和精确着陆等。研究人员对预测校正制导算法在解决不同情形的问题时进行了有针对性的优化，但由于算法自身的逻辑特性要求在预测环节进行多次的积分运算和大量的迭代，导致算法的单步运行时间偏长，极大地影响了算法的在线性能，制约了其在线应用的可能性。

随着计算机技术的发展和计算能力的提升，基于欧拉积分的预测-校正方法成为了国内外学者研究的重点。数值预测-校正算法通过对动力学方程进行积分来预测终端状态，Shen Zuo-jun详细介绍了一种横向制导策略，定义待飞航程为当前位置到航向校准圆柱的地表距离，通过待飞航程和航向角定义了横程。LuPing应用了这种横向制导策略，同时提出了一种纵向制导策略，定义终端到航向校准圆柱的地表距离为剩余航程，通过欧拉积分预测终端经纬度，进而得到剩余航程，进行倾侧角迭代。Lu Ping还以低升力结构的飞行器为背景应用了预测—校正制导，并取得了很高的精度。

还有许多学者针对更加具体的任务形式对预测-校正制导做出了一些改进。龙嘉腾在火星大气进入的背景下考虑到倾侧角多次反号会产生燃料消耗过多的问题，把预测环节引入了侧向制导中，给出了只经过一次反转就使末端横程为零的侧向制导律。李惠峰应用平衡滑翔条件(QEGC)来进行攻角设计，进而得到再入轨迹。考虑到对于高升阻比RLV的QEGC约束过于苛刻，张鹏将地球自转的哥氏加速度引入QEGC，得到改进的准平衡滑翔条件，在合理的前提下放宽了倾侧角幅值约束。

现有技术主要针对数值预测—校正算法进行一些参数设置和计算逻辑层面的改进，或依据飞行器运行的具体环境细化部分参数，进行一些有针对性的优化，虽然能够提升算法效率和精度，但提升仍然十分有限，且由于大量研究针对具体问题进行优化，其方法不具有普适性。总的来说，算法预测环节运行时间长、在线能力差的问题仍然十分显著。

近年来，基于深度学习的人工智能技术渗透到先进科技领域的方方面面，结合大数据和神经网络的思路为各行各业的研究提供了新的可探索路线。除去常见的自然语言识别、图片识别等应用外，神经网络在非线性函数拟合上也具有应用优势。

发明内容

在数值预测-校正算法中，耗时的主要部分就是预测环节的多次积分运算，该环节具有显著的输入输出特征和映射关系，可以将输出视作输入的多元非线性函数。利用这一特性，本发明提出建立基于BP神经网络进行航程预测的再入预测-校正算法，通过训练神经网络拟合这一多元非线性函数，避免预测环节多次积分运算，在保证制导精度的同时大大提升算法运行效率，使算法具有更加广阔的应用前景。

本发明的技术方案：

一种基于BP神经网络预测航程的再入预测-校正制导方法，包括纵向制导和横侧向制导，具体如下：

(1)基于BP神经网络预测航程的纵向制导

预测-校正制导算法的纵向制导核心逻辑是通过给定的目标函数f迭代求解控制指令的幅值。

(1.1)纵向制导流程

纵向制导包括“预测环节”和“校正环节”。预测环节用欧拉积分计算预测剩余航程S_p，校正环节迭代倾侧角指令

具体运行流程为：

(1.1.0)起飞前，预设终端目标信息，包括终端能量和终端经纬度。

(1.1.1)飞行过程中，从传感器和控制器获得当前点的状态值与控制指令，包括地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ；

(1.1.2)基于当前状态计算实际地面航程S；

(1.1.3)以当前状态倾侧角作为迭代初始值赋给

利用BP神经网络模型计算S_p；

(1.1.4)计算目标函数

(1.1.5)通过迭代格式

更新倾侧角值；

(1.1.6)重复(1.1.3)～(1.1.5)，直至目标函数f的值小于预设误差限(误差限一般设置为接近零的小值)；

(1.1.7)判断

是否在约束范围(σ_min,σ_max)内；若在约束范围内，则以此时的

作为倾侧角幅值指令，若不在约束范围内，则以σ_min或σ_max作为倾侧角幅值指令；纵向制导结束。

由于数值预测-校正算法纵向制导的预测环节存在多次积分计算，因此占用了主要的运行时间，为了优化算法的运行效率，本发明中在步骤(1.1.3)采用基于BP神经网络模型的预测环节来代替数值预测校正制导基于欧拉积分的预测环节，实现快速计算目标函数f的过程。BP神经网络模型的建立与训练方法具体如下：

(a)输入数据选定

飞行器的数学模型：

式中：V是速度，γ是弹道倾角，ψ是弹道偏角；r是地心距，表示飞行器到地心的距离；λ是飞行器在地表投影点的经度，φ是飞行器在地表投影点的纬度；g是重力加速度，其中g₀＝9.8067m/s²，m是飞行器的质量，ω_e是地球自转的角速度；σ是倾侧角，D是阻力，L是升力。

对于待训练的神经网络模型，影响其输出“预测剩余航程S_p”的变量包括地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ。因此，初步选择的输入变量为地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ。

(b)输入输出影响特性分析与输入数据生成

对于初步选择的输入、输出变量，需要进行数据扩充之后才可以进行训练，但无依据的扩充会导致数据量过于庞大冗杂。因此，需要针对每个输入变量进行输出变量的影响特性分析。计算机算力有限的情形下，输入输出影响特性分析对于训练数据生成的可实现性具有重要意义。基于分析结果，可以对状态输入进行有针对性的扩充。考虑到不同飞行阶段输入输出特性可能不同，需要选择具有代表性的采样数据点，若在一段飞行过程中，飞行器最大速度为V_max，则可以取飞行速度为V_max，V_max/2，V_max/5的状态点，分别对应飞行过程的“高速”、“中速”、“低速”状态特征。

分析输入输出影响特性的流程为：

(b.1)选择采样数据点。

(b.2)确定扩充的幅值和间隔(要求幅值大，间隔小，扩充数据点多)，对步骤(b.1)中选取的数据点的第一个维度输入进行扩充，得到一组扩充数据；切换扩充的输入维度，直至得到所有维度的输入的扩充数据。

(b.3)把步骤(b.2)得到的扩充数据作为输入，用欧拉积分法计算输入对应的输出。

(b.4)更换采样数据点，重复步骤(b.2)和(b.3)的扩充步骤，则得到H-S_p，V-S_p，λ-S_p，φ-S_p，θ-S_p，ψ-S_p，σ-S_p的单个输入对输出值的影响关系。

(b.5)通过(b.1)～(b.4)影响关系分析，对由地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ构成的状态集进行扩充；并依据输入对输出的影响关系，对应采取三类不同的扩充策略：

无影响：即X-S_p图像呈与x轴平行的水平直线；则把该输入直接删去。

线性影响：即X-S_p图像呈倾斜直线；则进行三点扩充。

非线性影响：根据非线性程度选择扩充方式；比如，若X-S_p图像呈二次曲线，可以采用五点扩充，若非线性程度很大，则进一步增加取点数量。

N点扩充(包括三点扩充和五点扩充)：指扩充后的数据点个数；对于N点扩充，若扩充幅值为A，则N点扩充的扩充间隔为A/(N-2)。

(b.6)对所有线性影响和非线性影响的状态使用N点扩充，得到扩维输入矩阵。

(c)训练数据的生成与神经网络模型的训练

在步骤(b.6)中得到扩维输入矩阵后，以矩阵中的每个状态向量作为输入，应用欧拉积分法计算输出值，将状态向量对应的输出值存储为输出向量，最后，把输入矩阵和输出向量合并，得到训练数据矩阵。

应用训练数据矩阵来训练神经网络，就是要把训练数据喂给搭建好的初始化神经网络模型。神经网络的基础结构由神经元以及神经元间的连接共同组成。第一层神经元为输入层，底层神经元为输出层，中间的神经元为隐藏层。BP神经网络是全连接的神经网络，神经元之间的每条连接线上有权重系数w，每个神经元有偏置值b，w和b的集合构成BP神经网络的待训练参数，其更新方式遵循：

其中，lr是学习率，需要根据实际情况自主设置；Loss为损失函数，定义为神经网络输出值和训练数据输出值的均方误差。

在损失函数值小于设定值时，神经网络模型收敛，此时的BP神经网络模型就具有了依据输入(状态)计算输出(剩余航程)的功能，可被用于代替“预测环节”，实现制导功能。

(2)横侧向制导

横侧向制导的目标是基于横程Z确定倾侧角的符号。横侧向制导的横程Z＝arcsin(sinΩsinΔψ)，式中：Ω是实际地面航程S对应的地心角，Δψ＝ψ_s-ψ是航向偏差，为速度和待飞位移的夹角；

飞行过程中，要求横程值位于限幅之间：

倾侧角的符号确定方式为：

本发明的有益效果：

本发明首先通过数据需求分析，确定建立神经网络模型需要的输入输出，在此基础上对数据进行扩维，得到训练数据，使用训练数据训练剩余航程预测的神经网络模型，将模型应用于预测-校正算法中。相比传统的数值预测-校正算法，本发明的方法能够在基本保证原有精度的同时将算法运行效率提升十倍以上，同时还具有绝对收敛的特性，极大提升了制导算法的稳定性和在线性能，具有广阔应用前景。

附图说明

图1为传统数值预测校正算法流程示意图；

图2为本发明的基于BP神经网络预测航程的再入预测-校正制导方法流程图；

图3为本发明实施例中BP神经网络预测输出示意图；

图4为本发明实施例中BP神经网络预测误差示意图；

图5为本发明实施例中BP神经网络预测误差百分比示意图；

图6为本发明实施例中BP神经网络模型蒙特卡罗仿真误差分布示意图；

图7为本发明实施例中落点精度对比示意图。

具体实施方式

以下结合附图和技术方案，进一步说明本发明的具体实施方式。

如图1和图2所示，预测校正方法基于飞行器的飞行状态计算得到预测航程，再以剩余航程作为反馈信息来迭代获取倾侧角指令，传统数值预测校正算法采用欧拉积分的方式计算预测航程，需要从飞行的当前状态一直积分到飞行终端，造成消耗时间长，算法效率低。本发明旨在对图1中的传统数值预测校正算法流程进行改进，引入了BP神经网络来进行航程的预测，代替传统的积分计算，达到提升计算效率的目的。

本实施例以某空天飞行器再入阶段为例，并验证本发明的BP神经网络预测-校正算法。空天飞行器是既能航空又能航天的新型飞行器，它同时拥有飞机发动机和火箭发动机，可以像飞机一样从飞机场跑道上起飞，以高超声速在大气层飞行，也可以进入太空，成为航天器，降落时亦可以像飞机一样在飞机跑道上水平降落。再入指的是飞行器由空间重新进入大气层的过程，由于再入初始能量高，且往往处于无动力状态，因此具有很高的制导难度。

空天飞行器再入的动力学模型可以由下式给出：

式中：V是速度，γ是弹道倾角，ψ是弹道偏角，r是地心距，表示飞行器到地心的距离，λ是飞行器在地表投影点的经度，φ是飞行器在地表投影点的纬度；g是重力加速度，其中g₀＝9.8067m/s²，m是飞行器的质量，ω_e是地球自转的角速度。σ是倾侧角，D是阻力，L是升力，L和D的计算方法由下式给出：

式中：ρ表示大气密度，可以视为高度的函数，A为参考面积，C_L和C_D分别表示升力和阻力系数，可以视为是攻角和马赫数的函数。再入过程的控制变量一般只有攻角α和倾侧角σ，在设计再入弹道的过程中，攻角α的值由事先设定好的α-V剖面给出。预测校正制导算法能够通过给定的倾侧角对动力学模型进行积分，进而预测剩余航程和落点，并基于此进行迭代，得到满足航程要求的倾侧角。对于本专利使用的研究对象，倾侧角是唯一的控制变量。

采用本发明的方法进行算法设计，具体步骤如下：

(一)基于BP神经网络预测航程的纵向制导

(1)纵向制导流程

数值预测校正制导使用欧拉积分法预测环节的剩余航程，预测环节是需要在反复迭代中进行的环节，是算法计算量的最主要部分，对剩余航程的导数进行积分来计算剩余航程的过程会带来巨大的计算量，为了解决这个问题，本发明采用基于BP神经网络计算航程的方法来代替积分计算预测剩余航程。使用训练得到的BP神经网络模型，输入飞行器状态，即可得到预测剩余航程输出值。

指令校正环节通过迭代来实现倾侧角值的求解，取迭代的目标函数为：

f＝S_p-S (3)

式中，S_p是BP神经网络模型得到的当前点的预测剩余航程，S是当前点到目标点的实际地面航程，S的计算方法为：

式中λ、φ是当前点的经、纬度，λ_f、φ_f是目标点的经、纬度，Ω是S对应的地心角。

在航程预测环节获得了在给定倾侧角下的航程之后，通过牛顿迭代来求解符合要求的倾侧角指令：

式中：目标函数f_i的导数

一般来说难以解析求取，因此在实际应用中可以采用差分来代替。a是系数因子，一般情况下，为了保证计算效率，需要给它分配一个合适的值。然而，当接近真正的解时，如果a的值太大，迭代可能陷入死循环，在真解附近振荡。迭代中的另一个问题是目标函数f_i在局部的单调性可能与它的整体单调性不一致，由于局部的单调性异常，迭代可能会反向进行从而偏离正确的解。这也会产生发散。为了解决这一问题，采用牛顿下山法给出了一种自适应迭代算法。若当前次迭代的目标函数绝对值大于上次迭代的目标函数绝对值，则将系数a变为原来的1/2重新计算目标函数。

综合预测环节和校正环节，纵向制导具体运行流程为：

(1.0)起飞前，预设终端目标信息，包括终端能量和终端经纬度。

(1.1)飞行过程中，从传感器和控制器获得当前点的状态值与控制指令，包括地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ；

(1.2)基于当前状态计算实际地面航程S；

(1.3)以当前状态倾侧角作为迭代初始值赋给

利用BP神经网络计算S_p；

(1.4)计算目标函数

(1.5)通过迭代格式

更新倾侧角值；

(1.6)重复(1.3)～(1.5)，直至目标函数f的值小于预设误差限(误差限一般设置为接近零的小值)；

(1.7)判断

(2)BP神经网络模型的建立与训练

BP神经网络进行的拟合是基于大量数据实现的，在进行神经网络相关研究之前，通过将数值-预测校正算法应用于空天飞行器再入段仿真，可以获得一条可实现的飞行轨迹。飞行轨迹实质上由一系列密集的状态数据点构成，这些状态数据点和计算剩余航程的欧拉积分是生成训练数据的基础。

(2.1)输入数据选定

对于一个的BP神经网络模型来说，进行训练需要确定模型的输入和输出，结合研究对象，需要建立的是一个以预测剩余航程S_p为输出的模型。确定输出之后，就要考虑以所有影响输出的变量作为输入。对于本发明中式(1)确定的研究对象，可以直接推出影响输出的状态变量，包括地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ。需要注意的是，数值预测-校正方法本身已经存在很多种，在不同的方法中对于剩余航程(即输出)的定义也有所区别，因此判断影响输出的状态变量时需要具体问题具体分析，可能在上文中提到的七个状态的基础上有所增减。

经过数据需求分析，可以初步确定训练数据的输入和输出的维数。本发明中，输入数据为七维，包含地心距r、速度V、经度λ、纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ。输出数据为一维，即预测剩余航程S_p。定义包含输入输出状态的所有状态数据点的集合矩阵为基准弹道状态数据矩阵I₀。

(2.2)输入对输出影响特性分析

对于初步选择的输入、输出变量，需要进行扩充之后才可以进行训练，但无依据的扩充会导致数据量过于庞大冗杂。因此，需要针对每个输入变量进行输出变量的影响特性分析。考虑到不同飞行阶段输入输出特性可能不同，需要在高速、中速以及低速阶段分别选择具有代表性的采样数据点，对于本实施例，研究对象的速度变化区间为1000m/s～7000m/s，因此选择速度为7000m/s(高速)，3500m/s(中速)，1400m/s(低速)的数据点作为采样数据点。以本实施例中七维输入，一维输出为例，具体操作步骤为：

(2.2.1)选择采样数据点

(2.2.2)对该据点的七维输入分别进行扩充，确定扩充的幅值和间隔，形成七组扩充数据；举例来说：若状态X的值为100，取扩充幅值为20，扩充间隔为2，则扩充后X的变化范围为100±20，变化间隔为2，形成80:2:120的向量，除状态X外，其余状态值维持不变，形成一组数据。对状态Y、状态Z…做同样操作，直至形成七组数据。

(2.2.3)把某一组数据作为输入，使用欧拉积分计算这些输入对应的输出。以状态X扩充形成的数据为例，则对应计算出不同状态X取值下输出的值，这样便可以得到状态X对输出的影响规律X-S_p。

(2.2.4)更换采样数据点，重复(2.2.2)和(2.2.3)步骤。则得到H-S_p，V-S_p，λ-S_p，φ-S_p，θ-S_p，ψ-S_p，σ-S_p的单个输入对输出值的影响关系。

通过输入输出影响分析，可以将输入对输出的影响关系分为三类，对应采取不同的扩充策略：

线性影响：即X-S_p图像呈倾斜直线；则进行三点扩充。

针对本实施例研究对象所做的输入、输出特性分析结论为：经度λ、纬度φ、弹道偏角ψ对预测剩余航程S_p无影响。同时，在高速和中速阶段，地心距r、速度V、弹道倾角γ、倾侧角σ对于预测剩余航程S_p的影响有明显的线性关系。因此，输入数据需要扩充的维数可以从七维降至四维，对于地心距r、速度V、弹道倾角γ、倾侧角σ，在高速和中速阶段可以采取三点扩充，不必把扩充间隔取得过细。在计算机内存和算力有限的情形下，输入对输出影响特性分析对于训练数据生成的可实现性具有重要意义。在扩维完成后，得到扩维输入矩阵I。

(2.3)训练数据矩阵的生成

为了大致估计存储扩维输入矩阵I占用的内存空间，需要计算扩维输入矩阵I的规模，计算公式如下：

式中，m和n是基准弹道状态数据矩阵I₀的行数和列数，M和N是扩展后输入矩阵I的行数和列数，k_i是第i个状态扩充后的状态点的个数，k_i＝1+扩充幅值/扩充间隔。

以扩维输入矩阵I中的每个状态向量作为输入，应用欧拉积分计算预测剩余航程S_p，将状态向量对应的剩余航程S_p存储为输出向量O，最后，把输入矩阵I和输出向量O合并，就得到了训练数据矩阵T。

(2.4)BP神经网络模型训练与验证

使用Matlab中的Neural Network Toolbox来训练神经网络模型。由于BP神经网络具有良好的非线性拟合性能，故而采用该型结构。鉴于本实施例数据拟合的复杂性，使用了深度网络而不是单层网络进行训练。

(a)模型训练方法

BP神经网络的代码界面主要涉及数据的读取，输入/输出维数的设置，训练集和测试集规模设置和训练相关参数设置。这里主要介绍训练集和验证集规模设置和训练相关参数设置。

一般来说，用于训练的数据要分为三块，即训练集、验证集和测试集。定义如下：

训练集：顾名思义指的是用于训练的样本集合，主要用来训练神经网络中的参数。

验证集：用于验证模型性能的样本集合.不同神经网络在训练集上训练结束后,通过验证集来比较判断各个模型的性能。

测试集：对于训练完成的神经网络,测试集用于客观的评价神经网络的性能。

验证集来自对训练集的再划分，这一操作默认由工具箱自主完成，因此实质上需要人为划分的只有训练集和测试集两部分。由于本专利的数据点不具有特殊性，因而可以选择随机划分的方式，即随机地决定一部分为训练集，剩余部分即为测试集。

训练相关参数主要包括：

net隐藏层层数：设置隐藏层层数，在一定范围内，层数越多，拟合效果一般越好，隐藏层层数决定了网络的深度。

Epoch：当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一次epoch。简单来说，一个Epoch就是将所有训练样本训练一次的过程。

Lr：学习速率，如果学习率过小，梯度下降很慢，如果学习率过大，梯度下降的步子过大可能会跨过最优值。

Goal：训练要求达到的模型精度。

max_fail：允许连续进行validation checks失败的最大次数。这是为了避免过拟合而设置的一个训练终止条件。

利用训练数据矩阵T进行神经网络训练，得到的结果如图3、图4以及图5所示：

可以看到，模型对对测试集进行计算的输出误差完全控制在1.5％以内。

(b)模型验证

对于完成训练后得到的BP神经网络模型，要进一步验证其可靠性，需要进行针对输入不确定性的蒙特卡罗仿真。

模型测试用蒙特卡洛仿真的方式，仿真误差采用均匀分布，误差限与训练模型的误差限一致。每个点进行20次仿真，得到的结果如图6：

对该仿真进行统计学分析：得到的结论为：

模型误差在[-5％,5％]置信区间内的置信概率为96.7427％；

模型误差在[-10％,10％]置信区间内的置信概率为99.8046％。

因此可以认为，模型是可靠的。模型的精度可以通过把扩充间隔取得更加密集来提升，当然，这也意味着会付出更多的离线运算时间来获得训练数据。

(二)横侧向制导流程

侧向制导决定控制指令的符号，要通过合理的定义倾侧角反转逻辑来实现，反转逻辑的设计基于横程和横程边界的定义，本实施例中，定义横程表示沿当前状态飞行至终端后的落点误差大小，其的定义如下：

Z＝arcsin(sinΩsinΔψ) (6)

式中：Δψ＝ψ_s-ψ是航向偏差，为速度和待飞位移的夹角，这种定义方法在倾侧角变号时，横程可以很快的响应，有较好的控制效果，由于航向偏差是以目标落点为基准，可以保证轨迹会逐渐趋向于目标落点。

横程的上下边界设计为：

其中k₁和k₂为可调参数。至此，倾侧角符号翻转逻辑为：

(三)基于BP神经网络的再入预测-校正算法与传统数值预测-校正算法的性能对比

鉴别制导算法性能好坏的主要手段是蒙特卡罗仿真，本发明将BP神经网络的预测-校正算法与传统数值预测-校正算法进行对比，鉴别指标为二者的制导精度和运行时间。每种方法的仿真次数为20次。

影响轨迹的参数主要涉及能量、气动品质、再入点初始位置误差。综合考虑这些影响，蒙特卡罗仿真的不确定性参数由下表给出：

表1蒙特卡罗仿真不确定性参数

最终，所有仿真实验的落点偏差如下图7所示：

对于本实施例中的算例，传统数值预测-校正制导方法的单次平均运行时间为51.697s，基于BP神经网络的预测—校正算法的单次平均运行时间为4.771s。计算时间缩短至原来的十分之一以下，且落点误差基本一致，在保证制导精度的基础上极大提高了计算效率。

Claims

1.一种基于BP神经网络预测航程的再入预测-校正制导方法，包括纵向制导和横侧向制导，其特征在于，具体如下：

(1)基于BP神经网络预测航程的纵向制导

(1.1)纵向制导流程

纵向制导包括预测环节和校正环节；预测环节用欧拉积分计算预测剩余航程S_p，校正环节迭代倾侧角指令

具体流程为：

(1.1.0)起飞前，预设终端目标信息，包括终端能量和终端经纬度；

(1.1.1)飞行过程中，从传感器和控制器获得当前点的状态值与控制指令，包括地心距r、速度V、飞行器在地表投影点的经度λ、飞行器在地表投影点的纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ；

(1.1.2)基于当前状态计算实际地面航程S；

(1.1.3)以当前状态倾侧角作为迭代初始值赋给

利用BP神经网络模型计算S_p；

(1.1.4)计算目标函数

(1.1.5)通过迭代格式

更新倾侧角值，a是系数因子；

(1.1.6)重复(1.1.3)～(1.1.5)，直至目标函数f的值小于预设误差限；

(1.1.7)判断

作为倾侧角幅值指令，若不在约束范围内，则以σ_min或σ_max作为倾侧角幅值指令；纵向制导结束；

其中，所述的BP神经网络模型的建立与训练方法具体如下：

(a)输入数据选定

飞行器的数学模型：

式中：V是速度，γ是弹道倾角，ψ是弹道偏角；r是地心距，表示飞行器到地心的距离；λ是飞行器在地表投影点的经度，φ是飞行器在地表投影点的纬度；g是重力加速度，其中g₀＝9.8067m/s²，m是飞行器的质量，ω_e是地球自转的角速度；σ是倾侧角，D是阻力，L是升力；

对于待训练的神经网络模型，影响其输出预测剩余航程S_p的变量包括地心距r、速度V、飞行器在地表投影点的经度λ、飞行器在地表投影点的纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ；因此，初步选择的输入变量为地心距r、速度V、飞行器在地表投影点的经度λ、飞行器在地表投影点的纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ；

(b)输入输出影响特性分析与输入数据生成

考虑到不同飞行阶段输入输出特性不同，需要选择具有代表性的采样数据点，若在一段飞行过程中，飞行器最大速度为V_max，则取飞行速度为V_max，V_max/2，V_max/5的状态点，分别对应飞行过程的高速、中速、低速状态特征；

分析输入输出影响特性的流程为：

(b.1)选择采样数据点；

(b.2)确定扩充的幅值和间隔，对步骤(b.1)中选取的数据点的第一个维度输入进行扩充，得到一组扩充数据；切换扩充的输入维度，直至得到所有维度的输入的扩充数据；

(b.3)把步骤(b.2)得到的扩充数据作为输入，用欧拉积分法计算输入对应的输出；

(b.4)更换采样数据点，重复步骤(b.2)和(b.3)的扩充步骤，则得到H-S_p，V-S_p，λ-S_p，φ-S_p，γ-S_p，ψ-S_p，σ-S_p的单个输入对输出值的影响关系；

(b.5)通过(b.1)～(b.4)影响关系分析，对由地心距r、速度V、飞行器在地表投影点的经度λ、飞行器在地表投影点的纬度φ、弹道倾角γ、弹道偏角ψ、倾侧角σ构成的状态集进行扩充；并依据输入对输出的影响关系，对应采取三类不同的扩充策略：

无影响：即X-S_p图像呈与x轴平行的水平直线；则把该输入直接删去，X表示状态；

线性影响：即X-S_p图像呈倾斜直线；则进行三点扩充；

非线性影响：根据非线性程度选择扩充方式；

N点扩充：指扩充后的数据点个数；对于N点扩充，若扩充幅值为A，则N点扩充的扩充间隔为A/(N-2)；

(b.6)对所有线性影响和非线性影响的状态使用N点扩充，得到扩维输入矩阵；

(c)训练数据的生成与神经网络模型的训练

在步骤(b.6)中得到扩维输入矩阵后，以矩阵中的每个状态向量作为输入，应用欧拉积分法计算输出值，将状态向量对应的输出值存储为输出向量，最后，把输入矩阵和输出向量合并，得到训练数据矩阵；

(2)横侧向制导

横侧向制导的目标是基于横程Z确定倾侧角的符号；横侧向制导的横程Z＝arcsin(sinΩsinΔψ)，式中：Ω是实际地面航程S对应的地心角，Δψ＝ψ_s-ψ是航向偏差，为速度和待飞位移的夹角；

飞行过程中，要求横程值位于限幅之间：

其中k₁和k₂为可调参数；

倾侧角的符号确定方式为：